Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection"
tailieunhanh - Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection"
This paper presents a probabilistic model for sense disambiguation which chooses the best sense based on the conditional probability of sense paraphrases given a context. We use a topic model to decompose this conditional probability into two conditional probabilities with latent variables. We propose three different instantiations of the model for solving sense disambiguation problems with different degrees of resource availability. | Topic Models for Word Sense Disambiguation and Token-based Idiom Detection Linlin Li Benjamin Roth and Caroline Sporleder Saarland University Postfach 15 11 50 66041 Saarbriicken Germany linlin beroth csporled @ Abstract This paper presents a probabilistic model for sense disambiguation which chooses the best sense based on the conditional probability of sense paraphrases given a context. We use a topic model to decompose this conditional probability into two conditional probabilities with latent variables. We propose three different instantiations of the model for solving sense disambiguation problems with different degrees of resource availability. The proposed models are tested on three different tasks coarse-grained word sense disambiguation fine-grained word sense disambiguation and detection of literal vs. nonliteral usages of potentially idiomatic expressions. In all three cases we outperform state-of-the-art systems either quantitatively or statistically significantly. 1 Introduction Word sense disambiguation WSD is the task of automatically determining the correct sense for a target word given the context in which it occurs. WSD is an important problem in NLP and an essential preprocessing step for many applications including machine translation question answering and information extraction. However WSD is a difficult task and despite the fact that it has been the focus of much research over the years state-of-the-art systems are still often not good enough for real-world applications. One major factor that makes WSD difficult is a relative lack of manually annotated corpora which hampers the performance of supervised systems. To address this problem there has been a significant amount of work on unsupervised WSD that does not require manually sense-disambiguated training data see McCarthy 2009 for an overview . Recently several researchers have experimented with topic models Brody and Lapata 2009 Boyd-Graber et al. 2007 Boyd-Graber and
Ngọc Huệ
61
10
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Application of dynamic topic models to toxicogenomics data
10
69
1
Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation"
5
82
0
Báo cáo khoa học: "Authorship Attribution with Author-aware Topic Models"
6
57
0
Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection"
10
48
0
Báo cáo khoa học: "PCFGs, Topic Models, Adaptor Grammars and Learning Topical Collocations and the Structure of Proper Names"
10
66
0
Báo cáo khoa học: "Automatic Labelling of Topic Models"
10
48
0
Báo cáo khoa học: "Identifying Word Translations from Comparable Corpora Using Latent Topic Models"
6
63
0
Báo cáo khoa học: "Employing Topic Models for Pattern-based Semantic Class Discovery"
9
63
0
Báo cáo khoa học: "Multi-Document Summarization using Sentence-based Topic Models"
4
51
0
Báo cáo khoa học: "Unsupervised Topic Identification by Integrating Linguistic and Visual Information Based on Hidden Markov Models"
8
75
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461871
55
Giới thiệu :Lập trình mã nguồn mở
14
22681
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10071
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9535
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8294
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8244
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6696
253
Vật lý hạt cơ bản (1)
29
5777
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Topic Models
Word Sense Disambiguation
Token based Idiom Detection
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
BMC Bioinformatics
Dynamic topic model
Times series gene expression
Topic modeling
Latent dirichlet model
Dynamic Translation Model Adaptation
Vladimir Eidelman
Authorship Attribution
Author aware Topic Models
Yanir Seroussi
PCFGs Topic Models
Adaptor Grammars and Learning Topical Collocations
the Structure of Proper Names
Automatic Labelling
Jey Han Lau
Identifying Word Translations
Comparable Corpora
Latent Topic Models
Employing Topic Models
Pattern based Semantic Class Discovery
Mingjie Zhu
xử lý ngôn ngữ tự nhiên
Multi Document Summarization
Sentence based Topic Models
Dingding Wang
Unsupervised Topic Identification
Integrating Linguistic
Visual Information Based on Hidden Markov Models
mô hình ngôn ngữ
Bilingual Topic AdMixture Models
Word Alignment
Bing Zhao
Incorporating topic information
sentiment analysis models
Tony Mullen
Statistical Models
Topic Segmentation
Jeffrey C
Reynar
Incorporating Lexical Priors
Jagadeesh Jagarlamudi
scientific reports
model language
process natural language
Posterior inference
Online maximum a posteriori estimation
Large scale learning
Streaming text collections
Financial modeling
Lecture Financial modeling
Asset expected return
Accrued interest
Yield curve models
Forward rates
Financial statement simulation
Cash flow
Cash flow models
Financial simulations
Retirement ratios
Changing asset allocation
Sequence motifs
Transcription factor binding sites
Molecular biology
DNA sequences
User defined function
Calculating cost of capital
Portfolio models
Estimating asset risk
Asset risk
Portfolio risk
Computing portfolio risk
TÀI LIỆU MỚI ĐĂNG
Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4
47
246
1
28-04-2024
Mass Transfer in Multiphase Systems and its Applications Part 19
40
256
1
28-04-2024
extremetech Hacking BlackBerry phần 9
31
252
0
28-04-2024
BeginningMac OS X Tiger Dashboard Widget Development 2006 phần 2
34
213
0
28-04-2024
Lịch sử Đội TNTP Hồ Chí Minh - CHƯƠNG III VÂNG LỜI BÁC DẠY, LÀM NGHÌN VIỆC TỐT, CHỐNG MỸ, CỨU NƯỚC, THIẾU NIÊN SĂN SÀNG
45
137
0
28-04-2024
Giáo trình CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT - Chương 1
5
127
0
28-04-2024
XỬ TRÍ CHẤN THƯƠNG SỌ NÃO KÍN
1
114
1
28-04-2024
Lãi suất cơ bản, công cụ quan trọng của chính sách tiền tệ
5
114
0
28-04-2024
Gastroenterology an illustrated colour text - part 10
10
89
0
28-04-2024
MẪU GIẤY PHÉP VẬN TẢI LOẠI C
2
110
0
28-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5759
1382
Ebook Chào con ba mẹ đã sẵn sàng
112
3770
1232
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5327
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8294
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3503
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3688
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4059
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4132
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.