Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation"
tailieunhanh - Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation"
We propose an approach that biases machine translation systems toward relevant translations based on topic-specific contexts, where topics are induced in an unsupervised way using topic models; this can be thought of as inducing subcorpora for adaptation without any human annotation. We use these topic distributions to compute topic-dependent lexical weighting probabilities and directly incorporate them into our translation model as features. | Topic Models for Dynamic Translation Model Adaptation Vladimir Eidelman Computer Science and UMIACS University of Maryland College Park MD vlad@ Jordan Boyd-Graber iSchool and UMIACS University of Maryland College Park MD jbg@ Philip Resnik Linguistics and UMIACS University of Maryland College Park MD resnik@ Abstract We propose an approach that biases machine translation systems toward relevant translations based on topic-specific contexts where topics are induced in an unsupervised way using topic models this can be thought of as inducing subcorpora for adaptation without any human annotation. We use these topic distributions to compute topic-dependent lexical weighting probabilities and directly incorporate them into our translation model as features. Conditioning lexical probabilities on the topic biases translations toward topicrelevant output resulting in significant improvements of up to 1 BLEU and 3 TER on Chinese to English translation over a strong baseline. 1 Introduction The performance of a statistical machine translation SMT system on a translation task depends largely on the suitability of the available parallel training data. Domains . newswire vs. blogs may vary widely in their lexical choices and stylistic preferences and what may be preferable in a general setting or in one domain is not necessarily preferable in another domain. Indeed sometimes the domain can change the meaning of a phrase entirely. In a food related context the Chinese sentence W M ÍM fensi henduo would mean They have a lot of vermicelli however in an informal Internet conversation this sentence would mean They have a lot of fans . Without the broader context it is impossible to determine the correct translation in otherwise identical sentences. 115 This problem has led to a substantial amount of recent work in trying to bias or adapt the translation model TM toward particular domains of interest Axelrod et al. 2011 Foster et al. 2010 .
Hương Thu
108
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Application of dynamic topic models to toxicogenomics data
10
69
1
Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation"
5
82
0
Báo cáo khoa học: "Authorship Attribution with Author-aware Topic Models"
6
57
0
Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection"
10
48
0
Báo cáo khoa học: "PCFGs, Topic Models, Adaptor Grammars and Learning Topical Collocations and the Structure of Proper Names"
10
66
0
Báo cáo khoa học: "Automatic Labelling of Topic Models"
10
48
0
Báo cáo khoa học: "Identifying Word Translations from Comparable Corpora Using Latent Topic Models"
6
63
0
Báo cáo khoa học: "Employing Topic Models for Pattern-based Semantic Class Discovery"
9
63
0
Báo cáo khoa học: "Multi-Document Summarization using Sentence-based Topic Models"
4
51
0
Báo cáo khoa học: "Unsupervised Topic Identification by Integrating Linguistic and Visual Information Based on Hidden Markov Models"
8
75
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461869
55
Giới thiệu :Lập trình mã nguồn mở
14
22655
59
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10896
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10068
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9524
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8287
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8241
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7865
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6689
253
Vật lý hạt cơ bản (1)
29
5774
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Topic Models
Dynamic Translation Model Adaptation
Vladimir Eidelman
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
BMC Bioinformatics
Dynamic topic model
Times series gene expression
Topic modeling
Latent dirichlet model
Authorship Attribution
Author aware Topic Models
Yanir Seroussi
Word Sense Disambiguation
Token based Idiom Detection
PCFGs Topic Models
Adaptor Grammars and Learning Topical Collocations
the Structure of Proper Names
Automatic Labelling
Jey Han Lau
Identifying Word Translations
Comparable Corpora
Latent Topic Models
Employing Topic Models
Pattern based Semantic Class Discovery
Mingjie Zhu
xử lý ngôn ngữ tự nhiên
Multi Document Summarization
Sentence based Topic Models
Dingding Wang
Unsupervised Topic Identification
Integrating Linguistic
Visual Information Based on Hidden Markov Models
mô hình ngôn ngữ
Bilingual Topic AdMixture Models
Word Alignment
Bing Zhao
Incorporating topic information
sentiment analysis models
Tony Mullen
Statistical Models
Topic Segmentation
Jeffrey C
Reynar
Incorporating Lexical Priors
Jagadeesh Jagarlamudi
scientific reports
model language
process natural language
Posterior inference
Online maximum a posteriori estimation
Large scale learning
Streaming text collections
Financial modeling
Lecture Financial modeling
Asset expected return
Accrued interest
Yield curve models
Forward rates
Financial statement simulation
Cash flow
Cash flow models
Financial simulations
Retirement ratios
Changing asset allocation
Sequence motifs
Transcription factor binding sites
Molecular biology
DNA sequences
User defined function
Calculating cost of capital
Portfolio models
Estimating asset risk
Asset risk
Portfolio risk
Computing portfolio risk
TÀI LIỆU MỚI ĐĂNG
Data Structures and Algorithms - Chapter 8: Heaps
41
120
0
27-04-2024
báo cáo hóa học:" Rare ligamentum flavum cyst causing incapacitating lumbar spinal stenosis: Experience with 3 Chinese patients"
4
96
0
27-04-2024
Hệ thống làm lạnh và điều hòa không khí
21
126
0
27-04-2024
Báo cáo khoa học: " Principaux critères économiques de gestion des forêts : analyse critique et comparative"
29
89
0
27-04-2024
Tự học thổi sáo và ngâm thơ part 4
11
150
1
27-04-2024
Điều bạn cần làm để giữ chặt tình yêu
5
107
0
27-04-2024
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
120
0
27-04-2024
Tổng hợp Đề thi học sinh giỏi môn Sinh lớp 9 cấp huyện vòng 1 năm 2010-2011
12
177
1
27-04-2024
BÀI GIẢNG Biến Đổi Năng Lượng Điện Cơ - TS. Hồ Phạm Huy
137
93
0
27-04-2024
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
90
0
27-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7865
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5744
1368
Ebook Chào con ba mẹ đã sẵn sàng
112
3768
1231
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5323
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8287
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3501
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10896
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3687
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4054
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4130
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.