Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Exploiting N-best Hypotheses for SMT Self-Enhancement"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Exploiting N-best Hypotheses for SMT Self-Enhancement"
Hữu Long
78
4
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Word and n-gram posterior probabilities estimated on N-best hypotheses have been used to improve the performance of statistical machine translation (SMT) in a rescoring framework. In this paper, we extend the idea to estimate the posterior probabilities on N-best hypotheses for translation phrase-pairs, target language n-grams, and source word reorderings. The SMT system is self-enhanced with the posterior knowledge learned from Nbest hypotheses in a re-decoding framework. | Exploiting N-best Hypotheses for SMT Self-Enhancement Boxing Chen Min Zhang Aiti Aw and Haizhou Li Department of Human Language Technology Institute for Infocomm Research 21 Heng Mui Keng Terrace 119613 Singapore bxchen mzhang aaiti hli @i2r.a-star.edu.sg Abstract Word and n-gram posterior probabilities estimated on N-best hypotheses have been used to improve the performance of statistical machine translation SMT in a rescoring framework. In this paper we extend the idea to estimate the posterior probabilities on N-best hypotheses for translation phrase-pairs target language n-grams and source word reorderings. The SMT system is self-enhanced with the posterior knowledge learned from N-best hypotheses in a re-decoding framework. Experiments on NIST Chinese-to-English task show performance improvements for all the strategies. Moreover the combination of the three strategies achieves further improvements and outperforms the baseline by 0.67 BLEU score on NIST-2003 set and 0.64 on NIST-2005 set respectively. 1 Introduction State-of-the-art Statistical Machine Translation SMT systems usually adopt a two-pass search strategy. In the first pass a decoding algorithm is applied to generate an N-best list of translation hypotheses while in the second pass the final translation is selected by rescoring and re-ranking the N-best hypotheses through additional feature functions. In this framework the N-best hypotheses serve as the candidates for the final translation selection in the second pass. These N-best hypotheses can also provide useful feedback to the MT system as the first decoding has discarded many undesirable translation candidates. Thus the knowledge captured in the N-best hypotheses such as posterior probabilities for words n-grams phrase-pairs and source word re orderings etc. is more compatible with the source sentences and thus could potentially be used to improve the translation performance. Word posterior probabilities estimated from the N-best hypotheses .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Exploiting Latent Information to Predict Diffusions of Novel Topics on Social Networks"
Báo cáo khoa học: "Online Plagiarism Detection Through Exploiting Lexical, Syntactic, and Semantic Information"
Báo cáo khoa học: "Exploiting Multiple Treebanks for Parsing with Quasi-synchronous Grammars"
Báo cáo khoa học: Exploiting Social Information in Grounded Language Learning via Grammatical Reductions""
Báo cáo khoa học: "Exploiting Web-Derived Selectional Preference to Improve Statistical Dependency Parsing"
Báo cáo khoa học: "Improving Question Recommendation by Exploiting Information Need"
Báo cáo khoa học: "Exploiting Morphology in Turkish Named Entity Recognition System"
Báo cáo khoa học: "Exploiting Readymades in Linguistic Creativity: A System Demonstration of the Jigsaw Bard"
Báo cáo khoa học: "Exploiting Heterogeneous Treebanks for Parsing"
Báo cáo khoa học: "Exploiting Bilingual Information to Improve Web Search"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.