Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Improve SMT Quality with Automatically Extracted Paraphrase Rules"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Improve SMT Quality with Automatically Extracted Paraphrase Rules"
Thanh Phương
98
9
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
We propose a novel approach to improve SMT via paraphrase rules which are automatically extracted from the bilingual training data. Without using extra paraphrase resources, we acquire the rules by comparing the source side of the parallel corpus with the target-to-source translations of the target side. | Improve SMT Quality with Automatically Extracted Paraphrase Rules Wei He1 Hua Wu2 Haifeng Wang2 Ting Liu1 1Research Center for Social Computing and Information Retrieval Harbin Institute of Technology whe tliu @ir.hit.edu.cn 2Baidu wu_hua wanghaifeng @baidu.com Abstract We propose a novel approach to improve SMT via paraphrase rules which are automatically extracted from the bilingual training data. Without using extra paraphrase resources we acquire the rules by comparing the source side of the parallel corpus with the target-to-source translations of the target side. Besides the word and phrase paraphrases the acquired paraphrase rules mainly cover the structured paraphrases on the sentence level. These rules are employed to enrich the SMT inputs for translation quality improvement. The experimental results show that our proposed approach achieves significant improvements of 1.6 3.6 points of BLEU in the oral domain and 0.5 1 points in the news domain. 1 Introduction The translation quality of the SMT system is highly related to the coverage of translation models. However no matter how much data is used for training it is still impossible to completely cover the unlimited input sentences. This problem is more serious for online SMT systems in real-world applications. Naturally a solution to the coverage problem is to bridge the gaps between the input sentences and the translation models either from the input side which targets on rewriting the input sentences to the MT-favored expressions or from This work was done when the first author was visiting Baidu. Correspondence author tliu@ir.hit.edu.cn 979 the side of translation models which tries to enrich the translation models to cover more expressions. In recent years paraphrasing has been proven useful for improving SMT quality. The proposed methods can be classified into two categories according to the paraphrase targets 1 enrich translation models to cover more bilingual expressions 2 paraphrase the input .
TÀI LIỆU LIÊN QUAN
báo cáo khoa học: " The implementation of a translational study involving a primary care based behavioral program to improve blood pressure control: The HTN-IMPROVE study protocol "
Báo cáo khoa học: "Improve SMT Quality with Automatically Extracted Paraphrase Rules"
Báo cáo khoa học: "Using Rejuvenation to Improve Particle Filtering for Bayesian Word Segmentation"
Báo cáo khoa học: "Using Search-Logs to Improve Query Tagging"
Báo cáo khoa học: "Using Document Level Cross-Event Inference to Improve Event Extraction"
Báo cáo khoa học: "Wikipedia as Sense Inventory to Improve Diversity in Web Search Results"
Báo cáo khoa học: "Using Cross-Entity Inference to Improve Event Extraction"
Báo cáo khoa học: "Using Large Monolingual and Bilingual Corpora to Improve Coordination Disambiguation"
Báo cáo khoa học: "Exploiting Web-Derived Selectional Preference to Improve Statistical Dependency Parsing"
Báo cáo khoa học: "Using Anaphora Resolution to Improve Opinion Target Identification in Movie Reviews"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.