Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Better Filtration and Augmentation for Hierarchical Phrase-Based Translation Rules"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Better Filtration and Augmentation for Hierarchical Phrase-Based Translation Rules"
Ngọc Huệ
79
5
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
This paper presents a novel filtration criterion to restrict the rule extraction for the hierarchical phrase-based translation model, where a bilingual but relaxed wellformed dependency restriction is used to filter out bad rules. Furthermore, a new feature which describes the regularity that the source/target dependency edge triggers the target/source word is also proposed. | Better Filtration and Augmentation for Hierarchical Phrase-Based Translation Rules Zhiyang Wang 1 Yajuan Lu 1 Key Lab. of Intelligent Information Processing Institute of Computing Technology Chinese Academy of Sciences PO. Box 2704 Beijing 100190 China wangzhiyang@ict.ac.cn Qun Liu 1 Young-Sook Hwang HILab Convergence Technology Center C I Business SKTelecom 11 Euljiro2-ga Jung-gu Seoul 100-999 Korea yshwang@sktelecom.com Abstract This paper presents a novel filtration criterion to restrict the rule extraction for the hierarchical phrase-based translation model where a bilingual but relaxed well-formed dependency restriction is used to filter out bad rules. Furthermore a new feature which describes the regularity that the source target dependency edge triggers the target source word is also proposed. Experimental results show that the new criteria weeds out about 40 rules while with translation performance improvement and the new feature brings another improvement to the baseline system especially on larger corpus. 1 Introduction Hierarchical phrase-based HPB model Chiang 2005 is the state-of-the-art statistical machine translation SMT model. By looking for phrases that contain other phrases and replacing the subphrases with nonterminal symbols it gets hierarchical rules. Hierarchical rules are more powerful than conventional phrases since they have better generalization capability and could capture long distance reordering. However when the training corpus becomes larger the number of rules will grow exponentially which inevitably results in slow and memory-consuming decoding. In this paper we address the problem of reducing the hierarchical translation rule table resorting to the dependency information of bilingual languages. We only keep rules that both sides are relaxed-well-formed RWF dependency structure see the definition in Section 3 and discard others which do not satisfy this constraint. In this way about 40 bad rules are weeded out from the original rule
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Better Alignments = Better Translations?"
Báo cáo khoa học: "Learning Better Rule Extraction with Translation Span Alignment"
Báo cáo khoa học: "Smaller Alignment Models for Better Translations: Unsupervised Word Alignment with the 0"
Báo cáo khoa học: "Better Filtration and Augmentation for Hierarchical Phrase-Based Translation Rules"
Báo cáo khoa học: "Better Hypothesis Testing for Statistical Machine Translation: Controlling for Optimizer Instability"
Báo cáo khoa học: "Better Automatic Treebank Conversion Using A Feature-Based Approach"
Báo cáo khoa học: "Learning Better Data Representation using Inference-Driven Metric Learning"
Báo cáo khoa học: "Better Word Alignments with Supervised ITG Models"
Báo cáo khoa học: "Toward Smaller, Faster, and Better Hierarchical Phrase-based SMT"
Báo cáo khoa học: "Low-cost, High-performance Translation Retrieval: Dumber is Better"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.