Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Transliteration Alignment"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Transliteration Alignment"
Nhật Lan
42
9
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
This paper studies transliteration alignment, its evaluation metrics and applications. We propose a new evaluation metric, alignment entropy, grounded on the information theory, to evaluate the alignment quality without the need for the gold standard reference and compare the metric with F -score. We study the use of phonological features and affinity statistics for transliteration alignment at phoneme and grapheme levels. The experiments show that better alignment consistently leads to more accurate transliteration. In transliteration modeling application, we achieve a mean reciprocal rate (MRR) of 0.773 on Xinhua personal name corpus, a significant improvement over other reported results on. | Transliteration Alignment Vladimir Pervouchine Haizhou Li Institute for Infocomm Research A STAR Singapore 138632 vpervouchine hli @i2r.a-star.edu.sg Bo Lin School of Computer Engineering NTU Singapore 639798 linbo@pmail.ntu.edu.sg Abstract This paper studies transliteration alignment its evaluation metrics and applications. We propose a new evaluation metric alignment entropy grounded on the information theory to evaluate the alignment quality without the need for the gold standard reference and compare the metric with F-score. We study the use of phonological features and affinity statistics for transliteration alignment at phoneme and grapheme levels. The experiments show that better alignment consistently leads to more accurate transliteration. In transliteration modeling application we achieve a mean reciprocal rate MRR of 0.773 on Xinhua personal name corpus a significant improvement over other reported results on the same corpus. In transliteration validation application we achieve 4.48 equal error rate on a large LDC corpus. 1 Introduction Transliteration is a process of rewriting a word from a source language to a target language in a different writing system using the word s phonological equivalent. The word and its transliteration form a transliteration pair. Many efforts have been devoted to two areas of studies where there is a need to establish the correspondence between graphemes or phonemes between a transliteration pair also known as transliteration alignment. One area is the generative transliteration modeling Knight and Graehl 1998 which studies how to convert a word from one language to another using statistical models. Since the models are trained on an aligned parallel corpus the resulting statistical models can only be as good as the alignment of the corpus. Another area is the transliteration validation which studies the ways to validate transliteration pairs. For example Knight and Graehl 1998 use the lexicon frequency Qu and Grefen-stette
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Collapsed Consonant and Vowel Models: New Approaches for English-Persian Transliteration and Back-Transliteration"
Báo cáo khoa học: "A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining"
Báo cáo khoa học: "Hindi-to-Urdu Machine Translation Through Transliteration"
Báo cáo khoa học: "Jointly optimizing a two-step conditional random field model for machine transliteration and its fast decoding algorithm"
Báo cáo khoa học: "Latent Class Transliteration based on Source Language Origin"
Báo cáo khoa học: "Nonparametric Bayesian Machine Transliteration with Synchronous Adaptor Grammars"
Báo cáo khoa học: "Transliteration Alignment"
Báo cáo khoa học: "An Algorithm for Unsupervised Transliteration Mining with an Application to Word Alignment"
Báo cáo khoa học: "Chinese-English Backward Transliteration Assisted with Mining Monolingual Web Pages"
Báo cáo khoa học: "Active Sample Selection for Named Entity Transliteration"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.