Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Empirical Methods for Compound Splitting"
tailieunhanh - Báo cáo khoa học: "Empirical Methods for Compound Splitting"
Compounded words are a challenge for NLP applications such as machine translation (MT). We introduce methods to learn splitting rules from monolingual and parallel corpora. We evaluate them against a gold standard and measure their impact on performance of statistical MT systems. Results show accuracy of and performance gains for MT of BLEU on a German-English noun phrase translation task. | Empirical Methods for Compound Splitting Philipp Koehn Information Sciences Institute Department of Computer Science University of Southern California koehn@ Kevin Knight Information Sciences Institute Department of Computer Science University of Southern California knight@ Abstract Compounded words are a challenge for NLP applications such as machine translation MT . We introduce methods to learn splitting rules from monolingual and parallel corpora. We evaluate them against a gold standard and measure their impact on performance of statistical MT systems. Results show accuracy of and performance gains for MT of BLEU on a German-English noun phrase translation task. Figure 1 Splitting options for the German word Aktionsplan 1 Introduction Compounding of words is common in a number of languages German Dutch Finnish Greek etc. . Since words may be joined freely this vastly increases the vocabulary size leading to sparse data problems. This poses challenges for a number of NLP applications such as machine translation speech recognition text classification information extraction or information retrieval. For machine translation the splitting of an unknown compound into its parts enables the translation of the compound by the translation of its parts. Take the word Aktionsplan in German see Figure 1 which was created by joining the words Ak-tion and Plan. Breaking up this compound would assist the translation into English as action plan. Compound splitting is a well defined computational linguistics task. One way to define the goal of compound splitting is to break up foreign words so that a one-to-one correspondence to English can be established. Note that we are looking for a one-to-one correspondence to English content words Say the preferred translation of Ak-tionsplan is plan for action. The lack of correspondence for the English word or does not detract from the definition of the task We would still like to break up the German compound .
Tân Thành
85
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Data analysis of empirical bayes methods
0
98
0
Assessment of empirical methods for runoff estimation in Chaskaman catchment of Western Maharashtra, India
5
85
1
Báo cáo khoa học: "An Extensive Empirical Study of Collocation Extraction Methods"
6
103
0
Báo cáo khoa học: "Empirical Methods for Compound Splitting"
8
82
0
Computational Methods for Protein Structure Prediction and Modeling Volume 1: Basic Characterization
407
66
0
Research Methods and Statistics in Psychology
245
85
0
Ebook Observer performance methods for diagnostic imaging: Part 2
286
89
0
Groundwater recharge estimation using comparison of methods in Sirumugai area of coimbatore, Tamil Nadu, India
8
79
0
Hedonic methods in housing markets - Pricing environmental amenities and segregation
282
76
3
Steiner tree methods for optimal sub-network identification: An empirical study
19
49
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462291
61
Giới thiệu :Lập trình mã nguồn mở
14
24918
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11286
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10511
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9790
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8876
1160
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8467
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8090
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7471
1763
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7188
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Empirical Methods
Compound Splitting
Philipp Koehn
scientific reports
model language
process natural language
Approaches for statistical inference
Bayes approach
The empirical bayes approach
Performance of bayes procedures
Empirical bayes methods
Empirical method
Runoff estimation
Statistical performance
Chaskaman catchment
Assessment of empirical methods
An Extensive Empirical Study
Collocation Extraction Methods
Pavel Pecina
báo cáo khoa học
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
medical books
Biomedical Electronics
Medical Equipment
Empirical Force Fields
Computational Methods
Domain Partitioning
operational definitions
experimental method
Observational methods
establishment paradigm
discrete scales
Descriptive statistics
Observer performance methods
Diagnostic imaging
Empirical operating characteristics possible
Computation and meanings
Visual search paradigms
Recharge estimation
Comparison of methods
Empirical formula
Sirumugai area of coimbatore
Groundwater recharge estimation
Hedonic methods in housing markets
Housing markets
Pricing environmental amenities and segregation
Homebuyer’s countryside view
Empirical developments in hedonic modeling
Biological networks
Systems biology
Steiner tree methods
Bioinformatics field
NP complete
Quantitative methods for the social sciences
The social sciences
Empirical social science
Survey research
Constructing a survey
Conducting a survey
Evaluation and evolution
Bank efficiency considering heterogeneity technology
Empirical study from China
Dagum Gini index
Kernel density estimation methods
Nash sutcliffe efficiency
Root mean square error
SCS CN and surface runoff
Runoff estimation methods
A systemic
Action Research
tesearch model
Research methods
underlying theory
project management
Tài liệu nước ngoài
Tài liệu ngoại ngữ
Kiến thức ngoại ngữ
Tài liệu tiếng Anh
Architecture Knowledge
current guidelines
recommend treatment
symptomatic HIV
antiretroviral treatment
TB incidence
antiretroviral drugs
TÀI LIỆU MỚI ĐĂNG
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
159
2
26-11-2024
Giáo án điện tử tiểu học môn lịch sử: Cách mạng mùa thu
39
157
1
26-11-2024
Báo cáo khoa học: "A rare coexistence of adrenal cavernous hemangioma with extramedullar hemopoietic tissue: a case report and brief review of the literature"
4
100
0
26-11-2024
CÔNG NGHỆ MÔI TRƯỜNG - CHƯƠNG 5 CƠ SỞ QUÁ TRÌNH XỬ LÝ SINH HỌC
1
132
0
26-11-2024
THUẬT TOÁN LUYỆN KIM SONG SONG (Parallel Simulated Annealing Algorithms) GIẢI QUYẾT BÀI TOÁN MAX-SAT
41
114
1
26-11-2024
English Grammar Tests-Elementary Level's archiveReal Life: Accessories and Clothing (1)
8
112
0
26-11-2024
Giáo trình Công nghệ chế biến dầu mỡ thực phẩm - ThS. Trần Thanh Trúc
104
121
0
26-11-2024
Tóc highlight cho mùa thu
7
120
0
26-11-2024
Đề thi Tiếng Anh lop 12 (2010-2011) Trần Hưng Đạo Mã đề: 001
19
103
0
26-11-2024
Báo cáo lâm nghiệp: " Influence de l’élagage sur la duraminisation, la production de bois de tension et quelques autres propriétés du bois de peuplierI 214"
13
101
0
26-11-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8090
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7471
1763
Ebook Chào con ba mẹ đã sẵn sàng
112
4364
1369
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6156
1258
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8876
1160
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3790
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3909
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4618
562
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11286
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4454
490