tailieunhanh - Luận án Tiến sĩ Khoa học máy tính: Cải tiến chất lượng dịch máy thống kê Anh - Việt dựa vào đảo trật tự từ theo cây cú pháp phụ thuộc

Luận văn đề xuất và cải tiến các phương pháp giải quyết bài toán đảo cụm từ trong dịch máy thống kê dựa vào cụm theo hướng tiếp cận tiền xử lý dựa trên cây phân tích cú pháp phụ thuộc. Tìm ra cách tích hợp thông tin về cây phân tích cú pháp phụ thuộc vào hệ dịch máy thống kê (lựa chọn thông tin cú pháp, xây dựng luật đảo trật tự thủ công và tự động giữa 2 cặp ngôn ngữ). | Luận án Tiến sĩ Khoa học máy tính Cải tiến chất lượng dịch máy thống kê Anh - Việt dựa vào đảo trật tự từ theo cây cú pháp phụ thuộc ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN HỒNG VIỆT CẢI TIẾN CHẤT LƯỢNG DỊCH MÁY THỐNG KÊ ANH-VIỆT DỰA VÀO ĐẢO TRẬT TỰ TỪ THEO CÂY CÚ PHÁP PHỤ THUỘC LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2019 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN HỒNG VIỆT CẢI TIẾN CHẤT LƯỢNG DỊCH MÁY THỐNG KÊ ANH-VIỆT DỰA VÀO ĐẢO TRẬT TỰ TỪ THEO CÂY CÚ PHÁP PHỤ THUỘC Chuyên ngành Khoa học máy tính Mã số 9 48 01 01 01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC 1. TS. Nguyễn Văn Vinh 2. . Nguyễn Lê Minh Hà Nội - 2019 Lời cam đoan Tôi xin cam đoan luận án này là kết quả nghiên cứu của tôi được thực hiện dưới sự hướng dẫn của TS. Nguyễn Văn Vinh và . Nguyễn Lê Minh. Các nội dung trích dẫn từ các nghiên cứu của các tác giả khác trình bày trong luận án này được ghi rõ nguồn trong phần tài liệu tham khảo. Trần Hồng Việt TÓM TẮT Đảo trật tự từ là một trong các vấn đề quan trọng của dịch máy liên quan đến việc làm thế nào để sinh ra thứ tự các từ cụm từ chính xác trong ngôn ngữ đích. Trong hệ dịch máy thống kê dựa trên cụm từ Phrase-Based Statistical Machine Translation - PBSMT Koehn và cộng sự 2003 Och và Ney 2004 59 89 việc đảo cụm từ vẫn còn đơn giản và chất lượng chưa cao. Bên cạnh đó do các ngôn ngữ có nhiều đặc điểm khác nhau đặc biệt sự khác nhau về thứ tự từ trong các ngôn ngữ dẫn tới không thể mô hình hóa chính xác trong quá trình dịch 89 . Nhiều hướng nghiên cứu giải quyết vấn đề sắp xếp lại trật tự từ bên trong hệ thống dịch máy thống kê dựa trên cụm từ. Một số nghiên cứu theo hướng tiếp cận tiền xử lý cho vấn đề sắp xếp lại trật tự từ cho kết quả tốt đảm bảo cân bằng giữa chất lượng dịch và thời gian giải mã qua thực hiện tiền xử lý quá trình sắp xếp lại. Với ưu điểm của cấu trúc cây cú pháp phụ thuộc kết nối tất cả các từ trong một câu với khả năng nắm bắt phụ thuộc giữa các từ xa nhau với các cấu .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN