tailieunhanh - Một phương pháp dịch từ mới trong dịch máy Hoa-Việt

Bài viết trình bày một phương pháp dịch NNE-UKW dựa vào việc phân rã từ và mô hình ngôn ngữ. Kết quả thử nghiệm cho thấy phương pháp của chúng tôi đã tăng điểm BLEU so với hệ dịch cơ sở và hệ dịch phân đoạn từ. Mời các bạn cùng tham khảo! | Hội Thảo Quốc Gia 2015 về Điện Tử Truyền Thông và Công Nghệ Thông Tin ECIT 2015 Hội Thảo Quốc Gia 2015 về Điện Tử Truyền Thông và Công Nghệ Thông Tin ECIT 2015 Một Phương Pháp Dịch Từ Mới Trong Dịch Máy Hoa-Việt Trần Thanh Phước Nguyễn Thị Thanh Thảo Khoa Công nghệ Thông tin Khoa Công nghệ Thông tin Trường Đại Học Tôn Đức Thắng Trường Cao Đẳng Kinh Tế Kỹ Thuật TPHCM tranthanhphuoc@ nguyenthithanthao@ Trịnh Thanh Duy Đinh Điền Khoa Kinh tế Kỹ thuật Khoa Công nghệ Thông tin Trường Bách Khoa Sài Gòn Trường Đại Học Khoa Học Tự Nhiên trinhthanhduy@ ddien@ Tóm tắt Từ mới UKW Unknown word là vấn đề Không giống như các ngôn ngữ phương Tây điển hiển nhiên trong dịch máy nói chung và trong dịch hình là tiếng Anh từ trong tiếng Hoa và tiếng Việt thống kê Hoa-Việt nói riêng. Hơn nữa so với các ngôn không được phân định bởi khoảng trắng. Một câu ngữ giàu tài nguyên khác như tiếng Hoa Anh thì kho tiếng Hoa bao gồm một dãy các ký tự nằm liên tiếp ngữ liệu song ngữ Hoa-Việt còn hạn chế vì vậy UKW nhau và không có khoảng trắng giữa các ký tự này. trong dịch máy Hoa-Việt lại càng nhiều hơn. Mặt khác ranh giới từ trong tiếng Hoa và tiếng Việt không được Trong tiếng Việt các từ chính tả được cách với nhau phân định bởi khoảng trắng phân đoạn từ thường được bởi một khoảng trắng dấu câu nằm liền sau từ chính thực hiện đầu tiên trong dịch máy Hoa Việt sang các tả. Do đó việc phân đoạn từ thường được giải quyết ngôn ngữ khác hoặc ngược lại. Việc phân đoạn từ làm đầu tiên trong dịch máy Hoa Việt sang các ngôn ngữ tăng chất lượng dịch chung cuộc nhưng lại phát sinh khác. Việc phân đoạn từ làm tăng chất lượng dịch nhiều UKW. Chúng tôi chia UKW làm hai phần là nhưng thường phát sinh nhiều UKW hơn so với hệ UKW dạng thực thể có tên và UKW không thuộc thực dịch cơ sở hệ dịch không phân đoạn từ xem mỗi ký thể có tên NNE-UKW . Trong bài báo này chúng tôi sẽ tự tiếng Hoa và từ chính tả tiếng Việt là đơn vị độc trình bày một phương pháp

TỪ KHÓA LIÊN QUAN