tailieunhanh - Luận văn:Nghiên cứu phương pháp thu thập tập dữ liệu song song (parallel corpus)Việt-Anh, Việt-Pháp từ các nguồn tài liệu đa ngữ

Đa ngôn ngữ là từ để chỉ các quốc gia mà có nhiều ngôn ngữ được công nhận trong cùng một quốc gia (ví dụ Canada công nhận tiếng Anh và tiếng Pháp), có một ngôn ngữ được công nhận nhưng các ngôn ngữ khác dùng khá phổ biến (ví dụ Tây Ban Nha công nhận tiếng Tây Ban Nha là ngôn ngữ chính thức nhưng tiếng Catalan, tiếng Basque và tiếng Galica được công nhận là ngôn ngữ chính thức phụ). Cần phân biệt với những ngôn ngữ được sử dụng tại 1 quốc gia nhưng không có địa. | Bộ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG LÊ CÔNG VÔ NGHIÊN CỨU PHƯƠNG PHÁP THU THẬP TẬP DỮ LIỆU SONG SONG PARALLEL CORPUS VIỆT - ANH VIỆT - PHÁP TỪ CÁC NGUỒN TÀI LIỆU ĐA NGỮ Chuyên ngành KHOA HỌC MÁY TÍNH Mã số LUẬN VĂN THẠC sĩ KỸ THUẬT Đà Nắng - Năm 2011 Công trình được hoàn thành tại ĐẠI HỌC ĐÀNẴNG Người hướng dẫn khoa học TS. Huỳnh Công Pháp Phản biện 1 PGS. TS. Đoàn Văn Ban Phản biện 1 TS. Huỳnh Hữu Hưng Luận văn sẽ được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nằng ngày 10 tháng 9 năm 2011. Có thể tìm hiểu luận văn tại - Trung tâm Thông tin - Học liệu Đại học Đà Nằng - Trung tâm Học liệu Đại học Đà Nằng -1- MỞĐẦU 1. Lý do chọn đề tài Trước sự bùng nổ của thông tin như hiện nay nhu cầu dịch tự động ngày càng lớn. Việc dịch tự động các văn bản bài báo tạp chí . từ ngôn ngữ A sang ngôn ngữ B hoặc nhiều ngôn ngữ khác để phục vụ công việc học tập nghiên cứu một cách kịp thời nhanh chóng là một trong những vấn đề hết sức cấp bách. Chính vì vậy bài toán dịch tự động song song giữa các ngôn ngữ càng có ý nghĩa thiết thực hơn bao giờ hết. Ngày nay với sự phát triển của CNTT Internet phát triển mạnh và được sử dụng rộng rãi. Các dịch vụ dịch thuật ngày càng trở nên phổ biến và không thể thiếu của con người thì việc xây dựng kho dữ liệu song song Parallel Corpus là điều cần làm để làm cơ sở nền tảng cho hệ thống dịch tự động thông minh hơn nhằm phục vụ cho việc dịch các đoạn văn bản các bài báo . Ngoài ra kho dữ liệu song song cũng rất quan trọng đối với mục đích nghiên cứu và học tập như là tạo hệ thống mẫu để đánh giá chất lượng dịch phục vụ cho việc học ngoại ngữ . Ngày nay việc đánh giá và phát triển các hệ thống ngôn ngữ khác như Tiếng Anh tiếng Ý tiếng Pháp . dễ dàng và đạt được chất lượng cao. Bởi vì các ngôn ngữ này có hệ thống kho ngữ liệu song song lớn và có chất lượng rất cao. Nhưng đối với tiếng Việt rất khó khăn để xây dựng một hệ thống kho ngữ liệu song song chất lượng tốt và hiện nay chưa tồn tại dịch tự .

TỪ KHÓA LIÊN QUAN