tailieunhanh - Xây dựng tự động từ điển Việt - Anh và ứng dụng trong lĩnh vực du lịch

Từ điển song ngữ là một dạng tài nguyên ngôn ngữ quan trọng được sử dụng trong nhiều lĩnh vực của xử lý ngôn ngữ tự nhiên, như: dịch máy, tìm kiếm liên ngữ, tra cứu ngữ nghĩa giữa hai ngôn ngữ. Bài viết trình bày một phương pháp xây dựng tự động từ điển song ngữ và ứng dụng phương pháp này để xây dựng tự động từ điển song ngữ Việt - Anh miền du lịch. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Huế ngày 07-08 6 2019 DOI XÂY DỰNG TỰ ĐỘNG TỪ ĐIỂN VIỆT - ANH VÀ ỨNG DỤNG TRONG LĨNH VỰC DU LỊCH Nguyễn Tiến Hà1 Nguyễn Thị Minh Huyền2 1 2 Trường Đại học Khoa học Tự nhiên Đại học Quốc gia Hà Nội tienhapt@ huyenntm@ TÓM TẮT Từ điển song ngữ là một dạng tài nguyên ngôn ngữ quan trọng được sử dụng trong nhiều lĩnh vực của xử lý ngôn ngữ tự nhiên như dịch máy tìm kiếm liên ngữ tra cứu ngữ nghĩa giữa hai ngôn ngữ Việc xây dựng từ điển có thể được thực hiện nhờ các phương pháp thu thập thủ công và hoặc khai thác từ nguồn ngữ liệu song ngữ. Trong khi kho ngữ liệu song ngữ có gióng hàng mức câu được mở rộng liên tục nhờ các phương pháp xây dựng bán tự động và tự động việc tận dụng nguồn tài nguyên này để tự động làm giàu từ điển song ngữ cho phép chúng ta thu được kho từ vựng song ngữ ngày càng giá trị. Trong bài báo này chúng tôi trình bày một phương pháp xây dựng tự động từ điển song ngữ và ứng dụng phương pháp này để xây dựng tự động từ điển song ngữ Việt - Anh miền du lịch. Từ khóa Từ điển Từ điển Anh-Việt Từ điển song ngữ Trích rút cụm từ song ngữ Xây dựng kho ngữ liệu song ngữ Kho ngữ liệu song ngữ. I. GIỚI THIỆU Từ điển song ngữ là một dạng tài nguyên ngôn ngữ quan trọng được sử dụng trong nhiều lĩnh vực của xử lý ngôn ngữ tự nhiên. Hiện nay các phương pháp xây dựng từ điển song ngữ đều là thủ công hoặc bán tự động và chưa khai thác được kho ngữ liệu song ngữ gióng hàng mức câu được cập nhật bổ sung mở rộng từng ngày. Các phương pháp xây dựng từ điển song ngữ tiếng Việt với một ngôn ngữ khác đã được đề xuất chủ yếu khai thác tài nguyên từ các cuốn từ điển song ngữ đã được xuất bản chẳng hạn như trong công trình của Văn Ngọc Sang và cộng sự công bố năm 2007 về xây dựng từ điển song ngữ Việt-Jrai Jrai-Việt 1 và công trình công bố năm 2014 2 về xây dựng từ điển điện tử Chăm - Việt từ việc khai thác cuốn từ điển Chăm - Việt đã

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.