Đang chuẩn bị liên kết để tải về tài liệu:
Đánh giá bộ nhãn ngữ nghĩa LLOCE
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Xây dựng bộ ngữ liệu bằng phương pháp thủ công sẽ tốn nhiều thời gian và công sức. Vì vậy, việc nghiên cứu xây dựng bộ ngữ liệu tự động đang được các nước quan tâm. Tuy nhiên đối với Tiếng Việt thì vấn đề này chưa được giải quyết. Bài viết trình bày mô hình khảo sát tính hiệu quả của bộ nhãn ngữ nghĩa thuộc từ điển LLOCE (Longman Lexicon Of Contemporary English) trong quá trình gán nhãn ngữ nghĩa tự động cho ngữ liệu song ngữ Anh-Việt. Mời các bạn cùng tham khảo! | Hội Thảo Quốc Gia 2015 về Điện Tử Truyền Thông và Công Nghệ Thông Tin ECIT 2015 Đánh giá bộ nhãn ngữ nghĩa LLOCE Hồ Xuân Vinh Nguyễn Thị Thanh Thảo Đinh Điền Khoa Công nghệ thông tin - Đại Học Khoa Học Tự Nhiên TP. Hồ Chí Minh Khoa Công nghệ thông tin - Cao Đẳng Kinh Tế Kỹ Thuật TP. Hồ Chí Minh Email hovinh39@gmail.com nguyenthithanhthao@hotec.edu.vn ddien@fit.hcmus.edu.vn Tóm tắt Theo đà phát triển của các phương pháp dịch Nói đến các bộ nhãn ngữ nghĩa ta có thể liệt kê như máy dịch máy thống kê dựa trên ngữ nghĩa semantics- sau based Statistical Machine Translation được đánh giá là sẽ có triển vọng nhiều nhất. Tuy nhiên phương pháp này LLOCE Longman Lexicon of Contemporary En- đòi hỏi bộ ngữ liệu song ngữ lớn mà có gán nhãn ngữ glish từ điển về chủ đề mỗi chủ đề được chia nghĩa semantic-tag . Xây dựng bộ ngữ liệu như thế bằng thành nhiều nhóm mỗi nhóm chứa nhiều lớp ngữ phương pháp thủ công sẽ tốn nhiều thời gian và công sức. nghĩa với từ thuộc lớp nghĩa đó. Tên của mỗi lớp Vì vậy việc nghiên cứu xây dựng bộ ngữ liệu tự động cũng chính là nhãn ngữ nghĩa. Từ điển bao gồm đang được các nước quan tâm. Tuy nhiên đối với Tiếng Việt thì vấn đề này chưa được giải quyết. Trong bài báo 14 chủ đề 129 nhóm 2.449 lớp ngữ nghĩa với hơn chúng tôi trình bày mô hình khảo sát tính hiệu quả của bộ 16.000 mục từ. nhãn ngữ nghĩa thuộc từ điển LLOCE Longman Lexicon LDOCE Longman Dictionary of Contemporary Of Contemporary English trong quá trình gán nhãn ngữ English mỗi từ được phân loại dựa trên từ loại mã nghĩa tự động cho ngữ liệu song ngữ Anh-Việt. cú pháp mã ngữ nghĩa mã chủ đề và mã phong Từ khóa LLOCE sense tag semantic annotation nhãn ngữ nghĩa. cách. Từ điển bao gồm 100 chủ đề 19 mã ngữ nghĩa 13 mã ngữ nghĩa phái sinh 45.000 mục từ I. GIỚI THIỆU với hơn 65.000 nghĩa. WordNet hệ thống tri thức khổng lồ về ngữ nghĩa Xử lý ngôn ngữ tự nhiên Natural Language trong Tiếng Anh với 117.000 ý niệm khác nhau. Processing-NLP là lĩnh vực quan tâm đến tương tác Được xây dựng bởi đơn vị .