tailieunhanh - Nghiên cứu luật hiệu chỉnh kết quả dùng phương pháp MST phân tích cú pháp phụ thuộc tiếng Việt

Tài liệu "Nghiên cứu luật hiệu chỉnh kết quả dùng phương pháp MST phân tích cú pháp phụ thuộc tiếng Việt" trình bày phương pháp Maximum Spanning Tree để phân tích cú pháp phụ thuộc câu tiếng Việt và sử dụng bộ hiệu chỉnh cây bằng luật để cải thiện đầu ra của MST. Cuối cùng chúng tôi đưa ra một số kết quả thực nghiệm trên tập ngữ liệu 450 câu tiếng Việt và đề xuất hướng phát triển phương pháp MST cho bài toán này. | Nghiên cứu luật hiệu chỉnh kết quả dùng phương pháp MST phân tích cú pháp phụ thuộc tiếng Việt Nguyễn Lê Minh Hoàng Thị Điệp Trần Mạnh Kế Japan Advanced Institute of Đại học Công Nghệ - ĐHQG Đại học Công Nghệ - ĐHQG Science and Technology Hà Nội Hà Nội Tóm tắt Phân tích cú pháp có vai trò quan trọng trong lĩnh vực xử lý văn bản vì nó là bước trung gian của nhiều bài toán lớn như tóm tắt văn bản dịch máy hỏi đáp tự động. Trong thời gian gần đây phân tích cú pháp phụ thuộc thu hút được sự quan tâm của nhiều nhóm nghiên cứu xử lý ngôn ngữ tự nhiên trên thế giới bởi quan hệ phụ thuộc giữa hai từ vựng có thể có ích trong khử nhập nhằng và cú pháp này có khả năng mô hình hóa các ngôn ngữ có trật tự từ tự do. Trong báo cáo này chúng tôi trình bày phương pháp Maximum Spanning Tree để phân tích cú pháp phụ thuộc câu tiếng Việt và sử dụng bộ hiệu chỉnh cây bằng luật để cải thiện đầu ra của MST. Cuối cùng chúng tôi đưa ra một số kết quả thực nghiệm trên tập ngữ liệu 450 câu tiếng Việt và đề xuất hướng phát triển phương pháp MST cho bài toán này. 1 Giới thiệu Tình hình nghiên cứu tự động phân tích cú pháp phụ thuộc tiếng Việt Phân tích cú pháp phụ thuộc1 trong vài năm gần đây thu hút được sự quan tâm của cộng đồng nghiên cứu xử lý ngôn ngữ tự nhiên 8 vì cú pháp phụ thuộc là một dạng biểu diễn câu có nhiều ứng dụng cho các bài toán phức tạp như trích chọn thông tin hay tóm tắt văn bản. Tuy nhiên các tiếp cận cho bài toán này đều dựa trên học máy và đòi hỏi kho ngữ liệu với nhiều thông tin về từ loại và quan hệ phụ thuộc nên hiện chưa có ai công bố nghiên cứu về phân tích cú pháp phụ thuộc tiếng Việt. Cú pháp phụ thuộc Cú pháp phụ thuộc là cấu trúc cú pháp chứa các mục từ vựng nối với nhau bởi các quan hệ nhị phân không đối xứng gọi là sự phụ thuộc 5 . Quan hệ phụ thuộc này có thể được đặt tên để làm rõ liên hệ giữa hai mục từ. Hình 2 là minh họa cú pháp phụ thuộc của một câu tiếng Việt. Theo quy ước phổ biến trong các tài liệu về cú pháp phụ thuộc thì mục từ nằm ở gốc .

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.