tailieunhanh - Cải tiến giải thuật CYK cho bài toán phân tích cú pháp tiếng việt.

Cải tiến giải thuật CYK cho bài toán phân tích cú pháp tiếng việt. Có nghĩa rằng sự hỗn loạn từ bên ngoài, truyền sự đa dạng vào trong hệ thống, phải được điều chỉnh cho ảnh hưởng ít nhất tới việc hệ đạt mục đích của mình, vậy trong hệ phải có sẵn sàng các hoạt động cao hơn độ đa dạng của bên ngoài. | Tạp chí Tin học và Đĩêu khiền học 2006 325-338 CÁI TIẾN GIẢI THUẬT CYK CHO BÀI TOÁN PHÂN TÍCH CÚ PHÁP TIENG việt ĐINH THỊ PHƯƠNG THU HOÀNG VĨNH SƠN HUỲNH QUYẾT THANG Khoa Công nghệ thông tin - Trường Đại học Bách Khoa Hà Nội Abstract. The CYK Cocke-Younger-Kasami is one of algorithms used for parsing in the natural language processing. It is a simple algorithm for context free grammar that must be in Chomsky Normal Form. Because of Vietnamse s complexity applying the CYK directly to the Vietnamese parsing is less effectiveness. In this paper we propose some modifications of the CYK algorithm data structure and data storage applying on the Vietnamese parsing to improve the accuracy and increase performance. The experimental results are compared with the modificative Early algorithm 6 to show the efficiency of these modifications. Tóm tắt. Giải thuật CYK Cocke-Younger-Kasami là một trong số những giải thuật được sử dụng để phân tích cú pháp trong xử lý ngôn ngữ tự nhiên. Đây là một giải thuật tổng quát sử dụng tương đối đơn giản cho các văn phạm phi ngữ cảnh có các luật sinh tuân theo chuẩn Chomsky. Nhưng khi áp dụng giải thuật CYK cho tiếng Việt là một ngôn ngữ có tính phức tạp thì có nhiều hạn chế phải khắc phục. Trong bài báo này chúng tôi trình bày một đề xuất mở rộng giải thuật CYK và một số cải tiến quá trình phân tích lưu trữ dữ liệu trung gian áp dụng trong bài toán phân tích cú pháp tiếng Việt để nâng cao tốc độ và độ chính xác. Kết quả thử nghiệm đã được so sánh với giải thuật phân tích cú pháp Early cải tiến 6 và đã chứng minh được tính hiệu quả. 1. MỞ ĐẦU Trên thế giới bài toán phân tích cú pháp đã được nghiên cứu từ lâu và phát triển mạnh mẽ với nhiều mô hình phân tích cú pháp khác nhau. Ưng dụng của phân tích cú pháp có ý nghĩa thực tế rất lớn đối với những hệ thống phát hiện và sửa lỗi chính tả sửa lỗi cú pháp tóm tắt phân lớp văn bản . Tuy nhiên tại Việt Nam những kết quả nghiên cứu về phân tích cú pháp tiếng Việt còn rất ít và hạn chế. Để .

TỪ KHÓA LIÊN QUAN