tailieunhanh - Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút từ kho ngữ liệu
Mục tiêu nghiên cứu đề tài là nghiên cứu về từ điển, cơ sở dữ liệu từ điển, cấu trúc định dạng của các chuẩn dữ liệu từ điển; kho ngữ liệu, các loại kho ngữ liệu. Tìm ra giải pháp xây dựng cơ sở dữ liệu từ điển bằng cách trích rút từ các kho ngữ liệu. Từ đó, có thể làm nguồn dữ liệu cho các phần mềm từ điển, có thể nguồn cho các chương trình dịch tự động, trích rút thông tin tự động, tóm tắt văn bản tự động, | ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ KHO NGỮ LIỆU Mã số T2016-07-03 Chủ nhiệm đề tài ThS. Trần Thị Kiều Đà Nẵng 12 2016 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ KHO NGỮ LIỆU Mã số T2016-07-03 Chủ nhiệm đề tài ThS. Trần Thị Kiều Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài Đà Nẵng 12 2016 MỤC LỤC MỞ ĐẦU . 1 1. LÝ DO CHỌN ĐỀ TÀI .1 2. MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU .2 3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU .2 . Đối tượng nghiên cứu . 2 . Phạm vi nghiên cứu . 2 4. BỐ CỤC CỦA BÁO CÁO .2 CHƯƠNG 1 TỔNG QUAN . 4 . CƠ SỞ LÝ THUYẾT .4 . Tổng quan về từ điển . 4 . Cơ sở dữ liệu từ điển . 5 . Các chuẩn dữ liệu từ điển. 5 . Kho ngữ liệu . 9 . Các phương pháp tách từ tiếng Việt hiện nay . 11 . CÁC CÔNG TRÌNH NGHIÊN CỨU XÂY DỰNG TỪ ĐIỂN .11 . TỔNG KẾT CHƯƠNG 1 .12 CHƯƠNG 2 ĐỀ XUẤT GIẢI PHÁP XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN TỪ KHO NGỮ LIỆU . 13 . PHÁT BIỂU BÀI . ĐỀ XUẤT GIẢI PHÁP .14 . Mô hình bài toán . 14 . Đặc tả mô hình bài toán . 15 . LỰA CHỌN PHƯƠNG PHÁP KỸ . Phân đoạn từ trong tiếng Việt . 16 . Dịch máy thống kê . 18 . Định dạng dữ liệu từ điển . 20 . TỔNG KẾT CHƯƠNG 2 .20 CHƯƠNG 3 TRIỂN KHAI XÂY DỰNG VÀ THỰC NGHIỆM . 21 . TRIỂN KHAI ỨNG DỤNG .21 . Lựa chọn công nghệ . 21 . Chuẩn bị dữ liệu . 21 . Kết quả đạt được . 21 . Đánh giá kết quả . 25 . TỔNG KẾT CHƯƠNG 3 .25 DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt Ý nghĩa 1 HTML HyperText Markup Language 2 CSDL Cơ sở dữ liệu 3 KDD Knowledge Discovery in Database 4 KPDL Khai phá dữ liệu 5 LRMM Left Right Maximum Matching 6 RLMM Right Left Maximum Matching 7 MMSEG Maximum Matching Segmentation 8 WFST Weighted .
đang nạp các trang xem trước