tailieunhanh - Luận văn : Biểu diễn văn bản trên lý thuyết tập mờ . Áp dụng trong bài toán phân lớp văn bản

Biểu diễn văn bản là một trong những công đoạn quan trọng nhất và được quan tâm đầu tiên trong các vấn đề xử lý văn bản. Nó có ảnh hưởng rất lớn đến các bài toán tìm kiếm văn bản, phân lớp, phân cụm hay tóm tắt văn bản Khóa luận này trình bày và nghiên cứu một phương pháp biểu diễn văn bản mới dựa trên cơ sở lý thuyết tập mờ và áp dụng vào bài toán phân lớp văn bản. Nội dung của khóa luận tập trung vào các vấn đề sau:. | Luận văn tốt nghiệp Biểu diễn văn bản trên lý thuyết tập mờ . Áp dụng trong bài toán phân lớp văn bản Khóa luận tốt nghiệp Nguyễn Việt Cường LỜI CẢM ƠN Em xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới thầy giáo tiến sĩ HÀ QUANG THỤY Trường Đại học Công nghệ ĐHQG Hà Nội và tiến sĩ ĐOÀN SƠN Đại học Tohoku Nhật Bản đã hướng dẫn và động viên em rất nhiều trong quá trình làm luận văn. Em xin được gửi lời cảm ơn tới các Thầy Cô trong Trường Đại học Công Nghệ Đại học Quốc Gia Hà Nội và nhóm Xeminar thuộc bộ môn Các Hệ thống Thông tin những người đã dạy dỗ giúp đỡ và chỉ bảo cho em trong suốt quá trình học tập. Cuối cùng con xin gửi lời biết ơn tới gia đình nơi đã sinh thành nuôi dưỡng và động viên con rất nhiều trong thời gian qua. Hà Nội ngày 20 05 2006 Sinh viên Nguyễn Việt Cường i Khóa luận tốt nghiệp Nguyễn Việt Cường TÓM TẮT Biểu diễn văn bản là một trong những công đoạn quan trọng nhất và được quan tâm đầu tiên trong các vấn đề xử lý văn bản. Nó có ảnh hưởng rất lớn đến các bài toán tìm kiếm văn bản phân lớp phân cụm hay tóm tắt văn bản. Khóa luận này trình bày và nghiên cứu một phương pháp biểu diễn văn bản mới dựa trên cơ sở lý thuyết tập mờ và áp dụng vào bài toán phân lớp văn bản. Nội dung của khóa luận tập trung vào các vấn đề sau 1. Trình bày một số phương pháp biểu diễn văn bản thông thường trong đó khóa luận đi sâu vào cách biểu diễn theo mô hình vector tức mỗi văn bản sẽ được biểu diễn như một vector có các thành phần là các từ khóa có mặt hoặc không có mặt trong văn bản. Sau đó khóa luận tìm hiểu phương pháp biểu diễn văn bản trong máy tìm kiếm. 2. Trình bày về lý thuyết tập mờ và đề cập một cách biểu diễn văn bản mới dựa trên các khái niệm mờ. Từ đó đề xuất hướng giải quyết khi xuất hiện các từ đồng nghĩa trong văn bản. 3. Tiến hành thử nghiệm cách biểu diễn mới này vào bài toán phân lớp văn bản. Chỉ ra một số kết quả phân lớp và so sánh với phương pháp biểu diễn theo mô hình vector thông thường. Từ đó rút ra một số kết luận và hướng phát triển tiếp .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.