tailieunhanh - Luận văn: Nghiên cứu và đánh giá các hệ truy xuất thông tin

Hệ truy xuất thông tin xử lý các tập tin lưu trữ và những yêu cầu về thông tin, xác định và tìm từ các tập tin những thông tin phù hợp với những yêu cầu về thông tin. Việc truy xuất những thông tin đặc thù phụ thuộc vào sự tương tự giữa các thông tin được lưu trữ và các yêu cầu, được đánh giá bằng cách so sánh các giá trị của các thuộc tính đối với thông tin được lưu trữ và các yêu cầu về thông tin. | BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SỸ KHOA HỌC NGHIÊN CỨU VÀ ĐÁNH GIÁ CÁC HỆ TRUY XUẤT THÔNG TIN NGÀNH CÔNG NGHỆ THÔNG TIN MÃ SỐ CAO THỊ THU HƯƠNG Người hướng dẫn khoa học . NGUYỄN THANH THUỶ HÀ NỘI - 2006 1 LỜI CẢM ƠN Em xin chân thành gửi lời cảm ơn sâu sắc tới Thầy giáo hướng dẫn Thanh Thuỷ người đã có những hướng dẫn tận tình quý báu giúp em hoàn thành luận văn này. Em cũng xin cảm ơn các Thầy Cô khoa Công nghệ Thông tin trường Đại học Bách Khoa Hà Nội đã truyền đạt kiến thức quý báu trong khoá học này. Cuối cùng xin cảm ơn gia đình và cơ quan nơi đang công tác đã tạo điều kiện thuận lợi để tôi hoàn thành khoá học này. Hà nội tháng 10 năm 2006 Cao Thị Thu Hương 2 MỤC LỤC Chương 1 TỔNG QUAN VỀ HỆ TRUY XUẤT THÔNG . Lịch sử truy xuất thông tin và hệ thống truy xuất thông . Hệ truy xuất thông . Khái niệm về hệ truy xuất thông . Cách thức hoạt động của hệ thống truy xuất thông . Các phương tiện truy xuất thông . So sánh truy xuất thông tin cổ điển và truy xuất thông tin trên . So sánh truy xuất thông tin với truy xuất dữ . So sánh IRS với các hệ thống thông tin Chương 2 XÂY DỰNG một hệ TRUY xuất thông . Một số mô hình xây dựng một hệ truy xuất thông . Mô hình không gian . Tìm kiếm . Tìm kiếm Boolean mở . Mô hình xác . Đánh giá chung về các mô . Các bước xây dựng một hệ truy xuất thông . Tách từ tự động cho tập các tài . Lập chỉ mục cho tài . Tìm kiế . Sắp xếp các tài liệu trả về Ranking .26 Chương 3 LẬP CHỈ MỤC. 27 . Khái quát về hệ thống lập chỉ . Xác định mục từ quan trọng cần lập chỉ . Một số hàm tính trọng số mục . Tần số tài liệu nghịch đảo Inverse Document Frequency .32 . Độ nhiễu tín hiệu The Signal - Noise Ratio .32 . Giá trị độ phân .

TỪ KHÓA LIÊN QUAN