Đang chuẩn bị liên kết để tải về tài liệu:
Luận văn Tìm hiểu về Search Engine và xây dựng ứng dụng minh hoạ cho Search Engine tiếng Việt
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Tham khảo luận văn - đề án 'luận văn tìm hiểu về search engine và xây dựng ứng dụng minh hoạ cho search engine tiếng việt', luận văn - báo cáo phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả | Luận văn II Tìm hiểu về Search Engine và xây II I dựng ứng dụngminh hoạ cho I Search Engine tiếng Việt MỞ ĐÀU Trong thời đại ngày nay thông tin là nhu cầu thiết yếu đối với mọi người trên mọi lĩnh vực. Mỗi phút trôi qua hàng triệu triệu trang web được đẩy lên nhằm làm giàu nguồn tài nguyên vô tận này. Tuy nhiên tồn tại một nghịch lý là dù được ví như thư viện toàn cầu internet vẫn không thoả mãn nhu cầu thông tin của con người. Xung quanh vấn đề này có nhiều nguyên nhân nhưng quan trọng nhất là sự thông hiểu giữa con người và công cụ tìm kiếm trên mạng - search engine - chưa đạt đến mức có thể giao tiếp tốt với nhau. Hơn nữa mỗi search engine sẽ mang đặc thù của ngôn ngữ mà nó hiển thị như search engine Tiếng Việt phải giải quyết những vấn đề đặc trưng của Tiếng Việt cụ thể là vấn đề bảng mã ngữ pháp trong Tiếng Việt. Nếu ta hiểu cách thức search engine tổ chức thông tin thực thi một câu truy vấn và đặc trưng của ngôn ngữ mà search engine sẽ tiếp cận thì ta có thể tối ưu hoá cơ hội nhận được các thông tin hữu ích. Đây là mục tiêu chính của luận văn. 1 Tài liệu chi xem đươc một số trang đầu. Vui lòng download file góc để xem toàn bộ các trang TÌM HIỂU VẤN ĐỀ Chương 1 TỔNG QUAN VỀ HỆ THỐNG SEARCH ENGINE 1. Các bộ phận cấu thành hệ thống search engine 1.1 Bộ thu thập thông tin - Robot Robot là một chương trình tự động duyệt qua các cấu trúc siêu liên kết để thu thập tài liệu một cách đệ quy nó nhận về tất cả tài liệu có liên kết với tài liệu này. Robot được biết đến dưới nhiều tên gọi khác nhau spider web wanderer hoặc web worm . Những tên gọi này đôi khi gây nhầm lẫn như từ spider wanderer làm người ta nghĩ rằng robot tự nó di chuyển và từ worm làm người ta liên tưởng đến virus. về bản chất robot chỉ là một chương trình duyệt và thu thập thông tin từ các site theo đúng giao thức web. Những trình duyệt thông thường không được xem là robot do thiếu tính chủ động chúng chỉ duyệt web khi có sự tác động của con người. 1.2 Bộ lập chỉ mục - Index Hệ thống lập chỉ mục hay .