tailieunhanh - Đề tài: Điện toán đám mây, MapReduce và ứng dụng xây dựng hệ tìm kiếm theo yêu cầu người dùng

Bộ máy tìm kiếm a. Quy trình tìm kiếm Quy trình tìm kiếm bao gồm có bốn bước: • Truy vấn tìm kiếm được thực hiện bởi người sử dụng bằng cách yêu cầu bộ máy tìm kiếm thực hiện tìm kiếm các từ khóa nào đó. • Bộ máy tìm kiếm sẽ thực hiện xử lý truy vấn • Máy tìm kiếm tìm các từ khóa trong bộ chỉ mục có sẵn của nó • Máy tìm kiếm thực hiện đánh điểm, sắp xếp theo độ phù hợp với yêu cầu tìm kiếm và trả kết quả về cho người dùng | VIỆN CÔNG NGHỆ THÔNG TIN TRUYỀN THÔNG BỘ MÔN CÔNG NGHỆ PHẦN MỀM BÁO CÁO THỰC TẬP TỐT NGHIỆP Đề tài Điện toán đám mây MapReduce và ứng dụng xây dựng hệ tìm kiếm theo yêu cầu người dùng Giảng viên hướng dẫn . Huỳnh Quyết Thắng ThS. Lê Quốc Bộ môn Công nghệ phần mềm Viện CNTT TT Đại học Bách Khoa Hà Nội Sinh viên thực hiện Nguyễn Văn Đông Anh 20060102 Hà Nội 02 2011 Mục Lục 1. Bộ máy tìm a. Quy trình tìm b. Tiêu chí cho một bộ máy tìm 2. a. Solr là b. Tại sao chọn c. Quá trình thực i. File chỉ mục. 6 ii. Quá trình đánh chỉ mục. 8 iii. Quá trình tìm kiếm. 11 3. Solr trong dự án a. BKProfile là gì . 13 b. Thiết kế cấu trúc bản ghi chỉ c. Nâng cao chất lượng tìm i. Đánh trọng số. 17 ii. Gom nhóm các cụm từ hay xuất hiện. 17 4. Điện toán đám mây MapReduce và ứng dụng xây dựng hệ tìm kiếm theo yêu cầu người dùng 1. Bộ máy tìm kiếm a. Quy trình tìm kiếm Quy trình tìm kiếm bao gồm có bốn bước Truy vấn tìm kiếm được thực hiện bởi người sử dụng bằng cách yêu cầu bộ máy tìm kiếm thực hiện tìm kiếm các từ khóa nào đó. Bộ máy tìm kiếm sẽ thực hiện xử lý truy vấn Máy tìm kiếm tìm các từ khóa trong bộ chỉ mục có sẵn của nó Máy tìm kiếm thực hiện đánh điểm sắp xếp theo độ phù hợp với yêu cầu tìm kiếm và trả kết quả về cho người dùng. b. Tiêu chí cho một bộ máy tìm kiếm Có rất nhiều tiêu chí cần đặt ra cho một bộ máy tìm kiếm. Kết quả phải chính xác Sắp xếp theo thứ tự phù hợp Càng phù hợp với yêu cầu tìm kiếm của người sử dụng thì càng được đưa lên đầu tiên Tốc độ nhanh Dễ dàng tùy chỉnh Đối với người phát triển một bộ máy tìm kiếm được coi là tốt nếu nó có thể dễ dàng thêm bớt cấu hình các thuộc tính bên trong nhân của bộ tìm kiếm. Ngoài ra máy tìm kiếm còn cho phép người phát triển dễ dàng theo dõi quá trình tìm kiếm theo dõi quá trình thực hiện xử lý câu truy vấn của người dùng để từ đó có các bước tùy chỉnh phù hợp để nâng cao độ phù hợp của kết quả trả về Phân tán Với khối lượng thông tin .

TỪ KHÓA LIÊN QUAN