tailieunhanh - Luận văn tốt nghiệp: Giải pháp tính hạng trang khai thác cấu trúc Block của web và áp dụng vào máy tìm kiếm

Ngày nay, với những tác động to lớn và mạnh mẽ của mạng Internet tới đời sống kinh tế, chính trị và văn hóa của con người, lĩnh vực khai phá dữ liệu Web đã và đang trở thành lĩnh vực nghiên cứu thời sự, thu hút được sự quan tâm của rất nhiều nhà nghiên cứu. Khai phá dữ liệu Web là điểm hội tụ của rất nhiều lĩnh vực nghiên cứu như: cơ sở dữ liệu, truy xuất thông tin (information retrival), trí tuệ nhân tạo, nó còn là một lĩnh vực nhỏ trong học máy (machine learning). | Luận văn tốt nghiệp 1 r J r 1 1 J 11 J 1 r Ả J r Giải pháp tính hạng trang khai thác câu trúc r l 1 1 A 1 A r J A 1 Ấ Block của web và áp dụng vào máy tìm kiêm Mở đầu Ngày nay với những tác động to lớn và mạnh mẽ của mạng Internet tới đời sống kinh tế chính trị và văn hóa của con người lĩnh vực khai phá dữ liệu Web đã và đang trở thành lĩnh vực nghiên cứu thời sự thu hút được sự quan tâm của rất nhiều nhà nghiên cứu. Khai phá dữ liệu Web là điểm hội tụ của rất nhiều lĩnh vực nghiên cứu như cơ sở dữ liệu truy xuất thông tin information retrival trí tuệ nhân tạo nó còn là một lĩnh vực nhỏ trong học máy machine learning và xử lý ngôn ngữ tự nhiên. Một trong những lĩnh vực nghiên cứu đang rất được quan tâm hiện nay trong khai phá Web là việc xây dựng các công cụ tìm kiếm trên Web. Bởi trong bối cảnh xã hội thông tin ngày nay nhu cầu nhận được các thông tin một cách nhanh chóng chính xác đang ngày càng trở nên cấp thiết. Để tìm ra được các thông tin có ích đối với mỗi người dùng đặc biệt là với những người dùng thiếu kinh nghiệm hoàn toàn không phải là việc đơn giản. Với một công cụ tìm kiếm khả năng người dùng có thể duyệt Web và định vị được các trang Web mình quan tâm đã trở nên dễ dàng hơn nhiều. Tuy nhiên hiện nay do sự phát triển và thay đổi với tốc độ quá nhanh của Internet các công cụ tìm kiếm đang phải đối mặt với những bài toán nan giải về tốc độ. Trong đó có bài toán về tốc độ tính toán hạng cho các trang Web thực thi nhiệm vụ tính toán độ quan trọng cho các trang thông tin kết quả tìm được so với yêu cầu tìm kiếm của người dùng. Vì kích thước của World Wide Web là vô cùng lớn lên tới hàng tỉ trang web không những thế các trang Web này không ở trạng thái tĩnh mà luôn luôn thay đổi. Do đó tính hiệu quả về thời gian càng trở nên quan trọng. Nếu phép tính PageRank cho tập các trang web trong cơ sở dữ liệu không đủ nhanh hệ thống tìm kiếm sẽ không cung cấp được chất lượng tìm kiếm tốt cho người dùng. Ý thức đây là một lĩnh vực nghiên cứu có nhiều triển vọng chúng

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN