Đang chuẩn bị liên kết để tải về tài liệu:
Khai phá tập mục thường xuyên cổ phần cao trong cơ sở dữ liệu lớn
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Trong bài báo này, các tác giả đề xuất một cải tiến của thuật toán FSM. Việc cải tiến được thực hiện thông qua một chiến lược tỉa hiệu quả hơn các tập mục ứng viên, nhờ đó giảm bớt được thời gian hiện thuật toán khai phá. nội dung chi tiết. | Tạp chí Tin học và Điều khiển học T.24 S.2 2008 168-178 KHAI PHÁ TẬP MỤC THƯỜNG XUYÊN cổ PHÂN CAO TRONG Cơ SỞ DỮ LIỆU LỚN VŨ ĐỨC THI1 NGUYỄN HUY ĐỨC2 1 Viện Công nghệ thông tin Viện Khoa học và Công nghệ Việt Nam 2Khoa Thông tin - Máy tính Trường Cao đẳng Sư phạm Trung ương Abstract. Itemsets share has been proposed to evaluate the significance of itemsets for mining association rules in databases. The Fast Share Measure FSM algorithm is one of the best algorithms to discover all share-frequent itemsets efficiently. However FSM is fast only when dealing with small datasets. In this paper we shall propose a revised version of FSM called the Advanced FSM AFSM algorithm. AFSM prune the candidates more efficiently than FSM and therefore can improve the performance significantly. Tóm tắt. Khai phá tập mục thường xuyên cổ phần cao Share-Frequent Itemset là một mờ rộng của bài toán khai phá tập mục thường xuyên đã được các tác giả đề xuất với mục đích đánh giá ý nghĩa của các tập mục trong khai phá luật kết hợp. Thuật toán FSM Fast Share Measure là một trong các thuật toán tốt để khai phá hiệu quả các tập mục thường xuyên cổ phần cao. Trong báo cáo này chúng tôi đề xuất một cải tiến của thuật toán FSM. Việc cải tiến được thực hiện thông qua một chiến lược tỉa hiệu quả hơn các tập mục ứng viên nhờ đó giảm bớt được thời gian thực hiện thuật toán khai phá. 1. MỞ ĐẦU Bài toán cơ bản hay còn gọi là bài toán nhị phân khai phá luật kết hợp do Agrawal T.Imielinski và A. N. Swami đề xuất và nghiên cứu lần đầu tiên vào năm 1993 4 mục tiêu của bài toán là phát hiện các tập mục thường xuyên từ đó tạo các luật kết hợp. Trong mô hình của bài toán nhị phân này giá trị của mỗi mục dữ liệu trong một giao tác là 0 hoặc 1. Bài toán cơ bản khai phá luật kết hợp có nhiều ứng dụng tuy vậy do tập mục thường xuyên chỉ mang ngữ nghĩa thống kê nên nó chỉ đáp ứng được phần nào nhu cầu ứng dụng thực tiln. Nhằm khắc phục hạn chế của bài toán cơ bản khai phá luật kết hợp nhiều nhà nghiên cứu đã mở .