tailieunhanh - Khai thác luật kết hợp thu gọn

Bào báo đề xuất phương pháp khai thác và không gian lưu trữ tập luật kết quả. Tập luật thu gọn khá nhỏ so với tập luật truyền thống nhưng tích hợp đầy đủ các thông tin về chúng và nếu cần chúng ta có thể suy diễn tập các luật còn lại dựa vào tính chất bắc cầu. Một đặc điểm thú vị của luật thu gọn là vế phải của nó chỉ chứa một thuộc tính giúp cho người dùng khai thác dễ dàng hơn. | Một sổ vdn đề chọn lọc của Cồng nghệ Ihỗng tín và truyỉn thông Đại Lài Ị 4-15 tháng 9 năm 2007 KHAI THÁC LUẬT KÉT HỢP THU GỌN Lê Hoài Bắc1 Võ Đình Bảy2 Ị Khoa CNTT- Đại học Khoa học tự nhiên - ĐHQG - HCM 2 KhoaCNTT-ĩ ại học Kỹ thuật Công nghệ Tp. HCM Khai thác luật truyền thống sinh ra quá nhiều dư thừa 1 3 . Bên canh đổ khi số tập phổ biến lớn sẽ tạo ra khá nhiều luật làm cho người dùng khó khai thác. Chỉnh vì vậy cần phải cỏ phương pháp khai thác hiệu quả tập luật kểt hợp. Bài bảo đề xuất phương pháp khai thác luật thu gọn nhằm làm giảm thời gian khai thác và không gian lưu trữ tập luật kểt quà. Tập luật thu gọn khả nhỏ so với tập luật truyền thống nhưng tích hợp đầy đù các thông tin về chủng và nếu cần chủng ta cỏ thể suy diễn tập các luật còn lại dựa vào tinh chất bắc cầu 3 Một đặc điểm thủ vị của luật thu gọn là vể phải của nó chi chứa một thuộc tinh giúp cho người dùng khơi thác dễ dàng hơn 1. Khai thâc tập phổ biến 2 Cẩu trúc IT-tree Itemset Tidset - tree và các lớp tương đương Cho I là tập cảc danh mục Itemset và X c I. Ta định nghĩa một hàm p X k X l k gồm k phần tử đầu của X và một quan hệ tương đương dựa vào tiền tổ 0k trên Y p X k p Y k . . Itemset như sau . Nghĩa là hai Itemset có cùng mộỉ lớp tương đương khi và chi khi chúng chia sẽ chung k phần tử đầu phổ biến. Như được trinh bày ưong hình 1 mỗi nút trong IT-tree đại diện cho một cặp Itemset-Tidset X t X thựC tê Ịà một ỉớp tj n Tất các các nút con của nút X thuộc về lớp tương đương của nó bởi vì chúng chia sẻ cùng tiền tổ X. Kí hiệu một lởp tương đương là M J trong đó p là nút cha và mỗi li là một mục dữ liệu đơn đại diện cho nút Plixt Pli . Chẳng hạn nút gốc của cây tương ứng với lớp A C D T W nút ưái cùng của gốc là lớp A chứa tất cả các itemset chứa A là tiền tố nghĩa là tập C D T W . Như vậy mỗi lóp thành viên đại diện cho một con của nút cha. Một lớp đại diện cho các mục dữ liệu mà các mục dữ liệu đó là tiền tổ để cổ thể mở rộng thành các lớp phổ biến mới. Rõ ràng không có cây con nào cùa .

TỪ KHÓA LIÊN QUAN