tailieunhanh - Một thuật toán khai phá tập thường xuyên dựa trên bao đóng của các thuộc tính

Bài toán khai phá luật kết hợp là bài toán cơ bản trong khai thác dữ liệu. Bài toán gồm hai bước chính: Bước một, tìm tất cả các tập thường xuyên theo ngưỡng SO cho trước. Bước hai, dựa vào các tập thường xuyên, tìm các luật kết hợp. Tất cả khó khăn của việc giải quyết bài toán tập trung ở bước một. Kết quả ứng dụng ánh xạ đóng và tập đóng để tìm tập thường xuyên cũng đã được nhiều tác giả công bố. Bài báo này sẽ đề xuất thuật toán tìm các tập thường xuyên dựa trên bao đóng của nó để giảm thiểu các tập mục dữ liệu cần tính toán. | Một sể vấn đề chọn lọc cùa Cổng nghệ thông tin và truyền thông Đại Lài 14-ỉ 5 thảng 9 nâm 2007 MỘT THUẬT TOÁN KHAI PHÁ TẬP THƯỜNG XUYÊN DựA TRÊN BAO ĐÓNG CỦA CÁC THUỘC TÍNH Nguyễn Hữu Trọng Trường Đại học Nha Trang Bài toản khai phả luật kểt hợp là bài toán cơ bàn trong khai thác dữ liệu. Bài toán gồm hai bước chinh 3 Bước một tìm tẩt cả các tập thường xuyên theo ngưỡng so cho trước. Bước hai dựa vào các tập thưởng xuyên tìm các luật kểt hợp. Tầt cả khó khán của việc giải quyết bài toán tập trung ở bước một. Kết quả ứng đụng ánh xạ đóng và tập đóng để tìm tập thường xuyên cũng đã được nhiều tác giả công bể. Bài báo này sẽ đề xuất thuật toán tìm các tập thường xụyền dựa trên bao đóng của nó đề giảm thiểu các tập mục dữ liệu cần tính toán 1. Các khái niệm cơ bản . Cơ sở dữ liệu giao tác Cho I xỉ x2 xn là tập hợp các mục đữ liệu. Mỗi xi e 1 gọi là một mục dữ liệu. Một tập con t xil XÍ2 .xik G I với kín được gọi là một giao tác trên I. Một tập hợp gồm m giao tác T tl t2 . tm với m bất kỳ được gọi là một cơ sờ dữ liệu giao tác trên I 4 . Mỗi tập hợp X CI I với IIXII k được gọi là tập k-mục dữ liệu của I trong trường hợp không quan tâm đến sổ mục dữ liệu của X ta gọi tát X là tập mục dữ liệu một tập con s T gọi là tập định danh giao tác tidset . Để thuận tiện trong các ví dụ ta viết X ABC thay cho X A B C và s 123 thay cho s t 1 t2 t3 . Ma trận giao tác Cho một cơ sở dữ liệu giao tác T tl t2 . tm trên I xl x2 . xn . Ma trận giao tác của T là ma trận M mij mxn được định nghĩa 1 khi tị 0 khi X t tj Độ hỗ trợ của một tập mục dữ liệu X là tồng số các giao tác ừong T chứa X Supp X teT Xạt . Tập mục dữ liệu thường xuyên Cho so là một số nguyên vả X 1. Ta nói X là tập mục dữ liệu thường xuyên theo ngưỡng so tập thường xuyên nếu Supp X so. 321 Một số vẩn đề chọn lọc cùa Công nghệ thông tin và truyên thông Đợi Lài Ỉ4-Ỉ5 tháng 9 năm 2007 Đặt Fi X I Ị Supp X SO là tập các tập thường xuyên theo ngưỡng so của T. Một luật kết hợp trên cơ sở dữ liệu giao tác T trên I là một biểu .

TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
31    252    0    29-04-2024
8    176    0    29-04-2024
37    156    0    29-04-2024
33    125    0    29-04-2024
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.