tailieunhanh - Bài giảng Khai phá dữ liệu: Bài 2 - Văn Thế Thành

Bài giảng Khai phá dữ liệu - Bài 2: Luật kế hợp cung cấp cho người đọc các kiến thức cơ sở về luật kết hợp, tạo luật kết hợp, các tập phổ biến với mẹo Apriori, tạo ứng viên Apriori, thuật toán Apriori đã đủ nhanh,. nội dung chi tiết. | Bài 2 Luật kết hợp Khai phá dữ liệu 1 Luật kết hợp Cơ sở Khai phá luật kếthợp - Tìmtần số mẫu mối kết hợp sự tương quan hay các cấu trúc nhân quả giữa các tập đối tượng trong các cơ sở dữ liệu giao tác cơ sở dữ liệu quan hệ và những kho thông tin khác. Tính hiểu được dễ hiểu Tính sử dụng được Cung cấp thông tin thiết thực Tính hiệu quả Đã có những thuật toán khai thác hiệu quả Các ứng dụng - Phân tích dữ liệu giỏ hàng cross-marketing thiết kế catalog lossleader analysis gom cụm phân lớp . Khai phá dữ liệu 2 Luật kết hợp Cơ sở Định dạng thể hiện đặc trưng cho các luật kết hợp - khăn bia 60 - mua khăn mua bia 60 - Neu mua khăn thì mua bia trong 60 trường hợp. Khăn và bia được mua chung trong dòng dữ liệu. Các biểu diễn khác - mua x khăn mua x bia 60 - khoa x CS A học x DB điểm x A 1 75 Khai phá dữ liệu 3 1 Luật kết hợp Cơ sở khăn b 60 NẾU mua khăn THÌ mua bia 1 2 3 4 trong 60 trường hợp trên dòng dữ liệu 1 Tiền đề vế trái thân 2 Mệnh đề kết quả vế phải đầu 3 Support tần số trong bao nhiêu phần trăm dữ liệu thì những điều ở vế trái và vế phải cùng xảy ra 4 Confidence độ mạnh nếu vế trái xảy ra thì có bao nhiêu khả năng vế phải xảy ra Khai phá dữ liệu Luật kết hợp Cơ sở Bộ ủng hộ biểu thị tần số luật có trong các giao tác. support A B s c p AuB support A B Bộ tin cây biểu thị số phần trăm giao tác có chứa luôn B trong số những giao tác có chứa A. confidence A B s c p B A p AuB p A support A B support A Khai phá dữ liệu 5 Luật kết hợp Cơ sở Bộ ủng hộ tối thiểu o - Cao ít tập phần tử itemset phổ biến ít luật hợp lệ rất thường xuất hiện - Thấp nhiều luật hợp lệ hiếm xuất hiện Bộ tin cây tối thiểu Y - Cao ít luật nhưng tất cả gần như đúng - Thấp nhiều luật phần lớn rất không chắc chắn Giá trị tiêu biểu ơ 2 -10 Y 70 - 90 Khai phá dữ liệu 6 2 Luật kết hợp Cơ sở Giao tác - Dạng quan hệ Tid item 1 item1 1 item2 2 item3 Item vàitemsets Dạng kết Tid itemset 1 item1 item2 2 item3 phần tử đơn lẻ và tập phần tử Support của tập I số lượng giao tác có chứa

TỪ KHÓA LIÊN QUAN