tailieunhanh - Khai phá tập mục lợi ích cao với cây COFI-tree trên dòng dữ liệu

Bài viết Khai phá tập mục lợi ích cao với cây COFI-tree trên dòng dữ liệu trình bày các nội dung chính sau: Các thuật ngữ cho khai phá tập mục lợi ích cao trên dòng dữ liệu; Khai phá tập mục lợi ích cao trên dòng dữ liệu. | Tuyển tập Hội nghị Khoa học thường niên năm 2020. ISBN 978-604-82-3869-8 KHAI PHÁ TẬP MỤC LỢI ÍCH CAO VỚI CÂY COFI-TREE TRÊN DÒNG DỮ LIỆU Nguyễn Huy Đức1 Đỗ Oanh Cường1 1 Trường Đại học Thủy lợi email ducnghuy@ 1. GIỚI THIỆU Ví dụ dòng giao tác bảng có các khối giao tác B1 - B5 mỗi cửa sổ chứa 3 khối giao Khai phá tập mục lợi ích cao là một hướng tác W1 chứa 3 khối B1-B3 W2 chứa 3 khối mở rộng và tổng quát của khai phá tập mục B2 - B4. Nếu hiện tại khai phá trên cửa sổ W1 phổ biến được đề xuất vào năm 2004 3 . thì thời điểm sau khai phá trên cửa sổ W2. Trong 1 tác giả đề xuất thuật toán khai phá hiệu quả tập mục lợi ích cao trên CSDL giao Bảng . Dòng dữ liệu giao tác tác dựa trên cấu trúc cây COFI-tree. Trong thực tế có nhiều ứng dụng sinh ra dòng dữ liệu data streams theo thời gian thực như dòng giao tác trong dây chuyền bán lẻ dòng kích web trong các ứng dụng web Các dòng giao tác này xuất hiện liên tục tuần tự theo thời gian và không giới hạn về số lượng. Do vậy tại thời điểm khai phá cần lấy các giao tác trong một khoảng thời gian nào đó. Khi chuyển sang thời điểm sau một số giao tác cũ cần loại bỏ và cần xét thêm các giao tác mới Bảng . Bảng lợi ích xuất hiện. Điều quan trọng khi khai phá trên dòng dữ liệu là phải kế thừa được những kết quả cũ trong khoảng thời gian trước để tạo ra kết quả mới trong khoảng thời gian hiện tại. Dựa trên phương pháp cửa sổ trượt Sliding window-based methods trong khai phá tập mục phổ biến 2 và cách khai phá Ký hiệu các khối giao tác là Bj các cửa sổ trong 1 bài báo đề xuất thuật toán khai phá là Wk có một số thuật ngữ như sau tập mục lợi ích cao trên dòng dữ liệu. - Lợi ích của tập mục X trong khối Bj ký hiệu u B j X là tổng lợi ích của tập mục X tại 2. CÁC THUẬT NGỮ CHO KHAI PHÁ TẬP MỤC LỢI ÍCH CAO TRÊN DÒNG các giao tác thuộc khối Bj tức là DỮ LIỆU uB j X u i p Tq . Tq B j i p X Tq Phân hoạch dòng giao tác thành từng khối - Lợi ích của tập mục X trong cửa sổ Wk và định nghĩa cửa sổ gồm một số khối. Tại ký .