tailieunhanh - Khai thác luật tuần tự có ràng buộc Itemset dựa trên tập mẫu thỏa ràng buộc
Trong bài báo này phát biểu bài toán khai thác luật tuần tự với ràng buộc Itemset ở vế trái của luật và đề xuất hai thuật toán MSRIC_R và MSRIC_P để giải quyết bài toán này. Trong đó, MSRIC_R thực hiện đưa ràng buộc vào giai đoạn sinh luật từ tập mẫu tìm được, còn MSRIC_P thực hiện ở giai đoạn tìm mẫu trước. Mời các bạn cùng tham khảo! | KHAI THÁC LUẬT TUẦN TỰ CÓ RÀNG BUỘC ITEMSET DỰA TRÊN TẬP MẪU THỎA RÀNG BUỘC Văn Thị Thiên Trang Khoa Công nghệ Thông tin trường Đại học Công nghệ Tp. Hồ Chí Minh Việt Nam TÓM TẮT Trong bài báo này chúng tôi phát biểu bài toán khai thác luật tuần tự với ràng buộc Itemset ở vế trái của luật và đề xuất hai thuật toán MSRIC_R và MSRIC_P để giải quyết bài toán này. Trong đó MSRIC_R thực hiện đưa ràng buộc vào giai đoạn sinh luật từ tập mẫu tìm được còn MSRIC_P thực hiện ở giai đoạn tìm mẫu trước. Kết quả thực nghiệm cho thấy MSRIC_P hiệu quả hơn. In this paper we state the problem of mining sequential rules with itemset contraint in the pre-condition of the rule and propose two algorithms named MSRIC_R and MSRIC_P to solve this problem. MSRIC_R algorithm puts the constraints into the rule generating process and MSRIC_P puts into the pattern mining process. The experimental results show that MSRIC_P is more efficient than the other in all cases examined in this work. Key words Sequential rule constraint sequential pattern prefix-tree sequence database. 1. GIỚI THIỆU Luật tuần tự được sinh từ mẫu tuần tự nó biểu diễn mối quan hệ giữa hai loạt sự kiện loạt sự kiện này sẽ xảy ra sau loạt sự kiện kia. Một luật khai thác được sẽ biểu diễn dưới dạng nghĩa là nếu X có mặt trong một chuỗi bất kỳ của cơ sở dữ liệu CSDL thì với một độ tin cậy cao có thể khẳng định Y cũng xuất hiện trong chuỗi đó theo sau X. Nó được ứng dụng trong việc dò lỗi phát hiện xâm nhập và bẫy lỗi trong lĩnh vực y dược thương mại điện tử. Tùy thuộc vào từng lĩnh vực ứng dụng nhu cầu khai thác luật tuần tự cũng khác nhau. Nếu khai thác trả về tập đầy đủ các luật tuần tự thì tốn nhiều thời gian và bộ nhớ. Một số nghiên cứu tiến hành khai thác luật tuần tự không dư thừa nhằm tìm ra những luật tổng quát nhất thu gọn số lượng tập luật khai thác được. Tuy nhiên nếu khai thác theo yêu cầu người dùng thì luật tuần tự tổng quát và luật tuần tự không dư thừa không đáp ứng được. Do đó trong bài báo này chúng tôi đề .
đang nạp các trang xem trước