tailieunhanh - Privacy preserving frequency-based learning algorithms in two part partitioned record model

In this paper, we consider a new scenario for privacy-preserving data mining called two-part partitioned record model (TPR) and find solutions for a family of frequency-based learning algorithms in TPR model. In TPR, the dataset is distributed across a large number of users in which each record is owned by two different users, one user only knows the values for a subset of attributes and the other knows the values for the remaining attributes. | Privacy Preserving Frequency-based Learning Algorithms in Two-Part Partitioned Record Model Luong The Dung Vietnam Government Information Security Commission Email thedungluong@ Tran Dang Hung Hanoi National University of Education Email hungtd@ Abstract. In this paper we consider a new scenario for privacy-preserving data mining called two-part partitioned record model TPR and find solutions for a family of frequency-based learning algorithms in TPR model. In TPR the dataset is distributed across a large number of users in which each record is owned by two different users one user only knows the values for a subset of attributes and the other knows the values for the remaining attributes. A miner aims to learn for example classification rules on their data while preserving each user s privacy. In this work we develop a cryptographic solution for frequency-based learning methods in TPR. The crucial step in the proposed solution is the privacy-preserving computation of frequencies of a tuple of values in the users data which can ensure each user s privacy without loss of accuracy. We illustrate the applicability of the method by using it to build the privacy preserving protocol for the naive Bayes classifier learning and briefly address the solution in other applications. Experimental results show that our protocol is efficient. Tóm tắt. Trong mô hình TPR tập dữ liệu gồm n bản ghi được phân tán trên 2n người dùng trong đó mỗi bản ghi được sở hữu bởi hai người dùng khác nhau một người dùng biết một số giá trị thuộc tính trong khi người dùng còn lại biết các thuộc tính còn lại của bản ghi. Giả thiết rằng các thuộc tính của mỗi người dùng là nhạy cảm và mỗi người dùng không muốn bộc lộ các giá trị thuộc tính cho việc khai phá dữ liệu. Một người Miner với mục đích là học các mô hình khai phá dữ liệu dựa trên tính tần suất ví dụ như học các luật phân lớp trong khi đảm bảo sự riêng tư cho mỗi người dùng. Các giải pháp ngẫu nhiên có thể giải quyết vấn

TỪ KHÓA LIÊN QUAN