tailieunhanh - Một mở rộng thuật toán phân cụm k-means cho dữ liệu hỗn hợp.

Một mở rộng thuật toán phân cụm k-means cho dữ liệu hỗn hợp. Để mô tả sự tương tự về mặt tổ chức (cấu trúc) của 2 hệ thống, điều khiển học đã xây dựng ra ngôn ngữ hình thức với các khái niệm như tổ chức, cấu trúc, trật tự, sự đa dạng, sự ràng buộc, ngẫu nhiên, tự do, sự phức tạp. | Tap chi Tin hoc và Diều khiển hoc 2006 267 274 MỘT MỞ RỘNG THUẬT TOAN PHÂN CỤM k-MEANS CHO DỮ LIỆU HON HỢP HOÀNG XU AN 11UAN 1 NGUYEN THỊ XUAN HƯƠNG2 1Khoa Cong nghệ thong tin Trường -Dại học Công nghệ 2 Trường Dại học Dôn lập Hải Phong Abstract. Partitioning a large set of data objects into homogenous clusters is an important problem in data mining. Àmong clustering algorithms k-means is well known by its advantages and especially efficient for clustering very large data sets. This algorithm and its prime variants are only to cluster numerical data sets. There are some extensions to this algorithm for clustering data sets with mixed numeric and categorical values but they omit some its advantages. Ịn this paper we present an improvement of . -means algorithm for clustering a data set with mixed numeric and categorical values. This algorithm conserves advantages of -means algorithm. Tóm tat. Phan một tập dữ liệu thanh các tập con sao cho các dối lượng trong cung tập con tương tiụr nhau còn các dội tượng thuộc cac tập con khác nhau thì khác nhau theo một nghĩa nao do la mật bài toán quan trong trong kham pha tri thức tù dữ liệu. Trong sộ cac thuật toan phận cum thuạt toán k-mean cá nhiậu ưu diậm và dược su dung rậng rai dặc biet khi phận cum cac tập dữ Iìộu lớn. Ban dậu thuât toán nay và cac bien the cua ná chỉ làm vìộc với dữ liêu so sau dá dữ cá mật sậ mờ rông dậ làm viẹc với dữ liẹu dinh danh hoặc dữ liẹu hận hợp nhưng cac thuât toan nay làm mat di mọt so ưu diệm cua thuât toan nguyen thủy. Trong bai này chung tậi dậ xuất mật thuật toán mo rọng cua thuật toan k-means cho dữ lieu hận hợp goi la thuật toán k-tậm. Thuât toán này kậ thừa các uu diem cua thuât toan k-means. 1. GIỚI THIÊU Thuật toán phân cum k-means dau tiên do MacQueen d ê xuất nam 1967 10 và các biến the cua no 1 nhu PAM CLARA CLARANS lá các thuật toán phán hoạch tập dữ liêu gêm N dêi tuong co n thuộc tính so thanh k k N tap con. Cac thuât toán loai này dơn gian dê phuc tap thap va de song .

TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.