Đang chuẩn bị liên kết để tải về tài liệu:
Bài giảng Khai phá dữ liệu: Bài 5 - Văn Thế Thành
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài giảng "Khai phá dữ liệu - Bài 5: Gom cụm (clustering)" trình bày các nội dung: Phân tích bằng gom cụm là gì, đối tượng tương tự và không tương tự, các loại dữ liệu trong phân tích bằng gom cụm, các phương pháp gom cụm chính, phương pháp phân hoạch,. . | Bài 5 Gom cụm clustering Phân tích bằng gom cụm Phân tích bằng gom cụm là gì Đối tượng tương tự và không tương tự Các loại dữ liệu trong phân tích bằng gom cụm Các phương pháp gom cụm chính Các phương pháp phân hoạch Các phương pháp phân cấp . Phân tích Outlier Tóm tắt Phân tích bằng gom cụm là gì Gom cụm gom các đối tượng dữ liệu o Tương tự với một đối tượng khác trong cùng cụm o Không tương tự với các đối tượng trong các cụm khác o Mục tiêu của gom cụm để gom tập các đối tượng thành các nhóm 1 Các ứng dụng tiêu biểu của gom cụm Một công cụ độc lập để xem xét phân bố dữ liệu Làm bước tiên xử lý cho các thuật toán khác Các ứng dụng của gom cụm Tiếp thị khám phá các nhóm khác hàng phân biệt trong CSDL mua hàng Sử dụng đất nhận dạng các vùng đất sử dụng giống nhau khi khảo sát CSDL quả đất Bảo hiểm nhận dạng các nhóm công ty có chính sách bảo hiểm mô tô với chi phí đền bù trung bình cao Hoạch định thành phố nhận dạng các nhóm nhà cửa theo loại nhà giá trị và vị trí địa lý. Thế nào là gom cụm tốt Một phương pháp tốt sẽ tạo ra các cụm có chất lượng cao với o Tương tự cao cho trong lớp intra-class o Tương tự thấp giữa các lớp inter-class Chất lượng của kết quả gom cụm phụ thuộc vào o độ đo tương tự sử dụng o Cài đặt độ đo tương tự Chất lượng của phương pháp gom cụm cũng được đo bởi khả nang phát hiện vài hay tất cả các mẫu bị che hidden patterns 2 Các yêu cầu của gom cụm trong KPDL 1 Có thể thay đổi quy mô scalability Khả năng làm việc các loại thuộc tính khác nhau. Khám phá các cụm có hình dáng bất kỳ Các yêu cầu tối thiều cho tri thức lĩnh vực nhằm xác định các tham biến nhập 7 Các nhu cầu gom cụm trong KPDL 2 Khả năng làm việc với nhiêu và outliers Không nhạy cảm với thư tự các bản ghi nhập vào Có số chiêu cao HỢp tác với các ràng buộc do người dùng chỉ định Có thể diễn dịch và khả dụng 8 Tương tự và bất tương tự giữa hai đối tượng 1 Không có định nghĩa duy nhất về sự tương tự và bất tương tự giữa các đối tượng dữ liệu Định nghĩa về tương tự và bất tượng tự giữa các