tailieunhanh - Bài giảng Khai phá dữ liệu: Bài 4 - Văn Thế Thành
Bài giảng "Khai phá dữ liệu - Bài 4: Phân lớp Classification" giới thiệu tới người đọc các kiến thức tổng quan phân lớp là gì, dự báo là gì, giới thiệu cây quyết định, phân lớp kiểu Bayes, những phương pháp phân lớp khác, độ chính xác trong phân lớp. . | Bài 4 Phân lớp - Classification Khai phá dữ liệu 1 Phân lớp và dự báo Tổng quan Phân lớp là gì Dự báo là gì Giới thiệu cây quyết định Phân lớp kiểu Bayes Những phương pháp phân lớp khác Độ chính xác trong phân lớp Tóm tắt Khai phá dữ liệu 2 Phân lớp là gì Mục đích để dự đoán những nhãn phân lớp cho các bộ dữ liệu mâu mới Đầu vào một tập các mâu dữ liệu huấn luyện với một nhãn phân lớp cho mỗi mâu dữ liệu Đầu ra mô hình bộ phân lớp dựa trên tập huấn luyện và những nhãn phân lớp Khai phá dữ liệu 1 Một số ứng dụng phân lớp tiêu biểu Tín dụng Tiếp thị Chẩn đoán y khoa Phân tích hiệu quả điều trị Khai phá dữ liệu 4 Dự đoán là gì Tương tự với phân lớp o xây dựng một mô hình o sử dụng mô hình để dự đoán cho những giá trị chưa biết Phương thức chủ đạo Giật lùi o hồi quy tuyến tính và nhiều cấp o hồi quy không tuyến tính Khai phá dữ liệu 5 Phân lớp so với dự báo Phân lớp o dự đoán các nhãn phân lớp o phân lớp dữ liệu dựa trên tập huấn luyện và các giá trị trong một thuộc tính phân lớp và dùng nó đe xác định lớp cho dữ liệu mới Dự báo o xây dựng mô hình các hàm giá trị liên tục o dự đoán những giá trị chưa biết Khai phá dữ liệu 6 2 Phân lớp - tiến trình hai bứơc 1. Bước 1 Xây dựng mô hình từ tập huấn luyện 2. Bước 2 Sử dụng mô hình - kiểm tra tính đúng đắn của mô hình và dùng nó để phân lớp dữ liệu mới Khai phá dữ liệu 7 Xây dựng mô hình Bước 1 Mỗi bộ mẫu dữ liệu được phân vào một lớp được xác định trước Lớp của một bộ mẫu dữ liệu được xác định bởi thuộc tính gán nhãn lớp Tập các bộ mẫu dữ liệu huấn luyện -tập huấn luyện - được dùng đe xây dựng mô hình Mô hình được biểu diễn bởi các luật phân lớp các cây quyết định hoặc các công thức toán học Khai phá dữ liệu 8 Sử dụng mô hình Phân lớp cho những đối tượng mới hoặc chưa được phân lớp Bước 2 Đánh giá độ chính xác của mô hình o lớp biết trước của một mẫu bộ dữ liệu đem kiểm tra được so sánh với kết quả thu được từ mô hình o tỉ lệ chính xác phần trăm các mẫu bộ dữ liệu được phân lớp đúng bởi mô hình trong số các lần kiểm tra .
đang nạp các trang xem trước