Đang chuẩn bị liên kết để tải về tài liệu:
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn giới thiệu chung, rừng ngẫu nhiên xiên phân (RF-ODT); kết quả thực nghiệm; hướng phát triển. | Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn Đỗ Thanh Nghị Khoa CNTT-TT, ĐH. Cần Thơ Số 1 Lý Tự Trọng, Ninh Kiều, Cần Thơ Email: dtnghi@cit.ctu.edu.vn http://www.cit.ctu.edu.vn/∼dtnghi ĐHBK Tp.HCM, 27/03/2014 Đỗ Thanh Nghị RF-ODT cho phân lớp dữ liệu có số chiều lớn 1/ 40 Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Nội dung Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Đỗ Thanh Nghị RF-ODT cho phân lớp dữ liệu có số chiều lớn 2/ 40 Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Cây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả (Wu et al., 08) Đỗ Thanh Nghị RF-ODT cho phân lớp dữ liệu có số chiều lớn 3/ 40 Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Cây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả (Wu et al., 08) Ưu điểm của cây quyết định thời gian huấn luyện nhanh xử lý được dữ liệu liên tục, rời rạc mô hình dễ diễn dịch (luật if . then .) kết quả tốt cho phân lớp, hồi quy Khuyết điểm của cây quyết định hàm phân hoạch: đơn biến không hiệu quả cho vấn đề phức tạp: số chiều rất lớn (nhiễu), mất cân bằng, phi tuyến Đỗ Thanh Nghị RF-ODT cho phân lớp dữ liệu có số chiều lớn 4/ 40 Giới thiệu Rừng ngẫu nhiên xiên phân (RF-ODT) Kết quả thực nghiệm Hướng phát triển Top 10 vấn đề khó của khai mỏ dữ liệu (Yang & Wu, 06) Phân lớp dữ liệu có số chiều lớn #individus #dimensions vài trăm phần tử với hàng nghìn chiều dữ liệu hoàn toàn dễ tách biệt có nhiều lựa chọn mô hình mô hình học thường cho độ chính xác 100% trong tập học nhưng dự báo tập kiểm tra không tốt mô hình tốt: dự báo tốt trong tương lai Đỗ Thanh Nghị RF-ODT cho phân lớp dữ liệu có số chiều lớn 5/ .