tailieunhanh - Các thuật toán học máy áp dụng cho phân lớp, dự đoán

Bài viết tiến hành nghiên cứu các thuật toán , Bayes áp dụng cho các bài toán phân lớp và dự báo. Các chỉ tiêu theo ma trận nhầm lẫn được sử dụng để đánh giá, so sánh hiệu quả của các thuật toán. | ISSN 2354-0575 CÁC THUẬT TOÁN HỌC MÁY ÁP DỤNG CHO PHÂN LỚP DỰ ĐOÁN Nguyễn Quang Hoan1 Vũ Ngọc Tân2 Nguyễn Bá Giầu3 Phạm Đình Hà4 1 Trường Đại học Sư phạm Kỹ thuật Hưng Yên 2 Trường Đại học Luật Hà Nội 3 Trường THPT Nguyễn Bỉnh Khiêm - Vĩnh Bảo - Hải Phòng 4 Trường THPT Kim Thành - Kim Thành - Hải Dương Ngày tòa soạn nhận được bài báo 12 01 2018 Ngày phản biện đánh giá và sửa chữa 26 02 2018 Ngày bài báo được xét duyệt đăng 28 02 2018 Tóm tắt Bài báo nghiên cứu các thuật toán Bayes áp dụng cho các bài toán phân lớp và dự báo. Các chỉ tiêu theo ma trận nhầm lẫn được sử dụng để đánh giá so sánh hiệu quả của các thuật toán. Một số bàn luận các trường hợp khác nhau về độ lớn dữ liệu tỷ lệ dữ liệu học và dữ liệu thử được trình bày nhằm phân tích các tình huống trong ứng dụng. Các tính toán trực tiếp so sánh với tính toán trong phần mềm Weka được sử dụng để chạy thử kết xuất hiển thị các kết quả phân lớp dự báo nhằm minh chứng khả năng áp dụng thực tế. Từ khóa Luật học Độ lợi thông tin Entropy thuật toán học tỷ suất độ lợi. 1. Giới thiệu dụng. Bài báo này còn nêu quy trình giải bài toán Cây quyết định là một phương pháp tạo ra phân lớp dựa theo cây quyết định cách lựa chọn cấu trúc trong đó mỗi nút đại diện cho một phép thuật toán và cách xử lý dữ liệu cho các đối tượng thử đối với một thuộc tính mỗi nhánh trong cây cụ thể. thể hiện một kết quả thu được trên cơ sở các luật 4 6 . Đường dẫn từ gốc đến lá đại diện cho quy trình 2. Thuật toán cây quyết định trong phân loại. Cây quyết định dựa trên phương . Thuật toán pháp chia nói theo hình tượng là cây để trị . được Breiman Friedman Olsen và Trị ở đây hàm ý rút ra các quy tắc các luật học. Stone phát triển từ thuật toán ID3 trong lĩnh vực trí Luật phổ biến là luật if then hay luật nhân quả tuệ nhân tạo và trong thống kê. ID3 sử dụng độ lợi được áp dụng. thông tin Information Gain làm tiêu chí chọn nút. Có hai cách chia toàn bộ cơ sở dữ liệu học Độ lợi thông tin của một thuộc tính được tính bằng thành cây .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN