Đang chuẩn bị liên kết để tải về tài liệu:
Luận văn Thạc sĩ Kỹ thuật: Một số thuật toán học máy trong phân loại hành vi sử dụng gói cước data viễn thông

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

Luận văn tập trung vào các kỹ thuật xử lý dữ liệu lớn và các thuật toán phân lớp dữ liệu bao gồm: Phân loại tuyến tính, Hồi quy logistic, Phân loại Naïve Bayes, Rừng ngẫu nhiên (RF). Ứng dụng thuật toán học máy trong lĩnh vực kinh doanh viễn thông sử dụng dữ liệu lịch sử của tập khách hàng để xây dựng các mô hình có khả năng phân loại, dự đoán nhu cầu sử dụng của khách hàng. | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN QUANG TUẤN MỘT SỐ THUẬT TOÁN HỌC MÁY TRONG PHÂN LOẠI HÀNH VI SỬ DỤNG GÓI CƯỚC DATA VIỄN THÔNG LUẬN VĂN THẠC SĨ KỸ THUẬT Theo định hướng ứng dụng Hà Nội - năm 2020 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN QUANG TUẤN MỘT SỐ THUẬT TOÁN HỌC MÁY TRONG PHÂN LOẠI HÀNH VI SỬ DỤNG GÓI CƯỚC DATA VIỄN THÔNG CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH MÃ SỐ 8.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT Theo định hướng ứng dụng NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS. TRẦN ĐÌNH QUẾ Hà Nội - năm 2020 LỜI CAM ĐOAN Tôi xin cam đoan Khoá luận tốt nghiệp với đề tài MỘT SỐ THUẬT TOÁN HỌC MÁY TRONG PHÂN LOẠI HÀNH VI SỬ DỤNG GÓI CƯỚC DATA VIỄN THÔNG là công trình nghiên cứu của cá nhân tôi các số liệu kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác không sao chép của bất cứ ai. Tôi xin chịu mọi trách nhiệm về công trình nghiên cứu của riêng mình Hà Nội ngày . Người cam đoan Nguyễn Quang Tuấn i MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT . iv DANH MỤC CÁC BẢNG . v DANH MỤC CÁC HÌNH . vi MỞ ĐẦU . 1 CHƯƠNG 1 - TỔNG QUAN VỀ BÀI TOÁN PHÂN LOẠI HÀNH VI SỬ DỤNG DỊCH VỤ VIỄN THÔNG . 3 1.1 Giới thiệu bài toán .3 1.2 Tổng quan quy trình phân tích dữ liệu .3 1.2.1 Tổng quan .3 1.2.2 Quy trình triển khai bài toán phân tích dữ liệu .4 1.2.3 Lưu đồ quy trình thực hiện dự án ứng dụng phân tích dữ liệu .6 1.3 Xử lý dữ liệu phân tán với Spark .6 1.3.1 Giới thiệu .6 1.3.2 Cơ chế hoạt động .7 1.3.3 Spark application .9 1.4 Các chỉ số đánh giá hiệu năng mô hình .9 1.4.1 Ma trận nhầm lẫn Confusion matrix .9 1.4.2 Các chỉ số Accuracy Precision Recall và F1 score .10 1.4.3 Đường cong ROC .11 1.4.4 Biểu đồ Lift .13 1.4.5 Biểu đồ Gain .14 1.5 Các phương pháp xây dựng đặc trưng dữ liệu .15 1.5.1 Các phương pháp thống kê lựa chọn đặc trưng dữ liệu với phương pháp lọc .16 ii 1.5.2 Các phương pháp thống kê lựa chọn đặc trưng dữ liệu với phương pháp đóng gói.20 1.5.3 Các phương pháp thống kê lựa chọn đặc trưng dữ .

TÀI LIỆU LIÊN QUAN