tailieunhanh - Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 5 - Nguyễn Hoàng Ân (2018)

Bài giảng "Khai phá dữ liệu - Chương 5: Khai phá dữ liệu trong kinh doanh" cung cấp cho người học các kiến thức: Hiểu dữ liệu và chuẩn bị dữ liệu, vai trò của tiền xử lý dữ liệu, nhiệm vụ chính của tiền xử lí dữ liệu. | Bài giảng Kho dữ liệu và khai phá dữ liệu Chương 5 - Nguyễn Hoàng Ân 2018 Chương 5 Khai phá dữ liệu trong kinh doanh Phần 1 Tiền xử lí dữ liệu 1. Hiểu dữ liệu và chuẩn bị dữ liệu 2. Vai trò của tiền xử lý dữ liệu 3. Nhiệm vụ chính của tiền xử lí dữ liệu 1. Những vấn đề cơ bản để hiểu dữ liệu Cách thu thập được dữ liệu cần thiết để mô hình hóa Data Acquisition Cách kết hợp dữ liệu tìm được từ các nguồn dữ liệu khác nhau Data Integeation. Mô tả dữ liệu Data Description Đánh giá chất lượng độ sạch của dữ liệu Data Assessment Thu thập dữ liệu Cách thu thập dữ liệu cần thiết để mô hình hóa Data Acquisition Trích chọn dữ liệu theo câu hỏi từ CSDL tới tập tin phẳng Flat file Ngôn ngữ hỏi bậc cao truy nhập trực tiếp CSDL Kết nối mức thấp để truy nhập trực tiếp CSDL Loại bỏ ràng buộc không gian thời gian khi di chuyển khối lượng lớn dữ liệu Hỗ trợ việc quản lý và bảo quản dữ liệu tập trung hóa Rút gọn sự tăng không cần thiết của dữ liệu Tạo điều kiện quản trị dữ liệu tốt hơn để đáp ứng mối quan tâm đúng đắn Tích hợp dữ liệu Cách kết hợp dữ liệu tìm được từ các nguồn dữ liệu khác nhau Data Integeation. Mô tả dữ liệu Giá trị kỳ vọng mean Xu hướng trung tâm của tập dữ liệu Độ lệch chuẩn Standard deviation Phân bố dữ liệu xung quanh kỳ vọng Cực tiểu Minimum Giá trị nhỏ nhất Cực đại Maximum Giá trị lớn nhất Bảng tần suất Frequency tables Phân bố tần suất giá trị của các biến Lược đồ Histograms Cung cấp kỹ thuật đồ họa biểu diễn tần số giá trị của một biến Mô tả dữ liệu 13 18 13 14 13 16 14 21 13 Đánh giá và lập hồ sơ dữ liệu Đánh giá dữ liệu Định vị một vấn đề trong dữ liệu cần giải quyết Tìm ra và quyết định cách nắm bắt vấn đề Mô tả dữ liệu sẽ làm hiện rõ một số vấn đề Kiểm toán dữ liệu lập hồ sơ dữ liệu và phân tích ảnh hưởng của dữ liệu chất lượng kém. Lập hồ sơ dữ liệu cơ sở căn cứ phân bố dữ liệu Tâm của dữ liệu Các ngoại lai tiềm năng bất kỳ Số lượng và phân bố các khoảng trong trong mọi trường hợp Bất cứ dữ liệu đáng ngờ như mã thiếu miscodes dữ liệu .

TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.