tailieunhanh - Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang
Chương 4 - Các phương pháp học có giám sát (học dựa trên các láng giềng gần nhất). Chương này trình bày những nội dung chính sau: Các khái niệm, các ví dụ về bài toán phân lớp, giải thuật phân lớp, giải thuật dự đoán, hàm tính khoảng cách, chuẩn háo miền giá trị thuộc tính,. nội dung chi tiết. | Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@ Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2011-2012 Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu năng hệ thống học máy Các phương pháp học dựa trên xác suất Các phương pháp học có giám sát Học dựa trên các láng giềng gần nhất (Nearest neighbors learning) Các p phương gp pháp p học không gg giám sát Lọc cộng tác Học tăng cường Học Máy – IT 4862 2 Học dựa trên các láng giềng gần nhất Một số tên gọi khác của phương pháp học dựa trên các láng giềng gần nhất (Nearest neighbors learning) • Instance-based learning • Lazy learning • Memory Memory-based based learning Ý tưởng của phương pháp học dựa trên các láng giềng gần nhất ộ tập ập các ví dụ ụ học ọ • Với một ─ ─ (Đơn giản là) lưu lại các ví dụ học Chưa xây dựng một mô hình (mô tả) rõ ràng và tổng quát của hàm mục tiêu cần học • Đối với một ví dụ cần phân loại/dự đoán ─ Xét quan hệ giữa ví dụ đó với các ví dụ học để gán giá trị của hàm mục tiêu (một nhãn lớp, hoặc một giá trị thực) Học Máy – IT 4862 3 Học dựa trên các láng giềng gần nhất Biểu diễn đầu vào của bài toán • Mỗi ví dụ x được biểu diễn là một vectơ n chiều trong g không gg gian các vectơ X∈Rn • x = (x1,x2, ,xn), trong đó xi (∈R) là một số thực C thể Có ể áp dụng được với cả ả 2 kiểu ể bài toán học • Bài toán phân lớp (classification) Hàm mục ụ tiêu có g giá trịị rời rạc ạ ((a discrete-valued target g function)) ─ Đầu ra của hệ thống là một trong số các giá trị rời rạc đã xác định trước (một trong các nhãn lớp) ─ • Bài toán dự đoán/hồi quy (prediction/regression) Hàm mục tiêu có giá trị liên tục (a continuous-valued target function) ─ Đầu ra của hệ thống là một giá trị số thực ─ Học Máy – IT 4862 4 Ví dụ bài toán p phân lớp p Xét 1 láng giềng gần nhất → Gán z vào lớp c2 Xét 3 láng giềng gần nhất → Gán z vào lớp c1 Xét 5 láng giềng gần nhất → Gán z vào lớp c1 Học Máy –
đang nạp các trang xem trước