Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Nghiên cứu và thử nghiệm thuật toán phân cụm K-means
tailieunhanh - Nghiên cứu và thử nghiệm thuật toán phân cụm K-means
Bài viết "Nghiên cứu và thử nghiệm thuật toán phân cụm K-means" đưa ra các bước xây dựng thuật toán phân cục K-means và sử dụng thư viện có sẵn scikit-learn để chạy thử nghiệm thuật toán, đưa ra các hạn chế và ưu điểm của thuật toán này. Mời các bạn cùng tham khảo chi tiết nội dung bài viết! | NGHIÊN CỨU VÀ THỬ NGHIỆM THUẬT TOÁN PHÂN CỤM K-MEANS Đỗ Thuỳ Dương Trường Đại học Hà nội Tóm tắt - Bài báo cáo này đưa ra các bước xây dựng thuật toán phân cục K-means và sử dụng thư viện có sẵn scikit-learn để chạy thử nghiệm thuật toán đưa ra các hạn chế và ưu điểm của thuật toán này. Từ khoá - Học không giám sát phân cụm K-means scikit-learn python 1. Giới thiệu Nếu thuật toán Linear Regression - là thuật toán đơn giản nhất trong học máy có giám sát thì một trong những thuật toán cơ bản nhất trong học máy không giám sát là thuật toán phân cụm K-means. Trong thuật toán K-means clustering chúng ta không biết nhãn label của từng điểm dữ liệu. Mục đích là làm thể nào để phân dữ liệu thành các cụm cluster khác nhau sao cho dữ liệu trong cùng một cụm có tính chất giống nhau. Ví dụ Một công ty muốn tạo ra những chính sách ưu đãi cho những nhóm khách hàng khác nhau dựa trên sự tương tác giữa mỗi khách hàng với công ty đó số năm là khách hàng số tiền khách hàng đã chi trả cho công ty độ tuổi giới tính thành phố nghề nghiệp . Giả sử công ty đó có rất nhiều dữ liệu của rất nhiều khách hàng nhưng chưa có cách nào chia toàn bộ khách hàng đó thành một số nhóm cụm khác nhau. Áp dụng thuật toán phân cụm K-means chúng ta có thể phân nhóm các khách hàng. Sau khi đã phân ra được từng nhóm nhân viên công ty đó có thể lựa chọn ra một vài khách hàng trong mỗi nhóm để quyết định xem mỗi nhóm tương ứng với nhóm khách hàng nào. Phần việc cuối cùng này cần sự can thiệp của con người nhưng lượng công việc đã được rút gọn đi rất nhiều. Ý tưởng đơn giản nhất về cluster cụm là tập hợp các điểm ở gần nhau trong một không gian nào đó không gian này có thể có rất nhiều chiều trong trường hợp thông tin về một điểm dữ liệu là rất lớn . Hình bên dưới là một ví dụ về 3 cụm dữ liệu từ giờ tôi sẽ viết gọn là cluster . 36 Bài toán với 3 clusters. Giả sử mỗi cluster có một điểm đại diện center màu vàng. Và những điểm xung quanh mỗi center thuộc vào cùng nhóm với center đó. Một cách đơn giản nhất xét .
Hải Yến
640
6
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Đồ án tốt nghiệp Thuật toán Phân cụm dữ liệu nửa giám sát
61
202
9
Thuật toán phân cụm K-MI và thuật toán hỗ trợ thử nghiệm phân cụm
17
81
0
Thuật toán phân cụm mờ cộng tác và giảm chiều dữ liệu cho bài toán phân cụm ảnh vệ tinh siêu phổ
6
54
1
Một cải tiến phân cụm mờ với tham số mờ cho từng cụm dữ liệu
6
60
3
So sánh một số thuật toán phân cụm phổ cho dữ liệu biểu diễn Gene
8
96
0
Một phương pháp phân cụm khuôn mặt hiệu quả trên mạng xã hội
6
76
0
Cải tiến thuật toán phân cụm mờ dựa trên độ đo trọng số Entropy và chỉ số Calinski - Harabasz
11
90
0
Ứng dụng thuật toán phân cụm dữ liệu để khai thác kết quả thi nhằm chuẩn hóa chất lượng đề thi trắc nghiệm
4
67
2
Đoán nhận gen bằng kỹ thuật phân cụm trong tin học
11
63
1
Đánh giá hiệu năng của thuật toán phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa
14
135
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461871
55
Giới thiệu :Lập trình mã nguồn mở
14
22673
60
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10897
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10070
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9534
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8293
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8243
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6692
253
Vật lý hạt cơ bản (1)
29
5775
85
TỪ KHÓA LIÊN QUAN
Cơ sở dữ liệu
Thuật toán phân cụm K means
Học không giám sát
pPhân cụm K means
Scikit learn
Thuật toán Linear Regression
Thuật toán K means clustering
Thuật toán KMeans
Mô hình MapReduce
Phân cụm ảnh
Phương pháp Unsupervised Learning
Thuật toán cho hàm map
Bài giảng Máy học nâng cao
Máy học nâng cao
Hierarchical clustering
Density based clustering
TÀI LIỆU MỚI ĐĂNG
Động cơ đốt trong và máy kéo công nghiêp tập 1 part 7
23
258
0
28-04-2024
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
146
0
28-04-2024
BÀI GIẢNG VỀ - MẠCH ĐIỆN II - Chương I: Phân tích mạch trong miền thời gian
38
140
0
28-04-2024
GIÁO TRÌNH MÁY ĐIỆN KHÍ CỤ ĐIỆN - PHẦN I MÁY ĐIỆN - CHƯƠNG 1
46
131
2
28-04-2024
New Trends and Developments in Automotive Industry Part 7
35
96
0
28-04-2024
MẪU CHỨNG CHỈ QUẢN LÝ VŨ KHÍ, VẬT LIỆU NỔ, CCHT
1
118
0
28-04-2024
ĐỀ THI THỬ ĐẠI HỌC 2009 – THPT ĐÔNG SƠN 1 – LẦN 2 – MÔN TOÁN
8
93
0
28-04-2024
Norton ghost : Chương trình sao chép ổ cứng part 9
8
102
0
28-04-2024
GYNECOLOGIC CANCERS IN PREGNANCY: GUIDELINES OF AN INTERNATIONAL CONSENSUS MEETING
12
91
0
28-04-2024
Giáo trình vật liệu điện part 8
11
112
0
28-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5755
1381
Ebook Chào con ba mẹ đã sẵn sàng
112
3770
1232
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5326
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8293
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3503
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10897
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3688
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4058
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4132
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.