Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Kỹ thuật lập trình
Một cải tiến thuật toán K-Means song song sử dụng phương pháp lấy mẫu
tailieunhanh - Một cải tiến thuật toán K-Means song song sử dụng phương pháp lấy mẫu
Nghiên cứu này trình bày ý tưởng cải tiến thuật toán phân cụm dữ liệu PK-means, phân tích ưu và nhược điểm của thuật toán này, sau đó trình bày thuật toán cải tiến của chúng tôi SK-meansMR và thực nghiệm đánh giá chất lượng, tốc độ của thuật toán trên dữ liệu lớn. | 196 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Một cải tiến thuật toán K-Means song song sử dụng phương pháp lấy mẫu Trần Hoàng Việt1 Nguyễn Thị Tuyết1 Trần Thiên Thành1 1 Khoa Công nghệ thông tin Đại học Quy Nhơn tranhoangviet92@ nguyenthituyet@ thanhtranthien@ Tóm tắt Phân cụm dữ liệu là một kỹ thuật ứng dụng trong nhiều lĩnh vực khác nhau. K-means là thuật toán kinh điển trong phân cụm dữ liệu. Hiện tại trong thời điểm bùng nổ dữ liệu K-means cũng như các thuật toán khác không đáp ứng yêu cầu về tốc độ. Việc cải tiến thuật toán để xử lý dữ liệu lớn là nhu cầu cấp thiết. Trong nghiên cứu này chúng tôi trình bày ý tưởng cải tiến thuật toán phân cụm dữ liệu PK-means phân tích ưu và nhược điểm của thuật toán này sau đó trình bày thuật toán cải tiến của chúng tôi SK-meansMR và thực nghiệm đánh giá chất lượng tốc độ của thuật toán trên dữ liệu lớn. Keywords K-means cải tiến MapReduce PK-means SK-meansMR. 1 Mở đầu Chúng ta đang tràn ngập trong thông tin nhưng lại khát tri thức nhận định của John Naisbett s đã thể hiện được nhu cầu rất lớn về khai phá dữ liệu. Đặc biệt trong thời điểm bùng nổ thông tin việc khai phá dữ liệu lớn càng trở nên cấp thiết hơn nữa. Các bài toán hiện tại thường gắn liền với tập dữ liệu lớn nhưng các thuật toán truyền thống không đáp ứng yêu cầu về thời gian. Xử lý song song trên môi trường phân tán là một giải pháp để giải quyết vấn đề này. Phân cụm dữ liệu là một bước quan trọng trong khai phá dữ liệu được ứng dụng trong nhiều lĩnh vực khác nhau như thiên văn học tin sinh học thương mại điện tử phát hiện lừa đảo quảng cáo quản lý quan hệ khách hàng chăm sóc sức khỏe viễn thông đầu tư. Trong phân cụm dữ liệu thuật toán K-means là thuật toán kinh điển nhưng không thể giải quyết tập dữ liệu lớn. Để khắc phục một số nhược điểm của K-means khi xử lý dữ liệu lớn các cải tiến thường sử dụng mô hình lập trình MapReduce để tăng hiệu suất thuật toán. Một trong những thuật toán cải tiến .
Phương Loan
105
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Thuật toán và tư duy thuật toán
46
177
4
Bài giảng Thuật toán: Chương 2 - GV. Nguyễn Thanh Cẩm
65
152
0
Bài giảng Thuật toán: Chương 3 - GV. Nguyễn Thanh Cẩm
67
128
1
Bài giảng Thiết kế và đánh giá thuật toán: Phân tích thuật toán - TS. Lê Nguyên Khôi
29
173
2
Bài giảng Thuật toán: Chương 1 - GV. Nguyễn Thanh Cẩm
77
129
0
Bài giảng Thuật toán: Chương 4 - GV. Nguyễn Thanh Cẩm
42
156
0
Bài giảng Tin học 10 - Bài 4: Bài toán và thuật toán (Bùi Thanh Hoàn)
41
137
1
Ebook Cẩm nang thuật toán: Tập 1 - Robert Sedgewick
404
239
29
Ebook Cẩm nang thuật toán: Tập 2 - Robert Sedgewick
309
204
14
Ebook Một số vấn đề về thuật toán - Nguyễn Hữu Điền
233
155
4
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461871
55
Giới thiệu :Lập trình mã nguồn mở
14
22662
59
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10897
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10069
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9525
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8293
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8243
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6691
253
Vật lý hạt cơ bản (1)
29
5775
85
TỪ KHÓA LIÊN QUAN
Kỹ thuật lập trình
Thuật toán K Means song song
Phương pháp lấy mẫu
Phân cụm dữ liệu
Mô hình lập trình song song MapReduce
Khai phá dữ liệu
Khai phá quá trình
Môn học Khai phá dữ liệu
Nội dung Khai phá dữ liệu
Dạy học Khai phá dữ liệu
Bài luận môn Khai phá dữ liệu
Bài giảng Khai phá dữ liệu
Quá trình khám phá tri thức
Vai trò khai phá dữ liệu
ứng dụng khai phá dữ liệu
Ý nghĩa khai phá dữ liệu
Bài giảng môn học Khai phá dữ liệu
Tổng quan về khai phá dữ liệu
Bài toán khai phá dữ liệu
Giai đoạn trong khai phá dữ liệu
Ứng dụng của khai phá dữ liệu
Nhập môn khai phá dữ liệu
Bài giảng Nhập môn khai phá dữ liệu
Tài nguyên khai phá dữ liệu
Khai phá quy trình
Học máy suốt đời
Bài giảng Nhập môn Học máy và Khai phá dữ liệu
Nhập môn Học máy và Khai phá dữ liệu
Học máy và khai phá dữ liệu
Kiểu dữ liệu có cấu trúc
Kiểu dữ liệu phi cấu trúc
Data mining
Khám phá tri thức
Vai trò của khai phá dữ liệu
Lợi ích của khai phá dữ liệu
Tiến trình khai phá dữ liệu
Phương pháp khai phá dữ liệu
Từ dữ liệu đến quyết định
Khai phá dữ liệu trong kinh doanh
Bài giảng Khai phá dữ liệu trong kinh doanh
Kho dữ liệu
Quy trình khai phá dữ liệu trong kinh doanh
Kỹ thuật của khai phá dữ liệu
Thuật toán K Means
Hệ thống thông tin
Vấn đề khai phá dữ liệu
Tìm hiểu quá trình khai phá dữ liệu
Bài giảng Kho dữ liệu và khai phá dữ liệu
Kho dữ liệu và khai phá dữ liệu
Bài toán trong khai phá dữ liệu
Phương pháp cơ bản trong khai phá dữ liệu
Kỹ thuật tích hợp cơ sở dữ liệu
Mô hình dữ liệu mở rộng XML
Phát triển ứng dụng khai phá dữ liệu
Chuẩn dành cho khai phá dữ liệu
Kỹ thuật khai phá dữ liệu
Khai phá tri thức
Nhà kho dữ liệu
Khoa học máy tính
Nghiên cứu trong khai phá dữ liệu
Cơ sở dữ liệu
Kiểu mẫu được khai phá
Công nghệ khai phá dữ liệu
Machine learning
Hướng dữ liệuKhai phá dữ liệu phân tán
Khai phá dữ liệu không tĩnh
Khai phá luật kết hợp
Khai phá mẫu dãy
Khai phá kết hợp dựa theo ràng buộc
Thuật toán khai phá vô hướng luật kết hợp
Khai phá quan điểm
Khai phá phương tiện xã hội
Bài giảng Khai phá quan điểm
Nội dung Khai phá phương tiện xã hội
Mục tiêu Khai phá phương tiện xã hội
Bài toán khai phá quan điểm
Mô hình khai phá quan điểm
Nhu cầu về khai phá dữ liệu
Mô hình quá trình KDD lặp
Association rule
Xử lý cơ sở dữ liệu
Kiểu dữ liệu
Kiểu mẫu dùng để khai phá
Ứng dựng của kho dữ liệu
Ứng dựng của khai phá dữ liệu
TÀI LIỆU MỚI ĐĂNG
beginning Ubuntu Linux phần 1
34
212
1
28-04-2024
Trading Strategies Profit Making Techniques For Stock_8
23
175
0
28-04-2024
Magnetic Bearings Theory and Applications phần 2
14
172
0
28-04-2024
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
139
0
28-04-2024
báo cáo hóa học:" Endoscopic decompression for intraforaminal and extraforaminal nerve root compression"
7
107
0
28-04-2024
Data Structures and Algorithms - Chapter 9: Hashing
54
113
0
28-04-2024
Hệ thống làm lạnh và điều hòa không khí
21
126
0
28-04-2024
Lãi suất cơ bản, công cụ quan trọng của chính sách tiền tệ
5
114
0
28-04-2024
Báo cáo khoa học: " Principaux critères économiques de gestion des forêts : analyse critique et comparative"
29
89
0
28-04-2024
Bảng màu theo chữ cái – V
11
101
0
28-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5753
1381
Ebook Chào con ba mẹ đã sẵn sàng
112
3769
1231
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5326
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8293
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3502
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10897
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3688
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4055
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4132
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.