Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
tailieunhanh - Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
Bài viết nghiên cứu cách thức tăng (giảm) phần tử của lớp mất cân bằng dựa trên một mức độ “an toàn”. Từ đó, đề xuất một phương pháp mới vừa tăng số lượng các phần tử an toàn ở lớp thiểu số, vừa giảm các phần tử an toàn ở mức đa số. | PHƯƠNG PHÁP MỚI DỰA TRÊN VÙNG AN TOÀN NÂNG CAO HIỆU QUẢ PHÂN LỚP DỮ LIỆU MẤT CÂN BẰNG BÙI DƯƠNG HƯNG 1 NGUYỄN THỊ HỒNG , ĐẶNG XUÂN THỌ 2 1 Khoa Tin học, Trường Đại học Công đoàn 2 Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Email: thodx@ 2 Tóm tắt: Nghiên cứu bài toán phân lớp trong thực tế như chuẩn đoán y học, phát hiện sự cố tràn dầu, phát hiện gian lận kinh tế tài chính ngày càng được nhiều nhà khoa học quan tâm vì tầm ảnh hưởng lớn của những lĩnh vực này tới con người. Tuy nhiên, nhiều nghiên cứu đã chỉ ra hiệu quả phân lớp của các bài toán này chưa cao do có sự chênh lệch về số lượng phần tử giữa các lớp dữ liệu. Một yêu cầu đặt ra là cần có những hướng tiếp cận mới đối với trường hợp dữ liệu mất cân bằng để tăng tính hiệu quả phân lớp chính xác của thuật toán phân lớp. Bài báo của chúng tôi đề xuất ba thuật toán mới dựa trên mức an toàn nhằm nâng cao hiệu quả phân lớp dữ liệu. Hai thuật toán, Random Safe Oversampling (RSO) và Random Safe Undersampling (RSU) cải tiến trực tiếp từ Random Oversamling và Random Undersampling. Thuật toán thứ ba, Random Safe Over-Undersampling (RSOU) là sự kết hợp của RSO và RSU nhằm đồng thời vừa tăng thêm các phần tử ở lớp thiểu số vừa loại bỏ các phần tử ở lớp đa số ở các vùng an toàn. Từ khóa: Dữ liệu mất cân bằng; Phân lớp dữ liệu; Safe level; Random Oversampling; Random Undersampling; Random Safe Oversampling; Random Safe Undersampling 1. MỞ ĐẦU Ngày nay, một số lượng lớn của dữ liệu được thu thập và lưu trữ trong các cơ sở dữ liệu ở khắp mọi nơi trên thế giới. Không khó để tìm được các cơ sở dữ liệu lên tới Terabytes trong các doanh nghiệp và các trung tâm nghiên cứu [1], [2]. Rất nhiều thông tin và kiến thức vô giá tiềm ẩn trong các cơ sở dữ liệu như vậy, mà chưa có phương pháp tự động hiệu quả để phân tách thông tin [3]. Trong suốt nhiều năm, nhiều thuật toán được tạo ra để phân tách những gì được gọi là “quặng vàng” của tri thức từ các tập dữ liệu lớn. Đặc biệt, trong đó vấn đề phân lớp mất cân
Thanh Hảo
116
10
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Random Border Undersampling: Thuật toán mới giảm phần tử ngẫu nhiên trên đường biên trong dữ liệu mất cân bằng
8
65
0
Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớp
7
52
2
Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng
65
45
5
Tài liệu hướng dẫn thực hành môn Cấu trúc dữ liệu và giải thuật - Bài 5: Cây cân bằng AVL
7
106
0
Bài giảng Cấu trúc dữ liệu và giải thuật: Cây AVL - ĐHKHTN
13
139
1
Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
10
91
0
Phương pháp mới dựa trên đường biên và vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
9
78
0
Ứng dụng kỹ thuật học máy trên dữ liệu mất cân bằng hỗ trợ dự đoán sớm khả năng thôi học của học sinh trung học phổ thông
10
62
1
Tóm tắt Luận văn Thạc sĩ: Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng
26
22
1
Thuật toán HMU trong bài toán phân lớp dữ liệu mất cân bằng
8
107
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461871
55
Giới thiệu :Lập trình mã nguồn mở
14
22685
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10072
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9535
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8294
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8244
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6696
253
Vật lý hạt cơ bản (1)
29
5777
85
TỪ KHÓA LIÊN QUAN
Cơ sở dữ liệu
Dữ liệu mất cân bằng
Phân lớp dữ liệu
Random Undersampling
Random Safe Oversampling
Random Safe Undersampling
Random Border Undersampling
Thuật toán mới giảm phần tử ngẫu nhiên
Đường biên dữ liệu mất cân bằng giới
Mất cân bằng dữ liệu
Tăng phần tử
Khai thác luật phân lớp
Cơ sở dữ liệu mất cân bằng về lớp
Cơ sở dữ liệu
Thuộc tính lớp
Luận văn Thạc sĩ Kỹ thuật
Khoa học máy tính
Hiệu năng phân lớp dữ liệu
Dữ liệu phân bố không cân bằng
Cấu trúc dữ liệu
Bài giảng Cấu trúc dữ liệu
Cây cân bằng AVL
Cây nhị phân tìm kiếm
Xử lý mất cân bằng bằng
Các node trên cây cân bằng
Bài giảng Cấu trúc dữ liệu và giải thuật
Cách xây dựng cây cân bằng
Các trường hợp mất cân bằng cây AVL
Xử lý mất cân bằng cây AVL
Thao tác trên cây AVL
Mức độ an toàn
Sinh thêm phần tử ngẫu nhiên
Giảm bớt phần tử ngẫu nhiên
Khai phá dữ liệu
Cây quyết định
Mô hình học máy
Giải thuật AdaBoost
Tóm tắt Luận văn Thạc sĩ
Nghiên cứu phân lớp
Thuật toán HMU
Phương pháp làm giảm số lượng phần tử
Lề giả thuyết
Số lượng phần tử
Cải thiện hiệu suất phân lớp
Hypothesis margin
Thuật toán HBU
Phân lớp microRNA
Border line
Random Sampling
Over Sampling
Thuật toán mới Random Border Over Sampling
Tạp chí Nghiên cứu khoa học
Phương pháp DEC SVM phân lớp
Mẫu nhân tạo lớp thiểu số
Sinh ngẫu nhiên phần tử lớp thiểu số
Bộ lọc tái lấy mẫu
Loại bỏ nhiễu
Thuật toán SMOTE
Xử lý dữ liệu mất cân bằng
Chấm điểm tín dụng
Quản trị rủi ro tín dụng
Ngân hàng thương mại Việt Nam
Kỹ thuật lấy mẫu dưới
Cấu trúc dữ liệu và giải thuật
Cây nhị phân tìm kiếm cân bằng
Mất cân bằng cây nhị phân
Dữ liệu có số chiều cao
Bình phương tối thiểu từng phần
Sinh thêm phần tử nhân tạo
Bộ dữ liệu chuẩn từ nguồn UCI
Ung thư da
Ung thư hắc tố
Phương pháp gán trọng số động
Hàm mất mát Large Margin Cosine Loss
Tập dữ liệu HAM10000
Phát hiện gian lận tài chính
Gian lận trong tài chính
Bài toán phát hiện gian lận tài chính
Kỹ thuật khai phá dữ liệu
Pin mặt trời
Phương pháp DEC SVM
Phân lớp dữ liệu mất cân bằng
Thiết kế bộ điều khiển thích nghi trượt
Robot công nghiệp
Phân loại văn bản
Chất lượng đào tạo đại học
Máy học vector hỗ trợ
Cây quyết định
TÀI LIỆU MỚI ĐĂNG
Anh văn bằng C-124
8
176
0
29-04-2024
Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "
7
175
0
29-04-2024
Posted prices versus bargaining in markets_7
23
157
0
29-04-2024
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
139
0
29-04-2024
The profit magic of stock Timing The Markets_5
22
121
0
29-04-2024
Đề tài: Tìm hiểu một số yêu cầu đặt ra với một phòng thu âm, để đảm bảo chất lượng âm thanh trong sản phẩm đa phương tiện
8
161
1
29-04-2024
HƯỚNG DẪN SỬ DỤNG PHẦN MỀM CAITA part 9
18
130
0
29-04-2024
Anh văn TOEFL Vocabulary-008
8
86
0
29-04-2024
báo cáo hóa học:" Perceptions of rewards among volunteer caregivers of people living with AIDS working in faith-based organizations in South Africa: a qualitative study"
10
83
0
29-04-2024
Báo cáo y học: "Regulation and localization of endogenous human tristetraprolin"
12
84
0
29-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5760
1382
Ebook Chào con ba mẹ đã sẵn sàng
112
3770
1232
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5328
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8294
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3504
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3689
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4060
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4133
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.