Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Khoa Học Tự Nhiên
Vật lý
Thuật toán HMU trong bài toán phân lớp dữ liệu mất cân bằng
tailieunhanh - Thuật toán HMU trong bài toán phân lớp dữ liệu mất cân bằng
Phân lớp dữ liệu mất cân bằng là một bài toán quan trọng trong thực tế. Nhiều phương pháp đã được nghiên cứu nhằm nâng cao hiệu suất của bài toán phân lớp này. Trong bài báo này chúng tôi đề xuất một thuật toán làm giảm số lượng phần tử (Undersampling) dựa trên giá trị lề giả thuyết (hypothesis margin) của các đối tượng thuộc lớp đa số để cải thiện hiệu suất phân lớp tập dữ liệu mất cân bằng | THUẬT TOÁN HMU TRONG BÀI TOÁN PHÂN LỚP DỮ LIỆU MẤT CÂN BẰNG NGUYỄN THỊ LAN ANH Trường Đại học Sư phạm, Đại học Huế ĐT: 0120 372 5257, Email: lananh257@ Tóm tắt: Phân lớp dữ liệu mất cân bằng là một bài toán quan trọng trong thực tế. Nhiều phương pháp đã được nghiên cứu nhằm nâng cao hiệu suất của bài toán phân lớp này. Trong bài báo này chúng tôi đề xuất một thuật toán làm giảm số lượng phần tử (Undersampling) dựa trên giá trị lề giả thuyết (hypothesis margin) của các đối tượng thuộc lớp đa số để cải thiện hiệu suất phân lớp tập dữ liệu mất cân bằng. Từ khóa: Dữ liệu mất cân bằng, phương pháp làm giảm số lượng phần tử, lề giả thuyết, Hypothesis margin 1. GIỚI THIỆU Trong những năm trở lại đây, vấn đề dữ liệu mất cân bằng là một trong những vấn đề quan trọng và đã nhận được nhiều sự quan tâm của các nhà nghiên cứu trên thế giới. Một tập dữ liệu được gọi là mất cân bằng khi số lượng phần tử thuộc về một nhãn lớp bé hơn nhiều so với các nhãn lớp khác. Trong phạm vi bài báo này chúng tôi chỉ đề cập đến bài toán phân loại hai lớp. Trong trường hợp đó, lớp có số lượng phần tử ít hơn được gọi là lớp thiểu số và lớp còn lại được gọi là lớp đa số. Bài toán phân lớp dữ liệu mất cân bằng là một bài toán phổ biến trong thực tế, nhằm phát hiện các đối tượng hiếm nhưng quan trọng, chẳng hạn như bài toán phát hiện gian lận, phát hiện vị trí tràn dầu trên biển dựa vào ảnh chụp vệ tinh, các bài toán trong lĩnh vực tin sinh học như bài toán dự đoán cấu trúc protein, dự đoán tương tác giữa proteinprotein, phân lớp microRNA , cũng như các bài toán chẩn đoán bệnh trong y học. Trong một số trường hợp, tỷ lệ giữa các phần tử thuộc lớp thiểu số so với các phần tử thuộc lớp đa số có thể lên đến 1:100 hoặc 1:100,000 [1]. Khi áp dụng các thuật toán phân lớp truyền thống lên các tập dữ liệu mất cân bằng, đa số các phần tử thuộc lớp đa số sẽ được phân lớp đúng và các phần tử thuộc lớp thiểu số cũng sẽ được gán nhãn lớp là nhãn lớp của lớp đa số. Điều này dẫn đến kết quả là accuracy .
Ðắc Trọng
125
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Thuật toán và tư duy thuật toán
46
177
4
Bài giảng Thuật toán: Chương 2 - GV. Nguyễn Thanh Cẩm
65
152
0
Bài giảng Thuật toán: Chương 3 - GV. Nguyễn Thanh Cẩm
67
128
1
Bài giảng Thiết kế và đánh giá thuật toán: Phân tích thuật toán - TS. Lê Nguyên Khôi
29
173
2
Bài giảng Thuật toán: Chương 1 - GV. Nguyễn Thanh Cẩm
77
129
0
Bài giảng Thuật toán: Chương 4 - GV. Nguyễn Thanh Cẩm
42
156
0
Bài giảng Tin học 10 - Bài 4: Bài toán và thuật toán (Bùi Thanh Hoàn)
41
137
1
Ebook Cẩm nang thuật toán: Tập 1 - Robert Sedgewick
404
239
29
Ebook Cẩm nang thuật toán: Tập 2 - Robert Sedgewick
309
204
14
Ebook Một số vấn đề về thuật toán - Nguyễn Hữu Điền
233
155
4
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461872
55
Giới thiệu :Lập trình mã nguồn mở
14
22690
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10902
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10072
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9536
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8295
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8244
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6697
253
Vật lý hạt cơ bản (1)
29
5779
85
TỪ KHÓA LIÊN QUAN
Vật lý
Thuật toán HMU
Dữ liệu mất cân bằng
Phương pháp làm giảm số lượng phần tử
Lề giả thuyết
Số lượng phần tử
Đề thi kết thúc học phần Cơ học lượng tử
Đề thi Cơ học lượng tử
Đề cuối học kỳ môn Cơ học lượng tử
Bài tập Cơ học lượng tử
Cơ học lượng tử
Giá trị định lượng ngữ nghĩa
Định lượng ngữ nghĩa
Đại số gia tử
ÁNh xạ định lượng ngữ nghĩa
Mở rộng đại số gia tử
Thủ tục đệ quy
Số lượng phần tử cho anten khe
Phần tử cho anten khe
Radar hàng hải
Anten dải rộng
Băng thông rộng
Điện tử cơ bản
Phần tử tích trữ năng lượng
Mạch RC nối tiếp
Kỹ thuật điện
Thiết bị điện
Bộ nhớ số
Luận văn Thạc sĩ Kỹ thuật Cơ điện tử
Kỹ thuật Cơ điện tử
Cơ điện tử
Ứng dụng thuật toán tiến hóa
Ước lượng tham số
Điều khiển con lắc ngược
Phần mềm Matlab simulink
Vi khuẩn học
Viêm tử cung
Số lượng kháng sinh
Tính mẫn cảm với kháng sinh
Vi khuẩn hiếu khí
Dịch tử cung bò sữa
Phần tử bắn
Lượng sửa kỹ thuật
Địa Pháo binh
Công tác Pháo binh
Kỹ thuật chuyên ngành trận địa
Tính lượng sửa kỹ thuật trận địa
Khai phá tập tối thiểu số lượng phần tử
Khai phá tập mục lợi ích cao
Khai phá dữ liệu
CSDL giao dịch
Quản lý kinh doanh tiếp thị
Hệ boson hai thành phần
Hằng số liên kết
Chuyển pha lượng tử
Phương pháp Cornwall–Jackiw–Tomboulis
Biểu diễn Lagrangian
xử lý tín hiệu
xử lý số
mạch lọc số
cài đặt phần cứng
quá trình lượng tử hoá
Thành phần loài san hô
Hàm lượng axit béo
Dạng phân tử
Phân lớp phospholipid loài san hô mềm bebryce sp
Lipid phân cực
Ceramide aminoethylphosphonate
hoá học 10
thành phần nguyên tử
cấu tạo nguyên tử
hạt nhân nguyên tử
khối lượng nguyên tử
nguyên tố hoá học
oxit quan trọng
Bài viết về xây dựng
Vết nứt thở
Phân tích động
Phần tử hữu hạn
Phương pháp tích phân số Newmark
Mô hình phần tử hữu hạn
Cầu dây văng
Tải trọng di động
Hệ số động lực
Mô hình hai khối lượng
Cầu Nhật Lệ 2
Bê tông chất lượng siêu cao
Cường độ chịu nén
Ứng xử nén
Mô hình Drucker Prager
Phương pháp phần tử hữu hạn
Phần mềm ANSYS APDL
Cơ sở viễn thông
Biến điệu góc
Biến điệu xung
Viễn thông số
Biến điệu mã xung
Lượng tử hóa
Nhiễu lượng tử
Luận án Tiến sĩ Vật lý
Luận án Tiến sĩ
Vật lý lý thuyết
Vật lý toán
Hệ bán dẫn thấp chiều
Siêu mạng hợp phần
Tóm tắt Luận văn Thạc sĩ
Luận văn Khoa học Thư viện
Phát triển thư viện điện tử
Vấn đề số hóa tài liệu
Phần mềm thư viện điện tử
Nâng cao chất lượng đào tạo
Chất lượng dịch vụ ngân hàng
Ngân hàng điện tử
Dịch vụ ngân hàng điện tử
Ngân hàng TMCP Đầu tư và Phát triển
Phát triển công nghệ số
Nhập môn xử lý ảnh số
Quá trình thu nhận ảnh
Lượng tử hoá ảnh
Kỹ thuật nâng cao chất lượng ảnh
Tiền xử lý ảnh
Lý thuyết điều khiển tự động
Hệ xung số
Cơ sở toán học của hệ gián đoạn
Chất lượng hệ xung
Tổng hợp hệ xung
Luận văn Thạc sĩ
Luận văn Thạc sĩ Khoa học
Vật lý nguyên tử
Máy gia tốc Elekta Precise
Tỉ số mô cực đại
Photon năng lượng cao
lấy mẫu tần số
TÀI LIỆU MỚI ĐĂNG
Công nghiệp gang thép Việt Nam : Một giai đoạn phát triển và chuyển đổi chính sách mới part 5
6
194
0
29-04-2024
MySQL Database Usage & Administration PHẦN 7
37
156
0
29-04-2024
MySQL Database Usage & Administration PHẦN 9
37
142
0
29-04-2024
báo cáo hóa học:" Endoscopic decompression for intraforaminal and extraforaminal nerve root compression"
7
107
0
29-04-2024
Báo cáo tốt nghiệp: Vận hành và bảo dưỡng trong MPLS
92
144
3
29-04-2024
Hệ thống làm lạnh và điều hòa không khí
21
126
0
29-04-2024
Gastroenterology an illustrated colour text - part 10
10
89
0
29-04-2024
Báo cáo nghiên cứu nông nghiệp " Introduction of the principles of GAP for citrus through implementation of citrus IPM using Farmer Field Schools "
12
92
0
29-04-2024
Thương hiệu sản phẩm làng nghề: Đã ít, lại thiếu tính cạnh tranh
5
117
0
29-04-2024
Điều bạn cần làm để giữ chặt tình yêu
5
107
0
29-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5765
1383
Ebook Chào con ba mẹ đã sẵn sàng
112
3770
1232
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5328
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8295
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3504
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10902
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3690
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4062
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4133
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.