Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Kỹ thuật lập trình
Ứng dụng các kỹ thuật phân lớp dữ liệu cho bài toán khai thác dữ liệu tiếng dân tộc thiểu số phục vụ xử lý ngôn ngữ tự nhiên
tailieunhanh - Ứng dụng các kỹ thuật phân lớp dữ liệu cho bài toán khai thác dữ liệu tiếng dân tộc thiểu số phục vụ xử lý ngôn ngữ tự nhiên
Nghiên cứu đã trình bày những nét chính về mặt ý tưởng, giải thuật; ưu, nhược điểm của một số giải thuật phân lớp dữ liệu được sử dụng phổ biến trong xử lý tiếng Việt như SVM, cây quyết định, giải thuật Bayes. | Đinh Thị Mỹ Hạnh 237 Ứng dụng các kỹ thuật phân lớp dữ liệu cho bài toán khai thác dữ liệu tiếng dân tộc thiểu số phục vụ xử lý ngôn ngữ tự nhiên Đinh Thị Mỹ Hạnh Đại học Đà Nẵng 41 Lê Duẩn Hải Châu Đà Nẵng dtmhanh@ Tóm tắt. Nghiên cứu này phân tích vai trò thực trạng của kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên XLNNTN xử lý tiếng Việt XLTV nói chung và tiếng dân tộc thiểu số DTTS nói riêng. Trên cơ sở mô hình tổng quan của bài toán XLNNTN tác giả tập trung nghiên cứu bài toán phân lớp dữ liệu. Nghiên cứu đã trình bày những nét chính về mặt ý tưởng giải thuật ưu nhược điểm của một số giải thuật phân lớp dữ liệu được sử dụng phổ biến trong xử lý tiếng Việt như SVM cây quyết định giải thuật Bayes Tuy nhiên đối với việc xử lý tiếng DTTS thì còn hạn chế do nhiều nguyên nhân khác nhau. Tác giả lựa chọn giải thuật SVM để phân lớp văn bản tiếng DTTS trên tập dữ liệu thử nghiệm từ đó đánh giá hiệu quả thực hiện và đưa ra những đề xuất liên quan đến bài toán phân lớp dữ liệu trên văn bản tiếng DTTS. Từ khóa tiếng dân tộc thiểu số phân lớp văn bản SVM kho ngữ liệu xử lý tiếng Việt. 1 Đặt vấn đề Trong bối cảnh Công nghệ Thông tin CNTT ngày càng phát triển mạnh mẽ và có ảnh hưởng trong hầu hết các mặt của đời sống xã hội việc ứng dụng CNTT vào các vấn đề của XLNNTN nói chung XLTV nói riêng trong đó có tiếng DTTS đã và đang nhận được sự quan tâm từ các chuyên gia cũng như xã hội. Tuy nhiên do nhiều nguyên nhân khác nhau mà việc xử lý tiếng DTTS nói chung và xử lý văn bản tiếng DTTS nói riêng còn rất nhiều hạn chế chưa có nhiều giải thuật được triển khai trên các ngôn ngữ này. Đây cũng là một trong những nguyên nhân khiến cho lĩnh vực xử lý khai thác tiếng DTTS chưa đạt được nhiều kết quả như kỳ vọng. Hiện nay dù đã có một số kho ngữ liệu chung của một vài tiếng DTTS phổ biến trong đó chủ yếu là từ điển tiếng Việt - tiếng DTTS nhưng chưa có nhiều các từ điển dành cho lĩnh vực hẹp. Điều này gây khó khăn cho việc nghiên cứu và phát triển các hệ thống dịch tự động .
Xuân Phượng
65
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 7 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
7
177
2
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Bài 1 - Lê Thanh Hương
13
147
2
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 6 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
6
227
2
Bài giảng Xử lý ngôn ngữ tự nhiên: Dịch máy - Lê Thanh Hương
12
126
0
Bài giảng Xử lý ngôn ngữ tự nhiên: Dịch máy - Lê Thanh Hương
12
120
1
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Bài 4(tt) - Lê Thanh Hương
6
130
1
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân loại tin tự động cho báo điện tử - Lê Thanh Hương
4
107
0
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân loại tin tự động cho báo điện tử - Lê Thanh Hương
6
92
1
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích ngữ nghĩa - Lê Thanh Hương
5
120
0
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích ngữ nghĩa - Lê Thanh Hương
5
100
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461870
55
Giới thiệu :Lập trình mã nguồn mở
14
22657
59
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10896
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10069
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9524
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8287
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8242
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7865
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6690
253
Vật lý hạt cơ bản (1)
29
5774
85
TỪ KHÓA LIÊN QUAN
Kỹ thuật lập trình
Xử lý ngôn ngữ tự nhiên
Bài toán khai thác dữ liệu
Khai thác dữ liệu tiếng dân tộc
Kỹ thuật phân lớp dữ liệu
Bài toán phân lớp văn bản
Bài giảng Xử lý ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên
Kỹ thuật lập trình
Xử lý nhập nhằng ngữ nghĩa
Xử lý ngữ nghĩa
Xử lý ngôn ngữ
Natural Language Processing
Ngôn ngữ lập trình
Nhập nhằng cấu trúc
Tri thức về ngôn ngữ
Mô hình ngôn ngữ
Mô hình n gram
Dịch máy
Phương pháp dịch máy
Hiểu ngôn ngữ
Phân tích ngữ nghĩa
Phân loại tin tự động
Biểu diễn vị từ
Thuộc tính về sự kiện
Thuộc tính về sự kiện
Mô hình ngôn ngữ Google Book N grams
Mô hình ngôn ngữ KenLM
Phương pháp làm mịn
Tách từ tiếng Việt
Gán nhãn từ loại
Phân tích cú pháp
Nghĩa từ vựng
Phân giải nhập nhằng từ
Phân loại văn bản
Lexical chain
Phản hồi thông tin
Bài toán PTCP
Cấu trúc ngữ pháp
Phân tích cú pháp xác suất
CKY kết hợp xác suất
Văn phạm phi ngữ cảnh xác suất
Hình thái học
TÀI LIỆU MỚI ĐĂNG
Trading Strategies Profit Making Techniques For Stock_8
23
175
0
28-04-2024
Anh văn bằng C-124
8
175
0
28-04-2024
Lịch sử Đội TNTP Hồ Chí Minh - CHƯƠNG III VÂNG LỜI BÁC DẠY, LÀM NGHÌN VIỆC TỐT, CHỐNG MỸ, CỨU NƯỚC, THIẾU NIÊN SĂN SÀNG
45
137
0
28-04-2024
Diseases of the Liver and Biliary System - part 1
33
125
0
28-04-2024
Data Structures and Algorithms - Chapter 9: Hashing
54
113
0
28-04-2024
Data Structures and Algorithms - Chapter 8: Heaps
41
120
0
28-04-2024
New Trends and Developments in Automotive Industry Part 7
35
96
0
28-04-2024
Hệ thống làm lạnh và điều hòa không khí
21
126
0
28-04-2024
MẪU GIẤY PHÉP VẬN TẢI LOẠI C
2
109
0
28-04-2024
Thương hiệu sản phẩm làng nghề: Đã ít, lại thiếu tính cạnh tranh
5
117
0
28-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7865
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5747
1375
Ebook Chào con ba mẹ đã sẵn sàng
112
3768
1231
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5325
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8287
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3501
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10896
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3687
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4055
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4130
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.