Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Khoa Học Xã Hội
Báo chí - Truyền thông
Hướng tiếp cận không toàn văn cho bài toán phân lớp tự động bản tin tiếng Việt
Đang chuẩn bị liên kết để tải về tài liệu:
Hướng tiếp cận không toàn văn cho bài toán phân lớp tự động bản tin tiếng Việt
Ngọc Ánh
119
6
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài viết này trình bày một hướng tiếp cận phân lớp các bản tin tiếng Việt không dựa trên nội dung toàn văn của bản tin đó. Qua đó đề xuất sử dụng một trong hai thông tin: 1-tóm tắt; 2-từ khóa đại diện, trong đó tóm tắt và từ khóa đại diện được tạo tự động từ nội dung của văn bản, để phân lớp văn bản. | Hội thảo quốc gia lần thứ XX: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông – Quy Nhơn, 23-24/11/2017 Hướng tiếp cận không toàn văn cho bài toán phân lớp tự động bản tin tiếng Việt Trương Quốc Định Trần Thị Thúy Trần Thị Cẩm Tú Huỳnh Kim Quýt Khoa CNTT&TT Khoa Kỹ thuật Công nghệ Khoa Kỹ thuật Công nghệ Khoa CNTT Trường Đại học Cần Thơ Trường Đại học Cửu Long Trường Đại học Cửu Long Trường Đại học Tiền Giang Cần Thơ, Việt Nam Vĩnh Long, Việt Nam Vĩnh Long, Việt Nam Tiền Giang, Việt Nam tqdinh@cit.ctu.edu.vn tranthithuy@mku.edu.vn tranthicamtu@mku.edu.vn huynkimquyt@tgu.edu.vn Tóm tắt—Trong bài báo này chúng tôi trình bày một hướng tiếp cận phân lớp các bản tin tiếng Việt mà không dựa trên nội dung toàn văn của bản tin đó. Chúng tôi đề xuất sử dụng một trong hai thông tin: 1tóm tắt; 2- từ khóa đại diện, trong đó tóm tắt và từ khóa đại diện được tạo tự động từ nội dung của văn bản, để phân lớp văn bản. Chúng tôi sử dụng tổng cộng 2000 bản tin được tải về từ các trang báo điện tử như vnexpress.net, vietnamnet.vn để kiểm thử giải pháp đề xuất. Kết quả thực nghiệm cho thấy hướng tiếp cận không toàn văn cho bài toán phân lớp văn bản là khả thi và có thể cải tiến để ứng dụng thực tế. Từ khóa: phân loại văn bản; tóm tắt tự động; mô hình chủ đề; cây quyết định. I. GIỚI THIỆU Bài toán phân loại văn bản (text classification) là bài toán cơ bản của lĩnh vực khai phá văn bản (text mining). Phân loại văn bản chính là gán nhãn (lớp/chủ đề) một cách tự động dựa vào nội dung của văn bản. Phân loại văn bản được ứng dụng trong nhiều lĩnh vực như tìm kiếm thông tin, lọc văn bản, tổng hợp tin tức tự động, thư viện điện tử. Hình 1. Phân lớp văn bản Bài toán phân loại văn bản có thể được định nghĩa như sau. Từ một tập các văn bản D = {d1, d2, , dn}, được gọi là tập huấn luyện, trong đó các tài liệu di được gán nhãn chủ đề ci với ci thuộc tập các chủ đề C = {c1, c2, , cn} để xây dựng bộ phân lớp. Nhiệm vụ của bộ phân lớp là gán đúng nhãn chủ đề ck cho một tài
TÀI LIỆU LIÊN QUAN
Tiếp cận Heuristic giải bài toán Clique lớn nhất trên đơn đồ thị vô hướng không có trọng số
Bài giảng Tiếp cận theo trình tự trẻ bệnh nặng
Tổ chức không gian lãnh thổ kinh tế - xã hội Việt Nam: Nhận thức và hành động hướng tới phát triển bền vững
Nghiên cứu ảnh hưởng của nguồn vốn con người đến tăng trưởng kinh tế các tỉnh, thành Việt Nam: Tiếp cận bằng mô hình kinh tế lượng không gian
Thông tư số 147/2002/TT-BQP về chế độ đối với quân nhân, cán bộ đi chiến trường B, C, K trong thời kỳ chống Mỹ cứu nước, không có thân nhân phải trực tiếp nuôi dưỡng và quân nhân, cán bộ được Đảng cử ở lại Miền Nam hoạt động sau Hiệp định Giơnevơ năm 1954 do Bộ Quốc phòng ban hành, để hướng dẫn bổ sung TT 2546/1999/TT-BQP ngày 4/9/1999 hướng dẫn thi hành NĐ 23/1999/NĐ-CP về chế đ
Dung hợp gen EML4-ALK: Hướng tiếp cận mới trong điều trị nhắm trúng đích với ung thư phổi không tế bào nhỏ
Tại sao phải nhận những căng thẳng không cần thiết?
Ảnh hưởng của cảnh quan môi trường đến tâm lý và thói quen đọc sách: hướng tiếp cận thúc đẩy phát triển văn hóa đọc cho sinh viên Học viện Ngân Hàng
Thủ tục Thực hiện bổ sung chế độ trợ cấp 1 lần đối với người có thời gian công tác là cán bộ xã (phường) hoạt động ở miền Nam, trực tiếp tham gia kháng chiến chống Mỹ cứu nước từ tháng 7/1954 đến 30/4/1975 đã về gia đình (hiện không đang công tác)
Thực hiện bổ sung chế độ trợ cấp 1 lần đối với thân nhân người có thời gian công tác là cán bộ xã (phường) hoạt động ở miền Nam, trực tiếp tham gia kháng chiến chống Mỹ cứu nước từ tháng 7/1954 đến 30/4/1975 đã về gia đình (hiện không đang công tác)
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.