Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng
Đang chuẩn bị liên kết để tải về tài liệu:
Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng
Mỹ Trâm
15
5
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài viết "Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng" trình bày một phương pháp xây dựng tập dữ liệu tiếng Việt cho bài toán tìm kiếm câu hỏi tương đồng.Tác giả xây dựng được 7911 cặp câu hỏi được gán nhãn. Đồng thời, tập dữ liệu này cũng được thử nghiệm đánh giá trên một số mô hình học máy cơ bản. | TẬP DỮ LIỆU TIẾNG VIỆT CHO BÀI TOÁN TÌM CÂU HỎI TƯƠNG ĐỒNG Hà Thị Thanh1 Nguyễn Thị Oanh1 1 Trường Đại học Công nghệ Thông tin và Truyền thông Đại học Thái Nguyên Email htthanh@ictu.edu.vn Ngày nhận bài 05 8 2022 Ngày nhận bài sửa sau phản biện 10 11 2022 Ngày chấp nhận đăng 14 11 2022 TÓM TẮT Bài toán tìm kiếm câu hỏi tương đồng là bài toán phổ biến và quan trọng trong xử lý ngôn ngữ tự nhiên. Tuy nhiên có rất ít nghiên cứu về bài toán này trên tập dữ liệu tiếng Việt. Nguyên nhân của hiện tượng trên là do chưa có tập dữ liệu tiếng Việt chuẩn cho bài toán tìm kiếm câu hỏi. Trong bài báo này chúng tôi trình bày một phương pháp xây dựng tập dữ liệu tiếng Việt cho bài toán tìm kiếm câu hỏi tương đồng. Chúng tôi xây dựng được 7911 cặp câu hỏi được gán nhãn. Đồng thời tập dữ liệu này cũng được thử nghiệm đánh giá trên một số mô hình học máy cơ bản. Từ khóa elastic search máy tìm kiếm tập dữ liệu. VIETNAMESE DATASET FOR THE FINDING SIMILAR QUESTION PROBLEM ABSTRACT Finding similar questions is a common problem in natural language processing. However little research has been conducted on the question retrieval problem for Vietnamese. The reason for this is that there is no standard Vietnamese dataset for the finding question problem. In this paper we created a method to build a Vietnamese dataset for the problem of finding similar questions. As a result we built 7911 pairs of labeled questions. This dataset was evaluated on some basic machine learning models. Keywords dataset elastic search search engine. 1. GIỚI THIỆU câu hỏi mới ᵍ và các câu hỏi ᵍ1 ᵍ2 . . . ᵍᵊ trong kho dữ liệu của hệ thống hỏi đáp. Đầu Bài toán tìm câu hỏi tương đồng là bài ra trả về danh sách xếp hạng các câu hỏi sao toán trung gian hỗ trợ cho các hệ thống hỏi cho những câu tương đồng nhất với câu hỏi đáp tự động tìm kiếm câu trả lời cho câu hỏi truy vấn ở trên và câu không tương đồng nhất mới. Bài toán tìm kiếm câu hỏi tương đồng ở cuối của danh sách. Bài toán tìm câu hỏi tuy không phải là lĩnh vực
TÀI LIỆU LIÊN QUAN
Bài tập tiếng Anh du lịch (English for Tourism)
English for Tourism 1 (Tiếng Anh dành cho Du lịch) - ThS. Đỗ Thị Hoa Quyên (ĐH Tôn Đức Thắng)
Test de connaissance du français
Chiến lược nghe mở rộng trong giảng dạy tiếng Anh chuyên ngành: Nghiên cứu thực nghiệm đối với môn “Tiếng Anh Du lịch 2” tại trường Đại học Đà Lạt
"Dinh thự thuốc phiện" độc đáo nhất Việt Nam
Báo cáo bài tập lớn Cơ sở dữ liệu: Xây dựng phần mềm quản lý trung tâm Tiếng Anh
Học từ vựng tiếng anh với Word List (Có nghĩa tiếng việt)
Khảo sát đánh giá dữ liệu thuật ngữ tiếng Anh chuyên ngành tạo hình đa phương tiện phục vụ cho giảng dạy và học tập
Nghiên cứu các phương thức dịch ẩn dụ tu từ tiếng Anh sang tiếng việt dựa trên cứ liệu diễn văn của Martin Luther King
English for tourism
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.