tailieunhanh - Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng
Trong nghiên cứu này chúng tôi sử dụng tiếp cận học máy nhằm xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang web hỏi đáp cộng đồng. Các cặp câu hỏi - câu trả lời này sẽ được sử dụng làm nguồn dữ liệu cho các hệ thống hỏi đáp tự động. | Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng Nguyễn Văn Tú, Lê Anh Cường, Nguyễn Hà Nam XÂY DỰNG CÁC CẶP CÂU HỎI - CÂU TRẢ LỜI CHẤT LƯỢNG CAO TỪ CÁC TRANG WEB HỎI ĐÁP CỘNG ĐỒNG Nguyễn Văn Tú1, Lê Anh Cường2, Nguyễn Hà Nam3 1 Trường Đại học Tây Bắc 2 Trường Đại học Tôn Đức Thắng 3 Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội Tóm tắt: Các trang web hỏi đáp cộng đồng có chứa các tài liệu liên quan. Các đánh giá nổi tiếng nhất một lượng lớn thông tin hỏi - đáp có giá trị sinh về nhiệm vụ hỏi - đáp factoid là hội nghị truy hồi ra bởi những người sử dụng. Trong các trang web văn bản (Text REtrieval Conference-TREC). Các hỏi đáp cộng đồng, người dùng có thể gửi các câu câu hỏi và câu trả lời được phát hành bởi TREC hỏi, trả lời các câu hỏi của người khác, và cung cấp đã trở thành nguồn dữ liệu quan trọng cho các nhà thông tin phản hồi cho những câu hỏi/câu trả lời. nghiên cứu trong việc nghiên cứu xây dựng các hệ Trong nghiên cứu này chúng tôi sử dụng tiếp cận thống hỏi đáp tự động [1]. Tuy nhiên, khi phải đối học máy nhằm xây dựng các cặp câu hỏi - câu trả mặt với các câu hỏi non-factoid như các câu hỏi về lời chất lượng cao từ các trang web hỏi đáp cộng lý do tại sao, như thế nào, hoặc những gì về hầu đồng. Các cặp câu hỏi - câu trả lời này sẽ được sử như không có hệ thống hỏi đáp tự động nào làm dụng làm nguồn dữ liệu cho các hệ thống hỏi đáp việc tốt. tự động. Chúng tôi thực hiện trích rút những đặc trưng quan trọng từ mỗi luồng hỏi đáp cũng như Các cặp câu hỏi - câu trả lời do người dùng tạo ra thông tin của người gửi câu trả lời và xây dựng mô chắc chắn sẽ rất quan trọng để giải quyết vấn đề hình phân loại để xác định được các cặp câu hỏi trả lời các câu hỏi non-factoid. Rõ ràng, những cặp - câu trả lời có ý nghĩa. Các kết quả thực nghiệm câu hỏi - câu trả lời tự nhiên thường được tạo ra trên bộ dữ liệu cung cấp bởi SemEval 2015 cho trong quá trình giao tiếp của
đang nạp các trang xem trước