tailieunhanh - Thiết kế robot trợ lý giảng dạy giao tiếp bằng giọng nói

Bài viết trình bày thiết kế và kiểm nghiệm thử một Robot trợ lý giảng dạy hoạt động như một trợ lý ảo nhưng có khả năng giao tiếp bằng giọng nói, không cần kết nối mạng như các trợ lý ảo hiện tại và sử dụng mã nguồn mở Pocketsphinx để nhận dạng giọng nói. | Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 61 12 2020 48 Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh THIẾT KẾ ROBOT TRỢ LÝ GIẢNG DẠY GIAO TIẾP BẰNG GIỌNG NÓI DESIGN OF VOICE COMMUNICATION-BASED TEACHING ASSISTANT ROBOT Đoàn Huỳnh Công Sơn Trương Ngọc Sơn Trường Đại học Sư phạm Kỹ thuật Việt Nam Ngày tòa soạn nhận bài 13 7 2020 ngày phản biện đánh giá 4 8 2020 ngày chấp nhận đăng 5 8 2020 TÓM TẮT Nghiên cứu này trình bày thiết kế và kiểm nghiệm thử một Robot trợ lý giảng dạy hoạt động như một trợ lý ảo nhưng có khả năng giao tiếp bằng giọng nói không cần kết nối mạng như các trợ lý ảo hiện tại và sử dụng mã nguồn mở Pocketsphinx để nhận dạng giọng nói. Nghiên cứu cũng sử dụng khối hiệu chỉnh đặt sau Pocketsphinx để nâng cao độ chính xác cho khối nhận dạng giọng nói. Phần lõi xử lý ngôn ngữ tự nhiên được sử dụng là mạng LSTM cho phép đưa ra câu trả lời phù hợp mà mạng đã được huấn luyện. Chương trình được cài đặt trên phần cứng nhúng Raspberry Pi Zero có mức tiêu tốn năng lượng thấp. Kết quả kiểm thử và đánh giá cho thấy nếu không sử dụng khối hiệu chỉnh robot có khả năng nhận dạng và trả lời câu hỏi với tỷ lệ chính xác là . Tỷ lệ nhận dạng được tăng lên đáng kể khi sử dụng khối hiệu chỉnh. Từ khóa Robot trợ lý giảng dạy Xử lý ngôn ngữ tự nhiên Mạng Long short-term memory Nhận dạng giọng nói. ABSTRACT This study presents a design and testing of a teaching assistant robot working as a virtual assistant that is capable of communicating using voice with humans. Robotcan work without connecting to the network the open source Pocketsphinx is employed for speech recognition. The Pocketsphinx module is followed by a correction module to improve the accuracy. The Long Short-Term Memory is utilized for the natural language processing unit that produces the answers. The model is deployed on the low-cost embedded board Raspberry Pi Zero. The evaluation was performed with and without using the proposed correction module. The accuracy is when using .