tailieunhanh - Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị

Nghiên cứu trình bày khái quát mô hình Markov ẩn và thiết kế tập lệnh giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử bằng giọng nói. Thu âm bộ dữ liệu của nhiều người nói, sau đó tiến hành thực nghiệm huấn luyện mô hình và nhận dạng tiếng nói trên bộ dữ liệu nhằm đánh giá sự phụ thuộc của hệ thống vào các tham số khác nhau của mô hình. | 212 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị Lê Vũ Công Hòa1 Hoàng Thị Minh Khanh1 Lê Quang Tam1 Ninh Khánh Duy1 1 Trường Đại học Bách Khoa Đại học Đà Nẵng conghoacntt13t1@ minhkhanhhoang2105@ lesan1995@ nkduy@ Tóm tắt. Nhận dạng tiếng nói dùng mô hình Markov ẩn HMM đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử. Để tạo ra hệ thống dễ sử dụng cho người khiếm thị chúng tôi đã thiết kế tập lệnh điều khiển gồm 4 nhóm với 46 lệnh là các từ đơn. Để huấn luyện và kiểm thử hệ thống nhận dạng tiếng nói chúng tôi đã thu âm dữ liệu tiếng nói của 42 người với các chất giọng khác nhau trong điều kiện môi trường thực tế và tiến hành các thử nghiệm nhận dạng. Thực nghiệm cho thấy việc thiết lập các tham số của HMM và kích thước dữ liệu huấn luyện ảnh hưởng không nhỏ đến kết quả nhận dạng. Ở chế độ offline hệ thống nhận dạng tiếng nói rời rạc của chúng tôi đạt độ chính xác cao nhất lần lượt là 99 42 và 91 14 trong các thử nghiệm nhận dạng phụ thuộc người nói và độc lập người nói. Ở chế độ online hệ thống đạt độ chính xác trên 80 khi nhận dạng độc lập người nói trong điều kiện phòng tương đối yên tĩnh và phần cứng máy tính có tài nguyên hạn chế. Từ khóa Điều khiển bằng giọng nói Nhận dạng tiếng nói rời rạc Mô hình Markov ẩn Đọc báo cho người khiếm thị. 1 Giới thiệu Nhận dạng tiếng nói ra đời đã góp phần thay đổi cách người dùng điều khiển máy tính cũng như các thiết bị điện tử khác. Không cần phải thao tác trên màn hình hay bàn phím như thông thường hệ thống nhận dạng tiếng nói giúp chuyển đổi tín hiệu tiếng nói từ người dùng thành câu lệnh tương ứng. Dựa vào khả năng này việc áp dụng nhận dạng tiếng nói cho .

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.