tailieunhanh - Tóm tắt Luận văn Thạc sĩ: Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Mục đích của Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Ngoài ra, một số kỹ thuật khử nhiễu dữ liệu như CMS cũng được tích hợp để tăng tính hiệu quả của hệ thống. Các kỹ thuật nhận dạng giọng nói trong luận văn tập trung vào loại dữ liệu âm thanh tiếng Việt. Mời các bạn cùng tham khảo! | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - Nguyễn Hữu Đam NGHIÊN CỨU VỀ NHẬN DẠNG ÂM THANH VÀ ỨNG DỤNG TRONG CHUYỂN ĐỔI ÂM THOẠI SANG VĂN BẢN TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2020 Luận văn được hoàn thành tại HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học Đình Hóa Phản biện 1 . Phản biện 2 . Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc . giờ . ngày . tháng . . năm . Có thể tìm hiểu luận văn tại - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 MỞ ĐẦU Nhận dạng tiếng nói của con người đã và đang thu hút sự quan tâm nghiên cứu của nhiều nhà khoa học khi mà công nghệ tự động hóa ngày càng có nhiều ứng dụng trong thực tiễn cuộc sống. Nghiên cứu nhận dạng tiếng nói Việt cũng được quan tâm nghiên cứu nhiều trong những năm gần đây tuy vậy cho đến nay các kết quả vẫn chưa thỏa mãn những bài toán đặt ra từ thực tế cuộc sống do tính chất phức tạp về ngữ âm của tiếng Việt. Hiện nay trên thế giới các công nghệ xử lý tiếng nói đã phát triển các hệ thống ứng dụng xử lý tiếng nói đã được sử dụng ở nhiều nơi độ chính xác của các hệ thống này ngày càng được cải thiện. Các ứng dụng của lĩnh vực xử lý tiếng nói rất phổ biến nhận dạng tiếng nói tổng hợp tiếng nói xác thực người nói qua giọng nói và các thành tựu của chúng được áp dụng vào nhiều lĩnh vực trong thực tế. Luận văn tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói từ đó xây dựng ứng dụng nhận dạng một số từ các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Ngoài ra một số kỹ thuật khử nhiễu dữ liệu như CMS cũng được tích hợp để tăng tính hiệu quả của hệ thống. Các kỹ thuật nhận dạng giọng nói trong luận văn tập trung vào loại dữ liệu âm thanh tiếng Việt. Cấu trúc của luận văn được trình bày trong ba chương gồm các nội dung chính như sau. Chương 1 nghiên cứu và trình bày tổng quan về các đặc trưng âm thanh cần thiết cho quá

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN