tailieunhanh - Tạp chí khoa học và công nghệ: Giải pháp giảm nhiễu trong miền Wavelet để nâng cao hiệu suất nhận dạng tiếng nói tự động

Bài báo này trình bày nghiên cứu về phương pháp giảm nhiễu (NR) mới trong miền Wavelet. Bằng cách tích hợp thuật toán NR vào trong các khối front-ends trong hệ thống nhận dạng tiếng nói tự động (ASR), hiệu suất nhận dạng đã được cải thiện rõ rệt trong môi trường có nhiễu. | TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG - SỐ 4 39 .2010 GIẢI PHÁP GIẢM NHIỄU TRONG MIỀN WAVELET ĐỂ NÂNG CAO HIỆU SUẤT NHẬN DẠNG TIẾNG NÓI Tự ĐỘNG A WAVELET-BASED NOISE REDUCTION APPROACH FOR ROBUST AUTOMATIC SPEECH RECOGNITION Phạm Văn Tuấn Hoàng Lê Uyên Thục Trường Đại học Bách khoa Đại học Đà Nang TÓM TẮT Công nghệ xử lý tiếng nói hiện đại là chuyên ngành liên quan tới nhiều lĩnh vực khác nhau là sự tích hợp của các kỹ thuật phân tích mã hóa tổng hợp nhận dạng và truyền tiếng nói trong môi trường thực. Tất cả những lĩnh vực trên đòi hỏi các thuật toán phải có sự ổn định cao đối với môi trường nhiễu âm học một vấn đề đầy thách thức cho thông tin thoại trong môi trường thực. Bài báo này trình bày nghiên cứu về phương pháp giảm nhiễu NR mới trong miền Wavelet. Bằng cách tích hợp thuật toán NR vào trong các khối front-ends trong hệ thống nhận dạng tiếng nói tự động ASR hiệu suất nhận dạng đã được cải thiện rõ rệt trong môi trường có nhiễu. ABSTRACT Modern speech processing technology is the interdisciplinary subject of dealing with a complex integrated system consisting of speech analysis coding synthesis recognition and transmission in realistic environments. All addressed topics make robustness to acoustic background noise highly challenging in speech communications. In this paper these challenges are studied by novel Wavelet-based noise reduction NR methods. By integrating the NR algorithms into front-end units of an Automatic Speech Recognition ASR engine we realize that recognition performance is significantly improved in noisy environments. 1. Giới thiệu Như là một phần của hệ thống thông tin người-máy có thể thấy mục tiêu của hệ ASR là chuyển nội dung ngôn ngữ của tiếng nói sang từ hay câu. Đề tài được quan tâm nhiều nhất trong lĩnh vực này trong những năm qua là nâng cao hiệu suất cho hệ thống ASR trong môi trường có nhiễu. Hệ thống ASR đang thử nghiệm hiện nay có tỷ lệ lỗi trung bình khoảng 5 đến 10 . Tuy nhiên khả năng nhận dạng tiếng nói bị giảm đột

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.