tailieunhanh - Phương pháp nâng cao chất lượng tiếng nói bằng cách triệt nhiễu thành phần xấp xỉ và thành phần chi tiết trên miền wavelet

Bài báo này trình bày phương pháp triệt nhiễu nâng cao chất lượng tiếng nói bằng biến đổi Wavelet cho tín hiệu tiếng nói thành hai thành phần hệ số chi tiết và hệ số xấp xỉ, sau đó áp dụng kỹ thuật trừ phổ và kỹ thuật ước lượng bình phương tối thiểu MMSE (minimum mean square error) của Ephraim/Malah cho các hệ số đó. | Đỗ Huy Khôi và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 15 - 19 PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI BẰNG CÁCH TRIỆT NHIỄU THÀNH PHẦN XẤP XỈ VÀ THÀNH PHẦN CHI TIẾT TRÊN MIỀN WAVELET Đỗ Huy Khôi, Nguyễn Thành Trung, Trịnh Văn Hà* Trường Đại học Công nghệ Thông tin & Truyền thông – ĐH Thái Nguyên TÓM TẮT Kỹ thuật triệt nhiễu và nâng cao chất lượng tiếng nói dùng phép biến đổi Wavelet đã được nghiên cứu nhiều trên thế giới. Hầu hết các nghiên cứu tập trung vào cách ước lượng và đặt ngưỡng toàn cục cho toàn bộ tín hiệu. Bài báo này trình bày phương pháp triệt nhiễu nâng cao chất lượng tiếng nói bằng biến đổi Wavelet cho tín hiệu tiếng nói thành hai thành phần hệ số chi tiết và hệ số xấp xỉ, sau đó áp dụng kỹ thuật trừ phổ và kỹ thuật ước lượng bình phương tối thiểu MMSE (minimum mean square error) của Ephraim/Malah cho các hệ số đó. Các kết quả mô phỏng cho thấy tiếng nói có nhiễu được triệt nhiễu bằng phương pháp đề xuất có SNR cao hơn các phương pháp trừ phổ, phương pháp MMSE và phương pháp Wavelet của Dohono. Từ khóa: wavelet, triệt nhiễu, phổ trừ, MMSE, PSNR. TỔNG QUAN VỀ TRIỆT NHIỄU TÍN HIỆU TIẾNG NÓI* Nhiễu ảnh hưởng nhiều đến hiệu quả xử lý tín hiệu. Vì vậy, triệt nhiễu và nâng cao chất lượng tín hiệu là bước quan trọng trong các hệ thống xử lý tín hiệu thời gian thực [3]. Mô hình chung của tín hiệu có nhiễu là: xk = sk + nk , k = 0,, K − 1 (1) Trong đó sk là tín hiệu tiếng nói sạch, nk là nguồn nhiễu độc lập với phương sai σ k (σ n2 = 1) (giả sử nk là nhiễu trắng). Gọi sˆ là giá trị ước lượng của tín hiệu tiếng nói sạch. Mục đích của các phương pháp triệt nhiễu tín hiệu tiếng nói là tối thiểu sai số bình phương trung bình E (| sˆ, s |2 ) t −b ) là hàm wavelet mẹ, ψ (t ) a là hàm wavelet phức của ψ (t ) , b là toán tử Trong đó ψ ( dịch và a là toán tử tỉ lệ. Trong thực tế biến đổi wavelet thường dùng là wavelet rời rạc DWT (Discrete Wavelet Transform) được thực hiện bằng cấu trúc đa phân giải MRA (Multiresolution Analysis) phân tích tín hiệu ra

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.