tailieunhanh - Chất lượng tiếng nói

Tiếng nói đóng vai trò rất quan trọng trong thông tin liên lạc. Quá trình truyền tín hiệu tiếng nói được truyền đi qua các phương tiện thông tin bị các loại nhiễu tác động nên chất lượng bị suy giảm. Vì vậy, các thuật toán Speech Enhancement và các kĩ thuật làm giảm nhiễu được ra đời. Trong bài Lab này ta sẽ đi nghiên cứu 2 thuật toán ước lượng phổ để khử nhiễu kinh điển là Spectral Subtraction [1] và Wiener Filter [2]. Việc ước lượng phổ nhiễu đòi hỏi một thuật toán VAD ( Voice Activity Detection ) để tìm khoảng thời. | SPEECH ENHENCEMENT ALGORITHMS FINAL PROJECT JUN-2012 DUT ELECTRONICS AND TELECOMMUNICATION ENGINEERING DIGITAL SIGNAL PROCESSING MAIN REPORT Author Hoàng Minh Thảo langtu2790@ 1 1. Tổng quan về nâng cao chất lượng tiếng nói í Tiếng nói đóng vai trò rất quan trọng trong thông tin liên lạc. Quá trình truyền tín hiệu tiếng nói được truyền đi qua các phương tiện thông tin bị các loại nhiễu tác động nên chất lượng bị suy giảm. Vì vậy các thuật toán Speech Enhancement và các ki thuật làm giảm nhiễu được ra đời. Trong bài Lab này ta sẽ đi nghiên cứu 2 thuật toán ước lượng phổ để khử nhiễu kinh điển là Spectral Subtraction 1 và Wiener Filter 2 . Việc ước lượng phổ nhiễu đòi hỏi một thuật toán VAD Voice Activity Detection để tìm khoảng thời gian không có tiếng nói hoạt động. Ta sẽ đi phân tích từng phần theo sự phát triển của các thuật toán và đánh giá kết quả mà các thuật toán mang lại. . Phân tích tín hiệu có nhiễu thành các segment frame Tín hiệu có nhiễu được chia ra thành nhiều Segment hay Frame có chiều dài bằng 25 ms với độ dịch là 40 của Window trên suốt chiều dài tín hiệu. Cửa sổ có thể chọn Rectangle Hanning Hamming Blackman . Việc chọn loại cửa sổ sẽ ảnh hưởng tới việc khôi phục tín hiệu đã tăng cường sau này. Ở đây cửa sổ được lựa chọn là Hamming. Do Hamming là cửa sổ phi tuyến nên khi thực hiện biến đổi FFT thì vô tình đã làm suy giảm tín hiệu vì thế yêu cầu đăt ra là các Segment phải sắp xếp chồng lên nhau theo 1 tỉ lệ dịch SP thích hợp vùng xếp chồng giữa 2 Segment liên tục gọi là overlap . 3 w SP The STFT as the FFT on a St ra ng window Minh họa quá trình Segmenting bằng cửa sổ rectwin y n tín hiệu có nhiễu cộng vào. SP shift percentage W Window Length X. o số mẫu ở vùng overlap o fix W 1-SP . L Noisy Signal Length x . Số Segment có thể được tính dựa vào công thức sau Number of noisy signal Segments LengthSignal - WindowLength Shift Percentage WindowLength 1 _ 1 Dấu J để chỉ là lấy giá tri nguyên nhỏ hơn và gần kết quả nhất. K CKhi tín hiệu được

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.