tailieunhanh - Một kỹ thuật biến đổi giọng người nói hiệu quả sử dụng kỹ thuật phân rã tiếng nói theo thời gian
Nghiên cứu này đề xuất phương pháp biến đổi giọng người nói trong tiếng nói lai giữa hai phương pháp TD-GMM à phương pháp thay thế khung HTT [5], sử dụng kỹ thuật phân rã tiếng nói theo thời gian cải tiến MRTD. | Một kỹ thuật biến đổi giọng người nói hiệu quả sử dụng kỹ thuật phân rã tiếng nói theo thời gian Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-2, Số 16 (36), tháng 12/2016 Một kỹ thuật biến đổi giọng ngƣời nói hiệu quả sử dụng kỹ thuật phân rã tiếng nói theo thời gian An Efficient Approach for Voice Transformation using Temporal Decomposition Phùng Trung Nghĩa Abstract: Voice transformation is an important cả các thông tin chung về người nói như giới tính, độ issue in speech synthesis when we need to synthesize tuổi, , đến các thông tin chi tiết như thông tin nhận multiple output voices but do not want to rebuid the danh chính xác người nói [3-7]. Các hệ thống tổng synthesis system. Speech transformed by the hợp tiếng nói nhân tạo thường chỉ có thể tổng hợp ra conventional method using Gaussian Mixture Model tiếng nói của một số giọng nói đã được thu sẵn và (GMM) is not high-quality due to the oversmoothness huấn luyện trước cho máy tính. Để có thể tổng hợp ra of GMM. Therefore, a number of methods have been nhiều giọng nói đầu ra mà không cần xây dựng lại hệ proposed to overcome the disadvantages of the thống tổng hợp tiếng nói cần đến các hệ thống biến conventional method using GMM. Among them, đổi giọng người nói [3-6]. Hidden Markov Model Trajectory Tiling (HTT) and Trên thế giới đã có nhiều nghiên cứu về biến đổi Temporal Decomposition – GMM (TD-GMM) giọng người nói trong tiếng nói [3-6]. Phương pháp improve the effectiveness of voice transformation. However, they still have drawbacks. In this paper, a truyền thống là phương pháp sử dụng học máy thống voice transformation method using the modified kê dùng mô hình Gaussian hỗn hơn GMM [3]. Do restricted TD (MRTD) is proposed. The experimental chất lượng tiếng nói tổng hợp / tái tạo bằng các mô results with Vietnamese and English corpus confirm hình thống kê như GMM có xu hướng bị trung bình the effectiveness of the proposed method compared hóa,
đang nạp các trang xem trước