tailieunhanh - TTS - VLSP 2021: Development of smartcall Vietnamese text-to-speech

In this paper, we propose an approach that preprocesses noisy found data on the Internet and trains a high-quality TTS model on the processed data. The VLSP-provided training data was thoroughly preprocessed using 1) voice activity detection, 2) automatic speech recognition-based prosodic punctuation insertion, and 3) Spleeter, source separation tool, for separating voice from background music. |

TÀI LIỆU MỚI ĐĂNG
34    213    1    30-04-2024
37    158    0    30-04-2024
173    106    0    30-04-2024
24    110    0    30-04-2024
40    99    0    30-04-2024
6    94    0    30-04-2024
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.