tailieunhanh - Áp dụng thuật toán Dynamic time wraping (DTW) cho ứng dụng nhận dạng mẫu tiếng việt

: Tự động nhận dạng tiếng nói (Automatic Speech Recognition ASR) là một lĩnh vực nghiên cứu quan trọng để đưa các ứng dụng tiếng nói vào nhiều ngành. Một vấn đề liên quan cần nghiên cứu trong lĩnh vực này được dựa trên cơ sở lưu trữ một hoặc nhiều mẫu tín hiệu cho mỗi từ cần nhận dạng. Quá trình nhận dạng là quá trình thực hiện việc so sánh hai mẫu tín hiệu của cùng một âm để tím ra mẫu có sai số nhỏ nhất. Bởi vì tín hiệu âm thanh được tạo ra tại các | Trong tÊt c¶ c¸c ng«n ng÷, tõ lµ ®¬n vÞ tù nhiªn nhá nhÊt cña tiÕng nãi vµ tõ lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng tiÕng nãi. TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. Trong tiÕng ViÖt, ©m tiÕt lµ nh÷ng ®¬n vÞ ©m thanh nhá nhÊt vµ nh­ vËy ©m tiÕt lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng lêi ViÖt. Do vËy nã cã thÓ ®­îc lùa chän lµm ®¬n vÞ nhËn d¹ng tiÕng nãi cho c¸c øng dông nhËn d¹ng lêi ViÖt. Tuy nhiªn, do trong tiÕng ViÖt, sè l­îng ©m tiÕt rÊt lín trªn ©m tiÕt nªn rÊt khã cã thÓ ¸p dông cho c¸c hÖ thèng nhËn d¹ng tiÕng viÖt cì lín do viÖc thu thËp mÉu tiÕng nãi cÇn thiÕt cho c¸c ©m tiÕt sÏ gÆp nhiÒu khã kh¨n do sã l­îng mÉu qu¸ lín vµ thêi gian xö lý so s¸nh, lùa chän mÉu trong c¬ së d÷ liÖu l©u. Ngoµi ra , mçi mÉu huÊn luyÖn cña mét ©m tiÕt chØ cã thÓ sö dông ®Ó huÊn luyÖn vµ so s¸nh lùa chän cho chÝnh ©m tiÕt ®ã chø kh«ng thÓ sö dông chung ®Ó huÊn luyÖn vµ lùa chän cho c¸c ©m tiÕt kh¸c. Xong bï l¹i, ph­¬ng ph¸p nµy cã nhiÒu ®¬n gi¶n do kh«ng cÇn ph¶i sö dông mét sè c¸c ph­¬ng ph¸p ®Ó ph©n ®o¹n vµ g¸n nh·n.

TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
10    187    3    11-01-2025
5    185    1    11-01-2025