tailieunhanh - Nhận dạng tiếng nói bằng mạng Nơron

Mạng nơ ron (Neuron Netwok) là một công cụ có khả năng giải quyết được nhiều bài toán khó, thực tế những nghiên cứu về mạng nơ ron đưa ra một cách tiếp cận khác với những cách tiếp cận truyền thống trong lý thuyết nhận dạng. Trong khuôn khổ bài báo này tác giả mong muốn được thảo luận về 1 phương pháp nhận dạng tiếng nói sử dụng mạng nơ ron. Mở đầu Đã có nhiều công trình nghiên cứu về lĩnh vực nhận dạng tiếng nói (Speech recognition) trên cơ sở lý thuyết các hệ thống thông. | Nhận dạng tiếng nói bằng mạng Nơron nhân tạo Mạng nơ ron Neuron Netwok là một công cụ có khả năng giải quyết được nhiều bài toán khó thực tế những nghiên cứu về mạng nơ ron đưa ra một cách tiếp cận khác với những cách tiếp cận truyền thống trong lý thuyết nhận dạng. Trong khuôn khổ bài báo này tác giả mong muốn được thảo luận về 1 phương pháp nhận dạng tiếng nói sử dụng mạng nơ ron. Mở đầu Đã có nhiều công trình nghiên cứu về lĩnh vực nhận dạng tiếng nói Speech recognition trên cơ sở lý thuyết các hệ thống thông minh nhân tạo nhiều kết quả đã trở thành sản phẩm thương mại như ViaVoice Dragon. các hệ thống bảo mật thông qua nhận dạng tiếng nói các hệ quay số điện thoại bằng giọng nói. Triển khai những công trình nghiên cứu và đưa vào thực tế ứng dụng vấn đề này là một việc làm hết sức có ý nghĩa đặc biệt trong giai đoạn công nghiệp hoá hiện đại hoá hiện nay của nước nhà. Mạng nơ ron Neuron Netwok là một công cụ có khả năng giải quyết được nhiều bài toán khó thực tế những nghiên cứu về mạng nơ ron đưa ra một cách tiếp cận khác với những cách tiếp cận truyền thống trong lý thuyết nhận dạng. Trong khuôn khổ bài báo này tác giả mong muốn được thảo luận về 1 phương pháp nhận dạng tiếng nói sử dụng mạng nơ ron với - Phương pháp mã dự đoán tuyến tính LPC Linear Predictive Coding được sử dụng trong việc trích trọn những đặc trưng cơ bản của tiếng nói. - Mạng nơ ron lan truyền ngược hướng Back-propagation Neural Network được sử dụng để học mẫu và ra quyết định đối tượng nhận dạng. Xử lý tín hiệu tiếng nói Quá trình tiền xử lý tín hiệu là chuyển tiếng nói từ dạng sóng wave form representation sang dạng biểu diễn tham số parametric form representation . Các tham số biểu diễn tín hiệu tiếng nói có thể là năng lượng thời gian ngắn short time energy tỷ lệ qua điểm không zero crossing rate tỷ lệ qua mức level crossing rate . Đã có nhiều cách dùng để trích chọn ra được những thông tin về âm thanh một cách trực tiếp từ những tín hiệu số của tiếng nói và hiệu quả hơn là phương pháp .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN