tailieunhanh - Một mô hình phát hiện tiếng nói kích thước nhỏ

Bài viết Một mô hình phát hiện tiếng nói kích thước nhỏ đề xuất một mô hình học sâu với chỉ 74k tham số nhưng vẫn có một kết quả tốt trong việc phát hiện tiếng nói. Mô hình chúng tôi sử dụng là mạng nơ ron tích chập sử dụng 1D time-channel separable convolution. | Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 MỘT MÔ HÌNH PHÁT HIỆN TIẾNG NÓI KÍCH THƯỚC NHỎ Nguyễn Duy Khánh1 Đỗ Văn Hải2 1 Trường Đại học Bách Khoa Hà Nội 2 Trường Đại học Thủy lợi 1. GIỚI THIỆU . Tăng cường dữ liệu Hiện nay có rất nhiều hệ thống liên quan Sử dụng tăng cường dữ liệu data đến xử lí tiếng nói. Tuy nhiên trong một augmentation nhằm giúp mô hình học tránh luồng audio tiếng nói không phải luôn liên quá khớp cũng như tăng tính tổng quát hóa. tục sẽ có những đoạn audio không có sự tồn Trong nghiên cứu này chúng tôi sử dụng 2 tại của tiếng nói con người. Do đó chúng ta phương pháp phổ biến được đề xuất gần đây cần một hệ thống để phát hiển tiếng nói trong là SpecAugment và SpecCutout. audio Voice Activity Detector - VAD . Một . Kiến trúc hệ thống hệ thống VAD sẽ kiểm tra xem có tiếng nói trong một đoạn audio ngắn không để khi áp dụng vào cả đoạn audio dài sẽ biết được phần có tiếng nói trong đó. Gần đây có rất nhiều thiết bị cầm tay có liên quan đến xử lí tiếng nói. Tuy nhiên do là thiết bị cầm tay bộ nhớ và khả năng tính toán của chúng bị giới hạn. Vì thế một mô hình có kích thước nhỏ là cần thiết. Trong nghiên cứu này chúng tôi đề xuất một mô hình học sâu với chỉ 74k tham số nhưng vẫn có một kết quả tốt trong việc phát hiện tiếng nói. Mô hình chúng tôi sử dụng là mạng nơ ron tích chập sử dụng 1D time-channel separable convolution. Bằng việc sử dụng separable convolution số lượng tham số giảm đi một cách đáng kể trong khi vẫn giữ được độ chính xác cao. 2. HỆ THỐNG ĐỀ XUẤT . Trích chọn đặc trưng Phương pháp trích chọn đặc trưng dùng trong nghiên cứu này là Mel frequency Hình 1. Kiến trúc hệ thống. cepstral coefficients - MFCC một phương pháp được sử dụng rộng rãi trong các hệ Như đã đề cập việc dùng 1D time-channel thống liên quan đến xử lí tiếng nói. separable convolution sẽ giúp làm giảm số 91 Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 lượng tham số. Lớp convolution này có thể hình CNN

Thế Sơn 28 3 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Giáo trình Mạng nơ ron học sâu và ứng dụng: Phần 1

121 5 1

Nhận dạng khuôn mặt trong video bằng mạng nơ ron tích chập

5 206 5

Nhận dạng chữ số viết tay dựa trên mạng nơ ron tích chập sâu

12 247 7

Mô hình huấn luyện mạng nơ ron dựa trên ảnh mô phỏng

7 150 1

Tóm tắt Luận văn Thạc sĩ: Nghiên cứu phân loại độ tuổi của người bằng ảnh mặt người sử dụng mạng nơ ron tích chập

24 61 1

Nhận diện khuôn mặt sử dụng mạng nơron tích chập xếp chồng và mô hình FaceNet

7 146 8

Phát hiện cháy rừng bằng mạng nơ ron học sâu, dựa trên khói và lửa thu nhận được từ camera giám sát

8 71 1

Nâng cao hiệu năng phát hiện đám cháy sử dụng thị giác máy dựa trên mạng nơ-ron YOLOV5

6 27 1

Dự đoán giá trị cảm biến chất lượng không khí sử dụng mạng nơ ron tích chập một chiều và mạng bộ nhớ dài ngắn hạn

8 10 1

Phát hiện và phân lớp phương tiện giao thông dựa trên mô hình mạng nơ ron tích chập

8 66 3

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462381 61

Giới thiệu :Lập trình mã nguồn mở

14 27190 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11387 543

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10587 468

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9868 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8913 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8537 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8113 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 8065 1836

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7316 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp

5 177 2 21-01-2025

báo cáo khoa học: "Malignant peripheral nerve sheath tumor arising from the greater omentum: Case report"

4 149 1 21-01-2025

The Ombudsman Enterprise and Administrative Justice

309 152 0 21-01-2025

Báo cáo khoa học: "A rare coexistence of adrenal cavernous hemangioma with extramedullar hemopoietic tissue: a case report and brief review of the literature"

4 113 0 21-01-2025

Giáo trình môn cầu đường

26 147 2 21-01-2025

Neuromuscular Diseases A Practical Guideline - part 4

46 159 1 21-01-2025

Norton Commander version 5 part 5

18 134 0 21-01-2025

Báo cáo lâm nghiệp: "Les facteurs de productivité du Pin noir d’Autriche (Pinus nigra Arnold. ssp. nigricans Host. austriaca Hoss. Novak) dans les Alpes du Sud"

17 118 0 21-01-2025

Ảnh ĐẶNG QUANG HIẾU: Cái lem nhem đẹp của Hà Nội

10 130 0 21-01-2025

Đề đề xuất - Trường thcs Trần Hưng Đạo

5 121 0 21-01-2025

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8113 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 8065 1836

Ebook Chào con ba mẹ đã sẵn sàng

112 4472 1380

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6442 1283

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8913 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3877 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3932 610

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4830 568

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11387 543

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4548 490