Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Kỹ Thuật - Công Nghệ
Kĩ thuật Viễn thông
Một mô hình phát hiện tiếng nói kích thước nhỏ
tailieunhanh - Một mô hình phát hiện tiếng nói kích thước nhỏ
Bài viết Một mô hình phát hiện tiếng nói kích thước nhỏ đề xuất một mô hình học sâu với chỉ 74k tham số nhưng vẫn có một kết quả tốt trong việc phát hiện tiếng nói. Mô hình chúng tôi sử dụng là mạng nơ ron tích chập sử dụng 1D time-channel separable convolution. | Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 MỘT MÔ HÌNH PHÁT HIỆN TIẾNG NÓI KÍCH THƯỚC NHỎ Nguyễn Duy Khánh1 Đỗ Văn Hải2 1 Trường Đại học Bách Khoa Hà Nội 2 Trường Đại học Thủy lợi 1. GIỚI THIỆU . Tăng cường dữ liệu Hiện nay có rất nhiều hệ thống liên quan Sử dụng tăng cường dữ liệu data đến xử lí tiếng nói. Tuy nhiên trong một augmentation nhằm giúp mô hình học tránh luồng audio tiếng nói không phải luôn liên quá khớp cũng như tăng tính tổng quát hóa. tục sẽ có những đoạn audio không có sự tồn Trong nghiên cứu này chúng tôi sử dụng 2 tại của tiếng nói con người. Do đó chúng ta phương pháp phổ biến được đề xuất gần đây cần một hệ thống để phát hiển tiếng nói trong là SpecAugment và SpecCutout. audio Voice Activity Detector - VAD . Một . Kiến trúc hệ thống hệ thống VAD sẽ kiểm tra xem có tiếng nói trong một đoạn audio ngắn không để khi áp dụng vào cả đoạn audio dài sẽ biết được phần có tiếng nói trong đó. Gần đây có rất nhiều thiết bị cầm tay có liên quan đến xử lí tiếng nói. Tuy nhiên do là thiết bị cầm tay bộ nhớ và khả năng tính toán của chúng bị giới hạn. Vì thế một mô hình có kích thước nhỏ là cần thiết. Trong nghiên cứu này chúng tôi đề xuất một mô hình học sâu với chỉ 74k tham số nhưng vẫn có một kết quả tốt trong việc phát hiện tiếng nói. Mô hình chúng tôi sử dụng là mạng nơ ron tích chập sử dụng 1D time-channel separable convolution. Bằng việc sử dụng separable convolution số lượng tham số giảm đi một cách đáng kể trong khi vẫn giữ được độ chính xác cao. 2. HỆ THỐNG ĐỀ XUẤT . Trích chọn đặc trưng Phương pháp trích chọn đặc trưng dùng trong nghiên cứu này là Mel frequency Hình 1. Kiến trúc hệ thống. cepstral coefficients - MFCC một phương pháp được sử dụng rộng rãi trong các hệ Như đã đề cập việc dùng 1D time-channel thống liên quan đến xử lí tiếng nói. separable convolution sẽ giúp làm giảm số 91 Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 lượng tham số. Lớp convolution này có thể hình CNN
Thế Sơn
28
3
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Giáo trình Mạng nơ ron học sâu và ứng dụng: Phần 1
121
5
1
Nhận dạng khuôn mặt trong video bằng mạng nơ ron tích chập
5
206
5
Nhận dạng chữ số viết tay dựa trên mạng nơ ron tích chập sâu
12
247
7
Mô hình huấn luyện mạng nơ ron dựa trên ảnh mô phỏng
7
150
1
Tóm tắt Luận văn Thạc sĩ: Nghiên cứu phân loại độ tuổi của người bằng ảnh mặt người sử dụng mạng nơ ron tích chập
24
61
1
Nhận diện khuôn mặt sử dụng mạng nơron tích chập xếp chồng và mô hình FaceNet
7
146
8
Phát hiện cháy rừng bằng mạng nơ ron học sâu, dựa trên khói và lửa thu nhận được từ camera giám sát
8
71
1
Nâng cao hiệu năng phát hiện đám cháy sử dụng thị giác máy dựa trên mạng nơ-ron YOLOV5
6
27
1
Dự đoán giá trị cảm biến chất lượng không khí sử dụng mạng nơ ron tích chập một chiều và mạng bộ nhớ dài ngắn hạn
8
10
1
Phát hiện và phân lớp phương tiện giao thông dựa trên mô hình mạng nơ ron tích chập
8
66
3
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462381
61
Giới thiệu :Lập trình mã nguồn mở
14
27190
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11387
543
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10587
468
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9868
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8913
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8537
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8113
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8065
1836
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7316
268
TỪ KHÓA LIÊN QUAN
Kĩ thuật Viễn thông
Mạng nơ ron tích chập
Mô hình phát hiện tiếng nói
Hệ thống xử xử lí tiếng nói
Nền tảng Pytorch Lightning
Lớp point wise convolutional layer
Giáo trình Mạng nơ ron học sâu
Mạng nơ ron học sâu
Ứng dụng mạng nơ ron học sâu
Cơ sở toán học của mạng Nơ ron
Học theo thông số
Nhận dạng khuôn mặt
Nhận dạng khuôn mặt từ video
Nhận dạng chữ số viết tay
Multi layer perceptron
Mô hình mạng nơ ron tích chập
Kiến trúc CNN
Deep learning
Mạng nơ ron
Mạng Inception v3
Kiến trúc mạng nơ ron
Tóm tắt Luận văn Thạc sĩ
Khoa học máy tính
Phân loại độ tuổi bằng ảnh mặt người
Nhận diện khuôn mặt
Mạng nơ ron tích chập xếp chồng
Mô hình FaceNet
Thuật toán đặc trưng khuôn mặt
Phát hiện cháy rừng
Camera giám sát
Cảnh báo cháy rừng
Phát hiện lửa
Mạng nơ ron YOLOV5
Thị giác máy
Hệ thống báo cháy
Giám sát chất lượng không khí
Mạng bộ nhớ dài ngắn hạn
Dự đoán chất lượng không khí
Thiết bị bay không người lái
Phân lớp phương tiện giao thông
Kỹ thuật học sâu
Mạng R CNN
Công tác quản lý giao thông
Dự đoán góc quay vô lăng
Xe tự lái
Cấu trúc mạng
Công nghệ LiDAR
Giới thiệu bài toán tô màu
Mô hình mạng residual
Mô hình kết hợp ResNet18
Mô hình kết hợp VGG16
Tích hợp DSM
Thuật toán Catboost
Mô hình số bề mặt
Xử lý ngôn ngữ tự nhiên
Tạp chí Khoa học và Công nghệ
Nhận dạng cảm xúc
Phân loại cảm xúc
Trích chọn đặc trưng
Phát hiện bộ phận cây
Tập dữ liệu PlantClef
Phương pháp phát hiện tự động bộ phận cây
Hệ thống tự động nhận dạng cây
Luận văn Thạc sĩ
Công nghệ thông tin
Kỹ thuật phần mềm
Nghiên cứu mạng nơ ron tích chập
Mô hình dự đoán tương tác protein
Phân loại dạng điều chế tín hiệu
Phương pháp nhận dạng tín hiệu
Công cụ học sâu
Điều chế tín hiệu
Luận văn Thạc sĩ Kỹ thuật
Hành vi của khách hàng theo độ tuổi
Tạp Chí Khoa Học Giáo Dục
Khoa Học Giáo Dục Kỹ Thuật
Nhận diện cảm xúc khuôn mặt
Phân loại cảm xúc khuôn mặt
Thuật toán tối ưu
Giá trị hàm mất mát
Số chu kì học
Hàm Entropy chéo
Nhận dạng cử chỉ tay
Ra đa FMCW
Phổ micro Doppler
Mô hình Cross CNN
Trí tuệ nhân tạo
Nền tảng di động Android
Bài toán nhận dạng chữ số viết tay
Kĩ thuật học sâu
Bộ cơ sở dữ liệu MNIST
Bộ cơ sở dữ liệu CIFAR 10
Phân lớp ảnh
Truy vấn ảnh dựa trên ngữ nghĩa
Bộ dữ liệu ảnh Caltech 256
Tập từ vựng thị giác
Mảng anten không đồng nhất
Nguồn tín hiệu vô tuyến
Mô hình DOA ResNet
Trinh sát tín hiệu vô tuyến
TÀI LIỆU MỚI ĐĂNG
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
177
2
21-01-2025
báo cáo khoa học: "Malignant peripheral nerve sheath tumor arising from the greater omentum: Case report"
4
149
1
21-01-2025
The Ombudsman Enterprise and Administrative Justice
309
152
0
21-01-2025
Báo cáo khoa học: "A rare coexistence of adrenal cavernous hemangioma with extramedullar hemopoietic tissue: a case report and brief review of the literature"
4
113
0
21-01-2025
Giáo trình môn cầu đường
26
147
2
21-01-2025
Neuromuscular Diseases A Practical Guideline - part 4
46
159
1
21-01-2025
Norton Commander version 5 part 5
18
134
0
21-01-2025
Báo cáo lâm nghiệp: "Les facteurs de productivité du Pin noir d’Autriche (Pinus nigra Arnold. ssp. nigricans Host. austriaca Hoss. Novak) dans les Alpes du Sud"
17
118
0
21-01-2025
Ảnh ĐẶNG QUANG HIẾU: Cái lem nhem đẹp của Hà Nội
10
130
0
21-01-2025
Đề đề xuất - Trường thcs Trần Hưng Đạo
5
121
0
21-01-2025
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8113
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8065
1836
Ebook Chào con ba mẹ đã sẵn sàng
112
4472
1380
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6442
1283
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8913
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3877
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3932
610
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4830
568
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11387
543
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4548
490