tailieunhanh - Phương pháp tăng cường dữ liệu hai pha cho mô hình nhận dạng tiếng nói theo kiến trúc END2END

Bài viết Phương pháp tăng cường dữ liệu hai pha cho mô hình nhận dạng tiếng nói theo kiến trúc END2END trình bày cách tiếp cận tăng cường dữ liệu 2 pha cho mô hình nhận dạng tiếng nói dựa trên kiến trúc End2End. Kết quả thử nghiệm với các bộ test khác nhau đã cho thấy sai số giảm rõ rệt. | Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 PHƯƠNG PHÁP TĂNG CƯỜNG DỮ LIỆU HAI PHA CHO MÔ HÌNH NHẬN DẠNG TIẾNG NÓI THEO KIẾN TRÚC END2END Nguyễn Thị Phương Thảo1 Phạm Thanh Bình1 Đỗ Văn Hải1 1 Trường Đại học Thủy lợi 1. MỞ ĐẦU của phổ tín hiệu tiếng nói một cách ngẫu nhiên Đối với bài toán nhận dạng tiếng hay các theo cả chiều tần số và thời gian. Kỹ thuật này bài toán về học máy khác thì dữ liệu thực tế đã giúp cải thiện độ ổn định của các mô hình thử nghiệm test càng giống với dữ liệu huấn nhận dạng E2E lên một cách rõ rệt. luyện train thì càng tốt. Tuy nhiên điều này Trong nghiên cứu này chúng tôi thử hiếm khi xảy ra trong thực tế. Do đó luôn có nghiệm các mô hình nhận dạng E2E trong sự sai khác mismatch giữa dữ liệu huấn điều kiện môi trường có nhiễu. Đây là kịch luyện dẫn xuất là mô hình và dữ liệu test. bản rất hay xuất hiện trong thực tế. Dữ liệu Trong những năm gần đây nổi lên một huấn luyện thu âm trong môi trường ít nhiễu cách tiếp cận mới trong nhận dạng tiếng nói nhưng dữ liệu lúc thử nghiệm lại là trong môi đang được các nhóm nghiên cứu lớn đang trường có nhiễu. Để giúp mô hình nhận dạng nghiên cứu phát triển đó là nhận dạng tiếng E2E ổn định với môi trường có nhiễu chúng nói dựa trên kiến trúc end-to-end E2E 1 . tôi đề xuất một quy trình tăng cường dữ liệu Công nghệ E2E được dựa trên cơ chế từ gồm 2 pha. chuỗi đến chuỗi sequence to sequence được Pha 1 Bổ sung thêm nhiễu vào tín hiệu áp dụng đầu tiên trong bài toán dịch máy. tiếng nói. Trong bài toán này đầu vào là một chuỗi các Pha 2 Sử dụng phương pháp SpecAugment từ của ngôn ngữ nguồn đầu ra là một chuỗi để che đi một phần tín hiệu trên miền thời gian các từ của ngôn ngữ đích. Chiều dài chuỗi và tần số của tín hiệu đã được bổ sung nhiễu ở đầu vào và đầu ra có thể khác nhau. pha 1. Trong cuộc thi VLSP 2021 về nhận dạng Với phương pháp đề xuất này mô hình nhận tiếng nói tiếng Việt1 trong 6 đội có kết quả dạng tiếng nói E2E đã cho kết quả nhận dạng cao nhất có đến 5 đội .

Thái Hồng 13 3 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Đồ án: Tìm hiểu bài toán nhận dạng kí tự viết tay và phát triển ứng dụng

63 166 5

Đề tài: Bài toán nhận dạng biển số xe

91 411 42

Bài giảng Lý thuyết nhận dạng

93 102 9

Bài tập lớn môn Trí tuệ nhân tạo: Nhận dạng ký tự viết tay tiếng Việt

20 501 40

Bài tập lớn môn học Kĩ thuật đồ họa: Nghiên cứu ứng dụng nhận dạng chữ viết tay

17 133 4

Review các phương pháp nhận dạng văn bản

8 33 1

Một mô hình đề xuất cho bài toán nhận dạng ký tự trên container vận tải đường thủy

10 86 1

Chương XI: Nhận dạng tam giác

17 105 0

Luận văn Tốt nghiệp: Nhận dạng ngôn ngữ

59 63 0

Báo cáo: Tìm hiểu mạng nơ-tron ứng dụng trong nhận dạng chữ viết

40 72 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461872 55

Giới thiệu :Lập trình mã nguồn mở

14 22690 61

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10902 530

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10073 446

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9536 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8295 1125

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8244 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7866 2220

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6697 253

Vật lý hạt cơ bản (1)

29 5779 85

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Báo cáo khoa học: Loss of kinase activity in Mycobacterium tuberculosis multidomain protein Rv1364c

14 235 0 29-04-2024

Mass Transfer in Multiphase Systems and its Applications Part 19

40 256 1 29-04-2024

extremetech Hacking BlackBerry phần 9

31 253 0 29-04-2024

BeginningMac OS X Tiger Dashboard Widget Development 2006 phần 2

34 213 0 29-04-2024

Trading Strategies Profit Making Techniques For Stock_8

23 176 1 29-04-2024

Management and Services Part 1

10 158 0 29-04-2024

MySQL Database Usage & Administration PHẦN 9

37 142 0 29-04-2024

B2B Content Marketing: 2012 Benchmarks, Budgets & Trends

17 139 0 29-04-2024

Đề tài: Tìm hiểu một số yêu cầu đặt ra với một phòng thu âm, để đảm bảo chất lượng âm thanh trong sản phẩm đa phương tiện

8 161 1 29-04-2024

QUẢN LÝ CHẤT LƯỢNG KHÔNG KHÍ

75 138 0 29-04-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7866 2220

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5765 1383

Ebook Chào con ba mẹ đã sẵn sàng

112 3770 1232

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5328 1136

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8295 1125

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3504 643

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10902 530

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3690 525

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4062 516

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4133 480