tailieunhanh - Nhúng văn bản tiếng Việt trong dữ liệu audio dựa vào đặc điểm của chữ viết tiếng Việt

Các bài toán nhúng văn bản tiếng Việt trong dữ liệu audio đều phải giải quyết hai vấn đề liên quan, đó là tăng hiệu quả nhúng và bảo mật nội dung tin nhúng. Chúng tôi giải quyết bài toán này bằng cách phân tích đặc điểm của chữ viết tiếng Việt; từ đó xây dựng khóa mã, dùng để mã hóa và nén văn bản tiếng Việt trước khi thực hiện nhúng. Kết quả thử nghiệm với các văn bản tiếng Việt thông dụng, cho thấy số bit tin cần nhúng giảm đáng kể so với phương pháp nhúng thông thường; đồng thời nội dung văn bản nhúng được bảo mật. | Vũ Văn Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 53 - 58 NHÚNG VĂN BẢN TIẾNG VIỆT TRONG DỮ LIỆU AUDIO DỰA VÀO ĐẶC ĐIỂM CỦA CHỮ VIẾT TIẾNG VIỆT Vũ Văn Tâm1*, Phan Trọng Hanh2 1Đại học Kỹ thuật – Hậu cần CAND (Bộ Công an), 2Học viện Kỹ thuật Quân sự (Bộ Quốc phòng) TÓM TẮT Các bài toán nhúng văn bản tiếng Việt trong dữ liệu audio đều phải giải quyết hai vấn đề liên quan, đó là tăng hiệu quả nhúng và bảo mật nội dung tin nhúng. Chúng tôi giải quyết bài toán này bằng cách phân tích đặc điểm của chữ viết tiếng Việt; từ đó xây dựng khóa mã, dùng để mã hóa và nén văn bản tiếng Việt trước khi thực hiện nhúng. Kết quả thử nghiệm với các văn bản tiếng Việt thông dụng, cho thấy số bit tin cần nhúng giảm đáng kể so với phương pháp nhúng thông thường; đồng thời nội dung văn bản nhúng được bảo mật. Từ khóa: Nhúng văn bản; nhúng dữ liệu; mã hóa văn bản; nén văn bản; nhúng audio ĐẶT VẤN ĐỀ* Nhúng văn bản tiếng Việt trong dữ liệu audio là một trong những bài toán cơ bản nhất của kỹ thuật giấu tín hiệu trong dữ liệu số. Hiện nay, đã có nhiều phương pháp tiếp cận khác nhau như: Phương pháp nhúng LSB (Least Significant Bit) [2], [4], [5]; Mã hóa Parity (Parity Coding) [2], [4]; Mã hóa Phase (Phase Coding) [2], [5]; Ứng dụng kỹ thuật trải phổ [1], [2]; Kỹ thuật mã hóa echo [2], [6]. Các phương pháp nêu trên tập trung chủ yếu vào xây dựng thuật toán nhúng tin nhằm bảo đảm tin nhúng được ổn định. Việc kết hợp giữa nhúng tin với nén và mã hóa tin có thể sẽ tăng được hiệu quả nhúng và bảo mật được tin cần nhúng. Trên cơ sở nghiên cứu về đặc điểm của chữ viết tiếng Việt, từ đó xây dựng các khóa mã dùng để nén và mã hóa chữ viết tiếng Việt trước khi thực hiện nhúng vào dữ liệu audio. Với cách tiếp cận như trên, bài báo được trình bày theo thứ tự sau: Đặc điểm chữ viết tiếng Việt; Xây dựng mô hình; Xây dựng các thuật toán; Thử nghiệm và đánh giá và cuối cùng là phần kết luận. ĐẶC ĐIỂM CHỮ VIẾT TIẾNG VIỆT Bộ chữ viết tiếng Việt được chia làm 2 loại: Chữ số (từ 0 đến 9), là loại .

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.