tailieunhanh - Các giải thuật phát hiện chữ viết đối với các ngôn ngữ có dấu
Bài báo này giới thiệu tổng quan các giải thuật phát hiện chữ viết trong ảnh của các ngôn ngữ có dấu trên thế giới để cung cấp các hướng nghiên cứu đối với bài toán phát hiện chữ viết tiếng Việt. | Các giải thuật phát hiện chữ viết đối với các ngôn ngữ có dấu Thông tin khoa học công nghệ CÁC GIẢI THUẬT PHÁT HIỆN CHỮ VIẾT ĐỐI VỚI CÁC NGÔN NGỮ CÓ DẤU Lê Ngọc Thúy* Tóm tắt: Có rất nhiều nghiên cứu trong thời gian gần đây về vấn đề phát hiện và nhận dạng chữ viết trong ảnh và video. Tuy nhiên, hầu hết các nghiên cứu này tập trung vào giải quyết bài toán đối với chữ viết tiếng Anh mà có rất ít nghiên cứu dành cho chữ viết của các ngôn ngữ khác. Trong khi đó, chữ viết có dấu là một vấn đề phức tạp để có thể định vị và nhận dạng chính xác do phần dấu thường nằm tách biệt so với phần chính của ký tự. Bài báo này giới thiệu tổng quan các giải thuật phát hiện chữ viết trong ảnh của các ngôn ngữ có dấu trên thế giới để cung cấp các hướng nghiên cứu đối với bài toán phát hiện chữ viết tiếng Việt. Từ khóa: OCR, Phát hiện chữ viết trong ảnh chụp, Nhận dạng chữ viết trong ảnh chụp. 1. GIỚI THIỆU Bài toán nhận dạng văn bản trong ảnh quét (Optical Character Recognition – OCR) là vấn đề đã được giải quyết tốt với nhiều sản phẩm thương mại trên thị trường. Tuy nhiên, phát hiện và nhận dạng chữ viết trong ảnh chụp là một vấn đề còn có nhiều thách thức và đang rất được các nhà khoa học quan tâm trong thời gian gần đây. Vấn đề này có những nét tương đồng nhưng gặp nhiều thách thức hơn so với bài toán OCR do các nguyên nhân sau: (i) Sự phức tạp của khung cảnh trong ảnh: có rất nhiều vật thể, biểu tượng, tranh ảnh,. xen lẫn vào trong khung cảnh của ảnh chụp tự nhiên với những họa tiết, cấu trúc và đặc trưng tương tự như chữ viết; (ii) Ảnh bị mờ, kém chất lượng do camera focus không đúng; (iii) Độ sáng trong ảnh không đồng đều; (iv) Chữ viết bị biến dạng do trục quang học của camera không vuông góc với mặt phẳng chữ viết. Bài toán nhận dạng chữ viết trong ảnh chỉ mới nhận được nhiều sự quan tâm của các học giả gần đây nhờ vào sự phát triển của các thiết bị di động về cả khả năng thu nhận hình ảnh và khả năng xử lý, tính
đang nạp các trang xem trước