tailieunhanh - Báo cáo "Xây dựng hệ thống nhận dạng và dịch trên thiết bị di động "

Trình bày kiến thức tổng quan về lĩnh vực OCR (Optical Character Recognition) - Lĩnh vực nhận dạng ký tự quang học. Tìm hiểu nội dung về công nghệ mã nguồn mở Tesseract OCR, công nghệ Android, mô hình client/server, công nghệ dịch Google Translate. Các công nghệ, mô hình này được sử dụng để xây dựng hệ thống. Giới thiệu kiến trúc và các thành phần cơ bản của hệ thống nhận dạng và dịch trên thiết bị di động đã xây dựng. Trình bày kết quả thực nghiệm chức năng rút trích thông tin từ ảnh của hệ. | Xây dựng hệ thống nhận dạng và dịch trên thiết bị di động Phạm Phi Hiệu Trường Đại học Công nghệ Luận văn Thạc sĩ ngành Công nghệ Phần mềm Mã số 60 48 10 Người hướng dẫn TS. Kiều Văn Hưng Năm bảo vệ 2011 Abstract Trình bày kiến thức tổng quan về lĩnh vực OCR Optical Character Recognition - Lĩnh vực nhận dạng ký tự quang học. Tìm hiểu nội dung về công nghệ mã nguồn mở Tesseract OCR công nghệ Android mô hình client server công nghệ dịch Google Translate. Các công nghệ mô hình này được sử dụng để xây dựng hệ thống. Giới thiệu kiến trúc và các thành phần cơ bản của hệ thống nhận dạng và dịch trên thiết bị di động đã xây dựng. Trình bày kết quả thực nghiệm chức năng rút trích thông tin từ ảnh của hệ thống cũng như so sánh một sách tương đối kết quả OCR với một số hệ thống khác. Keywords Công nghệ mã nguồn mở Dịch Hệ thống nhận dạng Ký tự quang học Thiết bị di động Content MỞ ĐẦU Đặt vấn đề Từ lâu con người đã quen với việc sử dụng máy tính để lưu trữ những tài liệu cần thiết xuất phát từ những tiện ích to lớn do máy tính mang lại lưu trữ khối dữ liệu lớn ít bị hư hỏng dễ quản lí dễ tìm kiếm dễ chỉnh sửa. Tuy nhiên giấy vẫn là một vật liệu quan trọng đã đang và sẽ được sử dụng để lưu trữ tài liệu vì sự cần thiết của nó trong cuộc sống hàng ngày ví dụ sách báo. . Một nhu cầu tất yếu con người muốn đưa các tài liệu đang lưu trữ trên giấy cũng như trên một số vật liệu khác lên máy tính để có thể làm việc với chúng một hiệu quả hơn. Một cách thông thường con người sẽ đánh máy trực tiếp các tài liệu đó lên máy tính. Đối với một số lượng nhỏ tài liệu việc này hoàn toàn bình thường. Song đối với một khối lượng tài liệu khổng lồ ví dụ như cả kho sách đây là một vấn đề nan giải mặc dù với việc đánh máy độ chính xác rất cao nhưng lại tốn quá nhiều thời gian trong khi với các công nghệ hiện có cho phép ta giải quyết vấn đề này chụp ảnh tài liệu và nhận dạng ký tự trong ảnh. Nhận dạng ký tự quang học tiếng Anh Optical Character Recognition viết tắt là OCR 20 là quá trình rút trích .

TỪ KHÓA LIÊN QUAN