tailieunhanh - Xây dựng cơ sở tri thức chữ nhiều bậc đệ quy và kho thành tố cơ bản của chữ Nôm

Chữ Hán-Nôm hiện nay được sử dụng rộng rãi trong vùng Đông Á và trên thế giới nhờ sự phát triển của ngành công nghệ thông tin, mạng Internet và nhất là chuẩn mã chữ quốc tế Unicode và ISO/IEC 10646. Chữ Nôm nhờ đó đã gia nhập cộng đồng mạng thông tin và máy tính. để nắm bắt nội dung chi tiết. | NHÁP XÂY DỰNG CƠ SỞ TRI THỨC CHỮ NHIỀU BẬC ĐỆ QUY VÀ KHO THÀNH TỐ CƠ BẢN CỦA CHỮ NÔM Ngô Thanh Giang Tô Trọng Đức Ngô Thanh Nhàn Ngô Trung Việt Nhóm Nôm Na Hà Nội Hội nghị Quốc tế về chữ Nôm Tháng 6 năm 2006 Huế Giới thiệu Chữ Hán-Nôm hiện nay được sử dụng rộng rãi trong vùng Đông Á và trên thế giới nhờ sự phát triển của ngành công nghệ thông tin mạng Internet và nhất là chuẩn mã chữ quốc tế Unicode và ISO IEC 10646. Chữ Nôm nhờ đó đã gia nhập cộng đồng mạng thông tin và máy tính. Tuy nhiên thông lệ quốc tế về chữ Hán-Nôm còn nhiều điểm cơ bản chưa chính xác về tự đạng. Cụ thể mỗi chữ Hán-Nôm bị coi là một chữ cái character và từ đó cách phân tích nội tại của chữ Hán-Nôm còn phải dùng phương pháp bộ và số nét theo cách của Tự điển Khang Hi năm 1710-1716. Do đó kho chữ cái Hán-Nôm trong bộ chuẩn quốc tế lên đến hơn Đó là một điều kỳ lạ. Ai cũng biết mỗi chữ Hán-Nôm ghi một âm tiết được tạo thành bằng những bộ phận giống nhau về hình dáng. Tự điển Khang Hi bắt đầu công tác phân tích và tìm ra 214 bộ mà phương Tây dịch sai thành radical . Tự điển Khang Hi có thể coi là một bước cách mạng về mặt phân tích chữ Hán theo các bộ phận tự dạng nội tại của chữ nó cho phép người ta sắp thứ tự vào một bảng tự điển theo một quy trình mà ai cũng truy tìm được. Nhưng việc dùng cách đếm số nét không phải là bộ phận tự dạng nội tại làm phức tạp thêm cho việc tìm chữ trong văn bản hay tự điển không một người thành thạo chữ Hán-Nôm khi nhìn mặt chữ lại nghĩ đến số nét. Trong bài viết này chúng tôi bàn tới quy trình xây dựng và thống nhất hóa cơ sở tri thức chữ Hán Nôm sau đây gọi là CSTTC . Gọi là cơ sở tri thức là vì ngoài việc là kho chữ tập hợp chữ Nôm với mục từ các nguồn khác nhau CSTTC Hán Nôm còn lưu giữ các thông tin tự đạng hữu ích cho các thao tác công nghệ thông tin ngôn ngữ học từ vựng lịch sử từ vựng học ngữ nghĩa học văn bản học giải nghĩa Việt-Anh . Việc thống nhất và hoàn thiện CSTTC được tiến hành trên một quy trình mới Thành tố với tư cách .