tailieunhanh - Ứng dụng mô hình BERT cho bài toán phân loại hồ sơ theo thời hạn bảo quản

Bài viết trình bày nghiên cứu đánh giá sự hiệu quả của mô hình BERT so sánh với các thuật toán máy học truyền thống và mô hình học sâu trên các bộ dữ liệu thực tế hồ sơ lưu trữ theo thời hạn bảo quản ở các cơ quan. | TNU Journal of Science and Technology 226 07 41 - 49 APPLICATION OF BERT ARCHITECTURE FOR STORAGE TIME OF RECORD CLASSIFICATION PROBLEM Ton Nu Thi Sau Tran Quoc Toanh Hanoi University of Home Affairs Campus in HCM City ARTICLE INFO ABSTRACT Received 06 02 2021 Record storage at the competent agencies and organizations is an essential problem in the management and organization of document Revised 19 4 2021 preservation. However with the increasing number of archives and Published 04 5 2021 many different types of documents leading to overloading documents during the archiving process. Therefore the classification of records KEYWORDS according to the preservation period is a very important step in preservation contributing to optimize the composition of the archive BERT architecture fonts and save the cost of document Therefore in this paper we Machine learning present a study evaluating the effectiveness of the BERT model Deep learning compared with traditional machine learning and deep learning algorithms on a real-world dataset to solve this task automatically. Record classification Experimental results show that the BERT model achieved the best Text classification results with of precision of recall and of F1- score. This result shows that the BERT model can be applied to build systems to support record classification in the real-world application is completely feasible. ỨNG DỤNG MÔ HÌNH BERT CHO BÀI TOÁN PHÂN LOẠI HỒ SƠ THEO THỜI HẠN BẢO QUẢN Tôn Nữ Thị Sáu Trần Quốc Toanh Phân hiệu Trường Đại học Nội vụ Hà Nội tại TP. Hồ Chí Minh THÔNG TIN BÀI BÁO TÓM TẮT Ngày nhận bài 06 02 2021 Công tác lưu trữ hồ sơ tại các cơ quan tổ chức có thẩm quyền là một vấn đề cần thiết trong việc quản lý và tổ chức bảo quản tài liệu. Tuy Ngày hoàn thiện 19 4 2021 nhiên hiện nay với số lượng hồ sơ lưu trữ ngày càng nhiều và có Ngày đăng 04 5 2021 nhiều loại văn bản quy định lưu trữ khác nhau dẫn đến việc tình trạng quá tải tài liệu trong quá trình lưu trữ. Do đó .

TỪ KHÓA LIÊN QUAN