tailieunhanh - Phần mềm phát hiện sao chép luận văn Đại học Cửu Long

Bài viết đề xuất một giải pháp phát hiện sao chép luận văn dựa trên các kỹ thuật của lĩnh vực tìm kiếm thông tin. Việc kiểm chứng luận văn có được sao chép hay không dựa trên hai nguồn là cơ sở dữ liệu (CSDL) cục bộ và trực tuyến. Việc kiểm tra được thực hiện ở mức câu vì đây là hình thức phổ biến nhất. | TẠP CHÍ KHOA HỌC ĐẠI HỌC cửu LONG Số 11 năm 2018 PHÀN MỀM PHÁT HIỆN SAO CHÉP LUẬN VĂN ĐẠI HỌC CỬU LONG Trần Lam Quyên Trần Thị Thúy TÓM TẮT Trong bài báo này chúng tôi đề xuất một giải pháp phát hiện sao chép luận văn dựa trên các kỹ thuật của lĩnh vực tìm kiếm thông tin. việc kiểm chứng luận văn có được sao chép hay không dựa trên hai nguồn là cơ sở dữ liệu CSDL cục bộ và trực tuyển. Việc kiểm tra được thực hiện ở mức câu vì đây là hình thức phổ biến nhất. Đổi với việc kiểm tra trực tuyến chúng tôi thực hiện truy vẩn bộ mảy tìm kiếm google để tìm các tài liệu có thể bị sao chép và sử dụng độ đo Jaccard để tính điểm sự giong nhau giữa hai câu. Đổi với CSDL cục bộ chúng tôi sử dụng hệ quản trị CSDL MongoDB để lưu chỉ mục nghịch đảo nguồn CSDL cục bộ và sử dụng độ đo Cosine để xác định điểm tương đồng giữa hai câu. Hệ thống có khả năng tìm được các câu có khả năng sao chép từ nguồn khác và đồng thời loại bỏ được câu sao chép với câu trích dan. Ket quả thực nghiệm cho thấy giải pháp mà chúng tôi đề xuất mang lại hiệu quả cao trong thực tế. ABSTRACT This paper proposes a plagiarism detection software which based on the information retrieval techniques. The thesis plagiarism is commonly verified by two basic resources local and online databases. The copy will be checked at sentence level because this is the most common copied form. To detect the plagiarism online the system will initially run a query on the searching engine Google to find the documents where plagiarism may derive from and then the Jaccard measure is used to compute the similarity between two sentences. In terms of local resources the MongoDB database is used to store the inverse index and the Cosine measure is simultaneously used to compute the similarity between two sentences. The study results showed that the proposed software is effectively applied in reality. 1. Cơ sở khoa học và thực tiễn Tình trạng sao chép hiện nay đang là một vấn nạn có một bộ phận xem việc sao chép là bình thường. Tại hội nghị

TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.