tailieunhanh - Bài giảng Thư viện số: Chương 3 - TS. Đỗ Quang Vinh

Bài giảng Thư viện số: Chương 3 có nội dung giới thiệu về chỉ mục tài liệu văn bản do TS. Đỗ Quang Vinh biên soạn. Các kiến thức về các mô hình nén IFID, so sánh các phương pháp chỉ mục, chỉ mục tệp ký số SFID, Văn bản mẫu,. sẽ được giới thiệu trong chương 3. Tham khảo tài liệu để nắm bắt nội dung cụ thể. | BÀI GIẢNG THƯ VIỆN SỐ CHƯƠNG 3: CHỈ MỤC TÀI LIỆU VĂN BẢN TS. ĐỖ QUANG VINH HÀ NỘI - 2013 NỘI DUNG TỔNG QUAN VỀ THƯ VIỆN SỐ DL MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL CHỈ MỤC TÀI LIỆU TÌM KIẾM THÔNG TIN CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE CHỈ MỤC TÀI LIỆU VĂN BẢN MỞ ĐẦU Định nghĩa (từ để nhận dạng đối với chỉ mục): là một dãy cực đại của các ký tự chữ và số, nhưng giới hạn tối đa 256 ký tự và tối đa 4 ký tự số Bảng - CSDL TREC Số tài liệu N 741856 Số thuật ngữ F 333338738 Số thuật ngữ riêng biệt n 535346 Số con trỏ chỉ mục f 134994414 Kích thước tổng (MB) CHỈ MỤC TỆP ĐẢO IFID Định nghĩa (Đỗ Trung Tuấn): Chỉ mục là bảng dữ liệu hay cấu trúc dữ liệu dùng để xác định vị trí của các dòng trong tệp theo điều kiện nào đó Định nghĩa (Folk ., Zoellick B., Riccardi G.): Chỉ mục là một cách tìm kiếm thông tin Định nghĩa : Chỉ mục là một cơ chế nhằm định vị thuật ngữ cho trước trong văn bản Định nghĩa | BÀI GIẢNG THƯ VIỆN SỐ CHƯƠNG 3: CHỈ MỤC TÀI LIỆU VĂN BẢN TS. ĐỖ QUANG VINH HÀ NỘI - 2013 NỘI DUNG TỔNG QUAN VỀ THƯ VIỆN SỐ DL MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL CHỈ MỤC TÀI LIỆU TÌM KIẾM THÔNG TIN CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE CHỈ MỤC TÀI LIỆU VĂN BẢN MỞ ĐẦU Định nghĩa (từ để nhận dạng đối với chỉ mục): là một dãy cực đại của các ký tự chữ và số, nhưng giới hạn tối đa 256 ký tự và tối đa 4 ký tự số Bảng - CSDL TREC Số tài liệu N 741856 Số thuật ngữ F 333338738 Số thuật ngữ riêng biệt n 535346 Số con trỏ chỉ mục f 134994414 Kích thước tổng (MB) CHỈ MỤC TỆP ĐẢO IFID Định nghĩa (Đỗ Trung Tuấn): Chỉ mục là bảng dữ liệu hay cấu trúc dữ liệu dùng để xác định vị trí của các dòng trong tệp theo điều kiện nào đó Định nghĩa (Folk ., Zoellick B., Riccardi G.): Chỉ mục là một cách tìm kiếm thông tin Định nghĩa : Chỉ mục là một cơ chế nhằm định vị thuật ngữ cho trước trong văn bản Định nghĩa (chỉ mục tệp đảo IFID): Đối với mỗi một thuật ngữ trong từ điển, một IF chứa một danh sách đảo (IL) lưu trữ một danh sách con trỏ tới tất cả xuất hiện của thuật ngữ đó trong văn bản chính, trong đó mỗi một con trỏ trong thực tế là số tài liệu mà thuật ngữ đó xuất hiện. IL đôi khi được coi là một danh sách mục lục và các con trỏ là mục lục Đây là phương pháp chỉ mục tự nhiên nhất, gần tương ứng với chỉ mục của một cuốn sách và với cách dùng mục lục truyền thống Bảng - Văn bản mẫu; mỗi dòng là một tài liệu TÀI LIỆU VĂN BẢN 1 Information retrieval is searching and indexing 2 Indexing is building an index 3 An inverted file is an index 4 Building an inverted file is indexing Bảng - IF đối với văn bản của bảng Số Thuật ngữ IL(tài liệu; vị trí) 1 an (2;4), (3;1), (3;5), (4;2) 2 and (1;5) 3 building (2;3), (4;1) 4 file (3;3), (4;4) 5 index (2;5), (3;6) 6 indexing (1;6), (2;1), (4;6) 7 information (1;1) 8 inverted (3;2), (4;3) 9 is (1;3), (2;2), (3;4), (4;5) 10 .

TỪ KHÓA LIÊN QUAN
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.