Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Công Nghệ Thông Tin
Kỹ thuật lập trình
Phrasal semantic distance for Vietnamese textual document retrieval
Đang chuẩn bị liên kết để tải về tài liệu:
Phrasal semantic distance for Vietnamese textual document retrieval
Yên Bằng
108
18
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
In this paper, a computational semantic method is proposed to estimate the phrasal semantic distance used in our model of Vietnamese document retrieval system. The semantic distances between phrases are defined in terms of semantic classes and semantic relations to ensure that it can reflect how different two certain phrases are. | Journal of Computer Science and Cybernetics, V.31, N.3 (2015), 185– 202 DOI: 10.15625/1813-9663/31/3/5923 PHRASAL SEMANTIC DISTANCE FOR VIETNAMESE TEXTUAL DOCUMENT RETRIEVAL DO THI THANH TUYEN† AND NGUYEN TUAN DANG‡ University of Information Technology, VNU-HCM; † tuyendtt@uit.edu.vn; ‡ dangnt@uit.edu.vn Abstract. In this paper, a computational semantic method is proposed to estimate the phrasal semantic distance used in our model of Vietnamese document retrieval system. The semantic distances between phrases are defined in terms of semantic classes and semantic relations to ensure that it can reflect how different two certain phrases are. To estimate the semantic distance, the semantic classes of a phase are identified by using the n-gram model. After identification of the semantic classes, their semantic relations are also identified by using a Vietnamese Lexicon Ontology. This handcrafted ontology contains defined semantic classes and their potential relations in Vietnamese language explicitly. For the evaluation purpose, a phrasal semantic retrieval system has been built to test with a data set of 720 phrases and 30 queries. The evaluation shows the precision of 96.6% and the recall of 78.4% on experiment results. Keywords. Lexicon ontology, phrasal semantic analysis, semantic class, semantic distance, semantic information retrieval. 1. INTRODUCTION Actually, most approaches of modern information retrieval systems are aimed at exploiting semantic features of phrases in both documents and queries to identify which documents are relevant to the user’s needs. In fact, the systems conceived by such approaches are called “semantic information retrieval systems”, which are distinguished from the other information retrieval systems working with documents of semantic web standard as in [1, 2]. In an information retrieval system, the key problem is how to estimate the “semantic similarity” between a keywords based query and each text document. To solve this problem, the
TÀI LIỆU LIÊN QUAN
Phrasal semantic distance for Vietnamese textual document retrieval
Empirical methods for computing phrasal and sentential semantics in Vietnamese
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.