Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Using Mutual Information to Resolve Query Translation Ambiguities and Query Term Weighting"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Using Mutual Information to Resolve Query Translation Ambiguities and Query Term Weighting"
Khải Tâm
73
7
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
An easy way of translating queries in one language to the other for cross-language information retrieval (IR) is to use a simple bilingual dictionary. Because of the generalpurpose nature of such dictionaries, however, this simple method yields a severe translation ambiguity problem. This paper describes the degree to which this problem arises in Korean-English cross-language IR and suggests a relatively simple yet effective method for disambiguation using mutual information statistics obtained only from the target document collection. . | Using Mutual Information to Resolve Query Translation Ambiguities and Query Term Weighting 1 Myung-Gil Jang 2 Sung Hyon Myaeng and 1 Se Young Park 1 Dept of Knowledge Information Electronics and Telecommunications Research Institute 161 Kajong-Dong Yusong-Gu Taejon Korea 305-350 mgjang sypark @etri.re.kr Abstract An easy way of translating queries in one language to the other for cross-language information retrieval IR is to use a simple bilingual dictionary. Because of the general-purpose nature of such dictionaries however this simple method yields a severe translation ambiguity problem. This paper describes the degree to which this problem arises in Korean-English cross-language IR and suggests a relatively simple yet effective method for disambiguation using mutual information statistics obtained only from the target document collection. In this method mutual information is used not only to select the best candidate but also to assign a weight to query terms in the target language. Our experimental results based on the TREC 6 collection shows that this method can achieve up to 85 of the monolingual retrieval case and 96 of the manual disambiguation case. Introduction Cross-language information retrieval IR enables a user to retrieve documents written in diverse languages using queries expressed in his or her own language. For cross-language IR either queries or documents are translated to overcome the language differences. Although it is possible to apply a high-quality machine translation system for documents as in Oard Hackett 1997 query translation has emerged as a more popular method because it is much simpler and more economical compared to document translation. Query translation can be 2 Dept of Computer Science Chungnam National University 220 Gung-Dong Yusong-Gu Taejon Korea 305-764 shmyaeng @ cs.chungnam.ac .kr done in one or more of the three approaches a dictionary-based approach a thesaurus-based approach or a corpus-based approach. There are three
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: " Using the reduced La(Co,Cu)O3 nanoperovskites as catalyst precursors for CO hydrogenation"
báo cáo khoa học: " Improving benchmarking by using an explicit framework for the development of composite indicators: an example using pediatric quality of care"
Báo cáo y học: "Improving benchmarking by using an explicit framework for the development of composite indicators: an example using pediatric quality of care"
Báo cáo y học: "The effectiveness of hand-disinfection by a flow water system using electrolytic products of sodium chloride, compared with a conventional method using alcoholic solution in an"
BÁO CÁO NGHIÊN CỨU KHOA HỌC KỸ THUẬT: 75 USING IN VITRO PROPAGATION TO PRESERVE Glyptostrobus pensilis (Staunton ex.)
Báo cáo khoa học: "Grammar Error Correction Using Pseudo-Error Sentences and Domain Adaptation"
Báo cáo khoa học: "Historical Change in Language Using Monte Carlo Techniques"
Báo cáo khoa học: "Multilingual Named Entity Recognition using Parallel Data and Metadata from Wikipedia"
Báo cáo khoa học: "Classifying French Verbs Using French and English Lexical Resources"
Báo cáo khoa học: "Text Segmentation by Language Using Minimum Description Length"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.