Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Exploiting Bilingual Information to Improve Web Search"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Exploiting Bilingual Information to Improve Web Search"
Nhất Tiến
79
9
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Web search quality can vary widely across languages, even for the same information need. We propose to exploit this variation in quality by learning a ranking function on bilingual queries: queries that appear in query logs for two languages but represent equivalent search interests. For a given bilingual query, along with corresponding monolingual query log and monolingual ranking, we generate a ranking on pairs of documents, one from each language. Then we learn a linear ranking function which exploits bilingual features on pairs of documents, as well as standard monolingual features. . | Exploiting Bilingual Information to Improve Web Search Wei Gao1 John Blitzer2 Ming Zhou3 and Kam-Fai Wong1 1The Chinese University of Hong Kong Shatin N.T. Hong Kong China wgao kfwong @se.cuhk.edu.hk 2Computer Science Division University of California at Berkeley CA 94720-1776 USA blitzer@cs.berkeley.edu 3Microsoft Research Asia Beijing 100190 China mingzhou@microsoft.com Abstract Web search quality can vary widely across languages even for the same information need. We propose to exploit this variation in quality by learning a ranking function on bilingual queries queries that appear in query logs for two languages but represent equivalent search interests. For a given bilingual query along with corresponding monolingual query log and monolingual ranking we generate a ranking on pairs of documents one from each language. Then we learn a linear ranking function which exploits bilingual features on pairs of documents as well as standard monolingual features. Finally we show how to reconstruct monolingual ranking from a learned bilingual ranking. Using publicly available Chinese and English query logs we demonstrate for both languages that our ranking technique exploiting bilingual data leads to significant improvements over a state-of-the-art monolingual ranking algorithm. 1 Introduction Web search quality can vary widely across languages even for a single query and search engine. For example we might expect that ranking search results for the query ft ft w ft Thomas Hobbes to be more difficult in Chinese than it is in English even while holding the basic ranking function constant. At the same time ranking search results for the query Han Feizi ftft is likely to be harder in English than in Chinese. A large portion of web queries have such properties that they are originated in a language different from the one they are searched. This variance in problem difficulty across languages is not unique to web search it appears in a wide range of natural language processing
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Exploiting Latent Information to Predict Diffusions of Novel Topics on Social Networks"
Báo cáo khoa học: "Online Plagiarism Detection Through Exploiting Lexical, Syntactic, and Semantic Information"
Báo cáo khoa học: "Exploiting Multiple Treebanks for Parsing with Quasi-synchronous Grammars"
Báo cáo khoa học: Exploiting Social Information in Grounded Language Learning via Grammatical Reductions""
Báo cáo khoa học: "Exploiting Web-Derived Selectional Preference to Improve Statistical Dependency Parsing"
Báo cáo khoa học: "Improving Question Recommendation by Exploiting Information Need"
Báo cáo khoa học: "Exploiting Morphology in Turkish Named Entity Recognition System"
Báo cáo khoa học: "Exploiting Readymades in Linguistic Creativity: A System Demonstration of the Jigsaw Bard"
Báo cáo khoa học: "Exploiting Heterogeneous Treebanks for Parsing"
Báo cáo khoa học: "Exploiting Bilingual Information to Improve Web Search"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.