Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "A Graph Approach to Spelling Correction in Domain-Centric Search"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "A Graph Approach to Spelling Correction in Domain-Centric Search"
Tường Minh
85
10
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Spelling correction for keyword-search queries is challenging in restricted domains such as personal email (or desktop) search, due to the scarcity of query logs, and due to the specialized nature of the domain. For that task, this paper presents an algorithm that is based on statistics from the corpus data (rather than the query log). This algorithm, which employs a simple graph-based approach, can incorporate different types of data sources with different levels of reliability (e.g., email subject vs. email body), and can handle complex spelling errors like splitting and merging of words. . | A Graph Approach to Spelling Correction in Domain-Centric Search Zhuowei Bao University of Pennsylvania Philadelphia PA 19104 USA zhuowei@cis.upenn.edu Benny Kimelfeld IBM Research-Almaden San Jose CA 95120 USA kimelfeld@us.ibm.com Yunyao Li IBM Research-Almaden San Jose CA 95120 USA yunyaoli@us.ibm.com Abstract Spelling correction for keyword-search queries is challenging in restricted domains such as personal email or desktop search due to the scarcity of query logs and due to the specialized nature of the domain. For that task this paper presents an algorithm that is based on statistics from the corpus data rather than the query log . This algorithm which employs a simple graph-based approach can incorporate different types of data sources with different levels of reliability e.g. email subject vs. email body and can handle complex spelling errors like splitting and merging of words. An experimental study shows the superiority of the algorithm over existing alternatives in the email domain. 1 Introduction An abundance of applications require spelling correction which at the high level is the following task. The user intends to type a chunk q of text but types instead the chunk s that contains spelling errors which we discuss in detail later due to uncareful typing or lack of knowledge of the exact spelling of q. The goal is to restore q when given s. Spelling correction has been extensively studied in the literature and we refer the reader to comprehensive summaries of prior work Peterson 1980 Kukich 1992 Jurafsky and Martin 2000 Mitton 2010 . The focus of this paper is on the special case where q is a search query and where s instead of q is submitted to a search engine with the goal of retrieving documents that match the search query q . Spelling correction for search queries is important because a significant portion of posed queries may be misspelled Cucerzan and Brill 2004 . Effective 905 spelling correction has a major effect on the experience and effort .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Graph Branch Algorithm: An Optimum Tree Search Method for Scored Dependency Graph with Arc Co-occurrence Constraints"
Báo cáo toán học: "Graph Powers and Graph Homomorphism"
Báo cáo toán học: " The tau constant of a metrized graph and its behavior under graph operations"
Báo cáo khoa học: "Bootstrapping via Graph Propagation"
Báo cáo khoa học: "A Graph-based Cross-lingual Projection Approach for Weakly Supervised Relation Extraction"
Báo cáo khoa học: "Efficient Tree-based Approximation for Entailment Graph Learning"
Báo cáo khoa học: "Utilizing Dependency Language Models for Graph-based Dependency Parsing Models"
Báo cáo khoa học: "Graph-based Semi-Supervised Learning Algorithms for NLP"
Báo cáo khoa học: "Tweet Recommendation with Graph Co-Ranking"
Báo cáo khoa học: "A Unified Graph Model for Sentence-based Opinion Retrieval"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.