Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Large Scale Acquisition of Paraphrases for Learning Surface Patterns"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Large Scale Acquisition of Paraphrases for Learning Surface Patterns"
Nam Dương
46
9
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Paraphrases have proved to be useful in many applications, including Machine Translation, Question Answering, Summarization, and Information Retrieval. Paraphrase acquisition methods that use a single monolingual corpus often produce only syntactic paraphrases. We present a method for obtaining surface paraphrases, using a 150GB (25 billion words) monolingual corpus. Our method achieves an accuracy of around 70% on the paraphrase acquisition task. We further show that we can use these paraphrases to generate surface patterns for relation extraction. Our patterns are much more precise than those obtained by using a state of the art baseline and can extract relations with. | Large Scale Acquisition of Paraphrases for Learning Surface Patterns Rahul Bhagat Information Sciences Institute University of Southern California Marina del Rey CA rahul@isi.edu Deepak Ravichandran Google Inc. 1600 Amphitheatre Parkway Mountain View CA deepakr@google.com Abstract Paraphrases have proved to be useful in many applications including Machine Translation Question Answering Summarization and Information Retrieval. Paraphrase acquisition methods that use a single monolingual corpus often produce only syntactic paraphrases. We present a method for obtaining surface paraphrases using a 150GB 25 billion words monolingual corpus. Our method achieves an accuracy of around 70 on the paraphrase acquisition task. We further show that we can use these paraphrases to generate surface patterns for relation extraction. Our patterns are much more precise than those obtained by using a state of the art baseline and can extract relations with more than 80 precision for each of the test relations. 1 Introduction Paraphrases are textual expressions that convey the same meaning using different surface words. For example consider the following sentences Google acquired YouTube. 1 Google completed the acquisition of YouTube. 2 Since they convey the same meaning sentences 1 and 2 are sentence level paraphrases and the phrases acquired and completed the acquisition of in 1 and 2 respectively are phrasal paraphrases. Paraphrases provide a way to capture the variability of language and hence play an important Work done during an internship at Google Inc. role in many natural language processing NLP applications. For example in question answering paraphrases have been used to find multiple patterns that pinpoint the same answer Ravichandran and Hovy 2002 in statistical machine translation they have been used to find translations for unseen source language phrases Callison-Burch et al. 2006 in multi-document summarization they have been used to identify phrases from different .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Large-Scale Syntactic Language Modeling with Treelets"
Báo cáo khoa học: "Joint Feature Selection in Distributed Stochastic Learning for Large-Scale Discriminative Training in SMT"
Báo cáo khoa học: "A Discriminative Hierarchical Model for Fast Coreference at Large Scale"
Báo cáo khoa học: "Practical very large scale CRFs"
Báo cáo khoa học: "Bucking the Trend: Large-Scale Cost-Focused Active Learning for Statistical Machine Translation"
Báo cáo khoa học: "A Large Scale Distributed Syntactic, Semantic and Lexical Language Model for Machine Translation"
Báo cáo khoa học: "Semi-supervised Relation Extraction with Large-scale Word Clustering"
Báo cáo khoa học: "Large-Scale Cross-Document Coreference Using Distributed Inference and Hierarchical Models "
Báo cáo khoa học: "Efficient Inference of CRFs for Large-Scale Natural Language Data"
Báo cáo khoa học: "Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.