Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Large Scale Acquisition of Paraphrases for Learning Surface Patterns"
tailieunhanh - Báo cáo khoa học: "Large Scale Acquisition of Paraphrases for Learning Surface Patterns"
Paraphrases have proved to be useful in many applications, including Machine Translation, Question Answering, Summarization, and Information Retrieval. Paraphrase acquisition methods that use a single monolingual corpus often produce only syntactic paraphrases. We present a method for obtaining surface paraphrases, using a 150GB (25 billion words) monolingual corpus. Our method achieves an accuracy of around 70% on the paraphrase acquisition task. We further show that we can use these paraphrases to generate surface patterns for relation extraction. Our patterns are much more precise than those obtained by using a state of the art baseline and can extract relations with. | Large Scale Acquisition of Paraphrases for Learning Surface Patterns Rahul Bhagat Information Sciences Institute University of Southern California Marina del Rey CA rahul@ Deepak Ravichandran Google Inc. 1600 Amphitheatre Parkway Mountain View CA deepakr@ Abstract Paraphrases have proved to be useful in many applications including Machine Translation Question Answering Summarization and Information Retrieval. Paraphrase acquisition methods that use a single monolingual corpus often produce only syntactic paraphrases. We present a method for obtaining surface paraphrases using a 150GB 25 billion words monolingual corpus. Our method achieves an accuracy of around 70 on the paraphrase acquisition task. We further show that we can use these paraphrases to generate surface patterns for relation extraction. Our patterns are much more precise than those obtained by using a state of the art baseline and can extract relations with more than 80 precision for each of the test relations. 1 Introduction Paraphrases are textual expressions that convey the same meaning using different surface words. For example consider the following sentences Google acquired YouTube. 1 Google completed the acquisition of YouTube. 2 Since they convey the same meaning sentences 1 and 2 are sentence level paraphrases and the phrases acquired and completed the acquisition of in 1 and 2 respectively are phrasal paraphrases. Paraphrases provide a way to capture the variability of language and hence play an important Work done during an internship at Google Inc. role in many natural language processing NLP applications. For example in question answering paraphrases have been used to find multiple patterns that pinpoint the same answer Ravichandran and Hovy 2002 in statistical machine translation they have been used to find translations for unseen source language phrases Callison-Burch et al. 2006 in multi-document summarization they have been used to identify phrases from different .
Nam Dương
44
9
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Developing Large Web Applications
302
63
0
Applying the noncooperative game model for compensation concept in contractor selection process for large-scale projects
13
23
1
Taxonomic assignment for large scale metagenomic data on high perfomance systems
12
62
0
Study to fabricate the large scale buckypaper based on carbon nanotubes
8
61
0
A study in vibration of a large scale hydraulic cylinder actuator via numerical simulation
5
87
0
New results on finite time stability for nonlinear fractional order large scale systems with time varying delay and interconnections
6
102
0
An approach to the large-scale integration of wind energy in Albania
17
41
1
Robust finite - time supoptimal control of large scale systems with interacted state and control delays
15
47
3
Large scale mimo MC-CDMA system using combined multiple beamforming and spatial multiplexing
11
90
0
2SigFinder: The combined use of smallscale and large-scale statistical testing for genomic island detection from a single genome
15
66
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461928
55
Giới thiệu :Lập trình mã nguồn mở
14
23024
64
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10968
531
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10166
451
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9564
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8362
1127
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8272
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7887
2225
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6808
256
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
6041
1457
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Large Scale Acquisition of Paraphrases
Learning Surface Patterns
Rahul Bhagat
báo cáo khoa học
báo cáo ngôn ngữ
xử lý ngôn ngữ tự nhiên
Bài giảng Xử lý ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên
Kỹ thuật lập trình
Xử lý nhập nhằng ngữ nghĩa
Xử lý ngữ nghĩa
Xử lý ngôn ngữ
Natural Language Processing
Ngôn ngữ lập trình
Nhập nhằng cấu trúc
Tri thức về ngôn ngữ
Mô hình ngôn ngữ
Mô hình n gram
Dịch máy
Phương pháp dịch máy
Hiểu ngôn ngữ
Phân tích ngữ nghĩa
Phân loại tin tự động
Biểu diễn vị từ
Thuộc tính về sự kiện
Thuộc tính về sự kiện
Mô hình ngôn ngữ Google Book N grams
Mô hình ngôn ngữ KenLM
Phương pháp làm mịn
Tách từ tiếng Việt
Gán nhãn từ loại
Phân tích cú pháp
Nghĩa từ vựng
Phân giải nhập nhằng từ
Phân loại văn bản
Lexical chain
Phản hồi thông tin
Bài toán PTCP
Cấu trúc ngữ pháp
Phân tích cú pháp xác suất
CKY kết hợp xác suất
Văn phạm phi ngữ cảnh xác suất
Hình thái học
TÀI LIỆU MỚI ĐĂNG
Đánh giá hao mòn và độ tin cậy của chi tiết và kết cấu trên đầu máy diezel part 3
12
323
0
17-05-2024
GIÁO TRÌNH VI XỬ LÝ 1 - CHƯƠNG 5. LẬP TRÌNH CHO VI ĐIỀU KHIỂN 80C51
23
116
1
17-05-2024
A Practical Guide for Health Researchers - part 7
24
114
0
17-05-2024
báo cáo hóa học:" Journal of the International AIDS Society: an important step forward"
2
90
0
17-05-2024
Quy Trình Canh Tác Cây Bông Vải
8
116
0
17-05-2024
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
128
0
17-05-2024
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
99
0
17-05-2024
Chủ đề 3 : SỰ CÂN BẰNG CỦA VẬT RẮN (4 tiết)
9
141
0
17-05-2024
Những loại nước uống làm răng xỉn màu
4
87
0
17-05-2024
ENOVARA PLC RAPPORT ANNUEL ET ÉTATS FINANCIERS AUDITÉS Pour l’exercice clos le 31 mars 2010_4
10
103
0
17-05-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7887
2225
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
6041
1457
Ebook Chào con ba mẹ đã sẵn sàng
112
3784
1250
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5401
1137
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8362
1127
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3547
656
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10968
531
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3745
527
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4158
523
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4184
483
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.