Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
Ánh Trang
73
6
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Distributional similarity is a classic technique for entity set expansion, where the system is given a set of seed entities of a particular class, and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning (PU learning) can model the set expansion problem better. Based on the test results of 10 corpora, we show that a PU learning technique outperformed distributional similarity significantly. . | Distributional Similarity vs. PU Learning for Entity Set Expansion Xiao-Li Li Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 xlli@i2r.a-star.edu.sg Bing Liu University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA liub@cs.uic.edu Abstract Distributional similarity is a classic technique for entity set expansion where the system is given a set of seed entities of a particular class and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning PU learning can model the set expansion problem better. Based on the test results of 10 corpora we show that a PU learning technique outperformed distributional similarity significantly. 1 Introduction The entity set expansion problem is defined as follows Given a set s of seed entities of a particular class and a set D of candidate entities e.g. extracted from a text corpus we wish to determine which of the entities in D belong to s. In other words we expand the set s based on the given seeds. This is clearly a classification problem which requires arriving at a binary decision for each entity in D belonging to s or not . However in practice the problem is often solved as a ranking problem i.e. ranking the entities in D based on their likelihoods of belonging to s. The classic method for solving this problem is based on distributional similarity Pantel et al. 2009 Lee 1998 . The approach works by comparing the similarity of the surrounding word distributions of each candidate entity with the seed entities and then ranking the candidate entities using their similarity scores. Lei Zhang University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA zhang3@cs.uic.edu See-Kiong Ng Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 skng@i2r.a-star.edu.sg In .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Measures of Distributional Similarity"
Báo cáo khoa học: "Verb Classification using Distributional Similarity in Syntactic and Semantic Structures"
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
Báo cáo khoa học: "Reducing semantic drift with bagging and distributional similarity"
Báo cáo khoa học: "Directional Distributional Similarity for Lexical Expansion"
Báo cáo khoa học: "Syntax is from Mars while Semantics from Venus! Insights from Spectral Analysis of Distributional Similarity Networks"
Báo cáo khoa học: "Scaling Distributional Similarity to Large Corpora"
Báo cáo khoa học: "Exploring Distributional Similarity Based Models for Query Spelling Correction"
Báo cáo khoa học: "Integrating Pattern-based and Distributional Similarity Methods for Lexical Entailment Acquisition"
Báo cáo khoa học: "Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.