Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations"
Bạch Vân
72
9
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
We propose using large-scale clustering of dependency relations between verbs and multiword nouns (MNs) to construct a gazetteer for named entity recognition (NER). Since dependency relations capture the semantics of MNs well, the MN clusters constructed by using dependency relations should serve as a good gazetteer. However, the high level of computational cost has prevented the use of clustering for constructing gazetteers. | Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations Jun ichi Kazama Japan Advanced Institute of Science and Technology JAIST Asahidai 1-1 Nomi Ishikawa 923-1292 Japan kazama@jaist.ac.jp Kentaro Torisawa National Institute of Information and Communications Technology NICT 3-5 Hikaridai Seika-cho Soraku-gun Kyoto 619-0289 Japan torisawa@nict.go.jp Abstract We propose using large-scale clustering of dependency relations between verbs and multiword nouns MNs to construct a gazetteer for named entity recognition NER . Since dependency relations capture the semantics of MNs well the MN clusters constructed by using dependency relations should serve as a good gazetteer. However the high level of computational cost has prevented the use of clustering for constructing gazetteers. We parallelized a clustering algorithm based on expectationmaximization EM and thus enabled the construction of large-scale MN clusters. We demonstrated with the IREX dataset for the Japanese NER that using the constructed clusters as a gazetteer cluster gazetteer is a effective way of improving the accuracy of NER. Moreover we demonstrate that the combination of the cluster gazetteer and a gazetteer extracted from Wikipedia which is also useful for NER can further improve the accuracy in several cases. 1 Introduction Gazetteers or entity dictionaries are important for performing named entity recognition NER accurately. Since building and maintaining high-quality gazetteers by hand is very expensive many methods have been proposed for automatic extraction of gazetteers from texts Riloff and Jones 1999 Thelen and Riloff 2002 Etzioni et al. 2005 Shinzato et al. 2006 Talukdar et al. 2006 Nadeau et al. 2006 . Most studies using gazetteers for NER are based on the assumption that a gazetteer is a mapping from a multi-word noun MN 1 to named entity categories such as Tokyo Stock Exchange ORGANIZATION .2 However since the correspondence between the labels and
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Inducing Domain-specific Semantic Class Taggers from (Almost) Nothing"
Báo cáo khoa học: "TrustRank: Inducing Trust in Automatic Translations via Ranking"
Báo cáo khoa học: "Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations"
Báo cáo khoa học: "Inducing Word Alignments with Bilexical Synchronous Trees"
Báo cáo khoa học: "Inducing Combinatory Categorial Grammars with Genetic Algorithms"
Báo cáo khoa học: "Inducing Ontological Co-occurrence Vectors"
Báo cáo khoa học: "Inducing Frame Semantic Verb Classes from WordNet and LDOCE"
Báo cáo khoa học: "Exploiting Aggregate Properties of Bilingual Dictionaries For Distinguishing Senses of English Words and Inducing English Sense Clusters"
Báo cáo khoa học: "Inducing Probabilistic Syllable Classes Using Multivariate Clustering"
Báo cáo khoa học: "Inducing a Semantically Annotated Lexicon via EM-Based Clustering"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.