Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Probabilistic Hierarchical Clustering of Morphological Paradigms"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Probabilistic Hierarchical Clustering of Morphological Paradigms"
Bảo Giang
84
10
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
We propose a novel method for learning morphological paradigms that are structured within a hierarchy. The hierarchical structuring of paradigms groups morphologically similar words close to each other in a tree structure. This allows detecting morphological similarities easily leading to improved morphological segmentation. Our evaluation using (Kurimo et al., 2011a; Kurimo et al., 2011b) dataset shows that our method performs competitively when compared with current state-ofart systems. | Probabilistic Hierarchical Clustering of Morphological Paradigms Burcu Can Department of Computer Science University of York Heslington York YO10 5GH UK burcucan@gmail.com Suresh Manandhar Department of Computer Science University of York Heslington York YO10 5GH UK suresh@cs.york.ac.uk Abstract We propose a novel method for learning morphological paradigms that are structured within a hierarchy. The hierarchical structuring of paradigms groups morphologically similar words close to each other in a tree structure. This allows detecting morphological similarities easily leading to improved morphological segmentation. Our evaluation using Kurimo et al. 2011a Kurimo et al. 2011b dataset shows that our method performs competitively when compared with current state-of-art systems. 1 Introduction Unsupervised morphological segmentation of a text involves learning rules for segmenting words into their morphemes. Morphemes are the smallest meaning bearing units of words. The learning process is fully unsupervised using only raw text as input to the learning system. For example the word respectively is split into morphemes respect ive and ly. Many fields such as machine translation information retrieval speech recognition etc. require morphological segmentation since new words are always created and storing all the word forms will require a massive dictionary. The task is even more complex when morphologically complicated languages i.e. agglutinative languages are considered. The sparsity problem is more severe for more morphologically complex languages. Applying morphological segmentation mitigates data sparsity by tackling the issue with out-of-vocabulary OOV words. In this paper we propose a paradigmatic approach. A morphological paradigm is a pair StemList SuffixList such that each concatenation of Stem Suffix where Stem G StemList and Suffix G SuffixList is a valid word form. The learning of morphological paradigms is not novel as there has already been existing work .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A Probabilistic Model for Fine-Grained Expert Search"
Báo cáo khoa học: "A Probabilistic Model for Canonicalizing Named Entity Mentions"
Báo cáo khoa học: "Probabilistic Integration of Partial Lexical Information for Noise Robust Haptic Voice Recognition"
Báo cáo khoa học: "A systematic understanding of probabilistic semantic extraction in large corpus"
Báo cáo khoa học: "Enhanced word decomposition by calibrating the decision threshold of probabilistic models and using a model ensemble"
Báo cáo khoa học: "Authorship Attribution Using Probabilistic Context-Free Grammars"
Báo cáo khoa học: "A Probabilistic Modeling Framework for Lexical Entailment"
Báo cáo khoa học: "A Scalable Probabilistic Classifier for Language Modeling"
Báo cáo khoa học: "Probabilistic Document Modeling for Syntax Removal in Text Summarization"
Báo cáo khoa học: "Compiling a Massive, Multilingual Dictionary via Probabilistic Inference"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.