Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "A Practical Classification of Multiword Expressions"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "A Practical Classification of Multiword Expressions"
Hữu Từ
47
6
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
The paper proposes a methodology for dealing with multiword expressions in natural language processing applications. It provides a practically justified taxonomy of such units, and suggests the ways in which the individual classes can be processed computationally. While the study is currently limited to Polish and English, we believe our findings can be successfully employed in the processing of other languages, with emphasis on inflectional ones. | A Practical Classification of Multiword Expressions Radoslaw Moszczynski Institute of Computer Science Polish Academy of Sciences Ordona 21 01-237 Warszawa Poland rm@ipipan.waw.pl Abstract The paper proposes a methodology for dealing with multiword expressions in natural language processing applications. It provides a practically justified taxonomy of such units and suggests the ways in which the individual classes can be processed computationally. While the study is currently limited to Polish and English we believe our findings can be successfully employed in the processing of other languages with emphasis on inflectional ones. 1 Introduction radoslaw moszczynskilt is generally acknowledged that multiword expressions constitute a serious difficulty in all kinds of natural language processing applications Sag et al. 2002 . It has also been shown that proper handling of such expressions can result in significantly better results in parsing Zhang et al. 2006 . The difficulties in processing multiword expressions result from their lexical variability and the fact that many of them can undergo syntactic transformations. Another problem is that the label multiword expressions covers many linguistic units that often have little in common. We believe that the past approaches to formalize the phenomenon such as IDAREX Segond and Breidt 1995 and Phrase Manager Pedrazzini 1994 suffered from trying to cover all multiword expressions as a whole. Such an approach as is shown below cannot efficiently cover all the phenomena related to multiword expressions. Therefore in the present paper we formulate a proposal of a taxonomy for multiword expressions useful for the purposes of natural language processing. The taxonomy is based on the stages in the NLP workflow in which the individual classes of units can be processed successfully. We also suggest the tools that can be used for processing the units in each of the classes. 2 An NLP Taxonomy of Multiword Expressions At this stage
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Practical very large scale CRFs"
Báo cáo khoa học: "State-of-the-art NLP Approaches to Coreference Resolution: Theory and Practical Recipes
Báo cáo khoa học: "Building Practical Spoken Dialog Systems"
Báo cáo khoa học: " A Practical Korean Question Answering Framework for Restricted Domain"
Báo cáo khoa học: "A Practical Classification of Multiword Expressions"
Báo cáo khoa học: "A Practical Solution to the Problem of Automatic Part-of-Speech Induction from Text"
Báo cáo khoa học: "Transonics: A Practical Speech-to-Speech Translator for English-Farsi Medical Dialogues"
Báo cáo khoa học: "A Practical Solution to the Problem of Automatic Word Sense Induction"
Báo cáo khoa học: "Automatic clustering of collocation for detecting practical sense boundary"
Báo cáo khoa học: "Practical Issues in Compiling Typed Unification Grammars for Speech Recognition"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.