Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Detecting Errors in Discontinuous Structural Annotation"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Detecting Errors in Discontinuous Structural Annotation"
Thu Hà
77
8
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Consistency of corpus annotation is an essential property for the many uses of annotated corpora in computational and theoretical linguistics. While some research addresses the detection of inconsistencies in positional annotation (e.g., partof-speech) and continuous structural annotation (e.g., syntactic constituency), no approach has yet been developed for automatically detecting annotation errors in discontinuous structural annotation. This is significant since the annotation of potentially discontinuous stretches of material is increasingly relevant, from treebanks for free-word order languages to semantic and discourse annotation. . | Detecting Errors in Discontinuous Structural Annotation Markus Dickinson Department of Linguistics The Ohio State University dickinso@ling.osu.edu W. Detmar Meurers Department of Linguistics The Ohio State University dm@ling.osu.edu Abstract Consistency of corpus annotation is an essential property for the many uses of annotated corpora in computational and theoretical linguistics. While some research addresses the detection of inconsistencies in positional annotation e.g. part-of-speech and continuous structural annotation e.g. syntactic constituency no approach has yet been developed for automatically detecting annotation errors in discontinuous structural annotation. This is significant since the annotation of potentially discontinuous stretches of material is increasingly relevant from treebanks for free-word order languages to semantic and discourse annotation. In this paper we discuss how the variation n-gram error detection approach Dickinson and Meurers 2003a can be extended to discontinuous structural annotation. We exemplify the approach by showing how it successfully detects errors in the syntactic annotation of the German TIGER corpus Brants et al. 2002 . 1 Introduction Annotated corpora have at least two kinds of uses firstly as training material and as gold standard testing material for the development of tools in computational linguistics and secondly as a source of data for theoretical linguists searching for analytically relevant language patterns. Annotation errors and why they are a problem The high quality annotation present in gold standard corpora is generally the result of a manual or semi-automatic mark-up process. The annotation thus can contain annotation errors from automatic pre- processes human post-editing or human annotation. The presence of errors creates problems for both computational and theoretical linguistic uses from unreliable training and evaluation of natural language processing technology e.g. van Halteren 2000 Kveton and .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A System for Detecting Subgroups in Online Discussions"
Báo cáo khoa học: "Detecting Semantic Equivalence and Information Disparity in Cross-lingual Documents"
Báo cáo khoa học: "Detecting Errors in Automatically-Parsed Dependency Relations"
Báo cáo khoa học: "Detecting Experiences from Weblogs"
Báo cáo khoa học: "Peeling Back the Layers: Detecting Event Role Fillers in Secondary Contexts"
Báo cáo khoa học: "Detecting Compositionality in Multi-Word Expressions"
Báo cáo khoa học: "A Feedback-Augmented Method for Detecting Errors in the Writing of Learners of English"
Báo cáo khoa học: "Detecting Erroneous Sentences using Automatically Mined Sequential Patterns"
Báo cáo khoa học: "Detecting Semantic Relations between Named Entities in Text Using Contextual Features"
Báo cáo khoa học: "Detecting Errors in Discontinuous Structural Annotation"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.