Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
tailieunhanh - Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
Annotated corpora are essential for almost all NLP applications. Whereas they are expected to be of a very high quality because of their importance for the followup developments, they still contain a considerable number of errors. With this work we want to draw attention to this fact. Additionally, we try to estimate the amount of errors and propose a method for their automatic correction. | Automatic Detection and Correction of Errors in Dependency Treebanks Alexander Volokh DFKI Stuhlsatzenhausweg 3 66123 Saarbrucken Germany Gunter Neumann DFKI Stuhlsatzenhausweg 3 66123 Saarbrucken Germany neumann@ Abstract Annotated corpora are essential for almost all NLP applications. Whereas they are expected to be of a very high quality because of their importance for the followup developments they still contain a considerable number of errors. With this work we want to draw attention to this fact. Additionally we try to estimate the amount of errors and propose a method for their automatic correction. Whereas our approach is able to find only a portion of the er -rors that we suppose are contained in almost any annotated corpus due to the nature of the process of its creation it has a very high pre -cision and thus is in any case beneficial for the quality of the corpus it is applied to. At last we compare it to a different method for error detection in treebanks and find out that the errors that we are able to detect are mostly different and that our approaches are complementary. 1 Introduction Treebanks and other annotated corpora have become essential for almost all NLP applications. Papers about corpora like the Penn Treebank 1 have thousands of citations since most of the algorithms profit from annotated data during the development and testing and thus are widely used in the field. Treebanks are therefore expected to be of a very high quality in order to guarantee reliability for their theoretical and practical uses. The construction of an annotated corpus involves a lot of work performed by large groups. However despite the fact that a lot of human post-editing and automatic quality assurance is done errors can not be avoided completely 5 . 346 In this paper we propose an approach for finding and correcting errors in dependency treebanks. We apply our method to the English dependency corpus - conversion of the Penn .
Ðoan Trang
53
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Design and development of an automatic three-phase sequence reversal detection and correction for industrial equipment structure
10
62
1
Báo cáo khoa học: "Automatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation Scopes"
5
84
0
Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
5
52
0
Báo cáo khoa học: "Semi-supervised Learning for Automatic Prosodic Event Detection Using Co-training Algorithm"
9
85
0
Báo cáo khoa học: "Using Deep Morphology to Improve Automatic Error Detection in Arabic Handwriting Recognition"
10
101
0
Báo cáo khoa học: "Automatic Satire Detection: Are You Having a Laugh?"
4
96
0
Báo cáo khoa học: "Automatic Detection of Syllable Boundaries Combining the Advantages of Treebank and Bracketed Corpora Training"
8
57
0
Báo cáo khoa học: "Automatic error detection in the Japanese learners’ English spoken data"
4
87
0
Báo cáo khoa học: "Automatic Detection of Grammar Elements that Decrease Readability"
4
57
0
Báo cáo khoa học: " Improved Automatic Detection of Zero Subjects and Impersonal Constructions in Spanish"
10
53
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462299
61
Giới thiệu :Lập trình mã nguồn mở
14
24949
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11291
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10514
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9795
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8878
1160
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8468
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8092
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7476
1763
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7193
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Automatic Detection
Correction of Errors
Dependency Treebanks
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Design of an automatic three phase sequence reversal detection
Development of an automatic three phase sequence reversal detection
Correction for industrial equipment structure
Three phase sequence reversal detection
Automatic Extraction of Lexico Syntactic Patterns
Detection of Negation
Speculation Scopes
Semi supervised Learning
Automatic Prosodic Event Detection
Co training Algorithm
xử lý ngôn ngữ tự nhiên
Using Deep Morphology
Improve Automatic Error Detection in Arabic Handwriting Recognition
Nizar Habash and Ryan M
Roth
Automatic Satire Detection
Are You Having a Laugh
Clint Burfoot
Syllable Boundaries Combining the Advantages of Treebank
Bracketed Corpora Training
mô hình ngôn ngữ
Automatic error detection
the Japanese learners’ English
spoken data
Grammar Elements
Decrease Readability
Improved Automatic
Detection of Zero Subjects
Impersonal Constructions in Spanish
scientific reports
model language
process natural language
Text Genre
Brett Xerox
Automatic Detection of Nonreferential
Spoken Multi Party Dialog
Christoph Muller
Luận án Tiến sĩ
Atomic and nuclear physics
Luận án Tiến sĩ Vật lý
Spect CT images segmentation software
Brain tumors
PPE detection
Deep learning
Object detection
Automatic monitoring
Real time personal protective equipment detection
Tạp chí khoa học
Automatic detection of surface water bodies
Sentinel 1 SAR images using Valley Emphasis method
The highest Completeness
Surface water body
Valley emphasis algorithm
Automatic Detectio
Poor Speech Recognition
Dialogue Level
BMC Bioinformatics
Synapse detection
Automatic quantification
3D confocal image
Model selection
High throughput microscopy
Analyze cellular dynamics
Requires automated methods
Automatic processing
Research Challenges
Satellite Images
Mine Detection
Chemical Unmanned
Aerial Vehicle
Báo cáo sinh học hay
cách trình bày báo cáo
báo cáo sinh học
công trình nghiên cứu sinh học
tài liệu về sinh học
báo cáo hóa học
công trình nghiên cứu về hóa học
tài liệu về hóa học
Báo cáo lâm nghiệp hay
báo cáo lâm nghiệp
công trình nghiên cứu lâm nghiệp
tài liệu về lâm nghiệp
TÀI LIỆU MỚI ĐĂNG
Color Atlas of Ophthamology
165
134
2
28-11-2024
CHƯƠNG 2: RỦI RO THÂM HỤT TÀI KHÓA
28
152
1
28-11-2024
Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "
72
178
2
28-11-2024
CUỘC KHÁNG CHIẾN CHỐNG THỰC DÂN PHÁP KẾT THÚC (1953 - 1954)_5
11
135
1
28-11-2024
Neuromuscular Diseases A Practical Guideline - part 4
46
143
1
28-11-2024
Báo cáo y học: "Association between the TNFRII 196R allele and diagnosis of rheumatoid arthritis"
7
92
0
28-11-2024
QUYẾT ĐỊNH Số 511/1999/QĐ-BCA (V26)
7
102
0
28-11-2024
Decison 729 -Approval of HCMC Water Supply Planning till 2025
9
129
0
28-11-2024
solar collectors and panels theory and applications Part 8
30
108
0
28-11-2024
Báo cáo khoa học: " SemiIntensity modulated radiotherapy (IMRT) in benign giant cell tumors – a single institution case series and a short review of the literatur"
7
96
0
28-11-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8092
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7476
1763
Ebook Chào con ba mẹ đã sẵn sàng
112
4367
1369
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6160
1259
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8878
1160
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3794
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3910
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4621
562
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11291
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4457
490