Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
tailieunhanh - Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
Annotated corpora are essential for almost all NLP applications. Whereas they are expected to be of a very high quality because of their importance for the followup developments, they still contain a considerable number of errors. With this work we want to draw attention to this fact. Additionally, we try to estimate the amount of errors and propose a method for their automatic correction. | Automatic Detection and Correction of Errors in Dependency Treebanks Alexander Volokh DFKI Stuhlsatzenhausweg 3 66123 Saarbrucken Germany Gunter Neumann DFKI Stuhlsatzenhausweg 3 66123 Saarbrucken Germany neumann@ Abstract Annotated corpora are essential for almost all NLP applications. Whereas they are expected to be of a very high quality because of their importance for the followup developments they still contain a considerable number of errors. With this work we want to draw attention to this fact. Additionally we try to estimate the amount of errors and propose a method for their automatic correction. Whereas our approach is able to find only a portion of the er -rors that we suppose are contained in almost any annotated corpus due to the nature of the process of its creation it has a very high pre -cision and thus is in any case beneficial for the quality of the corpus it is applied to. At last we compare it to a different method for error detection in treebanks and find out that the errors that we are able to detect are mostly different and that our approaches are complementary. 1 Introduction Treebanks and other annotated corpora have become essential for almost all NLP applications. Papers about corpora like the Penn Treebank 1 have thousands of citations since most of the algorithms profit from annotated data during the development and testing and thus are widely used in the field. Treebanks are therefore expected to be of a very high quality in order to guarantee reliability for their theoretical and practical uses. The construction of an annotated corpus involves a lot of work performed by large groups. However despite the fact that a lot of human post-editing and automatic quality assurance is done errors can not be avoided completely 5 . 346 In this paper we propose an approach for finding and correcting errors in dependency treebanks. We apply our method to the English dependency corpus - conversion of the Penn .
Ðoan Trang
54
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Design and development of an automatic three-phase sequence reversal detection and correction for industrial equipment structure
10
62
1
Báo cáo khoa học: "Automatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation Scopes"
5
84
0
Báo cáo khoa học: "Automatic Detection and Correction of Errors in Dependency Treebanks"
5
52
0
Báo cáo khoa học: "Semi-supervised Learning for Automatic Prosodic Event Detection Using Co-training Algorithm"
9
85
0
Báo cáo khoa học: "Using Deep Morphology to Improve Automatic Error Detection in Arabic Handwriting Recognition"
10
101
0
Báo cáo khoa học: "Automatic Satire Detection: Are You Having a Laugh?"
4
96
0
Báo cáo khoa học: "Automatic Detection of Syllable Boundaries Combining the Advantages of Treebank and Bracketed Corpora Training"
8
57
0
Báo cáo khoa học: "Automatic error detection in the Japanese learners’ English spoken data"
4
87
0
Báo cáo khoa học: "Automatic Detection of Grammar Elements that Decrease Readability"
4
57
0
Báo cáo khoa học: " Improved Automatic Detection of Zero Subjects and Impersonal Constructions in Spanish"
10
53
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462347
61
Giới thiệu :Lập trình mã nguồn mở
14
26466
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11368
543
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10557
468
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9850
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8897
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8512
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8107
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7833
1803
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7285
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Automatic Detection
Correction of Errors
Dependency Treebanks
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Design of an automatic three phase sequence reversal detection
Development of an automatic three phase sequence reversal detection
Correction for industrial equipment structure
Three phase sequence reversal detection
Automatic Extraction of Lexico Syntactic Patterns
Detection of Negation
Speculation Scopes
Semi supervised Learning
Automatic Prosodic Event Detection
Co training Algorithm
xử lý ngôn ngữ tự nhiên
Using Deep Morphology
Improve Automatic Error Detection in Arabic Handwriting Recognition
Nizar Habash and Ryan M
Roth
Automatic Satire Detection
Are You Having a Laugh
Clint Burfoot
Syllable Boundaries Combining the Advantages of Treebank
Bracketed Corpora Training
mô hình ngôn ngữ
Automatic error detection
the Japanese learners’ English
spoken data
Grammar Elements
Decrease Readability
Improved Automatic
Detection of Zero Subjects
Impersonal Constructions in Spanish
scientific reports
model language
process natural language
Text Genre
Brett Xerox
Automatic Detection of Nonreferential
Spoken Multi Party Dialog
Christoph Muller
Luận án Tiến sĩ
Atomic and nuclear physics
Luận án Tiến sĩ Vật lý
Spect CT images segmentation software
Brain tumors
PPE detection
Deep learning
Object detection
Automatic monitoring
Real time personal protective equipment detection
Tạp chí khoa học
Automatic detection of surface water bodies
Sentinel 1 SAR images using Valley Emphasis method
The highest Completeness
Surface water body
Valley emphasis algorithm
Automatic Detectio
Poor Speech Recognition
Dialogue Level
BMC Bioinformatics
Synapse detection
Automatic quantification
3D confocal image
Model selection
High throughput microscopy
Analyze cellular dynamics
Requires automated methods
Automatic processing
Research Challenges
Satellite Images
Mine Detection
Chemical Unmanned
Aerial Vehicle
Báo cáo sinh học hay
cách trình bày báo cáo
báo cáo sinh học
công trình nghiên cứu sinh học
tài liệu về sinh học
báo cáo hóa học
công trình nghiên cứu về hóa học
tài liệu về hóa học
Báo cáo lâm nghiệp hay
báo cáo lâm nghiệp
công trình nghiên cứu lâm nghiệp
tài liệu về lâm nghiệp
TÀI LIỆU MỚI ĐĂNG
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
158
4
04-01-2025
Bệnh sán lá gan trên gia súc và cách phòng trị
3
167
1
04-01-2025
SQL và PL/SQLCơ bản.Oracle cơ bản - SQL và PL/SQLMỤC LỤCMỤC LỤC ... CHƯƠNG
104
168
0
04-01-2025
Norton Commander version 5 part 5
18
133
0
04-01-2025
Ai cũng cởi, chỉ một người không cởi
10
118
1
04-01-2025
Giáo trình phân tích hệ số truyền nhiệt và mật độ dòng nhiệt của các loại thiết bị ngưng tụ p8
5
120
0
04-01-2025
Dự án nghiên cứu nông nghiệp: Xây dựng chiến lược nâng cao tính cạnh tranh của các doanh nghiệp vừa và nhỏ nông thôn trong chuỗi ngành hàng nông sản: trường hợp ngành thức ăn chăn nuôi ' Ms5
9
128
0
04-01-2025
QUYẾT ĐỊNH Số 511/1999/QĐ-BCA (V26)
7
113
0
04-01-2025
Advances in Risk Management Part 3
20
118
0
04-01-2025
Đề đề xuất - Trường thcs Trần Hưng Đạo
5
117
0
04-01-2025
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8107
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7833
1803
Ebook Chào con ba mẹ đã sẵn sàng
112
4424
1376
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6336
1275
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8897
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3854
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3926
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4753
567
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11368
543
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4527
490