Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Japanese Named Entity Recognition based on a Simple Rule Generator and Decision Tree Learning"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Japanese Named Entity Recognition based on a Simple Rule Generator and Decision Tree Learning"
Tài Ðức
92
8
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Named entity (NE) recognition is a task in which proper nouns and numerical information in a document are detected and classified into categories such as person, organization, location, and date. NE recognition plays an essential role in information extraction systems and question answering systems. It is well known that hand-crafted systems with a large set of heuristic rules are difficult to maintain, and corpus-based statistical approaches are expected to be more robust and require less human intervention. . | Japanese Named Entity Recognition based on a Simple Rule Generator and Decision Tree Learning Hideki Isozaki NTT Communication Science Laboratories 2-4 Hikaridai Seika-cho Souraku-gun Kyoto 619-0237 Japan isozaki@cslab.kecl.ntt.co.jp Abstract Named entity NE recognition is a task in which proper nouns and numerical information in a document are detected and classified into categories such as person organization location and date. NE recognition plays an essential role in information extraction systems and question answering systems. It is well known that hand-crafted systems with a large set of heuristic rules are difficult to maintain and corpus-based statistical approaches are expected to be more robust and require less human intervention. Several statistical approaches have been reported in the literature. In a recent Japanese NE workshop a maximum entropy ME system outperformed decision tree systems and most hand-crafted systems. Here we propose an alternative method based on a simple rule generator and decision tree learning. Our experiments show that its performance is comparable to the ME approach. We also found that it can be trained more efficiently with a large set of training data and that it improves readability. 1 Introduction Named entity NE recognition is a task in which proper nouns and numerical information in a document are detected and classi fied into categories such as person organization location and date. NE recognition plays an essential role in information extraction systems see MUC documents 1996 and question answering systems see TREC-QA documents http trec.nist.gov . When you want to know the location of the Taj Mahal traditional IR techniques direct you to relevant documents but do not directly answer your question. NE recognition is essential for finding possible answers from documents. Although it is easy to build an NE recognition system with mediocre performance it is difficult to make it reliable because of the large number of .
TÀI LIỆU LIÊN QUAN
Báo cáo y học: "Identification and characterization of a virus-specific continuous B-cell epitope on the PrM/M protein of Japanese Encephalitis Virus: potential application in the detection of antibodies to distinguish Japanese Encephalitis Virus infection from West Nile Virus and Dengue Virus infections"
Báo cáo khoa học: "Post-ordering by Parsing for Japanese-English Statistical Machine Translation"
Báo cáo khoa học: "Using Smaller Constituents Rather Than Sentences in Active Learning for Japanese Dependency Parsing"
Báo cáo khoa học: "Pointwise Prediction for Robust, Adaptable Japanese Morphological Analysis"
Báo cáo khoa học: "Linefeed Insertion into Japanese Spoken Monologue for Captioning"
Báo cáo khoa học: "A Syntax-Free Approach to Japanese Sentence Compression"
Báo cáo khoa học: "Bypassed Alignment Graph for Learning Coordination in Japanese Sentences"
Báo cáo khoa học: "A Unified Single Scan Algorithm for Japanese Base Phrase Chunking and Dependency Parsing"
Báo cáo khoa học: "A Combination of Active Learning and Semi-supervised Learning Starting with Positive and Unlabeled Examples for Word Sense Disambiguation: An Empirical Study on Japanese Web Search Query"
Báo cáo khoa học: "Dependency Parsing of Japanese Spoken Monologue Based on Clause Boundaries"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.