Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Encoding a Parallel Corpus for Automatic Terminology"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Encoding a Parallel Corpus for Automatic Terminology"
Hiếu Khanh
56
2
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
We present a status report about an ongoing research project in the field of (semi-)automatic terminology acquisition at the European Academy Bolzano. The main focus will be on encoding a text corpus, which serves as a basis for applying term extraction programq. The CATEx (C_omputer A_.ssisted Terminology E~raction) project emerged from the need to support and improve, both qualitatively and quantitatively, the manual acquisition of terminological data. Thus, the main objective of CATEx is the development of a computational framework for (semi-)antomatic terminology acquisition, which consists of four modules: a parallel text corpus, term-extraction programs, a term bank linked. | Proceedings of EACL 99 Encoding a Parallel Corpus for Automatic Terminology Extraction Johann Gamper European Academy Bolzano Bozen Weggensteinstr. 12 A 39100 Bolzano Bozen Italy jgamper eurac.edu Abstract We present a status report about an ongoing research project in the field of semi- automatic terminology acquisition at the European Academy Bolzano. The main focus will be on encoding a text corpus which serves as a basis for applying term extraction programs. 1 Introduction Text corpora are valuable resources in all areas dealing with natural language processing in one form or another. Terminology is one of these fields where researchers explore domain-specific language material to investigate terminological issues. The manual acquisition of terminological data from text material is a very work-intensive and error-prone task. Recent advances in automatic corpus analysis favored a modern form of terminology acquisition 1 a corpus is a collection of language material in machine-readable form and 2 computer programs scan the corpus for terminologically relevant information and generate lists of term candidates which have to be post-edited by humans. The following project CATEx adopts this approach. 2 The CATEx Project Due to the equal status of the Italian and the German language in South Tyrol legal and administrative documents have to be written in both languages. A prerequisite for high quality translations is a consistent and comprehensive bilingual terminology which also forms the basis for an independent German legal language which reflects the Italian legislation. The first systematic effort in this direction was initiated a few years ago at the European Academy Bolzano Bozen with the goal to compile an Italian German legal and administrative terminology for South Tyrol. The CATEx Computer Assisted Terminology Extraction project emerged from the need to support and improve both qualitatively and quantitatively the manual acquisition of terminological data.
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A Procedure for Morphological Encoding"
Báo cáo khoa học: "A Generalized-Zero-Preserving Method for Compact Encoding of Concept Lattices"
Báo cáo khoa học: "Lexicographic Semirings for Exact Automata Encoding of Sequence Models"
Báo cáo khoa học: "A Tool for Deep Semantic Encoding of Narrative Texts"
Báo cáo khoa học: "A Hierarchical Approach to Encoding Medical Concepts for Clinical Notes"
Báo cáo khoa học: "Generalized Encoding of Description Spaces and its Application to Typed Feature Structures"
Báo cáo khoa học: "Encoding Lexicalized Tree Adjoining Grammars with a Nonmonotonic Inheritance Hierarchy"
Báo cáo khoa hoc:" Variation in genes encoding eosinophil granule proteins in atopic dermatitis patients from Germany"
Báo cáo khoa hoc:" Lack of association between mutations of gene-encoding mitochondrial D310 (displacement loop) mononucleotide repeat and oxidative stress in chronic dialysis patients in Taiwan"
Báo cáo toán học: "Differential display identifies overexpression of the USP36 gene, encoding a deubiquitinating enzyme, in ovarian cancer"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.