Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Domain Kernels for Word Sense Disambiguation"
tailieunhanh - Báo cáo khoa học: "Domain Kernels for Word Sense Disambiguation"
In this paper we present a supervised Word Sense Disambiguation methodology, that exploits kernel methods to model sense distinctions. In particular a combination of kernel functions is adopted to estimate independently both syntagmatic and domain similarity. We defined a kernel function, namely the Domain Kernel, that allowed us to plug “external knowledge” into the supervised learning process. | Domain Kernels for Word Sense Disambiguation Alfio Gliozzo and Claudio Giuliano and Carlo Strapparava ITC-irst Istituto per la Ricerca Scientifica e Tecnologica I-38050 Trento ITALY gliozzo giuliano strappa @ Abstract In this paper we present a supervised Word Sense Disambiguation methodology that exploits kernel methods to model sense distinctions. In particular a combination of kernel functions is adopted to estimate independently both syntagmatic and domain similarity. We defined a kernel function namely the Domain Kernel that allowed us to plug external knowledge into the supervised learning process. External knowledge is acquired from unlabeled data in a totally unsupervised way and it is represented by means of Domain Models. We evaluated our methodology on several lexical sample tasks in different languages outperforming significantly the state-of-the-art for each of them while reducing the amount of labeled training data required for learning. 1 Introduction The main limitation of many supervised approaches for Natural Language Processing NLP is the lack of available annotated training data. This problem is known as the Knowledge Acquisition Bottleneck. To reach high accuracy state-of-the-art systems for Word Sense Disambiguation WSD are designed according to a supervised learning framework in which the disambiguation of each word in the lexicon is performed by constructing a different classifier. A large set of sense tagged examples is then required to train each classifier. This methodology is called word expert approach Small 1980 Yarowsky and Florian 2002 . However this is clearly unfeasible for all-words WSD tasks in which all the words of an open text should be disambiguated. On the other hand the word expert approach works very well for lexical sample WSD tasks . tasks in which it is required to disambiguate only those words for which enough training data is provided . As the original rationale of the lexical sample tasks was to define a .
Bạch Tuyết
65
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Domain Kernels for Word Sense Disambiguation"
8
54
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461857
55
Giới thiệu :Lập trình mã nguồn mở
14
22593
58
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10047
445
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9513
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8267
1124
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8216
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6669
253
Vật lý hạt cơ bản (1)
29
5765
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Domain Kernels
Word Sense Disambiguation
Alfio Gliozzo and Claudio Giuliano and Carlo Strapparava
báo cáo khoa học
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
Bài giảng Xử lý ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên
Kỹ thuật lập trình
Xử lý nhập nhằng ngữ nghĩa
Xử lý ngữ nghĩa
Xử lý ngôn ngữ
Natural Language Processing
Ngôn ngữ lập trình
Nhập nhằng cấu trúc
Tri thức về ngôn ngữ
Mô hình n gram
Dịch máy
Phương pháp dịch máy
Hiểu ngôn ngữ
Phân tích ngữ nghĩa
Phân loại tin tự động
Biểu diễn vị từ
Thuộc tính về sự kiện
Thuộc tính về sự kiện
Mô hình ngôn ngữ Google Book N grams
Mô hình ngôn ngữ KenLM
Phương pháp làm mịn
Tách từ tiếng Việt
Gán nhãn từ loại
Phân tích cú pháp
Nghĩa từ vựng
Phân giải nhập nhằng từ
Phân loại văn bản
Lexical chain
Phản hồi thông tin
Bài toán PTCP
Cấu trúc ngữ pháp
Phân tích cú pháp xác suất
CKY kết hợp xác suất
Văn phạm phi ngữ cảnh xác suất
Hình thái học
TÀI LIỆU MỚI ĐĂNG
Mass Transfer in Multiphase Systems and its Applications Part 19
40
255
1
24-04-2024
extremetech Hacking BlackBerry phần 9
31
240
0
24-04-2024
Trading Strategies Profit Making Techniques For Stock_3
23
183
0
24-04-2024
Anh văn bằng C-124
8
172
0
24-04-2024
Magnetic Bearings Theory and Applications phần 2
14
170
0
24-04-2024
Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "
7
175
0
24-04-2024
Công nghiệp gang thép Việt Nam : Một giai đoạn phát triển và chuyển đổi chính sách mới part 5
6
194
0
24-04-2024
Data Structures and Algorithms - Chapter 9: Hashing
54
113
0
24-04-2024
Giáo trình tổng quan khoa học thông tin và thư viện part 7
22
143
2
24-04-2024
Christmas Meditations on the Twelve Holy Days
173
103
0
24-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5674
1348
Ebook Chào con ba mẹ đã sẵn sàng
112
3757
1230
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5307
1135
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8267
1124
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3483
641
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3677
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4039
514
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4120
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.