tailieunhanh - Bài giảng Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Bài 4(tt) - Lê Thanh Hương

Bài giảng về "Phân tích ngữ nghĩa" thảo luận một số nội dung chủ yếu sau: Tại sao cần phân tích ngữ nghĩa? Thế nào được coi là hiểu? Một số khái niệm cơ bản về logic, logic: thuật ngữ Lambda, cách biểu diễn vị từ, sử dụng lượng từ, các thuộc tính về sự kiện,. . | Làm cách nào chọn cây đúng? Phân tích cú pháp xác suất z Ví dụ: z Khi số luật tăng, khả năng nhập nhằng tăng Tập p luật NYU: bộ PTCP Apple pp p pie : 20,000-30,000 luật cho tiếng Anh Lựa chọn luật AD: V DT NN PP (1) VP → V NP PP NP → DT NN (2) VP → V NP NP → DT NN PP I saw a man with a telescope. Lê Thanh Hương g Bộ môn Hệ thống Thông tin Viện CNTT &TT – Trường ĐHBKHN Email: huonglt-fit@ z z 1 Kết hợp từ (bigrams pr) 2 Kết hợp từ (bigrams pr) Ví dụ: Eat ice-cream (high freq) Eat John (low, except on Survivor) z ⇒ Verb-with-obj, verb-without-obj z Nhược điểm: P(John decided to bake a) có xác suất cao z Xét: P(w3) = P(w3|w2w1))=P(w P(w3|w2)P(w2|w1)P(w1) Giả thiết này quá mạnh: chủ ngữ có thể quyết định bổ ngữ trong câu Clinton admires honesty ¾ sử dụng cấu trúc ngữ pháp để dừng việc lan truyền z Xét Fred watered his mother’s small garden. Từ garden có ảnh hưởng như thế nào? z z z Pr(garden|mother’s small) thấp ⇒ mô hình trigram không tốt Pr(garden | X là thành phần chính của bổ ngữ cho động từ to water) cao hơn ¾ sử dụng bigram + quan hệ ngữ pháp Ví dụ Nhược điểm: • Kích thước tập ngữ pháp tăng z Các bài báo của tạp chí Wall Street Journal trong 1 năm: 47,219 câu, độ dài trung bình 23 từ, gán nhãn bằng tay: chỉ có hay 2,232 câu có cùng cấu trúc ngữ pháp ¾ Không thể dựa trên việc tìm các cấu trúc cú pháp đúng cho cả câu. Phải xây dựng tập các mẫu ngữ pháp nhỏ 4 Luật Luật 3 1. VP 2. 3. VP VP ADJ NP DT NN Sự tương thích giữa chủ ngữ và bổ ngữ: John admires honesty Honesty admires John ??? 3 S Luật 1 V có một số loại bổ ngữ nhất định z VP Luật 2 z NP→DT NN NN NP→DT JJ NN S→NP VBX JJ CC VBX NP Nhóm (NNS, NN) thành NX; (NNP, NNPs)=NPX; (VBP, VBZ, VBD) VBD)=VBX; VBX; Chọn các luật theo tần suất của nó NP NN VBX JJ CC VBX DT JJ NN This apple pie looks good and is a real treat 5 6 Tính Pr Tính xác suất Pr(X →Y) X 1 S 2 NP VP 3 NP DT JJ NN VBX NP 4 The big guy ate DT JJ NN the apple pie 1470 Y DT JJ .

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.