tailieunhanh - Bài giảng Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Bài 4(tt) - Lê Thanh Hương

Bài giảng về "Phân tích ngữ nghĩa" thảo luận một số nội dung chủ yếu sau: Tại sao cần phân tích ngữ nghĩa? Thế nào được coi là hiểu? Một số khái niệm cơ bản về logic, logic: thuật ngữ Lambda, cách biểu diễn vị từ, sử dụng lượng từ, các thuộc tính về sự kiện,. . | Làm cách nào chọn cây đúng? Phân tích cú pháp xác suất z Ví dụ: z Khi số luật tăng, khả năng nhập nhằng tăng Tập p luật NYU: bộ PTCP Apple pp p pie : 20,000-30,000 luật cho tiếng Anh Lựa chọn luật AD: V DT NN PP (1) VP → V NP PP NP → DT NN (2) VP → V NP NP → DT NN PP I saw a man with a telescope. Lê Thanh Hương g Bộ môn Hệ thống Thông tin Viện CNTT &TT – Trường ĐHBKHN Email: huonglt-fit@ z z 1 Kết hợp từ (bigrams pr) 2 Kết hợp từ (bigrams pr) Ví dụ: Eat ice-cream (high freq) Eat John (low, except on Survivor) z ⇒ Verb-with-obj, verb-without-obj z Nhược điểm: P(John decided to bake a) có xác suất cao z Xét: P(w3) = P(w3|w2w1))=P(w P(w3|w2)P(w2|w1)P(w1) Giả thiết này quá mạnh: chủ ngữ có thể quyết định bổ ngữ trong câu Clinton admires honesty ¾ sử dụng cấu trúc ngữ pháp để dừng việc lan truyền z Xét Fred watered his mother’s small garden. Từ garden có ảnh hưởng như thế nào? z z z Pr(garden|mother’s small) thấp ⇒ mô hình trigram không tốt Pr(garden | X là thành phần chính của bổ ngữ cho động từ to water) cao hơn ¾ sử dụng bigram + quan hệ ngữ pháp Ví dụ Nhược điểm: • Kích thước tập ngữ pháp tăng z Các bài báo của tạp chí Wall Street Journal trong 1 năm: 47,219 câu, độ dài trung bình 23 từ, gán nhãn bằng tay: chỉ có hay 2,232 câu có cùng cấu trúc ngữ pháp ¾ Không thể dựa trên việc tìm các cấu trúc cú pháp đúng cho cả câu. Phải xây dựng tập các mẫu ngữ pháp nhỏ 4 Luật Luật 3 1. VP 2. 3. VP VP ADJ NP DT NN Sự tương thích giữa chủ ngữ và bổ ngữ: John admires honesty Honesty admires John ??? 3 S Luật 1 V có một số loại bổ ngữ nhất định z VP Luật 2 z NP→DT NN NN NP→DT JJ NN S→NP VBX JJ CC VBX NP Nhóm (NNS, NN) thành NX; (NNP, NNPs)=NPX; (VBP, VBZ, VBD) VBD)=VBX; VBX; Chọn các luật theo tần suất của nó NP NN VBX JJ CC VBX DT JJ NN This apple pie looks good and is a real treat 5 6 Tính Pr Tính xác suất Pr(X →Y) X 1 S 2 NP VP 3 NP DT JJ NN VBX NP 4 The big guy ate DT JJ NN the apple pie 1470 Y DT JJ .