tailieunhanh - Bài giảng Trình biên dịch: Chương 4, 5 - TS. Vũ Đức Lung

Bài giảng Trình biên dịch - Chương 4, 5 trang bị cho người học những kiến thức về phân tích từ vựng và cú pháp trong trình biên dịch. Trong chương này gồm có những nội dung sau: Vai trò của phân tích từ vựng, các tính chất của token, chứa tạm chương trình nguồn,. . | 05 04 2012 TRÌNH BIÊN DỊCH COMPILER Khoa Kỹ thuật máy tính TS. Vũ Đức Lung Email lungvd@ Khoa KTMT - UIT TS. Vũ Đức Lung 1 Vai trò của bộ phân tích từ vựng 1. Token mẫu trị từ vựng Token Trị từ vựng Ý nghĩa của mẫu const const const if if if then then then relation các toán tử quan hệ num hằng số bất kỳ id abc. OU bcl. chuỗi gồm ký tự chữ và số bắt đầu là ký tự chữ literal abcef là chuỗi ký tự bất kỳ nằm giữa 2 dấu Khoa KTMT - UIT TS. Vũ Đức Lung 3 CÁC TÍNH CHẤT CỦA TOKEN Phân tích từ vựng phải có nhiệm vụ chọn thông tin có liên quan đến token để cất chúng vào bảng danh biểu Ví dụ trị từ vựng . Token luôn mang trong mình một thuộc tính duy nhất là con trỏ để chỉ đến vị trí của nó trong bảng danh biểu. Khi một token được chuyển đến bộ phân tích cú pháp nó sẽ có dạng. Token thuộc tính Khoa KTMT - UIT TS. Vũ Đức Lung Ỉ Chương 4 Phân tích từ vựng Nội dung Vai trò của bộ phân tích từ vựng CÁC TÍNH CHẤT CỦA TOKEN CHỨA TẠM CHƯƠNG TRÌNH NGUỒN Đặc tả nhận dạng token Sơ đồ dịch Automat hữu hạn - Automat hữu hạn không tất định NFA - Automat hữu hạn tất định DFA Khoa KTMT - UIT TS. Vũ Đức Lung Sự giao tiếp giữa bộ phân tích từ vựng và bộ phân tích cú pháp Khoa KTMT - UIT TS. Vũ Đức Lung 1. CHỨA TẠM CHƯƠNG TRÌNH NGUỒN Cặp bộ đệm Cấu tạo và Quy trình hoạt động 1 05 04 2012 CHỨA TẠM CHƯƠNG TRÌNH NGUỒN pháp cầm canh u H N b x eof - 2 eof I I I I I eof Giải thuật T ll l k ur pl p2 p2 p2 1 If p2 A eof then if p2 ở ranh giới một nửa bộ đệm then begin chất đầy N kỳ hiệu nhập vào nửa bên phải bộ đệm p2 p2 1 end else if p2 ở tận cùng bên phải bộ đệm then begin lấp đầy N ký hiệu vào nửa bên trái bộ đệm chuyển p2 về đầu bộ đệm end else dừng sự phân tích từ vựng Đặc tả token Các quy tắc định nghĩa biểu thức chính quy 1. 6 là biểu thức chính quy biểu thị cho tập 6 2. a là ký hiệu thuộc - biểu thị cho tập a 3. r và s là hai biểu thức chính quy biểu thị cho L r và L s thì a r s là biểu thức chính quy biểu thị cho L r L s . b r s là biểu thức chính quy biểu thị