tailieunhanh - Bài giảng Ngôn ngữ lập trình Python - Chương 4.2: Các thư viện phổ biến (tiếp theo)

Bài giảng Ngôn ngữ lập trình Python - Chương : Các thư viện phổ biến (tiếp theo), chương này cung cấp cho học viên những nội dung sau: giới thiệu và cài đặt pandas; cấu trúc dữ liệu của pandas; series và dataframe; data alignment and arithmetic; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | Trịnh Tấn Đạt Đại Học Sài Gòn trinhtandat@ http site ttdat88 Nội Dung Giới thiệu và cài đặt Cấu trúc dữ liệu của pandas Series và Dataframe Bài tập Cài đặt pandas là thư viện mở rộng từ numpy chuyên để xử lý dữ liệu cấu trúc dạng bảng có thể dùng để đọc file excel hoặc csv Tên pandas là viết tắt từ panel data Để cài đặt module pandas dùng lệnh pip install pandas https docs user_guide https docs reference Đặc điểm Đọc dữ liệu từ nhiều định dạng Liên kết dữ liệu và tích hợp xử lý dữ liệu bị thiếu Xoay và chuyển đổi chiều của dữ liệu dễ dàng Tách đánh chỉ mục và chia nhỏ các tập dữ liệu lớn dựa trên nhãn Có thể nhóm dữ liệu cho các mục đích hợp nhất và chuyển đổi Lọc dữ liệu và thực hiện query trên dữ liệu Xử lý dữ liệu chuỗi thời gian và lấy mẫu Cấu trúc dữ liệu trong pandas Dữ liệu của pandas có 3 thành phần chính Series dãy cấu trúc 1 chiều mảng dữ liệu đồng nhất. Dataframe khung cấu trúc 2 chiều dữ liệu trên các cột là đồng nhất có phần giống như table trong SQL nhưng với các dòng được đặt tên Panel bảng cấu trúc 3 chiều có thể xem như một tập các dataframe với thông tin bổ sung Dữ liệu series gần giống kiểu array trong numpy nhưng có 2 điểm khác biệt quan trọng Chấp nhận dữ liệu thiếu NaN không xác định Hệ thống chỉ mục phong phú Ví dụ Series Dữ liệu một chiều Có thể coi như một dạng kết hợp giữa List và Dictionary. Mọi dữ liệu được lưu trữ theo thứ tự và có label. Cột đầu tiên là Index nó giống như Keys trong Dictionary. Cột thứ 2 mới là dữ liệu. Cột dữ liệu có label riêng của nó và có thể gọi bằng thuộc tính .name Ví dụ Dataframe Dữ liệu 2 chiều Các cột có tên Dữ liệu trên cột là đồng nhất Các dòng có thể có tên Có thể có ô thiếu dữ liệu Panel Dữ liệu 3 chiều Một tập các dataframe Các dataframe có cấu trúc tương đồng Có thể có các thông tin bổ sung cho từng dataframe Series data None index None dtype None name None copy False fastpath False source Parameters data

TỪ KHÓA LIÊN QUAN