tailieunhanh - Bài giảng Nhập môn lập trình khoa học dữ liệu: Bài 9 - Trương Xuân Nam

Bài giảng Nhập môn lập trình khoa học dữ liệu: Bài 9 Thư viện Pandas cung cấp cho người học những kiến thức như: Giới thiệu và cài đặt pandas; Cấu trúc dữ liệu trong pandas; Làm việc với series; Làm việc với dataframe. Mời các bạn cùng tham khảo! | NHẬP MÔN LẬP TRÌNH KHOA HỌC DỮ LIỆU Bài 9 Thư viện Pandas 1 Nội dung 1. Giới thiệu và cài đặt pandas 2. Cấu trúc dữ liệu trong pandas 3. Làm việc với series 4. Làm việc với dataframe 5. Bài tập TRƯƠNG XUÂN NAM 2 Phần 1 Giới thiệu và cài đặt pandas TRƯƠNG XUÂN NAM 3 Cài đặt pip install pandas pandas là thư viện mở rộng từ numpy chuyên để xử lý dữ liệu cấu trúc dạng bảng Tên pandas là dạng số nhiều của panel data TRƯƠNG XUÂN NAM 4 Đặc điểm nổi bật của pandas Đọc dữ liệu từ nhiều định dạng Liên kết dữ liệu và tích hợp xử lý dữ liệu bị thiếu Xoay và chuyển đổi chiều của dữ liệu dễ dàng Tách đánh chỉ mục và chia nhỏ các tập dữ liệu lớn dựa trên nhãn Có thể nhóm dữ liệu cho các mục đích hợp nhất và chuyển đổi Lọc dữ liệu và thực hiện query trên dữ liệu Xử lý dữ liệu chuỗi thời gian và lấy mẫu TRƯƠNG XUÂN NAM 5 Phần 2 Cấu trúc dữ liệu trong pandas TRƯƠNG XUÂN NAM 6 Cấu trúc dữ liệu trong pandas Dữ liệu của pandas có 3 cấu trúc chính Series loạt cấu trúc 1 chiều mảng dữ liệu đồng nhất Dataframe khung cấu trúc 2 chiều dữ liệu trên các cột là đồng nhất có phần giống như table trong SQL nhưng với các dòng được đặt tên Panel bảng cấu trúc 3 chiều có thể xem như một tập các dataframe với thông tin bổ sung Dữ liệu series gần giống kiểu array trong numpy nhưng có 2 điểm khác biệt quan trọng Chấp nhận dữ liệu thiếu NaN không xác định Hệ thống chỉ mục phong phú giống dictionary TRƯƠNG XUÂN NAM 7 Cấu trúc dataframe Dữ liệu 2 chiều Các cột có tên Dữ liệu trên cột là đồng nhất series Các dòng có thể có tên Có thể có ô thiếu dữ liệu TRƯƠNG XUÂN NAM 8 Cấu trúc panel Dữ liệu 3 chiều Một tập các dataframe Các dataframe có cấu trúc tương đồng Có thể có các thông tin bổ sung cho từng dataframe TRƯƠNG XUÂN NAM 9 Phần 3 Làm việc với series TRƯƠNG XUÂN NAM 10 Tạo dữ liệu series 1 import pandas as pd import numpy as np S 100 size 4 print S 0 73 print 1 80 print 2 4 3 7 dtype int32 RangeIndex start 0 stop 4 step 1 73 80 4 7 TRƯƠNG XUÂN NAM 11 Tạo dữ

crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.