Đang chuẩn bị liên kết để tải về tài liệu:
Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R - Phần 4

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

Biên tập số liệu ở đây không có nghĩa là thay đổi số liệu gốc (vì đó là một tội lớn, một sự gian dối trong khoa học không thể chấp nhận được), mà chỉ có nghĩa tổ chức số liệu sao cho R có thể phân tích một cách hữu hiệu. Nhiều khi trong phân tích thống kê, chúng ta cần phải tập trung số liệu thành một nhóm, hay tách rời thành từng nhóm, hay thay thế từ kí tự (characters) sang số (numeric) cho tiện việc tính toán. Chương này sẽ bàn qua một số lệnh. | Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R 4 Biên tập dữ liệu Biên tập số liệu ở đây không có nghĩa là thay đổi số liệu gốc vì đó là một tội lớn một sự gian dối trong khoa học không thể chấp nhận được mà chỉ có nghĩa tổ chức số liệu sao cho R có thể phân tích một cách hữu hiệu. Nhiều khi trong phân tích thống kê chúng ta cần phải tập trung số liệu thành một nhóm hay tách rời thành từng nhóm hay thay thế từ kí tự characters sang số numeric cho tiện việc tính toán. Chương này sẽ bàn qua một số lệnh căn bản cho việc biên tập số liệu. Chúng ta sẽ quay lại với dữ liệu chol trong ví dụ 1. Để tiện việc theo dõi và hiểu câu chuyện xin nhắc lại rằng chúng ta đã nhập số liệu vào trong một dữ liệu R có tên là chol từ một text file có tên là chol.txt setwd c works stats chol - read.table chol.txt header TRUE attach chol 4.1 Kiểm tra số liệu trống không missing value Trong nghiên cứu vì nhiều lí do số liệu không thể thu thập được cho tất cả đối tượng hay không thể đo lường tất cả biến số cho một đối tượng. Trong trường hợp đó số liệu trống được xem là missing value tạm dịch là số liệu trống không . R xem các số liệu trống không là NA. Có một số kiểm định thống kê đòi hỏi các số liệu trống không phải được loại ra vì không thể tính toán được trước khi phân tích. R có một lệnh rất có ích cho việc này na.omit và cách sử dụng như sau chol.new - na.omit chol Trong lệnh trên chúng ta yêu cầu R loại bỏ các số liệu trống không trong data.frame chol và đưa các số liệu không trống vào data.frame mới tên là chol.new. Chú ý lệnh trên chỉ là ví dụ vì trong dữ liệu chol không có số liệu trống không. 4.2 Tách rời dữ liệu subset Nếu chúng ta vì một lí do nào đó chỉ muốn phân tích riêng cho nam giới chúng ta có thể tách chol ra thành hai data.frame tạm gọi là nam và nu. Để làm chuyện này chúng ta dùng lệnh subset data cond trong đó data là data.frame mà chúng ta muốn tách rời và cond là điều kiện. Ví dụ nam - subset chol sex Nam nu - subset chol sex Nu Sau khi ra hai lệnh này chúng ta đã .