Đang chuẩn bị liên kết để tải về tài liệu:
Giáo trình -Phân tích số liệu bằng R-chương 3-4
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
3 Nhập dữ liệu Muốn làm phân tích dữ liệu bằng R, chúng ta phải có sẵn dữ liệu ở dạng mà R có thể hiểu được để xử lí. Dữ liệu mà R hiểu được phải là dữ liệu trong một data.frame. Có nhiều cách để nhập số liệu vào một data.frame trong R, từ nhập trực tiếp đến nhập từ các nguồn khác nhau. Sau đây là những cách thông dụng nhất: 3.1 Nhập số liệu trực tiếp: c() Ví dụ 1: chúng ta có số liệu về độ tuổi và insulin cho 10 bệnh nhân như sau, và muốn nhập. | 3 Nhập dữ liệu Muốn làm phân tích dữ liệu bằng R chúng ta phải có sẵn dữ liệu ở dạng mà R có thể hiểu được để xử lí. Dữ liệu mà R hiểu được phải là dữ liệu trong một data.frame. Có nhiều cách để nhập số liệu vào một data.frame trong R từ nhập trực tiếp đến nhập từ các nguồn khác nhau. Sau đây là những cách thông dụng nhất 3.1 Nhập số liệu trực tiếp c Ví dụ 1 chúng ta có số liệu về độ tuổi và insulin cho 10 bệnh nhân như sau và muốn nhập vào R. 50 16.5 62 10.8 60 32.3 40 19.3 48 14.2 47 11.3 57 15.5 70 15.8 48 16.2 67 11.2 Chúng ta có thể sử dụng function có tên c như sau age - c 50 62 60 40 48 47 57 70 48 67 insulin - c 16.5 10.8 32.3 19.3 14.2 11.3 15.5 15.8 16.2 11.2 Lệnh thứ nhất cho R biết rằng chúng ta muốn tạo ra một cột dữ liệu từ nay tôi sẽ gọi là biến số tức variable có tên là age và lệnh thứ hai là tạo ra một cột khác có tên là insulin. Tất nhiên chúng ta có thể lấy một tên khác mà mình thích. Chúng ta dùng function c viết tắt của chữ concatenation - có nghĩa là móc nối vào nhau để nhập dữ liệu. Chú ý rằng mỗi số liệu cho mỗi bệnh nhân được cách nhau bằng một dấu phẩy. Kí hiệu insulin - cũng có thể viết là insulin có nghĩa là các số liệu theo sau sẽ có nằm trong biến số insulin. Chúng ta sẽ gặp kí hiệu này rất nhiều lần trong khi sử dụng R. R là một ngôn ngữ cấu trúc theo dạng đối tượng thuật ngữ chuyên môn là object-oriented language vì mỗi cột số liệu hay mỗi một data.frame là một đối tượng object đối với R. Vì thế age và insulin là hai đối tượng riêng lẻ. Bây giờ chúng ta cần phải nhập hai đối tượng này thành một data.frame để R có thể xử lí sau này. Để làm việc này chúng ta cần đến function data.frame tuan - data.frame age insulin Trong lệnh này chúng ta muốn cho R biết rằng nhập hai cột hay hai đối tượng age và insulin vào một đối tượng có tên là tuan. Đến đây thì chúng ta đã có một đối tượng hoàn chỉnh để tiến hành phân tích thống kê. Để kiểm tra xem trong tuan có gì chúng ta chỉ cần đơn giản gõ tuan Và R sẽ báo cáo age insulin 1 50 16.5 2 62 10.8 3