tailieunhanh - Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 4 - Học viện Ngân hàng
Bài thực hành 4 - Phân tích dữ liệu bằng biểu đồ. Những nội dung được trình bày trong bài gồm: Các hàm R cơ bản, đọc dữ liệu, Biểu đồ phân bố (histogram), biểu đồ hộp (box plot), biểu đồ thanh (bar plot), biểu đồ tương quan (scatter plot). | Phân tích dữ liệu với R Chương 2 _ phần 4 Phân tích dữ liệu bằng biểu đồ Các hàm R cơ bản Biểu đồ phân bố (histogram) Biểu đồ hộp (box plot) Biểu đồ thanh (bar plot) Biểu đồ tương quan (scatter plot) Đọc dữ liệu > setwd("D:/") > ob = ("", header = T) > attach(ob) > head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace 1 7 6900 0 79 16080 15 1 0 1 2 8 5400 0 67 14100 15 1 0 1 3 9 5040 0 96 12420 15 1 0 1 4 11 6300 0 84 15720 15 1 0 1 5 12 6000 0 88 8880 12 1 0 1 6 18 6900 0 72 10380 15 1 0 1 Mục đích Muốn mô tả phân bố biến salnow Phân bố salnow có khác nhau giữa nam và nữ (sex) Hàm hist () Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob) Hist(salnow) > hist(salnow, col= "blue", border = "white") hist(salnow, col= "blue", border = "white", xlab = "lương hiện tại ($)", ylab = "tỉ lệ", prob = T, main = "Phân bố mức lương hiện tại của nhân viên") Hàm boxplot Boxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal) Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal) boxplot(salnow) boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue") boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue") boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T) boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T) boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T) Hàm barplot table (groupA, GroupB) means = with(data,tapply(var,group, mean)) barplot(table, horiz) barplot(mean, horiz) f = table(sex) barplot(f) barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề") Hàm plot() plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd) abline(lm(varX~varY),col = , lwd) plot(salnow~edlevel,ch =16, . | Phân tích dữ liệu với R Chương 2 _ phần 4 Phân tích dữ liệu bằng biểu đồ Các hàm R cơ bản Biểu đồ phân bố (histogram) Biểu đồ hộp (box plot) Biểu đồ thanh (bar plot) Biểu đồ tương quan (scatter plot) Đọc dữ liệu > setwd("D:/") > ob = ("", header = T) > attach(ob) > head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace 1 7 6900 0 79 16080 15 1 0 1 2 8 5400 0 67 14100 15 1 0 1 3 9 5040 0 96 12420 15 1 0 1 4 11 6300 0 84 15720 15 1 0 1 5 12 6000 0 88 8880 12 1 0 1 6 18 6900 0 72 10380 15 1 0 1 Mục đích Muốn mô tả phân bố biến salnow Phân bố salnow có khác nhau giữa nam và nữ (sex) Hàm hist () Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob) Hist(salnow) > hist(salnow, col= "blue", border = "white") hist(salnow, col= "blue", border = "white", xlab = "lương hiện tại ($)", ylab = "tỉ lệ", prob = T, main = "Phân bố mức lương hiện tại của nhân viên") Hàm boxplot Boxplot(var, .
đang nạp các trang xem trước