tailieunhanh - Giáo trình -Phân tích số liệu bằng R - chương 11-12

11 Phân tích phương sai (Analysis of variance) Phân tích phương sai, như tên gọi, là một số phương pháp phân tích thống kê mà trọng điểm là phương sai (thay vì số trung bình). Phương pháp phân tích phương sai nằm trong “đại gia đình” các phương pháp có tên là mô hình tuyến tính (hay general linear models), bao gồm cả hồi qui tuyến tính mà chúng ta đã gặp trong chương trước. Trong chương này, chúng ta sẽ làm quen với cách sử dụng R trong phân tích phương sai. Chúng ta sẽ bắt đầu bằng một phân. | 11 Phân tích phương sai Analysis of variance Phân tích phương sai như tên gọi là một số phương pháp phân tích thống kê mà trọng điểm là phương sai thay vì số trung bình . Phương pháp phân tích phương sai nằm trong đại gia đình các phương pháp có tên là mô hình tuyến tính hay general linear models bao gồm cả hồi qui tuyến tính mà chúng ta đã gặp trong chương trước. Trong chương này chúng ta sẽ làm quen với cách sử dụng R trong phân tích phương sai. Chúng ta sẽ bắt đầu bằng một phân tích đơn giản sau đó sẽ xem đến phân tích phương sai hai chiều và các phương pháp phi tham số thông dụng. Phân tích phương sai đơn giản one-way analysis of variance - ANOVA Ví dụ 1. Bảng thống kê dưới đây so sánh độ galactose trong 3 nhóm bệnh nhân nhóm 1 gồm 9 bệnh nhân với bệnh Crohn nhóm 2 gồm 11 bệnh nhân với bệnh viêm ruột kết colitis và nhóm 3 gồm 20 đối tượng không có bệnh gọi là nhóm đối chứng . Câu hỏi đặt ra là độ galactose giữa 3 nhóm bệnh nhân có khác nhau hay không Gọi giá trị trung bình của ba nhóm là P1 p2 và L13 và nói theo ngôn ngữ của kiểm định giả thiết thì giả thiết đảo là Ho P1 L12 L13 Và giả thiết chính là HA có một khác biệt giữa 3 Pj j 1 2 3 Bảng . Độ galactose cho 3 nhóm bệnh nhân Crohn viêm ruột kết và đối chứng Nhóm 1 bệnh Crohn Nhóm 2 bệnh viêm ruột kết Nhóm 3 đối chứng control 1343 1264 1809 2850 1393 1314 1926 2964 1420 1399 2283 2973 1641 1605 2384 3171 1897 2385 2447 3257 2160 2511 2479 3271 2169 2514 2495 3288 2279 2767 2525 3358 2890 2827 2541 3643 2895 2769 3657 3011 n 9 Trung bình 1910 SD 516 n 11 Trung bình 2226 SD 727 n 20 Trung bình 2804 SD 527 Chú thích SD là độ lệch chuẩn standard deviation . Thoạt đầu có lẽ bạn đọc sau khi đã học qua phương pháp so sánh hai nhóm bằng kiểm định t sẽ nghĩ rằng chúng ta cần làm 3 so sánh bằng kiểm định t giữa nhóm 1 và 2 nhóm 2 và 3 và nhóm 1 và 3. Nhưng phương pháp này không hợp lí vì có ba phương sai khác nhau. Phương pháp thích hợp cho so sánh là phân tích phương sai. Phân tích phương sai có thể ứng

TỪ KHÓA LIÊN QUAN