tailieunhanh - TƯƠNG QUAN TUYẾN TÍNH (Linear correlation)

Phân tích tương quan (Correlation) là kỹ thuật rất thường dùng trong thống kê y học nhằm khảo sát mối liên quan giữa 2 biến số đo trên cùng các đối tượng thông qua hệ số tương quan (correlation coefficient). Có nhiều loại hệ số tương quan (HSTQ) nhưng bài này chỉ trình bày hệ số tương quan r của Pearson (Pearson r correlation coefficient). Pearson r là số đo mối liên quan tuyến tính của 2 biến số, và được sử dụng khi 2 biến số thuộc thang đo lường tỉ số hoặc thang khoảng. . | TƯƠNG QUAN TUYẾN TÍNH Linear correlation I. GIỚI THIỆU Phân tích tương quan Correlation là kỹ thuật rất thường dùng trong thống kê y học nhằm khảo sát mối liên quan giữa 2 biến số đo trên cùng các đối tượng thông qua hệ số tương quan correlation coefficient . Có nhiều loại hệ số tương quan HSTQ nhưng bài này chỉ trình bày hệ số tương quan r của Pearson Pearson r correlation coefficient . Pearson r là số đo mối liên quan tuyến tính của 2 biến số và được sử dụng khi 2 biến số thuộc thang đo lường tỉ số hoặc thang khoảng. II. CÁCH TÍNH và ĐẢC ĐIỂM CỦA PEARSON r Để tính được Pearson r cần phải đo dược 2 biến số x và y - thí dụ chiều cao x và cân nặng y . Các số đo này phải được lấy thành cặp đối với từng thành viên của 1 mẫu ngẫu nhiên đơn giản rút ra từ 1 dân số. Công thức tính r _ xy ĐẶC ĐIỂM Giá trị của Pearson r nằm trong khoảng -1 đến 1. Một HSTQ bằng -1 cho thấy 2 biến số có mối liên quan nghịch chiều tuyệt đối perfect negative relationship liên quan nghịch chiều x tăng y giảm x giảm y tăng . Một HSTQ bằng 1 cho thấy 2 biến số có mối liên quan thuận chiều tuyệt đối. perfect positive relationship liên quan thuận chiều x tăng y tăng x giảm y giảm Một HSTQ bằng 0 cho thấy không có mối liên quan giữa 2 biến số. Giá trị tính được của Pearson r không phụ thuộc vào các đơn vị của x và y. Giá trị của Pearson r bị ảnh hưởng rất nhiều bởi giá trị cực giống như ĐLC . Giả định cơ bản của Pearson r là mối liên quan giữa 2 biến số là mối liên quan tuyến tính. Do vậy việc dựng các biểu đồ phân tán scatter diagram với x ở trục ngang và y ở trục dọc của đồ thị sẽ giúp đánh giá mối liên quan giữa 2 biến số. Nếu các điểm trên đồ thị nằm sát 1 đường thẳng hướng chéo lên trên hoặc chéo xuống dưới thì 2 biến số được xem là có mối liên quan tuyến tính và việc sử dụng Pearson r là hoàn toàn thích hợp. A B F C DE Hình 1. Scatter plot và correlation. A r 1 B r 0 7 C r -0 9 D r -0 4 E r 0 0 F r 0 0 III. KIỂM ĐỊNH GIẢ THUYẾT VỀ PEARSON r Pearson r là số thống kê tính được từ 1 mẫu rút ra từ