Đang chuẩn bị liên kết để tải về tài liệu:
HỒI QUI TUYẾN TÍNH (Linear regression)

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

Phân tích hồi qui (Regression) là kỹ thuật rất thường dùng trong thống kê y học nhằm tiên đoán giá trị của một đặc điểm khi đã biết giá trị của một đặc điểm khác. Như vậy, phân tích hồi qui chỉ giúp tiên đoán (hoặc ước lượng) khi 2 biến số có mối tương quan khá tốt. Sở dĩ gọi là hồi qui tuyến tính vì kỹ thuật chỉ giúp đo đạc các mối liên quan tuyến tính (theo đường thẳng). Sở dĩ gọi là hồi đơn biến (simple linear regression) vì chỉ dùng 1 biến số này (gọi. | HỒI QUI TUYẾN TÍNH Linear regression I. GIỚI THIỆU Phân tích hồi qui Regression là kỹ thuật rất thường dùng trong thống kê y học nhằm tiên đoán giá trị của một đặc điểm khi đã biết giá trị của một đặc điểm khác. Như vậy phân tích hồi qui chỉ giúp tiên đoán hoặc ước lượng khi 2 biến số có mối tương quan khá tốt. Sở dĩ gọi là hồi qui tuyến tính vì kỹ thuật chỉ giúp đo đạc các mối liên quan tuyến tính theo đường thẳng . Sở dĩ gọi là hồi đơn biến simple linear regression vì chỉ dùng 1 biến số này gọi là biến số độc lập - independent variable hay biến số giải thích -explanatory variable để tiên đoán hay ước lượng ra biến số kia biến số phụ thuộc -dependent variable . Trong hồi qui đa biến - multiple regression có nhiều hơn 1 independent variable được sử dụng để tiên đoán. II. THIẾT LẬP PHƯƠNG TRÌNH HỒI QUI MẪU Sample regression equation Phương trình pt hồi qui mẫu là pt được thiết lập từ số liệu của 1 mẫu rút ra từ dân số và sẽ được suy diễn như 1 pt hồi qui cho dân số nếu thích hợp . Khái niệm về đường thẳng vừa khít nhất line of best fit Giống như trường hợp với Pearson r giả định quan trọng nhất trong hồi qui tuyến tính là 2 biến số được xem xét có mối liên quan tuyến tính với nhau. Nghĩa là một đường thẳng có thể được sử dụng để mô tả mối liên quan này. Công thức đại số của pt đường thẳng là y a bx theo đó b là độ dốc slope của đường thẳng và a là điểm cắt intercept của đường thẳng vào trục y. Độ dốc cho biết sự thay đổi trung bình ở y có được khi x thay đổi. Độ dốc càng nhiều đường thẳng dựng đứng hơn thì y cũng thay đổi nhiều hơn tương ứng với mỗi thay đổi của x và mối tương quan của 2 biến số cũng mạnh hơn. Giá trị tại điểm cắt a cho biết giá trị trung bình của y khi x 0. y x Với 2 điểm bất kỳ rất dễ để xác định phương trình đường thẳng. Tuy nhiên khi có nhiều điểm hơn 3 điểm khó có thể tìm thấy 1 đường thẳng đi qua các điểm này cùng 1 lúc ngoại trừ khi có mối tương quan tuyệt đối 1. Như vậy trong hồi qui tuyến tính cần phải tìm một đường thẳng vừa khít nhất với