tailieunhanh - Một số lưu ý khi sử dụng tương quan Pearson

Bài báo này nêu ra một số lưu ý khi sử dụng hệ số tương quan Pearson. Dựa trên một số chuỗi số liệu giả lập, tác giả đã chỉ ra ảnh hưởng của các giá trị quan trắc bất thường tới chất lượng của hệ số Pearson. Tác giả cho rằng hiển thị số liệu theo dạng đồ thị là một trong những cách thức đơn giản và hiệu quả để khảo sát chuỗi số liệu trước khi tính toán hệ số Pearson. | NGHIÊN CỮU TRAO ĐỔI MỘT SỐ LƯU Ý KHI SỬ DỤNG TƯƠNG QUAN PEARSON TS. Nguyễn Đăng Quang Trung tâm Dự báo khí tượng thủy văn Trung ương gài báo này nêu ra một số lưu ý khi sử dụng hệ số tương quan Pearson. Dựa trên một số chuỗi số liệu giả lập chúng tôi đã chỉ ra ảnh hưởng của các giá trị quan trắc bất thường tới chất lượng của hệ số Pearson. Chúng tôi cho rồng hiển thị số liệu theo dạng đổ thị là một trong những cách thức đơn giản và hiệu quả để khảo sát chuỗi số liệu trước khi tính toán hệ số Pearson. 1. Đặt vấn đề Hệ số tương quan Pearson là một trong những trị số được sử dụng phổ biến nhất trong khí tượng thủy văn để xác định mối liên hệ tuyến tính giữa hai chuỗi số liệu. Ví dụ ta muốn xác định mối liên hệ giữa chuỗi 40 năm 1965-2014 số liệu nhiệt độ bể mặt đất tại trạm Phù Liễn với chuỗi số liệu tương ứng tại Hà Nội công thức tính hê số tương quan Pearson giữa Phù Liễn và Hà Nội được biểu diễn nhưsau r C0V x y - X1 2 K y - y 2 trong đó X y tương ứng với chuỗi nhiệt độ tại Phù Liễn và Hà Nội. Hệ số tương quan giữa X và y kí hiệu là rxy cho ta biết mức độ phụ thuộc tuyến tính giữa X và y. Hệ số này được tính bằng tỉ số giữa hiệp phương sai của hai biến X y và tích của độ lệch chuẩn sx sy của chúng n là độ dài của chuối số liệu trong ví dụ nêu trên thì n 40. Hệ số tương quan rxy dao động trong khoảng -1 số tuyệt đối của hệ số càng lớn thì tương quan giữa hai chuỗi số liệu càng lớn và ngược lại. Nếu hai biến là độc lập thống kê thì hệ số tương quan rXy bằng 0 1 . Trong phạm vi bài viết này chúng tôi đưa ra một số lưu ý khi thao tác tính toán hệ sô tương quan Pearson trên các chuỗi số liệu. Những lưu ý này được nhà toán học người Anh Francis John Frank Anscombe mô tả 2 Nay chúng tôi giả lập một số chuỗi số liệu khí tượng để minh họa một cách tường minh hơn. Bảng 1. Chuẩn sai nhiệt độ tháng 1 tại 2. Tiến hành thử nghiêm Chuỗi số liệu giả định chuẩn sai nhiệt độ tháng 1 C tại 6 trạm được dẫn ra trong bảng 1. Sáu chuỗi số liệu giả định này tuy có những đặc trưng .

TỪ KHÓA LIÊN QUAN