tailieunhanh - So sánh một số phương pháp xử lý dữ liệu thiếu cho chuỗi dữ liệu thời gian một chiều
Bài viết này trước tiên nhằm giới thiệu các phương pháp xử lý dữ liệu thiếu. Tiếp theo một framework cho phép điền đầy dữ liệu mất mát cho chuỗi thời gian đơn biến được xây dựng. Cuối cùng, chúng tôi thực hiện so sánh hiệu suất của các phương pháp ước lượng giá trị thiếu trên ba chuỗi dữ liệu thời gian thực sử dụng bốn chỉ số đánh giá. Thông qua kết quả thử nghiệm, phương pháp DTWBI và eDTWBI đạt được kết quả vượt trội hơn các phương pháp khác khi dữ liệu có tính chất mùa vụ và không có thành phần xu hướng, trong khi đó thì tốt hơn các phương pháp khi dữ liệu có cả hai tính chất mùa vụ và xu hướng. | Vietnam J. Agri. Sci. 2021 Vol. 19 No. 4 452-461 Tạp chí Khoa học Nông nghiệp Việt Nam 2021 19 4 452-461 SO SÁNH MỘT SỐ PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU THIẾU CHO CHUỖI DỮ LIỆU THỜI GIAN MỘT CHIỀU Phan Thị Thu Hồng Khoa Công nghệ thông tin Học viện Nông nghiệp Việt Nam Tác giả liên hệ ptthong@ Ngày nhận bài Ngày chấp nhận đăng TÓM TẮT Chuỗi thời gian chứa các giá trị thiếu xảy ra trong hầu hết mọi lĩnh vực khoa học ứng dụng. Bỏ qua các giá trị thiếu có thể dẫn đến giảm hiệu năng của hệ thống và kết quả không đáng tin cậy đặc biệt là khi dữ liệu mất theo khoảng lớn. Do đó xử lý dữ liệu thiếu là một bước rất quan trọng để thực hiện các công việc tiếp như phân lớp phân tích dữ liệu. Bài viết này trước tiên nhằm giới thiệu các phương pháp xử lý dữ liệu thiếu. Tiếp theo một framework cho phép điền đầy dữ liệu mất mát cho chuỗi thời gian đơn biến được xây dựng. Cuối cùng chúng tôi thực hiện so sánh hiệu suất của các phương pháp ước lượng giá trị thiếu trên ba chuỗi dữ liệu thời gian thực sử dụng bốn chỉ số đánh giá. Thông qua kết quả thử nghiệm phương pháp DTWBI và eDTWBI đạt được kết quả vượt trội hơn các phương pháp khác khi dữ liệu có tính chất mùa vụ và không có thành phần xu hướng trong khi đó thì tốt hơn các phương pháp khi dữ liệu có cả hai tính chất mùa vụ và xu hướng. Từ khóa Chuỗi thời gian một chiều dữ liệu thiếu ước lượng giá trị thiếu độ tương tự. An Empirical Study of Imputation Methods for Univariate Time Series ABSTRACT Time series with missing values occur in almost areas of applied science. Ignoring missing values can lead to a reduction of system performance and unreliable results especially in case of large missing values. Therefore handling missing data is an important task to effectively perform further purposes such as classification data analysis etc. This article aims first to introduce approaches for dealing with missing data. Next a framework is built to fill the incomplete data in univariate
đang nạp các trang xem trước