tailieunhanh - Ứng dụng phương pháp khoa học dữ liệu để dự báo tuổi phát triển của sâm và phân tích các yếu tố ảnh hưởng

Bài viết Ứng dụng phương pháp khoa học dữ liệu để dự báo tuổi phát triển của sâm và phân tích các yếu tố ảnh hưởng dựa trên cơ sở dữ liệu thực nghiệm thu thập được nhằm xây dựng và đánh giá hiệu suất của 3 mô hình máy học: Tăng cường độ dốc cực cao - Extreme Gradient Boosting (XGB), Tăng cường độ dốc nhẹ - Light Gradient Boosting (LGB) và Tăng cường độ dốc - Gradient Boosting (GB) trong việc dự đoán CAG. | Journal of Science and Transport Technology University of Transport Technology Application of data science approach to predicting the cultivation ages of ginseng and analyzing affecting variables Do Quang Hung1 Ngo Thi Thu Tinh1 Nguyen Phuong Linh2 1 University of Transport Technology Hanoi 100000 Vietnam 2 Hanoi - Amsterdam Highschool for the Gifted Hanoi 100000 Vietnam Article info Abstract The cultivation ages of ginseng are important factors that influence the Type of article quality and price of ginseng. Recent advances in data science have created great Original research paper benefits for various practical applications. In data science machine learning plays a vital role to discover the insights from data. This study develops and assesses Corresponding author the performance of three machine learning models including Extreme Gradient E-mail address Boosting XGB Light Gradient Boosting LGB and Gradient Boosting GB in tinhntt@ predicting the cultivation age of ginseng CAG . The models are developed based on 106 data samples with nine input parameters and one output parameter. The K- Received 21 7 2022 fold cross-validation technique is used to improve the models generalizability and Accepted 22 8 2022 predictive performance. Importantly the XGB model is optimized to find the Published 24 8 2022 hyperparameters. The predictive performance of the optimal XGB model is compared to the performance of the LG and GB models. The results show that the XGB is the best model with very high predictive performance R 2 RMSE years MAE years . The sensitivity analysis using the feature importance is performed to evaluate the influence of input variables on the predicted CAG. Keywords Cultivation age of ginseng CAG Machine learning ML Extreme Gradient Boosting XGB Data science. JSTT 2022 2 3 25-38 https vn Tạp chí điện tử Khoa học và Công nghệ Giao thông Trường Đại học Công nghệ GTVT Ứng dụng phương pháp khoa học dữ liệu để dự báo

TỪ KHÓA LIÊN QUAN