ارزیابی دقت الگوریتم‌های مختلف یادگیری ماشین در پیش‌بینی تبخیر – تعرق محصول خیار گلخانه‌ای

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی آبیاری و آبادانی، دانشکده کشاورزی، پردیس کشاورزی و منابع طبیعی، دانشگاه تهران، کرج، ایران.

2 گروه مهندسی آبیاری و آبادانی، دانشکده کشاورزی، پردیس کشاورزی و منابع طبیعی، دانشگاه تهران، کرج، ایران

3 استاد، پردیس کشاورزی و منابع طبیعی، گروه آب، تخصص: آب و خاک/ محیط زیست و مدلینگ

4 گروه علوم باغبانی و فضای سبز، دانشکده کشاورزی، پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران.

5 گروه علوم و مهندسی خاک، دانشکده کشاورزی، پردیس کشاورزی و منابع طبیعی، دانشگاه تهران، کرج، ایران.

10.22059/jwim.2025.399994.1251

چکیده

در این پژوهش، تبخیر – تعرق گیاه خیار گلخانه‌ای (رقم تالیسیا) در دو فصل رشد پاییز – زمستان 1401 و بهار – تابستان 1402 در گلخانه‌ای واقع در پردیس کشاورزی و منابع طبیعی دانشگاه تهران با هدف مدل‌سازی ETc مورد بررسی قرار گرفت. ETc با استفاده از سنسورهای TDR نصب‌شده در عمق 30 سانتی‌متر و معادله بیلان آب خاک اندازه‌گیری شد. ETo نیز به کمک میکرولایسیمتر چمن اندازه‌گیری شد. متغیرهای ورودی مدل شامل ده ویژگی از جمله دما، رطوبت نسبی، تابش خورشیدی، ETo و روز پس از انتقال نشاء بودند. تحلیل همبستگی نشان داد که تابش، دمای میانگین و روز پس از انتقال نشاء بیشترین رابطه مثبت با ETc دارند. برای پیش‌بینی ETc، شش الگوریتم یادگیری ماشین شامل PCR، PLS، SVM، RF، GB و XGB در پایتون پیاده‌سازی و هایپرپارامترهای هر کدام با الگوریتم TPE از کتابخانه Optuna بهینه‌سازی شدند. ارزیابی مدل‌ها با شاخص‌های آماری و اعتبارسنجی متقابل پنج بخشی انجام شد. نتایج نشان داد، الگوریتم GB با میانگین R2، RMSE، MAE و NSE به‌ترتیب برابر با 0.9، 0.59 میلی متر در روز، 0.41 میلی متر در روز و 0.89، بالاترین دقت و عملکرد را نسبت به سایر مدل‌ها دارد. به‌دنبال آن الگوریتم‌های XGB، RF و SVM نیز با عملکرد نزدیک به GB قرار گرفتند و با آن اختلاف معنی‌دار نداشتند. تحلیل SHAP نیز نشان داد متغیرهای روز پس از انتقال نشاء، ETo و تابش بیشترین نقش را در مدل‌ها دارند. این پژوهش نشان داد که مدل‌های درخت‌محور می‌توانند ابزار دقیقی برای مدیریت نیاز آبی خیار گلخانه‌ای باشند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Evaluation of the Accuracy of Different Machine Learning Algorithms in Predicting Greenhouse Cucumber Crop Evapotranspiration

نویسندگان [English]

  • Morteza khoshsimaie chenar 1
  • Hamideh Noory 2
  • Abdolmajid Liaghat 3
  • Forouzandeh Soltani Salehabadi 4
  • Babak Motesharezadeh 5
1 Department of Irrigation and Reclamation Engineering, Faculty of Agriculture, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran.
2 Department of Irrigation and Reclamation Engineering, Faculty of Agriculture, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran
3
4 Department of Horticultural Science and Landscape Architecture, Faculty of Agriculture, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran.
5 Department of Soil Science, Faculty of Agriculture, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran.
چکیده [English]

In this study, the crop evapotranspiration (ETc) of greenhouse cucumber was modeled during two distinct growing seasons: autumn–winter 2022–2023 and spring–summer 2023, within a controlled greenhouse environment located at the College of Agriculture and Natural Resources, University of Tehran. ETc was estimated using soil water balance equations informed by data from Time Domain Reflectometry (TDR) sensors installed at a soil depth of 0–30 cm. Reference evapotranspiration (ETo) was measured with a micro-lysimeter containing turfgrass. The model’s input variables included ten features, such as air temperature, relative humidity, solar radiation, ETo, and days after transplanting (DAT). Correlation analysis revealed that solar radiation, mean temperature, and DAT exhibited the strongest positive relationships with ETc. To predict ETc, six machine learning algorithms—Principal Component Regression (PCR), Partial Least Squares (PLS), Support Vector Machine (SVM), Random Forest (RF), Gradient Boosting (GB), and Extreme Gradient Boosting (XGB)—were implemented in Python. The hyperparameters of each model were optimized using the Tree-structured Parzen Estimator (TPE) algorithm from the Optuna library. Model performance was evaluated through five-fold cross-validation using R², RMSE, MAE, and NSE as performance metrics. Results indicated that the GB algorithm achieved the highest predictive accuracy, with average R², RMSE, MAE, and NSE values of 0.90, 0.59 mm/day, 0.41 mm/day, and 0.89, respectively. XGB, RF, and SVM followed closely with no statistically significant difference compared to GB. SHAP analysis identified DAT, ETo, and solar radiation as the most influential features across models., This study demonstrates that tree-based machine learning models offer robust and accurate tools for managing the water requirements of greenhouse cucumber cultivation.

کلیدواژه‌ها [English]

  • Reference evapotranspiration
  • SHAP analysis
  • Soil water balance
  • XGBoost algorithm