بازسازی داده‌های گمشده جریان روزانه رودخانه بر اساس روش انتساب چندگانه مبتنی بر معادلات زنجیره‌ای: مطالعه موردی: حوضه آبریز رودخانه کاجو، ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری آب و هواشناسی، گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه‌ریزی محیطی، دانشگاه سیستان و بلوچستان، زاهدان، ایران

2 گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه ریزی محیطی، دانشگاه سیستان و بلوچستان، زاهدان، ایران.

3 گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه‌ریزی محیطی، دانشگاه سیستان و بلوچستان، زاهدان، ایران.

4 پژوهشگر پسادکتری، گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه‌ریزی محیطی، دانشگاه سیستان و بلوچستان، زاهدان، ایران.

5 گروه مهندسی آب، دانشکده مهندسی آب و خاک، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران

10.22059/jwim.2026.408919.1280

چکیده

مقادیر گمشده در مطالعات هیدرولوژی یک چالش رایج برای هیدرولوژیست‌ها محسوب می‌شود، به‌ویژه در تحلیل‌های آماری که به مجموعه داده‌های کامل نیاز است. این پژوهش، عملکرد روش انتساب چندگانۀ جایگزینی مبتنی بر معادلات زنجیره‌ای (MICE) را در پیش‌بینی و بازسازی مقادیر جریان روزانه رودخانه ارزیابی می‌کند. محدوده مورد مطالعه پژوهش، حوضه آبریز رودخانه کاجو در جنوب‌شرق ایران و دوره آماری آن در بازه سال‌های هیدرولوژیکی 1352-1351 تا 1401-1400 می‌باشد. برای بررسی و اعتبارسنجی کارایی رویکرد MICE در مدیریت داده‌های گمشده جریان، از داده‌های تاریخی روزانه کامل جریان در بازه سال‌های هیدرولوژیکی 1392-1391 تا 1401- 1400 استفاده شده است. در ادامه، روش‌های MICE همراه با رگرسیون خطی چندگانه (MLR) برای بازسازی کُل مقادیر گمشده جریان روزانه به‌کار گرفته شده است. برترین روش‌های برآورد با معیارهایی از قبیل ضریب تعیین تعدیل شده (Adj R^2)، خطای استاندارد (RSE) و میانگین درصد خطای مطلق (MAPE) ارزیابی شده است. یافته‌ها نشان داد که روش درختان طبقه‌بندی و رگرسیون (CART) ترکیب شده با MLR با بالاترین مقدار Adj R^2 و کمترین مقادیر RSE و MAPE در مقایسه با سایر روش‌های آزمون شده دارای عملکرد بهتری بوده است. مقادیر RSE و MAPE روش CART-MLR، در ایستگاه پیرسهراب به ترتیب472/0 و 583/0 و در ایستگاه چندوکان 475/0 و 588/0 می‌باشد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Multiple imputations by chained equations for recovering missing daily streamflow observations: a case study of Kajo River catchment in Iran

نویسندگان [English]

  • Fatemeh Ganji Gohari 1
  • Hamid Nazaripour 2
  • Mohammadreza Poodineh 3
  • Mohsen Hamidianpour 3
  • Alireza Ghaemi 4
  • Reza Teimouri 5
1 Ph.D. Student in Climatology, Department of Physical Geography, Faculty of Geography and Environmental Planning, University of Sistan and Baluchestan, Zahedan, Iran
2 Department of Physical Geography, Faculty of Geography and Environmental Planning, University of Sistan and Baluchestan, Zahedan, Iran.
3 Department of Physical Geography, Faculty of Geography and Environmental Planning, University of Sistan and Baluchestan, Zahedan, Iran
4 Postdoctoral Researcher, Department of Physical Geography, Faculty of Geography and Environmental Planning, University of Sistan and Baluchestan, Zahedan, Iran
5 Department of Water Engineering, Faculty of Water and Soil Engineering, Gorgan University of Agricultural Sciences and Natural Resources, Gorgan, Iran
چکیده [English]

Missing values in hydrology studies are a common challenge for hydrologists, especially in statistical analyses that require complete datasets. This research evaluates the performance of the Multiple Imputation by Chained Equations (MICE) method in predicting and reconstructing daily river flow values. The study area is the Kajo River basin in southeastern Iran, and the statistical period covers the hydrological years from 1972-1973 to 2021-2022. To investigate and validate the effectiveness of the MICE approach in managing missing flow data, complete historical daily flow records from the hydrological years 2011–2012 to 2021–2022 were used. Subsequently, the MICE method along with Multiple Linear Regression (MLR) was applied to reconstruct all missing daily flow values. The best-performing estimation methods were evaluated using criteria such as the adjusted coefficient of determination (Adj R²), residual standard error (RSE), and mean absolute percentage error (MAPE). The findings indicated that the Classification and Regression Trees (CART) method combined with MLR outperformed other tested methods, achieving the highest AdjR² value and the lowest RSE and MAPE values. The RSE and MAPE values for the CART-MLR method at the Pirsehrab station are 0.472 and 0.583, respectively, and at the Chandokan station are 0.475 and 0.588, respectively.

کلیدواژه‌ها [English]

  • Missing Data
  • Streamflow
  • Multiple Imputation
  • MICE