Skip to main navigation menu Skip to main content Skip to site footer

SECTION B: LIFE SCIENCES

Vol. 16 No. 1 (2024)

Evaluation of statistical and mathematical methods to estimate missing pluviometric data in the microbasin of the Pita river, Pichincha, Ecuador

DOI
https://doi.org/10.18272/aci.v16i1.3274
Submitted
February 27, 2024
Published
2024-05-09

Abstract

The absence of time series data on meteorological variables is a drawback in environmental sciences, especially with regard to precipitation, which is a key variable in several fields. The present study aimed to compare several statistical and mathematical methods to generate missing pluviometric data in the microbasin of the Pita River, such as the Paulhus and Kohler method, multiple linear regression (MLR), Wavelet transform and artificial neural networks, using information from the hydrometeorological network of the Fund for Water Protection (FONAG) of Quito.

viewed = 399 times

References

  1. Toro Trujillo, A. M., Arteaga Ramírez, R., Vázquez Peña, M. A. y Ibáñez Castillo, L. A. (2017). Relleno de series diarias de precipitación, temperatura mínima, máxima de la región norte del Urabá Antioqueño. Revista Mexicana de Ciencias Agrícolas, 6(3). doi: https://doi.org/10.29312/remexca.v6i3.640
  2. Benítez-Gilabert, M. y Álvarez-Cobelas, M. (2008). Reconstrucción de series temporales en ciencias ambientales. Revista Latinoamericana de Recursos Naturales, 4(3). http://hdl.handle.net/10261/22205
  3. Alfaro, E. J. y Soley, F. J. (2009). Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas. Revista de Matemática: Teoría y Aplicaciones, 16(1). doi: https://doi.org/10.15517/rmta.v16i1.1419
  4. Altamirano, C. y Carrillo, P. (2023). Comparación de técnicas de relleno de datos faltantes de variables meteorológicas en la provincia de Chimborazo. Escuela Superior Politécnica del Chimborazo. http://dspace.espoch.edu.ec/handle/123456789/19932
  5. Muñoz Herrera, W., Bedoya, O. F. y Rincón, M. E. (2020). Aplicación de redes neuronales para la reconstrucción de series de tiempo de precipitación y temperatura utilizando información satelital. Revista EIA, 17(34). doi: https://doi.org/10.24050/reia.v17i34.1292
  6. Pérez Pelea, L. (2019). Valores atípicos en los datos, ¿cómo identificarlos y manejarlos? Revista Del Jardín Botánico Nacional, 40. https://revistas.uh.cu/rjbn/article/view/6537
  7. Herrera Oliva, C. S., Campos Gaytán, J. R. y Carrillo González, F. M. (2017). Estimación de datos faltantes de precipitación por el método de regresión lineal: Caso de estudio Cuenca Guadalupe, Baja California, México. Investigación y Ciencia de La Universidad Autónoma de Aguascalientes, 71. doi: https://doi.org/10.33064/iycuaa201771598
  8. Sayl, K., Adham, A. y Ritsema, C. J. (2020). A GIS-based multicriteria analysis in modeling optimum sites for rainwater harvesting. Hydrology, 7(3). doi: https://doi.org/10.3390/HYDROLOGY7030051
  9. Cardoso Pereira, S., Marta-Almeida, M., Carvalho, A. C. y Rocha, A. (2020). Extreme precipitation events under climate change in the Iberian Peninsula. International Journal of Climatology, 40(2). doi: https://doi.org/10.1002/joc.6269
  10. Carranza, J. M. G., Cortes, M. A. R., Hernandez, L. A. A., Vega, F. C., Vargas, F. L. R., Belmán, J. U. G. y Rangel, J. C. G. (2021). Relleno de datos faltantes en series de datos de precipitación para la ciudad de Guanajuato. Jóvenes En La Ciencia: XXVI Verano de La Ciencia, 10.
  11. Gómez Guerrero, J. S. y Aguayo Arias, M. I. (2019). Evaluación de desempeño de métodos de relleno de datos pluviométricos en dos zonas morfoestructurales del Centro Sur de Chile. Investigaciones Geográficas, 99. doi: https://doi.org/10.14350/rig.59837
  12. Palma, K. (2020). Evaluación del estado del humedal Pugllohuma, perteneciente al Área de Conservación Hídrica Antisana (ACHA), mediante análisis de índices espectrales de imágenes capturadas desde una aeronave no tripulada (UAV) [Tesis Ingeniería, Escuela Politécnica Nacional]. Repositorio Digital Escuela Politécnica Nacional. http://bibdigital.epn.edu.ec/handle/15000/21131
  13. FONAG. (2014). Caracterización biofísica y socioeconómica de le cuenca alta del río Guayllabamba, con énfasis en las subcuencas de los ríos Pita y San Pedro y las microcuencas de los ríos orientales Papallacta y Antisana. FONAG.
  14. Tufiño, S. (2019). Comportamiento hidrológico de la cuenca del río Pita: Perspectiva con el modelo de planificación hídrica [Tesis Ingeniería, Universidad de las Américas]. Repositorio Digital Universidad de las Américas. https://dspace.udla.edu.ec/handle/33000/11325
  15. Melo Martínez, C. E., Malagón Márquez, D. A. y Ramírez Forero, D. D. (2019). Interpoladores determinísticos espaciotemporales, series de tiempo y análisis de datos funcionales para el estudio y predicción de la precipitación en Cundinamarca y Bogotá D.C [Tesis de Grado, Universidad Distrital Francisco José de Caldas]. Repositorio Institucional Universidad Distrital Francisco José de Caldas http://hdl.handle.net/11349/14699
  16. OMM. (2011). Guía de prácticas climatológicas N° 100. Organización Mundial Meteorológica.
  17. Rhif, M., Abbes, A. Ben, Farah, I. R., Martínez, B. y Sang, Y. (2019). Wavelet transform application for/in non-stationary time-series analysis: A review. In Applied Sciences (Switzerland), 9(7). doi: https://doi.org/10.3390/app9071345
  18. Montgomery, K. (2013). Big Data Now. Journal of Chemical Information and Modeling, 53(9). https://pubs.acs.org/toc/jcisd8/53/9
  19. Pinthong, S., Ditthakit, P., Salaeh, N., Hasan, M. A., Son, C. T., Linh, N. T. T., Islam, S. y Yadav, K. K. (2022). Imputation of missing monthly rainfall data using machine learning and spatial interpolation approaches in Thale Sap Songkhla River Basin, Thailand. Environmental Science and Pollution Research. doi: https://doi.org/10.1007/s11356-022-23022-8
  20. Portuguez‐maurtua, M., Arumi, J. L., Lagos, O., Stehr, A. y Arquiñigo, N. M. (2022). Filling Gaps in Daily Precipitation Series Using Regression and Machine Learning in Inter‐Andean Watersheds. Water (Switzerland), 14(11). doi: https://doi.org/10.3390/w14111799
  21. A. De Asis, C. (2021). Comparison of Normal Ratio Method and Distance Power Method for Estimating Missing Rainfall Data with Three Neighboring Stations. Journal of Engineering Research and Reports. doi: https://doi.org/10.9734/jerr/2021/v21i617469
  22. Polpinij, J. y Namee, K. (2021). Comparison of Methods to Estimate Missing Values in Monthly Rainfall Data. 25th International Computer Science and Engineering Conference. doi: https://doi.org/10.1109/ICSEC53205.2021.9684588
  23. Curci, G., Guijarro, J. A., Di Antonio, L., Di Bacco, M., Di Lena, B. y Scorzini, A. R. (2021). Building a local climate reference dataset: Application to the Abruzzo region (Central Italy), 1930–2019. International Journal of Climatology, 41(8). doi: https://doi.org/10.1002/joc.7081
  24. Papailiou, I., Spyropoulos, F., Trichakis, I. y Karatzas, G. P. (2022). Artificial Neural Networks and Multiple Linear Regression for Filling in Missing Daily Rainfall Data. Water (Switzerland), 14(18). doi: https://doi.org/10.3390/w14182892
  25. Gunawardena, N., Durand, P., Hedde, T., Dupuy, F. y Pardyjak, E. (2022). Data Filling of Micrometeorological Variables in Complex Terrain for High-Resolution Nowcasting. Atmosphere, 13(3). doi: https://doi.org/10.3390/atmos13030408
  26. Liyew, C. M. y Melese, H. A. (2021). Machine learning techniques to predict daily rainfall amount. Journal of Big Data, 8(1). doi: https://doi.org/10.1186/s40537-02100545-4
  27. Afrifa-Yamoah, E., Mueller, U. A., Taylor, S. M. y Fisher, A. J. (2020). Missing data imputation of high-resolution temporal climate time series data. Meteorological Applications, 27(1). doi: https://doi.org/10.1002/met.1873
  28. Llamas, R. M., Guevara, M., Rorabaugh, D., Taufer, M. y Vargas, R. (2020). Spatial gap-filling of ESA CCI satellite-derived soil moisture based on geostatistical techniques and multiple regression. Remote Sensing, 12(4). doi: https://doi.org/10.3390/rs12040665
  29. Sentop, M. S., Yucel, M. y Ustundag, B. B. (2023). Spatio-Temporal Missing Data Reconstruction by Using Deep Neural Networks in Agricultural Monitoring Systems. 11th International Conference on Agro-Geoinformatics: Agro-Geoinformatics. doi: https://doi.org/10.1109/Agro-Geoinformatics59224.2023.10233578
  30. Achite, M., Katipoglu, O. M., Şenocak, S., Elshaboury, N., Bazrafshan, O. y Dalkılıç, H. Y. (2023). Modeling of meteorological, agricultural, and hydrological droughts in semi-arid environments with various machine learning and discrete wavelet transform. Theoretical and Applied Climatology, 154(1–2). doi: https://doi.org/10.1007/s00704-023-04564-4
  31. Narimani, R., Jun, C., De Michele, C., Gan, T. Y., Nezhad, S. M. y Byun, J. (2023). Multilayer perceptron-based predictive model using wavelet transform for the reconstruction of missing rainfall data. Stochastic Environmental Research and Risk Assessment, 37(7). doi: https://doi.org/10.1007/s00477-023-02471-8
  32. Vivas, E., de Guenni, L. B., Allende-Cid, H. y Salas, R. (2023). Deep Lagged-Wavelet for monthly rainfall forecasting in a tropical region. Stochastic Environmental Research and Risk Assessment, 37(3). doi: https://doi.org/10.1007/s00477-022-02323-x
  33. Ghamariadyan, M. y Imteaz, M. A. (2021). A wavelet artificial neural network method for medium-term rainfall prediction in Queensland (Australia) and the comparisons with conventional methods. International Journal of Climatology, 41(S1). doi: https://doi.org/10.1002/joc.6775
  34. Park, J., Müller, J., Arora, B., Faybishenko, B., Pastorello, G., Varadharajan, C., Sahu, R. y Agarwal, D. (2023). Long-term missing value imputation for time series data using deep neural networks. Neural Computing and Applications, 35(12). doi: https://doi.org/10.1007/s00521-022-08165-6
  35. Gholami, V. y Sahour, H. (2022). Simulation of rainfall-runoff process using an artificial neural network (ANN) and field plots data. Theoretical and Applied Climatology, 147(1–2). doi: https://doi.org/10.1007/s00704-021-03817-4
  36. Katipoğlu, O. M. (2022). Prediction of missing temperature data using different machine learning methods. Arabian Journal of Geosciences, 15(1). doi: https://doi.org/10.1007/s12517-021-09290-7
  37. Ilaboya, I.R y E, I. O. (2019). Performance of Multiple Linear Regression (MLR) and Artificial Neural Network (ANN) for the Prediction of Monthly Maximum Rainfall in Benin City, Nigeria. International Journal of Engineering Science and Application, 3(1).
  38. Canchala-Nastar, T., Carvajal-Escobar, Y., Alfonso-Morales, W., Loaiza Cerón, W. y Caicedo, E. (2019). Estimation of missing data of monthly rainfall in southwestern Colombia using artificial neural networks. Data in Brief, 26. doi: https://doi.org/10.1016/j.dib.2019.104517
  39. FONAG. (2012). Análisis Gobernanza de la Microcuenca de Río Pita. Fondo Para La Protección Del Agua. FONAG.
  40. Andrade, A. y Yépez, H. (2014). Almacenamiento de agua y cuantificación de carbono en el ecosistema páramo dentro de un esquema Global Environment Oulook (GEO), caso de estudio: Páramo de Píntag-Cuenca Alta del Río Pita [Tesis Ingeniería, Escuela Politécnica Nacional]. Repositorio Digital Escuela Politécnica Nacional. https://bibdigital.epn.edu.ec/handle/15000/7386
  41. Simbaña, K., Romero, D., Yánez, G., Benavides, D., & Navarrete, H. (2019). Evaluación de la calidad del agua del río Pita (Ecuador), implicación para la conservación de la vida acuática y silvestre. InfoANALÍTICA, 7(2). doi: https://doi.org/10.26807/ia.v7i2.104
  42. Das, K. R. y Imon, A. H. M. R. (2014). Geometric median and its application in the identification of multiple outliers. Journal of Applied Statistics, 41(4). doi: https://doi.org/10.1080/02664763.2013.856385
  43. Maharana, K., Mondal, S. y Nemade, B. (2022). A review: Data pre-processing and data augmentation techniques. Global Transitions Proceedings, 3(1). doi: https://doi.org/10.1016/j.gltp.2022.04.020
  44. Barrera-Escoda, A. (2004). Técnicas de completado de series mensuales y aplicación al estudio de la influencia de la NAO en la distribución de la precipitación en España [Tesis Diploma de Estudios Avanzados, Universidad de Barcelona]. Grupo de Análisis de situaciones Meteorológicas Adversas. https://zucaina.net/Publicaciones/barrera-dea.pdf
  45. Guijarro, J. (2023). Guía de uso del paquete de R climatol (versión 4). Climatol. https://www.climatol.eu/climatol4.1-es.pdf
  46. Montero, R. (2016). Modelos de regresión lineal múltiple. Documentos de Trabajo En Economía Aplicada, 3(12). https://www.ugr.es/~montero/matematicas/regresion_lineal.pdf
  47. Hui, E. G. M. (2019). Learn R for Applied Statistics. APRESS. doi: https://doi.org/10.1007/978-1-4842-4200-1
  48. Gamboa, R. (2015). Evaluación de modelos empíricos matemáticos y redes neuronales para estimar datos faltantes en estaciones meteorológicas en México [Tesis, Institución de Enseñanza e Investigación en Ciencias Agrícolas]. Institución de Enseñanza e Investigación en Ciencias Agrícolas. http://colposdigital.colpos.mx:8080/jspui/bitstream/handle/10521/2621/Gamboa_Chel_RO_MC_Hidrociencias_2015.pdf?sequence=1
  49. Quiroz, R., Yarlequé, C., Posadas, A., Mares, V. y Immerzeel, W. W. (2011). Improving daily rainfall estimation from NDVI using a wavelet transform. Environmental Modelling and Software, 26(2). doi: https://doi.org/10.1016/j.envsoft.2010.07.006
  50. Ilyas, H., Raja, M. A. Z., Ahmad, I. y Shoaib, M. (2021). A novel design of Gaussian Wavelet Neural Networks for nonlinear Falkner-Skan systems in fluid dynamics. Chinese Journal of Physics, 72. doi: https://doi.org/10.1016/j.cjph.2021.05.012
  51. Katsavrias, C., Papadimitriou, C., Hillaris, A. y Balasis, G. (2022). Application of Wavelet Methods in the Investigation of Geospace Disturbances: A Review and an Evaluation of the Approach for Quantifying Wavelet Power. Atmosphere, 13(3). doi: https://doi.org/10.3390/atmos13030499
  52. Zamrane, Z., Mahé, G. y Laftouhi, N. E. (2021). Wavelet analysis of rainfall and runoff multidecadal time series on large river basins in western north africa. Water (Switzerland), 13(22). doi: https://doi.org/10.3390/w13223243
  53. Santamaría, F., Cortés, C. A. y Román, Y. F. J. (2012). Uso de la transformada de ondeletas (wavelet transform) en la reducción de ruidos en las señales de campo eléctrico producidas por rayos. Informacion Tecnologica, 23(1). doi: https://doi.org/10.4067/S0718-07642012000100008
  54. Paparoditis, E. (2010). Wavelet Methods in Statistics with R. Journal of the Royal Statistical Society Series A: Statistics in Society, 173(1). doi: https://doi.org/10.1111/j.1467-985x.2009.00624_7.x
  55. Lantz, B. (2015). Machine Learning with R: Second Edition. Packt Publishing. https://www.oreilly.com/library/view/machine-learning-with/9781784393908/
  56. Franklin, J. (2005). The elements of statistical learning: data mining, inference and prediction. In Mathematical Intelligencer, 27(2). doi: https://doi.org/10.1007/BF02985802
  57. Dangeti, P. (2017). Statistics for Machine Learning: Techniques for exploring supervised, unsupervised, and reinforcement learning models with Python and R. Packt Publishing. https://dl.acm.org/doi/book/10.5555/3164859
  58. Toral, J. (2012). Redes Neuronales. Universidad de Guadalajara.
  59. Raschka, S. y Mirjalili, V. (2019). Python Machine Learning. Machine Learning and Deep Learning with Python, scikitlearn, and TensorFlow 2. Packt Publishing. https://books.google.com.ec/books/about/Python_Machine_Learning. html?id=sKXIDwAAQBAJ&redir_esc=y
  60. Sánchez, N. (2020). Estudio comparativo de modelos de predicción estocásticos y heurísticos aplicados a la estimación de la calidad del aire. Universitat Oberta de Catalunya.
  61. Ortega, R. M. M., Pendás, L. C. T., Ortega, M. M., Abreu, A. P. y Cánovas, A. M. (2009). El coeficiente de correlación de los rangos de spearman caracterizacion. Revista Habanera de Ciencias Medicas, 8(2). https://www.redalyc.org/pdf/1804/180414044017.pdf
  62. Ali, S. y Shahbaz, M. (2020). Streamflow forecasting by modeling the rainfall– streamflow relationship using artificial neural networks. Modeling Earth Systems and Environment, 6(3). doi: https://doi.org/10.1007/s40808-020-00780-3
  63. Cartaya, S., Zurita, S. y Montalvo, V. (2016). Métodos de ajuste y homogenización de datos climáticos para determinar índice de humedad de Lang en la provincia de Manabí, Ecuador. La Técnica: Revista de Las Agrociencias. ISSN 2477-8982, 16. doi: https://doi.org/10.33936/la_tecnica.v0i16.540
  64. Poblete, D., Arevalo, J., Nicolis, O. y Figueroa, F. (2020). Optimization of hydrologic response units (Hrus) using gridded meteorological data and spatially varying parameters. Water (Switzerland), 12(12). doi: https://doi.org/10.3390/w12123558
  65. Krleža, D., Vrdoljak, B. y Brčić, M. (2021). Statistical hierarchical clustering algorithm for outlier detection in evolving data streams. Machine Learning, 110(1). doi: https://doi.org/10.1007/s10994-020-05905-4
  66. Xu, L., Chen, N., Moradkhani, H., Zhang, X. y Hu, C. (2020). Improving Global Monthly and Daily Precipitation Estimation by Fusing Gauge Observations, Remote Sensing, and Reanalysis Data Sets. Water Resources Research, 56(3). doi: https://doi.org/10.1029/2019WR026444
  67. Kuriqi, A., Ali, R., Pham, Q. B., Montenegro Gambini, J., Gupta, V., Malik, A., Linh, N. T. T., Joshi, Y., Anh, D. T., Nam, V. T. y Dong, X. (2020). Seasonality shift and streamflow flow variability trends in central India. Acta Geophysica, 68(5). doi: https://doi.org/10.1007/s11600-020-00475-4
  68. Salazar, A. (2019). Estimación de niveles medios diarios en estaciones específicas en el río Magdalena a partir de esta variable en estaciones de aguas arriba y de afluentes mediante relaciones empíricas. Casos de estudio: Purificación, Puerto Berrío y Calamar [Tesis de Maestría, Universidad de los Andes]. Repositorio Institucional Séneca Universidad de los Andes. http://hdl.handle.net/1992/43914
  69. Sifuzzaman, M., Islam, M. R. y Ali, M. Z. (2009). Application of Wavelet Transform and its Advantages Compared to Fourier Transform. Journal of Physical Sciences, 13. https://www.researchgate.net/publication/242602743_Application_of_Wavelet_Transform_and_its_Advantages_Compared_to_Fourier_Transform
  70. Alfaro, R. y Pacheco, R. (2000). Aplicación de algunos métodos de relleno a series anuales de lluvia de diferentes regiones de Costa Rica. Tópicos Meteorológicos y Oceanográficos, 7. https://www.researchgate.net/publication/237217878_Aplicacion_de_algunos_metodos_de_relleno_a_series_anuales_de_lluvia_de_diferentes_regiones_de_Costa_Rica
  71. Tealab, A., Hefny, H. y Badr, A. (2017). Forecasting of nonlinear time series using ANN. Future Computing and Informatics Journal, 2(1). doi: https://doi.org/10.1016/j.fcij.2017.05.001
  72. García Valero, J. A. (2021). Redes Neuronales Artificiales. Aplicación a la regionalización de la precipitación y temperaturas diarias. Agencia Estatal de Meteorología AEMET. doi: https://doi.org/10.31978/666-20-028-5
  73. Baño-Medina, J. y Gutiérrez, J. M. (2018). Deep Convolutional Neural Networks For Feature Selection in Statistical Downscaling. 8th International Workshop in Climate Informatics.