Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/10495/41736
Título : | Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
Autor : | Londoño García, Tomás |
metadata.dc.contributor.advisor: | Parra Toro, Juan Camilo |
metadata.dc.subject.*: | Análisis de datos Data analysis Aprendizaje automático (inteligencia artificial) Machine learning Caudal de la corriente de agua Stream flow Datos nulos Valores faltantes Imputación de datos Métodos determinísticos http://aims.fao.org/aos/agrovoc/c_1cb3b243 http://vocabularies.unesco.org/thesaurus/concept2214 |
Fecha de publicación : | 2024 |
Resumen : | RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas de evaluación (MSE, similitud, R², correlación de Spearman, coeficiente de variación y rango intercuartílico), se encontró que la interpolación lineal fue la técnica más precisa. El spline, si bien puede capturar tendencias a largo plazo, presentó dificultades para modelar picos y cambios bruscos en los caudales horarios. La media móvil, por otro lado, fue efectiva para suavizar la serie y capturar la tendencia general, pero no se adaptó bien a variaciones bruscas en los datos. Los métodos basados en modelos de aprendizaje automático (KNN y MissForest) presentaron un mayor costo computacional y, en general, resultados menos precisos. Estos resultados sugieren que, para series de tiempo de caudales horarios, con las características analizadas, la interpolación lineal podría ser una opción sólida y eficiente para imputar datos faltantes. Sin embargo, se recomienda evaluar otras técnicas en futuros estudios con diferentes características de los datos (como el uso de variables meteorológicas) y con ventanas de valores faltantes del orden de semanas. |
Aparece en las colecciones: | Especializaciones de la Facultad de Ingeniería |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
LondoñoTomás_2024_ImputaciónDatosFaltantes.pdf | Trabajo de grado de especialización | 1.94 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons