Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/10495/29068
Título : | Estimación de áreas a cultivar en Colombia |
Autor : | Gomez Osorno, Jesús David |
metadata.dc.contributor.advisor: | Botia Valderrama, Javier Fernando |
metadata.dc.subject.*: | Aprendizaje automático (inteligencia artificial) Machine learning Técnicas de predicción Forecasting Análisis de datos Data analysis Agricultura Agriculture Cosecha Harvesting http://aims.fao.org/aos/agrovoc/c_3041 http://aims.fao.org/aos/agrovoc/c_15962 http://aims.fao.org/aos/agrovoc/c_203 http://aims.fao.org/aos/agrovoc/c_3500 |
Fecha de publicación : | 2022 |
Resumen : | RESUMEN : En esta monografía, se centra en el escenario de diferentes cultivos entre el año 2007 y 2018 que está organizado en una base de datos del Ministerio de Agricultura y Desarrollo Rural, el cual son datos abiertos del Gobierno Colombiano. El principal problema que se enfoca en resolver la monografía es encontrar un modelo predictivo capaz de estimar la cantidad de área necesaria en un cultivo específico para lograr una cosecha objetivo. Debido a la alta dimensionalidad de los datos, se propone una estrategia para dividir los datos de acuerdo con una recomendación de Asobancaria, el cual menciona: “Respecto al tamaño de la tierra para la Food and Agriculture Organization - FAO (2012), la clasificación varía a lo largo de zonas geográficas y de producción - los pequeños productores son aquellos con -- menos de 1 hectárea productiva, los medianos rondan de 1 a 10 hectáreas y los grandes poseen más de 10 hectáreas”. Por consiguiente, al considerar que las hectáreas en la base de datos se manejan como un dato entero, no es posible trabajar con los pequeños agricultores. Lo anterior permitió generar dos bases de datos nuevos que representan los medianos (1/4 de los datos originales) y grandes productores (3/4 de los datos originales). A partir de la división de los datos, se realizó una exploración de datos para generar la mejor representación de las bases de datos antes de crear los modelos de regresión. Aplicando la estrategia de división de datos, se generaron mejores resultados, para la base de datos de medianos agricultores se logró un MAE de 0.001335 con un modelo de regresión de Huber, y para los grandes agricultores se logró un MAE de 0.001003 con el modelo de regresión de bosques aleatorios o random forest. |
Aparece en las colecciones: | Especializaciones de la Facultad de Ingeniería |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
GomezJesus_2022_EstimacionAreasCosecha.pdf | Trabajo de grado de especialización | 3.17 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons