Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/24636
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorOviedo Carrascal, Efraín Alberto-
dc.contributor.authorRodriguez Muñoz, David Alberto-
dc.date.accessioned2021-12-07T16:07:38Z-
dc.date.available2021-12-07T16:07:38Z-
dc.date.issued2021-
dc.identifier.urihttp://hdl.handle.net/10495/24636-
dc.description.abstractRESUMEN : Para los bancos es de vital importancia poder anticiparse a la realidad económica de cada persona (y más cuando el mismo es cliente del propio banco), para así determinar planes de acción con ese cliente, planes que incluyen: ofertar créditos hipotecarios, créditos de consumo o tarjetas de crédito, entre muchos otros productos que pueda ofrecer el banco. Este es el objetivo principal de esta monografía, hacer uso de un conjunto de datos demográficos y financieros de los clientes del banco Bancolombia, para diseñar un estimador basado en algoritmos de aprendizaje automático, que tengan la capacidad de adelantarse con un alto grado de predicción a los gastos personales que tendrá el cliente del banco en los próximos meses, con el fin de ayudar al banco en la creación de créditos y el ajuste de la capacidad de pago de cada cliente. Los datos con los que se cuenta para el diseño del algoritmo, son anonimizados, obtenidos mediante la plataforma kaggle, donde los mismos fueron publicados para la competencia Dataton BC 2020, estos datos describen: la vida financiera de cada cliente, si presenta algún tipo de crédito con el banco, las obligaciones financieras que pueda tener, si ha tenido cartera castigada o si el cliente ha estado mucho tiempo en mora, entre otros (además de datos demográficos). Las estrategias utilizadas para solucionar el problema mediante la creación del diseño más óptimo posible fueron: trabajar fuertemente sobre diferentes transformaciones de los datos, adicionar y eliminar varios datos o utilizarlos de una manera diferente (muestras del conjunto inicial), realizar feature engineering para crear características que permitan la disminución de la dimensionalidad del conjunto de datos. Durante cada tratamiento sobre el conjunto de datos, se utilizan diseños sencillos de algoritmos de aprendizaje de máquina para analizar los efectos que estos cambios tienen sobre el modelo en cuestión. El tratamiento de los datos no fue sencillo, se encontraron las siguientes observaciones; hay diferentes valores nulos sobre los datos (tanto numéricos como categóricos), la dispersión de los datos numéricos fue un tema importante, ya que hubo características cuya naturaleza no es propia para todos los individuos del banco (si no para un sector particular), los datos se encontraban desactualizados, analizando las variables categóricas se encuentra la existencia de un sesgo poblacional fuerte, por último, las características no presentaban la correlación necesaria para describir la variable objetivo. De todos los modelos diseñados, el mejor resultado obtenido fue el Gradient Boost Tree con una profundidad máxima de 15 y 50 árboles estimadores (rendimiento en R2 de 13.8% para entrenamiento y 12.4% para prueba, y, MAPE 111 para entrenamiento y 109 para prueba), cabe resaltar que es el modelo con mejores resultados al evaluar con los datos de prueba, existen otros modelos que logran un rendimiento más alto en el conjunto de entrenamiento, pero disminuye en el conjunto de prueba. Estos resultados podrían mejorarse aplicando las sugerencias presentadas para trabajos futuros.spa
dc.format.extent39spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/publicdomain/zero/1.0/*
dc.titlePredicción de gastos personales o familiares de los clientes de Bancolombiaspa
dc.title.alternativePrediction of personal or family expenses of Bancolombia's customersspa
dc.typeinfo:eu-repo/semantics/otherspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameEspecialista en Analítica y Ciencia de Datosspa
thesis.degree.levelEspecializaciónspa
thesis.degree.disciplineFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datosspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellínspa
dc.type.coarhttp://purl.org/coar/resource_type/c_46ecspa
dc.type.redcolhttp://purl.org/redcol/resource_type/COtherspa
dc.type.localTesis/Trabajo de grado - Monografía - Especializaciónspa
dc.subject.agrovocTécnicas de predicción-
dc.subject.agrovocForecasting-
dc.subject.proposalPredicciónspa
dc.subject.proposalDatos Financierosspa
dc.subject.proposalMachine learningspa
dc.subject.proposalGastos familiaresspa
dc.subject.agrovocurihttp://aims.fao.org/aos/agrovoc/c_3041-
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RodriguezDavid_2021_PrediccionDatosFinancierosGastoFamiliar.pdfTrabajo de grado de especialización564.89 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons