Predicción de gastos personales o familiares de los clientes de Bancolombia

Rodriguez Muñoz, David Alberto

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/24636

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Oviedo Carrascal, Efraín Alberto	-
dc.contributor.author	Rodriguez Muñoz, David Alberto	-
dc.date.accessioned	2021-12-07T16:07:38Z	-
dc.date.available	2021-12-07T16:07:38Z	-
dc.date.issued	2021	-
dc.identifier.uri	http://hdl.handle.net/10495/24636	-
dc.description.abstract	RESUMEN : Para los bancos es de vital importancia poder anticiparse a la realidad económica de cada persona (y más cuando el mismo es cliente del propio banco), para así determinar planes de acción con ese cliente, planes que incluyen: ofertar créditos hipotecarios, créditos de consumo o tarjetas de crédito, entre muchos otros productos que pueda ofrecer el banco. Este es el objetivo principal de esta monografía, hacer uso de un conjunto de datos demográficos y financieros de los clientes del banco Bancolombia, para diseñar un estimador basado en algoritmos de aprendizaje automático, que tengan la capacidad de adelantarse con un alto grado de predicción a los gastos personales que tendrá el cliente del banco en los próximos meses, con el fin de ayudar al banco en la creación de créditos y el ajuste de la capacidad de pago de cada cliente. Los datos con los que se cuenta para el diseño del algoritmo, son anonimizados, obtenidos mediante la plataforma kaggle, donde los mismos fueron publicados para la competencia Dataton BC 2020, estos datos describen: la vida financiera de cada cliente, si presenta algún tipo de crédito con el banco, las obligaciones financieras que pueda tener, si ha tenido cartera castigada o si el cliente ha estado mucho tiempo en mora, entre otros (además de datos demográficos). Las estrategias utilizadas para solucionar el problema mediante la creación del diseño más óptimo posible fueron: trabajar fuertemente sobre diferentes transformaciones de los datos, adicionar y eliminar varios datos o utilizarlos de una manera diferente (muestras del conjunto inicial), realizar feature engineering para crear características que permitan la disminución de la dimensionalidad del conjunto de datos. Durante cada tratamiento sobre el conjunto de datos, se utilizan diseños sencillos de algoritmos de aprendizaje de máquina para analizar los efectos que estos cambios tienen sobre el modelo en cuestión. El tratamiento de los datos no fue sencillo, se encontraron las siguientes observaciones; hay diferentes valores nulos sobre los datos (tanto numéricos como categóricos), la dispersión de los datos numéricos fue un tema importante, ya que hubo características cuya naturaleza no es propia para todos los individuos del banco (si no para un sector particular), los datos se encontraban desactualizados, analizando las variables categóricas se encuentra la existencia de un sesgo poblacional fuerte, por último, las características no presentaban la correlación necesaria para describir la variable objetivo. De todos los modelos diseñados, el mejor resultado obtenido fue el Gradient Boost Tree con una profundidad máxima de 15 y 50 árboles estimadores (rendimiento en R2 de 13.8% para entrenamiento y 12.4% para prueba, y, MAPE 111 para entrenamiento y 109 para prueba), cabe resaltar que es el modelo con mejores resultados al evaluar con los datos de prueba, existen otros modelos que logran un rendimiento más alto en el conjunto de entrenamiento, pero disminuye en el conjunto de prueba. Estos resultados podrían mejorarse aplicando las sugerencias presentadas para trabajos futuros.	spa
dc.format.extent	39	spa
dc.format.mimetype	application/pdf	spa
dc.language.iso	spa	spa
dc.type.hasversion	info:eu-repo/semantics/draft	spa
dc.rights	info:eu-repo/semantics/openAccess	spa
dc.rights.uri	http://creativecommons.org/publicdomain/zero/1.0/	*
dc.title	Predicción de gastos personales o familiares de los clientes de Bancolombia	spa
dc.title.alternative	Prediction of personal or family expenses of Bancolombia's customers	spa
dc.type	info:eu-repo/semantics/other	spa
oaire.version	http://purl.org/coar/version/c_b1a7d7d4d402bcce	spa
dc.rights.accessrights	http://purl.org/coar/access_right/c_abf2	spa
thesis.degree.name	Especialista en Analítica y Ciencia de Datos	spa
thesis.degree.level	Especialización	spa
thesis.degree.discipline	Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos	spa
thesis.degree.grantor	Universidad de Antioquia	spa
dc.rights.creativecommons	https://creativecommons.org/licenses/by-nc-sa/4.0/	spa
dc.publisher.place	Medellín	spa
dc.type.coar	http://purl.org/coar/resource_type/c_46ec	spa
dc.type.redcol	http://purl.org/redcol/resource_type/COther	spa
dc.type.local	Tesis/Trabajo de grado - Monografía - Especialización	spa
dc.subject.agrovoc	Técnicas de predicción	-
dc.subject.agrovoc	Forecasting	-
dc.subject.proposal	Predicción	spa
dc.subject.proposal	Datos Financieros	spa
dc.subject.proposal	Machine learning	spa
dc.subject.proposal	Gastos familiares	spa
dc.subject.agrovocuri	http://aims.fao.org/aos/agrovoc/c_3041	-
Aparece en las colecciones:	Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
RodriguezDavid_2021_PrediccionDatosFinancierosGastoFamiliar.pdf	Trabajo de grado de especialización	564.89 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons