Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/35503
Título : Analítica de datos para predicciones en aprobaciones de tarjetas de crédito
Autor : Rosales Guerrero, Santiago Felipe
Martínez Rendón, María Isabel
metadata.dc.contributor.advisor: Botia Valderrama, Javier Fernando
metadata.dc.subject.*: Tarjetas de crédito
Bancos
Aprendizaje automático (inteligencia artificial)
Comportamiento del consumidor
Modelos de clasificación
Desbalance de datos
Fecha de publicación : 2023
Resumen : RESUMEN : Uno de los objetivos de los bancos es ofrecer tarjetas de crédito a clientes que tengan un buen comportamiento de pago. Con esto en mente, el objetivo de este documento es indicar cómo a través de la información personal e historial de pagos, de los clientes existentes en el banco, se puede catalogar a un posible cliente como apto o no apto para la aprobación de un cupo de tarjeta de crédito. Además de la adecuación y limpieza de los datos, es necesario implementar metodologías para hacer un tratamiento al desbalance de las etiquetas de la base de datos, ya que por lo general los bancos tienen muchos clientes con buen comportamiento en sus pagos y muy pocos que incumplen. Luego, se realiza una competencia de modelos teniendo como línea base la regresión logística, los modelos implementados fueron: Máquina de Soporte Vectorial, Árboles de Decisión, AdaBoost y Árboles Aleatorios. El mejor resultado se obtuvo con el método de sobremuestreo SMOTENC y con el modelo Árboles Aleatorios con un Accuracy de 98.8%, Balance accuracy score de 81.2% y Log Loss de 0.035.
ABSTRACT : One of the objectives of banks is to offer credit cards to customers with good payment behavior. With this in mind, the objective of this document is to indicate how, through the personal information and payment history of the bank's existing customers, a potential customer can be categorized as eligible or ineligible for credit card quota approval. In addition to the adequacy and cleanliness of the data, it is necessary to implement methodologies to treat the imbalance of the database labels, since banks usually have many customers with good payment behavior and very few who default. Then, a model competition is carried out having logistic regression as a baseline, the models implemented were: Support Vector Machine, Decision Trees, AdaBoost and Random Forest. The best result was obtained with the SMOTENC oversampling method and with the Random Forest model with an Accuracy of 98.8%, Balance accuracy score of 81.2% and Log Loss of 0.035.
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RosalesSantiago_2023_AprobacionTarjetasCredito.pdfTrabajo de grado de especialización1.72 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons