Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/29124
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorOviedo Carrascal, Efraín Alberto-
dc.contributor.authorCaro Puerta, Laura Cristina-
dc.contributor.authorRodas Zuluaga, Lady Jhoana-
dc.date.accessioned2022-06-13T13:20:12Z-
dc.date.available2022-06-13T13:20:12Z-
dc.date.issued2022-
dc.identifier.urihttp://hdl.handle.net/10495/29124-
dc.description.abstractRESUMEN : Home Credit Default Risk es un reto planteado por Kaggle que busca un modelo de aprendizaje automático que permita hacer predicciones del cumplimiento de pago de sus clientes al ser ésta una entidad financiera dedicada a la entrega de créditos. Se cuenta con 10 datasets y el modelo se selecciona de acuerdo con el mejor resultado de la curva ROC encontrada. Para el desarrollo del proyecto se decide trabajar con tres de los ocho datasets comenzando un preprocesamiento por separado, buscando nulos, correlaciones y agregaciones, para luego unirlas y obtener un solo dataset con el cual desarrollar el proyecto. Luego, se realiza un análisis exploratorio de las diferentes variables que representan el dataset y se realiza un preprocesamiento más profundo donde se buscan nulos, correlaciones, outliers y se realiza la transformación de las variables categóricas. En este punto, se nota un significativo desbalance de las clases de la variable objetivo, donde más del 80% de los datos se encuentran en la clase 0 (el cliente cumple con los pagos). Debido al desbalance existente en la variable TARGET, se realizan dos escenarios aplicando los modelos con la técnica de balanceo oversampling y luego con la técnica de balanceo undersampling. Por el tipo de problema trabajado, se decide trabajar con los modelos de Regresión Logística, Random Forest y Gradient Boosting. Los resultados obtenidos con la técnica oversampling, para el modelo Regresión Logística fue de alrededor del 70% con una curva ROC del 77%, mientras que con los modelos Random Forest y Gradient Boosting, se obtiene un resultado por encima del 90% para todas las métricas con ambos modelos y ambas curvas ROC con un 98%. Con la técnica de undersampling, los tres modelos arrojan resultados muy similares, donde las métricas muestran en promedio un 68% de acierto y las curvas ROC entre 75% y 76%. Se observa que ambas técnicas generan resultados acordes, incluso aplicando la metodología Stratified K Fold, con la única diferencia de que la técnica de undersampling baja el resultado obtenido en la curva ROC de los modelos Random Forest y Gradient Boosting.spa
dc.format.extent54spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/co/*
dc.titleModelos de aprendizaje supervisado para la clasificación de riesgo crediticio en la entidad financiera Home Creditspa
dc.typeinfo:eu-repo/semantics/otherspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameEspecialista en Analítica y Ciencia de Datosspa
thesis.degree.levelEspecializaciónspa
thesis.degree.disciplineFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datosspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellín - Colombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_46ecspa
dc.type.redcolhttp://purl.org/redcol/resource_type/COtherspa
dc.type.localTesis/Trabajo de grado - Monografía - Especializaciónspa
dc.subject.unescoCrédito-
dc.subject.unescoCredit-
dc.subject.unescoGestión de riesgos-
dc.subject.unescoRisk management-
dc.subject.lembAprendizaje automático (inteligencia artificial)-
dc.subject.lembMachine learning-
dc.subject.lembAprendizaje supervisado (aprendizaje automático)-
dc.subject.lembSupervised learning (Machine learning)-
dc.subject.agrovocDisposición a pagar-
dc.subject.agrovocWillingness to pay-
dc.subject.agrovocurihttp://aims.fao.org/aos/agrovoc/c_5e003e07-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept3570-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept17117-
dc.relatedidentifier.urlhttps://github.com/LadyRodas/HomeCreditspa
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
CaroLaura_RodasLady_2022_MonografíaHomeCredit.pdfTrabajo de grado de especialización1.33 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons