Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/21866
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorOviedo, Efraín Alberto-
dc.contributor.authorAcevedo Álvarez, Andrés Felipe-
dc.contributor.authorBetancur Tellez, Sebastián-
dc.date.accessioned2021-08-25T16:01:28Z-
dc.date.available2021-08-25T16:01:28Z-
dc.date.issued2021-
dc.identifier.urihttp://hdl.handle.net/10495/21866-
dc.description.abstractRESUMEN : Se presenta a continuación un proyecto de machine learning dentro de la analítica predictiva aplicado a un problema real del sector financiero y bancario. En el año 2016 el banco Santander propuso a través de la plataforma Kaggle un reto analítico dirigido a todos aquellos apasionados por la inteligencia artificial con el objetivo principal de resolver un problema de clasificación cuyo fin era identificar cuáles clientes se encontraban satisfechos y cuáles no con la entidad financiera. Se decide retomar este concurso en el que en su momento participaron más de 5.000 equipos a nivel mundial para a modo de reto académico y personal encontrar resultados sobresalientes a un problema complejo. Adicional, se presenta un proyecto con una característica muy común en el día a día de un científico de datos: una base de datos altamente desbalanceada, por lo que hace del reto un problema mucho más interesante a resolver, más aún cuando se enmarca en un contexto de experiencia y fidelización de clientes, temática que a hoy es foco organizacional en las principales organizaciones del mundo. Dentro de este proyecto se persigue unos resultados tanto de machine learning como de negocio sobresalientes. La métrica propuesta por el banco Santander para evaluar la calidad de los modelos fue el área bajo la curva ROC, y lo que se busca en este entregable es alcanzar un resultado mínimo del 70%. En cuanto a los datos, fueron suministrados directamente por la entidad bancaria de manera anonimizada a través de la plataforma Kaggle, con una muestra total de 76 mil clientes y más de 350 características relacionales entre banco y cliente. Aquí se tenían dos grandes retos, el primero era reducir la alta dimensionalidad que presentaba la base a través de técnicas como correlaciones, limpieza de datos y depuración de valores atípicos, y la segunda era trabajar de manera precisa las diversas técnicas para lograr enfrentarse a una base altamente desbalanceada. Para este entregable se plantearon 5 modelos de clasificación, en donde en cada iteración se buscó encontrar la mejor escogencia de variables, a través de un preprocesamiento detallado de los datos y la aplicación de diversas técnicas de balance. Para cada modelo se aplicó una búsqueda rigurosa de los mejores hiperparametros y se realizaron las validaciones necesarias para lograr las métricas esperadas. Finalmente, los resultados cumplieron con lo esperado, se selecciona como el modelo con la mejor métrica a una red neural que arroja un área bajo la curva ROC del 0.84 y se propone como entregable adicional que la entidad financiera utiliza cómo métrica de negocio el indicador NPS, el cual le permite medir la satisfacción de sus clientes y junto a los hallazgos de este modelo pueda tomar acciones proactivas que le apunten a la fidelización de sus clientes.spa
dc.format.extent23spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/co/*
dc.titleSantander customer satisfaction : un caso práctico de analítica productivaspa
dc.typeinfo:eu-repo/semantics/otherspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameEspecialista en Analítica y Ciencia de Datosspa
thesis.degree.levelEspecializaciónspa
thesis.degree.disciplineFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datosspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellínspa
dc.type.coarhttp://purl.org/coar/resource_type/c_46ecspa
dc.type.redcolhttp://purl.org/redcol/resource_type/COtherspa
dc.type.localTesis/Trabajo de grado - Monografía - Especializaciónspa
dc.subject.unescoAnálisis de datos-
dc.subject.unescoData analysis-
dc.subject.unescoInstituciones financieras-
dc.subject.unescoFinancial institutions-
dc.subject.unescoProcesamiento de datos-
dc.subject.unescoData processing-
dc.subject.agrovocMachine learning-
dc.subject.agrovocAprendizaje electrónico-
dc.subject.agrovocurihttp://aims.fao.org/aos/agrovoc/c_49834-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept2214-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept10861-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept522-
dc.relatedidentifier.urlhttps://github.com/sebastianbetancur1/Monografia_de_grado_UdeAspa
dc.identifier.urlhttps://github.com/sebastianbetancur1/Monografia_de_grado_UdeAspa
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
AcevedoAndres_BetancurSebastian_2021_AnaliticaPredictivaClientes.pdfTrabajo de grado de especialización610.69 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons