Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/44870
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorEscobar Grisales, Daniel-
dc.contributor.authorOrbes Cabrera, Camilo-
dc.date.accessioned2025-02-13T19:03:48Z-
dc.date.available2025-02-13T19:03:48Z-
dc.date.issued2025-
dc.identifier.urihttps://hdl.handle.net/10495/44870-
dc.description.abstractRESUMEN : La comunicación mediante plataformas digitales es una práctica común en las empresas donde se tiene una gran cantidad de personal y donde todos los colaboradores podrían estar distanciados geográficamente. Plataformas como Microsoft Teams ofrecen servicios para la comunicación interna en una empresa, pero estos servicios tienen un costo asociado. En la empresa Bancolombia se ha evidenciado un sobrecosto respecto al intercambio de mensajes fuera del límite contratado. Dentro de los diferentes análisis realizados internamente en el banco, se ha evidenciado que muchos de los mensajes que se intercambian no tienen un contenido laboral. En este trabajo se proponen y comparan diversas metodologías para identificar aquellos mensajes que no tienen un contenido laboral. Los resultados indican que los enfoques basados en boosting de gradiente extremo (XGBoost, del inglés Xtreme Gradient Boosting), y bosques aleatorios (RF del inglés, Random Forest) logran obtener desempeños de hasta 99%, especialmente cuando la representación del texto es obtenida mediante caracterizaciones basadas en la frecuencia de términos, como la técnica de frecuencia de término – frecuencia inversa de documento (TF-IDF, del inglés Term Frequency-Inverse Document Frequency). También se consideraron estrategias más recientes, como Word2Vec, pero su desempeño fue menor, aunque su eficiencia computacional fue mayor. Finalmente, estos análisis fueron integrados los resultados en un tablero en Power Bi, con el fin de visualizar los resultados, facilitando el análisis de los flujos de mensajes en las diferentes áreas de la organización y las métricas de clasificación de los modelos.spa
dc.format.extent38 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titleModelo analítico para clasificación de mensajes laborales usando NLP. Semestre de industriaspa
dc.typeinfo:eu-repo/semantics/bachelorThesisspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameIngeniero Electrónicospa
thesis.degree.levelPregradospa
thesis.degree.disciplineFacultad de Ingeniería. Ingeniería Electrónicaspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.publisher.placeMedellín, Colombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.redcolhttps://purl.org/redcol/resource_type/TPspa
dc.type.localTesis/Trabajo de grado - Monografía - Pregradospa
dc.subject.decsProcesamiento de lenguaje natural-
dc.subject.decsNatural Language Processing-
dc.subject.lembClasificación (computadores electrónicos)-
dc.subject.lembSorting (electronic computers)-
dc.subject.lembAlgoritmos (computadores)-
dc.subject.lembComputer algorithms-
Aparece en las colecciones: Ingeniería Electrónica

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
OrbesCamilo_2025_ModeloClasificaciónChats.pdfTrabajo de grado de pregrado2.1 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons