Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/10495/40416
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Botía Valderrama, Javier Fernando | - |
dc.contributor.author | Villada osorio, Juan Sebastián | - |
dc.contributor.author | España Chamorro, Christian Daniel | - |
dc.date.accessioned | 2024-07-05T19:47:30Z | - |
dc.date.available | 2024-07-05T19:47:30Z | - |
dc.date.issued | 2024 | - |
dc.identifier.uri | https://hdl.handle.net/10495/40416 | - |
dc.description.abstract | RESUMEN : Hoy en día, en la era digital, los datos de las noticias digitales son la mina de oro de la opinión pública y de las tendencias emergentes en el tiempo. De este proyecto esperamos que surja una potente máquina analítica que nos permita explorar esta riqueza de datos para encontrar significado dentro de ellos. Además del hecho de que queremos que esta herramienta evolucione a través de niveles más altos de sofisticación de la ciencia y el análisis de datos, la visión es que esta herramienta esté en progreso y se actualice continuamente para aprender y adaptarse a entornos cambiantes según sea necesario. Esta información puede tener un valor incalculable para empresas, investigadores y organismos gubernamentales, interesados en conocer mejor las opiniones del público en general sobre diversos temas de la sociedad actual. Se entrenaron desde cero cuatro modelos siguiendo la arquitectura de BERT, para la clasificación de noticias en positivas o negativas. El mejor modelo tuvo un accuracy de 72%, precisión de 80%, recall de 80%, F1 score de 80%, adicionalmente la grafica ROC muestra un 89% de probabilidades de que el modelo clasifique correctamente un ejemplo positivo de uno negativo. | spa |
dc.description.abstract | ABSTRACT : Today in digital era, digital news data is the gold mine of public opinion and time-emerging trend. Coming out of this project we expect a powerful analytical machine that will allow us to explore this wealth of data to find meaning within that data. Besides the fact that we want this tool to evolve across higher levels of sophistication of data science and analysis, the vision is that this tool is in progress and continuously updated to learn and adapt to changing environments as needed. This information can be invaluable to companies, researchers, and government agencies, as they are interested in learning more about the views of the general public on various issues in current society. Four models were trained from scratch following the BERT architecture for the classification of news into positive or negative. The best model obtained an accuracy of 72%, a precision of 80%, a recall of 80% and an F1 score of 80%. In addition, the ROC plot shows an 89% probability that the model correctly classifies a positive example from a negative one. | spa |
dc.format.extent | 20 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | eng | spa |
dc.type.hasversion | info:eu-repo/semantics/draft | spa |
dc.rights | info:eu-repo/semantics/openAccess | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/co/ | * |
dc.title | Desarrollo de una herramienta de análisis de sentimiento en tiempo real para comprender la percepción pública a través de Google Noticias | spa |
dc.type | info:eu-repo/semantics/other | spa |
oaire.version | http://purl.org/coar/version/c_b1a7d7d4d402bcce | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
thesis.degree.name | Especialista en Analítica y Ciencia de Datos | spa |
thesis.degree.level | Especialización | spa |
thesis.degree.discipline | Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos | spa |
thesis.degree.grantor | Universidad de Antioquia | spa |
dc.rights.creativecommons | https://creativecommons.org/licenses/by-nc-sa/4.0/ | spa |
dc.publisher.place | Medellín, Colombia | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_46ec | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/COther | spa |
dc.type.local | Tesis/Trabajo de grado - Monografía - Especialización | spa |
dc.subject.decs | Procesamiento de lenguaje natural | - |
dc.subject.decs | Natural Language Processing | - |
dc.subject.decs | Análisis de sentimientos | - |
dc.subject.decs | Sentiment Analysis | - |
dc.subject.unesco | Análisis de datos | - |
dc.subject.unesco | Data analysis | - |
dc.subject.lemb | Opinión pública | - |
dc.subject.lemb | Public opinion | - |
dc.subject.lemb | Procesamiento de datos en tiempo real | - |
dc.subject.lemb | Real-time data processing | - |
dc.subject.unescouri | http://vocabularies.unesco.org/thesaurus/concept2214 | - |
dc.relatedidentifier.url | github.com/CDspana/Especializacion | spa |
dc.identifier.url | https://www.overleaf.com/read/whqfsgjjcqgy#40673d | spa |
dc.subject.meshuri | https://id.nlm.nih.gov/mesh/D009323 | - |
dc.subject.meshuri | https://id.nlm.nih.gov/mesh/D000090042 | - |
Aparece en las colecciones: | Especializaciones de la Facultad de Ingeniería |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
VilladaChristianVilladaJuan_2024_DesarrolloHerramientaPercepcion | Trabajo de grado de especialización | 737.72 kB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons