Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/10495/35518
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Botia Valderrama, Javier Fernando | - |
dc.contributor.author | Aguiar Valencia, Daniela | - |
dc.date.accessioned | 2023-06-15T15:33:56Z | - |
dc.date.available | 2023-06-15T15:33:56Z | - |
dc.date.issued | 2023 | - |
dc.identifier.uri | https://hdl.handle.net/10495/35518 | - |
dc.description.abstract | RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, menciones entre otros. Después de estos se evaluaran diferentes métricas de desempe˜no de clasificación en cada uno de los modelos planteados, teniendo en cuenta diferentes formas de vectorización de los conjuntos de datos y tambi´en diferentes distribuciones de los mismos, esto con el fin de comparar primero la eficacia de cada modelo y adem´as si influye o no la porci´on de datos que se utilice para entrenar y testear y adem´as la forma de representar los mismos. Los mejores modelos que se encontraron fueron una regresión logística con una representaci´on de los datos dada por un embebimiento y un clasificador de stacking con una representaci´on de los datos dada por una vectorización Count Vectorizer. | spa |
dc.description.abstract | ABSTRACT : The purpose of this paper is to perform an analysis of sentiments in tweets in Spanish. In the first instance, a treatment of the data that involves a normalization of the language must be taken into account where stopword, emojis, mentions, among others, will be eliminated. After these, different classification performance metrics will be evaluated in each of the proposed models, taking into account different forms of vectorization of the data sets and also different distributions of the same, this in order to first compare the effectiveness of each model and also if it influences or not the portion of data that is used to train and test and also the way of representing them. The best models found were a logistic regression with a representation of the data given by an embedding and a stacking classifier with a representation of the data given by a Count Vectorizer. | spa |
dc.format.extent | 35 | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.type.hasversion | info:eu-repo/semantics/draft | spa |
dc.rights | info:eu-repo/semantics/openAccess | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/co/ | * |
dc.title | Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets | spa |
dc.type | info:eu-repo/semantics/other | spa |
oaire.version | http://purl.org/coar/version/c_b1a7d7d4d402bcce | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
thesis.degree.name | Especialista en Analítica y Ciencia de Datos | spa |
thesis.degree.level | Especialización | spa |
thesis.degree.discipline | Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos | spa |
thesis.degree.grantor | Universidad de Antioquia | spa |
dc.rights.creativecommons | https://creativecommons.org/licenses/by-nc-sa/4.0/ | spa |
dc.publisher.place | Medellín, Colombia | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_46ec | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/COther | spa |
dc.type.local | Tesis/Trabajo de grado - Monografía - Especialización | spa |
dc.subject.decs | Análisis de sentimientos | - |
dc.subject.decs | Sentiment Analysis | - |
dc.subject.decs | Minería de datos | - |
dc.subject.decs | Data Mining | - |
dc.subject.lemb | Análisis de regresión logística | - |
dc.subject.proposal | Tweets | spa |
dc.subject.proposal | Embedding | spa |
Aparece en las colecciones: | Especializaciones de la Facultad de Ingeniería |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
AguiarDaniela_2023_AnalisisSentimientosTweets.pdf | Trabajo de grado de especialización | 2.31 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons