Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/29051
Título : Automatic personality estimation from text in two languages using natural language processing techniques
Autor : López Pabón, Felipe Orlando
metadata.dc.contributor.advisor: Orozco Arroyave, Juan Rafael
metadata.dc.subject.*: Deep Learning
Aprendizaje Profundo
Procesamiento de lenguaje natural
Natural Language Processing
Aprendizaje automático (inteligencia artificial)
Machine learning
Lingüística computacional
Computational linguistics
Personalidad
Fecha de publicación : 2022
Resumen : ABSTRACT : According to the literature review, there is a lack of works in the field of automatic personality recognition based on machine learning or deep learning models using word embeddings that do not rely on dictionaries or lexicons that are highly dependent on human intervention. Similarly, there is a lack of works using texts in a language other than English. This study is focused on the use of natural language processing techniques that allow the extraction of word embeddings that are useful for the estimation of the 5 personality traits defined in the OCEAN model of psychology (the Emotional Stability trait is considered instead of the Neuroticism trait) in two languages: English and Spanish. The main contribution of this work includes: 1) different experiments are explored: i) regression methods, to predict the personality scores on the traits, classification methods, such as ii) two-class classification: weak vs. strong presence of each trait, and iii) three-class classification: low vs. medium vs. high presence of each trait; 2) implementation of word embeddings based on classical methods: Word2Vec and GloVe as well as word embeddings based on state-of-the-art methods such as BERT and BETO to train machine learning methods; 3) use of deep learning methods that allow to extract word embeddings from texts and train the embeddings layer from scratch or use pre-trained embeddings to improve the performance of the architectures; and 4) evaluation of the different methods in Spanish language taking into account text signals coming from YouTube and Twitter.
RESUMEN : De acuerdo con la revisión de la literatura, faltan trabajos en el campo del reconocimiento automático de la personalidad basados en modelos de aprendizaje automático clásico o aprendizaje automático profundo que utilicen incrustaciones de palabras y que no dependan de diccionarios o léxicos altamente dependientes de la intervención humana. Del mismo modo, faltan trabajos que utilicen textos en un idioma distinto al inglés. Este estudio se centra en el uso de técnicas de procesamiento del lenguaje natural que permiten la extracción de incrustaciones de palabras que son útiles para la estimación de los 5 rasgos de personalidad definidos en el modelo OCEAN de psicología (se considera el rasgo de Estabilidad Emocional en lugar del rasgo de Neuroticismo) en dos idiomas: Inglés y Español. La principal contribución de este trabajo incluye: 1) se exploran diferentes experimentos: i) métodos de regresión, para predecir las puntuaciones de personalidad en los rasgos, métodos de clasificación, como ii) clasificación de dos clases: presencia débil vs. fuerte de cada rasgo, y iii) clasificación de tres clases: presencia baja vs. media vs. alta de cada rasgo; 2) implementación de incrustaciones de palabras basados en métodos clásicos: Word2Vec y GloVe, así como incrustaciones de palabras basadas en métodos del estado del arte como BERT y BETO para entrenar métodos de aprendizaje automático; 3) uso de métodos de aprendizaje profundo que permiten extraer incrustaciones de palabras a partir de textos y entrenar la capa de incrustaciones desde cero o utilizar incrustaciones preentrenadas para mejorar el rendimiento de las arquitecturas; y 4) evaluación de los diferentes métodos en lengua española teniendo en cuenta señales de texto procedentes de YouTube y Twitter.
Aparece en las colecciones: Maestrías de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
LopezFelipe_2022_PersonalidadTextoAprendizaje.pdfTesis de maestría6.73 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons