Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/31409
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorOrozco Arroyave, Juan Rafael-
dc.contributor.advisorNöth, Elmar-
dc.contributor.advisorSchuster, Maria-
dc.contributor.authorArias Vergara, Tomás-
dc.date.accessioned2022-10-20T15:01:29Z-
dc.date.available2022-10-20T15:01:29Z-
dc.date.issued2022-
dc.identifier.urihttps://hdl.handle.net/10495/31409-
dc.description.abstractABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings captured in the short-term (4 months) and long-term (5 years). Machine learning methods are used to perform three tasks: (1) automatic classification of patients vs. healthy speakers. (2) regression analysis to predict the dysarthria level and neurological state. (3) speaker embeddings to analyze the progression of the speech symptoms over time. For hearing loss, automatic acoustic analysis is performed to evaluate whether the duration and onset of deafness (before or after speech acquisition) influence the speech production of cochlear implant users. Additionally, articulation, prosody, and phonemic analyses show that cochlear implant users present altered speech production even after hearing rehabilitation.spa
dc.description.abstractRESUMEN : La presente tesis aborda el análisis automático de los trastornos del habla derivados de la enfermedad de Parkinson y la pérdida auditiva. En el caso de la enfermedad de Parkinson, el progreso de los síntomas del habla se evalúa considerando las grabaciones capturadas a corto (4 meses) y largo plazo (5 años). Métodos de aprendizaje automático son utilizados para realizar tres tareas: (1) clasificación automática de pacientes contra a hablantes sanos, (2) análisis de regresión para predecir el nivel de disartria y el estado neurológico, y (3) modelos de hablante para análisis longitudinal del progreso de los desórdenes en la voz. En el caso de la pérdida auditiva, se realiza un análisis acústico automático para evaluar si la duración y el inicio de la sordera (antes o después de la adquisición del habla) influye en la producción del habla de los usuarios de implantes cocleares. Además, se realizan análisis de articulación, prosodia y fonéticos para demostrar que los usuarios de implantes cocleares presentan una producción del habla alterada incluso después de la rehabilitación auditiva. El análisis acústico automático se realiza considerando fonación, articulación, prosodia y características fonéticas. La precisión de la producción de fonemas se caracteriza mediante el cálculo de las probabilidades obtenidas de redes neuronales recurrentes entrenadas en Alemán y Español. El análisis fonético considera tres dimensiones principales: forma de articulación, lugar de articulación y sonorización. Esta tesis también propone una metodología para la detección automática del tiempo de inicio de la voz en consonantes oclusivas sordas. Además, en este trabajo se analiza la influencia de la edad en el análisis acústico. El análisis de regresión se realiza para estimar la edad de una persona utilizando las características de fonación, articulación, prosodia y fonética. También, en esta tesis se considera el uso de smartphones para aplicaciones en el sector médico.spa
dc.format.extent221spa
dc.format.mimetypeapplication/pdfspa
dc.language.isoengspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by/2.5/co/*
dc.titleAnalysis of Pathological Speech Signalsspa
dc.title.alternativeAnálisis de Señales de Voz Patológicasspa
dc.typeinfo:eu-repo/semantics/doctoralThesisspa
dc.publisher.groupGrupo de Investigación en Telecomunicaciones Aplicadas (GITA)spa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameDoctor en Ingeniería Electrónica y de Computaciónspa
thesis.degree.levelDoctoradospa
thesis.degree.disciplineFacultad de Ingeniería. Doctorado en Ingeniería Electrónica y de Computaciónspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellín - Colombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_db06spa
dc.type.redcolhttps://purl.org/redcol/resource_type/TDspa
dc.type.localTesis/Trabajo de grado - Monografía - Doctoradospa
dc.subject.decsDeep Learning-
dc.subject.decsAprendizaje profundo-
dc.subject.decsParkinson Disease-
dc.subject.decsEnfermedad de parkinson-
dc.subject.decsSpeech Recognition Software-
dc.subject.decsSoftware de Reconocimiento del Habla-
dc.subject.decsCochlear Implants-
dc.subject.decsImplantes Cocleares-
dc.subject.decsAging-
dc.subject.decsEnvejecimiento-
dc.subject.lembMachine learning-
dc.subject.lembAprendizaje automático (inteligencia artificial)-
dc.subject.proposalSpeech processingspa
Aparece en las colecciones: Doctorados de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
AriasTomas_2022_AnalysisPathologicalSpeechTesis doctoral19.65 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons