Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/5977
Título : Automatic detection of hypernasal speech of children with cleft lip and palate from spanish vowels and words using classical measures and nonlinear analysis
Otros títulos : Detección automática de voz hipernasal de niños con labio y paladar hendido a partir de vocales y palabras del español usando medidas clásicas y análisis no lineal
Autor : Vargas Bonilla, Jesús Francisco
Vásquez Correa, Juan Camilo
Castellanos Domínguez, César Germán
Nöth, Elmar
metadata.dc.subject.*: Detección de señales
Hipernasalidad
Labio leporino
Paladar hendido
Lenguaje fonético
Perturbación
Dinámica no lineal
Fecha de publicación : 2016
Editorial : Universidad de Antioquia, Facultad de Ingeniería
Citación : J. R. Orozco, J. F. Vargas, J. C. Vásquez, C. G. Castellanos and E. Nöth, "Automatic detection of hypernasal speech of children with cleft lip and palate from spanish vowels and words using classical measures and nonlinear analysis", Rev. Fac. Ing. Univ. Antioquia, no. 80, pp. 109-123, 2016.
Resumen : RESUMEN: Este artículo presenta un sistema para la detección automática de señales de voz hipernasales basado en la combinación de dos diferentes esquemas de caracterización aplicados en las cinco vocales del español y dos palabras seleccionadas. El primer esquema está basado en características clásicas como perturbaciones del periodo fundamental, medidas de ruido y coeficientes cepstrales en la frecuencia de Mel. El segundo enfoque está basado en medidas de dinámica no lineal. Las características más relevantes son seleccionadas usando dos técnicas: análisis de componentes principales y selección flotante hacia adelante secuencial. La decisión acerca de si un registro de voz es hipernasal o sano es tomada usando una máquina de soporte vectorial de margen suave. Los experimentos consideran grabaciones de las cinco vocales del idioma español y las palabras y se consideran, asimismo, tres conjuntos de características: (1) el enfoque clásico, (2) el análisis de dinámica no lineal y (3) la combinación de ambos esquemas. En general, los aciertos son mayores y más estables cuando las características clásicas y no lineales son combinadas, indicando que el análisis de dinámica no lineal se complementa con el esquema clásico.
ABSTRACT: This paper presents a system for the automatic detection of hypernasal speech signals based on the combination of two different characterization approaches applied to the five spanish vowels and two selected words. The first approach is based on classical features such as pitch period perturbations, noise measures, and Mel-Frequency Cepstral Coefficients (MFCC). The second approach is based on the Non-Linear Dynamics (NLD) analysis. The most relevant features are selected and sorted using two techniques: Principal Components Analysis (PCA) and Sequential Forward Floating Selection (SFFS). The decision about whether a voice record is hypernasal or healthy is taken using a Soft Margin - Support Vector Machine (SM-SVM). Experiments upon recordings of the five Spanish vowels and the words are performed considering three different set of features: (1) the classical approach, (2) the NLD analysis, and (3) the combination of the classical and NLD measures. In general, the accuracies are higher and more stable when the classical and NLD features are combined, indicating that the NLD analysis is complementary to the classical approach.
metadata.dc.identifier.eissn: 2422-2844
ISSN : 0120-6230
metadata.dc.identifier.doi: 10.17533/udea.redin.n80a12
Aparece en las colecciones: Artículos de Revista en Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
OrozcoJuan_2016_AutomaticDetectionHypernasal.pdfArtículo de investigación1.82 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons