Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/10495/5977
Título : | Automatic detection of hypernasal speech of children with cleft lip and palate from spanish vowels and words using classical measures and nonlinear analysis |
Otros títulos : | Detección automática de voz hipernasal de niños con labio y paladar hendido a partir de vocales y palabras del español usando medidas clásicas y análisis no lineal |
Autor : | Vargas Bonilla, Jesús Francisco Vásquez Correa, Juan Camilo Castellanos Domínguez, César Germán Nöth, Elmar |
metadata.dc.subject.*: | Detección de señales Hipernasalidad Labio leporino Paladar hendido Lenguaje fonético Perturbación Dinámica no lineal |
Fecha de publicación : | 2016 |
Editorial : | Universidad de Antioquia, Facultad de Ingeniería |
Citación : | J. R. Orozco, J. F. Vargas, J. C. Vásquez, C. G. Castellanos and E. Nöth, "Automatic detection of hypernasal speech of children with cleft lip and palate from spanish vowels and words using classical measures and nonlinear analysis", Rev. Fac. Ing. Univ. Antioquia, no. 80, pp. 109-123, 2016. |
Resumen : | RESUMEN: Este artículo presenta un sistema para la detección automática de señales de voz hipernasales basado en la combinación de dos diferentes esquemas de caracterización aplicados en las cinco vocales del español y dos palabras seleccionadas. El primer esquema está basado en características clásicas como perturbaciones del periodo fundamental, medidas de ruido y coeficientes cepstrales en la frecuencia de Mel. El segundo enfoque está basado en medidas de dinámica no lineal. Las características más relevantes son seleccionadas usando dos técnicas: análisis de componentes principales y selección flotante hacia adelante secuencial. La decisión acerca de si un registro de voz es hipernasal o sano es tomada usando una máquina de soporte vectorial de margen suave. Los experimentos consideran grabaciones de las cinco vocales del idioma español y las palabras y se consideran, asimismo, tres conjuntos de características: (1) el enfoque clásico, (2) el análisis de dinámica no lineal y (3) la combinación de ambos esquemas. En general, los aciertos son mayores y más estables cuando las características clásicas y no lineales son combinadas, indicando que el análisis de dinámica no lineal se complementa con el esquema clásico. ABSTRACT: This paper presents a system for the automatic detection of hypernasal speech signals based on the combination of two different characterization approaches applied to the five spanish vowels and two selected words. The first approach is based on classical features such as pitch period perturbations, noise measures, and Mel-Frequency Cepstral Coefficients (MFCC). The second approach is based on the Non-Linear Dynamics (NLD) analysis. The most relevant features are selected and sorted using two techniques: Principal Components Analysis (PCA) and Sequential Forward Floating Selection (SFFS). The decision about whether a voice record is hypernasal or healthy is taken using a Soft Margin - Support Vector Machine (SM-SVM). Experiments upon recordings of the five Spanish vowels and the words are performed considering three different set of features: (1) the classical approach, (2) the NLD analysis, and (3) the combination of the classical and NLD measures. In general, the accuracies are higher and more stable when the classical and NLD features are combined, indicating that the NLD analysis is complementary to the classical approach. |
metadata.dc.identifier.eissn: | 2422-2844 |
ISSN : | 0120-6230 |
metadata.dc.identifier.doi: | 10.17533/udea.redin.n80a12 |
Aparece en las colecciones: | Artículos de Revista en Ingeniería |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
OrozcoJuan_2016_AutomaticDetectionHypernasal.pdf | Artículo de investigación | 1.82 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons