Classificação de disfonias por meio da análise de medidas não lineares e de quantificação de recorrência

Silvana Luciene do Nascimento Cunha Costa

IFPB - Campus João Pessoa Brasil

Giulliana Karla Lacerda Pereira de Queiroz

IFPB

Suzete Élida Nóbrega Correia

IFPB

Vinícius Jefferson Dias Vieira

UFCG

Leonardo Wanderley Lopes

UFPB/Campus João Pessoa

Resumo

In recent years techniques of digital processing of speech signals have been used as an auxiliary tool in the evaluation of vocal deviations, providing the patient with greater comfort low cost and objectivity when compared to the techniques traditionally employed, such as perceptual-auditory analysis. The evaluation of vocal quality, through acoustic analysis of voice signals, is becoming a very popular clinical practice for the detection of vocal disorders that in some cases can be caused by laryngeal lesions or vocal abuse. In this research, we used some traditional non-linear measures combined with measures of recurrence quantification for the discriminative analysis of vocal deviations, breathiness, roughness and strain. The characteristics of the non-linear dynamic analysis,used in the classification process, were the Reconstruction Step (τ), the First Minimum of the Mutual Information Function (PM) and the Correlation Dimension (D2). The quantification measures employed were: Determinism (Det), Shannon entropy (Entr), Mean length of diagonal lines (Lmed), Maximum length of vertical lines (Vmax) and Transitivity (Trans). Through these statistical tests, the potential of each characteristic to discriminate the types of voice signals was evaluated. In the classification process, the neural network MLP (Multilayer Perceptron) was used, with supervised learning algorithm Graded Conjugate Gradient (SCG). There was an average accuracy of 90% in the discrimination between healthy and deviant voices. In the classification between healthy and strained voices, an average accuracy of 76% was obtained with the combined measures Trans, τ , Vmax, Lmed, Det and D2. In the detection of the roughness deviation, an average accuracy of 89% was obtained with the Lmed, Entr, Trans and D2 measures and in the distinction between healthy and breathy voices, 91.17% of accuracy was obtained with only two combined measures, Trans and τ , showing the promising character of the used technique.

Palavras-chave


Non-linear Analysis. Recurrence Quantification Analysis. Acoustic Analysis. Digital Processing of Speech Signals. Vocal Quality Assessment.


Texto completo:

Referências


BARAVIEIRA, P. B. Aplicação de uma rede neural artificial para a avaliação da rugosidade e soprosidade vocal. 2016. 101 f. Tese (Doutorado em Ciências)–Programa de PósGraduação Interunidades em Bioengenharia EESC/FMRP/IQSC, Universidade de São Paulo, 2016.

BEHLAU, M. Voz, O Livro do Especialista. Revinter, 2001.

CAMPISI, P. et al. MultiDimensional Voice Program analysis in children with vocal cord nodules. J Otolaryngol, v. 29, n. 5, p. 302-308, 2000.

COSTA, W. C. de A. Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas. 2012. 176 f. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de

Campina Grande Campina Grande, 2012.

COURAS, M. F. K. B. Classificação de desvios vocais utilizando características baseadas no modelo linear de produção da fala. 2017. 115 f. Dissertação (Mestrado em Engenharia Elétrica)–

Instituto Federal da Paraíba, João Pessoa, 2017.

CRUZ, B. S. C.; OLIVEIRA, I. B. Disfonias nas Laringectomias Parciais: revisão sistemática de literatura em procedimentos avaliativos. In: ENCONTRO DE INICIAÇÃO CIENTÍICA, 19., 2014, Campinas. Anais... Campinas: Pontifícia Universidade Católica, 2014.

DAJER, M. E. Análise de sinais de voz por padrões visuais de dinâmica vocal. 2010. 154 f. Tese (Doutorado em Ciências)– Universidade de São Paulo, São Carlos, 2010.

ECKMANN, J. P.; KAMPHORST S. O.; RUELLE, D. Recurrence plots of dynamical systems. Europhys. Lett, v. 56, n. 5, p. 973-977, 1987.

FANT, G. Speech acoustics and phonetics. Springer, 2004.

FIEDLER-FERRARA, N.; PRADO, C. P. C. Caos - uma Introdução. Editora Edgard Blücher, 1994.

FRASER, A. M.; SWINNEY, H. L. Independent coordinates for strange attractors from mutual information. Physical Review A, v. 33, n. 2, p. 1134-1140, 1986.

HENRIQUEZ, P. et al. Characterization of healthy ant pathological voice through measures based on nonlinear dynamics. IEEE Transactions on Audio, Speech and Language Processing, v. 17, n. 6, p. 1186-1195, 2009.

HOSMER, D. W. JR.; LEMESHOW, S. Applied logistic regression. New York: John Wiley & Sons, 2000.

JIANG, J.; ZHANG, Y.; MCGILLIGAN, C. Chaos in voice, from modeling to measurement. Journal of Voice, v. 20, n. 1, p. 2-17, jan. 2006.

KANTZ, H.; SCHREIBER, T. Nonlinear time series analysis. Cambrigde University Press, 2004.

KENT, R. D.; READ, C. The acoustic analysis of speech. San Diego: Singular Pub. Group, 1992.

KUMAR, A.; MULLICK, S. K. Nonlinear dynamica analysis of speech. Journal of Acoustical Society of America, v. 100, n. 1, p. 615-629, 1996.

LOPES, L. W. et al. Effectiveness of recurrence quantification measures in discriminating patients with and without voice disorders. In: INTERNATIONAL CONFERENCE ON VOICE PHYSIOLOGY AND BIOMECHANICS, 10., 2016, Viña del Mar, Chile.

Anais... Viña del Mar, 2016. p. 14-17.

LORENZ, E. N. Deterministic non-periodic flow. Journal of Atmospheric Science, v. 26, p. 130-136, 1963.

MARWAN, N. Encounters With Neighbours - Current Developments of Concepts Based on Recurrence Plots and Their Applications. University of Potsdam, 2003.

MARWAN, N.; KURTHS, J. Line structures in recurrence plots. Physics Letters A, v. 336, n. 4, p. 349-357, 2005.

MOLLER, M. F. A scaled conjugate gradient algorithm for fast supervised learning. Neural Networks, v. 6, n. 4, p. 525-533, 1993.

SANTOS, M. O. Análise Acústica de Desvios Vocais Infantis utilizando a Transformada Wavelet. 2015. 79 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2015.

SOUZA, T. A. Aplicação da Transformada Wavelet em Análise de Texturas de Gráficos de Recorrência para Detectação de Patologias Laríngeas. 2015. 79 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2015.

TAKENS, F. Detecting strange attractors in turbulence. Lecture notes in mathematics, v. 898, n. 1, p. 366-381, 1981.

VIEIRA, V. J. D. Avaliação de Distúrbios da Voz por meio de Análise de Quantificação de Recorrência. 2014. 2017 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2014.

WEBBER, C. Jr.; ZBILUT, J. Recurrence quantifications: Feature extractions from recurrence plots. Int. J. Bifurcation and Chaos, v. 17, p. 3467-3475, 2007.

WEBBER, C. L.; ZBILUT, J. P. D. Dynamical assessment of physiological systems and states using recurrence plot strategies. J. Appl. Physiol, v. 76, p. 965-973, 1994.

YAMASAKI, R. et al. Correspondência entre escala analógico-visual e a escala numérica na avaliação perceptivo-auditiva de vozes. In: CONGRESSO BRASILEIRO DE FONOAUDIOLOGIA, 16., Campos de Jordão, 2008. Anais... Campos de Jordão: Sociedade Brasileira de Fonoaudiologia Campos de Jordão, 2008. p. 24-27.

ZHANG, Y.; JIANG. J. J. Acoustic analyses of sustained and running voices from patients with laryngeal pathologies. Journal of Voice, v. 22, n. 1, p. 1-9, jan. 2008.


DOI: http://dx.doi.org/10.18265/1517-03062015v1n38p148-160

O arquivo PDF selecionado deve ser carregado no navegador caso tenha instalado um plugin de leitura de arquivos PDF (por exemplo, uma versão atual do Adobe Acrobat Reader).

Como alternativa, pode-se baixar o arquivo PDF para o computador, de onde poderá abrí-lo com o leitor PDF de sua preferência. Para baixar o PDF, clique no link abaixo.

Caso deseje mais informações sobre como imprimir, salvar e trabalhar com PDFs, a Highwire Press oferece uma página de Perguntas Frequentes sobre PDFs bastante útil.

Visitas a este artigo: 1311

Total de downloads do artigo: 1726