Classificação de disfonias por meio da análise de medidas não lineares e de quantificação de recorrência

Autores

  • Giulliana Karla Lacerda Pereira de Queiroz Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • Silvana Luciene do Nascimento Cunha Costa Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) http://orcid.org/0000-0002-1923-2018
  • Suzete Élida Nóbrega Correia Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • Vinícius Jefferson Dias Vieira Universidade Federal de Campina Grande (UFCG) http://orcid.org/0000-0003-1072-1533
  • Leonardo Wanderley Lopes Universidade Federal da Paraíba (UFPB)

DOI:

https://doi.org/10.18265/1517-03062015v1n38p148-160

Palavras-chave:

Análise Não Linear, Análise de Quantificação de Recorrência, Análise Acústica, Processamento Digital de Sinais de Voz, Avaliação da Qualidade Vocal

Resumo

Nos últimos anos, técnicas de processamento digital de sinais de voz vêm sendo empregadas como ferramentas auxiliares na avaliação de desvios vocais, trazendo maior comodidade ao paciente, baixo custo e caráter objetivo, comparado às técnicas tradicionalmente empregadas, como a análise perceptivo-auditiva. A avaliação da qualidade vocal, por análise acústica de sinais de voz, se constitui cada vez mais em prática clínica para detecção de distúrbios vocais que, em alguns casos, podem ser ocasionados por lesões laríngeas ou abuso vocal. Nesta pesquisa, foram empregadas algumas medidas não lineares tradicionais, combinadas com medidas de quantificação de recorrência, para a análise discriminativa dos desvios vocais rugosidade, soprosidade e tensão. As características da análise dinâmica não linear, abordadas para o processo de classificação, foram o Passo de Reconstrução (t), o Primeiro Mínimo da Função de Informação Mútua (PM) e a Dimensão de correlação (D2). As medidas de quantificação empregadas foram: Determinismo (Det), Entropia de Shannon (Entr), Comprimento médio das linhas diagonais (Lmed), Comprimento máximo das linhas verticais (Vmax) e Transitividade (Trans). Por meio de testes estatísticos, foi avaliado o potencial de cada característica em discriminar os tipos de sinais de voz considerados. No processo de classificação, foi utilizada a rede neural MLP (Multilayer Perceptron), com algoritmo de aprendizado supervisionado Scheduling Conjugate Graded (SCG). Obteve-se uma acurácia média de 90% na discriminação entre vozes saudáveis e desviadas. Na classificação entre vozes saudáveis e tensas, obteve-se uma acurácia média de 76%, com as medidas combinadas Trans, t, Vmax, Lmed, Det e D2. Na detecção do desvio rugosidade, obteve-se uma acurácia média de 89% com as medidas Lmed, Entr, Trans e D2 e, na distinção entre as vozes saudáveis e soprosas, obteve-se 91,17% com apenas duas medidas combinadas Trans e t, demonstrando o caráter promissor da técnica empregada.  

Downloads

Não há dados estatísticos.

Referências

BARAVIEIRA, P. B. Aplicação de uma rede neural artificial para a avaliação da rugosidade e soprosidade vocal. 2016. 101 f. Tese (Doutorado em Ciências)–Programa de Pós-Graduação Interunidades em Bioengenharia EESC/FMRP/IQSC, Universidade de São Paulo, 2016.

BEHLAU, M. Voz, O Livro do Especialista. Revinter, 2001.

CAMPISI, P. et al. MultiDimensional Voice Program analysis in children with vocal cord nodules. J Otolaryngol, v. 29, n. 5, p. 302-308, 2000.

COSTA, W. C. de A. Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas. 2012. 176 f. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande Campina Grande, 2012.

COURAS, M. F. K. B. Classificação de desvios vocais utilizando características baseadas no modelo linear de produção da fala. 2017. 115 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal da Paraíba, João Pessoa, 2017.

CRUZ, B. S. C.; OLIVEIRA, I. B. Disfonias nas Laringectomias Parciais: revisão sistemática de literatura em procedimentos avaliativos. In: ENCONTRO DE INICIAÇÃO CIENTÍICA, 19., 2014, Campinas. Anais... Campinas: Pontifícia Universidade Católica, 2014.

DAJER, M. E. Análise de sinais de voz por padrões visuais de dinâmica vocal. 2010. 154 f. Tese (Doutorado em Ciências)– Universidade de São Paulo, São Carlos, 2010.

ECKMANN, J. P.; KAMPHORST S. O.; RUELLE, D. Recurrence plots of dynamical systems. Europhys. Lett, v. 56, n. 5, p. 973-977, 1987.

FANT, G. Speech acoustics and phonetics. Springer, 2004.

FIEDLER-FERRARA, N.; PRADO, C. P. C. Caos - uma Introdução. Editora Edgard Blücher, 1994.

FRASER, A. M.; SWINNEY, H. L. Independent coordinates for strange attractors from mutual information. Physical Review A, v. 33, n. 2, p. 1134-1140, 1986.

HENRIQUEZ, P. et al. Characterization of healthy ant pathological voice through measures based on nonlinear dynamics. IEEE Transactions on Audio, Speech and Language Processing, v. 17, n. 6, p. 1186-1195, 2009.

HOSMER, D. W. JR.; LEMESHOW, S. Applied logistic regression. New York: John Wiley & Sons, 2000.

JIANG, J.; ZHANG, Y.; MCGILLIGAN, C. Chaos in voice, from modeling to measurement. Journal of Voice, v. 20, n. 1, p. 2-17, jan. 2006.

KANTZ, H.; SCHREIBER, T. Nonlinear time series analysis. Cambrigde University Press, 2004.

KENT, R. D.; READ, C. The acoustic analysis of speech. San Diego: Singular Pub. Group, 1992.

KUMAR, A.; MULLICK, S. K. Nonlinear dynamical analysis of speech. Journal of Acoustical Society of America, v. 100, n. 1, p. 615-629, 1996.

LOPES, L. W. et al. Effectiveness of recurrence quantification measures in discriminating patients with and without voice disorders. In: INTERNATIONAL CONFERENCE ON VOICE PHYSIOLOGY AND BIOMECHANICS, 10., 2016, Viña del Mar, Chile. Anais... Viña del Mar, 2016. p. 14-17.

LORENZ, E. N. Deterministic non-periodic flow. Journal of Atmospheric Science, v. 26, p. 130-136, 1963.

MARWAN, N. Encounters With Neighbours - Current Developments of Concepts Based on Recurrence Plots and Their Applications. University of Potsdam, 2003.

MARWAN, N.; KURTHS, J. Line structures in recurrence plots. Physics Letters A, v. 336, n. 4, p. 349-357, 2005.

MOLLER, M. F. A scaled conjugate gradient algorithm for fast supervised learning. Neural Networks, v. 6, n. 4, p. 525-533, 1993.

SANTOS, M. O. Análise Acústica de Desvios Vocais Infantis utilizando a Transformada Wavelet. 2015. 79 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2015.

SOUZA, T. A. Aplicação da Transformada Wavelet em Análise de Texturas de Gráficos de Recorrência para Detectação de Patologias Laríngeas. 2015. 79 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2015.

TAKENS, F. Detecting strange attractors in turbulence. Lecture notes in mathematics, v. 898, n. 1, p. 366-381, 1981.

VIEIRA, V. J. D. Avaliação de Distúrbios da Voz por meio de Análise de Quantificação de Recorrência. 2014. 2017 f. Dissertação (Mestrado em Engenharia Elétrica)–Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2014.

WEBBER, C. Jr.; ZBILUT, J. Recurrence quantifications: Feature extractions from recurrence plots. Int. J. Bifurcation and Chaos, v. 17, p. 3467-3475, 2007.

WEBBER, C. L.; ZBILUT, J. P. D. Dynamical assessment of physiological systems and states using recurrence plot strategies. J. Appl. Physiol, v. 76, p. 965-973, 1994.

YAMASAKI, R. et al. Correspondência entre escala analógico-visual e a escala numérica na avaliação perceptivo-auditiva de vozes. In: CONGRESSO BRASILEIRO DE FONOAUDIOLOGIA, 16., Campos de Jordão, 2008. Anais... Campos de Jordão: Sociedade Brasileira de Fonoaudiologia Campos de Jordão, 2008. p. 24-27.

ZHANG, Y.; JIANG. J. J. Acoustic analyses of sustained and running voices from patients with laryngeal pathologies. Journal of Voice, v. 22, n. 1, p. 1-9, jan. 2008.

Downloads

Publicado

2018-02-15

Edição

Seção

Engenharias IV - Engenharia Elétrica - Telecomunicações e Processamento de Sinais

Artigos mais lidos pelo mesmo(s) autor(es)