Análise acústica de sinais de vozes patológicas por meio de características temporais

Autores

  • Maria do Carmo de Luna Malheiros Frazão Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • Silvana Luciene do Nascimento Cunha Costa Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) http://orcid.org/0000-0002-1923-2018
  • Suzete Élida Nóbrega Correia Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) http://orcid.org/0000-0002-7675-3979

DOI:

https://doi.org/10.18265/1517-03062015v1n22p28-34

Palavras-chave:

análise acústica, vozes patológicas, características temporais, diagnóstico de patologias laríngeas

Resumo

Este trabalho trata da avaliação de desempenho de características temporais de sinais de vozes no pré-diagnóstico de patologias laríngeas (edema de Reinke, paralisia e nódulos vocais). As medidas temporais empregadas são: período de pitch (frequência fundamental), jitter, shimmer, energia segmental, autocorrelação e taxa de cruzamentos por zero. Na etapa de classificação é empregada a análise discriminante com as funções linear (LDA) e quadrática (QDA). A avaliação de desempenho do classificador é realizada com as medidas empregadas de forma individual e de forma combinada, ressaltando a eficácia da análise de discriminante linear na classificação entre vozes saudáveis e patológicas. A medida temporal que apresentou os melhores resultados na classificação foi Shimmer percentual, chegando a uma precisão de 100% entre sinais saudáveis ou com paralisia, como também para sinais com edema de Reinke ou com nódulo vocal.

Downloads

Não há dados estatísticos.

Referências

BALAKRISHNAMA, S.; GANAPATHIRAJU, A. Linear discriminant analysis – a Brief Tutorial. Institute for Signal and Information Processing. Department of Electrical and Computer Engineering, Mississippi State University.

BRANDT, R. R. Modelagem de vozes patológicas baseadas na estimação espectral do ruído glotal. Dissertação (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2011. 88f

BOYANOV, B.; HADJITODOROV, S. Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases. Proceedings of IEEE Engineering in Medicine And Biology. p. 74-82, Jul./Aug. 1997.

COSTA, S. C.; AGUIAR NETO, B. G.; FECHINE, J. F.; CORREIA, S. Parametric cepstral analysis for pathological voice assessment. Proceedings of The 23rd ACM Symposium on Applied Computing 2008 (ACM SAC’ 2008). Computer Applications in Health Care Track, Pages 1410-1414, Fortaleza,-Ceará, Brazil, Mar.2008a.

COSTA, S. C. Análise acústica, baseada no modelo linear de produção da fala, para discriminação de vozes patológicas.Tese de Doutorado. Universidade Federal de Campina Grande, Campina Grande, 2008b.

COSTA, S. C.; COSTA, W. C. A.; CORREIA, S. Análise Dinâmica não linear aplicada ao diagnóstico de patologias orgânicas e neurológicas da laringe. In: VI Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VI CONNEPI. . Anais do VI CONNEPI, 2011.

DELLER Jr. R.;PROAKIS, J. G.; HANSEN, J. H. L. Discrete-time processing of speech signals.Macmillan Publishing Co., 1993.

DIBAZAR, A. A.; BERGER, T.W.; NARAYANAN, S. S. Pathological voice assessment. Proceedings of the 28th IEEE EMBS Annual International Conference, New York- USA, p. 1669-1673, Ago., 2006.

FRAZÃO, M. C. L. M.; COSTA S. C.; CORREIA S.; COSTA, W. C. A. O uso de características temporais de sinais de voz na detecção de patologias laríngeas. In: VII Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VII CONNEPI, 2012. Anais do VII CONNEPI, 2012.

GODINO-LLORENTE, J. I.; GÓMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters. IEEE Transactions on Biomedical Engineering, v. 53 (10), p.1943-1953, 2006.

KAY ELEMETRICS, Kay Elemetrics Corp. Disordered Voice Database, model 4337, 03 ed, 1994a.

KAY ELEMETRICS, Kay Elemetrics Corp. Multi-Speech, model 3700, 1994b.

KHATTREE, R.; NAIK, D.N. Multivariate data reduction and discrimination with SAS software. 558 p. Cary, NC, USA: SAS Institute Inc., 2000.

RABINER.R.; SCHAFER R. W. Digital processing of speech signals. Nova Jersey: Prentice-Hall, 1978.

RUSSO, I. C. P.; BEHLAU, M. Percepção da fala: análise acústica do português brasileiro. São Paulo: Lovise, 1993.

SAMPAIO, O. M. Diferenciação entre rums cubanos e não cubanos. Instituto de Química de São Carlos- Universidade de São Paulo. São Paulo, 2006.

VARELLA, C.A.A. Estimativa da produtividade e do estresse nutricional da cultura do milho usando imagens digitais. Tese (Doutorado em Engenharia Agrícola) – Universidade Federal de Viçosa- Viçosa, 2004. 92f.

VIEIRA, R. T. Processamento digital de sinais de voz para detecção de patologias na laringe. . Monografia (Bacharel em Engenharia Elétrica) – Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2011. 66f.

Downloads

Publicado

2013-08-26

Edição

Seção

Engenharias IV - Engenharia Elétrica - Telecomunicações e Processamento de Sinais

Artigos mais lidos pelo mesmo(s) autor(es)