Análise acústica de sinais de vozes patológicas por meio de características temporais

Maria do Carmo de Luna Malheiros Frazão

Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Silvana Luciene do Nascimento Cunha Costa

ORCID iD Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Suzete Élida Nóbrega Correia

ORCID iD Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Resumo

Este trabalho trata da avaliação de desempenho de características temporais de sinais de vozes no pré-diagnóstico de patologias laríngeas (edema de Reinke, paralisia e nódulos vocais). As medidas temporais empregadas são: período de pitch (frequência fundamental), jitter, shimmer, energia segmental, autocorrelação e taxa de cruzamentos por zero. Na etapa de classificação é empregada a análise discriminante com as funções linear (LDA) e quadrática (QDA). A avaliação de desempenho do classificador é realizada com as medidas empregadas de forma individual e de forma combinada, ressaltando a eficácia da análise de discriminante linear na classificação entre vozes saudáveis e patológicas. A medida temporal que apresentou os melhores resultados na classificação foi Shimmer percentual, chegando a uma precisão de 100% entre sinais saudáveis ou com paralisia, como também para sinais com edema de Reinke ou com nódulo vocal.

Palavras-chave


análise acústica; vozes patológicas; características temporais; diagnóstico de patologias laríngeas


Texto completo:

Referências


BALAKRISHNAMA, S.; GANAPATHIRAJU, A. Linear discriminant analysis – a Brief Tutorial. Institute for Signal and Information Processing. Department of Electrical and Computer Engineering, Mississippi State University.

BRANDT, R. R. Modelagem de vozes patológicas baseadas na estimação espectral do ruído glotal. Dissertação (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2011. 88f

BOYANOV, B.; HADJITODOROV, S. Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases. Proceedings of IEEE Engineering in Medicine And Biology. p. 74-82, Jul./Aug. 1997.

COSTA, S. C.; AGUIAR NETO, B. G.; FECHINE, J. F.; CORREIA, S. Parametric cepstral analysis for pathological voice assessment. Proceedings of The 23rd ACM Symposium on Applied Computing 2008 (ACM SAC’ 2008). Computer Applications in Health Care Track, Pages 1410-1414, Fortaleza,-Ceará, Brazil, Mar.2008a.

COSTA, S. C. Análise acústica, baseada no modelo linear de produção da fala, para discriminação de vozes patológicas.Tese de Doutorado. Universidade Federal de Campina Grande, Campina Grande, 2008b.

COSTA, S. C.; COSTA, W. C. A.; CORREIA, S. Análise Dinâmica não linear aplicada ao diagnóstico de patologias orgânicas e neurológicas da laringe. In: VI Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VI CONNEPI. . Anais do VI CONNEPI, 2011.

DELLER Jr. R.;PROAKIS, J. G.; HANSEN, J. H. L. Discrete-time processing of speech signals.Macmillan Publishing Co., 1993.

DIBAZAR, A. A.; BERGER, T.W.; NARAYANAN, S. S. Pathological voice assessment. Proceedings of the 28th IEEE EMBS Annual International Conference, New York- USA, p. 1669-1673, Ago., 2006.

FRAZÃO, M. C. L. M.; COSTA S. C.; CORREIA S.; COSTA, W. C. A. O uso de características temporais de sinais de voz na detecção de patologias laríngeas. In: VII Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VII CONNEPI, 2012. Anais do VII CONNEPI, 2012.

GODINO-LLORENTE, J. I.; GÓMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters. IEEE Transactions on Biomedical Engineering, v. 53 (10), p.1943-1953, 2006.

KAY ELEMETRICS, Kay Elemetrics Corp. Disordered Voice Database, model 4337, 03 ed, 1994a.

KAY ELEMETRICS, Kay Elemetrics Corp. Multi-Speech, model 3700, 1994b.

KHATTREE, R.; NAIK, D.N. Multivariate data reduction and discrimination with SAS software. 558 p. Cary, NC, USA: SAS Institute Inc., 2000.

RABINER.R.; SCHAFER R. W. Digital processing of speech signals. Nova Jersey: Prentice-Hall, 1978.

RUSSO, I. C. P.; BEHLAU, M. Percepção da fala: análise acústica do português brasileiro. São Paulo: Lovise, 1993.

SAMPAIO, O. M. Diferenciação entre rums cubanos e não cubanos. Instituto de Química de São Carlos- Universidade de São Paulo. São Paulo, 2006.

VARELLA, C.A.A. Estimativa da produtividade e do estresse nutricional da cultura do milho usando imagens digitais. Tese (Doutorado em Engenharia Agrícola) – Universidade Federal de Viçosa- Viçosa, 2004. 92f.

VIEIRA, R. T. Processamento digital de sinais de voz para detecção de patologias na laringe. . Monografia (Bacharel em Engenharia Elétrica) – Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2011. 66f.


DOI: http://dx.doi.org/10.18265/1517-03062015v1n22p28-34

O arquivo PDF selecionado deve ser carregado no navegador caso tenha instalado um plugin de leitura de arquivos PDF (por exemplo, uma versão atual do Adobe Acrobat Reader).

Como alternativa, pode-se baixar o arquivo PDF para o computador, de onde poderá abrí-lo com o leitor PDF de sua preferência. Para baixar o PDF, clique no link abaixo.

Caso deseje mais informações sobre como imprimir, salvar e trabalhar com PDFs, a Highwire Press oferece uma página de Perguntas Frequentes sobre PDFs bastante útil.

Visitas a este artigo: 2034

Total de downloads do artigo: 1752