Análise acústica de sinais de vozes patológicas por meio de características temporais
DOI:
https://doi.org/10.18265/1517-03062015v1n22p28-34Palavras-chave:
análise acústica, vozes patológicas, características temporais, diagnóstico de patologias laríngeasResumo
Este trabalho trata da avaliação de desempenho de características temporais de sinais de vozes no pré-diagnóstico de patologias laríngeas (edema de Reinke, paralisia e nódulos vocais). As medidas temporais empregadas são: período de pitch (frequência fundamental), jitter, shimmer, energia segmental, autocorrelação e taxa de cruzamentos por zero. Na etapa de classificação é empregada a análise discriminante com as funções linear (LDA) e quadrática (QDA). A avaliação de desempenho do classificador é realizada com as medidas empregadas de forma individual e de forma combinada, ressaltando a eficácia da análise de discriminante linear na classificação entre vozes saudáveis e patológicas. A medida temporal que apresentou os melhores resultados na classificação foi Shimmer percentual, chegando a uma precisão de 100% entre sinais saudáveis ou com paralisia, como também para sinais com edema de Reinke ou com nódulo vocal.
Downloads
Referências
BALAKRISHNAMA, S.; GANAPATHIRAJU, A. Linear discriminant analysis – a Brief Tutorial. Institute for Signal and Information Processing. Department of Electrical and Computer Engineering, Mississippi State University.
BRANDT, R. R. Modelagem de vozes patológicas baseadas na estimação espectral do ruído glotal. Dissertação (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2011. 88f
BOYANOV, B.; HADJITODOROV, S. Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases. Proceedings of IEEE Engineering in Medicine And Biology. p. 74-82, Jul./Aug. 1997.
COSTA, S. C.; AGUIAR NETO, B. G.; FECHINE, J. F.; CORREIA, S. Parametric cepstral analysis for pathological voice assessment. Proceedings of The 23rd ACM Symposium on Applied Computing 2008 (ACM SAC’ 2008). Computer Applications in Health Care Track, Pages 1410-1414, Fortaleza,-Ceará, Brazil, Mar.2008a.
COSTA, S. C. Análise acústica, baseada no modelo linear de produção da fala, para discriminação de vozes patológicas.Tese de Doutorado. Universidade Federal de Campina Grande, Campina Grande, 2008b.
COSTA, S. C.; COSTA, W. C. A.; CORREIA, S. Análise Dinâmica não linear aplicada ao diagnóstico de patologias orgânicas e neurológicas da laringe. In: VI Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VI CONNEPI. . Anais do VI CONNEPI, 2011.
DELLER Jr. R.;PROAKIS, J. G.; HANSEN, J. H. L. Discrete-time processing of speech signals.Macmillan Publishing Co., 1993.
DIBAZAR, A. A.; BERGER, T.W.; NARAYANAN, S. S. Pathological voice assessment. Proceedings of the 28th IEEE EMBS Annual International Conference, New York- USA, p. 1669-1673, Ago., 2006.
FRAZÃO, M. C. L. M.; COSTA S. C.; CORREIA S.; COSTA, W. C. A. O uso de características temporais de sinais de voz na detecção de patologias laríngeas. In: VII Congresso de Pesquisa e Inovação da Rede Norte e Nordeste de Educação Tecnológica – VII CONNEPI, 2012. Anais do VII CONNEPI, 2012.
GODINO-LLORENTE, J. I.; GÓMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters. IEEE Transactions on Biomedical Engineering, v. 53 (10), p.1943-1953, 2006.
KAY ELEMETRICS, Kay Elemetrics Corp. Disordered Voice Database, model 4337, 03 ed, 1994a.
KAY ELEMETRICS, Kay Elemetrics Corp. Multi-Speech, model 3700, 1994b.
KHATTREE, R.; NAIK, D.N. Multivariate data reduction and discrimination with SAS software. 558 p. Cary, NC, USA: SAS Institute Inc., 2000.
RABINER.R.; SCHAFER R. W. Digital processing of speech signals. Nova Jersey: Prentice-Hall, 1978.
RUSSO, I. C. P.; BEHLAU, M. Percepção da fala: análise acústica do português brasileiro. São Paulo: Lovise, 1993.
SAMPAIO, O. M. Diferenciação entre rums cubanos e não cubanos. Instituto de Química de São Carlos- Universidade de São Paulo. São Paulo, 2006.
VARELLA, C.A.A. Estimativa da produtividade e do estresse nutricional da cultura do milho usando imagens digitais. Tese (Doutorado em Engenharia Agrícola) – Universidade Federal de Viçosa- Viçosa, 2004. 92f.
VIEIRA, R. T. Processamento digital de sinais de voz para detecção de patologias na laringe. . Monografia (Bacharel em Engenharia Elétrica) – Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, João Pessoa, 2011. 66f.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Revista Principia possa publicar seus artigos e disponibilizar pra toda a comunidade.
A Revista Principia adota a licença Creative Commons 4.0 do tipo atribuição (CC-BY). Esta licença permite que outros distribuam, remixem, adaptem e criem a partir do seu trabalho, inclusive para fins comerciais, desde que lhe atribuam o devido crédito pela criação original.
Os autores estão autorizados a enviar a versão do artigo publicado nesta revista em repositório institucionais, com reconhecimento de autoria e publicação inicial na Revista Principia.
Demais informações sobre a Política de Direitos Autorais da Revista Principia encontram-se neste link.