Classificação de sinais de voz através da aplicação da transformada Wavelet Packet e redes neurais artificiais

Autores

  • Augusto Felix Tavares Silva Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), Campus João Pessoa
  • Samuel R. de Abreu Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), Campus João Pessoa
  • Silvana Cunha Costa Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), Campus João Pessoa
  • Suzete Elida Nobrega Correia Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), Campus João Pessoa http://orcid.org/0000-0002-7675-3979

DOI:

https://doi.org/10.18265/1517-03062015v1n37p34-41

Palavras-chave:

Análise acústica, Transformada Wavelet Packet, Redes Neurais Artificiais, Patologias Laríngeas

Resumo

Patologias como edemas, nódulos e paralisia são bastante recorrentes e influenciam diretamente as disfunções vocais. A análise acústica tem sido empregada para avaliar as desordens causadas nos sinais de voz, detectando a presença de patologias na laringe, por meio de técnicas de processamento digital de sinais.  Este trabalho tem como objetivo distinguir sinais de voz, entre saudáveis e afetados por patologias laríngeas, empregando a transformada Wavelet Packet na etapa de extração de características. Medidas de energia e entropia, em seis níveis de resolução, obtidas através da wavelet de Daubechies de ordem 4, são usadas na discriminação dos sinais de voz. A classificação é feita por meio de Redes Neurais Artificiais. Foram obtidas taxas de acurácia acima de 90%, com a medida de entropia, na discriminação entre vozes saudáveis e afetadas por patologias nas pregas vocais (nódulos, edema de Reinke e paralisia).

Downloads

Não há dados estatísticos.

Referências

AKAY, M. Time Frequency and Wavelets in Biomedical Signal Processing, lEEE Press, 1998.

AKBARI, A.; ARJMANDI, M. K. An efficient voice pathology classification scheme based on applying multi-layer linear discriminant analysis to wavelet packet-based features. Biomedical Signal Processing and Control, v. 10, 2014.

ALMEIDA, N. C. Sistema Inteligente para Diagnóstico de Patologias na Laringe utilizando Máquinas de Vetor Suporte. Tese (Doutorado em Automação e Sistemas)–UFRN, Natal, 2010.

ARJMANDI, K. A.; POOYAN, M. An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine. Biomedical Signal Processing and Control, v. 1, n. 7, 2012.

BEHROOZMAND, R.; ALMASGANJ, F. Optimal Selection of wavelet-packet-based features using genetic algorithm in pathological assessment of patient´s speech signal with unilateral vocal fold paralysis. Computers in Bioloy and Medicine, v. 37, 2007.

BURRUS, C. S.; GOPINATH, R. A.; GUO, H. Introduction to Wavelets and Wavelet Transforms: a primer, 1998.

CASTELANO, C. R. Estudo Comparativo da Transformada Wavelet no Reconhecimento de Padrões da Íris Humana. Dissertação (Mestrado em Engenharia Elétrica) – Escola de Engenharia de São Carlos, USP, 2006.

CHOUEITER, G. F.; GLASS, J. R. A wavelet and filter bank framework for phonetic classification, In: IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING, 2005. Proceedings…ICASSP, 2005.

COIFMAN, R. R.; WICKERHAUSER, M. V. Entropy-based Algorithms for Best Basis Selection. IEE Transaction on Information Theory, v. 38, n. 2, 1992.

CORREIA, S. E. N.; COSTA W. C. A.; COSTA S. L. N. C. Detecção Automática de Patologias Laríngeas usando a Transformada Wavelet Discreta. Anais... do 11th Brazilian Congress on Computational Intelligence (CBIC), 2013.

COSTA, S. L. N. C. Análise acústica, baseada no modelo linear de produção da fala, para discriminação de vozes patológicas. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, 2008.

FONSECA, S. E. Wavelets, Predição Linear e LS-SVM Aplicados na Análise e Classificação de Sinais de Vozes Patológicas. Tese (Doutorado em Engenharia Elétrica)–Universidade de São Paulo, 2008.

GODINO-LLORENTE, J. I.; GÓMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality Reduction of a Pathological Voice Quality Assessment System Based on Gaussian Mixture Models and Short-Term Cepstral Parameters. IEEE Transactions on Biomedical Engineering, v. 53, n. 10, 2006.

MAGALHÃES, M. K. et al. Percepção Visual da Perturbação do Sinal de Voz por Meio da Transformada de Hilbert. In: XI CONGRESSO BRASILEIRO DE INFORMÁTICA EM SAÚDE (CBIS'2008), 2008, Campos do Jordão. Anais... do XI Congresso Brasileiro de Informática em Saúde, 2008.

MALLAT, S. A Wavelet Tour of Signal Processing, Academic Press, 1999.

PARRAGA, A. Aplicação da Transformada Wavelet Packet na Análise e Classificação de Sinais de Vozes Patológicas. Dissertação (Mestrado em Automação e Instrumentação Eletrônica )–UFRS, Porto Alegre, 2002.

PINTO, R. M. da F. Novas Abordagens ao Estudo de Sinais Biomédicos: Análise em Tempo-Frequência e Transformada de Hilbert-Huang. Tese (Doutorado em Engenharia Biomédica e Física) – Universidade de Lisboa, 2009.

SANTOS, M. O. et al. Avaliações dos distúrbios Vocais em Crianças usando Características baseadas na Transformada Wavelet. In: XXIV CONGRESSO BRASILEIRO DE ENGENHARIA BIOMÉDICA (CBEB 2014), Anais... 2014.

SHUCK JR., A.; GUIMARGES, L. V.; WISBE, J. O. Dysphonic Voice Classification using Wavelet Packet Transform and Artificial Neural Network. In: ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY, 2003. Proceedings of the 25th Annual International Conference of the IEEE, 2003.

TANG, Y. Y. Wavelet Theory and Its Applications to Pattern Recognition, World Scientific, 2000.

TOSI, O. Vibratory Motion. In: Textbook of phisics for audiologists and speach pathologists. Lasing, Linko Copies, p.188-208,1979.

Downloads

Publicado

2017-12-21

Edição

Seção

Engenharias IV - Engenharia Elétrica - Telecomunicações e Processamento de Sinais

Artigos mais lidos pelo mesmo(s) autor(es)