Classificação de sinais de voz através da aplicação da transformada Wavelet Packet e redes neurais artificiais

Augusto Felix Tavares Silva

Instituto Federal da Paraíba, Campus João Pessoa

Samuel R. de Abreu

Instituto Federal da Paraíba, Campus João Pessoa

Silvana Cunha Costa

Instituto Federal da Paraíba, Campus João Pessoa

Suzete Elida Nobrega Correia

Instituto Federal da Paraíba, Campus João Pessoa

Resumo

Pathologies such as edema, nodules and paralysis are quite recurrent and directly influence vocal dysfunctions. The acoustic analysis has been used to evaluate the disorders caused in the voice signals, detecting the presence of pathologies in the larynx, through digital signal processing techniques. This work aims to distinguish healthy voice signals from the ones affected by laryngeal pathologies, using the Wavelet Packet transform in the feature extraction step. Energy and entropy measures, in six resolution levels, obtained through the Daubechies wavelet of order 4 are used in the discrimination of the voice signals. The classification is done through Artificial Neural Networks. Accuracies above 90% were obtained, with the entropy measure, in the discrimination between healthy voices and affected ones by pathologies in the vocal folds (nodules, Reinke’s edema and paralysis)

Palavras-chave


Acoustic Analysis. Wavelet Packet Transform. Artificial Neural Networks. Laryngeal Pathologies.


Texto completo:

Referências


AKAY, M. Time Frequency and Wavelets in Biomedical Signal Processing, lEEE Press, 1998.

AKBARI, A.; ARJMANDI, M. K. An efficient voice pathology classification scheme based on applying multi-layer linear discriminant analysis to wavelet packet-based features. Biomedical Signal Processing and Control, v. 10, 2014.

ALMEIDA, N. C. Sistema Inteligente para Diagnóstico de Patologias na Laringe utilizando Máquinas de Vetor Suporte. Tese (Doutorado em Automação e Sistemas)–UFRN, Natal, 2010.

ARJMANDI, K. A.; POOYAN, M. An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine. Biomedical Signal Processing and Control, v. 1, n. 7, 2012.

BEHROOZMAND, R.; ALMASGANJ, F. Optimal Selection of wavelet-packet-based features using genetic algorithm in pathological assessment of patient´s speech signal with unilateral vocal fold paralysis. Computers in Bioloy and Medicine, v. 37, 2007.

BURRUS, C. S.; GOPINATH, R. A.; GUO, H. Introduction to Wavelets and Wavelet Transforms: a primer, 1998.

CASTELANO, C. R. Estudo Comparativo da Transformada Wavelet no Reconhecimento de Padrões da Íris Humana. Dissertação (Mestrado em Engenharia Elétrica) – Escola de Engenharia de São Carlos, USP, 2006.

CHOUEITER, G. F.; GLASS, J. R. A wavelet and filter bank framework for phonetic classification, In: IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING, 2005. Proceedings…ICASSP, 2005.

COIFMAN, R. R.; WICKERHAUSER, M. V. Entropy-based Algorithms for Best Basis Selection. IEE Transaction on Information Theory, v. 38, n. 2, 1992.

CORREIA, S. E. N.; COSTA W. C. A.; COSTA S. L. N. C. Detecção Automática de Patologias Laríngeas usando a Transformada Wavelet

Discreta. Anais... do 11th Brazilian Congress on Computational Intelligence (CBIC), 2013.

COSTA, S. L. N. C. Análise acústica, baseada no modelo linear de produção da fala, para discriminação de vozes patológicas. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, 2008.

FONSECA, S. E. Wavelets, Predição Linear e LS-SVM Aplicados na Análise e Classificação de Sinais de Vozes Patológicas. Tese (Doutorado em Engenharia Elétrica)– Universidade de São Paulo, 2008.

GODINO-LLORENTE, J. I.; GÓMEZ-VILDA, P.; BLANCO VELASCO, M. Dimensionality Reduction of a Pathological Voice Quality Assessment System Based on Gaussian Mixture Models and ShortTerm Cepstral Parameters. IEEE Transactions on Biomedical Engineering, v. 53, n. 10, 2006.

MAGALHÃES, M. K. et al. Percepção Visual da Perturbação do Sinal de Voz por Meio da Transformada de Hilbert. In: XI CONGRESSO BRASILEIRO DE INFORMÁTICA EM SAÚDE (CBIS’2008), 2008, Campos do Jordão. Anais... do XI Congresso Brasileiro de Informática em Saúde, 2008.

MALLAT, S. A Wavelet Tour of Signal Processing, Academic Press, 1999.

PARRAGA, A. Aplicação da Transformada Wavelet Packet na Análise e Classificação de Sinais de Vozes Patológicas. Dissertação (Mestrado em Automação e Instrumentação Eletrônica )–UFRS, Porto Alegre, 2002.

PINTO, R. M. da F. Novas Abordagens ao Estudo de Sinais Biomédicos: Análise em Tempo-Frequência e Transformada de HilbertHuang. Tese (Doutorado em Engenharia Biomédica e Física) – Universidade de Lisboa, 2009.

SANTOS, M. O. et al. Avaliações dos distúrbios Vocais em Crianças usando Características baseadas na Transformada Wavelet. In: XIV CONGRESSO BRASILEIRO DE ENGENHARIA BIOMÉDICA (CBEB 2014), Anais... 2014.

SHUCK JR., A.; GUIMARGES, L. V.; WISBE, J. O. Dysphonic Voice Classification using Wavelet Packet Transform and Artificial Neural Network. In: ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY, 2003. Proceedings of the 25th Annual International Conference of the IEEE, 2003.

TANG, Y. Y. Wavelet Theory and Its Applications to Pattern Recognition, World Scientific, 2000.

TOSI, O. Vibratory Motion. In: Textbook of phisics for audiologists and speach pathologists. Lasing, Linko Copies, p.188-208,1979.


DOI: http://dx.doi.org/10.18265/1517-03062015v1n37p34-41

O arquivo PDF selecionado deve ser carregado no navegador caso tenha instalado um plugin de leitura de arquivos PDF (por exemplo, uma versão atual do Adobe Acrobat Reader).

Como alternativa, pode-se baixar o arquivo PDF para o computador, de onde poderá abrí-lo com o leitor PDF de sua preferência. Para baixar o PDF, clique no link abaixo.

Caso deseje mais informações sobre como imprimir, salvar e trabalhar com PDFs, a Highwire Press oferece uma página de Perguntas Frequentes sobre PDFs bastante útil.

Visitas a este artigo: 1183

Total de downloads do artigo: 1044