Simplificações e adaptações para redução do custo computacional do pré-processamento de voz na Platraforma Arduino
DOI:
https://doi.org/10.18265/1517-03062015v1n29p9-18Palavras-chave:
Processamento de sinais de voz, Pré-ênfase, Janelamento, Arduino, Custo computacionalResumo
Atualmente, existe um crescente interesse por aplicações em que a interação homem-máquina seja realizada via voz humana. No entanto, alguns equipamentos, como telefones celulares e eletrodomésticos, possuem limitações de armazenamento e processamento, dificultando a implementação de sistemas de reconhecimento automático da fala. Neste trabalho, foram implementadas simplificações matemáticas e estratégias de programação em duas etapas típicas de um sistema de reconhecimento da fala: a pré-ênfase e a divisão em quadros e janelamento. O objetivo dessa implementação foi analisar o impacto dessas adaptações no desempenho e, consequentemente, no custo computacional das referidas etapas. Ao final deste trabalho, o tempo de execução foi reduzido para 1/5 do tempo original da pré-ênfase e para 1/10 no caso da divisão em quadros e janelamento.
Downloads
Referências
ATMEL CORPORATION. Atmel 8-bit microcontroller with 4/8/16/32kbytes in-system programmable flash: datasheet summary. San Jose, CA: Atmel Corporation, 2014.
BARR, M. Programming Embedded Systems in C and C++. Sebastopol, CA: O’Reilly & Associates, 1999.
BENZEGHIBA, M. F.; BOURLARD, H. On the combination of speech and speaker recognition. In: EUROPEAN CONFERENCE ON SPEECH, COMMUNICATION AND TECHNOLOGY (EUROSPEECH” 03), 8., 2003, Geneva, Switzerland, Proceedings... Geneva: ISCA, 2003. p. 1361-1364.
CIPRIANO, J. L. G. Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em models ocultos de Markov. 2001. 123 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001.
CUNHA, A. M.; VELHO, L. Métodos Probabilísticos para reconhecimento de Voz. Relatório Técnico. Rio de Janeiro: Laboratório VISGRAF – Instituto de Matemática Pura e Aplicada, 2003.
FECHINE, J. M. Reconhecimento automático de identidade vocal utilizando modelagem híbrida: Paramétrica e Estatística. 2000. 212 f. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2000.
FRANCIA III, G. A. Embedded Systems Programming. Journal of Computing Sciences in Colleges, v. 17, n. 2, p. 217-223, 2001.
FURUI, S. Cepstral Analysis Technique for Automatic Speaker Verification. IEEE Transactions on Acoustics, Speech and Signal Processing, v. 29, n. 2, p. 254-272, Apr. 1981.
KLEIJN, W. B.; PALIWAL, K. K. Speech Coding and Synthesis. New York: Elsevier Science, 1995.
LATHI, B. P. Modern Digital and Analog Communication Systems. 3rd ed. New York: Oxford University Press, 1998.
LIMA, A. A.; FRANCISCO, M. S.; LIMA NETTO, S.; RESENDE JUNIOR., F. G. V. Análise Comparativa de Parâmetros em Sistemas de Reconhecimento de Voz. In: SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES, 18., 2000, Gramado. Anais... Gramado: SBrT, 2000.
MCROBERTS, Michael. Arduino Básico. São Paulo: Novatec, 2011.
PETRY, A.; ZANUZ, A.; BARONE, D. A. C. Reconhecimento automático de pessoas pela voz através de técnicas de processamento digital de sinais. In: SEMANA DA COMPUTAÇÃO – SEMAC, 11., 2000, São José do Rio Preto. Anais... São José do Rio Preto: UNESP, 2000.
RABINER, L.; SCHAFER, R. W. Digital processing of speech signals. New Jersey: Prentice Hall, 1978.
SHAUGHNESSY, D. O. Speech Communications: human and machine. New York: Wiley-IEEE Press, 2000.
SILVA, D. D. C. Desenvolvimento de um IP CORE de Pré-processamento Digital de Sinais de Voz para Aplicação em Sistemas Embutidos. 2006. 108 f. Dissertação (Mestrado em Informática) – Universidade Federal de Campina Grande, Campina Grande, 2006.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Revista Principia possa publicar seus artigos e disponibilizar pra toda a comunidade.
A Revista Principia adota a licença Creative Commons 4.0 do tipo atribuição (CC-BY). Esta licença permite que outros distribuam, remixem, adaptem e criem a partir do seu trabalho, inclusive para fins comerciais, desde que lhe atribuam o devido crédito pela criação original.
Os autores estão autorizados a enviar a versão do artigo publicado nesta revista em repositório institucionais, com reconhecimento de autoria e publicação inicial na Revista Principia.
Demais informações sobre a Política de Direitos Autorais da Revista Principia encontram-se neste link.