Simplificações e adaptações para redução do custo computacional do pré-processamento de voz na Platraforma Arduino

Autores

  • Pedro Ítalo Ribeiro Albuquerque Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • Emerson Barbosa da Cunha Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • Daniella Dias Cavalcante da Silva Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)
  • César Rocha Vasconcelos Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB)

DOI:

https://doi.org/10.18265/1517-03062015v1n29p9-18

Palavras-chave:

Processamento de sinais de voz, Pré-ênfase, Janelamento, Arduino, Custo computacional

Resumo

Atualmente, existe um crescente interesse por aplicações em que a interação homem-máquina seja realizada via voz humana. No entanto, alguns equipamentos, como telefones celulares e eletrodomésticos, possuem limitações de armazenamento e processamento, dificultando a implementação de sistemas de reconhecimento automático da fala. Neste trabalho, foram implementadas simplificações matemáticas e estratégias de programação em duas etapas típicas de um sistema de reconhecimento da fala: a pré-ênfase e a divisão em quadros e janelamento. O objetivo dessa implementação foi analisar o impacto dessas adaptações no desempenho e, consequentemente, no custo computacional das referidas etapas. Ao final deste trabalho, o tempo de execução foi reduzido para 1/5 do tempo original da pré-ênfase e para 1/10 no caso da divisão em quadros e janelamento.

Downloads

Não há dados estatísticos.

Referências

ATMEL CORPORATION. Atmel 8-bit microcontroller with 4/8/16/32kbytes in-system programmable flash: datasheet summary. San Jose, CA: Atmel Corporation, 2014.

BARR, M. Programming Embedded Systems in C and C++. Sebastopol, CA: O’Reilly & Associates, 1999.

BENZEGHIBA, M. F.; BOURLARD, H. On the combination of speech and speaker recognition. In: EUROPEAN CONFERENCE ON SPEECH, COMMUNICATION AND TECHNOLOGY (EUROSPEECH” 03), 8., 2003, Geneva, Switzerland, Proceedings... Geneva: ISCA, 2003. p. 1361-1364.

CIPRIANO, J. L. G. Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em models ocultos de Markov. 2001. 123 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001.

CUNHA, A. M.; VELHO, L. Métodos Probabilísticos para reconhecimento de Voz. Relatório Técnico. Rio de Janeiro: Laboratório VISGRAF – Instituto de Matemática Pura e Aplicada, 2003.

FECHINE, J. M. Reconhecimento automático de identidade vocal utilizando modelagem híbrida: Paramétrica e Estatística. 2000. 212 f. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2000.

FRANCIA III, G. A. Embedded Systems Programming. Journal of Computing Sciences in Colleges, v. 17, n. 2, p. 217-223, 2001.

FURUI, S. Cepstral Analysis Technique for Automatic Speaker Verification. IEEE Transactions on Acoustics, Speech and Signal Processing, v. 29, n. 2, p. 254-272, Apr. 1981.

KLEIJN, W. B.; PALIWAL, K. K. Speech Coding and Synthesis. New York: Elsevier Science, 1995.

LATHI, B. P. Modern Digital and Analog Communication Systems. 3rd ed. New York: Oxford University Press, 1998.

LIMA, A. A.; FRANCISCO, M. S.; LIMA NETTO, S.; RESENDE JUNIOR., F. G. V. Análise Comparativa de Parâmetros em Sistemas de Reconhecimento de Voz. In: SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES, 18., 2000, Gramado. Anais... Gramado: SBrT, 2000.

MCROBERTS, Michael. Arduino Básico. São Paulo: Novatec, 2011.

PETRY, A.; ZANUZ, A.; BARONE, D. A. C. Reconhecimento automático de pessoas pela voz através de técnicas de processamento digital de sinais. In: SEMANA DA COMPUTAÇÃO – SEMAC, 11., 2000, São José do Rio Preto. Anais... São José do Rio Preto: UNESP, 2000.

RABINER, L.; SCHAFER, R. W. Digital processing of speech signals. New Jersey: Prentice Hall, 1978.

SHAUGHNESSY, D. O. Speech Communications: human and machine. New York: Wiley-IEEE Press, 2000.

SILVA, D. D. C. Desenvolvimento de um IP CORE de Pré-processamento Digital de Sinais de Voz para Aplicação em Sistemas Embutidos. 2006. 108 f. Dissertação (Mestrado em Informática) – Universidade Federal de Campina Grande, Campina Grande, 2006.

Downloads

Publicado

2023-03-13

Edição

Seção

Ciência da Computação

Artigos mais lidos pelo mesmo(s) autor(es)