- Submissão
- Submissão online
- Diretrizes para Autores
- Declaração de Direito Autoral
- Política de Privacidade
- Sobre este sistema de publicação
- Sobre
- Foco e Escopo
- Equipe Editorial
- História da Revista Principia
- Normas de homogeneidade
- Comitê de ética
- Política de ética para autores, Conselho Editorial e avaliadores
- Política de retirada de artigos
- Perguntas e respostas frequentes
- Equipe de apoio da Revista Principia
- Conflito de interesses
- Plano de Desenvolvimento Editorial da Revista Principia
- Princípios DEIA (Diversidade, Equidade, Inclusão e Acessibilidade)
- Normas para números especiais na Revista Principia
- Princípios FAIR
- Curso de Escrita Científica - ACS - Prof. Osvaldo
- Sites e manuais sobre boas práticas científicas
Simplificações e adaptações para redução do custo computacional do pré-processamento de voz na Platraforma Arduino
Resumo
Atualmente, existe um crescente interesse por aplicações em que a interação homem-máquina seja realizada via voz humana. No entanto, alguns equipamentos, como telefones celulares e eletrodomésticos, possuem limitações de armazenamento e processamento, dificultando a implementação de sistemas de reconhecimento automático da fala. Neste trabalho, foram implementadas simplificações matemáticas e estratégias de programação em duas etapas típicas de um sistema de reconhecimento da fala: a pré-ênfase e a divisão em quadros e janelamento. O objetivo dessa implementação foi analisar o impacto dessas adaptações no desempenho e, consequentemente, no custo computacional das referidas etapas. Ao final deste trabalho, o tempo de execução foi reduzido para 1/5 do tempo original da pré-ênfase e para 1/10 no caso da divisão em quadros e janelamento.
Palavras-chave
Processamento de sinais de voz; Pré-ênfase; Janelamento; Arduino; Custo computacional
Texto completo:
Referências
ATMEL CORPORATION. Atmel 8-bit microcontroller with 4/8/16/32kbytes in-system programmable flash: datasheet summary. San Jose, CA: Atmel Corporation, 2014.
BARR, M. Programming Embedded Systems in C and C++. Sebastopol, CA: O’Reilly & Associates, 1999.
BENZEGHIBA, M. F.; BOURLARD, H. On the combination of speech and speaker recognition. In: EUROPEAN CONFERENCE ON SPEECH, COMMUNICATION AND TECHNOLOGY (EUROSPEECH” 03), 8., 2003, Geneva, Switzerland, Proceedings... Geneva: ISCA, 2003. p. 1361-1364.
CIPRIANO, J. L. G. Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em models ocultos de Markov. 2001. 123 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001.
CUNHA, A. M.; VELHO, L. Métodos Probabilísticos para reconhecimento de Voz. Relatório Técnico. Rio de Janeiro: Laboratório VISGRAF – Instituto de Matemática Pura e Aplicada, 2003.
FECHINE, J. M. Reconhecimento automático de identidade vocal utilizando modelagem híbrida: Paramétrica e Estatística. 2000. 212 f. Tese (Doutorado em Engenharia Elétrica) – Universidade Federal de Campina Grande, Campina Grande, 2000.
FRANCIA III, G. A. Embedded Systems Programming. Journal of Computing Sciences in Colleges, v. 17, n. 2, p. 217-223, 2001.
FURUI, S. Cepstral Analysis Technique for Automatic Speaker Verification. IEEE Transactions on Acoustics, Speech and Signal Processing, v. 29, n. 2, p. 254-272, Apr. 1981.
KLEIJN, W. B.; PALIWAL, K. K. Speech Coding and Synthesis. New York: Elsevier Science, 1995.
LATHI, B. P. Modern Digital and Analog Communication Systems. 3rd ed. New York: Oxford University Press, 1998.
LIMA, A. A.; FRANCISCO, M. S.; LIMA NETTO, S.; RESENDE JUNIOR., F. G. V. Análise Comparativa de Parâmetros em Sistemas de Reconhecimento de Voz. In: SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES, 18., 2000, Gramado. Anais... Gramado: SBrT, 2000.
MCROBERTS, Michael. Arduino Básico. São Paulo: Novatec, 2011.
PETRY, A.; ZANUZ, A.; BARONE, D. A. C. Reconhecimento automático de pessoas pela voz através de técnicas de processamento digital de sinais. In: SEMANA DA COMPUTAÇÃO – SEMAC, 11., 2000, São José do Rio Preto. Anais... São José do Rio Preto: UNESP, 2000.
RABINER, L.; SCHAFER, R. W. Digital processing of speech signals. New Jersey: Prentice Hall, 1978.
SHAUGHNESSY, D. O. Speech Communications: human and machine. New York: Wiley-IEEE Press, 2000.
SILVA, D. D. C. Desenvolvimento de um IP CORE de Pré-processamento Digital de Sinais de Voz para Aplicação em Sistemas Embutidos. 2006. 108 f. Dissertação (Mestrado em Informática) – Universidade Federal de Campina Grande, Campina Grande, 2006.
Visitas a este artigo: 2952
Total de downloads do artigo: 1820