Codificação perceptiva de áudio por meio de decomposições atômicas em exponenciais complexas
DOI:
https://doi.org/10.18265/1517-03062015v1n46p196-212Palavras-chave:
Matching Pursuit, Decomposição atômica de sinais, PsicoacústicaResumo
A decomposição atômica de sinais por algoritmo da classe Matching Pursuit (MP) vem sendo aplicada à compressão de áudio. De acordo com a literatura, a utilização de critérios psicoacústicos possibilita uma representação mais compacta do sinal, sem perda de qualidade percebida. Neste trabalho é apresentada a implementação de um sistema de análise por síntese de sinais de áudio utilizando MP associado ao uso de limiar de mascaramento global psicoacústico, inspirado na camada I do MPEG, além de Dicionários de Exponenciais Complexas (DEC). Para a compressão do sinal, utiliza-se a otimização taxa-distorção por curvas operacionais, ajustando-se o multiplicador de Lagrange. O desempenho do método de compressão para diferentes tipos de sinais é avaliado por uma medida objetiva padronizada pela International Telecommunications Union (ITU), o Perceptual Evaluation of Audio Quality (PEAQ) em função da taxa de bits por amostra, obtendo-se resultados satisfatórios.
Downloads
Referências
BOSI, M.; GOLDBERG, R. E. Introduction to digital audio coding and standards. New York: Springer, 2002.
CORMEN, T. H. et al. Introduction to algorithms. Cambridge, MA: MIT press, 2009.
DAVIS, G.; MALLAT, S.; ZHANG, Z. Adaptive time-frequency approximations with matching pursuits. Wavelet Analysis and Its Applications, v. 5, p. 271-293, 1994. DOI: 10.1016/B978-0-08-052084-1.50018-1. Disponível em: https://www.sciencedirect.com/science/article/pii/B9780080520841500181. Acesso em: 3 dez. 2018.
FASTL, H.; ZWICKER, E. Psychoacoustics: facts and models. Berlin: Springer, 2007.
FERRANDO, S. E.; KOLASA, L. A.; KOVACEVIC, N. Algorithm 820: a flexible implementation of matching pursuit for Gabor functions on the interval. ACM Transactions on Mathematical Software (TOMS), v. 28, n. 3, p. 337-353, 2002. DOI: 10.1145/569147.569151. Disponível em: https://dl.acm.org/citation.cfm?id=569151. Acesso em: 3 dez. 2018.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 11172-3:1993: Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part1: Systems, Part2: Video, Part3: Audio. Geneva, Switzerland: [s. n.], 1993.
LIN, Y.; ABDULLA, W. H. Audio watermark: a comprehensive foundation using MATLAB. Cham: Springer, 2015.
MALLAT, S. A wavelet tour of signal processing: the sparse way. 3. ed. Burlington: Academic Press, 2008.
MALLAT, S. G.; ZHANG, Z. Matching pursuits with time-frequency dictionaries. IEEE Transactions on Signal Processing, v. 41, n. 12, p. 3397-3415, 1993. Disponível em: https://pdfs.semanticscholar.org/0b6e/98a6a8cf8283fd76fe1100b23f11f4cfa711.pdf. Acesso em: 3 dez. 2018.
NOGUEIRA JUNIOR, V. S.; TCHEOU, M. P.; ÁVILA, F. R. Decomposição psicoacústica de sinais de áudio com base em dicionários redundantes e exponenciais complexas. In: SIMPÓSIO DE PROCESSAMENTO DE SINAIS, 7., 2017, São Bernardo do Campo. Anais [...]. São Bernardo do Campo: UFABC, 2017. Disponível em: http://eventos.ufabc.edu.br/siimsps/files/id151.pdf. Acesso em: 3 dez. 2018.
ORTEGA, A.; RAMCHANDRAN, K. Rate-distortion methods for image and video compression. IEEE Signal Processing Magazine, v. 15, n. 6, p. 23-50, 1998. DOI: 10.1109/79.733495. Disponível em: https://ieeexplore.ieee.org/abstract/document/733495. Acesso em: 3 dez. 2018.
PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Scalable parametric audio coder using sparse approximation with frame-to-frame perceptually optimized wavelet packet based dictionary. In: AES CONVENTION, 138., 2015, Varsóvia. Proceedings [...]. Varsóvia: AES, 2015. Disponível em: http://www.aes.org/e-lib/online/browse.cfm?elib=17688. Acesso em: 3 dez. 2018.
PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Audio/speech coding using the matching pursuit with frame-based psychoacoustic optimized time-frequency dictionaries and its performance evaluation. In: IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING: ALGORITHMS, ARCHITECTURES, ARRANGEMENTS, AND APPLICATIONS, 20., 2016, Poznan, Poland. Proceedings […]. Poznan: IEEE Xplore, 2016. DOI: 10.1109/SPA.2016.7763617. Disponível em: https://ieeexplore.ieee.org/abstract/document/7763617. Acesso em: 3 dez. 2018.
INTERNATIONAL TELECOMMUNICATION UNION. BS. 1387: method for objective measurements of perceived audio quality. Geneva, Switzerland: International Telecommunication Union, 2001.
SAYOOD, K. Introduction to data compression. 5. ed. Cambridge, MA: Morgan Kaufmann, 2017.
SPANIAS, A.; PAINTER, T.; ATTI, V. Audio signal processing and coding. New Jersey: Wiley, 2006.
THIEDE, T. et al. PEAQ-The ITU standard for objective measurement of perceived audio quality. Journal of the Audio Engineering Society, v. 48, n. 1/2, p. 3-29, 2000. Disponível em: http://www.aes.org/e-lib/browse.cfm?elib=12078. Acesso em: 3 dez. 2018.
TOUMI, I.; DERRIEN, O. Sparse decomposition of audio signals using a perceptual measure of distortion. Application to lossy audio coding. In: INTERNATIONAL CONFERENCE ON DIGITAL AUDIO EFFECTS, 18., 2015, Trondheim, Norway. Proceedings [...]. Trondheim, Norway: Norwegian University of Science and Technology, 2015. Disponível em: https://hal.archives-ouvertes.fr/hal-01240863/. Acesso em: 3 dez. 2018.
VERMA, T. S.; MENG, T. H. Y. Sinusoidal modeling using frame-based perceptually weighted matching pursuits. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, 24., Phoenix, USA, 1999. Proceedings [...]. Phoenix, USA: IEEE, 1999. p. 981-984. DOI: 10.1109/ICASSP.1999.759861. Disponível em: https://ieeexplore.ieee.org/abstract/document/759861. Acesso em: 3 dez. 2018.
Downloads
Publicado
Edição
Seção
Licença
• O(s) autor(es) autoriza(m) a publicação do artigo na revista;
• O(s) autor(es) garante(m) que a contribuição é original e inédita e que não está em processo de avaliação em outra(s) revista(s), nem esteja publicado em anais de congressos e/ou portais institucionais;
• A revista não se responsabiliza pelas opiniões, ideias e conceitos emitidos nos textos, por serem de inteira responsabilidade de seu(s) autor(es). Opiniões e perspectivas expressas no texto, assim como a precisão e a procedência das citações, são de responsabilidade exclusiva do(s) autor(es), e contribuem para a promoção dos:
- Princípios FAIR (Findable, Accessible, Interoperable, and Reusable – localizável, acessível, interoperável e reutilizável);
- Princípios DEIA (diversidade, equidade, inclusão e acessibilidade).
• É reservado aos editores o direito de proceder ajustes textuais e de adequação do artigos às normas da publicação.
Responsabilidades dos autores e transferência de direitos autorais
Os autores devem declarar a originalidade do estudo, bem como o fato de que este não foi publicado anteriormente ou está sendo considerado para publicação em outro meio, como periódicos, anais de eventos ou livros. Ao autorizarem a publicação do artigo na Revista Principia, os autores devem também responsabilizar-se pelo conteúdo do manuscrito, cujos direitos autorais, em caso de aprovação, passarão a ser propriedade exclusiva da revista. A Declaração de Responsabilidades dos Autores e Transferência de Direitos Autorais deverá ser assinada por todos os autores e anexada ao sistema como documento suplementar durante o processo de submissão. Clique no link abaixo para fazer o download do modelo.
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Revista Principia possa publicar seus artigos e disponibilizar pra toda a comunidade.
A Revista Principia adota a licença Creative Commons 4.0 do tipo atribuição (CC-BY). Esta licença permite que outros distribuam, remixem, adaptem e criem a partir do seu trabalho, inclusive para fins comerciais, desde que lhe atribuam o devido crédito pela criação original.
Os autores estão autorizados a enviar a versão do artigo publicado nesta revista em repositório institucionais, com reconhecimento de autoria e publicação inicial na Revista Principia.