Codificação perceptiva de áudio por meio de decomposições atômicas em exponenciais complexas
DOI:
https://doi.org/10.18265/1517-03062015v1n46p196-212Palavras-chave:
Matching Pursuit, Decomposição atômica de sinais, PsicoacústicaResumo
A decomposição atômica de sinais por algoritmo da classe Matching Pursuit (MP) vem sendo aplicada à compressão de áudio. De acordo com a literatura, a utilização de critérios psicoacústicos possibilita uma representação mais compacta do sinal, sem perda de qualidade percebida. Neste trabalho é apresentada a implementação de um sistema de análise por síntese de sinais de áudio utilizando MP associado ao uso de limiar de mascaramento global psicoacústico, inspirado na camada I do MPEG, além de Dicionários de Exponenciais Complexas (DEC). Para a compressão do sinal, utiliza-se a otimização taxa-distorção por curvas operacionais, ajustando-se o multiplicador de Lagrange. O desempenho do método de compressão para diferentes tipos de sinais é avaliado por uma medida objetiva padronizada pela International Telecommunications Union (ITU), o Perceptual Evaluation of Audio Quality (PEAQ) em função da taxa de bits por amostra, obtendo-se resultados satisfatórios.
Downloads
Métricas
Referências
BOSI, M.; GOLDBERG, R. E. Introduction to digital audio coding and standards. New York: Springer, 2002.
CORMEN, T. H. et al. Introduction to algorithms. Cambridge, MA: MIT press, 2009.
DAVIS, G.; MALLAT, S.; ZHANG, Z. Adaptive time-frequency approximations with matching pursuits. Wavelet Analysis and Its Applications, v. 5, p. 271-293, 1994. DOI: 10.1016/B978-0-08-052084-1.50018-1. Disponível em: https://www.sciencedirect.com/science/article/pii/B9780080520841500181. Acesso em: 3 dez. 2018.
FASTL, H.; ZWICKER, E. Psychoacoustics: facts and models. Berlin: Springer, 2007.
FERRANDO, S. E.; KOLASA, L. A.; KOVACEVIC, N. Algorithm 820: a flexible implementation of matching pursuit for Gabor functions on the interval. ACM Transactions on Mathematical Software (TOMS), v. 28, n. 3, p. 337-353, 2002. DOI: 10.1145/569147.569151. Disponível em: https://dl.acm.org/citation.cfm?id=569151. Acesso em: 3 dez. 2018.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 11172-3:1993: Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part1: Systems, Part2: Video, Part3: Audio. Geneva, Switzerland: [s. n.], 1993.
LIN, Y.; ABDULLA, W. H. Audio watermark: a comprehensive foundation using MATLAB. Cham: Springer, 2015.
MALLAT, S. A wavelet tour of signal processing: the sparse way. 3. ed. Burlington: Academic Press, 2008.
MALLAT, S. G.; ZHANG, Z. Matching pursuits with time-frequency dictionaries. IEEE Transactions on Signal Processing, v. 41, n. 12, p. 3397-3415, 1993. Disponível em: https://pdfs.semanticscholar.org/0b6e/98a6a8cf8283fd76fe1100b23f11f4cfa711.pdf. Acesso em: 3 dez. 2018.
NOGUEIRA JUNIOR, V. S.; TCHEOU, M. P.; ÁVILA, F. R. Decomposição psicoacústica de sinais de áudio com base em dicionários redundantes e exponenciais complexas. In: SIMPÓSIO DE PROCESSAMENTO DE SINAIS, 7., 2017, São Bernardo do Campo. Anais [...]. São Bernardo do Campo: UFABC, 2017. Disponível em: http://eventos.ufabc.edu.br/siimsps/files/id151.pdf. Acesso em: 3 dez. 2018.
ORTEGA, A.; RAMCHANDRAN, K. Rate-distortion methods for image and video compression. IEEE Signal Processing Magazine, v. 15, n. 6, p. 23-50, 1998. DOI: 10.1109/79.733495. Disponível em: https://ieeexplore.ieee.org/abstract/document/733495. Acesso em: 3 dez. 2018.
PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Scalable parametric audio coder using sparse approximation with frame-to-frame perceptually optimized wavelet packet based dictionary. In: AES CONVENTION, 138., 2015, Varsóvia. Proceedings [...]. Varsóvia: AES, 2015. Disponível em: http://www.aes.org/e-lib/online/browse.cfm?elib=17688. Acesso em: 3 dez. 2018.
PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Audio/speech coding using the matching pursuit with frame-based psychoacoustic optimized time-frequency dictionaries and its performance evaluation. In: IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING: ALGORITHMS, ARCHITECTURES, ARRANGEMENTS, AND APPLICATIONS, 20., 2016, Poznan, Poland. Proceedings […]. Poznan: IEEE Xplore, 2016. DOI: 10.1109/SPA.2016.7763617. Disponível em: https://ieeexplore.ieee.org/abstract/document/7763617. Acesso em: 3 dez. 2018.
INTERNATIONAL TELECOMMUNICATION UNION. BS. 1387: method for objective measurements of perceived audio quality. Geneva, Switzerland: International Telecommunication Union, 2001.
SAYOOD, K. Introduction to data compression. 5. ed. Cambridge, MA: Morgan Kaufmann, 2017.
SPANIAS, A.; PAINTER, T.; ATTI, V. Audio signal processing and coding. New Jersey: Wiley, 2006.
THIEDE, T. et al. PEAQ-The ITU standard for objective measurement of perceived audio quality. Journal of the Audio Engineering Society, v. 48, n. 1/2, p. 3-29, 2000. Disponível em: http://www.aes.org/e-lib/browse.cfm?elib=12078. Acesso em: 3 dez. 2018.
TOUMI, I.; DERRIEN, O. Sparse decomposition of audio signals using a perceptual measure of distortion. Application to lossy audio coding. In: INTERNATIONAL CONFERENCE ON DIGITAL AUDIO EFFECTS, 18., 2015, Trondheim, Norway. Proceedings [...]. Trondheim, Norway: Norwegian University of Science and Technology, 2015. Disponível em: https://hal.archives-ouvertes.fr/hal-01240863/. Acesso em: 3 dez. 2018.
VERMA, T. S.; MENG, T. H. Y. Sinusoidal modeling using frame-based perceptually weighted matching pursuits. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, 24., Phoenix, USA, 1999. Proceedings [...]. Phoenix, USA: IEEE, 1999. p. 981-984. DOI: 10.1109/ICASSP.1999.759861. Disponível em: https://ieeexplore.ieee.org/abstract/document/759861. Acesso em: 3 dez. 2018.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Revista Principia possa publicar seus artigos e disponibilizar pra toda a comunidade.
A Revista Principia adota a licença Creative Commons 4.0 do tipo atribuição (CC-BY). Esta licença permite que outros distribuam, remixem, adaptem e criem a partir do seu trabalho, inclusive para fins comerciais, desde que lhe atribuam o devido crédito pela criação original.
Os autores estão autorizados a enviar a versão do artigo publicado nesta revista em repositório institucionais, com reconhecimento de autoria e publicação inicial na Revista Principia.
Demais informações sobre a Política de Direitos Autorais da Revista Principia encontram-se neste link.