Codificação perceptiva de áudio por meio de decomposições atômicas em exponenciais complexas

Valmir dos Santos Nogueira Junior

ORCID iD Universidade do Estado do Rio de Janeiro (UERJ) Brasil

Michel Pompeu Tcheou

ORCID iD Universidade do Estado do Rio de Janeiro (UERJ) Brasil

Flávio Rainho Ávila

Universidade do Estado do Rio de Janeiro (UERJ) Brasil

Resumo

A decomposição atômica de sinais por algoritmo da classe Matching Pursuit (MP) vem sendo aplicada à compressão de áudio. De acordo com a literatura, a utilização de critérios psicoacústicos possibilita uma representação mais compacta do sinal, sem perda de qualidade percebida. Neste trabalho é apresentada a implementação de um sistema de análise por síntese de sinais de áudio utilizando MP associado ao uso de limiar de mascaramento global psicoacústico, inspirado na camada I do MPEG, além de Dicionários de Exponenciais Complexas (DEC). Para a compressão do sinal, utiliza-se a otimização taxa-distorção por curvas operacionais, ajustando-se o multiplicador de Lagrange. O desempenho do método de compressão para diferentes tipos de sinais é avaliado por uma medida objetiva padronizada pela International Telecommunications Union (ITU), o Perceptual Evaluation of Audio Quality (PEAQ) em função da taxa de bits por amostra, obtendo-se resultados satisfatórios.

Palavras-chave


Matching Pursuit; Decomposição atômica de sinais; Psicoacústica


Texto completo:

Referências


BOSI, M.; GOLDBERG, R. E. Introduction to digital audio coding and standards. New York: Springer, 2002.

CORMEN, T. H. et al. Introduction to algorithms. Cambridge, MA: MIT press, 2009.

DAVIS, G.; MALLAT, S.; ZHANG, Z. Adaptive time-frequency approximations with matching pursuits. Wavelet Analysis and Its Applications, v. 5, p. 271-293, 1994. DOI: 10.1016/B978-0-08-052084-1.50018-1. Disponível em: https://www.sciencedirect.com/science/article/pii/B9780080520841500181. Acesso em: 3 dez. 2018.

FASTL, H.; ZWICKER, E. Psychoacoustics: facts and models. Berlin: Springer, 2007.

FERRANDO, S. E.; KOLASA, L. A.; KOVACEVIC, N. Algorithm 820: a flexible implementation of matching pursuit for Gabor functions on the interval. ACM Transactions on Mathematical Software (TOMS), v. 28, n. 3, p. 337-353, 2002. DOI: 10.1145/569147.569151. Disponível em: https://dl.acm.org/citation.cfm?id=569151. Acesso em: 3 dez. 2018.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 11172-3:1993: Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part1: Systems, Part2: Video, Part3: Audio. Geneva, Switzerland: [s. n.], 1993.

LIN, Y.; ABDULLA, W. H. Audio watermark: a comprehensive foundation using MATLAB. Cham: Springer, 2015.

MALLAT, S. A wavelet tour of signal processing: the sparse way. 3. ed. Burlington: Academic Press, 2008.

MALLAT, S. G.; ZHANG, Z. Matching pursuits with time-frequency dictionaries. IEEE Transactions on Signal Processing, v. 41, n. 12, p. 3397-3415, 1993. Disponível em: https://pdfs.semanticscholar.org/0b6e/98a6a8cf8283fd76fe1100b23f11f4cfa711.pdf. Acesso em: 3 dez. 2018.

NOGUEIRA JUNIOR, V. S.; TCHEOU, M. P.; ÁVILA, F. R. Decomposição psicoacústica de sinais de áudio com base em dicionários redundantes e exponenciais complexas. In: SIMPÓSIO DE PROCESSAMENTO DE SINAIS, 7., 2017, São Bernardo do Campo. Anais [...]. São Bernardo do Campo: UFABC, 2017. Disponível em: http://eventos.ufabc.edu.br/siimsps/files/id151.pdf. Acesso em: 3 dez. 2018.

ORTEGA, A.; RAMCHANDRAN, K. Rate-distortion methods for image and video compression. IEEE Signal Processing Magazine, v. 15, n. 6, p. 23-50, 1998. DOI: 10.1109/79.733495. Disponível em: https://ieeexplore.ieee.org/abstract/document/733495. Acesso em: 3 dez. 2018.

PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Scalable parametric audio coder using sparse approximation with frame-to-frame perceptually optimized wavelet packet based dictionary. In: AES CONVENTION, 138., 2015, Varsóvia. Proceedings [...]. Varsóvia: AES, 2015. Disponível em: http://www.aes.org/e-lib/online/browse.cfm?elib=17688. Acesso em: 3 dez. 2018.

PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Audio/speech coding using the matching pursuit with frame-based psychoacoustic optimized time-frequency dictionaries and its performance evaluation. In: IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING: ALGORITHMS, ARCHITECTURES, ARRANGEMENTS, AND APPLICATIONS, 20., 2016, Poznan, Poland. Proceedings […]. Poznan: IEEE Xplore, 2016. DOI: 10.1109/SPA.2016.7763617. Disponível em: https://ieeexplore.ieee.org/abstract/document/7763617. Acesso em: 3 dez. 2018.

INTERNATIONAL TELECOMMUNICATION UNION. BS. 1387: method for objective measurements of perceived audio quality. Geneva, Switzerland: International Telecommunication Union, 2001.

SAYOOD, K. Introduction to data compression. 5. ed. Cambridge, MA: Morgan Kaufmann, 2017.

SPANIAS, A.; PAINTER, T.; ATTI, V. Audio signal processing and coding. New Jersey: Wiley, 2006.

THIEDE, T. et al. PEAQ-The ITU standard for objective measurement of perceived audio quality. Journal of the Audio Engineering Society, v. 48, n. 1/2, p. 3-29, 2000. Disponível em: http://www.aes.org/e-lib/browse.cfm?elib=12078. Acesso em: 3 dez. 2018.

TOUMI, I.; DERRIEN, O. Sparse decomposition of audio signals using a perceptual measure of distortion. Application to lossy audio coding. In: INTERNATIONAL CONFERENCE ON DIGITAL AUDIO EFFECTS, 18., 2015, Trondheim, Norway. Proceedings [...]. Trondheim, Norway: Norwegian University of Science and Technology, 2015. Disponível em: https://hal.archives-ouvertes.fr/hal-01240863/. Acesso em: 3 dez. 2018.

VERMA, T. S.; MENG, T. H. Y. Sinusoidal modeling using frame-based perceptually weighted matching pursuits. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, 24., Phoenix, USA, 1999. Proceedings [...]. Phoenix, USA: IEEE, 1999. p. 981-984. DOI: 10.1109/ICASSP.1999.759861. Disponível em: https://ieeexplore.ieee.org/abstract/document/759861. Acesso em: 3 dez. 2018.


DOI: http://dx.doi.org/10.18265/1517-03062015v1n46p196-212

O arquivo PDF selecionado deve ser carregado no navegador caso tenha instalado um plugin de leitura de arquivos PDF (por exemplo, uma versão atual do Adobe Acrobat Reader).

Como alternativa, pode-se baixar o arquivo PDF para o computador, de onde poderá abrí-lo com o leitor PDF de sua preferência. Para baixar o PDF, clique no link abaixo.

Caso deseje mais informações sobre como imprimir, salvar e trabalhar com PDFs, a Highwire Press oferece uma página de Perguntas Frequentes sobre PDFs bastante útil.

Visitas a este artigo: 1776

Total de downloads do artigo: 1349