Codificação perceptiva de áudio por meio de decomposições atômicas em exponenciais complexas

Valmir dos Santos Nogueira Junior; Michel Pompeu Tcheou; Flávio Rainho Ávila

doi:10.18265/1517-03062015v1n46p196-212

Autores

Valmir dos Santos Nogueira Junior Universidade do Estado do Rio de Janeiro (UERJ) Brazil http://orcid.org/0000-0003-3703-3618
Michel Pompeu Tcheou Universidade do Estado do Rio de Janeiro (UERJ) Brazil http://orcid.org/0000-0003-2068-2865
Flávio Rainho Ávila Universidade do Estado do Rio de Janeiro (UERJ) Brazil

DOI:

https://doi.org/10.18265/1517-03062015v1n46p196-212

Palavras-chave:

Matching Pursuit, Decomposição atômica de sinais, Psicoacústica

Resumo

A decomposição atômica de sinais por algoritmo da classe Matching Pursuit (MP) vem sendo aplicada à compressão de áudio. De acordo com a literatura, a utilização de critérios psicoacústicos possibilita uma representação mais compacta do sinal, sem perda de qualidade percebida. Neste trabalho é apresentada a implementação de um sistema de análise por síntese de sinais de áudio utilizando MP associado ao uso de limiar de mascaramento global psicoacústico, inspirado na camada I do MPEG, além de Dicionários de Exponenciais Complexas (DEC). Para a compressão do sinal, utiliza-se a otimização taxa-distorção por curvas operacionais, ajustando-se o multiplicador de Lagrange. O desempenho do método de compressão para diferentes tipos de sinais é avaliado por uma medida objetiva padronizada pela International Telecommunications Union (ITU), o Perceptual Evaluation of Audio Quality (PEAQ) em função da taxa de bits por amostra, obtendo-se resultados satisfatórios.

Downloads

Não há dados estatísticos.

Métricas

Carregando Métricas ...

Referências

BOSI, M.; GOLDBERG, R. E. Introduction to digital audio coding and standards. New York: Springer, 2002.

CORMEN, T. H. et al. Introduction to algorithms. Cambridge, MA: MIT press, 2009.

DAVIS, G.; MALLAT, S.; ZHANG, Z. Adaptive time-frequency approximations with matching pursuits. Wavelet Analysis and Its Applications, v. 5, p. 271-293, 1994. DOI: 10.1016/B978-0-08-052084-1.50018-1. Disponível em: https://www.sciencedirect.com/science/article/pii/B9780080520841500181. Acesso em: 3 dez. 2018.

FASTL, H.; ZWICKER, E. Psychoacoustics: facts and models. Berlin: Springer, 2007.

FERRANDO, S. E.; KOLASA, L. A.; KOVACEVIC, N. Algorithm 820: a flexible implementation of matching pursuit for Gabor functions on the interval. ACM Transactions on Mathematical Software (TOMS), v. 28, n. 3, p. 337-353, 2002. DOI: 10.1145/569147.569151. Disponível em: https://dl.acm.org/citation.cfm?id=569151. Acesso em: 3 dez. 2018.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 11172-3:1993: Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part1: Systems, Part2: Video, Part3: Audio. Geneva, Switzerland: [s. n.], 1993.

LIN, Y.; ABDULLA, W. H. Audio watermark: a comprehensive foundation using MATLAB. Cham: Springer, 2015.

MALLAT, S. A wavelet tour of signal processing: the sparse way. 3. ed. Burlington: Academic Press, 2008.

MALLAT, S. G.; ZHANG, Z. Matching pursuits with time-frequency dictionaries. IEEE Transactions on Signal Processing, v. 41, n. 12, p. 3397-3415, 1993. Disponível em: https://pdfs.semanticscholar.org/0b6e/98a6a8cf8283fd76fe1100b23f11f4cfa711.pdf. Acesso em: 3 dez. 2018.

NOGUEIRA JUNIOR, V. S.; TCHEOU, M. P.; ÁVILA, F. R. Decomposição psicoacústica de sinais de áudio com base em dicionários redundantes e exponenciais complexas. In: SIMPÓSIO DE PROCESSAMENTO DE SINAIS, 7., 2017, São Bernardo do Campo. Anais [...]. São Bernardo do Campo: UFABC, 2017. Disponível em: http://eventos.ufabc.edu.br/siimsps/files/id151.pdf. Acesso em: 3 dez. 2018.

ORTEGA, A.; RAMCHANDRAN, K. Rate-distortion methods for image and video compression. IEEE Signal Processing Magazine, v. 15, n. 6, p. 23-50, 1998. DOI: 10.1109/79.733495. Disponível em: https://ieeexplore.ieee.org/abstract/document/733495. Acesso em: 3 dez. 2018.

PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Scalable parametric audio coder using sparse approximation with frame-to-frame perceptually optimized wavelet packet based dictionary. In: AES CONVENTION, 138., 2015, Varsóvia. Proceedings [...]. Varsóvia: AES, 2015. Disponível em: http://www.aes.org/e-lib/online/browse.cfm?elib=17688. Acesso em: 3 dez. 2018.

PETROVSKY, A.; HERASIMOVICH, V.; PETROVSKY, A. Audio/speech coding using the matching pursuit with frame-based psychoacoustic optimized time-frequency dictionaries and its performance evaluation. In: IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING: ALGORITHMS, ARCHITECTURES, ARRANGEMENTS, AND APPLICATIONS, 20., 2016, Poznan, Poland. Proceedings […]. Poznan: IEEE Xplore, 2016. DOI: 10.1109/SPA.2016.7763617. Disponível em: https://ieeexplore.ieee.org/abstract/document/7763617. Acesso em: 3 dez. 2018.

INTERNATIONAL TELECOMMUNICATION UNION. BS. 1387: method for objective measurements of perceived audio quality. Geneva, Switzerland: International Telecommunication Union, 2001.

SAYOOD, K. Introduction to data compression. 5. ed. Cambridge, MA: Morgan Kaufmann, 2017.

SPANIAS, A.; PAINTER, T.; ATTI, V. Audio signal processing and coding. New Jersey: Wiley, 2006.

THIEDE, T. et al. PEAQ-The ITU standard for objective measurement of perceived audio quality. Journal of the Audio Engineering Society, v. 48, n. 1/2, p. 3-29, 2000. Disponível em: http://www.aes.org/e-lib/browse.cfm?elib=12078. Acesso em: 3 dez. 2018.

TOUMI, I.; DERRIEN, O. Sparse decomposition of audio signals using a perceptual measure of distortion. Application to lossy audio coding. In: INTERNATIONAL CONFERENCE ON DIGITAL AUDIO EFFECTS, 18., 2015, Trondheim, Norway. Proceedings [...]. Trondheim, Norway: Norwegian University of Science and Technology, 2015. Disponível em: https://hal.archives-ouvertes.fr/hal-01240863/. Acesso em: 3 dez. 2018.

VERMA, T. S.; MENG, T. H. Y. Sinusoidal modeling using frame-based perceptually weighted matching pursuits. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, 24., Phoenix, USA, 1999. Proceedings [...]. Phoenix, USA: IEEE, 1999. p. 981-984. DOI: 10.1109/ICASSP.1999.759861. Disponível em: https://ieeexplore.ieee.org/abstract/document/759861. Acesso em: 3 dez. 2018.

Codificação perceptiva de áudio por meio de decomposições atômicas em exponenciais complexas

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Métricas

Referências

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Google Tradutor

Enviar Submissão

info_basica

Informações

Associada/membro/apoiador

Bases de Dados Indexadas

Redes Sociais

Preservação Digital

Mapa

Palavras-chave