MPEG Surround
MPEG Surround (ISO / IEC 23003-1[1] ou MPEG-D Part 1[2][3]), também conhecido como Codificação de Áudio Espacial (SAC)[4][5][6][7] é um formato de compressão com perdas para som surround que fornece um método para estender serviços de áudio mono ou estéreo para áudio multicanal de forma compatível com versões anteriores. As taxas de bits totais usadas para o núcleo (mono ou estéreo) e os dados MPEG Surround são normalmente apenas um pouco maiores do que as taxas de bits usadas para codificação do núcleo (mono ou estéreo). O MPEG Surround adiciona um fluxo de informações secundárias ao fluxo de bits principal (mono ou estéreo), contendo dados de imagem espacial. Os sistemas de reprodução estéreo antigos ignorarão essas informações secundárias, enquanto os players que suportam decodificação MPEG Surround emitirão o áudio multicanal reconstruído.
O Moving Picture Experts Group (MPEG) lançou uma chamada para propostas sobre codificação de áudio espacial MPEG em março de 2004. O grupo decidiu que a tecnologia que seria o ponto de partida no processo de padronização seria uma combinação das propostas de dois proponentes - Fraunhofer IIS / Agere Systems e Coding Technologies / Philips.[5] O padrão MPEG Surround foi desenvolvido pelo Moving Picture Experts Group (ISO/IEC JTC 1 /SC29/WG11) e publicado como ISO/IEC 23003 em 2007.[1] Foi o primeiro padrão do grupo de padrões MPEG-D, formalmente conhecido como ISO/IEC 23003 - Tecnologias de áudio MPEG.
O MPEG Surround também foi definido como um dos tipos de objetos de áudio MPEG-4 em 2007.[8] Existe também o tipo de objeto MPEG-4 No Delay MPEG Surround (LD MPEG Surround), que foi publicado em 2010.[9][10] O Spatial Audio Object Coding (SAOC) foi publicado como MPEG-D Parte 2 - ISO/IEC 23003–2 em 2010 e estende o padrão MPEG Surround reutilizando seus recursos de renderização espacial, mantendo total compatibilidade com os receptores existentes. O sistema MPEG SAOC permite que os usuários do lado da decodificação controlem interativamente a renderização de cada objeto de áudio individual (por exemplo, instrumentos individuais, vocais, vozes humanas).[2][3][11][12][13][14][15] Existe também o Unified Speech and Audio Coding (USAC) que será definido na MPEG-D Parte 3 - ISO/IEC 23003-3 e ISO/IEC 14496-3:2009/Amd 3.[16][17] As ferramentas de codificação paramétrica MPEG-D MPEG Surround são integradas ao codec USAC.[18]
O núcleo (mono ou estéreo) pode ser codificado com qualquer codec de áudio (com ou sem perdas). Taxas de bits particularmente baixas (64-96 kbit/s para canais 5.1) são possíveis ao usar HE-AAC v2 como codec principal.
Percepção de sons no espaço
[editar | editar código-fonte]A codificação MPEG Surround usa nossa capacidade de perceber o som em 3D e captura essa percepção em um conjunto compacto de parâmetros. A percepção espacial é atribuída principalmente a três parâmetros, ou pistas, que descrevem como os humanos localizam o som no plano horizontal: diferença de nível interaural (ILD), diferença de tempo interaural (ITD) e coerência interaural (IC). Esses três conceitos são ilustrados na próxima imagem. Formas de onda diretas, ou de primeira chegada, da fonte atingem o ouvido esquerdo no momento, enquanto o som direto recebido pelo ouvido direito é difratado ao redor da cabeça, com atraso de tempo e atenuação de nível associados. Esses dois efeitos resultam em DTI e DPI associados à fonte principal. Por fim, em um ambiente reverberante, o som refletido da fonte, ou o som da fonte difusa, ou o som não correlacionado pode atingir ambos os ouvidos, todos eles relacionados com CI.
Descrição
[editar | editar código-fonte]O MPEG Surround usa diferenças intercanais em nível, fase e coerência equivalentes aos parâmetros ILD, ITD e IC. A imagem espacial é capturada por um sinal de áudio multicanal em relação a um sinal de downmix transmitido. Esses parâmetros são codificados em uma forma muito compacta para decodificar os parâmetros e o sinal transmitido e sintetizar uma representação multicanal de alta qualidade.
O codificador MPEG Surround recebe um sinal de áudio multicanal x1 a xN onde o número de canais de entrada é N. O aspecto mais importante do processo de codificação é que um sinal de downmix, xt1 e xt2, que é tipicamente estéreo, é derivado do sinal de entrada multicanal, e é esse sinal de downmix que é comprimido para transmissão pelo canal em vez do sinal multicanal. O codificador pode explorar o processo de downmix para ser mais vantajoso. Ele não apenas cria um equivalente fiel do sinal multicanal no downmix mono ou estéreo, mas também cria a melhor decodificação multicanal possível com base no downmix e nas indicações espaciais codificadas. Alternativamente, o downmix pode ser fornecido externamente (Downmix artístico antes do bloco do diagrama). O processo de codificação MPEG Surround pode ser ignorado pelo algoritmo de compressão usado para os canais transmitidos (codificador de áudio e decodificador de áudio antes do bloco do diagrama). Pode ser qualquer tipo de algoritmo de compressão de alto desempenho, como MPEG-1 Layer III, MPEG-4 AAC ou MPEG-4 High Efficiency AAC, ou pode até ser PCM.
Os sinais espaciais são gerados e recuperados em dois tipos de módulos de filtro. O OTT reverso (um para dois) gera um fluxo downmixado, uma diferença de nível, um valor de coerência e um sinal residual opcional de um par de sinais. O elemento TTT reverso (dois para três) gera dois fluxos downmixados, duas diferenças de nível, um valor de coerência e um sinal residual opcional. Tanto na direção direta (decodificação) quanto na reversa (codificação), organizar esses filtros em uma configuração de árvore permite downmixing e recuperação arbitrários.[19]
Compatibilidade com legado
[editar | editar código-fonte]A técnica MPEG Surround permite compatibilidade com decodificadores MPEG estéreo existentes e futuros, fazendo com que o downmix transmitido (por exemplo, estéreo) pareça aos decodificadores MPEG estéreo uma versão estéreo comum do sinal multicanal. A compatibilidade com decodificadores estéreo é desejável, pois a apresentação estéreo permanecerá difundida devido ao número de aplicações em que a audição é feita principalmente por meio de fones de ouvido, como tocadores de música portáteis.
O MPEG Surround também suporta um modo no qual o downmix é compatível com decodificadores surround de matriz populares, como o Dolby Pro-Logic.[19]
Aplicações
[editar | editar código-fonte]Transmissão de áudio digital
[editar | editar código-fonte]Devido à largura de banda relativamente pequena do canal, ao custo relativamente alto do equipamento de transmissão e das licenças de transmissão e ao desejo de maximizar as opções do usuário fornecendo muitos programas, a maioria dos sistemas de transmissão digital existentes ou planejados não pode fornecer som multicanal aos usuários.
O DRM+ foi projetado[20] para ser totalmente capaz de transmitir MPEG Surround e tal transmissão também foi demonstrada com sucesso.[21]
A compatibilidade com versões anteriores e a sobrecarga relativamente baixa do MPEG Surround oferecem uma maneira de adicionar som multicanal ao DAB sem reduzir severamente a qualidade do áudio ou impactar outros serviços.
Transmissão de TV Digital
[editar | editar código-fonte]Atualmente, a maioria das transmissões de TV digital usa codificação de áudio estéreo. O MPEG Surround pode ser usado para estender esses serviços estabelecidos ao som surround, como no DAB.
Serviço de download de música
[editar | editar código-fonte]Atualmente, vários serviços comerciais de download de música estão disponíveis e fazendo sucesso comercial considerável. Esses serviços podem ser estendidos perfeitamente para fornecer apresentações multicanal, permanecendo compatíveis com reprodutores estéreo: em computadores com sistemas de reprodução de 5.1 canais, os arquivos de som compactados são apresentados em som surround, enquanto em reprodutores portáteis os mesmos arquivos são reproduzidos em estéreo.
Serviço de streaming de música/rádio na internet
[editar | editar código-fonte]Muitas rádios da Internet operam com largura de banda de transmissão severamente limitada, de modo que só podem oferecer conteúdo mono ou estéreo. A tecnologia MPEG Surround Coding poderia estender isso para um serviço multicanal, permanecendo ainda dentro da faixa operacional permitida de taxas de bits. Como a eficiência é de suma importância nesta aplicação, a compressão do sinal de áudio transmitido é vital. Usando a recente tecnologia de compressão MPEG (codificação de perfil de alta eficiência MPEG-4), sistemas MPEG Surround completos foram demonstrados com taxas de bits tão baixas quanto 48 kbit/s.
Ver também
[editar | editar código-fonte]Referências
- ↑ a b ISO (29 de janeiro de 2007). «ISO/IEC 23003-1:2007 - Information technology -- MPEG audio technologies -- Part 1: MPEG Surround». ISO. Consultado em 13 de novembro de 2024. Arquivado do original em 6 de junho de 2011
- ↑ a b MPEG. «MPEG standards - Full list of standards developed or under development». chiariglione.org. Consultado em 13 de novembro de 2024. Arquivado do original em 20 de abril de 2010
- ↑ a b MPEG. «Terms of Reference». chiariglione.org. Consultado em 13 de novembro de 2024. Arquivado do original em 21 de fevereiro de 2010
- ↑ «Preview of ISO/IEC 23003-1, First edition, 2007-02-15, Part 1: MPEG Surround» (PDF). 15 de fevereiro de 2007. Consultado em 13 de novembro de 2024. Arquivado do original (PDF) em 14 de junho de 2011
- ↑ a b ISO/IEC JTC 1/SC29/WG11 (Julho de 2005). «Tutorial on MPEG Surround Audio Coding». Consultado em 13 de novembro de 2024. Cópia arquivada em 30 de abril de 2010
- ↑ «Working documents, MPEG-D (MPEG Audio Technologies)». MPEG. Consultado em 13 de novembro de 2024. Cópia arquivada em 21 de fevereiro de 2010
- ↑ MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status (PDF), Audio Engineering Society, 2005, consultado em 13 de novembro de 2024, cópia arquivada (PDF) em 18 de julho de 2011
- ↑ ISO (2007). «BSAC extensions and transport of MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007». ISO. Consultado em 13 de outubro de 2009. Arquivado do original em 6 de junho de 2011
- ↑ AES Convention Paper 8099 - A new parametric stereo and Multi Channel Extension for MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF), consultado em 13 de novembro de 2024, cópia arquivada (PDF) em 28 de setembro de 2011
- ↑ ISO/IEC JTC 1/SC29/WG11 (Outubro de 2009), ISO/IEC 14496-3:2009/FPDAM 2 – ALS simple profile and transport of SAOC, N11032 (DOC), consultado em 13 de novembro de 2024, cópia arquivada em 29 de julho de 2014
- ↑ ISO (6 de outubro de 2010). «ISO/IEC 23003-2 - Information technology -- MPEG audio technologies -- Part 2: Spatial Audio Object Coding (SAOC)». Consultado em 13 de novembro de 2024. Arquivado do original em 1 de fevereiro de 2012
- ↑ Spatial Audio Object Coding (SAOC) – The Upcoming MPEG Standard on Parametric Object Based Audio Coding (PDF), 2008, consultado em 13 de novembro de 2024, cópia arquivada (PDF) em 12 de março de 2012
- ↑ Manfred Lutzky, Fraunhofer IIS (2007), MPEG low delay audio codecs (PDF), consultado em 13 de novembro de 2024, cópia arquivada (PDF) em 27 de setembro de 2011
- ↑ MPEG (Outubro de 2009). «91st WG11 meeting notice». chiariglione.org. Consultado em 13 de novembro de 2024. Arquivado do original em 17 de fevereiro de 2010
- ↑ ISO/IEC JTC 1/SC 29 (30 de dezembro de 2009). «Programme of Work (Allocated to SC 29/WG 11) - MPEG-D». Consultado em 13 de novembro de 2024. Arquivado do original em 31 de dezembro de 2013
- ↑ «ISO/IEC DIS 23003-3 - Information technology -- MPEG audio technologies -- Part 3: Unified speech and audio coding». 15 de fevereiro de 2011. Consultado em 13 de novembro de 2024. Arquivado do original em 28 de janeiro de 2012
- ↑ «ISO/IEC 14496-3:2009/PDAM 3 - Transport of unified speech and audio coding (USAC)». 30 de junho de 2011. Consultado em 13 de novembro de 2024. Arquivado do original em 29 de janeiro de 2012
- ↑ «Unified Speech and Audio Coder Common Encoder Reference Software». Março de 2011. Consultado em 13 de novembro de 2024. Arquivado do original em 6 de agosto de 2011
- ↑ a b Herre, Jürgen; Kjörling, Kristofer; Breebaart, Jeroen; Faller, Christof; Disch, Sascha; Purnhagen, Heiko; Koppens, Jeroen; Hilpert, Johannes; Rödén, Jonas (8 de dezembro de 2008). «MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding». Journal of the Audio Engineering Society (em inglês). 56 (11): 932–955. Consultado em 13 de novembro de 2024 Abstract
- ↑ «DRM system enhancement approved by ETSI» (Nota de imprensa). DRM Consortium. 2 de setembro de 2009. Consultado em 13 de novembro de 2024. Arquivado do original em 15 de outubro de 2009
- ↑ «DRM+ in Band I promoted as a most suitable technology to complement other digital radio standards in countries like France» (Nota de imprensa). DRM Consortium. 16 de julho de 2009. Consultado em 13 de novembro de 2024. Arquivado do original em 15 de outubro de 2009
Ligações externas
[editar | editar código-fonte]- MPEG Surround
- Official MPEG web site
- RFC 5691 - RTP Payload Format for Elementary Streams with MPEG Surround Multi-Channel Audio