Codificador avanzado de audio de alta eficiencia (HE-AAC del inglés High-Efficiency Advanced Audio Coding) es un formato de compresión de audio digital con pérdidas definido como un perfil MPEG-4 de audio en la ISO/IEC 14496-3 basado en la Replicación de banda espectral (Spectral Band Replication (SBR)) y el estéreo paramétrico (Parametric Stereo (PS)).
Image may be NSFW.
Clik here to view.
Diagrama de integración, basado en la especificación técnica de MPEG-4 y Evolución
Es una extensión de una de los tres perfiles definidos en el estándar MPEG-2Parte 7 (AAC), el AAC LC(Low Complexity AAC), optimizado para tasas de bitsbajas.
Codificador avanzado de alta eficiencia | |
---|---|
Desarrollador | |
ISO | |
Información general | |
Extensión de archivo | .m4a |
Tipo de formato | Formato de compresión de audio |
Contenedor para | 3GP, MP4, .dvb, etc. |
Extendido de | AAC |
Estándar(es) | ISO/IEC 14496-3 |
Formato abierto | ? |
Características principales
HE-AAC está considerado un codificador de calidad alta. Las tasas de bits que se consiguen en audio estéreode “buena calidad” van de 16 a 48 Kbits/s dependiendo de la versión. Las frecuencias de muestreoque soporta oscilan entre los 24 y 96 KHz. Soporta canales mono, estéreoy muticanal(5.1, 7.1).
Versiones
HE-AAC v1
También conocido como aacPlus es la primera versión de HE-AAC. Combina el códec de audio AAC-LC con la Replicación de banda espectral (SBR), herramienta de expansión debido a que ofrece la misma experiencia de sonido con aproximadamente la mitad de la tasa de bits respecto a otros códecs de audio. El perfil de HE-AAC v1 está especificado en la ISO/IEC 14496-3:2001/Amd.1. Algunos ejemplos de tasas de bits que consigue para audio de “buena calidad” son:[2]
Mono | Estéreo | 5.1 |
---|---|---|
32 Kbps | 48 Kbps | 128 Kbps |
HE-AAC v2
También conocido como aacPlus v2, es la segunda versión de HE-AAC. HE-AAC v2 surge de la combinación de las tecnologías usadas en la v1 (AAC-LC y SBR) con el Estéreo Paramétrico (Parametric Stereo (PS)). El perfil de HE-AAC v2 está especificado en la ISO/IEC 14496-3:2001/Amd.4.
Características
El uso del estéreo paramétricopermite aumentar la eficiencia en la codificación respecto a la v1 mediante la explotación de una representación paramétrica de la imagen estéreo de la señalde entrada. HE-AAC v2 es un superconjunto del códec de audio AACque consigue para MPEG-4tasas de bits más bajas manteniendo la calidad del audio.
Otra característica importante que incluye HE-AAC v2, que también es incluida en la v1, es la flexibilidad en el transporte de metadatos. Éstos se pueden incorporar como datos auxiliares, de forma que tan sólo pueden ser decodificados por los decodificadorescompatibles. Los decodificadores que no sean compatibles ignoraran éstos metadatos.
Arquitectura
- Codificador
Image may be NSFW.
Clik here to view.
Codificador HE-AAC.
Las tecnologías AAC, SBR y PS son los componentes básicos del perfil MPEG-4HE-AAC v2. El códec AAC se utiliza para codificar la banda de frecuencias bajas (low band), la Replicación de banda espectral codifica la banda de frecuencias altas (high band), y PS codifica la imagen estéreo de forma parametrizada.
Un codificador típico de aacPlus, presenta una señal de entrada de audio muestreado a fs (frecuencia de muestreo) que alimenta a un banco de filtrosde 64 bandas-QMF (Filtro espejo en cuadratura) el cual transforma el señal al dominio QMF. Tanto el bloque del estéreo paramétricocomo el de la Replicación de banda espectral utilizan los datos obtenidos de la transformación para realizar la codificación. Ésta señal entra en el bloque PS en el cual realiza un mezcla (downmix) de estéreo a mono. La señal obtenida después de ser procesada en el bloque PS se envia al multiplexadory al bloque SBR. Al bloque codificador AAC le llega una señal, que puede ser obtenida en el bloque PS, reconstruido otra vez al dominio temporal como una síntesis con 32 bandas-QMF o bien si no usamos el bloque PS (caso de HE-AAC v1) llega la señal de entrada remuestreada por dos. Finalmente todos los datos codificados se multiplexana una corriente de bitsúnica.[3]
- Decodificador
Image may be NSFW.
Clik here to view.
Decodificador HE-AAC.
En el caso del decodificador, primero se demultiplexala corriente de bits de entrada en tres corrientes de bits diferentes: datos para AAC, datos para SBR y datos para PS. El decodificador AAC genera a su salida una señal en el dominio temporalde banda baja a una frecuencia de muestreo fs/2. Ésta señal se transforma al dominio QMFpara su procesamiento. El bloque de procesamiento SBR reconstruye la señal en el dominio QMF de banda alta, una vez obtenidas tanto la banda alta como la banda baja se fusionan para conseguir la banda completa (Full-Band) en el dominio QMF. Si se usa el bloque PS, éste crea una representación estéreo en el dominio QMF. Finalmente el señal es sintetizado mediante un banco de filtros de 64 bandas-QMF. La salida del descodificador es una señal en el dominio temporal con una frecuencia de muestreo (fs).[3]
Calidad perceptual
Se han realizado diferentes evaluaciones sobre la calidad del audio obtenido aplicando HE-AAC y HE-AAC v2. El test realizado por la EBU(European Broadcasting Union), el cual evaluaba una gran variedad de formatos, entre ellos Mp3PRO, aacPlus, AAC, Real8, WMA8, MP3, a una tasa de bits de 48kbits/s utilizando el método "MUSHRAtest method", dió como resultado una clara superioridad del formato HE-AAC respecto a los demás, por encima incluso del Mp3PRO.
Detalles de Comparación:
Image may be NSFW.
Clik here to view.
Otro test realizado por MPEG, usando también el método de test MUSHRA determinó que la aplicación de el bloque estéreo paramétrico en el HE-AAC v2 mejora la calidad del audio obtenido a medida que se bajaba la tasa de bits, respecto al HE-AAC v1. Los test efectuados por el Institut für Rundfunktechnik(IRT), usando códecs de audio multicanal como Dolbya 384 kbits/s y WMA a 192 kbit/s, demostraban que el aacPlus a 160 kbits/s produce resultados mejores en diferentes tipos de música respecto a los demás.[4]
Detalles de Encoder:
Image may be NSFW.
Clik here to view.
Se ha de aclarar que el hecho de conseguir unas tasas de bits superiores va en detrimento del coste computacional.
Image may be NSFW.
Clik here to view.
Aplicaciones
Algunos de los formatos que contienen HE-AAC son MP4, M4A(MPEG-4) y 3GP. HE-AAC también está disponible para los sistemas operativos Windows, Linuxy Macintosh.
Sus principales usos son en DAB+(Digital Audio Broadcasting), Gestión de derechos digitales(Digitals right management (DRM)), DVB-H, DMB(Digital Multimedia Broadcasting), MediaFLO, 3GPP(3rd Generation Partnership Project), XM Radio, Radio digital Mundial(Digital Radio Mondiale), Radio por internet en streamingpara dispositivos móviles, Telefonía móvil, descarga de música para móviles y los sistemas de Televisión Digital Terrestre ISDB-T y SBTVD-T.
La mayoría de aplicaciones que usan el HE-AAC están relacionadas con la necesidad de obtener tasas de bits bajas debido al uso de canales de transmisión con capacidad limitada (ancho de banda limitado).[5]
Versión | Aplicaciones típicas | Tasas de bits típicas |
---|---|---|
HE-AAC v1 | XM Radio
Mobile music download Digital Radio Mondiale |
64 kbit/s (estéreo) |
HE-AAC v2 | 3GPP music download
Digital radio DAB+ (Stereo) Internet radio streaming |