Código multicanal

Ir a: navegación, búsqueda de

Con la popularización de audio digital Hay una creciente demanda de compresión de audio y técnicas de transmisión de audio. El uso de la codificación perceptual (basado en el modelo psicoacústico) ha sido un gran avance en la compressión de audio digital. Pero no resuelve el problema de la multicanal codificación de audio.

La evolución de la tecnología de audio multicanal ha ido creciendo lentamente comenzando con estéreo evolucionando a 5.1 sonido envolvente sistemas y luego de 10 o más canales. Estos sistemas ya no son sólo para el cine o estudios de grabación, pero ahora son utilizados en lo que llamamos)cine en casa).

Emplean estos sistemas "home cinema" Dolby 5.1 que tiene 5 canales y un sexto canal para las frecuencias bajas. Sin embargo, hay nuevas aplicaciones que utilizan muchos más canales.

Sin embargo, me parece importante destacar el hecho de que todos los sistemas multicanales no tienen el mismo comportamiento. Podríamos hablar de dos categorías diferentes:

Categoría 1 incluye: cine sonoro la intención de ser reproducida en "5,1" los sistemas de cine en casa o en el negocio del teatro. El correlación cruzada entre los canales tiende a ser alta para canales simétricos (L-Ls, R-Rs, C-R, C-L), pero no entre el resto de los canales.

Categoría 2 incluiría esas señales en vivo obtenidas mediante múltiples micrófonos para capturar la acústica propiedades de una habitación. Las señales de orientación para generan campos acústicos, obtenidos por una agrupación lineal de micrófonos, pertenecen a este grupo. Estas señales tienen una muy alta correlación cruzada entre todos los canales.

Contenido

  • 1 Señales de la clase 1
  • 2 Búfer de entrada
    • 2.1 Filtrado
    • 2.2 Transitorio del detector
    • 2.3 Precombinación portador.
  • 3 Clase 2 señales
    • 3.1 Teorema de Karhunen-Loeve
    • 3.2 Propiedades KLT
    • 3.3 Aplicación de las propiedades de clase 2 señales

Señales de la clase 1

Para la clase 1 señales, es el sistema más comúnmente utilizado hoy en día Dolby Digital. Esto se utiliza tanto en cines como en cine en casa. Es el sistema compressión Dolby AC-3. La distribución de los altavoces Dolby 5.1 se compone de tres canales frontales (izquierda, derecha y centro), 2 surround canales (izquierdos y derecho) y un canal dedicado al fortalecimiento de los graves efectos. Este canal está severamente limitada a una banda de 20 a 120 Hz, mientras que las otras cinco tienen un respuesta de frecuencia de 20 Hz a 20 kHz, así que estamos hablando de un sistema de 5.1 canales.

La codificación audio digital que se utiliza en la Disco compacto (16-bit PCM) logra un rango dinámico de 96 dB a expensas de trabaja a una frecuencia de 44,1 kHz con muestras de 16 bits, que es un montón de datos sobre a ser almacenados o transmitidos de manera rentable, particularmente en sistemas multicanales. Es por ello que necesitamos algoritmo de compresión. El Dolby AC-3 alcanza tasas de compresión 10:1 también permitidas a diferentes velocidades dependiendo del número de canales codificados o calidad requerida.

Dolby AC-3 ha sido diseñada para maximizar el tiempo y la frecuencia característica de enmascaramiento oído humano. Esto sucede cada señal para codificar para un banco de filtros, distribuye los bits que se pueden cuantificar los componentes Spectrum Analysis Products de distintas bandas teniendo en cuenta las características espectrales de la señal codificada. Un modelo interno que simula el enmascaramiento de frecuencia y una audiencia provisional permite el codificador varían su resolución Spectrum Analysis Products-temporal dependiendo de la naturaleza del sonido, en una forma que se garantice un mínimo número de bits para describir cada señal de banda para asegurar que el ruido se convierte en totalmente enmascarado. Este modelo hace los componentes espectrales de frecuencia del sonido que va ser enmascarada por otra que se disfraza no se cifran. AC-3 también distribuye los bits entre los distintos canales así como para conseguir un poco tasa estable, asignando más bits a canales con un mayor contenido de frecuencia.

El algoritmo de AC-3 considera los seis canales como una entidad única mediante la adición de un marco único bit, que consigue la tarifa un poco menos que separa cada canal en un fotograma diferente.

Los bloques más importantes de este algoritmo son los siguientes:

  • Búfer de entrada.
  • Filtrado
  • Transitorio del detector
  • Precombinación portador

Búfer de entrada

AC-3 es un bloque estructurado codificador, de modo que uno o más bloques de muestras de la señal en el tiempo son almacenados en el búfer para cada canal de entrada antes de proceder con la fiscalía. Los bloques se componen generalmente de muestras de 512.

Filtrado

Las señales de entrada son individualmente filtrado paso alto con una frecuencia de 3 Hz para eliminar el componente continua. El bajo la señal de canal es también grave pasabajas filtrada a una frecuencia de 120 Hz.

Transitorio del detector

Aplicamos una banda filtro de paso centrado en de alta frecuencia detecta la presencia de transitorios.

En el caso de una señal que varía muy rápidamente, como el ataque en un platillo, necesitamos un buen resolución temporal de la misma (lo que implica menos resolución espectral), por lo tanto, debe ser el tamaño de bloque pequeño para codificar la ruido de cuantización asociado a esta señal temporalmente confinados en las cercanías de la misma, por lo que esto puede ser enmascarado por el ruido que la señal a lo largo de las líneas de enmascaramiento temporal oído humano.

Impuso una limitación en las variaciones de tamaño que pueden sufrir los bloques para facilitar el proceso de consolidación; permitió ocho diferentes combinaciones de cuatro tipos de ventana. Cada una de las ocho combinaciones se identifican mediante una tabla de ID el decodificador debe saber en todo momento el tipo de ID de tabla que se está utilizando en el análisis de la señal, por lo que esta información es multiplex junto con los coeficientes que describe la señal. La información de ID de tabla usado en conjunción con su protección contra errores es el 1% de la tasa de bits total.

Precombinación portador.

En general los sistemas multicanal promedio es directamente proporcional a la raíz cuadrada del número de canales. Si utilizamos 128 kbit / s para codificar un solo canal, una cantidad de 5.1 canales requerirá 128 • √ 5.1 = 289 kbit / s que se puede transmitir mediante la velocidad con las comodidades típicas de trabajo AC-3 (320 kbit / s). Es por ello que la mayoría del tiempo será suficiente para usar como un método de algoritmo de compresión de la asignación de bits. Sin embargo, cuando se necesita mayor compresión es también portador de precombinación método utilizado.

Esta técnica elimina la información redundante HF y se basa en el fenómeno psicoacustic que las frecuencias altas en el oído humano es más sensible al sonido de la señal de sí mismo "envolvente".

Este comportamiento es utilizado por la AC-3 separando las señales y alta frecuencia envolvente del portador, así que esa información es codificado envolvente con más precisión el portador.

El impacto auditivo es mínimo, puesto que la localización del sonido se graba en el sobre, el cual se combina el sonido en el oído produciendo un efecto equivalente al sonido original.

Además de todo esto, tomamos la alta correlación que existe entre canales utilizando cifrado simétrico diferencia y cantidad así tenemos también ahorran poco más tan simétricas como canales son bastante similar, que será necesario codificar solamente uno y la diferencia entre esto y el otro canal.

Clase 2 señales

Teorema de Karhunen-Loeve

Para la codificación de señales multicanales para la clase 2 se hace uso de las propiedades de la Teorema de Karhunen-Loeve. Esto se transforma en un tipo de matriz producto MxV = U. Donde M es la matriz compuesta por el autovectores asociado con el matriz covarianzas de V y U matriz señales uncorrelate esa llamada matriz autochannels. V es la matriz que contiene nuestra señal multicanal para codificar. Y finalmente U és de la matriz de salida con nuestra señal codificada.

Propiedades KLT

Lo interesante de esta operación es sus propiedades. La primera es que si queremos restaurar nuestra señal original, sólo tenemos que multiplica por la matriz M transpuesto. Esto simplifica considerablemente el tiempo de decodificación.

La segunda es que los canales U se ordenan de mayor energía a menor energía. Esto es muy útil para la asignación de bits de codificación. La codificación de los canales menos energía.

Binario requiere un bitrate mucho menor que la de los canales de energía más altos.

La tercera es que las señales obtenidas de los KLT retienen las características espectrales y señales de audio perceptiva. Por lo tanto también podemos utilizar esta propiedad aplicar codificación perceptual.

Aplicación de las propiedades de clase 2 señales

Basado en estas propiedades podemos reducir la tasa de bits. Primero agarra la matriz M tiene sus valores máximos de diagonal. Puesto que la diagonal es la correlación cruzada de canales propios. Por lo tanto en los valores que están muy lejos de la diagonal utilizar menos bits. La segunda propiedad es la que asumirá como los últimos canales (que tienen una energía más baja) es codificar con menos bits. Esto no afecta grandemente la calidad. Y finalmente aprovechar propiedad para implementar la tercera codificación perceptual como puede ser por ejemplo algoritmo de cifrado Avance Codec de audio (AAC). Esta técnica puede alcanzar tasas de compresión muy alta. Pero la única condición es que todos los canales tienen una alta autocorrelación entre todos ellos.

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=Multichannel_code&oldid=584046760"