Códecs (WikiPedia Español)

CCIR 601 CCIR 601 es la primera norma sobre la televisin digital, encargndose del muestreo de la seal.
Se aplica solamente en estudios, sin llevar a cabo ningn tipo de compresin. Dicha norma, ha ido evolucionando desde que fue creada, en los aos 80, lo que hace interesante o imprescindible especificar la famlia de parmetros a los cuales hace referencia. Empezando por la relacin de aspecto (4:3 16:9) hasta el submuestreo de las componentes de color que se aplica (4:4:4 4:2:2). La norma recomienda que sea usada como base para los estndares de codificacin digital, por los estudios de televisin en paises que utilicen un sistema de 525 lneas y 625 lneas. La norma especifica mtodos para la codificacin digital de seales de vdeo. Incluye una relacin de la frecuencia de muestreo (Fm) de 13,5 MHz para la componente de luminancia Y, con una relacin de aspecto 4:3 y 16:9. Para sistemas que requieren una resolucin horizontal mayor, hay una alternativa cuya frecuencia de muestreo es de 18 MHz para una relacin de aspecto de 16:9. Para las componentes de crominancia se emplean una frecuencia de muestreo de 6,75 MHz. La profundidad del muestreo PCM es de 8 bits, opcionalmente de 10 bits para los centros de produccin y el flujo de la seal digitalizada se obtiene a partir de : Flujo = (13,5 + 2x6,75)x10 = 270 Mbps Tabla de contenidos 1 Definicin de las seales digitales Y, Cr, Cb a partir de las analgicas Er', Eg' y Eb'. 1.1 Construccin de las seales de luminancia Ey' y de diferencia de color (Er' - Ey') y (Eb' Ey') . 1.2 Construccin de seales de diferencia de color re-normalizadas (Ecr' y Ecb'). 1.3 Conversin A/D (Analgica/Digital) 1.4 Cuantificacin. 1.5 Construccin de Y, Cr, Cb cuantificando Er', Eg', Eb'. 1.6 Limitando las seales Y, Cr y Cb.
Definicin de las seales digitales Y, Cr, Cb a partir de las analgicas Er', Eg' y Eb'. El espacio de color que generan las componentes Y, Cb y Cr es muy similar al que se utiliza en el sistema PAL, con la diferencia de que los coeficientes que ponderan las seales, hacen que las componentes tengan la misma amplitud pico a pico. Veamos ahora los pasos necesarios para obtener las componentes Y, Cb y Cr. Construccin de las seales de luminancia Ey' y de diferencia de color (Er' - Ey') y (Eb' Ey') . Ey' = 0,299Er' + 0,587Eg' + 0,114Eb' (Er' - Ey') = Er' - 0,299Er' - 0,587Eg' - 0,114Eb' = 0,701Er' - 0,587Eg' - 0,114Eb' (Eb' - Ey') = Eb' - 0,299Er' - 0,587Eg' - 0,114Eb' =-0,299Er' - 0,587Eg' + 0,866Eb' Podemos representar los valores normalizados a la unidad segn la siguiente tabla Valores normalizados Condicin Blanco Negro Rojo Er' 1,0 0 1,0 Eg' 1,0 0 0 Eb' 1,0 0 0 Ey' 1,0 0 0,299 Er'-Ey' 0 0 0,701 Eb'-Ey' 0 0 -0,299
Azul Amarillo Cian Magenta
0 1,0 0 1,0
0 1,0 1,0 0
1,0 0 1,0 1,0
0,114 0,886 0,701 0,413
-0,114 0,114 -0,701 0,587
0,886 -0,886 0,299 -0,587
Construccin de seales de diferencia de color re-normalizadas (Ecr' y Ecb'). Mientras que los valores de Ey' tienen un rango [0 - 1,0], las seales (Er' - Ey') tienen un rango que va de [-0,701 a +0,701] y (Eb' - Ey') de [-0,886 a +0,886]. Para restaurar la excursin de la seal de diferencia de color a la unidad, los coeficientes se han de calcular de la siguiente forma: Kr = 0,5 / 0,771 = 0,713 ; Kb = 0,5 / 0,886 = 0,564 Entonces, basta multiplicar por los K's: Ecr' = 0,713(Er'-Ey') = 0,500Er' - 0,419Eg' - 0,081Eb' Ecb' = 0,564(Eb' - Ey') = -0,169Er' - 0,331Eg' + 0,500Eb' Donde Ecr' y Ecb' son las seales re-normalizadas de diferencia de color rojo (red) y azul (blue). Conversin A/D (Analgica/Digital) Para realizar la conversin A/D, se ha de tomar una frecuencia de muestreo que nos permita compatibilizar el intercambio de contenidos entre los sistemas Europeo (PAL, 625 lneas activas) y Americano (NTSC, 565 lneas activas). Se ha tomado una frecuencia de muestreo (Fm(Y)) que es mltiplo entero (143) del mnimo comn mltiplo de la Fl (frecuencia de lnea) de ambos estndares (15.625Hz y 15.734,26573HZ) que resulta de 2,25MHz. Adems, para que cumpla el criterio de Nyquist, se ha tomado seis veces dicha frecuencia para la componente de luminancia (Fm(Y) = 13,5MHz) y de tres veces para las de crominancia (Fm(Cr, Cb) = 6,75MHz). Cuantificacin. En el caso de cuantificacin uniforme binaria de 8 bits, 28 niveles (=256), para niveles iguales de cuantificacin, obtenemos un rango de nmeros binarios que va del 0000 0000 al 1111 1111 (00 al FF en notacin hexadecimal), equivalentemente del 0 al 255 en notacin decimal. En el caso de sistemas 4:2:2, el nivel 0 y el 255 estn reservados para datos de sincronismo, mientras que los niveles 1 al 254 estn disponibles para video. Dado que la seal de luminancia ocupa nicamente 220 niveles, para proveer de mrgenes de trabajo, y que el nivel negro es el nivel 16, el valor decimal de la seal de luminancia, Ys, previo a la cuantificacin es: Ys = 219Ey' + 16 el nivel correspondiente al valor despus de la cuantificacin, es un valor entero cercano a Ys. De forma similar, dado que la seal diferencia de color ocupa 255 niveles y que el nivel 0 se convierte en el nivel 128, el valor decimal de la seal diferencia de color, Crs y Cbs, previas a la cuantificacin son: Crs = 224[0,713(Er' - Ey')] + 128 Cbs = 224[0,564(Eb' - Ey')] + 128 y simplificndolas son: Crs = 160(Er' - Ey') + 128
Cbs = 126(Eb' - Ey') + 128 el nivel correspondiente al valor despus de la cuantificacin, es un valor entero cercano a Crs y Cbs. Los equivalentes digitales se denominan Y, Cr y Cb. Debido a la necesidad de crear mrgenes de seguridad para las seales Y, Cb, Cr, y que estas tienen una rango de valores de 220, 225, 225 respectivamente, se concluye que el nmero de colores representados en el espacio de color Y, Cb. Cr es menor que el de R,G,B. N Colores RGB(8 bits/m) = 256x256x256 = 16.777.216 colores N Colores YCbCr(8 bits/m) = 220x225x225 = 11.137.500 colores Adems, hay que tener en cuenta que no todos los 11 millones de valores son vlidos, ya que se pueden obtener valores negativos de R, G, B. A este efecto se le denomina error de Gamut en RGB. Construccin de Y, Cr, Cb cuantificando Er', Eg', Eb'. En el caso donde las componentes son directamente derivadas de las componentes de seal gamma pre-corregidas Er', Eg', Eb' , o directamente generadas de forma digital, entonces la cuantificacin y codificacin debe ser equivalente a: Erd'(en forma digital) = int(219Er') + 16 Egd'(en forma digital) = int(219Eg') + 16 Ebd'(en forma digital) = int(219Eb') + 16 Entonces: Y = (77/256)Erd' + (150/256)Egd' + (29/256)Ebd' Cr = (131/256)Erd' - (110/256)Egd' - (21/256)Ebd' + 128 Cb = -(44/256)Erd' - (87/256)Egd' + (131/256)Ebd' + 128 tomando los coeficientes enteros ms cercanos, base 256. Para obtener las componentes 4:2:2 Y, Cr, Cb, filtrando paso-bajo y sub-muestreando deben cumplir el 4:4:4: Cr, Cb. Limitando las seales Y, Cr y Cb. La codificacin digital en forma de seales Y, Cr y Cb, pueden representar una gama de valores de seales mayor de las que pueden ser soportadas por los correspondientes rangos de seales R, G y B. De esta forma, cuando la seal es convertida a R, G, B, puede resultar con valores fuera del rango de definicin. Entonces resulta conveniente limitar los valores de Y, Cr, Cb para evitar dicho problema. MJPEG El JPEG del movimiento (M-JPEG) es un nombre informal para los formatos de las multimedias donde cada marco video o campo entrelazado de una secuencia video digital se comprime por separado como imagen del JPEG. Es de uso frecuente en aplicaciones mviles tales como cmaras fotogrficas digitales. Contenido 1 Codec 2 usos 3 cmaras fotogrficas de Digital 4 crticas 5 ver tambin 6 acoplamientos externos
Codec El JPEG del movimiento utiliza la tecnologa de la codificacin del intraframe que es muy similar en tecnologa a la pieza del I-frame de los estndares video de la codificacin tales como MPEG-1 y MPEG-2, pero no utiliza la prediccin interframe. La carencia del uso de la prediccin interframe da lugar a una prdida de capacidad de la compresin, pero facilita corregir video, puesto que simple corrige puede ser realizado en cualquier marco cuando todos los marcos son I-frames. Los formatos video de la codificacin tales como MPEG-2 se pueden tambin utilizar en tal manera del I-frame solamente para proporcionar capacidad similar de la compresin y la facilidad similar de corregir caractersticas. Usar solamente tecnologa de la codificacin del intraframe tambin hace el grado de la independiente de la capacidad de la compresin de la cantidad de movimiento en la escena, puesto que la prediccin temporal no se est utilizando. (Usar la prediccin temporal puede mejorar ordinariamente substancialmente la capacidad video de la compresin, pero las marcas el dependiente del funcionamiento de la compresin en como de bien la remuneracin del movimiento se realiza para el contenido de la escena.) El bitrate cae entre los formatos sin comprimir (como el RGB, la compresin 1:1, y YCbCr, compresin 1:1.5 a 1:2.5) y MPEG (1: 100) Las tarifas de datos en la gama de 29 Mbit/s son mismo alta calidad, pero tambin dan lugar a tamaos del archivo comparativamente grandes. los usos M-JPEG se utiliza con frecuencia en el vdeo no linear que corrige sistemas. La reproduccin de este formato a la velocidad completa requiere capacidad rpida el descifrar del JPEG. M-JPEG es tambin de uso general por las cmaras de vdeo basadas IP va corrientes del HTTP usando el tipo contento de multipart/x-mixed-replace. Esto separa cada imagen en contestaciones individuales del HTTP en un marcador especificado. Los browsers basados Mozilla como Netscape y Firefox tienen ayuda nativa para ver estas corrientes mientras que no lo hace el Internet Explorer. La consola del juego de PlayStation ha integrado el hardware de la descompresin de M-JPEG para jugar secuencias del en-juego FMV. La consola del juego de Wii de Nintendo puede jugar videos M-JPEG-codificados de una tarjeta del SD usando su canal de la foto. El jugador audio digital de SanDisk Sansa juega videos cortos de M-JPEG. las cmaras fotogrficas de Digital Antes de la subida reciente de la codificacin MPEG-4 en dispositivos del consumidor, una forma progresiva de la exploracin de MJPEG tambin consider uso extenso en e.g. los modos de la pelcula de las cmaras fotogrficas inmviles de Digital, permitiendo la codificacin del vdeo y el aparato de lectura a travs del hardware integrado de la compresin del JPEG con solamente una modificacin del software. Una vez ms la calidad resultante marcado se reduce comparada a la compresin del MPEG en un bitrate similar, particularmente pues el sonido (cuando es incluido) era a menudo PCM o la bajo-compresin (y bajo sin comprimir procesador-exigir) ADPCM. Para compensar y para guardar tamaos del archivo/tarifas de transferencia bajo control, los tamaos del marco y las tarifas, junto con tarifas sanas del muestreo, fueron mantenidos relativamente bajos, con los niveles muy altos de la compresin para cada marco individual; e.g. tamaos comunes 160x120 o 320x240, tpicamente en 10, 12 o 15 marcos/en segundo lugar, con la calidad del cuadro equivalente a un ajuste del JPEG de 50 (una compresin ms spera que utilizada comercialmente en alambiques digitales tpicos) y 8 mono ADPCM sonido del kilociclo. Esto dio lugar a un muy bsico, pero todava la salida video servicable en un almacenaje similar cost a MPEG (tarifa video de ~120 kB/s, audio de ~8 kB/s - o aproximadamente 1 Mbit/s en la resolucin de 320x240 del colmo), pero con los overheads de proceso mnimos. Este contenido generado usuario fue almacenado tpicamente en los archivos del envase de los MOVIMIENTOS populares de Windows AVI o de Apple QuickTime, generalmente viewable nativo (o despus de la instalacin de un conductor simple del CODEC) en la mayora de las versiones del sistema operativo aplicable.
las crticas Desemejante de los formatos del vdeo especificados en estndares internacionales tales como MPEG-2 y el formato especificado en el an-cuadro del JPEG que cifra estndar, no hay documento que define un solo formato exacto que se reconozca universal mientras que una especificacin completa del JPEG del movimiento para el uso en todos los contextos. Esto levanta preocupaciones de la compatibilidad por salidas del archivo de diversos fabricantes. El formato tiene un ndice binario relativamente alto para la calidad entregada, requiriendo ms espacio de almacenaje que formatos ms modernos para una calidad dada de la imagen. Desde el desarrollo del estndar original del JPEG en los aos 90 tempranos, las mejoras de la tecnologa han llevado a cabo mejoras en la compresin del intraframe posibles. La organizacin s mismo del JPEG ha desarrollado un nuevo diseo llamado JPEG 2000, y otros tipos de tales mejoras de la tecnologa se pueden encontrar en los diseos H.263v2 del anexo I y MPEG-4 de la parte 2, de los cuales utilizar la prediccin del frecuencia-dominio transforman valores del coeficiente, y en H.264/MPEG-4 AVC, que utiliza la prediccin espacial y adaptante transformar las tcnicas del tamao de bloque y una codificacin ms sofisticada de la entropa que cul era prctico cuando el primer diseo del JPEG fue desarrollado. Consecuentemente, MJPEG es un codec anticuado e ineficaz, que ventaja principal es procesador bajo de arriba. MPEG-1 MPEG-1 define un grupo de estndares audio y video de la codificacin (sistema de pesos americano) y de la compresin convenidos en por MPEG (grupo de expertos mvil del cuadro). El vdeo MPEG-1 es utilizado por el formato video y menos del CD (VCD) comnmente por el formato del DVD-Vdeo. La calidad en la resolucin y el bitrate estndares de VCD es spero la de una cinta de VHS. MPEG-1 la capa audio 3 es el nombre completo para el formato audio popular MP3. Mientras que un hardware ms barato y ms de gran alcance el descifrar del consumidor lleg a estar disponible, formatos ms avanzados tales como MPEG-2 y MPEG-4 fueron desarrollados. Estos ms nuevos formatos son ms complejos y requieren un hardware ms de gran alcance, pero tambin alcanzan la mayor eficacia de la codificacin, es decir, calidad por bitrate. MPEG-1 consiste en varios parte, como sigue: 1. Sincronizacin y multiplexacin del vdeo y del audio (corriente del programa MPEG-1). 2. Codec de la compresin para las seales video no entrelazadas. 3. Codec de la compresin para la codificacin perceptiva de audioseales. El estndar define tres las capas, o los niveles de la complejidad, de la codificacin audio del MPEG. 1. MP1 o MPEG-1 capa 1 (MPEG-1 capa audio 1) de la parte 3 2. MP2 o MPEG-1 capa 2 (MPEG-1 capa audio 2) de la parte 3 3. MP3 o MPEG-1 capa 3 (MPEG-1 capa audio 3) de la parte 3 4. Procedimientos para probar conformidad. 5. Software de la referencia. Referencia: ISO/IEC JTC1/SC29/WG11 (el junio de 1996) el vdeo MPEG-1 MPEG-1 vdeo era originalmente diseado con meta de alcanzando aceptable video calidad en 1.5M pedacito/segundo dato tarifa y 352x240 (marco 29.97 por la resolucin)/352x288 del segundo (marco 25 por segundo). Mientras que los usos MPEG-1 son a menudo resolucin baja y bitrate bajo, el estndar permite cualquier resolucin menos que 4095x4095. Sin
embargo, la mayora de las puestas en prctica fueron diseadas con la especificacin obligada de Bitstream del parmetro en mente. MPEG-1 es actualmente el formato ms compatible de la familia del MPEG; es playable en casi todas las computadoras y los jugadores de VCD/DVD. Una desventaja grande del vdeo MPEG-1 es que apoya solamente cuadros progresivos. Esta deficiencia ayud al desarrollo pronto del MPEG-2 ms avanzado. MPEG-2 Moving Pictures Experts Group Layer 2 (MPEG-2), es la designacin para un grupo de estndares de codificacin de audio y video acordado por MPEG (grupo de expertos en imgenes en movimiento ), y publicados como estndar ISO 13818. MPEG-2 es por lo general usado para codificar audio y video para seales de transmisin, que incluyen televisin digital terrestre, por satlite o cable. MPEG-2. Con algunas modificaciones, es tambin el formato de codificacin usado por los discos SVCDs y DVD`s comerciales de pelculas. MPEG-2 es similar a MPEG-1, pero tambin proporciona soporte para video entrelazado (el formato utilizado por las televisiones.) MPEG-2 video no est optimizado para bajas tasas de bits (menores que 1 Mbit/s), pero supera en desempeo a MPEG-1 a 3 Mbit/s y superiores. MPEG-2 introduce y define Flujos de Transporte, los cuales son diseados para transportar video y audio digital a travs de medios impredecibles e inestables, y son utilizados en transmisiones televisivas. Con algunas mejoras, MPEG-2 es tambin el estndar actual de las transmisiones en HDTV. Un descodificador que cumple con el estndar MPEG-2 deber ser capaz de reproducir MPEG-1. MPEG-2 audio, definido en la Parte 3 del estndar, mejora a MPEG-1 audio al alojar la codificacin de programas de audio con ms de dos canales. La parte 3 del estndar admite que sea hecho retro-compatible, permitiendo que descodificadores MPEG-1 audio puedan descodificar la componente estreo de los dos canales maestros, o en una manera no retrocompatible, la cual permite a los codificadores hacer un mejor uso del ancho de banda disponible. MPEG-2 soporta varios formatos de audio, incluyendo MPEG-2 AAC. Tabla de contenidos 1 El Estndar MPEG-2 2 Codificacin de vdeo MPEG-2 (simplificado) 3 Codificacin de audio MPEG-2. 4 MPEG-2 En SVCD 5 MPEG-2 En DVD 6 MPEG-2 en DVB 7 MPEG-2 en ATSC 8 Standards MPEG-2 9 Retenedores de patente
El Estndar MPEG-2 Informacin general acerca de MPEG-2 Video y MPEG-2 Audio excluyendo las modificaciones cuando es usado en DVD / DVB. Un Flujo de Sistema MPEG-2 tpico consta de dos elementos: video data + time stamps audio data + time stamps Codificacin de vdeo MPEG-2 (simplificado) MPEG-2 es para la codificacin genrica de imgenes en movimiento y el audio asociado que crea un flujo de video mediante tres tipos de datos de marco (cuadros intra, cuadros posteriores predecibles y cuadros predecibles bi-direccionales) arreglados en un orden especfico llamado La estructura GOP(GOP = Group Of Pictures o grupo de imgenes).
Generalmente el material originado es una secuencia de video a una resolucin de pxeles prefijada a 25 o 29,97 cuadros por segundo con sonido. MPEG-2 admite flujos de video escaneado de manera tanto progresiva como entrelazada. En flujos de escaneo progresivo, la unidad bsica de codificacin es un campo. En la discusin de abajo, los trminos genricos cuadro e imagen se refieren tanto a los campos o cuadros, dependiendo del tipo de flujo. El flujo MPEG-2 esta hecho de una serie de cuadros de imgenes codificadas. Las tres maneras de codificar una imagen son: intra-codificado (I cuadro), predecible posterior (P cuadro) y predecible bi-direccional (B cuadro). La imagen del video es separada en dos partes: luminancia (Y) y croma (tambin llamada seales de diferencia de color U y V) a su vez, son divididos en Macro-bloques los cuales son la unidad bsica dentro de una imagen. Cada macro-bloque es dividido en cuatro 8X8 bloques de luminancia. el nmero de bloques de croma 8X8s depende del formato de color de la fuente. Por ejemplo en el formato comn 4:2:0 hay un bloque de croma por macro-bloque por cada canal haciendo un total de seis bloques por macro-bloque. En el caso de los cuadros I, la verdadera informacin de imagen pasada a travs del proceso codificador descrito abajo, los cuadros P y B primero son sujetos a un proceso de compensacin de movimiento, en el cual son co-relacionados con la imagen previa (y en el caso del cuadro B, la siguiente). Cada macro-bloque en la imagen P o B es entonces asociada con un rea en la imagen previa o siguiente que este bien correlacionada con alguna de stas. El "vector de movimiento" que mapea el macro-bloque con su rea correlacionada es codificado, y entonces la diferencia ente las dos reas es pasada a travs del proceso de codificacin descrito abajo. Cada bloque es procesado con una transformada coseno discreta (DCT) 8X8 . El coeficiente DCT resultante es entonces cuantificado de acuerdo a un esquema predefinido, reordenado a una mxima probabilidad de una larga hilera de ceros, y codificado. Finalmente, se aplica un algoritmo de codificacin Huffman de tabla fija. Los cuadros I codifican redundancia espacial, mientras que los cuadros B y P codifican redundancia temporal. Debido a que los marcos adyacentes son a menudo bien corelacionados, los cuadros P pueden ser del 10% del tamao de un cuadro I, y el cuadro B al 2% de su tamao. La secuencia de diferentes tipos de marcos es llamadala estructura de grupos de imgenes(GOP). Hay muchas estructuras posibles pero una comn es la de 15 marcos de largo, y tiene la secuencia I_BB_P_BB_P_BB_P_BB_P_BB_. Una secuencia similar de 12 marcos es tambin comn. La relacin de cuadros I, P y B en la estructura GOP es determinado por la naturaleza del flujo de video y el ancho de banda que constrie el flujo, adems el tiempo de codificacin puede ser un asunto importante. Esto es particularmente cierto en las transmisiones en vivo y en ambientes de tiempo real con Fuentes de cmputo limitados, un flujo que contenga varios cuadros B puede tomar tres veces ms tiempo para codificar que un archivo que slo contenga cuadros I. La tasa de bit de salida de un codificador MPEG-2 puede ser constante (CBR) o variable (VBR), con un mximo determinado por el reproductor por ejemplo el mximo posible en un DVD de pelcula es de 10.4 Mbit/s. Para lograr una tasa de bits constante el grado de cuantificacin es alterado para lograr la tasa de bits requerida. Incrementar la cuantificacin hace visible un defecto cuando el video es descodificado, Generalmente en la forma de amosaicamiento, donde las discontinuidades en los filos de los macro-bloques se hace ms visible como reduccin de la tasa de bits. Codificacin de audio MPEG-2. MPEG-2 adems introduce nuevos mtodos de codificacin de audio. stos son: Baja tasa de bits de codificacin con tasas de muestreo divididas (MPEG-1 capa 1/2/3 LSF) Codificacin multi-canal hasta 6 canales (5.1) MPEG-2 En SVCD Restricciones adicionales y modificaciones de MPEG-2 en SVCD:
Resolucin 380 x 480 pxeles NTSC (USA, Japn) 480 x 576 pxeles PAL (Europa) Relacin de aspecto 4:3 Tasa de cuadros 59.94 campos/s, 29.97 cuadros/s (NTSC) 50 campos/s, 25 cuadros/s (PAL) ) Tasa de bits de Audio + video Pico 2.52 Mbit/s Mnimo 300 Kbit/s YUV 4:2:0 Audio MPEG-1 capa 2 (MP2): 44.1KHz, 224 Kbit/s, Estreo Estructura GOP Debe salir secuencia de Encabezado para cada GOP No hay lite mximo de GOPshj MPEG-2 En DVD Restricciones adicionales y modificaciones de MPEG-2 en DVD: Resolucin de Video: NTSC (USA, Japn) Pixels 720 x 480 704 x 480 352 x 480 352 x 240 PAL (Europa) Pixels 720 x 576 704 x 576 352 x 576 352 x 288 Relacin de aspecto 4:3 16:9 Tasa de cuadros 59.94 campos/s 50 campos/s 23.976 cuadros/s (con banderas de 3:2) 29.97 cuadros/s (NTSC) 25 cuadros/s (PAL) Audio: Linear Pulse Code Modulation(Cdigo de Pulsos Modulado Lineal = LPCM): 48KHz o 96KHz, 16 bit, 2 canales(Estreo) MPEG-1 Capa 2 (MP2): 48KHz, hasta 7.1 canales (requerido en reproductores PAL) Dolby Digital (DD): 48KHz, 448 kbit/s, hasta 5.1 canales Digital Theater Systems (Sistema de Teatro Digital = DTS): 754 kbit/s o 1510 kbit/s (no requerido para cumplir con el reproductor) Debe haber al menos una pista de audio que no sea DTS (ni MP2 para NTSC) Tasa de bits de Audio + video: Buffer mximo promedio de 9.8 Mbit/s Pico 15 Mbit/s Mnimo 300 Kbit/s YUV 4:2:0 Posibilidad de subttulos opcionales Closed captioning (solo en NTSC)
Estructura GOP Debe salir secuencia de Encabezado para cada GOP 18 marcos mximos por GOP Closed GOP requerido para DVDs multi ngulo MPEG-2 en DVB Restricciones y modificaciones adicionales para DVB-MPEG. Restringido a una de las siguientes resoluciones: 720 480 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 640 480 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 544 480 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 480 480 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 352 480 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 352 240 pxel, 24/1.001, 24, 30/1.001 o 30 marco/s 720 576 pxel, 25 marco/s 544 576 pxel, 25 marco/s 480 576 pxel, 25 marco/s 352 576 pxel, 25 marco/s 352 288 pxel, 25 marco/s MPEG-2 en ATSC Restringido a una de las siguientes resoluciones 1920 1080 pxeles, hasta 60 campos/s (1080i) 1280 720 pxeles, hasta 60 cuadros/s (720p) 720 576 pxeles, hasta 50 campos/s, 25 cuadros/s (576i, 576p) 720 480 pxeles, hasta 60 campos/s, 30 cuadros/s (480i, 480p) 640 480 pxeles, hasta 60 cuadros/s Nota: 1080i est codificado con cuadros de 19201088 pxeles, sin embargo las ltimas 8 lneas se descartan antes de ser mostradas. Standards MPEG-2 ISO/IEC 13818-1 Sistema - describe sincronizacin y multiplexado de video y audio. ISO/IEC 13818-2 Video - Cdec(codificador/decodificador) compresor para seales de video entrelazado y no entrelazado. ISO/IEC 13818-3 Audio - Cdec(codificador/decodificador) compresor de seales de audio. Una extension habilitada multicanal de MPEG-1 audio (MP3). ISO/IEC 13818-4 Describe maniobras de prueba de cumplimiento(del estandar). ISO/IEC 13818-5 Describe sistemas para simulacin por Software. ISO/IEC 13818-6 Describe extensiones para DSM-CC (Comando Digital de herramientas de almacenamiento y control) ISO/IEC 13818-7 codificacin avanzada de audio. (AAC) ISO/IEC 13818-9 Extension para interfaces en tiempo real. ISO/IEC 13818-10 confomidad con extensiones para DSM-CC.
Retenedores de patente Aproximadamente 640 patentes mundiales conforman la propiedad intelectual completa que rodea a MPEG-2, stas estn retenidas por alrededor de 20 corporaciones y una universidad: Alcatel Canon, Inc. Columbia University France Tlcom (CNET) Fujitsu General Electric Capital Corporation General Instrument Corp. GE Technology Development, Inc. Hitachi, Ltd. KDDI Corporation (KDDI) Lucent Technologies LG Electronics Inc. Matsushita Mitsubishi Nippon Telegraph and Telephone Corporation (NTT) Philips Robert Bosch GmbH Samsung Sanyo Electric Co. Ltd. Scientific Atlanta Sharp Sony Thomson Licensing S.A. Toshiba Victor Company of Japan, Limited (JVC) MPEG-4 MPEG-4, introducido a finales de 1998, es el nombre de un grupo de estndares de codificacin de audio y video as como su tecnologa relacionada normalizada por el grupo MPEG (Moving Picture Experts Group) de ISO/IEC. Los usos principales del estndar MPEG-4 son los flujos de medios audiovisuales, la distribucin en CD, la transmisin bidireccional por videfono y emisin de televisin. MPEG-4 retoma muchas de las caractersticas de MPEG-1 y MPEG-2 as como de otros estndares relacionados, tales como soporte de VRML (Virtual Reality Modeling Language) extendido para Visualizacin 3D, archivos compuestos en orientacin a objetos (incluyendo objetos audio, video y VRML), soporte para la gestin de Derechos Digitales externos y variados tipos de interactividad. La mayora de las caractersticas que conforman el estndar MPEG-4 no tienen que estar disponibles en todas las implementaciones, al punto que es posible que no existan implementaciones completas del estndar MPEG-4. Para manejar esta variedad, el estndar incluye el concepto de perfil (profile) y nivel, lo que permite definir conjuntos especficos de capacidades que pueden ser implementados para cumplir con objetivos particulares Partes de MPEG-4 MPEG-4 est formado por varios estndares, llamados "partes", que incluyen: Parte 1 (ISO/IEC 14496-1): Sistemas: Describe la sincronizacin y la transmisin simultnea de audio y video. Parte 2 (ISO/IEC 14496-2): Visual: Un cdec de compresin para elementos visuales (video, texturas, imgenes sintticas, etc.). Uno de los muchos perfiles definidos en la Parte 2 es el Advanced Simple Profile (ASP).
Parte 3 (ISO/IEC 14496-3): Audio: Un conjunto de cdecs de compresin para la codificacin de flujos de audio; incluyen variantes de Advanced Audio Coding (AAC) as como herramientas de codificacin de audio y habla. Parte 4 (ISO/IEC 14496-4): Conformidad: Describe procedimientos para verificar la conformidad de otras partes del estndar. Parte 5 (ISO/IEC 14496-5): Software de referencia: Formado par elementos de software que demuestran y clarifican las otras partes del estndar. Parte 6 (ISO/IEC 14496-6): Delivery Multimedia Integration Framework (DMIF). Parte 7 (ISO/IEC 14496-7): Software optimizado de referencia: Contiene ejemplos sobre como realizar implementaciones optimizadas (por ejemplo, en relacin con la Parte 5). Parte 8 (ISO/IEC 14496-8): Transporte sobre redes IP: Especifica un mtodo para transportar contenido MPEG-4 sobre redes IP. Parte 9 (ISO/IEC 14496-9): Hardware de referencia: Proveediseos de hardware que demuestran implementaciones de otras partes del estndar. Parte 10 (ISO/IEC 14496-10): Advanced Video Coding (AVC): Un cdec de seales de video tcnicamente idntico al estndar ITU-T H.264. Parte 12 (ISO/IEC 14496-12): Formato para medios audiovisuales basado en ISO: Un formato de archivos para almacenar contenido multimedia. Parte 13 (ISO/IEC 14496-13): Extensiones para el manejo y proteccin de Propiedad Intelectual (IPMP). Parte 14 (ISO/IEC 14496-14): Formato de archivo MPEG-4: El formato de archivo de contenedor designado para contenidos MPEG-4; basado en la Parte 12. Parte 15 (ISO/IEC 14496-15): Formato de archivo AVC: Para el almacenamiento de video Parte 10, basado en la Parte 12. Parte 16 (ISO/IEC 14496-16): Animation Framework eXtension (AFX). Part 17 (ISO/IEC 14496-17): Formato de subttulos (en elaboracin - el ltimo avance en su revisin data de enero de 2005). Parte 18 (ISO/IEC 14496-18): Compresin y transmisin como flujo de fuentes tipogrficas (para fuentes OpenType). Parte 19 (ISO/IEC 14496-19): Flujos de texturas sintetizadas. Parte 20 (ISO/IEC 14496-20): Representacin liviana de escenas (LASeR). Parte 21 (ISO/IEC 14496-21): Extensin de MPEG-J para rendering (en elaboracin - el ltimo avance en su revisin data de enero de 2005). Tambin es posible definir perfiles a nivel de las partes, dado que una implementacin de una parte no necesariamente contiene toda esa parte. MPEG-1, MPEG-2, MPEG-7 y MPEG-21 son otros grupos de estndares MPEG. H.261 H.261 es un estndar video 1990 de la codificacin de ITU diseado originalmente para la transmisin sobre las lneas del ISDN en las cuales las tarifas de datos son mltiplos de 64 kbit/s. El ndice de datos del algoritmo de la codificacin fue diseado para poder funcionar entre 40 kbit/s y 2 Mbit/s. El estndar apoya los marcos video del CIF y de QCIF con resoluciones del luma de 352x288 y 176x144 respectivamente (y 4:2: 0 muestreos con resoluciones del chroma de 176x144 y de 88x72, respectivamente). Tambin tiene un truco backward-compatible para todava enviar grficos del cuadro con la resolucin del luma 704x576 (que fue agregado en una revisin ms ltima alrededor de 1994). Contenido [piel] 1 historia Diseo 2 H.261 3 puestas en prctica del software 4 ver tambin [corregir] historia H.261 era el primer estndar video digital prctico de la codificacin. El diseo H.261 era un esfuerzo pionero, y todos los estndares video internacionales subsecuentes de la codificacin (MPEG-1, MPEG-2/H.262, H.263, y H.264 uniforme) se han basado de cerca en su diseo. Adems, los mtodos usados por el comit de desarrollo H.261 (conducido por Sakae Okubo) para desarrollar de colaboracin el estndar han seguido siendo el proceso de funcionamiento
bsico para el trabajo de estandardizacin subsecuente en el campo. El algoritmo de la codificacin utiliza un hbrido de la prediccin compensada movimiento del inter-cuadro y espacial transformar la codificacin con el quantization, la exploracin del zigzag y la codificacin escalares de la entropa. [corregir] el diseo H.261 La unidad de proceso bsico del diseo se llama un macroblock. Cada macroblock consiste en un arsenal 16x16 de muestras del luma y dos rdenes correspondientes 8x8 de muestras del chroma usando 4:2: 0 muestreos y un espacio de color de YCbCr. La prediccin del inter-cuadro quita redundancia temporal, con los vectores del movimiento usados para ayudar al codec para compensar el movimiento. Transformar la codificacin usando un coseno discreto 8x8 transforman (DCT) quita la redundancia espacial. El quantization escalar entonces se aplica a redondo los coeficientes del transformar a la precisin apropiada, y el quantized transforman coeficientes son zigzag explorado y entropa cifrada (con un cdigo variable-length del Funcionar-Nivel) para quitar redundancia estadstica. El estndar H.261 especifica realmente solamente cmo descifrar el vdeo. Dejaron los diseadores del codificador libres disear sus propios algoritmos de codificacin, mientras se obligara a su salida correctamente permitiera que sea descifrado por cualquier decodificador hecho segn el estndar. Los codificadores tambin se dejan libres realizar cualquier proceso previo que deseen a su entrar el vdeo, y los decodificadores se permiten realizar cualquier post-processing desean a su vdeo descifrado antes de la exhibicin. Se llama una tcnica eficaz del post-processing que se convirti en un elemento dominante de los mejores sistemas de H.261-based filtracin de la apertura. Esto reduce el aspecto de molestar los artefactos bloquear-formados causados por la remuneracin bloquearbasada del movimiento y espacial transformar las partes del diseo. De hecho, bloqueando los artefactos ser probablemente un fenmeno familiar a casi cada uno que ha mirado el vdeo digital. La filtracin que desbloquea tiene desde se convierte en una parte integral del estndar ms reciente, H.264 (aunque aun cuando usa H.264, el post-processing adicional todava se permite y puede realzar calidad visual si est realizado bien). Los refinamientos introducidos en esfuerzos ms ltimos de la estandardizacin han dado lugar a mejoras significativas en capacidad de la compresin concerniente al diseo H.261. Esto ha dado lugar a H.261 que llegaba a ser esencialmente obsoleto, aunque todava se utiliza como modo de la al revscompatibilidad en algunos sistemas video de la comunicacin y para algunos tipos de vdeo del Internet. Sin embargo, H.261 sigue siendo un jaln histrico importante en el desarrollo del campo de la codificacin video. [corregir] las puestas en prctica del software El libavcodec LGPL-licenciado incluye un codificador H.261 y un decodificador. Se utiliza en muchos programas como en los jugadores libres del jugador de medios de VLC y de las multimedias de MPlayer, y en proyectos del ffdshow y de los decodificadores de FFmpeg. [corregir] ver tambin
H.264/MPEG-4 AVC Tabla de contenidos 1 Historia 2 Caractersticas 3 Nuevas especificaciones 3.1 Tipos de imgenes 3.2 Compensacin de movimiento 3.3 Transformada 3.4 Cuantificacin 3.5 Filtro de "deblocking" 3.6 Exploracin de los coeficientes 3.7 Codificacin entrpica 3.8 Adaptacin a la red 3.9 Algoritmos para la prevencin de prdidas 3.9.1 FMO y ASO 3.9.2 DP 3.9.3 RS
Historia H.264 o MPEG-4 parte 10 es una norma que define un cdec de vdeo de alta compresin, desarrollada conjuntamente por el ITU-T Video Coding Experts Group (VCEG) y el ISO/IEC Moving Picture Experts Group (MPEG). La intencin del proyecto H.264/AVC fue la de crear un estndar capaz de proporcionar una buena calidad de imagen con tasas binarias notablemente inferiores a los estndares previos (MPEG-2, H.263 o MPEG-4 parte 2), adems de no incrementar la complejidad de su diseo. Para garantizar un gil desarrollo de la misma, la ITU-T y la ISO/IEC acordaron unirse para desarrollar conjuntamente la siguiente generacin de cdecs de vdeo. El Joint Video Team (JVT) estaba formado por expertos del VCEG y MPEG y naci en diciembre de 2001 con el objetivo de completar el desarrollo tcnico del estndar hacia el 2003. La ITU-T plane adoptar el estndar bajo el nombre de ITU-T H.264 y ISO/IEC bajo el nombre de MPEG-4 Parte 10 Cdec de Vdeo Avanzado (AVC) y de aqu surgi el nombre hbrido de H.264/MPEG-4 AVC. Para empezar a programar el cdigo del nuevo estndar adoptaron las siguientes premisas: La estructura DCT + Compensacin de Movimiento de las versiones anteriores era superior a otros estndares y por esto no haba ninguna necesidad de hacer cambios fundamentales en la estructura. Algunas formas de codificacin de vdeo que haban sido excludas en el pasado debido a su complejidad y su alto coste de implementacin se volveran a examinar para su inclusin puesto que la tecnologa VLSI haba sufrido un adelanto considerable y una bajada de costes de implementacin. Para permitir una libertad mxima de mejora en la codificacin, la sintaxis se debera cambiar de forma que no fuera compatible con normas anteriores. Caractersticas El uso inicial del MPEG-4 AVC estuvo enfocado hacia el video de baja calidad para videoconferencia y aplicaciones por Internet, basado en 8 bits/muestra y con un muestreo ortogonal de 4:2:0. Esto no daba salida al uso de este cdec en ambientes profesionales que exigen resoluciones ms elevadas, necesitan ms de 8 bits/muestra y un muestreo de 4:4:4 o 4:2:2, funciones para la mezcla de escenas, tasas binarias ms elevadas, poder representar
algunas partes de video sin perdidas y utilizar el sistema de color por componentes RGB. Por este motivo surgi la necesidad de programar unas extensiones que soportasen esta demanda. Tras un ao de trabajo intenso surgieron las extensiones de gama de fidelidad(FRExt) que incluan: Soporte para un tamao de transformada adaptativo. Soporte para una cuantificacin con matrices escaladas. Soporte para una representacin eficiente sin prdidas de regiones especficas. Este conjunto de extensiones denominadas de "perfil alto" son: La extensin High que soporta 4:2:0 hasta 8 bits/muestra La extensin High-10 que soporta 4:2:0 hasta 10 bits/muestra La extensin High 4:2:2 que soporta hasta 4:2:2 y 10 bits/muestra La extensin High 4:4:4 que soporta hasta 4:4:4 y 12 bits/muestra y la codificacin de regiones sin prdidas. A continuacin podemos ver una tabla con ms especificaciones sobre estos perfiles en contraste con el perfil original: Original High High 10 High 4:2:2 slices I i P slices B slices SI i SP imagenes de referencia mltiples Filtro "deblocking" codificacin CAVLC codificacin CABAC ordenacin flexible de macrobloques (FMO) ordenacin arbitraria de slices (ASO) slices redundantes (RS) particin de datos (DP) codificacin entrelazada formato 4:2:0 formato monocromo (4:0:0) formato 4:2:2 formato 4:4:4 8 Bits/pxel 9 y 10 Bits/pxel 11 y 12 Bits/pxel transformada 8x8 SI NO NO SI SI SI NO SI SI SI NO NO SI NO NO NO SI NO NO NO SI SI NO SI SI SI SI NO NO NO NO SI SI SI NO NO SI NO NO SI SI SI NO SI SI SI SI NO NO NO NO SI SI SI NO NO SI SI NO SI SI SI NO SI SI SI SI NO NO NO NO SI SI SI SI NO SI SI NO SI High 4:4:4 SI SI NO SI SI SI SI NO NO NO NO SI SI SI SI SI SI SI SI SI
matrices de cuantificacin cuantificacin Cb i Cr separadas codificacin sin prdidas
NO NO NO
SI SI NO
SI SI NO
SI SI NO
SI SI SI High 4:4:4
Original High High 10 High 4:2:2
Nuevas especificaciones H.264/MPEG-4 AVC no supone una gran ruptura tecnolgica con respecto a las normas de codificacin de vdeo anteriores. Las diferencias se pueden encontrar a pequea escala sobre el principio general de codificacin (prediccin, transformada, cuantificacin, etc.). Tipos de imgenes Podemos encontrar las mismas imgenes que en las normas precedentes (Imgenes I, P y B ) y dos nuevas, la SP (Switching P) y la SI (Switching I) que sirven para codificar la transicin entre dos flujos de vdeo. Permiten, sin enviar imgenes intra muy costosas en tiempos de procesamiento, pasar de un vdeo a otro utilizando prediccin temporal o espacial como antes, pero con la ventaja que permiten la reconstruccin de valores especficos exactos de la muestra aunque se utilicen imgenes de referencia diferentes o un nmero diferente de imgenes de referencia en el proceso de prediccin. Compensacin de movimiento El proceso de compensacin de movimiento es diferente de las normas precedentes puesto que propone una gran variedad de formas y de particiones de bloques. De cara a la compensacin de movimiento, cada macrobloque, aparte del tamao original (16x16 pxeles), puede ser descompuesto en sub-bloques de 16x8, 8x16 o 8x8 pxeles. En este ltimo caso, es posible descomponer a su vez cada sub-bloque de 8x8 pxeles en particiones de 8x4, 4x8 o 4x4 pxeles. Antes, el estndar ms novedoso introduca particiones de 8x8. Esta variedad de particiones proporciona una mayor exactitud en la estimacin, a lo que se suma una precisin que puede llegar hasta un cuarto de pxel. Transformada Es una aproximacin a la DCT que viene utilizndose en vdeo pero con las siguientes particularidades: Tamao: 4x4 pxeles (8x8 en los perfiles FRExt). Coeficientes enteros: lo que permite evitar los errores de redondeo habituales en la DCT clsica (coeficientes irracionales) y garantizar un ajuste perfecto entre la transformacin directa y la inversa. Precisin finita: Otra consecuencia favorable de la caracterstica anterior es que se puede calcular sin exceder los 16 bits de precisin. Eficiencia: Se puede implementar exclusivamente por medio de sumas y desplazamientos binarios. Cuantificacin Cada paso del parmetro de cuantificacin (QP) incrementa un 12,5% el intervalo de cuantificacin, lo que equivale a duplicarlo por cada 6 pasos. El rango dinmico del QP ha aumentado respecto a normas precedentes, puesto que los valores van de 0 a 51. Los macrobloques se cuantifican utilizando un parmetro de control que puede cambiar adaptndose al bloque en cuestin. Si utilizamos FRExt tendremos un rango dinmico que se multiplicar por 6 por cada bit adicional(partiendo de 8 bits, 52 pasos). Adems, para poder
conseguir los mejores resultados visuales la cuantificacin de la crominancia es ms esmerada que la de luminancia. Filtro de "deblocking" H.264 tambin integra un filtro antibloques que mejora la eficacia de compresin y la calidad visual de las secuencias de vdeo eliminando efectos indeseables de la codificacin como por ejemplo el efecto de bloques. Exploracin de los coeficientes Existen dos modos de exploracin de los coeficientes transformados: "zig-zag" y "zig-zag inverso". El segundo modo de exploracin permite en particular la lectura del macrobloque en sentido contrario para poder funcionar con la codificacin entrpica adaptativa. Codificacin entrpica La codificacin entrpica se puede realizar de tres formas diferentes. Un primer mtodo utilizado es el conocido UVLC (Universal Variable Length Coding). Este tipo de codificacin es utilizado para codificar la gran mayora de los elementos de sincronizacin y cabeceras. Los otros dos mtodos son utilizados para codificar buena parte del resto de elementos sintcticos (coeficientes, vectores de movimiento). Las codificaciones utilizadas para esta tarea estn basadas en VLC (Variable Length Coding) de forma adaptativa, de este concepto nace el CAVLC (Context Adaptative Variable Length Coding) y el CABAC (Context Adaptative Binary Arithmetic Coding). Adaptacin a la red Conceptualmente los algoritmos estn divididos en dos capas: una primera capa de codificacin de vdeo VCL (Video Coding Layer) que se ocupa de representar eficzmente el contenido de vdeo y una capa de adaptacin a la red NAL (Network Adaptacin Layer) que est dirigida ms particularmente a adaptar el formato de datos de vdeo al soporte de transmisin. Algoritmos para la prevencin de prdidas FMO y ASO La ordenacin flexible de macrobloques (FMO) y la ordenacin arbitraria de slices (ASO) son tcnicas para reestructurar la representacin de las regiones fundamentales (macrobloques) aunque tambin pueden ser utilizados para otros objetivos. DP La particin de datos proporciona la capacidad de separar los elementos de sintaxis ms importantes de los menos importantes en paquetes de datos diferentes, permitiendo el uso de proteccin de error desigual (UEP). RS El algoritmo de slices redundantes permite a un codificador enviar una representacin suplementaria de una regin de imagen que puede ser usado si la representacin primaria es corrompida o perdida.

Códecs (WikiPedia Español)

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Códecs (WikiPedia Español)

Uploaded by

Copyright:

Available Formats

CCIR 601 CCIR 601 es la primera norma sobre la televisin digital, encargndose del muestreo de la seal.

Azul Amarillo Cian Magenta

1,0 0 1,0 1,0

0,114 0,886 0,701 0,413

-0,114 0,114 -0,701 0,587

0,886 -0,886 0,299 -0,587

matrices de cuantificacin cuantificacin Cb i Cr separadas codificacin sin prdidas

Original High High 10 High 4:2:2

You might also like