Información de referencia de MPEG-2

Los siguientes apartados presentan información práctica para crear archivos multimedia de salida MPEG-2.

Acerca de la selección de velocidades de bits

A la hora de determinar las velocidades de bits media y máxima para la reproducción de DVD estándar, recuerde que debe tener en cuenta la velocidad de bits de la pista de audio, así como la velocidad de bits de MPEG-2.

Deberá conservar el total de las velocidades de bits media y máxima de audio y vídeo por debajo de 10,08 Mbps, que es la velocidad de transferencia máxima garantizada para los reproductores de DVD estándar. Dado que los formatos de audio compatibles con DVD tienen una velocidad de bits constante (CBR), no hay ninguna velocidad de bits de audio máxima de la que preocuparse.

Por ejemplo, si utiliza audio AIFF a 1,5 Mbps, deberá mantener las velocidades de bits media y máxima de audio y de vídeo por debajo de 8,5 Mbps. Normalmente, la velocidad de bits media será inferior a este valor (por ejemplo, 3,5 Mbps para dos horas de contenido en DVD). Sin embargo, la velocidad de bits máxima también deberá estar situada por debajo de este valor. Se recomienda una velocidad de bits máxima de 8,0 Mbps para dejar un margen de error (por ejemplo, para poder incluir secuencias de subtítulos). Si utiliza uno de los formatos de audio comprimido compatibles con DVD, como Dolby Digital o MPEG-1/Capa-2, la velocidad de bits de audio puede ser de tan solo 0,2 a 0,4 Mbps; en este caso, puede ajustar la velocidad de bits máxima alrededor de 1 Mbps por encima.

Además, como norma general ajuste la velocidad de bits máxima al menos 1 Mbps por encima de la velocidad de bits media para posibilitar la variación de la velocidad de bits que permita alcanzar el objetivo de obtener una calidad constante.

Tamaños de fotogramas y formatos de vídeo en MPEG-2

Dado que MPEG-2 utiliza tamaños fijos para los fotogramas de vídeo, Compressor introducirá el tamaño del fotograma de salida en los campos del panel Geometría en función del formato de vídeo que seleccione.

El formato de vídeo que elija en el menú local “Formato de vídeo” determinará las opciones de las características asociadas, como tamaño y frecuencia de fotogramas, proporciones y dominancia campo. Para obtener más información, consulte La pestaña “Formato de vídeo.

Formato de vídeo
Tamaño de fotogramas (píxeles)
Frecuencia de fotogramas (fps)
Proporciones
Método de escaneado
NTSC
720 x 480
23,98 (solo progresivo), 29,97
4:3 ó 16:9
Entrelazado, progresivo
PAL
720 x 576
25
4:3 ó 16:9
Entrelazado, progresivo
720p
1280 x 720
23,98, 25, 29,97, 50, 59,94
16:9
Progresivo
HD 1440 x 1080
1440 x 1080
23,98 (solo progresivo), 25, 29,97
16:9
Entrelazado, progresivo
HD 1920 x 1080
1920 x 1080
23,98 (solo progresivo), 25, 29,97
16:9
Entrelazado, progresivo
640 x 480 (1,33)
640 x 480
23,98, 25, 29,97
4:3 ó 16:9
Entrelazado, progresivo
640 x 360 (1,78)
640 x 360
23,98, 25, 29,97
4:3 ó 16:9
Entrelazado, progresivo
640 x 352 (1,82)
640 x 352
23,98, 25, 29,97
4:3 ó 16:9
Entrelazado, progresivo
640 x 384 (1,67)
640 x 384
23,98, 25, 29,97
4:3 ó 16:9
Entrelazado, progresivo
640 x 320 (2,00)
640 x 320
23,98, 25, 29,97
4:3 ó 16:9
Entrelazado, progresivo

Descripción de grupos GOP y tipos de fotogramas

Una función principal de la codificación MPEG-2 es su capacidad de eliminar la redundancia, no solo dentro de un fotograma, sino también entre un grupo de fotogramas. MPEG-2 utiliza tres tipos de fotogramas (I, P y B) para representar el vídeo. Un ajuste de GOP (grupo de imágenes) define el modelo de los tres tipos de fotogramas utilizados. Estos tres tipos de imágenes se definen de los siguientes modos:

  • Intra (I): conocido también como fotograma de referencia. Cada GOP contiene un fotograma I. El fotograma I es el único tipo de fotograma MPEG-2 que se puede descomprimir totalmente sin ninguna referencia a los fotogramas situados delante o detrás. También es el que incluye más datos y precisa más espacio en disco. Para colocar un fotograma I en un cambio de escena o en cualquier otra ubicación específica de fotograma, deberá configurarlo manualmente mediante la ventana “Vista previa”. Esto se conoce como fotograma I forzado. Consulte Cómo trabajar con marcadores y fotogramas póster para obtener más información.
  • Previsto (P): codificado a partir de una imagen “prevista” basándose en el fotograma I o P anterior más próximo. Los fotogramas P suelen precisar mucho menos espacio en disco que los fotogramas I, puesto que hacen referencia a un fotograma I o P anterior del GOP.

    Nota: tanto los fotogramas I como los P también se conocen como fotogramas de referencia, pues los fotogramas B pueden hacer referencia a uno o a ambos tipos de fotogramas.

  • Bidireccional (B): codificado a partir de la interpolación de los fotogramas de referencia anterior y siguiente, sean tanto fotogramas I como P. Los fotogramas B constituyen el tipo de fotograma MPEG-2 de mayor eficacia en cuanto a su almacenamiento, siendo los que menos espacio en disco requieren.

El uso de fotogramas B y P es lo que permite que MPEG-2 pueda eliminar la redundancia temporal, contribuyendo a su capacidad de comprimir vídeo de manera eficaz.

Aspectos que se deben tener en cuenta al elegir un ajuste de GOP

Debe tener en cuenta los siguientes factores al elegir un ajuste de GOP.

Estructura de GOP

Este ajuste permite especificar si habrá dos, uno o ningún fotograma B entre los fotogramas de referencia dentro de un GOP. La estructura del GOP, junto con su tamaño, determinarán el número de fotogramas I, P y B que se utilizarán durante la transcodificación.

La estructura de GOP que elija dependerá de la distancia a la que deban estar los fotogramas P. Como los fotogramas P se prevén a partir del fotograma de referencia previo (sea I o P), si existen uno o dos fotogramas B en medio, la previsión deberá cubrir la distancia que se puedan mover los objetos durante la duración de entre dos y tres fotogramas.

En principio, cuanto menos movimiento medio haya entre un fotograma y el siguiente, más se podrán separar los fotogramas P y mayor podrá ser la compresión. Para la mayoría del material de vídeo, la estructura IBBP será una buena opción. El material con un movimiento inusualmente rápido a través de toda la secuencia puede beneficiarse de una estructura IBP o IP, pero, en tales casos, es posible que sea necesaria una velocidad de bits relativamente alta (de 6 a 8 Mbps para vídeo SD) para obtener una buena calidad.

Tamaño de GOP

Este ajuste especifica el número de fotogramas existente dentro de un GOP. Como existe exactamente un fotograma I por cada GOP, los tamaños de GOP mayores suelen proporcionar una mayor compresión, puesto que los fotogramas B y P son más pequeños que los fotogramas I.

Para la mayor parte de los contenidos, se consiguen buenos resultados separando los fotogramas I alrededor de medio segundo. Esto equivale a un tamaño de GOP de 15 fotogramas para NTSC y de 12 fotogramas para PAL. La especificación DVD‑Vídeo prohibe que las longitudes de GOP sean mucho mayores que estos valores. En general, solo podrá aprovechar un tamaño de GOP reducido aquel material en el que los cambios de escena estén separados por menos de medio segundo en todo el vídeo.

GOP abiertos y cerrados

Los GOP abiertos son más eficaces porque permiten un fotograma B adicional en el modelo de GOP. Los GOP abiertos comienzan con un fotograma B que es capaz de mirar al último fotograma P del GOP anterior, así como al primer fotograma I de su propio GOP.

Figure. Diagram comparing Open GOP and Closed GOP.

Por definición, los GOP cerrados no pueden contener ningún fotograma que haga referencia a un fotograma del GOP anterior o siguiente. En contraste, los GOP abiertos comienzan por uno o más fotogramas B que hacen referencia al último fotograma P del GOP anterior. Los GOP cerrados creados por Compressor comienzan siempre por un fotograma I.

Los GOP abiertos suelen ofrecer una compresión ligeramente superior a la que ofrecen los GOP cerrados con la misma estructura y tamaño. La ilustración anterior muestra que un GOP cerrado contiene un fotograma P más que un GOP abierto de la misma longitud. Debido a que los fotogramas P generalmente requieren más bits que los fotogramas B, el GOP abierto consigue una compresión ligeramente superior.

Existen limitaciones en cuanto al uso de GOP abiertos para discos DVD-Video que se crean mediante una aplicación de creación de DVD. Una de ellas es que solo se permiten GOP cerrados dentro de secuencias MPEG-2 que se utilizarán para discos DVD de ángulo mixto o varios ángulos.

La otra limitación es que solo se pueden configurar marcadores de capítulo de DVD al principio de un GOP cerrado. El mejor momento para definir marcadores de capítulo es antes de realizar la transcodificación MPEG-2. Por ejemplo, si especifica sus marcadores de capítulo en Final Cut Pro, puede configurar Compressor para que realice una transcodificación MPEG-2 con GOP abiertos. Compressor hará entonces que un GOP cerrado empiece solamente en los marcadores de capítulo especificados y que todos los demás GOP sean abiertos. Esto también se puede conseguir especificando “fotogramas I forzados” en la ventana “Vista previa” de Compressor y asignándoles un nombre de capítulo que deba utilizar una aplicación de creación de DVD.

No obstante, si desea especificar marcadores de capítulos en cualquier límite de GOP una vez transcodificado el vídeo en el formato MPEG-2, solo deberá utilizar GOP cerrados. Esta libertad es limitada, pues le permite configurar marcadores de capítulo únicamente en los límites de GOP, y no en cualquier fotograma de vídeo.

Acerca de 24p (23,98p)

Para la creación y codificación de DVD, 24p hace referencia a una secuencia de vídeo que contiene 24 fotogramas progresivos (no entrelazados) por segundo, con las dimensiones de fotogramas en definición estándar relacionadas con NTSC (720 x 480 para MPEG-2). Las películas tienen una frecuencia de fotogramas nativa de 24 fps y, como el formato MPEG-2 puede representar internamente el vídeo de 24 fps, muchos DVD de películas comerciales están codificados de este modo. Pero, cuando utilice vídeo NTSC en un proyecto, la frecuencia de fotogramas del material transferido de películas se reducirá de 24 fps a 23,976 fps (redondeado a 23,98) y se añadirá un desplegable 2:3:2:3. Por lo tanto, el término más preciso es en realidad 23,98p.

Compressor también puede hacer esto con los archivos de vídeo de origen 24P. Con este material, la opción de frecuencia de fotogramas 23,98 (en la pestaña “Formato de vídeo”) comprime cada fotograma de origen de uno en uno, sin comprimir fotogramas o campos repetidos para conseguir una frecuencia de visualización de 29,97 fps. De este modo se consigue una mayor calidad a una velocidad de bits menos comprimida que la que sería posible si el material 24p se convirtiera a 29,97 fps antes de la transcodificación. Compressor también configura correctamente los marcadores de fotogramas internos MPEG-2, de modo que los reproductores de DVD puedan aplicar correctamente el proceso de avance 3:2 para su visualización en televisores NTSC entrelazados de 29,97 fps.

Nota: En caso de que el vídeo de origen tenga una frecuencia de fotogramas de 24,00 fps en lugar de 23,98 fps, Compressor omitirá un fotograma de cada 1.000 fotogramas de origen. Si el vídeo de origen 24p es de 23,98 fps, Compressor transcodificará todos los fotogramas de origen, sin omitir (ni repetir) ninguno de ellos.