Informations de référence MPEG-2

Les rubriques suivantes comportent des informations utiles pour la création de fichiers multimédias de sortie MPEG-2.

À propos de la sélection des débits

Lorsque vous déterminez les débits moyen et maximum pour la lecture de DVD standard, n’oubliez pas de prendre en compte le débit de la piste audio, ainsi que le débit MPEG2.

Vous devez faire en sorte que le total des débits audio et vidéo moyens et maximum soit inférieur à 10,08 Mbps, vitesse maximum de transfert garantie par les lecteurs DVD standard Étant donné que les formats audio compatibles avec les DVD utilisent un débit constant (CBR, de l’anglais « Constant bit rate »), vous n’avez pas à vous préoccuper d’un éventuel débit audio maximum.

Par exemple, si vous traitez la composante audio au format AIFF à 1,5 Mbps, vous devez maintenir les débits vidéo maximum et moyen sous la barre des 8,5 Mbps. Généralement, le débit moyen sera inférieur à cette valeur (par exemple, 3,5 Mbps pour deux heures de métrage sur votre DVD). Le débit maximum doit toutefois être, lui aussi, inférieur à cette valeur. Un débit maximum de 8,0 Mbps est recommandé pour prévoir une marge d’erreur supplémentaire, afin de s’adapter par exemple aux flux de sous-titrage. Si vous utilisez un format audio compressé compatible DVD comme, par exemple, Dolby Digital ou MPEG-1/Layer-2, le débit audio peut descendre jusqu’à entre 0,2 et 0,4 Mbps, ce qui vous permet alors de régler le débit maximum sur environ 1 Mbps plus haut.

En règle générale, réglez le débit maximum au moins 1 Mbps plus haut que le débit moyen afin de permettre au débit de varier et d’obtenir une qualité constante.

Tailles d’images et formats vidéo MPEG-2

Comme le format MPEG-2 pour DVD prend des tailles d’images vidéo fixes, Compressor introduit automatiquement les dimensions de l’image de sortie dans les champs de la sous-fenêtre Géométrie en fonction du format vidéo choisi.

Le format vidéo que vous choisissez dans le menu local Format vidéo détermine les options des caractéristiques associées, telles que la taille d’image et la fréquence d’images, les proportions et la priorité de trame. Pour plus d’informations, consultez la section Onglet Format vidéo.

Format vidéo
Taille d’image (en pixels)
Fréquence d’images (images par seconde)
Proportions
Méthode de balayage
NTSC
720 x 480
23,98 (progressive uniquement), 29,97
4:3 ou 16:9
Entrelacée, progressive
PAL
720 x 576
25
4:3 ou 16:9
Entrelacée, progressive
720p
1280 x 720
23,98, 25, 29,97, 50, 59,94
16:9
Progressif
1440 x 1080 HD
1440 x 1080
23,98 (progressive uniquement), 25, 29.97
16:9
Entrelacée, progressive
1920 x 1080 HD
1920 x 1080
23,98 (progressive uniquement), 25, 29.97
16:9
Entrelacée, progressive
640 x 480 (1,33)
640 x 480
23,98, 25, 29,97
4:3 ou 16:9
Entrelacée, progressive
640 x 360 (1,78)
640 x 360
23,98, 25, 29,97
4:3 ou 16:9
Entrelacée, progressive
640 x 352 (1,82)
640 x 352
23,98, 25, 29,97
4:3 ou 16:9
Entrelacée, progressive
640 x 384 (1,67)
640 x 384
23,98, 25, 29,97
4:3 ou 16:9
Entrelacée, progressive
640 x 320 (2,00)
640 x 320
23,98, 25, 29,97
4:3 ou 16:9
Entrelacée, progressive

Compréhension des types de GOP et d’images

L’une des principales fonctions de l’encodage MPEG-2 est sa capacité à supprimer les redondances, pas seulement dans une image, mais aussi dans un groupe d’images. Le MPEG-2 utilise trois types d’image (I, P et B) pour représenter une vidéo. Les paramètres des groupes d’images (GOP) permettent de définir le motif des trois types d’image utilisées. Ces trois types d’image sont définis comme suit.

  • Intra (I) : également connue sous le nom d’image clé. Chaque GOP contient une image I. L’image I est le seul type d’image MPEG-2 qui peut être totalement décompressé sans faire aucune référence aux images qui la précèdent ou la suivent. Comme c’est aussi le type d’image le plus « lourd » en terme de données, c’est lui qui requiert le plus d’espace disque. Si vous souhaitez placer une image I à un changement de scène ou à tout autre emplacement précis, vous devez le paramétrer manuellement à l’aide de la fenêtre Aperçu. Dans ce cas, une image I est qualifiée de forcée. Pour en savoir plus, consultez la section Utilisation de marqueurs et d’affiches.
  • Prédite (P) : image encodée à partir d’une image « prédite » selon l’image I ou P précédente la plus proche. Les images P requièrent généralement moins d’espace disque que les images I, car elles font référence à l’image I ou P qui la précède dans le GOP.

    Remarque : les images I et P sont aussi dénommées images de référence, car une image B peut faire référence à l’un ou l’autre type d’image.

  • Bidirectionnelle (B) : image encodée à partir d’une interpolation des images de référence suivantes et précédentes, qu’il s’agisse d’images I ou P. Les images B sont le type d’image MPEG-2 le plus efficace en termes de stockage, car c’est celui qui requiert le moins d’espace disque.

C’est l’utilisation d’images B et P qui permet au MPEG-2 de supprimer les redondances temporaires, contribuant ainsi à l’efficacité de la compression vidéo.

Points à considérer avant de choisir les paramètres d’un GOP

Vous devez considérer les aspects suivants.

Structure GOP

Ce paramètre indique qu’il y aura deux, une ou aucune image(s) B entre les images de référence au sein d’un GOP. La structure et la taille d’un GOP permettent de définir le nombre d’images I, P et B utilisées dans un GOP pendant l’encodage.

La structure que vous choisissez dépend de l’éloignement des images P. Comme une image P est prédite à partir de l’image de référence antérieure (soit une image I, soit une image P) et qu’il peut y avoir entre elles une ou deux images B, la prédiction doit couvrir la distance que les objets peuvent parcourir pendant la durée de deux ou trois images.

En principe, plus le mouvement moyen est faible d’une image à l’autre, plus les images P peuvent être espacées, et plus la compression peut être importante. Pour la plupart des contenus vidéo, la structure IBBP est un bon choix. Dans le cas de contenus qui ont des séquences entières avec de rares mouvements rapides, il est possible de choisir une structure IBP ou IP, mais un débit relativement élevé (6 à 8 Mbps pour la vidéo SD) peut alors s’avérer nécessaire pour obtenir une bonne qualité.

Taille GOP

Ce paramètre spécifie le nombre d’images contenues dans un GOP. Or, comme un GOP ne contient exactement qu’une seule image I, une taille plus grande permet généralement d’obtenir une meilleure compression, car les images B et P occupent moins d’espace que les images I.

Pour la plupart des médias, un espacement d’environ une demi-seconde entre chaque image I donne de bons résultats. Cela revient à une taille de GOP contenant 15 images en NTSC et 12 images en PAL. Les spécifications du format DVD vidéo interdisent des GOP contenant plus d’images. Généralement, seuls les contenus dont les changements de scènes à des intervalles inférieurs à une demi-seconde sont fréquents bénéficient de GOP de taille plus petite.

GOP ouverts et fermés

Les GOP ouverts sont plus efficaces, car ils permettent l’insertion d’une autre image B dans le modèle GOP. Les GOP ouverts commencent par une image B capable de consulter la dernière image P du GOP précédent ainsi que la première image I de son propre GOP.

Figure. Diagram comparing Open GOP and Closed GOP.

Par définition, les GOP fermés ne peuvent contenir aucune image faisant référence à une image du GOP précédent, ou suivant. Au contraire, les GOP ouverts commencent par une ou plusieurs images B qui font référence à la dernière image P du GOP antérieur. Les GOP fermés créés par Compressor commencent toujours par une image I.

À structure et taille identiques, la compression obtenue est généralement meilleure avec les GOP ouverts qu’avec les GOP fermés. En effet, l’illustration ci-dessus montre qu’un GOP fermé contient plus d’images P qu’un GOP ouvert de même longueur. Or, comme les images P requièrent habituellement plus de bits que les images B, la compression des GOP ouverts est d’une qualité légèrement supérieure.

Certaines restrictions s’appliquent à l’utilisation de GOP ouverts avec des DVD vidéo créés à l’aide d’une application de création de DVD. La première limite exclusivement aux GOP fermés les flux MPEG-2 utilisés pour des DVD à angles multiples ou mixtes.

La deuxième oblige à définir les marqueurs de chapitre des DVD au début d’un GOP fermé. Le meilleur moment pour définir des marqueurs de chapitre est avant d’effectuer le transcodage MPEG-2. Par exemple, si vous spécifiez des marqueurs de chapitre dans Final Cut Pro, vous pouvez paramétrer Compressor de manière à procéder au transcodage MPEG-2 avec des GOP ouverts. Compressor forcera alors un GOP fermé à commencer uniquement au niveau des marqueurs de chapitre spécifiés et ouvrira les autres GOP. Vous pouvez également procéder en spécifiant « images I forcées » dans la fenêtre Aperçu de Compressor, puis en indiquant un nom de chapitre à utiliser par une application de création de DVD.

Toutefois, si vous souhaitez définir des marqueurs de chapitre à chaque limite de GOP après le transcodage de votre vidéo au format MPEG-2, vous ne devez utiliser que des GOP fermés. Cette liberté d’action est limitée, car vous ne pouvez définir des marqueurs de chapitre qu’aux limites des GOP et pas à n’importe quelle image de la vidéo.

Environ 24p (23,98p)

Pour la création et l’encodage de DVD, le format 24P se réfère à une séquence vidéo qui contient 24 images progressives (non entrelacées) par seconde, avec une résolution d’image standard de type NTSC (720 x 480 pour le MPEG-2). La fréquence d’images naturelle des films est de 24 images par seconde, et comme le format MPEG-2 est capable de représenter en interne des vidéos à cette fréquence, de nombreux films DVD commerciaux sont encodés à l’aide de cette méthode. Cependant, chaque fois que vous utilisez de la vidéo NTSC dans votre projet, la fréquence d’images des données transférées à partir d’un film est ralentie de 24 ips à 23,976 ips (arrondi à 23,98) et un pulldown 2:3:2:3 est ajouté. Le terme plus précis est donc en fait 23,98p.

Compressor peut également effectuer cette opération pour les fichiers vidéo sources 24p. Pour ce type de fichiers, l’option de fréquence d’images 23,98 (sous l’onglet Format vidéo) compresse une par une chaque image source, sans compresser les images ou les trames qui se répètent, dans le but d’obtenir une fréquence d’images de 29,97 images par seconde. Avec un taux de compression inférieur, le résultat obtenu est de meilleure qualité que si le fichier avait été converti à 29,97 images par seconde avant le transcodage. Compressor définit en outre convenablement les indicateurs d’images MPEG-2 internes, ce qui permet aux lecteurs DVD d’appliquer de manière appropriée le processus pulldown 3:2 pour l’affichage de 29,97 images entrelacées par seconde sur des télévisions NTSC.

Remarque : si la fréquence d’images de votre vidéo source est de 24,00 images par seconde au lieu de 23,98, Compressor saute une image toutes les 1000 images source. Au contraire, lorsque la fréquence de la vidéo source 24P est de 23,98 images par seconde, Compressor transcode toutes les images sources, sans en sauter ou en répéter aucune.