MPEG-2-Referenzinformationen

Die folgenden Abschnitte enthalten nützliche Informationen zur Erstellung von MPEG-2-Ausgabemediendateien.

Informationen zum Wählen von Bitraten

Wenn Sie die durchschnittliche und maximale Bitrate für die standardmäßige DVD-Wiedergabe bestimmen, ist es wichtig, auch die Bitrate für die Audiospur sowie die Bitrate für das Format MPEG-2 zu berücksichtigen.

Die Summe der durchschnittlichen sowie der maximalen Audio- und Videobitraten muss unter 10,08 MBit/s liegen, denn dies ist die maximale Übertragungsrate, die von handelsüblichen DVD-Playern gewährleistet wird. Da DVD-kompatible Audioformate konstante Bitraten (CBR) haben, brauchen Sie sich um die maximale Audiobitrate keine Gedanken zu machen.

Wenn Sie also beispielsweise Audiomaterial in AIFF mit 1,5 MBit/s verwenden, sollten sowohl der durchschnittliche als auch der maximale Wert der Videobitrate unter 8,5 MBit/s liegen. Normalerweise wird die durchschnittliche Bitrate darunter liegen (z. B. 3,5 MBit/s für 2 Stunden Material auf DVD). Die maximale Bitrate muss jedoch ebenfalls unterhalb dieses Werts bleiben. Eine maximale Bitrate von 8,0 MBit/s wird empfohlen, um einen Spielraum zu haben, falls Probleme auftreten (z. B. wenn Sie Streams mit Untertiteln unterbringen müssen). Wenn Sie ein DVD-kompatibles komprimiertes Audioformat wie Dolby Digital oder MPEG-1/Layer-2 verwenden, kann Ihre Audiobitrate unter Umständen nur bei 0,2 bis 0,4 MBit/s liegen. In diesem Fall können Sie Ihre maximale Bitrate auf 1 MBit/s und höher einstellen.

Im Allgemeinen sollten Sie die maximale Bitrate so festlegen, dass sie mindestens um 1 MBit/s höher ist als die durchschnittliche Bitrate. Dadurch gewähren Sie einen gewissen Spielraum für Schwankungen in der Bitrate und erzielen somit ein gleichbleibendes Qualitätsniveau.

MPEG-2-Videobildgrößen und -formate

Da MPEG-2 feste Videobildgrößen verwendet, setzt Compressor die Werte für die Bildgröße der Ausgabedatei im Bereich „Geometrie“ auf der Basis des von Ihnen gewählten Videoformats automatisch ein.

Das von Ihnen im Einblendmenü „Videoformat“ ausgewählte Videoformat bestimmt die Optionen für die zugehörigen Eigenschaften wie Bildgröße und Bildrate, Seitenverhältnis und Halbbilddominanz. Weitere Informationen hierzu finden Sie unter Bereich „Videoformat“.

Videoformat
Bildgröße (in Pixeln)
Bildrate (in fps)
Seitenverhältnis
Abtastverfahren
NTSC
720 x 480
23,98 (nur progressiv); 29,97
4:3 oder 16:9
Interlaced, progressiv
PAL
720 x 576
25
4:3 oder 16:9
Interlaced, progressiv
720p
1280 x 720
23,98; 25; 29,97; 50; 59,94
16:9
Progressiv
HD 1440 x 1080
1440 x 1080
23,98 (nur progressiv); 25; 29,97
16:9
Interlaced, progressiv
HD 1920 x 1080
1920 x 1080
23,98 (nur progressiv); 25; 29,97
16:9
Interlaced, progressiv
640 x 480 (1,33)
640 x 480
23,98; 25; 29,97
4:3 oder 16:9
Interlaced, progressiv
640 x 360 (1,78)
640 x 360
23,98; 25; 29,97
4:3 oder 16:9
Interlaced, progressiv
640 x 352 (1,82)
640 x 352
23,98; 25; 29,97
4:3 oder 16:9
Interlaced, progressiv
640 x 384 (1,67)
640 x 384
23,98; 25; 29,97
4:3 oder 16:9
Interlaced, progressiv
640 x 320 (2,00)
640 x 320
23,98; 25; 29,97
4:3 oder 16:9
Interlaced, progressiv

Konzept von GOPs und Bildtypen

Ein wichtiges Leistungsmerkmal der MPEG-2-Codierung besteht darin, dass Redundanzen entfernt werden können, und zwar nicht nur innerhalb eines Bildes, sondern auch innerhalb einer Gruppe von Bildern. MPEG-2 verwendet bei der Wiedergabe von Videomaterial drei Bildtypen (I-, P- und B-Bilder). Eine GOP-Einstellung (GOP - Group of Pictures) definiert dabei das Muster der drei verwendeten Bildtypen. Die drei Bildtypen sind wie folgt definiert:

  • Intra (I): Wird auch als Keyframe bezeichnet. Jede GOP enthält ein I-Bild. Das I-Bild ist der einzige MPEG-2-Bildtyp, der komplett dekomprimiert werden kann und keine Referenzen auf vorherige oder nachfolgende Bilder enthält. I-Bilder sind datenintensiv und erfordern daher den meisten Speicherplatz. Wenn Sie bei einem Szenenwechsel oder an einer anderen wichtigen Stelle ein I-Bild platzieren möchten, müssen Sie dieses manuell einfügen. Verwenden Sie hierfür das Fenster „Vorschau“. Dies wird auch als erzwungenes I-Bild bezeichnet. Weitere Informationen hierzu finden Sie unter Arbeiten mit Markern und Posterbildern.
  • Prädiktiv (P): P-Bilder werden „prädiktiv“ codiert, d. h., es wird die Differenz zum vorherigen I- oder P-Bild codiert. P-Bilder benötigen normalerweise wesentlich weniger Speicherplatz als I-Bilder, weil sie ein vorheriges I- oder P-Bild innerhalb der GOP als Referenz nutzen.

    Hinweis: Sowohl I-Bilder als auch P-Bilder werden häufig als Referenzbilder bezeichnet, da sich ein B-Bild auf einen oder beide dieser Bildtypen beziehen kann.

  • Bidirektional (B): B-Bilder werden auf der Basis einer Interpolation von vorherigen und nachfolgenden Referenzbildern codiert, bei denen es sich entweder um I-Bilder oder um P-Bilder handeln kann. B-Bilder sind der speichereffizienteste MPEG-2-Bildtyp, da sie am wenigsten Speicherplatz erfordern.

Durch die Verwendung von B- und P-Bildern ist es möglich, dass MPEG-2 zeitliche Redundanzen entfernt und Videomaterial sehr effizient komprimiert.

Kriterien bei der Wahl von GOP-Einstellungen

Bei der Wahl von GOP-Einstellungen sollten Sie die folgenden Aspekte berücksichtigen.

GOP-Muster

Die ausgewählte GOP-Struktur (Einblendmenü „GOP-Muster“) legt fest, ob zwischen den Referenzbildern innerhalb einer GOP zwei, ein oder kein B-Bild enthalten sein soll. Die GOP-Struktur bestimmt zusammen mit der GOP-Größe, wie viele I-, P- und B-Bilder während der Umcodierung verwendet werden.

Die Wahl der GOP-Struktur hängt davon ab, wie weit die P-Bilder voneinander entfernt sein sollen. Da ein P-Bild durch eine prädiktive Codierung aus dem vorherigen Referenzbild entsteht (dies kann ein I-Bild oder ein P-Bild sein), muss die prädiktive Codierung im Falle des Vorhandenseins von zwei B-Bildern zwischen den P-Bildern die Distanz berücksichtigen, um die sich die Objekte während der Dauer von zwei bis drei Bildern bewegen.

Prinzipiell gilt: Je geringer die Bewegungsdifferenz zwischen einem Bild und dem nächsten ist, desto weiter können die P-Bilder auseinander liegen und desto mehr kann die Datei komprimiert werden. Die IBBP-Struktur ist für die meisten Videodateien geeignet. Enthält das Videomaterial jedoch über die gesamte Sequenz ungewöhnlich schnelle Bewegungen, ist unter Umständen eine IBP- oder IP-Struktur besser geeignet. In solchen Fällen dürfte eine relativ hohe Bitrate (6 bis 8 MBit/s für SD-Video) erforderlich sein, um eine gute Qualität zu erzielen.

GOP-Größe

Die ausgewählte GOP-Größe (Einblendmenü „GOP-Größe“) gibt an, wie viele Bilder in einer GOP enthalten sind. Da in jeder GOP genau ein I-Bild vorkommt, lassen sich GOP-Strukturen mit höheren Werten für die GOP-Größe (längere Muster) in der Regel stärker komprimieren, da B- und P-Bilder kleiner sind als I-Bilder.

Für die meisten Medien führt ein Abstand von einer halben Sekunde zwischen den I-Bildern zu guten Ergebnissen. Dies entspricht einer GOP-Größe von 15 Bildern für NTSC und 12 Bildern für PAL. Die DV-Video-Spezifikation lässt keine GOP-Größen zu, die wesentlich über diese Werte hinausgehen. Kürzere GOP-Größen sind im Allgemeinen nur für Material von Vorteil, das häufige Szenenwechsel im Abstand von weniger als einer halben Sekunde enthält.

Offene und geschlossene GOPs

Offene GOPs sind sehr effizient, da sie ein zusätzliches B-Bild im GOP-Muster zulassen. Offene GOPs beginnen mit einem B-Bild, das sowohl das letzte P-Bild aus der vorherigen GOP als auch das erste I-Bild der eigenen GOP als Referenzbild verwenden kann.

Figure. Diagram comparing Open GOP and Closed GOP.

Per Definition darf eine geschlossene GOP kein Bild enthalten, das sich auf ein Bild in der vorherigen oder nachfolgenden GOP bezieht. Im Gegensatz dazu beginnen offene GOPs mit einem oder mehreren B-Bildern, die sich auf das letzte P-Bild der vorherigen GOP beziehen. Mit Compressor erstellte geschlossene GOPs beginnen stets mit einem I-Bild.

Offene GOPs lassen sich im Allgemeinen etwas besser komprimieren als geschlossene GOPs derselben Struktur und Größe. Die Abbildung weiter oben zeigt, dass eine geschlossene GOP ein P-Bild mehr enthält als eine offene GOP derselben Länge. Da P-Bilder üblicherweise mehr Bit erfordern als B-Bilder, ist die offene GOP etwas besser komprimierbar.

Es gibt einige Einschränkungen in Bezug auf die Verwendung von offenen GOPs für DVDs mit dem Format „DVD-Video“, die mit einem DVD-Authoring-Programm erstellt werden. Eine Einschränkung besteht darin, dass innerhalb von MPEG-2-Streams, die für Multi-Angle- oder Mixed-Angle-DVDs verwendet werden, nur geschlossene GOPs zulässig sind.

Eine weitere Einschränkung ist, dass DVD-Kapitel-Marker nur am Anfang einer geschlossenen GOP gesetzt werden können. Am besten ist es, wenn Sie die Kapitel-Marker definieren, bevor Sie mit der Umcodierung in MPEG-2 beginnen. Wenn Sie beispielsweise die Kapitel-Marker in Final Cut Pro festlegen, können Sie Compressor so einstellen, dass die Codierung in MPEG-2 mit offenen GOPs vorgenommen wird. Compressor veranlasst dann, dass eine geschlossene GOP jeweils nur an den festgelegten Kapitel-Markern beginnen darf. Alle anderen GOPs werden zu offenen GOPs. Das gleiche Ergebnis können Sie erzielen, indem Sie „erzwungene I-Bilder“ im Fenster „Vorschau“ von Compressor definieren. Geben Sie diesen dann einen Kapitelnamen, der vom DVD-Authoring-Programm verwendet werden soll.

Wenn Sie jedoch Kapitel-Marker an einer beliebigen GOP-Grenze einfügen wollen, nachdem Ihr Videomaterial in das Format MPEG-2 umcodiert wurde, sollten Sie nur geschlossene GOPs verwenden. Beachten Sie dabei, dass Sie Kapitel-Marker nur an GOP-Grenzen einfügen können und nicht an jedem beliebigen Bild im Videomaterial.

Bildrate 24p (23,98p)

Im Zusammenhang mit DVD-Authoring und Codierung bezieht sich 24p auf eine Videosequenz, die 24 progressive Bilder (Vollbilder) pro Sekunde enthält. Dabei wird eine NTSC-SD-Bildgröße verwendet (720 x 480 für MPEG-2). Auf Film aufgezeichnetes Videomaterial (im Gegensatz zu auf Band aufgezeichnetem Videomaterial) hat eine native Bildrate von 24 fps. Da das MPEG-2-Format in der Lage ist, Videomaterial intern mit 24 fps wiederzugeben, werden viele kommerzielle Film-DVDs auf diese Weise codiert. Allerdings wird bei der Verwendung von NTSC-Video die Bildrate von Material, das von Film übertragen wurde, von 24 fps auf 23,976 fps (gerundet auf 23,98) reduziert. Außerdem wird ein 2:3:2:3-Pulldown hinzugefügt. Die exakte Bezeichnung für die Bildrate „24p“ wäre also eigentlich 23,98p.

Compressor kann dieses Verfahren auch auf 24p-Ausgangsvideodateien anwenden. Für solches Material komprimiert die Bildratenoption „23,98“ (im Bereich „Videoformat“) jedes Originalbild eins zu eins. Bildwiederholungen oder Halbbilder werden dabei nicht komprimiert, damit eine Wiedergaberate von 29,97 fps erreicht wird. Das Ergebnis ist eine höhere Qualität bei einer niedrigeren Bitrate bei der Komprimierung als dies möglich wäre, wenn das 24p-Material vor dem Umcodieren in 29,97 fps konvertiert würde. Compressor setzt darüber hinaus die internen MPEG-2-Bildmarkierungen (Flags) korrekt, sodass DVD-Player den 3:2-Pulldown-Prozess richtig anwenden, wenn das Material mit 29,97 fps auf NTSC-Fernsehbildschirmen im Zeilensprungverfahren angezeigt wird.

Hinweis: Hat Ihr Ausgangsvideo eine Bildrate von 24,00 fps anstatt 23,98 fps, überspringt Compressor pro 1000 Bilder im Ausgangsmaterial je ein Bild. Liegt das 24p-Ausgangsvideo mit einer Bildrate von 23,98 fps vor, codiert Compressor alle Ausgangsbilder um, ohne dass Bilder ausgelassen (oder wiederholt) werden.