MPEG-2 に関する参考情報

以下のセクションでは、MPEG-2 の出力メディアファイルの作成に役立つ情報について説明します。

ビットレートの選択について

標準 DVD 再生用の標準ビットレートと最大ビットレートを決める際には、オーディオトラックのビットレートと MPEG-2 のビットレートを考慮してください。

オーディオビットレートとビデオビットレートでは、平均値および最大値の合計が、標準 DVD プレーヤーからの転送で保証される最大値 10.08 Mbps を下回る必要があります。DVD 対応のオーディオフォーマットは、固定ビットレート(CBR)なので、考慮する最大オーディオビットレートはありません。

たとえば、1.5Mbps の AIFF オーディオを使用している場合は、ビデオビットレートの平均値と最大値が両方とも 8.5Mbps を常に下回るようにします。通常、標準ビットレートはこの値よりも低くなります(たとえば、長さが 2 時間分 DVD ビデオでは 3.5 Mbps です)。しかし、最大ビットレートもこの値より低く設定する必要があります。エラー(たとえば、サブタイトルストリームの受け入れ)の可能性も考慮し、最大ビットレートを 8.0 Mbps に設定することをお勧めします。Dolby Digital や MPEG-1/レイヤー 2 といった DVD 対応の圧縮オーディオフォーマットを使用している場合は、オーディオビットレートを 0.2 〜 0.4 Mbps 程度に低く設定します。この場合、最大ビットレートを約 1 Mbps 高く設定できます。

また、一般的には、最大ビットレートは標準ビットレートより少なくとも 1 Mbps は高く設定しておき、ビットレートの変動を許容しながら品質を一定に保てるようにします。

MPEG-2 のビデオフレームサイズとフォーマット

MPEG-2 では、固定サイズのビデオフレームが使われるため、「Compressor」の「ジオメトリ」パネルのフィールドには、選択したビデオフォーマットに対応した出力フレームサイズが入力されます。

「ビデオフォーマット」ポップアップメニューで選択したビデオフォーマットに応じて、フレームサイズとフレームレート、アスペクト比、優先フィールドなどの関連特性のオプションが決まります。詳細については、「ビデオフォーマット」タブを参照してください。

ビデオフォーマット
フレームサイズ(ピクセル)
フレームレート(fps)
アスペクト比
スキャン方式
NTSC
720×480
23.98(プログレッシブのみ)、29.97
4:3 または 16:9
インターレース、プログレッシブ
PAL
720 ×576
25
4:3 または 16:9
インターレース、プログレッシブ
720p
1280×720
23.98、25、29.97、50、59.94
16:9
プログレッシブ
HD 1440×1080
1440×1080
23.98(プログレッシブのみ)、25、29.97
16:9
インターレース、プログレッシブ
HD 1920×1080
1920×1080
23.98(プログレッシブのみ)、25、29.97
16:9
インターレース、プログレッシブ
640×480(1.33)
640×480
23.98、25、29.97
4:3 または 16:9
インターレース、プログレッシブ
640×360(1.78)
640×360
23.98、25、29.97
4:3 または 16:9
インターレース、プログレッシブ
640×352(1.82)
640×352
23.98、25、29.97
4:3 または 16:9
インターレース、プログレッシブ
640×384(1.67)
640×384
23.98、25、29.97
4:3 または 16:9
インターレース、プログレッシブ
640×320(2.00)
640×320
23.98、25、29.97
4:3 または 16:9
インターレース、プログレッシブ

GOP とフレームタイプについて理解する

MPEG-2 によるエンコーディングの最も大きな特長は、フレームからだけではなく、フレームのグループからも冗長性を排除できる点です。MPEG-2 では、3 種類のフレームタイプ(I、P および B)を使って画像を表現します。グループオブピクチャ(GOP)設定により、使用する 3 種類のフレームタイプのパターンを定義します。これら 3 種類のフレームタイプは、次のような方法で定義されます。

  • Intra(I): キーフレームとしても知られています。GOP ごとに I フレームを 1 つ含みます。I フレームは、前後のフレームへの参照なしに完全に展開できる唯一の MPEG-2 フレームタイプです。データは最も重くなるため、必要となるディスク容量も最大になります。シーンが変わる個所や、ほかの特定のフレーム位置に I フレームを配置する場合は、「プレビュー」ウインドウを使って手動で設定する必要があります。これは、強制 I フレームとして知られています。詳細については、「マーカーとポスターフレームを使って作業する」を参照してください。
  • Predicted(P): 先行する I フレームまたは P フレームのうち、最も近いフレームに基づいて予測されるピクチャからエンコードされます。
 P フレームは通常、GOP 内の先行する I フレームまたは P フレームを参照するため、必要となるディスク容量は I フレームより小さくなります。

    メモ: I フレームと P フレームは参照フレームとしても知られています。なぜなら、B フレームが I フレームと P フレームのいずれか(あるいはその両方)を参照するためです。

  • Bi-directional(B): 直前および直後の参照フレームである I フレームまたは P フレームを補完することによってエンコードされます。B フレームは最も効率的に格納できる MPEG-2 フレームタイプであり、必要となるディスク容量は最小となります。

B フレームと P フレームを用いると、MPEG-2 は時間の冗長性を排除できるようなり、その結果ビデオを効率的に圧縮できます。

GOP 設定を選択する際の注意点

GOP 設定を選択する際は、次の要素に注意してください。

GOP 構造

この設定では、GOP 内の参照フレームの間に配置する B フレームの数を、0、1、または 2 から選択します。GOP 構造および GOP サイズにより、トランスコーディング中に使用される I フレーム、P フレーム、および B フレームの数が決定されます。

選択するべき GOP 構造は、P フレームの間隔に依存します。P フレームは直前の参照フレーム(I フレームまたは P フレーム)から予測されるため、間に B フレームが 1 または 2 つ存在する場合は、2 〜 3 フレームが再生される時間内にオブジェクトの移動距離を予測する必要があります。

原理としては、隣り合ったフレーム間の平均の動きが少ないほど P フレームの間隔を空けることが可能で、圧縮率が上がります。ほとんどのビデオソースには IBBP 構造をお勧めします。シーケンス全体で動きがとても速い素材には IBP 構造か IP 構造をお勧めしますが、このような場合には高品質を実現するために比較的高めのビットレート(SD ビデオの場合は 6 〜 8 Mbps)が必要です。

GOP サイズ

この設定では GOP 内のフレーム数を指定します。それぞれ GOP は必ず I フレームを 1 つを持ち、B フレームと P フレームは I フレームよりも小さいので、圧縮率は GOP サイズが大きくなるほど向上します。

ほとんどのメディアでは、I フレームの間隔を 1/2 秒にすると優れた結果が得られます。1/2 秒の間隔は、NTSC では 15 フレームの GOP サイズ、PAL では 12 フレームの GOP サイズに相当します。DVD/ビデオ仕様ではこれより長い GOP を認められていません。通常、ビデオ全体を通してシーンの変更が 1/2 秒未満の間隔で頻繁に起こる素材では、小さめの GOP サイズを使った方が良い結果が得られます。

オープン GOP とクローズド GOP

オープン GOP は、GOP パターンに特別な B フレームが含まれているため最も効率的です。オープン GOP は、直前の GOP の最後の P フレームとその GOP 内の最初の I フレームを参照する B フレームで始まります。

Figure. Diagram comparing Open GOP and Closed GOP.

定義では、前後の GOP 内にあるフレームを参照するフレームをクローズド GOP に含めることはできません。一方、オープン GOP は、直前の GOP の最後の P フレームを参照する 1 つまたは複数の B フレームから開始します。「Compressor」によって作成されるクローズド GOP は、I フレームから始まります。

オープン GOP とクローズド GOP で構造およびサイズが同じ場合、オープン GOP で圧縮する方がやや効率的です。上記の図から、クローズド GOP には同じ長さのオープン GOP よりも P フレームが 1 つ多く含まれることが分かります。P フレームは通常 B フレームより多くのビットを必要とするため、オープン GOP を使用すると圧縮率がわずかに向上します。

DVD オーサリングアプリケーションを使って作成した DVD ビデオディスクでは、オープン GOP の使用にいくつかの制約が生じます。たとえば、ミックスアングルまたはマルチアングル DVD に使用される MPEG-2 ストリームでは、クローズド GOP の使用しか認められていません。

ほかにも、DVD チャプタマーカーを設定できるのは、クローズド GOP の開始点に限られるなどの制約があります。チャプタマーカーの定義は、MPEG-2 トランスコーディングの開始前に行うのが最適です。たとえば、「Final Cut Pro」でチャプタマーカーを指定する場合は、オープン GOP による MPEG-2 トランスコーディングを実行するよう「Compressor」を設定します。すると、「Compressor」は、1 つのクローズド GOP が必ず指定したチャプタマーカーから開始されるよう強制し、その他の GOP すべてをオープンにします。この操作は、「強制 I フレーム」を「Compressor」の「プレビュー」ウインドウで指定し、それらに DVD オーサリングアプリケーションで使用するチャプタ名を与えることでも実行できます。

ただし、ビデオを MPEG-2 フォーマットにトランスコードした後でチャプタマーカーを任意の GOP 境界に設定したい場合には、クローズド GOP のみを使用してください。この場合、ビデオフレームではなく GOP 境界にしかチャプタマーカーを設定できないという制約が生じます。

24p(23.98p)について

DVD オーサリングとエンコーディングに関し、24P とは、NTSC における標準精細度フレームサイズ(MPEG-2 の 720×480)で、1 秒間に 24 個のプログレッシブフレーム(つまり、ノンインターレースフレーム)を持つビデオシーケンスを意味します。フィルムで撮影する映画では、24 fps というネイティブフレームレートを使用します。MPEG-2 フォーマットは内部で 24 fps ビデオを表すことができるため、市販されているほとんどの DVD はこの方法でエンコードされます。ただし、プロジェクトで NTSC ビデオを使用する場合はいつでも、フィルム転送素材のフレームレートは 24 fps から 23.976 fps(繰り上げて 23.98)に低下し、2:3:2:3 のプルダウンが追加されます。そのため、実際には「23.98p」というのが正確な用語です。

「Compressor」では、24p ソース・ビデオ・ファイルについてもこれを行うことができます。そのような素材の場合、23.98 フレームレートオプション(「ビデオフォーマット」タブ)はそれぞれのソースフレームを 1 対 1 で圧縮します。繰り返しのフレームやフィールドは圧縮せず、29.97 fps の表示レートは実現されません。その結果、24p ソースをトランスコーディング前に 29.97 fps に変換した場合よりも、低い圧縮ビットレートで高い品質を実現できます。また、「Compressor」では内部の MPEG-2 フレームフラグも正しく設定されるため、DVD プレーヤーは 29.97 fps のインターレース NTSC テレビに 3:2 プルダウン処理を正しく適用します。

メモ: ソースビデオで使用されるフレームレートが 23.98 fps ではなく 24.00 fps の場合、「Compressor」は 1000 ソースフレームごとに 1 フレームをスキップします。24p ソースビデオが 23.98 fps のフレームレートの場合、「Compressor」はすべてのソースフレームをトランスコードし、スキップ(または繰り返し)は行われません。