概述

简介

本指南将详细介绍在交付媒体和文件时应遵循的素材要求,包括音乐、音乐视频、电视节目和影片。如需了解更多详情,请联系你的技术顾问。

质量对我们而言非常重要。我们期待收到尽可能高质量的素材。我们的产品在质量上必须足以媲美市场上已经发布的实体产品,甚至更胜一筹。例如,如果产品的实体版本中包括 5.1 环绕声或隐藏式字幕,则我们的产品也必须提供这些内容。如果实体产品为章节指定了具体名称(而不是“第 1 章”、“第 2 章”等),那么我们的产品也应该具有相同的章节名称。如果专辑是立体声专辑,那么我们的产品也必须提供立体声。

此版本中的变更

日期 - 版本

更新内容

2025 年 4 月 28 日 - 版本 5.3.17

更新了音乐专辑动态封面描述文件。新增了音乐视频字幕描述文件。其他细微更正和补充。

有关完整的更新记录,请参见指南修订历史

《Apple 视频和音频素材指南 5.3.17》更新内容

音乐专辑动态封面描述文件

更新了音乐专辑动态封面描述文件的要求。详情请参见音乐专辑动态封面描述文件

音乐视频字幕描述文件

新增了有关交付音乐视频字幕和 SDH 内容的说明。详情请参见音乐视频字幕描述文件

其他

少量更正和补充说明。

音乐音频内容描述文件

音乐音频源描述文件

Apple 接受采样率为 44.1、48、88.2、96、176.4 或 192 kHz,且位深度为 16 或 24 位的音频。请注意,如果有立体声源,则必须使用立体声源。如需了解 Apple 数字母带的音频要求,请参见 Apple 数字母带音频源描述文件

如果没有立体声源,例如在某些老式(模拟)录音或环境录音的情况下,请发送左右声道相同的音频源。不接受单声道音频。

支持的未压缩音频格式为:

格式

容器类型

符合条件的编解码器

脉冲编码调制(PCM)

WAV (.wav)

Apple 保真压缩(ALAC)

M4A (.m4a)

QuickTime https://www.apple.com/quicktime

CAF (.caf)

iTunes Producer

免费无损音频编解码器(FLAC)

FLAC (.flac)

FLAC https://xiph.org/flac/

所有其他音频格式将被拒绝。

【重要事项】所有音频都必须使用符合条件且被 Apple 认可的编解码器生成。

Apple 数字母带音频源描述文件

Apple 数字母带(此前称为“Mastered for iTunes”)音频必须遵循以下要求,才会在 Apple 的平台中显示认证徽标:

  • 音频的位深度必须为 24 位,并使用支持的格式交付。

  • 可接受的采样率为 44.1、48、88.2、96、176.4 和 192 kHz。

有关 Apple 数字母带的深入描述,请参考此处的技术概要:Apple 数字母带

Apple 数字母带内容的最佳做法

制作 Apple 数字母带内容的最佳做法如下所示。Apple 建议你向母带处理工作室传达这些最佳做法:

  • 音频源的解析度至少为 44.1 kHz/24-bit。不得使用经过升频(Up-sampling)和/或位填充(bit-padding)处理的 44.1 kHz/16-bit 文件。

  • 文件应通过最新的 Apple AAC 编码器进行编码,可以使用下列工具:Apple Digital Masters Droplets、RoundTripAAC 插件或 Sonnox 的 Pro-Codec v2 插件(内含 Apple 的 iTunes Plus AAC 编码器)。请使用这些工具设定适合的电平,以免出现过载。

  • Apple 不会因为出现一定数量的过载情况而拒收文件,但因电平过高而造成明显过载可能会导致曲目无法被认证为“Apple 数字母带”。

  • 文件格式必须为 24 位 PCM,采样率为 44.1、48、88.2、96、176.4 或 192 kHz。请使用项目的原始解析度,请勿进行降频(down-sample)处理。可接受 ALAC 或 FLAC 无损压缩。

高解析度无损音频源描述文件

高解析度无损音频的素材要求

音乐内容要在 Apple 的平台中显示“高解析度无损”徽标,其音频必须满足以下要求:

  • 位深度应为 24 位,并使用规定的格式。

  • 采样率应为 88.2、96、176.4 或 192 kHz。请注意,44.1 和 48 kHz 的采样率不满足“高解析度无损”的要求。

另请遵循 Apple 数字母带内容的最佳做法,详情可参见 Apple 数字母带音频源描述文件

沉浸式音频源描述文件

沉浸式音频源必须满足以下要求:

杜比全景声

  • 我们不接受由立体声生成的杜比全景声音频文件。具体要求如下:

    • 杜比全景声曲目必须由多轨,或由多轨制作的分轨生成。

    • 请勿直接将立体声音频转换成杜比全景声音频。

    • 请勿从立体声版本中提取分轨(“分解混音”)。

    • 请勿只将一个立体声混音放置在声场并添加环境声或混响,通过这种方式制作而成的杜比全景声音频也不予接受。

  • 杜比全景声文件必须使用音频定义模型广播波形格式(ADM BWF)。

  • 同一个项目中的所有曲目应具有相同的帧速率。

  • 所有音频的解析度应为 48 kHz/24-bit,且采用线性脉冲编码调制(LPCM)。

  • 杜比全景声文件必须与同一项目内的立体声参考文件一致且同步。

  • 整体响度不得超过 -18 LKFS(基于 ITU-R BS. 1770-4 标准)。

  • 真实峰值不得超过 -1 dBTP(基于 ITU-R BS. 1770-4 标准)。

  • 全频内容不应出现在 BWF ADM 的低频效果(LFE)通道中。

  • 对于曲目无缝播放的专辑:

    • 必须为专辑中的每首曲目交付一个相应的 ADM BWF 文件。

    • 杜比全景声音频与其对应的立体声音频在曲目衔接处的差异不得超过半帧(按 48 kHz 计算,半帧包含 1000 次采样)。

    • 杜比全景声音频的结尾部分必须与其对应的立体声音频一致,不得有额外的空白片段。

【注】不符合规范的沉浸式音频可能会从 Apple Music 中下架。

5.1 环绕声和 7.1 环绕声

【注】不接受由立体声混音生成的 5.1 环绕声和 7.1 环绕声音频文件。不接受由 5.1 环绕声生成的 7.1 环绕声音频。5.1 和 7.1 音频文件应符合以下交付标准。

  • 音频文件必须为 LPCM 音频,使用 .mov 封装,并分配有多个声道。

  • 音频文件的解析度应为 48 kHz/16-bit 或 24-bit。

  • 整体响度不得超过 -18 LKFS(基于 ITU-R BS. 1770-4 标准)。

  • 真实峰值不得超过 -1 dBTP(基于 ITU-R BS. 1770-4 标准)。

  • 环绕声文件必须与同一项目内的立体声参考文件一致且同步。

沉浸式音频声道分配

  • 5.1 和 7.1 声道的沉浸式音频须使用 QuickTime .mov 文件扩展名。

  • 对于 7.1 声道的沉浸式音频,必须按照下表中的任一方案分配每一个声道。方案一(Option 1)中,一条音轨包含所有八个声道;而方案二(Option 2)中,一条音轨对应一个声道。请注意,“Rsl”(Rear Surround Left,即左后方环绕)也可用“Rls”(Rear Left Surround)表示。

    显示音频声道分配的表格图像
  • 对于 5.1 环绕声音频,必须按照下表中的任一方案分配声道。方案一(Option 1)中,一条音轨包含所有六个声道,声道分配顺序有以下四种:Option 1a、1b、1c 和 1d。

    音频声道分配表
    • 在列出的所有方案中,所有立体声音轨的声道分配可以使用 L 和 R 表示,也可以使用 Lt 和 Rt 表示,但请勿混合使用(例如 L 和 Rt,或 R 和 Lt)。

    请参考音频声道分配,了解标签描述以及如何进行音频声道分配。

沉浸式音频的交付规范

交付沉浸式音频时,请注意以下事项:

  • 首次交付曲目时,必须交付 2.0 立体声音频源的数据文件,并将数据文件的 role(用途)指定为 audio.2_0;如果只交付一个沉浸式音频源,则应使用 audio.transform_to.2_0 属性指示 Apple 通过转换生成 2.0 立体声音频源。

  • 一首曲目只能交付两个音频源(一个立体声音频和一个沉浸式音频)。

  • 请勿为同一曲目交付两个沉浸式音频源或两个立体声音频源。

  • 请勿将 2.0 立体声音频源和 5.1/7.1 声道音频源包含在同一个数据文件中。

  • 最新交付(首次交付或更新)的立体声音频源与沉浸式音频源的时长之差不得大于 50 毫秒。

  • 专辑中的所有曲目应具有相同的帧速率。

铃声源描述文件

  • 解析度可以为 44.1 kHz/16-bit、44.1 kHz/24-bit 或 96 kHz/24-bit。

  • 必须为无损。

  • WAV、FLAC 或 ALAC 格式。

  • 长度最短为 5 秒,最长为 30 秒。

请参见音乐音频源描述文件中的表格,了解受支持的未压缩音频格式。所有其他的音频格式都将被拒绝。请注意,如果有立体声源,则必须使用立体声源。

【重要事项】所有音频都必须使用符合条件且被 Apple 认可的编解码器生成。

音乐专辑封面图描述文件

  • .jpg 扩展名的 JPEG 文件(不压缩质量),或带 .png 扩展名的 PNG 文件。

  • 色彩空间应为 RGB(屏幕标准)。

  • 专辑封面图文件的建议尺寸为 3000 x 3000 像素;尺寸至少为 1400 x 1400 像素。

  • 对于铃声,尺寸至少为 800 x 800 像素。建议尺寸为 1400 x 1400 像素,以达到最佳效果。

  • 图像必须为方形。

  • 文件格式应为 JPEG 或 PNG(100% 质量)。

  • 宽高比 1:1。

请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。

【重要事项】CMYK(打印标准)图像将不予接受。

音乐专辑动态封面描述文件

音乐专辑动态封面应遵循下方列出的技术规范。如果数据包中包含不符合规范的素材,则整个数据包会被拒绝。

请务必提交以下两种规格的动态封面素材:

  • 专辑页面动态封面 3 x 4

  • 专辑页面动态封面 1 x 1

专辑页面动态封面 3 x 4

此规格的动态封面会显示在 iPhone 上的专辑详情页,是必须提交的素材。

  • 文件格式:MOV 或 MP4

  • 视频编解码器:Apple ProRes 422、Apple ProRes 4444 或 H.264

  • 分辨率:2048 x 2732 像素(3 x 4);采用方形像素(1:1)

  • 帧速率:23.976、24、25、29.97 或 30 fps

  • 色彩空间:Rec. 709 或 sRGB

  • 时长:15 至 35 秒

专辑页面动态封面 1 x 1

此规格的动态封面会显示在 Mac、iPad 和智能电视上的专辑详情页,也是必须提交的素材。

  • 文件格式:MOV 或 MP4

  • 视频编解码器:Apple ProRes 422、Apple ProRes 4444 或 H.264

  • 分辨率:3840 x 3840 像素(1 x 1);采用方形像素(1:1)

  • 帧速率:23.976、24、25、29.97 或 30 fps

  • 色彩空间:Rec. 709 或 sRGB

  • 时长:15 至 35 秒

音乐数码手册描述文件

  • .pdf 扩展名的 PDF 文件。

  • 最少四页。

  • 大小不超过 10 MB。

  • 所有字体已嵌入。

  • 11 英寸 x 8.264 英寸(28 厘米 x 21 厘米)。

  • RGB 色彩。

  • 水平呈现。

  • 所有图像应为全幅无裁切图像(full-bleed),如样例页面所示。

【重要事项】手册应专为 Apple 格式设计,不可照搬唱片封套说明并添加边框以放大尺寸。

内容注意事项

  • 当保存为 PDF 文件时,请确保文稿以全屏模式打开,文稿周围无负空间。

  • 如果数码手册页书很多,请考虑减少图像数量或对图像进行优化,以降低总文件大小。

  • 不允许出现出版商标记。

  • 不得销售或宣传其他产品或服务,也不得包含任何其他宣传网站。

  • 请勿链接到手册以外的任何地方,艺人和/或唱片公司网站除外。

  • 不得出现时间敏感性信息(例如,促销或即将到来的巡演或演唱会日期)。

数码手册示例

音乐视频内容描述文件

音乐视频标清源描述文件

【注】音乐视频不支持分段。

NTSC 和 PAL

  • ITU-R BT.601 色彩空间,Long GOP。

  • 可接受的格式和尺寸:

格式

比特率

编码尺寸

显示尺寸

应为 Apple ProRes 422(HQ)。

动态比特率(VBR):40-60 Mbps

NTSC:720 x 480 或 720 x 4861

853 x 480(宽高比为 16:9 的内容)

640 x 480(宽高比为 4:3 的内容)

应为 Apple ProRes 422(HQ)。

动态比特率(VBR):40-60 Mbps

PAL:720 x 576

1024 x 576(宽高比为 16:9 的内容)

768 x 576(宽高比为 4:3 的内容)

MPEG-2 程序流主描述文件

最小 15 Mbps

NTSC 或 PAL:640 x 高度2

640 x 高度2

1 编码像素为 720 x 486 的内容,其顶部应至少有 4 个黑色像素,底部至少有 2 个;顶部和底部的剪裁值必须至少共有 6 个像素。

2 高度取决于视频源的宽高比,最大为 480 像素。

  • 所有编码内容必须包含像素宽高比(pasp),该像素宽高比最好能使显示宽高比达到 4:3 或 16:9。

  • 原始片源的原生帧速率:

    • 29.97 隔行帧/秒的视频源,以隔行方式或去隔行方式(即标记为逐行)进行交付。

    • 通过逐行方式交付的影片源应为 24、25 或 30 fps。

    • 磁转胶源应为 23.976 fps,通过逐行方式交付;不得通过隔行方式交付,否则交付将会失败。

    • 对于混合帧速率素材,请联系你的技术顾问。

  • 隔行内容必须标记为非逐行,且必须在流媒体中定义场排序。

  • 必须正确标记优先场(上场优先、下场优先或逐行)。

  • 可设置灰度系数,且系数应介于 2.15 至 2.25 之间。

  • 不接受胶转磁素材。

  • 交付的视频源可带有遮幅:允许上下黑边、左右黑边或四周黑边。

    • 如果标清源文件带有遮幅,则该标清源文件应按其全幅状态交付,同时随附包含指定剪裁矩形的元数据。有关详细信息,请参见《Apple Music 技术规范》中的“音乐视频单曲剪裁尺寸元数据示例”。

    • 如果交付的标清源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

    • 4:3 标清视频不得以带黑边的变形 16:9 格式交付。

【重要事项】所有视频必须至少以一个黑帧开始和结束。此外,视频只能在编辑列表的最后一个编辑中包含空编辑,否则视频会被拒绝。

音乐视频高清源描述文件

【注】音乐视频不支持分段。

  • Apple ProRes 422(HQ)或 4444 或 4444(XQ)。

  • VBR 预计为大约 220 Mbps。

  • 接受高清编码尺寸,以支持方形像素宽高比(PASP):

已编码

PASP

转换至 ProRes 的源格式

1920 x 1080

1:1

HDCAM SR、D5、ATSC

1280 x 720

1:1

ATSC 逐行

  • 接受的高清编码尺寸,以支持非方形像素宽高比(由此,你可以按最佳原始片源的原生尺寸发送高清视频,例如按高清广播尺寸发送*):

已编码

PASP

转换至 ProRes 的源格式

1440 x 1080

1:1.33333

XDCAM-HD、HDCAM

1280 x 1080

1:1.5

DVCProHD 隔行

960 x 720

1:1.33333

DVCProHD 逐行

* 如果原始高清源像素宽高比不是正方形,请在交付前联系你的技术顾问。

  • 原始源的原生帧速率:

    • 源自视频的素材为 29.97 或 25 隔行帧/秒。

    • 数字逐行素材或影片源素材为 23.976、24、25 或 30 fps。

  • 可设置灰度系数,且系数应介于 2.15 至 2.25 之间。

  • 交付的高清源可带有遮幅:允许上下黑边、左右黑边或四周黑边。

    • 高清源可按其全幅状态交付,同时随附包含指定剪裁矩形的元数据。有关详细信息,请参见《Apple Music 技术规范》中的“音乐视频单曲剪裁尺寸元数据示例”。

    • 如果交付的高清源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

【重要事项】所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。

音乐视频 HDR 源描述文件

HDR 视频源必须满足以下小节中的最低要求。

杜比视界和 HDR10

  • 显示尺寸和 PASP 必须匹配相应的主要视频的显示尺寸和 PASP。

  • HDR 视频源必须逐行扫描,且帧速率统一。

  • HDR 视频源轨道应只包含一个编辑列表条目。

  • 时长必须匹配相应的主视频时长。

  • 帧数必须匹配相应的主视频帧数。

  • 指定 HDR 格式(杜比视界或 HDR10)为源属性。

  • HDR 视频源可包含嵌入音频,但音频会被忽略;而 SDR 源包含的音频将被打包至数据包。

  • 可设置灰度系数,且系数应介于 2.15 至 2.25 之间。

  • 交付的 HDR 源可带有遮幅:允许上下黑边、左右黑边或四周黑边。

    • HDR 源可按其全幅状态交付,同时随附包含指定剪裁矩形的元数据。有关详细信息,请参见《Apple Music 技术规范》中的“音乐视频单曲剪裁尺寸元数据示例”。

    • 如果交付的 HDR 源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

  • 所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。对于杜比视界格式的 HDR 视频源,附带元数据文件应包含上述黑帧。

杜比视界

  • 单个 Apple ProRes 4444 或 4444 XQ 12 位文件,随附单个杜比视界 CM 元数据文件(支持杜比视界 CM 版本 2.9 和 CM 版本 4.0 附加元数据文件)。

  • 传递函数:SMPTE ST 2084(PQ)。

  • 白点和基色:ITU-R BT.2020 或 D65 P3。

  • 变换矩阵:BT.2020(对于 BT.2020 基色)或 BT.709(对于 D65 P3 基色)。

  • 杜比视界 CM 元数据不应包含任何镜头间隙,镜头中引用的帧应涵盖视频正片中的所有帧。

HDR10

  • 单个 Apple ProRes 4444 或 4444 XQ 12 位文件。

  • 传递函数:SMPTE ST 2084(PQ)。

  • 白点和基色:ITU-R BT.2020 或 D65 P3。

  • 变换矩阵:BT.2020(对于 BT.2020 基色)或 BT.709(对于 D65 P3 基色)。

  • ST 2086 和 MaxCLL/MaxFALL 元数据作为附加源属性提供。

音乐视频 4K 源描述文件

  • 尺寸应为 3840 x 2160(UHD)或 4096 x 2160(DCI 4K)。你可以选择为 DCI 4K 素材提供剪裁尺寸(Apple 强烈建议提供)。

  • Apple ProRes 422 HQ 或 4444 或 4444 XQ。

  • 预期 VBR 针对 422 HQ 为大约 880 Mbps,针对 4444 为大约 1320 Mbps,针对 4444 XQ 为大约 2000 Mbps。

  • 内容应使用 ITU-R BT.709 色彩空间编码。详情请参见 https://www.itu.int/rec/R-REC-BT.709/en

  • 内容应以源的原始帧速率传送。

  • 4K 源必须逐行扫描,可以以 23.976、24、25、29.97 或 30 fps 交付。

  • 可设置灰度系数,且系数应介于 2.15 至 2.25 之间。

  • 交付的 4K 源可带有遮幅:允许上下黑边、左右黑边或四周黑边。

    • 4K 源可按其全幅状态交付,同时随附包含指定剪裁矩形的元数据。有关详细信息,请参见《Apple Music 技术规范》中的“音乐视频单曲剪裁尺寸元数据示例”。

    • 如果交付的 4K 源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

  • 所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。

音乐视频音频源描述文件

如果 5.1 环绕声可用于音乐视频音频源,那么除了提供立体声版本之外,音频应以 5.1 环绕声形式交付;否则音频可仅以立体声交付。

MPEG-2 程序流容器

立体声

  • MPEG-1 第 II 层

  • 384 kbps

  • 48 kHz

  • 与已交付的视频包括在同一个文件中

QuickTime 容器

立体声

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期杜比定向逻辑声道为 Lt、Rt;预期立体声声道为 L、R。

5.1 环绕声

【注】5.1 环绕声的音频曲目声道可以全部为 24 位全部为 16 位。同一音频曲目不能同时使用 16 位声道和 24 位声道。

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期声道为 L、R、C、LFE、Ls、Rs。

音乐视频音频/视频容器

  • 所有内容应封装在一个 MPEG-2 程序流文件中交付。

  • 所有 MPEG-2 内容都必须使用 .mpg 文件扩展名。

  • 音频与视频流必须先合成再交付。

音乐视频隐藏式字幕描述文件

【注】隐藏式字幕可与 ProRes 和 MPEG-2 文件一并发送。

  • 文本应为 EIA-608 格式。

  • 与关联的视频包含在同一数据包中交付。

  • 在 Scenarist SCC 格式文件中,请使用 .scc 文件扩展名。

  • 时间码帧速率只能是 29.97。此帧速率与你的视频源帧速率无关。但是,时间码格式必须匹配视频源的时间码格式,即丢帧(DF)或非丢帧(NDF)。

    • 丢帧格式的前两个时间分隔符是冒号,最后一个时间分隔符是分号(HH:MM:SS;FF)。

    • 非丢帧格式的所有时间分隔符均为冒号(HH:MM:SS:FF)。

视频源帧速率

隐藏式字幕帧速率

描述

时间码格式

时间码示例

29.97、59.94i

29.97

NTSC 视频

DF

HH:MM:SS;FF

25、50i

29.97

PAL 视频

NDF

HH:MM:SS:FF

24

29.97

影片

NDF

HH:MM:SS:FF

23.976

29.97

NTSC 影片

NDF

HH:MM:SS:FF

  • 对于要以文本形式呈现的对白,字幕应在首句可听见的对白出现后一秒内显示并保持同步。

字幕的时间码是相对于节目的开始,而不是 QuickTime 影片的时间码轨道。

如需制作 EIA-608 隐藏式字幕,请使用 Final Cut Pro 或第三方字幕制作 App 输出 SCC 文本文件。

请注意:

  • 如需在交付视频之前测试隐藏式字幕,请参阅“在 Compressor 中导入和预览字幕”。

  • 如果广播或 Web 交付系统有任何可用的隐藏式字幕数据,则必须提供。

音乐视频字幕描述文件

Apple 接受格式为 iTunes 时序文本文件的音乐视频字幕和 SDH 内容。详情请参见《Apple Transactional Film Specification(Apple 付费点播电影技术规范)》中的“iTunes Timed Text Profile(iTunes 时序文本描述文件)”。

  • 交付格式为 iTunes 时序文本(iTT)文件,使用 .itt 文件扩展名。

  • 与通过 <assets> 块关联的视频素材包含在同一数据包中交付。

  • iTT 文稿中只允许有一个 div 元素。

  • timeBase 必须设定为 smpte

  • dropMode 必须设定为 "dropNTSC""nonDrop";iTunes 时序文本不支持 dropPAL

  • fontFamily 中的字体只能指定为 sansSerif

iTT 文件格式是时序文本标记语言(TTML)的一个子集,基于第一版万维网联盟(W3C)2013 年 9 月 24 日的推荐标准。所有 iTT 文稿均为使用特定 TTML 子集的 TTML 文稿。

如需制作 iTT 格式的字幕,请使用 Final Cut Pro 或第三方字幕制作 App 输出 iTT 文件。

音乐视频屏幕捕捉图像描述文件

【注】Apple 强烈建议使用 image_time 属性来交付屏幕捕捉的时间码,而非发送素材文件。Apple 将使用时间码指定的帧为你创建图像。有关详细信息,请参见《Apple Music 技术规范》中的“音乐视频单曲元数据注释”。

  • 从已交付视频中直接捕捉的图像(首选在 XML 中为时间码指定 image_time 属性)。

  • 宽高比为 16:9 或 4:3(针对原有视频)。

  • 建议尺寸为 3840 x 2160 像素 - 4K 分辨率。

  • 最小尺寸(小于此尺寸将不予接受):水平像素至少为 1920 垂直像素至少为 1080。

  • .jpg 扩展名的 JPEG 文件(不压缩质量),或带 .png 扩展名的 PNG 文件。

  • RGB 颜色配置文件(屏幕标准)。

  • 仅可包括有效像素区域(不得使用上下黑边、在图像外部使用黑条来满足所需高宽比)。

包含以下任一内容的视频屏幕捕捉将被拒绝:

  • 动作模糊的图像。

  • 低质量或像素化的图像。

  • 面部、手臂、肩膀剪裁生硬。

  • 包含艺人名称或音乐视频标题的文本。

  • 未经授权或未被授予使用权的第三方商标。

  • 无意中闭上的眼睛。

请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。图像必须从视频中直接获取。

重要说明:

  • 请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。

  • CMYK 颜色配置文件图像将不予接受。

  • 图像必须从视频中直接获取。

TTML 文件格式

概述

本章将介绍用于交付专辑曲目歌词的文件格式(不适用于音乐视频曲目)。该文件格式基于 TTML 1.0 版本(https://www.w3.org/TR/ttml1/),并包含一些 Apple 特有做法的扩展。交付的歌词文件必须格式正确且使用 .ttml 扩展名。创建 TTML 文稿并以 .ttml 为扩展名存储后,便可在曲目 <lyrics_file> 块中指定该文件进行交付。

【注】理解此文稿需要对 TTML 有一定了解。

歌词的 TTML 概述

如需为专辑中的歌曲提供歌词,请交付歌词文件。歌词文件使用 TTML 格式,并包含 Apple 特有做法的扩展。每份歌词文件包含一首歌曲的歌词。你可以在 metadata.xml 文件中的每个 <track> 标签中使用 <lyrics_file> 标签指定歌词文件。有关如何交付歌词文件,请参阅基本音乐专辑元数据示例

【注】音乐视频无法交付歌词。

歌词文件可以按行或按节拍来划分歌词。

有关 XML 格式的注释,请参见歌词示例注释

【注】系统支持使用 <lyrics> 标签以纯文本格式发送歌词,但后续将不支持以 HTML 格式发送歌词。

下文简要介绍了歌词的标准 TTML 内容元素。本章节中的 Apple 扩展符号 表示 Apple 特有的做法或建议。

歌词结构

一首歌曲的基本结构依照标准 TTML 内容元素划分。

歌词内容

TTML 元素

使用

歌曲

<body>

<body> 元素块包含用于交付歌词的标签。

段落

<div>

<div> 块用于放置一段(或一行)歌词的所有标签。

Apple 扩展符号 你可以在 <div> 块中使用 itunes:song-part 属性来说明这部分歌词在歌曲结构中的作用,详见歌词的 Apple 扩展

<p>

<p> 标签用于放置歌词中的每一行。

Apple 扩展符号 应使用 <p> 标签来分隔歌词行,请勿使用换行符 <br>

  • <p> 标签中使用 ttm:agent 属性来指明这部分歌词由哪位艺人演唱,详见下文有关演唱者的说明。

  • <p> 标签中添加 beingend 属性来标记每行歌词的时间码,详见下文有关时间码的说明。

字词或短语

<span>

如果在 <p> 标签中有个别字词或短语需要添加特殊说明,请使用 <span> 标签。

  • <span> 标签中添加 ttm:agent 属性来指明这部分字词或短语由哪位艺人演唱,详见下文有关演唱者的说明。

  • <span> 标签中添加 beingend 属性来标记字词或短语的时间码,详见下文有关时间码的说明。

歌词的 Apple 扩展

Apple 扩展符号 歌曲组成部分:为区分歌曲的组成部分,请在 <div> 块中添加 itunes:song-part 属性来标记这部分歌词在歌曲结构中的作用。

示例:<div itunes:song-part="Chorus">

itunes:song-part 属性可以指定为任意值,但 Apple 建议使用以下值:

  • Verse(主歌)

  • Chorus(副歌)

  • PreChorus(预副歌)

  • Bridge(桥段)

  • Intro(前奏)

  • Outro(尾奏)

  • Refrain(叠句)

  • Instrumental(器乐)

【注】歌曲组成部分的标记信息当前不向用户显示。

演唱者

<p><span> 元素中添加 ttm:agent 属性来指明这部分内容由哪位艺人演唱。

时间码

歌词时间码可选择性提供。你可以为歌词标记起始时间,使歌词与歌手实际唱词的时间同步,显示效果类似卡拉 OK。

时间码应使用同步多媒体集成语言(SMIL)表示,可提供完整或部分时钟值:

hh:mm:ss.sss(时:分:秒.毫秒)

其中,小时和毫秒可不提供。

时间码规范

  • 标记时间时,请同时提供 beginend 属性。

  • 必须提供有效的时间码。

  • 在同一个元素中,begin 时间码必须在 end 时间码之前。

  • 子元素的时间码必须包含在母元素的时间码中。

  • 时间码必须在歌曲的持续时间内。

  • <div> 元素的时间码不能有所重合(即使 ttm:agent 属性不相同)。

文本和空格符

系统处理文稿中的空白字符时,遵循 XML 1.0 规范中 §2.10 对空白字符的处理规则。

Apple 扩展符号 Apple 建议严格遵循 xml:space="default" 规则,避免指定 XML 空白字符处理属性。

按行划分歌词的 XML 交付示例

以下示例为按行划分歌词的交付文稿,使用 TTML 格式。

<?xml version="1.0" encoding="UTF-8"?><tt xmlns="http://www.w3.org/ns/ttml" xmlns:tts="http://www.w3.org/ns/ttml#styling" xmlns:itunes="http://itunes.apple.com/lyric-ttml-extensions" xmlns:ttm="http://www.w3.org/ns/ttml#metadata" xml:lang="en-US"> <head> <metadata> <ttm:title>City of Stars</ttm:title> <ttm:agent type="person" xml:id="v1"> <ttm:name type="full">Ryan Gosling</ttm:name> </ttm:agent> <ttm:agent type="person" xml:id="v2"> <ttm:name type="full">Emma Stone</ttm:name> </ttm:agent> <ttm:agent type="group" xml:id="v3"/> </metadata> </head> <body dur="02:29.720"> <div begin="00:09.327" end="00:44.651" itunes:song-part="Verse"> <p begin="00:09.327" end="00:12.109" ttm:agent="v1">City of stars</p> <p begin="00:12.426" end="00:15.906" ttm:agent="v1">Are you shining just for me?</p> <p begin="00:18.972" end="00:21.753" ttm:agent="v1">City of stars</p> <p begin="00:22.024" end="00:25.552" ttm:agent="v1">There's so much that I can't see</p> <p begin="00:28.052" end="00:30.752" ttm:agent="v1">Who knows?</p> <p begin="00:31.373" end="00:37.357" ttm:agent="v1">I felt it from the first embrace I shared with you</p> <p begin="00:37.803" end="00:41.859" ttm:agent="v2">That now our dreams</p> <p begin="00:41.957" end="00:44.651" ttm:agent="v2">May finally come true</p> </div> <div begin="00:48.026" end="01:14.408" itunes:song-part="Verse"> <p begin="00:48.026" end="00:50.585" ttm:agent="v2">City of stars</p> <p begin="00:50.757" end="00:54.257" ttm:agent="v2">Just one thing everybody wants</p> <p begin="00:57.199" end="00:59.753" ttm:agent="v2">There in the bars</p> <p begin="00:59.753" end="01:05.401" ttm:agent="v2">And through the smokescreen of the crowded restaurants</p> <p begin="01:05.637" end="01:11.699" ttm:agent="v2">It's love, yes, all we're looking for is love</p> <p begin="01:11.699" end="01:14.408" ttm:agent="v2">From someone else</p> </div> <div begin="01:15.080" end="01:54.303" itunes:song-part="Chorus"> <p begin="01:15.080" end="01:16.660" ttm:agent="v1">A rush</p> <p begin="01:16.159" end="01:17.555" ttm:agent="v2">A glance</p> <p begin="01:17.304" end="01:18.858" ttm:agent="v1">A touch</p> <p begin="01:18.357" end="01:19.705" ttm:agent="v2">A dance</p> <p begin="01:19.705" end="01:22.873" ttm:agent="v3">Look in somebody's eyes</p> <p begin="01:22.874" end="01:25.029" ttm:agent="v3">To light up the skies</p> <p begin="01:25.030" end="01:28.223" ttm:agent="v3">To open the world and send it reeling</p> <p begin="01:28.324" end="01:34.000" ttm:agent="v3">A voice that says, "I'll be here, and you'll be alright"</p> <p begin="01:37.001" end="01:39.905" ttm:agent="v3">I don't care if I know</p> <p begin="01:40.003" end="01:42.126" ttm:agent="v3">Just where I will go</p> <p begin="01:42.126" end="01:45.302" ttm:agent="v3">'Cause all that I need's this crazy feeling</p> <p begin="01:45.304" end="01:48.958" ttm:agent="v3">A rat, tat, tat on my heart</p> <p begin="01:49.703" end="01:54.303" ttm:agent="v1">Think I want it to stay</p> </div> <div begin="01:55.855" end="02:16.755" itunes:song-part="Outro"> <p begin="01:55.855" end="01:58.807" ttm:agent="v1">City of stars</p> <p begin="01:59.104" end="02:02.506" ttm:agent="v1">Are you shining just for me?</p> <p begin="02:05.936" end="02:08.957" ttm:agent="v1">City of stars</p> <p begin="02:10.380" end="02:16.755" ttm:agent="v2">You never shined so brightly</p> </div> </body></tt>

按节拍划分歌词的 XML 交付示例

以下示例为按节拍划分歌词的交付文稿,使用 TTML 格式。

<?xml version="1.0" encoding="UTF-8"?><tt xmlns="http://www.w3.org/ns/ttml" xmlns:tts="http://www.w3.org/ns/ttml#styling" xmlns:itunes="http://itunes.apple.com/lyric-ttml-extensions" xmlns:ttm="http://www.w3.org/ns/ttml#metadata" xml:lang="en-US"> <head> <metadata> <ttm:title>Dancing With A Stranger</ttm:title> <ttm:agent type="person" xml:id="v1"> <ttm:name type="full">Sam Smith</ttm:name> </ttm:agent> <ttm:agent type="person" xml:id="v2"> <ttm:name type="full">Normani</ttm:name> </ttm:agent> <ttm:agent type="group" xml:id="v3"/> </metadata> </head> <body dur="02:51.030"> <div begin="00:07.621" end="00:45.268" itunes:song-part="Verse"> <p begin="00:07.621" end="00:10.267" ttm:agent="v1"> <span begin="00:07.621" end="00:07.920">I</span> <span begin="00:07.920" end="00:08.253">don't</span> <span begin="00:08.253" end="00:08.739">wanna</span> <span begin="00:08.739" end="00:09.103">be</span> <span begin="00:09.103" end="00:09.655">alone</span> <span begin="00:09.655" end="00:10.267">tonight</span> </p> <p begin="00:10.961" end="00:15.046" ttm:agent="v1"> <span begin="00:10.961" end="00:12.244">It's</span> <span begin="00:12.244" end="00:12.828">pretty</span> <span begin="00:12.828" end="00:13.177">clear</span> <span begin="00:13.177" end="00:13.462">that</span> <span begin="00:13.462" end="00:13.761">I'm</span> <span begin="00:13.761" end="00:14.046">not</span> <span begin="00:14.046" end="00:14.494">over</span> <span begin="00:14.494" end="00:15.046">you</span> </p> <p begin="00:16.828" end="00:20.471" ttm:agent="v1"> <span begin="00:16.828" end="00:17.210">I'm</span> <span begin="00:17.210" end="00:17.527">still</span> <span begin="00:17.527" end="00:18.127">thinking</span> <span begin="00:18.127" end="00:18.394">'bout</span> <span begin="00:18.394" end="00:18.676">the</span> <span begin="00:18.676" end="00:19.178">things</span> <span begin="00:19.178" end="00:19.594">you</span> <span begin="00:19.594" end="00:20.471">do</span> </p> <p begin="00:21.271" end="00:24.175" ttm:agent="v1"> <span begin="00:21.271" end="00:21.588">So</span> <span begin="00:21.588" end="00:21.859">I</span> <span begin="00:21.859" end="00:22.188">don't</span> <span begin="00:22.188" end="00:22.722">wanna</span> <span begin="00:22.722" end="00:23.055">be</span> <span begin="00:23.055" end="00:23.620">alone</span> <span begin="00:23.620" end="00:24.175">tonight</span> </p> <p begin="00:24.289" end="00:26.656" ttm:agent="v1"> <span begin="00:24.289" end="00:24.705">Alone</span> <span begin="00:24.705" end="00:25.321">tonight,</span> <span begin="00:25.471" end="00:25.905">alone</span> <span begin="00:25.905" end="00:26.656">tonight</span> </p> <p begin="00:27.320" end="00:29.237" ttm:agent="v1"> <span begin="00:27.320" end="00:27.686">Can</span> <span begin="00:27.686" end="00:28.003">you</span> <span begin="00:28.003" end="00:28.304">light</span> <span begin="00:28.304" end="00:28.486">the</span> <span begin="00:28.486" end="00:29.237">fire?</span> </p> <p begin="00:30.545" end="00:34.297" ttm:agent="v1"> <span begin="00:30.545" end="00:30.894">I</span> <span begin="00:30.894" end="00:31.211">need</span> <span begin="00:31.211" end="00:32.078">somebody</span> <span begin="00:32.078" end="00:32.361">who</span> <span begin="00:32.361" end="00:32.662">can</span> <span begin="00:32.662" end="00:32.995">take</span> <span begin="00:32.995" end="00:34.297">control</span> </p> <p begin="00:35.177" end="00:39.449" ttm:agent="v1"> <span begin="00:35.177" end="00:35.529">I</span> <span begin="00:35.529" end="00:35.878">know</span> <span begin="00:35.878" end="00:36.761">exactly</span> <span begin="00:36.761" end="00:37.028">what</span> <span begin="00:37.028" end="00:37.326">I</span> <span begin="00:37.326" end="00:37.678">need</span> <span begin="00:37.678" end="00:38.177">to</span> <span begin="00:38.177" end="00:39.449">do</span> </p> <p begin="00:39.868" end="00:42.815" ttm:agent="v1"> <span begin="00:39.868" end="00:40.217">'Cause</span> <span begin="00:40.217" end="00:40.516">I</span> <span begin="00:40.516" end="00:40.833">don't</span> <span begin="00:40.833" end="00:41.401">wanna</span> <span begin="00:41.401" end="00:41.684">be</span> <span begin="00:41.684" end="00:42.268">alone</span> <span begin="00:42.268" end="00:42.815">tonight</span> </p> <p begin="00:42.935" end="00:45.268" ttm:agent="v1"> <span begin="00:42.935" end="00:43.401">Alone</span> <span begin="00:43.401" end="00:43.961">tonight,</span> <span begin="00:44.142" end="00:44.625">alone</span> <span begin="00:44.625" end="00:45.268">tonight</span> </p> </div> <div begin="00:46.537" end="01:10.357" itunes:song-part="Chorus"> <p begin="00:46.537" end="00:49.038" ttm:agent="v1"> <span begin="00:46.537" end="00:47.238">Look</span> <span begin="00:47.238" end="00:47.537">what</span> <span begin="00:47.537" end="00:47.820">you</span> <span begin="00:47.820" end="00:48.121">made</span> <span begin="00:48.121" end="00:48.406">me</span> <span begin="00:48.406" end="00:49.038">do</span> </p> <p begin="00:49.214" end="00:51.121" ttm:agent="v1"> <span begin="00:49.214" end="00:49.529">I'm</span> <span begin="00:49.529" end="00:49.846">with</span> <span begin="00:49.846" end="00:50.745">somebody</span> <span begin="00:50.745" end="00:51.121">new</span> </p> <p begin="00:51.228" end="00:55.675" ttm:agent="v1"> <span begin="00:51.228" end="00:51.879">Ooh,</span> <span begin="00:51.879" end="00:52.463">baby,</span> <span begin="00:52.463" end="00:53.012">baby,</span> <span begin="00:53.012" end="00:53.345">I'm</span> <span begin="00:53.345" end="00:54.180">dancing</span> <span begin="00:54.180" end="00:54.513">with</span> <span begin="00:54.513" end="00:54.831">a</span> <span begin="00:54.831" end="00:55.675">stranger</span> </p> <p begin="00:55.921" end="00:58.332" ttm:agent="v1"> <span begin="00:55.921" end="00:56.521">Look</span> <span begin="00:56.521" end="00:56.820">what</span> <span begin="00:56.820" end="00:57.153">you</span> <span begin="00:57.153" end="00:57.487">made</span> <span begin="00:57.487" end="00:57.769">me</span> <span begin="00:57.769" end="00:58.332">do</span> </p> <p begin="00:58.524" end="01:00.468" ttm:agent="v1"> <span begin="00:58.524" end="00:58.876">I'm</span> <span begin="00:58.876" end="00:59.209">with</span> <span begin="00:59.209" end="01:00.041">somebody</span> <span begin="01:00.041" end="01:00.468">new</span> </p> <p begin="01:00.572" end="01:05.714" ttm:agent="v1"> <span begin="01:00.572" end="01:01.153">Ooh,</span> <span begin="01:01.153" end="01:01.788">baby,</span> <span begin="01:01.788" end="01:02.321">baby,</span> <span begin="01:02.321" end="01:02.639">I'm</span> <span begin="01:02.639" end="01:03.505">dancing</span> <span begin="01:03.505" end="01:03.823">with</span> <span begin="01:03.823" end="01:04.137">a</span> <span begin="01:04.137" end="01:04.763">strang</span> <span begin="01:04.763" end="01:05.714">er</span> </p> <p begin="01:07.255" end="01:10.357" ttm:agent="v1"> <span begin="01:07.255" end="01:08.186">Dancing</span> <span begin="01:08.186" end="01:08.471">with</span> <span begin="01:08.471" end="01:08.805">a</span> <span begin="01:08.805" end="01:09.410">strang</span> <span begin="01:09.410" end="01:10.357">er</span> </p> </div> <div begin="01:12.395" end="01:31.914" itunes:song-part="Verse"> <p begin="01:12.395" end="01:15.728" ttm:agent="v2"> <span begin="01:12.395" end="01:12.795">I</span> <span begin="01:12.795" end="01:13.328">wasn't</span> <span begin="01:13.328" end="01:13.960">even</span> <span begin="01:13.960" end="01:14.576">going</span> <span begin="01:14.576" end="01:14.867">out</span> <span begin="01:14.867" end="01:15.728">tonight</span> </p> <p begin="01:17.141" end="01:20.976" ttm:agent="v2"> <span begin="01:17.141" end="01:17.491">But</span> <span begin="01:17.491" end="01:17.808">boy,</span> <span begin="01:17.808" end="01:18.141">I</span> <span begin="01:18.141" end="01:18.408">need</span> <span begin="01:18.408" end="01:18.691">to</span> <span begin="01:18.691" end="01:18.976">get</span> <span begin="01:18.976" end="01:19.259">you</span> <span begin="01:19.259" end="01:19.607">off</span> <span begin="01:19.607" end="01:19.887">of</span> <span begin="01:19.887" end="01:20.257">my</span> <span begin="01:20.257" end="01:20.976">mind</span> </p> <p begin="01:21.843" end="01:25.984" ttm:agent="v2"> <span begin="01:21.843" end="01:22.158">I</span> <span begin="01:22.158" end="01:22.443">know</span> <span begin="01:22.443" end="01:23.360">exactly</span> <span begin="01:23.360" end="01:23.643">what</span> <span begin="01:23.643" end="01:23.926">I</span> <span begin="01:23.926" end="01:24.344">have</span> <span begin="01:24.344" end="01:24.774">to</span> <span begin="01:24.774" end="01:25.984">do</span> </p> <p begin="01:26.678" end="01:29.484" ttm:agent="v2"> <span begin="01:26.678" end="01:27.062">I</span> <span begin="01:27.062" end="01:27.395">don't</span> <span begin="01:27.395" end="01:27.929">wanna</span> <span begin="01:27.929" end="01:28.262">be</span> <span begin="01:28.262" end="01:28.862">alone</span> <span begin="01:28.862" end="01:29.484">tonight</span> </p> <p begin="01:29.628" end="01:31.914" ttm:agent="v2"> <span begin="01:29.628" end="01:30.060">Alone</span> <span begin="01:30.060" end="01:30.575">tonight,</span> <span begin="01:30.746" end="01:31.212">alone</span> <span begin="01:31.212" end="01:31.914">tonight</span> </p> </div> <div begin="01:33.183" end="02:06.889" itunes:song-part="Chorus"> <p begin="01:33.183" end="01:35.516" ttm:agent="v2"> <span begin="01:33.183" end="01:33.799">Look</span> <span begin="01:33.799" end="01:34.116">what</span> <span begin="01:34.116" end="01:34.434">you</span> <span begin="01:34.434" end="01:34.767">made</span> <span begin="01:34.767" end="01:35.050">me</span> <span begin="01:35.050" end="01:35.516">do</span> </p> <p begin="01:35.841" end="01:37.660" ttm:agent="v2"> <span begin="01:35.841" end="01:36.174">I'm</span> <span begin="01:36.174" end="01:36.457">with</span> <span begin="01:36.457" end="01:37.324">somebody</span> <span begin="01:37.324" end="01:37.660">new</span> </p> <p begin="01:37.921" end="01:42.396" ttm:agent="v2"> <span begin="01:37.921" end="01:38.454">Oh,</span> <span begin="01:38.454" end="01:39.054">baby,</span> <span begin="01:39.054" end="01:39.604">baby,</span> <span begin="01:39.604" end="01:39.905">I'm</span> <span begin="01:39.905" end="01:40.804">dancing</span> <span begin="01:40.804" end="01:41.121">with</span> <span begin="01:41.121" end="01:41.406">a</span> <span begin="01:41.406" end="01:42.396">stranger</span> </p> <p begin="01:42.543" end="01:44.887" ttm:agent="v2"> <span begin="01:42.543" end="01:43.111">Look</span> <span begin="01:43.111" end="01:43.410">what</span> <span begin="01:43.410" end="01:43.746">you</span> <span begin="01:43.746" end="01:44.044">made</span> <span begin="01:44.044" end="01:44.343">me</span> <span begin="01:44.343" end="01:44.887">do</span> </p> <p begin="01:45.154" end="01:46.957" ttm:agent="v2"> <span begin="01:45.154" end="01:45.453">I'm</span> <span begin="01:45.453" end="01:45.754">with</span> <span begin="01:45.754" end="01:46.671">somebody</span> <span begin="01:46.671" end="01:46.957">new</span> </p> <p begin="01:47.178" end="01:51.922" ttm:agent="v2"> <span begin="01:47.178" end="01:47.778">Oh,</span> <span begin="01:47.778" end="01:48.362">baby,</span> <span begin="01:48.362" end="01:48.911">baby,</span> <span begin="01:48.911" end="01:49.245">I'm</span> <span begin="01:49.245" end="01:50.111">dancing</span> <span begin="01:50.111" end="01:50.445">with</span> <span begin="01:50.445" end="01:50.746">a</span> <span begin="01:50.746" end="01:51.922">stranger</span> </p> <p begin="01:53.860" end="01:57.321" ttm:agent="v3"> <span begin="01:53.860" end="01:54.727">Dancing</span> <span begin="01:54.727" end="01:55.092">with</span> <span begin="01:55.092" end="01:55.393">a</span> <span begin="01:55.393" end="01:56.106">strang</span> <span begin="01:56.106" end="01:57.321">er</span> </p> <p begin="01:58.560" end="02:01.904" ttm:agent="v3"> <span begin="01:58.560" end="01:59.424">Dancing</span> <span begin="01:59.424" end="01:59.757">with</span> <span begin="01:59.757" end="02:00.074">a</span> <span begin="02:00.074" end="02:00.823">strang</span> <span begin="02:00.823" end="02:01.904">er</span> </p> <p begin="02:03.210" end="02:05.197" ttm:agent="v1"> <span begin="02:03.210" end="02:04.461">Dancing,</span> <span begin="02:04.461" end="02:05.197">yeah</span> </p> <p begin="02:04.801" end="02:06.889" ttm:agent="v2"> <span begin="02:04.801" end="02:05.741">Ooh,</span> <span begin="02:05.741" end="02:06.440">ooh-</span> <span begin="02:06.440" end="02:06.889">yeah</span> </p> </div> <div begin="02:10.453" end="02:29.249" itunes:song-part="Outro"> <p begin="02:10.453" end="02:12.827" ttm:agent="v1"> <span begin="02:10.453" end="02:11.103">Look</span> <span begin="02:11.103" end="02:11.437">what</span> <span begin="02:11.437" end="02:11.738">you</span> <span begin="02:11.738" end="02:12.071">made</span> <span begin="02:12.071" end="02:12.370">me</span> <span begin="02:12.370" end="02:12.827">do</span> </p> <p begin="02:13.187" end="02:15.036" ttm:agent="v1"> <span begin="02:13.187" end="02:13.520">I'm</span> <span begin="02:13.520" end="02:13.822">with</span> <span begin="02:13.822" end="02:14.720">somebody</span> <span begin="02:14.720" end="02:15.036">new</span> </p> <p begin="02:15.179" end="02:19.646" ttm:agent="v1"> <span begin="02:15.179" end="02:15.830">Ooh,</span> <span begin="02:15.830" end="02:16.395">baby,</span> <span begin="02:16.395" end="02:16.896">baby,</span> <span begin="02:16.896" end="02:17.246">I'm</span> <span begin="02:17.246" end="02:18.080">dancing</span> <span begin="02:18.080" end="02:18.395">with</span> <span begin="02:18.395" end="02:18.712">a</span> <span begin="02:18.712" end="02:19.646">stranger</span> </p> <p begin="02:19.835" end="02:22.136" ttm:agent="v3"> <span begin="02:19.835" end="02:20.417">Look</span> <span begin="02:20.417" end="02:20.753">what</span> <span begin="02:20.753" end="02:21.051">you</span> <span begin="02:21.051" end="02:21.369">made</span> <span begin="02:21.369" end="02:21.683">me</span> <span begin="02:21.683" end="02:22.136">do</span> </p> <p begin="02:22.497" end="02:24.374" ttm:agent="v3"> <span begin="02:22.497" end="02:22.798">I'm</span> <span begin="02:22.798" end="02:23.065">with</span> <span begin="02:23.065" end="02:23.982">somebody</span> <span begin="02:23.982" end="02:24.374">new</span> </p> <p begin="02:24.510" end="02:29.249" ttm:agent="v3"> <span begin="02:24.510" end="02:25.059">Ooh,</span> <span begin="02:25.059" end="02:25.710">baby,</span> <span begin="02:25.710" end="02:26.209">baby,</span> <span begin="02:26.209" end="02:26.542">I'm</span> <span begin="02:26.542" end="02:27.411">dancing</span> <span begin="02:27.411" end="02:27.745">with</span> <span begin="02:27.745" end="02:28.043">a</span> <span begin="02:28.043" end="02:29.249">stranger</span> </p> </div> <div begin="02:29.648" end="02:48.133" itunes:song-part="Outro"> <p begin="02:29.648" end="02:32.602" ttm:agent="v3"> <span begin="02:29.648" end="02:30.000">I'm</span> <span begin="02:30.000" end="02:30.917">dancing,</span> <span begin="02:30.917" end="02:31.232">I'm</span> <span begin="02:31.232" end="02:32.602">dancing</span> </p> <p begin="02:34.324" end="02:39.579" ttm:agent="v1"> <span ttm:role="x-bg"> <span begin="02:34.324" end="02:34.690">(I'm</span> <span begin="02:34.690" end="02:35.572">dancing,</span> <span begin="02:35.572" end="02:35.874">I'm</span> <span begin="02:35.874" end="02:37.266">dancing)</span> </span> <span begin="02:35.747" end="02:36.677">Dancing</span> <span begin="02:36.677" end="02:37.027">with</span> <span begin="02:37.027" end="02:37.344">a</span> <span begin="02:37.344" end="02:38.253">strang</span> <span begin="02:38.253" end="02:39.579">er</span> </p> <p begin="02:38.994" end="02:43.927" ttm:agent="v1"> <span ttm:role="x-bg"> <span begin="02:38.994" end="02:39.413">(I'm</span> <span begin="02:39.413" end="02:40.178">dancing,</span> <span begin="02:40.178" end="02:40.562">I'm</span> <span begin="02:40.562" end="02:41.978">dancing)</span> </span> <span begin="02:40.407" end="02:41.325">Dancing</span> <span begin="02:41.325" end="02:41.671">with</span> <span begin="02:41.671" end="02:41.941">a</span> <span begin="02:41.941" end="02:42.860">strang</span> <span begin="02:42.860" end="02:43.927">er</span> </p> <p begin="02:43.690" end="02:48.133" ttm:agent="v2"> <span ttm:role="x-bg"> <span begin="02:43.690" end="02:44.039">(I'm</span> <span begin="02:44.039" end="02:44.874">dancing,</span> <span begin="02:44.874" end="02:45.191">I'm</span> <span begin="02:45.191" end="02:46.495">dancing)</span> </span> <span begin="02:45.163" end="02:46.061">Dancing</span> <span begin="02:46.061" end="02:46.411">with</span> <span begin="02:46.411" end="02:46.747">a</span> <span begin="02:46.747" end="02:47.558">strang</span> <span begin="02:47.558" end="02:48.133">er</span> </p> </div> </body></tt>

歌词示例注释

注释中带有符号 Apple 扩展符号 的部分为 Apple 特有的做法或建议。

参考编号(如 §7.2.2)表示 TTML 规范中对此元素进行讲解的章节。

<?xml version="1.0" encoding="UTF-8"?>

XML 声明必填

必须定义文稿的字符编码。

Apple 仅接受 UTF-8 编码,因为这种编码可以对非罗马字符进行高效编码。

【重要说明】TTML 文件中不得包含字节顺序标记(BOM)。

<tt xmlns="http://www.w3.org/ns/ttml"

  xmlns:tts="http://www.w3.org/ns/ttml#styling"

  xmlns:itunes="http://itunes.apple.com/lyric-ttml-extensions"

  xmlns:ttm="http://www.w3.org/ns/ttml#metadata"

文稿容器 §7.1.1必填

iTunes 定时文本(iTT)文稿容器以 tt 元素开始。

xmlns(表示 XML 命名空间)属性为必填项,且 Schema 验证需要该属性。它用于声明 XML 中标签应遵循的命名空间(以及关联的 Schema)。命名空间必须为 http://www.w3.org/ns/ttml

Apple 扩展符号 使用 Apple 扩展需要指定 XML 命名空间:http://itunes.apple.com/lyric-ttml-extensions。请注意,此示例使用了前缀 itunes(在前缀 xmlns:itunes 中),但不强制要求使用 itunes,你可以使用任何前缀。

xml:lang="en-US">

语言 §7.2.2必填

这与语言代码中的 locale 属性所用的格式相同,且指示了歌词中所使用的语言和可选方言。

Head 元素

<head>

标头 §7.1.2必填

Head 元素的开始,指定了文稿元数据(例如,标题)和其他文稿特定信息(例如,表演艺人)。

【注】Apple 扩展符号 Apple 在处理过程中会忽略 Head 元素内包含的所有样式和布局元素。

<metadata>

元数据 §8.1.1必填

元数据块的开始。

  <ttm:title>City of Stars</ttm:title>

标题 §12.1.2必填

提供你要交付歌词的歌曲名称。

<ttm:agent type="person" xml:id="v1">

演唱者 §12.1.5可选

ttm:agent 元素用于指定所有演唱歌词的艺人。在 TTML 文稿中提供歌词时,你可以在 xml:id 属性中提供相应的值来指明演唱某部分歌词的艺人。如需了解如何使用 ttm:agentxml:id 属性,请参见 <p><span> 元素的注释。

例如,如果歌词文件中列出了多位演唱艺人,系统会启用 Apple Music Duet(二重唱)功能,将不同演唱者的歌词分别显示在屏幕的两侧。

ttm:agent 元素中包括 typexml:id 属性。

type 属性用于指定演唱者的类型:

  • "person" 表示个人独唱

  • "group" 表示多人合唱

  • "other" 表示其他情况

xml:id 属性用于提供艺人的参考 ID。

Apple 扩展符号 ttm:agent 属性只能用于层次结构中的单个元素。例如,如果你在母元素(div)中指定了 ttm:agent,则不能在子元素(p)中指定 ttm:agent

<ttm:name type="full">Ryan Gosling</ttm:name>

名称 §12.1.6可选

ttm:name 属性用于提供演唱者的名称和名称类型。

type 属性必须提供,且值必须为 "full"

</ttm:agent>

ttm:agent 块到此结束。

</metadata>

metadata 块到此结束。

Body 元素

<body dur="02:29.720">

正文 §7.1.3必填

Body 元素的开始,用于确定歌词及其时间码。必须指定 <body> 元素,但 dur 属性为可选项。

<div begin="00:09.327" end="00:44.651" itunes:song-part="Verse">

段落 §7.1.4必填

从这里开始输入歌词文本和对应的时间码。

一个 <div> 元素代表一个歌词段落。同一份歌词文稿内可以包含多个连续的 <div> 元素。

Apple 扩展符号 由于歌词段落是通过 <div> 标签来标记的,因此请勿使用 <p></br></p> 来表示空行。

Apple 扩展符号 你可以选择在 <div> 元素中添加 itunes:song-part 属性,用于标记这部分歌词在歌曲结构中的作用。Apple 推荐使用以下值:

  • Verse(主歌)

  • Chorus(副歌)

  • PreChorus(预副歌)

  • Bridge(桥段)

  • Intro(前奏)

  • Outro(尾奏)

  • Refrain(叠句)

  • Instrumental(器乐)

注解示例中的 div 块包含以下段落标签(<p>)。下文会对示例段落进行详细解释。

【注】歌曲组成部分的标记信息当前不向用户显示。

按行划分歌词的时间码示例

<p begin="00:09.327" end="00:12.109" ttm:agent="v1">City of stars</p>

<p begin="00:12.426" end="00:15.906" ttm:agent="v1">Are you shining just for me?</p>

<p begin="00:18.972" end="00:21.753" ttm:agent="v1">City of stars</p>

<p begin="00:22.024" end="00:25.552" ttm:agent="v1">There's so much that I can't see</p>

<p begin="00:28.052" end="00:30.752" ttm:agent="v1">Who knows?</p>

<p begin="00:31.373" end="00:37.357" ttm:agent="v1">I felt it from the first embrace I shared with you</p>

<p begin="00:37.803" end="00:41.859" ttm:agent="v2">That now our dreams</p>

<p begin="00:41.957" end="00:44.651" ttm:agent="v2">May finally come true</p>

示例段落 §7.1.5

每个 <p> 元素定义了每一行歌词演唱的时间段。

时间码可选):

对于按行划分的歌词,你可以在 <p> 标签中添加时间属性(beginend)。

  • begin 属性用于标记该行歌词的起始时间。

  • end 属性用于标记该行歌词的结束时间。

有关时间值的详细信息和规则,请参见时间码

演唱者:

如果歌词由不同艺人演唱,则可以使用 ttm:agent 属性来指明演唱某句歌词的艺人。你可以使用参考 ID(xml:id)来指代艺人,该 ID 由你在 Head 元素内的演唱者元素(ttm:agent)中指定,具体请参见前文注释。使用演唱者属性时,请遵循以下规范:

  • 如果演唱者不同,元素的时间码可以有所重合。

  • 同一位演唱者的时间码不得有任何重合。

按节拍划分歌词的时间码示例

<p begin="02:38.994" end="02:43.927" ttm:agent="v1">

<span ttm:role="x-bg">

<span begin="02:38.994" end="02:39.413">(I'm</span>

<span begin="02:39.413" end="02:40.178">dancing,</span>

<span begin="02:40.178" end="02:40.562">I'm</span>

<span begin="02:40.562" end="02:41.978">dancing)</span>

</span>

<span begin="02:40.407" end="02:41.325">Dancing</span>

<span begin="02:41.325" end="02:41.671">with</span>

<span begin="02:41.671" end="02:41.941">a</span>

<span begin="02:41.941" end="02:42.860">strang</span>

<span begin="02:42.860" end="02:43.927">er</span>

</p>

<p begin="02:43.690" end="02:48.133" ttm:agent="v2">

<span ttm:role="x-bg">

<span begin="02:43.690" end="02:44.039">(I'm</span>

<span begin="02:44.039" end="02:44.874">dancing,</span>

<span begin="02:44.874" end="02:45.191">I'm</span>

<span begin="02:45.191" end="02:46.495">dancing)</span>

</span>

<span begin="02:45.163" end="02:46.061">Dancing</span>

<span begin="02:46.061" end="02:46.411">with</span>

<span begin="02:46.411" end="02:46.747">a</span>

<span begin="02:46.747" end="02:47.558">strang</span>

<span begin="02:47.558" end="02:48.133">er</span>

</p>

段落 §7.1.5

每个 <p> 元素定义了每一行歌词演唱的时间段。

字词 §7.1.6

在按节拍划分的歌词中,请使用 <span> 元素来指定每拍的时间码,以及插入背景人声。

时间码按节拍划分的歌词必填):

<p> 标签中使用 <span> 元素来标记歌词的时间码。如需按节拍划分整份歌词,请在所有歌词行(<p> 标签)中提供带有时间码属性的 <span> 元素。

  • begin 属性表示 <span> 元素的起始时间。

  • end 属性表示 <span> 元素的结束时间。

单词断开的情况不要求使用 <span> 元素。

角色 §12.2.2

可以在 <span> 元素中使用 ttm:role="x-bg" 属性来插入背景人声。

<span ttm:role="x-bg"> 标签应放在 <p> 标签的开头或末尾。

  • 如果背景人声出现在主唱人声之前,请将 <span ttm:role="x-bg"> 标签放在主唱人声的 <span> 标签之前。

  • 否则,请将 <span ttm:role="x-bg"> 标签放在 <p> 标签的末尾。

  </div>

 </body>

</tt>

电视内容描述文件

ProRes 文件要求

【重要说明】所有 ProRes 文件都必须包含有效的整数以定义场处理方式。Apple 仅接受以下对值(在 ProRes 头部信息中显示为“fiel”):

  • field count = 1 , field ordering = 0

  • field count = 2 , field ordering = 1

  • field count = 2 , field ordering = 6

  • field count = 2 , field ordering = 9

  • field count = 2 , field ordering = 14

field count 是 Atom Inspector 中的“fields”值,用于 fiel 原子标签。field ordering 是 Atom Inspector 中的“detail”值,用于 fiel 原子标签。

高清电视节目源描述文件

  • Apple ProRes 422(HQ)或 4444 或 4444(XQ)。

  • ITU-R BT.709 色彩空间,文件正确标记为 709。

  • VBR 预计为 88-220 Mbps。

  • 接受高清编码尺寸,以支持方形像素宽高比(PASP):

已编码

PASP

转换至 ProRes 的源格式

1920 x 1080

1:1

HDCAM SR、D5、ATSC

1280 x 720

1:1

ATSC 逐行

  • 接受的高清编码尺寸,以支持非方形像素宽高比(由此,你可以按最佳原始片源的原生尺寸发送高清视频,例如按高清广播尺寸发送*):

已编码

PASP

转换至 ProRes 的源格式

1440 x 1080

1:1.33333

XDCAM-HD、HDCAM

1280 x 1080

1:1.5

DVCProHD 隔行

960 x 720

1:1.33333

DVCProHD 逐行

* 如果原始高清源像素宽高比不是正方形,请在交付前联系你的技术顾问。

  • 支持 23.976、24、25、29.97 帧速率。

  • 原始片源的原生帧速率: 

    • 29.97 隔行帧/秒的视频源可使用隔行方式交付,也可使用去隔行方式交付(即标记为逐行)。

    • 23.976、24 和 25 fps 必须以逐行方式交付。

    • 必须正确标记优先场(上场优先、下场优先或逐行)。

    • 不得为了实现电视广播帧速率而复制或消除场和帧(例如,胶转磁、NTSC 至 PAL 转换)。

    • 对于混合帧速率素材,请联系你的技术顾问。

  • 隔行内容必须正确标记为隔行,且必须在 QuickTime 容器中定义 field ordering。

  • 当内容由于上下黑边、左右黑边或四周黑边而产生无效像素,应在元数据中提供剪裁尺寸。请参考《Apple Transactional TV Specification(Apple 付费点播电视节目技术规范)》中的“Basic TV Episode Metadata Example(基本电视单集元数据示例)”以了解更多信息。

  • 从标清插值而成的内容将被拒绝。

4K 电视节目源描述文件

  • 尺寸应为 3840 x 2160(UHD)或 4096 x 2160(DCI 4K)。你可以选择为 DCI 4K 素材提供剪裁尺寸(Apple 强烈建议提供)。

  • Apple ProRes 422 HQ 或 4444 或 4444 XQ。

  • 预期 VBR 针对 422 HQ 为大约 880 Mbps,针对 4444 为大约 1320 Mbps,针对 4444 XQ 为大约 2000 Mbps。

  • 内容应使用 ITU-R BT.709 色彩空间编码。详情请参见 https://www.itu.int/rec/R-REC-BT.709/en

  • 内容应以源的原始帧速率传送。

  • 4K 源必须逐行扫描,可以以 23.976、24、25、29.97 或 30 fps 交付。

  • 如果交付的 4K 源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

  • 所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。

标清电视节目源描述文件

NTSC

Apple ProRes:

  • 应为 Apple ProRes 422(HQ)。

  • VBR 预计为 40-60 Mbps。

  • 720 x 480 或 720 x 486 编码像素;16:9 内容以 853 x 480 显示或 4:3 内容以 640 x 480 显示。对于正确制作的 720 x 486 内容,其顶部会至少有 4 个黑色像素,底部至少有 2 个。顶部和底部的剪裁值必须总共至少 6 个像素。

  • 所有编码内容必须包含像素宽高比(pasp),该像素宽高比最好能使显示宽高比达到 4:3 或 16:9。

  • 原始源的原生帧速率:

    • 29.97 fps 视频源可以隔行方式交付。

    • 24 fps 必须以逐行方式交付。

    • 23.976 fps 的磁转胶素材必须以逐行方式交付;不得以隔行方式交付,否则将无法交付。

    • 不接受胶转磁素材。

  • 当内容由于上下黑边、左右黑边或四周黑边而产生无效像素,应在元数据中提供剪裁尺寸。请参考《Apple Transactional TV Specification(Apple 付费点播电视节目技术规范)》中的“Basic TV Episode Metadata Example(基本电视单集元数据示例)”以了解更多信息。

  • 4:3 标清视频不得以带黑边的变形 16:9 格式交付。

MPEG-2:

  • MPEG-2 程序流主描述文件。

  • 4:2:0 色度采样。

  • ITU-R BT.601 色彩空间。

  • 至少 15 Mbps。

  • 使用 Long GOP。

  • 水平尺寸固定为 640。

  • 根据源的宽高比,垂直尺寸大小可变,最大尺寸为 480。

  • 方形像素宽高比(1:1)。

  • 原始源的原生帧速率:

    • 29.97 隔行帧/秒的视频源可使用隔行方式交付,也可使用去隔行方式交付(即标记为逐行)。

    • 24 fps 必须以逐行方式交付。

    • 23.976 fps 的磁转胶素材必须以逐行方式交付;不得以隔行方式交付,否则将无法交付。

    • 必须正确标记优先场(上场优先、下场优先或逐行)。

    • 不得为了实现电视广播帧速率而复制或消除场和帧(例如,胶转磁、NTSC 至 PAL 转换)。

    • 对于混合帧速率素材,请联系你的技术顾问。

  • 隔行内容必须标记为非逐行且必须在流媒体中定义 field ordering。

  • 剪裁无效像素并保留场。所有边缘要在视频时长的 90% 以上时间内为有效像素。

  • 交付的内容不得包含上下黑边、左右黑边或四周黑边。

PAL

Apple ProRes:

  • 应为 Apple ProRes 422(HQ)。

  • VBR 预计为 40-60 Mbps。

  • 720 x 576 编码像素;16:9 内容以 1024 x 576 显示或 4:3 内容以 768 x 576 显示。

  • 所有编码内容必须包含像素宽高比(pasp),该像素宽高比最好能使显示宽高比达到 4:3 或 16:9。

  • 原始源的原生帧速率:

    • 25 fps 的视频源可以隔行方式或去隔行方式(正确标记为逐行)交付。

    • 不接受胶转磁素材。

  • 当内容由于上下黑边、左右黑边或四周黑边而产生无效像素,应在元数据中提供剪裁尺寸。请参考《Apple Transactional TV Specification(Apple 付费点播电视节目技术规范)》中的“Basic TV Episode Metadata Example(基本电视单集元数据示例)”以了解更多信息。

  • 4:3 标清视频不得以带黑边的变形 16:9 格式交付。

MPEG-2:

  • MPEG-2 程序流主描述文件。

  • 4:2:0 色度采样。

  • ITU-R BT.601 色彩空间。

  • 至少 15 Mbps。

  • 使用 Long GOP。

  • 水平尺寸固定为 640。

  • 根据源的宽高比,垂直尺寸大小可变,最大尺寸为 480。

  • 方形像素宽高比(1:1)。

  • 原始源的原生帧速率:

    • 源自视频的素材为 25 隔行帧/秒,必须以去隔行方式(即标记为逐行)交付。

    • 24 和 25 fps 的电影源必须以逐行方式交付。

    • 23.976 fps 的磁转胶素材必须以逐行方式交付;不得以隔行方式交付,否则将无法交付。

    • 必须正确标记优先场(上场优先、下场优先或逐行)。

    • 不接受隔行扫描的素材。

    • 不得为了实现电视广播帧速率而复制或消除场和帧(例如,胶转磁、NTSC 至 PAL 转换)。

    • 对于混合帧速率素材,请联系你的技术顾问。

  • 剪裁无效像素。所有边缘要在视频时长的 90% 以上时间内为有效像素。

  • 交付的内容不得包含上下黑边、左右黑边或四周黑边。

【重要事项】所有视频必须至少以一个黑帧开始和结束。此外,视频只能在编辑列表的最后一个编辑中包含空编辑,否则视频会被拒绝。

电视节目音频源描述文件

MPEG-2 程序流容器

立体声

  • MPEG-1 第 II 层

  • 384 kbps

  • 48 kHz

  • 与已交付的视频包括在同一个文件中

QuickTime 容器

5.1 环绕声

【注】5.1 环绕声的音频曲目声道可以全部为 24 位全部为 16 位。同一音频曲目不能同时使用 16 位声道和 24 位声道。

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期声道为 L、R、C、LFE、Ls、Rs。

立体声

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期杜比定向逻辑声道为 Lt、Rt;预期立体声声道为 L、R。

电视节目音频/视频容器

MPEG-2 程序流容器

  • 所有内容应封装在一个 MPEG-2 程序流文件中交付。

  • 所有 MPEG-2 内容应使用 .mpg 文件扩展名。

  • 音频与视频流必须先合成再交付。

QuickTime 容器

  • 所有内容应封装在一个 QuickTime .mov 文件中交付。

  • 所有音频和视频内容均须使用 QuickTime .mov 文件扩展名。

  • 对于 5.1 环绕声音频,必须按照下表中的任一方案分配每一个声道。方案一(Option 1)中,一条音轨包含所有六个声道,声道分配顺序有以下四种:Option 1a、1b、1c 和 1d。请注意,“Lt”和“Rt”仅用于杜比矩阵立体声。

音频声道分配表
  • 在列出的所有方案中,所有立体声音轨的声道分配可以使用 L 和 R 表示,也可以使用 Lt 和 Rt 表示,但请勿混合使用(例如 L 和 Rt,或 R 和 Lt)。

【重要事项】请参考音频声道分配,了解标签描述以及如何进行音频声道分配。

电视节目隐藏式字幕描述文件

【注】隐藏式字幕可与 ProRes 和 MPEG-2 文件一并发送。

  • 文本应为 EIA-608 格式。

  • 与关联的视频包含在同一数据包中交付。

  • 在 Scenarist SCC 格式文件中,请使用 .scc 文件扩展名。

  • 时间码帧速率只能是 29.97,此帧速率与你的视频源帧速率无关。但是,时间码格式必须匹配视频源的时间码格式,即丢帧(DF)或非丢帧(NDF)。

    • 丢帧格式的前两个时间分隔符是冒号,最后一个时间分隔符是分号(HH:MM:SS;FF)。

    • 非丢帧格式的所有时间分隔符均为冒号(HH:MM:SS:FF)。

视频源帧速率

隐藏式字幕帧速率

描述

时间码格式

时间码示例

29.97、59.94i

29.97

NTSC 视频

DF

HH:MM:SS;FF

25、50i

29.97

PAL 视频

NDF

HH:MM:SS:FF

24

29.97

影片

NDF

HH:MM:SS:FF

23.976

29.97

NTSC 影片

NDF

HH:MM:SS:FF

  • 对于要以文本形式呈现的对白,字幕应在首句可听见的对白出现后一秒内显示并保持同步。

字幕的时间码是相对于节目的开始,而不是 QuickTime 影片的时间码轨道。

如需制作 EIA-608 隐藏式字幕,请使用 Final Cut Pro 或第三方字幕制作 App 输出 SCC 文本文件。

请注意:

  • 如需在交付视频之前测试隐藏式字幕,请参阅“在 Compressor 中导入和预览字幕”。

  • 如果广播或 Web 交付系统有任何可用的隐藏式字幕数据,则必须提供。

电视节目封面图描述文件

1:1 封面图

  • .jpg 扩展名的 JPEG 文件(不压缩质量)、带 .png 扩展名的 PNG 文件或带 .lsr 扩展名的 LSR 文件。

  • 色彩空间应为 RGB(屏幕标准)。

  • LSR 文件:

    • 尺寸至少为 3000 x 3000 像素。

    • 必须最少有两层(最多有五层)。

    • 分层 LSR 文件中的每个图像都必须有唯一名称。

    • 分层 LSR 文件中的每个图像都必须是 PNG 格式。

  • JPG 或 PNG 文件的尺寸至少应为 3000 x 3000 像素。

  • 最低分辨率应为 72 dpi。

  • 宽高比应为 1:1。

  • 不得包含裸露或色情图片素材。

  • 不得包含宣传素材,包括网址(URL)或水印。

请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。

【重要事项】不接受 CMYK(打印标准)图像。

2:3 封面图

  • .jpg 扩展名的 JPEG 文件(不压缩质量)、带 .png 扩展名的 PNG 文件或带 .lsr 扩展名的 LSR 文件。

  • 色彩空间应为 RGB(屏幕标准)。

  • LSR(分层源表示)文件:

    • 尺寸至少为 2000 x 3000 像素。

    • 至少须有两层(最多有五层)。

    • 分层 LSR 文件中的每个图像都必须有唯一名称。

    • 分层 LSR 文件中的每个图像都必须是 PNG 格式。

  • JPG 或 PNG 文件的尺寸至少应为 2000 x 3000 像素。

  • 宽高比应为 2:3。

  • 不得包含裸露或色情图片素材。

  • 不得包含宣传素材,包括网址(URL)或水印。

请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。

【重要事项】不接受 CMYK(打印标准)图像。

Display P3 封面图

  • .png 扩展名的 PNG 文件,或带 .lsr 扩展名的 LSR 文件(必须嵌入 Display P3 颜色配置文件)。

  • 色彩空间为 Display P3。

  • 色彩模式为 RGB。

  • 色彩深度为 16 位/通道。

  • 尺寸为 3000 x 3000 像素。

  • 分辨率最低为 72 dpi。

  • 不得包含裸露或色情图片素材。

  • 不得包含宣传素材,包括网址(URL)或水印。

16:9 封面图

16:9 封面图要求:

  • .jpg 扩展名的 JPEG 文件(不压缩质量)、带 .png 扩展名的 PNG 文件或带 .lsr 扩展名的 LSR 文件。

  • 尺寸至少为 1920 x 1080 像素(建议尺寸为 3840 x 2160 像素)。

  • 宽高比为 1.75d - 1.80d。

  • 不得包含裸露或色情图片素材。

  • 不得包含宣传素材,包括网址(URL)或水印。

电视节目背景图和内容标志

竖版背景图

  • .png 扩展名的 PNG。

  • 尺寸必须为 1680 x 3636 像素。

横版背景图

  • .png 扩展名的 PNG。

  • 尺寸必须为 4320 x 3240 像素。

全彩的内容标志

  • 透明背景且带 .png 扩展名的 PNG 文件。

  • 尺寸必须为 4320 x 1300 像素。

单色的内容标志

  • 透明背景且带 .png 扩展名的 PNG 文件。

  • 尺寸必须为 4320 x 1300 像素。

  • 文本必须为白色。

电视节目内容注意事项

  • 视频素材不应包含推广性质的社交媒体图标、标语或二维码。

  • 在视频主体中不得显示任何水印或徽标。

  • 敬请收看的预告不能出现在视频主体中,仅接受在视频结尾显示。

  • 任何时候都不得在视频中显示评级或通告。

  • 视频开头和结尾可以出现电视网络标识,但显示时间须短于五(5)秒。

  • 不接受商业广告或其他宣传素材,包括网址(URL)。有关更多详情,请联系你的技术顾问。

  • 商用黑帧最长可为 5 秒。

  • 预览必须包含适合普通观众的内容。

  • 预览不得有片头或结尾制作人员名单,且不得以黑帧开始。

  • 对于一整季中的每个单集,其预览都应是唯一的。

  • 预览不得包含任何剧透。

  • 每个视频的开头和结尾都需要有至少 1 个黑帧。

影片内容描述文件

ProRes 文件要求

【重要说明】所有 ProRes 文件都必须包含有效的整数以定义场处理方式。Apple 仅接受以下对值(在 ProRes 头部信息中显示为“fiel”):

  • field count = 1 , field ordering = 0

  • field count = 2 , field ordering = 1

  • field count = 2 , field ordering = 6

  • field count = 2 , field ordering = 9

  • field count = 2 , field ordering = 14

field count 是 Atom Inspector 中的“fields”值,用于 fiel 原子标签。field ordering 是 Atom Inspector 中的“detail”值,用于 fiel 原子标签。

影片高清源描述文件

  • Apple ProRes 422(HQ)或 4444 或 4444(XQ)。

  • ITU-R BT.709 色彩空间,文件正确标记为 709。

  • VBR 预计为大约 220 Mbps。

  • 接受高清编码尺寸,以支持方形像素宽高比(PASP):

已编码

PASP

转换至 ProRes 的源格式

1920 x 1080

1:1

HDCAM SR、D5、ATSC

  • 接受高清编码尺寸,以支持非方形像素宽高比(由此,你可以按最佳原始片源的原生尺寸发送高清视频,例如发送高清广播尺寸的视频*):

已编码

PASP

转换至 ProRes 的源格式

1440 x 1080

1:1.33333

XDCAM-HD、HDCAM

1280 x 1080

1:1.5

DVCProHD 隔行

* 如果原始高清源像素宽高比不是正方形,请在交付前联系你的技术顾问。

  • 原始源的原生帧速率:

    • 29.97 隔行帧/秒的视频源可使用隔行方式交付,也可使用去隔行方式交付(即标记为逐行)。

    • 源自视频的素材为 25 隔行帧/秒。

    • 数字逐行素材或影片源素材为 23.976、24、25 或 30 fps。

  • 交付的内容可带有遮幅:允许上下黑边、左右黑边或四周黑边(元数据包中应包含相应的剪裁值)。

  • 从标清插值而成的内容将被拒绝。

【重要事项】所有视频必须至少以一个黑帧开始和结束。此外,视频只能在编辑列表的最后一个编辑中包含空编辑,否则视频会被拒绝。

影片 HDR 源描述文件

HDR 视频源必须满足以下小节中的最低要求。

针对杜比视界和 HDR10

  • 显示尺寸和 PASP 必须匹配相应的主要视频的显示尺寸和 PASP。

  • HDR 视频源必须逐行扫描,且帧速率统一。

  • HDR 视频源轨道应只包含一个编辑列表条目。

  • 时长必须匹配相应的主视频时长。

  • 帧数必须匹配相应的主视频帧数。

  • 指定 HDR 格式(杜比视界或 HDR10)为源属性。

  • HDR 文件必须包含音频。请参阅《Apple Transactional Film Specification(Apple 付费点播电影技术规范)》,了解音频的不同处理方式,包括忽略音频、使用音频或将音频设为主要音频。

针对杜比视界

  • 单个 Apple ProRes 4444 或 4444 XQ 12 位文件,随附单个杜比视界 CM 元数据文件(支持杜比视界 CM 版本 2.9 和 CM 版本 4.0 附加元数据文件)。

  • 传递函数:SMPTE ST 2084(PQ)。

  • 白点和基色:ITU-R BT.2020 或 D65 P3。

  • 变换矩阵:BT.2020(对于 BT.2020 基色)或 BT.709(对于 D65 P3 基色)。

  • 杜比视界 CM 元数据不应包含任何镜头间隙,镜头中引用的帧应涵盖视频正片中的所有帧。

针对 HDR10

  • 单个 Apple ProRes 4444 或 4444 XQ 12 位文件。

  • 传递函数:SMPTE ST 2084(PQ)。

  • 白点和基色:ITU-R BT.2020 或 D65 P3。

  • 变换矩阵:BT.2020(对于 BT.2020 基色)或 BT.709(对于 D65 P3 基色)。

  • ST 2086 和 MaxCLL/MaxFALL 元数据作为附加源属性提供。

影片 4K 源描述文件

  • 尺寸应为 3840 x 2160(UHD)或 4096 x 2160(DCI 4K)。你可以选择为 DCI 4K 素材提供剪裁尺寸(Apple 强烈建议提供)。

  • Apple ProRes 422 HQ 或 4444 或 4444 XQ。

  • 预期 VBR 针对 422 HQ 为大约 880 Mbps,针对 4444 为大约 1320 Mbps,针对 4444 XQ 为大约 2000 Mbps。

  • 内容应使用 ITU-R BT.709 色彩空间编码。详情请参见 https://www.itu.int/rec/R-REC-BT.709/en

  • 内容应以源的原始帧速率传送。

  • 4K 源必须逐行扫描,可以以 23.976、24、25、29.97 或 30 fps 交付。

  • 如果交付的 4K 源文件不带遮幅,或者不包含无效像素,那么 Apple 建议将所有剪裁尺寸属性设定为“0”(零)。

  • 所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。对于杜比视界格式的 HDR 视频源,附带元数据文件应包含上述黑帧。

影片标清源描述文件

NTSC

  • 应为 Apple ProRes 422(HQ)。

  • VBR 预计为 40-60 Mbps。

  • 720 x 480 或 720 x 486 编码像素;16:9 内容以 853 x 480 显示或 4:3 内容以 640 x 480 显示。对于正确制作的 720 x 486 内容,其顶部会至少有 4 个黑色像素,底部至少有 2 个。顶部和底部的剪裁值必须总共至少 6 个像素。

  • 所有编码内容必须包含像素宽高比(pasp),该像素宽高比最好能使显示宽高比达到 4:3 或 16:9。

  • 原始源的原生帧速率:

    • 29.97 fps 视频源可以以隔行方式交付。

    • 24 fps 必须以逐行方式交付。

    • 23.976 fps 的磁转胶素材必须以逐行方式交付;不得以隔行方式交付,否则将无法交付。

    • 不接受胶转磁素材。

  • 交付的内容可带有遮幅:允许上下黑边、左右黑边或四周黑边。

  • 4:3 标清视频不得以带黑边的变形 16:9 格式交付。例如,剪裁后最小显示必须等于或超过 768 x 576。

PAL

  • 应为 Apple ProRes 422(HQ)。

  • VBR 预计为 40-60 Mbps。

  • 720 x 576 编码像素;16:9 内容以 1024 x 576 显示或 4:3 内容以 768 x 576 显示。

  • 所有编码内容必须包含像素宽高比(pasp),该像素宽高比最好能使显示宽高比达到 4:3 或 16:9。

  • 原始源的原生帧速率:

    • 24 和 25 fps 的电影源必须以逐行方式交付。

    • 23.976 fps 的磁转胶素材必须以逐行方式交付;不得以隔行方式交付,否则将无法交付。

    • 不接受胶转磁素材。

  • 交付的内容可带有遮幅:允许上下黑边、左右黑边或四周黑边。

  • 4:3 标清视频不得以带黑边的变形 16:9 格式交付。例如,剪裁后最小显示必须等于或超过 768 x 576。

【重要事项】所有视频必须至少以一个黑帧开始和结束。此外,以空编辑开始或包含空编辑的视频将被拒绝;只有当空编辑为编辑列表的最后一项时,文件才可以包含空编辑。

立体视频源描述文件

交付立体视频内容时,你需要提交两个视频文件:

  • 左眼视频文件,可选择在单个 QuickTime 容器中加入相关的立体声音轨

  • 无音轨的右眼视频文件

视频文件可以均是标准动态范围(SDR)视频源,也可以均是高动态范围(HDR)视频源,但同一个立体视频内容不能同时交付两种视频源。如果使用 HDR 视频源,HDR 格式类型应为杜比视界。

对于立体 HDR 视频内容,你还可以交付一个立体 HDR 附加映射文件。支持杜比视界 CM 版本 4.0 附加元数据文件。

有关详情,请参阅《Apple Transactional Film Specification(Apple 付费点播电影技术规范)》的“Stereoscopic Video Delivery(立体视频交付)”部分。

视频源支持以下格式。

动态范围

编解码器

编码格式

基色

传递函数

SDR

Apple ProRes

422HQ

ITU-R BT.709-6

ITU-R BT.709-6

HDR

Apple ProRes

4444XQ

ITU-R BT.2020

SMPTE ST-2084

HDR

Apple ProRes

4444XQ

P3-D65

SMPTE ST-2084

影片音频源描述文件

如果影片在其他格式或同类市场中有 5.1 或 7.1 环绕声音频,则除立体声音轨外,你也必须将环绕声音频提供给 Apple。

【注】5.1 和 7.1 环绕声的音频曲目声道可以全部为 24 位全部为 16 位。音频曲目不能是 16 位与 24 位声道的组合。

7.1 环绕声

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期声道为 L、R、C、LFE、Ls、Rs、Rls(或 Lrs)、Rrs。

5.1 环绕声

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期声道为 L、R、C、LFE、Ls、Rs。

立体声

  • LPCM 采用 Big Endian 或 Little Endian,16 位或 24 位,至少 48 kHz。

  • 预期杜比定向逻辑声道为 Lt、Rt;预期立体声声道为 L、R。

杜比全景声音频源描述文件

  • 音频混音必须适合在家庭场景收听,并且在至少配有 7.1.4 扬声器布局的房间内进行监听测试。

  • 如果杜比全景声文件可用于导出传统音频素材(7.1 声道、5.1 声道和立体声 LtRt 音频),则这些传统渲染音频也必须适合在家庭场景收听。

  • 所有音频应与画面的持续时间相同并保持同步,且音频应以整段而非单独片段的方式提交。

  • 杜比全景声文件中的导片和同步音应在提交前删除。

  • 杜比全景声文件必须使用音频定义模型广播波形格式(ADM BWF)。

  • 曲目应为 48 kHz/24-bit 的 LPCM 音频。

  • 至多包含 128 个独立音轨。

  • 1-128 个音轨可能用于音频对象或音床。

  • 应在 ADM BWF 文件的 DBMD 部分准确提供其他内容元数据,例如预期的艺术素材压缩配置文件和向下混音级别等。

  • 在杜比全景声文件中,对白或语音的平均响度必须在 -31 LKFS 至 -10 LKFS 之间,建议控制在 -30 LKFS 至 -18 LKFS 之间。请使用以下测量方法:

    • 对完整混音的 5.1 声道渲染音频进行响度测量。

    • 使用 BS.1770 测量算法和“对白智能技术”(或其他语音选通算法)来测量整段素材时长内累计的对白选通响度,以确认该响度位于上述指定范围内。

    • 测量对白的占比。如果占比小于 10%,则对白可能不是这段音频素材中用于响度校正的“锚元素”。此时请应该遵循以下段落中的步骤。

  • 如果对白不是“锚元素”(例如音乐素材),则杜比全景声文件的平均音频响度必须在 -31 LKFS 至 -5 LKFS 之间。请使用以下测量方法:

    • 对完整混音的 5.1 声道渲染音频进行响度测量。

    • 使用 BS.1770-4(或 BS.1770-3)测量算法来测量完整节目混音(全部通道在素材整段时长内)的响度,以确认该响度位于上述指定范围内。

影片音频/视频和配音容器

  • 所有内容应封装在一个 QuickTime .mov 文件中交付。

  • 所有音频和视频内容均须使用 QuickTime .mov 文件扩展名。

  • 对于 7.1 环绕声音频,必须按照下表中的任一方案分配声道。方案一(Option 1)中,一条音轨包含所有八个声道;而方案二(Option 2)中,一条音轨对应一个声道。请注意,“Rsl”(Rear Surround Left,即左后方环绕)也可用“Rls”(Rear Left Surround)表示。

    显示音频声道分配的表格图像
  • 对于 5.1 环绕声音频,必须按照下表中的任一方案分配声道。方案一(Option 1)中,一条音轨包含所有六个声道,声道分配顺序有以下四种:Option 1a、1b、1c 和 1d。请注意,“Lt”和“Rt”仅用于杜比矩阵立体声。

    音频声道分配表
    • 在列出的所有方案中,所有立体声音轨的声道分配可以使用 L 和 R 表示,也可以使用 Lt 和 Rt 表示,但请勿混合使用(例如 L 和 Rt,或 R 和 Lt)。

    【重要事项】请参考音频声道分配,了解标签描述以及如何进行音频声道分配。另请参见表 1:ProRes 音频声道数据分配和电平,了解音乐、音效和对白的音频电平和声道分配。

    【注】有关备选音频的更多信息,请参见《Apple Transactional Film Specification(Apple 付费点播电影技术规范)》中的“Assets and Data Files(素材和数据文件)”部分。

影片隐藏式字幕描述文件

  • 文本应为 EIA-608 格式。

  • 与关联的视频包含在同一数据包中交付。

  • 在 Scenarist SCC 格式文件中,请使用 .scc 文件扩展名。

  • 时间码帧速率只能是 29.97,此帧速率与视频源帧速率无关。但是,时间码格式必须匹配视频源的时间码格式,即丢帧(DF)或非丢帧(NDF)。

    • 丢帧格式的前两个时间分隔符是冒号,最后一个时间分隔符是分号(HH:MM:SS;FF)。

    • 非丢帧格式的所有时间分隔符均为冒号(HH:MM:SS:FF)。

视频源帧速率

隐藏式字幕帧速率

描述

时间码格式

时间码示例

29.97、59.94i

29.97

NTSC 视频

DF

HH:MM:SS;FF

25、50i

29.97

PAL 视频

NDF

HH:MM:SS:FF

24

29.97

影片

NDF

HH:MM:SS:FF

23.976

29.97

NTSC 影片

NDF

HH:MM:SS:FF

  • 对于要以文本形式呈现的对白,字幕应在首句可听见的对白出现后一秒内显示并保持同步。

字幕的时间码是相对于节目的开始,而不是 QuickTime 影片的时间码轨道。

如需制作 EIA-608 隐藏式字幕,请使用 Final Cut Pro 或第三方字幕制作 App 输出 SCC 文本文件。

请注意:

  • 如需在交付视频之前测试隐藏式字幕,请参阅“在 Compressor 中导入和预览字幕”。

  • 如果广播或 Web 交付系统有任何可用的隐藏式字幕数据,则必须提供。

影片口述影像(AD)描述文件

  • 为口述影像(AD)提供一个备选音轨并为视觉元素提供对应描述,该描述对于实时了解视频内容以及剧情、音乐、对白和音效至关重要。

  • 以预先混合的格式和 2.0 立体声格式交付,或以 5.1 环绕声格式交付(无 7.1 环绕声格式)。

  • 你可以提供任何语言的口述影像(AD)文件,创建的数据包会包含口述影像。口述影像的语言必须与相应的音频源或备选音频文件的语言匹配,才会被包含在数据包中。若你发送的口述影像文件没有相应的音频文件,则口述影像也将无法上架使用。

影片 iTunes 时序文本描述文件

时序文本文件的交付要求如下。另请参考《Apple Transactional Film Specification(Apple 付费点播电影技术规范)》中的“iTunes Timed Text Profile(iTunes 时序文本描述文件)”,进一步了解规范。

  • 交付格式为 iTunes 时序文本(iTT)文件,使用 .itt 文件扩展名。

  • 与通过 <assets> 块关联的视频素材包含在同一数据包中交付。

  • iTT 文稿中只允许有一个 div 元素。

  • timeBase 必须设定为 smpte

  • dropMode 必须设定为 "dropNTSC""nonDrop";iTunes 时序文本不支持 dropPAL

  • fontFamily 中的字体只能指定为 sansSerif

iTT 文件格式是时序文本标记语言(TTML)的一个子集,基于第一版万维网联盟(W3C)2013 年 9 月 24 日的推荐标准。所有 iTT 文稿均为使用特定 TTML 子集的 TTML 文稿。

如需制作 iTT 格式的字幕,请使用 Final Cut Pro 或第三方字幕制作 App 输出 iTT 文件。

影片配音演员名单视频描述文件

完整的正片长度视频素材包括一组数据文件,它们在其素材中存在特定用途。下表描述配音演员名单视频的可选数据文件。

素材类型

数据文件

描述

完整

用途:video.end.dub_credits

一个可选的数据文件,包含与音频音轨关联的制作人员名单。

一个纯视频序列,包含一个或多个对应特定语言音频的静态制作人员名单。关联音频配音的制作人员名单视频序列会出现在主节目之后。

语言:必须提供

配音演员名单视频描述文件

  • 应为 Apple ProRes 422(HQ)。

  • 影片应正确标记颜色参数(ITU BT.709)。

  • 视频尺寸、像素宽高比和帧速率必须匹配正片视频源。

  • 配音演员名单的时间尺度必须与视频源的时间尺度相匹配。

  • 每个配音演员名单最少显示 4 秒。

  • 如果配音演员名单视频的分辨率与正片视频源的分辨率不一致,则必须为配音演员名单视频提供不同的剪裁尺寸属性,以匹配正片视频源的宽高比。

  • 不应为配音演员名单视频提供音轨——音轨将被忽略。

  • 如有需要,配音演员名单视频将进行去隔行处理,因而无需匹配场顺序——最好使用逐行。

  • 不支持叠化和滚动制作人员名单。

  • 第一帧和最后一帧不需要是黑帧。

影片审查许可页描述文件

一个完整正片长度的视频素材由多个具有特定用途的数据文件组成,其中包括审查许可证的数据文件(非必需)。有关说明请参见下表。

素材类型

数据文件

描述

完整

用途:card

一个非必需的数据文件,包含一张与影片相关的图像。

包含影片相关信息(例如许可证)的图像文件。Apple 将使用该图像创建视频,以便在商店中播放。

此类数据文件有一个“subtype(子类型)”属性,用于标识所交付的文件类型。目前可用的子类型只有“certificate(许可证)”。

审查许可页图像描述文件

  • .jpg 扩展名的 JPEG 文件,或带 .png 扩展名的 PNG 文件。

  • 尺寸至少为 640 x 480 像素。

  • 色彩空间应为 RGB(屏幕标准)。

  • 仅可包含有效像素区域。

  • 许可证图像必须裁剪(上下、左右或四周不得留有黑边)。

  • 许可证图像仅可包含许可证内容。

  • 请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。

影片章节图像描述文件

  • .jpg 扩展名的 JPEG 文件(不压缩质量),或带 .png 扩展名的 PNG 文件。

  • 色彩空间应为 RGB(屏幕标准)。

  • 必须与视频源具有相同的宽高比。

  • 最小水平尺寸为 640(高清源尺寸更大)。

  • 垂直尺寸可(按视频源宽高比)伸缩。

  • 仅可包括有效像素区域(需要匹配完整节目的总体宽高比时除外)。

  • 章节图像必须剪裁(上下、左右、四周不得留有黑边,但上条备注的情形除外)。

  • 章节图像必须包含图片内容。

  • 每个章节图像文件必须为唯一,具有不同的校验和。

【重要事项】接受 CMYK(打印标准)图像。

影片封面图描述文件

2:3 封面图

  • .jpg 扩展名的 JPEG 文件(不压缩质量)、带 .png 扩展名的 PNG 文件或带 .lsr 扩展名的 LSR 文件。

  • 色彩空间应为 RGB(屏幕标准)。

  • LSR(分层源表示)文件:

    • 尺寸至少为 2000 x 3000 像素。

    • 至少须有两层(最多有五层)。

    • 分层 LSR 文件中的每个图像都必须有唯一名称。

    • 分层 LSR 文件中的每个图像都必须是 PNG 格式。

  • JPG 或 PNG 文件的尺寸至少应为 2000 x 3000 像素。

  • 宽高比应为 2:3。

  • 应是取材自影片的封面图(单页)。必须包含主要图像和标题。请勿包含 DVD 封面、发行日期、网站或宣传标签。

  • 封面图不得显示影片评级。

请勿通过拉伸较小尺寸的图像来满足最低尺寸要求。过于模糊或像素化的图像将被拒绝。

【重要事项】不接受 CMYK(打印标准)图像。

Display P3 封面图

  • .png 扩展名的 PNG 文件,或带 .lsr 扩展名的 LSR 文件(必须嵌入 Display P3 颜色配置文件)。

  • 色彩空间为 Display P3。

  • 色彩模式为 RGB。

  • 色彩深度为 16 位/通道。

  • 尺寸应为 2000 x 3000 像素。

  • 分辨率最低为 72 dpi。

  • 应是取材自影片的封面图(单页)。必须包含主要图像和标题。请勿包含 DVD 封面、发行日期、网站或宣传标签。

  • 封面图不得显示影片评级。

16:9 封面图

  • .jpg 扩展名的 JPEG 文件(不压缩质量)、带 .png 扩展名的 PNG 文件或带 .lsr 扩展名的 LSR 文件。

  • PNG 和 JPG 文件的尺寸至少应为 1920 x 1080 像素(建议尺寸为 3840 x 2160 像素)。

  • LSR 文件的尺寸至少应为 3840 x 2160 像素。

  • 分辨率为 72 dpi。

  • 宽高比为 1.75d - 1.80d。

  • 应是取材自影片的封面图(单页)。必须包含主要图像和标题。请勿包含 DVD 封面、发行日期、网站或宣传标签。

  • 封面图不得显示影片评级。

影片背景图和内容标志

竖版背景图

  • .png 扩展名的 PNG 文件。

  • 尺寸必须为 1680 x 3636 像素。

横版背景图

  • .png 扩展名的 PNG 文件。

  • 尺寸必须为 4320 x 3240 像素。

全彩的内容标志

  • 透明背景且带 .png 扩展名的 PNG 文件。

  • 尺寸必须为 4320 x 1300 像素。

单色的内容标志

  • 透明背景且带 .png 扩展名的 PNG 文件。

  • 尺寸必须为 4320 x 1300 像素。

  • 文本必须为白色。

影片内容注意事项

  • 视频素材不应包含推广性质的社交媒体图标、标语或二维码。

  • 完整影片素材不应包含 FBI、MPAA 或发行日期标签。

  • 预告片素材不应包含 FBI、MPAA 或发行日期标签。

  • 每个视频的开头和结尾都需要有至少 1 个黑帧。

  • 预告片应具有与完整素材相同的宽高比。

  • 不接受包括网址(URL)在内的推广贴片(Promotional Bumper)。请联系你的技术顾问了解更多详情。

  • 对于美国和加拿大的预告片,预告内容必须适用于普通观众。

  • 对于所有其他国家/地区的预告片,预告内容不得超出该影片可销售地区的长片分级的分类范围。针对世界范围(WW)可用的预告必须适用于所有获准销售的地区。

  • 封面图不应包含 DVD 标签、发行日期标签或网站标签。

Epic Stage 视频描述文件

Epic Stage 视频注意事项

Epic Stage 视频仅用于 Apple TV 频道的 Epic Stage 展示位。

注意事项

Epic Stage 素材应从静态画面平稳自然地过渡到动态画面。视频的前两秒请注意:

  • 避免在第一帧呈现黑色画面。

  • 避免快速跳切。

  • 避免出现突兀或剧烈的音效或提示音。

  • 避免出现对话。

整个视频中:

  • 请勿包含片头字幕、制片商徽标、获奖信息或电影节奖项、制作人员、长台词或旁白片头字幕、CTA 信息(呼吁观看者采取某种行动)。

视频结束时:

  • 应留出收尾时间,让动态画面自然过渡回静态画面。建议时长为两秒。

  • 请勿在最后一帧呈现黑色画面。

【注】请默认观众开启了声音,并据此设计视频。

Epic Stage 视频不应包含裸露、暴力、血腥、种族歧视、仇恨的图像或色情内容。视频中的枪不应对准观众,且视频内容应适合所有年龄段观看。此外,对于在 Apple TV 频道订阅服务中上线的内容,其品质应符合上线地区的基本要求,详细说明请参见“Minimum Storefront Requirements(各地区基本要求)”。

横版 Epic Stage 视频要求

此类 Epic Stage 视频的交付要求如下。另请参见 Epic Stage 视频注意事项进一步了解规范。

  • 平台:Apple TV、台式电脑、iPad

  • 宽高比:16:9

  • 尺寸:3840 × 2160 像素

  • 文件格式:ProRes 4444(全部帧)

  • 帧速率:不低于 23.98 帧/秒

  • 音频:必须提供 2.0;可选择性提供 5.1 和杜比全景声

  • 时长:建议 30 至 40 秒

  • 颜色配置文件:8 位

竖版 Epic Stage 视频要求

此类 Epic Stage 视频的交付要求如下。另请参见 Epic Stage 视频注意事项进一步了解规范。

  • 平台:iPhone

  • 宽高比:3:4

  • 尺寸:1620 x 2160 像素

  • 文件格式:ProRes 4444(全部帧)

  • 帧速率:不低于 23.98 帧/秒

  • 音频:必须提供 2.0;可选择性提供 5.1 和杜比全景声

  • 时长:建议 15 至 20 秒

  • 颜色配置文件:8 位

XML

  • 所有 XML 都必须用 UTF-8 编码。

  • 不得使用任何字节顺序标记(BOM)。

  • XML 中不能包含空数据或空标签。应移除未使用的元素。

  • 必须将 XML 的格式设置为使用换行符和缩进。

有关更多信息,请参考相应媒体类型的元数据规范,或咨询你的技术顾问。

音频声道分配

音频声道分配

此前,你可以使用 QuickTime Pro 7 分配音频声道。从 macOS Catalina 开始,macOS 系统仅支持 64 位的 App,而 QuickTime Pro 7 为 32 位的 App,因此已无法使用。

现在,你可以使用 Compressor 4.4.5 的命令行界面为 QuickTime 影片分配音频声道。使用命令行选项 -⁠relabelaudiotracks,后跟要标记的声道(用标签值表示)。有关音频声道布局的更多信息,请参见“Compressor 中的音频通道布局”。

可用于音频标记的值包括:

标签

描述

L

R

C

LFE

低频效果

Ls

左环绕

Rs

右环绕

Lc

中前左

Rc

中前右

Rsl(或 Rls)

左后环绕

Rsr(或 Rrs)

右后环绕

Lt

左总

Rt

右总

LtRt

矩阵立体声(Lt Rt)

stereo

立体声(L R)

示例

  • 若一个 QuickTime 影片文件有两条音轨,其中第一条音轨包含左音频声道,第二条音轨包含右音频声道,请在命令行中键入以下内容:

    /Applications/Compressor.app/Contents/MacOS/Compressor -relabelaudiotracks L R <path_to_Quicktime_Movie_source_file>

  • 同理,若一个 QuickTime 影片文件有一条音轨,该音轨同时包含左右音频声道(即矩阵立体声),请在命令行中键入以下内容:

    /Applications/Compressor.app/Contents/MacOS/Compressor -relabelaudiotracks LtRt <path_to_Quicktime_Movie_source_file>

以上命令将覆盖原始源文件中的音频声道分配,让分配过程更为快捷。如要存储至新文件,请在命令中添加 -⁠locationpath,例如:

/Applications/Compressor.app/Contents/MacOS/Compressor -relabelaudiotracks L R <path_to_Quicktime_Movie_source_file> -locationpath <path_to_output_file>

以及

/Applications/Compressor.app/Contents/MacOS/Compressor -relabelaudiotracks LtRt <path_to_Quicktime_Movie_source_file> -locationpath <path_to_output_file>

有关使用命令行的更多信息,请参见“Compressor 中的 shell 命令介绍”。你也可以在命令行工具中使用 /Applications/Compressor.app/Contents/MacOS/Compressor -help 显示帮助。

表 1:ProRes 音频声道数据分配和电平

标签

数据和电平

L

MnE

R

MnE

C

对白

LFE

特效

Ls

音乐

Rs

音乐

Lt

5.1 声道转换为立体声

Rt

5.1 声道转换为立体声

Max peak(最大峰值)

-6db

LKFS(响度)

-24db

指南修订历史

下表列出了此前发布的规范版本和修订概要:

日期 - 版本

概要

2025 年 2 月 24 日 - 版本 5.3.16

更新了音乐视频音频源、电视节目封面图和立体视频源的描述文件。电视节目现支持 4K 源。更新了电视节目和影片的内容注意事项。

2024 年 6 月 - 版本 5.3.15

更新了影片海报图描述文件。

2024 年 4 月 8 日 - 版本 5.3.14

新增了立体视频源文件要求;本指南更名为《Apple 视频和音频素材指南》

2024 年 1 月 16 日 - 版本 5.3.13

更新了沉浸式音频源的要求;将本指南更名为《视频和音频素材指南》

2023 年 12 月 4 日 - 版本 5.3.12

更正了 TTML 文件格式规范。

2023 年 8 月 14 日 - 版本 5.3.11

更新了 TTML 文件格式规范;其他细微更正和补充。

2023 年 2 月 27 日 - 版本 5.3.10

更新了沉浸式音频、影片高清源、影片 HDR 源、杜比全景声音频源的描述文件。更正了竖版 Epic Stage 视频的尺寸要求。

2023 年 1 月 17 日 - 版本 5.3.9

新增了三个章节:高解析度无损音频源描述文件、音乐专辑动态封面描述文件、Epic Stage 视频描述文件;另有其他更正。

2021 年 10 月 4 日 - 版本 5.3.8

更正了音频解析度要求。新增了有关沉浸式音频源的说明。

2021 年 7 月 19 日 - 版本 5.3.7

移除了有关印度 CBFC 许可证的内容。

2021 年 6 月 3 日 - 版本 5.3.6

更新了沉浸式音频源的要求;区分了沉浸式音频和空间音频;更新了影片海报图的要求。

2021 年 5 月 17 日 - 版本 5.3.5

新增了沉浸式音频源的要求和规范。

2020 年 8 月 31 日 - 版本 5.3.4

现支持杜比视界 CM 版本 4.0 附加元数据文件。添加了新的数据文件用途,用于交付 CBFC 许可证(如果内容在印度销售)。“音频声道分配”部分新增 Rrs(右后环绕)标签。

2020 年 8 月 10 日 - 版本 5.3.3

音乐视频描述文件新增灰度系数。章节图像可使用 PNG 格式发送。QuickTime Pro 7 已弃用。《iTunes 隐藏式字幕测试指南》已弃用。

2019 年 10 月 28 日 - 版本 5.3.2

更新了 Apple 数字母带要求。更新了音乐音频源要求。

2019 年 8 月 7 日- 版本 5.3.1

移除了有声书要求。重新命名了 MFiT。

2019 年 5 月 13 日 - 版本 5.3

针对电视节目和影片,添加了对 16:9 海报图、内容标志和背景图的要求。为了使版本号与新 Schema 版本同步,已将该指南的版本号由 5.2 更改至 5.3。

2019 年 1 月 30 日 - 版本 5.2.14

为高清和标清音乐视频源描述文件添加了 30 fps 的选项。添加了有声书描述文件。

2018 年 8 月 8 日 - 版本 5.2.13

更新了音乐视频源描述文件。为影片添加了杜比全景声音频源。阐明了像素宽高比。

2018 年 5 月 2 日 - 版本 5.2.12

针对音乐视频屏幕捕捉图像的要求已更改。

添加了针对电影和电视的 Display P3 海报图和封面图要求。

2018 年 2 月 21 日-版本 5.2.11

更新了针对音乐视频的屏幕捕捉图像要求。从标清插值成为高清的内容将被拒绝。更正了一个链接。

2017 年 10 月 18 日 - 版本 5.2.10

针对 HDR 和 4K 视频的新增源素材要求。

2017 年 7 月 12 日 - 版本 5.2.9

添加了音乐、音效和对白的音频电平和声道分配设置功能。口述影像(AD)文件能够以 5.1 环绕声音频格式交付。配音演员名单视频现可添加剪裁尺寸。变更了海报图和封面图的尺寸要求。

2017 年 5 月 17 日 - 版本 5.2.8

针对电影预告片的要求进行了更改。更新了针对高清源的音乐视频、电视节目和影片的要求。

2017 年 1 月 26 日 - 版本 5.2.7

添加了新的章节以描述交付专辑曲目歌词的文件格式。对单声道音频进行了说明。

2016 年 8 月 17 日 - 版本 5.2.6

更新口述影像(AD)。

2016 年 5 月 26 日 - 版本 5.2.5

5.1 和 7.1 环绕声的音频轨道声道可以全部为 24 位或全部为 16 位。配音演员名单的时间尺度必须与视频源的时间尺度相匹配。

2016 年 1 月 15 日 - 版本 5.2.4

为高清源添加了其他格式。更新了网址(URL)链接。

2015 年 9 月 28 日 - 版本 5.2.3

针对电影和电视节目更改了海报图要求。针对电影增加了分层图像要求。阐明了隐藏式字幕。

2015 年 7 月 16 日 - 版本 5.2.2

针对电影增加了 7.1 环绕声音频要求。更改了专辑封面图要求。

2015 年 1 月 8 日 - 版本 5.2.1

针对 ProRes 增加了对 field count 的说明。增加了高清源的显示尺寸,以适应使用非方形像素的视频格式,例如广播尺寸。增加了影片的口述影像(AD)要求。阐明了音乐视频屏幕捕捉图像。

2014 年 4 月 9 日 - 版本 5.2

增加了音乐视频的隐藏式字幕要求。增加了 MFiT 内容的最佳做法。增加了电视节目封面图的要求。增加了电视节目内容注意事项的指导。阐明了电视节目和电影的 SCC 文件。将此规范的版本号从 5.1 变更为 5.2,以使版本号与新 Schema 版本同步。

2013 年 3 月 20 日 - 版本 5.1.1

更正了 NTSC 和 PAL 格式的 ProRes 标清描述文件。

2013 年 2 月 28 日 - 版本 5.1

针对交付 Mastered for iTunes 内容增加了最佳做法。变更了铃声专辑封面图的要求。针对电视节目和电影阐明了隐藏式字幕的可接受帧速率。视频只能在编辑列表的最后一个编辑中包含空编辑,否则视频会被拒绝。

2012 年 11 月 7 日 - 版本 5.0.1

阐明了电影的标清视频源。增加了新视频源验证。为 NTSC 和 PAL 标清电视节目源描述文件增加了 Apple ProRes。变更了 QuickTime 音频声道分配的要求。隐藏式字幕可添加到 MPEG-2 源。

2012 年 5 月 30 日 - 版本 5.0

变更了专辑封面图和海报图要求。从建议图像格式列表中移除了 TIFF 并移除了 DPI 要求。增加了配音演员名单视频的交付要求。现在支持 96 kHz 音频。

2011 年 9 月 22 日 - 版本 4.8

增加了电视节目的剪裁尺寸。阐明了电视节目的内容注意事项。阐明了电视节目的隐藏式字幕。增加了 iTT 文件的交付要求。

2011 年 7 月 13 日 - 版本 4.7.2

阐明了 5.1 音频和隐藏式字幕的交付要求。增加了电视节目隐藏式字幕的描述文件。变更了影片海报图要求。

2011 年 4 月 15 日 - 版本 4.7

阐明了电视节目的高清剪裁。增加了高清影片源的色彩空间要求。阐明了影片的隐藏式字幕文本。

2011 年 2 月 9 日 - 版本 4.6

移除了图书的素材规范(创建了新的《iBooks Store 素材指南》)。此素材指南更名为:《iTunes 视频和音频素材指南》

2010 年 11 月 5 日 - 版本 4.5

阐明了高清音乐视频音频源描述文件的环绕声。阐明了音乐视频高清源的交付。增加了图书源描述文件的章节。将之前错误移除的 25 fps 重新添加到高清电视节目源描述文件中。为电视节目内容注意事项部分增加了两个新的最佳做法项。

2010 年 8 月 5 日 - 版本 4.4

增加了高清音乐视频的源描述文件和剪裁信息。阐明了专辑封面图。为高清音乐视频音频源描述文件增加了环绕声。

2010 年 2 月 3 日 - 版本 4.3

阐明了 CAF 容器中允许使用 ALAC。增加了预剪辑铃声的源描述文件。阐明了影片评级不得出现在海报图上。

2009 年 12 月 18 日 - 版本 4.2

阐明了质量标准。阐明了隐藏式字幕。

2009 年 11 月 10 日 - 版本 4.1

阐明了音乐和电影的音频要求。

2009 年 9 月 11 日 - 版本 4.0

增加了电影内容的最佳做法。阐明了 SCC 文件的要求。

2009 年 7 月 1 日 - 版本 3.3.2

阐明了图像和音频要求。阐明了电视节目的帧速率要求。

2009 年 5 月 12 日 - 版本 3.3.1

针对封面图、海报图和视频屏幕捕捉的 PNG 格式图像增加了支持。章节缩略图像目前不支持 PNG 图像。

2009 年 3 月 17 日 - 版本 3.3

针对电影增加了更新的 PAL 支持。针对电影内容描述文件增加了隐藏式字幕。针对音频增加了 24 位支持。针对电视节目内容增加了最佳做法。阐明了如何为电影和电视节目发送立体声。

2008 年 10 月 1 日 - 版本 3.2

在音乐音频内容描述文件中增加了音频源规范,在电视内容描述文件和附录 1 中增加了高清格式,提供音频声道分配说明。

2008 年 5 月 8 日 - 版本 3.1.1

对本指南的格式进行重新设置。将内容类型描述文件分开介绍。增加影片高清和标清规范。增加电视节目和电影的图像规范。

2007 年 4 月 2 日 - 版本 2.3

引入素材规范指南。