用于准备dvd视频格式数据的方法,用于重建dvd视频数据的方法和dvd视频数据的结构的制作方法

文档序号:6759153阅读:574来源:国知局
专利名称:用于准备dvd视频格式数据的方法,用于重建dvd视频数据的方法和dvd视频数据的结构的制作方法
技术领域
本发明涉及一种用于准备优选地为电影数据的DVD视频格式数据 的方法,以便把该数据从服务器传输至客户端,其中DVD视频格式数据 被设置为预定数据文件组。本发明还涉及DVD设备中使用的一种用于对 根据上述方法而准备的DVD视频数据进行重建的方法。此外,本发明涉 及一种包括数据文件组的DVD视频数据结构,所述数据文件包括视频、 音频和丰富内容的数据,并根据DVD视频规范而组织。此外,本发明涉 及DVD播放机中使用的一种记录载体,以及一种对存储在记录载体上的 视频文件进行播放的DVD设备,所述DVD设备包括读取装置,用于读 取存储在所述记录载体上的数据;用于处理DVD视频格式文件的装置; 以及解码装置,用于对例如mpeg-4编码的数据进行解码。最后,本发 明涉及一种计算机程序产品,以及一种包括用于消费类电子设备的硬 件和软件的计算机程序。
背景技术
过去,出售和购买例如音乐(例如mp3音乐商店)的数字内容变 得越来越流行,而且已经发展为相当大的产业。该产业的增长一方面 受到因特网连接带宽增长的支持,允许以更短的时间下载数字内容, 另一方面受到用于播放所下载内容的播放机的使用的简易性的发展的 支持。然而,仍旧有限的因特网连接带宽阻止了因特网上关于视频内容 的内容分布的进一步发展,例如视频内容的分布仍以DVD媒体的形式而 实现,在DVD媒体上按照DVD视频规范而存储视频内容。现有技术中已知的是,DVD视频格式允许包含丰富的内容,即包
含例如字幕等的子图像数据、导航信息等。通常,视频和音频数据按照mpeg-2或即eg-l标准而编码,并被封 装在作为DVD视频格式数据结构的一部分的数据分组中。.由于可用的因特网带宽持续增长且成本在降低,所以下载视频、 电影等变得更加流行。然而,不希望简单地下载mpeg-2编码的或mpeg-4 编码的视频流,因为用户在这种情况下需要特殊的软件来把卿eg-2/4 数据流变为生产DVD视频盘所需的DVD视频格式。例如,需要一种简单且容易地使用用于下载DVD视频格式的视频 内容的解决方案。另外,例如当希望把最初购买的DVD保存在安全的地 方并仅使用该DVD的副本时,希望能够把DVD存储在CD或硬盘上。虽然DVD格式具有在视频标题组(Video—TS)目录中包括特定文 件的目录结构,而且实际的视频或音频内容被包括在视频对象文件中 (V0B扩展文件),且实际的视频内容之前具有包(pack)报头和PES 分组报头,然而存在其他的格式,这些格式要求在不散置 (interspersed)任何控制信息的情况下写入视频数据。这种文件格式是如国际标准ISO/IEC 14496-1: 2002中定义的 MPEG-4文件。具体地,这个MPEG-4标准中的第1部分"系统"中的第13章节"文件格式"与之密切相关。这里,需要把音频或视频数据写入 所谓的"mdat"原子。MPEG-4标准要求这个mdat原子中的数据是所谓 大块(chunk)中的数据,即仅表示组成音频或视频的有效载荷数据的 数据,或一般地,是其间不具有任何分组控制信息的媒体内容。换句 话说,该文档中被称作"早期"(legacy)解码器的MPEG-4相容解码器 假定mdat原子仅包括图像大块组,即与后续图像组有关的图像数据的 视频编码组。MPEG-4所提供的一个例外是,mdat原子可以包括若干轨 道(track),这意味着可以把例如若干个电影包括到一个MPEG-4容器 内。当MPEG-4播放机将要播放第一电影或第一轨道时,搜索mdat原子 中正确的起始点(这个起始点可以是地址或存储介质上特定的扇区边 界),而且对从这个起始点开始的数据以及随后紧接着的数据进行解 码,直到完成对这个大块中的所有数据的解码。与此相反,如上所述,MPEG-2文件格式是与这个MPEG-4文件原理
不同的DVD文件格式,因为存在若干文件,每一个文件都包括控制信息, 因而后来不会把图像数据组写入单一文件内,而是组之前通常有包括 控制信息的特定报头。因此,在常规DVD上,数据没有被写入大块中, 而是封装在所谓的PES分组中(PES^节目基本流)。此外,由于DVD文件大小的限制,可以把视频对象分为两个或甚 至更多个视频对象文件。在这个上下文中要注意的是,标题组包括具 有相同属性的标题,例如相同的纵横比。当要以16: 9把电影写在DVD 上,而且要以4: 3把制造者写到DVD上时,必须产生针对该DVD的两个 标题组。同时,DVD播放机变得越来越流行。这意味着多个家庭或业务用 户拥有与电视机相连的DVD播放机。因此,常规用户习惯于她或他的 DVD/电视机组合。如上所述,可用因特网带宽的增加不仅允许通过DVD来分发电影, 该DVD可以在特定商店中出售,而且还允许参照电影接受者所支付的费 用而下载完整的电影。然而,DVD格式需要若干分离的文件,这不能很 好地适于通过因特网来舒适地下载。替代的是,需要使用简单且舒适 的过程,该过程允许用户使用单击而从因特网完成任意文件格式的订 购和出货。此外,最好是向用户保证无错且安全的下载,但是当需要通过因 特网或任意其他网络(例如无线网)来下载单一数据实体而不是若干 不同的数据实体时,这不能在所有情况下得以保证。此外,如上所述,需要用户执行额外的步骤以重建DVD盘的文件 结构,从而把因特网下载的数据馈入与计算机分离的DVD播放机(即与 电视机相连),这是一个缺点。发明内容本发明的目的是提供一种对具有一个或更多个文件的音频或视 频内容的表示(^presentation)进行处理的概念,其中有效载荷数 据块被控制数据分离,这使用户感到舒适且适于因特网下载。这个目的通过权利要求l所述的装置、权利要求19所述的方法、
权利要求20所述的数据表示、权利要求21所述的处理器、权利要求23 所述的处理方法或权利要求24所述的计算机程序来实现。本发明基于如下发现在某个场景中,即第一表示包括具有由媒 体文件控制块分离的至少两个媒体文件有效载荷块的媒体文件,或包 括每个均具有媒体文件有效载荷块和媒体文件控制块的至少两个媒体 文件,其中所述媒体文件有效载荷块表示所述媒体内容,所述媒体文 件控制块包括相关的媒体文件有效载荷块的控制信息,则一种数据实 体构造器通过如下步骤产生作为所述媒体内容的第二表示的数据实体产生所述一个或更多个媒体文件,从而在再生媒体文件中再生媒体文件控制部分位于两个再生媒体文件有效载荷部分之间,以及产生有效载荷数据调度(schedule),所述有效载荷数据调度具有调度信息, 针对每一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒 体文件有效载荷块的有效载荷信息的开始。因此原始文件结构得以维 持,而且适用于所述第二格式的设备可以简单地跳过所述控制块,并 在不需要任何附加信息的情况下播放所述媒体内容。本发明的优点在于产生单一的数据实体,该单一的数据实体用作 所述媒体内容的第二表示,而在所述媒体内容的第一表示中包括若干 文件。备选地,当所述第一表示包括单一的文件时,本发明的优点在 于,由于所述有效载荷数据调度,包括在新产生的数据实体中的有效 载荷数据可以在期望不中断有效载荷数据的情况下被设备读取和处 理,即有效载荷数据没有被控制数据中断。因此,本发明提供了一种单一的数据实体,该数据实体可通过因 特网容易地且无错地下载。另外,由于有效载荷数据调度信息,所述 媒体有效载荷数据可以由不能对有效载荷数据块之间的任意控制数据 进行处理的设备来处理。另外,所述第一表示被包括在所述第二表示内,因为所述至少一 个再生媒体文件优选地具有与原始媒体文件相同的结构。优选地,所述媒体内容的所述第一表示是具有若干文件、且额外 地在视频对象单元中具有节目基本流的DVD表示,其中,所述节目基本流具有控制信息和图像组视频信息。在这个实施例中,所述数据实体
构造器产生MPEG-4容器,该容器包括原始DVD格式的副本,而且另外还包括指示每一个有效载荷信息块的开始的有效载荷数据调度。这具有 如下优点遵循MPEG-4、因而期望没有被控制数据块所分离的视频数 据大块的解码器可以通过跳过有效载荷数据之间的控制数据来使用有 效载荷信息,从而DVD格式可以容易地由遵循MPEG-4的解码器来解析。 换句话说,包括在DVD格式的附加文件中、或包括在图像组有效载荷数 据的报头中的附加信息被早期(legacy)播放机跳过,从而保证了兼 容。优选地,例如,所述播放机在主电影的开始处开始,在转换期间, 通过相应地设置数据有效载荷调度的第一入口来定义所述主电影的开 始。例如MPEG-4/DVD设备的增强播放机能够理解散置的控制数据块。 要注意的是,常规的DVD视频播放机不能播放以MPEG-4H. 264编码的内 容。然而,可以容易地构造能够播放散置有DVD视频导航数据的MPEG-4 内容的视频播放机。因此,在通过因特网进行接收后,可以容易地对 MPEG-4容器进行解包,从而用户能够容易地烧写其DVD,该DVD由计算 机进行输出,并被输入需要原始DVD文件结构的常规DVD播放机中。随后描述优选实施例。本发明提供了一种用于准备开始处提到的 DVD视频格式数据的方法,该方法允许容易地访问和下载视频内容,同 时保持了DVD视频格式的优点,即把丰富内容并入了原始mpeg-l/2音频 /视频流。例如,这个目的是通过一种用于准备如上所述DVD视频格式 数据的方法而实现的,所述方法包括步骤以预定的顺序读出文件中 的数据;以及把读取的数据写入单一的文件,其中,保持由文件的预 定顺序所给出的读取数据的顺序,而且文件的起始地址紧跟随先前文 件的结束地址而没有任何间隙。换句话说,包含视频、音频和丰富内容数据且其结构符合DVD视 频规范的预定文件全都存储在单一的文件中。文件的原始顺序在所述 单一文件中得以保持,该顺序也是DVD视频规范的一部分,而且单一文 件内文件的开始紧接着先前文件的结束。在本发明的上下文中,表述 "紧接着"或"没有任何间隙"的含义是,连续文件之间不存在实质 的地址间隙(例如,仅由存储介质自身的技术要求引起的间隙不是实 质的间隙)。为了有效的存储,单一文件内的两个文件之间不存在实质
的或值得注意的空地址空间。如果需要,使用填充数据进行填充,直 至下一扇区的开始。此外,在本发明的上下文中,"DVD"意味着像DVD、 HD-DVD、 BD (Blu-Ray-Disc) —样的各个光存储介质,以及适于存储大量多媒体 数据(例如视频等)的未来的光存储介质。明显的是,包含DVD视频格式数据的单一文件的优点是,与DVD视 频规范中规定的下载多个不同文件相比,该单一文件可以更加容易地 存储、共享或从网页下载。用户仅需要下载一个单一的文件。不需要 执行其他解压缩,例如un-zip等,而是可以立即重放文件。优选地,文件组包括文件VIDEO—TS. IF0 、 VIDEO—TS. VOB 、 VIDE0—TS. BUP、 VTS—xx一O. IF0、 VTS_xx—y. V0B、 VTS_xx—0. BUP,其中, xx和y是十进制数字。与DVD视频规范相对应的这些文件用于存储丰富 内容,例如标题编号、字幕等,以及以mpeg-2编码的音频/视频数据。在本发明的优选实施例中,携带DVD视频内容的单一文件嵌在 mp4-格式的文件中。优选地,单一文件的数据被放入mp4-文件结构的 "mdat"原子中。换句话说,作为mpeg-4规范中公开的实例,mp4-文件结构用作容 纳单一文件的容器,该单一文件又用作存储DVD格式数据的容器。这些措施的优点是,不需放弃合并可以从DVD视频文件格式获知 的丰富内容的可能性,就可以使用最新的即4-文件格式。在另一优选实施例中,"mdat"原子的逻辑起始地址相对于mp4-文件的起始地址在2048字节的边界上对齐。如已知,2048字节是DVD上一个扇区的大小,而且是关于搜索视 频起始操作的最小单位,所述视频起始用于读取DVD。把"mdat"原子放置在2048字节边界上具有如下优点当搜索 "mdat"原子时,操作速度更快。在另一优选实施例中,单一文件存储在以相对于mp4-文件起始地 址的下一2048字节边界为逻辑地址而开始的"mdat"原子中,其中优 选地,"mdat"原子的起始地址与单一文件的数据的起始地址之间的空 间由"0"字节来填充。
换句话说,单一文件(其第一数据)位于2048字节的边界上,从 而对"mdat"原子的开始、更具体地为对单一文件的开始的査找过程 得以改进。例如,找到"mdat"原子的开始,则可以仅通过把该地址 舍入至下一2048字节边界而计算出"mdat"原子的开始。在优选实施例中,mp4-文件的音频和视频轨道的样本表(引用 (reference)表)对包含在单一文件中的所有音频/视频PES分组的有效载荷进行引用。如同即eg-2规范和DVD视频规范中所述,PES分组是包含基本流数据的数据分组,所述基本流数据表示音频和视频信息。通过准备这个 包含对PES分组的引用的引用表,能够重建音频和视频基本流。这个措施具有如下优点不支持丰富内容的播放机可以通过分别 使用引用表及其中的引用(reference)来重放视频。在另一优选实施例中,把所有导航包填充至2048字节边界。这个措施具有如下优点由于导航包后的数据在2048字节边界上 开始,所以搜索性能提高,而且可以更快地进行査找。在另一优选实施例中,DVD视频格式数据包含作为视频对象单元 (VOBU) —部分的导航包,而且所述导航包由mp4-文件的"moov"原 子内的秘密轨道来引用。更优选地,该轨道包括引用表,并包括包报头、系统报头和导航 包的分组报头,所述引用表包含针对每一个导航包的一个引用。例如,下载的视频内容包含用于保护下载的内容免受非法复制和 分发的数字版权管理(DRM)。在DVD视频格式数据结构中,利用密钥对 包含在视频对象单元(VOBU)中的音频/视频数据进行编码,而密钥存 储在分配给该VOBU的导航包中。换句话说,每一个VOBU具有其自有的、 被分配用于对视频/音频数据进行解码的密钥。因此,在不访问导航包 的情况下,更具体地,在不访问存储在这个导航包中的密钥的情况下, 不能对包含在PES分组中的视频/音频数据进行解码,因而不能播放。提供所述秘密轨道的优点是,可以通过存储在秘密轨道中的引用 来访问导航包以及其中存储的各个密钥,从而该密钥可以被读取,并 用于对音频/视频数据进行解码。以mpeg-4编码的音频/视频数据内容存储 在DVD视频容器中,而且DVD视频的视频管理器管理表中的"提供商唯 一ID"字段被分为两个子字段, 一个子字段用于存储DVD视频是否包含 mpeg-4内容的信息,而第二子字段用于存储在检测到mpeg-4内容的情 况下所使用的第二 "首先播放PGC"的地址。首先,这个措施意味着存储在PES分组中的、以即eg-2编码的数 据被各个以mpeg-4编码的数据而替代,但是它们仍可以保留mpeg-2的 格式。这个措施自身具有如下优点在不放弃还提供可从DVD视频格式 获知的丰富内容的情况下,可以使用更为强大的即eg-4编码。如果相 应播放机不支持即eg-4编码,则使用第二"首先播放PGC"的地址;相 反,如果DVD播放机不支持mpeg-4内容,则第二 "首先播放PGC"引用 例如用于播放静止图像或任意其他信息的数据。通过任意上述方法所准备的单一文件可以通过一种方法得以重 建,在该方法中,使用每一个数据文件中引用相邻数据文件的起始地 址的相对地址引用,把包含在单一文件中的数据分入预定的数据文件 组。这里要注意的是,DVD视频格式规范中规定的文件组中的每一个 都包含引用其他文件的相对地址引用。这个固有信息可以用于重建或 恢复DVD视频数据文件。仅需要找出单一文件的开始,其与第一DVD视 频文件(即文件VIDE0—TS. IF0)的开始相对应。可以通过上述相对地 址来找出单一文件中包含的余下的文件。在另一优选实施例中,通过如下方式获得"mdat"原子中包含的 单一文件传递mp4文件以获得"mdat"原子的起始地址,以及把该地 址舍入(round)至下一2048字节边界,即第一数据文件(即 VIDE0_TS. IFO文件)的起始地址。如上所述,存储在"mdat"原子中的单一文件位于2048字节边界 上(相对于整个即4-文件的起始地址),从而通过搜索"mdat"原子的 开始、然后把该地址舍入至下一2048字节边界,来容易地对"mdat"原子内的单一文件进行定位。这个计算出的地址是第一数据文件(即 VIDEO_TS. IFO文件)的起始地址。
在另一优选实施例中,如果所述DVD设备不支持丰富内容,则音 频和视频的样本表中的引用用于访问包含在被引用的PES分组中的视 频和音频数据,以重建电影。这个措施具有如下优点每一个PES分组在音频和视频轨道中被 引用,从而能够通过使用这些引用而重建视频和音频流。如果所述DVD 设备不支持丰富内容,则可以使用这些引用。在另一优选实施例中,如果所述DVD设备不支持丰富内容,则所 述秘密轨道中的引用用于访问包含在被引用的导航包中的数据。更优 选地,每一个被引用的导航包包含用于对属于相同VOBU的PES分组的有 效载荷进行解码的解码密钥,而且所述解码密钥被读取并用于对所读 取的所述VOBU的PES有效载荷进行解码,特别是对音频和视频数据进行 解码。换句话说,如果所述DVD设备不支持丰富内容,则仍能够重放视 频,因为所述装置能够通过使用秘密轨道中的引用而访问导航包中存 储的解码密钥。在另一优选实施例中,通过创建与DVD视频兼容的UDF 1.02文件 系统、并把所述单一文件的片段连续地写到DC或DVD介质上,而把所述 单一文件复制到所述介质,其中所述片段具有任意大小。由于所有内容被存储在一个单一的文件内,所以DVD视频文件系 统关于最大文件大小的限制(例如IS0 9660文件系统要求文件不大于 2G字节)将被如下规则取代允许每个文件入口具有任意数目的片段, 但是所述片段必须物理相邻(连续)。所以基本上,不允许在光存储介 质上进行文件的分段。这允许很简单的文件系统驱动器堆栈。本发明的目的还通过一种DVD视频数据结构而实现,所述结构包 括具有视频/音频和丰富内容、以及根据DVD视频规范而组织的数据文 件组,其中所述数据文件组包含在一个单一的视频文件中,所述数据 文件被组织在所述单一文件中,在连续的数据文件之间不存在任何的 未使用的地址空间。上面关于根据本发明的方法所描述的优点对于这种DVD视频数据 结构也是有效的,从而可以省却进一步的描述。
在优选实施例中,所述数据文件组中的某些文件包含以即eg-4编 码的视频/音频信息。这个措施的优点是,在不放弃行业中所公知且普遍使用的DVD视 频格式的优点的前提下,可以使用更强大的mpeg-4编码。在另一优选实施例中,所述数据结构是至少包含"moov"原子和 "mdat"原子的mp4-容器结构,其中所述"mdat"原子包含所述单一 文件。mp4容器结构自身在本领域中是已知的,而且例如在ISO 14496标 准中有所描述,将其内容在此引入作为参考。与DVD视频数据结构相对 应的单一文件被存储在"mdat"原子内。这个措施允许在新的mp4容器 结构内使用广泛使用的DVD视频数据结构。因此,这个措施允许两个容 器结构的组合。在另一优选实施例中,所述单一文件在相对于mp4文件结构开始 处的2048字节边界处开始。更优选地,轨道原子包含引用数据,所述引用数据引用存储在图 像组(GOP;视频对象单元(VOBU)的结构)的PES分组中的每一个视 频/音频帧。更优选地,额外地将包含帧片段的每一个PES分组连同余下的帧 片段一同存储,而且所述轨道原子的所述引用数据引用所述额外存储 的帧数据。根据DVD视频规范,PES分组可以具有的最大长度为2'6字节。然而,帧长度可以超过这个最大长度,从而仅把帧中的数据片段存储在一个 PES分组中。由于轨道原子包含仅引用一个帧或整数倍数的帧的引用数 据,所以除了PES分组之外,还作为原始数据来存储帧片段。由此,轨 道原子中的引用数据对帧进行引用。在另一优选实施例中,提供了包含引用数据的秘密轨道原子,所 述引用数据引用每一个VOBU内的每一个导航包,用于访问存储在导航 包中的、对存储在被分配的PES分组中的编码的视频/音频数据进行解 码所需的密钥数据。本发明的目的还通过一种DVD播放机中使用的记录载体而实现,
其特征在于,把上述数据结构写到所述记录载体上。优选地,所述记 录载体被设置为DVD介质。本发明的目的还通过一种DVD装置而实现,所述DVD装置用于播放 存储在记录载体上的视频电影,所述DVD装置包括读取装置,用于读 取存储在所述记录载体上的数据;用于处理DVD视频格式文件的装置; 以及解码装置,用于对以mpeg-4和/或rapeg-2编码的数据进行解码,其 中所述DVD装置还包括分离装置,用于对存储在上述DVD数据结构的所 述单一文件中的数据文件组进行分离。在优选实施例中,所述分离装置适于从mp4容器结构的"mdat" 原子中读出所述单一文件。更优选地,所述分离装置适于查找"mdat"原子的起始地址,并 把该地址舍入至相对于mp4容器结构的开始的下一2048字节边界,以读 取所述单一文件。优选地,所述DVD装置包括第一引用装置,适于读取包含在所 述轨道原子中的所述引用数据,并适于读取包含在被引用的PES分组中 的视频/音频数据。更优选地,所述DVD装置包括第二引用装置,适于读取包含在 秘密轨道中的所述引用数据,并适于读取包含在每一个VOBU的被引用 的导航包中的密钥数据;以及解码装置,适于通过使用所读取的被分 配给VOBU的密钥数据而对所读取的所述VOBU的视频/音频数据进行解 码。在另一优选实施例中,所述解码装置还适于通过使用由许可服务 器提供的主密钥而对所读取的密钥数据进行解码。其他特征和优点可以从下文描述和附图中获得。要理解的是,在不背离本发明的范围的前提下,不仅可以以所给 出的各个组合,而且还可以以其他组合或以独立方式来使用上述特征 和下文将要解释的特征。


附图中示出了本发明的实施例,下文参考附图对本发明的实施例图中图1示意性地示出了DVD盘和存储在其上的DVD视频格式数据;图2示意性地示出了DVD视频VOB文件的逻辑数据结构;图3示意性地示出了视频PES分组;图4示意性地示出了逻辑mp4-容器数据结构的部分;图5示意性地示出了mp4-容器的"mdat"原子与地址空间的关系;图6示意性地示出了 "mdat"原子以及引用"rndat"原子中的PES 分组的轨道原子;图7示意性地示出了图6中的"mdat"原子和轨道原子,其中除了 各自的PES分组之外,还存储了两个PES分组的有效载荷;图8示意性地示出了引用作为视频对象单元一部分的导航包的秘 密轨道原子;图9示意性地示出了用于提供和使用DVD视频内容的系统; 图10示出了DVD设备的框图;以及图lla示出了用于把第一表示转换为第二表示的本发明的设备的 示意图;图llb示出了本发明的媒体处理器的示意图;图12示出了有效载荷数据调度的优选实施例;图13示出了具有再生的媒体文件/有效载荷块以及相关的有效载荷数据调度信息的数据实体的示意图;图14示出了具有MP4-文件形式的单一数据实体的优选实施例; 图15示出了MPEG-4中使用的原子封装结构的概图; 图16示出了针对大块原子的样本的MPEG-4描述;以及 图17示出了大块偏移原子的MPEG-4描述。
具体实施方式
在下文对本发明的描述中,使用了即eg-2或即eg-4 IS0规范中定 义的多个技术术语。因此,把这些规范的相应内容在此并入作为参考。 此外,本发明涉及DVD视频数据结构和mp4-容器结构,在可公开获取的 文件中也定义这些结构。例如,上文提到的mpeg-4规范中对mp4-容器
结构进行了描述。DVD视频规范可以从DVD论坛(www.dvdforum.org) 获得。与mpeg-2和mpeg-4有关的其他信息可以在书"The mpeg-4 book", Fernando Pereira et al., Prentice Hall PTR, 2002中找至lj,将其内 容在此并入作为参考。最后,可以在因特网网页ww. nerodigital. com上找到与申请人的 mpeg-4编解码器有关的所谓"Nero Digital"的详细信息。这个信息 在此也被并入作为参考。传统上,Nero Digital内容被存储在所谓的mp4-容器中。为了在 线分发预支配(pre-mastered)的内容,需要新技术以允许用户熟悉 的来自DVD视频盘的丰富内容表示。下文描述的NeroDigital-DRM (数 字版权管理)内容存储格式被设计用于同时满足内容生产者和内容消 费者的期望目标,即内容容易访问(读访问)、容易生产(写访问)、 支持丰富内容的CD设备的低开发成本、具有良好品质且可快速下载并 且空间消耗小的丰富内容、以及与不支持丰富内容的具有mpeg-4、Nero Digital功能的播放机的后向兼容。在图1中,在上半部分示意性地示出了已知的DVD视频容器格式的 结构。DVD视频容器格式通过多个指定文件来描述其内容。g卩,这些文 件是V工DE0—TS. IFO、 VIDEO—TS. V0B、 VIDEO—TS. BUP、 VTS—nn—0. IFO、 VTS_nn—m. V0B、以及VTS—nn—0. BUP,其中nn和m是等于或大于零的整数。 这些文件连续地且按照特定的、明确定义的顺序而存储在DVD视频介质 10上。这个顺序在上文提到的DVD视频规范中所有规定。通常,DVD视频盘包括Video—TS目录,该目录中包括音频/视频以 及元数据,而且额外包括例如控制数据的数据。术语"TS"代表标题 组。目录Video—TS必须包括Video—TS. IF0文件,该文件包括VMGI (视 频管理器信息)结构。VMGI包括与分离的标题在DVD上的编号和位置有 关的信息,而且额外包括主菜单的控制信息。VMGI的备份包括在文件 Video—TS.BUP (VMGI一BAK)中。主菜单的音频/视频数据位于文件Video—TS.VOB中。在DVD不包括 主菜单的情况下,可以省略这个文件。Video—TS.VOB中的数据被称作 VMGM (视频管理器菜单)。 DVD视频盘可以包括若干标题组。标题组是具有相同特性的若干标题的组,所述特性是例如分辨率、音轨等。作为标题组l的示例有例如主电影和电影的末端部分,作为标题组2的示例有第一片尾和第二片 尾。这些标题组中的每一个包括三个部分。标记组具有VTSI (视频标 题组信息)部分、VTSM (视频标题组菜单)部分和VTS—TT (视频标题 组标题)部分。VTSI被包括在文件VTS—nn—0. IF0中,而且nn指示标题组编号。VTSI 表包括控制信息和标题组中标题的更加详细的描述,例如章节的位置、 音轨出现的位置等信息。VTSI的备份(VTSI-BAK)被包括在 VTS_nn—0. BUP文件中。针对标题组中标题的菜单(音频菜单、子图像菜单、章节菜单,...) 的所有音频/视频数据被包括在VTSM (视频标题组菜单)部分中。VTSM 数据被包括在文件VTS—nnJ).V0B中,rm是标题组编号。当不存在菜单 时,可以省略这个文件。音频/视频数据,即标题的有效载荷,被包括在以VTS—nn」.VOB 开始的文件中。文件名中最后的编号是文件编号,而且nn是标题组编 号。由于UDF文件系统对于消费类设备是难以解析的,因此对DVD视频 媒体引入了约束,即每个文件中仅能够存在一个单一的范围(extent)。 IS09660文件系统的最大文件大小为2GB。 1G限额事实上来自这样的意 图,即避免每个文件具有多于一个的范围,因为对范围的搜索会变得 复杂得多。因此,由于单一范围的大小被限制为大约1G,所以通常大 于lG字节的标题的音频/视频数据被分为若干个文件。文件 VTS—nn_l. V0B、 VTS—nn_2. VOB、 VTS—nn—3. V0B,…中的数据在DVD上是 物理相邻的。这意味着例如VTS—rm—l.VOB中最后扇区之后的扇区是 VTS_nn—2. V0B的第一扇区(V0B-视频对象)。应当注意的是,所述文件包含引用其他文件的相对地址引用。因 此,具有DVD视频格式的所有指定的文件通过相对地址引用而彼此链接。考虑到UDF文件系统驱动器的复杂性,由于不曾存在大于预定范围 (1G字节)的文件,所以描述DVD视频内容的多个文件是有利的。然而,
对于下载来说,当用户从因特网进行下载时,所述多个文件相当不便。 在图1中,示出了一种使下载过程更为方便的方法。根据这个方法, 把多个文件连接在一起,并组合为一个由附图标记20所指示的大的内 容文件。这个单一的文件20包括表示DVD视频的所有文件。这些文件在 单一文件20中的顺序与DVD视频规范中规定的顺序相对应。保持这个顺 序使得可以使用文件中的地址引用来恢复原始的DVD视频文件组。特别 地,重放DVD视频所需的唯一的文件入口点是VTS一TS. IFO文件的开端, 这也是新的单一文件20的开端。通过对这个文件进行处理,可以基于 其中存储的地址引用来计算后续文件的起始地址(平面地址空间中的 相对逻辑块编号)。在图1中,箭头22指示文件包含对其他文件的地址引用。 这个单一文件的优点是,它可以很容易地通过因特网而下载。由 于这个单一文件不需要对原始文件21迸行分离和恢复时所需的任何额外信息,所以构造这个单一文件的过程是简单的。在图2中,示意性地示出了 ".VOB"的逻辑数据结构。 所谓的VOB文件包括交织的视频单元(ILVU),而该单元又包括一 个或更多个视频对象单元(VOBU)。每一个视频对象单元VOBU包括导 航包(NV—PCK),具有跳跃标记和时序信息;以及一个或更多个所谓的 图像组(GOP)。图像组GOP包括视频包(V—PCK)、音频包(A—PCK)以 及字幕包(SP—PCK),它们表示真实的视频、音频和字幕数据。视频对象单元是DVD播放机可以控制的最小单元实体。图像组包括要解码的数据,其中图像组由所谓的I帧开始,并在下一个I帧之前结 束(参见即eg-2规范)。如图2所示,视频包V—PCK包括所谓的视频PES分组(节目基本流), PES分组由分组报头和有效载荷来表示。有效载荷包括来自基本视频或 音频流的数据,即DVD播放机所要显示的帧。如上所述,这个数据以 mpeg-2的方式编码。图2所示的V0B文件结构通常是己知的,而且是DVD视频规范的一部分,所以这里不对该结构的更多细节进行描述。现在参考图3,示出了单一视频PES分组。与DVD视频格式相比,有
效载荷中的数据不是以mpeg-2编码,而是以mpeg-4编码。
再次使用DVD视频格式所运用的概念,是一种创建丰富的mpeg-4
内容的非常有效的方式。换句话说,这个方法提供了把mpeg-4内容封
装在DVD视频格式内的方式。
这个方法的基本原理是,把音频和视频流封装在与程序流(PS)
兼容的mpeg-2系统规范中,然后使用这些数据流取代传统的mpeg-2音
频/视频流来表示DVD视频盘的内容。即eg-4 DVD视频支持16像素倍数
的所有分辨率。也可以是高清晰度格式。
使用mpeg-4编码的数据来取代mpeg-2编码的数据的一个优点是,
显著地减小了存储视频和音频数据所需的存储空间。例如,mpeg-4编 码允许在CD-ROM而不是DVD盘上记录视频。
参考图4,部分地示出了即4-容器的逻辑结构。对于更多细节,参 考mpeg-4规范和其中描述的mp4-容器格式。
在本实施例中,包括所有DVD视频文件的单一文件20被放入mp4-容器的"mdat"原子30。然而,单一文件的DVD视频内容没有被"moov" 原子50内的任意轨道所引用。
因此,单一文件20和DVD视频内容在"mdat"原子30内、在相对于 mp4-容器文件40的开始的2048字节的边界上对齐。这确保了基于扇区 的搜索操作。为了实现这种对齐,必须利用0字节把单一文件20填充至 下一2048字节边界。所述对齐的示例如图5所示。例如,如果"mdat" 原子在相对地址x处开始(相对于mp4-容器文件40的起始地址),那么 单一文件20从"mdat"地址x后的下一2048字节边界处的地址开始存储。 "mdat"原子报头的末端与单一文件20的起始地址之间的空间由0字节 来填充。
这个对齐的优点是,支持基于菜单的强化的Nero Digital内容的 播放机仅需对mp4-容器40进行解析,以获得"mdat"原子的开端。舍 入至下一2048字节边界的这个值是DVD视频导航器的入口点;它是普通 DVD视频的VIDEO—TS. IFO文件的开端。
存储在mp4-容器40内的DVD视频内容的有用扩展是,通过mp4-容器 的"moov"原子50对DVD视频内容的主电影进行引用的选项。这使不支
持丰富内容的早期播放机能够对具有强化的Nero Digital标题的主电
影进行重放。
在图6中,示出了用于实现这个目标的数据结构。 在存储有单一文件20的"mdat"原子30中,即在最低逻辑等级PES
分组中,为了进行说明仅示出了这些分组。
如上所述,每一个PES分组包括报头部分和有效载荷部分。在有效
载荷部分,存储来自基本视频/音频流(以mpeg-2或mpeg-4编码)的数据。
根据这个实施例,每一个PES分组的有效载荷部分被作为轨道原子 60—部分的引用记录62所引用。
换句话说,轨道原子60包括引用记录62,每一个记录62引用了一
个PES分组的有效载荷部分。具体地,引用记录62包括各个有效载荷部
分的起始和结束地址。通过使用这些引用,能够重放由所有PES分组的
有效载荷部分中包含的数据所表示的电影。
由于轨道原子60中的mp4-容器的引用记录62总是引用完整的样本
(帧),因此所有的音频/视频PES分组必须包含至少一个完整的帧。这 个要求由箭头32和术语"n个帧"来表示,其中n是整数。在创建内容 时必须考虑这个要求。
对于DVD播放机,必须实现解多路复用器以实现关于大PES分组的 鲁棒性。如果需要,必须为成功的解多路复用提供足够的缓冲空间。
由于不同的帧具有不同的大小,把音频/视频PES分组关于2048字 节边界进行对齐不再是可行的(需要在每一个A/V PES分组之后插入填 充)。为了避免这个对齐问题对搜索性能产生负面影响,作为视频对象 单元VOBU—部分的所有导航包必须被填充至2048字节的边界。
参考图2, PES分组的报头保留两个字节用于存储PES分组的长度。 这意味着PES分组的最大大小是65531字节。对于高清晰度内容,这可 能不足以存储完整的帧,所以可能不能引用来自即4-容器轨道60的相 同内容。
为了克服这个缺陷,把表示帧片段的有效载荷部分存储两次。在 图7示意地示出了这个方法。这里,PES分组33、 34仅包含一个帧的片
段,即PES分组33的有效载荷部分中的第一片段和PES分组34的有效载 荷部分中的第二片段。第一片段和第二片段共同表示一个帧。
其中存储的有效载荷部分和数据以连续的方式额外地分别存储 (原始音频/视频(A/V)数据)。现在,引用记录62引用原始A/V数据, 而不引用PES分组33、 34的有效载荷部分。
被提供用于通过因特网进行下载的多数视频内容携带有数字版权 管理,以便保证该内容不会被非法复制、播放等。数字版权管理的一 部分是内容加密。在本实施例中,使用每个标题(电影)的存储密钥 来进行内容加密,该密钥可以从许可服务器获得。这个密钥类似于VCPS
(视频内容保护系统)规范中使用的唯一密钥。把内容加密绑定到介 质不需要对内容文件进行修改,仅需把该内容文件的许可信息存储在 介质上的某处,该信息使用从唯一介质ID中导出的密钥而被加密。这
个密钥存储在许可中。
上述Nero Digital DRM格式支持基于每个单元(DVD视频VOBU)的 复制保护的启用/禁用。这允许支持广播标志(DVB、数字视频广播) 的实时记录、根据内容提供者(广播站)的请求而动态地启用/禁用复 制保护。
图2所示的DVD视频导航包(NV—PCK)存储有用于对A/VPES分组和 指定复制控制信息的设置进行加密的程序密钥。使用为该电影而指定 的唯一密钥对该程序密钥自身进行加密。这个加密以与用于把内容加 密绑定至物理介质的VCPS技术类似的技术进行。
换句话说,可通过存储在被分配给相同VOBU的导航包中的程序密 钥,对分配给图像组的有效载荷进行解码或解密。然后,通过存储在 这个视频对象单元的导航包中的另一个密钥,对被分配给下一VO別的 PES分组的有效载荷进行加密。
在图8的示意图中示出了三个视频对象单元,每一个都包含导航包 和图像组,其中图像组包括要解码的PES分组。
为了保证DVD播放机即使在不支持丰富内容的情况下也能对PES分 组进行解码,mp4-容器40包括被称作秘密轨道原子的另一个原子70。 这个秘密轨道原子70包含引用记录72 (形成引用表),每一个引用记录72引用V0BU的导航包。这个引用表允许获得存储在导航包中的程序密 钥,以便对PES分组(还被引用记录62所引用)进行解码。
基于轨道原子60和秘密轨道原子70,即使DVD播放机不支持丰富内 容,也能够重建用于重放的音频/视频流。轨道原子60和70均为mp4-容器的"moov"原子的一部分。
因此,不支持丰富内容表示的DVD视频设备(例如启用Nero Digital DRM的设备)必须依赖这个秘密轨道原子70,以获得针对被加 密内容的合适密钥。然而,支持丰富内容的播放机在读取DVD视频导航 包时,可以忽略秘密轨道原子70和作为DVD导航一部分的结果密钥信 息。
导航包具有2048字节的固定大小。mp4-容器所引用的秘密轨道原 子70应当携带轨道类型(原子HDLR/TYPE) "NDRM"、名称(原子 HDLR/匪E) "Nero Digital DRM"。引用表(秘密轨道70)应当包含针 对记录的每一个导航包的一个入口,而不管实际上是否保护该记录。 与mp4-容器引用的音频和视频数据相比,NDRM轨道应当包括包报头、
系统报头和导航包的包报头。
通常,上述mp4-容器文件可以被复制到光盘或DVD介质上。对于 重放兼容性,作为稍有修改的与DVD视频兼容的UDF 1. 02文件系统来创 建所述文件系统。与DVD视频媒体相比,如果任意的mp4-容器文件大于 2G字节,则不应为媒体存储而创建IS09660文件系统。
由于上述数据结构在一个单一文件内存储了所有的内容,DVD视频 文件系统关于最大文件大小的限制(与DVD视频重放有关的文件入口不 会具有多于一个的片段的特征)将被如下规则取代允许每个文件入 口具有任意数目的片段,但是该片段必须在物理上相邻(连续)。所以 基本上,不允许在光存储介质上进行根据本发明的mp4-容器文件的片段化。
这允许在启用Nero Digital DRM的CE设备上运用非常简单的文件 系统驱动器堆栈,减小开发成本和推向市场的时间。
在图9中,示出了一种使用上述数据结构、即mp4-容器格式的系统。 系统100包括提供用于下载的视频内容的服务器102。此外,服务器102
把以DVD视频格式提供的视频内容转换为上述mp4-容器数据结构。例 如,这个转换包括参考图l所述的方法,即构造包括所有DVD视频文件 的一个单一文件20。此外,服务器102用于建立轨道原子60和秘密轨道 原子70的引用表。当然,服务器102也可以用作提供许可密钥的许可服 务器,通过该许可密钥对存储在导航包中的程序密钥进行解密。
服务器102提供的即4-容器文件可由用户104通过因特网下载,并 存储在计算机106或DVD播放机108上。计算机106或DVD播放机108适于 对mp4-容器文件进行处理,以便重放电影。
在图10中,示意性地示出了DVD播放机108的框图。DVD播放机108 可以和因特网相连,并可以与用于显示电影的监视器109相连。
DVD播放机108包括读取单元112,读取单元112被设置用于读取存 储在DVD介质或CD-ROM介质114上的数字数据。
读取的数据由处理器单元116进行处理。与处理器单元116相连的 是适于对以mpeg-2或mpeg-4编码的数据进行解码的解码单元118,以及 适于对存储在所述单一文件20中的数据文件组进行分离的分离单元 120。
DVD播放机108还包括第一引用单元122,第一引用单元122适于读 取包含在轨道原子60中的引用数据,并适于读取包含在被引用的PES 分组中的视频/音频数据。
DVD播放机108还包括第二引用单元,第二引用单元适于读取包含 在所述秘密轨道原子70中的引用数据,并适于读取包含在每一个VOBU 的被引用导航包中的密钥数据。解码单元126与第二引用单元124相连, 解码单元126适于通过使用所读取的被分配给所述V0BU的密钥数据来 对读取的VOBU的视频/音频数据进行解码。
总之,上述视频内容存储格式满足了针对内容生产者和内容消费 者的如下期望目标,即
-容易访问内容所述视频内容包含在单一文件中,所述单一文件 可以在对等网络上共享,或从网页上下载;
-受DRM保护的内容可以从任意可出售的DVD视频介质中产生,在不
失去菜单和用户交互(被称作丰富内容)的情况下,可以转换为上述
格式;
-通过以新的方式使用现有的技术,CE设备制造商可以把现有的
DVD视频导航架构与现有的Nero数字兼容硬件即eg-4解码器进行组合,
并用很少的工作就可获得对丰富内容的支持;
-通过同时利用mpeg-4和DVD视频的优点,能够实现具有良好品质 的丰富内容、快速的下载以及很小的空间消耗;以及
-丰富内容被嵌入对主电影标题进行引用的mp4-容器。因此,即使
在播放机不支持菜单的情况下,也可以保证主电影的重放。
图lla示出了用于把媒体内容的第一表示转换为媒体内容的第二 表示的本发明的设备的示意图。典型地,第一表示是DVD表示,而第二 表示是遵循MPEG-4的表示。通常,第一表示包括一个或更多个媒体文 件IIOO、 1102、 1104。每一个媒体文件包括图lla中被表示为"媒体文 件有效载荷"的有效载荷部分,以及在图lla中被表示为报头Hl、 H2 或Hn的控制部分。仅作为示例,每一个媒体文件可以表示电影场景。 所以,第一媒体文件1100可以包括第一场景的音频/视频内容,第二文 件1102可以包括第二视频或音频场景的音频或视频内容等。通常,每 一个媒体文件具有媒体文件有效载荷,用于表示该媒体文件的媒体 内容;以及媒体文件控制部分,包括针对相关的该媒体文件的媒体文 件有效载荷的控制信息。
通常,媒体内容的第一表示可以是具有至少两个文件的文件组, 每一个文件具有图lla所示针对文件1100和1102的报头块和有效载荷
块。备选地或额外地,第一表示可以是单一文件或多个文件,每一个 文件具有由控制部分分离的至少两个有效载荷部分。图2中示出了针对 该备选的示例,其中文件是视频对象文件(VOB),该文件包括有效载 荷信息的若干部分,这是因为该文件包括若干音频节目基本流或视频 节目基本流。备选地,这种单一文件具有由控制信息块分离的有效载 荷块,控制信息块在图13中被表示为文件VTS—01—0. VOB或 VTS一Ol一l. VOB。
本发明的装置包括用于产生数据实体的数据实体构造器1110,数 据实体是媒体内容的第二表示。根据本发明,数据实体构造器1110可
用于产生指示第二表示的数据实体类型的第二表示指示符。例如,所 述第二表示指示符是指示如下的指示符数据实体是MP4文件,即根据
MPEG-4标准而写入的文件或数据实体,MPEG-4标准也被称作国际标准 IS0/IEC 14496-1: 2002。
图lla中的1112处示出了第二表示指示符。此外,数据实体构造器 1110可用于再生至少一个媒体文件,从而再生的媒体文件包括再生的 媒体文件控制部分和再生的媒体文件有效载荷,其中再生的媒体文件 有效载荷用于表示第一表示媒体文件的媒体内容。通常,由再生的媒 体文件表示的媒体内容与再生的媒体文件表示的媒体内容相同。图lla 中在1114处示出了再生的至少一个媒体文件。在本发明的优选实施例 中,至少一个再生的媒体文件具有与第一表示媒体文件相同的文件结 构。在实施例中,与媒体文件l 1100相对应的再生媒体文件MF1'简单 地被复制到新产生的数据实体中。备选地,例如,与较早的解码器有 关的媒体文件1100的有效载荷部分可以被与相同的电影场景有关、但
使用不同的且优选地为品质上更好的编码器/解码器而产生的编码的 媒体文件有效载荷而取代。然而,第一表示媒体文件和再生的第二表 示媒体文件中的媒体文件有效载荷具有例如相同电影场景中或音频片 段中的媒体内容。
类似地,数据实体构造器可以对报头或控制数据进行修正。例如, 对控制数据的修正或修改的示例是,增加与数据实体构造器1110有关 的信息,或增加额外的元数据等。然而在优选实施例中,例如H1'的控 制块可能不会被修改,使得当第一表示是DVD表示时,新产生的数据实 体内的所产生的媒体文件不再能够被DVD刻录机播放。所以,本发明优 选地再生至少一个媒体文件,使得至少一个再生的媒体文件遵从相同 的格式要求,这对于第一表示媒体文件或多个第一表示媒体文件也是 有效的。
另外,数据实体构造器1110可用于产生有效载荷数据调度1116, 有效载荷数据调度具有调度信息,对于每一个再生媒体文件,调度信 息指示该再生媒体文件中有效载荷信息的开始。当再生媒体文件包括 由控制数据分离的若干块有效载荷信息时,有效载荷调度由数据实体
构造器1110产生,使得能够使用有效载荷数据调度1116来导出有效载 荷数据的每一个块的开始。优选地,数据实体1120是单一文件,该文
件可以被存储或从提供者发送至接受者。另外要注意的是,数据实体
1120不需要是物理文件,而是可以包括对MPEG-4标准所允许的附加位 置的引用。因此,数据实体1120将被看作逻辑结构或包括数据部分 1112、 1114和1116的逻辑容器。
图12示出了针对如下情况的有效载荷数据调度的优选实施例,即 存在若干第一表示媒体文件,每一个文件具有优选地在报头中的控制 部分以及有效载荷部分。在这种情况下,有效载荷数据调度优选地包 括第一再生媒体文件1200的有效载荷的起始地址、第二再生媒体文 件1202的有效载荷部分的起始地址、直到第n个再生媒体文件有效载荷
部分的起始地址。
图12的表中所示的这些地址可以是存储介质的相对或绝对地址,
新产生的数据实体存储在所述存储介质上。备选地,所述地址可以是
与任意存储介质分离的逻辑地址,而且优选地与数据实体的开始有关, 或者与解码器已知的数据实体的任意参考点有关。
备选地,写入有效载荷数据调度,使得表的入口并不指示有效载 荷块的起始地址,而是指示在前控制数据块的结束地址或指示在前控 制数据块的起始地址以及任何中间控制数据块的大小。当解码器已知 控制数据块的大小时(例如所有的控制数据块具有相同的大小),那么 仅给出控制数据块的起始地址或结束地址就足够了,从而需要分块的 媒体数据的数据解码器在处理媒体内容时可以跳过控制数据。
图llb示出了用于对结合图lla所讨论的数据实体进行处理的媒体 处理器的优选实施例。数据实体1120被输入解多路复用器设备1130, 该设备还可以被看作数据流解析器。数据流解析器对数据实体进行处 理,并在有效载荷数据调度信道1132上输出有效载荷数据调度,并通 过媒体文件信道1134处输出再生的媒体文件。优选地,解多路复用器 1130还用于在相应的输出信道1136处输出解码器类型指示。有效载荷 数据调度1132被输入有效载荷数据调度读取器1138,读取器1138控制 有效载荷数据解码器1140。有效载荷数据解码器接收再生媒体文件,
并输出解码后的媒体内容。模式控制输入1142优选地具有两个模式。 在模式1下,有效载荷数据解码器1140受控,使得解码器使用有效载荷 数据调度来跳过再生媒体文件中的控制部分。因此,当有效载荷数据 解码器是遵循MPEG-4的设备时,即该设备不能处理在有效载荷数据块 之间散置的任何控制块而是依赖没有被控制数据块分离的分块的数 据,使用模式l。
当模式控制输入1142被设置为模式2时,忽略有效载荷数据调度而 使用控制部分。模式2解码器可以是典型的DVD解码器,它原样读取再 生媒体文件,因此它不需知晓任何MPEG-4语法,而可以简单地读取并 处理图lla中的数据实体1120的部分1114。
随后,结合图13示出了用于把DVD格式或表示(MPEG-4表示)转换 为MPEG-4格式或表示的本发明的优选实施例。图13左边部分示出了产 生的媒体文件1114,而图13的右手端示出了有效载荷数据调度1116。 在DVD的示例中,写入图l实施例的第一文件组。然后,写入与第一电 影场景或第一组电影场景有关的第一视频对象文件。在这个实施例中, 这个对象文件包括若干控制部分,例如第一控制块或报头,以及针对 每一个PES分组的包报头和PES分组报头。然后,在每一个包报头和PES
分组报头后,写入优选地为加密的音频或视频数据。在音频的示例中, 这些音频数据可以是与音频片段的特定时间部分有关的音频编码器的 输出数据。在视频的示例中,标题为"加密的音频视频数据"的有效 载荷块包括图像组的视频数据。因此,再生媒体文件1114组成了MPEG-4 PES分组集合,该集合构成了DVD视频流。
有效载荷数据调度1116包括每一个有效载荷块或样本的信息,从 而可以使用有效载荷数据调度1116来处理产生的媒体文件1114,以跳 过每一个控制块,从而解码器仅接收所需的有效载荷块,例如具有 MPEG-4形式的有效载荷块。
图14示出了MPEG-4文件。图14和后续的图15至17全都从示出了MP4 文件的文件格式的MPEG-4标准的第13章节中导出。通常,MP4文件包括 若干原子。文件中的主要原子是moov原子和mdat原子。moov项由图14 中的1400表示,而mdat原子由图14中的1402表示。在特定的分级顺序中,moov原子1400可以包括若干其他原子,这在图15的表中示出,图 15给出了MPEG-4标准的原子封装结构的概况。根据本发明,例如图13 所示的再生媒体文件1114被引入图14的mdat原子1402中,而图13中的 有效载荷数据调度1116被包括在moov原子1400中。随后,可以看出moov 原子中的哪些原子接收有效载荷数据信息,即每一个音频或视频样本 的有效载荷块的开始的指示。具体地,在标准的13. 2. 3. 15章节中示出 了样本表原子。
该样本表包含作为轨道中媒体样本的索引的所有时间和数据。使 用该表,可以在时间上定位样本、确定样本的类型、并确定样本的大 小、容器和在容器内的偏移。如果样本表原子的轨道包含在引用数据 中,则需要如下子原子样本描述、样本大小、样本至大块(sample to chunk)和大块偏移(chunk offset)。
样本表中所有子表使用相同的总样本数。此外,样本描述原子应 当包含至少一个入口。需要样本描述原子,因为它包含数据引用索引 字段,该字段指示使用哪个数据引用原子来获取媒体样本。如果没有 样本描述,则不能确定媒体样本的存储位置。
图16示出了sample to chunk原子,而图17示出了大块偏移原子和 相应的描述。具体地,sample to chunk原子给出了mdat原子中的大块 数据与样本的对应关系。具体地,在其常规的MPEG-4使用中,mdat原
子包括若干轨道的数据,其中,针对每一个轨道,单一入口应当是足 够的,因为在13.2. 3. 19章节中提到的表中的每一个入口标识了具有相 同特性的一连串大块,而这是轨道的常规情况。
然而,对于本发明,MPEG-4语法有可能是"错用"的,因为根据 本发明,作为新的"一连串大块"或新的"轨道"开始来用信号表示 有效载荷数据块的开始,而在图13的实施例中,仅存在单一的有效载 荷块"(加密的)AV数据"。因此,图13所示的有效载荷数据调度1116 可以被看作sample tochunk原子中的表的示意性表示。然而,在优选 实施例中,也使用大块偏移原子。通常,有效载荷数据块的开始由表 入口给出,这是因为正如图16中的13.2.3. 19章节的第三段中提到的, 每一个入口包括具有相同特性的一连串大块中的第一大块的索引。因
此,根据本发明,组成图13中的有效载荷的每一个音频视频数据块被 当作一连串大块,其中这个一连串仅具有单一的大块,即包括在PES
分组中的PES分组有效载荷。
取决于本发明方法的特定实施方式的需求,本发明的方法能够以 硬件或软件来实现。可以使用数字存储介质,特别是其上存储有电可 读控制信号的磁盘、DVD或CD来实现,它们与可编程计算机系统一同工 作,使得能够执行本发明的方法。因此,通常本发明是具有存储在机 器可读载体上的程序代码的计算机程序产品,当所述计算机程序产品 在计算机上运行时,所述程序代码用于执行本发明的方法。换句话说, 本发明的方法是具有程序代码的计算机程序,当所述计算机程序在计 算机上运行时,所述程序代码用于执行本发明的方法中的至少一个方 法。
根据上面的描述,本领域的技术人员现在可以理解,本发明的广 义教导能够以多种形式而实现。因此,虽然结合本发明的具体示例对 本发明的信息做出了描述,然而本发明的真实范围不应限于此,因此 在对附图、说明书和权利要求书进行研究后,其他的修改对于本领域 的技术人员来说将会变得显而易见。
权利要求
1.一种用于把媒体内容的第一表示转换为所述媒体内容的第二表示的装置,所述第一表示包括具有由媒体文件控制块分离的至少两个媒体文件有效载荷块的媒体文件,或包括每一个均具有媒体文件有效载荷块和媒体文件控制块的至少两个媒体文件,所述媒体文件有效载荷块表示所述媒体内容,所述媒体文件控制块包括相关的媒体文件有效载荷块的控制信息,所述装置包括数据实体构造器,用于产生数据实体,所述数据实体是所述媒体内容的所述第二表示,所述文件构造器用于再生所述一个或更多个媒体文件,使得在再生媒体文件中再生媒体文件控制部分位于两个再生媒体文件有效载荷部分之间;以及产生有效载荷数据调度,所述有效载荷数据调度具有调度信息,针对每一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒体文件有效载荷块的有效载荷信息的开始。
2. 根据权利要求1所述的装置,其中,存在具有由媒体内容确定 的预定顺序的多个媒体文件,以及所述数据实体构造器用于再生,使得所述再生媒体文件也具有所 述预定顺序。
3. 根据权利要求1所述的装置,其中,所述第一表示是存储在DVD 上的媒体内容,而且所述数据实体构造器用于产生遵循MPEG-4的数据 实体,以作为所述第二表示。
4. 根据权利要求1所述的装置,其中,所述数据实体构造器用于 连接所述再生媒体文件,从而对于所述数据实体内的数据序列,再生 媒体文件的控制块位于两个再生媒体文件有效载荷之间。
5. 根据权利要求1所述的装置,其中,所述数据实体构造器用于 产生遵循MPEG-4的表示,作为所述第二表示,所述有效载荷数据调度被包括在moov原子中,以及 所述至少一个媒体文件被包括在mdat原子中。
6. 根据权利要求5所述的装置,其中,所述有效载荷数据调度被 包括在所述moov原子所包括的样本表原子中。
7. 根据权利要求6所述的装置,其中,所述数据实体构造器用于 把所述有效载荷数据调度输入所述样本表原子所包括的sample to chunk原子中。
8. 根据权利要求6所述的装置,其中,所述数据实体构造器用于 在有效载荷数据调度中将每一个有效载荷数据块用信号表示为新的轨 道。
9. 根据权利要求1所述的装置,其中,所述数据实体具有包括与 所述数据实体的起始点有关的相对地址的地址结构,以及所述数据实体构造器用于产生所述有效载荷数据调度,使得再生 有效载荷块开始处的相对地址被包括在所述有效载荷数据调度中。
10. 根据权利要求l所述的装置,其中,存在多个媒体文件,所 述数据实体构造器用于再生所述多个再生媒体文件,使得所述文件彼此连接,以及产生所述有效载荷数据调度,使得所述有效载荷数据调度被包括 在与所述再生媒体文件分离的所述数据实体中。
11. 根据权利要求l所述的装置,其中,当产生所述至少一个再生 媒体文件时,所述数据实体构造器用于复制所述至少一个媒体文件。
12. 根据权利要求1所述的装置,其中,当再生所述至少一个再生 媒体文件时,所述数据构造器用于改变编码格式。
13. 根据权利要求1所述的装置,其中,当再生所述至少一个再生 媒体文件时,所述数据实体构造器用于修改所述控制信息。
14. 根据权利要求1所述的装置,其中,所述再生媒体文件包括属 于标题组的视频对象文件,所述视频对象文件具有一系列包,每一个 包具有包报头和节目基本流(PES)分组,所述PES分组具有PES分组报 头和PES有效载荷数据块,每一个PES数据块包括图像组的音频或视频 数据,以及所述数据实体构造器用于产生所述再生媒体控制部分,使得所述视频对象文件的所述再生媒体控制部分包括作为所述控制块的包报头和PES分组报头以及作为所述有效载荷数据块的所述PES有效载荷数据 块,以及所述数据实体构造器用于产生所述有效载荷数据调度,使得能够 指示所述PES有效载荷数据块的开始。
15. 根据权利要求1所述的装置,其中,所述数据实体构造器可用 于产生至少一个附加文件,所述附加文件不包括与所述媒体内容有关 的信息,而且所述数据实体构造器还用于产生所述有效载荷数据结构, 使得所述有效载荷数据结构不会引用所述至少一个附加文件。
16. 根据权利要求1所述的装置,其中,所述数据实体构造器用于 再生所述再生媒体文件,使得所述再生媒体文件的所述有效载荷的至 少一部分被加密。
17. 根据权利要求1所述的装置,其中,所述数据实体构造器用于 把所述至少一个再生媒体文件放入mdat原子,而且所述mdat原子的逻 辑起始地址相对于所述数据实体的所述起始地址在字节边界栅格上对 齐。
18. 根据权利要求17所述的装置,其中,所述数据实体构造器用 于再生所述至少一个媒体文件,使得所述文件自与相对于所述数据实 体的所述起始地址的字节栅格点相邻的逻辑地址处开始,而且以零来 填充所述mdat原子的起始地址与所述单一实体的所述数据的所述起始 地址之间的空间。
19. 一种用于把媒体内容的第一表示转换为所述媒体内容的第二 表示的方法,所述第一表示包括具有由媒体文件控制块分离的至少两 个媒体文件有效载荷块的媒体文件,或每一个包括均具有媒体文件有 效载荷块和媒体文件控制块的至少两个媒体文件,所述媒体文件有效 载荷块表示所述媒体内容,所述媒体文件控制块包括相关的媒体文件 有效载荷块的控制信息,所述方法包括产生数据实体,所述数据实体是所述媒体内容的所述第二表示, 再生所述一个或更多个媒体文件,使得在再生媒体文件中再生媒 体文件控制部分位于两个再生媒体文件有效载荷部分之间;以及产生有效载荷数据调度,所述有效载荷数据调度具有调度信息, 针对每一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒 体文件有效载荷块的有效载荷信息的开始。
20. —种表示媒体内容的数据实体,所述数据实体包括用于标识数据实体类型的表示指示符;一个或多个再生媒体文件,其中再生媒体文件控制部分位于两个 再生媒体文件有效载荷部分之间;以及有效载荷数据调度,所述有效载荷数据调度具有调度信息,针对 每一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒体文 件有效载荷块的有效载荷信息的开始。
21. —种用于处理数据实体的媒体处理器,所述数据实体具有表 示指示符、再生媒体文件以及有效载荷数据调度,其中,所述表示指 示符标识数据实体类型,再生媒体文件控制部分位于两个再生媒体文 件有效载荷部分之间,所述有效载荷数据调度具有调度信息,针对每 一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒体文件 有效载荷块的有效载荷信息的开始,所述媒体处理器包括有效载荷数据调度读取器,用于读取所述有效载荷数据调度信 息;以及有效载荷数据解码器,用于对所述再生媒体文件进行解码,其中, 所述有效载荷数据解码器根据所述有效载荷数据调度信息而受控,使得所述有效载荷数据解码器对所述两个再生媒体文件有效载 荷部分进行解码,以及所述有效载荷数据解码器跳过位于所述两个再生媒体文件有效 载荷部分之间的所述再生媒体文件控制部分。
22. 根据权利要求21所述的媒体处理器,还包括模式控制器,当所述模式控制器检测到所述有效载荷数据解码器是适于对所述媒体文 件的所述控制部分进行处理和解释的解码器时,所述模式控制器用于 控制所述有效载荷数据解码器不跳过所述至少一个控制部分。
23. —种用于处理数据实体的媒体处理方法,所述数据实体具有 表示指示符、再生媒体文件以及有效载荷数据调度,其中,所述表示指示符标识数据实体类型,再生媒体文件控制部分位于两个再生媒体文件有效载荷部分之间,所述有效载荷数据调度具有调度信息,针对 每一个再生媒体文件有效载荷块,所述调度信息指示所述再生媒体文件有效载荷块的有效载荷信息的开始,所述媒体处理方法包括 读取所述有效载荷数据调度信息;以及 通过如下步骤对所述再生媒体文件进行解码对所述两个再生媒体文件有效载荷部分进行解码,以及 跳过位于所述两个再生媒体文件有效载荷部分之间的所述 再生媒体文件控制部分。
24.—种计算机程序,当在计算机上运行时,用于执行权利要求19或权利要求23所述的方法。
全文摘要
为了把媒体内容的第一表示转换为所述媒体内容的第二表示,使用数据实体构造器(1110),它产生作为所述媒体内容的所述第二表示的数据实体(1120)。所述数据实体构造器产生第二表示指示符、至少一个再生媒体文件(1114)以及有效载荷数据调度(1116),所述有效载荷数据调度具有调度信息,针对每一个再生媒体文件,所述调度信息指示所述再生媒体文件的有效载荷信息的开始。所述再生媒体文件所表示的媒体内容与所述第一表示中的原始媒体文件(1100、1102、1104)所表示的媒体内容相同。
文档编号G11B27/10GK101111894SQ200580047242
公开日2008年1月23日 申请日期2005年10月5日 优先权日2005年1月25日
发明者奥利弗·扎克, 安德烈亚斯·埃克勒德, 理查德·莱塞 申请人:尼禄股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1