媒体电子文件的制作方法、装置及其播放设备及方法

文档序号:6782334阅读:163来源:国知局
专利名称:媒体电子文件的制作方法、装置及其播放设备及方法
技术领域
本发明涉及媒体播放技术领域,更具体说,涉及一种媒体电子文件的制作 方法、装置及其播放设备及方法。
背景技术
Matrox Electronic Systems Ltd.(迈创电子系统有限^>司)于1997年9月制 定了 OpenDML AVI Format Extensions (开放DML音频-f见频交错4各式范围), 用于捕捉、编辑和视音频序列的回放。格式信息和数据信息单独存放在一个 LIST(列表)中,每一项格式信息是唯一的。视音频数据是按帧存放,音频和 视频数据的大小和存放位置是随机的,每帧数据是非加密数据。文件尾含有整 个视音频数据帧的索引表。AVI(Audio Video Interleaved,音频视频交错)文件结构中格式LIST和媒体 数据LIST对其它非媒体和格式信息的数据的扩展不方便。另外,每一项的格 式信息都是唯一的,这对于需要增加的每一节目段的数据格式支持不够灵活。 例如,如果需要添加用户可编辑的EXIF(Extended information,扩展信息)信息, 在AVI中需要重新添加EXIF定义与LIST的支持;如果制作商制作音影文件 时,录制了多个不同参数的节目,那么AVI对此就无能为力,它对同一个格式 选项仅支持一项,不支持重复的同类格式信息。AVI中同步是根据视频的帧率与音频的比特率来进行视音频同步,在分离 音频和视频数据时,需要计算音频和视频的时间戳,同时无规律的音4见频帧顺 序导致了分离的效率低下,同步效率低,这直接影响了回放的效率。此外,AVI中缺乏一定的安全机制,缺少与外部安全机制联系的接口。 AVI 不能提供措施保障广告商利益。最后,AVI中松散的帧结构,难以满足K-Show(—种合成原唱、伴音、歌词、录音及录音回放的技术)中主音和伴音 的无缝切换。发明内容鉴于上述,本发明的目的是提供一种媒体播放方法和相应的便携式娱乐设备以及相应的系统,其支持多种文件格式,具有灵活的可扩展性。本发明的目的还在于提供一种制作^某体电子文件的方法及装置,能制作具有可扩展性的媒体电子文件。本发明实施例提供的一种制作媒体电子文件的方法,该方法包括 按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件, 其中,所述块结构包括若干个数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。本发明实施例提供的一种制作媒体电子文件的方法,所述媒体电子文件包括若干个数据块,分别为整体信息块,视频信息块、音频信息块、基本媒体数据块以及摘要信息块,该方法包括将同步视频数据和同步音频数据合成打包存储在基本媒体数据块, 将所述同步视频数据对应的文件视频信息存储在视频信息块,将所述同步音频数据对应的文件音频信息存储在音频信息块;以及,将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据块的摘要信息存储在摘要信息块。本发明实施例提供的一种制作媒体电子文件的装置,该装置包括 存储单元,用于存储媒体电子文件,所述々某体电子文件至少包括若干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘基本媒体数据处理单元,用于同步视频数据和同步音频数据合成打包存储在基本媒体数据块;视频信息处理单元,用于将所述同步视频数据对应的文件视频信息存储在 视频信息块;音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在 音频信息块;整体信息处理单元,用于将文件整体信息存储在整体信息块; 摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。本发明实施例提供的一种媒体播放方法,所播放々某体电子文件包含多个作 为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息块,用 于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用 于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个 主类的视音频数据的摘要信息的摘要信息块,该方法包括读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整 体信息、文件视频信息、文件音频信息以及摘要信息;根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格 式,对所述基本媒体数据块中的视音频数据进行解码;根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息 中的播放速率,进行同步播放。本发明实施例提供的一种便携式娱乐设备,包括数据存储器,所述数据存储器存储媒体电子文件,所述媒体电子文件包含 多个作为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息 块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息 块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存 储每个主类的视音频数据的摘要信息的摘要信息块;与数据存储器连接的处理器,所述处理器,用于处理;现频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和输出;用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数据 的DAC, ADC和DAC的配合实现声音的输入和合成输出。本发明实施例提供的一种系统,包括随机存取存储器RAM和执行其中的 程序的CPU或MPU,所述程序包括如下格式的文件所述媒体电子文件包含多个作为基本组织 形式的数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件 视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分 的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音 频数据的摘要信息的摘要信息块,当该文件被CPU或MPU执行时,能够执行 上述媒体播放的方法。在本发明制作媒体电子文件的实施例中,由于音频信息块和视频信息块单 独编辑,因此音频数据和视频数据可以按照不同格式编码在基本数据存储单 元,易于扩展媒体电子文件,而且,由于媒体电子文件以块为组织形式,每个 数据块可按照层次保存数据,因此,与现有技术相比,可以节省媒体电子文件 的存储空间。在播放所述媒体电子文件中,每个基本媒体数据块内的数据是已同步好的 数据,在播放时,无需担心同步问题和对时间戳进行计算和纠正。因此,相对 于AVI中音频数据帧和视频数据帧随机存放,显著改善了回放效率。


图1为根据本发明的一个实施例的AMVB文件的结构框图。 图 2为根据本发明实施例的AMVB文件中'AMVH,中的 MainAMVBHeader数据结构。图 3 为才艮据本发明实施例的 AMVB文件中'VMHD,中的 AMVBVideoStreamHeader凄t据结构。图 4为根据本发明实施例的 AMVB文件中'AMHD,中的 AMVBAudioStreamHeader数才居结构。图5为根据本发明实施例的AMVB文件中々某体数据SBCK中的 AMVBCUNKHeader数据结构。图6为根据本发明实施例的AMVB文件中'DRM,(数字版权保护)中的 AMVBDRMHeader lt据结构。图7为根据本发明实施例的AMVB文件中媒体数据摘要信息中的 AMVBINDEXENTRY数据结构。图8为根据本发明实施例的AMVB文件中'EXIF,中的EXIFOffset、 EXBaselnfo、 EXVideoInfo、 EXAudioInfo数据结构。图9为根据本发明实施例的AMVB文件中每个时刻歌词数据的 AMVBLYRIC数据结构。图10为根据本发明实施例的AMVB文件中分段节目数据的 AMVBPROGINDEXENTRY数据结构。图11为根据本发明实施例的AMVB文件中播放控制中的 AMVBCTLPLAY数据结构。图12为4艮据本发明实施例的AMVB文件中的编辑控制AMVBEDITCTR 数据结构。图13为根据本发明实施例的AMVB文件中的元素表描述AMVBFDDEPIC数据结构。图14示出播放媒体文件所需的硬件结构的一个实施例。 图15示出々某体文件制作的实施例。 图16示出媒体文件播放的实施例。图17A示出了一个实现完整的K-Show功能的实施例的流程示意图;图17B示出实现K-Show功能实施例。 图18示出广告播放控制实施例。 图19示出版权保护检测实施例。 图20示出生物i人^i正实施例。 图21示出编辑控制实施例。 图22示出播;^丈控制实施例。
具体实施方式
AVI(Audio Video Interleaved)是 一 种 RIFF(Resource Interchange File Format,资源交换文件格式)文件格式,多用于音视频捕捉、编辑、回放等应用 程序中。通常情况下, 一个AVI文件可以包含多个不同类型的媒体流(典型的 情况下有一个音频流和一个纟见频流),不过含有单一音频流或单一一见频流的AVI 文件也是合法的。在文件开始包含音频和视频格式信息。视音频数据是按帧存 放,音频和视频数据的大小和存放位置是随机的,每帧数据是非加密数据。文 件尾一般含有整个视音频数据帧的索引表。Matrox Electronic Systems Ltd.于 1997年9月制定了 OpenDML AVI Format Extensions。资源交换文件才各式(Resource Interchange File Format, RIFF)文件使用四 字符码(four-character code, FOURCC )来表征数据类型,比如'RIFF'、 'AVI'、 'LIST,等。最开始的4个字节是一个四字符码'RIFF,,表示这是一个RIFF文件; 紧跟着后面用4个字节表示此RIFF文件的大小;然后又是一个四字符码说明 文件的具体类型(比如AVI、 WAVE等);最后就是实际的数据。注意文件大小 值的计算方法为实际数据长度+ 4(文件类型域的大小);也就是说,文件大 小的值不包括'RIFF,域和"文件大小"域本身的大小。RIFF文件的实际数据中,通常还使用了列表(List)和块的形式来组织。列表 可以嵌套子列表和块。其中,列表的结构为'LIST, listSize listType listData —'LIST,是一个四字符码,表示这是一个列表;listSize占用4字节,记录了整也是一个四字符码,表示本列表的具体类型;listData 就是实际的列表数据。注意listSize值的计算方法为实际的列表数据长度+4 (listType域的大小);也就是说listSize值不包括'LIST,域和listSize域本身的 大小。再来看块的结构ckID ckSize ckData——ckID是一个表示块类型的四 字符码;ckSize占用4字节,记录了整个块的大小;ckData为实际的块凝:据。 注意ckSize值指的是实际的块数据长度,而不包括ckID域和ckSize域本身的 大小。注意在下面的内容中,将以LIST (listType (listData))的形式来表示一个 列表,以ckID (ckData)的形式来表示一个块,如[optional element ]中括号中的 元素表示为可选项。AVI文件类型用一个四字符码'AVI ,来表示。整个AVI文件的结构为一 个RIFF头+两个列表(一个用于描述媒体流格式、 一个用于保存媒体流数据)+ 一个可选的索引块。AVI文件的展开结构大致如下 RIFF ('AVI' LIST ('固''avih,(主AVI信息头数据) IiST ('strl,'strh,(流的头信息数据)'strf,(流的格式信息数据)['strd,(可选的额外的头信息数据)]['strn,(可选的流的名字)]))LIST ('movi,{ SubChunk|LIST('rec ,SubChunkl SubChunk2['idxl ,(可选的AVI索引块数据)])AVI文件的数据组织形式,是按LIST的方式分别表明格式信息和数据, 作为一种专门针对音影文件的文件格式,其缺乏对扩展信息的足够支持,比如 AVI文件格式是针对32位操作系统,整个文件大小不超过4G;再比如如果在 AVI中需要增加快速预览信息,则除了需要重新制定这个快速预览信息的格式 夕卜,还需要在格式LIST中增加该格式信息和增加另 一个LIST存放数据(因为 它不是音影播放数据,无法存放在LIST MOVI中)。并且如果有多个节目的时 候,AVI的格式信息是唯一的,其不支持不同格式信息的媒体数据。此外,逐 帧的结构视音频数据的随机存放增加了视音频同步的难度,降低了回放的效 率;由于没有涉及节目和内容保护,缺乏有效的安全性;包括整个视音频数据 帧的索引表,极大增加了整个文件的大小。下面举具体实施例详细介绍本发明的具体实施例方式。本发明实施例是按照块结构为基本组织形式,将视音频流进行编码,生成 媒体电子文件,其中,所述块结构包括若干个数据块,分别为用于存储文件 整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件 音频信息的音频信息块、用于按照划分的主类类别存储^L音频数据的基本媒体 数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。所述数据块可以按照分层结构存储信息。比如每个数据块可以至少包括多个主类块,每个主类块按照信息类别存储信息;主类块可以包括多个子类块, 每个子类块按照对应类别的子类存储信息。每个子类块可以包括多个层次块, 每个层次块按照对应子下的分层结果存储信息。每个层次块也可以包括多个基 本数据单元,用于存储数据的最小单位。下面再以基本J 某体数据块为例说明分层结构存储的实施例,如果基本媒体 数据块可以包括两个子类块,其中每个子类块用于存储-现频流或音频流。所述 子类块至少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同 步的视频流,第二层次块用于存储多帧同步的音频流。所述第二层次块包括多 个元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和 音轨分离的数据流。这里,当所述块结构包括多个视频信息块或多个音频信息 块时,每个视频信息块中存储的文件视频信息中的文件格式信息可以相同,也 可以不同。相应的,每个音频信息块中存储的文件音频信息中的文件格式信息 可以片目同,也可以不同。所述块结构还可以包括版权保护信息块,用于存储关键的版权保护或者 内容保护的信息。所述块结构还可以包括编辑控制块、元素块和元素描述块,其中,所述 编辑控制块,用于存储对视音频内容进行修改的控制信息;元素块,用于存储 对视音频内容进行修改的替换素材信息;所述元素描述块,用于存储所述替换 素材信息的格式信息。所述块结构还包括节目分段信息索引块,用于保存视频流分段的大小、 分段信息摘要和分段时间戳。这里,视频流可以按照时间、内容和语言中的一种或几种进行分^a。所述块结构还包含播放控制块,用于存储针对特定的环境下数据的权限 保护信息。所述权限保护信息可以包括隐私保护所有权信息长度,以及在所 述长度范围内的指紋信息或视网膜信息,用于提供给指紋传感器或者虹膜传感 器进行权限认证。所述块结构还包括快速预览图像信息块,用于存储多种语言的预览信息。 所述摘要信息还可以包括所述基本媒体数据块按照主类类别存储的视音 频信息之间的关联信息,自身与最近的广告块的偏移信息。所述块结构还可以包括歌词/字幕信息块,用于存储至少一种语言的歌词。 所述块结构还可以包括用户可定义信息块,用于存储用户自定义信息。 下面介绍下本发明实施例的制作々某体电子文件的方法。 本发明实施例的制作媒体电子文件的方法可以这样实现(1) 将同步视频数据和同步音频数据合成打包存储在基本媒体数据块,(2) 将所述同步视频数据对应的文件视频信息存储在视频信息块,将所 述同步音频数据对应的文件音频信息存储在音频信息块;(3) 将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据 块的摘要信息存储在摘要信息块。这里,步骤(1)、 (2)和(3)的顺序不限。在将同步视频数据和同步音频数据合成打包存储在基本媒体数据块之前, 可以进行水印处理,比如将同步视频数据嵌入水印,或将同步音频数据嵌入 水印。还可以生成数字版权管理DRM数据头保存在版权保护信息块中,并对 同步视频数据和/或同步音频数据进行数字版权保护DRM加密。当然,制作的媒体电子文件中,还可以进入如下的任何一个或几个操作。将多种语言的预览信息保存在预览图像信息块中;将特定环境下数据的权 限保护信息保存在播放控制块中;将视频流分段的大小、分段信息摘要和分段 时间戳保存在分段信息索引块;将至少一种语言的歌词保存在歌词/字幕信息块 中;将对视音频内容进行修改的控制信息存储在编辑控制块;将对视音频内容 进行修改的替换素材信息存储在元素块;将所述替换素材信息的格式信息存储 在元素描述块;将用户自定义信息存储在用户可定义信息块。本发明实施例的制作媒体电子文件的装置包括存储单元、基本媒体数据 处理单元、视频信息处理单元、视频信息处理单元、音频信息处理单元、整体信息处理单元和摘要信息处理单元。其中,存储单元,用于存储媒体电子文件,所述媒体电子文件至少包括若 干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘要信息块;基本媒体数据处理单元,用于同步视频数据和同步音频数据 合成打包存储在基本媒体数据块;视频信息处理单元,用于将所述同步视频数 据对应的文件视频信息存储在视频信息块;音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在 音频信息块;整体信息处理单元,用于将文件整体信息存储在整体信息块; 摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。该装置还可以包括如下一个或几个处理单元。水印处理单元,用于在将同步视频数据和同步音频数据合成打包前,将提 取的同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。加密处理单元,用于在将同步视频数据和同步音频数据合成打包前,生成 数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/ 或同步音频数据进行数字版权保护DRM加密。预览图像处理单元,用于将多种语言的预览信息保存在预览图像信息块中。播放控制处理单元,用于将特定环境下数据的权限保护信息保存在播放控 制块中。分段信息索引处理单元,用于将视频流分段的大小和分段时间戳保存在分 段信息索引块。歌词信息处理单元,用于将将至少一种语言的歌词保存在歌词/字幕信息块中。编辑控制处理单元,用于将对视音频内容进行修改的控制信息存储在编控制块;元素处理单元,用于将对视音频内容进行修改的替换素材信息存储在元素块;元素描述处理单元,用于将所述替换素材信息的格式信息存储在元素描述块。以下以一个具体化的实施例来描述本发明提供的文件格式,这里,将这里 格式p版),并且,为叙述方便起见,后面都采用这一称呼。然而,应当理解,本发明并不局限于这一具体的实施例。例如,AMVB文件本身的命名、具体的 参数名称、字节数等等都不能限制本发明,具有与AMVB相同或类似的基本 技术特征的任何文件都应落入AMVB的范畴。而且,具有本发明的基本技术 特征的一切修改、等同物和可选方案都应落入本发明的保护范围。在此描述的实例AMVB是一种用于解决高效回放、内容和节目安全的媒 体文件格式,它提供了节目分段、广告播放控制、K-Show(—种合成原唱、伴 音、歌词、录音及录音回放的技术)、影音编辑合成、支持多语言预览信息等 功能。AMVB的有效数据以块组成,块可以嵌套主类。块BLCK可以根据功 能需要增加或者减少,并且各个块BLCK的顺序可以打乱,每个块BLCK后 是主类标识,主类标识可以嵌套子类, 一个主类下可以包含多个同类型的子类, 子类下是各个层次的数据,各层次包含了不同类别的元素。AMVB文件基本配 置依次包括AMVB文件整体信息块、视频信息块、音频信息块、用户可定义 信息块、版权保护信息块、基本媒体数据块、摘要信息块。其中,基本媒体数 据块是以主类'MOVD,标识,子类'SBCK,组成。SBCK是回放的基本单位,每 个SBCK包含多个已同步的流信息,包括多轨道多语言音频流、视频流等。此 外,AMVB还可包含可选的播放控制块、编辑控制块、内容素材块、素材描述 块、多语言字幕信息块、多语言快速预览图像信息、多语言节目分段信息块等, 用于内容的隐私保护,交互编辑和4番》文。AMVB文件格式引入了块和类的概念,每个块含有主类标识和子类标识。 扩展了 EXIF(Extended information,扩展信息)、快速预览信息和字幕流信息; 增加了素材编辑和合成接口 ;增加的DRM(Digital right magagement,数字版斗又 管理)和水印功能接口提高了内容安全和节目安全性。以々某体数据块内子块(或 称子类)为同步和回放单位,极大的提高了回放的效率,同时也有效的减少了 整个AMVB摘要信息的大小。AMVB文件格式中同属一个主类的子类数据块 必须按照相应的顺序放置同一主类下,每个子类数据块可以不是唯一的。图1为根据本发明实施例的AMVB文件的结构框图。参考图1描述Amvb 文件的具体的技术特征。根据本发明的优选实施例,AMVB文件格式中的最大单元是 BLOCK(BLCK),每个块支持的大小用8字节表示,支持264-l字节大小的数 据。满足日益增长的数据和64位的操作系统的需求;相比AVI有更大的扩展 空间。AMVB文件格式中各块之间的顺序是不固定的,除了满足基本的AMVB 文件格式要求外,用户可以根据需求,增加自己需要的BLCK,扩展很灵活。利用AMVB格式,在节目录制时,可以在时间上和内容上对节目分段, 同时还支持对不同格式的节目的支持,也就是说,两个不同编码格式的媒体数 据,只要满足AMVB数据组织的要求,在转制时,不需要对两个不同编码格 式的媒体数据进行解码再编码,可以有效节省制作时间和增加节目录制的灵活 性。在AMVB格式中,数据组织形式即音视频流在一个基本回放单位内是时 间上基本同步的,不同于AVI中音视频数据帧的分离存放,在回放时,可以快 速的对音视频同步,提高了回放的速度。在AMVB格式中,整个节目的索引信息只包含每个基本回放单元的信息, 假设基本回放单元的时间是1秒,那么整个索引信息的大小至少比AVI中的索 引信息小帧率的倍数,很适合在资源有限的便携式式设备上使用。根据AMVB格式,amvb文件保留DRM接口和版权保护接口 ,对于内容 信息可以申请DRM保护或者版权保护,对于需要保护的模块,调用专用的 DRM或者版权保护库进行保护, 一旦出现非法用户,可以通过DRM信息来保 护内容不被破坏,通过版权信息来保护内容不被盗版和盗播。amvb格式是一种多层次结构,在同一层次下支持不同表达形式的相同内 容,如可以支持多语言功能。根据AMVB格式,通过增加控制编辑块、元素块和元素描述块提供交互 接口;根据AMVB格式,通过增加节目分段和字幕信息块,结合基本媒体信息 块提供完善的K-Show功能。根据AMVB格式,至少包括AMVB整体信息块、视频格式信息块,音频 格式信息块、DRM信息块、EXIF信息块、基本々某体数据块和摘要信息块从而 构成一个基本的AMVB文件。AMVB文件标识和大小标识为4字符'AMVB,,文件大小用8字节表示, 不包含4字符标识和用于表示文件大小的8字节。块文件的标识和大小每个块都有BLOCK(BLCK)标识,文件大小也用8 字节表示。AMVB文件整体信息块包含文件整体信息,由4字符主类标识'AVHD, 表示,紧接子类'AMVH,标识和该子类大小,MainAMVBHeader结构中包含 视频帧间隔时间、媒体信息子块最大字节数、媒体信息子块总数、广告信息子 块总数、总帧数、版本号、文件中包含的流个数、多语言分类、多音轨分类、 视频帧緩存大小、从文件头到DRM块的偏移量、从文件头到预览信息块的偏 移量、从文件头到媒体数据子块摘要信息块的偏移量、从文件头到媒体数据块 的偏移量、从文件头到辅助信息块的偏移量、从文件头到歌词数据块的偏移量、 歌词总条数、广告存放设置、广告播;改时间设置、总播;改时间、广告信息块的 总时长,此外还可以包括各种信息块的有效性标志以及是否加密和是否含有印信息的标志位,最后保留16字节用于扩展。视频信息块包含文件视频信息,由4字符主类标识'AMVV,表示,紧接 子类'VMHD,标识和该子类大小,AMVBVideoStreamHeader结构中包含一见频标 志、编码器插件号、预览信息语言分类、视频数据流的时基标准、视频帧率、 流的开始时间、流的长度、视频流数据緩存大小、视频的宽度、视频的高度、 颜色深度和播放大小,此外视频还有可选的补充的特殊一见频格式信息块,最后 保留8字节用于扩展。音频信息块包含文件音频信息,由4字符主类标识'AMVA,表示,紧接 子类'AMHD,结构标识和该子类大小,AMVBAudioStreamHeade结构中包含音 频标志、编码器插件号、音轨语言分类信息、数据流的时基标准、流的开始时 间、流的长度、流数据緩存大小、音轨数与音频的通道凄t、音频的采样精度、 音频的采样率、音频的比特率,此外音频还有可选的补充的特殊音频格式信息 块,最后保留8字节用于扩展。用户可定义信息块(扩展信息块)EXIF:用于可由用户定义的扩展信息, 由4字符主类标识'EXIF,表示,紧接子类'ofet,、 子类'base,、 子类'vido,和子 类'audo',以及各个子类的大小。子类'ofet,的EXIFOffset结构中主要包括后续 的exif信息相对于'EXIF,的偏移。子类'base,的EXBaselnfo结构中主要包括发 行次数、制作商、发行商、创作时间、发行时间地点、版权所有者、技术支持、 软件开发和评价等。子类'vido,的EXVideoInfo结构中主要包括帧宽高、颜色 深度、播放速率、压缩格式、影名、主要演员、关键词等。子类'audo,的 EXAudioInfo结构中主要包括音频编码信息、采样率、采样精度、比特率、演 唱者、歌曲名、关键词等。版权保护(DRMX言息块由4字符主类标识'DRM,表示,紧接子类'VDRM, 和子类'VDRM,,以及各个子类的大小。子类'VDRM,和子类'ADRM,各保留2K 字节的信息用于存储关4建的版权保护或者内容保护的信息。节目分段索引块由4字符主类标识'PBSK,表示,紧接子类'SBSC,标识和该子类的大小。每个分段节目索引信息由标识'psdx,, 分段节目每段的大小, 分段时间戳,12字节的扩展,语言数以及各种语言的分段节目内容的长度和 内容组成。基本i某体tt据块由4字符主类标识'MOVD,表示,包括各个由子类'SBCK, 标识的基本媒体数据子块(SBCK, SubBlock)及其大小。数据子块(这里也可称 为子类)内容可以分别是^L音频数据和广告视音频数据,每个子块中包括子块 头、各种语言和轨道的音频包、视频数据包。每帧视频数据包括3字节视频 帧头标识、1字节帧序号以及4字节帧大小;每帧音频包括3字节音频帧头标 识、1字节语言和轨道序号以及4字节该帧大小。其中,音频数据包可以多个 音轨,默认为1个音轨。注意,只有该媒体数据块中的主类标识'MOVD,可以 有多个,此时对应有多个节目的情况。基本媒体数据子块的摘要信息块由4字符主类标识'MMPS,表示,紧接 子类'SBPS,标识和该子类大小。子类'SBPS,由各个子块的摘要信息组成。每个 子块摘要信息由标识'SBCK,、 该'SBCK,的时间戳、该数据块相对于'MOVD, 的偏移、该数据块与其后最近广告块的最小偏移量组成。快速预览图像信息块由4字符主类标识'PVIF,标识,紧接子类'PVHD, 标识和该子类大小。子类下对应各个语言的预览信息,其有3字节prv标识和 一字节的语言标号标识,然后是该语言下的预览信息大小,预览图像信息可以 是包括格式信息的商标(LOGO)或者图像序列。歌词数据块:由4字符主类标识'WOAS,表示,紧接子类'LCPS,标识和该子 类大小。子类下对应于各个语言的歌词信息,每个语言的歌词信息由3字节lug 标识和1字节语言标识。每个时间的子块歌词信息由标识'lyrc,, 'lyrc,的时间 戳,该时刻歌词数据长度和有效歌词数据组成。控制信息块由4字符主类标识'COPL,标识,紧接子类标识'BSCO,和该 子类大小。子类内容包括隐私保护所有权信息、分段节目播放控制、时间播放 控制、存活控制、传播控制、传播平台控制、数据存放顺序和节目完整性信息。编辑控制块由4字符主类标识'EDCO,标识,紧才妄子类标识'BSCO'、 'PCCO'、 'AUCO'、 'TXCO'、 'OTCO,和各子类的大小。子类'BSCO,包括 了基本的信息包括总时长(4字节)、用到的各类别的元素信息总数(各4字节); 子类'PCCO,包括了图像元素在元素表中的类别、编号、时间戳,在画面中的位 置、该元素大小、时长、动作信息;子类'AUCO,包括了音频元素在元素表中 的类别、编号、时间戳、时长、演奏的乐器;子类'TXCO,包括字幕元素在字 幕信息表中的类别、编号、时间戳、持续长度和字体、特效和画面上的位置; 子类'OTCO,包括一些无法分类的信息包括用户自定义的语言等。元素块,由4字符主类标识'FDLY,标识。紧接子类标识'PCLY,、 'AULY,、 'TXLY,、 'BSLY,和'SPLY,和各子类的大小。每个子类包括每一元素类别大小 和子子类别标记和含有编号的有效数据。'PCLY,可以划分为人物类别('hum,)、 景物('viw,)、动物('zoo,)、卡通('kat, ) ; 'AULY,可以分成人声('poa,)和 乐声('mic,) ;'BSLY,可以划分一些基本的元素,比如几何形状、脸型等;其 中,元素块可以由多个,每个主类标识下根据需要可以增加相应的子类别。元素描述块,由4字符主类标识'FDDP,标识,紧接子类标识'PCDP,、 'AUDP'、 'TXDP,、 'BSDP,和'SPDP'和该子类的大小。每个子类包括格式信 息、包含元素子类别以及子类别文字描述。'PCDP,可以进一步划分为人物类别 ('hum,)、景物('viw,)、动物('zoo,)、卡通('kat, ) ; 'AUDP,可以分成人声 ('poa,)和乐声('mic,);其中主类标识'FDDP,可以由多个,每个主类标识下 根据需要可以增加相应的子类别。以本发明的文件格式制作的媒体文件,在很好的满足捕捉、编辑和播放功 能的同时,其灵活的扩展性,增加了完善的广告播放功能和多语言K-Show功 能接口;支持预览信息,节目分段和EXIF信息;改善节目和内容安全性,保 障了节目、内容和广告商的利益;提高了回放的效率、减少文件的大小同时也使得同步机制更加简单和可靠;增加了交互模式下利用元素素材库中的影音元 素对基本媒体数据进行编辑和合成的支持;提供了针对隐私和重要数据权P艮设置的4妻口。图 2为根据本发明实施例的AMVB文件中'AMVH,中的 MainAMVBHeader数据结构。其中各参数含义如下dwMicroSecPerFrame: 表示视频帧间隔时间(106/帧率); dwMaxBytesPercuk:表示所有SBCK单元中的最大字节数; dwFlags: 辅助信息选项; dwTotalsubCuk: 该文件中SBCK的总数;dwTotalADsbck: 该文件中广告信息块的总凄史; dwTotalFrames: 该文件中的总帧数;dwVersion: 版本号;dwStreams: 数据流个数; dwlanguage: 支持语言数; dwtrack: 支持音轨数; dwSuggestedBufferSize:表示流中4见频緩存大小;dwOffsetofDRM[2]: 表示从该节目文件'AMVB,标志到相对应的'DRM, 标志处的偏移,〗氐位在前,高位在后;dwOffsetofofet[2]: 表示从该节目文件'AMVB,标志到相对应的EXIF中 'ofet,标志处的偏移,低位在前,高位在后;dwOffsetofPVHD[2]: 表示从该节目文件'AMVB,标志到相对应的 'PVHD,标志处的偏移,低位在前,高位在后;dwOffsetofMOVB[2]: 表示从该节目文件'AMVB,标志到相对应的第一 个'MOVD,的偏移,低位在前,高位在后;dwOffsetoflndx[2]: 表示从该节目文件'AMVB ,标志到相对应的'MMPS,的偏移,低位在前,高位在后;dwOffsetLyrc[2]: 表示从该节目文件'AMVB,标志到相对应的'LCPS, 的偏移,低位在前,高位在后;dwTotalLyrc: dwADflags:成放置;dwADInterval:放间隔;dwTotalTime: dwTotal ADTime: dwReserved[4]:表示歌词的总条数;最高位设置AD存放模式,1为独立放置,0为合当dwADflags最高位为1时,指定播放时间或者播总播放时间;总的AD播放时间;保留。图3为根据本发明实施例的AMVB文件中'VMHD,中的 AMVBVideoStreamHeader数据结构。其中各参数含义如下fccType:fccHandler:dwFlags:dwFields:dwOriTime:^见频才示志为'vido'; 表示视频编码器插件GUID号; 预览图像序列(logo)对应的语言分类; 视频流中一帧分的场数;用于表示该视频数据流的时基标准,32位(单位:ms);dwFmmeRate:dwStart:dwLength:视频帧率; 流的开始时间; 流的长度;dwSuggestedBufferSize:读取该一见频流数据建议使用的緩存大小; dwWidth: 表示视频的宽度; dwHeight: 表示视频的高度;dwBitCount: 表示颜色深度;rcFrameL和rcFrameH:指定这个流在视频主窗口中的显示位置; dwReserved[2]: 备用;图4为根据本发明实施例的AMVB文件中'AMHD,中的AMVBAudioStreamHeader数据结构。其中各参凄t含义如下 fccType: fccHandler: dwFlags: dwOriTime:ms);dwStart: dwLength:dwSuggestedBufferSize dwChannels: dwBitsPerSample: dwSamplesPerSec: dwBitrate: dwReserved[2]:图5为根据本发明实施例的AMVB文件中々某体数据SBCK中的 AMVBCUNKHeader数据结构。其中各参数含义如下 dwStrType:基本的^f见音频流信息 bit
: SBCK包含的视频流总帧数; bit[7…14]: SBCK包含的音频流总帧数;bit[15]: SBCK中音视频位置先后选项,0表示音频在前,1相反; dwTick:时间戳,精确到毫秒(ms); dwOffset:时间偏移,精确到毫秒(ms); dwTxts:字幕流信息;dwSzRnd:从头'SBCK,到第二个流头的距离; dwflags: 备用; dwReserved:保留;音频才示志为'audo'; 表示音频编码器插件GUID号; 音轨对应的语言分类;用于表示该音频数据流的时基标准,32位(单位:流的开始时间; 流的长度,建议取值总有效音频数据长度; :读取该音频流数据建议使用的緩存大小; 低8位为音频的通道数,高8位为音轨数; 音频的采样精度; 音频的采样率; 音频的比特率; 备用;图6为4艮据本发明实施例的AMVB文件中'DRM,中的AMVBDRMHeader 数据结构。其中各参数含义如下dwReserved[2048]: DRM(数字版权保护)内容;图7为根据本发明实施例的AMVB文件中々某体数据摘要信息中的 AMVBINDEXENTRY数据结构。其中各参数含义如下dwChunkld: 表征本数据块的四字符码;dwTick: 用于该SBCK的时间戳,32位(单位,ms);dwOffset: 本数据块在文件中的相对于本节目段的'MOVD,的位置;dwOffsetAD: AD块信息;图8为根据本发明实施例的AMVB文件中'EXIF,中的EXIFOffset、 EXBaselnfo、 EXVideoInfo、 EXAudioInfo数据结构。其中EXIFOffset结构描述 了对应于EXBaselnfo、 EXVideoInfo、 EXAudioInfo数据结构中每一个参数相 对于'EXIF标识的偏移。EXBaselnfo中的参数含义如下PublishTimes:发行次数;(2字节)Make:制作商;(36字节)Medium:媒体信息;(16字节)Mode:模式;(24字节)Publish:发行商;(32字节)CreatData:创作时间;(32字节)PublishData:发行时间;(32字节)Location:首次发行地点;(40字节)Copyright:版权所有者;(24字节)Technical:技术支持;(56字节)Software:软件开发;(24字节)Comments:评价;U256字节)EXVideoInfo中的参数含义如下dwWitdh: 视频帧宽度;(2字节)dwHeight: 视频帧高度;(2字节)dwBPP:颜色深度;(2字节)dwBitRate: 视频播》文速率;(4字节)dwCompression:压缩才各式;(4字节)dwTime: 持续时长;(2字节)MovieName:影名;(56字节)Actor: 主要演员;(48字节)KeyWord: 关键词;(100字节)EXAudioInfo中的参数含义如下dwID: 音频编码信息;(2字节)dwSamplerate: 采样率;(4字节)dwSamplebits: 采样精度;(2字节)dwBitRate: 比特率;(4字节)dwTime: 持续时长;(4字节)Author: 演唱者(32字节)MusicName:歌曲名(64字节)KeyWord: 关键词(80字节)图9为根据本发明实施例的AMVB文件中每个时刻歌词数据的 AMVBLYRIC数据结构。其中各参数含义如下dwChunkld: 表征本数据块的四字符码,'lyrc,; dwTick: 用于该'lyrc,的时间戳,32位(单位,ms);dwOffset: ptrBuf的长度; ptrBuf: 数据指针;图10为根据本发明实施例的AMVB文件中分段节目数据的AMVBPROGINDEXENTRY数据结构。其中各参数含义如下 dwChunkld: 表征本数据块的四字符码,'psdx,; dwMovSize: 该分段节目数据长度(包括'MOVD,);dwTimeStamp:日于间戳; dwReserved[3]: 保留; dwLanguage: 语言数(《32 ); *dwLength: 每段语言的节目信息长度; *ptrBuf: 数据指针;图11为根据本发明实施例的AMVB文件中播放控制中的 AMVBCTLPLAY数据结构。其中各参数含义如下dwOrder: 数据排列信息(参数,不在dwCrllnfo中给出);dwPracy: 控制信息包括隐私保护所有权信息长度dwpsctr: 分段节目播放控制信息长度dwTimeCtr: 时间播放控制信息长度dwlong: 存活控制信息长度dwspreadctr: 传播控制信息长度dwsprosctr: 传播平台控制信息长度dwintegrality: 完整性标识长度;dwreserved: 保留*dwCrlInfo: 以上各个控制信息内容;dwcb: ^卜充扩展长度图12为根据本发明实施例的AMVB文件中的编辑控制AMVBEDITCTR 数据结构。其中各参数含义如下dwClassify: 元素表中的类别 dwNo: 元素表中的编号 dwTime: 时间戳dwLastTime: 时长 dwRect:画面中的位置 dwSrcSize: 源大小 dwAct: 动作信息 乐器信息字体信息 特效信息dwYq: dwfont dwSp: dwres: dwcb:保叙田补充扩展长度图13为根据本发明实施例的AMVB文件中的元素表描述AMVBFDDEPIC 数据结构。各参数含义如下 dwClassify: 元素类别 dwwidth: 图像元素的宽 dwheight: 图像元素的高 dwbpp: 图像元素的色彩数 dwCp: 编码器 dwsample:音频采样率 dwbitrate:音频比特率 dwbits: 音频采样精度 dwtotal: 总子类别元素个数 dwChlen: 文字描述长度子类图片描述长度 子类别文字描述 子类别图片或者音频缩略描述dwDepicLen: dwChTxt: dwDepic: dwreserved:保叙田dwcb: 补充扩展长度在本发明实施例中,AMVB的有效数据以块组成,块内包含主类。块BLCK 可以根据功能需要增加或者减少,块BLCK可以随机存放,每个块BLCK后 是主类标识,主类下面是子类, 一个主类下可以包含多个同类型的子类,子类 下是各个层次的数据,各层次内是不同类别的元素。AMVB文件基本配置依次 包括AMVB文件整体信息块、视频信息块、音频信息块、版权保护信息块、 基本媒体数据块、摘要信息块。基本媒体信息数据块中每个子块包含已同步的 音-见频流。该结构相对一般的^某体文件格式如AVI,扩展性区别如下将整体信息块,视频信息块,音频信息块单独存放,当需要将不同格式的 音频或者视频数据包含在文件中时,可以增加视频信息块或者音频信息块,将 该格式信息包含在内。子类下层次,层次包含不同元素的结构,可以对在同一层次下区分不同的 元素,比如,在音频流层次,包含各种语言的各种音轨。在AVI中只分音频流 与视频流,不再往下细分,也就是说无法扩展。这种组织方式相对并列结构, 逻辑更清晰,扩展更方便,因为并列结构在扩展时,必须4姿顺序规定好每个数 据单元的代表何种信息,而我们这种方式每个数据单元(元素)的信息是通过 层次下的每个信息字段标识出来,顺序是不强制的。此外这种方式组织的数据 更紧凑,因为将同层次下同类别数据放在一起,查找更方便。版权保护信息块,由于AVI中数据是非加密的,而AVI中并没有定义来区 分是否加密了数据。其它区别第一、基本媒体信息数据块中每个子块包含已同步的音视频流,回放时查 找更快。摘要信息块相对原AVI中的indx (索引信息)块更小,因为摘要信息 块中标识的是每个媒体信息数据块中每个子块的信息,而每个子块是经过同步 的音视频流,同步的时间可以是1S, 0.5s等,如果同步是1S相对AVI就节省 了 20倍~ 30倍的数据量。第二、摘要信息块中,含有字段描述各个媒体数据子块间的相互关系,比 如某些媒体数据子块需要播放,而某些媒体数据子块无需播放时,就可以通过该字段进行控制。而AVI中是没有控制信息可以描述的地方。作为播放amvb文件的硬件设备,可以是任何形式和结构的具有随机存取 存储器(RAM)和执行其中的程序的CPU或MPU的装置,其中RAM可以接 收并存储计算机程序和应用程序作为临时和/或非易失性状态的计算机可读指 令。可以进一步具有从硬盘读取和写入到其中的硬盘驱动器、从磁盘读取和写 入到其中的磁盘驱动器和/或从光盘读取和写入到其中的光盘驱动器。存储介质 的实例包括但不限于CD-ROM、磁光盘、ROM、 RAM、 EPROM、 EEPROM、 高速闪存、磁或光卡、DVD或适合于存储电子指令的任何类型的媒介。本领 域普通技术人员将会理解到 一种或多种这种存储器、驱动器和它们相应的媒介 都是存储计算机可读指令的计算机程序产品的实例,当这些程序产品被CPU 或MPU执行时,它们可以执行本发明的方法步骤的全部或其一部分。这些程 序产品的执行或程序产品本身也作为本发明的实例。对于在计算机领域中的普通技术人员显然的是,使用根据本发明的教导编 程的通用数字计算机也可以方便地实施本发明。例如利用本发明实施例的 amvb文件进行播放的装置可以包括各种主机、终端、PC机、膝上型电脑、掌 上型电脑等等。当计算机装载并执行适当的软件代码或程序时,这些适当的软 件代码或程序可以执行本发明的方法步骤的全部或其一部分。这些程序的执行 或程序本身也作为本发明的实施例。基于本发明的教导普通技术人员容易地制 备的适当的软件代码或程序对于在软件领域的普通技术人员来说是显然的。具 体而言,本领域的普通技术人员将会认识到,可以以许多种计算机语言(包括 但不限于C、 C++、 Fortran、 Basic等)编写实现本发明的计算4几程序产品。 对本领域普通技术人员很显然的是,通过制备专用集成电路或者通过与常规设 备和电路的适当网络互连也可以实施本发明。以下通过几个实施例进一步示意利用amvb文件进行播放的方法和设备。本领域技术人员可以理解,本发明的实施不局限于这些具体的实施例。 实施例1图14提供了播放amvb文件的硬件结构的一个实施例,基本结构包括控制 设备开关的电源(Power )、静态存储器(SRAM )、处理器、模数转换单元(ADC )、 数模转换单元(DAC)等。SRAM用于存储媒体电子文件,所述々某体电子文件 包含多个作为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频 信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用 于存储每个主类的视音频数据的摘要信息的摘要信息块,当然,还可以存储图 l所示的媒体电子文件;与数据存储器连接的处理器,所述处理器,用于处理 视频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和 输出;用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数 据的DAC, ADC和DAC的配合实现声音的输入和合成输出。选择地,为控制未经授权的使用,还包括一个传感器,用于釆集用户的指 紋或者虹膜特征信息,并将传感器中SDRAM里的图像输出到处理器进行匹酉己; 处理器用于处理视频流,负责视频流的解密、解压缩和显示和对音频流数据的 解密、解压缩和输出;ADC负责声音信号的输入采样量化;DAC提供音频数 据转换成声音数据;ADC和DAC的配合实现声音的输入和合成输出(K-Show 实现条件之一 )。处理器在播放同时可将ADC输入的声音或者合成声音录制成指定格式文 件,并记录起始时间。选择地,当处理器对采用同音轨数目的处理时,将更加有利于K-Show的 实现,可以提高实时性。实施例2图15提供了一个AMVB文件的制作实施例。该实施例的制作包含了 DRM 保护,版权保护,节目分段,广告选项和多音轨(伴音设置)。首先,设置视音频的格式信息,文件格式信息,包括节目表、DRM选项、 广告播放选项、音轨数等;其次,对含有数据组织信息的视音频数据,根据 DRM选项和版权保护选项分别嵌入水印信息和DRM加密,其中在音频数据 DRM加密前,需先生成一个DRM数据头写入文件;此外,凄t据组织信息包括 数据块类型(广告/非广告),该音频流音轨数,时间戳;然后,将经过保护的 视音频数据按次序写入文件,同时更新图2整体数据块(如时长、各块偏移等) 和图7媒体数据摘要信息块,并加密这两个数据块;最后,如果有的话,还要 写入用户输入的用户信息和预览信息。参见图15所示,AMVB文件的制作步骤如下步骤501:设置视频参数,包括视频高度、宽度、帧率以及编码器。 步骤502:设置音频参数,包括声道数、比特率、采样率、采样精度、编 码器。步骤503:设置节目表,包括DRM选项、广告播放选项、同步最小单位、 音轨数设置、语言分类设置、流数、伴音设置、水印信息设置、控制信息设置, 然后步骤512。步骤504:输入含数据组织信息的同步视频数据。步骤505:判断该数据是否需要嵌入水印,如果需要,执行步骤506,否 则,执行步骤507。步骤506:嵌入视频水印,执行步骤507。步骤507:判断是否需要进行DRM保护,如果需要,则对该数据进行加 密处理,执行步骤512,否则执行步骤512。步骤508:输入含输入组织信息的同步音频数据。步骤509:判断是否需要嵌入水印,如果是,则执行步骤510,否则,执 行步骤511。步骤510:嵌入音频水印,执行步骤511。步骤511:判断是否需要进行DRM保护,如果是,则生成DRM头数据,蒋该DRM头数据写入DRM块,并加密数据,执行步骤512,否则,执行步骤 512。步骤512:才艮据设置的参数,以及同步视频数据以及同步音频数据进行合成o步骤513:判断所有节目数据是否合成完毕,如果合成完毕,则执行步骤 512,否则,执行步骤514.步骤514:更新整体数据块、更新摘要信息块、步骤515:判断是否有用户信息或预览信息输入,如果有,则执行步骤516, 否则,结束本流程。步骤516:写入用户信息,写入预览信息。 整个AMVB文件的文件结构图,可参照图1 。在本发明实施例中,文件制作过程主要是将经过同步的音频和视频流放在 一起(打成一个packet),相对AVI,采用对逐帧的^L音频数据的随机存放,造 成对应时间点的音视频数据的位置比较分散,这就需要在解码播放时,搜索上 下一定范围内的音频或者视频数据,增加读取数据的次数,而当范围比较大时, 会需要更多的时间。而在制作时将经过同步的音频和视频流放在一起,可以减 少读取文件的次数,完全不需要进行搜索,可以直接达到指定播放点,从而达 到快速回》i:的目的。实施例3图16提供了一个AMVB文件的播放实施例。在播放AMVB文件前首先需要检测是否含有播放控制块,DRM数据保护, 节目表;对含有播放控制块的AMVB文件进行合法用户权限4企测;对含有DRM 保护的进行DRM头数据解密,并解析媒体数据摘要信息块,4企测数据的完整 性;待合法性和完整性检测完成后,解析节目表,将节目表信息输出,节目表 中每个节目的信息可参照图10;根据系统要求播放的节目号,读取该节目数据, 进行同步播放。本实施例的媒体播放方法,所播放媒体电子文件包含多个作为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件视 频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的 主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频 数据的摘要信息的摘要信息块,该方法包括读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整 体信息、文件视频信息、文件音频信息以及摘要信息;根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格 式,对所述基本媒体数据块中的视音频数据进行解码;根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息 中的播放速率,进行同步播放。当所述媒体电子文件还包括版权保护信息块,则在读取整体信息块、视频信息块、音频信息块以及摘要信息块时,对每 个数据块进行解密,以及,对所述视音频数据进行解码前,根据所述DRM信息块中DRM数据头进 行解密。在解码过程中,该方法进一步包括如果没有检测到由内容商提供的水印信息或者水印信息不完整,停止读取 和播放操作。所述媒体电子文件还包含播放控制块,用于存储针对特定的环境下数据的 权限保护信息;则该方法还包括读取播放控制块信息,检测播放控制条件,并根据所述 播放控制条件,控制同步播放。当播放控制条件包括根据已播放次数时,则控制同步播放包括判断已播 放次数是否达到设定值,如果是,则停止播放,否则,每播放一次,修改当前 播放次数。在播放过程中,该方法还包括根据dwOrder值,对把基本媒体数据块内的子块顺序置乱的节目,利用 dwOrder值产生序列控制真实的数据播放顺序;通过修改播放控制块dwPracy值和内容,设定用户的密钥组来设定可观赏 的用户群;通过修改播放控制块dwpsctr值和内容,设定可播放的节目时间和长度; 通过修改播放控制块dwlong值和内容,设定节目的播放次数; 通过修改播放控制块dwspreadctr值和内容,设定节目的拷贝次数和删除 权限;通过修改播放控制块dwsprosctr值和内容,设定节目的可以播;改的平台。根据dwintegrality和对应的内容,利用dwOrder产生的前10个值的基本 媒体数据子块内容进行hash (散列),将hash值与dwintegrality对应的内容进 行匹配,来判断文件是否#1窜改。还包括在dwPracy指定的长度权限信息中,存储指紋信息或者视网膜信 息,通过在播放设备接口上连接的指紋传感器或者虹膜传感器检测的使用者的 指紋数据和虹膜数据,与文件中存储的特征信息比较,权限合法,则控制数据 的读取和播放,否则,停止媒体数据的读取。当所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息, 自身与最近的广告块的偏移信息时,该方法进一步包括当要求广告强制播放,Seek (定点查找)或者快进时,如果seek的时间段 内含有广告,则必须播放广告;当不要求广告强制播放,则同正常播放方式。所述媒体电子文件还包含编辑控制块、元素块和元素描述块,所述编辑控 制块,用于存储对视音频内容进行修改的控制信息;元素块,用于存储对视音 频内容进行修改的替换素材信息;所述元素描述块,用于存储所述替换素材信 息的格式信息;则该方法还包括向用户提供元素描述块内容,并接收用户根据所述元素描述块提供的可编辑替换素材信息,或者接收到用户从外部载入替换素材信息;根据接收到的输入命令,利用所述替换素材信息将当前节目的视音频内容 进行替换播方文。所述基本媒体数据块至少包括两个子类块,其中每个子类块用于存储视频 流或音频流;所述子类块至少包括第一层次块和第二层次块,其中,第一层次 块用于存储多帧同步的视频流,第二层次块用于存储多帧同步的音频流;所述 第二层次块包括多个元素块,分别存储按照主音和伴音的多语言多音轨数据 流,以及按照语言和音轨分离的数据流,则该方法还包括接收用户输入的需要切换的音频频道和语言频道,并根 据输入的命令,实时读取对应语言的音频数据,并进行多语言音轨切换。所述媒体电子文件还包含节目分段信息索引块,用于保存在用于保存视频 流分段的大小、分段信息摘要和分段时间戳,则该方法进一步包括在节目播放过程中,读取节目分段索引块,得到分段信息摘要和时间标记; 然后,用户根据分段摘要信息,输入要播放的节目号;根据节目号,读取对应 的节目内容,进行解码播放。所述媒体电子文件还包#词/字幕信息块,则该方法进一步包括获取节目信息和语言和字幕信息;根据节目表信息,选取节目;根据要求在播放时,实时切换音轨;根据语言要求切换不同的声音和字幕。 所述々某体电子文件还包括快速预览图像信息块;该方法进一步包括当接收到快速预览命令时,提供各语言的预览信息。 在播放4某体文件过程中,该方法进一步包括 接收到暂停播力文命令时,从元素描述块中,获取素材信息; 从编辑信息块中读取,默认的编辑方式;修改编辑方式、从元素块中获取需要替换或编辑的元素,并且设置与播放 相关的一系列的命令,保存编辑;播放节目。更具体地说,包括如下步骤1) 、读取整体信息块和DRM块,计算节目分段数,判断DRM保护或者 版权保护;2) 、如l)所述,如果进行了 DRM保护,则对整体信息块和播放控制块(如 果含有编辑控制块)进行解密;3) 、如l)所述,如果节目进行了分段,则读取节目分段表,记录节目分段 的开始时间和结束时间,并且根据播放要求(例如可以根据外部命令输入)将 节目分段内容的相应部分,如中文节目内容输出;4) 、如2)所述,如果含有播放控制块,读取播放控制块信息,4企测播放控 制条件,譬如根据已播放次数控制此次播放,并修改当前播放次数,或者需要 首先输入用户密码才可继续〗番放操作;5) 、读取整体信息块,视音频信息块,获得视音频编码格式、媒体格式信 息,包括音视频时长,音频的格式信息,视频的格式信息以及各数据块在整个 文件中的相对文件头的偏移;6) 、读取节目信息摘要表(如果进行了 DRM保护,需首先要解密),记录 摘要信息,如相对于本节目段的偏移,时间戳和广告位置偏移;7) 、根据已读取信息,如果进行了 DRM保护,则播放时,读取媒体数据 块每一个SBCK都需要首先解密,然后分别输出音频和—见频数据;8) 、系统根据5)中得到的媒体编码格式,调相应的解码器对7)中输出数据 进行解码;9) 、系统根据8)中视音频解码输出数据的时间戳,进行同步播放。 在本发明实施例中,由于层次下包含了各种类别的元素,这里元素就是音频或者视频数据,音频数据的类别可以继续细分为各种语言和各种音轨。在播 放时,可以根据用户体验,选择播放不同的音轨或者将不同的音轨组合播放, 体验不同的效果。由于每个媒体数据子块都是已经经过同步的数据,并且同别的数据是组织在一起的,所以在播放不同的音轨是可以达到无缝切换的目 的。实施例4K-Show功能实现的实施例。图17A提供了一个完整的K-Show功能的实施例。首先,进入点播系统,阅读节目表,选取需要K-Show的文件;然后进入 K-Show环节,进行实时切换音源,并合成背景声与人声输出。图17B提供了 K-Show环节的一个包含硬件的具体实施过程。根据输入的需要K-Show的命令,判断是否需要进行模式切换,如果否, 则打开ADC设备并初始化;如果需要进行模式切换,则在当前播放时间点的下一时刻,切换音轨,如 需要解密数据,将对应的视音频数据解密,再执行播放进程;将背景音数据流输出处理器解码输出到输出buffer;同时对应的同步视频 数据流进入处理器解码输出;与此同时,ADC采集麦克等设备输入人声,并在输出buffer中合成背景音 与人声,并进行音效处理和回声消除;在合成声音的同时,根据用户的要求,如果要保存用户的歌声或合成声, 则将其录制下来,并由处理器进行指定格式压缩保存;合成音频通过DAC与解码后的^L频帧进行同步插,;故。此过程中需要ADC/DAC进行声音的输入和采集,由处理器进行声音的合 成和音轨的切换及进行视频图像的同步输出。实施例5图18提供了一个广告播放控制的实施例。在制作广告数据时,可以在媒体数据摘要信息块AMVBINDEXENTRY的 dwOffsetAD中记录该块与最近的广告块的偏移;在播放时,根据节目广告的 播放权限设置a) 要求广告强制播放,Seek或者快进时,如果seek的时间段内含有广 告,则必须播放广告。b) 不要求广告强制播放,则同正常播放方式。 实施例6图19提供了版权保护水印的检测过程实施例。水印信息可以在解码过程中提取,通过检测水印信息的完整性来控制播放 的进行。更具体地说,可以包括1) 在播放前,导入版权标识库或者首先读取文件中存放的版^又标识(该 数据标识在原始文件中受DRM保护)或者也可以是用户的身份信息;2) 播放时,解密并同时解码视音频数据,首先,对音频进行水印提取, 该音频水印,当该文件仅用音频流时,其为版权标识;如果含有音3见频,则音 频水印为一组密钥,作为视频水印提取的输入,此时,视频水印为版权标识;3) 将提取的版权标识与标准的版权标识进行匹配(此时提取的版权标识 也可输出),在低于一定相似度的情况时,认为非法文件不予播;改,否则,正 常播放。实施例7图20提供了生物认证的实施例。首先,通过例如图14的设备连接的指紋或者虹膜传感器采集用户的生物 特征,处理器通过计算传感器SRAM的生物特征图像,并与文件中读取的被 hash过的特征值进行匹配,匹配成功则继续操作,否则拒绝非法用户继续播放。用户的生物特征不仅可以通过存储在被加密的amvb文件控制信息块中, 将用户生物特征信息以不可见鲁棒水印的方式同时嵌入与该音影文件中将可 以对用户生物特征信息与受限播放的节目内容有机的结合起来,达到对用户信 息或内容保护的目的。实施例8图21是一个编辑控制的实施例。46对于素材编辑和合成过程如下a) 暂停播放,从元素描述表中,获取素材信息;b) 从编辑信息块中读取默认的编辑方式;c) 修改编辑方式、从元素表中获取需要替换或编辑的元素,并且设置 与播放相关的一系列的命令,保存编辑。编辑和合成的算法选择现有的算法。d) 播放节目。 实施例9图22是播放控制的实施例。在播放控制选项中,结合实施例6和7,可提供实施例6中的水印信息, 提供实施例7中的指紋或者虹膜信息;此外,可根据提供的播放次数进行控制 节目被播放的次数,以及节目允许播;改和操作的平台, 一旦检测到该平台不能 很好的完成所提供的功能,可拒绝被进一步的播放。通过对节目内容hash生 成完整性信息与该文件中保存的完整性信息匹配,如果信息完整,则允许播放, 否则文件曾被播放,拒绝播放。本发明并不局限于说明书中描述的具体规格和上述具体实施例。例如,可 以在其它文件格式中采用相同的广告信息措施,保障广告商的利益。可以采用 类似的子块结构同步音视频数据。可以采用相同的方式在其它文件结构中提供 K-Show功能。本发明提供的媒体电子文件,该电子文件包含作为基本组织形式的块,至 少包括整体信息块、视频信息块、音频信息块、基本媒体数据块和摘要信息块, 每个块嵌套主类,块后是主类标识,主类标识可以嵌套子类,子类可以含有不 同的层次, 一个主类下可以包含多个同类型的子类,层次下是不同的元素,基 本媒体数据块是已同步的媒体信息流,所述媒体电子文件可以包含多个不同格 式的媒体节目。本发明实施例的媒体电子文件,可以支持最大264-1字节文件大小,每个 基本媒体信息块支持232-1字节的大小,当大于232-1字节时自动分段增加媒体加到分段表中。基于本发明的技术方案,在所述媒体电子文件中,基本媒体数据块保存的 是已同步好的数据,在播放时,无需担心同步问题和对时间戳进行计算和纠正。因此,相对于AVI中音频数据帧和视频数据帧随机存放,显著改善了回》文效率。 此外,分离的主音数据包和伴音数据包有效的达到了无缝切换的要求。在本发明的实施例中,媒体电子文件以块为组织形式,每个块BLCK后是 主类标识,主类标识可以嵌套子类, 一个主类下可以包含多个同类型的子类; 并且支持264-1字节的大小。这种方式相对于AVI扩展更灵活。在本发明的实施例中,可以采样DRM方法进行对数据的加密,有效保护 用户商的利益,而AVI中没有任何的保护措施;并且增加了播放控制信息,便 于用户自己保护特殊信息,其能够控制密钥播放某一段的内容、设置不可删除 权限、自我复制权限等。在本发明的实施例中,提供了广告强制播放功能的措施,可以有力的保障 广告商的利益。而AVI中没有相应的措施来达到这个要求。在本发明的实施例中,可以在媒体电子文件中提供K-Show的功能。在本发明的实施例中,增加了交互式元素合成和编辑的支持,可以用元素 库中的元素对基本的媒体信息实时进行编辑和合成。
权利要求
1、一种制作媒体电子文件的方法,其特征在于,该方法包括按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件,其中,所述块结构包括若干个数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。
2、 根据权利要求1所述的方法,其特征在于,所述数据块按照分层结构 存储信息。
3、 根据权利要求2所述的方法,其特征在于,所述数据块至少包括一个 主类块,每个主类块"t安照信息类别存储信息。
4、 根据权利要求3所述的方法,其特征在于,所述主类块至少包括一个 子类块,每个子类块按照对应类别的子类存储信息。
5、 根据权利要求4所述的方法,其特征在于,所述子类块至少包括一个 层次块,每个层次块按照对应子下的分层结果存储信息。
6、 根据权利要求5所述的方法,其特征在于,所述层次块至少包括一个 包括基本数据单元,用于存储数据的最小单位。
7、 根据权利要求3所述的方法,其特征在于,所述基本媒体数据块至少 包括两个子类块,其中每个子类块用于存储视频流或音频流。
8、 根据权利要求7所述的方法,其特征在于,所述子类块至少包括第一 层次块和第二层次块,其中,第一层次块用于存储多帧同步的3见频流,第二层 次块用于存储多帧同步的音频流。
9、 根据权利要求8所述的方法,其特征在于,所述第二层次块包括多个 元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音 轨分离的数据流。
10、 根据权利要求1所述的方法,其特征在于,所述块结构包括多个^L频 信息块时,每个视频信息块中存储的文件视频信息中的文件格式信息相同或不 同。
11、 根据权利要求l所述的方法,其特征在于,所述块结构包括多个音频 信息块时,每个音频信息块中存储的文件音频信息中的文件格式信息相同或不 同。
12、 根据权利要求1所述的方法,其特征在于,所述块结构还包括 版权保护信息块,用于存储关键的版权保护或者内容保护的信息。
13、 根据权利要求1所述的方法,其特征在于,所述块结构还包括编辑 控制块、元素块和元素描述块,其中,所述编辑控制块,用于存储对视音频内容进行修改的控制信息; 所述元素块,用于存储对视音频内容进行修改的替换素材信息; 所述元素描述块,用于存储所述替换素材信息的4各式信息。
14、 根据权利要求1所述的方法,其特征在于,所述块结构还包括节目 分段信息索引块,用于保存视频流分段的大小、分段信息摘要和分段时间戳。
15、 根据权利要求14所述的方法,其特征在于,所述视频流是按照时间、 内容和语言中的一种或几种进行分段。
16、 根据权利要求1所述的方法,其特征在于,所述块结构还包含 播放控制块,用于存储针对特定的环境下数据的权限保护信息。
17、 根据权利要求16所述的方法,其特征在于,所述权限保护信息包括: 隐私保护所有权信息长度,以及在所述长度范围内的指紋信息或视网膜信息,用于提供给指紋传感器或者虹膜传感器进行权限认证。
18、 根据权利要求1所述的方法,其特征在于,所述块结构还包括 快速预览图像信息块,用于存储多种语言的预览信息。
19、 根据权利要求1所述的方法,其特征在于,所述摘要信息包括 所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息。
20、 根据权利要求1所述的方法,其特征在于,所述块结构还包括歌词/ 字幕信息块,用于存储至少一种语言的歌词。
21、 根据权利要求1所述的方法,其特征在于,所述块结构还包括用户可 定义信息块,用于存储用户自定义信息。
22、 一种制作i某体电子文件的方法,其特征在于,所述媒体电子文件包括 若干个数据块,分别为整体信息块,视频信息块、音频信息块、基本媒体数 据块以及摘要信息块,该方法包括将同步视频数据和同步音频数据合成打包存储在基本媒体数据块, 将所述同步视频数据对应的文件视频信息存储在视频信息块,将所述同步音频数据对应的文件音频信息存储在音频信息块;以及,将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据块的摘要信息存储在摘要信息块。
23、 根据权利要求22所述的方法,其特征在于,在将同步视频数据和同 步音频数据合成打包存储在基本媒体数据块之前,该方法进一步包括将同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。
24、 根据权利要求22所述的方法,其特征在于,在将同步视频数据和同 步音频数据合成打包存储在基本媒体数据块之前,该方法进一步包括生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步一见频 数据和/或同步音频数据进行数字版权保护DRM加密。
25、 根据权利要求22所述的方法,其特征在于,该方法还进一步包括 将多种语言的预览信息保存在预览图像信息块中。
26、 根据权利要求22所述的方法,其特征在于,该方法还进一步包括 将特定环境下数据的权限保护信息保存在播放控制块中。
27、 根据权利要求22所述的方法,其特征在于,该方法还进一步包括 用于将视频流分段的大小、分段信息摘要和分段时间戳保存在分段信息索引块。
28、 根据权利要求22所述的方法,其特征在于,该方法进一步包括 将至少一种语言的歌词保存在歌词/字幕信息块中。
29、 根据权利要求26所述的方法,其特征在于,所述权P艮保护信息包括 隐私保护所有权信息长度,以及在所述长度范围内的指紋信息或视网膜信自
30、 根据权利要求26所述的方法,其特征在于,所述摘要信息包括 所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息。
31、 根据权利要求22所述的方法,其特征在于,该方法还进一步包括 将对视音频内容进行修改的控制信息存储在编辑控制块; 将对视音频内容进行修改的替换素材信息存储在元素块;将所述替换素材信息的格式信息存储在元素描述块。
32、 根据权利要求22所述的方法,其特征在于,该方法进一步包括 将用户自定义信息存储在用户可定义信息块。
33、 根据权利要求22所述的方法,其特征在于,按照分层结构将信息存 储在对应的数据块中。
34、 一种制作i某体电子文件的装置,其特征在于,该装置包括 存储单元,用于存储媒体电子文件,所述媒体电子文件至少包括若干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘 要信息块;基本々某体数据处理单元,用于同步视频数据和同步音频数据合成打包存储 在基本媒体数据块;视频信息处理单元,用于将所述同步视频数据对应的文件视频信息存储在 视频信息块;音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在音频信息块;整体信息处理单元,用于将文件整体信息存储在整体信息块; 摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。
35、 根据权利要求34所述的装置,其特征在于,该装置还包括 水印处理单元,用于在将同步视频数据和同步音频数据合成打包前,将提取的同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。
36、 根据权利要求34所述的装置,其特征在于,该装置还包括 加密处理单元,用于在将同步视频数据和同步音频数据合成打包前,生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/ 或同步音频数据进行数字版权保护DRM加密。
37、 根据权利要求34所述的装置,其特征在于,该装置还包括预览图像处理单元,用于将多种语言的预览信息保存在预览图像信息块中。
38、 根据权利要求34所述的装置,其特征在于,该装置还包括 播放控制处理单元,用于将特定环境下数据的权限保护信息保存在播放控制块中。
39、 根据权利要求34所述的装置,其特征在于,该装置还包括 分段信息索引处理单元,用于将视频流分段的大小和分段时间戳保存在分段信息索引块。
40、 根据权利要求34所述的装置,其特征在于,该装置还包括 歌词信息处理单元,用于将至少一种语言的歌词保存在歌词/字幕信息块中。
41、 根据权利要求34所述的装置,其特征在于,该装置还包括 编辑控制处理单元,用于将对视音频内容进行修改的控制信息存储在编辑控制块;元素处理单元,用于将对视音频内容进行修改的替换素材信息存储在元素块;元素描述处理单元,用于将所述替换素材信息的^^式信息存储在元素描述块。
42、 一种媒体播放方法,其特征在于,所播放媒体电子文件包含多个作为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息块,用于 存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于 按照划分的主类类别存储视音频数据的基本々某体数据块,以及用于存储每个主 类的视音频数据的摘要信息的摘要信息块,该方法包括读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整 体信息、文件^L频信息、文件音频信息以及摘要信息;根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格 式,对所述基本媒体数据块中的视音频数据进行解码;根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息 中的播放速率,进行同步播放。
43、 根据权利要求42所述的方法,其特征在于,当所述媒体电子文件还 包括版权保护信息块,则在读取整体信息块、视频信息块、音频信息块以及摘要信息块时,对每 个数据块进行解密,以及,对所述视音频数据进行解码前,根据所述DRM信息块中DRM数据头进 行解密。
44、 根据权利要求42所述的方法,其特征在于,在解码过程中,该方法 进一步包括如果没有检测到由内容商提供的水印信息或者水印信息不完整,停止读取 和播放操作。
45、 根据权利要求42中的方法,其特征在于,所述媒体电子文件还包含播放控制块,用于存储针对特定的环境下数据的权限保护信息;则该方法还包括读取播放控制块信息,4企测播放控制条件,并根据所述 播放控制条件,控制同步播放。
46、 根据权利要求45所述的方法,其特征在于,当播放控制条件包括根 据已播放次数时,则控制同步播放包括判断已播放次数是否达到设定值,如 果是,则停止播放,否则,每播放一次,修改当前播放次数。
47、 根据权利要求45所述的方法,其特征在于,在播放过程中,该方法 还包括根据dwOrder值,对把基本媒体数据块内子块顺序置乱的节目,利用 dwOrder值产生序列控制真实的数据播放顺序;通过修改播放控制块dwPracy值和内容,i殳定用户的密钥组来设定可观赏 的用户群;通过修改播放控制块dwpsctr值和内容,设定可播放的节目时间和长度; 通过修改播放控制块dwlong值和内容,设定节目的播放次数; 通过修改播放控制块dwspreadctr值和内容,设定节目的拷贝次数和删除 权限;通过修改播放控制块dwsprosctr值和内容,设定节目的可以播放的平台; 根据dwintegrality和对应的内容,利用dwOrder产生的前10个值的基本媒体数据块内子块内容进行hash,将hash值与dwintegrality对应的内容进行匹配,来判断文件是否被窜改。
48、 根据权利要求45所述的方法,其特征在于,在还包括在dwPracy 指定的长度权限信息中,存储指玟信息或者视网膜信息,通过在播放设备接口 上连接的指紋传感器或者虹膜传感器检测的使用者的指紋数据和虹膜数据,与 文件中存储的特征信息比较,权限合法,则控制数据的读取和播放,否则,停 止媒体数据的读取。
49、 根据权利要求42所述的方法,其特征在于,当所述基本媒体数据块按照主类类别存储的^L音频信息之间的关联信息,自身与最近的广告块的偏移 信息时,该方法进一步包括当要求广告强制播放,Seek或者快进时,如果seek的时间段内含有广告, 则必须播放广告;当不要求广告强制播放,则同正常播放方式。
50、 根据权利要求42所述的方法,其特征在于,所述J 某体电子文件还包 含编辑控制块、元素块和元素描述块,所述编辑控制块,用于存储对;规音频内 容进行修改的控制信息;元素块,用于存储对视音频内容进行修改的替换素材 信息;所述元素描述块,用于存储所述替换素材信息的格式信息;则该方法还包括向用户提供元素描述块内容,并接收用户根据所述元素描述块提供的可编 辑替换素材信息,或者接收到用户从外部载入替换素材信息;根据接收到的输入命令,利用所述替换素材信息将当前节目的视音频内容 进行替换播放。
51、 根据权利要求42所述的方法,其特征在于,所述基本媒体数据块至 少包括两个子类块,其中每个子类块用于存储视频流或音频流;所述子类块至 少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同步的视频 流,第二层次块用于存储多帧同步的音频流;所述第二层次块包括多个元素块, 分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音轨分离的 数据流,则该方法还包括接收用户输入的需要切换的音频频道和语言频道,并根 据输入的命令,实时读取对应语言的音频数据,并进行多语言音轨切换。
52、 根据权利要求42所述的方法,其特征在于,所述々某体电子文件还包 含节目分段信息索引块,用于保存在用于保存视频流分段的大小、分段信息摘 要和分段时间戳,则该方法进一步包括在节目播放过程中,读取节目分段索引块,得到分段信息摘要和时间标记; 然后,用户根据分段摘要信息,输入要播放的节目号;根据节目号,读取对的节目内容,进行解码播放。
53、 根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包 含歌词/字幕信息块,则该方法进一步包括获取节目信息和语言和字幕信息;根据节目表信息,选取节目;根据要求 在播放时,实时切换音轨;根据语言要求切换不同的声音和字幕。
54、 根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包 括快速预览图像信息块;该方法进一步包括当接收到快速预览命令时,提供各语言的预览信息。
55、 根据权利要求42所述的方法,其特征在于,在播放媒体文件过程中, 该方法进一步包括接收到暂停播放命令时,从元素描述块中,获取素材信息; 从编辑信息块中读取,默认的编辑方式;修改编辑方式、从元素块中获取需要替换或编辑的元素,并且设置与播放 相关的一系列的命令,保存编辑; 播放节目。
56、 一种便携式娱乐设备,其特征在于,包括数据存储器,所述数据存储器存储媒体电子文件,所述々某体电子文件包含 多个作为基本组织形式的数据块,分别为用于存储文件整体信息的整体信息 块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息 块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存 储每个主类的视音频数据的摘要信息的摘要信息块;与数据存储器连接的处理器,所述处理器,用于处理视频流,负责视频流的解密、解压缩和显示和对音 频流数据的解密、解压缩和输出;用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数据 的DAC, ADC和DAC的配合实现声音的输入和合成输出。
57、 根据权利要求56所述的设备,其特征在于,还包括指紋或虹膜传感 器,用于采集用户的指紋或者虹膜特征信息,并将传感器捕捉到图像输出到处 理器进行匹配。
58、 根据权利要求56所述的设备,其特征在于,所述处理器,在处理视 频流的同时,将ADC输入的声音或者合成声音录制成指定格式文件,并记录 起始时间。
59、 一种系统,其特征在于,包括随机存取存储器RAM和执行其中的程 序的CPU或MPU,所述程序包括如下格式的文件所述媒体电子文件包含多个作为基本组织 形式的数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件 视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分 的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音 频数据的摘要信息的摘要信息块,当该文件被CPU或MPU执行时,能够执行 根据权利要求43 ~ 45中任一项的方法。
全文摘要
本发明公开了一种制作媒体电子文件的方法,该方法包括按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件,其中,所述块结构包括若干个数据块,分别为用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,及用于存储每个主类的视音频数据的摘要信息的摘要信息块。由于音频信息块和视频信息块单独编辑,音频数据和视频数据可按照不同格式编码在基本数据存储单元,易于扩展媒体电子文件,由于媒体电子文件以块为组织形式,每个数据块可按照层次保存数据,因此,与现有技术相比,可以节省媒体电子文件的存储空间。
文档编号G11B27/034GK101261865SQ20081009340
公开日2008年9月10日 申请日期2008年4月21日 优先权日2007年4月20日
发明者孔文海, 智 李 申请人:炬力集成电路设计有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1