基于多码流可交互的示教录像文件格式及存储播放方法与流程

文档序号:13763767阅读:556来源:国知局

本发明涉及视频教学技术领域,具体是基于多码流可交互的示教录像文件格式及存储播放方法。



背景技术:

随着国家“精品课程”建设项目的开展,计算机多媒体技术、网络技术等技术的不断发展,大大推动了教学手段的现代化进程。在现代化教学过程中,多媒体形式的引入使得教学从传统的粉笔、课本、笔记等方式转向了更为直观、方便理解的音/视频及交互式教学。

传统视频教学中只能针对单路音/视频、单一文件类型进行教学,若在教学过程中需进行其它类型文件的显示,就需要在各种软件中切来切去,既不方便教师的操作,又不能给学生提供统一的视觉感受,大大降低教师的教学效率和学生的教学体验。

虽然目前有一些多媒体教学软件已经实现了较为丰富的音视频教学及方便用户交互,但此类教学软件所使用的文件是专为教学软件本身而设计的,并且不提供二次编辑的功能,不能满足普通用户对自己录制的音、视频数据进行教学素材制作的要求。

综合以上所述,一款既能满足多媒体教学及交互的要求,又能方便普通用户进行二次编辑和修改的针对多路音、视频流以及其它常用数据文件的示教专用录像文件格式亟待出现。



技术实现要素:

本发明的目的在于提供基于多码流可交互的示教录像文件格式及存储播放方法,立足于音视频流数据及其它常用数据文件的存储及显示技术,并将两者完美结合,除保留常规多媒体高交互性的优点外,同时通过对普通常用数据文件的兼容,形成一种多路音、视频流,多格式数据存储与显示为一体的混合型录像文件格式——基于多码流可交互的示教专用录像文件。

为实现上述目的,本发明提供如下技术方案:

基于多码流可交互的示教录像文件格式,由四个部分组成:文件头、流头结构、流数据、索引数据;文件头用来描述整个文件的信息;流头结构用来描述文件中每个流的信息;流数据用来存储具体的流内容;索引数据用于存储流数据的索引信息。

作为本发明进一步的方案:文件头包括文件大小、流的个数、头数据大小与索引位置。

作为本发明进一步的方案:流头结构包含流的相对偏移时间,流中最大帧的字节数,视频的宽、高,音视频采样率、采样大小,音视频压缩算法,流的长度。

作为本发明进一步的方案:流数据包括音视频帧、视频标注结构、WORD文件数据、JPG数据;每一帧音视频数据都由帧头+数据部分组成。

作为本发明进一步的方案:流数据的索引信息包括视频关键帧、音频帧与视频标注帧。

基于多码流可交互的示教录像文件格式的存储播放方法,包括以下步骤:

1)多路音视频数据同步存储:将音视频数据采用示教录像文件格式进行存储,且音视频数据采用交替性的方式进行存储,即对于每路音视频数据的流,都相对均匀地分布在示教录像文件的各个部分,对于每一路音视频数据,能在离文件头较近的部位获得第一帧音视频数据;每一帧音视频数据都采用帧头+帧数据部分的结构;

对每一路音视频数据,设置此音视频数据相对于示教录像文件中第一帧音视频数据的偏移时间戳;当需要对播放中的示教录像文件进行定位时,根据索引数据中的偏移时间戳定位到需要的位置;

2)视频标注存储播放:视频标注帧支持对正在播放的视频进行视频标注;视频标注帧作为一个单独的数据流进行存储,数据结构采用帧头+帧数据部分的方式,每个视频标注帧中存储多路标注,每个标注针对一路视频,具体内容包括:视频流编号、起始时间戳、结束时间戳、标识类型、坐标;视频标注帧在打开示教录像文件后全部读取出来,然后在示教录像文件的播放过程中,根据每路视频的当前播放时间戳进行动态的显示和隐藏;

3)非音视频数据存储:非音视频数据采用帧头+帧数据部分的格式,其存储方式与音视频数据相同;非音视频数据在默认状态下不会显示,但在录像文件的播放过程中能手动切换显示。

作为本发明进一步的方案:视频标注支持的类型为:矩形标注、圆形或椭圆形标注、箭头标注和文字标注。

作为本发明进一步的方案:非音视频数据的数据类型包括Word、PPT、TEXT、JPG。

作为本发明进一步的方案:步骤2)中,还能对其中一路视频标注帧进行手动的停止和开启操作。

与现有技术相比,本发明的有益效果是:

本发明示教录像文件格式是基于音/视频录像数据、视频标注(如矩形标,圆形标注,箭头标注,文字标注等)、常用文档格式(如WORD,EXCEL,JPG,PNG)为一体的多码流、多文件类型为一体的可交互的专用录像文件格式,其主要用于视频教学,使用专用播放器进行播放,并可在播放过程中进行任意交互,如切换显示不同音/视频码流,切换显示其它类型的流内容等。使用本发明格式的示教录像文件格式,可以达到通用音视频录像格式所不具备的多种类型文件同步存储和播放的效果,又解决了市面上常用多媒体交互文件不方便编辑的问题。此种类型的示教录像文件可以用于所有需要进行音、视频同步播放/交互的领域,如医疗示教,多媒体教室教学等。

附图说明

图1是本发明示教录像文件格式示意图。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参阅图1,本发明实施例中,基于多码流可交互的示教录像文件格式由四个部分组成:文件头、流头结构、流数据、索引数据。

文件头用来描述整个文件的信息,整个文件只有一个文件头,包括文件大小、流的个数、头数据大小、索引位置等。

流头结构用来描述文件中每个流的信息,每个流都有一个流头结构,如流的相对偏移时间,流中最大帧的字节数(用于预分配内存),视频的宽、高,音视频采样率、采样大小,音视频压缩算法,流的长度(毫秒)等。

流数据用来存储具体的流内容,如音视频帧,视频标注结构,WORD文件数据,JPG数据等,每一帧流数据都由帧头+数据部分组成。

索引数据用于存储流数据的索引信息(如视频关键帧,音频帧,视频标注帧,其它数据帧等),其主要作用是快速定位,整个文件中只有一个索引数据块,所有的流数据、索引数据都存储在这块区域,但在播放时,可以根据索引数据中的流编号,将索引数据分别读取到不同的流索引中,这样可以加快索引的速度。

多路音视频同步方案:对于在同一录像文件中存储多路音、视频流的方案,目前比较成熟的通用录像文件格式都可以提供支持,如ASF,AVI等,但这类文件在使用通用的播放器(如VLC)进行播放时,只能将每一路视频流放在单独的窗口中进行播放,且播放时只能同时播放一路声音,这种方式很难满足需对多路音视频进行同步播放及控制的要求,而且通用的录像文件格式一般都比较复杂,不方便用户进行二次编辑。

基于多码流可交互的示教录像文件格式的存储播放方法,具体描述如下:

1.此示教录像文件格式采用私有文件格式进行音视频数据的存储,将音视频数据进行极简化存储,每一帧数据都采用帧头+帧数据部分的结构,这样可以使用统一的结构进行音视频帧数据的读写,加快了数据的读写速度。

此示教录像文件格式对于音视频数据采用交替性的方式进行存储,即对于每路音视频流,都相对均匀地分布在文件的各个部分,对于每一路数据,都可以在离文件头部较近的部位获得第一帧数据,避免了因数据分布不均而导致有些流需要较长时间才能获取到第一帧数据的问题。

对于每一路音视频数据,都可以设置此音视频数据相对于文件第一帧音视频数据的偏移时间戳,这样可以对每一路音视频数据进行准确的同步。

对于视频,每一个关键帧都建立了索引,对于音频,每一帧都有索引,当需要对播放中的文件进行定位时,可以根据索引中的时间戳快速地定位到需要的位置。

可对每一路音、视频流进行单独的控制,也可以对所有流进行同步控制,可以同时播放多路音频流和视频流,视频流的播放布局和窗口大小可以任意调整。

2.视频标注存储方案

视频标注帧支持对正在播放的视频进行重点标注,目前支持4种类型的标注:矩形标注、圆形(椭圆形)标注、箭头标注和文字标注。

视频标注帧作为一个单独的数据流进行存储,数据结构与音视频数据相同,即帧头+帧数据的方式,每个视频标注帧中可以存储多路标注,每路标注针对一路视频,具体内容包括:视频流编号(即作用于哪路视频)、起始时间戳、结束时间戳、标识类型、坐标等,一般标识流在打开示教录像文件后全部读取出来,然后在示教录像文件的播放过程中,根据每路视频流的当前播放时间戳进行动态的显示和隐藏。

可以对某路视频标注流进行手动的停止和开启操作。

3.其它非音视频数据数据存储方案

对于其它非音视频数据数据,采用和音视频数据相同的结构,即帧头+帧数据部分的格式,数据类型包括Word,PPT,TEXT,JPG等,这些非音视频数据在默认状态下不会显示,但在录像文件的播放过程中可以进行手动切换显示,此类文件可以显示在单独的窗口中,也可以与其它的视频进行并行显示。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1