3d立体视频编码存储方法

文档序号:7996631阅读:133来源:国知局
专利名称:3d立体视频编码存储方法
技术领域
本发明涉及一种3D立体视频编码存储方法,属于视频编码与存储领域。
背景技术
3D立体视频是多视点视频,从时间和空间两个角度描述场景画面。因此保存3D立体视频需要更多的数据和更复杂的结构。目前常见的3D立体视频的保存方法是将多视点视频在空间维度拼接在一起,再作为一个普通的平面视频进行编码存储,简称为“拼图”方法。例如,将左右视点视频的每一帧并排拼成一个“左右图”,或者“上下图”是一种常见的方法。这类“拼图”方式具有很大局限性。分辨率大大降低,例如“左右图”拼图方式在水平上的分辨率降低了 50% ;“3X3”拼图方式在水平和垂直方向分辨率都降低了 2/3。如果要维持分辨率在一定水平上,则全图的分辨率可能过高导致编码器编码失败。另外,“拼图”方法使得视频编码方法与3D显示设备的显示原理紧密相干,按照某种“拼图”方法制作出来的3D立体视频只能适合某类3D显示设备,不适合其他类型的3D显示设备使用。例如 “左右图”方法制作出的视频适合垂直光栅类型的3D显示器,而不是水平光栅类型、或者时分方式的3D显示设备。

发明内容
本发明的目的是克服现有技术中存在的不足,提供一种3D立体视频的编码存储方法,用于多视点3D立体视频的编码和存储。按照本发明提供的技术方案,所述3D立体视频编码存储方法是
对于一段具有k视点的3D立体视频,假设每个视点的帧序列分别为S1、S2,…,Sk,每个帧序列的长度都为M帧fn-m表示Sn帧序列里的第m帧,η称为视点序号,m称为帧序号;进行如下操作
步骤一、将该段3D立体视频的所有帧重新排序,按照帧序号优先、视点序号其次的方式排序
Fl-1, F2-1,…,Fk-I, Fl-2, F2-2, ...,Fk-2, Fl-3, F2-3, ...,Fk-3,
Fl-Μ, F2-M, ...,Fk-M, 将所有帧的排序序列称为“全系列帧”;
步骤二、将步骤一排序得到的全系列帧输入视频编码器得到帧序列F’,视频编码器参数选择设为如下五种模式之一
a)设定只做I帧编码,不做P/B帧编码;
b)设定做I/P帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧,并且各个视点帧序列里出现的I帧间隔完全一致;
C)设定做I/P帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为P帧编码;
d)设定做I/P/B帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧;对于每个B帧,指定与其在同一个视点帧序列里的前后各一个I/P帧作为参考帧;并且各个视点帧序列里出现的I/P/B帧间隔完全一致;
e)设定做I/P/B帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;对于每个B帧,指定在全系列帧里前后各一个I/P帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为P/B帧编码;
步骤三、将步骤二编码得到的帧序列F’,采用媒体交换文件格式,即MXF格式打包,并且该MXF格式遵循如下几个规则
f)在MXF头部中,加入一个标示该MXF为“立体视频”的元数据;所述元数据的UUID为指定的唯一值;
g)在MXF头部中,加入一个存储视频参数元数据,所存储的视频参数包括宽、高、帧率、采样率、画幅比、帧长度、码率,其中采样率=视点数X帧率;
h)在MXF尾部的索引表区段,对第一视点的帧序列F’1-1,F'1-2, F'1-3,…F’ I-M 做索引;对其他视点的帧序列不做索引。所述的视频编码器可以为MFEG2、MFEG4、H.沈4、或VCl等视频编码算法。本发明的优点是最大限度的保留每个视点的信息,并且在播放时可准确的同步与定位各视点的视频,且顺序存储使得硬盘类存储介质能发挥最大性能。
具体实施例方式下面结合附图
和实施例对本发明作进一步说明。对于一段具有2视点的3D立体视频,帧率为Mpf S,假设每个视点的帧序列分别为 S1、S2,每个帧序列的长度都为1000帧。设定视频编码器采用MFEG-2视频编码算法。本发明的3D立体视频编码存储方法如下。1.将该段3D立体视频的所有帧重新排序,按照帧序号优先、视点序号其次的方式排序
Fl-1, F2-1, Fl-2, F2-2, Fl-3,F2-3,…,Fl-1000,F2-1000, 以上排序序列称为“全系列帧”;
2.将步骤一排序得到的全系列帧输入MFEG-2视频编码器,视频编码器参数可设为如下五种模式之一
a)设定只做I帧编码,不做P/B帧编码;
b)设定做I/P帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧,并且各个视点帧序列里出现的I帧间隔完全一致;
c)设定做I/P帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为P帧编码;
d)设定做I/P/B帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧;对于每个B帧,指定与其在同一个视点帧序列里的前后各一个I/P帧作为参考帧;并且各个视点帧序列里出现的I/P/B帧间隔完全一致;
e)设定做I/P/B帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;对于每个B帧,指定在全系列帧里前后各一个I/P帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为P/B帧编码。“/”是或的意思,为本技术领域常规写法。这里,视频编码器参数设定为做I/P帧编码。对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧,F1-2的参考帧是Fl-1,F2-2的参考帧是F2_l,F1-3 的参考帧是F1-2。并且各个视点帧序列里出现的I帧间隔均为12,也就是说Fl-1,F2-1, Fl-13, F2-13 等是 I 帧。3.将步骤二经过视频编码器编码得到的帧序列F’,采用媒体交换文件格式(MXF 格式)打包,并且该MXF遵循如下几个规则
a)在MXF头部中,加入一个标示该MXF为“立体视频”的元数据。该元数据的UUID (通用唯一识别码)为0x060e2b340253010c0d01010101016300。b)在MXF头部中,加入一个存储视频参数元数据,所存储的视频参数包括宽、高、 帧率、采样率、画幅比、帧长度、码率等关键信息。其中采样率=38。c)在MXF尾部的索引表区段,对第一视点的帧序列 F,1-1,F,1-2,F,1-3,…,F,1-1000
做索引。对其他视点的帧序列不做索引。这样便完成了 3D立体视频的编码存储。这样做的优点是
1.将各个视点的帧作为一个独立帧加入帧序列给视频编码器编码,而不是将多个视点的帧拼图后给视频编码器编码,可以最大限度保存各个视点的画面信息。2.按照帧序号优先、视点序号其次的方法排序,在播放时可以顺序读取,可提高硬盘的读取效率和读取速度。3.步骤二的模式a)只做I帧编码,消除帧间依赖性,可以随机定位到任何一帧并独立解码。4.步骤二的模式b)和模式d)在同一个视点帧序列做帧间预测,可以提高编码效率。并且规定了各个视点帧序列里的I/P/B帧的同步出现,可以提高视频的检索定位效率。5.步骤三的模式C)和模式e)在全帧系列里做帧间预测和编码,在解码时可以只用一个视频解码器实体,而不需要多个视频解码器实体。6.在MXF文件头部里加入“立体视频”的元数据,可将该MXF与其他存储2D视频的MXF文件区分开,快速识别文件类型。7.在MXF尾部的索引表区段只对第一视点的帧序列,减小了索引的数目。
权利要求
1. 3D立体视频编码存储方法,其特征是对于一段具有k视点的3D立体视频,假设每个视点的帧序列分别为S1、S2,…,Sk,每个帧序列的长度都为M帧fn-m表示Sn帧序列里的第m帧,η称为视点序号,m称为帧序号;进行如下操作步骤一、将该段3D立体视频的所有帧重新排序,按照帧序号优先、视点序号其次的方式排序Fl-1, F2-1,…,Fk-I, Fl-2, F2-2, ...,Fk-2, Fl-3, F2-3, ...,Fk-3,Fl-Μ, F2-M, ...,Fk-M, 将所有帧的排序序列称为“全系列帧”;步骤二、将步骤一排序得到的全系列帧输入视频编码器得到帧序列F’,视频编码器参数选择设为如下五种模式之一设定只做I帧编码,不做Ρ/Β帧编码;设定做Ι/Ρ帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧,并且各个视点帧序列里出现的I帧间隔完全一致;设定做Ι/Ρ帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为P帧编码;设定做Ι/Ρ/Β帧编码;对于每个P帧,指定与其在同一个视点帧序列里的前一帧作为参考帧;对于每个B帧,指定与其在同一个视点帧序列里的前后各一个Ι/Ρ帧作为参考帧;并且各个视点帧序列里出现的Ι/Ρ/Β帧间隔完全一致;设定做Ι/Ρ/Β帧编码;对于每个P帧,指定在全系列帧里前一帧作为参考帧;对于每个 B帧,指定在全系列帧里前后各一个Ι/Ρ帧作为参考帧;并且I帧只出现在第一视点帧序列里,其他视点帧序列都作为Ρ/Β帧编码;步骤三、将步骤二编码得到的帧序列F’,采用媒体交换文件格式,即MXF格式打包,并且该MXF格式遵循如下几个规则在MXF头部中,加入一个标示该MXF为“立体视频”的元数据;所述元数据的UUID为指定的唯一值;在MXF头部中,加入一个存储视频参数元数据,所存储的视频参数包括宽、高、帧率、 采样率、画幅比、帧长度、码率,其中采样率=视点数X帧率;在MXF尾部的索引表区段,对第一视点的帧序列F,1-1,F,1-2,F' 1-3,…F,I-M 做索引;对其他视点的帧序列不做索引。
2.如权利要求1所述的3D立体视频编码存储方法,其特征是,所述视频编码器采用 MFEG2、MFEG4、H.洸4、或VCl视频编码算法。
全文摘要
本发明提供了一种3D立体视频编码存储方法,对于一段具有k视点的3D立体视频,假设每个视点的帧序列分别为S1、S2,…,Sk,每个帧序列的长度都为M帧;Fn-m表示Sn帧序列里的第m帧;步骤一、将该段3D立体视频的所有帧重新排序,按照帧序号优先、视点序号其次的方式排序得到全系列帧;步骤二、将步骤一排序得到的全系列帧输入视频编码器得到帧序列F’,步骤三、将步骤二编码得到的帧序列F’,采用媒体交换文件格式,即MXF格式打包。本发明的优点是最大限度的保留每个视点的信息,并且在播放时可准确的同步与定位各视点的视频,且顺序存储使得硬盘类存储介质能发挥最大性能。
文档编号H04N13/00GK102404577SQ201110392399
公开日2012年4月4日 申请日期2011年12月1日 优先权日2011年12月1日
发明者李艳华, 林晓森 申请人:无锡太行电子技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1