视频编码和解码方法

文档序号:7848832阅读:132来源:国知局
专利名称:视频编码和解码方法
技术领域
本发明总体涉及视频压缩领域,更具体来说,涉及MPEG系列的视频编码标准和ITU-H.26X系列的视频编码推荐。更精确地说,本发明涉及一种应用于原始视频序列的视频编码方法以及对应的解码方法,在所述原始视频序列中,各连续帧或视频对象平面(VOP)包括一个或几个任意定形的视频对象(VO),所述视频对象在每个VOP中由其纹理和运动分量以及附加的形状分量所定义。
背景技术
在最初的视频标准和推荐中(分别直到MPEG-2和H.263),假设为矩形的视频按照三个分离的通道被描述一个通道用于亮度,两个通道用于色度(这种基于三通道的表示方案已经与诸如基于网格的方法之类的其它压缩方案一起使用)。然而,当必须被编码、发送和/或存储的场景由几个具有独立运动的对象构成时(特别当每次有一个空间-时间不连续时),会出现伪像。这些区域需要被特别处理及细化。
利用MPEG-4标准,已经引入了一个附加的通道α通道,在MPEG-4术语学中也称为“任意形状通道”。该α通道允许独立地描述存在于所涉及场景中的每个视频对象(VO)的轮廓(或形状),并因此使得有可能分开地编码所述对象,同时避免沿着这些对象边界的不连续。然而,这种技术的一个缺点是,作为描述所述形状通道所需的开销的代价,会发生比特位的浪费。
发明概要因此,本发明的一个目的是提出一种借以避免所述缺点的编码方法。
为此,本发明涉及一种诸如在说明书的开头段落中定义的视频编码方法,所述方法还包括以下步骤(a)非面向对象的编码步骤,应用于视频序列的少数帧;
(b)面向对象的编码步骤,应用于在所述少数帧后面的该序列的所有帧;(c)定序步骤,用来控制将所述非面向对象和面向对象的编码步骤分别应用于适当的帧,以便生成一个编码的比特流,该比特流包括对应于所述少数帧的非面向对象编码的数据和其后的对应于所述后面各帧的面向对象编码的数据。
本发明的另一个目的是提出一种应用于一个对应于原始视频序列的编码的比特流的视频解码方法,在所述原始视频序列中,各连续帧包括一个或几个任意定形的视频对象(VO)(所述视频对象由其纹理和运动分量以及附加的形状分量所定义)并已通过一种视频编码方法被编码,该视频编码方法包括以下步骤(a)非面向对象的编码步骤,应用于视频序列的少数帧;(b)面向对象的编码步骤,应用于在所述少数帧后面的该序列的所有帧;(c)定序步骤,用来控制将所述非面向对象和面向对象的编码步骤分别应用于适当的帧,以便生成一个编码的比特流,该比特流包括对应于所述少数帧的非面向对象编码的数据和其后的对应于所述后面各帧的面向对象编码的数据;所述解码方法本身包括以下步骤(1)第一解码步骤,应用于所述编码的比特流的所述非面向对象编码的数据,所述非面向对象编码的数据对应于原始视频序列的所述少数帧;(2)空间-时间分割步骤,应用于所述编码的比特流的所述非面向对象编码的数据并用来重建各VO的缺失的形状分量,所述非面向对象编码的数据对应于所述少数帧;(3)第二解码步骤,应用于所述编码的比特流的所述面向对象编码的数据,所述面向对象编码的数据对应于所述后面各帧;(4)定序步骤,用来控制将所述解码和分割步骤分别应用于适当的帧。
发明的详细描述例如文献US 6026195的许多文献都描述了根据MPEG-4标准的面向对象的视频编码方法和设备。所述设备的视频输入由视频对象(VO)构成,并被组织成诸如视频对象平面(VOP)的数字视频图像的序列的形式,其中每个图像由三个分量定义形状、运动和纹理。所述编码设备包括形状编码器、纹理编码器和运动编码器,其中形状编码器编码每个对象的形状的特定表示,纹理编码器编码每个VO的纹理的表示,运动编码器编码每个VO的运动的表示。
然后,表示各VO的所编码的形状、纹理和运动的信号被发送到多路复用器,该多路复用器向缓冲器提供多路复用的数据流。所述缓冲器的输出然后通过一个通道被发送,或者被存储在用于未来使用的诸如数据库的记录介质中,以便随后由多路分解器和解码设备接收,该多路分解器分离所接收的编码的数据。所述解码设备又包括形状解码器、纹理解码器和运动解码器,它们的输出被发送到重建设备,该重建设备例如是合成器(诸如位于用户家中的个人计算机)。在所述重建设备中,所接收的各VOP被处理,并且可以输出如此重组的视频图像序列(例如被显示或者被存储在视频库中)。
针对这样一个已知系统,本发明的原理是通过在编码侧和解码侧都对所涉及的输入序列进行分割来修改编码和解码部分。考虑到所述原理的实现方式,在编码设备中加入一个定序模块,以便执行以下操作(a)对于该序列的少数帧(或图像),并且优选地只对于两个最初的帧,不发送VOP中的VO的形状分量对于这两个最初的图像不选择面向对象的编码模式,并且这两个图像根据非面向对象的编码模式被编码,例如根据基于块的模式被编码,就好像它们是单个矩形对象(该模式在此称为“传统”模式),或者这两个图像根据基于小波分解的模式被编码;(b)仍使用面向对象的编码模式对该序列的后面各帧(如果在操作(a)中只考虑了两个帧的话,即是第三帧、第四帧等等)进行编码,然而无需发送任何形状分量。
在解码设备中,对应地提供一个定序模块以执行以下操作(a)对应于所述两个最初的图像的非面向对象编码的数据通过第一解码步骤被“传统地”解码(即根据如上所述的基于块的模式或基于小波的模式被解码);
(b)基于这两个最初的图像执行空间-时间分割步骤;(c)通过第二解码步骤,根据面向对象的解码模式对对应于所谓后面的图像(即除了两个最初的图像之外的所有图像)的面向对象编码的数据进行解码,由于在解码设备中提供的空间-时间分割处理,获得针对每个VOP的形状信息。
利用该技术解决方案,可以实现基于对象的处理而不用编码形状信息,从而避免了比特位的浪费。
必须注意,本公开内容是说明性的,并且根据本发明的方法并不限于前述的实现方式。例如可以通过在编码的比特流中发送画面级别(picture level)的关于所感兴趣的区域数量(即每个VOP中的VO数量)的信息来略微改进所述分割处理。按照这种方式,解码设备可以调整所述分割步骤,以便获得与编码器侧完全相同的分割。
权利要求
1.一种应用于原始视频序列的视频编码方法,在所述原始视频序列中各连续帧或视频对象平面(VOP)包括一个或几个任意定形的视频对象(VO),所述视频对象在每个VOP中由所述视频对象的纹理和运动分量以及附加的形状分量所定义,所述方法包括以下步骤(a)非面向对象的编码步骤,应用于视频序列的少数帧;(b)面向对象的编码步骤,应用于在所述少数帧后面的该序列的所有帧;(c)定序步骤,用来控制将所述非面向对象和面向对象的编码步骤分别应用于适当的帧,以便生成一个编码的比特流,该比特流包括对应于所述少数帧的非面向对象编码的数据和其后的对应于所述后面各帧的面向对象编码的数据。
2.根据权利要求1的编码方法,其中所述少数帧的数量等于2。
3.根据权利要求1或2的编码方法,其中所述编码的比特流还包括关于原始视频序列中的所感兴趣的区域的数量的信息。
4.根据权利要求3的编码方法,其中所述关于所感兴趣的区域的数量的信息是在画面级别给出的。
5.一种应用于一个对应于原始视频序列的编码的比特流的视频解码方法,在所述原始视频序列中各连续帧或视频对象平面(VOP)包括一个或几个任意定形的视频对象(VO)并已通过一种视频编码方法被编码,所述视频对象在每个VOP中由所述视频对象的纹理和运动分量以及附加的形状分量所定义,所述视频编码方法包括以下步骤(a)非面向对象的编码步骤,应用于视频序列的少数帧;(b)面向对象的编码步骤,应用于在所述少数帧后面的该序列的所有帧;(c)定序步骤,用来控制将所述非面向对象和面向对象的编码步骤分别应用于适当的帧,以便生成一个编码的比特流,该比特流包括对应于所述少数帧的非面向对象编码的数据和其后的对应于所述后面各帧的面向对象编码的数据;所述解码方法本身包括以下步骤(1)第一解码步骤,应用于所述编码的比特流的所述非面向对象编码的数据,所述非面向对象编码的数据对应于原始视频序列的所述少数帧;(2)空间-时间分割步骤,应用于所述编码的比特流的所述非面向对象编码的数据并用来重建各VO的缺失的形状分量,所述非面向对象编码的数据对应于所述少数帧;(3)第二解码步骤,应用于所述编码的比特流的所述面向对象编码的数据,所述面向对象编码的数据对应于所述后面各帧;(4)定序步骤,用来控制将所述解码和分割步骤分别应用于适当的帧。
全文摘要
本发明涉及一种应用于原始视频序列的视频编码方法,在所述原始视频序列中,各连续帧或视频对象平面(VOP)包括一个或几个任意定形的视频对象(VO),所述视频对象由其纹理和运动分量以及附加的形状分量所定义。根据本发明,所述方法包括非面向对象的编码步骤,应用于视频序列的少数帧;面向对象的编码步骤,应用于在所述少数帧后面的该序列的所有帧;以及定序步骤,用来控制将所述非面向对象和面向对象的编码步骤分别应用于适当的帧,以便生成一个编码的比特流,该比特流包括对应于所述少数帧的非面向对象编码的数据和其后的对应于所述后面各帧的面向对象编码的数据。本发明还涉及一种对应的视频解码方法。
文档编号H04N7/50GK1732691SQ200380107904
公开日2006年2月8日 申请日期2003年12月22日 优先权日2002年12月30日
发明者C·迪富尔, G·马昆特, S·瓦伦特 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1