多通道视频编码和解码的方法及装置的制作方法

文档序号:7679032阅读:303来源:国知局
专利名称:多通道视频编码和解码的方法及装置的制作方法
技术领域
本发明涉及视频编码和解码,更具体地涉及用于多通道(multi-pass)视频编码和解码的方法和装置。
背景技术
标准化国际组织/国际电工委员会(IS0/IEC)移动图像专家组一4 (MPEG-4)第10部分先进视频编码(AVC)标准/国际电信联盟、电信部分(ITU-T) H. 264标准(以下称为"MPEG4/H. 264标准"或简单地称为"H.264标准")是目前最权威和最能代表技术发展水平的编码标准。如同其他视频编码标准一样,H.264标准使用基于块的运动补偿和类似离散余弦变换(DCT)的变换编码。众所周知,DCT是高效视频编码并且适合高端应用,例如播放高清晰度电视(HDTV)。然而,DCT算法不适合要求非常低比特率的应用,诸如专用的视频手机。对于非常低的比特率,即使使用解块滤波器,DCT变换也会引入块赝像,因为以非常低的比特率可以编码很少的系数,并且每个系数具有非常粗略的量化步骤。
追求匹配(MP)是一种渴望的算法,以将任意信号分解为从函数的冗余代码字典中选出的波形的线性扩展。选择这些波形以便最佳匹配信号结构。
假设我们有l-D信号/Y"并且我们想要使用来自全部的字典集合^的基本矢量分解该信号。单独的字典函数可以如下表示:
(1)
其中,r是与特定字典元素相关的指数参数。如下所示,通过选择r开始分解从而使内积的绝对值最大
"〈/[。,』〉 (2)然后,如下计算残留信号
雄)=州-肌(O (3)然后,以与原始信号相同的方式扩展该残留信号。该过程迭代地继续,直到生成一组扩展系数的数或者到达用以残留的一些能量阈值。每一阶段n均生成字典函数r。。如下所示,在整个M阶段之后,信号可以通过字典元素的线性函数达到近似
/(0 = 1>W) (4)
/7个样本信号的匹配分解的复杂性证明为lW.丄"l0g^次序。这里,^取决于字典的尺寸而不考虑平移,^是优选的扩展系数的数值,而常数A取决于选择字典函数的策略。给定一个高度过完
备(over-complete)字典,匹配相比于在其复杂性限定为o("log2")的H. 264标准中使用的8X8和4X4 DCT整数变换在计算上耗费更大。
一般来说,匹配算法兼容于任意集合的冗余基本形状。已经提议的是用过完备Gabor函数扩展信号。2-DGabor字典是极端冗余的,并且每种形状均可以存在于任意己编码残留图像中的整数像素位置。由于匹配具有巨大的字典集合并且每个编码基本函数都与残留信号中的结构十分匹配,因此,基于帧的Gabor字典不包括虚假的块结构。
基于匹配的非常低比特率的视频编码采用Gabor冗余字典集合,根据提议的使用匹配算法的视频编码系统(下文称为"现有技术中的基于Gabor的匹配视频编码方法")。提议的系统基于低比特率的混合DCT系统结构,该混合DCT系统以下称之为低比特率图像编码仿真模型,或者简称为"SIM3",其中DCT残留编码器由匹配编码器替换。此编码器使用匹配来通过字典可拆分2-DGabor函数分解运动残留图像。所示的提议系统对于以低比特率的低运动序列执行得很好。
平滑的16X16正弦平方窗口已经应用于现有技术中基于Gabor的匹配视频编码方法中的8X8分区的预测图像。现有技术中基于Gabor匹配视频编码方法中的匹配视频编解码是基于ITU-TH. 263编解码的。然而,H. 264标准允许可变块尺寸运动补偿具有小的块尺寸,其对于l咖a运动补偿可以小到4X4。此外,H. 264标准主要基于基线和主轮廓的4X4的类似DCT的变换,而不是像多数其他卓越的现有视频编码标准中的8X8。用于内编码的方向空间预测改进了预测信号的质量。所有这些显著的设计特征使得H. 264标准更加有效,但是,当在H.264标准上应用匹配时,其需要处理更复杂的情况。平滑的16X16正弦平方窗口如下所示
<formula>formula see original document page 9</formula>(5)
已经提议了混合编码方案(下面称之为"现有技术混合编码方案"),其得益于由运动估计的H.264标准引入的一些特征,并且其替换空间域中的变换。使用匹配算法编码预测误差,其通过适当设计的二维的、各向异性的、冗余字典分解信号。而且,快速原子(fast atom)搜索技术已经被引入。然而,提议的现有技术混合编码方案并未确定使用单一通道还是双通道方案。而且,提议的现有技术混合编码方案表明运动估计部分与H.264标准兼容,但是没有解决在编码方案中是否使用任何解块滤波器或者是否使用任何其他方法在很低比特率情况下平滑由预测的图像引起的块赝像。

发明内容
本发明针对现有技术的上述以及其他缺点和不足,其涉及用于多通道视频编码和解码的方法和装置。
根据本发明的一方面,提供了使用多通道视频编码方案编码视频信号数据的视频编码器。视频编码器包括运动估计器和分解模块。运动估计器对于视频信号数据执行运动估计从而在第一编码通道中获得对应视频信号数据的运动残留。与运动估计器进行信号通信的分解模块分解后续编码通道中的运动残留。
根据本发明的另一方面,提供了使用多通道视频编码方案编码视频信号数据的方法。该方法包括对于视频信号数据执行运动估计从而在第一编码通道中获得对应视频信号数据的运动残留,以及分解后续编码通道中的运动残留。
根据本发明的另一方面,提供了用于解码视频比特流的视频
解码器。该视频解码器包括熵解码器、原子解码器(atomdecoder)、反向变换器、运动补偿器、解块滤波器和组合器。熵解码器解码视频比特流从而获得解压縮的视频比特流。与熵解码器进行信号通信的原子解码器解码对应解压縮的比特流的解压縮的原子,从而获得解码原子。与原子解码器进行信号通信的反向变换器对解码的原子应用反向变换从而形成重构的残留图像。与熵解码器进行信号通信的运动补偿器使用对应解压縮的比特流的运动矢量执行运动补偿,从而形成重构的预测图像。与运动补偿器进行信号通信的解块滤波器对于重构的预测图像执行解块过滤从而平滑重构的预测图像。与反向变换器和重叠块运动补偿器进行信号通信的组合器组合重构的预测图像和残留图像从而获得重构图像。
根据本发明的另一方面,提供了用于解码视频比特流的方法。该方法包括解码视频比特流来获得解压缩的视频比特流、解码对应解码的比特流的解压縮的原子来获得解码原子、对解码的原子应用反向变换从而形成重构的残余图像、使用对应解压縮比特流的运动矢量执行运动补偿从而形成重构的预测图像、对于重构的 预测图像执行解块过滤来平滑重构的预测图像,以及组合重构的 预测图像和残留图像来获得重构图像。
本发明的上述和其他方面、特征以及优点将从示例性实施例 的下列详述中得以体现,其将联系附图加以说明。


根据下面示例性附图可以更好的理解本发明,其中
图1A和IB是用以示例的在双通道基于H. 264标准的匹配编 码器/解码器(CODEC)中的编码器的第一和第二通道部分的图示, 根据当前原理的实施例可以对其应用当前原理;
图2是用以示例的在双通道基于H. 264标准的匹配编码器/解 码器(CODEC)中的解码器的图示,根据当前原理的实施例可以对 其应用当前原理;
图3是用以根据当前原理的实施例编码输入视频次序的示例 性方法的图示;并且
图4是用以根据当前原理的实施例解码输入视频次序的示例 性方法的图示。
具体实施例方式
本发明涉及用于多通道视频编码和解码的方法和装置。有利 的是,本发明校正了由例如以非常低的比特率应用的H.264标准 中使用的DCT变换引入的块赝像。此外,在保持本发明大范围内, 本发明不限于只以低比特率应用,也可以用于其他(高)比特率。
本发明的附示了本发明的原理。因此可以预见的是,尽 管没有在此明确描述和显示,但是本领域技术人员可以在本发明 的精神和范围内设计出体现本发明原理的各种结构。
在此引证的所有示例和条件语言试图用于教学目的来帮助读者理解发明的原理以及由发明者贡献的概念从而促进该技术,并 且解释为不受这种具体引证的示例和情况的限制。
而且,在此引证发明的原理、方面和实施例的所有陈述,与 其特定示例一样,都试图包含其中的结构性和功能性等同物。因 此,可以预见的是,这种等同物包括当前公知的等同物和未来发 展出的等同物,也就是,不论其结构,能够执行相同功能的发展 出的任何元件。
因此,例如,本领域那些技术人员可以预见的是这里介绍的 框图表现了体现本发明原理的说明性电路图的概念性观点。类似 地,可以预见的是任意流程表、流程图、状态转移图、伪代码, 等等都表示了在计算机可读介质中实质上所表示并由计算机或处 理器执行的各种处理,而无论这样的计算机或处理器是否明确表 示出来。
通过像可以执行与适当软件相关联软件的硬件那样使用专用 硬件提供图中展示的各种元件的功能。当由处理器提供时,可以 由单一专用处理器、由单一共享处理器或者由许多单独处理器提 供该功能,其中一些可以共享。而且,明确对术语"处理器"或 "控制器"的使用不应当排外地解释为能够执行软件的硬件,并
且没有限制,可能隐含地包括,数字信号处理器("DSP")硬件、 用于存储软件的只读存储器("ROM")、随机存取存储器("RAM") 和不变存储器。
其他硬件、传统和/或惯例,也可以包括在内。类似地,图中 所示的任何开关都只是概念性的。它们的功能可以通过运行程序 逻辑、通过专用逻辑、通过程序控制与专用逻辑的相互作用,甚 至通过人工来实现,由执行人优选的特定技术也从文中得以更明 确地理解。
根据本权利要求,表达为用于执行特定功能的方法的任何元 件都试图包含执行以下功能的任意方式,该功能包括,例如,a) 执行该功能的电路元件的组合或者b)与适当电路结合的用来执 行软件从而实现功能的任何形式的软件,因此包括固件、微码等等。如同由这种权利要求所定义的发明存在于以下事实中,即由 各种引证的方法提供的功能以权利要求所要求的方式结合和集合 起来。因此,应当注意的是任何可以提供这些功能的方法都与这 里展示的相同。
根据当前原理,提供了多通道视频编码和解码方案。该多通 道视频编码和解码方案可以与匹配一同使用。在说明性实施例中, 公开了一种用于匹配视频编码的双通道基于H. 264的编码方案。
H. 264标准应用基于块的运动补偿和相似于其他视频解压标 准的类似DCT的变换。即使使用解块滤波器,以非常低的比特率, DCT变换也会引入块赝像,因为只有很少的系数可以非常低的比特 率编码,并且每一系数都试图具有非常粗略的量化步骤。根据当 前原理,使用过度完成基础的匹配应用于编码残留图像。运动补 偿和模式判定部分与H.264标准兼容。重叠块运动补偿(0BMC) 应用于使预测图像平滑。此外,提供了用于选择不同于匹配的基 础的新方法。
根据当前原理,视频编码和/或解码器对于预测图像应用0BMC 来减少由预测模型引起的块赝像。匹配算法用来编码残留图像。 匹配的优点在于其不是基于块的,而是基于帧的,因此,不存在 由编码残留区别引起的块赝像。
转到图1A和1B,在双通道基于H. 264标准的匹配的编码/解 码器(CODEC)中编码器的示例性第一和第二通道部分通常由参考 数字110和160表示。编码器通常由参考数字190表示而解码器 部分通常由参考数字191表示。
参考图1A,第一通道部分110的输入端与组合器112的非转 化输入端、编码器控制模型114的输入端和运动估计器116的第 一输入端以信号通信方式进行连接。组合器112的第一输出端与 缓冲器118的第一输出端以信号通信方式进行连接。组合器112 的第二输出端与整数变换/缩放/量化模块120的输入端以信号通 信方式进行连接。整数变换/缩放/量化模块120的输出端与縮放/ 反向变换模块122的第一输入端以信号通信方式进行连接。编码控制模块114的第一输出端与帧内预测器126的第一输 入端以信号通信方式进行连接。编码控制模块114的第二输出端
与运动补偿器124的第一输入端以信号通信方式进行连接。编码 控制模块114的第三输出端与运动估计器116的第二输入端以信 号通信方式进行连接。编码器控制模块114的第四输出端与缩放/ 反向变换模块122的第二输入端以信号通信方式进行连接。编码 器控制模块114的第五输出端与缓冲器118的第一输入端以信号 通信方式进行连接。
运动估计器116的输入端与运动补偿器124的第二输入端以 及缓冲器128的第二输入端以信号通信方式进行连接。组合器112 的反向输入端选择性地与运动补偿器124的输出端或者帧内预测 器126的输出端以信号通信方式进行连接。运动补偿器124或者 帧内预测器126选择的输出端与组合器128的第一输入端以信号 通信方式进行连接。縮放/反向变换模块122的输出端与组合器 128的第二输入端以信号通信方式进行连接。组合器128的输出端 与帧内预测器126的第二输入端、运动估计器116的第三输入端 以及运动补偿器124的输入/输出端以信号通信方式进行连接。缓 冲器118的输出端可用作为第一通道部分110的输出端。
关于第一通道部分110、编码器控制模块114、整数变换/縮 放/量化模块120、缓冲器118和运动估计器116都包含在编码器 190中。而且,关于第一通道部分、缩放/反向变换模块122、帧 内预测器126和运动补偿器124都包含在解码器部分191中。
第一通道部分110的输入端接收输入视频111,并且在缓冲器 118中存储控制数据(例如,运动矢量、模式选择、预测的图像等), 以在第二通道部分160中使用。
参考图1B,第二通道部分160的第一输入端与熵编码器166 的输入端以信号通信方式进行连接。第一输入端从第一通道部分 IIO接收控制数据162 (例如,模式选择,等等)和运动矢量164。 第二通道部分160的第二输入端与组合器168的非反向输入端以 信号通信方式进行连接。第二通道部分160的第三输入端与重叠块运动补偿(0BMC) /解块模块170的输入端以信号通信方式进行
连接。第二通道部分160的第二输入端从第一通道部分110接收 输入视频110,并且第二通道部分的第三输入端从第一通道部分 ilO接收预测图像187。
提供残留172的组合器168的输出端与原子检测器174的输 入端以信号通信方式进行连接。提供编码的残留178的原子检测 器174的输出端与原子编码器176的输入端以及组合器180的第 一非反向输入端以信号通信方式进行连接。0BMC/解块模块170的 输出端与组合器168的反向输入端以及组合器180的第二非反向 输入端以信号通信方式进行连接。提供输出视频的组合器180的 输出端与参考缓冲器182的输入端以信号通信方式进行连接。原 子编码器176的输出端与熵编码器166的输入端以信号通信方式 进行连接。熵编码器166的输出端可用作第二通道部分160的输 出端,并且提供输出比特流。
关于第二通道部分160,熵编码器包含在编码器190中,并且 组合器168、 OBMC模块170、原子检测器174、原子编码器176和 参考缓冲器182包含在解码器部分191中。
转到图2,双通道基于H.264标准的匹配编码器/解码器 (CODEC)中的示例性解码器总地由参考数字200表示。
解码器200的输入端与熵解码器210的输入端以信号通信方 式进行连接。熵解码器210的输出端与原子解码器220的输入端 以及运动补偿器250的输入端以信号通信方式进行连接。提供残 留的反向变换模块230的输出端与组合器270的第一非反向输入 端以信号通信方式进行连接。运动补偿器250的输出端与0BMC/ 解块模块260的输入端以信号通信方式进行连接。0BMC/解块模块 260的输出端与组合器270的第二非反向输入端以信号通信方式 进行连接。组合器的输出端可用作解码器200的输出端。
当前原理可应用于ITU-T H. 264/AVC编码系统,不像在现有 技术下基于Gabor的匹配视频编码方法的在H. 263编解码器基础 上的匹配视频编解码器。由于基于帧的残留编码,我们对于预测图像应用OBMC,其不能在H. 264/AVC编解码器上执行。
在根据当前原理的实施例中,视频编码方案中的第一通道与 H. 264标准兼容。在第一通道中不存在实质的编码。所有的控制数 据,例如模式选择、预测图像和运动矢量存入用于第二通道的缓 冲器。DCT变换仍然应用在运动补偿和使用比率失真优化(RDO) 的模式选择的第一通道中。为第二通道保存所有的残留图像,而 不是用DCT系数编码残留图像。在当前原理的实施例中,提议应 用16X16强制内编码或者兼容H.264标准的强制内编码,并且特 别地处置内编码和交互编码宏块之间的边界部分。
在第二通道中,可以由熵编码来编码运动矢量和控制数据。 可以由匹配来编码残留图像。可以根据例如现有技术中基于Gabor
匹配视频编码方法来执行原子检测和参数编码。为参考帧保存重 构的图像。
匹配视频编码的好处之一在于匹配不是基于块的,因此不存 在块赝像。然而,当在块基础上执行运动预测并且不精确时,其 还是以非常低的比特率产生一些块赝像。模拟表明原子出现在移 动轮廓和运动矢量(MVs)不十分精确的区域。改进运动估计使得 原子更好地表现残留。
为了消除来自运动预测中的赝像,其中一个方法包括,用类 似H.264或者改进的解块滤波器来平滑在预测图像中的块状边界。 在另一种方法中,采用了使用重叠块(0BMC)的较平滑的运动模 型。在现有技术下基于Babor的匹配视频编码方法中,采用了 16 X16正弦平方窗口。例如,根据现有技术的混合编码方案,可能 限定NXN正弦平方窗口。为8X8的块设计16X16正弦平方窗口, 并且像处置四个8X8的块那样处置16X16的块。
然而,在H. 264标准中,支持具有luma块尺寸为16X16、 16 X8、 8X16和8X8的样本的分区。在选择8X8的样本分区情况 下,8X8分区进一步分为8X4、 4X8或4X4 luma样本的分区并 且与色度样本相对应。在此,提议四种方法来解决更多分区类型。 第一个方法是为4X4分区使用8X8正弦平方窗口。由于所有其他分区都在4X4之上,因此将这些分区分割成若干4X4分区。
第二个方法是为8X8及以上的分区使用16X16的正弦平方窗口, 但是其不触及小于8X8的分区。第三个方法是为所有分区使用自 适应性0BMC。所有这三个方法只执行0BMC而不执行解块滤波器, 而第四个方法是将0BMB和解块滤波器结合起来。
除了在现有技术下基于Gabor的匹配视频编码方法中为了残 留编码而执行的冗余Gabor字典集合之外,我们提议利用更加过 完备的基础。以非常低的比特率,平移运动模型难以精确地表现 诸如移动边缘的相关视觉特征的自然运动。因此,多数残留误差 能量位于这些区域。因此,使用边缘检测冗余字典来表示误差图 像是很有意义的。具有较少冗余的离散小波变换(例如,2-D 二 元树离散小波变换(DDWT)),其可以利用2-D Gabor字典或者 使用一些其他边缘检测字典。2-D DDWT比2-D DWT具有较多的子 带/方向。每个子带表示一个方向,这就是边缘可检测。在噪声成 型后,2-D DDWT与标准2-D DWT相比较获得了具有相同的保留系 数的较高的PSNR。因此,其更适合编码边缘信息。对于预测图像 应用0BMC之后,误差图像将具有更平滑的边缘。参数的完整2-D 字典可以用来提供更平滑的边缘。
参考图3,用来编码输入视频次序的示例性方法总地以参考数 字300来表示。方法300包括起始块305,其将控制转到决定块 310。决定块310决定当前帧是否是I帧。如果是,那么将控制转 到功能块355。否则,将控制转到功能块315。
功能块355执行兼容H. 264标准的帧编码来提供输出比特流, 并且将控制转到结束块370。
功能块315执行兼容H. 264标准运动补偿,并且将控制转到 功能块320。功能块320保存运动矢量(MVs)、控制数据和预测 块,并且将控制转到决定块325。决定块325决定是否己到达帧末 端。如果到达,那么将控制转到功能块330。否则,将控制转回到 功能块315。
功能块330对于预测图像执行OBMC和/或解块滤波,并且将控制转到功能块335。功能块335从原始的和预测的图像获得残留 图像,并且将控制转到功能块340。功能块340使用匹配编码残留, 并且将控制转到功能345。功能块345执行熵编码来提供输出比特 流,并且将控制转到结束块370。
参考图4,用于解码输入视频次序的示例性方法总地以参考数 字400表示。方法400包括将控制转到决定块410的开始块405。 决定块410决定当前帧是否为I帧。如果是,那么将控制转到功 能块435。否则,将控制转到功能块415。
功能块435执行兼容H.264标准的解码来提供重构图像,并 且将控制转到结束块470。
功能块415解码运动矢量、控制数据和匹配原子,并且将控 制转到功能块420和功能块425。功能块420使用解码的原子重构 残留图像,并且将控制转到功能块430。功能块425通过解码运动 矢量和其他控制数据以及应用OBMC和/或解码滤波来重构预测图 像,并且将控制转到功能块430。功能块430将重构的残留图像与 重构的预测图像组合从而提供重构的图像,并且将控制转到结束 块470。
现将对本发明的众多附带优点/特征中的一些给予描述,其中 一些上文巳提到。例如,其中一个优点/特征是使用多通道视频编 码方案编码视频信号数据的视频编码器,其中该视频编码器包括 运动估计器和分解模块。该运动估计器对于视频信号数据执行运 动估计来获得对应第一编码通道中的视频信号数据的运动残留。 分解模块与运动估计器进行信号通信,分解后续的编码通道中的 运动残留。
另外一个优点/特征是如上所述的视频编码器,其中多通道视 频编码方案是双通道视频编码方案。视频编码器还包括与运动估 计器和分解模块进行信息通信的缓冲器,用来存储从第一编码通 道获得的用于在第二编码通道中后续使用的运动残留。分解模块 分解使用第二编码通道中的冗余Gabor字典集合的运动残留。
再一个优点特征是使用上述双通道视频编码方案的视频编码器,其中在第一编码通道中的运动估计器遵从国际通信联盟、通
信部分(ITU-T)的H. 264标准执行运动估计和编码模式选择。
另外一个优点特征是使用上述双通道视频编码方案视频编码 器,其中视频编码器还包括预测模块和重叠块运动补偿器。预测 模块与缓冲器进行信号通信,形成对应第一编码通道中的视频信 号数据的预测图像。重叠块运动补偿器与缓冲器进行信号通信,
对于使用16X16正弦平方窗口的预测图像执行重叠块运动补偿 (0BMC)来平滑第二编码通道中的预测图像。缓冲器存储用于在 第二编码通道中后续使用的第一编码通道中的预测图像。
此外,另一优点特征是使用上述双通道视频编码方案的视频 编码器,其中视频编码器还包括预测模块和重叠块运动补偿器。
预测模块与缓冲器进行信号通信,形成对应第一编码通道中的视 频信号数据的预测图像。重叠块运动补偿器与缓冲器进行信号通 信,仅对于第二编码通道中的预测图像的8X8和更大分区执行重 叠块运动补偿(0BMC)。缓冲器存储用于在第二编码通道中后续 使用的第一编码通道中的预测图像。
此外,另一优点特征是使用上述双通道视频编码方案的视频 编码器,其中视频编码器还包括预测模块和重叠块运动补偿器。
预测模块与缓冲其进行信号通信,形成对应第一编码通道中的视 频信号数据的预测图像。重叠块运动补偿器与缓冲器进行信号通 信,执行使用第二编码通道中的预测图像的4X4分区的8X8正 弦平方窗口的重叠块运动补偿(0BMC)。当在第二编码通道执行 0BMC时,预测图像的所有分区都分割成4X4分区。缓冲器存储用 于在第二编码通道中后续使用的第一编码通道中的预测图像。
同样,另一优点特征是使用上述双通道视频编码方案的视频 编码器,其中视频编码器还包括预测模块和重叠块运动补偿器。
预测模块与缓冲器进行信号通信,形成对应第一编码通道中的视 频信号数据的预测图像。重叠块运动'补偿器与缓冲器进行信号通 信,为第二编码通道中的预测图像的所有分区执行自适应性重叠 块运动补偿(0BMC)。缓冲器存储用于在第二编码通道中后续使用的第一编码通道中的预测图像。
另外,另一优点特征是使用上述双通道视频编码方案的视频 编码器,其中视频编码器还包括预测模块和解块滤波器。预测模 块与缓冲器进行信号通信,形成对应第一编码通道中的视频信号 数据的预测图像。解块滤波器与缓冲器进行信号通信,对于第二 编码通道中的预测图像执行解块操作。缓冲器存储用于在第二编 码通道中后续使用的第一编码通道中的预测图像。
再一优点特征是使用上述双通道视频编码方案的视频编码 器,其中分解模块执行二元树小波变换来分解运动残留。
再一优点特征是使用上述双通道视频编码方案和二元树小波 变换的视频编码器,其中分解模块使用噪声成型来选择二元树
(dual-tree)小波变换的系数。
另外,另一优点特征是使用上述双通道视频编码方案的视频 编码器,其中分解模块应用参数完整的2-D字典来分解第二编码 通道中的运动残留。
此外,另一优点特征是用于解码视频比特流的视频解码器, 其中视频解码器包括熵解码器、原子解码器、反向变换器、运动 补偿器、解块滤波器和组合器。熵解码器解码视频比特流来获得
解压的视频比特流。原子解码器,与熵解码器进行信号通信,解 码对应解压比特流的解压原子从而获得解码原子。反向变换器,
与原子解码器进行信号通信,对解码原子应用反向变换从而形成 重构的残留图像。运动补偿器,与熵解码器进行信号通信,执行 使用对应解压比特流的运动矢量的运动补偿从而形成重构的预测 图像。解块滤波器与运动补偿器进行信号通信,对于重构的预测 图像执行解块过滤从而平滑重构的预测图像。组合器与反向变换 器和重叠块运动补偿器进行信号通信,组合重构的预测图像与残 留图像从而获得重构图像。
基于本文教导,相关领域的普通技术人员中可以轻易确定本 发明的上述以及其他特征和优点。可以理解的是本发明的教导可 以以各种形式的硬件、软件、固件、专用处理器或其组合的形式执行。
最优选地,本发明的教导执行为硬件与软件的组合。另外, 软件可以执行为明确体现在程序存储单元上的应用程序。应用程 序可以上载到,且由,任何适当构造组成的装置执行。优选地, 该装置在具有诸如一个或多个中央处理器("CPU")、随机存取 存储器("RAM")和输入/输出("I/O")界面的硬件的计算机 平台上执行。计算机平台也可以包括操作系统和微指令代码。上 述各种程序和功能可以是微指令代码的部分或是应用程序的部
分,或者是可由CPU执行的任意其组合体。另外,各种其他外围
设备部件连接到诸如附加数据存储单元和打印单元的计算机平台。
还可以理解到的是,由于附图中描述的一些组成系统的组件 和方法优选以软件形式实现,因此系统组件或处理功能块之间的 实际连接取决于本发明编程方式的不同而不同。给定其中的教益, 本领域的普通技术人员能够预期本发明的这些以及类似的实施方 式或者配置。
尽管文中已参考附图描述了图示的实施例,但是可以理解的 是,本发明不仅限于这些明确的实施例,在不背离本发明的范围 或精神的情况下,本领域普通技术人员可以进行各种更改和修正。 所有这种更改和修正都试图包含在所附权利要求设定的本发明的 范围内。
权利要求
1.一种使用多通道视频编码方案编码视频信号数据的视频编码器,包括运动估计器(116),用于对视频信号数据执行运动估计,从而在第一编码通道中获得对应视频信号数据的运动残留;与所述运动估计器进行信号通信的分解模块(174),用于分解后续编码通道中的运动残留。
2. 根据权利要求l所述的视频编码器,其中,所述多通道视 频编码方案是双通道视频编码方案,所述视频编码器还包括与所 述运动估计器和所述分解模块进行信号通信的缓冲器(118),所 述缓冲器(118)存储在所述第一编码通道中获得的用于在第二编 码通道中后续使用的运动残留;分解模块(174)在第二编码通道中使用冗余Gabor字典集合 分解所述运动残留。
3. 根据权利要求2所述的视频编码器,其中,所述运动估计 器(116)在所述第一编码通道中遵从国际通信联盟、通信部分(ITU-T)的H.264标准执行运动估计和编码模式选择。
4. 根据权利要求2所述的视频编码器,还包括 与所述缓冲器进行信号通信的预测模块(124, 126),用于在第一编码通道中形成对应视频信号数据的预测图像;与所述缓冲器进行信号通信的重叠块运动补偿器(170),用 于使用16X16正弦平方窗口对预测图像执行重叠块运动补偿 (0BMC),以平滑在所述第二编码通道中的所述预测图像,其中, 所述缓冲器存储第一编码通道中的所述预测图像,用于在第二编 码通道中后续使用。
5. 根据权利要求2所述的视频编码器,还包括 与所述缓冲器进行信号通信的预测模块(124, 126),用于在第一编码通道中形成对应所述视频信号数据的预测图像;与缓冲器进行信号通信的重叠块运动补偿器(170),用于仅对所述第二编码通道中的所述预测图像的8X8和更大的分区执行 重叠块运动补偿(0BMC),其中,所述缓冲器存储用于在第二编码通道中后续使用的第一编码通道中的所述预测图像。
6. 根据权利要求2所述的视频编码器,还包括与所述缓冲器进行信号通信的预测模块(124, 126),用于 在第一编码通道中形成对应视频信号数据的预测图像;与所述缓冲器进行信号通信的重叠块运动补偿器(170),用 于在第二编码通道中为预测图像的4X4分区使用8X8正弦平方 窗口执行重叠块运动补偿0BMC,其中,当在第二编码通道中执行 0BMC时,将预测图像的所有分区分割成4X4分区,其中,所述缓 冲器存储用于在第二编码通道后续使用的第一编码通道中的预测 图像。
7. 根据权利要求2所述的视频编码器,还包括 与所述缓冲器进行信号通信的预测模块(124, 126),用于在第一编码通道中形成对应视频信号数据的预测图像;与所述缓冲器进行信号通信的重叠块运动补偿器(170),用 于在第二编码通道中为预测图像的所有分区执行自适应重叠块运 动补偿0函C,其中,所述缓冲器存储用于在第二编码通道后续使 用的第一编码通道中的预测图像。
8. 根据权利要求2所述的视频编码器,还包括 与所述缓冲器进行信号通信的预测模块(124, 126),用于在第一编码通道中形成对应视频信号数据的预测图像;与所述缓冲器进行信号通信的解块滤波器(170),用于在所 述第二编码通道中对预测图像执行解块操作,其中,所述缓冲器 存储用于在第二编码通道中后续使用的第一编码通道中的预测图 像。
9. 根据权利要求2所述的视频编码器,其中,所述分解模块 (174)执行二元树小波变换来分解运动残留。
10. 根据权利要求9所述的视频编码器,其中,所述分解模 块(174)利用噪音成型来选择二元树小波变换的系数。
11. 根据权利要求2所述的视频编码器,其中,所述分解模块(174)应用参数过完备2-D字典来分解第二编码通道中的运动残留。
12. —种使用多通道视频编码方案编码视频信号数据的方法,包括对视频信号数据执行运动估计,以便在第一编码通道中获得对应视频信号数据的运动残留(315);分解在后续编码通道中的运动残留(340)。
13. 根据权利要求12所述的方法,其中,多通道视频编码方 案是双通道视频编码方案,所述方法还包括存储用于在第二编码 通道中后续使用的在第一编码通道中获得的运动残留(320),所 述分解步骤(340)在第二编码通道中使用冗余Gabor字典集合分 解运动残留。
14. 根据权利要求13所述的方法,其中,在第一编码通道中 的运动估计和编码模式选择遵从国际电信联盟、电信部分(ITU-T) H. 264标准执行。
15. 根据权利要求13所述的方法,还包括 在第一编码通道中形成对应视频信号数据的预测图像(315); 在第一编码通道中存储预测图像(320);使用16X16正弦平方窗口对预测图像执行重叠块运动补偿 0BMC,以平滑在第二编码通道中的预测图像(330)。
16. 根据权利要求13所述的方法,还包括 在第一编码通道中形成对应视频信号数据的预测图像(315); 在第一编码通道中存储预测图像(320); 仅对第二编码通道中的预测图像的8X8和更大分区执行重叠块运动补偿0BMC (330)。
17. 根据权利要求13所述的方法,还包括 在第一编码通道中形成对应视频信号数据的预测图像(315); 在第一编码通道中存储预测图像(320); 在第二编码通道中为预测图像的4X4分区使用8X8正弦平方窗口来执行重叠块运动补偿0BMC,其中,当在第二编码通道中执行0BMC时,预测图像的所有分区都分割成4X4分区。
18. 根据权利要求13所述的方法,还包括 在第一编码通道中形成对应视频信号数据的预测图像(315); 存储在所述第一编码通道中的所述预测图像(320);在第二编码通道中为预测图像的所有分区执行自适应重叠块运动补偿(0BMC)。
19. 根据权利要求13所述的方法,还包括在第一编码通道中形成对应视频信号数据的预测图像(315);在第一编码通道中存储预测图像(320); 在第二编码通道中对预测图像执行解块操作(330)。
20. 根据权利要求13所述的方法,其中,所述分解步骤(340) 执行二元树小波变换来分解运动残留。
21. 根据权利要求20所述的方法,其中,所述分解步骤(340) 利用噪音成型来选择二元树小波变换的系数。
22. 根据权利要求13所述的方法,其中,所述分解步骤(340) 应用参数过完备2-D字典来分解第二编码通道中的运动残留。
23. —种用于解码视频比特流的视频解码器,包括 熵解码器(210),用于解码视频比特流从而获得解压縮视频比特流;与所述熵解码器进行信号通信的原子解码器(220),用于解 码对应解压縮比特流的解压缩的原子从而获得解码的原子;与所述原子解码器进行信号通信的反向变换器(230),用于 对解码的原子应用反向变换从而形成重构的残留图像;与所述熵解码器信号通信的运动补偿器(250),使用对应解 压縮比特流的运动矢量执行运动补偿以形成重构的预测图像;与所述运动补偿器进行信号通信的解块滤波器(260),对重 构的预测图像执行解块滤波,从而平滑重构预测图像;与所述反向变换器和所述重叠块运动补偿器进行信号通信的 组合器(270),将重构的预测图像和残留图像组合以获得重构图
24. —种解码视频比特流的方法,包括 解码视频比特流以获得解压縮视频比特流(405); 解码对应解压縮比特流的解压缩原子以获得解码原子(415); 对解码的原子应用反向变换以形成重构的残留图像(420); 使用对应解压縮比特流的运动矢量执行运动补偿以形成重构 预测图像(425);对重构的预测图像执行解块滤波以平滑重构的预测图像(425);将重构的预测图像和残留图像组合以获得重构的图像(430)。
全文摘要
本发明公开了一种视频编码器、视频解码器以及使用多通道视频编码方案编码和解码视频信号数据的方法。视频编码器包括运动估计器(116)和分解模块(174)。运动估计器对视频信号数据执行运动估计从而获得对应第一编码通道中的视频信号数据的运动残留。分解模块与运动估计器进行信号通信,分解后续编码通道中的运动残留。
文档编号H04N7/36GK101518085SQ200780034952
公开日2009年8月26日 申请日期2007年2月15日 优先权日2006年9月22日
发明者鹏 尹, 王贝贝 申请人:汤姆森许可贸易公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1