对图像进行编码/解码的方法和设备的制造方法

文档序号:9251230阅读:484来源:国知局
对图像进行编码/解码的方法和设备的制造方法
【专利说明】对图像进行编码/解码的方法和设备
[0001]本申请是向中国知识产权局提交的申请日为2011年I月19日、申请号为201180014824.9、发明名称为“使用先前块的运动矢量作为当前块的运动矢量来对图像进行编码/解码的方法和设备”的申请的分案申请。
技术领域
[0002]本发明涉及一种用于对图像进行编码/解码的方法和设备,更具体地说,涉及一种用于基于帧间预测对图像进行编码/解码的方法和设备。
【背景技术】
[0003]根据视频压缩标准(诸如MPEG-1、MPEG-2和MPEG-4H.264/MPEG-4AVC (先进视频编码)),通过将图像划分为预定大小的块来对图像进行编码。接下来,通过使用帧间预测或帧内预测来对每个预定大小的块进行预测编码。
[0004]对于帧间预测,通过搜索与当前块相同或相似的块的至少一个参考帧来执行运动估计,通过执行运动估计而产生的运动矢量与像素值一起被编码,编码的结果被随后插入比特流。

【发明内容】

[0005]技术方案
[0006]本发明的一个或多个方面提供了一种图像编码方法和设备以及图像解码方法和设备,以及记录有用于执行所述图像编码方法和/或所述图像解码方法的程序的计算机可读记录介质,其中,在所述图像编码方法和设备以及图像解码方法和设备中,基于至少一个先前块的运动矢量来确定当前块的运动矢量,并基于确定的运动矢量来对图像进行编码/解码。
[0007]有益效果
[0008]根据本发明,使用至少一个先前块的运动矢量作为当前块的运动矢量来执行编码,从而增加编码模式的命中率以及预测的精度。因此,可使用更高的压缩率来对图像进行编码和解码。
【附图说明】
[0009]图1是根据本发明的实施例的图像编码设备的框图。
[0010]图2是根据本发明的实施例的图像解码设备的框图。
[0011]图3示出根据本发明的实施例的分层编码单元。
[0012]图4是根据本发明的实施例的基于编码单元的图像编码器的框图。
[0013]图5是根据本发明的实施例的基于编码单元的图像解码器的框图。
[0014]图6示出根据本发明的实施例的最大编码单元、子编码单元和预测单元。
[0015]图7示出根据本发明的实施例的编码单元和变换单元。
[0016]图8a和图8b示出根据本发明的实施例的编码单元、预测单元和变换单元的划分形状。
[0017]图9是根据本发明的另一实施例的图像编码设备的框图。
[0018]图10是示出根据本发明的实施例的对包括在双向预测图像中的块进行预测的方法的示图。
[0019]图1la和图1lb是示出根据本发明的实施例的基于先前编码块的运动矢量来确定当前块的运动矢量的方法的示图。
[0020]图12a和图12b是示出根据本发明的实施例的基于先前编码块的运动矢量来确定当前块的运动矢量的方法的示图。
[0021]图13a和图13b是示出根据本发明的实施例的基于先前编码块的运动矢量来确定当前块的运动矢量的方法的示图。
[0022]图14是根据本发明的另一实施例的图像解码设备的框图。
[0023]图15是示出根据本发明的实施例的图像编码方法的流程图。
[0024]图16是示出根据本发明的实施例的图像解码方法的流程图。
[0025]最佳模式
[0026]根据本发明的一方面,提供了一种基于在当前块被解码之前解码的至少一个块的运动矢量来确定当前块的运动矢量并基于确定的运动矢量来对当前块进行解码的图像解码方法,所述方法包括:对关于在第一方向、第二方向和双向中将被用于对当前块进行解码的预测方向的信息以及关于当前块的像素值的信息进行解码;基于对关于预测方向的信息进行解码的结果,确定当前块将被预测的预测方向,确定用于按照确定的预测方向对当前块进行预测的至少一个运动矢量;基于所述至少一个运动矢量和对关于像素值的信息进行解码的结果,恢复当前块。第一方向是从当前图像到先前图像的方向,第二方向是从当前图像到后续图像的方向。
[0027]根据本发明的另一方面,提供了一种基于在当前块被编码之前编码的至少一个块的运动矢量来确定当前块的运动矢量并基于确定的运动矢量来对当前块进行编码的图像编码方法,所述方法包括:基于所述至少一个块的运动矢量确定当前块的第一方向运动矢量和第二方向运动矢量;基于第一方向运动矢量和第二方向运动矢量,从第一方向预测、第二方向预测和双向预测中确定将被用于对当前块进行编码的预测方法;对关于在确定的预测方法中使用的预测方向的信息以及关于基于所述预测方法产生的当前块的像素值的信息进行编码。第一方向是从当前图像到先前图像的方向,第二方向是从当前图像到后续图像的方向。
[0028]根据本发明的另一方面,提供了一种基于在当前块被解码之前解码的至少一个块的运动矢量来确定当前块的运动矢量并基于确定的运动矢量来对当前块进行解码的图像解码设备,所述设备包括:解码器,对关于在第一方向、第二方向和双向中将被用于对当前块进行解码的预测方向的信息以及关于当前块的像素值的信息进行解码;运动矢量确定器,基于对关于预测方向的信息进行解码的结果,确定当前块将被预测的预测方向,确定用于按照确定的预测方向对当前块进行预测的至少一个运动矢量;恢复单元,基于所述至少一个运动矢量和对关于像素值的信息进行解码的结果,恢复当前块。第一方向是从当前图像到先前图像的方向,第二方向是从当前图像到后续图像的方向。
[0029]根据本发明的另一方面,提供了一种基于在当前块被编码之前编码的至少一个块的运动矢量来确定当前块的运动矢量并基于确定的运动矢量来对当前块进行编码的图像编码设备,所述设备包括:运动矢量确定器,基于所述至少一个块的运动矢量确定当前块的第一方向运动矢量和第二方向运动矢量;编码器,基于第一方向运动矢量和第二方向运动矢量,从第一方向预测、第二方向预测和双向预测中确定将被用于对当前块进行编码的预测方法,对关于在确定的预测方法中使用的预测方向的信息以及关于基于所述预测方法产生的当前块的像素值的信息进行编码。第一方向是从当前图像到先前图像的方向,第二方向是从当前图像到后续图像的方向。
[0030]根据本发明的另一方面,提供了一种记录有用于执行所述图像编码方法和/或所述图像解码方法的程序的计算机可读记录介质。
【具体实施方式】
[0031]以下,将参照附图更详细地描述本发明的示例性实施例。
[0032]图1是根据本发明的实施例的图像编码设备100的框图。
[0033]参照图1,图像编码设备100包括最大编码单元划分器110、编码深度确定器120、图像数据编码器130和编码信息编码器140。
[0034]最大编码单元划分器110可基于作为具有最大大小的编码单元的最大编码单元来对当前帧或像条进行划分。也就是说,最大编码单元划分器110可将当前帧或像条划分为至少一个最大编码单元。
[0035]根据本发明的实施例,可使用最大编码单元和深度来表示编码单元。如上所述,最大编码单元指示当前帧的多个编码单元中具有最大大小的编码单元,深度指示编码单元分层减小的程度。随着深度增加,编码单元从最大编码单元减小到最小编码单元,其中,最大编码单元的深度被定义为最小深度,最小编码单元的深度被定义为最大深度。由于随着深度增加,编码单元的大小从最大编码单元开始减小,第k深度的子编码单元可包括多个第k+n深度的子编码单元(k和η是等于或大小I的整数)。
[0036]根据将被编码的帧的大小的增加,按照较大的编码单元对图像进行编码可导致较高的图像压缩率。然而,如果较大的编码单元被固定,则可能无法通过反映连续变化的图像特征来对图像进行有效地编码。
[0037]例如,当平滑区域(诸如海洋或天空)被编码时,编码单元越大,压缩率可提高得越大。然而,当复杂的区域(诸如人或建筑物)被编码时,编码单元越小,压缩率可提高得越大。
[0038]因此,根据本发明的实施例,针对每个帧或像条设置不同最大图像编码单元和不同最大深度。由于最大深度表示编码单元可减小的最大次数,因此,包括在最大图像编码单元中的每个最小编码单元的大小可根据最大深度被不同地设置。
[0039]编码深度确定器120确定最大深度。可基于率失真(RD)代价的计算来确定最大深度。可针对每个帧或像条或者针对每个最大编码单元不同地确定最大深度。确定的最大深度被提供给编码信息编码器140,根据最大编码单元的图像数据被提供给图像数据编码器 130。
[0040]最大深度表示可包括在最大编码单元中的具有最小大小的编码单元(即,最小编码单元)。换句话说,最大编码单元可根据不同深度被划分为具有不同大小的子编码单元(具体参见图8a和图Sb)。包括在最大编码单元中的具有不同大小的子编码单元可基于具有不同大小的处理单元被预测或变换。变换可以是离散余弦变换(DCT)或KarhunenLoever变换(KLT),在所述变换中,空间域的像素值被变换为频域系数。
[0041]换句话说,图像编码设备100可基于具有各种大小和各种形状的处理单元来执行用于图像编码的多个处理操作。为了对图像数据进行编码,多个处理操作(诸如预测、变换和熵编码)被执行,其中,针对每个操作可使用具有相同大小或不同大小的处理单元。
[0042]例如,图像编码设备100可选择与编码单元不同的处理单元来对所述编码单元进行预测。
[0043]当编码单元的大小是2NX2N(其中,N是正整数)时,用于预测的处理单元可以是2NX2N、2NXN、NX2N和NXN。换句话说,可基于具有将编码单元的高度和宽度中的至少一个二等分的形状的处理单元来执行运动预测。以下,作为预测的基础的处理单元被定义为“预测单元”。
[0044]预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个,可仅对具有特定大小或特定形状的预测单元执行特定预测模式。例如,可仅对具有正方形形状的大小为2NX2N和NXN的预测单元执行帧内模式。此外,可仅对大小为2NX2N的预测单元执行跳过模式。如果多个预测单元存在于编码单元中,则在对每个预测单元执行预测之后,可选择具有最小编码误差的预测模式。
[0045]可选择地,图像编码设备100可基于具有与编码单元不同大小的处理单元对图像数据执行变换。对于编码单元中的变换,可基于具有与编码单元相同的大小或小于编码单元的大小的处理单元来执行变换。以下,作为变换的基础的处理单元被定义为“变换单元”。
[0046]编码深度确定器120可通过使用基于拉格朗日乘子的RD优化来确定包括在最大编码单元中的子编码单元。换句话说,编码深度确定器120可确定从最大编码单元划分的多个子编码单元具有何种形状,其中,所述多个子编码单元根据所述多个子编码单元的深度而具有不同大小。图像数据编码器130通过基于由编码深度确定器120确定的划分形状对最大编码单元进行编码来输出比特流。
[0047]编码信息编码器140对关于由编码深度确定器120确定的最大编码单元的编码模式的信息进行编码。换句话说,编码信息编码器140通过对以下信息进行编码来输出比特流:关于最大编码单元的划分形状的信息、关于最大深度的信息和关于每个深度的子编码单元的编码模式的信息。关于子编码单元的编码模式的信息可包括关于子编码单元的预测单元的信息、关于每个预测单元的预测模式的信息和关于子编码单元的变换单元的信息。
[0048]关于最大编码单元的划分形状的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1