图像解码装置以及图像解码方法

文档序号:7813236阅读:279来源:国知局
图像解码装置以及图像解码方法
【专利摘要】图像编码装置具备:预测部(4),其根据各颜色成分信号适应性地决定运动预测单位块的大小,并且将该运动预测单位块分割为运动矢量分配区域来搜索运动矢量;可变长编码部(8),其在对运动预测单位块整体分配运动矢量的情况下,如果该运动矢量与预测矢量相等、且不存在预测误差信号(5),则设为mc_skip模式来进行编码,在运动矢量分配区域为规定的大小以上、且对运动矢量分配区域整体分配运动矢量的情况下,如果该运动矢量与预测矢量相等、且不存在预测误差信号(5),则设为sub_mc_skip模式来进行编码。
【专利说明】图像解码装置以及图像解码方法
[0001]本发明是2010年5月27日递交的国际申请号为PCT/JP2010/003553的PCT申请进入中国国家阶段的、国家申请号为“201080023464.4”、发明名称为“图像编码装置、图像解码装置、图像编码方法以及图像解码方法”的申请的分案申请。

【技术领域】
[0002]本发明涉及一种在图像压缩编码技术、压缩图像数据传输技术等中使用的图像编码装置、图像解码装置、图像编码方法以及图像解码方法。

【背景技术】
[0003]以往,在MPEG、ITU-T H.26x等国际标准影像编码方式中,将输入影像帧以由16X 16像素块形成的宏块(macro block)的单位来进行分割后进行压缩处理。
[0004]另一方面,近年来,期望对具有与HDTV (High Definit1n Televis1n (高清晰度电视),1920X1080像素)的4倍相当的空间分辨率的4KX2K像素的影像格式、进而与其4倍相当的8KX4K像素的影像格式、或者增加颜色信号的采样数来提高颜色再现性的4:4:4影像信号格式等的高清晰.高质量影像进行压缩编码的技术。在对这种高清晰.高质量影像进行压缩编码的情况下,通过16X16像素的宏块是无法进行充分利用图像信号相关的编码,难以实现高压缩率。为了应对这种问题,提出了如下技术:例如将以往的16X16像素宏块的大小如非专利文献I那样扩展为32 X 32像素块,通过使运动矢量的分配单位变大来削减预测所需的参数的代码量,或者通过使预测误差信号的变换编码的块大小变大来有效地去除信号的像素间相关。
[0005]图21是表示非专利文献I的编码装置的结构的框图。在非专利文献I的编码中,首先,将作为编码对象的输入影像信号1001在块分割部1002中以宏块(与亮度信号相当的32像素X 32线的矩形块)的单位来进行分割,并作为编码影像信号1003输入到预测部1004。
[0006]在预测部1004中,将宏块内的各颜色成分的图像信号在帧内.帧间进行预测,来得到预测误差信号1005。特别是在帧间进行运动补偿预测的情况下,以宏块本身、或者将宏块进一步细分而成的子块的单位来搜索运动矢量,根据运动矢量生成运动补偿预测图像,取与编码影像信号1003的差分,由此得到预测误差信号1005。
[0007]压缩部1006针对预测误差信号1005,一边与运动矢量的分配单位区域的大小相应地变更块大小,一边实施DCT (离散余弦变换)处理来去除信号相关之后,进行量化来得到压缩数据1007。压缩数据1007在可变长编码部1008中被进行熵编码而作为比特流1009输出,并且被送至局部解码部1010,得到解码预测误差信号1011。
[0008]将该解码预测误差信号1011与使用于预测误差信号1005的生成的预测信号1012相加来设为解码信号1013,并输入到环路滤波器1014。解码信号1013在环路滤波器1014中被实施去除块失真的处理之后,作为用于生成以后的预测信号1012的参照图像信号1015保存到存储器1016中。此外,为了得到预测信号1012而在预测部1004中决定的预测信号生成用参数1017被送至可变长编码部1008,多路复用到比特流1009而被输出。在此,预测信号生成用参数1017中例如包含表示如何进行帧内的空间预测的帧内预测模式、表示巾贞间的运动量的运动矢量等信息。
[0009]以往的MPEG、ITU-T H.26x等的国际标准影像编码方式中作为宏块大小采用了16X16像素块,与此相对,在非专利文献I中,使用32X32像素块的宏块大小(超宏块:SMB)。图22表示在针对每个MXM像素宏块进行运动补偿预测时的运动矢量分配区域的分割形状的样子,图22的(a)是非专利文献I的SMB,图22的(b)是以往的MPEG-4AVC/H.264 (参照非专利文献2)的宏块。SMB设为像素数M = 32来将每个运动矢量所覆盖的运动预测区域的面积取得较大,与此相对,以往的宏块使用像素数M/2 = 16。由此,在SMB中作为画面整体所需的运动矢量的信息量与像素数M/2 = 16相比变少,因此能够抑制作为比特流应传输的运动矢量代码量。
[0010]非专利文献1:Siwei Ma and C.-C.Jay Kuo, "High-definit1n Video Codingwith Super-macroblocks", Proc.SPIE, Vol.6508, 650816 (2007)
[0011]非专利文献2:MPEG-4AVC(IS0/IEC 14496-10)/ITU-T H.264 标准。


【发明内容】

[0012]在非专利文献1、2的以往方式中,设置如下称为跳过模式的特别模式:在上述运动预测的结果,完全不产生关于运动矢量、预测误差信号应编码的数据。例如,在非专利文献2中,将“运动矢量与其预测值一致,并且预测误差信号的变换系数全部为零”的事例定义为跳过模式。另外,能够选择跳过模式的情况被限定于分配运动矢量的区域的大小与宏块的大小相同时。因此,在如非专利文献I那样扩展宏块大小的情况下,存在如下问题:仅对最大大小的运动预测块设定跳过模式,因此与其相比大小更小的运动预测块不应用跳过模式而难以高效进行编码。
[0013]本发明是为了解决如上所述的问题而完成的,其目的在于提供一种如下的图像编码装置及其方法、以及图像解码装置及其方法:实现安装负荷平衡良好且与作为编码对象的影像信号的统计和局部性质相应地更好地去除信号相关来进行高效的信息压缩的影像编码方法,为了进行超高清晰影像信号的编码而提高了最优性。
[0014]本发明所涉及的图像解码装置,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码装置的特征在于,具备:解码部,从所述比特流对用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在所述第一运动预测模式不是跳过模式、而且对所述块分层地进行分割的情况下,对用于分层地进行分割而得到的第二运动预测单位块的第二运动预测模式进行解码;算术解码部,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及预测部,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像;在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
[0015]本发明所涉及的图像解码方法,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码方法的特征在于,包括:解码步骤,从所述比特流对用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在所述第一运动预测模式不是跳过模式、而且对所述块分层地进行分割的情况下,对用于分层地进行分割而得到的第二运动预测单位块的第二运动预测模式进行解码;算术解码步骤,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及预测步骤,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
[0016]本发明所涉及的图像解码装置,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码装置的特征在于,具备:解码部,从所述比特流对决定所述块的大小的信息、表示与块大小有关的阈值的信息以及用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在第一运动预测模式不是跳过模式、而且第一运动预测单位块大于阈值的情况下,对用于分层地分割所述第一运动预测单位块而得到的第二运动预测单位块用的第二运动预测模式进行解码;算术解码部,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及预测部,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
[0017]本发明所涉及的图像解码方法,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码方法的特征在于,包括:解码步骤,从所述比特流对决定所述块的大小的信息、表示与块大小有关的阈值的信息以及用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在第一运动预测模式不是跳过模式、而且第一运动预测单位块大于阈值的情况下,对用于分层地分割所述第一运动预测单位块而得到的第二运动预测单位块的第二运动预测模式进行解码;算术解码步骤,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及预测步骤,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
[0018]本发明所涉及的图像编码装置具备:预测部,在宏块中根据规定条件适应性地决定运动预测单位块的大小,并且将该运动预测单位块分割为运动矢量分配区域来搜索运动矢量;以及编码部,在对运动预测单位块整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动预测单位块的运动矢量求出的预测矢量相等、且不存在作为运动预测误差信号进行编码的数据,则作为第一跳过模式进行编码;在运动矢量分配区域为规定的大小以上、且对运动矢量分配区域整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动矢量分配区域的运动矢量求出的预测矢量相等、且不存在作为运动预测误差信号进行编码的数据,则作为第二跳过模式进行编码。
[0019]本发明所涉及的图像解码装置具备:解码部,从比特流解码得到表示宏块内的运动预测单位块的大小、确定将运动预测单位块分割得到的运动矢量分配区域的形状的运动预测模式、以及与运动矢量分配区域对应的运动矢量的数据,根据该运动预测模式来确定运动预测单位块是否为第一跳过模式、以及运动矢量分配区域是否为第二跳过模式;以及预测部,在运动预测单位块为第一跳过模式的情况或者运动矢量分配区域为第二跳过模式的情况下,根据周边的运动矢量求出预测矢量来设定为运动矢量,并且将运动预测误差信号全部设定为零来生成预测图像,在运动预测单位块不是第一跳过模式、且该运动预测单位块的运动矢量分配区域不是第二跳过模式的情况下,根据解码部解码得到的运动预测模式和运动矢量生成预测图像。
[0020]本发明所涉及的图像编码方法具备:预测步骤,在宏块中根据规定条件适应性地决定运动预测单位块的大小,并且将该运动预测单位块分割为运动矢量分配区域来搜索运动矢量;以及编码步骤,在对运动预测单位块整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动预测单位块的运动矢量求出的预测矢量相等、且不存在作为运动预测误差信号进行编码的数据,则作为第一跳过模式进行编码,在运动矢量分配区域为规定的大小以上、且对运动矢量分配区域整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动矢量分配区域的运动矢量求出的预测矢量相等、且不存在作为运动预测误差信号进行编码的数据,则作为第二跳过模式进行编码。
[0021]本发明所涉及的图像解码方法具备:解码步骤,从比特流解码得到表示宏块内的运动预测单位块的大小、确定将运动预测单位块分割得到的运动矢量分配区域的形状的运动预测模式、以及与运动矢量分配区域对应的运动矢量的数据,根据该运动预测模式来确定运动预测单位块是否为第一跳过模式、以及运动矢量分配区域是否为第二跳过模式;跳过模式预测步骤,在运动预测单位块为第一跳过模式的情况或者运动矢量分配区域为第二跳过模式的情况下,根据周边的运动矢量求出预测矢量来设定为运动矢量,并且将运动预测误差信号全部设定为零来生成预测图像;以及预测步骤,在运动预测单位块不是第一跳过模式、且运动预测单位块的运动矢量分配区域不是第二跳过模式的情况下,解码得到表示与运动矢量分配区域对应的运动矢量的数据,根据该运动矢量和通过解码步骤解码得到的运动预测模式生成预测图像。
[0022]根据本发明,关于运动预测单位块和运动矢量分配区域分别设定第一跳过模式和第二跳过模式,因此在进行4:4:4格式的影像信号的编码的情况下,能够构成可进行跳过模式的分层表现并灵活地适应各颜色成分信号的时间变化的特性的图像编码装置和图像解码装置,能够对4:4:4格式的影像信号进行最佳的编码处理。

【专利附图】

【附图说明】
[0023]图1表示本发明的实施方式I所涉及的图像编码装置和图像解码装置作为处理对象的4:4:4格式。
[0024]图2是表示实施方式I所涉及的图像编码装置的结构的框图。
[0025]图3是表示图2所示的块分割部所生成的基准块的说明图。
[0026]图4是表示由图2所示的预测部进行的将运动预测单位块以基本块单位来分割后的形状例的说明图。
[0027]图5是表示图2所示的预测部的动作的流程图。
[0028]图6是用于说明由预测部进行的成本J的计算方法的图。
[0029]图7是表示由预测部进行的运动预测模式mc_model?4的预测矢量PMV的计算例的图。
[0030]图8是用于说明跳过模式的图。
[0031]图9是用于说明可变长编码部的熵编码方法的图。
[0032]图10是表示图2所示的可变长编码部的内部结构的框图。
[0033]图11是表示图2所示的可变长编码部的动作的流程图。
[0034]图12是表示上下文模型(Ctx)的概念的说明图。
[0035]图13是表示与运动矢量有关的上下文模型(Ctx)的例的说明图。
[0036]图14是说明运动预测模式的相关的差异的图,图14的(a)、(b)示出在基本块Ba、Bb中选择的运动预测模式的两种状态。
[0037]图15是表示图10所示的二值化部的运动预测模式的二值化结果的图。
[0038]图16A是说明由图10所示的二值化部进行的运动预测模式的二值化的图,表示binO的上下文模型选择方法。
[0039]图16B是说明由图10所示的二值化部进行的运动预测模式的二值化的图,表示binl的上下文模型选择方法。
[0040]图16C是说明由图10所示的二值化部进行的运动预测模式的二值化的图,表示bin2的上下文模型选择方法。
[0041]图16D是说明由图10所示的二值化部进行的运动预测模式的二值化的图,表示bin4的上下文模型选择方法。
[0042]图16E是说明由图10所示的二值化部进行的运动预测模式的二值化的图,表示bin5的上下文模型选择方法。
[0043]图17是表示比特流的数据排列的说明图。
[0044]图18是表示实施方式I所涉及的图像解码装置的结构的框图。
[0045]图19是表示图18所示的可变长解码部的内部结构的框图。
[0046]图20是表示图18所示的可变长解码部的动作的流程图。
[0047]图21是表示非专利文献I的编码装置的结构的框图。
[0048]图22表示在非专利文献I的编码装置中针对每个宏块进行运动补偿预测时的运动矢量分配区域的分割形状的样子。

【具体实施方式】
[0049]实施方式1.
[0050]下面,参照附图详细说明本发明的实施方式。
[0051]在本实施方式中,关于进行以4:4:4格式输入的数字影像信号的压缩和解压缩的图像编码装置和图像解码装置,说明与各颜色成分的信号的状态相适应地进行运动补偿预测处理的图像编码装置和图像解码装置。
[0052]在此,图1示出实施方式I所涉及的图像编码装置和图像解码装置作为输入所使用的4:4:4格式。4:4:4格式是指,如图1的(a)所示,构成彩色运动图像的三个信号成分CO、Cl、C2的像素数都相同的格式。三个信号成分的颜色空间既可以是RGB或者XYZ,也可以是亮度.色差(YUV、YCbCr、或者YPbPr)。相对于4:4:4格式,图1的(b)所示的4:2:0格式表示如下格式:颜色空间是YUV、YCbCr、或者YPbPr,并且相对于亮度Y的像素数,色差信号成分(例如若是YCbCn则Cb、Cr)的像素数在水平W.垂直H分别为二分之一。
[0053]关于以下说明的图像编码装置和图像解码装置,特别限定于4:4:4格式的颜色空间为YUV、YCbCr或者YPbPr、并且将各颜色成分视为与亮度成分相当来进行处理的方式,来进行说明。但是,以下说明的动作在以4:2:0格式的影像信号为对象的图像编码装置和图像解码装置中也能够对其亮度信号直接应用,这是显然的。
[0054]1.图像编码装置
[0055]图2是表示实施方式I所涉及的图像编码装置的结构的框图。图2所示的图像编码装置构成为:将4:4:4格式的输入影像帧分割为规定大小的块、即MmaxXMmax像素块(以下,称为“基准块”),以该基准块的单位来进行运动预测,对预测误差信号进行压缩编码。
[0056]首先,作为编码对象的输入影像信号I在块分割部2中以基准块的单位被分割并作为编码信号3输入到预测部4。图3示出块分割部2所生成的基准块。如图3所示,基准块构成为将由MniaxXMniax像素构成的矩形的块汇总而成的单位的基准块数据。详细内容在后文说明,基准块大小Mmax是在巾贞或者序列、或者GOP (Group Of Pictures:图像组)等的上位层数据级别中决定和编码。此外,也可以构成为在帧内变更基准块大小Mmax,在该情况下,以切片(slice)等的将多个宏块汇总而成的单位来指定基准块大*Mmax。
[0057]基准块数据进一步被分割成Li XMi像素块(1:颜色成分标识符)的“运动预测单位块”,以运动预测单位块为基础来进行运动预测、编码。图3的(a)中的运动预测单位块的图案为Ltl = Mmax/2、MQ = Mmax/2,图3的(b)中的运动预测单位块的图案为Ltl = Mmax/2、M。=Mmax,图3的(a)、(b)中都是L1 = M1 = L2 = M2 = Mmax。此外,在下面的说明中,关于4:4:4格式的各颜色成分的基准块,设为在三个颜色成分CO、Cl、C2中相同,在变更基准块大小Mmax的情况下,对于三个颜色成分都变更为同一大小。另外,关于运动预测单位块的各个大小LpMi,也可以构成为能够针对每个颜色成分C0、C1、C2进行选择,能够以序列、G0P、帧、基准块等的单位来进行变更。通过采用这种结构,无需变更基准块大小Mmax,能够根据每个颜色成分的信号的性质的差异来灵活地决定运动预测单位块大小LpMi,能够进行考虑了以基准块为单位的编码.解码处理的并行化.流水线操作化的高效的安装。
[0058]在预测部4中,对基准块内的各颜色成分的图像信号进行运动补偿预测,来得到预测误差信号(运动预测误差信号)5。预测部4的动作是本实施方式I的图像编码装置的特征,因此后面详细说明。压缩部6对预测误差信号5实施DCT处理等变换处理来去除信号相关之后,进行量化来得到预测误差压缩数据7。此时,在压缩部6中对预测误差信号5进行DCT等正交变换.量化,将预测误差压缩数据7输出到可变长编码部(编码部)8和局部解码部10。
[0059]可变长编码部8对预测误差压缩数据7进行熵编码来作为比特流9进行输出。局部解码部10从预测误差压缩数据7得到解码预测误差信号11。该解码预测误差信号11在加法部中与使用于预测误差信号5的生成的预测信号(预测图像)12相加而成为解码信号13并输入到环路滤波器14。此外,为了得到预测信号12而在预测部4中决定的预测信号生成用参数17被送至可变长编码部8,并作为比特流9被输出。关于预测信号生成用参数17的内容,与预测部4的说明一起后面详细说明。另外,可变长编码部8中的预测信号生成用参数17的编码方法也是本实施方式I的特征之一,因此后面详细说明。
[0060]环路滤波器14使用预测信号生成用参数17和量化参数19对重叠有随着压缩部6中的变换系数量化产生的块失真的解码信号13实施块失真去除滤波。解码信号13在环路滤波器14中被实施去除编码噪声的处理之后作为用于生成以后的预测信号12的参照图像信号15而保存到存储器16中。
[0061]在非专利文献1、2等影像编码方式中,一般采用在以基准块为宏块的情况下一边以宏块的单位来选择帧内编码、帧间预测编码一边进行编码的方法。这起因于存在如下情况:在帧间的运动预测不充分的情况下,利用帧内的相关的情况下编码更有效率。以后,在本实施方式I的图像编码装置中,在说明发明点时,关于针对帧内编码的描述、其选择性使用,在文中不进行明确说明,在不特别说明的情况下,设为能够进行以基准块为单位的帧内编码的选择性使用的结构。在本实施方式I的图像编码装置中,也可以将基准块定义为宏块,但是为了说明运动预测,以后也使用基准块这一用语。
[0062]下面,说明作为本实施方式I的特征之一的预测部4的详细的动作。本实施方式I的预测部4的特征是以下3点。
[0063](I)基准块.运动预测单位块的大小与在运动预测中使用的分割形状的联动适应化
[0064](2)与各颜色成分的性质相应的运动预测模式、运动矢量的决定
[0065](3)基于基准块.运动预测单位块的大小的适应性的跳过模式选择
[0066]关于上述(I),预测部4首先与各颜色成分的信号的性质相应地将基准块分割成LiXMi像素的运动预测单位块,进一步将运动预测单位块分割成由IiXmi像素的组合构成的多个形状。然后,预测部4对各分割区域分别分配固有的运动矢量来进行预测,将预测效率最优的形状选择为运动预测模式,使用作为其结果得到的运动矢量来进行对于各分割区域的运动预测,得到预测误差信号5。设运动预测单位块内的分割形状采取由包括IiXmi像素的“基本块”的组合构成的形状。在本实施方式I的图像编码装置中,在Mi与Hii之间、Li与Ii之间设置“mi = MiA^i = Q/2”的限制。图4中示出根据该条件确定的基本块的分割形状。图4是表示由预测部4进行的将运动预测单位块以基本块单位来分割后的形状例的说明图。下面,设在本实施方式I的图像编码装置中,将图4所示的分割形状的图案(分割图案)mc_mode0?7对于三个颜色成分共用。但是,也可以构成为对三个颜色成分独立确定分割图案mc_mode0?7。此外,下面,将该分割图案mc_mode0?7称为“运动预测模式”。
[0067]在非专利文献1、2的影像编码方式中,运动预测适用区域的形状被限定为矩形,无法使用如图4那样的矩形以外的对角分割。与此相对,在本实施方式I中,通过使如图4那样的适用运动预测的区域的形状多样化,运动物体的轮廓部分等在基准块内包含复杂的运动的情况下,能够以比矩形分割少的运动矢量条数进行运动预测。
[0068]另外,在“S.Kondo and H.Sasai, "A Mot1n Compensat1n Technique usingSliced Blocks and its Applicat1n to Hybrid Video Coding", VCIP 2005, July 2005”中,公开了针对以往的宏块的运动预测适用区域的分割形状的多样化方法。在该文献中,通过进行宏块分割的线段与其块边界之间的交点位置来表现分割形状。然而,该方法是固定了像素数M的状态下增加基准块内的分割图案的方法,存在以下问题。
[0069]问题1:
[0070]用于描述基准块的分割图案的代码量增加。由于允许满足Mmax mod Hii = O的任意的IV基准块内的分割图案增加,需要将用于指定该图案的信息作为开销信息进行编码。分割图案越增加,某特定的分割图案产生的概率越分散,因此分割图案的熵编码的效率差,成为作为代码量的开销而在编码的整体性能上产生限度。
[0071]问题2:
[0072]由于分割图案增加,编码时为了选择最佳的分割而所需的运算量增大。运动预测是占编码处理负荷的大部分的高负荷处理,在分割图案胡乱增加的算法中,将图像编码装置必须设计成从中仅验证和利用特定的分割图案。因而,图像编码装置有时无法最大限度地有效利用算法所具有的原来的性能。
[0073]与此相对,在本实施方式I的图像编码装置中的图4的研究中,首先,通过采取I)设为能够根据编码的条件、影像信号的分辨率、性质来在帧等的上位级别中变更Mmax的值、2)设为能够与每个颜色成分Ci的特性相应地将MmaxXMmax的像素块分割成基本块LiXMi像素、3)在将基本块的分割条件限定为满足“mi = Mi/2'% = Q/2”的限制的分割形状的基础上确保分割的变化(variat1n)、这三个措施,解决上述问题。关于基本块的大小Mmax的值,不在帧、切片内局部地变更而仅在帧级别或者帧列(序列、G0P)等的上位数据结构级别中能够进行变更。该结构能够实现对于包含在基准块内的图像信号图案的含义的差异的适应化。例如,在分辨率小的(Video Graphics Array,VGA等)影像和分辨率大的(HDTV等)影像中,相同的Mmax X Mfflax像素块内的信号图案所表现的含义不同。在预测同一被摄体的情况下,在分辨率小的影像中与被摄体的结构相近的信号图案被捕捉,但是在分辨率大的影像中,即使使用与分辨率小的时候相同的块大小也只不过捕捉被摄体的更局部的部位的信号图案。因而,在基准块的大小不依赖于分辨率而相同的情况下,随着分辨率变高,基准块内的信号图案中噪声成分的要素变大,无法提高作为图案匹配技术的运动预测的性能。
[0074]因此,通过设为仅在上位数据结构级别中能够变更基准块大小Mmax的值,能够抑制基准块大小Mmax的值的信号化所需的代码量,并且能够根据影像的分辨率、场景变化(scenechange)、画面整体的活动变化等状况,来将包含在基准块中的信号图案在运动预测的含义上最优化。除了该结构以外,通过设为如图3那样能够按每个颜色成分变更运动预测单位块内的分割图案,能够与各颜色成分的信号特性相应地使运动预测的处理单位最优化。并且,通过在运动预测单位块内如图4那样赋予分割图案的限定性自由度,能够抑制运动预测单位块内的分割图案的表现所需要的代码量的同时改善运动预测的整体效率。另外,如果能够高效地进行在帧级别中决定基准块大小Mmax的值的处理,则以后就能够将在基准块内应检查的分割图案的变化与以往技术相比抑制为较少,能够使编码处理的负荷变小。
[0075]决定基准块大小Mmax的值的方法中例如有如下方法。
[0076](I)根据编码对象影像的分辨率决定。在相同Mmax值的情况下,在分辨率大的情况下,基准块内的图像信号图案更具有噪声成分上的意思,运动矢量难以捕捉图像信号图案。在这种情况下使Iax值变大来使得能够捕捉图像信号图案。
[0077](2)将帧间的差分值的大小视为活动,在活动大的情况下,以小的Mmax值进行运动预测,在活动小的情况下,以大的Mmax值进行运动预测。另外,此时的大小控制是根据编码对象影像的帧频来决定的。帧频越高,则帧间相关越大,运动矢量本身的动态范围越小,其代码量越小,因此考虑如下方法等:即使活动稍微小,也将Mmax值设定成不会过大来使得能够预测到细的运动。
[0078](3)将(I)和(2)的方法以加权方式进行组合,来进行判断。
[0079]在决定基准块大小Mniax的值之后,按每个颜色成分决定运动预测单位块的大小LpMi0例如在输入影像信号I为在YUV(或者YCbCr等)的颜色空间中定义的信号的情况下,作为颜色信号的U/V成分与亮度信号Y成分相比信号频带窄。因而,块内分散与亮度相比变小。将此作为依据,考虑构成为如下判断基准的例子(参照图3):关于U/V成分的大小L1、Mi,取比亮度信号Y成分的大小LpMi大的值。
[0080]作为进行这些判断的结果所得到的各块大小Mmax、Lp Mi的值作为基准块大小信息18被通知到块分割部2、预测部4、可变长编码部8。此外,如果如图3那样相对于Mmax将LpMi设定为能够通过简单的运算导出的值,则不将Lp Mi作为独立的值来进行编码而只要对计算式的标识符进行编码即可,因此能够抑制基准块大小信息18所需的代码量。
[0081]此外,虽然在图2中没有特别图示,但是图像编码装置也可以是具备基准块大小决定部来决定基准块大小信息18的结构,该基准块大小决定部用于决定Mmax、Lp Mi的值并通知给各部。
[0082]预测部4基于根据基准块大小信息18导出的运动预测单位块大小Lp Mi,执行使用图3、图4的分割图案的运动检测处理。图5是表示预测部4的动作的流程图。预测部4以LiXMi像素的运动预测单位块为单位对该帧的Ci成分进行运动预测。基本上,在该过程中,关于图4的mcjnodeO?7的各个分割图案,在所指定的运动搜索范围内检测每个分割区域的最优运动矢量,最终决定关于该运动预测单位块使用mcjnodeO?7中的哪个运动预测模式的情况下预测效率最高。
[0083]预测效率是通过根据运动预测单位块内的运动矢量的总代码量R、以及根据适用该运动矢量来保存在存储器16内的参照图像生成的预测信号12与输入影像信号I之间的预测误差量D导出的下述成本J来进行定义。预测部4构成为输出该成本J为最小的运动预测模式和运动矢量。
[0084]J = D+λ RU:常数)(I)
[0085]因此,预测部4首先对各运动预测模式mC_m0dek进行成本Jk的计算(步骤STl)。图6中以mc_mode5的事例为例说明成本J的计算方法。此时,帧F (t)内的被预测对象的运动预测单位块由两个分割区域Bc^B1构成。另外,设存储器16内保存有两张已完成编码?局部解码的参照图像F’(t-l)、F’(t-2),分割区域Bc^B1能够使用这两张参照图像F’(t-1)、F’ (t-2)来进行运动预测。在图6中,分割区域Btl使用参照图像F’ (t-2)来检测运动矢量MVu(Btl),分割区域&使用参照图像F’ (t-1)来检测运动矢量MVw(B1)t5当将B设为分割区域,将Sn(X)设为第η帧的画面内位置X= (i,j)处的像素值,将V设为运动矢量时,能够使用差分绝对值和(Sum of Absolute Difference, SAD)作为下式(2)计算分割区域B
的预测误差量D。
[0086]


(2)
[0087]根据进行上式⑵的计算的结果所得到的与分割区域Bc^B1对应的预测误差量%、D1,作为D = Dc^D1求出预测误差量D。
[0088]另一方面,使用预测矢量PMV (Btl)、PMV (B1),根据下式(3)得到运动矢量预测差分值MVD (B0)、MVD (B1),对这些值进行代码量换算来得到代码量Rc^R1,作为总代码量R = ^+R1求出总代码量R。
[0089]MVD (B0) = MVt_2 (B0) -PMV (B0)(3)
[0090]MVD (B1) = MVh (B1) -PMV (B1)
[0091]通过以上内容,求出成本J。预测部4关于搜索范围内的作为检查对象的所有的运动矢量进行成本J的计算,求出成本J最小的解来作为mC_m0de5的分割图案。此外,图7中示出mc_model?4的预测矢量PMV的计算例。在图7中,箭头表示在预测矢量的导出中利用的周边的运动矢量MV,用〇包围的三个运动矢量MV的中值(中央值)成为其所指示的分割区域的预测矢量PMV。
[0092]此外,构成为:在对LiXMi像素块选择了 k = 7即mc_mode7的情况下,进一步对IiXmi像素块选择与mcjnodeO?7的模式相当的运动预测模式。为了便于说明,将此时的模式的名称设为sub_mc_modeO?7。设对IiXmi像素块决定sub_mc_mode的处理按照图5的处理流程,设与LiXMi像素块单位对应的mc_mode7的成本J7为使用以IiXmi像素块为单位确定的sub_mc_mode得到的总成本。
[0093]接着,预测部4验证这样求出的mc_modek下的成本Jk是否小于到此为止验证的mc_modek下的成本(步骤ST2),在小的情况下(步骤ST2 “是”),将mc_modek保持为到此时刻为止的最佳运动预测模式,并且保持此时的运动矢量和预测误差信号(步骤ST3)。预测部4在验证完所有的运动预测模式时(步骤ST4 “是”),将到此为止保持的运动预测模式、运动矢量、预测误差信号5作为最终解进行输出(步骤ST5)。否则(步骤ST2 “否”或者步骤ST4 “否”),在步骤ST6中使变量k递增,返回到步骤STl来验证下一个运动预测模式。
[0094]此外,在与mc_mode0、sub_mc_modeO相当的运动预测模式中,将其运动矢量与预测矢量一致(应编码的预测差分值为O)、且预测误差信号的变换.量化后的系数全部为O的事例分别定义为特别的跳过模式。下面,设将与mc_mode0对应的跳过模式称为mc_skip模式(第一跳过模式),将与sub_mc_modeO对应的跳过模式称为sub_mc_skip模式(第二跳过模式)。图8是用于说明跳过模式的图,在图8的(a)中以一个实线包围的矩形表示运动预测单位块,表示其运动矢量是MV。此时,例如使用周边的运动预测单位块的运动矢量来如图8那样求出预测矢量PMV。运动矢量的编码是对与预测矢量之间的预测差分值进行编码,因此在预测差分值为O的事例(MV = = PMV)中、且预测误差信号5中不存在应编码的非O系数的情况下,将该运动预测单位块视为mC_skip模式。另外,图8的(b)是以图8的(a)中用阴影表示的基本块为中心进行放大显示的,粗线框表示运动预测单位块区域。在该事例中,对象的基本块的sub_mc_mode与sub_mc_modeO相对应。当将此时的运动矢量设为MVs,且将预测矢量设为PMVs时,与mC_skip的判断同样地,在预测差分值为O的事例(MVs==PMVs)中、且预测误差信号5中不存在应编码的非O系数的情况下,将适用于该基本块的运动预测模式视为sub_mc_skip模式。
[0095]在非专利文献1、2等的以往的编码方式中,一般设计成:设置仅与mcjnodeO、即最大的运动预测单位块(在非专利文献1、2中,与本实施方式I中的基准块相比运动预测单位块的大小相同,并且相当于宏块)对应的跳过模式,在跳过模式的情况下,对宏块的信息完全不进行编码。在本实施方式I中,特征在于,将其进一步在sub_mc_mode的阶层中也进行定义。在非专利文献1、2等的以往的编码方式中,所处理的影像信号为HDTV程度那样,是采样率比较低的影像信号,比宏块的大小更小的运动预测单位块只意味着运动变得复杂,即使考虑跳过模式,也难以进行高效的编码。另一方面,在超过HDTV的超高清晰影像、4:4:4格式等的采样率高的影像信号中,如果只是仅以由LiXMi像素块构成的运动预测单位块的大小设置跳过模式,则在选择与其相比更小的基本块(或者根据其组合确定的运动矢量分配区域)时,无法有效地利用跳过的条件,明示地对始终为O值的运动矢量、零系数值进行编码,编码效率差。因而,在本实施方式I中,构成为:不仅针对由作为mc_mode分配的单位的LiXMi像素块构成的运动预测单位块的单位,而且在由作为sub_mc_mode分配的单位的IiXmi像素块构成的基本块为一定大小以上(Ii > It7Iiii > mt)的情况下,能够针对每个基本块选择并利用sub_mc_skip模式。阈值lt、mt既可以根据Mi' Li的值唯一地确定(例如,It = Q/2,mt = Mi/2等),也可以构成为在巾贞、序列的级别中多路复用到比特流来进行传输。
[0096]通过以上叙述的预测部4中的处理,输出预测误差信号5和预测信号生成用参数17 (运动预测模式和运动矢量),它们通过可变长编码部8进行熵编码。下面,说明作为本实施方式I的图像编码装置的特征之一的预测信号生成用参数17的熵编码方法。
[0097]在下面说明的预测信号生成用参数17的编码中,将说明的对象设为运动预测模式、运动矢量这两种参数。图9是用于说明可变长编码部8的熵编码方法的图。在本实施方式I的图像编码装置中,如图9所示,在对被预测?编码对象的基本块Bx的运动预测模式m(Bx)进行编码时,选择性地参照同一帧F(t)的左侧的基本块Ba的预测模式m(Ba)、上侧的基本块Bb的预测模式m(Bb)、紧接之前的相邻帧F’ (t-Ι)中的与基本块Bx相同的位置的基本块B。的运动预测模式m(B。)的状态来进行熵编码。
[0098]图10表示可变长编码部8的内部结构,图11表示其动作流程。本实施方式I中的可变长编码部8由如下部分构成:上下文模型决定部21,其确定针对作为编码对象数据的运动预测模式、运动矢量等各个数据类型被定义的上下文模型(后述);二值化部22,其按照关于各编码对象数据类型确定的二值化规则将多值数据变换为二值数据;发生概率生成部23,其提供二值化后的各个bin的值(0/1)的发生概率;编码部24,其根据所生成的发生概率执行算术编码;发生概率信息存储存储器25,其存储发生概率信息。针对向上下文模型决定部21的输入,在此限定于预测图像生成用参数17中的运动预测模式和运动矢量,来进行说明。
[0099](A)上下文模型决定处理(图11中的步骤STlI)
[0100]上下文模型是将与成为信息源码元的发生概率的变动要因的其它信息的依赖关系模型化而成的,通过与该依赖关系对应地切换发生概率的状态,能够根据码元的实际发生概率进行相适应的编码。图12中示出上下文模型CtX的概念。此外,在该图中设信息源码元为二值,但是也可以是多值。但是,在本实施方式I中仅处理二值算术编码。
[0101]图12的O?2这种上下文模型CtX的选择项是设想使用该上下文模型CtX的信息源码元的发生概率的状态将会根据状况发生变化来进行定义的。就本实施方式I中的图像编码装置而言,根据某个基准块中的编码数据与其周边的基准块的编码数据之间的依赖关系切换上下文模型ctx的值。
[0102]例如,图13 中不出在 “D.Marpe et.al.,"Video Compress1n UsingContext-Based Adaptive Arithmetic Coding",Internat1nal Conference on ImageProcessing 2001”中公开的与运动矢量有关的上下文模型的例。在图13中,块C的运动矢量是编码对象(准确地说,从附近预测块C的运动矢量得到的预测差分值HlVdk(C)被编码)。另外,ctx_mvd(C, k)表示对于块C的运动矢量的上下文模型。mvdk(A)表示块A中的运动矢量预测差分值,Hivdk(B)表示块B中的运动矢量预测差分值,这些值用于上下文模型的切换评价值ek(C)的定义。评价值ek(C)表示附近的运动矢量的偏差状况,一般有如下趋势:在该偏差小的情况下,运动矢量预测差分值mvdk (C)变小,相反地在评价值ek(C)大的情况下,运动矢量预测差分值Hivdk(C)也变大。因而,期望运动矢量预测差分值Hivdk(C)的码元发生概率根据评价值ek(C)而被适应化。可以说,该发生概率的变化集(set)是上下文模型,在该事例中有三种发生概率变化。
[0103]这样,对各个编码对象数据预先定义上下文模型,在图像编码装置和图像解码装置中共用。在上下文模型决定部21中,进行根据这种编码对象数据的种类来选择预先确定的模型的处理。此外,关于选择上下文模型中的哪个发生概率变化,相当于下述(C)的发生概率生成处理。
[0104]在图10中,特征在于,可变长编码部8准备多个对运动预测模式、运动矢量分配的上下文模型26的候选,根据上下文模型选择信息27切换所使用的上下文模型26。如图9所示,如果被预测.编码对象的基本块Bx的运动预测模式m(Bx)在帧间关于运动的状态的相关低,则认为与在同一帧内在空间上相邻的图像区域的状态之间的相关高(即,运动预测模式m(Bx)的值对运动预测模式m(Ba)、m(Bb)的分割形状的影响强),因此将同一帧的左侧的基本块Ba的运动预测模式m (Ba)、上侧的基本块Bb的运动预测模式m(Bb)利用于上下文模型26的决定。图14中示出作为该想法的依据的例。图14中,关于运动预测模式m(Bx)=mc_mode3的情况,将在基本块Ba、Bb中选择的运动预测模式的两种状态相比较来示出。在图14的(a)中,对于运动预测模式m(Bx)的分割形状,在基本块Ba、Bb中都是使分割的缝隙自然连接。另一方面,在图14的(b)中,在基本块Ba、Bb中分割的缝隙都没有连接。一般,该分割形状表示存在于基准块内的多个不同的运动区域的存在,因此容易反映影像的结构。因而,认为图14的(a)所示的状态与图14的(b)所示的状态相比更是“容易引起的状态”。也就是说,与运动预测模式m(Ba)、m(Bb)的状态相应地运动预测模式m(Bx)的发生概率受到影响。
[0105]同样地,如果在帧间关于运动的状态的相关高,则认为与在时间上相邻的图像区域的状态之间的相关高(即,关于运动预测模式、m(Bx),与运动预测模式m(B。)的分割形状相对应地可取的值的概率发生变化),因此可变长编码部8将在紧接之前的相邻帧中处于与基本块Bx相同的位置的基本块B。的运动预测模式m(B。)利用于上下文模型26的决定。
[0106]可变长编码部8在决定运动矢量的上下文模型26时,也同样地如果在帧间关于运动的状态的相关低,则将同一帧的左侧的块Ba的运动矢量、上侧的块Bb的运动矢量利用于上下文模型26的决定。另一方面,如果在帧间关于运动的状态的相关高,则可变长编码部8将在紧接之前的相邻帧中处于与块Bx相同的位置的块B。的运动矢量利用于上下文模型26的决定。与运动预测模式同样地,关于运动矢量,也可以将颜色成分间的相关利用于上下文模型26的决定。
[0107]关于在帧间关于运动的状态的相关的高低,可以在图像编码装置中通过规定的方法进行检测,来将上下文模型选择信息27的值明示地多路复用到比特流9来传递到图像解码装置,还可以构成为在图像编码装置和图像解码装置这两者中根据可检测的信息分别决定上下文模型选择信息27的值。由于影像信号是非定常的,因此能够进行这种适应控制,由此能够提高算术编码的效率。
[0108](B) 二值化处理(图11中的步骤ST12)
[0109]通过二值化部22对编码对象数据进行二值序列化,根据二值序列的各bin(二进制位置)来确定上下文模型。在二值化的规则中,按照各编码数据可取的值的大致分布进行向可变长的二值序列的变换。与将本来可取多值的编码对象数据直接进行算术编码的情况相比,二值化具有如下优点等:通过以bin单位进行编码来能够减少概率数直线(probability number line)分割数,能够简化运算,能够实现上下文模型的精简化。
[0110]例如,当设为Li =Mi = 32、li =HIi = 16进行编码时,二值化部22如图15的(a)、
(b)那样进行运动预测模式的二值化。
[0111]在各bin0、l、2、4、5中应用如图16A?图16E所示的上下文模型。关于BinOjB图16A所示,将相对于编码对象数据(块C)在上侧(块A) ?左侧(块B)的位置的运动预测单位块的状态“是否为跳过模式”作为发生概率的切换基准。关于Binl,如图16B所示,将上侧(块A) ?左侧(块B)的位置的运动预测单位块的状态“是否有运动预测块分割”作为发生概率的切换基准。关于Bin2,如图16C所示,将上侧(块A) ?左侧(块B)的位置的块的状态“是否为复杂的运动预测模式”作为发生概率的切换基准。Bin3不定义上下文模型,固定为规定的发生概率。关于Bin4,如图16D所示,将左侧(块B)的位置的块的状态中“运动预测形状分割是否为水平分割”作为发生概率的切换基准。关于Bin5,如图16E所示,将上侧(块A)的位置的块的状态中“运动预测形状分割是否为垂直分割”作为发生概率的切换基准。这样,通过根据运动预测区域的形状来确定上下文模型26,能够与局部影像信号的性质相适应地进行与运动预测模式信息有关的发生概率的选择,能够提高算术编码的编码效率。此外,在Ii = Hii = 16中进行不使用sub_mc_skip的选择的情况(阈值It >=16,mt >= 16)下,构成为对图15的(b)的BinO不进行编码。
[0112](C)发生概率生成处理(图11中的步骤ST13)
[0113]在上述(A)、⑶的过程(步骤ST11,ST12)中,完成多值的编码对象数据的二值化、以及适用于各bin的上下文模型的设定,做好编码准备。接着,通过发生概率生成部23进行使用于算术编码的发生概率信息的生成处理。在各上下文模型中包含相对于0/1的各值的发生概率的变化,因此参照通过步骤STll决定的上下文模型26来进行处理。发生概率生成部23确定如图13所示的评价值ek(C)那样的用于选择发生概率的评价值,据此决定从所参照的上下文模型的选择项中将哪一个发生概率变化使用于当前的编码。
[0114]进而,本实施方式I中的可变长编码部8具备发生概率信息存储存储器25,具备针对在编码的过程中依次更新的发生概率信息28存储与所使用的上下文模型的变化相应的部分的机构。发生概率生成部23根据上下文模型26的值决定使用于当前的编码的发生概率信息28。
[0115](D)编码处理(图11中的步骤ST14)
[0116]在上述(C)的过程(步骤ST13)中,得到算术编码过程所需的概率数直线上的0/1各值的发生概率,因此按照在以往例中列举的过程在编码部24中进行算术编码(步骤ST14)。
[0117]另外,实际的编码值(0/1)29被反馈到发生概率生成部23,为了进行所使用的发生概率信息28的更新,进行0/1产生频率的计数(步骤ST15)。例如,设在使用某一特定发生概率信息28进行100个bin的编码处理的时刻,该发生概率变化中的0/1的发生概率为0.25/0.75。在此,当使用相同的发生概率变化来对“I”进行编码时,“I”的出现频率被更新,0/1的发生概率变化为0.247/0.752。通过该机制,能够进行与实际的发生概率相适应的高效的编码。
[0118]当结束了所有的bin的编码处理时,编码部24所生成的算术编码结果30成为来自可变长编码部8的输出,并作为比特流9从图像编码装置被输出(步骤ST16)。
[0119]2.编码比特流的结构
[0120]输入影像信号I基于上述处理在图2的图像编码装置中被进行编码,以将多个基准块捆起来的单位(以下,称为切片)作为比特流9从图像编码装置输出。
[0121]图17中示出比特流9的数据排列。比特流9构成为会聚了与包含在帧中的基准块的数量相应的编码数据,基准块以切片为单位被单元化。准备属于同一帧的基准块作为共用参数参照的图片级别头部,在该图片级别头部中保存基准块大小信息18。如果基准块大小Mmax以比图片级别上位的序列单位被固定,则也可以构成为将基准块大小信息18多路复用到序列级别头部。
[0122]各切片分别从切片头部开始,接着排列切片内的各基准块的编码数据。在图17的例子中,表示在第2切片中包含K个基准块。基准块数据由基准块头部和预测误差压缩数据构成,在基准块头部中排列有与基准块内的运动预测单位块相应的运动预测模式mcjnode和运动矢量(相当于预测信号生成用参数17)、使用于预测误差压缩数据7的生成的量化参数19等。
[0123]作为运动预测模式mc_mode,首先mc_skip或者mc_mode0?7的种类被编码,如果是mc_skip,则设为不传输以下所有的宏块编码信息。如果是mc_mode0?6,则与由运动预测模式指定的运动矢量分配区域相应的运动矢量信息被编码。如果是mC_m0de7,则根据基准块大小信息18决定在sub_mc_mode的代码中是否包含sub_mc_skip。在此,设根据基准块大小Mp Li将sub_mC_skip代码的有无的阈值确定为It = LiZ^mt = Mi^0在此基础上,如果满足“li > lt, Hii > mt”的条件,则根据图15的(b)的二值化规则,进行包含sub_mc_skip的部分的sub_mc_mode的编码。如果不满足“li > lt, Hii > mt”,则从图15的(b)的二值化规则仅排除BinO的编码。另外,表示运动预测模式和运动矢量的算术编码中的上下文模型选择指针的上下文模型选择信息27包含在基准块头部中。
[0124]此外,虽然未图示,但是也可以构成基准块大小决定部使得能够针对各基准块选择在各基准块内使用的运动预测单位块的大小LpMi,将在基准块内使用的运动预测单位块的大小Lp Mi多路复用到各基准块头部,以代替将在基准块内使用的运动预测单位块的大小LpMi多路复用到序列、或者图片级别头部中。由此,需要针对每个基准块对运动预测单位块的大小Lp Mi进行编码,但是能够与局部的图像信号的性质相应地改变运动预测单位块的大小,能够进行适应性更高的运动预测。关于表示多路复用到各基准块头部、还是固定地多路复用到序列、G0P、图片、切片等的上位级别的头部的信息,只要作为识别信息多路复用到序列、G0P、图片、切片等的上位级别头部中即可。由此,在尽管以上位级别进行固定但对运动预测性能的影响少的情况下,能够减少针对每个基准块对运动预测单位块的大小Li^Mi进行编码的开销来进行高效的编码。
[0125]3.图像解码装置
[0126]图18是表示本实施方式I中的图像解码装置的结构的框图。可变长解码部(解码部)100将图17所示的比特流9作为输入,在对序列级别头部进行解码之后,对图片级别头部进行解码来解码得到基准块大小的信息。由此识别在该图片中使用的基准块的大小^ax和运动预测单位块的大小Lp Mi,向预测误差解码部101和预测部102通知该基准块大小信息18。此外,在能够将运动预测单位块的大小Lp Mi多路复用到各基准块头部中的比特流结构的情况下,构成为:可变长解码部100对表示运动预测单位块的大小LyMi是否被多路复用到各基准块头部中的识别信息进行解码,根据该识别信息对各基准块头部进行解码,由此识别运动预测单位块的大小LpM”
[0127]基准块数据的解码是首先从基准块头部的解码开始进行。可变长解码部100在该过程中对上下文模型选择信息27进行解码。接着,根据解码得到的上下文模型选择信息27,针对每个颜色成分进行对每个运动预测单位块适用的运动预测模式的解码。关于运动预测模式,首先以运动预测单位块的单位来进行mc_mode的解码,在mc_skip的情况下,基于图8的条件,根据周边的运动矢量求出预测矢量来将其分配到当前运动矢量。另外,在是mc_mode7的情况下,基于图8的条件,针对每个基本块进行sub_mc_mode的解码。此时,根据基准块大小信息18以与图像编码装置侧相同的判断基准进行sub_mC_skip有无利用的判断,基于该判断执行sub_mc_mode的解码处理。在利用sub_mc_skip的情况下,如果是sub_mc_mode = = sub_mc_skip,则跳过该基本块的编码数据的解码,对当前运动矢量分配利用图8的方法求出的预测矢量。在其它情况下,根据上下文模型选择信息27与运动矢量分配区域的数量相应地进行运动矢量的解码,进一步针对每个基准块依次对量化参数19、预测误差压缩数据7等信息进行解码。
[0128]预测误差压缩数据7、量化参数19被输入到预测误差解码部101,被复原为解码预测误差信号11。该预测误差解码部101进行与图2的图像编码装置中的局部解码部10等价的处理。
[0129]预测部102根据由可变长解码部100解码的预测信号生成用参数17和存储器103内的参照图像信号15生成预测信号12。此外,预测部102进行与图像编码装置中的预测部4等价的处理,但是不包括运动矢量检测动作。运动预测模式是图4所示的mcjnodeO?7中的某一个,预测部102使用根据其分割形状对各基本块分配的运动矢量来生成预测图像
12。
[0130]解码预测误差信号11和预测信号12通过加法部相加,并作为解码信号13向环路滤波器104输入。该解码信号13在环路滤波器104中被实施去除编码噪声的处理之后,作为用于生成以后的预测信号12的参照图像信号15保存到存储器103中。图18中虽然没有图示,但是环路滤波器104除了使用由可变长解码部100解码的预测信号生成用参数17、量化参数19以外,还使用滤波系数信息20通过与图像编码装置中的环路滤波器14等价的处理来进行参照图像信号15的生成。图像编码装置的环路滤波器14与图像解码装置的环路滤波器104的差异在于,前者参照作为原图像信号的编码信号3来生成滤波系数信息20,与此相对,后者参照从比特流9解码得到的滤波系数信息20来进行滤波处理。
[0131]以下,叙述由可变长解码部100进行的基准块的运动预测模式、运动矢量的解码处理。
[0132]图19表示可变长解码部100中的与算术解码处理有关的内部结构,图20表示其动作流程。
[0133]本实施方式I中的可变长解码部100由如下部分构成:上下文模型决定部21,其确定包含运动预测模式、运动矢量等的预测信号生成用参数17、预测误差压缩数据7、量化参数19等各个解码对象数据的类型,对它们分别确定与图像编码装置共同定义的上下文模型;二值化部22,其生成基于解码对象数据的类型确定的二值化规则;发生概率生成部23,其按照二值化规则和上下文模型,赋予各个bin (0/1)的发生概率;解码部105,其根据所生成的发生概率执行算术解码,根据作为其结果得到的二值序列和上述二值化规则对编码数据进行解码;以及发生概率信息存储存储器25,其存储发生概率信息28。设图19所示的各部中附加有与图10所示的可变长编码部8的内部结构要素相同的编号的各部分别进行相同的动作。
[0134](E)上下文模型决定处理、二值化处理、发生概率生成处理(图20的步骤STll?ST13)
[0135]这些过程(步骤STll?ST13)遵照图像编码装置侧的过程㈧?(C)(图11的步骤STll?ST13),因此省略说明。此外,在使用于运动预测模式、运动矢量的解码的上下文模型的决定中参照上述的解码得到的上下文模型选择信息27。
[0136](F)算术解码处理(图20的步骤ST21,ST15,ST22)
[0137]在到上述(E)为止的过程中确定从现在开始要解码的bin的发生概率,因此在解码部105中按照规定的算术解码处理过程使bin的值复原(步骤ST21)。bin的复原值40(图19)被反馈到发生概率生成部23,为了进行所使用的发生概率信息28的更新,进行0/1产生频率的计数(步骤ST15)。在解码部105中,每次确定各bin的复原值时,确认与以二值化规则确定的二值序列图案之间的一致性,将一致的图案所指示的数据值作为解码数据值106进行输出(步骤ST22)。只要未确定解码数据,就返回到步骤STll继续进行解码处理。
[0138]此外,在上述说明中,设将上下文模型选择信息27多路复用的单位是基准块单位,但是也可以以切片单位、图片单位等来进行多路复用。通过作为位于切片、图片、序列等的上位数据层的标志来进行多路复用,在通过切片以上的上位层中的切换能够确保充分的编码效率的情况下,无需在基准块级别中逐一对上下文模型选择信息27进行多路复用而能够减少开销比特。
[0139]另外,上下文模型选择信息27也可以是根据包含在与其自身不同的比特流中的关联信息在图像解码装置的内部确定的信息。另外,在上述说明中设可变长编码部8和可变长解码部100进行算术编码.算术解码处理来进行了说明,但是也可以构成为将这些处理作为哈弗曼编码处理,将上下文模型选择信息27利用为适应性地切换可变长编码表的手段。
[0140]根据以上结构的图像编码?解码装置,能够进行跳过模式的分层表现,能够根据编码对象基准块的内部状态适应性地对运动预测模式、运动矢量的信息进行编码,能够进行高效的编码。
[0141]根据以上内容,根据实施方式1,将图像编码装置构成为具备:预测部4,其根据颜色成分信号适应性地决定运动预测单位块的大小,并且将该运动预测单位块分割为运动矢量分配区域来搜索运动矢量;可变长编码部8,其在对运动预测单位块整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动预测单位块的运动矢量求出的预测矢量相等、且不存在作为预测误差信号5进行编码的数据,则将运动预测模式设为mc_skip模式来进行编码,在运动矢量分配区域为规定的大小以上、且对运动矢量分配区域整体分配运动矢量的情况下,如果该运动矢量与根据周边的运动矢量分配区域的运动矢量求出的预测矢量相等、且不存在作为预测误差信号5进行编码的数据,则将运动预测模式设为sub_mc_skip模式来进行编码,从而生成比特流9。因此,能够提供如下的图像编码装置:为了高效地对4:4:4格式的彩色影像信号进行编码,能够进行跳过模式的分层表现,能够根据编码对象基准块的内部状态适应性地对运动预测模式、运动矢量的信息进行编码,在成为高压缩率的低比特率编码中有效地抑制运动矢量的代码量来进行编码。
[0142]另外,根据实施方式1,将图像解码装置构成为具备:可变长解码部100,其从所输入的比特流9解码得到表示运动预测单位块的大小、确定将运动预测单位块分割得到的运动矢量分配区域的形状的运动预测模式以及与运动矢量分配区域对应的运动矢量的预测信号生成用参数17,根据该运动预测模式确定运动预测单位块是否为mc_skip模式、以及运动矢量分配区域是否为sub_mc_skip模式;预测部102,其在运动预测单位块为mc_skip模式的情况或者运动矢量分配区域为sub_mC_skip模式的情况下,根据周边的运动矢量求出预测矢量来设定为运动矢量,并且将解码预测误差信号11全部设定为零来生成预测信号12,在运动预测单位块不是mC_skip模式、且该运动预测单位块的运动矢量分配区域不是sub_mC_skip模式的情况下,根据可变长解码部100解码得到的运动预测模式和运动矢量来生成预测信号12。因此,能够提供与上述图像编码装置对应的影像解码装置。
[0143]此外,在本实施方式I中,说明了对于4:4:4影像信号的编码.解码的实施例,但是如上所述,以用以往的亮度?色差成分格式进行颜色间隔剔除的4:2:0或者4:2:2格式为对象的影像编码中,以宏块等的基准块的单位进行编码?解码的情况下,当然也能够适用本发明中的编码?解码处理。
[0144]产业上的可利用性
[0145]本发明所涉及的图像编码装置、图像解码装置、图像编码方法以及图像解码方法能够对4:4:4格式的影像信号进行最佳的编码处理,因此适用于图像压缩编码技术、压缩图像数据传输技术等。
【权利要求】
1.一种图像解码装置,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码装置的特征在于,具备: 解码部,从所述比特流对用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在所述第一运动预测模式不是跳过模式、而且对所述块分层地进行分割的情况下,对用于分层地进行分割而得到的第二运动预测单位块的第二运动预测模式进行解码; 算术解码部,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及 预测部,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像;在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
2.一种图像解码方法,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码方法的特征在于,包括: 解码步骤,从所述比特流对用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在所述第一运动预测模式不是跳过模式、而且对所述块分层地进行分割的情况下,对用于分层地进行分割而得到的第二运动预测单位块的第二运动预测模式进行解码; 算术解码步骤,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及 预测步骤,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
3.一种图像解码装置,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码装置的特征在于,具备: 解码部,从所述比特流对决定所述块的大小的信息、表示与块大小有关的阈值的信息以及用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在第一运动预测模式不是跳过模式、而且第一运动预测单位块大于阈值的情况下,对用于分层地分割所述第一运动预测单位块而得到的第二运动预测单位块用的第二运动预测模式进行解码; 算术解码部,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及 预测部,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
4.一种图像解码方法,将把运动图像信号的各帧分割为块、并对所述块进行运动预测并进行了预测编码的比特流作为输入,对所述运动图像信号进行解码,该图像解码方法的特征在于,包括: 解码步骤,从所述比特流对决定所述块的大小的信息、表示与块大小有关的阈值的信息以及用于与所述块对应的第一运动预测单位块的第一运动预测模式进行解码,并且在第一运动预测模式不是跳过模式、而且第一运动预测单位块大于阈值的情况下,对用于分层地分割所述第一运动预测单位块而得到的第二运动预测单位块的第二运动预测模式进行解码; 算术解码步骤,根据所述块的周边的块的所述第一运动预测模式是否为跳过模式,切换为了对所述第一运动预测模式进行解码而使用的发生概率;以及 预测步骤,在所述第一运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第一运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式是跳过模式的情况下,根据周边的运动矢量求出预测矢量并设定为针对所述第二运动预测单位块的运动矢量来生成预测图像,在所述第二运动预测模式不是跳过模式的情况下,根据通过所述解码部解码的第二运动预测模式和运动矢量生成预测图像。
【文档编号】H04N19/423GK104270635SQ201410444239
【公开日】2015年1月7日 申请日期:2010年5月27日 优先权日:2009年5月29日
【发明者】关口俊一, 杉本和夫, 伊谷裕介, 峯泽彰, 加藤嘉明 申请人:三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1