由视频编码装置执行的方法与流程

文档序号:11171039阅读:737来源:国知局
由视频编码装置执行的方法与流程
由视频编码装置执行的方法本申请为2012年5月30日提交的申请号为201210174055.5、发明名称为“视频的解码装置/方法、编码装置/方法及存储介质”的发明专利申请的分案申请。技术领域本文中讨论的实施例涉及视频解码装置、视频编码装置、视频解码方法、视频编码方法及存储介质。

背景技术:
目前的视频编码技术中,将图片划分成块,对块中的像素进行预测,并且预测的差分被编码以实现高的压缩比。根据待编码图片中的空间相邻像素来预测像素的预测模式被称为帧内预测模式。另外,使用运动补偿技术根据之前编码的参考图片来预测像素的预测模式被称为帧间预测模式。在视频编码装置的帧间预测模式下,用来预测像素的参考区域用被称为运动向量的二维坐标数据来表示,并且对运动向量数据、以及原始像素与预测像素之间的差分像素数据进行编码,其中,该运动向量包括水平分量和垂直分量。为了减少编码量,根据与待编码目标块(可被称为编码目标块)相邻的块的运动向量生成预测向量,并且对目标块的运动向量与预测向量之间的差分向量进行编码。通过将较少量的编码分配给较小的差分向量,可以减少运动向量的编码量以及提高编码效率。另外,在视频解码装置中,针对每个块确定与视频编码装置中生成的预测向量相同的预测向量,并且通过将编码差分向量和预测向量相加来恢复运动向量。为此,视频编码装置和视频解码装置包括具有基本上相同配置的向量预测单元。在视频解码装置中,通常按照光栅扫描技术或z扫描技术的顺序从左上方至右下方对块进行解码。因此,只有在要在视频解码装置处被解码的目标块左侧或者上面的块的运动向量,即在目标块之前被解码的运动向量,可被视频编码装置和视频解码装置的运动向量预测单元用于预测。另外,在MPEG(运动图片专家组)-4AVC/H.264(下文中可被简单地称为H.264)中,可以取代要处理的目标图片的运动向量而使用之前编码/解码的参考图片的运动向量来确定预测向量(例如参见ISO/IEC14496-10(MPEG-4第10部分)/ITU-TRec.H.264)。此外,2011年3月JCT-VC第五次会议,JCTVC-E603,“WD3:WorkingDraft3ofHigh-EfficiencyVideoCoding(高效视频编码的工作草案3)”中公开了一种确定预测向量的方法。高效视频编码(HEVC)是一种视频编码技术,其标准化由ISO/IEC和ITU-T联合讨论。HEVC测试模型(HM)软件(版本3.0)已经被提出作为参考软件。下面描述HEVC的概要。在HEVC中,提供了用于列出参考图片的参考图片列表L0和L1。对于每个块,最多达两个参考图片的区域,即对应于参考图片列表L0和L1的运动向量可被用于帧间预测。参考图片列表L0和L1一般对应于显示时间的方向。参考图片列表L0列出了相对于要处理的目标图片的先前图片,而参考图片列表L1列出了未来图片。参考图片列表L0和L1的每个条目包括像素数据的存储位置和相应图片的图片序列号(POC,pictureordercount)。POC用整数表示,并且表示图片显示的顺序和图片的相对显示时间。假定在显示时间“0”处显示具有POC“0”的图片,则给定图片的显示时间可以通过将图片的POC乘以常数来获得。例如,当“fr”表示帧的显示周期(Hz)并且“p”表示图片的POC时,图片的显示时间可以用以下公式(1)来表示。显示时间=p×(fr/2)……公式(1)因此,可以说POC表示以常数为单位的图片的显示时间。当参考图片列表包括两个或更多个条目时,运动向量所涉及的参考图片由参考图片列表中的索引号(参考索引)来指定。当参考图片列表仅包括一个条目(或者一个图片)时,与参考图片列表对应的运动向量的参考索引被自动设置为“0”。在这种情况下,不需要明确地指定参考索引。块的运动向量包括L0/L1列表标识符、参考索引和向量数据(Vx,Vy)。参考图片用L0/L1列表标识符和参考索引来标识,而参考图片中的区域用向量数据(Vx,Vy)来标识。向量数据中的Vx和Vy分别表示水平轴和垂直轴上的参考区域的坐标与要处理的目标块(或当前块)的坐标之间的差分。例如,可以以四分之一像素为单位来表示Vx和Vy。L0/L1列表标识符和参考索引可以被共同地称为参考图片标识符,并且(0,0)可以别称为0向量。下面描述确定HEVC中的预测向量的方法。针对由L0/L1列表标识符和参考索引标识的每个参考图片,确定预测向量。在参考由列表标识符LX和参考索引refidx标识的参考图片来确定运动向量的预测向量的向量数据mvp时,计算最多达三组向量数据作为预测向量候选。在空间上和时间上与目标块相邻的块被分类成三组:目标块左侧的块(左侧组)、目标块上面的块(上部组)以及在时间上与目标块相邻的块(时间相邻组)。从三个组中的每个组中选择最多达一个预测向量候选。以如下的组的优先权的顺序列出所选择的预测向量候选:时间相邻组、左侧组和上部组。该列表以阵列mvp_cand来布置。如果所有组中都没有出现预测向量候选,则向阵列mvp_cand增加0向量。预测候选索引mvp_idx用来标识要被用作预测向量的、列表中的预测向量候选之一。即,位于阵列mvp_cand中第“mvp_idx”个位置处的预测向量候选的向量数据被用作预测向量的向量数据mvp。当mv表示涉及由列表标识符LX和参考索引refidx标识的参考图片的编码目标块的运动向量时,视频编码装置搜索阵列mvp_cand以寻找与运动向量mv最接近的预测向量候选,并且将找到的预测向量候选的索引设定为预测候选索引mvp_idx。此外,视频编码装置使用以下公式(2)来计算差分向量mvd,并且将refidx、mvd和mvp_idex编码为列表LX的运动向量信息。mvd=mv-mvp……公式(2)视频解码装置对refidx、mvd和mvp_idex进行解码,根据refidx确定mvp_cand,以及将位于mvp_cand中第“mvp_idx”个位置处的预测向量候选用作预测向量mvp。视频解码装置根据以下公式(3)来恢复目标块的运动向量mv。mv=mvd+mvp……公式(3)接下来描述在空间上与目标块相邻的块。图1是示出在空间上与目标块相邻的块的图。参考图1,描述从目标块左侧的块和目标块上面的块中选择预测向量候选的示例性处理。首先,描述从目标块左侧的块中选择预测向量候选的示例性处理。依次搜索目标块左侧的块I和H,直至找到具有列表标识符LX和参考索引refidx的运动向量1。如果找到了具有列表标识符LX和参考索引refidx的运动向量1,则选择运动向量1。如果没有找到运动向量1,则搜索涉及如下参考图片的运动向量2,该参考图片在参考图片列表LY中并且与由参考图片列表LX的参考索引refidx表示的参考图片相同。如果找到运动向量2,则选择运动向量2。如果没有找到运动向量2,则搜索用于帧间预测的运动向量3。如果找到了运动向量3,则选择运动向量3。如果该处理中选择的运动向量不涉及与由参考图片列表LX的参考索引refidx表示的参考图片相同的参考图片,则执行稍后描述的定标处理。接下来,描述从目标块上面的块中选择预测向量候选的示例性处理。依次搜索目标块上面的块E、D和A,直至找到具有列表标识符LX和参考索引refidx的运动向量1。如果找到了具有列表标识符LX和参考索引refidx的运动向量1,则选择运动向量1。如果没有找到运动向量1,则搜索涉及如下参考图片的运动向量2,该参考图片在参考图片列表LY中并且与由参考图片列表LX的参考索引refidx表示的参考图片相同。如果找到运动向量2,则选择运动向量2。如果没有找到运动向量2,则搜索用于帧间预测的运动向量3。如果找到了运动向量3,则选择运动向量3。如果该处理中选择的运动向量不涉及与由参考图片列表LX的参考索引refidx表示的参考图片相同的参考图片,则执行稍后描述的定标处理。接下来,描述在时间上与目标块相邻的块。图2是用来描述从在时间上与目标块相邻的块中选择预测向量候选的处理的图。首先,选择包括时间相邻块并且被称为搭配图片(collocatedpicture,ColPic)的时间相邻参考图片20。ColPic20是参考图片列表L0或L1中具有参考索引“0”的参考图片。通常,ColPic是参考图片列表L1中具有参考索引“0”的参考图片。通过下面描述的定标方法,对如下mvCol22进行定标以生成预测向量候选,该mvCol22是位于ColPic20中与目标块11相同位置处的块(Col块)21的运动向量。下面描述对运动向量进行定标的示例性方法。在此,假定输入运动向量用mvc=(mvcx,mvcy)表示,输出向量(预测向量候选)用mvc’=(mvcx’,mvcy’)表示,以及mvc是mvCol。此外,ColRefPic23表示mvc所涉及的图片,ColPicPoc表示包括mvc的ColPic20的POC,ColRefPoc表示ColRefPic23的POC,CurrPoc表示当前目标图片10的POC,以及CurrRefPoc表示由RefPicList_LX和RefIdx标识的图片25的POC。当要定标的运动向量是空间相邻块的运动向量时,ColPicPoc等于CurrPoc。当要定标的运动向量是时间相邻块的运动向量时,ColPicPoc等于ColPic的POC。如以下公式(4)和(5)所示,根据图片的时间间隔之间的比率对mvc进行定标。mvcx’=mvcx×(CurrPoc-CurrRefPoc)/(ColPicPoc-ColRefPoc)……公式(4)mvcy’=mvcy×(CurrPoc-CurrRefPoc)/(ColPicPoc-ColRefPoc)……公式(5)然而,由于除法需要大量的计算,所以例如可以通过使用以下公式进行乘法和移位来对mvc’进行近似。DiffPocD=ColPicPoc-ColRefPoc……公式(6)DiffPocB=CurrPoc-CurrRefPoc……公式(7)TDB=Clip3(-128,127,DiffPocB)……公式(8)TDD=Clip3(-128,127,DiffPocD)……公式(9)iX=(0x4000+abs(TDD/2))/TDD……公式(10)Scale=Clip3(-1024,1023,(TDB×iX+32)>>6)……公式(11)abs():返回绝对值的函数Clip3(x,y,z):返回x、y和z的中值的函数>>:右算术移位通过公式(11)获得的“Scale”用作定标因子。在该示例中,Scale=256表示系数为“1”,即,mv未定标。定标因子具有小数点之后8比特的精度。因而,当乘以定标因子时,运动向量的小数点之后的精度增加8比特。根据定标因子Scale,使用以下公式来执行定标操作。mvcx’=(Scale×mvcx+128)>>8……公式(12)mvcy’=(Scale×mvcy+128)>>8……公式(13)在公式(12)和(13)中,通过将2N-1加到被乘以定标因子的值上并且将加法结果向右移位N比特,来将小数点之后的N比特舍入为最接近的整数。ISO/IEC14496-10(MPEG-4第10部分)/ITU-TRec.H.264中公开了类似的定标处理。所获得的向量mvc’用作预测向量候选。

技术实现要素:
实施例的一个方面的目的是提供一种使得可以改进预测向量的准确度的视频解码装置、视频编码装置、视频解码方法、视频编码方法及存储程序代码的存储介质。根据本发明的一个方面,提供了一种视频解码装置,该视频解码装置包括:参考图片列表存储单元,存储图片的图片信息;运动向量信息存储单元,存储运动向量信息,其中,运动向量信息包括在空间上和时间上与要解码的目标块相邻的块的运动向量、以及指示运动向量所涉及的图片的参考图片标识符;以及预测向量生成单元,根据图片信息和运动向量信息,对目标块的运动向量的预测向量候选进行定标,以及以预定量朝向0对定标的预测向量候选进行校正。根据本发明的另一方面,提供了一种由视频编码装置执行的方法。该方法包括:根据图片的图片信息和运动向量信息,对要编码的目标块的预测向量候选进行定标,以获得定标的预测向量候选,所述运动向量信息包括与所述目标块在空间上或时间上相邻的块的运动向量、以及表示所述运动向量所涉及的图片的参考图片标识符;以及以预定量“a”朝向0对定标的预测向量候选进行校正,其中,当定标因子的小数点之后的预定精度N是8比特时,通过以下公式表示所述定标和所述校正:mvcx’=sign(Scale×mvcx)×{(abs(Scale×mvcx)-a+128)>>8},mvcy’=sign(Scale×mvcy)×{(abs(Scale×mvcy)-a+128)>>8},其中,abs()为返回绝对值的函数,sign()为返回符号1或者-1的函数;其中,所述预定量“a”大于等于1并且小于等于2N-2。附图说明图1是图示在空间上与目标块相邻的块的图;图2是用来描述从在时间上与目标块相邻的块中选择预测向量候选的处理的图;图3是图示mvp’与mvCol之间的关系的图;图4是图示当mvp’为正时mv的出现概率分布的图;图5是图示当mvp’为负时mv的出现概率分布的图;图6是图示根据第一实施例的视频解码装置的示例性配置的框图;图7是图示根据第一实施例的预测向量生成单元的示例性配置的框图;图8是图示根据第一实施例的定标操作单元的示例性配置的框图;图9是图示定标操作单元的部件的示例性配置(1)的框图;图10是图示定标操作单元的部件的示例性配置(2)的框图;图11是用来描述定标操作单元的操作的图;图12是图示定标操作单元的部件的示例性配置(3)的框图;图13是图示由第一实施例的视频解码装置执行的示例性处理的流程图;图14是图示由第一实施例的预测向量生成单元执行的示例性处理(1)的流程图;图15是图示由第一实施例的预测向量生成单元执行的示例性处理(2)的流程图;图16是图示根据第二实施例的预测向量生成单元的示例性配置的框图;图17是图示由第二实施例的预测向量生成单元执行的示例性处理的流程图;图18是图示根据第三实施例的预测向量生成单元的示例性配置的框图;图19是图示由第三实施例的预测向量生成单元执行的示例性处理(1)的流程图;图20是图示由第三实施例的预测向量生成单元执行的示例性处理(2)的流程图;图21是图示根据第四实施例的预测向量生成单元的示例性配置的框图;图22是图示由第四实施例的预测向量生成单元执行的示例性处理(1)的流程图;图23是图示由第四实施例的预测向量生成单元执行的示例性处理(2)的流程图;图24是图示根据第五实施例的视频编码装置的示例性配置的框图;图25是图示由第五实施例的视频编码装置执行的示例性处理的流程图;以及图26是图示图像处理装置的示例性配置的图。具体实施例在HEVC和H.264中,帧之间的移动由各个块的运动向量来表示。通常,当根据时间相邻块生成预测向量时,对时间相邻块的运动向量进行定标。在此,目标图片的显示时间与目标块的运动向量所涉及的图片的显示时间之间的差分T1不同于包括时间相邻块的图片的显示时间与时间相邻块的运动向量所涉及的图片的显示时间之间的差分T2。所以,通过差分T1与差分T2之间的比率(T1/T2)来对时间相邻块的运动向量进行定标,使得每单位时间的运动量成为常量。然而,采用由公式(12)和(13)表示的方法,很难提高预测向量的准确度,其中,在由公式(12)和(13)表示的方法中,使用具有小数点之后的某个精度的定标向量来对运动向量进行定标,并且预测向量由与定标的运动向量最接近的整数来表示。本公开内容的一个方面使得可以提高预测向量的准确度。发明人研究了预测向量的准确度。图3是图示mvp’与mvCol之间的关系的图。在图3中,mvCol22表示在时间上与要处理的目标块11相邻的块(Col块21)的运动向量,而mv表示目标块11的运动向量。还是在图3中,mvp’表示通过以实数的无限精度用上述比率(T1/T2)对mvCol22进行定标而获得的运动向量(预测向量候选)。即,mvp’由以下公式(14)来表示。mvp’=mvCol×(T1/T2)……公式(14)当等于mv的预测向量候选被选择为预测向量时,则差分向量变成“0”,因而提高了编码效率。所以,为了提高编码效率,重要的是使mvp’变成等于或接近于mv。发明人研究了mvp’与mv之间的差分。图4是图示当mvp’为正时mv的出现概率分布的图。图4的概率分布基于向量的水平分量。图5是图示当mvp’为负时mv的出现概率分布的图。图5的概率分布也基于向量的水平分量。如图4和图5所示,当将通过对mvCol22进行定标而获得的mvp’与mv进行比较时,在与mvp’相比稍微更靠近0向量的位置处,mv的出现频率最高。为此,在以下描述的示例中,朝向0向量对通过定标因子定标的预测向量候选进行校正。下面,参考附图来描述本发明的优选实施例。《第一实施例》<配置>图6是图示根据第一实施例的视频解码装置100的示例性配置的框图。如图6所示,视频解码装置100可以包括:熵解码单元101、参考图片列表存储单元102、运动向量信息存储单元103、预测向量生成单元104、运动向量恢复单元105、预测像素生成单元106、逆量化单元107、逆正交变换单元108、解码像素生成单元109以及解码图像存储单元110。熵解码单元101对压缩流进行熵解码,从而对正交变换系数、以及目标块的L0和L1的参考索引、差分向量和预测候选索引进行解码。参考图片列表存储单元102存储包括图片的POC的图片信息,图片包括目标块可以涉及的参考图片,并且参考图片列表存储单元102还存储图像数据的存储位置。运动向量信息存储单元103存储运动向量信息,运动向量信息包括在时间上和空间上与目标块相邻的块的运动向量、以及指示运动向量所涉及的图片的参考图片标识符。运动向量信息由运动向量恢复单元105生成。预测向量生成单元104从熵解码单元101获得L0和L1的参考索引(参考图片标识符),并且生成目标块的运动向量的预测向量候选的列表。稍后描述预测向量生成单元104的细节。运动向量恢复单元105从熵解码单元101获得L0和L1的差分向量以及预测候选索引,并且将由预测候选索引指示的预测向量候选加到相应的差分向量上以恢复运动向量。预测像素生成单元106使用恢复的运动向量以及存储在解码图像存储单元110中的解码图像,来生成预测像素信号。逆量化单元107对从熵解码单元101获得的正交变换系数进行逆量化。逆正交变换单元108通过对从逆量化单元107输出的逆量化信号进行逆正交变换,来生成预测误差信号。预测误差信号输出到解码像素生成单元109。解码像素生成单元109将预测像素信号和预测误差信号相加,以生成解码像素。解码图像存储单元110存储解码图像,解码图像包括由解码像素生成单元109生成的解码像素。存储在解码图像存储单元110中的解码图像输出到显示单元。接下来,更加详细地描述预测向量生成单元104。图7是图示根据第一实施例的预测向量生成单元104的示例性配置的框图。如图7所示,预测向量生成单元104可以包括定标因子计算单元201、向量信息获得单元202以及定标操作单元203。预测向量生成单元104接收目标块的参考图片标识符和目标图片的POC信息。在此,LX表示参考列表标识符,而refidx表示目标块的参考图片标识符中所包括的参考索引。运动向量信息存储单元103存储之前处理的块的运动向量信息。运动向量的运动向量信息包括:包括运动向量的块所属的图片的标识符、运动向量所涉及的图片的标识符(参考图片标识符)、以及运动向量的水平分量和垂直分量的值。向量信息获得单元202从运动向量信息存储单元103获得与目标块相邻的块的运动向量信息。运动向量信息包括:运动向量、包括运动向量的块所属的图片的标识符、以及运动向量所涉及的参考图片的参考图片标识符。向量信息获得单元202依次获得在空间上和时间上与目标块相邻的块的运动向量信息。如上所述,首先搜索目标块左侧的块的运动向量。向量信息获得单元202搜索具有列表标识符LX和参考索引refidx的运动向量1,以及如果找到则选择运动向量1。如果没有找到运动向量1,则向量信息获得单元202搜索涉及如下参考图片的运动向量2,该参考图片在参考图片列表LY中并且与由参考图片列表LX的参考索引refidx表示的参考图片相同。如果找到运动向量2,则向量信息获得单元202选择运动向量2。如果没有找到运动向量2,则向量信息获得单元202搜索用于帧间预测的运动向量3。如果找到运动向量3,则向量信息获得单元202选择运动向量3。如...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1