使用不对称运动分割的视频译码技术的制作方法_4

文档序号:9872759阅读:来源:国知局
运动向量导出过程,所以此文献中所描述的全部技术适用于合并模式及跳过模式两者。
[0158]图11是说明用于合并/跳过模式的经视图间预测的运动向量候选者的实例导出的概念图。举例来说,图11展示经视图间预测的运动向量候选者的导出过程的实例。对于合并/跳过模式,通过以下步骤导出经视图间预测的运动向量候选者。首先,视频编码器20和/或视频解码器30使用视差向量在同一存取单元的参考视图中定位当前PU/CU 114的对应块(例如,参考块)112。在图11的实例中,当前块(当前PU) 114在视图Vl中,而对应参考块112在视图VO中。如果对应参考块112未经帧内译码且未经视图间预测,且其参考图片(在此实例中在视图VO和时间Tl中)具有等于当前PU/CU 114的同一参考图片列表中的一个条目的POC值的POC值,那么将对应参考块112的运动信息(即,预测方向、参考图片索引和运动向量)导出为在基于参考图片的POC转换参考索引之后的经视图间预测的运动向量。
[0159]可如下界定对应参考块112。首先表示当前预测单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xP,yP)。变量nPSW和nPSH分别表示当前预测单元的宽度和高度。参考视图次序索引标记为refViewIdx,且视差向量标记为mvDisp。通过以下操作导出参考层明度位置(xRef,yRef):
[0160]xRef=Clip3(0,PicffidthlnSamplesL-l,xP+((nPSff-1)>>1)+((mvDisp[0]+2)>>2)) (H-124)
[0161]yRef = Clip3(0,PicHeightInSamplesL-1,yP+((nPSH-1)>>1) + ((mvDisp[I]+2)>>2)) (H-125)
[0162]对应参考块112设定成覆盖具有等于refViewIdx的ViewIdx的视图分量中的明度位置(xRef,yRef)的预测单元。
[0163]另外,视差向量可转换成视图间视差运动向量(IDMVC),其添加到合并候选者列表中处于与IPMVC不同的位置。视图间视差运动向量也可以添加到AMVP候选者列表中处于与IPMVCX当其可用时)相同的位置。IPMVC或IDMVC可在此上下文中被称为“视图间候选者”。
[0164]在用于合并/跳过模式的一个实例中,IPMVC(如果可用)在全部空间和时间合并候选者之前插入到合并候选者列表。IDMVC插入在从Ao导出的空间合并候选者之前。
[0165]以下部分描述3D-HEVC中用于纹理译码的合并候选者列表构造。首先,视频编码器20和/或视频解码器30例如使用上述NBDV导出技术导出视差向量。在导出视差向量之后,视频编码器20和/或视频解码器30可经配置以如下所述执行3D-HEVC中的合并候选者列表构造过程。
[0166]视频编码器20和/或视频解码器30可使用上述程序导出一或多个IPMVC。如果IPMVC可用,那么可将IPMV插入到合并列表。
[0167]接着,视频编码器20和/或视频解码器30可经配置以导出空间合并候选者和3D-HEVC中的一或多个IDMVC插入。为了导出空间合并候选者,视频编码器20和/或视频解码器30可经配置以按例如以下次序检查空间相邻PU的运动信息:A1Uo, A^B2,如图6中所示。
[0168]视频编码器20和/或视频解码器30可进一步经配置以执行受约束修剪。为了执行受约束修剪,视频编码器20和/或视频解码器30可经配置以在AdPIPMVC具有相同运动向量和相同参考索引的情况下不将位置A1处的空间合并候选者插入到合并候选者列表中。否则将位置A1处的空间合并候选者插入到合并候选者列表中。
[0169]如果位置仏处的合并候选者和合并位置A1*的合并候选者(或IPMVC)具有相同运动向量和相同参考索引,那么位置仏处的合并候选者不插入到合并候选者列表中。否则将位置B1处的合并候选者插入到合并候选者列表中。如果位置Bo处的合并候选者可用(S卩,经译码且具有运动信息),那么将位置Bo处的合并候选者添加到候选者列表。视频编码器20和/或视频解码器30使用上述程序导出IDMVC。如果IDMVC可用,且IDMVC的运动信息不同于从^和扮导出的候选者,那么将IDMVC插入到候选者列表。
[0170]如果BVSP针对整个图片(或针对当前切片)经启用,那么将BVSP合并候选者插入到合并候选者列表。如果位置Ao处的合并候选者可用,那么将其添加到候选者列表。如果B2处的合并候选者可用,那么将其添加到候选者列表。
[0171]下一部分将论述3D-HEVC中用于时间合并候选者的导出过程。3D-HEVC中的时间合并候选者导出类似于HEVC中的时间合并候选者导出过程,其中利用位于同一地点的PU的运动信息。然而,对于3D-HEVC,可改变时间合并候选者的目标参考图片索引而不是将参考图片索引固定为O。当等于O的目标参考索引对应于时间参考图片(同一视图中)时,在位于同一地点预测单元(PU)的运动向量指向视图间参考图片时,将目标参考索引改变为对应于参考图片列表中的视图间参考图片的第一条目的另一索引。相反,当等于O的目标参考索引对应于视图间参考图片时,在位于同一地点的预测单元(PU)的运动向量指向时间参考图片时,将目标参考图片索引改变为对应于参考图片列表中的时间参考图片的第一条目的另一索弓I。
[0172]现将论述3D-HEVC中用于组合双向预测合并候选者的实例导出过程。如果从以上两个步骤(即,空间合并候选者的导出和时间合并候选者的导出)导出的候选者的总数小于候选者的最大数目(可为预定义的),那么执行如在HEVC中界定的相同过程,如上文所描述。然而,参考索引1CandIdx和IICandIdx的规范不同。图12是指示3D-HEVC中的1CandIdx及I ICandIdx的实例规范的另一表。举例来说,在图12中说明的表中界定combldx、1CandIdx和I ICandIdx之间的关系。
[0173]3D-HEV中用于零运动向量合并候选者的一个实例导出过程是与HEVC中经界定的程序相同的程序。在3D-HEVC的一个实例中,合并候选者列表中的候选者的总数高达6,且在切片标头中产生five_minus_max_num_merge_cand语法元素以指定从6减去合并候选者的最大数目。应注意,语法元素five_minus_max_num_merge_cand的值在O到5且包含O和5的范围中。
[0174]以下描述例如3D-HEVC中用于深度译码的运动向量继承(MVI)t3MVI技术寻求利用图片的纹理分量与其相关联深度视图分量之间的运动特性的相似性。图13是说明用于深度译码的运动向量继承候选者的实例导出的概念图。举例来说,图13展示MVI候选者的导出过程的实例,其中将对应纹理块120选择为位于纹理图片124中的当前PU122的中心右下方的4x4块。对于深度图片128中的当前PU 126,MVI候选者重新使用与对应纹理图片124中的已经译码对应纹理块120相关联的运动向量和参考索引(如果此些信息可用)。
[0175]应注意,在深度译码中使用具有整数精度的运动向量,而利用具有四分之一精度的运动向量用于纹理译码。因此,对应纹理块的运动向量可在用作MVI候选者之前经按比例缩放。
[0176]在MVI候选者产生的情况下,如下构造用于深度视图的合并候选者列表。对于MVI插入,使用如上文所描述的技术导出MVI,并且如果可用则插入到合并候选者列表中。
[0177]下文描述用于空间合并候选者的导出过程和3D-HEVC中用于深度译码的IDMVC插入。首先,视频编码器20和/或视频解码器30可经配置以按以下次序检查空间相邻PU的运动信息:Ai,Bi,Bo,Ao 或 B2。
[0178]视频编码器20和/或视频解码器30可随后如下执行受约束修剪。如果位置A1处的运动向量候选者和MVI候选者具有相同运动向量和相同参考索引,那么Ai处的运动向量候选者不插入到合并候选者列表中。如果位置Bi处的运动向量候选者和位置Ai处的运动向量候选者/MVI候选者具有相同运动向量和相同参考索引,那么位置Bi处的运动向量候选者不插入到合并候选者列表中。如果位置Bo处的运动向量候选者可用,那么将位置Bo处的运动向量候选者添加到合并候选者列表。如果位置Ao处的运动向量候选者可用,那么将位置Ao处的运动向量候选者添加到合并候选者列表。如果位置B2处的运动向量候选者可用,那么将位置B2处的运动向量候选者添加到合并候选者列表。
[0179]3D-HEVC深度译码中用于时间合并候选者的导出过程类似于HEVC中的时间合并候选者导出过程,其中利用位于同一地点的PU的运动信息。然而,在3D-HEVC深度译码中,如上文所解释,时间合并候选者的目标参考图片索引可改变而不是固定为O。
[0180]现将描述3D-HEVC深度译码中用于组合双向预测合并候选者的导出过程。如果从以上两个步骤导出的候选者的总数小于候选者的最大数目,那么除1CandIdx和IlCandIdx的指定外执行如HEVC中界定的相同过程。在图12中说明的表中界定combldx、1CandIdx和I ICandIdx之间的关系。
[0181]3D-HEVC深度译码中用于零运动向量合并候选者的导出过程与HEVC中界定的程序相同。
[0182]以下描述用于高级残余预测(ARP)的实例技术。第4次JCT3V会议中采用应用于具有等于Part_2Nx2N(例如,图5中的NxN)的分割模式的CU的ARP,如JCT3V-D0177中所提议。JCT3V-D0177文献是张等人的标题为“CE4:用于多视图译码的高级残余预测”的文献。了(713¥_00177文献从2014年8月22 日起从http://phenix.1t-sudparis.eu/jct3v/doc_end_user/current_document.php?id = 862可用。
[0183]图14说明多视图视频译码中的高级残余预测(ARP)的预测结构。如图14中所展示,在当前块(“Curr”)140的预测中调用随后的块。由视差向量(DV)146导出的参考/基础视图144中的参考块142标记为“基础”。通过当前块140的(时间)运动向量150(表示为TMV)导出的与当前块Curr 140在同一视图(视图Vm)中的块148标记为“CurrTRef”。通过当前块的时间运动向量(TMV)导出的与块基础142在同一视图(视图Vo)中的块152标记为“BaseTRef”。以与当前块Curr 140进行比较的TMV+DV的向量154识别参考块BaseTRef 152。
[0184]残余预测符表示为BaseTRef-Base,其中减法运算应用于所表示像素阵列的每一像素。可进一步将加权因数V’乘以残余预测符。因此当前块Curr的最终预测符可表示为CurrTRef+w*(BaseTRef-Base)。
[0185]注意在以上描述和图14中,假定应用单向预测。当延伸ARP到双向预测时,针对每一参考图片列表应用以上步骤。当当前块Curr使用视图间参考图片(不同视图中)用于两个参考图片列表中的一者时,停用ARP过程。
[0186]以下描述ARP中的解码过程。首先,视频解码器30获得指向目标参考视图的视差向量(例如,使用NBDV导出过程)。随后,在同一存取单元内的参考视图的图片中,视频解码器30使用视差向量定位对应块。
[0187]视频解码器30可再使用当前块的运动信息以导出参考块的运动信息。视频解码器30可随后基于当前块的同一运动向量和所导出参考图片应用用于对应块的运动补偿,以导出残余块。
[0188]图15是说明当前块160、参考块162和运动补偿块164和166之间的实例关系的概念图。具有与当前视图(Vm)的参考图片相同的POC(图片次序计数)值的参考视图(Vo)中的参考图片被选择为对应块162的参考图片。视频编码器20和/或视频解码器30可将加权因数应用于残余块以得到经加权残余块且将经加权残余块的值添加到预测样本。
[0189]以下描述加权因数。ARP中使用三个加权因数,S卩,0、0.5和I。导致当前CU的大多数最小速率失真成本的加权因数被选择为最终加权因数,且在CU层级在位流中发射对应加权因数索引(例如,分别对应于加权因数O、I和0.5的O、I和2)。在ARP的一个实例中,一个CU中的全部PU预测共享同一加权因数。当加权因数等于O时,ARP不用于当前CU。
[0190]以下描述ARP的一些进一步简化。首先,描述经由运动向量按比例缩放的参考图片选择。第二,描述内插滤波器。
[0191]对于经由运动向量按比例缩放的参考图片选择,在JCT3V-C0049中,以非零加权因数译码的预测单元的参考图片可在块之间不同。JCT3V-C0049文献是张等人的标题为“3D-CE4:用于多视图译码的高级残余预测”的文献。JCT3V-C0049文献在2013年9月23日从http://phenix.1nt-evry.fr/jct3v/doc_end_user/current_document.php?id = 487可用。
[0192]因此,可能需要存取来自参考视图的不同图片以产生对应块的经运动补偿的块(例如,图14中的BaseTRef )。已提出当加权因数不等于O时在执行用于残余产生过程的运动补偿之前朝向固定图片按比例缩放当前PU的经解码运动向量。如JCT3V-D0177中所提议,所述固定图片在其来自同一视图的情况下经界定为每一参考图片列表的第一参考图片。当经解码运动向量不指向固定图片时,视频解码器30可首先经按比例缩放经解码运动向量且随后使用经按比例缩放运动向量以识别CurrTRef和BaseTRef。用于ARP的此参考图片称为目标ARP参考图片。
[0193]对于内插滤波器,如JCT3V-C0049中所描述,视频编码器20和/或视频解码器30可在对应块及其预测块的内插过程期间应用双线性滤波器。对于非基础视图中的当前PU的预测块,可应用常规8/4分接头滤波器。在另一实例中,如JCT3V-D0177所提议,无论当应用ARP时块在基础视图还是非基础视图中,视频编码器20和/或视频解码器30可始终采用双线性滤波。
[0194]在本发明的一或多个实例中,视频编码器20和/或视频解码器30可经配置以使用从NBDV导出过程返回的视图次序索引识别参考视图。在ARP的一个实例中,当一个参考图片列表中的一个PU的参考图片来自与当前视图不同的视图时,ARP针对此参考图片列表停用。
[0195]2013年6月27日申请的第61/840,400号美国临时申请案和2013年7月18日申请的第61/847,942号美国临时申请案中描述用于深度帧间译码的一些添加技术。在这些实例中,当译码深度图片时,通过估计深度值从当前块的相邻样本转换视差向量。
[0196]在ARP的其它实例中,可例如通过存取由视差向量识别的基础视图的参考块而导出额外合并候选者。
[0197]以下描述用于定位用于视图间运动预测的块的技术。在3D-HEVC中,使用两个一般步骤识别参考4x4块。第一步骤是以视差运动向量识别参考视图中的像素。第二步骤是获得对应4x4块(具有分别对应于RefPicListO或RefPicListl的运动信息的唯一集合)且利用所述运动信息产生合并候选者。
[0198]如下识别参考视图中的像素(xRef,yRef):
[0199]xRef=Clip3(0,PicffidthlnSamplesL-l,xP+((nPSff-1)>>1)+((mvDisp[0]+2)>>2)) (H-124)
[0200]yRef = Clip3(0,PicHeightInSamplesL~l ,yP+( (nPSH-1)>>1) + ((mvDisp[I]+2)>>2)) (H-125)
[0201]其中(xP,yP)是当前HJ的左上方样本的坐标,mvDi sp是视差向量且nPSWxnPSH是当前PU的大小,且PicWidthInSamplesL及PicHeightInSamplea界定参考视图(与当前视图相同)中的图片的分辨率。
[0202]以下描述子PU层级视图间运动预测。在JCT3V-E0184中,提出使用用于IPMVC的子PU层级视图间运动预测方法,S卩,从参考视图中的参考块导出的候选者。安等人的JCT3V-EO184“3D-CE3.h相关:子PU层级视图间运动预测”从http://phenix.1t-sudparis.eu/jct2/doc_end_user/current_document.php?id = 1198可用。
[0203]上文描述视图间运动预测的基本概念(例如,相对于用于跳过/合并模式的视图间候选者导出过程),其中仅与中心位置相关联的参考块的运动信息用于相依视图中的当前PU。然而,当前PU可对应于参考视图中的参考区域(具有与由视差向量识别的当前PU相同的大小),且参考区域可具有丰富的运动信息(即,超过运动向量)。
[0204]因此,提出子PU层级视图间运动预测(SPIVMP)方法。图16是说明子预测单元(PU)视图间运动预测的概念图。如图16中所展示,当前视图Vl中的当前PU 170可分裂成多个子PU (例如,四个子HJ) ο每一子PU的视差向量可用以定位参考视图VO中的对应参考块。视频编码器20和/或视频解码器30可经配置以复制(S卩,再使用)与参考块中的每一者相关联的运动向量以用于当前HJ 170的对应子PU。
[0205]在一个实例中,如下导出时间视图间合并候选者。首先,由NxN表示经指派子PU大小。首先将当前HJ划分为具有较小大小的多个子PU。通过nPSW X nPSH表示当前PU的大小且通过nPSWsub X nPSHSub表不子PU的大小。
[0206]nPSffsub=min(N,nPSff)
[0207]nPSHSub=min(N,nPSH)
[0208]第二,针对每一参考图片列表将默认运动向量tmvLX设定为(O,O)且将参考索引refLX设定为-1。对于光栅扫描次序中的每一子PU,以下适用。将DV添加到当前子PU的中间位置以如下获得参考样本位置(xRefSub,yRefSub):
[0209]xRefSub = Clip3(O,PicffidthlnSamplesL-l,xPSub+nPSffsub/2+( (mvDisp[0]+2)>>2))
[0210]yRefSub = Clip3(0 ,PicHeightInSamplesL-1,yPSub+nPSHSub/2+( (mvDisp[ I ]+2)?2))
[0211]参考视图中覆盖(xRefSub,yRefSub)的块用作当前子HJ的参考块。
[0212]对于所识别的参考块,如果其是使用时间运动向量经译码,那么以下适用。如果refLO和refLl两者等于-1,且当前子PU不是光栅扫描次序中的第一者,那么参考块的运动信息由全部先前子PU继承。相关联运动参数可用作当前子PU的候选运动参数。语法元素tmvLX和refLX经更新到当前子PU的运动信息。否则(例如,如果参考块经帧内译码),将当前子PU的运动信息设定成tmvLX和refLX。可应用不同的子PU块大小,例如4x4、8x8和16x16。子PU的大小可在VPS中用信号表示。
[0213]以下描述用于深度译码的子PU层级运动向量继承。类似于从一个纹理视图到另一纹理视图的子PU层级视图间运动预测的提议,2013年7月24日申请的第61/858,089号美国临时申请案提出应用从一个纹理视图到对应深度视图的子PU层级运动预测的技术。即,可在若干子PU中分割当前PU且每一子PU使用位于同一地点的纹理块的运动信息用于运动补偿。在此情况下,支持子PU层级MVI,且由视图间运动预测使用的视差向量被视为始终为零。
[0214]3D-HEVC中用于BVSP的当前设计展现以下问题。当使用AMP且当前PU大小是4x16或16x4且PU经单向预测时,通过针对整个HJ导出一个视差向量而实现BVSP。即PU中的每一子块使用相同视差向量用于参考块合成和运动补偿。因此,对于较大的块大小,BVSP可较不高效,因为使用相同视差向量用于全部子块的块合成和运动补偿对于所述子块中的一些可能较不最佳。
[0215]作为另一缺点,当当前PU双向预测时,以等于4x8和8x4的块大小启用BVSP。然而,在HEVC中,不允许用于含有少于64像素的块(例如,4x8或8x4块)的运动补偿(但允许16x4和4x16运动补偿)。
[0216]鉴于这些缺陷,本发明提出与3D-HEVC中的视图合成预测相关的技术,其集中于BVSP运动补偿大小。根据本发明的技术,对于BVSP,每一 PU可分裂成子块,且每一子块可与不同视差运动向量相关联且单独地经运动补偿。以此方式,对于以AMP分割的块可增加BVSP的准确性,且因此,译码效率可增加。根据本发明的技术,可用于BVSP的子块的大小可进一步如下界定。
[0217]在本发明的一个实例中,当当前PU大小是16x4(或4x16)且当前PU经单向预测时,视频编码器20和/或视频解码器30可经配置以将BVSP和运动补偿技术应用于当前PU的8x4(或4x8)子块。即,BVSP子区的大小是8x4(或4x8)。子块中的每一者可被指派从深度块转换的视差运动向量。
[0218]图17是描绘当使用AMP时本发明的BVSP和运动补偿技术的概念图。在图17的实例中,视频编码器20和/或视频解码器30将当前PU 250不对称分割为4x16块。应注意4x16分割仅是一个实例,且参考图17描述的本发明的技术可应用于其它不对称分区,包含16x4分区。视频编码器20和/或视频解码器30可经配置以将PU 250细分为4x8子块255和256。
[0219]在图17的实例中,视频编码器20和/或视频解码器30经配置以使用BVSP单向预测PU 250。在此方面,视频编码器20和/或视频解码器30可经配置以例如使用NBDV导出技术导出PU 250的视差向量。举例来说,视差向量261可从相邻块252导出。视频编码器20和/或视频解码器30可随后经配置以再使用视差向量261来定位参考深度图片中的对应深度块260。根据本发明的技术,并非使用深度块2
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1