视频编码设备、视频解码设备、视频编码方法、视频解码方法以及程序与流程

文档序号:11990833阅读:321来源:国知局
视频编码设备、视频解码设备、视频编码方法、视频解码方法以及程序与流程
本发明涉及使用分级编码单元的视频编码设备、视频解码设备、视频编码方法、视频解码方法以及程序。

背景技术:
非专利文献(NPL)1公开了典型的视频编码系统和视频解码系统。NPL1中描述的视频编码设备具有如图15中所示的结构。以下将图15中示出的视频编码设备称为典型视频编码设备。参考图15,以下描述典型视频编码设备的结构和操作,该设备接收数字化视频的每个帧作为输入并输出比特流。图15中所示视频编码设备包括变换器/量化器101、熵编码器102、逆变换器/逆量化器103、缓冲器104、预测器105、复用器106以及编码控制器108。图15中所示视频编码设备将每个帧分割成16×16像素尺寸的被称为宏块(MB)的块,并从该帧的左上方起依次编码每个MB。图16为示出在帧具有QCIF(四分之一通用中间格式)空间分辨率情况下的块分割示例的说明图。为了简单起见,以下仅关注亮度(luminance)像素值来描述每个单元的操作。从经块分割的输入视频减去供应自预测器105的预测信号,并将结果输入至变换器/量化器101作为预测错误图像。存在两种类型的预测信号,即,内(intra)预测信号和间(inter)预测信号。间预测信号亦称帧间预测信号。以下描述每种预测信号。内预测信号是基于与存储在缓冲器104中的当前图片具有相同的显示时间的、重建图片的图像而生成的预测信号。参见NPL1中的8.3.1的用于亮度采样的Intra_4×4预测过程、8.3.2的用于亮度采样的Intra_8×8预测过程以及8.3.3的用于亮度采样的Intra_16×16预测过程,存在3种块尺寸的内预测可用——即,Intra_4×4、Intra_8×8和Intra_16×16。从图17中的(a)和(c)可以理解,Intra_4×4和Intra_8×8分别是4×4块尺寸和8×8块尺寸的内预测。附图中每个圈(○)代表用于内预测的参考像素,即,与当前图片具有相同的显示时间的重建图片的像素。在Intra_4×4的内预测中,直接将重建的外围像素设置为参考像素,并将其用于图17(b)中所示九个方向上的填补(外插)以形成预测信号。在Intra_8×8的内预测中,将通过由图17(c)中右箭头下方所示低通滤波器(1/2、1/4、1/2/)对重建图片的图像的外围像素加以平滑而获得的像素设置为参考像素,并将其用于图17(b)中所示九个方向上的外插以形成预测信号。类似地,从图18(a)中可以理解,Intra_16×16是16×16块尺寸的内预测。像图17中那样,附图中每个圈(○)代表用于内预测的参考像素,即与当前图片具有相同的显示时间的重建图片的像素。在Intra_16×16的内预测中,直接将重建图片的图像的外围像素设置为参考像素,并将其用于图18(b)中所示四个方向上的外插以形成预测信号。在下文中,将使用内预测信号编码的MB和块分别称为内MB和内块,即,将内预测的块尺寸称为内预测块尺寸,并将外插的方向称为内预测方向。内预测块尺寸和内预测方向是与内预测有关的预测参数。间预测信号是从与当前图片具有不同的显示时间、并存储于缓冲器104中的重建图片的图像中生成的预测信号。在下文中,将使用间预测信号编码的MB和块分别称为间MB和间块。间预测的块尺寸(间预测块尺寸)例如可从16×16、16×8、8×16、8×8、8×4、4×8和4×4中选择。图19为示出使用16×16块尺寸的间预测示例的说明图。图19中所示的运动矢量MV=(mvx,mvy)为间预测的预测参数,其指示参考图片的间预测块(间预测信号)相对于将被编码的块的平行位移。在AVC中,间预测的预测参数不仅包括间预测的方向,而且还包括参考图片索引,其中所述间预测的方向代表间预测信号的参考图片相对于将被编码的块的将被编码的图片的方向,而所述参考图片索引用来标识用于对将被编码的块进行间预测的参考图片。这是因为在AVC中,可将存储于缓冲器104中的多个参考图片用于间预测。在AVC间预测中,能够以1/4像素的精确度来计算运动矢量。图20为示出在运动补偿预测中亮度信号的内插处理的说明图。在图20中,A代表位于整数像素位置的像素信号,b、c、d代表位于小数像素位置的具有1/2像素精确度的像素信号,而e1、e2、e3代表位于小数像素位置的具有1/4像素精确度的像素信号。通过对位于水平整数像素位置的像素应用6抽头滤波器而生成像素信号b。同样地,通过对位于纵向整数像素位置的像素应用6抽头滤波器而生成像素信号c。通过对位于水平或垂直小数像素位置的具有1/2像素精确度的像素应用6抽头滤波器而生成像素信号d。以[1,-5,20,20,-5,1]/32来代表该6抽头滤波器的系数。分别通过对位于相邻整数像素位置或小数像素位置的像素应用2抽头滤波器[1,1]/2而生成像素信号e1、e2和e3。通过仅包括内MB而编码的图片称为I图片。通过不仅包括内MB而且还包括间MB而编码的图片称为P图片。通过包括不止使用一个参考图片而是同时使用两个参考图片用于间预测的间MB而编码的图片称为B图片。在B图片中,其中间预测信号的参考图片相对于将被编码的块的将被编码的图片的方向为过去的间预测称为前向预测,其中间预测信号的参考图片相对于将被编码的块的将被编码的图片的方向为将来的间预测称为后向预测,而同时使用既涉及过去又涉及将来的两个参考图片的间预测称为双向预测。间预测的方向(间预测方向)为间预测的预测参数。依照来自编码控制器108的指令,预测器105将输入视频信号与预测信号相比较,以确定使得预测错误图像块的能量最小化的预测参数。编码控制器108将确定的预测参数供应至熵编码器102。变换器/量化器101对已从中减去预测信号的图像(预测错误图像)进行频率变换以获得频率变换系数。变换器/量化器101还以预定的量化步长宽度Qs来量化该频率变换系数。在下文中,将量化的频率变换系数称为变换量化值。熵编码器102对预测参数和变换量化值进行熵编码。预测参数为关联于MB和块预测的信息,诸如预测模式(内预测、间预测)、内预测块尺寸、内预测方向、间预测块尺寸以及上文所述的运动矢量等。逆变换器/逆量化器103以预定的量化步长宽度Qs来逆量化变换量化值。逆变换器/逆量化器103还对通过逆量化获得的频率变换系数执行逆频率变换。将预测信号添加至通过逆频率变换获得的重建预测错误图像,并将结果供应至缓冲器104。缓冲器104存储供应的重建图像。将用于一帧的重建图像称为重建图片。复用器106对熵编码器102的输出数据和编码参数进行复用及输出。基于上述操作,视频编码设备中的复用器106生成比特流。NPL1中描述的视频解码设备具有如图21中所示的结构。在下文中,将图21中所示的视频解码设备称为典型视频解码设备。参照图21描述典型视频解码设备的结构与操作,所述典型视频解码设备接收比特流作为输入并输出经解码的视频帧。图21中所示的视频解码设备包括解复用器201、熵解码器202、逆变换器/逆量化器203、预测器204以及缓冲器205。该解复用器201对输入比特流进行解复用并提取熵编码视频比特流。熵解码器202对视频比特流进行熵解码。熵解码器202对MB和块预测参数以及变换量化值进行熵解码,并将结果供应至逆变换器/逆量化器203和预测器204。逆变换器/逆量化器203以量化步长宽度来逆量化变换量化值。逆变换器/逆量化器203还对通过逆量化获得的频率变换系数执行逆频率变换。在逆频率变换之后,预测器204基于熵解码MB和块预测参数,使用缓冲器205中存储的重建图片的图像生成预测信号。在生成预测信号之后,将供应自预测器204的预测信号添加至通过由逆变换器/逆量化器203执行的逆频率变换而获得的重建预测错误图像,并将结果供应至缓冲器205作为重建图像。继而,输出存储于缓冲器205中的重建图片输出为解码图像(解码视频)。基于上述操作,典型视频解码设备生成解码图像。引文列表非专利文献NPL1:ISO/IEC14496-10AdvancedVideoCodingNPL2:“TestModelunderConsideration,”Document:JCTVC-B205,JointCollaborativeTeamonVideoCoding(JCT-VC)ofITU-TSG16WP3andISO/IECJTC1/SC29/WG112ndMeeting:Geneva,CH,21-28July,2010

技术实现要素:
技术问题NPL2公开了考虑中的测试模型(TMuC)。与NPL1中公开的不同,该TMuC使用图22中所示的分级编码单元(编码树块(CTB))。在本说明书中,将CTB块称为编码单元(CU)。在此,将最大CU称为最大编码单元(LCU),并将最小CU称为最小编码单元(SCU)。在TMuC方案中,引入预测单元(PU)的概念作为对每个CU的预测的单元(见图23)。PU为预测的基本单元,并定义了图23中所示的8个PU划分类型{2N×2N,2N×N,N×2N,N×N,2N×nU,2N×nD,nL×2N,nR×2N}。将用于间预测的PU称为间PU,并将用于内预测的PU称为内PU。将使用间预测的PU划分称为间PU划分,并将使用内预测的PU划分称为内PU划分。在图23中所示的形状之中,仅将支持2N×2N和N×N正方形作为内PU划分。在下文中,将CU和PU的一边的长度分别称为CU尺寸和PU尺寸。TMuC方案可使用具有最多达12个抽头的滤波器来以小数精确度寻找预测图像。像素位置与滤波器系数之间的关系如下。[表1]像素位置滤波器系数1/4{-1,5,-12,20,-40,229,76,-32,16,-8,4,-1}1/2{-1,8,-16,24,-48,161,161,-48,24,-16,8,-1}3/4{-1,4,-8,16,-32,76,229,-40,20,-12,5,-1}参考图24描述像素位置。在图24中,假设A和E是位于整数像素位置的像素。在这种情况下,b是位于1/4像素位置的像素,c是位于1/2像素位置的像素,并且d是位于3/4像素位置的像素。上述情况也适用于垂直方向上的像素。图20中所示的像素b或像素c是通过对水平或垂直的1/2像素位置应用一次滤波器而生成。像素e1通过对1/4像素位置应用一次滤波器而生成。参照图25,对小数像素的生成示例进行描述,所述小数像素诸如像素e2和像素e3,其像素位置为在水平方向和垂直方向两者上的小数精确度位置并且至少其中之一为1/4像素位置。在图25中,假设像素A是位于整数像素位置的像素而像素c是位于要获取的小数像素位置的像素。在这种情况下,首先通过应用针对垂直1/4像素位置的滤波器来生成像素b。继而,相对于小数像素b通过应用针对水平3/4像素位置的滤波器而生成像素c。在NPL2的8.3内插方法(InterpolationMethods)中更为详细地描述了小数像素的生成。在TMuC方案中,将指示所有层次上CU的每个PU报头中的PU划分类型的语法(根据NPL2中的4.1.10的预测单元语法,在内预测情况下为intra_split_flag以及在间预测情况下为inter_partitioningidc)嵌入到输出比特流中。在下文中,将intra_split_flag语法称为内PU划分类型语法,并将inter_partitioning_idc语法称为间PU划分类型语法。当在每个LCU内存在许多小尺寸CU时,比特流中所包括的间PU划分类型语法比特的数目比率增大,从而造成压缩视频的质量降低的问题。此外,在TMuC方案中,对参考图片的存储器访问随着间PU划分的尺寸变小而增加,从而造成存储器带宽紧张的问题。特别是由于在TMuC方案中使用12抽头滤波器来生成小数像素,因而使得存储器带宽更为紧张。图26为描述当使用12抽头滤波器时的存储器访问区域的说明图。图26(A)示出了当选择N×NPU划分类型时一个间PU划分的存储器访问区域,而图26(B)示出了当选择2N×2N间PU划分类型时的存储器访问区域。当选择N×N时,由于针对间PU划分0、1、2、3中的每一个执行总共4次如图26(A)中的虚线所包围的尺寸的存储器访问,因此存储器访问量具有通过将4(N+11)2=4N2+88N+484乘以参考图片的比特计数而获得的值。由于2N×2N间PU划分的存储器访问量具有通过将(2N+11)2=4N2+44N+121乘以参考图片的比特计数而获得的值,因此N×N间PU划分的存储器访问量变得比2N×2N存储器访问量更大。例如,当N=4时,8×8CU中的间PU的存储器访问量,预测为单向预测,并且考虑每个像素值的比特精确度为8比特的情况。在2N×2N间PU划分中的存储器访问量为19×19×1×8比特=2888比特,而在N×N间PU划分中的存储器访问量为15×15×4×8比特=7200比特,该存储器访问量大约为2.5倍。在LCU单元中,如果LCU的块尺寸为128×128,则当通过一个间PU划分预测LCU时存储器访问量将为139×139×1×8比特=154568比特,而当LCU全部由4×4间PU划分来预测时(即,当通过1024个间PU划分来预测LCU时),存储器访问量将为15×15×1024×8比特=1843200比特,该存储器访问量大约为12倍。本发明的目的是减少每预定区域的存储器带宽。对于问题的解决方案根据本发明的视频编码设备是使用间预测来对视频进行编码的视频编码设备,其包括编码控制装置,该编码控制装置用于基于最小间PU尺寸和将被编码的CU的CU尺寸来控制将被编码的CU的间PU划分类型。根据本发明的视频解码设备是使用间预测来对视频进行解码的视频解码设备,该视频解码设备包括解码控制装置,该解码控制装置用于基于最小间PU尺寸和将被解码的CU的尺寸来控制将被解码的CU的间PU划分。根据本发明的视频编码方法是使用间预测来对视频进行编码的视频编码方法,该视频编码方法包括基于最小间PU尺寸和将被编码的CU的CU尺寸来控制将被编码的CU的间PU划分类型。根据本发明的视频解码方法是使用间预测来对视频进行解码的视频解码方法,该视频解码方法包括基于最小间PU尺寸和将被解码的CU的尺寸来控制将被解码的CU的间PU划分。根据本发明的视频编码程序使得使用间预测来对视频进行编码的计算机执行基于最小间PU尺寸和将被解码的CU的CU尺寸来控制将被编码的CU的间PU划分类型的过程。根据本发明的视频解码程序使得使用间预测来对视频进行解码的计算机执行基于最小间PU尺寸和将被解码的CU的尺寸来控制将被解码的CU的间PU划分的过程。发明的有益效果根据本发明,可限制对小的间PU划分的使用以减少存储器带宽。附图说明[图1]图1为示例性实施方式1中的视频编码设备的框图。[图2]图2为示出确定PU划分类型候选项的过程的流程图。[图3]图3为指明关于序列参数集中最小间PU尺寸的信息的列表的说明图。[图4]图4为示出PU报头写入操作的流程图。[图5]图5为指明关于PU语法中inter_partitioning_idc语法的信息的列表的说明图。[图6]图6为示例性实施方式2中的视频解码设备的框图。[图7]图7为示出PU报头解析操作的流程图。[图8]图8为指明关于图片参数集中最小间PU尺寸的信息的列表的说明图。[图9]图9为指明关于切片报头中最小间PU尺寸的信息的列表的说明图。[图10]图10为示例性实施方式4中的视频解码设备的框图。[图11]图11为示出错误检测操作的流程图。[图12]图12为示出信息处理系统的配置示例的框图,该信息处理系统能够实现根据本发明的视频编码设备和视频解码设备的功能。[图13]图13为示出根据本发明的视频编码设备的主要部分的框图。[图14]图14为示出根据本发明的视频解码设备的主要部分的框图。[图15]图15为典型视频编码设备的框图。[图16]图16为示出块分割示例的说明图。[图17]图17为描述Intra_4×4和Intra_8×8的内预测的说明图。[图18]图18为描述Intra_16×16的内预测的说明图。[图19]图19为示出间预测示例的说明图。[图20]图20为示出运动补偿预测中对亮度信号的内插处理的说明图。[图21]图21为典型视频解码设备的框图。[图22]图22为描述CTB的说明图。[图23]图23为描述PU的说明图。[图24]图24为描述小数像素位置的说明图。[图25]图25为描述在TMuC方案中使用12抽头滤波器的小数像素生成方法的说明图。[图26]图26为描述当使用12抽头滤波器来生成小数像素时的存储器访问范围的说明图。具体实施方式为了解决上述典型技术的技术问题,本发明使用分级编码单元基于视频编码中CU深度(即CU尺寸)限制间PU划分,以解决所述问题。在本发明的一个示例中,限制能够使用间PU划分的除2N×2N之外的CU尺寸来解决所述问题。在本发明的另一示例中,限制PU报头中的间PU划分类型语法的传输来解决所述问题。在本发明的上述示例中,可将比特流中所包括的间PU划分类型语法的比特数目的比率保持为低,以抑制存储器带宽并同时改善压缩视频的质量。示例性实施方式1示例性实施方式1示出的视频编码设备包括:编码控制装置,该编码控制装置用于基于从外部设定的预定最小间PU尺寸来控制间PU划分类型;以及嵌入装置,该嵌入装置用于在比特流中嵌入关于最小间PU尺寸的信息以将关于最小间PU尺寸的信息信号发送至视频解码设备。在该示例性实施方式中,假设可用的CU尺寸为128、64、32、16和8(即,LCU的尺寸为128而SCU的尺寸为8),而最小间PU尺寸(minInterPredUnitSize)为8。在该示例性实施方式中还假设关于最小间PU尺寸的信息(min_inter_pred_unit_hierarchy_depth)为通过将最小间PU尺寸(8)除以SCU尺寸(8)而获得的值的以2为底的log(对数)。因此,在该示例性实施方式中,复用到比特流中的min_inter_pred_unit_hierarchy_depth的值为0(=log2(8/8))。如图15中所示典型视频编码设备那样,如图1所示,示例性实施方式中的视频编码设备像包括变换器/量化器101、熵编码器102、逆变换器/量化器103、缓冲器104、预测器105、复用器106以及编码控制器107。图1所示的示例性实施方式中的视频编码设备与图15所示的视频编码设备的不同之处在于:将minInterPredUnitSize供应至编码控制器107,来以大于minInterPredUnitSize的CU尺寸传输间PU划分类型语法;并且还将minInterPredUnitSize供应至复用器106,来将minInterPredUnitSize信号发送至视频解码设备。编码控制器107使预测器105计算成本(比率-失真成本:R-D成本),该成本根据编码失真(输入信号与重建图片之间的错误图像的能量)以及生成的比特计数而计算。编码控制器107确定在其中R-D成本得到最小化的CU分离(splitting)图案(通过如图22所示的split_coding_unit_flag确定的分离图案)以及每个CU的预测参数。编码控制器107将确定的split_coding_unit_flag和每个CU的预测参数供应至预测器105和熵编码器102。该预测参数是与将被编码的CU的预测相关联的信息,诸如预测模式(pred_mode)、内PU划分类型(intra_split_flag)、内预测方向、间PU划分类型(inter_partitioning_idc)以及运动矢量。作为示例,该示例性实施方式中的编码控制器107从总共10种类型的内预测{2N×2N,N×N}和间预测{2N×2N,2N×N,N×2N,N×N,2N×nU,2N×nD,nL×2N,nR×2N}中作为用于尺寸大于minInterPredUnitSize的CU选择最佳的PU划分类型的预测参数。对于尺寸等于minInterPredUnitSize的CU,编码控制器107从总共3种类型的内预测{2N×2N,N×N}和间预测{2N×2N}中选择最佳的PU划分类型作为预测参数。对于尺寸小于minInterPredUnitSize的CU,编码控制器107从两种类型的内预测{2N×2N,N×N}中选择最佳的PU划分类型作为预测参数。图2为示出该示例性实施方式中的编码控制器107用以确定PU划分类型候选项的操作的流程图。如图2中所示,当在步骤S101中确定将被编码的CU的CU尺寸大于minInterPredUnitSize时,编码控制器107在步骤S102中将PU划分类型候选项设置为总共10种类型的内预测{2N×2N,N×N}和间预测{2N×2N,2N×N,N×2N,N×N,2N×nU,2N×nD,nL×2N,nR×2N},并在步骤S106中基于R-D成本来确定预测参数。当在步骤S101中确定将被编码的CU的CU尺寸小于或等于minInterPredUnitSize时,编码控制器107转到步骤S103。当在步骤S103中确定将被编码的CU的CU尺寸等于minInterPredUnitSize时,编码控制器107在步骤S104中将PU划分类型候选项设置为总共3种类型的内预测{2N×2N,N×N}和间预测{2N×2N},并在步骤S106中基于R-D成本来确定预测参数。当在步骤S103中确定将被编码的CU的CU尺寸小于minInterPredUnitSize时,编码控制器107在步骤S105中将PU划分类型候选项设置为总共2种类型的内预测{2N×2N,N×N},并在步骤S106中基于R-D成本来确定最佳的PU划分类型作为预测参数。预测器105选择与编码控制器107所确定的每个CU的预测参数相对应的预测信号。从形状由编码控制器107确定的每个CU的输入视频中减去供应自预测器105的预测信号,以生成预测错误图像,并将预测错误图像输入到变换器/量化器101。变换器/量化器101对预测错误图像进行频率变换以获得频率变换系数。变换器/量化器101还以预定量化步长宽度Qs来量化频率变换系数,以获得变换量化值。熵编码器102对供应自编码控制器107的split_coding_unit_flag(见图22)、预测参数以及供应自变换器/量化器101的变换量化值进行熵编码。逆变换器/逆量化器103以预定量化步长宽度Qs来逆量化变换量化值。逆变换器/逆量化器103还对通过逆量化而获得的频率变换系数执行逆频率变换。将预测信号添加至通过逆频率变换而获得的重建预测错误图像,并将结果供应至缓冲器104。复用器106复用并输出关于最小间PU尺寸的信息(min_inter_pred_unit_hierarchy_depth)以及熵编码器102的输出数据。根据NPL2中的4.1.2的序列参数集RBSP语法,复用器106复用如图3中所列出的序列参数集中的log2_min_coding_unit_size_minus3语法和max_coding_unit_hierarchy_depth语法之后的min_inter_pred_unit_hierarchy_depth语法(通过将minInterPredUnitSize除以SCU尺寸而获得的值的以2为底的log(对数),即,在示例性实施方式中为0)。log2_min_coding_unit_size_minus3语法和max_coding_unit_hierarchy_depth语法分别为用于确定SCU尺寸(minCodingUnitSize)和LCU尺寸(maxCodingUnitSize)的信息。MinCodingUnitSize和maxCodingUnitSize分别按如下计算。minCodingUnitSize=1<<(log2_min_coding_unit_size_minus3+3)maxCodingUnitSize=1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth)min_inter_pred_unit_hierarchy_depth语法与minCodingUnitSize具有以下关系。min_inter_pred_unit_hierarchy_depth=log2(minInterPredUnitSize/minCodingUnitSize)基于上述操作,根据本发明的视频编码设备生成比特流。基于预定的最小间PU尺寸和将被编码的CU的CU尺寸,该示例性实施方式中的视频编码设备控制将被编码的CU的间PU划分,以便不出现尺寸小于最小间PU尺寸的任何间PU。通过防止出现尺寸小于最小间PU尺寸的任何间PU,存储器带宽得到减少。另外,由于通过防止出现尺寸小于最小间PU尺寸的任何间PU而减少了将被信号发送的间PU划分类型语法的数目,因此降低了PU报头的代码量在比特流中的百分比,并因而改善了视频的质量。该示例性实施方式的视频编码设备中的编码控制装置基于从外部设置的预定最小间PU尺寸来控制间PU划分。作为示例,编码控制设备进行控制,使得除2N×2N之外的间PU划分类型仅用于CU尺寸大于预定尺寸的CU之中。因此,由于2N×2N间PU划分的发生概率增加以减少熵,因此改善了熵编码的效率。所以,可在减少存储器带宽的同时保持压缩视频的质量。同样地,对于视频解码,该示例性实施方式中的视频编码设备包括嵌入装置,该嵌入装置用于在比特流中嵌入关于从外部设置的预定最小间PU尺寸的信息,以便可从比特流中解析间PU划分类型语法。因此,由于将预定尺寸信号发送至视频解码设备,因而可增强视频编码设备与视频解码设备的互操作性。示例性实施方式2示例性实施方式2中的视频编码设备包括:编码控制装置,该编码控制装置用于基于从外部设置的预定最小间PU尺寸来控制间PU划分类型,以及用于基于以上预定最小间PU尺寸来控制间PU划分类型语法的熵编码;以及嵌入装置,该嵌入装置用于在比特流中嵌入关于最小间PU尺寸的信息以便将关于以上最小间PU尺寸的信息信号发送至视频解码设备。在此示例性实施方式中,假设传输间PU划分类型语法的CU的CU尺寸大于以上最小间PU尺寸(minInterPredUnitSize)。还假设在该示例性实施方式中,可用的CU尺寸为128、64、32、16和8(即,LCU尺寸为128而SCU尺寸为8),并且minInterPredUnitSize为8。因此,在该示例性实施方式中,用于在比特流中嵌入间PU划分类型语法的CU尺寸为128、64、32和16。还假设在该示例性实施方式中,关于最小间PU尺寸的信息(min_inter_pred_unit_hierarchy_depth)是通过将最小间PU尺寸(8)除以SCU尺寸(8)而获得的值的以2为底的log(对数)。因此,在该示例性实施方式中,复用到比特流之中的min_inter_pred_unit_hierarchy_depth的值为0(=log2(8/8))。该示例性实施方式中的视频编码设备的结构与图1所示的示例性实施方式1中的视频编码设备的结构相同。如图1中所示,该示例性实施方式中的视频编码设备与图15中示出的视频编码设备的不同之处在于,将minInterPredUnitSize供应至编码控制器107,从而以大于minInterPredUnitSize的CU尺寸来传输间PU划分类型语法,并且还将minInterPredUnitSize供应至复用器106,来将minInterPredUnitSize信号发送至视频解码设备。编码控制器107使预测器105计算根据编码失真(输入信号与重建图片之间的错误图像的能量)以及生成的比特计数而计算的R-D成本。编码控制器107确定在其中R-D成本得到最小化的CU分离图案(由如图22中所示的split_coding_unit_flag确定的分离图案)以及每个CU的预测参数。编码控制器107将确定的split_coding_unit_flag和每个CU的预测参数供应至预测器105和熵编码器102。该预测参数是与将被编码的CU的预测相关联的信息,诸如预测模式(pred_mode)、内PU划分类型(intra_split_flag)、内预测方向、间PU划分类型(inter_partitioning_idc)以及运动矢量。与示例性实施方式1中类似,该示例性实施方式中的编码控制器107从总共10种类型的内预测{2N×2N,N×N}和间预测{2N×2N,2N×N,N×2N,N×N,2N×nU,2N×nD,nL×2N,nR×2N}中选择最佳的PU划分类型作为用于尺寸大于minInterPredUnitSize的CU的预测参数。对于尺寸等于minInterPredUnitSize的CU,编码控制器107从总共3种类型的内预测{2N×2N,N×N}和间预测{2N×2N}中选择最佳的PU划分类型作为预测参数。对于尺寸小于minInterPredUnitSize的CU,编码控制器107从内预测{2N×2N,N×N}中选择最佳的PU划分类型作为预测参数。当将被熵编码的CU的预测模式为间预测并且CU尺寸小于或等于minInterPredUnitSize时,该示例性实施方式中的编码控制器107对熵编码器102加以控制,使其不对inter_partitioning_idc进行熵编码。预测器105选择与编码控制器107所确定的每个CU的预测参数相对应的预测信号。从形状由编码控制器107所确定的每个CU的输入视频中减去供应自预测器105的预测信号,以生成预测错误图像,并将预测错误图像输入至变换器/量化器101。变换器/量化器101对预测错误图像进行频率变换,以获得频率变换系数。变换器/量化器101还以预定量化步长宽度Qs来量化频率变换系数,以获得变换量化值。熵编码器102对供应自编码控制器107的split_coding_unit_flag(见图22)、预测参数以及供应自变换器/量化器101的变换量化值进行熵编码。如上文所述,当将被熵编码的CU的预测模式为间预测并且CU尺寸小于或等于minInterPredUnitSize时,该示例性实施方式中的熵编码器102不对inter_partitioning_idc进行熵编码。逆变换器/逆量化器103以预定量化步长宽度Qs来逆量化变换量化值。逆变换器/逆量化器103还对通过逆量化而获得的频率变换系数执行逆频率变换。将预测信号添加至通过逆频率变换而获得的重建预测错误图像,并将结果供应至缓冲器104。复用器106复用并输出关于最小间PU尺寸的信息(min_inter_pred_unit_hierarchy_depth)和熵编码器102的输出数据。根据NPL2中的4.1.2的序列参数集RBSP语法,复用器106复用如图3中所列出的序列参数集中的log2_min_coding_unit_size_minus3语法和max_coding_unit_hierarchy_depth语法之后的min_inter_pred_unit_hierarchy_depth语法(通过将minInterPredUnitSize除以SCU尺寸而获得的值的以2为底的log(对数),即,在示例性实施方式中为0)。log2_min_coding_unit_size_minus3语法和max_coding_unit_hierarchy_depth语法分别为用于确定SCU尺寸(minCodingUnitSize)和LCU尺寸(maxCodingUnitSize)的信息。MinCodingUnitSize和maxCodingUnitSize分别按如下计算。minCodingUnitSize=1<<(log2_min_coding_unit_size_minus3+3)maxCodingUnitSize=1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth)min_inter_pred_unit_hierarchy_depth语法与minCodingUnitSize具有以下关系。min_inter_pred_unit_hierarchy_depth=log2(minInterPredUnitSize/minCodingUnitSize)基于上述操作,该示例性实施方式中的视频编码设备生成比特流。接下来参考图4的流程图,描述作为该示例性实施方式的特征的、写入间PU划分类型语法的操作。如图4中所示,熵编码器102在步骤S201中对split_coding_unit_flag进行熵编码。熵编码器102还在步骤S202中对预测模式进行熵编码,即,熵编码器102对pred_mode语法进行熵编码。当在步骤S203中确定将被编码的CU的预测模式为间预测、并且在步骤S204中确定CU尺寸小于或等于minInterPredUnitSize时,编码控制器107对熵编码器102加以控制,使其跳过对inter_partitioning_idc语法的熵编码。当在步骤S203中确定将被编码的CU的预测模式为内预测时,或者当在步骤S204中确定CU尺寸大于minInterPredUnitSize时,编码控制器107对熵编码器102加以控制,使其在步骤S205中对关于将被编码的CU的PU划分类型信息进行熵编码。根据NPL2中的4.1.10预测单元算法,以如图5中所示列表中所表示的信号发送上述pred_mode语法和inter_partitioning_idc语法。该示例性实施方式特征在于:当满足“if(currPredUnitSize>minInterPredUnitSize)”条件时,仅在尺寸大于minInterPredUnitSize的CU的PU报头中信号发送inter_partitioning_idc语法。当将被编码的CU的CU尺寸小于或等于预定最小间PU尺寸时,该示例性实施方式中的视频编码设备不对将被编码的CU的PU报头层中的间PU划分类型语法进行熵编码,从而减少将被信号发送的间PU划分类型语法的数目。由于将被信号发送的间PU划分类型语法的数目的减少将会减小PU报头的代码量在比特流中的百分比,因此进一步改善了视频的质量。当将被编码的CU的CU尺寸超过预定最小间PU尺寸时,该示例性实施方式中的视频编码设备以预定的间PU划分类型来设置将被编码的CU的PU报头层中的间PU划分类型语法,并且对间PU划分类型进行熵编码,以便不出现尺寸小于最小间PU尺寸的间PU。通过防止出现尺寸小于最小间PU尺寸的任何间PU,使存储器带宽得到减少。示例性实施方式3示例性实施方式3中的视频解码设备解码由示例性实施方式2中的视频编码设备生成的比特流。该示例性实施方式中的视频解码设备包括:解复用装置,该解复用装置用于对复用至比特流之中的最小间PU尺寸信息进行解复用;CU尺寸确定装置,该CU尺寸确定装置用于基于解复用的最小间PU尺寸信息来确定从中解析间PU划分类型的预定CU尺寸;以及解析装置,该解析装置用于从比特流中解析由CU尺寸确定设备所确定的CU尺寸中的间PU划分类型。如图6中所示,该示例性实施方式中的视频解码设备包括解复用器201、熵解码器202、逆变换器/逆量化器203、预测器204、缓冲器205以及解码控制器206。解复用器201对输入比特流进行解复用,并提取最小间PU尺寸信息和熵编码视频比特流。解复用器201对如图3中所列的序列参数中的log2_min_coding_unit_size_minus3语法和max_coding_unit_hierarchy_depth语法之后的min_inter_pred_unit_hierarchy_depth语法进行解复用。解复用器201还使用解复用的语法值来确定最小间PU尺寸(minInterPredUnitSize),其中按如下所述方式来传输间PU划分类型语法(inter_partitioning_idc语法)。minInterPredUnitSize=1<<(log2_min_coding_unit_size_minus3+3+min_inter_pred_unit_hierarchy_depth)换言之,该示例性实施方式中的解复用器201还在基于解复用的最小间PU尺寸信息来确定从中解析间PU划分类型语法的CU尺寸中发挥作用。解复用器201还将最小间PU尺寸供应至解码控制器206。熵解码器202对视频比特流进行熵解码。熵解码器202将经熵解码的变换量化值供应至逆变换器/逆量化器203。熵解码器202将经熵解码的split_coding_unit_flag和预测参数供应至解码控制器206。当将被解码的CU的预测模式为间预测并且CU尺寸为minInterPredUnitSize时,该示例性实施方式中的解码控制器206对熵解码器202加以控制,使其跳过对将被解码的CU的间PU划分类型语法的熵解码。解码控制器206还将将被解码的CU的间PU划分类型设置为2N×2N。当将被解码的CU的CU尺寸小于minInterPredUnitSize时,CU的预测模式仅为内预测。逆变换器/逆量化器203以预定的量化步长宽度来逆量化亮度和色差的变换量化值。逆变换器/逆量化器203还对通过逆量化获得的频率变换系数执行逆频率变换。在逆频率变换之后,预测器204基于从解码控制器206供应的预测参数,使用存储于缓冲器205中的重建图片的图像来生成预测信号。将供应自预测器204的预测信号添加至通过由逆变换器/逆量化器203所执行的逆频率变换而获得的重建预测错误图像,并将结果供应至缓冲器205作为重建图片。继而输出存储于缓冲器205中的重建图片作为解码图像。基于上述操作,该示例性实施方式中的视频解码设备生成解码图像。接下来参考图7的流程图,描述作为该示例性实施方式的特征的、解析间PU划分类型语法的操作。如图7中所示,熵解码器202在步骤S301中对split_coding_unit_flag进行熵解码以决定CU尺寸。在步骤S302中,熵解码器202对预测模式进行熵解码。换言之,熵解码器202对pred_mode语法进行熵解码。当在步骤S303中确定预测模式为间预测并在步骤S304中确定决定的CU尺寸小于或者等于minInterPredUnitSize时,解码控制器206在步骤S305中控制熵解码器202,以跳过对间PU划分类型的熵解码,并将CU的PU划分类型设置为2N×2N(inter_partitioning_idc=0)。当在步骤S303中确定预测模式为内预测时,或者当在步骤S304中确定所决定的CU尺寸大于minInterPredUnitSize时,解码控制器206在步骤S306中控制熵解码器202以不跳过对将被解码的CU的PU划分类型的熵解码,并将CU的PU划分类型设置成作为熵解码的结果而获得的PU划分类型。示例性实施方式1和示例性实施方式2中的视频编码设备可将示例性实施方式1中所使用的最小间PU尺寸信息(min_inter_pred_unit_hierarchy_depth)复用至如图8中所示列表或如图9中所示列表所代表的图片参数集或切片报头(sliceheader)之中。类似地,该示例性实施方式中的视频解码设备可从图片参数集或切片报头中解复用min_inter_pred_unit_hierarchy_depth语法。示例性实施方式1和示例性实施方式2中的视频编码设备可将min_inter_pred_unit_hierarchy_depth语法设置为通过将LCU尺寸(maxCodingUnitSize)除以最小间PU尺寸(minInterPredUnitSize)而获得的值的以2为底的log(对数),即,可使用以下公式。min_inter_pred_unit_hierarchy_depth=log2(maxCodingUnitSize/minInterPredUnitSize)在这种情况下,该示例性实施方式中的视频解码设备可按如下所示基于min_inter_pred_unit_hierarchy_depth语法来计算最小间PU尺寸。minInterPredUnitSize=1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth-min_inter_pred_unit_hierarchy_depth)在该示例性实施方式中的视频解码设备中,由于不出现尺寸小于最小间PU尺寸的间PU,因此减少了存储器带宽。示例性实施方式4示例性实施方式4中的视频解码设备解码由示例性实施方式1中视频编码设备所生成的比特流。该示例性实施方式中的视频解码设备包括:用于对复用至比特流中的最小间PU尺寸信息进行解复用的装置;以及错误检测装置,所述错误检测装置用于基于解复用的最小间PU尺寸信息来检测访问包括将被解码的CU的比特流的访问单元中的错误。如在NPL1的3.1访问单元中所定义,访问单元是存储一个图片的编码数据的单元。错误是指违反基于每预定区域所允许的运动矢量数目的限制。如图10中所示,该示例性实施方式中的视频解码设备包括解复用器201、熵解码器202、逆变换器/逆量化器203、预测器204、缓冲器205以及错误检测器207。解复用器201以与示例性实施方式3中的解复用器201相同的方式操作,以便对输入比特流进行解复用以及提取最小间PU尺寸信息和熵编码的视频比特流。解复用器201还确定最小间PU尺寸并将最小间PU尺寸供应至错误检测器207。熵解码器202对视频比特流进行熵解码。熵解码器202向逆变换器/逆量化器203供应熵解码的变换量化值。熵解码器202继而向错误检测器207供应熵解码的split_coding_unit_flag和预测参数。错误检测器207基于从解复用器201供应的最小间PU尺寸对供应自熵解码器202的预测参数执行错误检测,并将结果供应至预测器204。下文将会描述错误检测操作。错误检测器207还充当示例性实施方式3中解码控制器206的作用。逆变换器/逆量化器203以与示例性实施方式3中的逆变换器/逆量化器203相同的方式操作。预测器204基于从错误检测器207供应的预测参数,使用缓冲器205中存储的重建图片的图像来生成预测信号。缓冲器205以与示例性实施方式3中的缓冲器205相同的方式操作。基于上述操作,该示例性实施方式中的视频解码设备生成解码图像。参考图11的流程图,描述该示例性实施方式中的视频解码设备对访问包括将被解码的CU的比特流的访问单元中的错误进行检测的错误检测操作。在步骤S401中,错误检测器207决定CU尺寸、预测模式以及PU划分类型。在步骤S402中,错误检测器207确定将被解码的CU的PU的预测模式。当预测模式为内预测时,过程结束。当预测模式为间预测时,程序转到步骤S403。在步骤S403中,错误检测器207将将被解码的CU的PU尺寸与最小间PU尺寸相比较。当将被解码的CU的PU尺寸大于或等于最小间PU尺寸时,过程结束。当将被解码的CU的PU尺寸小于最小间PU尺寸时,程序转到步骤S404。在步骤S404中,错误检测器207确定存在错误并将该错误通知外部。例如,错误检测器207输出产生错误的将被解码的CU的地址。根据以上操作,错误检测器207检测访问包括将被解码的CU的比特流的访问单元中的错误。每个上述示例性实施方式均能够以硬件或以计算机程序来实现。图12中所示的信息处理系统包括处理器1001、程序存储器1002、用于存储视频数据的存储介质1003以及用于存储比特流的存储介质1004。存储介质1003和存储介质1004可为不同存储介质,或相同存储介质上的存储区域。可使用诸如硬盘等磁介质作为存储介质。在图12中所示的信息处理系统中,用于实现图1、图6和图10中的每个所示出的每个块(除缓冲块之外)的功能的程序存储于程序存储器1002中。处理器1001根据存储于程序存储器1002中的程序执行处理,以实现分别在图1、图6或图10中示出的视频编码设备或视频解码设备的功能。图13为示出根据本发明的视频编码设备的主要部分的框图。如图13中所示,根据本发明的视频解码设备是使用间预测来编码视频的视频编码设备,该设备包括编码控制装置11(图1中作为示例而示出的编码控制器107),所述编码控制装置11用于基于预定最小间PU尺寸(PA)和将被编码的CU的CU尺寸(PB)来控制将被编码的CU的间PU划分类型。图14为示出根据本发明的视频解码设备的主要部分的框图。如图14中所示,根据本发明的视频解码设备是使用间预测来解码视频的视频解码设备,所述设备包括解码控制装置21(图6和图10中作为示例而示出的解码控制器207),所述解码控制装置21用于基于预定最小间PU尺寸(PA)和将被解码的CU的尺寸(PB)来控制将被解码的CU的间PU划分。虽然已参考示例性实施方式和示例对本发明进行了描述,但本发明并不限于上述示例性实施方式和示例。在本发明范围内可对本发明的结构和细节做出可由本领域技术人员所了解的各种改变。本申请要求基于在2011年1月13日提交的日本专利申请第2011-4964号的优先权,其公开内容整体并入本文。参考标号列表11编码控制装置21解码控制装置101变换器/量化器102熵编码器103逆变换器/逆量化器104缓冲器105预测器106复用器107、108编码控制器201解复用器202熵解码器203逆变换器/逆量化器204预测器205缓冲器206解码控制器207错误检测器1001处理器1002程序存储器1003存储介质1004存储介质
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1