基于分区基础的自适应环路滤波方法和装置与流程

文档序号:12730711阅读:243来源:国知局
基于分区基础的自适应环路滤波方法和装置与流程

本申请要求下述申请的优先权:2010年10月5日递交的,发明名称为“改进的自适应环路滤波器”的美国临时申请案No.61/390,068;2010年12月10日递交的,发明名称为“自适应环路滤波器的率失真复杂度优化方法”的美国临时申请案No.61/421,729;2011年7月6日递交的,发明名称为“基于分区基础的自适应环路滤波方法和装置”的美国申请案No.13/177,343;2011年3月21日递交的,发明名称为“基于分区基础的自适应环路滤波器”的美国临时申请案No.61/454,829。本发明还与2011年4月25日递交的,发明名称为“自适应环路滤波方法和装置”美国专利申请案No.13/093,068有关;2011年6月12日递交的,发明名称为“用于视频编码的示范适应偏移方法和装置”美国专利申请案No.13/158,427有关;与2011年1月3日递交的,发明名称为“联发科自适应环路滤波装置”的美国临时申请案No.61/429,313有关。本申请将上述美国临时申请案及专利申请案作为参考。

技术领域

本发明有关于视频编码(video coding),且尤其有关于与自适应环路滤波(Adaptive Loop Filtering)有关的编码技术。



背景技术:

运动补偿(motion compensation)帧间编码(inter-frame coding)已在多种编码标准中广泛应用,如MPEG-1/2/4以及H.261/H.263/H.264/AVC。上述编码系统中的运动估计、运动补偿和后续处理都是基于块(block basis)进行的。在压缩进程中,由于采用了如量化(quantization)的有损操作(lossy operation),可能会出现编码噪声(coding noise)。在重建(reconstructed)视频数据中,特别是在块边缘或边缘附近,会有明显的编码伪影(coding artifact)。为了减小编码伪影的明显性,更新的编码系统例如H.264/AVC以及高性能视频编码(High Efficiency Video Coding,HEVC)开始采用一种被称为解块(deblock)的技术。解块进程在块边缘进行自适应地应用滤波,以平滑编码噪声带来的边缘或边缘附近的突变,并维持图像的清晰度。此外,根据帧间编码的特性,解块进程可被整合到环路内进行操作。在最近的HEVC开发中,采用自适应环路滤波来处理解块后的重建帧。自适应环路滤波常被用于作进一步环路处理且经常在解块重建视频数据后使用。

传统自适应环路滤波器(Adaptive Loop Filter,ALF)仅被应用于滤波能提高性能的块。对于那些使用自适应环路滤波并不能帮助提高性能的块,一般不进行自适应环路滤波。当应用ALF,一单个滤波器(single filter,SF)被应用于一片(slice)内的块。该单个滤波器是从一组候选滤波器中选择出来以达到最佳的性能,如最小失真、最小率或者R-D(Rate-distortion)性能。这样的ALF方案被称为单自适应滤波器方案(SF ALF)。另一种ALF方案被称为QC_ALF方案,是由高通公司(Qualcomm)提出(于2010年4月15-23日,在德国德累斯顿(Dresden)举行的关于视频编码的联合协作小组(JCT-VC)的ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的第一次会议上,Karczewicz等人的题为:“高通公司关于视频编码的建议书”中提出,记载于文档:JCTVC-A121)。依据该QC_ALF,该ALF滤波器基于块基础应用于一块上的解块视频数据。对应每一块,计算该块中的每一像素(i,j)的改进拉普拉斯算子(i,j)(Sum-modified Laplacian Measure(i,j),SLM(i,j))。该块上的每一像素依据该SLM值被分类至该多个级别或者类别中。虽然该QC_ALF方案的性能会优于该SF ALF的性能,但是每一像素该SLM的计算两及从一个像素至另一像素的滤波器的转换将导致更高的计算复杂度及消耗更多的效能。因此,需要发展以能提供每一分区具有多个滤波器选择的优点同时没有高度的计算复杂性和像素之间滤波器转换的ALF方案。

在区域划分及模式决定的ALF设计中,一名为率失真优化(rate-distortion optimization,RDO))的优化技术经常被用于区域划分及模式决定中。虽然该RDO技术能够实现最佳的率失真表现,但是它并没有考虑到系统复杂性,这将消耗有价值的系统资源。因此,需要使用一种新的优化方案在这三者中(率、失真及复杂度)达到最佳化。因此,一种率失真复杂性优化(rate-distortion-complexity optimization,RDCO)技术被使用在ALF设计中。该RDCO技术也被应用在SAO设计中以实现最佳的率失真复杂性的性能。



技术实现要素:

本发明揭露了采用自适应环路滤波处理编码视频的方法和装置。在本发明的一实施例中,采用自适应环路滤波处理编码视频的方法及装置包括从一处理单元接收与编码视频数据相对应的一重建视频数据;对该重建视频数据应用自适应滤波以产生滤波视频数据;提供该滤波视频数据。该自适应滤波的操作可以为依据分区适应标识选择基于分区的ALF或者非基于分区的ALF。若已选择该基于分区的ALF,该重建视频数据被划分成MxN个分区,其中M和N为整数。该MxN个分区的分区可以基于1-D或者2-D表示法进行合并。进一步,一合并标识用于表示一分区是否与一个或者多个相邻分区合并。当使用1-D表示法,依据一扫描图形为该MxN个分区中的每一个指定一分组索引。该扫描图形可以从一组扫描图形中进行选择,该组扫描图形包括变形希尔伯特曲线、水平蛇扫描、垂直蛇扫描、Z型蛇扫描、螺旋扫描、四分树扫描及栅格扫描。依据本发明的另一实施例,该MxN个分区中的任意两个分区之间的每一分区的边界为一最大编码单元的边界或者是多个最大编码单元的边界。还依据本发明另一实施例,使用一合并标识表示该分区是否被允许合并。

本发明揭露一自适应滤波器或者范例性适应偏移滤波器的设计方法及装置。依据本发明的一实施例,该自适应滤波器或者范例性适应偏移滤波器的设计方法及装置包括如下步骤:为自适应滤波器或者范例性适应偏移滤波器决定与设计特征相关的候选项;及依据RDCO从该多个该候选项中选择一最佳的候选项。该设计特征可能与模式决定或分区划分有关。对于该ALF设计,该RDCO的复杂性与用于ALF设计的滤波器的参数数量、被滤波像素的数量、滤波器的参数数量和被滤波像素的数量的组合有关,或者还与滤波器参数的数量、将被滤波像素的数量及为ALF设计进行的模式选择的候选模式的操作的数量的组合有关。对于SAO设计,该RDCO的复杂性像素分类方法类型的操作数量有关,或者与像素分类方法类型的操作数量及具有一偏移值的将被补偿的像素数量的组合有关。

附图说明

图1揭露基于运动补偿预测的视频编码系统的示范性方块示意图,其中自适应环路滤波器被应用于重建视频数据。

图2揭露基于像素的自适应滤波器的范例,其中SLM被用于将一6×4块的像素划分至三个类别。

图3揭露将包含416×240个像素的图片划分至4×4最大编码单元(Largest Coding Unit,LCU)对齐分区的范例,其中每一正方形为包含64×64个像素的一LCU且一非最右边和非底部分区包含2×1个LCU。

图4揭露支持带有标识的基于分区的ALF的语法设计,该分区自适应标识指示是否使用基于分区的ALF。

图5揭露依据变形希尔伯特曲线(deformed Hilbert curve)通过4×4分区的扫描顺序。

图6揭露依据水平蛇扫描(horizontal snake scan)通过4×4分区的扫描顺序。

图7揭露依据垂直蛇扫描(vertical snake scan)通过4×4分区的扫描顺序。

图8揭露依据Z型蛇扫描(zig-zag scan)通过4×4分区的扫描顺序。

图9揭露依据螺旋扫描(spiral scan)通过4×4分区的扫描顺序。

图10揭露依据四分树扫描(quad-tree scan)通过4×4分区的扫描顺序。

图11揭露依据栅格扫描(raster scan)通过4×4分区的扫描顺序。

图12揭露一拆分分区的范例,其中一分区被拆分成5个分区,如:F0,F1,F2,F3及一无滤波器分区。

图13揭露一将5个将被滤波分区(to-be-filtered regions)合并成3个分区的范例,该3个分别为F0’、F1’及一无滤波器分区。

图14揭露一支持2-D分区合并的语法设计。

具体实施方式

对于数字视频压缩来说,运动补偿帧间编码是一种有效的压缩技术,已广泛地用于多种编码标准中,如MPEG-1/2/4和H.261/H.263/H.264/AVC。在运动补偿系统中,运动估计/补偿和后续压缩通常基于块在块中进行。在压缩进程中,由于采用了如量化的有损操作,可能会出现编码噪声。在重建视频数据中,特别是在块边缘或边缘附近,会有明显的编码伪影。为了减小编码伪影的明显性,更新的编码系统例如上述系统中的H.264/AVC以及HEVC系统开始采用一种被称为解块的技术,。解块进程在块边缘进行自适应地应用滤波,以平滑编码噪声带来的边缘或边缘附近的突变,并维持图像的清晰度。此外,根据帧间编码的特性,解块进程可被整合到环路内进行操作。

在HEVC系统中,除了解块滤波器以外,还使用另一被称为自适应环路滤波器(ALF)的环路滤波器。解块滤波器只应用与块边界,而自适应滤波器则可以应用至一帧(frame)、一域(field)、一片(slice)或者一图片区域内的所有像素。传统的ALF只应用于使用滤波器能够提高性能的块。对于那些使用ALF并不能提高性能的块则不使用ALF。当ALF被使用,一单个滤波器SF被应用于一片内的块中。该单个滤波器是从一组候选滤波器中选择出来以达到最佳的性能,如最小失真、最小率或者R-D性能。这样的ALF方案被称为单自适应滤波器方案(SF ALF)。于该被选滤波器相关的信息被传输至解码器。为了节省该将被传输或者存储的信息,该组ALF滤波器可以被预先定义,且该滤波器选择可以使用一索引表示。作为替代的,该过滤器可以在基于已重建视频数据的时间延迟安排中得到。因此,无需附加信息(side information)或者只需很少的附加信息。此外,能减少被使用的滤波器的相关信息的工具也可以被采用,如:利用熵编码编码该滤波器系数和或者传输该系数的差值。

图1揭示了一使用自适应环路滤波及解块的编码系统的系统方块图。图1揭露了具有解块功能的基于运动补偿预测的视频编码器的系统方块。压缩系统100显示了典型的视频编码器与帧内/帧间(intra/inter-prediction)预测、变换/量化(transformation/quantization)和熵编码(entropy coding)进行结合,以产生压缩视频数据。输入视频数据(即原始信号112)通过输入接口进入编码器,且该原始信号112由帧内/帧间预测模块110进行处理。在帧内预测模式,该输入的数据使用同一帧或者同一域内已编码的图像进行预测。在帧间预测模式,该预测可以基于在时序上的先前的重建数据142,其中,该重建数据142被存储在参考图像缓冲器140中。该帧间预测可以是一列表0预测模式,其中,该预测是基于解码顺序在当前图像之前且在参考图像的第一列表中的图像。该帧间预测也可以是一列表1预测模式,如果该当前片(current slice)为一B-片(B-slice),该帧间预测是基于解码顺序在当前图像之前且在参考图像的第二列表中的图像。该帧间预测也可以是双向预测(bi-prediction)模式,如果当前片为B-片,该帧间预测是基于列表0参考图像和列表1参考图像。在该帧间预测模式中,该帧内/帧间预测模块110将该预测数据提供至加法器115,且从该原始信号112中减去该预测数据。该加法器115的输出被称为预测误差117,变换/量化模块120进一步对该预测误差117进行变换/量化处理。该变换/量化模块120将该预测误差117转换为编码符号,由熵编码模块130进一步处理以产生压缩输出比特流132(即压缩比特流)用于存储或者传输。逆变换/量化(inverse DCT and inverse quantization,可表示为IDCT/IQ)模块160处理由该变换/量化模块120提供之预测误差117以形成重建预测误差(reconstructed prediction error)162。在该帧间预测模式,重建预测误差162与重建视频数据119结合以形成该当前重建帧152。在该帧内预测模式,该重建预测误差162与同一图像内的先前重建周边数据叠加。在该帧间预测模式中,该帧内/帧间预测模块110传输该预测信号119至重建模块150,其中,该重建数据119是依据时序上的先前重建帧或者依据同一图像中的先前重建周边数据取决于是帧间预测模式还是帧内预测模式。

该重建数据由解块模块170及ALF180处理后存储在参考图像缓冲器140中作为处理随后图像的参考视频数据。HEVC中的原始ALF是基于块的应用。若该ALF能提高性能(更低失真、更低的比特率、更好的R-D性能),则该块开启ALF。否则,该块关闭ALF。一种ALF规格被称为QC_ALF方案,是由高通公司(Qualcomm)提出(于2010年4月15-23日,在德国德累斯顿(Dresden)举行的关于视频编码的联合协作小组(JCT-VC)的ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的第一次会议上,Karczewicz等人的题为:“高通公司关于视频编码的建议书”中提出,记载于文档:JCTVC-A121)。依据该QC_ALF,该ALF被应用至解块视频数据基于像素基础。对应每一块,计算该块中的每一像素(i,j)的改进拉普拉斯算子(i,j)(Sum-modified Laplacian Measure(i,j),SLM(i,j))如下:

其中,该R(i,j)为解块视频数据。计算该SLM基于以(i,j)为中心的(2K+1)x(2L+1)邻近窗口。该邻近窗口尺寸可以为9x9,7x7,5x5or 3x3。为了减少复杂性,使用尺寸为3x3的邻近窗口。计算该块的每一像素的SLM,以将该像素归类至M个组中的其中一个。请参见图2,其揭露了依据该SLM值将该像素归类至三个组中。该QC_ALF方案中,依据每一组选择一滤波器对该组相关的像素进行滤波。为了减少计算复杂性,该ALF滤波器通常是水平或者垂直对称的。举例来说,使用如9x9,7x7,or 5x5这样的钻石型滤波器,或者如5x5、3x3这样的方形滤波器。基于SLM的ALF应用于每一像素,且不同的像素将应用不同的滤波器。因此QC_ALF同样被称为像素-自适应(pixel-adaptive或pixel-adaptation,PA)ALF。前面提到的SF ALF可以被认为是一种特殊的PA ALF,其只采用一组滤波器。

虽然PA ALF能自适应的基于像素选择一滤波器,但是其仍需要由解码器计算SLM来获得每一像素的群组信息,因为需求附加信息(side information)为已编码的重要信息。因此,需要发展一种ALF方案可以实现更好的性能且或者降低计算复杂性。因此,本发明揭露一种分区基础(region based)的ALF规格。依据本发明之ALF方案,应用该ALF至该解块视频数据基于分区基础。划分一图片或者图像区域为多个固定块或者以固定块组形成多个分区。作为替换的,可以将一图像或者图像区域进行分割或递归地分割形成多个分区。举例来说,可以递归地使用四分树来划分一图片或者图像区域以形成该多个分区。可在语法中设置一标识用于指示是否采用分区基础ALF或者非分区基础ALF。举例来说,一个标识用于在分区基础ALF和块基础(block based)ALF之间进行选择。块基础滤波器的推导可以使用像素基础ALF相似的方法。举例来说,Chong等人描述了一块基础ALF的方法,将4×4块中所有像素的拉普拉斯算子算得之活性值之平均值作为该4x4块的单一活动指标。于2011年3月16-23日,在瑞士日内瓦(Geneva)举行的关于视频编码的联合协作小组(JCT-VC)的ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的第五次会议上,Chong等人的题为:“CE8议题2:基于自适应环路滤波器(ALF)的块”中提出,记载于文档:JCTVC-E323。该方法需要计算该4×4块每一像素的拉普拉斯算子的活性值。相较于像素基础ALF,虽然该方法并无节省运算量,但块基础ALF可降低像素基础ALF的切换不同滤波器的频率。也可以使用其他测量方式来取代拉普拉斯算子的活性值作为分类标准,,如:带偏移(band offset,BO)或者边缘偏移(edge offset,EO)作为分类标准用于示范性自适应偏移(sample adaptive offset,SAO),也可以使用Karczewicz等人公开的SLM计算法来替代。BO和EO相对于SLM来说,需要更少的计算量。

一使用块组的基于分区基础的ALF的范例,一图像可以被分割成16个大小基本相等的分区。举例来说,一非最右边分区的分区宽度可以为(PicWidth/4),其中PicWidth为图像宽度。对于最右边分区,该分区宽度则为(PicWidth–(PicWidth/4)*3)。非最底部分区的高度则为(PicHeight/4),其中PicHeight为图像高度。对于最底部分区的高度则为(PicHeight–(PicHeight/4)*3)。在这个范例中,该最右边分区及最底部分区可能大于其他分区。另一个范例,如图3所示,将一图像分割成16个大小基本相等基于LCU对齐(LCU--aligned)的分区。其中,该分区的边界则必定为最大编码单元(LCU)的边界。该图像的大小为416x240,且包含7x4个LCU,其中,每一个LCU包含64x64个像素。该非最右边分区的分区宽度为(((PicWidthInLCUs+1)/4)*64),其中PicWidthInLCUs表示图像宽的LCU数量。非底部分区的高度为(((PicHeightInLCUs+1)/4)*64),其中,PicHeightInLCUs表示图像高的LCU数量。该最右分区及最底部分区的大小可以由图像宽度(PicWidth)、图像高度(PicHeight)、非最右分区及非底部分区的大小推导得出。一索引被分配给每一4x4分区。使用4x4分区作为一范例,本发明并不限于该4x4分区的例子。实际上,本发明可以使用MxN分区。其中,M和N为整数。一图像其图像宽度为PicWidthInSamples及图像高度为PicHeightInSamples。则每一分区其左上角的分区指数的坐标为(x,y)的分区索引可以如下推导得知。(1<<Log2MaxCUSize)为最大编码单元的大小,且xMaxIndex及yMaxIndex为在水平及垂直方向的最大分区索引。对应的,分区的水平间隔x_interval及分区间的垂直间隔y_interval可以由下述公式推导得知。

x_interval=((((PicWidthInSamples+(1<<Log2MaxCUSize)–1)>>Log2MaxCUSize)+x_round)/(xMaxIndex+1)),和 (1)

y_interval=((((PicHeightInSamples+(1<<Log2MaxCUSize)–1)>>Log2MaxCUSize)+y_round)/(yMaxIndex+1)), (2)

其中x_round=max(0,(xMaxIndex+1)/2–1)and y_round=max(0,(yMaxIndex+1)/2–1).

该水平索引x_idx和该垂直索引y_idx可以被推导如下:

x_idx=min(xMaxIndex,x/(x_interval<<Log2MaxCUSize)),和 (3)

y_idx=min(yMaxIndex,y/(y_interval<<Log2MaxCUSize)) (4)

该分区索引region_idx依据以下公式被决定:

region_idx=y_idx*(xMaxIndex+1)+x_idx. (5)

当该4x4分区被基于分区的ALF所使用,该分区索引可以被推导如下。该分区的水平间隔x_interval及分区间的垂直间隔y_interval可以由下述公式推导得知:

x_interval=((((PicWidthInSamples+(1<<Log2MaxCUSize)–1)>>Log2MaxCUSize)+1)>>2),和 (6)

y_interval=((((PicHeightInSamples+(1<<Log2MaxCUSize)–1)>>Log2MaxCUSize)+1)>>2). (7)

该水平索引x_idx和该垂直索引y_idx可以被推导如下:

x_idx=min(3,x/(x_interval<<Log2MaxCUSize)),和 (8)

y_idx=min(3,y/(y_interval<<Log2MaxCUSize)). (9)

该分区索引region_idx依据以下公式被决定:

region_idx=(y_idx<<2)+x_idx. (10)

该滤波器索引filter_idx(x,y)依据以下公式被决定:

filter_idx(x,y)=region_tab[region_idx], (11)

其中,region_tab[16]={0,1,4,5,15,2,3,6,14,1,10,7,13,12,9,8}.

两相邻分区,如具有连续索引的分区可以被合并。当分区合并后,每一合并后的分区应用一滤波器。该图像可以使用基于像素的ALF、基于块的ALF或者基于分区的ALF进行处理。相较于基于像素的ALF和基于块的ALF,基于分区的ALF可以节省自适应像素进行的基于像素的分类计算及基于自适应块进行的基于块的计算,相应的,当使用基于分区的ALF,解码器的平均计算量也相应减少。更进一步,基于分区的ALF显着的减少了图像中滤波器的转换次数,因此转换耗能更少。图4揭露支持在基于分区的ALF和基于像素的ALF之间进行选择,或者在基于分区的ALF和基于块的ALF之间进行选择的语法设计。唯一的语法改变为在ALF的片头参数装置alf_param()中增加一标识(region_adaptation_flag)或者在图像参数装置(PPS)以在基于分区的ALF和基于块的ALF之间进行选择。

进行分区合并可以进一步提高编码效能。相邻分区可能具有相似的特征且能分享同一滤波器以减少指示ALF滤波器所需信息。一种执行分区合并的方法是的将2-D区域并至1-D区域。举例来说,将该4x4分区可以被转换成使用分组索引0-15的1-D分区。执行将该2-D转换成1-D可以依据一特殊的扫描模式。有许多已知的扫描模式可以被用于将2-D分区转换成1-D分区。如图5所示的变形希尔伯特曲线(deformed Hilbert curve),图6所示的水平蛇扫描(horizontal snake scan),图7所示的垂直蛇扫描(vertical snake scan),图8所示的Z型蛇扫描(zig-zag scan),图9所示的螺旋扫描(spiral scan),图10所示的四分树扫描(quad-tree scan)及图11所示的栅格扫描(raster scan)。在转换该2-D分区至该1-D分区时,相邻的分区,如合并表示法所指示的具有连续索引的分区可以被合并以分享同一滤波器。举例来说,使用一合并标识一标示组索引为n的分区是否与组索引为(n-1)的分区合并。

也可以使用2-D合并表示法执行分区合并,其中一分区可以与一附近的分区合并。进一步,首先,使用一第一标识以标示该分区是否被合并,若该第一标识指示该分区已被合并,则一合并候选标识将会被使用。在某种情况下,附近的部分分区不能被作为合并候选。如,在图像或者在4x4边界上的一分区不能具有合并候选资格。因此,该合并候选标识可以基于相邻分区的可用性作自适应性的变化。举例来说,该合并候选分区可以为一左侧或者上部分区,且使用一1比特的标识作为合并候选标识。然而,如果左侧和上部分区没有同时存在,则该合并候选标识可以被省略。因此,该合并候选标识可基于该相邻分区的可用性自适应性的变化。当一些相邻分区是无效的,该合并候选标识则表现为更小的比特。该分区合并自适应应用于每一4x4分区组。使用一分区合并使能标识(enable flag)标示该4x4分区是否允许分区合并。

用于ALF滤波的分区也可以被认为是一滤波单元(filter unit,FU)。若分割能实现更好的性能,则一图像或者图像区域可以被递归的划分成更小的滤波单元,如更低的率失真(rate-distortion,R-D)成本。可以计算一将被滤波分区的该R-D成本和计算分割成的分区的该R-D成本。如果分割可以实现低R-D成本,则该将被滤波分区将被分割。否则不分割该分区。作为替代的,一图像或者图像区域也可以首先被分割成更小的分区。相邻分区可以被合并如果合并能实现更好的性能,如更低的R-D成本。如果合并后的分区的R-D成本低于独立分区的R-D成本,则该分区进行合并,否则不合并。依据本发明的实施例,可以合并几个将被滤波分区形成一滤波单元以减少滤波器信息的比特率。

请参阅图12,为一分区分割的范例。一分区(滤波单元FU1210)被分割成5个分区(FUs1220),如F0,F1,F2,F3和无滤波分区。可以依据低R-D成本进行该分区的分割。图13为本发明进行分区合并的范例。依据低R-D成本该将被滤波分区1310被考虑进行合并成3个分区1320,分别为F0’、F1’及一无滤波器分区。分区F0和F2合并成F0’,分区F1和F3合并成F1’。

图14揭露支持2-D分区合并的语法设计的范例。分区合并alf_fs_selection_param(r,c)函数描述分区合并的讯息。该ALF合并标识(alf_merge_flag)表示该当前分区(如本实施例中的FU)是否已与其他分区合并。其中值1表示该当前分区已合并,值0标志该当前分区未与左侧或者上部分区合并。该当前分区不被合并时则加入一该当前分区的滤波器设置索引(alf_fu_filter_set_idx)。该图像的第一分区一般滤波器索引预设为0,且无需传送给解码器端。该语法元素alf_merge_up_flag表示该分区是否与其顶部方向的分区合并,其中值0表示当前分区与左侧的FU合并,值1表示当前分区与其上方的分区合并。

本发明的另一方面涉及一ALF滤波器的设计。率失真优化(Rate-distortion optimization,RDO)应用于视频编码以获得好的编码效率被广泛所知。RDO应用在模式选择:宏块或者自宏块或者编码单元、帧间预测、运动预测、自适应滤波器选择(如滤波器大小、滤波器形状、开启/关闭等)、SAO选择(如选择不同的像素分类方法)。最好的RDO选择是最小化一率失真成本函数(rate-distortion cost function)J=D+λR,其中D为原始像素与重建(或者预测)像素之间的预测失真(estimated distortion),R为传输该附加信息所需的预测率(estimated rate),λ为拉格朗日乘子(Lagrange multiplier)。

率失真复杂性优化(rate-distortion-complexity optimization,RDCO)技术用于视频编码以在视频效率与编码复杂度中获得好的平衡也被广泛所知。RDCO应用在模式选择:宏块或者自宏块或者编码单元、帧间预测、运动预测。最佳的RDCO选择是最小化一率失真复杂性成本函数J=D+λ1R+λ2C,其中D为原始像素与重建(或者预测)像素之间的预测失真,R为传输该附加信息所需的预测率,C为编码或者解码所需的预测复杂性(依据时钟周期、记忆体存取或者其他复杂性评价标准),λ1和λ2为拉格朗日乘子。

本发明的一实施例涉及与RDCO配合的ALF/SAO设计。其中,依据RDCO决定与一设计特征相关的最佳候选项。该设计特征可一是模式决定或者分区划分。在不同的ALF模式中进行模式选择可以取决于片的类型如I/B/P-片或者帧间/帧内编码单元的比例。本发明另一实施例为依据RDCO进行ALF滤波器选择。当RDCO被应用于ALF滤波器的选择,RDCO中的复杂性与滤波器参数的数量有关。作为替代的,该RDCO可以用于ALF滤波器的选择,该RDCO的复杂性(C)与滤波器参数的数量(A)及将被滤波的像素数量(B)有关,如C=A*B。依据本发明的另一实施例,该RDCO可以用于ALF滤波器的选择,该RDCO的复杂性(C)与滤波器参数的数量(A)、将被滤波的像素数量(B)及一模式中所需操作(TableOfNumOperations[Mode])的数量有关,如:C=A*B*TableOfNumOperations[Mode]。

2011年6月12日递交的,发明名称为“用于视频编码的示范适应偏移方法和装置”美国专利申请案No.13/158,427揭露了一种SAO方案,该方案中使用多个像素分类标准类型对每一像素进行分类,且每一分类类型将该像素分类至多个类别中。依据该像素分类类型及该像素的种类,决定以偏移值以补偿该偏移。该SAO方案使用带偏移(band offset,BO)环境或者边偏移(edge offset,EO)分类像素至类别中。不同的像素分类类型的复杂性不同。因此,RDCO技术可以被用于SAO作出选择一像素分类类型的决定以实现最佳的RDCO性能。美国申请案No.13/177,343另一方面揭示了分区分割。该RDCO技术也可以被用于SAO以决定分区分割,RDCO成本与将被处理的像素数量及该模式所需的操作数量(TableOfNumOperations[Mode])相关,如:选择的像素分类的类型。

上述自适应滤波器可以被应用在视频编码器及/或视频解码器中。在该视频编码或者视频解码器中,该重建视频数据受编码噪声的影响。上述自适应滤波器方案能帮助提高重建视频的视觉质量。上述根据本发明的实施例具有先进ALF的编码系统可通过多种硬件、软件码或上述结合实现。举例来说,本发明的一实施例可为电路集成到视频压缩芯片,或者程序码集成到视频压缩系统,以进行相应处理。本发明的一实施例也可为程序码在数字信号处理器(Digital Signal Processor,DSP)上执行以进行相应处理。本发明还可包含一系列功能,并由电脑处理器、数字信号处理器、微处理器、现场可编程门阵列(Field Programmable Gate Array,FPGA)执行。通过执行定义本发明实施例的机器可读软件码或韧件码,上述处理器可根据本发明执行特定任务。软件码或韧件码可在不同程序语言和不同格式或方式中进行。软件码可编译成不同的目标平台。不过,不同的编码格式、方式和软件码语言,以及与本发明有关的使码执行任务的其它方法均符合本发明的精神,落入本发明的保护范围。

虽然本发明已就较佳实施例揭露如上,然其并非用以限制本发明。本发明所属技术领域中普通技术人员,在不脱离本发明的精神和范围内,当可作各种的变更和润饰。因此,本发明的保护范围当视之前的权利要求书所界定为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1