一种基于邻近值的HEVC帧内编码优化方法与流程

文档序号:17925955发布日期:2019-06-15 00:24阅读:382来源:国知局
一种基于邻近值的HEVC帧内编码优化方法与流程

本发明涉及图像通信领域中的视频编码技术,最主要的是提升编码性能的问题,涉及高性能视频编码标准hevc帧内编码优化方法。



背景技术:

随着人们对高清视频的需求日渐增加,视频编码标准的性能也在不断提升,相比于之前主流的h.264/avc视频编码标准,最新一代视频编码标准(highefficiencyvideocoding,hevc)已经实现了更高的编码效率和更好的视频质量。在相同的视频质量下,hevc相比h.264/avc提升了50%的编码效率。而hevc之所以能够取得如此好的效果,主要源于其更加灵活的四叉树划分方式、改进的帧内以及帧间预测模式、更好的熵编码等方面。在hevc帧内预测过程中,当像素之间的相关性很高时,这种传统的帧内预测方式能够取得很理想的编码性能,但当预测块比较大或者纹理比较复杂时,如果仍然只是简单利用参考像素来预测待编码像素就会影响预测精度。因此本发明期望通过有效的帧内编码优化方法提高其预测精度,从而达到降低更多码率的目的。

目前学术界关于优化帧内预测方面已有一些研究。x.wang针对人眼对不同区域的注意力不同,提出了一种基于感兴趣区域的自适应帧内更新编码方法,降低了输出码率。y.wang等提出了一种基于马尔科夫模型的帧内预测方法,将35种帧内预测模式按照各个模式的特性分为3类,每一类使用不同的平滑滤波器,该方法相比hevc本身达到了节省码率的目的。y.zheng等提出了一种基于梯度插值的帧内角度预测方法,其梯度由行参考样本和列参考样本生成,并根据预测方向对每个像素进行动态变化,提出的优化方法取得了较好的编码效率。chen等提出了一种基于卷积的帧内迭代滤波方法对预测后的像素进行平滑滤波,实验结果显示该方法相对hevc标准有一定的码率下降,尤其对高清视频效果更加明显。



技术实现要素:

针对高性能视频压缩编码标准hevc码率依旧较高,可以进一步研究降低码率的问题,本发明提出了一种基于邻近值的hevc帧内编码优化方法,在合理的时间复杂度范围内,进一步优化hevc的帧内预测方法。

本发明的基本思想是在时间复杂度可控的前提下,利用i帧相邻点之间的空域相关性去设计滤波器。本发明将当前像素与周围像素的相关性进行有效的数学建模,并且训练出合适的滤波器系数,从而提高整体预测精度,提升了hevc帧内编码性能。

本发明提供的基于邻近值的hevc帧内编码优化方法,该方法主要包括先使用hevc帧内预测生成预测块,再对该预测块中的每一个像素点,使用相应的滤波器对其进行修正,每次滤波则会使用该像素点左边、左上、上边位置的修正值以及该像素本身的预测值。同时,均衡考虑低解码器复杂度和高编码效率两方面因素,本发明将改进的帧内优化技术与chen的方法相结合,从而进一步提高hevc的帧内编码性能。具体主要包括以下过程步骤:

(1)使用传统hevc帧内预测对当前预测块pu(predictionunit)的每一个像素进行预测,生成预测块;

(2)判断预测块pu的大小;

(3)预测块pu小于等于8时,对与步骤(1)中预测块的每一个像素,使用该像素点左边、左上、上边位置的修正值以及该像素本身的预测值进行修正;

(4)预测块pu大于8时,使用卷积核对步骤(1)中生成的预测块进行迭代卷积,而经过迭代卷积后的修正块则作为最后的预测块;

(5)根据率失真代价函数rdcost(rate-distortioncost,rdcost)决策最优的预测方式。

在本发明的上述技术方案中,在步骤(3)中,修正的具体公式为:

其中,u(i,j)为经过hevc帧内预测得到的当前像素,为经过马尔科夫模型修正后的当前像素,为修正后的当前像素的相邻像素,ρ1、ρ2和ρ3为相邻像素对应的权值参数,ρ4为当前像素对应的权值参数,而ε则为偏移量,取值为0.5。

在本发明的上述技术方案中,在步骤(3)中,对于每个像素,均基于上述公式(1)对hevc的预测像素值进行递归地修正,为了使整个滤波过程能够依据帧内预测模式的特性来选择权值参数,我们将35种帧内预测模式分为8类,每一类别中包含的帧内预测模式都具有相似的特性。同时,考虑到色度分量的影响,将第9类滤波器设定为色度模式,如表1。

表1帧内预测模式的分类

在本发明的上述技术方案中,在步骤(3)中,高斯牛顿法的初始值是使用最小二乘法从训练序列中得到的,其可表示为:

其中,a、b、c、d分别表示存储该类别中和u(i,j)的矩阵,o表示存储该类别中o(i,j)的矩阵,而rab则表示a与b的自相关系数。

在本发明的上述技术方案中,在步骤(3)中,使用了高斯牛顿法求解滤波器的权值参数,其相应的公式为:

ρ(s+1)=ρ(s)-(jtj)-1jtr(ρ(s))(3)

其中,公式(3)为高斯牛顿法的迭代公式,ρ(s+1)表示第s+1次迭代后的权值参数,ρ(s)表示第s次迭代后的权值参数,j表示残差函数r对权值参数ρ的雅可比矩阵,即对ρ求其偏导数,如公式(4)所示,r(ρ(s))表示第s次迭代时的残差,如公式(5)所示。

在本发明的上述技术方案中,在步骤(3)中,使用的训练序列如表2。

表2训练序列

在本发明的上述技术方案中,在步骤(4)中,pu大小从4×4到32×32的迭代次数分为为3、5、10、25,卷积核为:

在本发明的上述技术方案中,在步骤(5)中,经过rdcost决策后最优预测方式,会有一个标志位flag,若flag等于1,则说明进行传统的hevc帧内编码后,还需要使用本发明的优化方法去修正。

根据本发明的上述方法可以编制执行上述一种基于邻近值的hevc帧内编码优化方法的hevc视频编码器。

本发明是基于以下思路分析而完成的:

首先,将35种帧内预测模式分为8类,每一类别中包含的帧内预测模式都具有相似的特性。同时,考虑到色度分量的影响,将第9类滤波器设定为色度模式。其次,使用四种量化参数(qp=22,27,32,37)对4个训练序列的前5帧进行hevc帧内编码,并根据滤波器的分类将每个类别中的像素值分别存储。然后,使用简单的最小二乘法计算出初始权值系数,将其应用到高斯牛顿法进行一次次的迭代估计,直至得到最佳系数,将最佳权值参数应用到hevc帧内编码框架中。

在编码端,其先使用hevc帧内预测生成预测块,再对该预测块中的每一个像素点,使用相应的滤波器对其进行修正。该方法使用基于邻近值的帧内编码优化方法进行4×4和8×8块大小的修正,而当帧内预测块的大小为16×16或32×32时,则使用chen的帧内迭代滤波方法去修正。当应用整个优化方法时,对于每个cu层需要多1个标志位flag,以表明进行传统的hevc帧内预测后,是否需要使用帧内编码优化方法去修正,将该标志位写入码流一起传输到解码端。

在解码端,首先从码流中判断出标志位flag的值,若flag为0,则只需要进行传统的hevc帧内编码即可,若flag为1,则在传统的hevc帧内编码后,我们还需要根据预测块的大小选择不同的优化方法进行修正。

与标准的hevc视频编码方法相比,本发明针对hevc的帧内编码提出的一种基于邻近值的帧内编码优化方法,能有效降低码率。该方法在hevc帧内预测过程中,对于当前像素,先根据传统hevc帧内编码方法得到其预测值,再使用相应的滤波器对该预测值进行修正。本发明方法将当前像素与周围像素的相关性进行了有效的数学建模,并且训练出合适的滤波器系数,提升了hevc帧内编码性能。

附图说明

图1为本发明的基于邻近值的hevc帧内编码优化方法的流程图。

图2为本发明使用滤波器修正单个像素的图示,u(i,j)为经过hevc帧内预测得到的当前像素,为经过马尔科夫模型修正后当前像素,为经过马尔科夫模型修正后的当前像素的相邻像素,ρ1、ρ2和ρ3为相邻像素对应的权值参数,ρ4为当前像素对应的权值参数。

图3为本发明方法pu块中所有像素值进行递归修正的图示,深色框为参考像素,浅色框中为已预测像素。

具体实施方式

下面结合实施例对本发明作进一步的详细说明,有必要指出的是,以下的实施例只用于对本发明做进一步的说明,不能理解为对本发明保护范围的限制,所属领域技术熟悉人员根据上述发明内容,对本发明做出一些非本质的改进和调整进行具体实施,应仍属于本发明的保护范围。

本发明所提出的一种基于邻近值的hevc帧内编码优化方法,与hevc标准参考代码hm16.9的帧内编码方法比较过程如下:

1、打开标准hm16.9参考代码,配置文件为encoder_intra_main.cfg。在量化参数qp为22,27,32,37的情况下对标准视频测试序列进行编解码,记录标准hevc视频编码时的码率及峰值信噪比psnr;

2、这里我们定义变量bd-rate(deltarate),bd-rate表示本发明方法相比hevc帧内编码方法在相同psnr下比特率变化的百分比;

3、编码的对象为标准的hevc测试视频,它们的名称和分辨率分别为:traffic(2560×1600)、peopleonstreet(2560×1600)、kimono1(1920×1080)、cactus(1920×1080)、parkscene(1920×1080)、basketballdrive(1920×1080)、bqterrace(1920×1080)、fourpeople(1280×720)、johnny(1280×720)、kristenandsara(1280×720)、basketballdrill(832×480)、bqmall(832×480)、partyscene(832×480)、racehorsec(832×480)、basketballpass(416×240)、bqsquare(416×240)、blowingbubbles(416×240)、racehorse(416×240);

4、输入2个相同的视频序列;

5、分别对2个相同的视频序列进行视频编码;

6、利用hm16.9标准方法对视频序列在hevc方式下进行视频编码;

7、利用本发明方法对视频序列在hevc方式下进行视频编码;

8、结果如表3所示,分别对分辨率从2560×1600大小到416×240大小的共18个视频序列进行实验,来比较hm16.9标准和优化后的编码方法的相关参数。在时间复杂度可控的情况下,本发明在亮度分量y、色度分量u和v分量的平均增益分别为1.3%、1.4%和1.4%(bd-rate),其中y分量的最大增益达到了2.7%,说明本发明方法起到了很好的效果。

表3本发明方法与标准hm16.9对比的实验结果

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1