视频图像分量的预测方法、装置及计算机存储介质与流程

文档序号:25731032发布日期:2021-07-02 21:19阅读:105来源:国知局
视频图像分量的预测方法、装置及计算机存储介质与流程

本申请是基于申请日为2018年08月09日的pct国际专利申请pct/cn2018/099684进入中国国家阶段的中国专利申请号201880096258.2、发明名称为“视频图像分量的预测方法、装置及计算机存储介质”的中国专利申请提出的,在该中国专利申请记载的范围内提出分案,该中国专利申请的全部内容再次引入本申请作为参考。

本申请实施例涉及视频编解码的技术领域,尤其涉及一种视频图像分量的预测方法、装置及计算机存储介质。



背景技术:

随着人们对视频显示质量要求的提高,高清和超高清视频等新视频应用形式应运而生。在这种高分辨率高质量视频欣赏应用越来越广泛的情况下,对视频压缩技术的要求也越来越高。h.265/高效率视频编码(highefficiencyvideocoding,hevc)是目前最新的国际视频压缩标准,h.265/hevc的压缩性能比前一代视频编码标准h.264/先进视频编码(advancedvideocoding,avc)提高约50%,但仍然满足不了视频应用迅速发展的需求,尤其是超高清、虚拟现实(virtualreality,vr)等新视频应用。

itu-t的视频编码专家组和iso/iec的运动图像专家组于2015年成立联合视频研究组(jointvideoexplorationteam,jvet)着手制定下一代的视频编码标准。联合探索测试模型(jointexplorationtestmodel,jem)为通用的参考软件平台,不同编码工具基于此平台验证。2018年4月,jvet正式命名下一代视频编码标准为多功能视频编码(versatilevideocoding,vvc),其相应的测试模型为vtm。在jem和vtm参考软件中,已经集成了一种基于线性模型的预测方法,色度分量可以通过线性模型由亮度分量得到预测值。然而现有技术中,在计算线性模型的模型参数时,只考虑了相邻参考亮度值和相邻参考色度值,导致计算得到的线性模型具有偏差,使得利用线性模型所得到的色度预测值准确度较低。



技术实现要素:

为解决上述技术问题,本申请实施例期望提供一种视频图像分量的预测方法、装置及计算机存储介质,可以提高视频图像分量的预测准确度,进而节省了编码码率。

本申请实施例的技术方案可以如下实现:

第一方面,本申请实施例提供了一种视频图像分量的预测方法,所述方法包括:

根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;

根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;

根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;

根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;

根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值。

第二方面,本申请实施例提供了一种视频图像分量的预测装置,其中,所述视频图像分量的预测装置包括:网络接口,存储器和处理器;

所述网络接口,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;

所述存储器,用于存储能够在所述处理器上运行的计算机程序;

所述处理器,用于在运行所述计算机程序时,执行第一方面所述的方法的步骤。

第三方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质存储有视频图像分量的预测程序,所述视频图像分量的预测程序被至少一个处理器执行时实现第一方面所述的方法的步骤。

本申请实施例提供了一种视频图像分量的预测方法、装置及计算机存储介质,根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值;从而可以提高视频图像分量的预测准确度,进而节省了编码码率。

附图说明

图1a至图1c为相关技术方案的视频图像采样格式的结构示意图;

图2a和图2b为相关技术方案的当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值的采样示意图;

图3a至图3c为相关技术方案的cclm计算模型的原理结构示意图;

图4为本申请实施例提供的一种视频编码系统的组成框图示意图;

图5为本申请实施例提供的一种视频解码系统的组成框图示意图;

图6为本申请实施例提供的一种视频图像分量的预测方法流程示意图;

图7为本申请实施例提供的一种当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值的分组示意图;

图8为相关技术方案的计算模型与本申请实施例提供的计算模型对比示意图;

图9为本申请实施例提供的一种视频图像分量的预测装置的组成结构示意图;

图10为本申请实施例提供的另一种视频图像分量的预测装置的组成结构示意图;

图11为本申请实施例提供的又一种视频图像分量的预测装置的组成结构示意图;

图12为本申请实施例提供的再一种视频图像分量的预测装置的组成结构示意图;

图13为本申请实施例提供的再一种视频图像分量的预测装置的组成结构示意图;

图14为本申请实施例提供的一种视频图像分量的预测装置的具体硬件结构示意图。

具体实施方式

为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。

在视频图像中,一般采用第一图像分量、第二图像分量和第三图像分量来表征编码块;其中,这三个图像分量包括一个亮度分量与两个色度分量,亮度分量通常使用符号y表示,色度分量通常使用符号cb、cr表示,其中,cb表示为蓝色色度分量,cr表示为红色色度分量。在本申请实施例中,第一图像分量可以为亮度分量y,第二图像分量可以为蓝色色度分量cb,第三图像分量可以为红色色度分量cr,但是本申请实施例对此并不作具体限定。目前常用的采样格式为ycbcr格式,ycbcr格式包括以下几种,分别如图1a至图1c所示,其中,图中的叉表示第一图像分量采样点,圈表示第二图像分量或第三图像分量采样点。

ycbcr格式包括:

4:4:4格式:如图1a所示,表示第二图像分量或第三图像分量没有下采样;

4:2:2格式:如图1b所示,表示第二图像分量或第三图像分量相对于第一图像分量进行2:1的水平采样,没有竖直下采样。对于每两个第二图像分量采样点或第三图像分量采样点,每个扫描行都包括四个y采样点;

4:2:0格式:如图1c所示,表示第二图像分量或第三图像分量相对于第一图像分量进行2:1的水平下采样和2:1的竖直下采样。

在视频图像采用ycbcr4:2:0格式的情况下,若视频图像的第一图像分量为2n×2n大小的编码块,则对应的第二图像分量或第三图像分量为n×n大小的编码块,其中n为编码块的边长。在本申请实施例中,下述将以4:2:0格式为例进行描述,但是本申请实施例的技术方案同样适用于其他采样格式。

在下一代视频编码标准h.266中,为了进一步提升了编码性能和编码效率,针对分量间预测(cross-componentprediction,ccp)进行了扩展改进,提出了分量间计算模型预测(cross-componentlinearmodelprediction,cclm)。在h.266中,cclm实现了第一图像分量到第二图像分量、第一图像分量到第三图像分量以及第二图像分量与第三图像分量之间的预测,下述将以第一图像分量到第二图像分量的预测为例进行描述,但是本申请实施例的技术方案同样也可以适用于其他图像分量的预测。

可以理解地,为了减少第一图像分量与第二图像分量之间的冗余,在使用cclm计算模型的预测模式中,第二图像分量是基于相同编码块的第一图像分量重建值来进行预测的,例如使用如式(1)所示的计算模型:

predc[i,j]=α·recl[i,j]+β(1)

其中,i,j表示编码块中采样点的位置坐标,i表示水平方向,j表示竖直方向,predc[i,j]表示编码块中位置坐标为[i,j]的采样点的第二图像分量预测值,recl[i,j]表示同一编码块中(经过下采样的)位置坐标为[i,j]的采样点的第一图像分量重建值,α和β是上述计算模型的模型参数,可以通过当前编码块周围的第一图像分量相邻参考值和第二图像分量相邻参考值的最小化回归误差推导得到,如使用式(2)计算得到:

其中,l(n)表示经过下采样的左侧和上侧第一图像分量相邻参考值,c(n)表示左侧和上侧第二图像分量相邻参考值,n为第二图像分量相邻参考值的个数。参见图2,其示出了相关技术方案中当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值的采样示意图;加黑的较大方框分别用于突出指示第一图像分量编码块21和对应的第二图像分量编码块22,灰色圆圈用于指示第一图像分量编码块21的相邻参考值l(n),或者第二图像分量编码块22的相邻参考值c(n)。其中,图2a示出了2n×2n大小的第一图像分量编码块21,对于4:2:0格式的视频图像来说,一个2n×2n大小的第一图像分量相对应的第二图像分量的大小为n×n,如图2b中的22所示。这里,对于方形编码块,式(2)可以直接应用;对于非方形的编码块,较长边缘的邻近采样首先进行下采样,得到与较短边缘采样数量相等的采样数,然后再应用式(2);在本申请实施例中,对此不作具体限定。

图3a至图3c示出了相关技术方案中cclm计算模型的原理结构示意图,如图3a至图3c所示,a、b、c为第一图像分量相邻参考值,a、b、c为第二图像分量相邻参考值,e为当前编码块某采样点的第一图像分量重建值,e为当前编码块该采样点的第二图像分量预测值;其中,利用当前编码块所有的第一图像分量相邻参考值l(n)和第二图像分量相邻参考值c(n),根据式(2)可以计算得出α和β,根据计算得到的α和β以及式(1)可以建立计算模型,如图3c所示;将当前编码块某采样点的第一图像分量重建值e带入式(1)所述的计算模型中,可以计算得到当前编码块该采样点的第二图像分量预测值e。

在jem中,目前有两种cclm的预测模式:一种是单模型cclm的预测模式;另一种是多模型cclm(multiplemodelcclm,mmlm)的预测模式,也称为mmlm的预测模式。顾名思义,单一模型cclm的预测模式则是只有一种计算模型来实现由第一图像分量预测第二图像分量;而mmlm的预测模式则是有多种计算模型来实现由第一图像分量预测第二图像分量。例如,在mmlm的预测模式中,将当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值分成两组,每一组均可以单独作为推导计算模型中模型参数的训练集,即每一个分组都能推导出一组模型参数α和β。

在现有的mmlm的预测模式中,目前是采用第一图像分量相邻参考值的均值作为第一图像分量相邻参考值和第二图像分量相邻参考值以及第一图像分量重建值的分类依据。然而,在本申请实施例中,考虑到当前编码块的第二图像分量预测值是通过当前编码块的第一图像分量重建值来预测的,为了提高视频图像分量的预测准确度,下述结合附图对本申请各个实施例进行详细介绍。

实施例1

参见图4,其示出了一种视频编码系统的组成框图示例;参见图5,其示出了一种视频解码系统的组成框图示例;如图4所示,该视频编码系统400包括变换与量化401、帧内估计402、帧内预测403、运动补偿404、运动估计405、反变换与反量化406、滤波器控制分析407、去方块滤波及样本自适应缩进(sampleadaptive0ffset,sao)滤波408、头信息编码及基于上下文的自适应二进制算术编码(context-basedadaptivebinaryarithmaticcoding,cabac)409和解码图像缓存410等部件;如图5所示,该视频解码系统500包括头信息解码及cabac解码501、反变换与反量化502、帧内预测503、运动补偿504、去方块滤波及sao滤波505和解码图像缓存506等部件;视频图像经过视频编码系统400中变换与量化401、帧内估计402、帧内预测403、运动补偿404、运动估计405、去方块滤波及sao滤波408以及头信息编码及cabac409等部分处理之后,输出该视频图像的码流;该码流输入视频解码系统500中,经过视频解码系统500中头信息解码及cabac解码501、反变换与反量化502、帧内预测503以及运动补偿504等部分处理,最终恢复出原来的视频图像。本申请实施例主要应用在如图4所示的帧内预测403部分和如图5所示的帧内预测503部分;也就是说,本申请实施例对于编码系统和解码系统可以同时作用,本申请实施例对此不作具体限定。

基于上述图4或者图5的应用场景示例,参见图6,其示出了本申请实施例提供的一种视频图像分量的预测方法流程,所述方法可以包括:

s601:根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;

s602:根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;

s603:根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;

s604:根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;

s605:根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值。

基于图6所示的技术方案,通过根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值;从而可以提高视频图像分量的预测准确度,进而节省了编码码率。

基于图6所示的技术方案,在一种可能的实现方式中,在所述根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值之前,所述方法还包括:

针对所述当前编码块进行第一图像分量的相邻参考值采样,获取所述当前编码块的第一图像分量相邻参考值;

针对所述当前编码块进行第二图像分量的相邻参考值采样,获取所述当前编码块的第二图像分量相邻参考值;

针对所述当前编码块所有采样点进行第一图像分量的重建采样,获取所述当前编码块所有采样点的第一图像分量重建值。

下述以图2所示的采样点示意图进行说明,对于以4:2:0格式的视频图像来说,第一图像分量编码块的大小为2n×2n,则对应第二图像分量编码块的大小为n×n,经过下采样得到当前编码块的第一图像分量相邻参考值用l(n)表示,经过采样得到当前编码块的第二图像分量相邻参考值用c(n)表示,n=1,2,3,...,n,n为第二图像分量相邻参考值的个数;经过采样得到当前编码块各个采样点的第一图像分量重建值用recl[i,j]表示,i、j表示所述当前编码块中采样点的位置坐标,i表示水平方向,j表示竖直方向。

需要说明的是,阈值是当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值的分类依据,同时也是当前编码块的第一图像分量重建值的分类依据。其中,阈值是用于指示建立多个计算模型所依据的设定值,阈值的大小与当前编码块所有采样点的第一图像分量重建值有关。具体地,可以通过计算当前编码块所有采样点的第一图像分量重建值的均值得到,也可以通过计算当前编码块所有采样点的第一图像分量重建值的中值得到,本申请实施例对此不作具体限定。

在本申请实施例中,首先,可以根据所述当前编码块所有采样点的第一图像分量重建值以及式(3),计算得出均值mean:

其中,mean表示所述当前编码块所有采样点的重建亮度值的均值,∑recl[i,j]表示所述当前编码块所有采样点的重建亮度值之和,m表示所述当前编码块所有采样点的重建亮度值的采样个数。

其次,将计算得出的均值mean直接作为阈值,利用该阈值可以建立两个计算模型;但是本申请实施例并不限于只建立两个计算模型。举例来说,根据当前编码块所有采样点的第一图像分量重建值之和∑recl[i,j]求取平均值,进而得到均值mean。如果建立两个计算模型,则可以将mean直接作为阈值,根据该阈值可以将当前编码块的第一图像分量相邻参考值分为两部分,预示着后续可以建立两个计算模型;如果建立三个计算模型,则将(第一图像分量最小重建值+mean+1)>>1作为第一个阈值,将(第一图像分量最大重建值+mean+1)>>1作为第二个阈值,根据这两个阈值可以将当前编码块的相邻参考值分为三部分,预示着后续可以建立三个计算模型;下述将以计算得出的均值mean作为阈值来建立两个计算模型为例进行描述。

基于图6所示的技术方案,在一种可能的实现方式中,所述根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,包括:

若所述当前编码块的第一图像分量相邻参考值不大于所述至少一个阈值,则获得第一组的第一图像分量相邻参考值l(m)和第二图像分量相邻参考值c(m);

若所述当前编码块的第一图像分量相邻参考值大于所述至少一个阈值,则获得第二组的第一图像分量相邻参考值l(k)和第二图像分量相邻参考值c(k)。

需要说明的是,以上述计算得出的均值mean作为阈值,可以将当前编码块的第一图像分量相邻参考值分为两部分,分别为l(m)和l(k);相应地,也可以将当前编码块的第二图像分量相邻参考值分为两部分,分别为c(m)和c(k)。举例来说,参见图7,其示出了本申请实施例提供的一种当前编码块的第一图像分量相邻参考值和第二图像分量相邻参考值的分组示意图;当前编码块的第一图像分量相邻参考值用l(n)表示,当前编码块的第二图像分量相邻参考值用c(n)表示,假定阈值用threshold表示,本实例中将当前编码块所有采样点的第一图像分量重建值的均值mean作为阈值,即threshold=mean,若l(n)≤threshold,则可以将l(n)对应采样点的第一图像分量相邻参考值和第二图像分量相邻参考值判定为第一组,从而得到第一组的第一图像分量相邻参考值l(m)和第二图像分量相邻参考值c(m);若l(n)>threshold,则可以将l(n)对应采样点的第一图像分量相邻参考值和第二图像分量相邻参考值判定为第二组,从而得到第二组的第一图像分量相邻参考值l(k)和第二图像分量相邻参考值c(k)。

可以理解地,在得到第一组的第一图像分量相邻参考值l(m)和第二图像分量相邻参考值c(m)以及第二组的第一图像分量相邻参考值l(k)和第二图像分量相邻参考值c(k)之后,可以将每一组的第一图像分量相邻参考值和第二图像分量相邻参考值作为单独的训练集,即每一个分组都能训练出一组模型参数;因此,在上述实现方式中,具体地,所述根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型,包括:

根据所述l(m)、所述c(m)以及式(4),计算得出第一计算模型的第一参数α1和第一计算模型的第二参数β1:

根据所述l(k)、所述c(k)以及式(5),计算得出第二计算模型的第一参数α2和第二计算模型的第二参数β2:

根据所述第一计算模型的第一参数α1和所述第一计算模型的第二参数β1、所述第二计算模型的第一参数α2和所述第二计算模型的第二参数β2以及式(6),建立第一计算模型pred1c[i,j]和第二计算模型pred2c[i,j]:

其中,m表示所述第一组的第一图像分量相邻参考值l(m)或第二图像分量相邻参考值c(m)的个数,k表示所述第二组的第一图像分量相邻参考值l(k)或第二图像分量相邻参考值c(k)的个数,i、j表示所述当前编码块中采样点的位置坐标,i表示水平方向,j表示竖直方向;threshold表示预设阈值,所述预设阈值是根据所述当前编码块所有采样点的第一图像分量重建值得到的;recl[i,j]表示所述当前编码块中位置坐标为[i,j]的采样点的第一图像分量重建值;pred1c[i,j]和pred2c[i,j]表示所述当前编码块中位置坐标为[i,j]的采样点的第二图像分量预测值。

可以理解地,考虑到当前编码块的第一图像分量重建值和第一图像分量相邻参考值之间的相似度,根据相似度的大小对每个相邻参考采样点分配一个权重(即加权系数),对计算模型的第一参数α和第二参数β进行修正,可以使得推导的计算模型更准确。其中,本申请实施例以第一图像分量相邻参考值和第一图像分量重建值的差值为例进行说明,加权系数的设计准则为:计算第一图像分量相邻参考值和当前编码块所有采样点的第一图像分量重建值的差值集合,从该差值集合中获取到最小值;设计的加权系数与最小值成反比,而且差值越小,表明了当前编码块的第一图像分量相邻参考值和第一图像分量重建值之间的相似度越大,即加权系数也越大;反之,则加权系数越小。另外,加权系数不仅可以根据当前编码块的第一图像分量相邻参考值和第一图像分量重建值的差值计算得到,还可以根据当前编码块的第一图像分量相邻参考值在当前编码块中出现的次数计算得到,甚至还可以根据当前编码块的第一图像分量的其他方式计算得到,本申请实施例对此不作具体限定。下述的加权系数将以当前编码块的第一图像分量相邻参考值和第一图像分量重建值的差值为例进行描述。

基于图6所示的技术方案,在一种可能的实现方式中,在所述根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型之前,所述方法还包括:

根据所述l(m)、所述recl[i,j]以及式(7),计算得出所述第一计算模型的所述l(m)和所述c(m)的加权系数w(m):

根据所述l(k)、所述recl[i,j]以及式(8),计算得出所述第二计算模型的所述l(k)和所述c(k)的加权系数w(k):

在上述实现方式中,具体地,所述根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型,包括:

根据所述w(m)、所述l(m)、所述c(m)以及式(9),计算得出第一计算模型的第一参数α1和第一计算模型的第二参数β1:

根据所述w(k)、所述l(k)、所述c(k)以及式(10),计算得出第二计算模型的第一参数α2和第二计算模型的第二参数β2:

根据所述第一计算模型的第一参数α1和所述第一计算模型的第二参数β1、所述第二计算模型的第一参数α2和所述第二计算模型的第二参数β2以及式(11),建立第一计算模型pred1c[i,j]和第一计算模型pred2c[i,j]:

其中,i、j表示所述当前编码块中采样点的位置坐标,i表示水平方向,j表示竖直方向;threshold表示预设阈值,所述预设阈值是根据所述当前编码块所有采样点的第一图像分量重建值得到的;recl[i,j]表示所述当前编码块中位置坐标为[i,j]的采样点的第一图像分量重建值;pred1c[i,j]和pred2c[i,j]表示所述当前编码块中位置坐标为[i,j]的采样点的第二图像分量预测值。

需要说明的是,在本申请实施例中,考虑到当前编码块的第一图像分量重建值和第一图像分量相邻参考值之间的相似度,比如以当前编码块的第一图像分量相邻参考值与第一图像分量重建值之间的差值来计算得到加权系数,然后依据该加权系数对每个相邻参考采样点进行加权,通过对α1和β1以及α2和β2进行修正,可以使得所推导的计算模型更加准确,进而使得当前编码块的第二图像分量预测值更加接近于当前编码块的第二图像分量真实值。参见图8,其示出了相关技术方案的计算模型与本申请实施例提供的计算模型对比示意图;在图8中,若采用偏离当前编码块的第一图像分量重建值较多的第一图像分量相邻参考值来构建计算模型,可能导致当前编码块的第二图像分量预测值与第二图像分量实际值之间偏离较远,从而降低了预测精度;比如图8中的b和c,由于b和c处的第一图像分量相邻参考值比较偏离当前编码块的第一图像分量重建值,按照现有相关技术方案来推导计算模型,这两个点也会被用于计算模型参数α和β,使得推导得到的计算模型远远偏离了期望得到的计算模型;但是在本申请实施例中,通过加权系数w(m)来对每个相邻参考采样点进行加权,比如w(a)、w(b)和w(c),可以使得推导得到的计算模型更加贴合期望得到的计算模型,进而使得当前编码块的第二图像分量预测值更加接近于当前编码块的第二图像分量真实值。

基于图6所示的技术方案,在一种可能的实现方式中,所述根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型,包括:

根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果进行分组,得到至少两组所述第一图像分量重建值集合,以及所述至少两组第一图像分量重建值集合与所述至少两个计算模型之间的对应关系;

根据所述当前编码块中各采样点的第一图像分量重建值所归属的第一图像分量重建值集合以及所述至少两组第一图像分量重建值集合与所述至少两个计算模型之间的对应关系,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型。

需要说明的是,在得到上述式(6)或者式(11)所对应的两个计算模型之后,首先将当前编码块所有采样点的第一图像分量重建值recl[i,j]与阈值threshold进行比较,根据比较结果可以得到至少两组第一图像分量重建值集合,以及所述至少两组第一图像分量重建值集合与所述至少两个计算模型之间的对应关系;然后通过位置坐标为[i,j]的采样点的第一图像分量重建值recl[i,j]来判断该recl[i,j]所归属的第一图像分量重建值集合;即首先判断recl[i,j]≤threshold,还是recl[i,j]>threshold,确定出recl[i,j]所归属的第一图像分量重建值集合;然后再确定出位置坐标为[i,j]的采样点的第二图像分量预测值是采用第一计算模型进行计算,还是采用第二计算模型进行计算;也就是说,若recl[i,j]≤threshold,则将该recl[i,j]带入第一计算模型来计算出位置坐标为[i,j]的采样点的第二图像分量预测值;若recl[i,j]>threshold,则将该recl[i,j]带入第二计算模型来计算出位置坐标为[i,j]的采样点的第二图像分量预测值。

可以理解地,考虑到当前编码块的第一图像分量重建值和第一图像分量相邻参考值之间的相似度,在建立计算模型之前,还可以针对当前编码块的第一图像分量相邻参考值进行筛选。需要说明的是,筛选准则可以根据当前编码块的第一图像分量相邻参考值和第一图像分量重建值的差值进行筛选,还可以根据当前编码块的第一图像分量相邻参考值在当前编码块中出现的次数进行筛选,甚至还可以根据当前编码块的第一图像分量的其他方式进行筛选,本申请实施例对此不作具体限定。下述的筛选将以当前编码块的第一图像分量相邻参考值和第一图像分量重建值的差值为例进行描述。

基于图6所示的技术方案,在一种可能的实现方式中,在所述根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型之前,所述方法还包括:

遍历所述当前编码块的第一图像分量相邻参考值,将所述第一图像分量相邻参考值中的任意一个采样值与所述当前编码块所有采样点对应的第一图像分量重建值进行差值计算,获得所述采样值对应的差值集合;

若所述差值集合中的最小值大于预设门限值,则从所述第一图像分量相邻参考值中剔除所述采样值以及从所述第二图像分量相邻参考值中剔除对应位置的采样值。

需要说明的是,在得到计算模型之前,还可以考虑到当前编码块的第一图像分量重建值和第一图像分量相邻参考值的相似度。即根据第一图像分量相邻参考值和第一图像分量重建值的差值对第一图像分量相邻参考值进行筛选。举例来说,首先设置一个预设门限值;然后遍历当前编码块的所有第一图像分量相邻参考值,将所述第一图像分量相邻参考值中的任意一个采样值与当前编码块所有采样点的每一个第一图像分量重建值进行求差;如果第一图像分量相邻参考值中的某一个采样值与当前所有的第一图像分量重建值的差值中的最小值大于预设门限值,则认为该采样值对应位置的相邻点是干扰点,影响计算模型的精确度,需要把该相邻点剔除出计算模型的训练样本;后续使用剔除完干扰点后的第一图像分量相邻参考值和对应的第二图像分量相邻参考值作为计算模型的训练样本来计算得到模型参数,从而使得推导出的计算模型更加精确。

在上述mmlm的预测模式中,除了可以从当前编码块的第一图像分量到第二图像分量进行预测之外,还可以进行第二图像分量到第三图像分量、或者第三图像分量到第二图像分量的预测;其中,第三图像分量到第二图像分量的预测和第二图像分量到第三图像分量的预测方法相似,在本申请实施例中,下述将以第二图像分量到第三图像分量的预测为例进行描述。

基于图6所示的技术方案,在一种可能的实现方式中,所述方法还包括:

获取所述当前编码块中采样点[i,j]的第二图像分量的预测残差pred'cb[i,j]和所述采样点[i,j]的第三图像分量估计值predcr[i,j];

根据所述pred'cb[i,j]、所述predcr[i,j]以及式(12),计算得出所述采样点[i,j]的第三图像分量预测值:

其中,表示所述当前编码块中位置坐标为[i,j]的采样点的第三图像分量预测值,a*表示比例因子,cb(n)表示所述当前编码块的第二图像分量相邻参考值,cr(n)表示所述当前编码块的第三图像分量相邻参考值,λ等于∑(cb(n)·cb(n))>>9。

需要说明的是,在mmlm的预测模式中,第二图像分量到第三图像分量的预测应用于残差域,取代了原来的重构采样信号。其中,λ的值可以确定(-0.5)对推导出的a*值的影响有多大;比如当使用较大的λ值时,(-0.5)就会具有较多影响。在本申请实施例中,λ的值可以等于∑(cb(n)·cb(n))>>z,其中z为预定义固定值(比如7、8或者9);λ的值也可以基于当前编码块的特征内容(比如编码块的大小、参考样本等)而发生改变,本申请实施例对此不作具体限定。

本实施例提供了一种视频图像分量的预测方法,通过根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值;从而可以提高视频图像分量的预测准确度,进而节省了编码码率。

实施例2

基于前述实施例相同的发明构思,参见图9,其示出了本申请实施例提供的一种视频图像分量的预测装置90的组成,所述视频图像分量的预测装置90可以包括:第一获取部分901、分组部分902、建立部分903、选取部分904和第一预测部分905;其中,

所述第一获取部分901,配置为根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;

所述分组部分902,配置为根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;

所述建立部分903,配置为根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;

所述选取部分904,配置为根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;

所述第一预测部分905,配置为根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值。

在上述方案中,参见图10,所述视频图像分量的预测装置90还包括第二获取部分906,配置为:

针对所述当前编码块进行第一图像分量的相邻参考值采样,获取所述当前编码块的第一图像分量相邻参考值;

针对所述当前编码块进行第二图像分量的相邻参考值采样,获取所述当前编码块的第二图像分量相邻参考值;

针对所述当前编码块所有采样点进行第一图像分量的重建采样,获取所述当前编码块所有采样点的第一图像分量重建值。

在上述方案中,所述分组部分902,具体配置为:

若所述当前编码块的第一图像分量相邻参考值不大于所述至少一个阈值,则获得第一组的第一图像分量相邻参考值l(m)和第二图像分量相邻参考值c(m);

若所述当前编码块的第一图像分量相邻参考值大于所述至少一个阈值,则获得第二组的第一图像分量相邻参考值l(k)和第二图像分量相邻参考值c(k)。

在上述方案中,所述建立部分903,具体配置为:

根据所述l(m)、所述c(m)以及式(4),计算得出第一计算模型的第一参数α1和第一计算模型的第二参数β1;

根据所述l(k)、所述c(k)以及式(5),计算得出第二计算模型的第一参数α2和第二计算模型的第二参数β2;

根据所述第一计算模型的第一参数α1和所述第一计算模型的第二参数β1、所述第二计算模型的第一参数α2和所述第二计算模型的第二参数β2以及式(6),建立第一计算模型pred1c[i,j]和第二计算模型pred2c[i,j]。

在上述方案中,参见图11,所述视频图像分量的预测装置90还包括加权部分907,配置为:

根据所述l(m)、所述recl[i,j]以及式(7),计算得出所述第一计算模型的所述l(m)和所述c(m)的加权系数w(m);

根据所述l(k)、所述recl[i,j]以及式(8),计算得出所述第二计算模型的所述l(k)和所述c(k)的加权系数w(k)。

在上述方案中,所述建立部分903,具体配置为:

根据所述w(m)、所述l(m)、所述c(m)以及式(9),计算得出第一计算模型的第一参数α1和第一计算模型的第二参数β1;

根据所述w(k)、所述l(k)、所述c(k)以及式(10),计算得出第二计算模型的第一参数α2和第二计算模型的第二参数β2;

根据所述第一计算模型的第一参数α1和所述第一计算模型的第二参数β1、所述第二计算模型的第一参数α2和所述第二计算模型的第二参数β2以及式(11),建立第一计算模型pred1c[i,j]和第二计算模型pred2c[i,j]。

在上述方案中,所述选取部分904,具体配置为:

根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量重建值集合,以及所述至少两组第一图像分量重建值集合与所述至少两个计算模型之间的对应关系;

根据所述当前编码块中各采样点的第一图像分量重建值所归属的第一图像分量重建值集合以及所述至少两组第一图像分量重建值集合与所述至少两个计算模型之间的对应关系,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型。

在上述方案中,参见图12,所述视频图像分量的预测装置90还包括剔除部分908,配置为:

遍历所述当前编码块的第一图像分量相邻参考值,将所述第一图像分量相邻参考值中的任意一个采样值与所述当前编码块所有采样点的第一图像分量重建值进行差值计算,获得所述采样值对应的差值集合;

若所述差值集合中的最小值大于预设门限值,则从所述第一图像分量相邻参考值中剔除所述采样值以及从所述第二图像分量相邻参考值中剔除对应位置的采样值。

在上述方案中,参见图13,所述视频图像分量的预测装置90还包括第二预测部分909,配置为:

获取所述当前编码块中采样点[i,j]的第二图像分量的预测残差pred'cb[i,j]和所述采样点[i,j]的第三图像分量估计值predcr[i,j];

根据所述pred'cb[i,j]、所述predcr[i,j]以及式(12),计算得出所述采样点[i,j]的第三图像分量预测值。

可以理解地,在本实施例中,“部分”可以是部分电路、部分处理器、部分程序或软件等等,当然也可以是单元,还可以是模块也可以是非模块化的。

另外,在本实施例中的各组成部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,readonlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

因此,本实施例提供了一种计算机存储介质,该计算机存储介质存储有视频图像分量的预测程序,所述视频图像分量的预测程序被至少一个处理器执行时实现上述实施例一所述的方法的步骤。

基于上述视频图像分量的预测装置90的组成以及计算机存储介质,参见图14,其示出了本申请实施例提供的视频图像分量的预测装置90的具体硬件结构,可以包括:网络接口1401、存储器1402和处理器1403;各个组件通过总线系统1404耦合在一起。可理解,总线系统1404用于实现这些组件之间的连接通信。总线系统1404除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图14中将各种总线都标为总线系统1404。其中,网络接口1401,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;

存储器1402,用于存储能够在处理器1403上运行的计算机程序;

处理器1403,用于在运行所述计算机程序时,执行:

根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;

根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;

根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;

根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;

根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值。

可以理解,本申请实施例中的存储器1402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的系统和方法的存储器1402旨在包括但不限于这些和任意其它适合类型的存储器。

而处理器1403可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1403中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1403可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1402,处理器1403读取存储器1402中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可选地,作为另一个实施例,处理器1403还配置为在运行所述计算机程序时,执行上述实施例一所述视频图像分量的预测方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本申请的保护之内。

工业实用性

本申请实施例中,通过根据当前编码块所有采样点的第一图像分量重建值,获取至少一个阈值;根据所述当前编码块的第一图像分量相邻参考值与所述至少一个阈值的比较结果进行分组,得到至少两组第一图像分量相邻参考值和第二图像分量相邻参考值;根据所述至少两组第一图像分量相邻参考值和第二图像分量相邻参考值,建立至少两个计算模型;根据所述当前编码块所有采样点的第一图像分量重建值与所述至少一个阈值的比较结果,从所述至少两个计算模型中选取所述当前编码块中各采样点对应的计算模型;根据所述当前编码块中各采样点对应的计算模型,获取所述当前编码块中各采样点的第二图像分量预测值;从而可以提高视频图像分量的预测准确度,进而节省了编码码率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1