基于聚类感知的无参考色调映射图像质量评价算法的制作方法

文档序号：19741486发布日期：2020-01-18 05:17阅读：376来源：国知局

本发明涉及图像质量评价算法，尤其涉及基于聚类感知的无参考色调映射图像质量评价算法。

背景技术：

高动态范围(highdynamicrange,hdr)图像相比低动态范围(lowdynamicrange，ldr)图像能够表示更大的亮度范围，其亮度范围大约是10^-4cd/m²~10⁵cd/m²。ldr图像能表示的动态范围不超过3个数量级，但人类视觉系统在真实场景中可以接受的动态范围可以达到6个数量级。因此，hdr图像对用户来说感受更真实更有吸引力。随着成像和计算机图形学技术的发展，hdr图像的获得越来越容易。然而，hdr显示设备比较昂贵，超出了普通消费者的承受范围。为了解决这个问题，产业界和学术界开发了许多色调映射算子(tone-mappedoperator,tmo)，tmo能够把hdr图像转换成ldr图像，转换后的ldr图像被称为色调映射图像(tone-mappedimage,tmi)。由于tmi相对hdr图像缩小了动态范围，tmi不可避免的产生失真，例如亮度信息丢失、结构信息丢失、不自然的颜色等。准对一个hdr图像，不同的tmo产生的效果不一样。因此，tmi质量评价对于选择合适的tmo和改进tmo本身具有重要的研究意义。

tmi质量评价分为主观质量评价和客观质量评价，而早期的tmo性能评价主要采用主观质量评价。然而，主观质量评价具有三方面的缺点。首先主观质量评价比较耗时费力，需要昂贵的hdr显示器和多个测试人员多次实验。其次主观质量不能嵌入到图像处理系统来改进tmo。最后主观评价由于人为的一些不确定因素导致评价的误差，传统的客观质量评价方法假定参考图像和测试图像具有相同的动态范围，因此传统的客观质量评价方法不能直接评价tmi。近年来，全参考tmi质量评价算法取得了丰硕的成果。yeganeh等人首次建立了色调映射图像数据库（tone-mappedimagedatabase,tmid），tmid可以下载并用于评价tmi质量评价算法的性能。同时，他们提出了一种全参考tmi质量评价方法（tonemappedimagequalityindex,tmqi），这个方法的基本思想是高质量的tmi不但要保护hdr图像的结构信息，还要保留图像的自然场景统计特性(naturalscenestatistics，nss)。nafchi等人基于图像的局部相位信息提出了fsitm方法，该方法考虑了图像的颜色信息，但没有考虑图像的自然度。kundu等人准对tmqi均匀池化的缺点，在tmqi基础上加入了视觉注意力模型，运用感知池化策略提升质量评价算法的性能。xie等人使用字典学习技术在稀疏域提取局部结构相似度和全局自然度，合并这两个特征提出了一种全参考质量评价算法smti。鉴于色调映射图像失真类型多的特点，hadizadeh等人从结构保真度、自然度、亮度、颜色等方面提取了八类特征来评价tmi质量。由于tmi失真通常不会出现模糊、块效应等类型的失真，传统的质量评价算法不适合评价tmi。普通（低动态）图像的质量评价方法不适用于色调映射图像质量评价，因为色调映射图像的失真类型和低动态图像的失真类型不同，低动态图像的失真类型主要是块效应、模糊、振铃效应，而色调映射图像的失真类型主要是高亮区域和低暗区域的失真。面向色调映射图像的全参考图像质量评价方法要求评价图像时存在参考图像，在很多应用场景中无法获得参考图像，即全参考图像的应用范围有限，国际上现有具有代表性的无参考色调映射图像质量评价方法关键性能指标srocc在0.8282，性能不够好。

技术实现要素：

为了解决上述所存在的问题，本发明所要解决的技术问题提供了基于聚类感知的无参考色调映射图像质量评价算法，该种算法在评价测试图像时不需要参考图像的存在。

基于聚类感知的无参考色调映射图像质量评价算法，实现基于聚类感知的无参考色调映射图像质量评价算法，包含以下几个步骤：

步骤a：在亮度域上提取聚类感知特征，先把tmi转换成灰度图，再根据亮度信息进行聚类划分，所述聚类划分采用k-means聚类算法来自动识别图像的高亮区、中间区、低暗区，在每个区域分别提取面积比率和信息熵两个特征；

步骤b：在显著性区域上提取显著性区域特征，对tmi的非负矩阵分解得到测试图像对应的系数，对系数进行分析识别出tmi的混合区域，在所述混合区域提取块比例和信息熵两个特征；

步骤c：提取自然度特征，所述自然度特征提取包括亮度统计特征和颜色通道统计特征；

步骤d：使用机器学习的方法对所有特征进行回归，得到图像质量评价分。

上述技术方案中，在步骤a中所述k-means聚类算法在聚类时只考虑像素点到聚类中心的距离来确定像素点的类别，不考虑人眼对亮度感知的非线性特性，对于相近的人眼感知差，物理亮度距离与聚类中心的亮度值成正比，即人眼对暗区聚类时与聚类中心的距离要短一些，对中间区域聚类时与聚类中心的距离要长一些。在图像质量评价领域采用k-means聚类算法来自动识别图像的高亮区、中间区、低暗区，并根据人眼感知原理对k-means聚类的分区结果进行了改进，增加了中间区的亮度范围。对图像高亮区、中间区、低暗区的自动识别相对固定百分比的识别增加了不同场景的适用性，对k-means聚类的分区结果进行改进提升了算法的精度。

上述技术方案中，在步骤a中所述面积比率包括高亮区面积比率、中间区面积比率和低暗区面积比率；在步骤a中所述信息熵包括高亮区信息熵、中间区信息熵和低暗区信息熵，信息熵是衡量信息量的有效方法，所以对暗区、中间区、亮区和灰度图像分别求信息熵。考虑到人眼观察图像时先整体后局部的特点，同时提取全局信息熵eg为特征，由于tmi图像容易出现过曝光或欠曝光的区域，这些区域的大小会影响图像的质量，因此提取了三个区域的面积比例作为特征。

上述技术方案中，在步骤b中所述非负矩阵的分解是把一个数据矩阵m分解为两个非负矩阵w和的乘积，w为特征矩阵，s为编码矩阵，数据矩阵m可以看作特征矩阵w中每一列和s中对应系数的线性组合，由于s的非负性，m是有w中的每一列按照s决定的权重系数累加而成，由于w中的每一列就是一个图像块，因此非负矩阵分解与部分组成整体的直观认知相符。基于这种新的感兴趣区域检测方法的特征适合色调映射图像质量评价，由于矩阵非负分解速度快，因此这种新的感兴趣区域检测方法有很好的运算速度。

上述技术方案中，所述特征矩阵w通过训练库训练得到，所述训练库n与所述数据矩阵m相同，从tmid数据库中随机选取了不同场景和纹理的十幅色调映射图像，先把每一幅tmi转换成灰度图像，然后把灰度图像分成的图像块，把每个图像块转换成m维的列向量ni，组合所有训练图像块的列向量生成所述训练库n，所述训练库n为m×n大小。

上述技术方案中，在步骤b中所述混合区域是指具有高亮区、中间区、低暗区这三个区域两个或两个以上的区域，混合区域中像素间的亮度值差异比较大，具有显著性区域的特点。例如一个图像块的有三分之一的亮区像素和三分之二的中间区像素。把亮区、暗区、中间区、混合区图像块分别进行非负矩阵分解，图像暗区、中间区、亮区的编码矩阵的系数值比较小，混合区系数有较大值。因此可以通过分析编码矩阵的最大值来判断显著性区域，信息熵能有效衡量图像的信息量，对所述s的所有像素求信息熵获得显著性区域的信息量，显著性区域面积越大，对图像质量的影响越大。

上述技术方案中，在步骤c中所述亮度统计特征提取使用了十四个不同类别场景的自然图像，首先把每一幅图像转化成灰度图像，把灰度图像分割成11×11的图像块，分别求出每个图像块的均值与标准差，最后统计一幅图像中所有图像块的均值与标准差的均值，获得一幅图像的均值和标准差，图像的均值、标准差分别与高斯概率密度函数和beta概率密度函数能够很好地拟合。

上述技术方案中，在步骤c中所述颜色通道统计特征通过rgb颜色空间来提取。所述自然度特征结合了亮度统计特征和颜色通道统计特征，相对单种自然度大幅提高了算法的srocc性能。

上述技术方案中，在步骤d中所述机器学习的方法包括svm。由于支持向量机（supportvectormachine,svm）在图像处理领域得到广泛的应用，因此把训练图像的特征向量和对应的mos值输入支持向量机训练出一个预测模型f(·)，把测试图像的特征向量输入预测模型获得图像的客观质量预测值。

上述技术方案中，在步骤d中所述回归是指通过一个回归模型建立一个函数，这个函数能够映射特征向量到主观图像质量评价分，所述回归模型是指把训练图像的特征向量和对应的mos值输入支持向量机训练出一个预测模型。

与现有技术相比，本发明的有益效果是：由于普通（低动态）图像的质量评价方法不适用于色调映射图像质量评价，因此本发明要针对色调映射图像的特点设计了质量评价算法，解决的技术问题是设计特征表达色调映射图像的细节丢失程度、图像自然度、图像感兴趣区域检测；面向色调映射图像的全参考图像质量评价方法要求评价图像时存在参考图像，本发明是一种无参考色调映射图像质量评价方法，评价测试图像时，不需要参考图像的存在；本发明采用k-means聚类算法来自动识别图像根据人眼感知原理对k-means聚类的分区结果进行了改进对k-means聚类的分区结果进行改进提升了算法的精度；并提出了一种新的感兴趣区域检测方法，基于这种新的感兴趣区域检测方法的特征适合色调映射图像质量评价，由于矩阵非负分解速度快，因此这种新的感兴趣区域检测方法有很好的运算速度；自然度特征结合了亮度自然度和颜色自然度，相对单种自然度大幅提高了算法的srocc性能，本发明的关键性能指标srocc在0.8313，超过了国际上现有代表性的算法。

附图说明

图1为基于聚类感知的无参考色调映射图像质量评价算法的流程框架图。

具体实施方式

下面结合附图，对本发明的具体实施方式作详细说明。

如图1所示，基于聚类感知的无参考色调映射图像质量评价算法，实现基于聚类感知的无参考色调映射图像质量评价算法，包含以下几个步骤：

步骤b：在显著性区域上提取显著性区域特征，tmi的非负矩阵分解得到测试图像对应的系数，对系数进行分析识别出tmi的混合区域，在所述混合区域提取块比例和信息熵两个特征；

步骤c：提取自然度特征，所述自然度特征提取包括亮度统计特征和颜色通道统计特征；

步骤d：提取了聚类感知、显著性区域和自然度特征三类特征后，使用机器学习的方法对所有特征进行回归，得到图像质量评价分。

本发明提取了聚类感知特征、显著性区域特征、自然度特征。聚类感知特征在亮度域上提取，先把tmi转换成灰度图，根据亮度信息进行聚类，把图像分成亮区、暗区、中间区三个区域，在每个区域分别提取面积比率和信息熵两个特征。生理学和心理学的一些证据表明人眼观察一幅图像时先看图像的整体，人脑会抑制图像中高频出现的特征，视觉注意力容易关注偏差比较大的区域，即显著性区域。假设图像中一个m×m区域具有亮区、暗区、中间区这三个区域中两个或两个以上区域的像素，这样的区域称为混合区域。混合区域中像素间的亮度值差异比较大，具有显著性区域的特点。本文通过对tmi的非负矩阵分解得到测试图像对应的系数，对系数进行分析识别出tmi的混合区域，在混合区域提出块比例、信息熵特征。由于tmo处理过程缩小了hdr图像的动态范围，影响了tmi的自然度，因此提取了亮度通道和颜色通道的自然统计特征。最后使用机器学习方法对所有特征进行回归，提出了无参考tmi质量评价方法。

在步骤a中所述k-means聚类算法在聚类时只考虑像素点到聚类中心的距离来确定像素点的类别，不考虑人眼对亮度感知的非线性特性。k-means聚类时只考虑像素点到聚类中心的距离来确定像素点的类别，没有考虑人眼对亮度感知的非线性特性。设聚类中心亮度值为s1，感知亮度为p1，某个像素点像素亮度值为s2，感知亮度为p2。根据费希纳定理：

（1）

则亮度感知差p2－p1和s2与s1的关系为：

（2）

在k-means算法中和s2的物理亮度距离为:

对于相近的人眼感知差p2－p1，物理亮度距离与聚类中心的亮度值成正比，即人眼对暗区聚类时与聚类中心的距离要短一些，对中间区域聚类时与聚类中心的距离要长一些。因此，采用如下算法对色调映射图像的三个区域进行调整。

设计l为图像像素亮度值，c1，c2，c3分别为暗区、中间区，亮区的聚类中心，则三个区域的分类如下：

（4）

在视觉注意处理中，人类视觉系统对视觉细胞产生的刺激进行融合，通过不同的信息特征进行聚类，形成人类视觉系统的注意力分配图，因此聚类是人类视觉系统的固有功能。设m×n的灰度图像i，i(x,y)表示图像i中(x,y)像素点的亮度值，设暗区、中间区、亮区的像素亮度值集合分别为rl，rm，rh，则

（5）

其中c3，c1为亮区和暗区的聚类中心。

在步骤a中所述面积比率包括高亮区面积比率、中间区面积比率和低暗区面积比率；在步骤a中所述信息熵包括高亮区信息熵、中间区信息熵和低暗区信息熵。信息熵是衡量信息量的有效方法，设p为概率密度，对rl，rm，rh，i分别求信息熵为：

（6）

el，em，eh分别表示暗区、中间区、亮区的信息熵。考虑到人眼观察图像时先整体后局部的特点，同时提取全局信息熵eg为特征。

由于tmi图像容易出现过曝光或欠曝光的区域，这些区域的大小会影响图像的质量，因此提取了三个区域的面积比例作为特征。设n(·)函数表示计算图像或者图像块的像素个数，则每个区域的面积比例可以表示为：

（7）

ratiol，ratioh，ratiom分别表示暗区、亮区、中间区的面积比率。聚类感知特征向量fcluster为：

fcluster={el,em,eh,eg,ratiol，ratioh，ratiom}

当人眼看一幅图像时注意力会被吸引到图像中的一部分区域，这部分区域被称为显著性区域，是大部分人认为图像中重要的或者显著的部分。显著性区域的图像质量显然影响人眼对图像整体质量的评价。goferman等人认为人眼观察一幅图像时先看图像的整体，人脑会抑制图像中高频出现的特征，视觉注意力容易关注偏差比较大的区域，即显著性区域。本文对tmi灰度图像的非负矩阵分解获得对应图像的系数，通过对系数的直方图的分析，提出了一种混合区域的识别方法，然后对混合区域提取信息熵，块比率等特征。许多研究表明稀疏表示符合人脑对图像信号的认知，非负矩阵分解（nmf）与稀疏表示的字典学习类似。在步骤b中所述非负矩阵的分解是把一个数据矩阵m分解为两个非负矩阵w和s的乘积，w为特征矩阵，s为编码矩阵。

所述特征矩阵w通过训练库训练得到，所述训练库n与所述数据矩阵m相同,从tmid数据库中随机选取了不同场景和纹理的十幅色调映射图像，先把每一幅tmi转换成灰度图像，然后把灰度图像分成的图像块，把每个图像块转换成m维的列向量ni，组合所有训练图像块的列向量生成所述训练库n，所述训练库n为m×n大小。本发明中m=4900,n>20000。对于训练样本库n，nmf的目标是寻找特征矩阵w=[w1,w2,…,wr]∈r^m×r和s=[s1，s2，…，sn]∈r^r×n来近似训练样本矩阵m，即

m=ws（8）

其中r是大于零的整数，表示特征矩阵中列向量的个数。w和s的寻找过程可以转化为如下优化问题：

（9）

本发明用lin[14]的方法计算出了w和s。对于一个测试图像块转化而成的列向量ti∈r^m×1，则得到ti非负矩阵分解后的编码矩阵fi∈r^r×1为：

（10）

其中(w^tw)^-1w^t是w的伪逆矩阵。对于测试图像t=[t1，t2，…,tn]获得编码矩阵f=[f1，f2，…,fn]，n为一幅测试图像包含的图像块的个数。

在步骤b中所述混合区域是指具有高亮区、中间区、低暗区这三个区域两个或两个以上的区域，混合区域中像素间的亮度值差异比较大，具有显著性区域的特点。例如一个图像块的有三分之一的亮区像素和三分之二的中间区像素。把亮区、暗区、中间区、混合区图像块分别进行非负矩阵分解，图像暗区、中间区、亮区的编码矩阵的系数值比较小，混合区系数有较大值。因此可以通过分析编码矩阵的最大值来判断显著性区域，设阈值th，定义显著性区域s如下：

，其中i=1,2…,n（11）

信息熵能有效衡量图像的信息量，根据式（6）对s的所有像素求信息熵获得显著性区域的信息量es。显著性区域面积越大，对图像质量的影响越大，因此提取显著性区域的面积比例ratios：

（12）

其中n(·)函数表示计算图像或者图像块的像素个数，i表示图像。显著性特征fs为：

fs={es,ratios}

hdr图像经过色调映射后可能会出现曝光过度或者曝光不足的现象，造成tmi看起来不自然。然而，高质量的tmi不应当破坏其自然特性。tmi的自然度失真主要体现在图像过亮、过暗、不自然的颜色，因此考虑基于亮度和颜色提取自然度特征。在步骤c中所述亮度统计特征提取使用了十四个不同类别场景的自然图像，首先把每一幅图像转化成灰度图像，把灰度图像分割成的图像块，分别求出每个图像块的均值与标准差，最后统计一幅图像中所有图像块的均值与标准差的均值，获得一幅图像的均值和标准差，图像的均值、标准差分别与高斯概率密度函数和beta概率密度函数能够很好地拟合。两个概率密度函数计算如(13)、(14)。

(13)

(14)

其中，b(·)是beta函数，模型的参数设置为μm=115.94，αm=27.99，αd=4.4，βd=10.1，亮度和对比度的联合概率如下：

(15)

其中，𝐾是随着pm和pd改变的标准化因子，k=max{pm，pd}使得统计自然度n标准化。

在步骤c中所述颜色通道统计特征通过rgb颜色空间来提取，局部标准化颜色系数（localnormalizedcolorcoefficients,lncc）服从高斯分布，lncc可以表示为：

（16）

其中是给定图像的c颜色通道某个像素的值，(i,j)是图像的空域坐标。

（17）

（18）

采用广义高斯函数（generalizedgaussiandistribution,ggd）来拟合lncc参数。ggd概率密度函数如下：

（19）

其中，是伽马函数，β为:

(20)

α是形状参数，σ²是尺度参数，准对每一个颜色通道c，用ggd进行拟合获得高斯分布参数（αc，σ²）。因此选择rgb颜色空间来提取颜色自然度特征fc：

fc={αc，σ²|c∈{r,g,b}}

在步骤d中所述机器学习的方法包括svm，提取了聚类感知、显著性区域、自然度三类特征共十六个，设v是tmi的特征向量，可以表示为：

v={fc,fs,n,fc}（21）

在步骤d中所述回归是指通过一个回归模型建立一个函数，这个函数能够映射特征向量到主观图像质量评价分，所述回归模型是指把训练图像的特征向量和对应的mos值输入支持向量机训练出一个预测模型。由于支持向量机（supportvectormachine,svm）在图像处理领域得到广泛的应用，因此把训练图像的特征向量和对应的mos值输入支持向量机训练出一个预测模型f(·)，把测试图像的特征向量输入预测模型获得图像的客观质量预测值q。

q=f(v)（22）

在本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马华林;张立燕
技术所有人：浙江工商职业技术学院
我是此专利的发明人

上一篇：一种基于迁移学习的特殊场景下铁路异物侵限检测方法与流程
上一篇：键盘检测方法及其系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。