一种基于离散不可分离剪切波变换和人眼视觉特性的图像质量评价方法与流程

文档序号:16902903发布日期:2019-02-19 18:10阅读:193来源:国知局
一种基于离散不可分离剪切波变换和人眼视觉特性的图像质量评价方法与流程
本发明涉及图像质量评价方法,尤其涉及一种基于离散不可分离剪切波变换和人眼视觉特性的图像质量评价方法。
背景技术
:图像质量评价是图像处理领域中最基本、最具有挑战性的研究邻域之一。进行图像质量评价研究的目的是得到一个和主观评价保持一致性的客观评价方法。一个成功的客观评价方法能够减少工人繁重的工作,例如通信中图像质量的监控、印刷质量的检测等。此外在很多领域,例如数字图像获取、图像压缩、数字水印、图像恢复、图像的色彩对比度增强、图像的显示等,成功的客观质量评价方法能够在线提高这些领域中实现算法的性能,同时减少计算的复杂度。图像质量评价方法分为主观评价和客观评价。由于主观评价需要消耗大量的时间和人力,成本比较大。此外,主观评价不适合于在线的视觉信号处理,例如编码、传输、中继等。因此,客观评价方法被大量研究。均方误差和峰值信噪比是传统的客观评价方法,这两种方法比较简单,大量用于图像质量的客观评价。但是,它们不能和图像的主观评价结果保持一致。传统的图像质量客观评价方法包括峰值信噪比(peaksignal-to-noiseratio,psnr)和均方误差(meansquarederror,mse)。这两种方法仅仅简单计算原始图像和失真图像之间像素的差值,和人眼主观评价之间的相关性很差。图像质量的客观评价方法是根据人眼视觉在观看一个失真图像时考虑的首要原则去构建评价模型。典型的首要原则包括结构相似性(structuralsimilarity,ssim)方法(wangz,bovikac,sheikhhrandsimoncelliep,“imagequalityassessment:fromerrorvisibilitytostructuralsimilarity”,ieeetransimageprocess,vol.13,no.4,pp.600-612,2004)和视觉信息保真度(visualinformationfidelity,vif)方法(sheikhhrandbovikac,“imageinformationandvisualquality”,ieeetransimageprocess,vol.15,no.2,pp.430-444,2006)。结构相似性方法假设人眼视觉系统高度重视图像结构的失真,并把图像结构的失真程度作为测量图像质量失真的标准。结构相似性方法在图像质量评价领域被进一步的扩展和研究。在视觉信息保真度方法中,图像质量评价问题被认为是信息保真度的问题,通过处理进入人眼视觉中的图像信号去获取认知信息。通过使用小波变换,视觉信息保真度方法把失真图像提供的关于参考图像的信息量使用数值表示。因为人眼是失真图像的最终接受端和评估端,所以非常有必要把人眼视觉系统的心理特性融合进图像质量评价系统的具体实现过程。在过去的二十多年中,大量的工作研究了基于人眼视觉系统特性的图像质量评价。小波变换广泛用于提取图像质量的特征和模拟人眼的多分辨率、局部化特性。尽管小波变换在图像处理的很多方面取得了显著的成功,但是它在大于一维的领域中并不是最优的。实际上,小波变换仅仅对含有点奇异的一维逐段连续的函数提供最优的近似表示。在二维图像中,其它类型的奇异,包括边缘、纹理等,通常占主要地位,小波变换由于缺少方向性不能有效地表示它们。剪切波变换是传统小波变换的一种多维版本,能够在多个尺度和多个方向上分析图像。剪切波变换的多维表示呈现了真实的数学和几何特性,包括多尺度、局部化、各向异性、方向性等。在论文《nonseparableshearlettransform》(wang-qlim,ieeetransimageprocess,vol.22,no.5,pp.2056-2065,2013)中,wang-qlim提出一种图像稀疏表示方法,即离散不可分离剪切波变换(discretenonseparableshearlettransform,dnst)。离散不可分离剪切波变换使用不可分离的生成函数产生紧支撑的剪切波,在空间域提供比小波变换更好的局部化特性和方向选择性。此变换由于具有多分辨率、多方向和局部化的特征,在图像处理邻域中受到了广泛重视。传统的小波变换能够高效地处理一维数据,但是小波变换有缺陷。例如,如果使用小波变换处理图像和视频这种多变量多方向的数据,效果就很差。近年以来,多尺度几何分析(multiscalegeometricanalysis,mga)方法被提出去克服这个缺陷。多尺度几何分析方法包括多个类型,即曲线波变换、轮廓波变换、剪切波变换等。剪切波变换继承了曲线波变换、轮廓波变换的优点,能够实现多维数据和各向异性信息在多个尺度上的稀疏表示。所以,它能够精确地检测图像中信号的奇异性。在二维情况下,剪切波变换定义为:shψf(a,s,t)=<f,ψa,s,t>……(1),公式(1)中,f表示一个函数,a表示尺度参数,s表示剪切参数,t表示平移参数。剪切波ψa,s,t定义为:公式(2)中,aa是一个各向异性的膨胀矩阵,bs表示非扩展的剪切矩阵,ψ表示局部化生成函数,能够满足合适的准许条件。使用f表示一个二维函数,fn表示使用不同变换得到的前m个最大的系数对f进行的重建。得到的逼近误差为:εm=||f-fm||2……(3),如果使用傅里叶变换(fouriertransform),逼近误差为εm≤m-1/2……(4)使用小波变换的逼近误差为:εm≤m-1……(5)小波变换的逼近误差小于傅里叶变换的逼近误差,但是和理论上最优的逼近误差相比还有很大差距。理论上最优的逼近误差为:εm≤m-2……(6),对于剪切波变换,其逼近误差满足:εm≤m-2(logm)3……(7),显然,对于二维逐段平滑函数,剪切波变换提供了比傅里叶变换和小波变换更好的近似特性。剪切波变换的频域具有梯形的特点,类似瓷砖的形状,剪切波变换相对于小波变换、轮廓波变换有很多优点。例如,剪切波变换没有方向数量的限制,而且剪切波变换的剪切滤波器比小波变换、轮廓波变换使用的方向滤波器具有更小的支撑尺寸。wang-qlim提出的离散不可分离剪切波变换和不可分离的剪切波生成器有关。离散不可分离剪切波变换基于离散的框架,能够实现连续变换的数字化表示。此外,它使用紧支撑剪切波,紧支撑剪切波在空域具有最好的局部化特性,提高了以往剪切波类型的方向选择性,能够对多变量数据中各向异性的奇异性进行稀疏地编码。如图1所示zonenplatte_cosinus图片进行离散不可分离剪切波变换的二级分解情况,生成一个低通子带和多个高通子带。第一级尺度分解在不同方向生成4个子带,第二级尺度分解在不同方向生成6个子带。图1中离散不可分离剪切波变换的子带分解,(a)为最初的zonenplatte_cosinus图像,(b)为低通子带,(c)为第一级尺度中4个方向的高通子带,(d)为第二级尺度中6个方向的高通子带。如上,离散不可分离剪切波变换形成了在空域和频域都具有很好局部化特性的parseval框架,而且提供了非常好的方向选择性,能够最优地稀疏表示具有边缘的图像。使用这些很好的特性,离散不可分离剪切波变换适合于图像质量评价领域中的处理工作。基于上述现有技术中存在的不足,如何应用离散不可分离剪切波变换完成图像质量评价方法也成为本发明专利申请亟待解决的问题。技术实现要素:为了弥补现有技术存在的缺陷,本发明提出一种基于离散不可分离剪切波变换和人眼视觉特性的图像质量评价方法,失真图像的质量损失在离散不可分离剪切波变换域中进行评估,离散不可分离剪切波变换是一种新的多尺度方向变换,使用本发明的变换模仿人眼视觉系统的多通道特性,本发明所述图像质量评价方法是使用人眼视觉的多个底层心理特性,包括多通道特性、对比度敏感函数、对比度隐藏、熵隐藏特性、恰能够识别门限、差值集成。在离散不可分离剪切波变换域中不同尺度不同方向子带中的每个位置点定义局部对比度,然后,在离散不可分离剪切波变换域中建立一个新的恰可识别检测门限,其中,在视觉隐藏效应问题中,不仅考虑对比度隐藏效应,而且也考虑熵隐藏效应,熵隐藏效应能够测量由于图像半局部复杂性引起的可视性门限的变化,最后,使用minkowski公式集成所有的差值产生最终的质量值。为了实现上述目的,本发明采取的技术解决方案是:本发明所述基于离散不可分离剪切波变换和人眼视觉特性的图像质量评价方法包括以下步骤:步骤一、对图像进行离散不可分离剪切波变换;步骤二、使用离散不可分离剪切波变换子带中的系数计算离散不可分离剪切波变换域中的局部对比度;步骤三、使用对比度敏感函数构建对比度检测门限;步骤四、计算离散不可分离剪切波变换域的视觉隐藏效应;步骤五、计算离散不可分离剪切波变换域的恰可识别检测门限;步骤六、集成所有的差值作为失真图像的客观评价值。进一步地,步骤一中,构建人眼视觉系统的模型,使用离散不可分离剪切波变换模拟人眼视觉系统中信息处理机制的多通道特性,离散不可分离剪切波变换将参考图像和失真图像分解成不同尺度不同方向的多个子带;进一步地,步骤二中,采用离散不可分离剪切波变换子带中的系数,计算离散不可分离剪切波变换域中的局部对比度:为了提取参考图像和失真图像的特征,使用离散不可分离剪切波变换模拟人眼视觉系统的多通道特性,在离散不可分离剪切波变换域中计算参考图像和失真图像的局部对比度,这里,使用五级离散不可分离剪切波变换进行变换,每级尺度从高频到低频分别具有16、16、16、8、8个方向子带,为了说明自然图像和复杂图像中的非平稳性和局部结构,需要按照以下公式(8)与公式(9)定义局部对比度:公式(8)、(9)中,cs,o(x,y)表示第s级尺度第o个方向子带中位置(x,y)处的局部对比度,is,o(x,y)表示位于第s级尺度第o个方向子带中位置(x,y)处离散不可分离剪切波变换的系数,ls(x,y)表示背景的能量,即低于第s级尺度对应频率的所有响应之和;进一步地,步骤三中,使用对比度敏感函数构建对比度检测门限:对比度敏感在频域中具有非线性的带通特性,对不同的频率呈现不同的敏感强度,采用对比度敏感函数表示由空间频率敏感性引起的变化特征,对比度敏感函数在中频达到最大值,在低频和高频逐渐衰减,以对比度敏感函数的模型即h(f)来数量化的描述人眼视觉对空间频率的敏感程度,如以下公式(10)所示:公式(10)中,f表示径向空间频率,参数fpeak等于8,参数λ等于0.114,另外,人眼视觉系统具有倾斜效应,即人眼对水平方向和竖直方向具有最大的敏感性,在对角线方向具有最小的敏感性,公式(10)中的h(f)和f分别被h(f,θ)和fθ代替,fθ如以下公式(11)所示:fθ=f/[0.15cos(4θ)+0.85]……(11),公式(11)中,θ表示方向,fθ表示由于倾斜效应引起的f的变化,对于水平方向或竖直方向,θ等于0或π/2,对于对角线方向,θ等于π/4或3π/4,这里h(f,θ)产生近似-3db的衰减,上述的对比度检测门限是指观察者能够感知目标信号对比度的最小值,定义为对比度敏感函数的倒数,如下式所示:公式(12)中,cts,o表示第s级尺度第o个方向子带的对比度检测门限;进一步地,步骤四中,计算离散不可分离剪切波变换域的视觉隐藏效应:视觉隐藏效应是指人眼视觉由于背景信号或隐藏信号的出现而引起目标信号可视性门限的变化情况,当目标信号和背景信号具有相似的空间频率、方向、相位时,视觉隐藏效应就会变得明显,视觉隐藏效应包括对比度隐藏效应和熵隐藏效应,对比度隐藏效应表明,目标信号检测门限随着背景信号对比度的变化而变化,是背景信号对比度的函数,背景信号的强度能使用目标信号检测门限的数值化表示,使用以下公式(13)计算在离散不可分离剪切波变换域中的对比度隐藏效应模型:公式(13)中,cms,o(x,y)表示由于对比度隐藏引起的在位置(x,y)处可视性门限的变化,s表示尺度,o表示方向,参数k1和k2决定对比度曲线的枢轴点,参数b决定曲线在过度区域跟随渐近线的状况,其变化范围是2~4,参数s表示隐藏对比度渐近线的斜率,其变化范围是0.65~1,c′s,o(x,y)表示加权后的局部对比度,这里,使用对比度敏感函数h(f,θ)对局部对比度进行加权,c′s,o(x,y)表示如公式(14)所示:c′s,o(x,y)=cs,o(x,y)·h(f,θ)|f=s,θ=o……(14),在视觉隐藏效应中,除了对比度隐藏效应,熵隐藏效应也需要被同时处理,对比度隐藏效应仅考虑由于对比度值引起的可视性门限的改变,熵隐藏效是指由邻域特性引起的可视性门限的改变,熵隐藏效应具有的特点是,隐藏效果是隐藏信号不确定性的函数,这种隐藏效应也称为邻域隐藏,熵隐藏效应的作用是对比度隐藏效应的补充,熵隐藏效应强度的数值化表示依靠目标信号的邻域特性,考虑到熵隐藏效应,公式(13)中的可视性门限需要进行调整,按照如下公式(15)所示进行调整:公式(15)中,vms,o(x,y)表示在第s级尺度第o个方向子带中位置(x,y)处改变后的可视性门限,δs(x,y)表示邻域复杂性的参数,能够从参考图像和失真图像中的组成部分进行估计,使用一个s型函数把熵值e(x,y)映射到δs(x,y)中,如公式所(16)所示:公式(16)中,参数b1、b2和b3设置为:b1=0.3,b2=2,b3=1,熵值e(x,y)表示邻域的活动性,通过一个n×n的邻域进行计算,如公式(17)所示:e(x,y)=-∑p(x,y)log(p(x,y))……(17),公式(17)中,p(x,y)表示概率,根据位置(x,y)处n×n邻域的亮度直方图计算;进一步地,步骤五中,计算离散不可分离剪切波变换域的恰可识别检测门限:视觉的恰可识别检测门限是指一个最小的可视性门限,低于最小的可视性门限的变化不易被观察者检测到,将会被人眼忽略掉,以对比度检测门限为基础,定义离散不可分离剪切波变换域中的恰可识别检测门限,其中融合了视觉隐藏模型,如以下公式(18)所示:jnds,o(x,y)=cts,ovms,o(x,y)……(18),公式(18)中jnds,o(x,y)表示第s级尺度第o个方向子带中位置(x,y)处的恰可识别检测门限,cts,o表示对比度检测门限,vms,o(x,y)表示第s级尺度第o个方向子带位置(x,y)的视觉隐藏强度的测量值,表示由于视觉隐藏效应引起的人眼视觉系统检测门限的变化,这里使用的恰可识别检测门限除了考虑对比度隐藏效应之外,还考虑了熵隐藏效应;进一步地,步骤六中,集成所有的差值作为失真图像的客观评价值:在参考图像和失真图像之间局部对比度的差值小于恰可识别检测门限,人眼将观察不到任何失真效果,离散不可分离剪切波变换子带中每个系数的感知差值,如以下公式(19)所示:公式(19)中,pes,o(x,y)表示每个子带的感知差值图,es,o(x,y)表示离散不可分离剪切波变换域中的参考图像和失真图像局部对比度之间差值的绝对值,如以下公式(20)所示:公式(20)中,和分别表示参考图像和失真图像在离散不可分离剪切波变换域中的局部对比度,对于相同数量的es,o(x,y),当jnds,o(x,y)比较大时,感知差值将会变小,当pes,o(x,y)等于0时,表示观察不到失真图像中的失真,pes,o(x,y)的增加意味着感知失真的增加和图像视觉质量的减小,在离散不可分离剪切波变换域中,各个尺度、各个方向子带中每个位置的感知差值集成在一起,全部的差值集成包括子带内部的集成和子带之间的集成,子带内部的差值集成如以下公式(21)所示:公式(21)中,pes,o表示子带内部集成的结果,xs,o和ys,o分别表示第s级尺度第o个方向子带的高度和宽度,求和指数β是一个经验参数,β值为4,子带之间的差值集成包括同一个尺度内部不同方向子带的集成、全部尺度的集成,如以下公式(22)、(23)表示:公式(22)、(23)中,pes表示在第s级尺度上全部方向的集成,os表示第s级尺度中方向的全部数量,pe表示所有尺度集成的结果,n表示分解尺度的全部数量,βo取值2.3,βs取值2.5,根据weber-fechner定律,即目标信号的感知强度和目标信号物理亮度的对数成正比,定义失真图像的质量qa,如以下公式(24)所示:qa=log10(pe+1)……(24),公式(24)中,使用常数1,以使失真图像的质量值不会出现负值。本发明所述方法的有益效果在于:1、本发明所述方法使用离散不可分离剪切波变换模仿人眼视觉系统的多通道特性,同时考虑了对比度敏感函数和视觉隐藏效应,形成离散不可分离剪切波变换域的恰可识别检测门限。对于视觉隐藏效应,本发明所述方法不仅仅使用对比度隐藏效应,还使用熵隐藏效应,使用minkowski求和实现差值集成,并产生了一个客观值用来表示失真图像的质量。2、本发明所述方法在匹配主观评价值的一致性方面,比目前最先进的图像质量评价方法具有更好的性能,本发明所述方法具有更好的预测精度,和人眼视觉的主观评价值具有更好的一致性。附图说明图1是离散不可分离剪切波变换的子带分解示意图;图2是本发明所述方法的步骤流程示意图;图3((a)-(e))是五个图像数据库中本发明所述方法的预测值和主观评价值之间的散点图和拟合曲线。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。本发明所述方法包括如下步骤:步骤一、对参考图像和失真图像分别进行离散不可分离剪切波变换:为了构建人眼视觉系统的模型,使用离散不可分离剪切波变换模拟人眼视觉系统中信息处理机制的多通道特性,离散不可分离剪切波变换将参考图像和失真图像分解成不同尺度不同方向的多个子带;步骤二、采用离散不可分离剪切波变换子带中的系数,计算离散不可分离剪切波变换域中的局部对比度;为了提取参考图像和失真图像的特征,使用离散不可分离剪切波变换模拟人眼视觉系统的多通道特性,在离散不可分离剪切波变换域中计算参考图像和失真图像的局部对比度,这里,使用五级离散不可分离剪切波变换进行变换,每级尺度从高频到低频分别具有16、16、16、8、8个方向子带,为了说明自然图像和复杂图像中的非平稳性和局部结构,需要按照以下公式(8)与公式(9)定义局部对比度:公式(8)、(9)中,cs,o(x,y)表示第s级尺度第o个方向子带中位置(x,y)处的局部对比度,is,o(x,y)表示位于第s级尺度第o个方向子带中位置(x,y)处离散不可分离剪切波变换的系数,ls(x,y)表示背景的能量,即低于第s级尺度对应频率的所有响应之和;步骤三、使用对比度敏感函数构建对比度检测门限:对比度敏感在频域中具有非线性的带通特性,对不同的频率呈现不同的敏感强度,采用对比度敏感函数表示由空间频率敏感性引起的变化特征,对比度敏感函数在中频达到最大值,在低频和高频逐渐衰减,以对比度敏感函数的模型,即h(f)来数量化的描述人眼视觉对空间频率的敏感程度,如以下公式(10)所示:公式(10)中,f表示径向空间频率,参数fpeak等于8,参数λ等于0.114,另外,人眼视觉系统具有倾斜效应,即人眼对水平方向和竖直方向具有最大的敏感性,在对角线方向具有最小的敏感性,公式(10)中的h(f)和f分别被h(f,θ)和fθ代替,fθ如以下公式(11)所示:fθ=f/[0.15cos(4θ)+0.85]……(11),公式(11)中,θ表示方向,fθ表示由于倾斜效应引起的f的变化,对于水平方向或竖直方向,θ等于0或π/2,对于对角线方向,θ等于π/4或3π/4,这里h(f,θ)产生近似-3db的衰减,对比度检测门限是指观察者能够感知目标信号对比度的最小值,定义为对比度敏感函数的倒数,如下式所示:公式(12)中,cts,o表示第s级尺度第o个方向子带的对比度检测门限;步骤四、计算离散不可分离剪切波变换域的视觉隐藏效应;视觉隐藏效应是指人眼视觉由于背景信号或隐藏信号的出现而引起目标信号可视性门限的变化情况,当目标信号和背景信号具有相似的空间频率、方向、相位时,视觉隐藏效应就会变得明显,视觉隐藏效应包括两部分,即对比度隐藏效应和熵隐藏效应,对比度隐藏效应表明,目标信号检测门限随着背景信号对比度的变化而变化,是背景信号对比度的函数,背景信号的强度能使用目标信号检测门限的数值化表示,使用以下公式(13)计算在离散不可分离剪切波变换域中的对比度隐藏效应模型:公式(13)中,cms,o(x,y)表示由于对比度隐藏引起的在位置(x,y)处可视性门限的变化,s表示尺度,o表示方向,参数k1和k2决定对比度曲线的枢轴点,参数b决定曲线在过度区域跟随渐近线的状况,其变化范围是2~4,参数s表示隐藏对比度渐近线的斜率,其变化范围是0.65~1,c′s,o(x,y)表示加权后的局部对比度,这里,使用对比度敏感函数h(f,θ)对局部对比度进行加权,c′s,o(x,y)表示如公式(14)所示:c′s,o(x,y)=cs,o(x,y)·h(f,θ)|f=s,θ=o……(14),在视觉隐藏效应中,除了对比度隐藏效应,熵隐藏效应也需要被同时处理,对比度隐藏效应仅考虑由于对比度值引起的可视性门限的改变,熵隐藏效应指由于邻域特性引起的可视性门限的改变,熵隐藏效应具有一个特点,即隐藏效果是隐藏信号不确定性的函数,这种隐藏效应也称为邻域隐藏,熵隐藏效应的作用是对比度隐藏效应的补充,熵隐藏效应强度的数值化表示依靠目标信号的邻域特性,考虑到熵隐藏效应,公式(13)中的可视门限需要进行调整,按照如下公式(15)所示:公式(15)中,vms,o(x,y)表示在第s级尺度第o个方向子带中位置(x,y)处改变后的可视门限,δs(x,y)表示邻域复杂性的参数,能够从参考图像和失真图像中的组成部分进行估计,使用一个s型函数把熵值e(x,y)映射到δs(x,y)中,如公式所(16)所示:公式(16)中,参数b1、b2和b3设置为:b1=0.3,b2=2,b3=1,熵值e(x,y)表示邻域的活动性,通过一个n×n的邻域进行计算,如公式(17)所示:e(x,y)=-∑p(x,y)log(p(x,y))……(17),公式(17)中,p(x,y)表示概率,根据位置(x,y)处n×n邻域的亮度直方图计算;步骤五、计算离散不可分离剪切波变换域的恰可识别检测门限:视觉的恰可识别检测门限是指一个最小的可视门限,低于最小的可视门限的变化不易被观察者检测到,将会被人眼忽略掉,以对比度检测门限为基础,定义离散不可分离剪切波变换域中的恰可识别检测门限,其中融合了视觉隐藏模型,如以下公式(18)所示:jnds,o(x,y)=cts,ovms,o(x,y)……(18),公式(18)中jdns,o(x,y)表示第s级尺度的第o个方向子带中位置(x,y)处的恰可识别检测门限,cts,o表示对比度检测门限,vms,o(x,y)对第s级尺度第o个方向子带位置(x,y)处视觉隐藏的强度进行测量,表示由于视觉隐藏效应引起的人眼视觉系统检测门限的变化,这里使用的恰可识别检测门限除了考虑对比度隐藏效应之外,还考虑了熵隐藏效应;步骤六、集成所有的差值作为失真图像的客观评价值:在参考图像和失真图像之间局部对比度的差值小于恰可识别检测门限,人眼将观察不到任何失真效果,离散不可分离剪切波变换子带中每个系数的感知差值,如以下公式(19)所示:公式(19)中,pes,o(x,y)表示每个子带的感知差值图,es,o(x,y)表示离散不可分离剪切波变换域中的参考图像和失真图像局部对比度之间差值的绝对值,如以下公式(20)所示:公式(20)中,和分别表示参考图像和失真图像在离散不可分离剪切波变换域中的局部对比度,对于相同数量的es,o(x,y),当jnds,o(x,y)比较大时,感知差值将会变小,当pes,o(x,y)等于0时,表示观察不到失真图像中的失真,pes,o(x,y)的增加意味着感知失真的增加和图像视觉质量的减小,在离散不可分离剪切波变换域中,各个尺度、各个方向子带中每个位置的感知差值集成在一起,全部的差值集成包括子带内部的集成和子带之间的集成,子带内部的差值集成如以下公式(21)所示:公式(21)中,pes,o表示子带内部集成的结果,xs,o和ys,o分别表示第s级尺度第o个方向子带的高度和宽度,求和指数β是一个经验参数,β值为4,子带之间的差值集成包括同一个尺度内部不同方向子带的集成、全部尺度的集成,如以下公式(22)、(23)表示:公式(22)、(23)中,pes表示在第s级尺度上全部方向的集成,os表示第s级尺度中方向的全部数量,pe表示所有尺度集成的结果,n表示分解尺度的全部数量,βo取值2.3,βs取值2.5,根据weber-fechner定律,即目标信号的感知强度和目标信号物理亮度的对数成正比,定义失真图像的质量qa,如以下公式(24)所示:qa=log10(pe+1)……(24),公式(24)中,使用常数1,以使失真图像的质量值不会出现负值。以下,从三个方面对本发明所述方法与其他方法进行比较:1、全面的性能比较如图3((a)-(e))所示,在五个图像数据库中,本发明所述方法的预测值和主观评价值之间的散点图和拟合曲线。如图3所示关联图和拟合曲线,(a)为tid2008数据库,(b)为tid2013数据库,(c)为live数据库,(d)为ivc数据库,(e)为csiq数据库。图3((a)-(e))中的每个点表示图像数据库中的一个失真图像。图3((a)-(e))中的纵轴表示图像数据库的主观评价值dmos或mos,横轴表示本发明所述方法经过非线性回归处理之后的预测值。如图3((a)-(e))所示,本发明所述方法预测的客观评价值和主观评价值具有高度的一致性。在实验中,比较了本发明的方法和六个具有代表性的全参考图像质量评价方法,其中包括两个最常使用的传统方法,即psnr和多尺度结构相似性(multi-scalestructuralsimilarity,ms-ssim)(wangz,simoncelliepandbovikac,“multi-scalestructuralsimilarityforimagequalityassessment”,confrecasilomarconfsignalsystcomput,vol.2,pp.1398-1402,2003)方法,和四个目前水平最好的全参考图像质量评价方法,即vif、vsnr(chandlerdmandhemamiss,“vsnr:awavelet-basedvisualsignal-to-noiseratiofornaturalimages”,ieeetransimageprocess,vol.16,no.9,pp.2284-2298,2007)、fsim(zhangl,zhangl,mouxandzhangd,“fsim:afeaturesimilarityindexforimagequalityassessment”,ieeetransimageprocess,vol.20,no.8,pp.2378-2386,2011)、nqm(damera-venkatan,kitetd,geislerws,evansblandbovikac,“imagequalityassessmentbasedonadegradationmodel”,ieeetransimageprocess,vol.9,no.4,pp.636-650,2000)。为了比较它们的性能,计算了cc、srocc、rmse、or,并在表1列出。在表1的每种性能测量值中,每种数据库中的前三个最好的客观评价值使用粗体表示。表1七种客观评价方法性能的全面比较如表1所示,可以看出本发明所述方法在所有的数据库上都表现很好。特别对于tid2008、tid2013、ivc和csiq,根据cc、srocc、rmse和or这些指标,本发明方法是一致性最好的客观评价方法。本发明方法具有很好的性能,在tid2008、tid2013、live、ivc、csiq上分别具有的cc值为0.9271、0.9171、0.9567、0.9423和0.9365。此外,为了进行全面的性能比较,计算了性能测量参数cc、srocc、rmse的加权平均值,如表1所示。每个数据库的权值定义为这个数据库的图像数量除以全部数据库中图像数量的总和,如表2所示。显然,对于这些所有的图像数据库,根据加权平均值,本发明所述方法也超过了其它任何一种方法。表2每个数据库的权重数据库tid2008tid2013liveivccsiq权值0.25790.45520.11680.03570.13442、统计意义的比较为了比较本发明所述方法和其它方法的统计意义,使用f-test。根据主观评价值和非线性回归后的客观评价值之间的预测差值计算f-test。预测的差值如下式所示:di=oi-sii=1,2,...,n……(27)公式(27)中,oi表示第i个客观评价值,si表示第i个主观评价值,n表示实验中失真图像的数量。预测差值被认为符合高斯分布。对于一个客观评价方法,如果预测差值的方差越小,那么它的预测性能就越好。如表3所示,列出了在五个数据库上每种方法预测差值的方差,每种数据库中最小的方差使用黑体表示。这里,使用f-ratio表示两个客观评价方法预测差值方差之间的比值,其中,较大的方差放在分子,较小的方差放在分母。如果f-ratio大于门限值,那么这两个客观评价方法在统计意义上的比较就是有意义的。此门限值和预测差值的数量、指定的置信度有关。这里,实验中使用的置信度是95%。如表4所示,列出了多个方法关于统计意义的性能比较结果。如表4所示,值“1”表示在95%的置信度上,本发明所述方法的统计意义好于表格中第一行方法的统计意义,同理“0”表示本发明所述方法的统计意义差于表格中第一行方法的统计意义,“-”表示这两种方法的统计意义无法分辨。表3在五个数据库中客观评价方法预测差值的方差表4根据统计意义得到的比较结果数据库psnrms-ssimvifvsnrfsimnqmtid20081-1111tid2013111111live1-0101ivc11-1-1csiq1111-1如表3所示,本发明所述方法相对于其它方法,除了live数据库,在其它数据库上都具有最小的方差。对于live数据库,本发明方法的方差和最小值(fsim的方差)具有较好的接近度。如表4所示,本发明所述方法在统计意义上好于大多数的其它方法。3、计算复杂度比较计算复杂度是图像质量客观评价方法最重要的特点之一。如表5所示,列出了七种全参考图像质量评价方法的平均计算时间。在一个具有3.2-ghzintelcore4的cpu和4gram的计算机上进行仿真实验,使用matlabr2014作为软件开发平台去编程实现这些客观评估算法。对每种方法,在tid2008数据库上计算失真图像平均的执行时间,每个失真图像的分辨率是384×512像素,执行时间的单位是秒。如表5所示实验结果表明,本发明所述方法比vif、fsim、nqm需要更少的时间。其中,vif方法需要的时间最长。此外,psnr、ms-ssim和vsnr需要的时间比本发明所述方法更少,但是这几种方法的性能差于本发明所述方法,这可以从表1和表3中得出。总之,本发明所述方法明显具有中等的计算复杂度,相对于其它的方法具有显著的优势。表5七种全参考图像质量评价方法的平均执行时间最后应说明的是:以上实施例仅说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1