基于高维离散余弦变换的无参考光场图像质量评价方法

文档序号：25427564发布日期：2021-06-11 21:41阅读：134来源：国知局

本发明涉及一种图像质量评价方法，尤其是涉及一种基于高维离散余弦变换的无参考光场图像质量评价方法。

背景技术：

光场图像质量的定量评价是光场图像处理领域中具有挑战性的问题。与平面图像相比，光场图像同时包含了空间强度信息和方向信息，提供了更为丰富的视觉信息。近年来，随着商用光场相机的推出，光场图像在工业界和商业界逐渐普及。因此，光场图像被广泛地采集、处理、传输、储存，并显示在各类应用中。在光场图像的处理过程中，将不可避免地造成光场图像的失真，从而会降低用户对于光场图像的使用体验。为了向用户提供更为优质的服务，实时检测并准确地评估光场图像的质量是有必要的。因此，光场图像质量评价也成为了光场图像处理领域中具有挑战性的问题。

迄今为止，许多研究人员已经提出了许多较为成熟的平面图像客观质量评价方法，这些平面图像客观质量评价方法能够较为准确地预测平面图像质量。然而，光场图像不仅包含了场景的空间强度信息，而且也记录了场景的方向信息。因此，光场图像质量不单单与空间质量有关，还与光场图像的角度一致性相关。此外，光场图像还能提供场景的深度信息，故而光场图像的深度感知也是不容忽视的。简单地说，光场图像因其高维结构特性，使得平面图像客观质量评价方法并不适用于对光场图像客观质量的预测。

目前，对于光场图像客观质量评价方法的探索只是初步，现有的光场图像客观质量评价方法还很少。如：tian等人提出的一种全参考光场图像质量评价方法(y.tian,h.zeng,l.xing,j.chen,j.zhu,andk.ma,“amulti-orderderivativefeature-basedqualityassessmentmodelforlightfieldimage,”j.vis.commun.imagerepresent.,vol.57,pp.212-217,nov.2018.(基于多阶导数特征的光场图像质量评估模型))，该方法为mdfm方法，该方法对原始光场图像和失真光场图像的每个子孔径图像进行二阶梯度导数的相似度比较，得到失真光场图像的每个子孔径图像的结构相似度值，并平均失真光场图像的所有子孔径图像的结构相似度值作为失真光场图像的质量分数。又如：shi等人提出的一种无参考光场图像质量评价方法(l.shi,s.zhao,andz.chen,“belif:blindqualityevaluatoroflightfieldimagewithtensorstructurevariationindex,”inproc.ieeeint.conf.imageprocess.(icip),taipei,taiwan,sept.2019,pp.3781-3785.(belif:基于张量结构变化指数的光场图像盲质量评价器))，其被命名为盲光场图像质量估计器(简称为：belif)，该方法首先生成光场图像的独眼图阵列，然后使用张量分解获取独眼图阵列的第一切片并测量了第一切片中的自然度来衡量光场图像的空间质量，接着用第一切片与独眼图阵列中的每幅独眼图进行结构相似度比较来获取光场图像的角度一致性。再如：shi等人进一步提出了一种无参考光场图像质量评价方法(l.shi,w.zhou,z.chenandj.zhang,“no-referencelightfieldimagequalityassessmentbasedonspatial-angularmeasurement,”ieeetransactionsoncircuitsandsystemsforvideotechnology,vol.30,no.11,pp.4114-4128,nov.2020.(基于空间-角度测量的无参考光场图像质量评估))，简称为：nr-lfqa，该方法结合了独眼图阵列和极平面图像来估计光场图像质量。再如：zhou等人提出了一种无参考光场图像质量评价方法(w.zhou,l.shi,z.chenandj.zhang,“tensororientedno-referencelightfieldimagequalityassessment,”ieeetrans.imageprocess.,vol.29,pp.4070-4084,2020.(张量定向无参考光场图像质量评估))，简称为tensor-nlfq，该方法使用张量分解去提取四个方向子孔径图像栈中的主成分，然后评估主成分中的自然度来捕获光场图像的空间质量，再用主成分与子孔径图像栈中的每个视点进行结构相似度比较来估计光场图像的角度一致性。

全参考光场图像质量评价方法需要原始光场图像的信息，在某些无法获取原始光场图像的信息的情况下，全参考光场图像质量评价方法将无法使用；无参考光场图像质量评价方法不需要原始光场图像的信息，但是更需要关注它的预测性能，上述现有的无参考光场图像质量评价方法的客观评价结果与主观感知质量的一致性还有待提高。

技术实现要素：

本发明所要解决的技术问题是提供一种基于高维离散余弦变换的无参考光场图像质量评价方法，其无需原始光场图像的任何信息，且能够获得与主观感知质量高度相似的客观评价结果。

本发明解决上述技术问题所采用的技术方案为：一种基于高维离散余弦变换的无参考光场图像质量评价方法，其特征在于包括以下步骤：

步骤1：将待评价的4维的光场图像记为l，l的角度分辨率为u×v，l的空间分辨率为x×y；然后将l视作为2维的子孔径图像阵列，子孔径图像阵列由u×v幅子孔径图像构成，每幅子孔径图像的分辨率为x×y，将子孔径图像阵列中视点坐标位置为(u,v)的子孔径图像记为iu,v；其中，1≤u≤u，1≤v≤v；

步骤2：将子孔径图像阵列中除最后一行和最后一列外的每幅子孔径图像作为待处理子孔径图像，将子孔径图像阵列中视点坐标位置为(u',v')的待处理子孔径图像记为iu',v'；然后计算子孔径图像阵列中的每幅待处理子孔径图像与其水平相邻的子孔径图像之间的水平差分图像，将iu',v'与其水平相邻的子孔径图像即子孔径图像阵列中视点坐标位置为(u'+1,v')的待处理子孔径图像iu'+1,v'之间的水平差分图像记为将中坐标位置为(x,y)的像素点的像素值记为并计算子孔径图像阵列中的每幅待处理子孔径图像与其垂直相邻的子孔径图像之间的垂直差分图像，将iu',v'与其垂直相邻的子孔径图像即子孔径图像阵列中视点坐标位置为(u',v'+1)的待处理子孔径图像iu',v'+1之间的垂直差分图像记为将中坐标位置为(x,y)的像素点的像素值记为接着计算子孔径图像阵列中的每幅待处理子孔径图像的子孔径梯度图像，将iu',v'的子孔径梯度图像记为gu',v'，将gu',v'中坐标位置为(x,y)的像素点的像素值记为gu',v'(x,y)，在得到子孔径图像阵列中的所有待处理子孔径图像的子孔径梯度图像后，将子孔径图像阵列转换成子孔径梯度图像阵列，记为g，g的角度分辨率为(u-1)×(v-1)，即由(u-1)×(v-1)幅子孔径梯度图像构成，g的空间分辨率为x×y，即每幅子孔径梯度图像的分辨率为x×y；其中，1≤u'≤u-1，1≤v'≤v-1，1≤x≤x，1≤y≤y，符号“||”为取绝对值符号，iu',v'(x,y)表示iu',v'中坐标位置为(x,y)的像素点的像素值，iu'+1,v'(x,y)表示iu'+1,v'中坐标位置为(x,y)的像素点的像素值，iu',v'+1(x,y)表示iu',v'+1中坐标位置为(x,y)的像素点的像素值；

步骤3：将g划分为个互不重叠的尺寸为4×4×4×4的4d块，将g中的第s个4d块记为gbs，将gbs中坐标位置为(u1,v1,x1,y1)的像素点的像素值记为gbs(u1,v1,x1,y1)；然后采用四维离散余弦变换技术将g中的每个4d块转换到4d-dct域中，得到g中的每个4d块对应的频域块，将gbs对应的频域块记为fbs，将fbs中频域坐标位置为上的值记为即为gbs在4d-dct域中在频域坐标位置上的4d-dct系数，gbs在4d-dct域中共包含有256个4d-dct系数，包括1个直流系数和255个交流系数，当时gbs在4d-dct域中在频域坐标位置(1,1,1,1)上的4d-dct系数为直流系数；其中，符号为向下取整符号，1≤u1≤4，1≤v1≤4，1≤x1≤4，1≤y1≤4，函数g()的功能定义为a1,a2为两个参数；

步骤4：计算g中的所有4d块在4d-dct域中在相同频域坐标位置上的交流系数所对应的能量值，在不为(1,1,1,1)的情况下将g中的所有4d块在4d-dct域中在频域坐标位置上的交流系数所对应的能量值记为然后将得到的255个能量值按顺序排列构成维数为255×1的能量向量，作为l对应的能量向量，并记为e，e＝[e1,e2,…,ek,…,e255]^t；其中，1≤k≤255，符号“[]”为向量或矩阵表示符号，e1表示e中的第1个元素，e2表示e中的第2个元素，ek表示e中的第k个元素，e255表示e中的第255个元素，k与的关系为：e1＝e(1,1,1,2)，e2＝e(1,1,1,3)，e255＝e(4,4,4,4)，上标“t”表示向量或矩阵的转置；

步骤5：提取出g中的所有4d块在4d-dct域中在相同频域坐标位置上的交流系数的振幅并构成维数为1×sz的振幅向量，在不为(1,1,1,1)的情况下将g中的所有4d块在4d-dct域中在频域坐标位置上的交流系数的振幅构成的振幅向量记为然后对得到的每个振幅向量用韦伯概率分布进行拟合，拟合后得到对应的尺度参数，将对用韦伯概率分布进行拟合后得到的对应的尺度参数记为再将得到的255个尺度参数按顺序排列构成维数为255×1的无符号系数分布特征向量，作为l对应的无符号系数分布特征向量，并记为λ，λ＝[λ1,λ2,…,λk,…,λ255]^t；其中，符号“||”为取绝对值符号，表示g中的第1个4d块记为gb1对应的频域块fb1中频域坐标位置为上的值，表示g中的第sz个4d块记为gbsz对应的频域块fbsz中频域坐标位置为上的值，为的振幅，为的振幅，为的振幅，λ1表示λ的第1个元素，λ2表示λ的第2个元素，λk表示λ的第k个元素，λ255表示λ的第255个元素，k与的关系为：λ1＝w(1,1,1,2)，λ2＝w(1,1,1,3)，λ255＝w(4,4,4,4)；

步骤6：选取n幅用于训练的4维的无失真光场图像，按照步骤1至步骤5的过程，以相同的方式获取每幅无失真光场图像对应的能量向量和无符号系数分布特征向量；然后将n幅无失真光场图像对应的能量向量构成训练的能量矩阵，记为ze，ze＝[te1,te2,…,ten,…,ten]，将n幅无失真光场图像对应的无符号系数分布特征向量构成训练的无符号系数分布特征矩阵，记为zw，zw＝[tw1,tw2,…,twn,…,twn]；然后对ze进行主成分分析，获得维数为255×m1的能量投影矩阵，记为同样，对zw进行主成分分析，获得维数为255×m2的无符号系数分布特征投影矩阵，记为其中，n≥100，无失真光场图像的角度分辨率为u×v，无失真光场图像的空间分辨率为x×y，ze和zw的维数均为255×n，te1表示第1幅无失真光场图像对应的能量向量，te2表示第2幅无失真光场图像对应的能量向量，ten表示第n幅无失真光场图像对应的能量向量，ten表示第n幅无失真光场图像对应的能量向量，tw1表示第1幅无失真光场图像对应的无符号系数分布特征向量，tw2表示第2幅无失真光场图像对应的无符号系数分布特征向量，twn表示第n幅无失真光场图像对应的无符号系数分布特征向量，twn表示第n幅无失真光场图像对应的无符号系数分布特征向量，1≤n≤n，m1和m2均为正整数，1≤m1+m2＜n；

步骤7：对e进行去中心化处理，得到去中心化处理后的能量向量，记为同样，对λ进行去中心化处理，得到去中心化处理后的无符号系数分布特征向量，记为然后用对进行降维，得到l对应的裁剪的能量向量，记为fe，同样，用对进行降维，得到l对应的裁剪的无符号系数分布特征向量，记为fw，其中，和的维数为255×1，μze为通过对ze中的每行逐行求平均得到，即μze中的第k个元素为ze中的第k行的所有元素的平均值，μzw为通过对zw中的每行逐行求平均得到，即μzw中的第k个元素为zw中的第k行的所有元素的平均值，fe的维数为m1×1，fw的维数为m2×1；

步骤8：将fe和fw连接起来构成的向量作为l的感知特征向量，记为f，f＝[(fe)^t,(fw)^t]；其中，f的维数为1×(m1+m2)；

步骤9：将f作为输入，结合支持向量回归技术，计算得到l的客观质量评价分数，记为qpredict；其中，qpredict越大，说明输入的f对应的光场图像的质量越好；反之，说明输入的f对应的光场图像的质量越差。

与现有技术相比，本发明的优点在于：

(1)本发明方法是一种无参考光场图像质量评价方法，这与全参考光场图像质量评价方法相比，本发明方法不需要原始光场图像的任何信息就可以预测失真光场图像的客观质量评价分数，因此，本发明方法可以广泛地适用于无法直接获取原始光场图像信息的情景。

(2)作为一种无参考光场图像质量评价方法，由于在没有原始光场图像信息的前提下对待评价光场图像进行质量预测，其准确性往往受到更多地关注，本发明方法与现有的无参考质量评价方法相比，本发明方法考虑了失真光场图像的失真特点和内在的高维结构性，将子孔径图像阵列转换成子孔径梯度图像阵列，然后再使用四维离散余弦变换(4d-dct)将子孔径梯度图像阵列转换到4d-dct域，这有效地保留了失真光场图像的高维结构信息，并捕捉了与主观感知更为相关的特征，因此最终能够获得与主观感知质量高度相似的客观评价结果。

附图说明

图1为本发明方法的总体实现框图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于高维离散余弦变换的无参考光场图像质量评价方法，其总体实现框图如图1所示，其包括以下步骤：

步骤1：将待评价的4维的光场图像记为l，l的角度分辨率为u×v，l的空间分辨率为x×y；然后将l视作为2维的子孔径图像阵列，子孔径图像阵列由u×v幅子孔径图像(sai)构成，每幅子孔径图像的分辨率为x×y，将子孔径图像阵列中视点坐标位置为(u,v)的子孔径图像记为iu,v；其中，1≤u≤u，1≤v≤v，u、v、x、y由实际的4维的光场图像确定。

步骤3：将g划分为个互不重叠的尺寸为4×4×4×4的4d块，将g中的第s个4d块记为gbs，将gbs中坐标位置为(u1,v1,x1,y1)的像素点的像素值记为gbs(u1,v1,x1,y1)；然后采用四维离散余弦变换(4d-dct)技术将g中的每个4d块转换到4d-dct域中，得到g中的每个4d块对应的频域块，将gbs对应的频域块记为fbs，将fbs中频域坐标位置为上的值记为即为gbs在4d-dct域中在频域坐标位置上的4d-dct系数，gbs在4d-dct域中共包含有256个4d-dct系数，包括1个直流系数和255个交流系数，当时gbs在4d-dct域中在频域坐标位置(1,1,1,1)上的4d-dct系数为直流系数；其中，符号为向下取整符号，1≤u1≤4，1≤v1≤4，1≤x1≤4，1≤y1≤4，函数g()的功能定义为a1,a2为两个参数；四维离散余弦变换(4d-dct)技术能够较为完整地保留光场图像的高维内在结构，同时将光场图像从空间域转换到频率域能更好地捕获光场图像的失真信息。

步骤5：提取出g中的所有4d块在4d-dct域中在相同频域坐标位置上的交流系数的振幅并构成维数为1×sz的振幅向量，在不为(1,1,1,1)的情况下将g中的所有4d块在4d-dct域中在频域坐标位置上的交流系数的振幅构成的振幅向量记为然后对得到的每个振幅向量用韦伯概率分布进行拟合，拟合后得到对应的尺度参数，将对用韦伯概率分布进行拟合后得到的对应的尺度参数记为在此用韦伯概率分布进行拟合得到尺度参数的过程为现有技术；再将得到的255个尺度参数按顺序排列构成维数为255×1的无符号系数分布特征向量，作为l对应的无符号系数分布特征向量，并记为λ，λ＝[λ1,λ2,…,λk,…,λ255]^t；其中，符号“||”为取绝对值符号，表示g中的第1个4d块记为gb1对应的频域块fb1中频域坐标位置为上的值，表示g中的第sz个4d块记为gbsz对应的频域块fbsz中频域坐标位置为上的值，为的振幅，为的振幅，为的振幅，λ1表示λ的第1个元素，λ2表示λ的第2个元素，λk表示λ的第k个元素，λ255表示λ的第255个元素，k与的关系为：λ1＝w(1,1,1,2)，λ2＝w(1,1,1,3)，λ255＝w(4,4,4,4)。

步骤6：选取n幅用于训练的4维的无失真光场图像，按照步骤1至步骤5的过程，以相同的方式获取每幅无失真光场图像对应的能量向量和无符号系数分布特征向量；然后将n幅无失真光场图像对应的能量向量构成训练的能量矩阵，记为ze，ze＝[te1,te2,…,ten,…,ten]，将n幅无失真光场图像对应的无符号系数分布特征向量构成训练的无符号系数分布特征矩阵，记为zw，zw＝[tw1,tw2,…,twn,…,twn]；然后对ze进行主成分分析(pca)，获得维数为255×m1的能量投影矩阵，记为同样，对zw进行主成分分析(pca)，获得维数为255×m2的无符号系数分布特征投影矩阵，记为其中，n≥100，在本实施例中取n＝133，无失真光场图像的角度分辨率为u×v，无失真光场图像的空间分辨率为x×y，ze和zw的维数均为255×n，te1表示第1幅无失真光场图像对应的能量向量，te2表示第2幅无失真光场图像对应的能量向量，ten表示第n幅无失真光场图像对应的能量向量，ten表示第n幅无失真光场图像对应的能量向量，tw1表示第1幅无失真光场图像对应的无符号系数分布特征向量，tw2表示第2幅无失真光场图像对应的无符号系数分布特征向量，twn表示第n幅无失真光场图像对应的无符号系数分布特征向量，twn表示第n幅无失真光场图像对应的无符号系数分布特征向量，1≤n≤n，m1和m2均为正整数，1≤m1+m2＜n，在本实施例中当n＝133时取m1＝21、m2＝15最佳。

步骤8：将fe和fw连接起来构成的向量作为l的感知特征向量，记为f，f＝[(fe)^t,(fw)^t]；其中，f的维数为1×(m1+m2)。

以下对本发明方法进行实验，进一步说明本发明方法的有效性与可行性。

本发明方法的有效性将在两个4d光场图像主观评价数据库上进行验证，另外，选择已被验证的、高效的平面图像和光场图像共8种图像客观质量评价方法作为对比，来体现本发明方法的优势。用于测试的两个4d光场图像主观评价数据库分别为win5-lid数据库(l.shi,s.zhao,w.zhou,andzchen,“perceptualevaluationoflightfieldimage,”inproc.the25thieeeint.conf.imageprocess.(icip),athens,greece,oct.2018,pp.41-45.(光场图像的感知评价))和nbulf1.0数据库(z.huang,m.yu,g.jiang,k.chen,z.peng,andf.chen,“reconstructiondistortionorientedlightfieldimagedatasetforvisualcommunication,”inint'l.symp.net.comp.commun.(isncc),istanbul,turkey,2019,pp.1-5.(用于视觉通信的重建失真定向光场图像数据集))。其中，win5-lid数据库共包含了10幅原始光场图像，其中6幅属于自然场景，4幅属于合成场景，win5-lid数据库中引入了6种失真类型，其中hevc、jpeg2000、ln和nn这4种失真类型共分成5个不同的失真等级，另外还包括了两种默认参数的基于cnn的重建算法，因此，1幅原始光场图像对应22幅不同失真类型的失真光场图像，共计220幅失真光场图像；win5-lid数据库还提供了平均主观分(meanopinionscore，mos)。nbulf1.0数据库共包含了14幅原始光场图像，其中8幅属于自然场景，6幅属于合成场景，nbulf1.0数据库中引入了5种失真类型，分别为bi、nni、zhang、epicnn和vdsr，每种失真类型分为3个不同的失真等级，因此，1幅原始光场图像对应15幅不同失真类型的失真光场图像，共计210幅失真光场图像；nbulf1.0数据库还提供了mos值。表1给出了两个4d光场图像数据库的各项指标，包括原始光场图像的数目、失真光场图像的数目、失真类型、光场图像的空间分辨率和角度分辨率。

表1两个4d光场图像数据库的各项指标

通过比较客观质量评价方法预测得到的客观质量评价分数与mos值是否一致来评价该客观质量评价方法的预测性能。具体而言，本发明方法所提取的失真光场图像的感知特征向量通过支持向量回归模型融合得到失真光场图像的客观质量评价分数；然后将失真光场图像的客观质量评价分数与mos值进行非线性拟合；接着采用3个根据视频质量评价专家组提供的标准指标来对不同的客观质量评价方法的预测性能进行量化。3个标准指标分别为spearman秩相关系数(spearmanrankordercorrelationcoefficient，srocc)、pearson线性相关系数(pearsonlinearcorrelationcoefficient，plcc)和均方根误差(rootmeansquareerror，rmse)，其中，srocc用于测量客观质量评价方法的预测单调性，plcc和rmse用于测量客观质量评价方法的预测准确性，srocc的取值范围在[-1,1]之间，plcc的取值范围在[0,1]之间，srocc和plcc的绝对值越接近于1，rmse越接近0，说明客观质量评价方法的预测性能越好。

本发明方法将与4种平面图像客观质量评价方法和4种光场图像客观质量评价方法比较。其中，包括了两种2d全参考图像质量评价方法，它们是ssim方法(z.wang,a.c.bovik,h.r.sheikh,ande.p.simoncelli,“imagequalityassessment:fromerrorvisibilitytostructuralsimilarity,”ieeetrans.imageprocess.,vol.13,no.4,pp.600-612,apr.2004(图像质量评估:从误差可见性到结构相似性))和vif方法(h.r.sheikh,anda.c.bovik,“imageinformationandvisualquality,”ieeetrans.imageprocess.,vol.15,no.2,pp.430–444,feb.2006(图像信息和视觉质量))；两种2d无参考图像质量评价方法，它们是brisque方法(a.mittal,a.k.moorthy,anda.c.bovik,“no-referenceimagequalityassessmentinthespatialdomain,”ieeetrans.imageprocess.,vol.21,no.12,pp.4695-4708,dec.2012(空间域的无参考图像质量评价))和sseq方法(l.liu,b.liu,h.huang,anda.c.bovik,“no-referenceimagequalityassessmentbasedonspatialandspectralentropies,”signalprocess.imagecommun.,vol.29,no.8,pp.856-863,sep.2014(基于空间和谱熵的无参考图像质量评价))；一种全参考光场图像质量评价方法，该方法为mdfm方法；三种无参考光场图像质量评价方法，它们是belif、nr-lfqa和tensor-nlfq。

表2给出了本发明方法与ssim、vif、brisque、ssqe、mdfm、belif、nr-lfqa和tensor-nlfq共8种现有的客观质量评价方法在nbulf1.0和win5-lid数据库中的预测性能指标srocc、plcc和rmse的值。

表2本发明方法与ssim、vif、brisque、ssqe、mdfm、belif、nr-lfqa和tensor-nlfq共8种现有的客观质量评价方法在nbulf1.0和win5-lid数据库上的3个性能指标srocc、plcc和rmse的结果

从表2中可以看出，在win5-lid和nbulf1.0数据库中，本发明方法均具有最优异的预测性能。本发明方法在不同数据库中均具有较好的预测性能，这表明本发明方法具有很好的鲁棒性。值得一提的是，与全参考方法相比，本发明方法也依然占据优势。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郁梅;项建军;蒋志迪;蒋刚毅
技术所有人：宁波大学
我是此专利的发明人

上一篇：一种提取罐及提取罐冷凝布局系统的制作方法
上一篇：一种合成革加工系统及加工方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。