基于窗口间平均差异的直方图相似性度量方法

文档序号：6572577阅读：289来源：国知局

专利名称：基于窗口间平均差异的直方图相似性度量方法
技术领域：
本发明属于图像分析技术领域，具体涉及一种基于窗口间平均差异的直方图相似性度量方法。
背景技术：
直方图是数字图像的重要特征之一，反映一幅图像(或其中一部分区域)的灰度、颜色、纹理等特性的总体分布信息。直方图特征被广泛应用于图像检索、目标跟踪等方面[1][2]。具体应用中，两幅直方图之间的相似性是非常重要的评价标准。已有的直方图相似性度量主要是基于两幅直方图之间的欧氏距离或变换后的一些距离标准，如L1距离、Lp距离、x2距离等。这些方法在评价直方图相似性时，都是通过计算两个直方图对应位置处的值作为标准的，计算较简单，但是对直方图有一定形变(偏移、压缩、拉伸等)的情况，例如图像受噪声、光照变化等因素影响，有些就不能很好地反映其相似性。采用这些度量标准时，一幅图像与其受一定噪声、光照影响后的图像之间的直方图相似性可能会明显小于这幅图像与另一幅不相关的图像之间的直方图相似性，这在具体应用中是非常不利的。一些改进的方法如累加直方图的L1距离等[3][4]考虑到了直方图不同位置之间的关系，但缺点是丢失了直方图的局部信息。其他的一些直方图比较方法，如直方图峰值匹配法[5]、直方图各阶矩比较法[6]等参数化的方法在一些特定应用下有很好的效果，但在普遍性上存在一定的不足。而针对这些不足提出的EMD(EarthMover’s Distance)方法[7][8]对直方图偏移等情况能较好解决，但由于两幅直方图之间匹配要解决一个最优化问题，复杂度较高，在大数据量的图像检索等应用中存在一些不足。本发明提出一种新的基于窗口间平均差异的直方图相似性度量方法，通过计算两幅直方图之间不同窗口距离的取值差异并加权求和，得到一个窗口间平均差异度量来评价两幅直方图的相似性，算法简单、通用，较好地解决了以前方法存在的一些问题。

发明内容
本发明的目的在于提供一种计算复杂度比较低、平均差错率也低的直方图相似性度量方法。
本发明提出的直方图相似性度量方法是一种基于窗口平均差异的度量方法。
下面先介绍已有的直方图相似性评价标准已有的直方图相似性评价主要是基于两幅直方图相同窗口处的值的比较，如L1距离、Lp距离、x2距离等。这些距离以及经过一些简单变换后的距离(如余弦距离等)都可看成是一定参数下的欧氏距离，距离越大则直方图相似性越小。
简单并不失一般性，这里考虑一维直方图，并以L1距离、Lp距离、x2距离为例。设两幅直方图分别为G＝{g(j)|j＝0，1，……，r}和H＝{h(k)| k＝0，1，……，r}，其中j、k表示直方图中窗口的位置，r为窗口最大标号(对于图像的灰度直方图而言j、k就表示灰度值，r取值为255)，g(j)表示直方图G在窗口j处的取值，h(k)表示直方图H在窗口k处的取值。两幅直方图的各类距离定义为这些度量方法存在的最大问题就是只计算了两幅直方图相同窗口处的值之间的关系，没有考虑不同窗口之间的相关性。以一个简单的例子来说明如图1所示。图中显示了三幅不同的直方图分布情况，其中Y直方图是X直方图经过一定压缩之后的结果(例如对灰度图像作一个灰度区间压缩变换)，主观判断很显然会得出X与Y这两幅直方图的相似性要高于X与Z之间的相似性。但由于计算L1距离、Lp距离、x2距离时只考虑相同窗口位置对应取值的差异，会得出X与Y这两幅直方图的相似性要小于X与Z之间的相似性。另一个实际图像的例子如下将一幅图像中各点灰度值均变为不大于原灰度值的最小的偶数(0到254之间)，而另一幅图像各点的灰度值是第一幅图像对应位置处灰度值加1(即全为奇数)，这时两幅图像的灰度直方图分别只在偶数值部分和奇数值部分的取值不为0，没有任何交集，因此所求出的以上三类直方图距离都很大，会得出这两幅图完全不相似的结论。而事实上这两幅图几乎没有差异，直方图形状也完全一样，只是平移了一个窗口。当然这个问题在扩大窗口尺度或经过直方图平滑之后可以得到一定程度的解决，但这样又会造成统计信息的损失，且对其他一些变换的情况仍可能存在问题。这些例子都可以说明由于直方图各窗口处的值有一定的相关性，只考虑相同窗口处取值的不同来评价直方图相似性存在一定的局限性。
本发明提出的直方图窗口间平均差异度量方法如下考虑到直方图各窗口处的值之间的的相关性，设两幅直方图分别为G＝{g(j)|j＝0，1，……，r}和H＝{h(k)|k＝0，1，……，r}，其中j、k表示直方图中窗口的位置，r为窗口的最大标号，g(j)表示直方图G在窗口j处的统计值，h(k)表示直方图H在窗口k处的统计值。若G、H满足总点数相等的条件，即∑(g(j))＝∑(h(k))，定义两幅直方图G和H中不同窗口间的距离d＝|j-k|，则直方图窗口间平均差异度量按照如下方法求得(a)设定一个直方图最大窗口距离dmax，作为循环终止标志，大于dmax的窗口距离都视作dmax。
(b)取d＝0，得到n0＝∑(min(g(i)，h(i)))，即统计两幅直方图相同窗口处的交集。然后将两幅直方图各窗口处的统计值都减去相应的交集部分，生成两幅新的直方图，即g(i)’＝g(i)-min(g(i)，h(i))，h(i)’＝h(i)-min(g(i)，h(i))。此时这两幅直方图相同窗口处的取值至少有1个为0。
(c)取d＝1，对两幅新的直方图，从窗口位置m＝0开始，从小到大搜索到m＝r-d若一幅直方图上第m窗口与另一幅直方图上第m+d窗口(即对应的窗口距离为d的窗口)的取值均不为0，则设两个值中较小的一个为pm，将两个窗口处的值各减去pm，生成两幅更新的直方图。完成所有的搜索后，将有值的pm累加起来，得到点数的统计值n1，将其定义为窗口距离为1时的直方图取值差异。
(d)对d从1到dmax依次进行如步骤(c)的操作，就可以得到两幅直方图之间不同窗口距离d的取值差异n1到nmax，结合之前求得的n0，将不同窗口间直方图的平均差异D定义为D=Σi=0dmaxni·iΣi=0dmaxni---(4)]]>其中，分子为对应各不同窗口距离的直方图取值差异的加权和(以窗口为权值)，分母为一幅直方图中的总点数。
D表示了两幅直方图之间的窗口间平均差异，D值越小表示两幅直方图之间的相似性越大。
下面举例来说明D的求取方法。两幅直方图A和B(如图2所示)，总点数均为30，由于一共只有6个窗口，最大窗口距离dmax设为5。
A(7，2，8，2，9，2)B(0，2，4，6，8，10)得到A、B的交集min(A，B)＝(0，2，4，2，8，2)，总点数d0＝18；A、B分别减去交集后得到A1(7，0，4，0，1，0)B1(0，0，0，4，0，8)从左到右搜索A1、B1中窗口距离r为1并且窗口处取值均不为0的点，并分别减去两个值中较小的一个即A1、B1首先分别变为(7，0，0，0，1，0)和(0，0，0，0，0，8)；然后分别变为(7，0，0，0，0，0)和(0，0，0，0，0，7)；最后得到总点数d1＝4+1＝5；A2(7，0，0，0，0，0)B2(0，0，0，0，0，7)增加偏差r继续搜索，依次得到d2＝0；d3＝0；d4＝0；d5＝7；根据公式(4)计算得到D＝1.333几种直方图相似性度量方法性能的比较此处选取了标准图像库中10幅自然图像(如图3所示)，图像大大小均为128像素×128像素(总点数为16384)。求出它们相互之间及与各自图像受噪声、灰度偏移等影响后的灰度直方图之间的相似性度量，将提出的窗口间平均差异度量(dmax取40)与经典的L1距离、Lp距离(p取2)和x2距离度量进行了比较。在按照(1)、(2)、(3)式求这三个距离时，将求得的距离除以总窗口数(256)，得到平均化后的结果(因为这里只是比较相对大小，所以归一化操作对结果没有影响)。为了仿真图像受噪声、灰度偏移等影响而对图像进行的变换包括1、加上15 dB高斯噪声；2、各点灰度变为原先的90％；3、各点灰度变为原先的110％。这些变换对图像本身及其直方图形状的影响并不是很大，无论从对图像或直方图形状的主观感受还是从图像检索等应用的要求来看，一幅图像与其经过上述变换后的图像的直方图相似性一般应该小于该图像与另一幅图像之间的直方图相似性。而从实际比较的结果可以看出，一些情况下采用这些距离度量来评价直方图相似性，会得到相反的结论。
对10幅图像两两之间(一共为45组情况)及各自与其变换后的图像之间采用四种相似性度量进行评价的结果进行统计可知，采用L1距离、Lp距离(p取2)和x2距离度量的错误率较高，分别为7组、14组和18组。而采用本发明提出的窗口间平均差异度量错误率最低，仅在其中3组情况下出现问题，而在这3组情况下采用其他三种距离度量也都不能正确评价。可见，与经典的直方图相似性评价方法(L1距离、Lp距离和x2距离)相比，窗口间平均差异度量在图像受噪声、光照条件等因素影响而发生直方图偏移的情况下有更好的效果。

图1、直方图相似性示例。
图2、窗口间平均差异度量计算方法示例。
图3、用于比较的灰度图像集(尺度128像素×128像素)。
图4、用于比较的灰度图像及其直方图。第一排从左到右依次为这两幅图像以及第一幅图像加上15 dB高斯噪声、灰度变为原来的90％和灰度变为原来的110％后的图像，而下一行对应位置则是每幅图的灰度直方图。
具体实施例方式
以所选图像中名为‘woman2’和‘crowd’的图像的对比为例(图4)。图4第一排从左到右分别为这两幅图像和‘woman2’图像加上15 dB高斯噪声、灰度变为原来的90％和灰度变为原来的110％后的图像，而下一行对应位置则是每幅图的灰度直方图。根据公式(1)、(2)、(3)和(4)，采用L1距离、Lp距离(p取2)、x2距离和窗口间平均差异度量(下文表中用AD表示，dmax取40)对(a)与(b)、(a)与(c)、(a)与(d)和(a)与(e)的直方图相似性进行比较，结果如表1所示。
其中，(a)与(b)之间的L1距离(32.2)基本接近(a)与(c)、(a)与(d)、(a)与(e)之间的L1距离(分别为32.3、29.3、29.1)，不容易判断彼此之间相似性的大小。(a)与(b)之间的Lp距离(47.5)则明显小于(a)与(c)、(a)与(d)、(a)与(e)之间的Lp距离(分别为61.0、71.7、69.0)。类似地，(a)与(b)之间的x2距离(10.9)明显小于(a)与(c)、(a)与(d)、(a)与(e)之间的x2距离(分别为32.6、43.7、34.9)。采用这两种距离度量会得出(a)与(b)的直方图相似性更大的结论，这与实际观察到的图像和直方图情况都不符合。可见，如果利用L1距离、Lp距离(p取2)或x2距离所度量的直方图相似性对(a)进行图像检索，则可能错误地把(b)图作为检索结果，而非(c)、(d)或(e)。
相比之下，采用本发明提出的窗口间平均差异度量则可得出(a)与(b)的直方图窗口间平均差异(7.9)明显大于(a)与(c)、(a)与(d)、(a)与(e)之间的直方图窗口间平均差异(分别为4.9、3.6、3.4)，即(a)与(b)的直方图相似性较小的结论，更加符合真实情况。
表1、图4采用不同方法进行直方图相似性度量的结果

综上所述，本文提出的直方图窗口间平均差异来度量直方图相似性，在图像受噪声、光照条件等因素影响而发生直方图偏移的情况下性能优于经典的直方图相似性度量方法。该方法计算简明，且具有很好的通用性，有望应用于基于直方图相似性的各种领域，如图像检索、目标跟踪等。
参考文献[1]Belongie，S.，Carson，C.，Greenspan，H.，and Malik，J.Color and texture-based imagesegmentation using EM and its application to content-based image retrieval.IEEE InternationalConference on Computer Vision，1998，pp.675-682. Hafner，J.，Sawhney，H.S.，Equitz，W.，Flickner，M.，and Niblack，W. Efficient color histogramindexing for quadratic form distance functions.IEEE Transactions on Pattern Analysis and MachineIntelligence，17，(1995)729-735. Shen，H.C.and Wong，A.K.C.Generalized texture representation and metric.Computer，Vision，Graphics，and Image Processing，23，(1983)187-206. Werman，M.，Peleg，S.，and Rosenfeld，A.A distance metric for multi-dimensional histograms.Computer，Vision，Graphics，and Image Processing，32，(1985)328-336. Das，M.，Riseman，E.M.，and Draper，B.A.FOCUSSearching for multi-colored objects in adiverse image database.IEEE Conference on Computer Vision and Pattern Recognition，1997，pp.756-761. Stricker，M.and Orengo，M.Similarity of color images.SPIE Conference on Storage andRetrieval for Image and Video Databases III，1995，pp.381-392. Rubner Y.，Tomasi C.，and Guibas L.J.The Earth Mover′s Distance as a metric for image retrieval.Intemational Journal of Computer Vision，40，(2000)99-121. Levina E.，Biekel P. The Earth Mover’s Distance is the Mallows Distancesome insightsfromstatistics.IEEE International Conference on Computer Vision，2001，pp.251-256.
权利要求
1.一种基于窗口间平均差异的直方图相似性度量方法，其特征在于统计两幅直方图相同窗口之间的取值差异和不同距离窗口之间的取值差异，求出以窗口距离为权值进行加权后的平均差异，将其作为评价这两幅直方图相似性的标准，具体步骤如下设两幅直方图分别为G＝{g(j)|j＝0，1，……，r}和H＝{h(k)|k＝0，1，……，r}，其中j、k表示直方图中窗口的位置，r为窗口的最大标号，g(j)表示直方图G在窗口j处的统计值，h(k)表示直方图H在窗口k处的统计值；若G、H满足总点数相等的条件，即∑(g(j))＝∑(h(k))，定义两幅直方图G和H中不同窗口间的距离d＝|j-k|，则直方图窗口间平均差异度量按照如下方法求得(a)设定一个直方图最大窗口距离dmax，作为循环终止标志，大于dmax的窗口距离都视作dmax；(b)取d＝0，统计两幅直方图相同窗口处的交集；得到n0＝∑(min(g(i)，h(i)))；然后将两幅直方图各窗口处的统计值都减去相应的交集部分，生成两幅新的直方图即g(i)’＝g(i)-min(g(i)，h(i))，h(i)’＝h(i)-min(g(i)，h(i))，此时这两幅直方图g(i)’和h(i)’相同窗口处的取值至少有1个为0；(c)取d＝1，对两幅新的直方图，从窗口位置m＝0开始，从小到大搜索到m＝r-d若一幅直方图上第m窗口与另一幅直方图上第m+d窗口的取值均不为0，则设两个值中较小的一个为pm，将两个窗口处的值各减去pm，生成两幅更新的直方图；完成所有的搜索后，将有值的pm累加起来，得到点数的统计值n1，将其定义为窗口距离为1时的直方图取值差异；(d)对d从1到dmax依次进行如步骤(c)的操作，得到两幅直方图之间不同窗口距离d的取值差异n1到nmax，结合之前求得的n0，得不同窗口间直方图的平均差异D为D=Σi=0dmaxni·iΣi=0dmaxni]]>其中，分子为对应各不同窗口距离的直方图取值差异的加权和，分母为一幅直方图中的总点数；D值越小表示两幅直方图之间的相似性越大。
全文摘要
本发明属于图像分析技术领域，具体是一种基于窗口间平均差异的直方图相似性度量方法。该方法通过统计两幅直方图相同窗口之间的取值差异及不同距离窗口之间的取值差异，求出以窗口距离为权值进行加权后的平均差异，并将其作为评价这两幅直方图相似性的标准。针对图像的灰度直方图用本发明度量方法和传统度量方法进行比较，表明该评价标准在直方图发生偏移的情况下性能优于传统的度量标准。本发明提出直方图相似性度量方法，给出相似性的评价标准，为基于直方图的图像检索等应用提供更可靠的依据。
文档编号G06T7/00GK101082987SQ20071004291
公开日2007年12月5日申请日期2007年6月28日优先权日2007年6月28日
发明者汪源源, 马煜, 顾晓东申请人:复旦大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪源源;马煜;顾晓东
技术所有人：复旦大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。