1.基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,包括以下步骤:
步骤a、提取待检索图像及图像库SIFT特征;
步骤b、生成SIFT描述符直方图和SIFT描述符核密度;
步骤c、融合SIFT描述符核密度和SIFT描述符直方图;
步骤d、改进传统Hausdorff距离度量;
步骤e、将改进的Hausdorff距离用于图像匹配。
2.根据权利要求1所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤a的具体步骤如下:
步骤a1:构建待检索图像及图像库高斯差分尺度函数
利用不同尺度的高斯函数与图像做卷积运算,构建二维图像的高斯差分尺度函数D(x,y,σ),有:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)
其中,k是尺度比例系数,G(x,y,σ)是尺度可变的高斯函数,I(x,y)是图像,并且有:
其中,(x,y)是尺度坐标,σ的大小决定图像平滑的程度;
步骤a2:检测高斯差分尺度空间极值点
将图像中的每一个采样点都与该采样点相邻的点比较,当某个采样点在高斯差分尺度空间的所有点中是最大值或最小值时,认为该点是图像在该尺度下的一个特征点;
步骤a3:除去边缘不稳定的特征点,生成SIFT描述符
使用Harris Corner检测器去除边缘的不稳定特征点,保留稳定的特征点,生成SIFT描述符。
3.根据权利要求1所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤b的具体步骤如下:
步骤b1:通过SIFT描述符的分层聚类来构造可扩展词汇树
提取每张图片的SIFT描述符,得到一个集合F={fi},然后对集合F采用K-Means聚类方法进行分层聚类,初始时,在第1层对集合F进行K-Means聚类,把集合F分成k份{Fi|1≤i≤k};以此类推,对新产生的簇集利用K-Means再分成k个簇集,不断地重复上述操作直到深度达到预先设定的L值,构造出可扩展词汇树,共有c=BL个节点组成,其中,B是分支因子,L是深度,c是节点总个数,fi表示图片中某个SIFT描述符,F是描述符集合,Fi是对集合F进行K-Means聚类得到的某个簇集;
步骤b2:累计可扩展词汇树中每个节点上的描述符出现的次数,得到SIFT描述符直方图
在构造可扩展词汇树中,共有c=BL个节点,对第一个节点上的SIFT描述符出现的次数进行累计,获得基于可扩展词汇树的SIFT描述符直方图,用H=[h1,...,hi,...,hc]表示,其中hi表示第i个节点出现SIFT描述符的次数;
步骤b3:对SIFT描述符进行量化,得到SIFT描述符核密度
对所有的SIFT描述符进行量化,则每个SIFT描述符fi都对应可扩展词汇树中一条从根节点到叶子节点的量化路径,即对应一组视觉词每一组视觉词都对应它的核密度f(c),得到基于可扩展词汇树的SIFT描述符核密度;其中是一个视觉词,即可扩展词汇树中的每个节点都代表一个视觉词,l表示该节点在可扩展词汇树中所在的层数,hl表示该节点在该层树节点中的索引,L是深度。
4.根据权利要求1所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤c的具体步骤如下:
步骤c1:得到SIFT描述符直方图和SIFT描述符核密度的基本概率分配函数
为了计算方便,将SIFT描述符直方图设为A,SIFT描述符核密度设为B,则辨别框Ω:{A,B},辨别框是描述构成整个假设空间所有元素的集合,用基本概率分配函数考虑到所有的可能结果,用m()表示;此时,
子集A的基本概率分配函数为
子集B的基本概率分配函数为
其中,M为归一化常数,
m1(Ai)表示焦元为Ai的基本概率赋值,m2(Bj)表示焦元为Bj的基本概率赋值;
步骤c2:应用Dempster组合规则结合步骤c1得到融合结果
Dempster组合规则为:将步骤c1得到结果m(A)和m(B)代入得到m(AB);
其中,M为归一化常数,M=∑A∩B=φ(m(A)m(B))=1-∑A∩B≠φ(m(A)m(B))
m(A)表示子集A的基本概率分配函数,m(B)表示子集B的基本概率分配函数,m(AB)表示子集A和子集B融合的基本概率分配函数。
5.根据权利要求5所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤d的具体步骤如下:
步骤d1:写出成本函数的微分方程形式
成本函数的微分方程形式如下:
步骤d2:得到成本函数的通解
解微分方程,得到成本函数的表达式为如下:
其中γ0是成本函数初始值,它的范围为0~1,k是比例系数,τ是匹配参数;
步骤d3:用传统的Hausdorff距离作为成本函数的变量,改进的Hausdorff距离
给定两个有限集合X={x1,x2,...,xM}和Y={y1,y2,...,yN},则X和Y之间传统的Hausdorff距离定义为
其中,d(X,Y)是传统的Hausdorff距离,min表示最小值,max表示最大值,x和y分别是点集X和Y中的点,d(x,y)表示点x和点y之间的几何距离;
改进的Hausdorff距离为:
其中|X|是有限集合X的个数,dH(X,Y)是改进的Hausdorff距离,d(X,Y)是传统的Hausdorff距离,γ(d(X,Y))是变量为d(X,Y)的成本函数。
6.根据权利要求6所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤e的具体步骤如下:
根据步骤c得到的融合特征,用改进的Hausdorff距离进行图像的相似度测量,将得到的相似度按照降序排列,得出检索结果。