一种图像检索方法及装置与流程

文档序号：12124391阅读：235来源：国知局

本发明涉及图像检索技术领域，特别是涉及一种图像检索方法及装置。

背景技术：

近三十年来，多媒体技术快速发展，许多图像数据库被建立，例如外观设计专利数据库、人脸识别数据库、虹膜识别数据库、指纹识别数据库、车辆登记号码数据库等。从这些数据库中寻找图像实际上就是一个图像检索问题，因此如何快速有效地从数据库中检索出图像一直是图像检索技术的研究热点。

为了提高图像检索的速度，寻找最能表达图像特征的描述子尤为重要。因为离散傅里叶变换描述子的不变性特征，对图像边缘的描述具有鲁棒性，所以人们广泛地使用基于离散傅里叶变换描述子的方法来寻找图像边缘特征，并获得不错的效果。然而离散傅里叶变换描述子也有缺陷。每幅图像的边缘特征都包含x坐标和y坐标，由于传统的离散傅里叶变换描述子只能应用单个方向的信息，为了有效地构建字典，这种方法需要更多的训练图片。然而像人脸识别这样的数据库，能用来作为训练的图像不多，因此往往不能满足实际训练的要求。除此以外，传统的离散傅里叶变换描述子只能反映图像的频域特征，能用于图像检索的信息十分有限。寻找一种具有传统离散傅里叶变换描述子优点的更广泛的特征描述子将成为近年来研究的重点。

技术实现要素：

本发明的目的是提供一种图像检索方法及装置，目的在于解决现有表达图像特征的描述子特征信息不充分，表达能力不强，导致检索能力较低的问题。

为解决上述技术问题，本发明提供一种图像检索方法，包括：

获取待检索图像；

对所述待检索图像进行预处理操作；

采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征；

调用预先构建的字典，所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；

利用预设分类器对所述待检索图像进行分类，得到检索结果。

可选地，所述采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征包括：

采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度；

采用一范数来定义目标函数，并分离不可导点和稳定点集，使用非凸优化技术来求解问题获得图像的边缘特征。

可选地，所述利用预设分类器对所述待检索图像进行分类的步骤包括：

利用1-NN分类器对所述待检索图像进行分类。

可选地，所述字典预先构建的步骤包括：

对每一幅训练图像提取边缘点；

每幅进行边缘点提取的步骤为：

采用离散余弦变换的方法对原始边缘点进行处理；

将所有训练图像的边缘点个数的平均值作为目标值，若当前训练图像的边缘点个数大于所述目标值，则对边缘点进行离散余弦变换，保留低频所对应的离散余弦变换系数，去除高频系数，若当前训练图像的边缘点个数小于所述目标值，则对边缘点进行离散余弦变换后在高频对应的系数位置补零；

将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。

本发明还提供了一种图像检索装置，包括：

获取模块，用于获取待检索图像；

预处理模块，用于对所述待检索图像进行预处理操作；

计算模块，用于采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征；

调用模块，用于调用预先构建的字典，所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；

分类模块，用于利用预设分类器对所述待检索图像进行分类，得到检索结果。

可选地，所述计算模块具体用于：

采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度；采用一范数来定义目标函数，并分离不可导点和稳定点集，使用非凸优化技术来求解问题获得图像的边缘特征。

可选地，所述分类模块具体为：利用1-NN分类器对所述待检索图像进行分类的模块。

可选地，调用模块具体为：对每一幅训练图像提取边缘点；每幅进行边缘点提取的步骤为：采用离散余弦变换的方法对原始边缘点进行处理；将所有训练图像的边缘点个数的平均值作为目标值，若当前训练图像的边缘点个数大于所述目标值，则对边缘点进行离散余弦变换，保留低频所对应的离散余弦变换系数，去除高频系数，若当训练图像的边缘点个数小于所述目标值，则对边缘点进行离散余弦变换后在高频对应的系数位置补零；将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。

本发明所提供的图像检索方法及装置，通过获取待检索图像；对待检索图像进行预处理操作；采用离散分数阶傅里叶变换作为描述子，计算得到待检索图像的边缘特征；调用预先构建的字典，字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；利用预设分类器对待检索图像进行分类，得到检索结果。本发明所提供的图像检索方法及装置，通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征，对图像数据获得的边缘特征具有时域以及频域的描述性能，且离散分数阶傅里叶变换描述子具有不变形特征，同时训练能够融合两维的特征信息，提升了图像的检索效果。

附图说明

为了更清楚的说明本发明实施例或现有技术的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明所提供的图像检索方法的一种具体实施方式的流程图；

图2为本发明实施例提供的图像检索装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明所提供的图像检索方法的一种具体实施方式的流程图如图1所示，该方法包括：

步骤S101：获取待检索图像；

步骤S102：对所述待检索图像进行预处理操作；

步骤S103：采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征；

步骤S104：调用预先构建的字典，所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；

步骤S105：利用预设分类器对所述待检索图像进行分类，得到检索结果。

本发明所提供的图像检索方法，通过获取待检索图像；对待检索图像进行预处理操作；采用离散分数阶傅里叶变换作为描述子，计算得到待检索图像的边缘特征；调用预先构建的字典，字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；利用预设分类器对待检索图像进行分类，得到检索结果。本发明所提供的图像检索方法，通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征，对图像数据获得的边缘特征具有时域以及频域的描述性能，且离散分数阶傅里叶变换描述子具有不变形特征，同时训练能够融合两维的特征信息，提升了图像的检索效果。

在上述实施例的基础上，本发明所提供的图像检索方法中，所述采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征的步骤可以具体包括：

采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度；

采用一范数来定义目标函数，并分离不可导点和稳定点集，使用非凸优化技术来求解问题获得图像的边缘特征。

所述利用预设分类器对所述待检索图像进行分类的步骤包括：

利用1-NN分类器对所述待检索图像进行分类。

进一步地，在上述任意实施例的基础上，本申请所提供的图像检索方法中，字典预先构建的步骤包括：

对每一幅训练图像提取边缘点；

每幅进行边缘点提取的步骤为：

采用离散余弦变换的方法对原始边缘点进行处理；

将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。

下面对本发明所提供的图像检索方法的具体实施过程进行进一步详细阐述。

首先对每一幅训练图像提取边缘点。由于每幅图的边缘点个数不相同，为了统一边缘点个数，使用基于离散余弦变换(DCT)的方法对原始边缘点进行处理。将所有训练图像的边缘点个数的平均值作为目标个数，若当前训练图像的边缘点个数大于目标值，对边缘点进行DCT，保留低频所对应的DCT系数，去除多出的高频系数，若前训练图像的边缘点个数小于目标值，对边缘点进行DCT后在高频对应的系数位置补零。最后将所得到的DCT系数进行反离散余弦变换(IDCT)得到个数相同的边缘点。

为了运用离散分数阶傅里叶变换(DFrFTs)作为描述子，关键是确定描述子的最优旋转角度。对于图像检索问题，属于同一类的图像其在旋转时频域的特征应该是聚集在一起的，而不同类的图像会相隔很远。换句话说，描述子的类内间距要尽可能小，类外间距要尽可能大。为了综合这两个判据，一般的方法是费希尔(Fisher)判别法，即类内间距和类外间距比值要最小。本申请决定最优旋转角度的方法就是使Fisher判别最小。

假设有C种不同类型的图像，N_c表示c类图像的训练数目，其中c＝0,…,C-1。N表示图像边缘点的数目。是一个复值向量，和分别表示边缘点的x坐标和y坐标，其中n_c＝0,…,N_c-1，c＝0,…,C-1。Re(z)和分别表示向量z的实部和虚部。C^a×b表示a×b的复值矩阵。F_α∈C^N×N是分数阶傅里叶变换矩阵，其中旋转角度α∈[-π,π)。让J_intra和J_inter分别表示DFrFTs描述子基于二范测度的类内间距和类外间距。

和

这里表示第c类图像边缘点向量的平均值，即

值得注意的是，F_α是埃尔米特矩阵，J_intra和J_inter与F_α独立。因此J_intra和J_inter都不能用于决定DFrFTs的旋转角度。实际上，包含有x坐标和y坐标的信息，为了不失去任何信息，的实部和虚部都必须保留用于检索。因为用一范测度的目标函数可以将优化问题重新定义为一个线性约束的线性目标函数，其解很容易找到，所以我们将类内间距和类外间距分别重新定义为和其中

和

按照DFrFTs矩阵的定义，

F_α≡Ediag(e^-jαβ)E^T， (6)

其中E是与α无关的实值酉矩阵，diag(z)表示以z的元素为对角线的对角矩阵，

β≡[0 … N-1]^T， (7)

和

对于

z≡[z₀ … z_N-1]^T， (9)

上表T表示转置操作。定义

和

其中c＝0,…,C-1，n_c＝0,…,N_c-1。

相似的可以定义

和

其中c＝0,…,C-1，d＝0,…,C-1。

让类内间距和类外间距的比值为即

从上面的推导可以看出和α有关。让α₀表示最优的旋转角度。值得注意的是，因为是个连续函数，所以在α₀周围的小区域内的点具有近似的函数值。换句话说，我们也只能近似求得的全局最优值。实际上，一般会要求有一系列不同的旋转角度能局部最小化为了解决这个问题，可以注意到局部最小化的值α不仅会落在目标函数的稳定点处，还有可能落在不可导点处。因为包含不可导的一范数，所以字典的设计问题就变成寻找一系列旋转角度，使得局部最小。用表示一系列旋转角度，开始时是一个空集，定义最优化问题P：

要求：

满足(17)， (28b)

有可能是稳定的，有可能是不可导的，(28c)

同时

通过寻找问题P的局部解，将解加到中，然后迭代L次，接着获得L个能局部最小化的不同旋转角度。

寻找的所有不可导点，让A和的维数分别为M₁×2N和M₂×2N。这里

和

M₂＝2NC²。 (30)

定义A的第m₁行和的第m₂分别为

其中m₁＝1,…,M₁ (31)

和

其中m₂＝1,…,M₂， (32)

里面有

其中m₁＝1,…,M₁， (33)

其中m₁＝1,…,M₁， (34)

其中m₂＝1,…,M₂， (35)

和

其中m₂＝1,…,M₂。 (36)

让表示DFrFTs的旋转角度，其中k＝0,…,K₁-1，于是有

对于m₁＝1,…,M₁，或

对于m₂＝1,…,M₂。这里K₁是(37)或(38)的全部根的数目。因为绝对值函数|z|的不可导点值出现在z＝0，所以的不可导点只落在其中k＝0,…,K₁-1。不是一般性，假设序列以升序排列，即其中k＝0,…,K₁-2。

为寻找的稳定点，定义

其中m₁＝1,…,M₁ (39)

和

其中m₂＝1,…,M₂。 (40)

接着，

这里，

注意到在是可导的，其中k＝0,…,K₁-2。也有，

和

对于所有其中k＝0,…,K₁-2。假设有P_k个稳定点在让这些点表示为其中p＝0,…,P_k-1和k＝0,…,K₁-2。于是有，

其中p＝0,…,P_k-1和k＝0,…,K₁-2。换句话，我们有

其中p＝0,…,P_k-1和k＝0,…,K₁-2。

(43)和(44)暗示着

其中p＝0,…,P_k-1和k＝0,…,K₁-2。对于k＝0,…,K₁-2都是已知的。因此，(37)，(38)和(47)是传统的三角等式。通过二倍角公式，可以将上述等式表示为多项式，这些等式的解将很容易找到。显然，获得的解就是对应的不可导点和稳定点的解。

最后，通过在集合识别出L个最小函数值，对应的DFrFTs角度就找到了。

定义其中δ是变换矩阵的列数和行数的比值。如果δ去得很小，就会产生很少的描述子，也就是说还没有足够的信息去进行图像检索，否则δ过大，就会出现过拟合现象。

让表示最优旋转角度，其中l＝0,…,L-1。将作为列向量可以构成字典，其中c＝0,…,C-1，n_c＝0,…,N_c-1，l＝0,…,L-1。

假设有M个测试图像，让y_m∈C^N×1表示一个复值向量，其中m＝0,…,M-1。Re(y_m)和Im(y_m)分别是测试图像边缘点的x坐标向量和y坐标向量。为了进行图像检索，需要使用1-NN分类规则。也就是找在旋转时频域中使y_m和距离最小的那个类。将目标类定义为对应最近的测试边缘特征向量为使用一范数作为距离度量，将作为目标函数，即测试图像所属的类由以下优化问题表达：

遍历查找得到该问题的解，即检索到同一类的图像。

下面对本发明实施例提供的图像检索装置进行介绍，下文描述的图像检索装置与上文描述的图像检索方法可相互对应参照。

图2为本发明实施例提供的图像检索装置的结构框图，参照图2图像检索装置可以包括：

获取模块100，用于获取待检索图像；

预处理模块200，用于对所述待检索图像进行预处理操作；

计算模块300，用于采用离散分数阶傅里叶变换作为描述子，计算得到所述待检索图像的边缘特征；

调用模块400，用于调用预先构建的字典，所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；

分类模块500，用于利用预设分类器对所述待检索图像进行分类，得到检索结果。

作为一种具体实施方式，本发明所提供的图像检索装置中，计算模块具体用于：

作为一种具体实施方式，本发明所提供的图像检索装置中，分类模块具体为：利用1-NN分类器对所述待检索图像进行分类的模块。

在上述任一实施例的基础上，本发明所提供的图像检索装置中，调用模块具体为：对每一幅训练图像提取边缘点；每幅进行边缘点提取的步骤为：采用离散余弦变换的方法对原始边缘点进行处理；将所有训练图像的边缘点个数的平均值作为目标值，若当前训练图像的边缘点个数大于所述目标值，则对边缘点进行离散余弦变换，保留低频所对应的离散余弦变换系数，去除高频系数，若当训练图像的边缘点个数小于所述目标值，则对边缘点进行离散余弦变换后在高频对应的系数位置补零；将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。

本实施例的图像检索装置用于实现前述的图像检索方法，因此图像检索装置中的具体实施方式可见前文中的图像检索方法的实施例部分，例如，获取模块100，预处理模块200，计算模块300，调用模块400，分类模块500，分别用于实现上述图像检索方法中步骤S101，S102，S103，S104和S105，所以，其具体实施方式可以参照相应的各个部分实施例的描述，在此不再赘述。

本发明所提供的图像检索装置，通过获取待检索图像；对待检索图像进行预处理操作；采用离散分数阶傅里叶变换作为描述子，计算得到待检索图像的边缘特征；调用预先构建的字典，字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像；利用预设分类器对待检索图像进行分类，得到检索结果。本发明所提供的图像检索装置，通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征，对图像数据获得的边缘特征具有时域以及频域的描述性能，且离散分数阶傅里叶变换描述子具有不变形特征，同时训练能够融合两维的特征信息，提升了图像的检索效果。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的图像检索方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黎伟禧;凌永权;
技术所有人：广东工业大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。