一种基于拉普拉斯嵌入的图像分类词典学习方法和装置与流程

文档序号:11251449阅读:520来源:国知局
一种基于拉普拉斯嵌入的图像分类词典学习方法和装置与流程

本发明涉及图像处理领域,特别涉及一种基于拉普拉斯嵌入的图像分类词典学习方法和装置。



背景技术:

图像分类是根据各个图像在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。图像分类利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

其中,图像分类主要包括基于色彩特征的索引分类、基于纹理的图像分类、基于形状的图像分类和基于空间关系的图像分类。已有技术中最常用的图像分类算法是基于稀疏表达的图像分类算法,通常包括图像特征提取、词典学习、图像编码和图像分类等步骤。

其中,已有技术中的词典学习采用的是传统的基于稀疏表达的词典学习方法,具体的是直接采用训练样本构造词典,词典中的每一个原子对样本的表达都具有相同的权重,最终导致构造的词典不利于图像的分类。而且,传统的基于稀疏表达的词典学习方法直接采用训练样本构造词典,如果在实际应用中的图像样本比较少时,将会导致训练样本的个数不足,也不利于对样本进行稀疏表达。



技术实现要素:

为了解决现有技术的词典学习方法中的每一个原子对样本的表达都具有相同的权重,最终导致构造的词典不利于图像的分类的问题,本发明实施例提供一种基于拉普拉斯嵌入的图像分类词典学习方法和装置,可以避免词典学习方法在实际应用中的由于图像样本比较少时导致的训练样本不足,而引起的不利于对样本进行稀疏表达的问题出现。所述技术方案如下:

第一方面,提供了一种基于拉普拉斯嵌入的图像分类词典学习方法,所述方法包括:

步骤100:从训练样本库中获取训练样本特征集,其中,所述训练样本特征集中包括至少2类训练样本;

步骤110:根据所述训练样本集中的第c类训练样本,采用拉普拉斯约束条件训练所述第c类训练样本的稀疏表达词典,其中,c为大于0的正整数,所述拉普拉斯约束条件为:

φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表sc矩阵的第i列,pij为权重系数,pij代表训练样本和训练样本的紧邻程度,代表所述第c类训练样本中的第i个样本,代表所述第c类训练样本中的第j个样本;

步骤120:基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图,其中,所述图结构模型为拉普拉斯嵌入结构,所述图结构模型为代表第1种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,代表第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,t是常数,μk为第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法对应的权重系数;

步骤130:基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解;

步骤140:针对所述训练样本特征集中的每一类训练样本,重复执行上述步骤110~步骤130,直至所述训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

可选的,所述基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图,具体为:

基于欧式距离、汉明距离、余弦距离和切比雪夫距离中的至少两种和其对应的权重系数,确定所述第c类训练样本的近邻关系图。

可选的,所述基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解的步骤,具体包括:

步骤1301:将所述词典权重矩阵设置为固定值,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,所述固定值为所述词典权重矩阵对应的随机数矩阵;

步骤1302:将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解;

步骤1303:若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件不收敛,则循环执行所述步骤1301和所述步骤1302;

步骤1304:若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件收敛,则将所述第一最优解确定为所述稀疏表达矩阵的最优解,将所述第二最优解确定为词典权重矩阵的最优解。

可选的,所述将所述词典权重矩阵设置为固定值,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,具体为:

将所述词典权重矩阵设置为固定值,基于迭代更新的方法根据公式:

求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,sc为所述第c类训练样本的稀疏表达矩阵,代表sc矩阵的第k行第n列的元素,κ(xc,xc)=φ(xc)tφ(xc),φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,代表sc矩阵的第n列的所有元素,代表sc矩阵的第k行的所有元素,wc是词典权重矩阵,k是wc矩阵的列数,α、β是常数,α、β称为正则化因子。

可选的,所述将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解,具体为:

将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法,根据公式:求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解,其中,φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表矩阵的第k列。

第二方面,提供了一种基于拉普拉斯嵌入的图像分类词典学习装置,所述装置包括:

第一获取模块,用于从训练样本库中获取训练样本特征集,其中,所述训练样本特征集中包括至少2类训练样本;

第一处理模块,用于根据所述训练样本集中的第c类训练样本,采用拉普拉斯约束条件训练所述第c类训练样本的稀疏表达词典,其中,c为大于0的正整数,所述拉普拉斯约束条件为:

φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表sc矩阵的第i列,pij为权重系数,pij代表训练样本和训练样本的紧邻程度,代表所述第c类训练样本中的第i个样本,代表所述第c类训练样本中的第j个样本;

第二获取模块,用于基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图,其中,所述图结构模型为拉普拉斯嵌入结构,所述图结构模型为代表第1种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,代表第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,t是常数,μk为第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法对应的权重系数;

第二处理模块,用于基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解;

循环模块,用于针对所述训练样本特征集中的每一类训练样本,重复执行所述第一处理模块、所述第二获取模块和所述第二处理模块的执行步骤,直至所述训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

可选的,所述第二获取模块具体用于:

基于欧式距离、汉明距离、余弦距离和切比雪夫距离中的至少两种和其对应的权重系数,确定所述第c类训练样本的近邻关系图。

可选的,所述第二处理模块具体包括:

第一求解子模块,用于将所述词典权重矩阵设置为固定值,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,所述固定值为所述词典权重矩阵对应的随机数矩阵;

第二求解子模块,用于将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解;

第一判断子模块,用于若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件不收敛,则循环执行所述第一求解子模块和所述第二求解子模块的执行步骤;

第二判断子模块,用于若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件收敛,则将所述第一最优解确定为所述稀疏表达矩阵的最优解,将所述第二最优解确定为词典权重矩阵的最优解。

可选的,所述第一求解子模块具体用于:

将所述词典权重矩阵设置为固定值,基于迭代更新的方法根据公式:

求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,sc为所述第c类训练样本的稀疏表达矩阵,代表sc矩阵的第k行第n列的元素,κ(xc,xc)=φ(xc)tφ(xc),φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,代表sc矩阵的第n列的所有元素,代表sc矩阵的第k行的所有元素,wc是词典权重矩阵,k是wc矩阵的列数,α、β是常数,α、β称为正则化因子。

可选的,所述第二求解子模块具体用于:

将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法,根据公式:求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解,其中,φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表矩阵的第k列。

第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:

步骤100:从训练样本库中获取训练样本特征集,其中,所述训练样本特征集中包括至少2类训练样本;

步骤110:根据所述训练样本集中的第c类训练样本,采用拉普拉斯约束条件训练所述第c类训练样本的稀疏表达词典,其中,c为大于0的正整数,所述拉普拉斯约束条件为:

φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表sc矩阵的第i列,pij为权重系数,pij代表训练样本和训练样本的紧邻程度,代表所述第c类训练样本中的第i个样本,代表所述第c类训练样本中的第j个样本;

步骤120:基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图,其中,所述图结构模型为拉普拉斯嵌入结构,所述图结构模型为代表第1种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,代表第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,t是常数,μk为第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法对应的权重系数;

步骤130:基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解;

步骤140:针对所述训练样本特征集中的每一类训练样本,重复执行上述步骤110~步骤130,直至所述训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例提供的基于拉普拉斯嵌入的图像分类词典学习方法和装置,通过在传统的拉普拉斯约束条件中引入了词典权重矩阵,给图像分类词典中的每一个原子赋予不同的权重,实现了可以给图像分类词典中有利于图像分类准确性的原子赋予较大的权重,提高了本发明实施例的图像分类词典用于图像分类时的分类效果;同时,本发明实施例在传统的拉普拉斯约束条件中引入了词典权重矩阵,对图像分类词典矩阵进行升维,可以进一步提高本发明实施例的图像分类词典用于图像分类时的分类效果;而且,本发明实施例采用多距离加权的图结构模型计算两个样本之间的近邻程度,提高了衡量两个样本之间的近邻程度的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于拉普拉斯嵌入的图像分类词典学习方法的流程示意图;

图2是图1中步骤130的执行流程示意图;

图3是本发明实施例提供的一种基于拉普拉斯嵌入的图像分类词典学习装置的结构框图;

图4是图3中第二处理模块304的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

为了解决现有技术的词典学习方法中的每一个原子对样本的表达都具有相同的权重,最终导致构造的词典不利于图像的分类的问题,本发明实施例提供一种基于拉普拉斯嵌入的图像分类词典学习方法和装置,通过在传统的拉普拉斯约束条件中引入了词典权重矩阵,给图像分类词典中的每一个原子赋予不同的权重,实现了可以给图像分类词典中有利于图像分类准确性的原子赋予较大的权重,提高了本发明实施例的图像分类词典用于图像分类时的分类效果;同时,本发明实施例在传统的拉普拉斯约束条件中引入了词典权重矩阵,对图像分类词典矩阵进行升维,可以进一步提高本发明实施例的图像分类词典用于图像分类时的分类效果;而且,本发明实施例采用多距离加权的图结构模型计算两个样本之间的近邻程度,提高了衡量两个样本之间的近邻程度的准确性。

下面将结合附图1和附图2,对本发明实施例的基于拉普拉斯嵌入的图像分类词典学习方法进行详细说明。

参考附图1所示,本发明实施例的基于拉普拉斯嵌入的图像分类词典学习方法包括:

步骤100:从训练样本库中获取训练样本特征集,其中,所述训练样本特征集中包括至少2类训练样本。

对于从训练样本库中获取训练样本特征集的具体步骤,本发明实施例不做具体限定,本领域技术人员可参考现有技术。其中,从训练样本库中获取训练样本特征集的步骤可以包括从训练样本库中的图像中提取图像特征和图像标签。

示例的,以本发明实施例的训练样本库为人脸图像样本库为例,本发明实施例的图像分类词典用于人脸图像的分类,其中,从人脸图像样本库中获取人脸图像分类词典的训练样本特征集的步骤如下:获取人脸图像样本库中的人脸图像,并获取人脸图像中的人脸图像信息,然后将人脸图像信息由二维图像矩阵转化为一个一维列向量,其中,这个一维列向量就是从人脸图像样本库中获取的人脸图像特征(其中,人脸图像特征可以是hog特征、lbp特征、haar特征中的一种或多种的组合),人脸图像所属的人就是图像类别,也是从人脸图像样本库中获取到的图像标签。

需要说明的是,从训练样本库中获取的训练样本特征集中至少包括2类训练样本,即训练样本特征集中包括的训练样本至少属于2类图像类别,也就是训练样本特征集中包括的训练样本至少包括2类图像标签。示例的,以人脸图像训练样本特征集为例,人脸图像训练样本特征集中至少包括2个人的人脸图像训练样本。

步骤110:根据所述训练样本集中的第c类训练样本,采用拉普拉斯约束条件训练所述第c类训练样本的稀疏表达词典。

假设训练样本集中有n类训练样本,其中,n为大于1的正整数,示例的,训练样本集中有3类训练样本,第c类训练样本可以是训练样本库中的第2类训练样本,其中,c为大于0的正整数。以人脸图像训练样本集为例,第c类训练样本可以是人脸图像训练样本集中第2个人的人脸图像训练样本。

进一步的,本发明实施例的图像分类词典学习方法采用的拉普拉斯约束条件为:其中,φ(xc)是第c类训练样本映射到核空间中的图像特征矩阵,wc是词典权重矩阵,sc为第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表sc矩阵的第i列,pij为权重系数,pij代表训练样本和训练样本的紧邻程度,代表第c类训练样本中的第i个样本,代表第c类训练样本中的第j个样本。

需要说明的是,假设训练样本集中的训练样本一共有n类,其中,n为大于1的正整数,x=[x1,x2,…xc,…,xn]∈rd×n表示训练样本,d是图像特征的维度,n是训练样本集中的训练样本总的数目,x1,x2,…xc,…,xn分别表示第1,2,…c,…,n,类训练样本,假设n1,n2,…,nc,…,nn分别表示每类训练样本数目,那么n=n1+n2+,…+nc+…+nn。其中,在步骤110的执行过程中,需要对训练样本集中的每一类训练样本重复执行,即分别针对训练样本集中的每一类训练样本,采用拉普拉斯约束条件训练其对应的稀疏表达词典。

其次,需要说明的是,对于将第c类训练样本映射到核空间中的图像特征矩阵φ(xc)的过程,本发明实施例不做具体限定和累述,本领域技术人员可参考现有技术。示例的,可以参考从低维空间向高维空间的映射获取将第c类训练样本映射到核空间中的图像特征矩阵φ(xc)。

步骤120:基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图。

其中,本发明实施例采用的图结构模型为拉普拉斯嵌入结构,该图结构模型的表达公式为其中,代表第1种求本发明实施例的第c类训练样本中的第i个样本与第j个样本之间的距离的方法,代表第k种求本发明实施例的第c类训练样本中的第i个样本与第j个样本之间的距离的方法,t是常数,μk为第k种求本发明实施例的第c类训练样本中的第i个样本与第j个样本之间的距离的方法对应的权重系数。

需要说明的是,拉普拉斯嵌入结构采用的是图嵌入算法,其中,图嵌入算法旨在发现一个存在于低维空间且能够描述原始高维空间本质特征的优化准则。图嵌入方法是把数据看作图中的结点,每一个结点表示数据中的一个样本,用一个无向有权图来描述数据结点之间的关系,通过给两个结点之间赋一个权值来表示它们之间的近邻关系。

其次需要说明的是,图嵌入方法中采用图来表示数据之间的关系,其实就是将数据空间看作是流形空间中的点,首先假设这些数据点处在一个高维流形空间上,然后利用图中各个数据点的近邻关系,找到一个合理的描述方法,或者说是目标函数,找到一个处于低维空间的图来近似的表示原始空间的图,而且降维后的数据能够保持降维之前的近邻关系。其中,图模型的好坏影响到图降维之后的效果,本申请的发明人经过大量的尝试和总结,采用拉普拉斯嵌入结构的图结构模型来描述样本结点之间的关系,可以很好的保持图降维之后的效果。

为了准确描述第c类训练样本中的第i个样本与第j个样本之间的紧邻程度,本发明实施例采用基于多距离加权衡量的拉普拉斯嵌入图结构模型,其表达公式为其中,所采用的计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法包括欧式距离、汉明距离、余弦距离和切比雪夫距离中的至少两种和其对应的权重系数,即本发明实施例基于欧式距离、汉明距离、余弦距离和切比雪夫距离中的至少两种和其对应的权重系数,确定第c类训练样本的近邻关系图。

示例的,公式中的第一种计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法可以是计算第i个样本与第j个样本之间的欧式距离的方法;公式中的第二种计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法可以是计算第i个样本与第j个样本之间的汉明距离的方法;公式中的第三种计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法可以是计算第i个样本与第j个样本之间的余弦距离的方法;公式中的第四种计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法可以是计算第i个样本与第j个样本之间的切比雪夫距离的方法。当然,此处仅是举例说明,并不代表公式中包括的计算第c类训练样本中的第i个样本与第j个样本之间的距离的方法局限于此。

示例的,欧氏距离又称为欧几里得度量,是常见的两点之间或多点之间的距离表示法,定义了欧几里得空间中,两点xi和xj之间的距离为:

示例的,汉明距离是以理查德·卫斯里·汉明的名字命名的。在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。

示例的,欧氏距离的计算公式为其中xi和xj为高维向量。

示例的,切比雪夫距离是向量空间中的一种度量,二个点之间的距离定义是其各坐标数值差绝对值的最大值。若xi和xj代表两个图像样本,xi和xj是高维向量,则两者之间的切比雪夫距离计算公式为:dchebyshev(xi,xj)=max(|xi-xj|),其中:max(|xi-xj|)代表求xi和xj向量中的元素一一对应相减后的值,然后求取这些值中的最大值。

步骤130:基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解。

基于迭代更新的方法,求解拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解,其中,拉普拉斯约束条件的表达式为:具体的,参考附图2所示,基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解的过程包括如下步骤:

步骤1301:将所述词典权重矩阵设置为固定值,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解。

首先将词典权重矩阵设置为固定值,固定值可以是为词典权重矩阵对应的随机数矩阵,即在初始过程中,将词典权重矩阵中的数值设置为随机数,然后将词典权重矩阵的固定值代入拉普拉斯约束条件中,拉普拉斯约束条件简化为

然后,基于简化后的拉普拉斯约束条件,采用迭代更新的方法求取拉普拉斯约束条件中的稀疏表达矩阵的第一最优解,其中,简化后的拉普拉斯约束条件中sc为第c类训练样本的稀疏表达矩阵,代表sc矩阵的第k行第n列的元素,κ(xc,xc)=φ(xc)tφ(xc),φ(xc)是第c类训练样本映射到核空间的中的图像特征矩阵,代表sc矩阵的第n列的所有元素,代表sc矩阵的第k行的所有元素,wc是词典权重矩阵,k是wc矩阵的列数,α、β是常数,α、β称为正则化因子。

采用迭代更新的方法求取的稀疏表达矩阵的第一最优解的表达式为

其中,(wctκ(xc,xc)wc)kk=1,e=wctκ(xc,xc)wc

步骤1302:将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解。

步骤1301执行完毕之后,将稀疏表达矩阵设置为迭代更新的方法求取的稀疏表达矩阵的第一最优解,带入拉普拉斯约束条件中,拉普拉斯约束条件简化为其中,φ(xc)是第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表矩阵的第k列。

然后,采用迭代更新的方法,基于简化后的拉普拉斯约束条件:

求取拉普拉斯约束条件中的词典权重矩阵的第二最优解,其中,求解的词典权重矩阵的第二最优解表达式为其中,代表wc矩阵的第k列,f=scsct

步骤1303:若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件不收敛,则循环执行上述的步骤1301和步骤1302,直到,计算获得的稀疏表达矩阵的第一最优解和词典权重矩阵的第二最优解组成的拉普拉斯约束条件收敛,则执行步骤1304。

步骤1304:若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件收敛,则将所述第一最优解确定为所述稀疏表达矩阵的最优解,将所述第二最优解确定为词典权重矩阵的最优解。

步骤140:针对所述训练样本特征集中的每一类训练样本,重复执行上述步骤110~步骤130,直至所述训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

针对训练样本集中的训练样本每一类训练样本,分别重复执行上述步骤中的步骤110、步骤120和步骤130,获取每一类训练样本对应的拉普拉斯约束条件中的稀疏表达矩阵的最优解和词典权重矩阵的最优解;直至训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

其中,示例的,训练产生的基于拉普拉斯嵌入的图像分类词典的表达式为其中,φ(y)待分类的图像样本,φ(xc)是第c类训练样本映射到核空间中的图像特征矩阵,wc是词典权重矩阵,sc为第c类训练样本的稀疏表达矩阵,α称为正则化因子。

对于本发明实施例的基于拉普拉斯嵌入的图像分类词典进行图像分类的过程,本发明实施例在此不再累述。示例的,使用训练获得的每一类的词典权重矩阵wc和φ(xc),按照公式对样本φ(y)进行稀疏编码,然后进行求解,可以得到如下表达式:

其中,代表sc向量的第k个元素。然后再计算φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,r(c)的计算公式如下:比较φ(y)和每类样本的拟合误差,待分类图像则属于拟合误差最小的那个类别。

本发明实施例提供的基于拉普拉斯嵌入的图像分类词典学习方法和装置,通过在传统的拉普拉斯约束条件中引入了词典权重矩阵,给图像分类词典中的每一个原子赋予不同的权重,实现了可以给图像分类词典中有利于图像分类准确性的原子赋予较大的权重,提高了本发明实施例的图像分类词典用于图像分类时的分类效果;同时,本发明实施例在传统的拉普拉斯约束条件中引入了词典权重矩阵,对图像分类词典矩阵进行升维,可以进一步提高本发明实施例的图像分类词典用于图像分类时的分类效果;而且,本发明实施例采用多距离加权的图结构模型计算两个样本之间的近邻程度,提高了衡量两个样本之间的近邻程度的准确性。

参见图3所示,本发明实施例提供了一种基于拉普拉斯嵌入的图像分类词典学习装置,该装置包括第一获取模块301、第一处理模块302、第二获取模块303、第二处理模块304和循环模块305。

其中,第一获取模块301,用于从训练样本库中获取训练样本特征集,其中,所述训练样本特征集中包括至少2类训练样本;

第一处理模块302,用于根据所述训练样本集中的第c类训练样本,采用拉普拉斯约束条件训练所述第c类训练样本的稀疏表达词典,其中,c为大于0的正整数,所述拉普拉斯约束条件为:

φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表sc矩阵的第i列,pij为权重系数,pij代表训练样本和训练样本的紧邻程度,代表所述第c类训练样本中的第i个样本,代表所述第c类训练样本中的第j个样本;

第二获取模块303,用于基于多距离加权衡量的图结构模型,获取所述第c类训练样本的近邻关系图,其中,所述图结构模型为拉普拉斯嵌入结构,所述图结构模型为代表第1种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,代表第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法,t是常数,μk为第k种求所述第c类训练样本中的第i个样本与第j个样本之间的距离的方法对应的权重系数;

第二处理模块304,用于基于迭代更新的方法求取所述拉普拉斯约束条件中的词典权重矩阵和稀疏表达矩阵的最优解;

循环模块305,用于针对所述训练样本特征集中的每一类训练样本,重复执行第一处理模块302、第二获取模块303和第二处理模块304的执行步骤,直至所述训练样本特征集中的每一类训练样本均执行完毕,则输出训练产生的基于拉普拉斯嵌入的图像分类词典。

优选的,第二获取模块具体303用于:

基于欧式距离、汉明距离、余弦距离和切比雪夫距离中的至少两种和其对应的权重系数,确定所述第c类训练样本的近邻关系图。

可选的,参考图4所示,第二处理模块304具体包括:

第一求解子模块3041,用于将所述词典权重矩阵设置为固定值,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,所述固定值为所述词典权重矩阵对应的随机数矩阵;

第二求解子模块3042,用于将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解;

第一判断子模块3043,用于若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件不收敛,则循环执行第一求解子模块3041和第二求解子模块3042的执行步骤;

第二判断子模块3044,用于若所述稀疏表达矩阵的第一最优解和所述词典权重矩阵的第二最优解组成的所述拉普拉斯约束条件收敛,则将所述第一最优解确定为所述稀疏表达矩阵的最优解,将所述第二最优解确定为词典权重矩阵的最优解。

可选的,第一求解子模块3041具体用于:

将所述词典权重矩阵设置为固定值,基于迭代更新的方法根据公式:

求取所述拉普拉斯约束条件中的所述稀疏表达矩阵的第一最优解,其中,sc为所述第c类训练样本的稀疏表达矩阵,代表sc矩阵的第k行第n列的元素,κ(xc,xc)=φ(xc)tφ(xc),φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,代表sc矩阵的第n列的所有元素,代表sc矩阵的第k行的所有元素,wc是词典权重矩阵,k是wc矩阵的列数,α、β是常数,α、β称为正则化因子。

可选的,第二求解子模块3042具体用于:

将所述稀疏表达矩阵设置为所述第一最优解,基于迭代更新的方法,根据公式:求取所述拉普拉斯约束条件中的所述词典权重矩阵的第二最优解,其中,φ(xc)是所述第c类训练样本映射到核空间的中的图像特征矩阵,wc是词典权重矩阵,sc为所述第c类训练样本的稀疏表达矩阵,k是wc矩阵的列数,代表矩阵的第k列。

需要说明的是:上述实施例提供的基于拉普拉斯嵌入的图像分类词典学习装置在训练生成每一类训练样本的图像分类词典时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于拉普拉斯嵌入的图像分类词典学习装置与基于拉普拉斯嵌入的图像分类词典学习方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

基于相同的发明构思,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质可以是存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质存储有一个或者一个以上计算机程序,该一个或者一个以上计算机程序被一个或者一个以上的处理器用来执行图1、图2所示的基于拉普拉斯嵌入的图像分类词典学习方法。另外,上述实施例提供的计算机可读存储介质与上述的基于拉普拉斯嵌入的图像分类词典学习方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1