基于稀疏边界Fisher算法的图像识别方法及装置与流程

文档序号:11276870阅读:382来源:国知局
基于稀疏边界Fisher算法的图像识别方法及装置与流程
本发明涉及图像识别领域,更具体地说,涉及一种基于稀疏边界fisher算法的图像识别方法及装置。
背景技术
:随着人工智能技术的发展,人机交互的形式不断扩充丰富,构建有效的人机交互成为发展趋势。人脸是人类情感表达和交流的最重要、最直接的方式,因此人脸识别技术逐渐成为人机交互中模式识别领域的一个热点。基于人脸特征的识别方法也逐渐发展起来,但是采用的对人脸特征的提取方法还不够成熟可靠。边界fisher分析(mfa)算法是一种特征提取方法,它是一种结合类边界信息的图嵌入算法,基本思想是构造一个本征图,使类内样本点更加紧凑,同时构造一个惩罚图,使异类间的边界样本点更加分离,充分利用了类间边界判别信息和类内的局部相似信息,将数据的几何结构很好地保留,但是由于局部的判别结构忽略了数据集的全局判别信息,可能导致所有数据的判别学习失去平衡。因此,如何很好地保留数据几何结构的同时保证数据集的全局判别信息是本领域技术人员需要解决的问题。技术实现要素:本发明的目的在于提供一种基于边界fisher分析的特征提取方法,以很好地保留数据几何结构同时保证数据集的全局判别信息,提高识别率。为实现上述目的,本发明实施例提供了如下技术方案:一种基于稀疏边界fisher算法的图像识别方法,包括:获取第一训练数据集,根据所述第一训练数据集得到投影矩阵;对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵;将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集;接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。优选地,所述利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别,包括:利用最近邻分类算法对所述第二测试数据在所述第二训练数据集上进行识别。优选地,所述获取第一训练数据集,根据所述第一训练数据集得到投影矩阵,包括:获取第一训练数据集其中xi∈rd,yi∈{1,2,...,c},n是样本的个数,d是样本的维数,yi是xi的类别标签,c是类别总数;对寻找投影矩阵的目标函数求解,得到所述投影矩阵;其中,投影矩阵为p且p∈rd×m,m为设定的子空间大小;x∈rd×n,是所述第一训练数据集中的训练数据做成的样本矩阵;lb∈rn×n,是类间拉普拉斯矩阵;lw∈rn×n,是类内拉普拉斯矩阵;a是对矩阵x(lw+lb)xt特征分解后由其非零特征值对应的特征向量组成的矩阵。优选地,对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵,包括:采用线性bregman迭代方法求解对所述投影矩阵p稀疏化,得到所述稀疏投影矩阵v,其中||v||1是1范数。优选地,所述将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集,包括:所述第一训练数据集根据所述稀疏投影矩阵v进行投影得到第二训练数据集其中zi=vtxi。一种基于稀疏边界fisher算法的图像识别装置,包括:投影矩阵获取模块,用于获取第一训练数据集,根据所述第一训练数据集得到投影矩阵;稀疏化处理模块,用于对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵;训练数据集投影模块,用于将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集;测试数据投影模块,用于接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;识别模块,用于利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。优选地,所述识别模块具体用于利用最近邻分类算法对所述第二测试数据在所述第二训练数据集上进行识别。优选地,所述投影矩阵获取模块,包括:第一训练数据集获取单元,用于获取第一训练数据集其中xi∈rd,yi∈{1,2,...,c},n是样本的个数,d是样本的维数,yi是xi的类别标签,c是类别总数;投影矩阵获取单元,用于对寻找投影矩阵的目标函数求解,得到所述投影矩阵;其中,投影矩阵为p且p∈rd×m,m为设定的子空间大小;x∈rd×n,是所述第一训练数据集中的训练数据做成的样本矩阵;lb∈rn×n,是类间拉普拉斯矩阵;lw∈rn×n,是类内拉普拉斯矩阵;a是对矩阵x(lw+lb)xt特征分解后由其非零特征值对应的特征向量组成的矩阵。优选地,所述稀疏化处理模块,具体用于采用线性bregman迭代方法求解对所述投影矩阵p稀疏化,得到所述稀疏投影矩阵v,其中||v||1是1范数。优选地,所述训练数据集投影模块,具体用于所述第一训练数据集根据所述稀疏投影矩阵v进行投影得到第二训练数据集其中zi=vtxi。通过以上方案可知,本发明实施例提供的一种基于稀疏边界fisher算法的图像识别方法,包括:获取第一训练数据集,根据所述第一训练数据集得到投影矩阵;对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵;将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集;接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。因此,通过对训练数据集进行投影得到投影矩阵,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,可以很好地保留数据几何结构;再将投影矩阵进行稀疏化处理,可以得到更好的泛化能力和判别能力,保证数据集的全局判别信息,然后将第一测试数据进行投影得到的第二测试数据,再通过分类算法在稀疏投影后的第二训练数据集上进行识别,因此对于测试数据的识别既充分利用了类间判别信息和类内的局部相似信息,最大程度的保留了数据的集合结构,同时也保证了数据集的全局判别信息解决了对所有数据的判别学习失去平衡的问题,提高了识别率;本发明还公开了一种基于稀疏边界fisher算法的图像识别装置,同样能实现上述技术效果。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例公开的一种图像识别方法流程图;图2为本发明实施例公开的一种图像识别装置结构示意图;图3为本发明实施例公开的一具体的投影矩阵模块结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开了一种基于边界fisher分析的特征提取方法,以保证数据集的全局判别信息,提高识别率。参见图1,本发明实施例提供的一种基于边界fisher算法的图像识别方法,包括:s101,获取第一训练数据集,根据所述第一训练数据集得到投影矩阵。具体地,首先对训练图像进行mfa(边界fisher分析)子空间学习,即在训练图像中获取第一训练数据集,并且根据训练数据集得到投影矩阵。其中,投影矩阵可以根据训练数据集得到寻找投影矩阵的目标函数,通过对目标函数求解得到投影矩阵。需要说明的是,对训练图形进行mfa子空间学习可以充分利用类间编辑判别信息和类内的局部相似信息,得到的投影矩阵能最大程度地保留数据的几何结构,但是局部的判别忽略了数据集的全局判别信息。s102,对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵;具体地,对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵,可以控制原始变量和特征权重,可以得到更好的泛化能力和判别能力,解决了mfa子空间学习忽略数据集的全局判别信息的问题。s103,将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集;在本方案中,通过s102得到的稀疏投影矩阵对第一训练数据集进行投影,得到投影后的第二数据集;需要说明的是,对测试数据进行分类时需要在投影后的训练数据集即第二训练数据集上进行分类。s104,接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;具体地,首先在待识别图像中得到测试数据,即第一测试数据,再利用s102得到的系数投影矩阵对第一测试数据进行投影,得到投影后的测试数据,即第二测试数据。s105,利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。具体地,将投影后的测试数据即第二测试数据在投影后的训练数据集即第二训练数据集上进行分类,分类通过分类算法实现,也就是对测试图像数据进行识别,得出识别结果。因此,通过对训练数据集进行投影得到投影矩阵,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,因此可以很好地保留数据几何结构;再将投影矩阵进行稀疏化处理,可以得到更好的泛化能力和判别能力,保证数据集的全局判别信息,然后将第一测试数据进行投影得到的第二测试数据,再通过分类算法在稀疏投影后的第二训练数据集上进行识别,因此,对于测试数据的识别既充分利用了类间判别信息和类内的局部相似信息,最大程度的保留了数据的几何结构,同时也保证了数据集的全局判别信息解决了对所有数据的判别学习失去平衡的问题,提高了识别率。本发明实施例公开了一种具体的基于稀疏边界fisher算法的图像识别方法,相对于上一实施例,本实施例对技术方案做了进一步的说明和优化。包括:s201,获取第一训练数据集其中xi∈rd,yi∈{1,2,...,c},n是样本的个数,d是样本的维数,yi是xi的类别标签,c是类别总数;具体地,在训练图像中得到训练数据集,即第一训练数据集s202,对寻找投影矩阵的目标函数求解,得到所述投影矩阵;其中,投影矩阵为p且p∈rd×m,m为设定的子空间大小;x∈rd×n,是所述第一训练数据集中的训练数据组成的样本矩阵;lb∈rn×n,是类间拉普拉斯矩阵;lw∈rn×n,是类内拉普拉斯矩阵;a是对矩阵x(lw+lb)xt特征分解后由其非零特征值对应的特征向量组成的矩阵。具体地,根据s201得到的第一训练数据集得到第一训练数据集中的训练数据组成的样本矩阵x,将x带入寻找投影矩阵的目标函数中进行求解,得到目标函数中的投影矩阵p。s203,采用线性bregman迭代方法求解对所述投影矩阵p稀疏化,得到所述稀疏投影矩阵v,其中||v||1是1范数。具体地,将投影矩阵稀疏化,采用线性bregman迭代方法求解从而得到投影矩阵稀疏化后的稀疏投影矩阵v。通过线性bregman迭代进行稀疏化处理,可以控制原始变量和特征的权重,得到更好地泛化能力和判别能力。s204,所述第一训练数据集根据所述稀疏投影矩阵v进行投影得到第二训练数据集其中zi=vtxi。具体地,通过s203得到的稀疏投影矩阵v对第一训练数据集进行投影,得到投影后的第二数据集其中zi由xi通过稀疏投影矩阵v计算得来,即zi=vtxi。s205,接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;具体地,接收待识别图的第一测试数据x,其中x∈rd,对x进行稀疏化处理,也就是说将x通过稀疏投影矩阵v进行投影,得到第二测试数据z,其中z∈rm。s206,利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。具体地,利用分类算法对第二测试数据z在第二训练数据集上进行分类,也就是对测试图像数据进行识别,得出识别结果。因此,本发明实施例通过对训练数据集进行投影得到投影矩阵p,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,最大程度的保留数据的几何结构;再将投影矩阵p通过bregman迭代方法进行稀疏化处理得到稀疏投影矩阵v,可以得到更好的泛化能力和判别能力;然后将第一测试数据x进行投影得到的第二测试数据z,再通过分类算法在稀疏投影后的第二训练数据集上进行识别,因此对于测试数据的识别既充分利用了类间判别信息和类内的局部相似信息,同时也解决了对所有数据的判别学习失去平衡的问题,提高了识别率。本发明实施例公开了一种具体的基于基于稀疏边界fisher算法的图像识别方法,相对于上一实施例本实施例对上一实施例中利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别做了具体的限定,其他步骤与上一实施例大致相同,详细内容可以参见上一实施例相对应的部分,此处不再赘述。具体的:利用最近邻分类算法对所述第二测试数据在所述第二训练数据集上进行识别。下面对本发明实施例提供的一种基于稀疏边界fisher算法的图像识别装置进行介绍,可以与上文描述的一种基于稀疏边界fisher算法的图像识别方法相互参照。参见图2,本发明实施例提供一种基于稀疏边界fisher算法的图像识别装置,包括投影矩阵获取模块301,稀疏化处理模块302,训练数据集投影模块303,测试数据投影模块304,识别模块305。投影矩阵获取模块301,用于获取第一训练数据集,根据所述第一训练数据集得到投影矩阵。具体地,投影矩阵获取模块301首先对训练图像进行mfa子空间学习,在训练图像中获取第一训练数据集,并且根据训练数据集得到投影矩阵。其中,可以根据训练数据集得到寻找投影矩阵的目标函数,再通过对目标函数求解得到投影矩阵。需要说明的是,对训练图形进行mfa子空间学习可以充分利用类间编辑判别信息和类内的局部相似信息,得到的投影矩阵能最大程度地保留数据的几何结构,但是局部的判别忽略了数据集的全局判别信息。稀疏化处理模块302,用于对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵。具体地,稀疏化处理模块302对所述投影矩阵进行稀疏化处理,得到稀疏投影矩阵,可以控制原始变量和特征权重,可以得到更好的泛化能力和判别能力,解决了mfa子空间学习忽略数据集的全局判别信息的问题。训练数据集投影模块303,用于将所述第一训练数据集通过所述稀疏投影矩阵进行投影,得到第二训练数据集。具体地,通过稀疏化处理模块302得到的稀疏投影矩阵对第一训练数据集进行投影,得到投影后的第二训练数据集。测试数据投影模块304,用于接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;具体地,测试数据投影模块304首先在待识别图像中得到测试数据,即第一测试数据,再利用稀疏化处理模块302得到的稀疏投影矩阵对第一测试数据进行投影,得到投影后的测试数据,即第二测试数据。识别模块305,用于利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。具体地,将测试数据投影模块304得到的第二测试数据在训练数据集投影模块303的第二训练数据集上进行分类,分类通过分类算法实现,也就是对测试图像数据进行识别,得出识别结果。因此,投影矩阵获取模块301通过对训练数据集进行投影得到投影矩阵,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,最大程度的保留数据的几何结构;稀疏化处理模块302再将投影矩阵进行稀疏化处理,可以得到更好的泛化能力和判别能力,然后测试数据投影模块304将第一测试数据进行投影得到的第二测试数据,识别模块305再通过分类算法在第二训练数据集上进行识别。因此,通过对训练数据集进行投影得到投影矩阵,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,可以很好地保留数据几何结构;再将投影矩阵进行稀疏化处理,可以得到更好的泛化能力和判别能力,保证数据集的全局判别信息,然后将第一测试数据进行投影得到的第二测试数据,再通过分类算法在稀疏投影后的第二训练数据集上进行识别,因此对于测试数据的识别既充分利用了类间判别信息和类内的局部相似信息,最大程度的保留了数据的集合结构,同时也保证了数据集的全局判别信息解决了对所有数据的判别学习失去平衡的问题,提高了识别率。本发明实施例公开了一种具体的基于基于稀疏边界fisher算法的图像识别装置,相对于上一实施例,本实施例对技术方案做了进一步的说明和优化。具体的:投影矩阵获取模块401,参见图3,投影矩阵获取模块401具体包括:第一训练数据集获取单元401a,用于获取第一训练数据集其中xi∈rd,yi∈{1,2,...,c},n是样本的个数,d是样本的维数,yi是xi的类别标签,c是类别总数;具体地,第一训练数据集获取单元在训练图像中得到训练数据集,即第一训练数据集投影矩阵获取单元401b,用于对寻找投影矩阵的目标函数求解,得到所述投影矩阵;其中,投影矩阵为p且p∈rd×m,m为设定的子空间大小;x∈rd×n,是所述第一训练数据集中的训练数据做成的样本矩阵;lb∈rn×n,是类间拉普拉斯矩阵;lw∈rn×n,是类内拉普拉斯矩阵;a是对矩阵x(lw+lb)xt特征分解后由其非零特征值对应的特征向量组成的矩阵。具体地,根据第一训练数据集获取单元401a得到的第一训练数据集得到第一训练数据集中的训练数据组成的样本矩阵x,将x带入寻找投影矩阵的目标函数中进行求解,得到目标函数中的投影矩阵p。稀疏化处理模块402,用于采用线性bregman迭代方法求解对所述投影矩阵p稀疏化,得到所述稀疏投影矩阵v,其中||v||1是1范数。具体地,将投影矩阵稀疏化,采用线性bregman迭代方法求解以得到投影矩阵稀疏化后的稀疏投影矩阵v。通过线性bregman迭代进行稀疏化处理,可以控制原始变量和特征的权重,得到更好地泛化能力和判别能力。训练数据集投影模块403,用于所述第一训练数据集根据所述稀疏投影矩阵v进行投影得到第二训练数据集其中zi=vtxi。具体地,通过稀疏化处理模块402得到的稀疏投影矩阵v对第一训练数据集进行投影,得到投影后的第二数据集其中zi由xi通过稀疏投影矩阵v计算得来,即zi=vtxi。测试数据投影模块404,用于接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;具体地,接收待识别图的第一测试数据x,其中x∈rd,对x进行稀疏化处理,也就是说将x通过稀疏投影矩阵v进行投影,得到第二测试数据z,其中z∈rm。识别模块405,用于利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。具体地,利用分类算法对第二测试数据z在第二训练数据集上进行分类,对测试数据进行识别,得出识别结果。因此,本发明实施例第一训练数据集获取单元401a通过对训练数据集进行投影得到投影矩阵p,也就是对训练数据集进行mfa子空间学习,可以充分利用类间边界判别信息和类内的局部相似信息,最大程度的保留数据的几何结构;稀疏化处理模块402再将投影矩阵p通过bregman迭代方法进行稀疏化处理得到稀疏投影矩阵v,可以得到更好的泛化能力和判别能力;然后测试数据投影模块404将第一测试数据x进行投影得到的第二测试数据z,识别模块405再通过分类算法在第二训练数据集上进行识别。因此对于测试数据的识别既充分利用了类间判别信息和类内的局部相似信息,最大程度的保留了数据的集合结构,同时也保证了数据集的全局判别信息解决了对所有数据的判别学习失去平衡的问题,提高了识别率。本发明实施例公开了一种基于稀疏边界fisher算法的图像识别装置,相对于上一实施例本实施例对上一实施例中识别模块做了具体地限定,其他模块与上一实施例大致相同,详细内容可以参见上一实施例相对应的部分,此处不再赘述。具体地:识别模块具体用于利用最近邻分类算法对所述第二测试数据在所述第二训练数据集上进行识别。本发明实施例公开了一种具体的基于边界fisher分析的图像识别方法。具体的:本发明实施例本发明在jaffe人脸表情库上进行测试,该数据集是人脸表情识别研究中使用最广泛的数据集之一。jaffe人脸库包含有10名日本女性的213张表情图片,共含有7种基本表情,分别是愤怒、高兴、伤心、惊讶、厌恶、恐惧和面无表情。在本实例中,使用手工方法定位每张图片的眼睛,根据双眼的位置进行表情图片的分割,得到每张图片的面部表情区域。每张人脸表情图被尺寸化为32*32。s501,获取第一训练数据集其中xi∈rd,yi∈{1,2,...,c},n是样本的个数,n=140,d是样本的维数d=1024,yi是xi的类别标签,c是类别总数,c=7;s502,对寻找投影矩阵的目标函数求解,得到所述投影矩阵;其中,投影矩阵为p且p∈rd×m,m为设定的子空间大小;x∈rd×n,是所述第一训练数据集中的训练数据做成的样本矩阵;lb∈rn×n,是类间拉普拉斯矩阵;lw∈rn×n,是类内拉普拉斯矩阵;a是对矩阵x(lw+lb)xt特征分解后由其非零特征值对应的特征向量组成的矩阵。因此,该投影矩阵可以最大程度的保留数据的几何结构。s503,采用线性bregman迭代方法求解对所述投影矩阵p稀疏化,得到所述稀疏投影矩阵v,其中||v||1是1范数。具体地,将投影矩阵稀疏化,采用线性bregman迭代方法求解以得到投影矩阵稀疏化后的稀疏投影矩阵v。通过线性bregman迭代进行稀疏化处理,控制原始变量和特征的权重,可以得到更好地泛化能力和判别能力。s504,所述第一训练数据集根据所述稀疏投影矩阵v进行投影得到第二训练数据集其中zi=vtxi。s505,接收待识别图像的第一测试数据,对所述第一测试数据通过所述稀疏投影矩阵进行投影得到第二测试数据;具体地,接收待识别图的第一测试数据x,其中x∈rd,对x进行稀疏化处理,也就是说将x通过稀疏投影矩阵v进行投影,得到第二测试数据z,其中z∈rm。s506,利用分类算法对所述第二测试数据在所述第二训练数据集上进行识别。具体地,利用分类算法对第二测试数据z在第二训练数据集上进行分类,对测试数据进行识别。本发明实施例从jaffe数据库的每类中选取20个人脸样本进行测试,7类表情共140个训练样本,数据集其余所有样本作为测试样本。实验重复10次,记录10次识别结果的平均值,对比方法为未进行稀疏化的mfa算法和经过pca降维后的mfa。实验结果如表1所示,从实验结果可以看出,本发明提供的一种基于边界fisher分析的图像识别方法即使未配合pca降维的情况下也能拥有较好的识别效果,能够有效提升识别率。表1:基于稀疏边界fisher分析以及边界fisher分析的表情识别率(%)方法边界fisher分析pca+边界fisher分析本发明平均识别率46.44±4.6878.63±4.6779.04±3.42本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1