一种基于黑森正则约束与a优化的非负图像数据降维方法

文档序号:9235626阅读:752来源:国知局
一种基于黑森正则约束与a优化的非负图像数据降维方法
【技术领域】
[0001] 本发明属于图像数据处理技术领域,具体设及一种基于黑森正则约束与A优化的 非负图像数据降维方法。
【背景技术】
[0002] 在图像聚类,图像识别和基于图像的情景模式识别等图像处理领域,数据规模在 近期呈现爆炸式增长,且该些待处理的图像数据往往都具有非常高维的特征。该些海量高 维特征数据,带来了许多图像存储和处理方面的挑战。幸运的是,研究人员发现该些图像数 据的内在维度相比其原始维度要低得多。该种使用低维的数据来替代数据的原始高维表 示的做法,被称为降维。对于许多数据分析方法来说,利用降维可W减少维度灾难的约束, 有效降低分析方法本身的计算复杂度,甚至还能提升一些方法的效果,如降维后数据可W 提高判别性从而改善聚类分析结果。近些年来,研究者提出了许多经典的数据降维技术, 如矢量分解(VectorQuantization,VQ)、主成分分析(PrincipalComponentAnalysis, PCA)、线性判别分析(LinearDiscriminantAnalysis,LDA)、独立成分分析(Incbpendent ComponentAnalysis,ICA)、稀疏编码(SparseCoding)、局部保留投影(LocalPreserving Projection,LPF〇和非负矩阵分解(Non-negativeMatrixF'actorization,NMF)等。
[0003] 在所有该些方法中,非负矩阵分解是较为频繁使用的基本方法。非负矩阵分解的 基本步骤是将原始数据矩阵分解成为两个因子矩阵,而分解所得因子矩阵的乘积可W有效 地近似表示原始数据。非负矩阵分解所得的其中一个因子矩阵可W看作原始数据的一组 基,每组基向量都蕴含着一些数据的内在语义;另一个因子矩阵则看作系数矩阵,来表述原 始数据与每组基向量的联系,它相当于原始数据在低维空间下的新表示。此外,非负矩阵分 解还要求原始数据矩阵是非负(即矩阵的每个元素都是非负的)的,并且分解所得的基矩 阵和系数矩阵都是非负的。该种基于基向量组合的表示形式具有很直观的语义解释,它反 映了人类思维中"局部构成整体"的概念。在现实应用中,文本矩阵、图像矩阵等原本就是 非负的,而非负矩阵分解后找到的基的数量通常要远小于数据的原始维度。因此,非负矩阵 分解可W有效地压缩数据大小,为其他数据学习方案如聚类、分类等提供便利。
[0004] 近年来,不断有研究人员提出改进型的非负矩阵分解方法,如概念分解(Concept F'actorization,CF)、图正则非负矩阵分解(Graph regularized Non-negative Matrix F'actorization,GNMF) W及带约束的非负矩阵分解(Constrained Nonnegative Matrix 化ctorization,CNMF)等。该些改进方法虽然在各自针对的子问题上都有所突破,却或是 没有考虑使用线性回归模型来约束降维后的数据表示,或是没有顾及原始图像数据的流形 结构中包含的内在几何特性。因此,该些非负矩阵分解方法所得到的基可能与原始数据距 离甚远,使用该类基来进行数据表示显然也不会是最优的。

【发明内容】

[0005] 针对现有技术所存在的上述技术问题,本发明提供了一种基于黑森正则约束与A 优化的非负图像数据降维方法,能够有效提取低维特征表示,所得的低维表示具有更强的 判别能力,可W明显改良后续图像数据分析的效果。
[0006] -种基于黑森正则约束与A优化的非负图像数据降维方法,包括如下步骤:
[0007] (1)获取图像样本集合,通过图像特征提取得到集合中每个图像样本的特征向量, 进而构建所述图像样本集合的样本特征矩阵X ;
[0008] (2)根据所述的样本特征矩阵X,基于黑森能量原则计算出对应的黑森正则矩阵 肿,
[000引 做根据所述的样本特征矩阵X和黑森正则矩阵光,通过基于A优化与黑森正则 约束的非负矩阵分解迭代算法,求解出基矩阵U和系数矩阵V,并使系数矩阵V作为图像数 据的低维特征表示。
[0010] 所述的非负矩阵分解迭代算法基于W下迭代方程组:
[0024]
[002引其中;U嘴U w分别为第t次迭代和第t-1次迭代的基矩阵,V嘴V w分别为第t 次迭代和第t-1次迭代的系数矩阵,Pt和P W分别为第t次迭代和第t-1次迭代的辅助矩 阵,[diagO]表示由0中矩阵的对角线元素组建的对角矩阵,为中间矩降矿中第j行第k列元素,为基矩阵护-1中第j行第k列元素,巧^^,^为中间矩阵^^中第k行第i 列元素,为系数矩阵yt-i中第k行第i列元素,地W和请苗分别为辅助矩阵P嘴辅助 矩阵pw中第i行第k列元素,af;;苗为中间矩阵A"中第j行第k列元素,为中间矩 阵旷1中第j行第k列元素,为中间矩阵扩1中第k行第i列元素,瑪苗为中间矩阵 旷1中第k行第i列元素,4苗为中间矩阵Et-i中第i行第k列元素,/品切中间矩阵护-1 中第i行第k列元素,嗦示矩阵转置,如品为中间矩阵沪中第k行第i列元素,非品为 中间矩阵旷1中第k行第1列元素,新子j)为中间矩阿gt-l中第k行第i列元素,爲f/Tj)为 中间矩阵护-1中第k行第i列元素,巧占 1)为中间矩阵Qt-i中第k行第1列元素,弓(心)为 中间矩阵$1-1中第k行第1列元素,t为迭代次数,i、j、k和1均为自然数且1《i《n, 1《j《m,l《k《r,l《1《r,n为样本特征矩阵X的列数即集合中图像样本的个数,m 为样本特征矩阵X的行数即每个图像样本的特征个数,r为系数矩阵V的行数即样本特征 矩阵X降维后的维度,a、P和A均为预设的迭代运算系数。
[0030]所述的迭代运算系数a、P和A满足W下关系式:
[00引] 入二曰P
[0032] 所述非负矩阵分解迭代算法的迭代终止条件如下:
[0033]
[0034]
[00巧]其中;TrO表示0中矩阵的迹,I为单位矩阵,丫为迭代运算系数且为实际经验 值,〇t和〇w分别为第t次迭代和第t-1次迭代的目标判断矩阵,P为预设的收敛阔值。
[0036] 本发明的有益技术效果如下;
[0037] (1)基于统计学的数据编码;相比于传统的基于非负矩阵分解的图像数据降维方 法,本发明基于岭回归模型,在目标函数中加入A优化正则项,使得分解得到的数据表示, 不论其数据标注值如何选择,都服从一个稳定的线性模型,预测误差较小。
[0038] (2)考虑原始图像数据的内在几何结构;相比于传统的基于非负矩阵分解的图像 数据降维方法,本发明通过在非负矩阵分解的目标函数中加入黑森正则项,使得分解得到 的数据表示能够保存原有图像数据的流形结构中包含的内在特性。
[0039] (3)处理高维数据的有效性;相比于直接的使用原始数据进行数据分析,本发明 通过降维去掉了高维数据中的冗余信息,提取出了能准确表示数据语义结构的低维表示, 使得对于高维图像数据的聚类等数据分析变得简单而有效。
【附图说明】
[0040] 图1为本发明基于黑森正则约束与A优化的非负图像数据降维方法的流程示意 图。
【具体实施方式】
[0041] 为了更为具体地描述本发明,下面结合附图及【具体实施方式】对本发明的技术方案 进行详细说明。
[0042] 如图1所示,本发明基于黑森正则约束与A优化的非负图像数据降维方法,包括如 下步骤:
[0043] (1)构建样本特征矩阵。
[0044] 本实施方式W MINIST手写体数字数据集为例,该数据集合的统计信息如表1所 示:
[0045]表1
[0046]
[0047] 其中,MINIST数据集中有4000张手写体数字图像,4000张手写体数字图像由10 个不同的手写体数字组成(每个数字400张图像),直接选取图像像素的灰度值作为图像特 征。
[0048] 选取MINIST数据集中两类实例作为原始的高维数据集合(即确定聚类个数1 = 2),并构建对应的样本特征矩阵X,X为mXn维矩阵,m为样本的特征个数(即图像的像素 个数),n为样本个数(即图像帖数),n = 2X400 = 800,m = 784 ;则样本特征矩
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1