一种基于子空间学习的图像特征提取方法与流程

文档序号:22615043发布日期:2020-10-23 19:14阅读:318来源:国知局
本发明涉及图像处理与分析
技术领域
:,具体地说是一种基于子空间学习的图像特征提取方法。
背景技术
::随着图像采集技术和计算机技术的飞速发展,图像处理与分析成为研究的热点。由于图像含有丰富的信息,其维数往往较高,对高维图像数据进行降维并提取出有效的特征是后续图像分析与应用的重要基础。特征是描述图像模式的最佳方式,特征的各个维度能够从不同的角度描述图像。特征提取的主要思想是将原始样本投影到一个低维特征空间,得到最能反应样本本质或进行样本区分的低维样本特征。随着机器学习理论在图像特征提取领域的应用不断深入,近年来,很多新的方法与思想被应用于图像特征提取领域,子空间学习方法是比较有代表性的方法之一。子空间学习旨在将图像从原始特征空间转换到子空间,降低特征维数同时获得新的图像特征表示。常用的子空间学习方法,如典型相关分析(canonicalcorrelationanalysis,cca)、核典型关联分析方法(kernelcanonicalcorrelationanalysis,kcca)、独立成分分析(independentcomponentanalysis,ica)、局部线性嵌入(locallylinearembedding,lle)、偏最小二乘(partialleastsquares,pls)和局部保持投影(localitypreservingprojection,lpp)等均在图像分析和处理领域广泛应用并表现出良好的性能。然而,图像包含有丰富的信息,比如2d图像可以提取出颜色、形状、纹理和空间关系等特征;磁共振影像可以提取出大脑的皮层厚度、体积、表面积和局部回指标等特征。因此,利用子空间学习方法挖掘图像不同特征之间的潜在关联并找到图像的最佳低维表示对后续的图像处理与分析具有重要意义。此外,在现实生活中,大量的图像数据是没有标记信息的,而少量图像可以通过人工标注的方法获得标记信息。如何利用有标记的图像更好地对无标记的图像提取特征,促进无标记图像的识别与分析,也具有重要研究意义。技术实现要素:本发明为克服上述现有技术的不足,提出了一种特征提取方法,用于后续的图像分类。该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中,在子空间中尽可能保持多特征之间的相关性、原始的数据结构以及数据与类标之间的对应关系。然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间。在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示。本方法能够充分利用图像的多特征信息、数据的结构信息和数据的类标信息对无标记图像提取特征,显著提高了无标记图像的分类准确率。本发明的技术方案是:一种基于子空间学习的图像特征提取方法,该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中;然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间;在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示,该方法包括如下步骤:(1)对采集的磁共振mri图像进行预处理,提取多种形态学特征;(2)使用有标记样本学习投影矩阵定义为特征矩阵a,为特征矩阵b,其中n为有标记样本数目,d为特征维数,为第n个样本的a特征向量,为第n个样本的b特征向量,定义y∈rn×c是由0-1编码组成的类标矩阵,其中c为类别数目,为了学习两个投影矩阵ud×c和vd×c,目标函数定义如下:目标函数的第一项l(u,v)是从特征空间到类标空间的线性回归项,它保证了投影后的样本与类标相对应,l(u,v)定义如下:目标函数的第二项f(u,v)用于保持同一幅图像的a特征和b特征在子空间中尽可能靠近,f(u,v)定义如下:目标函数的第三项g(u,v)是图正则化项,用来保持单一特征样本之间的邻域关系这一局部结构信息,关于a特征数据xa的图正则化项,定义一个无向对称图ga=(va,wa),其中va是xa中的样本集合,wa表示样本之间的关系,wa中的每个元素定义为:其中定义为的k近邻,定义ai为utxa的第i列,a特征数据的图正则化项定义如下:其中la=da-wa是图拉普拉斯矩阵,da∈rn×n是对角矩阵,其对角线元素为对于b特征数据xb,定义bi为vtxb的第i列,b特征数据的图正则化项定义如下:其中和lb的定义如前所述,最终,图正则化项g(u,v)表示为目标函数的最后一项r(u,v)控制投影矩阵的尺度以避免产生过拟合:此外,λ,α和β是三个平衡参数,基于公式(2),(3),(7)和(8),得到最终的目标函数为(3)无标记样本特征提取定义和分别为m个无标记样本的a特征矩阵和b特征矩阵,无标记样本在子空间中的特征表示为feaa∈rm×c和feab∈rm×c,计算如下:为了使无标记样本的投影特征更具区分性,同时平衡a和b两种特征对分类的影响,对子空间中的特征进行自加权运算和加权融合,得到最终的特征,最终,无标记样本的特征为fea=η*(|feaa|*feaa)+(1-η)*(|feab|*feab)(15)其中η为权重参数。特别地,步骤(1)的具体方式为:采集mri图像数据,使用freesurfer软件进行预处理,提取多种形态学特征;然后,使用高斯核函数对图像进行平滑;最后,使用自动解剖标记(automatedanatomicallabeling,aal)模板计算每个解剖区域的多种形态学特征值。本发明还包括一种医学图像分类装置,该装置包括数据采集部件、存储器和处理器,其中,所述数据采集部件采集并对采集的mri图像进行预处理,提取形态学特征;所述存储器存储有计算机程序,所述程序被处理器执行时能够实现上述方法的步骤(2)至步骤(3)。本发明还包括一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述方法的步骤。本发明的有益效果是:利用有标记图像和子空间学习方法对无标记图像进行特征提取,充分利用了图像的多特征信息、有标记图像数据的结构信息和类标信息。该方法提取的特征显著降低了原始图像数据的维数,能更好地反映出图像的本质信息,具有较强的区分性、鲁棒性和更好的泛化能力。附图说明图1是本发明的基于子空间学习的图像特征提取方法示意框图;图2是mr图像示意图。具体实施方式下面结合附图和实例对本发明作进一步说明。如图1所示,以阿茨海默症(alzheimer’sdisease,ad)患者和正常受试者(normalcontrols,nc)的mri图像作为有标记数据,以转化型轻度认知障碍(progressivemildcognitiveimpairment,pmci)患者和稳定型轻度认知障碍(stablemildcognitiveimpairment,smci)患者的mri图像作为无标记数据,用本发明提出的基于子空间学习的图像特征提取方法对pmci和smci患者图像提取特征的具体步骤如下文所示:(1)图像预处理从adni数据库中随机选取142个ad患者,165个正常受试者,126个pmci患者和95个smci患者的mri图像(如图2所示),使用freesurfer软件进行预处理,提取皮层厚度(corticalthickness,ct)和体积(volume,vol)两种形态学特征。ct指的是每个顶点中白质和灰质表面之间的最近距离。然后,使用高斯核函数对图像进行平滑。最后,使用自动解剖标记(automatedanatomicallabeling,aal)模板计算每个解剖区域的平均ct和vol。特别地,由于缺乏ct特征,排除掉12个aal皮质下区域,使用其余78个脑区的数据。(2)使用ad和nc数据学习投影矩阵定义为皮层厚度特征矩阵,为体积特征矩阵,其中n为ad和nc受试者数目之和,d为特征维数。定义y∈rn×c是由0-1编码组成的类标矩阵,其中c为类别数目。为了学习两个投影矩阵ud×c和vd×c,目标函数定义如下:l(u,v)是从特征空间到类标空间的线性回归项,它保证了投影后的样本与类标相对应。l(u,v)定义如下:第二项用于保持同一幅图像的ct特征和体积特征在子空间中尽可能靠近。众所周知,同一幅图像的不同形态学特征从不同角度反映了相同的类标信息,它们在子空间中应该是一一对应并尽可能靠近的。因此,f(u,v)定义如下:第三项g(u,v)是图正则化项,用来保持数据的局部结构信息。我们通过图正则化项来保持单一形态特征样本之间的邻域关系。这里,我们首先介绍ct特征数据的图正则化项xct。我们定义一个无向对称图gct=(vct,wct),其中vct是xct中的样本集合,wct表示样本之间的关系。wct中的每个元素定义为:其中定义为的k近邻。定义ai为utxct的第i列,ct特征数据的图正则化项定义如下:其中lct=dct-wct是图拉普拉斯矩阵,dct∈rn×n是对角矩阵,其对角线元素为类似的,对于体积特征数据xvol,定义bi为vtxvol的第i列。体积特征数据的图正则化项定义如下:其中和lvol的定义如前所述。最终,图正则化项g(u,v)表示为最后一项r(u,v)控制投影矩阵的尺度以避免产生过拟合:此外,λ,α和β是三个平衡参数。基于公式(2),(3),(7)和(8),我们得到最终的目标函数为优化算法如下:初始化矩阵u和v为零矩阵。我们迭代的固定一个变量更新另一个变量。首先,固定v,q(u,v)对u求偏导,并设置为0,我们得到求得类似的,固定u更新v,我们求得算法1概括了利用ad和nc数据学习投影矩阵的过程。(3)mci患者特征提取定义和分别为m个mci患者的皮层厚度和体积特征矩阵。mci患者在子空间中的特征表示为feact∈rm×c和feavol∈rm×c,计算如下:为了使pmci和smci患者的投影特征更具区分性,同时平衡皮层厚度和体积两种形态学特征对分类的影响,我们对子空间中的特征进行自加权运算和加权融合,得到最终的特征。最终,mci患者的生物标记为fea=η*(|feact|*feact)+(1-η)*(|feavol|*feavol)(15)其中η为权重参数。本发明的效果可以通过实验结果进一步说明。实验数据为从adni数据库中随机选取的126个pmci患者和95个smci患者的图像数据。将数据集划分为训练集和测试集两部分,采用十折交叉验证的方法进行实验。本方法与经典的特征提取方法pca和ica进行比较,分类器采用基于线性核函数的支持向量机分类器,表1记录了实验的结果。从表1可以看到,采用本发明提出的生物特征后,算法识别的准确度、敏感性和roc曲线下面积均得到了有效提升,说明本方法提取的特征有利于分类性能的提高。表1传统的特征提取方法和本发明的特征提取方法分类性能比较特征提取方法准确率(%)敏感性(%)特异性(%)roc曲线下面积pca61.3253.6271.490.6512ica61.7674.8244.250.6335本发明69.3775.3961.230.6951当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1