一种用于fmri数据的特征选择方法

文档序号:6639301阅读:592来源:国知局
一种用于fmri数据的特征选择方法
【专利摘要】一种用于FMRI数据的特征选择方法,属于生物医学图像模式识别【技术领域】,具体涉及功能磁共振图像的特征选择方法。首先随机选择一个数据的子矩阵用elastic net方法计算出所选特征的权重向量,将所得到的权重向量转化为稳定得分向量。重复以上过程p(p>1000)次,得到各特征的被选次数向量,依照计算得到的累加稳定得分向量和次数向量得到特征重要性度量值,然后进行特征排序与选择;本发明的方法具有容错性高,稳定性强等特点,对于磁共振数据模式识别等领域特征选择与排序提供了新的有效技术。
【专利说明】-种用于FMRI数据的特征选择方法

【技术领域】
[0001] 本方法属于生物医学图像模式识别【技术领域】,具体设及功能磁共振图像的特征选 择方法。

【背景技术】
[0002] 静息态功能磁共振是指在无特定的认知任务且处在安静休息状态下利用血氧水 平依赖炬OLD)的功能磁共振成像技术对大脑神经元的自发活动进行研究。
[0003] 模式识别系统主要有数据获取,数据预处理,特征选择与提取,分类决策四部分组 成。其中,特征选择与提取就是要根据原始数据,选择和提取出最能反映分类本质的特征。 由于磁共振数据的高维小样本特性,其中含有大量对分类无意义的冗余特征,所W特征选 择对于磁共振数据的分类或者任务激活区定位而言意义重大。
[0004] 特征选择排序的重点是特征重要性度量,现有的度量方法包括二类,一类是如滴 函数、类内类间距离、基巧系数、相关性分析等,该些方法都是基于传统统计学理论,存在抗 噪声能力低、样本数量要求大等局限性,不适合磁共振图像该种典型的高维小样本数据的 特征选择处理;另一类如使用某些机器学习方法作为载体,将学习得到的特征权重作为特 征重要性度量,该一类方法的问题在于其对数据质量的依赖较强,方法的稳定性不高。
[0005] 稳定选择(St油ility selection)方法是一种随机稀疏的特征选择方法,目前主 要用于基因选择领域。由于大脑的临近体素之间具有较强的关联性,而稳定选择是一种纯 稀疏的方法,并不能很好地检测到该种结构。所W,本发明采用一种改进的稳定选择方法, 即采用弹性网巧lastic Net)该种结构稀疏方法代替稳定选择内部的纯稀疏方法,并取得 了比W往方法更好的效果。


【发明内容】

[0006] 针对上述问题和不足,本发明提供了一种针对功能磁共振数据的特征选择方法, 用弹性网(elastic net)该种同时具备结构和稀疏特质的方法代替稳定选择本身包含的纯 稀疏方法(如 lasso, 11-logistic)。
[0007] 为实现上述目的,本发明的具体步骤如下:
[000引 (1)将原始磁共振数据矩阵转化为N蝴矩阵,其中N为样本个数,D为特征维数;
[0009] (2)给定迭代次数P,给定特征数量阔值U,初始化一个D*1的稳定得分零向 量score,初始化一个D*1的次数向量m,其中迭代次数P > 1000次,特征数量阔值为 1《U《D ;
[0010] (3)随机选择一个指定大小的子矩阵[N/L]*[D/V]作为训练数据,其中□代表取 整函数;
[0011] (4)根据训练数据用弹性网方法得到其特征权重wO,若特征i(i = 1,2,…,D)在 此次循环中被选择,则m(i) = m(i)+l ;若特征i (i = 1,2,…,D)在此次循环中被选择且 其特征权重不为零,则score (i) = score (i)+l ;
[0012] (5)将迭代数目自增1.若迭代数目达到预定次数p,则转到步骤化),否则转到步 骤(2);
[0013] (6)用稳定得分向量和次数矩阵得到各特征的重要性度量值S(i) = score(i)/ m(i),并将特征按照S降序排列;
[0014] (7)在降序排列的特征中寻找前U个特征作为最后的特征,方法完成。
[0015] 进一步的,所述步骤(4)中的弹性网方法为
[0016] (1)
[0017] 其中yi是训练数据第i个样本标签,X。是第i个样本的第j个特征值,W j.是第j 个特征的权重值,:i = 1,k/ij,J = 1,....松巧,入1和入2是优化问题中1范数和2范数 的惩罚系数,当^1=0时,优化问题为一个最小二乘问题,当A 2=0时,优化问题为常规 Lasso问题。
[0018] 进一步的,所述步骤(4)中弹性网的阔值选择为使得所选特征中有四分之一的特 征权重不为零。
[0019] 本发明根据磁共振数据的特性,即高维小样本,且相邻体素间存在极大关联性,提 出一种基于稳定选择和弹性网的稳定特征选择方法,给出了特征的重要性度量值计算方 法,提出了基于稳定选择中稳定得分的特征重要性度量模型,该模型能够充分体现激活体 素之间的结构性,可有效克服目前特征选择方法所存在的局限性;所提出的特征选择方法 具有特征重要性度量稳定,容错性好等优点,可满足磁共振数据分类器设计的特征选择与 排序的实际需要,为生物医学图像模式识别等领域特征选择与排序提供了新的有效技术。

【专利附图】

【附图说明】
[0020] 图1为块刺激与特征区域的对应关系图。
[0021] 图2为特征区域的位置图。
[0022] 图3为在所有样本标签都正确的情况下得到的结果。
[0023] 图4为随机使一个样本标签错误的情况下得到的结果。
[0024] 图5为随机使两个样本标签错误的情况下得到的结果。
[0025] 图6为随机使=个样本标签错误的情况下得到的结果。
[0026] 图7为随机使五个样本标签错误的情况下得到的结果。
[0027] 图8为随机使十个样本标签错误的情况下得到的结果。
[002引图9为各个方法选择正确率随着错误的标签个数增加的结果。

【具体实施方式】
[0029] 下面结合附图和实施例对本发明的【具体实施方式】做进一步详细地描述,W下实施 例用于说明本发明,但不用来限制本发明的范围。
[0030] 一种用于FMRI数据的特征选择方法,具体实施步骤如下:
[0031] 步骤A ;仿真数据构造。生成一个70*63体素的fMRI图像,其中每一体素包含一个 160个时间点的零均值序列。构造S种块刺激时间序列(加入信噪比等于2的高斯噪声)

【权利要求】
1. 一种用于FMRI数据的特征选择方法,其具体步骤如下: (1) 将原始磁共振数据矩阵转化为N*D矩阵,其中N为样本个数,D为特征维数; (2) 给定迭代次数p,给定特征数量阈值u,初始化一个D*1的稳定得分零向量score, 初始化一个D*1的次数向量m,其中迭代次数p> 1000次,特征数量阈值为I<u<D; (3) 随机选择一个指定大小的子矩阵[N/L]*[D/V]作为训练数据,其中□代表取整函 数; (4) 根据训练数据用弹性网方法得到其特征权重《0,若特征i(i= 1,2,…,D)在此次 循环中被选择,则m(i) =m(i)+l;若特征i(i= 1,2,…,D)在此次循环中被选择且其特 征权重不为零,则score(i) =score(i)+l; (5) 将迭代数目自增1.若迭代数目达到预定次数p,则转到步骤(6),否则转到步骤 (2); (6) 用稳定得分向量和次数矩阵得到各特征的重要性度量值S(i) =SC〇re(i)/m(i), 并将特征按照S降序排列; (7) 在降序排列的特征中寻找前u个特征作为最后的特征,方法完成。
2. 如权利要求1所述用于FMRI数据的特征选择方法,其特征在于:所述步骤(4)中的 弹性网方法为
其中Yi是训练数据第i个样本标签,Xu是第i个样本的第j个特征值,是第j个特 征的权重值,i=IU,,,bi/U,)=I,,,uIs'/Tj,A :和X2是优化问题中1范数和2范数的惩 罚系数,当X1=O时,优化问题为一个最小二乘问题,当X2=〇时,优化问题为常规Lasso 问题。
3. 如权利要求1或2所述用于FMRI数据的特征选择方法,其特征在于:所述步骤(4) 中弹性网的阈值选择为使得所选特征中有四分之一的特征权重不为零。
【文档编号】G06K9/00GK104504373SQ201410794713
【公开日】2015年4月8日 申请日期:2014年12月18日 优先权日:2014年12月18日
【发明者】陈华富, 李志强, 王亦伦 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1