一种基于多线性主元分析的大脑认知状态判定方法

文档序号:6587230阅读:218来源:国知局
专利名称:一种基于多线性主元分析的大脑认知状态判定方法
技术领域
本发明属于生物特征提取以及大脑认知状态判定分类领域,涉及脑血氧水平的功能核磁成像的预处理、多线性主成分的提取和线性判别分类,是基于多线性主元分析的特征提取算法和线性判别分类算法。
背景技术
认知神经科学是在认知科学和神经科学的基础上发展起来的ー门学科,其核心分支学科是认知心理学和人工智能。其中,认知心理学结合信息加工理论解释人的认知过程,并采用科学的方法对人的感知觉、注意、记忆、语言等认知过程展开实验研究。与此同吋,人工智能的发展引发了学界对人脑认知过程更多的关注与研究,ー些新的理论成果相继出现,大大丰富了认知科学的内涵。认知神经科学_在从分子水平、细胞水平对大脑内与学习和记忆相关的一系列神经活动进行研究。当前,基于血氧水平依赖(Blood-oxygen-leveldependent,简称 BOLD)的 fMRI(functional magnetic resonance images,即功能磁共振成像技术)已经成为认知神经科学中研究大脑功能使用最为广泛的研究手段。fMRI所采集的实验数据是ー类维数高、数据量巨大、噪声非常強、结构特别复杂的数据。因此,脑fMRI数据分析是一件困难而意义重大的工作,它直接决定了采用fMRI方法进行脑功能研究的成败。现有的fMRI数据分析方法主要有两类:模型驱动的參数方法和数据驱动的非參数方法。模型驱动的參数方法中的模型假设需要对脑的结构、功能和处理机制有比较深刻的认识,但这些认识本身就是脑功能研究的目标。所以,模型驱动的參数方法只是ー种对假设模型的验证方法,而模型中关于生理、神经、功能等机理的假设还有待进ー步研究、验证和解释。数据驱动的非參数方法主要是直接选用统计学、机器学习等学科中已有的多元统计方法对fMRI数据进行处理,只是非常有限地利用了 fMRI和脑认知领域的知识。因此,非參数方法的处理结果往往不是很理想,并且合理、准确地解释这些结果也比较困难。鉴于上述情况,脑fMRI研究迫切需要能更有效、更准确地提取实验数据中与认知活动相关的信息数据分析的新方法。在模式识别里的张量对象通常都是指高维的张量空间,直接应用于这种空间的识别算法往往要受到维度的限制,即所谓的维数灾难。为了解决维数灾难,出现了很多降维算法。主元分析法(Principalcomponentanalysis,简称PCA)是一种经典的用于降维的无监瞀的线性技木。PCA的核心思想是减少包含大量无关參数的数据集的维度,同时尽可能多的保留出现在原始数据集中的參数,这能够通过转化为ー个新的參数集(即主成分)来实现,这些參数是不相关的、有序的,以至于第一个很少能保留原始数据參数的大部分。PCA理想化的应用于张量对象要求它们重新变形为高维的向量(向量化),这明显地造成了计算机内存的消耗。除了这些实施的问题外,很容易理解的就是向量化会重新破坏它的本来结构和原始数据间的相关性,消除了冗余,或者是对原始数据集有了更高的顺序依赖性,并且可能失去了更简洁、更有用的能从原始形式中获得的表现形式。向量化作为PCA的预处理忽略了张量对象本来就是多维的对象。因此,直接作用在张量对象上而不是在它的向量化上的降低维度算法更加可取。线性判别分析(LinearDiscriminant Analysis, LDA),也叫做 Fisher 线性判别(Fisher Linear Discriminant, FLD),是模式识别的又一经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。线性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小。就是说,它能够保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式在该空间中有最佳的可分离性。主成分分析(PCA)与线性判别(LDA)有着非常近似的意思,LDA的输入数据是带标签的,而PCA的输入数据是不带标签的,所以PCA是ー种无监瞀的学习方式(unsupervisedlearning)。LDA通常来说是作为ー个独立的算法存在,给定了训练数据后,将会得到一系列的判别函数,之后对于新的输入,就可以进行预测了。而PCA更像是ー个预处理的方法,它可以将原本的数据降低维度,而使得降低了维度的数据之间的方差最大。PCA仅仅是将图像数据矢量化再根据特征值和特征向量进行特征提取,而忽略了张量对象往往是多阶数据这个因素,从而造成了只在ー个方向上投射而导致的降维效果的不理想以及破坏了原始图像的结构和相关性,不能完全保持原始图像中的冗余和结构等问题。

发明内容
鉴于PCA的局限性,我们提出将ー种改进的PCA方法应用于脑fMRI数据分析:多线性主元分析法(简称MPCA)。在此基础上,我们又结合了 LDA的特点,最终形成了 MPCA+LDA的方法应用于脑fMRI数据分析中,可以通过该方法来判定大脑所处的认知任务状态。本发明针对目前生物特征提取和分类判别领域中存在的问题,提出了ー种应用于大脑认知状态判定领域的多线性主元分析方法。改进的PCA,我们称之为多线性主元分析法(Multilinear Principal ComponentAnalysis,简称MPCA)。这种方法延续了经典PCA的范式,直接对原始张量数据进行处理,利用多线性主元分析(MPCA)考虑了在ー个局部领域内的图像像素的空间相关性,从多个方向上对脑fMRI数据张量对象进行降維和特征提取,克服了传统PCA单纯的进行降维而破坏了原始图像数据的结构和相关性,不能完全保持原始图像数据中的冗余和结构的不足。这种MPCA方法是ー种用来在所有张量模式方向上降维并在姆ー个模式方向上寻 求它们的基础成分(主要成分)的多线性算法,它允许仿射张量捕获出现在原始张量上的大多数变化。结合多线性主元分析(MPCA)与线性判别分析(LDA)的特点,利用MPCA-LDA算法进行大脑所处认知任务状态的鉴别。通过MPCA算法求得训练样本的特征子空间,并在此基础上计算出LDA算法的特征子空间。训练样本与测试样本分别向上述特征子空间投影,从而得到判别特征。最后利用最近 领域法分类器完成识别分类。本发明的方法包括如下步骤:I)输入样本集,对输入数据集进行预处理;
2)计算训练样本集的MPCA特征分解,求出MPCA特征变换矩阵,将训练样本投射到MPCA特征子空间,得到特征张量,之后直接矢量化,得到训练集的特征向量集;3)将上述MPCA降维后的特征向量集作为LDA的输入,求出LDA最优投射矩阵,并将MPCA降维后的特征向量集投射到LDA特征子空间进ー步提取训练集的判别特征向量;4)特征分类,将训练图像和测试图像的投射所得判别特征向量进行特征匹配,进而分类。所述步骤2)中,计算训练样本集的特征分解,求出特征张量及最优投射矩阵
权利要求
1.一种基于多线性主元分析的大脑认知状态判定方法,其特征在于,包括如下步骤: 1)输入样本集,对输入数据进行预处理; 2)计算训练样本集的特征分解,求出特征变换矩阵,将训练样本到张量特征子空间,得到训练集的特征张量集;3)将降维后的低维特征张量数据矢量化作为LDA的输入,求出LDA最优投射矩阵,并将矢量化的低维特征张量数据投射到LDA特征子空间进ー步提取训练集的判别特征向量; 4)特征分类,将训练图像和测试图像的投射所得判别特征向量进行特征匹配,进而分类。
2.根据权利要求1所述的ー种基于多线性主元分析的大脑认知状态判定方法,其特征在于:所述步骤2)中,计算训练样本集的特征分解,求出特征张量以及最优特征变换矩阵
3.根据权利要求1所 述的ー种基于多线性主元分析的大脑认知状态判定方法,其特征在干:所述步骤3)中,将多线性主元分析(MPCA)降维后的特征向量集作为线性判别分析(LDA)的输入,求取最优LDA投射子空间Vlda,具体步骤是: 运用LDA寻找使得类间散布矩阵Sb和类内散布矩阵Sw比值最大的投射子空间Vlda,最优的投射子空间
4.根据权利要求1所述的ー种基于多线性主元分析的大脑认知状态判定方法,其特征在于:所述步骤4)中,特征分类,将训练图像和测试图像的判别特征向量进行特征匹配,进而分类,具体步骤是: 首先将中心化后的训练样本集和测试样本集分别向MPCA和LDA的最优投射子空间投影,从而得到它们各自的判别特征向量集{ym, m = I, 和(Y1, 1 = 1,…,L},其中M, L分别表示训练样本集和测试样本集的样本数; 下面引用的测试判别特征集表示包含所有测试样本判别特征向量的集合,训练判别特征集表示包含所有训练样本判别特征向量的集合,分别简称测试集和训练集; 最后利用匹配分数S(p,g)来表示测试集中类别为p子集与训练集中类别为g子集的相似度:
全文摘要
本发明公开了一种基于多线性主元分析的大脑认知状态判定方法,包括如下步骤1)输入样本集,对输入数据进行预处理;2)计算训练样本集的特征分解,求出最优特征变换矩阵,将训练样本投射到张量特征子空间,得到训练集的特征张量集;3)将降维后的低维特征张量数据矢量化作为LDA的输入,求出LDA最优投射矩阵,并将矢量化的低维特征张量数据投射到LDA特征子空间进一步提取训练集的判别特征向量;4)特征分类,将训练图像和测试图像的投射所得判别特征向量进行特征匹配,进而分类。本发明利用多线性主元分析直接对多阶张量数据进行降维和特征提取,克服了传统PCA单纯的进行降维而破坏了原始图像数据的结构和相关性,不能完全保持原始图像中的冗余和结构的不足,保留了fMRI成像数据的空间结构信息。
文档编号G06K9/66GK103116764SQ20131006656
公开日2013年5月22日 申请日期2013年3月2日 优先权日2013年3月2日
发明者李军, 甘云, 徐鑫秀, 王洪勇, 李明欣, 袁森, 曹凯, 梁继民, 秦伟 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1