建立一种阿尔茨海默病的分层多流形分析模型的制作方法

文档序号:11951340阅读:645来源:国知局
本发明是一种可视化的阿尔茨海默病的分层多流形分析模型,特别涉及建立一种阿尔茨海默病的分层多流形分析模型。
背景技术
:阿尔茨海默病是一种神经退化性疾病,60%至80%的痴呆老年人都患有这种病。到目前为止,还没有治疗可以阻止或者逆转阿尔茨海默病的病程,阿尔茨海默病的病情分析可以为患者提供更多的临床试验机会并且更好的计划未来。因此,一直以来,大量的精力被投入到利用各种模态的生物标志物来对阿尔茨海默病进行分析上。本发明在结合核磁共振技术,正电子发射断层扫描等技术的基础上,可以帮助用户可视化地分析阿尔茨海默病的病情。在过去的十年中,各种机器学习方法被用于分析阿尔茨海默病的征兆,包括渐进性轻度认知障碍,稳定性轻度认知障碍等。早期的研究主要是探讨单一模态的生物标志物,如三维结构磁共振成像,正电子发射断层扫描或脑脊液图像。近年来,将神经影像和一些非成像的模式信息进行结合来对阿尔茨海默病进行分析受到越来越多的人的关注,因为通过不同的方式可以获得脑部的互补信息,得到更好的分析结果。在本发明作出之前,大多数现有的模型中只支持分析二类问题,如判断患病或是健康,或者判断健康或是轻度认知障碍等。其他的分析方法,大部分都属于加权多核组合的范畴。其中一个典型的方法是:首先为每个模态的生物标志物构建独立的线性内核,然后搜索最优化的多核线性组合,之后将搜索到的最优的组合核反馈到支持向量机分类器,利用支持向量机进行分类。除了线性核函数,高斯核还有贝叶斯核径向基函数也被用多核学习的阿尔茨海默病建模上。在此基础上,研究人员试图在多核组合之前通过进行预处理如深度学习或稀疏表示将冗余,无关的特征消除。然而,这导致了一个问题,对于分析一个病情未知的人员如何在没有先验知识的情况下给模型选择一个合适的分类器。如果我们将一个只包含患病跟健康分类器的模型用在分析轻度认知障碍患者上,那么分析的结果将会误导我们。据我们所知,只有一种稀疏判别特征选择的方法是支持分析多阶段的阿尔茨海默病的,但是他们所使用的分类器是未阐明的。此外,现有的分析模型几乎都是不可视的,使得用户很难理解和调整参数。造成这种状况的一个原因是:分类器所使用的特征数量比可以可视化的数量大得多。另一个原因是:现有的大多数方法都是依靠支持向量机和核方法的。而支持向量机是一种内在的二元分类器,核方法则通常将数据转换为隐含的高维空间。技术实现要素:本发明的目的就是克服上述缺陷,研制建立一种阿尔茨海默病的分层多流形分析模型。本发明的技术方案是:建立一种阿尔茨海默病的分层多流形分析模型,其主要技术特征在于如下步骤:(1)分别从各个模态的生物标志物中提取有价值的子流形,对于每个模态找到与其相对应的最优映射,并且对各个子流形进行可视化,具体包括:(1.1)利用所选样本构建双中心化测地距离矩阵跟对应的判别信息矩阵。(1.2)利用获得的矩阵计算高维数据所对应低维嵌入的最优判别映射;(1.3)将找到的最佳低维流形进行可视化;(2)根据已经获得的映射进行测试数据的降维,将测试数据映射到各个模态目标判别式对应的低维流形中去;(3)先将不同模态流形的维度联合,进行流形合并,再对整体进行一次联合降维,并将最终低维流形可视化;(4)利用K近邻方法对映射后的数据进行多分类,使模型具备分析的多个阶段。所述步骤(1)在找最优映射时实际是在维持流形内部结构跟增强整体判别力之间进行平衡。所述步骤(3)在降维时通过保持同一类数据中的局部连接,来找到一个最优的低维嵌入。所述步骤(4)在嵌入的目标流形上,寻找其最近的k个训练数据点,将这k个近邻中出现频率最高的类别赋给目标样本,达到对多个阶段进行建模。本发明的优点和效果在于一方面解决了以往在该领域的研究很少允许用户拥有可视化的模型,从而导致用户对分析结果的不理解,难以了解病情。同时利用分层框架,降低了模型中对分类器的要求,提高预测准确性。另一方面也解决了该领域中很少有模型支持多阶段分析的问题。具体主要有如下一些优点:(1)在建立模型第一层流形映射的时候同时考虑了各个流形的内部结构跟整体的判别力,提高了映射的准确度。(2)模型支持可视化,方便用户进行病情分析。(3)模型支持多阶段诊断。(4)本发明建立了分层的多流形学习的模型,其分层结构有助于进行分布式计算,支持用于处理大数据分析。本发明建立了分层的多流形学习的模型,这个模型由两层多流形降维的具体分段模型组成,其中第一层模型通过学习各种模态的生物标志物的判别流形获得,而第二层模型则是通过是先将多元判别流形合并,再对整体进行一次联合降维,使其嵌入到一个单一的低维空间中获得。附图说明图1——本发明流程示意图。具体实施方式本发明的主要技术思路是:本发明先利用训练数据提取各个模态的子流形,找到各个模态的最佳的低维嵌入。然后将测试数据映射到对应的子流形中,再将所有模态流形的维度联合,进行流形合并。之后对整体进行一次联合降维,最后利用K近邻分类器进行分类。在此过程中各个流形都是可视化的。这有效解决了当前领域很欠缺的分析过程的可视化,使得用户便于理解分析过程和调整参数。通过两层框架,降低了数据复杂度,提高了模型的分类准确性,同时也解决了在该领域的多阶段病情分析问题。具体说明本发明。本发明的步骤如图1所示:1.多流形判别映射这步负责从各个模态的数据中提取有价值的子流形。假设代表从已知高维训练数据集XS学到的低维嵌入。表示ZS中的lth个模态,ns是训练样本的个数。本发明制定的多流形判别映射的优化目标在维持内部结构跟增强判别能力的提高之间进行平衡。优化目标如下:ZS=argminΣl=1m(Σi,j=1ns(||zil-zjl||2-dijl2)2+γΣi,j=1ns(<zil,zjl>-φijl)2)---(1)]]>在公式(1)中,假设不同模态实际在不同的黎曼流形上,表示第i个数据根第j个数据在第l个模态的流形Ml上,可以通过欧式最短距离来近似,φij是通过训练数据的配对关系定义的判别信息,γ是权衡参数。公式的右边由两项组成,第一项是结构项,目的是诠释每一种模态的生物标志物中的内在流形结构。第二项是权重项,使得不同类型的嵌入尽可能的分开。定理1.方程跟方程的解在约束下是相同的。由于公式(1)是一个非凸优化,根据定理1,将结构项替换为于是得到如下目标函数:ZS=argminΣl=1m(||ZSlZSlT-BSl||F2+γ||ZSlZSlT-ΦSL||F2)=argminΣl=1m||ZSlZSlT-11+γ(BSL+γΦsl)||F2---(2)]]>其中是Ml上的双中心化测地距离矩阵,是对应的判别信息矩阵。ΦSl=-12HΨSlH---(3)]]>这里是一个测地距离判别方阵,其中,当yi=yj时否则跟记录了Ml上从xi到xj的测地距离向量。通过这种方式,保持类内距离不变,同时按比例增加类间距离。2.测试数据扩展为了将模型的分析扩展到未知的测试数据XT上,本发明制定了一个可以最大限度地保留XT和XS的原始形态流形之间的测地距离的方法来对测试数据进行投影。一开始的优化目标:然后,再一次用定理1将替换为得到如下优化目标:ZT=argminΣl=1m||ZSlZTl-BTl||F2---(4)]]>其中是在Ml上的XT和XS之间的双中心化测地线距离矩阵。可以证明最小二乘跟公式(4)等价,其最优解为:ZTL=BTlTVpll(Λpll)-12---(5)]]>3.综合流形投影先将不同模态的流形整合到一个单一的流形中,再进行一次联合降维。最终得到的流形是可视化的,本发明通过调整局部保持投影学习一个判别线性投影,能保持在同一类的数据中的局部连接。本发明利用类内欧氏距离的总和最小化,来制定整合流形投影的优化目标,其最优解为:argminAΣi,j=1ns||ATzi-ATzj||2WY=12tr(ATZSLLYZSA)s.t.ATZSTDYZSA=I---(6)]]>其中WY是标签相似度矩阵,其元素wij当且仅当xi和xj的具有相同的诊断结果,否则wij=0,DY=diag(WY1)是对角的度矩阵,LY=(DY-WY)是拉普拉斯矩阵。约束的目的是确保解决方案的唯一性。求得的A即为最佳的线性映射。4.使用K近邻方法分类在嵌入的目标流形上,寻找其最近的k个训练数据点,将这k个近邻中出现频率最高的类别赋给目标样本,进而实现对病情多个阶段进行建模。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1