一种基于多数据中心的多模态脑网络特征分类方法

文档序号:34798763发布日期:2023-07-18 18:12阅读:24来源:国知局
一种基于多数据中心的多模态脑网络特征分类方法

本发明涉及生物医学影像信息处理,具体是涉及一种基于多数据中心的多模态脑网络特征分类方法。


背景技术:

1、人类大脑是自然界存在的一种极具复杂的系统,各类神经元细胞通过突触连接在一起,形成了一个非常复杂的网络,因此脑网络是大脑进行各种生理和认知活动的结构基础。随着科学的进步,脑成像技术的发展为脑网络研究提供了广阔的平台。目前人们主要利用功能性磁共振成像技术(functional magnetic resonance imaging,fmri)和结构磁共振成像技术(structural magnetic resonance imaging,smri)技术分别构建功能网络和结构网络对大脑进行研究。fmri具有较高的空间分辨率和非侵入式等特点,而smri通过人脑内部的质子密度的分布现象对大脑组织结构部位进行成像,从而获取大脑组织的形态学数据。两种技术在脑网络研究和脑疾病辅助诊断中应用非常广泛,对于人类脑科学研究的发展有着十分重要的意义。

2、功能网络是指将不同的神经元集合或者是将某些脑区之间的功能利用一种相关性关系进行整合,并通过功能连接来记录不同脑区之间信号的动态协调性。结构网络是根据不同脑区之间的形态学相关性寻找脑区之间的关联,并且结构连接是大脑中网络连接的物质基础,神经元的各种活动通过结构网络传导至全脑,产生协同作用。研究功能网络可以探索人脑的功能组织模式,有助于理解人脑在正常或疾病状态下的功能活动规律;研究结构网络有助于揭示人脑结构网络的拓扑性质。对两种脑网络进行融合研究可以进一步加速人类探索大脑的脚步,可以更全面地分析和理解脑疾病地病理生理机制。

3、近年来,共享数据呈现出增长的趋势,世界各地先后公开发布了多个医学数据库来解决不同的健康问题。尽管多中心医学影像数据库的发展在一定程度上方便了对数据访问权限的获取,但是对多中心数据进行分析是充满挑战性的。多中心数据来源复杂,大多数方法都假设多中心数据来自相同的分布,即现有的方法忽略了不同中心之间扫描设备或成像参数间的差异所造成的数据异构问题,所以无法很好地处理多中心异构数据,这不仅降低了数据的统计能力,也会削弱多中心数据分析研究的可信度。

4、现有的多中心异构数据研究可大致分为两类,一类是为每个中心分别学习模型并最终整合,但是这类方法忽略了多中心数据间的异质性;另一类是多源领域自适应问题,即首先基于不同的源域数据训练模型,然后在目标域上测试所学习的模型。无监督低秩表示被提出用于领域自适应,源域数据通过低秩表示变换到目标域以进行后续的学习任务,但是现有的方法忽略了不同源域中数据之间的复杂关系,即高阶关系,而这种关系也许包含有用的信息来提高分类或回归的性能。

5、在机器学习领域,多模态学习已经引起了研究人员广泛兴趣。在医学影像领域研究人员开始利用多模态数据进行疾病诊断和分析,整合多种模态数据能够提供必要的互补信息,从而帮助提高脑疾病的诊断精度。特征选择经常被用于去除多模态数据中多余或不相关的特征,然而由于大脑和脑疾病的复杂性,从单模态数据中检测出所有与疾病相关的特征是非常困难的。由于不同模态数据反映相同的基础病理,也许能互相提供互补的信息有助于寻找异常的脑区。目前已有相关研究探索从多模态数据中联合地选择特征,但是由于患有相同脑疾病的不同被试具有异质性,仅考虑数据和被试标签之间的关系用于特征选择并不能很好地挖掘数据中复杂的内在关系,并且在数据采集过程中往往同时使用多个成像设备采集数据,使得不同类别的样本在某些模态下可能会非常相似,通过一般方法提取出的特征容易重复或相似,判别性较低。


技术实现思路

1、发明目的:针对以上缺点,本发明提供一种降低数据异质性的基于多数据中心的多模态脑网络特征分类方法。

2、技术方案:为解决上述问题,本发明采用一种基于多数据中心的多模态脑网络特征分类方法,包括以下步骤:

3、(1)采集多个不同数据中心的各模态脑影像数据,并分别进行预处理,得到各数据中心各模态的预处理图像;

4、(2)将得到的预处理图像基于标准化大脑分区模板进行脑区划分,均划分为n个脑区,每个脑区分别对应脑网络中的一个节点;

5、(3)分别提取各数据中心各模态预处理图像中的参数,分别构建各模态的脑网络;

6、(4)将每个脑网络的上三角元素拼接成一个维数为的连接向量;并将每个数据中心的相同模态的所有连接向量组合成连接聚合矩阵;

7、(5)选择一个数据中心为目标域,其他数据中心为源域,对目标域和源域中连接聚合矩阵的连接向量分别划分训练集和测试集;使用基于超图的多源领域自适应算法为每个源域中的训练集求解得到一个转换矩阵,通过转换矩阵将多个源域中的连接向量分布转换为与目标域中的连接向量分布一致,并将转换后源域中的训练集与目标域中的训练集组合为最终的各模态连接训练集;

8、(6)使用基于局部有序结构的多任务特征选择算法在最终的各模态连接训练集中训练模型和选择特征;基于训练集训练的模型以及选择的特征,在目标域测试集中选出判别特征;

9、(7)对选择出的判别特征采用基于多核学习的支持向量机算法进行分类,最终得到分类结果。

10、进一步的,所述步骤(1)中采集多个不同数据中心的大脑功能磁共振成像和大脑结构磁共振成像;对大脑结构核磁共振成像预处理后得到大脑灰质图像。

11、所述步骤(2)中标准化大脑分区模板包括aal分区模板和brodmann分区模板。

12、所述步骤(3)中各模态的脑网络包括大脑功能网络和大脑结构网络,对于不同数据中心的大脑功能磁共振图像,提取不同脑区的平均时间序列,计算两两脑区平均时间序列之间的相关系数,构建每个被试的大脑功能网络;对于不同数据中心的大脑灰质图像,使用核密度估计方法估计每个脑区所有体素的灰质体积值的概率密度函数,然后计算两两脑区灰质体积的概率密度函数之间的jensen散度,将jensen散度定义为结构网络的连接权重以评估不同脑区灰质体积的相似性,从而构建每个被试的大脑结构网络。

13、所述jensen散度的计算公式为:

14、

15、式中,和分别表示脑区p和脑区q灰质体积的概率分布,和对应的概率密度函数为和dkl(.||.)为计算两两脑区灰质体积的概率密度函数之间的kl散度;和之间kl散度的计算公式为:

16、

17、进一步的,所述步骤(5)中基于超图的多源领域自适应算法中,第m个模态的目标函数如下所示:

18、

19、式中,||.||*为矩阵的核范数,||.||2,1为矩阵的l2,1范数,tr(.)为矩阵的迹运算,为目标域训练集的特征矩阵,dm为第m个模态的特征数,nt为目标域中训练集的个数,i=1,...,s为第i个源域训练集的特征矩阵,为第i个源域中训练集的个数,为所有源域的重建系数矩阵,ns为所有源域中训练集的个数,为所有源域的误差矩阵,为第i个源域的转换矩阵,为超图拉普拉斯矩阵,τ和λ均为平衡三项的正则化参数。

20、计算所有源域中训练集的超图g,求解出lh,然后通过增广拉格朗日乘子法求解式(3),得到zm,em,的最优解,通过将相应源域中的数据转换至目标域。

21、进一步的,所述步骤(6)中局部有序结构具体内容为:对于特征矩阵x,经投影后在低维空间中的表示为r=wx,w为x的投影矩阵,x中的一个三元组(xi,xu,xv)映射到低维空间中的三元组可表示为(ri,ru,rv),局部有序结构可等价于以下优化问题:

22、

23、式中,xu和xv为xi的邻居节点,为xi的k个近邻样本集合,为邻接矩阵,dist(.,.)为距离度量;式(4)等价于minw tr(wtxlxtw);式中,d是对角矩阵,s为距离矩阵。

24、将上述优化问题与特征选择相结合再联合优化,目标函数如下:

25、

26、式中,y为所有训练集的标签向量,xm为组合后的最终连接训练集特征矩阵,wm为xm的投影矩阵,α和β均为平衡三项的正则化参数;采用加速近似梯度算法求解式(5),得到系数矩阵wm,对求解得到的系数矩阵wm的每行求平方和得到列向量p,选出列向量p中值大于等于0.01对应的特征,得到判别性特征。

27、进一步的,所述步骤(7)中具体分类步骤为:

28、(1)为每一个模态计算得到一个线性核矩阵;

29、(2)合并多个模态的线性核矩阵,合并公式为:

30、

31、式中,是在第m个模态连接向量xi和连接向量xj的核函数,αm为非负权重参数,且满足∑mαm=1的约束条件;通过在训练集上使用网格搜索策略找到αm的最优值;

32、(3)在合并后的混合核矩阵上使用支持向量机算法进行分类。

33、有益效果:本发明相对于现有技术,其显著优点是利用基于低秩表示的多源领域自适应方法将多个数据中心源域中的样本转换到目标域的特征空间中,并且引入了超图拉普拉斯矩阵,通过超图拉普拉斯矩阵反映不同中心数据之间的高阶关系,有效降低多模态多中心脑网络中特征的异质性。利用基于局部有序结构的多模态特征选择方法,并使用多核学习融合功能网络和结构网络以更好地辅助脑疾病特征识别,对研究大脑的认知功能和结构的障碍具有重要的应用价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1