基于多模态特征融合的2型糖尿病风险分层预测方法

文档序号:33558503发布日期:2023-03-22 13:06阅读:180来源:国知局
基于多模态特征融合的2型糖尿病风险分层预测方法

1.本发明涉及糖尿病预测诊断领域的2型糖尿病风险预测


背景技术:

2.近年来,随着我国经济的快速发展,人民群众的生活质量大大提高,高油高脂的食物摄入比例增大,我国糖尿病的患者数和患病率逐步提升。据统计,我国糖尿病患病人群呈爆发式增长,已成为世界上糖尿病患者最多的国家,并且在我国人口老龄化日益加剧的大背景下,我国糖尿病的患病风险讲进一步扩大,这意味着我国在糖尿病预防和控制上将会面临持续的挑战。糖尿病致死致残率高的核心原因在于糖尿病病变后会引发诸多并发症,如肾功能衰竭以及血管并发症,其中冠状动脉病变(coronary artery disease,cad)是最主要的大血管并发症,糖尿病视网膜病变(diabetes retinopathy)是最主要的微血管并发症之一。糖尿病患者cad的发病率可高达55%,是糖尿病患者最常见的死亡原因,dr是主要的致盲疾病,均需要庞大的社会资源及医疗资源支出。世界卫生组织根据病因学将糖尿病划分为四类:1型和2型糖尿病、妊娠糖尿病以及特殊类型糖尿病。据资料显示,35岁之后90%-95%的患者所患糖尿病为2型。2型糖尿病是一种以高血糖为特点的代谢紊乱疾病,其发病几率与多方面因素有关例如生活环境、方式以及遗传因素。由于2型糖尿病在临床确诊前会有较长时间的潜伏期,建立精准的糖尿病患病风险预测模型具有非常重大的意义与价值。通过模型的风险预测,未病先防,尽早发现高危人群,可从源头上减少2型糖尿病的发生,降低患病率,有效预防2型糖尿病。但传统的基于视网膜眼底图像的2型糖尿病风险预测模型直接基于视网膜眼底图像提取特征,没能综合考虑2型糖尿病的患病因素,在几年后的随访中结果并不理想,同时由于关键特征提取不足,无法有效的提高预测的准确率。
3.本发明提出一种基于多模态特征融合的2型糖尿病风险分层预测方法,以有效解决这一问题。在对人群进行2型糖尿病风险预测时,避免了使用单一片面的特征,考虑到了多种模态的特征,包含临床特征、生物指标特征、血糖方面特征以及预测血糖值,将多种信息融合在一起,综合考量,提高预测患病风险的准确率。


技术实现要素:

4.本发明的目的是为了提高预测2型糖尿病的准确度,而提出的一种基于多模态特征融合的2型糖尿病风险分层预测方法。
5.上述发明目的主要是通过以下技术方案实现的:
6.s1、获取视网膜眼底图像数据集,包括横截面数据集d1和回顾性队列c中的数据集d2,其中d1数据集由健康人群和患有2型糖尿病人群提供的视网膜眼底图像构成,并且收集每个人的血糖值以及临床信息,回顾性队列c将基线为两年前时未患2型糖尿病的健康人群纳入队列,d2数据集由基线时健康人群提供的视网膜眼底图像组成,同时收集每个人的临床信息;
7.s2、对d1数据集进行标注,将每个人的血糖值作为对应视网膜眼底图像的标签;
8.s3、对d2数据集进行标注,以距基线2年后的队列c中是否患2型糖尿病为依据,患2型糖尿病标注为1,否则标注为0;
9.s4、在d1数据集上,通过提取视网膜眼底图像特征,训练一个基于预测空腹血糖值的血糖模型model1,将预测血糖值与实际血糖值相比较,计算出损失值,根据损失值调整model1中的参数,直至model1预测效能达到所定标准;
10.s5、利用数据集d2,训练基于多模态的2型糖尿病风险预测模型model2,并对未来两年内的患病风险进行分层。
11.模型训练步骤为:首先利用model1模型对d2数据集进行训练,得到预测血糖值,同时利用model1模型中的特征提取模块提取d2数据集的血糖方面特征;其次通过d2数据集中的视网膜眼底图像计算生物指标,得到生物标志物特征;接着收集d2数据集中人群的临床信息作为临床特征,将临床特征、生物标志物特征以及预测血糖值进行特征编码;得到编码好的临床特征、生物标志物特征和预测血糖值之后,将其与血糖方面特征进行多模态特征融合;最后将融合得到的特征输入至分类器中进行预测,模型输出结果为未来两年内的2型糖尿病发病几率,并根据设定阈值将其划分为高风险、中风险、低风险。
12.发明效果
13.本发明提供了一种基于多模态特征融合的2型糖尿病风险分层预测方法。本算法首先利用涵盖健康人群和患2型糖尿病人群的视网膜眼底图像数据集及其血糖标签值进行预训练,得到一个预测血糖值的模型model1。其次,在对目标人群进行糖尿病风险预测时,利用model1预测目标人群的血糖值并提取目标人群的血糖方面特征。之后收集该人群的临床特征同时计算该人群的生物指标特征,并对上述两者和预测血糖值进行编码。将上述编码完成后的特征与血糖方面特征和进行多模态融合。最后将融合特征输入分类器中,预测未来两年内的2型糖尿病发病几率。实验表明,该方法具有多模态特征融合特点,将血糖方面特征、预测血糖值、临床特征、生物指标特征进行融合,同时考虑到了多个2型糖尿病的患病因素,能够提高模型预测的准确度。
附图说明
14.图1本文算法的实现过程图;
15.图2model1训练过程示意图;
16.图3model2训练过程示意图;
17.具体实施方法
具体实施方式一:
18.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.如图1所示本文提供的基于多模态特征融合的2型糖尿病风险分层预测方法,所述模型训练包含步骤:
20.s1、获取视网膜眼底图像数据集,所属数据集包括横截面数据集d1和回顾性队列c
中的数据集d2,其中d1数据集由健康人群和患有2型糖尿病人群提供的视网膜眼底图像组成,并且收集每个人的血糖值以及临床信息,回顾性队列c为以两年前为基线,基线时未患2型糖尿病的健康人群,d2数据集由基线时健康人群提供的视网膜眼底图像组成,同时收集每个人的临床信息;
21.s2、对d1数据集进行标注,将每个人的血糖值作为对应眼底图像的标签;
22.s3、对d2数据集进行标注,以距基线2年后的队列c中是否患2型糖尿病为依据,患2型糖尿病标注为1,否则标注为0;
23.s4、在d1数据集上,通过提取视网膜眼底图像特征,训练一个基于预测空腹血糖值的inception-resnet-v1回归模型,将模型预测性能训练到所定标准;
24.s5、以数据集d2为输入,训练基于多模态的2型糖尿病风险预测模型,通过inception-resnet-v1回归模型得到d2数据集的预测血糖值和血糖方面特征,其次利用视网膜眼底图像计算生物指标,得到生物标志物特征,将上述三种特征与临床信息特征进行融合后输入至分类器中,输出结果为未来两年内的2型糖尿病发病几率,并根据设定阈值0.3、0.7将其划分为低风险、中风险、高风险。
25.下面对本发明实施例进行详细的说明:
26.本发明实施例具体实现如下:
27.s1、获取视网膜眼底图像数据集,包括横断数据集d1和回顾性队列c中的数据集d2;
28.以血红蛋白a1c(hba1c)值≥6.5%、至少在两次就诊中空腹血糖水平≥7.0mmoll-1
,或有糖尿病的药物治疗史为标准,定义患2型糖尿病人群。
29.对于横断数据集d1,由健康人群和患2型糖尿病的视网膜眼底图像构成,以及人群的血糖值作为相应视网膜眼底图像的标签,并收集临床信息:年龄、性别、身高、体重、血压。
30.创建回顾性队列c,以两年前为基线,将两年前未患2型糖尿病的健康人群作为入选队列标准。
31.对于数据集d2,由队列c中人群基线时的视网膜眼底图像构成,并收集临床信息:年龄、性别、身高、体重、血压。
32.s2、对d1数据集进行标注,将每个人的血糖值作为对应视网膜眼底图像的标签;
33.s3、对d2数据集进行标注,以距基线2年后的队列c中是否患2型糖尿病为依据,患2型糖尿病标注为1,否则标注为0;
34.s4、如图2所示,在d1数据集上,通过提取视网膜眼底图像特征,训练一个基于预测空腹血糖值的inception-resnet-v1回归模型,将全连接层作为网络的最终层,且全连接层的输出层神经元个数为1,将模型预测性能训练到所定标准;
35.(1)初始化inception-resnet-v1回归模型参数;
36.(2)然后对inception-resnet-v1回归模型进行训练,将d1数据集的视网膜眼底图像输入到inception-resnet-v1回归模型中,输出对血糖的预测结果根据与相应血糖标签值y计算均方误差损失函数mse,mes计算公式如下:
[0037][0038]
其中n为数据集总个数;
[0039]
(3)利用损失函数反向传播优化网络模型参数,直至损失函数满足阈值条件;
[0040]
s5、如图3所示,以数据集d2为输入,训练基于多模态的2型糖尿病风险预测模型,将预测血糖值、血糖方面特征、生物标志物特征以及临床特征进行融合,模型输出结果为未来两年内的2型糖尿病发病几率,并根据设定阈值0.3、0.7将其划分为低风险、中风险、高风险。
[0041]
模型训练步骤为:
[0042]
(1)利用inception-resnet-v1回归模型对d2数据集进行训练,得到预测血糖值,同时利用inception-resnet-v1回归模型中的特征提取模块提取d2数据集的血糖方面特征;
[0043]
(2)通过d2数据集中的视网膜眼底图像计算生物指标:crae、crve、分形维数、分支角度、弯曲度,得到生物标志物特征;
[0044]
具体指标计算方法如下所示:
[0045]

crae:在视网膜眼底图像中距视盘0.5倍-2倍视盘直径距离范围内,选取6条直径最宽的动脉,具体计算公式如下:
[0046][0047]
其中w1、w2分别为6条动脉中最宽和最窄的动脉宽度;
[0048]

crve:在视网膜眼底图像中距视盘0.5倍-2倍视盘直径距离范围内,选取6条直径最宽的静脉,具体计算公式如下:
[0049][0050]
其中w1、w2分别为6条静脉中最宽和最窄的静脉宽度;
[0051]

分形维数:在视网膜眼底图像中距视盘0.5倍-2倍视盘直径距离范围内,利用盒计数法得到;
[0052]

分支角度:计算不受范围限制,具体计算公式如下:
[0053][0054]
其中d0为母血管的平均宽度、d1、d2分别为两个分支血管的平均宽度;
[0055]

弯曲度:血管直线长度与实际长度的比值;
[0056]
(3)收集d2数据集中患者的临床信息作为临床特征,将临床特征与生物标志物特、预测血糖值按照one-hot编码方式进行编码;
[0057]
(4)将编码好的临床特征、生物标志物特征和预测血糖值与血糖方面特征进行多模态特征融合;
[0058]
(5)将融合得到的特征经全连接层后,输入至softmax分类器中进行预测,模型输出结果为未来两年内的2型糖尿病发病几率,并根据设定阈值将其划分为高风险、中风险、低风险。
[0059]
该方法具有多模态特征融合特点,将血糖方面特征、预测血糖值、临床特征、生物指标特征进行多模态融合,同时考虑到了多个2型糖尿病的患病因素,提高了特征的有用性,能够提高模型预测的准确度。
[0060]
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于
本发明范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1