融合知识图谱和深度学习的糖尿病预测方法及系统

文档序号:33292440发布日期:2023-02-28 20:19阅读:35来源:国知局
融合知识图谱和深度学习的糖尿病预测方法及系统

1.本发明涉及一种融合知识图谱和深度学习的糖尿病预测方法及系统,属于医疗信息化技术领域。


背景技术:

2.糖尿病是因机体胰岛素分泌相对或绝对不足导致血糖过高,而引起蛋白质和脂肪代谢紊乱的一种常见内分泌代谢性疾病。糖尿病的症状常表现为多饮、多食、多尿、体重下降,但主要危害在于患者长期血糖升高会引发各种严重的并发症,给肾脏、血管、神经、眼睛等器官带来巨大的危害,甚至危及生命。
3.目前,糖尿病仍然无法被完全治愈,但如果在糖尿病早期对患者进行适当的护理,改变其生活方式并辅助药物治疗,能够使糖尿病并发症的风险降低30%~60%。因此,糖尿病的早期发现至关重要。在医学上,糖尿病的诊断主要依靠指尖采血的方式,诊断标准为空腹血糖≥7.0mmol/l或者糖耐量试验后两小时血糖≥11.1mmol/l。
4.但随着人工智能技术和智慧医疗的飞速发展,研究人员开始将人工智能方法应用于糖尿病的预测。主要是采用机器学习或深度学习相关算法自动处理糖尿病数据,挖掘出数据中的隐藏信息,以此来判断患者是否患有糖尿病。目前已有的糖尿病分类预测模型虽然能有效识别糖尿病高危人群,可为健康管理、疾病预防决策提供依据,但仍然存在一些不足之处。
5.例如,目前的糖尿病分类预测模型大多基于数据驱动的方法实现,受到数据质量的限制。而且大多模型仅考虑患者的体检数据,并未考虑到患者的生活习惯以及自身症状对预测结果的影响。
6.此外,仅基于机器学习或深度学习方法的分类预测模型可解释性较低,且缺乏外部医学专业知识的支撑。医疗决策往往伴随着生命风险,如果将如此重要的决策交给无法提供责任且缺乏解释性的机器,无异于推卸责任,可能导致灾难性后果。
7.上述问题是在糖尿病预测过程中应当予以考虑并解决的问题。


技术实现要素:

8.本发明的目的是提供一种融合知识图谱和深度学习的糖尿病预测方法及系统解决现有技术中存在的仅考虑患者的体检数据,预测结果的准确性较低,且缺乏可解释性的问题。
9.本发明的技术解决方案是:
10.一种融合知识图谱和深度学习的糖尿病预测方法,包括以下步骤,
11.s1、构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,得到体检数据向量;
12.s2、获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型transr将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图
谱;
13.s3、基于步骤s2构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;
14.s4、融合自注意力机制与卷积神经网络,构建分类预测模型,由步骤s1得到的体检数据向量与步骤s3得到的症状描述向量,由分类预测模型获得预测结果。
15.进一步地,步骤s1中,构建体检数据实体向量库,具体为,
16.s11、依据医学上定义的体检指标正常范围,将体检指标的检测值划分为更具细粒度的若干参考范围,并确定对应的关系;
17.s12、基于划分的参考范围,将体检指标、关系与检测值表示成三元组的形式,采用知识表示模型transh得到体检数据实体向量库。
18.进一步地,步骤s2中,获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型transr将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱,具体为,
19.s21、获取用于构建知识图谱的糖尿病领域专业文献;
20.s22、进行知识抽取,包括实体抽取和关系抽取,其中,实体抽取为基于双向长短期记忆网络bilstm和条件随机场crf模型抽取出步骤s21得到的糖尿病领域专业文献中与糖尿病相关的实体;关系抽取为通过对文本进行句法分析抽取出文本中隐含的实体之间的关系,并表示成三元组(头实体,关系,尾实体)的形式;
21.s23、进行知识融合,通过实体对齐和实体链接对抽取的知识实体整合、消歧,通过关系推理进行正确性判断,进而更新三元组中的实体和关系;
22.s24、进行知识表示,基于知识表示模型transr将糖尿病领域知识图谱中的实体和关系表示成向量形式,得到构建的糖尿病领域知识图谱。
23.进一步地,步骤s3中,进而获得患者自身状况的矩阵,具体为,
24.s31、判定患者是否进行体检获得体检数据,如是,进入步骤s32;如否,则进入步骤s33;
25.s32、在患者进行体检获得体检数据时,由得到的症状描述向量与步骤s1得到的患者体检数据向量拼接成描述患者自身状况的矩阵;
26.s33、在患者未进行体检未获得体检数据时,由得到的症状描述向量单独拼接成描述患者自身状况的矩阵。
27.进一步地,步骤s4中,融合自注意力机制与卷积神经网络,构建分类预测模型,分类预测模型包括输入层、自注意力层、卷积层、全连接层、softmax层和输出层,具体为,
28.s41、分类预测模型的输入层将患者自身状况的矩阵输入到自注意力层中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息矩阵;
29.s42、将获取的全局信息矩阵输入到卷积层中,进行局部特征提取,得到患者体检数据和症状描述的最终表示向量;
30.s43、将步骤s42得到的患者体检数据和症状描述的最终表示向量,经全连接层的变换后得到患者是否患有糖尿病的得分向量s;
31.s44、将得分向量s输入到softmax层,得分向量s经由softmax层计算,得到患者是
否患有糖尿病的概率分布,根据概率分布获得患者是否患有糖尿病的预测结果,并由输出层输出预测结果。
32.进一步地,步骤s41中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息,具体为,
33.s411、定义三个权重矩阵:wq∈rq×k,wk∈rq×k,wv∈rv×k,根据式其中,表示患者自身状况矩阵的列向量,将矩阵中的每个向量被线性映射到三个不同的空间,得到查询向量qi、键向量ki和值向量vi;
34.s412、将查询向量qi、键向量ki和值向量vi分别合并成查询矩阵q、键矩阵k、值矩阵v,根据下式计算出自注意力机制获取的全局信息矩阵即输出矩阵:
[0035][0036]
其中,softmax()为激活函数,dk为查询向量qi的维度。
[0037]
进一步地,步骤s42中,由卷积层进行局部特征提取,得到患者体检数据和症状描述的最终表示向量,具体为,
[0038]
s421、假设卷积层的卷积滤波器wf∈rh×d,其中,r为向量空间,h为卷积滤波器窗口大小,d表示输入向量的维度,对于输入的从i行到i+k-1行的局部特征即全局信息矩阵第i到i+h-1列表的向量,卷积滤波器所提取的特征子矩阵的第i个特征值表示为:
[0039][0040]
其中,f(
·
)是非线性激活函数relu(
·
),b是偏置值;
[0041]
s422、获得自注意力层得到的输出矩阵e
attn
的局部特征矩阵为:
[0042]
c=[c1,c2,c3,

,ci,

,c
m-h+1
]
[0043]
其中,m为e
attn
列向量个数,h为卷积滤波器窗口大小;
[0044]
s423、对局部特征矩阵c进行最大池化操作,得到患者体检数据和症状描述的最终表示向量。
[0045]
进一步地,步骤s44中,得分向量s经由softmax层计算,得到患者是否患有糖尿病的概率分布,即患者患糖尿病和不患糖尿病的概率:
[0046][0047]
其中,exp(si)、exp(sj)分别为得分向量s第i维、第j维的以e为底的指数,i、j分别表示得分向量s的维数。
[0048]
一种采用上述任一项所述的一种融合知识图谱和深度学习的糖尿病预测方法的系统,包括体检数据向量表示模块、知识图谱构建模块、自身状况矩阵生成模块和分类预测模块,
[0049]
体检数据向量表示模块:构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,体检数据向量;
[0050]
知识图谱构建模块:获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型transr将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿
病领域知识图谱;
[0051]
自身状况矩阵生成模块:基于构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;
[0052]
分类预测模块:融合自注意力机制与卷积神经网络,构建分类预测模型,由患者自身状况的矩阵,通过构建的分类预测模型获得预测结果。
[0053]
本发明的有益效果是:该种融合知识图谱和深度学习的糖尿病预测方法及系统,与现有方法相比,能够通过同时考虑患者体检数据与症状描述,并引入自注意力机制获取全局信息以及卷积神经网络提取局部特征,从而能够从数据中挖掘出更多的信息,获得的预测结果具有更高准确性。该方法基于数据和知识共同驱动,能够从海量医学数据中挖掘出诊断规则,且通过引入外部医学专业知识的支持,使得预测过程更接近于实际临床诊断,具有更高的可解释性,能够解决现有的糖尿病预测过程中考虑的影响因素不全面,导致预测结果准确性和可解释性较低的问题。
附图说明
[0054]
图1是本发明实施例融合知识图谱和深度学习的糖尿病预测方法的流程示意图。
[0055]
图2是实施例中得到体检数据向量表示的说明示意图。
[0056]
图3是实施例中构建糖尿病领域知识图谱的说明示意图。
[0057]
图4是实施例中分类预测模型的说明示意图。
[0058]
图5是本发明实施例融合知识图谱和深度学习的糖尿病预测系统的说明示意图。
具体实施方式
[0059]
下面结合附图详细说明本发明的优选实施例。
[0060]
实施例
[0061]
一种融合知识图谱和深度学习的糖尿病预测方法,如图1,包括以下步骤,
[0062]
s1、构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,得到体检数据向量;
[0063]
步骤s1中,构建体检数据实体向量库,如图2,具体为,
[0064]
s11、依据医学上定义的体检指标正常范围,将体检指标的检测值划分为更具细粒度的若干参考范围,并确定对应的关系,在一个示例中,划分为七个参考范围,并分别确定对应的关系为严重偏低、一般偏低、轻微偏低、正常、轻微偏高、一般偏高、严重偏高。
[0065]
s12、基于划分的参考范围,将体检指标、关系与检测值表示成三元组的形式,如(甘油三酯,0.44mmol/l,轻微偏低),基于知识表示模型transh得到体检数据实体向量库。
[0066]
s2、获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型transr将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱;如图3。
[0067]
s21、获取用于构建知识图谱的糖尿病领域专业文献;
[0068]
s22、进行知识抽取,包括实体抽取和关系抽取,其中,实体抽取为基于双向长短期记忆网络bilstm和条件随机场crf模型抽取出步骤s21得到的糖尿病领域专业文献中与糖尿病相关的实体;关系抽取为通过对文本进行句法分析抽取出文本中隐含的实体之间的关
系,并表示成三元组(头实体,关系,尾实体)的形式,如(糖尿病,症状,多食);
[0069]
s23、进行知识融合,通过实体对齐和实体链接对抽取的知识实体整合、消歧,通过关系推理进行正确性判断,进而更新三元组中的实体和关系;
[0070]
s24、进行知识表示,基于知识表示模型transr将糖尿病领域知识图谱中的实体和关系表示成向量形式,得到构建的糖尿病领域知识图谱。
[0071]
s3、基于步骤s2构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;
[0072]
步骤s3中,进而获得患者自身状况的矩阵ek×m,具体为,
[0073]
s31、判定患者是否进行体检获得体检数据,如是,进入步骤s32;如否,则进入步骤s33;
[0074]
s32、在患者进行体检获得体检数据时,由得到的症状描述向量与步骤s1得到的患者体检数据向量拼接成描述患者自身状况的矩阵;
[0075]
s33、在患者未进行体检未获得体检数据时,由得到的症状描述向量单独拼接成描述患者自身状况的矩阵。
[0076]
s4、融合自注意力机制与卷积神经网络,构建分类预测模型,由步骤s1得到的体检数据向量与步骤s3得到的症状描述向量,由分类预测模型获得预测结果。
[0077]
在步骤s1患者体检数据和步骤s3症状描述都表示成向量后,拼接成用于描述患者自身状况的矩阵。该矩阵融合了两种模态的数据,即共同考虑了患者体检数据和症状描述中的信息。由于患者体检数据与症状描述之间存在相互影响,所以首先将该矩阵输入到自注意力机制中,获取全局信息。此外,为了防止某些局部无效信息对预测结果的影响,所以采用卷积神经网络提取局部有效特征。
[0078]
步骤s4中,融合自注意力机制与卷积神经网络,构建分类预测模型,分类预测模型包括输入层、自注意力层、卷积层、全连接层、softmax层和输出层,如图4,具体为:
[0079]
s41、将患者自身状况的矩阵ek×m输入到自注意力层中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息矩阵;
[0080]
步骤s41中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息,具体为,
[0081]
s411、定义三个权重矩阵:wq∈rq×k,wk∈rq×k,wv∈rv×k,根据式其中,表示患者自身状况矩阵的列向量,将矩阵中的每个向量被线性映射到三个不同的空间,得到查询向量qi、键向量ki和值向量vi;
[0082]
s412、将查询向量qi、键向量ki和值向量vi分别合并成查询矩阵q、键矩阵k、值矩阵v,根据下式计算出自注意力机制获取的全局信息矩阵即输出矩阵:
[0083][0084]
其中,softmax()为激活函数,dk为查询向量qi的维度。
[0085]
s42、将获取的全局信息矩阵输入到卷积神经网络中,由卷积层进行局部特征提取,得到患者体检数据和症状描述的最终表示向量;能够实现更深层次挖掘关系矩阵中的信息。
[0086]
步骤s42中,由卷积层进行局部特征提取,得到患者体检数据和症状描述的最终表示向量,具体为,
[0087]
s421、假设卷积层的卷积滤波器wf∈rh×d,其中,r为向量空间,h为卷积滤波器窗口大小,d表示输入向量的维度,对于输入的从i行到i+k-1行的局部特征即全局信息矩阵第i到i+h-1列表的向量,卷积滤波器所提取的特征子矩阵的第i个特征值表示为:
[0088][0089]
其中,f(
·
)是非线性激活函数relu(
·
),b是偏置值;
[0090]
s422、获得自注意力层得到的输出矩阵e
attn
的局部特征矩阵为:
[0091]
c=[c1,c2,c3,

,ci,

,c
m-h+1
]
[0092]
其中,m为e
attn
列向量个数,h为卷积滤波器窗口大小;
[0093]
s423、对局部特征矩阵c进行最大池化操作,得到患者体检数据和症状描述的最终表示向量。
[0094]
s43、将步骤s42得到的患者体检数据和症状描述的最终表示向量,经全连接层的变换后得到患者是否患有糖尿病的得分向量s;
[0095]
s44、将得分向量s输入到softmax层,得分向量s经由softmax层计算,得到患者是否患有糖尿病的概率分布,根据概率分布获得患者是否患有糖尿病的预测结果,并由输出层输出预测结果。
[0096]
步骤s44中,得分向量s经由softmax层计算,得到患者是否患有糖尿病的概率分布,即患者患糖尿病和不患糖尿病的概率:
[0097][0098]
其中,exp(si)、exp(sj)分别为得分向量s第i维、第j维的以e为底的指数,i、j分别表示得分向量s的维数。
[0099]
如图5,实施例还提供一种采用上述任一项所述的一种融合知识图谱和深度学习的糖尿病预测方法的系统,包括体检数据向量表示模块、知识图谱构建模块、自身状况矩阵生成模块和分类预测模块,
[0100]
体检数据向量表示模块:构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,体检数据向量;
[0101]
知识图谱构建模块:获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型transr将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱;
[0102]
自身状况矩阵生成模块:基于构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;
[0103]
分类预测模块:融合自注意力机制与卷积神经网络,构建分类预测模型,由患者自身状况的矩阵,通过构建的分类预测模型获得预测结果。
[0104]
该种融合知识图谱和深度学习的糖尿病预测方法及系统,与现有方法相比,能够通过同时考虑患者体检数据与症状描述,并引入自注意力机制获取全局信息以及卷积神经网络提取局部特征,从而能够从数据中挖掘出更多的信息,获得的预测结果具有更高准确
性。该方法基于数据和知识共同驱动,能够从海量医学数据中挖掘出诊断规则,且通过引入外部医学专业知识的支持,使得预测过程更接近于实际临床诊断,具有更高的可解释性,能够解决现有的糖尿病预测过程中考虑的影响因素不全面,导致预测结果准确性和可解释性较低的问题。
[0105]
该种融合知识图谱和深度学习的糖尿病预测方法及系统,通过构建糖尿病领域知识图谱,在深度学习分类预测模型的基础上引入了外部医学专业知识,同时提高了预测结果的准确性和可解释性。通过同时考虑患者的体检数据以及症状描述,能够防止患者自身其他因素对体检指标检测值的影响,减少了外部噪声对预测结果的影响。
[0106]
该种融合知识图谱和深度学习的糖尿病预测方法及系统,针对体检数据是数值类型数据,而患者症状描述是文本类型数据,在同时考虑体检数据与患者症状描述,需要对两种不同的模态的数据进行一定的预处理,该方法中,构建体检数据的向量表示通过知识表示学习模型transh,将患者体检数据表示成向量的形式。糖尿病领域知识图谱的构建即患者症状描述向量表示,通过收集的糖尿病领域文献,构建出糖尿病领域知识图谱,并通过知识表示学习模型transr将知识图谱中的实体向量化。通过知识图谱抽取出患者症状描述中的症状实体,并表示成向量形式。在体检数据和患者症状描述都表示成向量形式后,拼接成一矩阵,然后输入到sacc分类器中,即可得到患者患有糖尿病的概率。
[0107]
该种融合知识图谱和深度学习的糖尿病预测方法及系统,通过构建体检数据的向量表示,以及糖尿病领域知识图谱的构建即患者症状描述向量表示,结合自注意力机制与卷积神经网络构建的分类预测模型sacc(self-attention cnn classfier),能够获得预测结果。通过构建糖尿病领域知识图谱,并利用表示学习将知识图谱与深度学习结合,在糖尿病预测中引入外部专业知识的支持,能够使分类预测模型考虑的因素更加全面,有效提高预测的准确性和可解释性。该方法中的建模数据来源于医疗数据以及糖尿病领域专业文献,真实可靠,即使患者未进行体检并未获得体检数据,该方法也可针对患者的症状描述进行预测,适用范围广,具有更好的可行性。
[0108]
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1