一种基于图神经网络的生命体征预测方法

文档序号:37910421发布日期:2024-05-10 23:50阅读:9来源:国知局
一种基于图神经网络的生命体征预测方法

本发明涉及深度学习,尤其涉及一种基于图神经网络的生命体征预测方法。


背景技术:

1、近几年,利用深度学习技术对生命体征进行监测的例子层出不穷,但实现预测生命体征的技术少之又少。主要有一下几种方法,统计模型预测利用患者的历史生命体征数据,建立统计预测模型,预测某些生命体征的未来趋势。常用的模型有线性回归、逻辑回归等。机器学习预测使用神经网络、支持向量机等机器学习算法,根据患者的临床指标、生化指标、年龄、基因信息等建模,实现对疾病风险、住院时间等的预测。数据驱动的临床决策支持通过分析大规模的医疗数据库,发现不同生命体征的参数与疾病结局之间的关联,建立预测模型,为临床决策提供数据支持,但是在实际应用中存在各种问题。曾红武等人于2023年在论文《医疗物联网:慢性病智能生命体征监测》中提到通过数据采集、预处理、特征提取和建立模型几个步骤进行监测,但该方法利用了生命体征数据,并未结合时间进行预测,仅仅达到监测的效果。zhang x等人于2021年在论文《graph-guided network forirregularly sampled multivariate time series》中提出raindrop模型并采用transformer注意力机制替代图卷积的信息交互方式,解决了采样时间存在间隔而难以同时采样的问题,很好的表达了生命体征中潜在的空间关联性,有效提取了时间序列信息,并将体征信息进行细分,便于模型处理。但是时间序列存在截断和缺失,无法连续地进行实时预测,各种体征数据在空间上联系密集,容易过拟合,并且训练需要大量的时间和资源;该方法忽略了复杂背景下对人体生命体征预测的有效性,存在计算复杂、精度较低等问题。fritz b a等人于2019年在论文《deep-learning model for predicting 30-daypostoperative mortality》中使用卷积神经网络(convolutional neural networks,cnn)与长短期记忆人工神经网络(long short-term memory,lstm)预测手术过后30天的死亡率。cnn与lstm结合虽然可以学习到序列数据中的时间特征,但是它们没有表示出生命体征数据的空间关联性,并且在训练过程中需要大量的计算资源和时间。

2、目前的生命体征预测算法采用lstm或raindrop模型等方法,依然存在无法处理非序列数据,对数据时间规则存在一定的依耐性;并且精确度较低,面对大量生命体征数据,计算量较大,速度较慢。


技术实现思路

1、发明目的:本发明的目的是提供一种能提高信息提取能力和预测准确性的基于图神经网络的生命体征预测方法。

2、技术方案:本发明的生命体征预测方法,包括步骤如下:

3、s1,对采集含有患者信息的数据集,并对数据集进行预处理;

4、s2,将预处理后的数据分为动态特征向量和静态特征向量,并对动态特征向量和静态特征向量分别输入生命体征预测网络进行处理;

5、s3,将处理完后的动态特征向量和静态特征向量进行拼接,得到一个新的特征向量;

6、s4,将新的特征向量输入gelu和全连接层,输出患者生命体征预测信息;

7、s5,通过wandb模块对患者的指标进行实时监测。

8、进一步,步骤s1中,将含有患者信息的数据集分为三等份,每份包含n名患者;每名患者的数据为一个单独的.txt文件,其中记录了患者48小时内的监测数据,分为三个字段,分别为time、parameter和value;

9、且每名患者的数据中前五个数据均为静态特征,分别为:年龄、体重、icu类型、身高和性别;剩下数据均为动态特征,包括心率、血压、体温;

10、输出的标签为患者id以及in-hospital_death。

11、进一步,步骤s2中,将每名患者数据中的静态特征划作为静态特征向量,动态特征作为动态特征向量。

12、进一步,步骤s2中,对动态特征向量进行处理的步骤如下:

13、s21,将动态特征向量进行复制,采用一层全连接层将所有的时间序列长度由t+压缩成t;随后,再将动态特征向量的传感器维度复制并拼接起来,实现对向量信息的复制,将复制完的特征向量放入relu层和dropout层中继续处理;将处理后的特征向量输入至图神经主干网络,采用可变形注意力模块,对相应传感器输入的动态特征向量在每一采样时刻进行图神经展开,建立动态图神经模型进行图模型的信息提取,输出一个大小不变的二维向量;

14、s22,将二维向量使用正余弦的位置编码方式,创建pe矩阵:

15、pe(pos,2i)=sin(pos/10002i/dim),i∈(0,dim/2)

16、pe(pos,2i+1)=cos(pos/1000(2i+1)/dim),i∈(0,dim/2)

17、其中,pe为二维矩阵,pos表示位置信息,dim表示向量的维度信息,i表示向量的位置信息,sin()为正弦函数,cos()为余弦函数;

18、s23,经过pe矩阵后输出为二维特征向量,随后可变形注意力编码器对输入的各个传感器的各个时间序列进行融合,实现对固定时间内的时间信息整合,输出为一个三维特征向量;

19、s24,将三维特征向量放入残差解码器,实现对三维特征向量的解码分析;所述残差解码器的输入为三维特征向量,输出为二维特征向量。

20、进一步,步骤s23中,采用多头注意力机制从多头不同图神经网络得到需提取的特征向量,并将特征向量在第三维度拼接,最终输出维度为3的特征向量;将输入的二维特征向量x0∈r(d×t),复制b次并拼接成为x1∈r(d×b)×t,创建拥有d×b个节点的动态特征图g。

21、进一步,步骤s2中,将静态特征向量输入全连接层,实现对静态特征向量的复制。

22、本发明与现有技术相比,其显著效果如下:

23、1、本发明使用增加了多头注意力机制的deformable detr(detectiontransformer)替代图神经网络中的transformer作为消息传递机制,加快了预测速度;

24、2、本发明增加体征数据的正余弦时间位置编码,实现对体征信息的时间序列的特征强化;

25、3、针对最后的分类预测进行全局emdedding分类,不仅仅使用global维度信息,也加入了图神经edge维度信息,着重强调各种体征之间的信息关系,更加有效地提高了预测精准度;

26、4、本发明的输出模块选用激活函数gelu,保证信息完整性,有效地提高了预测的精准度;

27、5、本发明将输入的特征复制多份,设为单独的图节点,增加了对于deformabledetr的适应性,提高了特征提取的能力;利用wandb模块实现了实时监测;

28、6、针对bottomk%的链接权重阻断问题,改进为topk%的链接选择,着重选择权重较大的前几个链接;topk方法是确定一个基准数,然后遍历数组比较元素与基准数的大小,保留较大或较小的k个元素;重复该比较过程,采用最大堆或最小堆等数据结构维护当前的前k个元素,直到从数组中选择出最大的或最小的k个数。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1