脓毒症特征变量的度量方法、装置、终端设备及介质

文档序号：37190525发布日期：2024-03-01 12:59阅读：19来源：国知局

本发明涉及脓毒症预测领域，尤其涉及一种脓毒症特征变量的度量方法、装置、终端设备及计算机可读存储介质。

背景技术：

1、脓毒症是机体对感染的反应失调，导致危及生命的器官功能障碍，是一种全身性的炎症反应综合症，具有死亡率高的特点。若脓毒症患者得不到及时的治疗，其死亡率和器官损伤程度将大幅提升，因此脓毒症特征变量的度量以及发现至关重要。

2、目前，在对重症监护病房(icu)患者进行脓毒症(特征)早期预测的方法主要是采用lasso正则化的cox比例风险模型。该模型利用mimic-ii临床数据集，可从重症监护病房获得生理和实验室数据。但是这个方法所采用的数据集的缺失比较大，深度学习效果一般，难以捕获用于预测脓毒症的特征，因此对脓毒症特征进行预测的结果会存在精度不够高的问题。

技术实现思路

1、本发明提供了一种脓毒症特征变量的度量方法、装置、终端设备及计算机可读存储介质，以解决如何提高对脓毒症特征进行预测的精度的技术问题。

2、为了解决上述技术问题，本发明实施例提供了一种脓毒症特征变量的度量方法，包括：

3、获取待预测用户的特征变量；其中，所述特征变量的类型包括实验室变量、人口统计学信息和生命体征变量；

4、从所述特征变量中提取原始数据特征、数值分析特征、路径签名特征、缺失数据特征和临床专家评分特征；

5、将提取的特征输入至预先训练的预测模型，基于所述预测模型的输出，获得每个特征变量的重要性度量值，以量化特征变量在脓毒症预测中的作用大小；

6、其中，所述预测模型包括自适应决策网络和多个xgboost分类器；所述多个xgboost分类器的输入端作为所述预测模型的输入端，所述多个xgboost分类器的输出端与所述自适应决策网络的输入端连接，所述自适应决策网络的输出端作为所述预测模型的输出。

7、作为优选方案，所述预测模型的训练方法包括：

8、获取若干用户样本的样本数据集，并将所述样本数据集划分为训练集和测试集；其中，每个用户样本均包括对应的实验室变量、人口统计学信息和生命体征变量；

9、通过所述训练集，采用五折交叉验证法分别训练预设的多个xgboost基础模型；

10、在所有xgboost基础模型收敛时，获得所述多个xgboost分类器；通过所述多个xgboost分类器的输出，训练预设的基础决策模型，直至所述基础决策模型收敛，获得所述预先训练的预测模型。

11、作为优选方案，所述原始数据特征指缺失率小于等于第一预设阈值的特征变量；所述数值分析特征包括生命体征变量在时间窗口内的平均值、方差、标准差、中位数、最大值和最小值；所述路径签名特征值指对生命体征变量进行二阶路径签名特征进行计算的计算结果；所述缺失数据特征包括二值特征、测量频率特征、测量间隔特征、缺失持续时间特征、缺失数据的累积特征和相邻缺失间的有效测量特征；所述临床专家评分特征包括sofa评分和qsofa评分。

12、作为优选方案，在所述获取若干用户样本的样本数据集之前，还包括：

13、获取原始数据集；

14、剔除缺失值大于第二预设阈值的特征变量；

15、对经过剔除处理后保留的用户样本中的缺失数据进行第一向前填充处理；

16、采用箱线图法，对经过第一向前填充处理的数据进行异常值的识别；

17、对识别得到的异常值进行第二向前填充处理；

18、在经过第二向前填充处理的数据中阳性样本的数量大于阴性样本的数量时，从阳性样本中随机筛选出与阴性样本数量一致的阳性样本；在经过第二向前填充处理的数据中阴性样本的数量大于阳性样本的数量时，从阴性样本中随机筛选出与阳性样本数量一致的阴性样本；从而获得经过预处理的所述样本数据集。

19、作为优选方案，所述采用箱线图法，对经过第一向前填充处理的数据进行异常值的识别，具体为：

20、计算经过第一向前填充处理的数据中各用户样本的四分位距、上四分位和下四分位；其中，所述四分位距为所述上四分位和下四分位的差值；

21、根据所述四分位距、上四分位和下四分位，设置用户样本的正常值范围；

22、将在所述正常值范围外的用户样本识别为异常值。

23、相应的，本发明实施例还提供了一种脓毒症特征变量的度量装置，包括获取模块、特征提取模块和预测模块；其中，

24、所述获取模块，用于获取待预测用户的特征变量；其中，所述特征变量的类型包括实验室变量、人口统计学信息和生命体征变量；

25、所述特征提取模块，用于从所述特征变量中提取原始数据特征、数值分析特征、路径签名特征、缺失数据特征和临床专家评分特征；

26、所述预测模块，用于将提取的特征输入至预先训练的预测模型，基于所述预测模型的输出，获得每个特征变量的重要性度量值，以量化特征变量在脓毒症预测中的作用大小；

27、其中，所述预测模型包括自适应决策网络和多个xgboost分类器；所述多个xgboost分类器的输入端作为所述预测模型的输入端，所述多个xgboost分类器的输出端与所述自适应决策网络的输入端连接，所述自适应决策网络的输出端作为所述预测模型的输出。

28、作为优选方案，所述预测模型的训练方法包括：

29、获取若干用户样本的样本数据集，并将所述样本数据集划分为训练集和测试集；其中，每个用户样本均包括对应的实验室变量、人口统计学信息和生命体征变量；

30、通过所述训练集，采用五折交叉验证法分别训练预设的多个xgboost基础模型；

31、在所有xgboost基础模型收敛时，获得所述多个xgboost分类器；通过所述多个xgboost分类器的输出，训练预设的基础决策模型，直至所述基础决策模型收敛，获得所述预先训练的预测模型。

32、作为优选方案，所述原始数据特征指缺失率小于等于第一预设阈值的特征变量；所述数值分析特征包括生命体征变量在时间窗口内的平均值、方差、标准差、中位数、最大值和最小值；所述路径签名特征值指对生命体征变量进行二阶路径签名特征进行计算的计算结果；所述缺失数据特征包括二值特征、测量频率特征、测量间隔特征、缺失持续时间特征、缺失数据的累积特征和相邻缺失间的有效测量特征；所述临床专家评分特征包括sofa评分和qsofa评分。

33、相应的，本发明实施例还提供了一种终端设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现所述的脓毒症特征变量的度量方法。

34、相应的，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行所述的脓毒症特征变量的度量方法。

35、相比于现有技术，本发明实施例具有如下有益效果：

36、本发明实施例提供了一种脓毒症特征变量的度量方法、装置、终端设备及计算机可读存储介质，所述预测方法包括：获取待预测用户的特征变量；其中，所述特征变量的类型包括实验室变量、人口统计学信息和生命体征变量；从所述特征变量中提取原始数据特征、数值分析特征、路径签名特征、缺失数据特征和临床专家评分特征；将提取的特征输入至预先训练的预测模型，基于所述预测模型的输出，获得每个特征变量的重要性度量值，以量化特征变量在脓毒症预测中的作用大小；其中，所述预测模型包括自适应决策网络和多个xgboost分类器；所述多个xgboost分类器的输入端作为所述预测模型的输入端，所述多个xgboost分类器的输出端与所述自适应决策网络的输入端连接，所述自适应决策网络的输出端作为所述预测模型的输出。实施本技术实施例，相比现有技术面对数据集缺失大的问题，本实施例采用xgboost和自适应决策网络，并且多个xgboost分类器对应多个输出，将多个xgboost的输出输入自适应决策网络，通过自适应决策网络进行整合，使得多个xgboost模型输出的自适应权重分配更合理，可以有效提高对脓毒症特征进行预测的精度；此外，本技术提取特征变量的原始数据特征、数值分析特征、路径签名特征、缺失数据特征和临床专家评分特征，并将提取的特征输入至预测模型，可以从原始数据特征、数值分析特征、路径签名特征、缺失数据特征和临床专家评分特征五个方面对用户的特征变量进行分析和预测，可以提高用于分析和预测的数据的质量，进一步提高预测的精度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨正飞,刘思齐,杨其宇,朱慧敏,冯晓乐,唐俊鹏,刘威鹏
技术所有人：中山大学孙逸仙纪念医院
我是此专利的发明人

上一篇：一种高适用性电泳涂料的制作方法
上一篇：一种向量检索方法、装置、电子设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。