器官衰竭感染病症的预测、预测模型的训练方法及系统与流程

文档序号:25722822发布日期:2021-07-02 21:07阅读:183来源:国知局
器官衰竭感染病症的预测、预测模型的训练方法及系统与流程

本发明涉及人工智能技术领域,特别涉及一种器官衰竭感染病症的预测、预测模型的训练方法及系统。



背景技术:

器官衰竭感染病症(以下简称“病症”)是指由感染引起的全身炎症反应综合征,该病症发病率高,病情凶险,病死率高,是重症监护病房内非心脏病人死亡的主要原因,此病症可以由任何部位的感染引起,常常发生在有严重疾病的患者中,其根本发病机制尚未明了。病症判别标准包括sirs(systemicinflammatoryresponsesyndrome,全身炎症反应综合征)评分、sofa(sequentialorganfailureassessment,序贯器官衰竭估计)评分等。

由于该病症病情危重,因此需要在发病前一段时间,通过各项生理指标提前做出预判,并做好相应的医治准备;然而,现有的预判方案均存在预测的准确率较低,无法满足实际的医治需求的问题。



技术实现要素:

本发明要解决的技术问题是为了克服现有技术中器官衰竭感染病症的预判方式均存在准确率较低,无法满足实际的医治需求缺陷,提供一种器官衰竭感染病症的预测、预测模型的训练方法及系统。

本发明是通过下述技术方案来解决上述技术问题:

本发明提供一种器官衰竭感染病症预测模型的训练方法,所述训练方法包括:

获取参考数据集;

提取所述参考数据集中与器官衰竭感染病症关联的第一病症数据;

基于所述第一病症数据训练得到器官衰竭感染病症预警模型;其中,所述器官衰竭感染病症预警模型用于输出器官衰竭感染病症的发病概率;

获取目标数据集;

基于所述目标数据集对所述器官衰竭感染病症预警模型进行增量学习训练,以得到目标病症预测模型。

较佳地,所述基于所述目标数据集对所述器官衰竭感染病症预警模型进行增量学习训练,以得到目标病症预测模型的步骤包括:

根据所述目标数据集划分出训练集;

采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型。

较佳地,所述参考数据集为mimic(medicalinformationmartforintensivecare,重症监护医学信息库)数据集,所述目标数据集为国内患者病患数据。

较佳地,所述采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型的步骤包括:

基于learn++(一种增量学习算法)增量学习算法采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型;

其中,所述learn++算法中的弱分类器均采用多层感知器mlp。

较佳地,所述获取目标数据集的步骤包括:

每隔设定时间获取更新后的国内患者数据对应的数据量;

当所述数据量大于第一设定阈值时,则根据更新后的国内患者数据形成一个批次数据并作为所述目标数据集。

较佳地,所述采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型的步骤包括:

采用首次批次数据对应的所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到中间病症预测模型;

依次采用不同批次数据对应的所述训练集对基于上一批次数据训练得到的中间病症预测模型进行更新;

采用当前批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第一测试结果,采用之前若干批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第二测试结果;

当所述第一测试结果与所述第二测试结果的差值小于第二设定阈值时,则将当前批次数据对应的中间病症预测模型作为所述病症预测模型。

较佳地,所述基于所述第一病症数据训练得到器官衰竭感染病症预警模型的步骤包括:

基于所述第一病症数据获取若干病例对应的历史标注结果,以及与每个病例在历史连续设定时长内对应的用于表征器官衰竭感染病症的历史特征数据;

基于每个病例对应的所述历史特征数据和所述历史标注结果训练得到所述器官衰竭感染病症预警模型;

其中,所述器官衰竭感染病症预警模型用于预测患者在未来连续设定时长后的发病概率。

较佳地,所述基于每个病例对应的所述历史特征数据和所述历史标注结果训练得到所述器官衰竭感染病症预警模型的步骤包括:

采用机器学习算法基于每个病例对应的所述历史特征数据和所述历史标注结果训练得到所述器官衰竭感染病症预警模型;

其中,所述机器学习算法包括多层感知器mlp、支持向量机svm、集成学习lightgbm和长短时记忆网络lstm中的至少一种。

本发明还提供一种器官衰竭感染病症的预测方法,所述预测方法包括:

获取待测病患数据;

将所述待测病患数据输入上述的器官衰竭感染病症预测模型的训练方法得到的所述病症预测模型,以获取目标预测结果。

本发明还提供一种器官衰竭感染病症预测模型的训练系统,所述训练系统包括:

参考数据集获取模块,用于获取参考数据集;

病症数据提取模块,用于提取所述参考数据集中与器官衰竭感染病症关联的第一病症数据;

预警模型训练模块,用于基于所述第一病症数据训练得到器官衰竭感染病症预警模型;其中,所述器官衰竭感染病症预警模型用于输出器官衰竭感染病症的发病概率;

目标数据集获取模块,用于获取目标数据集;

病症预测模型训练模块,用于基于所述目标数据集对所述器官衰竭感染病症预警模型进行增量学习训练,以得到目标病症预测模型。

较佳地,所述病症预测模型训练模块包括:

训练集划分单元,用于根据所述目标数据集划分出训练集;

病症预测模型训练单元,用于采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型。

较佳地,所述参考数据集为mimic数据集,所述目标数据集为国内患者病患数据。

较佳地,所述病症预测模型训练单元用于基于learn++增量学习算法采用所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型;

其中,所述learn++算法中的弱分类器均采用多层感知器mlp。

较佳地,所述目标数据集获取模块包括:

数据量获取单元,用于每隔设定时间获取更新后的国内患者数据对应的数据量;

数据集获取单元,用于当所述数据量大于第一设定阈值时,则根据更新后的国内患者数据形成一个批次数据并作为所述目标数据集。

较佳地,所述病症预测模型训练单元包括:

训练子单元,用于采用首次批次数据对应的所述训练集对所述器官衰竭感染病症预警模型进行增量学习训练以得到中间病症预测模型;

所述训练子单元还用于依次采用不同批次数据对应的所述训练集对基于上一批次数据训练得到的中间病症预测模型进行更新;

测试结果获取子单元,用于采用当前批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第一测试结果,采用之前若干批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第二测试结果;

预测模型获取子单元,用于当所述第一测试结果与所述第二测试结果的差值小于第二设定阈值时,则将当前批次数据对应的中间病症预测模型作为所述病症预测模型。

较佳地,所述预警模型训练模块包括:

历史数据获取单元,用于基于所述第一病症数据获取若干病例对应的历史标注结果,以及与每个病例在历史连续设定时长内对应的用于表征器官衰竭感染病症的历史特征数据;

预警模型训练单元,用于基于每个病例对应的所述历史特征数据和所述历史标注结果训练得到所述器官衰竭感染病症预警模型;

其中,所述器官衰竭感染病症预警模型用于预测患者在未来连续设定时长后的发病概率。

较佳地,所述预警模型训练模块用于采用机器学习算法基于每个病例对应的所述历史特征数据和所述历史标注结果训练得到所述器官衰竭感染病症预警模型;

其中,所述机器学习算法包括多层感知器mlp、支持向量机svm、集成学习lightgbm和长短时记忆网络lstm中的至少一种。

本发明还提供一种器官衰竭感染病症的预测系统,所述预测系统包括:

待测病患数据获取模块,用于获取待测病患数据;

预测模块,用于将所述待测病患数据输入上述的器官衰竭感染病症预测模型的训练系统得到的所述病症预测模型,以获取目标预测结果。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现上述的器官衰竭感染病症预测模型的训练方法;和/或,实现上述的器官衰竭感染病症的预测方法。

本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的器官衰竭感染病症预测模型的训练方法的步骤;和/或,实现上述的器官衰竭感染病症的预测方法的步骤。

本发明的积极进步效果在于:

本发明中,基于mimic数据集训练得到器官衰竭感染病症预警模型来预测患者在未来连续设定时长后的发病概率;定期获取更新后的国内患者数据形成的不同批次数据,采用每一批次数据中的训练集对器官衰竭感染病症预警模型进行增量学习训练得到目标病症预测模型,以直接输出患者是否患有器官衰竭感染病症的预测结果,充分利用mimic数据集中的大量数据,将在mimic数据集上训练的一些知识应用了国内病患数据集的预测上;提取连续若干小时的特征指标,更全面地反映了病情的发展情况,使得训练出的预警模型更准确;基于增量学习算法利用旧知识和新数据进行训练,解决了因新旧数据集特征分布不同而造成预测发病准确率较低的问题,有效地提高了病症预警系统在辅助治疗上的实际意义;另外,使用多个分类能力较弱的弱分类器进行增强学习,能够有效地提高预测模型的训练效率,进一步地保证了预测模型的预测精度。

附图说明

图1为本发明实施例1的器官衰竭感染病症预测模型的训练方法的流程图。

图2为本发明实施例2的器官衰竭感染病症预测模型的训练方法的流程图。

图3为本发明实施例3的器官衰竭感染病症的预测方法的流程图。

图4为本发明实施例4的器官衰竭感染病症预测模型的训练系统的模块示意图。

图5为本发明实施例5的器官衰竭感染病症预测模型的训练系统的模块示意图。

图6为本发明实施例6的器官衰竭感染病症的预测系统的模块示意图。

图7为本发明实施例7的实现官衰竭感染病症预测模型的训练方法的电子设备的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在的实施例范围之中。

实施例1

如图1所示,本实施例的器官衰竭感染病症预测模型的训练方法包括:

s101、获取参考数据集;

s102、提取参考数据集中与器官衰竭感染病症关联的第一病症数据;

s103、基于第一病症数据训练得到器官衰竭感染病症预警模型;其中,器官衰竭感染病症预警模型用于输出器官衰竭感染病症的发病概率;

s104、获取目标数据集;

具体地,参考数据集为mimic数据集,目标数据集为国内患者病患数据,例如医院icu病房中的患者检查产生的病患数据等。

s105、基于目标数据集对器官衰竭感染病症预警模型进行增量学习训练,以得到目标病症预测模型。

通过更新后的国内患者病患数据不断地对器官衰竭感染病症预警模型进行增量学习训练处理,即利用增量学习的方法对器官衰竭感染病症预警模型进行二次训练,同时采用旧知识和新数据进行训练,解决了因新旧数据集特征分布不同而造成预测发病准确率较低的问题,有效地提高了病症预警系统在辅助治疗上的实际意义;利用增量学习得到的模型对国内患者数据集进行器官衰竭感染病症预测,有效地提升了模型的训练精度,能够明显提高器官衰竭感染病症的发病预测准确率。

本实施例中,充分利用mimic数据集数据量大的优势,将在mimic数据集上训练的一些知识传承到了国内病患数据集的预测上,即基于mimic数据集中庞大的病患数据训练得到器官衰竭感染病症预警模型;获取更新后的国内患者数据对器官衰竭感染病症预警模型进行增量学习训练得到目标病症预测模型,病症预测模型能够很好地适用于对国内病患数据集,能够有效地提高国内病患数据集的器官衰竭感染病症发病的预测结果的准确率,保证了对器官衰竭感染病症的预判结果,便于做好相应的医治准备,满足更高的医治需求。

实施例2

如图2所示,本实施例的器官衰竭感染病症预测模型的训练方法是对实施例1的进一步改进,具体地:

步骤s103包括:

s1031、基于第一病症数据获取若干病例对应的历史标注结果,以及与每个病例在历史连续设定时长内对应的用于表征器官衰竭感染病症的历史特征数据;

s1032、基于每个病例对应的历史特征数据和历史标注结果训练得到器官衰竭感染病症预警模型;其中,器官衰竭感染病症预警模型用于预测患者在未来连续设定时长后的发病概率。

具体地,采用机器学习算法基于每个病例对应的历史特征数据和历史标注结果训练得到器官衰竭感染病症预警模型;

其中,机器学习算法包括但不限于多层感知器mlp、支持向量机svm、集成学习lightgbm和长短时记忆网络lstm;可以采用上述的一种或者多种算法相结合的方式进行训练以得到器官衰竭感染病症预警模型,具体采用一种或多种算法进行训练可以根据实际模型训练情况进行选择或调整。当采用多种算法进行训练时,则可以通过每种算法训练对应的训练结果计算均值、取占比等方式以最终确定器官衰竭感染病症预警模型,具体采用多种算法如何进行训练得到模型属于本领域的成熟技术,因此此处就不再赘述。

具体地,提取与器官衰竭感染病症相关的连续t小时(t可取值为1、2、3、4、5等)的特征指标(即特征数据),特征指标可以包括但不限于平均动脉压、心率、氧饱和度、收缩压、舒张压、呼吸频率、体温、格拉斯哥评分、氧分压、吸氧浓度、指脉氧饱和度、心输出量、每搏量、每搏量变异率、潮气量、气道峰压、钙、尿素氮、磷、镁、氯、脑钠肽、肌钙蛋白i、纤维蛋白原、c反应蛋白、血沉、氨、酸碱度、二氧化碳分压、碳酸氢根、碱剩余、动脉血氧饱和度、淋巴细胞计数、平均血红蛋白量、肺泡-动脉氧分压差、红细胞计数、平均红细胞体积、中性粒细胞计数、年龄、监护室类型、呼气末正压、氧气流量、白细胞计数、血红蛋白、红细胞压积、肌酐、胆红素、直接胆红素、血小板、国际标准化比值、凝血活酶时间、谷草转氨酶、sofa评分、乳酸、血糖、钾、阴离子间隙、白蛋白、杆状核中性粒细胞、凝血酶原时间、钠、铁蛋白、转铁蛋白、肌酸激酶、肌酸激酶mb、乳酸脱氢酶、肌钙蛋白t、红细胞分布宽度、碱性磷酸酶、平均血红蛋白浓度、尿酸、单核细胞计数、机械通气、12小时内的抗生素服用数量、24小时内的抗生素服用数量、48小时内的抗生素服用数量、体重、尿量、24h液体出入量平衡等。当然,特征数据还可以包括上述之外的数据,具体可以根据实际情况进行增加、修改或者其他调整。

建立连续的t小时的特征指标与标注结果的映射关系,并将mimic数据集中的病患数据随机打乱,然后从中按设定比例划分得到训练集和测试集。采用多层感知器mlp、支持向量机svm、集成学习lightgbm或长短时记忆网络lstm等机器学习算法采用训练集得到基于mimic数据集的提前n小时(n可取值1、2、3、4、5等)的预警模型,该预警模型用于预测未来n小时后的发病概率,即通过提取连续若干小时的更多维度的特征数据,能够更全面地反映了病情的发展情况,使得训练出的模型更准确,也保证了后续病症预测模型训练的准确度以及该病症预测模型的预测准确率。

步骤s104包括:

s1041、每隔设定时间获取更新后的国内患者数据对应的数据量;

s1042、当数据量大于第一设定阈值时,则根据更新后的国内患者数据形成一个批次数据并作为目标数据集。

其中,采用首次批次数据对应的训练集对器官衰竭感染病症预警模型进行增量学习训练以得到中间病症预测模型;

依次采用不同批次数据对应的训练集对基于上一批次数据训练得到的中间病症预测模型进行更新;

采用当前批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第一测试结果,采用之前若干批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第二测试结果;

当第一测试结果与第二测试结果的差值小于第二设定阈值时,则将当前批次数据对应的中间病症预测模型作为病症预测模型。

基于不断地产生的国内病患数据形成多个批次数据,当这些国内病患数据的数据量达到一定量后则将其作为一个新的批次数据,然后将每个批次数据划分为训练集和测试集,并利用每个批次数据中的训练集对器官衰竭感染病症预警模型进行增量学习训练得到中间预测模型,并采用本批次数据的测试集和之前批次数据的测试集对中间预测模型进行测试以获取测试结果,增量学习训练过程可以随着国内病患数据的不断更新而不断持续下去,直至模型基本稳定则停止增量学习训练,以最终获取目标病症预测模型。

步骤s105包括:

s1051、根据目标数据集划分出训练集;

s1052、采用训练集对器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型。

具体地,基于learn++增量学习算法采用训练集对器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型;

其中,learn++算法中的弱分类器均采用多层感知器mlp,使用多个分类能力较弱的弱学习器进行增强学习,能够有效地提高训练效率。

当然也可以根据实际情况选择其他类型的弱分类器,具体可以根据实际训练需求进行重新确定与调整。

具体地,将每个批次数据划分成训练集和测试集之后,增量学习过程中采用的learn++算法得到若干个弱分类器(多层感知器mlp),若单个弱分类器在测试集上的加权误差:

其中,dt(i)为训练集每条数据的权重,当dt(i)小于1/2时,则该弱分类器成功;计算成功的弱分类器上的标准误差为:

βt=et/(1-et)

基于成功的弱分类器获取联合模型的方法为:

该联合模型在测试集上的误差:

当et小于1/2,则确定联合模型成功,并根据测试集上的结果重新划分该批次数据的训练集和测试集:

一个批次数据生成t个联合模型后训练中止,在任意一组数据的联合模型生成后,其最终用于预测的病症预测模型为:

另外,本实施例中采用learn++算法进行增量学习训练的过程属于本领域的成熟技术,因此在此就不再赘述。

下面结合实例具体说明本实施例的器官衰竭感染病症预测模型的训练方法的实现过程:

(1)对mimic数据集中病例进行预处理,包括进行阴阳性的标注以及与器官衰竭感染病症相关的特征指标的提取等;提取特征时,对各病例连续提取5小时特征指标,把这些特征指标放在一起作为1条数据,而建立连续5小时特征与标注结果的映射关系;将mimic数据集按1:1划分成训练集和测试集,采用lightgbm机器学习方法利用训练集进行模型训练,得到基于mimic数据集的1-5小时后的器官衰竭感染病症模型,并在测试集上进行测试。

(2)依次对国内病患数据集进行预处理、标注、特征提取与数据集划分等操作,得到国内病患数据集的训练集和测试集,采用国内病患数据集的训练集对器官衰竭感染病症模型进行增量学习训练;同时采用当前批次的国内病患数据集的测试集和先前批次数据的测试集输入增量学习训练后的器官衰竭感染病症模型中进行模型测试;

具体地,可以将国内病患数据集的数据集划分为6个批次,采用learn++增量学习算法,每组数据生成5个联合模型,弱分类器均用6层mlp模型,其节点数依次为455,256,128,64,24,24,2,采用交叉熵作为损失函数,选择adam优化器(学习率0.1),batchsize(批尺寸)为256,dropout为0.9。当每次生成弱分类器时,单次训练集连续训练后的损失函数小于0.1便停止训练,有利于提高训练速度及效率。通过不断输入的新批次数据,利用mimic数据集训练模型和该批次国内病患数据的训练集进行增量学习,并在测试集上测试。先前批次的测试集也会在之后批次的模型进行测试以进一步地保证了模型训练的精度。若先前批次的测试结果趋于稳定,且测试结果符合精度要求,则作为国内病患数据集的最终预测模型。

分别采用本实施例的目标病症预测模型、现有的利用mimic数据集上训练的模型、利用国内病患训练集进行训练得到模型对同一国内病患测试集进行测试以获取预测结果,参见下表为三种预测模型对应的的预测准确率:

根据上表可以得知,第一种方法对应利用mimic数据集上训练的模型直接去测试国内病患测试集对应的预测准确度;第二种方法对应国内病患训练集直接进行训练得到模型,并在国内病患测试集上进行测试对应的预测准确度;第三种方法为本实施例的目标病症预测模型对应的预测准确度,比较这三种模型分别对应的测试结果,可以得知本实施例的增量学习的预测准确率最高,达到了提高器官衰竭感染病症的发病预测的准确度的效果。其中,增量学习通过不断学习新的批次数据以提高模型精度,并且模型在学习新知识的同时没有忘记旧知识,保证了模型训练的稳定性。

本实施例中,基于mimic数据集训练得到器官衰竭感染病症预警模型来预测患者在未来连续设定时长后的发病概率;获取更新后的国内患者数据对应的不同批次数据对器官衰竭感染病症预警模型进行增量学习训练得到目标病症预测模型,病症预测模型能够很好地适用于对国内病患数据是否对应器官衰竭感染病症发病进行预测,有效地提高了预测结果的准确率,保证了对器官衰竭感染病症的预判结果,便于做好相应的医治准备,满足更高的医治需求。

实施例3

本实施例的器官衰竭感染病症的预测方法基于实施例1或2中的器官衰竭感染病症预测模型的训练方法实现。

如图3所示,本实施例的器官衰竭感染病症的预测方法包括:

s201、获取待测病患数据;其中,待测病患数据为国内患者数据集。

s202、将待测病患数据输入器官衰竭感染病症预测模型的训练方法得到的病症预测模型,以获取目标预测结果。

本实施例中,采用上述的病症预测模型直接输出国内患者数据集对应的器官衰竭感染病症发病的预测结果,保证了预测结果的准确性,在满足治疗场景的需求的同时,提升了患者的体验感。

实施例4

如图4所示,本实施例的器官衰竭感染病症预测模型的训练系统包括参考数据集获取模块1、病症数据提取模块2、预警模型训练模块3、目标数据集获取模块4和病症预测模型训练模块5。

参考数据集获取模块1用于获取参考数据集;

病症数据提取模块2用于提取参考数据集中与器官衰竭感染病症关联的第一病症数据;

预警模型训练模块3用于基于第一病症数据训练得到器官衰竭感染病症预警模型;其中,器官衰竭感染病症预警模型用于输出器官衰竭感染病症的发病概率;

目标数据集获取模块4用于获取目标数据集;

具体地,参考数据集为mimic数据集,目标数据集为国内患者病患数据,例如医院icu病房中的患者检查产生的病患数据等。

病症预测模型训练模块5用于基于目标数据集对器官衰竭感染病症预警模型进行增量学习训练,以得到目标病症预测模型。

通过更新后的国内患者病患数据不断地对器官衰竭感染病症预警模型进行增量学习训练处理,即利用增量学习的方法对器官衰竭感染病症预警模型进行二次训练,同时采用旧知识和新数据进行训练,解决了因新旧数据集特征分布不同而造成预测发病准确率较低的问题,有效地提高了病症预警系统在辅助治疗上的实际意义;利用增量学习得到的模型对国内患者数据集进行器官衰竭感染病症预测,有效地提升了模型的训练精度,能够明显提高器官衰竭感染病症的发病预测准确率。

本实施例中,充分利用mimic数据集数据量大的优势,将在mimic数据集上训练的一些知识传承到了国内病患数据集的预测上,即基于mimic数据集中庞大的病患数据训练得到器官衰竭感染病症预警模型;获取更新后的国内患者数据对器官衰竭感染病症预警模型进行增量学习训练得到目标病症预测模型,病症预测模型能够很好地适用于对国内病患数据集,能够有效地提高国内病患数据集的器官衰竭感染病症发病的预测结果的准确率,保证了对器官衰竭感染病症的预判结果,便于做好相应的医治准备,满足更高的医治需求。

实施例5

如图5所示,本实施例的器官衰竭感染病症预测模型的训练系统是对实施例4的进一步改进,具体地:

本实施例的预警模型训练模块3包括历史数据获取单元6和预警模型训练单元7。

历史数据获取单元6用于基于第一病症数据获取若干病例对应的历史标注结果,以及与每个病例在历史连续设定时长内对应的用于表征器官衰竭感染病症的历史特征数据;

预警模型训练单元7用于基于每个病例对应的历史特征数据和历史标注结果训练得到器官衰竭感染病症预警模型;其中,器官衰竭感染病症预警模型用于预测患者在未来连续设定时长后的发病概率。

具体地,预警模型训练模块3用于采用机器学习算法基于每个病例对应的历史特征数据和历史标注结果训练得到器官衰竭感染病症预警模型;

其中,机器学习算法包括但不限于多层感知器mlp、支持向量机svm、集成学习lightgbm和长短时记忆网络lstm;可以采用上述的一种或者多种算法相结合的方式进行训练以得到器官衰竭感染病症预警模型,具体采用一种或多种算法进行训练可以根据实际模型训练情况进行选择或调整。当采用多种算法进行训练时,则可以通过每种算法训练对应的训练结果计算均值、取占比等方式以最终确定器官衰竭感染病症预警模型,具体采用多种算法如何进行训练得到模型属于本领域的成熟技术,因此此处就不再赘述。

具体地,提取与器官衰竭感染病症相关的连续t小时(t可取值为1、2、3、4、5等)的特征指标(即特征数据),特征指标可以包括但不限于平均动脉压、心率、氧饱和度、收缩压、舒张压、呼吸频率、体温、格拉斯哥评分、氧分压、吸氧浓度、指脉氧饱和度、心输出量、每搏量、每搏量变异率、潮气量、气道峰压、钙、尿素氮、磷、镁、氯、脑钠肽、肌钙蛋白i、纤维蛋白原、c反应蛋白、血沉、氨、酸碱度、二氧化碳分压、碳酸氢根、碱剩余、动脉血氧饱和度、淋巴细胞计数、平均血红蛋白量、肺泡-动脉氧分压差、红细胞计数、平均红细胞体积、中性粒细胞计数、年龄、监护室类型、呼气末正压、氧气流量、白细胞计数、血红蛋白、红细胞压积、肌酐、胆红素、直接胆红素、血小板、国际标准化比值、凝血活酶时间、谷草转氨酶、sofa评分、乳酸、血糖、钾、阴离子间隙、白蛋白、杆状核中性粒细胞、凝血酶原时间、钠、铁蛋白、转铁蛋白、肌酸激酶、肌酸激酶mb、乳酸脱氢酶、肌钙蛋白t、红细胞分布宽度、碱性磷酸酶、平均血红蛋白浓度、尿酸、单核细胞计数、机械通气、12小时内的抗生素服用数量、24小时内的抗生素服用数量、48小时内的抗生素服用数量、体重、尿量、24h液体出入量平衡等。当然,特征数据还可以包括上述之外的数据,具体可以根据实际情况进行增加、修改或者其他调整。

建立连续的t小时的特征指标与标注结果的映射关系,并将mimic数据集中的病患数据随机打乱,然后从中按设定比例划分得到训练集和测试集。采用多层感知器mlp、支持向量机svm、集成学习lightgbm或长短时记忆网络lstm等机器学习算法采用训练集得到基于mimic数据集的提前n小时(n可取值1、2、3、4、5等)的预警模型,该预警模型用于预测未来n小时后的发病概率,即通过提取连续若干小时的特征数据,能够更全面地反映了病情的发展情况,使得训练出的模型更准确,也保证了后续病症预测模型训练的准确度以及该病症预测模型的预测准确率。

另外,本实施例的目标数据集获取模块4包括数据量获取单元8和数据集获取单元9。

数据量获取单元8用于每隔设定时间获取更新后的国内患者数据对应的数据量;

数据集获取单元9用于当数据量大于第一设定阈值时,则根据更新后的国内患者数据形成一个批次数据并作为目标数据集。

本实施例的病症预测模型训练模块5包括训练集划分单元10和病症预测模型训练单元11。

训练集划分单元10用于根据目标数据集划分出训练集;

病症预测模型训练单元11用于采用训练集对器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型。

具体地,病症预测模型训练单元11用于基于learn++增量学习算法采用训练集对器官衰竭感染病症预警模型进行增量学习训练以得到目标病症预测模型;

其中,learn++算法中的弱分类器均采用多层感知器mlp,使用多个分类能力较弱的弱学习器进行增强学习,能够有效地提高训练效率。

当然也可以根据实际情况选择其他类型的弱分类器,具体可以根据实际训练需求进行重新确定与调整。

具体地,将每个批次数据划分成训练集和测试集之后,增量学习过程中采用的learn++算法得到若干个弱分类器(多层感知器mlp),若单个弱分类器在测试集上的加权误差:

其中,dt(i)为训练集每条数据的权重,当dt(i)小于1/2时,则该弱分类器成功;计算成功的弱分类器上的标准误差为:

βt=et/(1-et)

基于成功的弱分类器获取联合模型的方法为:

该联合模型在测试集上的误差:

当et小于1/2,则确定联合模型成功,并根据测试集上的结果重新划分该批次数据的训练集和测试集:

一个批次数据生成t个联合模型后训练中止,在任意一组数据的联合模型生成后,其最终用于预测的病症预测模型为:

另外,本实施例中采用learn++算法进行增量学习训练的过程属于本领域的成熟技术,因此在此就不再赘述。

具体地,本实施例的病症预测模型训练单元11包括训练子单元、测试结果获取子单元和预测模型获取子单元。

训练子单元用于采用首次批次数据对应的训练集对器官衰竭感染病症预警模型进行增量学习训练以得到中间病症预测模型;

训练子单元还用于依次采用不同批次数据对应的训练集对基于上一批次数据训练得到的中间病症预测模型进行更新;

测试结果获取子单元用于采用当前批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第一测试结果,采用之前若干批次数据划分出的测试集对当前的中间病症预测模型进行测试以获取第二测试结果;

预测模型获取子单元用于当第一测试结果与第二测试结果的差值小于第二设定阈值时,则将当前批次数据对应的中间病症预测模型作为病症预测模型。

基于不断地产生的国内病患数据形成多个批次数据,当这些国内病患数据的数据量达到一定量后则将其作为一个新的批次数据,然后将每个批次数据划分为训练集和测试集,并利用每个批次数据中的训练集对器官衰竭感染病症预警模型进行增量学习训练得到中间预测模型,并采用本批次数据的测试集和之前批次数据的测试集对中间预测模型进行测试以获取测试结果,增量学习训练过程可以随着国内病患数据的不断更新而不断持续下去,直至模型基本稳定则停止增量学习训练,以最终获取目标病症预测模型。

下面结合实例具体说明本实施例的器官衰竭感染病症预测模型的训练方法的实现过程:

(1)对mimic数据集中病例进行预处理,包括进行阴阳性的标注以及与器官衰竭感染病症相关的特征指标的提取等;提取特征时,对各病例连续提取5小时特征指标,把这些特征指标放在一起作为1条数据,而建立连续5小时特征与标注结果的映射关系;将mimic数据集按1:1划分成训练集和测试集,采用lightgbm机器学习方法利用训练集进行模型训练,得到基于mimic数据集的1-5小时后的器官衰竭感染病症模型,并在测试集上进行测试。

(2)依次对国内病患数据集进行预处理、标注、特征提取与数据集划分等操作,得到国内病患数据集的训练集和测试集,采用国内病患数据集的训练集对器官衰竭感染病症模型进行增量学习训练;同时采用当前批次的国内病患数据集的测试集和先前批次数据的测试集输入增量学习训练后的器官衰竭感染病症模型中进行模型测试;

具体地,可以将国内病患数据集的数据集划分为6个批次,采用learn++增量学习算法,每组数据生成5个联合模型,弱分类器均用6层mlp模型,其节点数依次为455,256,128,64,24,24,2,采用交叉熵作为损失函数,选择adam优化器(学习率0.1),batchsize(批尺寸)为256,dropout为0.9。当每次生成弱分类器时,单次训练集连续训练后的损失函数小于0.1便停止训练,有利于提高训练速度及效率。通过不断输入的新批次数据,利用mimic数据集训练模型和该批次国内病患数据的训练集进行增量学习,并在测试集上测试。先前批次的测试集也会在之后批次的模型进行测试以进一步地保证了模型训练的精度。若先前批次的测试结果趋于稳定,且测试结果符合精度要求,则作为国内病患数据集的最终预测模型。

分别采用本实施例的目标病症预测模型、现有的利用mimic数据集上训练的模型、利用国内病患训练集进行训练得到模型对同一国内病患测试集进行测试以获取预测结果,参见下表为三种预测模型对应的的预测准确率:

根据上表可以得知,第一种方法对应利用mimic数据集上训练的模型直接去测试国内病患测试集对应的预测准确度;第二种方法对应国内病患训练集直接进行训练得到模型,并在国内病患测试集上进行测试对应的预测准确度;第三种方法为本实施例的目标病症预测模型对应的预测准确度,比较这三种模型分别对应的测试结果,可以得知本实施例的增量学习的预测准确率最高,达到了提高器官衰竭感染病症的发病预测的准确度的效果。其中,增量学习通过不断学习新的批次数据以提高模型精度,并且模型在学习新知识的同时没有忘记旧知识,保证了模型训练的稳定性。

本实施例中,基于mimic数据集训练得到器官衰竭感染病症预警模型来预测患者在未来连续设定时长后的发病概率;获取更新后的国内患者数据对应的不同批次数据对器官衰竭感染病症预警模型进行增量学习训练得到目标病症预测模型,病症预测模型能够很好地适用于对国内病患数据是否对应器官衰竭感染病症发病进行预测,有效地提高了预测结果的准确率,保证了对器官衰竭感染病症的预判结果,便于做好相应的医治准备,满足更高的医治需求。

实施例6

本实施例的器官衰竭感染病症的预测系统基于实施例4或5中的器官衰竭感染病症预测模型的训练系统实现。

如图6所述,本实施例的器官衰竭感染病症的预测系统包括待测病患数据获取模块12和预测模块13。

待测病患数据获取模块12用于获取待测病患数据;

预测模块13用于将待测病患数据输入器官衰竭感染病症预测模型的训练系统得到的病症预测模型,以获取目标预测结果。

本实施例中,采用上述的病症预测模型直接输出国内患者数据集对应的器官衰竭感染病症发病的预测结果,保证了预测结果的准确性,在满足治疗场景的需求的同时,提升了患者的体验感。

实施例7

图7为本发明实施例7提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现实施例1或2中任意一实施例中的器官衰竭感染病症预测模型的训练方法。图7显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。

总线33包括数据总线、地址总线和控制总线。

存储器32可以包括易失性存储器,例如随机存取存储器(ram)321和/或高速缓存存储器322,还可以进一步包括只读存储器(rom)323。

存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或2中任意一实施例中的器官衰竭感染病症预测模型的训练方法。

电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图7所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例8

本发明实施例8提供了一种电子设备,电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现实施例3中的器官衰竭感染病症的预测方法,该电子设备的具体结构参照实施例7中的电子设备,其工作原理与实施例7中的电子设备的工作原理基本一致,在此不再赘述。

实施例9

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1或2中任意一实施例中的器官衰竭感染病症预测模型的训练方法中的步骤。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1或2中任意一实施例中的器官衰竭感染病症预测模型的训练方法中的步骤。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

实施例10

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例3中的器官衰竭感染病症的预测方法中的步骤。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例3中的器官衰竭感染病症的预测方法中的步骤。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1