重度急性呼吸窘迫综合症预警方法及系统与流程

文档序号:22223760发布日期:2020-09-15 19:17阅读:194来源:国知局
重度急性呼吸窘迫综合症预警方法及系统与流程

本发明涉及临床医疗与人工智能技术领域,尤其涉及重度急性呼吸窘迫综合症预警方法及系统。



背景技术:

急性呼吸窘迫综合症(acuterespiratorydistresssyndrome,简称为ards)是一种由多种原因引发急性肺部炎性反应而导致一系列病理生理学反应的临床综合症,是急诊及icu常见的具有较高死亡率的疾病,其发生率随着人口老龄化而上升。因有效治疗手段匮乏,急性呼吸窘迫综合症一旦发作则死亡率极高,并且治疗费用昂贵。因此,对可能发生急性呼吸窘迫综合症的患者进行提前预警并及时采取有效治疗手段抑制其发生,具有重要的临床医疗意义。

目前已有的急性呼吸窘迫综合症预警方法大体有以下两种:第一种是传统的肺损伤预测评分(lips),通过利用病人入院后病情记录信息对急性呼吸窘迫综合症进行预测,但该方法无法实现动态实时性监测预警;第二种是利用人工智能、机器学习技术,基于患者的连续基本生命体征相关动态数据构建急性呼吸窘迫综合症预警模型。目前虽然存在有基于距离检测和基于信念函数理论的预测模型,并可以达到了一定的预测准确性,但其均采用小样本数据训练模型且数据质量要求高,特别是对于icu重症病人有其应用局限性。



技术实现要素:

本发明实施例提供重度急性呼吸窘迫综合症预警方法及系统,用以解决现有技术中存在的问题或至少在一定程度上解决存在的问题。

第一方面,本发明实施例提供重度急性呼吸窘迫综合症预警方法,包括:

获取icu重症患者的待预测生理体征数据;

将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;

将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

进一步地,所述获取icu重症患者的待预测生理指标数据,具体包括:

从icu重症监护医学信息数据库中按照第一约束条件筛选出所述icu重症患者;

按照第二约束条件从所述icu重症患者筛选出ards组患者,按照第三约束条件从所述icu重症患者筛选出非ards组患者;

分别提取所述ards组患者和所述非ards组患者的心率时间序列监测数据、呼吸率时间序列监测数据、血氧饱和度时间序列监测数据和平均脉动压时间序列监测数据。

进一步地,所述将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据,具体包括:

将所述待预测生理体征数据进行数据可视化处理,剔除远离预设正常值范围的噪音数据,并进行缺失值数据填补,得到待预测生理体征预处理数据;

按照预设时间窗口生成所述待预测生理体征预处理数据的时序数据曲线;

在所述预设时间窗口中对所述时序数据曲线进行特征提取处理,得到时序数据特征集合;

将所述时序数据特征集合进行标准化处理,得到时序数据标准化结果;

对所述时序数据标准化结果采用机器学习算法进行k-折交叉验证,按照预设次数预测准确率的平均值为衡量标准进行特征选择,得到所述生理特征时序数据。

进一步地,所述按照预设时间窗口生成所述待预测生理体征预处理数据的时序数据曲线,具体包括:

获取任一患者在所述预设时间窗口的心率时间序列监测数据、呼吸率时间序列监测数据、血氧饱和度时间序列监测数据和平均脉动压时间序列监测数据;

其中,所述ards组患者以所述预设时间窗口为长度,以确诊出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口为异常数据窗口,所述ards组患者的初始检测时间窗口以及非ards组患者的任意时间窗口为非异常数据窗口。

进一步地,所述在所述预设时间窗口中对所述时序数据曲线进行特征提取处理,得到时序数据特征集合,具体包括:

从平均值、标准差、倾斜度、峰度、样本熵和去趋势波动分析的维度对所述时序数据曲线进行特征提取,得到所述时序数据特征集合。

进一步地,所述将所述时序数据特征集合进行标准化处理,得到时序数据标准化结果,具体包括:

将所述ards组患者的时序数据特征集合中的以所述预设时间窗口为长度,以确诊出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口的特征向量除以ards组患者初始窗口特征向量,得到ards组患者时序数据标准化结果,并标记所述时间窗口为正类;

将所述非ards组患者的时序数据特征集合中的第一非ards组患者初始窗口特征向量除以第二非ards组患者初始窗口特征向量,得到非ards组患者时序数据标准化结果,并标记其余时间窗口为负类。

进一步地,所述监测预警模型,通过以下步骤获得:

获取所述患者样本集特征时序数据;

按照所述重度急性呼吸窘迫综合症特征分级标准将所述患者样本集划分为ards组和非ards组;

获取xgboost模型作为初始模型;

将每个时间窗口的四项数据及时间窗口内是否发作的分类标签输入至所述初始模型进行训练,调整模型参数使所述初始模型达到准确率最优状态,得到所述监测预警模型。

第二方面,本发明实施例提供重度急性呼吸窘迫综合症预警系统,包括:

获取模块,用于获取icu重症患者的待预测生理体征数据;

处理模块,用于将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;

预警模块,用于将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

第三方面,本发明实施例提供一种电子设备,包括:

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述重度急性呼吸窘迫综合症预警方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现任一项所述重度急性呼吸窘迫综合症预警方法的步骤。

本发明实施例提供的重度急性呼吸窘迫综合症预警方法及系统,通过提取重症患者的四种典型生理特征数据,并进行线性和非线性的特征选择构建监测预警模型,对患者可能出现的急性呼吸窘迫综合症进行识别和早期预警,辅助医护人员及时诊治病人出现和发生急性呼吸窘迫综合症。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的重度急性呼吸窘迫综合症预警方法流程图;

图2为本发明实施例提供的患者四项生理特征的时序数据曲线示意图;

图3为本发明实施例提供的重度急性呼吸窘迫综合症预警系统结构图;

图4为本发明实施例提供的电子设备的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的重度急性呼吸窘迫综合症预警方法流程图,如图1所示,包括:

s1,获取icu重症患者的待预测生理体征数据;

s2,将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;

s3,将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

具体地,从医院患者库中筛选满足一定条件的icu重症患者生理体征数据,提取icu病人的集中几种基本生理体征时序数据,如病人的心率(hr)、呼吸率(rr)、血氧饱和度(spo2)和平均动脉压(mabp)四项时间序列监测数据,进一步对上述数据作预处理,消除噪音和不一致数据以及缺失数据修复,然后从预设时间窗口中进行特征提取,将提取出的特征进行标准化处理,根据ards患者和非ards患者两类患者的样本数据及选择的特征,采用机器学习算法进行模型训练,得到监测预警模型,后续将新收治的待预测患者的生理体征数据输入至该监测预警模型,得到监测预警结果,能对可能出现的急性呼吸窘迫综合症进行识别和早期预警。

本发明实施例通过提取重症患者的四种典型生理特征数据,并进行线性和非线性的特征选择构建监测预警模型,对患者可能出现的急性呼吸窘迫综合症进行识别和早期预警,辅助医护人员及时诊治病人出现和发生急性呼吸窘迫综合症。

基于上述实施例,该方法中步骤s1具体包括:

从icu重症监护医学信息数据库中按照第一约束条件筛选出所述icu重症患者;

按照第二约束条件从所述icu重症患者筛选出ards组患者,按照第三约束条件从所述icu重症患者筛选出非ards组患者;

分别提取所述ards组患者和所述非ards组患者的心率时间序列检测数据、呼吸率时间序列检测数据、血氧饱和度时间序列检测数据和平均脉动压时间序列检测数据。

具体地,首先按照第一约束条件在icu重症监护医学信息数据库中进行患者筛选,第一约束条件具体为14周岁以上、入住icu病房12小时内、氧合指数pao2/fio2>200mmhg、机械通气时间超过48小时且未出现充血性心衰状况。

进一步地,从筛选出的患者中分出ards组和非ards组,其中按照第二约束条件筛选出ards组,ards组包含已确诊的中度和重度急性呼吸窘迫综合症患者,第二约束条件具体为氧合指数pao2/fio2≤200mmhg并且呼气末正压通气peep≥5cmh2o,且第一次出现急性呼吸窘迫综合症的时刻在入住icu病房的12小时以后;按照第三约束条件筛选出非ards组患者,非ards组包含轻度adrs患者和未患ards的患者,第三约束条件具体为氧合指数pao2/fio2>200mmhg且呼气末正压通气peep<5cmh2o。

待患者分组完成后,提取患者生理体征数据,分别提取患者的心率(hr)、呼吸率(rr)、血氧饱和度(spo2)和平均动脉压(mabp)的时间序列监测数据,如图2所示。

基于上述任一实施例,该方法中步骤s2具体包括:

将所述待预测生理体征数据进行数据可视化处理,剔除远离预设正常值范围的噪音数据,并进行缺失值数据填补,得到待预测生理体征预处理数据;

按照预设时间窗口生成所述待预测生理体征预处理数据的时序数据曲线;

在所述预设时间窗口中对所述时序数据曲线进行特征提取处理,得到时序数据特征集合;

将所述时序数据特征集合进行标准化处理,得到时序数据标准化结果;

对所述时序数据标准化结果采用机器学习算法进行k-折交叉验证,按照预设次数预测准确率的平均值为衡量标准进行特征选择,得到所述生理特征时序数据。

其中,所述按照预设时间窗口生成所述待预测生理体征预处理数据的时序数据曲线,具体包括:

获取任一患者在所述预设时间窗口的心率时间序列监测数据、呼吸率时间序列监测数据、血氧饱和度时间序列监测数据和平均脉动压时间序列监测数据;

其中,所述ards组患者以所述预设时间窗口为长度,以确诊出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口为异常数据窗口,所述ards组患者的初始检测时间窗口以及非ards组患者的任意时间窗口为非异常数据窗口。

其中,所述在所述预设时间窗口中对所述时序数据曲线进行特征提取处理,得到时序数据特征集合,具体包括:

从平均值、标准差、倾斜度、峰度、样本熵和去趋势波动分析的维度对所述时序数据曲线进行特征提取,得到所述时序数据特征集合。

其中,所述将所述时序数据特征集合进行标准化处理,得到时序数据标准化结果,具体包括:

将所述ards组患者的时序数据特征集合中的以所述预设时间窗口为长度,以确诊出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口的特征向量除以ards组患者初始窗口特征向量,得到ards组患者时序数据标准化结果,并标记所述时间窗口为正类;

将所述非ards组患者的时序数据特征集合中的第一非ards组患者初始窗口特征向量除以第二非ards组患者初始窗口特征向量,得到非ards组患者时序数据标准化结果,并标记其余时间窗口为负类。

具体地,对提取患者待预测生理体征数据进行预处理,本发明实施例采用单变量散点图、箱型图进行数据可视化,剔除远离正常值范围的噪音数据,并使用均值填补与同类均值插补相结合的方法填补缺失值数据。

进一步地,生成时序数据曲线。令xs,i(l),i=1,...,4代表患者s在l时刻被监测到的四项基本生理体征数据,xs,i(a:b)=(xs,i(a),...,xs,i(b))代表患者s的第i项生理体征从时刻a到时刻b的连续时间序列数据,t代表病人被确诊出现急性呼吸窘迫综合症的时刻。对于急性呼吸窘迫综合症患者,以时刻t作为结束时刻,长度为τ的预设时间窗口内的四项生命体征数据xs,i(t-τ+1:t)为异常的时间窗口,而ards组患者的初始窗口xs,i(1:τ)以及非ards组患者的任意时间窗口均为非异常。

进一步地,对时间窗口进行判断之前,本发明对时间窗口内的时间序列数据进行特征提取处理。对于每一项生理体征在以时刻t作为结束时刻,长度为τ的时间窗口内的时序数据xs,i(t-τ+1:t),本发明实施例从中提取出线性特征和非线性特征,用t-代表时间窗口的初始时刻,即t-=t-τ+1。提取的特征具体包括:

1)平均值

2)标准差σ

3)倾斜度

此处,倾斜度也被称为三阶矩,反映出随机变量与中心分布的不对称程度,曲线向右倾斜时,倾斜度为正;曲线向左倾斜时,倾斜度为负。此外,倾斜度还可以反映时间序列数据的加速或减速能力。

4)峰度

此处,峰度也被称为四阶矩,其描述概率分布形状,反映了数据在平均值周围的集中程度。

5)样本熵

样本熵(sampen)是基于近似熵的一种用于度量时间序列复杂性的改进方法,在评估生理时间序列的复杂性和诊断病例状态等方面均有应用。样本熵定义了两个参数:嵌入维度u和相似容限r,其中u为整数,表示比较向量的长度,r为实数,表示相似度的度量值。将原时间序列xs,i(t-:t)分成为若干长度为u的子时间序列xs,i(t-:t-+u-1),xs,i(t-+1:t-+u),...,xs,i(t--u+1:t),并定义函数h(u,r)为相似度小于r的子时间序列对数。样本熵计算公式为:

6)去趋势波动分析(dfa值)

去趋势波动分析(dfa值)可以有效滤去序列中的各阶趋势成分,适合非平稳时间序列的长程幂律相关分析。首先,将需要被计算的时间序列xs,i(t-τ+1:t)整合成序列y(u),u=1,...,τ,计算公式为:

然后,y(n)将被切分成若干长度为n的子序列,并且使用最小二乘法为每个子序列拟合一条直线yn(u)。则对于长度n,波动值f(n)计算方法为:

针对不同的子序列长度n计算不同的波动值f(n)。

最后,去趋势波动分析的取值为logf(n)和logn拟合直线函数图像的斜率。

经过对患者的四项生理体征进行上述六种特征计算和提取后,一共产生了24个特征。

进一步地,对提取的特征进行标准化处理和特征选择。对于患者s在结束时刻为t的时间窗口内体征数据计算得到的特征表示为ps,j(t),j=1,...,24。由于每个患者之间存在年龄、体重等各方面的个体差异,因此,本发明实施例将计算得到的24个特征进行标准化:将计算结果除以此患者第一个时间窗口,即初始时间窗口的计算结果,标准化后的结果为ps,j(t)=ps,j(t)/ps,j(τ),ps,j(τ)为此患者初始窗口的特征向量。

对于ards组患者,取其第一个时间窗口和已出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口(称之为患病窗口,即以预设时间窗口为长度,以确诊出现急性呼吸窘迫综合症时刻为结束时刻的时间窗口)计算得到ps,j,并标记为正类。对于非ards组患者,取其前两个时间窗口计算ps,j,即第一非ards组患者初始窗口特征向量和第二非ards组患者初始窗口特征向量,并标记为负类。

最后采用机器学习方法(如xgboost算法)进行k-折交叉验证,取预设次数,如20次预测准确率的平均值作为衡量标准进行特征选择。首先计算使用每个特征单独预测得到的准确率,并按照准确率从大到小排列。为了减少输入的特征数量,本发明实施例采取连续的特征选择方式,即针对此单特征分类准确率的排序,第一次只选择分类准确率最高的特征进行预测,之后每次新增未选择特征中分类准确率最高的特征与之前被选择的特征组合成新的特征集合进行预测,直至预测准确率最高为止,得到的新的特征集合具体包括血氧饱和度的平均值、标准差、倾斜度和样本熵,呼吸率的平均值和标准差,心率的平均值和标准差,平均动脉压的平均值、倾斜度和峰度。

基于上述任一实施例,所述监测预警模型,通过以下步骤获得:

获取所述患者样本集特征时序数据;

按照所述重度急性呼吸窘迫综合症特征分级标准将所述患者样本集划分为ards组和非ards组;

获取xgboost模型作为初始模型;

将每个时间窗口的四项数据及时间窗口内是否发作的分类标签输入至所述初始模型进行训练,调整模型参数使所述初始模型达到准确率最优状态,得到所述监测预警模型。

具体地,获取训练用的患者样本集特征时序数据,按照重度急性呼吸窘迫综合症特征分级标准对述患者样本集特征时序数据进行分级评定,得到分类标签,对应于该分类标签,将患者样本集特征时序数据分成用于训练的若干个数据集,采用机器学习算法,如xgboost算法但不限于该算法构建模型,训练一个xgboost模型,调整模型参数使预测模型达到准确度最优的状态,如xgboost算法包括决策树数量、决策树最大深度和最小叶子节点样本权重,得到监测预警模型。

图3为本发明实施例提供的重度急性呼吸窘迫综合症预警系统结构图,如图3所示,包括:获取模块31、处理模块32和预警模块33;其中:

获取模块31用于获取icu重症患者的待预测生理体征数据;处理模块32用于将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;预警模块33用于将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

本发明实施例提供的系统用于执行上述对应的方法,其具体的实施方式与方法的实施方式一致,涉及的算法流程与对应的方法算法流程相同,此处不再赘述。

本发明实施例通过提取重症患者的四种典型生理特征数据,并进行线性和非线性的特征选择构建监测预警模型,对患者可能出现的急性呼吸窘迫综合症进行识别和早期预警,辅助医护人员及时诊治病人出现和发生急性呼吸窘迫综合症。

图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communicationsinterface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器830中的逻辑指令,以执行如下方法:获取icu重症患者的待预测生理体征数据;将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:获取icu重症患者的待预测生理体征数据;将所述待预测生理体征数据经过数据预处理、特征提取、特征标准化以及特征选择后,得到生理特征时序数据;将所述生理特征时序数据输入至预先训练好的监测预警模型,得到所述监测预警模型输出的监测预警结果,其中所述监测预警模型,是基于患者样本集特征时序数据,以及重度急性呼吸窘迫综合症在时间窗口内是否发作作为分类标签,并采用机器学习算法训练得到的。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1