基于患者生理反应的对急性呼吸道疾病综合征(ARDS)的预测的制作方法

文档序号:15575832发布日期:2018-09-29 05:30阅读:249来源:国知局

本发明涉及计算机辅助的医学诊断领域,并且具体而言涉及可用于预测ards的发作的一组整合的模型;所述模型的参数针对ards的早期检测而被选择。



背景技术:

急性呼吸窘迫综合征(ards)是一种破坏性疾病,并且其特征在于血气屏障破裂导致肺泡漫水和炎症。ards影响超过二十五万名患者,每年导致超过四百万个住院日。据估计,所有icu患者中ards占5-15%,并且死亡率约为40%,并且在出院后甚至更高。少于三分之一的ards患者是由icu医生在病床边检测到的。ards的早期检测至关重要,因为它有可能为预防和处置ards及其并发症提供更宽的治疗窗口。

vairavan等人在2014年8月18日提交的usp序列号14/379176“acutelunginjury(ali)/acuterespiratorydistresssyndrome(ards)assessmentandmonitoring”(下文称为'176)公开了一种针对ards的早期检测模型,在此通过引用并入本文。所公开的ards检测模型使用用于检测生命体征、实验室结果、通气设置等中的ards特征的基于知识和数据的模型提供了对ards风险的连续评分。

图1图示了所公开的ards检测系统10的示例实施例。该模型的示例输入包括:

临床知识源,包括:

基于医学专业人员的知识的临床知识94和规则92;

基于研究文章和其他资料的临床研究104和概率102;以及

基于现有标准的临床定义114和逻辑流112;

icu(重症监护室)前患者数据144,包括人口统计结果、病史、当前状况等等;以及

icu患者数据142,包括患者的生命体征、实验室结果、所使用的干预措施等等。

在本申请的文字和附图中,使用以下缩写/首字母缩略词。rr-呼吸率;hr-心率;asbp-动脉收缩压;adbp-动脉舒张压;alb-白蛋白;bili-胆红素;hct-血细胞比容;hgb-血红蛋白;as-阿斯匹林;pan-胰腺炎;pne-肺炎;dm-糖尿病;chemo-化疗;以及adt-入院出院流转。术语“apacheii”是基于aado2或pao2(取决于fio2)、温度、平均动脉压、ph动脉、hr、rr、钠、钾、肌酸酐、hct、白血球计数和格拉斯哥昏迷量表的计算值。

多个诊断模型90-140可以用于处理由输入数据提供的信息,每个诊断模型被配置为基于所提供的信息来确定患者的ards状态的风险评分。

图2示出了可以包括在ards检测系统10中的示例诊断模型40。诊断模型40使用基于患者的生理数据34的时间序列分析的lempel-ziv复杂度量度44、46,所述患者的生理数据34包括心率(hr)、收缩压(sbp)、舒张压(dsp)、以及呼吸率(rr)、还有患者迄今接受的处置32。处置32可以包括药物36或其他规定的干预,诸如具有高潮气体积(vt)的侵入性通气。

为了确定示例诊断模型的ards状态输出,基于这些复杂度量度44、46的值来计算50一值。该计算值可以与阈值52(以下称为“阈值处理”)进行比较,并且二元(是/否)确定是基于所述结果的;例如,如果所计算的值大于或等于阈值,则输出'是’;否则,输出“否”。

如图1中所示,来自诊断模型90-140的ards状态输出被聚合82以提供患者将经历ards的可能性(风险)的估计。在一个示例实施例中,线性判别分析(lda)或投票系统(sofali)可以用于聚合来自诊断模型90、100、110、120、130、140的预测。

如果使用线性判别分析来聚合每个诊断模型的输出以确定ards的概率/可能性,则lda可以接收直接计算的模拟值50,而不是阈值函数52的二元输出。

如果使用投票系统,则可以使用本领域已知的各种技术中的任一种来组合阈值处理后的每个诊断模型52的二元输出,包括加权平均或非加权平均,以确定ards的概率/可能性。

由聚集器82确定的概率还可以与阈值进行比较以确定是否向医务人员发出警报或其他通知,以便可以采取预防性措施或其他预防。

诊断模型90、100、120、130、140中的每个以及聚合器82(统称为“预测器”)的二元输出可以是正确的或不正确的,这取决于回顾性地发现预测是否匹配实际的或真实的结果(即患者是否经历ards('是'),或者患者没有经历ards('否'))。如果预测结果是肯定的但实际结果是否定的,则认为预测器产生了“假阳性”,并且如果预测结果为否但实际结果为是,则认为预测器产生了“假阴性”。否则,预测器被认为产生了“真阳性”(预测和实际结果都为是),或者“真阴性”(预测和实际结果都为否)。

roc(接收器操作特性)曲线通常用于表征预测器的“质量”,例如,如图3中所示,其中,图示了六个诊断模型(af)中的每个的roc,以及基于这六种诊断模型的组合的sofali投票系统(g)和lda聚合器(h)的复合roc。roc曲线将预测器针对可能的阈值范围将产生正确的阳性输出(“真阳性”)的概率对比预测器将产生错误阳性输出(“假阳性”)映射为概率。患有疾病的那些人的“真阳性”比例通常称为预测器的“灵敏度”,而没有疾病的那些人的“真阴性”比例通常称为测试的“特异性”;相应地,“假阳性”的比例等于1-特异性。

在典型的预测器中,非常高的正阈值可能产生非常少的误报,但也比较低的阈值产生更少的真阳性,对应于图3中所示的roc空间的左下区域。随着阈值的降低,预计会出现真阳性以及假阳性的数量,对应于roc空间的上部中心区域。如果阈值非常低,则预计假阳性的比例会增加,对应于roc空间的右上区域。

“无用的”预测器是这样的预测器,其产生假阳性与其产生真阳性是同等可能地,对应于图2的对角roc线210。提供roc曲线ah的预测器产生真阳性的概率比假阳性更大,并且因此是比产生roc曲线210的无用预测器更好的预测器。例如,提供roc曲线g的预测器比提供roc曲线c的另一个预测器产生更大概率的真阳性和更少的假阳性,并且因此是比另一个预测器更好的预测器。roc曲线越靠近roc空间的左上角,预测器越接近“完美”预测器(全部真阳性并且没有假阳性)。在图3中,提供roc曲线h和d的预测器被认为是比提供roc曲线a-c和e-g的预测器更好的预测器。

用于表征预测器正确预测结果能力的统计量是roc曲线下面积(auc,或auroc)。auc可以跨阈值的范围在0到1的范围内,并且表示:当提供一对病例中的一个病例具有阳性结果并且另一个病例具有阴性结果时,预测器能够正确识别阳性病例的概率。auc通常被称为测试的“准确度”。

将预测器应用于病例时使用的阈值选择通常是假阳性(“假警报”)和假阴性(“漏诊”)的可能性与这些结果中的每个的代价或后果之间的折衷。如果假设错误预测的代价或后果相同,则通常将产生roc曲线的拐点上的点的阈值选为最佳阈值。

虽然ards检测系统10提供接近90%的准确度(auc),如roc曲线h所示(auc:0.87),该准确性通过获得和评估大量患者信息来实现的,如上面的缩写词和首字母缩略词列表所示。尽管这些信息中的一部分可能很容易获得,但获取其他信息可能需要特定的测试,其中一些可能是侵入性的,或者至少不舒服。此外,一些测试可能并非在所有医疗机构都容易地获得,或者由于需求、成本或其他因素而不常用。

此外,每个预测器在任何特定时间的结果都是基于当时可用的患者信息;如果输入的特征的最近值不可用,则预测变量使用上一个可用值,并且该值可能已过时,从而导致较不准确并且可能错误的预测。

如果针对输入特征的值不可用,则诊断模型会将该缺失的特征替换为该特征的群体中值。然而,对于干预性特征而言,用它们各自的群体中值代替缺失的特征不适合,例如,潮气量或peep,因为它等于在信息可能丢失时错误地输入对患者的干预,因为事实上,可能没有施予干预。

此外,在ards检测系统10中使用的若干输入特征在一定程度上是主观的,并且其他特征可能与所采取的治疗措施有关,但是这些措施对特定患者的有效性可能是未知的。



技术实现要素:

提供一种能够以比当前所需要的显著更少的患者信息来提供ards的合理准确的预测ards检测/预测系统将是有利的。提供一种能够在ards发作之前提供ards的预测而剑星可以采取预防或保护措施的ards检测/预测系统也将是有利的。

为了更好地解决这些问题中的一个或多个,在本发明的一个实施例中,提供了一种已知ards模型的最小“修剪”版本,其关于患者的生理反应来量化ards的风险,消除了常规ards模型当前使用的更加主观的和/或治疗性的特征。这种方法提供了对ards风险的准确追踪,其仅根据患者的生理反应和可观察到的反应进行建模,并且选择决策标准以在ards发病前尽快提供阳性预测。此外,修剪过程还允许使用风险因素和产生优化性能的规则的选择性组合来针对不同医疗机构地点定制ards模型。另外,通过根据先前记录的数据提供对缺失数据的估计,可以在缺失或过期数据的情况下提供预测。

为了提供这种优化的ards系统,通过提供多个先前患者的每个患者的生理数据的时间序列、对患者是否经历ards的识别以及经历ards的每个患者的ards发作的时间来训练每个预测器。基于这种训练,确定roc曲线和roc曲线下面积(auc),抽样roc曲线下面积表征诊断模型正确识别患者是否将经历ards的能力。不同于常规ards预测器,可以基于所记录的ards的发作之前的预测时间(“预测提前时间”)来选择聚合器的阈值和每个诊断模型的阈值(如果用于向聚合器提供输出)以提供对ards的早期预测。所选择的阈值针对使用阈值的聚合器和每个诊断模型而被存储,以基于所选择的(一个或多个)阈值来提供对将来的患者的ards的早期预测。

为了补偿所需患者数据的不完整或陈旧值,基于先前患者的群体中的缺失特征的值,所述诊断模型使用针对缺失值的人造值。由于该值是人造的/估计的,因而确定并报告关于ards的聚合可能性的置信区间。

为了进一步减少诊断模型所需的输入特征,可以基于先前患者的生理数据的集合来确定每个诊断模型的输出对每个输入特征的灵敏度,并且输入特征对准确性或预测提前时间影响最小的诊断模型在诊断模型的修正版本中可以被忽略。当输入特征在特定医疗机构不可用时并且在确定上述置信区间时,也可以考虑该灵敏度确定。

此后,对于未来患者的ards风险可能基于这组减少的所需输入特征和相应的修正的诊断模型。还可以选择(一个或多个)修正的诊断模型的(一个或多个)阈值以最大化预测提前时间,或者最大化接收至少某个最小预测提前时间的患者的比例。

附图说明

将参考附图并且通过范例的方式详细解释本发明,其中,

图1图示了本申请的母申请中公开的示例ards检测系统。

图2图示了在图1的示例ards检测系统中使用的示例诊断模型。

图3图示了针对示例ards检测系统中的六个诊断模型和两个预测聚合器的示例roc曲线。

图4图示了本发明的示例ards检测系统,其使用患者生理数据来提供ards的预测。

图5图示用于确定将多个ards预测器的预测提前时间最大化的预测阈值的示例过程。

图6图示了对图4的ards检测系统进行示例“修剪”以减少每个诊断模型所需的输入特征的数量。

图7图示了对图1的ards检测系统的修剪的示例性流程图。

图8图示了对图4的ards检测系统的另一示例修剪。

图9图示了用于使用本发明的实施例来检测ards的发作的示例流程图。

图10图示了对应于本发明的ards检测系统的示例实施例的示例roc曲线。

图11图示了针对不同预测器阈值的预测提前时间的示例分布图。

图12图示了本发明的简约实施例与现有技术的ards检测系统的实施例之间的聚合ards的roc曲线的示例性比较。

贯穿附图,相同的附图标记指示相似或相应的特征或功能。附图被包括以用于说明的目的,并且不旨在限制本发明的范围。

具体实施方式

在以下说明中,为了解释而非限制的目的,阐述了诸如特定架构、接口、技术等的具体细节,以便提供对本发明的概念的透彻理解。然而,对于本领域技术人员来说显而易见的是,本发明可以在偏离这些具体细节的其他实施例中实施。以类似的方式,本说明书的文本针对如附图中所示的示例实施例,并且不旨在超出权利要求中明确包括的限制而限制要求保护的发明。为了简化和清楚起见,省略了对众所周知的设备、电路和方法的详细描述,以免以不必要的细节掩盖对本发明的描述。

图4图示了使用患者生理数据来提供对ards的未来发作的预测的示例性ards检测系统400。示例系统400包括五个诊断模型410、420、430、440和450。基于输入特征的特征的集合411-413,诊断模型410使用“模糊逻辑”来预测当前患者是否将经历ards。诊断模型420基于输入的特征的集合421-424使用“比值比(oddsratio)”测试。诊断模型430基于输入的特征的集合431-434使用“对数似然比”测试。诊断模型440基于输入的特征的集合441使用“lempel-ziv复杂度”测试;并且诊断模型450基于输入人特征的集合451使用“逻辑回归”测试。

上述模型/测试中的每个在本领域中都是众所周知的,其是用于基于先前患者的病史的回顾性分析来确定与每个模型相关联的特征的技术。上述通过引用并入本文的'0176申请提供了对这些测试的更详细的描述。

特别值得注意的是,只有生理或可观测的措施被用作示例诊断模型410、420、430、440、450的输入。为了本公开的目的,术语生理数据或生理量度包括患者的任何身体特征,包括例如年龄,性别等。将输入限制为生理量度减少了所需信息的数量,消除了主观信息,并且提供了独立于所提供的干预或药物的ards预测,除了它们对患者的生理措施的影响之外。

诊断模型410、420、430、440和450中的每个的ards状态输出可以通过将基于诊断模型的输入的计算值与和每个诊断模型相关联的阈值进行比较来确定,或者在不执行阈值处理的情况下通过提供连续变量来确定,如上面关于图1-3所详细描述的。来自不同诊断模型的ards状态被聚合以提供当前患者将经历ards的概率p(ards)。在图4的示例实施例中,使用线性判别分析(lda)作为聚合器490;因此,每个诊断模型的输出可以是由诊断模型产生的计算值,而不需要阈值处理。可以使用其他聚类技术,例如包括,诸如sofali之类的投票技术,其通常在阈值处理之后使用每个诊断模型的二元输出。聚合器490可以被配置为基于确定的聚集值与阈值的比较来提供ards发作的二元是/否的预测。

由于对阳性ards预测的提前通知对可用于ards及其并发症的预防和治疗的有效性具有显著影响,因而选择聚合器490中的阈值和诊断模型410、420、430、440、450中使用的每个阈值(如果有的话),以最大化ards发作之前的预测提前时间。

图5图示了用于确定优化多个ards诊断模型410、420、430、440、450和聚合器490的预测提前时间的预测阈值的示例过程。为了便于参考,因为诊断模型和聚合器提供对ards的预测,所以术语“预测器”在本文中用于指代诊断模型410、420、430、440、450和聚合器490。在该示例实施例中,经由循环510-519独立地分析每个预测器。

在循环520-529中,当应用于与循环530-539中的先前患者相关联的生理数据时,针对多个可能阈值中的每个评估预测器的性能。针对这些先前患者中的每个的实际或真实结果(ards,无ards)以及ards的发作时间都是已知的。在540处,将每个先前患者的生理数据的时间序列应用于当前预测器,并且当每个新数据项由预测器处理时,在550处获得预测。如果在555处预测ards,则在560处记录针对该患者的该预测的时间和实际结果,包括ards发作的时间。

在该示例实施例中,一旦提供第一阳性预测,就保持ards发作的预测;也就是说,随后的阴性预测不会改变这种阳性预测。因此,在接收到阳性ards预测并且记录预测时间和真实结果(以及时间)之后,在539处终止对该先前患者的数据的处理并选择下一个先前患者。

如果在565未报告阳性ards预测并且达到先前患者数据的结束,则在539选择下一个先前患者。

在处理了最后的先前患者的数据之后,循环530-539终止。在该点,已经记录了使用当前阈值的所有阳性预测以及与每个预测相对应的真实结果。对于那些经历过实际ards发作的先前患者,ards发作时间与阳性ards预测时间之间的差异提供了使用当前阈值针对这些先前患者中的每个的预测提前时间。

基于记录的阳性预测结果和实际结果,可以确定真阳性和假阳性的数量,从其可以计算针对当前阈值的真阳性率tpr和假阳性率fpr。该阳性率的对提供了在roc曲线上对应于该阈值一个点。在570处记录该对,这有助于创建roc曲线和相应的auc。针对每个阈值的真阳性率和假阳性率的该配对也有助于选择阈值,其最大化对于确定可能经历ards的患者具有提前警告的可能性,如下面进一步详细描述的。

当在529处处理了可能的阈值的集合之后,可以在580处确定并呈现针对该预测器的roc曲线和auc。

针对图4的ards检测系统400的五个诊断模型410、420、430、440、450和聚合器490的示例性roc曲线的集合在图10中进行了图示。如图10中所示,聚合器490实现了auc为0.87的roc曲线f,其与图3中所示的传统ards检测系统10的roc曲线h相当,但是图4的检测系统400使用显著较少的输入数据项目,并且不依赖于在患者的处置期间施予的干预或药物。

在590处,如果当前预测器是聚合器490或在阈值处事之后向聚合器提供二元值的诊断模型410、420、430、440、450,则选择当前预测器的阈值用于将来患者。使用所记录的针对使用给定阈值的真阳性预测中的每个的预测提前时间(在560),可以选择使针对当前预测器的预期预测提前时间最大化的阈值。可以使用各种技术和标准来选择该阈值。例如,至少具有给定的最小提前期的先前患者的数量/比例可以用作选择阈值的标准;或者,可以选择提供最长平均提前时间的阈值,或者可以选择提供最长中值提前期的阈值,等等。

在示例实施例中,可以使用累积分布函数(cdf)来为每个测试选择阈值。示例累积分配函数在图11中图示,对于三个阈值中的每个,其示出了关于在ards发作之前的阳性预测时间(时间=0)的阳性预测的分布。例如,cdf1120示出大约20%(1121)的阳性预测在ards发作前至少18小时发生,40%(1122)的阳性预测在发作前至少1.5小时发生,并且大约65%(1123)的阳性预测在ards发作时或发作前发生。利用提供cdf1120的阈值,中值预测提前时间为大约4小时。较低的阈值将产生较高比例的早期检测,如cdf1130所示;并且较高的阈值将产生较低比例的早期检测,如cdf1110所示。

虽然较低的阈值将提供对随后发现经历ards的患者的较大比例的早期阳性识别,但这个较低的阈值也会产生对后来发现没有经历ards(假阳性)的患者的较大比例的阳性识别。一般来说,由于不识别可能发生ards的患者(假阴性)的后果远大于错误预测患者可能经历ards的后果,因此相对较大比例的假警报(例如20-30%)可能是可以接受的。

这种高的假警报率也是可以接受的,因为在监测先前的患者期间,当他们的生理状况指示ards可能时,将可能己经应用一些保护性或预防性处置。当对这些患者应用保护性或预防性治疗时,这些处置可能已经有效地预防了这些患者中至少一部分患者发生ards。虽然这些患者,他们如果没有接受处置将会经历ards,可以被(一个或多个)预测器正确识别,但是这些处置对预防ards有效的事实这些患者被认为是“假阳性”的预测。

本领域技术人员将认识到,取决于应用于预测患有ards的患者的保护性或预防性处置的性质以及这些治疗的预期有效性,可以使用更高或更低的假警报比例。在一些实施例中,对于每个特定预测器,假警报的不同比例可以是可接受的,这取决于例如在该特定预测器指示ards的肯定预测的情况下可能应用的特定处置的侵入性。

如上所述,在570处,针对每个预测器的每个阈值记录真阳性率(tpr)和假阳性率(fpr)。为了提供ards的真阳性预测的最大比例,选择产生等于最大允许假阳性率的假阳性率的阈值。

给定允许误报率,在对所有预测器进行处理以选择阈值后,该阈值使每个预测器的正确识别为可能经历ards的患者比例最大化后,该过程终止于519。

通过消除不显著影响诊断模型质量的数据项,可以进一步减少所需的输入数据项。图6图示了对ards检测系统400进行示例“修剪”610以减少每个诊断模型所需的输入特征的数量。图7图示了用于例如可能在修剪块610中使用的、对ards检测系统400进行修剪的示例性流程图。术语“预测器”在图7中使用,因为如下面进一步详细描述的那样,还可以评估对聚合器的输入以潜在地消除一个或多个诊断模型的输出。

循环710-719针对每个输入特征独立地评估每个诊断模型。本领域的技术人员可以认识到可以执行多变量和/或相互依赖的评估。例如,如果确定特定输入特征对特定诊断模型具有显著影响并且不能从该诊断模型中消除,那么该输入特征可以被其他诊断模型考虑忽略,因为其从其他诊断模型中消除将不会减少诊断系统400所需的总输入数量。

在循环720-729内,诊断模型对每个输入特征的灵敏度在730处使用先前患者的多个生理的和可观察的量度来评估,对于所述患者已知ards的实际发作或非发作。

用于确定过程对输入特征的值的敏感性的技术在本领域中是公知的,并且通常可以表征为统计技术或经验技术。统计测试包括,例如,方差分析(anova),其中,确定每个输入特征对感兴趣输出的方差的贡献。可以预期显著影响感兴趣输出变量的输入特征会显著影响感兴趣输出的值。

例如,经验技术可能包括“假设”分析:“假设”输入特征具有最小值:感兴趣输出将如何变化?;“假设”输入特征具有最大值:感兴趣输出将如何变化?;等等。

如果诊断模型允许在不改变诊断模型的内部的情况下省略输入变量,则经验性评估可以包括仅在没有输入变量的情况下再处理先前的患者数据并且观察感兴趣的输出如何变化。

在示例修剪元素610中,存在两个感兴趣的输出:诊断模型的auc和预测提前时间。在730处,将针对每个输入特征的auc和预测提前时间的灵敏度进行比较以关于这些感兴趣输出中的每个对输入特征进行排序。预测提前时间可以通过发作前的预测的平均或中值时间的来测量,或者可以通过给定的最小预测提前时间之前的预测的比例来测量,等等。如果auc和预测提前时间都对输入特征的值相对不敏感,则可以在740处从当前检测器中消除该输入特征。

可以使用不同的标准来定义每个auc和预测提前时间的相对不敏感性。例如,auc小于5%的变化可被认为表示auc对输入特征的相对不敏感性;但是,因为预测提前时间可能对患者的恢复至关重要,所以在输入特征被认为对预测提前时间的影响不大的情况下,可能需要预测提前时间的变化小于1%。在示例实施例中,可以基于诊断模型对每个输入特征的灵敏度对输入特征中的每个进行顺序排列,并且可以选择提供最高灵敏度的“前n个”输入特征用于修正的诊断模型中。在替代实施例中,可以基于获得每个输入特征的相对成本或侵入程度来使用加权排名。也就是说,如果获得特定输入特征相对容易,则保留该特征的标准可能低于保留难以获得的输入特征的标准。

在从诊断模型中消除了提供低灵敏度的输入特征之后,诊断模型可以在750处使用减少的输入特征集来再训练以优化其性能,并且可以在760处确定该修正的诊断模型的roc和auc。特别值得注意的是,在770处,如果诊断模型的阈值处理后的二元输出被用作诊断模型的输出,用于随后的聚灰或者用于从聚合器发出警报,则使用例如上面关于图5详述的过程来评估修正后的诊断模型以识别优化预测提前时间的阈值。

在所有诊断模型都被训练之后,对于那些在阈值处理之后提供二元输出的诊断模型,提供了优化预测提前时间的阈值,该过程终止于719。

如图6中所示,仅需要bili和ph输入特征的经修正的模糊推理诊断模型410'取代了需要全部输入411-413的原始诊断模型410。仅需要呼吸率(rr)的经修正的比值比诊断模型420’取代了需要所有输入421-424的原始诊断模型420。需要ph、pao2、as、pan、pneu、脓毒症、休克和创伤输入特征的经修正的对数似然比诊断模型430'代替原来的需要所有输入431-434的诊断模型430。

发现lempel-ziv诊断模型440和逻辑回归诊断模型450分别要求所有原始输入441、451,并保持不变。也就是说,发现诊断模型440、450的auc或预测提前时间或两者分别对输入特征441、451中的每个敏感。

可以看出,简化ards检测系统400'需要比ards检测系统400少得多的输入,具有对预测质量(auc)或预测提前时间的极小的影响(如果有的话),如下面进一步详述。

如上所述,通过对聚合器490进行图7的修剪过程,可以实现输入要求的进一步降低。也就是说,可以确定对于聚合器490的每个输入由聚合器490提供给的auc和预测提前时间的灵敏度,并且可以消除对auc和预测提前时间具有不显著影响的输入。人们将认识到,去除对聚合器490的输入的结果/好处是消除了提供该输入的诊断模型及其所有输入特征。

图8图示了对图4的ards检测系统的另一示例修剪。使用先前患者的生理和可观测量以及他们的实际ards结果,确定来自可能性诊断模型420'、lempel-ziv诊断模型440和逻辑回归诊断模型450的输入对聚合器490的auc或预测提前时间具有不显著的效果,并且这些诊断模型作为对ards检测系统400”的修正聚合器490'的输入而被消除。

图12图示对应于图3的现有技术综合模型的roch(图4中的曲线h)以及图8的简约模型的rocj的示例roc曲线h和j。可以看出,本发明提供的简约模型提供了与现有技术综合模型相当的预测性能。

图9图示了用于使用本发明的实施例来检测ards的发作的示例流程图。

在910处,接收患者的生理数据。该数据通常是患者的最新数据,但是如果给定的诊断模型使用比较值(例如数据元素的值的变化),则还可以提供患者的时间序列数据。在循环920-929中,该数据或该数据的子集被提供给每个诊断模型以获得对患者是否可能经历ards的预测。

在930处,评估数据以确定可用患者数据是否足以提供诊断模型所需的数据。如果针对该患者的数据不可用,则在930处提供人造值或预测值。该人造值可以基于与当前患者具有相似特征的先前患者的数据值,当前患者的先前数据值,大量人口的平均值或其他来源获得。置信区间可以基于与该值相关联的估计方差够与该人造值相关联。方差可以基于数据值在选择人造值的群体中的分布,基于由医学参考提供的关于特定生理特征的变化,基于数据值的已知可行范围,或其他技术。

在940处,诊断模型接收患者数据和人造数据(如果有的话)并产生ards预测。该预测可以是基于针对该诊断模型的基于输入数据的计算量度是高于还是低于给定阈值的二元(是/否)预测。给定的阈值可能已被选择为使真阳性预测最大化的比例,同时允许给定比例的假阳性预测。任选地,以及预测可以是随后与其他数值合并并且与合并阈值进行比较以提供聚合的二元预测的数值。

在所有诊断模型都己基于患者数据提供预测之后,在950处提供总计预测。本领域技术人员将认识到,如果聚集器被认为是循环920-929中的预测器,则该步骤950可以仅对应于应用于该“最后”预测器的步骤930-940。

然后从系统输出聚合预测,作为患者可能经历ards的计算概率,和/或在预测输出大于选定阈值(即,如果ards的预测是阳性的)的情况下作为警报通知。

如果任何人造数据被用作诊断模型的输入,则诊断模型的输出可以是基于与人造数据相关联的方差的多个预测。例如,如果方差是常规计算方差统计量,则诊断模型可以被提供以等于人造值加上方差两倍的第一输入以及随后的等于人造值减去方差的两倍(“两个西格玛”值)第二输入以提供两个对应的预测。在其他情况下,诊断模型的输入可能是数据值的已知可行范围的程度。在其他情况下,诊断模型的输入可能是人造值加上或减去人造值的给定百分比。本领域的技术人员将认识到,也可以使用表示数据项可以假定的值范围的其他输入值。

假设不同的与方差相关的输入值提供多个不同的预测,则将这多个预测提供给对预测进行组合的聚合器,并且所述聚合器处理多个预测中的每个以确定假设数据项可能产生了这些预测中的每个的预测输出。如果聚合器的输出根据各个诊断模型的不同方差相关输出而有所不同,那么两个输出都可以与缺少哪个输入的标识一起呈现,从而导致冲突的输出。因此系统的用户被告知哪个输入将用于消除预测中的模糊性。

如果不同的与方差相关的输入值全部产生相同的预测,那么将该单一预测作为预测器的输出提供,而没有与预测相关联的方差。这适用于各个诊断模型以及聚合器。

虽然己经在附图和前面的描述中详细示例和描述了本发明,但是这样的示例和描述应当被视为示例性或示范性的,而非限制性的;本发明不限于公开的实施例。例如,在前述修剪过程中,可以执行多变量修剪,其中,每个诊断模型的灵敏度是针对输入特征的组合进行评估的。也就是说,可以发现模型对输入特征的对的灵敏度远远大于任何单独的灵敏度,这可以使得能够消除其他输入特征,只要这对特征没有被消除。

另外,可以在一个实施例中操作本发明,其中,所描述的步骤可用于优化用于检测不同临床事件(例如急性肾损伤或急性低血压)的诊断模型的不同集合。

本领域技术人员通过研究附图、公开以及权利要求书,在实践请求保护的本发明时,可以理解和实现对所公开实施例的其他的变型。在权利要求中,“包括”一词不排除其他元件或步骤,并且词语“一”或“一个”不排除多个。单个处理器或者其它单元可以实现权利要求书中记载的若干项的功能。尽管在互不相同的从属权利要求中记载了特定措施,但是这并不指示不能有利地使用这些措施的组合。计算机程序可以存储/分布在适合的介质上,例如与其他硬件一起被提供或作为其他硬件的部分被提供的光学存储介质或固态介质,但是计算机程序也可以以其他形式分布,例如经由因特网或其他的有线或无线的电信系统分布。权利要求书中的任何附图标记不应被解释为对范围的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1