用于识别诊断为充血性心力衰竭危重病人的方法和系统的制作方法

文档序号:6412226阅读:459来源:国知局
专利名称:用于识别诊断为充血性心力衰竭危重病人的方法和系统的制作方法
技术领域
本发明涉及数据库处理技术,更具体地说,本发明涉及用不同的数据库处理技术来识别具有预后不良的高危充血性心力衰竭的病人。
充血性心力衰竭是起泵作用的心肌终末器官衰竭的症状描述。心脏泵血衰竭导致身体的待泵血区域出现液体潴留或充血。在右心室衰竭的情况下,结果是出现全身性水肿,最初经常表现为在外周部位(例如,踝)出现下垂性水肿症状。在左心室衰竭的情况下,肺中出现液体潴留并表现为肺水肿,它的首要症状是呼吸短促。由于左心的相对大小和为关键器官提供体循环的生理功能,因此左心衰竭更常见且更重要。
心力衰竭(低输出量衰竭)主要的潜在诱因是导致心肌梗塞和心肌坏死的冠状动脉疾病。其它的病理学因素包括心肌病和心肌炎,瓣膜机能障碍,代谢和内分泌异常(例如,甲状腺机能减退,酒精,Mg缺乏等)和心包异常。
1992年,据估计充血性心力衰竭(CHF)流行率约是普通人口的1%,占年龄超过65岁的6.8%,且为管理照顾人口的0.2%-0.4%(在老年成员有效恢复健康之前)。以确切数字计算,在美国这大约相当于276万病人。通过严重程度分组获得的估计数为,10%的病人为重度,40%为中度,其余的为轻度。预计诊断为CHF的新病例将增加29%,即从1992年的每年495700例到2007年的642000例。这种增加是由于以下几个因素,包括人口普遍老龄化,以及医生认识水平的提高和诊断技术的改进。
在管理照顾计划(MCOs)中注册的老年人的数量已经有了显著的增加。在一些计划中,老年人可占总注册人数的50%。此外,截止到1995年底,计划在重危医护方案中注册的老年人数增长28%,达到230万人。由于医疗改革议案提前通过,这将促进老年人加入健康计划,所以重危医护方案中的注册人数可望继续增长。此外,当前所提供的“50/50”的服务迫使MCOs为每个已注册医疗方案患者而去注册一个非医疗方案的病人,这种情况可能将被改变,这会使计划容易集中于注册医疗方案的病人。
随着可选择的治疗方案的增加,患CHF的病人可存活更长时间。这就是说,对于总是增长的大量病人来说,MCOs需要能够有成本效益地管理CHF。由于其它几个因素,这是很明显的。按照1992年保健筹资局(HCFA)所说的,CHF是最昂贵的保健难题。花费在住院上的费用是约54.5亿美元,或是诊断相关部门(DRG)总预算的4.8%。CHF也是65岁和年龄更大的人单个最常见的住院原因。正如前面提到的,预计普通人口的1%有CHF,占老年人的6.8%。有意思的是,甚至在不能使老年人有效康复的MCOs中,CHF可占总MCO医疗失败率的2%。
通过三种病理生理学机理CHF的治疗主要是症状性治疗1.减少后负荷—减小心脏泵血的阻力。尽管在严重情况中使用主动脉对抗搏动法,但这主要是通过药理学而实现。
2.影响心收缩力的状态—通过直接作用于心肌的药剂(例如,强心苷)来改善心脏效率,通过减少室的大小以降低施氏平衡以及改善冠状动脉中的血流量。
3.减少前负荷—减少进入心脏的血流量。通过应用药物(利尿药,血管舒张药),限定饮食(限制盐和水)和物理方法(交替止血带,减少血量)可进行此治疗。
因此,主要的药理性措施由三类基本药剂组成,它们是利尿药,强心苷和血管紧张素转化酶(ACE)抑制剂。此外,近来的研究已经表明应用具有抗氧化剂作用的β-阻滞剂可获得好的疗效。最后,目前的心脏移植术可为危及生命的晚期心力衰竭提供一种替代疗法。
如上文所概括的,所需照顾的复杂性表明需要实质性地将医生和病人纳入多种条件的最佳管理中,此条件包括适当选择和应用药理性措施以及改变个体生活模式以获得最佳的治疗结果。
显然,任何CHF疾病管理方案的总目的是提高患CHF的病人治疗和预后的质量,而同时节约开支。达到此目的的一个重要步骤是识别预后不良的高危病人并确保对这些病人进行“最佳实施”的治疗。因此,确实需要识别因CHF而住院的高危病人。
本发明包括一种由计算机执行的方法,它用于从存在于一种请求数据库中有关病人的信息中形成一种识别诊断为充血性心力衰竭危重病人的模型,所述的方法包括以下步骤1)以预定的标准为基准,在请求数据库中处理病人的信息,从而发现并提取一组充血性心力衰竭病人的请求信息;2)使用在请求数据库中提供的信息来定义与充血性心力衰竭相关的事件;3)处理所提取的请求信息和定义的事件以创建含有事件等级信息的文件;4)定义一种提供时间范围的时间窗,从其中判定是否在随后的处理中考虑该事件;5)将一组变量定义为潜在的预报器;6)使用时间窗和该组变量来处理事件等级信息,从而生成一种分析文件;和7)对分析文件进行统计分析以生产一种预报模型,所述的预报模型是该组变量子集的函数。
本发明的另外一个方面包括一种由计算机执行的方法,它应用所生成的模型识别诊断为充血性心力衰竭的危重病人,所述方法包括的附加步骤是将预报模型用于被处理的请求数据库以识别并输出列有每个患者可能预后不良的文件。
在看相关的附图时,可通过下面的详细说明更好地理解本发明,其中附

图1 A是说明本发明典型全过程的高等级流程图。
附图1B是说明本发明全过程应用的高等级流程图。
附图2是说明适合与本发明一起使用的三种典型资源的高等级流程块图。
附图3是表示典型格式的数据结构图,其中将来自附图2的信息存储在研究数据库中。
附图4是数据结构图,它表示附图1所示过程中所生成的事件等级文件的典型格式。
附图5是表示分析文件典型格式的数据结构图,所述的分析文件(部分)产生于附图4中所示的事件等级文件和附图1中所示的过程。
附图6A是解释本发明中使用的分析和预报范围概念的简明磁泡图。
附图6B是表示一级典型时间窗示意图的时间一线图,所述的典型时间窗图适用于处理附图4中所示的事件等级文件的(部分)数据。
本发明包括在预定的充血性心力衰竭病人的人口中识别那些预后不良的高危病人的设备和方法。对这些高危病人的识别作为尝试中的最初阶段,以预防和/或改善患者的预后,此尝试例如为靶向干扰。
最初,应用一种或多种信息来源以识别原始群体的充血性心力衰竭病人。来源实例包括诸如医生,医院和药房这样的健康照顾提供者,它们全都保存病人的记录。然而,每个这些提供者的单独记录是分散的,难以利用,和/或有许多不同的格式。
另一方面,含有这类信息的更广泛的来源存在于任何给定的资金提供者的健康照顾请求记录中。
现在转到附图,附图1A是说明本发明典型全过程的高等级流程图。正如附图1中所说明的,接受“原始”请求信息并将它存储于由流程块110代表的数据库(例如,DB2格式)中。在请求处理中,在此“原始”信息的数据库可以应用之前,通常进行一些预处理(步骤112),它可以包括删除请求,恢复多重请求等等。这种预处理步骤的输出(由流程块114代表),在此典型实施例中,是一个目前以SAS格式存储的“更清楚”的数据库。
SAS是一种公知的格式,并且它是SAS研究所(北卡罗来纳,Cary的公司)生产的软件包。应该指出的是在数据的存储和处理中可以应用其它数据处理和存储格式,此格式可为本领域技术熟练人员所惯用的。
还应指出在SAS/STAT用户指南,版本6(1990年第四版,第一和二卷)和SAS语言参考资料,版本6(1990年第一版)中对SAS的格式,编制程序技术和功能作了更完整的描述。由于它们的关于SAS语言,SAS编制程序,功能和格式的理论,在此引入这两本书作为参考。
此外,将用于作为本发明—部分的信息处理的SAS子程序应用于计算机操作,它可在计算机上执行并可存储于诸如磁带,磁盘,CD ROM等存储介质或其它适宜的介质中,以利于储存和/或运输。然后可以将此存储的软件与计算机一起使用,例如PC机。
尽管资金提供者的请求记录含有重要的信息,但它可能不是以一种可应用于有效分析的方式编排的。所以,下一步是进行另一个由流程块116代表的处理步骤(例如,筛选充血性心力衰竭病人,年龄等),从而将“原始”数据转换成一种更合适和更有用的数据库。即,从处理(例如,抽取)步骤中输出的数据是“原始”信息的子集并代表最初的充血性心力衰竭病人的整体,进一步处理在此基础上进行。
下一步是对最初的充血性心力衰竭病人整体进行一种“质量检验”,这一步是任选的。该步骤在某种程度上带有主观性。此处理步骤(由流程块118代表)应用中间输出文件对抽取的信息进行精炼,这是通过(例如)检验来观察是否在抽取的信息中存在不平衡而进行的。这一步基本上是一种普通的感觉检验,可以根据需要将此步骤进行多次以确保数据库数据的完整性。在这一点上,数据库数据存在于请求等级上。
存在于请求等级的信息以原始数据元的形式提供了各种信息。通过将信息重新格式化形成一种事件等级格式,下一处理步骤(由流程块120代表)则从请求等级数据中创建新文件(例如,原始文件1和原始文件2)。
在此之前,使用由请求信息提供的可用的原始数据元和有关充血性心力衰竭的临床知识两者的配合来定义与充血性心力衰竭有关的一组事件(例如,医生门诊检查充血性心力衰竭)。随着这些事件的定义,应用请求等级信息创建基于事件而不是基于请求的新文件。使信息成为事件等级格式是本发明的一个重要方面,因为在其它情况中,它允许在随后的分析中增加灵活性。
正如流程块122所描述的,对事件等级数据进行进一步处理以生成一种分析文件。尤其是使用代表可变时间窗和多个变量的输入信息来进行此处理。时间窗输入限制时间段,其中要考虑来自原始文件的事件。这就是说,将时间窗用于识别分析范围和预报范围,在此将分析范围的活动性用于预测预报范围中的一些预定结果。用于分析的变量的选择(包括非独立的和独立的)是影响最后预报模型准确度的一个重要步骤。非独立变量代表所需结果(即,一种所预测的预后不良的结果);而独立变量代表预报器。对于不同的时间窗调整以及不同变量的修改来说,通过输入参数可以容易地对这个处理步骤(步骤122)重新编制程序。在该步骤中生成的分析文件是一种可以通过成员将它们分成若干部分的成员等级文件。
掌握了分析文件,从而确定了用于识别高危子组的模型和技术。这就是说,正如由步骤124所代表的,将分析文件用于展开由一方程式所代表的识别技术,此方程式将编入上述处理步骤的初始变量合并为一个子集。所得子集是可最好地反映与预后不良的关系的那些变量,从而使健康照顾资源(例如,资金)能够得到实质性的应用。应当指出的是,因为变量可以明显地影响分组识别的准确度,所以初始和最后变量的确定是本发明的一个重要方面。
以多种应用统计技术的方法可以将上述识别模型(步骤124)展开。这种用于产生此模型的在本发明典型实施方案中使用的技术是多重逻辑回归。
附图1B是解释本发明应用的典型过程的高等级流程图。由于已经展开了此模型(如附图1A中所表示的),可以将它用于更新的请求数据(步骤132)或其它充血性心力衰竭病人的数据库(例如,其他保健提供者的请求信息),以便识别诊断为充血性心力衰竭的危重病人(步骤134),同时使各种类型靶向干扰对危重病人进行适当的处理并使健康照顾资源获得最大限度地有效分配。
尽管下面说明和描述了本发明识别充血性心力衰竭高危病人的不良预后的方法和系统的特殊实施例,但是并不要将本发明限制于所示的具体内容中。相反,可以在与权利要求相同的内容和范围内且在不脱离本发明实质的情况下对具体内容作不同的修改。
正如所提到的,将本发明用于识别有预后不良的充血性心力衰竭的高危病人。这种高危子群的识别是能够尝试不同处理技术(例如,靶向干扰)中的第一步。
最初,需要用于识别充血性心力衰竭病人的总体的信息来源。含有这类信息的广泛资料来源存在于许多资金提供者的保健请求记录中。正如所公知的,对于付款/偿付来说,接受和处理对药物、医生和医院的请求。在本发明典型的实施方案中,将这种请求信息输入一种基于资金提供者计算机系统(没有显示)的DB2数据库中。
附图2是解释适合与本发明一起使用的三种典型信息来源的高等级流程块图。正如附图2中所解释的,这类提供者的请求信息一般包括三种资料来源药物请求(Rx)210,医生(DR)请求212,和医院(HL)请求214。正如代表请求信息的流程块上所列出的,许多类信息可以从各自的请求信息中得到,所述的请求信息包括药物代码,医生姓名,诊断代码,程序,不同日期和其它重要信息。许多这类信息使用代码作为参考,诸如药物代码,程序代码和疾病代码。附录I-XIV提供了与本发明一起使用的不同代码的典型排列。对于本发明的处理目的来说,这些代码选自大量资料来源的代码,并且随着本领域技术人员将采用它,可以将这些代码进行修改以包含/除去认为在不同处理阶段更有用/较无用的代码。
还应注意的是,在健康照顾业中(诸如在美国所实施的),用于请求信息中的各种代码表示所请求的程序,治疗方法,诊断,药物等。对于本发明的典型实施方案来说,所选择的代码显示于附录I-XIV中。这些代码可以在美国医学会(1995)的医生当前程序术语(CPT)和St.Anthony的ICD-9-CM代码手册(1994)中找到,由于它们的代码理论和代码来源,在此引入这两本书作为参考。因为本领域技术人员乐于应用它,适合与本发明一起使用的任何代码组(代表不同的程序,治疗方法,诊断,药物等)已经足够。有关这类代码的内容贯穿在本说明书中。
DB2数据库代表需要处理的“原始”数据元的来源。处理这种原始数据的第一步是进行数据完整性检验(例如,删除或恢复请求)。接下来,将数据按程序装入一种“研究”数据库。该研究数据库是一种SAS格式的请求等级数据库。
对于每个Rx,DR和HL请求来说,包含在研究数据库中的记录的典型格式在附图3中表示。正如附图3所示,请求从请求1排列至请求x,同时也存在关于所请求的特殊服务提供者(例如,Rx)适宜的信息。
一旦成为SAS格式,SAS程序就会处理信息以便1)识别有充血性心力衰竭的病人(步骤116),2)将请求等级信息处理成事件等级信息(步骤120),3)使用预定的变量和时间示意图来生成用于分析目的的分析文件(步骤122)和4)创建预报模型,作为最能反映预后不良的关系的那些变量的函数(步骤124)。
应提到的是,从统计学观点来看,展开来自数据集预报模型的一个重要的需要考虑的问题是样本的大小。为了使预报模型具有最高的完整性,样本的大小是一个重要因素。正如背景技术中所述,据报道充血性心力衰竭的流行率约为1%;然而,所需可用于确定预报方程的样本大小取决于变量间联系的大小。因为最初不知道这些联系,所以开始需要包括在任何个体计划中的所有病人。第一步为抽取有充血性心力衰竭的病人(步骤116),即用不同的参数来确定那些患者符合所考虑的CHF病人的原始总整体的要求。
例如,在本发明的典型实施方案中,仅有下列情况的病人是合格的 1)连续在资金提供者处注册6个月或更长时间和2)他/她的第一次CHF请求或用与CHF有关的药物治疗是在30岁或年龄更大时。当然,这些标准是典型的例证,而且可以将它们进行修改,使符合要求的注册时间是12个月或3个月,或个人年龄必须在18岁。在本发明典型实施例中,抽取请求步骤(步骤116)抽取病人的所有请求资料,这些病人或者具有CHF适宜的代码(见附录I)或者用一种与CHF有关的药物(见附录XIV)治疗。
在抽取请求步骤后,进行请求的调整和完整性检验(步骤118)。为了进行这一步骤,从上述定义的数据集中生成中间输出文件,它含有用于处理目的的信息。在本发明的典型实施例中,为了复查而产生用于下列项目的信息,以确定中间数据文件中的数据是否与常用的临床知识和经验以及关于事件频率的文献证据相一致。
A)首先,生成成员注册期间数量的频率计数。然后,对于至少有6个月多次注册期间的成员来说,需要确定在每次注册期间是否有CHF的诊断。因此,需要排除没有CHF诊断的注册期间,并且对于在多次注册期间中有CHF诊断的成员来说,仅保留含CHF诊断的最近的注册期间。
B)对于所有剩余成员的这一注册期间来说,要识别整个注册过程中成员遇到的总成本(ALL COSTS)。将总成本的完整程序单变量分别提供给每个计划和一起提供给所有的计划。应指出的是“程序单变量”是一种生成描述性统计(例如,平均值,标准差等)的SAS程序。
C)从上述确定的总成本中,特别需要识别心血管(CV)成本。在进行这一步骤的过程中,如果来自DR或HL文件的请求在第一或第二位置上带有任何CV ICD-9代码,那么认为成本是CV成本。如果来自Rx文件的请求是来自治疗等级04 000,那么将它看作为一种CV请求且将成本看作是CV成本。也可以将CV成本的全部程序单变量分别提供给每个计划和一起提供给所有计划。
D)特别需要从CV成本中识别CHF成本。如果来自DR或HL文件的请求在第一或第二位置上带有任何CV ICD-9代码,那么认为成本是CHF成本。也可以将CHF成本的全部程序单变量分别提供给每个计划和一起提供给所有计划。
E)对于剩余的所有成员注册期间来说,单独和一起计算每个计划的总成员月数。在进行这一步骤中,考虑在任一月中注册的成员,此月需要注册至少一天。对于这一点,将全部程序单变量分别提供给每个计划和一起提供给所有计划。
F)最后,将特有成员记数提供给在剩余注册期间内的所有患者状态码=20。需要指出状态码=20表示已经死亡或没有恢复。
应注意的是,有关成本计算,在本发明的典型实施方案中应用下列原则a.将在每个请求的基础上的住院病人的住院,急诊服务,医生/门诊病人和其它医疗服务的成本看作总支付+总余额+总储备+总扣除(AMTPAID+AMTCOPAY+AMTRESERVE+AMTDEDUCT)b.将药物成本看作总支付+总余额(AMTPAID+AMTCOPAY)还应指出,为了使成本准确,还应注意将下面的规则用于本发明的典型实施方案。
1.仅因CHF住院可以生成其它事件。
2.医院成本包括所有的Rx,治疗程序和医生的费用。
3.医院门诊检查可以生成成本(包括在医院成本中)设置为零的Rx和程序事件。
4.医院门诊检查不能生成单独的医生门诊检查事件。
上述用于对数据完整性进行初级评价的信息是典型的例证,并且可以对它们进行修改以包括/除去所示的在本发明范围内更有用/较无用的参数。
使用这一信息,对CHF病人的原始整体进行“质量检验”,以确保由于不平衡的输出信息而使最后的结果(即,预报模型)不会出现不合理的歪曲。通过(例如)检验以观察是否不平衡存在于所抽取的信息中,此处理步骤(流程块118)使用中间输出文件可使抽取的信息得到精炼,否则此不平衡可以破坏预报模型的完整性。在典型的实施方案中,通过检查中间文件手工进行步骤118。然而,预计通过使用不同的阈值可以将这种信息自动地进行处理而发现潜在的不平衡。
根据认为与接下来的处理目的相应的各种预定标准抽取和精炼请求等级信息后,此信息则转换成一种事件等级格式。
为了提供处理的灵活性,尤其是在对时间窗进行分析中,进行上述第二步骤(即,将请求等级信息转换成事件等级信息,步骤122)以生成两种原始数据文件,分析文件可据此文件而产生。
在本发明的典型实施力案中,原始数据文件1是一种成员等级文件并含有静态性质(即,没有时间敏感性)的所有数据,诸如1)成员姓名,2)出生日期,3)性别,4)首次可用的注册日期(即,数据集或注册日期的开始)5)注册的最后数据(即,数据集或注册的最后日期的结束),6)第一次CHF诊断的日期(在任何位置中的ICD-9代码),7)最后一次CHF诊断的日期(在任何位置中的ICD-9代码),8)首次因CHF住院的日期,9)最后因CHF住院的日期,10)首次糖尿病事件的日期(治疗等级081xxx或任何位置中的ICD-9代码250xx),11)首次节律障碍事件的日期(治疗等级047xxx或任何位置中的ICD-9代码426xx-427xx),12)首次呼吸疾病事件的日期(治疗等级151xxx或任何位置中的ICD-9代码490xx-496xx),13)病人状态码=20的日期。
原始数据文件2是一种事件等级文件,它带有通过成员和事件按年月日期安排的每个事件的记录,在本发明中此事件日期是按时间先后顺序排列。
应当指出的是,一个事件,有时称为一个事件,它是一个基于临床知识,被认为与CHF相关的事件。从请求中得到可用的原始数据元的有关内容后,可以从数据元中直接或间接地定义一组事件,其中事件以单个数据元,组合的数据元为基础或来源于单个或多个数据元。
附图4是一种典型的事件列表和原始文件2(一种事件等级文件)的格式。
关于附图4,在本发明典型的实施方案中,为考虑不同的事件而确立下面典型的基本原则I.将一种具有从至少一天开始并通过至少一天时间和具有04位置码的请求看为一种住院事件(用第一和第二个ICD-9代码)。注意位置码用于区别发生所考虑的服务的位置(例如,急诊室,医生诊室等)。应当指出成本仅进入第一个ICD-9代码种类。此外,如果在出院的一天内又出现新的住院,那么将两种住院事件联成一个事件。如果新的住院发生在前次出院后一天以上,那么将第二次住院看作一个新的住院。
II.将带有07,08或10位置码的请求或带有下面的医院常用程序编码系统(HCPC)代码的请求看为ER检查事件(使用第一和第二个ICD-9代码),所述的HCPC代码是带有提供者代码=81的A0010-A0070,A0215-A0225,A0999。应指出的是成本仅进入第一个ICD-9代码种类。
III.将带有01或06位置码和带有专门服务(DOS)日期的请求看为门诊检查事件(仅使用一个ICD-9代码),但是在同一DOS上有不同的提供者符号(如果在同一DOS上有相同的提供者符号,那么认为是相同的门诊检查),但是,如果门诊检查事件出现在住院期间,那么此不产生门诊检查事件(将该事件的总成本算入住院)。还将带有下列HCPC代码的请求看为一种门诊检查带有提供者代码=81的A0080-A0210。对于所有其它的门诊检查事件来说,成本仅进入第一个ICD-9代码种类。应当指出的是,如果下列一种情况存在,那么不将下列提供者符号看作是单独的门诊检查并应将它们与出现在同一DOS上的门诊检查连接在一起,这些情况为1)24(放射治疗),2)34,35(独立的实验室),3)55(医院普通/特殊X射线检查)。
根据下列相关的诊断将上述三种事件类型进行进一步的定义如果第一或第二个ICD-9代码来自附录I,那么将它看为一种充血性心力衰竭(CHF)医院,急诊室(ER)或门诊检查。如果(参照附录II)一种请求带有下列第一或第二位置中ICD-9代码中的一种,那么将它记录为一种缺血性心脏病(IHD)医院,ER,或门诊检查子集 描述1.410xx急性心肌梗塞2.411xx其它急性和亚急性类型的缺血性心脏病3.412xx老年心肌梗塞4.413xx心绞痛5.414xx其它类型的慢性缺血性心脏病如果第一或第二个ICD-9代码来自附录III,那么将它看为一种糖尿病的医院,急诊室(ER)或门诊检查。如果第一或第二种ICD-9代码来自附录IV,那么将它看为一种节律障碍病的医院,ER,或门诊检查。如果第一或第二种ICD-9代码来自附录V,那么将它看为一种高血压病的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录VI,那么将它看为一种生活模式的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录VII,那么将它看为一种其它心脏病的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录VIII,那么将它看为一种呼吸疾病的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录X,那么将它看为一种甲状腺毒症的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录XI,那么将它看为一种肺栓塞病的医院,ER,或门诊检查。如果第一或第二个ICD-9代码来自附录XII,那么将它看为一种贫血病的医院,ER,或门诊检查。如果第一或第二种ICD-9代码来自附录XIII,那么将它看为一种传染病的医院,ER,或门诊检查。
如果第一或第二个ICD-9代码不是来自上述附录中的任何一个,那么将它记录为一种其它疾病的医院,ER,或门诊检查。
将带有02,03,04,或09位置码的任何请求和不能与其它类型事件(ER,医院或门诊检查)连接的任何请求看为混合医疗事件。在本发明的典型实施方案中,混合医疗事件的子集包括CV或非CV,其中,如果第一或第二个ICD-9代码来自附录IX,那么将它看为一种CV混合事件。如果第一或第二个ICD-9代码不是来自附录IX,那么将它看为一种非CV混合事件。
此外,将带有下列任一代码的任何请求看为常规CV程序CPT 80162 地高辛等级CPT 80190 普路卡因酰胺等级CPT 80194 奎尼丁等级需要将下列程序与来自附录IX的CV诊断联系起来,从而将它们看作常规CV程序CPT 80002-80019自动血液检测CPT 93000-93014相关的ECGCPT 93040-93278相关的ECGICD-9 8951-8953 相关的ECGCPT 93307-93350相关的ECHOICD-9 8968 相关的ECHOICD-9 8972 相关的ECHOCPT 71010-71035胸部放射ICD-9 8744-8749 胸部X射线将带有下列任一代码的任何请求看为中间CV程序CPT 71090 起搏器CPT 93015-93024压迫试验CPT 78460-78489CV放射CPT 78401-78412(CV放射的旧代码)CPT 93501-93570心脏导管ICD-9 3721-3723 心脏导管CPT 93600-93660EPSICD-9 3726-3727 EPSCPT 93720-93799其它将带有下列代码之一的任何请求看为危重CV程序CPT 92950-92996CPR等ICD-9 3791 CPR等CPT 33960-33978心脏助推器将带有下列代码之一的任何请求记录为CV外科程序CPT 33010-33100心包程序CPT 33200-33261起搏器ICI)-9 3964 起搏器CPT 33400-33492瓣膜外科ICD-9 35xx 瓣膜外科CPT 33510-33560CABGICD-9 361x CABGICD-9 360x 血管成形术CPT 33600-33855先天性外科疾病
CPT33930-33950心(肺)移植物CPTV421 心脏移植物ICD-9 375x 心脏移植术ICD-9 336x 心-肺结合移植术应指出的是,程序成本分配给发生程序的ER,医生门诊检查或住院。如果程序出现在这些给定事件的代码以外,那么认为该程序是一种CV混合医疗事件并因此相应地分配成本。
关于ACE抑制剂(a)ACE抑制剂治疗等级045400(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,ACE抑制剂的Rx是在本月中。
关于袢利尿剂(a)袢利尿剂治疗等级043100(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,袢利尿剂的Rx是在本月中。
关于其它利尿剂(a)其它利尿剂治疗等级043200和043300(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,其它利尿剂的Rx是在本月中。
关于地高辛(a)地高辛治疗等级041000(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,地高辛的rx是在本月中。
关于β阻断剂(a)β阻断剂治疗等级044000(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,β阻断剂的rx是在本月中。
关于钙通道阻断剂(a)钙通道阻断剂治疗等级04200
(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,钙通道阻断剂的Rx是在本月中。
关于其它CV药物(a)其它CV药物治疗等级04000(而不是其它等级041000,042000,043100,043200,043300,044000,045400)(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,其它药物的rx是在本月中。
关于非CV药物(a)其它非CV药物治疗等级,不是04000,111200,083000,134000,或137000。
(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,非CV药物的rx是在本月中。
关于Na/H2O潴留剂(a)其它Na/H2O潴留剂(NSAID-其它等级111200,类固醇-其它等级083000,雌激素-其它等级134000和137000)(b)如果从医院请求中生成,成本=0。
(c)种类指示符=#,Na/H2O潴留剂的rx是在本月中。在使用上述指令和规则生成两种原始文件后(与附图1的步骤120一致),在事件等级数据上进行进一步处理以生成分析文件(步骤122)。分析文件的典型格式在附图5中显示。正如所显示的,分析文件的格式包括在表的第一栏中成员的名单。表的顶部一行是变量的名单,这在下面具体说明。此表的内容表示所列变量与成员关系。
尤其是,从原始文件到分析文件的处理包含一个(部分)由时间窗和许多变量定义的规则系统。对于不同的时间窗调整以及变量的修改来说,可以将这种规则系统进行重新编排。在这一步骤中生成的分析文件是一种成员等级文件(即,根据成员编排)。主要的分析文件是来源于原始文件中信息的成员等级文件。
创建每个主要的分析文件以考虑所检查事件的单个参考时间窗和对该文件有意义的预报窗。在典型的实施方案中,每个用于数据新时间窗都使用另一个主要的分析文件。
为了生成分析文件,使用多个变量将一种时间窗示意图用于事件等级数据。
首先讨论变量,处理中所包括的是独立和非独立变量。独立变量代表预后不良的潜在预报器;而非独立变量代表所预测的预后不良。
为了确定步骤122的典型独立变量,尽可能多地使用原始数据元,假设都与CHF无关。然后,以临床知识为基础,创建另外的变量。此外,以临床知识为基础,将数据元和/或变量的结合体用作变量。最后,基于它们在疾病管理中可作为潜在的着力点,可以创建并应用某些变量。
在本发明典型实施方案中,下面表1显示除了事件文件中的每个项目之外的,目前在步骤122中应用于SAS子程序中以生成分析文件的许多变量。要指出的是附图4中的每个事件可以自动成为一种用于处理的独立变量。
表1另外有意义的独立变量1.年龄(第一次CHF诊断或药物疗法的时间—三者之一)2.性别(M/F)3.HMO成员(识别特殊的HMO)4.第一次CHF诊断的位置(位置码)5.缺血性心脏病(Y/N)6.糖尿病(Y/N)7.不良生活模式诊断(Y/N)8.心脏节律障碍(Y/N)9.其它心脏病(Y/N)10.高血压病(Y/N)11.合并症疾病数(0-x)12.ACE抑制剂处方数(0-x)13.地高辛处方数(0-x)14.袢利尿剂处方数(0-x)15.其它CV处方数(0-x)
16.非CV处方数(0-x)17.药物拥用率(变应性测定)18.CHF住院数19.CHF急诊服务数20.医生门诊检查数21.总成本住院病人的医院成本急诊室成本药房成本22.心血管成本住院病人的医院成本急诊室成本医生成本药房成本23.CHF成本住院病人的医院成本急诊室成本医生成本对于非独立变量,它们是通过使用本发明而预测的结果,它们包括,例如1.因CHF住院(HL)。这是一种称作HL指示符的二分变量,如果容许出现,那么HL=1,否则指示符等于0;2.高成本。例如,可以将高成本指示符定义为最高为10%的使用美元衡量的资源应用。从最高为10%的第一次CHF诊断或第一次接受与CHF相关药物(在记录中)时的成本开始计算资源+1,3和6个月-对每个时间段都单独进行分析。此外,这是一种称作高成本指示符的二分变量,如果病人(例如)在最高点10%,那么高成本=1,否则高成本=0。
在典型的实施方案中,也可以将高成本指示符定义为预报区域(B至C)中每个成员的总成本分布(PMPM)。对于在总成本分布中具有最高PMPM的10%成员来说,将高成本指示符设定为1,对于所有其它的成员来说,将高成本指示符设定为0。
3.死亡。
尽管上面仅列出了三种非独立变量,但是本领域普通技术人员可以认识到其它与本发明目的一致的公知或还未公知的变量也可以充当在本发明范围内的非独立变量。
对于生成分析文件的时间窗方面,应指出的是对于每个所选择的成员都有一个分析记录。
在本发明中,已将下述的示意图进行展开来定义预报区段和检查数据以创建分析文件。时间窗基本上可以定义一种预报区段或区域610和事件窗(分析区域)612,在此可以应用活动性来预测预报区段中的情况。见附图6A。正如本领域技术人员可以理解的,另外的时间窗示意图也完全适合本发明。
作为解释,将请求记录覆盖的时间称作在某点‘A’开始和某点‘C’结束的时间窗。用点‘B’将时间间隔分成分析和预报区域,使得A<B<C。于是‘B’代表现在,‘A’代表最远的过去事件,且‘C’代表最远的将来事件。
作为实例,Jane Doe的分析记录基于从1/1/91开始到6/30/93的请求。因此A=1/1/91,C=6/30/93并且B可选自两者之间的某个时间,诸如12/31/92。通常以数据抽取记录为基础来定义A(即,当数据可以使用时定义),并且用成员仍然注册且对资金提供来说仍然合格的最后日期来定义C。当然,这些常用时间点定义的变化可以在本发明的范围内进行选择。
重要的是定义‘B’。在本发明中产生两种‘B’的基本定义以便使预报模型的准确度达到最大限度。不过,正如本领域人员可以理解的,也可以使用可替代的‘B’的定义。
附图6B是一种典型时间窗图,它称作示意图1,它用于处理附图4中所示的事件等级文件的数据。
在示意图1中,将事件预报区域设定为从B至C,这样对于分析中的所有成员来说,使B=C-(x#月)。例如,如果创建6个月的CHF住院(HL)模型(即,将HL用作一种非独立变量),那么B=C-(6个月)。在JaneDoe的实例中,B等于12/31/92。因此,仅用从A到B(1/1/91-12/31/92)的数据预测在‘下一次六个月’中的CHF。本文中的词组‘下一次六个月’的意思是时间点B是“现在”并且在它以后的任何时间为将来且在它以前的任何时间为过去。这是示意图1的关键概念并且它对于理解预报模型的执行和应用都是重要的。
在另一个实施方案中,可以将反映所预报事件准确度的分析权应用于以下范围内3个月x1、3-6个月x0.75、6-9个月x0.5、9-12个月x0.25,大于12个月x0.125。正如本领域技术人员可以理解的,可应用其它合适的加权技术。例如,也可以使用负加权技术。在本发明典型的实施方案中,所用的实际加权因子是1/e-x,其中x=每个事件距B点的月数。
因此,通过获得一种所选的时间窗示意图和一组合适的预定变量,处理步骤122生成了分析文件。
然后使用分析文件可以以应用不同的统计技术的方法展开此识别/预测的模型。尤其是使用可用于SAS中的统计函数将分析文件(目前是一种成员等级)进行处理。在本发明的典型实施方案中,为生成预报模型而进行的统计处理是多重逻辑回归。正如本领域技术人员可以理解的,其它统计技术也适合用于本发明。
在典型的实施方案中,当将统计处理用于分析文件时,它可以识别符合显著性(例如,概率值<0.05)预定等级的变量。然后这些变量形成一种预报模型,它是以下形式的数学方程式Logit(p)=a+bx1+cx2...+zxi其中,x1...xi是所识别的变量,而a...z是参数的估计值。然后应用下面的公式确定所考虑的结果的个体概率(p)p=e-logit(p)/(1+e-logit(p))。
用上述步骤进行几个试验。在一个试验中,将以示意图1为基础的模型的结果,所有商品化的成员和用作非独立变量的HL指示符排列在下面。所得最能预测预后不良的独立变量是1)因CHF住院,2)袢利尿剂—服用天数,3)因高血压住院一停留时间,4)医生门诊检查CHF,5)医生门诊检查MI,和6)服用ACE抑制剂(负指示符)。
在另一个试验中,将以示意图1为基础的模型结果,所有先前没有因CHF住院的商品化的成员和用作非独立变量的HL指示符排列在下面。所得最能预测预后不良的独立变量是1)袢利尿药—服用天数,2)医生门诊检查CHF,3)因IHD住院,4)医生门诊检查IHD,5)因糖尿病看急诊,6)因高血压住院-停留时间,(7)因生活模式看急诊,8)因其它心脏病住院,9)医生门诊检查肺功能,10)医生门诊检查贫血/急诊抢救贫血,和11)“其它”CV药物处方(Rx)。
在另一个试验中,将以示意图1为基础的模型的结果,医务人员和用作非独立变量的HL指示符列在下面。所得最能预测预后不良的独立变量是1)因CHF住院,2)袢利尿剂-服用天数,3)医生门诊检查CHF,4)因糖尿病看急诊。
应指出的是每个试验结果表示将许多不同的独立变量用于特殊的预报模型;依靠所需模型的精确度,可以在它们个体性质的基础上将更多或更少的独立变量用于准确地预测所选择的非独立变量。
接下来将确定的模型应用于数据。可以将确定的模型用于存在的数据,作为有规律地更新的数据或其它资金提供者的其它请求数据库。为了做到这一点,仅需要处理的是确定的有意义的独立变量。当然,随着将新请求数据库进行分析,可以重复整个处理过程以便生成一种新模型,从而确定是否其它变量可以成为更好的预报器。通过应用此模型而生成的输出文件是一种含有所有CHF病人名单的文件,所述CHF病人的名单是根据代表病人有预后不良可能性的指示符排序(即,由非独立变量定义的经验)。然后可以将此名单划分为子组,诸如按照可能有预后不良的病人的增长为5%或10%进行分组。
目前可以通过确定在每个5%或10%的子组中发生的预后不良的数量来评价模型的性能。
通过将模型用于将来请求数据或其它CHF病人的数据库或如上所述在新数据库中建立一种新模型,可以识别高危的CHF病人,同时使各型干扰最有效地分配CHF病人的保健资源。这种干扰可以采取下列形式1)特殊病例的管理,2)以小组特征为基础的新型干扰,3)高危的干扰,4)高(相对)成本的干扰,或5)当然完全坚持最佳实施原则的计划修改。
附录I-XIV如下。
附录I充血性心力衰竭诊断ICD-9代码398.91 带有风湿热的CHF,非活动性402.01 带有CHF的HTN心脏病,恶性402.11 带有CHF的HTN心脏病,良性402.91 带有CHF的HTN心脏病,未特别指明404.01 带有CHF的HTN心和肾疾病,恶性404.03 带有CHF的HTN心和肾疾病,和肾衰竭,恶性404.11 带有CHF的HTN心和肾疾病,良性404.13 带有CHF的HTN心和肾疾病,或肾衰竭,良性404.91 带有CHF的HTN心和肾疾病,未特别指明404.93 带有CHF的HTN心和肾疾病,和肾衰竭,未特别指明428xx 心力衰竭附录II410xx 急性心肌梗塞411xx 其它急性和亚急性形式的缺血性心脏病412xx 老年心肌梗塞413xx 心绞痛414xx 其它形式的慢性缺血性心脏病附录III糖尿病ICD-9代码250xx 糖尿病症DM治疗等级代码081100 胰岛素081200 口服降血糖药附录1V心脏节律障碍代码节律障碍ICD-9代码426xx 传导障碍427xx 心脏节律障碍节律障碍治疗等级代码047100 等级I-膜稳定剂047110 等级Ia047120 等级Ib047130 等级Ic047300 等级III047500 其它抗节律障碍剂附录V高血压病ICD-9代码401xx 原发性高血压402xx 高血压性心脏病403xx 高血压性肾病404xx 高血压性心脏和肾病405xx 继发性高血压附录VI不良生活模式的ICD-9代码2780x 肥胖303xx 酒精依赖综合征3050x 酗酒3051x 嗜烟272xx 脂类紊乱附录VII其它心脏病ICD-9代码391xx 有心脏损害的风湿热393-398xx 慢性风湿性心脏病421xx 急性和亚急性心脏病422xx 急性心肌梗塞424xx 瓣膜疾病(其它心内膜疾病)425xx 心肌病4290x 心肌炎,未特别指明4291x 心肌变性4292x 心血管疾病,未特别指明4293x 心脏肥大附录VIII慢性呼吸疾病ICD-9代码490xx 支气管炎,未特别指明为急性或慢性491xx 慢性支气管炎492xx 肺气肿493xx 哮喘494xx 支气管扩张495xx 外源性过敏性肺泡炎496xx 慢性气道阻塞,未在别处分类附录IX所有心血管疾病ICD-9代码093-093x 心血管梅毒09883-09885淋球菌性心脏病27482 心脏痛风石3062 由精神因素引起的心血管机能障碍390-4299x 循环系统疾病745-7469x 心脏异常785-7853x 心血管系统症状9971 心脏并发症附录X甲状腺毒症ICD-9代码242xx 有或无甲状腺肿的甲状腺毒症附录XI肺栓塞(PE)ICD-9代码4151x 肺栓塞和梗塞附录XII贫血ICD-9代码280xx 缺铁性贫血281xx 其它缺乏性贫血282xx 遗传性溶血性贫血283xx 获得性溶血性贫血284xx 再生障碍性贫血285xx 其它和未特别指明的贫血附录XIII传染病ICD-9代码001xx-139xx传染性和寄生虫性疾病附录XIV充血性心力衰竭药物疗法二联疗法(疗法等级)地高辛和袢利尿剂(041000和043100)地高辛和ACE抑制剂(041000和045400)ACE抑制剂和袢利尿剂(045400和043100)三联疗法(疗法等级)地高辛和袢利尿剂和ACE抑制剂(041000和043100和045400)附图4事件 事件日期 数量成本种类指示符1.CHF ER日期 NA$NA2.CHF住院 日期 LOS $NA3.CHF门诊检查 日期 NA$子集4.IHD ER日期 NA$子集5.IHD住院 日期 LOS $子集6.IHD门诊检查 日期 NA$NA7.糖尿病ER 日期 NA$NA8.糖尿病住院日期 LOS $NA9.糖尿病门诊检查日期 NA$NA10.节律障碍ER 日期 NA$NA11.节律障碍住院 日期 LOS $NA12.节律障碍门诊检查 日期 NA$NA13.高血压ER 日期 NA$NA14.高血压住院 日期 LOS $NA15.高血压门诊检查 日期 NA$NA16.生活模式ER 日期 NA$NA17.生活模式住院 日期 LOS $NA18.生活模式门诊检查 日期 NA$NA19.其它心脏病ER 日期 NA$NA20.其它心脏病住院 日期 LOS $NA21.其它心脏病门诊检查 日期 NA$NA22.呼吸病ER 日期 NA$NA23.呼吸病住院 日期 LO$NA24.呼吸病门诊检查 日期 NA$NA25.甲状腺毒症ER 日期 NA$NA26.甲状腺毒症住院 日期 LOS $NA27.甲状腺毒症门诊检查 日期 NA$NA28.肺栓塞ER日期NA$ NA29.肺栓塞住院 日期LOS $ NA30.肺栓塞门诊检查 口期NA$ NA31.贫血ER 日期NA$ NA32.贫血住院日期LOS $ NA33.贫血门诊检查日期NA$ NA34.传染病ER日期NA$ NA35.传染病住院 日期LOS $ NA36.传染病门诊检查 日期NA$ NA37.其它ER 日期 月中的#ER$ NA38.其它住院日期 月中的#住院 $ NA39.其它门诊检查首次日期 月中的#OV$ NA40.混合医疗事件首次日期 月中的# $#月中CV41.常规CV程序 首次日期 事件日期上的#$ NA42.中间CV程序 首次日期 事件日期上的#$ NA43.危重CV程序 首次日期 事件日期上的#$ NA44.CV外科 首次日期 事件日期上的#$ NA45.ACE抑制剂治疗的Rx 首次日期 服用天数 $月中的#rx46.袢性利尿剂治疗的Rx 首次日期 服用天数 $月中的#rx47.其它利尿剂治疗的Rx 首次日期 服用天数 $月中的#rx48.地高辛治疗的Rx 首次日期 服用天数 $月中的#rx49.β阻断剂治疗的Rx首次日期 服用天数 $月中的#rx50.Ca通道阻断剂α的Rx 首次日期 服用天数 $月中的#rx51.其它CV药物的Rx 首次日期 服用天数 $月中的#rx52.非CV药物的Rx首次日期 服用天数 $月中的#rx53.Na/H2O药物的Rx 首次日期 服用天数 $月中的#rx
权利要求
1.一种由计算机执行的用于识别诊断为充血性心力衰竭危重病人的方法,有关病人的信息存在于一种请求数据库中,所述的方法包括以下步骤以预定的标准为基础,处理请求数据库中病人的信息以抽取一组充血性心力衰竭病人的请求信息;使用在请求数据库中可用的信息来定义一组与充血性心力衰竭相关的事件;将抽取的请求信息和定义的事件转换成含有事件等级信息的文件;定义一种提供时间范围的时间窗,从中判定是否将所定义事件中的特殊部分用于随后的处理中;将一组变量定义为潜在预报器;使用时间窗和该组变量来处理事件等级信息以生成一种分析文件;和对分析文件进行统计分析以生成一种用于识别诊断为充血性心力衰竭危重病人的预报模型,所述的预报模型为该组变量子集的函数。
全文摘要
将计算机技术用于识别充血性心力衰竭的病人,其中有关病人的信息存于一种请求数据库中。该技术包括:处理请求数据库中病人的信息,定义一组与充血性心力衰竭相关的事件,生成事件等级信息,判定是否应将事件用于随后的处理中,将一组变量定义为预后不良的预报器,将事件等级信息进行处理以生成一种分析文件。对分析文件进行统计分析,生成一种预报模型;最后,将预报模型用于识别充血性心力衰竭病人。
文档编号G06F19/00GK1185305SQ9711550
公开日1998年6月24日 申请日期1997年6月17日 优先权日1996年6月17日
发明者B·王, F·弗雷德曼 申请人:史密丝克莱恩比彻姆公司, 多样化药品服务公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1