一种将多种主要不良心血管事件预测模型融合的集成预测方法与流程

文档序号:11407796阅读:181来源:国知局
本发明涉及心血管疾病风险评估方面,具体涉及一种将多种主要不良心血管事件预测模型融合的集成预测方法。
背景技术
::急性冠脉综合征(acs,acutecoronarysyndrome),作为冠心病中最为严重和急性的一组疾病,是指由于冠状动脉血流量减少导致部分心肌不能正常工作或者死亡而产生的一系列症状。针对急性冠脉综合征患者进行主要不良心血管事件预测,能够综合多种患者特征,提供一种对患者预后情况的全面评估。评估结果能够(1)指导医生为患者选择合适的病房;(2)辅助医生为患者合理制定药物及有创干预治疗方案,通过更合理的治疗与护理方案,减少患者主要不良心血管事件的发生几率及医疗开支;(3)为患者及其家人提供更多关于可能出现的不良事件的信息,营造更为详尽全面的医疗服务。因此,针对急性冠脉综合征患者的主要不良心血管事件的预测与评估在患者的临床诊断、治疗、护理方面起到了至关重要的作用。针对急性冠脉综合征患者的主要不良心血管事件预测研究方法主要分为基于队列研究和基于电子病历的研究两种。最为著名的队列研究项目有:全球急性冠脉综合事件注册评分(grace,theglobalregistryofacutecoronaryevents)、心肌梗死溶栓治疗疗法指南(timi,thethrombolysisinmyocardialinfarction)和不稳定心绞痛中血小板糖蛋白iib/iiia:依替巴肽对受体抑制实验(pursuit,theplateletglycoproteiniib/iiiainunstableangina:receptorsuppressionusingintegrilintherapy)等。然而,队列研究依然存在许多不足:(1)入组标准使收集到的数据与真实的医疗环境中的患者数据存在差异。(2)模型中包含的风险因子较少,可能导致模型预测性能的退化。(3)随着医学技术的发展,越来越多的潜在风险因素未包含在grace、timi等现有队列研究模型中。(4)队列研究模型其自身并不能对含有缺失值(missingvalue)的患者进行预测。然而,在实际的临床环境当中,患者记录中含有大量缺失值,限制了模型的使用。近年来,随着医院信息系统的快速发展,大量的电子病历(emr,electronicmedicalrecords)数据得以累积。许多研究已经在电子病历数据的基础上,采用先进的机器学习算法构建了针对不同疾病的预测模型。基于电子病历数据的研究方法相较于传统队列研究有一定的优越性,但依然存在不足之处:由于电子病历数据中不可避免的缺失值、病人不能准确描述自身病情和医生不能准确判断其所观察到的现象产生的数据不确定性(该类数据通常以自由文本形式记录)以及检查检验结果中可能存在一定程度的错误值,导致使用这些数据构建的模型存在不确定性,预测准确率受到影响,甚至会导致模型得出错误的结论。目前在主要不良心血管事件预测领域,尚未有研究针对这一问题进行探究。此外,尽管近年来针对心血管疾病的各种风险评估模型层出不穷,许多队列模型也已经在实际的临床环境中证明了自己的价值,然而鲜有研究将各个不同的基于队列研究的模型和基于电子病历数据的模型相融合来构建一种综合多位“专家”意见的集成预测模型。技术实现要素:本发明的目的在于针对现有技术的不足,提供一种将多种主要不良心血管事件预测模型融合的集成预测方法。解决了现有基于电子病历数据不良事件预测模型不确定性问题,同时实现了将多种基于队列研究模型和基于电子病历数据模型相融合从而构建一种综合多方面“专家”意见的集成预测模型。本发明所提供的技术方案为:一种将多种主要不良心血管事件预测模型融合的集成预测方法,所述主要不良心血管事件预测模型包括基于队列研究的模型和基于电子病历研究的模型;所述集成预测方法包括如下步骤:1)将待融合主要不良心血管事件预测模型的输出结果分别二值化;2)根据步骤1)中二值化后的待融合主要不良心血管事件预测模型的输出结果,使用粗糙集(roughset)理论计算各独立预测模型的权重值;3)将待融合主要不良心血管事件预测模型的输出结果分别归一化;4)针对步骤3)中归一化后的待融合主要不良心血管事件预测模型的输出结果,将其最佳分类阈值点格式化为0.5;5)根据步骤2)中计算的各独立预测模型的权重值和步骤4)中得到的各独立预测模型的输出结果,计算各患者的基本概率分配;6)针对步骤5)中得到的各患者的基本概率分配,使用dempster规则合成方法,将各独立预测模型输出项结合,得到结合的mass函数;7)根据步骤6)中得到的结合的mass函数,计算最终的集成预测方法的输出值。上述技术方案中,将多种独立急性冠脉综合征主要不良心血管事件预测模型融合的集成预测方法能够有效较少基于电子病历研究模型的不确定性问题;同时能够将各个不同的独立预测相融合,得到一种能够综合多方面“专家”意见的集成预测模型。优选的,所述基于队列研究的模型包括全球急性冠脉综合事件注册评分(grace,theglobalregistryofacutecoronaryevents)、心肌梗死溶栓治疗疗法指南(timi,thethrombolysisinmyocardialinfarction)和不稳定心绞痛中血小板糖蛋白iib/iiia:依替巴肽对受体抑制实验(pursuit,theplateletglycoproteiniib/iiiainunstableangina:receptorsuppressionusingintegrilintherapy)中所用模型的一种或几种;所述基于电子病历研究的模型包括支持向量机(supportvectormachine,svm)、带范数一的逻辑回归(l1-logisticregression)或分类回归树(classificationandregressiontrees,cart)中的一种或几种。优选的,所述步骤1)中输出结果分别二值化是指:使用待融合主要不良心血管事件预测模型的输出结果roc曲线上最靠近图像左上角的点作为最佳阈值点进行二值化。优选的,所述步骤2)中使用粗糙集理论计算各独立预测模型的权重值是指:在粗糙集理论中,定义信息系统其中,对象集合o={o1,o2,...,ot}是由有限t个对象o组成的非空集合,属性集合a={a1,a2,...,an}是由有限n个属性a组成的非空集合,结果集合r={r1,r2,...,rm}是由有限m个结果r组成的非空集合;对于每一个子集都有一个等价关系,所述等价关系定义为:根据等价关系ind(p),所述对象集合o={o1,o2,...,ot}能够被分割成不同的子集,该不同的子集的集合定义为o/ind(p),o/ind(p)中任意的一个元素都被称为等价类(equivalenceclass);根据公式1.1,得到所述信息系统关于属性集合a={a1,a2,...,an}、排除了属性aj的属性集合a-{aj}以及结果集合r={r1,r2,...,rm}的等价关系:根据信息熵理论,所述信息系统中结果集合r={r1,r2,...,rm}对于属性集合a={a1,a2,...,an}的依赖性(dependence)为:其中,[x]是在o/ind(a)中的等价划分,[y]是在o/ind(r)中的等价划分,p[x]=|[x]|/|[y]|且p([y]/[x])=|[y]∩[x]|/|[x]|;所述结果集合r={r1,r2,...,rm}对于排除了属性aj的属性集合a-{aj}的依赖性(dependence)为:所述属性aj的显著性(significance)为:所述属性aj的权重值(weight)为:根据上述公式1.2-1.8,计算各独立预测模型的权重值。优选的,所述步骤3)中输出结果归一化是指:根据公式1.9对输出结果范围不是0到1的各独立预测模型进行归一化,其中,ii,j指的是第j个患者在模型i中的输出结果,i指的是其中一种主要不良心血管事件预测模型,n指的是患者的总数,mini和maxi分别指的是i模型对于所有患者输出评分的最小值和最大值。优选的,所述步骤4)中将其最佳分类阈值点格式化为0.5是指:根据公式1.10将待融合独立预测模型的最佳阈值点统一格式化为0.5,其中,fi,j指的是独立预测模型i针对第j个患者的格式化输出,i指的是其中一种主要不良心血管事件预测模型,thresholdi指的是独立预测模型i的最佳阈值点,即独立预测模型i的roc曲线上最靠近左上角的点。优选的,所述步骤5)中计算各患者的基本概率分配(bpa,basicprobabilityassignment)是指:mass函数的取值:m:2θ→[0,1],该分配函数称为mass函数,表示每个假设的mass函数值都在0和1之间;其中,θ为一个识别框架(frameofdiscernment)用以表示一个信息系统中所有可能出现的互斥状态;幂集2θ表示由识别框架θ中所有的子集以及空集组成的集合;所述mass函数满足且其中m(a)表示了假设a的基本概率分配;如果m(a)>0,假设a为焦元(focalelement);使用公式1.11将步骤2)中计算的各独立预测模型的权重值和步骤4)中得到的各独立预测模型的输出结果添加到各患者的基本概率分配中,j=1,2,...,n其中,fi,j指的是独立预测模型i针对第j个患者的格式化输出,i指的是其中一种主要不良心血管事件预测模型,wi是通过粗糙集理论计算的独立预测模型i的权重值。优选的,所述步骤6)中得到结合的mass函数是指:根据dempster合成规则定义为:其中,b,c指的是彼此独立的假设,m1(b)指的是假设b的mass函数,m2(c)指的是假设c的mass函数;表示不同mass函数所提供的证据发生的冲突,称为冲突概率(conflictprobability);系数1/1-k为归一化因子;使用公式1.13计算合成的mass函数:j=1,2,...,n其中,i=i1,i2,...,im,m≥1指的是合成后的第j个患者预测为1的mass函数,指的是合成后的第j个患者预测为0的mass函数,指的是合成后的第j个患者的mass函数,fall,j指的是合成后的预测模型针对第j个患者的格式化输出,i指的是其中一种主要不良心血管事件预测模型。优选的,所述步骤7)中计算最终的集成预测方法的输出值是指:使用公式1.14计算:其中,iall,j指的是对患者j的最终的预测输出值。同现有技术相比,本发明的有益效果体现在:将多种独立急性冠脉综合征主要不良心血管事件预测模型融合进行集成预测,能够有效较少基于电子病历研究模型的不确定性问题;同时能够将各个不同的独立预测相融合,得到一种能够综合多方面“专家”意见的集成预测模型,提供预测的准确性。附图说明图1为本发明提供的一种将多种主要不良心血管事件预测模型融合的集成预测方法的流程图。具体实施方式下面结合具体实施例和说明书附图对本发明作进一步的说明。实施例集成预测方法中所选择的独立预测模型包括:全球急性冠脉综合事件注册评分(grace),支持向量机(supportvectormachine,svm)、带范数一的逻辑回归(l1-logisticregression)和分类回归树(classificationandregressiontrees,cart)。图1为将多种主要不良心血管事件预测模型融合的集成预测方法的流程图。具体真实的临床案例有2973例,为了能更清楚地展示具体的计算过程,仅选取了10例真实的临床案例作为示例,表1为10例真实的临床案例。表1患者案例的各独立预测模型输出结果图1中的步骤s101为将待融合独立主要不良心血管事件预测模型输出结果二值化。具体使用四种模型的输出结果roc曲线上最靠近左上角的点作为最佳阈值点来对其输出进行二值化,根据得到的真实临床数据集构建的各待融合独立预测模型最佳阈值点分别为:0.2348,0.22689,0.2584和106.5。表2给出了根据最佳阈值点二值化后,各待融合独立模型的输出结果和最佳阈值点。表2二值化的各独立预测模型输出结果和最佳阈值点图1中的步骤s102为根据步骤s101二值化后的待融合独立主要不良心血管事件预测模型输出结果,使用roughset理论计算各独立模型的权重值。根据公式1.2-1.8,可以计算各待融合独立预测模型的权重值,计算结果如表3所示。表3二值化的各独立预测模型输出结果、最佳阈值点和权重值需要指出的是,表3中计算的权重值是根据全部患者样本数据计算得来的,并不是仅使用上述10个患者案例数据计算而来。图1中步骤s103为将待融合独立主要不良心血管事件预测模型输出结果归一化。根据公式1.9可以将各独立模型的输出归一化到0到1之间。其中grace模型输出的最大值和最小值是根据全部患者样本数据计算的来的,分别为201和37,而不是仅使用上述10个患者案例数据计算而来。图1中步骤s104为针对步骤s103归一化后的待融合独立主要不良心血管事件预测模型输出结果,将其最佳分类阈值点格式化为0.5。根据公式1.10可以将全部待融合的独立不良事件预测模型的最佳阈值点统一格式化为0.5,格式化后的各独立预测模型输出如表4所示。表4格式化后的各独立预测模型输出结果图1中步骤s105为根据步骤s102计算的各独立预测模型权重值和步骤s104得到的各独立预测模型输出结果,计算各样本的基本概率分配。根据公式1.11可以计算得到包含了权重值的各待融合独立不良事件预测模型的基本概率分配,计算得到的基本概率分配如表5所示。表5患者案例的基本概率分配图1中步骤s106为针对步骤s105得到的各样本的基本概率分配,使用dempster规则合成方法,将各独立预测模型的输出相结合,得到结合的mass函数。根据公式1.12-1.13可以将各待融合模型的输出相结合,得到结合的mass函数,计算得到的结合的mass函数如表6所示。表6患者案例的结合的mass函数图1中步骤s107为根据步骤s106得到的结合预测结果,计算最终的集成主要不良心血管事件预测模型输出值。根据公式1.14我们可以得到最终的预测值,同样使用roc曲线上最靠近左上角的点作为最佳阈值点我们可以得到最终的预测结果,计算得到的最终预测值和预测结果如表7所示。表7患者案例最终的预测值和预测结果综上所述,本发明通过使用roughset理论计算各待融合独立不良事件预测模型权重值,使用dempster-shafer证据理论将各待融合独立不良事件预测模型输出相融合,从而解决了使用电子病历数据构建的模型中不确定性问题,提高模型的预测准确定,同时还实现了将各种不同的模型相融合从而构建一种综合各方面“专家”意见的集成预测模型。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1