基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法与流程

文档序号:12467164阅读:2825来源:国知局
基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法与流程

本发明涉及计算机技术领域,具体涉及三种基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法。



背景技术:

诊断试验对医疗保健具有十分重要的作用,对卫生保健费用的影响也具有十分重要的意义。临床当中为病人诊治中需要解决的一个重要问题是病人是否患病、患的是什么病,在肯定和排除诊断中,就需要合理地选用诊断试验;另外在筛检无症状的病人、随访疾病、判断疾病的严重性、估计预后和对治疗的反应都需要根据诊断试验的精确性、准确性、病人的可接受性、安全性和花费等方面对其进行选择,这些都是临床实践中最易碰到的问题。

自从Yerushalmy提出灵敏度和特异度的概念,并创立了诊断试验评价方法以来,灵敏度与特异度始终是诊断试验评价方法中最基本及应用最广泛的工具。几乎所有的统计评价指标都是灵敏度与特异度的函数,例如Youden指数,标准化诊断准确率可表达成灵敏度与特异度的线性组合,诊断阳性/阴性似然比,比数积,阳性/阴性预测值可表达成灵敏度与特异度的商式组合,信息量可表达成灵敏度与特异度商式的对数函数。但是这些指标都有一个局限,就是当灵敏度与特异度重要性不同的时候,它们体现不出诊断的真实价值。

然而在临床实践当中,Galen与Gambino指出不同的情形下灵敏度、特异度有着不同的重要性:①对病情严重但治疗有积极意义,漏诊会造成不可挽回的损害而误诊不致带来严重后果的疾病,如嗜铬细胞瘤,以灵敏度较为重要;②对病情重又属于不治之症,误诊会产生严重后果的疾病,如多发性硬化症,以特异度较为重要;③对病情较重但治疗有积极意义,漏诊和误诊造成危害相当的疾病,如心肌梗塞、糖尿病、某些血液病等,灵敏度和特异度大致同等重要。Galen和Gambino提出的上述概念可看作临床应用的一般原则,尚不具备技术上的可操作性。

如图1所示,以不同截断点时的1-特异度为横轴,灵敏度为纵轴,作真阳性率与假阳性率曲线,该曲线称之为ROC(receiver operating characteristic)曲线。其曲线下的面积描述了诊断系统对正反两种状态的判别能力。目前,ROC分析被公认为衡量诊断信息和诊断决策质量的最佳方法。ROC曲线下的面积AUC(the area under the curve)越大,说明试验的诊断价值越大。当AUC接近0.5时,即ROC曲线接近对角线,此时该诊断试验就失去临床意义。ROC曲线中最佳诊断界值确定也是目前研究的热点之一。

当灵敏度与特异度重要性不同的时候(这是诊断试验最佳诊断界值的确定面临的一个非常现实的问题),现有最佳诊断界值的确定方法不能满足临床医学中诊断方法评价的现实需要。



技术实现要素:

针对现有技术的不足,本发明的目的在于提供三种基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法,以提高诊断试验的真实价值。

为了实现上述目的,本发明采取的技术方案是:

一种基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法,包括步骤:

对于灵敏度和特异度重要性不同的诊断试验,获取该诊断试验的多个诊断界值c以及这些诊断界值所对应的灵敏度SEN(c)与特异度SPE(c);

按加权(0,1)距离最小原则计算ROC曲线中的最佳诊断界值:按照假阳性率与假阴性率的重要性不同对灵敏度和特异度赋以不同的权重后,再使得假阳性率与假阴性率平方之和达到最小,此时寻找到的最佳诊断界值记为Cw*,即Cw*是使得表达式2w(1-SEN(c))2+2(1-w)(1-SPE(c))2达到最小的c值,w表示灵敏度的权重,1-w表示特异度的权重。

一种基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法,包括步骤:

对于灵敏度和特异度重要性不同的诊断试验,获取该诊断试验的多个诊断界值c以及这些诊断界值所对应的灵敏度SEN(c)与特异度SPE(c);

按加权Youden指数最大原则计算ROC曲线中的最佳诊断界值:按照灵敏度与特异度的重要性不同对灵敏度和特异度赋以不同的权重后,使得灵敏度与特异度之和达到最大,此时寻找到的最佳诊断界值记为CJw,即CJw是使得表达式2wSEN(c)+2(1-w)SPE(c)-1达到最大的c值,w表示灵敏度的权重,1-w表示特异度的权重。

一种基于灵敏度与特异度任意赋权的最佳诊断界值的确定方法,包括步骤:

对于灵敏度和特异度重要性不同的诊断试验,确定灵敏度的权重w和特异度的权重1-w,0≤w≤1;

获取该诊断试验的多个诊断界值c以及这些诊断界值所对应的灵敏度SEN(c)与特异度SPE(c);

按加权乘积指数最大原则计算ROC曲线中的最佳诊断界值:按照灵敏度与特异度重要性不同赋以不同的权重后,使得灵敏度与特异度乘积达到最大,此时寻找到的最佳诊断界值记为CSw,即CSw是使得表达式(SEN(c))2w·(SPE(c))2(1-w)达到最大的c值,w表示灵敏度的权重,1-w表示特异度的权重。

与现有技术相比,本发明的有益效果在于:

灵敏度与特异度重要性不同这是诊断试验最佳诊断界值的确定面临的一个非常现实的问题。本发明将liu在2012年提出的乘积指数推广至加权乘积指数,建立三种新的基于灵敏度与特异度任意赋权综合评价指标-“加权Youden指数”最大原则,“加权(0,1)距离最小”原则以及“加权乘积指数最大”原则下ROC曲线中最佳诊断界值的确定方法,并且寻找到了这三种原则下的最佳诊断界值重合的前提条件,当灵敏度与特异度重要性不同的时候,它们能体现诊断的真实价值,且实用性强,所编写的模型程序简洁,便于临床医生的使用,它的建立将为诊断试验评价提供新的更有力的统计分析工具。

附图说明

图1为ROC曲线;

图2为本发明三种可基于灵敏度与特异度任意赋权的ROC曲线中最佳诊断界值的确定方法的流程示意图。

具体实施方式

当灵敏度与特异度重要性不同的时候,现有最佳诊断界值的确定方法不能满足临床医学中诊断方法评价的现实需要。本研究建立了三种可基于灵敏度与特异度任意赋权的ROC曲线下最佳诊断界值的确定方法,从实际应用出发,实用性强,这属于开创性研究。

Perkins与Schisterman(2006)比较了ROC曲线中两种不同确定最佳诊断界值的原则:“Youden指数”最大原则,“(0,1)距离最小”原则,其中,(0,1)指图1坐标系中的左上角的(0,1)点。Liu(2012)提出了“灵敏度与特异度的乘积最大”原则并且与“Youden指数”最大原则,“(0,1)距离最小”两种原则进行了比较。但是这三种原则下可基于灵敏度与特异度任意赋权的ROC曲线下最佳诊断界值的确定方法国内外暂未见报道,而灵敏度与特异度重要性不同这是诊断试验最佳诊断界值的确定面临的一个非常现实的问题。

对于灵敏度和特异度重要性不同的诊断试验,确定灵敏度的权重(w)和特异度的权重(1-w)。若该临床问题的研究认为灵敏度较为重要,则0.5<w≤1;若认为特异度较为重要,则0≤w<0.5;若认为灵敏度与特异度同样重要,则w=0.5。灵敏度和特异度权重,可以根据专业知识、临床经验,并结合同行共识领域专家的建议共同确定。

获取该诊断试验的多个诊断界值c以及这些诊断界值所对应的灵敏度SEN(c)与特异度SPE(c),基于灵敏度与特异度任意赋权的三种原则ROC曲线下确定最佳诊断界值的方法如下:

(1)、“加权(0,1)距离最小”原则

按照假阳性率(1-SEN(c))与假阴性率(1-SPE(c))的重要性不同对灵敏度和特异度赋以不同的权重(分别是w和1-w)后,再使得假阳性率与假阴性率平方之和达到最小,此时寻找到的最佳诊断界值记为Cw*,即Cw*是使得表达式2w(1-SEN(c))2+2(1-w)(1-SPE(c))2达到最小的c值:

min{2w(1-SEN(c))2+2(1-w)(1-SPE(c))2} (1)

其中0≤w≤1。它为灵敏度与特异度的二次多项式函数,可见,当灵敏度与特异度重要性相同时(w=0.5),“加权(0,1)距离最小”原则等价于“(0,1)距离最小”原则。

(2)、“加权Youden指数最大”原则

按照灵敏度(SEN(c))与特异度(SPE(c))的重要性不同赋以不同的权重(分别是w和1-w)后,使得灵敏度与特异度之和达到最大,此时寻找到的最佳诊断界值记为CJw,即CJw是使得表达式2wSEN(c)+2(1-w)SPE(c)-1达到最大的c值

max{2wSEN(c)+2(1-w)SPE(c)-1} (2)

其中0≤w≤1。它为灵敏度与特异度的一次线性函数。同样地,当灵敏度与特异度重要性相同时(w=0.5),“加权Youden指数最大”原则等价于“Youden指数最大”原则。

(3)、“加权乘积指数最大”

按照灵敏度(SEN(c))与特异度(SPE(c))重要性不同赋以不同的权重(分别是w和1-w)后相乘,使得灵敏度与特异度乘积达到最大,此时寻找到的最佳诊断界值记为CSw,即CSw是使得表达式(SEN(c))2w·(SPE(c))2(1-w)达到最大的c值:

max{(SEN(c))2w·(SPE(c))2(1-w)} (3)

其中0≤w≤1。它为灵敏度与特异度的幂函数的乘积,可见,当灵敏度与特异度重要性相同时(w=0.5),“加权乘积指数最大”原则等价于“乘积最大”原则。

三种加权原则下最佳诊断界值重合的前提条件:

首先,我们将公式(1)、(2)、(3)分别对C求微分后,令其等于0,找它们的极值点。

对公式(1)求微分:

令其为0,极值点Cw*应满足

接下来对公式(2)求微分有:

令其为0,极值点CJw应满足

接下来对公式(3)求微分有:

令其为0,极值点CSw应满足

因为上述方程的解不是唯一的,可能存在多解的情形:可能是极大值点,可能极小值点。又因为(1)、(2)和(3)是灵敏度与特异度的二次或一次多项式函数,不存在不可导点,所以最佳诊断界值的只需考虑上述方程(4)、(5)以及(6)的所有极值点解即可。根据方程(4)、(5)以及(6)可推导出最佳诊断界值Cw*、CJw以及CSw重合当且仅当即若“加权(0,1)距离最小”原则与“加权乘积指数最大”原则下寻找到的最佳诊断界值Cw*,Csw其各自对应的灵敏度与特异度相等,则此时三个最佳诊断界值重合。

1)所构造的“加权(0,1)距离”为Dw=2w(1-SEN)2+2(1-w)(1-SPE)2,0≤w≤1;该指标的值越小,说明诊断价值越大。

2)所构造的加权Youden指数为Jw=2wSEN+2(1-w)SPE-1,0≤w≤1;该指标的值越大,说明诊断价值越大。

3)所构造的加权乘积指数为:

Sw=(SEN)2w·(SPE)2(1-w),0≤w≤1;

该指标的值越大,说明诊断价值越大。

4)将公式(1)展开后与公式(2)进行比较可以看出,相比“加权Youden指数最大”原则而言,“加权(0,1)距离最小”原则同样除了使得假阳性率与假阴性率加权后2w(1-SEN(c))+2(1-w)(1-SPE(c))达到最小外,还须使得第三项即灵敏度与特异度加权后平方和wSEN(c)2+(1-w)SPE(c)2达到最小。

上列详细说明是针对本发明可行实施例的具体说明,该实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1