用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统的制作方法

文档序号:6459654阅读:295来源:国知局

专利名称::用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统的制作方法
技术领域
:本发明涉及的是一种医疗器械
技术领域
的诊断装置,具体是一种用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统。
背景技术
:结直肠癌是常见的恶性肿瘤,在世界范围内其死亡率居各种肿瘤的第3位,在西方居第2位,在我国发病率居第4位,在上海等发达城市中,其发病率更上升到了第2位。近年来,越来越多的肿瘤标志物已在结直肠癌的筛査和辅助诊断方面显示了一定的应用价值。许多医学研究探讨肿瘤标志物的正常值与非正常值的合适分割点(cutofflevel),从而提高诊断效果。经对现有技术文献的检索发现,Korner在A皿SurgOncol2007;14:417-423(外科肿瘤年报2007;14:417-423)上发表的文章"DiagnosticAccuracyofSerum-carcinoembryonicAntigeninRecurrentColorectalCancer:aReceiverOperatingCharacteristicCurveAnalysis.,'("血清癌胚抗原在复发性结直肠癌中的诊断正确率受试者工作曲线分析"),该文中提出,根据临床数据,将CEA(癌胚抗原)这个肿瘤标志物的最佳分割点设为4ixg/L,凡是大于4g/L者即可诊断为结直肠癌。经检索还发现,Carpelan-Holmstrom在"PreoperativeSerumLevelsofCEAandCA242inColorectalCancer."(BrJCancer1995;71:868-872)"结直肠癌术前癌胚抗原和糖类抗原242的血清水平研究"(英国癌症杂志1995;71:868-872),该文中认为CEA的分割点应为5tig/L。但是,由于肿瘤标志物值域较广,其检测数值隐含了病人患病可能性的重要信息。例如,两个病人CEA的检测结果分别为6ug/L和550ug/L,根据以上学者的结论,两人均可认为是结直肠癌患者,但从医生的经验可知,两个病人患癌症的概率明显不同,甚至CEA为6yg/L的患者很可能是良性,从而导致误诊。因此,肿瘤标志物单分割点的诊断方式过于粗糙,无法定量地给出患癌的概率,无法最大程度地提高诊断效果。而诊断是关乎生命的问题,因此提高肿瘤标志物对于结直肠癌的诊断正确率,在医学上具有重大意义。
发明内容本发明的目的在于针对上述现有技术的不足,提出了一种用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,它能对检验数据进行多层合理划分,从中推导诊断规则,提供病人患病的概率,为医生提供诊断参考,从而提高诊断正确率。由于这种方法能够更好得保留原有检验数据的信息,因此诊断正确率高于医学上的单分割点串并联检验方法,并且一切过程均由系统自动完成,具有较高实用价值。本发明是通过以下技术方案实现的,本发明包括GUI(图形用户界面)模块、检验数据存储模块、分割点生成模块、概率诊断模块和分割点优化设置模块,其中GUI模块为客户所使用的图形用户界面,通过该界面可以实现用户与系统的交互性操作,并接受交互式操作过程中各模块的中间结果或最后结果;检验数据存储模块用于存放两类数据,第一类数据为历史数据,是经过确诊的具有各肿瘤标志物的检验数据以及经过确诊后的诊断结果,此类数据在求取多分割点设置方案时由概率诊断模块调用;第二类为待分析数据,是还未进行确诊的具有各肿瘤标志物的检验数据,在进行患结直肠癌的概率分析时由概率诊断模块调用;分割点生成模块包括实验组合子模块、分割点进化子模块,其中,实验组合子模块负责根据GUI模块中指定的肿瘤标志物分割点个数生成正交实验组合矩阵,矩阵中的每一列就是一个分割点组合;分割点进化子模块接收分割点组合,并接收概率诊断模块反馈过来的分割点的优劣结果,不断生成诊断正确率更佳的多分割点设置方案,并将分割点设置方案传输给概率诊断模块;概率诊断模块包括诊断规则子模块、患病概率子模块和诊断正确率评价子模块,其中诊断规则子模块根据分割点进化子模块生成的分割点设置方案,将校验数据存储模块中的检验数据离散化,使用粗糙集中的值约简法,形成诊断规则,并传输给患病概率子模块;患病概率子模块利用诊断规则,对检验数据存储模块中的历史数据逐一做出患病概率的判断;诊断正确率评价子模块根据每个检验数据的概率值,将每个检验数据区分为结直肠癌或者正常两类,当完成所有数据的判断后,与真实诊断结果作对比,统计所有检验数据中正确诊断的病例数,以AUC(受试者工作曲线线下面积)作为评价指标,获知分割点方案下的诊断正确率,反馈给分割点进化子模块,概率诊断模块和分割点进化子模块之间进行反复的信息互动,当达到诊断正确率目标时,输出多分割点优化方案,然后将此信息以及对应的实验组合、诊断规则、AUC值等信息传输至分割点优化设置模块中的分割点方案收集子模块;分割点优化设置模块包括分割点方案收集子模块、方差分析子模块、方案输出子模块,其中,分割点方案收集子模块负责集合所有实验组合下的多分割点优化方案、诊断规则及AUC值,并传输给方差分析子模块;方差分析子模块对分割点方案收集子模块中的多分割点优化设置方案及其AUC值进行方差分析,得出最终的最佳分割点组合,若这种组合已经在实验组合子模块产生的正交实验组合中存在,则直接将对应的多分割点优化设置方案作为最佳多分割点设置方案,连同这种分割点设置结果下的诊断规则,共同保存至方案输出子模块,并可显示于GUI模块;若这种分割点组合不存在于正交实验组合中,则再次调用分割点生成模块、概率诊断模块,将最终形成的肿瘤标志物多分割点设置方案和诊断规则作为结果保存至方案输出子模块,并可显示于GUI模块。所述分割点进化子模块,使用遗传算法完成每个实验组合下,分割点初始种群的生成及进化,具体如下对实验组合子模块生成的实验组合矩阵中的每一个分割点组合,使用遗传算法生成w个个体组成的群体矩阵,矩阵中每一行代表一个个体,数字代表肿瘤标志物的分割点位置,每一个个体就是一种分割点方案,将这n个分割点方案传输给概率诊断模块进行诊断正确率的评价。其次,分割点进化子模块接收概率诊断模块反馈回来的对于该分割点方案的^断正确率的评价结果AUC,获知种群中每一个个体的优劣,将AUC作为遗传算法的目标函数,然后通过交叉和变异,生成新的分割点种群,完成一次进化;最后,分割点进化子模块与概率诊断模块不断进行信息交互,根据进化停止条件,最终将实验组合及相应的分割点优化设置方案、诊断规则共同传输至分割点优化设置模块中的分割点方案收集子模块。所述诊断规则子模块,离散化检验数据存储模块中第一类数据的检验数据(所有检验数据离散为l,2…m的形式),作为本模块中进行规则推导的分析数据,每条数据均由条件属性与决策属性组成,条件属性即为各个肿瘤标志物,决策属性即是最后的类别归属,即包括正常和结直肠癌两类,应用粗糙集值约简法处理离散后的数据获得决策规则集,规则集中的每条规则都代表了肿瘤标志物的取值与最后类别归属之间的因果关系,每条规则都有强度、确定度和覆盖度这三个性质,强度指符合规则的数据条数占总数据条数的比例;确定度指符合规则的数据条数占肿瘤标志物结果与这条规则相符的数据条数的比例;覆盖度指符合规则的数据条数占所有类别归属与这条规则相同的数据条数的比例。所述患病概率子模块,为每条数据在决策规则集中寻找相符的若干条规则,然后累加其中决策属性相同的规则的强度值,从而完成该数据属于每个类别的概率分配,即患病概率。所述诊断正确率评价子模块,对患病概率子模块得到的患病概率结果进行分析,设定概率阀值,患病概率大于阈值的属于结直肠癌,患病概率小于阈值的属于正常,并将这个类别归属结果与检验数据存储模块中检验数据的真实诊断结果做比较,获得灵敏性Se和特异性Sp,求取AUC,并将AUC反馈给分割点进化子模块。本发明包括两个功能获得多分割点设置方案和确定病人患结直肠癌的概率,分别通过接受GUI模块中用户发来的信息来完成当利用本系统获得多分割点设置方案时,选择检验数据存储模块中的第一类数据、分割点生成模块、概率诊断模块和分割点优化设置模块,得到最佳多分割点设置方案,并传输至GUI模块,让用户直观获知;当需要对于待诊断的检验数据进行分析确定病人患结直肠癌的概率时,选择检验数据存储模块中的第二类数据、患病概率子模块和方案输出子模块,其中,患病概率子模块所应用的分割点方案和诊断规则为方案输出子模块中存储的最佳分割点方案和相应的诊断规则,最终概率结果将传输至GUI模块,使用户直观获知。当系统初次使用时,必须先获得多分割点设置方案和相应的诊断规则,存储至方案输出子模块,才能利用设置的分割点方案和诊断规则确定病人患结直肠癌的概率。随着检验数据存储模块中第一类数据的不断丰富,分割点设置方案需定期进行调整,不断增加其可靠性,从而提高第二类数据诊断正确率。应用本发明对新的病人的诊断过程具体如下新的病人的肿瘤标志物检测结果出来后,由于还没有正确的诊断结果,医生将这个结果放入校验数据存储模块的第二类数据中,然后使用本发明的第二功能,获知患病的概率,这也是医生所希望得到的决策支持。当病人进行后续的一系列检査后,最终可以确诊是否患病,当知道这个结果后,原来的第二类数据只需补充确诊类别后,就可放入第一类数据。随着时间的变化,第一类数据会越来越多,当到达一定量时,可以重新求取最佳的多分割点设置方案,使系统更好的应用于第二类数据,定期循环这一过程。诊断规则子模块离散的检验数据可以是第一类,也可以是第二类,取决于GUI模块中所选择的是哪一个功能,对于第二类数据只需使用系统中的部分模块就可。第二类数据主要是在使用系统的确定病人患结直肠癌的概率这个功能时而用。由于肿瘤标志物是最常用的检测手法,以往医生可能将原本患癌的病人误诊为正常而不进行后续检查,当最终确诊时,很有可能已经错过了最佳时机,因此本系统希望能够在肿瘤标志物检测时就告知医生这个病人患病的可能性,使医生有所警觉,降低误诊率。与现有技术相比,本发明具有如下有益效果本发明可减少医学上的单分割点诊断方法对于连续检验数据造成的信息损失,对检验数据进行更有效的解读。本发明所使用的检验数据信息损失量更小,因而使在这基础上所进行的诊断活动更为准确,故具有良好的实用价值。本发明优于医学现有的单分割点的串并联诊断方式,可直接作为医学诊断辅助决策系统使用。图l是本发明的系统结构框图。具体实施例方式下面结合附图对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。本实施例的目标是获得结直肠癌肿瘤标志物多分割点设置方案。如图1所示,本实施例包括GUI模块、检验数据存储模块、分割点生成模块、概率诊断模块和分割点优化设置模块,其中GUI模块为客户所实用的图形用户界面,通过该界面可以实现用户与系统的交互性操作,并接受交互式操作过程中各模块的中间结果或最后结果,由于检验数据为3个肿瘤标志物(是指"CEA,CA19-9和CA50"),用户在GUI模块中指定最大的肿瘤标志物分割点个数为3;检验数据存储模块存放有两类数据,第一类数据为历史数据,是经过确诊的具有各肿瘤标志物的检验数据以及经过确诊后的诊断结果,此类数据在求取多分割点设置方案时由概率诊断模块调用;第二类为待分析数据,是还未进行确诊的具有各肿瘤标志物的检验数据,在进行患结直肠癌的概率分析时由概率诊断模块调用;本实施例中采集的经过确诊的具有各肿瘤标志物的检验数据具体如下收集某三级甲等医院2004年11月2006年11月住院及体检病人血清标本进行检测,其患者均经肠镜或手术病理切片明确诊断。其中,结直肠癌组75例;正常对照组49例。每个病人所检测的肿瘤标志物为CEA(癌胚抗原)、CA19-9(糖类抗原19-9)和CA50(糖类抗原50)。它们的单分割点及值域分别为CEA正常参考值为<4.8yg/L,检测值范围为0-550iig/L;CA19-9正常参考值为〈33U/ml,检测值范围为0-500U/ml;CA50正常参考值为〈25U/ml,检测值范围为0-200U/ml。分割点生成模块包括实验组合子模块和分割点进化子模块,其中实验组合子模块根据分割点个数生成正交实验组合矩阵,其组合矩阵如下111222333123123123123231312(1)其中每一列为一种分割点组合,其数字指相应肿瘤标志物的分割点个数,共9种组合。力割点进化子模块从组合开始随机生成大小为n=300的分割点种群矩3.8945.2913.59阵89'1234:6892'48,矩阵中每一行代表一个个体,数字代表肿瘤标志45.293.58189.38物的分割点位置,每一个个体就是一种分割点方案,并将这"个分割点方案传输给概率诊断模块进行诊断正确率的评价。概率诊断模块包括诊断规则子模块、患病概率子模块和诊断正确率评价子模块,其中-诊断规则子模块,首先离散化检验数据,CEA以3.89为分割点,凡是检验结果《3.89的数据,以"1"代表,凡是〉3.89者以2代替,依此类推,完成肿瘤标志物CEA,CA19-9和CA50检验结果的离散化。根据离散化的结果使用粗糙集值约简法获得诊断规则集R,具体如下每一条检验数据et/)都可表示为一个序列q(x),c2(x),c3,{C|,C2,c3,}=C,C是条件属性的集合,q指CEA,c"2指CA19-9,q指CA50,"为决策属性的集合,即该病人属于正常"i,还是结直肠癌"2,应用粗糙集的值约简法获得的决策规则,可以表示为q(x),C2(;c),C30c)4"(x),或者简记为,所有的规则集合记为^,并且求取每条规则的强度、确定度和覆盖度,具体如下强度欲(C,D)JC(如,,W为集合义的基数、确定度,、lcOc)nD(;c)l窓芏存仏^、|C(x)nD(x〗cei;C,D):1、!二,/"、覆盖度cx^(C,Z))=1、"/力。患病概率子模块,为f/中数据;c,在诊断规则子模块的规则集合i中寻找与之条件属性^,,^,cj相匹配的若干规则,然后累加其中决策属性相同的规则的强度值,完成^属于每个决策的概率分配,记&'"为A属于正常"'的概率,为X'属于结直肠癌A的概率。诊断正确率评价子模块,设定阈值为50%,对患病概率子模块得到的患病概率结果进行判断,获得诊断结果<formula>complexformulaseeoriginaldocumentpage12</formula>Z)2d<50%,"i表示是f/朋We^A=50%收W正常,A表示是结直肠癌,Unable表示不确定,并将"、'与检验数据存储模块中检验数据的真实诊断结果做比较,得到灵敏性Se和特异性Sp,然后求得AUC:<formula>complexformulaseeoriginaldocumentpage12</formula>一-化和(1-—,并将结果反馈至分割点进化子模块,经过不断遗传优化,最终输出的分割点设置方案为[3.0785.1532.56],其Se=0.9,Sp=0.75,AUC=0.82,当前的组合方案为,将以上信息及其的到的诊断规则保存至分割点优化设置模块中的分割点方案收集子模块,然后进入到下一个实验组合的处理。分割点优化设置模块中记录了所有实验组合及其相应的多分割点优化方案,Se,Sp和AUC值,分别见表1和表2。表1多分割点设置算法的诊断效果<table>complextableseeoriginaldocumentpage12</column></row><table><table>complextableseeoriginaldocumentpage13</column></row><table>根据分割点方案收集子模块中的信息,方差分析子模块根据正交实验的方差分析结果获得"3-3-2"为最佳的多分割点组合。由于此组合在正交实验组合矩阵中已有,因此它所对应的多分割点设置方案即为最佳方案,保存至方案输出子模块,并传送至GUI模块。最终结果总结至表3和表4。表3"3-3-2"多分割点设置方案的诊断效果<table>complextableseeoriginaldocumentpage13</column></row><table>表4"3-3-2"多分割点设置方案<table>complextableseeoriginaldocumentpage13</column></row><table>医学上常用的单分割点串并联诊断方法的诊断表现为Se^.9,Sp=0.67,AUC=0.78。可见,本实施例系统确能够优化结直肠癌诊断,具有良好的实用价值。当利用本实施例系统确定病人患结直肠癌的概率时,当新的肿瘤标志物检验结果到达检验数据存储模块时,将被存放入第二类数据,然后可在GUI模块中只选择检验数据存储模块中的第二类数据、患病概率子模块和方案输出子模块,可获知该病人患结直肠癌的概率,用于辅助医生判断。权利要求1、一种用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,包括GUI模块、检验数据存储模块,其特征在于,还包括分割点生成模块、概率诊断模块和分割点优化设置模块,其中GUI模块为客户所使用的图形用户界面,通过该界面实现用户与系统的交互性操作,并接受交互式操作过程中各模块的中间结果或最后结果;检验数据存储模块用于存放两类数据,第一类数据为历史数据,是经过确诊的具有各肿瘤标志物的检验数据以及经过确诊后的诊断结果,此类数据在求取多分割点设置方案时由概率诊断模块调用;第二类为待分析数据,是还未进行确诊的具有各肿瘤标志物的检验数据,在进行患结直肠癌的概率分析时由概率诊断模块调用;分割点生成模块包括实验组合子模块、分割点进化子模块,其中,实验组合子模块负责根据GUI模块中指定的肿瘤标志物分割点个数生成正交实验组合矩阵,矩阵中的每一列就是一个分割点组合;分割点进化子模块接收分割点组合,并接收概率诊断模块反馈过来的分割点的优劣结果,不断生成诊断正确率更佳的多分割点设置方案,并将分割点设置方案传输给概率诊断模块;概率诊断模块包括诊断规则子模块、患病概率子模块和诊断正确率评价子模块,其中诊断规则子模块根据分割点进化子模块生成的分割点设置方案,将检验数据存储模块中的检验数据离散化,使用粗糙集中的值约简法,形成诊断规则,并传输给患病概率子模块;患病概率子模块利用诊断规则,对检验数据存储模块中的历史数据逐一做出患病概率的判断;诊断正确率评价子模块根据每个检验数据的概率值,将每个检验数据区分为结直肠癌或者正常两类,当完成所有数据的判断后,与真实诊断结果作对比,统计所有检验数据中正确诊断的病例数,以AUC作为评价指标,获知分割点方案下的诊断正确率,反馈给分割点进化子模块,概率诊断模块和分割点进化子模块之间进行反复的信息互动,当达到诊断正确率目标时,输出多分割点优化方案,然后将此信息以及对应的实验组合、诊断规则、AUC值传输至分割点优化设置模块中的分割点方案收集子模块;分割点优化设置模块包括分割点方案收集子模块、方差分析子模块、方案输出子模块,其中,分割点方案收集子模块负责集合所有实验组合下的多分割点优化方案、诊断规则及AUC值,并传输给方差分析子模块;方差分析子模块对分割点方案收集子模块中的多分割点优化设置方案及其AUC值进行方差分析,得出最终的最佳分割点组合,若这种组合已经在实验组合子模块产生的正交实验组合中存在,则直接将对应的多分割点优化设置方案作为最佳多分割点设置方案,连同这种分割点设置结果下的诊断规则,共同保存至方案输出子模块,并可显示于GUI模块;若这种分割点组合不存在于正交实验组合中,则再次调用分割点生成模块、概率诊断模块,将最终形成的肿瘤标志物多分割点设置方案和诊断规则作为结果保存至方案输出子模块,并可显示于GUI模块。2、根据权利要求1所述的用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,其特征是,所述分割点进化子模块,使用遗传算法完成每个实验组合下,分割点初始种群的生成及进化,具体如下对实验组合子模块生成的实验组合矩阵中的每一个分割点组合,使用遗传算法生成"个个体组成的群体矩阵,矩阵中每一行代表一个个体,每一个个体就是一种分割点方案,并把这"个分割点方案传输给概率诊断模块进行诊断正确率的评价;分割点进化子模块接收概率诊断模块反馈回来的对于该分割点方案的诊断正确率的评价结果AUC,获知种群中每一个个体的优劣,将AUC作为遗传算法的目标函数,然后通过交叉和变异,生成新的分割点种群,完成一次进化;分割点进化子模块与概率诊断模块不断进行信息交互,根据进化停止条件,最终将实验组合及相应的分割点设置方案、诊断规则共同传输至分割点优化设置模块中的分割点方案收集子模块。3、根据权利要求1所述的用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,其特征是,所述诊断规则子模块,离散化检验数据存储模块中第一类数据的检验数据,作为本模块中进行规则推导的分析数据,每条数据均由条件属性与决策属性组成,条件属性即为各个肿瘤标志物,决策属性即是最后的类别归属,即包括正常和结直肠癌两类,应用粗糙集值约简法处理离散后的数据获得决策规则集,规则集中的每条规则都代表了肿瘤标志物的取值与最后类别归属之间的因果关系,每条规则都有强度、确定度和覆盖度这三个性质,强度指符合规则的数据条数占总数据条数的比例,确定度指符合规则的数据条数占肿瘤标志物结果与这条规则相符的数据条数的比例,覆盖度指符合规则的数据条数占所有类别归属与这条规则相同的数据条数的比例。4、根据权利要求1所述的用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,其特征是,所述患病概率子模块,为每条数据在决策规则集中寻找相符的若干条规则,然后累加其中决策属性相同的规则的强度值,从而完成该数据属于每个类别的概率分配。5、根据权利要求1所述的用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,其特征是,所述诊断正确率评价子模块,对患病概率子模块得到的患病概率结果进行分析,设定概率阀值,患病概率大于阈值的属于结直肠癌,患病概率小于阈值的属于正常,并将这个类别归属结果与检验数据存储模块中检验数据的真实诊断结果做比较,获得灵敏性Se和特异性Sp,求取AUC,并将AUC反馈给分割点进化子模块。全文摘要一种医学
技术领域
的用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统,包括GUI模块、检验数据存储模块、分割点生成模块、概率诊断模块和分割点优化设置模块,GUI模块为图形用户界面,实现用户与系统的交互性操作,并接受各模块的中间或最后结果;检验数据存储模块用于存放系统中其它模块所用的两类数据;分割点生成模块为每一组实验组合生成众多的多分割点设置方案,在与概率诊断模块的信息交互中,不断优化这些方案。概率诊断模块对每一个方案的效果进行评判,并将结果反馈给分割点生成模块,最后将每一组实验组合优化后的方案保存至分割点优化设置模块,得出最佳的分割点设置方案。本发明可直接作为医学诊断辅助决策系统使用。文档编号G06F19/00GK101344519SQ20081004192公开日2009年1月14日申请日期2008年8月21日优先权日2008年8月21日发明者施京华,强苏,平顾,钢黄申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1