一种用于优化选取脑卒中相关生物标志物的方法与流程

文档序号:12786689阅读:370来源:国知局

本发明提供一种用于优化选取脑卒中相关生物标志物的方法,是一种基于互信息分析-主成分分析-二级支持向量机的脑卒中生物标志物优化选取方法,属于生物医学工程领域。



背景技术:

脑卒中对人的健康及生命影响十分严重,以其高发病率、高病死率、高致残率对人类健康构成巨大威胁,已成为全球第二大常见死因。脑卒中检测手段困难,目前脑血管病患者的常规检测项目有:

a)主要为血压、心电图、眼底检查、血常规、尿常规、血脂、血糖、血液流变学、血

同型半胱氨酸、抗磷脂抗体等常规检测后;

b)脑血管病患者进一步行辅助检查,包括:经颅多普勒超声、颈动脉超声、颅脑CT(包

括CT、CTA、CTV、CTP)、MRI、MRA等;

c)进一步创性检查:DSA及介入治疗。

但是这些方法都存在困难,导致它们不能完全适应于目前的临床检测。

神经生化检测在脑卒中的作用越来越受到重视,人们期望通过生化指标来协助脑卒中的早期诊断,并作出评价。近年来,随着临床检验医学的快速发展与研究的深入,许多新的检测项目(特别是一些生化标志物)的相继问世,检验方法也不断更新与改进,极大地促进了临床脑卒中的实验诊断的革命。生化标志物在脑卒中的早期诊断、治疗、病情监测及估计病人的预后等方面发挥着越来越重要的作用。

传统的大分子标志物(大分子蛋白,抗原,激素等)是以抗体为基础进行免疫组化或蛋白质印迹检测,灵敏度低,操作复杂,并且抗体制备困难;基因标志物主要用逆转录-多聚酶链反应进行检测,灵敏度虽然高,但是操作中容易有交叉污染,导致假阳性的出现。对于脑卒中,现在还没有单一,有效的生物标志物,必须将集中生物标志物结合起来才能更全面地认识和了解脑卒中,发挥它的临床作用。当前,在做生化检测时,往往为了全面了解疾病,会做许多标志物的检测,然而有些生物标志物的检测是没有必要的,同时有些生物标志物之间会有信息的重叠,造成信息量的冗余。



技术实现要素:

1.目的:本发明专利的目的是提供一种用于优化选取脑卒中相关生物标志物的方法,它通过选取出的脑卒中生物标志物可以很好的对脑卒中进行预判诊断,减少了脑卒中生化检测过程中信息的冗余浪费,并且提高了检测的准确度。

2.技术方案:

本发明是一种用于优化选取脑卒中相关生物标志物的方法,它主要分为两个环节,考虑到脑卒中存在有出血性脑卒中和缺血性脑卒中两种情况,在进行诊断时要进行区分,所以把脑卒中相关生物标志物的优化选取过程分为两个环节。第一个环节是诊断患者是否患有脑卒中,第二个环节区分得有脑卒中的患者患的是哪一种脑卒中。在每个环节中,先通过互信息分析,分别分析出和患病与否,患哪种脑卒中的互信息值,并以此为进行筛选。再运用主成分分析,减少信息的冗余,最后用支持向量机的方法对筛选出的生物标志物进行调整修正,来完成整个优化选取过程。

本发明专利设计了一种用于优化选取脑卒中生物标志物的方法,该方法具体步骤包括:

步骤1,读入含有多种生化检测出的生物标志物的浓度的个体数据,将各组输入量按照是否患脑卒中定义为1和0,分别计算各个生物标志物浓度和患病与否的互信息值,并对互信息值进行排序;

步骤2,选择步骤1中互信息值较大的几个生物标志物信息,对他们进行主成分分析,选取累计方差贡献率超过80%的几个主成分;

步骤3,按照主成分分析过程中得出的线性组合公式,分别计算选取出的主成分的值作为计算的输入量;

步骤4,将含有多种生物标志物信息的个体进行分类,四分之三个体数据作为训练集,四分之一作为验证集;将步骤3中选取出的主成分结果输入支持向量机之中,训练集先对支持向量机进行学习训练,再通过验证集对患病与否作判断;通过检测预测结果的灵敏度和特异性来评估所选取的生物标志物以及主成分分析是否合适;

步骤5,如果检测的结果较差,即灵敏度和特异性都较低,则返回到步骤1,重新选取互信息值较大的生物标志物,再按照以上步骤进行,直到灵敏度和特异性都达到工程要求。

步骤6,将前五步输入数据中的正常人数据进行剔除,再将出血性脑卒中患者定义为2,缺血性脑卒中定义为3;分别计算各个生物标志物浓度和患两种病的互信息值,并对互信息值进行排序;

步骤7,选择步骤6中互信息值较大的几个生物标志物信息,对他们进行主成分分析,选取累计方差贡献率超过80%的几个主成分;

步骤8,将去除正常人后的个体信息进行分类,四分之三个体数据作为训练集,四分之一作为验证集;将步骤7中选取出的可以区分两种脑卒中的主成分结果输入支持向量机之中;支持向量机先通过训练集进行学习训练,再通过验证集对两种病进行区分;通过对两种病区分结果的灵敏度和特异性来评估所选取的生物标志物以及主成分分析是否合适;

步骤9,如果检测的结果较差,即灵敏度和特异性都较低,则返回到步骤6,重新选取互信息值较大的生物标志物,重复步骤6~8,直到灵敏度和特异性都达到工程要求;这样最终输出的结果就是能够将正常人、缺血性脑卒中患者、出血性脑卒中患者区分开生物标志物选取组合方式。

3、优点及功效:

本发明一种用于优化选取脑卒中相关生物标志物的方法,具有以下几个优点:

(1)本发明通过两个步骤对脑卒中生物标志物进行选取组合,减少了信息的冗余浪费,同时通过了支持向量机的检验,实现了对选取结果的修正,实现了通过选取出生物标志物信息可以实现脑卒中的诊断。

(2)本发明减少了生化检测的种类项目,降低了诊断成本,提高了诊断的正确率,同时可以实现脑卒中风险的预判,保护生命财产安全。

(3)本发明提供了一种处理生物信息的普遍手段,对于其他疾病的生物标志物信息可以使用同样的方法进行优化选取,是一种普适的方法。针对一些要通过多种生化检测来进行诊断的疾病,比方说乳腺癌,肺癌等,生物标志物信息有着很大作用,可以使用同种方法进行处理来提高断的灵敏度和特异性。

附图说明

图1是本发明的流程框图。

具体实施方式

下面结合附图和实施例,对本发明的技术方案做进一步的说明。

见图1所示,本发明一种用于优化选取脑卒中生物标志物的方法,该方法具体步骤包括:

步骤1,将从合作单位获取的就诊者生物标志物信息输入,共计24种生物标志物信息。将各组输入量按照是否患脑卒中定义为1和0,分别计算各个生物标志物浓度和患病与否的互信息值,并对互信息值进行排序;

步骤2,通过互信息值的排序,我们筛选出尿酸,血浆纤维蛋白原等12种相关性大的生物标志物,对他们进行主成分分析。通过选取累计方差贡献率超过80%的主成分,我们选出了6个综合指标;

步骤3,按照主成分分析过程中得出的线性组合公式,分别计算选取出的主成分的值作为计算的输入量;

步骤4,将含有多种生物标志物信息的个体进行分类,将四分之三数据作为训练集,四分之一数据作为验证集;将步骤3选取出的主成分结果输入支持向量机之中,选择径向基函数作为核函数,通过交叉验证的方法找到最合适的惩罚参数和核函数参数。训练集先对支持向量机进行学习训练,再通过验证集对患病与否的判断;通过检测预测结果的灵敏度和特异性来评估所选取的生物标志物以及主成分分析是否合适;

步骤5,如果检测的结果较差,即灵敏度和特异性都较低,则返回到步骤1,重新选取互信息值较大的生物标志物,再按照以上步骤进行,直到灵敏度和特异性都达到工程要求。通过实验,发现选出的6个主成分可以很好的区分正常人和病人,灵敏度和特异性都达到了100%。

步骤6,将前五步输入数据中的正常人数据进行剔除,再将出血性脑卒中患者定义为2,缺血性脑卒中定义为3;分别计算各个生物标志物浓度和患两种病的互信息值,并对互信息值进行排序;

步骤7,由于出血性脑卒中和缺血性脑卒中在生物标志物信息上区分较小,不同于前一环节,选出了同型半胱氨酸,C反应蛋白等6种生物标志物,对他们进行主成分分析,选取累计方差贡献率超过80%的几个主成分,最终选择出三个主成分;

步骤8,将已有患有脑卒中患者的数据进行分类,四分之三数据作为训练集,四分之一作为验证集;将步骤7选取出的可以区分两种脑卒中的主成分结果输入支持向量机之中,选择径向基函数作为核函数,通过交叉验证的方法找到最合适的惩罚参数和核函数参数;支持向量机先通过训练集进行学习训练,再通过验证集对两种病的区分;通过对两种病区分结果的灵敏度和特异性来评估所选取的生物标志物以及主成分分析是否合适;

步骤9,如果检测的结果较差,即灵敏度和特异性都较低,则返回到步骤6,重新选取互信息值较大的生物标志物,再重复步骤6~8,直到灵敏度和特异性都达到工程要求。最终实验结果可以较好的把出血性脑卒中患者和缺血性脑卒中患者区分开,灵敏度和特异性都达到了80%以上,得到了较好的效果。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1