一种提高慢阻肺急性加重状态诊断准确率的风险预测方法

文档序号:26952998发布日期:2021-10-16 02:28阅读:482来源:国知局
一种提高慢阻肺急性加重状态诊断准确率的风险预测方法

1.本发明涉及医疗检测领域,特别涉及一种新型的慢阻肺急性加重的风险预测方法。


背景技术:

2.慢性阻塞性肺病,简称慢阻肺,是一种常见的慢性气道炎症疾病,其特点是出现持续性的呼吸系统症状和气道受限。慢阻肺急性加重是患者在短期内出现呼吸系统症状的持续恶化,它会进一步恶化患者健康状况,加速肺功能下降并增加死亡率。目前认为慢阻肺患者是否会出现急性加重是由多因素共同作用的结果,其中基因起着重要作用。
3.慢阻肺是一种高发病率高死亡率疾病,急性加重需要的额外治疗更是给患者家庭和社会带来巨大的经济负担。近年来,全基因组关联研究和候选基因研究发现了大量慢阻肺易感多态位点。因此,通过慢阻肺急性加重个体和对照慢阻肺非急性加重个体的基因型数据建立相应的模型,预测慢阻肺个体的急性加重发生风险就显得十分重要。
4.通过风险预测模型,测定一个人的基因型数据就可以计算出慢阻肺急性加重发生的风险大小。若风险较高,则需要制订更谨慎的治疗方案,也需要病人更加注意预防。
5.遗传风险评分(genetic risk score,grs)作为分析单核苷酸多态性(single nucleotide polymorphisms,snp)与复杂疾病临床表型的有效方法。单个snp对疾病具有微弱效应,而grs方法整合了若干个snp的微弱效应,已被广泛用于疾病诊断、治疗、预后等临床阶段。在grs方法中,对目标人群进行全基因组测序,用所得的全基因组数据建立grs模型,其可以表示为:(β
i
表示第i个snp的权重,g
i
表示第i个snp的风险等位基因的个数,n为snp的数量)。该算法认为每个风险等位基因对疾病的影响不同,通过给每个风险等位基因赋予相应的权重来表明snp对疾病的影响程度。
6.但传统的grs使用全基因组测序,不但所需样本量较大,且数据量大、处理复杂、产出速度较慢、定位不够准确,使得研究工作繁重且定位基因的时间周期较长。因而,目前需要一种更准确地、快速预测慢阻肺急性加重风险的方法。


技术实现要素:

7.鉴于现有技术中的上述需求,本发明使用了全外显子组测序(wes)技术。外显子组是单个个体的基因组dna上所有蛋白质编码序列的总合。人类外显子组序列约占人类全部基因组序列的1%,但大约包含85%的致病突变。相比全基因组测序,全外显子测序更加经济、高效,其技术优势在于直接对蛋白编码序列进行测序,找出影响蛋白结构的变异;高深度测序,可发现变异频率低于1%的罕见变异;仅针对外显子组区域,有效降低测序费用、存储空间和工作量。用全外显子测序技术得到的snp数据建立的egrs(exon genetic risk score,egrs)风险预测模型相比传统grs在多方面都更具优势。
8.本发明的目的是克服上述现有问题,建立一种新型的慢阻肺患者发生急性加重风险的预测模型。
9.本发明的慢阻肺患者发生急性加重风险的预测模型通过以下步骤获得:
10.1)获得慢阻肺急性加重个体和慢阻肺非急性加重个体的全外显子snp基因型;
11.2)根据数据中各snp相应风险等位基因个数进行0、1、2评分,筛选出与慢阻肺急性加重显著相关的snp;
12.3)进一步得到与慢阻肺急性加重显著相关的snp及其相应or值;
13.4)利用步骤3)获得的与慢阻肺急性加重相关的snp及其相应or值建立改进的egrs模型。
14.在本发明的具体实施方案中,首先对大量慢阻肺急性加重个体和慢阻肺非急性加重个体进行外显子基因测序,得到其慢阻肺急性加重个体和慢阻肺非急性加重个体的外显子原始snp基因型数据。
15.在优选的实施方案中,可使用本领域公知的任何方法获得个体的外显子snp基因型数据,包括但不限于使用life technologies的ion proton
tm
系统和5500xl基因分析仪。
16.随后经过质量控制、哈迪

温伯格平衡检验等流程,除去不合格基因型数据,保留合格的外显子snp基因型数据,进行进一步分析。
17.在本发明的具体实施方案中,根据数据中各snp相应的风险等位基因个数进行0、1、2评分,具体地是指,将得到的外显子snp基因型数据,规定含两个风险等位基因的纯合子记2分,含一个风险等位基因的杂合子记1分,无风险等位基因的纯合子记0分(通常选择频率低的等位基因为风险等位基因)。应用该评分方法标示相应的snp数据,记为g
i

18.在本发明具体的实施方案中,为了筛选出与慢阻肺急性加重显著相关的snp,用logistic回归算法分析得到与慢阻肺急性加重显著相关的snp(p<0.01)及其相应的or值。
19.在本发明的具体实施方案中,对如前所述的获得的慢阻肺急性加重独立影响的snp的or值取自然对数得到相应的权重β
i
。使用全部慢阻肺急性加重显著相关的snp建立改进的egrs模型,egrs模型表示为各snp风险等位基因数g
i
与snp对应权重β
i
乘积之和,得到发生慢阻肺急性加重风险模型为egrs=sum(β
i
g
i
)。
20.在本发明的另一方面,提供了一种预测慢阻肺患者急性加重风险的方法,所述方法包括以下步骤:
21.1)获得所述慢阻肺患者的外显子snp基因型;
22.2)利用egrs=sum(β
i
g
i
)预测该患者发生急性加重的风险;其中,β
i
表示第i个急性加重易感snp的关联系数,g
i
表示第i个snp基因型的评分,即,该样本携带的第i个snp的多少个风险等位基因,为0,1,2中的一个值。
23.在另一方面,本发明提供了外显子snp基因型在制备用于预测慢阻肺患者急性加重风险的试剂盒中的用途。
24.在本发明所述用途的优选的实施方案中,所述外显子snp基因型与风险模型egrs=sum(β
i
g
i
)组合用于制备预测慢阻肺患者急性加重风险的试剂盒。
25.在本发明所述用途的进一步优选的实施方案中,所述外显子snp为表1中所列出的snp中的一个或多个,或其组合。
26.在本发明所述用途的进一步优选的实施方案中,所述外显子snp为人类基因组中的全部外显子snp。
27.另一方面,本发明还提供了用于预测慢阻肺患者急性加重风险的装置,所述装置
包括:
28.1)数据获取装置,用于获得受试者的外显子snp基因型;
29.2)数据处理装置,用于执行egrs=sum(β
i
g
i
)的公式;
30.3)输出装置,根据执行egrs=sum(β
i
g
i
)的公式的结果,将受试者分类为慢阻肺患者急性加重风险和慢阻肺患者非急性加重风险人群。
31.与已有方法相比,本发明的有益效果是:本发明实施例中,建立了一种新型的慢阻肺患者发生急性加重的风险预测方法,该方法基于现有的grs,将grs和wes相结合,提出了改进的egrs方法,利用全外显子测序技术使得测序深度更高,可发现变异频率低于1%的罕见变异;仅针对外显子组区域,有效降低测序费用、存储空间和工作量。而使用egrs方法可以深度利用数据信息从而提高模型的准确率。
附图说明
32.图1为本发明的方法流程图;
33.图2稳定型与急性加重型个体egrs评分箱型图;
34.图3为对验证集样本预测的roc曲线图。
具体实施方式
35.下面结合附图和具体实施方式对本发明做进一步详细描述。以下实施例或者附图用于说明本发明,但不用来限制本发明的范围。
36.如图1所示,本发明是通过以下技术方案实现的:检测慢阻肺急性加重个体和慢阻肺非急性加重个体的外显子snp基因型数据,筛选出与慢阻肺急性加重显著相关的snp,根据数据中风险等位基因个数进行0、1、2评分,进一步得到对慢阻肺急性独立影响的snp及相应or值,然后利用以上遗传信息数据建立改进的egrs模型,最后使用模型进行慢阻肺急性加重风险预测。
37.具体地,本发明的风险模型如下获得:
38.1、获取慢阻肺急性加重个体和慢阻肺非急性加重个体的外显子基因型数据;
39.2、对snp数据进行转换
40.人为选择snp中的一个等位基因为风险等位基因(通常选择频率低的等位基因为风险等位基因),相应的另一个等位基因为参考等位基因。将含两个风险等位基因的纯合子记为2分,将含一个等位基因和一个非风险等位基因的杂合子记为1分,将不含有风险等位基因的纯合子记为0分,分数记为g
i

41.3、筛选得到与慢阻肺急性加重显著相关的snp及其相应的or值
42.通过logistic回归得到与慢阻肺急性加重显著相关的snp(p<0.01)及其相应的or值。
43.4、建立相应的egrs模型
44.对各snp相应的or值取自然对数得到各变量的权重β
i
,改进的egrs表示为各snp风险等位基因数g
i
与snp对应权重β
i
乘积之和。于是可以得到慢阻肺急性加重发病风险的模型为egrs=sum(β
i
g
i
)。
45.5、慢阻肺急性加重风险预测
46.对个体进行慢阻肺急性加重风险预测,只需测定该个体的外显子基因型数据,利用上述模型就可以计算出该人慢阻肺急性加重的风险大小。
47.本发明人建模使用的外显子snp数据来自北京协和医院呼吸内科慢阻肺住院病人共72人,其中稳定期患者30人,急性加重期患者42人。将72人随机分成两组,训练集52人和验证集20人。采集全部72人血液检测外显子snp基因型数据,对训练集52人的血液外显子snp基因型数据进行质控剔除不合格的snp,包括:单个snp的检出率低于95%,个体的snp检出率不低于90%。52人的外显子snp按风险等位基因(通常选择频率低的等位基因为风险等位基因)的个数进行0、1、2计分转换记为g
i
,并通过单因素logistic回归分析得到与慢阻肺急性加重显著相关的外显子snp及其相应的or值及95%置信区间,对or值取自然对数得到各外显子snp相应的权重β
i
。得90个与慢阻肺急性加重相关的外显子snp,如表1所示:
48.表1与慢阻肺急性加重显著相关的90个snp
49.50.利用52人的与慢阻肺急性加重显著相关的外显子snp数据建立改进的egrs模型:egrs=sum(β
i
g
i
)。基于egrs模型,我们使用线性回归模型进行稳定期copd与急性加重copd间的诊断预测。
51.为了检验该模型建立是否成功,我们利用改进的egrs对验证集20人外显子snp数据进行分析,得到20个慢阻肺急性加重患者的egrs分数(表2)及预测结果(图3),相应的roc曲线如图3所示,roc曲线的面积为0.740,提示有较好的预测效能。
52.表2部分个体grs评分结果
[0053][0054]
其中a表示慢阻肺急性加重患者(n=20),s表示慢阻肺非急性加重患者(n=16)。
[0055]
采用改进的egrs模型对验证集患者慢阻肺急性加重风险预测的正确率为74%,说明该模型在预测慢阻肺患者是否会出现急性加重方面有极大的潜力。
[0056]
综上所述,本发明实施方式提供了一种改进的慢阻肺急性加重风险预测方法,该方法基于现有的grs方法,将grs和wes相结合,提出了改进的egrs方法,利用全外显子测序技术使得测序深度更高,可发现变异频率低于1%的罕见变异;仅针对外显子组区域,有效降低测序费用、存储空间和工作量。而使用egrs方法可以深度利用数据信息从而提高模型的准确率。
[0057]
以上所述仅为本发明的优选实施而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改。等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1