一种用于检测强直性脊柱炎易感风险位点的试剂盒的制作方法

文档序号:14590149发布日期:2018-06-02 06:31阅读:246来源:国知局

本发明涉及一种用于检测强直性脊柱炎易感风险位点的试剂盒,属于分子生物学和医学领域。



背景技术:

强直性脊柱炎(ankylosing spondylitis,AS)是脊柱关节病(spondyloarthropathies,SpA)的原型,它主要的临床表现为隐匿起病的炎性腰背痛、晨僵,后期导致脊柱活动受限,可合并外周关节炎、肌腱末端、韧带附着点炎等表现,疾病晚期出现脊柱强直或畸形,生活质量严重下降。目前亚洲人群强直性脊柱炎患病率为0.23%,患者人数超过500万人。目前认为遗传因素、肠道菌群、免疫紊乱均参与AS发病,其中,基于三分之一的AS患者有家族史、AS与HLA-B27基因强相关,遗传因素被认为在AS发病中占据重要地位。既往的基于双胞胎的研究提示,遗传因素在AS的发病机制中的作用可达90%。在AS疾病易感基因的研究过程中,HLA-B27是最早也是被认为与AS的家族聚集性的遗传相关的重要的基因,而整个MHC占的比例约是40-50%。MHC又叫主要组织相容性复合体,是存在于脊椎动物某一染色体上编码主要组织相容性抗原的一组紧密连锁的基因群,与免疫应答、免疫调节和移植排斥等有关。研究认为HLA-B27在疾病的总的遗传风险大约占20-30%。

近年来,研究者对AS遗传易感性的认知,由于全基因组关联分析研究(genome-wide association study,GWAS)的普及应用得到了前所未有的提高,目前在欧洲人群中已有超过40余个AS疾病易感区域被报道,这为研究AS的发生和发展的机制开辟了全新的思路。GWAS是基于“常见疾病,常见变异”的研究思路,认为复杂疾病是多个易感基因在散发无亲缘关系的人群中分布频率不同、结合环境等多方面因素发生的;通过在病例和对照人群中,对全基因组范围的位点进行全扫并分析,寻找在病例组与对照组中最小等位基因频率(minor allele frequency,MAF)相差达到统计学差异的易感SNP,认为其与疾病易感风险相关,从而进一步探讨疾病的致病或易感基因。

GWAS检测的位点,多为单核苷酸多态性位点(single nucleotide polymorphism,SNP),其主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。GWAS报道的SNP多位于基因以外的非编码序列上。欧洲人群关于AS易感位点的GWAS研究最早在2007年,使用包含14,436个SNP的全基因组芯片对1000例AS病人及1500例对照进行全扫及验证,发现了IL23R和ARTS1(ERAP1)这两个基因是AS的新易感基因。2010年采用Illumina HumHap370芯片对澳大利亚、英国和北美等大样本欧洲人群进行全扫并验证,除了确认此前报道的ERAP1和IL-23R基因,还报道了2p15,21q22,ANTXR2,IL1R2等易感区域。2011年通过对前期芯片数据的整合及进一步大样本研究,报道了三个新的易感区域:RUNX3,LTBR-TNFRSF1A,IL12B;并发现ERAP1与HLA-B27在AS发病中存在基因间相互作用,ERAP1仅在HLA-B27阳性患者中与AS存在相关性。2013年通过Immunochip免疫芯片对9069例AS病人及13578例对照进行全扫筛选,进一步发现13个AS易感区域;而2016年通过增加对照例数,又新报道了17个AS易感区域。多个欧洲人群的GWAS研究,至今已报道超过40个易感区域、64个达到或接近统计学差异的易感位点,这些易感位点揭示了炎症反应、白介素23-白介素17轴、免疫反应等多个通路参与AS发病。

而在中国汉族人群中AS易感区域的研究,存在以下局限性及需解决问题:1)多数研究为小样本量的候选位点研究,检验效能不足;2)多数研究没有考虑南北人群间基因位点的MAF频率差异,也难以校正其混杂因素;3)前期中国人群的全基因组芯片研究结果提示,某些欧洲人群报道的位点在中国人群中基因分布频率差异大、且未在中国人群中发现其与AS相关,提示AS易感区域可能存在人群异质性。



技术实现要素:

基于上述研究背景,本发明设计了基于Illumina Human610-Quad芯片和Illumina OmniExpress芯片对中国汉族AS患者和健康志愿者对照人群中进行全扫并进行关联分析的研究思路,剖析南北人群中基因频率分布差异,以荟萃分析结果探索中国人群中AS相关的易感基因,并使用风险分数对人群AS易感风险进行预测。

由于目前AS仍存在延误诊断的现象,易造成残疾,应争取早期诊断、治疗,因此在该领域迫切需要找出在中国人群中与AS相关的易感位点,研究这些AS易感位点对中国人群AS易感风险的预测作用及效果。

本发明申请是针对目前在AS的早期诊断中尚缺乏特异性的检测位点及预测方法的不足,提供一种用于检测强直性脊柱炎易感风险位点的试剂盒,所述的试剂盒用于检测如下位点基因型:rs6600247、rs10865331、rs10510607、rs12504282、rs11742270、rs30187、rs10045403、rs10050860、rs639575、rs8006884、rs2297518、rs9901869、rs8070463和/或rs2836883。

本发明的有益效果在于,上述试剂盒用于检测多个中国汉族人群特异的易感位点组合,以此协助治疗。

说明书附图

图1为HLA-B27标签SNP以及非MHC区易感位点组合的wPRS预测效果图。

具体实施方式

本发明申请通过密集型的Illumina Human610-Quad芯片和Illumina OmniExpress芯片对大样本的强直性脊柱炎患者和健康对照中国汉族人群进行全基因组关联分析,首次发现并证明了14个SNP位点在中国汉族人群中与AS存在明显相关性:rs6600247,rs10865331,rs10510607,rs12504282,rs11742270,rs30187,rs10045403,rs10050860,rs639575,rs8006884,rs2297518,rs9901869,rs8070463和rs2836883。SNP rs6600247碱基是C(胞嘧啶)时为风险型,是T(胸腺嘧啶)时为保护型;SNP rs10865331碱基是A(腺嘌呤)时为风险型,是G(鸟嘌呤)时为保护型;SNP rs10510607碱基是C(胞嘧啶)时为风险型,是T(胸腺嘧啶)时为保护型;SNP rs12504282碱基是T(胸腺嘧啶)时为风险型,是C(胞嘧啶)时为保护型;SNP rs11742270碱基是G(鸟嘌呤)时为风险型,是A(腺嘌呤)时为保护型;SNP rs30187碱基是T(胸腺嘧啶)时为风险型,是C(胞嘧啶)时为保护型;SNP rs10045403碱基是A(腺嘌呤)时为风险型,是G(鸟嘌呤)时为保护型;SNP rs10050860碱基是C(胞嘧啶)时为风险型,是T(胸腺嘧啶)时为保护型;SNP rs639575碱基是T(胸腺嘧啶)时为风险型,是A(腺嘌呤)时为保护型;SNP rs8006884碱基是C(胞嘧啶)时为风险型,是T(胸腺嘧啶)时为保护型;SNP rs2297518碱基是A(腺嘌呤)时为风险型,是G(鸟嘌呤)时为保护型;SNP rs9901869碱基是A(腺嘌呤)时为风险型,是G(鸟嘌呤)时为保护型;SNP rs8070463碱基是C(胞嘧啶)时为风险型,是T(胸腺嘧啶)时为保护型;SNP rs2836883碱基是G(鸟嘌呤)时为风险型,是A(腺嘌呤)时为保护型;P值均小于0.05,达到统计学差异,可认为其在中国人群中与AS相关。因此,上述14个SNP位点可作为检测AS的特异性SNP,是强直性脊柱炎早期重要的辅助诊断指标,并在此基础上完成了本发明。

经研究分析后发现:提供14个AS致病相关性单核苷酸多态性位点(SNP)信息,在对应的14个位点上,AS患者碱基为风险型等位基因的频率显著高于健康对照,相反,该位点上碱基为保护型的频率则显著低于健康对照,当在上述位点检测到风险型等位基因改变时,则AS的患病风险增大,符合的位点数越多,AS患病风险越大,预测效果越明显。

可涉及的检测样品包括血液、体液或组织。本发明涉及的方法步骤如下:

1.研究对象:收集1965例AS病例,主要是2005-2009年于中山大学附属第三医院门诊就诊或住院的AS患者,病例经风湿病学专家们确诊,符合1984年纽约修订的AS诊断标准。对于每个AS患者,在被告知之该研究目的之后同意抽血用于该研究,并签署知情同意书。健康志愿者对照人群则主要包括了安徽、山东、广东、新加坡、南京的无AS症状或病史的健康中国汉族人群,这些健康志愿者同样在被告知之后同意抽血用于该研究,并签署知情同意书。对研究对象抽取全血4ml,放于EDTA管,带回实验室使用TIANamp Blood DNA kit血液基因组DNA提取试剂盒,根据试剂盒操作按步骤提取DNA。

2.检测芯片:采用Illumina HuamHap 610-Quad SNP芯片、Illumina OmniExpress芯片分别对968例及997例AS样本进行检测,2种分别覆盖基因组61万及73万个位点,主要是SNP位点。根据2种芯片平台上的病例,分别匹配相同或相似检测芯片的中国人群对照样本,具体见下:

3.数据分析:(1)按照芯片检测流程进行基因型检测,使用Illumina Beadstudio进行数据读取和基因型转换的原始数据,对各个数据分别进行初步质量控制(quality control,QC),QC标准:样本可读率(call rate)<96%,样本检测性别与记录性别不一致者,MAF<1%,位点可读率<90%以及对照中HWE的P值<10-8);(2)初步QC后分别合并2个平台的样本,进一步行严格质控:位点可读率<96%,MAF<1%,HWE P值<10-6;去除杂合度大于平均值(Mean)+3×标准差(SD)的样本,基于PLINK软件和基于IBS(identical by state)的方法计算可能具有亲缘关系的一对标本,去除其中一个可读率较低的,以得到分析样本中不存在一级和二级亲属;利用PCA得到中国人群样本且控制对照:病例比例约2:1,并根据PCA分为南北人群。QC后最终得到四个数据集:239例AS与600例对照(451984SNPs)、667例AS与1462例对照(451984SNPs)、585例AS与1108例对照(532418SNPs)、362例AS与878例对照(532418SNPs)。(3)在4个数据集中使用SHAPEIT软件进行单倍型构建、IMPUTE2软件进行基因型填补,填补后根据填补准确度>=80%、MAF>=0.5%、HWE在对照中的P值<10-6进行填补后数据质控,SNPTEST软件进行填补基因型关联分析、META软件对4个数据集进行荟萃分析,进一步去除样本中最佳基因型概率<90%的位点填补结果,去除缺失率>=10%的位点,最终得到1853例AS与4048例对照的5,852,133个SNP位点数据结果。根据欧洲人群报道区域,抽取其中非MHC区47个易感区域共51个位点进行分析。

4.关联结果:共发现14个SNP位点与AS相关,整合4个数据集中这些位点的染色体位置、风险型/保护型等位基因、分布频率、比值比(odds ratio,OR),P值结果:

1.风险分数计算及预测模型:计算14个位点组合在AS和对照样本的wPRS,绘制ROC曲线,计算(area under the curve,AUC),发现使用14个位点对预测AS易感风险的效果一般(AUC=0.578,95%置信区间(95%CI)=0.411~0.699),可能与非MHC区易感位点可解释AS表型变异度的比例仅小相关;而仅使用HLA-B27标签SNP rs13202464的预测模型,可较有效区分AS病例和对照(AUC=0.871,95%CI=0.859~0.882);进一步结合14个易感位点和rs13202464的预测模型,有更明显的区分效应(AUC=0.884,95%CI=0.873~0.895),使用DeLong’s方法进行统计学检验,P值有统计学差异(P=2.17×10-6)。

可见,我们发现了上述14个易感位点在中国人群中与AS相关,且组合14个易感位点可以提高AS易感风险预测的特异度和敏感度,并具有统计学差异。

风险分数计算及预测模型:根据权重后多基因风险分数(weighted Polygenic Risk Score,wPRS)的计算方法,提取AS及对照中各个位点无缺失的样本,及AS相关的非MHC位点及HLA-B27标签SNP的数据结果(实测及最佳填补基因型、Beta值),按照“wPRS=(风险型等位基因(0,1,2)*Beta值的总和)/总Beta值”计算公式,计算多个位点组合在AS和对照样本的wPRS,绘制受试者工作特征曲线(receiver operating characteristic curve,ROC曲线),反映不同组合的灵敏度和特异度预测情况,及不同模型统计学差异。

根据上述的研究结果,本发明提供了一种试剂盒,该试剂盒用于检测以下的基因位点:rs6600247、rs10865331、rs10510607、rs12504282、rs11742270、rs30187、rs10045403、rs10050860、rs639575、rs8006884、rs2297518、rs9901869、rs8070463和/或rs2836883。

如图1所示,“HLA-B27+SNP”为HLA-B27标签SNP以及非MHC区易感位点组合的wPRS预测效果,其曲线下面积(AUC)可达0.884,其敏感度为89.0%,特异度为84.8%。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1