单核苷酸多态性rs7576984和rs2066802在检测结核易感性中的应用的制作方法

文档序号:12816978阅读:215来源:国知局

本发明属于生物医学领域,涉及stat1基因单核苷酸多态性rs7576984和rs2066802在检测结核易感性中的应用,特别涉及stat1基因单核苷酸多态性(snp)rs7576984和rs2066802位点标志物在人群对结核病易感性筛查和评估中的应用。



背景技术:

结核病(tuberculosis,tb)是一种严重威胁人类健康的全球性疾病,其已成为人类三大感染性疾病杀手之一。世界卫生组织全球结核病报告指出,大约1/3的人被结核分枝杆菌感染,其中仅有10%的感染者发病。这就意味着结核感染者是否发病与宿主-病原体之间的相互作用、环境、遗传等有着密切的关系。最近,许多研究证明结核风险与免疫系统和炎性反应相关基因的多态性有密切的联系。

人类stat1基因位于染色体2q32.2区,其编码产物是信号转导和转录激活因子1(stat1),该蛋白属于stat蛋白家族。stat通路在所有脊椎动物和一些早期的后生动物中是高度保守的,它能够通过简单而直接的方式把许多细胞因子的信号从细胞膜受体传导到细胞核内,该过程可以分为三个基本阶段:受体的激活、信号转导及靶基因表达。细胞因子可以导致其同源受体被janus激酶(jak)磷酸化、进而为细胞浆内的stat提供对接位点;stat蛋白被jak磷酸化后形成同源/异源二聚体并从膜受体转运到细胞核内;stat形成二聚体或更复杂的复合物结合到靶基因调控区域的保守dna序列上、调控转录的起始和增强。研究结果表明结核分枝杆菌感染的b10r鼠巨噬细胞可以诱导不依赖于分枝杆菌吞噬作用的细胞凋亡,结核分枝杆菌可以诱导蛋白酪氨酸激酶(ptk)活化、jak2/stat1-α磷酸化和stat1-α核易位。结核分枝杆菌感染激活jak2/stat1-alpha通路的发现表明结核分枝杆菌可能模仿巨噬细胞激活刺激。

有研究已经确认stat1突变会导致机体对结核分枝杆菌的易感性更高。

随着基因组学的发展和结核分枝杆菌全基因组测序的完成,成千上万的单核苷酸多态性(snp)位点从结核患者身上被鉴定。研究者利用这些数据绘制出结核分枝杆菌snp系谱树并提出了结核分枝杆菌谱系的进化假说。尽管结核分枝杆菌snp研究在方法学和基因组学上取得了举世瞩目的成就,但是中国人群stat1基因snp与结核感染风险之间的关系却依旧知之甚少。

因此,确定中国人群stat1基因的snp并深入研究其与结核患病风险之间的关系显得非常有必要。



技术实现要素:

本发明的目的是提供stat1基因单核苷酸多态性rs7576984和rs2066802在检测结核易感性中的应用。

本发明所提供的应用具体可为三个,即应用a、应用b和应用c。

应用a:用于检测rs7576984位点的单核苷酸多态性的物质在制备评价或辅助评价待测人患结核病的风险性的产品中的应用;

应用b:用于检测rs2066802位点的单核苷酸多态性的物质在制备诊断或辅助诊断待测人是否患有结核病的产品中的应用。

其中,所述rs7576984位点为人类基因组2号染色体上自5’末端起第191003857位核苷酸;所述rs7576984位点的核苷酸为c或a。所述rs2066802位点为人类基因组2号染色体上自5’末端起第191009941位核苷酸;所述rs2066802位点的核苷酸为c或t。

进一步,所述应用a为所述用于检测rs7576984位点的单核苷酸多态性的物质以及记载有如下(a1)或(a2)或(a3)所示内容的可读性载体在制备评价或辅助评价待测人患结核病的风险性的产品中的应用;(a1)在共显性遗传模型下,所述rs7576984位点为ca基因型的待测人患结核病的风险高于所述rs7576984位点为cc基因型的待测人;(a2)在显性遗传模式下,所述rs7576984位点为aa基因型或ca基因型的待测人患结核病的风险高于所述rs7576984位点为cc基因型的待测人;(a3)在隐性遗传模式下,所述rs7576984位点为aa基因型的待测人患结核病的风险低于所述rs7576984位点为ca基因型或cc基因型的待测人。

进一步,所述应用b为所述用于检测rs2066802位点的单核苷酸多态性的物质以及记载有如下(b1)所示内容的可读性载体在制备评价或辅助评价待测人患结核病的风险性的产品中的应用;(b1)在共显性遗传模式下,所述rs2066802位点为ct基因型的待测人患结核病的风险高于所述rs2066802位点为tt基因型的待测人。

应用c:用于检测双体型m的物质在制备评价或辅助评价待测人患结核病的风险性的产品中的应用。

单体型(haplotype)是位于一条染色体特定区域的一组相互关联,并倾向于以整体遗传给后代的单核苷酸多态的组合。双体型为位于同源染色体上的单体型对。

构成所述双体型m的单体型的单核苷酸多态组合依次如下:rs13029247位点和rs7576984位点。

所述rs13029247位点为人类基因组2号染色体上自5’末端起第191001932位核苷酸;所述rs13029247位点的核苷酸为c或t。所述rs7576984位点为人类基因组2号染色体上自5’末端起第191003857位核苷酸;所述rs7576984位点的核苷酸为c或a。

进一步,所述应用c为所述用于检测双体型m的物质以及记载有如下(c1)所示内容的可读性载体在制备评价或辅助评价待测人患结核病的风险性的产品中的应用;(c1)构成所述双体型m的2个单体型中有一个“ta”这种单体型的待测人患结核病的风险高于构成所述双体型m的2个单体型中没有“ta”这种单体型的待测人。

本发明还保护一种产品,含有用于检测rs7576984位点的单核苷酸多态性的物质;所述产品具有评价或辅助评价待测人患结核病的风险性的功能。

其中,所述rs7576984位点为人类基因组2号染色体上自5’末端起第191003857位核苷酸;所述rs7576984位点的核苷酸为c或a。

在本发明中,所述用于检测rs7576984位点的单核苷酸多态性的物质具体为引物对甲或成套单链dna分子甲;所述引物对甲由序列表中序列1所示的单链dna和序列表中序列2所示的单链dna组成;所述成套单链dna分子甲由序列表中序列1所示的单链dna、序列表中序列2所示的单链dna和序列表中序列3所示的单链dna组成。

所述产品中,还可含有记载有如上(a1)或(a2)或(a3)所示内容的可读性载体。

本发明还保护一种产品,含有用于检测rs2066802位点的单核苷酸多态性的物质;所述产品具有评价或辅助评价待测人患结核病的风险性的功能。

其中,所述rs2066802位点为人类基因组2号染色体上自5’末端起第191009941位核苷酸;所述rs2066802位点的核苷酸为c或t。

在本发明中,所述用于检测rs2066802位点的单核苷酸多态性的物质为引物对乙或成套单链dna分子乙;所述引物对乙由序列表中序列4所示的单链dna和序列表中序列5所示的单链dna组成;所述成套单链dna分子乙由序列表中序列4所示的单链dna、序列表中序列5所示的单链dna和序列表中序列6所示的单链dna组成。

所述产品中,还可含有记载有如上(b1)所示内容的可读性载体。

本发明还保护一种产品,含有用于检测双体型m的物质的产品;构成所述双体型m的单体型的单核苷酸多态组合依次如下:rs13029247位点和rs7576984位点;所述产品具有评价或辅助评价待测人患结核病的风险性的功能。

其中,所述rs13029247位点为人类基因组2号染色体上自5’末端起第191001932位核苷酸;所述rs13029247位点的核苷酸为c或t;所述rs7576984位点为人类基因组2号染色体上自5’末端起第191003857位核苷酸;所述rs7576984位点的核苷酸为c或a。

在本发明中,所述用于检测单体型m的物质由用于检测所述rs13029247位点的单核苷酸多态性的物质和用于检测所述rs7576984位点的单核苷酸多态性的物质组成。

其中,用于检测所述rs13029247位点的单核苷酸多态性的物质为引物对丙或成套单链dna分子丙;所述引物对丙由序列表中序列7所示的单链dna和序列表中序列8所示的单链dna组成;所述成套单链dna分子丙由序列表中序列7所示的单链dna、序列表中序列8所示的单链dna和序列表中序列9所示的单链dna组成。用于检测所述rs7576984位点的单核苷酸多态性的物质为引物对甲或成套单链dna分子甲;所述引物对甲由序列表中序列1所示的单链dna和序列表中序列2所示的单链dna组成;所述成套单链dna分子甲由序列表中序列1所示的单链dna、序列表中序列2所示的单链dna和序列表中序列3所示的单链dna组成。

所述产品中,还可含有记载有如上(c1)所示内容的可读性载体。

在本发明中,所述待测人最好来自中国汉族人群。

本发明通过中国汉族人群病例对照研究,首次发现stat1-rs7576984和rs2066802位点多态性与结核风险显著相关联,在共显性遗传模型下stat1-rs7576984ca基因型和stat1-rs2066802ct基因型携带者罹患结核病的风险更好;在显性遗传模型下,stat1-rs7576984位点((ca+aa)vs.cc)基因型与显著增加的结核风险相关;在隐性遗传模型下,stat1-rs7576984位点(aavs.(cc+ca))基因型与显著的抗结核性相关;携带stat1rs13029247-rs7576984双体型“ta”的人罹患结核的风险更高。这一研究成果为筛选和预测结核病提供了新途径,为研发人群结核筛查试剂盒提供了理论依据。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

下述实施例中所用试剂如无特殊说明,均购自国药集团化学试剂公司。

下述实施例中利用全血基因组dna提取试剂盒(北京天根生化科技有限公司,dp304试剂盒)进行全血基因组dna的提取。目标snp的筛选采用theinternationalhapmap(http://hapmap.ncbi.nlm.nih.gov)数据库。中国汉族人基因型数据从haploview4.2数据库获取(http://www.broad.mit.edu/haploview)。应用sequenom公司的基质辅助激光解析时间飞行质谱系统(maldi-tof)中的iplex试剂盒进行snp基因型分析。

实施例1、stat1基因单核苷酸多态性rs7576984和rs2066802在检测结核易感性中的应用

一、患者及分组情况

本发明所涉及的病例-对照研究共选择解放军第三○九医院收治的已确诊病例2039例,分为两组:(1)结核病组:全军结核病研究所收治的临床上经影像学、实验室检查及抗结核治疗而确诊的活动性结核病患者1032例,其中男605例,女427例,平均年龄(39.30±19.29)岁。包括肺结核、结核性胸膜炎、结核性心包炎、结核性脑膜炎、结核性腹膜炎、泌尿系结核、骨关节结核、淋巴结结核等。(2)非结核对照组:临床上经影像学、实验室检查及治疗效果而确诊的非结核疾病患者1007例,其中男534例,女473例,平均年龄(45.23±24.23)岁。

二、人外周血白细胞基因组dna提取

采集患者外周静脉血2ml,置于抗凝管中。应用全基因组dna提取试剂盒(北京天根生化有限公司产品),按照说明书从1ml外周血中提取白细胞基因组dna,溶解于0.1×te缓冲液中(10mmol/ltris-1mmol/ledta,ph8.0),于-20℃冰箱中储存备用。

三、标签snp的选择

使用hapmap数据库的人类全基因组snp的基因型数据,进行标签位点的选择。筛选标签位点遵循连锁不平衡系数r2>0.8的原则,即标签位点与被它代表的位点之间有足够强的连锁不平衡(r2值>0.8)的连锁强度。再使用haploview4.2程序,对从hapmap下载下来的中国汉族人(chb)基因型数据,进行标签位点的选择,所选择的位点仅限最小等位基因频率(minorallelefrequency,maf)>0.05。

四、snp质谱分析

应用sequenom公司的基质辅助激光解析时间飞行质谱系统(maldi-tof)中的iplex试剂盒进行snp基因型分析。其步骤简述如下:

(1)多重pcr引物设计和扩增:5μl反应体系中包括:1×反应buffer,10ng基因组dna,0.5u热启动taqdna聚合酶(hotstartaq,qiagen),500μmol脱氧核糖核苷三磷酸(dntps),每个位点100nmol上游和下游引物,置于384孔板中,使用abi-9700pcr扩增仪,于94℃15min活化dna聚合酶后,于94℃变性20s,56℃退火30s和72℃延伸60s,循环45次。pcr产物用2.0%琼脂糖凝胶电泳检测。

(2)去除未反应的引物和dntps:pcr扩增后,在反应体系中加入2μl0.3u虾碱性磷酸酶(shrimpalkalinephosphatase,sap),于37℃下恒温20min进行多余碱基消减反应,再置于85℃放置5min进行灭活。

(3)单碱基延伸pcr反应:应用iplex试剂盒。调节延伸引物的浓度,降低质谱峰图的背景噪音后,在9μl反应体系中,加入100μmolddntp0.2μl、0.04μl0.05u的上述dna聚合酶、625-1250nmol/l的延伸引物。先置pcr扩增仪94℃30s;再进行延伸pcr反应循环:置94℃5s,5×(52℃5s+80℃5s),该循环进行200次;然后置94℃5s,52℃5s,80℃5s,该循环进行40次;最后置72℃延伸3min,置4℃保存。

(4)纯化的延伸反应产物进行maldi-tof-ms分析:上述样品应用6mg树脂脱盐处理后,应用自动机械臂点样仪转移至sequenom的384孔质谱芯片上,另在384孔质谱芯片上设置4个孔的重复质控样品。在质谱分型系统中对点样后的质谱芯片进行基因分型。

(5)数据采集和基因型分析:不同的波谱峰形状代表电荷标记的不同质量。如果产物中存在2个单核苷酸多态性位点,每一个位点有1个等位基因,那么该等位基因是纯合子;如果质谱仪捕捉到4个不同的波谱峰,那么2个单核苷酸多态性是杂合子。通过操作界面typer4.0软件包读取质谱峰图,获得基因型数据。

五、统计学分析

所有数据的统计采用statastatisticalpackage(version10.0;statacorplp,collegestation,tx,usa)软件,结核组与非结核对照组等位基因频率和基因型差异采用χ2检验,当p<0.05时表明有显著性差异。非结核对照样本的各个snp位点采用hardy-weinbergequilibrium(hwe)平衡采用数据库(http://ihg.gsf.de/cgi-bin/hw/hwal.p1)中的χ2检验进行平衡检验,当p>0.05时表示通过hardy-weinberg平衡检验的标准。akaike信息标准被用于选取每个snp最保守的遗传模型。通过非条件logistic回归计算目标snp基因型的比值比(or)和95%置信区间(ci)并辅以年龄和性别加以校正。

各snp位点间的连锁不平衡(ld)强度按照常规的做法采用lewontin标准化系数d和连锁不平衡系数r2来表示,单体域采用haploview4.2软件的默认参数进行划分。在各个单体域内,采用基于bayesian算法的phase2.1软件,推断出每个样品的单体型。随后采用haplo.stats软件进行单体型分析。具体的方法是:基于广义线性模型,并辅以各种混杂因子的校正,进行全局性(global)和针对单体型(haplotype-specific)的hap.score分析。各个单体域内频率<0.03的单体型,合并为其他(others)项。使用100000次置换(simulations)检验得到观察p值,并计算各个单体型的hap.score值。对bayesian算法获得的双单体型(diplotype)数据,同样进行非条件性logistic回归分析,并校正年龄和性别。某一单体型的双体型分为3类:0份拷贝样本、1份拷贝样本和2份拷贝样本,以0份拷贝样本为参照,分析1份拷贝样本和2份拷贝的结核易感性或抗结核性。

六、实验结果分析

通过基因型分析,从stat1基因选出5个单核苷酸多态性(snp)位点,即rs2280235位点、rs16833155位点、rs13029247位点、rs7576984位点和rs2066802位点。所述rs7576984位点为人类基因组2号染色体上自5’末端起第191003857位核苷酸;所述rs7576984位点的核苷酸为c或a。所述rs2066802位点为人类基因组2号染色体上自5’末端起第191009941位核苷酸;所述rs2066802位点的核苷酸为c或t。所述rs13029247位点为人类基因组2号染色体上自5’末端起第191001932位核苷酸;所述rs13029247位点的核苷酸为c或t。

步骤四中用于检测所述rs7576984位点的上下游引物为引物1和引物2,延伸引物为引物3。引物1和引物2是一对引物,扩增含待测位点前后约200-300bp的产物,引物3是第3条引物即单碱基延伸引物,约15-20bp,只在200-300bp产物的一条链上延伸1个碱基。最终通过质谱检测16-21bp延伸子的分子量大小对应基因型。

引物1:5’-acgttggatgtgtcctgtgggctttgtaac-3’(序列1);

引物2:5’-acgttggatggggaagtcagaattctccag-3’(序列2);

引物3:5’-ccctctggtccctctctcta-3’(序列3)。

步骤四中用于检测所述rs2066802位点的上下游引物为引物4和引物5,延伸引物为引物6。

引物4:5’-acgttggatgcactgtgccaggtactgtct-3’(序列4);

引物5:5’-acgttggatgaaaattcctggagcaggttc-3’(序列5);

引物6:5’-ttgagcaggttcaccagct-3’(序列6)。

步骤四中用于检测所述rs13029247位点的上下游引物为引物7和引物8,延伸引物为引物9。

引物7:5’-acgttggatgcacagtttttgctgtgtggg-3’(序列7);

引物8:5’-acgttggatgcctgttctcatagagattaa-3’(序列8);

引物9:5’-gattaaattctagaaagatgttattttt-3’(序列9)。

这些snp的具体信息、染色体位置及等位基因频率见表1。所有位点在非结核对照组样本中均通过了hardy-weinberg平衡检验(p>0.01)。尽管5个等位基因频率在结核组和非结核对照组之间无显著性差异(表1)。但如表2所示,在共显性遗传模型下,stat1-rs7576984位点ca基因型在结核组和非结核对照组之间存在显著性差异(p=0.003),stat1-rs2066802位点ct基因型在结核组和非结核对照组之间存在显著性差异(p=0.023)。进一步非条件logistic回归分析发现stat1-rs7576984位点ca基因型与显著增加的结核风险相关(p=0.004,or1.347,95%ci1.100-1.650),stat1-rs2066802位点ct基因型在与显著增加的结核风险相关(p=0.042,or1.215,95%ci1.007-1.466)。如表3所示,在显性遗传模型下,stat1-rs7576984位点((ca+aa)vs.cc)基因型与显著增加的结核风险相关(p=0.022,or1.258,95%ci1.033-1.531);在隐性遗传模型下,stat1-rs7576984位点(aavs.(cc+ca))基因型与显著的抗结核性相关(p=0.037,or0.515,95%ci0.276-0.962)。此外,其它4个snp在显性遗传模型或隐性遗传模型下均无显著的结核风险或抗结核性。

表1stat1基因snp位点信息及基因频率一览表

表2共显性遗传模型下stat1基因5个snp基因型频率在结核组与对照组之间的分布

表3显性或隐性遗传模型下stat1基因5个snp基因型频率在结核组与对照组之间的分布

即根据以上结果,可知:(a1)所述rs7576984位点为ca基因型的待测人患结核病的风险高于所述rs7576984位点为cc基因型的待测人(共显性遗传模型);(a2)所述rs7576984位点为aa基因型或ca基因型的待测人患结核病的风险高于所述rs7576984位点为cc基因型的待测人(显性遗传模型);(a3)所述rs7576984位点为aa基因型的待测人患结核病的风险低于所述rs7576984位点为ca基因型或cc基因型的待测人(隐性遗传模型);(b1)所述rs2066802位点为ct基因型的待测人患结核病的风险高于所述rs2066802位点为tt基因型的待测人(共显性遗传模型)。

为了进一步评价5个snp两两位点间的连锁不平衡强度,我们采用haploview发现了一个由rs7576984和rs13029247等2个snp组成的单体域。我们从目标人群中只发现了4个最常见的单体型(cc,tc,ta,ca)(表4),全局性分数检验表明该单体域中的这些单体型在结核组和非结核对照组之间无显著性差异(globalp=0.18241,df=5)。进一步logistic回归分析发现,虽然单体型“ta”与结核风险之间无显著地联系,但是在其组成的双体型“ta”在1份拷贝时与显著增加的结核风险相关(p=0.001,or1.393,95%ci1.138-1.706)(表5)。

表4stat1基因常见单体型与结核风险间的联系

a.p值:单体型频率在结核组与对照组之间的差异.

b.psim:100000次置换后的差异.

c.非条件性logistic回归分析,加以年龄和性别校正.

d.na:不适用.

表5stat1基因snp双体型与结核风险之间的联系.

a.非条件性logistic回归分析,辅以年龄和性别校正.

b.全局性检验.

即根据以上结果可知:(c1)构成双体型的2个单体型中有一个“ta”这种单体型的待测人患结核病的风险高于构成双体型的2个单体型中没有“ta”这种单体型的待测人。

本发明通过中国汉族人群病例对照研究,首次发现stat1-rs7576984和rs2066802位点多态性与结核风险显著相关联,在共显性遗传模型下stat1-rs7576984ca基因型和stat1-rs2066802ct基因型携带者罹患结核病的风险更好;在显性遗传模型下,stat1-rs7576984位点((ca+aa)vs.cc)基因型与显著增加的结核风险相关;在隐性遗传模型下,stat1-rs7576984位点(aavs.(cc+ca))基因型与显著的抗结核性相关;携带stat1rs13029247-rs7576984双体型“ta”的人罹患结核的风险更高。这一研究成果为筛选和预测结核病提供了新途径,为研发人群结核筛查试剂盒提供了理论依据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1