本发明涉及分子生物学,具体地说,涉及检测2型糖尿病易感基因的突变位点组合及其检测引物与应用。
背景技术:
2型糖尿病(t2dm)是遗传和环境因素共同作用导致的复杂疾病。t2dm的家族聚集性、同卵双生子发病的高一致性以及在某些种族人群中的高发率均强烈提示遗传因素在其发病中的作用。相关研究预计有30%~70%的t2dm患者患病风险可归因于遗传易感性。同时,t2dm具有遗传异质性,其表型受到多基因遗传背景和复杂环境因素的共同控制。具体说来,每个患者可能有不同的易感基因组合,而非患者人群亦可不同程度集结各种遗传和环境疾病易感因素;就单个遗传或环境因素而言,易感基因在患者群与非患者群中均可存在,其差别仅是频率上的差异。因此,确认t2dm易感基因实非易事。
目前,对2型糖尿病的检测多采用血常规检测,该方法只能在已经患病的患者上检测到,并不能对糖尿病的潜在患者予以警示和指导。
根据现有的研究报道,已知有不少于17个基因与2型糖尿病有关,其中,还存在与2型糖尿病潜在相关的25个突变位点,但并没有单一可以确定糖尿病的位点,也没有将所有位点关联分析的一套体系或者流程。若对所有已知突变位点均进行检测,则存在成本高、检测时间长、准确度低的问题。
因此,亟需开发一种可高效检测2型糖尿病的方法,在控制成本的基础上,确保检测准确率不小于92%。
技术实现要素:
为了解决现有技术中存在的问题,本发明的目的是提供一种用于检测2型糖尿病易感基因的突变位点组合及其检测引物与应用。
为了实现本发明目的,本发明的技术方案如下:
第一方面,本发明提供了一种用于检测2型糖尿病易感基因的突变位点组合,所述突变位点来自kcnq1、c2cd4a、tcf7l2、slc30a8、cdkal1、cdkn2a/2b、kcnj11、ppar2、igf2bp2、fto、jazfl、grk5、rasgrp1、hhex、ptprd和ssr基因中21个突变位点,分别为:
2818521c>t,2835964a>c,2837316c>t,62104190a>g,114788815t>c,114758349c>t,118184783c>t,111694438t>c,22134094t>c,17388025t>c,12393125c>g,185511687g>t,53782363c>a,53786615t>a,28180556t>c,121149403c>t,38530704t>c,94462882c>t,8879118c>t,2216258t>c,2208899g>t。
第二方面,本发明提供一种用于检测2型糖尿病易感基因的引物组合,所述引物组合用于扩增前述突变位点组合中的突变位点。更为准确地说,所述引物组合可扩增前述突变位点组合中的每个突变位点。
作为优选,本发明进一步提供了所述引物组合中的具体引物序列,即所述引物组合包括seqidno.1~44所示的引物。
更为优选,所述引物组合由seqidno.1~44所示的引物组成。本发明经过大量客观实验研究发现,对前述突变位点组合中21个突变位点的扩增和检测,可实现对2型糖尿病的高效检测,检测准确率可达92%以上。
需要说明的是,基于本发明所述引物组合对现有技术的贡献,含有所述引物组合的试剂和/或试剂盒也属于本发明的保护范围。
本发明进一步针对试剂盒提供优选的工作程序和工作体系:
所述试剂盒的工作程序为:98℃预变性30s;98℃变性10s,60℃退火30s,72℃延伸30s,35个循环,最后72℃延伸2min;恢复至4℃。
所述试剂盒的工作体系为50μl:
dna模板2μl(<1000ng);
q5high-fidelity2×mastermix25μl(neb);
上游引物2.5μl(10μm);
下游引物2.5μl(10μm);
去离子三蒸水18μl。
第三方面,本发明提供了所述引物组合在制备检测2型糖尿病试剂或试剂盒方面的应用。
其实质在于,提供了所述突变位点组合在检测2型糖尿病方面的应用。
进一步地,本发明所提供的突变位点组合,以及引物组合,格外适用于针对亚洲人群进行2型糖尿病的检测或诊断。
本发明涉及到的原料或试剂均为普通市售产品。
在符合本领域常识的基础上,上述各优选条件,可以相互组合,得到具体实施方式。
本发明的有益效果在于:
本发明经过试验研究发现,对本发明选择的突变位点组合进行突变位点基因型的检测,可有效判断待检样本是否为2型糖尿病。本发明针对现有技术中已公开的21个snp位点,筛选出了最佳的检测组合,在控制成本的基础上,将检测准确率提到到92%以上。
具体实施方式
下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本实施例用于说明使用本发明所述引物组合,针对本发明所述突变位点进行检测的方法,具体步骤如下:
1、外周血抽提
取-80℃冻存edta抗凝管全血,使用qiaampgdnabloodminikit抽提dna。
1)取200μl已添加抗凝剂的血液样品至1.5ml离心管中,再加入40μl蛋白酶k溶液,
再加入200μlalbuffer,立刻祸旋振荡充分混匀15秒;
2)在56℃孵育30min;
3)从烘箱中取出裂解后的标本,短甩;
4)加入200μl无水乙醇,立刻润旋振荡充分混勾,短甩;
5)将上一步混合物(包括可能有的沉淀)加入一个吸附柱中(吸附柱放入收集管中),盖上盖子,8000rpm离心lmin,换收集管;
6)加入500μlawlbuffer,盖上盖子,12000rpm离心3min,换收集管;
7)加入500μlaw2buffer,盖上盖子,8000rpm离心lmin,倒掉收集管的液体,空柱子干甩lmin;
8)取出吸附柱,放入一个消过毒的新离心管中,把装有滤液的收集管扔掉。在吸附柱内加入100μlaebuffer,室温放置30min左右,然后8000rpm离心1.5min
9)加入100μlaebuffer,室温放置10min左右,然后8000rpm离心1.5min.
10)扔掉吸附柱,储存于4℃冰箱备用。
2、pcr扩增基因:
将本发明所述21对引物均稀释到10μm后,分别将上游引物与下游引物混合,每个引物取10μl,得到上游引物混合液210μl,下游引物混合液210μl,引物序列如表1所示:
表1测序基因扩增引物序
(1)pcr反应体系(50μl)配制:
dna模板2μl(<1000ng);
q5high-fidelity2×mastermix25μl(neb);
上游引物2.5μl(10μm);
下游引物2.5μl(10μm);
去离子三蒸水18μl。
(2)pcr扩增参数设置:
94℃预变性98℃预变性30s;98℃变性10s,退火30s,72℃延伸30s,最后72℃延伸2min,35个循环;恢复至4℃。
将多重pcr扩增产物采用2%琼脂糖凝胶电泳(150v,30min),通过紫外分析仪检测有清晰的目的条带后,将多重pcr产物进行纯化(德国耶拿pcr纯化试剂盒),以及以及浓度测定。
3、多重pcr产物文库构建
(1)将多重pcr产物稀释到2ng/μl,吸取50μl,共计100ng备用;
(2)进行末端修复
按照下表体系进行混合在pcr管中:
混合后将放入pcr仪中,反应程序为20℃30min,65℃30min;
(3)添加测序接头
将上述产物取出,按照下表体系加入如下试剂:
将上述反应液放入pcr仪中,反应程序20℃15min;反应结束后,向上述反应液中加入3μl(red)usertmenzyme,放入pcr仪中,反应程序,37℃15min;
(4)片段选择
取出步骤(3)的最终反应液,将反应液转移到1.5ml的ep管中,加入40μlampurexpbeads(漩涡震荡均匀后室温静置30min),漩涡震荡5s,室温静置5min,然后将ep管放在磁力架上,吸附5min,待反应液澄清后,将上清液缓慢转移到另一个新的1.5mlep管中,加入20μlampurexpbeads,漩涡震荡5s,室温静置5min,然后将ep管放在磁力架上,吸附5min,待反应液澄清后,弃掉上清液,向管中加入200μl80%的乙醇溶液,30s后吸出上清液,再次向管中加入200μl80%的乙醇溶液,30s后吸出上清液,将ep管口敞开,在磁力架上晾干5min;将ep管从磁力架上取下,加入17μl纯水,漩涡震荡混匀,室温孵育2min,短时离心,放在磁力上吸附5min;吸出15μl上清液到pcr管中备用。
(5)添加index序列以及扩增
将步骤(4)的反应液加入如下体系并扩增;
反应程序如下:
4、产物纯化
将步骤4中的pcr产物转移到1.5ml的ep管中,加入45μlampurexpbeads,漩涡震荡5s,室温静置5min,然后将ep管放在磁力架上,吸附5min,待反应液澄清后,弃掉上清液,向管中加入200μl80%的乙醇溶液,30s后吸出上清液,再次向管中加入200μl80%的乙醇溶液,30s后吸出上清液,将ep管口敞开,在磁力架上晾干5min;将ep管从磁力架上取下,加入33μl纯水,漩涡震荡混匀,室温孵育2min,短时离心,放在磁力上吸附5min;吸出30μl上清液到新的1.5mlep管中备用。
5、文库检测
使用qubit检测文库的浓度并使用agilent2100bioanalyzer检测文库完整性。
6、上机测序
使用illumina公司的hiseqxten将文库上机测序,程序为pe150。
7、结果分析:
对21个突变位点的基因型结果进行分析,根据公式计算。
表2
公式:p=exp(-0.3357+0.1408*rs1801282+0.0479*rs4402960+0.0360*rs1800629+0.0546*rs1800795+0.1749*rs864745+0.0196*rs13266634+0.5091*rs17584499+0.0525*rs10811661+0.0757*rs1111875-0.0232*rs7903146+0.0290*rs12243326+0.0023*rs10886471-0.0088*rs2237892+0.0437*rs2237895-0.0351*rs2237897-0.0169*rs5219+0.1184*rs7403531+0.0620*rs7172432+0.2335*rs8050136-0.1215*rs9939609+0.0056*rs10425678)/(1+exp(-0.3357+0.1408*rs1801282+0.0479*rs4402960+0.0360*rs1800629+0.0546*rs1800795+0.1749*rs864745+0.0196*rs13266634+0.5091*rs17584499+0.0525*rs10811661+0.0757*rs1111875-0.0232*rs7903146+0.0290*rs12243326+0.0023*rs10886471-0.0088*rs2237892+0.0437*rs2237895-0.0351*rs2237897-0.0169*rs5219+0.1184*rs7403531+0.0620*rs7172432+0.2335*rs8050136-0.1215*rs9939609+0.0056*rs10425678))
其中,p代表2型糖尿病易感性的评估参数,rs#代表每个snp位点的基因型,取值可能为0、1或2,如基因型为ref/ref取值为0;如基因型为alt/alt取值为2;如基因型为ref/alt取值为1,(以rs1801282位点为例,cc取值为0,cg取值为1,gg则取值为2)。据以上规则,将数据值代入公式计算得到p,p的结果取值约束在0~1之间。
根据计算所得判断,在实际应用中,定性整体评估:当p值小于等于0.5时,判断为不易感;当p值大于0.5时,判断为易感。
细化评估:当p值小于0.25时,判断为不易感;当p值大于0.25且小于等于0.5时,判断为一般不易感;当p值大于0.5且小于0.6时,判断为一般易感;当p值大于等于0.6且小于0.75时,判断为较易感;当p值大于等于0.75且小于0.9时,判断为较高危易感;当p值大于等于0.9时,判断为高危易感。
实施例2
本实施例使用实施例1所述方法,对1054位糖尿病患者进行基因检测,判断1028位为2型糖尿病患者,检测准确率为97.5%。进一步,针对512份来自1000g(千人基因组项目)公共数据库的亚洲健康人数据,对本发明所述21个突变位点的基因型进行分析,并根据分析结果采用实施例1的公式进行计算,判断451为非2型糖尿病患者,检测准确率为88.1%。综合检测准确率为92.8%,
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110>北京市计算中心
<120>用于检测2型糖尿病易感基因的突变位点组合及其检测引物与应用
<130>khp171115626.0
<141>2017-11-20
<160>42
<170>siposequencelisting1.0
<210>1
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>1
tcacaagcccctacagacca20
<210>2
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>2
aacctttccggcccattttc20
<210>3
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>3
ggaactgtggactgccatgt20
<210>4
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>4
aactgatcaacagcaccataca22
<210>5
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>5
tctggctgtgaaatcccctg20
<210>6
<211>19
<212>dna
<213>人工序列(artificialsequence)
<400>6
cccatgcgtgtgcaatcag19
<210>7
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>7
tctgtgttcaccaggctttcc21
<210>8
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>8
cctgcatcctgtctggaagt20
<210>9
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>9
gccaaagtgctgagtcactaat22
<210>10
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>10
gcaaacccctattccatgct20
<210>11
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>11
cagaggaagagcaagggtagg21
<210>12
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>12
gtgtggggtaagcagatgaca21
<210>13
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>13
aatgttgagggacggaggtg20
<210>14
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>14
aagcactgagagaaacagccc21
<210>15
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>15
ccacgttgcagttgcctttct21
<210>16
<211>19
<212>dna
<213>人工序列(artificialsequence)
<400>16
gctgggctacctcctttgg19
<210>17
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>17
acagtgaaaagaaggaactgtgac24
<210>18
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>18
gatgagatctctgccggacc20
<210>19
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>19
tgtgacagtgccagcttcat20
<210>20
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>20
agctgggatagcataacataacca24
<210>21
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>21
aattcaaaactggctcttgaatgaa25
<210>22
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>22
gcagtaagagtgtgtggggt20
<210>23
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>23
gcacccgactggaaaacctt20
<210>24
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>24
gctgaacaaacaaattgtgggg22
<210>25
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>25
agtttcaactttccttagctgctt24
<210>26
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>26
gtaccctgtgacctcagtttct22
<210>27
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>27
tgagctagtcacaggggtct20
<210>28
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>28
tgggcccaagaaaagacaaca21
<210>29
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>29
tggggacacacaagcatcaa20
<210>30
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>30
ctttgttggagggtgagggt20
<210>31
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>31
aacaaacacaacctggaagaca22
<210>32
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>32
tgggctggtagggaacaact20
<210>33
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>33
tctgctaaaggtcctgacccc21
<210>34
<211>19
<212>dna
<213>人工序列(artificialsequence)
<400>34
gggagtctgttctgtggca19
<210>35
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>35
ggaatctgctttgaccattcctt23
<210>36
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>36
cgagaggactctgcagtgagg21
<210>37
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>37
agtgaaatggggcttcctctg21
<210>38
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>38
tctcacccaggacacgtcta20
<210>39
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>39
tgccttccctgtaactgtgg20
<210>40
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>40
actttgaggtgccattcctca21
<210>41
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>41
acataagttccgtaagagccat22
<210>42
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>42
tagagtaacagagactatccaagtg25