一种建库方法及SNP分型方法与流程

文档序号:14983833发布日期:2018-07-20 20:42阅读:366来源:国知局

本发明涉及分子生物学领域,更具体地说,涉及一种建库方法及snp分型方法。



背景技术:

单核苷酸多态性(singlenucleotidepolymorphism,snp)是指基因组上单个核苷酸位置上存在转换、颠换、插入、缺失等变化,其数量很多,多态性丰富。snp被认为是遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与snp有关,因此snp的分型对诸多疾病的治疗和用药有着积极的意义。

针对基因检测,二代高通量测序技术因其准确、灵敏的特性,应用范围不断扩大,已涉及生命科学研究以及医学研究的各个不同方面,利用二代高通量测序技术来进行snp位点的检测也是目前的研究热点之一。但是,基于二代高通量测序技术的snp分型方法,当待测snp位点与测序引物末端之间距离较长时,检测时间会大大延长,且受限于测序方法的读长,检测的准确性会大大降低;此外,当同时对多个易感基因的多个snp位点检测时,通常需要针对不同待测snp位点附近的序列设计多种不同的测序引物,但不同测序引物之间容易产生相互干扰,测序引物难以准确锚定在特定位置,从而增加了测序引物的设计难度,可能降低snp分型检测的准确率。

因此,需要一种新的建库方法及snp分型方法,使得对待测snp位点检测的准确性不受测序读长的影响;且能够避免在同一体系中同时对多个待测snp位点进行检测时,不同测序引物之间相互干扰的现象。



技术实现要素:

本发明的目的在于提供一种建库方法及snp分型方法,旨在解决现有技术中snp分型准确性受测序读长影响,以及在同一体系中同时对多个snp位点检测时不同测序引物之间相互干扰的问题。

为了实现发明目的,本发明提供了一种建库方法,包括以下步骤:

a、pcr扩增含待测snp位点的待测序样本,得到扩增产物;

b、在所述扩增产物上连接接头一,得到含有iis型限制性内切酶识别序列以及iis型限制性内切酶切割位点的连接产物,所述接头一为双链核酸分子,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基;

c、采用iis型限制性内切酶对连接产物进行酶切,得到含有待测snp位点和接头一的第一核酸片段,且所述第一核酸片段上经酶切形成第一末端;

d、在第一核酸片段在第一末端处连接接头二,得到文库分子,所述接头二为含有测序引物结合位点的双链核酸分子。

优选的,所述iis型限制性内切酶识别序列位于所述pcr扩增引物组中的至少一种扩增引物上,并通过pcr扩增引入至连接产物上。

优选的,所述iis型限制性内切酶识别序列位于所述接头一上,并通过连接反应引入至连接产物上。

优选的,所述pcr扩增所用的引物组中,有少一种扩增引物上含有可断裂位点或可切除序列;所述步骤b包括以下步骤:

b1.利用断裂剂切割所述扩增产物,所述断裂剂用于对扩增产物中的可断裂位点或可切除序列进行特异性切割,形成第二末端;

b2.在所述扩增产物的第二末端处连接接头一,得到含有iis型限制性内切酶识别序列以及iis型限制性内切酶切割位点的连接产物,所述接头一为双链核酸分子,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基。

优选的,所述步骤b1和步骤b2在同一反应体系中同时进行。

优选的,所述测序引物结合位点位于所述接头二与第一末端连接的一端处。

本发明还提供了一种snp分型方法,包括对按上述任一种建库方法制得的文库分子进行测序的步骤。

优选的,所述方法还包括将文库分子可寻址的固定在固相载体上的步骤。

优选的,当检测的待检测序样本有多个时,根据待测序样本的不同分别进行建库,获得多种文库分子,再将多种文库分子混合后进行测序。

优选的,所述多种文库分子上分别含有不同的标签序列。

本发明的建库方法,使获得的文库分子上的接头二与待测snp位点之间的距离为0至5个碱基。后续可将含有不同待测snp位点的文库分子混合,然后进行测序,测序时,测序引物与文库分子中的接头二上的序列完全互补配对,因此对多种待测snp位点进行测序的测序引物可以是相同的,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性;另外,只需进行较少次数的测序步骤即可完成检测,大大缩短了测序时间,且使对待测snp位点的检测不受测序仪器读长的限制,也能提高测序的准确性;通过在接头一末端上设置生物素标记,可以方便的对文库分子进行提纯,且在测序过程中可以更方便地将其可寻址的固定在固相载体上,从而有利于测序步骤的进行。

附图说明

图1是本发明第二实施例中文库分子的聚丙烯酰胺凝胶电泳检测图。

图2是本发明第五实施例中文库分子的聚丙烯酰胺凝胶电泳检测图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。

本发明提出第一实施例,一种建库方法,包括以下步骤:

a、pcr扩增含待测snp位点的待测序样本,得到扩增产物;

b、在所述扩增产物上连接接头一,得到含有iis型限制性内切酶识别序列以及iis型限制性内切酶切割位点的连接产物,所述接头一为双链核酸分子,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基;

c、采用iis型限制性内切酶对连接产物进行酶切,得到含有待测snp位点和接头一的第一核酸片段,且所述第一核酸片段上经酶切形成第一末端;

d、在第一核酸片段在第一末端处连接接头二,得到文库分子,所述接头二为含有测序引物结合位点的双链核酸分子。

本发明获得含有iis型限制性内切酶识别序列的文库分子,其接头二与待测snp位点之间的距离为0至5个碱基。后续将含有不同待测snp位点的文库分子混合并进行测序时,测序引物与文库分子中的接头二上的序列完全互补配对,因此对多种待测snp位点进行测序的测序引物可以是相同的,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性;另外,只需进行较少次数的测序步骤即可完成检测,大大缩短了测序时间,且使对待测snp位点的检测不受测序仪器读长的限制,也能提高准确性。

所述iis型限制性内切酶用于识别iis型限制性内切酶识别序列并在iis型限制性内切酶切割位点处进行切割。所述iis型限制性内切酶为切割位点在识别序列之外的限制性内切酶,包括但不限于:acuⅰ、alwⅰ、bbsⅰ、bbvⅰ、bccⅰ、bceaⅰ、bcivⅰ、bfuaⅰ、bmrⅰ、bpmⅰ、bpueⅰ、bsaⅰ、bsemⅱ、bserⅰ、bsgⅰ、bsmaⅰ、bsmbⅰ、bsmfⅰ、bspcnⅰ、bspmⅰ、bspqⅰ、btgzⅰ、earⅰ、eciⅰ、ecop15ⅰ、fauⅰ、fokⅰ、hgaⅰ、hphⅰ、hpyav、mboⅱ、mlyⅰ、mmeⅰ、mnlⅰ、nmeaⅲ、pleⅰ、sapⅰ、sfanⅰ和tspdtⅰ。

所述待测序样本为含待测snp位点的核酸分子,包括但不限于dna分子、cdna分子或rna分子。

步骤a中所述的pcr扩增可为单分子扩增,也可为非单分子扩增。

优选的,所述单分子扩增为乳液pcr、桥式pcr或乳液桥式pcr。

优选的,所述非单分子扩增为普通pcr扩增、实时荧光定量pcr、不对称pcr、固相pcr、原位pcr、反转录pcr、巢式pcr、兼并引物pcr、免疫pcr、反向pcr或递减pcr。

优选的,所述iis型限制性内切酶识别序列位于所述pcr扩增引物组中的至少一种扩增引物上,并通过步骤a的扩增反应中引物与模板链的互补配对将其引入至扩增产物上;或,所述iis型限制性内切酶识别序列位于所述接头一上,通过连接接头一将iis型限制性内切酶识别序列引入连接产物中。

所述接头一可以直接连接在扩增产物的第一末端;也可以对扩增产物进行切割后形成第二末端,再在第二末端上连接接头一。

优选的,所述pcr扩增所用的引物组中,有至少一种扩增引物上含有可断裂位点或可切除序列,所述步骤b包括以下步骤:

b1.利用断裂剂切割所述扩增产物,所述断裂剂用于对扩增产物中的可断裂位点或可切除序列进行特异性切割,形成第二末端;

b2.在所述扩增产物的第二末端处连接接头一,得到含有iis型限制性内切酶识别序列以及iis型限制性内切酶切割位点的连接产物,所述接头一为双链核酸分子,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基。

进一步的,所述可断裂位点为u,所述断裂剂为urse酶;

或,所述可切除序列为rna序列,所述断裂剂为rnaseh;

或,所述可切除序列为限制性内切酶识别序列,所述断裂剂为相应的限制性内切酶。

优选的,连接接头一和连接接头二的反应均是在连接酶的作用下进行的,一实施方式中,所述连接酶可以选自e.colidna连接酶、t4dna连接酶、热稳定dna连接酶和tthdna连接酶,优选为t4dna连接酶,其适用性广,且既可连接粘性末端,又能连接平末端。

优选的,步骤c开始之前还包括对反应体系中的连接酶进行灭活的步骤,本方案可以避免在步骤c的酶切过程中发生酶切产物重新连接。

优选的,所述步骤b1和步骤b2可以分步进行,也可以在同一反应体系中同时进行。

优选的,所述步骤b1和步骤b2在同一反应体系中同时进行,与分步进行的方案相比,本方案简化了建库步骤,提高了建库效率。

所述步骤c和步骤d可以分步进行,也可以在同一反应体系中同时进行。

优选的,所述步骤c和步骤d在同一反应体系中同时进行,与分步进行的方案相比,本方案简化了建库步骤,提高了建库效率。

当所述iis型限制性内切酶识别序列位于所述pcr扩增引物组中的至少一种扩增引物上,通过扩增反应将其引入至扩增产物上时,步骤b1和步骤c可以在同一体系中同时进行,步骤b2和步骤d也可以在同一体系中同时进行;或,所述步骤b1、b2、步骤c、步骤d均在同一反应体系中同时进行,与分步进行的方案相比,本方案简化了建库步骤,提高了建库效率。

优选的,所述接头一在与第一末端连接端的相对末端上含有生物素标记,利用该生物素标记,可以在步骤d结束后,很方便的将文库分子分离出来。

所述接头一通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体上,可以在后续步骤中固定在固相载体上。

所述接头二为含有测序引物结合位点的双链核酸分子,本发明通过在第一核酸片段上连接接头二,后续将含有不同待测snp位点的文库分子混合,然后进行测序。测序过程中,统一了多种待测snp位点的测序引物,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性。

优选的,所述测序引物结合位点位于所述接头二与第二末端连接的一端;与测序引物结合位点位于接头二其他位置的技术方案相比,本方案缩短了了待测snp位点与测序引物之间的距离,减少了测序步骤,从而缩短了检测时间,提高了检测的准确性。

本发明提出第二实施例,以人类全血基因组为模板,构建含rs1799853位点的mthfr基因片段文库。

a、配制巢式扩增反应体系,第一轮pcr扩增,在200μl离心管中加入浓度为50ng/μl的人类全血dna分子1.0μl;2×longtaqmix(深圳华因康基因科技有限公司生产)10μl;浓度为10μm的上游引物(seqidno:1)0.4μl;浓度为10μm的下游引物(seqidno:2)0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,49℃条件下持续20秒,72℃条件下持续1分钟,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第一轮pcr产物;

第二轮pcr扩增,在200μl离心管中加入稀释100倍的第一轮pcr扩增产物1.0μl;2×longtaqmix10μl;浓度为10μm的上游引物(seqidno:3)0.4μl;0.4μl浓度为10μm的下游引物(seqidno:4);20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,50℃条件下持续20秒,72℃条件下持续20秒,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第二轮pcr产物;其中,上游引物(seqidno:3)的上含有u以及acuⅰ酶识别序列ctgaag,上游引物3’末端与待测snp位点相邻,acuⅰ酶切割位点位于snp位点上。

b、配置切割-连接反应体系如下:取第二轮pcr产物20μl,浓度为2units/μl的user酶2μl,浓度为2units/μl的t4连接酶1μl,t4连接酶缓冲液2.7μl,浓度为10pmol/μl的接头一0.2μl,去离子水1.1μl,在室温下反应半小时,65℃下灭活10分钟,得到连接产物。接头一由seqidno:5和seqidno:6组成,其中seqidno:5的5’端上含有生物素标记,且被预先固定在含链霉亲和素的磁珠上。

c、采用acuⅰ酶对步骤b中的连接产物进行酶切,配置反应体系,步骤b中的连接产物27μl,浓度为2units/μl的acuⅰ酶1μl,浓度为3.2mm的s-腺苷甲硫氨酸0.5μl,10×cutsmart®buffer2.5μl;去离子水2μl;在37℃条件下反应1小时,65℃下灭活20分钟,得到含有待测snp位点和接头一的第一核酸片段,第一核酸片段上经酶切形成含有2个突出碱基的第一末端,且待测snp位点位于末端。将离心管置于磁架上,分离去除上清,得到吸附在磁珠上的第一核酸片段,向0.8μl磁珠中加入15μl4×bwbuffer和16.5μl水,室温回转孵育30min。将磁珠用50μl1×nxs(含1%triton)洗一遍,50μl1×nxs(含0.01%triton)洗一遍,50μl1×te(含50mmkcl溶液)洗一遍,重悬于20μl1×cutsmartbuffer中用2units虾碱性磷酸酶对其进行处理,37℃下反应1h。反应完毕置于65℃下灭活5min。

d、向步骤c的反应体系中加入以下组分,浓度为10pmol/μl的接头二1μl;浓度为2units/μl的t4dna连接酶1μl;7.5ulligasebuffe(含117mmtris-hcl,17.5mmmgcl2,35mmdtt,5mmatp和23.415%(w/v)peg6000);去离子水0.5μl;室温下反应1小时。其中,接头二包括两种,分别由seqidno:7和seqidno:8、seqidno:9和seqidno:8组成,seqidno:8序列为测序引物结合序列。反应完成后,将离心管置于磁架上,分离去除上清,得到吸附在磁珠上的含有接头一、接头二以及rs1799853位点的文库分子。

对文库分子进行验证,配制以下反应体系,扩增文库分子:稀释100倍的磁珠悬液1μl;2×longtaqmix10μl;浓度为10μm上游引物(seqidno:10)0.4μl;浓度为10μm下游引物(seqidno:11)0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续2分钟;94℃条件下持续20秒,54℃条件下持续20秒,72℃条件下持续10秒分钟,一共25个循环;72℃条件下持续3分钟;pcr反应完成后,得到验证产物。

验证产物聚丙烯酰胺凝胶电泳结果如图1所示,0为分子大小标记物,泳道1为验证产物,从图中可以看出,验证产物在60bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本实施例中,上游引物(seqidno:3)的设计既兼顾了对待测snp位点的特异性扩增,又使其上含有acuⅰ酶识别序列ctgaag。使上游引物3’末端与待测snp位点相邻,从而保证了pcr扩增的效率;由于acuⅰ酶切割位点位于acuⅰ酶识别序列后16bp处,上游引物在acuⅰ酶识别序列后的序列长度为15bp,从而使得切割位点在待测snp位点上,第二轮pcr产物在acuⅰ酶的作用下,得到的第一核酸片段,其含有2个突出碱基的第一末端,且待测snp位点位于末端。由于本实施例待测snp位点位于末端,其基因突变有两种可能,因此接头二包括两种双链核酸分子,分别与含上述两种突变可能的snp位点的第一末端连接。

本发明提出第三实施例,以人类全血基因组为模板,构建含rs1057910位点的mthfr基因片段文库。

本实施例与第二实施例的区别在于,步骤a中第一轮pcr扩增的引物组为:上游引物(seqidno:12)和下游引物(seqidno:13);第二轮pcr扩增的引物组为:上游引物(seqidno:14)和下游引物(seqidno:15)。其中上游引物(seqidno:14)上含有nb.bbvci酶切序列gctgagg,下游引物(seqidno:15)上含有bceaⅰ酶识别序列acggc,得到的第二轮pcr产物中,bceaⅰ切割位点与待测rs1057910位点之间的距离为4bp。

配制切割-连接反应体系:第二轮pcr产物20μl,浓度为2units/μl的nb.bbvci酶0.5μl,浓度为2units/μl的t4连接酶1μl,10×nebuffer3.13μl,bceaⅰ酶1μl,浓度为10μm的接头一0.2μl,浓度为10μm的接头二1μl,浓度为100mm的atp0.3μl,去离子水3μl。其中,接头一由seqidno:16和seqidno:6组成;接头二由seqidno:17和seqidno:11组成。上述两个反应体系在25℃下反应一小时,80℃条件下灭活20分钟,反应完成后,通过接头一末端的生物素标记,将文库分子杂交至流动小室上。

对文库分子进行验证,其中验证引物组为:上游引物(seqidno:18),下游引物(seqidno:11)。验证产物在95bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本实施例的切割-连接反应体系中同时包括nb.bbvci酶、bceaⅰ酶、接头一以及接头二,在同一体系中同时对扩增产物的两端进行切割以及分别连接接头一和接头二的反应,实现了多酶协作,简化了建库步骤,提高了建库效率。

本发明提出第四实施例,以人类全血基因组为模板,构建含rs9923231位点的vkorc1基因片段文库。

本实施例与第二实施例的区别在于,第二轮pcr扩增的引物组为seqidno:19和seqidno:20,其中seqidno:19上含有u。

步骤b中的切割-连接反应体系中,接头一由seqidno:21和seqidno:22组成,其中,seqidno:21上含有acuⅰ酶识别序列ctgaag,通过接头一与扩增产物的连接反应将acuⅰ酶识别序列引入至连接产物中,seqidno:20的5’端上含有生物素标记,且被预先固定在含链霉亲和素的磁珠上。

步骤c中的接头二为以下接头的等比例混合物:seqidno:7和seqidno:8组成的接头,seqidno:9和seqidno:8组成的接头,seqidno:23和seqidno:8组成的接头,seqidno:24和seqidno:8组成的接头。

对该文库分子进行验证的步骤中,验证引物组为:上游引物(seqidno:25)和下游引物(seqidno:11)。本实施例文库分子的验证产物经琼脂糖凝胶电泳,在65bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本实施例在接头一上设置acuⅰ酶识别序列,通过接头一与扩增产物的连接将acuⅰ酶识别序列引入至文库分子中,降低了扩增引物的设计难度。由于本实施例待测snp位点位于末端,其基因突变四种突变可能,因此接头二包括四种双链核酸分子,分别与含上述四种突变可能的snp位点的第一末端连接。

本发明提出第五实施例,以人类全血基因组为模板,建立五个不同的反应体系,分别构建含rs1799853位点的cyp2c9基因片段,含rs1057910位点的cyp2c9基因片段,含rs9923231位点的vkorc1基因片段,含rs4244285位点的cyp2c19基因片段,含rs4986893位点的cyp2c19基因片段的基因文库。

本实施例与第二实施例的区别在于,各反应体系中第一轮pcr扩增的扩增引物组分别为:上游引物(seqidno:1)和下游引物(seqidno:2),上游引物(seqidno:12)和下游引物(seqidno:13),上游引物(seqidno:26)和下游引物(seqidno:27),上游引物(seqidno:28)和下游引物(seqidno:29),上游引物(seqidno:30)和下游引物(seqidno:31);第二轮pcr扩增的引物组分别为:上游引物(seqidno:3)和下游引物(seqidno:4),上游引物(seqidno:32)和下游引物(seqidno:33),上游引物(seqidno:34)和下游引物(seqidno:21),上游引物(seqidno:35)和下游引物(seqidno:36),上游引物(seqidno:37)和下游引物(seqidno:38)。其中seqidno:3、seqidno:32、seqidno:34、seqidno:35、seqidno:37上均含有acuⅰ酶识别序列ctgaag。

各反应体系中连接的接头一分别由以下序列组成:seqidno:5和seqidno:6,seqidno:39和seqidno:40,seqidno:41和seqidno:42,seqidno:43和seqidno:44,seqidno:45和seqidno:46,且各接头一的引物组上分别含有标签序列:actg、tgca、gtac、catg和agtc;接头二分别为seqidno:7和seqidno:8,seqidno:9和seqidno:8,seqidno:24和seqidno:8,seqidno:25和seqidno:8,seqidno:47和seqidno:8、seqidno:48和seqidno:8的混合物,其中,seqidno:7、seqidno:9、seqidno:24、seqidno:25序列的3’端经氨基修饰,避免在反应过程中发生自连;seqidno:8序列的5’端经磷酸修饰。

验证产物经聚丙烯酰胺凝胶电泳结果如图2所示,0为分子大小标记物,泳道1-5分别为上述五个反应体系的验证产物,分别在63bp、74bp、121bp、127bp、112bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本发明还提出了第六实施例,一种snp分型方法,包括对按上述任一实施例中的建库方法制得的文库分子进行测序的步骤。

本发明的文库分子上由于含有接头二,通过测序引物与接头二的特异性结合,统一了同一体系中多个不同待测snp位点的测序引物,避免了测序引物之间的相互干扰。

优选的,所述方法还包括将文库分子可寻址的固定在固相载体上的步骤。

所述可寻址的固定,是指能够确定位置信息的固定。即固相载体上每一具体位置上所固定的文库分子与其它位置上所固定的文库分子之间是能够明确区分的。

进一步的,文库分子可通过直接或间接的方式可寻址的固定在固相载体上。

针对通过直接的方式实现含测序接头的文库分子的可寻址固定,本发明提出一实施例:文库分子直接通过接头一杂交至流动小室上,从而实现文库分子的可寻址固定;本发明还提出另一实施例,文库分子通过接头一固定在微球上,微球预先固定在固相载体上,从而实现含文库分子的可寻址固定。

针对通过间接的方式实现文库分子的可寻址固定,本发明提出一实施例:文库分子先固定在微球上,然后再将微球固定在固相载体上,从而实现文库分子的可寻址固定。

当检测的待测序样本有多个时,根据待测序样本的不同分别进行建库,获得多种文库分子,再将多种文库分子混合,在同一体系中进行测序。

优选的,所述多种文库分子分别含有不同的标签序列,本方案通过文库分子上的标签序列,可以区分出不同文库分子的测序结果。

进一步的,所述标签序列位于所述接头一上。

优选的,所述测序的方法为第二代高通量基因测序技术,包括但不限于连接测序法或合成测序法。

所述连接测序法是基于连接酶在核酸片段之间进行连接反应的过程中的保真性来实现的,以待测序核酸片段为模板,测序引物和寡聚核苷酸探针(该探针的特定位置上带有荧光标记)进行连接反应,通过检测连接产物上的荧光标记从而确定寡核苷酸探针上带有荧光标记的特定位置对应的序列的信息。目前,市场上常见的连接测序法有多种,包括但不限于:深圳华因康基因科技有限公司的pstar连接测序法、abi公司的连接测序法、completegenomics公司的连接测序法。

所述合成测序法是基于聚合酶在延伸核酸链过程中的保真性来实现的,以待测序核酸片段为模板,锚定引物(又称测序引物,其与待测序核酸片段所在链互补)互补结合至待测序核酸片段上,通过检测在延伸过程中产生的信号来确定待测序核酸片段上相应位置的序列信息。目前,市场上常见的合成测序法有多种,包括但不限于:illumina公司的solexa合成测序法、roche公司的454合成测序法、lifetechnologies公司的iontorrent、ionproton合成测序法。

本发明还提出第七实施例,一种对mthfr基因rs1799853位点检测的方法,本实施例在第二实施例的基础上,还包括以下步骤:

向步骤c中得到的吸附在磁珠上的文库分子中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含质量浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用深圳华因康基因科技有限公司的高通量基因测序仪pstariia,以连接测序法进行测序,测序引物(seqidno:12)5’端经磷酸修饰,且固定在测序接头的测序引物结合序列上,采用与检测位点互补的带有荧光基团的简并九聚物xnnnnnnnn作为测序探针,经过一次连接测序,确定mthfr基因的rs1801133位点为c。

本发明还提出第八实施例,一种对mthfr基因rs1057910位点检测的方法,本实施例在第三实施例的基础上,还包括以下步骤:

向杂交至流动小室上的文库分子中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含质量浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用illumina测序仪,将测序引物(seqidno:12)固定在测序接头的测序引物结合序列上,经过四次合成测序,确定mthfr基因的rs1057910位点为a。

本发明还提出第九实施例,同时检测cyp2c9基因片段上的rs1799853位点、rs1057910位点,vkorc1基因片段上的rs9923231位点,cyp2c19基因片段上的rs4244285位点、rs4986893位点,本实施例在第四实施例的区别在于,还包括以下步骤:

将吸附在磁珠上的文库分子混匀,向其中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含质量浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用深圳华因康基因科技有限公司的高通量基因测序仪pstariia,以连接测序法进行测序,将测序引物(seqidno:43)固定在测序接头的测序引物结合位点上,经过一次连接测序,确定上述待测snp位点分别为c、a、t、g、g。

本实施例通过在文库分子上连接相同的测序接头,统一了同一体系中多个待测snp位点检测的测序引物,避免了不同引物之间的相互干扰。

本发明提出第十实施例,一种用于检测多种snp位点突变的试剂盒,所述试剂盒包括扩增引物组和/或接头一;所述扩增引物组用于对所述多种snp位点中的至少一个snp位点进行特异性扩增,所述接头一为双链核酸分子,用于与含待测snp位点的待测序样本的扩增产物连接;所述扩增引物组中的至少一种扩增引物或接头一上含有iis型限制性内切酶识别序列,使得产生的iis型限制性内切酶切割位点与snp位点之间的距离为0至5个碱基。优选的,所述多种snp位点包括rs1799853、rs1057910、rs9923231、rs4244285、rs4986893中的至少一个;所述用于特异性扩增rs1799853位点的引物组包括seqidno:3和seqidno:4、seqidno:1和seqidno:2、seqidno:1和seqidno:4、seqidno:3和seqidno:2中的至少一对;所述用于特异性扩增rs1057910位点的引物组包括seqidno:12和seqidno:13、seqidno:14和seqidno:15、seqidno:32和seqidno:33、seqidno:12和seqidno:15、seqidno:12和seqidno:13、seqidno:14和seqidno:13、seqidno:14和seqidno:33、seqidno:32和seqidno:13、seqidno:32和seqidno:15中的至少一对;所述用于特异性扩增rs9923231位点的引物组包括seqidno:1和seqidno:2、seqidno:19和seqidno:20、seqidno:1和seqidno:20、seqidno:19和seqidno:2中的至少一对;所述用于特异性扩增rs4244285位点的引物组包括seqidno:28和seqidno:29、seqidno:35和seqidno:36、seqidno:28和seqidno:36、seqidno:35和seqidno:29中的至少一对;所述用于特异性扩增rs4986893位点的引物组包括seqidno:30和seqidno:31、seqidno:37和seqidno:38、seqidno:30和seqidno:38、seqidno:37和seqidno:31中的至少一对。

优选的,所述接头一选自:由seqidno:5和seqidno:6组成的rs1799853接头一,由seqidno:16和seqidno:6组成或由seqidno:39和seqidno:40组成的rs1057910接头一,由seqidno:21和seqidno:22组成的rs9923231接头一,由seqidno:43和seqidno:44组成的rs4244285接头一,由seqidno:45和seqidno:46组成的rs4986893接头一中的至少一种;所述rs1799853接头一用于与含rs1799853位点的基因片段连接,所述rs1057910接头一用于与含rs1057910位点的基因片段连接,所述rs9923231接头一用于与含rs9923231位点的基因片段连接,所述rs4244285接头一用于与含rs4244285位点的基因片段连接,所述rs4986893接头一用于与含rs4986893位点的基因片段连接。

优选的,所述用于特异性扩增rs1799853位点的引物组包括seqidno:3和seqidno:4、seqidno:1和seqidno:2这两对引物对,所述seqidno:1和seqidno:2用作特异性扩增的外引物对,seqidno:3和seqidno:4用作特异性扩增的内引物对,本方案的扩增准确性更高。

优选的,所述试剂盒还包括rs1799853接头二,所述rs1799853接头二为由seqidno:7和seqidno:8组成的双链核酸分子和由seqidno:9和seqidno:8组成的双链核酸分子的混合物,所述接头二用于与含rs1799853位点的基因片段连接。本方案中,由于rs1799853接头二直接与rs1799853位点连接,rs1799853位点有两种突变可能性,因此,rs1799853接头二设计为包括分别可以与具有两种突变可能性的rs1799853位点连接的双链核酸分子的混合物。

优选的,所述用于特异性扩增rs1057910位点的引物组包括seqidno:12和seqidno:13、seqidno:14和seqidno:15、seqidno:32和seqidno:33这三对引物对,所述seqidno:12和seqidno:13用作特异性扩增的外引物对,seqidno:14和seqidno:15和/或seqidno:32和seqidno:33用作特异性扩增的内引物对,本方案的扩增准确性更高。

优选的,所述试剂盒还包括由seqidno:17和seqidno:11组成的rs1057910接头二,所述rs1057910接头二用于与含rs1057910位点的基因片段连接。

优选的,所述用于特异性扩增rs9923231位点的引物组包括seqidno:1和seqidno:2、seqidno:19和seqidno:20这两对引物对,所述seqidno:1和seqidno:2用作特异性扩增的外引物对,seqidno:19和seqidno:20用作特异性扩增的内引物对,本方案的扩增准确性更高。

优选的,所述试剂盒还包括rs9923231接头二,所述rs9923231接头二为由seqidno:21和seqidno:22组成的双链核酸分子、由seqidno:9和seqidno:8组成的双链核酸分子、由seqidno:23和seqidno:8组成的双链核酸分子、由seqidno:24和seqidno:8组成的双链核酸分子的混合物,所述rs9923231接头二用于与含rs9923231位点的基因片段连接。本方案中,由于rs9923231接头二直接与rs9923231位点连接,rs9923231位点有四种突变可能性,因此,rs9923231接头二设计为包括分别可以与具有四种突变可能性的rs9923231位点连接的双链核酸分子的混合物。

优选的,所述用于特异性扩增rs4244285位点的引物组包括seqidno:28和seqidno:29、seqidno:35和seqidno:36这两对引物对,所述seqidno:28和seqidno:29用作特异性扩增的外引物对,seqidno:35和seqidno:36用作特异性扩增的内引物对,本方案的扩增准确性更高。

优选的,所述试剂盒还包括由seqidno:47和seqidno:8组成的rs4244285接头二,所述rs4244285接头二用于与含rs4244285位点的基因片段连接。

优选的,所述用于特异性扩增rs4986893位点的引物组包括seqidno:30和seqidno:31、seqidno:37和seqidno:38这两对引物对,所述seqidno:30和seqidno:31用作特异性扩增的外引物对,seqidno:37和seqidno:38用作特异性扩增的内引物对,本方案的扩增准确性更高。

优选的,所述试剂盒还包括由seqidno:48和seqidno:8组成的rs4986893接头二,所述rs4986893接头二用于与含rs4986893位点的基因片段连接。

优选的,所述试剂盒还包括测序引物seqidno:12。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

sequencelisting

<110>广州康昕瑞基因健康科技有限公司

<120>一种建库方法及snp分型方法

<130>

<160>48

<170>patentinversion3.3

<210>1

<211>24

<212>dna

<213>人工序列

<400>1

ggatggaaaacagagacttacaga24

<210>2

<211>21

<212>dna

<213>人工序列

<400>2

atatggccacccctgaaatgt21

<210>3

<211>25

<212>dna

<213>人工序列

<400>3

cgguctgaagaggagcattgaggac25

<210>4

<211>21

<212>dna

<213>人工序列

<400>4

gggtcacccacccttggtttt21

<210>5

<211>50

<212>dna

<213>人工序列

<400>5

cctccctgcagtctctatgggcacgtcacgacaacttattctcattcggt50

<210>6

<211>41

<212>dna

<213>人工序列

<400>6

atgagaataagttgtcgtgacgtgcccatagagactgcagg41

<210>7

<211>21

<212>dna

<213>人工序列

<400>7

ctacttcagcgactagcagag21

<210>8

<211>19

<212>dna

<213>人工序列

<400>8

ctgctagtcgctgaagtag19

<210>9

<211>21

<212>dna

<213>人工序列

<400>9

ctacttcagcgactagcaggg21

<210>10

<211>22

<212>dna

<213>人工序列

<400>10

cgacaacttattctcattcggt22

<210>11

<211>19

<212>dna

<213>人工序列

<400>11

ctacttcagcgactagcag19

<210>12

<211>24

<212>dna

<213>人工序列

<400>12

ttcatatacccctgaattgctaca24

<210>13

<211>20

<212>dna

<213>人工序列

<400>13

tggggacttcgaaaacatgg20

<210>14

<211>26

<212>dna

<213>人工序列

<400>14

cgggctgagggcatgcaagacaggag26

<210>15

<211>25

<212>dna

<213>人工序列

<400>15

cggtacggcgtggggagaaggtcaa25

<210>16

<211>51

<212>dna

<213>人工序列

<400>16

cctccctgcagtctctatgggcacgtcacgacaacttattctcattcgggc51

<210>17

<211>21

<212>dna

<213>人工序列

<400>17

gactgctagtcgctgaagtag21

<210>18

<211>20

<212>dna

<213>人工序列

<400>18

cgacaacttattctcattcg20

<210>19

<211>18

<212>dna

<213>人工序列

<400>19

gaagugagccaccgcacc18

<210>20

<211>20

<212>dna

<213>人工序列

<400>20

agacgccagaggaagagagt20

<210>21

<211>56

<212>dna

<213>人工序列

<400>21

cctccctgcagtctctatgggcacgtcagtcacgacaacttattctcatctgaagt56

<210>22

<211>42

<212>dna

<213>人工序列

<400>22

gatgagaataagttgtcgtgacgtgcccatagagactgcagg42

<210>23

<211>21

<212>dna

<213>人工序列

<400>23

ctacttcagcgactagcagtg21

<210>24

<211>21

<212>dna

<213>人工序列

<400>24

ctacttcagcgactagcagcg21

<210>25

<211>20

<212>dna

<213>人工序列

<400>25

cgacaacttattctcatctg20

<210>26

<211>20

<212>dna

<213>人工序列

<400>26

caccaagacgctagacccaa20

<210>27

<211>24

<212>dna

<213>人工序列

<400>27

tagatgtgagaaacagcatctgga24

<210>28

<211>23

<212>dna

<213>人工序列

<400>28

accagagcttggcatattgtatc23

<210>29

<211>24

<212>dna

<213>人工序列

<400>29

gcagaacagagcttttcctatcct24

<210>30

<211>22

<212>dna

<213>人工序列

<400>30

aagacaaataggccgggaatgt22

<210>31

<211>25

<212>dna

<213>人工序列

<400>31

cttagaagcctgatctatattggga25

<210>32

<211>36

<212>dna

<213>人工序列

<400>32

cgguactcatgactactgaaggaggtccagagatac36

<210>33

<211>20

<212>dna

<213>人工序列

<400>33

tgtcacaggtcactgcatgg20

<210>34

<211>25

<212>dna

<213>人工序列

<400>34

cgguctgaaggtgagccaccgcacc25

<210>35

<211>25

<212>dna

<213>人工序列

<400>35

cgguctgaagcattgattatttccc25

<210>36

<211>16

<212>dna

<213>人工序列

<400>36

aagcaatcaataaagt16

<210>37

<211>25

<212>dna

<213>人工序列

<400>37

cgguctgaagtgtaagcaccccctg25

<210>38

<211>21

<212>dna

<213>人工序列

<400>38

agggcttggtcaatatagaat21

<210>39

<211>50

<212>dna

<213>人工序列

<400>39

cctccctgcagtctctatgggctgcacacgacaacttattctcattcggt50

<210>40

<211>41

<212>dna

<213>人工序列

<400>40

atgagaataagttgtcgtgtgcagcccatagagactgcagg41

<210>41

<211>50

<212>dna

<213>人工序列

<400>41

cctccctgcagtctctatgggcgtaccacgacaacttattctcattcggt50

<210>42

<211>41

<212>dna

<213>人工序列

<400>42

atgagaataagttgtcgtggtacgcccatagagactgcagg41

<210>43

<400>43

000

<210>44

<211>41

<212>dna

<213>人工序列

<400>44

atgagaataagttgtcgtgcatggcccatagagactgcagg41

<210>45

<211>50

<212>dna

<213>人工序列

<400>45

cctccctgcagtctctatgggcagtccacgacaacttattctcattcggt50

<210>46

<211>41

<212>dna

<213>人工序列

<400>46

atgagaataagttgtcgtgagtcgcccatagagactgcagg41

<210>47

<211>21

<212>dna

<213>人工序列

<400>47

ctacttcagcgactagcagtc21

<210>48

<211>21

<212>dna

<213>人工序列

<400>48

ctacttcagcgactagcagcc21

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1