一种建库方法及SNP分型方法与流程

文档序号:14983820发布日期:2018-07-20 20:42阅读:406来源:国知局

本发明涉及分子生物学领域,更具体地说,涉及一种建库方法及snp分型方法。



背景技术:

单核苷酸多态性(singlenucleotidepolymorphism,snp)是指基因组上单个核苷酸位置上存在转换、颠换、插入、缺失等变化,其数量很多,多态性丰富。snp被认为是遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与snp有关,因此snp的分型对诸多疾病的治疗和用药有着积极的意义。

针对基因检测,二代高通量测序技术因其准确、灵敏的特性,应用范围不断扩大,已涉及生命科学研究以及医学研究的各个不同方面,利用二代高通量测序技术来进行snp位点的检测也是目前的研究热点之一。但是,基于二代高通量测序技术的snp分型方法,当待测snp位点与测序引物末端之间距离较长时,检测时间会大大延长,且受限于测序方法的读长,检测的准确性会大大降低;此外,当同时对多个易感基因的多个snp位点检测时,通常需要针对不同待测snp位点附近的序列设计多种不同的测序引物,但不同测序引物之间容易产生相互干扰,测序引物难以准确锚定在特定位置,从而增加了测序引物的设计难度,可能降低snp分型检测的准确率。

因此,需要一种新的建库方法及snp分型方法,使得对待测snp位点检测的准确性不受测序读长的影响;且能够避免在同一体系中同时对多个待测snp位点进行检测时,不同测序引物之间相互干扰的现象。



技术实现要素:

本发明的目的在于提供一种建库方法及snp分型方法,旨在解决现有技术中snp分型准确性受测序读长影响,以及在同一体系中同时对多个snp位点检测时不同测序引物之间相互干扰的问题。

为了实现发明目的,本发明提供了一种建库方法,包括以下步骤:

a、利用特异性扩增引物组对含待测snp位点的待测序样本进行pcr扩增,得到扩增产物;所述特异性扩增引物组中的至少一种扩增引物上含有iis型限制性内切酶识别序列,所述扩增产物上含有iis型限制性内切酶切割位点,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基;

b、采用iis型限制性内切酶对扩增产物进行酶切,得到含有待测snp位点的第一核酸片段,且所述第一核酸片段上经酶切形成第一末端;

c、在连接酶作用下,所述第一核酸片段在第一末端处连接测序接头,得到文库分子。

优选的,所述含有iis型限制性内切酶识别序列的特异性扩增引物上还含有u,所述u和所述待测snp位点在扩增产物上的位置分别位于所述iis型限制性内切酶切割位点的两侧;所述步骤b结束后,还包括向反应体系中加入user酶的步骤。

优选的,所述含有iis型限制性内切酶识别序列的特异性扩增引物的5’端经过磷酸修饰,所述经磷酸修饰的5’端和所述待测snp位点在扩增产物上的位置分别位于所述iis型限制性内切酶切割位点的两侧;所述步骤b结束后,还包括向反应体系中加入λ核酸外切酶的步骤。

优选的,所述测序接头上有测序引物结合位点和标签序列。

优选的,所述第一末端为粘性末端;所述测序接头为含有第二末端的双链核酸分子,所述第二末端与第一末端完全互补配对。

优选的,所述文库分子的末端上含有生物素标记,其被预先固定在含链霉亲和素或亲和素标记的磁珠上。

本发明还提供了一种snp分型方法,包括对按上述任一种建库方法制得的文库分子进行测序的步骤。

优选的,所述方法还包括将文库分子可寻址的固定在固相载体上的步骤。

优选的,当检测的待测序样本有多个时,根据待测序样本的不同分别进行建库,获得多种文库分子,再将多种文库分子混合在一起进行测序。

优选的,所述多种文库分子上分别含有不同的标签序列。

本发明的建库方法,通过设计含有iis型限制性内切酶识别序列的特异性扩增引物,通过在pcr过程中引物与模板链的互补配对将iis型限制性内切酶识别序列引入至扩增产物上,使获得的文库分子上的测序接头与待测snp位点之间的距离为0至5个碱基。后续可将含有不同待测snp位点的文库分子混合,然后进行测序,测序时,测序引物与文库分子中的测序接头上的序列完全互补配对,这样,对多种待测snp位点进行测序的测序引物可以是相同的,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性;另外,只需进行较少次数的测序步骤即可完成检测,大大缩短了测序时间,且使对待测snp位点的检测不受测序仪器读长的限制,也能提高准确性。

附图说明

图1是本发明第二实施例中文库分子的聚丙烯酰胺凝胶电泳检测图。

图2是本发明第五实施例中文库分子的聚丙烯酰胺凝胶电泳检测图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。

本发明提出第一实施例,一种建库方法,包括以下步骤:

a、利用特异性扩增引物组对含待测snp位点的待测序样本进行pcr扩增,得到扩增产物;所述特异性扩增引物组中的至少一种扩增引物上含有iis型限制性内切酶识别序列,所述扩增产物上含有iis型限制性内切酶切割位点,所述iis型限制性内切酶切割位点与所述待测snp位点之间的距离为0至5个碱基;

b、采用iis型限制性内切酶对扩增产物进行酶切,得到含有待测snp位点的第一核酸片段,且所述第一核酸片段上经酶切形成第一末端;

c、在连接酶作用下,所述第一核酸片段在第一末端处连接测序接头,得到文库分子。

本发明设计含有iis型限制性内切酶识别序列的特异性扩增引物,通过在pcr过程中引物与模板链的互补配对,将iis型限制性内切酶识别序列引入至扩增产物上,使iis型内切酶切割位点与待测snp位点之间的距离为0至5个碱基,从而使获得的文库分子中的测序接头与待测snp位点之间的距离为0至5个碱基。后续可将含有不同待测snp位点的文库分子混合,然后进行测序,测序引物与文库分子中的测序接头上的序列完全互补配对,因此对多种待测snp位点进行的测序引物可以是相同的,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性。此外,若采用合成测序法,只需要进行较少次数的测序步骤即可完成对待测snp位点的检测,缩短了检测时间,提高了检测的准确性;采用连接测序法,可以根据待测snp位点离测序引物的距离设计测序探针,只需进行一次连接测序即可完成对待测snp位点的检测,缩短了测序时间,提高了检测的准确性。

所述iis型限制性内切酶用于识别iis型限制性内切酶识别序列并在iis型限制性内切酶切割位点处进行切割。所述iis型限制性内切酶为切割位点在识别序列之外的限制性内切酶,包括但不限于:acuⅰ、alwⅰ、bbsⅰ、bbvⅰ、bccⅰ、bceaⅰ、bcivⅰ、bfuaⅰ、bmrⅰ、bpmⅰ、bpueⅰ、bsaⅰ、bsemⅱ、bserⅰ、bsgⅰ、bsmaⅰ、bsmbⅰ、bsmfⅰ、bspcnⅰ、bspmⅰ、bspqⅰ、btgzⅰ、earⅰ、eciⅰ、ecop15ⅰ、fauⅰ、fokⅰ、hgaⅰ、hphⅰ、hpyav、mboⅱ、mlyⅰ、mmeⅰ、mnlⅰ、nmeaⅲ、pleⅰ、sapⅰ、sfanⅰ和tspdtⅰ。

所述待测序样本为含待测snp位点的核酸分子,包括但不限于dna分子、cdna分子或rna分子。

步骤a中所述的pcr扩增可为单分子扩增,也可为非单分子扩增。

优选的,所述单分子扩增为乳液pcr、桥式pcr或乳液桥式pcr。

优选的,所述非单分子扩增为普通pcr扩增、实时荧光定量pcr、不对称pcr、固相pcr、原位pcr、反转录pcr、巢式pcr、兼并引物pcr、免疫pcr、反向pcr或递减pcr。

优选的,步骤b中经iis型限制性内切酶后,还包括将反应体系在80℃下维持5分钟,然后自然冷却至室温的步骤;本方案使得经iis型限制性内切酶酶切获得的不同于第一核酸片段的第二核酸片段变为3’突出端,从而可以有效避免在后续的连接步骤中,切割后的第一核酸片段与第二核酸片段之间重新连接。

优选的,所述含有iis型限制性内切酶识别序列的特异性扩增引物上还含有u,所述u和待测snp位点在扩增产物上的位置分别位于iis型限制性内切酶切割位点的两侧;步骤b反应结束后,向反应体系中加入user酶。本方案使得步骤b反应结束后,u位于切割后得到的不同于第一核酸片段的第二核酸片段上,在user酶存在的条件下,第二核酸片段上含u的单链被切割为小片段,从而能够避免在后续的连接步骤中,切割后的第一核酸片段和第二核酸片段之间重新连接。

进一步的,当u靠近扩增引物的5’端,iis型限制性内切酶识别序列靠近扩增引物的3’端,且所述u与所述iis型限制性内切酶识别序列之间的距离至少为3bp,user酶可以在iis型限制性内切酶加入之前加入反应体系、还可以与iis型限制性内切酶同时加入反应体系、还可以在步骤b反应结束后加入反应体系;优选的,所述user酶与iis型限制性内切酶同时加入反应体系。与分步加入user酶和iis型限制性内切酶的技术方案相比,本方案简化了操作步骤。

优选的,所述含有iis型限制性内切酶识别序列的特异性扩增引物的5’端经过磷酸修饰,所述经磷酸修饰的5’端和所述待测snp位点分别位于所述iis型限制性内切酶切割位点的两侧;步骤b反应结束后,向反应体系中加入λ核酸外切酶。本方案使得步骤b反应结束后,经磷酸修饰的5’端位于切割后得到的不同于第一核酸片段的第二核酸片段上,在λ核酸外切酶存在的条件下,第二核酸片段上含有5’端经过磷酸修饰的单链被降解为小片段,从而能够避免在后续的连接步骤中,切割后的第一核酸片段和第二核酸片段之间重新连接。

优选的,所述含有iis型限制性内切酶识别序列的特异性扩增引物的5’端含有生物素标记,所述含生物素标记的5’端和所述待测snp位点分别位于所述iis型限制性内切酶切割位点的两侧;所述特异性扩增引物的5’端通过生物素标记与链霉亲和素或亲和素的特异性结合预先固定在含链霉亲和素或亲和素的磁珠上,或在步骤b反应结束后,向反应体系中加入含链霉亲和素或亲和素的磁珠。本方案使得步骤b结束后,含生物素标记的5’端位于切割后得到的不同于第一核酸片段的第二核酸片段上,步骤b反应结束后,可以吸附在磁珠上的第二核酸片段从反应体系中分离出来,从而能够避免在后续的连接步骤中,切割后的第一核酸片段和第二核酸片段之间重新连接。

优选的,所述连接酶无特殊限制,能够实现dna片段连接即可,例如:e.colidna连接酶、t4dna连接酶、热稳定dna连接酶、tthdna连接酶。更优选为t4dna连接酶,其适用性广,且既可连接粘性末端,又能连接平末端。

所述测序接头为含有测序引物结合位点的双链核酸分子;本发明通过在第一核酸片段上连接测序接头,后续将含有不同待测snp位点的文库分子混合,然后进行测序的过程中,统一了多种待测snp位点的测序引物,降低了测序引物的设计难度,保证了各snp位点的测序引物锚定效率的一致性,避免了测序过程中由于引物不同而产生的相互干扰,提高了测序的准确性。

优选的,所述测序引物结合位点位于所述测序接头的第二末端,所述第二末端用于与所述第一末端连接;与测序引物结合位点位于测序接头其他位置的技术方案相比,本方案缩短了待测snp位点与测序引物之间的距离,减少了测序步骤,从而缩短了检测时间,提高了检测的准确性。

所述第一末端可以为平末端,也可以为粘性末端。

优选的,所述第一末端为粘性末端;此时,所述第二末端为与第一末端完全互补配对的粘性末端,与第一末端为平末端相比,本方案形成文库分子的连接效率更高。

优选的,所述文库分子的末端上含有生物素标记,所述生物素标记可以位于所述测序接头的第二末端的相对末端上,也可以位于文库分子与测序接头连接端的相对末端上;本方案中,利用该生物素标记,可以在步骤c结束后,很方便的将文库分子纯化出来。

所述文库分子通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体上,也可以在步骤c的连接反应结束后通过生物素标记固定在固相载体上。

本发明提出第二实施例,以人类全血基因组为模板,构建含rs1801133位点的mthfr基因片段文库,建库步骤如下。

a、制备扩增产物,配制巢式扩增反应体系如下:

第一轮pcr扩增,在200μl离心管中加入浓度为50ng/μl的人类全血dna分子1.0μl;2×longtaqmix(深圳华因康基因科技有限公司生产)10μl;浓度为10μm的上游引物(seqidno:1)0.4μl;浓度为10μm的下游引物(seqidno:2)0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,56℃条件下持续20秒,72℃条件下持续1分钟,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第一轮pcr产物;

第二轮pcr扩增,在200μl离心管中加入浓度为0.1ng/μl的第一轮pcr扩增产物1.0μl;2×longtaqmix10μl;浓度为10μm的上游引物(seqidno:3)0.4μl;0.4μl浓度为10μm的下游引物(seqidno:4);20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,55℃条件下持续20秒,72℃条件下持续20秒,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第二轮pcr产物;其中,上游引物(seqidno:3)上含有bceaⅰ酶识别序列acggc,bceaⅰ酶切割位点位于bceaⅰ酶识别序列和rs1801133位点之间,且与待测snp位点之间的长度为4bp。

b、采用bceaⅰ酶对步骤a中第二轮pcr产物进行切割,配制反应体系如下:

纯化的第二轮pcr产物200ng,浓度为2units/μl的bceaⅰ酶1μl,10×nebuffer3.1(neb公司生产)2.5μl,去离子水1.5μl,在37℃条件下反应1小时,65℃下灭活20分钟,得到含待测snp位点的第一核酸片段,且第一核酸片段上经切割形成5’端有2个突出碱基的第一末端。

c、步骤b反应结束后,向体系中加入以下组分:浓度为2.5pmol/μl的测序接头0.4μl;浓度为2units/μl的t4dna连接酶1μl;浓度为100mm的atp0.3μl;质量浓度为30%的聚乙二醇600010μl;去离子水加至40μl;室温下反应1小时。测序接头由seqidno:5和seqidno:6组成,与第一末端完全互补配对,其中,seqidno:5上的agtcgctgaagtagtcggt序列为测序引物结合序列,seqidno:5的5’端含有生物素标记,且被预先固定在含链霉亲和素的磁珠上;反应完成后,将离心管置于磁架上,分离去除上清,得到吸附在磁珠上的含有测序接头和rs1801133位点的文库分子;

对文库分子进行验证,配制以下反应体系,扩增文库分子:

稀释100倍的磁珠悬液1μl;2×longtaqmix10μl;浓度为10μm上游引物(seqidno:7)0.4μl;浓度为10μm下游引物(seqidno:4)0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续2分钟;94℃条件下持续20秒,54℃条件下持续20秒,72℃条件下持续10秒分钟,一共25个循环;72℃条件下持续3分钟;pcr反应完成后,得到验证产物。

验证产物聚丙烯酰胺凝胶电泳结果如图1所示,0为分子大小标记物,泳道1为验证产物,从图中可以看出,验证产物在110bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本发明提出第三实施例,以人类全血基因组为模板,构建含rs1801133位点的mthfr基因片段文库,与第二实施例的区别在于,步骤a中第二轮pcr扩增的扩增引物为:上游引物(seqidno:8)、下游引物(seqidno:4);其中,上游引物(seqidno:8)上含有acuⅰ酶识别序列ctgaac,acuⅰ酶切割位点位于acuⅰ酶识别序列和rs1801133位点之间,且与待测snp位点之间的长度为4bp;

b、采用acuⅰ酶对步骤a中的扩增产物进行切割,配制反应体系如下:

纯化的第二轮pcr产物200ng;浓度为2units/μl的acuⅰ酶0.5μl;10×cutsmart®buffer2.5μl;3.2mms-腺苷甲硫氨酸0.5μl,去离子水1.5μl;在37℃条件下反应1小时,65℃下灭活20分钟,得到含待测snp位点的第一核酸片段,且第一核酸片段上经切割形成3’端有2个突出碱基的第一末端;

步骤c中的测序接头由seqidno:9和seqidno:10组成,与第一末端完全互补配对,其中,seqidno:9上的agtcgctgaagtagtcggt序列为测序引物结合序列。

对文库分子进行验证的步骤中,以上游引物(seqidno:11)、下游引物(seqidno:12)配制扩增反应体系并进行扩增得到验证产物。

验证产物经聚丙烯酰胺凝胶电泳,验证产物在110bp附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本发明提出了第四实施例,以人类全血基因组为模板,构建含rs1801133位点的mthfr基因片段文库,配制两个不同的反应体系,与第二实施例的区别在于,步骤a中各反应体系第二轮pcr扩增的引物分别为:上游引物(seqidno:13)和下游引物(seqidno:4);上游引物(seqidno:14)和下游引物(seqidno:4);其中上游引物(seqidno:13)为dna序列,其上含有bsmfⅰ酶识别序列gggac及两个u;上游引物(seqidno:14)为dna序列,其上含有btgzⅰ酶识别序列gcgatg及两个u。

b、分别配制两个如下的反应体系并反应:纯化的第二轮pcr产物200ng;浓度为2units/μl的bsmfⅰ酶1μl;10×cutsmart®buffer1μl;去离子水1.5μl;在65℃条件下反应1小时,65℃下灭活20分钟,得到含待测snp位点的第一核酸片段及含两个u的第二核酸片段,且第一核酸片段上经切割形成5’端有4个突出碱基的第一末端;切割反应完成后,向反应体系中加入user酶,室温下作用30分钟,第二核酸片段上含u的单链发生降解,本方案可以有效防止第一核酸片段和第二核酸片段之间重新连接,有利于文库分子的制备;

纯化的第二轮pcr产物200ng;浓度为2units/μl的btgzⅰ酶1μl;10×cutsmart®buffer0.5μl;去离子水1.5μl;在60℃条件下反应1小时,80℃下灭活20分钟,得到含待测snp位点的第一核酸片段及含两个u的第二核酸片段,且第一核酸片段上经切割形成5’端有4个突出碱基的第一末端;切割反应完成后,向反应体系中加入user酶,室温下作用30分钟,第二核酸片段上含u的单链发生降解,本方案可以有效防止第一核酸片段和第二核酸片段之间重新连接,有利于文库分子的制备。

步骤c中两个反应体系的测序接头均由seqidno:5和seqidno:15组成;

本实施例文库分子的验证产物经聚丙烯酰胺凝胶电泳,验证产物在110bp位置附近出现目标条带,与理论预期文库分子大小完全相符,说明本发明的方法可以实现对待测序样本的建库。

本发明提出了第五实施例,以人类全血基因组为模板,建立五个不同的反应体系,分别构建含rs1799853位点的cyp2c9基因片段,含rs1057910位点的cyp2c9基因片段,含rs9923231位点的vkorc1基因片段,含rs4244285位点的cyp2c19基因片段,含rs4986893位点的cyp2c19基因片段的基因文库,建库步骤如下。

a、制备扩增产物,配制巢式扩增反应体系如下:

第一轮pcr扩增,在200μl离心管中加入浓度为50ng/μl的人类全血dna分子1.0μl;2×longtaqmix10μl;浓度为10μm的上游引物0.4μl;浓度为10μm的下游引物0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,49℃条件下持续20秒,72℃条件下持续1分钟,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第一轮pcr产物。其中,各反应体系中第一轮pcr扩增的扩增引物分别为:上游引物(seqidno:16)和下游引物(seqidno:17);上游引物(seqidno:18)和下游引物(seqidno:19);上游引物(seqidno:20)和下游引物(seqidno:21);上游引物(seqidno:22)和下游引物(seqidno:23);上游引物(seqidno:24)和下游引物(seqidno:25);

第二轮pcr扩增,在200μl离心管中加入浓度为0.1ng/μl的第一轮pcr扩增产物1.0μl;2×longtaqmix10μl;浓度为10μm的上游引物0.4μl;浓度为10μm的下游引物0.4μl;20μl去离子水;混匀并离心。将离心管置于pcr仪中,设置反应程序:94℃条件下持续4分钟;94℃条件下持续20秒,t℃条件下持续20秒,72℃条件下持续20秒,一共30个循环;72℃条件下持续3分钟;pcr反应完成后,得到第二轮pcr产物;其中,各反应体系中的退火温度t分别为50℃,50℃,53℃,45℃和45℃。各反应体系中,第二轮pcr扩增的扩增引物分别为:上游引物(seqidno:26)和下游引物(seqidno:27);上游引物(seqidno:28)和下游引物(seqidno:29);上游引物(seqidno:30)和下游引物(seqidno:31);上游引物(seqidno:32)和下游引物(seqidno:33);上游引物(seqidno:34)和下游引物(seqidno:35);其中上游引物seqidno:26、seqidno:28、seqidno:30、seqidno:32、seqidno:34上含有bceaⅰ酶识别序列acggc,bceaⅰ酶切割位点位于bceaⅰ酶识别序列和待测snp位点之间,且与待测snp位点之间的长度为4bp。

b、分别采用bceaⅰ酶对步骤a中第二轮pcr产物进行切割,配制反应体系如下:

纯化的第二轮pcr产物200ng;浓度为2units/μl的bceai酶1μl;10×nebuffer3.12.5μl,去离子水1.5μl;在37℃条件下反应1小时,65℃下灭活20分钟,得到含待测snp位点的第一核酸片段,且第一核酸片段上经切割形成5’端有2个突出碱基的第一末端。

c、步骤b反应结束后,向各反应体系中加入以下组分:浓度为2.5pmol/μl的测序接头0.4μl,浓度为2units/μl的t4dna连接酶1μl,浓度为100mm的atp0.3μl,质量浓度为30%的聚乙二醇600010μl,去离子水加至40μl,室温下反应1小时;各反应体系的测序接头分别由seqidno:36和seqidno:37、seqidno:38和seqidno:37、seqidno:39和seqidno:40、seqidno:41和seqidno:40、seqidno:42和seqidno:43组成。其中,seqidno:36、seqidno:38、seqidno:39、seqidno:41、seqidno:42上分别含有标签序列acgt、tgca、gtac、catg、agtc,且均含有测序引物结合位点agtcgctgaagtagtcggt,其5’端为含有生物素标记,且被预先固定在含链霉亲和素的磁珠上;反应完成后,将离心管置于磁架上,分离去除上清,分别得到吸附在磁珠上含有待测snp位点和测序接头的文库分子。

对各反应体系中制备的文库分子进行验证,首先配制以下反应体系,扩增文库分子:稀释100倍的磁珠悬液1μl,2×longtaqmix10μl,浓度为10μm上游引物0.4μl,浓度为10μm下游引物(seqidno:4)0.4μl,20μl去离子水,混匀并离心;将离心管置于pcr仪中,设置反应程序:94℃条件下持续2分钟;94℃条件下持续20秒,54℃条件下持续20秒,72℃条件下持续10秒分钟,一共25个循环;72℃条件下持续3分钟;pcr反应完成后,得到验证产物。其中,各体系中扩增反应的引物分别为:上游引物(seqidno:7)和下游引物(seqidno:44);上游引物(seqidno:7)和下游引物(seqidno:29);上游引物(seqidno:7)和下游引物(seqidno:31);上游引物(seqidno:7)和下游引物(seqidno:45);上游引物(seqidno:7)和下游引物(seqidno:35)。

验证产物经琼脂糖凝胶电泳结果如图2所示,0为分子大小标记物,泳道1-5分别为上述五个反应体系验证产物,在82bp、67bp、121bp、127bp、112bp位置附近出现目标条带,与理论预期文库分子完全相符,说明本发明的方法可以实现对待测序样本的建库。

本发明还提出了第六实施例,一种snp分型方法,包括对按上述任一实施例中的建库方法制得的文库分子进行测序的步骤。

本发明的文库分子上由于含有测序接头,统一了同一体系中多个不同待测snp位点的测序引物,避免了测序引物之间的相互干扰。

优选的,所述方法还包括将文库分子可寻址的固定在固相载体上的步骤。

所述可寻址的固定,是指能够确定位置信息的固定。即固相载体上每一具体位置上所固定的文库分子与其它位置上所固定的文库分子之间是能够明确区分的。

进一步的,含测序接头的文库分子可通过直接或间接的方式可寻址的固定在固相载体上。

针对通过直接的方式实现含测序接头的文库分子的可寻址固定,本发明提出一实施例:含测序接头的文库分子杂交至流动小室上,从而实现含测序接头的文库分子的可寻址固定;本发明还提出另一实施例,含测序接头的文库分子固定在微球上,微球预先固定在固相载体上,从而实现含测序接头的文库分子的可寻址固定。

针对通过间接的方式实现含测序接头的文库分子的可寻址固定,本发明提出一实施例:含测序接头的文库分子先固定在微球上,然后再将微球固定在固相载体上,从而实现含测序接头的文库分子的可寻址固定。

当检测的待测序样本有多个时,根据待测序样本的不同分别进行建库,获得多种文库分子,再将多种文库分子混合,在同一体系中进行测序。

优选的,所述多种文库分子分别含有不同的标签序列,本方案通过文库分子上的标签序列,可以区分出不同文库分子的测序结果。

进一步的,所述标签序列位于所述文库分子上的测序接头上。

优选的,所述测序的方法为第二代高通量基因测序技术,包括但不限于连接测序法或合成测序法。

所述连接测序法是基于连接酶在核酸片段之间进行连接反应的过程中的保真性来实现的,以待测序核酸片段为模板,测序引物和寡聚核苷酸探针(该探针的特定位置上带有荧光标记)进行连接反应,通过检测连接产物上的荧光标记从而确定寡核苷酸探针上带有荧光标记的特定位置对应的序列的信息。目前,市场上常见的连接测序法有多种,包括但不限于:深圳华因康基因科技有限公司的pstar连接测序法、abi公司的连接测序法、completegenomics公司的连接测序法。

所述合成测序法是基于聚合酶在延伸核酸链过程中的保真性来实现的,以待测序核酸片段为模板,锚定引物(又称测序引物,其与待测序核酸片段所在链互补)互补结合至待测序核酸片段上,通过检测在延伸过程中产生的信号来确定待测序核酸片段上相应位置的序列信息。目前,市场上常见的合成测序法有多种,包括但不限于:illumina公司的solexa合成测序法、roche公司的454合成测序法、lifetechnologies公司的iontorrent、ionproton合成测序法。

需要说明的是,采用合成测序法进行snp分型检测时,所述测序接头的3’端固定在固相载体上,保留固定在固相载体上的单链核酸分子,对待测snp位点进行检测。采用连接测序法进行snp分型检测时,所述测序接头的任一条单链均可固定在固相载体上,并保留作为测序模板。

本发明还提出第七实施例,一种对mthfr基因rs1801133位点检测的方法,本实施例在第二实施例的基础上,还包括以下步骤:

向步骤c中得到的吸附在磁珠上的文库分子中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含质量浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用深圳华因康基因科技有限公司的高通量基因测序仪pstariia,以连接测序法进行测序,测序引物(seqidno:12)5’端经磷酸修饰,且固定在测序接头的测序引物结合序列上,采用与检测位点互补的带有荧光基团的简并九聚物nnnnxnnnn作为测序探针,经过一次连接测序,确定mthfr基因的rs1801133位点为t。

本发明还提出第八实施例,一种对mthfr基因rs1801133位点检测的方法,本实施例在第三实施例的基础上,还包括以下步骤:

将步骤c制得的文库分子杂交至流动小室上;向文库分子中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含质量浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用illumina测序仪,将测序引物(seqidno:12)固定在测序接头的测序引物结合序列上,经过四次合成测序,确定mthfr基因的rs1801133位点为t。

本发明还提出第九实施例,同时检测cyp2c9基因片段上的rs1799853位点、rs1057910位点,vkorc1基因片段上的rs9923231位点,cyp2c19基因片段上的rs4244285位点、rs4986893位点,本实施例在第四实施例的区别在于,还包括以下步骤:

将步骤c中各反应体系得到的吸附在磁珠上的文库分子混匀,向其中加入浓度为0.1m的naoh溶液20μl,使模板变性为单链,分离去除上清,用20μl1×te(含v/v浓度为0.01%的triton)洗涤两遍,20μl1×te洗涤一遍,最后重悬于10μl1×te中用作测序模板;采用深圳华因康基因科技有限公司的高通量基因测序仪pstariia,以连接测序法进行测序,将测序引物(seqidno:43)固定在测序接头的测序引物结合位点上,经过一次连接测序,确定上述待测snp位点分别为c、a、t、g、g。

本实施例通过在文库分子上连接相同的测序接头,统一了同一体系中多个待测snp位点检测的测序引物,避免了不同引物之间的相互干扰。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

sequencelisting

<110>广州康昕瑞基因健康科技有限公司

<120>一种建库方法及snp分型方法

<130>

<160>45

<170>patentinversion3.3

<210>1

<211>20

<212>dna

<213>人工序列

<400>1

gtgctgttggaaggtgcaag20

<210>2

<211>20

<212>dna

<213>人工序列

<400>2

actcagcgaactcagcactc20

<210>3

<211>25

<212>dna

<213>人工序列

<400>3

cggtacggcaaggtgtctgcgggag25

<210>4

<211>18

<212>dna

<213>人工序列

<400>4

ggcaagtgatgcccatgt18

<210>5

<211>50

<212>dna

<213>人工序列

<400>5

cctccctgcagtctctatgggcacgtctgctagtcgctgaagtagtcggt50

<210>6

<211>26

<212>dna

<213>人工序列

<400>6

ccaccgactacttcagcgactagcag26

<210>7

<211>19

<212>dna

<213>人工序列

<400>7

agtcgctgaagtagtcggt19

<210>8

<211>28

<212>dna

<213>人工序列

<400>8

cggtctgaagagaaggtgtctgcgggag28

<210>9

<211>50

<212>dna

<213>人工序列

<400>9

agtcgctgaagtagtcggtctgctacgtcctccctgcagtctctatgggc50

<210>10

<211>26

<212>dna

<213>人工序列

<400>10

agcagaccgactacttcagcgactgg26

<210>11

<211>18

<212>dna

<213>人工序列

<400>11

ggcaagtgatgcccatgt18

<210>12

<211>19

<212>dna

<213>人工序列

<400>12

accgactacttcagcgact19

<210>13

<211>23

<212>dna

<213>人工序列

<400>13

cggtgggacggugtcugcgggag23

<210>14

<211>24

<212>dna

<213>人工序列

<400>14

cggtgcgatgggugtcugcgggag24

<210>15

<211>28

<212>dna

<213>人工序列

<400>15

ctccaccgactacttcagcgactagcag28

<210>16

<211>24

<212>dna

<213>人工序列

<400>16

ggatggaaaacagagacttacaga24

<210>17

<211>21

<212>dna

<213>人工序列

<400>17

atatggccacccctgaaatgt21

<210>18

<211>24

<212>dna

<213>人工序列

<400>18

ttcatatacccctgaattgctaca24

<210>19

<211>20

<212>dna

<213>人工序列

<400>19

tggggacttcgaaaacatgg20

<210>20

<211>20

<212>dna

<213>人工序列

<400>20

caccaagacgctagacccaa20

<210>21

<211>24

<212>dna

<213>人工序列

<400>21

tagatgtgagaaacagcatctgga24

<210>22

<211>23

<212>dna

<213>人工序列

<400>22

accagagcttggcatattgtatc23

<210>23

<211>24

<212>dna

<213>人工序列

<400>23

gcagaacagagcttttcctatcct24

<210>24

<211>22

<212>dna

<213>人工序列

<400>24

aagacaaataggccgggaatgt22

<210>25

<211>25

<212>dna

<213>人工序列

<400>25

cttagaagcctgatctatattggga25

<210>26

<211>23

<212>dna

<213>人工序列

<400>26

cggtacggcggagcattgaggac23

<210>27

<211>21

<212>dna

<213>人工序列

<400>27

gggtcacccacccttggtttt21

<210>28

<211>34

<212>dna

<213>人工序列

<400>28

cggtactcatgactaacggcaggtccagagatac34

<210>29

<211>20

<212>dna

<213>人工序列

<400>29

tgtcacaggtcactgcatgg20

<210>30

<211>23

<212>dna

<213>人工序列

<400>30

cggtacggctgagccaccgcacc23

<210>31

<211>20

<212>dna

<213>人工序列

<400>31

agacgccagaggaagagagt20

<210>32

<211>23

<212>dna

<213>人工序列

<400>32

cggtacggcattgattatttccc23

<210>33

<211>16

<212>dna

<213>人工序列

<400>33

aagcaatcaataaagt16

<210>34

<211>23

<212>dna

<213>人工序列

<400>34

cggtacggcgtaagcaccccctg23

<210>35

<211>21

<212>dna

<213>人工序列

<400>35

agggcttggtcaatatagaat21

<210>36

<211>50

<212>dna

<213>人工序列

<400>36

cctccctgcagtctctatgggcacgtctgctagtcgctgaagtagtcggt50

<210>37

<211>26

<212>dna

<213>人工序列

<400>37

gtaccgactacttcagcgactagcag26

<210>38

<211>50

<212>dna

<213>人工序列

<400>38

cctccctgcagtctctatgggctgcactgctagtcgctgaagtagtcggt50

<210>39

<211>50

<212>dna

<213>人工序列

<400>39

cctccctgcagtctctatgggcgtacctgctagtcgctgaagtagtcggt50

<210>40

<211>26

<212>dna

<213>人工序列

<400>40

ggaccgactacttcagcgactagcag26

<210>41

<211>50

<212>dna

<213>人工序列

<400>41

cctccctgcagtctctatgggccatgctgctagtcgctgaagtagtcggt50

<210>42

<211>50

<212>dna

<213>人工序列

<400>42

cctccctgcagtctctatgggcagtcctgctagtcgctgaagtagtcggt50

<210>43

<211>26

<212>dna

<213>人工序列

<400>43

caaccgactacttcagcgactagcag26

<210>44

<211>19

<212>dna

<213>人工序列

<400>44

gtcacccacccttggtttt19

<210>45

<211>20

<212>dna

<213>人工序列

<400>45

gtcccgagggttgttgatgt20

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1