一种应用于标记开发的高通量测序的接头及其运用方法

文档序号:414929阅读:624来源:国知局
专利名称:一种应用于标记开发的高通量测序的接头及其运用方法
技术领域
本发明涉及高通量测序领域,尤其涉及一种标记开发的高通量测序的接头及其运用方法。
背景技术
RAD (restriction association site DNA)是酶切位点附近的 DNA 序列标签。 RAD可以作为一种分子标记应用于基因定位,图谱绘制等。RAD标记的密度可以通过在分离的过程中应用不同的内切酶获得。RAD标记技术与第二代测序技术的完美结合,能够快速而且高通量的实现标记开发,图谱绘制等。RAD标记技术能够降低基因组的复杂度,不受基因组序列有无的限制,操作简便,能够快速的开发出大量的分子标记,从而广泛应用于群体的遗传研究。发明内容
为了实现上述的技术目的,本发明提供了一种标记开发的高通量测序的接头及其运用方法。
本发明的一个目的是提供两种特殊结构的接头分子A和B。
本发明提供的双链接头DNA序列分子A,包括正向和反向两条链。正向链从5’末端到3’末端依次由如下部分组成与Illumina公司的Hiseq2000测序平台测序序列P7相同的寡核苷酸片段和与待测DNA的3’端互补的粘性酶切位点序列;反向链与正向链除了突出的粘性末端外,其余序列与正向链互补,并在5’末端进行磷酸化修饰。接头A的结构如图I所示。
前述的提供的双链接头DNA序列分子A,其中所述的正向链为序列表中序列I。
前述的提供的双链接头DNA序列分子A,其中所述的与illumina公司的 Hiseq2000测序平台测序序列p7相同的寡核苷酸片段,为序列表中序列I的第5_61位。
前述的提供的双链接头DNA序列分子A,其中所述的与待测DNA的3’端互补的粘性酶切位点序列,为序列表中序列I的第1-4位。
前述的提供的双链接头DNA序列分子A,其中所述的反向链为序列表中序列2。
前述的提供的双链接头DNA序列分子A,其中所述的在反向链5’末端进行磷酸化修饰,为序列表中序列I的第I位的脱氧核糖核苷酸进行的磷酸化修饰。
本发明提供的局部双链的接头DNA序列分子B,包括一个长的正向链和一个短的反向链。正向链从5’末端到3’末端依次由如下部分组成 与Illumina公司的测序平台测序序列P5相同的寡核苷酸片段和与待测DNA的3’端互补的一个脱氧核糖核苷酸突出末端;反向链与正向链的一部分序列互补并在5’末端进行磷酸化修饰。接头B的结构如图2 所示。
前述的提供的局部双链的接头DNA序列分子B,其中所述的正向链为序列表中序列3。
前述的提供的局部双链的接头DNA序列分子B,其中所述的与Illumina公司的测序平台测序序列P5相同的寡核苷酸片段,为序列表中序列3的第1-57位。
前述的提供的局部双链的接头DNA序列分子B,其中所述的与待测DNA的3’端互补的一个脱氧核糖核苷酸为序列表中序列3的第58位。
前述的提供的局部双链的接头DNA序列分子B,其中所述的反向链为序列表中序列4。
前述的提供的局部双链的接头DNA序列分子B,其中所述的在反向链5’末端进行磷酸化修饰,为序列表中序列4的第I位的脱氧核糖核苷酸进行的磷酸化修饰。
本发明的第二个目的是提供一种运用上述接头A和B进行高通量测序开发分子标记的方法,包括如下步骤I)将所述用于标记开发的基因组DNA用特定的限制性内切酶消化,并将所述的接头A与消化产物连接,得到含有接头A的连接产物;2)对步骤I)得到的连接产物进行打碎,打碎大小集中在300— 700bp之间;3)对步骤2)得到的打碎产物纯化回收之后,进行末端补平,加dATP,并进行接头B的连接;4)对步骤3)得到的连接产物进行纯化并定量后进行PCR扩增,并将扩增产物纯化后,在Illumina公司的Hiseq2000测序平台进行测序;5)进行生物信息分析后,确定酶切位点SNP或INDEL等标记。流程图如图3所/Jn ο
前述的一种运用上述接头A和B进行高通量测序开发分子标记的方法,步骤I)中, 所述将基因组DNA消化的酶切体系包括酶切缓冲液、限制性内切酶、O. I-Iug的基因组 DNA,所述限制性内切酶在酶切体系中的浓度为O. 5 U/ul ;所述的连接体系包括上述酶切产物、接头A、ATP、连接酶,所述的接头A的浓度为ΙΟΟηΜ,所述的ATP的浓度为ImM,所述连接酶在所述连接体系中的浓度为O. 5 U/ul。
前述的一种运用上述接头A和B进行高通量测序开发分子标记的方法,步骤2)中, 所述的打碎的条件为使用covaris打碎仪器并调整相应的参数。
前述的一种运用上述接头A和B进行高通量测序开发分子标记的方法,步骤3)中, 所述的回收打碎产物的方法为采用PCR产物回收试剂盒进行回收;所述的末端补平体系为使用NEB公司的Quick Blunting kit进行;所述的加dATP的体系包括dATP,加A缓冲液,加dATP的聚合酶,所述的dATP的浓度为5 mM,所述的聚合酶在所述的反应体系中的浓度为O. 05 U/ul ;所述的接头B的连接体系包括接头B,ATP、连接酶,所述的接头B的浓度为10 uM,所述的ATP的浓度为ImM,所述连接酶在所述连接体系中的浓度为O. 5 U/ul。
前述的一种运用上述接头A和B进行高通量测序开发分子标记的方法,步骤4)中, 所述的PCR体系包括引物,聚合酶混合物,以及步骤3)中得到的连接产物。所述的引物的浓度为O. 2 uM,所述聚合酶混合物在所述PCR体系中所占的50%的体积。
前述的一种运用上述接头A和B进行高通量测序开发分子标记的方法,其中所述的基因组DNA为任何单倍体或二倍体材料的DNA,包括动物、植物、微生物等。
本发明的实验证明,本发明提供的接头分子A和B,能够连接到DNA片段的两端,运用本发明的建库方法,成功的构建了 DNA文库,并成功的运用在illumina公司的Hiseq2000 的测序平台进行测序,获得大量的分子标记位点;同时,可以实现多个样本的混合建库,根据需要调整获取的分子标记的数目。本发明提供了一种便捷,高效,快速的标记开发的方法,在居群遗传、图谱绘制、种质评价和鉴定等研究和应用领域有着广泛的应用前景。


图I为接头A的结构示意图;图2为接头B的结构示意图;图3为建库流程示意图;图4为所述材料基因组DNA酶切产物琼脂糖凝胶电泳图;图5为对酶切基因组DNA产物加上接头A之后的打碎产物的琼脂糖凝胶电泳图(切胶回收前后);图6为对加上接头B的连接产物进行PCR扩增产物的电泳图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。
下述实施例中所述方法如无特别说明均为常规方法,所用核苷酸序列均由上海 Invitrogen生物公司合成。所用试剂如无特别说明均为NEB公司的产品,所用水均为超纯水。
I、基因组DNA的酶切和接头A的连接。
I)样品浓度测定使用Qubit (美国)对样品DNA浓度测定,进行精准定量,并使用O. 8%琼脂糖凝胶,120v电压,电泳I小时,检测样品质量,确保水稻基因组DNA样品完整无降解。
2)以步骤I)检测的水稻基因组DNAlOOngIug为模板进行限制性酶切。反应体系和反应条件如下样品 DNA (150 250 ng/ μ I) O. 1-1 μ g , Restriction Enzyme {EcoRl)Iμ 1,10XNEB Buffer 2 5 μ 1,补加H2O至总体积为50 μ 1,将上述混合液37°C处理15 mirT2 h后,65°C处理20 min。取出Iul进行电泳检测,结果表明,酶切充分,得到均匀弥散的条带,如附图4。
3)接头A的连接在步骤2)得到的消化产物中,补加ATP,T4连接酶,连接缓冲液以及接头A,在室温连接。具体的反应体系和反应条件如下步骤2)中的消化产物50ul,100 mM ATP I μ 1,10XNEB Buffer 2 I μ I, (1000 u) Τ4 DNA Ligase, O. 5 μ ,加 Η20 5 μ I, IOOnM Adaptorl 2.5 μ 1,总共 60 ul,室温(或 16°C )下连接 2h ;连接产物65°C 20 min,连接酶活性失活。
2、连接产物的随机打碎,补平,加dATP。
I)将步骤I中得到的连接产物使用covaris(美国)破碎至300_700bp,使用Qiagen PCR试剂盒回收打碎产物,具体步骤按照Qiagen试剂盒操作说明书进行。
2)对上述回收产物进行末端补平。反应体系和反应条件如下打碎产物DNA 30 μ ,IOXBlunting Buffer 5 μ1,1 mM dNTP 10 μ ,Quick Blunting kit Enzyme Mix, I μ , 加H2O 9 μ ,总体系50 μ ;反应条件:30 °C孵育30 min。
3)对步骤2)的补平产物进行纯化将上述产物进行胶回收,纯化目的片段。I. 0% 琼脂糖凝胶电泳,切胶回收300-700bp范围的条带。整个回收过程按照Qiagen胶回收试剂盒操作说明书进行。如附图5。
4)对步骤3)中的纯化产物进行加dATP,反应体系和条件如下步骤3)中的补平产物,20 μ , 100 mM dATP I μ , 10ΧΝΕΒ Buffer 2 3 μ , Klenow exo- (NEB) (50,000 units/ ml) 0. 3 μ1,Η20 5.5 μ ,总体积 30 μ ;反应条件充分混匀,37 °C孵育 30 min, 75 °C 20 min热失活。
3、接头B的连接。
I)将步骤2的连接产物,加入接头B,反应体系和条件具体如下连接产物30 μ , NEB Buffer 22 μ1,10 uM 接头 B 2.5 μ , (1000 u) T4 DNA Ligase O. 5 41,加氏015 μ , 总体积50 μ ,室温(或16°C )下连接2小时,连接产物65°C 20min,连接酶活性失活。
2)将步骤I)中的连接产物等体积AMP μ re XP Beads纯化I次。纯化过程严格按照使用说明书进行。
3)将步骤2)中的回收产物进行Qubit定量,用于下一步PCR反应。
4、PCR扩增目的片段。
I)将步骤3中回收的产物,精准定量IOng用于PCR反应,得到的PCR产物,即为所构建的文库。反应体系和条件如下DNA样品3 μ1,ΡΟ Primer 11 Pl,PCR Primer 2 I μ ,2X Phusion PCR Master Mix 25 μ1,Η20 20 μ ,总共 50 μ ,应条件为先 98°C预变性 Imin ; 然后 98°C 10 s,60°C 30 s,72°C 30 s,共 10个循环;最后 72°C 延伸 5 minoPrimer I 的序列为 5’ -AATGATACGGCGACCACCGA-3’ ;Primer 2 的序列为 5’ -CAAGCAGAAGACGGCATACGA-3’。
2)将步骤I)中的PCR产物等体积AMP μ re XP Beads纯化两次。纯化过程严格按照使用说明书进行。取出Iul进行琼脂糖凝胶电泳检测,结果表明,得到300— 700富集的条带,如附图6。
3)将步骤2)中的纯化产物进行Qy bit精准定量。
5、文库库检和上机。
I)将步骤4中所得的纯化产物稀释到lng/ul,取出Iul用于Agilent2100 (美国 Agilent公司)检测,另外再取Iul用于QPCR (Biorad公司)检测,根据检测结果,决定上机浓度。
2)根据步骤I)所得的浓度,将文库稀释到上机要求后,在Illumina公司的 Hiseq2000测序平台进行测序。
6、上机结果质控。
I)对水稻RAD基因组数据进行酶切位点分析,共5,533个。
2)对下机数据16M过滤出有酶切位点的reads,再将PEreads用BWA是用较严格的参数比对到水稻基因组上,可以正确成对比上基因组的reads为42,6410对,read2上含酶切位点的总数目为590,905对。
3) BffA比对位置和基因组上酶切位点能够完全重合的数目情况统计如下过滤后 reads正向比对的有4546处,和基因组能完成重合的数目为4370处。
4)有78. 9%的酶切位点被覆盖到。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。序列表I<110>北京诺禾致源生物信息科技有限公司〈120〉一种应用于标记开发的高通量测序的接头及其运用方法〈160〉 4〈210〉 I〈211〉 61〈212〉 DNA〈213〉人工序列〈220〉〈223〉在第I位碱基进行磷酸化修饰 〈400〉 Iaattgatcgg aagagcgtcg tgtagggaaa gagtgtagat ctcggtggtc gccgtatcat60t 61序列表2<110>北京诺禾致源生物信息科技有限公司〈120〉一种应用于标记开发的高通量测序的接头及其运用方法〈160〉 4〈210〉 2〈211〉 19〈212〉 DNA〈213〉人工序列〈220〉〈223〉在第I位碱基进行磷酸化修饰 〈400〉 2acgtgtgctc ttccgatc19序列表3<110>北京诺禾致源生物信息科技有限公司〈120〉一种应用于标记开发的高通量测序的接头及其运用方法〈160〉 4〈210〉 3〈211〉 58〈212〉 DNA〈213〉人工序列〈220〉〈400〉 3aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct58<110>北京诺禾致源生物信息科技有限公司〈120〉一种应用于标记开发的高通量测序的接头及其运用方法〈160〉 4〈210〉 4〈211〉 18〈212〉 DNA〈213〉人工序列 〈220〉〈223〉在第I位碱基进行磷酸化修饰 〈400〉 4CTAGCCTTCT CGCAGCAC18
权利要求
1.一种接头序列A,其特征在于,是如下I)或2)的核苷酸 1)由序列表中序列I和2所示的核苷酸序列组成的接头; 2)将序列表中序列2的核苷酸残基序列经过一个或几个碱基的取代和/或缺失和/或添加且具与接头A同样功能的核苷酸序列。
2.一种接头序列B,其特征在于,是如下I)或2)的核苷酸 1)由序列表中序列3和4所示的核苷酸序列组成的接头; 2)将序列表中序列4的核苷酸残基序列经过一个或几个碱基的取代和/或缺失和/或添加且具与接头B同样功能的核苷酸序列。
3.一种运用上述接头A和B进行高通量测序开发分子标记的方法,其特征在于分步连接权利要求I中接头A和权利要求2中接头B,构建DNA文库。
4.根据权利要求3所述的方法,其特征在于,所述的DNA来源,是植物、动物或者微生物。
5.根据权利要求3所述的方法,其特征在于,测序平台为illuminaHiseq2000测序平台。
全文摘要
本发明基于illumina公司的Hiseq测序平台提供的接头序列和测序流程,设计了内切酶特异性的粘性末端序列接头,成功的建立了DNA标签文库的建库方法,并应用于Hiseq2000测序,开发分子标记,从而应用于群体遗传学研究和遗传图谱的绘制。
文档编号C12Q1/68GK102978205SQ201210464920
公开日2013年3月20日 申请日期2012年11月19日 优先权日2012年11月19日
发明者蒋智, 刘少卿, 彭献军, 吴静 申请人:北京诺禾致源生物信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1