多基因多区域的特异性捕获方法

文档序号:409555阅读:264来源:国知局
专利名称:多基因多区域的特异性捕获方法
技术领域
本发明属于基因测序技术领域,具体涉及一种多基因多区域的特异性捕获方法。
背景技术
当今世界,核酸测序技术取得了突飞猛进的进展,人类基因组计划及许多动物、植物及微生物的基因组序列相继测序完成。测序技术由原来的第一代Sanger测序法,逐步发展出高通量测序技术。高通量测序技术可以同时对上百万甚至上千万个相同或不同DNA短片段^0-500bp)同时进行测序,并产生庞大的序列数据。然而,这些庞大数据的处理对科学家提出了严峻的挑战。对一个基因组测序来说,可能测序完成只需要两三天的时间,但是要把数据处理完需要一周或者更多的时间。这就大大延迟了基因组测序的速度。新一代测序技术催生了丰富多彩的基因组图谱。然而,对于许多研究而言,尤其是那些需要对上亿人批量测序来确认DNA序列与各种疾病相关的遗传变异时,一个完整的人类基因组重测序依然价格昂贵。何况与疾病相关的变异大都发生于蛋白编码区,这仅占人类基因组的2%。因此,以成本效益至上的目标区域测序方法是今后发展的重点之一,依托这些方法研究高信息量区域可大大降低成本。有些研究不必要知道全部的基因组序列,而是对特定的基因组区域进行研究,比如外显子、SNP区域或与疾病相关的区域,因此极大的提高了数据处理的速度。而要达到特定区域的序列研究,就要首先解决如何对它们的高效捕获。
目前基因捕获有三种方法基于芯片的杂交捕获方法;基于in-solution的杂交捕获方法;用分子倒置探针来分离特异基因组区域的方法。基于芯片的杂交捕获方法,基因组DNA首先被打断,然后与定制的序列捕获芯片杂交,没有杂交上的被洗掉。富集的目标群体随后被洗脱并扩增,然后用高通量测序仪测序。这种方法的几大优势定向捕获基因组目标区(目前一块芯片最长可捕获5MB的指定基因组区域;数据可靠;只要你选择出想要捕获的区域就会设计并合成一块定制的序列捕获芯片,使用方便省力。但是基因组DNA的需要量比较多,对于稀有的珍贵基因组不适用,其特异性不及in-solution方法。基于in-solution的杂交捕获方法的流程为基因组DNA打断——精选大小合适的文库与RNA诱饵共孵育24小时形成RNA-DNA杂合体——洗脱磁珠——PCR扩增——测序。I)极佳的特异性高达90%的读出序列来源于RNA"诱饵"捕获,其中和靶向序列完全重合的超过50% ;2)优秀的均一性对基因组大片段序列,至少和捕获序列重合一半以上的RNA"诱饵"超过80%,即使对小片段的外显子序列,这一数字也超过60% ;3)卓越的重现性2组技术重复试验间的差异率不到10-5 ;4)可以精确地检测SNP。综上所述,实验结果完美验证了基于液相序列捕获的高通量平行靶向测序技术的特异性,准确性,重现性和广泛的应用前景。但是因为所用的诱饵是RNA,所以需要很高的操作要求,试剂或者器具都需要用无RNA酶的。而且操作步骤比较
夢办
系 7Τ< ο
分子倒置探针分离特异基因组区域的方法,这种溶液中(in-solution)捕获方法能够对大组分的基因组位点进行定向重测序。这种通量可以达到1Mb,甚至更高。应用高度多重复合的单链80聚体库来环化同时环化目标基因组区域。这种捕获技术可以用一组通用引物扩增所有的靶标。如图I所示,一个捕获寡核苷酸包含两个单链捕获臂序列,这两个臂序列可以与目标序列的两端侧翼序列分别互补,从而使靶标序列环化。连接两个臂序列的寡聚核苷酸序列是一个固定序列。每一个环化反应中包含有一个40bp的序列,它可以和捕获核苷酸序列互补。这个序列提供下游扩增用的通用引物序列。这种技术捕获区域能达到800bp,同时满足灵敏性和高度特异性的要求。尿喃唳糖基化酶(uracil glycosylase)是存在于多种生物体内的一种重要的DNA修复酶,对于DNA复制中错配的尿嘧啶及因胞嘧啶脱氨基造成的尿嘧啶有移除作用,在保持基因组完整性方面发挥着至关重要的作用。 不足之处是需要一个40bp载体寡核苷酸,这个寡核苷酸的3’端必须精确的与基因组片段的3’端对接。核酸酶活性能够将多余的5’端的序列切除。这些分子机制使捕获臂的设计复杂化并使这个方法用标准引物设计软件很棘手。要将这个技术推广到研究者,使其设计能够覆盖任何给定人类基因组靶序列的捕获臂是很大的挑战。

发明内容
本发明目的在于提供一种进行多基因多区域捕获特异核酸靶标的试剂盒,解决了现有技术中基因捕获技术中的种种不足之处。为了解决现有技术中的这些问题,本发明提供的技术方案是一种进行多基因多区域捕获特异核酸靶标的试剂盒,其特征在于所述试剂盒包括第一引物、捕获组分和第二引物所述第一引物用于进行待捕获的目的基因区域序列第一次单向PCR扩增,所述第一引物一端与标记有生物素的第一接头DNA片段相连,并与待捕获的目的基因区域序列互补结合的寡核苷酸单链序列;所述捕获组分包括亲和素和与亲和素结合的固相载体;所述亲和素用于捕获第一次单向PCR扩增后的目的基因区域序列,并与所述第一次单向PCR扩增后的目的基因区域序列上的生物素相结合;所述第二引物用于对亲和素结合后的目的基因区域序列进行第二次单向PCR扩增,所述第二引物一端与第二接头DNA片段相连,并与所述目的基因区域序列互补结合,且与第一引物进行PCR扩增的方向相反。优选的,所述固相载体为微球。优选的,所述固相载体为磁性微球。优选的,所述亲和素选自卵白亲合素、链亲合素、卵黄亲合素及类亲合素。优选的,所述第一接头DNA片段具有SEQ No 1的连续核苷酸序列,且5’端通过生物素进行标记;第二接头DNA片段具有SEQ No 2的连续核苷酸序列。优选的,所述第一引物由第一接头DNA片段、ACTG碱基组和用于特异性扩增目的基因靶向序列,含有目的基因的至少15个连续的核苷酸序列的特异性引物连接而成;所述第二引物由第二接头DNA片段、ACTG碱基组和用于特异性扩增目的基因靶向序列,含有目的基因的至少15个连续的核苷酸序列的特异性引物连接而成。优选的,所述第一引物进行第一次PCR扩增的第一 PCR反应体系包括PCR缓冲液、dNTPs、MgCl2、TaqDNA聚合酶、待捕获的目的基因区域序列作为模板DNA,所述第一 PCR反应体系终浓度组成为PCR缓冲液终浓度I IOX ;dNTPsO. 01 I. 5mM ;引物序列终浓度为O. 01 2 μ M ; 模板DNAO. 01 IOng/ μ L ;TaqDNA 聚合酶O. 01 I. OU/ μ L ;MgCl2终浓度为 0.5 5mM。优选的,所述第二引物进行第二次PCR扩增的第二 PCR反应体系包括PCR缓冲液、dNTPs、MgCl2、TaqDNA聚合酶、待捕获的目的基因区域序列作为模板DNA,所述第二 PCR反应体系终浓度组成为PCR缓冲液终浓度I IOX ;dNTPsO. 01 I. 5mM ;引物序列终浓度为O. 01 2 μ M ;模板DNAO. 01 IOng/ μ L ;TaqDNA 聚合酶O. 01 I. OU/ μ L ;MgCl2终浓度为 O. 5 5mM。本发明的另一目的在于提供一种进行多基因多区域捕获特异核酸靶标的方法,其特征在于所述方法包括以下步骤(I)将待捕获的基因组随机打断后采用第一引物进行第一次PCR扩增;所述第一引物一端与标记有生物素的第一接头DNA片段相连,并与待捕获的目的基因区域序列互补结合的寡核苷酸单链序列;(2)使用捕获组分对进行第一次单向PCR扩增后的目的基因区域序列进行捕获;所述捕获组分包括亲和素和与亲和素结合的固相载体;所述亲和素与所述第一次单向PCR扩增后的目的基因区域序列上的生物素相结合;(3)使用第二引物对亲和素结合后的目的基因区域序列进行第二次单向PCR扩增;所述第二引物一端与第二接头DNA片段相连,并与所述目的基因区域序列互补结合,且与第一引物进行PCR扩增的方向相反;(4)将第二次单向PCR扩增后的目的基因区域序列除去亲和素生物素复合物,获得两端带有相同或不同DNA接头的单链DNA文库。本发明的又一目的在于提供一种进行多基因多区域捕获特异核酸靶标的试剂盒在基因测序方面的应用。如本文所用,术语“亲和素”包括卵白亲合素(Avidin,A)、链霉亲合素(Streptavidin, SA)、卵黄亲合素及类亲合素等。该术语还包括野生型、突变型以及衍生型的亲和素。如本文所用,术语“生物素”(biontin,B)广泛分布于动、植物组织中,常从含量较高的卵黄和肝组织中提取,分子 量244. 31Kd。生物素分子有两个环状结构,其中I环为咪唑酮环,是与亲和素结合的主要部位;11环为噻吩环,C2上有一戊酸侧链,其末端羧基是结合抗体和其他生物大分子的惟一结构,经化学修饰后,生物素可成为带有多种活性基团的衍生物——活化生物素。如本文所用,术语“固相载体” 一般选择可结合如亲和素或链霉亲和素等大分子蛋白质;生物大分子固相化后仍应保持活性,而且为有利于反应充分进行,最好其活性基团朝向反应溶液。接头DNA片段的序列如下接头A :5’ -/BioTEG/GAGGATCCAGAATTCTCGAGTT-3,;接头B :5,-CTCGAGAATTCTGGATCCTC-3,;捕获引物包括第一引物和第二引物,均由接头DNA片段+ACTG碱基组+与待扩增的基因组DNA片段配合的特异性引物(specific primer)组成。即第一引物的结构为接头A+ACTG+specific primer ;第二引物的结构为接头 B+ACTG+specific primer ;两引物中特异性引物根据所要捕获的不同基因而不同。将捕获引物设计成三部分接头部分、中间部分和末尾部分;其各部分作用不同。其中中间部分为ACTG碱基组,中间部分加上ACTG,其目的是为了在测序开始时用这四个已知的碱基进行纠正;ACTG 4个碱基顺序任意排列。特异性引物要求设计成相同或相近的退火温度,因此长度不固定。特异性引物根据所要捕获的不同基因的差异进行设计。接头和特异性引物依据普通引物设计原则(I)长度15_30bp,—般不大于38,否则PCR的最适延伸温度会超过Taq酶的最佳作用温度(74度),从而降低产物的特异性。(2)G十C含量应在45% — 55%之间,PCR扩增中的复性温度一般是较低Tm值引物的Tm值减去5-10度。(3)碱基分布的随机性应避免连续出现4个以上的单一碱基。尤其是不应在其3’端出现超过3个的连续G或C,否则会使引物在G十C富集序列区错误引发。(4)引物自身不能含有自身互补序列,否则会形成发夹样二级结构。(5)引物之间两个引物之间不应有多于4个的互补或同源碱基,不然会形成引物二聚体,尤应避免3’端的互补重叠。(6)特异性与非特异扩增序列的同源性应小于70%,或少于连续8个的互补碱基。(7)引物的3’端引物的3’端很大程度上影响Taq酶的延伸效应,3’端不应发生错配。引物的3’端碱基最好选用A、G、C,而尽可能地避免选用T,尤应避免连续出现2个以上的T。(8)避开引物的二级结构区某些引物无效的原因是引物重复区二级结构的影响。本发明提出多基因多区域两步单向扩增捕获特异核酸靶标方法,这种方法既集合了 in-solution的高特异性的优点,由具有操作简单、省时省力的优点,又具有用样品量少的优点。优选的多基因多区域两步单向扩增捕获特异核酸靶标方法可以采用如下的步骤进行(I)首先将基因组用超声破碎仪进行随机打断;(2)将单引物加入破碎的基因组中进行单向PCR扩增。单引物由DNA特异引物在5’端与接有生物素的接头DNA相连;(3)用链霉亲和素磁珠将携带生物素(Bio)的单链目的片段DNA进行捕获;(4)用特异性引物对捕获的DNA进行第二次单向PCR扩增;(5)除去带有生物素的单链,获得两端带有相同或不同DNA接头的单链DNA文库(文库DNA相同序列分子也可以是不同系列的分子);
(6)文库DNA用于测序或其它任何应用。相对于现有技术中的方案,本发明的优点是(I)本发明方法的特异性与基于in-solution捕获方法的特异性更好。(2)引物设计容易,整个操作更简单。(3)均一性和覆盖率更高。


下面结合附图及实施例对本发明作进一步描述图I为现有技术中分子倒置探针分离特异基因组区域方法的流程示意图;图2为本发明进行多基因多区域捕获特异核酸靶标的方法流程示意图;图3为本发明进行多基因多区域捕获特异核酸靶标的方法覆盖度结果;图4为本发明采用的捕获引物的结构示意图;在序列结构组成上,所述捕获引物由接头DNA片段+ACTG碱基组+与待扩增的基因组DNA片段配合的特异性引物(specificprimer)组成。
具体实施例方式以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。实施例一、基因组DNA的提取和纯化I、向 200 μ I 全血中添加 400 μ I Lysis Solution 和 20 μ I Proteinase Ksolution,混勻获得均一悬液。2、在56°C水浴锅中孵育lOmin。3、添加200 μ I无水乙醇并混匀。4、将制备的裂解混合物转移到 Gene JET Genomic DNA Purification Column。6000g 离心 lmin,弃掉废液。将 Gene JET Genomic DNA Purification Column 转移到 2ml
新的收集管。5、加500μ1 Wash buffer 1,8000g离心Imin弃掉废液后将纯化柱放回收集管。6、加 500 μ I Wash buffer II 到 Gene JET Genomic DNA Purification Column,12000g 离心 3min。
7、将空柱子 12000g 离心 lmin。
8、Gene JET Genomic DNA Purification Column 转移到新的 1.5ml 的 EP 管。9、添加 100 μ I 的双蒸水或 Elution buffer 到 Gene JET Genomic DNAPurification Column 的中心,室温孵育 2min,8000g 离心 lmin。10、弃掉纯化柱,纯化的DNA或者立即用于下游实验或者储存在_20°C。二、基因组DNA纯度检测(Nanodrop)I、双击电脑屏幕上的Nanodrop图标,启动软件.2、选择所需的测量模式,屏幕上会弹出初始化仪器的提示.往仪器的加样孔中加入2微升的蒸馏水,合上上盖使形成液柱,然后点击确定以开始初始化,可以听见电磁阀开合的声音.3、五六秒后屏幕上的提示信息消失,表示初始化完成.用擦镜纸将蒸馏水擦干净,加入2-3微升的Buffer,合上上盖并点击Blank.4、Blank完成后,用擦镜纸将Buffer擦干净即可以开始上样,点击Measure开始测量。三、基因组DNA 的片段化(fragmentization)基因组DNA样品从不同的来源获得,从细菌到哺乳动物。当0D260/280的nanodrop检测值在I. 8-2. 0,浓度大约O. 3 μ g/ μ I。将超声破碎仪的功率设置成200W,破碎5秒,停5秒,破碎次数200次。四、引物设计接头A :5’ -/BioTEG/GAGGATCCAGAATTCTCGAGTT-3,;接头B :5,-CTCGAGAATTCTGGATCCTC-3,;所述的特异性引物(specific primer),为用于特异性扩增目的基因祀向序列,含有目的基因的至少15个连续的核苷酸序列;如进行PCR扩增血管性血友病基因的1-5个外显子的特异性引物具有SEQ No 5 14的连续核苷酸序列。
权利要求
1.一种进行多基因多区域捕获特异核酸靶标的试剂盒,其特征在于所述试剂盒包括第一引物、捕获组分和第二引物 所述第一引物用于进行待捕获的目的基因区域序列第一次单向PCR扩增,所述第一引物一端与标记有生物素的第一接头DNA片段相连,并与待捕获的目的基因区域序列互补结合的寡核苷酸单链序列; 所述捕获组分包括亲和素和与亲和素结合的固相载体;所述亲和素用于捕获第一次单向PCR扩增后的目的基因区域序列,并与所述第一次单向PCR扩增后的目的基因区域序列上的生物素相结合; 所述第二引物用于对亲和素结合后的目的基因区域序列进行第二次单向PCR扩增,所述第二引物一端与第二接头DNA片段相连,并与所述目的基因区域序列互补结合,且与第一弓I物进行PCR扩增的方向相反。
2.根据权利要求I所述的试剂盒,其特征在于所述固相载体为微球。
3.根据权利要求I所述的试剂盒,其特征在于所述固相载体为磁性微球。
4.根据权利要求I所述的试剂盒,其特征在于所述亲和素选自卵白亲合素、链亲合素、卵黄亲合素及类亲合素。
5.根据权利要求I所述的试剂盒,其特征在于所述第一接头DNA片段具有SEQNo 1的连续核苷酸序列,且5’端通过生物素进行标记;第二接头DNA片段具有SEQ No 2的连续核苷酸序列。
6.根据权利要求I所述的试剂盒,其特征在于所述第一引物由第一接头DNA片段、ACTG碱基组和用于特异性扩增目的基因靶向序列,含有目的基因的至少15个连续的核苷酸序列的特异性引物连接而成;所述第二引物由第二接头DNA片段、ACTG碱基组和用于特异性扩增目的基因靶向序列,含有目的基因的至少15个连续的核苷酸序列的特异性引物连接而成。
7.根据权利要求I所述的试剂盒,其特征在于所述第一引物进行第一次PCR扩增的第一PCR反应体系包括PCR缓冲液、dNTPs、MgCl2, TaqDNA聚合酶、待捕获的目的基因区域序列作为模板DNA,所述第一 PCR反应体系终浓度组成为 PCR缓冲液终浓度I 10 X ; dNTPs O. 01 I. 5mM ; 弓I物序列终浓度为O. OI 2 μ M ; 模板 DNA O. 01 lOng/μ L ;TaqDNA 聚合酶 O. 01 I. OU/ μ L ; MgCl2 终浓度为O. 5 5mM。
8.根据权利要求I所述的试剂盒,其特征在于所述第二引物进行第二次PCR扩增的第二PCR反应体系包括PCR缓冲液、dNTPs、MgCl2, TaqDNA聚合酶、待捕获的目的基因区域序列作为模板DNA,所述、第二 PCR反应体系终浓度组成为、 PCR缓冲液终浓度I 10 X ; dNTPs O. 01 I. 5mM ; 弓I物序列终浓度为O. OI 2 μ M ; 模板 DNA O. 01 lOng/μ L ;TaqDNA 聚合酶 O. Ol I. OU/ μ L ; MgCl2 终浓度为O. 5 5mM。
9.一种进行多基因多区域捕获特异核酸靶标的方法,其特征在于所述方法包括以下步骤 (1)将待捕获的基因组随机打断后采用第一引物进行第一次PCR扩增;所述第一引物一端与标记有生物素的第一接头DNA片段相连,并与待捕获的目的基因区域序列互补结合的寡核苷酸单链序列; (2)使用捕获组分对进行第一次单向PCR扩增后的目的基因区域序列进行捕获;所述捕获组分包括亲和素和与亲和素结合的固相载体;所述亲和素与所述第一次单向PCR扩增后的目的基因区域序列上的生物素相结合; (3)使用第二引物对亲和素结合后的目的基因区域序列进行第二次单向PCR扩增;所述第二引物一端与第二接头DNA片段相连,并与所述目的基因区域序列互补结合,且与第一弓I物进行PCR扩增的方向相反; (4)将第二次单向PCR扩增后的目的基因区域序列除去亲和素生物素复合物,获得两端带有相同或不同DNA接头的单链DNA文库。
10.一种进行多基因多区域捕获特异核酸靶标的试剂盒在基因测序方面的应用。
全文摘要
本发明公开了一种进行多基因多区域捕获特异核酸靶标的试剂盒,其特征在于所述试剂盒包括第一引物、捕获组分和第二引物;所述第一引物用于进行待捕获的目的基因区域序列第一次单向PCR扩增,所述第一引物一端与标记有生物素的第一接头DNA片段相连,并与待捕获的目的基因区域序列互补结合的寡核苷酸单链序列;所述捕获组分包括亲和素和与亲和素结合的固相载体;所述亲和素用于捕获第一次单向PCR扩增后的目的基因区域序列,并与所述第一次单向PCR扩增后的目的基因区域序列上的生物素相结合;所述第二引物用于对亲和素结合后的目的基因区域序列进行第二次单向PCR扩增,所述第二引物一端与第二接头DNA片段相连,并与所述目的基因区域序列互补结合,且与第一引物进行PCR扩增的方向相反。该试剂盒特异性好,操作更简单,均一性和覆盖率更高。
文档编号C12N15/10GK102634507SQ20121010331
公开日2012年8月15日 申请日期2012年4月10日 优先权日2012年4月10日
发明者何越, 杨楠, 臧伯玮, 艾洪新 申请人:凯晶生物科技(苏州)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1