一种针对一个或多个目标基因组区域进行边扩增边连接的方法

文档序号:435621阅读:232来源:国知局
专利名称:一种针对一个或多个目标基因组区域进行边扩增边连接的方法
技术领域
本发明涉及一种针对一个或多个目标基因组区域进行边扩增边 连接的公用接头设计方法。本发明又涉及一种针对一个或多个目标基 因组区域进行边扩增边连接的方法。本发明所述方法适用于针对任意 长度的目标基因组区域的边扩增边连接工作,所得到的非特异连接的长链DNA可根据研究需要应用于多种DNA分析平台。本发明还涉及一 种针对一个或多个目标基因组区域序列重测序工作、建立随机DNA文 库的方法,所得随机DNA文库可用于通过包括Sanger测序技术、边合 成边测序技术在内的测序方法对所述一个或多个目标基因组区域序列 进行重测序。
背景技术
自1983年Kary Mull is发明聚合酶链式反应(polymerase chain reaction, PCR)以来,历经三十多年,PCR技术已成为生物科学领域 不可或缺的、运用广泛的实验技术。为不同的实验目的,在标准PCR 基础上又衍生出RT-PCR (Reverse Transcriptase PCR,逆转录PCR)、 Inverse PCR (反向PCR), J力PCR (原位PCR) , Long PCR (长 PCR), Real Time PCR (实时PCR), Single Cell PCR (单细胞PCR), Hot Start PCR (热启动PCR), Colony PCR (菌落PCR) , AFLP PCR (Amplified Fragment Length Polymorphism PCR,扩增片断长度 多态性PCR)等多项技术手段。可以说,自PCR技术问世以来,分子生 物学及之后的基于大规模测序反应的基因组学均得到了飞速的发展。本发明应用碱基互补配对的基本原理,通过设计含"公用接头,, 的目标基因组区域的引物,在第一轮多核苷酸扩增反应后,第二轮多 核苷酸扩增反应中,将目标基因组区域在扩增的基础上进行高效地连 接,即"边扩增边连接"。连接工作按随机顺序进行,在本发明的上 下文中这种随机顺序连接的方式称为"非特异连接"。经过边扩增边连接得到由目标基因组区域的DNA片段经"非特异连接"而成的长链 DNA,此长链DNA可根据研究需要应用于多种DNA分析平台。通过本发明提出的"边扩增边连接"方法获得长链DNA,并经过DM 随机打断法打断,可建立用于通过包括Sanger测序技术、边合成边测 序技术在内的测序方法对所述一个或多个目标基因组区域序列进行重 测序工作的随机DNA文库。本发明可运用于一个目标基因组区域的边扩增边连接和随机DM 文库建立工作,也可用于两个及两个以上的多个目标基因组区域边扩 增边连接和随机DM文库建立工作。设计目的的不同,使本发明提出的"边扩增边连接"反应与同样 使用接头设计的串联PCR方法具有本质的分别串联PCR是根据具体 研究的需要,进行特殊的接头设计,将本属基因组不同区域的DNA, 甚至是不同物种基因组的DNA片断进行"特异性"连接,以获得研究所 需要的"功能性DNA片段"。而本发明是为了得到特异扩增的、"非 特异连接"的长链DNA。在本发明中,除在目标基因组区域的引物设计中在正向引物和反 向引物的5,端和3,端分别加上本发明提出的一对反向互补的公用接 头外,两轮多核苷酸扩增反应均无需特殊处理;非特异连接长链DNA 的生成无需"连接酶"作用。本发明获得的长链DNA可突破在保真要求限制下的长PCR (Long PCR)方法目的片段长度的限制,而且可免去使用包含特殊酶物质的试 剂盒及设计更严格引物的麻烦;与使用同连接区域特异配对之接头的 串联PCR (overlap PCR)方法相比,本发明只需设计一对公用接头, 在第二轮多核苷酸扩增反应中利用公用接头将目标基因组区域原始DNA片段按随机顺序连接,又免去了设计多对可用于特异串联的互补 引物的工序,对本行业的技术人员来说本发明所涉及的实验室工作是 简单易行且费用很低的。发明内容本发明基于以下认识在目标基因组区域的每对引物设计中加入 反向互补的同一对"公用接头"(Universal Adaptor),对目标基因 组区域的原始DNA片断进行特异性多核苷酸扩增和非酶法连接,形成 由目标基因组区域DNA片段按随机顺序连接而成的长链DNA混合物。本发明获得的长链DNA可在诸多DNA分析平台上进行应用,对高 通量重测序工作尤其具有重要的意义。在经过诸如超声法、喷雾法、 化学剪切法、酶剪切法等在内的DNA随机打断法打断后,可重新获得 含有目标基因组区域片段的DM片段,这些DNA片段可高效地涵盖整 个目标区域,将其作为重测序工作的随机DNA文库(DNA library),可 有效地进行目标基因组区域的高通量重测序工作。本发明的一个方面,涉及一种用于针对一个或多个目标基因组区 域进行边扩增边连接的公用接头,其为两条以5, —3,方向和以3, —5,方向碱基互补的寡核苷酸序列,其序列结构特征为l)在多核 苷酸扩增反应退火温度下不与目标基因组结合;2)自身不形成发夹等 二级结构;3)胞嘧啶和鸟噤呤的含量占四种碱基数量总和的20%-80%; 且4)序列长度在7-100个碱基。具体的,所述一对公用接头中的一 个加在多核苷酸扩增反应正向引物的5,端,与之互补的另一个加在 多核苷酸扩增反应反向引物的5'端。本发明中,为满足加在引物两端而不影响对目标基因组区域进行 扩增,同时为降低成本的要求,所述公用接头的长度应当尽可能选择 较短的寡核苷酸序列,其长度适当地为8-50个碱基,优选为9- 4 0个碱基,更优选为10-3 O个碱基,更优选为11-2 5个碱基,更 优选为12-2 O个碱基,更优选为13-18个碱基,甚至更优选为17个碱基。本发明又一方面,涉及一种针对一个目标基因组区域进行边扩增 边连接的方法,包括步骤1) 针对 一 个目标基因组区域,设计包含本发明所述公用接头的用 于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用 接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩 增反应,扩增目标基因组区域,得到在所述目标基因组区域5,端和3, 端加入本发明所述公用接头的可连接性DNA片段;3) 步骤2)获得的可连接性DM片段,作为第二轮多核苷酸扩增 反应的模板进行边扩增边连接反应;得到由步骤2 )所得可连接性DNA 片段连接而成的长链DNA。在本发明中,所述目标基因组序列区域可以为任意长度的目标基 因组区域,包括但不限于长度在70 - 10000个碱基的序列,例如,长 度在100 - 3000个碱基的序列,长度在300 - 2000个碱基的序列,长 度在700 - 1000个碱基的序列。在本发明的又一方面,涉及一种针对两个及两个以上的多个目标 基因组区域进行边扩增边连接的方法,包括步骤1) 针对多个目标基因组区域的每个区域,分别设计包含本发明所 述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中每对正 向和反向引物所含公用接头彼此反向互补;2) 利用步骤l)中所述正向和反向引物,通过第一轮多核苷酸扩 增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5' 端和3,端加入本发明所述公用接头的不同可连接性DM片段;3) 将步骤2)获得的不同可连接性DNA片段进行等量地混合,作 为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步 骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链 DNA。在本发明上下文中,所述第一轮多核苷酸扩增反应是指常规多核苷酸扩增反应,包括例如在多核苷酸扩增反应仪中首先升高温度,使原始DNA的双链解旋、打开,随即降低温度,使正、反向引物分别与 目标基因组序列的5,和3,端序列配对、结合,并在多核苷酸聚合酶 的作用下,按照碱基互补配对原则,以5, —3,的顺序、添加多核苷 酸扩增反应的反应体系中游离的dNTPs,经过多次的"变性-退火-延 伸"过程,使得所述目标基因组区域原始DNA序列得到高效的扩增。 在本发明的上下文中,第一轮多核苷酸扩增反应所需扩增的目标基因 组区域称为目标基因组区域原始DNA序列,经第一轮多核苷酸扩增后 得到5,端和3,端加入本发明所述公用接头的目标基因组区域,称为 "可连接性DNA片段"。在本发明上下文中,所述第二轮多核苷酸扩增反应是指将在本发 明第一轮多核苷酸扩增反应获得的"可连接性DNA片段",作为第二 轮多核苷酸扩增反应的模板,在DNA双链解旋、打开后,在碱基互补 配对原则的指引下, 一条可连接性DNA片段的单链3,端的公用接头 与另一条可与之互补的可连接性DNA片段的单链3,端的公用接头彼 此配对,作为第二轮多核苷酸扩增反应的引物,在无需另加特殊引物 的条件下,进行可连接性DNA片段的连接和多核苷酸扩增反应。扩增 和连接同时进行,因此称为"边扩增边连接"反应。在第二轮多核苷酸扩增反应中,无需连接酶的处理,原始DNA片段在公用接头的带领下,可在扩增的同时进行随机顺序的连接,形成 "非特异连接的长链DM"。在本发明的上下文中,按随机顺序连接 的方式也称为"非特异连接"。在本发明上下文中,在第二轮多核苷酸扩增反应中依据第一轮所 得DNA产量大小进行等量混合是指,根据第一轮多核苷酸扩增反应产 物的等摩尔量混合。具体的,可用例如Hoechst染料H33258或 Picogreen对第一轮多核苷酸扩增反应所得产物进行准确定量。也可 通过对多核苷酸扩增产物进行凝胶电泳,与已知量的DNA Marker比对 进行粗略定量。在本发明上下文中,所述针对多个目标基因组区域进行边扩增边合成的方法,适于两个或两个以上的任意多个目标基因组区域,包括2以及大于2的任意整数。例如,所述方法可以针对2 - 10000000个 目标基因组区域进行边扩增边合成,例如2 - 1000000个目标基因组区 城,2-IOOOOO个目标基因组区域,2 - 1000个目标基因组区域,2-IOO个目标基因组区域。本发明又一方面,涉及一种建立针对一个目标基因组区域序列重 测序随机DNA文库的方法,包括步骤1 )针对一个目标基因组区域,设计包含本发明所述公用接头的用 于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用 接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩 增反应,扩增目标基因组区域,得到在所述目标基因组区域5,端和3, 端加入本发明所述公用接头的可连接性DNA片段;3) 步骤2)获得的可连接性DNA片段作为第二轮多核苷酸扩增反 应的模板进行边扩增边连接反应;得到由步骤2)所得可连接性DNA 片段连接而成的长链DM;4) 将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机 DM文库。本发明的再一方面,涉及一种建立针对两个及两个以上的多个目 标基因组区域重测序随机DM文库的方法,包括步骤1) 针对多个目标基因组区域的每个区域,分别设计包含本发明所 述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中每对正 向和反向引物所含公用接头彼此反向互补;2) 利用步骤l)中所述正向和反向引物,通过第一轮多核苷酸扩 增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5' 端和3,端加入公用接头的不同可连接性DM片段;3) 将步骤2)获得的不同可连接性DNA片段进行等量地混合,作 为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步 骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链DNA;4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机 DNA文库。在本发明上下文中,所述建立针对多个目标基因组区域重测序随 机DM文库的方法,适于两个或两个以上的任意多个目标基因组区域, 包括2以及大于2的任意整数。例如,所述方法可以针对2 - 10000000 个目标基因组区域进行边扩增边合成,例如2 - 1000000个目标基因组 区域,2 - 100000个目标基因组区域,2 - 1000个目标基因组区域,2 -100个目标基因组区域。在本发明上下文中,打断所得长链DNA序列所述DNA随机打断法 包括超声法、喷雾法、化学剪切法、酶剪切法等在内的本领域周知的 打断DM序列的方法。


图1描述了利用公用接头进行目标基因组区域边扩增边连接反应 的流程。其中图1A示例了引物设计过程,具体的,(l)显示为设计好的引物, 包含黑色的公用接头(Universal Adaptor)和花色的目标基因组区域 原始引物两部分;(2)显示所设计的引物,在第一轮多核普酸扩增反应 的退火过程中,可与目标基因组区域进行配对,引导目标基因组区域 原始DNA序列的特异性扩增。图1B示例了第一轮多核苷酸扩增反应将设计好的含有公用接头 的引物使特定的目标基因组区域扩增,得到目标基因组区域原始DNA 序列5,端和3,端加上公用接头的可连接性DNA片段(4)。其中,一 个多核苷酸扩增反应只扩增一个目标基因组区域。若目标基因组区域 数目大于1,则每个目标基因组区域的多核苷酸扩增反应需独立进行。图1C示例了笫二轮多核苷酸扩增和连接反应(边扩增边连接反 应)。具体分两种情况1) 针对一个目标基因组区域,以第一轮多核苷酸扩增产物为模板、公用接头为引物进行第二轮多核苷酸扩增反应(未画出);2) 针对两个及两个以上的多个目标基因组区域,将第一轮多核苷酸扩增得到的可连接性DNA片段进行等量混合,将混合物作为第二轮 多核苷酸扩增反应模板、公用接头为引物进行第二轮多核苷酸扩增反 应,如(2) - (3) -.(4)所示;其中,反向互补的公用接头在多核苷酸扩增反应退火阶段彼此配 对,作为第二轮多核苷酸扩增反应的引物,使可连接性DNA片段解旋 后的单链在多核苷酸聚合酶的作用下延伸、形成双链DNA,获得非特 异连接的长链DNA。扩增和连接反应同时进行,称为"边扩增边连接" 反应。获得的长链DNA可运用类似全基因组打碎后测序的策略,通过(5 ) 用DNA随机打断法将长链DNA打断、建立随机DNA文库,再用包含 Sanger测序4支术、边合成边测序4支术在内的测序方法进4亍测序。图2为实施例1中经过第一轮多核苷酸扩增反应,获得的"可连 接性DNA片段"的凝胶电泳图,其中9个可连接性DNA片段为9个目 标基因组区域C57^W-10 、 C5WA-18 、 "U-1 、 "U-5 、 "D"9 、 2 、iO y^-l、 iX^、和1原始序列的5,端和3'端连接上公用接头 (各20个碱基,共计40个碱基)后的产物,用C577A-10' ( 483bp)、 C57^7A-18, ( 375bp)、 7^7-1, (524bp) 、 /J"-5 , (595bp) 、 "J2"9 , (556bp)、 /^L -12 , (490bp)、 AX45H , (531bp) 、 /X45M , (404bp) 和蕭^y-l' (419bp)表示。其中胶图上;W^y-l,的大小(约500bp) 与理论值(419bp)不符,重测序结果证明iVA^-l存在非特异扩增。图3为实施例1中笫二轮多核苷酸扩增和连接反应,即边扩增边 连接反应获得的"非特异连接的长链DM"的凝胶电泳图;图4为将边扩增边连接反应得到的非特异连接的长链DNA产物用 超声法打断、建库、用Sanger测序技术测序,所得到的含有杂合位点 的片段测序结果。其中在用超声法将非特异连接的长链DM产物打断 后,建立pUC 118 DNA文库,并在ABI公司的3730x1测序仪上用Sanger测序法进行重测序工作。图中所示为(^尸M-10重测序后得到的杂合位点显示。图5为实施例2中所得非特异连接的长链DM之凝胶电泳图。 图6为实施例3中所得凝胶电泳图,其中选择人类基因组中与癌 症相关的候选基因^ ^2的第IO个外显子的一部分(在本实施例中命 名为10j)作为一个目标基因组区域,利用公用接头(各l 7 个碱基,共3 4个碱基),经过两轮多核苷酸扩增反应,将一个目标 基因组区域扩增并连接形成长链DNA。图7为实施例4中所得酶切反应电泳图。其中选择人类基因组中 与癌症相关的候选基因A (^2的第6个外显子(序列长度446,在5, 至3,方向的第167个碱基处含一个化2zw71酶切位点)作为一个目标 基因组区域,利用公用接头(各17个碱基,共34个碱基),经过两 轮多核苷酸扩增反应,将一个目标基因组区域扩增并连接形成的长链 DM,随后将第一轮多核苷酸扩增反应产物和经两轮多核苷酸反应扩 增、连接得到的长链DNA用异丙醇沉淀法纯化,并在相同条件下用As/z^ I酶切。实施例实施例1实施例l选用人类基因组中癌症相关的候选基因CSFM基因的第 10、 18个外显子、X4A7基因的第1、 5、 9、 12外显子、/WS基因的 第1、 4外显子和iVWS基因的笫l个外显子作为目标基因组区域,通 过两轮多核苷酸反应扩增、连接,并通过Sanger测序技术测序验证本 方法的有效性。具体过程如下1.引物设计选择人类基因组中与癌症相关的候选基因C57^A基因的第10、 18个外显子、X4U基因的第1、 5、 9、 12外显子、AX^基因的第1、 4 外显子和^A^基因的第1个外显子作为目标基因组区域原始DNA片 段,用Primer3软件设计9对引物,在9对引物中为正向引物加上CGC GGATCC GCGGCCGC TTC序列,在反向引物加上GAA GCGGCCGC GGATCC GCG 序列(均增加在引物序列的5,端),这两段寡核苷酸序列反向互补, 为本实施例的公用接头,其中GGATCC为HI酶切位点,GCGGCCGC 为^ 纟I酶切位点。设计好的引物为(下划线部分即为公用接头序列) CW^ -IO(序列长度443): 正向引物CGCGGATCCGCGGCCGCTTCGAGCACCCACTGTGTTCCAG 反向引物GAAGCGGCCGCGGATCCGCGTGATTAGCACCTGTCTCTCGC (757^ -18 (序列长度335 ): 正向引物CGCGGATCCGCGGCCGCTTCTCCAACTACATTGTCAAGGGC 反向引物GAAGCGGCCGCGGATCCGCGCATTCCTGCACTCTCACCAAC "D-l (序列长度484 ):正向引物CGCGGATCCGCGGCCGCTTCTTCTGGGCTCAAGCTATCTGC 反向引物GAAGCGGCCGCGGATCCGCGAACACACACGCCAGCCATAC(序列长度555 ): 正向引物CGCGGATCCGCGGCCGCTTCCACTTGGCCACTGTGTTGTAA 反向引物GAAGCGGCCGCGGATCCGCGAATGGGAGAAGTGCAATACCA(序列长度516): 正向引物CGCGGATCCGCGGCCGCTTCGGCACTACATCGGATTCATGG 反向引物GAAGCGGCCGCGGATCCGCGGAACTTCAAGTCACTTCTAGACCACC 12 (序列长度450 ): 正向引物CGCGGATCCGCGGCCGCTTCGCCTGTTTGACTGGCATTATTC 反向引物GAAGCGGCCGCGGATCCGCGCTGACACCTAGCTGTGATCCTG iTA^-l (序列长度491):正向引物CGCGGATCCGCGGCCGCTTCTCTTAAGCGTCGATGGAGGAG 反向引物GAAGCGGCCGCGGATCCGCGTTGAAACCCAAGGTACATTTCAGi X^-4 (序列长度:364 ):正向引物CGCGGATCCGCGGCCGCTTCTCAGTTGCCTGAAGAGAAACATAA 反向引物GAAGCGGCCGCGGATCCGCGTAACAGTCTGCATGGAGCAGGM^9-l (序列长度379 ):正向引物CGCGGATCCGCGGCCGCTTCCCAAATGGAAGGTCACACTAGG 反向引物GAAGCGGCCGCGGATCCGCGGAACTCAACACTGAGTTTGCAATAG2. 第一轮多核苷酸扩增反应九个目标基因组区域原始DNA片断的扩增反应独立进行。 多核苷酸扩增体系(10ja 1 ):腿(5ng/m 1): 1 m 1,引物(10jiM):正反向引物各0. 4 m 1 , Taq DNA聚合酶(5U/ jn 1 ): 1 jli 1, 10 x buffer:5jiil, dNTPs(2.5mM): 0. 8jnl, ddH20: 1.4pl。多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上反应)94度/lG分钟94度/30秒-58度/30秒-72度/1分钟,40个循环 72度/5分钟。第一轮多核苷酸扩增反应结束后,获得在两端连上公用接头的可 用于"边扩增边连接"反应的CS尸^ -10, C5757W-18, /^7-1, ""-5, /^7-9, X4^ -12, ^ ^y-l, iX4S一和A^ASH共九种可连接性DNA片 段,用dlO' 、 C5^-18' 、 u-r 、 U-5' 、 、 /JU-12' 、 AX^-1' 、 MA^-4'和厕^SK'表示。根据扩增产量, 九种产物以等DNA量的方式进行混合,作为第二轮多核苷酸扩增和连接反应的模板。实验胶图见图2。3. 第二轮多核苷酸扩增和连接反应(边扩增边连接反应) 多核苷酸扩增体系(20m1):模板8jul, Taq dna聚合酶(5U/pi): 2|jl, 10xbuffer: 2jnl, dNTPs (2. 5mM): 1.6pl, ddH20:6. 4jn 1。其中模板取自笫一轮多核苷酸扩增反应所得产物的等量混合 物。多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反 应)94度/2分钟94度/15秒-60度/30秒-68度/8分钟,10个循环 94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒), 共15个循环72度/lQ分钟。第二轮多核苷酸扩增和连接反应结束后,获得"非特异连接的长 链腿,,。本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。 获得的非特异连接的长链DNA的电泳检测胶图见图3。4.建立载体文库、使用Sanger测序技术测序运用超声法打断已获得的非特异连接的长链DM。取长度在1. 5~ 2kb的片段建立pUC 118 DNA文库,并在ABI公司的3730x1测序仪上 用Sanger测序技术测序。片段测序的结果与原始DNA片段第一轮多核 苷酸扩增后的产物测序结果进行比对,以确定"打断后DNA片段"的 序列位置,并验证测序质量。统计结果显示打断后DNA片段中含C57^7-l 0片段17条,C57^) -l8 片段21条,/^7-l片段12条,"D-5片段55条,/JU-9片段21 条,/^7-12片段40条,AX45K片段19条,M/^-4片段45条,MM-1 片段36条,共获有效读长7274bp,占总测序量的63. 89%。在余下的 测序读长中,非特异性扩增产物达20. 37%,可通过提高原始DNA片段 的引物质量,减少非特异性扩增,提高测序效率。对获得有效读长的DNA片段的统计表明,已获得的DNA片段可完 全覆盖本实施例中的九个目标基因组区域,并可有效检测出本实施例 中九个目标基因组区域原始DNA片段中所含有的全部杂合位点。图4显示了其中一个来自"^7-10序列的杂合位点。 实施例2:本实施例选用人类基因组中癌症相关的候选基因朋CW和朋"2 基因的70个外显子作为目标基因组区域,通过两轮多核普酸反应扩 增、连接。具体过程如下:1.引物设计选择人类基因组中与癌症相关的候选基因朋"7和朋基因的 70个外显子作为70个目标基因组区域,用Primer3软件设计70对引 物,在每对引物中的一个加上17个碱基长度的GTAAAACGACGGCCAGT 序列,另 一个加上17个碱基长度的ACTGGCCGTCGTTTTAC序列(均增加 在引物序列的5,端),这两段寡核苷酸序列反向互补,为本实验的 公用接头。以^ a7基因的第1、第IO个外显子,和5^^2基因第5、第24 个外显子为例,设计好的引物为(下划线部分即为公用接头序列)MCW-1(序列长度530):正向引物GTAAAACGACGGCCAGTATTGCGCCATCACACTCTAGC 反向引物ACTGGCCGTCGTTTTACTTTGTGCTCATGGCAGATTTC;朋CW-18(序列长度548):正向引物GTAAAACGACGGCCAGTGGGTTTCTCTTGGTTTCTTTGA 反向引物ACTGGCCGTCGTTTTACGTTGCCAGAATAAATGAAAATGGT朋tX -5(序列长度451):正向引物GTAAAACGACGGCCAGTCAATGTACACATGTAACACCACAAA 反向引物ACTGGCCGTCGTTTTACCCAAGACATATCAGGATCCACCT朋0^-24(序列长度452):正向引物ACTGGCCGTCGTTTTACTCAGCTATTTTGATTTGCTTTTATT 反向引物GTAAAACGACGGCCAGTAGCTATTTCCTTGATACTGGACTG2. 笫一轮多核苷酸扩增反应多核苷酸扩增体系UOpl) : DNA(5ng/iu 1): 1 jal,引物(5ju M):正反向引物各0. 4 p 1 , Taq DM聚合酶(5U/ p 1 ): 1 /a 1 , 10 x buffer: ljjl, dNTPs (2.5mM) : 0. 8yl, ddH20: 5.4/j1。多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上 反应)94度/5分钟94度/30秒-62度/35秒-72度/35秒,40个循环 72度/10分钟。第 一轮多核苷酸扩增反应结束后,获得在7 0个目标基因组区域原 始序列的5,端和3,端连上公用接头的可用于"边扩增边连接"反应 的70种产物。根据扩增产量,70种产物以等DNA量的方式进行混合, 作为第二轮多核苷酸扩增和连接反应的模板。3. 第二轮多核苷酸扩增和连接反应(边扩增边连接反应) 多核苷酸扩增体系(20ja 1):模板6jal, Taq DNA聚合酶(5U/Ml) : 2jal, 10 x buffer: 2jli1,證Ps ( 2.5mM) : 1.6jul, ddH20: 8.4ju 1。其中模板取自第一轮多核苷酸扩增反应所得产物的等量混合 物。多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反 应)94度/2分钟94度/15秒-60度/30秒-68度/8分钟,10个循环 94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒), 共15个循环72度/lG分钟。第二轮多核苷酸扩增和连接反应结束后,获得"非特异连接的长 链DNA"。本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DNA的电泳检测胶图见图5。4.建立随机DNA文库、使用边合成边测序测序技术进行测序 根据Illumina Genome Ana Iyer测序仪工作条件要求,运用喷雾 法打断已获得的非特异连接的长链DNA,取长度在100-200bp的片段 建立随机DNA文库,在Illumina Genome Ana Iyer测序仪上运用边 合成边测序技术进行测序。片段测序的结果与目标区域的碱基序列进 行比对,以确定"打断后DNA片段"的序列位置,并验证测序质量。统计结果显示70个目标基因组区域全部比对成功,覆盖率均达 100%,平均每个碱基覆盖的次数达2000次。对杂合位点的分析显示使 用本发明提出的方法合成的目标基因组区域非特异连接的长链DNA、 结合边合成边测序技术进行测序,可有效检测出所有的杂合位点。与 70个目标基因组区域的PCR产物用Sanger法重测序结果比较,无假 阳性和假阴性。实施例3:本实施例选用人类基因组中癌症相关的候选基因A W2的第10 个外显子的一部分(在本实施例中命名为A "2-10j)作为目标基因 组区域,通过两轮多核普酸反应扩增、连接。具体过程如下1.引物设计选择人类基因组中与癌症相关的候选基因A "2的第IO个外显子 的一部分(在本实^例中命名为A (X -10j)作为一个目标基因组区 域,用Primer3软件设计引物,在正向引物中一个加上17个碱基长度 的序列GTAAAACGACGGCCAGT,在反向引物中加上17个碱基长度的 ACTGGCCGTCGTTTTAC序列(均增加在引物序列的5,端),这两段寡核 苷酸序列反向互补,为本实验的公用接头。设计好的引物为(下划线部分即为公用接头序列)朋"2 -10j(序列长度478):正向引物GTAAAACGACGGCCAGTAAAGATGAAACGGACTTGCTATT 反向引物ACTGGCCGTCGTTTTACGTTGTCCCTGGAAGGTCACTA。2. 第一轮多核苷酸扩增反应多核苷酸扩增体系(IOjjI) : DNA(5ng/ju 1): 1 m 1,引物(5 p M) 正反向引物各0. 4 ju 1 , Taq DNA聚合酶(5U/ ju 1 ): 1 ju 1 , 10 x buffer: ljLil, dNTPs ( 2.5mM ) : 0. 8jul, ddH20: 5. 4jnl。多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上 反应)94度/5分钟94度/30秒-62度/35秒-72度/35秒,40个循环 72度/lG分钟。第一轮多核苷酸扩增反应结束后,获得在这一个目标基因组区域 原始序列的5,端和3,端连上公用接头的可用于进一步连接的可连接 性DNA片段朋C^-10j,(序列长度512)。实验胶图见图6。3. 第二轮多核苷酸扩增和连接反应多核苷酸扩增体系(20y 1):模板8jil, Taq DNA聚合酶(5U/ y 1) : 2 m 1, 10 x buffer: 2 ja 1, d證s ( 2.5mM) : 1. 6 |a 1, ddH20: 6.4jjl。其中模板取自第一轮多核苷酸扩增反应所得产物。多核苷酸扩增程序(在GeneAinp 9800多核苷酸扩增反应仪上反 应)94度/2分钟94度/15秒-60度/30秒-68度/8分钟,10个循环 94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒), 共15个循环72度/lG分钟。第二轮多核苷酸扩增和连接反应结束后,获得"非特异连接的长 链腿"。本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DM的电泳检测胶图见图6 。 实施例4:本实施例选用人类基因组中癌症相关的候选基因A^^2的第6个 外显子(序列长度446 ,在5, —3,方向的第167个碱基处含一个 Sa/z^I酶切位点)作为一个目标基因组区域,通过两轮多核苷酸扩增 反应扩增、连接成长链DM。第一轮多核苷酸扩增反应产物和经两轮 多核苷酸反应扩增、连接得到的长链DM经异丙醇沉淀法纯化后、在 相同条件下进行酶切。具体过程如下1. 引物设计选择人类基因组中与癌症相关的候选基因^ "^的第6个外显子 的作为一个目标基因组区域,用Primer3软件设计引物,在正向引物 中一个加上17个碱基长度的序列GTAAAACGACGGCCAGT,在反向引物中 加上17个碱基长度的ACTGGCCGTCGTTTTAC序列(均增加在引物序列的 5,端),这两段寡核苷酸序列反向互补,为本实验的公用接头。 设计好的引物为(下划线部分即为公用接头序列) -6(序列长度:446): 正向引物GTAAAACGACGGCCAGTTTCTGCCTCATACAGGCAATTC 反向引物ACTGGCCGTCGTTTTACCATAATGCTTGACACCACTGGAC。2. 第一轮多核苷酸扩增反应多核苷酸扩增体系U0m 1) : DNA(5ng/ja 1): 1 m 1,引物(5 u M):正反向引物各0. 4 ia 1 , Taq ■聚合酶(5U/ |i 1 ): 1 n 1,10 x buf f er: dNTPs ( 2.5mM) : 0.8|al, ddH20: 5.4pl。多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上 反应)94度/5分钟94度/30妙-58度/35秒-72度/35秒,40个循环 72度/10分钟。第一轮多核苷酸扩增反应结束后,获得在这一个目标基因组区域 原始序列的5,端和3,端连上公用接头的可用于进一步连接的可连接 性DNA片段A C42-6'(序列长度480 )。实验胶图见图7。3. 第二轮多核苷酸扩增和连接反应多核苷酸扩增体系(20jul):模板8yl, Taq DNA聚合酶(5U/ jli1): 2jal, 10 x buffer: 2jal, dNTPs ( 2.5mM) : 1.6)al, d歸 6.4pl。其中模板取自第一轮多核苷酸扩增反应所得产物。多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反 应)94度/1分钟94度/10秒-68度/15分钟,14个循环 94度/10秒-68度/15分钟(每轮循环增加15秒),共16个 循环72度/lQ分钟。第二轮多核苷酸扩增和连接反应结束后,获得"非特异连接的长 链DNA"。本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。 获得的非特异连接的长链DNA的电泳检测胶图见图7。4. 細〃1酶切首先将笫一轮多核苷酸扩增反应获得的产物、和经两轮多核苷酸 反应扩增、连接获得的长链DNA,用异丙醇沉淀法进行纯化。具体过程如下取第一轮多核苷酸扩增反应扩增产物100 ju 1,加入100 ia 1异丙 醇,10p lNaCl2 ( 6mM) ,-80lC冷冻1小时后在4'C温度条件下、 13, OOOrpm转速离心30分钟,弃去上清液后加入500 p 1 80%乙醇,4 X:温度条件下、13, OOOrpm转速离心IO分钟,弃去上清液,室温晾干, 加入100p 1 ddH20 ,混合均匀。用NanoDrop核酸蛋白测定4义ND-1000 测得纯化后产物浓度为37.9ng/yl;取经两轮多核苷酸反应扩增、连接获得的长链dna产物30m1 , 加入30u 1异丙醇,3ja INaCh ( 6mM) ,-80X:冷冻1小时后在4X:温度 条件下、13, 000rpm转速离心30分钟,弃去上清液后加入500 ju 1 80% 乙醇,4t:温度条件下、13, OOOrpm转速离心10分钟,弃去上清液, 室温晾干,加入100p lddH20 ,混合均匀。用NanoDrop核酸蛋白测定 仪冊-1000测得纯化后产物浓度为35.0 ng/jjl。将纯化后的产物在相同条件下进行^/z^I酶切。具体过程如下 酶切反应体系(20 m 1 ):纯化后产物6 |a 1, Sa/z^I酶(15U/ m 1 ): 1.5jil, 10 xk buffer: 2pl, 0. 1%BSA: 2jil, ddH20: 8. 5yl。 反应条件37t:水浴2小时,酶切实验的胶图见图7。 图7显示经纯化处理过的可连接性DNA片段(S^7^ -6,)经 &迈#1酶切后得到两条特异性片段,而经纯化处理过的经本发明提出 的实验方法扩增、连接得到的长链DNA经A迈VI酶切后得到片段长度 与可连接性DNA片段长度一致的产物。酶切实验的结果证实了本发明 提出的针对貝标基因组区域进行的边扩增边连接方法的有效性。
权利要求
1. 一种对一个和多个目标基因组区域进行边扩增边连接的公用接头,其包括两条以5’→3’方向和以3’→5’方向碱基互补的寡核苷酸序列,所述寡核苷酸序列的结构特征为1)在多核苷酸扩增和连接退火温度下不与目标基因组结合;2)自身不形成发夹等二级结构;3)胞嘧啶和鸟嘌呤的含量占四种碱基数量总和的20%-80%;且4)序列长度在7-100碱基。
2. —种针对一个目标基因组区域进行边扩增边连接的方法,包 括步骤1) 针对一个目标基因组区域,设计包含权利要求1所述公用接 头的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物 中公用接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸 扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5,端 和3,端加入权利要求1所述公用接头的可连接性DNA片段;3) 步骤2)获得的可连接性DNA片段,作为第二轮多核苷酸扩 增反应的模板进行边扩增边连接反应;得到由步骤2)所得可连接性 DNA片段连接而成的长链DNA。
3. —种针对两个及两个以上的多个目标基因组区域进行边扩增 边连接的方法,包括步骤1) 针对多个目标基因组区域的每个区域,分别设计包含权利要 求1所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中 每对正向和反向引物中公用接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸 扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5, 端和3,端加入权利要求1所述公用接头的不同可连接性DNA片段;3)将步骤2)获得的不同可连接性DM片段进行等量地混合,作 为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步 骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链 腿。
4. 一种建立针对一个目标基因组区域序列重测序随机DNA文库 的方法,包括步骤1) 针对一个目标基因组区域,设计包含权利要求1所述公用接 头的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物 中公用接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸 扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5,端 和3,端加入权利要求1所述公用接头的可连接性DNA片段;3) 步骤2)获得的可连接性DNA片段作为第二轮多核苷酸扩增 反应的模板进行扩增反应;得到由步骤2)所得可连接性DNA片段连 接而成的长链DNA;4) 将步骤3)所得的长链DNA用DNA随机打断法打断,得到随 机薩文库。
5. —种建立针对两个及两个以上的多个目标基因组区域重测序 随机DNA文库的方法,包括步骤1) 针对多个目标基因组区域的每个区域,分别设计包含权利要 求1所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中 每对正向和反向引物中公用接头彼此反向互补;2) 利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸 扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5, 端和3'端加入公用接头的不同可连接性DNA片段;3) 将步骤2)获得的不同可连接性DM片段进行等量地混合, 作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长 链DNA;4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随 机DNA文库。
6.根据权利要求4或5所述的方法,其中步骤4)中打断所得 长链DNA序列的方法为包括超声法、喷雾法、化学剪切法、酶剪切法 等在内的DNA随机打断方法。
全文摘要
本发明涉及一种针对一个或多个目标基因组区域进行边扩增边连接的公用接头设计方法。本发明又涉及一种针对一个或多个目标基因组区域进行边扩增边连接的方法。本发明所述方法适用于针对任意长度的目标基因组区域的边扩增边连接工作,所得到的非特异连接的长链DNA可根据研究需要应用于多种DNA分析平台。本发明还涉及一种针对一个或多个目标基因组区域序列重测序工作、建立随机DNA文库的方法,所得随机DNA文库可用于通过包括Sanger测序技术、边合成边测序技术在内的测序方法对所述一个或多个目标基因组区域序列进行重测序。
文档编号C12N15/09GK101265471SQ20071014362
公开日2008年9月17日 申请日期2007年8月15日 优先权日2007年4月29日
发明者张秀清, 杨焕明, 琳 林, 建 汪, 苏夜阳 申请人:北京华大基因研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1