一种富含AT或者GC基因的合成方法与流程

文档序号:13885668阅读:1858来源:国知局
一种富含AT或者GC基因的合成方法与流程

本发明涉及生物工程领域,具体涉及一种富含at或者gc基因的合成方法。

技术背景

随着医学工程,生物工程以及合成生物学的发展,根据天然存在的dna序列或者人为创造的dna序列,特异地进行体外dna合成(基因合成)的需求越来越大。体外基因合成能够根据蛋白质的密码子特点,实现基因最优化的密码子组合,从而实现蛋白质的高效表达。它也能够根据研发的需要,实现多基因融合以及基因与多个调控区的有效融合。近来,体外基因合成还被用来创造以dna为基本材质的新型纳米材料。

目前被工业界广泛采用的是基于聚合酶链式反应(polymerasechainreaction,pcr)技术的dna合成方法。这种合成方法是首先手动或者利用软件将一条基因的分割成若干个短的单链寡核苷酸片段。其中一部分单链寡核苷酸片段位于基因的正义链,一部分单链寡核苷酸片段位于基因的反义链;位于正义链和反义链上的单链寡核苷酸片段之间通过一定长度的互补配对重叠区,以搭桥的方式覆盖整条完整的基因长度。然后,利用修饰的碱基作为原料,使用包括固相合成法,磷酸二酯法,磷酸三酯法,亚磷酸三酯法,芯片合成法等化学合成的技术路线,合成这些单链寡核苷酸片段(需要指出的是这种单链dna寡核苷酸片段的合成,长度越长,错误率越高。目前的行业内的单链dna寡核苷酸合成技术而言,在100bp以下,保真度较好。因此目前,在各种具体的基因合成方法中,在化学法合成的阶段,通常长度控制在100bp以内)。接下来,搭桥的正义链和反义链的寡核苷酸片段之间互为模板,利用pcr技术进行一轮或多轮扩增,获得大量的完整的基因dna。这些dna最后,通过酶切,酶连或其它的分子克隆手段装载到质粒载体上,转化到大肠杆菌中,进行测序验证以及进一步的大量扩增。一些具体的方法虽然在pcr程序或者一些引物设计上有差别,但是基本上涵盖了上述核心流程(参考文献包括:stemmeretal.,1995;kodumaletal.,2004;reisingeretal.,2006;xiongetal.,2004和xiongetal.,2006等)。

基于pcr技术的基因合成方法能够有效的合成gc含量在40%-60%的基因,然而对于一些富含at(低gc)或者高gc的基因,合成能力有限。gc越低或者gc约高,合成越困难。对于at含量在80%以上或者gc含量在70%以上,pcr技术几乎无法实现有效的合成。通常来说,利用pcr进行合成富含gc,常常因为寡核苷酸链或者局部dna产物之间容易形成gc发夹,而造成合成失败。相反地,在利用pcr合成富含at基因的时候,常常因为形成稳定的dna双链困难,导致合成失败。另外,富含gc和at基因常常也会伴随着高重复,这种高重复会导致合成的基因产生缺失或者插入,而导致合成失败。

另外一种被少量采用的基因合成技术是基于连接酶法的基因组装合成技术。这种方法实际是比pcr方法更古老的基因合成技术。同上述的pcr方法相比,它也需要首先设计并利用化学法合成短的单链寡核苷酸片段,只是在具体寡核苷酸链设计上稍有不同。具体而言可以大致分为以下步骤:1)首先手动或者利用软件将一条基因的分割成若干个短的单链寡核苷酸片段。其中一半单链寡核苷酸片段位于基因的正义链,一半单链寡核苷酸片段位于基因的反义链;位于正义链上的寡核苷酸片段和位于反义链上的寡核苷酸片段之间保持一定的交错重叠互补区;重叠互补区的长度为随机长度;最终保证位于正义链和反义链上的单链寡核苷酸片段之间能够通过互补配对的形式形成寡核苷酸之间仅缺乏磷酸二酯键连接的完整的双链dna。2)利用同上述pcr合成方法中的单链寡核苷酸的合成方法来合成单链寡核苷酸片段。3)将获得的单链寡核苷酸片段进行磷酸化处理。4)将获得的基因的多个正义链,反义链的单链寡核苷酸片段混合在同一个体系中,退火,加入连接酶连接形成一条完整的双链。获得的dna双链可以进一步通过分子克隆手段装载到质粒载体上进行保存和大量的扩增(参考文献包括guptaetal.,1968;hsiungetal.,1979;erenandswenson,1989;grundstrometal.,1985和auetal.,1998等)。这种方法还能和pcr结合,提高合成能力。通过步骤4获得的完整的双链dna能够利用pcr技术进行扩增,提高合成的产量和基因合成的长度(参考文献包括smithetal.,1990;jayaramanetal.,1991;strizhovetal.,1996和smithetal.,2003等)。

基于这种传统的连接酶法进行的dna合成技术,同样能够合成gc含量在40%-60%的基因。然而对于低gc和高gc的基因,其合成能力甚至比单独依赖pcr技术进行合成更低。其中原因包括1)由于高gc和低gc基因局部gc含量的不均一性,混和在同一个体系中的多条单链寡核苷酸自身在退火过程中形成局部二级结构,阻止完整的dna双链的形成。2)由于高gc和低gc基因伴随的高重复,正义链,反义链上的寡核苷酸对之间本身互相错配无法被后面的筛选过程排除,造成合成失败。3)由于高gc和低gc基因伴随的高重复,使得正义链,反义链寡核苷酸形成的dna双链产生的部分长度一致的粘性末端之间能够互相错配,造成合成失败。

鉴于已有的方法在富含gc和at基因上较低的合成能力,各大基因合成公司将富含gc或者at基因定义为难度基因,而有别于其标准服务(见各大基因合成公司网站)。对富含gc或者at难度基因的定义标准虽然有一定区别,但是比较经典的方式是将高于60%gc或者60%at含量的基因定义为难度基因。这类难度基因中大约30%的基因,各基因合成公司,可能通过反复的优化pcr法和连接酶法的过程,花费正常基因3倍至10倍的时间进行合成。剩下的大约70%的基因,各大基因公司会因为反复的尝试失败后,而拒绝提供服务。



技术实现要素:

本发明的目的在于解决目前富含at或者gc基因合成困难的问题,提供一种有效的富含at或者gc基因的合成方法。

本发明的概述如下(如附图1所展示流程图):

一种富含at或者gc基因的合成方法的合成方法,包含以下步骤:

步骤一:将基因的一条链分割成a1,a2…at的多个寡核苷酸片段;将基因的另一条链分割成b1,b2…bt的多个寡核苷酸片段;设计的an和对应的bn寡核苷酸片段能够互补配对产生带有粘性末端的双链寡核苷酸片段,其中相邻两个双链寡核苷酸片段的相邻粘性末端能互补配对,且粘性末端长度依照基因的序列顺序,依次为4,6,8,10…2(n+1)个碱基;n选自1,2,3,……,t;

步骤二:获得步骤一中设计的寡核苷酸片段;

步骤三:分别将an,bn的寡核苷酸链分段慢退火形成双链寡核苷酸片段;

步骤四:将步骤3中所获得的双链寡核苷酸片段利用磷酸化酶进行磷酸化;

步骤五:将步骤四中所获得的各个双链寡核苷酸片段利用连接酶,连接成一条完整的基因。

其中,本发明所述的富含at或者gc基因是指基因中at含量超过60%的基因或gc含量超过60%的基因。

所述的t优选自大于等于1且小于等于15的整数。

步骤一优选包括:将基因的一条链人工或者利用软件分割成a1,a2…at的多个寡核苷酸片段;将基因的另一条链人工或者利用软件分割成b1,b2…bt的多个寡核苷酸片段;设计的an和对应的bn寡核苷酸片段能够互补配对产生带有粘性末端的双链寡核苷酸片段,其中以an的方向计,双链寡核苷酸片段an/bn的3’端粘性末端和双链寡核苷酸片段an+1/bn+1的5’端粘性末端能互补配对,且粘性末端长度为2(n+1)个碱基。

步骤一中所述的寡核苷酸片段的长度优选为20-150bp。

步骤二中获得步骤一中设计的寡核苷酸片段的方法为现有的合成寡核苷酸片段的任何一种方法,优选化学合成法;涉及的化学合成法包括但不限于固相合成法,磷酸二酯法,磷酸三酯法,亚磷酸三酯法,和芯片合成法等。

步骤三中所述的分段慢退火优选分别将合成的每一个双链寡核苷酸片段的两条寡核苷酸片段在离心管中退火,即不同的寡核苷酸对an/bn,加入不同的反应管中,单独退火。包括首先用85℃-95℃高温℃℃将寡核苷酸对变性5-15min,再将变性后的寡核苷酸对置于低于30℃的条件下自然冷却,或者以每分钟降低0.1℃-2℃的方式缓慢冷却退火。

在本发明方法中,所述的寡核苷酸片段退火进一步优选包括以下步骤:将1ul寡核苷酸片段an,1ul寡核苷酸片段bn,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管中,混合均匀后,95℃变性5min,室温冷却30min–1h;其中寡核苷酸片段an和寡核苷酸片段bn的初始浓度均为50um。

步骤四所述的磷酸化优选包括以下步骤:从步骤三退火形成的a1/b1,a2/b2…an/bn双链寡核苷酸片段中各取1ul,加入t4pnk激酶2ul,t4pnk激酶buffer2ul,补充水至20ul,37度反应0.5h。

本发明方法中,双链寡核苷酸片段a1/b1的5’端和at/bt的3’端可以根据后续的克隆需求分别设计产生平末端或者带有目标载体上用于载体上特定的限制性内切酶克隆的粘性末端。

步骤五包括利用任何连接酶(比如t4连接酶)将磷酸化的双链寡核苷酸片段连接成一条完整的基因。

磷酸化产物连接过程优选包括以下步骤:从退火后的磷酸化产物中取5ul,加入1ul酶切的目标载体,10ul2×连接酶buffer,3ulh2o,室温反应0.5h。

本发明方法中双链寡核苷酸片段a1/b1的5’端和at/bt的3’端设计产生平末端时退火后的磷酸化产物的连接过程包括以下步骤:从退火后的磷酸化产物中取5ul,加入1ul线性化的平末端目标载体,10ul2×连接酶buffer,3ulh2o,室温反应0.5h。

线性化的平末端目标载体可以是ecorv切割或者pcr扩增。

有益效果:

本发明方法的优势在于:本发明提供的方法能够有效的进行富含at(大等于60%含量)或者gc基因(大等于60%含量)的合成,它弥补了行业内利用传统方法在富含at或gc基因上无法合成或者合成困难的技术短板。该方法一个合成周期(涵盖基因dna合成,转化到大肠杆菌中扩增,测序验证等流程。通常为2-6天。)能够合成很多个单链寡核苷酸长度的富含at和gc的基因,在一些情况下,合成效率甚至能够比肩目前行业内定义的正常基因(40%-60%gc含量)的合成效率,是一种高效的方法。本发明所述的方法,互补的单链寡核苷酸,单独慢退火,保证了覆盖富含at或者gc基因的所有单链寡核苷酸区段能够正确的形成寡核苷酸双链,这种设计是确保富含at或者gc基因,正确合成的第一个关键点。本发明所述的方法中,单链寡核苷酸形成的双链dna的粘性末端配对区,依次以4,6,8,…2(n+1)的方式加长。这种双链寡核苷酸对之间,偶数个碱基的差异化粘性末端接头的选择,使得富含at或gc的双链寡核苷酸对,能够依照基因的序列顺序,正确的合成基因。另外这种独特的设计,使得双链寡核苷酸对的粘性末端之间,由于富含gc或at重复,造成错配的情况时候,无法连接成一条正确的基因。例如,4个碱基和6个碱基的粘性末端的错配,会留下2个碱基的空缺。这种经过我们实验优化,获得的偶数个碱基差异化粘性末端接头的设计是本技术保证富含at或者gc基因合成,最关键的地方。本发明所采用的单链寡核苷酸退火程序,能够在不依赖昂贵的仪器基础上,非常简便的实现单链寡核苷酸的退火。它有效的规避了目前最经典的基因合成pcr技术中,需要跑胶,回收的繁琐程序以及pcr进行基因合成的短板。同时本技术也规避了传统的连接酶法中,在合成富含at或者gc基因的时候,单链寡核苷酸之间容易错配及无法退火形成一条完整的基因的问题,实现了富含at或者gc基因的有效组装。总之,本发明提供的富含at或者gc的基因合成方法能够有效的合成传统的方法无法合成或者合成起来困难的富含at或者gc的基因,其设计独特,操作简便,合成效率高。

附图说明:

图1:本发明富含at或gc基因的合成流程图。

图2:实施例1的测序结果。

图3:实施例2的测序结果。

具体实施方式:

为了进一步了解本发明所阐述的方法,以下结合附图及实施例对本发明做进一步的阐述。

实施例1:

本实施例合成的目的序列是一条at含量为93.7%的序列。其序列如序列表中seqidno.1所示。

本实施例的基因合成过程如下:

1)将基因的正义链手动分割成若干条70-80bp的寡核苷酸序列,标记为a1,a2,a3,a4,序列依次如序列表中seqidno.2-5所示;基因的反义链手动分割成若干条70-80bp的寡核苷酸序列,标记为b1,b2,b3,b4,序列依次如序列表中seqidno.6-9所示。

其中a1,b1能够互补配对形成一个反义链的5’端带有catt4个碱基的粘性末端;a2,b2能够互补配对形成一个正义链的5’端带有aatg4个碱基的粘性末端,反义链的5’端带有tttcta6个碱基的粘性末端;a3,b3能够互补配对形成一个正义链的5’端带有tagaaa6个碱基的粘性末端,反义链的5’端带有ttttttct的粘性末端;a4,b4能够互补配对形成一个正义链的5’端带有agaaaaaa的粘性末端。

2)利用化学合成法合成步骤1中寡核苷酸a1,a2,a3,a4;b1,b2,b3,b4,浓度为50um。

3)取1ula1,1ulb1片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管1中,混合均匀后,95℃变性5min,室温冷却1h。取1ula2,1ulb2片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管2中,混合均匀后,95℃变性5min,室温冷却1h。取1ula3,1ulb3片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管3中,混合均匀后,95℃变性5min,室温冷却1h。取1ula4,1ulb4片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管4中,混合均匀后,95℃变性5min,室温冷却1h。

4)分别从步骤3中的反应管1,2,3,4中各取1ul反应产物,加入t4pnk激酶2ul,t4pnk激酶buffer2ul,补充水至20ul,37℃反应0.5hour。

5)从步骤4中磷酸化产物中取5ul,加入1ulecorv酶切好的puc57载体,10ul2×连接酶buffer,3ulh2o反应0.5hour。取10ul连接产物转化大肠杆菌感受态细胞top10,涂布带有x-gal和iptg的lb平板。

6)序列合成检测:筛选5中获得的阳性克隆子3个,抽提质粒测序,序列完全正确(图2)。

该实施例利用本发明提供的方法,通过一个合成周期,成功实现了含93.7%at基因的合成。该实施例我们也反复尝试过传统的pcr法和连接酶法,均没有获得正确的序列克隆。这表明,我们的方法在富含at基因合成上具有极大的优越性。

实施例2:

本实施例合成的目的序列是一条gc为72%序列。其序列如序列表中seqidno.10所示。

本实施例的基因合成过程如下:

1)将基因的正义链手动分割成若干条50-60bp的寡核苷酸序列,标记为a1,a2,a3,a4,序列依次如序列表中seqidno.11-14所示;基因反义链手动分割成若干条50-60bp的寡核苷酸序列,标记为b1,b2,b3,b4,序列依次如序列表中seqidno.15-18所示。

其中a1,b1能够互补配对形成一个正义链的5’端带有agctt5个碱基的粘性末端;反义链的5’端带有gcct4个碱基的粘性末端;a2,b2能够互补配对形成一个正义链的5’端带有aggc4个碱基的粘性末端,反义链的5’端带有cctgcc6个碱基的粘性末端;a3,b3能够互补配对形成一个正义链的5’端带有ggcagg6个碱基的粘性末端,反义链的5’端带有gactactc的粘性末端;a4,b4能够互补配对形成一个正义链的5’端带有gagtagtc的粘性末端,反义链的5’端带有aattc的粘性末端。其中a1,b1互补配对形成的正义链5’端带有agctt的粘性末端,以及a4,b4互补配对形成的反义链5’端带有aattc的粘性末端能够保证将片段克隆到hindiii和ecori酶切的载体上。

2)利用化学合成法合成步骤1中寡核苷酸a1,a2,a3,a4;b1,b2,b3,b4,浓度为50um。

3)取1ula1,1ulb1片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管1中,混合均匀后,95℃变性5min,室温冷却1h。取1ula2,1ulb2片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管2中,混合均匀后,95℃变性5min,室温冷却1h。取1ula3,1ulb3片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管3中,混合均匀后,95℃变性5min,室温冷却1h。取1ula4,1ulb4片段,10ul2×ssc缓冲液,8ulh2o加入到1.5ml反应管4中,混合均匀后,95℃变性5min,室温冷却1h。

4)分别从步骤3中的反应管1,2,3,4中各取1ul反应产物,加入t4pnk激酶2ul,t4pnk激酶buffer2ul,补充水至20ul,37℃反应0.5h。

5)从步骤4中磷酸化产物中取5ul,加入1ulhindiii及ecori酶切的puc57载体,10ul2×连接酶buffer,3ulh2o反应0.5h。取10ul连接产物转化大肠杆菌感受态细胞top10,涂布带有x-gal和iptg的lb平板

6)序列合成检测:筛选5中获得的阳性克隆子2个,抽提质粒测序,测序结果完全正确。测序结果如图3。

该实施例利用本发明所提供的方法,通过一个合成周期,成功实现了含有72%gc的基因的合成。该基因,我们尝试用传统的连接酶法进行合成,均以获得错误的序列告终。我们同时也反复优化pcr程序去合成,但是在经历3个合成周期的失败后,仍然没有得到正确的序列。这表明,我们的方法在富含gc基因的合成上成功率高,具有极大的优越性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1