高gc含量大片段dna的体外组装方法及应用

文档序号:9447732阅读:1719来源:国知局
高gc含量大片段dna的体外组装方法及应用
【技术领域】
[0001]本发明属于合成生物学技术领域,具体地,本发明涉及一种高GC含量大片段DNA 的体外组装方法及应用。
【背景技术】
[0002] 微生物(尤其是放线菌)产生的具有生物活性的天然产物(次级代谢产物),是人 类抵抗癌症、衰老和感染性疾病等的宝贵财富。据统计,在已报道的天然药物中,有50%左 右是由放线菌科的细菌产生的。同时,生物信息学分析显示,已完成测序的放线菌基因组中 除了已知功能天然药物的生物合成基因簇外,还含有大量的隐形天然产物生物成基因簇, 送些信息为将来新功能天然药物的筛选挖掘提供了宝贵的资源库。随着细菌耐药性问题日 益严峻,从放线菌资源库中开发挖掘抗耐药性菌株感染的新天然药物变得尤为重要,而其 中天然产物生物合成基因簇(一般可达20-150化)的快速克隆,将是重要的关键技术之一。 传统建库筛选的方法操作步骤繁琐,耗时耗力。随着合成生物学的发展,各种DNA体外组装 方法相继诞生,如DNA assembler与Gibson等温一步法。由于体外操作与方法设计的简便 性,它们为快速克隆天然药物的生物合成基因簇提供了一种新方式。Gibson等温一步法由 于操作简单、组装尺度大(目前拼接的最大分子尺度为580化),已被广泛用于各个实验室, 但还未见报道用于高GC含量DNA大片段(主要针对放线菌天然产物生物合成基因簇)的 组装。
[0003]Gibson等温一步法主要利用体外同源重组原理,在一个反应体系中,可一次同时 组装多个片段。该方法涉及H种酶,巧外切酶产生片段间重叠区的粘性末端,Phusion聚合 酶与Taq连接酶修补缺口。在拼接低GC含量片段(小于40% )时,组装效率可达100%。 但文献报道显示,随着片段与载体重叠区GC含量的增加,组装效率逐级下降,当GC含量为 40 %时,效率为80 %,而当GC含量升高至60 %时,效率仅有30 %。推测主要原因是反应在 较低温度(5(TC)进行,当GC含量升高后,片段末端由于退火温度过高不易解链或者解链后 易发生错配,导致载体自连或者片段间错误连接。而放线菌来源DNA的GC含量一般都超过 70%,用传统的Gibson等温一步法显然无法满足拼接要求。本发明人的实验结果也证实了 送一点,当在载体末端引入来自组装片段的40bp重叠区,组装3个5化的DNA片段时(片 段GC含量大于75 % ),其组装效率为0。于是,本发明人对送种方法进行了改进,改进后可 明显提高组装效率。最后,运用改进的方法应用于始旋链霉菌原始霉素II生物合成基因簇 (67化)的组装,验证了方法的有效性,因此,该方法为放线菌来源的天然产物生物合成基因 簇W及各种高GC含量大片段DNA的快速克隆提供了很好的操作工具,本方法的推广应用将 能有效地推动新天然药物挖掘开发的进度。

【发明内容】

[0004]本发明的目的是提供一种新的高GC含量DNA大片段的体外组装方法,并用于原始 霉素II生物合成基因簇的快速克隆。
[0005] 在本发明的第一方面,提供了一种祀核酸序列的体外组装方法,包括步骤:
[0006] (a)提供用于拼接的n个结构单元,各结构单元的序列记为Ln,其中所述的n为 > 2的正整数;和线性化的载体元件;
[0007]其中,
[0008] (i)所述的n个所述结构单元可拼接成式I所示结构的、两端分别带有第一和第二 重叠区W及第一和第二限制性内切酶酶切位点的第一级拼接序列:
[0009]L1-L2-L3-----LN(I)
[0010] 式中,
[0011] L1、L2、……、Ln为各结构单元的核巧酸序列;
[0012] 并且,位于第一级拼接序列的5'端的L1具有从5'至3'方向的式II所示的结 构:
[0013]X0-X1-X2-X3-L1' (II)
[0014]式中,
[0015] X0为无或任意的长度为1-lOObp核巧酸序列;
[0016]XI为第一重叠区;
[0017]X2为第一限制性内切酶酶切位点;
[0018]X3为无或任意的长度为l-20bp核巧酸序列;
[0019] 11'为待保留的拼接单元序列;
[0020] 其中,X0-X1-X2-X3构成位于5'端的第一侧翼序列;
[0021] 并且,位于第一级拼接序列的3'端的Ln具有从5'至3'方向的式III所示的结 构:
[0022] Ln' -X4-X5-X6-X7 (III)
[0023]式中,
[0024]X7为无或任意的长度为1-lOObp核巧酸序列;
[00巧]X6为第二重叠区;
[0026]X5为第二限制性内切酶酶切位点;
[0027]X4为无或任意的长度为l-20bp核巧酸序列;
[0028] Ln'为待保留的拼接单元序列;
[0029] 其中,X4-X5-X6-X7构成位于3'端的第二侧翼序列;
[0030] 并且,第一重叠区和第二重叠区是互不相同的,且GC含量为0-50%;
[0031] (ii)所述线性化的载体元件的结构如式IV所示,
[0032]XOb-X化-X2b-X3b-Z-X4b-X化-X化-X化 (IV)
[0033]式中,
[0034]X化为X0的互补序列;
[003引 X化为XI的互补序列,即第一重叠区的互补序列;
[0036]X化为所述的第二限制性内切酶酶切位点;
[0037]X3b为X3的互补序列;
[0038]Z为载体的结构序列;
[0039]X4b为X4的互补序列;
[0040] X化为所述第二限制性内切酶酶切位点;;
[0041] X化为X6的互补序列,即第二重叠区的互补序列;
[0042] X化为X7的互补序列;
[0043] 化)在外切酶、聚合酶和/或连接酶酶存在下,使上述的n个结构单元和线性化的 载体元件进行组装,从而形成式V所述的第一级连接产物,其中所述连接产物为环状;
[0044] L1-L2-L3-----Ln-XOb-X化-X2b-X3b-Z-X4b-X化-X化-X化 (V)
[0045] 式中,1^、1^2、1^3、山^化^化、乂213^313、2^413^化^化^化的定义如上所述;
[0046] (C)任选地用所述的第一限制性内切酶和/或第二限制性内切酶上一步骤的连接 产物,从而获得用于下一级组装的结构单元;并且任选地重复步骤(a)和步骤化)共j次, 从而形成j+1级组装产物,其中j为>1的正整数。
[0047] 在另一优选例中,乂0、乂3^4、和乂7中的一个或多个为无。
[0048] 在另一优选例中,X化、X3b、X4b、和X化中的一个或多个为无。
[0049] 在另一优选例中,所述的第一侧翼序列为SEQIDNO.:1和/或所述的第二侧翼序 列为沈QIDNO. :2。
[0050] 在另一优选例中,所述的两个相邻的结构单元之间设有长度为10-5化P的粘性末 端。
[0051] 在另一优选例中,所述粘性末端的序列来自或不来自祀核巧酸序列的结构基因的 序列,优选地来自祀核巧酸序列的结构基因序列。
[0052] 在另一优选例中,j为1-5的正整数,较佳地为1-3的正整数。
[005引在另一优选例中,所述的第一限制性内切酶选自下组:化eI、NdeI。
[0054] 在另一优选例中,所述的第二限制性内切酶选自下组:化el、Ndel。
[0055] 在另一优选例中,所述的第一限制性内切酶和第二限制性内切酶是不同的酶。
[0056] 在另一优选例中,n为2-6的正整数,较佳地为2-4的正整数。
[0057] 在另一优选例中,所述的核酸序列的长度大于15化,较佳地为20-500化,更佳地 为 30-300化。
[0058] 在另一优选例中,所述的祀核酸序列的CG含量>55%,较佳地>60%,更佳地 > 65%或> 70% (如 70-80% )。
[0059] 在另一优选例中,所述的第一重叠区的CG含量为0-50%。
[0060] 在另一优选例中,所述的第二重叠区的CG含量为0-50%。
[0061] 在另一优选例中,所述的第一侧翼序列的CG含量为0-50%。
[0062] 在另一优选例中,所述的第二侧翼序列的CG含量为0-50%。
[0063] 在另一优选例中,所述的祀核酸序列为DNA序列。
[0064] 在另一优选例中,所述的祀核酸序列为基因簇序列。
[0065] 在另一优选例中,所述的祀核酸序列为放线菌的核巧酸序列。
[0066] 在本发明的第二方面,提供了一种用于DNA体外组装的构建物,所述构建物包括:
[0067] 用于拼接的n个结构单元,各结构单元的序列记为Ln,其中所述的n为> 2的正整 数;和
[0068] 线性化的载体元件;
[006引其中,
[0070] (i)所述的n个所述结构单元可拼接成式I所示结构的、两端分别带有第一和第二 重叠区W及第一和第二限制性内切酶酶切位点的第一级拼接序列:
[0071] L1-L2-L3-----Ln(I)
[0072] 式中,
[0073] 11、L2、……、Ln为各结构单元的核巧酸序列;
[0074] 并且,位
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1