一种含重复序列基因的合成方法

文档序号:585985阅读:1278来源:国知局
专利名称:一种含重复序列基因的合成方法
技术领域
本发明 涉及生物工程技术领域,具体涉及一种含重复序列基因的合成方法。
背景技术
基因合成是现代生命科学的一大基石,而人工合成基因的瓶颈是成本和效率。对 含重复序列的基因来说,因PCR时容易发生非目的序列配对,所以克服瓶颈的限制更加困 难。至今报道的最先进的基因合成方法,是用软件(DNAW0RKS、Gene2 oligo等)设计引物, 然后用重叠延伸PCR的方法人工合成基因。而软件设计引物最多考虑的是所有引物Tm值 的一致性及引物的长度,往往无法兼顾重复序列。在PCR拼接出现困难或测序结果发现缺 失的时候才发现是重复序列导致,需要重新设计引物进行修复,造成时间和成本的浪费。

发明内容
本发明的目的是克服现有技术中的缺陷,提供一种含重复序列基因的合成方法。本发明的含有重复序列基因的合成方法为采用重叠延伸PCR的方法人工合成基 因,所述重叠延伸PCR时所采用的引物满足下列要求当所述基因含有相邻的重复序列时,重叠延伸PCR引物中有一条引物的序列包含 该相邻的重复序列,且该相邻的重复序列不能出现在该引物的5’和3’端;或者,当所述基因含有相距较近的重复序列时,重复序列在不同的重叠延伸PCR 引物中呈直接重复的形式,且所述重复序列不能出现在该引物的5’和3’端。进一步的,所有重叠延伸PCR引物匹配部分的Tm值相似。所述重叠延伸PCR引物长度为20_50bp。所述重复序列包括正向重复序列与反向重复序列。所述重复序列的重复单元一般可包含12-30个碱基。所述相邻的重复序列是指序列中正向重复序列或反向重复序列的重复单元之间 至多间隔10个碱基。所述相距较近的重复序列是指序列中正向重复序列或反向重复序列的重复单元 之间间隔11-80个碱基。所述重复序列在不同的重叠延伸PCR引物中呈直接重复的形式是指无论对于正 向重复序列或是反向重复序列,各重复单元均出现在不同的引物中,且包含重复单元的引 物中,重复单元序列均相同(非互补)。所有重叠延伸PCR引物匹配部分的Tm值相似是指各重叠延伸PCR引物匹配部分 的Tm值的最大差值不超过8°C。本发明对含重复序列的基因片段利用手动设计引物的方法,兼顾考虑引物的Tm 值和重复序列,而任意一条引物的长度都可以随意改变,从而使相邻的重复序列设计在同 一条引物中或者相距较近的重复序列在不同的引物中呈直接重复的形式,而且重复不能出 现在引物的5’和3’端,也就是说相邻两条引物互补配对的序列必须是特异性的,不能完全是重复序列,进而避免了 PCR出现缺失的情况,大大提高了含重复序列基因的合成效率。经过数 百条基因的合成实验,证明上述重复序列基因的合成方法是非常高效的。 当然,对于较长的基因,整条基因都采取手动合成引物的方法,和软件设计比较而言,不仅 耗时而且易出错。所以本发明的含有重复序列基因的合成方法一般较适合合成90-350bp 的基因,对于较长基因(一般大于350bp),可以采用基因合成中常见的分段方法,将含有本 文介绍的两种重复的序列分作一段,其它序列分作一段或数段。这样就可以把不含重复的 片段用软件设计引物,而含重复序列的片段可以用手动设计引物的方法设计。因为含本文 介绍的两种重复的片段一定是较短片段,所以手动设计引物在几分钟之内即可完成,不会 是因为手动设计而延误时间。对于同一条基因,分段后用这两种方法设计的引物可以单独 分段PCR,然后再将PCR产物拼成基因全长,也可以将分段后设计的引物混合在一起做PCR, 直接合成全长基因。众所周知,根据密码子偏好性进行的序列优化是避免重复序列出现的最直接最有 效的方式。但是在很多情况下,研究者为了研究的需要、基因或蛋白结构和功能的要求等, 有些重复序列是不允许被优化的。那么当重复序列必须出现在目的基因序列中时,只能在 设计引物时考虑到如何防止因重复序列引起的错配。本发明介绍的引物设计方法可以有效 的避免引物的错配,确保引物之间序列特异性的结合,减少因重复序列导致的基因突变率, 进而降低了用于修复突变的引物合成和测序的费用,大大提高了含重复序列基因的合成效 率。


图1 实施例1手工设计引物的测序结果图2 实施例1软件设计引物的测序结果图3 实施例2手工设计引物的测序结果图4 实施例2软件设计引物的测序结果
具体实施例方式以下列举具体实例以进一步阐述本发明,应理解,实例并非用于限制本发明的保 护范围。实施例1这是一条含有23bp的反向重复(下划线标记重复单元)的基因片段,CAAGACCTC GAGTGCTGTTGACAGTGAGCGATCCAAGTCAGTGAAAGATAAGTAGTGAAGCCACAGATGTACTTATCTTTCACTGA CTTGGACTGCCTACTGCCTCGGAGGATCCGACAAC (SEQ ID NO 1),常用软件 Gene2oligo 设计的 PCR 引物如表1所示。表 1
引物名称 引物序列碱基数
~~PlCAAGACCTCGAGTGCTGTTGACAGTGAGCGAT(SEQ ID NO 2)3权利要求
1.一种含有重复序列基因的合成方法,为采用重叠延伸PCR的方法人工合成基因,所 述重叠延伸PCR时所采用的引物满足下列要求当所述基因含有相邻的重复序列时,重叠延伸PCR引物中有一条引物的序列包含该相 邻的重复序列,且所述相邻的重复序列不能出现在该引物的5’和3’端;或者,当所述基因含有相距较近的重复序列时,重复序列在不同的重叠延伸PCR引物 中呈直接重复的形式,且所述重复序列不能出现在引物的5’和3’端。
2.如权利要求1所述含有重复序列基因的合成方法,其特征在于,所有重叠延伸PCR弓丨 物匹配部分的Tm值相似。
3.如权利要求1所述含有重复序列基因的合成方法,其特征在于,所述重叠延伸PCR弓丨 物长度为20-50bp。
4.如权利要求1所述含有重复序列基因的合成方法,其特征在于,所述重复序列的重 复单元为15-30个碱基。
全文摘要
本发明公开了一种含重复序列基因的合成方法,为采用重叠延伸PCR的方法人工合成基因,所述重叠延伸PCR时所采用的引物满足下列要求相邻的重复序列设计在同一条引物中或者相距较近的重复序列在不同的引物中呈直接重复的形式,而且重复不能出现在引物的5’和3’端。本发明的含重复序列基因的合成方法可有效避免PCR出现缺失的情况,大大提高了含重复序列基因的合成效率。
文档编号C12N15/10GK102031250SQ201010286658
公开日2011年4月27日 申请日期2010年9月19日 优先权日2010年9月19日
发明者王素莲, 谢海燕 申请人:生工生物工程(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1