一种高通量DNA多位点精确碱基突变方法与流程

文档序号:15234238发布日期:2018-08-21 20:12阅读:922来源:国知局

本发明涉及基因操作技术领域,特别涉及一种高通量dna多位点精确碱基突变方法,具体是一种基于重叠延伸pcr,使用精确设计的寡核苷酸芯片高通量合成的突变引物文库,向目标基因片段多位点同时引入突变的方法。



背景技术:

1967年spiegelman等提出在体外分子水平定向进化生物分子的思想,定向进化技术是一种利用实验室手段通过反复多次改造遗传多样性,结合高通量文库筛选从而获得理想性状生物体的过程,现已成为蛋白质工程领域应用最广泛、最有效的技术之一。定向进化属于蛋白质的非合理设计范畴,与理性突变方法相比,突变体的构建无需受蛋白质空间结构信息和构效关系的限制,而是在体外模拟自然进化的过程(随机突变和选择),在基因内部引入大量变异,并通过筛选实现在较短时间内定向选择出所需性质或功能的基因突变体。

早期的定向进化技术的目标多是单个蛋白,基本用于蛋白质的研究和开发:通过随机或定点引入突变,以获得目的蛋白产量提高、蛋白催化活性提高或稳定性增强等突变体以满足生物催化及生物医药等领域的工业化需求。而近年来的趋势则转向于对整个代谢途径甚至在基因组水平进行改造,为有效合成有价值的生物产品构建新型的全细胞催化体系。

易错pcr是应用最早、最成熟也是目前最常用的一项定向进化技术。其原理是在体外扩增基因时适当地调整pcr实验条件,使扩增过程层出现少量碱基错配而引入突变的诱变方法。可调整的条件如使用低保真度的taq酶,采用突变酶,调整反应体系中4种dntp比例,增加mg2+浓度,加入mn2+等。也可以组合多个条件以提高碱基错配的机率。该方法的优点是:易错pcr操作简单,无需额外合成特殊引物,且pcr过程中并未改变目标片段扩增长度,突变频率可在一定程度上通过调节反应条件进行相应的控制,另外,迭代易错pcr可使小的有益突变累积而获得较为理想的突变体。不足之处是:(1)易错pcr一般只会引入很小部分序列改变(以点突变为主),因而一般适用于较小的基因片段(<2kb)。(2)引入突变的随机性导致的大量同义突变、终止密码子突变及读码框破坏等大量的冗余突变使得易错pcr构建的突变文库有效率较低,有效突变体比例约占0.1-0.2%,增加了实验成本,造成了下游筛选实验的困难,难以获得理想突变体。

1982年,加拿大著名科学家smith等发明了寡聚核苷酸定点突变技术,为蛋白质工程领域的发展奠定了重要的基础。定点突变作为一种最基本的理性设计方案至今仍被广泛应用于各种蛋白质改造。然而定点突变技术面临的最重要的难题是如何从其它19种天然氨基酸中选出可以达到改造蛋白目标的最佳替换氨基酸。一系列研究表明,多点突变能获得比起单点突变有更高概率获得更理想的进化子,然而多点突变是定点突变不易直接获得的。针对这类问题,基于pcr的点饱和突变技术的开发由于其简单快速及易操作性而受到了广大研究者的青睐。

基于pcr的点饱和突变方法的基本原理是在靶点处设计简并引物对目的基因进行扩增以达到获取突变子的目的。简并引物的突变位点一般计为nnn或nnx(n代表4种核苷酸等比例混合物;x代表2种核苷酸等比例混合物(如g/c或g/t),同一位点的各种核苷酸替换不存在偏好性。基于pcr的点饱和突变方法主要分为以下两种:

一种是突变引物诱变与重叠延伸pcr。当靶位点位于基因两端时,可设计正向引物为含有靶位点突变的简并引物,反向引物为与目的基因片段序列完全匹配的引物,以此引入突变。突变引物诱变是点饱和突变中最简单、最快速的方法,但难以对基因中间的靶位点实现点饱和突变。所以当靶位点位于基因中间时,可采用重叠延伸pcr:设计一对在靶位点附近有一定长度重叠的简并引物,将这两条引物分别与扩增基因全长的正反向引物组合,扩增包含突变靶位点的上下游片段。该法优点是:(1)可实现对基因中间的靶位点的点饱和突变;(2)可同时进行多点饱和突变。(3)基本不存在突变修复问题,提高产物中突变子比例;(4)突变与重组同时完成,一定程度可降低实验成本,缩短实验周期。不足之处是:(1)分别扩增上下游片段时,只能使用无加尾性能的高保真型或混合型dna聚合酶,而不能使用具有无模板加尾性能的dna聚合酶;(2)当靶位点靠近目的基因末端时,分段扩增的片段过小而不易回收,容易造成末端突变频率下降;(3)进行多点饱和突变时所需的简并引物数量较大,成本较高,且难以保证在有限实验次数内获得各点饱和突变子。

另一种是质粒扩增诱变(反向pcr)。这种方法以含有目标基因的质粒为pcr扩增模板,在靶位点处设计一对完全互补的简并引物(或特定突变引物),以反向pcr为基础,扩增质粒全长,然后用dpni消化含甲基化位点的亲本质粒,保留由于没有甲基化位点而被保护的新合成片段,最终通过筛选获得携带目标突变的质粒。由于此法需要扩增质粒全长序列,因此在pcr反应中应特别注意扩增过程中的保真性,一般采用高保真型dna聚合酶。目前已有研发单位及公司基于此方法开发了商业化的试剂盒,其中以stratagene公司的quickchange快速定点诱变试剂盒为代表。该法优点是:基于dna体外杂交退火连接实现携带目标位点突变的pcr产物自环化以及基于大肠杆菌体内同源重组实现携带目标位点突变的pcr产物自环化的诱变方法省去了对pcr后的产物进行克隆的步骤,因此在一定程度上可以提高实验效率,降低实验成本。不足之处是:(1)因需要扩增质粒全长,pcr有效扩增效率低,耗时长,且易在非目标位置引入随机突变;(2)pcr扩增和诱变效率易受到质粒载体大小的影响,表现为较大的质粒载体不易扩增且诱变效率较低;(3)基于大肠杆菌体内同源重组环化pcr产物的方法虽然步骤简单,但需要后续dpni酶消化处理或表达dpni的特殊大肠杆菌菌株来实现模板质粒的消除,且需要根据实际实验优化相应的电转化条件才能获得较高的诱变效率;(4)因整体诱变效率偏低,该方法需要通过迭代诱变多次实验才可获得多点诱变,实验耗时成本较高。



技术实现要素:

本发明的目的是提供一种快速、高效的高通量对目标片段dna多位点引入突变的方法。

第一方面,本发明要求保护一种高通量对目标片段dna多位点引入突变的方法。

本发明所提供的高通量对目标片段dna多位点引入突变的方法,具体可包括如下步骤:

(1)根据目标片段dna的序列,针对每个预突变位点及其对应的预突变结果分别设计单链寡核苷酸片段;

所述单链寡核苷酸片段自5’端到3’端依次由上游接头序列、内切酶m的正向识别序列、突变引物、所述内切酶m的反向识别序列和下游接头序列组成;所述突变引物由对应于所述预突变位点的突变序列和位于所述目标片段dna上所述预突变位点两侧的同源序列(即所述同源序列与所述目标片段dna的所述预突变位点两侧的序列完全一致)组成。

(2)合成步骤(1)所设计的单链寡核苷酸片段,获得包含所述突变引物序列的混合ssdna文库。

(3)以步骤(2)所得的混合ssdna文库为模板,采用所述上游接头序列和所述下游接头序列作为引物对进行pcr扩增,然后采用所述内切酶m对所得pcr产物进行酶切处理,获得短双链突变引物文库。

(4)利用所述目标片段dna的全长上游引物和步骤(3)获得的短双链突变引物文库对所述目标片段dna进行首轮touchdownpcr,扩增20-25个循环后得到一组产物,记为产物a;利用所述目标片段dna的全长下游引物和步骤(3)获得的短双链突变引物文库对所述目标片段dna进行首轮touchdownpcr,扩增20-25个循环后得到另一组产物,记为产物b;将所述产物a和所述产物b混合后继续进行5-10个循环(如10个循环)的第二轮touchdownpcr,得到终产物;所述终产物中的dna片段与所述目标片段dna相比已被引入多位点突变。

进一步地,步骤(2)中,根据步骤(1)所设计的单链寡核苷酸片段的序列,利用dna合成仪合成单链寡核苷酸片段并固定在用于制备芯片的固相载体上,合成结束后,将所述单链寡核苷酸片段从所述固相载体上脱离下来,获得包含所述突变引物序列的混合ssdna文库。

进一步地,步骤(1)中,所述预突变位点及其对应的预突变结果可按照如下任一形式的突变进行设计:全氨基酸饱和式突变、全碱基饱和式突变(saturatedmutation)。指目标区域序列内每个位置氨基酸均有几率突变为除野生型外的全部19种非同义氨基酸或每个位置脱氧核苷酸突变为野生型外的其他3种脱氧核苷酸。

进一步地,步骤(1)中,每个所述预突变位点均可根据实验需要设计为1个氨基酸的点突变或者为2-5个连续的氨基酸突变。

更进一步地,步骤(1)中,所述突变引物中的所述突变序列可根据实验需要设计为3-15nt,两侧的所述同源序列可为15-21nt(为保证突变引物在pcr过程中顺利引入,突变引物两侧均保留与野生型模板序列同源的15-21nt)。更加具体地,所述突变引物全长可为45nt。

进一步地,步骤(1)中,还可包括按照如下在所述突变引物内部排除所述内切酶m的识别序列的步骤:将存在所述内切酶m的识别序列的所述突变引物的序列在所述内切酶m的识别序列处进行同义氨基酸替换。

在本发明的一个实施例中,步骤(1)中,所述内切酶m为bspqi;所述单链寡核苷酸片段全长95nt:由上游接头序列(17nt),正向bspqi酶切位点(8nt),突变引物45nt(中心3-15nt为突变序列,两侧15-21nt为与突变位点两侧同源序列),反向bspqi酶切位点(8nt),下游接头序列(17nt)共计5部分组成;所述上游接头序列17nt为seqidno.2;所述bspqi正向酶切位点及补充1nt碱基为“gctcttca”;所述突变引物45nt(共计4503条如表1所示);所述bspqi反向酶切位点及补充1nt碱基为“tgaagagc”;所述下游接头序列17nt为seqidno.3。更进一步地,所述目标片段dna为seqidno.1所示的sfgfp基因。所述预突变位点为除去首位atg起始密码子外的全部氨基酸,共计237个氨基酸突变靶位点。设计单氨基酸饱和突变引物:针对每个氨基酸位点,设计除该位点野生型氨基酸外的19种氨基酸突变的单氨基酸突变引物45nt,突变引物结构为(21nt+3nt(突变氨基酸位点)+21nt),237个氨基酸位点共计4503条单氨基酸突变引物;对应于单氨基酸突变引物共计4503条所述突变引物的具体序列如表1所示。

进一步地,步骤(2)中,还可包括将所述混合ssdna文库溶于1×tebuffer的步骤。

进一步地,步骤(3)中进行的所述pcr扩增为两轮pcr扩增:

第一轮pcr扩增:以所述混合ssdna文库为模板,采用所述上游接头序列和所述下游接头序列作为引物对,进行10个循环的pcr扩增,得到第一轮pcr扩增产物;

第二轮pcr扩增:将所述第一轮pcr扩增产物稀释5-10倍(如8倍)后作为模板,采用所述上游接头序列和所述下游接头序列作为引物对,再进行10个循环的pcr扩增,得到第二轮pcr扩增产物。

该步骤中使用kapahifi高保真聚合酶。

为实现在尽可能控制循环数以保证均一性的前提下获得足量的pcr扩增产物,所以该步骤使用两轮pcr对突变引物库进行扩增。在操作过程中,少量取样电泳鉴定产物为单一条带后,pcr产物可不经过凝胶电泳分离,直接使用qiaquick胶回收试剂盒回收,因产物长度只有95bp,因此回收时需添加等体积异丙醇以提高回收效率。

进一步地,步骤(4)中,所述全长上游引物和所述全长下游引物在各自的首轮touchdownpcr反应体系中的终浓度均可为0.5-1μm;所述短双链突变引物文库在首轮touchdownpcr反应体系中的终浓度大于等于0.05-0.1μm(即≥单侧引物用量1/10,单侧引物即为所述全长上游引物或所述全长下游引物)。

在本发明的一个实施例中,所述全长上游引物和所述全长下游引物在各自的touchdownpcr反应体系中的终浓度均具体为0.5μm;所述短双链突变引物文库在touchdownpcr反应体系中的终浓度具体为0.5-1μm。

更进一步地,首轮pcr(即touchdownpcr)使用20μl反应体系,单侧全长引物(即为所述全长上游引物或所述全长下游引物)用量为终浓度0.5-1μm;步骤(3)回收的短双链突变引物文库用量可在100-300ng之间,为尽量减少最终产物中野生型(即步骤(1)中的目标片段dna)的比例,需保证突变引物足量(≥单侧引物用量1/10),可通过调整突变引物(即所述短双链突变引物文库)用量实现对最终产物突变密度的控制。

进一步地,步骤(4)中,所述touchdownpcr的退火温度可由65℃以0.3℃/循环的速度递减,总计30-35个循环(touchdownpcr共进行2轮,第一轮20-25个循环,第二轮10个循环,总计30-35个循环),退火温度降至54.5-56℃。

步骤(4)中所述单侧全长引物(即为所述全长上游引物或所述全长下游引物)分别与所述短双链突变引物文库进行20-25个循环扩增后,混合2个体系可提高含有突变的全长产物比例,可降低步骤(5)中与酶切后载体进行多片段组装过程的难度。相同突变引物(即所述短双链突变引物文库)用量条件下,调整第一轮pcr循环数,也可对最终产物突变密度产生影响。

进一步地,所述方法在步骤(4)之后,还可包括如下步骤(5);

(5)将所述终产物组装入高拷贝数质粒,转化大肠杆菌感受态细胞,根据文库大小进行突变体建库,对构建好的文库进行功能表型筛选;然后抽提质粒,扩增靶标片段并进行高通量测序分析。

在本发明的一个实施例中,所述高拷贝数质粒具体是使用peasyblunt载体改造,质粒自带氨苄和卡那抗性,其复制子为pbr322高拷贝数复制子,在组成型表达的lac启动子后添加bamhi/avrii酶切位点。更加具体的,所述高拷贝数质粒为向peasyblunt载体的平末端连接seqidno.4所示dna片段后得到的重组质粒。

步骤(4)中扩增的单侧全长引物(即为所述全长上游引物或所述全长下游引物)两侧添加与载体骨架酶切位点两端同源序列25bp,可使用neb的gibsonassemblykit将步骤(4)中的pcr回收产物克隆入载体。完成组装后的体系化转入transgene的transt1化转感受态细胞,氨苄抗性涂lb平板,37℃培养过夜,次日回收平板克隆直接进行表型筛选或抽提质粒以待转入新的筛选体系进行表达。

步骤(5)中,以下具体实施例中所述的gfp荧光蛋白突变建库属于建库后直接进行表型分选的类型,回收建库后的所有克隆进行质粒抽提。因二代测序有效片段读取长度限制,需对突变文库全长序列进行分段扩增,每段产物控制在260bp以内,设计相邻两段扩增片段之间有部分重叠,以修正测序过程序列边缘读取数据质量较差对结果分析造成的影响。

进一步地,所述方法还可包括通过调节反应条件从而实现对突变频率进行控制的步骤;

所述调节反应条件为如下任一:

(a1)在步骤(4)中,调节所述短双链突变引物文库在所述首轮touchdownpcr的反应体系中的用量;

(a2)在步骤(4)中,在所述短双链突变引物文库在两个所述首轮touchdownpcr的反应体系中的用量相同的条件下,调整所述首轮touchdownpcr的循环数。

第二方面,本发明要求保护前文所述方法(即高通量对目标片段dna多位点引入突变的方法)在如下任一中的应用:

(b1)构建突变体文库;

(b2)在高通量筛选目标功能蛋白;

(b3)高通量筛选目标核酸改造体。

本发明提供的是一种基于重叠延伸pcr,高通量对目标基因片段多位点高效引入突变的方法;所用引物不是简并引物,而是准确设计目标突变序列的突变引物;突变位点长度不限于单个氨基酸,可设计为连续1-5个氨基酸;引物非单条分开合成,而是由寡核苷酸合成仪在集成芯片上批量合成,引物种类量级可达104-105种类/批次;本发明所述突变方法可通过调节反应条件在一定程度上实现对突变频率的控制;本发明所述突变建库方法可获得较高比例的有效突变体,建库突变体阳性率(非同义氨基酸突变)可达~80%,可以有效避免随机突变建库引入的大量冗余,降低了建库工作量及筛选难度;突变引物由寡核苷酸芯片高通量合成,可快速、低成本地获得较高量级的突变体文库,进而经过后续高通量筛选成为获得理想蛋白质及核酸改造体的有力工具。

附图说明

图1为芯片合成突变引物文库序列设计及短双链突变引物制备流程。

图2为通量突变建库流程图和调整实验条件控制产物突变密度的结果统计图。其中,a为高通量突变建库流程;b为调整实验条件控制产物突变密度的结果统计图。

图3为gfp突变体建库二代测序分析结果统计图。其中,a为sfgfp突变文库分段(1-4)二代测序结果分析每条突变产物引入非同义氨基酸突变数量分布情况;b为sfgfp全长237个氨基酸每个位点的非同义氨基酸突变种类统计结果;c为分析sfgfp全长237个氨基酸位点每个位点总突变频率(所有种类非同义氨基酸突变汇总)统计结果;d为特定种类非同义氨基酸突变频率(全部237个氨基酸位点结果汇总)统计结果;e为分析每个氨基酸位点不同种类氨基酸突变频率分布情况(热图)。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

下述实施例中所使用的寡核苷酸芯片合成仪b3oligoarraysynthesizer及oligopool合成芯片均从customarray公司购置,实验室自行进行寡核苷酸文库序列设计及芯片合成。

实施例1、构建gfp全氨基酸饱和突变体文库

本实施例以构建gfp全氨基酸饱和突变体文库来验证本发明所述突变方法的有效性。

1、目标基因序列选取、全氨基酸位点饱和突变引物及相应寡核苷酸芯片合成序列设计。

(1)待突变基因模板序列选取为sfgfp(238aa,其基因序列如seqidno.1所示),与gfp(aequoreavictoria(jellyfish))氨基酸序列比较存在13处氨基酸替换(s2r、s30r、y39n、f64l、s65t、s72a、f99s、n105t、y145f、m153t、v163a、i171v、a206v),在未改变光谱的前提下,提高了gfp荧光强度及蛋白稳定性。

(2)选取目标突变位点为除去首位atg起始密码子外的2-238位氨基酸(共计237个氨基酸突变靶位点),设计单氨基酸饱和突变引物:针对每个氨基酸位点,设计除该位点野生型氨基酸外的19种氨基酸突变的单氨基酸突变引物45nt,突变引物结构为(21nt+3nt(突变氨基酸位点)+21nt,如图1所示),237个氨基酸位点共计4503条单氨基酸突变引物。

(3)因下游酶切实验需用到bspqi(newenglandbiolabs,货号:r0712)内切酶除去用于芯片和成寡核苷酸文库扩增的公用上下游接头序列,突变引物内部需排除bspqi靶点,以避免有效突变引物序列被内切酶消化;排除bspqi作用靶点方法为:将存在bspqi靶点的突变引物序列在内切酶靶点处以同义氨基酸替换的形式破坏靶点。

(4)在设计完毕的45nt突变引物各添加17nt接头序列及8ntbspqi酶切位点分别用于寡核苷酸芯片合成后的扩增及突变引物制备过程接头序列的消除(序列结构设计如图1所示)。

最终设计的对应于4503条单氨基酸突变引物的4503条单链寡核苷酸片段的序列全长95nt:由上游接头序列(17nt),正向bspqi酶切位点(8nt),突变引物45nt(中心3-15nt为突变序列,两侧15-21nt为与突变位点两侧同源序列),反向bspqi酶切位点(8nt),下游接头序列(17nt)共计5部分组成;所述上游接头序列17nt为seqidno.2;所述bspqi正向酶切位点及补充1nt碱基为“gctcttca”;所述突变引物45nt(共计4503条如表1所示);所述bspqi反向酶切位点及补充1nt碱基为“tgaagagc”;所述下游接头序列17nt为seqidno.3。

2、customarrayoligoarraysynthesizerdna合成仪合成单链寡核苷酸片段并固定在用于制备芯片的固相载体上,合成结束后,使用脱保护试剂溶解芯片上用来固定寡核苷酸链的高分子聚合物涂层,使合成的所述单链寡核苷酸片段从所述固相载体上脱离下来,获得包含突变引物序列的混合了4503种突变引物的ssdna文库,合成产物溶于200μl1×tebuffer。

3、对步骤2所得ssdna文库使用两端公用的上下游接头序列作为引物进行pcr扩增,获得足量pcr产物后酶切处理清除突变引物两侧接头序列,获得可用于下游突变pcr的短双链突变引物(45bp)(如图1所示)。

(1)ssdna突变引物文库扩增(95bp)

以芯片合成的单链寡核苷酸文库为模板,使用kapalibraryamplifcationkit(kapabiosystems,货号kk2612,pcrmixonly)对公用接头序列部分设计引物进行突变引物文库扩增,共两轮pcr扩增:

第一轮pcr扩增体系(20μl体系):1μl单链寡核苷酸文库为模板,上下游引物终浓度均为0.5μm,10μlkapahifipcr2×mix,剩余体积ddh2o补齐。pcr扩增条件:98℃45s预变性;98℃15s,53℃20s,72℃30s,10个热循环;72℃2min终延伸。

第二轮pcr扩增体系:引物及pcr反应试剂同首轮pcr一致,取第一轮pcr每管(20μl)10个循环产物1/8(2.5μl)为第二轮pcr模板(即相当于第一轮pcr产物稀释8倍后作为第二轮pcr的模板)。第二轮pcr扩增条件与第一轮相同。

取3-5μl第二轮pcr产物1.5%凝胶电泳鉴定条带清晰且单一,余下8管pcr产物不经电泳,添加pcr反应体系3倍体积溶胶液及等体积异丙醇,使用qiaquick胶回收试剂盒(qiagen,货号:28704)回收95bppcr产物。

(2)bspqi酶切消除突变引物两侧接头序列:酶切反应体系(20μl体系):步骤(1)回收的95bp突变文库pcr产物500-800ng,2μl10×nebbuffer3.1,1μlbspqi内切酶(10u),剩余体积ddh2o补齐。酶切反应条件:50℃1h,80℃20min。酶切消化产物使用qiaquick胶回收试剂盒回收,获得暴露出可用于下游pcr的突变引物(45bp)。

4、基于重叠延伸的高通量突变pcr(如图2中a所示):

两轮pcr:

第一轮pcr分2组,目标片段单侧全长引物分别与突变引物文库组合:pcr反应体系(20μl):sfgfpwt未突变线性片段1μl(5ng)为模板,目标片段全长上(下)游引物sfgfp-ful-f(r)终浓度0.5μm,步骤3(2)回收的45bp突变引物文库100-300ng(终浓度0.5-1μm),10μlkapahifipcr2×mix,剩余体积ddh2o补齐。第一轮pcr反应条件(touchdownpcr):98℃45s预变性;98℃15s,(初始退火温度65℃,-0.3℃/循环)30s,72℃30s,20-25个热循环;72℃2min终延伸。第一轮pcr结束后,混合2组第一轮pcr产物,直接进行第二轮pcr(touchdownpcr),二轮pcr反应条件:98℃45s预变性;98℃15s,(初始退火温度为第一轮pcr结束后降至的退火温度,-0.3℃/循环)20s,72℃30s,10个热循环;72℃2min终延伸。第二轮pcr产物(包含引入突变位点的全长/部分目标基因片段)使用qiaquick胶回收试剂盒回收。

5、使用nebuilder高保真dna组装克隆试剂盒(newenglandbiolabs,货号:e5520),将步骤4回收的突变pcr产物片段克隆入经bamhi-hf(newenglandbiolabs,货号:r3136)+avrii(newenglandbiolabs,货号:r0174)双酶切线性化的改造载体peasyblunt-b+a(初始载体为peasyblunt:transgen,货号:cb111-01),组装反应体系(10μl):突变pcr产物120-150ng(3μl),peasyblunt-b+a线性化载体骨架50ng(2μl),nebuilder2×mix5μl。组装反应条件:50℃45min。

其中,改造peasyblunt载体制备获得peasyblunt-b+a载体具体如下:向peasyblunt载体的平末端连接5’端携带bamhi,3’端携带avrii的野生型sfgfp片段,插入片段序列如seqidno.4所示,获得该目的片段所用pcr模板如seqidno.1所示,pcr引物序列如seqidno.5和seqidno.6所示。经测序正确插入目标片段的载体命名为peasyblunt-b+a,作为骨架载体用于下游突变建库。

6、取步骤5组装产物3μl转化trans1-t1phageresistant大肠杆菌化学感受态细胞100μl(transgen,货号:cd501),冰浴30min,42℃热激45s,冰浴5min,添加700μllb37℃摇床复苏1h,6000r/min1min离心去除上清,余下100μl菌体混匀涂氨苄青霉素抗性lb平板,37℃培养箱倒置培养过夜。建库前预实验首先对单板(n=4)克隆进行单克隆(n=96)目标片段sfgfp全长720bp一代测序鉴定:突变插入阳性率为~75%-100%,单条片段引入突变密度可通过调节突变pcr实验条件进行一定程度控制,可获得平均3.5-9.2个氨基酸突变/720bp的突变密度,具体实验条件调整对应的突变密度梯度变化结果如图2中b所示:调整突变pcr反应体系中突变引物的用量及第一轮扩增的循环数,可以实现对产物突变密度的调节:125ng突变引物+第一轮扩增20个循环可实现产物中突变密度为平均3.5/720bp;250ng突变引物+第一轮扩增25个循环可实现产物中突变密度为平均9.2/720bp。

本实施例中为构建突变产物文库,转化60个lb平板,统计生长克隆数为~4200/板,总计~2.5×105克隆。

7、收集60个平板全部克隆,使用大型/大量质粒提取试剂盒(biomed,货号:dp109)抽提全部插入突变产物的质粒。

8、二代测序分析突变建库结果:因受二代测序有效片段读取长度限制,需对突变文库全长序列进行分段扩增,每段产物控制在260bp以内,设计相邻两段扩增片段之间有部分重叠,以修正测序过程序列边缘读取数据质量较差对结果分析造成的影响。sfgfp突变文库分段扩增设计如图3中a所示,4段扩增产物长度分别为:256/243/248/229bp;除去公用扩增引物后有效分析片段长度如图3中a白色分段标注所示为:201/204/204/174bp,覆盖了除去起始密码子atg与终止密码子tga外的sfgfp基因全长237个氨基酸。

二代测序分析该方法sfgfp突变建库结果如下:

(1)sfgfp分段测序结果分析每条突变pcr产物氨基酸突变引入数量分布情况:如图3中a所示:f1/f2/f3/f4四片段每条产物突变引入数量基本呈现正态分布,平均引入氨基酸突变数量分别为:2.46/1.69/1.14/1.51,换算至sfgfp片段全长即为~6.8个氨基酸位点突变/720bp。

(2)分析sfgfp全长237个氨基酸每个位点的非同义氨基酸突变频率及种类:如图3中b所示:sfgfp全长237个氨基酸位点其中236个位点非同义氨基酸突变种类达到19,即实现了除野生型原始氨基酸外其他19种氨基酸全部覆盖的点饱和突变,整体单氨基酸突变种类覆盖度达到设计预期的99.91%(4499/4503)。

(3)分析sfgfp全长237个氨基酸位点每个位点总突变频率(所有非同义氨基酸突变总和)统计如图3中c所示:可见各氨基酸位点突变频率虽然稍有波动,但总体趋于一致,突变未见明显位置偏好性,每个氨基酸位点平均突变频率为~2.4%。

(4)分析某种特定种类氨基酸在全部227个氨基酸位点的突变频率汇总,如图3中d所示,在本突变建库方法中,20种氨基酸作为非同义氨基酸突变目标没有明显的偏好性,整体分布情况趋于平均。

(5)分析每个氨基酸位点不同种类氨基酸突变频率分布情况:热图如图3中e所示,纵轴为突变氨基酸位点(2-238),横轴为19种非同义突变氨基酸,图中数值代表某个位置氨基酸突变成某一种氨基酸的突变频率(0-1),蓝色越深表示突变频率越接近0,红色越深表示突变频率越接近1,白色部分颜色越浅表示突变频率越接近平均突变频率。每一行表示饱和突变位置都会出现一个0,代表本位置的野生型氨基酸;如图3中e所示,最终突变建库产物中引入非同一氨基酸突变的效率在各个位点差异不显著,无明显的序列区域或位置偏好性(热图纵向颜色分布无明显的红/蓝集中区域,整体趋于一致)。

综合图3中a-e的分析结果,可表明本建库方法获得的突变体文库可在目标片段全长范围内多位点同时引入精确碱基的突变、引入的突变在全长范围内分布较为均匀、引入非同一氨基酸突变种类覆盖度较高、且引入的突变种类及在序列全长各个位置均无显著偏好性,建库结果整体基本呈现全部氨基酸位置、各种突变类型的均匀分布。

综上所述,本发明是一种基于重叠延伸pcr,使用精确设计的寡核苷酸芯片高通量合成的突变引物文库快速、高效地向目标基因片段多位点同时引入突变的技术。该突变建库方法采用精确设计的突变引物,可以实现多点连续氨基酸(1-5aa)的突变,且可以通过调节反应条件在一定程度上实现对突变频率的控制,建库突变阳性率(非同义氨基酸突变)可达~80%,可以有效避免随机突变建库引入的大量冗余,降低了建库工作量及筛选难度;突变引物由寡核苷酸芯片高通量合成,可快速、低成本地获得较高量级的突变体文库,进而经过后续高通量筛选成为获得理想蛋白质及核酸改造体的有力工具。

表1sfgfp全长237个氨基酸位置饱和突变引物序列设计

<110>北京大学

<120>一种高通量dna多位点精确碱基突变方法

<130>gncln180782

<160>6

<170>patentinversion3.5

<210>1

<211>720

<212>dna

<213>artificialsequence

<400>1

atgcgtaaaggcgaggagctgttcactggtgtcgtccctattctggtggaactggatggt60

gatgtcaacggtcataagttttccgtgcgtggcgagggtgaaggtgacgcaactaatggt120

aaactgacgctgaagttcatctgtactactggtaaactgccggtaccttggccgactctg180

gtaacgacgctgacttatggtgttcagtgctttgctcgttatccggaccatatgaagcag240

catgacttcttcaagtccgccatgccggaaggctatgtgcaggaacgcacgatttccttt300

aaggatgacggcacgtacaaaacgcgtgcggaagtgaaatttgaaggcgataccctggta360

aaccgcattgagctgaaaggcattgactttaaagaagacggcaatatcctgggccataag420

ctggaatacaattttaacagccacaatgtttacatcaccgccgataaacaaaaaaatggc480

attaaagcgaattttaaaattcgccacaacgtggaggatggcagcgtgcagctggctgat540

cactaccagcaaaacactccaatcggtgatggtcctgttctgctgccagacaatcactat600

ctgagcacgcaaagcgttctgtctaaagatccgaacgagaaacgcgatcatatggttctg660

ctggagttcgtaaccgcagcgggcatcacgcatggtatggatgaactgtacaaatgataa720

<210>2

<211>17

<212>dna

<213>artificialsequence

<400>2

ccaatacggatgacggg17

<210>3

<211>17

<212>dna

<213>artificialsequence

<400>3

cctctgttattgccgcc17

<210>4

<211>763

<212>dna

<213>artificialsequence

<400>4

caccatcatcaccacagccaggatccatgcgtaaaggcgaagagctgttcactggtgtcg60

tccctattctggtggaactggatggtgatgtcaacggtcataagttttccgtgcgtggcg120

agggtgaaggtgacgcaactaatggtaaactgacgctgaagttcatctgtactactggta180

aactgccggtaccttggccgactctggtaacgacgctgacttatggtgttcagtgctttg240

ctcgttatccggaccatatgaagcagcatgacttcttcaagtccgccatgccggaaggct300

atgtgcaggaacgcacgatttcctttaaggatgacggcacgtacaaaacgcgtgcggaag360

tgaaatttgaaggcgataccctggtaaaccgcattgagctgaaaggcattgactttaaag420

aagacggcaatatcctgggccataagctggaatacaattttaacagccacaatgtttaca480

tcaccgccgataaacaaaaaaatggcattaaagcgaattttaaaattcgccacaacgtgg540

aggatggcagcgtgcagctggctgatcactaccagcaaaacactccaatcggtgatggtc600

ctgttctgctgccagacaatcactatctgagcacgcaaagcgttctgtctaaagatccga660

acgagaaacgcgatcatatggttctgctggagttcgtaaccgcagcgggcatcacgcatg720

gtatggatgaactgtacaaatgataacctaggctgctgccacc763

<210>5

<211>45

<212>dna

<213>artificialsequence

<400>5

caccatcatcaccacagccaggatccatgcgtaaaggcgaagagc45

<210>6

<211>39

<212>dna

<213>artificialsequence

<400>6

ggtggcagcagcctaggttatcatttgtacagttcatcc39

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1