在20世纪20年代和20世纪30年代期间,产生溶剂的梭菌首次用于丙酮、丁醇和乙醇的工业生产。在20世纪50年代期间,用来合成这些溶剂的更有效的石化技术的建立导致这样的大规模细菌发酵的放弃。然而,在当前环境中,随着利用可持续和可再生过程来进行化学品开发的压力越来越大,正重新开始对用于溶剂的生产的梭菌发酵感兴趣。这还受到对这些产溶剂(solventogenic)梭菌的生物理解的进步的帮助,其中借助于若干基因组的测序以及RNA测序和转录组学的应用。这些研究领域已打开了工程设计新菌株的可能性,其中上述新菌株能够过度产生丁醇,或除去竞争的副产物的生产,从而进一步提高产溶剂发酵的经济性。
为了利用基因组信息的这种流入,仍然需要用于产生商业相关的重组梭菌菌株和其它细菌菌株的快速和可靠的方法。
传统上很难产生重组梭菌菌株。低转化效率连同低重组效率一起已阻碍了制作稳定的表现出改善的溶剂相关表型的重组菌株的努力。在过去的几年中,已经开发了这样的技术,通过使用II型内含子,例如Targetron(Sigma)和Clostron(例如WO 2007/148091),其允许基因的插入失活,以及通过使用‘等位基因偶联交换’(ACE,例如WO 2009/101400),其允许新途径基因的整合,但多个突变的引入是困难的并且关于特定碱基变化(单核苷酸多态性,SNP)的引入做了很少工作。目前的技术并非足够好到能常规地实现这些目标中的任何一个目标。
对梭菌遗传系统的早期工作导致携带单交换的菌株来生成在特定基因中携带突变的菌株,但这些都不准确,它们是遗传不稳定的并在细胞中留下质粒和抗生素标记基因。它们还可能潜在地具有极性效应(例如,它们可能影响其它基因),尤其是如果靶向的基因是操纵子基因。
可以通过用线性DNA进行的转化来制作例如大肠杆菌的重组菌株(但需要的重组仅在重组菌株例如大肠杆菌HME63中才有效地工作,如由Jiang et al.2013,下文,使用的)或自杀载体(suicide vector),但在梭菌中,这些方法是不适用的,因为低重组频率并不允许在从细胞丢失DNA以前发生重组事件。为了克服此问题,许多方法采用稳定的复制载体,但是之后这些载体,在重组事件以后,必须从细胞丢失,否则抗生素和其它标记基因会被留下来,从而阻止进一步的操作。通过使用温度敏感复制子;假自杀载体(这些载体携带起点,其表现出不稳定分离并且可能最终从群体丢失)(例如Heap et al.,J.Microbiol.Methods,78(1),79-85.2009);将限制酶位点引入重组载体;以及在诱导型启动子下克隆限制性内切核酸酶(或使用限制性内切核酸酶的基因组拷贝),可能会丢失质粒。可替换地,在整合以后,FLP/FRT重组酶可以用来除去质粒的选择性标记和其它选择区(例如WO 2008/040387)。然而,这些方法会添加额外的步骤并增加系统的复杂性。
若干出版物已经证明,在梭菌中,通过抗生素抗性盒(例如Clostron)的插入或框内使用同源重组所引起的特定基因的缺失与反选择偶合。这取决于位于在染色体(例如pyrE)上的反选择基因同源物或异质引入的反选择基因同源物(例如来自大肠杆菌的codA)。至今,存在很少的梭菌菌株被工程设计以携带特定SNP的证据。对于艰难梭菌(C.difficile),已经做了一些工作(例如Cartman et al.,Appl.Environ.Micro.(2012)Jul;78(13):4683-90),但反选择标记的使用导致需要标记基因同源物被克隆到质粒,使用化学品的选择,如果细胞仍然携带上述基因同源物,则其是有毒的(即为双交换事件而选择),以及然后筛查所期望的基因变化,因为上述方法并不区分WT(野生型)回复体和掺入突变的细胞。如果获得的重组菌株仍然携带PyrE缺失,那么必须采取附加步骤来修复菌株。
一些反选择方法需要在可以使用上述方法(例如ACE)以前产生缺失菌株,并且通过使用毒性类似物作为反选择,存在引入另外的不需要的突变的风险。例如,pyrE突变体经常用来生成重组菌。这些突变体能够在5-氟乳清酸(5-FOA)上面生长,而具有野生型pyrE基因的细胞则将5-FOA转化成有毒类似物,从而引起细胞死亡。然而,pyrE是尿嘧啶生物合成途径的一部分,所以这些突变体还需要将尿嘧啶加入培养基以进行生长。干扰核苷酸生物合成途径如这些途径还可能具有意想不到的和不必要的另外的效应。
对于研究目的,RNA敲除和干扰方法可以是有用的,但是不适合于构建商业溶剂原梭菌菌株。转座子诱变还是用于产生重组菌株的有价值的工具,但,如同化学诱变一样,不能被靶向特定基因组位置,从而使它成为有价值的研究工具而不是用于构建工业相关梭菌菌株的可行方法。
可能会用来制作精确基因组变化的新方法是转录激活子样内切核酸酶(TALEN,例如US 8,420,782B2),但已经开发了用于编辑真核基因组的技术并且尚未特别适用于工业相关的溶剂原梭菌菌株。为每个基因靶来工程设计TALEN的需要是昂贵和耗时的,并且在梭菌中上述技术将精确地如何工作的实用性均不利于它在不远的将来变成广泛使用的工具。
因此仍然需要用于基因操作的通用方法,其将克服当使用当前可用的用于梭菌的工具时所遇到的多重挑战,即:低转化频率,低重组效率,不能相对于WT回复体来选择基因替代菌株,不需要的极性效应,当使用用于反选择步骤的毒性类似物时可能发生的不需要的附加突变(以及对于这些方法中的一些,需要使用缺失菌株而不是WT),难以制作多层突变,以及需要确保在双交换事件以后重组载体的丧失。
因此已开发了新方法,其是基于使用梭菌CRISPR/Cas系统。(CRISPR是成簇的规则间隔的短回文重复序列的首字母缩略词)。这些系统通常被描述为‘原核适应性免疫系统’,并且是借其细菌或古细菌细胞可以保护自身免受入侵DNA影响的方式,通常为噬菌体或质粒DNA。
具有CRISPR/Cas系统的细胞能够选择性地将来自‘入侵’DNA的短片段整合进入Cas基因簇。每个片段被称为‘间隔区’并且由同向重复序列(直接重复、正向重复,direct repeat)所侧接。如果细胞再次遭遇相同的入侵DNA,它将识别它为敌对物并会通过用Cas内切核酸酶对它进行切割以破坏它。
在入侵DNA中CRISPR/Cas系统识别的序列被称为‘原间隔区’并且具有与在基因组中的间隔区拷贝的同一性。为了确保细胞不会意外攻击间隔区的基因组拷贝,在Cas I或Cas II系统中的原间隔区必须具有与它相关的短序列,称为PAM序列。PAM序列可以是在原间隔区序列的上游或下游,其取决于系统的类型。如果它不存在或以任何方式被突变,则入侵DNA将不再由细胞所识别并且它不会被破坏。
与来自酿脓链球菌(Streptococcus pyogenes)的cas9相关的PAM序列是众所周知的(Jiang et al.,Nature Biotech.(March 2013),vol.31,no.3,pp.233-239);然而,先前还没有确定与梭菌系统相关的PAM序列。
不是所有原核生物都具有CRISPR/Cas基因同源物以及其中它们确实属于几个不同的类别(Makarova et al.,Nat.Rev.Microbiol.,9(6),467-77.2011)。关于来自酿脓链球菌和肺炎链球菌(Streptococcus pneumoniae)的II型cas 9系统,已发表了大量的工作(例如Jiang et al.,Nature Biotech.(March 2013),vol.31,no.3,pp.233-239)。这已经发展成为用于真核细胞的基因组-编辑工具,其已成功用于例如酵母(DiCarlo et al.,Nucleic Acids Research,41(7),4336-4343,2013)、斑马鱼(Hwang et al.,Nat.Biotechnol.,31(3),227-9.2013)和哺乳动物细胞(Ran et al.,Nature Protocols,8,2281-2308,2013)。
已开发了很多优良的分子工具,用于充分研究的细菌如大肠杆菌。这些工具包括一系列不同的质粒和高效转化以及重组技术。然而,这些工具的许多工具并不适用于细菌如梭菌。例如,Soucaille et al.(US 2012/0190116)注意到,在大肠杆菌中使用的基于采用线性DNA的经典技术在梭菌中是不可行的,这是由于线性片段的短的细胞内和细胞外半衰期、通过梭菌DNA酶和DNA限制性内切核酸酶的降解。
来自Tracy&Papoutsakis的专利申请(例如US 2012/0301964 A1、和US 2014/0141516 A1)说明了,Rocha等人的基本的同源重组机制的比较基因组学研究(PLoS Genet.,2005.1(2):p.e15)表明,梭菌缺乏任何明显的解离酶基因来催化在重组中间体的异源双链之间的分子内解离反应。为了克服此问题,通过在丙酮丁醇梭菌(Clostridium acetobutylicum)中表达来自枯草芽孢杆菌(B.subtilis)的recU基因对它们添加非内源性解离酶活性。然而,重组生成菌株(recombinogenic strains)是基因不稳定的,因而不适用于未来商业用途。
现已开发了新方法,其使得能够在细菌基因组中以快速和有效的方式来生产所期望的突变,而无需对细菌补充酶,以增强重组效率。在此方法中,低转化和重组效率变得基本不相关的。通过将“杀伤载体(killing vector)”引导到未突变的靶序列,可以靶向和杀死携带未突变序列的细胞,从而确保,仅回收的细胞是那些携带所期望的突变的细胞,进而不需要筛选。因为这是非常精确的过程,所以可以消除极性效应(利用更粗略的方法,其经常被看到)。另外,不需要反选择标记,因而无需使用缺失菌株并消除了通过使用用于选择的毒性类似物而无意中产生不需要的突变的可能性。
在此新方法中,DNA变化是永久和稳定的,以及转化载体的除去(或丧失)意味着可以容易地做出多层突变。上述方法还有利于每次靶向多于一种的基因或DNA元件,从而允许一次进行若干基因修饰。
因而,在一种实施方式中,本发明提供了用于在细菌基因组内的预期诱变区(IMR,intended mutagenesis region)中产生突变的方法,其中细菌包含CRISPR/Cas系统,以及其中IMR包含CRISPR PAM/原间隔区,其能够由细菌的CRISPR/Cas系统所识别,上述方法包括以下步骤:
(a)用重组载体来转化所述细菌的群体,其中重组载体包含重组元件,其中重组元件包含:
(i)替换元件(substitution element),其中替换元件包含突变,以及
(ii)同源臂,其侧接替换元件,其中同源臂能够促进在细菌基因组中用包含替换元件的元件替代所有或部分的IMR,
其中重组元件不包含CRISPR PAM/原间隔区,其能够由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM/原间隔区;
(b)在其中在群体内的一种或多种细菌中,在那些细菌的基因组中IMR的所有或部分由包含替换元件的元件替代的条件下,培养细菌的群体,并由此从在那些细菌的基因组的IMR除去CRISPR PAM/原间隔区,或使得CRISPR PAM/原间隔区不能由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM/原间隔区;
(c)用杀伤载体来转化细菌的群体,其中上述杀伤载体能够引导生产crRNA,其靶向在群体(还未从其除去CRISPR PAM/原间隔区或使得不能够由crRNA所识别)中的任何细菌的IMR中的CRISPR PAM/原间隔区,从而促进那些CRISPR PAM/原间隔区的CAS内切核酸酶诱导的切割,其中上述CRISPR PAM/原间隔区由crRNA所识别,以及那些细菌的随后死亡;以及
(d)从群体选择或分离一种或多种细菌,其基因组包含含有突变的替换元件。
IMR(预期诱变区)是在细菌基因组(在其内旨在进行所期望的突变)中的DNA序列。
在本发明的一些实施方式中,IMR对应于在细菌基因组中的区,其5'-端对应于重组元件的5'-同源臂的上游端以及其3'-端对应于重组元件的3'-同源臂的下游端。
如在本文中所使用的,术语“细菌基因组”或“基因组DNA”主要指环状细菌染色体,但该术语还可以包括内源性质粒(例如梭菌巨大质粒,或较小的内源性质粒),其对于细菌的生存力是至关重要的,可选地在某些条件下,或在确定的条件下其可以被选择。例如,这些内源性质粒可以赋予在否则有毒物质(例如抗生素或重金属)或竞争的微生物的存在下生长的能力,或利用特定的基质来生长的能力。在本发明的其中待突变的细菌基因组或基因组DNA是这样的内源性质粒的实施方式中,上述方法可选地包括以下步骤:在为质粒的存在所选择的条件下,培养细菌的群体。
在细菌的群体中的细菌必须具有CRISPR/Cas系统。这种CRISPR/Cas系统将是这样一种系统,其能够切割在群体内的细菌的基因组,当用杀伤载体来转化那些细菌时,其仍然包含PAM/原间隔区。
将被接受的是,在一些情况下,在细菌群体内,可以存在污染。如在本文中所使用的,术语"细菌的群体"主要指这样的细菌,其期望用重组载体和杀伤载体加以转化。
优选地,CRISPR/Cas系统是I型CRISPR/Cas系统。
在群体中的细菌可以具有内源性CRISPR/Cas系统或CRISPR/Cas系统可以是异源的。例如,异源性CRISPR/Cas系统可以是基于质粒的系统。
优选地,CRISPR/Cas系统是内源性CRISPR/Cas系统,即它存在于野生型细菌中。在本发明的一些实施方式中,CRISPR/Cas系统不是基于质粒的系统。
在群体中的细菌,可以,例如,是革兰氏阳性或革兰氏阴性细菌。优选地,细菌是革兰氏阳性细菌。
在一些实施方式中,细菌是孢子形成细菌。在其它实施方式中,细菌是糖分解细菌(解糖细菌,saccharolytic bacteria)。细菌可以是需氧或厌氧细菌。优选地,细菌是厌氧菌。细菌可以是嗜热菌。
在还有的其它实施方式中,细菌能够将基质转化成RCOOH,例如,转化成乙酸酯和/或丁酸酯。在这种情况下,R是脂族C1-C5,优选C1-3,烷基或烯基。细菌还可以能够将RCOOH转化成溶剂,优选转化成丙酮、乙醇和/或丁醇的一种或多种。
在其它实施方式中,细菌是溶剂产生细菌。如在本文中所使用的,术语"溶剂产生"意思是,细菌是那些细菌,其能够产生溶剂,优选溶剂如丙酮、乙醇、丙醇和/或丁醇。在某些特别优选的实施方式中,细菌能够产生乙醇、丙酮和丁醇。优选地,细菌是丁醇产生细菌或丁醇耐受细菌。
在一些优选实施方式中,细菌属于梭菌属(Clostridium)。优选的梭菌属包括丙酮丁醇梭菌(C.acetobutylicum)、C.arbusti、金黄丁酸梭菌(C.aurantibutyricum)、拜氏梭菌(C.beijerinckii)、噬纤维梭菌(C.cellulovorans)、解纤维梭菌(C.cellulolyticum)、热纤维梭菌(C.thermocellum)、热丁酸梭菌(C.thermobutyricum)、巴氏梭菌(C.pasteurianum)、克氏梭菌(C.kluyveri)、诺氏梭菌(C.novyi)、糖丁酸梭菌(C.saccharobutylicum)、产琥珀酸梭菌(C.thermosuccinogenes)、热棕榈梭菌(C.thermopalmarium)、解糖梭菌(C.saccharolyticum)、糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)、酪丁酸梭菌(C.tyrobutyricum)、假破伤风梭菌(C.tetanomorphum)、大梭菌(C.magnum)、杨氏梭菌(C.ljungdahlii)、产乙醇梭菌(C.autoethanogenum)、丁酸梭菌(C.butyricum)、紫色梭菌(C.puniceum)、C.diolis、同型丙酸梭菌(C.homopropionicum)和玫瑰色梭菌(C.roseum)。
在本发明的一些优选实施方式中,细菌是糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)菌株N1,例如N1-4。在本发明的其它实施方式中,细菌是糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)。在本发明的还有其它实施方式中,宿主细胞是糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-504。
在其它优选实施方式中,细菌是巴氏梭菌(例如DSM 525)、酪丁酸梭菌(例如ATCC 52755)、或拜氏梭菌(例如NCP 258和NCP 262)或梭菌属DL-VIII。
在其它优选实施方式中,细菌来自芽孢杆菌属(杆菌属,Bacillus)。在其它优选实施方式中,细菌来自放线菌目(Actinomycetales)。
在本发明的一些实施方式中,细菌是非高度重组生成细菌(recombinogenic bacterium)。如在本文中所使用的,“非高度重组生成”细菌是这样的细菌,其中,相比于在“高度重组生成”菌株中的重组,用来诱导重组的标准重组技术是低效的。各种方法已用来测量和比较在细菌的不同种之间的同源重组率(HRR)。在Vos和Didelot(2009)(“A comparison of homologous recombination rates inbacteria and archaea,”The ISME Journal 3,199–208;通过引用方式结合于本文)中,提供了有用的表格和讨论。依据相对于点突变(r/m)比率的重组,Vos和Didelot排列物种;这可以解释为在物种中HRR的一般指示。尤其是,r/m值被定义为,由于相对于点突变的重组的结果,核苷酸变化的比率。它可以估计自Maiden et al.(PNAS(USA)95:3140-3145(1998)的多位点序列分型(MLST,Multi Locus Sequence Typing)方法,其以引用方式结合于本文),其中利用ClonalFrame计算机程序包(Didelot and Falush(2007),Genetics 175:1251-1266;其以引用方式结合于本文)。Vos和Didelot(表1,其以引用方式具体地结合于本文)分类菌株:从嗜冷黄杆菌(Flavobacterium psychrophilum)到空肠弯曲杆菌(Campylobacter jejuni),作为具有‘非常高或高’同源重组率(即r/m值高于2)。在本发明的优选实施方式中,细菌不是高度重组生成型,即,细菌具有中间、低或非常低的HRR,例如,细菌具有低于2的r/m值,更优选低于1(如由Vos和Didelot所定义的)。
在一些实施方式中,并不修饰细菌来增强重组生成活性。尤其是,优选不通过使用非内源性或外源性重组酶来增强细菌的重组生成活性。
在其它实施方式中,细菌优选不是链球菌属(Streptococcus)或大肠杆菌(E.coli)。
IMR包含CRISPR PAM/原间隔区,其能够由细菌的CRISPR/Cas系统所识别。
PAM/原间隔区是在细菌基因组中的序列,其包括PAM序列和原间隔区的功能组合。此PAM/原间隔区序列是一种这样的序列,其能够由待使用的CRISPR/Cas系统所识别,以及在crRNA的生产以后,它将被所选的用于降解的CRISPR/Cas系统所靶向,从而导致仍然包含功能CRISPR/PAM原间隔区的任何细菌的细胞死亡。
如在本文中所使用的,术语"功能CRISPR/PAM原间隔区"是指CRISPR PAM/原间隔区,其能够由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM/原间隔区。在一些情况下,单突变(例如在PAM序列中)可能足以使得CRISPR/PAM/原间隔区无功能。
PAM是原间隔区-相邻基序的缩写词。PAM元件能够由细菌CRISPR/Cas系统所识别。PAM元件通常是3-6个核苷酸长并且对于每个细菌种类是特异的。
PAM元件相对于在细菌基因组中的原间隔区的取向是重要的。在一些细菌种类中,通常在原间隔区的5'端处或接近原间隔区的5'端处发现PAM元件。在其它种类中,通常在原间隔区的3'端处或接近原间隔区的3'端处发现PAM元件。
PAM元件可以是在细菌基因组的任一链上,但选为Cas间隔元件的序列应在和PAM元件相同的DNA链上(以致PAM元件和原间隔区是直接相邻的)。
一些研究已发现,在PAM元件中的几乎任何突变均消除通过CRISPR/Cas系统的识别(例如Jiang et al.,Nature Biotech(March 2013),vol.31,no.3,pp.233-239)。除功能原间隔区之外,PAM/原间隔元件必须具有功能PAM元件。如在本文中所使用的,术语"功能PAM元件"或"CRISPR PAM元件,其在细菌中是有功能的"意思是,PAM元件能够由细菌的内源性CRISPR/Cas系统所识别,或者,如果细菌没有内源性CRISPR/Cas系统,则通过基于载体的异源性CRISPR/Cas系统,其已被引入细菌。
多于一种的序列可以能够充当在所选细菌种类中的PAM元件。例如,已知来自大肠杆菌K-12的I-E CRISPR-Cas系统具有四个功能PAM序列(Gomaa et al.(2014).mBio,5(1):e00928-13DOI:10.1128/mBio.00928-13),以及,使用在实施例2中描述的方法,已确定在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中,至少四个有效的PAM序列(CCC、CCT、CCA和CCG)。可以通过用包含CRISPR间隔区、和相邻测试PAM元件的质粒来转化具有CRISPR/Cas系统(它的内源性CRISPR/Cas系统或异源性质粒衍生系统)的细菌,来测试PAM元件在特殊细菌种类中发挥作用的能力。如果PAM元件在细菌中是有功能的,则CRISPR/Cas系统将破坏含PAM元件的质粒以及转化效率将显著减小。在本文中此概念说明于实施例2。
CRISPR原间隔区是在细菌基因组内的序列,其由crRNA所靶向(条件是,也适当定位相容的PAM元件)。
IMR包含CRISPR PAM/原间隔区。
优选地,在IMR中的CRISPR PAM/原间隔区属于对应于在重组载体中的替换元件的DNA的区。在本实施方式中,当在步骤(b)中由替换元件替代IMR时,从细菌基因组功能上除去CRISPR PAM/原间隔区。在一些实施方式中(例如其中突变是缺失),在对应于替换元件的IMR中DNA的区可能相对于替换元件有很少或没有程度的同一性。在这样的情况下,对应于在重组载体中的替换元件的DNA的区将是在IMR中的DNA的区,其由对应于同源臂的区的内端来定义。
在其它实施方式中,在IMR中的CRISPR PAM/原间隔区属于在重组载体中对应于部分的替换元件和部分的5'-同源臂的DNA的区,或在IMR中的CRISPR PAM/原间隔区属于对应于在重组载体中的5'-同源臂的DNA的区。在这些情况下,交换事件(在同源臂和在细菌基因组中的相应序列之间),其发生在IMR中的PAM/原间隔区的5'处,将导致PAM/原间隔区从细菌基因组的丧失。发生在PAM/原间隔区中的交换事件可能使得PAM/原间隔区无功能,即,不能被crRNA所靶向。因此,来自这样的交换的细菌将不会被crRNA所靶向。
在其它实施方式中,在IMR中的CRISPR PAM/原间隔区属于对应于在重组载体中的部分的替换元件和部分的3'-同源臂的DNA的区,或在IMR中的CRISPR PAM/原间隔区属于对应于在重组载体中的3'-同源臂的DNA的区。在这些情况下,交换事件(在同源臂和在细菌基因组中的相应序列之间),其发生于在IMR中的PAM/原间隔区的3',将导致PAM/原间隔区从细菌基因组的丧失。交换事件,其发生在PAM/原间隔区中,可能使得PAM/原间隔区无功能,即,不能被crRNA所靶向。因此,来自这样的交换的细菌将不会被crRNA所靶向。
本领域技术人员将理解,在同源臂和在细菌基因组中的相应序列之间的交换事件是随机事件,以及,如果PAM/原间隔区是在对应于上游同源臂(例如)的IMR中的DNA的区中,则导致用替换元件来替代IMR的交换事件可能发生于PAM/原间隔区的3'。在这种情况下,crRNA将仍然靶向PAM/原间隔区,从而导致细菌的死亡。然而,在群体内的其它细菌中,导致由替换元件来替代IMR的交换事件可能发生于PAM/原间隔区的5'。在这种情况下,PAM/原间隔区将已从细菌基因组被除去,因而细菌将不会被crRNA所靶向。因此可以看出,本发明的实施方式,其中借助于PAM/原间隔区,其属于对应于同源臂的DNA的区,仍然能够导致这样的细菌,其包含替换元件以及其并不包含PAM/原间隔区或并不包含能够由crRNA所识别的PAM/原间隔区。
优选的是,PAM/原间隔区是在对应于在重组载体中的替换元件的DNA的区域内,或尽可能接近它,以最大化以下机会:由替换元件来替代IMR还将导致从细菌基因组除去PAM/原间隔区。
因此,优选地,在IMR中的PAM/原间隔区存在于DNA的区域内,其对应于:
(i)替换元件;
(ii)在上游同源臂和替换元件之间的重叠区;
(iii)在下游同源臂和替换元件之间的重叠区;
(iv)在重组元件中的上游同源臂;或
(v)在重组元件中的下游同源臂。
更优选地,在IMR中的PAM/原间隔区存在于DNA的区域内,其对应于:
(i)替换元件;
(ii)在上游同源臂和替换元件之间的重叠区;或
(iii)在下游同源臂和替换元件之间的重叠区。
最优选地。在IMR中的PAM/原间隔区存在于DNA的区域内,其对应于替换元件。
本发明的方法的步骤(a)的目的是用重组载体来转化细菌的群体。这可以使用标准重组协议来实现以及利用适当选择标记如抗生素加以选择。
重组载体包含重组元件,其中重组元件包含替换元件和同源臂。
替换元件包含所期望的突变。
突变可以,例如,是一个或多个核苷酸的替换、缺失或插入,或一个或多个替换、缺失或插入的组合。
替换元件可能是或可能不是基于它要替换的IMR的序列。例如,替换元件可以具有和IMR基本上相同的DNA序列,但,相比于IMR的DNA序列,替换元件可以包含SNP、插入或缺失。在其他情况下,例如在期望删除IMR或用不同的DNA来替代它的情况下,替换元件可能没有任何显著程度的相对于IMR的序列同一性。
在一些实施方式中,相比于IMR的序列,突变是或包含单核苷酸多态性(SNP)。在这样的实施方式中,突变优选是在PAM/原间隔区中,以致PAM/原间隔区变成不再有功能的(即,不再由CRISPR/Cas系统所识别)。如果不是这种情况,那么突变可以是在替换元件的序列的另一部分中。
在其它实施方式中,相比于IMR的序列,突变可以包含一个或多个核苷酸的一个或多个缺失。缺失可以是在框内或不在框内。优选地,缺失包括至少部分的PAM或PAM/原间隔区,以致PAM/原间隔区变成不再有功能的(即,不再由CRISPR/Cas系统所识别)。
在还有其它实施方式中,相比于IMR的序列,突变包含一个或多个核苷酸的一个或多个插入。在一些实施方式中,插入是在PAM/原间隔区内以致PAM/原间隔区变成不再有功能的(即,不再由CRISPR/Cas系统所识别的)。插入可以是框内插入或框外插入。
在其它实施方式中,突变是插入,其替代所有或部分的PAM/原间隔区。优选地,删除或突变PAM或PAM/原间隔区,以致它是不再有功能的(即,不再由CRISPR/Cas系统所识别)。
在所期望的突变(例如SNP、插入或缺失)不影响PAM/原间隔区的情况下,那么必须在PAM/原间隔区元件中进行另外的突变,以使得它在感兴趣的细菌种类中无功能。例如,可以在PAM/原间隔区元件中进行沉默突变(如果PAM/原间隔区序列是编码序列)。
在其中所期望的突变不是在实际PAM/原间隔区中的实施方式中,优选的是,将在PAM元件和突变的位点之间的距离保持到最小。PAM元件和突变的位点分开越远,则在它们之间的空间内发生重组事件的机会越大。这可以导致携带突变PAM元件但不是野生型的细菌(对于所期望的突变)。相比于所期望的突变,突变PAM可以是高达1500bp。在PAM位点和所期望的突变之间的距离优选是100bp或更少。更优选地,在PAM元件和所期望的突变的位点之间的距离是小于50个核苷酸,甚至更优选小于25个核苷酸以及最优选小于10个核苷酸。
替换元件的长度可以是1-100,000个核苷酸,优选1-50,000或1-10,000个核苷酸,更优选1-5000、1-2500、1-1000、1-500、1-50或1-10个核苷酸。
替换元件的最小尺寸是通过所期望的突变来定义。因此,在突变是或包含SNP的情况下,替换元件可以包含单核苷酸。在突变是包括PAM元件的缺失的情况下,替换元件可以是0个核苷酸。对于插入,替换元件是待插入的DNA的长度。
在本发明的一些实施方式中,替换元件不包含选择性标记,其将选择表型赋予已将替换元件插入其基因组的宿主细菌细胞。
在本发明的其它实施方式中,替换元件不包含选择性标记的第一元件,其能够与在细菌的基因组中的选择性标记的第二元件并列,以产生选择性标记等位基因,其将选择表型赋予已将替换元件插入其基因组的宿主细菌细胞。
重组元件还包含:
(ii)侧接替换元件的同源臂,其中,同源臂能够促进用包含替换元件的元件来替代在细菌基因组中的所有或部分的IMR。
同源臂促进在重组元件和细菌基因组之间的同源重组(双交换),其导致用包含替换元件的元件来替代IMR。
优选地,存在两个同源臂,其一是在替换元件的5'以及另一个是在替换元件的3'。
上游(5')同源臂包含DNA的链段,其序列与位于IMR的5'端的DNA的链段具有同一性。
下游(3')同源臂包含DNA的链段,其序列与位于IMR的3'端的DNA的链段具有同一性。
优选地,在5'同源臂和在细菌基因组中的相应序列之间的序列同一性的程度是至少80%,更优选至少90%、95%或99%,或它是100%。优选地,在3'同源臂和在细菌基因组中的相应序列之间的序列同一性的程度是至少80%,更优选至少90%、95%、或99%,或它是100%。
同源臂的长度可各自独立地为50-1500或200-1000个核苷酸,优选500-1000以及更优选独立地700-900个核苷酸的长度。最优选地,同源臂的长度各自独立地是约800个核苷酸。
如在本文中所使用的,术语"包含替换元件的元件"一般是指这样的元件,其包含部分的上游同源臂、替换元件和部分的下游同源臂。在已进行双交换以后,这样的元件将替代部分或所有的IMR。
包含替换元件的元件将替代在细菌基因组中的所有或部分的IMR。被替代的IMR的精确量将取决于在重组载体中的同源臂和在IMR中的相应区之间的交换事件的位置。
重组载体优选是环形载体(circular vector)。
重组载体优选具有起始元件(起始点元件,origin element),最优选革兰氏阳性起始元件(例如“pBP1”)。在一些优选实施方式中,重组载体起始元件与杀伤载体起始元件相容。
重组载体还可以包含适当选择标记(例如抗生素抗性基因)。优选地,重组载体和杀伤载体具有不同的选择标记。
重组元件不包含CRISPR PAM/原间隔区,其能够由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM原间隔区。这是为了确保,在双交换事件以后,能够由crRNA识别的新CRISPR PAM/原间隔区不被插入细菌基因组。
步骤(b)包括在其中,在群体内的一种或多种细菌中,在那些细菌的基因组中的所有或部分的IMR由包含替换元件的元件所替代的条件下,培养细菌的群体,并由此从在那些细菌的基因组中的IMR除去CRISPR PAM/原间隔区,或使得CRISPR PAM/原间隔区不能够由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM/原间隔区。
在许多细菌种类中,这种替代步骤不是很有效的。因此,一般不会预期,在群体内所有细菌中,此步骤会成功。
在此步骤中,培养已用重组载体加以转化的细菌,以促进双交换事件,其中包含替换元件的元件被整合到细菌基因组以及IMR在载体上环出(loop out)。
在本发明的方法中,不利用重组技术。尤其是,不将替换元件放置在线性DNA上。
双交换事件是所期望的,其中从在那些细菌的基因组中的IMR除去CRISPR PAM/原间隔区,或使得CRISPR PAM/原间隔区不能够由crRNA所识别,其中上述crRNA识别在IMR中的CRISPR/PAM原间隔区。
优选地,分离一种或多种转化细菌并基于选择性培养基(例如含有抗生素)进一步传代培养以保持重组载体(一次或多次,例如1-5次),以产生一个或多个另外的细菌的群体,其中一些将经历所期望的双交换事件。
用于培养细菌的适宜条件将是本领域中容易已知的。这样的条件,例如,描述于“Clostridia:Biotechnology and Medical Applications”,Eds H.Bahl and P.Dürre,ISBN 3-527-30175-5,尤其是部分3.4“Growth conditions and nutritional requirements”。在Bergey’s Manual of Systematic Bacteriology,Volume appropriate to the chosen phylum of bacteria,e.g.Volume Three for the Firmicutes,ISBN 978-0-387-95041-9中还提供了详细信息。
在本发明的方法的步骤(c)中,用杀伤载体来转化细菌的群体,其中上述杀伤载体能够产生crRNA,其靶向在群体中任何细菌的IMR中的CRISPR PAM/原间隔区,从其还未除去CRISPR PAM/原间隔区或使得CRISPR PAM/原间隔区不能由crRNA所识别,从而促进由crRNA识别的那些CRISPR PAM/原间隔区的CAS内切核酸酶诱导的切割,并促进那些细菌的随后死亡。
本发明的方法的第三步骤的目的是对在细菌的群体内的其基因组仍然包含功能PAM/原间隔区的细菌细胞进行选择。crRNA将靶向其中仅已发生单交换事件的任何细菌细胞,它还将靶向没有交换事件或已恢复到野生型(通过双交换)的任何细胞。由于这些细胞均将具有野生型(即功能的)PAM/原间隔区,所以将杀死这些细菌。
因此,基本上,仅那些在此步骤以后将活着的细菌细胞应该是这样的细菌细胞,其具有包含所期望的突变的替换元件。
此时,在选择性标记(例如抗生素抗性)的存在下,其仅对于杀伤载体是特异的(并且对于重组载体则不是),优选培养已用杀伤载体加以转化的细菌。
术语"crRNA"是指CRISPR RNA。crRNA是短单链RNA分子,其由短同向重复序列组成,其中上述短同向重复序列侧接将被CRISPR/Cas系统切割的靶间隔区序列。
在优选实施方式中,杀伤载体包含:
(i)Cas前导元件
(ii)第一Cas同向重复元件
(iii)Cas间隔元件,以及
(iv)第二Cas同向重复元件。
“Cas前导元件”是DNA元件,其通常发现在同向重复序列簇中的第一重复序列的上游。它有助于促进crRNA的生产,即,它充当RNA启动子。至今已确定许多Cas前导序列以及可以在任何特定的Cas系统中容易地建立它们的序列。优选地,Cas前导序列是一种这样的序列,其对应于CRISPR/Cas系统,其存在于待转化的细菌群体中。
Cas同向重复序列是DNA元件,其由存在于细菌的群体中的CRISPR/Cas系统所识别。这些同向重复序列的长度通常是25-35个核苷酸,更一般地约29或30个核苷酸长度。
同向重复序列不需要是相同的序列(Cas蛋白容忍通常为1-2个核苷酸的差异)。同向重复序列通常具有能够形成发夹环的回文区。
依据CRISPR/Cas系统的CRISPR/Cas同向重复序列-间隔簇的任何检查,可以容易地找到适用于任何一种CRISPR/Cas系统的同向重复序列的DNA序列。
Cas间隔元件包含20-50个核苷酸(优选30-40,更优选36-38个核苷酸)的序列,相对于存在(优选紧接)于在PAM/原间隔区中的PAM元件的5'或存在(优选紧接)于在PAM/原间隔区中的PAM元件的3'的20-50个核苷酸(优选30-40,更优选36-38个核苷酸),其具有高水平的序列同一性,这取决于存在于感兴趣的细菌群体中的CRISPR/Cas系统的偏爱。
优选地,在IMR(在细菌基因组中)中的PAM元件直接相邻于原间隔区序列(在细菌基因组中)的起始。
在原间隔区(在基因组DNA中)和间隔元件序列(例如在杀伤载体中)之间的序列同一性的程度优选是至少80%,更优选至少85%、90%、95%、96%、97%、98%或99%,或是100%。
优选地,选择Cas间隔区序列,以致存在低概率的与非原间隔区元件的相互作用。
可以使用本发明的方法来一次靶向在细菌基因组中的多于一个的原间隔区。在这种情况下,杀伤载体包含多于一种的Cas间隔元件,其中每种Cas间隔元件侧接有同向重复序列。
不同于在细菌基因组中的原间隔区元件,间隔元件不必具有关联的PAM元件。
杀伤载体具有起点(优选革兰氏阳性起点,例如pCB102),其与重组载体的起点相容。
优选地,用于重组载体和杀伤载体的起点是不同的。
重组载体和杀伤载体可以包含抗生素抗性元件或其它选择标记,从而允许独立地选择载体,例如,在某些抗生素的存在下,例如氯霉素、红霉素、四环素、壮观霉素、链霉素等。优选地,重组载体和杀伤载体包含抗生素抗性元件,其允许它们的针对不同的抗生素的独立选择。
在杀伤载体已被转化到细菌群体以后,Cas前导序列将促进crRNA的转录,其中上述crRNA将包含同向重复序列和Cas间隔元件。然后crRNA将靶向在细菌基因组中的还未通过包含替换元件的元件对IMR的替代所消除的任何PAM/原间隔区。然后将通过CRISPR/Cas系统来切割这样的PAM/原间隔区,从而导致在它们的基因组中仍然具有这样的PAM/原间隔区的那些细菌死亡。
可以利用序列对比的BLAST方法来获得百分比氨基酸序列同一性和核苷酸序列同一性(Altschul et al.(1997),"Gapped BLAST and PSI-BLAST:a new generation of protein database search programs",Nucleic Acids Res.25:3389-3402;和http://www.ncbi.nlm.nih.gov/BLAST)。优选地,使用标准或默认序列对比参数。
标准蛋白质-蛋白质BLAST(blastp)可以用于在蛋白质数据库中发现类似的序列。像其它BLAST程序,blastp被设计用来找到相似性的局部区域。当序列相似性跨越整个序列时,blastp还将报告全局序列对比,对于蛋白质鉴定目的来说,其是优选的结果。优选地,使用标准或默认序列对比参数。在一些情况下,可以取掉"低复杂度滤器"。
还可以借助于BLASTN程序,得分=50,字长=3,来进行BLAST蛋白搜索。为了获得用于比较目的的有缺口的序列对比,可以采用Gapped BLAST(在BLAST 2.0中),如描述于Altschul et al.(1997)Nucleic Acids Res.25:3389。可替换地,PSI-BLAST(在BLAST 2.0中)可以用来进行迭代搜索,其检测在分子之间的远距离关系(远缘谱系关系,distant relationship)。(见Altschul et al.(1997)同上)。当采用BLAST、Gapped BLAST、PSI-BLAST时,可以使用各个程序的默认参数。
关于核苷酸序列比较,MEGABLAST、不连续的megablast、和blastn可以用来完成此目标。优选地,使用标准或默认序列对比参数。MEGABLAST是专门设计的以有效地找到在非常相似的序列之间的长序列对比。不连续的MEGABLAST可以用来查找与本发明的核酸类似但不同的核苷酸序列。
通过将查询分成称为字(word)的短子序列,BLAST核苷酸算法寻找类似的序列。上述程序首先识别与查询字的精确匹配(字命中(word hits))。然后在多个步骤中BLAST程序扩展这些字命中以生成最终有缺口的序列对比。在一些实施方式中,可以借助于BLASTN程序,得分=100,字长=12,来进行BLAST核苷酸搜索。
控制BLAST搜索的灵敏度的重要参数之一是字长。blastn比MEGABLAST更加敏感的最重要的原因在于,它使用较短默认字长(11)。由于这个原因,在查找与来自其它生物的相关核苷酸序列的序列对比中,blastn优于MEGABLAST。在blastn中字长是可调节的并且可以从默认值减小至为7的最小值以增加搜索灵敏度。
可以通过使用新引入的不连续的megablast页面(www.ncbi.nlm.nih.gov/Web/Newsltr/FallWinter02/blastlab.html)来实现更敏感搜索。此页面使用与由Ma et al.(Bioinformatics.2002Mar;18(3):440-5)报道的算法类似的算法。不是要求精确词匹配作为序列对比扩展的种子,不连续的megablast使用在模板的较长窗口内的非连续字。在编码模式下,通过专注于寻找在第一和第二密码子位置处的匹配同时忽略在第三位置处的错配来考虑第三碱基摆动(wobbling)。在不连续的MEGABLAST中,使用相同字长的搜索是比使用相同字长的标准blastn更加灵敏和有效的。不连续的megablast的独特的参数是:字长:11或12:模板:16、18、或21;模板类型:编码(0),非编码(1),或两者(2)。
如在本文中所使用的,术语"转化(transformation)"和"转化(transforming)"是指借其将重组载体或杀伤载体插入细菌细胞的任何步骤。因此它尤其包括任何形式的电穿孔、接合或转染。
步骤(d)包括选择或分离一种或多种细菌,其基因组包含含有所期望的突变的替换元件。
携带所期望的(一种或多种)突变的细菌将容易失去WT(野生型)IMR,这是由于以下事实:它将在重组载体上环出。于是这样的修饰重组载体可以容易地从细菌群体丢失,因为杀伤载体将识别现在在载体上的PAM/原间隔区。因此,从这时起,应收回起初用来选择重组载体的选择标记(例如抗生素)。
利用并不含有杀伤载体选择标记(例如抗生素)的培养基,可以容易地分离已丢失杀伤载体的细菌。还可以使用替代方法。此外,可以使细胞经受可能增加质粒从细胞丧失的速率的某些应激,例如热激或电穿孔。
所选择或分离的细菌将是活细菌。
本发明进一步提供了用于制作突变细菌的方法,其包括通过本发明的方法来突变细菌。
本发明还提供了通过本发明的方法其基因组已突变的细菌。
附图说明
图1示出在本发明的一种实施方式中在重组载体的元件、内源性细菌DNA和杀伤载体之间的关系。
图2示出来自若干梭菌种的同向重复序列的序列对比。
图3示出PAM序列对质粒进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)的转化效率的影响。
图4示出针对SNP替代实例的突变和WT DNA序列的高分辨率熔解曲线分析(High Resolution Melt curve analysis)。
图5示出来自携带SNP的两个菌落的Sanger测序数据,其中上述SNP是利用描述的技术所产生。
图6示出针对靶向缺失实例的突变和WT DNA序列的高分辨率熔解曲线分析。
图7示出靶向缺失实例的Sanger测序结果。
实施例
实施例1:来自若干梭菌物种的同向重复序列的序列对比
目标:以鉴定可用于本发明的方法的一些同向重复序列。
方法:
利用CRISPRFinder程序Grissa,I.,Vergnaud,G.,&Pourcel,C.(2007)来寻找同向重复序列和间隔区序列。CRISPRFinder:一种用来鉴定聚簇规则间隔短回文重复序列(成簇的规律间隔的短回文重复序列)的网络工具。Nucleic Acids Res.,35,W52-7。
结果:
图2示出来自若干梭菌物种的同向重复序列的选择。在一些情况下,特定菌株具有多于一种的序列,所以这里包括最常用同向重复序列。缩写词如下:C_saccharoper=糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)N1-4(HMT)或N1-504),C_saccharob=糖丁酸梭菌(NCP258或NCP262,_1和_2是指2个主要DR簇),C_tyro=酪丁酸梭菌(ATCC 52755,_1和_2是指2个主要DR簇),C_pasteurianum=巴氏梭菌(DSM 525),C_autoethanogenum=产乙醇梭菌(Clostridium autoethanogenum)(DSM10061),C_sp_DLVIII=梭菌属(Clostridium sp.)(DL-VIII)。
实施例2:证实在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中的PAM序列
目标:以说明如何测试假定PAM序列的有效性。
方法:
将来自糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)的主要同向重复序列簇的间隔区_53的序列克隆到梭菌穿梭载体,pMTL83251。紧邻此间隔元件的5’端,加入各种不同的三核苷酸组合,包括预测的PAM序列CCC、CCG、CCT和非PAM序列GAC。当正确结合功能PAM序列时,间隔元件充当原间隔区。
利用标准电穿孔协议,接着在还含有5%葡萄糖的梭菌生长培养基(CGM)中过夜恢复阶段,将质粒转化成糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)。然后将混合物扩散到含有5%葡萄糖和40μg/ml红霉素的CGM琼脂平板上并在32℃的厌氧箱中放置至少48小时。然后计数菌落,以和空载体的转化相比,确定转化效率的变化。
通过在750ml dH2O中溶解以下量来制备CGM培养基:5.0g酵母提取物、0.75g K2HPO4、0.75g KH2PO4、0.40g MgSO4.7H2O、0.01g FeSO4.7H2O、0.01g MnSO4.4H2O、1.0g NaCl、2.0g(NH4)2SO4、2.0g天冬酰胺(以及15g细菌琼脂1号,如果制作固体培养基),然后高压灭菌。不调节培养基的pH(通常在6.6的区域)。分别制备葡萄糖溶液(50g葡萄糖,溶解于250ml dH2O,以给出20%(w/v)溶液)和高压灭菌。在冷却以后,合并葡萄糖和CGM溶液(根据需要)。
结果:
不同质粒的相对转化效率示于图3。空质粒pMTL83251和携带间隔区_53而没有PAM序列的质粒均产生菌落的菌苔(lawn)。携带相邻于5’CCC(PAMC)、CCT(PAMT)或CCA(PAMA)的间隔区_53的质粒产生明显更少的菌落。
实施例3:制作在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中的SNP替代
目标:为了显示使用所公开的技术如何可以做出具体的点突变。
方法:
选择IMR序列,用于在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)的基因组DNA中的突变。从上述序列,确定了相邻于PAM(在此实施例中为CCA)的候选原间隔区元件。此PAM/原间隔区元件的序列示于表1。设计了一种重组载体,其包含由一对同源臂侧接的替换元件,其中每个臂是大约800bp长。相对于PAM/原间隔区元件的原有基因组序列,替换元件(表1)携带三个SNP。掺入三个SNP之一以将PAM序列突变为CTA;其它两个被设计用来除去限制位点(大写字母和下划线)。
重组载体是基于梭菌穿梭载体pMTL82154。利用标准电穿孔协议,将它转化进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)。基于对氯霉素(50μg/ml)的抗性来选择成功的转化体。挑取单菌落并转入含有氯霉素的液体强化梭菌培养基(RCM)。传代培养它们四次或更多次以促进双交换事件和环出WT序列。
RCM半固体培养基的制备如下:3g.L-1酵母提取物、10g.L-1Lab-Lemco粉末、10g.L-1蛋白胨、5g.L-1葡萄糖、1g.L-1可溶性淀粉、5g.L-1氯化钠、3g.L-1乙酸钠、0.5g.L-1半胱氨酸盐酸盐、0.5g.L-1琼脂,pH调节至6.8±0.2,然后通过在121℃下的高压灭菌加以灭菌。
然后用包含前导序列和对应于上文确定的候选原间隔区的间隔元件的杀伤载体来转化这些培养物,其中上述间隔元件由在pMTL83251质粒骨架上的同向重复序列所侧接。在平板接种在含有5%葡萄糖加40μg/ml红霉素的CGM-琼脂上以前,在含有5%葡萄糖的CGM中,允许回收细胞过夜。
在杀伤载体上存在的间隔元件(表1)有效地将在基因组中的相应序列转变成功能原间隔区元件。由杀伤载体携带的这种间隔区仅靶向WT序列以及细菌自身的Cas系统感知其自身的基因组DNA作为入侵DNA并切割它,从而导致细胞死亡。因此,仅在借助于杀伤载体的转化以后回收的细胞必然已将替换元件重组进入它们的基因组DNA中。
表1:在实施例3中使用的PAM/原间隔区元件、间隔元件和替换元件的序列
高分辨率熔解曲线分析(HRM)
利用高分辨率熔解曲线分析来筛查通过上述过程所选择的菌落以鉴定SNP的存在(相比于WT序列)。利用将仅扩增来自细菌染色体的产物的引物来扩增含有SNP的预期位置的1.1kb区。然后对这种产物进行第二PCR以扩增覆盖预期SNP区的较短片段(85bp),其中利用Precision Melt超混合物(BioRad)。在PCR以后,熔解曲线从70℃运行到80℃,并具有0.2℃增量,以给出每个测试菌落的熔解曲线。
通过限制酶消化(因为SNP的两个会破坏AvrII位点),然后通过DNA测序,针对靶突变,还筛查了来自基因组DNA特异性PCR的1.1kb PCR产物。
结果:
在借助于杀伤载体的转化以后,获得两个有前途的菌落,命名为A和B。因此,这种方法显著减少了为鉴定需要的突变而需要加以筛查的菌落的数目。
通过HRM来分析菌落A和B并且相比于WT和对照菌株(携带掺入的三种突变之一),示于图4。相比于WT或对照的那些,菌落A和B的熔解曲线的差异表明,相比于WT菌株,穿过SNP序列的基因组的区已改变。
Sanger测序
为上述HRM分析所生成的来自基因组特异性PCR的1.1kb PCR产物的测序结果示于图5。“WT”的序列对比=获自WT培养物的序列,“预期突变”=预期突变的计算机(in silico)预测,“对照序列”=获自仅携带PAM突变的突变株的序列,“Col A”和“Col B”=使用糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)Cas系统,如上所述所制作的菌株,它们是利用Seqman Pro(DNAStar,Lasergene)所产生。
它证实了,在HRM曲线中的变化是由于已引入的三种SNP。
对此整个区的随后的测序表明,没有引入另外的突变(数据未示出)。
实施例4:在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中制作精确缺失
目标:为了显示本发明的方法如何可以用来在基因组中制作精确缺失。
方法:
设计了N端缺失突变体,其中从所选基因的起始除去12个氨基酸并添加新的起始密码子,从而导致在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中序列的框内截短,命名为"ΔNt”。还加入两个另外的SNP以除去AvrII限制位点。在此WT区内,确定了相邻于PAM(在此实施例中为CCA)的候选原间隔区元件。此区(含有PAM/原间隔区元件)的序列和用于缺失的区(突出显示的)示于表2。设计了重组载体,其包含由一对同源臂侧接的替换元件,其中每个臂是大约800bp长。相对于原来的基因组序列,替换元件(表2)携带36个碱基对缺失和新的起始密码子。
重组载体是基于梭菌穿梭载体pMTL82154。使用标准电穿孔协议,将它转化进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT),然后基于对氯霉素(50μg/ml)的抗性加以选择。挑取单菌落并转入含有氯霉素的液体增强梭菌培养基(RCM)。传代培养它们三次或更多次以促进双交换事件,从而环出WT序列。
然后用包含前导序列和对应于上文确定的候选原间隔区的间隔元件的杀伤载体来转化这些培养物,其中上述间隔元件由在pMTL83251质粒骨架上的同向重复序列所侧接。在被平板接种到含有5%葡萄糖加40μg/ml红霉素的CGM-琼脂上以前,允许在含有5%葡萄糖的CGM中回收细胞过夜。
因此,仅在用杀伤载体加以转化以后回收的细胞必然已将替换元件重组进入它们的基因组DNA,从而导致在基因的N端处靶向12个氨基酸的精确缺失。
表2:在实施例4中使用的PAM/原间隔区元件、间隔元件和替换元件的序列
结果:
在用杀伤载体转化以后,筛查大约30个有前途的菌落并且其中21个显示相对于WT对照的不同的HRM曲线(图6)。这些21个菌落的少量菌落的进一步分析和Sanger测序表明,它们均携带预期的N端缺失(图7)。
实施例5:新DNA进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)基因组的整合
目标:为了详述如何使用本发明的方法来将新DNA整合进入基因组DNA。
方法:
基于pMTL82154骨架来设计重组载体。在因缺乏编码序列而选择的糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)基因组中的区的上游和下游,它携带大约800bp。已在两个同源臂之间克隆基于硫解酶启动子序列的启动子以及将在此启动子的下游克隆用于插入的基因,作为替换元件,用于在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中表达。在3’同源臂的5’端处,在WT细胞中将由杀伤载体所识别的PAM/原间隔区元件序列(在IMR中)携带在PAM序列中的单SNP。这将确保,当将杀伤载体转化进入细胞时,仅携带整合DNA的细胞将生存。
已基于pMTL83251来构建杀伤载体。它携带前导序列和两个同向重复序列,其侧接间隔元件,其设计在选为整合位点的基因间的区内。已在糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)中测试了杀伤载体并且已表明会杀伤WT细胞。(此载体进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)的转化导致没有菌落被回收)。
已使用电穿孔将整合载体转化进入糖乙酸多丁醇梭菌(C.saccharoperbutylacetonicum)N1-4(HMT)并且基于氯霉素抗性来选择转化体。在传代培养3次或更多次以后,将引入杀伤载体以从群体除去任何WT细胞,从而仅留下那些已将新DNA整合进入它们的基因组的细胞。
序列表自由文本
SEQ ID NO:3<223>具有替换元件的重组载体的部分序列
SEQ ID NO:5<223>具有替换元件的重组载体的部分序列
SEQ ID NO:18<223>具有突变PAM位点的糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
SEQ ID NO:19<223>突变糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
SEQ ID NO:20<223>突变糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
SEQ ID NO:21<223>具有缺失的糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列。
序列表
<110> 绿色生物制品有限公司(Green Biologics Limited)
<120> 靶向突变
<130> 489.94.118730/01
<150> GB1406970.2
<151> 2014-04-17
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 52
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 1
ccacttgctg ctccagcgtt tcctagggga ccatatagat tcatatagat tt 52
<210> 2
<211> 37
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 2
cttgctgctc cagcgtttcc taggggacca tatagat 37
<210> 3
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 具有替换元件的重组载体的部分序列
<400> 3
ctacttgctg ctccagcgtt tccaagagga ccatatagat tcatatagat tt 52
<210> 4
<211> 120
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 4
aggttgatta ttttatgtta gaaagtgaag tatctaaaca aattacaact ccacttgctg 60
ctccagcgtt tcctagggga ccatatagat ttcataatag agaatatcta aacattattt 120
<210> 5
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 具有替换元件的重组载体的部分序列
<400> 5
aggttgatta ttttatgctt gctgctccag cgtttccaag aggaccatat agatttcata 60
atagagaata tctaaacatt attt 84
<210> 6
<211> 30
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 6
cttttaatat atccatattg gaatgtaaat 30
<210> 7
<211> 29
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 7
gttttatatt aactatgagg aatgtaaat 29
<210> 8
<211> 29
<212> DNA
<213> 梭菌属DLVIII(Clostridium sp DLVIII)
<400> 8
gttttatatt aactatgagg aatgtaaat 29
<210> 9
<211> 28
<212> DNA
<213> 糖丁酸梭菌(Clostridium saccharobutylicum)
<400> 9
gttttatctt aactagagga atgtaaat 28
<210> 10
<211> 30
<212> DNA
<213> 酪丁酸梭菌(Clostridium tyrobutyricum)
<400> 10
gttgaacctt aacatgagat gtatttaaat 30
<210> 11
<211> 30
<212> DNA
<213> 酪丁酸梭菌(Clostridium tyrobutyricum)
<400> 11
attgaacctt aacatgagat gtatttaaat 30
<210> 12
<211> 30
<212> DNA
<213> 糖丁酸梭菌(Clostridium saccharobutylicum)
<400> 12
gattaacatt aacatgagat gtatttaaat 30
<210> 13
<211> 30
<212> DNA
<213> 糖丁酸梭菌(Clostridium saccharobutylicum)
<400> 13
gttgaagatt aacattatat gttttgaaat 30
<210> 14
<211> 30
<212> DNA
<213> 糖丁酸梭菌(Clostridium saccharobutylicum)
<400> 14
gttgaagatt aacattatat gttttgaaat 30
<210> 15
<211> 30
<212> DNA
<213> 巴氏梭菌(Clostridium pasteurianum)
<400> 15
gttgaacctt aacataggat gtatttaaat 30
<210> 16
<211> 30
<212> DNA
<213> 产乙醇梭菌(Clostridium autoethanogenum)
<400> 16
gttgaacctc aacatgagat gtatttaaat 30
<210> 17
<211> 80
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 17
tgttagaaag tgaagtatct aaacaaatta caactccact tgctgctcca gcgtttccta 60
ggggaccata tagatttcat 80
<210> 18
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 具有突变PAM位点的糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
<400> 18
tgttagaaag tgaagtatct aaacaaatta caactctact tgctgctcca gcgtttccaa 60
gaggaccata tagatttcat 80
<210> 19
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 突变糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
<400> 19
tgttagaaag tgaagtatct aaacaaatta caactctact tgctgctcca gcgtttccta 60
ggggaccata tagatttcat 80
<210> 20
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 突变糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
<400> 20
tgttagaaag tgaagtatct aaacaaatta caactctact tgctgctcca gcgtttccaa 60
gaggaccata tagatttcat 80
<210> 21
<211> 129
<212> DNA
<213> 糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)
<400> 21
aaaatcttat gtattacaat ctaagaaaag aggttgatta ttttatgtta gaaagtgaag 60
tatctaaaca aattacaact ccacttgctg ctccagcgtt tcctagggga ccatatagat 120
ttcataata 129
<210> 22
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 具有缺失的糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)序列
<400> 22
aaaatcttat gtattacaat ctaagaaaag aggttgatta ttttatgctt gctgctccag 60
cgtttccaag aggaccatat agatttcata ata 93