优化的内切核酸酶及其用途的制作方法

文档序号:746959阅读:484来源:国知局
专利名称:优化的内切核酸酶及其用途的制作方法
技术领域
本发明涉及优化的内切核酸酶,以及使用优化的内切核酸酶对多核苷酸进行靶向整合、靶向缺失或靶向突变的方法。
背景技术
基因组改造(genome engineering)是概括用于在基因组内插入、缺失、取代或操纵特定遗传序列的不同技术的通用术语,其具有大量的治疗应用和生物技术应用。所有基因组改造技术或多或少都使用重组酶、整合酶或内切核酸酶,用于在预定位点制造DNA双链断裂,以促进同源重组。尽管已利用了大量的方法来制造DNA双链断裂,开发在基因组中于高度特异性位点制造DNA双链断裂的有效方法仍是基因疗法、农业技术和合成生物学中的主要目标。 实现该目标的ー种手段是使用对下述序列具有特异性的核酸酶,所述序列足够大到仅存在于基因组内的单个位点。识别此类大约15至30个核苷酸的大DNA序列的核酸酶因此被称为“大范围核酸酶”或“归巢(homing)内切核酸酶”,并常与寄生性(parasitic)或自私的(selfish)DNA元件相关联,所述元件例如常发现于植物和真菌基因组中的组I自剪接内含子和内含肽。大范围核酸酶通常被分组为四个家族LAGLIDADG家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族的特征在于影响催化活性和它们的DNA识别序列的序列的结构基序。来自LAGLIDADG家族的天然大范围核酸酶已被用于在昆虫和哺乳动物细胞培养物以及很多生物(例如植物、酵母或小鼠)中有效促进位点特异性基因组修饰,但是该手段已局限于对DNA识别序列保守的同源基因的修饰或已向其中引入了识别序列的预改造(preengineered)基因组的修饰。为避免此类局限以及为促进DNA双链断裂激发的基因修饰的系统性(systematic)执行,已经制造了新的核酸酶类型。ー种新核酸酶类型由人工组合的非特异性核酸酶和高度特异性DNA结合结构域构成。已使用FokI限制性酶的非特异性核酸酶结构域和经改造的锌指DNA结合结构域之间的嵌合融合体,在多种生物中展现了该策略的有效性(例如W003/089452)。该手段的一种变化是使用作为DNA结合结构域的大范围核酸酶的失活变体与非特异性核酸酶(例如FokI)融合的,例如 Lippow 等人,“Creation of a type IIS restriction endonucleasewith a long recognition sequence”,Nucleic Acid Research(2009), Vol. 37,No. 9,3061至3073页所公开的。一种备选手段是对天然大范围核酸酶进行遗传改造,以定制其与基因组中存在的位点结合的DNA结合区域,由此制造具有新特异性的经改造的大范围核酸酶(例如W007093918、W02008/093249、W009114321)。但是,已针对DNA切割特异性改造过的很多大范围核酸酶相对于其所来源的天然存在的大范围核酸酶而言具有減少的切割活性(US2010/0071083)。大多数的大范围核酸酶还作用于与其最优结合位点相似的序列上,这可能导致非意图性的或者甚至有害的脱靶作用。已采取了若干手段,以增强大范围核酸酶诱导的同源重组的效率,例如通过将核酸酶与大鼠糖皮质激素受体的配体结合结构域融合,以通过添加地塞米松或相似化合物促进或者甚至诱导该经修饰的核酸酶运送至细胞核以及由此运送至其靶向位点(W02007/135022)。尽管如此,本领域仍需要开发具有对同源重组有高诱导效率和/或针对其结合位点有高特异性的大范围核酸酶,由此限制脱靶作用的风险。发明简述本发明提供了 LAGLIDADG内切核酸酶家族的优化版本的内切核酸酶。特别是包括与SEQ ID N0:l、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列的优化的内切核酸酶。在本发明的一个实施方案中,优化的内切核酸酶是野生型或经改造版本的I-SceI,如SEQ ID NO : I所述,或其一种在氨基酸水平具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 序列同一,注的同源物,具有一种或多种选自以下的突变a)I-Scel_l,I-Scel-2,I-Scel-3,I-Scel-4,I-Scel-5, I-Scel-6, I-Scel-7, I-Scel-8 和 I-Scel-9 ;b)S229K, S229A, S229P, S229G,S229E, S229Q, S229D, S229N, S229C, S229Y, S229T, M203K, M203H, M203R, Q77K, Q77H, Q77R, E130K, E130H, E130R, Y199K, Y199H 和 Y199R ;c)在其氨基酸序列的起始甲硫氨酸之后的甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、异亮氨酸或组氨酸;或d)选自上述a)和b)、a)和c)、b)和c)或a)、b)和c)的一个或多个突变的组

ロ ο在一个实施方案中,优化的内切核酸酶包括SEQ ID NO :2、3或5所描述的氨基酸序列。在本发明的另ー个实施方案中,优化的内切核酸酶是经改造的内切核酸酶版本,其包含与SEQ ID NO: I、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列。在另ー个实施方案中,本发明提供了与SEQ ID NO :I所描述的多肽具有至少80%的氨基酸序列同一性的内切核酸酶,或与SEQ ID NO :1所描述的多肽具有至少80%的氨基酸序列同一性的经改造的内切核酸酶版本,其中通过删除或突变氨基酸序列TISSETFLK的任一个氨基酸,去除了氨基酸序列TISSETFLK。本发明的另ー个优选的实施方案是权利要求I至4的任一项所述的优化的内切核酸酶,其包含与SEQ ID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且包含SE9 ID NO :I的丝氨酸Nr229的突变。在本发明的另ー个实施方案中,优化的内切核酸酶与至少ー个锌指结构域,或与源自转录激活物-样(TAL)效应子的至少ー个重复单元,或与至少ー个锌指结构域和源自转录激活物-样(TAL)效应子的至少ー个重复单元融合。优选的,优化的内切核酸酶包括SecIII或SecIV分泌信号。本发明还提供了包含多核苷酸序列的经分离的多核苷酸,所述多核苷酸序列编码优化的内切核酸酶。优选地,这ー多核苷酸是经密码子优化的,或具有低含量的DNA不稳定性基序(motives),或具有低含量的密码子重复,或具有低含量的隐蔽剪接位点,或具有低含量的备选起始密码子,具有低含量的限制性位点,或具有低含量的RNA ニ级结构,或具有上述这些特征的任何组合。本发明的另ー实施方式是表达盒,所述表达盒包含与启动子和終止子序列功能性组合的、如上文所述的经分离的多核苷酸。本发明的其他实施方案是下述载体、宿主细胞或非人生物,它们包含编码优化的内切核酸酶的多核苷酸,或编码优化的内切核酸酶的经分离的多核苷酸,或含有编码优化的内切核酸酶的多核苷酸的表达盒,以及包含上述内切核酸酶、多核苷酸和表达盒的组合的载体、宿主细胞或非人生物。优选地,非人生物是植物。本发明提供了使用本文所述的内切核酸酶诱导同源重组或末端连接事件的方法。优选地,在用于序列切除的靶向整合的方法中。优选地,被切除的序列是标记基因。本发明进ー步提供了用于同源重组多核苷酸的方法,包括下列步骤a)提供用于同源重组的感受态细胞,b)提供下述多核苷酸,所述多核苷酸包含侧翼有序列A和序列B的经优化的内切核酸酶的DNA识别位点,c)提供包含序列A’和B’的多核苷酸,所述序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及d)提供本文所述的优化的内切核酸酶或本文所述的表达盒,e)在所述细胞中组合b)、c)和d),以及f)检测b)和c)的重组多核苷酸,或选择出包含b)和c)的重组多核苷酸的细胞,或使包含b)和c)的重组多核苷酸的细胞生长。优选地,用于多核苷酸同源重组的方法导致同源重组,其中,步骤a)的感受态细胞中包含的多核苷酸序列从步骤f)的生长细胞的基因组中缺失。 本发明的另一方法是用于靶向突变的方法,所述方法包括下述步骤a)提供包含下述多核苷酸的细胞,所述多核苷酸包含优化的内切核酸酶的DNA识别位点,b)提供能切割步骤a)的所述DNA识别位点的、如权利要求I至7中任意一项所述的经优化的内切核酸酶或权利要求10所述的表达盒,c)在所述细胞中组合a)和b),以及d)检测经突变的多核苷酸,或针对包含经突变的多核苷酸的细胞加以选择并且生长所述细胞。在本发明的另ー优选的实施方式中,上文所述的方法包括下述步骤,其中优化的内切核酸酶和DNA识别位点组合于至少ー种细胞中,这通过生物的杂交、通过转化或通过经由融合至经优化内切核酸酶的SecIII或SecIV肽介导的运送来实现。附图
简述图I显示了同源重组频率的比较,这是通过在三种不同的I-SceI变体诱导重组后,β-葡糖醛酸糖苷酶活性的重建蓝色幼苗)来测量的。每个I-SceI变体都在5株携带了测试构建体的不同植物株系中测试。对于每个组合,分析96株幼苗的Τ2代的β-葡糖醛酸糖苷酶活性(“ I-SceI ”,具有SEQ ID NO :1所述的氨基酸序列;"I-SceI c-term mod”具有SEQ ID NO 3所述的氨基酸序列;“NLS I-SceI c-term mod”具有SEQ ID NO :5所述的氨基酸序列),还參见实施例10b。图2描述了不同的I-SceI同源物的序列比对,其中I是SEQ ID N0:l,2是SEQ IDNO: 15,3 是 SEQ ID NO: 16,4 是 SEQ ID NO : 17,5 是 SEQID NO: 18。发明详述本发明提供了优化的内切核酸酶,其可以用作备选的诱导DNA双链断裂的酶。本发明还提供了使用这些优化的内切核酸酶的方法。优化的内切核酸酶是I-Sce-I(SEQ ID NO 1所述)的变体,以及I-Sce-I的同源物,所述同源物在氨基酸水平具有至少55 %、58 %、60 %、70 %、80 %、85 %、90 %、92 %、93%、94%、95%、96%、97%、98%或99%序列同一性。优化的I-SceI版本也被称为优化的I-SceI。I-SceI内切核酸酶的同源物可克隆自其它生物,或可通过对LAGLIDADG内切核酸酶加以突变来制造,例如通过替代、添加或缺失给定的LAGLIDADG内切核酸酶的氨基酸序列中的氨基酸来进行。例如,可向LAGLIDADG内切核酸酶的氨基酸序列添加核定位信号和/或改变其序列的一个或多个氨基酸和/或缺失其序列的部分,例如,其N-末端的部分或C-末端的部分。表I =I-SceI的示例性同源物(可克隆自其它生物)描述在表I中;
·
Oui-Prot登生物SEQID 与I-SeeI的I基酸序列同
录号NO;一性
A7LCPI酿酒酵母(& eerevM )IWO
Q36760酿酒酵母1598
063264二孢接合酵母 U. blsporm)1672
Q34839耐热克鲁维酵母([i/wmcuto/mww》1771
Q34807加拿大毕赤酵母(P. canadensis)18S8可用于本发明的LAGLIDADG内切核酸酶可在藻类、真菌、酵母、原生动物、叶绿体、线粒体、细菌和古细菌的基因组中发现。LAGLIDADG内切核酸酶包含至少一个保守的LAGLIDADG基序。LAGLIDADG基序的名称基于出现于所有LAGLIDADG内切核酸酶中的特征性氨基酸序列。术语LAGLIDADG是该氨基酸序列根据STANDARD ST. 25( S卩,PCIPI执行协调委员会(PCIPI Executive Coordination Committee)针对专利申请中呈现的核苷酸和氨基酸序列表所采用的标准)中所述的单字母编码的首字母缩写。但是,LAGLIDADG基序并非在所有LAGLIDADG内切核酸酶中完全保守(见例如 Chevalier 等人(2001), Nucleic Acids Res. 29(18) :3757 至 3774,或 Dalgaard 等人(1997),Nucleic Acids Res. 25(22) :4626 至 4638),从而一些 LAGLIDADG 内切核酸酶在它们的LAGLIDADG基序中包含一个或数个氨基酸改变。包含仅一个LAGLIDADG基序的LAGLIDADG内切核酸酶通常作为同源或异源二聚体发挥作用。包含两个LAGLIDADG基序的LAGLIDADG内切核酸酶作为单体发挥作用,并且通常包含伪二聚体结构。LAGLIDADG内切核酸酶可分离自表I中作为例子提到的生物的多核苷酸,或通过本领域已知的技术从头合成,例如使用本领域技术人员已知的公众数据库中可获得的序列信息来进行,所述数据库例如 Genbank (Benson (2010)), Nucleic Acids Res 38 :D46_51 或Swissprot(Boeckmann(2003), Nucleic Acids Res 31 :365-70)。可在针对蛋白质家族的PFAM-数据库中发现LAGLIDADG内切核酸酶的集合。PFAM-数据库检录号PR)0961描述了 LAGLIDADG I蛋白质家族,其包含约800条蛋白序列。PFAM-数据库检录号PF03161描述了 LAGLIDADG 2蛋白质家族的成员,其包含约150条蛋白序列。可在InterPro数据库中找到LAGLIDADG内切核酸酶的一个备选集合,例如,InterPro检录号 IPR004860。产生LAGLIDADG内切核酸酶的同源物的另一种方法是突变LAGLIDADG内切核酸酶的氨基酸序列,从而修饰它的DNA结合亲和力、它的二聚体形成亲和力或改变它的DNA识别序列。LAGLIDADG内切核酸酶的蛋白质结构确定以及同源物的序列比对允许涉及下述可以改变的氨基酸的理性的选择,所述氨基酸的改变影响它的DNA结合亲和力、它的酶活性或改变它的DNA识别序列。在本文中使用时,术语“DNA结合亲和性”表示大范围核酸酶或LAGLIDADG内切核酸酶与参照DNA分子(例如DNA识别序列或任意序列)非共价联结的趋势。结合亲和性是通过解离常数Kd (例如,I-SceI针对WT DNA识别序列的Kd为大约O. InM)测量的。在本文中使用时,如果相对于参照大范围核酸酶或LAGLIDADG内切核酸酶而言,重组大范围核酸酶针对参照DNA识别序列的Kd增加或减少统计上显著(P < O. 05)的量,那么大范围核酸酶则具有“变动的”结合亲和性。在本文中使用时,术语“酶活性”指大范围核酸酶(例如LAGLIDADG内切核酸酶)切割特定DNA识别序列的速率。此类活性是可测量的酶促反应,所述反应涉及对双链DNA的磷酸二酯键的水解。作用于特定DNA底物上的大范围磷酸酶的活性受大范围核酸酶对该 特定DNA底物的亲和性(affinity)或亲合力(avidity)的影响,这又进而受与DNA的序列特异性相互作用和非序列特异性相互作用的影响。可通过缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或I个氨
基酸对核酸酶进行优化,而不破坏其内切核酸酶活性。例如,当LAGLIDADG内切核酸酶的氨基酸序列中的部分被缺失的情况下,保留上文所述的LAGLIDADG内切核酸酶基序则是重要的。优选地,缺失PEST序列或其它失稳(destabilizing)基序,例如KEN-框、D-框和A-框。还可通过引入单个氨基酸改变,例如向PEST序列中引入带正电荷的氨基酸(精氨酸、组氨酸和赖氨酸),来破坏这些基序。经过突变而修饰了它的DNA结合亲和性或改变了它的DNA识别位点的LAGLIDADG内切核酸酶被称为经改造的内切核酸酶。可以像其他LAGLIDADG内切核酸酶一样,改造I-Sce I及其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的I-Sce I同源物,从而改变它的DNA结合亲和力、它的酶活性或改变它的DNA识别序列。经过改造的I-SceI和I-Sce I同源物版本在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80 %、85 %、90 %、92 %、93 %、94%、95%、96%、97%、98%或 99% 的序列同一性因此,在本发明的一个实施方案中,优化的内切核酸酶是经改造的版本的I-Sce I及其在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95 %、96%、97 %、98 %或99%的序列同一性的同源物,并且相比其未改造的形式(意指天然存在的各个LAGLIDADG内切核酸酶)时,具有改变的DNA结合亲和力、改变的酶活性或改变的DNA识别序列。在本发明的另一个实施方案中,优化的内切核酸酶是SEQ ID NO :1所述的I-SecI或如它们天然存在的其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的变体。只要不包含其他突变,则这样的同源物也将被认为是天然存在的同源物,其中所述同源物不是天然存在的,但具有A36G,L40M, L40V, I41S,I41N, L43A,H91A和I123L中的至少一个突变,所述突变对I-SceI的DNA结合亲和力几乎没有影响,或者将改变的它的DNA识别序列,而相比SEQ ID NO : I所述的I-SecI或在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的各个同源物(如其天然存在的),所述其他突变改变了其DNA结合亲和力、酶活性或其DNA识别序列。具有增加的或减少的DNA结合亲和性的I-SceI的经改造的版本例如被公开于W007/047859和W009/076292中,两者通过引用包括到本文中。如果没有另外的明确指明,所有突变体都将按照各内切核酸酶的野生型氨基酸序列的氨基酸编号来命名,例如,I-SceI的突变体L19将在如SEQ ID NO :1所示的野生型I-SceI氨基酸序列第19位处具有对亮氨酸的氨基酸替换。I-SceI的L19H突变体将以组氨酸替代野生型I-SceI氨基酸序列第19位的氨基酸亮氨酸。例如,I-SceI的DNA结合亲和性可通过对应于选自下组的取代的至少一种修饰而增加,所述组由(a)用 H、N、Q、S、T、K 或 R对 D201、L19、L80、L92、Y151、Y188、I191、Y199 或 Y222的取代;或(b)用 K 或 R对 N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194或S202的取代构成。I-SceI的DNA结合亲和性可通过对应于选自下组的取代的至少一种突变而减少,所述组由(a)用 H、N、Q、S、T、D 或 E 对 K20、K23、K63、K122、K148、K153、K190、K193、K195 或Κ223的取代;或(b)用 D 或 E 对 L19、L80、L92、Y151、Y188、1191、Y199、Y222、N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194 或 S202 的取代构成。具有改变的DNA识别序列的I-SceI、I-CreI、I-MsoI和I-CeuI的经改造版本被公开于例如 W007/047859 和 W009/076292 中。例如,I-SceI的一个重要DNA识别位点具有下述序列正义5’-TTACCCTGTTA T C C C T A G-3’碱基位置I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18反义3' -AATGGGACAA T A G G G A T C-5/I-SceI的下述突变将使第4位对C的优先性改变至A :K50。I-SceI的下述突变将保持第4位对C的优先性K50、CE57。I-SceI的下述突变将使第4位对C的优先性改变至G :E50、R57、Κ57。I-SceI的下述突变将使第4位对C的优先性改变至T :Κ57、Μ57、Q50。I-SceI的下述突变将使第5位对C的优先性改变至A :K48、Q102。I-SceI的下述突变将保持第5位对C的优先性R48、K48、E102、E59。I-SceI的下述突变将使第5位对C的优先性改变至G :E48、K102、R102。I-SceI的下述突变将使第5位对C的优先性改变至T :Q48、C102、L102、V102。I-SceI的下述突变将使第6位对C的优先性改变至A :K59。I-SceI的下述突变将保持第6位对C的优先性R59、K59。 I-SceI的下述突变将使第6位对C的优先性改变至G :K84、Ε59。
I-SceI的下述突变将使第6位对C的优先性改变至T :Q59、Y46。I-SceI的下述突变将使第7位对T的优先性改变至A :C46、L46、V46。I-SceI的下述突变将使第7位对T的优先性改变至C :R46、K46、E86。I-SceI的下述突变将使第7位对T的优先性改变至G :K86、R86、Ε46。I-SceI的下述突变将保持第7位对T的优先性K68、C86、L86、Q46 *。I-SceI的下述突变将使第8位对G的优先性改变至A :K61、S61、V61、Α61、L61。I-SceI的下述突变将使第8位对G的优先性改变至C :E88、R61、Η61。I-SceI的下述突变将保持第8位对G的优先性E61、R88、Κ88。I-SceI的下述突变将使第8位对G的优先性改变至T :K88、Q61、Η61。I-SceI的下述突变将使第9位对T的优先性改变至A :T98、C98、V98、L9B。I-SceI的下述突变将使第9位对T的优先性改变至C :R98、K98。I-SceI的下述突变将使第9位对T的优先性改变至G :E98、D98。I-SceI的下述突变将保持第9位对T的优先性Q98。I-SceI的下述突变将使第10位对T的优先性改变至A :V96、C96、A96。I-SceI的下述突变将使第10位对T的优先性改变至C :K96、R96。I-SceI的下述突变将使第10位对T的优先性改变至G :D96、E96。I-SceI的下述突变将保持第10位对T的优先性Q96。I-SceI的下述突变将保持第11位对A的优先性C90、L90。I-SceI的下述突变将使第11位对A的优先性改变至C :K90、R90。I-SceI的下述突变将使第11位对A的优先性改变至G :Ε90。I-SceI的下述突变将使第11位对A的优先性改变至T :Q90。I-SceI的下述突变将使第12位对T的优先性改变至A :Q193。I-SceI的下述突变将使第12位对T的优先性改变至C :E165、E193、D193。I-SceI的下述突变将使第12位对T的优先性改变至G :K165、R165。I-SceI的下述突变将保持第12位对T的优先性C165、L165、C193、V193、A193、T193、S193。I-SceI的下述突变将使第13位对C的优先性改变至A :C193、L193。I-SceI的下述突变将保持第13位对C的优先性K193、R193、D192。I-SceI的下述突变将使第13位对C的优先性改变至G :E193、D193、Κ163、R192。I-SceI的下述突变将使第13位对C的优先性改变至T :Q193、C163、L163。I-SceI的下述突变将使第14位对C的优先性改变至A :L192、C192。I-SceI的下述突变将保持第14位对C的优先性E161、R192、K192。I-SceI的下述突变将使第14位对C的优先性改变至G :K147、Κ161、R161、R197、D192、E192。I-SceI的下述突变将使第14位对C的优先性改变至T :K161、Q192。I-SceI的下述突变将保持第15位对C的优先性Ε151。I-SceI的下述突变将使第15位对C的优先性改变至G :Κ151。I-SceI的下述突变将使第15位对C的优先性改变至T :C151、L151、Κ151。I-SceI的下述突变将保持第17位对A的优先性N152、S152、C150、L150、V150、T150。I-SceI的下述突变将使第17位对A的优先性改变至C :Κ152、Κ150。I-SceI的下述突变将使第17位对A的优先性改变至G :N152、S152、D152、D150、Ε150。I-SceI的下述突变将使第17位对A的优先性改变至T :Q152、Q150。I-SceI的下述突变将使第18位对G的优先性改变至A :K155、C155。I-SceI的下述突变将使第18位对G的优先性改变R155、K155。I-SceI的下述突变将保持第18位对G的优先性E155。I-SceI的下述突变将使第18位对G的优先性改变至T :H155、Y155。 若干突变的组合可增强效果。一个例子是三重突变体W149G、D150C和N152K,其将使I-SceI在第17位对A的优先性改变至G。为保持酶活性,应当避免I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物的下述突变I38S、I38N、G39D、G39R、L40Q、L42R、D44E、D44G、D44H、D44S, A45E, A45D,Y46D、I47R、I47N、D144E、D145E、D145N 和 G146E。可组合改变了 I-SceI或其在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物的酶活性、DNA结合亲和性、DNA识别序列的突变,以制造经改造的内切核酸酶,例如基于I-SceI的经改造的内切核酸酶、并且较之SEQ ID NO :1所描述的I-SceI具有变动的DNA结合亲和性和/或改变的DNA识别序列。除了理性的改造I-SecI外,还可以利用分子进化改变I-SceI或其在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的酶活性、DNA结合亲和性、DNA识别序列。可例如采用DNA改组方案来调节编码候选内切核酸酶的多核苷酸。DNA改组是递归性重组和突变的方法,其通过对相关基因的库进行随机片段化、接着通过聚合酶链式反应样的方法重新组装片段来进行。见例如,Stemmer(1994)Proc Natl Acad SciUSA 91:10747-10751;Stemmer(1994)Nature 370 :389-391 和 US5, 605,793、US 5,837,458、US 5,830,721和 US5,811,238。还可基于对给定内切核酸酶晶体结构的进一步了解,使用理性设计,来制造经改造的内切核酸酶,见例如,Faj ardo-Sanchez 等人,“Computer design of obligateheterodimer meganucleases allows efficient cutting of custom DNA sequences,,,Nucleic Acids Research,2008,第 36 卷,第 7 期,2163-2173。经改造的内切核酸酶以及它们各自的DNA识别位点的大量例子是本领域已知的,并被公开于例如 WO 2005/105989、WO 2007/034262、W02007/047859、WO 2007/093918、WO2008/093249、WO 2008/102198、WO 2008/152524、WO 2009/001159、WO 2009/059195、WO2009/076292,WO 2009/114321 或 WO 2009/134714,WO 10/001189 中,上述文献均通过引用
并入本文。为了制造优化的核酸酶的突变和改变可以与用于制造经改造的内切核酸酶的突变组合,例如I-SceI的同源物可以是本文所述的优化的核酸酶,但也可以包括用于改变它的DNA结合亲和性和/或改变它的DNA识别序列的突变。
通过调整多核苷酸序列使其适合生物的密码子使用,或者通过从编码内切核酸酶的多核苷酸序列中删除备选的起始密码子或者通过删除隐蔽的多聚腺苷酸化信号,可以改善I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的氨基酸序列,以及编码I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的多核苷酸,其中所述生物中意图表达I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物的。用于制造优化的核酸酶的突变:可以通过改变各个LAGLIDADG内切核酸酶的氨基酸序列,优化已优化过的核酸酶,如优化版本的I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物,来增强蛋白稳定性。因此,较之未经优化的核酸酶的氨基酸序列而言,经优化的核酸酶不包含下 述,或具有降低的数量的下述a) PEST-序列b) KEN-框c)A_ 框,d)D-框,或e)根据N-末端规则包含用于稳定性的经优化的N-端末端,f)包含甘氨酸(glycin)作为N-端第二个氨基酸,或g)a)、b)、c)、d)、e)和 f)的任何组合。PEST序列是约12个氨基酸的序列,其包含至少一个脯氨酸、一个谷氨酸(glutamate)或天冬氨酸(aspartate),以及至少一个丝氨酸或苏氨酸。PEST序列例如被描述于 Rechsteiner M, Rogers Sff. “PEST Sequences and regulation byproteolySis. ” TrendS Biochem. Sci. 1996 ;21(7),267 至 271 页中。KEN-框的氨基酸共有序列是KENXXX(N/D)。A-框的氨基酸共有序列是AQRXLXXSXXXQRVL。
D-框的氨基酸共有序列是RXXL。对核酸酶进行稳定以对抗降解的另一途径是根据N-末端规则优化各内切核酸酶的N-端的氨基酸序列。针对在真核生物中的表达优化过的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸或半胱氨酸。针对在原核生物中的表达优化过的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、异亮氨酸或组氨酸。可通过缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或I个氨
基酸对核酸酶进行优化,而不破坏其内切核酸酶活性。例如,当LAGLIDADG内切核酸酶的氨基酸序列中的部分被缺失的情况下,保留上文所述的LAGLIDADG内切核酸酶基序则是重要的。用于优化核酸酶的另一途径是向核酸酶的氨基酸序列添加核定位信号。例如,SEQID NO :4所描述的核定位信号。经优化的核酸酶可包含上文所述的方法和特征的组合,例如,它们可包含核定位信号,包含甘氨酸作为第二个N-端氨基酸,或者包含C-端的缺失,或这些特征的组合。具有上文所述的方法和特征的组合的经优化的核酸酶的例子是例如SEQ ID NOs :2、3和5所描述的。经优化的核酸酶不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KTIPNNLVENYLTPMSLAYffFMDDGGK,KPIIY-IDSMSYLIFYNLIK, KLPNTISSETFLK,或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KPIIYIDSMSYLIFYNLIK, KLPNTISSETFLK 或TIS-SETFLK, 或者其不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KLPNTISSETFLK 或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列LAYWFMDDGGK, KLPNTISSETFLK 或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列KLPNTISSETFLK或TISSETFLK。在一种实施方式中,经优化的核酸酶是I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99%的序列同一性的同源物,其中,位于野生型I-SceI或其下述同源物的C-端的氨基酸序列TISSETFLK被缺失或突变,所述同源物在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性且在 C-端具有氨基酸序列TISSETFLK。可通过缺失或突变野生型I-SceI或下述其同源物的C-端的至少1、2、3、4、5、6、7、8或9个氨基酸,来缺失或突变氨基酸序列TISSETFLK,所述其同源物在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或99%的序列同一性且在C-端具有氨基酸序列TISSETFLK。表2 :针对野生型I-SceI中TISSETFLK氨基酸序列的缺失的不同例子
权利要求
1.优化的内切核酸酶,其包含与SEQID N0:l、15、16、17或19所描述的多肽具有至少80 %的氨基酸序列同一性的氨基酸序列。
2.权利要求I所述的优化的内切核酸酶,其包含SEQID NO :2、3或5所描述的氨基酸序列。
3.权利要求I所述的优化的内切核酸酶,其是经改造的内切核酸酶。
4.权利要求1、2或3所述的优化的内切核酸酶,其包含与SEQID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且不包含氨基酸序列TISSETFLK。
5.权利要求I至4的任一项所述的优化的内切核酸酶,其包含与SEQID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且包含SEQ ID ΝΟ:1的丝氨酸Nr229的突变。
6.权利要求I至5的任一项所述的优化的内切核酸酶,其与至少ー个锌指结构域,或至少ー个源自转录激活物-样(TAL)效应子的重复单元,或至少ー个锌指结构域和至少ー个源自转录激活物-样(TAL)效应子的重复单元融合。
7.权利要求I至6的任一项所述的优化的内切核酸酶,其还包含SecIII或SecIV分泌信号。
8.包含多核苷酸序列的经分离的多核苷酸,所述多核苷酸序列编码权利要求I至7中任意一项所述的优化的内切核酸酶。
9.权利要求8所述的包含核苷酸序列的经分离的多核苷酸,其中经分离的多核苷酸的序列 a.是经密码子优化的, b.具有低含量的RNA不稳定性基序, c.具有低含量的密码子重复, d.具有低含量的隐蔽剪接位点, e.具有低含量的备选起始密码子, f.具有低含量的限制性位点, g.具有低含量的RNAニ级结构, h.具有a)、b)、c)、d)、e)、f)或g)的任何组合。
10.表达盒,所述表达盒包含与启动子和終止子序列功能性组合的、权利要求8或9所述的经分离的多核苷酸。
11.载体、宿主细胞或非人生物,其包含 a.编码权利要求I至7中任一所述的优化的内切核酸酶的多核苷酸,或 b.权利要求8或9所述的经分离的多核苷酸,或 c.权利要求10所述的表达盒,或 d.a)、b)和c)的任何组合。
12.权利要求11所述的非人生物,其中所述非人生物是植物。
13.用于多核苷酸同源重组的方法,其包括 a.提供用于同源重组的感受态细胞, b.提供下述多核苷酸,所述多核苷酸包含侧翼为序列A和序列B的经优化的内切核酸酶的DNA识别位点,C.提供包含序列A’和B’的多核苷酸,所述序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及 d.提供如权利要求I至7中任意一项所述的优化的内切核酸酶或如权利要求10所述的表达盒, e.在所述细胞中组合b)、c)和d),以及 f.检测b)和c)的重组多核苷酸,或选择出或生长包含b)和c)的重组多核苷酸的细胞。
14.如权利要求13所述的用于多核苷酸同源重组的方法,其中,同源重组之后,步骤a)的所述感受态细胞中包含的多核苷酸序列从步骤f)的生长细胞的基因组中缺失。
15.用于多核苷酸的靶向突变的方法,其包括 a.提供包含含有如权利要求I至7中任意一项所述的经优化的内切核酸酶的DNA识别位点的多核苷酸的细胞, b.提供能切割步骤a)的所述DNA识别位点的、如权利要求I至7中任意ー项所述的经优化的内切核酸酶或权利要求10所述的表达盒, c.在所述细胞中组合a)和b),以及 d.检测经突变的多核苷酸,或选择出或生长包含经突变的多核苷酸的细胞。
16.如权利要求12至14中任意一项所述的用于同源重组或靶向突变的方法,其中所述经优化的内切核酸酶和DNA识别位点通过生物的杂交、通过转化或通过经由融合至经优化的内切核酸酶的SecIII或SecIV肽介导的运送,组合于至少ー个细胞中。
全文摘要
提供了优化的内切核酸酶,以及使用优化的内切核酸酶靶向整合、靶向缺失或靶向突变多核苷酸的方法。
文档编号C12N15/63GK102725412SQ201080062324
公开日2012年10月10日 申请日期2010年11月25日 优先权日2009年11月27日
发明者A·赫鲁贝克, C·比斯根 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1