切割来自谷氨酰胺合成酶基因的dna靶序列的大范围核酸酶变体及其用途的制作方法

文档序号:571507阅读:655来源:国知局
专利名称:切割来自谷氨酰胺合成酶基因的dna靶序列的大范围核酸酶变体及其用途的制作方法
切割来自谷氨酰胺合成酶基因的DNA靶序列的大范围核酸
酶变体及其用途本发明涉及切割来自谷氨酰胺合成酶(Glutamine Synthetase, GS)基因的 DNA靶序列的大范围核酸酶(meganuclease)变体,编码所述变体的载体,经所述载体修饰的细胞、动物或植物以及所述大范围核酸酶变体及衍生产物用于基因组工程(genome engineering)以及体内和离体基因组疗法(基因细胞疗法)的用途。谷氨酰胺合成酶(GS)也称为谷氨酸-氨连接酶(glutamate-ammonia ligase, GLUL),是一种负责从谷氨酸和氨进行谷氨酰胺生物合成的遍在管家酶,其使用ATP水解成 ADP和磷酸来驱动反应。因此,其是三羧酸循环和氨基酸代谢之间的重要连接(Meister et al.,1980,Glutamine metabolism,enzymology and regulation,Academic Press,N. Y., p. 1-40 and 319-329).该酶促反应是哺乳动物细胞中谷氨酰胺形成的通路。培养基中不存在谷氨酰胺时,GS酶在培养哺乳动物细胞的存活中起到关键性作用。谷氨酰胺合成酶由基因进化历史中最古老的功能性基因之一所编码,可被认为是原核生物和真核生物代谢中一个关键的酶(Kumada et al. ,2003,PNAS USA,90 :3009-3013)。由于其生物学功能,GS基因用作基因组工程(靶向和随机基因操作)的阳性选择标记。在大多数高等脊椎动物细胞中发现GS为低水平(可溶性蛋白的0.01%-0. 1%), 在某些特化细胞类型例如肝细胞、脂肪细胞和神经胶质细胞中水平较高( >总蛋白的) (Tiemeier et al. , 1972, J.Biol. Chem. , 247 :2272-2277 ;Gebhardt et al. ,1983, EMBO J. ,2 :567-570 ;Miller et al.,1978,PNAS USA,75 :1418-1422 ;Linser et al.,1979, PNAS USA,76 :6476-6480)。在细胞内,多种调节信号影响GS水平,例如糖皮质激素类固醇和cAMP,培养基中的谷氨酰胺似乎通过ADP核糖基化而对GS水平进行翻译后调节(Milman et al.,1975,J. Biol. Chem.,250 :1393-1399 ;Arad et al.,1976,Cell,8 :59-101)。一些哺乳动物细胞系(例如小鼠骨髓瘤细胞系)不表达足以在不添加谷氨酰胺的情况下存活的GS。在这些细胞系中,转染的GS基因可用作允许其在无谷氨酰胺培养基中生长的选择标记。其他细胞系(例如中国仓鼠卵巢(CHO)细胞系)表达足以在没有外源谷氨酰胺的情况下存活的GS。在这些情况下,可使用GS抑制剂如甲硫氨酸砜亚胺(methionine sulphoximine, Msx)来抑制内源GS活性,使得只有具有额外GS活性的转染子可存活。对于蛋白质生产来说,哺乳动物细胞是具有吸引力的,因为与市场上通常的细菌细胞表达的蛋白质不同,这些蛋白质一般正确折叠、合适地进行了修饰并且具有完全的功能。称为GS System 的哺乳动物表达系统由Lonza Biologies所开发,其使用CH0-K1 细胞来生产所需蛋白质。CH0-K1细胞产生内源GS,但是它们可通过转染GS基因并使用添加Msx(以足以抑制内源酶的水平)的无谷氨酰胺培养基来提供选择压力以及转染目的基因而用于产生稳定细胞系。GS System 已用于产生多种重组蛋白质,特别是已获得管理部门批准的治疗性产品。目前,有超过50种使用GS System 的产品在进行临床试验,5种产品已上市,例如 Zenapax (Roche)禾口 Synagis (MedImmune)。
尽管如此,为抑制GS内源表达的GS抑制剂的使用仍不完全令人满意,因为残余表达仍然存在。该问题可通过直接失活内源GS基因来克服。该失活可通过使用能够在活细胞中产生DNA双链断裂(DSB)以及切割独特位点的位点特异性核酸内切酶例如大范围核酸酶来实现。随后可通过同源重组(图3A)或非同源末端连接(Non Homologous End Joining, NHEJ)(图3B)来修复该切割。因此,靶向GS基因的人工大范围核酸酶可用于失活GS基因。谷氨酰胺合成酶在人体中也普遍表达,在肝、脑和肌肉组织中具有高浓度 (Haussinger D et al. , 1984, Glutamate Metabolism in Mammalian Tissues. Berlin Springer Verlag,3_15)。GS在氨和谷氨酰胺解毒、器官间氮流、pH内稳态和细胞信号转导中起重要作用(HSl^singer D,1998,Adv Enzymol RAMB 72:43-86)。已经在具有早
期致死病程的两个新生儿中描述了基于谷氨酰胺合成酶缺陷的谷氨酰胺先天系统性缺陷 HaberIe et al.,2006,J Inherit Metab Dis,29,352-358)。在其血清、尿和脑脊液中大量缺少谷氨酰胺。在两个患者中均检测到谷氨酰胺合成酶外显子7的纯合突变。一个患者中精氨酸3 替换为半胱氨酸(R3MC),另一个中精氨酸341替换为半胱氨酸(R341C)。谷氨酰胺合成酶酶学研究证实了这些突变导致谷氨酰胺合成酶活性严重降低。靶向同源重组将允许原位对突变进行精确矫正(correction)(图3C)。因此,可使用靶向GS基因的人工大范围核酸酶来修复与谷氨酰胺先天系统性缺陷相关的突变。同源重组(HR)是一种非常保守的DNA修复途径,其涉及DNA双链断裂(DSB)和其他 DNA 损伤的修复(Rothstein, Methods Enzymo 1.,1983,101,202-211 ;Paques 等, Microbiol Mol Biol Rev,1999,63,349-404 ;Sung 等,Nat. Rev. Mol. Cell. Biol.,2006, 7,739-750),但是也是许多生物学现象的基础,例如减数分裂中等位基因的减数分裂再分布(Roeder, Genes Dev.,1997,11,洸00_2621)、酵母中的接合型互换(Haber, Annu. Rev. Genet.,1998,32,561-599)以及I类内含子和蛋白内含子(intein)到新等位基因的“归巢”。HR通常促进内源序列之间遗传信息的交换,但是在基因靶向实验中,其被用于促进内源染色体序列与外源DNA构建体之间的交换。基本上,向细胞核中引入与所靶向的序列具有同源性的DNA,内源的同源重组机器提供了接下来的步骤(图3C)。同源基因靶向策略已用于在染色体中敲除内源基因(Capecchi,Μ. R.,Science, 1989,244,1288-1292 ;Smithies, 0. , Nature Medicine,2001,7,1083-1086)或敲入 (knock-in)外源序列。其同样也可用于基因矫正,并原则上用于矫正与单基因疾病相关的突变。然而,由于该过程的低效率(转染细胞的10_6到10_9),该应用事实上是困难的。增强重组效率的几种策略之一是使用大范围核酸酶向靶基因座中递送DNA双链断裂。大范围核酸酶定义为识别大序列的序列特异性内切核酸酶(Thierry,A. and B. Dujon, Nucleic Acids Res.,1992,20,5625-5631)。它们能够在活细胞中切割独特的位点,从而将切割位点附近的基因靶向增强1000倍或更多(Puchta等,Nucleic Acids Res.,1993,21,5034-5040 ;Rouet 等,Mol. Cell. Biol.,1994,14,8096-8106 ;Choulika 等, Mol. Cell. Biol.,1995,15,1968-1973 ;Puchta 等,Proc. Natl. Acad. Sci. U. S. Α.,1996, 93,5055-5060 ;Sargent 等,Mol. Cell. Biol.,1997,17,267-277 ;Cohen_Tannoudji 等, Mol. Cell. Biol.,1998,18,1444-1448 ;Donoho,等,Mol. Cell. Biol.,1998,18,4070-4078 ; Elliott等,Mol. Cell. Biol.,1998,18,93-101)。这样的大范围核酸酶可用于矫正造成单基因遗传疾病的突变。矫正遗传缺陷的最精准方法是使用带有未突变基因拷贝的修复基质(repair matrix),得到突变的回复。然而,基因矫正的效率随着突变与DSB之间距离的增长而降低, 200bp的距离降低五倍。因此,可使用给定的大范围核酸酶矫正仅在其DNA靶标附近的突变 (图 3C)。图3D中展示了称为“外显子敲入”的替代方案。在该情况下,可以使用在基因5' 部分进行切割的大范围核酸酶将功能性外显子序列敲入有害突变的上游。尽管该方法将转基因置于其常规位置,但是它也引起外显子重复(exons duplication),其长期影响尚待评价。另外,如将天然顺式作用元件置于切割下游的内含子中,则其直接环境将被改变,其固有功能也有待于探索。然而,该方法具有一个巨大的优点一种大范围核酸酶可用于大范围核酸酶切割位点下游的许多不同突变。然而,尽管鉴定了数百种天然的大范围核酸酶(也称作“归巢内切核酸酶”) (Chevalier, et al. ,2001 Nucleic Acids Res.,29,3757-3774),但可切割序列的种类过于有限而不能应对基因组的复杂度,例如在GS基因中没有切割位点。理论上,产生具有选定特异性的人造序列特异性内切核酸酶能够缓解这一局限性。因此,具有定制特异性的大范围核酸酶的产生处于紧张的研究中。最近,使用了锌指蛋白(ZFPs)与R)kl(—种IIS类限制性内切核酸酶)催化结构域的融合物来产生功能性序列特异性内切核酸酶(Smith等,Nucleic Acids Res., 1999,27,674-681 ;Bibikova 等,Mol. Cell. Biol. ,2001,21,289-297 ;Bibikova 等, Genetics,2002,161,1169-1175 ;Bibikova 等,Science,2003,300,764 ;Porteus, M. H. and D. Baltimore, Science, 2003, 300, 763- ;Alwin 等,Mol. Ther.,2005,12,610-617 ;Urnov 等, Nature, 2005,435,646-651 ;Porteus, Μ. H.,Mol. Ther.,2006,13,438-446)。Cys2-His2型锌指蛋白的结合特异性是容易操纵的,可能因为它们代表了简单 (特异性基本上由每个锌指上的四个残基决定)和模块化的系统(Pabo等,Annu. Rev. Biochem.,2001,70,313-340 Jamieson 等,Nat. Rev. Drug Discov.,2003,2,361-368)。来自 Pabo(Rebar, E.J.和 C. 0. Pabo, Science,1994,263,671-673 ;Kim,J. S.和 C. 0. Pabo, Proc. Natl. Acad. Sci. U S A,1998,95,2812—2817)、Klug (Choo,Y.禾口 A. Klug,Proc. Natl. Acad.Sci. USA,1994,91,11163-11167 ;Isalan Μ.和 A. Klug, Nat. Biotechnol.,2001,19, 656-660)和Barbas(Choo,Y.和A. Klug,Proc. Natl. Acad. Sci. USA,1994,91,11163-11167 ; Isalan Μ.和 A. Klug,Nat. Biotechnol.,2001,19,656-660)实验室的研究产生了能够结合大部分G/ANNG/ANNG/ANN序列的多种新人工ZFP。然而,ZFP可能具有其局限性,特别是对于需要极高水平特异性的应用(如治疗应用)而言。融合物中的i^okl核酸酶活性以二聚体发挥作用,但是最近显示其仅在两个单体之一与DNA结合或者两个单体结合两个远离的DNA序列时切割DNA (Catto等,Nucleic Acids Res.,2006,34,1711-1720)。因此,特异性可以是高度简并(degenerate)的,如在哺乳动物细胞(Porteus, M. H.和 D. Baltimore,Science,2003,300,763)和果蠅(Bibikova 等,Genetics,2002,161,1169-1175 ;Bibikova 等,Science,2003,300,764-)中的毒性所显示的。在自然界中,大范围核酸酶基本上由归巢内切核酸酶(Homing Endonuclease)代表。归巢内切核酸酶(HE)是一种广泛的天然大范围核酸酶家族,包括数百个蛋白质家族 (Chevalier, B. S. ^P B. L. Stoddard, Nucleic Acids Res.,2001,29,3757-3774)。这些蛋白质由可动遗传因子编码,所述可动遗传因子通过称作“归巢”的过程繁殖内切核酸酶切割其中不存在该可动遗传因子的同源等位基因,从而刺激同源重组事件,所述事件将该可动DNA复制进受者基因座。考虑到它们在效率和特异性方面的特有切割特性,它们可代表产生新的高度特异性内切核酸酶的理想骨架(scaffold)。HE属于四个主要的家族。LAGLIDADG家族(根据涉及催化中心的保守肽基序命名)是分布最广和最充分表征的一组。目前能够获得七种结构。尽管来自该家族的大部分蛋白质是单体的并展示两种LAGLIDADG基序,但是少数仅具有一个基序,因而发生二聚化以切割回文或假回文的靶序列。尽管LAGLIDADG肽是该家族成员中唯一的保守区,但是这些蛋白质共有非常类似的结构(

图1A)。催化核心侧翼是两个DNA结合结构域,对同二聚体(如I-CreI (Chevalier, 等,Nat. Struct. Biol.,2001,8,312-316),I-MsoI (Chevalier 等,J. Mol. Biol.,2003,329, 253-269)和 I-CeuI (Spiegel et al.,Structure, 2006,14,869-880))而言具有完全的二重对称性,对单体(如 HceI (Moure 等,J. Mol. Biol.,2003,334,685-69),I-DmoI (Silva 等,J. Mol. Biol.,1999,286,1123-1136)或 I-AniI (Bolduc 等,Genes Dev.,2003,17, 2875-2888))而言具有假对称性。两个单体和两个结构域(对于单体蛋白质而言)组成组织在二价阳离子周围的催化核心。就在催化核心上方的两个LAGLIDADG肽也在二聚化界面中起关键作用。DNA结合依赖于位于DNA大沟上的两个典型的鞍形αββαββα折叠。其他结构域可见于蛋白内含子(如PI-PfuI (Ichiyanagi等,J. Mol. Biol.,2000,300, 889-901)和 PHceI (Moure 等,Nat. Struct. Biol.,2002,9,764-770)中,其蛋白质剪接结构域也参与DNA结合。通过将N端I-DmoI结构域与I-CreI单体融合来产生功能性嵌合大范围核酸酶 (Chevalier 等,Mol. Cell.,2002,10,895-905 ;Epinat 等,Nucleic Acids Res, 2003, 31, 2952-62 ;国际 PCT 申请 WO 03/078619 和 WO 2004/031346)已证明了 LAGLIDADG 蛋白的可塑性。不同的小组还使用半推理性方法来局部改变I-CreI(Seligman等,Genetics, 1997,147,1653-1664 ;Sussman 等,J. Mol. Biol.,2004,342,31-41 ;国际 PCT 申请 WO 2006/097784,WO 2006/097853, WO 2007/060495,和 WO 2007/049156 ;Arnould 等,J. Mol. Biol. ,2006,355,443-458 ;Rosen 等,Nucleic Acids Res. ,2006,34,4791-4800 ;Smith 等,Nucleic Acids Res.,2006,34,el49),I-SceI (Doyon 等,J. Am. Chem. Soc.,2006,128, 2477-2484),PHceI (Gimble 等,J. Mol. Biol.,2003,334,993-1008)和 I-MsoI (Ashworth 等,Nature,2006,441,656-659)的特异性。另外,通过将半推理方法和高通量筛选组合在一起,改造了具有局部改变之特异性的数百种I-CreI衍生物-诱变I-CreI的残基Q44,R68和R70或Q44,R68,D75和177,并通过筛选(国际PCT 申请 WO 2006/097784 和 WO 2006/097853 ;Arnould 等,J. Mol. Biol.,2006,355,443-458 ; Smith 等,Nucleic Acids Res. ,2006,34, el49)鉴定在 DNA 靶标(5NNN DNA 靶标)的士3 到5位中具有改变特异性的变体集合。
-诱变I-CreI 的残基 K28, N30 和 Q38,N30, Y33 和 Q38 或 K28,Y33, Q38 和 S40,并通过筛选(Smith 等,Nucleic Acids Res.,2006,34,el49 ;国际 PCT 申请 WO 2007/060495 和TO 2007/049156)鉴定在DNA靶标(10NNN DNA靶标)的士8到10位中具有改变特异性
的变体集合。将两个不同的变体组合并装配在能切割嵌合靶标的一个功能性异二聚体内切核酸酶中,所述嵌合靶标得自每个变体DNA靶序列中不同一半的融合物(Arnould等, precited ;国际 PCT 申请 WO 2006/0978 和 WO 2007/034262),如图 IB 中所示。另外,I-CreI的28到40位以及44到77位残基显示形成两个可分离的功能性亚结构域,其能够结合归巢内切核酸酶半位点的不同部分(Smith等Nucleic Acids Res., 2006,34,el49 ;国际 PCT 申请 WO 2007/049095 和 WO 2007/057781)在相同单体内组合I-CreI中两个亚结构域的突变使得能够设计出新的嵌合分子 (同二聚体),其能切割含有通过各亚结构域结合的士3至5位以及士8至10位的核苷酸的回文组合 DNA 靴序列(Smith 等,Nucleic Acids Res.,2006,34,el49 ;国际 PCT 申请 WO 2007/049095 和 WO 2007/057781)。在国际PCT 申请 WO 2004/067736 ;Epinat et al.,Nucleic Acids Res. ,2003, 31,2952-2962 ;Chames et al.,Nucleic Acids Res.,2005,33,el78 禾口 Arnould et al., J. Mol.Biol.,2006,355,443-458中,描述了在哺乳动物或酵母细胞中产生大范围核酸酶变体的方法以及基于切割诱导重组的测定,其用于筛选特异性改变的变体。这些测定产生可通过标准方法监测的功能性LacZ报告基因。所述两个前述步骤的组合允许进行包括4种不同亚结构域的更大的组合方法。可分别修饰不同的亚结构域,并将其组合以获得完全重新设计的具有选定特异性的大范围核酸酶变体(异二聚体或单链分子),如图IC所示。在第一步中,将几对新的大范围核酸酶组合在切割来自希望切割之靶标的回文靶标的新分子(“半大范围核酸酶”)中。然后,这种“半大范围核酸酶”的组合可得到切割目的靶标的异二聚体种类。在Smith等(Nucleic Acids Res.,2006,34,el49)和 Arnould 等,(J. Mol.Biol.,2007,371,49-65)和 W02008/059382 中分别描述了将4组突变组装成切割模型靶序列或来自人RAGl、XPC和HPRT基因的序列的异二聚体内切核酸酶。这些变体可用于切割天然染色体序列,并在包括基因治疗的几个领域中开辟了具有新前景的道路。然而,尽管士1和士2位碱基对不显示与蛋白质有任何接触,但是已显示这些位置并非没有信息含量(Chevalier等,J. Mol.Biol.,2003,3 ,253-269)(特别是对于士1位碱基对而言),并且可以是额外的底物特异性的来源(Argast等,J. Mol. Biol.,1998,280, 345-353 Jurica 等,Mol. Cell.,1998,2,469-476 ;Chevalier, B. S. and B. L. Stoddard, Nucleic Acids Res.,2001,29,3757-3774)。对随机诱变的可切割的 I-Crel 靴标(Argast 等,前文所述)进行的体外选择揭示了这四个碱基对对于蛋白质结合和切割活性的重要性。已提出,存在于活性位点中的有序水分子网络对于DNA靶标的定位是重要的 (Chevalier 等,Biochemistry,2004,43,14015-14026)。另外,I-CreI 结合后该区域中出现的广泛的构象改变表明,四个中心核苷酸可对底物特异性做出贡献,可能是通过序列依赖性的构象偏好来实现(Chevalier等,2003,前文所述)。
因此,尚不清楚在10NNN和5NNN DNA靶标上被鉴定为切割回文序列(四个中心核苷酸为gtac)之同二聚体的变体是否允许设计新的内切核酸酶,所述内切核酸酶会切割在四个中心核苷酸中含有改变的靶标。本发明人在GS基因中鉴定了一系列能够被I-CreI变体切割的DNA靶标(图 18-20)。使用图ID中描述的组合方法完全重新设计I-CreI蛋白质的DNA结合结构域, 并进而改造出具有完全改造的特异性的新大范围核酸酶,以切割一种DNA靶标(GSCHOl)。 GSCHOl靶标存在于小鼠(图2A)和中国仓鼠(Criteculus griseus,图2B)GS基因中,其与 I-CreI C1221 22bp回文位点的区别在于包含四个中心核苷酸中两个(+1、+2位)的15个核苷酸(图4)。在第一个步骤中,将一对新大范围核酸酶组合成切割来源于想要切割的靶标的回文靶标的新分子(“半-大范围核酸酶”)。然后,此“半-大范围核酸酶”的组合可产生切割目的靴标的异二聚体种类。之前 Smith et al.,Nucleic Acids Res. ,2006,34, el49 B 经描述了将四组突变组装成切割模型靶序列或者来自人RAGl基因之序列的异二聚体核酸内切酶。尽管最初分别针对核苷酸10NNN和5NNN鉴定了组合变体,并且观察到靶标的四个中心核苷酸对经改造大范围核酸酶之活性的强烈影响,但是仍然选择出具有重大的特异性改变的功能性大范围核酸酶。另外,与I-CreI蛋白质的活性相比,可以通过随机和/或定点诱变和筛选显著改进所改造蛋白质的活性。这些能够切割来自GS基因的基因组DNA靶标的I-CreI变体可用于失活GS基因座(敲除或敲入)(图3A和3B),由此使得GS在任何座位用作基因组工程的选择标记,例如用于产生转基因动物和重组细胞系。此外,这些I-CreI变体可用于修复与先天系统性谷氨酰胺缺陷相关的GS突变(图3C和3D)。本发明涉及I-CreI变体,其中两个I-CreI单体的至少一个中含有至少两个替换, 其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述功能性亚结构域分别位于I-CreI的位置28到40和44到77,所述变体能够切割来自GS基因的DNA靶序列。可以通过任何公知的体外或体内切割测定法测量本发明变体的切割活性,例如国际 PCT 申请 WO 2004/067736 ;Epinat 等,Nucleic Acids Res.,2003,31,2952-2962 ; Chames 等,Nucleic Acids Res.,2005,33,el78 ; Arnould et al. ,J. Mol. Biol. ,2006,355, 443-458,和Arnould等,J. Mol. Biol.,2007,371,49-65中所述的测定法。例如,可通过直接重复重组测定法,使用报告载体在酵母或哺乳动物细胞中测量本发明变体的切割活性。报告载体在间插序列内包含报告基因的两个截短的非功能性拷贝(直接重复)和基因组(非回文)DNA靶序列,所述间插序列克隆到酵母或哺乳动物表达载体中。通常,基因组DNA靶序列包含每种(回文或假回文)亲本同二聚体I-CreI大范围核酸酶靶序列的不同的一半。 变体的表达产生功能性内切核酸酶,其能够切割基因组DNA靶序列。该切割诱导直接重复之间的同源重组,产生功能性报告基因,其表达可以通过合适的测定法监测。可将变体对基因组DNA靶标的切割活性与野生型I-CreI或HceI对其天然靶标的活性进行比较。定义-多肽序列中的氨基酸残基在本文中根据单字母代码命名,其中例如Q表示Gln或谷氨酰胺残基,R表示Arg或精氨酸残基,D表示Asp或天冬氨酸残基。
-核苷酸如下命名使用单字母代码命名核苷的碱基a为腺嘌呤,t为胸腺嘧啶,c 为胞嘧啶,g为鸟嘌呤。对于简并核苷酸而言,r表示g或a(嘌呤核苷酸),k表示g或t, S表示g或c, w表示a或t, m表示a或c, y表示t或c (啼唆核苷酸),d表示g, a或t, ν
g, a gJc c, b g, t gJc c, h a, t gJc c, η g, a, t c。-“大范围核酸酶”是指具有12到45pb双链DNA靶序列的内切核酸酶。所述大范围核酸酶是其中各结构域位于单体上的二聚体酶,或是在单个多肽上包含两个结构域的单体酶。-“大范围核酸酶结构域”是指这样的区域,其与大范围核酸酶DNA靶标的一半相互作用,并能够与相同大范围核酸酶的另一结构域结合,形成能够切割DNA靶标的功能性大范围核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。-“大范围核酸酶变体”或“变体”是指通过将野牛型大范围核酸酶(天然大范围核酸酶)氨基酸序列中的至少一个残基替换为不同的氨基酸而获得的大范围核酸酶。-“功能件变体”是指能够切割DNA靶序列的变体,优选地所述靶标是不被母体大范围核酸酶切割的新靶标。例如,这些变体在接触DNA靶序列的位置或与所述DNA靶标直接或间接相互作用的位置上具有氨基酸改变。- “ I-CreI ”是指具有pdb登录号lg9y序列(对应于序列表中的序列SEQ ID NO 1)的野生型I-CreI。-“具有新特异件的I-CreI变体”是指具有与母体大范围核酸酶不同的靶标切割模式的变体。等价且无差异地使用的术语“新特异性”,“经修饰的特异性”,“新切割特异性”, “新底物特异性”是指变体针对DNA靶序列中核苷酸的特异性。-“ I-CreI位点”是指被I-CreI切割的22到Mbp双链DNA序列。I-CreI位点包括野生型(天然)非回文I-CreI归巢位点和衍生的回文序列,如序列5’-t_12C_lia_1(ia_9a_8a_
10g+11a+12 (SEQ ID NO :2),也称为 C1221 (图 4)。-“结构域”或“核心结构域”是指“LAGLIDADG归巢内切核酸酶核心结构域”,它是 LAGLIDADG家族归巢内切核酸酶的特征性ajii^c^i^i^c^折叠,对应于约一百个氨基酸残基的序列。所述结构域包含在折叠成反向平行β-片层的四条β链(3力#3旦4), 所述β-片层与DNA靶标的一半相互作用。该结构域能够与另一 LAGLIDADG归巢内切核酸酶结构域结合,形成能够切割DNA靶标的功能性内切核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。例如,在二聚体归巢内切核酸酶I-CreI (163个氨基酸)的情况下, LAGLIDADG归巢内切核酸酶核心结构域对应于残基6到94。-“亚结构域”是指LAGLIDADG归巢内切核酸酶核心结构域中的区域,其与归巢内切核酸酶DNA靶标半位点的不同部分相互作用。- “ g -发夹”是指LAGLIDADG归巢内切核酸酶核心结构域反向平行β -片层的两条连续β-链(^^或β 3β4),其通过环或转角相连。-“单链大范围核酸酶”,“单链嵌合大范围核酸酶”,“单链大范围核酸酶衍生物”, “单链嵌合大范围核酸酶衍生物”或“单链衍生物”是指包含通过肽间隔区连接的两个 LAGLIDADG归巢内切核酸酶结构域或核心结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靶序列,所述靶序列包含各母体大范围核酸酶靶序列中不同的一半。- "DNA靶标”,“DNA靶序列”,“靶序列”,“靶位点”,“靶标”,“位点”;“目的位点”;“识别位点”,“识别序列”,“归巢识别位点”,“归巢位点”,“切割位点”是指被LAGLIDADG归巢内切核酸酶(例如I-CreI或其变体,或来自于I-CreI的单链嵌合大范围核酸酶)识别并切割的20到Mbp双链回文,局部回文(假回文)或非回文的多核苷酸序列。这些术语是指大范围核酸酶要在其中诱导双链断裂(切割)的独特DNA定位,优选地为基因组定位。DNA 靶标通过双链多核苷酸一条链的5'到3'序列来定义,如上文针对C1221所指出的。DNA 靶标的切割分别发生在有义和反义链位置+2和-2的核苷酸处。除非另有说明,否则I-Cre I大范围核酸酶变体对DNA靶标进行切割的位置对应于DNA靶标有义链上的切割位点。- “DNA靶标半位点”,“半切割位点”或“半位点”是指DNA靶标中与各个LAGLIDADG 归巢内切核酸酶核心结构域结合的部分。-“嵌合DNA靶标”或“杂合DNA靶标”是指两条母体大范围核酸酶靶序列不同的一半的融合物。另外,所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷酸组合(组合DNA靶标)。-是指谷氨酰胺合成酶或谷氨酸-氨连接酶(GLUL)基因,优选脊椎动物的GS基因,更优选哺乳动物的GS基因例如人、小鼠和中国仓鼠(Criteculus griseus) 的GS基因。GS基因序列可得自序列数据库,例如NCBI/GenBank数据库。人GS基因序列 (9282bp ;SEQ ID NO :272)可以登录号NC_000001. 9 (180618292 至 180627573位的反向互补序列)获得。小鼠GS基因序列(9770bp ;SEQ ID NO 3)可以登录号NC_000067. 5 (155747075 至155756844位的反向互补序列)获得。两个基因都具有7个外显子。小鼠GS基因在图 2A显示(外显子1(1至115位),外显子2 (四90至3168位),外显子3(4593至47 位), 外显子4 (6405至6551位),外显子5 (7076至7203位),外显子6 (7342至7541位)和外显子7 (7920至9770位))。人GS基因包含外显子1 (1至137位),外显子2 (3066至3244 位),外显子3 (4524至4685位),外显子4 (5414至5560位),外显子5 (5929至6056位), 外显子6 (6260至6459位)和外显子7 (7093至9282位)。从外显子2 (3003位(小鼠GS)) 或3079位(人GS))开始处至外显子7 (8238位(小鼠⑶)或7411位(人GS))开始处的 ORF的侧翼是分别位于5’和3’末端的长非翻译区。小鼠基因转录为2782bp mRNA(GenBank NM_008131),其含有 1 至 1250 位的 GS 0RF。中国仓鼠(Criteculus griseus) GS mRNA 是含有 147 至 1268 位的 GS ORF 的 1421bp 序列(登录号 GenBank X03495)(图 2B)。“来自GS基因的DNA靶序列”,“基因组DNA靶序列”,“基因组DNA切割位点”,“基因组DNA靶标”或“基因组靶标”是指如上所述GS基因中被大范围核酸酶变体或单链嵌合大范围核酸酶衍生物识别并切割的20到Mbp序列。-“载体”是指能够转运与之连接的另一核酸的核酸分子。- “M遯”是指一条序列与另一序列具有足够导致序列间同源重组的同一性,更具体地具有至少95 %的同一性,优选97 %的同一性,更优选99 %的同一性。-“同一件,,是指两个核酸分子或多妝之间的序列同一件。可通过比较各序列中可为比较目的而比对的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据时,则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核酸序列间共有的位置上相同或匹配的核苷酸数量的函数。可使用多种比对算法和/或程序计算两条序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分析包(University of Wisconsin, Madison, Wis.)的一部分获得,并可以例如默认设定使用。
是指在多核苷酸(cDNA,基因)或多肽序列中替换,缺失,添加一个或多个核苷酸/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。本发明的变体可以是同二聚体或异二聚体。优选地,异二聚体的两个单体在观到 40位和/或44到77位中被突变。更优选地,两个单体均在I-CreI的28到40位以及44 到77位中具有不同的替换。在所述变体的一个优选的实施方案中,位于I-CreI中44到77位的亚结构域中的所述替换位于44,68,70,75和/或77位。在所述变体的另一个优选的实施方案中,位于I-CreI中28到40位的亚结构域中的所述替换位于28,30,32,33,38和/或40位。在所述变体的另一个优选实施方案中,其在直接或通过水分子与DNA骨架或核苷酸碱基相互作用或与DNA靶序列接触的其他氨基酸残基位置上包含一个或多个突变;这些残基是本领域公知的(Jurica 等,Molecular Cell.,1998,2,469-476 ;Chevalier 等, J. Mol. Biol.,2003,329,253-269)。具体地,可在与磷酸骨架接触的位置例如最终的C端环 (137 到 143 位;Prieto 等,Nucleic Acids Res.,Epub 22April 2007)上引入另外的替换。 优选地,所述残基涉及所述DNA切割位点的结合和切割。更优选地,所述残基处于I-CreI 的138,139,142或143位上。可以在一个变体中突变两个残基,条件是各个突变在选自以下的不同残基对中138和139位残基对以及142和143位残基对。所引入的突变改变最终C端环中所述氨基酸与I-CreI位点中磷酸主链的相互作用。优选地,用疏水氨基酸替换 138或139位上的残基,以避免与DNA切割位点的磷酸主链形成氢键。例如,用丙氨酸替换 138位的残基,或用甲硫氨酸替换139位的残基。有利地用小氨基酸(例如甘氨酸)替换 142或143位的残基,以减小这些氨基酸残基侧链的大小。更优选地,最终C端环中的所述替换改变了变体针对I-CreI位点中士 1到2,士6到7和/或士11到12位的特异性。在所述变体的另一个优选实施方案中,其包含一个或多个额外的突变,所述突变改善变体对来自谷氨酰胺合成酶基因之DNA靶序列的结合和/或切割特性。被突变的额外残基可位于整个I-CreI序列上,尤其是I-CreI的C端一半(80到 163位)。I-CreI的两个单体均有利地被突变;每个单体上的突变可以相同或不同。例如, 变体在 2、3、6、7、12、19、24、35、39、43、45、47、50、54、57、59、60、64、66、80、87、92、96、105、 107、110、114、117、118、119、120、125、129、132、137、139、153、154、160 和 161 位上包含一个或多个额外的替换。所述替换有利地选自以下N2S、T3A、N6K、K7E、Y12H、G19S、G19A、IMV、 F35L、L39V、F43L、V45L、V45M、Q47K、Q50R、F54L、K57E、V59A、D60Y、V64A、Y66H、E80K、F87L、 F87I、Q92R、K96R、V105A、K107R、E110V、S114F、S114P、E117V、S118T、P119L、D120A、D120E、 V125I、V129A、I132V、D137N、D137Y、K139R、D153N、S154G、K160R、S161P 和 S161T。更优选地,变体包含至少一个选自G19S、ra4L、E80K、F87L、V105A和I132V的替换。所述变体还可在C端包含额外的残基。例如,分别可在I-CreI的164和165位插入甘氨酸(G)和/或脯氨酸⑵残基。根据所述变体的一个更优选的实施方案,所述额外的突变还削弱了功能性同二聚体的形成。更优选地,所述突变是G19S突变。G19S突变被有利地引入异二聚体I-CreI变体的两个单体之一中,从而获得具有增强的切割活性和增强的切割特异性的大范围核酸酶。另外,为了进一步增强切割特异性,另一单体可带有削弱功能性同二聚体的形成或者有助于异二聚体的形成的不同突变。在所述变体的另一个优选的实施方案中,所述替换是用选自A、D、E、G、H、K、N、P、 Q、R、S、T、Y、C、V、L、M、F、I和W的氨基酸代替原始氨基酸。本发明的变体可以衍生自野生型I-CreI (SEQ ID NO 1)或者与SEQ ID NO :1具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的I-CreI骨架蛋白,例如在I-CreI序列中具有2位丙氨酸插入、和在C端(164到166位)AAD插入的称为I-CreI N75的骨架(167个氨基酸;SEQ ID NO 4)。另外,本发明的变体可包含一个或多个在序列NH2端和/或COOH端插入的残基。 例如,在NH2端和/或COOH端引入标签(表位或多聚组氨酸序列);所述标签可用于所述变体的检测和/或纯化。变体也可以包含核定位信号(NLQ ;所述NLS可用于将所述变体输入细胞核中。NLS可以被恰好插入变体的第一甲硫氨酸后,或恰好插入N-端标签后。本发明的变体可以是能够切割回文或假回文DNA靶序列的同二聚体。或者,所述变体是异二聚体,其得自I-CreI中28到40位和44到77位中具有不同替换的第一和第二单体的结合,所述异二聚体能够切割来自GS基因的非回文DNA靶序列。被I-CreI变体切割的DNA靶序列存在于至少一种哺乳动物GS基因中,其选自人、 小鼠和/或中国仓鼠(Criteculus griseus) GS基因。DNA靶序列位于GS ORF中,这些序列覆盖所有的GS ORF (图18至20)。例如,DNA靶序列SEQ ID N0:5至28(图18)存在于人GS基因中。DNA靶序列SEQ ID NO :19和29至48存在于小鼠GS基因中(图19)。DNA靶序列SEQ ID N0:19、29、30、 34、46、47和49至60存在于中国仓鼠GS基因中(图20)。DNA靶序列SEQ ID NO :19存在于人、小鼠和中国仓鼠GS基因中。因此,切割DNA 靶序列SEQ ID NO 19的I-CreI变体能够诱导人、小鼠和中国仓鼠GS基因中的位点特异性修饰。DNA靶序列SEQ ID NO :29、30、34、46和47存在于小鼠和中国仓鼠GS基因中。因此,切割DNA靶序列SEQ ID NO :29、30、34、46和47的I-CreI变体能够诱导小鼠和中国仓鼠GS基因中的位点特异性修饰。此外,人、小鼠和中国仓鼠DNA靶序列SEQ ID NO :7、31和49在士3至5和士8至 10位核苷酸具有序列同一性。因此,切割DNA靶序列SEQ ID NO 49的I-CreI变体能够诱导中国仓鼠中的位点特异性修饰,其中一些也能够在人和/或小鼠GS基因中诱导。切割每个DNA靶标的异二聚体变体的实例显示于图18至20,表I至III。ΜΛ 切割来自人GS基因的DNA靶标的异二聚体Ι-Crel变体的序列
权利要求
1. I-CreI变体,其特征为两个I-CreI单体中的至少一个具有至少两个替换,其中 LAGLIDADG核心结构域的两个功能性亚结构域中各有一个,所述亚结构域分别位于I-CreI 的观到40位和44到77位,所述变体能够切割来自谷氨酰胺合成酶基因的DNA靶序列,并可通过至少包括下述步骤的方法获得(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,所述第一功能性亚结构域位于I-CreI的28到40位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,所述第二功能性亚结构域位于I-CreI的44到77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i) I-CreI位点-10到-8位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-10到-8位的核苷酸三联体,且(ii)+8 到+10位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-10到-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i) I-CreI位点-5到-3位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-5到-3位的核苷酸三联体,且(ii)+3到 +5位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-5 到-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i) I-CreI位点+8到+10位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+8到+10位的核苷酸三联体,且(ii)-10 到-8位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中 +8到+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i) I-CreI位点+3到+5位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+3到+5位的核苷酸三联体,且(ii)-5到-3 位的核苷酸三联体已被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+3到 +5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两个变体中沈到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)-10到-8位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-10到-8位的核苷酸三联体相同,( )+8到+10位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-10到-8位的核苷酸三联体的反向互补序列相同,(iii)_5到-3位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中-5到-3位的核苷酸三联体相同,和(iν) +3到+5位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA 靶序列中-5到-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两个变体中沈到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)+3到+5位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+3到+5位的核苷酸三联体相同,(i i) -5到-3位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA 靶序列中+3到+5位的核苷酸三联体的反向互补序列相同,(iii) I-CreI位点+8到+10位的核苷酸三联体被替换为存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+8到+10 位的核苷酸三联体,和(iv) "10到-8位的核苷酸三联体与存在于来自谷氨酰胺合成酶基因的所述DNA靶序列中+8到+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和/或(h)中获得的变体相组合,以形成异二聚体,和(j)选择和/或筛选来自步骤(i)的能够切割来自谷氨酰胺合成酶基因的所述DNA靶序列的异二聚体。
2.权利要求1的变体,其中位于I-CreI之44到77位的亚结构域中的所述替换是在 44、68、70、75 和 / 或 77 位。
3.权利要求1的变体,其中位于I-CreI之28到40位的亚结构域中的所述替换是在 28、30、32、33、38 和 / 或 40 位。
4.权利要求1到3中任一项的变体,其中所述替换是用选自A、D、E、G、H、K、N、P、Q、R、 S、Τ、Y、C、V、L、Μ、F、I和W的氨基酸替换原始氨基酸。
5.权利要求1到4中任一项的变体,所述变体为第一和第二单体结合所得到的异二聚体,所述第一和第二单体在I-CreI的28到40位和/或44到77位具有不同的突变,所述异二聚体能够切割来自谷氨酰胺合成酶基因的非回文DNA靶序列。
6.权利要求5的变体,其中所述DNA靶标来自人GS基因,并且选自序列SEQID NO 5 到28。
7.权利要求5的变体,其中所述DNA靶标来自小鼠GS基因,并且选自序列SEQID NO 19 和 29 至 48。
8.权利要求5的变体,其中所述DNA靶标来自中国仓鼠GS基因,并且选自SEQID NO 19、29、30、34、46、47 和 49 至 60。
9.权利要求1到8中任一项的变体,其在I-CreI的137到143位上包含至少一个替换,所述替换改变所述变体对I-CreI位点中士 1到2、士6到7和/或士 11到12位核苷酸的特异性。
10.权利要求1到9中任一项的变体,其在I-CreI全序列中包含至少一个替换,所述替换改进所述变体对来自谷氨酰胺合成酶基因之所述DNA靶标序列的结合和/或切割特性。
11.权利要求10的变体,其包含选自下列的至少一个替换N2S、T3A、N6K、K7E、Y12H、 G19S、G19A、I24V、F35L、L39V、F43L、V45L、V45M、Q47K、Q50R、F54L、K57E、V59A、D60Y、V64A、 Y66H、E80K、F87L、F87I、Q92R、K96R、V105A、K107R、E110V、S114F、S114P、E117V、S118T、 P119L、D120A、D120E、V125I、V129A、I132V、D137N、D137Y、K139R、D153N、S154G、K160R、S161P 和 S161T。
12.权利要求11的变体,其包含选自下列的至少一个替换G19S、F54L,E80K、F87L、 V105A 和 I132V。
13.权利要求6和10至12中任一项的变体,其中第一和第二单体在观、30、32、33、38、 40、44、68、70、75、77位以及最后在80位分别具有选自下列的氨基酸KTSGQS/VERNR+K80 和 KRTNQQ/DRSRT、KNGCAS/1RSNR 和 KNSRDR/YASRI、KRTCQT/KYSEV 和 KRTNQQ/LRNNI+K80、 KNSCAS/NTSRY 和 KNSTAS/MERNR、KNSRNQ/RYSEV 和 ENSRRK/NRSRY、KNTCQS/LRANV 和 KYTCQS/DYSSR、KNHHQS/NQSSV 和 KNSEQE/AYSYK、KRCCQE/KTTNI 和 KNRDQS/ARSRL、KRSYQS/QESRR 和 KSSHKS/NYSRV、KNSTQS/ARSER 和 KNSPQQ/KYSEV、KDSRTS/RRSND 和 KNCCHS/RRSND、KNHHQS/ YYSST 和 KTSGQS/QRSYR、KTSGQS/KRSRR 和 KNSRAQ/NRSRY、KNSYQS/KYSNQ 和 ENSRRK/KYSQN、 KSSHKS/1RSNR 和 KNDYCS/KESDR、KNSTQT/QNSQR 和 KNSRAQ/AQNNI、KNSRDR/1RCNR 和 KRANQE/ ARSER、KNSPKS/NKHNI 和 RNSAYQ/DYSSR、KNSCAS/1RANR 和 KNTCQS/QRSHY、KNTYWS/ARSRL 和 KNSRNQ/YSSSD、KDSRSS/YRSDV 和 KNTYWS/DYSSR、KTSGQS/KRSDK 和 NNSSRK/AYSRI、KNSRNQ/ SRSYT 和 KDSRQS/KESDR、KNSCAS/ARSER 和 KRSRQS/QYRNI。
14.权利要求7和10至12中任一项的变体,其中第一和第二单体在观、30、32、33、38、 40、44、68、70、75、77位以及最后在M或80位分别具有选自下列的氨基酸KNCCHS/KYSNI 和 KRSYQS/TYSRT、KRSRES/DYSYQ 和 KRGYQS/RHRDI、KRGYQS/KHRDI、KRGYQS/KNRDI、KRCYQS/ RHRDI、KRGYQS/NYSRY、KRGYQS/RTRDI、KRGYQS/TYSRV、KRGYQS/KARDI、KRGYQS/QYSRY、 KKSAQS/NYSRY、KRDYQS/QRSRT+K80、或 KRDYQS/TRSRI+K80、KHHCQT/RYSEV 和 KRTNQQ/IRCNR、 KNSRAQ/RYSER 和 KNSHAS/VERNR+K80、KRGRQA/RYSER 和 KNRDQS/TYSRT、KNSYQS/LRNNI+K80 和 KNSYQS/NYSYN+V24、KDSRQS/YRSDV 和 KHHCAS/DRSRQ、KNSTQS/DYSSR 和 KNSRAQ/RNSQI、 KNHHQS/QHSNR 和 KNSGQQ/QYSRV、KDSRTS/AYSYK 和 KRTYQS/RSSNT、KNSCQQ/QRSNR 和 KNDYYS/ TYSRV, KRYSQS/RYSEQ 和 KNSYRK/KSSNI、KNSCAS/NYSRV 和 KNTYQS/QHSNR、KNSSRD/QRSNI 和 KNSYQS/KESDR、KNTCQS/ECSNI 和 KNNGQS/KYSNI、KSSHKS/1RSNR 和 KNDYCS/KESDR、KTSHRS/ NRSRY 和 KNTYWS/DYSSR、KNSYHS/AYSRV 和 KDSRGS/QNSRV、KDSRQS/KESDR 和 NNSYRK/ARRNI、 KNSRNQ/ARSRL 和 KWSCQS/KASDK、KGSYKS/TRSER 和 KNSYGQ/KYSNQ。
15.权利要求8和10至12中任一项的变体,其中第一和第二单体在观、30、32、33、38、 40、44、68、70、75、77位以及最后在M或80位分别具有选自下列的氨基酸KNCCHS/KYSNI 和 KRSYQS/TYRST, KRSRES/DYSYQ 和 KRGYQS/RHRDI、KRGYQS/KHRDI、KRGYQS/KNRDI、KRCYQS/ RHRDI、KRGYQS/NYSRY、KRGYQS/RTRDI、KRGYQS/TYSRV、KRGYQS/KARDI、KRGYQS/QYSRY、 KKSAQS/NYSRY、KRDYQS/QRSRT+K80、或 KRDYQS/TRSRI+K80、KNHCQA/RYSER 和 KRTNQ/IRSNR、 KNSRDR/KYSEV 和 KNSGQG/TYSTO、KNSNQR/KYSEV 和 KRDYQS/NYSYQ、KRSYQS/KESDR 和 KNHHQS/ RYSEY、KNSYQS/LRNNI+K80 和 KNSYQS/NYSYN+V24、KRSYQS/KSSNV 和 KSTSRS/AYSDH、KSSCQA/ NKHNI 和 KNGHQS/QESRR、KRSYQS/QHSNR 和 KTSGQS/QYSRV、KNRDQS/ECSNI 和 KNSNYR/QRDNR、 KSSHKS/1RSNR 和 KNDCQS/KESDR、KNSHQT/NRSRY 和 KRSYES/DYSSR、KNSCQH/VERNR+K80 和 SNSYRK/NRSRY、KDSRTS/YRSDV 和 KKSSQS/DYSSR、KDSRQS/KESDR 和 NNSYRK/ARRNI、KNSRNQ/ ARSRL 和 KWSCQS/KASDK、KGSYKS/ARSER 和 KNSRQR/ARGNI。
16.权利要求13至15中任一项的变体,其中第一单体和第二单体分别选自以下序列对SEQ ID NO :61 至別(第一单体)和 SEQ ID NO 85 至 IO8 (第二单体);SEQ ID NO 109, 110、63、111 至 128(第一单体)和 SEQ ID NO :129 至 134、89、135 至 151(第二单体);SEQ ID NO :109、110、63、152 至 154、113、155 至 158、123、159 至 162、127、163(第一单体)和 SEQ ID NO :164,130 至 133,198-200,203 和 206 至 208、134、89、165、166、136、167 至 170、146、 147,171 至 175(第二单体)。
17.权利要求7、8、10至12、14和15中任一项的变体,其切割来自小鼠和仓鼠 (Critechulus sp.)谷氨酰胺合成酶基因的DNA靶序列SEQ ID NO :30,并包含第一和第二单体,其中第一单体和第二单体在28、30、32、33、38、40、44、68、70、75和77位和额外的位置具有选自下列的氨基酸KRSRES/DYSYQ+H66+132V,KRSRES/DYSYQ+A19+120A 或 KRSRES/ DYSYQ+S19+E57+T118+V132(第一单体)和 KRGQS/RHRDI,KRGYQS/QARDR+119L 或 KRSRQS/ QARDR (第二单体);KRSRES/DYSYQ+H66+132V (第一单体)和 KRGYQS/KHRDI+S19+M45 (第二单体)。
18.权利要求7、8、10至12、14、15和17中任一项的变体,其切割来自小鼠和仓鼠 (Critechulus sp.)谷氨酰胺合成酶基因的DNA靶序列SEQ ID NO 30,并包含具有SEQ ID NO 211至229、242至M4和271中任一序列的第一单体和具有SEQ ID NO :245至洸8中任一序列的第二单体。
19.权利要求1到15和17中任一项的变体,其与权利要求16或权利要求18所定义的序列之一具有至少95%的序列同一性。
20.权利要求1到19中任一项的变体,其包含核定位信号和/或标签。
21.权利要求5到20中任一项的变体,其为专性异二聚体,其中所述第一单体还包含 D137R突变,第二单体还包含R51D突变。
22.权利要求5到20中任一项的变体,其为专性异二聚体,其中所述第一单体还包含 E8R或E8K以及E61R突变,第二单体还包含K7E和K96E突变。
23.单链大范围核酸酶,其包含权利要求1至22中任一项所述变体之一的两个单体或核心结构域,或二者的组合。
24.权利要求23的单链大范围核酸酶,其包含权利要求13至18中任一项定义的第一和第二单体,二者通过肽连接子连接。
25.多核苷酸片段,其编码权利要求1至22中任一项的所述变体或者权利要求23或权利要求M所述单链大范围核酸酶。
26.表达载体,其包含至少一个权利要求25所述多核苷酸片段。
27.权利要求沈的表达载体,其包含两个不同的多核苷酸片段,每个多核苷酸片段编码权利要求5到22中任一项所定义之异二聚体变体的单体之一。
28.权利要求沈或权利要求27的载体,其包含靶向构建体,所述靶向构建体包含待引入谷氨酰胺合成酶基因中的序列,以及与权利要求1和5至8中任一项所定义I-CreI变体之基因组DNA切割位点侧翼的谷氨酰胺合成酶基因序列同源的序列。
29.权利要求观的载体,其中所述待引入序列是使得谷氨酰胺合成酶基因失活的序列,其侧翼是与I-CreI变体之基因组DNA切割位点侧翼谷氨酰胺合成酶基因序列同源的序列。
30.权利要求观的载体,其中所述待引入序列是修复人谷氨酰胺合成酶基因中突变的序列。
31.权利要求30的载体,其中所述序列编码人野生型谷氨酰胺合成酶的一部分。
32.权利要求观的载体,其中所述与I-CreI变体之基因组DNA切割位点侧翼的谷氨酰胺合成酶基因序列同源的序列包含权利要求31所定义的编码野生型谷氨酰胺合成酶之一部分的序列。
33.权利要求30的载体,其中修复所述突变的序列包含人谷氨酰胺合成酶开放读码框以及位于3’的多腺苷酸化位点以终止转录,侧翼是与I-CreI变体之基因组DNA切割位点侧翼的人谷氨酰胺合成酶基因序列同源的序列。
34.组合物,其至少包含权利要求1到22中任一项的变体、权利要求23或M的单链大范围核酸酶和/或权利要求26到33中任一项的表达载体。
35.权利要求34的组合物,其包含权利要求28到33中任一项定义的靶向DNA构建体。
36.权利要求35的组合物,其中所述靶向DNA构建体包含在重组载体中。
37.宿主细胞,其至少用权利要求25或27中定义的多核苷酸片段或权利要求沈到33 中任一项所述载体进行了修饰。
38.非人转基因动物,其包含权利要求25或权利要求27中定义的一种或两种多核苷酸片段。
39.转基因植物,其包含权利要求25或权利要求27中所定义的一种或两种多核苷酸片段。
40.权利要求1到22中任一项的变体、权利要求23或M的单链大范围核酸酶和/或权利要求26到33中任一项的表达载体中的至少之一用于基因组工程的非治疗目的的用途。
41.权利要求40的用途,其用于制备谷氨酰胺合成酶敲除动物/细胞系。
42.权利要求41的用途,其中所述动物/细胞系是转基因动物/细胞系,其中转基因插入于谷氨酰胺合成酶基因座。
43.权利要求41的用途,其中所述动物/细胞系是转基因动物/细胞系,其中转基因插入于任何基因组座位。
44.权利要求1到22中任一项的变体、权利要求23或M的单链大范围核酸酶和/或权利要求26到33中任一项的表达载体中的至少之一用于制备药物的用途,所述药物用于预防、改善或治愈由谷氨酰胺合成酶基因中的突变造成的病理状况。
45.权利要求40至44中任一项的用途,其中所述变体、单链大范围核酸酶或者载体与权利要求28至33中任一项定义的靶向DNA构建体相关联。
全文摘要
本发明涉及一种I-CreI变体,其中两个I-CreI单体之一具有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各有一个,所述亚结构域分别位于I-CreI的28到40位以及44到77位,所述变体能够切割来自谷氨酰胺合成酶基因的DNA靶序列。本发明还涉及所述变体和其衍生产物在改进用于重组蛋白质生产的表达系统中的用途。
文档编号C12N9/22GK102177235SQ200880131488
公开日2011年9月7日 申请日期2008年9月8日 优先权日2008年9月8日
发明者朱莉安娜·史密斯 申请人:赛莱克蒂斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1