新的衍生自I-CreI的单链大范围核酸酶及其用途的制作方法

文档序号:580271阅读:2525来源:国知局
专利名称:新的衍生自I-CreI的单链大范围核酸酶及其用途的制作方法
技术领域
本发明涉及新的衍生自I-CreI的单链大范围核酸酶,涉及编码所述新的衍生自 I-CreI的单链大范围核酸酶的载体,涉及经所述载体修饰的细胞、动物或者植物,并涉及所 述衍生自I-CreI的单链大范围核酸酶及其衍生产物在基因工程、基因治疗和抗病毒治疗 中的用途。在对给定遗传位点进行基因工程改造的所有方法中,已经开始使用稀少切割DNA 的内切酶(如大范围核酸酶)作为非常有效的工具,通过产生DNA双链断裂(double strand break, DSB)来提高同源基因靶向。大范围核酸酶识别大的序列(> 12bp),因此可在不影 响整个基因组完整性的情况下对对应位点进行切割。归巢内切核酸酶(即天然大范围核 酸酶)组成了若干大的蛋白质家族,这些蛋白质由可动内含子或蛋白内含子编码。归巢内 切核酸酶的靶序列通常是在缺少该内含子或蛋白内含子的同源等位基因内,切割通过DSB 诱导的同源重组机制来促使可动元件转移到断裂的序列中。I-SceI是第一个用于刺激 同源重组反应的归巢内切核酸酶,使哺乳动物细胞基因靶点的重组反应提高了 1000倍以 上(Choulika 等,Mol. Cell. Biol.,1995,15,1968-1973 ;Cohen-Tannoudji 等,Mol. Cell. Biol.,1998,18,1444-1448 ;Donoho 等,Mol. Cell. Biol.,1998,18,4070-4078 ;Alwin 等, Mol. Ther.,2005,12,610-617 ;Porteus, M. H.,Mol. Ther. 2006,13,438-446 ;Rouet 等,Mol. Cell. Biol.,1994,14,8096-8106)。最近,I-SceI还被用于在体内刺激小鼠肝脏内的定向 重组,并且可在高达的肝细胞中观察到重组的发生(Gouble等,J. Gene Med.,2006,8, 616-22)。但是,这种方法的固有缺陷是需要事先在目标位点中引入天然切割位点。为了克 服这个缺陷,在过去的数年中为了获得具有定制的切割特异性的内切核酸酶,进行了大量 的工作。这些蛋白质可用于切割天然染色体序列,这为基因工程的广泛应用打开了新的篇 章。例如,大范围核酸酶可用于诱导对那些与单基因遗传病有关的突变的校正,并且避免了 由于采用目前的基因治疗方法导致转基因随机插入而产生的风险(Hacein-Bey-Abina等, Science,2003,302,415-419)。将锌指蛋白(ZFP)与FokI酶(一种IIS类限制性内切核酸酶)的催化结构域进 行融合,来制备功能性序列特异性内切核酸酶(Smith等,Nucleic Acids Res.,1999,27, 674-681 ;Bibikova 等,Mol. Cell. Biol.,2001,21,289-297 ;Bibikova 等,Genetics, 2002, 161,1169-1175 ;Bibikova 等,Science,2003,300, 764 ;Porteus, M. H. and D.Baltimore, Science, 2003,300,763- ;Alwin 等,Mol. Ther.,2005,12,610-617 ;Urnov 等,Nature, 2005, 435,646-651 ;Porteus, M. H.,Mol. Ther.,2006,13,438-446)。最近,这样的核酸酶被用于 改造来自淋巴谱系的人细胞中的ILR2G基因(Urnov等,Nature,2005,435,646-651)。Cys2-His2型锌指蛋白的结合特异性易于操作,这可能是因为它们代表了简单 (特异性基本上由每个锌指上的四个残基决定)且模块化的系统(Pabo等,Armu. Rev. Biochem. ,2001,70,313-340 Jamieson 等,Nat. Rev. Drug Discov. ,2003,2,361—368)。 来自 Pabo 实验室(Rebar, E. J.和 C. 0. Pabo, Science, 1994,263,671—673 ;Kim, J. S. andC.O.Pabo,Proc. Natl. Acad. Sci. USA,1998,95,2812-2817)、Klug 实验室(Choo,Y.和 A. Klug, Proc. Natl. Acad. Sci. USA,1994, 91,11163-11167 ; Isalan Μ.禾口 A.Klug,Nat. Biotechnol.,2001,19,656-660)和 Barbas 实验室(Choo,Y.和 A. Klug, Proc. Natl. Acad. Sci. USA,1994,91,11163-11167 ;Isalan Μ.和 A. Klug,Nat.Biotechnol.,2001,19, 656-660)的研究得到了能够结合大多数G/ANNG/ANNG/ANN序列的大量新人工ZFP。但ZFP也有其局限性,尤其是对于需要极高特异性水平的应用(如治疗应用)而 言。融合后的FokI核酸酶以二聚体形式发挥其活性,但是最近的研究发现,在两个单体 之一与DNA结合后,或者两个单体与两个远离的DNA序列结合后,FokI核酸酶也可以切割 DNA (Catto 等,Nucleic Acids Res.,2006,34,1711-1720)。因此,特异性可能是高度简并 性的,如在哺乳动物细胞(Porteus,M. H. and D. Baltimore, Science, 2003, 300, 763)和果蠅 (Bibikova 等,Genetics,2002,161,1169-1175 ;Bibikova 等,Science,2003,300,764-)中 的毒性所示。鉴于其精准的特异性,归巢内切核酸酶可以作为改造定制内切核酸酶的理想骨 架。一些研究已经发现,可对LAGLIDADG蛋白(分布最广的归巢内切核酸酶)的DNA结合 结构域(Chevalier, B. S. and Stoddard B. L.,Nucleic Acids Res. 2001 ;29 :3757_74)进 行改造。LAGLIDADG是指整个家族中惟一真正保守的序列,其在蛋白中以一个或多个拷贝 (通常为两个拷贝)存在(Lucas等,Nucleic Acids Res. ,29 :960_969)。含有单个基序 的蛋白质(例如I-CreI (蛋白数据库(Protein Data Bank)编号1G9Y)和Ι-Msol)形成 同二聚体,并对具有回文或假性回文的DNA序列进行切割;而更大的双基序蛋白质(例如 I-SceI和I-DmoI)是单体,并对非回文结构的DNA序列进行切割。目前已经对几种不同的 LAGLIDADG蛋白进行了结晶,与在一级序列水平不具有相似性相比,它们的蛋白核心结构非 常保守(Jurica 等,Mol. Cell.,1998 ;2 469-476 ;Chevalier 等,Nat. Struct. Biol. 2001 ; 8 312-316 ;Chevalier 等,J. Mol. Biol.,2003,329 :253_69 ;Moure 等,J. Mol. Biol.,2003, 334 685-695 ;Moure 等,J. Mol. Biol.,2003,334,685-695 ;Moure 等,Nat Struct. Biol., 2002,9 764-770 ;Ichiyanagi 等,J. Mol. Biol.,2000,300 :889_901 ;Duan 等,Cell, 1997, 89 555-564 =Bolduc 等,Genes Dev.,2003,17 :2875_2888 ;Silva 等,J. Mol. Biol.,1999, 286 1123-1136)。在这个核心结构中,由两个单体构成(或在双LAGLIDADG蛋白中由两个结 构域构成)的两个特征性α β β α β β α折叠通过二重对称彼此相对。DNA结合依赖于每 个结构域上的四个β链,它们通过折叠成反向平行的片层,并且在DNA螺旋的大沟上 形成鞍。催化核心位于中心,两个对称单体/结构域对其均有贡献。除了这个核心结构外, 还有其他结构域比如PI-SceI (蛋白内含子,含有蛋白剪接结构域和额外的DNA结合结构 域)(Moure 等,Nat Struct. Biol.,2002,9 764-70 ;Grindl 等,Nucleic Acids Res. 1998, 26 1857-1862)。每个 I-CreI 单体包含一个由三个螺旋(alpha4 ( α 4)、alpha5 ( α 5)、 和alpha6(a6))和位于α 5螺旋和α 6螺旋之间的环构成的C端亚结构域(C端环;见

图1),这是位点识别、DNA结合和切割的关键(Prieto等,Nucleic Acids Res. ,2007,35 3267-3271)。一 些 LAGLIDAG 蛋白,包括 ΡΙ-SceI (Gimble 等,J. Mol. Biol.,2003,334 993-1008)、I-CreI(Seligman 等,Nucleic Acids Res,2002,30 :3870_3879 ;Sussman 等, J. Mol. Biol.,2004,342 :31-41 ;国际 PCT 申请 WO 2006/097784, WO 2006/097853, WO2007/060495 和 WO 2007/049156 ;Arnould 等,J. Mol.Biol.,2006,355,443-458 ;Rosen 等,Nucleic Acids Res.,2006,34,4791-4800 ;Smith 等,Nucleic Acids Res.,2006,34, el49)、I-SceI(Doyon 等,J Am Chem Soc.,2006,128 :2477_2484)和 I-MsoI (Ashworth 等, Nature, 2006,441 :656_659),可通过推理或半推理性诱变和筛选来进行修饰,以获得新的 结合或切割特异性。另一策略是通过在I-CreI和I-DmoI之间进行结构域交换来获得新的大范围核 酸酶,从而获得可切割杂合序列的大范围核酸酶,这个杂合序列对应于两种半亲本靶序 列的融合物(Epinat 等,Nucleic Acids Res.,2003,31 :2952_2962 ;Chevalier 等,Mol. Cell. 2002,10 :895-905 ;国际 PCT 申请 WO 03/078619 和 WO 2004/031346)。最近,通过半推理设计辅以高通量筛选方法从I-CreI中获得了成千上万的新 蛋白(Smith 等,Nucleic Acids Res.,2006,34,el49 ;Arnould 等,J. Mol. Biol.,2006, 355,443-458 ;国际 PCT 申请 WO 2006/097784, WO 2006/097853, WO 2007/060495 和 WO 2007/049156)。在这种方法中,在检测蛋白/DNA共结晶的结构后,挑选出有限的蛋白残基 组并且随机化。结合高通量筛选(HTS)技术,这种方法可以快速地鉴别出成百上千的特异 性被修饰的归巢内切核酸酶衍生物。此外,那些足够独立而可用于进行组合突变的DNA结合亚结构域也被鉴别出来 (Smith 等,Nucleic Acids Res. ,2006,34, el49 ;国际 PCT 申请 WO 2007/049095 和 WO 2007/057781)。这些发现使得可以产生切割选定的DNA靶序列的第二代改造的I-CreI衍生 物。这种组合策略已通过产生切割人RAGl基因和XPC基因中天然DNA靶序列的大范围核酸 酶而得以证实(Smith 等,Nucleic Acids Res. ,2006,34, el49 ;Arnould 等,J. Mol. Biol., 2007,371 49-65 ;国际 PCT 申请 WO 2007/093836, WO 2007/093918 和 WO 2008/010093)。切割来自人RAGl基因或XPC基因的天然DNA靶序列的改造大范围核酸酶是异二 聚体,其包含两个分别改造的单体,其各与靶序列的一半结合。异二聚体的形成是通过在同 一细胞中共表达两种单体来实现的(Smith等,Nucleic Acids Res.,2006,34,el49)。这 种两个单体的共表达导致形成了三种分子种类异二聚体(切割目的靶序列)和两种同二 聚体(被认为是副产物)(Arnould 等,J. Mol. Biol.,2006,355,443-458 ;国际 PCT 申请 WO 2006/097854 和 WO 2007/057781 ;Smith 等,Nucleic Acids Res.,2006,34,el49)。但是, 有时同二聚体个体可能导致高水平的毒性(Bibikova等,Genetics,2002,161,1169-1175 ; Beumer 等,Genetics,2006,172,2391-2403)。因此,单 LAGLIDADG 归巢内切核酸酶(例如 I-CreI)的广泛使用还存在一个限制因素,那就是这些蛋白是同二聚体。要解决这个问题 有两种可能对二聚化界面进行重新设计产生专性异二聚体,来抑制功能性同二聚体的形 成;或者通过蛋白连接或接头将两个单体融合成单链分子,从而促进不同α β β α β β α 折叠的分子间(而不是分子内)相互作用。后一种方法在载体化方面还有额外的优势, 因为只需要将一种编码序列或蛋白引入到细胞核中。这样就可避免使用两种不同载体或 者双顺反子载体。值得注意的是,至少在理论上,单链分子不一定会避免来自不同分子的 α β β α β β α折叠的相互作用(尤其在接头长并具有柔性的情况下),但是至少有利于 来自同一分子的α β β α β β α折叠发生相互作用。此外,制备单链分子和重新设计二聚 化界面也不是排他性的策略,而是可以联合使用。I-CreI 单链形式(scI-Crel)的制备已经被验证过了(Epinat 等,Nucleic AcidsRes.,2003,3 =2952-2962 ;国际PCT申请WO 03/078619)。在这种第一形式中,单链大范围核 酸酶的N端结构域(I-CreI氨基酸序列的1 93位)主要由I-CreI单体的α β β α β β α 折叠组成(核心结构域),而C端(I-CreI氨基酸序列的8 163位)是一个几乎完整的 I-CreI单体。接头(MLERIRLF匪R,SEQ ID NO 1)来自连接I-DmoI两个结构域的环。尽管该第一 scI-Crel是功能性的大范围核酸酶,但其稳定性低于I_CreI,这可能 是因为其折叠与I-CreI相比不是最佳的。该第一 scI-Crel的设计符合双LAGLIDADG内切 核酸酶的结构,因此与I-CreI的区别在于N端结构域比C端结构域短,而且缺少可存在于 某些双LAGLIDADG内切核酸酶C端结构域中的由三个α螺旋构成的C端亚结构域。既然最近的研究显示了 I-CreI中C端亚结构域在蛋白DNA结合特性和DNA靶标 切割活性方面起着重要的作用(Prieto等,Nucleic Acids Res.,2007,35 :3267_3271),那 么从该第一单体中移除三个C端螺旋,可能会对该第一 scI-Crel的折叠、稳定性产生影响, 并因此对其活性产生影响。但是,这三个C端螺旋在I-CreI 二聚体结构的相反一侧终止,远离含LAGLIDADG 基序的N端螺旋(图1)。连接一个结构域的C端残基与另一结构域的N端残基的柔性接 头(末端-末端融合)的长度会很长。此外,由于必须要跨过这个蛋白表面的很大一部分 区域,因此构建这样的接头是十分困难的。而且不能确定是否可获得正确的堆叠。在此,发明人提出了设计来自I-CreI同二聚体大范围核酸酶的单链分子的新方 法。这种策略保留了核心的α β β α β β α (也称为、日力^』』^》折叠和两个所 连接I-CreI单元的C端部分。这种设计在提高效率的同时,很大程度地降低了脱靶切割和毒性。这种单链分子 的结构和稳定性与异二聚体变体非常相似,并且这种分子表现为在溶液中以单体形式存 在。而且,所得蛋白在活细胞中在人细胞的内源性位点(SCID基因)上启动高效的同源基 因靶向(百分数水平),同时更有效地防止潜在的遗传毒性。在所有方面中,该单链分子的 性能与I-CreI (在特异性方面被认为是金标准的单体归巢内切核酸酶)一样好。这些特性 使得这种新一代大范围核酸酶成为基因组外科手术策略最好的分子剪刀之一,同时使得对 单基因疾病(例如重度联合免疫缺陷(SCID))的基因校正治疗变得更容易,而同时有可能 避免以前基因治疗方法存在的恶化效应。本发明的一个主题是单链I-CreI大范围核酸酶(scI-Crel),其包含由肽接头连 接的两个结构域(N端和C端),其中(a)来自亲本I-CreI单体的每个结构域含有所述亲本I-CreI单体的一部 分,至少从I-CreI中第一个α螺旋(α ^的起点延伸到C端环的末端,并依次包含 α1β1β2α2β3β4α3核心结构域、α 4螺旋和α 5螺旋以及I-CreI的C端环,并且(b)这两个结构域通过肽接头连接在一起,该肽接头使得所述两个结构域可折叠 形成I-CreI 二聚体,其能够结合并切割嵌合DNA靶标,该嵌合DNA靶标包含每种亲本同二 聚体I-CreI大范围核酸酶靶序列中各自不同的一半。定义-多肽序列中的氨基酸残基在本文中根据单字母代码命名,其中例如Q表示Gln或 谷氨酰胺残基,R表示Arg或精氨酸残基,D表示Asp或天冬氨酸残基。-核苷酸表示如下单字母代码用于表示核苷的碱基a是腺嘌呤,t是胸腺嘧啶,c是胞嘧啶,g是鸟嘌呤。对于简并核苷酸而言,r代表g或a(嘌呤核苷酸),k代表g或t, s代表g或c,w代表a或t,m代表a或c,y代表t或c (嘧啶核苷酸),d代表g、a或t,ν 代表g、a或c, b代表g、t或c, h代表a、t或c,禾口 η代表g、a、t或C。-“大范围核酸酶”是指具有12 45bp双链DNA靶序列的内切核酸酶。所述大范 围核酸酶是二聚体酶(其中各结构域位于单体上)或是单体酶(在单个多肽上包含两个结 构域)。所述大范围核酸酶可来自于LAGLIDADG归巢内切核酸酶,例如I-CreI。-“大范围核酸酶结构域”或者“结构域”是指这样的区域,其与大范围核酸酶DNA 靶标的一半相互作用,并能够与同一大范围核酸酶的另一结构域结合,形成能够切割所述 DNA靶标的功能性大范围核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。-“单链大范围核酸酶”是指包含通过肽间隔区连接在一起的两个LAGLIDADG归巢 内切核酸酶结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靶序列,该嵌合 DNA靶序列含两个亲本大范围核酸酶靶序列不同的一半。单链大范围核酸酶又被称为单链 衍生物、单链大范围核酸酶、单链大范围核酸酶衍生物或嵌合大范围核酸酶。-“核心结构域”是指“LAGLIDADG归巢内切核酸酶核心结构域”,它是LAGLIDADG家 族归巢内切核酸酶的特征性α工β工β 2 α 2 β 3 β 4 α 3折叠,对应于约一百个氨基酸残基的序 列。所述核心结构域包含折叠成反向平行β-片层的四条β链(日^^#4),所述β-片 层与DNA靶标的一半相互作用。该核心结构域能够与另一 LAGLIDADG归巢内切核酸酶核心 结构域结合,形成能够切割所述DNA靶标的功能性内切核酸酶,所述另一结构域与所述DNA 靶标的另一半相互作用。例如,在二聚体归巢内切核酸酶I-CreI (163个氨基酸)的情形中, 核心结构域包含I-CreI的6 94位残基。- “ β -发夹”是指LAGLIDADG归巢内切核酸酶核心结构域反向平行β -片层的两 条连续β-链(^^或β 3β4),其通过环或转角相连。-“亚结构域”是指LAGLIDADG归巢内切核酸酶核心结构域中的区域,其与归巢内 切核酸酶DNA靶标半位点的不同部分相互作用。-“大范围核酸酶变体”或“变体”是指通过将野生型大范围核酸酶(天然大范围 核酸酶)氨基酸序列中的至少一个残基替换为不同氨基酸而获得的大范围核酸酶。-“功能性变体”是指能够切割DNA靶序列的变体,优选地,所述靶标是不被亲本大 范围核酸酶切割的新靶标。例如,这样的变体在接触DNA靶序列的位置或与所述DNA靶标 直接或间接相互作用的位置上具有氨基酸改变。-“具有新特异件的大范围核酸酶变体”是指具有与其亲本大范围核酸酶不同的 靶标切割模式的变体。等价且无差异的术语“新特异性”、“经修饰的特异性”、“新切割特异 性”、“新底物特异性”是指变体针对DNA靶序列中核苷酸的特异性。- “I-Crel,,是指野生型I-CreI (蛋白数据库编号lg9y),对应于序列表中的序列 SEQ ID NO :20。-“亲本I-CreI单体”或者“ I-CreI单体”是指全长野生胡I-CreI氨基酸序列SEQ ID NO :20 (163个氨基酸),或其在SEQ ID NO :20中含有氨基酸替换的功能性变体。由两个 I-CreI单体组成的I-CreI以二聚体形式发挥作用。-“所述亲本I-CreI单体的一部分,其至少从I-CreI中第一个α螺旋的起点延 伸到C端环的末端,并依次包含= Q1P1I^a ^ J1C^核心结构域、α ,螺旋和α .螺旋以及I-CreI的C端环”是指对应于I-CreI至少8-143位的氨基酸序列。- “ I-CreI位点”是指被I-CreI切割的22_24bp双链DNA序列。I-CreI位点包括 野生型(天然)非回文序列I-CreI归巢位点和衍生的回文序列,例如序列5’-C_lia_1(ia_9a_8 a_7c_6g_5t_4c_3g-2t-ia+iC+2g+3a+4c+5g+6t+7t+8t+9t+10g+11, jkW^ C1221 (SEQ ID NO :21,图 3)。- “DNA靶标”、“DNA靶序列”、“靶序列”、“靶位点”、“靶标”、“位点”、“目的位点”、 “识别位点”、“识别序列”、“归巢识别位点”、“归巢位点”、“切割位点”是指被LAGLIDADG归巢 内切核酸酶(例如I-Crel,或者衍生自I-CreI的变体或单链嵌合大范围核酸酶)识别并切 割的20 24bp双链回文、部分回文(假回文)或非回文的多核苷酸序列。这些术语是指 要通过大范围核酸酶引入双链断裂(切割)的独特DNA位置(优选基因组位置)。DNA靶 标通过双链多核苷酸中一条链的5' -3'序列来定义,如上文针对C1221所示的。DNA靶 标的切割分别发生在有义链和反义链+2和_2位的核苷酸处。除非另有指明,否则DNA靶 标被I-CreI大范围核酸酶变体或单链衍生物切割的位置对应于DNA靶标有义链上的切割 位点。- "DNA靶标半位点”、“半切割位点”或“半位点”是指DNA靶标中与各个LAGLIDADG 归巢内切核酸酶核心结构域结合的部分。-“嵌合DNA靶标”或“杂合DNA靶标”是指两个亲本大范围核酸酶靶序列不同的 一半的融合物。另外,所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷 酸组合(组合DNA靶标)。-“包含各亲本同二聚体I-CreI大范围核酸酶靶序列中不同的一半的嵌合DNA靶 極”是指这样的靶序列,其包含回文靶序列的左侧部分和右侧部分,所述回文靶序列的左侧 部分被由一个亲本单体的两个相同单体构成的同二聚体大范围核酸酶切割,所述回文靶序 列的右侧部分可被由另一亲本单体的两个相同单体构成的另一同二聚体大范围核酸酶切 割。-“载体”是指能够转运与之连接的另一核酸的核酸分子。- “M遯”是指一条序列与另一序列具有足够导致序列间同源重组的同一性,更特 别地具有至少95 %的同一性,优选97 %的同一性,更优选99 %的同一性。-“同一性”是指两种核酸分子或多肽之间的序列同一性。可通过比较各序列中 可为比较目的而比对的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据 时,则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核 酸序列间共有的位置上相同或匹配的核苷酸数的函数。可使用多种比对算法和/或程序来 计算两条序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分析包(University of Wisconsin, Madison, Wis.)的一部分获得,并可以例如默认设置使用。-“个体”包括哺乳动物,以及其他脊椎动物(例如鸟类、鱼类和爬行动物)。本文 使用的术语“哺乳动物”是指任何这样的脊椎动物(包括单孔类、有袋类和胎盘动物),它们 对其幼仔哺乳,并且分娩活的幼仔(真哺乳亚纲(eutharian)或胎生哺乳动物)或者卵生 (后兽亚纲(metatharian)或非胎生哺乳动物)。哺乳动物物种的实例包括人和其他灵长 类(例如猴、黑猩猩)、啮齿类(例如大鼠、小鼠、豚鼠)和其他(例如牛、猪和马)。-“突变”是指在多核苷酸(cDNA、基因)或多肽序列中替换、缺失、插入一个或多 个核苷酸/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。-“位点特异性突变”是指核酸序列上某个特定核苷酸/密码子的突变,而不是随 机突变。本发明的单链I-CreI大范围核酸酶也称为scI-Crel大范围核酸酶或sc-I_CreI.根据本发明,将接头序列选择成允许sc-I-Crel的两个结构域折叠成I-CreI 二聚 体,并且结合和切割嵌合DNA靶标,该嵌合DNA靶标包含各亲本同二聚体I-CreI大范围核 酸酶靶序列中不同的一半。I-CreI 二聚体的形成可以通过所熟知的实验(例如用分析性离心进行的沉降平 衡实验)进行测定,详细情况见 Prieto 等,Nucleic Acids Research,2007,35,3267-3271。DNA的结合可以通过所熟知的实验(例如Prieto等,Nucleic Acids Research, 2007,35,3267-3271介绍的电泳迁移率变动测定(EMSA))来进行测定。本发明单链大范围核酸酶的切割活性可以通过所熟知的任何体外或体内切割测 定进行测量,例如在国际 PCT 申请 WO 2004/067736 ;Epinat 等,Nucleic Acids Res, 2003, 31 2952-2962 ;Chames 等,Nucleic Acids Res.,2005,33,el78 ;Arnould 等,J. Mol. Biol., 2006,355,443-458 ;Arnould 等,J. Mol. Biol.,Epub 10 May 2007 中介绍的。例如,本发明单链大范围核酸酶的切割活性可在酵母或哺乳动物细胞中通过使用 报告载体的同向重复重组测定来测量,与对应的来自相同亲本I-CreI单体的异二聚体大 范围核酸酶或另一单链大范围核酸酶进行比较。报告载体在克隆到酵母或哺乳动物表达载 体中的间插序列中包含报告基因的两个截短的非功能性拷贝(同向重复)以及基因组(非 回文)DNA靶序列,其包含各(回文或假性回文)亲本同二聚体I-CreI大范围核酸酶靶序 列中不同的一半。大范围核酸酶的表达导致基因组嵌合DNA靶序列被切割。这种切割诱导 同向重复之间的同源重组,得到功能性报告基因(比如LacZ),可通过适当的测定来监测其 表达。此外,通过在哺乳动物细胞中进行染色体测定,可将单链大范围核酸酶对其基因组 DNA靶标的活性与I-CreI对同一基因组位点中I-CreI位点的活性进行比较(Arnould等, J.Mol.Biol.,2007年5月10日电子公开)。此外,单链大范围核酸酶的切割特异性可以通 过比较嵌合DNA靶序列的切割情况与亲本I-CreI同二聚体大范围核酸酶对两种回文序列 的切割情况来获得。Sc-I-CreI两个结构域的N端序列可起始于I-CreI的1、2、3、4、5、6或8位。在一 个优选实施方案中,N端结构域起始于I-CreI的1或6位,C端结构域起始于I-CreI的2 或6位。两个结构域的C端序列在C端环后即终止,例如I-CreI的143或145位。或者,结 构域的C端序列还包括至少α 6螺旋(I-CreI的145 150位),并且最终包含额外的C端 残基。在这种情况下,结构域的C端序列在I-CreI的150、151、152、153、154、155、156、157、 158、159、160、161、162或163位终止。优选在152 160位终止。例如在152、156、160或 163位。在一个优选实施方案中,N端结构域在I-CreI的163位终止。更优选地,两个结构 域都在I-CreI的163位终止。在sc-I-Crel大范围核酸酶的另一个优选的实施方案中,接头包含由10 100个 (优选15 50个氨基酸,更优选20 35个氨基酸,更优选25 35个氨基酸)连续氨 基酸组成的线性序列,或由其组成。预计接头的序列会形成一个螺旋,可以是α螺旋(用SOPMA,即带比对的自优化预测方法进行预测,Geourjon和Del6age,1995)或者II型聚脯 氨酸螺旋。这种聚脯氨酸螺旋的实例以SEQ ID N0:15或16(表1)为代表。更优选地,接 头包含α螺旋。接头有利地选自包含SEQ ID Ν0:2-19或者由其组成的序列。优选地,其 选自SEQ ID NO :2-12和14-19的序列。更优选地,所述接头选自序列2、4_8、11、16、18和 19。甚至更优选地,所述接头由SEQ ID NO :2的序列组成。本发明的单链I-CreI大范围核酸酶可衍生自野生型I-CreI单体或其功能性变 体。此外,在亲本单体的ΝΗ2端和/或COOH端插入了一个或多个残基。还可在亲本单体的 5’端或3’端添加额外的密码子,以引入限制性酶切位点,以便克隆到不同的载体中。所述 序列的一个实例是SEQ ID NO :23,其含有丙氨酸残基(A)(被插入到第一个甲硫氨酸残基 之后),丙氨酸和天冬氨酸残基(AD)(被插入到C端脯氨酸残基之后)。这些序列使DNA编 码序列包含了 NcoI(CCatg)和EagI (cggccg)限制性酶切位点,可被克隆到不同载体中。例 如,还可在N端结构域的ΝΗ2末端和/或C端结构域的COOH末端引入一个标签(抗原决定 簇或者多聚组氨酸序列);所述标签可用于检测和/或纯化所述sc-I-Crel大范围核酸酶。优选地,sc-I-Crel大范围核酸酶衍生自异二聚体I-CreI变体的单体,更优选 地,衍生自具有如上文所述新切割特异性的变体(Arnould等,J. Mol. Biol.,2006,355, 443-458 ;Smith 等,Nucleic Acids Res. ,2006,34, el49 ;Arnould 等,J. Mol. Biol., Epub IOMay 2007 ;国际 PCT 申请 WO 2006/097784, WO 2006/097853, WO 2007/049095, WO 2007/057781, WO 2007/060495, WO 2007/049156, WO 2007/093836 和 WO 2007/093918)。因此,单链I-CreI大范围核酸酶的结构域可在接触DNA靶序列或者与DNA骨架或 与核苷酸碱基相互作用(直接或通过水分子)的I-CreI氨基酸残基位置处含有突变,这 些残基是该技术领域所熟知的(Jurica 等,Molecular Cell.,1998,2,469-476 ;Chevalier 等,J. Mol. Biol.,2003,329 :253_269)。优选地,所述突变改变了大范围核酸酶的切割特异 性,产生了具有新特异性的大范围核酸酶,该大范围核酸酶可以切割来自目的基因的DNA 靶标。更优选地,所述突变是第一功能性亚结构域(对应于I-CreI氨基酸序列的26 40位)中一个或多个氨基酸的替换,其改变对DNA靶标士8 10位核苷酸的特异性;和 /或第二功能性亚结构域(对应于I-CreI氨基酸序的44 77位)中的替换,其改变对 DNA靶标士 3 5位核苷酸的特异性,这在以前有过介绍(国际PCT申请2006/097784, WO 2006/097853, WO 2007/060495, WO 2007/049156, WO 2007/049095 和 WO 2007/057781 ; Arnould 等,J. Mol. Biol.,2006,355,443-458 ;Smith 等,Nucleic Acids Res. ,2006) 替 换有利地对应于I-CreI氨基酸序列的26、28、30、32、33、38和/或40位、44、68、70、75、和 /或77位。对于切割n-4是t或n+4是a的DNA靶标,所述I-CreI结构域有利地在44位 为谷氨酰胺(Q);对于切割n-4是a或n+4是t的DNA靶标,所述结构域的44位为丙氨酸 (A)或天冬酰胺;对于切割n-9是g或n+9是c的DNA靶标,所述结构域的38位有利地为 精氨酸(R)或赖氨酸⑷。根据所述scI-Crel大范围核酸酶的另一个优选的实施方案,至少一个结构域在 I-CreI的26 40位和/或44 77位具有突变,所述scI-Crel大范围核酸酶能切割非回 文DNA序列,其中所述DNA序列中至少+3 +5、+8 +10、-10 -8和-5 -3位的核苷 酸对应于来自目的基因的DNA靶标中+3 +5、+8 +10、-10 -8和-5 -3位的核苷 酸。优选地,scI-Crel大范围核酸酶的两个结构域都在26 40位和/或44 77位中有突变。更优选地,两个结构域在I-CreI的26 40位和/或44 77位中有不同的突变。在所述scI-Crel大范围核酸酶的另一个优选的实施方案中,至少一个结构域在 I-CreI中与DNA靶序列相互作用的其他氨基酸残基处有一个或多个突变。特别地,可在与 磷酸酯骨架接触的位置引入额外的替换,例如最后的C端环中(137 143位;Prieto等, Nucleic Acids Res. 2007,35,3262-3271)。优选地,所述残基参与所述DNA切割位点的结合 和切割。更优选地,所述残基在I-CreI的138、139、142或143位。可在同一结构域中突变 两个残基,只要每个突变在选自138和139位残基对以及142和143位残基对的不同残基 对中即可。所引入的突变改变了所述最后的C端环中的氨基酸与I-CreI位点磷酸酯骨架 的相互作用。优选地,138或139位的残基被疏水性氨基酸替换,以免与DNA切割位点的磷 酸酯骨架形成氢键。例如,138位的残基被丙氨酸替换或者139位的残基被甲硫氨酸替换。 有利地,142或143位的残基被小氨基酸(例如甘氨酸)替换,以减少这些氨基酸残基侧链 的大小。更优选地,所述最后的C端环中的替换改变了 scI-Crel大范围核酸酶对I-CreI 的士 1 2位、士6 7位和/或士 11 12位核苷酸的特异性。在所述scI-Crel大范围核酸酶的另一个优选的实施方案中,至少一个结构域包 含一个或多个额外突变,所述突变提高了结合和/或切割特性,包括scI-Crel大范围核酸 酶对来自目的基因的DNA靶序列的切割活性和/或特异性。所述额外的突变残基可能位于 整个I-CreI序列中。根据所述scI-Crel大范围核酸酶的一个更优选的实施方案,所述额外突变减少 由scI-Crel大范围核酸酶结构域形成功能性同二聚体。每个亲本单体最少具有二聚化界面的两个残基Z和Z’,其分别与同一亲本单体或 另一亲本单体中的残基Z’和Z相互作用(两对相互作用残基ZZ’),形成两种同二聚体和 一种异二聚体。根据本发明,二聚化界面的两对相互作用残基中的一对被互换,以获得具有 两个残基Z或Z’的第一结构域和具有两个残基Z’或Z的第二结构域。这样,各含有两个 残基Z或两个残基V的第一结构域和第二结构域比其亲本配对残基更不容易形成同二聚 体(scI-Crel结构域内部的相互作用),而scI-Crel两个结构域界面的两对相互作用残基 ZZ'则更容易形成异二聚体(scI-Crel结构域之间的相互作用)。因此,scI-Crel大范围核酸酶的结构域有利地分别在第一结构域(N端或C端结 构域)和第二结构域(C端或N端结构域)中含有至少一对以下突变a)用碱性氨基酸(优选精氨酸)替换第8位的谷氨酸(第一结构域),并用酸性 氨基酸(优选谷氨酸)替换第7位的赖氨酸(第二结构域);第一结构域还可包含用精氨 酸替换第7和96位的至少一个赖氨酸残基。b)用碱性氨基酸(优选精氨酸)替换第61位的谷氨酸(第一结构域),并用酸性 氨基酸(优选谷氨酸)替换第96位的赖氨酸(第二结构域);第一结构域还可包含用精氨 酸替换第7和96位的至少一个赖氨酸残基。c)用芳香族氨基酸(优选苯丙氨酸)替换第97位的亮氨酸(第一结构域),并用 小氨基酸(优选甘氨酸)替换第54位的苯丙氨酸(第二结构域);第一结构域还可包含用 色氨酸替换第54位的苯丙氨酸,第二结构域还可包含用甲硫氨酸替换第58位的亮氨酸或 第57位的赖氨酸,以及d)用碱性氨基酸(优选精氨酸)替换第137位的天冬氨酸(第一结构域),并用酸性氨基酸(优选谷氨酸)替换第51位的精氨酸(第二结构域)。例如,第一结构域可具有突变D137R,第二结构域具有突变R51D。或者,scI-Crel大范围核酸酶包含上文a)、b)、c)或d)中所述的至少两对突变; 有利地,其中一对突变如c)或d)中所述。优选地,一个结构域包含用酸性氨基酸(D或E) 替换第7位和第96位的赖氨酸残基,另一结构域包含用碱性氨基酸(K或R)替换第8位和 第61位的谷氨酸残基。更优选地,scI-Crel大范围核酸酶包含上文a)、b)和c)中所述 的三对突变。scI-Crel大范围核酸酶有利地由第一结构域(A)和第二结构域(B)组成,所 述第一结构域(A)至少具有选自以下的突变(i)E8R、E8K或E8H,E61R、E61K或E61H以及 L97F、L97W 或 L97Y ; (ii) K7R、E8R、E61R、K96R 和 L97F ;或(iii) K7R、E8R、F54W、E61R、K96R 和L97F,所述第二结构域(B)至少具有以下突变(iv) K7E或K7D,F54G或F54A以及K96D 或 K96E ; (ν) Κ7Ε、F54G、L58M 和 Κ96Ε ;或(vi) K7E、F54G、K57M 和 K96E。破坏从scI-Crel大范围核酸酶结构域形成功能性同二聚体的突变的另一个例子 是G19S突变。将G19S突变有利地引入到scI-Crel大范围核酸酶两个结构域之一中,以获 得具有增强的切割活性和增强的特异性的单链大范围核酸酶。此外,为了进一步增强切割 特异性,另一结构域或两个结构域都可携带破坏形成功能性同二聚体或促进形成异二聚体 sc-I-Crel大范围核酸酶的不同突变,如上文所述。例如,一个单体包含G19S突变、K7E和 K96E或E8K和E61R突变,另一个单体包含E8K和E61R或K7E和K96E突变。在所述scI-Crel大范围核酸酶的另一个优选的实施方案中,所述突变是用选自 A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、V、L和W的氨基酸替换原始氨基酸。本发明的主题还包括包含SEQ ID NO 95或SEQ ID NO 97之序列的scI-Crel大 范围核酸酶;这些scI-Crel大范围核酸酶对位于人RAGl基因的RAGl靶标(RAG1. 10 ;SEQ ID NO 41以及图16)进行切割。该sc-I-Crel大范围核酸酶可用于修复与SCID综合征有 关的RAGl突变,或用于基因组工程改造RAGl基因座。由于RAG1. 10在编码序列的上游(图 16),因此这些sc-I-Crel大范围核酸酶可通过外显子敲入来修复RAGl基因中的任何突变, 如国际PCT申请W02008/010093介绍的。本发明的主题还包括编码上文所述单链大范围核酸酶的多核苷酸片段。根据所述 多核苷酸的一个优选实施方案,编码所述单链大范围核酸酶两个I-CreI结构域的核酸序 列具有低于80%的核酸序列同一性,优选低于70%的核酸序列同一性。这降低了两个序列 发生重组的风险,从而提高所述多核苷酸构建体及其衍生载体的基因遗传稳定性。这可以 通过密码子使用和遗传密码简并性改写I-CreI序列而获得。例如,一个结构域来自野生型 I-CreI编码序列(SEQ ID NO :22),另一结构域来自经改写的I-CreI编码序列(SEQ ID NO 24)。此外,选择编码单链大范围核酸酶的cDNA中的密码子以促进所述蛋白在所希望的表 达系统中的表达。本发明的主题还包括用于表达本发明单链大范围核酸酶的重组载体。所述重组载 体包含编码上述单链大范围核酸酶的至少一个多核苷酸片段。可在本发明中使用的载体包括但不限于病毒载体、质粒、RNA载体,或者可由染色 体、非染色体、半合成或合成核酸组成的线性或环形DNA或RNA分子。优选的载体是那些能 够自主复制的载体(附加型载体)和/或表达与之连接的核酸的载体(表达载体)。大量 的合适载体是本领域技术人员已知的并且是商品化的。
病毒载体包括逆转录病毒、腺病毒、细小病毒(例如腺相关病毒)、冠状病毒、负链 RNA病毒如正粘病毒(例如流感病毒)、杆状病毒(例如狂犬病病毒和疱疹性口腔炎病毒)、 副粘病毒(例如麻疹病毒和仙台病毒)、正链RNA病毒如小RNA病毒和甲病毒,以及双链DNA 病毒,包括腺病毒、疱疹病毒(例如1型和2型单纯疱疹病毒,EB病毒,巨细胞病毒)和痘病 毒(例如牛痘病毒、禽痘病毒和金丝雀痘病毒)。其他病毒包括例如诺瓦克病毒、被膜病毒、 黄病毒、呼肠孤病毒、乳多空病毒、肝DNA病毒和肝炎病毒。逆转录病毒的例子包括禽白血 病肉瘤病毒、哺乳动物C型、B型病毒、D型病毒、HTLV-BLV组、慢病毒、泡沫病毒(Coffin, J. Μ. , Retroviridae :The viruses and their replication, In Fundamental Virology, 第三版,B. N. Fields 等编辑,Lippincott-Raven Publishers, Philadelphia, 1996)。优选的载体包括慢病毒载体,尤其是自失活的慢病毒载体。载体可包含选择标记,例如用于真核细胞培养的新霉素磷酸转移酶、组氨醇脱氢 酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱疹病毒胸苷激酶、腺苷脱氨酶、谷氨酰胺合 成酶和次黄嘌呤-鸟嘌呤磷酸核糖基转移酶;用于酿酒酵母(S. cerevisiae)的TRP1、URA3 和LEU2 ;用于大肠杆菌(E.coli)的四环素、利福平或氨苄青霉素抗性。优选地,所述载体是表达载体,其中编码本发明单链大范围核酸酶的序列置于适 当的转录和翻译控制元件的控制下,以允许产生或合成所述大范围核酸酶。因此,所述多核 苷酸包含在表达盒中。更具体地,载体包含复制起点、与所述编码多核苷酸有效连接的启动 子、核糖体结合位点、RNA剪接位点(使用基因组DNA时)、多聚腺苷酸化位点和转录终止位 点。其还可包含增强子。启动子的选择取决于用于表达多肽的细胞。合适的启动子包括组 织特异性和/或诱导型启动子。诱导型启动子的例子是由提高的重金属水平诱导的真核 金属硫蛋白启动子,应答于异丙基-β-D-硫代半乳吡喃糖苷(IPTG)诱导的原核IacZ启动 子,和由提高的温度诱导的真核热休克启动子。组织特异性启动子的例子是骨骼肌肌酸激 酶、前列腺特异性抗原(PSA)、α-抗胰蛋白酶、人表面活性剂(SP)A和B蛋白,β-酪蛋白 和酸性乳清蛋白基因。根据所述载体的另一有利的实施方案,其包含靶向构建体,所述靶向构建体包含 与如上所述基因组DNA切割位点周围的区域具有同源性的序列。或者,编码单链大范围核酸酶的载体和包含靶向构建体的载体是不同的载体。更优选地,靶向DNA构建体包含a)与如上所述基因组DNA切割位点周围的区域具有同源性的序列,和b)侧翼是a)中序列的待引入序列。优选地,使用至少50bp、优选多于IOObp以及更优选多于200bp的同源序列。因此, 靶向构建体优选地为200pb 6000pb,更优选地为IOOOpb 2000pb。事实上,具有的DNA 同源性位于断裂位点上游和下游的侧翼区域中,且待引入的DNA序列应位于两臂之间。待 引入序列优选是修复目的基因中突变的序列(基因校正或功能性基因的恢复),以用于基 因治疗。或者,待引入序列可以是用于以某特定方式改变染色体DNA的任何其他序列,包括 用于修饰某特定序列的序列、用于弱化或激活目的基因的序列,用于失活或缺失目的基因 或其部分的序列,用于在目的位点引入突变的序列,或用于引入外源基因或其部分的序列。 这些染色体DNA改变可以用于基因组工程改造(动物模型/人重组细胞系)。本发明还涉及通过上文所述的多核苷酸或载体(优选表达载体)修饰的原核或真核宿主细胞。本发明还涉及非人转基因动物或转基因植物,其特征是其所有或部分细胞通过上 文所述的多核苷酸或载体进行了修饰。本文使用的“细胞”是指原核细胞如细菌细胞,或真核细胞如动物细胞、植物细胞 或酵母细胞。本发明的主题还涉及上述大范围核酸酶、多核苷酸(优选包含在表达载体、细胞、 转基因植物、非人转基因哺乳动物中)在分子生物学、体内或体外遗传工程以及体内或体 外基因组工程中的用途(非治疗目的)。分子生物学包括但不限于DNA限制性处理和DNA作图。非治疗目的的遗传工程和 基因组工程包括例如(i)用于蛋白生产的包装细胞系中特定位点的基因靶向,( )用于品 系改良和代谢工程的农作物中特定位点的基因靶向,(iii)用于移除基因修饰农作物中标 志物的靶向重组,(iv)用于移除基因修饰微生物菌株中标志物(例如为了抗体的生产)的
靶向重组。根据所述用途的一个有利的实施方案,其用于在包含DNA靶序列的目的位点引入 双链断裂,从而诱导DNA重组事件、DNA丢失或细胞死亡。根据本发明,所述双链断裂用于修复特定序列、修饰特定序列、将突变基因恢复 成功能基因,弱化或激活内源目的基因,在目的位点引入突变,引入外源基因或其部分,失 活或缺失内源基因或其部分,染色体臂移位,或使DNA不被修复并被降解。本发明的主题也包括遗传工程方法,其特征是其包括目的位点(位于包含如上所 述DNA靶标的载体中)产生双链核酸断裂的步骤,其通过将所述载体与如上所述大范围核 酸酶的接触来实现,从而诱导与另一载体(其与所述大范围核酸酶切割位点周围序列具有 同源性)发生同源重组。本发明的主题也包括基因组工程方法,其特征是包括以下步骤1)对包含如上所 述大范围核酸酶的至少一个DNA靶标的基因座产生双链断裂,其通过将所述靶标与所述大 范围核酸酶接触来实现;2)在适合与靶向DNA构建体(其包含侧翼序列与靶基因座具有同 源性的待引入到所述位点的序列)发生同源重组的条件下,维持所述断裂基因座。本发明的主题也包括基因组工程方法,其特征是包括以下步骤1)对包含如上所 述大范围核酸酶的至少一个DNA靶标的基因座产生双链断裂,其通过将所述切割位点与所 述大范围核酸酶接触来实现;2)在适合与染色体DNA(其与切割位点周围的区域具有同源 性)发生同源重组的条件下,维持所述断裂基因座。本发明的主题也包括上述至少一种大范围核酸酶、一种或两种衍生多核苷酸(优 选包含在表达载体中)用于制备在有此需要的个体中预防、改善或治疗遗传病的药物的用 途,所述药物可通过任何方式施用于所述个体。本发明的主题也包括预防、改善或治疗有此需要的个体的遗传病的方法,所述方 法包括通过任何方式对所述个体施用包含如上所述的至少一种大范围核酸酶的组合物的步骤。在这种情况下,如上所述的大范围核酸酶的用途至少包含以下步骤a)诱导个体 的体细胞组织在基因(包含所述大范围核酸酶的至少一个识别和切割位点)的目的位点发 生双链断裂,和b)将靶向DNA引入到该个体中,所述靶向DNA包含(1)与切割位点周围区
16域具有同源性的DNA和(2)在靶向DNA与染色体DNA发生重组后修复目的位点的DNA。在 适合将靶向DNA弓丨入到目的位点的条件下,将靶向DNA引入到个体中。根据本发明,通过将所述大范围核酸酶施用于个体(体内),或者将所述大范围核 酸酶引入到从个体中取出的体细胞并在修饰后再输回到个体中(离体),从而诱导所述双 链切割。在所述用途的一个优选的实施方案中,大范围核酸酶与靶向DNA构建体结合,该 靶向DNA构建体包含能修复基因突变的序列,其侧翼为与所述大范围核酸酶基因组DNA切 割位点周围的基因区域具有同源性的序列,如上文所述。修复突变的序列既可以是携带校 正序列的基因片段,也可以是外显子敲入构建体。为了校正基因,基因切割发生在突变的附近(优选突变的500bp内)。靶向构建体 包含用于修复切割的基因片断,其侧翼为与基因组切割位点具有同源性的至少200bp的序 列(最小修复基质),还包括用于修复突变基因的正确序列。接下来,用于基因校正的靶向 构建体包含最小修复基质或由其组成;优选200 6000bp,更优选1000 2000bp。为了恢复功能性基因,基因的切割发生在突变的上游。优选地,所述突变是基因序 列中第一个已知的突变,这样该基因的所有下游突变可同时被校正。靶向构建体包含框内 融合的基因组DNA切割位点下游的外显子(像在cDNA中那样)和3’端终止转录的多聚腺 苷酸化位点。待引入序列(外显子敲入构建体)的侧翼为在切割位点周围的内含子或外显 子序列,以使改造基因(外显子敲入基因)转录成能编码功能性蛋白质的mRNA。例如,外显 子敲入构建体的侧翼为上游和下游序列。本发明的主题还包括上述至少一种大范围核酸酶、多核苷酸(优选包含在表达载 体中)用于制备在有此需要的个体中预防、改善或治疗由呈现DNA中间体的感染原引起之 疾病的药物的用途,所述药物可通过任何方式施用于所述个体。本发明的主题也包括预防、改善或治疗有此需要的个体中由呈现DNA中间体的感 染原引起的疾病的方法,所述方法包括以任何方式对所述个体施用如上所述组合物的步
马聚ο本发明的主题也包括上述至少一种大范围核酸酶、多核苷酸(优选包含在表达载 体中)在体外在生物衍生产品或旨在用于生物的产品中用于对呈现DNA中间体的感染原进 行增殖抑制、失活或缺失或对物品进行消毒的用途。本发明的主题也包括从产品或材料中去除某种呈现DNA中间体的感染原污染的 方法,所述方法至少包括以下步骤,即将生物制品或旨在用于生物利用的产品或物品与上 述化合物接触足够的时间,以对所述感染原进行增殖抑制、失活或缺失。在一个具体实施方案中,所述感染原是病毒。例如,所述病毒是腺病毒(Adll, Ad21)、疱疹病毒(HSV、VZV、EBV、CMV、疱疹病毒6、7或8)、肝DNA病毒(HBV)、乳多空病毒 (HPV)、痘病毒或逆转录病毒(HTLV、HIV)。本发明的主题也包括组合物,其特征在于包含上述至少一种大范围核酸酶、多核 苷酸(优选包含在表达载体中)。在所述组合物的一个优选实施方案中,其包含靶向DNA构建体,该靶向DNA构建体 包含能修复目的位点的序列,其侧翼为与如上所述靶基因座具有同源性的序列。优选地,所 述靶向DNA构建体包含在重组载体中或者包含在表达载体中,所述表达载体包含编码本发明大范围核酸酶的多核苷酸。本发明的主题也包括含有至少一种上述大范围核酸酶、编码所述大范围核酸酶的 表达载体以及包含靶向构建体的载体,其作为联合制剂用于同时、分别或者先后用于预防 和治疗遗传病。为了用于治疗,大范围核酸酶和可药用赋形剂可以按照治疗有效量施用。如果施 用量有生理意义,则认为这种组合以“治疗有效量”施用。如果某种制剂的存在可使受者发 生生理学上可以察觉的改变,就可以认为这种制剂具有生理意义。在本文中,如果某种药剂 的存在可以使目标疾病中一个或多个症状的严重程度减轻,并能对病变或异常进行基因组 校正,就可以认为这种药剂具有生理学意义。在本发明用途的一个实施方案中,大范围核酸酶基本上是非免疫原性的,即不引 发或几乎不引发不利的免疫应答。根据本发明,可使用大量改善或消除这类有害免疫反 应的方法。在一个优选的实施方案中,大范围核酸酶基本不含N-甲酰基甲硫氨酸。避免 不想要的免疫反应的另一种方式是将大范围核酸酶与聚乙二醇("PEG")或聚丙二醇 (“PPG")(优选500到20,000道尔顿的平均分子量(MW))缀合。与PEG或PPG缀合(例 如Davis等(US 4,179,337)所述)能够提供具有抗病毒活性的非免疫原性的生理活性水 溶性内切核酸酶缀合物。Saifer等(US 5,006,333)中还介绍了使用聚乙二醇-聚丙二醇 共聚物的类似方法。大范围核酸酶可作为多肽或作为编码所述多肽的多核苷酸构建体载体来使用。通 过本领域熟知的任何方便的、适合于特定细胞类型的方法(单独或与至少一种合适的介质 或载体和/或与靶向DNA组合)将其引入到细胞中(体外、离体或体内)。一旦进入细胞, 大范围核酸酶和包含靶向DNA和/或编码大范围核酸酶的核酸的载体(如果存在的话)就 会被细胞从胞质输入或易位至核内的作用位点。大范围核酸酶(多肽)可以有利地与脂质体、聚乙烯亚胺(PEI)和/或膜易位肽 组合(Bonetta,The Scientist,2002,16,38 ;Ford 等,Gene Ther.,2001,8,1-4 ;Wadia and Dowdy, Curr. Opin. Biotechnol.,2002,13,52-56);在最后一种情况下,大范围核酸酶的序 列与膜易位肽的序列融合(融合蛋白)。可以用很多方法(例如注射、直接摄入、射弹轰击、脂质体、电穿孔)将包含靶向 DNA和/或编码大范围核酸酶的核酸的载体引入到细胞中。可使用表达载体在细胞中稳定 或瞬时地表达大范围核酸酶。在真核细胞进行表达的技术是本领域技术人员熟知的(见 Current Protocols in Human Genetics 第 12 章‘‘Vectors For Gene Therapy,,&第 13 章 "Delivery Systems for Gene Therapy,,)。任选地,可优选在重组蛋白中掺入核定位信号 以确保其在核内表达。本发明的主题还包括上述至少一种大范围核酸酶作为制备其他大范围核酸酶之 骨架的用途。例如,为了制备新的归巢内切核酸酶,可对单链大范围核酸酶进行其他轮次的 诱变和选择/筛选。大范围核酸酶的用途以及使用本发明大范围核酸酶的方法还包括使用编码所述 大范围核酸酶的多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物,如上所述。本发明用途和方法的另一个有利的实施方案中,所述大范围核酸酶、多核苷酸、载 体、细胞、转基因植物或非人转基因哺乳动物与如上所述的靶向DNA构建体组合。优选地,
18所述编码大范围核酸酶的载体包含靶向DNA构建体,如上所述。制备具有新切割特异性的I-CreI变体的方法已有文献做过介绍(Epinat等, Nucleic Acids Res. ,2003,31 2952-2962 ;Chames φ, Nucleic Acids Res. ,2005, 33,el78,和 Arnould 等,J. Mol. Biol.,2006,355,443-458 ;Smith 等,Nucleic Acids Res.,2006,34,el49 ;Arnould 等,J. Mol. Biol.,Epub IOMay 2007 ;国际 PCT 申请 WO 2004/067736, WO 2006/097784, WO 2006/097853, WO 2007/049095, WO 2007/057781, WO 2007/060495, WO 2007/049156, WO 2007/093836, WO 2007/093918, W02008/010009, W02008010093, W02008/059317, W02008/059382, WO 2008/093152, WO 2008/093249, WO 2008/02198, WO 2008/02199, WO 2008/02274, WO 2008/149176, WO 2008/152523, WO 2008/152524和WO 2009/001159)。本发明的单链大范围核酸酶可通过熟知的重组DNA技 术和遗传工程技术从I-CreI或功能性变体中获得。例如,通过使用特定引物的PCR从DNA 模板扩增出序列,其在框内包含在N端结构域编码序列3’端或C端结构域编码序列5’端 的接头编码序列。然后将PCR片段通过合适的限制性酶切位点克隆到包含编码另一结构域 之序列的载体中。本发明定义的单链大范围核酸酶通过表达上述多肽来产生;优选地,在适 于表达该多肽的条件下,在经表达载体修饰的宿主细胞或转基因动物/植物中表达所述多 肽,从宿主细胞培养物或从转基因动物/植物中回收单链大范围核酸酶衍生物。除非另有说明,否则本发明的实施将利用细胞生物学、细胞培养、分子生物学、转 基因生物学、微生物学、DNA重组和免疫学的常规技术,它们为本领域所知。这些技术在文献 中有充分的介绍。参阅如 Current Protocols in Human Genetics (Frederick M,USUBEL, 2000,Wiley and son Inc,Library of Congress,USA) ;Molecular Cloning :A laboratory manual,第三版,(Sambrook 等,2001, Cold Spring Harbor, New York :CoId Spring Harbor Laboratory Press) ;Oligonucleotide Synthesis (M. J. Gait 编辑,1984) ;Mullis 等仄5.卩&1似.4683195;灿(;16化 Acid Hybridization (B. D. harries & S. J. Higgins 编 辑· 1984) ;Transcription And Translation (B. D. harries & S. J. Higgins 编辑· 1984); Culture Of Animal Cells (R.I. Freshney, Alan R.Liss, Inc.,1987) ;Immobilized Cells And Enzymes(IRL Press,1986) ;B.Perbal, A Practical Guide To Molecular Cloning(1984) ;Methods In ENZYM0L0GY 丛书(J, Abelson 和 Μ. Simon 主编,Academic Press, Inc. ,New York),特别是 Vol. 154 和 155 (Wu 等编辑)和 Vol 185,"Gene Expression Technology" (D. Goeddel 编辑);Gene Transfer Vectors For Mammalian Cells (J. H. Miller 禾口 M. P. Calos 编辑,1987, Cold Spring Harbor Laboratory) ;Immunochemical methods In Cell And Molecular Biology(Mayer 禾口 Walker 编辑,Academic press, London,1987) ;Handbook Of Experimental Immunology, Volumes I-IV(D. M. Weir 禾口 C. C. Blackwell 编辑,1986);禾口 Manipulating the Mouse Embryo, (Cold Spring harbor Laboratory Press, Cold Spring Harbor, N. Y.,1986)。除了上述特征外,本发明还包括如下描述中出现的其他特征,其是指举例说明本 发明的单链I-CreI大范围核酸酶及其用途的实例以及附图,其中-图1是I-CreI的Ca带状图。-图2是人XPC基因(GenBank编号NC_000003)的示意图。XPC外显子加框显示, XPC4. 1 (或Cl SEQ ID NO 26)的序列(20438位)位于外显子9上。
-图3代表被I-CreI或其一些衍生变体(分别是SEQID NO :21、27到29、26、30 和 31)切割的 22bp 的 DNA 靶标。C1221 是 I-CreI 靶标。10GAG_P、10GTA_P 和 5TCT_P 是回 文靶标,其与C1221的区别在于加框的基序。Cl是XPC靶标;C3和C4是回文靶标,分别来 自Cl的左侧部分和右侧部分。如图所示,10GAG_P、10GTA_P和5TCT_P的加框基序可以在 Cl靶标中找到。-图4示意异二聚体联合突变体对Cl靶标的切割。该图示意了用Cl靶标对C3和 C4切割酶的组合进行二次筛选。H33突变是体在7种C3切割酶中,X2突变是在8种C4切 割酶中,X2/H33异二聚体对Cl靶标的切割用黑圈标出。图5代表?0^0542大范围核酸酶表达载体图。?0^0542是基于2 4的复制载体, 带有LEU2营养缺陷基因标记以及能驱动大范围核酸酶表达的诱导型GallO启动子。图6代表在哺乳动物细胞中表达大范围核酸酶所需的质粒PCLS1088的图。图7代表pCLS1058报告载体图。该报告载体上有杀稻瘟素和氨苄青霉素抗性基 因。LacZ串联重复有SOObp的同源性,并被长为1.3kb的DNA序列隔开。其周围是EFl-a 启动子和终止子序列。靶位点用Gateway方法(INVITR0GEN)进行克隆,导致在选定的靶位 点替换CmR和ccdB基因。图8示意针对3种XPC靶标C1、C3和C4对18种单链构建体进行酵母筛选。每个 单链分子根据其表1中的编号标出。在每个四点酵母聚簇中,左边的两个点是实验结果,而 右边的两个点是内参,用来评价实验的质量和可靠性。-图9示意在CHO细胞中的染色体外测定中,X2-L1-H33和X2-RM2-H33这两种单 链构建体对C1、C3和C4 XPC靶标的切割。背景对应于用空表达载体转染细胞。同一实验 中I-SceI对S1234 I-SecI靶标的切割作为阳性对照。-图10示意在CHO细胞中的染色体外测定中,X2/H33异二聚体和X2-Ll-H33ei9S* X2-RM2-H33G19S这两种单链构建体对C1、C3和C4 XPC靶标的切割。背景对应于用空表达载 体转染细胞。同一实验中I-SecI对S1234 I-SecI靶标的切割作为阳性对照。-图11示意针对3种XPC靶标(Cl、C3和C4)对3种XPC单链分子X2-L1-H33、 SCXl 和 SCX2 进行酵母筛选。SCXl 是 X2(K7E)-L1-H33(E8K,G19S)分子,SCX2 代表 X2(E8K)-L1-H33(K7E,G19S)分子。在每个四点酵母聚簇中,左边的两个点是实验结果,而 右边的两个点是内参,用来评价实验的质量和可靠性。-图12代表中国仓鼠(Cricetulusgriseus)次黄嘌呤-鸟嘌呤磷酸核糖基转移 酶(HPRT)mRNA(GenBank编号J00060. 1)的示意图。灰色框表示ORF。还显示了 HprCH3靶 点的序列(SEQ ID NO 34)与其位置。-图13代表被I-CreI或其一些衍生变体(分别为SEQID NO :21、27和32 36) 切割的22bp的DNA靶标。C1221是I-CreI靶标。10GAG_P、10CAT_P和5CTT_P是回文靶标, 其与C1221的区别在于加框的基序。HprCH3是HPRT靶标,HprCH3. 3和HprCH3. 4是回文靶 标,分别来自HprCH3的左侧部分和右侧部分。如图所示,10GAG_P、10CAT_P和5CTT_P的加 框基序可以在HprCH3靶标中找到。-图14示意MA17和H33同二聚体、HPRT异二聚体和三种HPRT单链分子针对3种 HPRT靶标HprCH3、HprCH3. 3和HprCH3. 4的酵母筛选。H是MA17/H33异二聚体。由于它由 MA17和H33的共表达产生,因此实际上在酵母中有3种分子两种MA17和H33同二聚体和一种MA17/H33异二聚体。同二聚体的形成导致切割HprCH3. 3和HprCH3. 4靶标。SCl SC3分别为MA17-Ll-H33、MA17-Ll-H33ei9S和MA17-RM2-H33。在每个四点酵母聚簇中,左边 的两个点是实验结果,而右边的两个点是内参,用来评价实验的质量和可靠性。图15示意在CHO细胞中的染色体外测定中,MA17/H33异二聚体和4种HPRT单 链构建体(MA17_L1-H33、MA17-L1-H33G19S, MA17-RM2-H33 和 MA17-RM2_H33G19S)对 HprCH3、 HprCH3. 3和HprCH3.4HPRT靶标的切割。背景对应于用空表达载体转染细胞。同一实验中 I-SecI对S1234I-SecI靶标的切割作为阳性对照。-图16是人RAGl基因(GenBank编号NC_000011)的示意图。外显子序列加框显 示,还显示了外显子-内含子接合处。灰色框表示0RF。还显示了 RAG1. 10的序列(SEQ ID NO 41)与其位置。-图17代表被I-CreI或其一些衍生变体(分别是SEQID NO 21和SEQ ID NO 37 43)切割的 22bp 的 DNA 靶标。C1221 是 I-CreI 靶标。10GTT_P、5CAG_P、10TGG_P 和 5GAG_P是回文靶标,其与C1221的区别在于加框的基序。RAG1. 10是RAGl靶标。RAG1. 10. 2 和RAG1. 10. 3是回文靶标,分别来自RAG1. 10的左侧部分和右侧部分。如图所示,10GTT_P、 5CAG_P、10TGG_P和5GAG_P的加框基序可以在RAG1. 10靶标中找到。-图18示意4种RAGl单链分子针对3种RAGl靶标(RAG1.10、RAG1. 10. 2和 RAG1. 10. 3)的酵母筛选。SCl SC4 分别代表 M2-L1-M3、M2G19S-L1_H33、M2-RM2-H33 和 M2G19S-RM2-M30图中还显示了 M2和M3I_CreI突变体的活性,以及M2/M3异二聚体对3种 RAGl靶标的活性。在每个四点酵母聚簇中,左边的两个点是实验结果,而右边的两个点是内 参,用来评价实验的质量和可靠性。-图19示意两种单链分子SCl和SC2针对3种RAG1.10靶标的酵母筛选。SCl是 M3-RM2-M2分子,而SC2代表M3(K7E K96E) -RM2-M2 (E8K E61R)分子。在每个四点酵母聚簇 中,左边的两个点是实验结果,而右边的两个点是内参,用来评价实验的质量和可靠性。-图20示意6种RAGl单链分子针对3种RAGl靶标(RAG1.10、RAG1. 10. 2和 RAG1. 10. 3)的酵母筛选。图中还显示了 M2/M3异二聚体对3种RAGl靶标的活性。在每个 四点酵母聚簇中,左边的两个点是实验结果,而右边的两个点是内参,用来评价实验的质量 和可靠性。-图21示意在CHO细胞中的染色体外测定中,4种单链构建体对RAG1.10、 RAG1. 10. 2和RAG1. 10. 3靶标的切割。背景对应于用空表达载体转染细胞。结果表示为M2/ M3异二聚体针对相同三种靶标之活性的百分比。-图22示意A.CHO细胞中染色体测定的原理。B. M2/M3异二聚体以及两种单链 分子M3-RM2-M2ei9S和M3—-RM2-M2+·的基因校正活性。LacZ阳性细胞的比率表示为所转染 表达质粒数的函数。-图23示意5种单链分子对RAG1.10、RAG1. 10. 2和RAG1. 10. 3靶标的活性。在 每个酵母聚簇中,左边的两个点是单链分子,而右边的两个点是实验内参。-图24是用于内源性RAGl基因座的基因靶向策略的流程图。RAGl靶序列 (RAG1. 10 =SEQ ID NO 41)位于编码Ragl蛋白的外显子2的上游。外显子2加框显示,开 放读码框为白色。大范围核酸酶对天然RAGl基因的切割产生了同源重组的基质,它可利用 含1. 7kb的外源性DNA(其侧翼是同源性臂)的修复基质作为修复基质。
-图25代表pCLS1969载体图。-图26示意基因靶向事件的PCR分析。RAGl基因座的野生型克隆和随机插入了 供体修复质粒的克隆都不能进行PCR扩增。在RAGl基因座发生了基因靶向事件的克隆可 以获得2588bp的PCR产物。-图27示意细胞克隆的Southern印迹分析。用HindIII消化基因组DNA制备物, 然后对位于右侧同源臂外侧的RAGl基因片段进行Southern印迹。基因座图标出了 了野生 型基因座(5.3kb)和被靶向基因座(3.4kb)的限制性酶切模式。实心黑色框表示探针。对 来自单个转染细胞的5个克隆样品(1-5)和来自非转染细胞(293)的DNA进行了分析。在 3个样品中,等位基因之一被靶向。H是指HindIII位点。-图28示意异二聚体和单链分子的生物物理学分析。A;单链大范围核酸酶以及相 应异二聚体蛋白的圆二色性谱。B ;所有异二聚体和单链变体的热变性。C;分离系数(KAV) 与利用分析型Superdex-200 10-300GL柱的四种蛋白标准品(空心圆)分子量的对数的校 正曲线图。单链大范围核酸酶的值用实心圆表示(测定丽是34KDa,理论丽是41KDa)。-图29示意毒理学研究。Α.剂量应答研究。用不同量的多种大范围核酸酶表达载 体和固定量的修复质粒转染CHO细胞系。 ,Μ2/Μ3异二聚体;·,M2ei9S/M3异二聚体;▲, M2+/M3-异二聚体;X,M2+G19S/M3" ;*,M3-RM2_M2g19S ; ·,M2+G19S-RM2-M3" ; □,I—secI。B.通过 细胞存活测定监测的改造大范围核酸酶的毒性。用不同量的大范围核酸酶表达载体和恒定 量的编码GFP的质粒共转染CHO-Kl细胞。如材料和方法中介绍的,细胞存活以转染后第6 天表达GFP的细胞的百分比来表示。完全无活性的M2ei9S/M3ei9S异二聚体作为无毒性对照 ( )。C.通过DNA双链断裂处Y H2AX灶点的形成来观察DNA损伤。用10倍大范围核酸 酶活性剂量处理的细胞的代表性图像。实施例1 制备切割人类XPC基因的衍生自单链I-CreI的大范围核酸酶。着色性干皮病(XP)是一种罕见的常染色体隐性遗传病,其特征为对紫外线(UV) 接触过敏并且高度易感于皮肤癌。扫描与着色性干皮病有关的人XPC基因以寻找可能的靶 序列。一个可能的 22bp 的 DNA 靶标称为 Cl(cgagatgtcacacagaggtacg ;SEQ ID NO 26), 位于XPC第9个外显子的末端(图2)。对能切割Cl靶标的I-CreI衍生突变体的改造如 之前 Arnould 等,J. Mol. Biol.,Epub 10 May 2007 ;国际 PCT 申请 WO 2007/093836 和 WO 2007/093918所述。简单来说,将Cl序列分为两个回文半靶标,分别称为C3和C4(图3)。 由于C3靶标与10GAG_P靶标相同,仅在士6位不同,针对C3靶标对能切割10GAG_P靶标的 I-CreI衍生突变体进行筛选。与I-CreI野生型序列相比,分离了携带单突变Y33H(用组氨 酸残基替换第33位的酪氨酸)的突变体H33作为强C3切割酶。C4靶标是10GTA_P与5TCT_ P靶标的组合。将可切割10GTA_P靶标的I-CreI突变体与可切割5TCT_P靶标的I-CreI突 变体相组合,并针对C4 DNA靶标进行筛选,如之前Smith等,Nucleic Acids Res.,2006, 34,el49 ;国际 PCT 申请 WO 2007/049095 和 WO 2007/057781 中所述。分离了 I-CreI 突变 体X2作为强C4切割酶。与I-CreI野生型序列相比,X2突变体带有以下突变Y33H、Q38A、 S40Q、Q44K、R68Q、R70S和D75N。最后一步是将H33和X2 I-CreI突变体在酵母中共表达, 如之前国际 PCT 申请 WO 2006/097854 和 Arnould 等,J. Mol. Biol.,2006,355,443-458 所 述,这导致了 XPC Cl DNA靶标的强切割(图4)。由于存在两种同二聚体,因此两种突变体共表达获得的X2/H33XPC异二聚体不仅切割Cl靶标,还切割C3和C4靶标。为了避免出现这些副作用,构想出设计包含两种I-CreI 衍生突变体X2和H33的单链分子的新方法。为了达到这个目的,在单链分子设计中保留全 长X2N端突变体,并改造了一些X2-L-H33型构建体,其中L是蛋白接头。在该命名法中,X2 将称为N端突变体,H33称为C端突变体。另外一个重要的问题是单链分子中两个突变体 的序列同一性。事实上,两个I-CreI突变体X2和H33的核酸序列几乎相同,这提高了该构 建体稳定性的问题以及在这两种几乎相同的序列之间发生重组的风险。为了避免或者至少 减少这种可能性,使用另一种I-CreI形式(称为I-CreI CLS)来编码H33突变体。I-CreI CLS的核苷酸序列(SEQ ID NO 24)是利用密码子使用和遗传密码简并性从I-CreI野生型 序列(I-CreI wt ;SEQ ID NO 22)改写而来的。这意味着I-Crel CLS与I-CreI wt具有 73%的核酸序列同一性,并且具有3个单氨基酸突变(T42A、EllOW和Qll 1R),这些突变不 会改变I-CreI的活性。然后将Y33H引入到I-CreI CLS形式(SEQ ID NO 25)中。检测了 H33CLS突变体对C3靶标的活性,结果发现其与I-CreI野生型形式中的H33突变体的活性 一样强。利用H33CLS突变体构建了 18种X2-L-H33型单链形式(其中L是接头),它们各 不相同。G19S突变也被引入到两种单链分子的C端H33突变体中。然后在酵母中监测不同 单链构建体对ClXPC靶标及其两种衍生物C3和C4的活性,对其中一些在CHO细胞中用染 色体外测定进行监测。1)材料和方法a)在I-CreI CLS形式中引入Y33H突变用两组引物进行两个重叠PCR反应,第一个片段为GalIOF (5,-gcaactttagtgctga cacatacagg_3,;SEQ ID NO 44)禾口 H33Revp60 (5,-ctggtgtttgaacttgtgagattgatttggttt-3' ;SEQ ID NO :45),第二个片段为 H33Forp60 (5' -aaaccaaatcaatctcacaagttcaaacaccag-3,;SEQ ID NO 46)禾口 GallOR(5,-acaaccttgattggagacttgacc-3,;SEQ ID NO :47)。使用 约25ng的每种PCR片段和经过NcoI和EagI消化而线性化的75ng载体DNApCLS0542 (图 5),通过高效 LiAc 转化方案(Gietz, R. D.和 Woods R. Α.,Methods Enzymo 1.,2002,350, 87-96)转化酿酒酵母菌株 FYC2-6A (ΜΑΤ α,trplA63, leu2A 1, his3A200)。通过在酵母 中体内同源重组来产生含有Y33H突变的完整编码序列。b)突变体测序为回收表达突变体的质粒,采用标准方法提取酵母DNA并用于转化大肠杆菌。利 用MILLEGEN SA对质粒进行突变体ORF测序。c)克隆18种XPC单链分子对I-CreI CLS形式中的H33突变体进行了 18个独立的PCR反应。每个PCR反应 采用相同的反向弓丨物 CreCterR60(5' -tagacgagctcctaaggagaggactttttcttctcag-3,;SEQ ID NO 48)和特异性正向引物。所用的18种正向引物如下-LlEaRl 5' -tatcggccggtggcggaggatctggcggcggtggatccggtggtggaggctccggagg aggtggctctaacaaagagttcctgctgtatcttgctgga-3' (SEQ ID NO 49)-YPP 5' -tatcggccggtaaatcttccgattccaagggtattgatctgactaatgttactctgcctga tacccctacttattccaaagctgcctctgatgctattcctccagctaacaaagagttcctgctgtatcttgctggat tt-3,(SEQ ID NO 50)
-AOL 5' -tatcggccggtctggagtatcaggctccttactcttcccctccaggtcctccttgttgctc cggttcctctggctcctctgctggttgttctaacaaagagttcctgctgtatcttgctggattt-3'(SEQ ID NO
51)-CXT -tatcggccggtctgtcctatcattattctaatggtggctcccctacttctgatggtccagc tctgggtggcatttctgatggtggcgctactaacaaagagttcctgctgtatcttgctggattt-3,(SEQ ID NO
52).-BQY -tatcggccggtgattcctctgtttctaattccgagcacattgctcctctgtctctgccttc Ctctcctccatctgttggttctaacaaagagttcctgctgtatcttgctggattt-S' (SEQ ID NO :53)-VSG -tatcggccggtgcttctcagggttgtaaacctctggctctgcctgagctgcttactgagga ttcttataatactgataacaaagagttcctgctgtatcttgctggattt-3' (SEQ ID NO :54)-BYM -tatcggccggtaatcctattcctggtctggatgagctgggtgttggcaactctgatgctgc cgctcctggcactaacaaagagttcctgctgtatcttgctggattt-S' (SEQ ID NO :55)-MCJ :5,-tatcggccggtgctcctactgagtgttctccttccgctctgacccagcctccatccgcttc tggttccctgaacaaagagttcctgctgtatcttgctggattt-3' (SEQ ID NO :56)-GSmid 5' -tatcggccggtggaggcggttctggaggcggtggctctggtggaggcggttccggtgga ggcggatctggtggaggcggttctaac已已已gagttcctgctgtatcttgctggattt_3, (SEQ ID NO 57)-GSshort -tatcggccggtggaggcggttctggaggcggtggctctggtggaggcggttccaaca aagagttcctgctgtatcttgctggattt-3,(SEQ ID NO :58)-GSxshort -tatcggccggtggaggcggttctggaggcggtggctctaacaaagagttcctgctg tatcttgctggattt-3(SEQ ID NO 59)-PPR -tatcggccggtcaggttacttctgctgccggtcctgctactgttccatctggtaacaaaga gttcctgctgtatcttgctggattt-3' (SEQ ID NO:-SBAl -tatcggccggtggatctcctctgaagccttctgccccaaagattcctataggtggctcca acaaagagttcctgctgtatcttgctggattt-3' (SEQ ID NO :61)-SBA2 -tatcggccggtggatctcctctgaagccttctgccccaaagattcctataggtggctccc cactgaaaccttccgcacctaaaatcccaattggtggctctaacaaagagttcctgctgtatcttgctggattt_3,( SEQ ID NO 62)-LPl -tatcggccggtggatctcctctgtctaaaccaattccaggcggttccaacaaagagttcct gctgtatcttgctggattt-3' (SEQ ID NO 63)-LP2 -tatcggccggtggatctcctctgtctaaaccaattccaggcggttccccactgtcaaagcc aatccctggcggttctaacaaagagttcctgctgtatcttgctggattt-3,(SEQ ID NO :64)-RMl -tatcggccggtggatctgataagtataatcaggctctgtctgagcgtcgcgcctacggtgt cgccaataacctggtttccggtggaggcggttccaacaaagagttcctgctgtatcttgctggattt_3, (SEQ ID NO 65)-RM2 -tatcggccggtggatctgataagtataatcaggctctgtctaaatacaaccaagcactgtc caagtac已已tcaggccctgtctggtggaggcggttccaac已已已gagttcctgctgtatcttgctggattt一3’ (SEQ ID NO 66).所有PCR片段都被纯化并经EagI和SacI消化,将每种PCR片段连接进也经EagI 和SacI消化的X2突变体的酵母表达载体。对克隆进行测序后,获得了酵母表达载体中的
24所有单链分子。 d)在两种单链分子X2-L1-H33和X2-RM2-H33的C端H33突变体中引入G19S突变用两组引物进行两个重叠PCR反应第一个片段为GallOF(5’ -gcaactttagtgctg acacatacagg-3' :SEQ ID NO :44)和 G19SRev(5' gcaatgatggagccatcagaatccacaaatccagc -3,:SEQ ID NO :67),第二个片段为 G19For60(5,-gctggatttgtggattctgatggctccatcattg c-3,:SEQ ID NO 68)禾口 GallOR(5,-acaaccttgattggagacttgacc-3,SEQ ID NO :47)。使 用约25ng的每种PCR片段和经过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542 ; 图 5),通过高效 LiAc 转化方案(Gietz,R. D 和 Woods R. Α.,Methods Enzymol.,2002,350, 87-96)转化酿酒酵母菌株 FYC2-6A (ΜΑΤ α,trplA63, leu2A 1, his3A200)。通过在酵母 中体内同源重组来产生含有G19S突变的完整编码序列。e)在XPC X2-L1-H33单链分子中引入K7E、E8K和G19S突变首先,将G19S突变引入到X2-L1-H33分子中。对克隆到pCLS0542酵母表达载体 中的单链分子进行两个重叠PCR反应。第一个PCR反应所用引物是=GallOF (5 ’-gcaacttta gtgctgacacatacagg-3' ;SEQ ID NO 44)和G19SRev60(5'-gcaatgatggagccatcagaatccacaa atccagc-3,;SEQ ID NO 67);第二个 PCR 反应所用引物是G19For60 (5,-gctggatttgtggat tctgatggctccatcattgc-3 ;SEQ ID NO 68)和 Gal10R(5' -acaaccttgattggagacttgacc-3'; SEQ ID NO 47)。使用约25ng的每种PCR片段和经过NcoI和EagI消化而线性化的75ng 载体 DNA(pCLS0542 ;图 5),通过高效 LiAc 转化方案(Gietz,R. D 和 Woods R. Α.,Methods Enzymol.,2002,350,87-96)转化酿酒酵母菌株 FYC2-6A (ΜΑΤ α,trpl Δ63, leu2A 1, his3A200)。通过在酵母中体内同源重组来产生含有G19S突变体的完整编码序列。第二步,通过进行3个重叠突变将K7E和E8K突变引入到X2_L2_H33 (G19S)分子 中。对于SCXl分子,3个PCR反应使用3组引物,分别是GallOF和K7ERev (5,-gtacagcagg aactcttcgttatatttggtattgg-3,)、K7EFor(5,_aataccaaatataacgaagagttcctgctgtacc_3,; SEQ ID NO :69)和 E8KRevSC(5' -aagatacagcaggaactttttgttagagccacc-3' ;SEQ ID NO: 70)、E8KForSc(5' -ggtggctctaacaaaaagttcctgctgtatctt-3' ;SEQ ID NO 71)禾口 GallOR0 对于SCX2分子,3个PCR反应使用3组引物,分别是GallOF和E8KRev(5,-caggtacagcag gaactttttgttatatttgg-3‘ ;SEQ ID NO 72) > E8KFor(5' -accaaatataacaaaaagttcctgctgt acctgg-3' ; SEQ ID NO 73)和 K7ERevSC(5' -aagatacagcaggaactcttcgttagagccacc-3'; SEQ ID NO :74)、K7EForSc(5,-ggtggctctaacgaagagttcctgctgtatctt-3,; SEQ ID NO 75) 和GallOR。对这两个构建体,使用约25ng的每种PCR片段和经过NcoI和EagI消化而线 性化的75ng载体DNA(pCLS0542 ;图5),通过高效LiAc转化方案(Gietz, R. D.和Woods R. A. , Transformation of yeast by lithim aetate/single-stranded carrier DNA/ polyethylene glycol method, Methods Enzymol.,2002,350,87-96)转化酿酒酵母菌株 FYC2-6A (MAT α,trpl Δ 63,leu2 Δ 1,his3 Δ 200)。通过在酵母中体内同源重组来产生SCXl 或SCX2构建体的完整编码序列。f)表达大范围核Μ 克降的接合并在酵母Φ 帝选如之前(国际PCT 申请 WO 2004/067736 ;Epinat 等,Nucleic Acids Res.,2003, 31 2952-2962 ;Chames 等,Nucleic Acids Res.,2005,33,el78 ;Arnould 等,J. Mol. Biol., 2006,355,443-458)所述进行筛选。利用菌落网格(gridder) (QpixII, Genetix)进行接合。使用低网格密度(约4个点/cm2)将突变体置于覆盖在YPD平板上的尼龙滤膜上的网 格中。在相同的滤膜上进行第二次划网格的过程,以针对每个靶标点出由不同报告基因之 酵母菌株组成的第二层。将膜置于固体琼脂富YPD培养基上,并在30°C孵育一夜,以允许接 合。接着,将滤膜转移至缺乏亮氨酸和色氨酸且含有半乳糖(2%)作为碳源的合成培养基 上,并在37°C孵育5天,以筛选出带有表达载体和靶标载体的二倍体。5天后,将滤膜置于 含有0. 02%的X-Gal (在pH7.0的0. 5M磷酸钠缓冲液中)、0. 的SDS、6%二甲基甲酰胺 (DMF)、7mM β -巯基乙醇、1 %琼脂糖的固体琼脂糖培养基上,并在37°C孵育,以检测β -半 乳糖苷酶活性。通过扫描来分析结果,使用适当的软件进行定量。g)将XPC单链构律彳本克降讲Π甫?丨1云M勿表汰裁体Φ用以下引物对每个突变体的ORF进行PCR扩增CCM2For (5,-aagcagagctctctggct aactagagaacccactgcttactggcttatcgaccatggccaatacc aaatataacaaagagttcc-3‘ ;SEQ ID NO 76)禾Π CCMRev60(5' -ctgctctagactaaggagaggactttttcttctcag-3' ;SEQ ID NO :77)。 将PCR片段用限制性内切酶SacI和XbaI消化,然后连接到同样经SacI和XbaI消化的 PCLS1088载体中(图6)。通过测序(MILLEGEN)验证所得克隆。
_2] h) 輔CHO麵Φ傭械搬泖關·Φ械Cl、C3、禾口 C4革 如下克隆目的靶标从PR0LIG0订购对应于靶序列(侧翼是gateway克隆序列) 的寡核苷酸。使用Gateway方法(INVITR0GEN),将对单链寡核酸进行PCR扩增而产生的双 链靶DNA克隆进CHO报告载体中(pCLS1058,图7)。i) CHO细胞中的染饩体外测定根据供应商(QIAGEN)的方案用Polyfect转染试剂转染CHO细胞。转染后72 小时,去除培养基并添加150 μ 1裂解/显色缓冲液(1L缓冲液含有100ml裂解缓冲液 (Tris-HCl IOmM pH7.5、NaCl 150mM、Triton X1000. 1%,BSA 0. lmg/ml、蛋白酶抑制剂), 10ml Mg IOOX 缓冲液(MgCl2IOOmM, β -巯基乙醇 35% ), 110ml ONPG 8mg/ml 和 780ml 磷 酸钠0. IM pH7. 5)用于β-半乳糖苷酶液体实验。在37°C孵育后,在420nm处测定吸光度。 整个过程利用自动化BioCel⑧(Velocityll)平台进行。2)结果a) 18种XPC单链大范围核酸酶对3种XPC靶标的切割活性表1显示了用于构建不同单链分子的不同接头。对于每个单链分子,接头起始于 N端X2突变体的最后一个残基(P163)之后,在接头之后,N端H33突变体起始于N6残基。表1 接头“:~ 大小 SEQ“ =
编号 接头名 (aa) ID引物序列
______NO;__
—1 Ti22 3~ .AA(GGGGS)犷
~~ YPP35 4 -AAGKSSPSKGIDLTNVTLPDTPTYSKAASDAIPPA-
~3~ AQL3 -AAGLEYPQAPVSSPPGPPCCSGSSGSSAGCS-
4CXT :30 6 'AAGLSYHYSNGGSPTSDGPALGGISDGGAT·
5"BQY27 ~~ -AAGDSSVSNSEHIAPLSLPSSPPSVGS-
6_ VSG25-AAGASQGCKPLALPELLTEDSVNTD-—7 ]1 Μ~~~24 ""“9~ -AAGNPlPGLDELGVGNSDAAAPGT> ~ 8 “ MCJ23 -AAGAPTECSPSALTQPPSASGSL-
—9 GSmid27 ” -M(GGGGS)S-—
10Qsshort17 “ 12 -AA<GGGGSH-_
11GSxshort ~l2~~ 13 -M(GGGGS)2-_
12"PPR17 一 14 -AAGQVTSAAGPATVPSG-_
SBA119 15 -AAGGSPLKPSAPKIPiGGS-
~14SBA233 —16 -AAGGSPLKPSAPKIPlGGSPLKPSAPKIPiGGS-
15LP1 ""““15 ΤΓ~ -AAGGSPLSKPIPGGS-
16 _ LP2 一25 ~l8~ -AAGGSPLSKPIPGGSPLSKPIPGGS-
RM131 ~1Γ~ -AAGQSDKYNQALSERRAYWANNLVSGGGGS-
一 18 RM2 I32 2 -AAGGSDKYNQALSKYNQALSKYNQALSGGGGS-使用如之前所述的酵母筛选测定(国际PCT申请2004/067736 ;Epinat等, Nucleic Acids Res. ,2003,312952-2962 ;Chames φ, Nucleic Acids Res. ,2005,33, el78 ;Arnould 等,J. Mol. Biol.,2006, 355,443-458 ;),监测 18 种 XPC 单链分子对 3 种 XPC 靶标C1、C3和C4的切割活性。如图8所示,所有单链分子构建体都能切割Cl靶标,对C3靶 标也有很强的切割活性,对C4靶标的切割活性也可以检测到。将两种单链分子X2-L1-H33 和X2-RM2-H33克隆进哺乳动物表达载体中,并且在CHO细胞中用染色体外测定检测了它们 对XPC靶标的活性(图9)。该测定证实了酵母切割图谱(图9)。进一步地,在CHO细胞 中,X2-RM2-H33对Cl靶标的活性要高于X2-L1-H33。在CHO细胞中,C4切割几乎检测不 至IJ。没有检测出X2对C3的切割,同样地,H33也不切割C4(数据未显示)。因此,单链分子 对C3靶标的强切割提示,接头未消除分子间种类的形成,这是两种不同分子中H33单元的 二聚化界面相互作用的结果。假H33同二聚体的形成是C3切割的原因b)G19S突夺单独对xpc单链大范_核酸_切割特异丨牛的影口向为了验证这一假说,在两个单链分子的H33C端突变体中引入G19S突变。之前已 证明,G19S突变(I-CreI第19位残基的突变,根据pdb 1G9Y编号)可消除功能性同二聚 体的形成,而增强显示G19S单体的异二聚体的活性(国际PCT申请WO 2008/010093)。在 CHO细胞中用染色体外测定,将获得的两种单链分子(X2-Ll-H33ei9S和X2-RM2-H33ei9S)针对 3种XPC靶标进行表征。图10显示,G19S突变不仅提高对Cl靶标的活性,还显著降低对C3 靶标的活性。作为比较,图10还列出了 X2/H33异二聚体对3种XPC靶标的切割模式。这些结果证实了由于两个H33单元相互作用而形成分子间种类的假说。同样地, 两个X2单元之间的相互作用可能是C4靶标弱切割的原因(图8和图9)。因此,尽管在X2和H33单体之间引入接头有利于分子内相互作用(例如,结果使C4切割降低),但是不能消 除分子间相互作用。尽管如此,改造的XPC单链分子X2-RM2-H33ei9S对Cl XPC靶标的切割比X2/H33异 二聚体更强,而其对两个回文C3和C4靶标的切割活性比X2/H33异二聚体低很多。单链分 子X2-RM2-H33ei9S展示了比X2/H33异二聚体好得多的特异性,而且其活性水平与I-SecI相 当,后者是检验DNA双链断裂导致同源性重组的金标准。 c)G19S突夺与I他,破坏形成功能件同二聚体的I他,突夺的单 车大范 围核酸酶切割特异件的影响图11展示了在酵母筛选测定中,3种单链分子X2-L1-H33、SCX1和SCX2对3种XPC 靶标的切割活性。原始单链分子对Cl和C3靶标有强切割活性,但是引入K7E/E8K突变和 G19S突变以产生SCXl和SCX2分子后,对Cl靶标的切割活性提高,而对C3靶标的切割活性 完全消除。因此,K7E/E8K突变和G19S突变可成功地引入到单链分子中,在不影响对目的 DNA靶标切割活性的同时提高其特异性。实施例2 制备切割中国仓鼠HPRT基因的单链衍生自I-CreI的大范围核酸酶扫描来自中国仓鼠的次黄嘌呤磷酸核糖基转移酶(HPRT)基因以寻找可能的靶位 点。在基因的 ORF 中鉴定了 22bp 的序列,称为 HprCH3 (cgagatgtcatgaaagagatgg =SEQ ID NO 34)(图12)。从HprCH3靶标产生两种回文序列靶标HprCH3. 3和HprCH3. 4(图13)。由于 HprCH3. 3靶标与实施例1中描述的C3靶标相同,所以H33 I-CreI突变体对HprCH3. 3 (C3) 靶标产生强切割。HprCH3. 4靶标是10CAT_P靶标和5CTT_P靶标的组合。如之前所述获得 能切割 10CAT_P 靶标的 I-CreI 突变体(Smith 等,Nucleic Acids Res.,2006,34,el49 ; 国际 PCT 申请 WO 2007/060495 和 WO 2007/049156)并如 Arnould 等,J. Mol. Biol.,2006, 355,443-458、国际 PCT 申请 WO 2006/097784 和 WO 2006/097853 所述获得能切割 5CTT_P 靶标的 I-CreI 突变体。如之前所述(Smith 等,Nucleic Acids Res.,2006,34,el49 ;国 际PCT申请WO 2007/049095和WO 2007/057781)将这些突变体组合在一起,然后筛选其 对HprCH3. 4 DNA靶标的切割。被称为MA17的I-CreI突变体作为HprCH3. 4切割酶被分离 出来。但是,发现由于其松弛的特异性,MA17也能切割HprCH3. 3靶标(图14)。与I-CreI 野生型序列相比,MA17突变体具有以下突变S32T、Y33H、Q44R、R68Y、R70S、S72T、D75N和 I77N。最后一步是将H33和MA17I-CreI突变体在酵母中共表达,如之前所述(国际PCT申 请 WO 2006/097854 和 Arnould 等,J. Mol. Biol.,2006,355,443-458),导致对 HprCH3 DNA 靶标的切割。按照与实施例1相同的方案,构建两种HPRT单链构建体。使用了 Ll和RM2两种 接头(见实施例1的表1),产生了 MA17-L1-H33和MA17-RM2-H33单链分子。第二步,在 C端H33突变体中引入G19S突变,产生了另外两种单链大范围核酸酶MA17-Ll-H33ei9S和 MA17-RM2-H33G19SO然后在酵母和CHO细胞中检测这些不同构建体对HprCH3靶标及其两种 衍生物HprCH3. 3靶标和HprCH3. 4靶标的活性。1)材料和方法见实施例1。2)结果使用如之前所述的酵母筛选测定(国际PCT申请WO 2004/067736 ;Epinat等,Nucleic Acids Res. ,2003,31 2952-2962 ;Chames φ, Nucleic Acids Res. ,2005,33, el78 ;Arnould 等,J. Mol. Biol.,2006,355,443-458 ;),检测 3 种单链分子(MA17-L1-H33、 MA17-L1-H33G19S 和 MA17-RM2-H33)对 3 种 HPRT 靶标 HprCH3、HprCH3. 3 和 HprCH3. 4 的活 性。如图14所示,HprCH3靶标不被MA17-L1-H33切割,但可被另外两种单链分子切割。因 此,在我们改造单链构建体的方法中冊2接头似乎更适用,这在实施例1中也观察到了。这 些结果也证实,G19S突变的存在可增强异二聚体活性。与MA17/H33异二聚体相比,所有3 种单链分子对HprCH3. 3(与实施例1中的C3靶标相同)都有强切割,但不切割HprCH3. 4 靶标。在这种情况下,对HprCH3.3(C3)的切割不一定是由于形成了分子间种类既然MA17 突变体和H33突变体都可以作为同二聚体切割HprCH3. 3靶标,那么从理论上来说,MA17/ H33异二聚体或MA17-RM2-H33单链单体都可以切割HprCH3. 3靶标。MA17-Ll-H33ei9S禾口 MA17-RM2-H33G19S仍切割HprCH3. 3靶标,这证实了这个假说。下一步,将4种单链分子 (MA17-L1-H33, MA17-L1-H33G19S, MA17-RM2-H33 和 MA17-RM2_H33G19S)克隆进哺乳动物表达 载体中 ,在CHO细胞中检测对3种HPRT靶标的切割(图15)。MA17-RM2-H33G19S单链分子表 现出最强的活性。同样地,观察到了对HprCH3. 3 (C3)靶标的强切割,而对HprCH3. 4靶标的 切割很弱或者没有。实施例3 产牛切割人RAGl基因的衍生自I-CreI的单链大范围核酸酶RAGl基因参与V(D)J重组过程,这是免疫球蛋白和T淋巴细胞受体(TCR)成熟 的关键步骤。RAGl基因的突变导致T淋巴细胞成熟缺陷,同时伴随有B淋巴细胞功能缺 陷,这导致重度联合免疫缺陷(SCID)。鉴定了位于人RAGl基因内含子和第二个外显子 接合处的22bp DNA序列(称为RAG1. 10,SEQ ID NO 41 ;图16)作为可能被我们的大范 围核酸酶切割的序列(Smith等,Nucleic Acids Res. ,2006,34, el49 ;国际PCT申请WO 2008/010093)。从 RAG1. 10 序列衍生出 了两种回文序列 RAG1. 10. 2 和 RAG1. 10. 3 (图 17)。 RAG1. 10. 2 靶标是 10GTT_P 与 5CAG_P 靶标的组合,RAG1. 10. 3 靶标是 10TGG_P 与 5GAG_P 靶标的组合。如之前所述(Smith等,Nucleic Acids Res.,2006,34,el49 ;国际PCT申请 WO 2007/049095、WO 2007/057781、WO 2007/049156、WO 2007/060495、WO 2006/097784 和 WO 2006/097853 ;Arnould 等,J. Mol. Biol.,2006, 355,443-458),通过组合能从一侧切割 10GTT_P和5CAG_P靶标和从另一侧切割10TGG_P和5GAG_P靶标的I-CreI突变体,获得对 RAG1. 10. 2和RAG1. 10. 3靶标的强切割酶。然后如之前所述共表达切割酶(国际PCT申请WO 2006/097854 ;Arnould 等,J. Mol. Biol.,2006,355,443-458 ;),导致对 RAG1. 10 靶标的强切 割。M2/M3 RAG1. 10异二聚体在酵母中表现出最强的切割(国际PCT申请WO 2008/010093)。 M2是RAG1. 10. 2切割酶,其与I-CreI野生型序列相比具有以下的突变N30R、Y33N、Q44A、 R68Y、R70S和I77R。M3是RAG1. 10. 3切割酶,其与I-CreI野生型序列相比具有以下的突 变K28N、Y33S、Q38R、S40R、Q44Y、R70S、D75Q 和 I77V。按照与实施例1和2相同的实验方案,用2种接头Ll和RM2(见实施例1的表1) 构建3种单链构建体,产生3种单链分子M2-L1-M3、M2-RM2-M3和M3-RM2-M2。第二步,在 M2-L1-M3和M2-RM2-M3单链分子的N端M2突变体中引入G19S突变,产生了另外两种构建 体。此外,在M3-RM2-M2的M3突变体中引入K7E、K96E突变,M2突变体中引入E8K、E61R突 变,以产生单链分子M3(K7E K96E)-RM2-M2 (E8K E61R),其又被称为SC_0H。然后在酵母中 检测这6种单链构建体对RAG1. 10靶标及其两种衍生物RAG1. 10. 2和RAG1. 10. 3的切割。
1)材料和方法见实施例1,只是I-CreI CLS的突变(T42A、E110W和Q111R),已被复原。SC_0H单链分子的克隆对克隆在pCLS0542酵母表达载体中的携带K7E和K96E突变的M2突变体进行PCR 反应。PCR 反应使用反向弓丨物 CreCterSacI (5‘-tagacgagctcctacggggaggatttcttcttctcgc t_3,;SEQ ID NO 78)禾口正向弓丨物 RM2 (5,-tatcggccggtggatctgataagtataatcaggctctgtct aaatacaaccaagcactgtccaagtacaatcaggccctgtctggtggaggcggttccaacaaagagttcctgctgtat cttgctggattt-3,;SEQ ID NO :66)。纯化PCR片段并用EagI和SacI消化,连接到也经EagI和SacI消化的携带E8K 和E61R突变之M3突变体的酵母表达载体中。对克隆进行测序后,获得SC_0H单链分子。2)结果使用如之前所述的酵母筛选测定(国际PCT申请WO 2004/067736 ;Epinat等, Nucleic Acids Res. ,2003,31 2952-2962 ;Chames φ, Nucleic Acids Res. ,2005,33, el78 ;Arnould 等,J. Mol. Biol.,2006,355,443-458 ;),监测 4 种 RAGl 单链分子(M2-L1-M3、 M2G19S-L1_M3、M2-RM2-M3 禾口 M2G19S-RM2_M3)对 3 种 RAGl 革巴标 RAG1. 10、RAG1. 10. 2 禾口 RAG1. 10. 3的活性(图18)。如在实施例1和实施例2中观察到的,在构建单链构建体的方 法中RM2接头似乎更适用RAG1. 10靶标被M2-RM2-M3切割,但不被M2-L1-M3切割。此外, 发现M2-RM2-M3还可切割RAG1. 10.2。由于M3不能切割RAG1. 10. 2 (图18),这些结果提示, 分子间相互作用仍可导致两个M2单元相接触,这将形成同二聚体或者假同二聚体种类,导 致对回文RAG1. 10. 2靶标的切割。在M2突变体中引入G19S突变提高了这两种分子的活性,因为M2ei9S-Ll_M3切割 RAG1. 10靶标,而M2ei9S-RM2-M3的活性比M2-L1-M3更高。此外,如之前所述(见本申请实 施例1和国际PCT申请WO 2008/010093)可破坏形成功能性同二聚体的G19S突变消除了 RAG1. 10. 2切割。这个结果与来自不同M2-RM2-M3单链分子的M2单元之间仍可发生相互作 用的假说一致。但是,单链结构可能在一定程度上更有利于分子内相互作用,因为与M3相 反,M2-RM2-M3分子并不切割RAG1. 10. 3。总之,在酵母中M2ei9S-RM2-M3RAGl单链分子以饱 和水平切割RAG1. 10靶标,与用M2/M3异二聚体观察到的相当,并且完全不切割两种衍生的 回文靶标 RAG1. 10. 2 和 RAG1. 10. 3。图19所示针对3种RAG1. 10靶标对两种单链分子M3-RM2-M2和SC_0H进行的酵 母筛选证明,K7E/E8K和E61R/K96E的引入允许消除对RAG1. 10. 2靶标的异二聚体活性,而 不降低对RAG1. 10靶标的单链切割活性。因此,可在单链分子中引入这些突变以提高其特 异性,而不影响其对目的DNA靶标的活性。实施例4 制备RAGl单链分子,其中具有构成单链分子的两种突变体的不同定位 以及G19S突变的不同定位为了评价每种突 变体和G19S突变的定位对单链分子活性的影响,使用我们的 酵母筛选测定,检测 6 种构建体(M2-RM2-M3、M2G19S-RM2-M3、M2-RM2-M3G19S、M3-RM2-M2、 M3G19S-RM2-M2、M3-RM2-M2G19S)对 3 种靴标 RAG1. 10、RAG1. 10. 2 和 RAG1. 10. 3 的切割。1)材料和方法见实施例1。
2)结果如图20 所示,所有 6 种单链分子(M2-RM2-M3、M2G19S-RM2-M3, M2-RM2-M3G19S, M3-RM2-M2,M3G19S-RM2-M2,M3-RM2-M2G19S)对 RAG1. 10 靶标具有高活性,活性与原始 M2/M3 异 二聚体对相同靶标的活性相当。单链分子中单体M2或M3的相对位置(N端或C端)对分 子的总体活性没有影响。例如,M2-RM2-M3蛋白与M3-RM2-M2分子有相同的切割模式,以相 同的强度切割RAG1. 10和RAG1. 10. 2靶标,但不切割RAG1. 10. 3靶标(RR靶标)。
对一些构建体来说,RAG1. 10. 2回文靶标是可以切割的,这提示可以出现分子间相 互作用,并且产生有活性的核酸酶。但是,在引入G19S突变后,这些残留的活性就被消除。 图20对分子2和分子3 (M2G19S-RM2-M3和M2-RM2-M3ei9S)活性谱的比较提示,当导致该活性 的突变体(这里是M2突变体)携带G19S突变时,G19S突变的定位不影响对RAG1. 10靶标 的活性,但可破坏残留的同二聚体活性。实施例5 :G19S突变在单链分子中的重要性,如在CHO细胞的染色体外测定中所示就RAG1. 10切割活性而言,前文描述的6种单链分子以及实施例3中描述的SC_0H 单链分子在酵母筛选测定中似乎是等效的。但它们均以饱和水平切割该靶标。因此,在CHO 细胞中,用染色体外测定(如实施例1中所述)评价2种单链分子在携带或不携带G19S突 变的情况下对3种靶标RAG1. 10,RAG1. 10. 2和RAG1. 10. 3的活性。本测定选择的4种单链 分子是M3-RM2-M2、M3-RM2-M2(;19S、M3:RM2-M2+ 和 M3二RM2-M2+(;19S。M3-表示 M3 突变体携带 K7E和K96E突变,M2+表示M2突变体携带E8K和E61R突变。1)材料和方法将IO=-RMZ-MZi和M3=-RM2-M2^分子克隆进哺乳动物表达载体中方法与实施例1 中介绍的完全相同,只是引物CCM2For被替换成引物CCM2ForE8K(5 ’ -AAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGACCATGGCCAATACC AAATATAACAAAAAGTTCC-3,:SE0 ID NO :93)。2)结果图 21 显示 了 4 种单链分子 M3-RM2-M2、M3-RM2_M2G19S、M3:RM2_M2+ 禾口 M3"-RM2-M2+G19S 对 3 种靴标 RAG1. 10,RAG1. 10. 2 和 RAG1. 10. 3 在 CHO 细胞中的染色体外 SSA 活性。对这3种靶标的活性表示为原始M2/M3异二聚体对相同的3种靶标的活性的百分 比。这4种单链分子具有与背景水平相同的同二聚体活性(对RAG1. 10. 2和RAG1. 10. 3靶 标)。图21还显示,G19S突变是单链分子活性所必需的,因为只有携带了 G19S突变的两种 单链蛋白表现出与M2/M3异二聚体等效或甚至更高的RAG1. 10靶标切割活性。实施例6 =RAGl单链分子在CHO-Kl细胞中诱导高水平的基因靶向。为了进一步评价两种单链分子M3-RM2-M2ei9S(由核苷酸序列SEQ ID NO :94编码的 SEQ ID NO 95)和 M3:RM2_M2+G19S (由核苷酸序列 SEQ ID NO :96 编码的的 SEQ ID NO 97) 的切割活性,使用了 CHO细胞中的染色体报告系统(图22)。在该系统中,由CMV启动子驱 动的单拷贝LacZ基因被RAG1. 10序列中断,因此无功能。用编码RAGl单链大范围核酸酶 的质粒和LacZ修复质粒转染该细胞系,可以通过同源重组恢复功能性LacZ基因。之前已 显示,双链断裂可诱导同源重组;因此,LacZ基因被修复的比率可作为基因组RAG1. 10靶位 点切割效率的指标。1)材料和方法
CHO-K1细胞中的染饩体测定
将含有报告系统的CHO-Kl细胞系按每IOcm培养皿2 X IO5个细胞的密度接种到完 全培养基(Kaighn改良F-12培养基(F12-K),补加2mML-谷氨酰胺、青霉素(100UI/ml)、链 霉素(100 μ g/ml)、两性霉素 B (Fongizone) (0. 25 μ g/ml) (INVITROGEN-LIFE SCIENCE)禾口 10% FBS(SIGMA-ALDERICH CHIMIE))。第二天,用 Polyfect 转染试剂(QIAGEN)转染细胞。 简单地说,用2yg LacZ修复基质载体与不同量的大范围核酸酶表达载体共转染。在37°C 孵育72小时后,用0. 5%的戊二醛在4°C固定细胞10分钟,用IOOmM含0. 02% NP40的磷酸 缓冲液洗2次,然后用染色缓冲液(IOmM磷酸缓冲液、ImM MgCl2、33mM六氰化铁(III)、33mM 六氰化铁(ΙΙ)、0. (v/v)X-Gal)染色。37°C孵育过夜后,在光学显微镜下观察培养板, 并对LacZ阳性细胞克隆数进行计数。LacZ修复的比率以LacZ+灶点数除以转染的细胞数 (5X IO5)表示,并用转染效率校正。2)结果图22显示,两种单链分子M3-RM2-M2ei9S和M3:RM2-M2+ei9S可在CHO细胞中诱导高 水平的基因靶向。与原始的M2/M3异二聚体相比,它们甚至可以将基因校正率提高为3. 5倍。实施例7 产生RAGl单链分子,其两个亚单位具有不同的N端和C端末尾用M2-RM2-M3 RAGl单链分子构建新的单链分子构建体,其两个亚单位具有不同的 N端和C端末尾。这些新的构建体使得可以对连接两个I-CreI衍生突变体的接头的最佳可 能位置进行定位。I-CreI的N端包含六氨基酸残基的环,其后是LAGLIDADG α -螺旋(从 残基Κ7开始)。在I-CreI的结构中(PDB代码1G9Y),C端最后的10个残基可能是由于排 列混乱,因此是看不见的。在该结构中,C端在残基D153结束,螺旋α6包括145 150位 残基。因此,制备了一些单链分子构建体,其中Μ2或Μ3突变体的N端起始于残基Μ1、Ν2或 Ν6,而C端结束在不同的位置,分别是S145、L152、S156和K160。用之前所述的酵母筛选测 定(见实施例1)监测这些不同的RAGl单链分子构建体的活性。1)材料和方法a)在酵母表达载体中克隆M2突变体的截短形式RAGl M2-RM2-M3单链分子的克隆首先需要获得克隆在酵母表达载体(pCLS0542) 中的M2突变体(见实施例3的材料和方法)。为了克隆M2突变体的截短形式,需要用 不同的引物对进行PCR反应,这些引物对是CreNter6/CreCter、CreNter/CreCter 160、 CreNter/CreCterl56、CreNter/CreCterl52、CreNter/CreCter 145。下面的表 2 列出了这 些不同引物的序列。将不同的PCR片段用NcoI和EagI消化,然后连接进也经NcoI和EagI 消化的PCLS0542载体。然后对克隆进行测序。M2突变体的截短形式分别是M2 (6-163)、 M2 (1-160)、M2 (1-156)、M2 (1-152)和M2 (1-145),其中的数字表示M2突变体编码序列中包 含的I-CreI残基。b)克隆两个亚单位具有不同末尾的RAGl单链分子对I-CreI CLS形式的M3突变体进行不同的PCR反应。每个PCR反应使用一种正 向引物和一种反向引物。有两种可能的正向引物(RM2和RM2N2)和5种可能的反向引物 (CreCterR60、Crel60R60、Crel56R60、Crel52R60 和 Crel45R60)。正向引物使得可以获得 起始于残基N6或N2的M3编码序列,反向引物使得可以获得分别结束于残基P163、K160、S156、L152和S145的M3编码序列。将不同的PCR片段纯化,并用EagI和SacI消化,将每 个PCR片段连接进也经EagI和SacI消化的上述M2突变体之一的酵母表达载体中。对克 隆进行测序后,获得酵母表达载体中所有可能的单链分子。表2 引物序列
权利要求
单链I CreI大范围核酸酶,其包含由肽接头连接在一起的两个结构域,其中(a)衍生自亲本I CreI单体的每个结构域包含所述亲本I CreI单体的一部分,其至少从I CreI中第一个α螺旋(α1)的起点延伸到C端环的末端,并依次包括α1β1β2α2β3β4α3核心结构域、α4螺旋和α5螺旋以及I CreI的C端环,并且(b)这两个结构域通过肽接头连接在一起,所述肽接头使得所述两个结构域能够折叠成I CreI二聚体,其能够结合并切割嵌合DNA靶标,该嵌合DNA靶标包含各亲本同二聚体I CreI大范围核酸酶靶序列中不同的一半。
2.根据权利要求1的单链I-CreI大范围核酸酶,其中N端结构域起始于I-CreI的1 或6位,C端结构域起始于I-CreI的2或6位。
3.根据权利要求1或2的单链I-CreI大范围核酸酶,其中N端和/或C端结构域终止 于 I-CreI 的 145 位。
4.根据权利要求1或2的单链I-CreI大范围核酸酶,其中N端和/或C端结构域还至 少包括I-CreI的α 6螺旋。
5.根据权利要求4的单链I-CreI大范围核酸酶,其中N端和/或C端结构域终止于1-CreI的 152、156、160 或 163 位。
6.根据权利要求1至5中任一项的单链I-CreI大范围核酸酶,其中所述接头由15 35个氨基酸的序列组成。
7.根据权利要求6的单链I-CreI大范围核酸酶,其中所述接头选自序列SEQID NO2-12和 14-19。
8.根据权利要求1至7中任一项的单链I-CreI大范围核酸酶,其中两个结构域包含位 于I-CreI的26 40和/或44 77位的不同突变,所述单链I-CreI大范围核酸酶能切 割非回文DNA序列,其中所述DNA序列中至少+3 +5、+8 +10、-10 -8和-5 -3位 核苷酸对应于来自目的基因的DNA靶标的+3 +5、+8 +10、-10 -8和-5 -3位核苷酸。
9.根据权利要求1至8中任一项的单链I-CreI大范围核酸酶,其中至少一个结构域包 合位于I-CreI的137 143位的不同突变,其改变该单链I-CreI大范围核酸酶对I-CreI 位点中士1 2、6 7和/或11 12位核苷酸的特异性。
10.根据权利要求8或9的单链I-CreI大范围核酸酶,其中所述突变是用选自A、D、E、 G、H、K、N、P、Q、R、S、Τ、Y、C、V、L和W中的氨基酸替换原始氨基酸。
11.根据权利要求1至10中任一项的单链I-CreI大范围核酸酶,其包含阻止由这两个 结构域形成功能性同二聚体的突变。
12.根据权利要求11的单链I-CreI大范围核酸酶,其中每个结构域各包含选自以下 的至少一个突变对于第一和第二结构域分别为Κ7Ε或K7D和Ε8Κ或E8R ;F54G或F54A和 L97F 或 L97W ;K96D 或 Κ96Ε 和 E61R 或 Ε61Κ ;R51D 或 R51E 和 D137R 或 D137K。
13.根据权利要求12的单链I-CreI大范围核酸酶,其中一个结构域包含用酸性氨基酸 替换第7位和第96位的赖氨酸残基,另一结构域包含用碱性氨基酸替换第8位和第61位 的谷氨酸残基。
14.根据权利要求1至10中任一项的单链I-CreI大范围核酸酶,其中一个结构域包含 G19S突变。
15.根据权利要求14的单链I-CreI大范围核酸酶,其中另一结构域中或者这两个结构 域中包含至少一个如权利要求11至13中任一项所述破坏形成功能性同二聚体的突变。
16.根据权利要求1至15中任一项的单链I-CreI大范围核酸酶,其包含序列SEQID NO 95 或 SEQ ID NO :97。
17.编码权利要求1至16中任一项所述单链I-CreI大范围核酸酶的多核苷酸片段。
18.根据权利要求17的多核苷酸片段,其中编码所述两个结构域的核苷酸序列具有低 于80%的核酸序列同一性。
19.根据权利要求18的多核苷酸片段,其中编码所述两个结构域的序列分别来自序列 SEQ ID NO 22 和 SEQ ID NO :24。
20.包含权利要求17至19中任一项的多核苷酸片段的表达载体,所述多核苷酸片段与 允许产生该单链I-CreI大范围核酸酶的调节序列有效连接。
21.权利要求20的载体,其包含靶向DNA构建体,所述靶向DNA构建体包含与所述单链 I-CreI大范围核酸酶的基因组DNA靶标周围的区域具有同源性的序列。
22.权利要求21的载体,其中所述靶向DNA构建体包含a)与所述基因组DNA靶标周 围的区域具有同源性的序列,和b)待引入序列,其侧翼是a)的序列。
23.包含权利要求17至19中任一项的多核苷酸片段或权利要求20至22中任一项的 载体的宿主细胞。
24.包含权利要求17至19中任一项的多核苷酸片段的非人转基因动物。
25.包含权利要求17至19中任一项的多核苷酸片段的转基因植物。
26.药物组合物,其至少包含权利要求1至16中任一项的单链I-CreI大范围核酸酶、 权利要求16至18中任一项的多核苷酸片段或者权利要求20至22中任一项的载体。
27.权利要求26的组合物,还包含靶向DNA构建体,该靶向DNA构建体包含修复目的基 因组位点的序列,其侧翼为与所述基因组位点具有同源性的序列。
28.权利要求1至16中任一项的至少一种单链I-CreI大范围核酸酶、权利要求17至 19中任一项的至少一种多核苷酸片段、权利要求20至22中任一项的至少一种载体、权利要 求23的至少一种宿主细胞、权利要求25的至少一种转基因植物、权利要求24的至少一种 非人转基因哺乳动物用于在分子生物学、体内或体外遗传工程以及体内或体外基因组工程 中非治疗目的的用途。
29.权利要求1至16中任一项的至少一种单链I-CreI大范围核酸酶、权利要求17至 19中任一项的至少一种多核苷酸片段、权利要求20至22中任一项的至少一种载体用于制 备在有此需要的个体中预防、改善或治疗遗传病的药物的用途。
30.权利要求29的用途,其中所述单链I-CreI大范围核酸酶包含序列SEQID NO 95 或SEQ ID NO :97,所述遗传病是与人RAGl基因中的突变有关的SCID综合征。
31.权利要求1至16中任一项的至少一种单链I-CreI大范围核酸酶、权利要求17至 19中任一项的至少一种多核苷酸片段、权利要求20至22中任一项的至少一种载体用于制 备药物的用途,所述药物用于在有此需要的个体中预防、改善或治疗由呈现DNA中间体的 感染原所导致的疾病。
32.权利要求1至16中任一项的至少一种单链I-CreI大范围核酸酶、权利要求17至 19中任一项的至少一种多核苷酸片段、权利要求20至22中任一项的至少一种载体用于在生物衍生产品或者旨在用于生物的产品中对呈现DNA中间体的感染原进行增殖抑制、灭活 或缺失的用途或用于对物品进行消毒的用途。
33.权利要求31或32中的用途,其中所述感染原是病毒。
34.权利要求28至33中任一项的用途,其中所述大范围核酸酶、多核苷酸、载体、细胞、 转基因植物或非人转基因哺乳动物与如权利要求21、22和27中任一项所述靶向DNA构建 体相组合。
35.权利要求1至16中任一项的至少一种单链I-CreI大范围核酸酶、权利要求17至 19中任一项的至少一种多核苷酸片段、权利要求20至22中任一项的至少一种载体作为用 于改造其他大范围核酸酶的骨架的用途。
全文摘要
一种新的衍生自I-CreI的单链大范围核酸酶,其包含两个结构域,每个结构域各包含亲本I-CreI单体的一部分,其至少从I-CreI中第一个α螺旋的起点延伸到C端环的末端,所述两个结构域由肽接头连接,这个肽接头可使这两个结构域通过折叠形成I-CreI二聚体,其能够结合并切割嵌合DNA靶标,该嵌合DNA靶标包含亲本同二聚体I-CreI大范围核酸酶靶序列中各自不同的一半。衍生自I-CreI的单链大范围核酸酶用于基因工程、基因治疗以及抗病毒治疗的用途。
文档编号C12N9/22GK101970649SQ200980109080
公开日2011年2月9日 申请日期2009年2月2日 优先权日2008年1月31日
发明者西尔韦斯特·格里佐 申请人:赛莱克蒂斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1