切割来自rag基因的dna靶序列的大范围核酸酶变体及其用途的制作方法

文档序号:438933阅读:2866来源:国知局

专利名称::切割来自rag基因的dna靶序列的大范围核酸酶变体及其用途的制作方法切割来自RAG基因的DNA耙序列的大范围核酸酶变体及其用途本发明涉及切割来自RAG基因的DNA靶序列的大范围核酸酶(meganuclease)变体、编码所述变体的载体、经所述载体^"饰的细胞、动物或植物以及所述大范围核酸酶变体及衍生产物用于体内与离体基因组疗法(基因细胞疗法)和基因组工程(genomeengineering)的用途。重症联合免疫缺陷(SCID)由T淋巴细胞成熟中的缺陷引起,它经常与B淋巴细胞的功能缺陷相关(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。总体发病率估计为75000个新生儿中有一例。患有未治疗的SCID的患者常发生多种机会性微生物感染,并通常活不过一年。可通过来自家族供体的同种异体(allogenic)造血干细胞转移来治疗SCID。与供体的组织相容性可广泛变化。在一种SCID形式——腺苷脱氨酶(ADA)缺乏的情况下,可通过注射重组的腺苷脱氢酶来治疗患者。因为SCID患者中ADA基因已显示发生了突变(Giblett等,Lancet,1972,2,1067-1069),所以鉴定了与SCID有关的若干其他基因(Cavazzana-Calvo等,Annu.Rev.Med"2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。存在四种主要的SCID病因(i)ADA基因中的突变导致使淋巴细胞前体致死的噪呤代谢缺陷,这继而导致了B、T和NK细胞的缺乏。(ii)最常见的SCID形式——SCID-X1由编码YC的基因中的突变引起(Noguchi,等,Cell,1993,73,147-157),是T、B和NK细胞的细胞因子受体的组分。该受体通过JAK3激酶激活若干靼标(Macchi等,Nature,1995,377,65-68),其失活导致与YC失活相同的症状。(iii)有缺陷的V(D)J重组U疫球蛋白和T淋巴细胞受体(TCR)成熟中的关键步骤。参与该过程的三种基因——重组激活基因(RecombinationActivationGene)1和2(RAG1和RAG2)和Artemis中的突变导致T和B淋巴细胞的缺乏。RAG1和RAG2是负责起始V(D)J重组的两种蛋白质(Schatz等,Cell,1989,59,1035-1048;Oettinger等,Science,19卯,248,1517-1523)。这些蛋白质与免疫球蛋白和TCR基因座中V、D和J编码区段附近的重组序列(RS)结合,并催化复杂的切割反应。切割的结果是在RS与该编码区段之间发生DNA双链断裂(DSB),断裂的一侧(RS侧)是平末端,另一侧;UL夹(Dudley等,Adv.Immunol"2005,86,43-112)。该发夹被Artemis蛋白质切割,然后由非同源末端接合(Non-HomologousEndJoining,NHEJ)因子如Lig4和XRCC4加工。除了B和T细胞的缺少以外,Artemis基因中的突变还与细胞放射灵敏度(radiosensitivity)的提高相关(Moshous等,Cell,2001,105,177-186)。称作RS-SCID的该具体表型可能是由于Artemis在免疫球蛋白成熟和DNA维护二者中的作用。(iv)也报道了其他基因如涉及T细胞特异性信号转导的CD45中的突变,尽管它们代表少数情况(Cavazzana-Calvo等,Annu.Rev.Med.,2005,56,585-602;Fischer等,Immunol.Rev.,2005,203,98-109)。paradigm自从其遗传J^i被鉴定开始,不同的SCID形式由于两个主要的原因成为了基因治疗方法的范例(Fischer等,Immunol.Rev.,2005,203,98-109)。首先,像在所有血液病中一样,离体治疗是可以预见的。可从骨髓中回收造血干细胞(HSC)并在几次细胞分裂中保持其多能特性。因此,它们可在体外进行处理,然后重新注射进患者并在其中再生骨髓。其次,因为在SCID患者中T和B细胞及前体的成熟受损,因此矫正的细胞(correctedcell)具有选择性优点。因此,少量的矫正细胞能够恢复功能性免疫系统。这一假说已被以下内容多次g:(i)SCID患者中突变的回复与免疫功能的部分恢复相关(Hirschhorn等,Nat.Genet.,1996,13,290-295;Stephan等,N.Engl.J.Med.,1996,335,1563-1567;Bousso等,Proc.Natl.,Acad.Sci.USA,2000,97,274-278;Wada等,Proc.Natl.Acad.Sci.USA,2001,98,8697-8702;Nishikomori等,Blood,2004,103,4565-4572),(ii)体外矫正造血细胞中SCID-X1缺乏(Candotti等,Blood,1996,87,3097-3102;Cavazzana-Calvo等,Blood,1996,Blood,88,3卯1画3909;Taylor等,Blood,1996,87,3103-3107;Hacdn-Bey等,Blood,1998,92,40卯-4097),(iii)在动物模型中体内矫正SCID-X1(Soudais等,Blood,2000,95,3071-3077;Tsai等,Blood,2002,100,72-79)、JAK國3(Bunting等,Nat.Med.,1998,4,58-64;Bunting等,Hum.GeneTher.,2000,11,2353-2364)和RAG2(Yates等,Blood,2002,100,3942-3949)的缺乏,和(iv)基因治疗临床试验的结果(Cavazzana-Calvo等,Science,2000,288,669-672;Aiuti等,Nat.Med.,2002,8,423-425;Gaspar等,L肌cet,2004,364,2181-2187)。从九十年代起,若干基因疗法临床试验已获得了大量非常有用的信息。这些研究均基于使用以病毒载体引入基因组的功能基因来对突变基因进行回补(complementation)。针对SCID-X1(yC缺乏)的临床试验在用基因疗法治疗的十名患者中的九人中导致了功能免疫系统的恢复(Cavazzana-Calvo等,Science,2000,288,669-672)。其他成功的临床试验以四名SCID國X1患者(Gaspar等,Lancet,2004,364,2181-2187)和四名ADA患者(Aiuti等,Science,2002,296,2410-2413)进行,证实了基因治疗方法的益处。然而,第一批试验也显示了与该方法相关的风险。后来,三名患者发生了与急性白血病高度近似的单克隆淋巴组织增生。这些淋巴组织增生与插入诱变对细胞癌基因的激活相关。在所有这些情况下,增殖细胞的特征都是在相同基因座中插入了逆转录病毒载体,导致LM02基因it^达(Hacein-Bey等,Science,2003,302,415-419;Fischer等,N.Engl.J.Med.,2004,350,2526-2527)。因此,这些结果已证明了"基因疗法"在遗传疾病治疗中的非凡能力以及整合型逆转录病毒载体的限制(Kohn等,Nat.Rev.Cancer,2003,3,477-488)。尽管开发了新的电穿孔方法(来自AMAXAGmbH的Nucleofector技术;PCT/EP01/07348、PCT/DE02/01489和PCT/DE02/01483),但是病毒载体目前在HSC中给出了最有前途的结果。来自MoMLV(莫洛尼小鼠白血病病毒(MoloneyMurineLeukemiaVirus))的逆转录病毒已被用于有效地转导HSC,包括用于临床试验(见上文)。然而,经典的逆转录病毒载体仅转导细胞周期中的细胞(cyclingcdl),并且用莫洛尼载体转导HSC需要用生长因子对其进行刺激并诱导有丝分裂,从而强烈损伤其离体多能特性。相反,来自HIV-1的慢病毒载体能够有效地转导非有丝分裂的细胞,并完全适用于HSC转导(Logan等,Curr.Opin.Biotechnol.,2002,13,429436)。使用这些载体,侧翼DNA(flapDNA)的插入强烈刺激入核,因而刺激HSC的转导率(Sirven等,Blood,2000,96,4103-4110;Zennou等,Cell,2000,101,173-185)。然而,慢病毒载体也是整合型的,具有与莫洛尼载体相同的潜在风险在插入基因组后,病毒LTR启动子和增强子能够刺激相邻基因的表达(见上文)。缺失LTR3,中U3的增强子和启动子可能是一种选择。在逆转录后,该缺失将被复制进LTR5,中,称作"AU3"或"自失活"的这些载体能够防止由相邻基因激活所导致的插入诱变的风险。然而,它们不消除由插入引起的基因失活的风险或转录通读的风险。靶向同源重组是可能避免目前方法所引起的问题的另一种选择。目前的基因治疗策略基于回补方法,其中随机插入但是有功能的额外基因拷贝提供了突变的内源拷贝的功能。相反,同源重组会允许精确地原位矫正突变(图1A)。同源基因靶向策略已用于在染色体中敲除内源基因(Capecchi,M.R.,Science,1989,244,1288-1292;Smithies,O.,Nat.Med.,2001,7,1083-1086)或ltMknock-in)夕卜源序列。其同样也可用于基因矫正,并原则上用于矫正与单基因疾病相关的突变。然而,由于该过程的低效率(转染细胞的10_6到10—9),该应用事实上是困难的。在最近十年中,已开发了若干种方法来增强这一产率。例如,嵌合修复术(chimeraplasty)(DeSemir等J.GeneMed.,2003,5,625-639)和小片段同源替换(SmallFragmentHomologousReplacement)(Goncz等,GeneTher,2001,8,961-965;Bruscia等,GeneTher"2002,9,683-685;Sangiuolo等,BMCMed.Genet"2002,3,8;DeSemir,D.和J.M.Aran,Oligonucleotides,2003,13,261-269)已被用于尝试矫正CFTR突变,并取得了不同程度的成功。增强重组效率的另一策略是使用大范围核酸酶向靼基因座中递送DNA双链断裂(DSB)。大范围核酸酶定义为识别大序列的序列特异性内切核酸酶(Chevalier,B.S.和B丄.Stoddard,NucleicAcidsRes"2001,29,3757-3774)。它们能够在活细胞中切割独特的位点,从而将切割位点附近的基因靶向增强1000倍或更多(Puchta等,NucleicAcidsRes.,1993,21,5034-5040;Rouet等,Mol.Cell.Biol"1994,14,8096-8106;Choulika等,Mol.Cell.Biol"1995,15,1968-1973;Puchta等,Proc.Natl.Acad.Sci.USA,1996,93,5055-5060;Sargent等,Mol.Cell.Biol"1997,17,267-77;Donoho等,Mol.Cell.Biol,1998,18,4070-4078;Elliott等,Mol.Cell.Biol.,1998,18,93-101;Cohen-Tannoudji等,Mol.Cell.Biol"1998,18,1444-1448)。这样的大范围核酸酶可用于矫正造成单基因遗传疾病(如SCID)的突变。矫正遗传缺陷的最精准方法是使用带有未突变基因拷贝的修复基质(repairmatrix),得到突变的回复(图1A)。然而,基因矫正的效率随着突变与DSB之间距离的增长而降低,200bp的距离降低五倍。因此,可使用给定的大范围核酸SW正仅在其DNA靶标附近的突变。图IB中展示了称为"外显子敲入"的替代方案。在该情况下,可以使用在基因5,部分进行切割的大范围核酸酶将功能性外显子序列ILV有害突变的上游。尽管该方法将转基因置于其常规位置,但是它也引起外显子重复(exonsd叩lication),其长期影响尚待评价。另外,如将天然顺式作用元件置于切割下游的内含子中,则其直接环境将被改变,其固有功能也有待于探索。然而,该方法具有一个巨大的优点一种大范围核酸酶可用于许多不同的患者。然而,该技术的使用受到天然大范围核酸酶种类(repertoire)的限制。例如,在人SCH)基因中不存在已知天然大范围核酸酶的切割位点。因此,进行了大量研究来产生具有定制的特异性的大范围核酸酶,并且若千实验室已尝试改变天然大范围核酸酶的特异性或产生人工的内切核酸酶。最近,使用了锌指蛋白与Fdl(—种IIS类限制性内切核酸酶)催化结构域的融合物来产生功能性序列特异性内切核酸酶(Smith等,NucleicAcidsRes.,1999,27,674-681;Bibikova等,Mol.Cell.Biol"2001,21,289-297;Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764-;Porteus,M.H.和D.Baltimore,Science,2003,300,763-;Alwin等,Mol.Ther"2005,12,610-617;Urnov等,Nature,2005,435,646-651;Porteus,M.H.,Mol.Ther"2006,13,438-446)。这些核酸酶最近用于改造来自淋巴i普系的人细胞中的ILR2G基因(Urnov等,Nature,2005,435,646-651)。Cys2-His2型锌指蛋白(ZFP)代表了易于操作的简单且模块化的系统,因为ZFP特异性基本上由每个锌指上的四个残基决定(Pabo等,Annu.Rev.Biochem.,2001,70,313-340;Jamieson等,Nat.Rev.DrugDiscov"2003,2,361-368)。Pabo(Rebar,E.J.和C.O.Pabo,Science,1994,263,671-673;KimJ.S.和C.O.Pabo,Proc.Natl.Acad.SciUSA,1998,95,2812-2817)、Klug(Choo,Y.和A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;Isalan等,Nat.Biotechnol.,2001,19,656國660)和Barbas(Choo,Y.和A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;Isalan等,Nat.Biotechnol.,2001,19,656-660)实验室的研究产生了能够结合大部分G/ANNG/ANNG/ANN序列的多种新人工ZFP。然而,ZFP可能具有其局限性,特别^^对于需要极高水平特异性的应用(如治疗应用)而言。最近显示融合物中的i^fcl核酸酶活性通过DNA环作用于一个识别位点或被不同距离隔开的两个位点,包括存在一些DNA结合缺陷的突变体时(Catto等,NucleicAcidsRes.,2006,34,1711-1720)。因此,特异性可以是非常退化的,如在哺乳动物(Porteus,M.H.和D.Baltimore,Science,2003,300,763-)和果蝇(Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764)中的毒性所显示的。在自然界中,大范围核酸酶基本上由归巢内切核酸酶(HomingEndonuclease,HE)代表。归巢内切核酸酶是一种广泛的天然大范围核酸酶家族,包括数百个蛋白质家族(ChevalierB.S.和B丄.Stoddard,NucleicAcidsRes.,2001,29,3757-3774)。这些蛋白质由可动遗传因子编码,所述可动遗传因子通过称作"归巢"的过程繁殖内切核酸酶切割其中不存在该可动遗传因子的同源等位基因,从而刺激同源重组事件,所述事件将该可动DNA复制进受者基因座。考虑到它们在效率和特异性方面的特有切割特性,它们可代表产生新的高度特异性内切核酸酶的理想骨架(scaffold)。HE属于四个主要的家族。LAGLIDADG家族(根据涉及催化中心的保守肽基序命名)是分布最广和最充分表征的一组。目前能够获得七种结构。尽管来自该家族的大部分蛋白质是单体的并展示两种LAGLIDADG基序,但是少数仅具有一个基序,发生二聚化以切割回文或假回文的耙序列。尽管LAGLIDADG肽是该家族成员中唯一的保守区,但是这些蛋白质共有非常类似的结构(图2A)。催化核心侧翼是两个DNA结合结构域,对同二聚体(如I-Crel(Chevalier等,Nat.Struct.Biol"2001,8,312-316)和I-Msol(Chevalier等,J.Mol.Biol"2003,329,253-269))而言具有完全的二重对称性,,对单体(如I-SceI(Moure等,J.Mol.Biol"2003,334,685-695)、I画DmoI(Silva等,J.Mol.Biol"1999,286,1123-1136)或I画AniI(Bolduc等,GenesDev.,2003,17,2875-2888))而言具有假对称性。两个单体或两个结构域(对于单体蛋白质而言)组成组织在二价阳离子周围的催化核心。就在催化核心上方的两个LAGLIDADG肽也在二聚化界面中起关键作用。DNA结合农赖于位于DNA大沟上的两个鞍形ppa即折叠(图2A)。对与其天然靶标结合的I-CreI结构进行的分析显示,在每个单体中,八个残基(Y33、Q38、N30、K28、Q26、Q44、R68和R70)与±3、4、5、6、7、9和10位的七个减基建立直接相互作用(图3)。另外,一些残基与若干g建立由7JC介导的接触;例如S40和N30与+8和-8位的#对建立接触(上文引用的Chevalier等,2003)。其他结构域可见于内蛋白(如PI-PfuI(Ichiyanagi等,J.Mol.Biol"2000,300,889-卯1)和PI-SceI(Moure等,Nat.Struct.Biol.,2002,9,764-770))中,其蛋白质剪接结构域也参与DNA结合。功能性嵌合大范围核酸酶的产生已证明了LAGLIDADG蛋白的可塑性。可通过交换(swapping)不同单体的LAGLIDADG归巢内切核酸酶核心结构域来获得新的大范围核酸酶(Epinat等,NucleicAcidsRes.,2003,31,2952-62;Chevalier等,Mol.Cell"2002,10,895画卯5;Steuer等,Chembiochem.,2004,5,206-13;InternationalPCTApplicationsWO03/078619和WO2004/031346)。这些单链嵌合大范围核酸"(其中来自不同大范围核酸酶的两个LAGLIDADG归巢内切核酸酶核心结构域通过间隔区连接)能够切割对应于两个半母体DNA靼序列的融合物的杂合乾标。此夕卜,不同的小组还使用推理性方法来局部改变I-CreI、I-SceI、I-MsoI和PI-SceIHE的特异性(Sussman等,J.Mol.Biol"2004,342,31-41;Seligman等,Genetics,1997,147,1653-1664;Arnould等,J.Mol.Biol"2006,355,443-458;Doyon等,J.Am.Chem.Soc.,2006,128,2477-2484;Ashworth等,Nature,2006,441,656-659;Gimble等,J.Mol.Biol"2003,334,993-1008)。嵌合及单^A工HE的构建提示,可^f吏用组合方法获得切割新的(非回文)乾序列的新大范围核酸酶可在单个蛋白质中融合不同的单体或核心结构域,以实现新的特异性。这些结果意味着,I-Crel二聚体的两个DNA结合结构域独立作用;每个DNA结构域与DNA乾位点不同的一半结合。将半定量方法和高通量篩选(HTS)组合在一起,Arnould等能衍生具有改变的特异性的数百种I-Crel衍生物(Arnould等,J.Mol.Biol.,2006,355,443-458)。诱变I-CreI的残基Q44、R68和R70,并通过筛选鉴定在士3到5位中具有改变的特异性的变体集合。然后将两个不同的变体组合并装配在能切割嵌合靶标的一个功能性异二聚体内切核酸酶中,所述嵌合乾标得自每个变体DNA耙序列中不同一半的融合物。有趣的是,新蛋白保持了正确的折叠和稳定性、高活性和窄特异性。因此,可^f吏用两步骤策略来定制天然LAGLIDADG大范围核酸酶的特异性。第一步是局部诱变天然LAGLIDADG大范围核酸酶如I-Crel,并通过筛选来鉴定具有改变的特异质的模块性,使用组合方法产生切割所选位点的新的大范围核酸酶(图2B)。新大范围核酸酶集合的产生以及通过装配两个不同的单体/核心结构域来组合它们的能力可观地丰富了能够被耙向的DNA序列数,但是还不能满足所有可能的序列。为了达到更大量的序列,能够鉴定可以被组合的更小独立亚结构域会是非常有价值的(图2C)。然而,在单个单体或结构域内应用组合丰富比在单体之间难得多,因为结合界面的结构非常紧密,并且负责基本上所有M特异性相互作用的两个不同PP发夹不构成独立的亚结构域,而是单个折叠的一部分。例如,在1-CrelDNA结合区的内部部分中,gtc三联:体与来自第一发夹的一个残基(Q44)和来自第二发夹的两个残基结合(R68和R70;见前文引用的Chevalier等,2003的图IB)。尽管结构水平上缺乏明显的模块性,但是本发明人已鉴定了可分离能够结合归巢内切核酸酶半位点中不同部分的功能性亚结构域。通过将来自不同单体或核心结构域的两个亚结构域装配在相同的单体内,本发明人已改造了能够切割回文嵌合扭标的功能性归巢内切核酸酶(同二聚体)变体(图2C)。另外,通过装配四个不同的亚结构域形成能够切割非回文嵌合靼标的新异二聚体分子允许进行更大的组合方法(图2D)。不同的亚结构域可被独立修饰,并在一个大范围核酸酶变体(异二聚体或单链分子)内组合,所述变体能够切割来自目的基因的乾标。本发明人已使用该策略改造出了I-Crel变体,其能够切割来自RAG基因的DNA耙序列,因此可用于修复与SCID综合征相关的RAG1和RAG2突变(图4和5)。其他可能的应用包括在RAG基因座处进行基因组組。改造的变体可用于通过双链断裂诱导的重组进行基因矫正(图1A和1B)。本发明涉及I-CreI变体,其中两个I-CreI单体的至少一个中含有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中M一个,所述功能性亚结构域分别位于I-Crel的位置26到40和44到77,所述变体能够切割来自RAG基因的DNA耙序列。可以通过任何公知的体外或体内切割测定法测量本发明变体的切割活性,例如国际PCT申请WO2004/067736或Arnould等,J.Mol.Biol.,2006,355,443-458中所述的测定法。例如,可通过直接重复重组测定法,使用报告载体在酵母或哺乳动物细胞中测量本发明变体的切割活性。报告载体在间插序列内包含报告基因的两个截短的非功能性拷贝(直接重复)和基因组DNA乾序列,所述间插序列克隆到酵母或哺乳动物表达载体中。变体的表达产生功能性内切核酸酶,其能够切割基因组DNA耙序列。该切割诱导直接重复之间的同源重组,产生功能性报告基因,其表达可以通过合适的测定法监测。定义-多肽序列中的氨基酸残基在本文中根据单字母代码命名,其中例如Q表示Gin或谷氨酰胺残基,R表示Arg或精氨酸残基,D表示Asp或天冬氨酸残基。-核苷酸如下命名使用单字母代码命名核苷的碱基a为腺噪呤,t为胸腺嘧啶,c为胞嘧啶,g为鸟嘌呤。对于简并核苷酸而言,r表示g或a(噪呤核普酸),k表示g或t,s表示g或c,w表示a或t,m表示a或c,y表示t或c(嘧咬核脊酸),d表示g、a或t,v表示g、a或c,b表示g、t或c,h表示a、t或c,n表示g、a、t或c。-"大范围核酸酶"是指具有14到40pb双链DNA耙序列的内切核酸酶。所述大范围核酸酶是其中各结构域位于单体上的二聚体酶,或是在单个多肽上包含两个结构域的单体酶。國"大范围核酸酶结构域"是指这样的区域,其与大范围核酸酶DNA靶标的一半相互作用,并能够与相同大范围核酸酶的另一结构域结合,形成能够切割DNA靶标的功能性大范围核酸酶,所述另一结构域与所述DNA乾标的另一半相互作用。-"大范围核酸酶变体"或"变体"是指通过将野生型大范围核酸酶(天然大范围核酸酶)M酸序列中的至少一个残基替换为不同的M酸而获得的大范围核酸酶。-"功能性变体"是指能够切割DNA乾序列的变体,优选地所述乾标是不被母体大范围核酸酶切割的新靶标。例如,这些变体在接触DNA靶序列的位置或与所述DNA靶标直接或间接相互作用的位置上具有氨基酸改变。國"I-CreI"是指具有序列SWISSPROTP05725(SEQIDNO:234)或pdb登录号lg9y的野生型I-Crel。國"具有新特异性的I-Crel变体"是指具有与母体大范围核酸酶不同的耙标切割模式的变体。等价且无差异地使用的术语"新特异性"、"经修饰的特异性"、"新切割特异性"、"新底物特异性"是指变体针对DNA乾序列中核苷酸的特异性。-"I-CreI位点"是指被I-Crel切割的22到24bp双链DNA序列。I-Crel位点包括野生型(天然)非回文I-CreI归巢位点和衍生的回文序列,如序列5,-t_12c_11a_10a.9a.8a.7c.6g.5t.4C.3g_2t-ia+1c+2g+3a+4C+5g+6t+7t+8t+9t+10g+11a+12(SEQIDNO:1),也称为C1221(图3和9)。-"结构域"或"核心结构域"是指"LAGLIDADG归巢内切核酸酶核心结构域",它是LAGLIDADG家族归巢内切核酸酶的特征性0^^2012p3p4a3折叠,对应于约一百个氨基酸残基的序列。所述结构域包含在折叠成反向平行p-片层的四条p链(Pi、p2、(53、p4),所述p-片层与DNA靼标的一半相互作用。该结构域能^与另一LAGLIDADG归巢内切核酸酶结构域结合,形成能够切割DNA靶标的功能性内切核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。例如,在二聚体归巢内切核酸酶I-CreI(163个氨基酸)的情况下,LAGLIDADG归巢内切核酸酶核心结构域对应于残基6到94。-"亚结构域"是指LAGLIDADG归巢内切核酸酶核心结构域中的区域,其与归巢内切核酸酶DNA靶标半位点的不同部分相互作用。两个不同的亚结构域独立作用,并且一个亚结构域中的突变不改变另一亚结构域的结合和切割特性。因此,两个亚结构域结合归巢内切核酸酶DNA靶标半位点的不同部分。-"13-发夹"是指LAGLIDADG归巢内切核酸酶核心结构域反向平行P-片层的两条连续p-链(^|32或p3p4),其通过环或转角相连。-"单链大范围核酸酶"、"单链嵌合大范围核酸酶"、"单链大范围核酸酶衍生物"、"单链嵌合大范围核酸酶衍生物"或"单链衍生物,,是指包含通过肽间隔区连接的两个LAGLIDADG归巢内切核酸酶结构域或核心结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靼序列,所述靼序列包含各母体大范围核酸酶靼序列中不同的一半。-"DNA乾标"、"DNA耙序列"、"靼序列"、"靼位点"、"靶标"、"位点";"目的位点";"识别位点"、"识别序列"、"归巢识别位点"、"归巢位点"、"切割位点"是指被LAGLIDADG归巢内切核酸酶识别并切割的20到24bp双链回文、局部回文(假回文)或非回文的多核苦酸序列。这些术语是指内切核酸酶要在其中诱导双链断裂(切割)的独特DNA定位,优选地为基因组定位。DNA靶标通过双链多核普酸一条链的5,到3'序列来定义,如上文针对C1221所指出的。DNA靶标的切割分别发生在有义和反义链位置+2和-2的核苷酸处(图3)。除非另有说明,否则I-CreI大范围核酸酶变体对DNA靶标进行切割的位置对应于DNA靶标有义链上的切割位点。-"DNA乾标半位点"、"半切割位点"或"半位点"是指DNA靶标中与各个LAGLIDADG归巢内切核酸酶核心结构域结合的部分。-"嵌合DNA靶标"或"杂合DNA靶标"是指两条母体大范围核酸酶乾序列不同的一半的融合物。另外,所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷酸组合(组合DNA靼标)。"来自RAG基因的DNA靼序列"、"基因组DNA耙序列"、"基因组DNA切割位点"、"基因组DNA靶标"或"基因组耙标"是指RAG基因中被大范围核酸酶变体或单链嵌合大范围核酸酶衍生物识别并切割的20到24bp序列。-"RAG基因,,是指哺乳动物的RAG1或RAG2基因。例如,人RAG基因可以NCBI数据库中登录号NC_000011.8获得RAG1(GenelD:5896)和RAG2(GenelD:5897)序列分别位于36546139位到36557877位以及36570071位到36576362位(负链)。两个基因均具有短的非翻译外显子1以及包含编码RAG蛋白质的ORF的外显子2,所述ORF5,和3,端侧翼分别是短和长的非翻译区(图4和5)。-"载体"是指能够转运与之连接的另一核酸的核酸分子。-"同源"是指一条序列与另一序列具有足够导致序列间同源重组的同一性,更具体地具有至少95%的同一性,优选97%的同一性,更优选99%的同一性。國"同一性"是指两条核酸分子或多肽之间的序列同一性。可通过比较各序列中可为比较目的而排列的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据时,则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核酸序列间共有的位置上相同或匹配的核苷酸数量的函数。可使用多种比对算法和/或程序计算两条序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分4斤包(UniversityofWisconsin,Madison,Wis.)的一部分获得,并可以例如默i人i殳定使用。國"个体"包括哺乳动物,以及其他脊推动物(例如鸟类、鱼和爬行动物)。本文使用的术语"哺乳动物"是指任何这样的脊推动物,包括单孔类、有袋类和胎盘动物,它们对其幼仔哺乳,并且分娩活的幼仔(真哺乳亚纲(euttiarian)或胎盘哺乳动物)或者产卵(后兽亚纲(metatharian)或非胎盘(nonplacental)哺乳动物)。哺乳动物物种的实例包括人和其他灵长类(例如猴、猩猩)、啮齿动物(例如大鼠、小鼠、豚鼠)和其他,例如牛、猪和马。-突变是指在多核苷酸(cDNA、基因)或多肽序列中替换、缺失、添加一个或多个核苷^/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。本发明的变体可以是能够切割回文或假回文DNA靼序列的同二聚体。或者,所述变体是异二聚体,其得自I-Crel中26到40位和/或44到77位中具有不同突变的第一和第二单体的结合,所述异二聚体能够切割来自RAG基因的非回文DNA耙序列。优选地,该异二聚体的两个单体均在I-Crel的26到40位以及44到77位中具有不同的替换。在所述变体的一个优选的实施方案中,位于I-Crel中44到77位的亚结构域中的所述替换位于44、68、70、75和/或77位。44、68、70、75和/或77位的突变可有利地与66位的突变相组合。在所述变体的另一个优选的实施方案中,位于I-Crel中26到40位的亚结构域中的所述替换位于26、28、30、32、33、38和/或40位。在所述变体的另一个优选的实施方案中,所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、V、L和W的^^酸替换原始的M酸。例如-28位的赖氨酸(K)可以被突变为N、Q、A或R,-30位的天冬酰胺(N)可以被突变为H、G、R、K和D,画32位的(S)可以被突变为G、T、K、E、H、D和Q,-33位的酪氨酸(Y)可以被突变为S、R、C、A、N、R、G、T和H,画38位的谷氨酰胺(Q)可以被突变为R、A、T、Y、E、G、W、D和H,-40位的丝氨酸(8)可以被突变为R、K、Q、A、D、E和H,國44位的^^酰胺(Q)可以净皮突变为A、Y、N、K、D、R、T、E和H,画68位的精氨酸(R)可以被突变为H、A、Y、S、N、T、E和G,-70位的精氨酸(议)可以被突变为T、S、N、Q、H和A,-75位的天冬氨酸(。)可以被突变为R、Y、E、N、Q、K和S,且-77位的异亮氨酸(1)可以被突变为V、LN、R、Y、Q、E、K和D。在所述变体的另一个优选的实施方案中,其在另外的位置上包含一个或多个替换。被突变的另外的残基可直接或通过水分子而与DNA主链或核苷酸碱勤目互作用或接触DNA靼序列;这些与I-Crel相互作用g是本领域公知的。例如,可在与磷酸主链或核苷酸碱基间接相互作用的位置上引入另外的突变。或者,所述变体可包含一个或多个另外的突变,所述突变改善该变体对RAG基因的DNA靼序列的结合和/或切割特性。被突变的另外的残基可位于整个I-Crel序列上或I-Crel的C端一半中(80到163位)。这些突变优选地是I-CreI中下述位置的替换4、6、19、34、43、49、50、54、79、80、82、85、86、87、94、96、100、103、105、107、108、114、115、116、117、125、129、131、132、139、147、150、151、153、154、155、157、159和160。更优选地,所述替换选自G19S、G19A、F54L、S79G、F87L、V105A和I132V。在这些突变中,G19S突变是更为优选的,因为其不仅提高I-Crel衍生的异二聚体大范围核酸酶的切割活性,而且还通过减少带有G19S突变的单体形成功能性同二聚体而提高所述异二聚体大范围核酸酶的切割特异性。被所述变体切割的DNA把序列可在RAG基因的外显子或内含子中。优选地,其位于突变附近(优选在突变的500bp内)或突变上游(优选所述RAG基因中所有突变的上游)。在所述变体的另一个优选的实施方案中,所述DNA耙序列来自人RAG基因。来自各个人RAG基因的DNA靶标列于表III和IV以及图21和22中。例如,序列SEQIDNO:148到177是来自RAG1基因的DNA靶标;SEQIDNO:152到177位于RAG1ORF(5293到8424位)中,并且这些序列覆盖所有的RAG1ORF(表III和图4和21)。乾序列SEQIDNO:151(RAG1.10)位于RAGORF附近且在突变上游(图4)。把序列SEQIDNO:148、149(RAG1.6)和150(RAG1.7)位于突变上游(图4)。切割各DNA靶标的异二聚体变体列于表I和II以及图21和22中。表I:在RAG1基因中具有DNA乾位点的异二聚体I-Crel变体序列<table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table>先靶标的第一个威基在人RAG1基因中的位置。各变体的序列通过所指位置处的氨基酸残基来定义。例如,表I的第一个异二聚体变体由第一单体和第二单体组成,所述第一单体在28、38、40、44、68、70、75和77位分别具有Q、R、K、Y、E、S、R和V,所述第二单体30、32、44、68、70、75和77位分别具有R、Q、K、T、S、N和V。位置参考I-Crel序列SWISSPROTP05725或pdb登录号lg9y(SEQIDNO:234)来指定;I曙Crel在28、30、32、33、38、40、44、68、70、75、77、80和82位分别具有K、N、S、Y、Q、S、Q、R、R、D、I、E和K。变体可由具有表I所示氛基酸残基的I-Crel序列组成。在该情况下,未指出的位置未4皮突变,并因此对应于野生型I-Crel序列(SEQIDNO:234)。这些在RAG1基因中具有DNA乾位点的异二聚体I-Crel变体的实例是由序列SEQIDNO:2到38的第一单体和序列SEQIDNO:39到75、248到253的第二单体所组成的变体。或者,变体可包含具有表I所示氨基酸戎基的I-CreI序列。在后一情况下,未指出的位置可包含如上所述的突变,或可未被突变。例如,变体可衍生自SEQIDNO:203编码的I-Crel骨架蛋白,所述I-Crel骨架蛋白(SEQIDNO:235)具有2位的丙氨酸插入、替换A42T、D75N、WllOE和R111Q,以及C端的额外三个^^酸(A、A和D)。另夕卜,来自野生型I-Crel或I-Crel骨架蛋白的所述变体可包含额外的突变,如上所述。表格的最后一列中标出了被各个异二聚体变体切割的靶标的第一个碱基位置。表II:在RAG2基因中具有DNA扭位点的异二聚体I-Crel变体序列第一单体第二单体靶标*位置28Q33Y38Q40K44K68Y70S75E77V33C38A44R68N70S75N77N7732T33H44A68丫70S75Y77K30。33R38T44Q68A70S75D77R37828K30G38G44Q68R70R75N77133C38A44N68R70S75Q77Q82R52128K30G38G44A68R70S75Q77E28K33R38A40Q44Y68D7GS75R77V64828A33S38R40K44Q68R70R75N77I28K30G38H44K68H70E74628S33Y38R40K44Y68D7OS75R77V2BK3DM38Q44A68R70K81928K33R38Q40Q44N68K70H28A33S38R40K44Q68R70S75Y77R96828Q33S38R40K44RS8Y70S75N77T33R40Q44A66H70A75N96828Q33S38R40K44R68Y70S75N77T33R40Q44A70A75N100R131R96828Q33S38R40K44RS8Y70S75N77T33R40Q44A70A75N114P96828Q33S38R40K44R68Y70S75N77T33R40Q44A70A7SN115T161P96828Q33S38R40K44R68Y70S75N77T33R4DQ44A70A75N151A161A96828Q33S38R40K44R68Y7OS75N77T33R40Q44A70A75N154N96828Q33S38R40K44R68Y70S75N77T33R40Q44A7OA75N化0R的828Q33S38R40K44R68Y70S75N77T33R40Q44A7OA75N85R94L129A153G159R160R96828Q33S38R40K44R68Y70S75N77T33R40Q44A70A75N86D96E103D129A96828Q33S38R40K44R68Y70S75N77T33R40Q44A70H75N103D96828Q33S38R40K44R63Y70S75N77T33柳Q44A70H75N114P96828Q33S38R40K44R68Y70S75N77T33R40Q44A7OH75N117G161P96828Q33S38R40K44R68Y70S75N77T33R40Q44A70H75N147A160R96828Q33S38R40K44R68Y70S75N77T33柳Q44A70H75N87L132T15仏96828Q33S38R40K44R68Y7OS75N77T33R40Q44A70H75N87L94L125A157G160R卿28Q33S38R40K44R68Y70S75N77T33R40Q44A70N75N114P155P96828Q33S38R40K44R68Y70S75N77T33R40Q44A70N75N151A159R96828Q33S38R40K44R68Y70S75N77T33R40Q44A70N75N160R96828Q33S38R40K44咖Y70S75M77T33R40Q44A70P75N96828Q33S38R40K44R68Y70S75N77T33R40Q44A70N75N103S129A159R96828Q33S38R40K44R68Y70S75N77T33R40Q44A70N75N132V96823N33S38R40K44R68Y70S75N77N33R40Q44A70A75N86D96E103D129A96828N33S38R40K44R68Y70S75N77N33R40Q44A70N75N103S129A159R96828N33S38R40K44R68Y70S75Y77N33R40Q44A70N75N103S129A159R9686D28N33S38R40K44R68Y70S75N77T1化R33R40Q44A70N75N103S129A159R96828N33S38R40K44R68Y70S75N77T96E33R40CM4A70N75N103S129A159R96823Q33S38R40K44R68Y70S75N77T117G139R33R40Q44A70N75N132V96828W33S38R40K44RS8Y70S75N77T105A33R橋4A70N75随V9682薦3S38R概43L44R68Y70S75N77T33R4GQ44A70N75N132V96828N33S38R40K44R49A68Y70S75Y77N87L33R40Q44A70N75N132V96828N33S38R40K44R54L68Y70S75N77T33R40Q44A70N75N132V9684N28N33S38R40K44R50R68Y70S75N7丌87L96R33R40Q44A70N75N132V96828N33S38R40K43L44R68Y70S75N77T108V33R40Q44A70N75N132V96828N33S38R40K44R68Y70S75N77N33柳Q術0N75N132V96830D33R38T44E68R70R33C38A44D68Y70S75S77R132833C38A44T68Y70S75R7丌30N38Q44N68R70S75Q77Q82R151128S33Y33R40K44K68T70G28R33A38Y40Q44N68R70S75Y77N170728S33Y38R40K44A63Y70S75Y77K32Q33R44Q68A70S75D77R188428K30G38G44A68Y70S75Y77K28K33N38Q40A44N68R70S75Y77N228928K33S38R40H44N68R70S75Q77Q82R28K30G38H44N68Y70S75Y77Q235932S33C44Q68R70R75N77I28K30G38H44R68Y70S75E77V248828R33A38Y40Q44Q68Y70S75R77Q28Q33Y38R40K44A68Y70S75Y77K298328K30G38G44A68R70S75R77Y30R32G44Q68R70S75R77T80K343828K33R33M40Q44D68R70S75R77Q28K3GG38H44R68N70S75N77N386328S33Y38R40K44Q68Y70S75R77Q32T33H44E6BR70R403828K33S38R40E44Q68N70S75N77R28K30N38Q44Q68R70S75K77V429932Q33R44K68T70G30N33H38A44K68Y70S75Y77Q478228K33R38N4OQ44Q68R70R75N77I28K30G38G44A68Y70S75Y77K504032D33H38Q44A68R70S75E77R28K33R38A40Q44Y68S70S75S77D530130N32E44T68Y70S75Y77V28K3GN38Q44K68H70E570430D33R38T44K68Y70S75E77V28K33S38R40H44Q68Y70S75R77Q589930R32D44R6BR70S75Q77N28K33S38R40E44Q68Y70S75R77Q6054*靶标的第一个《511^人RAG2基因中的位置。这些在RAG2基因中具有DNA乾位点的异二聚体I-Crel变体的实例是由序列SEQIDNO:76到102、238到247的第一单体与序列SEQIDNO:103到147、236、237的第二单体所组成的变体。另外,本发明的变体可含有在序列的NH;j端和/或COOH端插入的一个或多个残基。例如,将标签(表位或多聚组氨酸序列)引入NH2端和/或COOH端;所述标签适用于所述变体的检测和/或纯化。本发明的主题还包括衍生自如上所述的I-Crel变体的单链嵌合内切核酸酶。所述单链嵌合内切核酸酶可包含两个I-CreI单体、两个I-CreI核心结构域(I-Crel的6到94位)或二者的组合。本发明的主题还包括编码如上所述的变体或单链嵌合内切核酸酶的多核苷酸片段;所述多核苷酸可编码同二聚体或异二聚体变体的一个单体,或编码单链嵌合内源核酸酶的两个结构J^/单体。本发明的主题还包括用于表达本发明变体或单链分子的重组载体。所述重组载体包含至少一个编码变体或单链分子的多核苦酸片段,如上所述。在一个优选的实施方案中,所述载体包含两个不同的多核苷酸片段,每个片段各编码异二聚体变体的单体之一。可在本发明中使用的载体包括但不限于病毒载体、质粒、RNA载体,或者可由染色体、非染色体、半合成或合成的核酸所组成的线性或环形DNA或RNA分子。优选的载体是能够自主复制与之连接的核酸的载体(附加型载体)和/或表达与之连接的核酸的载体(表达载体)。大量的合适载体是本领域技术人员已知的,并可以商品获得。病毒载体包括逆转录病毒、腺病毒、细小病毒(parvovirus)(例如IM目关病毒)、冠形病毒、负链RNA病毒如正粘病毒(orthomyxovirus)(例如流感病毒)、杆状病毒(例如狂犬病毒和疱渗性口腔炎病毒(vesicularstomatitisvirus))、副粘病毒(paramyxovirus)(例如麻渗病毒和4山台病毒(Sendai))、正链RNA病毒如小RNA病毒(picornavirus)和a病毒,以及双链DNA病毒,其包括腺病毒、疱渗病毒(例如1和2型单纯疱渗病毒、EB病毒、巨细胞病毒)和痘病毒(例如牛痘病毒、禽痘病毒和金丝雀痘病毒)。其他病毒包括例如诺瓦克病毒、披膜病毒(togavirus)、黄病毒(flavivirus)、呼肠病毒(reoviruses)、乳多空病毒(papovavirus)、肝DNA病毒(hepadnavirus)和肝炎病毒。逆转录病毒的实例包括禽白血病-肉瘤、哺乳动物C型、B型病毒、D型病毒、HTLV-BLV组、慢病毒、泡沫病毒(spumavirus)(Coffin,J.M.,Retroviridae:Thevirusesandtheirreplication;InFundamentalVirology,第三版,B.N.Fields,等编辑,Lippincott隱RavenPublishers,Philadelphia,1996)。优选的栽体包括慢病毒载体,尤其是自失活(selfinactivacting)的慢病毒载体。载体可包*择标记,例如用于真核细胞培养的新霉素磷酸转移酶、组氨醇脱氢酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱瘆病毒胸苷激酶、腺苦脱氨酶、谷氨酰胺合成酶和次黄噪呤-鸟嘌呤磷酸核糖基转移酶;用于酿酒酵母(S.cerevisiae)的TRP1;大肠杆菌(E.coli)中的四环素、利福平或氨千青霉素抗性。优选地,所述载体是表达载体,其中编码本发明变体/单链分子的序列置于适当的转录和翻^控制元件的控制下,以允许产生或合成所述变体。因此,所述多核苦酸包含在表达盒中。更具体地,载体包含复制起点、与所述编码多核苷酸有效连接的启动子、核糖体结合位点、RNA剪接位点(使用基因组DNA时)、多腺苷酸化位点和转录终止位点。其还可包含增强子。启动子的选择将取决于多肽在其中表达的细胞。优选地,所述变体是异二聚体,编码各个单体的两多核苷酸包含在一个载体中,所述载体能够驱动两多核苦酸同时表达。合适的启动子包括组织特异性和/或诱导型启动子。诱导型启动子的例子是由提高的重金属水平诱导的真核金属硫堇(metallothionine)启动子,应答于异丙基-p-D-硫代半乳吡喃糖苷(IPTG)诱导的原核lacZ启动子,和由提高的温度诱导的真核热休克启动子。组织特异性启动子的实例是骨骼肌肌酸激酶、前列腺特异性抗原(PSA)、a-抗胰蛋白酶、A^面活性剂(SP)A和B蛋白、p-酪蛋白和酸性乳清蛋白基因。根据所述载体的另一有利的实施方案,其包含扭向构建体,所述乾向构建体包含与如上述基因组DNA靶切割位点周围的区域共有同源性的序列。或者,编码I-CreI变体的栽体和包含耙向构建体的载体是不同的载体。更优选地,耙向DNA构建体包含a)与如上述基因组DNA切割位点周围的区域共有同源性的序列,和b)侧翼是a)中序列的待引M列。优选使用至少50bp、优选多于100bp、更优选多于200bp的同源序列。事实上,共有的DNA同源性位于断裂位点上游和下游的侧翼区域中,且待引入的DNA序列应位于两臂之间。对基因组治疗的目的而言,待引入的序列优选是修复目的基因中突变的序列(基因矫正或功能基因的恢复)。或者,其可以是用于以某种特定方式改变染色体DNA的任何其他序列,包括用于修饰特异序列、用于减弱或激活目的内源基因、用于失活或缺失目的内源基因或其部分、用于向目的位点中引入突变或用于引入外源基因或其部分的序列。这些染色体DNA改变被用于基因组改造(动物模型)。为了矫正RAG基因,基因的切割发生在突变附近,优选突变的500bp内(图1A)。耙向构建体包含RAG基因片段,其具有乾位点侧翼至少200bp的同源序列(最小修复基质)用于修复切割,并含有RAG基因的正确序列用于修复突变(图1A)。因此,用于基因矫正的靶向构建体包含最小修复基质或由其组成;其优选地为200pb到6000pb,更优选地为1000pb到2000pb。或者,为了恢复功能基因(图1B),基因的切割发生在突变的上游,例如RAG1基因的1704、2320或5282位(图4)或RAG2基因的980位(图5),分別位于RAG1.6、RAG1.7、RAG1.10和RAG2.8靼标中。优选所述突变是基因序列中第一个已知的突变,从而该基因中所有下游突变可同时被矫正。靶向构建体包含切割位点下游的外显子,它们框内融合M象在cDNA中一样),并在3'具有多香酸化位点以终止转录。待引入的序列(外显子1构建体)的侧翼是切割位点周围的内含子或外显子序列,从而允许改造基因(外显子敲入基因)转录成为能编码功能性蛋白质的mRNA(图1B)。例如,外显子l^构建体的侧翼是切割位点上游和下游的序列,其来自如上所述的最小修U质。例如,表III和IV以及图21和22中列出被各变体切割的靶标(表I和II)和修复各变体切割的最小基质。表III:I-Crel变体切割的RAG1基因靼标<table>tableseeoriginaldocumentpage29</column></row><table>表IV:I-Crel变体切割的RAG2基因靼标<table>tableseeoriginaldocumentpage30</column></row><table>论靶标的第一个4^在人RAG2基因中的位置。例如,为了矫正RAG1基因中与SCID综合征相关的一些突变(如图4中所示),可使用以下的变体/靶向构建体组合画R396C、R396H和D429G:*变体32G和33R(第一单体)/28K、30G、38G、44E、68R和70H(第二单体),以及包含RAG1基因中至少6270到6469位的靶向构建体,用于有效修复DNA双链断裂,以及大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。-R561C:*变体280、33R、38R、40K、44K、68T、70S、75N和77V(第一单体)/28R、33R、38Y、40Q、44N、68T、70S、75R和77V(第二单体)和包含RAG1基因中至少6976到7175位的靶向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。*变体301\、33Y、38Q、44Q、68R、70S和75N(第一单体)/28Q、33Y、38R、40K、44N、68R、70S、75R和77N(第二单体)和包含RAG1基因中至少7168到7367位的靶向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。*变体28K、30R、32D、33Y、38Q、40S、44D、68N、70S、75N和771(第一单体)/28K、30G、32S、33Y、38H、40S、44N、6服、70S、75R和77D(第二单体),和包含RAG1基因中至少7207到7406位的靶向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效^"复突变。画E774Ter(过早终止密码子)、R737H、E722K:A变体30G、38T、44Y、68Y、70S、75Q(第一单体)/28K、33R、38N、40Q、44Q、68R、70S、75K和77E(第二单体)和包含RAG1基因中至少7478到7677位的靶向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。-Y938Ter:*变体28K、30N、32S、33H、38Q、40Q、44D、68N、70S、75N和771(第一单体)/28K、30D、32S、33R、38Q、40S、44N、68Y、70S、75R和77V(第二单体),和包含RAG1基因中至少8149到8348位的靼向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。*变体32K、33T44N、68Y、70S、75Y和77Q(第一单体)/28K、33S、38R、40E、44Y、68Y、70S、75Q和771(第二单体),和包含RAG1基因中至少8252到8451位的靼向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序列,用于有效修复突变。*变体28K、30G、38H、44N、68E、70S、75K和77R(第一单体)/28A、33S、38R、40K、44D、68Y、70S、75S和77R(第二单体),和包含RAG1基因中至少8149到8348位的靶向构建体,用于有效修复DNA双链断裂,和大范围核酸酶切割位点与突变位点之间的所有序31列,用于有效修复突变。或者,为了恢复功能性RAG1基因(图1B),可将以下的变体组合与外显子UiA构建体结合使用,所述外显子IJLA构建体包含编码RAG1蛋白质的cDNA序列和下游多聚腺苷酸化位点,侧翼是切割位点的上游和下游序列,所述序列来自如上所述的最小修复基质(表m):*变体28K、30N、32S、33S、38R、40H、44A、68Y、70S、75Y和77K(第一单体)/28A、30N、32S、33S、38R、40K、44D、68N、70S、75N和771(第二单体),和用于有效修复DNA双链断裂的外显子^V构建体,其侧翼是包含RAG1基因中至少1608到1802位的序列。*变体28K、30D、32S、33R、38T、40S、44Y、68S、70S、75S、77D(第一单体)/28K、30N、32T、33C、38Q、40S、44K、68Y、70S、75Q和77N(第二单体),和用于有效修复DNA双链断裂的外显子^w构建体,其侧翼是包含RAG1基因中至少2219到2418位的序列。*变体SEQIDNO:5到12(第一单体)/SEQIDNO:42到49、248到253(笫二单体),和用于有效修复DNA双链断裂的外显子IUv构建体,其侧翼是包含RAG1基因中至少5181到5380位的序列。本发明的主题还包括一种组合物,其特征是包含至少一种变体、一种单链嵌合内切核酸酶和/或至少一种编码所述变体/单链分子的表达载体,如上所述。在所述组合物的一个优选的实施方案中,其包含耙向DNA构建体,所述构建体包含修复RAG基因中突变的序列,其侧翼是与所述变体的基因组DNA切割位点共有同源性的序列,如上所述。所述4务复突变的序列是具有正确序列的基因片段或者是外显子^构建体,如上所述。优选所述耙向DNA构建体包含在重组栽体中,或包含在表达载体中,所述表达载体包含编码本发明变体/单链分子的多核苷酸。在可使用两种载体的情况下,本发明的主题还包括含有如上述的I-Crel变体表达载体和包含如上述靶向构建体的载体的产品,其作为组合制剂用于在与RAG基因中突变相关的SCID综合征的治疗中同时、分离或依次使用。本发明的主题还包括如上所述的至少一种大范围核酸酶变体和/或一种表达载体用于制备药物的用途,所述药物用于在有此需要的个体中预防、改善或治疗与RAG基因中突变相关的SCID综合征,所述药物通过任何手段被施用给所述个体。在该情况下,大范围核酸酶变体的使用至少包括以下步骤(a)在个体的躯体组织中,在包含所述变体的至少一个识别和切割位点的目的位点处i秀导双链切割,和(b)向该个体中引入靶向DNA,其中所述靼向DNA包含(l)与切割位点周围区域共有同源性的DNA,和(2)在靶向DNA与染色体DNA之间重组后修复目的位点的DNA。在适合靼向DNA引入目的位点的条件下将靶向DNA引入所述个体。根据本发明,所述双链切割通过对个体施用所述大范围核酸酶而整体(intoto)诱导,或者通过将所述大范围核酸酶引入从个体中取出的体细胞(#干细胞)内并在修饰后放回个体内而进行离体诱导。本发明的主题还包括在有此需要的个体中预防、改善或治疗SCID综合征的方法,所述方法至少包括通过任何手段对所述个体施用上文所述组合物的步骤。大范围核酸酶变体可作为多肽使用或作为编码所述多肽的多核苷酸构建体使用。其通过本领域技术人员公知的任何适用于特定细胞种类的便利手段而(单独地或与至少一种合适的媒介或运载体和/或与靶向DNA组合)引入体细胞内。根据本发明的用途的一个有利的实施方案,所述大范围核酸酶变体(多肽)与以下组合-脂质体、聚乙烯亚胺(PEI);在这些情况下施用所述组合并因此将其引入:l区体把细胞内。-膜易位肽(Bonetta,TheScientist,2002,16,38;Ford等,GeneTher"2001,8,1-4;Wadia和Dowdy,Curr.Opin.Biotechnol.,2002,13,52-56);在这样的情况下,将变体/单链分子的序列与膜易位肽的序列融合(融合蛋白)。根据本发明的用途的另一有利的实施方案,将大范围核酸酶(编码所述大范围核酸酶的多核苷酸)和/或靶向DNA插入载体中。可通过大量方法(例如注射、直接#^、发射物轰击、脂质体、电穿孔)将包含耙向DNA和/或编码大范围核酸酶的载体引入细胞中。可使用表达载体在细胞中稳定或瞬时地表达大范围核酸酶。在真核细胞中表达的技术是本领域技33术人员>{^的(见CurrentProtocolsinHumanGenetics:第12章"VectorsForGeneTherapy"&第13章"DeliverySystemsforGeneTherapy")。任选地,可优选在重组蛋白中掺入核定位信号以确保其在核内表达。一旦ii^细胞内,大范围核酸酶和包含靼向DNA和/或编码大范围核酸酶的核酸的载体(如果存在的话)被细胞从胞质输入或易位至核内的作用位点。对治疗的目的而言,以治疗有效量施用大范围核酸酶和可药用赋形剂。如果施用量是有生理意义的,则这样的组合被称作以"治疗有效量"施用。如果一种药剂的存在导致可检测的接受者生理学改变,则它是有生理意义的。在本文中,如果药剂的存在导致目标疾病的一个或多个症状的严重程度减轻以及损伤或异常的基因组矫正,则它是有生理意义的。在根据本发明的用途的一个实施方案中,大范围核酸酶基本上是非免疫原性的,即不引发或几乎不引发不利的免疫应答。根据本发明可使用大量改善或消除这类有害免疫^^应的方法。在一个优选的实施方案中,大范围核酸酶基本不含N-曱醃基甲^酸。避免不想要的免M应的另一种方式是将大范围核酸酶与聚乙二醇("PEG")或聚丙二醇("PPG")(优选500到20,000道尔顿的平均分子量(MW))缀合。与PEG或PPG缀合(例如Davis等(US4,179,337)所述)能够提供具有抗病毒活性的非免疫原性的生理活性水溶性内切核酸酶缀合物。Saifer等(US5,006,333)中还描述了使用聚乙-聚丙二醇共聚物的类似方法。本发明还涉及通过上文所述的多核苷酸或载体(优选表达载体)修饰的原核或真核宿主细胞。本发明还涉及非人转基因动物或转基因植物,其特征是其所有或部分细胞通过上文所述的多核普酸或载体进行了修饰。本文使用的"细胞"是指原核细胞如细菌细胞,或真核细胞如动物、植物或酵母细胞。本发明的主题还包括如上所述的大范围核酸酶变体、一条或两条多核苷酸(优选包含在表达载体中)用于基因组改造(动物模型产生或敲除)、用于非治疗性目的的用途。根据所述用途的一个有利的实施方案,其用于在目的基因中诱导双链断裂,从而诱导DNA重组事件、DNA丢失或细胞死亡。根据本发明,所述双链断裂用于修复特定序列、修饰特定序列、恢复功能基因代替突变基因、减弱或激活目的内源基因、在目的位点内引入突变、引入外源基因或其部分、失活或缺失外源基因或其部分、易位染色体臂,或保留DNA不发生修复并被降解。才艮据所述用途的另一个有利的实施方案,所述变体、多核苷酸、载体与如上所述的乾向DNA构建体组合。在本发明大范围核酸酶变体用途的第一个实施方案中,其包括至少以下的步骤l)在包含所述大范围核酸酶变体的至少一个识别和切割位点的基因组基因座处引入双链断裂;2)提供包含待引A^列的靶向DNA构建体,所述序列側翼是与耙基因座共有同源性的序列。所述大范围核酸酶可直接直接提供给细胞或通过表达载体提供,所i^达载体包含编码所述大范围核酸酶的多核普酸序列,并适用于在所使用细胞中对其进行表达。该策略用于在乾位点引入DNA序列,例如产生可用于药物测试的^或敲除动物模型或细胞系。本发明的主题还包括如上所述的至少一种归巢内切核酸酶变体作为制造其他大范围核酸酶的骨架的用途。例如,为了制造新的、第三代归巢内切核酸酶的目的,可例如对所述变体进行笫三轮诱变和选择/筛选。归巢内切核酸酶变体的不同用途以及本发明归巢内切核酸酶变体的使用方法还包括衍生自所述变体的单链嵌合内切核酸酶、编码所述变体或单链嵌合内切核酸酶的多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物的用途,如上所述。可通过^it能够切割目的基因组DNA耙序列(例如来自哺乳动物基因的DNA耙序列)的I-Crel变体的方法获得根据本发明的I-Crel变体,所述方法包括以下步骤(a)构建笫一系列I-Crel变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,位于I-Crel的26到40位,(b)构建第二系列I-Crel变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,位于I-Crel的44到77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-Crel位点的变体,其中(i)I-Crel位点中-10到-8位的核苷酸三联体已被替换为存在于所il&因组靶标中-10到-8位的核苷酸三联体,且(ii)+8到+10位的核苷酸三联体已被替换为存在于所述基因组靶标中-10到-8位的核苦酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-Crel位点的变体,其中(i)I-Crel位点中-5到-3位的核苦酸三联体已被替换为存在于所述基因組耙标中-5到-3位的核普酸三联体,且(ii)+3到+5位的核苷酸三联体已被替换为存在于所述基因组耙标-5到-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-Crel位点的变体,其中(i)I-Crel位点中+8到+10位的核苦酸三联体已被替换为存在于所述基因组靶标中+8到+10位的核普酸三联体,且(ii)-10到-8位的核苷酸三联体已被替换为存在于所述基因组靶标+8到+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-Crel位点的变体,其中(i)I-Crel位点+3到+5位的核普酸三联体已被替换为存在于所述基因组靶标+3到+5位的核苷酸三联体,且(ii)-5到-3位的核苷酸三联体已被替换为存在于所述基因组靶标+3到+5位的核苦酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两个变体的26到40位和44到77位中的突变在单个变体中组合,获得切割下述序列的新的同二聚体I-Crel变体,所述序列中(i)-10到-8位的核苷酸三联体与存在于所述基因组靶标-10到-8位的核苷酸三联体相同,(ii)+8到+10位的核苷酸三联体与存在于所i^因组靶标-10到-8位的核苷酸三联体的反向互补序列相同,(iii)-5到-3位的核苷酸三联体与存在于所述基因组耙标-5到-3位的核苷酸三联体相同,和(iv)+3到+5位的核苷酸三联体与存在于所逸基因组乾标-5到-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(i)的两个变体的26到40位和44到77位中的突变在单个变体中組合,获得切割下述序列的新的同二聚体I-CreI变体,所述序列中(i)+3到+5位的核苷酸三联体与存在于所述基因组靶标+3到+5位的核苷酸三联体相同,(ii)-5到-3位的核苦酸三联体与存在于所述基因组扭标+3到+5位的核苷酸三联体的反向互补序列相同,(iii)I-Crel位36点+8到+10位的核苷酸三联体被替换为存在于所述基因组靶标+8到+10位的核苷酸,和(iv)-10到-8位的核苷酸三联体与存在于所述基因组靶标+8到+10位的核苦酸三联体的反向互补序列相同,(i)将步骤(g)和(h)中获得的变体组合,形成异二聚体,和(j)选择和/或筛选来自步骤(i)的能够切割位于哺乳动物基因中的所述基因组DNA把标的异二聚体。可省略步骤(c)、(d)、(e)或(f)之一。例如,如果省略步骤(c),则步骤(d)用这样的突变体I-Crel位点进行,所述突变中-10到-8位和-5到-3位的两个核苷酸三联体已被分别替换为存在于所述基因组耙标-10到-8位和-5到-3位的核苷酸三联体,且+3到+5位和+8到+10位的核普酸三联体已分别被替换为存在于所逸基因组乾标-5到-3位和-10到-8位的核普酸三联体的反向互补序列。步骤(a)、(b)、(g)和(h)可进一步包括在下述位置引入另外的突变接触DNA靼序列或直接或间接地与所述DNA靼标相互作用的位置,改善突变体的结合和/或切割特性的位置,或防止形成功能性同二聚体的位置,如上所述。这可通过如国际PCT申请WO2004/067736中所述产生组合文库来进行。改造本发明I-Crel变体的方法有利地包括将随机突变引入整个变体或变体的部分中,尤其是引入变体的C端一半(80到163位),以改善变体对来自目的基因的DNA靼标的结合和/或切割特性。可根据本领域^P的并可以商品获得的标准诱变方法,通过对变体池(pool)产生随机裔变文库来进行诱变。优选地,诱变在步骤(i)中形成或步骤(j)中获得的异二聚体的单体之一的整个序列上进行,有利地在单体池上进行,优选地在步骤(i)或(j)的异二聚体的两个单体上均进行诱变。优选根据Arnould等,J.Mol.Biol.,Epub2007年5月10日的图4所阐述的过程进行两轮选择/筛选。在笫一轮中,对异二聚体的单体之一进行诱变(图4中的单体Y),与另一单体(图4中的单体X)共表达以形成异二聚体,并针对来自目的基因的靶标选择改进的单体Y+。在第二轮中,对另一单体(单体X)进行诱变,与改进的单体Y+共表达形成异二聚体,并针对来自目的基因的靶标进行选择,以获得具有改进活性的大范围核酸酶(X+Y+)。可根据/^知的重叠PCR技术,通过扩增包含两个亚结构域中各一个的重叠片段来进行步骤(g)和(h)中的(分子内)突变组合。通过将来自步骤(g)的一个变体与来自步骤(h)的一个变体共表达以允许其形成异二聚体来进行步骤(i)中的(分子间)变体组合。例如,可用编码所述变体的一个或两个重组表达载体来修饰宿主细胞。然后在允许变体表达的条件下培养细胞,从而在宿主细胞中形成异二聚体。可如国际PCT申请WO2004/067736或Arnould等,J.Mol.Biol.,2006,355,443-458中所述,通过使用体外或体内切割测定来进行步骤(c)、(d)、(e)、(f)和/或(j)中的选择和/或筛选。根据所述方法的另一个优选的实施方案,通过重组介导的DNA双链断裂的修复在下述条件下在体内进行步骤(c)、(d)、(e)、(f)和/或G),在所述条件下,由所述变体产生的突变DNA乾序列中的双链断裂导致阳性选择标记或报告基因的激活或者阴性选择标记或报告基因的失活。本发明的主题还包括在I-Crel的26到40位和/或44到77位含有突变的I-Crel变体,其适用于^Lit能够切割来自RAG基因的DNA靶标的本发明变体。具体地,本发明包括如上所述&造I-Crel变体(包括表V、VI、VIII、IX的变体)的方法的步骤(c)到(f)中定义的I-Crel变体。本发明还包括如上所述改造I-Crel变体(包括表VII和X的组合变体)的方法的步骤(g)和(h)中定义的I-Crel变体。能够切割来自目的基因的DNA靶标的单链嵌合大范围核酸酶根据本领域公知的方法衍生自本发明的变体(Epinat等,NucleicAcidsRes"2003,31,2952-62;Chevalier等,Mol.Cell"2002,10,895-905;Steuer等,Chembiochem.,2004,5,206-13;国际PCT申请WO03/078619和WO2004/031346)。任何这些方法都可用于构建衍生自本发明所述变体的单链嵌合大范围核酸酶。编码本发明所述变体的多核香酸序列可通过本领域技术人员已知的任何方法制备。例如,通过使用特定引物的聚合酶链式反应从cDNA模板扩增它们。优选将所述cDNA的密码子选择成有助于所述蛋白质在期望的表达系统中表达。可通过公知的重组DNA和和遗传工程技术获得包含所述多核普酸38的重组载体并将其引入宿主细胞中。通it^达如上所述的多肽来产生本发明所述的I-Crel变体或单链衍生物;优选在适合多肽表达或共表达的条件下在以一个或两个表达载体(仅在变体的情况下)所述多肽,并从宿主细胞培养物或从转基因动物/植物中回收变体或单链衍生物。除了上述特征以外,本发明还包括在以下涉及说明本发明的I-Crel变体及其用途的实施例及附图中显现的其他特征,在附图中-图1显示了通过大范围核酸酶诱导的重组来恢复功能性基因的两种不同策略。A.基因矫正。突变发生在已知基因内。用大范围核酸酶切割并与修复基质重组后,有害突变被矫正。B.外显子序列l。突变发生在已知基因内。突变的mRNA转录本示于基因下方。在修^1^质中,位于切割位点下游的外显子与多聚腺普酸化位点框内(像cDNA中那样)融合,在3'终止转录。内含子和外显子序列可用作同源区。外显子序列^产生被改造的基因,其转录为能够编码功能性蛋白质的mRNA。-图2显示了归巢内切核酸酶的才莫块结构和用于定制大范围核酸酶设计的组合方法。A.与其DNA扭标结合的I-Crel归巢内切核酸酶的三维结构。催化核心被两个appappa折叠包围,所述折叠在DNA大沟上形成鞍形相互作用界面。B.鉴于两个DNA结合亚结构域的可分离性(左上),可以将与衍生自I-Crel耙序列的不同序列结合的不同I-Crel单体(右上和左下)组合,获得切割非回文嵌合乾标的异二聚体或单链融合物分子(右下)。C.鉴定更小的独立亚基(即在单个单体或a即a卯a折叠内的亚基(右上和左下))会允许通过将突变在同一单体内组合来设计新的嵌合分子(右下)。这样的分子会切割回文嵌合靼标(右下)。D.两个先前步骤的组合会允许进行涉及四个不同亚结构域的更大的组合方法。在第一步骤中,可将几个新的大范围核酸酶组合成新的分子("半-大范围核酸酶"),该分子切割来自想要切割的靶标的回文靶标。然后,这样的"半-大范围核酸酶"的组合可产生切割目的靶标的异二聚体种类。因此,针对各亚结构域鉴定少量新的切割酶(cleaver)会允许设计非常大量的新内切核酸酶。-图3显示了I-Crel与其DNA乾标C1221(SEQIDNO:l;Chevalier和Stoddard,NucleicAcidsRes"2001,29,3757-74;Chevalier等J.Mol.Biol.,2003,329,253-69)的威基特异性相互作用图镨。本发明人已鉴定了能够结合下述DNA靶标的新的I-Crel衍生内切核酸酶,所述DNA耙标在-10到-8和+8到+10或者-5到-3和+3到+5区域中被修饰。这些DNA区域用灰色框表示。-图4显示了人RAG1基因(GenelD5896,登录号NC_000011.8,36546139到36557877位)。CDS序列以框显示,并标出了CDS接合处。ORF用灰色框表示。标出了RAG1.10位点(SEQIDNO:151)以及多个可能的大范围核酸酶位点(RAG1.6:SEQIDNO:149;RAG1.7:SEQIDNO:150;RAG1.1:SEQIDNO:159,207;RAG1.2:SEQIDNO:165;RAG1.5:SEQIDNO:167;RAG1.3:SEQIDNO:168;RAG1.11:SEQIDNO:170;RAG1.12:SEQIDNO:173;RAG1.9:SEQIDNO:175和RAG1.4:SEQIDNO:176)的序列和位置。在ORF上标出了已知有害突变的实例。-图5显示了人RAG2基因(GenelD5897,登录号NC—000011.8,36570071到36576362(负链))。框中是CDS序列,并标出了CDS接口。ORF用灰色框表示。标出了RAG2.8大范围核酸酶位点的序列(SEQIDNO:184)和位置。在ORF上标出了已知的有害突变。-图6显示了I-CrelN75骨架蛋白的序列和用于Ulib4和Ulib5文库构建的简并引物。A.骨架(SEQIDNO:203)是I-CrelORF,其包含D75N密码子替换和3'端三个额外的密码子(AAD)。B.引物(SEQIDNO:204、205、206)。-图7显示了I-Crel变体在28、30、33、38和/或40位的切割模式。对于在筛选后获得并由28、30、33、38、40、70和75位残基定义的141种I-CreI变体中的每一种而言,用64个靼标在酵母中监测切割,所述乾标从被I-CreI切割的C1221回文乾标通过替换土8到10位的核苷酸衍生而来。靶标用对应于-10、-9和-8位核苷酸的三个字母来命名。例如,GGG对应于tcgggacgtcgtacgacgtcccga扭标(sEQIDNO:207)。数值对应于切割强度,所述强度在扫描滤器后通过适当的软件评价。对各蛋白质而言,针对64个耙标的每一个显示观察到切割(黑色框)或未观察到切割(O)。所有变体在位置75突变D75N。-图8显示了与其靶标结合的I-Crel同二聚体上蛋白质和DNA靶标中突变的定位。两组突变(残基44、68和70;残基28、30、33、38和40)在左侧的单体上用黑色显示。两组突变明显是空间上分离的。然而,不存在不同亚结构域的结构证据。DNA耙位点中的对应区(-5到-3区;-10到-8区)在一个半位点上以灰色显示。國图9显示了RAGl.lO系列把标和近^^衍生物。C1221(SEQIDNO:l)是I-CreI回文靼序列之一。10GTT_P、10TGG_P、5CAG_P和5GAG—P(SEQIDNO:208到2U)AiL现被I-Crel突变体切割的近^^衍生物。它们与C1221的区别在于加框的基序。C1221、10GTT_P、10TGG—P、5CAG—P和5GAG—P最早被描述为24bp的序列,但是结Sj数据提示,只有22bp与蛋白质/DNA相互作用相关。然而,在括号中标出了士12位。RAG1.10(SEQIDNO:151)是位于人RAG1基因中5270位的的DNA序列。RAGl.10.2(SEQIDNO;212)是衍生自RAGl.lO左侧部分的回文序列,且RAG1.10.3(SEQIDNO:213)^i衍生自RAGl.lO右側部分的回iL^列。10GTT_P、10TGG—P、5CAG_P和5GAG一P中加框的基序可见于RAGl.lO系列靶f示中。画图10显示了RAG2.8系列靼标和近缘衍生物。C1221(SEQIDNO:l)是I誦CreI回文靼序列之一。10GAA—P、10TGT_P、5TAT_P和5CTC—P(SEQIDNO:214到217)是发现被I-Crel切割的近缘衍生物。它们与C1221的区别在于加框的基序。C1221、10GAA—P、10TGT—P、5TAT—P和5CTC—P最早被描述为24bp的序列,但是结构l^据提示,只i22bp;蛋白质/DNA相互作用相关。然而,在括号中标出了士12位。RAG2.8(SEQIDNO:184)是位于人RAG2基因中968位的DNA序列。在RAG2.8:2靶标(SEQIDNO:218)中,靶标中部的ttga序列被替换为存在于C1221中的gtac。RAG2.8.3(SEQIDNO:219)^:;肝生自RAG2.8.2左侧部分的回iL^列,RAG2.8.4(SEQIDNO:220)是衍生自RAG2.8.2右侧的回文序列。10GAA—P、10TGT—P、5TAT_P和5CTC—P中加框的1^序可见于RAG2.8系列耙标中。-图ll显示了pCLS1055质粒载体图。國图12显示了pCLS10542质粒载体图。画图13展示了组合突变体对RAG1.10.2靶标的切割。该图展示了用RAG1.10.2耙标初步筛选I—Crel組合突变体的实例。Hll和H12是不同强度的阳性对照。在第一个滤器上,A5和D2位置处的阳性突变体的序列分别为KKSAQS/ASSDR和KKSSQS/AYSYK(与表V的命名法相同)。在第二个滤器上,A6、G9和H3位置处的阳性突变体的序列分别为KRDYQS/AYSYK、KRSNQS/AYSYK和KKSGQS/AYSYK。-图14展示了组合突变体对RAG1.10,3靶标的切割。该图展示了用RAG1.10.3靶标初步篩选I-Crel组合突变体的实例。H12是阳性对照。在第一个滤器上,A4和H4位置的阳性突变体的序列分别为KNSTAK/NYSYN和QNSSRK/AHQNI(与表VI的命名法相同)。在第二个滤器上,位置D3和Hll处的阳性突变体的序列分别为NNSSRRS/TRSYI和丽SSRR/NRSYV。-图15显示了pCLS1107载体图。-图16展示了异二聚体组合突变体对RAG1.10靶标的切割。该图展示了在表VII中所述的突变体中对一系列组合突变体进行再次筛选。-图17展示了组合突变体对RAG2.8,3把标的切割。该图展示了用RAG2.8.3耙标初步筛选I-Crel组合突变体的实例。在第一个滤器上,B3和F5位置处的阳性突变体的序列分别为KNSRQQ/ATQNI和KNSRQQ/NRNNI(与表VIII的命名法相同)。在第二个滤器上,Bl、Dll和Hll位置处的阳性突变体的序列分别为KNSRQA/RHTNI、KRSRQQ/AKGNI和KNRSQQ/ARHNI。-图18展示了组合突变体对RAG2.8.4乾标的切割。该图展示了用RAG2.8.4耙标初步筛选I-Crel组合突变体的实例。在笫一个滤器上,阳性突变体为NNSSRR/RYSNN(A7)、NNSSRK/TRSRY83S(B4)、NNSSRR/TYSRA(Cl和H2)、QNSSRK/KYSYN(C6、F4、G4和H7)、NNSSRR/TYSRV140A(C8和E8)、NNSSRR/KYSYN(C11)、NNSSRK/TYSRA(D6)和NNSSRR/TYSRA(H10)或未鉴定(A4和Gl)(与表IX的命名法相同),在笫二个滤器上,阳性突变体是KNSYQS/RYSNN(A5)、NNSSRR/KYSYN54L(Bl)、NNSSRR/RYSNT(C11和G3)、NNSSRR/RYSNN(D5和G7)、KNSSRS/QYSYN(E5)、QNSSRK/KYSYN(F12)、NNSSRK/TYSRA(H2)。-图19展示了异二聚体组合突变体对RAG2.8.2靶标的切割。A.用RAG2.8.2耙标再次篩选I-Crel突变体的组合。B.用RAG2.8.2乾标再次筛选I-CreI突变体的相同組合。用该序列未观察到切割。國图20展示了RAG2.8靼标的切割。将切割RAG2.8.3的一系列I-CrelN75优化突变体与切割RAG2.8.4的突变体共表达。用RAG2.8靶标测试切割。圃圈中是切割RAG2.8的突变体(D6)。D6是由以下两个变体单体的组合所产生的异二聚体33R40Q44A670N75N89A105A115T159R和28N33S38R40K44R68Y70S75N77N。H12是阳性对照。42-图21和22展示了可见于人RAG1和RAG2基因中的DNA靼序列,以及能够切割所述DNA靶标的相应I-Crel变体。标出了与耙序列最接近的外显子和外显子接合处(第1列和笫2列),显示了DNA靶标的序列(第3列)及其位置(第4列)。修复耙位点切割的最小修复基质通过其第一个核苷酸(起点,第7列)和最后一个核苷酸(终点,第8列)标出。各变体的序列由所指位置上的氨基酸戎基来定义。例如,图21的第一个异二聚体变体由在28、38、40、44、68、70、75和77位分别具有Q、R、K、Y、E、S、R、V的第一单体和在30、32、44、68、70、75和77位分别具有R、Q、K、T、S、N和V的第二单体组成。上述位置参考I-CreI序列SWISSPROTP05725或pdb登录号lg9y进行标示;I-Crel在28、30、32、33、38、40、44、68、70、75、77、80和82位分别具有K、N、S、Y、Q、S、Q、R、R、D、I、E和K。未标出的位置未突变,并因此对应于野生型I-Crel序列。-图23展示了在酵母中用优化突变体对RAG2.8靶标的切割。将切割RAG2.8,3序列的一系列I-Crel衍生物(在实施例9中鉴定)与通过随机诱变切割RAG2.8.4靶标的突变体而获得的新I-Crel系列共表达。在酵母中使用先前所述的功能测定法(Arnould等,2006,J.Mol.Biol.355,443-458)监测RAG2.8把标的切割,并在本文中通过酵母的蓝色染色显示。该图描述了在先前的初步筛选中鉴定的一系列突变体。将这些突变体重新排列,突变体在同一簇中的四个不同点中进行测试。圆圏内的突变体(E8)对应于表XII中所述的33R、40Q、44A、70N、75N/132V与28N、33S、38R、40K、44R、68Y、70S、75Y、77N/49A、87L的异二聚体。G12和H12是阳性对照(I-Scel大范围核酸酶和I-Scel靶标),F12是阴性对照(无大范围核酸酶)。画图24展示了通过共表达切割RAG1.10.3的KHSMAS/ARSYT突变体与切割RAG1.10.2的随机i秀变突变体,对RAG1.10靼标进4亍切割。该图展示了80个重新排列的突变体(孑LAl到G8)的再次筛选。在每个四点蔟中,两个左侧的点对应于随机诱变的突变体,而两个右側的点对应于在实施例3中被鉴定为RAG1.10.2切割酶的未诱变的KRSNQS/RYSDT蛋白质(见表V)。表XIII中描述的六个突变体用圆圈表示。-图25显示了用于在哺乳动物细胞中表达I-CrelN75的质粒pCLS1088的图i普。國图26显示了用于在哺乳动物细胞净艮告载体中入门克隆(gatewaycloning)DNA乾标的质粒pCLS1058的图镨。-图27展示了CHO细胞中的染色体外测定中,具有或不具有G19S突变的M2和M3I-Crel突变体对RAGl.lO、RAG1.10.2和RAG1.10.3把标的切割。回文靶标RAG1.10.2和RAG1.10.3的切割在图A中显示,而异二聚体大范围核酸酶对RAG1.10的切割在图B中显示。相同实验中I-Scel对I-Scel耙标的切割作为阳性对照显示。國图28展示了哺乳动物细胞中报告系统的设计。在起始密码子下游132bp处被I-SceI切割位点中断的噪呤霉素抗性基因处于EFIa启动子的控制下(l)。该转基因已在CHO-K1细胞中以单拷贝稳定表达。为了在相同的染色体环境中引入大范围核酸酶耙位点,修复基质包含i)无启动子的潮霉素抗性基因、(ii)完整的lacZ表达盒和iii)两条同源序列臂(1.1kb和2.3kb)。已构建了若千修复基质,其区别仅在于中断lacZ基因的识别位点(2)。因此,已生产了非常类似的细胞系Al细胞系、I-Scel细胞系和I-CreI细胞系。当lacZ修复基质(长度2kb)与表达切割识别位点的大范围核酸酶的载体一起共转染时,恢复了功能性lacZ基因(3)。大范围核酸酶诱导的重组水平可根据转染后蓝色集落或灶点(foci)的数量来推断。实施例1:^Liii8到土10位具有修饰的特异性的I-Crel变体国际PCT申请WO2004/067736和Arnould等,J.Mol.Biol.,2006,355,443-458中描述了在哺乳动物或酵母细胞中产生大范围核酸酶的方法和基于切割所诱导的重组的测定,其用于筛选具有改变的特异性的变体。这些测定产生可通过标准方法监测的功能性LacZ报告基因。A)材料和方法a)构建Ulib4、Ulib5和Lib4文库如先前所述(Epinat等,N.A.R.,2003,31,2952-2962)合成I-Crelwt和I國CreID75N开放读码框。通过用aac代替密码子75来引入突变D75N。通过用三种不同的残基组合进行替换而从I-CrelD75N蛋白衍生了三种组合文库(Ulib4、Ulib5和Lib4),所述残基组合可能参与与一个DNA乾标半位点的土8到10位g的相互作用。通过使用简并引物的PCR来产生大范围核酸酶文库的多样性,所述引物在各个选定位置上具有独特的简并密码子(编码10或12个不同的氨基酸)。N30、Y33和Q38位(Ulib4文库)或K28、N30和Q38位(Ulib5文库)的三个密码子被替换为编码12种不同氨基酸(A、d、E、G、H、K、N、P、Q、R、S、T)的简并密码子VVK(18种密码子)。因此,这些蛋白质文库的最大(理论)多样性为123或1728。然而,对核酸而言,多样性为183或5832。通过PCR获得带有期望的突变组合的片段,所述PCR使用一对简并引物(Ulib456for和Ulib4rev;Ulib456for和Ulib5rev,图6B)和作为DNA才莫板的D75N开放读码框(ORF)(图6A)。将相应的PCR产物克隆回酵母复制型表达载体pCLS0542中的I-CrelN75ORF中(前述Epinat等,和图12),所述栽体带有LEU2营养缺陷标记基因。在基于2micron的该复制型载体中,I-Crel变体处于半乳糖诱导型启动子的控制下。在定购自BIOMETHODES的Lib4中,70位的精氨酸首先被替换为丝氨酸(R70S)。然后将28、33、38和40位随机化。常规氨基酸(K28、Y33、Q38和S40)被替换为10种^&酸(A、D、E、K、N、Q、R、S、T、Y)之一。得到的文库就蛋白质而言具有10000的理论复杂度。b)构建靶标克隆C1221二十四bp回iJ^列(:tcaaaacgtcgtacgacgttttga,SEQIDNO:1)是近乎回文的天然I-Crel耙标(.tcaaaacgtcgtgagacagtttgg,SEQIDNO:221)半位点的重复。C1221在体外和体内(酵母和哺乳动物细胞中)与I-Crel天然靶标同样有效地被切割。64种回文把标如下衍生自C1221:从Sigma定购64对寡核苷酸(:ggcatacaagtttcnnnacgtcgtacgacgtnnngacaatcgtctgtoa(SEqidno:222)和反向互补序列),将其退火并以相同方向克隆进pGEM-TEasy(PROMEGA)中。接着,切下400bpPvuII片段并克隆进前文均已描述(前述Epinat等,2003)的酵母载体pFL39-ADH-LACURAZ(也称作pCLS0042)和哺乳动物载体pcDNA3衍生物中,得到64种酵母报告载体(靶标质粒)。或者,使用Gateway方案(INVITROGEN),将通过PCR扩增单链寡核普酸而产生的双链乾标DNA克隆进酵母和哺乳动物报告载体中。c)酵母菌株将大范围核酸酶表达变体的文库转化进leu2突变单倍体酵母菌株FYC2-6A:a,trplA63,leu2Al,his3A200中。转化使用经典的化学/热激方案,所述方案通常给出每jigDNA106个独立的转化体(Gietz和Woods,MethodsEnzymol.,2002,350,87-96)。将个体转化体(Leu+)克隆单个^沐到96孑L微孑Ul+。使用菌落采集器(QpixII,GENETIX)挑取了13824个菌落并在144个微孔板中培养。使用相同的方案将64个靶标质粒转化进单倍体酵母菌林FYBL2-7B:a,ura3A851,trplA63,leu2Al,lys2A202中,得到64个测试菌林。d)交配(mating)表达大范围核酸酶的克隆并在酵母中筛选将大范围核酸酶表达克隆与64个靶菌林中的每个进行交配,并通过使用前述Arnould等,2006中图2阐述的筛选实验来测试二倍体的p-半乳糖苷酶活性。将I-CreI变体以及酵母报告菌林储存在甘油(20。/o)中并在新的微孔板中复制。使用菌落网格(gridder)(QpixII,GENETIX)进行交配。使用高网格密度(约20个点/cm2)将突变体在覆盖YPD平板的尼龙滤纸上划网格。在相同的滤纸上进行第二次划网格的过程从而印上第二层,所述笫二层对每个变体而言由64个具有不同l艮告子的酵母菌林组成。将膜置于富含固体琼脂YPD的培养基上,并在301c孵育一夜,以允许交配。接着,将滤纸转移至合成培养基上并在37X:孵育五天,以选择带有表达载体和靶标载体的二倍体,所述合成培养基缺乏亮氨酸和色氨酸,并含有半乳糖(1%)作为碳源(对共表达实验而言还含有G418)。5天后,将滤纸置于固体培养基上并在37"c孵育,以监测p-半乳糖苷酶活性,所述固体培养基在0.5M磷酸钠緩冲液pH7.0中含有0.02%X画Gal、0.1%SDS、6%二甲基甲酰胺(DMF)、7mMp-巯基乙醇、1%琼脂糖。孵育两天后,通过扫描鉴定阳性克隆。使用适当的软件定量克隆的p-半乳糖苷酶活性。分离对至少一个靶标显示活性的克隆(首次篩选)。然后将点密度降低至4个点/cm2并一式四份针对64个报告菌林进行测试,从而创建完整图镨(二次筛选)。e)纽使用来自PROLIGO的引物PCR-Gall0画F(gcaactttagtgctgacacatacagg,SEQroNO:223)和PCR-Gall0-R(acaaccttgattgcagacttgacc,SEQIDNO:224),在酵母菌落上通近pcr扩增在酵母中首次和/或二次筛选期间鉴定的阳性克隆的开放读码框(ORF)。简言之,挑取酵母菌落,重悬于100plLGlu液体培养基中并过夜46培养。离心后,将酵母沉淀物重悬于10jLil无菌水中,并在50nl终体积中进行PCR反应,所述终体积含有1.5nl各种特定引物(100pmol/fi1)。PCR条件是941C变性10分钟的一个循环,94C变性30s、55"C退火1分钟、72匸延伸1.5分钟的35个循环,和最终延伸5分钟。然后对得到的PCR产物测序。f)对初步命中(primaryhit)进行再克隆使用Gateway方案(INVITROGEN)再克隆在初级筛选期间鉴定的阳性克隆的开放读码框(ORF)。如e)中所述,通过在酵母上进行的PCR扩增ORF。然后将PCR产物克隆进(i)酵母gateway表达载体,其带有半乳糖诱导型启动子、LEU2或KanR作为可选择标记物和2micron复制起点,和(ii)来自NOVAGEN的pET24d(+)载体中。通过测序(MILLEGEN)^ii得到的克隆。B)结果I-Crel是切割22bp假回文靶标的二聚体归巢内切核酸酶。与其天然耙标结合的I-Crel的结构分析显示在各单体中,八个残基与七个碱基建立直接相互作用(Jurica等,Mol.Cell.Biol.,1998,2,469-476)。根据这些结构数据,±8到10位核苷酸的>5^与I-Crel#^酸N30、Y33和Q38建立特异性接触(图3)。因此,在30、33和38位具有突变的新蛋白质能够展示新的切割模式,其中含有通过替换I-Crel所切割回文靼标的士8、±9和±10位而产生的64种靶标。另外,突变可改变参与与DNA威基直楱接触的残基数和位置。更特别地,除30、33、38以外但是在折叠蛋白上位于其附近的位置也可涉及与同一^对的相互作用。采取穷举性蛋白质文库和靶标文库方法来局部gtlt这部分DNA结合界面。首先,将I-Crel骨架从D75突变为N。D75N突变不影响蛋白质的结构,但是在it^达实验中降低了I-Crel的毒性.接着构建Ulib4文库将残基30、33和38随机化,并将常规M酸(N30、Y33和Q38)替换为12种^J^酸(A、D、E、G、H、K、N、P、Q、R、S、T)之一。得到的文库就蛋白质而言具有1728(对核酸而言5832)的理论复杂度。然后构建两个其他文库Ulib5和Lib4。在Ulib5中,将残基28、30和38随机化,并将常规氩基酸(K28、N30和Q38)替换为12种^J^酸(ADEGHKNPQRST)之一。得到的文库就蛋白质而言具有1728(对核酸而言5832)的复杂度。在Lib4中,首先用丝氨酸替换70位的精氨酸。然后将残基28、33、38和40随机化,并将常规氨基酸(K28、Y33、Q38和S40)替换为10种^J^酸(A、D、E、K、N、Q、R、S、T、Y)之一。得到的文库就蛋白质而言具有10000的复杂度。在初步筛选实验中,将来自Ulib4的20000个克隆、来自Ulib5的10000个克隆和来自Lib4的20000个克隆与64个测试菌林中的每一个交配,并测试二倍体的p-半乳糖苷酶活性。在第二轮筛选中将对64种靶标中至少一种显示切割活性的所有克隆一式四份地对64种乾标进行测试,并建立各个切割模式。然后通过PCR从各个菌林中扩增大范围核酸酶ORF并测序,鉴定了141个不同的大范围核酸酶变体。141个经确认的克隆显示非常多样的模式。这些新模式中的一些与野生型骨架共有一定的相似性,而许多其他的则完全不同。结果总结于图7。归巢内切核酸酶一般能够在其耙序列中接受一定的简并性,I-CreIN75骨架蛋白本身切割一系列4个靶标,对应于位置土10到土8中的aaa、aac、aag和aat三联体。用aaa、aag和aat,见察到强切割活性,而aac仅被微弱切割(且有时观察不到)。用其他蛋白质如I-CrelK28、N30、D33、Q38、S40、R70和N75以及I-CrelK28、N30、Y33、Q38、S40、R70和N75观察到相似的模式。对若干蛋白质如I-CrelR28、N30、N33、Q38、D40、S70和N75和I画CrelK28、N30N33、Q38、S40、R70和N75,aac不再被切割。然而,大量蛋白质展示非常不同的模式。用少量变体观察到对独特序列的切割。例如,蛋白I-CrelK28、R30、G33、T38、S40、R70和N75对不被野生型蛋白质切割的"ggg"乾标有活性,而I-CrelQ28、N30、Y33、Q38、R40、S70和N75切割被I-CrelN75切割的乾标之一aat。其他蛋白质有效地切割一系列不同的把标例如I-CrelN28、N30、S33、R38、K40、S70和N75切割ggg、tgg和tgt,CrelK28、N30、H33、Q38、S40、R70和N75切割aag、aat、gac、gag、gat、gga、ggc、ggg和ggt。被切割序列的数目在l到IO的范围内。总之,突变体切割37种新靶标,包括不被I画CreI切割的34种乾标和被I-Crel切割的3种耙标(aag、aat和aac,图7)。实施例2:用于^Lit切割来自RAG1或RAG2基因的新大范围核酸酶的策略如前所述(Arnould等,J.Mol.Biol.,2006,355,443-458)鉴定第一系列I-CreI变体,其在I-Crel的44、68、70、75和/或77位具有至少一个替换,并能够切割在±3到5位中具有变异的突变体I-Crel位点。如实施例1中所述鉴定笫二系列I-Crel变体,其在I-Crel的28、30、33位或28、33、38和40位含有至少一个替换,并能够切割在士8到10位具有变异的突变体I-CreI位点。该变体的切割模式在图7中表示。28、30、33、38和40位与44、68和70位位于相同的DNA结合折叠上,并且没有结构证据显示它们会独立作用。然而,这两组突变明显地处于该折叠(图8)中位于DNA靶标的不同区域附近的空间上分离的区域中。这些数据表明I-CreI包含两个独立的功能亚基,其可组合以切割新的嵌合靶标。嵌合耙标在士3到5位和±8到10位包含与各亚结构域结合的核苦酸。通过使用位于目的基因(RAG基因)中的耙标证实了该假说。被I-Crel变体切割的靶标是被I-CreI切割的回文序列C1221的24bp衍生物。然而,与其DNA耙标结合的I-CreI的结构表明,这些耙标的两个外部碱基对(-12和12位)对结合和切割没有影响(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.和B丄.Stoddard,NucleicAcidsRes.,2001,29,3757-3574;Chevalier等,J.Mol.Biol"2003,329,253-269),在^Mf究中,只考虑-ll到ll位。因此,在RAG1和RAG2基因中鉴定的乾标系列以22bp序列而不是24bp来定义。1)RAG1.10RAG1.10是位于人RAG1基因(登录号NCJ)00011.8,836546139到36557877位)中5270位的22bp(非回文)靼标(图9),其在RAG1编码外显子上游7bp(图4)。切割RAG1.10的大范围核酸酶可用于矫正切割位点附近的突变(图1A)。因为当距DSB的距离提高时基因矫正的效率降低(Elliott等,Mol.Cell.49Biol.,1998,18,93-101),所以该策略对位于切割位点500bp内的突变最为有效。或者,相同的大范围核酸酶可用于敲入外显子序列,这可在RAG1基因座上恢复功能性RAG1基因(图1B)。该策略可用于切割位点下游的任何突变。RAG1.10—部分是被先前鉴定的大范围核酸酶切割的10GTT_P、10TGG_P和5CAG—P和5GAG_P耙标(图9)的混杂物(patchwork)(图7)。因此,RAG1.10可被得自先^"鉴定的这些大范围核酸酶的组合突变体切割。因此,为了^SE该假说,从RAG1.10衍生了两个回文乾标RAG1.10.2和RAG1.10.3(图9)。因为RAG1.10.2和RAG1.10.3是回文的,所以它们应当被同二聚体蛋白质切割。在第一步中,设计了能够作为同二聚体切割RAG1.10.2和RAG1.10.3序列的蛋白质(实施例3和4)。在第二步中,将实施例3和4中获得的蛋白质共表达,获得切割RAG1.10的异二聚体(实施例5)。2)RAG2.8RAG2.8是位于人RAG2基因(登录号NC—000011.8,36576362到36570071位的互补序列)中968位的22bp(非回文)耙标(图10),其位于RAG2内含子的起始部分中(图5)。切割RAG2.8的大范围核酸酶可用于IJL/v外显子序列,这会在RAG2基因座处恢复功能性RAG2基因(闺1B)。该策略可用于切割位点下游的任何突变(图5)。RAG2.8—部分是被先前鉴定的大范围核酸酶切割的IOGAA一P、10TGT_P和5TAT_P和5CTC_P靶标(图10)的混杂物(图7)。因此,RAG1.10可被得自^前鉴定的这些大范围核酸酶的组合突变体切割。与RAG1.10相反,RAG2.8与C1221差异在于4bp中央区。根据与其靶标结合的I-CreI蛋白质的结构,4个中央^agJ寸(-2到2位)不与I画CreI蛋白接触(Chevalier等,Nat.Struct.Biol"2001,8,312-316;ChevalierB.S.和B丄.Stoddard,NucleicAcidsRes"2001,29,3757-3574;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此,这些位置上的>5^不应影响结合效率。然而,它们能够影响由该区域边缘处的两个缺口所引起的切割。因此,首先用来自C1221的gtac序列替换-2到2的ggaa序列,得到靼标RAG2.8.2。然后从RAG2.8.2衍生两个回文靼标RAG2.8.3和RAG2.8.4。因为RAG2.8.3和RAG2.8.4是回文的,所以它们应当被同二聚体蛋白质切割。在第一步中,设计了能够作为同二聚体切割RAG2.8.3和RAG2乂4序列的蛋白质(实施例6和7),随后将它们共表达以获得切割RAG2.8的异二聚体(实施例8)。在该情况下,未发现切割RAG2.8靶标的异二聚体。选择并l^精制一系列切割RAG2.8.3或RAG2.8.4的突变体。将选择的突变体随机诱变,并用于形成新的异二聚体,针对RAG2.8耙标筛选所述异二聚体(实施例9和10)。可鉴定到展示显著切割活性的切割RAG2.8耙标的异二聚体。实施例3:产生切割RAG1.10.2的大范围核酸酶该实施例显示,I-Crel突变体能够切割来自RAG1.10靶标左侧部分的回文形式RAG1.10.2DNA把序列(图9)。本实施例中描述的把序列是22bp回文序列。因此,仅以前ll个核苷酸描述它们,1^是仅用于表示它们的后缀—p(例如,乾标RAG1.10,2还被记为tgttctcaggt—P;SEqidno:212)。RAG1.10,2^t士l、±2、±3、±4、±5和±11#与5CAG一P才目似,在±1、±2、±8、±9和±10位与10GTG—p才目4以。推领,J位置士6、±7和±11对结合和切割活性几乎没有影响。如Arnould等,J.Mol.Biol.,2006,355,443-458中所述,先前通过在44、68、70、75和77位诱变I-Crel获得了能够切割5CAG_P(caaaaccaggt—P;SEQIDNO:210)的突变体。通扭28、30、32、33、38、40位诱变I-CrelN75和D75获得了能够切割10GTT—P靼标(:cgttacgtcgt—P)的突变体(实施例i和图7)。因此,组合这些突£体会允许切割RAG1.10.2耙标。两组蛋白质均在70位被突变。然而,推测I-CreI中存在两个可分离的功能性亚结构域。这意味着该位置对靶标碱基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割RAG1.10.2扭标,将来自切割5CAG—P的蛋白质中44、68、70、75和77位的突变与来自切割10GTG—P的蛋白质中30、32、33、38和40位的突变组合。A)材料和方法a)构建靶标载体如下克隆靼标侧翼是gateway克隆序列的对应于靼序列的寡核苷酸从Proligo定购(例如5'tggcatacaagttttgttctcaggtacctgagaacaacaatcgtctgtca3'(SEQIDNO:225),用于RAG1.10.2靼标)。使用GatewayR方案(INVITROGEN),将通过PCR扩增单链寡核苷酸而产生的双链乾DNA克隆进酵母才艮告载体(pCLS1055,图11)中。将酵母报告载体转化进酿酒酵母菌林FYBL2國7B(MATa,ura3A851,trplA63,leu2Al,lys2A202)中。b)构建组合突变体如实施例1和图7以及Arnould等,丄Mol.Biol.,2006,355,443-458中所述,分别针对10TGC—P和5TTT—P靼标鉴定切割10GTG—P或5CAG_P的I-Crel突变体。为了产生告^"来自两个系列的突变的I-Crel衍生编码序列,进行扩增I-Crel编码序列5,端(1-43位氨基酸)或3,端(39-167位)的独立的重叠PCR反应。对5'和3'端二者而言,都使用对载体(pCLS0542,图12)具有特异性的GallOF或GallOR引物和对编码序列氨基酸39-43的I-Crel序列具有特异性的引物(assF5,-ctannnttgaccttt-3,(SEQIDNO:226)或assR5,-aaaggtcaannntag-3,(SEQIDNO:227))进行PCR反应,其中nnn编码残基40。将得自使用相同引物进行的扩增反应并对残基40具有相同编码序列的PCR片段合并。然后,将得自使用引物GallOF和assR或assF和GallOR的Jl应的各个PCR片段库以等摩尔比混合。最后,使用高效LiAc转化方案(Gietz和Woods,MethodsEnzymol,2002,350,87-96),使用两种重叠PCR片段各约25ng以及25ng经Ncol和Eagl消化而线性化的载体DNA(pCLS0542)转化酵母酿酒酵母菌抹FYC2-6A(MATa,trplA63,leu2Al,his3A200)。通过在酵母中的同源重组来产生含有两组突变的完整编码序列。c)交配表达大范围核酸酶的克隆并在酵母中筛选实验步骤如实施例1中所描述,只是使用低网格密度(约4个点/cm2)。d)突变体测序为了回收突变体表达质粒,^吏用标准方案拔:取酵母DNA并用于转化大肠杆菌。然后通过MILLEGENSA对质粒进行突变体ORF的测序。或者,通过PCR从酵母DNA中扩增ORF(Akada等,Biotechniques,2000,28,668-670)并通过MILLEGENSA直接对PCR产物进行测序。B)结果通过将I-CrelN75或D75骨架中44、68、70、75和77位的突变与30、33、38和40位突变组合来构建I-Crel组合突变体,产生有1300复杂度的文库。组合的实例在表V中展示。将该文库转化进酵母中,并对2300个克隆(多样性的1.8倍)筛选针对RAG1.10.2DNA靶标(:tgttctcaggt—P;SEQIDNO:212)的切割。发现了64个阳性克隆,其在测序和二次筛选验证后证实对应于32种不同的新内切核酸酶(表V)。阳性的实例在图13中展示。表V:组合变体对RAG1.10.2靼标的切割*44、68、70、75和77位的氨基酸(AYSYK代表A44、28、30、32、33、(KRSNQS代表K28、R3038和4(H立的氨基酸、S32、N33.Q38和S40)Y68、S70、Y75和K77)KRSNQSKKSAQS鹏CQSKNSRTSKRDYQSKNSHGSKSSCQSKKSSQSKTSGQSAYSYK+++++++ASSDR++++RYSDT++++TYSYR+++KYSYN+AR鹏A咖IARENIARHNINRSYNAESYKATSDRWYSYK+MYSYR++QASDRTRSYYAASYKSYSWNRGNIMESRR服翻RRENIA,AASDR+RYSDQ*仗艮示1300个组合中的250个。+表示功能性组合。53实施例4:产生切割RAG1.10,3的大范围核酸酶该实施例显示,I-Crel变体能够切割来自RAG1.10.1靶标右侧部分的回文形式RAG1.10.3DNA耙序列(图9)。该实施例中描述的所有把序列都是22bp回文序列。因此,仅用前ll个核普酸描述它们,IC^是后缀—P;例如,乾标RAG1.10,3可称作ttggctgaggt—p;SEQIDNO:213。RAG1.10,3在士1、±2、±3、±4、±5和±7位与5GAG—P相似,在±1、±2、±7、±8、±9和±10位与10TGG—P相似。推效'J士6和±11位对结合和切割活性几乎没有影响。如Arnould等,J.Mol.Biol.,2006,355,443-458中所述,先前通过在44、68、70、75和77位诱变I-Crel获得了能够切割5GAG—P的突变体。如实施例l中所述,通过在28、30、32、33、38、40和70位诱变I-CrelN75和D75获得了能够切割10GTG—P靶标的突变体(图7)。因此,组合这些突变体对会允许切割RAG1.1(U耙标。两组蛋白质均在70位被突变。然而,推测I-CreI包含两个可分离的功能性亚结构域。这意味着该位置对靶标减基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割RAG1.10,3靶标,将来自切割5GAG—P(caaaacgaggt—P;SEQIDNO:210)的蛋白质中44、68、70、75和77位的突变与来自切割10TGG—P(ctggacgtcgt—P;SEQIDNO:加9)的蛋白质中28、30、32、33、38和40位的突变相组合。A)材料和方法见实施例3。B)结果通过将I-CrelN75或D75骨架上44、68、70、75和77位的突变与28、30、33、38和40位的突变组合来构建I-Crel组合突变体,产生具有1215复杂度的文库。组合的实例在表VI中展示。将该文库转化进酵母中,并对2300个克隆(多样性的1.9倍)筛选针对RAG1.10.3DNA靶标(ttggctgaggt—P;SEQIDNO:"3)的切割。发现了88个阳性克隆,在测序和二次筛选m^后发现其对应于27种不同的新内切核酸酶(见表VI)。阳性实例在图14中展示。表VI:组合变体对RAG1.10,3扭标的切割女44、68、70、75和77位的氨基酸(KGA代表K44、G68和A70)<table>tableseeoriginaldocumentpage55</column></row><table>*钇艮示了1215个组合中的250个。+表示功能性组合。实施例5:产生切割RAG1.10的大范围核酸酶在实施例3和4中鉴定了能够切割各回文RAG1.10衍生靶标(RAG1.10.2和RAG1.10.3)的I-Crel突变体。在酵母中共表达这些突变体对(一个切割RAG1.10.2,—个切割RAG1.10.3)。共表达后,应当存在三种活性分子种类两种同二聚体和一种异二聚体。测试应当形成的异二聚体是否切割RAG1.10靶标。A)材料和方法a)在卡那霉素抗性载体中克隆突变体为了在酵母中共表达两种I-Crel突变体,在卡那霉素抗性酵母表达载体(pCLS1107,图15)中亚克隆切割RAG1.10.2序列的突变体。通过使用亮氨酸载体(pCLS0542)和卡那霉素载体(pCLS1107)的通用引物(GallOF和GallOR)进行的PCR反应来扩增突变体。使用高效LiAc转化方案,使用约25ngPCR片段和经DraIII和NgoMIV消化而线性化的25ng载体DNA(pCLS1107)转化酵母酿酒酵母菌林FYC2-6A(MATa,trplA63,leu2Al,his3A200)。通过在酵母中体内同源重组来产生I-Crel突变体的完整编码序列。b)突变体表达用pCLS1107表达载体中编码切割RAG1.10.2耙标之突变体的DNA转化表达切割RAG1.10.3乾标之突变体的酵母菌林。在-LGlu+G418培养基上选择转化体。c)交配大范围核酸酶共表达克隆并在酵母中筛选实验步骤如实施例1中所述,只是使用低网格密度(约4个点/cm2)。B)结果共表达切割RAG1.10.2和RAG1.10.3的突变体在大部分情况下导致对RAG1.10乾标的有效切割(图16X功能性组合总结于表VII中。表VII:导致RAG1.10乾标切割的组合切割RACl.10.3的突变体28、30、32、33,38,40/44、68、70、75、77位的氨基酸(NnSSRR/ARTNI代表N28、N3D、S32、S33、R38.H40/A44、K68、T70、N75和I77)切割RACl-lO.2的突变体28,30,32、33-38、40/44、68、70,75和77位的氨基酸(KSAQS/AYSYK代表28、UO、S32、A33、()38、S40/A44、Y68、S70、Y75和K77)<table>tableseeoriginaldocumentpage56</column></row><table>十表示功能性组合实施例6:产生切割RAG2.8.3的大范围核酸酶该实施例显示,I-Crel突变体能够切割来自RAG2.8.2乾标左侧部分的回文形式RAG2.8.3DNA靼序列(图10)。该实施例中描述的耙序列是22bp回iL^列。因此,仅用前ll个核苷酸描述它们,随后^缀一P,例如乾标RAG2.8.3也会净皮记为tgaaactatgt_P;;SEQ1DJNO:219。RAG2.8,3^±1、±2、±3、±4、±5、±6、±7、±8和±9位上与5TiVT—P相似,在±1、±2、±6、±7、±8、土9和土10位与10GAA—P相似。如Arnould等,J.Mol.Biol"2006,355,443-458中所述,先前通ii在44、68、70、75和77位诱变I-Crel获得了能够切割5TAT—P的突变体。通过在28、30、33、38、40和70位诱变I-CrelN75获得了能够切割10GAA—P靶标的突变体(实施例1和图7)。因此,组合这些突变体对会允许切ijRAG2.8.3靼标。两组蛋白质均在位置70被突变。然而,推测I-Crel中存在两个可分离的功能性亚结构域。这意味着该位置对靶标威基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割RAG2.8.3靶标,将来自切割5TAT—P(caaaaccctgtJP)的蛋白质中44、68、70、75和77位的突变与来自切割10GAA—P(cgaaacgtegt一P)的蛋白质中28、30、33、38和40位的突变相组合。A)材料和方法见实施例3。B)结果通过将I-Crel骨架上44、68、70、75和77位的突变与28、30、33、38和40位突变组合来构建I-Crel組合突变体,产生具有648复杂度的文库(见表VIII)。将该文库转化进酵母中,并对1728个克隆(多样性的2.7倍)筛选针对RAG2.8DNA靶标(tgaaactatgt—P;SEQIDNO:184)的切割。发现了24个阳性克隆,在测序和二次筛选iHit后鉴定了表vin中列出的11种组合突变体。还鉴定了具有额外突变的突变体如KNWGQS/QRJRDL、KNESOS/ORRDI和KNRPOS/ORRDI(表X)。这些突变体很可能是得自组合过程期间的PCR假象(artefact)(见材料和方法)。阳性实例在图17中展示。57表VIII:组合变体对RAG2.8,3靶标的切割免<table>tableseeoriginaldocumentpage58</column></row><table>实施例7:产生切割RAG2.8.4的大范围核酸酶该实施例显示,I-CreI变体能够切割来自RAG2.8.2靶标右侧部分的回文形式RAG2.8.4DNA乾序列(图10)。该实施例中描述的所有耙序列都是22bp回文序列。因此,仅用前ll个核苷酸描述它们,1^是单独表示它们的后缀—P(例如耙标RAG2.8.4也会被称作ttgtatctcgt—P;SEQIDNO:220)。RAG2,8.4在士1、±2、±3、±4、±5和±7位与5CTC—P沖目4以,在±1、士2、±3、土4、±7、±8、土9和士10位与IOTGT一P相似。推测±6和±11位对结合和切割活性几乎没有影响。如Arnould,J.Mol.Biol.,2006,355,443-458中所述,先前通过在44、68、70、75和77位诱变I-CrelN75获得了能够切割5CTC_P(caaaacctcgt—P;SEQIDNO:217)的突变体。如实施例1中所述,通过在28、33、38、40和70位诱变I-CrelN75获得了能够切割10TGT—P靶标(ctgtacgtcgt—P;SEQIDNO:215)的突变体(图7)。因此,组合这些^变体对会允许切割RAG2.8.4靼标。两组蛋白质均在位置70被突变。然而,推测I-Crel包含两个可分离的功能性亚结构域。这意味着该位置对靶标的减基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割RAG2.8.4把标,将来自切割5CTC—P的蛋白质中44、68、70、75和77位的突变与来自切割10TGT—P的蛋白质中28、33、38和40位的突变相组合(表IX)。A)材料和方法见实施例3。B)结果在本实施例中使用并切割10TGT一P靼标或5CTC一P耙标的I-Crel突变体在表IX中列出。通过将I-Crel骨架上44、68、70、75和77位的突变与28、33、38和40位突变组合来构建I-Crel组合突变体(表IX),产生具有290复杂度的文库。将该文库转化进酵母中,并对1056个克斷多样性的3.6倍)筛选针对RAG2.8.4DNA乾标(ttgtatctcgt—P;SEQIDNO:2加)的切割。发现了105个阳性克隆,并在测序和二次篩选^^后鉴定了29种组合突变体(表IX)。还鉴定了具有额外突变的突变体如-丽SSRR7KYS丽(表x)-KNPPQS/QRRDI(表x)-國KNRWQS/QRRDI(表x)-KNSYOS/RYS丽(图18)_認SSRS/QYSYN(图18)画丽SSRK/TRSRY83S(图18)-NNSSRR7TYSRV140A(图18)-NNSSRR/KYSYN54L(图18)这些突变体4艮可能得自组合过程期间的PCR假象(见材料和方法)。阳性实例在图18中展示。60表IX:组合变体对RAG2.8.4把标的切割免44、68、70、75和77位的氨基酸(AYSRV代表A44、Y68、S70、R75和V77)28、30、32、33、38和4(H主的氨基酸(ANRK^R表A28、N30、S32、N33、R38和K40)ANS肌KNNSSRR训SSRKQNSSRKKNSSRSARDNIARSRYASSDRAYSNTAYSWHASRY朋DNIH卿lKANNIKASN1KA頂KGSNIK,K咖lK似MlKQSNIK剛K咖l++哪NIK剛lK咖lKRTWIKS訓KSSNIKSTNI(CTANIicr咖KTSN1+KYSM++KYSYM++++NESRK貼SRRNH训IMYS附QH腦Q咖lQRSYRRASNIRATNI朋SNIRNSNNR,R咖lR國RSGNIRSS训RSTNIRYSNI+R卿N+RYSMT+++SYSRITR柳TRSRST昭RY+TORA++++7YSRQ++TYSRV十表示功能性组合实施例8:产生切割RAG2.8.2的大范围核酸酶在实施例6和7中鉴定了能够切割各回文RAG2.8衍生乾标(RAG2.8.3和RAG2.8.4)的I-Crel突变体。在酵母中共表达这些突变体对(一个切割RAG2.8.3,一个切割RAG2.8.4)。共表达后,应当存在三种61活性分子种类两种同二聚体和一种异二聚体。测试应当形成的异二聚体是否切割RAG2.8和RAG2.8.2耙标。A)材料和方法见实施例5。B)结果共表达切割RAG2.8.3和RAG2.8.4的突变体在大部分情况下导致对RAG2.8.2靶标的有效切割(图19)。作为一般原则,当两种净皮表达的蛋白质给出作为同二聚体的强信号时,总是获得切割RAG2.8.2的功能性异二聚体(图19)。然而,这些组合均不能切割与RAG2.8.2序列仅有-1、1和2位的3bp不同的RAG2,8天然耙标(图10)。功能性组合总结于表X。表X:导致RAG2.8.2靼标切割的组合切割RAG2.8.4的突变体,28,30、32、33、38、40/44、68、70、75、77位的氨基酸胩SSRR/TYSRQ代表N28、固、S32、S33、R38、R40/T"、Y68、S70、R75和Q77切割RAG2.8.3的突变体28、30、32、33,38'40/44、68、70、75和77位的氨基酸(KNSRQY/QRSta代表K28、N30、S32、R33、Q38、Y40/Q44、R68、S70、N75和I77)KNSRQY/QRSNI,RQQ/N國KNSRQQ/ARAN1鹏RQQ/A,KNSRQQ/ATQNI鹏RQQ/A謹,GQS,卿DIKNESQS'QRRDIKNRPQS/QRRDINNSSRR/TYSRQ++++QMSSRK/KYSYN++NNSSRR/KYSNN+++QNSSRK/TRSRY++++++KNPPQS/QRRDI+++K麵QS/QRROI++++QMSSRK/RYSNT+++++NNSSRK/RYSNN++++隨SRK/RYSNT+*粗体的突变体是在实施例6和7中具有预料外突变的突变体。**+表示功能性组合实施例9:通过对切割RAG2.8.3的蛋白质进行随机诱变并与切割RAG2.8.4的蛋白质进行装配来产生切割RAG2.8的大范围核酸酶62已通过将切割回文RAG2.8.3和RAG2.8.4耙标的突变体进行装配而鉴定了能够切割非回文RAG2.8.2靶标的I-Crel突变体(实施例8)。然而,这些组合均不能够切割与RAG2.8.2的差异仅在于-1、1和2位的3bp的RAG2.8。因此,对切割RAG2.8.2的蛋白组合进行了诱变,并筛选了切割RAG2.8的变体。根据与其靶标结合的I-Crel蛋白质的结构,4个中央碱-2到2位)不与I-Crel蛋白接触(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3574;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此,难以合理地选择一组位置来诱变,在蛋白质的C端部分(最后83个氨基酸)或在整个蛋白质上进行了诱变。随机诱变产生高复杂度文库。因此,为了限制待测试变体文库的复杂度,仅对切割RAG2.8.2的异二聚体的两个组件之一进行诱变。因此,在笫一步中诱变切割RAG2.8.3的蛋白质,在第二步中评价与切割RAG2.8.4的蛋白质共表达时它们是否能够切割RAG2.8。A)材料和方法通过对所选经^Ut的切割RAG2.8.3靼标的大范围核酸酶的池进行随机裔变来创建新的I-Crel变体文库。如JBSdNTP-诱变试剂盒中JenaBioscienceGmbH的方案所述,通过PCR在两步式PCR方法中进行诸变,所述PCR使用1\1112+或作为8-氧代-dGTP和dPTP的dNTP衍生物。所使用的引物是preATGCreFor(5,-gcataaattactatacttctatagacacgcaaacacaaatacacagcggccttgccacc-3',SEQIDNO:228)和ICrelpostRev(5,-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccg&3',SEQIDNO:"9)。在酵母中,在线性化的pCLS1107载体(图15)中体内克隆新的文库,所述载体具有半乳糖诱导型启动子、作为可选择标记的Kai^和2micron复制起点。通过测序验证阳性结果克隆(MILLEGEN)。使用亮氨酸载体(pCLS0542)和卡那霉素载体(pCLS1107)的通用引物preATGCreFor和ICrelpostRev,通过PCRJl应扩增突变体池。使用高效LiAc转化方案,使用约75ngPCR片段和75ng以DraIII和NgoMIV消化线性化的载体DNA(pCLS1107)转化酵母酿酒酵母菌林FYC2-6A(MATa,trplA63,leu2Al,his3A200),并选择卡那霉素抗性菌落。通过在酵母中体内同源重组来产生I-Crel突变体完整编码序列的文库。然后使用Q-Pix2机器人(Genetix)挑取酵母菌落,并与相反交配型的酵母菌林(FYBL2-7B:MATa,ura3A851,trplA63,leu2Al,lys2A202)分别交配,所述酵母菌林含有克隆进pCLS1055酵母报告载体(图ll)的RAG2.8靶标,并表达切割被克隆进pCLS0542(图12)的RAG2.8.4靶标的突变体。如先前所述(Arnould等,2006,J.Mol.Biol.355,443-458)或如实施例1中所述进行交配。B)结果将切割RAG2.8.3的三种突变体(I-Crel33R、40Q、44A、70A和75N,或I-Crel33R、40Q、44A、70H和75N以及I画CreI33R、40Q、44A、70N和75N,根据表IX的命名法也称作KNSRQQ/ARANI、KNSRQQ/ARHNI和KNSRQQ/ARNNI)合并,随机诱变并转化进酵母(图20)。然后分别挑取2280个转化克隆并与酵母菌株交配,所述酵母菌林(i)在报告质粒中含有RAG2.8靶标,(ii)表达切割RAG2.8.4把标的变体,其选自实施例7中所述的变体。使用两个这样的菌株,其表达I-Crel28N、33S、38R、40K、44R、68Y、70S、75N和77N(或NNSSRK7RYS丽)突变体,或者表达I-Crel28Q、33S、38R、40K、44R、68Y、70S、75N和77T(或QNSSRK/RYSNT)突变体(见表XI)。发现24个克隆在与这样的酵母菌林交配时引发对RAG2.8靶标的切割。在对照实验中,发现不与NNSSRK/RYSNN或QNSSRK/RYSNT蛋白共表达时这些克隆均不引发对RAG2.8的切割。因此,24个阳性克隆含有与NNSSRK/RYSNN或QNSSRK/RYSNT形成异二聚体时能够切割RAG2.8的蛋白质。这些异二聚体突变体的实例列于表XI中。阳性实例在图20中展示。表XI:导致RAG2.8耙标切割的组合+:功能性组合。*随机诱变引起的突变为粗体实施例10:通iW切割RAG2.8.4的蛋白质进行随机i秀变并与切割RAG2.8.3的蛋白质共表达来产生以更高效率切割RAG2.8的大范围核酸酵通过将切割回文RAG2.8.3的突变体与切割回文RAG2.8.4靶标的突变体进行it^达来鉴定能够切割非回文RAG2.8靶标的I-Crel突变体(实施例9)。为了提高能够切割非回文RAG2.8耙标的I-Crel突变体的数目和效率,诱变切割回文RAG2.8.4靶标的突变体,并筛选在与切割RAG2.8.3靼标的突变体共表达时高效切割RAG2.8的新变体。A)材料和方法实验步骤与实施例9中所述的相似。B)结果_经优化的突变体RAG2.8.3_I-Crel33R40Q44A66H70A75NI-Crel33R40Q44A70A75N化0R131Ri-Crel33R40Q44A70A75N114PI-Crel33R40Q44A70A75N115T161Pl-Crel33R40Q術0A75N151A161Al-Crel33R40Q術0A75N154NI-Crel33R40Q44A70A75N160RI-Crel33R40Q44A70A75N85R94L129A153G15服160Rl-Crel33R40Q44A70A75N86D96E103D129Al-Crel33R40Q44A70H75N103Dl-Crel33R40Q44A70H75N114P-Crel33R40Q44A70H75N"7G161P-Crel33R40Q44A70H75N147A160R扁Crel33R40Q44A70H75N87U32T化1A-Crel33R40Q44A70H75N87L94L125A157G化0R-Crel33R40Q44A70N75N114P155P-Crel33柳Q44A70N75N151A159R-Crel33R40Q44A70N75N160R-Crel33R40Q44A70P75NOrel33R40Q44A70N75N103S129A159RCrel33R40Q44A70N75N132V-Crel33R40Q44A70A75N86D96E103D129A-Crel33幽44A70N75N103S129A159R-Crel33R40Q44A70N75N132VPNSA讓SSNO)JizN9卜so卜A99y寸寸MO寸ysssss8sla-o-lla!o-l寸.8dya,sw65将切割RAG2.8.4的三种突变体(I-Oel28Q33S38R40K44R68Y70S75N77T'、28N33S38R40K44R68Y70S75N77N:、R>el28N33S38R40K44R68Y70S75N77,根据表IX的命名法也称为QNSSRK/RYSNT.、NNSSRK/RYS丽和丽SSRK/RYSNTKNSRQQ/ARHNI和KNSRQQ/ARNM)合并,随机诱变并转化进酵母。然后将6696个转化克隆与酵母菌林交配,所述酵母菌林(i)在报告质粒中含有RAG2.8靶标,(ii)表达切割RAG2.8.3靶标的优化变体,其选自实施例9中鉴定的变体。使用两种菌林,其表达H>el33R40Q44A70N75N/103S129A159R或I-Cmf33R40Q44A70N75N/132V突变体(见表XI)。发现多于一百九十个克隆在与这样的酵母菌林交配时引发对RAG2.8耙标的切割。在对照实验中,发现不与这两个蛋白质中任一共表达时,这些克隆均不引发RAG2.8的切割。因此,多于一百九十个阳性克隆舍有在与I-Oel33R40Q44A70N75N/103S129A159R和I-Oel33R40Q44A70N75N/132V形成异二聚体时能够切割RAG2.8的蛋白质。这些异二聚体突变体的实例列于表XII中。将阳性克隆重新排列并在第二轮筛选中一式四份进行测试,如图23所示。表XII:导致切割RAG2.8靼标的组合切割RAG2.8-4的经优化的突变体I-Oel28N33S38R40K44R68Y70S75Y77N28N33S38R40K44R68Y70S75N77T6DU6R28N33S38R40K4収68Y70S75N77T96E28CJ33S38R40K44R68Y70S75N77T117G139RI-Crel28N33S38R40K144R68Y70S75N77T105A28N33S38R40K44R68Y70S75N77T43L28N33S38R40K44R68Y70S75Y77N49A87L28N33S38R40K44R68Y70S75N77T5化I-Crel28N33S38R40K44R68Y70S75N77T4N50R87L96RI-C,'e[28N33S38R40K44R68Y70S75N77T43LW8V买施例11:通过对切割RAG1.10.2靼标的蛋白质进行随机诱变并与切割RAG1.10.3靼标的蛋白质共表达来改进切割RAG1.10DNA序列的大范围核酸酶通过将切割回文RAG1.10.2和RAG1.10.3耙标的突变体进行装配而IIVa;ISSIP.o-IAcsPO-I66鉴定了能够切割RAG1.10靶标的I-Crel突变体(实施例5)。接着,为了改进RAG1.10切割效率,对切割RAG1.10DNA序列的组合突变体进^i秀变,并筛选对该靶标显示更强切割的变体。根据与其靶标结合的i_Crei蛋白质的结构,4个中央#对(-2到2位)不与I國CreI蛋白质接触(Chevalier等,Nat.Struct.Biol"2001,8,312-316;ChevalierB.S.和B丄.Stoddard,NucleicAcidsRes"2001,29,3757-3574;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此难以合理地选择一组位置来诱变,在整个蛋白质上进行了随机诱变。随机诱变产生高复杂度的文库。因此,为了限制通过诱变产生的待测试变体文库的复杂度,仅对切割RAG1.10靶标的异二聚体的两个组件之一进行诱变。因此,在第一步中诱变切割RAG1.10.2靼标的蛋白质,在第二步中评价在与切割RAG1.10.3DNA序列的蛋白质共表达时它们是否能够改进RAG1.10切割效率。A)材料和方法实验步骤与实施例9中所述的相似。B)结果将切割RAG1.10.2序列的五个突变体(KRSNQS/AYSYK、KKSAQS/AYSYK、KRSNQS/TYSYR、KNSRTS/AYSYK和KKSGQS/AYSYK、)合并,随机诱变并转化进酵母中。根据实施例3表V的命名法,用其28、30、32、33、38、40/44、68、70、75和77位氨基酸的单字母代码来描述这五个突变体。然后将2280个转化克隆与酵母菌林交配,所述酵母菌林含有(i)报告质粒中的RAG1.10靶标,(ii)表达质粒,其含有切割RAG1.10.3靶标的突变体(KHSMAS/ARSYT,见实施例4的表VI)。发现80个克隆比在与该酵母菌林交配后比原始RAG1.10.2突变体更有效地切割RAG1.10靶标。然后将这80个突变体重新排列(重新排列平板的孔A1到G8,见图24)并进行發逸筛选,所*逸筛选在与第一次筛选完全相同的条件下进行。从图24中可以看出,一些突变体能够与KHSMAS/ARSYT形成异二聚体,所述异二聚体对RAG1.10靶标显示更强的切割活性。对80个阳性克隆的测序使得可以鉴定相同的克隆,最终鉴定了6种给出更高RAG1.10切割水平的不同的新突变体。它们均列于表X1II中。五种突变体与与最初的KRSNQS/AYSYK密切相关,并且与该突变体的差异仅为一个或两个额外的替换。相反,与KRSNQS/AYSYK在75和77位不同并且与KRSNQS/TYSYR在44和75不同位的KHSNQS/AYSDR蛋白在新位置中不具有突变,这与最初被^it获得RAG1.10,2切割酶的蛋白质不同(见实施例3)。表XIII:对RAG1.10显示强切割活性的功能性突变体组合实施例12:通过引入单个G19S替换来改进切割RAG1.10DNA耙标的大范围核酸酶将G19S突变引入切割RAG1.10.2靶标(见实施例11,表XIII和图24)的KRSNQS/AYSDR突变体(下文称作M2)和切割RAG1.10.3靼标(见实施例4,表VI)的NNSSRE/YRSQV突变体(下文称作M3)中。然后在哺乳动物细胞中,在染色体外和染色体测定中针对RAGl.lO、RAG1.10.2和RAG1.10.3测试这些新的蛋白质。A)材料和方法a)引入G19S突变使用两组引物进行两个重叠PCR反应第一个片段使用引物GallOF(5,-gcaactttagtgctgacacatacagg-3,;SEQIDNO:223)和G19SRev(5,-gatgatgctaccgtcagagtccacaaagccggo3,;SEQIDNO:230),第二个片段使用引物G19SFor(5,-gccggctttgtggactctgacggtagcatcato3,;SEQIDNO:231)和GallOR(5,-acaaccttgattggagacttgaco3,;SEQIDNO:224)。使用高效LiAc转化方案(Gietz,R.D.和R.A.Woods,MethodsEnzymol"2002,350,87-96),4吏用约25ng每种PCR片段和75ng以Ncol和Eagl消化线性化的载体DNA(pCLS0542)转化酿酒酵母菌林FYC2-6A(MATa,trplA63,leu2Al,his3A200)。在酵母中通过体内同源重组来产生含有G19S突变的完整编码序列。切割RAGl.10.2的经优化的突变体重新排列平板上的位置序列B12I習OeIKRSNQS/AYSYK+E117GD3KRSNQS/AYSYK+K107R,D153GE7I-OelKRSNQS/AYSDREllI-CMKRSNQS/AYSYK+K34T,El17KFlI-CrelKRSN(JS/AYSYK+K100RG6I-OelKRSNQS/AYSYK+A150TC1ASW、SVSSKW)b)突变体测序为了回^达突变体的质粒,使用标准方案提取酵母DNA并用于转化大肠杆菌。然后通过MILLEGENSA对质粒进4亍突变体ORF的测序。c)将RAG1.10G19S突变体克隆进哺乳动物表达载体中使用以下引物通过PCR扩增各个突变体ORF:CCM2For:(5,-aagcagagctctctggctaactagagaacccactgcttactggcttatcgaccatggccaataccaaatataacaaagagttcc-3,;SEQIDNO:232)和CCMRevBis:(5,-ctgctotagattagtcggccgcc怨ggaggatttcttC"3,;SEQIDNO:233)。用限制性酶Sacl和Xbal消化PCR片段,然后连接进也经Sacl和Xbal消化的载体pCLS1088(图25)中。通过测序(MILLEGEN)lHit得到的克隆。d)在用于染色体外测定的载体中克隆不同的RAG1.10耙标如下克隆目的靶标从Proligo定购侧翼是gateway克隆序列的对应于耙序列的寡核苷酸。使用Gateway方案(INVITROGEN),将通过PCR扩增单链寡核苷酸而产生的双链耙DNA克隆进CHO报告载体(pCLS1058,图26)中。e)CHO细胞中的染色体外测定根据供应商的方案(QIAGEN)用Polyfect转染试剂转染CHO细胞。在每个测定中,将150ng靶标载体与两种突变体各12.5ng(12.5ng切割回文B2M11.2耙标的突变体和12.5ng切割回文B2M11.3耙标的突变体)共转染。转染后72小时,去除培养基并添加150jil裂解/显色(revdation)緩冲液用于p-半乳糖苷酶液体实验(1升緩冲液含有100ml裂解緩冲液(Tris-HCl10mMpH7.5、NaCl150mM、TritonX1000.1%、BSA01mg/ml、蛋白酶抑制剂)、10mlMg100x緩冲液(MgCl2100mM、|5-巯基乙醇35%)、110mlONPG8mg/ml和780ml磷酸钠0.1MpH7.5。在37■C孵育后,在420nm处测量吸光度。整个过程在自动化的Velocity11BioCel平台上进行。f)CHO细胞中的染色体测定将带有报告系统的CHO细胞系以每10cm平皿2x105个细胞的密度接种在完全培养基(Kaighn,s改良F-12培养基(F12-K),补充有2mML-谷氨酰胺、青霉素(100UI/ml)、链霉素(100照/ml)、两性霉素B(Fongizone)(0.25ng/ml)(INVITROGEN-LIFESCIENCE)和10%FBS(SIGMA-ALDRICHCHIMIE)中。第二天,用Polyfect转染试剂(QIAGEN)转染细胞。简言之,将O.lnglacz修复基质载体pCLS1058与多种量的大范围核酸酶表达载体共转染。在37t:孵育72小时后,在0.5%戊二醛中于4匸下将细胞固定10分钟,在含0.02%NP40的100mM磷酸盐緩冲液中洗涤两次,并用以下染色緩冲液(10mM磷酸盐緩冲液、lmMMgCl2、33mM铁氰化钟(Khexacy肌oferrate(III))、33mM亚铁氰化钾(Khexacyanoferrate(II))、0.1%(v/v)X國Gal)染色。在37匸孵育过^L^,在光学显微镜下检查平板,并计数LacZ阳性细胞克隆的数目。LacZ修复的频率表述为LacZ+灶点数除以转染细胞数(5xl05),并通过转染效率进行修正。B)结果在CHO细胞中使用染色体外测定来监测带有G19S突变的M2和M3I-Crel突变体(M2G19S和M3G19S)对其各自把标RAG1.10.2和RAG1.10.3的活性。以纯同二聚体的方式测试突变体,或在共转染带有或不带有G19S突变的突变体时进行测试,这允许检测两种异二聚体M2/M2G19S和M3/M3G19S对其各自RAG1.10.2和RAG1.10.3靶标的活性(图27A)。然后对RAG1.10靶标测试不同的异二聚体M2/M3、M2G19S/M3和M2/M3G19S(图27B)。从图27A和27B中可以看出,观察到G19S突变的两个方面。首先,该突变消除了同二聚体(M2G19S和M3G19S)对其回文靶标的活性。该作用可能是由于二聚体化界面内的空间冲突。迄今为止大部分^tit出的内切核酸酶(ZFN和HE)都是异二聚体,包含两种独立^it的单体,其各自结合靶标的一半。通过在相同细胞中共表达两种单体而获得异二聚体形成(PorteusH.M.,Mol.Ther.,2006,13,438-446;Smith等,NucleicacidsRes.Epub27November2006;国际PCT申请WO2007/097854和WO2007/049156)。然而,这事实上伴随着两种识别不同耙标的同二聚体的形成(Arnould等,J.Mol.Biol.,2006,355,443-458;Bibikova等,Genetics,2002,161,1169-1175),并且个体同二聚体有时能够导致极高水平的毒性(Bibikova等,Genetics,2002,161,1169-1175)。这个问题只能通过抑制功能性同二聚体的形成来解决,这在理论上可通过将两种单体融合在单链分子中来实现(Chevalier等,Mol.Cell"2002,10,895-卯5;Epinat等,NucleicAcidsRes"2005,33,5978-5990)。然而,这种设计是相对危险的,并可产生有害折叠的蛋白质(Epinat等,NucleicAcidsRes.,2005,33,5978-5990)。破坏各个同二聚体的功能性会是另一种解决方案,并且其中观察到的作用应与特异性具有巨大的关联。其次,在M3突变体中引入G19S突变大大提高了M3/M3G19S异二聚体对RAG1.10.3靶标的切割活性。对M2突变体而言不能真实地观察到这种效果,因为在该实验中其已经以饱和7jC平切割RAG1.10.2靶标。对于被M2/M3异二聚体以及M2G19S/M3和M2/M3G19S异二聚体以饱和水平切割的RAG1.10耙标而言,可得出相同的结论。然后在CHO细胞中在染色体测定中测试这后三种异二聚体。该染色体测定已在最近的出版物(Arnould等,J.Mol.Biol.Epub2007年5月10日)中充分描述。筒言之,首先创建带有单拷贝转基因的CHO细胞系。该转基因在I-SceI切割位点上游含有人EFla启动子(图28,步骤1)。接着,使用I-Scel大范围核酸酶在该基因座处引发DSB-诱导的同源重组,并插入带有新大范围核酸酶切割位点的5.5kb盒(图28,步骤2)。该盒含有由CMV启动子驱动的非功能性LacZ开放读码框,和无启动子的潮霉素标记基因。LacZ基因本身被含有待测试的大范围核酸酶切割位点(此处为RAG1.10切割位点)的50bp插入所失活。该细胞系继而可用于使用切割RAG1.10耙标的改造I-Crel衍生物来评价DSB诱导的基因乾向效率(LacZ修复)(图28,步骤3)。用修复基质和多种量的表达大范围核酸酶的载体共转染该细胞系。结果总结于表XIV中。LacZ基因修复的频率从使用最初改造的异二聚体(M2/M3)时2.4xl(T3的最大值提高至使用M2G19S/M3异二聚体时5.8x10-3的最大值。在两个单体之一(M2或M3)中引入G19S时,观察到基因靶向频率高于两倍的提高。因此,这些结果证实了在染色体外底物中观察到的结果,并显示G19S替换导致显著的活性提高。表XIV:CHO细胞中的才艮告染色体系统中大范围核酸酶诱导的lacZ修复的频率(描述于图28中)。异二聚体LacZ修复频率M2/M32.4x10—jM2G19S/M35.8x1(TJM2/M3G19S5.2x10陽JM2G19S/M3G19S0权利要求1.一种I-CreI变体,其特征为两个I-CreI单体中的至少一个含有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述亚结构域分别位于I-CreI的26到40位和44到77位,所述变体能够切割来自RAG基因的DNA靶序列,并可通过至少包含下述步骤的方法获得(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,所述第一功能性亚结构域位于I-CreI的26到40位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,所述第二功能性亚结构域位于I-CreI的44到77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点-10到-8位的核苷酸三联体已被替换为存在于所述基因组靶标中-10到-8位的核苷酸三联体,且(ii)+8到+10位的核苷酸三联体已被替换为存在于所述基因组靶标中-10到-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点-5到-3位的核苷酸三联体已被替换为存在于所述基因组靶标中-5到-3位的核苷酸三联体,且(ii)+3到+5位的核苷酸三联体已被替换为存在于所述基因组靶标中-5到-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点+8到+10位的核苷酸三联体已被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体,且(ii)-10到-8位的核苷酸三联体已被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点+3到+5位的核苷酸三联体已被替换为存在于所述基因组靶标中+3到+5位的核苷酸三联体,且(ii)-5到-3位的核苷酸三联体已被替换为存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两个变体中26到40位和44到77位的突变在单个变体中组合,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)-10到-8位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体相同,(ii)+8到+10位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体的反向互补序列相同,(iii)-5到-3位的核苷酸三联体与存在于所述基因组靶标中-5到-3位的核苷酸三联体相同,和(iv)+3到+5位的核苷酸三联体与存在于所述基因组靶标中-5到-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两个变体中26到40位和44到77位的突变在单个变体中组合,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)+3到+5位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体相同,(ii)-5到-3位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列相同,(iii)I-CreI位点+8到+10位的核苷酸三联体被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体,和(iv)-10到-8位的核苷酸三联体与存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和(h)中获得的变体相组合,以形成异二聚体,和(j)选择和/或筛选来自步骤(i)的能够切割来自RAG基因的所述DNA靶序列的异二聚体。2.根据权利要求1的变体,其中位于I-Crel44到77位的亚结构域中的所述替换位于44、68、70、75和/或77位。3.根据权利要求1的变体,其中位于I-Crel26到40位的亚结构域中的所述替换位于26、28、30、32、33、38和/或40位。4.根据权利要求1到3中任一项的变体,所述变体为两个相同单体相结合所得到的同二聚体,所述单体在I-Crel的26到40位和44到77位具有突变,所述同二聚体能够切割来自RAG基因的回文或假回文DNA靼序列。5.根据权利要求1到3中任一项的变体,所述变体为第一和第二单体结合所得到的异二聚体,所述第一和第二单体在I-Crel的26到40位和44到77位具有不同的突变,所述异二聚体能够切割来自RAG基因的非回文DNA耙序列。6.根据权利要求1到5中任一项的变体,其包含一个或多个替换,所述替换改进其对所述来自RAG基因的DNA耙序列的结合和/或切割特性。7.根据权利要求6的变体,其中所述替换位于I-CreI的以下位置4、6、19、34、43、49、50、54、79、80、82、85、86、87、94、96、100、103、105、107、108、114、115、116、117、125、129、131、132、139、147、150、151、153、154、155、157、159和/或160位。8.根据权利要求7的变体,其中所述替换选自G19S、G19A、F54L、S79G、F87L、V105A和1132V。9.根据权利要求1到8中任一项的变体,其中所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、W、L和V的^J^酸替换原始M酸。10.根据权利要求5到9中任一项的异二聚体变体,其中该异二聚体的一个单体包含G19S替换,所述替换损害功能性同二聚体的形成并提高该异二聚体的切割活性。11.根据权利要求1到10中任一项的变体,其中所述DNA乾序列来自人RAG基因。12.根据权利要求5到11中任一项的异二聚体变体,其中所述DNA靶标是来自人RAG1基因的序列,其选自序列SEQIDNO:148到177。13.根据权利要求5到11中任一项的异二聚体变体,其中所述DNA靶标是来自人RAG2基因的序列,其选自序列SEQIDNO:178到202。14.根据权利要求12的异二聚体变体,所述变体是由选自以下序列对的第一与第二单体组成的异二聚体SEQIDNO:2与39,SEQIDNO:3与40,SEQIDNO:4与41,SEQIDNO:5与42,SEQIDNO:6或10与SEQIDNO:42到49中任何一个,SEQIDNO:7、8或11与SEQIDNO:42到44与46到49中任何一个,SEQIDNO:9与SEQIDNO:43、248到253中任何一个,SEQIDNO:12与SEQIDNO:42到44与46到48中任何一个,SEQIDNO:13与50,SEQIDNO:14与51,SEQIDNO:15与52,SEQIDNO:16与53,SEQIDNO:17与54,SEQIDNO:18与55,SEQIDNO:19与56,SEQIDNO:20与57,SEQIDNO:21与58,SEQIDNO:22与59,SEQIDNO:23与60,SEQIDNO:24与61,SEQIDNO:25与62,SEQIDNO:26与63,SEQIDNO:27与64,SEQIDNO:28与65,SEQIDNO:29与66,SEQIDNO:30与67,SEQIDNO:31与68,SEQIDNO:32与69,SEQIDNO:33与70,SEQIDNO:34与,SEQIDNO:35与72,SEQIDNO:36与73,SEQIDNO:37与74,SEQIDNO:38与75。15.根据权利要求13的异二聚体变体,所述变体是由选自以下序列对的第一单体与第二单体组成的异二聚体SEQIDNO:76与103,SEQIDNO:77与104,SEQIDNO:78与105,SEQIDNO:79与106,SEQIDNO:80与107,SEQIDNO:81与108,SEQIDNO:82与109,SEQIDNO:83与SEQIDNO:110到128、236、237中任何一个,SEQIDNO:84与SEQIDNO:129或236,SEQIDNO:85与130,SEQIDNO:86与131,SEQIDNO:87与132,SEQIDNO:88与133,SEQIDNO:89与134,SEQIDNO:卯与135,SEQIDNO:91与136,SEQIDNO:92与137,SEQIDNO:93与138,SEQIDNO:94与139,SEQIDNO:95与140,SEQIDNO:96与141,SEQIDNO:97与142,SEQIDNO:98与143,SEQIDNO:99与144,SEQIDNO:100与145,SEQIDNO:101与146,SEQIDNO:102与147,SEQIDNO:238到240与SEQIDNO:236,SEQIDNO:241到247与SEQIDNO:237。16.自根据权利要求1到15中任一项的I-Crel变体衍生的单链嵌合内切核酸酶。17.多核苷酸片段,其编码根据权利要求1到15中任一项的变体或根据权利要求16的单链嵌合内切核酸酶。18.表达载体,其包含至少一个根据权利要求17的多核苷酸片段。19.根据权利要求18的表达载体,其包含两个不同的多核普酸片段,每个多核苷酸片段编码权利要求5、10以及12到15中任一项所定义的异二聚体变体的单体之一。20.包含耙向构建体的载体,所述乾向构建体包含待引Ajf列,所述待引入序列的侧翼是与权利要求1、4、5和11到13中任一项所定义变体的基因组DNA切割位点周围区域共有同源性的序列。21.根据权利要求18或权利要求19的包含乾向构建体的载体,所述靶向构建体包含待引入的序列,所述序列的侧翼是与权利要求l、4、5和11到13中任一项中所定义的变体的基因组DNA切割位点周围区域共有同源性的序列。22.根据权利要求20或权利要求21的载体,其中所述待引入的序列是修复RAG基因中突变的序列。23.根据权利要求22的载体,其中修复所述突变的序列是RAG基因的正确序列。24.根据权利要求22的载体,其中修复所述突变的序列包含RAGORF和在3'终止转录的多聚腺香酸化位点。25.根据权利要求20到24中任一项的载体,其中所述与变体基因组DNA切割位点周围的区域共有同源性的序列是人RAG1基因的片段,其包含所i^ARAGl基因的以下位置6到205、1603到1802、2219到2418、5181到5380、5222到5421、5499到5698、5709到5卯8、5936到6135、6049到6248、6097到6296、6212到6411、6270到6469、6521到6720、6559到6758、6667到6866、6710到6909、6853到7052、6976到7175、7012到7211、7168到7367、7207到7406、7231到7430、7478到7677、7622到7821、7709到7卯8、7920到8119、8144到8343、8149到8348、8252到8451,和/或8271到8470。26.根据权利要求20到24中任一项的载体,其中所述与变体基因组DNA切割位点周围的区域共有同源性的序列是人RAG2基因的片段,其包含所i^/vRAG2基因的以下位置-12到187、289到488、432到631、559到758、657到856、730到929、879到1078、1239到1438、1422到1621、1618到1817、1795到1994、2200到2399、2270到2469、2399到2598、2894到3093、3349到3548、3774到3973、3949到4148、4210到4409、4693到4892、4951到5150、5212到5411、5615到5814、5810到6009和/或5965到6164。27.根据权利要求23、25和26中任一项的载体,其包含至少一个权利要求25或26所定义的人RAG1或RAG2基因片段,以及变体切割位点与人RAG1或RAG2基因突变位点之间的所有序列。28.组合物,其包含至少一种根据权利要求1到15中任一项的变体,一种根据权利要求16的单链嵌合内切核酸酶,和/或至少一种根据权利要求18到27中任一项的表达载体。29.根据权利要求28的组合物,其包含根据权利要求23到27任一项中定义的靼向DNA构建体,所述耙向DNA构建体包^f务复RAG基因中突变的序列,该序列的侧翼是与所述变体的基因组DNA靶标切割位点周围的区域共有同源性的序列。30.根据权利要求29的组合物,其中所述耙向DNA构建体包含在重组载体中。31.包含根据权利要求18或权利要求19所述表达载体以及含有根据权利要求20和22到27之耙向构建体的载体的产品,其作为组合制剂用于在与RAG基因中突变相关的SCID综合征的预防或治疗中同时、分别或依次使用。32.根据权利要求1到15中任一项的至少一种变体、根据权利要求16的一种单链嵌合内切核酸酶,和/或根据权利要求18到27中任一项的一种表达载体用于制备药物的用途,所述药物用于在有此需要的个体中预防、改善或治疗与RAG基因中突变相关的SCID综合征。33.以根据权利要求17的多核苷酸或根据权利要求18到27中任一项的载体进行了修饰的宿主细胞。34.包含权利要求18到20中任一项中所定义的一个或两个多核苷酸片段的非人转基因动物。35.包含权利要求18到20中任一项中所定义的一个或两个多核苷酸片段的转基因植物。36.根据权利要求1到15中任一项的至少一种变体、根据权利要求16的一种单链嵌合内切核酸酶、根据权利要求18到27中任一项的一种载体用于基因组改造的非治疗目的用途。37.根据权利要求36的用途,其中所述变体、单链嵌合内切核酸酶或载体与权利要求21到27中任一项所定义的靶向DNA构建体相关联。全文摘要本发明涉及一种I-CreI变体,其中I-CreI单体之一具有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述亚结构域分别位于I-CreI的26到40位以及44到77位,所述变体能够切割来自RAG基因的DNA靶序列。本发明还涉及所述变体和衍生产物用于预防和治疗与RAG基因中突变相关的SCID综合征的用途。文档编号C12N15/55GK101517071SQ200780034222公开日2009年8月26日申请日期2007年6月25日优先权日2006年7月18日发明者西尔万·阿尔努,西尔韦斯特·格里佐申请人:赛莱克蒂斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1