切割来自小鼠rosa26基因座之dna靶序列的大范围核酸酶变体及其用途的制作方法

文档序号:570642阅读:312来源:国知局

专利名称::切割来自小鼠rosa26基因座之dna靶序列的大范围核酸酶变体及其用途的制作方法
技术领域
:本发明涉及切割来自小鼠R0SA26基因座之DNA靶序列的大范围核酸酶变体,涉及编码所述变体的载体,涉及被所述载体修饰的细胞、动物或植物,并涉及所述大范围核酸酶变体及衍生产物用于小鼠基因组改造的用途(生产重组蛋白、构建转基因小鼠和重组小鼠细胞系)。Friedrich和Soriano于1991年使用感染有逆转录病毒的胚胎干细胞(ES细胞)通过基因诱捕实验发现了小鼠R0SA26基因座(Friedrich,G.和P.Soriano,Genes&Development,1991,5,1513-1523)。R0SA26小鼠基因诱捕系(其中在R0SA26基因座的内含子1(非必需位点)中有插入)表现出在新生儿胚胎发育过程中(Friedrich和Soriano,1991,上文引用)和造血细胞中(Zambrowicz等,Proc.Natl.Acad.Sci.USA,1997,94,3789-3794)报告基因普遍表达。R0SA26基因座位于小鼠6号染色体,其产生三种转录物(图1)。两种转录物从共同的启动子起始,它们共有一致的5'端(外显子1和外显子2起始),但它们均不包含有意义的0RF。第三种转录物从反向链起始(Zambrowicz等,1997,上文引用)。在小鼠R0SA26启动子控制下的转基因表现出在胚胎和成年小鼠中的广泛表达(Soriano,P.,NatureGenetics,1999,21,70-71)。靴向小鼠ES细胞中的R0SA26基因座已广泛用于构建转基因小鼠模型(Kisseberth等,DevelopmentalBiology,1999,214,128-138;MaoX.等,Proc.Natl.Acad.Sci.USA,1999,96,5037-5042;Soriano,1999,上文引用;Awatramani等,NatureGenetics,2001,29,257-259;MaoX.等,Blood,2001,97,324-326;Possemato等,Genesis,2002,32,184-186;Mao,J.等,NucleicAcidsRes.,2005,33,el55;Yu等,Proc.Natl.Acad.Sci.USA,2005,102,8615-8620;国际PCT申请WO99/53017,WO02/098217,WO03/020743,W02004/063381和WO2005/116070)。然而,在小鼠细胞中同源重组效率非常低(频率10_610_9)。该效率可通过靶标基因座中的DNA双链断裂(DSB)来得以提高。这种DNA双链断裂可通过大范围核酸酶(定义为识别大序列的序列特异性内切核酸酶)来形成(Thierry,Α.和B.Dujon,NucleicAcidsRes.,1992,20,5625-5631)。这些蛋白质可切割活细胞中的独特位点,从而使切割位点附近的基因打靶提高1000倍或更多(Puchta等,NucleicAcidsRes.,1993,21,5034-5040;Rouet等,Mol.Cell.Biol.,1994,14,8096-8106;Choulika等,Mol.Cell.Biol.,1995,15,1968-1973;Puchta等,Proc.Natl.Acad.Sci.USA,1996,93,5055-5060;Sargent等,Mol.Cell.Biol.,1997,17,267-277;Cohen-Tannoudji等,Mol.Cell.Biol.,1998,18,1444-1448;Donoho等,Mol.Cell.Biol.,1998,18,4070-4078;Elliott等,Mol.Cell.Biol.,1998,18,93-101)。尽管已鉴定了数百种天然大范围核酸酶(也称为“归巢内切核酸酶”)(Chevalier,B.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774),但是可切割序列仍非常有限以致于不能应对基因组复杂性的问题,并且在所选基因中通常不会有可切割位点。从理论上讲,制备具有选定特异性的序列特异性人工内切核酸酶可以削弱该限制。因此,制备具有定制特异性的大范围核酸酶正在被广泛研究。最近,使用了锌指蛋白与FokI(IIS类限制性内切核酸酶)催化结构域的融合物来制备功能性序列特异性内切核酸酶(Smith等,NucleicAcidsRes.,1999,27,674-681;Bibikova等,Mol.Cell.Biol.,2001,21,289-297;Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764;Porteus,M.H.和D.Baltimore,Science,2003,300,763-;Alwin等,Mol.Ther.,2005,12,610-617;Urnov等,Nature,2005,435,646-651;Porteus,M.H.,Mol.Ther.,2006,13,438-446;国际PCT申请WO2007/014275)。最近,这样的核酸酶可用于改造来自淋巴谱系的人细胞中的ILR2G基因(Urnov等,Nature,2005,435,646-651)。Cys2-His2型锌指蛋白(ZFP)的结合特异性易于操作,这可能是因为它们代表了简单(特异性基本上由每个锌指上的四个残基决定)且模块化的系统(Pabo等,Armu.Rev.Biochem.,2001,70,313—340Jamieson等,Nat.Rev.DrugDiscov.,2003,2,361—368)。来自Pabo(Rebar,Ε.J.和C.0.Pabo,Science,1994,263,671-673;KimJ.S.和C.0.Pabo,Proc.Natl.Acad.SciUSA,1998,95,2812-2817)、Klug(Choo,Y.和A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;IsalanΜ.和A.Klug,Nat.Biotechnol.,2001,19,656-660)和Barbas(Choo,Y.和A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;IsalanM和A.Klug,Nat.Biotechnol.,2001,19,656-660)实验室的研究得到了能够结合大多数G/ANNG/ANNG/ANN序列的大量新人工ZFP。然而,ZFP可能具有其局限性,尤其是对于需要极高水平特异性的应用(如治疗应用)而言。最近显示,融合物中的FokI核酸酶活性作用于任一识别位点或被不同距离隔开的两个位点(通过DNA环),包括存在某些DNA结合缺陷型FokI突变体时(Catto等,NucleicAcidsRes.,2006,34,1711-1720)。因此,特异性可能是非常简并性的,如在哺乳动物细胞和果蠅(Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764-)中的毒性所示。在自然界中,大范围核酸酶基本上由归巢内切核酸酶(HomingEndonuclease,HE)代表。归巢内切核酸酶是一种广泛的天然大范围核酸酶家族,包括数百个蛋白质家族(ChevalierB.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774)。这些蛋白质由可动遗传元件所编码,所述可动遗传元件通过称作“归巢”的过程来增殖内切核酸酶切割其中不存在该可动遗传元件的同源等位基因,从而激发使该可动DNA复制进受者基因座的同源重组事件。考虑到它们在效率和特异性方面的优异切割特性,它们可代表产生新的高度特异性内切核酸酶的理想骨架。HE属于四个主要的家族。LAGLIDADG家族(根据参与催化中心的保守肽基序而命名)是分布最广和最充分表征的一组。目前已获得七种结构。尽管来自该家族的大多数蛋白质是单体的并显示两个LAGLIDADG基序,然而少数几种仅具有一个基序但发生二聚化以切割回文或假回文的靶序列。尽管LAGLIDADG肽是该家族成员中唯一的保守区域,但是这些蛋白质具有非常类似的结构(图2)。催化核心的侧翼是两个DNA结合结构域,对同二聚体(例如I-CreI(Chevalier等,Nat.Struct.Biol.,2001,8,312-316)和I-MsoI(Chevalier等,J.Mol.Biol.,2003,329,253-269))而言具有完全的二重对称性,对单体(如I-SceI(Moure等,J.Mol.Biol.,2003,334,685-695)、I-DmoI(Silva等,J.Mol.Biol.,1999,286,1123-1136)或I-AniI(Bolduc等,GenesDev.,2003,17,2875-2888))而言具有假对称性。两个单体或两个结构域(对于单体蛋白质而言)构成组织在二价阳离子周围的催化核心。在催化核心上方的两个LAGLIDADG肽也在二聚化界面中起关键作用。DNA结合依赖于位于DNA大沟上的两个典型鞍形ββαββ折叠。其它结构域可见于例如内含肽(例如PI-PfuI(Ichiyanagi等,J.Mol.Biol.,2000,300,889-901)和PI-SceI(Moure等,Nat.Struct.Biol.,2002,9,764-770))中,其蛋白质剪接结构域也参与DNA结合。通过将I-DmoI的N端结构域与I-CreI单体融合制备的功能性嵌合大范围核酸酶(Chevalier等,Mol.Cell.,2002,10,895-905;Epinat等,NucleicAcidsRes,2003,31,2952-62;国际PCT申请WO03/078619和TO2004/031346)已证明了LAGLIDADG蛋白的可塑性。此外,不同的小组还使用推理方法来局部改变I-CreI(Seligman等,Genetics,1997,147,1653-1664;Sussman等,J.Mol.Biol.,2004,342,31-41;国际PCT申请WO2006/097784,WO2006/097853和WO2007/049156;Arnould等,J.Mol.Biol.,2006,355,443-458;Rosen等,NucleicAcidsRes.,2006,34,4791-4800;Smith等,NucleicAcidsRes.,Epub2006年11月27日)、I-SceI(Doyon等,J.Am.Chem.Soc.,2006,128,2477-2484)、PI-SceI(Gimble等,J.Mol.Biol.,2003,334,993-1008)和I-MsoI(Ashworth等,Nature,2006,441,656-659)的特异性。此外,通过将半推理方法与高通量筛选相结合而改造出特异性局部改变的数百种I-CreI衍生物-诱变I-CreI的残基Q44、R68和R70或者Q44、R68、D75和177,通过筛选鉴定出一系列具有针对DNA靶标士35位(5NNNDNA靶标)之核苷酸的特异性改变的变体(国际PCT申请WO2006/097784和W02006/097853;Arnould等,J.Mol.Biol.,2006,355,443-458;Smith等,NucleicAcidsRes.,Epub2006年11月27日)。-诱变I-CreI的残基K28、N30和Q38、N30、Y33和Q38或者K28、Y33、Q38和S40,通过筛选鉴定出一系列具有针对DNA靶标士810位(10NNNDNA靶标)之核苷酸的特异性改变的变体(Smith等,NucleicAcidsRes.,Epub2006年11月27日;国际PCT申请WO2007/049156)。I-CreI的残基2840以及4477显示可形成两个单独的功能性亚结构域,能结合归巢内切核酸酶的半位点的不同部分(Smith等,NucleicAcidsRes.,Epub2006年11月27日;国际PCT申请WO2007/049095)。在同一单体内组合I-CreI两个亚结构域中的突变,这允许设计新的嵌合分子(同二聚体),其能够切割回文组合的DNA靶序列,所述靶序列包含与每个亚结构域结合的士35位和士810位的核苷酸(Smith等,NucleicAcidsRes.,Epub2006年11月27日;国际PCT申请W02007/049156)。两种不同的变体被组合并组装成功能性异二聚体内切核酸酶,其能够切割嵌合靶标,该嵌合靶标由每个变体DNA靶序列的不同一半进行融合而产生(Arnould等,上文引用;国际PCT申请WO2006/097854)。令人感兴趣的是,新的蛋白质保持了正确的折叠和稳定性、高活性以及窄特异性。前述两个步骤的组合允许更大的组合方法,其包括4个不同的亚结构域。可以对不同的亚结构域分别进行修饰并组合,以获得完全重新设计的具有选定特异性的大范围核酸酶变体(异二聚体或单链分子),如图3所示。第一步,将成对的新大范围核酸酶组合成新的分子(“半大范围核酸酶”),其切割衍生自欲切割之靶标的回文靶标。然后,对上述“半大范围核酸酶”进行组合可得到切割目的靶标的异二聚体形式。Smith等已描述了将四组突变组装进异二聚体内切核酸酶,其切割模式靶序列或者人RAGl基因的序列(NucleicAcidsRes.,Epub2006年11月27日)然而,在该报告中测试的靶标与回文I-CreI位点(C1221,图5)原始序列在士2和士1位是相同的。尽管士1和士2位碱基对不表现与蛋白质的任何接触,但已显示这些位置并非完全不含信息(Chevalier等,J.Mol.Biol.,2003,329,253-269)(尤其是对于士1位碱基对而言),并且它们可能是另外的底物特异性来源(Argast等,J.Mol.Biol.,1998,280,345-353Jurica等,Mol.Cell.,1998,2,469-476;Chevalier,B.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774)。体外选择经随机诱变的可切割I-CreI靶标(Argast等,上文引用)表明,这四个碱基对对于蛋白质结合和切割活动是重要的。已提示在活性位点发现的有序水分子网络对于DNA靶标定位是重要的(Chevalier等,Biochemistry,2004,43,14015-14026)。此外,I-CreI结合后该区域中出现的广泛构象变化表明,四个中央核苷酸可对底物特异性有所贡献,这可能由序列依赖性构象偏好所致(Chevalier等,2003,上文引用)。因此,还不清楚针对10NNN和5NNNDNA靶标鉴定的突变体作为切割回文序列(其4个中央核苷酸为gtac)的同源二聚体是否允许设计会切割4个中央核苷酸中包含变化之靶标的新内切核酸酶。本发明人已鉴定了小鼠R0SA26基因座中可被I-CreI变体切割的一系列DNA靶标(图17)。图3中所述的组合方法用于完全重新设计I-CreI蛋白的DNA结合结构域,从而改造出具有完全经改造之特异性的新大范围核酸酶,用以切割来自小鼠R0SA26基因座(rosal)的DNA靶标,该DNA靶标与I-CreIC122122bp回文位点具有13个核苷酸的差异(其中包括所述四个中央核苷酸之一(+1位))(图5)。尽管所组合的变体最初分别针对核苷酸10NNN和5NNN而鉴定出,并观察到了靶标的四个中央核苷酸对经改造大范围核酸酶活性的强作用,仍选出了特异性显著改变的功能性大范围核酸酶。此外,通过两个连续循环的随机诱变和筛选,经改造蛋白质的活性与I-CreI蛋白的活性相比可显著改进。在R0SA26基因座处产生双链断裂的能力提供了显著增强该基因座处同源重组的手段。因此,靶向R0SA26基因座的大范围核酸酶将允许在小鼠细胞中有效插入基因(图4)。能够在该基因座处有效地插入基因(基因敲入)具有如下优势使插入物的产生具有可再生的表达水平以及可预测的时间线。潜在的应用包括在小鼠细胞和经改造转基因小鼠以及重组小鼠细胞系中产生重组蛋白质,其可用于例如生产蛋白质、基因功能研究、药物筛选或作为疾病模型。本发明涉及I-CreI变体,其中两个I-CreI单体的至少一个具有至少两个替换,在LAGLIDADG核心结构域的两个功能性亚结构域(分别位于I-CreI的2640位以及4477位)中各含一个,并且所述I-CreI变体能够切割来自小鼠R0SA26基因座的DNA靶序列。本发明变体的切割活性可通过公知的体外或体内切割测定来测量,例如国际PCT申请WO2004/067736;Epinat等,NucleicAcidsRes.,2003,31,2952-2962;Chames等,NucleicAcidsRes.,2005,33,el78以及Arnould等,J.Mol.Biol.,2006,355,443-458中描述的。例如,本发明变体的切割活性可在酵母或哺乳动物细胞中通过使用报告载体的同向重复重组测定来测量。报告载体包含报告基因的两个截短的非功能性拷贝(同向重复)和位于居间序列中的基因组DNA靶序列,其被克隆在酵母或哺乳动物表达载体中。变体的表达产生能够切割该基因组DNA靶序列的功能性内切核酸酶。这种切割诱导同向重复之间的同源重组,得到功能性报告基因(可通过适当的测定来监测其表达)。定义-氨基酸是指天然或合成的氨基酸,包括前述氨基酸的对映异构体和立体异构体。-多肽序列中的氨基酸残基在本文中根据单字母代码命名,其中例如Q表示Gln或谷氨酰胺残基,R表示Arg或精氨酸残基,D表示Asp或天冬氨酸残基。-酸性氨基酸是指天冬氨酸(D)和谷氨酸(E)。-碱性氨基酸是指赖氨酸(K)、精氨酸(R)和组氨酸(H)。-小氨基酸是指甘氨酸(G)和丙氨酸㈧。-芳香族氨基酸是指苯丙氨酸(F)、色氨酸(W)和酪氨酸(Y)。-核苷酸表示如下单字母代码用于表示核苷的碱基a是腺嘌呤,t是胸腺嘧啶,c是胞嘧啶,g是鸟嘌呤。对于简并核苷酸而言,r代表g或a(嘌呤核苷酸),k代表g或t,s代表g或c,w代表a或t,m代表a或c,y代表t或c(嘧啶核苷酸),d代表g、a或t,ν代表g、a或c,b代表g、t或c,h代表a、t或c,η代表g、a、t或C。-“大范围核酸酶”是指具有1245bp双链DNA靶序列的内切核酸酶。所述大范围核酸酶是各结构域位于单体上的二聚体酶,或是在单个多肽上包含两个结构域的单体酶。-“大范围核酸酶结构域”是指这样的区域,其与大范围核酸酶DNA靶标的一半相互作用,并能够与同一大范围核酸酶的另一结构域结合,形成能够切割所述DNA靶标的功能性大范围核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。-“大范围核酸酶变体”或“变体”是指通过将野生型大范围核酸酶(天然大范围核酸酶)氨基酸序列中的至少一个残基替换为不同氨基酸而获得的大范围核酸酶。-“功能性变体”是指能够切割DNA靶序列的变体,优选地所述靶标是不被亲本大范围核酸酶切割的新靶标。例如,这样的变体在接触DNA靶序列的位置或与所述DNA靶标直接或间接相互作用的位置上具有氨基酸改变。-“具有新特异性的大范围核酸酶变体”是指具有与其亲本大范围核酸酶不同的靶标切割模式的变体。等价且无差异地术语“新特异性”、“经修饰的特异性”、“新切割特异性”、“新底物特异性”是指变体针对DNA靶序列中核苷酸的特异性。_“I-CreI”是指具有序列SWISSPROTP05725(对应于序列表中的序列SEQIDNO1)或序列pdb登录号lg9y(对应于序列表中的序列SEQIDNO133)的野生型I-Crel。-“结构域”或“核心结构域”是指“LAGLIDADG归巢内切核酸酶核心结构域”,它是LAGLIDADG家族归巢内切核酸酶的特征性ajii^c^i^i^c^折叠,对应于约一百个氨基酸残基的序列。所述结构域包含折叠成反向平行β-片层的四条β链(日力力#4),所述β-片层与DNA靶标的一半相互作用。该结构域能够与另一LAGLIDADG归巢内切核酸酶核心结构域结合,形成能够切割所述DNA靶标的功能性内切核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。例如,在二聚体归巢内切核酸酶I-CreI(163个氨基酸)的情形中,LAGLIDADG归巢内切核酸酶核心结构域对应于694位残基。-“单链大范围核酸酶”是指包含由肽间隔区连接的两个LAGLIDADG归巢内切核酸酶结构域或核心结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靶序列,所述靶序列包含各亲本大范围核酸酶靶序列中不同的一半。-“亚结构域”是指LAGLIDADG归巢内切核酸酶核心结构域中的区域,其与归巢内切核酸酶DNA靶标半位点的不同部分相互作用。两个不同的亚结构域独立作用,并且一个亚结构域中的突变不改变另一亚结构域的结合和切割特性。因此,两个亚结构域结合归巢内切核酸酶DNA靶标半位点的不同部分。-“β-发夹”是指LAGLIDADG归巢内切核酸酶核心结构域反向平行β-片层的两条连续β-链(^^或β3β4),其通过环或转角相连。-“I-CreI位点”是指被I-Crel切割的2224bp双链DNA序列。Ι-Crel位点包括野生型(天然)非回文I-CreI归巢位点和衍生的回文序列,例如序列5’-t_12C_lia_1(ia_9a_10g+11a+12(SEQIDNO:2),也称为C1221(图5)。-“DNA靶标”、“DNA靶序列”、“靶序列”、“靶位点”、“靶标”、“位点”;“目的位点”;“识别位点”、“识别序列”、“归巢识别位点”、“归巢位点”、“切割位点”是指被LAGLIDADG归巢内切核酸酶(例如I-CreI,或者衍生自I-CreI的变体或单链嵌合大范围核酸酶)识别并切割的2024bp双链回文、部分回文(假回文)或非回文的多核苷酸序列。这些术语是指大范围核酸酶诱导双链断裂(切割)的独特DNA位置(优选基因组位置)。DNA靶标通过双链多核苷酸中一条链的5'3'序列来定义,如上文针对C1221所示的。DNA靶标的切割分别发生在有义和反义链+2和-2位的核苷酸处。除非另有指明,否则I-CreI大范围核酸酶变体切割DNA靶标的位置对应于DNA靶标有义链上的切割位点。-"DNA靶标半位点”、“半切割位点”或“半位点”是指DNA靶标中与各个LAGLIDADG归巢内切核酸酶核心结构域结合的部分。-“嵌合DNA靶标”或“杂合DNA靶标”是指两条亲本大范围核酸酶靶序列不同的一半的融合物。另外,所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷酸组合(组合DNA靶标)。-“小鼠R0SA26基因座”是指位于小鼠6号染色体的基因座,其具有对应于EMBL登录号CQ880114(SEQIDNO3;13139bp)的序列。R0SA26产生3种转录物(图1):2种转录物起始自共同的启动子并具有相同的5'端(外显子1和外显子2起始),但它们都不包含有意义的0RF。第三种转录物从反向链起始。-“来自小鼠R0SA26基因座的DNA靶序列”、“基因组DNA靶序列”、“基因组DNA切割位点”、“基因组DNA靶标”或“基因组靶标”是指小鼠R0SA26基因座中被大范围核酸酶变体识别并切割的2024bp序列。-“载体”是指能够转运与之连接的另一核酸的核酸分子。-“同源”是指一条序列与另一序列具有足够导致序列间同源重组的同一性,更特别地具有至少95%的同一性,优选97%的同一性,更优选99%的同一性。-“同一性”是指两种核酸分子或多肽之间的序列同一性。可通过比较各序列中可为比较目的而比对的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据时,则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核酸序列间共有的位置上相同或匹配的核苷酸数的函数。可使用多种比对算法和/或程序来计算两条序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分析包(UniversityofWisconsin,Madison,Wis.)的一部分获得,并可以例如默认设置使用。-“个体”包括哺乳动物,以及其它脊椎动物(例如鸟类、鱼和爬行动物)。本文使用的术语“哺乳动物”是指任何这样的脊椎动物(包括单孔类、有袋类和胎盘动物),它们对其幼仔哺乳,并且分娩活的幼仔(真哺乳亚纲(eutharian)或胎盘哺乳动物)或者产卵(后兽亚纲(metatharian)或非胎盘(nonplacental)哺乳动物)。哺乳动物物种的实例包括人和其它灵长类(例如猴、黑猩猩)、啮齿动物(例如大鼠、小鼠、豚鼠)和其它(例如牛、猪和马)。-“突变”是指在多核苷酸(cDNA、基因)或多肽序列中替换、缺失、插入一个或多个核苷酸/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。本发明的变体可以是同二聚体或异二聚体。优选地,异二聚体的两个单体均在2640和/或4477位突变。更优选地,两个单体在I-CreI的2640位和4477位中有不同的替换。在所述变体的一个优选实施方案中,位于I-CreI中4477位亚结构域中的所述替换位于44、68、70、75和/或77位。在所述变体的另一优选的实施方案中,位于I-CreI中2640位的亚结构域中的所述替换位于26、28、30、32、33、38和/或40位。在所述变体的另一优选的实施方案中,所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、V、L和W的氨基酸替换原始的氨基酸。在所述变体的另一优选实施方案中,它包含在接触DNA靶标序列或者与DNA骨架或与核苷酸碱基相互作用(直接或通过水分子)的其它氨基酸残基位置的一个或多个突变,这些残基是该
技术领域
所熟知的(Jurica等,MolecularCell.,1998,2,469-476;Chevalier等,J.Mol.Biol.,2003,329,253-269)。特别的,可在磷酸骨架的位置引入额外的替换,例如最末C末端的环中(位点137143,Prieto等,NucleicAcidsRes.,Epub2007年4月22日)。优选地,所述残基参与所述DNA切割位点的结合和切割。更优选地,所述残基在I-CreI的138、139、142或143位。两个残基可能会在一个变体中突变,只要每个突变在选自138和139位的残基对以及142和143残基对的不同残基对中。所引入的突变修饰了所述最末C末端环的氨基酸与I-CreI的磷酸骨架的相互作用。优选地,138或139位的残基被疏水性氨基酸取代,以避免与DNA切割位点磷酸骨架形成氢键。例如,在138位残基被丙氨酸替换或者139位残基被蛋氨酸替换。有利地,142或143位的残基被小氨基酸(例如甘氨酸)替换,以减少这些氨基酸残基侧链的大小。更优选地,所述最末C末端环中的替换修饰了变体对I-CreI的士12位、士67位和/或士1112位的核苷酸的特异性。在所述变体的另一优选的实施方案中,它包含一个或多个额外突变,所述突变提高了变体针对来自小鼠R0SA26基因座之DNA靶序列的结合和/或切割特性。所述额外的突变残基可在整个I-CreI序列上,特别是在I-CreI的C端一半(80163位)中。例如,变体包含在位置19、24、79、105、107、151、153、158的一个或多个额外替换。所述替换优先选自G19S、I24V、S79G、V105A、K107R、V151A、D153G和K158E。本发明的变体可衍生自野生型I-CreI(SEQIDNO:1或133)或与SEQIDNO133具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的I-CreI骨架蛋白(例如在I-CreI序列的第2位具有丙氨酸插入、D75N替换和C端AAD插入(164166位)的SEQIDNO4(167个氨基酸)骨架)。此外,本发明的变体可包含在序列的NH2端和/或COOH端插入一个或多个残基。例如,在NH2端和/或COOH端引入标签(表位(HA-tag(YPYDVPDYA;SEQIDNO:135)或S-tag(KETAAAKFERQHMDS;SEQIDNO136)或聚组氨酸序列);所述标签可用于检测和/或纯化所述变体。当标签被引入NH2端时,该标签序列可取代变体中最前面的氨基酸(至少变体的第一蛋氨酸和最终第二个氨基酸,标签起始自蛋氨酸),或者在变体的第一(蛋氨酸)和第二氨基酸之间或第一氨基酸和第三氨基酸之间插入(无蛋氨酸标签)。该变体还可包含核定位信号(NLS);所述NLS可用于所述变体运输进细胞核。NLS的实例是KKKRK(SEQIDN0:134)。NLS可紧接变体的第一个蛋氨酸或紧接N端标签插入。本发明的变体可以是同二聚体,其能够切割回文或假回文DNA靶序列。或者,所述变体是异二聚体,其得自在I-CreI的2640位和/或4477位具有不同替换的第一和第二单体的结合,所述异二聚体能够切割来自小鼠R0SA26基因座的非回文DNA靶序列。被所述变体切割的DNA靶序列可在小鼠R0SA26基因座的外显子中或内含子中。在所述变体的另一优选的实施方案中,所述DNA靶标选自,SEQIDNO:530(图17),其涵盖了所有小鼠R0SA26基因座。表I:R0SA26基因座靶序列<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table>*所示位置是靶标中第一个核苷酸的位置更优选地,变体的单体具有至少以下替换,分别针对第一和第二单体-N30H、Y33S、Q44E、R68C、R70S和D75N(第一单体)以及N30D、Y33R、Q38T、Q44K、R68E、R70S和I77R(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:5(图1和17;表I),-S32N、Y33G、Q44K、R70E和D75N(第一单体)以及S32T、Q38W、Q44K、R68E、R70S和I77R(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:6(图1和17;表I),-Y33R,Q38N,S40Q、Q44N、R70S,D75R和I77D(第一单体)以及N30H、Y33S,Q44A、R70S、D75Q和I77E(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:7(图1和17;表I),-K28S、Q38R、S40K、Q44D、R68Y、R70S、D75S和I77R(第一单体)以及Y33C、Q38A、R68A、R70K和D75N(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:8(图1和17;表I),-Y33C、Q44T、R70S和D75Y(第一单体)以及S32D、Q38C、Q44D、R68Y、R70S、D75S和I77R(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:9(图1和17;表I),-S32T、Y33C、R68T、R70N和D75N(第一单体)以及S32T、Q38W、Q44K、R70E和D75N(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDN0:10(图1和17;表I),-R70S、D75R和I77Y(第一单体)以及Y33R、Q38A、S40Q、Q44A、R70S和D75N(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO11(图1和17;表I),-K28S,Q38R,S40K、Q44T、R68N,R70N和D75N(第一单体)以及Y33H、Q38S,Q44K、R68Y、R70S、D75Q和I77N(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:12(图1禾口17;表I),-K28A、Y33S、Q38R、S40K、Q44N、R68Y、R70S、D75R、I77V(第一单体)以及S32T、Y33C、Q44A、R70S和D75N(第二单体);该变体切割位于第一个内含子内的R0SA26靶标SEQIDNO:13(图1禾口17;表I),-S32D,Y33H,Q44K、R68E,R70S和I77R(第一单体)以及SMD、Y33H,Q44D、R68N,R70S和D75N(第二单体);该变体切割位于第一内含子内的R0SA26靶标SEQIDNO:14(图1和17;表I),_吧01、5320、1685、1701(和075则第一单体)以及D75N(第二单体);该变体切割位于第二外显子内的R0SA26靶标SEQIDNO:16(图1和17;表I),-K28R、Y33A、Q38Y、S40Q、R68Y、R70S、D75R和I77Q(第一单体)以及Y33R、Q38A、S40Q、R70S和I77K(第二单体);该变体切割位于第二外显子内的R0SA26靶标SEQIDNO:17(图1和17;表I),-K28R、N30D、D75E和I77R(第一单体)以及S32D、Q38C、Q44A、R70S、D75R和I77Y(第二单体);该变体切割位于第二位于外显子内的R0SA26靶标SEQIDNO:18(图1和17;表I),-Y33R、Q38A、S40Q、R70S、和D75N(第一单体)以及R70S、D75Y和I77R(第二单体);该变体切割位于第二外显子内的R0SA26靶标SEQIDNO19(图1和图17,表I),-Y33R、Q38A、S40Q、Q44N、R68Y、R70S、D75R和I77V(第一单体)以及N30R、S32D、Q44T、R68H、R70H和D75N(第二单体);该变体切割位于第二位于外显子内的R0SA26靶标SEQIDNO:20(图1和17;表I),-Y33P,S40Q、Q44K、R68Y,R70S,D75Q和I77N(第一单体)以及SMA、Y33C,R68Y,R70S、D75R和I77Q(第二单体);该变体切割位于第二内含子内的R0SA26靶标SEQIDNO:21(图1和17;表I),-K28A,Y33S,Q38R,S40K、R68N,R70S,D75N和I77R(第一单体)以及SMN、Y33G,Q44A、R68A、R70K和D75N(第二单体);该变体切割位于第二内含子内的R0SA26靶标SEQIDNO:22(图1禾口17;表I),-N30H、Y33S、Q44Y、R70S和I77V(第一单体)以及Y33R、S40Q、Q44A、R70S和D75N(第二单体);该变体切割位于第二内含子内的R0SA26靶标SEQIDN0:23(图1和17;表I),-S32D、Y33H、R68T、R70N和D75N(第一单体)以及N30R、S32D、Q44T、R68N、R70N和D75N(第二单体);该变体切割位于第二内含子和反义转录物内的R0SA26靶标SEQIDNO:24(图1禾口17;表I),-S32R、Y33D、Q44A、R70S和D75N(第一单体)以及Y33S、Q38R、S40H、R68H、R70H和D75N(第二单体);该变体切割位于第三外显子或反义转录物内的R0SA26靶标SEQIDNO:25(图1和17;表I),-Y33P,S40Q、Q44K、R68Y,R70S,D75Q和I77N(第一单体)以及K28R、Y33A,Q38Y,S40Q、Q44T、R68H、R70H和D75N(第二单体);该变体切割位于第三外显子或反义转录物的R0SA26靶标SEQIDNO:26(图1和17;表I),-K28Q、Q38R、S40K、Q44A、R70S、D75E和I77R(第一单体)以及N30R、S32D、Q44K、R68Y、R70S、D75Q和I77N(第二单体);该变体切割位于第三个外显子或反义转录物的R0SA26靶标SEQIDNO:27(图1和17;表I),-Y33T、Q38A、R68H、R70H和D75N(第一单体)以及N30H、Y33S、R70S和I77K(第二单体);该变体切割位于第三外显子或反义转录物内的R0SA26靶标SEQIDNO:28(图1和17;表I),-Y33T、S40T、R68A、R70K和D75N(第一单体)以及K28R、Y33A、Q38Y、S40Q、R70S和I77K(第二单体);该变体切割位于第三外显子或反义转录物内的R0SA26靶标SEQIDNO:29(图1和17;表I)和-S32D、Y33H、Q44N、R70S、D75R和I77D(第一单体)以及S32D、Q38C、R70S和I77K(第二单体);该变体切割位于第三外显子或反义转录本内的R0SA26靶标SEQIDNO30(图1和17;表I)。所述切割表I中R0SA26DNA靶标(核苷酸序列SEQIDNO:514禾Π1630)的变体实例包括分别具有任一氨基酸序列SEQIDNO82106的第一单体和任一氨基酸序列SEQIDNO107116、4、117130的第二单体的变体(图17)。此外,以下变体能够切割位于第二个外显子中的R0SA26DNA靶标(命名为rosal)(图1和17;表I)-具有选自以下之第一单体的40种变体I24V、Q44Y、R70S和D75N;I24V、Q44Y、R68Y、R70S、D75Y和I77R;I24V、Q44Y、R70S、D75N和I77V;I24V、Q44Y、R68N、R70S和D75R;I24V、Q44Y、R68S、R70S和D75R;I24V、Q44Y、R70S和D75Q;I24V、Q44Y、R68Y、R70S、D75R和I77V;I24V、Q44Y、R70S、D75Y和I77T;以及选自以下的第二单体K28E、Y33R、Q38R、S40R、Q44A、R68H、R70Q和D75N;K28E、Y33R、Q38R、S40R、Q44A、R70N和D75N;K28E、Y33R、Q38R、S40K、Q44A、R68H、R70Q和D75N;K28E、Y33R、Q38R、S40K、Q44V、R70A和D75N;K28E、Y33R、Q38R、S40K、Q44A、R70G和D75N;这些变体的实例示于表V中(第一单体m2、m6、m8、ml2、ml3、ml4、ml6或ml7(SEQIDNO:39、43、45、49、50、51、53和54);第二单体为SEQIDNO:60、61、63、65和66中任一种)。-具有包含I24V、Q44Y、R70S、D75Y和I77T之第一单体以及K28E、Y33R、Q38R、S40R、Q44A、R68S、R70Q和D75N(第二单体)的变体;该变体的一个实例示于表V中(第一单体ml7(SEQIDNO54)和第二单体SEQIDNO:62)。-具有选自以下之第一单体的10种变体I24V、Q44Y、R68N、R70S和D75R;I24V、Q44Y、R68S、R70S和D75R;I24V、Q44Y、R70S和D75Q;I24V、Q44Y、R68Y、R70S、D75R和I77V;I24V、Q44Y、R70S、D75Y和I77T;以及选自以下的第二单体K28E、Y33R、Q38R、S40K、Q44A、R70S和D75N以及K28E、Y33R、Q38R、S40K、Q44A、R68T、R70N和D75N;这些变体的实例子示于表V中(第一单体ml2、ml3、ml4、ml6或ml7(SEQIDNO:49、50、51、53和54);第二单体为SEQIDNO64和67中任一种)。-具有由序列SEQIDNO:72(M0_1;表VI禾口VII)或SEQIDNO:73(M0_2;表VI禾口VII)组成的第一单体以及由序列SEQIDNO7477(m0_l到m0_4;表VII)中任一种组成的第二单体的变体;这8个变体具有额外的替换,从而增加了变体对rosal靶标的切割活性。本发明包括与上述序列具有至少85%的同一性、优选至少90%同一性、更优选至少有95%(96%,97%,98%,99%)同一性的I-CreI变体,所述变体能切割小鼠R0SA26基因座的DNA靶标。例如,本发明包括衍生M0_1和m0_2(通过插入NLS、标签或两者)的I-CreI变体,其选自序列SEQIDNO140145。有利地,所述异二聚体变体是专性(obligate)异二聚体变体,其具有对应于第一和第二单体目的残基的至少一对突变(这形成两个I-CreI单体之间的分子间相互作用),其中所述突变对中的第一突变在第一单体中,所述突变对的第二突变在第二单体中,所述突变对防止每个单体形成功能性同二聚体,并允许形成功能异二聚体(能够切割小鼠R0SA26基因座中的基因组DNA靶标)。为了形成专性异二聚体,单体有利地具有至少一个以下突变对,分别为针对第一和第二单体a)用碱性氨基酸(优选精氨酸)替换第8位的谷氨酸(第一单体),并用酸性氨基酸(优选谷氨酸)替换第7位的赖氨酸(第二单体);第一单体还可包含用精氨酸替换第7和96位的至少一个赖氨酸残基。b)用碱性氨基酸(优选精氨酸)替换第61位的谷氨酸(第一单体),并用酸性氨基酸(优选谷氨酸)替换第96位的赖氨酸(第二单体);第一单体还可包含用精氨酸替换第7和96位的至少一个赖氨酸残基,c)用芳香族氨基酸(优选苯丙氨酸)替换第97位的亮氨酸(第一单体),用小氨基酸(优选甘氨酸)替换第54位的苯丙氨酸(第二单体);第一单体可还包含用色氨酸替换第54位的苯丙氨酸,第二单体还可包含用蛋氨酸替换第58位的亮氨酸或第57位的赖氨酸,以及d)用碱性氨基酸(优选精氨酸)替换第137位的天冬氨酸(第一单体),用酸性氨基酸(优选谷氨酸)替换第51位的精氨酸(第二单体)。例如,第一单体可具有突变D137R,第二单体具有突变R51D。该专性异二聚体大范围核酸酶有利地包含a)、b)、c)或d)中所述的至少两对突变;有利地,其中一对突变如c)或d)中所述。优选地,一个单体包含用酸性氨基酸(天冬氨酸(D)或谷氨酸(E),优选天冬氨酸(K7E和K96E))替换第7位和第96位的赖氨酸残基,另一单体包含用碱性氨基酸(精氨酸(R)或赖氨酸(K),例如,E8K和E61R)替换第8位和第61位的谷氨酸残基。更优选地,专性异二聚体大范围核酸酶包含a)、b)和c)中所述的三对突变。所述专性异二聚体大范围核酸酶有利地由以下组成(i)E8R、E8K或E8H,E61R、E61K或E61H以及L97F、L97W或L97Y;(ii)K7R、E8R、E61R、K96R和L97F;或(iii)K7R、E8R、F54W、E61R、K96R和L97F,第二单体(B)具有至少以下突变(iv)K7E或K7D,F54G或F54A以及K96D或K96E;(ν)K7E、F54G、L58M禾口K96E;或(vi)K7E、F54G、K57M禾口K96E。例如,第一单体可具有突变K7R、E8R或E8K、E61R、K96R和L97F,或者K7R、E8R或E8K、F54W、E61R、K96R和L97F,第二单体具有突变K7E、F54G、L58M和K96E,或者K7E、F54G、K57M和K96E。异二聚体的实例包括SEQIDNO147和SEQIDNO:148。专性异二聚体可包含上述至少一个NLS和/或一个标签;所述NLS和/或标签可在第一和/或第二单体中。本发明的主题也是衍生自上述I-CreI变体的单链嵌合大范围核酸酶(融合蛋白)。所述单链大范围核酸酶可包含两个I-CreI单体、两个I-CreI核心结构域(I-CreI的694位),或两者的组合。优选地,所述两个单体/核心结构域或两者的组合通过肽连接序列进行连接。肽连接序列的实例是SEQIDNO:149。单链嵌合大范围核酸酶的实例是SEQIDN0:146。单链嵌合大范围核酸酶还可包含上述至少一个NLS和/或一个标签;所述NLS和/或标签可在第一和/或第二单体中。本发明的主题也是编码上所述变体或单链嵌合内切核酸酶的多核苷酸片段;所述多核苷酸可编码同二聚体或异二聚体变体的一个单体,或单链嵌合内源核酸酶的两个结构域/单体。本发明的主题还包括用于表达本发明变体或单链分子的重组载体。所述重组载体包含编码上述变体或单链大范围核酸酶分的至少一个多核苷酸片段。在一个优选的实施方案中,所述载体包含两个不同的多核苷酸片段,每个片段各编码异二聚体变体的单体之一。可在本发明中使用的载体包括但不限于病毒载体、质粒、RNA载体,或者可由染色体、非染色体、半合成或合成的核酸所组成的线性或环形DNA或RNA分子。优选的载体是能够自主复制的载体(附加型载体)和/或表达与之连接的核酸的载体(表达载体)。大量的合适载体是本领域技术人员已知的并且是商品化的。病毒载体包括逆转录病毒、腺病毒、细小病毒(parvovirus)(例如腺相关病毒)、冠状病毒、负链RNA病毒如正粘病毒(orthomyxovirus)(例如流感病毒)、杆状病毒(例如狂犬病毒和疱疹性口腔炎病毒(vesicularstomatitisvirus))、副粘病毒(paramyxovirus)(例如麻疹病毒和仙台病毒(Sendai))、正链RNA病毒如小RNA病毒(picornavirus)和甲病毒,以及双链DNA病毒,其包括腺病毒、疱疹病毒(例如1和2型单纯疱疹病毒、EB病毒、巨细胞病毒)和痘病毒(例如牛痘病毒、禽痘病毒和金丝雀痘病毒)。其它病毒包括例如诺瓦克病毒、披膜病毒(togavirus)、黄病毒(flavivirus)、呼肠11病_(reoviruses)、|L多空病_(papovavirus)、月干DNA病_(hepadnavirus)禾口月干炎病毒。逆转录病毒的实例包括禽白血病肉瘤、哺乳动物C型、B型病毒、D型病毒、HTLV-BLV组、慢病毒、泡沫病毒(spumavirus)(Coffin,J.Μ.,Retroviridae:Thevirusesandtheirreplication,InFundamentalVirology,第三版,B.N.Fields,等编辑,Lippincott-RavenPublishers,Philadelphia,1996)。优选的载体包括慢病毒载体,尤其是自失活(selfinactivacting)的慢病毒载体。载体可包含选择标记,例如用于真核细胞培养的新霉素磷酸转移酶、组氨醇脱氢酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱疹病毒胸苷激酶、腺苷脱氨酶、谷氨酰胺合成酶和次黄嘌呤-鸟嘌呤磷酸核糖基转移酶;用于酿酒酵母(S.cerevisiae)的TRPl;用于大肠杆菌(E.coli)的四环素、利福平或氨苄青霉素抗性。优选地,所述载体是表达载体,其中编码本发明变体/单链大范围核酸酶的序列置于适当的转录和翻译控制元件的控制下,以允许产生或合成所述变体。因此,所述多核苷酸包含在表达盒中。更具体地,载体包含复制起点、与所述编码多核苷酸有效连接的启动子、核糖体结合位点、RNA剪接位点(使用基因组DNA时)、多腺苷酸化位点和转录终止位点。其还可包含增强子。启动子的选择将取决于用于表达多肽的细胞。优选地,当所述变体是异二聚体时,编码各个单体的两多核苷酸包含在一个载体中,所述载体能够驱动两多核苷酸同时表达。合适的启动子包括组织特异性和/或诱导型启动子。诱导型启动子的例子是由提高的重金属水平诱导的真核金属硫蛋白(metallothionine)启动子、响应于异丙基-β-D-硫代半乳吡喃糖苷(IPTG)诱导的原核IacZ启动子和由提高的温度诱导的真核热休克启动子。组织特异性启动子的实例是骨骼肌肌酸激酶、前列腺特异性抗原(PSA)、α-抗胰蛋白酶、人表面活性剂(SP)A和B蛋白、β-酪蛋白和酸性乳清蛋白基因。根据所述载体的另一有利的实施方案,其包含靶向构建体,所述靶向构建体包含与如上述基因组DNA靶切割位点周围的区域具有同源性的序列。或者,编码I-CreI变体/单链大范围核酸酶的载体和包含靶向构建体的载体是不同的载体。更优选地,靶向DNA构建体包含a)与如上述基因组DNA切割位点周围的区域具有同源性的序列,和b)侧翼是a)中序列的待引入序列。为了在小鼠的R0SA26基因座敲入基因,待引入序列包含外源基因表达盒或其部分,以及最后筛选标记(例如HPRT基因)。或者,待引入序列可以是用于以任何特定方式改变小鼠R0SA26基因座的任何其它序列,包括用于修饰小鼠R0SA26基因座中特定序列、用于削弱或激活小鼠R0SA26基因座或部分、用于在小鼠R0SA26基因座目的位点引入突变或用于失活或删除小鼠R0SA26基因座或其一部分的序列。优选地,使用至少50bp、优选多于IOObp以及更优选多于200bp的同源序列来修复切割位点。事实上,具有的DNA同源性位于断裂位点上游和下游的侧翼区域中,且待引入的DNA序列应位于两臂之间。因此,靶向构建体优选地为200pb6000pb,更优选地为IOOOpb2000pb。为了插入序列,DNA同源性一般位于紧邻断裂位点上游和下游的区域中(紧邻断裂点的序列;最小修复基质)。然而,当插入与切割位点侧翼序列的缺失一起发生时,具有的DNA同源性位于缺失区域的上游和下游。例如,由上述变体切割的小鼠ROSA26DNA靶标以及用于修复由每个变体产生之每个切割的最小基质示于图17中。本发明的主题还包括组合物,其特征在于包含上述至少一个大范围核酸酶(变体或单链衍生嵌合大范围核酸酶)和/或编码所述大范围核酸酶的至少一个表达载体。在所述组合物的一个优选实施方案中,它包含如上定义的靶向DNA构建体。优选地,所述靶向DNA构建体包含在重组载体中或者包含在表达载体中,所述表达载体包含编码本发明大范围核酸酶的多核苷酸。本发明的主题还包括上述大范围核酸酶、一种或两种核苷酸(优选包含在表达载体中)用于小鼠R0SA26基因座的非治疗目的基因组改造的用途。根据所述用途的一个有利实施方案,其用于在小鼠R0SA26基因座的目的位点(包含DNA靶标序列)引入双链断裂,从而诱导DNA重组事件、DNA的损失或细胞死亡。根据本发明,所述双链断裂用于修饰R0SA26基因座的特定序列,削弱或激活内源性R0SA26基因座,在R0SA26基因座的目的位点引入突变,引入外源基因或其部分,失活或缺失内源性R0SA26基因座或其部分,染色体臂移位,或使DNA不修复并被降解。根据所述用途的另一有利实施方案,所述变体、核苷酸、载体与上述靶向DNA构建体相关联。在本发明大范围核酸酶用途的一个优选实施方案中,它至少包括以下步骤1)在小鼠R0SA26基因座的目的位点(其包含所述大范围核酸酶的至少一个识别和切割位点)引入双链断裂,其通过将所述切割位点与所述大范围核酸酶接触来实现;2)提供靶向DNA构建体,其包含侧翼序列与靶基因座具有同源性的待引入序列。所述大范围核酸酶可以直接提供给细胞或通过表达载体来提供,所述表达载体包含编码所述大范围核酸酶并适用于在所使用细胞中表的多核苷酸序列。该策略用来在靶标位点引入DNA序列,例如用于产生可用于生产蛋白质、基因功能研究、药物开发(药物筛选)或作为疾病模型的敲入转基因小鼠或重组小鼠细胞系。本发明的主题还包括用于制备表达目的产物的转基因小鼠的方法,该方法包括至少以下步骤(a)将上述大范围核酸酶引入小鼠多能前体细胞或小鼠胚胎,从而诱导R0SA26基因座目的位点的双链切割,所述目的位点包含所述大范围核酸酶的DNA识别和切割位点;并且同时或连续地(b)向步骤(a)的小鼠前体细胞或胚胎引入靶向DNA,其至少包含编码侧翼序列与切割位点周围区域具有同源性之目的产物的序列,从而产生基因组经修饰的小鼠前体细胞或胚胎(其具有通过在靶向DNA和染色体DNA之间进行同源重组而插入的目的序列),(c)使步骤(b)的基因组经修改小鼠前体细胞或胚胎发育成嵌合小鼠,以及(d)从步骤(C)的嵌合小鼠得到转基因小鼠。优选地,步骤(C)包括将步骤(b)中产生的基因组修饰前体细胞引入囊胚,从而生成嵌合小鼠。根据所述方法的一个优选实施方案,其包括另一步骤(e)以任何方式从转基因小鼠中回收目的产物。本发明的主题还包括制备表达目的产物的重组小鼠细胞,其包括至少以下步骤(a)将上述大范围核酸酶引入小鼠细胞,从而诱导R0SA26基因座目的位点的双链切割,所述目的位点包含所述大范围核酸酶的DNA识别和切割位点;并且同时或连续地(b)向步骤(a)的小鼠细胞引入靶向DNA,其至少包含编码侧翼序列与切割位点周围区域具有同源性之目的产物的序列,从而产生重组小鼠细胞(其具有通过在靶向DNA和染色体DNA之间进行同源重组而插入的目的序列),(c)以任何适当的方法分离步骤(b)中的重组小鼠细胞。根据所述方法的一个优选实施方案,其包括另一步骤(d),以任何方法从重组小鼠细胞中回收目的产物。所述靶向DNA在适合于将靶向DNA引入目的位点的条件下被引入细胞。在一个优选的实施方案中,所述靶向DNA构建体被插入载体中。被修饰的细胞可以是任何目的细胞。为制备转基因小鼠,所述细胞是多能前体细胞例如本领域熟知的胚胎源性干细胞(ES细胞)。为制备重组小鼠细胞系,所述细胞有利地可以是NSO、SP2/0(BALB/c骨髓瘤;ECACC#85110503和#85072401)或L(ATCC#CRL_2648)细胞。所述大范围核酸酶可以直接提供给细胞或通过表达载体提供给细胞,所述表达载体包含编码所述大范围核酸酶和适于其在所使用细胞中表达的多核苷酸序列。为了制备表达目的产物的转基因动物/重组细胞系,靶向DNA包含编码目的产物(蛋白质或RNA)的序列,以及最终的选择性标记基因,其侧翼为上述小鼠R0SA26基因座中大范围核酸酶位点的上游和下游序列,从而生成在R0SA26基因座中的大范围核酸酶位点处整合了目的外源序列的基因组经修饰细胞(动物前体细胞或胚胎/动物或人细胞),其通过同源重组来实现。目的序列可以是任何编码特定目的蛋白质/肽的基因,包括但不限于报告基因、受体、信号分子、转录因子、药物活性蛋白质和肽、致病基因产物和毒素。所述序列也可编码目的RNA分子,包括例如siRNA。外源序列的表达可由内源性R0SA26启动子或由异源启动子(优选普遍表达启动子或组织特异性启动子,组成型或诱导型)驱动,如上文所述。此外,目的序列的表达可以是条件性的;该表达可通过位点特异性重组酶(Cre、FLP...)来诱导。因此,将目的序列插入合适的盒中,所述盒可包括与所述目的基因有效连接的异源启动子以及一种或多种功能性序列包括但不限于(选择)标记基因、重组酶识别位点、多聚腺苷酸信号、剪接受体序列、内含子、用于蛋白质检测的标签和增强子。或者,所述适当的盒可包含与所述目的基因有效连接的内部核糖体进入位点(IRES)以及一种或多种功能性序列包括但不限于=IRES-Hygro基质(pCLS1675)、(选择)标记基因、重组酶识别位点、多聚腺苷酸信号、剪接受体序列、内含子、用于蛋白质检测的标签和增强子。大范围核酸酶可作为多肽或作为编码所述多肽的多核苷酸构建体来使用。通过本领域熟知的任何方便的、适合于特定细胞类型的方法(单独地或与至少一种合适的介质或载体和/或与靶向DNA组合)将其引入小鼠细胞。根据本发明用途的一个有利的实施方案,所述大范围核酸酶(多肽)与以下组合_脂质体、聚乙烯亚胺(PEI);在这些情况下施用所述组合并因此将其引入躯体靶细胞内。-膜易位肽(Bonetta,TheScientist,2002,16,38;Ford等,GeneTher.,2001,8,1-4;Wadia和Dowdy,Curr.Opin.Biotechnol.,2002,13,52-56);在这样的情况下,将变体/单链大范围核酸酶的序列与膜易位肽的序列融合(融合蛋白)。根据本发明用途的另一有利的实施方案,将大范围核酸酶(编码所述大范围核酸酶的多核苷酸)和/或靶向DNA插入载体中。可通过大量方法(例如注射、直接摄入、发射物轰击、脂质体、电穿孔)将包含靶向DNA和/或编码大范围核酸酶的核酸引入细胞中。可使用表达载体在细胞中稳定或瞬时地表达大范围核酸酶。在真核细胞中表达的技术是本领域技术人员公知的(见CurrentProtocolsinHumanGenetics第12章“VectorsForGeneTherapy”&第13章“DeliverySystemsforGeneTherapy”)。任选地,可优选在重组蛋白中掺入核定位信号以确保其在细胞核内表达。一旦进入细胞内,大范围核酸酶和包含靶向DNA和/或编码大范围核酸酶的核酸的载体(如果存在的话)被细胞从胞质输入或易位至细胞核内的作用位点。在本发明用途的一个实施方案中,大范围核酸酶基本上是非免疫原性的,即不引发或几乎不引发不利的免疫应答。根据本发明可使用大量改善或消除这类有害免疫反应的方法。在一个优选的实施方案中,大范围核酸酶基本不含N-甲酰基蛋氨酸。避免不想要的免疫反应的另一种方式是将大范围核酸酶与聚乙二醇(〃PEG")或聚丙二醇(〃PPG")(优选500到20,000道尔顿的平均分子量(MW))缀合。与PEG或PPG缀合(例如Davis等(US4,179,337)所述)能够提供具有抗病毒活性的非免疫原性的生理活性水溶性内切核酸酶缀合物。Saifer等(US5,006,333)中还描述了使用聚乙-聚丙二醇共聚物的类似方法。本发明还涉及通过上文所述的多核苷酸或载体(优选表达载体)修饰的原核或真核宿主细胞。本发明还涉及非人转基因动物或转基因植物,其特征是其所有或部分细胞通过上文所述的多核苷酸或载体进行了修饰。本文使用的“细胞”是指原核细胞如细菌细胞,或真核细胞如动物、植物或酵母细胞。本发明的主题还包括如上所述的至少一种大范围核酸变体作为制备其它大范围核酸酶之骨架的用途。例如,为制备新的第三代大范围核酸酶的目的,可对所述变体进行第三轮的诱变和选择/筛选。大范围核酸酶的不同用途以及使用本发明大范围核酸酶的方法还包括使用I-CreI变体、衍生自所述变体的单链嵌合大范围核酸酶、编码所述变体或单链嵌合大范围核酸酶的多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物的用途,如上所述。可通过改造能够切割小鼠R0SA26基因座的基因组DNA靶序列的I-CreI变体的方法获得本发明的I-CreI变体,其包括至少以下步骤(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,位于I-CreI的2640位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,位于I-CreI的4477位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)I-CreI位点中-10-8位的核苷酸三联体已被替换为存在于所述基因组靶标中-10-8位的核苷酸三联体,且(ii)+8+10位的核苷酸三联体已被替换为存在于所述基因组靶标中-10-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)I-CreI中-5-3位的核苷酸三联体已被替换为存在于所述基因组靶标中-5-3位的核苷酸三联体,且(ii)+3+5位的核苷酸三联体已被替换为存在于所述基因组靶标_5-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I_CreI位点的变体,其中至少(i)I-CreI位点中+8+10位的核苷酸三联体已被替换为存在于所述基因组靶标中+8+10位的核苷酸三联体,且(ii)-10-8位的核苷酸三联体已被替换为存在于所述基因组靶标+8+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)I-CreI位点+3+5位的核苷酸三联体已被替换为存在于所述基因组靶标+3+5位的核苷酸三联体,且(ii)_5-3位的核苷酸三联体已被替换为存在于所述基因组靶标+3+5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两种变体的2640位和4477位中的突变组合到单个变体中,获得切割下述序列的新的同二聚体I-CreI变体,所述序列中(i)-10-8位的核苷酸三联体与存在于所述基因组靶标-10-8位的核苷酸三联体相同,(ii)+8+10位的核苷酸三联体与存在于所述基因组靶标-10-8位的核苷酸三联体的反向互补序列相同,(iii)"5_3位的核苷酸三联体与存在于所述基因组靶标_5-3位的核苷酸三联体相同,和(iv)+3+5位的核苷酸三联体与存在于所述基因组靶标_5-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两种变体的2640位和4477位中的突变组合在单个变体中,获得切割下述序列的新的同二聚体I-CreI变体,所述序列中(i)+3+5位的核苷酸三联体与存在于所述基因组靶标+3+5位的核苷酸三联体相同,(ii)-5-3位的核苷酸三联体与存在于所述基因组靶标+3+5位的核苷酸三联体的反向互补序列相同,(iii)I-CreI位点+8+10位的核苷酸三联体被替换为存在于所述基因组靶标+8+10位的核苷酸,和(iv)-10-8位的核苷酸三联体与存在于所述基因组靶标+8+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和(h)中获得的变体组合,形成异二聚体,和(j)选择和/或筛选来自步骤⑴的能够切割位于小鼠R0SA26基因座中的所述基因组DNA靶标的异二聚体。可省略步骤(C)、(d)、(e)或(f)之一。例如,如果省略步骤(C),则步骤(d)用这样的突变体I-CreI位点进行,所述位点中-10-8位和-5-3位的两个核苷酸三联体已被分别替换为存在于所述基因组靶标-10-8位和-5-3位的核苷酸三联体,且+3+5位和+8+10位的核苷酸三联体已分别被替换为存在于所述基因组靶标_5-3位和-10-8位的核苷酸三联体的反向互补序列。步骤(a)、(b)、(g)、(h)和⑴还可包括在下述位置引入另外的突变接触DNA靶序列或者直接或间接地与所述DNA靶标相互作用的位置,改善突变体的结合和/或切割特性的位置,或防止形成功能性同二聚体的位置,如上所述。这可通过如国际PCT申请WO2004/067736中所述产生组合文库来进行。改造本发明I-CreI变体的方法有利地包括将随机突变引入整个变体或变体的部分中,尤其是引入变体的C端一半(80163位)中,以改善突变体针对来自目的基因的DNA靶标的结合和/或切割特性。可根据本领域公知的市售标准诱变方法,通过对变体池(pool)产生随机诱变文库来进行诱变。优选地,诱变在步骤(i)中形成或步骤(j)中获得的异二聚体的单体之一的整个序列上进行,有利地在单体池上进行,优选地在步骤(i)或(j)的异二聚体的两个单体上均进行诱变。优选根据Arnould等,J.Mol.Biol.,Epub2007年5月10日的图4所阐述的过程进行两轮选择/筛选。在第一轮中,对异二聚体的单体之一进行诱变(图4中的单体Y),与另一单体(图4中的单体χ)共表达以形成异二聚体,并针对来自目的基因的靶标选择改进的单体Y+。在第二轮中,对另一单体(单体X)进行诱变,与改进的单体Y+共表达形成异二聚体,并针对来自目的基因的靶标进行选择,以获得具有改进活性的大范围核酸酶(X+Y+)。可根据公知的重叠PCR技术,通过扩增包含两个亚结构域中各一个的重叠片段来进行步骤(g)和(h)中的(分子内)突变组合。通过将来自步骤(g)的一个变体与来自步骤(h)的一个变体共表达以允许其形成异二聚体来进行步骤(i)中的(分子间)变体组合。例如,可用编码所述变体的一个或两个重组表达载体来修饰宿主细胞。然后在允许变体表达的条件下培养细胞,从而在宿主细胞中形成异二聚体。如国际PCT申请WO2006/097854以及Arnould等,J.Mol.Biol.,2006,355,443-458中所述。可如国际PCT申请WO2004/067736;Arnould等,J.Mol.Biol.,2006,355,443-458;Epinat等,NucleicAcidsRes.,2003,31,2952-2962以及Chames等,NucleicAcidsRes.,2005,33,el78中所述,通过使用体外或体内切割测定来进行步骤(c)、(d)、(e)、(f)和/或(j)中的选择和/或筛选。根据所述方法的另一个优选的实施方案,通过重组介导的所述DNA双链断裂的修复在下述条件下在体内进行步骤(c)、(d)、(e)、(f)和/或(j),在所述条件下,由所述变体产生的突变DNA靶序列中的双链断裂导致阳性选择标记或报告基因的激活或者阴性选择标记或报告基因的失活。本发明的主题还包括在I-CreI的2640位和/或4477位含有突变的I-CreI变体,其适用于改造能够切割来自R0SA26基因座的DNA靶标的本发明变体。具体地,本发明涵盖用于改造I-CreI变体的方法之步骤(c)到(f)中的I-CreI变体,如上所述,包括mlml8变体(表II,SEQIDNO3855),包含Q44V、R70A和D75N的变体(SEQIDNO131;表III),以及包含K28E、Y33R、Q38R、S40R和D75N的变体(SEQIDNO:132;表III)。本发明还包括用于改造I-CreI变体的方法之步骤(g)和(h)中的I-CreI变体,如上所述,包括SEQIDNO:6067(表III的组合变体)序列的变体。能够切割来自目的基因的DNA靶标的单链嵌合大范围核酸酶通过本领域公知的方法衍生自本发明的变体(Epinat等,NucleicAcidsRes.,2003,31,2952-62;Chevalier等,Mol.Cell.,2002,10,895-905;Steuer等,Chembiochem.,2004,5,206-13;国际PCT申请WO03/078619和WO2004/031346)。任何这些方法都可用于构建衍生自本发明所述变体的单链嵌合大范围核酸酶。编码本发明所定义变体的多核苷酸序列可利用已知方法由本领域技术人员制备。例如,它们是从cDNA模板通过特异性引物的聚合酶链反应扩增而来。优选地,所选择的所述cDNA的密码子有利于所述蛋白质在所需表达系统中表达。包含所述多核苷酸的重组载体可通过公知的重组DNA和基因工程技术获得并引入宿主细胞。本发明定义的I-CreI变体或单链衍生物通过表达上述多肽来产生;优选地,所述多肽表达或共表达(只在变体情形中)在宿主细胞或转基因动物/植物(被一种表达载体或两种表达载体(只在变体情形中)修饰)中,其在适于表达或共表达该多肽的条件下进行,从宿主细胞培养物或从转基因动物/植物中回收变体或单链衍生物。除非另有说明,本发明的实践将使用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、DNA重组和免疫学的常规技术,属于本领域技巧。这些技术在文献中有充分角军释。见,例如,CurrentProtocolsinMolecularBiology(FrederickΜ·AUSUBEL,2000,WileyandsonInc,LibraryofCongress,USA);分子克隆实验室手册,第三片反,(Sambrook等,2001,ColdSpringHarbor,NewYorkCoIdSpringHarborLaboratoryPress);OligonucleotideSynthesis(M.J.Gaited.,1984);Mullis禾IjNo.4,683,195;NucleicAcidHybridization(B.D.Harries&S.J.Higginseds.1984);TranscriptionAndTranslation(B.D.Hames&S.J.Higginseds.1984);CultureOfAnimalCells(R.I.Freshney,AlanR.Liss,Inc.,1987);ImmobilizedCellsAndEnzymes(IRLPress,1986);B.PerbaliAPracticalGuideToMolecularCloning(1984);MethodsInENZYMOLOGYM^J(J.AbelsonandM.Simon,eds.-in-chief,AcademicPress,Inc.,NewYork),特别是154和155卷(Wu等eds.)和185卷,“GeneExpressionTechnology“(D.Goeddel,ed.);GeneTransferVectorsForMammalianCells(J.H.Miller禾口Μ·P.Caloseds.,1987,ColdSpringHarborLaboratory);ImmunochemicalMethodsInCellAndMolecularBiology(MayerandWalker,eds.,AcademicPress,London,1987);HandbookOfExperimentalImmunology,I到IV卷(D.Μ.Weir禾口C.C.Blackwel1,eds.,1986);以及ManipulatingtheMouseEmbryo,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1986)。除了上述特征,本发明还包括如下的描述中出现的其它功能,其是举例说明本发明的I-CreI大范围核酸酶变体及其用途的实例以及附图,其中-图1代表小鼠R0SA26基因座(EMBL登记号CQ880114;SEQIDNO3)。外显子加框显示(外显子1:24902599位,来自转录物1的外显子2:82289248位;来自转录物2中的外显子3起始于11845位,并与反义转录物(其终止于11505位)大范围重叠。迄今鉴定的这三种转录物以及靶标rosal的序列及位置被显示(SEQIDN0:15)。-图2代表I-CreI归巢内切核酸酶与其靶标DNA结合的三维结构。催化核心周围是两个αββαββα折叠,在DNA大沟以上形成鞍形的相互作用界面。-图3示意改造出I-CreI和其它LAGLIDADG归巢内切核酸酶之特异性的两步法。通过半推理性诱变原始骨架蛋白以及筛选特异性局部改变的功能性变体来产生大量I-CreI衍生物。然后,使用组合方法将这些突变体组装成具有完全重新设计之特异性的大范围核酸酶。同二聚体蛋白(“半大范围核酸酶”)通过组合同一αββαββα折叠内的两组突变来产生,共表达两种这样的“半大范围核酸酶”可得到切割目的靶标的异二聚体(“定制大范围核酸酶”)。-图4代表使用大范围核酸酶切割小鼠R0SA26基因座的策略。使用大范围核酸酶诱导的同源重组的基因插入将目的基因敲入小鼠R0SA26基因座中。内含子和外显子序列可以作为同源区域。-图5代表rosal靶序列及衍生产物。10GGG_P、5GAT_P和5TAT_P是由先前获得的I-CreI突变体切割的近似衍生物。它们与C1221(由I-CreI骨架蛋白切割的回文序列)的不同在于框中的基序。C1221、10GGG_P、5GAT_P和5TAT_P最初描述为24bp的序列,但结构数据显示,只有22bp与蛋白质/DNA相互作用相关。然而,士12位在括号内标出。rosal是位于小鼠R0SA26基因座8304位的DNA序列。在rosal.2靶标中,靶标中部的GTTC序列被C1221中的GTAC碱基替代。rosal.3是衍生自rosal.2左侧部分的回文序列,rosal.4是衍生自rosal.2右侧部分的回文序列。如图所示,在rosal系列靶标中发现了10GGG_P、5GAT_P和5TAT_P中加框的基序。-图6代表pCLS1055载体图。-图7代表pCLS0542载体图。-图8示意I-CreI突变体切割rosal.3DNA靶标。初步筛选中发现的63个阳性被重新安排在一个96孔板中并通过二次筛选验证(一式四份)。圈出了实施例2中选择的22个突变体。-图9示意了I-CreI组合突变体切割rosal.4靶标。初步筛选中发现的69个阳性被重新安排在一个96孔板中并通过二次筛选验证(一式四份)。圈出了实施例3中选择的15个突变体。-图10示意pCLS1107载体图。-图11示意异二聚体的I-CreI组合突变体切割rosal.2和rosal靶标。A用rosal.2靶标筛选I-CreI突变体组合的实例。B用rosal靶标筛选同样的I-CreI突变体组合。B5、B6、D5、D6、F5、F6、H5和H6表达切割rosal.3之I-CreI突变体的酵母菌株,其用pCLS1107空质粒DNA进行转化。-图12示意rosal靶标的切割。将一系列切割rosal.4的I-CreI突变体随机诱变与切割rosal.3的突变体共表达。用rosal靶标测试切割。在每个四点聚簇中,右边的两个点对应于切割rosal的一个原始异二聚体(一式两份),而左边的两个点对应于相同的突变rosal.4切割体,该切割体与非突变的rosal.3切割体共表达(突变体ml3,在表IV和表V中描述)。这两种显示改进的rosal切割的优化突变体被圈出,并对应于突变体ml3与M0_1(ClO)或者ml3与M0_2(E2)的共表达。M0_1和M0_2在表VI中进一步描述。-图13示意rosal靶标的切割。将一系列切割rosal.3的I-CreI突变体被随机诱变并与精制的切割rosal.4之突变体共表达。用rosal靶标测试切割。显示有效切割rosal的突变体被圈出。在滤膜上-Bll对应于异二聚体S19、V24、Y44、R68、S70、N75、V77+E28、R33、R38、K40、A44、H68、Q70、A105、R107、A151、G153、E158;-C9对应于异二聚体S19、V24、Y44、R68、S70、Q75、I77+E28、R33、R38、K40、A44、H68、Q70、A105、R107、A151、G153、E158;-Cll和E8对应于异二聚体V24、Y44、S68、S70、R75、I77、A105+E28、R33、R38、K40、A44、H68、Q70、A105、R107、A151、G153、E158;以及-E6对应于异二聚体V24、Y44、S68、S70、R75、177、G79+E28、R33、R38、K40、A44、H68、Q70、A105、R107、A151、G153、E158。-HlO是阴性对照,Hll和H12是不同强度的阳性对照。为了比较异二聚体在改进切割rosal.3靶标之突变体之前和之后针对rosal靶标的活性在每个聚簇中,右边两个点是实施例5中所述的异二聚体之一,左边两个点是具有实施例6中所述突变的异二聚体。-图14代表pCLS1058载体图。-图15代表pCLS1069载体图。-图16中示意在CHO细胞染色体外模型中由I-CreI精制突变体切割rosal靶标。显示了两个转染实验的数值。同一实验中的由I-CreIN75和I-SceI切割的I-CreI和I-SceI靶标做为阳性对照。-图17代表小鼠R0SA26中发现的大范围核酸酶靶序列和相应的能够切割每个所述DNA靶标的I-CreI变体。显示了DNA靶标序列(第1列)与其位置(第2列)。用于修复靶位点处切割的最小修复基质通过其第一个核苷酸(起始,第5列)和最后一个核苷酸(终点,第6列)标出。每个变体序列通过指定位置的氨基酸残基来定义。例如,图17的第一异二聚体变体由第一单体(在28、30、32、33、38、40、44、68、70、75和77位分别具有K、H、S、S、Q、S、Ε、C、S、N和I)和第二单体(在28、30、32、33、38、40、44、68、70、75和77位分别具有1(、0、5、1、1\5^、5、0、10组成。所述位置参照I-CreI序列SWISSPR0TP05725(SEQIDNO1)标出;I-CreI在第28、30、32、33、38、40、44、68、70、75和77位分别具有K、N、S、Y、Q、S、Q、R、R、D禾口I。-图18代表pCLS1675载体图。-图19代表pCLS1761载体图。-图20代表pCLS1762载体图。-图21示意使用IRES-Hygro基质(pCLS1675)的敲入(KI)事件的PCR分析。野生型R0SA26基因座克隆和潮霉素⑶S随机插入的克隆在PCR中是阴性的。在R0SA26基因座具有KI事件的克隆在PCR中阳性。具有KI事件和随机插入的克隆在PCR中也是阳性。实施例1用于改造切割小鼠R0SA26基因座之新的大范围核酸酶的策略使用Smith等,NucleicAcidsRes.,2006以及图3中所描述的组合方法,改造I-CreI的DNA结合结构域,并切割名称为rosal、位于小鼠R0SA26基因座的外显子2中8304位的22bp(非回文)序列(图5)(登记号CQ880114;SEQIDNO3)。切割rosal序列的大范围核酸酶可用于将基因敲入小鼠R0SA26基因座中(图4)。应用在以下领域在小鼠细胞中生产重组蛋白、改造重组细胞系,例如用于药物筛选的目的,改造转基因小鼠,例如用作动物模型。该rosal序列是被先前鉴定的大范围核酸酶切割的10GGG_P、5GAT_P和5TAT_P的拼接物(图5),如通过国际PCT申请W02006/097784,W02006/097853和WO2007/049156;Arnould等,J.Mol.Biol.,2006,355,443-458和Smith等,NucleicAcidsRes.,Epub2006年11月27日中所述而获得。因此,rosal可以被组合了切割这三个靶标之I-CreI衍生物中发现的突变的大范围核酸酶所切割。10GGG_P、5GAT_P和5TAT_P序列是C1221(被I-CreI切割的回文序列)的24bp衍生物(国际PCT申请WO2006/097784,WO2006/097853和WO2007/049156;Arnould等,J.Mol.Biol.,2006,355,443-458以及Smith等,NucleicAcidsRes.,Epub2006年11月27日)。然而,I-CreI与其DNA靶标结合的结构表明,这些靶标(-12和12位)的两个外部碱基对结合和切割都没有影响(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.禾口StoddardB.L.,NucleicAcidsRes.,2001,29,3757—3754;Chevalier等,J.Mol.Biol.,2003,329,253-269),并且在这项研究中,只考虑了-1111位。因此,rosal系列靶标被定义为22bp的序列,而非24bp。Rosal与C1221的差异在于4bp中央区域的一个碱基对。根据与其靶标结合的I-CreI蛋白质的结构,4个中央碱基对(-2到2位)不与I-CreI蛋白接触(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.和StoddardB.L.,NucleicAcidsRes.,2001,29,3757-3754;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此,假设在这些位置的碱基不影响结合效率。然而,它们能够影响由该区域边缘处的两个缺口所引起的切割。因此,首先用来自C1221的GTAC序列替换-2到2的GTTC序列得到靶标rosal.2(图5)。然后,从rosal.2衍生两种回文靶标,rosal.3和rosal.4(图5)。由于rosal.3和rosal.4是回文的,它们应当被同二聚体蛋白质切割。因此,首先设计能够切割rosal.3和rosal.4序列的同源二聚体蛋白质(实施例2和3),随后将它们共表达以获得切割rosal的异二聚体(实施例4)。可鉴定切割和rosal的rosal.2靶标的异二聚体。为提高对rosal靶标切割的活性,我们选择一系列切割rosal.3和rosal.4的选定突变体,然后进行精制;将所选突变体进行随机诱变,用于形成针对rosal靶标筛选的新异二聚体(实施例5和6)。最后,可鉴定出切割rosal靶标的异二聚体,其在酵母及CHO细胞中表现出高的切割活性。实施例2制备切割rosal.3的大范围核酸酶该实施例显示,I-CreI突变体可切割衍生自rosal靶标左侧部分的回文形式rosal.3DNA靶序列(图5)。本实施例中描述的靶序列是22bp的回文序列。因此,仅通过前11个核苷酸对它们进行描述,后接后缀P。例如,靶标rosal·3还被记为caacatgatgt_P;SEQIDNO:35。该rosal.3靴标在士1、士2、士3、士4、士5、士7、士9、士10和士11位与56六1"_卩相似,这两个序列仅在士6和士8位不同。推测士6位对结合和切割活性影响不大。先前通过在I-CreIN75的第24、44、68、70、75和77位诱变获得能够切割5GAT_P(caaaacgatgt_P;SEQIDNO32)的突变体,在Arnould等,J.Mol.Biol.,2006,355,443-458以及国际PCT申请WO2006/097784和WO2006/097853中有所描述。在该实施例中,检查切割5GAT_P靶标的突变是否也可以切割rosal.3靶标。1)材料和方法用于产生大范围核酸酶变体的方法和基于在哺乳动物或酵母细胞中切割诱导重组的测定(其用于筛选特异性改变的变体)在国际PCT申请WO2004/067736;Epinat等,NucleicAcidsRes.,2003,31,2952-2962;Chamesφ,NucleicAcidsRes.,2005,33,el78,和Arnould等,J.Mol.Biol.,2006,355,443-458中有描述。这些测定产生功能性LacZ报告基因,其可通过标准方法监测。a)构建靶标载体如下克隆靶标从PR0LIG0订购对应于侧翼是gateway克隆序列之靶序列的寡核昔酸5'tggcatacaagtttcaacatgatgtacatcatgttgacaatcgtctgtca3'(SEQIDN0:37)。使用Gateway方法(Invitrogen)将通过PCR扩增单链寡核酸产生的双链靶DNA克隆进酵母报告载体(PCLS1055,图6)中。将酵母报告基因载体转化进酿酒酵母菌株FYBL2-7B(MATa,ura3A851,trplΔ63,leu2A1,lys2Δ202)。b)I-CreI突变体在文库中鉴定切割5GAT_P的I-CreI突变体,其中I-CreI的24、44、68、70、75禾口77位都发生了突变,如先前Arnould等,J.Mol.Biol.,2006,355,443-458以及国际PCT申itWO2006/097784和W02006/097853中所述。将它们克隆进DNA载体(pCLS0542,图7)中并在酿酒酵母菌株FYC2-6A(ΜΑΤα,trplΔ63,leu2Δ1,his3Δ200)中表达。c)表达大范围核酸酶之克隆的接合并在酵母中筛选如先前所述(Arnould等,J.Mol.Biol.,2006,355,443-458)进行筛选。利用菌落网格(gridder)(QpixILGenetix)进行接合。使用低网格密度(约4个点/cm2)将突变体置于覆盖在YPD平板上的尼龙滤纸上的网格中。在相同的滤纸上进行第二次划网格的过程,以针对每个靶标点出由含不同报告基因之酵母菌株组成的第二层。将膜置于富含固体琼脂YPD的培养基上,并在30°C孵育一夜,以允许接合。接着,将滤纸转移至缺乏亮氨酸和色氨酸,且含有半乳糖(2%)作为碳源的合成培养基上并在37°C孵育五天,以选择带有表达载体和靶标载体的二倍体。5天后,将滤纸置于pH7.O的0.5M磷酸钠缓冲液,含有0.02%X-Gal.O.1%SDS、6%二甲基甲酰胺(DMF)、7mMβ-巯基乙醇、1%琼脂糖的固体培养基上并在37°C孵育,以监测半乳糖苷酶活性。通过扫描来分析结果,使用适当的软件进行定量。d)突变体测序为回收表达突变体的质粒,采用标准的方法提取酵母DNA并用于转化大肠杆菌。利用MILLEGENSA对质粒进行突变体ORF测序。或者,通过PCR从酵母DNA扩增ORF(Akada等,Biotechniques,2000,28,668-670),并利用MILLEGENSA对PCR产物直接进行测序。2)结果切割5GAT_P靶标的I-CreI突变体(先前在文库中鉴定,其中I-CreI的24、44、68、70、75和77位被突变)是针对rosal.3靶标DNA切割而筛选的(caacatgatgt_P;SEQIDNO35)。共发现63个阳性克隆,被重新安排在96孔板中并通过二次筛选验证(图8)。在这些阳性克隆中,22个(图8中圈出)被选中。对这22个阳性克隆进行测序。它们对应于切割rosal.3靶标的18种不同的新内切核酸酶(命名为mlml8=SEQIDNO3855;表II)。表II能够切割rosal.3DNA靶标的Ι-Crel突变体序歹Ij24,44,68,70,75和77图8中的位置名称SEQID位的氨基酸NO(例如VYRSYI代表V24,Y44,R68,S70,Y75和177)38AlandF3mlVYRSYI<table>tableseeoriginaldocumentpage32</column></row><table><table>tableseeoriginaldocumentpage33</column></row><table>*ml0中的82T是预期之外的突变,其可能由于酵母DNA测序前的PCR反应所引入的错误。实施例3制备切割rosal.4的大范围核酸酶该实施例表明,I-CreI突变体可切割衍生自回文形式rosal靶标右侧部分的rosal.4DNA靶序列(图5)。该实施例中所述的所有靶标序列均为22bp回文序列。因此,仅通过前11个核苷酸对其进行描述,后接后缀_P。例如,rosal.4还被记为tgggattatgt_P(SEQIDNO36)。该rosal.4靶标在士1、士2、士3、士4、士5、士7位与5TAT_P相似,在士1、士2、士7、士8、士9和士10位与10GGG_P相似。推测士6和士11位对结合和切割活性影响不大。先前通过在I-CreIN75的第44、68、70位诱变获得能够切割5TAT_P的突变体,如Arnould等,J.Mol.Biol.,2006,355,443-458以及国际PCT申请WO2006/097784和WO2006/097853中有所描述。先前通过在I-CreIN75的第28、30、33、38、40和70位诱变获得能够切割10GGG_P的突变体,如Smith等,NucleicAcidsRes.,Epub2006年11月27日以及国际PCT申请WO2007/049156所述。这两组蛋白质都在70位发生了突变。然而,推测存在有两个可分离的功能性亚结构域。这意味着该位置对靶标碱基士810的特异性几乎没有影响。因此,为检验组合突变体是否能够切割rosal.4靶标,将来自切割5TAT_P(caaaactatgt_P;SEQIDNO33)蛋白之中44、68和70位的突变与来自切割10GGG_P(cgggacgtcgt_P;SEQIDNO31)蛋白之中的28、30、33、38和40位的突变组合。1)材料和方法实验步骤如实施例2所述,如下组合突变体的构建在Smith等,NucleicAcidsRes.Epub2006年11月27日;国际PCT申请WO2007/049156,以及Arnould等,J.Mol.Biol.,2006,355,443-458;国际PCT申请WO2006/097784和WO2006/097853中,分别针对10GGG_P或5TAT_P靶标鉴定切割10GGG_P或5TAT_P的I-CreI突变体。为了产生含有来自两个系列的突变的I-CreI衍生编码序列,进行单独的重叠PCR反应,扩增I-CreI编码序列5'端(氨基酸143位)或3‘端(39167位)的。对5'和3'端二者而言,使用特异性针对载体(PCLS0542,图7)的引物GallOF(5‘-gcaactttagtgctgacacatacagg-3‘(SEQIDNO:56))或GallOR(5'-acaaccttgattggagacttgacc-3'(SEQIDNO:57)),以及特异性针对I-CreI编码序列3943位氨基酸的引物assF(5,-ctannnttgaccttt-3,(SEQIDNO58))或assR(5,-aaaggtcaannntag-3,(SEQIDN0:59)),其中,nrrn编码残基40。将得自使用相同引物并具有残基40相同编码序列进行的扩增反应对PCR片段合并。然后,将得自使用引物GalIOF和assR或assF和GalIOR的反应的各个PCR片段库以等摩尔比混合。最后,使用高效LiAc转化方案(Gietz和Woods,MethodsEnzymol,2002,350,87-96),使用两种重叠PCR片段各约25ng以及75ng经NcoI和EagI消化而线性化的载体DNA(pCLS0542)转化酿酒酵母菌株FYC2-6A(ΜΑΤα,trplA63,IeuAl,his3A200)。通过酵母中的体内同源重组来产生含有两组突变的完整编码序列。2)结果通过将44、68和70位的突变与I-CreIN75骨架中的28、30、33、38和40位的突变组合来构建I-CreI组合突变体,产生复杂度2208的文库。组合突变体的实例在表III中显示。将该文库转化进酵母中,并对3456个克隆(多样性的1.5倍)筛选针对r0Sal.4DNA靶标(tgggattatgt_P;SEQIDNO36)的切割。共发现了69个阳性克隆并重新安排在96孔板中并通过二次筛选验证(图9)。在这些阳性克隆中,15个(图9中圈出)被选中。测序后,这15个克隆对应于切割roSal.4DNA靶标的8种不同的新内切核酸酶(SEQIDN0:6067;表III)。表III组合变体切割rosal.4靶标<table>tableseeoriginaldocumentpage35</column></row><table>仅显示了2208种组合中的105种+表示在经测序阳性克隆中发现功能性组合突变体实施例4制备切割rosal的大范围核酸酶在实施例2和3中鉴定了能够切割各回文rosal衍生靶标(rosal.3和rosal.4)的I-CreI突变体。将这些突变体对(一个切割rosal.3,一个切割rosal.4)在酵母中共表达。共表达后,应当存在三种活性分子种类两种同二聚体和一种异二聚体。测定应当形成的异二聚体是否切割非回文rosal和rosal.2DNA靶标。1)材料和方法a)在卡那霉素抗性载体中克隆突变体为了在酵母中共表达两种I-CreI突变体,将切割rosal.4序列的突变体亚克隆进卡那霉素抗性基因标记的酵母表达载体(PCLS1107,图10)中。通过使用PCLS0542和pCLSlIO7的通用引物GalIOF5'-gcaactttagtgctgacacatacagg-3‘(SEQIDNO56)禾口GallOR5'-acaaccttgattggagacttgacc-3‘(SEQIDNO:57)进行的PCR反应来扩增突变体。使用高效LiAc转化方案,使用约25ngPCR片段和经DraIII和NgoMIV消化而线性化的25ng载体DNA(pCLS1107)转化酿酒酵母菌株FYC2-6A(ΜΑΤα,trplΔ63,leu2A1,his3A200)。通过在酵母中体内同源重组来产生I-CreI突变体的完整编码序列。然后,将每个酵母菌株(其含有切割亚克隆进pCLSl107载体之rosal.4靶标的突变体)与表达rosal.4靶标的酵母接合以进行验证。为了回收表达质粒的突变体,采用标准方法提取酵母DNA,并用于转化大肠杆菌和制备大肠杆菌DNA。b)突变体共表达用pCLSl107表达载体中编码切割rosal.4靶标之突变体的DNA转化表达PCLS0542表达载体中切割rosal.3靶标之突变体的酵母菌株。利用-L谷氨酸+G418培养基筛选转化子。c)共表达.大范围核11的克降的接合并在酵母Φ帝诛利用菌落网格(gridder)(QpixII,Genetix)进行接合。使用低网格密度(约4个点/cm2)将突变体置于覆盖在YPD平板上的尼龙滤纸上的网格中。在相同的滤纸上进行第二次划网格的过程,以针对每个靶标点出由含不同报告基因之酵母菌株组成的第二层。将膜置于富含固体琼脂YPD的培养基上,并在30°C孵育一夜,以允许接合。接着,将滤纸转移至缺乏亮氨酸和色氨酸,添加G418,且含有半乳糖(1%)作为碳源的合成培养基上并在37°C孵育五天,以选择带有表达载体和靶标载体的二倍体。5天后,将滤纸置于pH7.0的0.5M磷酸钠缓冲液,含有0.02%X-Gal.O.1%SDS、6%二甲基甲酰胺(DMF)、7πιΜβ-巯基乙醇、琼脂糖的固体培养基上并在37°C孵育,以监测半乳糖苷酶活性。通过扫描来分析结果,使用适当的软件进行定量。结果切割rosal.3靶标的突变体(表II描述的mlml8)与切割rosal.4靶标的8种突变体(表III种所述)共表达,在所有的情形中得到对rosal.2靶标的有效切割(图IlA中显示筛选实施例)。所有测试的组合在表IV中总结。这些组合大部分还可以切割rosal天然靶标,其与rosal.2序列仅在于+1位有Ibp的不同(图5)。如图IlB所示,针对rosal天然靶标观察到的信号与针对rosal.2靶标观察到的信号相比较弱。切割rosalDNA靶标的组合示于表V中。表IV:导致rosal.2靶标切割的组合<table>tableseeoriginaldocumentpage36</column></row><table>+表示异二聚体突变体切割rosal.2靶标魁导致rosal靶标切割的组合<table>tableseeoriginaldocumentpage37</column></row><table>+表示异二聚体突变体切割rosal.2靶标实施例5通过随机诱变切割rosal.4的蛋白质并与切割rosal.3的蛋白质进行组装来精制切割rosal的大范围核酸酶已通过将切割回文rosal.3和rosal.4靶标的突变体进行组装而鉴定了能够切割非回文rosal.2和rosal靶标的I-CreI突变体。然而,这些组合能有效切割rosal.2但弱切割rosal(其与rosal.2仅在于第1位的Ibp的不同)。针对rosal观察到的信号是不够的。因此,对切割rosal的蛋白组合进行了诱变,并筛选了有效切割rosal的突变体。根据与其靶标结合的I-CreI蛋白质的结构,4个中央碱基对(-22位)不与I-CreI蛋白接触(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.禾口B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3574;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此,难以合理地选择一组位置来诱变,在蛋白质的C端部分(最后83个氨基酸)或在整个蛋白质上进行了诱变。随机诱变产生高复杂度文库。因此,通过仅对切割rosal的异二聚体的两个组件之一进行诱变来限制待测试变体文库的复杂度。因此,切割rosal.4的蛋白质被诱变,并测试与切割rosal.3的蛋白质共表达时它们是否有效切割rosal。1)材料和方法a)随机诱变随机诱变文库利用所选突变体的集合来创建,如来自JenaBioscienceGmbH的JBSdNTP诱变试剂盒中的方案所述,通过PCR在两步式PCR方法中进行诱变,所述PCR使用Mn2+或作为8-氧代-dGTP和dPTP的dNTP衍生物。为了在整个蛋白质上随机诱变,所使用的引物是preATGCreFor(5‘-gcataaattactatacttctatagacacgcaaacacaaatacacagcggccttgccacc-3‘;SEQIDNO68)和ICreIpostRev(5‘-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccgc-3';SEQIDNO:69)。为了在所述蛋白质的C末端进行随机诱变,所使用的弓丨物是AA78a83For(5'-ttaagcgaaatcaagccg-3‘;SEQIDNO:70)禾口ICreIpostRev与dNTPs衍生物;蛋白质的其余部分用高保真Taq聚合酶来扩增,并且不使用dNTPs衍生物,使用引物preATGCreFor和AA78a83Rev(5‘-cggcttgatttcgcttaa-3‘;SEQIDNO:71)。使用pCLS0542(图7)和pCLS1107(图10)的通用引物,通过PCR反应扩增突变体集合。使用高效LiAc转化方案,使用约75ngPCR片段和75ng经DraIII和NgoMIV消化而线性化的载体DNA(pCLS1107)转化酿酒酵母菌株FYC2-6A(ΜΑΤα,trplA63,leu2A1,his3A200)。通过在酵母中体内同源重组来产生I-CreI突变体完整编码序列的文库。通过如实施例2中所述的测序方法来验证得到的阳性克隆。b)在含有rosal靶标的酵母菌株中克隆亮氨酸表达载体中的突变体使用高效LiAc转化方案,将pCLS0542载体(LEU2基因标记)中切割rosal.3靶标的突变体转化含有酵母报告基因载体(PCLS1055,图6)中rosal靶标的酵母菌株FYBL2-7B(MATa,ura3A851,trplΔ63,leu2A1,lys2Δ202)。得到的酵母菌株用作实施例4中描述的接合测定的靶标。2)结果将切割rosal.4的四种突变体(ERRR/AHQ、ERRR/ARN、ERRK/AHQ和ERRK/VRA,根据表V)合并,在所有蛋白上或在蛋白质的C末端部分上随机诱变并转化进酵母。4464个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有rosal靶标,(ii)表达切割rosal.3靶标的变体,其选自实施例2中所述的变体。使用三个这样的菌株,其表达I-CreIV24Y44S68S70R75177(或VYSSRI)突变体,I-CreIV24Y44R68S70Q75177(或VYRSQI)突变体,或I-CreIV24Y44R68S70Y75T77(或VYRSYT)突变体(见表II)。发现2个克隆在与这样的酵母菌株接合时,与诱变前的相同酵母菌株相比,引发对rosal靶标更好的切割。总之,鉴定出两种蛋白质当于VYSSRI、VYRSQI或VYRSYT(表VI)异二聚体形成异二聚体时能够有效地切割rosal(图12)。表VI表现出针对rosalDNA靶标之强切割活性的功能性突变体组合<table>tableseeoriginaldocumentpage39</column></row><table>*得自随机诱变的突变使用粗体。实施例6通过随机诱变切割rosal.3的蛋白质并与切割rosal.4的精制蛋白质组装来精制切割rosal的大范围核酸酶通过组装切割rosal.3和切割rosal.4精制突变体,鉴定出能够切割rosal靶标的I-CreI突变体。为了提高大范围核酸酶活性,切割rosal异二聚体的第二组件被诱变。在该实施例中,切割rosal.3突变体被诱变,接着与实施例5中所述的切割rosal.4精制突变体组合筛选更有效的切割rosal的变体。1)材料和方法a)随机诱变随机诱变文库利用所选突变体的集合来创建,如来自JenaBioscienceGmbH的JBSdNTP诱变试剂盒中的方案所述,通过PCR在两步式PCR方法中进行诱变,所述PCR使用Mn2+或作为8-氧代-dGTP和dPTP的dNTP衍生物。为了在整个蛋白质上随机诱变,所使用的引物是preATGCreFor(5‘-gcataaattactatacttctatagacacgcaaacacaaatacacagcggccttgccacc-3‘;SEQIDNO68)和ICreIpostRev(5‘-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccgc-3';SEQIDNO:69)。为了在所述蛋白质的C末端进行随机诱变,所使用的弓丨物是AA78a83For(5'-ttaagcgaaatcaagccg-3‘;SEQIDNO:70)禾口ICreIpostRev与dNTPs衍生物;蛋白质的其余部分用高保真Taq聚合酶来扩增,并且不使用dNTPs衍生物,使用引物preATGCreFor和AA78a83Rev(5‘-cggcttgatttcgcttaa-3‘;SEQIDNO:71)。使用pCLS0542(图7)和pCLS1107(图10)的通用引物,通过PCR反应扩增突变体集合。使用高效LiAc转化方案,使用约75ngPCR片段和75ng以NcoI和EagI消化而线性化的载体DNA(pCLS0542)转化酿酒酵母菌株FYC2_6A(MATα,trplA63,leu2A1,his3A200)。通过在酵母中体内同源重组来产生I-CreI突变体完整编码序列的文库。通过如实施例2中所述的测序方法来验证得到的阳性克隆。b)在含有rosal靶标的酵母菌株中克隆卡那霉素表达载体突变体使用高效LiAc转化方案,将用pCLS1107载体中的M0_1和M0_2精制的突变体(切割rosal.4靶标)转化含有酵母报告载体(pCLS1055,图6)中rosal靶标的酵母菌株FYBL2-7B(MATa,ura3A851,trplΔ63,leu2A1,lys2Δ202)。得到的突变体靴标菌株用作实施例4中描述的接合测定的靶标。2)结果将切割rosal.3的四种突变体的两种集合(根据表V的集合1:VYRSNI、VYYSYR、VYRSNV和VYNSRI以及集合2=VYYSYR,VYSSRI、VYRSQI和VYRSYT)在所有蛋白上或在蛋白质的C末端部分上随机诱变并转化进酵母。然后,将8928个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有rosal靶标,(ii)表达切割rosal.4靶标的变体,使用2个这样的菌株,其表达I-CreIE28R33R38R40A44H68Q70N75A105R107(或M0_1)突变体,或I-CreIE28R33R38K40A44H68Q70N75A105R107A151G153E158(或M0_2)突变体。发现5个克隆在与这样的酵母菌株接合时,与诱变前的相同酵母菌株相比,引发对rosal靶标更好的切割(图13)。测序后它们对应于四种蛋白质。总之,鉴定出四种蛋白质当与M0_1或M0_2形成异二聚体时能够有效地切割rosal(表VII)。表VII表现出针对rosalDNA靶标之强切割活性的功能性突变体组合<table>tableseeoriginaldocumentpage40</column></row><table>*得自随机诱变的突变使用粗体实施例7在CHO细胞的染色体外模型中验证rosal靶标的切割在实施例6中,鉴定出能够在酵母中有效地切割rosal靶标的I-CreI精制突变体。在该实施例中,使用哺乳动物细胞中的染色体外测定,测试两种突变体组合切割CHO细胞中rosal靶标的能力。1)材料和方法a)针对CHO筛选在载体中克隆rosal靶标如下克隆靶标从PR0LIG0订购对应于侧翼是gateway克隆序列之靶序列的寡核昔酸5'tggcatacaagtttcaacatgatgtacatcatgttgacaatcgtctgtca3‘(SEQIDNO:37)。使用Gateway方法(Invitrogen)将通过PCR扩增单链寡核酸产生的双链靶DNA克隆进CHO报告载体(PCLS1058,图14)中。b)大范围核酸酶再克隆在实施例6中鉴定的I-CreIN75、I-SceI和I-CreI突变体的ORF通过PCR扩增并测序(MILLEGEN)。然后,使用Gateway方法(Invitrogen)再克隆0RF。酵母DNA用来自Proligo的扩增弓I物PCR扩增ORF,BlF:5'ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc3'(SEQIDNO78)和B2R:5'ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc3'(SEQIDNO:79)。PCR产物克隆入Invitrogen的CHOgateway表达载体pCDNA6.2(pCLS1069,图15)中。通过如实施例2中所述的测序方法来验证得到的克隆。c)哺乳动物细胞中染饩体外中的测定根据供应商的方案(QIAGEN)用Polyfect转染试剂转染CHO细胞。转染后72小时,去除培养基并添加150μ1裂解/显色(revelation)缓冲液用于β-半乳糖苷酶液体实验(1升缓冲液通常含有:100ml裂解缓冲液(Tris-HClIOmMpH7.5、NaCl150mM、TritonX1000.1%,BSA0.lmg/ml、蛋白酶抑制剂)、IOmlMgIOOX缓冲液(MgCl2lOOmM、β-巯基乙醇35%)UlOmlONPG8mg/ml和780ml磷酸钠0.IMpH7.5。在37°C孵育后,在420nm处测量光密度。整个过程利用自动化的BioCel平台(Vel0Cityll)进行。2)结果图16中显示了两个实验的结果,表明两个I-CreI突变体(m0_2/M0_l和m0_2/M0_2)的组合能够在CHO细胞中切割rosal靶标,与I-CreIN75对I-CreI靶标(tcaaaacgtcgtgagacagtttgg,SEQIDNO80)或I-SceI对I-SceI的靶标(tagggataacagggtaat,SEQIDNO81)的活性相似。实施例8在小鼠细胞中R0SA26基因座处的基因组改造在实施例6和7中,已鉴定了在酵母中以及哺乳动物细胞(CH0Kl细胞)染色体外测定中能够有效地切割rosal的靶标的I-CreI精制突变体。在该实施例中测试了两种I-CreI精制突变体的一种组合诱导小鼠L细胞中R0SA26基因座处同源重组的能力。1)材料和方法a)敲入(KI)基质构建了两种敲入基质,其包含克隆在两个小鼠R0SA26同源性臂(CQ880114序列中62838317的HGR0SA26和831310319的HDR0SA26(对应于序列表中的SEQIDNO3))间的潮霉素抗性基因编码序列(CDS)。由此产生的质粒pCLS1679和pCLS1675(图18质粒图)。在PCLS1679中,潮霉素抗性基因编码序列(hygroCDS)与SV40polyA有效连接,被克隆入PBR322载体(PR0MEGA)的HGR0SA26和HDR0SA26之间。pCLS1675与pCLS1679的不同仅在于在hygro⑶S上游插入内部核糖体进入位点(IRES;SEQIDN0:139)。b)克隆大范围核酸酶I-CreI精制突变体m0_2和M0_1的ORF在实施例6中描述(表VII)。突变体的表达是在两个表达载体中,在人的延伸因子1α(EFlα)启动子或早期巨细胞病毒(CMV)启动子控制之下(PCLS1069,图15)。实施例7描述将突变体克隆入CMV启动子控制下的pCLS1069载体中。所产生的质粒通过测序验证(MILLEGEN)。在pCLS1761(图19)和pCLS1762(图20)中,m0_2和M0_ll-Crel突变体中分别由EFlα启动子控制。c)小鼠L细胞敲入实验小鼠L细胞(ATCC#CRL-2648)在完全DMEM培养基(DMEMGlutamax,GIBC0)补充以10%胎牛血清、青霉素、链霉素和fimgizon下培养。细胞用脂质体试剂(Invitrogen)转染,根据制造商推荐的方法转染。转染后两天,在含0.6mg/ml潮霉素的完全培养基中进行选择。经过两个星期的选择,用ClonePix机器人(GENETIX)挑取抗性克隆。克隆在含有0.6mg/ml潮霉素的完全培养基的96孔板中扩增一周。使用ZR96试剂盒(ZYMORESEARCH)从96孔板培养的抗性克隆提取基因组DNA。d)敲入事件的PCR分析通过PCR分析检测基因组DNA的敲入事件,使用引物对KI_GHG_S5(5‘tagtatacagaaactgttgcatcgc3';SEQIDNO137)和HygSeqRev(5‘cgtctgctgctccatacaag3';SEQIDNO:138),分别位于小鼠R0SA26序列中HGR0SA26同源臂上游以及潮霉素CDS中,以获取KI特异性PCR扩增(图21)。2)结果该实施例中使用的R0SA26大范围核酸酶是在实施例6中描述的m0_2和M0_1)(表VII),克隆入两种表达载体,在人的延伸因子la(EFla)启动子(pCLS1761和pCLS1762)或早期巨细胞病毒(CMV)启动子(pCLS1069,图15)控制下。小鼠L细胞用3种载体共转染2种表达m0_2和M0_1R0SA26大范围核酸酶以及KI基质的质粒。大范围核酸酶被分别克隆入PCLS1761和pCLS1762,分别是EFlα启动子和KI基质是pCLS1675。2ygKI基质载体和5yg或IOyg每种大范围核酸酶表达载体共转染总共2600000个小鼠L细胞。作为自发KI频率对照,用2μg的KI基质载体单独转染相同数量的细胞。通过FACS分析,使用表达荧光标记物的质粒来测定转染效率(40%)。通过计数潮霉素抗性克隆的总数并通过转染效率修正来测定抗性克隆的频率。分别获得2605、1197和1902个潮霉素抗性克隆(表VIII)。每个条件挑选92或184个克隆并以材料和方法描述的PCR分析。结果列于表VIII。VIII小鼠L细胞中R0SA26基因座处KI事件的PCR结果和频率<table>tableseeoriginaldocumentpage42</column></row><table>R0SA26大范围核酸酶和KI基质的共转染诱导L细胞中小鼠R0SA26基因座以4.9X10_4最大频率同源重组。没有发现仅转染KI基质发生自发性同源重组。该实施例显示了R0SA26大范围核酸酶诱导小鼠L细胞中小鼠R0SA26基因座同源重组能力。实施例9从m0_2和M0_1衍生的大范围核酸酶通过使用分子生物学和DNA重组的常规技术(其充分解释于CurrentProtocolsinMolecularBiology(FrederickM.AUSUBEL,2000,WileyandsonInc,LibraryofCongress,美国);分子克隆实验室手册,第三版(Sambrook等,2001,ColdSpringHarbor,NewYork:ColdSpringHarborLaboratoryPress),从m0_2(SEQIDNO:75)禾口M0_1(SEQIDNO72)改造大范围核酸酶构建体。NLS(KKKRK;SEQIDNO134)在M0_1和m0_2的第一个(M1)和第二个(A2)氨基酸之间插入,由此分别产生变体SEQIDNO140和141。标签(TagHA;YPYDVPDYA,SEQIDNO135)在m0_2第一个(M1)和第三个氨基酸(N3)之间插入,所产生的变体是SEQIDN01420标签(STag;KETAAAKFERQHMDS,SEQIDNO136)在M0_1的第一个(M1)和第二个(A2)氨基酸之间插入,由此产生的变体是SEQIDN0:143。标签(TagHA;YPYDVPDYA,SEQIDNO135)禾口NLS(KKKRK;SEQIDNO:134)m0_2的第一个(M1)和第二个氨基酸(A2)之间插入;所产生的变体是SEQIDNO:144。标签(STag;KETAAAKFERQHMDS,SEQIDNO136)和NLS(KKKRK;SEQIDNO134)在M0_1的第一个(Ml)和第二个(A2)氨基酸之间插入,由此产生的变体是SEQIDNO:145。构建了单链大范围核酸酶,其包含由连接序列(GGSDKYNQALSKYNQALSKYNQALSGGGGS;SEQIDNO149)隔开的M0_1单体(SEQIDNO72的1166位)和m0_2单体(SEQIDNO:75的3164位)由此产生的单链大范围核酸酶是SEQIDNO:146ο衍生于m0_2/M0_l的专性异源二聚体通过引入m0_2单体中的E8K和E61R突变以及M0_1单体中的K7E和K96E突变而改造,由此产生的异源二聚体是SEQIDN0:147和SEQIDNO:148。权利要求I-CreI变体,其特征在于两个I-CreI单体之一具有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述亚结构域分别位于I-CreI的26~40位和44~77位,所述变体能够切割来自小鼠ROSA26基因座的DNA靶序列,并可通过至少包括下述步骤的方法获得(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,所述第一功能性亚结构域位于I-CreI的26~40位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,所述第二功能性亚结构域位于I-CreI的44~77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)所述I-CreI位点中-10~-8位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中-10~-8位的核苷酸三联体,且(ii)+8~+10位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中-10~-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)所述I-CreI位点中-5~-3位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中-5~-3位的核苷酸三联体,且(ii)+3~+5位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中-5~-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)所述I-CreI位点中+8~+10位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中+8~+10位的核苷酸三联体,且(ii)-10~-8位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中+8~+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,其中至少(i)所述I-CreI位点中+3~+5位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中+3~+5位的核苷酸三联体,且(ii)-5~-3位的核苷酸三联体已被替换为存在于所述来自小鼠ROSA26基因座之DNA靶序列中+3~+5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两种变体中26~40位和44~77位的突变组合在单个变体中,以获得切割以下序列的新同二聚体I-CreI变体,所述序列(i)-10~-8位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中-10~-8位的核苷酸三联体相同,(ii)+8~+10位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中-10~-8位的核苷酸三联体的反向互补序列相同,(iii)-5~-3位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中-5~-3位的核苷酸三联体相同,和(iv)+3~+5位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中-5~-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两种变体中26~40位和44~77位的突变组合在单个变体中,以获得切割以下序列的新同二聚体I-CreI变体,所述序列(i)+3~+5位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中+3~+5位的核苷酸三联体相同,(ii)-5~-3位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中+3~+5位的核苷酸三联体的反向互补序列相同,(iii)I-CreI位点的+8~+10位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中+8~+10位的核苷酸三联体相同,和(iv)-10~-8位的核苷酸三联体与存在于所述来自小鼠ROSA26基因座之DNA靶序列中+8~+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和/或(h)中获得的变体相组合,以形成异二聚体,和(j)选择和/或筛选来自步骤(i)的能够切割来自小鼠ROSA26基因座之所述DNA靶序列的异二聚体。2.根据权利要求1的变体,其中位于I-CreI4477位的亚结构域中的所述替换位于44、68、70、75和/或77位。3.根据权利要求1的变体,其中位于I-CreI2640位的亚结构域中的所述替换位于26、28、30、32、33、38和/或40位。4.根据权利要求1至3中任一项的变体,其包含I-CreI137143位的一个或多个替换,其修饰该变体针对I-CreI位点中士12、士67和/或士1112位核苷酸的特异性。5.根据权利要求1至4中任一项的变体,其包含在整个I-CreI序列上的一个或多个替换,其提高该变体针对来自小鼠R0SA26基因座之所述DNA靶序列的结合和/或切割特性。6.根据权利要求5的变体,其包含一个或多个选自以下的替换G19S、I24V、S79G、V105A、K107R、V151A、D153G以及K158E。7.根据权利要求1至6中任一项的变体,其中所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、Τ、Y、C、W、L和V的氨基酸替换原始氨基酸。8.根据权利要求1至7中任一项的变体,其是异二聚体,得自在I-CreI的2640和/或4477位具有不同突变的第一和第二单体的结合,所述异二聚体能够切割来自小鼠R0SA26基因座的非回文DNA靶序列。9.根据权利要求8的变体,其中所述DNA靶标选自序列SEQIDNO514以及1630。10.根据权利要求9的变体,其中所述第一和第二单体分别包含至少以下替换-Ν30Η、Y33S、Q44E、R68C、R70S、D75N和N30D、Y33R、Q38T、Q44K、R68E、R70S、I77R,-S32N、Y33G、Q44K、R70E、D75N和S32T、Q38W、Q44K、R68E、R70S、I77R,-Y33R、Q38N、S40Q、Q44N、R70S、D75R、I77D和Ν30Η、Y33S、Q44A、R70S、D75Q、Ι77Ε,-K28S、Q38R、S40K、Q44D、R68Y、R70S、D75S、I77R和Y33C、Q38A、R68A、R70K、D75N,-Y33C、Q44T、R70S、D75Y和S32D、Q38C、Q44D、R68Y、R70S、D75S、I77R,-S32T、Y33C、R68T、R70N、D75N和S32T、Q38W、Q44K、R70E、D75N,-R70S、D75R、Ι77Υ和Y33R、Q38A、S40Q、Q44A、R70S、D75N,-K28S、Q38R、S40K、Q44T、R68N、R70N、D75N和Y33H、Q38S、Q44K、R68Y、R70S、D75Q、I77N,-K28A、Y33S、Q38R、S40K、Q44N、R68Y、R70S、D75R、I77V和S32T、Y33C、Q44A、R70S、D75N,-S32D、Y33H、Q44K、R68E、R70S、I77R和S32D、Y33H、Q44D、R68N、R70S、D75N,-N30R、S32D、R68S、R70K、D75N和D75N,-K28R、Y33A、Q38Y、S40Q、R68Y、R70S、D75R、I77Q和Y33R、Q38A、S40Q、R70S、I77K,-K28R、N30D、D75E、I77R和S32D、Q38C、Q44A、R70S、D75R、I77Y,-Y33R、Q38A、S40Q、R70S、D75N和R70S、D75Y、I77R,-Y33R、Q38A、S40Q、Q44N、R68Y、R70S、D75R、I77V和N30R、S32D、Q44T、R68H、R70H、D75N,-Y33P、S40Q、Q44K、R68Y、R70S、D75Q、I77N和S32A、Y33C、R68Y、R70S、D75R、I77Q,-K28A、Y33S、Q38R、S40K、R68N、R70S、D75N、I77R和S32N、Y33G、Q44A、R68A、R70K、D75N,-N30H、Y33S、Q44Y、R70S、I77V和Y33R、S40Q、Q44A、R70S、D75N,-S32D、Y33H、R68T、R70N、D75N和N30R、S32D、Q44T、R68N、R70N、D75N。-S32R、Y33D、Q44A、R70S、D75N和Y33S、Q38R、S40H、R68H、R70H、D75N,-Y33P、S40Q、Q44K、R68Y、R70S、D75Q、I77N和K28R、Y33A、Q38Y、S40Q、Q44T、R68H、R70H、D75N,-K28Q、Q38R、S40K、Q44A、R70S、D75E、I77R*N30R、S32D、Q44K、R68Y、R70S、D75Q、I77N,-Y33T、Q38A、R68H、R70H、D75N和N30H、Y33S、R70S、I77K,-Y33T、S40T、R68A、R70K、D75N和K28R、Y33A、Q38Y、S40Q、R70S,以及-S32D、Y33H、Q44N、R70S、D75R、I77D和S32D、Q38C、R70S、I77K。11.根据权利要求10的变体,其中所述第一单体为SEQIDNO82106中的任一序列,所述第二单体为SEQIDNO107116、4、117130中的任一序列。12.根据权利要求8的变体,其中所述DNA靶标是SEQIDNO:15。13.根据权利要求12的变体,其中所述第一单体选自I24V、Q44Y、R70S*D75N;I24V、Q44Y、R68Y、R70S、D75Y和I77R;I24V、Q44Y、R70S、D75N和I77V;I24V、Q44Y、R68N、R70S禾口D75R;I24V、Q44Y、R68S、R70S和D75R;I24V、Q44Y、R70S和D75Q;I24V、Q44Y、R68Y、R70S、D75R和I77V;I24V、Q44Y、R70S、D75Y和I77T,所述第二单体选自K28E、Y33R、Q38R、S40R、Q44A、R68H、R70Q和D75N;K28E、Y33R、Q38R、S40R、Q44A、R70N和D75N;K28E、Y33R、Q38R、S40K、Q44A、R68H、R70Q和D75N;K28E、Y33R、Q38R、S40K、Q44V、R70A和D75N;K28E、Y33R、Q38R、S40K、Q44A、R70G和D75N。14.根据权利要求13的变体,其中所述第一单选自序列SEQIDNO:39、43、45、49、50、51、53和54,所述第二单体选自序列SEQIDNO:60、61、63、65和66。15.根据权利要求12的变体,其中所述第一和第二单体分别包含至少以下的替换I24V、Q44Y、R70S、D75Y、I77T以及K28E、Y33R、Q38R、S40R、Q44A、R68S、R70Q、D75N。16.根据权利要求15的变体,其中所述第一和第二单体分别为SEQIDNO54和SEQIDNO:62。17.根据权利要求12的变体,其中所述第一单体选自I24V、Q44Y、R68N、R70S*D75R;I24V、Q44Y、R68S、R70S和D75R;I24V、Q44Y、R70S和D75Q;I24V、Q44Y、R68Y、R70S、D75R和I77V;I24V、Q44Y、R70S、D75Y和I77T,所述第二单体选自K28E、Y33R、Q38R、S40K、Q44A、R70S、D75N和K28E、Y33R、Q38R、S40K、Q44A、R68T、R70N、D75N。18.根据权利要求17的变体,其中所述第一单体选自序列SEQIDNO:49、50、51、53和54、其中所述第二单体选自序列SEQIDN0:64和67。19.根据权利要求12的变体、其中所述第一单体选自序列SEQIDN0:72和73,所述第二单体选自序列SEQIDNO7477。20.根据权利要求1至19中任一项的变体,其包含核定位信号和/或标签。21.根据权利要求1至10、12、13、15、17和20中任一项的变体,其与权利要求11、14、16,18和19中所述的序列具有至少95%序列同一性。22.根据权利要求8至21中任一项的变体,其为专性异二聚体,其中所述第一单体还包含D137R突变,所述第二单体还包含R51D突变。23.根据权利要求8至21中任一项的变体,其为专性异二聚体,其中所述第一单体还包含E8R或E8K以及E61R突变,所述第二单体还包含K7E和K96E突变。24.单链嵌合大范围核酸酶,其包含权利要求1至23中任一项之变体的两个单体或核心结构域或二者的组合。25.根据权利要求24的单链大范围核酸酶,其包含以肽连接序列连接的权利要求10、11和13至23中任一项的第一和第二单体。26.编码权利要求1至23中任一项的变体或者权利要求24或25的单链嵌合大范围核酸酶的多核苷酸片段。27.包含权利要求26的至少一个多核苷酸片段的表达载体。28.根据权利要求27的表达载体,其包含两个不同的多核苷酸片段,每个编码权利要求8至23任一项之异二聚体变体的单体之一。29.载体,其包含含有待引入小鼠ROSA26基因座中之序列的靶向构建体,所述序列的侧翼为与存在于小鼠ROSA26基因座中基因组DNA切割位点周围的区域具有同源性的序列,如权利要求1、8、9和12中任一项所述。30.根据权利要求27或28的载体,其包含含有待引入小鼠ROSA26基因座中之序列的靶向构建体,所述序列的侧翼为与存在于小鼠ROSA26基因座中基因组DNA切割位点周围的区域具有同源性的序列,如权利要求1、8、9和12中任一项所述。31.根据权利要求29或30的载体,其中所述待引入序列是包含与异源启动子有效连接的编码目的产物的DNA序列的盒。32.根据权利要求29或30的载体,其中所述待引入序列是包含编码目的产物的DNA序列的盒,其中将所述盒引入小鼠ROSA26基因座诱导所述产物从内源性ROSA26启动子表达。33.根据权利要求29至32中任一项的载体,其中所述与存在于小鼠ROSA26基因座中基因组DNA切割位点周围区域具有同源性的序列是包含选自以下位置之序列的小鼠ROSA26基因座片段=SEQIDNO:3的31313330、34013600、46284827、54955694、55195718、58176016、59036102、63206519、73057504、79818180、82158414,83058504、84948693、85898788、86608859、89219120、91919390、94679666、1017410373、1146911668、1230212501、1232512524、1244612465,1270212901、1281513014以及1286513064位。34.根据权利要求29至32中任一项的载体,其中所述与存在于小鼠R0SA26基因座中基因组DNA切割位点周围区域具有同源性的序列是包含切割位点上游和下游序列的小鼠R0SA26基因座片段,从而允许缺失紧邻所述切割位点两侧的编码序列。35.组合物,其至少包含权利要求1至23中任一项的变体、权利要求24或权利要求25的单链嵌合大范围核酸酶和/或权利要求27、28和30至34中任一项的表达载体。36.根据权利要求35的组合物,其包含含有待引入小鼠R0SA26基因座之序列的靶向DNA构建体,所述序列的侧翼为与所述变体的基因组DNA靶切割位点周围区域具有同源性的序列,如权利要求31至34中任一项所述。37.宿主细胞,其被根据权利要求26的多核苷酸或权利要求27至34中任一项的载体所修饰。38.非人转基因动物,其包含权利要求26或28所述的一种或两种多核苷酸片段。39.转基因植物,其包含权利要求26或28所述的一种或两种多核苷酸片段。40.权利要求1至23中任一项的变体、权利要求24或25的单链嵌合大范围核酸酶、权利要求27到34中任一项的载体用于非治疗目的改造小鼠基因组的用途。41.根据权利要求40的用途,其中所述变体、单链嵌合大范围核酸酶或载体与权利要求29至34中任一项所定义的靶向DNA构建体相关联。42.根据权利要求41的用途,其中所述靶向DNA构建体包含含有编码目的产物DNA序列的盒,以及最终的标记基因,其侧翼为与所述变体的基因组DNA靶切割位点周围区域具有同源性的序列,如权利要求31至34中任一项所述。43.根据权利要求40至42中任一项的用途,其用于制备表达目的异源蛋白质的转基因小鼠或重组小鼠细胞系。全文摘要I-CreI变体,其中两个I-CreI单体之一具有至少两个替换,在LAGLIDADG核心结构域的两个功能性亚结构域(分别位于I-CreI的26~40位以及44~77位)中各含一个,所述变体能够切割来自小鼠ROSA26基因座的DNA靶序列。所述变体及其衍生产物用于改造表达异源目的蛋白之转基因小鼠和重组小鼠细胞系的用途。文档编号C12N15/90GK101821386SQ200880102480公开日2010年9月1日申请日期2008年6月6日优先权日2007年6月6日发明者阿格内斯·古布勒申请人:赛莱克蒂斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1