使用锌指核酸酶在大鼠中进行基因组编辑的制作方法

文档序号:581556阅读:688来源:国知局
专利名称:使用锌指核酸酶在大鼠中进行基因组编辑的制作方法
技术领域
本公开属于大鼠基因组工程领域,包括体细胞的和可遗传的基因中断、基因组改变、在大鼠基因特定位置上产生携带随机突变的等位基因以及诱导同源定向修复。
背景技术
大鼠(Rattus norvegicus)是在高血压、心血管生理学、糖尿病、代谢紊乱、行为研究以及毒性测试领域中广泛使用的动物模型。Michalkiewicz等人(2007) J. Amer. Phys.Society 293 :H881-H894。这些模型系统的可用性,以及在大鼠基因组学和大鼠、人类和小鼠基因组序列中的进展大大加速了用于发现复杂疾病遗传基础的近交系大鼠模型的使用,并且提供了用于治疗性药物发现的动物模型。然而,有关大鼠基因组信息的进步并未伴随有基因组修饰技术的平行发展。与小鼠不同,用于基因靶向的大鼠胚胎干细胞克隆并不容易产生。前核注射经证实也较为困难,并且在产生转基因大鼠时成功率较低。Michalkiewicz等人(2007) J. Amer. Phys.Society293 :H881_H894报道了使用表达增强型绿色荧光蛋白质(eGFP)报告基因的慢病毒构建体来产生转基因大鼠,其中eGFP转基因经发现存在于整合在基因组内随机位点上的1-4个拷贝中。仍然需要以靶向方式修饰大鼠基因组的方法。基因组基因座的精确靶向位点特异性裂解对常规的同源重组提供了有效补充和/或替代方案。双链断裂(DSB)的产生使得在靶向基因座上的同源重组频率增加了 1000倍多。更简单来说,通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复也可能产生基因中断。产生两种此类DSB会导致缺失任意的大区。锌指蛋白的模块化DNA识别偏好使得可以合理设计位点特异性多指DNA结合蛋白。核酸酶域从II型限制性酶Fok I融合到位点特异性锌指蛋白使得可以产生位点特异性核酸酶。参见(例如)美国专利公布20030232410、20050208489、20050026157、20050064474、20060188987、20060063231、20070134796、2008015164、20080131962、2008015996 以及国际公布WO 07/014275和W02008/133938,这些均描述了锌指核酸酶的使用,并且为了所有目的而将它们以引用方式全文并入。发明概述本文公开了用于在大鼠中进行基因组编辑的组合物,该基因组编辑包括但不限于裂解大鼠中的一种或多种基因,导致一种或多种大鼠基因中的靶向改变(插入、缺失和/或置换突变),包括将这些靶向改变掺入胚系中;靶向引入非内源性核酸序列,使大鼠中的一种或多种基因部分或完全失活;还公开了诱导同源定向修复和/或产生编码大鼠基因的新型等位基因形式的随机突变的方法。在一个方面,本文描述了一种结合到大鼠基因组内所关注区域中的靶位点上的锌指蛋白(ZFP),其中所述ZFP包含一个或多个改造的锌指结合域。在一个实施方案中,ZFP是一种裂解大鼠内所关注的靶基因组区域的锌指核酸酶(ZFN),其中所述ZFN包含一个或多个改造的锌指结合域和核酸酶裂解域或裂解半域。裂解域和裂解半域可以(例如)由各种限制性核酸内切酶和/或归巢核酸内切酶获得。在一个实施方案中,裂解半域是源自IIS型限制性核酸内切酶(例如FokI)。具体地说,ZFN可以裂解一种特定的大鼠基因序列。或者,ZFN可以裂解两种或两种以上同源大鼠基因序列。ZFN可以结合和/或裂解大鼠基因,该大鼠基因位于基因的编码区内,或者位于在基因内的或邻近于基因的非编码序列中(如前导序列、尾随序列或内含子),或者位于编码区上游或下游的非转录区内。在某些实施方案中,ZFN结合和/或裂解靶大鼠基因的编码序列或调控序列。在另一方面,本文描述了包含一种或多种本文所述锌指核酸酶的组合物。在某些实施方案中,该组合物包含一种或多种锌指核酸酶与药学上可接受的赋形剂的组合。在另一方面,本文描述了编码一种或多种本文所述的ZFN的多核苷酸。该多核苷酸可以是(例如)mRNA。在另一方面,本文描述了包含多核苷酸的ZFN表达载体,该多核苷酸编码一种或多种本文所述的ZFN,并且可经操作连接到启动子上。在另一方面,本文描述了包含一种或多种ZFN表达载体的大鼠宿主细胞。大鼠宿主细胞可以是稳定转化的或瞬时转染的,或者是其与一种或多种ZFP表达载体的组合。在一个实施方案中,大鼠宿主细胞是胚胎干细胞。在其它实施方案中,一种或多种ZFP表达载体表达大鼠宿主细胞中的一种或多种ZFN。在另一实施方案中,大鼠宿主细胞可以还包含外源多核苷酸供体序列。在本文所述的任何实施方案中,大鼠宿主细胞可以包含胚细胞,例如一种或多种细胞胚胎。在另一方面,本文描述了一种裂解大鼠细胞中的一种或多种基因的方法,该方法包括(a)把编码一种或多种ZFN的一种或多种多核苷酸引入大鼠细胞,该ZFN在使得ZFN被表达并且一种或多种基因被裂解的条件下结合到一种或多种基因中的靶位点上。在又一方面,本文描述了把外源序列引入大鼠细胞基因组中的方法,该方法包括以下步骤(a)把编码一种或多种ZFN的一种或多种多核苷酸引入大鼠细胞,该ZFN在使得ZFN被表达并且一种或多种基因被裂解的条件下结合到一种或多种基因中的靶位点上;和(b)使细胞接触外源多核苷酸,以使得基因的裂解刺激外源多核苷酸通过同源重组整合到基因组中。在某些实施方案中,外源多核苷酸被物理性整合到基因组中。在其它实施方案中,外源多核苷酸是通过核酸复制程序(例如,双链断裂的同源定向修复)把外源序列拷贝到宿主细胞基因组中而整合到基因组中的。还在其它实施方案中,整合到基因组中是通过非同源依赖性靶向整合(例如,“末端捕获”)来进行的。在某些实施方案中,一种或多种核酸酶是IIS型限制性核酸内切酶的裂解域与改造的锌指结合域之间的融合体。在另一实施方案中,本文描述了修饰大鼠细胞的基因组中的一种或多种基因序列的方法,该方法包括(a)提供包含一种或多种靶基因序列的大鼠细胞;和(b)表达细胞中的第一和第二锌指核酸酶(ZFN),其中第一 ZFN在第一裂解位点进行裂解,第二 ZFN在第二裂解位点进行裂解,其中该基因序列位于第一裂解位点与第二裂解位点之间。其中第一和第二裂解位点的裂解导致通过非同源端连接来修饰基因序列。在某些实施方案中,非同源端连接导致第一裂解位 点与第二裂解位点之间的缺失。基因序列中缺失的大小是由第一裂解位点与第二裂解位点之间的距离决定的。因此,在所关注的任何基因组区域中,可以获得任意大小的缺失。可以获得25个、50个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1,000个核苷酸对或此范围内任意整数值个数的核苷酸对的缺失。此外,可以用本文公开的方法和组合物来获得大于1,000个核苷酸对的一系列任意整数值个数的核苷酸对的缺失。在其它实施方案中,非同源端连接在第一裂解位点与第二裂解位点之间产生插入物。修饰如本文所述大鼠的基因组的方法可用于产生动物(例如人类)疾病的模型,例如通过以下方式使基因(部分或完全地)失活或者在允许鉴定或选择携带那些基因的新型等位基因形式的转基因大鼠的基因的确定位置上形成随机突变,插入人化的大鼠基因(以非限制性例子的方式,用于研究药物代谢)或者插入所关注的突变体等位基因来检验(例如)这种突变体等位基因的表型效应。在又一方面,本文描述了胚系中断大鼠中的一种或多种靶基因的方法,该方法包括通过本文所述的任何方法,修饰在大鼠胚胎的一个或多个细胞的基因组中的一种或多种基因序列;以及使大鼠胚胎发育,其中修饰的基因序列存在于性成熟大鼠的至少一部分配子中。在另一方面,本文描述了一种在所关注的大鼠基因座中产生一种或多种可遗传突变体等位基因的方法,该方法包括通过本文所述的任何方法,修饰在大鼠胚胎的一个或多个细胞的基因组中的一个或多个基因座;饲养大鼠胚胎直到性成熟;和使性成熟的大鼠产生后代;其中后代中的至少一些包含突变体等位基因。在本文所述的任何方法中,编码锌指核酸酶的多核苷酸可以包含DNA、RNA或它们的组合。在某些实施方案中,多核苷酸包含质粒。在其它实施方案中,编码核酸酶的多核苷酸包含mRNA。还在其它方面,本文提供将核酸序列位点特异性整合到染色体中的方法。在某些实施方案中,该方法包括(a)注入胚胎,该胚胎具有(i)至少一种DNA载体,其中该DNA载体包含在待整合核酸序列侧翼的上游序列和下游序列,和(ii)编码识别染色体整合位点的锌指核酸酶的至少一种RNA分子;以及(b)培养该胚胎以使表达锌指核酸酶,其中由锌指核酸酶引入到整合位点中的双链断裂通过用DNA载体来同源重组而修复,以便将核酸序列整合到染色体中。合适的胚胎可来自若干不同的有脊椎物种,包括哺乳动物、鸟类、爬行动物、两栖动物和鱼类。一般而言,合适的胚胎是可以被收集、注射并且培养来表达锌指核酸酶的胚胎。在一些实施方案中,合适的胚胎可以包括来自啮齿动物、宠物、牲畜和灵长类的胚胎。啮齿动物的非限制性例子可以包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。宠物的非限制性例子可以包括猫、狗、兔、刺猬和雪貂。牲畜的非限制性例子可以包括马、山羊、绵羊、猪、骆马、羊驼和牛。灵长类的非限制性例子可以包括僧帽猴、黑猩猩、狐猴、猕猴、绒猴、絹毛猴、蛛猴、松鼠猴和长尾猴。在其它实施方案中,合适的胚胎可以包括来自鱼类、爬行动物、两栖动物或鸟类的胚胎。或者,合适的胚胎可以是昆虫胚胎,例如,果蝇胚胎或蚊子胚胎。
还提供了包含至少一种DNA载体的胚胎,其中该DNA载体包含在待整合核酸序列侧翼的上游序列和下游序列,以及编码识别染色体整合位点的锌指核酸酶的至少一种RNA分子。还提供了来自本文所述的任何胚胎的生物体。



图I示出对大鼠C6细胞中p53特异性ZFN对的Surveyor 核酸酶("CEL-1")测定结果。各泳道中的所用ZFN对在泳道上方示出,通过Surveyor错配试验检测的NHEJ活性百分比在底部示出。图2示出在携带eGFP基因的大鼠C6细胞中的eGFP靶向ZFN对16834/16833、16856/16855 和 16859/16860 的 Surveyor 核酸酶(“CEL-I”)测定结果。所用 ZFN 对在各泳道上方示出,并且非同源端连接百分比(%NHEJ)在适当时于各泳道下方显示。图3是示出使用转基因GFP大鼠中ZFN的GFP转基因的靶向修饰的示意图。图4(图A和B)示出通过大鼠幼仔中的ZFN进行的GFP靶向中断,所述大鼠幼仔是通过将GFP靶向ZFN前核注射到得自转基因GFP大鼠的胚胎中而产生的。图4A示出了紫外光下的5个幼仔,显示出3个GFP阳性动物和2个未表达GFP (GFP阴性)的动物。图4B示出GFP+和GFP-幼仔的尾部活组织检查的PCR分析结果。图5示出使用由CMV启动子(CMV)或CAG启动子驱动的ZFN在C6细胞中的内源IgM的外显子I中进行的ZFN介导的裂解。“连接的”是指在由2A肽连接的相同质粒上的ZFN对,而“未连接的”是指未由2A肽连接的ZFN对。图6示出由Surveyor 核酸酶进行的基因组DNA分析,该基因组DNA是通过IgMZFN注射的单细胞胚胎的活产所得到的43个动物的尾部来制备的。如所示,大鼠6#、7#、8#、19#和46#针对在IgM基因座上的修饰被记为阳性。具有白色数字的条指示产生自单独(编号的)母体的幼仔。图7示出针对ZFN质粒插入基因组而言对IgM修饰的大鼠(如图6中标识的6#、7#、8#、19#和46#)的PCR分析结果。图8 (图A和B)示出IgM修饰的大鼠19#的CEL-I和序列分析。WT、大鼠19野生型等位基因和大鼠19缺失等位基因的序列比对(图8B)显不了已从大鼠19缺失等位基因中删除的序列。图9(图A至C)示出针对在8个不同脱祀位点上的活性对I gm修饰的大鼠(如图
6中标识的6#、7#、8#、19#和46#)的分析。脱靶位点(位点I、位点2等)如表9中所描述。图10示出Rab38的ZFN介导修饰的序列分析。此图中所示的是具有两个缺失等位基因(Λ6和Λ42)的野生型等位基因比对。图11 (图A至C)示出对得自杂交ZFN-IgM修饰的大鼠和野生型大鼠的幼仔的分析。图IlA示出了来自杂交大鼠19# (实施例3)的5个幼仔(编号224到228)与野生型大鼠的PCR和CEL-I分析。图IlB示出序列分析确认,即3个IgM修饰的幼仔(如图中标识的225#、227#和228#)具有与亲代大鼠19#相同的IgM上的64个碱基对缺失等位基因。图IlC示出对大鼠19#的增加幼仔以及来自IgM修饰的大鼠46#和8#的杂交幼仔的PCR和CEL-I分析。IgM修饰的亲代大鼠在顶部以“F0”指示,而幼仔编号在各泳道上方指示。图12是示出靶向ZFN诱导的双链断裂之后修复结果的示意图。阴影条代表供体片段,而白色条示出ZFN双链断裂的靶位点。
图13是示出RFLP供体质粒构造的示意图。示出的是该质粒,以及与整合祀位点同源的左右PCR-扩增片段。指示了用于克隆的限制性酶。左方片段使用KpnI和NotI或PmeI0右方片段使用NotI或PmeI和SacII。图14是示出GFP-表达供体质粒构造的示意图。GFP盒是从现有质粒中PCR扩增并使用NotI位点被封闭到NotI RFLP供体中的。图15 (图A和B)示出检测RFLP整合的方法。图15A是示出检测RFLP整合和限制性酶消化的方法的示意图。图15B是示出使用PCR扩增进行GFP表达盒整合的示意图。图16是在琼脂糖凝胶上解析的荧光染色PCR片段的摄影图像。最左方泳道含DNA梯。泳道I至6含使用小鼠Mdrla特异性引物从整个或一部分小鼠胚泡中扩增的PCR片段。泳道I和2是分别从5/6和1/6个胚泡中扩增的。泳道3来自整个胚泡。泳道4至6分别来自1/2、1/3和1/6个相同胚泡。泳道7含使用相同引物从提取的小鼠趾DNA中扩增的阳性对照PCR片段。图17(图A和B)示出在琼脂糖凝胶上解析的荧光染色DNA片段的摄影图像。最左方泳道含DNA梯。图17A的泳道I至39含使用mMdrla特异性引物从37个小鼠胚胎中扩增的PCR片段以及用于PCR扩增的一个阳性和阴性对照物,所述小鼠胚胎是在相对于含有NotI位点的小鼠Mdrla和RFLP供体用ZFN RNA显微注射之后,在活体外培养的。图17B的泳道I至39含在进行Surveyor 突变检测测定之后图17A的PCR片段。图18 (图A和B)是在琼脂糖凝胶上解析的荧光染色DNA片段的摄影图像。最左方和最右方的泳道含DNA梯。泳道含使用mMdrla特异性引物从图17中所示小鼠胚胎中扩增的以及在未纯化PCR产物的情况下用NotI消化的PCR片段。图18B是图18A中相同凝胶上更持久的电泳扩增。未切PCR产物为约I. 8kb,并且消化产物是约900bp的两个条带。图19是在琼脂糖凝胶上解析的荧光染色DNA片段的摄影图像。最左方泳道含DNA梯。泳道I到6含一些如图18中所示的PCR片段,所述PCR片段是在PCR产物被柱纯化以便NotI可以在其最佳缓冲液中工作之后,经NotI消化的。线7和线8是用NotI消化的样本中的两个(如图18中)。该凝胶显示PCR反应中的NotI消化已完全。图20是在琼脂糖凝胶上解析的荧光染色PCR片段的摄影图像。最左方泳道含DNA梯。泳道I到5含使用PXR特异性引物从I、1/2、1/6、1/10、1/30个大鼠胚泡中扩增的PCR片段。泳道6是使用相同引物从纯化的Sprague Dawley基因组DNA中扩增的阳性对照物。图21 (图A和B)是在琼脂糖凝胶上解析的荧光染色DNA片段的摄影图像。最左方和最右方的泳道含DNA梯。图21A显示使用PXR特异性引物从大鼠胚胎中扩增并用NotI消化的PCR片段,所述大鼠胚胎是在显微注射PXR ZFN mRNA和NotI RFLP供体之后在活体外培养的,图21B显示在进行Surveyor 突变检测测定之后与图21A中所示相同的PCR片段。图22是在琼脂糖凝胶上解析的荧光染色DNA片段的摄影图像。头4个泳道是从胚胎受孕后12. 5天的4个良好发育胎鼠中PCR扩增的,该胚胎注射了具有NotI RFLP供体的mMdrla ZFN mRNA。PCR用NotI消化。泳道4是阳性的。泳道5_8是4个蜕膜的失效植入。所有四个泳道均为阴性。图23 (图A至E)是在琼脂糖凝胶上解析的荧光染色DNA片段的示意图和摄影图像。图23A是示出所用引物的位置的示意图。图23B和图23C示出引物PF和GR的结果。图23D和图23E示出引物PR+GF的结果。期望的片段大小为2. 4kb。40个胎鼠中有两个为GFP阳性。图24是在琼脂糖凝胶上解析的DNA片段的摄影图像。泳道8代表NotI位点阳性的13dpc胎鼠。
具体实施例方式本文描述了用于在大鼠中进行基因组编辑(例如,裂解基因;改变基因,例如通过裂解然后插入(物理插入或经由同源定向修复的复制来插入)外源序列和/或裂解然后进行非同源端连接(NHEJ);使一个或多个基因部分或完全地失活;用随机突变产生等位基因以产生内源基因的改变表达;等等)以及改变被携带入胚系中的大鼠基因组的组合物和方法。还公开了制备和使用这些组合物(试剂)以(例如)编辑(改变)靶大鼠细胞中的一种或多种基因的方法。因此,本文所述的方法和组合物提供了用于靶向基因改变(例如敲入)和/或(部分或完全)敲除一种或多种大鼠基因和/或用于使任意靶等位基因的序列随机性突变的高效方法,因此,可以产生人类疾病的动物模型。本文所述的组合物和方法提供了在不需要劳动密集型选择和/或筛选的情况下,以最小的脱靶效应对大鼠中内源基因座进行快速、完全和永久的靶向中断。整个动物基因的敲除也可以通过注入ZFN mRNA或ZFN表达盒来容易地以单个步骤进行。概述本文所公开的实施方法以及组合物的制备和使用采用了(除非另外指明)在分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和如本领域技术人员所知范围内的相关领域中的常规技术。这些技术在文献中有全面解释。参见(例如),Sambrook 等人,MOLECULAR CLONING A LABORATORY MANUAL,第二版,Cold SpringHarbor Laboratory 出版社,1989 年和第三版,2001 年;Ausubel 等人,CURRENT PROTOCOLSIN MOLECULAR BIOLOGY, John ffiley&Sons, New York,1987 年和周期性更新;METHODS INENZYM0L0GY 系列丛书,Academic 出版社,San Diego ;ffolffe, CHROMATIN STRUCTURE ANDFUNCTION,第三版,Academic 出版社,San Diego,1998 年;METH0DS IN ENZYM0L0GY,第 304卷,“Chromatin” (P. M. Wassarman 和 A. P. Wolffe 编),Academic 出版社,San Diego, 1999年;以及 METHODS IN MOLECULAR BIOLOGY,第 119 卷,“Chromatin Protocols”(P. B. Becker编)Humana 出版社,Totowa, 1999 年。定义术语“核酸”、“多核苷酸”和“寡聚核苷酸”可互换地使用,并且是指线状或环状构象的以及呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸的聚合物。就本公开的目的而言,这些术语不应解释为对聚合物长度的限制。这些术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸酯部分(例如硫代磷酸酯主链)上被修饰的核苷酸。通常,具体核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物能与T碱基配对。术语“多肽”、“肽”和“蛋白”可互换地使用,用于指氨基酸残基的聚合物。这些术语还适用于氨基酸聚合物,其中一个或多个氨基酸是相应天然氨基酸的化学类似物或经修饰的衍生物。
“结合”是指大分子之间(例如在蛋白与核酸之间)的序列特异性、非共价相互作用。并非所有结合相互作用的部件都必需为序列特异性的(例如与DNA主链中的磷酸酯残基接触),只要相互作用总体上为序列特异性即可。这种相互作用一般而言特征为KT6M4或更低的离解常数(Kd)。“亲和力”是指结合强度高结合亲和力与较低Kd相关。“结合蛋白”是能够非共价性结合到另一分子的蛋白。结合蛋白可以结合到(例如)DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白分子(蛋白结合蛋白)。就蛋白结合蛋白来说,其可以结合到其自身(以形成同型二聚体、同型三聚体等)和/或其可以结合不同蛋白的一个或多个分子。结合蛋白可以具有一种以上类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。
“锌指DNA结合蛋白”(或结合域)是以序列特异性方式通过一个或多个锌指结合DNA的蛋白或较大蛋白内的域,所述锌指是通过锌离子配位稳定结构的结合域内的氨基酸序列区。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。锌指结合域可以被“改造”以结合到预定核苷酸序列。改造锌指蛋白的方法的非限制性例子是设计和选择。设计的锌指蛋白是天然不存在的蛋白,其设计/组成主要来自合理性准则。设计的合理性准则包括应用取代法则和计算机化算法,用于处理在储存现有ZFP设计和结合数据信息的数据库中的信息。参见(例如),美国专利6,140,081;6,453,242 和 6,534,261 ;还参见 WO 98/53058 ;W0 98/53059 ;W0 98/53060 ;W0 02/016536和 TO 03/016496。“选择的”锌指蛋白是天然未发现的蛋白,其产生主要是来自经验过程,诸如噬菌体展示、相互作用陷阱或杂交体选择。参见(例如)US 5, 789, 538 ;US 5,925, 523 ;US6,007,988 ;US 6,013,453 ;US 6,200,759 ;W0 95/19431 ;W0 96/06166 ;W0 98/53057;W098/54311 ;W0 00/27878 ;W0 01/60970 ;W0 01/88197 和 TO 02/099084。术语“序列”是指任意长度的核苷酸序列,其可以是DNA或RNA ;可以是线状、环状或分支状,而且可以是单链或者双链。术语“供体序列”是指被插入基因组中的核苷酸序列。供体序列可以为任意长度,例如长度在2个与10,000个核苷酸之间(或它们之间或之上的任意整数值),优选长度在约100个与1,000个核苷酸之间(或它们之间的任意整数值),更优选长度在约200个与500个核苷酸之间。“同源但不相同序列”是指与第二序列存在一定程度的序列相同性的第一序列,但其序列不同于第二序列。例如,包含野生型序列的突变基因的多核苷酸与突变基因序列同源但不相同。在某些实施方案中,这两个序列间的同源性程度足以使它们之间利用正常细胞机制发生同源重组。两种同源非相同序列可以是任意长度的,它们的非同源性程度可以小到单个核苷酸(例如,通过靶向同源重组来校正基因组的点突变)或者可大到10万或更多个碱基(例如,在染色体的预定异位位点上插入基因)。包含同源但不相同序列的两种多核苷酸不必等长。例如,可以使用20个与10,000个之间的核苷酸或核苷酸对的外源多核苷酸(即供体多核苷酸)。测定核酸和氨基酸序列相同性的技术是本领域已知的。此类技术一般包括测定基因mRNA的核苷酸序列和/或测定其编码的氨基酸序列,并将这些序列与另一核苷酸或氨基酸序列作比较。以此方式还可以测定和比较基因组序列。通常,相同性分别指两种多核苷酸或多肽序列中的核苷酸-核苷酸或氨基酸-氨基酸正确对应。通过测定序列相同性百分比可以比较两个或多个(多核苷酸或氨基酸)序列。将两个比对序列(无论是核酸或是氨基酸序列)之间正确匹配的数目除以较短序列长度再乘以100得到两个序列的相同性百分比。Smith 和 Waterman, Advances in Applied Mathematics 2:482-489(1981)的局部同源性算法提供了核酸序列的近似比对。利用Dayhoff, Atlas of Protein Sequencesand Structure, M. 0. Dayhoff 编,5 增刊,3 :353-358,国家生物医学研究基金会(NationalBiomedical Research Foundation) (Washington, D. C.,美国)开发和 Gribskov, NucI.Acids Res. 14(6) :6745-6763(1986)标准化的评分矩阵,可将此算法应用于氨基酸序列。Genetics Computer Group (Madison, WI)在“最佳拟合(BestFit) ”实际应用中不范了该算法的执行以测定序列相同性百分比。Wisconsin序列分析软件包程序手册第8版(1995)(可购自Genetics Computer Group,Madison,WI)描述了该方法的默认参数。本公开内容中确立相同性百分比的优选方法是使用爱丁堡大学(University of Edinburgh)版权所有的、John F. Collins 和 Shane S. Sturrok 开发的、IntelliGenetics 公司(Mountain View,CA)发行的MPSRCH软件包。可以使用该软件包的Smith-Waterman算法,其中默认参数用于评分表(例如,缺口开放罚12分,缺口延伸罚I分和缺口罚6分)。所生成数据中“匹配”值反映序列相同性。本领域通常已知计算序列间相同性或相似性百分比的其它合适程序,例如另一比对程序是BLAST (使用默认参数)。例如,可以采用基于BLASTN和BLASTP确立相同性百分比的优选方法,使用以下默认参数遗传密码=标准;过滤=无;链=双链;截止值=60 ;期望值=10 ;矩阵=BL0SUM62 ;说明=50个序列;分选=HIGH S⑶RE ;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR。可以在以下网址上找到这些程序的详情http://www. ncbi. nlm. gov/cgi-bin/BLAST。至于本文所述的序列,序列相同性的程度的所需范围是大约80%到100%和二者之间的任意整数值。序列之间相同性百分比通常为至少70-75%、优选80-82%、更优选85-90%、甚至更优选92%、还更优选95%和最优选98%的序列相同性。或者,可以通过多核苷酸杂化来测定多核苷酸间的序列相似性程度,杂交条件应能使同源区之间形成稳定的双链体,随后用单链特异性核酸酶消化,并测定消化片段的大小。当使用上述方法测定,两个核酸或两个多肽序列在确定的分子长度上显示至少约70% -75%,优选80% -82%、更优选85% -90%、甚至更优选92%、还更优选95%、最优选98%的序列相同性时,则它们彼此是基本同源的。如本文所用,基本同源还指与特定DNA或多肽序列完全相同的序列。在例如该具体系统规定的严格条件下的Southern杂交实验中,可以鉴定基本同源的DNA序列。本领域技术人员能确定合适的杂交条件。参见(例如)Sambrook等人,同上Nucleic Acid Hybridization A Practical Approach, B. D. Hames和S. J. Higgins 编(1985)Oxford !Washington, DC ;IRL 出版社。可以用下述方法测定两个核酸片段的选择性杂交。两个核酸分子间的序列相同性程度影响这两个分子间的杂交效率和强度。部分相同的核酸序列能至少部分地抑制与靶分子完全相同序列 的杂交。可以使用本领域熟知的杂交试验评估完全相同序列的杂交抑制(例如,Southern (DNA)印迹,Northern (RNA)印迹,溶液杂交等,参见Sambrook,等人,Molecular Cloning A Laboratory Manual,第二版,(1989), Cold Spring Harbor, N. Y.)。此类试验可以使用不同程度的选择性来进行,例如使用从低到高的不同严格性的条件。如果使用低严格性条件,则可以使用缺乏甚至部分序列相同度的辅探针(例如,与靶分子的序列相同性小于约30%的探针)来评估不存在非特异性结合,以使得在不存在非特异性结合时,辅探针不会与IE杂交。当利用基于杂交的检测系统时,应选择与参考核酸序列互补的核酸探针,然后选择合适条件使探针与参考序列彼此选择性杂交或结合来形成双链体分子。能够在中等严格杂交条件下与参考序列选择性杂交的核酸分子通常在以下条件下杂交,该条件能检测至少长约10-14个核苷酸的靶核酸序列且至少约70%序列与所选核酸探针相同的靶核酸序列。严格杂交条件通常能检测与所选核酸探针的序列的相同性大于约90-95%的至少约10-14个核苷酸的靶核酸序列。当探针与参考序列具有特定程度的序列相同性时,可用于探针/参考序列杂交的杂交条件可以按本领域已知那样来确定(参见(例如),Nucleic AcidHybridization A Practical Approach, B. D. Hames 和 S. J. Higgins 编,(1985)Oxford ;Washington, DC ;IRL 出版社)。杂交条件为本领域技术人员所熟知。杂交严格性是指杂交条件不利于包含错配核苷酸的杂交体形成的程度,较高的严格性与对错配杂交体的较低容忍度有关。影响杂交严格性的因素为本领域技术人员所熟知,包括但不限于温度、pH、离子强度和有机溶剂(如甲酰胺和二甲基亚砜)的浓度。如本领域技术人员所知,较高温度、较低离子强度和较低溶剂浓度可提高杂交严格性。至于杂交的严格性条件,本领域熟知的可以使用许多等效条件通过改变(例如)以下因素来建立特定的严格性序列长度和性质、各种序列的碱基组成、盐和其它杂交溶液组分的浓度、杂交溶液中存在或不存在阻断剂(例如硫酸右旋糖酐和聚乙二醇)、杂交反应温度和时间参数以及变化的洗涤条件。按照本领域标准方法(参见(例如),Sambrook,等人,Molecular CloninR A Laboratory Manual,第二版,(1989) Cold Spring Harbor,N. Y.)来选择杂交条件的具体设定。“重组”是指两个多核苷酸之间交换遗传信息的过程。就本公开而言,“同源重组(HR)”是指(例如)在通过同源定向修复机制修复细胞内双链断裂期间所发生的此类交换的特殊形式。这一过程需要核苷酸序列同源,使用“供体”分子为模板来修复“靶”分子(即发生双链断裂的分子),分别称为“非交换型基因转换”或“短段基因转换”,因为其导致遗传信息从供体转移到靶上。不希望受限于任何特定理论,此类转移可涉及对断裂靶与供体间形成的异源双链体DNA进行错配校正,和/或“合成依赖性链退火”,其中使用供体再次合成遗传信息(该信息将成为靶的一部分),和/或相关过程。此类特殊HR常常导致靶分子序列的改变,以使得供体多核苷酸部分或全部并到靶多核苷酸中。在本公开的方法中,一种或多种本文所述的靶向核酸酶在靶序列(例如细胞染色质)中预定位点上产生双链断裂,并且可以将与断裂区中的核苷酸序列具有同源性的“供体”多核苷酸引入细胞中。双链断裂的存在已表明有助于供体序列的整合。供体序列可以被物理整合,或者,供体多核苷酸可用作通过同源重组来修复断裂的模板,导致将例如供体中的核苷酸序列的全部或一部分引入细胞染色质。因此,细胞染色质中的第一序列可以改变,并且在某些实施方案中,可以转化为供体多核苷酸中存在的序列。因此,术语“替换(replace) ”或“替换(replacement) ”的使用可以理解为表示用一个核苷酸序列替换另一个核苷酸序列(即,具有信息性含义的序列替换),并且不必需要用一个多核苷酸来物理或化学地替换另一个多核苷酸。
在本文所述的任何方法中,另外的锌指蛋白可用于细胞内的另外靶位点的另外的双链裂解。在用于对细胞染色质中所关注的区域内的序列进行靶向重组和/或替换和/或改变的方法的某些实施方案中,通过与外源“供体”核苷酸序列的同源重组来改变染色体序列。如果存在与断裂区域同源的序列,则细胞染色质中双链断裂的存在会刺激此类同源重组。在本文所述的任何方法中,第一核苷酸序列(“供体序列”)可以含与所关注的区 域中的基因组序列同源但不相同的序列,从而刺激同源重组以在所关注的区域中插入不相同序列。因此,在某些实施方案中,与所关注的区域中序列同源的供体序列的某些部分显示出与被替换基因组序列约80%至99% (或其间任意整数)的序列相同性。在其它实施方案中,例如,如果在100个毗连碱基对上仅有I个核苷酸不同,则供体与基因组序列间的同源性高于99%。在某些情况下,供体序列的非同源部分可含有所关注区域中不存在的序列,从而使得新的序列引入所关注区域中。在这些情况下,非同源序列一般具有50-1,000个碱基对(或它们间任意整数值)或大于1,000的任意数量碱基对的侧翼,这些侧翼碱基对与所关注区域中的序列同源或相同。在其它实施方案中,供体序列与第一序列不同源,并且通过非同源重组机制被插入基因组中。可以用本文所述的任何方法,通过靶向整合中断所关注的基因表达的供体序列,使细胞内的一个或多个靶序列部分或完全失活。还提供了具有部分或完全失活基因的细胞系O此外,如本文所述的靶向整合的方法还可用于整合一个或多个外源序列。外源核酸序列可以包含(例如)一个或多个基因或cDNA分子,或任何类型的编码或非编码序列,以及一个或多个控制元件(例如启动子)。另外,外源核酸序列可以产生一个或多个RNA分子(例如,小发夹 RNA(shRNA)、抑制性 RNA(RNAi)、微 RNA(miRNA)等)。“裂解”是指使DNA分子的共价主链的断裂。裂解可以通过各种方法引发,包括但不限于磷酸二酯键的酶或化学水解。单链裂解和双链裂解都可以,并且双链裂解可以作为两个不同的单链裂解的结果而发生。DNA裂解可以导致产生平端或交错端。在某些实施方案中,使用融合多肽来进行靶向双链DNA裂解。“裂解半域”是与第二多肽(相同或不同)一起形成具有裂解活性(优选双链裂解活性)的复合物的多肽序列。术语“第一和第二裂解半域”;“+和-裂解半域”和“右和左裂解半域”可互换使用来指能二聚的裂解半域对。“改造的裂解半域”是经修饰以便与另一裂解半域(如另一改造的裂解半域)形成专性异型二聚体的裂解半域。还参见美国专利公布No. 2005/0064474,2007/0218528和2008/0131962,它们的全文以引用方式并入本文。“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质,蛋白质包括组蛋白和非组蛋白染色体蛋白。大多数真核细胞染色质以核小体形式存在,其中核小体核心包含约150个碱基对的DNA,与包含组蛋白H2A、H2B、H3和H4各一对的八聚物缔合;并且接头DNA(各生物体长度可不同)在核小体核心间延伸。组蛋白Hl分子通常与接头DNA缔合。就本公开而言,术语“染色质”意味着涵盖所有类型细胞(原核和真核)的核蛋白。细胞染色质包括染色体和附加体染色质。
“染色体”是包含全部细胞基因组或其一部分的染色质复合物。细胞基因组的特征常常是其核型,它是包含细胞基因组的所有染色体的集合。细胞基因组可以包含一个或多个染色体。“附加体”是复制性核酸、核蛋白复合物或包含不是细胞染色体核型的一部分的核酸的其它结构。附加体的例子包括质粒和某些病毒基因组。“靶位点”或“靶序列”是限定核酸的一部分的核酸序列,在存在足以结合的条件下,结合分子与该部分核酸结合。例如,序列5’-GAATTC-3’是Eco RI限制性核酸内切酶的革巴位点。“外源”分子是通常不存在于细胞中、但可通过一种或多种遗传学、生化或其它方法引入细胞中的分子。“通常存在于细胞中”是根据细胞的具体发育阶段和环境条件来确定的。因此,例如仅在肌肉的胚胎发育期间存在的分子对成人肌肉细胞而言是外源分子。类 似地,热休克诱导的分子对非热休克细胞而言是外源分子。外源分子可包括(例如)功能失常内源分子的有功能型或功能正常的内源分子的功能失常型。外源分子还可以是通常发现于另一物种中的分子,例如,引入大鼠基因组的人类序列。除了别的方面外,外源分子可以是小分子或大分子,小分子如组合化学方法产生的分子,大分子如蛋白质、核酸、糖、脂质、糖蛋白、脂蛋白、多糖、上述分子的修饰衍生物,或包含一种或多种上述分子的任意复合物。核酸包括DNA和RNA,可以是单链或双链的;可以是直链、支链或环形的;并且可以具有任意长度。核酸包括能形成双链体的核酸,以及形成三联体的核酸。参见(例如),美国专利No. 5,176,996和5,422,251。蛋白质包括但不限于=DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰基转移酶、去乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。外源分子可以是与内源分子类型相同的分子,例如外源蛋白质或核酸。例如,外源核酸可以包括感染性病毒基因组、引入细胞的质粒或附加体或通常不存在于细胞中的染色体。将外源分子引入细胞的方法是本领域技术人员已知的,包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-右旋糖酐介导的转移和病毒载体介导的转移。相反,“内源”分子是在特定环境条件下的特定发育阶段的特定细胞中通常存在的分子。例如,内源核酸可以包括染色体,线粒体、叶绿体或其它细胞器的基因组,或天然的附加体核酸。其它内源分子可以包括蛋白质,例如转录因子和酶。“融合”分子是两个或多个亚基分子连接(优选共价连接)的分子。亚基分子可以是相同化学类型的分子,或可以是不同化学类型的分子。第一类型的融合分子的例子包括但不限于融合蛋白(例如,ZFP DNA结合域和裂解域之间的融合体)和融合核酸(例如,编码上述融合蛋白的核酸)。第二类型的融合分子的例子包括但不限于形成三联体的核酸与多肽之间的融合体以及小沟结合物与核酸之间的融合体。可以将融合蛋白递送到细胞中或将编码融合蛋白的多核苷酸递送到细胞中使融合蛋白在细胞中表达,在细胞中多核苷酸被转录,转录物被翻译,以产生融合蛋白。在细胞中表达蛋白质还可涉及反式剪接、多肽裂解和多肽连接。本公开其它地方给出将多核苷酸和多肽递送到细胞中的方法。
就本公开而言,“基因”包括编码基因产物的DNA区(见下),以及调节基因产物产生的所有DNA区,不论这种调控序列是否邻近于编码和/或转录的序列。因此,基因包括但不必限于启动子序列、终止子、翻译调控序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。“基因表达”是指将基因所含信息转化为基因产物。基因产物可以是基因的直接转录产物(例如mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其它类型的RNA)或mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、聚腺苷酸化、甲基化和编辑修饰的RNA,以及通过(例如)甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化修饰的蛋白质。 基因表达的“调控”是指改变基因活性。表达调控可以包括但不限于基因活化和基因阻抑。可以用基因组编辑(例如,裂解、改变、失活、随机突变)来调控表达。基因失活是指相对于不具有本文所述ZFP的细胞而言基因表达的任何降低。因此,基因失活可以是部分的或完全的。“所关注区域”是细胞染色质的任何区域(如基因或基因内或邻近于基因的非编码序列),其中期望结合外源分子。结合的目的可以是为了靶向DNA裂解和/或靶向重组。所关注区域可存在于(例如)染色体、附加体、细胞器基因组(例如线粒体、叶绿体)或感染性病毒基因组中。所关注区域可以位于基因的编码区内,转录的非编码区(如前导序列、尾随序列或内含子)内,或位于编码区上游或下游的非转录区内。所关注区域可以短到单个核苷酸对或长达2,000个核苷酸对,或任何整数值的核苷酸对。术语“操作性连接”和“操作性连接的”(或“可操作连接的”)可互换使用,指并列的两个或多个部件(如序列元件),其中各部件的布置使其发挥正常功能,并使至少一个部件能调节对至少一个其它部件施加的作用。例如,如果转录调控序列在对一种或多种转录调控因子的存在与否的反应中能控制编码序列的转录水平,则该转录调控序列(如启动子)操作性连接到编码序列。转录调控序列通常与编码序列顺式操作性连接,但不一定直接与其邻接。例如,增强子是操作性连接到编码序列的转录调控序列,即使它们不毗连。对融合多肽而言,术语“操作性连接的”可以指这样的事实,即各部件在连接其它部件时可执行与不如此连接时相同的功能。例如,对ZFP DNA结合域融合到裂解域的融合多肽而言,如果在该融合多肽中ZFP DNA结合域部分能够结合其靶位点和/或其结合位点,而裂解域能够裂解靶位点附近的DNAJU ZFP DNA结合域和裂解域是操作性连接的。蛋白质、多肽或核酸的“功能片段”是序列与全长蛋白质、多肽或核酸不同,但保留与全长蛋白质、多肽或核酸相同功能的蛋白质、多肽或核酸。功能片段可以具有比对应的天然分子更多、更少或与其相同数目的残基,和/或功能片段可以含有一个或多个氨基酸或核苷酸取代。测定核酸功能(例如编码功能、与另一核酸杂交的能力)的方法是本领域熟知的。类似地,测定蛋白质功能的方法是熟知的。例如,可以通过(例如)滤膜结合、电泳迁移率变动或免疫沉淀试验来测定多肽的DNA结合功能。可以通过凝胶电泳来测定DNA裂解。参见Ausubel等人,同上。可以通过(例如)免疫共沉淀、双杂交试验或互补(遗传和生化)测定蛋白质与另一种蛋白质相互作用的能力。参见(例如),Fields等人(1989)Nature 340 :245-246 ;美国专利 No. 5,585,245 和 PCT WO 98/44350。锌指核酸酶
本文描述了可用于一种或多种大鼠基因的基因组编辑(例如裂解、改变、失活和/或随机突变)的锌指核酸酶(ZFN)。ZFN包含锌指蛋白(ZFP)和核酸酶(裂解)域(例如裂解半域)。A.锌指蛋白可以改造锌指结合域以结合到选择的序列。参见(例如),Beerli等人(2002)Nature Biotechnol. 20 :135-141 ;Pabo 等人(2001)Ann. Rev. Biochem. 70 :313-340 ;Isalan 等人(2001)Nature Biotechnol. 19 :656-660 ;Segal 等人(2001)Curr. Opin.Biotechnol. 12 :632-637 ;Choo 等人(2000) Curr. Opin. Struct. Biol. 10 :411_416。与天然的锌指蛋白相比,改造的锌指结合域可具有 新颖的结合特异性,改造方法包括但不限于合理设计和各种类型的选择。合理设计包括(例如)使用含有三联体(或四联体)核苷酸序列和单独锌指氨基酸序列的数据库,其中各三连体或四连体核苷酸序列与结合特定三连体或四连体序列的一种或多种锌指氨基酸序列相关。参见(例如),共同拥有的美国专利6,453,242和6,534,261,它们的全文以引用方式并入本文。示例性选择方法(包括噬菌体展示和双杂交系统)描述在以下专利中美国专利 5,789,538,5, 925,523,6, 007,988,6, 013,453,6, 410,248,6, 140,466,6, 200,759 和6,242,568 ;以及 WO 98/37186,WO 98/53057,WO 00/27878,WO 01/88197 和 GB 2,338,237。另外,在(例如)共同拥有的WO 02/077227中已描述了增强锌指结合域的结合特异性的方法。靶位点选择、ZFP和用于设计和构造融合蛋白(和编码该融合蛋白的多核苷酸)的方法对本领域技术人员来说是已知的,并且详细描述于美国专利申请公布No. 20050064474和20060188987中,它们的全文以引用方式并入本文。另外,如在这些和其它参考文献中公开的,锌指结构域和/或多指锌指蛋白可使用任何合适的接头序列(包括例如长度为5个或更多氨基酸的接头,如TGEKP (SEQ ID NOI) ,TGGQRP(SEQ ID NO :2)、TGQKP(SEQ ID NO :3)和/或TGSQKP(SEQ ID NO :4))来连接在一起。对于长度为6个或更多氨基酸的示例性接头序列来说,另参见美国专利No. 6,479,626、6,903,185和7,153,949。本文所述的蛋白质可以包括蛋白质的单独锌指间的合适接头的任意组合。如下文所述,在某些实施方案中,四指、五指或六指结合域融合到裂解半域,例如II型限制性核酸内切酶(如FokI)的裂解域。一对或多对此类锌指/核酸酶半域融合体可用于靶向裂解,如在(例如)美国专利公布No. 20050064474中所描述。对于靶向裂解,结合位点的近边缘可以间隔有5个或更多核苷酸对,并且各融合蛋白均可结合到DNA靶的相对链。所有成对组合均可用于大鼠基因的靶向裂解。按照本发明来说,ZFN可靶向到大鼠基因组中的任意序列。在一些实施方案中,DNA结合域是由源自植物病原黄单胞菌的TAL效应子改造的结构域(参见 Boch 等人,(2009) Science 29 Oct 2009 (10. 1126/science. 117881)和Moscou and Bogdanove, (2009)Science 29 Oct 2009 (10. 1126/science. 1178817)。B.裂解域ZFN还包含核酸酶(裂解域、裂解半域)。本文公开的融合蛋白的裂解域部分可得自任何核酸内切酶或核酸外切酶。可获得裂解域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸 内切酶。参见(例如),2002-2003 Catalogue, New EnglandBiolabs,Beverly,MA ;和 Belfort 等人(1997)Nucleic Acids Res. 25 :3379_3388。裂解DNA的其它酶是已知的(例如SI核酸酶;绿豆核酸酶;胰DNase I ;微球菌核酸酶;酵母HO核酸内切酶;还参见 Linn 等人(编)Nucleases, Cold Spring Harbor Laboratory 出版社,1993)。这些酶(或其功能片段)中的一种或多种可用作裂解域和裂解半域的来源。类似地,如上所述,裂解半域可来自需要针对裂解活性二聚化的任何核酸酶或其部分。通常,如果融合蛋白包含裂解半域,则裂解需要两种融合蛋白。或者,可使用含有两个裂解半域的单一蛋白质。两个裂解半域可来自相同的核酸内切酶(或其功能片段),或者每个裂解半域可来自不同的核酸内切酶(或其功能片段)。另外,优选彼此相对地设置两种融合蛋白的靶位点,以使得两种融合蛋白与其各自靶位点的结合而将这些裂解半域定位于使这些裂解半域形成功能性裂解域(例如通过二聚化)的空间取向上。因此,在某些实施方案中,靶位点的近边缘间隔有5-8个核苷酸或15-18个核苷酸。然而,可将任何整数量的核苷酸或核苷酸对插入两个靶位点之间(例如2至50个核苷酸对或更多)。通常,裂解位点位于靶位点之间。许多物种中存在限制性核酸内切酶(限制性酶),它们能够序列特异性地结合DNA(在识别位点处),并且在结合位点或结合位点附近裂解DNA。某些限制性酶(例如IIS型)在远离识别位点的位点上裂解DNA,并且具有可分离的结合域和裂解域。例如,IIS型酶Fok I能在在一条链上距离识别位点9个核苷酸处和另一条链上距离识别位点13个核苷酸处催化DNA双链裂解。参见(例如),美国专利5,356,802 ;5,436,150和5,487,994 ;以及 Li 等人(1992) Proc. Natl. Acad. Sci. USA 89 :4275-4279 ;Li 等人(1993) Proc. Natl.Acad. Sci. USA 90 :2764-2768 ;Kim 等人(1994a)Proc. Natl. Acad. Sci. USA 91 :883-887 ;Kim等人(1994b) J. Biol. Chem. 269 :31,978-31,982。因此,在一个实施方案中,融合蛋白包含至少一种IIS型限制性酶的裂解域(或裂解半域)以及一个或多个锌指结合域,该锌指结合域可经过或未经过改造。裂解域可与结合域分离的示例性IIS型限制性酶是Fok I。这种特定酶的二聚体具有活性。Bitinaite 等人(1998) Proc. Natl. Acad. Sci. USA 95 :10,570-10,575。因此,为了本公开的目的而言,认为用于所公开融合蛋白的Fok I酶的一部分是裂解半域。因此,为了用锌指-Fok I融合体来靶向双链裂解和/或靶向替换细胞序列,可使用各自含有Fok I裂解半域的两种融合蛋白来重建有催化活性的裂解域。或者,也可使用含有锌指结合域和两个Fok I裂解半域的单一多肽分子。在本公开其它地方提供了用锌指-Fok I融合体进行靶向裂解和靶向序列改变的参数。裂解域或裂解半域可以是保留裂解活性或保留多聚化(例如二聚化)以形成功能性裂解域的能力的蛋白质的任何部分。。示例性IIS型限制性酶在国际公布WO 07/014275中有所描述,该公布全文并入本文。其它限制性酶也含有可分离的结合域和裂解域,本公开也设想了这些限制性酶。参见(例如),Roberts 等人(2003) Nucleic Acids Res. 31 :418_420。在某些实施方案中,裂解域包含最小化或防止均二聚的一个或多个改造的裂解半域(也称为二聚化域突变体),例如在美国专利公布No. 20050064474,20060188987和20080131962中所述,所有这些专利公布的公开内容以引用方式全文并入本文。在Fok I的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537 和 538 位置上的
氨基酸残基全部都是影响Fok I裂解半域二聚化的靶形成专性异质二聚体的Fok I的示例性改造裂解半域包括这样的对,其中第一裂解半域在Fok I的490和538位置上的氨基酸残基处具有突变,而第二裂解半域在486和499氨基酸残基处具有突变。因此,在一个实施方案中,490上的突变用Lys(K)替换Glu(E) ;538上的突变用Lys (K)替换Iso(I) ;486上的突变用Glu(E)替换Gln(Q) ;499上的突变用Lys (K)替换Iso(I)。具体来说,本文所述改造的裂解半域是通过以下方式制备在一个裂解半域中使位置490突变(E — K)和使538突变(I — K)以制备称为“E490K: I538K”的改造裂解半域,以及在另一裂解半域中使位置486突变(Q — E)和使位置499突变(I — L)以制备称为“Q486E: I499L”的改造裂解半域。本文所述的改造裂解半域是专性异质二聚体突变体,其中异常裂解被最小化或消除。参见(例如)美国专利公布No. 2008/0131962的实施例1,其公开内容出于所有目的以引用方式全文并入本文。本文所述的改造裂解半域可以通过任何合适的方法来制备,例如,通过野生型裂解半域(Fok I)的位点定向诱变,如在美国专利公布如.2005006447400.10/912,932,实施例5)和美国专利临时申请No. 60/721,054实施例38)中所述。C.在大鼠中靶向裂解的其它方法本文公开的方法中可以使用在任何大鼠基因中具有靶位点的任何核酸酶。例如,归巢核酸内切酶和巨核酸酶具有十分长的识别序列,其中一些在统计上在人类基因组中可能仅出现一次。不使用锌指核酸酶,或除了使用锌指核酸酶之外,可以使用任何在大鼠基因中具有靶位点的此类核酸酶来在大鼠基因中靶向裂解。示例性归巢核酸内切酶包括I-Scel、I-CeuI、PI-PspI、ΡΙ-Sce、Ι-SceIV、I-CsmI,
I-PanI、I-SceII、I-PpoI、Ι-SceIII、I-CreI、I-TevI、I-TevII 和 I-TevIII。它们的识别序列是已知的。还参见美国专利No. 5,420,032 ;美国专利No. 6,833,252 ;Belfort等人(1997)Nucleic Acids Res. 25 :3379-3388 ;Dujon 等人(1989)Gene 82 :115-118 ;Perler等人(1994)Nucleic Acids Res. 22,1125-1127 Jasin(1996)Trends Genet. 12 :224-228 ;Gimble 等人(1996) J. Mol. Biol. 263 :163-180 ;Argast 等人(1998) J. Mol. Biol. 280 345-353以及新英格兰生物实验室公司(New England Biolabs)目录。虽然就识别位点而言,大多数归巢核酸内切酶的裂解特异性并不是绝对的,但这些位点足够长,使得通过在含有其识别位点的单个拷贝的细胞中表达归巢核酸内切酶可以获得每个哺乳动物大小的基因组的单裂解事件。此外有报道,归巢核酸内切酶和巨核酸酶的特异性可以被改造成结合非天然祀位点。参见(例如),Chevalier等人(2002)Molec.Cell 10 :895-905 ;Epinat 等人(2003)Nucleic Acids Res. 31 :2952-2962 ;Ashworth 等人(2006) Nature 441 :656-659 ;Paques 等人(2007) Current Gene Therapy 7 :49-66 递送本文所述的ZFN可以通过任何合适的方式(包括例如通过ZFN mRNA注射)递送到革巴大鼠细胞。参见 Hammerschmidt 等人(1999)Methods Cell Biol. 59 :87_115。递送包含锌指的蛋白质的方法在以下文献中有所描述美国专利No. 6,453,242、6,503,717、6,534,261,6, 599,692、6,607,882、6,689,558,6, 824,978,6, 933,113、·6,979,539,7, 013, 219和7,163,824,所有这些专利的公开内容以引用方式全文并入本文。本文所述的ZFN还可用含有编码一种或多种ZFN的序列的载体来递送。可以使用任何系统,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疹病毒载体和腺相关病毒载体等。还可参见美国专利No. 6,534,261,6, 607,882、6,824,978,6, 933,113,6, 979,539,7, 013,219 和 7,163,824,它们的全文以引用方式并入本文。此外,显而易见的是,任何这些载体可以包含一种或多种ZFN编码序列。因此,当把一对或多对ZFN引入细胞时,ZFN可以携带在相同载体或在不同载体上。当使用多种载体时,各载体可包含编码一种或多种ZFN的序列。可以使用基于常规病毒和非病毒的基因转移方法来在大鼠细胞中引入编码经改造的ZFP的核酸。这种方法还可用于对大鼠细胞离体施用编码ZFP的核酸。在某些实施方案中,施加编码ZFP的核酸用于活体内或活体外的用途。非病毒载体递送系统包括电穿孔、脂质转染、显微注射、生物弹道术、病毒小体、月旨质体、免疫脂质体、聚阳离子或脂质核酸共轭物、裸露DNA、人造病毒粒子以及药剂增强摄取的DNA。使用(例如)Sonitron 2000系统(Rich-Mar)的声穿孔也可用于递送核酸。病毒载体递送系统包括DNA病毒和RNA病毒,它们在递送到细胞之后具有附加体或整合基因组。其它示例性核酸递送系统包括以下公司提供那些Amaxa Biosystems (Cologne, Germany)、Maxcyte 公司(Rockville, Maryland)> BTX Molecular Delivery Systems(Holliston,MA)和 Copernicus Therapeutics 公司(参见如 US6008336)。脂质转染在(例如)US5,049,386、US 4,946,787和US 4,897,355中有所描述,脂质转染试剂是市售的(例如Transfectam11^P Lipofectin )。适于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质包括Feigner在WO 91/17424、WO 91/16024中所描述的那些。可递送到细胞(活体外施用)或靶组织(活体内施用)。脂质核酸复合物(包括诸如免疫脂质复合物之类的靶向脂质体)的制备为本领域技术人员所熟知(参见(例如)Crystal,Science 270:404-410(1995) ;Blaese 等人,Cancer Gene Ther. 2 :291-297 (1995);Behr 等人,Bioconjugate Chem. 5 :382-389 (1994) ;Remy 等人,Bioconjugate Chem. 5 647-654(1994) ;Gao 等人,Gene Therapy 2:710-722(1995) ;Ahmad 等人,CancerRes. 52 :4817-4820(1992);美国专利 No. 4,186,183,4, 217,344,4, 235,871,4, 261,975、4,485,054,4, 501,728,4, 774,085,4, 837,028 和 4,946,787)。如上所示,所公开方法和组合物可用于任何类型的大鼠细胞。也可以使用大鼠细胞的子代、变体和衍生物。应用所公开方法和组合物可用于任何大鼠基因的基因组编辑。在某些应用中,所述方法和组合物可用于大鼠基因组序列的失活。在其它应用中,所述方法和组合物使得可以产生随机突变,包括产生基因的新型等位基因形式(其与未编辑的基因相比具有不同的表达)或人化大鼠基因的整合,从而又使得可以产生动物模型。在其它应用中,所述方法和组合物可用于在基因的确定位置上产生随机突变,该随机突变使得可以识别或选择携带了那些基因的新型等位基因形式的动物。在其它应用中,所述方法和组合物使得可以将外源(供体)序列靶向整合到大鼠基因组的任何所选区域中。调控序列(例如启动子)可在所关注位点上以靶向方式整合。“整合”意味着物理插入(例如插入到宿主细胞基因组中),也意味着通过核酸复制程序将供体序列拷贝到宿主细胞基因组中来进行的整合。供体序列也可以包含核苷酸,如shRNA、miRNA等等。这些小核酸供体可用于研究它们对大鼠基因组内所关注基因的作用。大鼠基因的基因组编辑(例如失活、整合和/或靶向突变或随机突变)可以通过(例如)以下方式实现单裂解事件;非同源端连接后裂解;同源定向修复机制后裂解;物理整合供体序列后裂解;连接后在两个位点上的裂解,以便删除该两个裂解位点间的序列;将错义或无义密码子靶向重组到编码区中;将无关序列(即,“填充片段”序列)靶向重组到基因或其调控区中,以便中断该基因或调控区;或者将剪接受体序列靶向重组到内含子中以导致转录物错剪接。参见美国专利公布No. 20030232410,20050208489,20050026157,20050064474,20060188987,20060063231 以及国际公布 WO 07/014275,这些申请的公开内容出于所有目的以引用 方式全文并入本文。大鼠ZFN介导的基因组编辑有许多应用。本文所述的方法和组合物使得可以产生人类疾病的大鼠模型。例如,编辑P53基因使得可以产生“肿瘤大鼠”,为研究肿瘤和测试肿瘤疗法提供动物模型。实施例实施例I :ZFN诱导大鼠C6细胞中的靶向中断设计了靶向大鼠p53的ZFN,并将其并到质粒中,基本上如在Urnov等人(2005)Nature 435(7042) :646-651中所述。代表性大鼠p53设计的识别螺旋示于下表I中。这些ZFN的靶位点示于表2中。表I :大鼠p53特异性ZFN设计
ZFN Fl F2 F3 F4 名称_10356 RSDDLTR RSDHLSR DNPNLNR RSDDLSR
(SEQ ID (SEQ ID (SEQ ID (SEQ ID NO:16) NO:44) NO:55) N0:100)
权利要求
1.一种修饰大鼠细胞中的ー种或多种内源细胞基因的方法,所述方法包括 把编码ー种或多种锌指核酸酶(ZFN)的一种或多种多核苷酸引入所述大鼠细胞,所述锌指核酸酶(ZFN)在使得所述ZFN被表达并且所述ー种或多种内源细胞基因被裂解和修饰的条件下,结合到所述ー种或多种基因中的靶位点上。
2.根据权利要求I所述的方法,其中所述修饰包括通过由裂解所述ー种或多种内源细胞基因所刺激的同源重组来将外源序列引入到大鼠细胞的所述基因组中。
3.根据权利要求2所述的方法,其中所述外源序列被物理性整合到所述基因组中。
4.根据权利要求2所述的方法,其中通过核酸复制程序将所述外源序列拷贝到所述宿主细胞基因组中来使所述外源序列整合到所述基因组中。
5.根据权利要求4所述的方法,其中所述核酸复制程序包括同源定向修复双链断裂。
6.根据权利要求4所述的方法,其中所述核酸复制程序包括非同源依赖性靶向整合。
7.根据权利要求I所述的方法,其中所述修饰是在裂解之后非同源端连接的結果。
8.根据权利要求7所述的方法,其中第一和第二锌指核酸酶在两个位点上裂解所述基因组,而且其中所述非同源端连接导致在所述第一裂解位点与所述第二裂解位点之间的缺失。
9.根据权利要求I到8中任一项所述的方法,其中所述锌指核酸酶包含IIS型限制性核酸内切酶的裂解域或裂解半域。
10.一种胚系中断大鼠中ー种或多种靶基因的方法,所述方法包括修饰在大鼠胚胎的一个或多个细胞的所述基因组中的ー种或多种基因序列,所述方法包括 根据权利要求I到9中任一项所述的方法,修饰大鼠胚胎的一个或多个细胞中的ー种或多种所述靶基因;和 使所述大鼠胚胎发育,其中修饰的基因序列存在于性成熟大鼠的至少一部分配子中。
11.ー种在所关注的大鼠基因座中产生ー种或多种可遗传突变体等位基因的方法,所述方法包括 通过权利要求I到9中任一项所述的方法,修饰大鼠胚胎的一个或多个细胞的所述基因组中的ー个或多个基因座;和 将所述大鼠胚胎饲养至性成熟;和 使所述性成熟大鼠产生后代;其中所述后代中的至少ー些包含所述突变体等位基因。
12.ー种包含一种或多种修饰的等位基因的大鼠,其是通过权利要求I至11中任ー项所述的方法来产生的。
全文摘要
本文公开了用于大鼠中一个或多个基因座的基因组编辑的方法和组合物,该方法和组合物使用包含锌指蛋白和裂解域或裂解半域的融合蛋白。还提供了编码所述融合蛋白的多核苷酸,以及包含所述多核苷酸和融合蛋白的细胞。
文档编号C12N15/11GK102625655SQ200980154833
公开日2012年8月1日 申请日期2009年12月3日 优先权日2008年12月4日
发明者崔晓霞, 费奥多·厄诺夫, 阿荣·M·戈特斯 申请人:桑格摩生物科学股份有限公司, 西格玛奥德里奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1