基因组编辑方法

文档序号:392791阅读:464来源:国知局
专利名称:基因组编辑方法
技术领域
本发明包括一种用于产生具有至少一种染色体编辑的动物或细胞的方法。具体而言,本发明涉及使用靶向锌指核酸酶来编辑染色体序列。
背景技术
合理的基因组工程化在基础研究、药物发现和基于 细胞的药品中具有巨大的潜力。现有的靶向基因敲除或位点特异性基因插入的方法依赖于同源重组。然而,在某些细胞类型中,低比率的自发重组已经为一般基因组编辑的巨大障碍。筛选工作的规模和分离目标事件所需的时间是令人望而却步的。因而,存在对于可以迅速地在大多数细胞类型中高速并有效地完成基因组编辑的技术的强烈需要,以便极大地减少整体工程化工作。发明概述本发明的一个方面包括一种用于编辑染色体序列的方法。所述方法部分地包括(a)向包含染色体序列的细胞中引入至少一种编码识别染色体序列中的靶序列且能够裂解染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的Q)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中供体序列的两侧为上游序列和下游序列,并且其中上游序列和下游序列与裂解位点的任一侧具有显著的序列同一性,或(ii)至少一种交换多核苷酸,其包含与染色体序列的位于裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列;和(b)培养细胞以允许表达锌指核酸酶,以使得锌指核酸酶将双链断裂在裂解位点引入染色体序列,并且其中双链断裂由以下过程修复(i)非同源末端连接修复过程,以使得将突变引入染色体序列,或任选地(ii)同源介导修复过程,以使得将供体序列整合到染色体序列中或使交换序列与染色体序列的一部分交换。本发明的另一个方面包括一种非人动物。所述非人动物可部分地通过以下步骤产生(a)向包含染色体序列的细胞中引入至少一种编码识别染色体序列中的靶序列且能够裂解染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的(i)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中供体序列的两侧为上游序列和下游序列,并且其中上游序列和下游序列与裂解位点的任一侧具有显著的序列同一性,或(ii)至少一种交换多核苷酸,其包含与染色体序列的位于裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列;和(b)培养细胞以允许表达锌指核酸酶,以使得锌指核酸酶将双链断裂在裂解位点引入染色体序列,并且其中双链断裂由以下过程修复(i)非同源末端连接修复过程,以使得将突变引入染色体序列,或任选地(ii)同源介导修复过程,以使得将供体序列整合到染色体序列中或使交换序列与染色体序列的一部分交换。本发明的另一个方面包括一种细胞。所述细胞可部分地通过以下步骤产生(a)向包含染色体序列的细胞中引入至少一种编码识别染色体序列中的靶序列且能够裂解染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的(i)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中供体序列的两侧为上游序列和下游序列,并且其中上游序列和下游序列与裂解位点的任一侧具有显著的序列同一性,或(ii)至少一种交换多核苷酸,其包含与染色体序列的位于裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列;和(b)培养细胞以允许表达锌指核酸酶,以使得锌指核酸酶将双链断裂在裂解位点引入染色体序列,并且其中双链断裂由以下过程修复(i)非同源末端连接修复过程,以使得将突变引入染色体序列,或任选地(ii)同源介导修复过程,以使得将供体序列整合到染色体序列中或使交换序列与染色体序列的一部分交换。本发明的另一个方面包括一种胚胎。通常,所述胚胎包含至少一种编码识别染色体序列中的靶序列且能够裂解染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的(i)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中供体序列的两侧为上游序列和下游序列,并且其中上游序列和下游序列与裂解位点的任一侧具有显著的序列同一性,或(ii)至少一种交换多核苷酸,其包含与染色体序列的位于裂解位点的 一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列。本发明的其它方面和重复更充分地描述如下。彩图参考本申请文件含有至少一张以彩色制作的照片。这个专利申请公布的具有彩色照片的副本在函索并支付必要费用时将由办事处提供。附图简述图I是描绘靶向ZFN诱导的双链断裂后的修复结果的示意图。带阴影的条代表供体片段,而白色条描述ZFN双链断裂的靶位点。图2是描绘RFLP供体质粒的构造的示意图。显示了质粒以及与整合靶位点同源的左侧和右侧PCR扩增片段。指示了用于克隆的限制酶。左侧片段使用KpnI和NotI或PmeI0右侧片段使用NotI或PmeI和SacII。图3是描绘表达GFP的供体质粒的构造的示意图。GFP盒从现有的质粒中经PCR扩增并使用NotI位点来克隆至NotI RFLP供体中。图4是描绘使用PCR扩增来检测(A) RFLP整合和限制酶消化以及(B) GFP表达盒的整合的方法的示意图。图5是在琼脂糖凝胶上分析的荧光染色PCR片段的摄影图像。最左边的泳道含有DNA梯状条带(DNA ladder)。泳道I至6含有使用小鼠Mdrla特异性引物从整个或一部分小鼠胚泡扩增的PCR片段。泳道I和2分别从5/6和1/6胚泡扩增。泳道3来自一个完整胚泡。泳道4至6分别来自1/2、1/3和1/6同一胚泡。泳道7含有使用相同引物从所提取的小鼠趾DNA扩增的阳性对照PCR片段。图6是在琼脂糖凝胶上分析的荧光染色DNA片段的摄影图像。最左边的泳道含有DNA梯状条带。(A)泳道I至39含有使用mMdrla特异性引物,从显微注射针对小鼠Mdrla的ZFN RNA和具有NotI位点的RFLP供体后体外培养的37个小鼠胚胎扩增的PCR片段,以及用于PCR扩增的一个阳性对照和一个阴性对照。(B)泳道I至39含有进行Surveyor突变检测试验后的(A)中的PCR片段。
图7是在琼脂糖凝胶上分析的荧光染色DNA片段的摄影图像。最左边和最右边的泳道含有DNA梯状条带。㈧泳道含有使用mMdrla特异性引物,从图6中小鼠胚胎扩增的PCR片段,并且在不纯化PCR产物的情况下,将其用NotI消化。图7B是图7A中的同一凝胶的较长时间运行。未切的PCR产物为约I. 8kb,并且经消化的产物是两个约900bp的条带。图8是在琼脂糖凝胶上分析的荧光染色DNA片段的摄影图像。最左边的泳道含有DNA梯状条带。泳道I至6含有PCR产物经柱纯化后用NotI消化的来自图7的一些PCR片段,柱纯化以便使NotI可在其最佳缓冲液中发挥作用。泳道7和8是如图7用NotI消化的样本中的两个。此凝胶显示PCR反应中的NotI消化是完全的。图9是在琼脂糖凝胶上分析的荧光染色PCR片段的摄影图像。最左边的泳道含有DNA梯状条带。泳道I至5含有使用PXR特异性引物,从I、1/2、1/6、1/10、1/30大鼠胚泡扩增的PCR片段。泳道6是使用相同引物,从经纯化的Sprague Dawley基因组DNA扩增的阳 性对照。

图10是在琼脂糖凝胶上分析的荧光染色DNA片段的摄影图像。最左边和最右边的泳道含有DNA梯状条带。(A)泳道含有使用PXR特异性引物,从显微注射PXR ZFN mRNA和NotI RFLP供体后体外培养的大鼠胚胎扩增并经NotI消化的PCR片段。(B)泳道含有进行Surveyor突变检测试验后的如图IOA中的相同PCR片段。图11是在琼脂糖凝胶上分析的荧光染色DNA片段的摄影图像。在注射mMdrla ZFNmRNA与NotI RFLP供体的胚胎受孕后12. 5天,从4个发育良好的胎儿PCR扩增前4个泳道。用NotI消化该PCR。泳道4是阳性泳道。泳道5-8是4个中止植入的蜕膜。所有四个都是阴性。图12是在琼脂糖凝胶上分析的荧光染色DNA片段的示意图和摄影图像。(A)示出所使用引物的位置的示意图。图⑶和(C)示出来自引物PF和GR的结果。图⑶和(E)示出来自引物PR+GF的结果。预计片段大小是2.4kb。四十个胎儿中的两个对于GFP呈阳性。图13是在琼脂糖凝胶上分析的DNA片段的摄影图像。泳道8代表对于NotI位点呈阳性的13dpc胎儿。图14说明了如Cel-I surveyor核酸酶测定所检测,人和猫细胞中ZFN介导的SMAD4 裂解。G = GFP (没有 ZFN 对照)。Z = SMAD4 ZFN(191160/19159)。箭头指示裂解产物。图15描绘确定猫胚胎中的SMAD4ZFN活性的Cel-I测定。图16说明了 AKD细胞中的Fel dl裂解。提供链1_外显子I的Fel dlZFN对17、18裂解的Cel-I筛选。图17说明了 AKD细胞中由Fel dlZFN对7、9进行的Fel dl链I-外显子2裂解。图18描绘了 AKD细胞中的链I-外显子2的Fel dlZFN对12/13裂解的Cel-I分析。图19说明了通过ZFN对17、18和12、13进行的猫胚胎中的Fel dl基因座的裂解。泳道1、2、7和8含有来自源于注射40ng/ μ LZFN的胚胎的个别胚泡的样本。泳道3显示来自源于注射20ng/y LZFN的胚胎的胚泡的样本。泳道4、9和10含有来自源于注射40ng/μ LZFN的胚胎的个别桑椹胚的样本。泳道3显示来自源于注射20ng/ μ LZFN的胚胎的桑椹胚的样本。泳道6显示来自对照胚泡的样本。图20显示在编码链2和链I的区之间包含4541bp缺失(SEQ ID NO 51)的经编辑Fel dl基因座的DNA序列。图21将包含4541bp缺失的经编辑Fel dl基因座(以红虚线指明,标示为“样本5”)与野生型Fel dl基因座的序列(SEQ ID NO 52)进行比对。在经编辑的样本中,ZFN13的结合位点被截短(并且ZFN 12的结合位点丢失),但是ZFN对17、18的结合位点是完整的。图22描述AKD细胞中的通过羧酸酯酶cauxin ZFN对1/2 (泳道2)、ZFN对9/10 (泳道4)和ZFN对17/18 (泳道5)进行的cauxin基因座裂解。泳道I和3含有来自对照(GFP)细胞的样本。图23说明通过cauxin ZFN对29/30 (泳道2)进行的cauxin基因座裂解。泳道 2含有对照(GFP)样本。图24描述TUBAlB基因座处的整合。(A)是示出供异源编码序列的整合的靶区的染色体序列(SEQ ID NO :85)、染色体靶区上的ZFN结合位点(黄色序列)、ZFN切割位点(黄色箭头)和整合位点(绿色箭头)的示意图。(B)显示TUBAlB基因座、整合位点、SH2生物传感器的设计和成功整合之后表达的蛋白质的示意图。(C)提供野生型和经整合细胞的蛋白质印迹的图像。图25描述包含两侧具有位于靶区的TUBAlA序列的SH2生物传感器序列的供体质粒的图。图26显示表达GFP-2xSH2-Grbl-2A蛋白质的个别分离的细胞克隆的微分干涉差(DIC)和荧光显微镜图像。荧光图像示出暴露于100ng/mL EGF之后的生物传感器易位的时间过程。图27描述包含两侧具有位于靶区的ACTB序列的SH2生物传感器序列的供体质粒的图。图28描述表达GFP-2xSH2-Grbl_2A(上图)和RFP-β -肌动蛋白(下图)的个别分离的细胞克隆的荧光显微镜图像。显示暴露于lOOng/mLEGF之后的时间过程。图29显示两个经编辑LRRK2基因座的DNA序列。上方序列(SEQ ID NO 92)在外显子30的靶序列中具有IObp缺失,并且下方序列(SEQ ID NO 93)在外显子30的靶序列中具有Sbp缺失。外显子以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图30显示两个经编辑ApoE基因座的DNA序列。上方序列(SEQ ID NO :114)在外显子2的靶序列中具有16bp缺失,并且下方序列(SEQ ID NO :115)在外显子2的靶序列中具有Ibp缺失。外显子序列以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图31示出经编辑瘦素基因座的DNA序列。显示其中从外显子I和内含子I中缺失151bp的瘦素基因座区(SEQ ID NO :116)。外显子以绿色示出;祀位点以黄色显示,并且缺失以深蓝色示出。图32提供显示两只动物中的经编辑APP基因座的DNA序列。(A)示出从外显子9中缺失292bp的大鼠APP基因座区(SEQ ID NO :127)。(B)显示在外显子9中存在309bp缺失的大鼠APP基因座区(SEQ ID NO :128)。外显子以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。
图33显示两只动物中的经编辑Ragl基因座的DNA序列。上方序列(SEQ ID NO 131)在外显子2中具有808bp缺失,并且下方序列(SEQ ID NO :132)在外显子2中具有29bp缺失。外显子序列以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图34显 示两只动物中的经编辑Rag2基因座的DNA序列。上方序列(SEQ ID NO 133)在外显子3的靶序列中具有13bp缺失,并且下方序列(SEQ ID NO :134)在外显子2的靶序列中具有2bp缺失。外显子序列以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图35显示两只动物中的经编辑Mdrla基因座的DNA序列。上方序列(SEQ ID NO 157)在外显子7中具有20bp缺失,并且下方序列(SEQ ID NO 158)在外显子7中具有15bp缺失和3bp插入(GCT)。外显子序列以绿色示出;靶序列以黄色显示,并且缺失以深蓝色示出。图36说明大鼠中的Mdrla基因的敲除。显示不同量的来自Mdrla敲除大鼠的结肠溶解产物和对照细胞溶解产物的蛋白质印迹。在图像左侧指示Mdr I a蛋白和肌动蛋白的相对位置。图37显示两只动物中的经编辑Mrpl基因座的DNA序列。上方序列(SEQ ID NO 159)在外显子11中具有43bp缺失,并且下方序列(SEQ ID NO :160)在外显子11中具有14bp缺失。外显子序列以绿色示出;靶序列以黄色显示,缺失以深蓝色示出;并且靶序列和外显子之间的重叠以灰色显示。图38示出经编辑Mrp2基因座的DNA序列。序列(SEQ ID NO :161)在外显子7中具有726bp缺失。外显子以绿色示出;靶序列以黄色显示,并且缺失以深蓝色示出。图39显示两只动物中的经编辑BCRP基因座的DNA序列。(A)示出在外显子7中包含588bp缺失的大鼠BCRP基因座区(SEQ ID NO :162)。(B)显示在外显子7中包含696bp缺失的大鼠BCRP基因座区(SEQ ID NO :163)。外显子序列以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图40显示Mdrla和两个额外基因Jagl和Notch3的靶位点和ZFN证实。(A)示出ZFN靶序列。ZFN结合位点加下划线。(B)示出在NIH3T3细胞中证实ZFN mRNA活性的突变检测试验的结果。将每个ZFN mRNA对共转染至NIH3T3细胞中。转染细胞在24h后收获。用突变检测试验分析基因组DNA以检测指示ZFN活性的NHEJ产物。M,PCR分子量标准;G (泳道1、3和5) =GFP转染对照;Z (泳道2、4和6),ZFN转染样本。以碱基对标明未切的和裂解的条带的相应大小。图41显示使用突变检测试验鉴定基因工程化Mdrla源种动物(founder)。以碱基对标明未切的和裂解的条带的相应大小。裂解的条带表明靶位点存在突变。M,PCR分子量标准。1-44,从经注射的卵细胞中出生的44只幼崽。源种动物的编号加下划线。图42显示Mdrla源种动物中的较大缺失的扩增。使用位于ZFN靶位点上游和下游800bp处的引物来扩增PCR产物。比I. 6kb野生型条带显著更小的条带表明靶基因座中的较大缺失。对在图7中未鉴定的四个源种动物加下划线。图43显示44只经注射Mdrla ZFN幼崽的Mdrlb位点的突变检测试验的结果。M,PCR分子量标准;WT,来自未注射Mdrla ZFN的FVB/N小鼠的趾DNA ;3T3,经Mdrla ZFN转染的作为对照的ΝΙΗ3Τ3细胞。
图44显示在Mdrla-/-小鼠中使用RT-PCR来检测Mdrla表达。(A)是靶位点周围的Mdrla基因组和mRNA结构的不意图说明。外显子由具有相应编号的空心矩形来表不。每个外显子的以碱基对表示的大小直接标示在下方。内含子序列以断开的条来表示,并且碱基对大小在下方。外显子7中的ZFN靶位点用实心矩形标明。源种动物#23中的396bp缺失位置在内含子6和外显子7上方标示。RT-F和RT-R是在RT-PCR中使用的分别位于外显子5和9中的引物。在RT反应中,40ng总RNA用作模板。通过在存在或不存在RT的情况下进行GAPDH扩增来证实输入RNA的归一化。图45显示在Mdrla-/-样本中分离和纯化野生型大小的物质之后条带分离的结果,然后该物质用作巢式PCR的模板。图46示出两只动物中的经编辑BDNF基因座的DNA序列。上方序列(SEQ ID NO 211)在外显子2的靶序列中具有14bp缺失,并且下方序列(SEQ ID NO :212)在外显子2的靶序列中具有7bp缺失。外显子以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图47显示经编辑DISCl基因座的DNA序列。显示外显子5的靶序列中存在20bp 缺失的大鼠DISCl区(SEQ ID NO :225)。外显子以绿色示出;靶位点以黄色显示,并且缺失以深蓝色示出。图48说明大鼠中的p53基因座的编辑。显示了裂解产物的存在指示p53基因得到编辑的Cel-I检测。图49说明大鼠中的p53基因的敲除。显示来自野生型(WT 731RP)和p53敲除(K0 733RP)动物的肾脏⑷和肝脏(L)样本的细胞质和细胞核溶解产物的蛋白质印迹。在每个图像右侧指不p53蛋白和肌动蛋白的相对位置。详细说明本公开提供产生包含至少一个经编辑染色体序列的基因修饰动物或动物细胞的方法。经编辑染色体序列可(I)经失活、(2)经修饰或(3)包含整合序列。失活染色体序列经改变以使得不产生功能性的蛋白质或控制序列不再发挥与野生型控制序列相同的功能。因而,包含失活染色体序列的基因修饰动物可被称为“敲除”或“条件性敲除”。同样地,包含整合序列的基因修饰动物可被称为“敲入”或“条件性敲入”。如下详述,敲入动物可为人源化动物。此外,包含经修饰染色体序列的基因修饰动物可包含靶向点突变或其它修饰以使得产生经改变的蛋白质产物。通常使用锌指核酸酶介导的过程来编辑染色体序列。简单地说,所述过程包括将至少一种编码靶向锌指核酸酶的核酸和任选地至少一种辅助多核苷酸引入细胞中。所述方法还包括孵育细胞以允许表达锌指核酸酶,其中通过锌指核酸酶引入靶向染色体序列的双链断裂由容易出错的非同源末端连接DNA修复过程或同源介导的DNA修复过程来修复。在示例性的实施方案中,细胞是胚胎。使用如本文所述的靶向锌指核酸酶技术编辑染色体序列的方法是迅速、精确和高效的。另外,本发明包括包含至少一个经编辑染色体序列的动物或细胞。以下更详细描述本发明的方法、本发明的动物、本发明的细胞和其应用。I.染色体编辑的方法本发明的一个方面包括一种染色体编辑的方法。如本文所使用的“染色体编辑”是指编辑染色体序列以使得序列(I)经失活、(2)经修饰或(3)包含整合序列。一般来说,编辑染色体序列的方法包括(a)向细胞中引入至少一种编码识别染色体序列中的靶序列且能够裂解染色体序列中的位点的锌指核酸酶的核酸,和任选的(i)至少一种包含供整合的序列的供体多核苷酸,所述序列的两侧为上游序列和下游序列,所述上游序列和下游序列与裂解位点的任一侧具有显著的序列同一性,或(ii)至少一种交换多核苷酸,其包含与染色体序列的位于裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的序列;和(b)培养细胞以允许表达锌指核酸酶,以使得锌指核酸酶将双链断裂引入染色体序列中,并且其中双链断裂由以下过程修复(i)非同源末端连接修复过程,以使得将突变引入染色体序列,或任选地(ii)同源介导修复过程,以使得将供体多核苷酸中的序列整合到染色体序列中或使交换多核苷酸中的序列与染色体序列的一部分交换。以下更详细描述锌指核酸酶介导的编辑染色体序列方法的组成部分。(a)编码锌指核酸酶的核酸所述方法部分地包括将至少一种编码锌指核酸酶的核酸引入细胞。通常情况下, 锌指核酸酶包含DNA结合域(即,锌指)和裂解域(即,核酸酶)。以下描述DNA结合和裂解域。编码锌指核酸酶的核酸可包括DNA或RNA。例如,编码锌指核酸酶的核酸可包括mRNA。当编码锌指核酸酶的核酸包括mRNA时,mRNA分子可在5’加帽。同样地,当编码锌指核酸酶的核酸包括mRNA时,mRNA分子可经多腺苷酸化。根据所述方法的示例性核酸是编码锌指核酸酶的加帽和多腺苷酸化mRNA分子。使mRNA加帽和多腺苷酸化的方法是本领域已知的。一般来说,本发明的锌指核酸酶一旦引入细胞,就在染色体序列中产生双链断裂。在某些实施方案中,双链断裂可通过细胞的非同源末端连接修复过程来修复以使得将突变弓I入染色体序列中。在其它实施方案中,如下所述,使用同源介导修复过程来编辑染色体序列。(I)锌指结合域锌指结合域可经工程化以识别和结合于所选择的任何核酸序列。参见例如Beerli 等(2002)Nat. Biotechnol. 20 :135-141 ;Pabo 等(2001)Ann. Rev. Biochem. 70 :313-340 ;Isalan 等(2001)Nat. Biotechnol. 19 :656-660 ;Segal 等(2001)Curr. Opin.Biotechnol. 12 :632-637 ;Choo 等(2000)Curr. Opin. Struct. Biol. 10 :411-416 ;Zhang等(2000)J.Biol. Chem. 275(43) :33850-33860 ;Doyon 等(2008)Nat. Biotechnol. 26 :702-708 ;和 Santiago 等(2008) Proc. Natl. Acad. Sci. USA 105 :5809_5814。与天然存在的锌指蛋白质相比,工程化锌指结合域可具有新颖的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理的设计包括例如使用包含双联体、三联体和/或四联体核苷酸序列和个别锌指氨基酸序列的数据库,其中每个双联体、三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关。参见例如美国专利第6,453,242和6,534,261号,其公开的全部内容以引用方式并入本文。例如,在美国专利第6,453,242号中描述的算法可用来设计锌指结合域以靶向预先选定的序列。替代方法,诸如使用非简并识别代码表的合理设计也可用来设计锌指结合域以靶向特定的序列(Sera等(2002)Biochemistry 41:7074-7081)。公开可利用的用于识别DNA序列中的潜在祀位点和设计锌指结合域的基于万维网的工具可分别发现于WWW. zincfingertools.org和 bindr. gdcb. iastate. edu/ZiFiT/ (Mandell 等(2006)Nuc. Acid Res. 34 W516-ff523 ;Sander 等(2007) Nuc. Acid Res. 35 W599-ff605)中。
锌指DNA结合域可经设计以识别长度为约3个核苷酸至约21个核苷酸,或长度约8个至约19个核苷酸范围内的DNA序列。通常,本文公开的锌指核酸酶的锌指结合域包含至少三个锌指识别区(即,锌指)。在一个实施方案中,锌指结合域可包含四个锌指识别区。在另一个实施方案中,锌指结合域可包含五个锌指识别区。在另一个实施方案中,锌指结合域可包含六个锌指识别区。锌指结合域可经设计以结合任何合适的靶DNA序列。参见例如美国专利第6,607,882,6, 534,261和6,453,242号,其公开的全部内容以引用方式并入本文。选择锌指识别区的示例性方法可包括噬菌体展示和双杂交系统,并且公开于美国专利第 5,789,538,5, 925,523,6, 007,988,6, 013,453,6, 410,248,6, 140,466,6, 200,759和 6,242,568 号以及 W098/37186、W098/53057、W000/27878、W001/88197 和 GB2, 338,237中,其各自的全部内容以引用方式并入本文。另外,锌指结合域的结合特异性的增强已描述于例如W002/077227中。
设计和构造融合蛋白(和其编码多核苷酸)的锌指结合域和方法是本领域技术人员己知的,并且详细描述于美国专利申请公布第20050064474和20060188987号中,其各自的全部内容以引用方式并入本文。可使用合适的连接子序列(包括例如长度为五个或更多个氨基酸的连接子)将锌指识别区和/或多指锌指蛋白连接在一起。关于长度为六个或更多个氨基酸的连接子序列的非限制实例,参见美国专利第6,479,626,6, 903,185和7,153,949号,其公开的全部内容以引用方式并入本文。本文所述的锌指结合域可包含个别锌指蛋白之间的合适连接子的组合。在一些实施方案中,锌指核酸酶可进一步包含核定位信号或序列(NLS)。NLS是有助于将锌指核酸酶蛋白靶向至细胞核中以便在染色体的靶序列处引入双链断裂的氨基酸序列。核定位信号在本领域中是已知的。参见例如Makkerh等(1996)Current Biology 6 1025-1027。(ii)裂解域锌指核酸酶还包含裂解域。本文公开的锌指核酸酶的裂解域部分可从任何核酸内切酶或核酸外切酶获得。可产生裂解域的核酸内切酶的非限制性实例包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如2002-2003 Catalog, New England Biolabs,Beverly,Mass. jPIBelfort等(1997)Nucleic Acids Res. 25 :3379-3388 or www.neb.com。裂解DNA的其它酶是己知的(例如SI核酸酶、绿豆核酸酶、胰腺DNA酶I、微球菌核酸酶、酵母 HO 核酸内切酶)。还参见 Linn 等(编)Nucleases, Cold Spring Harbor LaboratoryPress,1993。这些酶(或其功能片段)中的一个或多个可用作裂解域的来源。裂解域还可来源于裂解活性需要二聚作用的如上所述的酶或其一部分。裂解可能需要两个锌指核酸酶,因为每个核酸酶包含活性酶二聚体的单体。另外,单个锌指核酸酶可包含两个单体以便产生活性酶二聚体。如本文所使用的“活性酶二聚体”是能够裂解核酸分子的酶二聚体。两个裂解单体可来源于相同核酸内切酶(或其功能片段),或每个单体可来源于不同核酸内切酶(或其功能片段)。当使用两个裂解单体来形成活性酶二聚体时,两个锌指核酸酶的识别位点优选经布置以使得两个锌指核酸酶与其各自识别位点的结合使裂解单体彼此处于允许裂解单体通过例如二聚化来形成活性酶二聚体的空间定向中。因此,识别位点的近侧边缘可由约5个至约18个核苷酸分隔。例如,近侧边缘可由约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17或18个核苷酸分隔。然而,应理解任何整数个核苷酸或核苷酸对可插入两个识别位点之间(例如,约2个至约50个核苷酸对或更多)。诸如例如本文详细描述的锌指核酸酶的识别位点的近侧边缘可由6个核苷酸分隔。通常,裂解位点位于识别位点之间。限制核酸内切酶(限制酶)存在于许多物种中,并且能够以序列特异性的方式结合于DNA (在识别位点处),并且在结合位点处或附近裂解DNA。某些限制酶(例如,IIS型)在远离识别位点的位点处裂解DNA,并且具有可分离的结合和裂解域。例如,IIS型酶FokI在距其于一条链上的识别位点9个核苷酸处,并且在距其于另一条链上的识别位点13个核苷酸处催化DNA的双链裂解。参见例如美国专利第5,356,802,5, 436,150和5,487 ,994号;以及 Li 等(1992) Proc. Natl. Acad. Sci. USA 89 :4275-4279 ;Li 等(1993) Proc. Natl. Acad.Sci.USA 90 :2764-2768 ;Kim 等(1994a)Proc. Natl. Acad. Sci. USA 91 :883-887;Kim 等(1994b) J. Biol. Chem. 269 :31,978-31,982。因此,锌指核酸酶可包含来自至少一种IIS型限制酶的裂解域和一个或多个可经工程化或可未经工程化的锌指结合域。示例性的IIS型限制酶描述于例如国际公布W007/014,275中,其公开的全部内容以引用方式并入本文。其它限制酶也含有可分离的结合和裂解域,并且这些酶也包涵于本公开中。参见例如Roberts等(2003)Nucleic Acids Res. 31 :418_420。裂解域与结合域分离的示例性IIS型限制酶是FokI。此特定酶具有作为二聚体的活性(Bitinaite 等(1998) Proc. Natl. Acad. Sci. USA 95 :10,570-10,575)。因此,出于本公开的目的,在锌指核酸酶中使用的FokI酶的部分被认为是裂解单体。因此,对于使用FokI裂解域的靶向双链裂解,可使用两个各自包含FokI裂解单体的锌指核酸酶来重新构建活性酶二聚体。另外,也可使用含有锌指结合域和两个FokI裂解单体的单个多肽分子。在某些实施方案中,裂解域可包含一个或多个最大限度地减少或防止均二聚作用的工程化裂解单体,如例如美国专利公布第20050064474、20060188987和20080131962号中所描述,其各自的全部内容以引用方式并入本文。作为非限制实例,FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537 和 538 的氨基酸残基全部是影响FokI裂解半域的二聚作用的靶。形成专性异二聚体的FokI的示例性工程化裂解单体包括成对单体,其中第一裂解单体包含FokI的氨基酸残基位置490和538处的突变并且第二裂解单体包含氨基酸残基位置486和499处的突变。因此,在一个实施方案中,氨基酸位置490处的突变将Glu(E)替换为Lys(K);氨基酸残基538处的突变将Iso(I)替换为Lys (K);氨基酸残基486处的突变将Gln (Q)替换为Glu (E);并且位置499处的突变将Iso (I)替换为Lys (K)。具体来说,工程化裂解单体可通过以下方法来制备在一个裂解单体中将位置490从E突变为K并且将538从I突变为K来产生称做"E490K:I538K"的工程化裂解单体,并且在另一个裂解单体中将位置486从Q突变为E并且将499从I突变为L来产生称做"Q486E: I499L"的工程化裂解单体。以上描述的工程化裂解单体是异常裂解得以最小化或消除的专性异二聚体突变体。工程化裂解单体可使用合适方法,例如通过野生型裂解单体(FokI)的定点诱变来制备,如美国专利公布第20050064474号(参见实施例5)所描述。如上所述的锌指核酸酶可经工程化以在整合靶位点引入双链断裂。双链断裂可在整合靶位点,或其可在远离整合位点多达I个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个或1000个核苷酸处。在一些实施方案中,双链断裂可在远离整合位点多达I个、2个、3个、4个、5个、10个、15个或20个核苷酸处。在其它实施方案中,双链断裂可在远离整合位点多达10个、15个、20个、25个、30个、35个、40个、45个或50个核苷酸处。在其它实施方案中,双链断裂可在远离整合位点多达50个、100个或1000个核苷酸处。(iii)示例性锌指核酸酶本文提供识别和结合在各种动物染色体序列中发现的靶序列的锌指核酸酶的非限制性实例。例如,本发明的锌指核酸酶可具有与一序列至少80%同一的氨基酸序列,所 述序列选自具有选自 53、54、57-62、69-76、104-113、123-126、147-156、201-210、219-222、223-224、230-233、240-243的SEQ ID NO的锌指核酸酶。在其它实施方案中,序列同一性可为约 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%,96%,97%,98%,99%^; 100%。此外,由选自53、54、57-62、69-76、104-113、123-126、147-156、201-210、219-222、223-224,230-233,240-243的SEQ ID NO编码的锌指核酸酶可识别和结合与染色体SEQID NO 55、56、63-68、77-84、86-91、94-103、117-122、129、130、135、136、137、138、139-146、164-173、213-218、226-229、234、235、236、237、238、239 具有至少约 80 %,81 %,8283%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98 %、99 %或100 %序列同一性的染色体序列。(iv)靶向裂解的其它方法具有染色体中的靶位点的任何核酸酶可在本文公开的方法中使用。例如,归巢核酸内切酶和兆碱基大范围核酸酶具有极长识别序列,其中一些序列根据统计可能在人类规模的基因组中出现一次。代替锌指核酸酶或除了锌指核酸酶以外,可使用具有基因组中的唯一靶位点的任何此类核酸酶来进行染色体的靶向裂解。归巢核酸内切酶的非限制性实例包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI, I-Scell, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 和 I-TevIII0 这些酶的识别序列在本领域中是已知的。还参见美国专利第5,420,032号;美国专利第6,833,252 号;Belfort 等(1997) Nucleic Acids Res. 25 :3379-3388 ;Dujon 等(1989) Gene82 :115-118 ;Perler 等(1994)Nucleic Acids Res. 22,1125-1127 Jasin(1996)TrendsGenet. 12:224-228 ;Gimble 等(1996)J. Mol. Biol. 263:163-180 ;Argast 等(1998)J. Mol.Biol. 280 :345-353 和 New England Biolabs 目录。虽然大多数归巢核酸内切酶的裂解特异性相对于其识别位点来说不是绝对的,但是所述位点具有足够长度以致于可通过在含有其识别位点的单个拷贝的细胞中对归巢核酸内切酶进行表达来获得每个哺乳动物规模基因组的单个裂解事件。也已报道归巢核酸内切酶和兆碱基大范围核酸酶的特异性可经工程化以结合非天然靶位点。参见例如Chevalier 等(2002)Molec. Cell 10 :895-905 ;Epinat 等(2003)Nucleic Acids Res. 31 2952-2962 ;Ashworth 等(2006)Nature 441 :656-659 ;Paques 等(2007)Current GeneTherapy 7 :49-66。(b)任选的交换多核苷酸
编辑染色体序列的方法还可包括向细胞中引入至少一种交换多核苷酸,其包含与裂解位点处的染色体序列基本上同一且进一步包含至少一个特定核苷酸变化的序列。通常情况下,交换多核苷酸将是DNA。交换多核苷酸可为DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、线性DNA片段、PCR片段、裸核酸或与递送媒介物(诸如脂质体或泊洛沙姆(poloxamer))复合的核酸。示例性的交换多核苷酸可为DNA质粒。交换多核苷酸中的序列与染色体序列的位于裂解位点的一部分基本上一致。通 常,交换多核苷酸的序列将与染色体序列共有足够的序列同一性以使得两个序列可通过同源重组来交换。例如,交换多核苷酸中的序列可与染色体序列的区至少约80%、81 %、82%、83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%或 99% 同一。重要的是,交换多核苷酸中的序列相对于相应染色体序列的序列包含至少一个特定核苷酸变化。例如,特定密码子的一个核苷酸可更变成另一个核苷酸以使得密码子编码不同的氨基酸。在一个实施方案中,交换多核苷酸中的序列可包含一个特定核苷酸变化以使得所编码的蛋白质包含一个氨基酸变化。在其它实施方案中,交换多核苷酸中的序列可包含两个、三个、四个或更多个特定的核苷酸变化以使得所编码的蛋白质包含一个、两个、三个、四个或更多个氨基酸变化。在其它实施方案中,交换多核苷酸中的序列可包含三个核苷酸的缺失或插入以使得不改变编码阅读的阅读框(并且可产生功能蛋白)。然而,所表达蛋白质将包含单个氨基酸缺失或插入。交换多核苷酸中的与染色体序列的位于裂解位点的一部分基本上同一的序列的长度可以并且将会变化。通常,交换多核苷酸中的序列的长度可在约25bp至约10,OOObp范围内。在各个实施方案中,交换多核苷酸中的序列的长度可为约50、100、200、400、600、800、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800或5000bp。在其它实施方案中,交换多核苷酸中的序列的长度可为约 5500、6000、6500、6000、6500、7000、7500、8000、8500、9000、9500 或 10,OOObp0本领域技术人员将能使用熟知的标准重组技术来构建如本文所述的交换多核苷酸(参见例如 Sambrook 等,2001 和 Ausubel 等,1996)。在以上详述的修饰染色体序列的方法中,通过锌指核酸酶引入染色体序列中的双链断裂经由利用交换多核苷酸的同源重组来修复,以使得交换多核苷酸中的序列可与染色体序列的一部分交换。双链断裂的存在有助于同源重组和断裂的修复。交换多核苷酸可以实体整合或者替代地,交换多核苷酸可用作修复断裂的模板,导致交换多核苷酸中的序列信息与染色体序列中的所述部分中的序列信息交换。因此,内源性染色体序列的一部分可转换成交换多核苷酸的序列。变化的核苷酸可在裂解位点处或附近。另外,变化的核苷酸可在经交换序列中的任何位置处。然而由于交换,染色体序列得以修饰。(C)任选的供体多核苷酸编辑染色体序列的方法可替代地包括将至少一种包含供整合的序列的供体多核苷酸引入细胞中。供体多核苷酸包含至少三个组分两侧具有上游序列和下游序列待整合的序列,其中上游和下游序列与染色体中的整合位点的任一侧共有序列相似性。通常情况下,供体多核苷酸是DNA。供体多核苷酸可为DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、线性DNA片段、PCR片段、裸核酸或与递送媒介物(诸如脂质体或泊洛沙姆)复合的核酸。示例性的供体多核苷酸可为DNA质粒。供体多核苷酸包含供整合的序列。供整合的序列可为动物或细胞的内源性序列或其可为外源性序列。供整合的序列可编码蛋白质或非编码RNA(例如微小RNA)。因此,供整合的序列可以与一个或多个适当的控制序列可操作地连接。另外,供整合的序列可提供调控功能。因此,供整合的序列的大小可以并且将会变化。通常,供整合的序列可在约一个核苷酸到几百万个核苷酸范围内。供体多核苷酸还包含在待整合的序列两侧的上游和下游序列。选择供体多核苷酸中的上游和下游序列以促进目标染色体序列和供体多核苷酸之间的重组。如本文所使用的上游序列是指与整合靶位点上游的染色体序列共有序列相似性的核酸序列。相似地,下游序列是指与整合靶位点下游的染色体序列共有序列相似性的核酸序列。供体多核苷酸中的上游和下游序列可与靶染色体序列共有约75%、80%、85%、90%、95%或100%序列同一 性。在其它实施方案中,供体多核苷酸中的上游和下游序列可与靶染色体序列共有约95 %、96%、97%、98%、99%或100%序列同一性。在示例性的实施方案中,供体多核苷酸中的上游和下游序列可与靶染色体序列共有约99%或100%序列同一性。上游或下游序列可包含约20bp至约2500bp。在各个实施方案中,上游或下游序列可包含约 50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400 或 2500bp。示例性的上游或下游序列可包含约200bp至约2000bp、约600bp至约lOOObp,或更具体地约700bp至约lOOObp。在一些实施方案中,供体多核苷酸可进一步包含标记。此类标记可使得筛选靶向整合变得较容易。合适标记的非限制性实例包括限制位点、荧光蛋白质或选择标记。本领域技术人员将能使用熟知的标准重组技术来构建如本文所述的供体多核苷酸(参见例如 Sambrook 等,2001 和 Ausubel 等,1996)。在以上详述的通过整合序列来编辑染色体序列的方法中,通过锌指核酸酶引入染色体序列中的双链断裂经由利用供体多核苷酸的同源重组来修复以使得将序列整合至染色体中。双链断裂的存在有助于序列的整合。供体多核苷酸可以实体整合,或替代地,供体多核苷酸可用作修复断裂的模板,导致将所述序列以及供体多核苷酸的上游和下游序列的全部或一部分引入染色体中。因此,内源性染色体序列可转换成供体多核苷酸的序列。(d)将核酸引入细胞为了介导锌指核酸酶基因组编辑,将至少一种编码锌指核酸酶的核酸分子和任选地至少一种交换多核苷酸或至少一种供体多核苷酸引入细胞中。如本文所使用的术语“细胞”涵盖包含染色体序列的任何动物细胞。在一些实施方案中,术语“细胞”可指胚胎。在某些示例性的实施方案中,胚胎是受精单细胞阶段胚胎。在其它示例性的实施方案中,胚胎可为任何阶段的胚胎。将核酸引入胚胎或细胞中的合适方法可包括显微注射、电穿孔、声致穿孔、基因枪法、磷酸钙介导的转染、阳离子转染、脂质体转染、树形聚合物转染、热休克转染、核转染、磁转染、脂质转染、基因交付(impalefection)、光转染、专利品增强的核酸吸收,以及经由脂质体、免疫脂质体、病毒颗粒或人造病毒粒子来递送。在一个实施方案中,核酸可通过显微注射引入胚胎中。核酸可显微注射至胚胎的细胞核或细胞质中。在另一个实施方案中,核酸可通过核转染引入细胞中。在其中将编码锌指核酸酶的核酸和交换(或供体)多核苷酸引入胚胎或细胞的实施方案中,交换(或供体)多核苷酸与编码锌指核酸酶的核酸的比率可在约I : 10至约10 I范围内。在各个实施方案中,交换(或供体)多核苷酸与编码锌指核酸酶的核酸的比率可为约 I : 10、1 9、1 8、1 7、1 6、1 5、1 4、1 3、1 2、1 1、2 I、3 : 1、4 : 1、5 1、6 1、7 1、8 : 1、9 : I或10 : I。在一个实施方案中,比率可为约 I : I。在将一种以上编码锌指核酸酶的核酸和任选一种以上交换(或供体)多核苷酸引入胚胎或细胞的实施方案中,核酸可同时或相继引入。例如,可将编码分别具有针对不同识别序列的特异性的锌指核酸酶的核酸以及任选的交换(或供体)多核苷酸同时引入。另外,可将每种编码锌指核酸酶的核酸以及任选的交换(或供体)多核苷酸相继引入。在一个实施方案中,将至少一种编码锌指核酸酶的核酸分子引入细胞中。在另一个实施方案中,将至少2种、3种、4种、5种或5种以上编码锌指核酸酶的核酸分子引入细胞中。在以上实施方案的每一个中,也可如上所述以约I : 10至约10 I供体或交换多核苷酸与锌指核酸酶核酸的比率将一种或多种相应供体或交换多核苷酸引入细胞中。(e)培养细胞使用如本文所述的锌指核酸酶介导的过程来编辑染色体序列的方法还包括培养包含所引入核酸的细胞以使得表达至少一种锌指核酸酶。可使用标准程序来培养包含所引入核酸的细胞以使得表达锌指核酸酶。标准细胞培养技术描述于例如 Santiago 等(2008)PNAS 105 :5809-5814 ;Moehle 等(2007)PNAS 104 :3055-3060 ;Urnov 等(2005)Nature 435 :646-651 ;和 Lombardo 等(2007)Nat.Biotechnology 25 :1298-1306。本领域技术人员应认识到培养细胞的方法在本领域中是已知的,并且可以并且将会取决于细胞类型或细胞物种而变化。在所有情况下,可使用常规优选法来确定用于特定细胞类型的最好的技术。在细胞是胚胎的一个实施方案中,胚胎可在体外(例如,在细胞培养物中)培养。通常情况下,在适当的温度下和具有必要02/C02比率的适当培养基中将胚胎培养一段较短时间以使得表达锌指核酸酶。本领域技术人员将认识到培养条件可以并且将会取决于胚胎物种而变化。在所有情况下,可使用常规优选法来确定用于特定胚胎物种的最好的培养条件。在某些情况下,细胞系可来源于体外培养的胚胎(例如,胚胎干细胞系)。优选地,通过将胚胎转移至雌性宿主的子宫中来使胚胎在体内培养。一般来说,雌性宿主来自与胚胎相同或相似的物种。优选地,雌性宿主是假孕的。制备假孕雌性宿主的方法在本领域中是已知。另外,将胚胎转移至雌性宿主中的方法是己知的。将胚胎在体内培养使得胚胎可发育,并且可导致来源于胚胎的动物活产。此类动物通常在其体内的每个细胞中将包含打乱的染色体序列。在细胞中表达至少一种锌指核酸酶后,可对细胞的染色体序列加以编辑。在细胞包含所表达的锌指核酸酶但是不包含交换(或供体)多核苷酸的情况下,锌指核酸酶识别、结合和裂解目标染色体序列中的靶序列。由锌指核酸酶引入的双链断裂通过容易出错的非同源末端连接DNA修复过程来修复。因此,可在染色体序列中引入导致错义或无义突变的缺失或插入以致于使所述序列失活。
在胚胎或细胞包含所表达的锌指核酸酶以及交换(或供体)多核苷酸的情况下,锌指核酸酶识别、结合和裂解染色体中的靶序列。由锌指核酸酶引入的双链断裂经由与交换(或供体)多核苷酸的同源重组来修复,以使得染色体序列的一部分转换成交换多核苷酸中的序列或将供体多核苷酸中的序列整合到染色体序列中。因此,染色体序列得以编辑。本文公开的基因修饰动物可杂交以产生包含一个以上经编辑染色体序列的动物或产生关于一个或多个经编辑染色体序列为纯合的动物。本领域技术人员将认识到许多组合是可能的。此外,本文公开的基因修饰动物可与其它动物杂交以将经编辑染色体序列与其它遗传背景组合。作为非限制性实例,合适的遗传背景包括野生型、产生己知表型的自然突变、靶向染色体整合、非靶向整合等。(f)染色体编辑的类型如上所述,本发明的方法可用来⑴使染色体序列失活、(2)修饰染色体序列,或(3)将序列整合至染色体中。这些用途中的每一个在下文更详细地讨论。 i使序列失活在一个实施方案中,可使经编辑的染色体序列失活以使得序列不被转录、不产生所编码的蛋白质,或序列不能像野生型序列那样起作用。例如,可使蛋白质编码序列失活以使得不产生蛋白质。另外,可使微小RNA编码序列失活以使得不产生微小RNA。此外,可使控制序列失活以使得其不再充当控制序列。如本文所使用的“控制序列”是指实现核酸序列的转录、翻译或可达性的任何核酸序列。作为非限制实例,启动子、转录终止子和增强子是控制序列。失活的染色体序列可包含缺失突变(即,缺失一个或多个核苷酸)、插入突变(即,插入一个或多个核苷酸)或无义突变(即,单个核苷酸取代成另一个核苷酸以使得引入终止密码子)。在一些实施方案中,失活的染色体序列可被称为“敲除”。在本发明的一个重复中,由本发明的方法产生的“敲除”动物不包含任何外源性序列。ii.对序列讲行修饰在另一个实施方案中,经编辑染色体序列可经修饰以使得其编码改变的基因产物或序列的功能得以改变。编码蛋白质的染色体序列可经修饰以包含至少一个经改变的核苷酸以使得包含经改变的核苷酸的密码子编码不同的氨基酸。因此,所产生蛋白质包含至少一个氨基酸变化。此外,蛋白质编码序列可通过插入或缺失来修饰以使得不改变序列的阅读框并产生经修饰的蛋白质。在此类实施方案中,经修饰的序列可产生表型变化。另外,充当控制序列的染色体序列可经修饰。例如,启动子可经修饰以使得其总是具有活性或由外源性信号调控。在另一实施方案中,至少一个编码目标蛋白质的染色体序列可经编辑以使得改变蛋白质的表达模式。例如,控制蛋白质表达的调控区,诸如启动子或转录因子结合位点可改变以使得过度产生目标蛋白质,或改变蛋白质的组织特异性或时序表达,或其组合。iii.整合序列在另一实施方案中,经编辑染色体序列可包含整合的序列。此类序列可编码内源性蛋白质、外源性或异种蛋白质、野生型蛋白质、经修饰的蛋白质、融合蛋白、微小RNA等。整合蛋白质编码序列可与报告基因序列连接(报告基因序列可在5’或3’末端连接至蛋白质编码序列)。整合蛋白质编码序列也可处于内源性启动子的控制下,可与外源性启动子可操作连接,或可与内源性蛋白质编码序列在框内融合。另外,整合序列可充当控制元件。因此,整合序列相对于细胞可为内源性或外源性的。包含此类整合序列的动物或细胞可被称为“敲入”。在以上实施方案的一个重复中,应理解不存在选择标记。在某些实施方案中,序列可经整合以改变目标蛋白质的表达模式。例如,可产生条件性敲除系统。
A.备件件突夺在某些实施方案中,序列可经编辑以改变目标蛋白质的表达模式。例如,可产生条件性敲除系统。如本文所使用的“条件性敲除”系统是与在整个动物中,和/或以时序控制方式形成对照,其中核酸分子在特定器官、组织或细胞类型中的表达被打乱的模型。条件性敲除使得可例如甚至在基因的整体打乱会致命时研究基因功能。条件性敲除系统的非限制实例包括Cre-Iox重组系统。Cre-Iox重组系统包括Cre重组酶,它是可催化核酸分子中的特异位点(Iox位点)之间的核酸序列重组的位点特异性DNA重组酶。使用此系统以产生时序和组织特异性表达的方法在本领域中是已知的。通常,利用侧接目标染色体序列的Iox位点来产生基因修饰细胞。包含具有与Iox侧接的目标染色体序列的细胞的基因修饰动物然后可与另一种在一种或多种细胞中表达Cre重组酶的基因修饰动物杂交。然后产生包含一种或多种包含与Iox侧接的染色体序列的细胞和一种或多种包含Cre重组酶的细胞的子代动物。在包含与Iox侧接的染色体序列和Cre重组酶的细胞中,编码目标蛋白质的与Iox侧接的染色体序列得以重组,导致编码目标蛋白质的染色体序列缺失或倒位。可按时序并有条件地调控Cre重组酶的表达以实现对编码目标蛋白质的染色体序列的重组进行按时序和有条件的调控。A.打乱内源件基因座的整合在另一个实施方案中,本发明的方法可用于整合打乱内源性基因座的突变。例如,染色体序列可通过用外源性序列取代内源性序列来打乱,以使得外源性序列处于内源性启动子的控制下。在这些实施方案中,打乱的内源性序列将不被表达,但是整合的外源性序列将得以表达。外源性序列可为内源性序列的同系物。例如,当内源性序列是非人序列时,夕卜源性序列可为人序列。在一些实施方案中,外源性序列可与其替换的内源性序列无关。例如,内源性序列可用外源性标记取代以使得当内源性启动子具有活性时,标记是可检测的。在一些实施方案中,标记可为可放大标记的可检测信号的酶标记。另外,在一些实施方案中,本发明的方法可用来以外源性启动子或调控序列取代内源性启动子或其它调控序列。在这些实施方案中,与内源性启动子或调控序列形成对照,基因座的表达模式将由外源性启动子或调控序列来控制。此类外源性启动子或调控序列可为内源性启动子或调控序列的同系物。例如,当内源性序列是非人序列时,外源性序列可为人序列。在一些实施方案中,外源性序列可与其替换的内源性序列无关。C.外源件核酸序列的整合另外,代替打乱基因座,本发明的方法可用于在存在或不存在启动子的情况下将外源性序列整合到染色体序列中而不打乱内源性基因座的表达。在一些实施方案中,此类整合可位于“安全港”基因座中,诸如大鼠中的Rosa26基因座(或另一种动物中的等同物)或大鼠中的X染色体上的HPRT基因座(或另一种动物中的等同物)。在一个实施方案中,可将包含与外源性核酸序列可操作连接的外源性启动子的盒整合到安全港基因座中。在某些实施方案中,外源性启动子可为条件性的。例如,条件性启动子可为组织特异性启动子、器官特异性启动子或细胞类型特异性启动子(诸如干细胞启动子、B细胞启动子、毛发细胞启动子等)或可诱导启动子。如本文所使用的可诱导启动子是只在存在特定物质(诸如抗生素、药物或其它外源性化合物)时具有活性的启动子。在一些实施方案中,包含条件性启动子的盒的整合可用来跟踪细胞谱系。在另一个实施方案中,可整合外源性核酸序列以充当特定核酸序列的可检测标记。P.人源化在另一个实施方案中,基因修饰动物可为包含至少一个染色体整合的编码功能性人蛋白质的序列的“人源化”动物。功能性人类蛋白质可能在基因修饰动物中没有相应直系同源物。另外,产生基因修饰动物的野生型动物可包含与功能性人蛋白质对应的直系同源物。在这种情况下,使“人源化”动物中的直系同源序列失活以使得不产生内源性功能性蛋白质,并且"人源化"动物包含至少一个染色体整合的编码人蛋白质的序列。本领域技术人员应认识到“人源化”动物可通过使敲除动物与包含染色体整合序列的敲入动物杂交 来产生。(g)多个染色体编辑上述发明的进一步实施方案包括连续地进行本发明的方法,以使得具有一种以上染色体编辑的细胞得以发育。例如,可培养具有第一种编辑的胚胎以产生包含第一种基因组编辑的动物。来源于此动物的胚胎然后可用于本发明的方法中以产生第二种基因组编辑。可重复相同过程以产生具有三种、四种、五种、六种、七种、八种、九种、十种或十种以上基因组编辑的胚胎。另外,可通过将每种具有针对不同编辑位点的特异性的一种以上锌指核酸酶同时引入来使具有多种基因组编辑的细胞得以发育。也可任选地引入相应数目的供体和/或交换多核苷酸。引入细胞中的锌指核酸酶和任选相应供体或交换多核苷酸的数目可为两种、三种、四种、五种或五种以上。II.源自本发明的方法的应用本发明的方法可用于产生包含经编辑染色体序列的动物或细胞。此类动物或细胞可用于几种不同应用,包括例如研究应用、家畜应用、宠物应用或生物分子产生应用。此类应用的非限制性实例在以下(a)-(d)部分中详述。(a)研究应用在某些实施方案中,本发明的方法可用于产生可在研究应用中使用的动物或细胞。此类应用可包括疾病模型、药理学模型、发育模型、细胞功能模型和人源化模型,其每一个在下文予以详述。 .疾病模型本发明的方法可用于产生可用作疾病模型的动物或细胞。如本文所使用的“疾病”是指受试者的疾病、病症或适应症。例如,在一个实施方案中,本发明的方法可用于产生在一个或多个与疾病相关的核酸序列中包含染色体编辑的动物或细胞。此类核酸序列可编码疾病相关蛋白质序列或可为疾病相关控制序列。在一个实施方案中,由本发明的方法产生的动物或细胞可用于通过使用在疾病的研究中通常使用的度量来研究突变对于动物或细胞和疾病发生和/或进展的效应。另外,此类动物或细胞可用于研究药学活性化合物对于疾病的效应。在另一个实施方案中,由本发明的方法产生的动物或细胞可用于评估潜在基因治疗策略的功效。也就是说,编码与疾病相关的蛋白质的染色体序列可经修饰以使得疾病发生和/或进展得到抑制或降低。尤其是,所述方法包括编辑编码与疾病相关的蛋白质的染色体序列以便可产生改变的蛋白质,并且因此,动物或细胞具有改变的反应。因此,在一些实施方案中,基因修饰动物可与易患疾病的动物相比较以使得可评估基因治疗事件的效应。在某些实施方案中,本发明的方法可用于产生可用作表A中列出疾病的疾病模型的动物或细胞。此类动物或细胞可在表A列出的基因中包含染色体编辑。在另一个实施方案中,本发明的方法可用于产生可用作表B中列出疾病的疾病模型的动物或细胞。此类动物或细胞可在表B列出的基因中包含染色体编辑。在表B中,疾病/病症/适应症列中的条目后面的六位数字是可在万维网上获得的OMIM号码(Online Mendelian Inheritancein Man, OMIM(TM). McKusick-Nathans Institute of Genetic Medicine, Johns HopkinsUniversity(Baltimore, MD)and National Center for Biotechnology Information,National Library of Medicine(Bethesda,MD)。每一种病症名称后面的圆括号中的数字指示突变是否通过将野生型基因作图(I),通过将疾病表型本身作图(2),或这两种方法(3)来定位。例如,“(3)”表示对野生型基因作图,并展示与病症相联系的基因出现突变。
权利要求
1.一种编辑染色体序列的方法,所述方法包括 (a)向包含所述染色体序列的细胞中引入至少一种编码识别所述染色体序列中的靶序列且能够裂解所述染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的 (i)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中所述供体序列的两侧为所述上游序列和所述下游序列,并且其中所述上游序列和所述下游序列与所述裂解位点的任一侧具有显著的序列同一性,或 ( )至少一种交换多核苷酸,其包含与所述染色体序列的位于所述裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列;和 (b)培养所述细胞以允许表达所述锌指核酸酶,以使得所述锌指核酸酶将双链断裂在 所述裂解位点引入所述染色体序列,并且其中所述双链断裂由以下过程修复 (i)非同源末端连接修复过程,以使得将突变引入所述染色体序列,或任选的( )同源介导修复过程,以使得将所述供体序列整合到所述染色体序列中或使所述交换序列与所述染色体序列的一部分交换。
2.根据权利要求I所述的方法,其中所述细胞是胚胎。
3.根据权利要求2所述的方法,其中所述胚胎是单细胞胚胎。
4.根据权利要求I所述的方法,其中将一种以上编码锌指核酸酶的核酸引入所述细胞。
5.根据权利要求I所述的方法,其中所述编码锌指核酸酶的核酸是RNA。
6.根据权利要求5所述的方法,其中对所述RNA进行加帽。
7.根据权利要求5所述的方法,其中对所述RNA进行多腺苷酸化。
8.根据权利要求I所述的方法,其中将选自所述供体多核苷酸、所述交换多核苷酸或其任何组合的一种以上多核苷酸引入所述细胞。
9.根据权利要求I所述的方法,其中所述细胞是培养细胞、原代细胞或干细胞。
10.根据权利要求I所述的方法,其中所述细胞是人细胞、哺乳动物细胞、脊椎动物细胞、无脊椎动物细胞或真菌细胞。
11.一种非人动物,所述动物由根据权利要求I所述的方法产生。
12.根据权利要求11所述的非人动物,其中所述动物是啮齿类动物。
13.根据权利要求11所述的非人动物,其中所述动物是家畜动物。
14.根据权利要求11所述的非人动物,其中所述动物是伴侣动物。
15.一种细胞,所述细胞由使用根据权利要求I所述的方法产生。
16.根据权利要求15所述的细胞,其中所述细胞是胚胎。
17.根据权利要求16所述的细胞,其中所述胚胎是单细胞胚胎。
18.根据权利要求15所述的细胞,其中所述细胞是培养细胞、原代细胞或干细胞。
19.一种胚胎,所述胚胎包含至少一种编码识别所述染色体序列中的靶序列且能够裂解所述染色体序列中的裂解位点的锌指核酸酶的核酸,和任选的 (i)至少一种包含供整合的供体序列、上游序列和下游序列的供体多核苷酸,其中所述供体序列的两侧为所述上游序列和所述下游序列,并且其中所述上游序列和所述下游序列与所述裂解位点的任一侧具有显著的序列同一性,或 ( )至少一种交换多核苷酸,其包含与所述染色体序列的位于所述裂解位点的一部分基本上同一且进一步包含至少一个核苷酸变化的交换序列。
20.根据权利要求19所述的胚胎,其中所述胚胎是单细胞胚胎。
全文摘要
本发明包括一种用于产生具有至少一种染色体编辑的动物或细胞的方法。具体而言,本发明涉及使用靶向锌指核酸酶来编辑染色体序列。本发明还包括由本发明的方法产生的动物或细胞。
文档编号C12N15/87GK102858985SQ201080042058
公开日2013年1月2日 申请日期2010年7月23日 优先权日2009年7月24日
发明者E·魏因施泰因, X·崔, P·西蒙斯 申请人:西格马-奥尔德里奇有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1