用于靶向单链切割和靶向整合的方法和组合物的制作方法

文档序号:581112阅读:253来源:国知局
专利名称:用于靶向单链切割和靶向整合的方法和组合物的制作方法
技术领域
本公开属于基因组工程、基因靶向、靶向染色体整合和蛋白表达领域。
背景技术
关于基因组生物学,尤其是确定许多基因组的完整核苷酸序列的重要感兴趣领域,是基因组序列的靶向改变。人工核酸酶,其连接核酸酶的切割结构域与设定的DNA结合蛋白(例如,与如来自 I^okI核酸酶切割结构域连接的锌指蛋白(ZFP)),已被用于真核细胞中的靶向切割。例如, 锌指核酸酶介导的基因组编辑已显示出能通过(1)在活细胞的基因组中,特异性地在用于所需修饰的靶位点产生双链断裂,和( 允许DNA修复的天然机制以“恢复”该断裂,在特定位点修饰人类基因组的序列。为了增加特异性,使用一对或多对用户设计的锌指核酸酶诱导切割事件,该锌指核酸酶在结合DNA时即二聚化以形成催化激活的核酸酶复合物。而且,使用一对或多对锌指核酸酶(ZFN)进一步增加了特异性,其包括仅仅在形成异二聚体后切割双链DNA的改造切割半结构域。参见,例如,美国专利公开No. 20080131962,其通过引用全文并入本文。通过人工核酸酶产生的双链断裂(DSB)已经用于,例如,诱导靶向突变诱导细胞内DNA序列的靶向缺失和促进在预定染色体位点的靶向重组。参见,例如,美国专利公开 2003023M10 ;20050208489 ;20050026157 ;20050064474 ;20060188987 ; 20060063231 ;20070218528 ;20070134796 ;20080015164 以及国际公开 WO 07/014275 和 WO 2007/139982,其公开内容适用于所有目的地通过引用全文并入本文。因此,在靶基因组位点产生DSB的能力允许任意基因组的基因组编辑。有两种重要且不同的途径来修复DSB-同源重组和非同源末端连接(NHEJ)。同源重组需要存在同源序列作为模板(例如“供体”),以指导细胞内修复过程,而且修复的结果是没有错误并且可预测的。对于同源重组,缺乏模板(或“供体”)序列,细胞一般会通过非同源末端连接(NHEJ)的不可预测和容易出错的过程修复DSB。单链断裂(SSB),包括DNA缺口,是内源性活性氧物种和DNA代谢过程如DNA修复和复制中最常见的DNA损伤之一。参见,]^灯1111011等Q007)Annu Rev Genomics Hum Genet 8 :37-55 ;01 1110等Q003)Mol Cell Biol 23 :3974-3981。非凋亡细胞的染色体在整个基因组的大约50kb间隔处含有单链中断(SSB/缺口)。参见,例如,Szekvolgyi等(2007)Proc Natl Acad Sci USA104 14964-14969。大多数SSB/缺口可通过快速整体SSB修复过程进行修复,其可以分成4个基本步骤通过聚(ADP-核糖)聚合酶-I(PARP-I)的SSB缺失,通过各种酶的DNA末端加工,通过DNA聚合酶的DNA缺口填补和通过DNA连接酶的DNA连接, 参见 Caldecott,K. W. (2008)Nat Rev Genet 9,619_31。Lee 等 U004)Cell 117:171-184发现的数据表明,由突变的RAG蛋白诱导的缺口可以在哺乳动物细胞中启动同源性定向修复(HDR)。然而,以前没有表明改造ZFN可以诱导SSB/缺口,或这些SSB/缺口可以通过同源重组修复,或ZFN可用于通过同源重组促进转基因的靶向整合。因此,需要在双链DNA中产生单链断裂(缺口),并通过在缺口位点的同源重组促进靶向整合,同时在哺乳动物/人类细胞中不产生倾向错误的NHEJ修复的方法和组合物。发明概述本发明公开了用于在任意目标双链靶序列中诱导靶向单链断裂的方法和组合物。 还描述了在靶向单链切割之后促进同源重组和靶向整合的方法。因此,本发明描述了基因组的靶向调节。在一个方面,提供了在所需的双链靶序列中产生单链切割的人工(非天然存在) 核酸酶。这里描述的核酸酶包括一个DNA结合结构域(例如,改造的锌指蛋白)和至少一个切割结构域或至少一个切割半结构域。在特定的实施方案中,核酸酶是包括锌指结构域的锌指核酸酶,该锌指结构域被改造以结合任意选择的序列(例如,基因)。这里描述的任意锌指蛋白可包括1、2、3、4、5、6或多个锌指蛋白,每一锌指蛋白具有一个结合选择的序列(例如,基因)中的靶亚位点的识别螺旋。切割结构域可以来源于任意核酸酶,例如,来自IIS型核酸酶如R)kl的切割半结构域。在特定的实施方案中,切割半结构域包括改造的 i^okl切割半结构域,其与另一个切割半结构域(例如,二聚化结构域中改造的或野生型)形成异二聚体。在进一步的实施方案中,切割结构域(例如,改造的i^okl切割半结构域)包括失活核酸酶结构域的催化结构域(酶促活性)的突变。在另一个方面中,本发明提供了包括一对锌指核酸酶的复合物和/或组合物,每个核酸酶包括一个改造的锌指结构域和一个R)ki切割半结构域,其中切割半结构域形成二聚体(同源二聚体或异二聚体)。在特定的实施方案中,锌指核酸酶对中的一个锌指核酸酶包括第一催化激活的改造切割半结构域,另一个锌指核酸酶包括第二催化失活的改造切割半结构域,其中第一和第二改造切割半结构域形成专性异二聚体。在另一个方面中,提供了编码这里描述的任意核酸酶的多核苷酸。在另一个方面中,还提供了含有这里所述的任意蛋白和/或多核苷酸的分离的细胞。在特定的实施方案中,提供了通过靶向改变引入了外源序列到其中的细胞系。在特定的实施方案中,这些细胞系中的一个或多个选择的基因被失活(部分或全部)。在其他的实施方案中,细胞或细胞系包括一个或多个转录和/或翻译的外源序列,该外源序列已经被稳定或瞬时引入到细胞中。通过培养含有这里所述的任意蛋白和/或多核苷酸的细胞,在导致选择基因失活的细胞系中产生这种细胞系。还本发明提供了含有一个或多个转录和/或翻译的外源序列的转基因生物,该外源序列已经被稳定或瞬时引入到细胞中。进一步提供了含有通过这里提供的方法选择性失活的基因的转基因生物,或含有能改变内源序列的表达的外源序列的生物。这里所述的转基因生物可以是植物(例如农作物植物或烟草)或动物(例如,小鼠、大鼠、兔子、鱼等等)。在特定的实施方案中,转基因生物用于生产携带编码这里所述的核酸酶的一个或多个序列,和/或一个或多个外源序列(例如,使用这里所述的核酸酶通过靶向整合被插入到基因组中的序列)的生物的系。例如,这里公开了含有这里所述的核酸酶的转基因植物和植物系,该核酸酶在可诱导启动子的调控下。因此,可以在植物中在所需时间和/或植物的所需组织中,表达含有编码核酸酶的游离或整合序列的转基因植物和植物系。此外,本发明提供了在细胞中的靶双链序列中产生特定的单链断裂的方法。在特定的实施方案中,该方法包括引入一对或多对核酸酶(编码核酸酶的蛋白或多核苷酸)到细胞中。每个核酸酶对包括具有第一 DNA结合结构域和第一催化激活切割半结构域的第一核酸酶,和具有第二 DNA结合结构域和第二催化失活的切割半结构域的第二核酸酶。在以便每个核酸酶对的第一与第二切割半结构域形成二聚体并在靶序列中产生单链断裂的条件下,一对或多对核酸酶被引入到细胞中。在特定的实施方案中,第一和/或第二 DNA结合结构域含有锌指蛋白(例如,改造的锌指蛋白)。进一步地,在这里所述的任意方法中,第一和第二切割半结构域可含有i^okl 切割半结构域,例如被改造以形成专性异二聚体的I^okI切割半结构域。靶序列可以是任意双链序列,例如,细胞染色质中的序列如基因组序列或其部分。而且,靶序列可以是例如质粒或病毒中的染色体外的双链DNA序列。类似地,靶序列可以处于任意的细胞类型中,包括原核和真核细胞,如真菌细胞,植物细胞,动物细胞,哺乳动物细胞,灵长类动物细胞和人类细胞。单链断裂的位点可与催化激活的核酸酶结合的序列一致,或者它可以是相邻的 (例如与结合位点的近端分隔1,2,3,4,5,6,7,8,9,10,11,12,13,14,15或更多个核苷酸)。 可以通过递送融合蛋白到细胞中和/或通过递送编码一种或多种核酸酶的多核苷酸到细胞中,在细胞中表达融合蛋白,其中该多核苷酸,如DNA,被转录成mRNA,该mRNA然后翻译成融合蛋白。可选择地,RNA分子可以被递送到细胞中,该RNA分子然后被翻译以产生融合蛋白。在本发明公开的其他地方提供了将用于多核苷酸和多肽递送到细胞中的方法。本发明还提供了用于靶向重组的方法(用于,例如,染色体或者细胞染色质中目标区域中的序列的改变或取代)。例如,用野生型序列取代突变的基因组序列用于遗传疾病或遗传紊乱的治疗。此外,可以用突变序列取代野生型基因组序列,例如,来防止致癌基因产物或涉及不合宜的炎症性应答的基因产物的功能。进一步地,可以用一个或多个不同的等位基因取代基因的一个或多个等位基因(例如,双等位基因靶向整合)。在本发明公开的方法中,这里描述的一个或多个靶向核酸酶在靶序列的预定位点产生单链断裂,而且其与断裂区域中的核苷酸序列具有同源性的“供体”多核苷酸可以被导入到细胞中。这里已经显示单链断裂的存在有助于供体序列的整合。供体序列可以被物理整合或,可选地,供体多核苷酸用作模板用于通过同源重组修复断裂,其导致如供体中的全部或部分核苷酸序列导入到细胞染色质中。因此,细胞染色质中的最初序列可以被改变而且,在特定的实施方案中,可以被转变成供体多核苷酸中存在的序列。因此,术语“取代 (“r印lace”)”或“取代的(“r印lacement”)”的使用可以理解为表示用另一个核苷酸序列取代一个核苷酸序列(也即,信息意义上的序列取代),而且不必要求由另一个多核苷酸对一个多核苷酸进行物理或化学取代。另外,本发明提供了用第一核苷酸序列取代细胞染色质的目的区域(例如,基因组序列)的方法,该方法包括(a)改造第一锌指结构结合结构域以结合目的区域中的第二序列;(b)提供第二锌指结构结合结构域以结合目的区域中的第三序列;(c)在细胞中表达第一融合蛋白,该第一融合蛋白含有第一锌指结构结合结构域和第一催化激活的切割半结构域;(d)在细胞中表达第二融合蛋白,该第二融合蛋白含有第二锌指结合结构域和第二催化失活的切割半结构域;和(e)使细胞与含有第一核苷酸序列的多核苷酸接触;其中第一融合蛋白与第二序列结合,第二融合蛋白与第三序列结合,从而定位切割半结构域以便在细胞染色质的目的区域中产生单链断裂,而且用第一核苷酸序列取代目的区域中的核苷酸序列。在特定的实施方案中,在目的区域的第二与第三序列之间的位点产生细胞染色质中的单链断裂。锌指结构核酸酶可作为蛋白和/或编码所述锌指结构核酸酶的一个或多个多核苷酸的方式提供给细胞。例如,可以导入两个多核苷酸到细胞中,每个多核苷酸含有编码两种融合蛋白之一的序列。可选择地,可以引入含有编码两种融合蛋白的序列的单个多核苷酸到细胞中。在这里描述的任意方法中,其他的锌指结构蛋白对可用于细胞内另外的靶位点的另外的双链和/或单链切割。因此,在一个实施方案中,用第一核苷酸序列取代细胞染色质中的目的区域(例如,基因组)的方法包括(a)改造第一锌指结合结构域以结合目的区域中的第二序列;(b) 提供第二锌指结合结构域以结合第三序列;和(c)使细胞与(i)含有第一核苷酸序列的第一多核苷酸;(ii)含有第一融合蛋白的第二多核苷酸接触,第一融合蛋白含有第一锌指结合结构域和第一催化活性半切割第一结构域;和(iii)编码第二融合蛋白的第三多核苷酸,第二融合蛋白含有第二锌指结合结构域和第二催化失活的切割半结构域;其中表达第一和第二融合蛋白,第一融合蛋白与第二序列结合,第二融合蛋白与第三序列结合,从而定位切割半结构域以便在细胞染色质中的目的区域中产生单链断裂,并用第一核苷酸序列取代目的区域。在用于细胞染色质的目的区域中的序列的靶向重组和/或取代和/或改变的优选实施方案中,通过与外源“供体”核苷酸序列的同源重组来改变染色体的序列。如果存在与断裂区域同源的序列,通过细胞染色质中单链断裂的存在来刺激这种同源重组。值得注意的是,细胞染色质中的单链断裂不刺激非同源末端连接的细胞机理。在这里描述的任意方法中,第一核苷酸序列(“供体序列”)可含有与目的区域中的基因组序列同源但不相同的序列,从而刺激同源重组以插入非相同序列到目的区域中。 因此,在特定的实施方案中,与目的区域中序列同源的供体序列部分显示与被取代的基因组序列有大约80到99%的(或这之间的任意整数)序列同一性。在其他的实施方案中,供体与基因组序列之间的同源性高于99%,例如如果供体与超过100个连续碱基对的基因组序列之间只有1个核苷酸不同。在特定的情况下,供体序列的非同源部分可含有目的区域中不存在的序列,以便引入新的序列到目的区域中。在这种情况下,非同源序列一般侧接于 50-1,000(或这之间的任意整数值)个碱基对,或大于1,000的任意数量的碱基对的序列, 例如人工染色体中发现的那些序列,其与目的区域中的序列同源或相同。在其他的实施方案中,供体序列与第一序列是非同源的,而且通过非同源重组机制被插入到基因组中。这里描述的任意方法可用于通过供体序列的靶向整合,部分或完全失活细胞中的一个或多个靶序列,该靶向整合破坏目的基因的表达。本发明还提供了具有部分或完全失活的基因的细胞系。更进一步地,具有部分或完全失活的基因的植物细胞系可用于产生转基因植物。本发明还提供了包含这里所描述的核酸酶的植物细胞系,其中核酸酶的表达由诱导型启动子驱动。类似地,具有部分或完全失活的基因的哺乳动物生殖细胞,如卵母细胞,可用于产生转基因动物。此外,这里描述的靶向整合的方法还可用于整合一个或多个外源序列。外源核酸序列可包含,例如,一个或多个基因或cDNA分子,或任意类型的编码或非编码序列,以及一个或多个调控元件(例如,启动子)。另外,外源核酸序列可以产生一个或多个RNA分子(例如,小的发夹 RNA (shRNA),抑制 RNA (RNAi),小 RNA (miRNA),等等,)。在这里描述任意细胞、细胞系和方法中,细胞或细胞系可以是COS,CH0(例如, CHO-S, CHO-Kl, CH0-DG44, CH0-DUXB11, CHO-DUKX, CHOKlSV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, SP2/0_Agl4, HeLa, HEK293(例如,HEK293-F, HEK293-H, HEK293-T), PerC. 6 (Crucell) ;EBx (Sigma-Aldrich Group),昆虫细胞如草地贪夜蛾 (Spodoptera fugiperda, Sf),或真菌细胞如酵母属,毕赤氏酵母属和裂殖酵母属细胞。在另一个方面中,本发明提供了含有这里描述的一个或多个核酸酶(或编码这些核酸酶的多核苷酸)的试剂盒,该试剂盒用于实施这里描述的方法。试剂盒任选地可包含试剂、缓冲液、细胞、合适的容器和说明书。根据作为一个整体的本公开,这些和其他方面对本领域技术人员是非常显而易见的。附图简述

图1为描述示例性的锌指核酸酶(ZFN)结构,其包括失活的切割结构域的示意图。 ZFN对只切割一条DNA链以形成单链断裂(SSB),也称为缺口。图2,图A-C,描述了使用锌指核酸酶对进行双链靶的单链切割,其中一个核酸酶包括一个已经突变以失活核酸酶结构域的切割活性的切割结构域。图2A描述了通过用所述的ZFN对切割靶底物获得的双链切割产物的分析。从左至右,泳道表示分子量阶梯,对照,靶向CCR5的ZFN对8196zKK 8267EL,其中KK和 EL指改造的切割结构域,其形成专性的异质二聚体以产生双链断裂(参见,美国专利公开2008/0131962),本申请中称为野生型8196ζΚΚ拟67EL (WT);靴向CCR5的ZFN对 8196zKK拟67EL,其中8267EL蛋白在一个切割半结构域的催化结构域的450位置处还含有一个突变(D450N),该突变失活ZFN对的一个切割半结构域;靶向CCR5的ZFN对 8196ζΚΚ:拟67EL,其中8267EL蛋白在催化结构域的467位置处还含有一个突变(D467A), 该突变失活ZFN对的一个切割半结构域;另一个分子量阶梯,另一个对照;靶向CCR5的ZFN 对8267RD:8196zDR,其中RD和DR指改造的切割结构域,其形成专性异质二聚体(参见, 美国专利公开2008/0131962),本申请中称作野生型8267RD:8196zDR(WT);靶向CCR5的 ZFN对8267RD:8196zDR,其中8196zDR蛋白在一个切割半结构域的催化结构域的450位置处还含有一个突变(D450N),该突变失活ZFN对的一个切割半结构域;靶向CCR5的ZFN对 8267RD:8196zDR,其中8196zDR蛋白在催化结构域的467位置处还含有一个突变(D467A), 该突变失活ZFN对的一个切割半结构域。图2B描述了通过用所述的ZFN对切割靶底物获得的单链切割产物的分析。如上面图2A所述,泳道从左至右分别表示分子量阶梯,对照,靶向CCR5的ZFN 对 8196zKK:8267EL(WT);靴向 CCR5 的 ZFN 对 8196zKK:8267EL(D450N);靴向 CCR5 的 ZFN对8196zKK 8267EL (D467A);另一个分子量阶梯,另一个对照;靶向CCR5的ZFN对 8267RD:8196zDR(WT);靶向 CCR5 的 ZFN拟67RD:8196zDR 示(D450N);和靶向 CCR5 的 ZFN 对8267RD:8196zDR(D467A)。图2C的简图描述了使用这里所述的突变切割结构域可能的切割模式,其表明由于在不同的DNA片断中放射性标记的定位,可以在放射自显影分析中检测到条带。图3,图A到E,描述了通过HDR依赖的单链退火(SSA)途径,K562细胞中ZFN诱导的SSB/缺口的修复。在缺乏(无ZFN,图3B)或存在图2A中如上所述的ZFN表达质粒时,K562细胞未处理(未处理,图3A)或用SSA-GFP报告DNA质粒转染靶向CCR5的 ZFN8196zKK:8267EL (WT,图 3C);靶向 CCR5 的 ZFN8196zKK: 8267EL (D450N,图 3D);靶向 CCR5 的ZFN8196zKK:拟67EL(D467A,图3E)。转染后3天收集细胞,细胞用碘化丙锭(PI)孵育 5min染色非活细胞(PI+)后,进行细胞术分析。由于GFP供体序列侧接于CCR5序列,该CCR5 序列与缺口位点旁邻的区域同源,GFP供体序列通过HDR依赖途径整合到CCR5基因中的断裂中。因此,观察到的GFP荧光信号增强则表明已经发生供体序列的靶向整合。在四分体的上角标明了每个四分体中细胞的百分数。数据证明含有D450N和D467A突变体的ZNF对能够整合GFP序列。图4,图A到D,描述了诱导靶基因中的双链或单链断裂后,外源序列(膜片供体 (patch donor))的非同源末端连接(NHEJ)和靶向整合(Tl)。图4A描述了每个泳道中,在含有如上所述的ZFN对的K562细胞中通过NHEJ对双链而不是单链断裂的修复。泳道号对应于表1中的样本号。图4B描述了用表1中表明的ZFN对进行CCR-5基因的单链或双链切割后,46bp CCR-5膜片供体分子的靶向整合。泳道号与样本号对应。图4C和4D描述了用单个锌指核酸酶或两个锌指核酸酶的组合(每个泳道中如上所述)处理的细胞中的同源重组事件。图5,图A和B,描述了靶向整合分析,和存在46bp CCR5-膜片供体时对用所示的 ZFN组合转染的K562细胞进行的NHEJ分析。图5A显示了靶向整合分析,图5B显示了 NHEJ 分析。每个图下面的数字表示靶向整合或NHEJ的频率(%)。图6,图A和B,描述了靶向整合分析,和存在CCR5-tNGFR_outGFP供体时用表述的ZFN组合转染的K662细胞进行的NHEJ分析。图6A显示了 NHEJ分析,图6B显示了通过 Southern印迹进行的靶向整合分析。每个图下面的数字表示靶向整合或NHEJ的频率(%)。图7的图表描述了用表述的ZFN构建体转染的K562细胞中,在指示的时间点的 53BPl+foci (指示DSB)。空心圆表示没有ZFN的对照细胞;实心圆表示用野生型ZFN转染的细胞;空心正方形表示用野生型ZFN与失活的ZFN(D450N)转染的细胞;和实心正方形表示用野生型ZFN与失活的ZFN(D467A)转染的细胞。图8描述了 K562细胞中CXCR4基因座上的靶向整合分析。在缺乏(无ZFN)或存在 C)(CR4D450N ZFN :CXCR4-ZFN-L-EL-D450N+CXCR4-ZFN-R-KK 时,用 QCCR4-膜片供体 DNA 对K562细胞进行核转染。使细胞恢复4-7天,然后用相同的DNA再次进行核转染。重复该过程,进行总共4次核转染。最后一次核转染后3天收集细胞,用于gDNA制备和RFLP分析。 通过箭头指示由TI对CXCR4修饰的预期位置。每条泳道下面的数字表示TI的频率(% )。发明详述本发明公开了用于细胞染色质的靶向单链切割和细胞核苷酸序列靶向改变的组合物和方法,例如,通过外源多核苷酸(含有与细胞核苷酸序列同源的一个或多个区域)与基因组序列之间同源重组后的靶向单链切割。基因组序列包括染色体,游离基因,细胞器基因组(例如,线粒体,叶绿体),人工染色体中存在的那些序列,和细胞中存在的任意其他类型的核酸诸如,例如扩增的序列、双微染色体和内源或感染细菌与病毒的基因组。基因组序列可以是正常的(也即,野生型)或突变的;突变序列可包含,例如,插入,缺失,易位,重排和/或点突变。基因组序列还可以包含许多不同的等位基因之一。该组合物和方法还可以用于染色体外核苷酸序列例如质粒的靶向改变。可用于靶向单链切割和重组的组合物包括,含有切割半结构域和锌指结合结构域的融合蛋白,编码这些蛋白的多核苷酸,以及多肽与编码多肽的多核苷酸的组合。锌指结合结构域可包含一个或多个锌指结构(例如,2,3,4,5,6,7,8,9或更多个锌指结构),而且可以进行改造操作以结合任意的基因组或游离基因序列。因此,通过确定目标靶基因组或游离基因区域,需要在该基因组或区域进行切割或重组,根据这里公开的方法,可以构建一个或多个融合蛋白,其含有催化激活和催化失活的切割半结构域和锌指结构域,该锌指结构域被改造操作以识别所述基因组或游离基因区域中的靶序列。细胞中这种融合蛋白(或蛋白)的存在,将导致融合蛋白与它的(它们的)结合位点结合,以及所述基因组或游离基因区域内或邻近所述基因组或游离基因区域处的单链切割。值得注意的是,如这里所示,如果外源多核苷酸也存在于这种细胞中,该外源多核苷酸具有与基因组或游离基因区域同源的区域,基因组或游离基因区域与外源多核苷酸之间高效率发生同源重组。概述本发明在这里公开的方法的实施,以及组合物的制备和使用,除非另有说明,应用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和本领域技术内相关领域中的常规技术。这些技术在文献中被充分说明。参见,例如,Sambrook等MOLECULAR CLONING :A LAB0RAT0R Y MANUAL,第二版,Cold Spring Harbor Laboratory Press, 1989 和第三版,2001 ;Ausubel 等 CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Jo hn Wiley & Sons, New York,1987 和定期更新;METHODS IN ENZYM0L OGY 系列,Academic Press, San Diego ;ffolffe, CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press, San Diego, 1998 ;METHODS IN ENZYM0L0GY, Vol. 304,"Chromatin" (PM. Wassarman 和 A. P. ffolffe,编辑),Academic Press, San Diego,1999 ;和 METHODS IN MOLECULAR BIOLOGY, Vol. 119, “Chromatin Protocols" (P. B. Becker 编辑)Humana Press, Totowa, 1999。定义术语“核酸”,“多核苷酸”和“寡核苷酸”可互换使用,指线性或环状构象,单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合体。为了本公开内容的目的,这些术语不被理解为是对聚合体长度的限制。该术语可包含天然核苷酸的已知类似物,以及在碱基、糖和 /或磷酸酯部分(例如,硫代磷酯主链)被修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;也即A的类似物将与T进行碱基配对。术语“多肽”、“肽”和“蛋白,,可互换使用,指氨基酸残基的聚合物。该术语还应用于其中一个或多个氨基酸是对应的天然存在的氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。“结合”指大分子(例如,蛋白与核酸之间)之间的序列特异的、非共价的相互作用。不是结合相互作用的所有组分都需要是序列特异性的(例如,与DNA主链中的磷酸酯残基接触),只要该相互作用总体上是序列特异性的即可。这种相互作用通常特征在于解离常数(Kd)为10-6Μ—1或更低。“亲合性”指结合的强度增加的结合亲合性与较低的Kd相关。“结合蛋白”是能与另一个分子非共价结合的蛋白。结合蛋白可与例如DNA分子 (DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白结合蛋白)结合。在蛋白结合蛋白的情况中,它可与其自身结合(形成同源二聚体,同源三聚体,等等)和/或它可与一个不同蛋白或多个蛋白的一个或多个分子结合。结合蛋白可具有不止一种的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。“锌指DNA结合蛋白”(或结合结构域)是一种蛋白或较大蛋白内的结构域,其通过一个或多个锌指结构以序列特异性的方式结合DNA,锌指结构是结合结构域内的氨基酸序列区域,其结构通过锌离子的配合稳定。术语“锌指DNA结合蛋白”通常缩写为锌指蛋白或 ZFP。锌指结合结构域可以被“工程改造”以结合预定的核苷酸序列,例如通过天然存在锌指蛋白的识别螺旋区域的改造(改变一个或多个氨基酸)。因此,改造的锌指蛋白是非天然存在的蛋白。用于改造锌指蛋白的方法的非限制性实例是设计与选择。设计的锌指蛋白是非天然存在的蛋白,其设计/组成主要源自合理标准。用于设计的合理标准包括取代规则和用于处理储存现有ZFP设计和结合数据的数据库信息中的信息的计算机算法的应用。参见,例如,美国专利 6,140,081 ;6,453,242 和 6,534,261 ;还参见 WO 98/53058 ;WO 98/53059 ;WO 98/53060 ;WO 02/016536 和 WO 03/016496。“选择的”锌指蛋白是自然界中找不到的蛋白,其产生主要是来自实验处理如噬菌体展示、相互作用捕获或杂交体选择。参见,例如,US 5, 789, 538 ;US 5,925, 523 ;US 6,007,988 ;US 6,013,453 ;US 6,200,759 ;WO 95/19431 ;WO 96/06166 ;WO 98/53057;WO 98/54311 ;WO 00/27878 ;WO 01/60970 ;WO 01/88197 和 WO 02/099084。术语“序列”指任意长度的核苷酸序列,其可以DNA或RNA ;可以是线性、环形或分支的,而且可以是单链或双链的。术语“供体序列”指插入到基因组中的核苷酸序列。供体序列可以是任意长度的,例如长度为2到10,000(或者之间的任意整数值或以上)个核苷酸之间,优选长度为大约100到1,000(或之间的任意整数)个核苷酸,更优选长度为大约 200到500个核苷酸。可选择地,供体序列可以是人工染色体序列如细菌人工染色体(BAC) 或酵母人工染色体(YAC)。“同源但不相同的序列”指与第二序列享有一定程度的序列同一性的第一序列,但是其序列与第二序列的序列不相同。例如,含有突变基因的野生型序列的多核苷酸,与突变基因的序列是同源但不相同。在特定的实施方案中,两个序列之间的同源性程度足以允许利用正常的细胞机理进行它们之间的同源重组。两个同源但不相同的序列可以是任意长度的,而且它们的非同源性程度可以少到1个核苷酸(例如,用于通过靶向同源重组修正基因组的点突变)或大到10个或更多1Λ (例如,用于插入1个基因到染色体的预定异位位点)。 含有同源不相同序列的两个多核苷酸的长度不必相同。例如,可以使用20到10,000个核苷酸的外源多核苷酸(也即,供体多核苷酸),人工染色体或核苷酸对。用于确定核酸和氨基酸序列同一性的技术是本领域已知的。一般地,这种技术包括确定基因的mRNA的核苷酸序列和/或确定其编码的氨基酸序列,并与另一个核苷酸或氨基酸序列进行对比。也可以用这种方式测定和对比基因组序列。通常,同一性分别指两个多核苷酸或多肽序列的精确核苷酸与核苷酸或氨基酸与氨基酸的一致性。可通过测定它们的同一性百分比来对两个或多个序列(多核苷酸或氨基酸)进行对比。两个序列的同一性百分比,无论是核酸或氨基酸序列,是两个比对的序列之间的精确匹配的数目除以较短序列的长度并乘以100的数目。对于这里描述的序列,需要的序列同一性的程度范围为大约80%到100%以及二者之间的任意整数值。一般,序列之间的同一性百分比为至少 70-75 %,优选80-82 %,更优选85-90 %,更加优选92 %,仍然更优选95 %,最优选98 %的序列同一性。可选地,可以通过在允许同源区域之间形成稳定的双螺旋的条件下进行多核苷酸的杂交,接着用单链特异性核酸酶消化,并测定消化片段的大小来测定多核苷酸之间的序列相似性程度。当两个序列在分子的测定的长度显示至少大约70% -75%,优选 80% -82%,更优选85% -90%,更加优选92%,仍然更优选95%,和最优选98%序列同一性时,两个核酸,或两个多肽序列彼此是基本上同源的。如这里使用的,基本上同源还指与指定的DNA或多肽序列显示完全相同的序列。可以在例如,如特定系统中限定的严谨条件下在Southern杂交实验中测定基本上同源的DNA序列。测定合适的杂交条件在本领域技术范围内。参见,例如,Sambrook 等,上文Nucleic Acid Hybridization :A Practical Approach, editors B.D. Hames and S.J.Higgins, (1985)Oxford;Washington, DC ;IRL Press)0可以如下测定两个核酸片段的选择性杂交。两个核酸分子之间的序列同一性程度影响这两个分子之间杂交事件的效率和强度。部分相同的核酸序列将至少部分抑制与靶分子完全相同的序列的杂交。可使用本领域公知的杂交分析(例如,Southern (DNA)印迹, Northern(RNA)印迹,溶液杂交,等等,参见Sambrook等,Molecular Cloning :A Laboratory Manual,第二版,(1989) Cold Spring Harbor, N. Y.)测定完全相同序列的杂交抑制。可使用不同程度的选择性,例如,使用从低到高严谨的不同条件,进行这种分析。如果应用低严谨条件,可使用缺乏甚至部分程度序列同一性的第二探针(例如,与靶分子具有小于大约 30%序列同一性的探针)评价不存在非特异性结合,以便在不存在非特异性结合事件时, 第二探针不会与靶杂交。杂交条件是本领域技术人员公知的(参见,例如,Nucleic Acid Hybridization :A Practical Approach,editors B. D. Hames and S. J. Higgins, (1985)Oxford ;Washington, DC ;IRL Press)。杂交严谨性指不利于包含不匹配核苷酸的杂交体形成的杂交条件的程度, 同时较高严谨性与不匹配杂交体的较低耐受性相关。F影响杂交严谨性的因子是本领域技术人员公知的,其包括但不限于温度、PH、离子强度和有机溶剂如例如甲酰胺和二甲亚砜的浓度。如本领域技术人员已知的,杂交严谨性随较高的温度、较低的离子强度和较低的溶剂浓度而增加。关于杂交的严谨性条件,本领域公知的许多等价条件可以用于通过改变例如下列因子来建立特定严谨性序列的长度和特性,不同序列的碱基组成、盐和其他杂交液组分的浓度,杂交液中存在或不存在封闭剂(例如,硫酸葡聚糖和聚乙二醇),杂交反应温度和时间参数,以及改变洗涤条件。根据本领域的标准方法选择一组特定的杂交条件(参见,例如,Sambrook,等,Molecular CloninR :A Laboratory Manual,Second Edition,(1989) Cold Spring Harbor,N· Y·)。
“重组”指两个多核苷酸之间互换遗传信息的过程。为了本公开内容的目的,“同源重组0 )”指特定形式的这种交换,其在例如细胞中双链断裂的修复期间发生。该过程需要核苷酸序列同源性,使用“供体”分子进行模板修复“靶”分子(也即,其经历双链断裂), 而且由于它导致遗传信息从供体到靶的递送而不同地称为“非交换型型基因转化”或“短序列基因转化换”。不希望受任何特定理论的束缚,这种转移可涉及在断裂靶与供体之间形成的异源双链DNA的错配修正,和/或“合成依赖的链退火”,其中供体用于再合成将成为部分靶的遗传信息和/或相关过程。这种特殊化的HR通常导致靶分子序列的改变以致供体多核苷酸的部分或全部序列被整合到靶多核苷酸中。“切割”指DNA分子的共价主链的断裂。切割可以通过多种方法来启动,包括但不限于磷酸二酯键的酶水解或化学水解。单链切割指切割双链DNA/RNA的一条链,双链切割指切割两条链(例如,通过两个不同的单链切割事件)。在特定的实施方案中,融合多肽用于靶向的单链DNA切割。“切割半结构域”指与第二多肽(相同的或不同的)结合而形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”,“+和-切割半结构域”和“右和左切割半结构域”可交换使用,指二聚化的切割半结构域对。“改造的切割半结构域”是已经被修饰以便与另一个切割半结构域(例如,另一个改造的切割半结构域)形成专性异二聚体的切割半结构域。也参见美国专利
发明者汪建斌 申请人:桑格摩生物科学股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1