用于调控锌指蛋白表达的方法和组合物与流程

文档序号:12285241阅读:675来源:国知局
本申请要求2014年3月18日提交的美国临时申请No.61/955,002的权益,所述临时申请的公开内容以引用方式整体并入本文。
技术领域
本公开属于基因组表达和工程化的领域,更具体地说属于调控基因调节子诸如转录因子和核酸酶在细胞中的表达的领域。背景已描述了用于靶向调节内源性基因组DNA的基因表达的各种方法和组合物。通过DNA结合蛋白进行的基因表达的靶向调节描述于例如美国专利No.6,534,261;6,607,882;6,599,692;6,689,558;7,067,317;7,947,873;7,253,273;7,358,085;7,361,635;7,534,775;8,586,526和美国专利公布No.20110082093中。此外,使用位点特异性核酸酶的靶向切割事件可用来例如诱导靶向诱变、诱导细胞DNA序列的靶向缺失以及促进预定染色体基因座处的靶向重组。参见,例如,8,623,618;8,034,598;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公布20030232410;20050208489;20050026157;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983和20130177960和美国申请No.14/278,903,所述专利的公开内容出于所有目的以引用方式整体并入。这些方法经常涉及调节靶基因的表达的工程化蛋白或工程化核酸酶系统的使用。具体而言,工程化转录因子激活或抑制靶向基因,并且核酸酶诱导双链断裂(DSB)或靶DNA序列中的切口以使得通过非同源末端连接(NHEJ)进行的断裂修复或同源介导的修复(HDR)可导致基因的敲除或目标序列的插入(靶向整合)。内源性基因的调控和/或切割可通过使用诸如锌指蛋白转录因子(ZFP-TF)、锌指核酸酶(ZFN)、类转录激活因子效应子转录因子(TALE-TF)、CRISPR/Cas转录因子(参见,例如,Perez-Pinera等(2013)NatureMethods10:973–976)、类转录激活因子效应子核酸酶(TALEN)、Ttago核酸酶的蛋白质和系统或使用具有工程化crRNA/tracrRNA(‘单指导RNA’)的CRISPR/Cas系统以指导特异性切割来发生。使用含有锌指蛋白的这些工程化转录因子的临床试验已显示这些新型转录因子能够治疗各种病状(参见,例如,Yu等(2006)FASEBJ.20:479-481)。此外,使用工程化锌指核酸酶的临床试验还已证实了治疗效用(参见,例如,Tebas等(2014)NewEngJMed370(10):901)。使用这些蛋白质和系统的基因调节具有治疗各种疾病和病症(包括例如HIV感染、囊性纤维化、癌症诸如成恶性胶质瘤、神经病变、三核苷酸重复病症、HLA相关病症、血友病、神经学病状、病原体感染、溶酶体贮积病和血红蛋白病)的潜能。参见,例如,美国专利No.7,951,925;美国专利公布No.20140017212;20140093913;20140080216;20130145484、20080188000、20110082078、20110082093、20120196370、20120128635、20120214241、20130253040。然而,甚至在调节子与野生型等位基因相比优先结合(以序列特异性方式)到靶位点突变等位基因的实例中(参见,例如,美国专利公布No.20110082093和20130253040),调节子的过表达可导致结合于野生型序列和/或野生型序列的不希望的改变。因此,仍存在对用于调节外源性基因调节子在细胞内表达的组合物和方法的需要,以便实现调节子表达的最佳水平和基因表达水平的随后修饰。概述本发明描述用于基因疗法、基因表达和基因组工程化的组合物和方法。具体地说,描述的方法和组合物涉及基因表达调节子(例如,包含增加或减少基因表达的一种或多种锌指蛋白、TALE、CRISPR/Cas组分等的分子)在细胞内的调控(包括自我调控),在所述细胞中待调控的基因可为内源性基因或者可位于驱动目标转基因的表达的细胞内的表达盒中。在一方面,本发明包括包含编码至少一种基因调节子组分(例如,转录因子或核酸酶,诸如ZFP-TF、ZFN、TALE-TF、TALEN、Ttago核酸酶或者CRISPR/Cas核酸酶或转录因子的蛋白组分)的多核苷酸的构建体和序列(例如,启动子),其中所述多核苷酸还包含一种或多种可被基因调节子结合的低亲和性(自我调控性)靶序列。在某些实施方案中,编码转录因子或核酸酶(或其组分)的序列可操作地连接到包含一种或多种可被基因调控子结合的低亲和性(自我调控性)靶序列的序列。以此方式,基因调节子(例如,转录因子或核酸酶)的表达是自我调控性的,因为基因调节子与外源性构建体中的低亲和性靶序列的结合调节(例如,增加或减少)基因调节子的表达。任何数量的低亲和性靶序列或靶序列部分均可包含于构建体中,例如,1与30之间(或其间的任何数量)。在某些实施方案中,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个低亲和性靶序列或其部分包含于编码转录因子或核酸酶的构建体中。低亲和性靶序列或其部分的数量可基于例如锌指蛋白的结合亲和性,其中具有对靶位点高亲和性的锌指蛋白通常连接到比具有对靶位点较低亲和性的锌指蛋白具有较少的低亲和性靶位点的序列。在某些实施方案中,预期的靶位点处于内源性基因组中。低亲和性靶位点可与预期靶位点相同或不同。在某些实施方案中,低亲和性靶位点包含预期靶位点和额外的预期靶位点、额外的靶亚位点(例如,锌指蛋白的3个碱基对)或额外的碱基对。在某些实施方案中,低亲和性(自我调控性)靶位点包括不同数量的靶位点或亚位点,例如1、2、3、4、5、6、7、8、9、10个或甚至更多个额外或更少的靶位点或靶亚位点(例如,与预期靶位点中的6或7个CAG重复相比,低亲和性靶位点可由15-20个CAG重复构成)。在某些实施方案中,低亲和性靶序列包含多个重复(例如,CAG和/或CCG重复),并且包含于驱动转录因子或核酸酶的表达的转录因子控制元件中,所述转录因子或核酸酶靶向涉及三核苷酸重复病症的基因(例如,Htt基因,参见美国专利公布20110082093)。包含低亲和性靶位点的序列可位于启动子序列或表达构建体中的任何其他序列(例如,增强子序列)之内或近端,条件是当所述序列不被转录因子或核酸酶结合时转录不主要受序列存在的影响,但是当结合时转录被调节(增加或减少和/或关闭)。在某些实施方案中,如本文所述的构建体还包含供体核酸(或转基因)。在一些实施方案中,目标转基因的表达还可通过产生融合转基因来调节,以便融合转基因编码基因调节子和目标基因。在一些情况下,基因调节子和目标基因由自切割肽序列(例如,2A)或核糖体终止位点(例如,IRES)隔开。在其他实施方案中,目标基因编码报告基因。在某些实施方案中,包含如本文所述的多核苷酸的构建体为病毒构建体,例如慢病毒载体(LV)、整合缺陷型慢病毒载体(IDLV)、腺病毒或AAV构建体。在一些实施方案中,构建体编码的基因调节子包括转录因子(例如,DNA结合结构域诸如锌指或TALE或单指导RNA,以及转录调控结构域诸如激活结构域(例如,用于CRISPR/Cas系统的修饰的Cas9反式激活因子或用于与ZFP或TALE系统一起使用的HSVVP16结构域)或抑制结构域(例如,KRAB结构域))。在其他实施方案中,构建体编码核酸酶例如DNA结合蛋白(锌指蛋白或TALE),以及核酸酶结构域(例如,切割结构域)或CRISPR/Cas核酸酶。在某些实施方案中,基因调节子(例如,转录因子和/或核酸酶)结合于等位基因。因此,在结合于靶位点时,基因调节子可增加或减少基因表达。在其他实施方案中,基因调节子结合于突变体等位基因。在其他实施方案中,基因调节子结合于野生型和突变体等位基因(双等位基因的)。核酸酶可在靶DNA中诱导双链断裂(DSB)或单链断裂(切口)。在一些实施方案中,使用两种切口酶通过引入两种切口来产生DSB。在一些情况下,切口酶是ZFN,而在其他情况下,切口酶是TALEN或CRISPR/Cas切口酶。在其他方面,本文描述了包含一种或多种本文描述的构建体的细胞。在某些实施方案中,所述细胞还包含供体核酸(例如,转基因),所述供体核酸可包含于构建体上或被单独地提供(例如,在单独的构建体中)。因此,所述供体可在编码核酸酶的核酸之前、之后或连同编码核酸酶的核酸一起递送。供体核酸包含待整合至细胞的基因组(例如,内源性基因座)中的外源性序列(转基因)。在一些实施方案中,所述供体包含由具有靶向切割位点的同源区侧接的全长基因。在一些实施方案中,供体缺乏同源区并且通过同源独立性机制(即,NHEJ)整合至靶基因座中。在其他实施方案中,供体包含侧接用于细胞(即,用于基因校正)的同源区的核酸的较小片段。在一些实施方案中,供体包含编码功能或结构组分的基因,诸如shRNA、RNAi、miRNA等。在其他实施方案中,供体包含编码调控元件的基因,所述调控元件结合于目标基因和/或调节目标基因的表达。根据本发明的优选实施方案,构建体包含腺相关病毒载体(AAV),并且/或者由质粒DNA编码。在其他方面,如本文所述的构建体通过病毒和/或非病毒基因转移法来递送。额外的序列(编码或非编码序列)可包含于构建体,包括但不限于编码2A肽、SA位点、IRES等的序列,以及额外的编码序列诸如报告基因、治疗性多肽等。在另一方面,本文描述了改变细胞中的基因表达的方法,所述方法包括将如本文所述的构建体引入细胞中。在某些实施方案中,构建体编码可操作地连接到一种或多种功能结构域(例如,转录抑制因子、转录激活因子或核酸酶)的DNA结合分子(例如,ZFP、TALE、CRISPR/Cas单指导RNA等)。在本文描述的任何方法中,可例如通过用如本文所述的核酸酶在细胞的基因组中产生双链断裂(DSB)以使供体核酸在DSB位点处整合来将供体核酸整合到细胞的基因组中。在某些实施方案中,供体核酸通过非同源依赖性方法(例如,NHEJ)整合。在某些实施方案中,通过一种或多种锌指核酸酶(ZFN)、包含锌指结合结构域的融合蛋白来产生DSB,所述融合蛋白经工程化以结合目标区内的序列和切割结构域或切割半结构域。在其他实施方案中,通过一种或多种与核酸酶结构域(TALEN、megaTAL和/或cTALEN)融合的TALEDNA结合结构域(天然存在的或非天然存在的)来产生DSB。在其他实施方案中,使用工程化单指导RNA或其功能等效物被用来将核酸酶指导至基因组中的靶向位点的CRISPR/Cas核酸酶系统来产生DSB。在其他方面,本公开提供调控引入到细胞中的外源性基因调节子的表达的方法,所述方法包括引入如本文所述的构建体。在某些实施方案中,基因调节子抑制内源性基因的表达或使内源性基因的表达失活,并且自我调控在基因调节子结合于构建体中的低亲和性靶位点时出现(例如,以待超过预期靶位点的结合能力的足够高的水平),其中结合于低亲和性靶位点调节(例如,抑制)基因调节子和/或来自构建体的额外编码序列的表达。在其他方面,本公开提供使用如本文所述的构建体来遗传修饰的细胞。可使用任何细胞类型,包括但不限于哺乳动物、植物、真菌、细菌、鱼等。在某些实施方案中,所述细胞为细胞系。在其他实施方案中,所述细胞为原代细胞。在其他实施方案中,所述细胞为干细胞(例如,造血干细胞)。在一些方面,提供了包含如本文所述的多肽、多核苷酸(例如,自我调控性构建体)和/或细胞的药物组合物。在某些实施方案中,例如为了预防和/或治疗疾病或病症,向受试者施用组合物。药物组合物可配制用于全身施用(例如,静脉内、腹膜内、肌内、皮下、肺部或颅内输注)或局部施用。本文还提供了用于调控一种或多种基因调节子的表达的系统,所述系统包含具有包含用于基因调节子的预期靶位点的基因组的细胞,以及包含可操作地连接到编码基因调节子(或基因调节子的组分,例如在与单指导RNA共表达时发挥作用的蛋白质调节子)的序列的如本文所述的低亲和性(自我调控性)靶位点的外源性构建体。在基因调节子结合于低亲和性靶位点时,基因调节子的表达是自身调控的(减少的或增加的)。在某些实施方案中,低亲和性靶位点包含与预期靶位点相同的序列。在其他实施方案中,低亲和性靶位点包含不同于预期靶位点的序列。还提供了一种包含本发明的构建体和/或供体分子的试剂盒。构建体可编码ZFP-TF、ZFN、TALE-TF、TALEN、MegaTAL、cTALEN和/或CRISPR/Cas系统。如本文所述的试剂盒还可包含供体分子、用于实施本发明的方法的说明书等。试剂盒还可包含目标供体分子,诸如选择或筛选标记物。鉴于总体公开,这些和其他方面将对技术人员显而易见。附图简述图1A至1D是描述包含ZFP抑制因子(“ZFP-KOX”)和GFP变体Venus(“VENUS”)的构建体的示意图。KOX是指来自KOX1蛋白的KRAB抑制结构域。图1A示出蛋白质表达由Htt启动子驱动的构建体。图1B示出蛋白质表达由组成型CMV启动子驱动的构建体。图1C示出CMV启动子经修饰以包含7-20个CAG重复的构建体,所述7-20个CAG重复充当CAG结合性ZFP的低亲和性靶位点。图1D示出表达由具有非编码外显子1的Htt启动子驱动的构建体,所述非编码外显子1含有充当CAG结合性ZFP的低亲和性靶位点的17个CAG重复。还示出了人β-珠蛋白内含子、核定位信号(“NLS”)、FLAG表位标记、2A序列和来自人生长激素基因的聚腺苷酸化信号(hGHpolyA)。图2是描述ZFP-2A-VenusmRNA拷贝数在用包含指示的构建体的LV感染的亨廷顿氏病(Huntington’sDisease)(HD)神经元中的表达的图。在构建体中使用的ZFP为Htt或如实施例1所述的对照(Chk2)结合蛋白。图3是描述在用指示的LV构建体感染的HD神经元中通过定量RT-PCR(qRT-PCR)测定的相对Htt表达的图。图4是描述在用指示的IDLV构建体感染的293T细胞中通过定量RT-PCR(qRT-PCR)测量的相对Htt表达的图。图5是描述用具有CMV启动子、Htt启动子(Http)或具有17个CAG重复的Htt启动子和外显子1(Http-CAG17)的质粒转染的293T细胞的平均荧光强度(MFI)的图。图6A和6B是描述用具有指示的构建体的质粒转染的293T细胞的分析的图。图6A描述在用包括如图1C和实施例1所指示的构建体的构建体转染的细胞中表达的GFP的MFI。如所指示(左图),构建体不含低亲和性Htt靶位点(0)或包含呈CAG重复形式的7、10、13、15、18或20个低亲和性Htt靶位点。图6B是描述通过用图6A中描述的构建体转染的细胞的定量分析测量的的ZFP-2A-VENUS表达的图。图7是描述用指示的构建体转染的293T细胞的分析的图。图7A是描述用如实施例1所述的指示的构建体转染的293T细胞的GFP的MFI的图。图8A至8C是描述用包含指示的构建体的AAV转导的293T细胞的分析的图。图8A是描述用如实施例1所述的指示的构建体转导的293T细胞中的GFP表达的MFI的图。图8B是示出用于ZFP表达的细胞的分析的图。图8C描述来自包含0至20个CAG重复的构建体的报告基因表达(VENUS),其中表达通过流式细胞术以及通过荧光显微术来可视化。图9A和9B是描述用含有如实施例1所述的启动子构建体的AAV的不同感染复制数(MOI)转导的HD神经元的分析的图。图9A描述在具有如实施例1所述的启动子构建体中的结合CAG的33074或对照5475ZFP的AAV存在下来自野生型Htt等位基因(“CAG17”)或突变体(疾病相关)Htt等位基因(“CAG48”)的Htt基因的表达。图9B示出通过用图9A中描述的构建体转导的神经元的定量分析测量的ZFPTF表达。详述本文公开了用于调控外源性基因调节子在细胞内的表达的组合物和方法。具体而言,本发明涉及编码一种或多种工程化基因调节子(例如,转录因子和/或核酸酶)的构建体,在所述构建体中工程化基因调节子的表达可通过包含转录因子或核酸酶的一种或多种低亲和性靶位点来调控。例如,低亲和性靶位点包含于驱动基因调节子的表达的启动子内。以此方式,当转录因子或核酸酶以足够高的水平在细胞内表达时(例如,过表达),低亲和性靶位点被基因调节子结合,并且基因调节子的表达被调节(在TF-抑制因子或核酸酶的情况下下调,并且在TF-激活因子的情况下上调)。在一些实施方案中,目标转基因的表达还可通过产生融合转基因来调节,以便融合转基因编码基因调节子和目标基因。本发明还涉及包含如本文所述的构建体的细胞,以及包含如本文所述的构建体和/或细胞的药物组合物。因此,本发明的组合物和方法引起构建体上编码序列的调节,包括基因调节子表达在细胞内的下调,其中过表达是不希望的和/或对细胞有害的。总则除非另外指示,否则方法的实施以及本文公开的组合物的制备和用途采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA以及本领域技术内的相关领域中的常规技术。这些技术在文献中得以充分说明。参见例如Sambrook等MOLECULARCLONING:ALABORATORYMANUAL,第二版,ColdSpringHarborLaboratoryPress,1989和2001第三版;Ausubel等,CURRENTPROTOCOLSINMOLECULARBIOLOGY,JohnWiley&Sons,NewYork,1987和定期更新;丛书METHODSINENZYMOLOGY,AcademicPress,SanDiego;Wolffe,CHROMATINSTRUCTUREANDFUNCTION,第三版,AcademicPress,SanDiego,1998;METHODSINENZYMOLOGY,第304卷,“Chromatin”(P.M.Wassarman和A.P.Wolffe,编),AcademicPress,SanDiego,1999;以及METHODSINMOLECULARBIOLOGY,第119卷,“ChromatinProtocols”(P.B.Becker,编)HumanaPress,Totowa,1999。定义术语“核酸”、“多核苷酸”以及“寡核苷酸”可互换使用,并且是指呈线型或环状构象,以及呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本公开的目的,这些术语不应被解释为相对于聚合物的长度为限制性的。所述术语可涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸骨架)中被修饰的核苷酸。一般而言,具体核苷酸的类似物具有相同的碱基成对特异性;即A的类似物将会与T碱基成对。术语“多肽”、“肽”和“蛋白质”可互换使用,是指氨基酸残基的聚合物。所述术语还适用于一种或多种氨基酸是对应的天然存在氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。“结合”是指大分子之间(例如,蛋白质与核酸之间)序列特异性、非共价相互作用。并非所有的结合相互作用的组分都需要是序列特异性的(例如,与DNA骨架中磷酸盐残基接触),只要相互作用总体上是序列特异性的即可。此类相互作用特征通常在于10-6M-1或更低的解离常数(Kd)。“亲和性”是指结合的强度:增加的结合亲和性与较低的Kd相关。“结合蛋白”是能够结合于另一种分子的蛋白质。结合蛋白可以结合于例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。就蛋白质结合蛋白来说,它可以结合于其自身(以形成同源二聚体、同源三聚体等),并且/或者它可以结合于不同蛋白质的一种或多种分子。结合蛋白可以具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合活性、RNA结合活性和蛋白质结合活性。“锌指DNA结合蛋白”(或结合结构域)是通过一种或多种锌指以序列特异的方式结合DNA的蛋白质或较大蛋白质内的结构域,所述一种或多种锌指是结构通过锌离子配位稳定的结合结构域内的氨基酸序列区。术语锌指DNA结合蛋白常缩写为锌指蛋白或ZFP。“TALEDNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域涉及TALE与其同源靶DNA序列的结合。单一“重复单元”(也称为“重复序列”)通常为33-35个氨基酸长度,并且展现出至少一些与天然存在TALE蛋白质内的其他TALE重复序列的序列同源性。锌指和TALE结合结构域可经“工程化”以结合于预定核苷酸序列,例如通过天然存在锌指或TALE蛋白的识别螺旋区的工程化(改变一个或多个氨基酸)。因此,工程化DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。用于将DNA结合蛋白工程化的方法的非限制性实例是设计和选择。设计的DNA结合蛋白是自然界中不存在的蛋白质,所述DNA结合蛋白的设计/组成主要是合理标准的结果。用于设计的合理标准包括取代规则以及用于处理数据库中的信息的计算机化算法的应用,所述数据库存储了现有ZFP和/或TALE设计和结合数据的信息。参见,例如,美国专利8,586,526;6,140,081;6,453,242;6,534,261和8,586,526;还参见,WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496。“选择的”锌指蛋白或TALE是没有在自然界中发现的蛋白质,所述蛋白质的产生主要是经验过程诸如噬菌体展示、相互作用陷阱或杂交选择的结果。参见,例如,美国专利No.8,586,526;5,789,538;5,925,523;6,007,988;6,013,453;6,200,759;8,586,526;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970WO01/88197、WO02/099084。“TtAgo”是被认为涉及基因沉默的原核Argonaute蛋白。TtAgo来源于细菌嗜热栖热菌(Thermusthermophilus)。参见,例如,Swarts等,ibid,G.Sheng等,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是所需要的所有组分,包括例如用于由TtAgo酶切割的指导DNA。“重组”是指两种多核苷酸之间遗传信息的交换过程,包括但不限于通过非同源末端连接(NHEJ)和同源重组进行的供体捕获。为了本公开的目的,“同源重组(HR)”是指此类交换的特化形式,所述交换在例如通过同源介导的修复机制所进行的细胞中双链断裂修复期间发生。这个过程需要核苷酸序列同源性,使用“供体”分子以成为“靶”分子(即,经历双链断裂的那个分子)的修复模板,并且这个过程分别被称为“无交叉基因转换”或“短序列基因转换”,因为其导致基因信息从供体转移至所述靶。不希望被任何具体理论束缚,所述转移可以涉及在断裂的靶和供体之间形成的异源双链体DNA的错配校正,和/或“取决于合成的链退火”,在所述退火中供体用来重新合成将成为靶一部分的基因信息,和/或相关的过程。此类特化的HR经常导致靶分子序列的改变,这样使得供体多核苷酸的部分或所有序列并入靶多核苷酸中。“重组”是指两种多核苷酸之间遗传信息的交换过程,包括但不限于通过非同源末端连接(NHEJ)和同源重组进行的供体捕获。为了本公开的目的,“同源重组(HR)”是指此类交换的特化形式,所述交换在例如通过同源介导的修复机制所进行的细胞中双链断裂修复期间发生。这个过程需要核苷酸序列同源性,使用“供体”分子以成为“靶”分子(即,经历双链断裂的那个分子)的修复模板,并且这个过程分别被称为“无交叉基因转换”或“短序列基因转换”,因为其导致基因信息从供体转移至所述靶。不希望被任何具体理论束缚,所述转移可以涉及在断裂的靶和供体之间形成的异源双链体DNA的错配校正,和/或“取决于合成的链退火”,在所述退火中供体用来重新合成将成为靶一部分的基因信息,和/或相关的过程。此类特化的HR经常导致靶分子序列的改变,这样使得供体多核苷酸的部分或所有序列并入靶多核苷酸中。在本文描述的任何方法中,额外的锌指蛋白或TALEN对可用于细胞内额外靶位点的额外双链切割。外源性核酸序列可以包括例如一种或多种基因或cDNA分子,或任何类型的编码或非编码序列,以及一种或多种控制元件(例如,启动子)。此外,外源性核酸序列可产生一种或多种RNA分子(例如,小发夹RNA(shRNA)、抑制性RNA(RNAi)、微小RNA(miRNA)等)。“切割”是指DNA分子共价骨架的断裂。可通过各种各样的方法来引发切割,所述方法包括但不限于磷酸二酯键的酶水解或化学水解。单链切割和双链切割均有可能,并且双链切割可由于两个不同单链切割事件而发生。DNA切割可导致平末端或交错末端的产生。在某些实施方案中,融合多肽用于靶向双链DNA切割。“切割半结构域”是与第二多肽(相同的或不同的)结合而形成具有切割活性(优选地是双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”;“+和–切割半结构域”以及“右和左切割半结构域”可互换使用,是指二聚化的切割半结构域对。“工程化切割半结构域”是已经过修饰以便与另一种切割半结构域(例如,另一种工程化切割半结构域)形成专性异源二聚体的切割半结构域。还参见,美国专利No.7,914,796;8,034,598;8,623,618以及美国专利公布No.2011/0201055,所述专利以引用方式整体并入本文。术语“序列”是指具有任何长度的核苷酸序列,所述核苷酸序列可为DNA或RNA;可为线型、环状或分枝的,并且可为单链或双链。“染色质”是包括细胞基因组的核蛋白结构。细胞染色质包含核酸(主要为DNA)以及蛋白质,所述蛋白质包括组蛋白和非组蛋白染色体蛋白。大多数真核细胞染色质以核小体的形式存在,其中核小体核心包含大约150个与八聚体缔合的DNA碱基对,所述八聚体包含组蛋白H2A、H2B、H3以及H4中的各两个;并且接头DNA(根据生物体而具有可变的长度)在核小体核心之间延伸。组蛋白H1分子一般与接头DNA缔合。为了本公开的目的,术语“染色质”意在包括所有类型的原核和真核的细胞核蛋白。细胞染色质包括染色体染色质和游离基因染色质。“染色体”是包含所有或部分的细胞基因组的染色质复合物。细胞基因组的特征常常在于其核型,所述核型是包含细胞基因组的所有染色体的集合。细胞基因组可包括一条或多条染色体。“游离基因”是包含不是细胞染色体核型的部分的核酸的复制型核酸、核蛋白复合物或其他结构。游离基因的实例包括质粒和某些病毒基因组。“靶位点”或“靶序列”是定义结合分子将结合(条件是存在用于结合的充足条件)到的核酸部分的核酸序列。“预期”靶位点是DNA结合分子被设计和/或选择以结合于的靶位点(参见,例如,表2)。“低亲和性”或“自我调控性”靶位点或靶序列是在有存在的过量结合分子时被结合分子(例如,基因调节子)结合的核酸序列,和/或被比起预期靶位点具有较低结合亲和性的结合分子结合的核酸序列。低亲和性(自我调控性)靶位点的0、1、2、3、4、5、6个或更多个碱基对可不同于预期靶位点,并且/或者可包含预期靶位点,例如与预期靶位点相比包含额外或较少碱基对的靶位点(例如,可包含额外的重复诸如CAG或CCG)。在某些实施方案中,例如当低亲和性靶位点包含与预期靶位点相同的序列时,低亲和性靶位点仅在有存在的过量结合分子时(即,在预期靶位点(例如,内源性靶位点)全部被结合分子结合时)被结合。所述术语还包括靶位点的部分,例如存在于靶位点中的基序的重复。“外源性”分子是通常不存在于细胞中但可通过一种或多种遗传方法、生物化学方法或其他方法来引入细胞中的分子。“通常存在于细胞中”是相对于细胞的具体发育阶段和环境条件而确定的。因此,例如,仅在胚胎肌肉发育期间存在的分子相对于成人肌肉细胞是外源性分子。类似地,通过热休克诱导的分子相对于非热休克的细胞是外源性分子。外源性分子可以包括例如功能失常的内源性分子的功能形式或功能正常的内源性分子的功能失常形式。在其他情况中,外源性分子可为诸如通过组合化学过程产生的小分子,或大分子诸如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何修饰的衍生物或包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,可为单链或双链的;可为线型、分枝或环状的;并且可具有任何长度。核酸包括能够形成双链体以及三链体的那些核酸。参见,例如,美国专利No.5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化的DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰化酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。外源性分子可为与内源性分子相同类型的分子,例如外源性蛋白质或核酸。例如,外源性核酸可以包括感染性病毒基因组、引入细胞中的质粒或游离基因或通常不存在于细胞中的染色体。用于将外源性分子引入细胞的方法是本领域技术人员已知的,并且包括但不限于脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注入、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移以及病毒载体介导的转移。外源性分子也可为与内源性分子相同类型的分子,但是来源于与细胞所来源于的物种不同的物种。例如,人核酸序列可引入最初来源于小鼠或仓鼠的细胞系。相比之下,“内源性”分子是在特定环境条件下在特定发育阶段通常存在于特定细胞中的分子。例如,内源性核酸可以包括染色体、线粒体或其他细胞器的基因组或天然存在的游离基因核酸。额外的内源性分子可以包括蛋白质,例如转录因子和酶。“融合”分子是两个或更多个亚基分子被连接(优选共价地)的分子。亚基分子可为相同化学类型的分子,或者可为不同化学类型的分子。第一种类型融合分子的实例包括但不限于融合蛋白(例如,DNA结合结构域(例如,ZFP、TALE和/或大范围核酸酶DNA结合结构域)与核酸酶(切割)结构域(例如,核酸内切酶、大范围核酸酶等)之间的融合),以及融合核酸(例如,编码上述融合蛋白的核酸)。第二种类型融合分子的实例包括但不限于形成三链体的核酸与多肽之间的融合,以及小沟结合剂与核酸之间的融合。细胞中融合蛋白的表达可以由融合蛋白向细胞递送或通过编码融合蛋白的多核苷酸向细胞递送而引起,其中多核苷酸被转录并且转录物被翻译以产生融合蛋白。反式剪接、多肽切割以及多肽连接也可涉及细胞中蛋白质的表达。本公开在别处提出了用于向细胞递送多核苷酸和多肽的方法。“多聚化结构域”(也称为“二聚化结构域”或“蛋白质相互作用结构域”)是在ZFPTF或TALETF的氨基、羧基或氨基和羧基端区处并入的结构域。这些结构域允许多种ZFPTF或TALETF单位的多聚化,以便三核苷酸重复结构域的较大序列相对于具有野生型数量长度的较短序列变得优先被多聚化的ZFPTF或TALETF结合。多聚化结构域的实例包括亮氨酸拉链。多聚化结构域还可通过小分子来调控,其中多聚化结构域呈现适当的构象以允许仅在小分子或外部配体存在下与另一种多聚化结构域相互作用。以此方式,外源性配体可用来调控这些结构域的活性。为了本公开的目的,“基因”包括编码基因产物(参见下文)的DNA区,以及调控基因产物产生的所有DNA区,无论所述调控序列是否相邻于编码和/或转录序列。因此,基因包括但不一定限于启动子序列、终止子、翻译调控序列如核糖体结合位点和内核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质结合位点以及基因座控制区。“基因表达”是指将包含在基因中的信息转换成基因产物。基因产物可为基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质。基因产物也包括通过如加帽、聚腺苷酸化、甲基化以及编辑的方法来修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、肉豆蔻基化以及糖基化来修饰的蛋白质。基因表达的“调节”是指基因活性的变化。表达调节可以包括但不限于基因激活和基因抑制。基因编辑(例如,切割、改变、失活、随机突变)可用来调节表达。基因失活是指与不包含如本文所描述的ZFP、TALE或CRISPR/Cas系统的细胞相比,任何基因表达的减少。因此,基因失活可能是部分的或完全的。“目标区”是任何细胞染色质区,例如像基因或基因内或基因所相邻的非编码序列,在所述基因中希望结合外源性分子。结合可为了靶向DNA切割和/或靶向重组的目的。目标区可以存在于例如染色体、游离基因、细胞器基因组(例如,线粒体、叶绿体)或感染性病毒基因组中。目标区可以处于基因编码区内,处于转录的非编码区(例如像前导序列、尾随序列或内含子)内,或者处于编码区上游或下游内的非转录区内。目标区的长度可以小至单核苷酸对,或高达2,000个核苷酸对,或任何整数值的核苷酸对。“真核”细胞包括但不限于真菌细胞(诸如,酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞)。关于并列的两种或更多种组分(诸如序列元件),术语“有效的连接”或“有效地连接”(或“可操作地连接”)可互换使用,其中组分被布置以便组分正常发挥作用并且允许以下可能性:至少一种组分可介导施加在至少一种其他组分上的功能。作为说明,如果响应于一种或多种转录调控因子的存在或不存在,转录调控序列控制编码序列的转录水平,那么转录调控序列诸如启动子有效地连接到编码序列。转录调控序列通常与编码序列以顺式有效地连接,但无需直接相邻于所述编码序列。例如,增强子是有效地连接到编码序列的转录调控序列,虽然它们不是邻接的。相对于融合多肽,术语“有效地连接”可以是指以下事实:各组分在与其他组分连接的情况下进行与如果其未如此连接时将进行的功能相同的功能。例如,相对于DNA结合结构域(ZFP、TALE)与切割结构域(例如,核酸内切酶结构域,诸如FokI、大范围核酸酶结构域等)融合的融合多肽,如果在融合多肽中DNA结合结构域部分能够结合其靶位点和/或其结合位点,同时切割(核酸酶)结构域能够切割靶位点附近的DNA,则DNA结合结构域和切割结构域处于有效连接。核酸酶结构域还可展现出DNA结合能力(例如,与ZFP或TALE结构域融合的核酸酶还可结合于DNA)。类似地,相对于DNA结合结构域与激活或抑制结构域融合的融合多肽,如果在融合多肽中DNA结合结构域部分能够结合其靶位点和/或其结合位点,同时激活结构域能够上调基因表达或者抑制结构域能够下调基因表达,则DNA结合结构域和激活或抑制结构域处于有效连接。蛋白质、多肽或核酸的“功能片段”是序列不同于全长蛋白质、多肽或核酸但保留与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能片段可以拥有比对应天然分子更多、更少或相同数量的残基,和/或可以包含一种或多种氨基酸或核酸取代物。用于测定核酸功能(例如,编码功能,可杂交另一核酸的能力)的方法在本领域是众所周知的。类似地,用于测定蛋白质功能的方法是众所周知的。例如,多肽的DNA结合功能可以例如通过过滤结合、电泳迁移位移或免疫沉淀试验来测定。DNA切割可以通过凝胶电泳来分析。参见,Ausubel等,同上。蛋白质与另一种蛋白质相互作用的能力可以通过例如免疫共沉淀、双杂交试验或基因和生物化学的互补作用来测定。参见,例如,Fields等(1989)Nature340:245-246;美国专利No.5,585,245以及PCTWO98/44350。“载体”或“构建体”能够将基因序列转移至靶细胞。通常,“载体构建体”、“表达载体”和“基因转移载体”意指能够引导目标基因的表达并且可将基因序列转移至靶细胞的任何核酸构建体。因此,此术语包括克隆媒介物和表达媒介物以及整合载体。术语“受试者”和“患者”可互换使用,并且是指哺乳动物诸如人类患者和非人灵长类以及实验动物诸如兔、狗、猫、大鼠、小鼠以及其他动物。因此,如本文所用的术语“受试者”或“患者”意指本发明的细胞或干细胞可被施用到的任何患者或受试者(例如,哺乳动物)。DNA结合结构域如本文所述的构建体和包含这些构建体的细胞包括编码一种或多种DNA结合结构域的序列,所述DNA结合结构域特异性地结合于任何内源性基因中的靶序列。包括但不限于锌指DNA结合结构域、TALEDNA结合结构域、来自大范围核酸酶或单指导RNA(例如,CRISPR/Cas系统)的DNA结合结构域的任何DNA结合结构域均可用于本文公开的组合物和方法中。在某些实施方案中,DNA结合结构域包括锌指蛋白。优选地,锌指蛋白是非天然存在的,因为它经过工程化以结合于所选的靶位点。参见,例如,Beerli等(2002)NatureBiotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)NatureBiotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利No.6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;以及美国专利公布No.2005/0064474;2007/0218528;2005/0267061,所有文献均以引用方式整体并入本文。与天然存在的锌指蛋白相比,工程化的锌指结合结构域可具有新型结合特异性。工程化方法包括但不限于合理的设计和各种类型的选择。合理的设计包括例如使用包含三联体(或四联体)核苷酸序列和单独锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列缔合。参见,例如,美国专利6,453,242和6,534,261,所述专利以引用方式整体并入本文。包括噬菌体展示和双杂交系统的示例性选择方法公开于美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759以及6,242,568;以及WO98/37186;WO98/53057;WO00/27878;WO01/88197以及GB2,338,237中。此外,已在例如美国专利No.6,794,136中描述了对锌指结合结构域的结合特异性的增强。此外,如这些和其他参考文献中所公开的,可使用任何适合的接头序列(包括例如具有5个或更多个氨基酸长度的接头)来将锌指结构域和/或多指锌指蛋白连接在一起。关于6个或更多个氨基酸长度的示例性接头序列,还参见美国专利No.6,479,626;6,903,185;以及7,153,949。本文描述的蛋白质可包括单独的蛋白质锌指之间的适合接头的任何组合。此外,已在例如美国专利No.6,794,136中描述了对锌指结合结构域的结合特异性的增强。靶位点的选择以及融合蛋白(以及编码所述融合蛋白的多核苷酸)的设计和构建的方法是本领域技术人员已知的,并且详细描述于美国专利No.8,586,526;6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970WO01/88197;WO02/099084;WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496中。此外,如这些和其他参考文献中所公开的,可使用任何适合的接头序列(包括例如具有5个或更多个氨基酸长度的接头)来将锌指结构域和/或多指锌指蛋白连接在一起。关于6个或更多个氨基酸长度的示例性接头序列,还参见美国专利No.6,479,626;6,903,185;以及7,153,949。本文描述的蛋白质可包括单独的蛋白质锌指之间的适合接头的任何组合。ZFP还可为包含一个或多个调控结构域的融合蛋白,所述结构域可为转录激活或抑制结构域。在一些实施方案中,融合蛋白包含连接在一起的两个ZFPDNA结合结构域。这些锌指蛋白因此可包含8、9、10、11、12个或更多个指。在一些实施方案中,两个DNA结合结构域通过可延伸的柔性接头连接,以便一个DNA结合结构域包含4、5或6个锌指并且第二个DNA结合结构域包含额外的4、5或5个锌指。在一些实施方案中,接头为标准的指间接头,以便指阵列包含具有8、9、10、11或12个或更多个指的一种DNA结合结构域。在其他实施方案中,接头为不规则接头,诸如柔性接头。DNA结合结构域与至少一个调控结构域融合,并且可被认为是‘ZFP-ZFP-TF’架构。这些实施方案的具体实例可被称为“ZFP-ZFP-KOX”,其包含用柔性接头连接并且与KOX抑制因子和“ZFP-KOX-ZFP-KOX”融合的两个DNA结合结构域,在“ZFP-KOX-ZFP-KOX”中两个ZFP-KOX融合蛋白通过接头融合在一起。另选地,DNA结合结构域可来源于核酸酶。例如,归巢核酸内切酶(homingendonuclease)和大范围核酸酶诸如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII的识别序列是已知的。还参见,美国专利No.5,420,032;美国专利No.6,833,252;Belfort等(1997)NucleicAcidsRes.25:3379–3388;Dujon等(1989)Gene82:115–118;Perler等(1994)NucleicAcidsRes.22,1125–1127;Jasin(1996)TrendsGenet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353以及NewEnglandBiolabs目录。此外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可经过工程化以结合非天然靶位点。参见,例如,Chevalier等(2002)Molec.Cell10:895-905;Epinat等(2003)NucleicAcidsRes.31:2952-2962;Ashworth等(2006)Nature441:656-659;Paques等(2007)CurrentGeneTherapy7:49-66;美国专利公布No.20070117128。“双手”锌指蛋白是两个锌指DNA结合结构域簇由居间氨基酸隔开以便所述两个锌指结构域结合于两个不连续的靶位点的那些蛋白质。双手类型的锌指结合蛋白的实例为SIP1,其中四个锌指的簇位于蛋白质的氨基端,并且三个指的簇位于羧基端(参见,Remacle等,(1999)EMBOJournal18(18):5073-5084)。这些蛋白质中的每个锌指簇均能够结合于唯一的靶序列,并且两个靶序列之间的间隔可包含许多核苷酸。双手ZFP可包含例如与ZFP中的一个或两个融合的功能结构域。因此,将显而易见的是,功能结构域可附接到一个或两个ZFP的外部或者被定位于ZFP之间(附接到两个ZFP)。参见,例如,美国专利公开No.20130253940。在某些实施方案中,DNA结合结构域包含天然存在的或工程化的(非天然存在的)TAL效应子(TALE)DNA结合结构域。参见,例如,美国专利No.8,586,526,所述专利以引用方式整体并入本文。黄单孢菌属(Xanthomonas)的植物病原菌已知在重要农作物中引起许多疾病。黄单孢菌属的病原性取决于将超过25种不同效应蛋白质注入植物细胞中的保守的III型分泌(T3S)系统。在这些注入的蛋白质之中的是模拟植物转录激活因子并且操纵植物转录组的类转录激活因子效应子(TALE)(参见Kay等(2007)Science318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。最良好表征的TALE中的一种为来自野油菜黄单胞菌疱病致病变种(Xanthomonascampestgrispv.Vesicatoria)的AvrBs3(参见,Bonas等(1989)MolGenGenet218:127-136,以及WO2010079430)。TALE含有集中的串联重复结构域,各重复含有大约34个氨基酸,所述重复对这些蛋白质的DNA结合特异性至关重要。此外,它们含有核定位序列和酸性转录激活结构域(关于综述,参见SchornackS,等(2006)JPlantPhysiol163(3):256-272)。此外,在植物病原菌茄科雷尔氏菌(Ralstoniasolanacearum)中,已经发现命名为brg11和hpx17的两种基因与茄科雷尔氏菌生物变种1菌株GMI1000和生物变种4菌株RS1000中的黄单孢菌属的AvrBs3家族同源(参见Heuer等(2007)ApplandEnvirMicro73(13):4379-4384)。这些基因在核苷酸序列上彼此98.9%相同但是不同之处在于在hpx17的重复结构域中缺失1,575bp。然而,两种基因产物与黄单孢菌属的AvrBs3家族蛋白质具有小于40%序列同一性。这些TALE的特异性取决于在串联重复中发现的序列。重复序列包含大约102bp对并且重复序列通常彼此91-100%同源(Bonas等,同上)。重复序列的多态性通常位于位置12和13并且在位置12和13处的高变双残基的同一性与TALE的靶序列中的邻接核苷酸的同一性之间似乎存在一一对应的关系(参见Moscou和Bogdanove,(2009)Science326:1501和Boch等(2009)Science326:1509-1512)。在实验上,已经确定了供这些TALE的DNA识别的密码,以便位置12和13处的HD序列导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,并且IG与T结合。这些DNA结合重复序列已组装成具有新的组合和重复数量的蛋白质,以产生能够与新序列相互作用并且激活植物细胞中非内源性报告基因的表达的人工转录因子(Boch等,同上)。工程化TAL蛋白已与FokI切割半结构域连接以产生在酵母报告基因测定(基于质粒的靶标)中展现出活性的TAL效应子结构域核酸酶融合(TALEN)。Christian等((2010)<Geneticsepub10.1534/genetics.110.120717)。此外,还已描述了具有C末端和/或N末端截短物(C帽和/或N帽顺序)和不规则重复可变二残基区(RVD)的TALEN。参见,美国专利No.8,586,526,所述专利以引用方式整体并入。已公布了用于将这些TALEN蛋白工程化以进行与用户所选的靶序列的强健、位点特异性相互作用的方法和组合物(参见,美国专利No.8,586,526)。在一些实施方案中,TALEN包含核酸内切酶(例如,FokI)切割结构域或切割半结构域。在其他实施方案中,TALE核酸酶为megaTAL。这些megaTAL核酸酶是包含TALEDNA结合结构域和大范围核酸酶切割结构域的融合蛋白。大范围核酸酶切割结构域作为单体来起作用并且不需要二聚化以获得活性。(参见,Boissel等,(2013)NuclAcidRes:1-13,doi:10.1093/nar/gkt1224)。此外,核酸酶结构域还可展现DNA结合功能性。在其他实施方案中,核酸酶包含致密TALEN(cTALEN)。这些核酸酶是将TALEDNA结合结构域连接到TevI核酸酶结构域的单链融合蛋白。融合蛋白可充当由TALE区定位的切口酶,或可产生双链断裂,取决于TALEDNA结合结构域相对于TevI核酸酶结构域位于的位置(参见,Beurdeley等(2013)NatComm:1-8DOI:10.1038/ncomms2782)。任何TALEN均可与具有一个或多个mega-TAL的额外TALEN(例如,一种或多种TALEN(cTALEN或FokI-TALEN))组合使用。融合分子还提供了包含如本文所述的DNA结合结构域(例如,ZFP、TALE、单指导)和异源调控(功能)结构域(或其功能片段)的融合分子(例如,融合蛋白)。常见的功能结构域包括例如转录因子结构域(激活因子、抑制因子、辅助激活因子、辅助抑制因子)、沉默子、致癌基因(例如,myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等);DNA修复酶及其相关因子和修饰因子;DNA重排酶及其相关因子和修饰因子;染色质相关蛋白及其修饰因子(例如,激酶、乙酰化酶和脱乙酰基酶);以及DNA修饰酶(例如,甲基转移酶、拓扑异构酶、解旋酶、连接酶、激酶、磷酸酶、聚合酶、核酸内切酶)及其相关因子和修饰因子。对于关于DNA结合结构域和核酸酶切割结构域融合的细节,美国专利No.8,586,526;7,888,121;8,409,861;以及7,972,854以引用方式整体并入本文。用于实现激活的适合结构域包括HSVVP16激活结构域(参见,例如,Hagmann等,J.Virol.71,5952-5962(1997))核激素受体(参见,例如,Torchia等,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚基(Bitko和Barik,J.Virol.72:5610-5618(1998)以及Doyle和Hunt,Neuroreport8:2937-2942(1997));Liu等,CancerGeneTher.5:3-28(1998)),或人工嵌合功能结构域诸如VP64(Beerli等,(1998)Proc.Natl.Acad.Sci.USA95:14623-33)以及降解决定子(Molinari等,(1999)EMBOJ.18,6439-6447)。额外的示例性激活结构域包括Oct1、Oct-2A、Sp1、AP-2和CTF1(Seipel等,EMBOJ.11,4961-4968(1992)以及p300、CBP、PCAF、SRC1PvALF、AtHD2A和ERF-2。参见,例如,Robyr等(2000)Mol.Endocrinol.14:329-347;Collingwood等(1999)J.Mol.Endocrinol.23:255-275;Leo等(2000)Gene245:1-11;Manteuffel-Cymborowska(1999)ActaBiochim.Pol.46:77-89;McKenna等(1999)J.SteroidBiochem.Mol.Biol.69:3-12;Malik等(2000)TrendsBiochem.Sci.25:277-283;以及Lemon等(1999)Curr.Opin.Genet.Dev.9:499-504。额外的示例性激活结构域包括但不限于OsGAI、HALF-1、C1、AP1、ARF-5、-6、-7和-8、CPRF1、CPRF4、MYC-RP/GP以及TRAB1和修饰的Cas9反式激活因子蛋白。参见,例如,Ogawa等(2000)Gene245:21-29;Okanami等(1996)GenesCells1:87-99;Goff等(1991)GenesDev.5:298-309;Cho等(1999)PlantMol.Biol.40:419-429;Ulmason等(1999)Proc.Natl.Acad.Sci.USA96:5844-5849;Sprenger-Haussels等(2000)PlantJ.22:1-8;Gong等(1999)PlantMol.Biol.41:33-44;Hobo等(1999)Proc.Natl.Acad.Sci.USA96:15,348-15,353;以及Perez-Pinera等(2013)NatureMethods10:973–976)。对于本领域的技术人员而言,将明确的是在如本文所述的DNA结合结构域和功能结构域之间的融合分子(或编码融合蛋白的核酸)的形成中,激活结构域或与激活结构域相互作用的分子适合作为功能结构域。基本上能够为靶基因将激活复合物和/或激活活性(例如像,组蛋白乙酰化)募集到靶基因的任何分子均可用作融合蛋白的激活结构域。例如在美国专利申请No.6,919,204和7,053,264中描述了适合用作融合分子中的功能结构域的绝缘子结构域、定位结构域和染色质重塑蛋白诸如含ISWI的结构域和/或甲基结合结构域蛋白。示例性抑制结构域包括但不限于KRABA/B、KOX、TGF-β-诱导型早期基因(TIEG)、v-erbA、SID、MBD2、MBD3、DNMT家族成员(例如,DNMT1、DNMT3A、DNMT3B)、Rb和MeCP2。参见,例如,Bird等(1999)Cell99:451-454;Tyler等(1999)Cell99:443-446;Knoepfler等(1999)Cell99:447-450;以及Robertson等(2000)NatureGenet.25:338-342。额外的示例性抑制结构域包括但不限于ROM2和AtHD2A。参见,例如,Chem等(1996)PlantCell8:305-321;以及Wu等(2000)PlantJ.22:19-27。融合分子通过本领域技术人员众所周知的克隆和生物化学缀合方法来构建。融合分子包含DNA结合结构域和功能结构域(例如,转录激活或抑制结构域)。融合分子还任选地包含核定位信号(例如像,来自SV40介质T抗原的核定位信号)和表位标签(例如像,FLAG和血细胞凝集素)。设计融合蛋白(和编码融合蛋白的核酸),以便将翻译阅读框保存在融合组分之中。通过本领域技术人员众所周知的方法(包括但不限于生物化学缀合、细胞中的共表达等)构建一只手上功能结构域(或其功能片段)的多肽组分与另一只手上非蛋白DNA结合结构域(例如,单指导RNA、抗生素、嵌入剂、小沟结合剂、核酸)之间的融合。在某些实施方案中,由DNA结合结构域(例如,预期的靶位点和/或低亲和性位点)结合的靶位点存在于控制元件中和/或处于控制元件附近,例如在外源性控制元件或驱动宿主细胞中外源性基因调节子的表达的控制元件(例如,启动子)之内、相邻或接近外源性控制元件或驱动宿主细胞中外源性基因调节子的表达的控制元件。在某些实施方案中,靶位点为细胞染色质的可及区。可如例如美国专利No.6,511,808中所述的那样来确定可及区。如果靶位点不存在于细胞染色质的可及区中,则可如美国专利No.7,001,768中所述的那样来产生一个或多个可及区。如本领域的技术人员所知,如本文所述的融合分子可用药学上可接受的载体来配制。参见,例如,Remington'sPharmaceuticalSciences,第17版,1985;以及共同拥有的WO00/42219。融合分子的功能组分/结构域可选自多种不同组分中的任一种,一旦融合分子通过所述多种不同组分的DNA结合结构域结合于靶序列,所述多种不同组分就能够影响基因转录。因此,功能组成部分可包括但不限于各种转录因子结构域,诸如激活因子、抑制因子、辅助激活因子、辅助抑制因子和沉默子。还可选择受外源性小分子或配体调控的功能结构域。例如,可采用技术,其中功能结构域仅在外部RheoChemTM配体的存在下呈现其活性构象(参见,例如,US20090136465)。因此,DNA结合结构域(例如,ZFP或TALE或单指导)可以可操作地连接到所产生的基因调节子(例如,ZFP-TF或TALE-TF或CRISPR/Cas-TF)活性受外部配体控制的可调控的功能结构域。核酸酶在某些实施方案中,融合分子包含DNA结合结合结构域和切割(核酸酶)结构域。如此,可使用核酸酶例如工程化核酸酶来实现基因修饰。工程化核酸酶技术基于天然存在的DNA结合蛋白的工程化。例如,已描述了具有定制DNA结合特异性的归巢核酸内切酶的工程化。(参见,Chames等(2005)NucleicAcidsRes33(20):e178;Arnould等(2006)J.Mol.Biol.355:443-458)。此外,还已描述了ZFP和TALE的工程化。参见,例如,美国专利No.8,586,526;6,534,261;6,607,882;6,824,978;6,979,539;6,933,113;7,163,824;以及7,013,219。此外,ZFP和TALE已经与核酸酶结构域融合以产生能够通过其经工程化的(ZFP或TALE)DNA结合结构域识别其预期核酸靶标并且通过核酸酶活性引起在ZFP或TALEDNA结合位点附近切割DNA的ZFN和TALEN-功能实体。参见,例如,Kim等(1996)ProcNatlAcadSciUSA93(3):1156-1160。最近,最近,ZFN已经用于多种生物体中的基因组修饰。参见,例如,参见,例如,美国专利No.8,623,618;8,034,598;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公布20030232410;20050208489;20050026157;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983以及20130177960。因此,本文描述的方法和组合物广泛适用,并且可涉及任何目标核酸酶。核酸酶的非限制性实例包括大范围核酸酶、TALEN、Ttago核酸酶、CRISPR/Cas核酸酶系统和锌指核酸酶。核酸酶可能包含异源DNA结合和切割结构域(例如,锌指核酸酶;TALEN;大范围核酸酶DNA结合结构域以及异源切割结构域),或者另选地,可将天然存在的核酸酶的DNA结合结构域改变以结合于所选靶位点(例如,已经过工程化以结合于不同于同源结合位点的位点的大范围核酸酶)。在某些实施方案中,组合物包含来自大范围核酸酶(归巢核酸内切酶)的DNA结合结构域和/或核酸酶(切割)结构域。天然存在的大范围核酸酶识别15-40个碱基对切割位点,并且通常分为4个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。在某些实施方案中,归巢核酸内切酶(大范围核酸酶)为工程化的(非天然存在的)。归巢核酸内切酶和大范围核酸酶诸如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII的识别序列是已知的。还参见,美国专利No.5,420,032;美国专利No.6,833,252;Belfort等(1997)NucleicAcidsRes.25:3379–3388;Dujon等(1989)Gene82:115–118;Perler等(1994)NucleicAcidsRes.22,1125–1127;Jasin(1996)TrendsGenet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353以及NewEnglandBiolabs目录。来自主要来自LAGLIDADG家族的天然存在的大范围核酸酶的DNA结合结构域已用来在植物、酵母、果蝇(Drosophila)、哺乳动物细胞和小鼠中促进位点特异性基因组修饰,但是这种方法已限于保存大范围核酸酶识别序列的同源基因的修饰(Monet等(1999),Biochem.Biophysics.Res.Common.255:88-93)或已引入了识别序列的预工程化基因组(Route等(1994),Mol.Cell.Biol.14:8096-106;Chilton等(2003)PlantPhysiology133:956-65;Puchta等(1996),Proc.Natl.Acad.Sci.USA93:5055-60;Rong等(2002),GenesDev.16:1568-81;Gouble等(2006),J.GeneMed.8(5):616-622)。相应地,已经尝试将大范围核酸酶工程化以在医学或生物技术相关位点展现出新型结合特异性(Porteus等(2005),Nat.Biotechnol.23:967-73;Sussman等(2004),J.Mol.Biol.342:31-41;Epinat等(2003),NucleicAcidsRes.31:2952-62;Chevalier等(2002)Molec.Cell10:895-905;Epinat等(2003)NucleicAcidsRes.31:2952-2962;Ashworth等(2006)Nature441:656-659;Paques等(2007)CurrentGeneTherapy7:49-66;美国专利公布No.20070117128;20060206949;20060153826;20060078552;以及20040002092)。此外,来自大范围核酸酶的非天然存在或工程化的DNA结合结构域还已与来自异源核酸酶(例如,FokI)的切割结构域可操作地连接。在其他实施方案中,核酸酶为锌指核酸酶(ZFN)。ZFN包含已经工程化以结合于所选基因中的靶位点和切割结构域或切割半结构域的锌指蛋白。如以上所详细描述,锌指结合结构域可经工程化以结合于所选序列。参见,例如,Beerli等(2002)NatureBiotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)NatureBiotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的锌指蛋白相比,工程化的锌指结合结构域可具有新型结合特异性。工程化方法包括但不限于合理的设计和各种类型的选择。合理的设计包括例如使用包含三联体(或四联体)核苷酸序列和单独锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列缔合。参见,例如共有的美国专利6,453,242和6,534,261,所述专利以引用方式整体并入本文。在美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO98/37186;WO98/53057;WO00/27878;WO01/88197和GB2,338,237中公开了示例性选择方法,包括噬菌体展示和双杂交系统。此外,已在例如美国专利No.6,794,136中描述了对锌指结合结构域的结合特异性的增强。此外,如这些和其他参考文献中所公开的那样,可使用任何适合的接头序列来使DNA结合结构域(例如,锌指蛋白、TALE蛋白等)连接在一起或连接到功能结构域。参见,例如,美国专利No.8,772,453;6,479,626;6,903,185;和7,153,949美国专利公布No.20090305419;以及美国申请No.14/471,782。CRISPR(规律成簇的间隔短回文重复)/Cas(CRISPR相关的)核酸酶系统是基于可用于基因组工程的细菌系统的最近工程化的核酸酶系统。其基于许多细菌和古细菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入菌的DNA片段通过‘免疫’应答转化成CRISPRRNA(crRNA)。然后这种crRNA通过具有部分互补性的区与称为tracrRNA的另一种类型的RNA缔合以将Cas9核酸酶引导至与称为“原间隔区(protospacer)”的靶DNA中的crRNA同源的区。Cas9在由crRNA转录产物中所含的20-核苷酸指导序列指定的位点处切割DNA以在DSB处产生平末端。Cas9需要用于位点特异性DNA识别和切割的crRNA和tracrRNA。此系统现已经工程化,以便crRNA和tracrRNA可组合成一个分子(“单指导RNA”),并且单指导RNA的crRNA等效部分可经工程化以引导Cas9核酸酶靶向任何所需序列(参见,Jinek等(2012)Science337,第816-821页,Jinek等,(2013),eLife2:e00471,以及DavidSegal,(2013)eLife2:e00563)。因此,CRISPR/Cas系统可经工程化以在基因组的所需靶标处产生DSB,并且可通过使用修复抑制剂来影响DSB的修复以引起易错修复的增加。如本文所述的核酸酶还可包含核酸酶(切割结构域、切割半结构域)。如上所述,切割结构域可与DNA结合结构域(例如,锌指DNA结合结构域和来自核酸酶的切割结构域,或大范围核酸酶DNA结合结构域,以及来自不同核酸酶的切割结构域)异源。异源切割结构域可从任何核酸内切酶或核酸外切酶获得。切割结构域可来源于的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见,例如,2002-2003目录,NewEnglandBiolabs,Beverly,MA;以及Belfort等(1997)NucleicAcidsRes.25:3379-3388。切割DNA的额外的酶是已知的(例如,S1核酸酶;绿豆核酸酶;胰腺DNA酶I;微球菌核酸酶;酵母HO核酸内切酶;还参见,Linn等(编)Nucleases,ColdSpringHarborLaboratoryPress,1993)。这些酶(或其功能片段)中的一种或多种可用作切割结构域和切割半结构域的来源。类似地,切割半结构域可来源于如上提出的对于切割活性需要二聚化的任何核酸酶或其部分。一般而言,如果融合分子包含切割半结构域,则切割需要两个融合分子。另选地,可使用包含两个切割半结构域的单个蛋白质。所述两个切割半结构域可来源于相同核酸内切酶(或其功能片段),或者每个切割半结构域均可来源于不同的核酸内切酶(或其功能片段)。此外,两个融合蛋白的靶位点优选地相对于彼此而布置,以便两个融合蛋白与其各自靶位点的结合使切割半结构域置于允许切割半结构域例如通过二聚化来形成功能切割结构域的相互空间定位中。因此,在某些实施方案中,靶位点的近侧由5-8个核苷酸或由15-18个核苷酸隔开。然而,任何整数的核苷酸或核苷酸对可介于两个靶位点之间(例如,从2至50个核苷酸对或更多)。一般而言,切割的位点位于靶位点之间。限制核酸内切酶(限制酶)存在于许多物种中,并且能够以序列特异性方式结合于DNA(在识别位点处),并且在结合位点处或附近切割DNA。某些限制酶(例如,IIS型)在远离识别位点的位点处切割DNA,并且具有可分离的结合结构域和切割结构域。例如,IIS型酶FokI在距其一条链上的识别位点9个核苷酸处以及在距其另一条链上的识别位点13个核苷酸处催化DNA的双链切割。参见,例如,美国专利5,356,802;5,436,150和5,487,994;以及Li等(1992)Proc.Natl.Acad.Sci.USA89:4275-4279;Li等(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一个实施方案中,融合蛋白包含来自至少一种IIS型限制酶的切割结构域(或切割半结构域)以及一种或多种锌指结合结构域,所述一种或多种锌指结合结构域可能是或可能不是工程化的。切割结构域与结合结构域分离的示例性IIS型限制酶为FokI。这种特定的酶作为二聚体是有活性的。Bitinaite等(1998)Proc.Natl.Acad.Sci.USA95:10,570-10,575。因此,为了本公开的目的,认为用于公开的融合蛋白中的FokI酶的一部分是切割半结构域。因此,为了使用锌指-FokI或TALE-FokI融合体进行细胞序列的靶向双链切割和/或靶向置换,各自包含FokI切割半结构域的两种融合蛋白可用来重建催化活性的切割结构域。另选地,还可使用含有锌指结合结构域和两个FokI切割半结构域的单个多肽分子。本公开在别处提供了使用锌指-FokI或TALE-FokI融合体进行的靶向切割和靶向序列改变的参数。切割结构域或切割半结构域可为保留切割活性或保留多聚化(例如,二聚化)以形成功能切割结构域的能力的蛋白质的任何部分。美国专利公布No.20070134796中描述了示例性IIS型限制酶,所述专利整体并入本文。额外的限制酶也含有可分离的结合结构域和切割结构域,并且这些限制酶为本公开所涵盖。参见,例如,Roberts等(2003)NucleicAcidsRes.31:418-420。在某些实施方案中,如例如美国专利No.7,888,121;8,409,861;7,914,796;以及8,034,598中所述,切割结构域包含最小化或防止同源二聚化的一个或多个工程化切割半结构域(也称为二聚化结构域突变体),所述专利的全部公开内容均以引用方式整体并入本文。在FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537以及538上的氨基酸残基全部是用于影响FokI切割半结构域二聚的靶标。形成专性异源二聚体的FokI的示例性工程化切割半结构域包括如下对,在所述对中第一种切割半结构域包含在FokI的位置490和538上的氨基酸残基的突变,并且第二种切割半结构域包括在氨基酸残基486和499上的突变。因此,在一个实施方案中,490处的突变用Lys(K)置换Glu(E);在538处的突变用Lys(K)置换Iso(I);486处的突变用Glu(E)置换Gln(Q);并且位置499处的突变用Lys(K)置换Iso(I)。更确切地说,本文描述的工程化切割半结构域通过在一个切割半结构域中位置490(E→K)和538(I→K)突变以产生命名为“E490K:I538K”工程化切割半结构域,以及通过在另一切割半结构域中位置486(Q→E)和499(I→L)突变以产生命名为“Q486E:I499L”工程化切割半结构域来制备。本文描述的工程化切割半结构域是异常切割被最小化或消除的专性异源二聚突变体。参见,例如,美国专利No.7,888,121;8,409,861;7,914,796;以及8,034,598和美国专利公布No.20120040398,所述专利的公开内容为了所有目的而以引用方式整体并入。在某些实施方案中,工程化切割半结构域包含在位置486、499以及496(相对于野生型FokI编号)处的突变,例如在位置486处用Glu(E)残基替换野生型Gln(Q)残基、在位置499处用Leu(L)残基替换野生型Iso(I)残基以及在位置496处用Asp(D)或Glu(E)残基(也分别称为“ELD”和“ELE”结构域)替换野生型Asn(N)残基的突变。在其他实施方案中,工程化切割半结构域包含在位置490、538以及537(相对于野生型FokI编号)处的突变,例如在位置490处用Lys(K)残基置换野生型Glu(E)残基、在位置538处用Lys(K)残基置换野生型Iso(I)残基以及在位置537处用Lys(K)残基或Arg(R)残基(也分别称为“KKK”和“KKR”结构域)置换野生型His(H)残基的突变。在其他实施方案中,工程化切割半结构域包含在位置490和537(相对于野生型FokI编号)处的突变,例如在位置490处用Lys(K)残基置换野生型Glu(E)残基以及在位置537处用Lys(K)或Arg(R)残基(也分别称为“KIK”和“KIR”结构域)置换野生型His(H)残基的突变。(参见,美国专利No.8,623,618)。本文描述的工程化切割半结构域可以使用任何适合的方法例如通过如美国公布No.7,888,121和7,914,796中所描述的野生型切割半结构域(FokI)的定点诱变来制备。另选地,可在体内在核酸靶位点处使用所谓的“分裂酶”技术来组装核酸酶(参见,例如,美国专利公布No.20090068164)。此类分裂酶的组分可在独立的表达构建体上表达,或者可在单独组分由例如自切割2A肽或IRES序列隔开的一个开放阅读框中连接。组分可为单独锌指结合结构域或具有大范围核酸酶核酸结合结构域的结构域。在一些实施方案中,DNA结合结构域为来自与来源于植物病原体黄单孢菌(参见,Boch等,(2009)Science326:1509-1512以及Moscou和Bogdanove,(2009)Science326:1501)以及雷尔氏菌(参见,Heuer等(2007)AppliedandEnvironmentalMicrobiology73(13):4379-4384)的那些TAL效应子相似的TAL效应子的工程化结构域。还参见,美国专利No.8,586,526。使用之前,例如在如美国专利No.8,563,314中所述的基于酵母的染色体系统中可筛选核酸酶(例如,ZFN或TALEN)的活性。可使用本领域已知的方法来容易地设计核酸酶表达构建体。参见,例如,美国专利No.7,888,121和8,409,861,以及美国专利公布No.20030232410;20050208489;20050026157;20060063231;和20070134796。核酸酶的表达在组成型启动子或诱导型启动子(例如,在棉子糖和/或半乳糖的存在下被激活(去抑制)而在葡萄糖的存在下被抑制的半乳糖激酶启动子)的控制之下。在某些实施方案中,核酸酶为天然存在的。在其他实施方案中,核酸酶为非天然存在的,即在DNA结合结构域和/或切割结构域方面是工程化的。例如,可改变天然存在核酸酶的DNA结合结构域以结合于选定靶位点(例如,已经工程化以结合于不同于同源结合位点的大范围核酸酶)。在其他实施方案中,核酸酶包含异源DNA结合和切割结构域(例如,锌指核酸酶;TAL效应子核酸酶;具有异源切割结构域的大范围核酸酶DNA结合结构域)或由特异性指导RNA(例如,CRPISR/Cas)引导的一般核酸酶(genericnuclease)。靶位点本文描述的构建体还包含DNA结合结构域的一种或多种低亲和性靶位点。如以上所指出,低亲和性靶位点是当有存在的过量基因调节子时和/或当DNA结合结构域与更低亲和性而不是与预期靶位点(设计并检测DNA结合结构域所使用的预期把位点)结合时通常被基因调节子的DNA结合结构域结合的一种靶位点。结合亲和性可通过任何适合手段(或者包括但不限于Kd分析,或者关于报告基因或内源性基因的功能分析(例如,测量基因表达或切割的水平))来测定。结合亲和性可定量地表达(例如,Kd,基因表达或切割水平)或定性地表达(例如,相对于其他结合结构域(包括结合于相同基因内的相同或不同靶序列的那些结合结构域))。如以上所指出,本文公开的构建体的转录因子和/或核酸酶的靶位点通常包括多个结合位点(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17个或更多)。例如,包含三个指的ZFP通常识别包含9或10个核苷酸的靶位点;包含四个指的ZFP通常识别包含12至14个核苷酸的靶位点;然而具有六个指的ZFP可识别包含18至21个核苷酸的靶位点,其中多锌指蛋白的每个锌指均结合于在全部靶位点内具有任选的未结合核苷酸的3碱基对靶位点。类似地,被TALEDNA结合蛋白结合的靶位点包含1-2个核苷酸被单TALE重复(或半重复)的重复可变二残基(RVD)结合的任何数量的核苷酸。参见,例如,美国专利No.8,586,526。DNA结合分子经设计和/或选择以结合于预期靶位点。参见,例如表2。然而,当以足够高的水平表达时,这些DNA结合分子可结合于次优选、低亲和性靶位点。如本文所述的自我调控性构建体通过提供驱动基因调节子(抑制子或核酸酶)的表达的低亲和性靶位点来使用此现象,以便当以足够高的水平表达时基因调节子结合于存在于启动子中的低亲和性位点。基因调节子(抑制子或核酸酶)与低亲和性靶位点的结合转而抑制基因调节子的表达,因此提供了自我调控性构建体。低亲和性靶位点的序列通常与预期靶位点的序列不同。可改变一个或多个核苷酸,包括所有核苷酸。在某些实施方案中,低亲和性靶位点包含与预期靶位点相同的碱基对(邻接或非邻接的)的至少一半。在其他实施方案中,低亲和性靶位点包含与预期靶位点相同的碱基对的至少60%、70%、80%、85%、90%、95%或99%。例如,在具有18个碱基对的靶位点中,低亲和靶位点与预期靶位点之间的0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17个碱基对可能不同。类似地,对于具有21个碱基对的预期靶位点,低亲和性靶位点中可能不同的0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、1718、19或20个碱基对可能与预期靶位点不同。在某些实施方案中,低亲和性靶位点可包含存在于预期靶位点中的靶亚位点的邻接序列(例如,部分)(重复或不重复),例如存在于涉及三核苷酸重复病症的基因的调节子中的CAG或CCG重复。在某些实施方案中,低亲和性靶位点和预期靶位点相同,但是被DNA结合结构域结合的靶亚位点不是邻接的。构建体可包含任何数量的低亲和性靶位点(或其部分)。在某些实施方案中,低亲和性靶位点包含存在于预期靶序列中的基序的一个或多个重复,例如存在于调节子中的CAG或CCG重复,所述调节子与存在于患有三核苷酸重复病症的患者中的突变体和/或野生型等位基因结合。因此,构建体中包含的低亲和性靶位点的数量可通过技术人员根据所需自我调控性的量或程度来容易地测定。例如,为了调控对预期靶位点具有强结合亲和性的调节子,比起对预期靶位点具有较低结合亲和性的调节子,可包含较少的低亲和性靶位点。参见以下实施例。供体如以上所指出,例如为了校正突变体基因或者为了增加野生型基因的表达,可使用如本文所述的基因调节子(例如,核酸酶)来进行外源性基因(也被称为“供体序列”或“供体”或“转基因”)的插入。将显而易见的是,供体序列不必与其所置于的基因组序列相同。供体序列可含有侧接两个同源区的非同源序列,以允许目标位置处的有效HDR。此外,供体序列可包含含有与细胞染色质中的目标区不同源的序列的载体分子。供体分子可含有细胞染色质的若干不连续的同源区。例如,为了通常不存在于目标区中的序列的靶向插入,所述序列可存在于供体核酸分子中并且侧接目标区中的序列的同源区,或者另选地,供体分子可通过非同源末端连接(NHEJ)机制整合到切割的靶基因座中。参见,例如,U。参见,例如,美国专利No.7,888,121和7,972,843,以及美国专利No.8,703,489和美国公布No.20110281361和20110207221本文描述了用于插入所选位置中的任何多核苷酸的靶向插入的方法。用于插入的多核苷酸还可被称为“外源性”多核苷酸、“供体”多核苷酸或分子或“转基因”。供体多核苷酸可为单链和/或双链的DNA,并且可以线型或环状(例如,小环)形式引入细胞中。参见,例如,美国专利No.8,703,489和美国公布No.20110281361和20110207221。如果以线型形式引入,则供体序列的末端可通过为本领域技术人员已知的方法来保护(例如,免受核酸外切降解)。例如,一种或多种双脱氧核苷酸残基添加至线型分子的3’末端,并且/或者自补寡核苷酸连接到一个或两个末端。参见,例如,Chang等(1987)Proc.Natl.Acad.Sci.USA84:4959-4963;Nehls等(1996)Science272:886-889。用于保护外源性多核苷酸免受降解的另外方法包括但不限于添加末端氨基和使用修饰的核苷酸间键联,例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。可将多核苷酸引入细胞中作为载体分子的一部分,所述载体分子具有额外序列例如像复制起点、启动子和编码抗生素抗性的基因。此外,供体多核苷酸可作为裸核酸、作为与诸如脂质体或泊洛沙姆的药剂复合的核酸来引入,或者可通过病毒(例如,腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷型慢病毒(IDLV))来递送。在某些实施方案中,双链供体包括长度大于1kb的序列(例如,编码序列,也被称为转基因),例如在2kb与200kb之间,在2kb与10kb之间(或它们之间的任何值)。例如,双链供体还包含至少一个核酸酶靶位点。在某些实施方案中,供体包含例如用于与CRISPR/Cas一起使用的至少1个靶位点靶位点,或例如用于ZFN和/或TALEN对的2个靶位点。通常,核酸酶靶位点处于转基因序列之外(例如转基因序列的5’和/或3’)以切割所述转基因。核酸酶切割位点可支持任何核酸酶。在某些实施方案中,双链供体中含有的核酸酶靶位点支持被用来切割内源性靶标的相同核酸酶,切割的供体通过同源独立性方法整合到所述内源性靶标中。供体通常被插入,以便它的表达由整合位点处的内源性启动子(即,驱动供体所插入的内源性基因的表达的启动子)驱动。然而,将显而易见的是,供体可包含启动子和/或增强子,例如组成型启动子或者诱导型或组织特异性启动子。供体分子可插入内源性性基因中,以便所有、一些或没有内源性基因得以表达。例如,如本文所述的转基因可插入所选的基因座中,以便一些或没有内源性序列得以表达,例如作为具有转基因的融合体。在其他实施方案中,转基因整合到任何内源性基因座例如安全港基因座(safe-harborlocus)中。此外,虽然并非为表达所必需,但是外源性序列还可包括转录或翻译调控序列,例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽和/或多聚腺苷酸化信号的序列。可使用本领域已知的标准技术诸如PCR来从质粒、细胞或其他来源中分离本文描述的供体序列上携带的转基因。供使用的供体可包含不同类型的拓扑结构,包括超螺旋环状、松弛环状、线型等。另选地,它们可使用标准寡核苷酸合成技术来以化学方式合成。此外,供体可为甲基化的,或者缺乏甲基化。供体可呈细菌或酵母人工染色体(BAC或YAC)的形式。本文描述的双链供体多核苷酸可包含一个或多个非天然碱基和/或骨架。具体而言,可使用本文描述的方法来进行具有甲基化胞嘧啶的供体分子的插入,以在目标区达到转录静止的状态。外源性(供体)多核苷酸可包含任何目标序列(外源性序列)。示例性外源性序列包括但不限于任何多肽编码序列(例如,cDNA)、启动子序列、增强子序列、表位标签、标记基因、切割酶识别位点以及各种类型的表达构建体。标记基因包括但不限于序列编码介导抗生素抗性(例如,氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列、编码彩色或荧光或发光蛋白(例如,绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、荧光素酶)和介导增强的细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸还原酶)的序列。表位标签包括例如FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列中的一种或多种拷贝。在优选实施方案中,外源性序列(转基因)包含编码细胞中表达所需的任何多肽的多核苷酸,所述多肽包括但不限于抗体、抗原、酶、受体(细胞表面或核)、激素、淋巴因子、细胞因子、报告多肽(reporterpolypeptide)、生长因子及以上中的任一种的功能片段。编码序列可为例如cDNA。在某些实施方案中,外源性序列可包含标记基因(以上描述的),从而允许选择已进行了靶向整合的细胞和编码额外功能性的连接序列。标记基因的非限制性实例包括GFP、药物选择标记等。可插入的额外基因序列可包含例如野生型基因以置换突变序列。例如,野生型β珠蛋白基因序列可插入基因的内源性拷贝突变的干细胞的基因组中。野生型拷贝可在内源性基因座处插入,或者可另选地靶向到安全港基因座。按照本说说明书的教义,此类表达盒的构建利用分子生物学领域中众所周知的方法(参见,例如,Ausubel或Maniatis)。在使用表达盒产生转基因动物之前,表达盒对与所选控制元件相关的应激诱导物(stress-inducer)的响应性可通过将表达盒引入适合的细胞系(例如,原代细胞、转化细胞或永生化细胞系)中来检测。此外,虽然并非为表达所必需,但是外源性序列还可转录或翻译调控序列,例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽和/或多聚腺苷酸化信号的序列。此外,目标基因的控制元件可以可操作地连接到报告基因以产生嵌合基因(例如,报告表达盒)。还可实现非编码核酸序列的靶向插入。编码反义RNA、RNAi、shRNA和微小RNA(miRNA)的序列也可用于靶向插入。在另外的实施方案中,供体核酸可包含作为用于额外核酸酶设计的特异性靶位点的非编码序列。随后,额外的核酸酶可在细胞中表达,以便通过插入另一种目标供体分子来切割并且修饰原始供体分子。以此方式,可产生供体分子的反复整合,从而允许特定目标基因座处或安全港基因座处的特性叠加。递送可通过任何适合手段,包括例如通过注射ZFP-TF、TALE-TF蛋白或通过使用编码ZFN或TALEN的mRNA或通过多核苷酸(例如,单指导RNA)和相关功能结构域(例如,激活、抑制、核酸酶等)来向靶细胞递送蛋白质(例如,ZFP、TALE、CRISPR/Cas)、编码蛋白质的多核苷酸和包含本文描述的蛋白质和/或多核苷酸的组合物。适合的细胞包括但不限于真核和原核细胞和/或细胞系。所述细胞或产生自所述细胞的细胞系的非限制性实例包括COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)和perC6细胞,以及昆虫细胞诸如草地贪夜蛾(Spodopterafugiperda)(Sf)或真菌细胞诸如酵母属(Saccharomyces),毕赤酵母(Pichia)和裂殖酵母属(Schizosaccharomyces)。在某些实施方案中,细胞系为CHO-K1、MDCK或HEK293细胞系。适合的细胞还包括干细胞例如像胚胎干细胞、诱导多能干细胞、造血干细胞、神经元干细胞和间充质干细胞。递送包含如本文所述的锌指蛋白的蛋白质的方法在例如美国专利No.8,586,526、6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;以及7,163,824中有所描述,所述专利的所有公开内容以引用方式整体并入本文。还可使用含有编码本文描述的一种或多种组合物的序列的载体来递送如本文所述的核酸酶和/或供体构建体。可使用包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体;疱疹病毒载体以及腺相关病毒载体等的任何载体系统。还参见,美国专利No.6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219以及7,163,824,所述专利以引用方式整体并入本文。此外,将显而易见的是,这些载体中的任一种均可包含一个或多个编码锌指或TALE蛋白质的序列。因此,当向细胞中引入一种或多种ZFP、TALE或CRISPR/Cas多核苷酸和/或蛋白质时,可在相同载体或不同载体上携带编码ZFP、TALE或CRISPR/Cas蛋白质的序列。当使用多个载体时,各载体均可包含编码一种或多种ZFP、TALE或CRISPR/Cas系统的序列。常规的基于病毒和非病毒的基因转移方法可用来在细胞(例如,哺乳动物细胞)和靶组织中引入编码工程化ZFP、TALE、Ttago和/或CRISPR/Cas系统的核酸。此类方法也可用来向体外细胞中施用编码ZFP、TALE、Ttago和/或CRISPR/Cas系统的核酸。在某些实施方案中,施用编码ZFP、TALE、Ttago和/或CRISPR/Cas系统的核酸被施用用于体内或活体外基因疗法用途。非病毒载体递送系统包括DNA质粒、裸核酸和与递送媒介物诸如脂质体或泊洛沙姆复合的核酸。病毒载体递送系统包括DNA和RNA病毒,所述DNA和RNA病毒在递送至细胞后具有游离基因或整合的基因组。对于基因疗法规程的综述,参见,Anderson,Science256:808-813(1992);Nabel和Felgner,TIBTECH11:211-217(1993);Mitani和Caskey,TIBTECH11:162-166(1993);Dillon,TIBTECH11:167-175(1993);Miller,Nature357:455-460(1992);VanBrunt,Biotechnology6(10):1149-1154(1988);Vigne,RestorativeNeurologyandNeuroscience8:35-36(1995);Kremer&Perricaudet,BritishMedicalBulletin51(1):31-44(1995);Haddada等,CurrentTopicsinMicrobiologyandImmunologyDoerfler和(编)(1995);以及Yu等,GeneTherapy1:13-26(1994)。核酸的非病毒递送方法包括电穿孔、脂质转染、微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸偶联物、裸DNA、裸RNA、人工病毒粒子以及试剂增强的DNA摄取。使用例如Sonitron2000系统(Rich-Mar)的声致穿孔也可用于核酸的递送。在优选实施方案中,将一种或多种核酸作为mRNA递送。还优选使用加帽的mRNA以增加翻译效率和/或mRNA稳定性。尤其优选ARCA(抗-反向帽类似物)帽或其变体。参见,美国专利US7074596和US8153773,所述专利以引用方式并入本文。额外的示例性核酸输送系统包括由AmaxaBiosystems(Cologne,Germany),Maxcyte,Inc.(Rockville,Maryland)、BTXMolecularDeliverySystems(Holliston,MA)以及CopernicusTherapeuticsInc提供的那些核酸递送系统(参见,例如,US6008336)。脂质转染描述于例如美国专利No.5,049,386;4,946,787;和4,897,355)中,并且脂质转染试剂为商业销售的(例如,TransfectamTM以及LipofectinTM和LipofectamineTMRNAiMAX)。适用于多核苷酸有效受体识别脂质转染的阳离子和中性脂质包括Felgner、WO91/17424、WO91/16024的那些脂质。递送可为向细胞(活体外施用)或靶组织(体内施用)。脂质:核酸复合物,包括靶向脂质体诸如免疫脂质复合物的制备为本领域的技术人员众所周知(参见,例如,Crystal,Science270:404-410(1995);Blaese等,CancerGeneTher.2:291-297(1995);Behr等,BioconjugateChem.5:382-389(1994);Remy等,BioconjugateChem.5:647-654(1994);Gao等,GeneTherapy2:710-722(1995);Ahmad等,CancerRes.52:4817-4820(1992);美国专利No.4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。额外的递送方法包括使用将待递送的核酸包装到EnGeneIC递送媒介物(EDV)中。这些EDV使用双特异性抗体特异性地向靶组织递送,其中所述抗体的一个臂具有对于靶组织的特异性,并且另一个臂具有对于EDV的特异性。抗体将EDV带至靶细胞表面,然后通过胞吞作用将EDV带入细胞中。一旦处于细胞中,就释放内含物(参见,MacDiarmid等(2009)NatureBiotechnology27(7):643)。使用基于RNA或DNA病毒的系统以递送编码工程化ZFP、TALE或CRISPR/Cas系统的核酸利用了使病毒靶向体内的特定细胞并且将病毒有效载荷运输到核的高度进化过程。病毒载体可直接向患者(体内)施用或其可用于体外处理细胞并且向患者(活体外)施用经修饰的细胞。用于递送ZFP、TALE或CRISPR/Cas系统的常规基于病毒的系统包括但不限于用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关、牛痘和单纯性疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法使宿主基因组中的整合成为可能,常常导致插入的转基因长期表达。此外,已在许多不同细胞类型和靶组织中观察到高转导效率。逆转录病毒的趋向性可通过并入外来包膜蛋白质、扩增靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并且通常产生高病毒效价的逆转录病毒载体。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体包含包装能力高达6-10kb外来序列的顺式作用长末端重复。最小顺式作用LTR就足以用于载体的复制和包装,其接着用于将治疗基因整合至靶细胞中以提供持久的转基因表达。广泛使用的逆转录病毒载体包括基于小鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些逆转录病毒载体(参见,例如,Buchscher等,J.Virol.66:2731-2739(1992);Johann等,J.Virol.66:1635-1640(1992);Sommerfelt等,Virol.176:58-59(1990);Wilson等,J.Virol.63:2374-2378(1989);Miller等,J.Virol.65:2220-2224(1991);PCT/US94/05700)。在优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有极高转导效率且不需要细胞分裂。用所述载体已获得高效价和表达水平。此载体可在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也用来例如在核酸和肽的体外产生中用靶核酸转导细胞,并且用于体内和活体外基因疗法规程(参见,例如,West等,Virology160:38-47(1987);美国专利No.4,797,368;WO93/24641;Kotin,HumanGeneTherapy5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于多个出版物中,包括美国专利No.5,173,414;Tratschin等,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,等,Mol.Cell.Biol.4:2072-2081(1984);Hermonat和Muzyczka,PNAS81:6466-6470(1984);以及Samulski等,J.Virol.63:03822-3828(1989)。至少六种病毒载体方法目前可用于临床试验中的基因转移,其利用涉及通过插入辅助细胞系中的基因进行缺陷型载体的互补的方法以生成转导剂。pLASN和MFG-S是已被用于临床试验中的逆转录病毒载体的实例(Dunbar等,Blood85:3048-305(1995);Kohn等,Nat.Med.1:1017-102(1995);Malech等,PNAS94:2212133-12138(1997))。PA317/pLASN是用于基因治疗试验中的第一种治疗性载体。(Blaese等,Science270:475-480(1995))。已经观察到MFG-S包装载体的50%或更大的转导效率。(Ellem等,ImmunolImmunother.44(1):10-20(1997);Dranoff等,Hum.GeneTher.1:111-2(1997)。适用于引入本文描述的多核苷酸的载体还包括非整合慢病毒载体(IDLV)。参见,例如,Ory等(1996)Proc.Natl.Acad.Sci.USA93:11382-11388;Dull等(1998)J.Virol.72:8463-8471;Zuffery等(1998)J.Virol.72:9873-9880;Follenzi等(2000)NatureGenetics25:217-222;美国专利公布No.20090117617。重组腺相关病毒载体(rAAV)也可用来递送本文描述的组合物。所有载体来源于仅保留了侧接转基因表达盒的AAV145bp反向末端重复的质粒。由于整合到转导细胞基因组中所引起的有效基因转移和稳定的转基因递送是这种载体系统的关键特征。(Wagner等,Lancet351:91171702-3(1998),Kearns等,GeneTher.9:748-55(1996))。其他AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8AAV8.2、AAV9和AAVrh10以及假型AAV诸如AAV2/8、AAV2/5和AAV2/6也可根据本发明来使用。复制缺陷重组腺病毒载体(Ad)可以高效价产生并且容易感染许多不同细胞类型。大多数腺病毒载体经工程化以使转基因置换AdE1a、E1b和E3基因;随后使复制缺陷型载体在反式提供缺失基因功能的人293细胞中增殖。Ad载体可在体内转导多种类型的组织,包括非分裂性分化细胞,如见于肝、肾和肌肉组织中的细胞。常规Ad载体具有大的携带能力。Ad载体在临床试验中使用的实例涉及用肌内注射来进行用于抗肿瘤免疫的多核苷酸疗法(Sterman等,Hum.GeneTher.7:1083-9(1998))。用于基因转移的腺病毒载体在临床试验中使用的另外实例包括Rosenecker等,Infection24:15-10(1996);Sterman等,Hum.GeneTher.9:71083-1089(1998);Welsh等,Hum.GeneTher.2:205-18(1995);Alvarez等,Hum.GeneTher.5:597-613(1997);Topf等,GeneTher.5:507-513(1998);Sterman等,Hum.GeneTher.7:1083-1089(1998)。包装细胞用来形成能够感染宿主细胞的病毒颗粒。此类细胞包括293细胞,其包装腺病毒,以及ψ2细胞或PA317细胞,其包装逆转录病毒。用于基因疗法的病毒载体通常由生产细胞系产生,所述细胞系将核酸载体包装至病毒颗粒中。载体通常含有包装并随后整合至宿主中所需要的最小病毒序列(如果可适用),其他病毒序列被编码待表达的蛋白质的表达盒置换。缺失的病毒功能由包装细胞系以反式提供。例如,用于基因疗法的AAV载体通常仅具有包装并整合至宿主基因组中所需的来自AAV基因组的反向末端重复(ITR)序列。病毒DNA在细胞系中包装,所述细胞系含有编码其他AAV基因,即rep和cap的辅助质粒,但是缺乏ITR序列。还用作为辅助病毒的腺病毒来感染细胞系。辅助病毒促进AAV载体的复制以及AAV基因从辅助质粒中的表达。由于缺乏ITR序列,辅助质粒未大量地包装。可通过例如腺病毒比AAV更敏感的热处理来减少受腺病毒的污染。在许多基因治疗应用中,需要基因治疗载体以针对具体组织类型的高度特异性来递送。因此,病毒载体通常被修饰来通过在病毒外表面上以与病毒外壳蛋白的融合蛋白形式表达配体来对给定细胞类型具有特异性。选择具有对已知存在于目标细胞类型上的受体的亲和性的配体。例如,Han等,Proc.Natl.Acad.Sci.USA92:9747-9751(1995)报道可将Moloney小鼠白血病病毒修饰以表达与gp70融合的人调蛋白,并且重组病毒感染表达人表皮生长因子受体的某些人乳腺癌细胞。此原理可扩展至其他病毒-靶细胞对,其中靶细胞表达受体并且病毒表达包含细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可工程化以展示具有实际上任何选定细胞受体的特异性结合亲和力的抗体片段(例如,FAB或Fv)。虽然以上描述主要适用于病毒载体,但是相同原则可应用于非病毒载体。此类载体可经工程化以含有利于被特定靶细胞摄取的特定摄取序列。可通过向个体患者施用,通常通过如下所述的全身施用(例如,静脉内、腹膜内、肌肉内、鞘内、皮下或颅内输注)或局部施用在体内递送基因疗法载体。另选地,可向活体外细胞诸如从个体患者中移植的细胞(例如,淋巴细胞、骨髓穿刺液、组织活检)或万能供血者造血干细胞递送载体,随后,通常在选择已并入载体的细胞后将细胞再植入患者中。用于诊断、研究或基因疗法的活体外细胞转染(例如,通过将转染细胞再次输注到宿主生物中)为本领域技术人员众所周知。在优选实施方案中,将细胞从受试生物中分离,用ZFP、TALE或CRISPR/Cas系统核酸(基因cDNA或mRNA)转染,并且再次输注回至受试生物(例如,患者)中。在优选实施方案中,将一种或多种核酸作为mRNA递送。还优选使用加帽的mRNA以增加翻译效率和/或mRNA稳定性。尤其优选ARCA(抗-反向帽类似物)帽或其变体。参见,美国专利7,074,596和8,153,773,所述专利以引用方式整体并入本文。适用于活体外转染的各种细胞类型为本领域的技术人员众所周知(参见,例如,Freshney等,CultureofAnimalCells,AManualofBasicTechnique(1994年第3版))以及本文引用以讨论如何从患者分离和培养细胞的参考文献)。在一个实施方案中,干细胞用于细胞转染和基因疗法的活体外规程中。使用干细胞的优点是它们可在体外分化成其他细胞类型,或可引入哺乳动物(诸如,细胞供体)中,在所述哺乳动物中它们将被植入骨髓中。已知用于使用细胞因子例如GM-CSF、IFN-γ和TNF-α来使体外CD34+细胞分化成临床上重要的免疫细胞类型的方法(参见,Inaba等,J.Exp.Med.176:1693-1702(1992))。使用已知方法来分离干细胞以进行转导和分化。例如,通过用结合非所需细胞诸如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化的抗原呈递细胞)的抗体淘选骨髓细胞来从骨髓细胞中分离干细胞(参见,Inaba等,J.Exp.Med.176:1693-1702(1992))。已经过修饰的干细胞也可用于一些实施方案中。例如,已产生对细胞凋亡的抗性的神经元干细胞可用作治疗组合物,在所述治疗组合物中干细胞还含有本发明的ZFPTF。例如,可通过在干细胞或半胱天冬酶中破坏的那些干细胞中使用BAX或BAK特异性TALEN或ZFN(参见,美国专利公布No.20100003756),例如再次使用半胱天冬酶-6特异性ZFN敲除BAX或BAK来产生对细胞凋亡的抗性。这些细胞可用已知调控突变体或野生型Htt的ZFPTF或TALETF来转染。也可直接向生物体施用含有治疗性ZFP核酸的载体(例如,逆转录病毒、腺病毒、脂质体等)以进行体内细胞的转导。另选地,可施用裸DNA。施用是通过通常用于将分子引入成与血液或组织细胞的最终接触的任何途径,包括但不限于注射、输注、局部施用和电穿孔。施用此类核酸的适合方法是可用的且为本领域技术人员所熟知,并且虽然一种以上途径可用于施用特定组合物,但是特定途径常常可提供比另一途径更直接且更有效的反应。在某些实施方案中,直接在体内递送如本文所述的组合物(包含融合蛋白、CRISPR/Cas系统和/或修饰的细胞)(例如,多核苷酸和/或蛋白质)。组合物(细胞、多核苷酸和/或蛋白质)可直接向CNS施用(包括但不限于向脑或脊髓直接注射)。可靶向脑的一个或多个区域,包括但不限于海马、黑质、迈内特基底核(nucleusbasalisofMeynert)(NBM)、纹状体和/或皮质。另选地或除CNS递送之外,组合物还可以全身方式递送(例如,静脉内、腹膜内、心脏内、肌内、鞘内、皮下和/或颅内输注)。用于直接向受试者(包括直接向CNS中)递送如本文所述的组合物的方法和组合物包括但不限于通过针头组件进行的直接注射(例如,立体定位注射)。此类方法在例如关于用于向脑部递送组合物的针头组件的美国专利No.7,837,668;8,092,429以及美国专利公布No.20060239966中有所描述,所述专利以引用方式整体并入本文。用于向造血干细胞中引入DNA的方法公开于例如美国专利No.5,928,638中。用于向造血干细胞(例如,CD34+细胞)中引入转基因的载体包括35型腺病毒。药学上可接受的载体部分地通过所施用的具体组合物以及通过用来施用组合物的具体方法来确定。因此,如下所述,存在可用的药物组合物的广泛多种的适合制剂(参见,例如,Remington’sPharmaceuticalSciences,第17版,1989)。用于诊断、研究或基因疗法的活体外细胞转染(例如,通过将转染细胞再次输注到宿主生物中)为本领域技术人员众所周知。在优选实施方案中,将细胞从受试生物中分离,用ZFP核酸(基因或cDNA)转染,并且再次输注回至受试生物(例如,患者)中。适用于活体外转染的各种细胞类型为本领域的技术人员众所周知(参见,例如,Freshney等,CultureofAnimalCells,AManualofBasicTechnique(1994年第3版))以及本文引用以讨论如何从患者分离和培养细胞的参考文献)。如以上所指出,公开的方法和组合物可用于包括但不限于原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞的任何类型的细胞中。用于蛋白质表达的适合细胞系是本领域技术人员已知的,并且包括但不限于COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞诸如草地贪夜蛾(Sf)、任何植物细胞(分化的或未分化的),以及昆虫细胞诸如草地贪夜蛾(Sf)或真菌细胞诸如酵母属,毕赤酵母和裂殖酵母属。在某些实施方案中,细胞系为CHO-K1、MDCK或HEK293细胞系。此外,可将原代细胞分离并且在活体外用于再引入到待治疗的受试者中,随后用基因调节子(例如,ZFN或TALEN)或基因调节子系统(例如,Ttago和/或CRISPR/Cas)进行处理。适合的原代细胞包括外周血单核细胞(PBMC)以及其他血细胞亚类,诸如但不限于CD4+T细胞或CD8+T细胞。适合的细胞还包括干细胞例如像胚胎干细胞、诱导多能干细胞、造血干细胞(CD34+)、神经元干细胞和间充质干细胞。在一个实施方案中,干细胞用于细胞转染和基因疗法的活体外规程中。使用干细胞的优点是它们可在体外分化成其他细胞类型,或可引入哺乳动物(诸如,细胞供体)中,在所述哺乳动物中它们将被植入骨髓中。已知用于使用细胞因子例如GM-CSF、IFN-γ和TNF-α来使体外CD34+细胞分化成临床上重要的免疫细胞类型的方法(参见,Inaba等,J.Exp.Med.176:1693-1702(1992))。使用已知方法来分离干细胞以进行转导和分化。使用已知方法来分离干细胞以进行转导和分化。例如,通过用结合非所需细胞诸如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化的抗原呈递细胞)的抗体淘选骨髓细胞来从骨髓细胞中分离干细胞(参见,Inaba等,J.Exp.Med.176:1693-1702(1992))。已经过修饰的干细胞也可用于一些实施方案中。例如,已产生对细胞凋亡的抗性的干细胞可用作治疗组合物,在所述治疗组合物中干细胞还含有本发明的ZFP、TALE、ZFN、TALEN、CRISPR/Cas系统和/或供体。例如,可通过在干细胞或半胱天冬酶中破坏的那些干细胞中使用BAX或BAK特异性核酸酶(参见,美国专利公布No.2010/0003756),例如再次使用半胱天冬酶-6特异性ZFN敲除BAX或BAK来产生对细胞凋亡的抗性。另选地,对细胞凋亡的抗性还可通过使用如同Z-VAD-FMK(苄氧羰基-缬氨酰-丙氨酰-天门冬氨酰-[O-甲基]-氟甲基酮)的半胱天冬酶抑制剂来实现。也可直接向生物体施用含有治疗性ZFP、TALE、ZFN、TALEN、CRISPR/Cas系统和/或供体核酸的载体(例如,逆转录病毒、腺病毒、脂质体等)以进行体内细胞的转导。另选地,可施用裸DNA或mRNA。施用是通过通常用于将分子引入成与血液或组织细胞的最终接触的任何途径,包括但不限于注射、输注、局部施用和电穿孔。施用此类核酸的适合方法是可用的且为本领域技术人员所熟知,并且虽然一种以上途径可用于施用特定组合物,但是特定途径常常可提供比另一途径更直接且更有效的反应。以下实施例涉及组合物包含锌指转录因子抑制剂(ZFP-TF抑制剂)的本公开的示例性实施方案。应当理解这仅是为了例证的目的,并且可使用其他组合物,例如ZFP-TF激活因子、锌指核酸酶(ZFN)、TALE-TF(激活因子或抑制因子)、TALEN(例如,标准TALEN、Mega-TAL和/或致密TALEN(cTALEN))、CRISPR/Cas系统(转录因子和/或核酸酶系统)、具有工程化的DNA结合结构域的归巢核酸内切酶(大范围核酸酶)和/或天然存在的工程化归巢核酸内切酶(大范围核酸酶)DNA结合结构域与异源切割结构域的融合体和/或大范围核酸酶、锌指和/或TALE蛋白的融合体。此外,仅为了例证的目的,列举了自我调控启动子含有CAG结合蛋白的多个靶标的Htt等位基因的调控,但是应当理解可在表达构建体中使用任何低亲和性靶位点来实施本发明的方法和组合物,从而产生相同的自我调控。实施例实施例1:构建体用可操作地连接到Htt启动子序列(图1A)、CMV启动子(图1B)、CAG重复(7至20个)克隆到TATA盒下游的CMV启动子中的修饰的CMV启动子(图1C,也被称为“自我调控性启动子构建体”或“低亲和性靶位点构建体”)以及具有非编码外显子1(含有充当CAG结合ZFP的低亲和性靶位点的17个CAG重复)的修饰的Htt启动子(图1D)的ZFP编码序列来产生表达Htt结合ZFP的腺相关病毒载体(AAV)、慢病毒(LV)和整合缺陷型慢病毒(IDLV)构建体(Hong等(2002)Science.295(5556):868-72(参见,美国专利公布No.20130253040)以及GFPVenus变体(Nagai等(2002)NatureBiotech.20(1):87-90)。ZFP设计和靶位点示于下表1和2中。ZFP与KOX1的KRAB抑制结构域连接。命名为32528和31809的ZFP结合于Htt的启动子,并且抑制从突变体和野生型Htt等位基因中的转录。将命名为33074、30640和30648的ZFP设计来结合于CAG重复;30648可结合于突变体和野生型Htt等位基因上的CAG重复,并且抑制突变体和野生型Htt等位基因的转录;30640和33074优先地结合扩展的CAG重复,并且选择性地抑制突变体Htt的转录。命名为5475的ZFP是设计来结合于Chk2基因并且不结合于CAG重复的对照ZFP。在表2中,被ZFP识别螺旋接触的靶位点中的核苷酸以大写字母来指示;非接触的核苷酸以小写字母来指示。表1:锌指设计表2:靶位点SBS#靶位点33074agCAGCAGcaGCAGCAgCAGCAGcagca_(SEQIDNO:16)30648agCAGCAGCAGCAGCAGCAGcagcagca-(SEQIDNO:16)30640caGCAGCAGCAGCAGCAgcagcagcagc-(SEQIDNO:17)32528ccGGGACGGGTCCAaGATGGAcggccgc_(SEQIDNO:18)31809acGCTGCGCCGGCSGAGGCGgggccgcg_(SEQIDNO:19)实施例2:Htt和CMV启动子驱动型构建体将HD-神经元用构建体LV-CMV-ZFP-2A-VENUS或LV-Http-ZFP-2A-VENUS感染,并且将细胞在感染后21天收获(图2和3)。此外,将293T细胞用具有不同启动子(CMV或Htt)的IDLV构建体感染(图4),或者用表达质粒转染(图5)。将293T细胞在转导后48小时收获,并且通过流式细胞术(Gauva)来分析GFP/VENUS表达。还进行定量RT-PCR(qRT-PCR)以测量Htt和/或ZFP-2A-VENUS的mRNA表达水平。对于靶向Htt启动子的ZFP(32528),Htt启动子驱动型构建体导致ZFPmRNA表达较低(相比于CMV启动子驱动型构建体,图2),并且因此导致HD神经元中内源性Htt(图3)的抑制较小。对于也靶向Htt启动子的不同ZFP(31809),当相比于CMV启动子驱动型构建体时,Htt启动子驱动型构建体也导致内源性Htt的抑制较小(图4)。通过受转染细胞的平均荧光强度(MFI)(示于图5中)来测量由不同启动子驱动的ZFP-2A-VENUS的表达水平。ZFP30640结合于CAG重复,然而ZFP31089结合于Htt启动子中的非CAG靶位点。对于CMV启动子构建体,30640-2A-VENUS与31809-2A-VENUS的表达水平相似。对于Htt启动子构建体,相比于30640-2A-VENUS,31809-2A-VENUS以较低水平表达,表明ZFP31809通过其在Htt启动子中的靶位点来下调其表达。另一方面,30640-2A-VENUS的表达水平在其从也包含17个CAG重复的Htt启动子中表达时减少,表明ZFP30640通过CAG重复调控其自身表达。实施例3:具有修饰的CMV启动子的自我调控性构建体还评估含有经工程化到CMV启动子构建体(图1C)中的低亲和性靶位点的构建体,在所述构建体中在CMV启动子下游包含不同数量的CAG重复。将293T细胞用1μg(图6A和6B)或3μg(图6B和7)的质粒DNA转染。在转染后2天使用流式细胞术(图6A)和定量PCR分析(图6B)来进行ZFP-2A-VENUS表达水平的分析。在这些实验中,将293T细胞用包含CMV-33074-KOX-FLAG-2A-VENUS载体的DNA质粒转染,在所述CMV-33074-KOX-FLAG-2A-VENUS载体中CMV启动子含有许多(0个与20个之间)CAG重复;ZFP33074结合于CAG重复。示于图6A中的结果证实了ZFP33074的表达自我调控使用存在约15-20个CAG重复的修饰的CMV启动子。图6B示出,当ZFP表达水平高(例如,从3μg转染开始)时,ZFP能够调控其自身从包含较少CAG重复的构建体中的表达。CAG重复自身的存在不减少对照ZFP5475的表达,所述对照ZFP5475不结合于CAG重复。当用不同的CAG结合ZFP(33074、30640或30648)检测修饰的CMV启动子(具有7-20个CAG)时,比起较弱的抑制因子(33074和30640),更有效的抑制因子(30648)需要更少的CAG重复以展现自我调控。参见图7。还将293T细胞用AAV载体(AAV–CMV-CAG(0-20)-ZFP-2A-VENUS)感染。将293T细胞在转导后4天收获,并且通过流式细胞术(图8A)或显微术(图8C)来测量析GFP/VENUS表达。还进行定量PCR(qPCR)以测定ZFP-2A-VENUS的mRNA水平(图8B)。总之,这些结果证实了靶向CAG重复的ZFP可通过经工程化到表达载体的启动子中的靶位点(CAG重复)来调控其自身表达水平;启动子中较长的CAG重复区与ZFP的较低表达相关。还在携带野生型Htt等位基因(“CAG17”)和突变体Htt等位基因(“CAG48”)的HD胚胎干细胞来源的神经元中检测包含作为突变体Htt的等位基因特异性抑制因子的ZFP33074的自我调控性启动子构建体。在MOI高于10,000的AAV感染情况下(参见图9A),从缺乏任何CAG重复(“0”)的启动子中表达的ZFP33074能够部分抑制(多达约50%)野生型Htt等位基因(CAG17);在所有剂量下,突变体Htt等位基因(CAG48)均被抑制约90%或更大。在具有18或20个CAG重复的启动子构建体中,在任何剂量下均未观察到野生型CAG17等位基因的抑制。此外,在含有较长的CAG重复表达构建体的样品中,在低MOI下CAG48等位基因的抑制低于来自具有较短或没有CAG重复的构建体的CAG48等位基因的抑制。使用设计来检测ZFP33074mRNA的qPCR探针集来评估ZFP33074的表达水平(图9B)。表达载体启动子中的较长CAG重复通常与减少的ZFP表达相关。总之,这些实施例显示ZEP可通过经工程化到表达构建体的启动子中的靶位点调控表达,并且自我调控性的程度取决于包含于表达构建体中的结合位点的数量。这些结果还显示了此类自我调控在质粒载体或AAV、LV或IDLV载体的情况下是可行的。本文提到的所有专利、专利申请和专利公布特此以引用方式整体并入。虽然为了清楚理解的目的,已通过说明和实施例详细地提供了公开内容,但是将为本领域技术人员所显而易见的是,可在没有背离本公开精神或范围的情况下实施各种变化和修改。因此,前面的描述和实施例不应理解为限制性的。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1