用于治疗亨廷顿氏病的方法和组合物与流程

文档序号:13083560阅读:2190来源:国知局
相关申请的交叉引用本申请要求2013年11月11日提交的美国临时申请第61/902,704号的权益,通过引用将该申请全文纳入本文。技术领域本申请涉及基因表达和基因组编辑领域。背景亨廷顿氏病(HD),也称为亨廷顿氏舞蹈症,是运动、认知和精神病学障碍的进行性病症。该疾病的平均发病年龄为35-44岁,但在约10%的病例中,其发病出现于21岁之前,并且该疾病的诊断后平均寿命是15-18年。其在西欧血统中的普遍性为每100,000人中约3~7例。亨廷顿氏病是三核苷酸重复扩增病症的示例,其在1990年早期得到首次表征(参见DiProspero和Fischbeck(2005)NatureReviewsGenetics6:756-765)。这些病症涉及三个核苷酸的组的不稳定重复的定位扩增,并且可导致其中存在该重复扩大的基因功能丧失、累积毒性作用,或这两种后果并存。三核苷酸重复可位于基因的任何部分中,包括非编码和编码基因区域。位于编码区内的重复通常涉及重复的谷氨酰胺编码三联体(CAG)或丙氨酸编码三联体(CGA)。非编码序列中的扩大的重复区域可导致该基因的异常表达,而编码区中扩大的重复(也称为密码子重复病症)可造成错误折叠和蛋白质聚集。这一与异常蛋白质相关的病理生理学的额外病因通常是未知的。通常,在经历三核苷酸扩大的野生型基因中,这些区域在正常群体中包含可变数量的重复序列,但在受影响的群体中,重复的数量可从重复数量的两倍增加至其对数量级。在HD中,在大胞浆蛋白亨廷顿蛋白(Htt)的N末端编码区中插入重复。正常Htt等位基因包含15-20个CAG重复,而包含35或更多个重复的等位基因可被视作可能造成HD的等位基因,从而具有发展该疾病的风险。包含36-39个重复的等位基因被视作不完全渗透(incompletelypenetrant),而具有那些等位基因的那些个体可能或可能不发展该疾病(或可能在其生命后期发展症状),而包含40个重复或更多的等位基因被视作完全渗透(completelypenetrant)。事实上,尚未报道含有带有该多次重复的HD等位基因的无症状的人。人们发现,青少年HD发病(<21岁)的那些个体通常具有60或更多个CAG重复。除了CAG重复的增加以外,还已显示HD可涉及重复序列中的+1和+2移码,从而该区域将编码多聚丝氨酸多肽(在+1移码的情况中由AGC重复编码)序列段而非多聚谷氨酰胺(Davies和Rubinsztein(2006)JournalofMedicalGenetics43:893-896)。在HD中,突变Htt等位基因通常以显性性状遗传自一名亲本。如果另一名亲本不患有该病症,则由HD患者生产的任何子女发展该疾病的概率是50%。在一些情况中,亲本可能会具有中间的HD等位基因且无症状,但因重复扩增,其子女会显示该疾病。此外,HD等位基因还可能显示被称为“早发(anticipation)”的现象,其中,在数个世代中观察到愈发增加的严重性或愈发减小的发病年龄,这归因于精子形成过程中重复区域的不稳定性质。此外,Htt中的三核苷酸扩增导致纹状体中的中型多棘γ-氨基丁酸(GABA)投射神经元中的神经元缺失,其还伴随着新皮质中出现的神经元缺失。相比包含P物质且投射至内部苍白球(“直接”通路)的神经元,包含脑啡肽且投射至外部苍白球(所谓的“间接通路”)的中型棘突神经元(MSN)更多地涉及,然而这两种类型的MSN均受影响。HD中的MSN显示转录调节异常,同时伴随其它的异常变化(htt的异常聚集和包合、生物能量学缺陷、神经营养素缺陷、轴突传输紊乱和兴奋性神经毒性(exictotoxicity))。转录组学效应的机制可与下述相关:可溶性DNA结合转录因子活性变化、染色质生物化学与组织的异常,和聚集驱动型核转录因子隔离(参见Runne等(2008)JNeurosci28(39):9723-9731)。亨廷顿氏病患者的受大幅影响的其它脑部区域包括:黑质、皮层3、5和6区、海马的CA1区域、顶叶中的角回、小脑的浦肯野细胞、下丘脑的侧结节核,和丘脑的中央束旁复合体(Walker(2007)Lancet369:218-228)。对于正常Htt蛋白的作用尚不了解,但其可能涉及神经发生、凋亡细胞死亡,和囊泡运输。此外,证据显示野生型Htt刺激脑源性神经营养因子(BDNF),纹状体神经元的促活因子的产生。已显示HD的进展相关于HD小鼠模型中BDNF表达的减少(Zuccato等(2005)PharmacologicalResearch52(2):133-139),并且通过腺相关病毒(AAV)载体介导的基因递送进行的BDNF或神经胶质细胞系源性的神经营养因子(GDNF)的递送可保护HD小鼠模型中的纹状体神经元(Kells等,(2004)MolecularTherapy9(5):682-688)。针对HD的治疗选择目前极为受限。经设计以防止与蛋白质聚集相关的毒性的一些潜在的方法已显示出体外模型中这些毒性的减小,所述蛋白质聚集通过延长的多聚谷氨酰胺序列段发生,例如伴侣蛋白的过表达或采用化合物格尔德霉素的热激响应的诱导。其它治疗靶向疾病的临床表现中的凋亡作用。例如,已通过阻断小鼠配对(其中一个亲本包含HD等位基因而另一个亲本具有显性阴性的胱冬酶1等位基因)的后代中的动物模型中的胱冬酶活性显示疾病症状的减缓。此外,胱冬酶对于突变HDHtt的切割可在该疾病的致病性中起作用。相较于携带非胱冬酶抗性突变Htt等位基因的小鼠,发现携带胱冬酶-6抗性突变Htt的转基因小鼠保持了正常神经元功能,并且没有发展纹状体神经退行性变(参见Graham等(2006)Cell125:1179-1191)。靶向凋亡通路成员的分子也显示具有减缓症状学的作用。例如,化合物zVAD-fmk和二甲胺四环素(其均抑制胱冬酶活性)已显示减缓小鼠中的疾病表现。药物瑞马西胺也已用于小HD人试验,因为认为该化合物能阻止突变Htt与NDMA受体的结合,从而防止对神经细胞发生毒性作用。然而,这些试验中,在神经元功能方面没有统计学显著性的改进。此外,亨廷顿研究组(HuntingtonStudyGroup)采用辅酶Q进行了随机、双盲研究。尽管在采用辅酶Q10治疗的患者中观察到了疾病进展减缓的趋势,总体功能性能力速率降低方面并没有显著变化。(DiProspero和Fischbeck,同上)。美国专利公开文本2011/0082093和20130253040公开了靶向Htt的核酸酶。已描述用于靶向切割基因组DNA的多种方法和组合物。所述靶向切割事件可用于,例如,诱导靶向诱变、诱导细胞DNA序列的靶向缺失,和在预定的染色体基因座处促进靶向重组。参见例如美国专利号8,623,618;8,034,598;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开文本20030232410;20050208489;20050026157;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983和20130177960,以及美国申请号14/278,903,所述文献的公开内容通过引用其全文纳入本文用于所有目的。这些方法通常涉及采用经工程改造的切割系统在靶DNA序列中诱导双链断裂(DSB)或切口,从而对于因错误产生过程所致的断裂的修复(例如非同源末端连接(NHEJ))或采用修复模板(同源定向修复或HDR)的修复能够导致基因的敲出或感兴趣的序列的插入(靶向整合)。该技术还可用于通过利用供体寡核苷酸,在基因组序列中引入位点特异性变化,包括引入基因组区域的特定缺失,或特定点突变或定位变化(也称为基因校正)。切割可通过利用特异性核酸酶(例如,经工程改造的锌指核酸酶(ZFN)、转录活化物样效应物核酸酶(TALEN)),或采用CRISPR/Cas系统(采用经工程改造的crRNA/tracrRNA(‘单一向导RNA’)来引导特异性切割)来产生。此外,靶向的核酸酶基于阿尔古(Argonaute)系统(例如,来自嗜热栖热菌(T.thermophilus),称作‘TtAgo’,参见Swarts等(2014)Nature507(7491):258-261)开发,其也可具有用于基因组编辑和基因治疗的可能性。还开发了经工程改造的融合蛋白用于靶基因的调控表达。所述蛋白质用于,例如,增强或阻遏所需基因的表达(参见例如美国专利号6,534,261;6,607,882;6,824,978;6,933,113;7,013,219;7,220,719;8,268,618;7,985,778;8,586,526;美国专利申请20120294838;所述文献的公开内容通过引用其全文纳入本文用于所有目的)。因此,仍然需要能由这些有前景的技术衍生的,用于治疗和预防亨廷顿氏病的组合物和方法。发明概述本文公开了用于治疗亨廷顿氏病的方法和组合物。具体而言,本文提供用于修饰HDHtt等位基因(例如,调控其表达)从而治疗亨廷顿氏病的方法和组合物。还提供用于产生亨廷顿氏病的动物模型的方法和组合物。因此,一方面,提供经工程改造的(非自然产生的)DNA结合结构域(例如,锌指蛋白、TAL效应物(TALE)蛋白或CRISPR/dCas-TF),其调控HD等位基因(例如,Htt)的表达。经工程改造的锌指蛋白或TALE是非自然产生的锌指或TALE蛋白,其DNA结合结构域(例如,识别螺旋或RVD)已被改变(例如,通过选择和/或合理设计)以结合至预选择的靶位点。本文所述的任何锌指蛋白均可包括1、2、3、4、5、6或更多个锌指,各锌指具有与选定序列(例如,基因)中的亚靶位点(targetsubsite)结合的识别螺旋。类似地,本文所述的任何TALE蛋白均可包含任何数量的TALERVD。在一些实施方式中,至少一个RVD具有非特异性DNA结合。在一些实施方式中,至少一个识别螺旋(或RVD)是非自然产生的。在某些实施方式中,锌指蛋白具有表1A和1B中所示的识别螺旋。在其它实施方式中,锌指蛋白结合至表2A和2B中所示的靶序列。在一些实施方式中,锌指蛋白包含表2C中的识别螺旋。在某些实施方式中,锌指蛋白被配制于药物组合物中,例如,用于给予对象。还提供经工程改造的(非自然产生)CRISPR/Cas系统,其调控HD等位基因(例如Htt)的表达。Cas9核酸酶结构域可以经特定的工程改造以损失DNA切割活性(“dCAS”),并且融合至能够调控基因表达的功能结构域(参见Perez-Pimera(2013)NatMethod10(10):973-976),以产生dCas-TF。当dCas-TF伴随Htt特异性向导RNA提供时,所述系统调控Htt基因表达。一方面中,提供阻遏物(ZFP-TF、CRISPR/dCas-TF或TALE-TF),其完全或部分地结合至Htt的CAG重复区域外的序列。在另一个方面,提供ZFP、Cas或TALE阻遏物(ZFP-TF、CRISPR/dCas-TF或TALE-TF),其结合至Htt的CAG重复区域内的序列。在一些实施方式中,这些ZFP-TF、CRISPR/dCas或TALE-TF优先结合至关于野生型长度的重复序列段扩大的三核苷酸序列段(tract),由此实现对于扩大的等位基因的优先阻遏。在一些实施方式中,这些ZFP-TF、CRISPR/dCas-TF或TALE-TF包括蛋白质相互作用结构域(或“二聚结构域”),其在结合至DNA时允许多聚化。在一些实施方式中,这些ZFP-TF、CRISPR/dCas-TF或TALETF实现与重复序列的合作DNA结合,从而相比野生型等位基因,扩大的等位基因通过大量ZFP、dCas或TALE蛋白得以更高效地结合,允许对于突变型等位基因的优先阻遏。这些合作结合性ZFP-TF、CRISPR/dCas-TF或TALETF可以另包含或可以不另包含在结合至DNA时允许多聚化的蛋白质相互作用结构域。在一些实施方式中,ZFPTF、CRISPR/dCas-TF或TALETF形成给定大小的多聚体的稳定的复合体,因此能够优先与大于某一最小尺寸的CAG序列段相互作用,其中该最小尺寸大于野生型CAG序列段的长度。在某些实施方式中,本文所述的ZFP、CRISPR/dCas-TF或TALE蛋白(例如,双手的(two-handed),多聚化等)优先修饰突变Htt等位基因的表达。在一些实施方式中,ZFP、CRISPR/dCas-TF或TALE特异性地结合至突变Htt等位基因,其中扩大的序列段编码多聚谷氨酰胺,而在其它实施方式中,ZFP、CRISPR/dCas-TF或TALE特异性地结合至突变Htt等位基因,其中扩增序列段编码多聚丝氨酸。因此,在一些实施方式中,ZFP-TF、CRISPR/dCas-TF或TALE-TF调控野生型和突变形式的Htt等位基因。在某些实施方式中,ZFP、CRISPR/dCas-TF或TALE仅调控野生型Htt等位基因。在其它实施方式中,ZFP、CRISPR/dCas-TF或TALE仅调控突变形式的Htt。在其它实施方式中,提供对ZFP-TF、CRISPR/dCas-TF或TALE-TF的阻遏,其优先结合至与扩大的HDHtt等位基因相关联的已知的SNP。由此,ZFP-TF、CRISPR/dCas-TF或TALE-TF对于突变Htt等位基因具有特异性,其包含SNP,允许对于突变Htt等位基因的特异性阻遏。在另一个方面,提供通过与野生型等位基因相关的SNP相互作用来特异性活化野生型Htt等位基因的ZFP-TF、CRISPR/dCas-TF或TALE-TF。由此,仅野生型Htt等位基因被活化。在某些实施方式中,本文所述的锌指蛋白(ZFP)、dCas或TALE蛋白可位于操作性连接(operativelinkage)中,其具有作为融合蛋白的部分的调节结构域(或功能结构域)。所述功能结构域可以是,例如,转录活化结构域、转录阻遏结构域和/或核酸酶(切割)结构域。通过选择用于与ZFP、dCas或TALE融合的活化结构域或阻遏结构域,所述融合蛋白可用于活化或阻遏基因表达。在一些实施方式中,提供一种融合蛋白,其包含靶向本文所述的突变Htt的、与转录阻遏结构域融合的ZFP、dCas或TALE,所述转录阻遏结构域可用于下调突变Htt表达。在一些实施方式中,提供一种融合蛋白,其包含靶向野生型Htt等位基因的、与转录活化结构域融合的ZFP、dCas或TALE,所述转录活化结构域能上调野生型Htt等位基因。在某些实施方式中,调节结构域的活性通过外源小分子或配体调节,从而与细胞的转录器的相互作用不会在不存在外源配体的情况下发生。该外部配体控制ZFP-TF、CRISPR/dCas-TF或TALE-TF与转录器的相互作用的程度。调节结构域可操作性地连接至ZFP.dCas或TALE中一种或多种的任何部分,包括一个或多个ZFP、dCas或TALE之间,一个或多个ZFP、dCas或TALE外部及其任何组合。本文所述的任何融合蛋白均可配制成药物组合物。在一些实施方式中,本文所述的经工程改造的DNA结合结构域可位于操作性连接中,其具有作为融合蛋白部分的核酸酶(切割)结构域。在一些实施方式中,所述核酸酶包括Ttago核酸酶。在其它实施方式中,核酸酶系统,例如CRISPR/Cas系统可联合特定单一向导RNA使用,以将该核酸酶靶向至DNA中的靶位置。在某些实施方式中,所述核酸酶与核酸酶融合物可用于靶向干细胞中的突变Htt等位基因,所述干细胞例如,诱导型多潜能干细胞(iPSC)、人胚胎干细胞(hESC)、间充质干细胞(MSC)或神经元干细胞,其中,核酸酶融合物的活性将导致包含野生型数量的CAG重复的Htt等位基因。在某些实施方式中,提供包含所述经修饰的干细胞的药物组合物。而在另一个方面中,提供编码本文所述的任何DNA结合蛋白的多核苷酸。在另一个方面,提供编码CRIPSR/Cas核酸酶和单一向导RNA的多核苷酸。可向希望治疗亨廷顿氏病的对象给予所述多核苷酸。在另一方面,本发明提供用于生成研究亨廷顿氏病的特定模型系统的方法和组合物。在某些实施方式中,本文提供模型,其中突变Htt等位基因采用胚胎干细胞产生以生成这样的细胞和动物品系:其中利用锌指核酸酶(ZFN)、TALE-核酸酶(TALEN)、Ttago或CRISPR/Cas核酸酶驱动的靶向整合将特定长度的(例如,50、80、109和180个CAG重复)三核苷酸扩增序列段插入野生型Htt等位基因。在某些实施方式中,所述模型系统包含体外细胞系,而在其它实施方式中,所述模型系统包含转基因动物。在本文所述的任何动物模型中,所述动物可以是,例如,啮齿类(例如,大鼠、小鼠)、灵长类(例如,非人灵长类)或兔。因此,本发明还包括细胞或细胞系,其中与HD相关的内源性基因是经修饰的,例如与该细胞中的基因的野生型序列相比。所述细胞或细胞系可以就修饰而言是杂合或纯合的。所述修饰可包含插入、缺失和/或其组合。在某些实施方式中,所述基因(例如,Htt)通过核酸酶(例如,ZFN、TALEN、CRISPR/Cas系统、Ttago系统等)修饰。在某些实施方式中,所述修饰在核酸酶结合和/或切割位点处或附近,例如,在切割位点的上游活下由的1-300(或其间的任何值)个碱基对内,更优选在所述结合和/或切割位点的每侧1-100个碱基对(或其间的任何值)内,甚至更优选在所述结合和/或切割位点每侧的1-50个碱基对(或其间的任何值)内。在其它方面中,本发明包括将供体核酸递送至靶细胞。所述供体可在编码核酸酶的核酸之前、之后或与其一同递送。所述供体核酸可包含待整合至细胞的基因组(例如,内源基因座)中的外源序列(转基因)。在一些实施方式中,所述供体可包含全长基因或其片段,其侧接有与所述靶向切割位点具有同源性的区域。在一些实施方式中,所述供体缺乏同源区域,并且通过同源独立机制(即NHEJ)被整合进入靶基因座。所述供体可包含任何核酸序列,例如某一核酸,其在用作核酸酶诱导的双链断裂的同源导向修复的底物时,导致待在内源染色体基因座处产生的供体特异性缺失,或者(或此外),导致待生成的内源基因座的新型等位基因形式(例如,去除转录因子结合位点的点突变)。在一些方面中,所述供体核酸是寡核苷酸,其中整合导致基因校正事件,或靶向缺失。在一些实施方式中,编码DNA结合蛋白的多核苷酸是mRNA。在一些方面中,该mRNA可经化学修饰(参见例如Kormann等,(2011)NatureBiotechnology29(2):154-157)。在其它方面中,该mRNA可包含ARCA帽(参见美国专利7,074,596和8,153,773)。在其它实施方式中,该mRNA可包含未经修饰的和经修饰的核苷酸的组合(参见美国专利公开2012-0195936)。而在另一个方面中,提供包含本文所述的任何多核苷酸的任何基因递送载体。在某些实施方式中,所述载体是腺病毒载体(例如,Ad5/F35载体)、慢病毒载体(LV),包括整合活性或整合缺陷型慢病毒载体,或腺病毒相关的病毒载体(AAV)。在某些实施方式中,AAV载体是AAV6载体。因此,本文还提供腺病毒(Ad)载体、LV或腺病毒相关的病毒载体(AAV),其包含编码至少一种核酸酶(ZFN或TALEN)的序列和/或用于靶基因内的靶向整合的供体序列。在某些实施方式中,Ad载体是嵌合Ad载体,例如Ad5/F35载体。在某些实施方式中,慢病毒载体是整合酶缺陷型慢病毒载体(IDLV)或整合活性慢病毒载体。在某些实施方式中,所述载体是具有VSV-G包膜,或具有其它包膜的假型化载体。在一些实施方式中,提供用于亨廷顿氏病的模型系统,其中靶等位基因(例如,突变Htt)带有表达标志物标签。在某些实施方式中,突变型等位基因(例如,突变Htt)带标签。在一些实施方式中,野生型等位基因(例如,野生型Htt)带标签,并且其它实施方式中,野生型和突变型等位基因带有分开的表达标志物的标签。在某些实施方式中,该模型系统包含体外细胞系,而在其它实施方式中,该模型系统包含转基因动物。此外,还提供包含所述核酸和/或蛋白质(例如,含有ZFP、Cas或TALE的ZFP、Cas或TALE或融合蛋白)的药物组合物。例如,某些组合物包含含有编码本文所述的ZFP、Cas或TALE之一的序列的核酸,所述序列操作性地连接至调节序列,还包含药学上可接受的运载体或稀释剂,其中所述调节序列允许该核酸在细胞中表达。在某些实施方式中,编码的ZFP、CRISPR/Cas或TALE对HDHtt等位基因具有特异性。在一些实施方式中,药物组合物包含调控HDHtt等位基因的ZFP、CRISPR/Cas或TALE和调控神经营养因子的ZFP、CRISPR/Cas或TALE。基于蛋白质的组合物包括一种或多种ZFP。本文公开的CRISPR/Cas或TALE和药学上可接受的运载体或稀释剂。而在另一个方面中还提供分离的细胞,其包含本文所述的任何蛋白质、多核苷酸和/或组合物。在另一个方面,本文提供采用本文所述的方法和组合物治疗和/或预防亨廷顿氏病的方法。在一些实施方式中,所述方法涉及其中多核苷酸和/或蛋白质可采用病毒载体、非病毒载体(例如,质粒)和/或其组合递送的组合物。在一些实施方式中,所述方法涉及包含干细胞群体的组合物,所述干细胞群体包含ZFP或TALE,或用本发明的ZFN、TALEN、Ttago或CRISPR/Cas核酸酶系统改变。在一些实施方式中,本发明的方法和组合物用于对中型多棘神经元中某些基因的表达进行标准化和/或修饰。例如,在一些实施方式中,所述方法涉及利用,和/或所述组合物是,改变HD相关的一种或多种生物标志物的表达的遗传阻遏物,所述生物标志物包括但不限于DARPP-32A、PDE10a、Drd1和/或Drd2,用于患有亨廷顿氏病的对象的治疗或预防。在一些实施方式中,所述遗传阻遏物是抑制亨廷顿蛋白的表达的小分子、核酸或蛋白质。在一些实施方式中,所述遗传阻遏物特异性地结合至亨廷顿基因(其基因组DNA形式或转录本形式,例如mRNA)。在一些实施方式中,所述遗传阻遏物是外源的和/或包含天然情况下不存在的化学修饰和/或序列修饰。在某些实施方式中,所述遗传阻遏物是相对于与基因组的其它基因结合而言,特异性结合至亨廷顿基因的编码和/或非编码部分的ZFP、TALE或CasDNA结合结构域。在某些其它实施方式中,所述遗传阻遏物是包含如下序列的反义核酸,所述序列和与亨廷顿基因的转录本形式(例如mRNA)的编码和/或非编码部分互补的序列100%,或至少90%,或至少80%,或至少70%,或至少60%相同。遗传阻遏物特异性结合的亨廷顿基因的部分的长度可以是至少8,至少10,至少12,至少15,至少18,至少20,至少22,至少25,至少30,至少35,和/或至少40个核苷酸或更多。在本文所述的一些实施方式中,采用遗传阻遏物,例如用于治疗对象或用于测试遗传阻遏物,可导致相对于未处理的对照,DARPP-32A、PDE10a、Drd1和/或Drd2中一种或多种的表达增加。未处理的对照不接受遗传阻遏物,例如,未处理的对象或未处理的对照细胞,例如MSN。在一些方面中,相对于未处理的对照(例如,未处理的对象或未处理的MSN细胞),MSN中的DARPP-22的表达增加(例如,增加10%或更多,增加20%或更多,增加30%或更多,增加40%或更多,增加50%或更多,增加60%或更多,增加70%或更多,增加80%或更多,增加90%或更多,增加100%或更多,增加125%或更多,增加150%或更多,增加175%或更多,和/或增加200%或更多,或其间的任何值)。在其它方面中,相对于未处理的对照(例如,未处理的对象或未处理的MSN细胞),MSN中的PDE10a水平增加(例如,增加10%或更多,增加20%或更多,增加30%或更多,增加40%或更多,增加50%或更多,增加60%或更多,增加70%或更多,增加80%或更多,增加90%或更多,增加100%或更多,增加125%或更多,增加150%或更多,增加175%或更多,和/或增加200%或更多,或其间的任何值)。而在其它方面中,相对于未处理的对照(例如,未处理的对象或未处理的MSN细胞),MSN中的多巴胺受体Drd1和/或Drd2水平增加(例如,增加10%或更多,增加20%或更多,增加30%或更多,增加40%或更多,增加50%或更多,增加60%或更多,增加70%或更多,增加80%或更多,增加90%或更多,增加100%或更多,增加125%或更多,增加150%或更多,增加175%或更多,和/或增加200%或更多,或其间的任何值)。在一些方面中,DARPP-32A、PDE10a、Drd1和Drd2的任何组合的水平增加,例如,两种或更多种是增加的,其中所述两种可以是DARP32A和PDE10a,或DARP32A和Drd1或任何此类组合。在其它方面中,相对于未处理的对照(例如,未处理的对象或未处理的MSN细胞),DARPP-32A、PDE10a、Drd1和Drd2中的任何三种的水平是增加的,而在其它方面中,DARPP-32A、PDE10a、Drd1和Drd2的水平均增加。在一些实施方式中,采用本发明的方法和组合物来使患有HD的对象(例如,动物模型)中的握抱(clasping)行为标准化。例如,在一些方面中,所述遗传阻遏物,例如用于治疗对象或用于测试遗传阻遏物的应用,可导致经处理对象或动物模型中减少的握抱(相对于未处理的对照)。在一些方面中,所述模型是HDR6/2小鼠模型。在一些方面中,握抱行为减少10%或更多,减少20%或更多,减少30%或更多,减少40%或更多,减少50%或更多,减少60%或更多,减少70%或更多,减少80%或更多,减少90%或更多,或减少100%或更多,或其间的任何值。在一些方面中,握抱的减少可在动物出生7周内,8周内,9周内,10周内,11周,或12周内和/或用所述遗传阻遏物处理2周内,3周内,4周内,5周内,6周或7周内测试动物的30秒之内观察到。基于本公开内容整体,这些和其它方面对于本领域技术人员而言将是显而易见的。附图的简要说明图1A-1E的示意图说明野生型和突变(亨廷顿氏病,HD)亨廷顿(Htt)等位基因和与那些等位基因结合的多种ZFP-TF。图1A显示结合CAG重复外部的ZFP设计,因此预期其等同地结合至野生型等位基因和突变(HD)等位基因。“KRAB”指的是来自KOX1基因的KRAB阻遏结构域,而“ZFP”指的是锌指DNA结合蛋白。“标准ZFPTF”是ZFP转录因子融合蛋白,其中锌指DNA结合结构域连接至KRAB阻遏结构域。图1B显示设计以结合CAG区内部的ZFP-TF。图1C说明“双手的ZFPTF”,其为ZFP转录因子,其中锌指结构域的两个簇由刚性蛋白质序列分开。该图中显示功能性(阻遏)结构域在一个ZFP的外部,但显然该功能结构域可位于ZFP之间,或蛋白质任一端的ZFP的外部。图1D说明“多聚化ZFPTF”,其为能够通过多聚结构域(显示为有斑点的方框)多聚化的ZFPTF。图1E说明ZFP-ZFP-KRAB构造,其中两个锌指DNA结合结构域通过柔性接头连接,同时也融合至KRAB结构域。本领域技术人员应明了,在所有融合蛋白中,功能结构域可以在DNA结合结构域任一端,并且DNA结合结构域可包含宽范围数量的锌指。图1还显示,带有黑色菱形的方框是功能结构域(例如,活化,阻遏,切割结构域)。本领域技术人员应明了,图中所示的示例性模型也可应用至TALETF。图2A-2E说明采用不结合至CAG重复序列的ZFPTF,Htt的两个等位基因被图1A所示的ZFP阻遏。表1A和1B所示的ZFP的鉴定数在柱下方显示。图2A说明采用靶向人基因中的5个基因座的ZFP阻遏HEK293细胞中的人Htt等位基因。显示人Htt基因的图,以及ZFP结合位点的位置。对于各ZFP组,各柱代表独立转染。图2B说明显示HEK293细胞中的Htt蛋白质水平的Western印迹,其中该HEK293细胞用GFP对照或18856ZFPTF阻遏物(包含KOX1的KRAB阻遏结构域)转染,其中NFκBp65水平(“p65”)用于确认相等的蛋白质上样。Western印迹证实ZFP-TF阻遏Htt表达。图2C说明对于小鼠Htt特异性ZFP在Neuro2A细胞中的一组与图2A类似的数据。图2A中,显示小鼠Htt基因的图,并且指示ZFP结合位点的位置。图2D和2E说明永生化的纹状体细胞中阻遏了小鼠Htt基因表达(RNA),其中采用不同剂量的ZFP-TFmRNA转染。在除了图2B的所有情况中,HttmRNA水平通过实时RT-PCR检测并针对肌动蛋白mRNA的那些进行标准化。图3A-3G说明通过采用CAG重复区域内的ZFP结合对突变Htt的选择性阻遏,如图1B所示。该模型显示,突变型等位基因中的较长CAG重复区域允许CAG-靶向的ZFP阻遏物分子的增加的结合。图3A说明HEK293细胞中CAG-靶向的ZFP对于内源Htt基因(具有正常CAG重复长度)的不同的阻遏物活性。图3B显示Htt启动子/外显子1片段(包含不同长度的CAG重复(10-47个CAG重复))对荧光素酶报告物的阻遏。CAG10(各两个指示条件的最左柱)显示采用10个CAG重复的结果;CAG17(各两个指示条件从左数第二柱)显示采用17个CAG重复的结果;CAG23(各两个指示条件从右数第二柱)显示采用23个CAG重复的结果;且CAG47(各两个指示条件的最右柱)显示采用47个CAG重复的结果。图上方的示意说明该系统中所用的Htt启动子、外显子1、CAG重复和报告物荧光素酶基因的排列。数据显示CAG数量的增加会导致通过CAG-靶向的ZFP所致的来自Htt启动子的表达减少。此外,图3C显示,对于所有测试的剂量,尽管相对弱的CAG-靶向的ZFP不阻遏包含常规长度CAG重复和强CAG阻遏物的荧光素酶报告物,其驱动与强CAG-靶向的ZFP类似的对于包含扩大的CAG重复的荧光素酶报告物的阻遏。“pRL-Htt-CAG23-内含子1”(各对左柱)对应于来自野生型等位基因的表达,而“pRL-HttCAG47-内含子1”(各对右柱)对应于来自突变扩大的Htt等位基因(包含47个CAG重复)的表达。图3D说明源自HdH(Q111/Q7)敲入小鼠的永生化的小鼠纹状体细胞中,CAG-靶向的ZFP对突变Htt(111CAG)的阻遏。各对左柱显示野生型表达,而各对右柱显示敲入表达。在转染中采用不同浓度的ZFPmRNA测试了包含融合至KRAB阻遏结构域的特定ZFP的ZFP-TF。图3E说明HD患者源性的成纤维细胞系(CAG15/70)中CAG-靶向的ZFP的突变Htt阻遏。该成纤维细胞系中,野生型Htt等位基因包含15个CAG重复(“099T(CAG15)”,各指示条件中的中间柱),并且突变型扩大的Htt等位基因包含70个CAG重复(“099C(CAG70)”,各指示条件的右柱)。图3F显示4个不同的HD患者源性的成纤维细胞细胞系中,突变Htt表达的选择性阻遏。各组上方的数量指示野生型Htt等位基因(例如15或18)和突变型等位基因(例如70,67,45和44)上的CAG重复的数量;其中测试了两种不同剂量的ZFPmRNA。各对的左柱显示野生型Htt表达,且各右柱显示突变Htt的表达。图3G说明ZFP-TF30640、32528和30657存在下Western印迹分析检测的HD源性的患者成纤维细胞的Htt表达。较慢的迁移的蛋白质条带是通过扩大的突变Htt等位基因产生的那些。32528结合至Htt转录起始位点(TSS),因此抑制来自两个等位基因的表达,而30640和30657结合至CAG重复(CAG)。图4A和4B说明靶向至CAG重复的一组ZFP对HD患者源性的成纤维细胞系中突变Htt的阻遏。采用0.1ng-3μg范围的RNA浓度。在图4A和4B中,各指示条件的左柱显示总Htt表达,中间柱显示成纤维细胞中Htt的表达,其中Htt等位基因包含18个CAG重复(“099T(CAG18)”并且突变扩大的Htt等位基因包含45个CAG重复099T(CAG45。图5显示CAG-靶向的ZFP阻遏物对于HD患者源性的成纤维细胞中Htt和其它含CAG的基因的表达的作用。各指示条件下的左柱显示采用30640的结果;各指示条件下的中间柱显示采用30675的结果;且右柱显示模拟转染。图6A和6B说明测试三种CAG-靶向的ZFP的基因组范围特异性的实验。图6A说明采用30640、30645或33074在六个生物重复(六个分开的转染)HD成纤维细胞(CAG18(中间柱)/CAG45,右柱)上进行的Htt阻遏的qPCR分析。然后,通过qPCR选择四个最为类似的重复用于微阵列分析,数据示于图6B。图7说明CAG17/69神经元干细胞(NSC)中的Htt阻遏。细胞用指示剂量的ZFPmRNA转染。各指示剂量下的左柱显示CAG17细胞的结果,中间柱显示野生型细胞的结果,右柱显示CAG69细胞的结果。图8说明从用ZFPTF处理的HD胚胎干细胞(ESC)(CAG17/48)分化的神经元中的Htt表达。细胞用指示剂量的ZFPmRNA转染。图9说明在用ZFPTF30640处理后,R6/2小鼠中的突变Htt转基因表达的阻遏。图10A-10D说明具有特异性靶向扩大的CAG重复(如图1D所示)的多聚结构域的ZFP。图10A显示具有如下四个组分的单一ZFP:(i)KOX阻遏物结构域(椭圆形标记的“阻遏物”);(ii)结合至(CAG)N或该序列的变换形式的2-6个指的阵列(显示两个,小椭圆形标记的“Z”);和(iii)两个二聚结构域(矩形标记的“d1”和“d2”),其以反平行构造相互作用。这些结构域允许ZFP在CAG序列段的大沟中聚合。图10B显示3个ZFP的多聚体的结合事件的草图。应明了,可采用任何数量的多聚体,并且功能结构域可位于一个或多个个体ZFP上的任何位置,并且这些图也可应用至TALE-TF。图10C显示经设计以通过二聚化锌指(DZ)之间的相互作用多聚化的四种ZFP单体支架的蛋白质序列。支架称为DZ1(SEQIDNO:180)、DZ2(SEQIDNO:181)、DZ3(SEQIDNO:182)和DZ4(SEQIDNO:183)。二聚化锌指结构域带下划线,而阻遏结构域和核定位序列由粗体下划线和斜体(分别)表示。图10D显示经设计以通过卷曲螺旋(CC)之间的相互作用多聚化的七种ZFP单体支架的蛋白质序列。支架称为CC1(SEQIDNO:184)、CC2(SEQIDNO:185)、CC3(SEQIDNO:186)、CC4(SEQIDNO:187)、CC5(SEQIDNO:188)、CC6(SEQIDNO:189)和CC7(SEQIDNO:190)。卷曲螺旋序列带下划线,而阻遏结构域和核定位序列由粗体下划线和斜体(分别)表示。各支架的ZFP区域的位置(各设计彼此有所不同)以“[ZFP]”指示。各支架的(DNA结合)ZFP区域(各设计彼此有所不同)的位置以“[ZFP]”指示。图11A和11B说明具有二聚结构域的ZFP-TF的活性。在图11A中,具有“卷曲螺旋”(CC)结构域的ZFP-TF用荧光素酶报告物测试。pRL-HttCAG17(各对左柱)表示由具有17个CAG的人Htt启动子/外显子1片段控制的海肾荧光素酶报告物;pGL3-Htt-CAG47(各对右柱)表示由具有47个CAG重复的人Htt启动子/外显子1片段控制的萤火虫荧光素酶报告物。关于不同的二聚结构域的描述参见实施例10的内容。图11B中,具有二聚化锌指“DZ”结构域的ZFP用相同的荧光素酶报告物测试,并且采用一些ZFP-TF二聚结构域显示增加的阻遏。各对左柱指示来自17个CAG重复Htt等位基因的表达,而右柱指示来自47个CAG重复Htt等位基因的表达。图12A和12B说明ZFP-ZFP-KOX蛋白质对Htt的阻遏。图12A说明单一33088和33084ZFP-TF对Htt的阻遏,并且33088-33088和33088-33084ZFP-ZFP-KOX蛋白质在野生型(左柱)、CAG18(中间柱)和CAG45(右柱)(图12A)HD成纤维细胞中的阻遏;图12B说明33088-33088和33088-33084ZFP-ZFP-KOX在野生型(左柱)、CAG20(中间柱)和CAG41(左柱)HD成纤维细胞中的Htt阻遏。图13A-13E说明小鼠Htt的活化。图13A显示采用融合至p65活化结构域的ZFP的ZFP-TF驱动的Neuro2A细胞中小鼠Htt基因的RNA水平的上调。双重柱指示重复转染。图13B说明Western印迹,证明ZFP驱动的增加的Htt蛋白质生成。图13C说明野生型小鼠Htt等位基因和“敲入”Htt等位基因,其中小鼠序列(外显子1的大部分和内含子1的部分,野生型等位基因示意图上方)已被具有CAG扩大的对应的人序列(敲入等位基因示意图上方)替代。图13D说明用对应的人序列(SEQIDNO:192)替代的小鼠序列(SEQIDNO:191)之间的比对,从而敲入等位基因具有充分的序列散度以允许ZFP(在A和B中显示)经设计以特异性地结合小鼠序列。图13E说明野生型小鼠Htt等位基因在源自HdhQ111/Q7敲入小鼠的永生化的纹状体细胞中的特异性活化。左柱显示野生型细胞中的结果,而右柱显示敲入突变型等位基因细胞中的结果。图14A和14B说明用Htt特异性ZFN对处理K562细胞之后,Cel-I错配试验(SurveyorTM,转基因组)的结果。在对应的泳道底部显示有活性的ZFN的NHEJ活性(in-del)百分比。“GFP”指示已用GFP编码质粒转染的细胞。图14A说明较早切割Htt外显子的ZFN的结果,而图14B说明在终止密码子附近切割的ZFN的结果。也观察失活ZFN对(泳道未标注in-del百分比)。图15说明数种候选TALE-TF蛋白的Htt阻遏结果。在HD患者源性的成纤维细胞(CAG20/41)中测试TALE-TF。结果显示,TALETF中的一些在阻遏总体Htt表达方面具有活性,而其它的则显示突变Htt-优先阻遏。图16说明显示握抱行为(Mangiarini等(1996)Cell87:493-605)的两张照片。该测试涉及由其尾部收取测试小鼠,其中由观察者将其温和地向后和向前以平滑运动运动方式拖拽,直至该动物在表面上方约12英寸处悬挂。然后,在30秒时间内对动物评分。如右侧照片显示,HD小鼠具有‘握抱行为’,而左侧的照片显示正常对照小鼠表现出更舒展的行为。图17是HD(R6/2)小鼠模型的握抱行为的图表。小鼠悬挂30秒并记录该时程中握抱行为的类型和长度。可观察到,ZFP处理的小鼠在12周期间所有时间点显示握抱行为的减少。图18是源自用ZFP处理的R6/2小鼠的脑的中型多棘神经元的四种生物标志物的表达变化的图表。分析的四种生物标志物,DARPP-32、PDE10a、DRD1和DRD2,均显示相对于用GFP表达载体处理的R6/2小鼠的脑的信号的增加。发明详述本文公开了用于治疗亨廷顿氏病(HD)的组合物和方法。具体而言,提供包含锌指蛋白(ZFPTF)或TALE(TALE-TF)的Htt-调控性转录因子和采用所述蛋白质的方法,用于治疗或预防亨廷顿氏病。例如,提供阻遏突变Htt等位基因的表达或使野生型Htt等位基因的表达活化的ZFP-TF或TALE-TF。此外,提供修饰HD相关基因的基因组结构的锌指核酸酶(ZFN)、TALE核酸酶(TALEN)、Ttago系统或CRISPR/Cas核酸酶系统。例如,能够特异性改变Htt的突变形式的部分的ZFN、TALEN或CRISPR/Cas核酸酶系统。这些包括采用经工程改造的锌指蛋白或经工程改造的TALE蛋白,即,结合至预定的核酸靶序列的非自然产生的蛋白质,的组合物和方法。因此,本文所述的方法和组合物提供用于治疗和预防亨廷顿氏病的方法,并且,这些方法和组合物可包含能够调控靶基因的锌指转录因子或TALE转录因子,以及经工程改造的锌指和TALE核酸酶、Ttago和CRISPR/Cas核酸酶系统,其能够修饰或编辑Htt。概述除非另有说明,本方法的实施以及本文所述组合物的制备与应用采用本领域技术范围内的分子生物学、生物化学、染色质结构与分析、计算化学、细胞培养、重组DNA与相关领域的常规技术。这些技术在文献中已有充分描述。参见例如,Sambrook等,MOLECULARCLONING:ALABORATORYMANUAL(《分子克隆:实验室手册》)第2版,冷泉港实验室出版社(ColdSpringHarborLaboratoryPress),1989以及第3版,2001;Ausubel等,CURRENT方案INMOLECULARBIOLOGY(《新编分子生物学实验指南》),纽约约翰韦利父子公司(JohnWiley&Sons,NewYork)1987及定期更新;METHODSINENZYMOLOGY(《酶学方法》)丛书,圣迭戈学术出版社(AcademicPress,SanDiego);Wolffe,CHROMATINSTRUCTUREANDFUNCTION(《染色质结构与功能》),第3版,学术出版社,圣迭戈,1998;METHODSINENZYMOLOGY(《酶学方法》),第304卷,“Chromatin(染色质)”(P.M.Wassarman和A.P.Wolffe编),学术出版社,圣迭戈,1999;和METHODSINMOLECULARBIOLOGY(《分子生物学方法》),第119卷,“Chromatin方案(染色质方法)”(P.B.Becker编),托托瓦的休玛纳出版社(HumanaPress,Totowa),1999。定义术语\核酸\,\多核苷酸\和\寡核苷酸\互换使用并指脱氧核糖核苷酸或核糖核甘酸聚合物,可以是直链或环状构型的,是单链或双链形式的。出于本公开目的,这些术语不意在限制聚合物的长度。所述术语可涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫逐磷酸酯主链)经修饰的核苷酸。一般而言,具体核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T碱基配对。互换使用的术语“多肽”、“肽”和“蛋白质”指氨基酸残基的聚合物。该术语还应用于其中一种或多种氨基酸是对应的自然产生的氨基酸的化学类似物或经修饰的衍生物的氨基酸聚合物。\结合\指大分子之间(例如蛋白与核酸之间)的序列特异性、非共价相互作用。只要相互作用作为整体为序列特异性,不要求结合相互作用的所有组分都是序列特异性(例如,与DNA主链中的磷酸残基接触)。这样的相互作用通常表征为解离常数(Kd)是10-6M-1或更低。“亲合力”指结合的强度:提高的结合亲合力与较低的Kd关联。\结合蛋白\是能与另一分子非共价结合的蛋白质。结合蛋白能够结合至,例如,DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。在蛋白质结合蛋白的情况中,其可与自身结合(形成同型二聚体、同型三聚体等)和/或其可与一种或多种不同蛋白的一个或多个分子结合。结合蛋白可具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合,RNA结合和蛋白结合活性。\锌指DNA结合蛋白\(或结合结构域)是能以序列特异性方式通过一个或多个锌指结合DNA的蛋白质或较大蛋白质内的结构域,锌指是通过锌离子配位稳定其结构的结合结构域内氨基酸序列的区域。术语锌指DNA结合蛋白常缩写作锌指蛋白或ZFP。“TALEDNA结合结构域”或“TALE”是包含一种或多种TALE重复结构域/单元的多肽。重复结构域涉及TALE与其同类靶DNA序列的结合。单一“重复单元”(也称作“重复”)通常是33-35个氨基酸长度,并且与自然产生的TALE蛋白中的其它TALE重复序列显示至少一些序列同源。参见例如,美国专利号8,586,526。锌指结合结构域或TALEDNA结合结构域可以\经工程改造\以结合至预定的核苷酸序列,例如通过对自然产生的锌指蛋白的识别螺旋区域进行工程改造(改变一种或多种氨基酸)或通过工程改造TALE蛋白的RVD。因此,经工程改造的锌指蛋白或TALE是非自然产生的蛋白质。工程改造锌指蛋白或TALE的方法的非限制性示例是设计和选择。设计的锌指蛋白或TALE是其设计/组成主要由合理基准所得的非天然存在的蛋白。设计的合理标准包括应用替代法则和计算机算法来处理现有ZFP设计和结合数据的数据库存储信息中的信息。参见例如,美国专利8,586,526;6,140,081;6,453,242;和6,534,261;也参见WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496。\选定的\锌指蛋白或TALE是其生成主要由经验方法如噬菌体展示、相互作用陷阱或杂交体选择产生的天然情况下未发现的蛋白质。参见例如,8,586,526;5,789,538;US5,925,523;US6,007,988;US6,013,453;US6,200,759;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970;WO01/88197;WO02/099084。“TtAgo”是原核阿尔古蛋白质,认为其参与基因沉默。TtAgo源自嗜热细菌(Thermusthermophilus)。参见例如,Swarts等,同上,G.Sheng等,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是所需的全部组分,包括例如,用于通过TtAgo酶切割的向导DNA。\重组\指两个多核苷酸之间交换遗传信息的过程。就本公开的目的而言,\同源重组(HR)\指发生这种交换的特定形式,例如在修复细胞内双链断裂期间通过同源导向修复机制发生。该过程要求核苷酸序列同源性,利用\供体\分子模板修复\靶\分子(即,经历双链断裂的分子),该过程也称作\非交叉基因转化\或\短道基因转化\,因为其导致遗传信息从供体向靶转移。不希望受限于任何特定理论,这种转移可以涉及断裂的靶与供体间形成的异双链体DNA的错配校正,和/或采用供体再合成将成为部分靶的遗传信息的\合成依赖性链退火\,和/或相关过程。这些特定HR通常导致靶分子的序列改变使得供体多核苷酸的部分或全部序列被纳入靶多核苷酸。在本发明方法中,本文所述的一种或多种靶向核酸酶在靶序列(例如,细胞染色质)中的预定位点处产生双链断裂,并且可以将与所述断裂区域中的核苷酸序列具有同源性的“供体”多核苷酸引入该细胞。已显示存在双链断裂有助于供体序列的整合。供体序列可被物质整合(physicallyintegrated),或者,供体多核苷酸被用作模板用于通过同源重组进行的断裂修复,导致将供体中的全部或部分核苷酸序列引入细胞染色质。因此,细胞染色质中的第一序列可改变,并且在某些实施方式中,可转化成供体多核苷酸中存在的序列。因此,使用术语“替换”或“置换”可理解为代表一种核苷酸序列被另一种核苷酸序列替换(即,信息意义上序列的替换),而不一定要求一种多核苷酸被另一种多核苷酸物理或化学替换。本文所述的任何方法中,可采用锌指或TALE蛋白的额外的对进行细胞内额外的靶位点的额外的双链切割。在用于细胞染色质中的感兴趣区域中的序列的靶向重组和/或替代和/或变化的方法的某些实施方式中,通过同源重组,采用外源“供体”核苷酸序列来改变染色体序列。如果存在与断裂的区域同源的序列,则所述同源重组受细胞染色质中存在的双链断裂的刺激。在本文所述的任何方法中,第一核苷酸序列(“供体序列”)可包含与感兴趣区域中的基因组序列同源但不相同的序列,由此刺激同源重组以在感兴趣区域插入非相同序列。因此,在某些实施方式中,供体序列中与感兴趣区域序列同源的部分呈现与待替换的基因组序列有约80-99%(或其间任意整数)的序列相同性。在其它实施方式中,供体和基因组序列间的同源性超过99%,例如,供体与基因组序列的超过100个连续碱基对之间相差仅1个核苷酸时。在某些情况中,供体序列的非同源部分可包含不存在于感兴趣区域的序列,从而将新序列引入感兴趣区域。在这些情况中,非同源序列一般侧接50-1,000个碱基对(或其间的任何整数值)或大于1,000的任何数量个碱基对的序列,其与感兴趣区域中的序列同源或相同。在其它实施方式中,供体序列与第一序列非同源,并且通过非同源重组机制插入基因组。本文所述的任意方法可用于通过能破坏感兴趣基因表达的供体序列的靶向整合来使细胞内的一种或多种靶序列部分或完全失活。还提供具有部分或完全失活基因的细胞系。此外,本文所述的靶向整合方法也可用于整合一种或多种外源序列。外源核酸序列可包含,例如,一种或多种基因或cDNA分子,或任何类型的编码或非编码序列,以及一种或多种控制元件(例如,启动子)。此外,外源核酸序列可产生一种或多种RNA分子(例如,小发夹RNA(shRNA),抑制性RNA(RNAi),微小RNA(miRNA)等)。\切割\指DNA分子共价主链的断裂。切割可以由多种方法引发,包括但不限于,磷酸二酯键的酶促或化学水解。单链切割和双链切割均可采用,并且双链切割可由不同的单链切割事件所致。DNA切割可导致产生钝端或交错末端。在某些实施方式中,将融合多肽用于靶向双链DNA切割。\切割半结构域\是能与第二多肽(两者相同或不同)形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”;“+和–切割半结构域”和“右与左切割半结构域”可互换使用,指切割二聚化的半结构域的对。“工程改造的切割半结构域”是经修饰以与另一切割半结构域(例如,另一工程改造的切割半结构域)形成专性异二聚体的切割半结构域。还参见美国专利公开号2005/0064474、20070218528、2008/0131962和2011/0201055,通过引用其全文纳入本文。术语\序列\指任意长度的核苷酸序列,可以是DNA或RNA;可以是直链、环状或支链且可以是单链或双链。术语\供体序列\指插入基因组的核苷酸序列。供体序列可以是任意长度,例如长度为2-10,000个核苷酸(或其间或其上的任意整数值),优选长度为100-1,000个核苷酸(或其间的任意整数),更优选长度为200-500个核苷酸。\染色质\是包含细胞基因组的核蛋白结构。细胞染色质包含核酸和蛋白,核酸主要为DNA,蛋白包括组蛋白和非组蛋白染色体蛋白。真核细胞染色质主要以核小体形式存在,其中核小体核心包含约150碱基对的DNA与八聚体关联,所述八聚体包含组蛋白H2A、H2B、H3和H4各两份;以及在核小体核心之间延伸的接头DNA(长度根据生物体而各有不同)。组蛋白H1分子通常与接头DNA关联。就本公开的目的而言,术语“染色质”意在涵盖所有类型的细胞核蛋白,包括原核与真核的。细胞染色质包括染色体和附加体染色质。\染色体\是包含细胞的全部或部分基因组的染色质复合体。细胞基因组通常由其核型表征,其为包含该细胞基因组的全部染色体的集合。细胞基因组可包含一条或多条染色体。\附加体\是复制的核酸、核蛋白复合体或其它包含并非细胞染色体核型部分的核酸的结构。附加体的示例包括质粒和某些病毒基因组。\靶位点\或\靶序列\是限定结合分子将结合的核酸部分的核酸序列,前提是存在结合的充分条件。\外源\分子是通常不存在于细胞内的分子,但可通过一种或多种遗传、生化或其它方法引入细胞。“正常存在于细胞中”关于具体发展心理状态(mentalstage)和该细胞的环境条件确定。因此,例如,仅在肌肉的胚胎发育期间存在的分子对于成体肌肉细胞是外源分子。类似地,相对于非热激的细胞,通过热激诱导的分子是外源分子。例如,外源分子可包含功能失常的内源分子的功能性形式或者正常功能的内源分子的功能失常形式。外源分子可以是小分子或大分子等,小分子如由组合化学方法所产生,大分子如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物,或者是包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,其可以是单链或双链的;可以是直链、支链或环状的;并且可以具有任何长度。核酸包括能够形成双链体的那些,以及形成三链体的核酸。参见例如,美国专利号5,176,996和5,422,251。蛋白质可包括但不限于,DNA结合蛋白、转录因子、染色质重构因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基转移酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、旋转酶和解旋酶。外源分子可以是与内源分子同一类型的分子,例如外源蛋白或核酸。例如,外源核酸可包含感染性病毒基因组、引入细胞内的质粒或附加体,或包含通常不存在于细胞内的染色体。本领域技术人员已知将外源分子引入细胞内的方法,包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电转导、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可以是与内源分子相同类型但源自与该细胞来源不同物种的分子。例如,可将人核酸序列引入原始源自小鼠或参数的细胞系。相反,\内源\分子是通常存在于特定环境条件下特定发育阶段的特定细胞中的分子。例如,内源核酸可包含染色体、线粒体基因组、叶绿体或其它细胞器,或自然产生的附加体核酸。额外的内源分子可包括蛋白质,例如,转录因子和酶。术语“遗传阻遏物”指的是将一种或多种基因的表达减少至任何程度的任何分子。可以被阻遏的基因的非限制性示例包括HD相关的生物标志物(例如,DARPP-32A、PDE10a、Drd1和/或Drd2)。所述遗传阻遏可导致对于对象中亨廷顿氏病的治疗和/或预防。所述遗传阻遏物可以是任何分子,包括但不限于,抑制所述基因(例如,亨廷顿基因)的表达的小分子、核酸和/或蛋白质(例如,包含非自然产生的DNA结合结构域(例如,锌指蛋白、CRISRP/Cas或TALE结构域)的蛋白质)。遗传阻遏物蛋白可包括融合分子,例如,含有DNA结合结构域的融合蛋白转录因子(例如,ZFP-TF、CRISPR/dCas-TF或TALE-TF),和包含DNA结合结构域与核酸酶结构域的转录调节结构域或核酸酶(例如,ZFN、TALEN、CRISPR/Cas和/或Ttago核酸酶系统)。在一些实施方式中,所述遗传阻遏物特异性地结合至亨廷顿基因(其基因组DNA形式或转录本形式,例如mRNA)。\融合\分子是其中两个或多个亚单元分子相连(优选共价相连)的分子。亚基分子可以是相同化学类型的分子,也可以是不同化学类型的分子。第一类型的融合分子的示例可包括但不限于,融合蛋白(例如,ZFP或TALEDNA结合结构域与一种或多种活化结构域之间的融合)和融合核酸(例如,编码上文所述的融合蛋白的核酸)。第二类融合分子的示例包括但不限于:形成三链体的核酸与多肽之间的融合体,以及小沟结合子与核酸之间的融合体。细胞内融合蛋白的表达可由融合蛋白递送入细胞造成或通过向细胞递送编码融合蛋白的多核苷酸而引起,其中所述多核苷酸被转录,转录本经翻译产生所述融合蛋白。细胞中蛋白质的表达也可涉及反式剪接、多肽切割和多肽连接。用于将多核苷酸和多肽递送至细胞的方法在本公开内容中的他处呈现。“多聚结构域”(也称作“二聚结构域”或“蛋白质相互作用结构域”)是在ZFPTF或TALETF的氨基、羧基或氨基和羧基末端区域纳入的结构域。这些结构域允许多个ZFPTF或TALETF单元的多聚,从而相对于具有野生型数量长度的较短序列段,三核苷酸重复结构域的较大序列段变得被多聚ZFPTF或TALETF优先结合。多聚结构域的示例包括亮氨酸拉链。多聚结构域还可通过小分子调节,其中该多聚结构域假定一合适构象以允许仅在小分子或外部配体的存在下与另一多聚结构域相互作用。由此,外源配体可用于调节这些结构域的活性。就本公开的目的而言,\基因\包括编码基因产物(见前文)的DNA区域,以及调节基因产物生成的DNA区域,不论这类调节序列是否毗邻编码和/或转录序列。因此,基因包括但不必限于,启动子序列、终止子、翻译调节序列,例如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质连接位点和基因座控制区域。\基因表达\指基因所含信息转化成基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核糖酶、结构RNA或任何其它类型的RNA)或通过mRNA翻译产生的蛋白质。基因产物还包括经修饰的RNA,通过如下加工修饰,例如加帽、聚腺苷酸化、甲基化,和编辑,以及通过如下加工修饰的蛋白质,例如,甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、豆蔻酰化和糖基化。基因表达的\调控\指基因活性的改变。表达的调控可包括但不限于,基因活化和基因阻遏。基因组编辑(例如,切割、改变、失活、随机突变)可用来调控表达。失活的基因指的是,相较于不包括本文所述的ZFP或TALE蛋白的细胞,基因表达的任何减少。因此,基因失活可以是部分或完全的。\感兴趣区域\是需要结合外源分子的细胞染色质的任意区域,例如,基因或者基因内或与之毗邻的非编码序列。结合可以是出于靶向DNA切割和/或靶向重组的目的。感兴趣区域可以存在于例如染色体、附加体、细胞器基因组(例如,线粒体、叶绿体),或感染性病毒基因组中。感兴趣区域可处于基因的编码区中,转录的非编码区域例如前导序列、尾随序列或内含子中,或非转录区域中编码区的上游或下游。感兴趣区域可如单一核苷酸对一样小,或长达2,000个核苷酸对,或任意整数值的核苷酸对。\真核\细胞可包括但不限于,真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞)。涉及两个或多个组件(例如序列元件)的并置,所述组件设置成组件都可正常发挥作用并允许组件中至少一种能介导施加于至少一种其它组件上的作用时,术语\操作性连接\和\操作性相连\互换使用。例如,若转录调节序列控制编码序列响应一种或多种转录调节因子存在或缺失时的转录水平,则所述转录调节序列如启动子与所述编码序列操作性连接。转录调节序列一般与编码序列以顺式操作性地连接,但无需紧邻该序列。例如,增强子是操作性地连接编码序列的转录调节序列,尽管它们是不连续的。对于融合多肽,术语\操作性连接\可指各组件在与其它组件的连接中所发挥的功能与其在未连接时的功能相同。例如,对于其中ZFP或TALEDNA结合结构域融合至活化结构域的融合多肽,ZFP或TALEDNA结合结构域和活化结构域是操作性连接的,在该融合多肽中,ZFP或TALEDNA结合结构域部分能够结合其靶位点和/或其结合位点,而所述活化结构域能够上调基因表达。融合至能够调节基因表达的结构域的ZFP统称为“ZFP-TF”或“锌指转录因子”,而融合至能够调节基因表达的结构域的TALE统称为“TALE-TF”或“TALE转录因子”。对于其中ZFPDNA结合域与切割结构域(“ZFN”或“锌指核酸酶”)融合的融合多肽,若在融合多肽中ZFPDNA结合域部分能结合其靶位点和/或其结合位点,而切割结构域能切割靶位点附近的DNA,则ZFPDNA结合域与切割结构域操作性连接。例如,对于ZFPDNA结合域与切割结构域融合的融合多肽,若在融合多肽中ZFPDNA结合域部分能结合其靶位点和/或其结合位点,而切割结构域能切割靶位点附近的DNA,则ZFPDNA结合域与切割结构域操作性连接。蛋白质、多肽或核酸的\功能性片段\是序列与全长蛋白质、多肽或核酸不相同但保留全长蛋白质、多肽或核酸的相同功能的蛋白质、多肽或核酸。功能片段可具有比相应的天然分子更多、更少或相同数量的残基,和/或可含有1个或多个氨基酸或核苷酸取代。用于确定核酸功能(例如,编码功能、与另一核酸杂交的能力)的方法是本领域熟知的。类似地,用于确定蛋白质功能的方法也是熟知的。例如,可测定多肽的DNA结合功能,例如通过滤膜结合、电泳迁移率改变或免疫沉淀试验。DNA切割可通过凝胶电泳分析。参见Ausubel等,同上。可测定蛋白与另一蛋白相互作用的能力,例如,通过共免疫沉淀、双杂交试验或互补分析,既可以是遗传的也可以是生化的。参见例如,Fields等,(1989)Nature340:245-246;美国专利号5,585,245和PCTWO98/44350。\载体\能将基因序列转移至靶细胞。\载体构建物\、\表达载体\和\基因转移载体\通常指能指导感兴趣基因表达并能将基因序列转移至靶细胞的核酸构建物。因此,该术语包括克隆和表达载体,以及整合载体。\报告基因\或\报告序列\指的是产生蛋白质产物的任何序列,所述蛋白质产物容易被检测,其在常规试验中并非必需但是优选的。合适的报告物基因可包括但不限于,编码介导抗生素抗性(例如,氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列、编码有色或荧光或发光蛋白质(例如,绿色荧光蛋白、强化绿色荧光蛋白、红色荧光蛋白、荧光素酶)的序列,和介导增强的细胞生长和/或基因扩大的蛋白质(例如,二氢叶酸还原酶)。表位标签包括,例如,一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。“表达标签”包括编码可操作性地连接至所需基因序列以监测感兴趣的基因的表达的报告物的序列。亨廷顿氏病的生物标志物中型多棘神经元对HD高度易感。相比包含P物质且投射至内部苍白球(“直接”通路)的神经元,包含脑啡肽且投射至外部苍白球(所谓“间接通路”)的MSN更多地涉及,然而这两种类型的MSN均受影响。HD中的MSN显示htt的异常聚集和包合、生物能量学缺陷、神经营养素缺陷、转录调节异常、轴突传输紊乱和兴奋性神经毒性。例如,DARPP-32(多巴胺-和–cAMP-调节的磷蛋白,Mr32kDa)是纹状体中多巴胺和蛋白质激酶A的主要靶标,其作用是依赖于磷酸化状态和位置的双功能蛋白质,其中当DARP-32在Thr34被磷酸化时,其可作为蛋白质磷酸酶1(PP-1)的抑制剂,而当在Thr75处磷酸化时,其可作为PKA抑制剂(Svenningsson等,(2004)AnnuRevPharmacolToxicol44:269-96)。其在97%的MSN中表达,在若干皮质层和小脑浦肯野细胞中表达。然而,在HD小鼠模型中,其mRNA表达在MSN中下调的程度大于皮质(参见Ehrlich(2012)Neurotherapeutics9(2):270-284)。纹状体特异性环状核苷酸磷酸二酯酶PDE10A在纹状体中的作用是通过酶促水解限制环状核苷酸信号转导。它是在间接和直接MSN中以高水平表达的PDE的双重底物(参见Kleiman等,2011JofPharmaandExpThera336(1):64-78)并且在HD中下调。纹状体中的多巴胺信号转导通过多巴胺受体部分地调节,而间接MSN表达D1和D2多巴胺受体(分别是Drd1和Drd2)。直接通路的D1表达型细胞投射至黑质网状部(substantianigraparsreticulate),而间接通路的D2受体表达型MSN投射至内侧苍白球,并且基底神经节功能的经典模型表明,运动控制中,纹状体选择多巴胺差异作用的能力取决于将D1和D2受体分成两组MSN(参见Gerfen等(1990)Science250:1429-1432)。因此,Drd1和Drd2基因的表达是MSN的基本功能,而表达的失衡或缺陷可导致HD中观察到的运动功能破坏。那些似乎概括了人HD尾状中所观察到的那些的HD中的MSN功能的其它生物标志物包括PENK(脑啡肽原)减少、RGS4(G-蛋白质信号转导4调节物)、转录因子NGFi-A、钙/钙调蛋白依赖性3',5'-环状核苷酸磷酸二酯酶1BPDE1B,和CNR1(大麻素CB1受体)(Runne等,同上)。此外,也可直接分析突变htt基因的表达。小鼠模型的握抱行为指示该疾病。在相对攻击性的R6/2小鼠模型中,异位表达人Htt启动子和外显子1片段(包含扩大的CAG重复)(Mangiarini等.同上)。这些小鼠显示HD样行为变化和纹状体中型多棘神经元(MSN)(HD标志)的损失。死亡年龄通常在10和13周(尽管可能更早或更晚地发生),并且小鼠显示进展型神经病学表型。第一症状之一是尾巴拎起时的四肢运动障碍。其进展为交互握抱在一起和双脚松释直至小鼠在被拎起后即刻握抱住其双脚,并且无法放松该姿势。因此,握抱行为可被评为HD表型行为程度的度量。HD的表型改善可通过将处理的动物与未处理的动物做比较来检测。该模型可通过检测握抱行为和处死后生物标志物的变化来评价。例如,Rodriguez-Lebron等(2005,MolTher12(4):618-633利用对于握抱行为和DARPP-32和PENK表达变化的分析检测了shRNA抗Htt的功效。DNA结合结构域本文描述包含特异性地结合至含有三核苷酸重复(包括但不限于,Htt)的任何基因中的靶序列的DNA结合结构域的组合物。本文公开的组合物和方法中可采用任何DNA结合结构域。在某些实施方式中,DNA结合结构域包含锌指蛋白。优选地,该锌指蛋白是非自然产生的,其中它经工程改造以结合至所选的靶位点。参见例如,Beerli等(2002)NatureBiotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)NatureBiotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美国专利公开号2005/0064474;2007/0218528;2005/0267061,其均通过引用其全文纳入本文。与天然存在的锌指蛋白相比,经工程改造的锌指结合域可具有新的结合特异性。工程改造方法可包括但不限于,合理的设计和不同选择类型。例如,合理设计包括利用包含三体(或四体)核苷酸序列和单独锌指氨基酸序列的数据库,其中各三体或四体核苷酸序列与一种或多种结合该特定三体或四体序列的锌指氨基酸序列相关联。参见例如,共有的美国专利6,453,242和6,534,261,通过引用其全文纳入本文。示例性选择方法包括噬菌体展示和双杂交系统,公开于美国专利5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568;以及WO98/37186、WO98/53057、WO00/27878、WO01/88197和GB2,338,237。此外,例如在共有的WO02/077227中,已描述对锌指结合域的结合特异性的增强。此外,如这些以及其它参考文献中所公开的,锌指结构域和/或多指的锌指蛋白可利用任何合适的接头序列连接在一起,包括例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列还参见例如,美国专利号6,479,626、6,903,185和7,153,949。本文所述的蛋白质可包括蛋白质的个体锌指之间的合适的接头的任何组合。此外,例如在共有的WO02/077227中,已描述对锌指结合域的结合特异性的增强。靶位点选择;用于设计和构建融合蛋白(及其编码多核苷酸)的ZFP和方法是本领域技术人员已知的,并且详细描述于美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970WO01/88197;WO02/099084;WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496。此外,如这些以及其它参考文献中所公开的,锌指结构域和/或多指的锌指蛋白可利用任何合适的接头序列连接在一起,包括例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列还参见例如,美国专利号6,479,626、6,903,185和7,153,949。本文所述的蛋白质可包括蛋白质的个体锌指之间的合适的接头的任何组合。在某些实施方式中,DNA结合结构域是经工程改造的(以序列特异性方式)结合至Htt基因中的靶位点并调控Htt表达的锌指蛋白。ZFP可选择性地结合突变Htt等位基因或野生型Htt序列。Htt靶位点通常包括至少一个锌指,但可包括多个锌指(例如,2、3、4、5、6或更多个指)。ZFP通常包括至少三个指。某些ZFP包括四个、五个或六个指,而一些ZFP包括8、9、10、11或12个指。包括三个指的ZFP通常识别包括9或10个核苷酸的靶位点;包括四个指的ZFP通常识别包括12-14个核苷酸的靶位点;而具有六个指的ZFP能识别包括18-21个核苷酸的靶位点。ZFP也可以是包括一种或多种调节结构域的融合蛋白,其结构域可以是转录活化或阻遏结构域。在一些实施方式中,融合蛋白包含彼此连接的两个ZFPDNA结合结构域。因此,这些锌指蛋白可包含8、9、10、11、12或更多个指。在一些实施方式中,两个DNA结合结构域通过可延伸的柔性接头连接,从而一个DNA结合结构域包含4、5或6个锌指,而第二DNA结合结构域包含额外的4、5或5个锌指。在一些实施方式中,接头是标准的指间接头,从而该指阵列包含含有8、9、10、11或12或更多个指的一个DNA结合结构域。在其它实施方式中,接头是非典型接头,例如柔性接头。DNA结合结构域融合至至少一个调节结构域并且可被视作‘ZFP-ZFP-TF’结构。这些实施方式的特定示例可称作“ZFP-ZFP-KOX”,其包含用柔性接头连接并融合至KOX阻遏物的两个DNA结合结构域,和“ZFP-KOX-ZFP-KOX”,其中两个ZFP-KOX融合蛋白通过接头融合在一起。或者,所述DNA结合结构域可衍生自核酸酶。例如,已知寻靶内切核酸酶和大范围核酸酶的识别序列如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。还可参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)NucleicAcidsRes.25:3379–3388;Dujon等(1989)Gene82:115–118;Perler等(1994)NucleicAcidsRes.22,1125–1127;Jasin(1996)TrendsGenet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353和NEB公司(NewEnglandBiolabs)产品目录。此外,寻靶内切核酸酶和大范围核酸酶的DNA结合特异性可被工程改造以结合非天然靶位置。参见例如Chevalier等.(2002)Molec.Cell10:895-905;Epinat等.(2003)NucleicAcidsRes.31:2952-2962;Ashworth等.(2006)Nature441:656-659;Paques等.(2007)CurrentGeneTherapy7:49-66;美国专利公开号20070117128。“双手(twohanded)”锌指蛋白是其中两个锌指DNA结合结构域的簇被介入的氨基酸分开的那些蛋白质,从而这两个锌指结构域结合至两个不连续的靶位点。双手型锌指结合蛋白的一个示例是SIP1,其中四个锌指的簇位于该蛋白质的氨基末端,而三个指的簇位于羧基末端(参见Remacle等,(1999)EMBOJournal18(18):5073-5084)。这些蛋白质中的各锌指簇能够结合至独特的靶序列,并且两个靶序列指间的空隙可包含多个核苷酸。双手ZFP可包括功能结构域,例如融合至一个或两个ZFP。因此,显然功能结构域可连接至一个或两个ZFP外部(参见,图1C)或可位于ZFP之间(连接至两个ZFP)(参见,图4)。Htt-靶向的ZFP的特定示例公开于表1A和1B。该表中的第一列是ZFP的内参名称(编号)并且对应于表2A和2B的第1列中的相同的名称。“F”表示指,“F”后的数字表示哪个锌指(例如,“F1”指的是指1)。表1A:Htt-靶向的锌指蛋白表1B:人和小鼠Htt-靶向的锌指蛋白这些蛋白质的序列和靶位点的位置公开于表2A和2B。表2A和2B显示指示锌指蛋白的靶序列。与ZFP识别螺旋接触的靶位点中的核苷酸以大写字母表示;非接触的核苷酸以小写字母指示。表2A:人和小鼠Htt上的靶位点SBS#靶位点18856AcGCTGCGCCGGCGGAGGCGgggccgcg(SEQIDNO:88)25920gcGCTCAGCAGGTGGTGaccttgtggac(SEQIDNO:103)25921atGGTGGGAGAGACTGTgaggcggcagc(SEQIDNO:104)25923tgGGAGAGacTGTGAGGCGgcagctggg(SEQIDNO:105)25922atGGCGCTCAGCAGGTGGTGaccttgtg(SEQIDNO:106)表2B:人和小鼠Htt上的靶位点在某些实施方式中,所述DNA结合结构域包括天然存在或工程改造的(非天然存在)TAL效应物(TALE)DNA结合结构域。(参见例如,美国专利号8,586,526,其通过引用其全文纳入本文)。已知黄单胞菌属(Xanthomona)的植物病原菌在重要农作物中导致很多疾病。黄单胞菌属的病原性取决于保守的III型分泌(T3)系统,该系统向植物细胞内注入超过25种不同的效应物蛋白。这些注入的蛋白质中,有模拟植物转录激活物并操纵植物转录组的转录活化样效应物(TALE)(参见Kay等(2007)Science318:648-651)。这些蛋白含有DNA结合域和转录活化结构域。最为充分鉴定的TALE之一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonascampestrispv.vesicatoria)的AvrBs3(参见Bonas等(1989)MolGenGenet218:127-136和WO2010079430)。TALE含有串联重复的集中化结构域,各重复含有约34个氨基酸,它们是这些蛋白的DNA结合特异性的关键。此外,它们含有核定位序列和酸性转录活化结构域(综述参见SchornackS等(2006)JPlantPhysiol163(3):256-272)。此外,在致植物病细菌烟草青枯菌(Ralstoniasolanacearum)中,已发现烟草青枯菌生物变型(biovar)1菌株GMI1000和生物变型4菌株RS1000中称为brg11和hpx17的两个基因与黄单胞菌属(Xanthomonas)的AvrBs3家族同源(参见Heuer等(2007)ApplandEnvirMicro73(13):4379-4384)。这些基因在核苷酸序列上彼此98.9%相同,但区别为hpx17重复结构域中的1,575个碱基对缺失。然而,两种基因产物均与黄单胞菌属(Xanthomonas)的AvrBs3家族蛋白质具有低于40%序列相同性。这些TALE的特异性取决于串联重复中发现的序列。重复序列包含约102个碱基对,且重复区彼此间通常91-100%同源(Bonas等,同上)。重复区的多态性通常位于12和13位,且看来在12和13位的高可变双残基的种类和TALE靶序列中连续核苷酸的种类之间存在一一对应(参见Moscou和Bogdanove,(2009)Science326:1501以及Boch等(2009)Science326:1509-1512)。实验上已确定用于这些TALE的DNA识别编码,12与13位的HD序列导致结合于胞嘧啶(C),NG结合T、NI结合A、C、G或T,NN结合A或G,而IG结合T。这些DNA结合重复区已装配在具有新重复区组合与数量的蛋白质中,产生能在植物细胞中与新序列相互作用并激活非内源性报告基因的表达的人工转录因子(Boch等,同上)。已将经工程改造的TAL蛋白连接至FokI切割半结构域,以产生TAL效应物结构域核酸酶融合(TALEN),其在酵母报告物试验(基于质粒的靶向)显示活性。Christian等((2010)<Genetics电子公开10.1534/遗传学.110.120717)。还参见美国专利号8,586,526,其通过引用其全文纳入本文。待与ZFP或TALE蛋白使用的经设计的二聚结构域的特定示例列于表3。列出两种类型的结构域、卷曲螺旋(CC)和二聚化锌指(DZ)的氨基酸序列。表3:设计的二聚结构域融合蛋白还提供包含本文所述的DNA结合蛋白(例如,ZFP或TALE)和异源性调节(功能)结构域(或其功能性片段)的融合蛋白。常见的结构域包括例如:转录因子结构域(活化子、抑制子、共激活子、共抑制子)、沉默子、致癌基因(例如myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等);DNA修复酶及其相关因子和修饰子;DNA重排酶及其相关因子和修饰子;染色质相关蛋白及其修饰子(例如激酶、乙酰化酶和脱乙酰基酶);和DNA修饰酶(例如甲基转移酶、拓扑异构酶、解螺旋酶、连接酶、激酶、磷酸酶、聚合酶、内切核酸酶)及其相关因子和修饰子。美国专利号7,888,121和8,409,861提供关于DNA结合结构域与核酸酶切割结构域的融合的详细内容,通过引用其全文纳入本文。用于实现活化的合适结构域包括HSVVP16活化结构域(参见例如,Hagmann等,J.Virol.71,5952-5962(1997)),核激素受体(参见例如,Torchia等,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚基(Bitko和Barik,J.Virol.72:5610-5618(1998)和Doyle与Hunt,Neuroreport8:2937-2942(1997));Liu等,CancerGeneTher.5:3-28(1998)),或人工嵌合功能结构域,例如VP64(Beerli等,(1998)Proc.Natl.Acad.Sci.USA95:14623-33),和降解决定子(degron)(Molinari等,(1999)EMBOJ.18,6439-6447)。额外的示例性的活化结构域包括,Oct1,Oct-2A,Sp1,AP-2和CTF1(Seipel等.,EMBOJ.11,4961-4968(1992)以及p300,CBP,PCAF,SRC1PvALF,AtHD2A和ERF-2。参见例如Robyr等.(2000)Mol.Endocrinol.14:329-347;Collingwood等.(1999)J.Mol.Endocrinol.23:255-275;Leo等.(2000)Gene245:1-11;Manteuffel-Cymborowska(1999)ActaBiochim.Pol.46:77-89;McKenna等.(1999)J.SteroidBiochem.Mol.Biol.69:3-12;Malik等.(2000)TrendsBiochem.Sci.25:277-283;和Lemon等.(1999)Curr.Opin.Genet.Dev.9:499-504。额外的示例性的活化结构域可包括但不限于,OsGAI,HALF-1,C1,AP1,ARF-5,-6,-7和-8,CPRF1,CPRF4,MYC-RP/GP,和TRAB1。参见例如,Ogawa等.(2000)Gene245:21-29;Okanami等.(1996)GenesCells1:87-99;Goff等.(1991)GenesDev.5:298-309;Cho等.(1999)PlantMol.Biol.40:419-429;Ulmason等.(1999)Proc.Natl.Acad.Sci.USA96:5844-5849;Sprenger-Haussels等.(2000)PlantJ.22:1-8;Gong等.(1999)PlantMol.Biol.41:33-44;和Hobo等.(1999)Proc.Natl.Acad.Sci.USA96:15,348-15,353。本领域技术人员应明了,在DNA结合结构域与功能结构域之间的融合蛋白(或其编码核酸)的形成中,活化结构域或与活化结构域相互作用的分子适于作为功能结构域。基本上,能够招募活化复合物和/或活化活性(例如,组蛋白乙酰化)至靶基因的任何分子均可用作融合蛋白的活化结构域。适用作融合分子中的功能结构域的绝缘子结构域、定位结构域和染色质重构蛋白例如含ISWI的结构域和/或甲基结合结构域蛋白描述于,例如,美国专利号6,919,204和7,053,264。示例性的阻遏结构域可包括但不限于,KRABA/B,KOX,TGF-β-诱导型早期基因(TIEG),v-erbA,SID,MBD2,MBD3,DNMT家族成员(例如,DNMT1,DNMT3A,DNMT3B),Rb和MeCP2。参见例如,Bird等.(1999)Cell99:451-454;Tyler等.(1999)Cell99:443-446;Knoepfler等.(1999)Cell99:447-450;和Robertson等.(2000)NatureGenet.25:338-342。额外的示例性的阻遏结构域可包括但不限于,ROM2和AtHD2A。参见例如,Chem等.(1996)PlantCell8:305-321;和Wu等.(2000)PlantJ.22:19-27。融合分子通过本领域技术人员熟知的克隆和生物化学偶联方法构建。融合分子包含DNA结合结构域和功能结构域(例如,转录活化或阻遏结构域)。融合分子还任选包含核定位信号(例如,来自SV40介质T-抗原)和表位标签(例如,FLAG和血细胞凝集素)。设计融合蛋白(及其编码核酸),从而保留融合组分间的翻译阅读框。一方面,功能结构域(或其功能性片段)多肽组分与另一方面非蛋白质DNA结合结构域(例如,抗生素、嵌入剂、小沟结合剂、核酸)之间的融合通过本领域技术人员已知的生物化学偶联法构建。参见例如,皮尔斯化学公司(PierceChemicalCompan)(伊利诺伊州罗克福德)目录。已描述用于生成小沟结合剂与多肽之间的融合的方法和组合物。Mapp等.(2000)Proc.Natl.Acad.Sci.USA97:3930-3935。在某些实施方式中,DNA结合结构域结合的靶位点存在于细胞染色质的可及区域。可及区域可以按,例如,共有的国际公开WO01/83732中所述确定。如果靶位点不存在于细胞染色质的可及区域,可以按共有的WO01/83793所述产生一个或多个可及区域。在其它实施方式中,融合分子的DNA结合结构域能够结合至细胞染色质,无论其靶位点是否位于可及区域中。例如,所述DNA结合结构域能够结合至接头DNA和/或核小体DNA。该类型的\先驱\DNA结合结构域的示例可见于某些类固醇受体和肝细胞核因子3(HNF3)中。Cordingley等.(1987)Cell48:261-270;Pina等.(1990)Cell60:719-731;和Cirillo等.(1998)EMBOJ.17:244-254。融合分子可与药学上可接受的运载体配制,如本领域技术人员已知。参见例如,《雷明顿药物科学》(Remington'sPharmaceuticalSciences),17版,1985;和共有的WO00/42219。融合分子的功能性组分/结构域可选自任何多种不同的组分,所述组分一旦该融合分子通过其DNA结合结构域结合至靶序列即能影响基因转录。因此,功能性组分可包括但不限于,各种转录因子结构域,例如活化物、阻遏物、共活化物、共阻遏物,和沉默子。额外的示例性的功能结构域公开于,例如,共有的美国专利号6,534,261和6,933,113。还可选择通过外源小分子或配体调节的功能结构域。例如,可采用技术,其中功能结构域仅在额外的RheoChemTM配体的存在下假定其活性构象(参见例如US20090136465)。因此,可将ZFP或TALE操作性地连接至可调节的功能结构域,其中所得ZFP-TF或TALE-TF活性由额外配体控制。核酸酶本文还描述核酸酶,例如ZFN、TALEN、寻靶内切核酸酶、CRISPR/Cas和/或TtagoRNA导向的系统,其可用于体内遗传修饰,包括在核酸酶切割靶标后制造插入和/或缺失。在某些实施方式中,融合蛋白包含DNA结合型结合结构域和切割(核酸酶)结构域。如此,基因修饰可采用核酸酶,例如经工程改造的核酸酶来实现。经工程改造的核酸酶技术基于对自然产生的DNA结合蛋白的工程改造。例如,已描述了具有调整的DNA结合特异性的寻靶内切核酸酶的工程改造。(参见Chames等.(2005)NucleicAcidsRes33(20):e178;Arnould等.(2006)J.Mol.Biol.355:443-458)。此外,已描述ZFP的工程改造。参见例如美国专利号8,586,526;6,534,261;6,607,882;6,824,978;6,979,539;6,933,113;7,163,824和7,013,219。此外,已将ZFP和TALE融合至核酸酶结构域以产生ZFN和TALEN功能性实体,它们能够通过其经工程改造的(ZFP或TALE)DNA结合结构域识别其意图的核酸靶标,并造成该DNA在ZFP或TALEDNA结合位点附近通过核酸酶活性被切割。参见例如,Kim等.(1996)ProcNatlAcadSciUSA93(3):1156-1160。核酸酶(例如,ZFN、TALEN、CRISPR/Cas和/或Ttago系统)已用于多种生物中的基因组修饰。美国专利号7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;8,586,526;美国专利公开号20030232410;20050208489;20050026157;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983和20130177960,和美国申请号14/278,903。因此,本文所述的方法和组合物应用面广,并且可涉及任何感兴趣的核酸酶。核酸酶的非限制性示例包括CRISPR/Cas和/或Ttago系统、大范围核酸酶、TALEN和锌指核酸酶。核酸酶可包含异源的DNA结合与切割结构域(例如,锌指核酸酶;具有异源切割结构域的大范围核酸酶DNA结合域;TALEN;或者替代地,可改变天然存在核酸酶的DNA结合域以结合选定的靶位点(例如,大范围核酸酶经工程改造以结合不同于关联结合位点)。在某些实施方式中,核酸酶是大范围核酸酶(寻靶核酸内切酶)。自然产生的大范围核酸酶识别15-40碱基对的切割位点,并且通常分为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst箱家族和HNH家族。示例性寻靶核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。其识别序列是已知的。还可参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)NucleicAcidsRes.25:3379–3388;Dujon等(1989)Gene82:115–118;Perler等(1994)NucleicAcidsRes.22,1125–1127;Jasin(1996)TrendsGenet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353和NEB公司(NewEnglandBiolabs)产品目录。来自天然存在的大范围核酸酶的DNA结合域,主要是来自LAGLIDADG家族的DNA结合结构域已在植物、酵母、果蝇、哺乳动物细胞和小鼠中用于促进位点特异性基因组修饰,但该方法局限于对保留大范围核酸酶识别序列的同源基因的修饰(Monet等(1999),Biochem.Biophysics.Res.Common.255:88-93)或是对预先经工程改造引入识别序列的基因组的修饰(Route等(1994),Mol.Cell.Biol.14:8096-106;Chilton等(2003),PlantPhysiology.133:956-65;Puchta等(1996),Proc.Natl.Acad.Sci.USA93:5055-60;Rong等(2002),GenesDev.16:1568-81;Gouble等(2006),J.GeneMed.8(5):616-622)。因此,已尝试工程改造大范围核酸酶使其在医学或生物技术相关位点呈现新型结合特异性(Porteus等(2005),Nat.Biotechnol.23:967-73;Sussman等(2004),J.Mol.Biol.342:31-41;Epinat等(2003),NucleicAcidsRes.31:2952-62;Chevalier等(2002)Molec.Cell10:895-905;Epinat等(2003)NucleicAcidsRes.31:2952-2962;Ashworth等(2006)Nature441:656-659;Paques等(2007)CurrentGeneTherapy7:49-66;美国专利公开号20070117128、20060206949、20060153826、20060078552和20040002092)。此外,天然存在或工程改造的来自大范围核酸酶的DNA结合域也已和来自异源核酸酶(例如,FokI)的切割结构域操作性连接。在其它实施方式中,所述核酸酶是锌指核酸酶(ZFN)。ZFN包含已经工程改造以结合至所选基因中的靶位点的锌指蛋白和切割结构域或切割半结构域。如上详述,锌指结合域可经工程改造以结合所选序列。参见例如,Beerli等(2002)NatureBiotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)NatureBiotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的锌指蛋白相比,经工程改造的锌指结合域可具有新的结合特异性。工程改造方法可包括但不限于,合理的设计和不同选择类型。例如,合理设计包括利用包含三体(或四体)核苷酸序列和单独锌指氨基酸序列的数据库,其中各三体或四体核苷酸序列与一种或多种结合该特定三体或四体序列的锌指氨基酸序列相关联。参见例如,共有的美国专利6,453,242和6,534,261,通过引用其全文纳入本文。示例性选择方法包括噬菌体展示和双杂交系统,公开于美国专利5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568;以及WO98/37186、WO98/53057、WO00/27878、WO01/88197和GB2,338,237。此外,例如在共有的WO02/077227中,已描述对锌指结合域的结合特异性的增强。此外,如这些和其它参考文献中所公开,锌指结构域和/或多指的锌指蛋白可采用任何合适的接头序列连接在一起,包括例如,长度为5个或更多个氨基酸的接头(例如,TGEKP(SEQIDNO:135)、TGGQRP(SEQIDNO:136)、TGQKP(SEQIDNO:137),和/或TGSQKP(SEQIDNO:138))。长度为6个或更多个氨基酸的示例性接头序列参见例如,美国专利号6,479,626、6,903,185和7,153,949。本文所述的蛋白质可包括蛋白质的个体锌指之间的合适的接头的任何组合。还参见,美国临时专利申请号20110287512。CRISPR(ClusteredRegularlyInterspacedShortPalindromicRepeats(规则簇集的有间隙的短回文重复)/Cas(CRISPRAssociated(CRISPR相关的))核酸酶系统是近期经工程改造的核酸酶系统,其基于可用于基因组工程改造的细菌系统。其基于许多细菌和古菌的适应性免疫应答的部分。当病毒或质粒侵入细菌时,侵入物的DNA的片段通过“免疫”应答被转化成CRISPRRNA(crRNA)。然后,该crRNA通过部分互补性区域与另一类型的RNA(称为tracrRNA)相关联,以将Cas9核酸酶导向至与靶DNA(称为“原型间隔子”)同源的区域。Cas9切割DNA,在以crRNA转录本中所含的20个核苷酸的导向序列为特点的位点处的DSB处产生钝端。Cas9需要crRNA和tracrRNA用于位点特异性DNA识别和切割。该系统现已被工程改造,从而crRNA和tracrRNA可组合成一个分子(“单一向导RNA”),并且该单一向导RNA的crRNA等同部分可经工程改造以导向Cas9核酸酶以靶向任何所需序列(参见Jinek等(2012)Science337,816-821页,Jinek等,(2013),eLife2:e00471,和DavidSegal,(2013)eLife2:e00563)。因此,CRISPR/Cas系统可经工程改造以在基因组中的所需靶标处产生DSB,而DSB的修复可受到采用修复抑制剂(造成错误倾向修复的增加)的影响。如上所述,核酸酶的切割(核酸酶)结构域可以与DNA结合域是异源的,例如锌指DNA结合域和切割结构域来自某一核酸酶或大范围核酸酶DNA结合域且切割结构域来自另一核酸酶。异源切割结构域可获自任何内切核酸酶或外切核酸酶。可衍生出切割结构域的示范性核酸内切核酸酶,包括但不限于限制性内切核酸酶和寻靶内切核酸酶。参见例如,马萨诸塞州贝弗利(Beverly,MA)的NEB公司的2002-2003产品目录;和Belfort等(1997)NucleicAcidsRes.25:3379-338。已知切割DNA的其它酶(例如,S1核酸酶、绿豆核酸酶、胰DNA酶I、微球菌核酸酶、酵母HO核酸内切酶;还参见Linn等编,Nucleases(《核酸酶》),冷泉港实验室出版社(ColdSpringHarborLaboratoryPress),1993)。可将一种或多种这些酶(或其功能性片段)用作切割结构域和切割半结构域的来源。类似地,切割活性需要二聚化的切割半结构域可衍生自任何核酸酶或其部分,正如前文所述。一般而言,如果融合蛋白包含切割半结构域,则需要两种融合蛋白供于切割。或者,可使用包含两个切割半结构域的单个蛋白。这两个切割半结构域可衍生自同一核酸内切核酸酶(或其功能性片段),或各切割半结构域可衍生自不同的核酸内切核酸酶(或其功能性片段)。此外,优选两种融合蛋白的靶位点相对彼此排列,从而这两种融合蛋白与其各自靶位点的结合将切割半结构域放置为能使切割半结构域形成功能性切割结构域(例如,通过二聚化)的彼此空间定位。因此,在某些实施方式中,这些靶位点的邻近边缘间隔有5-8个核苷酸或15-18个核苷酸。然而可在两个靶位点之间介入任何整数个核苷酸或核苷酸对(例如,2-50个核苷酸对或更多)。一般而言,切割位点位于靶位点之间。限制性内切核酸酶(限制性酶)存在于许多物种,能序列特异性结合DNA(在识别位点处),并在结合位点处或其附近切割DNA。某些限制性酶(例如,IIS型)在从识别位点移除的位点处切割DNA并具有可分开的结合与切割结构域。例如,IIS型酶FokI催化DNA的双链切割,其一是距其识别位点9个核苷酸处,而另一是距其识别位点13个核苷酸处。参见例如,美国专利5,356,802、5,436,150和5,487,994;以及Li等,(1992)Proc.Natl.Acad.Sci.USA89:4275-4279;Li等,(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一种实施方式中,融合蛋白包含来自至少一种IIS型限制性酶的切割结构域(或切割半结构域)和一种或多种经或未经工程改造的锌指结合域。FokI是示例性IIS型限制性酶,其切割结构域可与结合域分离。该具体酶作为二聚体具有活性。Bitinaite等,(1998)Proc.Natl.Acad.Sci.USA95:10,570-10,575。因此,就本公开的目的而言,认为所述融合蛋白所用FokI酶的部分是切割半结构域。因此,对于利用锌指-FokI融合体的靶向双链切割和/或靶向细胞序列置换,可使用各自含有一个FokI切割半结构域的两种融合蛋白重建催化活性的切割结构域。或者,也可使用含有锌指结合域和两个FokI切割半结构域的单一多肽分子。采用锌指-或TALE-FokI融合的靶向切割和靶向序列变化的参数在本申请他处提供。切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如,二聚化)能力以形成功能性切割结构域的蛋白质任意部分。通过引用全文纳入本文的国际公开WO07/014275中描述了示例性IIS型限制性酶。其它限制性酶还包含可分开的结合和切割结构域,并且这些是本发明所设想的。参见例如Roberts等.(2003)NucleicAcidsRes.31:418-420。在某些实施方式中,切割结构域包含一种或多种经工程改造的切割半结构域(也称作二聚化结构域突变体),其同二聚作用降至最小或被阻止,例如,如美国专利号8,772,453;8,623,618;8,409,861;8,034,598;7,914,796;和7,888,121,所有公开通过引用全文纳入本文。在FokI的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538位的氨基酸残基都是影响FokI切割半结构域二聚化的靶标。能形成专性异二聚体的示例性工程改造FokI切割半结构域包括以下一对:第一切割半结构域包括FokI第490和538位氨基酸残基处的突变,和第二切割半结构域包括第486和499位氨基酸残基处的突变。因此,在一种实施方式中,490位的突变将Glu(E)替换为Lys(K);538位的突变将Iso(I)替换为Lys(K);486位的突变将Gln(Q)替换为Glu(E);而499位的突变将Iso(I)替换为Lys(K)。具体地,制备本文所述经工程改造的切割半结构域是通过在一个切割半结构域的490(E→K)和538(I→K)位突变来产生名为“E490K:I538K”的经工程改造切割半结构域,并通过另一切割半结构域的486(Q→E)和499(I→L)位突变来产生名为“Q486E:I499L”的经工程改造切割半结构域。本文所述的经工程改造的切割半结构域是专性杂二聚体突变型,其中异常切割被最小化或废除。参见例如美国专利号7,914,796和8,034,598,其公开内容通过引用其全文纳入本文用于所有目的。在某些实施方式中,经工程改造的切割半结构域包括在486、499和496位(根据野生型FokI编号)的突变,例如突变将野生型486位的Gln(Q)残基替换为Glu(E)残基,野生型499位的Iso(I)残基替换为Leu(L)残基,以及野生型496位的Asn(N)残基替换为Asp(D)或Glu(E)残基(还分别称作“ELD”和“ELE”结构域)。在其它实施方式中,经工程改造的切割半结构域包括在490、538和537位(根据野生型FokI编号)的突变,例如突变将野生型490位的Glu(E)残基替换为Lys(K)残基,野生型538位的Iso(I)残基替换为Lys(K)残基,以及野生型537位的His(H)残基替换为Lys(K)或Arg(R)残基(还分别称作“KKK”和“KKR”结构域)。在其它实施方式中,经工程改造的切割半结构域包含位置490和537(相对于野生型FokI编号)处的突变,例如在位置490处用Lys(K)残基替代野生型Glu(E)残基的突变,和在位置537处用Lys(K)残基或Arg(R)残基替代野生型His(H)残基的突变(还分别称作“KIK”和“KIR”结构域)。美国专利号8,772,453。本文所述的经工程改造的切割半结构域可用任何适当方法制备,例如,如美国专利号8,772,453;8,623,618;8,409,861;8,034,598;7,914,796和7,888,121所述通过定点诱变野生型切割半结构域(FokI)制备。或者,核酸酶可利用称为“分裂-酶(split-enzyme)”的技术(参见例如,美国专利公开号20090068164)在核酸靶位点处体内组装。这类分裂酶的组件可在另外的表达构建物上表达,或者可以连接于单独的组件相互分开的某一开放读框中,例如,组件由自切割2A肽或IRES序列分开。组件可以是单独的锌指结合域或大范围核酸酶核酸结合域的结构域。在一些实施方式中,所述DNA结合结构域是由TAL效应物工程改造的结构域,所述TAL效应物类似于源自植物病原体黄单胞菌(Xanthomonas)的那些(参见Boch等,(2009)Science326:1509-1512和Moscou与Bogdanove,(2009)Science326:1501)和Ralstonia(参见Heuer等(2007)AppliedandEnvironmentalMicrobiology73(13):4379-4384)。并且,参见PCT公开文本WO2010/079430。核酸酶(例如,ZFN或TALEN等)可在使用前针对活性进行筛选,例如,在基于酵母的染色体系统中,如8,563,314中所述。核酸酶的表达可受组成型启动子或诱导型启动子的控制,例如半乳糖激酶启动子在棉子糖和/或半乳糖的存在下被活化(去阻遏),并且在葡萄糖的存在下被阻遏。递送蛋白质(例如,ZFP、TALE、CRISPR/Cas、Ttago)、其编码多核苷酸,和包含本文所述的蛋白质和/或多核苷酸的组合物可通过任何合适的手段递送至靶细胞,包括例如,通过注射ZFP-TF、TALE-TF蛋白或通过利用编码ZFN或TALEN的mRNA。合适的细胞包括但不限于真核和原核细胞和/或细胞系。由此类细胞产生的所述细胞或细胞系的非限制性示例包括COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)和perC6细胞,以及昆虫细胞例如草地贪夜蛾(Spodopterafugiperda)(Sf),或真菌细胞例如酵母(Saccharomyces)、毕赤酵母(Pichia)和裂殖酵母(Schizosaccharomyces)。在某些实施方式中,细胞系是CHO-K1、MDCK或HEK293细胞系。合适的细胞还包括干细胞例如,胚胎干细胞、诱导型多潜能干细胞、造血干细胞、神经元干细胞和间充质干细胞。递送包含本文所述的锌指蛋白的蛋白质的方法可见述于,例如,美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219和7,163,824,其公开内容通过引用其全文纳入本文。本文所述的锌指、TALE或CRISPR/Cas蛋白还可采用包含编码锌指、TALE或CRISPR/Cas蛋白中的一种或多种的序列的载体递送。可采用任何载体系统,包括但不限于,质粒载体、逆病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疹病毒载体和腺相关病毒载体等。还参见例如,美国专利号6,534,261、6,607,882、6,824,978、6,933,113、6,979,539、7,013,219;和7,163,824,其通过引用全文纳入本文。此外,应明了,这些载体中的任一种均可包含一种或多种锌指或TALE蛋白编码序列。因此,当一种或多种ZFP、TALE或CRISPR/Cas蛋白被引入细胞时,编码所述ZFP、TALE或CRISPR/Cas蛋白的序列可被相同载体或不同载体携载。当采用多重载体时,各载体可包含编码一种或多种ZFP、TALE或CRISPR/Cas系统的序列。可采用传统病毒和基于非病毒的转基因方法来将编码经工程改造的ZFP、TALE或CRISPR/Cas系统的核酸引入细胞(例如,哺乳动物细胞)和靶组织。所述方法也可用于体外给予编码ZFP、TALE或CRISPR/Cas系统的核酸至细胞。在某些实施方式中,可给予编码ZFP、TALE或CRISPR/Cas系统的核酸用于体内或离体基因治疗应用。非病毒载体递送系统包括DNA质粒、裸核酸和与递送载体(例如脂质体或泊咯沙姆)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加体或整合的基因组。对于基因治疗法的综述,参见Anderson,Science256:808-813(1992);Nabel和Felgner,TIBTECH11:211-217(1993);Mitani和Caskey,TIBTECH11:162-166(1993);Dillon,TIBTECH11:167-175(1993);Miller,Nature357:455-460(1992);VanBrunt,Biotechnology6(10):1149-1154(1988);Vigne,RestorativeNeurologyandNeuroscience8:35-36(1995);Kremer和Perricaudet,BritishMedicalBulletin51(1):31-44(1995);Haddada等,刊于《微生物与免疫学热门主题》(CurrentTopicsinMicrobiologyandImmunology)Doerfler与(编)(1995);和Yu等,GeneTherapy1:13-26(1994)。非病毒递送核酸的方法包括电穿孔、脂质转染、微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸偶联物、裸DNA、裸RNA、人工病毒粒,和试剂增强型DNA摄取。利用例如Sonitron2000系统(Rich-Mar)的声孔效应也可用于递送核酸。在一个优选实施方式中,一种或多种核酸以mRNA形式递送。还优选采用加帽的mRNA来增加翻译效率和/或mRNA稳定性。特别优选ARCA(防倒转帽类似物)帽或其变体。参见美国专利US7074596和US8153773,其通过引用纳入本文。其它示例性的核酸递送系统包括Amaxa生物系统公司(德国科隆)、迈克赛特公司(Maxcyte,Inc.)(马里兰州罗克韦尔)、BTX分子递送系统公司(马萨诸塞州霍利斯顿)和哥白尼治疗公司(CopernicusTherapeuticsInc.)(参见例如US6008336)提供的那些。脂质转染描述于例如,美国专利号5,049,386;4,946,787和4,897,355),并且脂质转染试剂市售可得(例如,TransfectamTM和LipofectinTM和LipofectamineTMRNAiMAX)。适于多核苷酸的高效受体-识别脂质转染的阳离子和中性脂质包括那些Felgner、WO91/17424、WO91/16024的那些。可以递送至细胞(离体给予)或靶组织(体内给予)。脂质:核酸复合物(包括靶向脂质体,例如免疫脂质复合物)的制备是本领域技术人员熟知的(参见例如,Crystal,Science270:404-410(1995);Blaese等,CancerGeneTher.2:291-297(1995);Behr等,BioconjugateChem.5:382-389(1994);Remy等,BioconjugateChem.5:647-654(1994);Gao等,GeneTherapy2:710-722(1995);Ahmad等,CancerRes.52:4817-4820(1992);美国专利号4,186,183,4,217,344,4,235,871,4,261,975,4,485,054,4,501,728,4,774,085,4,837,028和4,946,787)。递送的其它方法包括将待被递送的核酸包装到EnGeneIC递送载体(EDV)中。采用双特异性抗体将这些EDV被特异性递送至靶组织,其中,所述抗体的一个臂对靶组织具有特异性,而另一个臂对EDV具有特异性。抗体将EDV带至靶细胞表面,然后EDV通过内吞作用进入细胞。一旦进入细胞,即释放内容物(参见MacDiarmid等(2009)NatureBiotechnology27(7):643)。用于递送编码经工程改造的ZFP、TALE或CRISPR/Cas系统的核酸的基于RNA或DNA病毒的系统利用将病毒靶向至身体中特定细胞并将病毒负荷运输至核高度演化的过程。病毒载体可直接给予患者(体内)或其可用于体外处理细胞,并将经修饰的细胞给予患者(离体)。用于递送ZFP、TALE或CRISPR/Cas系统的常规的基于病毒的系统可包括但不限于,用于基因传递的逆病毒、慢病毒、腺病毒、腺相关、牛痘和单纯性疱疹病毒载体。宿主基因组中的整合可采用逆病毒、慢病毒和腺相关病毒基因传递方法进行,通常导致插入的转基因的长期表达。此外,已在许多不同的细胞类型和靶组织中观察到了高转导功效。逆病毒的趋性可通过引入外来包膜蛋白、扩大靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞的逆病毒载体,并且通常产生高病毒效价。逆病毒转基因系统的选择取决于靶组织。逆病毒载体包含顺式作用的长末端重复,其具有包装长达6-10的外来序列的能力。最小的顺式作用的LTR足以用于载体的复制和包装,其随后用于将治疗基因整合进入靶细胞,以提供永久的转基因表达。广泛应用的逆病毒载体包括基于小鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、类人猿免疫缺陷型病毒(SIV)、人类免疫缺陷型病毒(HIV),及其组合的那些(参见例如,Buchscher等.,J.Virol.66:2731-2739(1992);Johann等.,J.Virol.66:1635-1640(1992);Sommerfelt等.,Virol.176:58-59(1990);Wilson等.,J.Virol.63:2374-2378(1989);Miller等.,J.Virol.65:2220-2224(1991);PCT/US94/05700)。在其中优选瞬时表达的应用中,可采用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中获得极高的转导效率,并且不需要细胞分裂。采用这种载体,已获得了高效价和高水平的表达。该载体可在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也用于用靶核酸转导细胞,例如,用于核酸和肽的体外生成,以及用于体内和离体基因治疗法(参见例如,West等.,Virology160:38-47(1987);美国专利号4,797,368;WO93/24641;Kotin,HumanGeneTherapy5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于多个公开文本中,包括美国专利号5,173,414;Tratschin等.,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等.,Mol.Cell.Biol.4:2072-2081(1984);Hermonat和Muzyczka,PNAS81:6466-6470(1984);和Samulski等.,J.Virol.63:03822-3828(1989)。目前有至少六种病毒载体法可用于临床试验中的基因传递,其采用通过将基因插入辅助细胞系来产生转导剂进行涉及缺陷型载体的互补的方法。pLASN和MFG-S是已用于临床试验的逆病毒载体的示例(Dunbar等.,Blood85:3048-305(1995);Kohn等.,Nat.Med.1:1017-102(1995);Malech等.,PNAS94:2212133-12138(1997))。PA317/pLASN是用于基因治疗试验的第一治疗载体。(Blaese等.,Science270:475-480(1995))。已在MFG-S包装的载体中观察到50%或更高的转导功效。(Ellem等.,ImmunolImmunother.44(1):10-20(1997);Dranoff等.,Hum.GeneTher.1:111-2(1997)。重组腺相关病毒载体(rAAV)是一种具有前景的替代性的基因递送系统,其基于缺陷型和非病原性细小病毒腺相关2型病毒。全部载体源自仅保留侧接转基因表达盒的AAV145碱基对反向末端重复的质粒。高效的基因转移和稳定的转基因递送是该载体系统的关键特征,这归因于向转导的细胞的基因组的整合。(Wagner等.,Lancet351:91171702-3(1998),Kearns等.,GeneTher.9:748-55(1996))。其它AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8AAV8.2、AAV9和AAVrh10和假型化的AAV,例如AAV2/8、AAV2/5和AAV2/6,也可根据本发明使用。复制缺陷型重组腺病毒载体(Ad)可以高效价生成,并且容易地感染多种不同的细胞类型。大多数腺病毒载体是经工程改造的,从而转基因替代了AdE1a、E1b和/或E3基因;随后该复制缺陷型载体在提供缺失反式基因功能的人293细胞中传播。Ad载体可体内转导多种类型的组织,包括不分裂的、分化的细胞,例如发现于肝、肾和肌肉中的那些。传统的Ad载体具有较大携载能力。临床试验中Ad载体应用的一个示例涉及用于采用肌内注射进行抗肿瘤免疫的多核苷酸治疗(Sterman等.,Hum.7:1083-9(1998))。临床试验中用于转基因的腺病毒载体的应用的其它示例包括Rosenecker等.,Infection24:15-10(1996);Sterman等.,Hum.GeneTher.9:71083-1089(1998);Welsh等.,Hum.GeneTher.2:205-18(1995);Alvarez等.,Hum.GeneTher.5:597-613(1997);Topf等.,GeneTher.5:507-513(1998);Sterman等.,Hum.GeneTher.7:1083-1089(1998)。采用包装细胞来形成能够感染宿主细胞的病毒颗粒。所述细胞包括293细胞,其包装腺病毒,和ψ2细胞或PA317细胞,其包装逆病毒。用于基因治疗的病毒载体通常由将核酸载体包装成病毒颗粒的生产细胞系产生。所述载体通常包含包装和后续整合进入宿主(若可行)所需的最小病毒序列,其它病毒序列被编码待表达的蛋白质的表达盒所替代。失去的病毒功能通过包装细胞系以反式提供。例如,用于基因治疗的AAV载体通常仅加工来自AAV基因组的反向末端重复(ITR)序列,其为包装和整合进入宿主基因组所需。病毒DNA被包装进入细胞系,其包含编码其它AAV基因,即rep和cap,但缺乏ITR序列的辅助质粒。所述细胞系也用腺病毒(作为辅助物)感染。辅助病毒促进AAV载体的复制和AAV基因从辅助质粒的表达。因为缺乏ITR序列,辅助质粒不以显著的量包装。腺病毒的污染可通过,例如,热处理(相比AAV,腺病毒对热处理更为敏感)来减少。.在许多基因治疗应用中,希望将基因治疗载体以高度特异性递送至特定组织类型。因此,病毒载体可经修饰以通过将配体表达成与病毒包衣蛋白融合的位于病毒外表面上的蛋白来具有针对给定细胞类型的特异性。选择对于已知存在于感兴趣的细胞类型上的受体具有亲和力的配体。例如,Han等.,Proc.Natl.Acad.Sci.USA92:9747-9751(1995),报道了莫洛尼小鼠白血病病毒可经修饰以表达融合至gp70的人调蛋白,并且该重组病毒感染表达人表皮生长因子受体的某些人乳腺癌细胞。该原理可延伸至其它病毒-靶细胞对,其中靶细胞表达受体,并且病毒表达包含针对该细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可经工程改造以显示对于几乎任何所选细胞受体具有特异性结合亲和力的抗体片段(例如,FAB或Fv)。尽管上文描述主要应用至病毒载体,相同的原理可应用至非病毒载体。所述载体可经工程改造以包含特定的摄取序列,其有利于被特定靶细胞摄取。基因治疗载体可通过给予个体患者来体内递送,通常通过全身性给予(例如,静脉内、腹膜内、肌内、皮下,或颅内输注)或局部施用,如下所述。或者,载体可离体递送至细胞,例如来自个体患者的外植的细胞(例如,淋巴细胞、骨髓抽出物、组织活检物)或通用供体造血干细胞,然后将所述再植入患者,通常在选择已纳入载体的细胞之后进行。用于诊断、研究或基因治疗(例如,通过重新输注转染的细胞进入宿主生物体)的离体细胞转染是本领域技术人员熟知的。在一个优选实施方式中,细胞从对象机体分离,用ZFP、TALE或CRISPR/Cas系统核酸(基因、cDNA或mRNA)转染,并重新输注回对象机体(例如,患者)。在一个优选实施方式中,一种或多种核酸以mRNA形式递送。也优选采用加帽的mRNA来增加翻译效率和/或mRNA稳定性。尤其优选ARCA(防倒转帽类似物)帽或其变化形式。参见美国专利7,074,596和8,153,773,通过引用其全文纳入本文。合适于离体转染的多种细胞类型是本领域技术人员熟知的(参见例如,Freshney等.,《动物细胞培养,基础技术手册》(CultureofAnimalCells,AManualofBasicTechnique)(第三版.1994))本文所引的参考内容是关于讨论如何分离和培养来自患者的细胞)。在一个实施方式中,细胞转染和基因治疗的离体方案中采用干细胞。采用干细胞的好处是,它们可以体外分化成其它细胞类型,或可被导入哺乳动物(例如细胞的供体),在此其将接植入骨髓。采用细胞因子例如GM-CSF、IFN-γ和TNF-α将CD34+细胞体外分化成临床上重要的免疫细胞类型的方法是已知的(参见Inaba等.,J.Exp.Med.176:1693-1702(1992))。采用已知方法分离干细胞用于转导和分化。例如,干细胞也可通过骨髓细胞用结合不需要细胞的抗体筛选而从骨髓细胞中分离,所述细胞例如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化抗原呈递细胞)(参见Inaba等.,J.Exp.Med.176:1693-1702(1992))。在一些实施方式中,可采用已经修饰的干细胞。例如,可将被制成抗凋亡的神经元干细胞用作治疗组合物,其中所述干细胞还包含本发明的ZFPTF。对于凋亡的抗性可来自于,例如,通过采用BAX-或BAK特异性TALEN或ZFN敲出干细胞中的BAX和/或BAK(参见,美国专利公开号20100003756),或干扰胱冬酶的那些,同样采用例如胱冬酶6特异性ZFN。这些细胞可用已知用于调节突变型或野生型Htt的ZFPTF或TALETF转染。也可将包含治疗性ZFP核酸的载体(例如,逆病毒、腺病毒、脂质体等)直接给予机体用于体内细胞转导。或者,可给予裸DNA。给予通过常用于导入分子并最终与血液或组织细胞接触的任何常规途径进行,包括但不限于,注射、输注、局部施用和电穿孔。合适的给予所述核酸的方法可得且为本领域技术人员熟知,并且,尽管可利用超过一种途径给予特定组合物,某特定途径通常能提供比另一途径更直接和更有效的反应。用于将DNA导入造血干细胞的方法公开于,例如,美国专利号5,928,638。有用于将转基因导入造血干细胞(例如,CD34+细胞)的载体包括腺病毒第35型。合适于将转基因导入免疫细胞(例如,T细胞)的载体包括非整合型慢病毒载体。参见例如Ory等.(1996)Proc.Natl.Acad.Sci.USA93:11382-11388;Dull等.(1998)J.Virol.72:8463-8471;Zuffery等.(1998)J.Virol.72:9873-9880;Follenzi等.(2000)NatureGenetics25:217-222。药学上可接受的运载体部分取决于需给予的特定组合物以及用来给予组合物的特定方法。因此,有多种合适的药物组合物制剂可用,如下所述(参见例如,Remington’sPharmaceuticalSciences(《雷明顿药物科学》);第17版,1989)。如上所述,公开的方法和组合物可用于任何类型的细胞,包括但不限于,原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞。用于蛋白质表达的合适的细胞系是本领域技术人员已知的,并且可包括但不限于COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞例如草地贪夜蛾(Spodopterafugiperda)(Sf),和真菌细胞例如酵母(Saccharomyces)、毕赤酵母(Pichia)和裂殖酵母(Schizosaccharomyces)。也可采用这些细胞系的子代、变体和衍生物。应用公开的组合物和方法可用于其中希望调控Htt等位基因的任何应用,包括但不限于,治疗和研究应用。其中Htt阻遏ZFPTF或TALETF可用作治疗剂的疾病和病症可包括但不限于,亨廷顿氏病。此外,包含对Htt的突变型等位基因具有特异性的ZFN或TALEN的方法和组合物可用作治疗剂来治疗亨廷顿氏病。阻遏HDHtt等位基因的ZFP-TF或TALETF也可与活化神经营养因子(包括但不限于,GDNF和BDNF)的ZFP-TF或TALE-TF联用。这些ZFP或TALE(或编码这些ZFP或TALE的多核苷酸)可同时给予(例如,在相同的药物组合物中)或可以任何顺序依次给予。用于治疗亨廷顿氏病的方法和组合物还包括这样的干细胞组合物:其中干细胞中的Htt等位基因的突变拷贝已采用Htt特异性ZFN或TALEN修饰成野生型Htt等位基因。本发明的方法和组合物也可用于设计和实现体外和体内模型,例如,三核苷酸重复病症的动物模型,其允许研究这些病症。合适的体外模型的非限制性示例包括来自任何生物体(包括成纤维细胞)的细胞或细胞系。用作动物模型的合适的动物的非限制性示例包括,无脊椎动物(秀丽隐杆线虫(C.elegans)、果蝇(drosophila))、啮齿类(例如,大鼠或小鼠)、灵长类(例如,非人灵长类)。本文所述的组合物(例如,蛋白质和/或多核苷酸),单独或与其它合适的组分组合(例如脂质体、纳米颗粒或本领域已知的其它组分)可被制成气溶胶制剂(即,它们可以是“雾状的”),以通过吸入方式给予。可将该气溶胶制剂置于加压的可接受推进剂中,如二氯二氟甲烷、丙烷、氮气等。适用于胃肠道外给药,例如通过静脉内、肌肉内、皮内以及皮下途径的制剂,包括水性和非水性、等张无菌注射溶液(其可含有抗氧化剂、缓冲液、抑菌剂和溶质,它们使该制剂与预期接受者的血液等渗)以及水性和非水性无菌悬浮液(其可包含悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂)。可通过,例如静脉内输注、口服、局部、腹膜内、膀胱内或鞘内方式给予组合物。化合物的制剂可以在单剂量或多剂量密封容器(例如安瓿和管形瓶)中存在。注射溶液和混悬液可以由前述无菌粉末、颗粒和片剂进行制备。给予患者的剂量应足以有效于在一段时间内于患者中产生治疗反应。所述剂量可通过所用的具体Htt结合型分子的功效和Kd、靶细胞、患者状况,以及待治疗的患者的体重或体表面积来确定。剂量大小也可由伴随特定化合物或载体在具体患者中的给予的任何不良副作用的存在、性质和程度来决定。实施例实施例1:Htt-靶向的锌指蛋白转录因子(ZFP-TF)和ZFN的设计和构建靶向至Htt的锌指蛋白基本如美国专利号6,534,261所述工程改造。表1A和1B显示示例性的Htt-靶向的ZFP的DNA结合结构域的识别螺旋,而表2A和2B显示这些ZFP的靶序列。具有一个连续的锌指阵列的ZFP被设计成靶向完全位于CAG重复区域内的位点(图1B)。所述ZFP可结合更长的、突变序列段,其具有更高的亲和力和/或更高的净占据性,能够实现对突变型等位基因的选择性阻遏。进一步设计ZFN,从而靶位点部分或完全位于CAG区之外(图1A),并且因而将等同地结合至野生型和突变型等位基因,并且调节来自两种等位基因的表达具有类似效率。当设计锌指蛋白以识别CAG区时,可在“混合匹配”组合中采用一指和两指模块的集合。那些模块示于下表2C。表2C.用于ZFP-TF靶向CAG重复的锌指识别螺旋还如上所述构建多聚化ZFPTF,不同之处在于该载体还包含编码1种或多种蛋白质相互作用结构域(也称为二聚或蛋白质相互作用结构域)的序列,其允许沿三核苷酸重复的序列段表达的蛋白质的多聚化,其操作性地连接至编码ZFPTF的序列。参见图1D和图10。表3显示二聚结构域设计,其与靶向至CAG重复区域的ZFP联用。图10C显示经设计以通过二聚化锌指(DZ)DZ1–DZ4之间的相互作用多聚化的四种ZFP单体支架的蛋白质序列。设计基于Mol.Syst.Biol.(2006)2:2006.2011中所述的工作。图10D显示经设计以通过卷曲螺旋(CC)CC1–CC7之间的相互作用多聚化的七种ZFP单体支架的蛋白质序列。CC#1的设计基于(J.Am.Chem.Soc.(2001),123:3151-3152)中所述的工作,而CC#2、CC#3和CC#4的设计基于(J.Am.Chem.Soc.(2000),122:5658-5659)。CC和DZ结构域允许ZFP在CAG序列段的大沟中聚合(示于图10B)。通过选择具有合适的结合性质的指阵列和二聚结构域,高效结合将仅对疾病等位基因的扩大的CAG序列段发生。ZFP-TF构建为融合蛋白,其包含核定位序列、靶向至Htt等位基因的经工程改造的锌指DNA结合结构域(表1A和1B),和来自人KOX1蛋白的KRAB阻遏结构域。参见图1A、1B和1D。设计的DNA结合结构域包含3-6个指模块,识别9-18个碱基对序列(表2A和2B)。与ZFP识别螺旋接触的靶位点中的核苷酸以大写字母表示;非接触的核苷酸以小写字母指示。还构建ZFP-ZFP-TF分子,其中两个ZFPDNA结合结构域与柔性接头融合,并融合至KRAB阻遏结构域(图1E)。DNA结合结构域选自表2A和2B。实施例2:人和小鼠细胞中Htt的两个等位基因的阻遏为了阻遏Htt的两个等位基因(非等位基因特异性),ZFP经设计以结合至Htt启动子和外显子1区域,其中靶位点不完全处于CAG重复内。参见,图1A。为了测试Htt阻遏型ZFPTF的活性,将ZFPTF转染进入人细胞,并采用实时RT-PCR监测Htt的表达。培养于补充有10%FBS和1e5个细胞的DMEM中的人HEK293细胞(Graham等(1977)JGenVirol36:59-74)用1μg的编码指示的ZFP-KOX融合的质粒DNA转染,转染通过Amaxa按照生产商的说明进行。转染的细胞孵育2天,通过实时PCR,分别采用Hs00918176_m1和4352935E引物与探针(应用生物系统公司),根据标准方案,分析内源人亨廷顿(Htt)和标准化对照β肌动蛋白(ACTB)的水平。Htt水平表示为Htt/ACTB比例,其针对模拟转染的样品(设为1)标准化。如图2A所示,Htt-靶向的ZFP阻遏Htt表达。采用标准方案进行Western印迹分析,以证实Htt蛋白质水平(图2B)的减少;采用p65蛋白作为上样对照。采用2000试剂盒(英杰公司),根据生产商方案,将小鼠Htt特异性ZFPTF阻遏物瞬时转染进入Neuro2A细胞(Klebe和Ruddle(1969)J.CellBiol.43:69A)。在转染后48小时分别采用ABI引物/探针组Mm01213820m1和4352933E检测mHtt和ACTBmRNA水平。将ZFP转染的样品的mHtt/ACTB比例针对GFP对照(设为1)标准化。如图2C所示,ZFP阻遏小鼠Htt表达。此外,小鼠Htt特异性ZFP-TF阻遏物能够阻遏永生化的纹状体细胞STHdh(Q111/Q7)中的小鼠Htt,该细胞源自Htt敲入小鼠(Trettel等.(2000)Hum.Mol.Genet9:2799-2809)。参见图2D和2E。指示的ZFP的mRNA采用mMessagemMachine试剂盒(安碧公司(Ambion))生成,并且如上所述采用Amaxa核转染剂转染0.1、0.5或2μg的这些mRNA。细胞在转染后48小时收获,用于如上所述进行mHtt和ACTB表达分析。相较于Neuro2A细胞,观察到纹状体细胞中具有较显著的阻遏,这可能是通过纹状体细胞中mRNA转染的转染效率增强所致。实施例3:人和小鼠细胞中的突变Htt的选择性阻遏为了实现突变Htt等位基因的选择性阻遏,ZFP被设计为结合CAG重复内部。图1B显示所述ZFP的一种类型,具有连接至阻遏结构域(例如KOX1的KRAB结构域)的连续的锌指阵列;这些ZFP可设计为具有合适的亲和力,从而转录阻遏所需的阈值占据性能够仅在扩大的CAG重复上建立。图1C、1D和1E显示ZFP设计的三个其它示例,其能够允许特异性结合至扩大的CAG重复。如图1B所示设计的ZFP被导入HEK293细胞,并评价Htt表达。采用FugeneHD应用标准方案将ZFP-编码型构建体转染进入HEK293细胞。转染后72小时,分离总RNA,并通过实时PCR,分别采用Hs00918176_m1和4352935E引物和探针(应用生物系统公司)分析内源人亨廷顿(Htt)相对于内参β肌动蛋白(ACTB)的水平。ZFP转染的样品的Htt/ACTB比例针对GFP对照(设为1)标准化。如图3A所示,被设计为结合至CAG重复(图1B)(结合至上或下链)的ZFP阻遏物(与KRAB阻遏结构域融合)在HEK293细胞中有效地阻遏Htt表达。图3A显示转录阻遏物,其中表达在重复转染(图中分开的柱)中检测,并且完成多重实时PCR试验(误差线)。个体ZFP的不同阻遏水平表明,其对于CAG重复区域具有不同的亲和力。因为HEK293细胞中的Htt等位基因具有16和17个CAG,该结果也表明“较弱的”ZFP,例如30640,不能有效阻遏具有野生型(未扩大的)CAG重复长度的Htt等位基因。为了测试ZFP例如30640能否阻遏具有扩大的CAG重复的Htt等位基因的转录,构建由包含不同的CAG重复长度的Htt启动子/外显子1片段控制的荧光素酶报告物。首先,人Htt启动子/外显子1片段从HEK293基因组DNA扩增,扩增采用正向引物:5’GAAGATCTCACTTGGGGTCCTCAGGTCGTGCCGAC(SEQIDNO:139)和反向引物:5’GTATCCAAGCTTCAGCTTTTCCAGGGTCGCCTAGGCGGTCT(SEQIDNO:140)。正向引物引入BglII位点,反向引物将Htt的第一ATG改变为TAG,并且产生AvrII位点,并且还包括HindIII位点。PCR产物用BglII和HindIII消化,并连接至pRL-TK载体(普洛麦格),其用相同的酶消化以产生构建体pRL-Htt。然后,人Htt外显子1片段(编码序列减去第一个ATG)从HEK293基因组DNA或来自具有扩大的CAG重复的HD患者的基因组DNA扩增,扩增采用正向引物:5’GCCTAGGCGACCCTGGAAAAGCTGATGAAGGCC(SEQIDNO:141)和反向引物:5’5’GTATCCAAGCTTGAGCTGCAGCGGGCCCAAACTCACG(SEQIDNO:142).正向引物引入AvrII位点,反向引物引入HindIII位点。PCR产物用AvrII和HindIII消化,并连接至pRL-Htt载体,其用相同的酶消化。通过测序鉴定具有10、17、23或47个CAG重复(pRL-Htt-CAG(x))的克隆。采用或不采用100ng的ZFP30640表达载体,将pRL-Htt-CAG(x)报告物(300ng)和pGL3-启动子报告物(100ng,用作标准化对照,普洛麦格)转染进入HEK293细胞。转染后24小时检测萤火虫(pGL报告物)和海肾(pRL报告物)荧光素酶活性。海肾荧光素酶水平针对来自相同的转染样品的萤火虫荧光素酶进行标准化,并且进一步针对“仅报告”样品的海肾/萤火虫比例标准化。如图3B所示,通过ZFP-TF30640的荧光素酶报告物的阻遏随着CAG重复的长度增加而增加,表明具有与30640类似的DNA结合亲和性的ZFP能够通过扩大的CAG重复来阻遏Htt启动子活性,并且,阻遏的水平也依赖于CAG重复长度。图3C显示与图3B类似的实验,不同之处在于还测试了“强”ZFP-TF30657,并且如图所示测试了多个剂量的30640和30657。在每个剂量水平,30640产生的pRL-Htt-CAG47报告物阻遏多于pRL-Htt-CAG23报告物(CAG重复长度依赖性阻遏),而30657对两种报告物的阻遏处于类似水平。对于pRL-Htt-CAG23报告物,在每个剂量水平,30640产生的阻遏少于30657,表示其对于具有正常CAG重复长度的内源Htt等位基因的活性差异(HEK293细胞,图3A);但对于pRL-Htt-CAG47报告物,30640和30657在每个剂量水平产生类似阻遏,表明“较弱的”ZFP例如30640能够通过扩大的CAG重复高效地阻遏Htt启动子,很可能是因为仅扩大的CAG靶标能够允许待由所述ZFP建立的阻遏所需的阈值占据性。图3D显示ZFP-TF30640和30657(融合至KOX1的KRAB阻遏结构域)能够阻遏源自Hdh(Q111/Q7)敲入小鼠的永生化的纹状体细胞中的敲入Htt等位基因(CAG111),说明ZFP例如30640,其驱动荧光素酶报告物的CAG重复长度依赖性阻遏,也能够阻遏来自具有扩大的CAG重复的内源Htt等位基因的表达。所示ZFP的mRNA采用mMessagemMachine试剂盒(安碧公司)产生,并且以指示剂量采用Amaxa核转染剂转染进入Hdh(Q111/Q7)细胞。为了检测来自野生型小鼠Htt等位基因的表达,在实时RT-PCR中采用正向引物CAGGTCCGGCAGAGGAACC(SEQIDNO:193)和反向引物TTCACACGGTCTTTCTTGGTGG(SEQIDNO:194);为了检测来自敲入Htt等位基因的表达,采用正向引物GCCCGGCTGTGGCTGA(SEQIDNO:195)和反向引物TTCACACGGTCTTTCTTGGTGG(SEQIDNO:196)。图3E显示测试HD患者源性的成纤维细胞系(GM21756,Coriell)中ZFP-TF30640和30657的结果,其分别在正常和突变Htt等位基因上具有15和70个CAG。首先建立基于SNP的等位基因特异性实时PCR试验以允许来自野生型或突变Htt等位基因的特异性检测。SNP(rs363099T/C)的定相通过Carroll等.(MolTher.(2011)19:2178-85)确定;“T”在正常等位基因上且“C”在突变等位基因上。为了检测来自突变型等位基因(099C)的Htt表达,来自成纤维细胞的cDNA通过实时PCR扩增(SsoFastEvaGreenSupermix,伯乐公司(Bio-Rad)),扩增采用正向引物099C.F(5’AGTTTGGAGGGTTTCTC,SEQIDNO:143)和反向引物099.R5(5’TCGACTAAAGCAGGATTTCAGG,SEQIDNO:144);退火/延伸温度为55.6℃。为检测来自野生型等位基因(099T)的Htt表达,进行成纤维细胞cDNA的实时PCR,其采用正向引物099T.F(5’AGTTTGGAGGGTTTCTT,SEQIDNO:145),反向引物099.R5和3’磷酸化的封闭寡聚物099T.BL(5’AGGGTTTCTCCGCTCAGC-3’磷酸化,SEQIDNO:146);退火/延伸温度为58.3℃。总人亨廷顿(hHtt,野生型和突变型等位基因)水平和标准化对照β肌动蛋白(ACTB)水平分别采用引物/探针Hs00918176_m1和4352935E(应用生物系统公司)通过实时PCR分析。对于图3E所示的试验,指示ZFP的mRNA采用mMessagemMachine试剂盒(安碧公司)产生,1μg的mRNA采用上述Amaxa核转染剂转染。细胞在转染后48小时收获;来自正常(CAG15,099T)、突变(CAG70,099C)Htt等位基因和总Htt(hHtt)的mRNA水平按上文所述定量并对ACTB水平进行标准化;各样品的Htt/ACTB比例进一步针对模拟转染的样品标准化。“强”CAG-靶向的ZFP30657阻遏两种等位基因,如同预期(基于其在HEK293细胞中的活性,图3A)。ZFP30640,其显示报告物的CAG重复长度依赖性阻遏,显示对于野生型等位基因的<10%的阻遏,而阻遏>90%的突变型等位基因。各样品的总Htt的水平与相同样品中野生型(wt)和突变Htt水平一致。还在正常成纤维细胞系以及包含Htt基因中不同的CAG重复长度的其它HD成纤维细胞系中测试ZFP-30640(参见图3F)。如上所述检测来自各等位基因的Htt表达。正常成纤维细胞系(CAG18/18)中没有观察到Htt阻遏。相反,在CAG15/67和CAG15/70细胞系中,于转染30640mRNA高和低剂量均观察到显著等位基因分型;突变型等位基因上具有中等CAG重复长度(CAG18/44和CAG18/45)的两种HD成纤维细胞系观察到类似结果-其中在30640的高和低剂量,扩大的等位基因被阻遏了约80%,而CAG18等位基因仍未被影响。总之,这些数据指示等位基因特异性阻遏物例如30640可在更普遍的疾病基因型例如CAG18/44和CAG18/45保持强CAG等位基因长度选择性。Western印迹分析用于显示ZFP例如30640在两种患者源性的成纤维细胞系中选择性地下调突变Htt蛋白质水平,证实qPCR试验所示的等位基因特异性调节(参见图3G)。ZFP通过mRNA转染(Amaxa核转染)以300ng的剂量递送进入4个重复的1.5e5细胞,并且在12孔板上铺板之前汇集。48小时时,清洗并收获细胞用于蛋白质提取制备。将约2.5μg的提取物加载至5%Tris-乙酸酯凝胶上,并通过MAB2166(密理博)检测。此外,将相同的样品加载至4-15%Tris-HCl凝胶上(伯乐),并采用标准方法转移供于通过作为上样对照的抗B肌动蛋白(1:20,000,西格玛)的检测。基于检测HttmRNA的qPCR研究,30640是靶向CAG重复的等位基因特异性阻遏物;32528是靶向转录起始位点(TS)的双等位基因阻遏物,并且30657是阻遏所用剂量的Htt等位基因的CAG-靶向的阻遏物。Western印迹显示,在HD患者源性的细胞系中,30640特异性地减少突变Htt(上方条带)的水平,而32528和30657类似地阻遏两种等位基因。实施例4:驱动Htt的等位基因特异性阻遏的其他CAG-靶向的ZFP设计。图4A显示测试ZFP-TF30640、30643、30645和33074(均靶向至CAG重复并采用KRAB阻遏结构域)在CAG18/45HD成纤维细胞系中的结果。所示的不同量的ZFPmRNA采用Amaxa核转染剂转染,突变Htt(右柱)、野生型Htt(中间柱)和总Htt(both等位基因,左柱)的表达如上所述在转染后24小时检测。ZFP30640、30645和33074在整个3μg-10ngZFPmRNA剂量范围驱动等位基因特异性阻遏;而30643似乎在30ng或更高的剂量显著阻遏两种等位基因,并且在10ng剂量开始显示等位基因选择性。图4B显示CAG15/70HD成纤维细胞系中,测试ZFP30643、30648、30657和30658(均靶向至CAG重复且采用KRAB阻遏结构域)的结果。所示的不同量的ZFPmRNA采用Amaxa核转染剂转染,突变Htt(右柱)、野生型Htt(中间柱)和总Htt(both等位基因,左柱)的表达如上所述在转染后24小时检测。相比在先前图中测试的ZFP(30640,30645和33074),这些ZFP在低剂量驱动突变Htt特异性阻遏。这些结果表明,取决于体内可达的ZFP表达水平(例如HD患者脑中),突变Htt的等位基因特异性阻遏可采用合适的ZFP设计实现。实施例5:替代性的含CAG的基因的阻遏采用实施例3中分离的RNA(图3E),分析含其它CAG重复的基因的阻遏,并且结果示于图5。采用实时PCR检测如下基因的表达水平,并针对肌动蛋白标准化:脊髓小脑性共济失调蛋白2抗体(“ATXN2”);发动蛋白(“DNM1”);F-箱仅蛋白质11(“FBXO11”)、硝酸还原酶(“NAP”);起点识别复合物亚基4(“ORC4”);磷酸激酶(“PHK”);OCT3/4蛋白质(“POU3”);含THAP结构域、凋亡相关的蛋白质2(“THAPII”);TATA结合蛋白(“TBP”);和斯钙素1(“STC1”)。此外,标示相对于转录起始位点(TS)的CAG重复序列的位置,并且在图3F中示作“TSS@”,其中“+”指示位于TSS下游的CAG重复的碱基位置,且“-“指示位于TSS上游的CAG重复位置。并且,对各基因显示CAG重复的数量(“#CAG”)。数据显示30640对突变扩大的Htt等位基因的阻遏是高特异性的,并且只有含CAG重复的基因的亚基(其CAG重复相对靠近其相应的转录起始位点)可能是ZFP(例如30640)的阻遏靶标。实施例6:Htt的等位基因特异性ZFP阻遏物的基因组范围特异性HD成纤维细胞(CAG18/45)经转染以通过微阵列分析研究CAG-靶向的ZFP的基因组范围特异性(图6)。ZFP以指示剂量通过mRNA转染(Amaxa核转染)递送-ZFP30640、30645和33074以六重方式分别以75ng、15ng和15ng剂量转染;GFP-KoxmRNA(150ng)经转染作为对照,并且用作运载体将所有用品中的转染的mRNA的总量带至150ng。通过等位基因特异性qPCR试剂在转染后24小时如上所述检测来自CAG18(099T,中间柱)和CAG45(099C,右柱)等位基因表达,其中各样品(1-6)是生物重复(分开转染)。Htt水平针对GAPDH的那些标准化。全部三个ZFP均观察到Htt的突变型等位基因特异性阻遏。然后选自四种最类似的重复如下用于微阵列分析(AffymetrixHGU133plus2.0):GFP重复1、3、4和6;30640重复2、3、5和6;30645重复2、3、5和6;和33074重复1、3、4和5用于微阵列分析。采用强多阵列平均化(RMA)来标准化来自各探针组的原始信号;采用T检验将ZFP-转染的样品与GFP-转染的样品做比较;采用相对于对照样品>2倍差异和T检验P值<0.05对基因(探针组)进行“变化”判定。基于该标准,30640仅阻遏两种基因,斯钙素1(STC1)和延伸的突触结合蛋白样蛋白质1(ESYT1);30645和33074各分别仅阻遏一种基因,STC1和白介素17受体A(ILR17RA)。Htt未检测为阻遏的(>2倍阻遏)基因,因为阵列上设定的Htt探针检测野生型和突变HttmRNA。该实验显示突变Htt特异性ZFP,当以驱动Htt的高效等位基因特异性阻遏的水平表达时,能够以极高的特异性基因组范围操作。实施例7:HD神经干细胞(NSC)中的等位基因特异性阻遏HDiPSC/ESC用Accutase酶传代,并培养在E8培养基中的基质胶被覆的板上(生命技术公司)。采用StemPro神经诱导培养基(生命技术公司)衍生神经干细胞。简言之,iPSC/ESC接种进入Geltrex被覆的6孔板中,以200,000细胞/孔接种,并且在10-20%融合时,将培养基更换为StemPro神经诱导培养基。培养基每2天更换,并且在第7天收获NSC并扩增。StemProNSCSFM培养基(生命技术公司)用于培养NSC。HDNSC(CAG17/69,源自CoriellGM23225iPSC)用1.5或0.5μgZFPmRNA,采用核转染法转染。转染后48小时细胞经收获并通过RT-PCR定量表达。Htt表达的等位基因特异性检测采用基于SNP(rs1143646)的基因分型试验#4351376(应用生物系统公司)进行。在测试的ZFP剂量,30640产生了对于突变Htt的等位基因特异性阻遏,30643产生了对于野生Htt的约50%的阻遏和对于突变Htt的约90%阻遏,且30648阻遏两种等位基因(图7);这些ZFP的结果与在HD成纤维细胞(图4)中的结果一致。各样品的总Htt水平(中间柱)与突变和野生型Htt水平一致。实施例8:分化的HD神经元中的Htt阻遏HDNSC用Accutase酶在Geltrex被覆的平板上传代。神经元分化通过将培养基更换成含StemPRONSCSFM培养基且不含(bFGF和EGF)的神经分化培养基来诱导。每3-4天更换培养基,持续至多21天。通过在神经分化培养基中培养,从NSC(CAG17/48,源自HDESC)衍生神经元。神经诱导后15天,细胞采用核转染,用1.0或0.5μgZFPmRNA转染。转染后48小时细胞经收获并通过RT-PCR定量基因表达。因为该患者系不含允许基于qPCR的野生型和突变Htt等位基因特异性检测的SNP,仅能检测总Htt水平。因为我们显示30640和33074不阻遏HD成纤维细胞和NSC中的CAG18或CAG17等位基因,在30640和33074处理的样品中观察到的总Htt的水平与突变型等位基因(CAG48)的等位基因特异性阻遏一致。30643和30648在测试剂量的ZFP的更有力的阻遏也与这些ZFP在HD成纤维细胞(图8)中的表现一致。实施例9:CAG靶向的阻遏物阻遏R6/2小鼠中的突变Htt转基因R6/2小鼠(携带具有约120个CAG重复的突变人Htt外显子1的转基因,参见Mangiarini等,(1996)Cell15:197)接受立体定向、双侧的3e10的由CMV启动子驱动编码ZFP30640-KOX或GFP的重组AAV2/6的载体基因组的纹状体注射。小鼠在5周龄注射并在8周龄处死用于分子分析。从各半球和切除左侧和右侧条纹并速冻。为评估突变Htt转基因的阻遏,采用TRIzolPlus(生命技术公司)从各纹状体提取总RNA,然后采用高能力RT(生命技术公司)进行cDNA合成。随后,R6/2转基因表达通过qPCR检测并针对三个参照基因(Atp5b,Eif4a2,UbC)的几何平均数进行标准化,如先前Benn等.((2008)MolecularNeurodegeneration:3,17)所述。相对于四种GFP处理的对照纹状体,我们观察到四种ZFP处理的纹状体中对于突变Htt转基因的统计学显著性的阻遏(P<0.001)(图9)。平均R6/2阻遏是GFP处理的对照的64.9%。因为采用单一立体定向注射和AAV2/6优先转导神经元细胞未实现纹状体的完全覆盖,观察到阻遏的比例(约35%)可能是对用AAV载体转导的实际细胞中的阻遏的低估。实施例10:采用具有二聚/多聚结构域的ZFP对突变Htt的选择性阻遏为了工程改造锌指转录因子以更好地区分短CAG和长GAG重复,我们追求同时减少个体锌指转录因子的DNA结合亲和力并增加结合至CAG重复内的亚位点附近的不同拷贝的融合蛋白之间的相互作用强度。为了减少个体锌指转录因子的DNA结合亲和力,我们产生了具有较少锌指和/或具有预期以低于最优的亲和力结合DNA的氨基酸序列的锌指结构域。为了增加结合至CAG重复内的亚位点附近的不同拷贝的融合蛋白之间的相互作用强度,我们将不同的二聚结构域融合至我们的锌指转录因子。该二聚结构域能以\平行\方式相互作用,并产生包含它们的融合蛋白的\头对头\或\尾对尾\二聚体。一种可能的二聚策略需要相同的ZFP-转录因子融合的阵列,其以\头对尾\方向结合,因此该策略需要以\反平行\方式相互作用的二聚结构域。参见例如McClain等.(2001)J.Am.Chem.Soc.123:3151-3152)并二聚化锌指肽(Giesecke等.(2006),MolecularSystemsBiology2:2006.2011)。二聚构建体CC1和CLAIM2基于反平行卷曲螺旋的对(McClain等,同上,Ghosh等.(2000)JAmChemSoc122:5658-5659)。二聚构建体CC3和CC4是CC2的截短形式,其分别缺乏4个残基或7个残基。二聚构建体DZ1,DZ2,DZ3和DZ4基于二聚化锌指结构域(Giesecke等,同上)的对。各例中,所述对的一个成员融合至锌指DNA结合结构域的N末端,并且所述对的另一个成员融合至锌指DNA结合结构域的C末端。采用富含甘氨酸和丝氨酸残基的短接头来将二聚结构域融合至锌指结合结构域。本发明的其它实施方式采用具有可变长度和/或氨基酸组成的接头。其中一种或多种残基被移去或一个或多个甘氨酸或丝氨酸残基变化成其它氨基酸残基的接头将降低这些接头的柔性,并且可改善长和短CAG重复之间的区分。为实现对突变Htt等位基因的选择性阻遏,ZFP以图1D和图10A和4B所示设计。图10C和10D显示多聚结构域的序列。图11A和11B说明设计以检测分别包含CC和DZ结构域的ZFP-TF阻遏其靶标的能力的实验结果。对于这些实验,指示的ZFP构建体(50ng)用pRL-Htt-CAG17(200ng)、pGL3-Htt-CAG47(200ng)和pVax-SEAP(分泌的碱性磷酸酶,10ng,用作标准化对照)转染进入HEK293细胞。转染后24小时检测荧光素酶活性和分泌的碱性磷酸酶活性。各样品的海肾荧光素酶(CAG17)/SEAP和萤火虫荧光素酶(CAG47)/SEAP比例针对仅报告物样品的那些标准化。以与pRL-Htt-CAG47报告物(参见实施例3)相同的方式构建pGL3-Htt-CAG47报告物,不同之处在于采用pGL-启动子构建体(普洛麦格)替代pRL-TK构建体。如图11A中所示,相较于具有相同的ZFP但不具有CC结构域的构建体,3种ZFP,当作为含有一种或多种CC结构域的构建体测试时,增强对于一种或两种报告物的阻遏。图11B显示DZ1和DZ3结构域增强32220对两种报告物的阻遏。这些结果表明,一般而言,CC和DZ结构域能增加多聚化的ZFP的亲和力,并且这种DNA结合结构域和二聚结构域的设计可产生最优的CAG-重复长度区分。实施例11:具有ZFP-ZFP-Kox设计的突变Htt的选择性阻遏在HD成纤维细胞中测试ZFP-ZFP-KOX设计的ZFPTF。在这些实验中,两种ZFPDNA结合结构域用柔性接头(LRQKDAARGSAAMAERPFQ,SEQIDNO:179)连接在一起,并融合至KOX阻遏结构域。接头位于保守的组氨酸和半胱氨酸之间。如上所述采用指示剂量的ZFPmRNA测试蛋白质。CAG18/45(图12A)和CAG20/41(图12B)HD成纤维细胞系中的这些结果显示,以该方式连接活性较低的ZFPDNA结合结构域可产生驱动等位基因特异性阻遏的复合ZFP。实施例12:小鼠细胞中Htt的活化还评估本文所述的ZFP活化Htt表达的能力。将靶向至小鼠Htt的+200~+467个碱基对区域(相对于转录起始位点)的ZFP融合至NFκBp65亚基的转录活化结构域。选择该靶向区域是因为在多种HD敲入小鼠模型中,该片段被来自人Htt的对应序列(主要是外显子1和一些内含子1序列)替代(Menalled等.(2003)J.Comp.Neurol4651:11-26;Wheeler等.(2000)HumMolGenet8:115-122),因此靶向至该区域的ZFP能够选择性地活化那些动物中的野生型等位基因而非该敲入等位基因。将ZFP转染进入Neuro2A细胞(在这些细胞中,两种Htt等位基因均为野生型),如实施例2中所述检测小鼠Htt和ACTBmRNA水平(重复转染和多重试验)。如图13所示,相较于模拟转染,采用两种ZFP-TF均检测到HttmRNA水平的增加。参见,图13A。增加的Htt蛋白质水平由Western印迹确认。参见,图13B。敲入Htt等位基因的生成示于图13C;序列比对(图13D)显示被替代的小鼠序列和对应的人序列之间的散度。图13E显示当将所述ZFP活化物转染进入源自HdhQ111/Q7敲入小鼠的永生化的纹状体细胞时,仅野生型Htt被选择性地活化。实施例13:Htt体内表达的调节为测试Htt特异性ZFPTF的体内功效,生成编码ZFP的AAV2载体。然后将这些基于AAV2的构建体递送至小鼠的脑。对于人Htt特异性ZFPTF,将AAV载体递送至R6/2小鼠或BACHD小鼠(C57Bl/6或FVB/N品系)来评估人转基因的阻遏,以及HD样表型的变化。对于小鼠Htt特异性ZFP(活化物或阻遏物),将AAV载体递送至野生型小鼠(C57Bl/6或FVB/N)或人Htt敲入小鼠(HdhQ111/Q7、HdhQ140/Q7或HdhQ175/Q7)以评估内源小鼠Htt表达的活化或阻遏。对于优先靶向CAG-扩大的等位基因的ZFP,将AAV载体递送至R6/2小鼠或人Htt敲入小鼠(HdhQ111/Q7、HdhQ140/Q7或HdhQ175/Q7)以检测对于野生型对比扩大的Htt等位基因的选择性阻遏。被处死之后,通过Taqman实时RT-PCR分析脑组织的Htt表达,并证明Htt基因通过ZFP-TF调控。转基因小鼠品系R6/2是成熟表征的HD动物模型,其中人Htt启动子和包含扩大的CAG重复的外显子1片段被异位表达(Mangiarini等.(1996)Cell87,493–506)。这些小鼠显示HD样表型行为变化,以及纹状体中型多棘神经元(MSN)的损失,这些是HD的标志。与MSN变性一致,已在R6/2小鼠中报告MSN标志物DARPP-32(Bibb等.2000,Proc.Natl.Acad.Sci.97(12):6809–6814),磷酸二酯酶10a(PDE10a)(Hebb等.2004Neuroscience,123(4):967-81),多巴胺受体D1(DRD1)和多巴胺受体D2(DRD2)(Cha等.1998Proc.Natl.Acad.Sci.95(11):6480–6485)的表达的减少。未测试遗传阻遏物ZFP-33074(其特异性地阻遏HD患者源性的成纤维细胞和神经元中的突变Htt等位基因)的体内功效,采用立体定向注射将AAV6-33074(即,包含遗传阻遏物的AAV6)双侧递送进入5周龄R6/2小鼠的纹状体。各纹状体在两个位点接受AAV注射,前侧和后侧输注的坐标分别是A/P+1.4,M/L+/-1.7,D/V-3.5和A/P+0.2,M/L+/-2.3,D/V–3.2。前侧位点接受5μl的AAV载体而后侧位点接受4μl载体。AAV6-33074载体的效价是1x1013载体基因组/ml。对照动物接受相同剂量的AAV6-GFP(即,包含绿色荧光蛋白的AAV6),在纹状体的相同位置给予。用AAV6-33074或AAV6-GFP注射的R6/2小鼠每周测试握抱行为,其为这些动物所示的常用运动缺陷(Mangiarini等.(1996)Cell87,493–506)。简言之,将各小鼠从其寝笼中移出,并置于笼盖上。然后,观察人员将动物温柔地以平滑移动方式向后上方拉直至该动物悬空在表面上约12英寸处。然后,对动物评分30秒。如果仅观察到前肢握抱,则对动物评分1。如果仅观察到后肢握抱,则对动物评分2。如果观察到前肢和后肢握抱,但非同时握抱,则对动物评分3。完全握抱,定义为同时的、前肢与后肢握抱拉紧成团,评分4(参见图16)。30秒悬空后,将动物送返其寝笼。对于各处理组,以及年龄匹配的野生型同窝出生鼠仔,确定每周各次观察时显示完全握抱(评分4)的动物的比例。相较于AAV6-GFP处理的动物,AAV6-33074处理的R6/2小鼠在7和12周龄之间(动物被处死用于表达分析时)显示握抱频率减少;该减少在9和12周龄时是统计学显著性的(卡方分析,p<0.05)(图17)。该结果显示突变Htt的遗传阻遏物,ZFP-33074,改善了握抱行为(R6/2小鼠中成熟表征的运动缺陷)。R6/2小鼠的纹状体中突变Htt和MSN标志物DARPP-32的表达水平通过免疫组化检测。AAV-33074注射7周后,R6/2小鼠用戊巴比妥深度麻醉并通过升主动脉灌注等张盐水,然后灌注250mL冰冷的0.1M磷酸盐缓冲液中的4%多聚甲醛(pH7.4)。切除脑并在相同溶液中后固定过夜,然后转移至25%蔗糖,然后在冷冻台显微镜用薄片切片机上以40μm切片。切片在PBS中清洗并室温于0.3%曲通X-10020%标准山羊血清/PBS(封闭溶液)中封闭4小时。兔抗DARPP-32抗体(细胞信号转导公司)和小鼠抗突变Htt抗体(密理博)于4℃在封闭溶液中孵育24小时。随后,切片在PBS中清洗,含Alexa555驴抗兔(生命技术公司)和Alexa488山羊抗小鼠(生命技术公司)的0.3%曲通X-100/PBS中孵育2小时。最后,切片在PBS中清洗,用DAPI(英杰公司)孵育10分钟并用盖玻片固定用于荧光显微镜检分析。在AAV-33074注射的纹状体区域中观察到减少的突变Htt染色;重要的是,在相同区域中观察到增加的DARRP-32染色,表明突变Htt的遗传阻遏物,ZFP-33074下调减少了MSN变性。还采用实时PCR(Taqman)试验检测了突变Htt和MSN标志物的表达水平。AAV载体输注(AAV-ZFP或AAV-GFP)后7周,R6/2小鼠纹状体经分离并切成前侧、中间和后侧区域,并分别速冻。用TRIzolPlusRNA纯化试剂盒(生命技术公司)从各纹状体区域分离总RNA,并且用500ngRNA,采用高能力cDNA反转录试剂盒(生命技术公司)在20-ul反应中产生cDNA。然后,在实时PCR反应中采用第100cDNA来确定感兴趣的基因的水平(野生型小鼠Htt,突变Htt转基因,DARPP-32,PDE10a,DRD1和DRD2),以及标准化基因(Atp5b,Eif4a2,UbC)的水平;标准化基因基于Benn等(2008)MolecularNeurodegeneration3:17选择。用于小鼠DARPP-32,PDE10a,多巴胺受体D1,多巴胺受体D2,Atp5b,Eif4a2和UbC的引物/探针组购自IDT;用于小鼠Htt的引物/探针购自生命技术公司,且用于突变Htt转基因的引物/探针如Benn等,同上所述。引物/探针组的序列列于表3。实时PCR试验采用SsoFast探针主混物(伯乐)以384孔板形式在CFX-384实时PCR仪器(伯乐)上按照生产商说明进行。表达分析采用CFX处理软件(v3.0)进行。简言之,各感兴趣基因和标准化基因的表达水平以三重反应方式检测并采用跨越125倍浓度范围(五倍连续稀释)的标准曲线定量。各感兴趣基因的表达水平针对来自相同样品的三种标准化基因的平均水平标准化(感兴趣的基因/标准化基因比例);然后,将各样品的这一比例向全部AAV-GFP处理的样品的平均值(设为1)比例化,并作图。使用双尾斯氏t检验评估统计学显著性。对于DARPP-32,表达是接受GFP对照的小鼠中表达的178%,而PDE10a,Drd1和Drd2分别是GFP对照中表达的184%,189%和162%。相对于AAV-GFP处理的纹状体,AAV-ZFP-33074处理的纹状体显示约60%的突变Htt阻遏(P<0.001),而野生型小鼠Htt的表达不变。ZFP处理的纹状体也在所测全部中等多棘神经元(MSN)标志物中显示统计学显著性的增加(DARPP-32、PDE10A、DRD1和DRD2),表明突变Htt的遗传阻遏物,ZFP-33074,减少R6/2小鼠中的纹状体MSN变性(图17)。表3:Taqman引物/探针组(全部序列为5’-3’)实施例14:神经营养因子和HDHtt等位基因特异性ZFPTF的共转染上文鉴定的Htt特异性ZFPTF与对脑神经营养因子具有特异性的ZFPTF共转染。所用的对脑神经营养因子具有特异性的ZFPTF对GDNF或BDNF具有特异性。实施例15:Htt-靶向的锌指核酸酶(ZFN)的设计和构建靶向人Htt和小鼠Htt的ZFN经设计以靶向侧接CAG重复的序列、第一编码ATG附近的序列、终止密码子,以及早期外显子。ZFN经设计并纳入基本如下所述的质粒或腺病毒载体,Urnov等.(2005)Nature435(7042):646-651,Perez等(2008)NatureBiotechnology26(7):808-816和美国专利公开2008/0131962。实施例16:Htt特异性ZFN的切割活性为了测试切割活性,将编码上述人Htt特异性ZFN对的质粒转染进入K562细胞。K562细胞从美国模式培养物保藏所获得,并且按照推荐于补充10%定量胎牛血清(FCS,Cy克隆)的F-12培养基(英杰公司)中生长。采用TrypLESelectTM蛋白酶(英杰公司)使细胞从塑料器皿上分离。对于转染,将一百万K562细胞与2μg锌指核酸酶质粒和100μLAmaxa溶液T混合。细胞在AmaxaNucleofectorIITM中采用U-23程序转染,并回收进1.4mL暖F-12培养基+10%FCS。收获基因组DNA,并且涵盖所需的切割位点的Htt基因座的部分经PCR扩增。采用AccuprimeHiFi聚合酶(英杰公司)的PCR如下进行:在最初3分钟变性(94℃)后,进行30个循环的PCR,持续30秒变性步骤(94℃),然后在58℃进行30秒退火步骤,然后68℃进行30秒延伸步骤。30循环完成后,反应在68℃孵育7分钟,然后在10℃不定孵育。来自K562Htt特异性ZFN处理的细胞的基因组DNA通过SurveyorTM核酸酶(转基因组公司(Transgenomic))检测,如下所述,例如,美国专利公开号20080015164;20080131962和20080159996。编码小鼠Htt特异性ZFN的对的质粒在Neuro-2a细胞中以类似方式测试。图14A和B显示,ZFN能够以8-40%的基因修饰效率靶向Htt基因,通过观察到的插入缺失量如上所述分析。实施例17:变化长度的三核苷酸重复的靶向整合以靶向整合策略,采用上述对于CAG重复侧接序列具有最大切割活性的Htt特异性ZFN将不同长度的CAG重复引入Htt野生型拷贝。构建包含50、80、109和180重复CAG单元的供体。然后将这些供体转染进入带有编码上述Htt特异性ZFN质粒的K562细胞。供体整合的验证通过基因组DNA分离、PCR扩增(如上所)随后对感兴趣区域测序来验证。采用在K562细胞中鉴定的导致供体等位基因靶向整合进入Htt等位基因的ZFN来将不同长度的供体核酸插入人胚胎干细胞(hESC)。成功的供体整合通过基因组DNA分离、PCR和上述测序来验证。实施例18:野生型和/或突变Htt的破坏/敲出作为非同源末端连接(NHEJ)的结果,在早期外显子中切割的ZFN可导致小插入或缺失(in-del),这可产生具有一个或两个Htt等位基因被破坏的细胞模型。指示的ZFN对如上所述制备并采用实施例8所述的CelI错配测试切割活性。这些ZFN对靶向人Htt的早期外显子,因此可用于敲出野生型或突变Htt等位基因。如图14A所示,ZFP对29627/29628、29631/29632(外显子12)和29637/29638(外显子18)切割Htt基因并因此能用于产生敲出细胞系。实施例19:野生型和HDHtt等位基因的表达标记采用对第一或最后编码外显子具有最大切割活性的ZFN,用不同的报告蛋白质标记野生型和突变Htt等位基因。各报告物(A和B)的供体DNA基于前导ZFN对的切割位点设计以允许报告物基因的靶向整合以产生与Htt的框内融合。供体DNA用前导ZFN对共转染进入K562细胞,用于选择产生最高整合频率的供体DNA构建体。ZFN对如上所述制备并采用实施例8所述的CelI错配测试切割活性。ZFN对用于靶向Htt编码序列的3’端,并因而可用于靶向野生型或突变Htt等位基因。如图14B所示,ZFP对25917/25916,25920/25921和25923/25922能够切割Htt基因并因此能用于引入报告物标签。所选的用于报告物A和对应的ZFN供体DNA构建体被递送进入源自携带突变Htt基因的对象的细胞(例如成纤维细胞、诱导型多潜能细胞)。克隆经衍生并针对报告物A的靶向整合进行筛选。杂合事件是希望的并且通过PCR鉴定靶向等位基因。选择含单一报告物标签的Htt等位基因和在其它等位基因上含未经修饰的ZFN靶序列的克隆;对于报告物B和对应的ZFN的供体构建体经转染以用报告物B标记第二等位基因。所得小鼠胚胎干细胞克隆包含野生型Htt等位基因和突变型等位基因,其由两种不同的标志物标记,允许跟踪来自各等位基因的表达;这些细胞用于采用标准方案产生三核苷酸重复病症的小鼠模型。实施例20:构建针对Htt的活性TALE-TF蛋白TALEDNA结合结构域连接至来自Kox1蛋白质的KRAB阻遏结构域(TALETF)并用于测试HD患者(CAG20/41)源性的成纤维细胞中Htt基因的阻遏。TALE蛋白的构建如前所述进行(参见美国专利号8,586,526;和美国专利号20130196373,其均通过引用纳入本文),并且用三种不同的C末端结构+63,+231和+278构建,如美国专利号8,586,526中所述。为了构建TALETF表达质粒,采用如前所述的TALEN表达质粒(参见美国专利号8,586,526)不同之处在于TALEN中所用的FokI结构域被KRAB阻遏结构域替代。TALE蛋白C末端和KRAB结构域的连接如下显示,其中KRAB结构域序列下划线表示。粗体和斜体部分指示三重旗帜标签,粗体部分指示核定位序列,“[重复]”指示TALE重复单元阵列的位置(完全重复加C末端半重复),波浪下划线部分显示KRAB结构域的序列:TALE-C63-Kox1:MMAGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN[重复]GGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSKSSV(SEQIDNO:197)TALE-C231-Kox1:MMAGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN[重复]GGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGSGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPW(SEQIDNO:198)TALE-C278-Kox1MMAGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN[重复]GGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQGSGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVEREIHQETHPDSETAFEIKSSV(SEQID碱基识别采用基于典型RVD的相关性进行(\TALE码”:NI为A,HD为C,NN为G(半重复中的NK),NG为T)。在一些TALETF中,该蛋白质经设计以结合DNA的正义(5’-3’)链,而在其它情况中,TALETF经设计以结合至反义(3’-5’)链。该组TALETF经设计以靶向Htt基因的CAG重复。TALEDNA结合蛋白通常优先与靶标5’端的‘T’核苷酸碱基相互作用,并且由此靶标是CAG重复区域,可预期结合至反义DNA链因而具有位于靶标5’端处的碱基‘T’的CTG重复序列的蛋白质可能具有较高的结合亲和力和特异性,以及由此所得的阻遏物活性。所测试的TALETF的靶标和数值标识符示于下表4。数值标识符是标记的“SBS#”,对于正义或反义链的特异性指示为(“S/A”),以及靶标,重复单元或RVD的数量,和C末端类型。表4:Htt特异性TALE-TF然后测试表中TALETF在HD患者(CAG20/41)源性的成纤维细胞中的Htt阻遏,结果示于图15。该实验中,细胞用1000、100或10ng的TALE-TF编码mRNA转染。各TALETF试验的结果以三组显示,代表三种转染的mRNA的量。在各组中,也有三个样品:左柱指示总Htt表达,中间柱指示来自CAG20Htt等位基因的表达,且右柱指示来自CAG41Htt等位基因的表达。数据显示存在能够阻遏两种Htt等位基因(参见例如102454)的一些TALETF,而其他TALETF能够选择性地抑制具有扩大的CAG重复的突变Htt(参见例如102451和102472)。本文中提及的所有专利、专利申请和出版物均以参考的方式用全文纳入本文。尽管出于理解清楚的目的,本发明通过说明和示例的方式提供了一些细节,但本领域技术人员可理解在不偏离本发明的精神或范围的情况下可实施各种改变和改进。因此,上述说明和实施例不应理解为是限制性的。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1