用于治疗血红蛋白病的材料和方法与流程

文档序号:17589229发布日期:2019-05-03 21:37阅读:366来源:国知局
用于治疗血红蛋白病的材料和方法与流程
本申请提供用于离体和体内治疗患有血红蛋白病的患者的材料和方法。此外,本申请提供通过基因组编辑来缺失、调节或灭活细胞中b细胞淋巴瘤11a(bcl11a)基因的转录控制序列的材料和方法。相关申请本申请要求2016年4月18日提交的美国临时申请62/324,024;2016年9月1日提交的美国临时申请62/382,522;和2016年12月2日提交的美国临时申请62/429,428的权益,其全部内容通过引用并入本文。通过引用序列表并入本申请包括计算机可读形式的序列表(文件名:160077pct序列表;14,446,299字节-ascii文本文件;创建于2017年4月7日),其全部内容通过引用并入本文并形成本公开的一部分。背景血红蛋白病包括遗传起源的贫血,其导致红细胞的产生减少和/或破坏增加。这些病症还包括遗传缺陷,其导致异常血红蛋白的产生,无法维持氧浓度。这些病症中的许多被称为β-血红蛋白病,因为它们不能以足够的量产生正常的β-珠蛋白,或者不能完全产生正常的β-珠蛋白。例如,β-地中海贫血是由β-珠蛋白基因表达的部分或完全缺陷引起的,导致成人血红蛋白(hba)缺陷或缺失。镰状细胞性贫血是由β-珠蛋白结构基因的点突变引起的,导致产生异常的血红蛋白(hbs)(atweh,semin.hematol.38(4):367-73(2001))。血红蛋白病导致血液的携氧能力降低,这可以特别是在锻炼时导致诸如疲劳、头晕和呼吸短促的症状。对于被诊断患有血红蛋白病的患者,目前只有少数对症治疗可用,诸如输血,以增加血氧水平。基因组工程是指对生物体的遗传信息(基因组)进行靶向的特定修饰的策略和技术。基因组工程是一个非常活跃的研究领域,因为它具有广泛的可能应用,特别是在人类健康领域;例如,修正携带有害突变的基因或探究基因的功能。开发用于将转基因插入活细胞的早期技术通常受限于新序列插入基因组的随机性质。随机插入基因组可能会导致破坏相邻基因的正常调控,从而导致严重的不想要的效应。另外,随机整合技术几乎不提供可重复性,因为不能保证序列将在两个不同细胞中的相同位置插入。最近的基因组工程策略,诸如zfn、talen、he和megatal,能够修饰dna的特定区域,从而与早期技术相比增加了校正或插入的精确度。这些较新的平台提供更大程度的可重复性,但仍有其局限性。尽管有全世界一直在尝试解决血红蛋白病的研究人员和医疗专业人员的努力,仍然迫切需要开发安全有效的血红蛋白病治疗。发明概述本公开提供一种解决血红蛋白病的遗传基础的方法。通过使用基因组工程工具来产生基因组的永久性变化,这些变化可以用单一处理来缺失、调节或灭活bcl11a基因的转录控制序列,所得疗法可以减轻血红蛋白病的效应。本文提供通过缺失、调节或灭活bcl11a基因的转录控制序列来产生基因组的永久性改变的细胞离体和体内方法,其可以用于治疗血红蛋白病。本文还提供用于执行此类方法的组分、试剂盒和组合物。还提供通过此类方法产生的细胞。血红蛋白病的实例可以是镰状细胞性贫血和地中海贫血(α、β、δ、γ及其组合)。本文提供一种通过基因组编辑来编辑人细胞中的b细胞淋巴瘤11a(bcl11a)基因的方法,该方法包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入人细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb)的步骤,这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。转录控制序列可以位于bcl11a基因的第二内含子内。转录控制序列可以位于bcl11a基因的+58dna超敏位点(dhs)内。本文还提供一种用于治疗患有血红蛋白病的患者(例如,人)的离体方法,该方法包括以下步骤:产生患者特异性诱导的多能干细胞(ipsc);在ipsc的bcl11a基因或编码该bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;将基因组编辑的ipsc分化成造血祖细胞;以及将该造血祖细胞植入患者体内。产生患者特异性诱导的多能干细胞(ipsc)的步骤可以包括:从患者体内分离体细胞;并将一组多能性相关基因引入该体细胞以诱导体细胞成为多能干细胞。该体细胞可以是成纤维细胞。这组多能性相关基因可以是选自oct4、sox2、klf4、lin28、nanog和cmyc的基因中的一种或多种。在ipsc的bcl11a基因或编码该bcl11a基因的调控元件的其他dna序列内或其附近进行编辑的步骤可以包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入ipsc中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。将基因组编辑的ipsc分化成造血祖细胞的步骤可以包括以下一者或多者:用小分子的组合处理、递送转录因子(例如,主转录因子)或递送编码转录因子(例如,主转录因子)的mrna。将造血祖细胞植入患者体内的步骤可以包括通过移植、局部注射、全身输注或其组合将造血祖细胞植入患者体内。本文还提供一种用于治疗患有血红蛋白病的患者(例如,人)的离体方法,该方法包括以下步骤:从患者体内分离间充质干细胞;在该间充质干细胞的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;将基因组编辑的间充质干细胞分化成造血祖细胞;以及将该造血祖细胞植入患者体内。间充质干细胞可以从患者的骨髓或外周血中分离。从患者体内分离间充质干细胞的步骤可以包括抽吸骨髓和使用密度梯度离心介质分离间充质细胞。在间充质干细胞的bcl11a基因或编码该bcl11a基因的调控元件的其他dna序列内或其附近进行编辑的步骤可以包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入间充质干细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。将基因组编辑的间充质干细胞分化成造血祖细胞的步骤可以包括以下一者或多者:用小分子的组合处理、递送转录因子(例如,主转录因子)或递送编码转录因子(例如,主转录因子)的mrna。将造血祖细胞植入患者体内的步骤可以包括通过移植、局部注射、全身输注或其组合将造血祖细胞植入患者体内。本文还提供一种用于治疗患有血红蛋白病的患者(例如,人)的离体方法,该方法包括以下步骤:从患者体内分离造血祖细胞;在造血祖细胞的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;以及将基因组编辑的造血祖细胞植入患者体内。该方法可以进一步包括在从患者体内分离造血祖细胞的步骤之前用粒细胞集落刺激因子(gcsf)治疗患者。用粒细胞集落刺激因子(gcsf)治疗患者的步骤可以与plerixaflor组合执行。从患者体内分离造血祖细胞的步骤可以包括分离cd34+细胞。在造血祖细胞的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑的步骤可以包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入造血祖细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。将基因组编辑的造血祖细胞植入患者体内的步骤可以包括通过移植、局部注射、全身输注或其组合将基因组编码的造血祖细胞植入患者体内。本文还提供一种用于治疗患有血红蛋白病的患者(例如,人)的体内方法,该方法包括编辑患者的细胞中的bcl11a基因的步骤。编辑患者的细胞中的bcl11a基因的步骤可以包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入该细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制的永久性缺失、调节或灭活。该细胞可以是骨髓细胞、造血祖细胞、cd34+细胞或其组合。这一种或多种dna内切核酸酶可以是cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas100、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4或cpf1内切核酸酶;其同系物,其天然存在的分子、其密码子优化形式或其修饰形式的重组以及其组合。该方法可以包括将编码这一种或多种dna内切核酸酶的一种或多种多核苷酸引入该细胞中。该方法可以包括将编码这一种或多种dna内切核酸酶的一种或多种核糖核酸(rna)引入该细胞中。这一种或多种多核苷酸或一种或多种rna可以是一种或多种修饰的多核苷酸或一种或多种修饰的rna。这一种或多种dna内切核酸酶可以是一种或多种蛋白质或多肽。这一种或多种蛋白质或多肽可以在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。这一种或多种蛋白质或多肽可以侧接两个nls,一个nls位于n-末端且第二个nls位于c-末端。这一个或多个nls可以是sv40nls。该方法可以进一步包括将一种或多种导向核糖核酸(grna)引入该细胞中。这一种或多种grna可以是单分子导向rna(sgrna)。这一种或多种grna或一种或多种sgrna可以是一种或多种修饰的grna、一种或多种修饰的sgrna或其组合。这一种或多种修饰的sgrna可以在其5’末端和3’末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。修饰的sgrna可以是seqidno:71,959的核酸序列。这一种或多种dna内切核酸酶可以与一种或多种grna、一种或多种sgrna或其组合预复合,以形成一种或多种核糖核蛋白(rnp)。rnp中sgrna与dna内切核酸酶的重量比可以是1:1。sgrna可以包含seqidno:71,959的核酸序列,dna内切核酸酶可以是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,并且sgrna与dna内切核酸酶的重量比可以是1:1。该方法可以进一步包括将包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中。该方法可以进一步包括将一种导向核糖核酸(grna)和包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中。这一种或多种dna内切核酸酶可以是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近在基因座处实现一处单链断裂(ssb)或双链断裂(dsb),这有助于将来自多核苷酸供体模板的新序列在该基因座处插入染色体dna中,导致邻近该基因座的染色体dna的转录控制序列的永久插入、调节或灭活。grna可以包含与基因座的区段互补的间隔区序列。邻近可以指核苷酸在基因座的上游和下游。该方法可以进一步包括将一种或多种导向核糖核酸(grna)和包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中。这一种或多种dna内切核酸酶可以是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现或产生一对单链断裂(ssb)和/或双链断裂(dsb):第一断裂在5’基因座处且第二断裂在3’基因座处,这有助于将来自多核苷酸供体模板的新序列在5’基因座和3’基因座之间插入染色体dna中,导致在5’基因座和3’基因座之间的染色体dna的转录控制序列的永久插入、调节或灭活。一个导向rna可以产生一对ssb或dsb。这一种导向rna可以包含与5’基因座或3’基因座互补的间隔区序列。或者,该方法可以包括第一导向rna和第二导向rna。第一导向rna可以包含与5'基因座的区段互补的间隔区序列,且第二导向rna可以包含与3'基因座的区段互补的间隔区序列。供体模板可以是单链或双链的。修饰的转录控制序列可以位于bcl11a基因的第二内含子内。修饰的转录控制序列可以位于bcl11a基因的+58dna超敏位点(dhs)内。这一种或两种grna可以是一种或两种单分子导向rna(sgrna)。这一种或两种grna或一种或两种sgrna可以是一种或两种修饰的grna或一种或两种修饰的sgrna。这一种修饰的sgrna可以在其5’末端和3’末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。这一种修饰的sgrna可以是seqidno:71,959的核酸序列。这一种或多种cas9内切核酸酶可以与一种或两种grna或者一种或两种sgrna预复合,以形成一种或多种核糖核蛋白(rnp)。这一种或多种cas9内切核酸酶可以在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。这一种或多种cas9内切核酸酶可以侧接两个nls,一个nls位于n-末端且第二个nls位于c-末端。这一个或多个nls可以是sv40nls。rnp中sgrna与cas9内切核酸酶的重量比可以是1:1。这一种sgrna可以包含seqidno:71,959的核酸序列,该cas9内切核酸酶可以是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,并且sgrna与cas9内切核酸酶的重量比可以是1:1。插入可以通过同源性定向修复(hdr)进行。ssb、dsb、5'基因座和/或3'基因座可以位于bcl11a基因的第二内含子内。ssb、dsb、5'基因座和/或3'基因座可以位于bcl11a基因的+58dna超敏位点(dhs)内。该方法可以进一步包括将一种或多种导向核糖核酸(grna)引入该细胞中。这一种或多种dna内切核酸酶可以是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现或产生一对单链断裂(ssb)或双链断裂(dsb):第一ssb或dsb在5’基因座处且第二ssb或dsb在3’基因座处,这引起在5’基因座和3’基因座之间的染色体dna的缺失,导致在5’基因座和3’基因座之间的染色体dna的转录控制序列的永久缺失、调节或灭活。第一导向rna可以包含与5'基因座的区段互补的间隔区序列,且第二导向rna包含与3'基因座的区段互补的间隔区序列。一个导向rna可以产生一对ssb或dsb。这一个导向rna可以包含与5’基因座或3’基因座互补的间隔区序列。或者,该方法可以包括第一导向rna和第二导向rna。第一导向rna可以包含与5'基因座的区段互补的间隔区序列,且第二导向rna可以包含与3'基因座的区段互补的间隔区序列。这一种或多种grna可以是一种或多种单分子导向rna(sgrna)。这一种或多种grna或一种或多种sgrna可以是一种或多种修饰的grna或一种或多种修饰的sgrna。这一种修饰的sgrna可以在其5’末端和3’末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。这一种修饰的sgrna可以是seqidno:71,959的核酸序列。这一种或多种cas9内切核酸酶可以与一种或多种grna或者一种或多种sgrna预复合,以形成一种或多种核糖核蛋白(rnp)。这一种或多种cas9内切核酸酶可以在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。这一种或多种cas9内切核酸酶可以侧接两个nls,一个nls位于n-末端且第二个nls位于c-末端。这一个或多个nls可以是sv40nls。rnp中sgrna与cas9内切核酸酶的重量比可以是1:1。这一种sgrna可以包含seqidno:71,959的核酸序列,该cas9内切核酸酶可以是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,并且sgrna与cas9内切核酸酶的重量比可以是1:1。5'基因座和/或3'基因座可以位于bcl11a基因的第二内含子内。5'基因座和/或3'基因座可以位于bcl11a基因的+58dna超敏位点(dhs)内。可以将cas9或cpf1mrna、grna和供体模板配制成单独的脂质纳米粒子或共配制成脂质纳米粒子。可以将cas9或cpf1mrna配制成脂质纳米粒子,并且grna和供体模板可以通过腺相关病毒(aav)载体递送到细胞。可以将cas9或cpf1mrna配制成脂质纳米粒子,并且grna可以通过电穿孔递送到细胞且供体模板可以通过腺相关病毒(aav)载体递送到细胞。这一种或多种rnp可以通过电穿孔递送至细胞。在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近的编辑可以降低bcl11a基因表达。bcl11a基因可以位于染色体2:60,451,167-60,553,567(基因组参考聚生体-grch38)上。本文还提供一种或多种导向核糖核酸(grna),其用于编辑来自患有血红蛋白病的患者的细胞中的bcl11a基因。这一种或多种grna可以包含选自序列表的seqidno:1-71,947中的核酸序列的间隔区序列。这一种或多种grna可以是一种或多种单分子导向rna(sgrna)。这一种或多种grna或一种或多种sgrna可以是一种或多种修饰的grna或一种或多种修饰的sgrna。这一种或多种修饰的sgrna可以在其5’末端和3’末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。这一种或多种修饰的sgrna可以包含seqidno:71,959的核酸序列。本文还提供一种包含seqidno:71,959的核酸序列的单分子导向rna(sgrna)。应理解,本说明书中描述的发明不限于技术实现要素:中概述的实施例。本文描述并举例说明了各种其他方面。附图简述通过参考附图可以更好地理解本说明书中公开并描述的用于治疗血红蛋白病的材料和方法的各个方面,其中:图1a-c显示包含化脓链球菌cas9内切核酸酶的密码子优化的基因的质粒。图1a是包含化脓链球菌cas9内切核酸酶的密码子优化的基因的质粒(ctx-1)。ctx-1质粒还包含grna支架序列,其包含来自序列表的seqidno:1-29,482中列出的序列的20bp间隔区序列。图1b是包含化脓链球菌cas9内切核酸酶的不同密码子优化的基因的质粒(ctx-2)。ctx-2质粒还包含grna支架序列,其包含来自序列表的seqidno:1-29,482中列出的序列的20bp间隔区序列。图1c是包含化脓链球菌cas9内切核酸酶的又一不同密码子优化的基因的质粒(ctx-3)。ctx-3质粒还包含grna支架序列,其包含来自序列表的seqidno:1-29,482中列出的序列的20bp间隔区序列。图2a-b描绘了ii型crispr/cas系统。图2a描绘包括grna的ii型crispr/cas系统。图2b描绘包括sgrna的ii型crispr/cas系统。图3显示在cd34+造血干细胞和祖细胞(hspc)以及每种不同的所得hpfh基因型中的dna编辑的速率。图4a-c显示在从来自移动性外周血(mpb)的批量编辑的人cd34+hspc分化的红细胞中γ-珠蛋白表达的上调。图4a描绘从人cd34+hspc到红细胞的造血作用。图4b显示每种缺失/修饰的γ/18srna的比率。图4c显示每种缺失/修饰的γ/α的比率。图5a-b显示在从来自人cd34+hspc的所有基因编辑的集落分化的红细胞中γ-珠蛋白表达的上调。图5a显示每种基因编辑的集落的γ/α珠蛋白mrna比率(%)。图5b显示每种基因修饰的平均γ/α珠蛋白mrna比率(%)。图6显示在人cd34+hspc衍生的红细胞集落中dna编辑的bcl11a内含子(spy101)率。图7a-b显示在从基因编辑的人mpbcd34+hspc分化的单细胞集落中spy101基因型和γ-珠蛋白表达之间的相关性。图7a显示每种基因编辑的集落的γ-珠蛋白与α-珠蛋白的百分比(hbg/hba)。图7b显示每种基因编辑的集落的β-样珠蛋白的百分比(hbg/(hbb+hbg))。图8显示在人mpbcd34+细胞中几种grna的靶上编辑功效。图9a-b显示用于检测脱靶编辑的杂交捕获测定和使用来自编辑的人mpbcd34+hspc的杂交捕获测定产生的结果。图9a显示用于检测潜在脱靶位点处的编辑活性的杂交捕获测定的示意图。图9b显示通过杂交捕获测序观察到的脱靶活性。图10a-b显示在来自scd患者、β-地中海贫血患者和健康供体的细胞中测量的珠蛋白mrna水平的比率。图10a显示,与健康供体相比,在来自scd患者的细胞中测量的珠蛋白mrna水平的比率。图10b显示,与健康供体相比,在来自β-地中海贫血患者的细胞中测量的珠蛋白mrna水平的比率。图11a-c显示用于检测各种基因编辑的细胞群体的流式细胞术策略和使用该流式细胞术策略产生的结果。图11a显示人mpbcd34+hspc亚群、相关表面标志物和流式细胞术门控策略。图11b显示在模拟和编辑条件下细胞类型的相似分布。图11c显示,与批量相比,跨亚群的相似高编辑效率。图12显示人mpbcd34+hspc移植后8周在nsg小鼠中人cd45ra+细胞群体的分析。数据点代表个体动物并描绘作为人cd45ra+活细胞的活细胞的百分比。图13显示在实验室和临床相关量表中在人mpbcd34+hspc中spy101grna和cas9蛋白的平均编辑功效。图14显示glp/毒理学研究设计的概述。图15显示用于在衍生自crispr/cas9基因编辑的人mpbcd34+hspc的红细胞群体中血红蛋白mrna和蛋白质水平的批量和单细胞集落分析的实验方法的概述。图16a-b显示用不同靶向编辑修饰的批量分化的人mpbcd34+hspc中的γ-珠蛋白mrna和蛋白质上调。图16a显示用不同靶向编辑修饰的批量分化的人mpbcd34+hspc中的γ-珠蛋白mrna上调。图16b显示用不同靶向编辑修饰的批量分化的人mpbcd34+hspc中的γ-珠蛋白上调。图17显示用不同靶向编辑修饰的分化的人mpbcd34+hspc的个体集落中的平均γ-珠蛋白上调。图18a-b显示在红细胞分化的人mpbcd34+hspc的靶5和靶6编辑的集落中的基因型与表型的相关性。图18a包括左侧的图表,其显示具有每种基因型的集落的百分比,以及右侧的图表,其显示具有每种水平的γ-珠蛋白上调的集落的百分比(表示为γ/(γ+β)珠蛋白mrna比)。图18b显示具有相似基因型的集落组的mrna转录物水平。图19显示用于自基因组dna的编辑效率、mrna实现的血红蛋白表达以及在源自crispr/cas9基因编辑的人mpbcd34+hspc的红细胞分化细胞群体中的蛋白质的批量分析的实验方法的概述。图20a-b显示用spy101grna或sd2grna编辑的mpbcd34+hspc的离体红细胞分化期间维持的基因编辑的百分比。图20a显示用spy101grna编辑的mpbcd34+hspc的离体红细胞分化期间维持的基因编辑的百分比。图20b显示用sd2grna编辑的mpbcd34+hspc的离体红细胞分化期间维持的基因编辑的百分比。图21a-d显示在红细胞分化后第11天或第15天在基因编辑的mpbcd34+hspc中描绘为γ/α或γ/(γ+β)的γ-珠蛋白转录物的增加。图21a显示在分化后第11天在基因编辑的mpbcd34+hspc中γ-珠蛋白转录物(γ/α)的增加。图21b显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白转录物(γ/α)的增加。图21c显示在分化后第11天在基因编辑的mpbcd34+hspc中γ-珠蛋白转录物(γ/(γ+β))的增加。图21d显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白转录物(γ/(γ+β))的增加。图22a-b是显示在红细胞分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白的上调的facs分析和中值荧光强度(mfi)分析。图22a是显示在红细胞分化后15天在基因编辑的mpbcd34+hspc中γ-珠蛋白的上调的facs分析。图22b是显示在红细胞分化后在来自四种供体的基因编辑的mpbcd34+细胞中γ-珠蛋白的平均上调的mfi分析。图23a-d是显示在红细胞分化后第15天在基因编辑的mpbcd34+hspc中描绘为γ/α或γ/(γ+β)的γ-珠蛋白的上调的批量液相色谱质谱(lc-ms)数据。图23a是显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白(γ/α)的上调的批量液相色谱质谱(lc-ms)数据。图23b是显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白(γ/α)的上调的批量液相色谱质谱(lc-ms)数据,其标准化成在用gfpgrna转染的mpbcd34+hspc中的γ-珠蛋白(γ/α)。图23c是显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白(γ/(γ+β))的上调的批量液相色谱质谱(lc-ms)数据。图23d是显示在分化后第15天在基因编辑的mpbcd34+hspc中γ-珠蛋白(γ/(γ+β))的上调的批量液相色谱质谱(lc-ms)数据,其标准化成在用gfpgrna转染的mpbcd34+hspc中的γ-珠蛋白(γ/α)。图24描绘杂交捕获诱饵设计。图25显示描绘杂交捕获方法检测插入缺失的能力的图表。图26显示自使用spy101grna的杂交捕获实验产生的数据的总结。图27显示自使用sd2grna的杂交捕获实验产生的数据的总结。图28显示移植实验的研究计划。图29a-e显示未处理的小鼠以及注射模拟编辑的细胞、gfpgrna编辑的细胞、spy101grna编辑的细胞或sd2grna编辑的细胞的小鼠的8周临时出血分析数据。图29a显示未处理(untx)小鼠的8周临时出血分析数据。图29b显示注射模拟编辑的细胞的小鼠的8周临时出血分析数据。图29c显示注射gfpgrna编辑的细胞的小鼠的8周临时出血分析数据。图29d显示注射spy101grna编辑的细胞的小鼠的8周临时出血分析数据。图29e显示注射sd2grna编辑的细胞的小鼠的8周临时出血分析数据。图30显示平均8周临时出血分析数据。图31显示与用与spy101grna复合的cas9蛋白(核糖核蛋白复合物,rnp)电穿孔的人mpbcd34+hspc相比,用各种cas9mrna和spy101grna(mrna1-8)电穿孔的人mpbcd34+hspc的插入缺失%。图32a-b显示与用与spy101grna复合的cas9蛋白(rnp)电穿孔的人mpbcd34+hspc相比,用各种cas9mrna和spy101grna(mrna1-8)电穿孔的人mpbcd34+hspc的标准化细胞计数和细胞活力。图32a显示与用与spy101grna复合的cas9蛋白(rnp)电穿孔的人mpbcd34+hspc相比,用各种cas9mrna和spy101grna(mrna1-8)电穿孔的人mpbcd34+hspc在电穿孔后48小时的细胞计数成倍增加。图32b显示与用与spy101grna复合的cas9蛋白(rnp)电穿孔的人mpbcd34+hspc相比,用各种cas9mrna和spy101grna(mrna1-8)电穿孔的人mpbcd34+hspc在电穿孔后48小时的细胞活力。图33a-c显示用于cas9rnp优化的几种cas9rnp构建体和与每种cas9rnp构建体相关的插入缺失%。图33a显示几种cas9rnp构建体。图33b显示使用1μgcas9:1μgspy101grna的每种cas9rnp构建体的插入缺失%。图33c显示使用3μgcas9:3μgspy101grna的每种cas9rnp构建体的插入缺失%。图34a-b显示在非临床和临床规模下用cas9mrna或cas9蛋白(feldan或aldevron)处理的人mpbcd34+hspc的基因编辑效率(%)。图34a显示在非临床规模下用cas9mrna或cas9蛋白(feldan或aldevron)处理的人mpb或骨髓(bm)衍生的cd34+hspc的基因编辑效率(%)。图34b显示在临床规模下用cas9蛋白(aldevron)处理的人mpbcd34+hspc的基因编辑效率(%)。图35a-b显示对于用cas9mrna和spy101grna或与spy101grna复合的cas9蛋白(feldan或aldevron)处理的细胞通过呈现γ/α珠蛋白mrna比率(%)和γ/(γ+β)珠蛋白mrna比率(%)得到的spy101在人mpbcd34+hspc中的功效。图35a显示用cas9mrna和spy101grna或与spy101grna复合的cas9蛋白(feldan或aldevron)处理的人mpbcd34+hspc的γ/α珠蛋白mrna比率(%)。图35b显示用cas9mrna和spy101grna或与spy101grna复合的cas9蛋白(feldan或aldevron)处理的人mpbcd34+hspc的γ/(γ+β)珠蛋白mrna比率(%)。图36a-b显示对于用与spy101grna复合的cas9蛋白(aldevron,技术优化的对未优化的)处理的细胞通过呈现γ/α珠蛋白mrna比率(%)和γ/(γ+β)珠蛋白mrna比率(%)得到的spy101在骨髓衍生的cd34+hspc中的功效。图36a显示用与spy101grna复合的cas9蛋白处理的骨髓衍生的cd34+hspc的γ/α珠蛋白mrna比率(%)。图36b显示用与spy101grna复合的cas9蛋白处理的骨髓衍生的cd34+hspc的γ/(γ+β)珠蛋白mrna比率(%)。图37a-b显示spy101在scd和β-地中海贫血患者样品中的功效。图37a显示来自用spy101grna和cas9蛋白处理的六名scd患者和两名健康供体的红细胞分化细胞的平均γ/(γ+β)珠蛋白mrna比率(%)。从用gfpgrna和cas9蛋白处理的各自对照样品中减去所有值。图37b显示来自用spy101grna和cas9蛋白处理的一名β-地中海贫血患者和两名健康供体的红细胞分化细胞的γ/α珠蛋白mrna比率(%)。从用gfpgrna和cas9蛋白处理的各自对照样品中减去所有值。图38a-b显示当使用cas9mrna或cas9rnp时,bcl11a内含子(spy101)的dna编辑速率。图38a显示当使用cas9mrna时,bcl11a内含子(spy101)的dna编辑速率。图38b显示当使用cas9rnp时,bcl11a内含子(spy101)的dna编辑速率。图39a-b显示在源自红细胞分化的人mpbcd34+hspc的单细胞集落中由spy101/cas9rnp引起的gata1结合位点(gbs)破坏与增加的γ-珠蛋白表达相关。图39a显示没有gbs破坏、具有单等位基因gbs破坏或双等位基因gbs破坏的spy101编辑的集落的γ/α珠蛋白mrna比率。图39b显示没有gbs破坏、具有单等位基因gbs破坏或双等位基因gbs破坏的spy101编辑的集落的γ/(γ+β)珠蛋白mrna比率。图40a-e显示通过流式细胞术分析在红细胞分化的spy101/cas9rnp编辑的人mpbcd34+hspc中增加的γ-珠蛋白表达。图40a显示与在gfpgrna/cas9rnp处理的红细胞分化的人mpbcd34+hspc中的α-珠蛋白表达相比较的在spy101/cas9rnp编辑的红细胞分化的人mpbcd34+hspc中的α-珠蛋白表达的流式细胞术分析。图40b显示与在gfpgrna/cas9rnp处理的红细胞分化的人mpbcd34+hspc中的β-珠蛋白表达相比较的在spy101/cas9rnp编辑的红细胞分化的人mpbcd34+hspc中的β-珠蛋白表达的流式细胞术分析。图40c显示与在gfpgrna/cas9rnp处理的红细胞分化的人mpbcd34+hspc中的γ-珠蛋白表达相比较的在spy101/cas9rnp编辑的红细胞分化的人mpbcd34+hspc中的γ-珠蛋白表达的流式细胞术分析。图40d显示,与gfpgrna/cas9rnp处理的红细胞分化的人mpbcd34+hspc相比较,在spy101/cas9rnp编辑的红细胞分化的人mpbcd34+hspc中的γ-珠蛋白阳性细胞的百分比。图40e显示,与gfpgrna/cas9rnp处理的红细胞分化的人mpbcd34+hspc相比较,在spy101/cas9rnp编辑的红细胞分化的人mpbcd34+hspc中的中值荧光强度(mfi)。序列表简述seqidno:1-29,482是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用化脓链球菌cas9内切核酸酶靶向的20bp间隔区序列。seqidno:29,483-32,387是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用金黄色葡萄球菌(s.aureus)cas9内切核酸酶靶向的20bp间隔区序列。seqidno:32,388-33,420是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用嗜热链球菌(s.thermophilus)cas9内切核酸酶靶向的20bp间隔区序列。seqidno:33,421-33,851是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用齿垢密螺旋体(t.denticola)cas9内切核酸酶靶向的20bp间隔区序列。seqidno:33,852-36,731是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用脑膜炎奈瑟菌(n.meningitides)cas9内切核酸酶靶向的20bp间隔区序列。seqidno:36,732-71,947是用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用氨基酸球菌属(acidominococcus)、毛螺菌科(lachnospiraceae)和弗朗西氏菌(franciscellanovicida)cpf1内切核酸酶靶向的20bp间隔区序列。seqidno:71,948是化脓链球菌cas9内切核酸酶的样品导向rna(grna)。seqidno:71,949显示如按其结构分类的已知归巢内切核酸酶家族。seqidno:71,950是grnaa(clo1)。seqidno:71,951是grnab(clo8)。seqidno:71,952是grnac(cso2)。seqidno:71,953是grnad(cso6)。seqidno:71,954是grnae(hpfh-15)。seqidno:71,955是grnaf(hpfh-4)。seqidno:71,956是grnag(kenya02)。seqidno:71,957是grnah(kenya17)。seqidno:71,958是grnai(sd2)。seqidno:71,959是grnaj(spy101)。seqidno:71,960-71,962显示样品sgrna序列。详细描述胎儿血红蛋白胎儿血红蛋白(hbf,α2γ2)是人胎儿中的主要氧转运蛋白且包括阿尔法(α)和伽马(γ)亚基。hbf表达在出生后约6个月停止。成人血红蛋白(hba,α2β2)是在出生约34个周后的人中的主要氧转运蛋白且包括阿尔法(α)和贝塔(β)亚基。在34周后,发育转换导致γ-珠蛋白基因的转录减少和β-珠蛋白基因的转录增加。由于许多形式的血红蛋白病是由于未能产生足够量的正常β-珠蛋白或不能完全产生正常的β-珠蛋白,因此增加的γ-珠蛋白(即,hbf)的表达将减轻β-珠蛋白疾病严重程度。b-细胞淋巴瘤11a(bcl11a)b-细胞淋巴瘤11a(bcl11a)是位于染色体2上的基因且范围为60,451,167-60,553,567bp(grch38)。bcl11a是一种锌指转录因子,其阻遏胎儿血红蛋白(hbf)并在出生后约6周开始下调hbf表达。bcl11a基因含有4个外显子,跨102.4kb的基因组dna。bcl11a也处于转录调节之下,包括内含子2中用于主转录因子gata-1的结合结构域。gata-1结合增强bcl11a表达,其继而阻遏hbf表达。内含子2含有多个dnase超敏位点(dhs),包括基于距转录起始位点的以千碱基计的距离而称为+55、+58和+62的位点。下面讨论各种编辑策略以缺失、调节或灭活bcl11a的转录控制序列。在该区域内的天然存在的snp与bcl11a表达降低和胎儿hb水平增加相关(orkin等人,2013gwas研究)。这些snp围绕3个dna超敏位点+55dhs、+58dhs和+62dhs组织。在这3个区域中,+58dhs区域似乎是与胎儿hb水平增加相关的关键区域,并且还具有gata1转录控制区域。治疗方法非同源末端连接(nhej)可以用于直接地或通过靶向几个位置的一个grna或几个grna裂解来改变剪接供体或受体位点来缺失bcl11a的转录控制序列的区段。还可以通过插入野生型bcl11a基因或含修饰的转录控制序列的cdna来调节或灭活bcl11a基因的转录控制序列。例如,用于通过同源定向修复(hdr)调节或灭活的供体含有具有小或大的侧翼同源臂以允许退火的bcl11a基因的修饰的转录控制序列。hdr基本上是一种无错误的机制,其在dsb修复期间使用供应的同源dna序列作为模板。同源定向修复(hdr)的速率是转录控制序列和切割位点之间的距离的函数,因此选择重叠或附近的靶位点是重要的。模板可以包括由同源区域侧接的其他序列,或者可以含有与基因组序列不同的序列,从而允许序列编辑。除了通过nhej或hdr缺失、调节或灭活bcl11a基因的转录控制序列之外,还可以有一系列的其他选择。如果存在小或大的缺失,则可以敲入含有bcl11a基因的修饰的转录控制序列的cdna。可以将全长cdna敲入任何“安全港”-即不是bcl11a基因本身的非有害插入点-有或没有合适的调控序列。如果该构建体在bcl11a调控元件附近被敲入,它将具有相似于正常基因的生理控制。两个或更多个(例如,一对)核酸酶可用于缺失转录控制序列区域,尽管通常必须提供供体以调节或灭活该功能。在这种情况下,将供应两个grna和一个供体序列。本文提供了使用基因组工程工具以通过以下方式产生对基因组的永久性改变的细胞离体和体内方法:1)通过由于nhej途径产生的缺失调节或灭活bcl11a基因的转录控制序列;2)通过hdr调节或灭活bcl11a基因的转录控制序列;3)通过缺失转录控制序列的至少一部分和/或将野生型bcl11a基因或包含修饰的转录控制序列的cdna敲入基因座或安全港口基因座来调节或灭活bcl11a基因的转录控制序列。此类方法使用内切核酸酶,例如crispr相关(cas9、cpf1等等)核酸酶,以永久地缺失、插入或编辑在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列的基因组基因座内或其附近的转录控制序列。以这种方式,本公开中阐述的实施例可以用单次处理或有限次数的处理来帮助缺失、调节或灭活bcl11a基因的转录控制序列(而不是在患者的一生中递送潜在的治疗)。本文提供用于治疗患有血红蛋白病的患者的方法。这种方法的一个方面是离体细胞基疗法。例如,可以产生患者特异性诱导的多能干细胞(ipsc)。然后,可以使用本文所述的材料和方法编辑这些ips细胞的染色体dna。接着,基因组编辑的ipsc可以分化成造血祖细胞。最后,可以将造血祖细胞植入患者体内。这种方法的另一个方面是离体细胞基疗法。例如,可以从患者体内分离间充质干细胞,其可以从患者的骨髓或外周血中分离。接着,可以使用本文所述的材料和方法编辑这些间充质干细胞的染色体dna。接着,基因组编辑的间充质干细胞可以分化成造血祖细胞。最后,可以将这些造血祖细胞植入患者体内。这种方法的另一个方面是离体细胞基疗法。例如,造血祖细胞可以从患者体内分离。接着,可以使用本文所述的材料和方法编辑这些细胞的染色体dna。最后,可以将基因组编辑的造血祖细胞植入患者体内。离体细胞治疗方法的一个优点是能够在施用前对治疗剂进行全面分析。基于核酸酶的治疗剂可具有一定程度的脱靶效应。离体执行基因校正允许人们在植入前表征校正的细胞群体。本公开包括对校正的细胞的整个基因组进行测序以确保脱靶效应(如果有的话)可以在与患者的最小风险相关的基因组位置中。另外,可以在植入前分离特定细胞群体,包括克隆群体。离体细胞疗法的另一个优点涉及与其他原代细胞来源相比在ipsc中的遗传校正。ipsc是多产的,使得其容易获得基于细胞的疗法所需的大量细胞。另外,ipsc是执行克隆分离的理想细胞类型。这允许筛选正确的基因组校正,而不会有降低活力的风险。相比之下,其他原代细胞仅存活几代并且难以克隆扩增。因此,用于治疗血红蛋白病的ipsc的操作可以更容易,并且可以缩短进行期望的遗传校正所需的时间量。对于离体疗法,移植需要清除骨髓壁龛或供体hsc以进行移植。目前的方法依赖于放射和/或化学疗法。由于这些限制,已经并且正在开发更安全的调理方案,诸如通过针对造血细胞表面标志物如cd117、c-kit等的抗体或抗体毒素缀合物免疫耗竭骨髓细胞。hsc移植的成功取决于对骨髓的高效归巢、后续移植和骨髓再增殖。植入的基因编辑的细胞的水平很重要,细胞多向移植的能力也很重要。造血干细胞(hsc)是离体基因疗法的重要靶标,因为它们提供校正细胞的延长来源。经处理的cd34+细胞将返回患者体内。方法还可包括基于体内的疗法。使用本文所述的材料和方法编辑患者体内细胞的染色体dna。这些细胞可以是骨髓细胞、造血祖细胞或cd34+细胞。尽管血细胞提供离体治疗和疗法的有吸引力的靶标,但增加的递送功效可以允许定向体内递送至造血干细胞(hsc)和/或其他b和t细胞祖细胞,诸如cd34+细胞。理想地,靶向和编辑将涉及相关的细胞。通过使用仅在某些细胞和或发育阶段中有活性的启动子,也可以防止其他细胞中的裂解。另外的启动子是可诱导的,因此如果核酸酶作为质粒递送,则可以暂时地得到控制。还可以使用增加的处理或结构域来调整递送的rna和蛋白质保留在细胞中的时间量以改变半衰期。体内治疗将消除许多治疗步骤,但较低的递送速率可能需要较高的编辑速率。体内治疗可以消除离体治疗和移植的问题和损失。体内基因疗法的优点可以是治疗性产生和施用的容易性。相同的治疗方法和疗法将有可能用于治疗一个以上的患者,例如共有相同或相似基因型或等位基因的许多患者。相反,离体细胞疗法通常需要使用患者自身的细胞,将其分离、操作并返回到同一患者。本文还提供一种通过基因组编辑来编辑细胞中的bcl11a基因的细胞方法。例如,可以从患者或动物体内分离细胞。然后,可以使用本文所述的材料和方法编辑细胞的染色体dna。无论细胞或离体或体内方法,本文提供的方法都可以涉及以下的一种或组合:1)通过由于nhej途径产生的缺失调节或灭活bcl11a基因的转录控制序列;2)通过hdr调节或灭活bcl11a基因的转录控制序列;或3)通过缺失转录控制序列的至少一部分和/或将野生型bcl11a基因或包含修饰的转录控制序列的cdna敲入基因座或在基因组的异源位置(诸如安全港口位点,诸如aavs1)来调节或灭活bcl11a基因的转录控制序列。hdr和敲入策略都在同源性定向修复(hdr)中利用供体dna模板。任一策略中的hdr可以通过使用一种或多种内切核酸酶在基因组中的特定位点处产生一处或多处单链断裂(ssb)或双链断裂(dsb)来实现。例如,nhej策略可以涉及通过在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用一种或多种crispr内切核酸酶和grna(例如,crrna+tracrrna,或sgrna)诱导一处单链断裂或双链断裂,或者在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用两种或更多种crispr内切核酸酶和两种或更多种sgrna诱导两处或更多处单链断裂或双链断裂来缺失bcl11a基因的转录控制序列的至少一部分。该方法可能需要开发和优化sgrna用于bcl11a基因的转录控制序列。例如,hdr策略可以涉及通过在外源引入以定向对同源定向修复的细胞dsb应答的供体dna模板(供体dna模板可以是短的单链寡核苷酸、短的双链寡核苷酸、长的单链或双链dna分子)的存在下在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用一种或多种crispr内切核酸酶和grna(例如,crrna+tracrrna,或sgrna)诱导一处单链断裂或双链断裂,或者在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用一种或多种crispr内切核酸酶和两种或更多种grna诱导两处或更多处单链断裂或双链断裂来调节或灭活bcl11a基因的转录控制序列。该方法可能需要开发和优化包含野生型bcl11a基因的grna和供体dna分子,该野生型bcl11a基因包含修饰的转录控制序列。例如,敲入策略涉及使用在bcl11a基因的转录控制序列上游或在其中或在安全的港口位点(诸如aavs1)中靶向的grna(例如,crrna+tracrrna,或sgrna)或一对grna将野生型bcl11a基因或包含修饰的转录控制序列的cdna敲入bcl11a基因的基因座中。供体dna可以是单链或双链dna,并且包含野生型bcl11a基因,该野生型bcl11a基因包含修饰的转录控制序列。上述策略(缺失/调节/灭活和敲入)的优点是相似的,原则上包括短期和长期有益的临床和实验室效应。除了上面列出的编辑选项之外,cas9或相似蛋白质可以用于将效应子结构域靶向可以识别用于编辑的相同靶位点,或者在效应子结构域范围内的其他靶位点。可以使用一系列的染色质修饰酶、甲基化酶或去甲基酶来改变靶基因的表达。这些类型的表观遗传调控具有一些优点,特别是因为它们在可能的脱靶效应方面受到限制。转录和翻译的调控涉及与细胞蛋白质或核苷酸相互作用的许多不同类别的位点。通常,转录因子或其他蛋白质的dna结合位点可以被靶向用于突变或缺失以研究该位点的作用,尽管它们也可以被靶向以改变基因表达。可以通过非同源末端连接nhej或通过同源定向修复(hdr)进行定向基因组编辑来添加位点。增加使用基因组测序、rna表达和转录因子结合的全基因组研究增加了我们识别这些位点如何导致发育或时间基因调控的能力。这些控制系统可以是定向的,或者可以涉及广泛的合作调控,这可能需要整合来自多种增强子的活性。转录因子通常结合6-12bp长的简并dna序列。单个位点提供的低特异性水平提示复杂的相互作用和规则涉及结合和功能结果。具有较少简并性的结合位点可以提供更简单的调控方式。可以设计人工转录因子以指定在基因组中具有较少相似序列并且具有较低的脱靶裂解潜力的较长序列。可以突变、缺失或甚至产生任何这些类型的结合位点以使基因调控或表达能够发生改变(canver,m.c.等人,nature(2015))。gata转录因子是以其结合gatadna结合序列的能力为特征的转录因子家族。gata结合序列位于bcl11a基因的+58dna超敏位点(dhs)内。具有这些特征的另一类基因调控区域是微rna(mirna)结合位点。mirna是非编码rna,其在转录后基因调控中起关键作用。mirna可以调控30%的所有哺乳动物蛋白编码基因的表达。发现通过双链rna(rnai)进行的特定且有效的基因沉默以及另外的小的非编码rna(canver,m.c.等人,nature(2015))。对基因沉默重要的最大类别的非编码rna是mirna。在哺乳动物中,mirna首先被转录为长rna转录物,其可以是单独的转录单元、蛋白质内含子的一部分或其他转录物。长转录物被称为初级mirna(pri-mirna),其包括不完全碱基配对的发夹结构。这些pri-mirna可以被microprocessor裂解成一个或多个较短的前体mirna(pre-mirna),该microprocessor是细胞核中的蛋白质复合物,其涉及drosha。pre-mirna是长度约70个核苷酸的短茎环,其中2-核苷酸3'-悬伸部输出到成熟的19-25个核苷酸的mirna:mirna*双链体中。具有较低碱基配对稳定性的mirna链(导向链)可以加载到rna诱导的沉默复合物(risc)上。乘客导向链(标有*)可以起作用,但通常会被降解。成熟的mirna将risc系链到主要在3'非翻译区域(utr)内发现的靶mrna中的部分互补序列基序,并且诱导转录后基因沉默(bartel,d.p.cell136,215-233(2009);saj,a.和lai,e.c.curropingenetdev21,504-510(2011))。mirna在发育、分化、细胞周期和生长控制中以及在哺乳动物和其他多细胞生物中的几乎所有的生物途径中都可以是重要的。mirna也可以涉及在细胞周期控制、细胞凋亡和干细胞分化、造血、缺氧、肌肉发育、神经发生、胰岛素分泌、胆固醇代谢、衰老、病毒复制和免疫应答中。单mirna可以靶向数百种不同的mrna转录物,而单个转录物可以被许多不同的mirna靶向。在最新发布的mirbase(v.21)中已经注释了超过28645种微rna。一些mirna可以由多个基因座编码,其中的一些基因座可以由串联共转录的簇表达。这些特征允许复杂的调控网络具有多种途径和反馈控制。mirna可以是这些反馈和调控回路的组成部分,并且可以通过将蛋白质产量保持在限度内来帮助调控基因表达(herranz,h.和cohen,s.m.genesdev24,1339-1344(2010);posadas,d.m.和carthew,r.w.curropingenetdev27,1-6(2014))。mirna在与异常mirna表达相关的大量人类疾病中也很重要。该关联强调了mirna调控途径的重要性。最近的mirna缺失研究已经将mirna与免疫应答的调控相连(stern-ginossar,n.等人,science317,376-381(2007))。mirna也与癌症强烈相连,并且可以在不同类型的癌症中发挥作用。已经发现mirna在许多肿瘤中被下调。mirna在诸如细胞周期控制和dna损伤应答的关键癌症相关途径的调控中是重要的,因此可以用于诊断并且可以在临床上靶向。微rna可以微妙地调控血管生成的平衡,使得耗尽所有微rna的实验抑制肿瘤血管生成(chen,s.等人,genesdev28,1054-1067(2014))。如已经对于蛋白质编码基因所显示,mirna基因也可以经历随癌症发生的表观遗传变化。许多mirna基因座可以与cpg岛相关,增加了它们通过dna甲基化调控的机会(weber,b.、stresemann,c.、brueckner,b.和lyko,f.cellcycle6,1001-1005(2007))。大多数研究使用染色质重塑药物治疗来揭示表观遗传学上沉默的mirna。除了它们在rna沉默中的作用外,mirna还可以激活翻译(posadas,d.m.和carthew,r.w.curropingenetdev27,1-6(2014))。敲除这些位点可以导致靶向基因的表达降低,而引入这些位点可以增加表达。通过突变种子序列(微rna的碱基2-8)可以最有效地敲除单个mirna,这对于结合特异性是重要的。在该区域中进行裂解,然后通过nhej进行错误修复可以通过阻断与靶位点的结合来有效地废除mirna功能。mirna也可以通过与回文序列相邻的特殊环区域的特异性靶向来抑制。无催化活性的cas9也可用于抑制shrna表达(zhao,y.等人,scirep4,3943(2014))。除了靶向mirna之外,还可以靶向和突变结合位点以防止被mirna沉默。人细胞为了减轻血红蛋白病,如本文所述并说明的,基因编辑的主要靶标是人细胞。例如,在离体方法中,人细胞可以是体细胞,其在使用所述技术修饰后可以产生祖细胞。例如,在体内方法中,人细胞可以是骨髓细胞、造血祖细胞或cd34+细胞。通过在源自需要的患者并因此已经与需要的患者完全匹配的自体同源细胞中执行基因编辑,可以产生可以安全地重新引入患者并且有效地产生可以有效地减轻与患者疾病相关的一种或多种临床状况的细胞群体的细胞。祖细胞(本文中也称为干细胞)能够增殖并产生更多的祖细胞,这些祖细胞又能够产生大量的母细胞,这些母细胞又可以产生分化的或可分化的子细胞。可以诱导子细胞自身以增殖并产生后代,后代随后分化成一种或多种成熟细胞类型,同时还保留一种或多种具有亲本发育潜力的细胞。因此,术语“干细胞”是指在特定情况下具有分化成更特异化或分化的表型的能力或潜力并且在某些情况下保持增殖而不明显分化的能力的细胞。在一个方面,术语祖细胞或干细胞是指广义母细胞,其后代(子代)通常在不同的方向上通过分化,例如通过获取完全个性化而特异化,如在胚胎细胞和组织的进行性多样化中发生的。细胞分化是通常通过许多细胞分裂发生的复杂过程。分化细胞可以源自多能细胞,其本身源自多能细胞等等。尽管这些多能细胞中的每一种都可以被认为是干细胞,但是各自可以产生的细胞类型的范围可以显著变化。一些分化细胞也具有产生更大发育潜力的细胞的能力。这种能力可以是天然的,或者可以在用各种因子处理后人工诱导。在许多生物学事例中,干细胞也可以是“多能的”,因为它们可以产生多于一种不同细胞类型的子代,但这不是“干细胞特性”所必需的。自我更新可以是干细胞的另一重要方面。理论上,自我更新可以通过两种主要机制中的任一种发生。干细胞可以不对称分裂,其中一个子细胞保持干细胞状态,而另一子细胞表达一些不同的其他特异性的功能和表型。或者,群体中的一些干细胞可以对称地分裂成两个干细胞,从而维持群体中的一些干细胞作为整体,而群体中的其他细胞仅产生分化的子代。通常,“祖细胞”具有更原始(即,与完全分化的细胞相比,处于沿着发育途径或进展的较早阶段)的细胞表型。通常,祖细胞也具有显著或非常高的增殖潜力。祖细胞可以产生多种不同的分化细胞类型或单一分化细胞类型,这取决于发育途径和细胞发育和分化的环境。在细胞个体发育的背景下,形容词“分化的”或“正分化的”是相对术语。“分化的细胞”是比正比较的细胞在发育途径中进一步发展的细胞。因此,干细胞可以分化成谱系限制性前体细胞(诸如,造血祖细胞),其又可以在该途径中进一步分化成其他类型的前体细胞(诸如,造血前体),然后成为末期分化的细胞,诸如红细胞,其在某种组织类型中起特征性作用,并且可以保持或不保持进一步增殖的能力。术语“造血祖细胞”是指干细胞谱系中产生所有血细胞类型的细胞,包括红细胞(红细胞(erythrocyte)或红细胞(redbloodcell,rbc))、骨髓细胞(单核细胞和巨噬细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、巨核细胞/血小板和树突细胞)和淋巴细胞(t细胞、b细胞、nk细胞)。“红细胞谱系细胞”指示接触的细胞是经历红细胞生成的细胞,因此在最终分化时它形成红细胞(erythrocyte)或红细胞(redbloodcell)。这些细胞来源于骨髓造血祖细胞。在暴露于特定生长因子和造血微环境的其他组分时,造血祖细胞可以通过一系列中间分化细胞类型(红细胞谱系的所有中间体)成熟为rbc。因此,“红细胞谱系”的细胞包括造血祖细胞、红血胚细胞、嗜碱性正成红细胞、有核红血球、晚幼红细胞、网织红细胞和红细胞。造血祖细胞可以表达造血祖细胞特征性的至少一种下列细胞表面标志物:cd34+、cd59+、thyl/cd90+、cd381o/-和c-kit/cdl17+。在本文提供的一些实施例中,造血祖细胞可以是cd34+。造血祖细胞可以是在患者用一种或多种因子如粒细胞集落刺激因子(任选地,与plerixaflor组合)治疗后从患者体内获得的外周血干细胞。cd34+细胞可以使用细胞选择系统(miltenyibiotec)富集。在基因组编辑之前,cd34+细胞可以在具有细胞因子(例如,scf、rhtpo、rhflt3)的无血清培养基(例如,cellgrowscgm培养基、cellgenix)中刺激。预期添加sr1和dmpge2和/或其他因子以改善长期移植。红细胞谱系的造血祖细胞可以具有红细胞谱系特征性的细胞表面标志物:诸如cd71和terl19。造血干细胞(hsc)可以是基因疗法的重要靶标,因为它们提供校正细胞的延长来源。hsc产生血细胞的髓样谱系和淋巴谱系。成熟的血细胞具有有限的寿命,并且必须在整个生命中不断地更换。血细胞通过多能hsc群体的增殖和分化不断地产生,该多能hsc群体可以通过自我更新补充。骨髓(bm)是人造血的主要位点并且是造血干细胞和祖细胞(hspc)的良好来源。在外周血(pb)中可以发现少量的hspc。在一些适应症或治疗中,它们的数量增加。hsc的子代阶段性成熟,产生多能和谱系定型的祖细胞,包括产生表达bcl11a的细胞的淋巴祖细胞。b细胞和t细胞祖细胞是需要bcl11a活性的两个细胞群体,因此它们可以在重新排列之前的阶段进行编辑,尽管校正祖细胞具有继续成为校正细胞来源的优势。经处理的细胞如cd34+细胞将返回患者体内。移植水平可能是重要的,因为在体内cd34+输注后基因编辑细胞的细胞多谱系移植的能力也是如此。诱导的多能干细胞本文所述的基因工程化人细胞可以是诱导的多能干细胞(ipsc)。使用ipsc的一个优势是细胞可以源自与祖细胞一起施用的相同受试者。也就是说,体细胞可以从受试者体内获得,重编程为诱导的多能干细胞,然后再分化成祖细胞以施用到受试者(例如,自体同源细胞)。因为祖细胞基本上来源于自体同源来源,所以与使用来自另一受试者或另一组受试者的细胞相比,可以降低移植排斥或变应性应答的风险。此外,ipsc的使用否定了对从胚胎来源获得的细胞的需要。因此,在一个方面,在所公开的方法中使用的干细胞不是胚胎干细胞。尽管在生理环境下分化通常是不可逆的,但最近已开发了几种方法来将体细胞重编程为ipsc。示例性方法是本领域技术人员已知的并且在下文中简要描述。术语“重编程”是指改变或逆转分化细胞(例如,体细胞)的分化状态的过程。换句话说,重编程是指将细胞向后分化分成更未分化或更原始类型的细胞的过程。应该注意的是,将许多原代细胞置于培养物中可以导致一些完全分化的特征的丧失。因此,简单地培养术语分化细胞中包括的这些细胞不会使这些细胞成为非分化细胞(例如,未分化细胞)或多能细胞。分化细胞向多能性的转变需要超出导致培养物中分化特性的部分丧失的刺激的重编程刺激。与原代细胞亲本相比,重编程细胞还具有延长传代能力而不丧失生长潜力的特征,该原代细胞亲本通常仅具有在培养物中有限数量的分裂的能力。在重编程之前,待重编程的细胞可以是部分分化的或终末分化的。重编程可以涵盖分化细胞(例如,体细胞)的分化状态完全逆转至多能状态(pluripotentstate)或多能状态(multipotentstate)。重编程可以涵盖分化细胞(例如,体细胞)的分化状态完全或部分逆转至未分化细胞(例如,胚胎样细胞)。重编程可以导致细胞表达特定基因,其表达进一步有助于重编程。在本文所述的某些实施例中,分化细胞(例如,体细胞)的重编程可以使分化细胞呈现未分化状态(例如,是未分化的细胞)。所得细胞称为“重编程细胞”或“诱导多能干细胞(ipsc或ips细胞)”。重编程可以涉及在细胞分化期间发生的至少一些可遗传的核酸修饰模式(例如,甲基化)、染色质浓缩、表观遗传变化、基因组印记等的改变,例如逆转。重编程不同于简单地维持已经是多能的细胞的现有未分化状态或维持已经是多能细胞(例如,造血干细胞)的细胞的现有的不完全分化状态。重编程也不同于促进已经是多能(pluripotent)或多能(multipotent)的细胞的自我更新或增殖,尽管在一些实施例中,本文所述的组合物和方法也可以用于此类目的。本领域已知许多方法可以用于由体细胞产生多能干细胞。将体细胞重编程为多能表型的任何此类方法都适用于本文所述的方法。已经描述了使用确定的转录因子组合产生多能细胞的重编程方法。通过定向转导oct4、sox2、klf4和c-myc,可以将小鼠体细胞转化为具有扩展的发育潜力的es细胞样细胞;参见,例如,takahashi和yamanaka,cell126(4):663-76(2006)。ipsc类似于es细胞,因为它们恢复了多能性相关的转录环路和大部分的表观遗传景观。此外,小鼠ipsc满足多能性的所有标准测定:特别地,体外分化成三个胚层的细胞类型、畸胎瘤形成、对嵌合体的贡献、种系传递[参见例如maherali和hochedlinger,cellstemcell.3(6):595-605(2008)],和四倍体互补。人ipsc可以使用相似的转导方法获得,并且已经确立转录因子trio、oct4、sox2和nanog作为控制多能性的转录因子的核心组;参见,例如,budniatzky和gepstein,stemcellstranslmed.3(4):448-57(2014);barrett等人,stemcellstransmed3:1-6sctm.2014-0121(2014);focosi等人,bloodcancerjournal4:e211(2014);和其中引用的参考文献。ipsc的产生历史上可以使用病毒载体通过将编码干细胞相关基因的核酸序列引入成人体细胞中来实现。ipsc可以自终末分化的体细胞以及成人干细胞或体干细胞产生或衍生。也就是说,非多能祖细胞可以通过重编程呈现多能(pluripotent)或多能(multipotent)。在这种情况下,可能没有必要包括重编程终末分化细胞所需的尽可能多的重编程因子。另外,重编程可以通过非病毒引入重编程因子诱导,例如通过引入蛋白质本身,或通过引入编码重编程因子的核酸,或通过引入在翻译产生重编程因子的信使rna诱导(参见例如,warren等,cellstemcell,7(5):618-30(2010)。重编程可以通过引入编码干细胞相关基因的核酸的组合来实现,该组合包括例如oct-4(也称为oct-3/4或pouf51)、soxl、sox2、sox3、sox15、sox18、nanog、klfl、klf2、klf4、klf5、nr5a2、c-myc、1-myc、n-myc、rem2、tert和lin28。使用本文所述的方法和组合物的重编程可以进一步包括将oct-3/4、sox家族的成员、klf家族的成员和myc家族的成员中的一种或多种引入体细胞中。本文所述的方法和组合物可以进一步包括引入oct-4、sox2、nanog、c-myc和klf4中的每一种的一种或多种用于重编程。如上所述,用于重编程的确切方法对于本文所述的方法和组合物未必是关键的。然而,在从重编程细胞分化的细胞用于例如人类疗法的情况下,在一个方面,重编程不受改变基因组的方法影响。因此,在此类实施例中,可以例如在不使用病毒或质粒载体的情况下实现重编程。通过添加各种试剂如小分子可以增强源自起始细胞群体的重编程的效率(即,重编程细胞的数量),如shi等人,cell-stemcell2:525-528(2008);huangfu等人,naturebiotechnology26(7):795-797(2008);和marson等人,cell-stemcell3:132-135(2008)所示。因此,增强诱导的多能干细胞产生的效率或速率的试剂或试剂组合可以用于产生患者特异性或疾病特异性ipsc。增强重编程效率的试剂的一些非限制性实例包括可溶性wnt、wnt条件培养基、bix-01294(g9a组蛋白甲基转移酶)、pd0325901(mek抑制剂)、dna甲基转移酶抑制剂、组蛋白脱乙酰酶(hdac)抑制剂、丙戊酸、5'-氮杂胞苷、地塞米松、辛二酰苯胺、异羟肟酸(saha)、维生素c和曲古抑菌素(tsa)等。重编程增强剂的其他非限制性实例包括:辛二酰苯胺异羟肟酸(saha(例如,mk0683、伏立诺他(vorinostat))和其他异羟肟酸)、bml-210、depudecin(例如,(-)-depudecin)、hc毒素、nullscript(4-(l,3-二氧代-lh,3h)-苯并[de]异喹啉-2-基)-n-羟基丁酰胺)、苯基丁酸盐(例如,苯基丁酸钠)和丙戊酸((vpa)及其他短链脂肪酸)、scriptaid、苏拉明钠、曲古菌素a(tsa)、apha化合物8、apicidin、丁酸钠、新戊酰氧基甲基丁酸酯(pivanex,an-9)、trapoxinb、衣原体、缩酚酸肽(也称为fr901228或fk228)、苯甲酰胺(例如,ci-994(例如,n-乙酰基地那林))和ms-27-275)、mgcd0103、nvp-laq-824、cbha(间羧基肉桂酸双羟肟酸)、jnj16241199、tubacin、a-161906、proxamide、oxamflatin、3-cl-ucha(例如,6-(3-氯代苯基脲基)己酸异羟肟酸)、aoe(2-氨基-8-氧代-9,10-环氧癸酸)、chap31和chap50。其他重编程增强剂包括例如hdac的显性阴性形式(例如,无催化活性的形式)、hdac的sirna抑制剂和特异性结合hdac的抗体。此类抑制剂可从例如biomolinternational、fukasawa、merckbiosciences、novartis、gloucesterpharmaceuticals、titanpharmaceuticals、methylgene和sigmaaldrich购得。为了证实用于本文所述方法的多能干细胞的诱导,可以测试分离的克隆的干细胞标志物的表达。在源自体细胞的细胞中的这种表达将细胞识别为诱导的多能干细胞。干细胞标志物可以选自包括ssea3、ssea4、cd9、nanog、fbxl5、ecatl、esgl、eras、gdf3、fgf4、cripto、daxl、zpf296、slc2a3、rexl、utfl和natl的非限制性组。在一种情况下,例如,表达oct4或nanog的细胞被识别为多能细胞。检测此类标志物表达的方法可以包括例如rt-pcr和检测编码多肽的存在的免疫学方法,诸如西方印迹或流式细胞术分析。检测不仅可以涉及rt-pcr,还可以包括蛋白质标志物的检测。细胞内标志物可以通过rt-pcr或蛋白质检测方法如免疫细胞化学来最好地识别,而细胞表面标志物可以例如通过免疫细胞化学容易地识别。分离细胞的多能干细胞特性可以通过评估ipsc分化成三个胚层中每一个的细胞的能力的测试来确认。作为一个实例,裸鼠中的畸胎瘤形成可以用于评估分离的克隆的多能特性。可以将细胞引入裸鼠中,并且可以对由细胞带来的肿瘤执行组织学和/或免疫组织化学。例如,包含来自所有三个胚层的细胞的肿瘤的生长进一步表明细胞是多能干细胞。产生患者特异性ipsc本公开的离体方法的一个步骤可以涉及产生患者特异性ips细胞、患者特异性ips细胞或患者特异性ips细胞系。如takahashi和yamanaka2006;takahashi,tanabe等人,2007所述,本领域有许多已确立的用于产生患者特异性ips细胞的方法。例如,产生步骤可以包括:a)从患者体内分离体细胞,诸如皮肤细胞或成纤维细胞;和b)将一组多能性相关基因导入体细胞中,以诱导细胞成为多能干细胞。该组多能性相关基因可以是选自oct4、sox2、klf4、lin28、nanog和cmyc的基因中的一种或多种。对患者的骨髓执行活组织检查或抽出活组织检查或抽出物是取自身体的组织或液体的样品。有许多种不同的活组织检查或抽出物。几乎所有这些都涉及使用锋利的工具除去少量组织。如果活组织检查将在皮肤或其他敏感区域上进行,则可以先应用麻醉药。可以根据本领域的任何已知方法执行活组织检查或抽出。例如,在骨髓抽出物中,使用大针进入骨盆骨以收集骨髓。分离间充质干细胞可以根据本领域已知的任何方法,诸如从患者的骨髓或外周血中分离间充质干细胞。例如,骨髓抽出物可以用肝素收集到注射器中。细胞可以在percolltm密度梯度上洗涤和离心。可以使用percolltm分离细胞,诸如血细胞、肝细胞、间质细胞、巨噬细胞、肥大细胞和胸腺细胞。可以在含有10%胎牛血清(fbs)的杜氏改良的伊格尔培养基(dmem)(低葡萄糖)中培养细胞(pittingermf、mackayam、becksc等人,science1999;284:143-147)。用gcsf治疗患者可以根据本领域已知的任何方法任选地用粒细胞集落刺激因子(gcsf)治疗患者。gcsf可以与plerixaflor组合施用。从患者体内分离造血祖细胞可以通过本领域已知的任何方法从患者体内分离造血祖细胞。cd34+细胞可以使用细胞选择系统(miltenyibiotec)富集。在基因组编辑之前,可以在无血清的培养基(例如,cellgrowscgm培养基,cellgenix)中用细胞因子(例如,scf、rhtpo、rhflt3)弱刺激cd34+细胞。基因组编辑基因组编辑通常是指优选以精确或预定的方式修饰基因组的核苷酸序列的过程。本文所述的基因组编辑方法的实施例包括使用定点核酸酶在基因组中的精确靶位置切割脱氧核糖核酸(dna),从而在基因组内的特定位置产生单链或双链dna断裂的方法。此类断裂可以并且通常通过天然的内源性细胞过程如同源定向修复(hdr)和nhej修复,如cox等人,naturemedicine21(2),121-31(2015)中最近综述。这两个主要的dna修复过程由替代途径家族组成。nhej直接连接由双链断裂产生的dna末端,有时会丢失或添加核苷酸序列,这可能破坏或增强基因表达。hdr利用同源序列或供体序列作为模板,用于在断裂点插入确定的dna序列。同源序列可以在内源基因组如姐妹染色单体中。或者,供体可以是外源核酸,诸如质粒、单链低聚核苷酸、双链低聚核苷酸、双链体低聚核苷酸或病毒,其具有与核酸酶裂解基因座高度同源的区域,但是还可以包含其他序列或序列改变,包括可以并入裂解的靶基因座的缺失。第三种修复机制可以是微同源介导的末端连接(mmej),也称为“替代nhej”,其中遗传结果相似于nhej,在裂解位点处可以发生小的缺失和插入。mmej可以利用侧接dna断裂位点的几个碱基对的同源序列来驱动更有利的dna末端连接修复结果,并且最近的报道进一步阐明了该过程的分子机制;参见,例如cho和greenberg,nature518,174-76(2015);kent等人,naturestructuralandmolecularbiology,adv.在线doi:10.1038/nsmb.2961(2015);mateos-gomez等人,nature518,254-57(2015);ceccaldi等人,nature528,258-62(2015)。在某些情况下,可以基于dna断裂位点的潜在微生物学分析来预测可能的修复结果。这些基因组编辑机制中的每一个都可以用于产生所需的基因组改变。基因组编辑过程中的一个步骤可以是在如预期突变位点附近的靶标基因座中产生一处或两处dna断裂,后者为双链断裂,或两处单链断裂。这可以通过使用如本文所述并说明的定点多肽来实现。定点多肽如dna内切核酸酶可以在核酸如基因组dna中引入双链断裂或单链断裂。双链断裂可以刺激细胞的内源dna修复途径(例如,同源依赖性修复或非同源末端连接或替代性非同源末端连接(a-nhej)或微同源介导的末端连接)。nhej可以修复裂解的靶核酸而无需同源模板。这有时可以在裂解位点处在靶核酸中产生小的缺失或插入(插入缺失),并且可以导致基因表达的破坏或改变。当可得到同源修复模板或供体时,可以发生hdr。同源供体模板可以包含可以与侧接靶核酸裂解位点的序列同源的序列。细胞可以使用姐妹染色单体作为修复模板。然而,出于基因组编辑的目的,修复模板可以作为外源核酸如质粒、双链体低聚核苷酸、单链低聚核苷酸、双链低聚核苷酸或病毒核酸供应。在使用外源供体模板的情况下,可以在同源性的侧翼区域之间引入另外的核酸序列(诸如转基因)或修饰(诸如单个或多个碱基改变或缺失),从而额外的或改变的核酸序列也变得并入靶标基因座。mmej可以产生相似于nhej的遗传结果,在裂解位点处可以发生小的缺失和插入。mmej可以利用位于侧接裂解位点的几个碱基对的同源序列来驱动有利的末端连接dna修复结果。在一些情况下,可以基于核酸酶靶标区域中的潜在微生物学分析来预测可能的修复结果。因此,在一些情况下,可以使用同源重组以将外源多核苷酸序列插入靶核酸裂解位点。外源多核苷酸序列在本文中称为供体多核苷酸(或供体或供体序列或多核苷酸供体模板)。可以将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入靶核酸裂解位点中。供体多核苷酸可以是外源多核苷酸序列,即不天然存在于靶核酸裂解位点的序列。由nhej和/或hdr引起的靶dna修饰可以导致例如突变、缺失、改变、整合、基因校正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、易位和/或基因突变。缺失基因组dna并将非天然核酸整合到基因组dna中的过程是基因组编辑的实例。crispr内切核酸酶系统可以在许多原核生物(例如,细菌和古细菌)的基因组中发现crispr(集簇的定期间隔区短回文重复序列)基因组基因座。在原核生物中,crispr基因座编码作为一种免疫系统起作用以帮助保护原核生物免受外来入侵者如病毒和噬菌体的攻击的产物。crispr基因座功能有三个阶段:将新序列整合到crispr基因座中、crisprrna(crrna)的表达和外来入侵者核酸的沉默。已经识别出五种类型的crispr系统(例如,i型、ii型、iii型、u型和v型)。crispr基因座包括许多称为“重复序列”的短重复序列。当表达时,重复序列可以形成二级结构(例如,发夹)和/或包含非结构化的单链序列。重复序列通常以簇的形式发生,并且经常在物种之间发散。重复序列规律地间隔着独特的间隔区序列,称为“间隔区”,产生重复序列-间隔区-重复序列基因座构造。间隔区与已知的外来入侵者序列相同或具有高度同源性。间隔区-重复单元编码crisprrna(crrna),其被加工成间隔区-重复序列单元的成熟形式。crrna包含参与靶向靶核酸的“种子”或间隔区序列(在原核生物中以天然存在的形式,间隔区序列靶向外来入侵核酸)。间隔区序列位于crrna的5'末端或3'末端。crispr基因座还包含编码crispr相关(cas)基因的多核苷酸序列。cas基因编码参与原核生物中crrna功能的生物发生和干扰阶段的内切核酸酶。一些cas基因包含同源的二级和/或三级结构。ii型crispr系统ii型crispr系统中的crrna生物发生本质上需要反式激活crisprrna(tracrrna)。tracrrna可以通过内源性rnaseiii修饰,然后与pre-crrna阵列中的crrna重复序列杂交。可以募集内源性rnaseiii以裂解pre-crrna。可以对裂解的crrna进行外切核糖核酸酶修剪以产生成熟的crrna形式(例如,5'修剪)。tracrrna可以保持与crrna杂交,并且tracrrna和crrna与定点多肽(例如,cas9)缔合。crrna-tracrrna-cas9复合物的crrna可以将复合物导向至crrna可以与之杂交的靶核酸。crrna与靶核酸的杂交可以激活cas9以进行靶向核酸裂解。ii型crispr系统中的靶核酸被称为前间隔区序列相邻基序(pam)。本质上,pam对于促进定点多肽(例如,cas9)与靶核酸的结合是必需的。ii型系统(也称为nmeni或cass4)进一步细分为ii-a型(cass4)和ii-b型(cass4a)。jinek等人,science,337(6096):816-821(2012)表明crispr/cas9系统可用于rna可编程基因组编辑,并且国际专利申请公告wo2013/176772提供用于位点特异性基因编辑的crispr/cas内切核酸酶系统的许多实例和应用。v型crispr系统v型crispr系统与ii型系统有几项重要的区别。例如,cpf1是单个rna导向的内切核酸酶,与ii型系统相反,其缺乏tracrrna。事实上,可以将cpf1相关的crispr阵列加工成成熟的crrna,而不需要其他反式激活tracrrna。可以将v型crispr阵列加工成长度为42-44个核苷酸的短成熟crrna,每个成熟crrna以直接重复序列的19个核苷酸开始,接着是间隔区序列的23-25个核苷酸。相反,ii型系统中的成熟crrna可以以间隔区序列的20-24个核苷酸开始,然后是直接重复序列的约22个核苷酸。此外,cpf1可以利用富含t的前间隔区序列相邻基序,使得cpf1-crrna复合物高效裂解靶dna,进展成为短的富含t的pam,这与在ii型系统的靶dna之后的富含g的pam形成对比。因此,v型系统在远离pam的点处裂解,而ii型系统在与pam相邻的点处裂解。此外,与ii型系统相反,cpf1通过具有4或5个核苷酸的5’悬伸部的交错dna双链断裂裂解dna。ii型系统通过钝的双链断裂裂解。与ii型系统相似,cpf1含有预测的ruvc样内切核酸酶结构域,但缺乏第二hnh内切核酸酶结构域,这与ii型系统相反。cas基因/多肽和前间隔区序列相邻基序示例性crispr/cas多肽包括fonfara等人,nucleicacidsresearch,42:2577-2590(2014)的图1中的cas9多肽。自cas基因被发现以来,crispr/cas基因命名系统经历了广泛的改写。上文fonfara的图5提供了来自不同物种的cas9多肽的pam序列。定点多肽定点多肽是用于基因组编辑以裂解dna的核酸酶。定点核酸酶或多肽可以作为一种或多种多肽或者编码多肽的一种或多种mrna施用到细胞或患者。在crispr/cas或crispr/cpf1系统的背景下,定点多肽可以与导向rna结合,这又指定多肽所定向的靶dna中的位点。在本文公开的crispr/cas或crispr/cpf1系统中,定点多肽可以是内切核酸酶,诸如dna内切核酸酶。定点多肽可以包含多个核酸裂解(即,核酸酶)结构域。两个或更多个核酸裂解结构域可以通过接头连接在一起。例如,接头可以包含柔性接头。接头的长度可以为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40个或更多个氨基酸。天然存在的野生型cas9酶包含两个核酸酶结构域:hnh核酸酶结构域和ruvc结构域。本文中,“cas9”是指天然存在的cas9和重组的cas9。本文考虑的cas9酶可以包含hnh或hnh样核酸酶结构域和/或ruvc或ruvc样核酸酶结构域。hnh或hnh样结构域包含mcra样折叠。hnh或hnh样结构域包含两条反向平行的β-链和α-螺旋。hnh或hnh样结构域包含金属结合位点(例如,二价阳离子结合位点)。hnh或hnh样结构域可以裂解靶核酸的一条链(例如,crrna靶向链的互补链)。ruvc或ruvc样结构域包含rnaseh或rnaseh样折叠。ruvc/rnaseh结构域参与多样化的基于核酸的功能,包括作用于rna和dna两者上的功能。rnaseh结构域包含被多个α-螺旋包围的5个β-链。ruvc/rnaseh或ruvc/rnaseh样结构域包含金属结合位点(例如,二价阳离子结合位点)。ruvc/rnaseh或ruvc/rnaseh样结构域可以裂解靶核酸的一条链(例如,双链靶dna的非互补链)。定点多肽可以在核酸如基因组dna中引入双链断裂或单链断裂。双链断裂可以刺激细胞的内源dna修复途径(例如,同源依赖性修复(hdr)或nhej或替代性非同源末端连接(a-nhej)或微同源介导的末端连接(mmej))。nhej可以修复裂解的靶核酸而无需同源模板。这有时可以在裂解位点处在靶核酸中产生小的缺失或插入(插入缺失),并且可以导致基因表达的破坏或改变。当可得到同源修复模板或供体时,可以发生hdr。同源供体模板可以包含与侧接靶核酸裂解位点的序列同源的序列。细胞可以使用姐妹染色单体作为修复模板。然而,出于基因组编辑的目的,修复模板可以作为外源核酸如质粒、双链体低聚核苷酸、单链低聚核苷酸或病毒核酸供应。在使用外源供体模板的情况下,可以在同源性的侧翼区域之间引入另外的核酸序列(诸如转基因)或修饰(诸如单个或多个碱基改变或缺失),从而额外的或改变的核酸序列也变得并入靶标基因座。mmej可以产生相似于nhej的遗传结果,在裂解位点处可以发生小的缺失和插入。mmej可以利用位于侧接裂解位点的几个碱基对的同源序列来驱动有利的末端连接dna修复结果。在一些情况下,可以基于核酸酶靶标区域中的潜在微生物学分析来预测可能的修复结果。因此,在一些情况下,可以使用同源重组以将外源多核苷酸序列插入靶核酸裂解位点。外源多核苷酸序列在本文中称为供体多核苷酸(或供体或供体序列)。可以将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入靶核酸裂解位点中。供体多核苷酸可以是外源多核苷酸序列,即不天然存在于靶核酸裂解位点的序列。由nhej和/或hdr引起的靶dna修饰可以导致例如突变、缺失、改变、整合、基因校正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、易位和/或基因突变。缺失基因组dna并将非天然核酸整合到基因组dna中的过程是基因组编辑的实例。定点多肽可以包含与野生型示例性定点多肽[例如,来自化脓链球菌的cas9,us2014/0068797序列编号8或sapranauskas等人,nucleicacidsres,39(21):9275-9282(2011)]和各种其他定点多肽具有至少10%、至少15%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列同一性的氨基酸序列。相对于10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。相对于10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。相对于定点多肽的hnh核酸酶结构域中的10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。相对于定点多肽的hnh核酸酶结构域中的10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。相对于定点多肽的ruvc核酸酶结构域中的10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。相对于定点多肽的ruvc核酸酶结构域中的10个连续的氨基酸而言,定点多肽可以包含与野生型定点多肽(例如,来自化脓链球菌的cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的同一性。定点多肽可以包含修饰形式的野生型示例性定点多肽。修饰形式的野生型示例性定点多肽可以包含降低定点多肽的核酸裂解活性的突变。修饰形式的野生型示例性定点多肽可以具有小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的野生型示例性定点多肽(例如,来自化脓链球菌的cas9,同上)的核酸裂解活性。修饰形式的定点多肽可以不具有实质性核酸裂解活性。当定点多肽是不具有实质性核酸裂解活性的修饰形式时,其在本文中称为“无酶解活性的”。修饰形式的定点多肽可以包含突变,使得其可以在靶核酸上诱导单链断裂(ssb)(例如,通过仅切割双链靶核酸的一个糖-磷酸酯主链)。突变可以在野生型定点多肽(例如,来自化脓链球菌的cas9,同上)的多个核酸裂解结构域中的一个或多个中产生小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的核酸裂解活性。突变可以导致多个核酸裂解结构域中的一个或多个保留裂解靶核酸的互补链的能力,但降低其裂解靶核酸的非互补链的能力。突变可以导致多个核酸裂解结构域中的一个或多个保留裂解靶核酸的非互补链的能力,但降低其裂解靶核酸的互补链的能力。例如,使野生型示例性化脓链球菌cas9多肽中的残基如asp10、his840、asn854和asn856突变以使多个核酸裂解结构域(例如,核酸酶结构域)中的一个或多个灭活。待突变的残基可以对应于野生型示例性化脓链球菌cas9多肽中的残基asp10、his840、asn854和asn856(例如,如通过序列和/或结构对齐确定)。突变的非限制性实例包括d10a、h840a、n854a或n856a。本领域的技术人员将认识到除丙氨酸取代之外的突变可能是合适的。d10a突变可以与h840a、n854a或n856a突变中的一个或多个组合,以产生基本上缺乏dna裂解活性的定点多肽。h840a突变可以与d10a、n854a或n856a突变中的一个或多个组合,以产生基本上缺乏dna裂解活性的定点多肽。n854a突变可以与h840a、d10a或n856a突变中的一个或多个组合,以产生基本上缺乏dna裂解活性的定点多肽。n856a突变可以与h840a、n854a或d10a突变中的一个或多个组合,以产生基本上缺乏dna裂解活性的定点多肽。包含一个基本上无活性的核酸酶结构域的定点多肽称为“切口酶”。rna导向的内切核酸酶如cas9的切口酶变体可以用于增加crispr介导的基因组编辑的特异性。野生型cas9通常由单个导向rna导向,该单个导向rna设计成与靶序列中的特定约20个核苷酸序列(诸如内源基因组基因座)杂交。然而,在导向rna和靶基因座之间可以耐受几种失配,将靶位点中所需同源性的长度有效地降低至例如少至13nt的同源性,从而导致由靶基因组中的其他位置的crispr/cas9复合物实现结合和双链核酸裂解(也称为脱靶裂解)的潜力升高。因为cas9的切口酶变体各自仅切割一条链,为了产生双链断裂,一对切口酶必须紧密地且在靶核酸的相对链上结合,从而产生一对切口,这相当于双链断裂。这需要两个单独的导向rna(每个切口酶一个)必须紧密地且在靶核酸的相对链上结合。该要求基本上使双链断裂发生所需的最小同源性长度加倍,从而降低了双链裂解事件将在基因组中的其他地方发生的可能性,其中两个导向rna位点-如果存在的话-不太可能彼此足够接近到能够形成双链断裂。如本领域所述,切口酶也可以用于促进hdr对nhej。hdr可以用于通过使用有效介导所需变化的特定供体序列将选定的变化引入基因组中的靶位点。预期的突变可以包括取代、添加和缺失或其任何组合。突变将突变的氨基酸转化为丙氨酸。该突变将突变的氨基酸转化为另一种氨基酸(例如,甘氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸)。该突变将突变的氨基酸转化为非天然氨基酸(例如,硒代甲硫氨酸)。该突变将突变的氨基酸转化为氨基酸模拟物(例如,磷酸酶模拟物)。该突变可以是保守突变。例如,该突变将突变的氨基酸转化为类似于突变氨基酸的大小、形状、电荷、极性、构象和/或旋转异构体的氨基酸(例如,半胱氨酸/丝氨酸突变、赖氨酸/天冬酰胺突变、组氨酸/苯丙氨酸突变)。该突变可以导致阅读框架的偏移和/或过早终止密码子的产生。该突变可以导致影响一种或多种基因的表达的基因或基因座的调控区域改变。定点多肽(例如,变体,突变的、无酶解活性的和/或条件无酶解活性的定点多肽)可以靶向核酸。定点多肽(例如,变体,突变的、无酶解活性的和/或条件无酶解活性的内切核酸酶)可以靶向dna。定点多肽(例如,变体,突变的、无酶解活性的和/或条件无酶解活性的内切核酸酶)可以靶向rna。定点多肽可以包含一个或多个非天然序列(例如,定点多肽是融合蛋白)。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9、核酸结合结构域和两个核酸裂解结构域(即,hnh结构域和ruvc结构域)的至少15%氨基酸同一性。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9和两个核酸裂解结构域(即,hnh结构域和ruvc结构域)的至少15%氨基酸同一性。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9和两个核酸裂解结构域的至少15%氨基酸同一性,其中核酸裂解结构域中的一个或两个包含与来自细菌(例如,化脓链球菌)的cas9的核酸酶结构域的至少50%氨基酸同一性。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9、两个核酸裂解结构域(即,hnh结构域和ruvc结构域)和非天然序列(例如,细胞核定位信号)或将定点多肽连接到非天然序列的接头的至少15%氨基酸同一性。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9、两个核酸裂解结构域(即,hnh结构域和ruvc结构域)的至少15%氨基酸同一性,其中该定点多肽在核酸裂解结构域中的一个或两个中包含突变,该突变使核酸酶结构域的裂解活性降低至少50%。定点多肽可以包含如下氨基酸序列,其包含与来自细菌(例如,化脓链球菌)的cas9和两个核酸裂解结构域(即,hnh结构域和ruvc结构域)的至少15%氨基酸同一性,其中核酸酶结构域中的一个包含天冬氨酸10的突变,和/或其中核酸酶结构域中的一个可以包含组氨酸840的突变,并且其中该突变使一个或多个核酸酶结构域的裂解活性降低至少50%。这一种或多种定点多肽如dna内切核酸酶可以包含两个切口酶,这些切口酶一起在基因组中的特定基因座处实现一个双链断裂,或者四个切口酶,这些切口酶一起在基因组中的特定基因座处实现或引起两个双链断裂。或者,一种定点多肽如dna内切核酸酶可以在基因组中的特定基因座处实现或引起一个双链断裂。定点多肽可以在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。例如,cas9内切核酸酶可以侧接两个nls,一个nls位于n-末端且第二个nls位于c-末端。nls可以是本领域中已知的任何nls,诸如sv40nls。基因组靶向核酸本公开提供一种基因组靶向核酸,其可以将相关多肽(例如,定点多肽)的活性定向到靶核酸内的特定靶序列。基因组靶向核酸可以是rna。基因组靶向rna在本文中称为“导向rna”或“grna”。导向rna可以至少包含与关注的靶核酸序列和crispr重复序列杂交的间隔区序列。在ii型系统中,grna还包含称为tracrrna序列的第二rna。在ii型导向rna(grna)中,crispr重复序列和tracrrna序列彼此杂交以形成双链体。在v型导向rna(grna)中,crrna形成双链体。在两种系统中,双链体可以结合定点多肽,使得导向rna和定点多肽形成复合物。基因组靶向核酸可以凭借其与定点多肽的结合为该复合物提供靶特异性。因此,基因组靶向核酸可以定向定点多肽的活性。示例性导向rna包括序列表中的seqidno:1-71,947中的间隔区序列和seqidno:71,950-71,959的sgrna序列。如本领域的普通技术人员所理解,每个导向rna可以设计成包括与其基因组靶序列互补的间隔区序列。例如,序列表中的seqidno:1-71,947中的间隔区序列中的每一个可以放入单个rna嵌合体或crrna(以及相应的tracrrna)中。参见jinek等人,science,337,816-821(2012)和deltcheva等人,nature,471,602-607(2011)或表1。基因组靶向核酸可以是双分子导向rna。基因组靶向核酸可以是单分子导向rna。双分子导向rna可以包含rna的两条链。第一链在5'至3'方向上包含任选的间隔区延伸序列、间隔区序列和最小的crispr重复序列。第二链可以包含最小tracrrna序列(与最小crispr重复序列互补)、3'tracrrna序列和任选的tracrrna延伸序列。ii型系统中的单分子导向rna(sgrna)可以在5'至3'方向上包含任选的间隔区延伸序列、间隔区序列、最小crispr重复序列、单分子导向接头、最小tracrrna序列、3’tracrrna序列和任选的tracrrna延伸序列。任选的tracrrna延伸可以包含为导向rna贡献其他功能(例如,稳定性)的元件。单分子导向接头可以连接最小的crispr重复序列和最小的tracrrna序列以形成发夹结构。任选的tracrrna延伸可以包含一个或多个发夹。v型系统中的单分子导向rna(sgrna)可以在5'至3'方向上包含最小的crispr重复序列和间隔区序列。sgrna可以在sgrna序列的5'末端包含20个核苷酸的间隔区序列。sgrna可以在sgrna序列的5'末端包含少于20个核苷酸的间隔区序列。sgrna可以在sgrna序列的5'末端包含超过20个核苷酸的间隔区序列。sgrna可以在sgrna序列的5'末端包含具有17-30个核苷酸的可变长度间隔区序列(参见表1)。sgrna可以在sgrna序列如表1的seqidno:71,961的3'末端不包含尿嘧啶。sgrna可以在sgrna序列如表1中的seqidno:71,962的3'末端包含一个或多个尿嘧啶。例如,sgrna可以在sgrna序列的3'末端包含1个尿嘧啶(u)。sgrna可以在sgrna序列的3'末端包含2个尿嘧啶(uu)。sgrna可以在sgrna序列的3'末端包含3个尿嘧啶(uuu)。sgrna可以在sgrna序列的3'末端包含4个尿嘧啶(uuuu)。sgrna可以在sgrna序列的3'末端包含5个尿嘧啶(uuuuu)。sgrna可以在sgrna序列的3'末端包含6个尿嘧啶(uuuuuu)。sgrna可以在sgrna序列的3'末端包含7个尿嘧啶(uuuuuuu)。sgrna可以在sgrna序列的3'末端包含8个尿嘧啶(uuuuuuuu)。sgrna可以是未修饰的或修饰的。例如,修饰的sgrna可以包含一个或多个2'-o-甲基硫代磷酸酯核苷酸。表1举例说明,crispr/cas/cpf1系统中使用的导向rna或其他较小的rna可以通过化学方法容易地合成,如下文所示和本领域中所述。虽然化学合成程序在不断扩展,但是通过诸如高效液相色谱(hplc,其避免使用诸如page的凝胶)的程序来纯化此类rna往往变得更具挑战性,因为多核苷酸长度显著增加超过一百个左右的核苷酸。一种用于产生更长的rna的方法是产生两个或更多个连接在一起的分子。更长的rna,诸如编码cas9或cpf1内切核酸酶的rna,更容易酶产生。可以在化学合成和/或酶产生rna期间或之后引入各种类型的rna修饰,例如,增强稳定性、降低先天免疫应答的可能性或程度和/或增强其他属性的修饰,如本领域中所述。间隔区延伸序列在基因组靶向核酸的一些实施例中,间隔区延伸序列可以修饰活性,提供稳定性和/或提供修饰基因组靶向核酸的位置。间隔区延伸序列可以修饰靶上或脱靶活性或特异性。在一些实施例中,可以提供间隔区延伸序列。间隔区延伸序列的长度可以为多于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、1000、2000、3000、4000、5000、6000或7000个或更多个核苷酸。间隔区延伸序列的长度可以为少于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、1000、2000、3000、4000、5000、6000、7000个或更多个核苷酸。间隔区延伸序列的长度可以少于10个核苷酸。间隔区延伸序列的长度可以在10-30个核苷酸之间。间隔区延伸序列的长度可以在30-70个核苷酸之间。间隔区延伸序列可以包含另一部分(例如,稳定性控制序列、内切核酸酶结合序列、核酶)。该部分可以降低或增加核酸靶向核酸的稳定性。该部分可以是转录终止子区段(即,转录终止序列)。该部分可以在真核细胞中起作用。该部分可在原核细胞中起作用。该部分可在真核细胞和原核细胞中起作用。合适部分的非限制性实例包括:5'帽(例如,7-甲基鸟苷酸帽(m7g))、核糖开关序列(例如,以允许蛋白质和蛋白质复合物的调控稳定性和/或调控可及性)、形成dsrna双链体(即,发夹)的序列、将rna靶向亚细胞位置的序列(例如,细胞核、线粒体、叶绿体等等)、提供追踪的修饰或序列(例如,直接缀合到荧光分子、缀合到促进荧光检测的部分、允许荧光检测的序列等)和/或提供蛋白质的结合位点的修饰或序列(例如,作用于dna的蛋白质,包括转录激活因子、转录控制、dna甲基转移酶、dna去甲基化酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等等)。间隔区序列间隔区序列与关注的靶核酸中的序列杂交。基因组靶向核酸的间隔区可以通过杂交(即,碱基配对)以序列特异性方式与靶核酸相互作用。间隔区的核苷酸序列可以根据关注的靶核酸的序列而变化。在本文的crispr/cas系统中,间隔区序列可以设计成与位于该系统中使用的cas9酶的pam的5'的靶核酸杂交。间隔区可以与靶序列完全匹配或者可以具有失配。每种cas9酶具有在靶dna中识别的特定pam序列。例如,化脓链球菌在靶核酸中识别包含序列5'-nrg-3'的pam,其中r包含a或g,其中n是任何核苷酸,并且n紧邻由间隔区序列靶向的靶核酸序列的3'。靶核酸序列可以包含20个核苷酸。靶核酸可以包含少于20个核苷酸。靶核酸可以包含多于20个核苷酸。靶核酸可以包含至少:5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。靶核酸可以包含至多:5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。靶核酸序列可以包含紧邻pam的第一个核苷酸的5’的20个碱基。例如,在包含5’-nnnnnnnnnnnnnnnnnnnnnrg-3’(seqidno:71,948)的序列中,靶核酸可以包含对应于n的序列,其中n是任何核苷酸,且带下划线的nrg序列是化脓链球菌pam。与靶核酸杂交的间隔区序列可以具有至少约6个核苷酸(nt)的长度。间隔区序列可以是至少约6nt、至少约10nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt或至少约40nt、约6nt至约80nt、约6nt至约50nt、约6nt至约45nt、约6nt至约40nt、约6nt至约35nt、约6nt至约30nt、约6nt至约25nt、约6nt至约20nt、约6nt至约19nt、约10nt至约50nt、约10nt至约45nt、约10nt至约40nt、约10nt至约35nt、约10nt至约30nt、约10nt至约25nt、约10nt至约20nt、约10nt至约19nt、约19nt至约25nt、约19nt至约30nt、约19nt至约35nt、约19nt至约40nt、约19nt至约45nt、约19nt至约50nt、约19nt至约60nt、约20nt至约25nt、约20nt至约30nt、约20nt至约35nt、约20nt至约40nt、约20nt至约45nt、约20nt至约50nt、或约20nt至约60nt。在一些实施例中,间隔区序列可以包含20个核苷酸。在一些实施例中,间隔区可以包含19个核苷酸。在一些实施例中,间隔区序列与靶核酸之间的互补百分比为至少约30%、至少约40%、至少约50%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%或100%。在一些实施例中,间隔区序列与靶核酸之间的互补百分比为至多约30%、至多约40%、至多约50%、至多约60%、至多约65%、至多约70%、至多约75%、至多约80%、至多约85%、至多约90%、至多约95%、至多约97%、至多约98%、至多约99%或100%。在一些实施例中,相对于靶核酸的互补链的靶序列的六个连续的5'-大多数核苷酸而言,间隔区序列与靶核酸之间的互补百分比是100%。相对于约20个连续核苷酸而言,间隔区序列和靶核酸之间的互补百分比可以是至少60%。间隔区序列和靶核酸的长度可以相差1至6个核苷酸,这可以被认为是一个或多个凸出(bulge)。可以使用计算机程序设计或选择间隔区序列。计算机程序可以使用变量,诸如预测的熔融温度、二级结构形成、预测的退火温度、序列同一性、基因组背景、染色质可及性、%gc,基因组发生的频率(例如,相同或相似但由于失配、插入或缺失而在一个或多个点处变化的序列)、甲基化状态、snp的存在等等。最小crispr重复序列最小crispr重复序列可以是与参考crispr重复序列(例如,来自化脓链球菌的crrna)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列同一性的序列。最小crispr重复序列可以包含可以与细胞中的最小tracrrna序列杂交的核苷酸。最小crispr重复序列和最小tracrrna序列可以形成双链体,即碱基配对的双链结构。最小crispr重复序列和最小tracrrna序列可以一起结合到定点多肽。最小crispr重复序列的至少一部分可以与最小tracrrna序列杂交。最小crispr重复序列的至少一部分可以包含与最小tracrrna序列的至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补性。最小crispr重复序列的至少一部分可以包含与最小tracrrna序列的至多约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补性。最小crispr重复序列的长度可以为约7个核苷酸至约100个核苷酸。例如,最小crispr重复序列的长度为约7个核苷酸(nt)至约50nt、约7nt至约40nt、约7nt至约30nt、约7nt至约25nt、约7nt至约20nt、约7nt至约15nt、约8nt至约40nt、约8nt至约30nt、约8nt至约25nt、约8nt至约20nt、约8nt至约15nt、约15nt至约100nt、约15nt至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt、或约15nt至约25nt。在一些实施例中,最小crispr重复序列的长度可以是大约9个核苷酸。最小crispr重复序列的长度可以是大约12个核苷酸。相对于一段至少6、7或8个连续核苷酸而言,最小crispr重复序列可以与参考最小crispr重复序列(例如,来自化脓链球菌的野生型crrna)至少约60%相同。例如,相对于一段至少6、7或8个连续核苷酸而言,最小crispr重复序列可以与参考最小crispr重复序列至少约65%相同,至少约70%相同,至少约75%相同,至少约80%相同,至少约85%相同,至少约90%相同,至少约95%相同,至少约98%相同,至少约99%相同或100%相同。最小tracrrna序列最小tracrrna序列可以是与参考tracrrna序列(例如,来自化脓链球菌的tracrrna)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列同一性的序列。最小tracrrna序列可以包含与细胞中的最小crispr重复序列杂交的核苷酸。最小tracrrna序列和最小crispr重复序列形成双链体,即碱基配对的双链结构。最小tracrrna序列和最小crispr重复序列可以一起结合到定点多肽。最小tracrrna序列的至少一部分可以与最小crispr重复序列杂交。最小tracrrna序列可以与最小crispr重复序列的至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补。最小tracrrna序列的长度可以为约7个核苷酸至约100个核苷酸。例如,最小tracrrna序列的长度可以是约7个核苷酸(nt)至约50nt、约7nt至约40nt、约7nt至约30nt、约7nt至约25nt、约7nt至约20nt、约7nt至约15nt、约8nt至约40nt、约8nt至约30nt、约8nt至约25nt、约8nt至约20nt、约8nt至约15nt、约15nt至约100nt、约15nt至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt、或约15nt至约25nt。最小tracrrna序列的长度可以是大约9个核苷酸。最小tracrrna序列可以是大约12个核苷酸。最小的tracrrna可以由jinek等人,同上所述的tracrrnant23-48组成。相对于一段至少6、7或8个连续核苷酸而言,最小tracrrna序列可以与参考最小tracrrna(例如,来自化脓链球菌的野生型tracrrna)至少约60%相同。例如,相对于一段至少6、7或8个连续核苷酸而言,最小tracrrna序列可以与参考最小tracrrna序列至少约65%相同,约70%相同,约75%相同,约80%相同,约85%相同,约90%相同,约95%相同,约98%相同,约99%相同或100%相同。最小crisprrna和最小tracrrna之间的双链体可以包含双螺旋。最小crisprrna和最小tracrrna之间的双链体可以包含至少约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。最小crisprrna和最小tracrrna之间的双链体可以包含至多约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。该双链体可以包含失配(即,双链体的两条链不是100%互补的)。双链体可以包含至少约1、2、3、4或5处或失配。双链体可以包含至多约1、2、3、4或5处或失配。双链体可以包含不超过2处失配。凸出在一些情况下,在最小crisprrna和最小tracrrna之间的双链体中可能存在“凸出”。凸出是双链体内核苷酸的未配对区域。凸出可以有助于双链体与定点多肽的结合。凸出可以在双链体的一侧包含未配对的5'-xxxy-3',其中x是任何嘌呤,且y包含可以与相对链上的核苷酸形成摆动对的核苷酸;和在双链体的另一侧上的未配对的核苷酸区域。在双链体的两侧上的未配对核苷酸的数量可以不同。在一个实施例中,凸出可以包含在凸出的最小crispr重复序列链上的未配对嘌呤(例如,腺嘌呤)。在一些实施例中,凸出可以包含凸出的最小tracrrna序列链的未配对的5'-aagy-3',其中y包含可以与最小crispr重复序列链上的核苷酸形成摆动配对的核苷酸。在双链体的最小crispr重复序列侧上的凸出可以包含至少1、2、3、4或5个或更多个未配对的核苷酸。在双链体的最小crispr重复序列侧上的凸出可以包含至多1、2、3、4或5个或更多个未配对的核苷酸。在双链体的最小crispr重复序列侧上的凸出可以包含1个未配对的核苷酸。在双链体的最小tracrrna序列侧上的凸出可以包含至少1、2、3、4、5、6、7、8、9或10个或更多个未配对的核苷酸。在双链体的最小tracrrna序列侧上的凸出可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个未配对的核苷酸。在双链体的第二侧(例如,双链体的最小tracrrna序列侧)上的凸出可以包含4个未配对的核苷酸。凸出可以包含至少一个摆动配对。在一些实施例中,凸出可以包含至多一个摆动配对。凸出可以包含至少一个嘌呤核苷酸。凸出可以包含至少3个嘌呤核苷酸。凸出序列可以包含至少5个嘌呤核苷酸。凸出序列可以包含至少一个鸟嘌呤核苷酸。在一些实施例中,凸出序列可以包含至少一个腺嘌呤核苷酸。发夹在各种实施例中,一个或多个发夹可以位于3'tracrrna序列中最小tracrrna的3'。该发夹可以从最小crispr重复序列和最小tracrrna序列双链体中的最后配对核苷酸起始至少约1、2、3、4、5、6、7、8、9、10、15或20个或更多个核苷酸3’。该发夹可以从最小crispr重复序列和最小tracrrna序列双链体中的最后配对核苷酸起始至多约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸3’。该发夹可以包含至少约1、2、3、4、5、6、7、8、9、10、15或20个或更多个连续核苷酸。该发夹可以包含至多约1、2、3、4、5、6、7、8、9、10、15或更多个连续核苷酸。该发夹可以包含cc二核苷酸(即,两个连续的胞嘧啶核苷酸)。该发夹可以包含双链体核苷酸(例如,发夹中的核苷酸,一起杂交)。例如,发夹可以包含cc二核苷酸,其与3'tracrrna序列的发夹双链体中的gg二核苷酸杂交。发夹中的一个或多个可以与定点多肽的导向rna相互作用区域相互作用。在一些实施例中,存在两个或更多个发夹,并且在其他实施例中,存在三个或更多个发夹。3'tracrrna序列3'tracrrna序列可以包含与参考tracrrna序列(例如,来自化脓链球菌的tracrrna序列)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列同一性的序列。3'tracrrna序列的长度可以为约6个核苷酸至约100个核苷酸。例如,3'tracrrna序列的长度可以为约6个核苷酸(nt)至约50nt、约6nt至约40nt、约6nt至约30nt、约6nt至约25nt、约6nt至约20nt、约6nt至约15nt、约8nt至约40nt、约8nt至约30nt、约8nt至约25nt、约8nt至约20nt、约8nt至约15nt、约15nt至约100nt、约15nt至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt、或约15nt至约25nt。3'tracrrna序列的长度可以为大约14个核苷酸。相对于一段至少6、7或8个连续核苷酸而言,3'tracrrna序列可以与参考3'tracrrna(例如,来自化脓链球菌的野生型3'tracrrna序列)至少约60%相同。例如,相对于一段至少6、7或8个连续核苷酸而言,3'tracrrna序列可以与参考3'tracrrna序列(例如,来自化脓链球菌的野生型3'tracrrna序列)至少约60%相同,约65%相同,约70%相同,约75%相同,约80%相同,约85%相同,约90%相同,约95%相同,约98%相同,约99%相同或100%相同。3'tracrrna序列可以包含多于一个双链体区域(例如,发夹、杂交区域)。3'tracrrna序列可以包含两个双链体区域。3'tracrrna序列可以包含茎环结构。3'tracrrna中的茎环结构可以包含至少1、2、3、4、5、6、7、8、9、10、15或20个或更多个核苷酸。3'tracrrna中的茎环结构可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。茎环结构可以包含功能部分。例如,茎环结构可以包含适体、核酶、蛋白质相互作用发夹、crispr阵列、内含子或外显子。茎环结构可以包含至少约1、2、3、4或5个或更多个功能部分。茎环结构可以包含至多约1、2、3、4或5个或更多个功能部分。3'tracrrna序列中的发夹可以包含p结构域。在一些实施例中,p结构域可以包含在发夹中的双链区域。tracrrna延伸序列无论tracrrna是在单分子导向还是双分子导向的背景下,都可以提供tracrrna延伸序列。tracrrna延伸序列的长度可以为约1个核苷酸至约400个核苷酸。tracrrna延伸序列的长度可以为多于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380或400个核苷酸。tracrrna延伸序列的长度可以为约20至约5000个或更多个核苷酸。tracrrna延伸序列的长度可以为超过1000个核苷酸。tracrrna延伸序列的长度可以为少于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400个或更多个核苷酸。tracrrna延伸序列的长度可以少于1000个核苷酸。tracrrna延伸序列的长度可以少于10个核苷酸。tracrrna延伸序列的长度可以为10-30个核苷酸。tracrrna延伸序列的长度可以为30-70个核苷酸。tracrrna延伸序列可以包含功能部分(例如,稳定性控制序列、核酶、内切核酸酶结合序列)。该功能部分可以包含转录终止子区段(即,转录终止序列)。功能部分的总长度可以为约10个核苷酸(nt)至约100nt、约10nt至约20nt、约20nt至约30nt、约30nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt、或约90nt至约100nt、约15nt至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt、或约15nt至约25nt。该功能部分可以在真核细胞中起作用。该功能部分可以在原核细胞中起作用。该功能部分可以在真核细胞和原核细胞中起作用。合适tracrrna延伸功能部分的非限制性实例包括:3’聚腺苷酸化尾、核糖开关序列(例如,以允许蛋白质和蛋白质复合物实现调控稳定性和/或调控可及性)、形成dsrna双链体(即,发夹)的序列、将rna靶向亚细胞位置的序列(例如,细胞核、线粒体、叶绿体等等)、提供追踪的修饰或序列(例如,直接缀合到荧光分子、缀合到促进荧光检测的部分、允许荧光检测的序列等)和/或提供蛋白质的结合位点的修饰或序列(例如,作用于dna的蛋白质,包括转录激活因子、转录控制、dna甲基转移酶、dna去甲基化酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等等)。tracrrna延伸序列可以包含引物结合位点或分子指数(例如,条形码序列)。tracrrna延伸序列可以包含一个或多个亲和标签。单分子导向接头序列单分子导向核酸的接头序列的长度可以为约3个核苷酸至约100个核苷酸。在jinek等人,同上中,例如,使用简单的4核苷酸“四环”(-gaaa-),science,337(6096):816-821(2012)。示例性接头的长度为约3个核苷酸(nt)至约90nt、约3nt至约80nt、约3nt至约70nt、约3nt至约60nt、约3nt至约50nt、约3nt至约40nt、约3nt至约30nt、约3nt至约20nt、约3nt至约10nt。例如,接头的长度可以为约3nt至约5nt、约5nt至约10nt、约10nt至约15nt、约15nt至约20nt、约20nt至约25nt、约25nt至约30nt、约30nt至约35nt、约35nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt、或约90nt至约100nt。单分子导向核酸的接头可以是4至40个核苷酸。该接头可以是至少约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000个或更多个核苷酸。该接头可以是至多约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000个或更多个核苷酸。接头可以包含多种序列中的任一种,但是在一些实施例中,接头将不包含具有与导向rna的其他部分的广泛同源区域的序列,这可能导致可能干扰导向的其他功能区域的分子内结合。在jinek等人,同上中,使用简单的4核苷酸序列-gaaa-,science,337(6096):816-821(2012),但同样可以使用包括更长序列的许多其他序列。接头序列可以包含功能部分。例如,接头序列可以包含一个或多个特征,这些特征包括适体、核酶、蛋白质相互作用发夹、蛋白质结合位点、crispr阵列、内含子或外显子。接头序列可以包含至少约1、2、3、4或5个或更多个功能部分。在一些实施例中,接头序列可以包含至多约1、2、3、4或5个或更多个功能部分。本公开的离体方法的步骤可以包括使用基因组工程编辑患者特异性ipsc细胞。或者,本公开的离体方法的步骤可以包括编辑间充质干细胞或造血祖细胞。同样地,本公开的体内方法的步骤可以包括使用基因组工程编辑患有血红蛋白病的患者中的细胞。相似地,本公开的细胞方法中的步骤可以包括通过基因组工程在人细胞中的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近编辑。患有血红蛋白病的不同患者通常将需要不同的缺失、调节或灭活策略。任何crispr内切核酸酶可以用于本公开的方法中,每种crispr内切核酸酶具有其自身的相关pam,其可以是或可以不是疾病特异性的。例如,用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自化脓链球菌的crispr/cas9内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:1-29,482中识别。用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自金黄色葡萄球菌的crispr/cas9内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:29,483-32,387中识别。用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自嗜热链球菌的crispr/cas9内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:32,388-33,420中识别。用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自齿垢密螺旋体的crispr/cas9内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:33,421-33,851中识别。用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自脑膜炎奈瑟菌的crispr/cas9内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:33,852-36,731中识别。用于在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近用来自氨基酸球菌属、毛螺菌科和弗朗西氏菌的crispr/cpf1内切核酸酶靶向的grna间隔区序列已经在序列表的seqidno:36,732-71,947中识别。例如,bcl11a基因的转录控制序列可以通过由nhej途径产生的缺失来调节或灭活。nhej可以用于直接地或通过靶向几个位置的一个grna或几个grna裂解来改变剪接供体或受体位点来缺失bcl11a基因的转录控制序列的区段。还可以通过插入野生型bcl11a基因或包含修饰的转录控制序列的cdna来调节或灭活bcl11a基因的转录控制序列。例如,用于通过hdr调节或活化的供体含有具有小或大的侧翼同源臂以允许退火的bcl11a基因的修饰的转录控制序列。hdr基本上是一种无错误的机制,其在dsb修复期间使用供应的同源dna序列作为模板。同源定向修复(hdr)的速率是转录控制序列和切割位点之间的距离的函数,因此选择重叠或最靠近靶位点是重要的。模板可以包括由同源区域侧接的其他序列,或者可以含有与基因组序列不同的序列,从而允许序列编辑。除了通过nhej或hdr调节或灭活bcl11a基因的转录控制序列之外,还可以有一系列的其他选择。如果存在小或大的缺失,则可以敲入含有修饰的转录控制序列的cdna。可以将全长cdna敲入任何“安全港”,但必须使用供应的或其他启动子。如果将该构建体敲入恰当位置,它将具有相似于正常基因的生理控制。可以使用成对的核酸酶以缺失基因区域,尽管通常将必须提供供体以调节或灭活该功能。在这种情况下,将供应两个grna和一个供体序列。一些基因组工程策略涉及通过缺失bcl11a基因的转录控制序列的至少一部分和/或通过也称为同源重组(hr)的同源定向修复(hdr)将野生型bcl11a基因或包含修饰的转录控制序列的cdna敲入相应基因的基因座或安全港基因座来调节或灭活bcl11a基因的转录控制序列。该策略可以调节或灭活bcl11a基因的转录控制序列并逆转、治疗和/或减轻患病状态。用于调节/灭活转录控制序列的供体核苷酸通常很小(<300bp)。这是有利的,因为hdr效率可以与供体分子的大小成反比。此外,预期供体模板可以适合尺寸受限的腺相关病毒(aav)分子,其已被证明是供体模板递送的有效手段。同源定向修复是修复双链断裂(dsb)的细胞机制。最常见的形式是同源重组。hdr还有其他途径,包括单链退火和替代hdr。基因组工程工具允许研究人员操纵细胞同源重组途径,以产生对基因组的位点特异性修饰。已经发现细胞可以使用反式提供的合成供体分子修复双链断裂。因此,通过在特异性突变附近引入双链断裂并提供合适的供体,可以在基因组中进行靶向改变。特异性裂解使hdr的速率比接受单独的同源供体的106个细胞中的1个的速率高1,000倍以上。在特定核苷酸处同源定向修复(hdr)的速率是距切割位点的距离的函数,因此选择重叠或最靠近靶位点是重要的。基因编辑提供优于基因添加的优势,因为原位校正使得基因组的其余部分不受干扰。由hdr进行编辑的供应供体显著不同,但可以包含具有小或大侧接同源臂以允许退火至基因组dna的预期序列。侧接引入的遗传改变的同源区域可以是30bp或更小,或者与可以含有启动子、cdna等的多千碱基盒一样大。已经使用了单链和双链低聚核苷酸供体。这些低聚核苷酸的大小范围为小于100nt至超过数kb,但也可以产生和使用更长的ssdna。可以使用双链供体,包括pcr扩增子、质粒和小环。一般而言,已经发现aav载体可以是递送供体模板的非常有效的手段,尽管单个供体的包装限度<5kb。供体的活性转录使hdr增加三倍,表明包含启动子可以增加转化。相反,供体的cpg甲基化降低了基因表达和hdr。除了野生型内切核酸酶如cas9之外,还存在切口酶变体,其使得一个或另一个核酸酶结构域灭活,导致仅切割一条dna链。hdr可以自单个cas切口酶或使用侧接靶区域的成对切口酶定向。供体可以是单链的,带切口的或dsdna。供体dna可以与核酸酶一起供应或者通过各种不同的方法,例如通过转染、纳米粒子、微注射或病毒转导独立地供应。已经提出了一系列系链选项,以增加供体对hdr的可用性。实例包括将供体附着到核酸酶,附着到附近结合的dna结合蛋白,或附着到参与dna末端结合或修复的蛋白质。修复途径的选择可以由许多培养条件如影响细胞循环的那些来导向,或通过靶向dna修复和相关蛋白来导向。例如,为了增加hdr,可以抑制关键的nhej分子,诸如ku70、ku80或dna连接酶iv。在不存在供体的情况下,来自dna断裂的末端或来自不同断裂的末端可以使用几种非同源修复途径连接,其中dna末端在连接处在有很少或没有碱基配对的情况下连接。除了规范的nhej外,还有相似的修复机制,诸如alt-nhej。如果存在两处断裂,则可以缺失或反转中间区段。nhej修复途径可以导致接合点处的插入、缺失或突变。在核酸酶裂解后,使用nhej以将15-kb诱导型基因表达盒插入人细胞系中的确定的基因座中。maresca,m.、lin,v.g.、guo,n.和yang,y.,genomeres23,539-546(2013)。除了通过nhej或hdr进行基因组编辑之外,还进行了使用nhej途径和hr两者的位点特异性基因插入。组合方法可以适用于某些设置,可能包括内含子/外显子边界。nhej可以证明对在内含子中的连接有效,而无错误的hdr可能更适合于编码区域。作为另一种选择,可以将野生型bcl11a基因或包含修饰的转录控制序列的cdna敲入相应基因的基因座或敲入安全港位点,诸如aavs1。在一些实施例中,所述方法可以提供一个grna或一对grna,其可用于促进并入来自多核苷酸供体模板的新序列以敲入一部分或整体的野生型bcl11a基因或包含修饰的转录控制序列的cdna。这些方法可以提供通过切割基因两次进行缺失的grna对,一个grna在一个或多个突变的5'末端切割,且另一个grna在一个或多个突变的3'末端切割,这促进来自多核苷酸供体模板的新基因插入以置换bcl11a基因的转录控制序列。切割可以通过一对dna内切核酸酶完成,每个内切核酸酶在基因组中产生dsb,或者切割可以通过多个切口酶完成,这些切口酶在基因组中一起产生dsb。或者,这些方法可以提供一个grna以在bcl11a基因的转录控制序列周围进行一次双链切割,其促进插入来自多核苷酸供体模板的新序列以用野生型bcl11a基因或包含修饰的转录控制序列的cdna置换bcl11a基因的转录控制序列。双链切割可以由单个dna内切核酸酶或多个切口酶进行,这些切口酶在基因组中一起产生dsb。bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近的示例性修饰包括在上文提到的bcl11a基因的转录控制序列内或其附近(邻近),诸如在转录控制序列的上游或下游在小于3kb、小于2kb、小于1kb、小于0.5kb区域内的置换。此类变体可以包括在5'和/或3'方向上比所讨论的特定置换大的置换或者在任一方向上更小的置换。因此,关于特定置换的“近”或“邻近”,意图是与所需置换边界(在本文中也称为端点)相关的ssb或dsb基因座可以在距所提到的参考基因座小于约3kb的区域内。ssb或dsb基因座可以更接近并且在2kb内,在1kb内,在0.5kb内或在0.1kb内。在小置换的情况下,所需端点可以位于或“邻近”参考基因座,意图是该端点可以在距参考基因座的100bp内,在50bp内,在25bp内或小于约10bp至5bp内。只要转录控制活性被调节或灭活,可以预期包含更大或更小置换的实例提供相同的益处。因此,预期本文描述并说明的置换的许多变型可以有效减轻血红蛋白病。另一种基因组工程策略涉及外显子或内含子缺失。特定外显子或内含子的靶向缺失可以是用单一治疗性混合物治疗大患者亚组的有吸引力的策略。缺失可以是单外显子或内含子缺失或多外显子或内含子缺失。虽然多外显子缺失可以到达更多的患者,但是对于更大的缺失,缺失效率随着大小的增加而大大降低。因此,缺失的大小范围可以是40至10,000个碱基对(bp)。例如,缺失的大小范围可以是40-100;100-300;300-500;500-1,000;1,000-2,000;2,000-3,000;3,000-5,000;或5,000-10,000个碱基对。如果内含子含有调控元件,诸如转录控制元件(例如,转录因子结合位点),则可能需要缺失内含子。为了确保在缺失后正确加工pre-mrna,可以缺失周围的剪接信号。剪接供体和受体通常在相邻内含子的100个碱基对内。因此,在一些实施例中,方法可以提供相对于每个关注的外显子/内含子接合切割约+/-100-3100bp的所有grna。对于任何基因组编辑策略,可以通过测序或pcr分析来确认基因编辑。靶序列选择相对于特定参考基因座的5'边界和/或3'边界的位置的偏移可以用于促进或增强基因编辑的特定应用,其部分地取决于选择用于编辑的内切核酸酶系统,如本文中进一步描述和说明的。在此类靶序列选择的第一非限制性实施例中,许多内切核酸酶系统具有可以导向用于裂解的潜在靶位点的初始选择的规则或标准,例如在crisprii型或v型内切核酸酶的情况下在与dna裂解位点相邻的特定位置中需要pam序列基序。在靶序列选择或优化的另一个非限制性实施例中,靶序列和基因编辑内切核酸酶的特定组合的脱靶活性的频率(即,在除所选靶序列以外的位点处发生的dsb的频率)可以相对于靶上活性的频率评估。在一些情况下,已经在所需基因座上正确编辑的细胞相对于其他细胞可以具有选择优势。选择优势的说明性但非限制性的实例包括获得诸如增强的复制速率、持久性、对某些情况的抗性、增强的成功移植或引入患者后体内持久性的速率等属性以及与维持或增加此类细胞的数量或活力相关的其他属性。在其他情况下,可以通过用于识别、分类或以其他方式选择已经正确编辑的细胞的一种或多种筛选方法来积极地选择已在所需基因座处正确编辑的细胞。选择优势和定向选择方法都可以利用与校正相关的表型。在一些情况下,可以编辑细胞两次或更多次以产生第二修饰,其产生用于选择或纯化预期细胞群体的新表型。可以通过添加用于可选择或可筛选标志物的第二grna来产生这种第二修饰。在一些情况下,可以使用含有cdna以及可选择的标志物的dna片段在所需基因座上正确编辑细胞。无论任何选择优势是否适用或在特定情况下是否应用任何定向选择,还可以通过考虑脱靶频率来导向靶序列选择,以便增强应用的有效性和/或降低在除所需靶标之外的位点处不期望改变的可能性。如本文和本领域中进一步描述和说明的,脱靶活性的发生可以受许多因素影响,这些因素包括靶上位点和各种脱靶位点之间的相似性和不相似性以及所用的特定内切核酸酶。生物信息学工具可以用于帮助预测脱靶活性,并且此类工具通常也可以用于识别脱靶活性的最可能位点,然后可以在实验设置下评估以评价脱靶活性与靶上活性的相对频率,从而允许选择具有较高相对靶上活性的序列。本文提供了此类技术的说明性实施例,并且其他技术在本领域中是已知的。靶序列选择的另一方面涉及同源重组事件。共有同源区域的序列可以作为导致间插序列缺失的同源重组事件的焦点。此类重组事件在染色体和其他dna序列的正常复制过程期间发生,并且在合成dna序列的其他时间,诸如在修复双链断裂(dsb)的情况下发生,这在正常细胞复制周期期间定期地发生,但也可以通过各种事件(诸如uv光和dna断裂的其他诱导物)的出现或某些试剂(诸如各种化学诱导剂)的存在来增强。许多这样的诱导剂导致dsb在基因组中不加选择地发生,并且dsb可以在正常细胞中定期地诱导和修复。在修复期间,可以完全保真地重新产生原始序列,然而,在一些情况下,在dsb位点引入小插入或缺失(称为“插入缺失”)。dsb还可以在特定位置特异性地诱导,如本文所述的内切核酸酶系统的情况,其可以用于在选定的染色体位置引起定向或优先的基因修饰事件。在许多情况下可以利用同源序列在dna修复(以及复制)的背景下进行重组的趋势,并且这是基因编辑系统如crispr的一种应用的基础,其中使用同源定向修复以将通过使用“供体”多核苷酸提供的关注的序列插入所需染色体位置。也可以使用特定序列之间的同源区域形成所需缺失,这些同源区域可以是可以包含少至10个碱基对或更少的“微同源”的小区域。例如,可以在与附近序列表现出微同源性的位点处引入单处dsb。在这种dsb的正常修复过程期间,高频率发生的结果是作为由dsb和伴随的细胞修复过程促进的重组的结果的间插序列的缺失。然而,在某些情况下,在同源区域内选择靶序列也可以产生大得多的缺失,包括基因融合(当缺失在编码区中时),其可能需要或可能不需要给出特定情况。本文提供的实施例进一步说明用于产生设计用于诱导导致转录控制蛋白活性的调节或灭活的置换的dsb的各种靶区域的选择,以及在设计用以相对于靶上事件而言使脱靶事件减至最少的此类区域内特异性靶序列的选择。核酸修饰在一些情况下,引入细胞中的多核苷酸可以包含一种或多种修饰,这些修饰可以单独或组合使用例如以增强活性、稳定性或特异性,改变递送,减少宿主细胞中的先天免疫应答,或用于其他增强,如本文进一步描述和本领域已知的。在某些实施例中,修饰的多核苷酸可以用于crispr/cas9/cpf1系统,在这种情况下,导向rna(单分子导向或双分子导向)和/或编码引入细胞中的cas或cpf1内切核酸酶的dna或rna可以被修饰,如下面所述和说明的。此类修饰的多核苷酸可以用于crispr/cas9/cpf1系统中以编辑任何一个或多个基因组基因座。出于此类用途的非限制性说明目的使用crispr/cas9/cpf1系统,可以使用导向rna的修饰来增强包含可以是单分子导向或双分子导向的导向rna和cas或cpf1内切核酸酶的crispr/cas9/cpf1基因组编辑复合物的形成或稳定性。导向rna的修饰也可以或替代地用于增强在具有在基因组中的靶序列的基因组编辑复合物之间的相互作用的起始、稳定性或动力学,其可以用于例如增强靶上活性。导向rna的修饰也可以或替代地用于增强特异性,例如与在其他(脱靶)位点处的效应相比较,增强在靶上位点处的基因组编辑的相对速率。修饰也可以或替代地用于例如通过增加导向rna对细胞中存在的核糖核酸酶(rna酶)引起的降解的抗性增加导向rna的稳定性,从而使其在细胞中的半衰期增加。增强导向rna半衰期的修饰可以在其中cas或cpf1内切核酸酶被引入细胞中以通过需要翻译以产生内切核酸酶的rna编辑的方面特别有用,因为增加在与rna编码内切核酸酶的同时引入的导向rna的半衰期可以用以增加导向rna和编码的cas或cpf1内切核酸酶在细胞中共存在的时间。修饰也可以或替代地用于降低引入细胞的rna引发先天免疫应答的可能性或程度。在包括小干扰rna(sirna)的rna干扰(rnai)的背景下已经充分表征的此类应答,如下文和本领域中所述,往往与rna的半衰期降低和/或与免疫应答相关的细胞因子或其他因子的诱导相关联。还可以对引入细胞中的编码内切核酸酶的rna进行一种或多种类型的修饰,包括但不限于增强rna的稳定性(诸如通过由细胞中存在的rna酶增加其降解)的修饰、增强所得产物(即,内切核酸酶)的翻译的修饰和/或降低引入细胞的rna引发先天免疫应答的可能性或程度的修饰。同样可以使用诸如前述和其他的修改的组合。在crispr/cas9/cpf1的情况下,例如,可以对导向rna进行一种或多种类型的修饰(包括上面示例的那些),和/或可以对编码cas内切核酸酶的rna进行一种或多种类型的修饰(包括上面示例的那些)。举例说明,crispr/cas9/cpf1系统中使用的导向rna或其他较小的rna可以通过化学方法容易地合成,使得能够容易地并入许多修饰,如下文所示并在本领域中所述。虽然化学合成程序在不断扩展,但是通过诸如高效液相色谱(hplc,其避免使用诸如page的凝胶)的程序来纯化此类rna往往变得更具挑战性,因为多核苷酸长度显著增加超过一百个左右的核苷酸。可以用于产生更长的化学修饰的rna的一种方法是产生两个或更多个接合在一起的分子。长得多的rna,诸如编码cas9内切核酸酶的rna,更容易酶产生。虽然可用于酶产生的rna的修饰类型较少,但仍有修饰可以用于例如增强稳定性、降低先天免疫应答的可能性或程度和/或增强其他属性,如下文和本领域中进一步描述的;并且正在定期地开发新的修饰类型。作为各种类型的修饰的说明,特别是那些经常与较小化学合成的rna一起使用的修饰,修饰可以包含在糖的2'位修饰的一个或多个核苷酸,在一些方面,2'-o-烷基、2'-o-烷基-o-烷基或2'-氟-修饰的核苷酸。在一些实施例中,rna修饰可以在rna的3'末端的嘧啶、无碱基残基或反向碱基的核糖上包含2'-氟、2'-氨基或2'o-甲基修饰。此类修饰可以常规地并入低聚核苷酸中,并且已经显示这些低聚核苷酸具有比针对给定靶标的2'-脱氧低聚核苷酸高的tm(即,更高的靶结合亲和力)。已经显示许多核苷酸和核苷修饰使得并入了它们的低聚核苷酸比天然低聚核苷酸对核酸酶消化更具抗性;这些修饰的低聚核苷酸比未修饰的低聚核苷酸完整地存活更长的时间。修饰的低聚核苷酸的具体实例包括包含修饰的主链的那些,例如硫代磷酸酯、磷酸三酯、膦酸甲酯、短链烷基或环烷基糖间键或短链杂原子或杂环糖间键。一些低聚核苷酸是具有硫代磷酸酯主链的低聚核苷酸和具有杂原子主链,特别是ch2-nh-o-ch2、ch,~n(ch3)~o~ch2(称为亚甲基(甲基亚胺基)或mmi主链)、ch2--o--n(ch3)-ch2、ch2-n(ch3)-n(ch3)-ch2和o-n(ch3)-ch2-ch2主链的低聚核苷酸,其中天然磷酸二酯主链表示为o-p-o-ch);酰胺主链[参见demesmaeker等人,ace.chem.res.,28:366-374(1995)];吗啉代主链结构(参见summerton和weller,美国专利5,034,506);肽核酸(pna)主链(其中低聚核苷酸的磷酸二酯主链被聚酰胺主链置换,核苷酸直接或间接结合到聚酰胺主链的氮杂氮原子上,参见nielsen等人,science1991,254,1497)。含磷键包括但不限于硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、包含3'亚烷基膦酸酯和手性膦酸酯的甲基和其他烷基膦酸酯、次膦酸酯、包含3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯的氨基磷酸酯、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯和具有正常3'-5'键的硼烷磷酸酯、这些的2'-5'连接的类似物以及具有相反极性的那些,其中相邻的核苷酸单元对将3'-5’连接至5'-3'或将2'-5’连接至5'-2';参见美国专利3,687,808;4,469,863;4,476,301;5,023,243;5,177,196;5,188,897;5,264,423;5,276,019;5,278,302;5,286,717;5,321,131;5,399,676;5,405,939;5,453,496;5,455,233;5,466,677;5,476,925;5,519,126;5,536,821;5,541,306;5,550,111;5,563,253;5,571,799;5,587,361;和5,625,050。基于吗啉代的低聚化合物描述于braasch和davidcorey,biochemistry,41(14):4503-4510(2002);genesis,第30卷,第3期,(2001);heasman,dev.biol.,243:209-214(2002);nasevicius等人,nat.genet.,26:216-220(2000);lacerra等人,proc.natl.acad.sci.,97:9591-9596(2000);和美国专利5,034,506,1991年7月23日颁发。环己烯基核酸低聚核苷酸模拟物描述在wang等人,j.am.chem.soc.,122:8595-8602(2000)中。其中不包括磷原子的修饰的低聚核苷酸主链具有由短链烷基或环烷基核苷酸间键、混合杂原子和烷基或环烷基核苷酸间键或一个或多个短链杂原子或杂环核苷酸间键形成的主链。这些包括具有吗啉代键的那些(部分地由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲酰基和硫代甲酰基主链;亚甲基甲酰基和硫代甲酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;和其他具有混合的n、o、s和ch2组成部分的其他主链;参见美国专利5,034,506;5,166,315;5,185,444;5,214,134;5,216,141;5,235,033;5,264,562;5,264,564;5,405,938;5,434,257;5,466,677;5,470,967;5,489,677;5,541,307;5,561,225;5,596,086;5,602,240;5,610,289;5,602,240;5,608,046;5,610,289;5,618,704;5,623,070;5,663,312;5,633,360;5,677,437;和5,677,439。还可以包括一个或多个取代的糖部分,例如,在2'位置的下列之一:oh,sh,sch3,f,ocn,och3och3,och3o(ch2)nch3,o(ch2)nnh2或o(ch2)nch3,其中n为1至约10;c1至c10低碳烷基、烷氧基烷氧基,取代的低碳烷基、烷芳基或芳烷基;氯;cl;br;cn;cf3;ocf3;o-、s-或n-烷基;o-、s-或n-烯基;soch3;so2ch3;ono2;no2;n3;nh2;杂环烷基;杂环烷芳基;氨基烷基氨基;聚烷基氨基;取代的甲硅烷基;rna裂解基团;报导体基团;嵌入剂;用于改善低聚核苷酸的药代动力学特性的基团;或用于改善低聚核苷酸和具有相似特性的其他取代基的药效学特性的基团。在一些方面,修饰包括2'-甲氧基乙氧基(2'-0-ch2ch2och3,也称为2'-o-(2-甲氧基乙基))(martin等人,heiv.chim.acta,1995,78,486)。其他修饰包括2'-甲氧基(2'-0-ch3)、2'-丙氧基(2'-och2ch2ch3)和2'-氟代(2'-f)。也可以在低聚核苷酸上的其他位置,特别是在3'末端核苷酸上的糖的3'位和5'末端核苷酸的5'位上进行相似的修饰。低聚核苷酸也可以具有糖模拟物,诸如环丁基代替戊呋喃糖基基团。在一些实施例中,核苷酸单元的糖和核苷酸间键(即主链)都可以用新的基团置换。可以维持碱基单元以与合适的核酸靶化合物杂交。一种此类低聚化合物,即已显示具有优异杂交特性的低聚核苷酸模拟物,被称为肽核酸(pna)。在pna化合物中,低聚核苷酸的糖主链可以用含酰胺的主链如氨基乙基甘氨酸主链置换。核碱基可以保留并直接或间接键合到主链的酰胺部分的氮杂氮原子上。教导pna化合物的制备的代表性美国专利包括但不限于美国专利5,539,082;5,714,331;和5,719,262。pna化合物的进一步教导可以在nielsen等人,science,254:1497-1500(1991)中见到。导向rna还可以另外或替代地包括核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括腺嘌呤(a)、鸟嘌呤(g)、胸腺嘧啶(t)、胞嘧啶(c)和尿嘧啶(u)。修饰的核碱基包括仅在天然核酸中偶尔或短暂发现的核碱基,例如次黄嘌呤、6-甲基腺嘌呤、5-me嘧啶,特别是5-甲基胞嘧啶(也称为5-甲基-2'脱氧胞嘧啶,并且在本领域中通常被称为5-me-c)、5-羟甲基胞嘧啶(hmc)、糖基hmc和龙胆二糖基hmc;以及合成的核碱基,例如2-氨基腺嘌呤、2-(甲基氨基)腺嘌呤、2-(咪唑基烷基)腺嘌呤、2-(氨基烷基氨基)腺嘌呤或其他杂取代的烷基腺嘌呤、2-硫代尿嘧啶、2-硫代胸腺嘧啶、5-溴尿嘧啶、5-羟基甲基尿嘧啶、8-氮杂鸟嘌呤、7-脱氮鸟嘌呤、n6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤。kornberg,a.,dnareplication,w.h.freeman&co.,sanfrancisco,第75-77页(1980);gebeyehu等人,nucl.acidsres.15:4513(1997)。还可以包括本领域已知的“通用”碱基,例如肌苷。已经显示5-me-c取代使核酸双链体稳定性增加0.6℃至1.2℃。(sanghvi,y.s.、crooke,s.t.和lebleu,b.编,antisenseresearchandapplications,crcpress,bocaraton,1993,第276至278页)和碱基取代的方面。修饰的核碱基可以包括其他合成和天然核碱基,诸如5-甲基胞嘧啶(5-me-c),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶,5-卤代尿嘧啶和胞嘧啶,5-丙炔基尿嘧啶和胞嘧啶,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假-尿嘧啶),4-硫代尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代,特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,8-氮杂鸟嘌呤和8-氮杂腺嘌呤,7-脱氮鸟嘌呤和7-脱氮腺嘌呤,以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。另外,核碱基可以包括美国专利3,687,808中公开的那些;'theconciseencyclopediaofpolymerscienceandengineering',第858-859页,kroschwitz,j.i.编,johnwiley&sons,1990中公开的那些;englisch等人,angewandlechemie,internationaledition',1991,30,第613页公开的那些;以及sanghvi,y.s.,第15章,antisenseresearchandapplications',第289至302页,crooke,s.t.和lebleu,b.ea.,crcpress,1993公开的那些。这些核碱基中的某些特别适用于增加本发明的低聚化合物的结合亲和力。这些包括5-取代的嘧啶、6-氮杂嘧啶和n-2、n-6和0-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。已经显示5-甲基胞嘧啶取代使核酸双链体稳定性增加0.6℃至1.2℃(sanghvi,y.s.、crooke,s.t.和lebleu,b.编,'antisenseresearchandapplications',crcpress,bocaraton,1993,第276至278页)并且是碱基取代的方面,甚至更特别地当与2'-o-甲氧基乙基糖修饰组合时。修饰的核碱基描述于美国专利3,687,808以及4,845,205;5,130,302;5,134,066;5,175,273;5,367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,596,091;5,614,617;5,681,941;5,750,692;5,763,588;5,830,653;6,005,096;和美国专利申请公告2003/0158403中。因此,术语“修饰的”是指并入导向rna、内切核酸酶或bcl11a的转录控制序列或导向rna和内切核酸酶两者的非天然糖、磷酸酯或碱基。给定低聚核苷酸中的所有位置不必均匀地修饰,并且实际上可以将多于一种前述修饰并入单个低聚核苷酸中,或甚至并入低聚核苷酸内的单个核苷酸中。编码内切核酸酶的导向rna和/或mrna(或dna)可以与一个或多个增强低聚核苷酸的活性、细胞分布或细胞摄取的部分或缀合物化学连接。此类部分包括但不限于脂质部分,诸如胆固醇部分[letsinger等人,proc.natl.acad.sci.usa,86:6553-6556(1989)];胆酸[manoharan等人,bioorg.med.chem.let.,4:1053-1060(1994)];硫醚,例如己基-s-三苯甲基硫醇[manoharan等人,ann.n.y.acad.sci.,660:306-309(1992)和manoharan等人,bioorg.med.chem.let.,3:2765-2770(1993)];硫代胆固醇[oberhauser等人,nucl.acidsres.,20:533-538(1992)];脂族链,例如十二烷二醇或十一烷基残基[kabanov等人,febslett.,259:327-330(1990)和svinarchuk等人,biochimie,75:49-54(1993)];磷脂,例如二-十六烷基-外消旋-甘油或三乙基铵1,2-二-o-十六烷基-外消旋-甘油-3-h-膦酸酯[manoharan等人,tetrahedronlett.,36:3651-3654(1995)和shea等人,nucl.acidsres.,18:3777-3783(1990)];聚胺或聚乙二醇链[mancharan等人,nucleosides&nucleotides,14:969-973(1995)];金刚烷基乙酸[manoharan等人,tetrahedronlett.,36:3651-3654(1995)];棕榈酰基部分[(mishra等人,biochim.biophys.acta,1264:229-237(1995)];或十八烷基胺或己基氨基-羰基-t羟胆固醇部分[crooke等人,j.pharmacol.exp.ther.,277:923-937(1996)]。还参见美国专利4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552,538;5,578,717;5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486,603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762,779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241,5,391,723;5,416,203;5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599,928和5,688,941。糖和其他部分可以用于将包含核苷酸如阳离子多核糖体和脂质体的蛋白和复合物靶向特定位点。例如,肝细胞定向转移可以通过脱唾液酸糖蛋白受体(asgpr)介导;参见例如hu等人,proteinpeptlett.21(10):1025-30(2014)。本领域已知并定期开发的其他系统可以用于将这种情况下使用的生物分子和/或其复合物靶向关注的特定靶细胞。这些靶向部分或缀合物可以包含与官能团共价键合的缀合基团,诸如伯或仲羟基基团。本发明的缀合基团包括嵌入剂、报导分子、聚胺、聚酰胺、聚乙二醇、聚醚、增强低聚物的药效学特性的基团和增强低聚物的药物动力学特性的基团。典型的缀合基团包括胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。在本公开的情形中,增强药效动力学特性的基团包括改善摄取、增强抗降解性和/或加强与靶核酸的序列特异性杂交的基团。在本公开的情形中,增强药代动力学特性的基团包括改善本发明的化合物的摄取、分布、代谢或排泄的基团。代表性缀合基团公开在1992年10月23日提交的国际专利申请pct/us92/09196和美国专利6,287,860中。缀合部分包括但不限于脂质部分,诸如胆固醇部分;胆酸;硫醚,例如己基-5-三苯甲基硫醇;硫代胆固醇;脂族链,例如十二烷二醇或十一烷基残基;磷脂,例如二-十六烷基-外消旋-甘油或三乙铵1,2-二-o-十六烷基-外消旋-甘油-3-h-膦酸酯;多胺或聚乙二醇链,或金刚烷乙酸,棕榈基部分或十八烷基胺或己基氨基-羰基-氧基胆固醇部分。参见,例如美国专利4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552,538;5,578,717;5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486,603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762,779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241;5,391,723;5,416,203;5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599,928;和5,688,941。较不易于化学合成并且通常通过酶合成产生的较长多核苷酸也可以通过各种手段进行修饰。此类修饰可以包括例如引入某些核苷酸类似物、在分子的5'或3'末端并入特定序列或其他部分以及其他修饰。举例来说,编码cas9的mrna长度为大约4kb,并且可以通过体外转录合成。对mrna的修饰可以应用于例如增加其翻译或稳定性(诸如通过增加其对细胞降解的抗性)或降低rna在引入外源rna,特别是诸如编码cas9的rna的较长rna后引发在细胞中常观察到的先天免疫应答的趋势。在本领域中已经描述了许多这样的修饰,诸如polya尾、5'帽类似物(例如,反逆向帽类似物(arca)或m7g(5’)ppp(5’)g(mcap))、修饰的5'或3'非翻译区域(utr)、使用修饰的碱基(诸如假-utp、2-硫代-utp、5-甲基胞嘧啶-5'-三磷酸酯(5-甲基-ctp)或n6-甲基-atp)或用磷酸酶处理以除去5'末端磷酸酯。这些和其他修饰是本领域已知的,并且定期开发了rna的新修饰。存在许多修饰的rna的商业供应商,包括例如trilinkbiotech、axolabs、bio-synthesisinc.、dharmacon等等。如trilink所述,例如,5-甲基-ctp可以用于赋予所需特征,诸如增加的核酸酶稳定性、增加的翻译或减少的先天免疫受体与体外转录的rna的相互作用。也已经显示5-甲基胞嘧啶-5'-三磷酸酯(5-甲基-ctp)、n6-甲基-atp以及假-utp和2-硫代-utp可以降低培养物中和体内的先天免疫刺激,同时增强翻译,如下文提到的kormann等人和warren等人的出版物所说明。已经显示,体内递送的化学修饰的mrna可以用于实现改善的治疗效果;参见,例如,kormann等人,naturebiotechnology29,154-157(2011)。此类修饰可以用于例如增加rna分子的稳定性和/或降低其免疫原性。使用化学修饰如假-u、n6-甲基-a、2-硫代-u和5-甲基-c,发现用2-硫代-u和5-甲基-c取代仅四分之一的尿苷和胞苷残基分别引起小鼠中mrna的toll样受体(tlr)介导的识别的显著降低。通过减少先天免疫系统的活化,这些修饰可以用于有效地增加体内mrna的稳定性和寿命;参见,例如,kormann等,同上。还已经显示,重复施用并入设计成绕过先天抗病毒应答的修饰的合成信使rna可以将分化的人细胞重编程为多能性。参见,例如,warren等人,cellstemcell,7(5):618-30(2010)。充当初级重编程蛋白的此类修饰的mrna可以是重编程多种人细胞类型的高效手段。此类细胞被称为诱导多能干细胞(ipsc),并且发现并入5-甲基-ctp、假-utp和反逆向帽类似物(arca)的酶合成的rna可以用于有效地逃避细胞的抗病毒应答;参见,例如,warren等,同上。本领域中描述的多核苷酸的其他修饰包括,例如,使用polya尾、添加5'帽类似物(诸如,m7g(5’)ppp(5’)g(mcap))、修饰5'或3'非翻译区域(utr)或用磷酸酶处理以除去5'末端磷酸酯-并且正在定期开发新的方法。已经结合包括小干扰rna(sirna)的rna干扰(rnai)的修饰开发了适用于产生用于本文的修饰的rna的许多组合物和技术。sirna在体内存在特定的挑战,因为它们通过mrna干扰对基因沉默的影响通常是短暂的,这可能需要重复施用。此外,sirna是双链rna(dsrna),并且哺乳动物细胞具有发展以检测和中和dsrna的免疫应答,dsrna通常是病毒感染的副产物。因此,存在哺乳动物酶,诸如pkr(dsrna反应激酶)和潜在的视黄酸诱导基因i(rig-i),其可以介导细胞对dsrna的应答,以及toll样受体(诸如tlr3、tlr7和tlr8),其可以响应此类分子触发细胞因子的诱导;参见,例如以下评论:angart等人,pharmaceuticals(basel)6(4):440-468(2013);kanasty等人,moleculartherapy20(3):513-524(2012);burnett等人,biotechnolj.6(9):1130-46(2011);judge和maclachlan,humgenether19(2):111-24(2008);以及其中引用的参考文献。已经开发并应用了多种修饰以增强rna稳定性、降低先天免疫应答和/或实现可以结合将多核苷酸引入人细胞中使用的其他益处;参见,例如以下评论:whiteheadka等人,annualreviewofchemicalandbiomolecularengineering,2:77-96(2011);gaglione和messere,minirevmedchem,10(7):578-95(2010);chernolovskaya等人,curropinmolther.,12(2):158-67(2010);deleavey等人,currprotocnucleicacidchemchapter16:unit16.3(2009);behlke,oligonucleotides18(4):305-19(2008);fucini等人,nucleicacidther22(3):205-210(2012);bremsen等人,frontgenet3:154(2012)。如上所述,存在许多修饰rna的商业供应商,其中许多已经专门设计用于改善sirna有效性的修饰。基于文献中报道的各种发现提供了多种方法。例如,dharmacon指出用硫(硫代磷酸酯,ps)置换非桥接氧已被广泛用于改善sirna的核酸酶抗性,如kole,naturereviewsdrugdiscovery11:125-140(2012)报道。据报道,核糖的2'-位置的修饰改善了核苷酸间磷酸键的核酸酶抗性,同时增加了双链体稳定性(tm),也已经显示其提供免于免疫激活的保护。中等ps主链修饰与小的耐受良好的2'-取代(2'-o-甲基、2'-氟、2'-羟基)的组合已经与用于体内应用的高度稳定的sirna相关联,如soutschek等人,nature432:173-178(2004)所报道;和已经报道2'-o-甲基修饰有效改善稳定性,如volkov,oligonucleotides19:191-202(2009)报道。关于降低先天免疫应答的诱导,已经报道用2'-o-甲基、2'-氟、2'-羟基修饰特定序列降低tlr7/tlr8相互作用,同时通常保持沉默活性;参见,例如,judge等人,mol.ther.13:494-505(2006);和cekaite等人,j.mol.biol.365:90-108(2007)。另外的修饰,诸如2-硫尿嘧啶、假尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶和n6-甲基腺苷也已经显示出最小化由tlr3、tlr7和tlr8介导的免疫效应;参见,例如,kariko,k.等人,immunity23:165-175(2005)。如本领域所知,并且可商购获得,许多缀合物可以应用于用于本文的多核苷酸如rna,其可以增强它们的细胞递送和/或摄取,包括例如胆固醇、生育酚和叶酸、脂质、肽、聚合物、接头和适体;参见,例如,winkler,ther.deliv.4:791-809(2013)的评论及其中引用的参考文献。密码子优化编码定点多肽的多核苷酸可以根据本领域的标准方法进行密码子优化,以在含有关注的靶dna的细胞中表达。例如,如果预期的靶核酸在人细胞中,则预期编码cas9的人密码子优化的多核苷酸用于产生cas9多肽。基因组靶向核酸和定点多肽的复合物基因组靶向核酸与定点多肽(例如,核酸导向的核酸酶,诸如cas9)相互作用,从而形成复合物。基因组靶向核酸将定点多肽导向至靶核酸。rnp定点多肽和基因组靶向核酸可以各自单独地施用到细胞或患者。另一方面,定点多肽可以与一种或多种基因组靶向核酸(导向rna、sgrna或crrna以及tracrrna)预复合。然后可以将预复合的材料施用到细胞或患者。此类预复合材料被称为核糖核蛋白粒子(rnp)。rnp中的定点多肽可以是例如cas9内切核酸酶或cpf1内切核酸酶。定点多肽可以在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。例如,cas9内切核酸酶可以侧接两个nls,一个nls位于n-末端且第二个nls位于c-末端。nls可以是本领域中已知的任何nls,诸如sv40nls。rnp中基因组靶向核酸与定点多肽的重量比可以是1:1。例如,rnp中sgrna与cas9内切核酸酶的重量比可以是1:1。例如,sgrna可以包含seqidno:71,959的核酸序列,cas9内切核酸酶可以是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,并且sgrna与cas9内切核酸酶的重量比可以是1:1。核酸编码系统组分本公开提供一种核酸,其包含编码本公开的基因组靶向核酸的核苷酸序列;本公开的定点多肽;和/或实施本公开方法的方面所必需的任何核酸或蛋白质分子。编码本公开的基因组靶向核酸、本公开的定点多肽和/或实施本公开方法的方面所必需的任何核酸或蛋白质分子的核酸可以包含载体(例如,重组表达载体)。术语“载体”是指能够转运与其连接的另一核酸的核酸分子。一种类型的载体是“质粒”,其是指环状双链dna环,其可以接合其他核酸区段。另一类型的载体是病毒载体,其中可以将其他核酸区段接合到病毒基因组。某些载体能够在它们被引入到其中的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其他载体(例如,非游离型哺乳动物载体)在引入宿主细胞中后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。在一些实施例中,载体能够定向它们可操作地连接的核酸的表达。此类载体在本文中称为“重组表达载体”,或更简单地称为“表达载体”,其起相同的功能。术语“可操作地连接”是指关注的核苷酸序列以允许表达核苷酸序列的方式与一个或多个调控序列连接。术语“调控序列”旨在包括例如启动子、增强子和其他表达控制元件(例如,多腺苷酸化信号)。此类调控序列在本领域中是公知的,并且描述于例如goeddel;geneexpressiontechnology:methodsinenzymology185,academicpress,sandiego,ca(1990)中。调控序列包括在许多类型的宿主细胞中定向核苷酸序列的组成型表达的调控序列,以及仅在某些宿主细胞中定向核苷酸序列的表达的调控序列(例如,组织特异性调控序列)。本领域技术人员应理解,表达载体的设计可以取决于诸如靶细胞的选择、所需表达水平等等因素。预期的表达载体包括但不限于基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、sv40、单纯疱疹病毒、人免疫缺陷病毒、逆转录病毒(例如,鼠白血病病毒、脾坏死病毒的病毒载体;和源自逆转录病毒如劳氏肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人免疫缺陷病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒的载体;以及其他重组载体。预期用于真核靶细胞的其他载体包括但不限于载体pxt1、psg5、psvk3、pbpv、pmsg和psvlsv40(pharmacia)。预期用于真核靶细胞的其他载体包括但不限于载体pctx-1、pctx-2和pctx-3,其描述于图1a至1c中。可以使用其他载体,只要它们与宿主细胞相容即可。在一些实施例中,载体可以包含一种或多种转录和/或翻译控制元件。取决于所用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等。载体可以是自灭活载体,其使病毒序列或crispr机制的组分或其他元件灭活。合适的真核启动子(即,在真核细胞中起作用的启动子)的非限制性实例包括来自以下的启动子:早期巨细胞病毒(cmv)、单纯疱疹病毒(hsv)胸苷激酶、早期和晚期sv40、来自逆转录病毒的长末端重复序列(ltr)、人延伸因子-1启动子(ef1)、包含与鸡β-肌动蛋白启动子(cag)融合的巨细胞病毒(cmv)增强子的杂合构建体、鼠干细胞病毒启动子(mscv)、磷酸甘油酸激酶-1基因座启动子(pgk)和小鼠金属硫蛋白-i。为了表达小rna,包括与cas内切核酸酶结合使用的导向rna,包括例如u6和h1的各种启动子如rna聚合酶iii启动子可能是有利的。用于增强此类启动子的使用的描述和参数是本领域已知的,并且定期描述其他的信息和方法;参见,例如,ma,h.等人,moleculartherapy-nucleicacids3,e161(2014)doi:10.1038/mtna.2014.12。表达载体还可以含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可以包含用于扩增表达的合适序列。表达载体还可以包括编码与定点多肽融合的非天然标签(例如,组氨酸标签、血凝素标签、绿色荧光蛋白等)的核苷酸序列,从而产生融合蛋白。启动子可以是诱导型启动子(例如,热激启动子、四环素调控的启动子、类固醇调控的启动子、金属调控的启动子、雌激素受体调控的启动子等)。启动子可以是组成型启动子(例如,cmv启动子、ubc启动子)。在一些情况下,启动子可以是空间限制的和/或时间限制的启动子(例如,组织特异性启动子、细胞类型特异性启动子等)。编码本公开的基因组靶向核酸和/或定点多肽的核酸可以包装到递送载体的表面中或该表面上以递送至细胞。预期的递送载体包括但不限于纳米球、脂质体、量子点、纳米粒子、聚乙二醇粒子、水凝胶和胶束。如本领域所述,可以使用多种靶向部分以增强此类载体与所需细胞类型或位置的优先相互作用。通过病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、核转染、磷酸钙沉淀、聚乙烯亚胺(pei)介导的转染、deae葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、定向微注射、纳米粒子介导的核酸递送等等可以将本公开的复合物、多肽和核酸引入细胞中。递送导向rna多核苷酸(rna或dna)和/或内切核酸酶多核苷酸(rna或dna)可以通过本领域已知的病毒或非病毒递送载体如电穿孔、机械力、细胞变形(sqzbiotech)和细胞穿透肽递送。或者,内切核酸酶多肽可以通过本领域已知的病毒或非病毒递送载体如电穿孔或脂质纳米粒子递送。在进一步的替代方面,dna内切核酸酶可以作为一种或多种多肽单独地或与一种或多种导向rna,或一种或多种crrna以及tracrrna预复合来递送。电穿孔是一种递送技术,其中将电场施加到一个或多个细胞以增加细胞膜的渗透性,这允许诸如药物、核酸(基因组靶向核酸)、蛋白质(定点多肽)或rnp的物质引入细胞中。通常,电穿孔通过在电穿孔比色皿中在1至2毫米的悬浮细胞的距离上经过数千伏特来工作(1.0-1.5kv,250-750v/cm)。多核苷酸可以通过非病毒递送载体递送,这些非病毒载体包括但不限于纳米粒子、脂质体、核糖核蛋白、带正电荷的肽、小分子rna缀合物、适体-rna嵌合体和rna融合蛋白复合物。一些示例性非病毒递送载体描述于peer和lieberman,genetherapy,18:1127-1133(2011)(其关注于用于sirna的非病毒递送载体,该非病毒递送载体也可用于递送其他多核苷酸)中。可以通过脂质纳米粒子(lnp)将多核苷酸如导向rna、sgrna和编码内切核酸酶的mrna递送至细胞或患者。lnp是指直径小于1000nm、500nm、250nm、200nm、150nm、100nm、75nm、50nm或25nm的任何粒子。或者,纳米粒子的尺寸范围可以是1nm至1000nm、1nm至500nm、1nm至250nm、25nm至200nm、25nm至100nm、35nm至75nm或25nm至60nm。lnp可以由阳离子、阴离子或中性脂质制成。中性脂质如融合磷脂dope或膜组分胆固醇可以作为“辅助脂质”包含在lnp中,以增强转染活性和纳米粒子稳定性。阳离子脂质的限制包括由于稳定性差和快速清除而导致的低效率,以及炎症或抗炎应答的产生。lnp还可以由疏水性脂质、亲水性脂质或疏水性脂质和亲水性脂质两者构成。本领域已知的任何脂质或脂质组合都可以用于产生lnp。用于产生lnp的脂质的实例是:dotma、dospa、dotap、dmrie、dc-胆固醇、dotap-胆固醇、gap-dmorie-dpype和gl67a-dope-dmpe-聚乙二醇(peg)。阳离子脂质的实例是:98n12-5、c12-200、dlin-kc2-dma(kc2)、dlin-mc3-dma(mc3)、xtc、md1和7c1。中性脂质的实例是:dpsc、dppc、popc、dope和sm。peg修饰的脂质的实例是:peg-dmg、peg-cerc14和peg-cerc20。脂质可以以任何数量的摩尔比组合以产生lnp。此外,一种或多种多核苷酸可以以宽范围的摩尔比与一种或多种脂质组合以产生lnp。如前所述,定点多肽和基因组靶向核酸可以各自单独地施用到细胞或患者。另一方面,定点多肽可以与一种或多种导向rna,或一种或多种crrna以及tracrrna预复合。然后可以将预复合的材料施用到细胞或患者。此类预复合材料被称为核糖核蛋白粒子(rnp)。rna能够与rna或dna形成特异性相互作用。虽然该特性在许多生物过程中被利用,但它也具有在富含核酸的细胞环境中混杂相互作用的风险。该问题的一个解决方案是形成核糖核蛋白粒子(rnp),其中rna与内切核酸酶预复合。rnp的另一益处是保护rna免于降解。rnp中的内切核酸酶可以被修饰或未修饰。同样,grna、crrna、tracrrna或sgrna可以被修饰或未修饰。许多修饰在本领域中是已知的并且可以使用。内切核酸酶和sgrna通常可以以1:1的摩尔比组合。或者,内切核酸酶、crrna和tracrrna通常可以以1:1:1的摩尔比组合。然而,可以使用宽范围的摩尔比来产生rnp。重组腺相关病毒(aav)载体可以用于递送。产生raav粒子的技术是本领域的标准,其中将包含待递送的多核苷酸、rep和cap基因以及辅助病毒功能的待包装的aav基因组提供到细胞中。raav的产生通常需要以下组分存在于单个细胞内(在本文中表示为包装细胞):raav基因组、与raav基因组分开(即,不在raav基因组中)的aavrep和cap基因以及辅助病毒功能。aavrep和cap基因可以来自可以得到重组病毒的任何aav血清型,并且可以来自不同于raav基因组itr的aav血清型,包括但不限于aav血清型aav-1、aav-2、aav-3、aav-4、aav-5、aav-6、aav-7、aav-8、aav-9、aav-10、aav-11、aav-12、aav-13和aavrh.74。假型raav的产生在例如国际专利申请公告wo01/83692中公开。参见表2。表2aav血清型genbank登记号aav-1nc_002077.1aav-2nc_001401.2aav-3nc_001729.1aav-3baf028705.1aav-4nc_001829.1aav-5nc_006152.1aav-6af028704.1aav-7nc_006260.1aav-8nc_006261.1aav-9ax753250.1aav-10ay631965.1aav-11ay631966.1aav-12dq813647.1aav-13eu285562.1一种产生包装细胞的方法包括产生稳定表达aav粒子产生的所有必需组分的细胞系。例如,包含缺乏aavrep和cap基因的raav基因组、与raav基因组分开的aavrep和cap基因以及可选择的标志物如新霉素抗性基因的质粒(或多个质粒)整合到细胞的基因组中。已经通过诸如以下的程序将aav基因组引入细菌质粒中:gc拖尾(samulski等人,1982,proc.natl.acad.s6.usa,79:2077-2081)、添加含有限制性内切核酸酶裂解位点的合成接头(laughlin等人,1983,gene,23:65-73)或通过直接钝端连接(senapathy和carter,1984,j.biol.chem.,259:4661-4666)。然后可以用辅助病毒如腺病毒感染包装细胞系。该方法的优点是细胞是可选择的并且适合大规模产生raav。合适方法的其他实例采用腺病毒或杆状病毒而不是质粒将raav基因组和/或rep和cap基因引入包装细胞中。raav产生的一般原理在例如carter,1992,currentopinionsinbiotechnology,1533-539;和muzyczka,1992,curr.topicsinmicrobial.andimmunol.,158:97-129)中评论。各种方法描述在ratschin等人,mol.cell.biol.4:2072(1984);hermonat等人,proc.natl.acad.sci.usa,81:6466(1984);tratschin等人,mo1.cell.biol.5:3251(1985);mclaughlin等人,j.virol.,62:1963(1988);和lebkowski等人,1988mol.cell.biol.,7:349(1988).samulski等人(1989,j.virol.,63:3822-3828);美国专利5,173,414;wo95/13365和响应的美国专利5,658.776;wo95/13392;wo96/17947;pct/us98/18600;wo97/09441(pct/us96/14423);wo97/08298(pct/us96/13872);wo97/21825(pct/us96/20777);wo97/06243(pct/fr96/01064);wo99/11764;perrin等人,(1995)vaccine13:1244-1250;paul等人,(1993)humangenetherapy4:609-615;clark等人,(1996)genetherapy3:1124-1132;美国专利5,786,211;美国专利5,871,982;和美国专利6,258,595。aav载体血清型可以与靶细胞类型匹配。例如,以下示例性细胞类型可以通过尤其是指定的aav血清型转导。参见表3。表3组织/细胞类型血清型肝aav8、aa3、aa5、aav9骨骼肌aav1、aav7、aav6、aav8、aav9中枢神经系统aav5、aav1、aav4rpeaav5、aav4感光细胞aav5肺aav9心脏aav8胰腺aav8肾aav2、aa8除腺相关病毒载体外,还可以使用其他病毒载体。此类病毒载体包括但不限于慢病毒、甲病毒、肠病毒、瘟病毒、杆状病毒、疱疹病毒、爱泼斯坦巴尔病毒、乳多空病毒、痘病毒、痘苗病毒和单纯疱疹病毒。在一些情况下,cas9mrna、靶向bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近的一个或两个基因座的sgrna和供体dna可以各自单独地配制到脂质纳米粒子中,或者全部共同配制到一种脂质纳米粒子中。在一些情况下,cas9mrna可以配制在脂质纳米粒子中,而sgrna和供体dna可以在aav载体中递送。可以选择将cas9核酸酶作为dna质粒、mrna或蛋白质递送。导向rna可以从相同的dna表达,或者也可以作为rna递送。可以对rna进行化学修饰以改变或改善其半衰期,或降低免疫应答的可能性或程度。内切核酸酶蛋白可以在递送前与grna复合。病毒载体允许高效递送;分裂型式的cas9和cas9的较小直向同源物可以包装在aav中,正如供体可以用于hdr。还存在可以递送这些组分中的每一种的一系列的非病毒递送方法,或者可以串联采用非病毒方法和病毒方法。例如,纳米粒子可以用于递送蛋白质和导向rna,而aav可以用于递送供体dna。遗传修饰的细胞术语“遗传修饰的细胞”是指包含通过基因组编辑(例如,使用crispr/cas9/cpf1系统)引入的至少一种遗传修饰的细胞。在本文的一些离体实施例中,遗传修饰的细胞可以是遗传修饰的祖细胞。在本文的一些体内实施例中,遗传修饰的细胞可以是遗传修饰的造血祖细胞。本文预期包含外源基因组靶向核酸和/或编码基因组靶向核酸的外源核酸的遗传修饰的细胞。术语“对照物处理的群体”描述已经用相同培养基、病毒诱导、核酸序列、温度、汇合度、烧瓶大小、ph等处理的细胞群体,除了添加基因组编辑组分之外。可以使用本领域已知的任何方法来测量bcl11a基因的转录控制序列或蛋白质表达或活性的调节或灭活,例如bcl11a基因蛋白的转录控制序列的蛋白质印迹分析或bcl11a基因mrna的转录控制序列的定量。术语“分离的细胞”是指从最初发现它的生物体中除去的细胞,或这种细胞的后代。任选地,细胞可以在体外培养,例如在限定条件下或在其他细胞存在下培养。任选地,可以将细胞随后引入第二生物体中或重新引入从中分离出细胞(或其后代细胞)的生物体中。关于分离的细胞群体的术语“分离的群体”是指已经从混合或异质细胞群体中除去和分离的细胞群体。在一些情况下,与分离或富集细胞的异质群体相比,分离的群体可以是基本上纯的细胞群体。在一些情况下,与包含人祖细胞和得到人祖细胞的细胞的异质细胞群体相比,分离的群体可以是人祖细胞的分离群体,例如,基本上纯的人祖细胞群体。关于特定细胞群体,术语“明显增强”是指其中特定类型细胞的发生率相对于预先存在或参考水平增加至少2-倍、至少3-倍、至少4-倍、至少5-倍、至少6-倍、至少7-倍、至少8-倍、至少9倍、至少10-倍、至少20-倍、至少50-倍、至少100-倍、至少400-倍、至少1000-倍、至少5000-倍、至少20000-倍、至少100000-倍或更多倍的细胞群体,这取决于例如用于减轻血红蛋白病的此类细胞的所需水平。关于特定细胞群体的术语“明显富集”是指相对于构成总细胞群体的细胞而言至少约10%、约20%、约30%、约40%、约50%、约60%、约70%或更多的细胞群体。关于特定细胞群体的术语“基本上纯的”是指相对于构成总细胞群体的细胞而言至少约75%、至少约85%、至少约90%或至少约95%纯的细胞群体。也就是说,关于祖细胞群体的术语“基本上纯的”或“基本上纯化的”是指含有少于约20%、约15%、约10%、约9%、约8%、约7%、约6%、约5%、约4%、约3%、约2%、约1%或小于1%的细胞不是由本文的术语定义的祖细胞的细胞群体。将基因组编辑的ipsc分化成造血祖细胞本公开的离体方法的另一步骤可以包括将基因组编辑的ipsc分化成造血祖细胞。分化步骤可以根据本领域已知的任何方法执行。将基因组编辑的间充质干细胞分化成造血祖细胞本公开的离体方法的另一步骤可以包括将基因组编辑的间充质干细胞分化成造血祖细胞。分化步骤可以根据本领域已知的任何方法执行。将细胞植入患者体内本公开的离体方法的另一步骤可以包括将细胞植入患者体内。该植入步骤可以使用本领域已知的任何植入方法完成。例如,遗传修饰的细胞可以直接注射到患者的血液中或以其他方式施用到患者。遗传修饰的细胞可以使用选择的标志物离体纯化。药学上可接受的载剂本文预期的向受试者施用祖细胞的离体方法可以包括使用包含祖细胞的治疗组合物。治疗组合物可以含有生理学上可耐受的载剂以及细胞组合物以及任选地作为活性成分溶解或分散在其中的至少一种如本文所述的其他生物活性剂。在一些情况下,除非如此需要,否则当出于治疗目的施用到哺乳动物或人患者时,治疗组合物基本上不具有免疫原性。通常,本文所述的祖细胞可以作为具有药学上可接受的载剂的悬浮液施用。本领域的技术人员将认识到,用于细胞组合物中的药学上可接受的载剂将不包括缓冲剂、化合物、冷冻保存剂、防腐剂或其他试剂,其量明显干扰待递送到受试者的细胞的活力。包含细胞的制剂可以包括例如容许维持细胞膜完整性的渗透缓冲液,和任选的营养物质,以在施用时维持细胞活力或增强移植。此类制剂和混悬剂是本领域技术人员已知的和/或如本文所述,使用常规实验,可以适合与祖细胞一起使用。细胞组合物也可以乳化或作为脂质体组合物存在,条件是乳化程序不会不利地影响细胞活力。细胞和任何其他活性成分可以与药学上可接受并且与活性成分相容并且以适合用于本文所述的治疗方法的量的赋形剂混合。包含在细胞组合物中的其他试剂可以包括其中组分的药学上可接受的盐。药学上可接受的盐包括与如盐酸或磷酸的无机酸或有机酸如乙酸、酒石酸、扁桃酸等形成的酸加成盐(与多肽的游离氨基基团形成)。用游离羧基基团形成的盐也可以衍生自无机碱,诸如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁,和有机碱,诸如异丙胺、三甲胺、2-乙基氨基乙醇、组氨酸、普鲁卡因等等。生理上可耐受的载剂是本领域公知的。示例性液体载剂是无菌水溶液,其不含除活性成分和水外的任何物质,或含有缓冲剂,诸如生理ph值下的磷酸钠、生理盐水或两者,诸如磷酸盐缓冲的盐水。另外,水性载体可以含有一种以上的缓冲盐,以及盐如氯化钠和氯化钾、右旋糖、聚乙二醇和其他溶质。除了水之外并且排除水,液体组合物还可以含有液相。这些额外的液相的实例是甘油、植物油如棉籽油和水-油乳液。在细胞组合物中使用的有效治疗特定病症或病况的活性化合物的量可以取决于该病症或病况的性质,并且可以通过标准临床技术确定。施用和功效术语“施用”、“引入”和“移植”在通过导致引入的细胞在所需位点如受伤或修复位点至少部分定位从而产生所需效果的方法或途径将细胞如祖细胞置于受试者中的情况下可互换使用。细胞如祖细胞或其分化的后代可以通过导致递送到受试者中的所需位置的任何合适的途径施用,在该位置处至少一部分的植入细胞或细胞组分保持存活。施用到受试者后细胞活力的时间可以短至几小时,例如二十四小时、几天、长达几年或甚至受试者的生命时间,即,长期移植。例如,在本文所述的一些方面,通过全身施用途径如腹膜内或静脉内途径施用有效量的肌原性祖细胞。术语“个体”、“受试者”、“宿主”和“患者”在本文中可互换使用,并且是指需要诊断、治疗或疗法的任何受试者。在一些方面,受试者是哺乳动物。在一些方面,受试者是人。当预防性地提供时,本文所述的祖细胞可以在血红蛋白病的任何症状之前,例如在发展疲劳,呼吸短促,黄疸,青春期后期生长缓慢,关节、骨和胸痛,脾脏和肝脏肿大之前施用到受试者。因此,预防性施用造血祖细胞群体用于预防血红蛋白病,诸如b-地中海贫血或镰状细胞病。当在治疗上提供时,在血红蛋白病的症状或适应症发作时(或之后),例如在疾病发作时,提供造血祖细胞。根据本文所述的方法施用的造血祖细胞群体可以包含从一个或多个供体获得的同种异体造血祖细胞。“同种异体的”是指造血祖细胞或包含从相同物种的一个或多个不同供体获得的造血祖细胞的生物样品,其中在一个或多个基因座处的基因不相同。例如,向受试者施用的造血祖细胞群体可以来源于一个或多个不相关的供体受试者,或来源于一个或多个不相同的同胞。在一些情况下,可以使用同基因造血祖细胞群体,诸如从遗传上相同的动物或从同卵双胞胎获得的那些。造血祖细胞可以是自体同源细胞;即,造血祖细胞从受试者获得或分离并施用到同一受试者,即供体和受体是相同的。术语“有效量”是指预防或减轻血红蛋白病的至少一种或多种征象或症状所需的祖细胞群体或其后代的量,并且涉及足以提供所需效果,例如治疗患有血红蛋白病的受试者的量的组合物。因此,术语“治疗有效量”是指当施用到典型受试者如具有或处于血红蛋白病的风险之中的受试者时足以促进特定效果的祖细胞或包含祖细胞的组合物的量。有效量还将包括足以预防或延迟疾病症状发展,改变疾病症状的过程(例如,但不限于减缓疾病症状的进展)或逆转疾病症状的量。应当理解,对于任何给定的情况,本领域普通技术人员使用常规实验可以确定适当的“有效量”。为了在本文所述的各个方面中使用,有效量的祖细胞包含至少102个祖细胞、至少5×102个祖细胞、至少103个祖细胞、至少5×103个祖细胞、至少104个祖细胞、至少5×104个祖细胞、至少105个祖细胞、至少2×105个祖细胞、至少3×105个祖细胞、至少4×105个祖细胞、至少5×105个祖细胞、至少6×105个祖细胞、至少7×105个祖细胞、至少8×105个祖细胞、至少9×105个祖细胞、至少1×106个祖细胞、至少2×106个祖细胞、至少3×106个祖细胞、至少4×106个祖细胞、至少5×106个祖细胞、至少6×106个祖细胞、至少7×106个祖细胞、至少8×106个祖细胞、至少9×106个祖细胞或其倍数。祖细胞可以来源于一个或多个供体,或者可以从自体同源的来源获得。在本文所述的一些实施例中,祖细胞可以在施用到需要其的受试者之前在培养物中扩增。“施用的”是指通过导致细胞组合物在所需位点处至少部分地定位的方法或途径将祖细胞组合物递送到受试者体内。细胞组合物可以通过任何适当的途径施用,该途径导致受试者中的有效治疗,即施用导致递送至受试者中的所需位置,其中经一定的时间将该组合物的至少一部分,即至少1×104个细胞递送到所需位点。施用模式包括注射、输注、滴注或摄取。“注射”包括而不限于静脉内、肌肉内、动脉内、鞘内、心室内、囊内、眶内、心内、皮内、腹膜内、气管内、皮下、表皮下、关节内、被膜下、蛛网膜下腔、脊柱内、脑内脊柱和胸骨内注射和输注。在一些实施例中,途径是静脉内。对于细胞的递送,施用可以通过注射或输注进行。细胞可以全身施用。短语“全身施用”、“全身地施用”、“外周施用”和“外周地施用”是指除直接施用到靶位点、组织或器官外祖细胞群体的施用,因此其代替地进入受试者的循环系统且因此经受新陈代谢和其他类似的过程。包括用于治疗血红蛋白病的组合物的治疗的功效可以由熟练的临床医生确定。然而,如果功能性bcl11a和功能性hbf的水平(仅作为一个实例)的任何一个或所有征象或症状以有益的方式改变(例如,bcl11a降低至少10%和/或hbf增加至少10%)或疾病的其他临床上接受的症状或标志物得到改善或减轻,则认为治疗是“有效治疗”。功效也可以通过如通过住院或需要医学干预(例如,疾病的进展停止或至少减缓)所评估个体失败以至恶化来测量。测量这些指示物的方法是本领域技术人员已知的和/或本文所述的。治疗包括对个体或动物的疾病的任何治疗(一些非限制性实例包括人或哺乳动物),并且包括:(1)抑制疾病,例如阻止或减缓症状的进展;或(2)缓解疾病,例如引起症状消退;(3)预防或降低症状发生的可能性。根据本公开的治疗可以通过减少功能性bcl11a的量和/或增加个体中功能性hbf的量来减轻与血红蛋白病相关的一种或多种症状。通常与血红蛋白病相关的早期征象包括例如疲劳,呼吸短促,黄疸,青春期后期生长缓慢,关节、骨和胸痛,脾和肝脏肿大。试剂盒本公开提供用于实施本文所述方法的试剂盒。试剂盒可以包含基因组靶向核酸、编码基因组靶向核酸的多核苷酸、定点多肽、编码定点多肽的多核苷酸和/或需要实施本文所述方法的方面或其任何组合的任何核酸或蛋白质分子中的一种或多种。试剂盒可以包含:(1)载体,其包含编码基因组靶向核酸的核苷酸序列,(2)定点多肽或包含编码定点多肽的核苷酸序列的载体,和(3)用于重构和/或稀释一种或多种载体和或多肽的试剂。试剂盒可以包含:(1)载体,其包含(i)编码基因组靶向核酸的核苷酸序列,和(ii)编码定点多肽的核苷酸序列;和(2)用于重构和/或稀释载体的试剂。在任何上述试剂盒中,试剂盒可以包含单分子导向基因组靶向核酸。在任何上述试剂盒中,试剂盒可以包含双分子基因组靶向核酸。在任何上述试剂盒中,试剂盒可以包含两种或更多种双分子导向或单分子导向。试剂盒可以包含编码靶向核酸的核酸的载体。在任何上述试剂盒中,试剂盒可以进一步包含待插入以实现所需遗传修饰的多核苷酸。试剂盒的组分可以在单独的容器中,或组合在单个容器中。任何上述试剂盒都可以进一步包含一种或多种其他试剂,其中此类其他试剂选自缓冲液、用于将多肽或多核苷酸引入细胞中的缓冲液、洗涤缓冲液、对照试剂、对照载体、对照rna多核苷酸、用于由dna体外产生多肽的试剂、用于测序的衔接子等等。缓冲液可以是稳定缓冲液、重构缓冲液、稀释缓冲液等等。试剂盒还可以包含一种或多种组分,其可以用于促进或增强内切核酸酶实现的dna的靶上结合或裂解或改善靶向的特异性。除了上述组分之外,试剂盒还可以包含使用试剂盒的组分来实施这些方法的说明书。可以将用于实践这些方法的说明书记录在合适的记录媒体上。例如,说明书可以印刷在基材如纸或塑料等上。说明书可以作为包装说明书存在于试剂盒中,存在于试剂盒或其组件的容器的标签中(即,与包装或子包装相关)等。说明书可以作为存在于合适的计算机可读存储媒体如cd-rom、软盘、闪存驱动器等上的电子存储数据文件存在。在一些情况下,试剂盒中不存在实际说明书,但是可以提供用于从远程源(例如,通过因特网)获得说明书的手段。这种情况的一个实例是一种包括网址的试剂盒,在该网址中可以查看说明书和/或可以从中下载说明书。与说明书一样,这种用于获得说明书的手段可以记录在合适的基材上。导向rna制剂本公开的导向rna可以与药学上可接受的赋形剂如载剂、溶剂、稳定剂、佐剂、稀释剂等一起配制,这取决于特定的施用模式和剂型。可以配制导向rna组合物以实现生理学上相容的ph,并且取决于制剂和施用途径,ph范围为ph约3至ph约11,ph约3至ph约7。在一些情况下,可以将ph调节至ph约5.0至ph约8的范围。在一些情况下,组合物可以包含治疗有效量的至少一种如本文所述的化合物以及一种或多种药学上可接受的赋形剂。任选地,组合物可以包含本文所述化合物的组合,或者可以包含可用于治疗或预防细菌生长的第二活性成分(例如而不限于抗细菌或抗微生物剂),或者可以包括本公开的试剂的组合。合适的赋形剂包括例如载剂分子,其包括大的缓慢代谢的大分子,诸如蛋白质、多糖、聚乳酸、聚乙醇酸、聚合氨基酸、氨基酸共聚物和无活性的病毒粒子。其他示例性赋形剂可以包括抗氧化剂(例如而不限于抗坏血酸)、螯合剂(例如而不限于edta)、碳水化合物(例如而不限于糊精、羟烷基纤维素和羟烷基甲基纤维素)、硬脂酸、液体(例如而不限于油、水、盐水、甘油和乙醇)、润湿剂或乳化剂、ph缓冲物质等等。其他可能的治疗方法可以使用工程化以靶向特定序列的核酸酶进行基因编辑。迄今为止,有四种主要类型的核酸酶:大范围核酸酶及其衍生物、锌指核酸酶(zfn)、转录激活因子如效应子核酸酶(talen)和crispr-cas9核酸酶系统。核酸酶平台的设计难度、靶向密度和作用模式各不相同,特别是因为zfn和talen的特异性是通过蛋白质-dna相互作用实现,而rna-dna相互作用主要导向cas9。cas9裂解还需要相邻的基序pam,其在不同crispr系统之间不同。来自化脓链球菌的cas9使用nggpam裂解,来自脑膜炎奈瑟球菌的crispr可以在具有包括nnnngatt、nnnnngttt和nnnngctt的pam的位点处裂解。许多其他cas9直系同源物靶向与替代pam相邻的前间隔区序列。crispr内切核酸酶如cas9可以用于本公开的方法中。然而,本文所述的教导如治疗靶位点可以应用于其他形式的内切核酸酶,诸如zfn、talen、he或megatal,或使用核酸酶的组合。然而,为了将本公开的教导应用于此类内切核酸酶,除其他方面外,人们将需要针对特定靶位点使蛋白质工程化。可以将其他结合结构域与cas9蛋白融合以增加特异性。这些构建体的靶位点将映射到鉴定的grna指定位点,但是将需要其他结合基序,诸如对于锌指结构域而言。在mega-tal的情况下,大范围核酸酶可以与taledna结合结构域融合。大范围核酸酶结构域可以增加特异性并提供裂解。相似地,灭活或死亡的cas9(dcas9)可以与裂解结构域融合,并且对于融合的dna结合结构域需要sgrna/cas9靶位点和相邻结合位点。除了催化灭活之外,这可能需要dcas9的一些蛋白质工程化以减少在没有其他结合位点的情况下的结合。锌指核酸酶锌指核酸酶(zfn)是模块化蛋白质,其由与ii型内切核酸酶foki的催化结构域连接的工程化锌指dna结合结构域构成。因为foki仅作为二聚体起作用,所以必须将一对zfn工程化以结合在对向dna链上的同源靶“半位点”序列并且它们之间的精确间隔使得能够形成催化活性的foki二聚体。在foki结构域二聚化时,其本身没有序列特异性,在zfn半位点之间产生dna双链断裂作为基因组编辑中的起始步骤。每个zfn的dna结合结构域通常由丰富的cys2-his2构造的3-6个锌指构成,每个指状物主要识别靶dna序列的一条链上的三重核苷酸,尽管与第四核苷酸的交叉链相互作用也很重要。在与dna发生关键接触的位置改变指状物的氨基酸会改变给定指状物的序列特异性。因此,四指锌指蛋白将选择性地识别12bp靶序列,其中靶序列是由每个指状物贡献的三重体优选性的组合,尽管三重体优选性可以被相邻指状物不同程度地影响。zfn的一个重要方面是,只需通过修饰单个指状物就可以很容易地将它们重新靶向到几乎任何基因组地址,尽管需要相当多的专业知识才能做到这一点。在zfn的大多数应用中,使用4-6个指状物的蛋白质,分别识别12bp至18bp。因此,一对zfn通常将识别24bp至36bp的组合靶序列,不包括半位点之间的典型5bp至7bp间隔区序列。结合位点可以用包括15bp至17bp的更大间隔区序列进一步间隔。假设在设计过程期间排除重复序列或基因同源物,则该长度的靶序列可能在人基因组中是独特的。然而,zfn蛋白-dna相互作用的特异性不是绝对的,因此脱靶结合和裂解事件确实作为两个zfn之间的异二聚体或作为zfn中的一个或另一个的同型二聚体而发生。后一种可能性已经通过工程化foki结构域的二聚化界面以产生“加”和“减”变体(也称为专性异二聚体变体)而有效地消除,所述变体只能彼此二聚化,而不能与它们自身二聚化。强制专性异二聚体阻止同型二聚体的形成。这极大地增强了zfn以及采用这些foki变体的任何其他核酸酶的特异性。在本领域中已经描述了各种基于zfn的系统,定期报告其修饰,并且许多参考文献描述了用于导向zfn设计的规则和参数;参见,例如segal等人,procnatlacadsciusa96(6):2758-63(1999);dreierb等人,jmolbiol.303(4):489-502(2000);liuq等人,jbiolchem.277(6):3850-6(2002);dreier等人,jbiolchem280(42):35588-97(2005);和dreier等人,jbiolchem.276(31):29466-78(2001)。转录激活因子样效应子核酸酶(talen)talen代表另一格式的模块化核酸酶,其与zfn一样,工程化dna结合结构域与foki核酸酶结构域连接,并且一对talen串联操作以实现靶向dna裂解。与zfn的主要区别在于dna结合结构域的性质和相关靶dna序列识别特性。talendna结合结构域源自tale蛋白,其最初描述于植物细菌病原体黄单胞菌属(xanthomonassp.)中。tale由33-35个氨基酸重复序列的串联阵列构成,每个重复序列识别靶dna序列中的单个碱基对,其长度通常长达20bp,总靶序列长度高达40bp。每个重复序列的核苷酸特异性由重复序列变量二残基(rvd)确定,其在12和13位仅包括两个氨基酸。碱基鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶主要被四种rvd识别:分别为asn-asn、asn-ile、his-asp和asn-gly。这构成了比锌指更简单的识别代码,因此代表了在核酸酶设计方面优于后者的优点。然而,与zfn一样,talen的蛋白质-dna相互作用在其特异性方面不是绝对的,并且talen也受益于使用foki结构域的专性异二聚体变体来降低脱靶活性。已经产生了foki结构域的其他变体,其在催化功能方面灭活。如果talen或zfn对的一半含有无活性的foki结构域,则仅在靶位点而不是dsb处发生单链dna裂解(切口)。结果与使用crispr/cas9/cpf1“切口酶”突变体相当,其中cas9裂解结构域之一已经灭活。dna缺口可以用于通过hdr驱动基因组编辑,但效率低于dsb。与dsb不同,主要的益处是可以快速且准确地修复脱靶缺口,而dsb趋于nhej介导的错修复。在本领域中已经描述了各种基于talen的系统,并且定期报告其修饰;参见,例如,boch,science326(5959):1509-12(2009);mak等人,science335(6069):716-9(2012);和moscou等人,science326(5959):1501(2009)。基于“金门(goldengate)”平台或克隆方案的talen的使用已由多个集团描述;参见,例如,cermak等人,nucleicacidsres.39(12):e82(2011);li等人,nucleicacidsres.39(14):6315-25(2011);weber等人,plosone.6(2):e16765(2011);wang等人,jgenetgenomics41(6):339-47,增刊2014,2014年5月17日;和cermakt等人,methodsmolbiol.1239:133-59(2015)。归巢内切核酸酶归巢内切核酸酶(he)是序列特异性内切核酸酶,其具有长识别序列(14-44个碱基对)并且以高特异性裂解dna-通常在基因组中独特的位点处。如根据其结构分类,至少有六个已知的he家族,包括衍生自广泛宿主的laglidadg(seqidno.71,949)、giy-yig、his-cis盒、h-n-h、pd-(d/e)xk和vsr样,这些宿主包括真核生物、原生生物、细菌、古细菌、蓝细菌和噬菌体。与zfn和talen一样,he可以用于在靶基因座处产生dsb,作为基因组编辑的初始步骤。此外,一些天然和工程化的he仅切割dna的单个链,从而起到位点特异性切口酶的作用。he的大靶序列及其提供的特异性使它们成为产生位点特异性dsb的有吸引力的候选者。在本领域中已经描述了各种基于he的系统,并且定期报告其修饰;参见,例如,以下评论:steentoft等人,glycobiology24(8):663-80(2014);belfort和bonocora,methodsmolbiol.1123:1-26(2014);hafez和hausner,genome55(8):553-69(2012);和其中引用的参考文献。megatal/tev-mtalen/megatev作为杂交核酸酶的进一步实例,megatal平台和tev-mtalen平台使用taledna结合结构域和催化活性he的融合,利用tale的可调谐dna结合和特异性以及he的裂解序列特异性;参见,例如,boissel等人,nar42:2591-2601(2014);kleinstiver等人,g34:1155-65(2014);和boissel和scharenberg,methodsmol.biol.1239:171-96(2015)。在另一变型中,megatev结构是大范围核酸酶(mega)与源自giy-yig归巢内切核酸酶i-tevi(tev)的核酸酶结构域的融合。两个活性位点在dna底物上相距约30bp,并且产生两个具有不相容粘性末端的dsb;参见,例如,wolfs等人,nar42,8816-29(2014)。预期现有的基于核酸酶的方法的其他组合将发展并且可用于实现本文所述的靶向基因组修饰。dcas9-foki或dcpf1-fok1和其他核酸酶组合上述核酸酶平台的结构特性和功能特性提供基因组编辑的另一方法,其可以潜在地克服一些固有的缺陷。例如,crispr基因组编辑系统通常使用单个cas9内切核酸酶来产生dsb。靶向的特异性由导向rna中的20或24个核苷酸序列驱动,该序列经历与靶dna的watson-crick碱基配对(在来自化脓链球菌的cas9的情况下,在相邻nag或nggpam序列中加上另外2个碱基)。这样的序列足够长,在人基因组中是独特的,然而,rna/dna相互作用的特异性不是绝对的,有时耐受显著的杂乱性,特别是在靶序列的5'半部分,这有效地降低驱动特异性的碱基数量。对此的一个解决方案是使cas9或cpf1催化功能完全灭活-仅保留rna导向dna结合功能-而是将foki结构域与灭活的cas9融合;参见,例如,tsai等,naturebiotech32:569-76(2014);和guilinger等人,naturebiotech.32:577-82(2014)。因为foki必须二聚化以具有催化活性,所以需要两个导向rna以将两个foki融合体紧密靠近地系链以形成二聚体并裂解dna。这基本上使组合靶位点中的碱基数量加倍,从而增加由基于crispr的系统靶向的严格性。作为进一步的实例,taledna结合结构域与催化活性he如i-tevi的融合利用tale的可调谐dna结合和特异性以及i-tevi的裂解序列特异性,期望可以进一步降低脱靶裂解。通过测序检测靶上突变和脱靶突变为了测序靶上位点和推定脱靶位点,识别适当的扩增引物,并使用用quickextractdna提取溶液(epicentre)在转染后三天从处理的细胞收获的基因组dna用这些引物建立反应。扩增引物含有侧接衔接子的基因特异性部分。正向引物的5'末端包含修饰的正向(读序1)引物结合位点。反向引物的5'末端含有相反取向的组合修饰的反向(读序2)和条形码引物结合位点。单个pcr反应通过在琼脂糖凝胶上分离验证,然后纯化并重新扩增。第二轮正向引物含有illuminap5序列,接着是一定比例的修饰的正向(读序1)引物结合位点。第二轮反向引物含有illuminap7序列(在5'末端),然后是6-碱基条形码和组合的修饰的反向(读序2)和条形码引物结合位点。第二轮扩增还在琼脂糖凝胶上检查,然后纯化,并使用nanodrop分光光度计定量。将扩增产物汇集以匹配浓度,然后提交至emoryintegratedgenomic核心,用于在illuminamiseq机上进行文库预备和测序。测序读数通过条形码分类,然后将其与由生物信息学对于每种产物提供的参考序列比对。使用先前描述的软件在推定的切割位点的区域中检测比对的测序读数中的插入和缺失率;参见,例如,lin等人,nucleicacidsres.,42:7473-7485(2014)。然后将在该窗口中检测到的插入和缺失水平与从模拟转染细胞中分离的基因组dna中相同位置中观察到的水平进行比较,以最小化测序假象的影响。突变检测分析使用由nhej对双链断裂的不完全修复产生的突变率来测量cas9和导向rna组合的靶上和脱靶裂解活性。按照制造商的说明,使用accuprimetaqdna聚合酶高保真(lifetechnologies,carlsbad,ca)对于在含有1μl细胞裂解物和1μl的每种10μm扩增引物的50μl反应物中的40个循环(94℃,30秒;52-60℃,30秒;68℃,60秒)扩增靶上基因座。根据制造商的方案执行t7ei突变检测测定[reyon等人,nat.biotechnol.,30:460-465(2012)],其中消化物在2%琼脂糖凝胶上分离,并使用imagej定量[guschin等人,methodsmol.biol.,649:247-256(2010)]。这些测定确定了批量细胞群体中插入/缺失(“插入缺失”)的百分比。本发明的方法和组合物因此,本公开特别涉及以下非限制性发明:在第一方法,方法1中,本公开提供一种通过基因组编辑来编辑人细胞中的bcl11a基因的方法,该方法包括以下步骤:将一种或多种脱氧核糖核酸(dna)内切核酸酶引入人细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。在另一方法,方法2中,本公开提供如方法1中提供的通过基因组编辑来编辑人细胞中的bcl11a基因的方法,其中转录控制序列位于bcl11a基因的第二内含子内。在另一方法,方法3中,本公开提供如方法1或2中提供的通过基因组编辑来编辑人细胞中的bcl11a基因的方法,其中转录控制序列位于bcl11a基因的+58dna超敏位点(dhs)内。在另一方法,方法4中,本文提供一种用于治疗患有血红蛋白病的患者的离体方法,该方法包括以下步骤:产生患者特异性诱导的多能干细胞(ipsc);在ipsc的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;将基因组编辑的ipsc分化成造血祖细胞;以及将该造血祖细胞植入患者体内。在另一方法,方法5中,本公开提供如方法4中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该产生步骤包括从患者体内分离体细胞;和将一组多能性相关基因引入体细胞中以诱导体细胞成为多能干细胞。在另一方法,方法6中,本公开提供如方法5中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该体细胞是成纤维细胞。在另一方法,方法7中,本公开提供如方法5或6中提供的用于治疗患有血红蛋白病的患者的离体方法,其中所述一组多能性相关基因是选自oct4、sox2、klf4、lin28、nanog和cmyc的基因中的一种或多种。在另一方法,方法8中,本公开提供如方法4至7中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中编辑步骤包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入ipsc中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。在另一方法,方法9中,本公开提供如方法4至8中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中分化步骤包括以下步骤中的一个或多个以将基因组编辑的ipsc分化成造血祖细胞:用小分子的组合处理,递送主转录因子,递送编码主转录因子的mrna,或递送编码转录因子的mrna。在另一方法,方法10中,本公开提供如方法4至9中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中植入步骤包括通过移植、局部注射、全身输注或其组合将造血祖细胞植入患者体内。在另一方法,方法11中,本公开提供一种用于治疗患有血红蛋白病的患者的离体方法,该方法包括以下步骤:从患者体内分离间充质干细胞;在间充质干细胞的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;将基因组编辑的间充质干细胞分化成造血祖细胞;以及将该造血祖细胞植入患者体内。在另一方法,方法12中,本公开提供如方法11中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该间充质干细胞自患者的骨髓或外周血中分离。在另一方法,方法13中,本公开提供如方法11或12中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该分离步骤包括:抽出骨髓和使用密度梯度离心介质分离间充质细胞。在另一方法,方法14中,本公开提供如方法11至13中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该编辑步骤包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入间充质干细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。在另一方法,方法15中,本公开提供如方法11至14中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该分化步骤包括以下步骤中的一个或多个以将基因组编辑的间充质干细胞分化成造血祖细胞:用小分子的组合处理,递送主转录因子,递送编码主转录因子的mrna,或递送编码转录因子的mrna。在另一方法,方法16中,本公开提供如方法11至15中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该植入步骤包括通过移植、局部注射、全身输注或其组合将造血祖细胞植入患者体内。在另一方法,方法17中,本公开提供一种用于治疗患有血红蛋白病的患者的离体方法,该方法包括以下步骤:从患者体内分离造血祖细胞;在造血祖细胞的bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近进行编辑;以及将基因组编辑的造血祖细胞植入患者体内。在另一方法,方法18中,本公开提供如方法17中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该方法进一步包括在该分离步骤之前用粒细胞集落刺激因子(gcsf)治疗患者。在另一方法,方法19中,本公开提供如方法18中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该治疗步骤与plerixaflor组合执行。在另一方法,方法20中,本公开提供如方法17至19中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该分离步骤包括分离cd34+细胞。在另一方法,方法21中,本公开提供如方法17至20中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该编辑步骤包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入造血祖细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制序列的永久性缺失、调节或灭活。在另一方法,方法22中,本公开提供如方法17至21中的任一项中提供的用于治疗患有血红蛋白病的患者的离体方法,其中该植入步骤包括通过移植、局部注射、全身输注或其组合将基因组编码的造血祖细胞植入患者体内。在另一方法,方法23中,本公开提供一种用于治疗患有血红蛋白病的患者的体内方法,该方法包括编辑患者的细胞中的bcl11a基因的步骤。在另一方法,方法24中,本公开提供如方法23中提供的用于治疗患有血红蛋白病的患者的体内方法,其中该编辑步骤包括将一种或多种脱氧核糖核酸(dna)内切核酸酶引入该细胞中以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现一处或多处单链断裂(ssb)或双链断裂(dsb),这导致bcl11a基因的转录控制的永久性缺失、调节或灭活。在另一方法,方法25中,本公开提供如方法23或24中提供的用于治疗患有血红蛋白病的患者的体内方法,其中该细胞为骨髓细胞、造血祖细胞或cd34+细胞。在另一方法,方法26中,本公开提供根据方法1、8、14、21和24中任一项的方法,其中该一种或多种dna内切核酸酶为cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas100、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4或cpf1内切核酸酶;其同系物,其天然存在的分子、其密码子优化形式或其修饰形式的重组以及其组合。在另一方法,方法27中,本公开提供如方法26中提供的方法,其中该方法包括将编码该一种或多种dna内切核酸酶的一种或多种多核苷酸引入该细胞中。在另一方法,方法28中,本公开提供如方法26或27中提供的方法,其中该方法包括将编码该一种或多种dna内切核酸酶的一种或多种核糖核酸(rna)引入该细胞中。在另一方法,方法29中,本公开提供如方法27或28中提供的方法,其中该一种或多种多核苷酸或一种或多种rna是一种或多种修饰的多核苷酸或一种或多种修饰的rna。在另一方法,方法30中,本公开提供如方法26中提供的方法,其中该一种或多种dna内切核酸酶是一种或多种蛋白质或多肽。在另一方法,方法31中,本公开提供如方法30中提供的方法,其中该一种或多种蛋白质或多肽在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。在另一方法,方法32中,本公开提供如方法31中提供的方法,其中该一种或多种蛋白质或多肽侧接两个nls,一个nls位于n-末端,且第二个nls位于c-末端。在另一方法,方法33中,本公开提供如方法31至32中任一项提供的方法,其中该一个或多个nls是sv40nls。在另一方法,方法34中,本公开提供如方法1至33中任一项提供的方法,其中该方法进一步包括将一种或多种导向核糖核酸(grna)引入该细胞中。在另一方法,方法35中,本公开提供如方法34中提供的方法,其中该一种或多种grna是单分子导向rna(sgrna)。在另一方法,方法36中,本公开提供如方法34或35中提供的方法,其中该一种或多种grna或一种或多种sgrna是一种或多种修饰的grna或一种或多种修饰的sgrna。在另一方法,方法37中,本公开提供如方法36中提供的方法,其中该一种或多种修饰的sgrna在其5'末端和3'末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。在另一方法,方法38中,本公开提供如方法37中提供的方法,其中该修饰的sgrna为seqidno:71,959的核酸序列。在另一方法,方法39中,本公开提供如方法34至38中提供的方法,其中该一种或多种dna内切核酸酶与一种或多种grna或一种或多种sgrna预复合以形成一种或多种核蛋白(rnp)。在另一方法,方法40中,本公开提供如方法39中提供的方法,其中在该rnp中sgrna与dna内切核酸酶的重量比为1:1。在另一方法,方法41中,本公开提供如方法40中提供的方法,其中该sgrna包含seqidno:71,959的核酸序列,该dna内切核酸酶是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,并且sgrna与dna内切核酸酶的重量比为1:1。在另一方法,方法42中,本公开提供如方法1至41中任一项提供的方法,其中该方法进一步包括将包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中。在另一方法,方法43中,本公开提供如方法1、8、14、21或24中任一项提供的方法,其中该方法进一步包括将一种导向核糖核酸(grna)和包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中,并且其中该一种或多种dna内切核酸酶是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近在基因座处实现一处单链断裂(ssb)或双链断裂(dsb),这有助于将来自该多核苷酸供体模板的新序列在该基因座处插入染色体dna中,导致邻近该基因座的染色体dna的转录控制序列的永久性插入、调节或灭活,并且其中该grna包含与该基因座的区段互补的间隔区序列。在另一方法,方法44中,本公开提供如方法43中提供的方法,其中邻近是指核苷酸在该基因座的上游和下游。在另一方法,方法45中,本公开提供如方法1、8、14、21或24中任一项提供的方法,其中该方法进一步包括将一种或多种导向核糖核酸(grna)和包含野生型bcl11a基因或含修饰的转录控制序列的cdna的多核苷酸供体模板引入该细胞中,并且其中该一种或多种dna内切核酸酶是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现或产生一对单链断裂(ssb)或双链断裂(dsb),第一断裂在5’基因座处且第二断裂在3’基因座处,这有助于将来自该多核苷酸供体模板的新序列引入在5’基因座和3’基因座之间的染色体dna中,导致在5’基因座和3’基因座之间的染色体dna的转录控制序列的永久性插入、调节或灭活。在另一方法,方法46中,本公开提供如方法45中提供的方法,其中一个grna产生一对ssb或dsb。在另一方法,方法47中,本公开提供如方法45中提供的方法,其中一个grna包含与5’基因座或3’基因座互补的间隔区序列。在另一方法,方法48中,本公开提供如方法45中提供的方法,其中该方法包括第一导向rna和第二导向rna,其中该第一导向rna包含与5'基因座的区段互补的间隔区序列且该第二导向rna包含与3'基因座的区段互补的间隔区序列。在另一方法,方法49中,本公开提供如方法43至48中任一项提供的方法,其中该一种或两种grna是一种或两种单分子导向rna(sgrna)。在另一方法,方法50中,本公开提供如方法43至49中任一项提供的方法,其中该一种或两种grna或一种或两种sgrna是一种或两种修饰的grna或一种或两种修饰的sgrna。在另一方法,方法51中,本公开提供如方法50中提供的方法,其中该一种修饰的sgrna在其5'末端和3'末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。在另一方法,方法52中,本公开提供如方法51中提供的方法,其中该一种修饰的sgrna为seqidno:71,959的核酸序列。在另一方法,方法53中,本公开提供如方法43至52中任一项提供的方法,其中该一种或多种cas9内切核酸酶与一种或两种grna或一种或两种sgrna预复合以形成一种或多种核蛋白(rnp)。在另一方法,方法54中,本公开提供如方法53中提供的方法,其中该一种或多种cas9内切核酸酶在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。在另一方法,方法55中,本公开提供如方法54中提供的方法,其中该一种或多种cas9内切核酸酶侧接两个nls,一个nls位于n-末端,且第二个nls位于c-末端。在另一方法,方法56中,本公开提供如方法54至55中任一项提供的方法,其中该一个或多个nls是sv40nls。在另一方法,方法57中,本公开提供如方法53中提供的方法,其中在该rnp中sgrna与cas9内切核酸酶的重量比为1:1。在另一方法,方法58中,本公开提供如方法53中提供的方法,其中该一种sgrna包含seqidno:71,959的核酸序列,该cas9内切核酸酶是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,其中sgrna与cas9内切核酸酶的重量比为1:1。在另一方法,方法59中,本公开提供如方法43至58中任一项提供的方法,其中该供体模板是单链的或双链的。在另一方法,方法60中,本公开提供如方法42至59中任一项提供的方法,其中该修饰的转录控制序列位于bcl11a基因的第二内含子内。在另一方法,方法61中,如方法42至59中任一项所提供,其中该修饰的转录控制序列位于bcl11a基因的+58dna超敏位点(dhs)内。在另一方法,方法62中,本公开提供如方法42至61中任一项提供的方法,其中该插入通过同源性定向修复(hdr)进行。在另一方法,方法63中,本公开提供如方法8、14、21、24、43和45中任一项提供的方法,其中ssb、dsb或5'基因座和3'基因座位于bcl11a基因的第二内含子内。在另一方法,方法64中,本公开提供如方法8、14、21、24、43和45中任一项提供的方法,其中ssb、dsb或5'dsb和3'dsb位于bcl11a基因的+58dna超敏位点(dhs)内。在另一方法,方法65中,本公开提供如方法1、8、14、21或24中任一项提供的方法,其中该方法进一步包括将一种或多种导向核糖核酸(grna)引入该细胞中,并且其中该一种或多种dna内切核酸酶是一种或多种cas9或cpf1内切核酸酶,其在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近实现或产生一对单链断裂(ssb)或双链断裂(dsb),第一ssb或dsb在5’基因座处且第二ssb或dsb在3’基因座处,这引起在5’基因座和3’基因座之间的染色体dna的缺失,导致在5’基因座和3’基因座之间的染色体dna的转录控制序列的永久性插入、调节或灭活。在另一方法,方法66中,本公开提供如方法65中提供的方法,其中一个grna产生一对ssb或dsb。在另一方法,方法67中,本公开提供如方法65中提供的方法,其中一个grna包含与5’基因座或3’基因座互补的间隔区序列。在另一方法,方法68中,本公开提供如方法65中提供的方法,其中该方法包括第一导向rna和第二导向rna,其中该第一导向rna包含与5'基因座的区段互补的间隔区序列且该第二导向rna包含与3'基因座的区段互补的间隔区序列。在另一方法,方法69中,本公开提供如方法65至68中提供的方法,其中该一种或多种grna是一种或多种单分子导向rna(sgrna)。在另一方法,方法70中,本公开提供如方法65至69中提供的方法,其中该一种或多种grna或一种或多种sgrna是一种或多种修饰的grna或一种或多种修饰的sgrna。在另一方法,方法71中,本公开提供如方法70中提供的方法,其中该一种修饰的sgrna在其5'末端和3'末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。在另一方法,方法72中,本公开提供如方法71中提供的方法,其中该一种修饰的sgrna为seqidno:71,959的核酸序列。在另一方法,方法73中,本公开提供如方法65至72中提供的方法,其中该一种或多种cas9内切核酸酶与一种或多种grna或一种或多种sgrna预复合以形成一种或多种核蛋白(rnp)。在另一方法,方法74中,本公开提供如方法73中提供的方法,其中该一种或多种cas9内切核酸酶在n-末端、c-末端或n-末端和c-末端两者侧接一个或多个核定位信号(nls)。在另一方法,方法75中,本公开提供如方法74中提供的方法,其中该一种或多种cas9内切核酸酶侧接两个nls,一个nls位于n-末端,且第二个nls位于c-末端。在另一方法,方法76中,本公开提供如方法74至75中任一项提供的方法,其中该一个或多个nls是sv40nls。在另一方法,方法77中,本公开提供如方法73中提供的方法,其中在该rnp中sgrna与cas9内切核酸酶的重量比为1:1。在另一方法,方法78中,本公开提供如方法73中提供的方法,其中该一种sgrna包含seqidno:71,959的核酸序列,该cas9内切核酸酶是包含n-末端sv40nls和c-末端sv40nls的化脓链球菌cas9,其中sgrna与cas9内切核酸酶的重量比为1:1。在另一方法,方法79中,本公开提供如方法65至78中任一项提供的方法,其中5’基因座和3’基因座两者位于bcl11a基因的第二内含子内。在另一方法,方法80中,本公开提供如方法65至78中任一项提供的方法,其中5’基因座和3’基因座两者位于bcl11a基因的+58dna超敏位点(dhs)内。在另一方法,方法81中,本公开提供如方法1、8、14、21或24-80中任一项提供的方法,其中将cas9或cpf1mrna、grna和供体模板各自配制成单独的脂质纳米粒子或全部共配制成脂质纳米粒子。在另一方法,方法82中,本公开提供如方法1、8、14、21或24-80中任一项提供的方法,其中将cas9或cpf1mrna配制成脂质纳米粒子,并且grna和供体模板两者都通过腺相关病毒(aav)载体递送到细胞。在另一方法,方法83中,本公开提供如方法1、8、14、21或24-80中任一项提供的方法,其中将cas9或cpf1mrna配制成脂质纳米粒子,并且grna通过电穿孔递送到细胞且供体模板通过腺相关病毒(aav)载体递送到细胞。在另一方法,方法84中,本公开提供如方法1、8、14、21或24-80中任一项提供的方法,其中该一种或多种rnp通过电穿孔递送到细胞。在另一方法,方法85中,本公开提供如方法1至84中任一项提供的方法,其中该bcl11a基因位于染色体2:60,451,167-60,553,567(基因组参考聚生体-grch38)上。在另一方法,方法86中,本公开提供如方法1至85中任一项提供的方法,其中血红蛋白病选自镰状细胞性贫血和地中海贫血(α、β、δ、γ及其组合)。在另一方法,方法87中,本公开提供如方法1至86中任一项提供的方法,其中在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近编辑可以降低bcl11a基因表达。在第一组合物,组合物1中,本公开提供一种或多种导向核糖核酸(grna),其用于编辑来自患有血红蛋白病的患者的细胞中的bcl11a基因,该一种或多种grna包含选自序列表的seqidno:1-71,947中的核酸序列的间隔区序列。在另一组合物,组合物2中,本公开提供组合物1的一种或多种grna,其中该一种或多种grna是一种或多种单分子导向rna(sgrna)。在另一组合物,组合物3中,本公开提供组合物1或2的一种或多种grna或sgrna,其中该一种或多种grna或一种或多种sgrna是一种或多种修饰的grna或一种或多种修饰的sgrna。在另一组合物,组合物4中,本公开提供组合物3的一种或多种sgrna,其中该一种或多种修饰的sgrna在其5'末端和3'末端中的每一个处或其附近包含三个2'-o-甲基-硫代磷酸酯残基。在另一组合物,组合物5中,本公开提供组合物3的一种或多种sgrna,其中该一种或多种修饰的sgrna包含seqidno:71,959的核酸序列。在另一组合物,组合物6中,本公开提供一种包含seqidno:71,959的核酸序列的单分子导向rna(sgrna)。定义术语“包含(comprising)”或“包含(comprise)”用于指对本发明必需的组合物、方法和其各自的组分,但是敞开式包括未指明的要素,而无论是否是必需的。术语“基本上由......组成”是指给定方面所需的那些要素。该术语容许存在不会实质上影响本发明该方面的基本和新颖或功能特征的其他要素。术语“由......组成”是指如本文所述的组合物、方法和其各自的组分,其不包括在该方面的该描述中未列举的任何要素。除非上下文另外明确指出,否则单数形式“一个(种)”和“该”包括复数个(种)指示物。本说明书中列举的任何数值范围都描述在所述范围内包含的相同数值精度(即,具有相同数量的指定数字)的所有子范围。例如,所述的“1.0至10.0”范围描述在所述最小值1.0和所述最大值10.0之间(并且包括端值)的所有子范围,例如,“2.4至7.6”,即使“2.4至7.6”的范围未在本说明书的文本中明确叙述。因此,申请人保留修改本说明书(包括权利要求书)的权利,以明确地叙述包含在本说明书中明确叙述的范围内的相同数值精度的任何子范围。所有这些范围都在本说明书中固有地描述,使得修改以明确地叙述任何这样的子范围将符合书面描述、描述的充分性和附加的物质要求,包括35u.s.c.§112(a)和第123条(2)epc下的要求。此外,除非上下文明确指出或以其他方式要求,否则本说明书中描述的所有数值参数(诸如表达值、范围、量、百分比等等的那些)可以被读作好像以词“约”为前缀,即使词“约”并没有明确地出现在一个数字之前。另外,本说明书中描述的数值参数应根据报告的有效数字的数量、数值精度且通过应用普通的舍入技术来解释。还应理解,本说明书中描述的数值参数必然具有用于确定参数的数值的基础测量技术的固有可变性特征。实施例通过参考提供本发明的示例性非限制性方面的实施例,将更全面地理解本发明。这些实施例描述使用crispr系统作为说明性基因组编辑技术,以在bcl11a基因或编码bcl11a基因的调控元件的其他dna序列内或其附近产生限定的基因组缺失、插入或置换,称为“基因组修饰”,这产生bcl11a基因的转录控制序列的永久性缺失、调节或灭活。如本文描述并示例,引入限定的治疗性修饰代表用于潜在地减轻血红蛋白病的新型治疗策略。实施例1-bcl11a基因的转录控制序列的crispr/spcas9靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列nrg的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna20bp间隔区序列,如序列表的seqidno:1-29,482中所示。实施例2-bcl11a基因的转录控制序列的crispr/sacas9靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列nngrrt的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna20bp间隔区序列,如序列表的seqidno:29,483-32,387中所示。实施例3-bcl11a基因的转录控制序列的crispr/stcas9靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列nnagaaw的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna20bp间隔区序列,如序列表的seqidno:32,388-33,420中所示。实施例4-bcl11a基因的转录控制序列的crispr/tdcas9靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列naaaac的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna20bp间隔区序列,如序列表的seqidno:33,421-33,851中所示。实施例5-bcl11a基因的转录控制序列的crispr/nmcas9靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列nnnnghtt的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna20bp间隔区序列,如序列表的seqidno:33,852-36,731中所示。实施例6-bcl11a基因的转录控制序列的crispr/cpf1靶位点对于靶位点,扫描bcl11a基因的12.4kb转录控制序列的区域。对于具有序列ytn的前间隔区序列相邻基序(pam),扫描每个区域。识别对应于pam的grna22bp间隔区序列,如序列表的seqidno:36,732-71,947中所示。实施例7-导向链的生物信息学分析候选导向将在多步骤过程中进行筛选和选择,该多步骤过程包括理论结合和实验评估活动。举例来说,可以使用如下文更详细描述并示例的多种可用于评估脱靶结合的生物信息工具中的一种或多种来针对在具有相似序列的脱靶位点处裂解的潜力来评估具有使特定靶上位点如在bcl11a基因的转录控制序列内的位点与邻近pam匹配的序列的候选导向,从而评估在除这些预期的染色体位置之外的染色体位置处作用的可能性。然后可以通过实验评估预测具有相对较低的脱靶活性潜力的候选者,以测量它们的靶向活性,然后在不同位点处的脱靶活性。优选的导向具有足够高的靶上活性以在所选的基因座处实现所需水平的基因编辑,并且具有相对较低的脱靶活性以降低在其他染色体基因座处改变的可能性。靶上活性与脱靶活性的比率通常被称为导向的“特异性”。对于预测的脱靶活性的初步筛选,有许多已知并公开的生物信息学工具可用于预测最可能的脱靶位点;并且由于与crispr/cas9/cpf1核酸酶系统中的靶位点的结合由互补序列之间的watson-crick碱基配对驱动,因此不相似程度(且因此降低的脱靶结合潜力)与一级序列差异基本相关:失配和凸出,即碱基变为非互补碱基,以及相对于靶位点而言在潜在脱靶位点中的碱基的插入或缺失。称为cosmid(具有失配、插入和缺失的crispr脱靶位点)的示例性生物信息学工具(可在网络crispr.bme.gatech.edu上获得)遵从此类相似性。其他生物信息学工具包括但不限于guido、autocosmid和cctop。生物信息学用于最小化脱靶裂解,以降低突变和染色体重排的有害影响。对crispr/cas9系统的研究表明,由于特别是在远离pam区域的位置导向链与具有碱基对失配和/或凸出的dna序列的非特异性杂交,可能存在高脱靶活性。因此,除了碱基对失配之外,重要的是具有可以识别在rna导向链和基因组序列之间具有插入和/或缺失的潜在脱靶位点的生物信息学工具。因此,基于生物信息学的工具cosmid(具有失配、插入和缺失的crispr脱靶位点)用于搜索基因组中潜在的crispr脱靶位点(可在网络crispr.bme.gatech.edu上获得)。cosmid输出基于失配的数量和位置对潜在的脱靶位点进行排序,允许更明智地选择靶位点,并避免使用更可能脱靶裂解的位点。采用其他生物信息学流水线来衡量一个区域中grna靶向位点的估计的靶上活性和/或脱靶活性。可以用于预测活性的其他特征包括关于所讨论的细胞类型、dna可及性、染色质状态、转录因子结合位点、转录因子结合数据和其他chip-seq数据的信息。衡量其他因子以预测编辑效率,诸如grna对的相对位置和方向、局部序列特征和微同源性。实施例8-针对靶上活性测试细胞中的优选导向然后测试据预测具有最低脱靶活性的grna在k562细胞中的靶上活性,并使用tide评价插入缺失频率。tide是一种网络工具,其快速地评估由导向rna(grna或sgrna)确定的靶基因座的crispr-cas9实现的基因组编辑。基于来自两个标准毛细管测序反应的定量序列追踪数据,tide软件量化编辑功效并识别靶向细胞池的dna中的主要插入和缺失类型(插入缺失)。对于详细的解释和实施例,参见brinkman等人,nucl.acidsres.(2014)。一种替代方法是新一代测序(ngs),也称为高通量测序,这是用于描述许多不同现代测序技术的全能术语,这些测序技术包括:illumina(solexa)测序、roche454测序、离子激流:质子/pgm测序和solid测序。这些最新技术使人们能够比先前使用的sanger测序更快速、更便宜地测序dna和rna,因此彻底改革了基因组学和分子生物学的研究。组织培养细胞的转染允许筛选不同的构建体且是测试活性和特异性的有力手段。组织培养细胞系如k562或hek293t易于转染并导致高活性。将评估这些或其他细胞系以确定与cd34+匹配的细胞系并提供最佳替代物。然后这些细胞将用于许多早期阶段的测试。例如,化脓链球菌cas9的各个grna可以使用质粒如图1a-1c中所述的ctx-1、ctx-2或ctx-3转染到细胞中,这些质粒适合在人细胞中表达。或者,也可以使用市售的载体。对于本文所述的bcl11agrna的indelfreq评估,采用市售的cas9表达质粒(geneart,thermofisher)。几天后(该实验的48小时),收获基因组dna并通过pcr扩增靶位点。切割活性通过nhej修复游离dna末端引入的插入、缺失和突变的速率来测量。尽管该方法不能将正确修复的序列与未裂解的dna区分开,但切割水平可以通过错修复的量来衡量。通过扩增识别的推定的脱靶位点并使用相似方法检测裂解,可以观察到脱靶活性。还可以使用侧接切割位点的引物测定易位,以确定是否发生特异性切割和易位。已经开发了未导向的测定法,允许对包括导向序列的脱靶裂解进行补充测试。然后可以在培养的细胞中跟踪具有显著活性的grna或grna对,以测量bcl11a基因的转录控制序列内+58dna超敏位点(dhs)的调节或灭活。可以再次跟踪脱靶事件。相似地,可以转染cd34+细胞,并测量bcl11a基因的转录控制序列内的+58dna超敏位点(dhs)的调节或灭活水平以及可能的脱靶事件。这些实验允许优化核酸酶和供体设计和递送。实施例9-对于脱靶活性测试细胞中的优选导向然后使用全基因组测序对于脱靶活性测试来自上述实施例中tide和下一代测序研究的具有最佳靶上活性的grna。将在cd34+细胞或ipsc中更完全地评价候选grna。实施例10-测试细胞中优选的grna组合将组合测试具有来自tide和下一代测序研究的最佳靶上活性和最低脱靶活性的grna以评价由于使用每种grna组合而导致的缺失的大小。将评价在原代人cd34+细胞中的潜在grna组合。例如,将测试grna组合的缺失bcl11a基因的全部或部分转录控制序列的效率。还将测试grna组合的缺失bcl11a基因的全部或部分+58dna超敏位点(dhs)的效率。实施例11-测试hdr基因编辑的不同方法在针对靶上活性和脱靶活性测试grna后,将对于hdr基因编辑测试调节/灭活和敲入策略。对于调节/灭活方法,供体dna模板将作为短的单链低聚核苷酸、短的双链低聚核苷酸(完整的pam序列/突变的pam序列)、长的单链dna分子(完整的pam序列/突变的pam序列)或长的双链dna分子(完整的pam序列/突变的pam序列)提供。供体dna模板将包含野生型bcl11a基因或含修饰的转录控制序列的cdna或者野生型bcl11a基因或含修饰的(例如,突变的)+58dna超敏位点(dhs)的cdna。此外,供体dna模板将由aav递送。对于cdna敲入方法,单链或双链dna可以包含bcl11a基因的超过40nt的修饰的转录控制序列。单链或双链dna可以包含bcl11a基因的超过80nt的修饰的转录控制序列。单链或双链dna可以包含bcl11a基因的超过100nt的修饰的转录控制序列。单链或双链dna可以包含bcl11a基因的超过150nt的修饰的转录控制序列。单链或双链dna可以包含bcl11a基因的超过300nt的修饰的转录控制序列。单链或双链dna可以包含bcl11a基因的超过400nt的修饰的转录控制序列。或者,dna模板将由aav递送。对于cdna敲入方法,单链或双链dna可以包含bcl11a基因的超过40nt的修饰的+58dna超敏位点(dhs)。单链或双链dna可以包含bcl11a基因的超过80nt的修饰的+58dna超敏位点(dhs)。单链或双链dna可以包含bcl11a基因的超过100nt的修饰的+58dna超敏位点(dhs)。单链或双链dna可以包含bcl11a基因的超过150nt的修饰的+58dna超敏位点(dhs)。单链或双链dna可以包含bcl11a基因的超过300nt的修饰的+58dna超敏位点(dhs)。单链或双链dna可以包含bcl11a基因的超过400nt的修饰的+58dna超敏位点(dhs)。或者,dna模板将由aav递送。实施例12-重新评估引导crispr-cas9/dna供体组合在测试hdr基因编辑的不同策略后,将在原代人细胞中对于缺失、重组和脱靶特异性的效率重新评估前导crispr-cas9/dna供体组合的效率。将cas9mrna或rnp配制成用于递送的脂质纳米粒子,将sgrna配制成纳米粒子或作为aav递送,并将供体dna配制成纳米粒子或作为aav递送。实施例13-相关动物模型中的体内测试在重新评估crispr-cas9/dna供体组合后,将在动物模型中体内测试前导制剂。如上所述,人细胞中的培养允许直接测试人靶标和背景人基因组。通过在nsg或类似小鼠中移植修饰的小鼠或人cd34+细胞,可以观察到临床前功效和安全性评价。在移植后的几个月内可以观察到修饰的细胞。实施例14-用各种grna编辑细胞将来自人供体1-3的运动的人外周血cd34+细胞在具有cd34+扩增补充剂的无血清stemspan培养基中培养两天。使用具有corfularge(clo)grna、corfusmall(cso)grna、hpfh5grna、kenyagrna、sd2sgrna或spy101sgrna的cas9mrna洗涤并电穿孔100,000个细胞。使细胞恢复两天,然后转换到红细胞分化培养基(imdm+glutamax,补充5%人血清,10ug/ml胰岛素、20ng/mlscf、5ng/mlil-3,3u/mlepo,1um地塞米松、1umβ-雌二醇、330ug/ml全转铁蛋白和2u/ml肝素(heraprin))。对于用corfularge(clo)grna电穿孔的细胞、用corfusmall(cso)grna电穿孔的细胞、用hpfh5grna电穿孔的细胞、用kenyagrna电穿孔的细胞、用sd2sgrna电穿孔的细胞和用spy101sgrna电穿孔的细胞中的每一种测定插入/缺失百分比(“插入缺失”)(图3),如本文所述的“通过序列进行的靶上和脱靶突变检测”和“突变检测测定”部分中所述。在红细胞分化培养基中将这些细胞分化12天后,收集rna以通过定量实时pcr评估血红蛋白水平(图4a-4c)。一天后使用流式细胞术产生单个红细胞祖细胞,并在红细胞分化培养基中培养以扩增并作为集落生长。将每个集落分开并在分选后12天收集用于分析dna和rna。在分选后15天收集姐妹集落用于分析血红蛋白。通过定量实时pcr测定珠蛋白表达(γ/18srna的比率或γ/α的比率),并比较每个编辑的红细胞集落(图5a-5b)。实施例15-测试spy101sgrna当使用spy101sgrna时,在bcl11a基因的内含子2内可能出现三种可能的基因编辑结果。在使用spy101sgrna时可能出现的第一基因编辑结果仅产生在两个等位基因中的插入缺失(插入缺失/插入缺失,图6)。在使用spy101sgrna时可能出现的第二基因编辑结果产生在两个等位基因中具有插入缺失和野生型序列的克隆(插入缺失/wt,图6)。在使用spy101sgrna时可能出现的第三基因编辑结果产生在两个等位基因中具有野生型序列的克隆(wt/wt,图6)。当使用spy101sgrna时,编辑92%的红细胞集落。例如,92%的红细胞集落具有具有插入缺失的等位基因(图6)。在用spy101编辑的单个红细胞集落中测量γ-珠蛋白表达(γ/α珠蛋白mrna比率或γ/(γ+β)珠蛋白mrna比率)(图7a-b)。单个红细胞集落包括具有双等位基因或纯合插入缺失(插入缺失/插入缺失)的集落、具有单等位基因或杂合插入缺失的集落(插入缺失/wt)以及在两个等位基因中具有野生型序列的集落(wt/wt)。与两个等位基因中具有野生型序列的克隆相比,具有插入缺失的红细胞集落能够表达更高水平的γ珠蛋白(图7a-b)。实施例16-镰状细胞病(scd)和β-地中海贫血的治疗策略下表(表4)提供了与实施例16-17中使用的grna相关的信息。表4a、g、u:2'-o-甲基残基s:硫代磷酸酯a、c、g、u:rna残基下表(表5)提供与实施例16-17中提到的靶标相关的信息。表5靶标1corfularge靶标2corfusmall靶标3hpfh5靶标4kenya靶标5sd2靶标6spy101scd和β-地中海贫血的治疗策略使用crispr/cas9以重新产生在hpfh患者中天然发生的相同基因突变。分离患者的造血干细胞,用crispr/cas9离体处理这些细胞以产生hpfh遗传编辑,然后将编辑的细胞重新引入患者体内。遗传修饰的干细胞产生红细胞,这些红细胞含有足够量的hbf,以显著降低疾病病状的严重程度。基于自然界中见到的hbf上调程度、使用crispr/cas9以高效率重新产生这些编辑的能力以及不存在脱靶编辑,优先考虑许多遗传编辑。计算选择候选导向rna(grna)序列,然后筛选cd34+细胞中的靶上编辑功效。图8中示出一种这样的筛选的结果。在多个供体样品上靶编辑时一致地高(>70%)识别出grna。每个cd34+细胞供体用独特的符号(▲、★、●)表示,并且每个供体的靶上编辑效率测量两次。通过检查数百个计算上识别为与预期靶上位点在序列方面最相似的位点,在cd34+细胞中对于脱靶活性筛选候选grna,因此具有最高的脱靶活性潜力。图9a-b显示图8中测试的每种grna的实验方法(图9a)和结果(图9b)。即使在预测的位点,大多数grna也没有展示出可检测的脱靶活性。只有grnac和grnag显示脱靶活性。对于每个预测位点使用多个探针以增加测定敏感度。使用候选grna以在由scd和β-地中海贫血患者以及健康供体获得的红系细胞中重新产生特异性hpfh或其他修饰。在红细胞分化后,测量珠蛋白转录物水平以评估γ-珠蛋白相对于α-珠蛋白或β-珠蛋白的增加。如图10a-b所示,在用grna编辑的患者细胞中观察到大于30%的γ-珠蛋白mrna水平,以重新产生hpfh靶标5和6。scd和β-地中海贫血患者样品表现出γ-珠蛋白的绝对增加大于来自健康供体的样品,与患者中的hbf比具有hpfh的杂合子携带者的hbf高的观察结果一致。从所示值中减去来自每个供体的模拟处理的细胞的背景水平。数据代表单个实验,除了表示3种不同供体样品的平均值的scd患者数据以外。所有实验的编辑效率都相似。为了确保批量cd34+群体中的编辑效率代表长期再增殖hsc(lt-hsc)中的编辑效率,将批量cd34+细胞分选到特定亚群中并测定靶上编辑效率,如图11a-c所示。观察到lt-hsc群体的高编辑效率。使用跨4个供体的spy101和cas9蛋白进行实验。条描绘平均值±sem。lt-hsc、长期造血干细胞;mpp,多能祖细胞;mlp,多淋巴祖细胞;cmp,普通髓系祖细胞;mep,巨核细胞红细胞祖细胞;gmp,粒细胞巨噬细胞祖细胞。在免疫受损的小鼠中执行体内移植研究以证实基因编辑的hspc保留造血系统长期再增殖的潜力。来自健康供体的人cd34+细胞未经处理,未经编辑或使用spy101grna进行基因编辑并引入nsg小鼠中。如图12所示,在注射了未处理/未编辑的hspc的小鼠和注射了spy101基因编辑的hspc的小鼠中存在相似水平的hcd45ra+细胞(移植后8周),证实spy101编辑的细胞保留移植潜力。数据点代表个体动物并描绘作为人cd45ra+的活细胞的百分比。平均值±sd。“未处理的”代表未经电穿孔并注射到免疫受损的小鼠中的hspc。“未编辑的”代表经过电穿孔但未经基因编辑并注射到免疫受损的小鼠中的hspc。“spy101”代表用cas9和spy101grna电穿孔并注射到免疫受损的小鼠中的hspc。过程开发在具有gmp能力的设施中启动,以为临床研究做准备。如图13所示,在gmp相容过程中,在临床规模上未观察到基因编辑功效的显著损失。数据是4次或更多次实验的平均值,±sd。已经为我们的主要候选者启动了glp/毒理学研究,如图14所示。在nsg小鼠中的两项独立研究将允许对编辑的cd34+细胞的生物分布和毒理学进行全面表征。实施例17-镰状细胞病(scd)和β-地中海贫血的治疗策略图16a-b和图17显示在人mpbcd34+细胞中重新产生六种不同hpfh变体或编辑“靶标”的结果。将cd34+细胞用crispr/cas9处理,使其分化成红细胞,然后使用图15中所示的实验方法测定批量的hbfmrna和蛋白质表达(图16a-b)和集落的hbfmrna和蛋白质表达(图17)。图16a-b中呈现的结果来自针对靶标1-3的3个不同供体以及针对靶标4-6的7个不同供体。已减去模拟处理的细胞的背景水平。数据是平均值±sem。批量分析证实hbf上调并允许对展示最高hbf水平的靶标的优先性。图17中呈现的克隆分析允许确认由crispr/cas9引起的遗传编辑确实是个体细胞水平上hbf增加的原因。结果来自单个供体,并且每个靶标50-80个集落。通过qrt-pcr测量mrna转录物水平。数据是平均值±sem。靶标5和6显示出最高的hbf水平,并在图18a-b中进一步分析。数据是平均值±sem。wt表示不显示基因编辑证据的集落,杂合子或het表示具有一个编辑的等位基因的集落,并且纯合子或homo表示具有两个编辑的等位基因的集落。图16a-b、17和18a-b中的证据支持在所产生的遗传编辑与所需的hbf上调之间的因果关系,为所提出的治疗策略提供进一步的验证。实施例18-对于靶上活性测试细胞中优选的导向rna来自四个独立供体的运动的人外周血(mpb)cd34+细胞在无血清培养基中培养,该培养基包含100ng/ml重组人干细胞因子(scf)、100ng/ml重组人fit3配体(flt3l)和100ng/ml血小板生成素(tpo)。将每个供体的200,000个细胞洗涤并用lonza电穿孔仪电穿孔,其中不含任何crispr/cas9编辑组分(模拟电穿孔样品),gfpgrna和cas9蛋白作为阴性对照(gfp),用spy101grna和cas9蛋白(spy)、sd2grna和cas9蛋白(sd2)或双bcl11a外显子2grna和cas9蛋白(ex2)。重组cas9蛋白编码侧接两个sv40核定位序列(nls)的化脓链球菌cas9。使用核糖核蛋白(rnp)1:1重量比的grna与cas9执行这些实验。spy101grna在bcl11a基因座的内含子2中产生dhs+58gata1结合位点的indel破坏。sd2grna在人β珠蛋白基因座中产生indel和4.9kb缺失。4.9kb缺失位于hbg1的上游,且包括整个hbg2序列。4.9kb缺失自距hbg2编码序列168bp5'开始,且自距hbg1编码序列168bp5’结束。外显子2grna在bcl11a基因座的外显子2上产生196bp缺失并用作阳性对照。未电穿孔的人mpbcd34+细胞用作阴性对照(无ep)。电穿孔后,允许基因编辑的mpbcd34+细胞恢复两天,然后转换到红细胞分化培养基(imdm+l-谷氨酰胺,补充有5%人血清、10ug/ml胰岛素、20ng/mlscf、5ng/mlil-3、3u/mlepo、1um地塞米松、330ug/ml全转铁蛋白和2u/ml肝素)。基因编辑的mpbcd34+细胞分化成红细胞,并通过tide分析、ddpcr分析、定量实时pcr分析、facs和lc-ms进一步测试(图20a-b、21a-d、22a-b和23a-d)。整个实验过程展示在图19中。tide分析/ddpcr分析分离基因组dna并测试在分化培养基中生长的每个基因编辑的人mpbcd34+细胞样品。在分化后第1、11、13和15天从细胞中分离基因组dna。通过tide分析来分析基因组dna,tide分析是用于快速评估由导向rna(grna或sgrna)确定的靶基因座的crispr-cas9的基因组编辑的网络工具。图20a-b中呈现的结果来自4个不同的供体,并展示在用sd2grna编辑的mpbcd34+细胞(图20b)和用spy101grna编辑的mpbcd34+细胞(图20a)的整个体外红细胞分化中维持基因编辑的百分比。数据是平均值±sd。还通过ddpcr分析来分析基因组dna以用sd2处理检测4.9kb缺失频率。图20b中呈现的结果来自4个不同的供体,并展示在用sd2grna编辑的mpbcd34+细胞的整个离体红细胞分化中维持基因编辑的百分比(图20b)。数据是平均值±sd。定量实时pcr分析分离mrna并测试在分化培养基中生长的每个基因编辑的人mpbcd34+细胞样品。在分化后第11天和第15天执行mrna分离。通过定量实时pcr测定珠蛋白表达(γ/α的比率和γ/(γ+β)的比率),并比较用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的人mpbcd34+细胞中的每一种(图21a-d)。图21a-d中呈现的结果来自4个不同的供体,并展示与用阴性对照相比,用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的人mpbcd34+细胞中的γ-珠蛋白转录物的增加。数据是平均值±sd。facs/lc-ms用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的人mpbcd34+细胞在分化培养基中生长15天。还用双bcl11a外显子2grna(ex2)或gfpgrna编辑人mpbcd34+细胞,并在分化培养基中生长15天。一些人mpbcd34+细胞未用任何crispr/cas9编辑组分(模拟电穿孔样品)编辑,并且一些人mpbcd34+细胞未电穿孔(无ep)。用血型糖蛋白a红细胞成熟标志物使活细胞染色。然后将细胞固定并透化。对于每个珠蛋白亚基,用荧光团缀合的抗体染色固定的细胞。然后通过facs分析染色的细胞,其是图22a中所示的γ-珠蛋白的实例。图22b中描绘来自4个不同供体的γ-珠蛋白的平均中值荧光强度(平均值±sem),并展示在用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的人mpbcd34+细胞中γ-珠蛋白的上调。用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的mpbcd34+细胞在分化培养基中生长15天。还用双bcl11a外显子2grna(ex2)或gfpgrna编辑人mpbcd34+细胞,并在分化培养基中生长15天。一些人mpbcd34+细胞未用任何crispr/cas9编辑组分(模拟电穿孔样品)编辑,并且一些人mpbcd34+细胞未电穿孔(无ep)。使用液相色谱-质谱(lc-ms)来检测变性的珠蛋白单体(图23a-d)。图23a-d中呈现的结果来自4个不同的供体,并还展示在用sd2grna编辑的mpbcd34+细胞和用spy101grna编辑的mpbcd34+细胞中的γ-珠蛋白的上调。数据是平均值±sd。实施例19-对于脱靶活性测试细胞中优选的导向rna虽然基因组的靶上编辑是成功治疗的基础,但检测任何脱靶编辑事件是确保产品安全的重要组成部分。用于检测脱靶位点处的修饰的一种方法涉及通过杂交捕获测序富集基因组中与靶上位点最相似的区域并定量检测的任何插入缺失。杂交捕获测序是一种量化crispr-cas9编辑的细胞和dna中的脱靶编辑的方法。与杂交捕获测序方法相关的细节如下:材料和方法材料和来源1.1.1.基因组dna由于该方法的目的是确定由crispr-cas9进行的编辑是否发生在基因组中的脱靶位点处,通常使用至少两种输入样品-处理过的样品和对照(未处理、模拟电穿孔等)样品。每个样品具有通过适当方法提取的基因组dna(gdna),并且gdna与杂交捕获文库(1.1.2)杂交,然后是如下所述的方案的其余部分。1.1.2.杂交捕获文库通过提供多达57,000种120-mer低聚核苷酸诱饵序列的列表产生如(1.2.2)中所述的杂交捕获文库,然后将其合成为定制的sureselectxt杂交捕获试剂盒。1.2方法1.2.1.脱靶位点检测算法为了确定最有可能进行脱靶编辑的位点,我们使用多种具有不同特征的算法来确保覆盖广泛范围的脱靶位点。1.1.1.1.cctop对于给定的导向序列,cctop使用bowtie1序列映射算法以搜索在位点和导向之间具有多达5处失配的脱靶位点的基因组。我们将这些位点称为“同源脱靶位点”(而不是“预测的脱靶位点”),因为仅使用序列同源性来确定基因组中的潜在脱靶位点。这5个失配限于在最接近序列的pam末端的5个碱基比对种子区域中不超过2个失配。crispor算法(1.2.1.2)在种子区域中没有限制,因此补充了cctop。1.2.1.1.cosmid由于一些脱靶cas9裂解位点可能在它们自身和导向之间具有短的插入缺失(也称为凸出),我们还用cosmid算法搜索,该算法可以检测具有插入缺失的脱靶位点(通常限于最多2个插入缺失),从而补充了用cctop进行的搜索。1.2.1.2.crisporcrispor是一种工具,其实现许多不同的已发布的crispr靶上和脱靶评分功能,以便比较各种方法。其使用bwa算法来针对基因组搜索导向序列以找到它们的脱靶位点。这与cctop中使用的bowtie1算法不同,并且允许稍微宽松的搜索,因为pam区域附近的失配不限于如cctop中的5个碱基中的2个。1.2.1.3.pam在默认情况下,用对于具有ngg或nagpam的导向搜索进行筛选,因为它们具有最大活性中的一些。后期筛选可以包含更多的pam,以确保不会错过脱靶位点,即使是具有活性非常低的位点。1.2.1.4.算法组合每种算法输出的导向连接在一起以消除相同的脱靶位点并馈入杂交捕获诱饵设计组分。1.2.2.杂交捕获诱饵1.2.2.1设计然后使用脱靶位点检测算法(1.2.1.)产生的位点列表来产生杂交捕获探针,其将富集输入gdna样品中的每个脱靶位点。虽然一个诱饵可能足以成功地富集靶dna序列,但是通常在靶位点上设计并平铺几个诱饵(图24),以使得诱饵更可能特异性地拉下靶区域,即使它在一侧侧接可能难以特异性结合的重复序列。杂交捕获诱饵(120-mer,深色部分)平铺在诱饵(20-mer,由*表示的浅色部分)上(图24)。1.2.3.测序在杂交捕获富集后,在illuminahiseq测序仪上用配对末端125bp读序和175bp插入物大小进行测序。通常进行测序以靶向具有自最小频率事件检测到的5个读序的靶标的覆盖率深度。为了检测例如0.5%插入缺失事件,执行测序至1000x覆盖率,使得0.5%事件可能具有5个读序。1.2.4.诱饵效果在典型的实验中,我们发现诱饵覆盖了绝大多数具有高水平的测序覆盖率的靶位点。由于高%或低%gc、低复杂性序列、低诱饵亲和力、诱饵非特异性和其他原因而对于可以通过下一代测序(ngs)方法实现的测序覆盖率存在一些限制。通过计算具有不同真实插入缺失频率的位点的不同测序覆盖率的采样功率来估计实验中检测插入缺失的实际功率。通常,增加的序列覆盖率提供增加的功率以检测具有低频率插入缺失的位点。例如,如果一个位点具有2500x测序覆盖率,则杂交捕获将具有99%的功率以查看具有0.4%插入缺失频率的位点,并且94%的功率以查看具有0.3%插入缺失频率的位点(图25)。1.2.5.量化对于人类基因组构建hg38,使用默认参数将测序数据与bwa算法对齐。对于每个潜在的脱靶位点,计数潜在cas9裂解位点的3bp内的所有插入缺失并除以切割位点处的覆盖率,从而在特定切割位点处提供一定量的插入缺失。1.2.6.重要切割位点的统计评估各种事件可以导致插入缺失,这不是在整个基因组中的位点处检测的crispr-cas9的结果:种系插入缺失变体或多态性、易受基因组断裂影响的区域、具有均聚物运行的区域以及否则难以测序的区域1.2.6.1.从分析中排除的位点我们从分析中排除:在逐个供体的基础上具有“种系”插入缺失的任何位点(在每个样品中供体具有>30%的插入缺失频率)、在雌性样品中的任何染色体y位点以及具有0覆盖率的任何位点。1.2.6.2.统计检验为了评估在潜在脱靶位点处见到的插入缺失是否确实是crispr-cas9诱导的事件,我们使用mann-whitneywilcoxon测试和学生t测试来测试用cas9和导向处理的样品是否具有比未处理的样品显著高的插入缺失频率。如果这些测试中的任何一个是显著的(p<0.05),我们认为该位点被标出用pcr追踪以确定是否存在显著编辑。为了确保我们尽可能积极地标出位点以执行追踪,我们不执行多项假设检验校正,这会减少我们发现显著的位点的数量。我们还建立了阴性对照分析,其中我们重复分析,除了我们寻找与处理过的样品相比在未处理样品中插入缺失频率较高的位点之外。在生物学上,我们没有理由期望在该分析中找到“真正的命中”,这为我们提供了关于我们可以期望在该数据集中找到的可以归因于背景噪声的假阳性的数量的经验信息。另外,我们可以通过利用另外两个阴性对照样品将其扩展为经验零分布,这些隐形对照样品包括没有用cas9或导向电穿孔的细胞和用cas9和gfp导向电穿孔的细胞。通过测试与“较大程度处理的”样品相比在“较小程度处理的”样品中的命中,我们确定了假阳性命中的保守经验零分布,其可以用于通知我们对于处理过的样品和未处理的样品的原始分析中命中的可信度。用sd2grna编辑的人mpbcd34+细胞和用spy101grna编辑的人mpbcd34+细胞通过本文所述的杂交捕获测序方法分析。图26-27中呈现的结果来自3至4个不同的供体,并展示0个脱靶位点,具有在用sd2grna编辑的基因编辑的mpbcd34+细胞(图27)和用spy101grna编辑的基因编辑的mpbcd34+细胞(图26)中切割的证据。第1轮的插入缺失频率大于(>)0.5%。第2轮的插入缺失频率大于(>)0.2%。实施例20-植入实验使用具有clinimacsprodigy(miltenyibiotec)的clinimacscd34微珠从健康供体分离运动的人外周血(mpb)cd34+细胞,并在无血清培养基中培养,该培养基包含100ng/ml重组人干细胞因子(scf)、100ng/ml重组人fit3-配体(flt3l)和100ng/ml血小板生成素(tpo)。然后使用遵循制造商的说明用以下物质之一对细胞进行电穿孔:不含任何crispr/cas9编辑组分的空载体(模拟电穿孔样品)、作为阴性对照的gfpgrna和cas9蛋白(gfp)、spy101grna和cas9蛋白(spy101)或sd2grna和cas9蛋白(sd2)。重组cas9蛋白编码侧接两个sv40核定位序列(nls)的化脓链球菌cas9。使用核糖核蛋白(rnp)1:1重量比的grna与cas9执行这些实验。每个基因编辑的mpbcd34+人细胞通过尾静脉注射到16只免疫受损小鼠(“nsg”或nodscidγ-nod)中以展示归巢和植入能力。nsg是近交实验室小鼠的菌株,是迄今为止描述的免疫缺陷最多的小鼠;参见,例如,shultz等人,nat.rev.immunol.7(2):118-130(2007)。与植入实验相关的细节呈现在图28中。在注射后8周,对nsg小鼠放血,并通过facs针对人cd45ra+和小鼠cd45+活细胞分析外周血。在注射后16周,处死nsg小鼠,并通过facs针对人cd45ra+和小鼠cd45+活细胞分析骨髓、脾和外周血。从所有三个健康供体中观察到mpbcd34+人细胞植入所有处理组中的辐射的nsg小鼠中。使用facs在来自所有供体的所有3个造血器官中检测人cd45ra+细胞。未转染的cd34+对照细胞表现出稍好的植入百分比。所有转染的细胞组具有相似的植入百分比,包括在所有3个健康供体中的模拟转染组。通常,与模拟转染对照相比,添加cas9-grnarnp不影响植入(图29a-e和图30)。图29a-e中的数据点代表个体小鼠并描绘作为人cd45ra+细胞的活细胞的百分比。数据是平均值±sem。实施例21-使用cas9rnp评估spy101编辑效率和功效为了使用crispr-cas9使用spy101治疗scd和β-地中海贫血达到最高功效,我们评估两种不同的cas9格式,即cas9mrna或cas9蛋白在来自运动的外周血(mpb)的人cd34+细胞中的编辑效率、功效和毒性。我们通过将cas9mrna和spy101grna或与spy101grna复合的cas9蛋白(作为核糖核蛋白(rnp)复合物)电穿孔到人mpbcd34+细胞中来比较cas9mrna与cas9蛋白的各种来源,并在电穿孔48小时后评估它们的编辑效率和细胞活力。我们比较了cas9mrna与cas9蛋白的各种来源,并且发现尽管我们可以在一些cas9mrna与cas9蛋白之间实现相似水平的编辑效率(图31),但与对照样品(无电穿孔(无ep)或无底物电穿孔(模拟ep)对照)相比,大多数具有显著更低的细胞活力,如图32a-b中所示,这表明cas9rnp是用于将cas9和grna高效递送到人mpbcd34+细胞中的最佳格式。我们接着比较了不同来源的cas9蛋白以及在n-或c-末端具有不同数量的核定位信号(nls)的cas9蛋白,因为这可以影响cas9高效定位到细胞核中以进行编辑。如图33a-c所示,我们发现在n末端和c末端都具有一个nls的aldevroncas9蛋白质具有最佳编辑效率,而细胞活力没有变化。接着,我们使用cas9mrna或cas9蛋白(选自先前实施例的feldan或aldevron)编译跨各种人mpbcd34+供体检查的spy101编辑效率,并观察到aldevroncas9蛋白产生最高的编辑功效(图34a)。另外,我们能够使用cas9蛋白在临床规模上在gmp相容制造中实现相似的编辑效率(图34b)。我们接着检查在源自mpb(图35a-b)或骨髓(bm,图36a-b)的几种cd34+供体上的spy101功效。我们看到,在整个优化过程中,我们通过在红细胞分化的cd34+细胞中的定量实时pcr实现了更好的功效,计量为γ-珠蛋白表达相对于α-珠蛋白或β-珠蛋白样珠蛋白(β-珠蛋白+γ-珠蛋白)。然后,我们研究了spy101在从scd或β-地中海贫血患者获得的细胞中是否有效。来自健康供体或患者的外周血单核细胞用spy101cas9rnp电穿孔,并且在提取rna之前相似于上述实例进行红细胞分化以测量γ-珠蛋白表达。我们看到spy101在患者样品中对于γ-珠蛋白增加确实有效(图37a-b)。为了更好地理解spy101编辑的红系细胞中基因型与表型的关系,我们用cas9rnp执行与实施例15相似的单集落分析,并且发现与cas9mrna相比,这使用cas9rnp增加了更大分数的双等位基因编辑的集落(图38a-b)。另外,未编辑的集落的详细分解、由spy101靶向的gata1结合位点的单等位基因破坏和gata1结合位点的双等位基因破坏揭示spy101的剂量依赖性功效,计量为与对照gfpgrna处理的细胞相比的γ-珠蛋白增加(图39a-b)。为了检查表达γ-珠蛋白的细胞的百分比,我们在来自人mpb的spy101cas9rnp编辑的cd34+细胞中执行facs分析。与对照gfpgrna处理的细胞相比,我们看到在spy101处理的细胞中表达γ-珠蛋白的红细胞分化细胞的百分比更高(图40a-d)以及每个细胞的γ-珠蛋白表达的增加(图40e)。关于示例性实施例的注释尽管出于说明本发明的各个方面和/或其潜在应用的目的,本公开提供了各种具体方面的描述,但应理解,本领域的技术人员将想到变化和修改。因此,本文所述的发明应当被理解为至少与它们要求保护的一样广泛,而不是由本文提供的特定示例性方面更狭义地限定。除非另有说明,否则本文中鉴定的任何专利、出版物或其他公开材料通过引用整体并入本说明书中,但仅仅在并入的材料不与现有的描述、定义、表述或本说明书明确阐述的其他公开材料发生冲突的程度上并入。因此,并且在必要的程度上,如本说明书中阐述的明确公开内容取代通过引用并入的任何冲突材料。任何材料或其一部分(据说通过引用并入本说明书中,但与现有定义、表述或本文所阐述的其他公开材料冲突)仅仅在并入的材料与现有的公开材料之间无冲突发生的程度上并入。申请人保留修改本说明书以明确地叙述通过引用并入本文的任何主题或其部分的权利。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1