用于胎儿血红蛋白再诱导的靶向BCL11A远端调控元件的制作方法

文档序号:15523188发布日期:2018-09-25 20:10阅读:341来源:国知局

根据35U.S.C.§119(e),本申请要求2012年11月27日提交的美国临时申请号61/730,323、2012年11月27日提交的美国临时申请号61/730,369、2013年3月11日提交的美国临时申请号61/776,144以及2013年10月10日提交的美国临时申请号61/889,174的优先权,以引用的方式将它们的内容各自整体并入本文。

政府支持

本发明是在由美国国立卫生研究院授予的基金号5RO1HL032259的政府支持下完成的。美国政府对本发明享有一定的权利。



背景技术:

正常成体血红蛋白包含四个珠蛋白,两个为α蛋白,两个为β蛋白。在哺乳动物(特别是人类)胎儿发育期间,胎儿产生胎儿血红蛋白,其包含两个γ-珠蛋白而不是两个β-珠蛋白。在新生儿时期,被称为“胎儿转换(fetal switch)”的珠蛋白转换发生,届时,红系细胞前体(erythroid precursors)从主要制造γ-珠蛋白转换成主要制造β-珠蛋白。从主要产生胎儿血红蛋白或HbF(α2γ2)到产生成体血红蛋白或HbA(α2β2)的发育转换起始于妊娠的约28-34周,并在出生后短暂地持续,直至HbA成为主导。这种转换主要是由γ-珠蛋白基因转录的减少以及β-珠蛋白基因转录的增加而引起。尽管在健康成体中的残留HbF水平具有超过20倍的差异并且受到遗传控制,但通常正常成体的血液中含有少于1%的HbF。

血红蛋白病(Hemoglobinopathies)涵盖了许多种基因起因的贫血,其中,存在有减少的红血细胞(RBC)产生和/或增加的红血细胞破坏(溶血)。这些血红蛋白病还包括导致伴随有保持氧浓度的能力受损的异常血红蛋白产生的遗传缺陷。一些此类紊乱包括不能产生足够量的正常β-珠蛋白,而另一些紊乱包括完全不能产生正常β-珠蛋白。与β-珠蛋白有关的这些紊乱通常被称作β-血红蛋白病。例如,β-地中海贫血症由(导致有缺陷的HbA或使HbA缺失的)β-珠蛋白基因表达的部分缺陷或完全缺陷造成。镰状细胞贫血由(导致异常(镰状)血红蛋白(HbS)产生的)β-珠蛋白结构基因中的点突变造成。HbS易于聚合,特别是在去氧条件下。HbS RBC比正常RBC更脆弱,并且更容易发生溶血,最终导致贫血。

近来,旨在降低患有β-血红蛋白病的患者中的珠蛋白链失衡或易于出现血红蛋白聚合的治疗研究已集中在胎儿血红蛋白(α2γ2;HbF)的药理学操控上。此类方法的治疗潜力由以下结果所暗示:对具有纯合的β-地中海贫血和遗传性胎儿血红蛋白持续存在症(hereditary persistence of fetal hemoglobin,HPFH)的共遗传(co-inheritance)的个体的轻度表型的观察结果;以及在胎儿血红蛋白浓度增加的情况下观察到无成体血红蛋白合成并具有纯合的β-地中海贫血的那些患者却具有降低的输血需求。此外,已观察到具有β链异常的成体患者的特定群体的胎儿血红蛋白(HbF)水平高于正常水平,并且已经观察到相比具有正常成体HbF水平的患者,该特定群体具有较轻微的疾病临床过程。例如,表达了20%-30%HbF的沙特阿拉伯镰状细胞贫血患者组仅具有轻微的疾病临床表现。现在认可了血红蛋白紊乱(如镰状细胞贫血和β-地中海贫血)通过增加HbF的产生而得到改善。

如前所述,胎儿血红蛋白向成体血红蛋白(α2γ2;HbA)的转换通常在分娩后的六个月内进行。然而,在大多数患有β-血红蛋白病的患者中,上游γ-珠蛋白基因是完整的并且具备完全功能,因此如果使这些基因再活化,则可在成体期维持功能性血红蛋白合成,从而改善疾病严重程度。不幸的是,尚未很好地了解作为珠蛋白转换基础的体内分子机制。

支持胎儿血红蛋白产生再活化可行性的证据来自于如下实验:在此类实验中,证明了当给予生长因子的适当组合时,含有克隆源性细胞(clonogenic cells)的外周血产生红系细胞集落(colonies)并在半固体培养中爆发(burst)。此类集落中的各个细胞可累积胎儿血红蛋白(HbF)、成体血红蛋白(HbA)或两者的组合。在来自成体血液的培养物中,有核红细胞仅累积HbA(F-A+)、或HbF和HbA的组合(F+A+)。重要的是,单个集落同时含有F+细胞和F-细胞,这表明这两种类型均为同一循环干细胞的后代。因此,在培养中的发育早期阶段期间,细胞通过目前尚未知晓的机制选择是否表达HbF。在培养中发育的成体F+细胞部分并未出现体内预编程(preprogrammed),但似乎取决于培养条件:变换到HbF和HbA组合表达通路例如可通过高血清浓度在体外实现,这是由于可被吸附在活性炭上的不明化合物的活性。

总体而言,对在珠蛋白转换中起作用的分子的识别对于干扰成体血红蛋白和诱导胎儿血红蛋白合成的新型治疗策略的开发很重要。此类分子将为用于各种血红蛋白病的治疗干预的开发提供新靶标,在这些血红蛋白病中,胎儿血红蛋白合成的再活化将显著改善疾病严重程度和发病率。



技术实现要素:

本文提供了通过在基因组水平上破坏BCL11A表达来增加细胞中胎儿β-珠蛋白水平的方法以及组合物。本文还提供了涉及通过胎儿β-珠蛋白水平的再诱导来治疗血红蛋白病的方法以及组合物。

本文所述的一个方面涉及用于生产具有减少的BCL11A mRNA或蛋白表达的祖细胞的方法,所述方法包括将分离的祖细胞与药剂进行接触,从而使BCL11A mRNA或蛋白表达降低,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA。

本文所述的另一方面涉及用于生产具有至少一种遗传修饰的基因工程人细胞的方法,所述方法包括将分离的细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在另一方面,本文还提供了在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞。在一个实施方式中,所述至少一种遗传修饰为在基因组DNA中指定位置处的删除。在一个实施方式中,相比在2号染色体的60,716,189-60,728,612位置上没有遗传修饰的对照细胞而言,所述分离的基因工程人细胞具有降低的或减少的BCL11A mRNA或蛋白表达。

本文所述的另一方面涉及本文所述的在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞用于增加哺乳动物中胎儿血红蛋白水平的用途。

本文所述的另一方面涉及本文所述的在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞用于治疗哺乳动物中的血红蛋白病的用途。

本文所述的另一方面涉及本文所述的在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞在制造用于治疗哺乳动物中的血红蛋白病的药物中的用途,由此哺乳动物中的胎儿血红蛋白水平有所增加。

本文所述的另一方面为包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞的组合物。在一个实施方式中,所述组合物进一步包含药学上可接受的载体。

本文所述的另一方面涉及包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞的组合物用于增加哺乳动物中胎儿血红蛋白水平的用途。

本文所述的另一方面涉及包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞的组合物用于治疗哺乳动物中的血红蛋白病的用途。

本文所述的另一方面涉及包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞的组合物在制造用于治疗哺乳动物中的血红蛋白病的药物中的用途,由此哺乳动物中的胎儿血红蛋白水平有所增加。

本文所述的另一方面为至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对人细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。在一个实施方式中,所述组合物进一步包含药学上可接受的载体。

本文所述的另一方面涉及至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物用于增加哺乳动物中胎儿血红蛋白水平的用途,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对人细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

本文所述的另一方面涉及至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物用于治疗哺乳动物中的血红蛋白病的用途,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对人细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

本文所述的另一方面涉及至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物在制造用于治疗哺乳动物中的血红蛋白病的药物中的用途,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对人细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此哺乳动物中的胎儿血红蛋白水平有所增加。

在一个实施方式中,本文提供了结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的细胞基因组DNA的药剂的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,BCL11A的mRNA或蛋白表达有所降低。

在一个实施方式中,本文提供了有效量的至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对细胞基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在一个实施方式中,本文提供了有效量的至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体的组合物的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,所述DNA靶向酶在2号染色体上在细胞基因组DNA中产生至少一种表观遗传修饰,从而影响BCL11A的mRNA或表达。在一个实施方式中,所述至少一种表观遗传修饰位于60,716,189-60,728,612位置处。在另一实施方式中,一种表观遗传修饰的作用为降低BCL11A的mRNA或蛋白表达。在一个实施方式中,在2号染色体上的细胞基因组DNA中的所述至少一种表观遗传修饰间接地或直接地影响2号染色体的60,716,189-60,728,612位置。

在一个实施方式中,本文提供了本文所述的任何分离的细胞用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途。

在一个实施方式中,本文提供了包含分离的基因工程人细胞的组合物用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途,其中,所述细胞在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上具有至少一种遗传修饰,所述至少一种遗传修饰通过将所述细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在一个实施方式中,本文提供了包含分离的基因工程人细胞的组合物用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途,其中,所述细胞在2号染色体上具有至少一种表观遗传修饰。在一个实施方式中,2号染色体上的所述至少一种表观遗传修饰位于60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)处。在另一实施方式中,2号染色体上的至少一种表观遗传修饰通过将细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体上在所述细胞的基因组DNA中产生至少一种表观遗传修饰,所述至少一种表观遗传修饰影响在其中产生所述表观遗传修饰的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)。

在一个实施方式中,本文提供了本文所述的任何分离的细胞或本文所述的组合物中的任何一种在制造用于增加有需要的哺乳动物中的胎儿血红蛋白的药物或用于治疗哺乳动物中的血红蛋白病的药物中的用途。

本文所述的另一方面为用于增加细胞中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:将分离的细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述细胞或其后代中的胎儿血红蛋白表达相对于所述接触之前的细胞有所增加。

本文所述的另一方面为用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:在所述哺乳动物中将分离的造血祖细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

本文所述的另一方面为用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括将在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞移植到所述哺乳动物中。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:在离体(ex vivo)情况下提供来自于所述哺乳动物的分离的造血祖细胞群或造血干细胞群;以及将所述造血祖细胞群或造血干细胞群与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:从所述哺乳动物中分离造血祖细胞群或造血干细胞群;以及将所述造血祖细胞群或造血干细胞群与有效量的组合物离体进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:提供(分离)来自于所述哺乳动物的造血祖细胞群或造血干细胞群;以及将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于接触之前的表达有所增加。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:从所述哺乳动物中分离造血祖细胞群或造血干细胞群;以及将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于接触之前的表达有所增加。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)提供造血祖细胞或造血干细胞或iPSC;(b)将所述细胞与有效量的组合物离体或在体外(in vitro)进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)从所述哺乳动物中分离造血祖细胞或造血干细胞;(b)将所述细胞与有效量的组合物离体或在体外进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)提供造血祖细胞或造血干细胞或iPSC;(b)将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)从所述哺乳动物中分离造血祖细胞或造血干细胞;(b)将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,本公开提供了用于治疗哺乳动物(例如人)中的血红蛋白病的方法,所述方法包括引入本文所述的组合物,所述组合物包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程细胞,由此所述哺乳动物中的胎儿血红蛋白表达有所增加。

在一个实施方式中,本公开提供了用于治疗哺乳动物(例如人)中的血红蛋白病的方法,所述方法包括通过本文所述的方法增加所述哺乳动物中的胎儿血红蛋白表达。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的细胞或分离的细胞群为人细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的细胞或分离的细胞群为祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述人细胞为造血祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述人细胞为诱导多能干细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述诱导多能干细胞为造血祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述造血祖细胞为红系细胞谱系(erythroid lineage)的细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,将所述造血祖细胞或分离的细胞离体、或在体外、或在体内进行接触。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述至少一种遗传修饰为删除。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述删除将2号染色体的60,716,189-60,728,612位置之间的整个区域移除、或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表2中所述的SNP标志物中的一个或多个。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表7中所列的片段中的一个或多个。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除将2号染色体的60,716,189-60,728,612位置之间的整个区域移除、或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。在一个实施方式中,在基因组删除的情况中,本文所用的术语“一部分/部分(portion)”为指定区域的至少20%-80%。

在任何治疗方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。

在任何方法的一个实施方式中,可将具有至少一种遗传修饰的接触后的细胞冷冻并保存,直至需要将所述细胞给予至哺乳动物中。

在任何所述方法的一个实施方式中,造血祖细胞、或干细胞、或分离的细胞可用本文所述的iPSC替代。

在任何所述方法的一个实施方式中,造血祖细胞、或干细胞、或iPSC、或分离的细胞对于哺乳动物而言为自体的,这意味着所述细胞来源于同一哺乳动物。在所述方法的另一实施方式中,造血祖细胞、或干细胞、或iPSC、或分离的细胞对于哺乳动物而言为非自体的,这意味着所述细胞并非来源于同一哺乳动物,而是来源于相同物种的另一哺乳动物。例如,哺乳动物为人。

在任何治疗方法的一个实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白表达的哺乳动物。

在任何治疗方法的一个实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为β-血红蛋白病。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为β-地中海贫血。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为镰状细胞贫血。

附图说明

图1A示出了636个SNP(此前公开了这些SNP与红系细胞特性(erythroid traits)有关,P<5×10-8)关于启动子、外显子、内含子、3'UTR和基因间序列的分布。为了比较,显示了这些区域的基因组分布。

图1B是标绘636个红系细胞特性相关SNP关于最近的红系细胞增强子的距离的累积分布(cumulative distribution)的图表。红系细胞增强子被定义为距离Refseq注释基因的TSS超过2kb、具有DNA酶I超敏感性的序列,存在H3K4me1,存在H3K27ac或H3K9ac二者之一,并缺乏H3K4me3和H3K27me3。还标绘了50组636个随机排列的非红系细胞特性相关SNP(来自于GWAS数据库)、来自Affy 6.0基因分型阵列的SNP、或随机SNP的距离的平均值±SD。

图2A示出了用针对H3K27me3、H3K4me3、H3K4me1、H3K27ac、GATA1、TAL1和PolII的抗体对CD34+细胞来源的红系细胞前体进行ChIP后再继以大规模并行测序。对从红系细胞前体、胎儿脑以及B淋巴细胞和T淋巴细胞中分离的细胞核进行DNA酶I处理,切割位点由大规模并行测序确定。HbF相关的SNP包括与HbF水平或F细胞数相关(P<5×10-8)的SNP;以及在给定的GWAS中与HbF或F细胞数最高度相关的前哨SNP(sentinel SNP)。基于距BCL11A TSS的距离(以kb计),将三个相邻的红系细胞DHS标注为+62、+58和+55。

图2B示出了原代人红系细胞前体在BCL11A内含子-2处的ChIP-qPCR,归一化至1%输入染色质。来自图2A的DHS+62、+58和+55以阴影示出。显示了在阴性对照(GAPDH、OCT4)和阳性对照(β-珠蛋白LCR HS3和α-珠蛋白HS-40)基因座处的富集以用于比较。

图2C示出了使用BCL11A启动子作为锚(anchor)跨越BCL11A基因座在原代人红系细胞前体中进行的染色体构象捕获。将相互作用频率针对LCR-HBB相互作用进行归一化。

图3A示出了对健康匿名供体在rs1427407处进行基因分型以识别杂合子个体,可从所述供体获得造血干细胞/祖细胞。对五个供体进行了识别。对造血干细胞/祖细胞进行红系细胞分化培养。从成红细胞(erythroblasts)中分离出染色质,并通过GATA1或TAL1进行免疫沉淀。使ChIP DNA或输入DNA经历焦磷酸测序反应,以对rs1427407G等位基因的相对丰度进行定量。该图以出现的顺序分别公开了SEQ ID NO:197和SEQ ID NO:198。

图3B示出了来自对健康匿名供体在rs1427407、rs7606173和rs7569946处进行基因分型以对关于rs1427407-rs7606173单倍型以及rs7569946呈杂合的个体进行识别的数据,可从所述供体获得造血干细胞/祖细胞。对三个供体进行了识别。单倍型分型揭示出,rs7569946G等位基因与rs1427407G等位基因和rs7606173C等位基因中的每个位于相同的染色体上。对造血干细胞/祖细胞进行红系细胞分化培养。分离RNA和基因组DNA,并通过逆转录制造cDNA。使成对的gDNA和cDNA样品经历焦磷酸测序反应,以对7569946G等位基因的相对丰度进行定量。

图3C示出了在CSSCD定群(cohort)中rs1427407-rs7606173单倍型的平均HbF。平均HbF水平在213个rs1427407-rs7606173G-C个体中为4.05%(SD 3.10);在254个rs1427407-rs7606173T-G/G-C杂合子中为7.08%(SD 4.50);以及在60个rs1427407-rs7606173T-G个体中为11.21%(SD 4.37)。P值对应于单尾学生t检验。在CSSCD中的单倍型频率为:TG 24.5%;TC 0.085%;GC 42.3%;GG 33.1%。

图4A-图4C示出了来自BCL11A内含子-2的12.4kb片段的数据,该片段涵盖了在Hsp68最小启动子上游克隆的DHS+62、+58和+55(涵盖了距离TSS的+52.0-64.4kb)和以H19绝缘子元件作为侧翼的lacZ报告基因。在单细胞阶段通过核注射生成瞬时转基因鼠胚胎。

图4A示出了用X-gal染色的E12.5瞬时转基因胚胎。

图4B示出了分离自稳定的转基因E12.5胚胎的外周血和胎儿肝脏的细胞悬浮液。用X-gal对细胞离心涂片(Cytospins)进行染色,并用核红(Nuclear Red)进行复染色。

图4C示出了来自骨髓成红细胞(CD71+/Ter119+)和脾淋巴细胞(B淋巴细胞为CD19+、T淋巴细胞为CD3+)的数据,这些细胞从年轻的成体稳定转基因动物中分离并分选。对细胞进行X-gal染色,或RNA分离继以RT-qPCR。将基因表达针对GAPDH进行归一化,并相对于T淋巴细胞进行表示,T淋巴细胞不表达BCL11A和lacZ。

图5A-图5C示出了转染有两对TALEN的小鼠红白血病(erythroleukemia,MEL)细胞和pro-B淋巴样细胞,所述两对TALEN各自被设计用于在来自+50.4-+60.4kb的直系同源(orthologous)10kb BCL11A内含子-2红系细胞增强子的任一端上产生DSB。分离出在10kb段具有双等位基因删除的克隆(称作Δ50.4-60.4)。

图5A示出了用识别内含子-2上游的序列、跨越内含子-2的序列和内含子-2下游的序列的引物对Bcl11a进行的RT-qPCR。

图5B示出了用抗-BCL11A进行的Δ50.4-60.4的免疫印迹。

图5C示出了Δ50.4-60.4MEL克隆中珠蛋白基因的表达。共同引物对识别成体β-珠蛋白β2和β1,而独立的引物识别胚胎β-珠蛋白εy和βH1。

图6示出了注射有lacZ报告子构建体的小鼠受精卵原核(pronuclei)。在E12.5将转基因胚胎分离。通过lacZ PCR对胚胎进行基因分型。描述了转基因胚胎的分数(fraction)和胎儿肝脏的X-gal染色。

图7示出了克隆至具有TK最小启动子和GFP的增强子构建体中的1-2kb的序列片段。通过慢病毒载体将增强子报告子构建体递送至原代人红系细胞前体。通过嘌呤霉素抗性对转染的细胞进行选择。对平均GFP荧光强度进行测量。

图8示出了与小鼠红系细胞的染色质图谱有关的数据,该数据揭示了Bcl11a内含子-2处的直系同源增强子标记。由此前公开的全面小鼠红系细胞染色质图谱获得的小鼠轨迹(tracks),具有组蛋白修饰、DNA酶I切割形式以及GATA1和TAL1ChIP-seq形式。虚线矩形界定了直系同源增强子标记,限定了TALEN介导的删除所靶向的Δ50.4-60.4元件。

图9A是本文所使用的TALEN介导的基因组工程化策略的示意图。TALEN是序列特异性核酸酶。将两对TALEN工程化为产生双链断裂,一对位于Bcl11a+50.4,另一对位于+60.4。对已通过NHEJ将两个DSB修复、并删去了介于中间的10kb片段的克隆进行分离。用位于该10kb删除的5'、3'、内部及跨越该10kb删除的引物通过PCR对克隆进行筛选。

图9B示出了来自Δ50.4-60.4克隆的HindIII消化的基因组DNA的Southern印迹,证实了这些克隆具有预期的被删去的等位基因并且缺乏非删去的等位基因。

图9C示出了在小鼠红白血病(MEL)细胞和前B淋巴细胞中的Δ50.4-60.4克隆,所述Δ50.4-60.4克隆具有由TALEN介导的NHEJ产生的双等位基因BCL11A增强子的删除。该直方图示出了使用该10kb删除的5'、3'、内部及跨越该10kb删除的引物产生的PCR扩增(参见图9A中的扩增子)。所有的Δ50.4-60.4克隆缺失了Del-1和Del-2的扩增,表明存在来自+50.4kb-+60.4kb的10kb BCL11A内含子-2红系细胞增强子的双等位基因删除。

图10示出了来自Δ50.4-60.4克隆的PCR产物的Sanger测序。示出了具有介于中间的间隔区的5'(+50.4)和3'(+60.4)左和右TALEN识别序列。一些等位基因显示出由各消化的间隔区序列直接进行末端连接的证据,而其它等位基因则显示出数百个额外的核苷酸的缺失。只有一个等位基因各自由MEL克隆#1和pro-B克隆#2分离出。该图以出现的顺序从上到下分别公开了SEQ ID NO:199至SEQ ID NO:215。

图11A示出了对于BCL11A+62、+58或+55DHS内的38个变体在来自CSSCD的1,178个个体中获得的基因型数据。在常见(MAF>1%)SNP(n=10)中,在rs1427407上的条件分析(conditional analysis)之前(rs1427407)或之后(rs7606173)与HbF水平最高度显著相关。SNP坐标(coordinates):2号染色体,building 19。

图11B为BCL11A处的HbF相关性分析。对于BCL11A+62、+58或+55DHS内的38个变体在来自CSSCD的1,178个个体中获得基因型数据。前哨SNP为在先前的GWAS中与HbF水平或F细胞数最高度相关的前哨SNP(7-12)。将这些SNP相对于BCL11A内含子-2示出,标明了3个DHS+62、+58和+55。

具体实施方式

本文所述的方法和组合物部分地涉及能够调控BCL11A蛋白表达的位于BCL11A基因上游的远端调控区域的发现。BCL11A蛋白通过抑制γ-珠蛋白诱导而作为胎儿血红蛋白表达的阶段特异性调节子(stage specific regulator)起作用。因此,本文所提供的方法和组合物为用于调控红系细胞中的γ-珠蛋白表达的新方法。更具体而言,这些活性可用在通过经由BCL11A基因产物的抑制来诱导γ-珠蛋白以治疗β-血红蛋白病的方法中。

在一个实施方式中,本文提供了用于生产具有减少的BCL11A mRNA或蛋白表达的分离的祖细胞的方法,所述方法包括将分离的祖细胞与药剂进行接触,从而使BCL11A mRNA或蛋白表达降低,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA。

在一个实施方式中,本文提供了用于生产具有减少的BCL11A mRNA或蛋白表达的分离的祖细胞的方法,所述方法包括提供分离的祖细胞,并将所述分离的祖细胞与药剂进行接触,从而使BCL11A mRNA或蛋白表达降低,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA。

在一个实施方式中,本文提供了用于生产具有减少的BCL11A mRNA或蛋白表达的分离的祖细胞的方法,所述方法包括将分离的祖细胞与药剂进行接触,从而使BCL11A mRNA或蛋白表达降低,所述药剂在2号染色体上的所述细胞的基因组DNA中产生表观遗传修饰。在一个实施方式中,基因组DNA中的所述表观遗传修饰位于2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)处。

在一个实施方式中,本文提供了用于产生具有减少的BCL11A mRNA或蛋白表达的分离的祖细胞的方法,所述方法包括提供分离的祖细胞,并将所述分离的祖细胞与药剂进行接触,从而使BCL11A mRNA或蛋白表达降低,所述药剂在2号染色体上的所述细胞的基因组DNA中产生表观遗传修饰。在一个实施方式中,基因组DNA中的所述表观遗传修饰位于2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)处。

在优选的实施方式中,本文所述的公开不涉及可能使人或动物痛苦而对他/它们没有任何实质性医疗益处的用于克隆人类的过程、用于修饰人类的生殖细胞系遗传身份(germ line genetic identity)的过程、人类胚胎在工业目的或商业目的中的用途、或者用于修饰动物的遗传身份的过程,以及来源于此类过程的动物。

本文所述的一个方面涉及用于生产具有至少一种遗传修饰的分离的基因工程人细胞的方法,所述方法包括将所述细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

本文所提供的另一方面涉及用于增加分离的细胞中的胎儿血红蛋白水平的方法,所述方法包括减少所述细胞中的BCL11A mRNA或蛋白表达。在一个方面,BCL11A mRNA或蛋白表达的减少通过在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA处造成至少一种遗传修饰而实现。在另一方面,BCL11A mRNA或蛋白表达的减少通过在2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA处造成至少一种遗传修饰(导致了2号染色体的60,716,189-60,728,612位置上的遗传功能的表观遗传修饰)而实现。在这一方面,位于2号染色体的60,716,189-60,728,612位置内的BCL11A增强子活性降低。根据这一方面的减少,与未用本文所公开的任何方法处理的对照细胞相比,在增强细胞中BCL11A mRNA或BCL11A蛋白表达方面,增强子活性低至少5%、低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。细胞中BCL11A mRNA或蛋白表达的减少意味着与未用本文所公开的任何方法处理的对照细胞相比,蛋白表达低至少5%、低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。

本文所提供的另一方面涉及用于增加分离的细胞中的胎儿血红蛋白水平的方法,所述方法包括提供分离的人细胞或祖细胞,以及使所述细胞中的BCL11A mRNA或蛋白表达减少。

本文所提供的另一方面涉及用于增加细胞中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:将分离的人细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述细胞或其后代中的胎儿血红蛋白表达相对于所述接触之前的细胞有所增加。

本文所提供的另一方面涉及用于增加细胞中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:提供分离的人细胞或祖细胞,将分离的人细胞或祖细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述细胞或其后代中的胎儿血红蛋白表达相对于所述接触之前的细胞有所增加。

本文所述的另一方面涉及用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括减少所述哺乳动物的造血祖细胞中的BCL11A mRNA或蛋白表达。在一个方面,BCL11A mRNA或蛋白表达的减少通过在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA处造成至少一种遗传修饰而实现。在另一方面,BCL11A mRNA或蛋白表达的减少通过在2号染色体上的所述细胞的基因组DNA处造成至少一种表观遗传修饰而实现。在另一方面,BCL11A mRNA或蛋白表达的减少通过在2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA处造成至少一种表观遗传修饰而实现。

本文所述的另一方面涉及用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括提供来自于哺乳动物的分离的人细胞或祖细胞,以及减少所述细胞中的BCL11A mRNA或蛋白表达。在一个方面,所述方法进一步包括选择需要增加其中的胎儿血红蛋白水平的哺乳动物。

本文所述的另一方面涉及用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:将所述哺乳动物的造血祖细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

本文所述的另一方面涉及用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:提供来自于哺乳动物的分离的人细胞或祖细胞或者分离的造血祖细胞群,将所述人细胞、或祖细胞、或造血祖细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

本文所提供的另一方面涉及用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括将本文所述的基因工程人细胞移植到所述哺乳动物中。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述方法进一步包括提供分离的细胞、或分离的祖细胞、或分离的细胞群,所述细胞可为祖细胞或造血祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的细胞为分离的祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的祖细胞为分离的人细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的人细胞为造血祖细胞。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述造血细胞为红系细胞谱系的细胞。分离造血祖细胞的方法在本领域中是众所周知的,例如,通过CD34+或CD133+细胞的流式细胞术纯化、与针对CD34或CD133的抗体缀合的微珠、造血祖细胞的标志物。市售试剂盒也是可用的,例如, Technology CD34微珠试剂盒,人;CD34MultiSort试剂盒,人;以及STEMCELLTMTechnology EasySepTM小鼠造血祖细胞富集试剂盒。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述人细胞为诱导多能干细胞(iPSC)。

在本文所述的这一方面和所有其它方面的另一实施方式中,本文所述的任何细胞的接触可为离体的、或体外的、或体内的。

在本文所述的这一方面和所有其它方面的另一实施方式中,本文所述的任何细胞的接触包括与药剂进行接触,所述药剂结合2号染色体上的所述细胞的基因组DNA,并在2号染色体上的所述细胞的基因组中产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。在一个实施方式中,所述表观遗传修饰位于2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上。

在本文所述的这一方面和所有其它方面的一个实施方式中,2号染色体上的所述细胞的基因组DNA中的所述至少一种表观遗传修饰间接地或直接地影响2号染色体的60,716,189-60,728,612位置。

本文所用的“间接地影响2号染色体的60,716,189-60,728,612位置”是指2号染色体上的所述细胞的基因组DNA中的表观遗传修饰对2号染色体的60,716,189-60,728,612位置的长距离作用。

在本文所述的这一方面和所有其它方面的另一实施方式中,本文所述的任何细胞的接触包括与药剂进行接触,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA,并在2号染色体上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。

在本文所述的这一方面和所有其它方面的另一实施方式中,本文所述的任何细胞的接触包括与有效量的组合物进行接触,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。

在本文所述的这一方面和所有其它方面的另一实施方式中,本文所述的任何细胞的接触包括与有效量的组合物进行接触,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。在一方面,所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

在本文所述的这一方面和所有其它方面的另一实施方式中,造血祖细胞、分离的人细胞或分离的细胞离体或在体外进行接触。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述至少一种遗传修饰为删除。在本文所述的这一方面和所有其它方面的另一实施方式中,所述至少一种表观遗传修饰为删除。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个组成。在另一实施方式中,所述删除由如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个组成。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述表观遗传修饰包括或影响如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个。本文所使用的短语“影响DNA酶1超敏感位点中的一个或多个”意思是这些DNA酶1超敏感位点(DHS)+62、+58和+55的天然功能降低,所述天然功能例如为接近转录因子或DNA降解酶(例如DNA酶I)。通常,DNA酶I超敏感位点(DHS)为对由DNA酶I进行的切割敏感的染色质区域。在基因组的这些特定区域中,染色质丧失其凝缩结构,使DNA暴露,并使其可接近。这提高了DNA被酶(例如DNA酶I)降解的有效性。这些可接近的染色质区域与转录活性功能性相关,因为这种重塑状态(remodeled state)对于蛋白(如转录因子)的结合是必需的。因此,与未用本文所公开的任何方法处理的对照细胞相比,本文所考虑的表观遗传修饰导致对DNA降解酶的接近降低,该降低为低至少5%、低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表2中所述的SNP标志物中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由表2中所述的SNP标志物中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除由表2中所述的SNP标志物中的一个或多个组成。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述表观遗传修饰包括或影响表2中所述的SNP标志物中的一个或多个。本文所使用的短语“影响SNP标志物中的一个或多个”意思是这些SNP的天然功能降低,所述天然功能例如为接近转录因子。例如,这些SNP的甲基化会使转录因子的结合降低,导致降低的BCL11A mRNA或蛋白表达。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表7中所列的片段中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由表7中所列的片段中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除由表7中所列的片段中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除为60,716,189至60,728,612、60,716,189至60,723,870、60,722,992至60,728,612、60,717,236至60,719,036、60,722,006至60,723,058、60,724,917至60,726,282、60,616,396至60,618,032、60,623,536至60,624,989、60,626,565至60,628,177、60,717,236至60,719,036、60,721,212至60,722,958、60,724,780至60,726,471、60,739,075至60,740,154、60,748,003至60,749,009、60,826,438至60,827,601、或60,831,589至60,833,556。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述表观遗传修饰包括或影响表7中所列的片段中的一个或多个。本文所使用的短语“影响表7中所列的片段中的一个或多个”意思是这些片段的天然功能降低,所述天然功能例如为接近转录因子。例如,这些片段的甲基化会使转录因子的结合降低,导致降低的BCL11A mRNA或蛋白表达。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述表观遗传修饰为60,716,189至60,728,612、60,716,189至60,723,870、60,722,992至60,728,612、60,717,236至60,719,036、60,722,006至60,723,058、60,724,917至60,726,282、60,616,396至60,618,032、60,623,536至60,624,989、60,626,565至60,628,177、60,717,236至60,719,036、60,721,212至60,722,958、60,724,780至60,726,471、60,739,075至60,740,154、60,748,003至60,749,009、60,826,438至60,827,601、或60,831,589至60,833,556。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除将2号染色体的60,716,189-60,728,612位置之间的整个区域移除,或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。本文所使用的术语“破坏”是指在包含一个或多个DNA酶1超敏感位点的破坏的细胞中BCL11A的红系细胞转录与不具有此类破坏的细胞相比减少至少10%(例如,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或甚至100%(即,无可检测的红系细胞转录))。在一个实施方式中,所述破坏包括修饰的DNA酶1超敏感位点不能结合至其天然转录因子(例如,GATA1和TAL1)。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述表观遗传修饰干扰2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的增强子区域处的表观遗传标记(epigenetic signature)的建立和/或维持,从而导致降低的BCL11A mRNA或蛋白表达,并使哺乳动物中的胎儿血红蛋白表达增加。

在本文所述的这一方面和所有其它方面的一个实施方式中,干扰2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)上的增强子区域处的表观遗传标记的建立和/或维持的表观遗传修饰包括但不限于影响DNA酶I敏感性的表观遗传修饰、影响组蛋白修饰的表观遗传修饰、影响GATA1/TAL1结合的表观遗传修饰、以及影响BCL11A的启动子的长距离启动子相互作用的表观遗传修饰。

例如,干扰2号染色体的60,716,189-60,728,612位置上的增强子区域处的表观遗传标记的建立和/或维持的表观遗传修饰包括但不限于2号染色体的60,716,189-60,728,612位置内的至少一种删除,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。例如,所述删除位于2号染色体的60,716,189-60,728,612位置上的DNA酶I敏感区域,例如,+62、+58和+55。所述删除可在+62、或+58、或+55、或它们的组合处。例如,在+62和+58处、+58和+55处、+62和+55处、或在+62、+58和+55全部三处。

作为另一实例,干扰2号染色体的60,716,189-60,728,612位置上的增强子区域处的表观遗传标记的建立和/或维持的表观遗传修饰包括但不限于2号染色体上的非60,716,189-60,728,612位置处的组蛋白修饰的改变,或者2号染色体上的60,716,189-60,728,612位置处的组蛋白修饰的改变,或者2号染色体上的非60,716,189-60,728,612位置以及60,716,189-60,728,612位置这二者处的组蛋白修饰的改变,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。

在另一实施方式中,干扰2号染色体的60,716,189-60,728,612位置上的增强子区域处的表观遗传标记的建立和/或维持的表观遗传修饰包括但不限于至少一种工程化特异性阻遏物(repressor)序列的插入,所述工程化特异性阻遏物序列的插入改变2号染色体的60,716,189-60,728,612位置上的非编码元件的表观遗传特征,并因此导致对靶基因表达的阻遏。首先特别关注在表观遗传学上阻遏各个增强子。换句话说,2号染色体中工程化特异性阻遏物序列的插入预计将干扰BCL11A红系细胞增强子处的表观遗传修饰,这最终导致降低的BCL11A基因表达。

可将本领域中已知的任何方法用于产生所考虑的表观遗传修饰,例如,如Mendenhall E.M.等,Nat.Biotechnol.,2013年9月8日以及Maeder ML等,Nat Biotechnol.,2013年10月9日(2013)中所述的方法。

在本文所述的这一方面和所有其它方面的一个实施方式中,2号染色体任何位置上的至少一种工程化特异性阻遏物序列的插入导致但不限于2号染色体的60,716,189-60,728,612位置处的DNA酶I敏感区域(例如,+62、+58和+55)减少;2号染色体的60,716,189-60,728,612位置上的组蛋白修饰增加;与2号染色体的60,716,189-60,728,612位置上的增强子区域的GATA1/TAL1的转录因子结合降低;以及2号染色体的60,716,189-60,728,612位置与BCL11A启动子之间的相互作用降低或削弱。

在本文所述的这一方面和所有其它方面的一个实施方式中,2号染色体任何位置上至少一种工程化特异性阻遏物序列的插入的整体作用为使BCL11A的mRNA和表达降低或减少。

在一些实施方式中,如在BCL11A的mRNA和表达、2号染色体的60,716,189-60,728,612位置或BCL11A增强子与BCL11A启动子之间的相互作用、以及与增强子区域的GATA1/TAL1结合的转录因子的情况下,文中所使用的术语“降低的(reduced)”或“减少的(decreased)”是指与对照情况(不存在本文所公开的表观遗传修饰或工程化序列的插入)相比,低至少5%、低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。细胞中BCL11A mRNA或蛋白表达的减少意味着与不具有本文所公开的表观遗传修饰或工程化序列的插入的对照细胞相比,蛋白表达低至少5%、低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。

在本文所述的这一方面和所有其它方面的一个实施方式中,至少一个工程化特异性阻遏物序列的插入发生在2号染色体的60,716,189-60,728,612位置的DNA酶I敏感区域(例如+62、+58以及+55)内。所述插入可在+62或+58或+55的5'端、或在+62或+58或+55的3'端、或在+62和+58之间、或在+58和+55之间、或在+55和+62之间。

在本文所述的这一方面和所有其它方面的一个实施方式中,至少一个工程化特异性阻遏物序列的插入使2号染色体的60,716,189-60,728,612位置的DNA酶I敏感区域改变。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述表观遗传修饰使2号染色体的60,716,189-60,728,612位置的DNA酶I敏感区域改变。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述表观遗传修饰使2号染色体的60,716,189-60,728,612位置上的组蛋白修饰改变。

在本文所述的这一方面和所有其它方面的一个实施方式中,至少一个工程化特异性阻遏物序列的插入使2号染色体的60,716,189-60,728,612位置上的组蛋白修饰改变。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述表观遗传修饰使2号染色体的60,716,189-60,728,612位置上的增强子区域的GATA1/TAL1结合改变,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。例如,转录因子与GATA1/TAL1的结合。

在本文所述的这一方面和所有其它方面的一个实施方式中,至少一个工程化特异性阻遏物序列的插入发生在本文所述的GATA1/TAL1内。所述插入可在GATA1或TAL1的5'端或3'端。所述插入可在GATA1和TAL1之间。所述插入改变了2号染色体的60,716,189-60,728,612位置上的增强子区域的GATA1/TAL1结合,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。例如,转录因子与GATA1/TAL1的结合。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述表观遗传修饰使BCL11A增强子与BCL11A启动子之间的相互作用改变。在一个实施方式中,所述相互作用被降低或削弱,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述表观遗传修饰使2号染色体60,716,189-60,728,612位置与BCL11A启动子之间的相互作用改变。在一个实施方式中,所述相互作用被降低或削弱,从而使得该区域的整体功能受到影响,由此使BCL11A的mRNA和表达降低或减少。

本文在另一方面还提供了在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上具有至少一种遗传修饰的分离的基因工程人细胞,所述至少一种遗传修饰通过将所述细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述分离的基因工程人细胞在2号染色体上的细胞基因组DNA处具有至少一种表观遗传修饰。在本文所述的这一方面和所有其它方面的另一实施方式中,所述分离的基因工程人细胞在2号染色体的60,716,189-60,728,612位置上的细胞基因组DNA处具有至少一种表观遗传修饰。

在任何具有至少一种表观遗传修饰的这些分离的基因工程人细胞的一些方面中,将所述细胞移植到哺乳动物中,用于增加该哺乳动物中的胎儿血红蛋白。

在本文所述的这一方面和所有其它方面的一个实施方式中,将在2号染色体的60,716,189-60,728,612位置上的细胞基因组DNA处具有至少一种遗传修饰的分离的基因工程人细胞移植到哺乳动物中,用于增加该哺乳动物中的胎儿血红蛋白。

在本文所述的这一方面和所有其它方面的一个实施方式中,将在2号染色体的60,716,189-60,728,612位置上的细胞基因组DNA处具有至少一种遗传修饰的分离的基因工程人细胞通过冷冻保存进行储存,供以后使用。

在任何具有至少一种表观遗传修饰的那些分离的基因工程人细胞的一些方面中,将所述细胞通过冷冻保存进行储存,供以后使用。

在本文所述的这一方面和所有其它方面的一个实施方式中,将在2号染色体的60,716,189-60,728,612位置上的细胞基因组DNA处具有至少一种遗传修饰的分离的基因工程人细胞冷冻保存、解冻并移植到哺乳动物中,用于增加该哺乳动物中的胎儿血红蛋白。

在任何具有至少一种表观遗传修饰的那些分离的基因工程人细胞的一些方面中,将所述细胞冷冻保存、解冻并移植到哺乳动物中,用于增加该哺乳动物中的胎儿血红蛋白。

本文所提供的另一方面涉及包含分离的基因工程人细胞的组合物,其中,所述细胞在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上具有至少一种遗传修饰,所述至少一种遗传修饰通过将所述细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

本文所提供的另一方面涉及包含分离的基因工程人细胞的组合物,其中,所述细胞在2号染色体上具有至少一种表观遗传修饰。在一个实施方式中,2号染色体上的所述至少一种表观遗传修饰位于60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)处。在另一实施方式中,2号染色体上的至少一种表观遗传修饰通过将细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体上在所述细胞的基因组DNA中产生至少一种表观遗传修饰,所述至少一种表观遗传修饰影响在其中产生所述表观遗传修饰的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述组合物使得接触的细胞中的胎儿血红蛋白mRNA或蛋白表达有所增加。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞对于在移植过程中作为细胞接受者的哺乳动物而言是自体的,即,所述组合物的细胞来源于或者收获自任何所述的修饰之前的该哺乳动物。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞对于在移植过程中作为细胞接受者的哺乳动物而言是非自体的,即,所述组合物的细胞并非来源于或者收获自任何所述的修饰之前的该哺乳动物。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞与在移植过程中作为细胞接受者的哺乳动物处于最小的HLA类型匹配。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的造血祖细胞。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的诱导多能干细胞。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个组成。在另一实施方式中,所述删除由如本文在实施例部分中所述的DNA酶1超敏感位点(DHS)+62、+58和+55中的一个或多个组成。在一个实施方式中,在基因组删除的情况中,本文所使用的术语“一部分/部分”是指定区域的至少10%至约100%。在其它实施方式中,删除的部分是指定区域的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或甚至100%。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表2中所述的SNP标志物中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由表2中所述的SNP标志物中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除由表2中所述的SNP标志物中的一个或多个组成。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除包括表7中所列的片段中的一个或多个。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除基本上由表7中所列的片段中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除由表7中所列的片段中的一个或多个组成。在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除为60,716,189至60,728,612、60,716,189至60,723,870、60,722,992至60,728,612、60,717,236至60,719,036、60,722,006至60,723,058、60,724,917至60,726,282、60,616,396至60,618,032、60,623,536至60,624,989、60,626,565至60,628,177、60,717,236至60,719,036、60,721,212至60,722,958、60,724,780至60,726,471、60,739,075至60,740,154、60,748,003至60,749,009、60,826,438至60,827,601、或60,831,589至60,833,556。

在本文所述的这一方面和所有其它方面的另一实施方式中,所述删除将2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)之间的整个区域移除,或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白的哺乳动物。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述哺乳动物已经被诊断为患有血红蛋白病。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述需要增加胎儿血红蛋白的哺乳动物已经被诊断为患有血红蛋白病。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述血红蛋白病为β-血红蛋白病。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述血红蛋白病为镰状细胞病。

在本文所述的这一方面和所有其它方面的一个实施方式中,所述血红蛋白病为β-地中海贫血。

在本文所述的这一方面和所有其它方面的一个实施方式中,将接触后的细胞、人细胞、造血祖细胞或其后代给予哺乳动物。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:在离体情况下提供来自于所述哺乳动物的分离的造血祖细胞群或造血干细胞群;以及将所述造血祖细胞群或造血干细胞群与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。在这一方法进一步的实施方式中,将接触后的具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群冷冻保存并储存,或者再引入至所述哺乳动物中。在另一实施方式中,将冷冻保存的具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群解冻,然后再引入至所述哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞可用本文所述的iPSC替代。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:从所述哺乳动物中分离造血祖细胞群或造血干细胞群;以及将所述造血祖细胞群或造血干细胞群与有效量的组合物离体进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。在这一方法进一步的实施方式中,将离体接触后的具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群冷冻保存并储存,或者再引入至所述哺乳动物中。在另一实施方式中,将冷冻保存的具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群解冻,然后再引入至所述哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞可用来源于所述哺乳动物的iPSC替代。在所述方法的任何实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白表达的哺乳动物。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:提供(分离)来自于所述哺乳动物的造血祖细胞群或造血干细胞群;以及将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。在这一方法进一步的实施方式中,将具有删除的基因组DNA且具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群冷冻保存并储存,或者再引入至所述哺乳动物中。在另一实施方式中,将具有删除的基因组DNA且具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群解冻,然后再引入至所述哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞可用本文所述的iPSC替代。在所述方法的任何实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是自体的,意思是所述细胞来源于同一哺乳动物。在所述方法的另一实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是非自体的,意思是所述细胞并非来源于同一哺乳动物,而是来源于相同物种的另一哺乳动物。例如,哺乳动物是人。在所述方法的任何实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白表达的哺乳动物。

在一个实施方式中,本公开提供了用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:从所述哺乳动物中分离造血祖细胞群或造血干细胞群;以及将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。在这一方法进一步的实施方式中,将具有删除的基因组DNA且具有增加的胎儿血红蛋白表达的造血祖细胞或干细胞群冷冻保存并储存,或者再引入至所述哺乳动物中。在另一实施方式中,将冷冻保存的具有增加的胎儿血红蛋白表达的造血祖细胞群或干细胞群解冻,然后再引入至所述哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞可用来源于所述哺乳动物的iPSC替代。在所述方法的任何实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白表达的哺乳动物。

在任何所述方法的一个实施方式中,所述方法进一步包括选择需要增加胎儿血红蛋白表达的哺乳动物。需要增加胎儿血红蛋白表达的示例性哺乳动物为已被诊断为患有血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)提供造血祖细胞或造血干细胞或iPSC;(b)将所述细胞与有效量的组合物离体或在体外进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在任何方法的一个实施方式中,可将步骤(b)后的细胞冷冻保存,直至需要将它们给予至哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是自体的,意思是所述细胞来源于同一哺乳动物。在所述方法的另一实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是非自体的,意思是所述细胞并非来源于同一哺乳动物,而是来源于相同物种的另一哺乳动物。例如,哺乳动物是人。

在任何所述方法的一个实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)从所述哺乳动物中分离造血祖细胞或造血干细胞;(b)将所述细胞与有效量的组合物离体或在体外进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,可将步骤(b)后的细胞冷冻保存,直至需要将它们给予至哺乳动物中。在所述方法的任何实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)提供造血祖细胞或造血干细胞或iPSC;(b)将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,可将步骤(b)后的细胞冷冻保存,直至需要将它们给予至哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是自体的,意思是所述细胞来源于同一哺乳动物。在所述方法的另一实施方式中,造血祖细胞或干细胞或iPSC对于哺乳动物而言是非自体的,意思是所述细胞并非来源于同一哺乳动物,而是来源于相同物种的另一哺乳动物。例如,哺乳动物是人。在所述方法的任何实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物中的血红蛋白病的方法,所述方法包括以下步骤:(a)从所述哺乳动物中分离造血祖细胞或造血干细胞;(b)将2号染色体的60,716,189-60,728,612位置上的所述细胞的基因组DNA离体删除,以在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加;以及(c)将步骤(b)的所述细胞给予至所述哺乳动物中。

在一个实施方式中,可将步骤(b)后的细胞冷冻保存,直至需要将它们给予至哺乳动物中。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物(例如人)中的血红蛋白病的方法,所述方法包括引入本文所述的组合物,所述组合物包含在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程细胞,由此所述哺乳动物中的胎儿血红蛋白表达有所增加。在这一方法进一步的实施方式中,所述方法包括化学疗法和/或放射疗法,以除去或降低哺乳动物中的内源造血祖细胞或干细胞。在所述方法的任何实施方式中,所述方法进一步包括选择需要治疗血红蛋白病的哺乳动物。

在一个实施方式中,本公开提供了用于治疗哺乳动物(例如人)中的血红蛋白病的方法,所述方法包括通过本文所述的方法增加所述哺乳动物中的胎儿血红蛋白表达。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为β-血红蛋白病。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为β-地中海贫血。

在任何所述治疗方法的任何实施方式中,所述血红蛋白病为镰状细胞贫血。

在任何所述方法的一个实施方式中,造血祖细胞、或干细胞、或iPSC对于哺乳动物而言是自体的,意思是所述细胞来源于同一哺乳动物。在任何所述方法的另一实施方式中,造血祖细胞、或干细胞、或iPSC对于哺乳动物而言是非自体的,意思是所述细胞并非来源于同一哺乳动物,而是来源于相同物种的另一哺乳动物。例如,哺乳动物为人。

在任何所述方法的一个实施方式中,本文所述的任何细胞的接触可为离体的、或体外的、或体内的。

在任何所述方法的另一实施方式中,本文所述的任何细胞的接触包括与药剂进行接触,所述药剂结合2号染色体上的所述细胞的基因组DNA,并在2号染色体上的所述细胞的基因组中产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。在一个实施方式中,所述表观遗传修饰位于2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上。

在任何所述方法的另一实施方式中,本文所述的任何细胞的接触包括与药剂进行接触,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA,并在2号染色体上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。

在任何所述方法的另一实施方式中,本文所述的任何细胞的接触包括与有效量的组合物进行接触,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。

在任何所述方法的另一实施方式中,本文所述的任何细胞的接触包括与有效量的组合物进行接触,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上产生表观遗传修饰,从而使BCL11A的mRNA或蛋白表达降低。在一方面,所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

在任何所述方法的另一实施方式中,造血祖细胞、分离的人细胞、或分离的细胞离体或在体外进行接触。

在任何所述方法的另一实施方式中,所述至少一种遗传修饰为删除。在本文所述的这一方面和所有其它方面的另一实施方式中,所述至少一种表观遗传修饰为删除。

在一个实施方式中,本文提供了结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的细胞基因组DNA的药剂的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,BCL11A的mRNA或蛋白表达有所降低。

在一个实施方式中,本文提供了有效量的至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体的组合物的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对细胞基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在一个实施方式中,本文提供了有效量的至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体的组合物的以下用途:用于增加哺乳动物中的胎儿血红蛋白、或用于治疗哺乳动物中的血红蛋白病、或用于降低BCL11A的mRNA或表达,其中,所述DNA靶向酶在2号染色体上在细胞基因组DNA中产生至少一种表观遗传修饰,从而影响BCL11A的mRNA或表达。在一个实施方式中,所述至少一种表观遗传修饰位于60,716,189-60,728,612位置处。在另一实施方式中,一种表观遗传修饰的作用为降低BCL11A的mRNA或蛋白表达。

在一个实施方式中,本文提供了本文所述的任何分离的细胞用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途。

在一个实施方式中,本文提供了包含分离的基因工程人细胞的组合物用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途,其中,所述细胞在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上具有至少一种遗传修饰,所述至少一种遗传修饰通过将所述细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

在一个实施方式中,本文提供了包含分离的基因工程人细胞的组合物用于增加哺乳动物中的胎儿血红蛋白或用于治疗哺乳动物中的血红蛋白病的用途,其中,所述细胞在2号染色体上具有至少一种表观遗传修饰。在一个实施方式中,2号染色体上的所述至少一种表观遗传修饰位于60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)处。在另一实施方式中,2号染色体上的至少一种表观遗传修饰通过将细胞与有效量的组合物进行接触的工序而得到,所述组合物至少包含DNA靶向酶或者携带有DNA靶向酶的编码序列的载体,其中,所述DNA靶向酶在2号染色体上在所述细胞的基因组DNA中产生至少一种表观遗传修饰,所述至少一种表观遗传修饰影响在其中产生所述表观遗传修饰的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg19人类基因组组装)。

在一个实施方式中,本文提供了本文所述的任何分离的细胞或本文所述的组合物中的任何一种在制造用于增加哺乳动物中的胎儿血红蛋白的药物或用于治疗哺乳动物中的血红蛋白病的药物中的用途。

在本文所述的组合物的用途的一个实施方式中,所述组合物使得接触的细胞中的胎儿血红蛋白mRNA或蛋白表达有所增加。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞对于在移植过程中作为细胞接受者的哺乳动物而言是自体的,即,所述组合物的细胞来源于或收获自任何所述的修饰之前的该哺乳动物。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞对于在移植过程中作为细胞接受者的哺乳动物而言是非自体的,即,所述组合物的细胞并非来源于或收获自任何所述的修饰之前的该哺乳动物。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞与在移植过程中作为细胞接受者的哺乳动物处于最小的HLA类型匹配。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的祖细胞。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的造血祖细胞。

在本文所述的组合物的用途的一个实施方式中,所述的任何组合物的细胞为任何所述的修饰之前的分离的诱导多能干细胞。

在本文所述的组合物的用途的一个实施方式中,在使用之前,将所述的任何组合物的细胞冷冻保存。

已知在BCL11A处存在HbF相关的变异(HbF-associated variations)。已在欧洲、非洲和亚洲血统的个体中进行了HbF水平的六个GWAS(或高度相关的特性F细胞(trait F-cell)数),各自识别出BCL11A内的特性相关变体(7-12)。与SCD和β-地中海贫血的临床严重程度有关的是相同的变体(9、10、50),这与HbF作为这些病症的主要调节物相一致。据估计,BCL11A处的变异解释了HbF水平中约15%的特性变异(7、12、43)。四种不同的SNP已被鉴定为与所述特性最高度相关(rs1427407(7)、rs11886868(8)、rs4671393(9)和rs766432(10-12));这些前哨SNP在BCL11A内含子-2中聚集于彼此的3kb内(图2A和图11B)。比起任何单个的SNP,包含前哨SNP的单倍型似乎更好地解释了HbF相关性(12、43)。BCL11A基因座处的50个SNP和内含子-2内的27个SNP与HbF水平相关,具有全基因组显著性(P<5×10-8)。尽管付出了大规模再测序(resequencing)的努力,尚未描述BCL11A的编码变体(43)。

此前,发明人使用CSSCD对BCL11A基因座处与HbF相关的信号进行精细定位,并报道了与rs4671393具有强相关性(43)。在该项研究中,估算出rs1427407。在以前的研究中,还识别出另外两个SNP(rs766432和rs11886868)为最高度特性相关的前哨SNP(8、10、11、51)。在其中所有四个前哨SNP处的基因型均可得的个体的子集(n=728)中,在rs1427407处进行基因型条件分析(conditioning on genotypes)后,rs4671393、rs766432和rs11886868的相关性结果均不显著;相反,在rs4671393、rs766432或rs11886868上进行条件分析后,rs1427407的相关性仍高度显著(表4)。因此,rs1427407是红系细胞DHS内与HbF水平最强相关的SNP,并且,比起其它此前描述的前哨SNP,它更好地解释了特性相关性。

条件分析证明在rs1427407上进行条件分析后仍保持显著的相关性。最显著的残差相关性(residual association)在DHS+55中是关于rs7606173(P=9.66×10-11);在DHS+62中是关于rs7599488(P=2.43×10-10)(之前已有报道(43),显著性仅是略低)(表1)。三个DHS内的罕见DNA序列变体的分析没有产生额外的独立的HbF相关信号(表5)。

本发明人发现,等位基因特异性转录因子(TF)结合与BCL11A表达有关。使用信息丰富(informative)的杂合子进行等位基因特异性生化研究,以控制样品之间的反式作用差异,并确保两个等位基因具有相等的丰度,这由成对gDNA中等位基因相等的表现度(representation)得到证实(图2B和图2C)。在DHS+62处的GATA1和TAL1结合峰的中心处直接找到rs1427407(图2B)。在所进行的ChIP分析中,将染色质超声处理成约500bp的片段。对用于ChIP-qPCR的五个原代人红系细胞前体样品(就rs1427407而言为杂合的)在红系细胞DHS处进行Sanger测序。在任何这些样品中,在rs1427407的500bp内唯一的其它杂合SNP是rs7599488(距rs1427407 3'304bp),其仅在五个样品的两个中是杂合的。这个SNP未落入GATA1或TAL1结合基序内。因此,DHS+62内的另一SNP似乎不太可能解释所观察到的等位基因特异性TF结合。

此外,本发明人发现,BCL11A表达和HbF水平之间存在相关性。本发明人的研究提供了对可能导致HbF水平在临床意义上增加的BCL11A表达中的变化的评估。先前报道了在有限的一组人的类淋巴母细胞细胞系中,与高HbF相关的等位基因rs4671393与降低的BCL11A表达存在相关性(13)。将这些实验扩展至基因分型的细胞系的较大集合中却并未证实这一观察结果。因此,本发明人发现,在红系细胞特异性的情况中,与HbF相关的rs1427407-rs7606173单倍型影响BCL11A表达,这是与DNA酶I敏感性发现相一致的可能性。在原代红系细胞前体中,BCL11A mRNA的表达在高HbF的rs1427407-rs7606173T-G单倍型和低HbF的G-C单倍型之间相差1.7倍(图3B);相应地,在T-G和G-C纯合子中的中位(median)HbF水平分别为10.6%和3.1%(图3C)。值得注意的是,在就rs1427407-rs7606173单倍型而言为杂合的细胞中观察到了表明在原代人红系细胞中BCL11A呈等位基因特异性表达的结果,因此,对BCL11A表达的适度影响反映了单倍型内的所有功能SNP的组合作用。虽然保护性BCL11A单倍型的遗传在群体基础上是临床有益的(9、10、50),T-G纯合子中HbF的平均水平仍然低于防止SCD发病所需的水平。然而,HbF水平对BCL11A表达的敏感性预测出疾病严重程度的缓解可能只需要适度地进一步降低BCL11A表达。

本发明人进一步研究了珠蛋白基因和BCL11A的发育调控。在人类发育期间,在头三个月中卵黄囊来源的ε-珠蛋白被胎儿肝来源的γ-珠蛋白取代。出生后,由于红细胞生成(erythropoiesis)从肝脏转移至骨髓,γ-珠蛋白逐渐沉默,β-珠蛋白占主导。小鼠个体发生(ontogeny)中仅出现一次珠蛋白基因表达的转换。在发生在妊娠中期的这一转变期间,循环的卵黄囊来源的原始红细胞(primitive erythrocytes)表达胚胎阶段的珠蛋白εy和βH1,而胎儿肝脏次级成红细胞(definitive erythroblasts)表达成体阶段的珠蛋白β1和β2。与这一发育转换相协调的是,BCL11A在次级红系细胞谱系而非原始阶段的红系细胞谱系中表达,并为珠蛋白基因表达的变化所需要(16、52)。

在10.5dpc的稳定转基因BCL11A+52.0-64.4报告子品系中,仅在胎儿肝原基(primordium)中观察到lacZ表达,而在卵黄囊、胎盘或胚胎的循环血液中并未观察到(图6A)。这些结果加上lacZ在12.5dpc的次级胎儿肝脏成红细胞而非卵黄囊来源的原始循环红细胞中表达的这一发现(图4B),表明了BCL11A复合(composite)增强子序列与内源珠蛋白基因转换相协调地、以发育特异性模式来驱动表达。

生成了一系列删除突变体以细化红系细胞增强子活性所需的最小元件。含有中央+58DHS的序列对于红系细胞增强子活性是足够的。仅含有侧翼+62或+55元件的那些序列不能指导红系细胞基因表达(图6B)。为了测试DHS在原代人红系细胞前体中增强基因表达的能力,我们使用了如前所述的GFP报告子系统的慢病毒递送(39)。类似地,在这个报告子分析中,+58DHS使基因表达增强(图7)。

本发明人决定生产具有Bcl11a增强子删除的细胞系,以研究对于BCL11A表达所需的增强子。生成了将增强子破坏的稳定红系细胞的细胞。因为没有合适的成体阶段的人红系细胞细胞系,作为原理求证,本发明人转向鼠体系。小鼠红白血病(MEL)细胞依赖于BCL11A来进行成体阶段模式的珠蛋白基因表达(14)。本发明人识别出小鼠Bcl11a内含子-2处的直系同源红系细胞复合增强子。像人GWAS标出的内含子-2BCL11A增强子一样,这些序列具有一系列红系细胞特异性DHS。此外,这些序列被H3K4me1和H3K27ac修饰,并缺乏H3K4me3和H3K27me3,并且在小鼠红系细胞染色质中被GATA1和TAL1所占用(图8)。已证明,包含一系列相邻DHS的复合调控元件对于许多基因座处的基因表达非常关键,其中包括β-珠蛋白控制区域、α-珠蛋白的多物种保守序列和IgH调控区域(53-55)。我们观察到复合增强子的物种特异性的独特特征。例如,本发明人识别出对应于三个人DHS+62、+58和+55各自的小鼠保守序列,并发现在+62和+55保守序列处具有红系细胞DNA酶I超敏感性,然而+58保守序列不具有DNA酶I超敏感性。

PCR和Southern印迹证实在三个独立的MEL克隆和两个独立的前B淋巴细胞克隆中Bcl11a的+50.4-60.4kb内含子区段的删去(图9)。Sanger测序的断点(breakpoints)是具有后续NHEJ修复的TALEN介导的切割的特征(图10)。在删除该内含子区段的情况下,我们使用对位于该删除上游、跨越该删除、或位于该删除下游的外显子连接(exon junctions)进行检测的引物对,通过RT-qPCR观察到在MEL细胞克隆中BCL11A转录本显著降低(图5A)。

定义

为了方便起见,这里收集了在整个申请(包括说明书、实施例以及所附的权利要求书)中所使用到的某些术语。除非另有定义,本文使用的所有技术术语和科学术语具有与本发明所属技术领域的普通技术人员通常所理解的含义相同的含义。

本文所使用的短语“结合2号染色体的60,716,189-60,728,612位置上的细胞基因组DNA的药剂”是指能够结合至基因组DNA内的位置(例如,2号染色体的60,716,189-60,728,612位置)的小分子、核酸、蛋白、肽或寡核苷酸,并且,相比未用此类药剂处理的细胞中的BCL11A mRNA或蛋白水平,此类药剂将细胞中的BCL11A mRNA或蛋白表达抑制了至少20%。在一个实施方式中,“干扰BCL11A与BCL11A结合伴侣的相互作用”的药剂作为这样的短语在本文中使用。

本文所使用的术语“小分子”是指化学药剂,包括但不限于肽、肽模拟物(peptidomimetics)、氨基酸、氨基酸类似物、多核苷酸、多核苷酸类似物、适体(aptamers)、核苷酸、核苷酸类似物、分子量小于约10,000克/摩尔的有机化合物或无机化合物(即,包括杂有机(heteroorganic)化合物和有机金属化合物);分子量小于约5,000克/摩尔的有机化合物或无机化合物;分子量小于约1,000克/摩尔的有机化合物或无机化合物;分子量小于约500克/摩尔的有机化合物或无机化合物;以及此类化合物的盐、酯和其它药学上可接受的形式。

本文所述的“核酸”可为RNA或DNA,并可为单链的或双链的,并例如可选自于包括以下物质的组:编码感兴趣的蛋白的核酸、寡核苷酸、核酸类似物,例如肽核酸(PNA)、伪互补PNA(pseudo-complementary PNA,pc-PNA)、锁核酸(locked nucleic acid,LNA)等。例如,此类核酸序列包括但不限于编码蛋白(例如,用作转录阻遏物的蛋白)的核酸序列、反义分子、核酶、小抑制核酸序列,例如但不限于RNAi、shRNAi、siRNA、微RNAi(mRNAi)、反义寡核苷酸等。

“干扰BCL11A与BCL11A结合伴侣的相互作用”是指相比不存在BCL11A抑制剂的可比的对照群,用BCL11A抑制剂处理的群中BCL11A与BCL11A结合伴侣的相互作用的量低至少5%。优选地,相比未添加BCL11A抑制剂的可比的对照处理群,BCL11A抑制剂处理的群中BCL11A与BCL11A结合伴侣的相互作用的量低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。最低限度地,可使用本领域的技术标准,通过对结合至BCL11A结合伴侣的BCL11A的量进行测定来对BCL11A相互作用进行分析,所述技术标准包括但不限于质谱法、免疫沉淀或凝胶过滤分析。可替代地或另外地,可通过以下方式对BCL11A活性进行分析:在用候选BCL11A抑制剂进行处理后,在mRNA或蛋白质水平上对胎儿血红蛋白表达进行测量。

在一个实施方式中,BCL11A活性为BCL11A与它的以下结合伴侣的相互作用:GATA-1、FOG-1、NuRD复合物的成分、基质蛋白-3(matrin-3)、MTA2和RBBP7。因此,可阻断这种相互作用的任何抗体或其片段、小分子、化学品或化合物均被认为是BCL11A活性的抑制剂。

本文所使用的术语“基因工程细胞”是指包含至少一种遗传修饰的细胞,如该术语在本文中使用时。

本文所使用的术语“遗传修饰”是指导致细胞中BCL11A表达或活性减少的基因组水平的破坏。示例性的遗传修饰可包括删除、移码突变、点突变、外显子去除、一个或多个DNA酶1超敏感位点(DHS)(例如,2个、3个、4个或更多个DHS区域)的去除等。

“抑制BCL11A表达”意思是相比不存在DNA靶向核酸内切酶的可比的对照细胞或细胞群,用DNA靶向核酸内切酶处理的细胞或细胞群中BCL11A的表达量低至少5%。优选地,相比未添加DNA靶向核酸内切酶的可比的对照处理群,在经处理的群中BCL11A表达的百分比低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。

“抑制BCL11A活性”意思是相比不存在DNA靶向核酸内切酶的可比的对照细胞或细胞群,用本文所述的方法处理的细胞或细胞群中BCL11A的功能活性的量低至少5%。优选地,相比未添加DNA靶向核酸内切酶的可比的对照处理群,BCL11A抑制剂处理的群中BCL11A活性的百分比低至少10%、低至少20%、低至少30%、低至少40%、低至少50%、低至少60%、低至少70%、低至少80%、低至少90%、低至少1倍、低至少2倍、低至少5倍、低至少10倍、低至少100倍、低至少1000倍或低更多。最低限度地,可使用本领域的技术标准,通过对蛋白或mRNA水平上的BCL11A表达量进行测定,来对BCL11A活性进行分析。可替代地或另外地,可使用报告子构建体对BCL11A活性进行测定,其中,所述报告子构建体对BCL11A活性敏感。γ-珠蛋白基因座序列由BCL11A构建体的核酸结合基序识别。

在一个实施方式中,本文所使用的术语“DNA靶向核酸内切酶”是指在基因组的期望位置(例如,2号染色体的60,716,189-60,728,612位置)处生成双链断裂且不产生不期望的脱靶(off-target)双链断裂的核酸内切酶。DNA靶向核酸内切酶可以是天然存在的核酸内切酶(例如,细菌大范围核酸酶(meganuclease));或者,DNA靶向核酸内切酶可以是人工生成的(例如,工程化的大范围核酸酶、TALEN或ZFN)。

在另一实施方式中,本文所使用的术语“DNA靶向核酸内切酶”是指在基因组的期望位置(例如,2号染色体的60,716,189-60,728,612位置)处生成单链断裂或“缺刻(nick)”或DNA磷酸糖骨架的一条链上的断裂且不产生不期望的脱靶DNA链断裂的核酸内切酶。

本文所使用的术语“载体”是指能够运送与其连结的另外的核酸的核酸分子。载体的一种类型是“质粒(plasmid)”,指的是其中可连接另外的核酸片段的环状双链DNA环。载体的另一种类型是病毒载体,其中,可将另外的核酸片段连接至病毒基因组中。某些载体能够在其所导入的宿主细胞中自主复制(例如,具有细菌复制起始位点的细菌载体和附加型哺乳动物载体(episomal mammalian vectors))。在导入至宿主细胞时,其它载体(例如,非附加型哺乳动物载体)整合至宿主细胞的基因组中,从而随着宿主基因组一起进行复制。此外,某些载体能够指导与其可操作地连结的基因的表达。在本文中此类载体被称为“重组表达载体”,或更简单而言被称为“表达载体”。通常,重组DNA技术中使用的表达载体通常处于质粒的形式。在本说明书中,因为质粒是载体最常用的形式,“质粒”和“载体”可以互换使用。然而,本文所述的方法和组合物可包括提供等同功能的其它形式的表达载体,例如病毒载体(例如,复制缺陷型逆转录病毒、慢病毒、腺病毒和腺相关病毒)。

在表达载体中,“可操作地连结(operably linked)”意在指以允许核苷酸序列表达的方式(例如,在体外转录/翻译系统中或当将载体导入至靶细胞时的靶细胞中),将感兴趣的核苷酸序列连结至调控序列。术语“调控序列”意在包括启动子、增强子和其它表达控制元件(例如,多腺苷酸化信号)。此类调控序列描述于例如Goeddel;Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)中。调控序列包括在多种类型的宿主细胞中指导核苷酸序列组成型表达的调控序列,以及仅在某些宿主细胞中指导核苷酸序列表达的调控序列(例如,组织特异性调控序列)。此外,可通过包含以特定时间间隔或在特定时间段内指导DNA靶向核酸内切酶合成的调控序列的载体的方式对该DNA靶向核酸内切酶进行递送。将为本领域技术人员所理解的是,表达载体的设计可取决于诸如靶细胞的选择、所需的表达水平等因素。

本文所使用的术语“切割(cleaves)”通常是指在期望位置处的DNA基因组中生成双链断裂。

本文所使用的术语“至少包含DNA靶向核酸内切酶的组合物的有效量”是指产生足以在基因组的期望位置生成双链断裂的核酸内切酶活性的DNA靶向核酸内切酶的量。在一个实施方式中,有效量的DNA靶向核酸内切酶在与该组合物接触的群的至少20%的细胞中的期望基因座处生成双链断裂(例如,群中至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或甚至100%的细胞含有由DNA靶向核酸内切酶组合物产生的遗传修饰)。

本文所使用的术语在细胞中“增加胎儿血红蛋白水平”表示相比不存在药剂的可比的对照群,用药剂处理的群中胎儿血红蛋白高至少5%,所述药剂通过结合至2号染色体的60,716,189-60,728,612位置处的基因组DNA而对BCL11A mRNA或蛋白表达造成破坏(例如,DNA靶向核酸内切酶)。优选地,相比可比尺寸和培养条件的对照处理群,用结合2号染色体的60,716,189-60,728,612位置处的基因组DNA的此类药剂处理的群中胎儿血红蛋白表达的百分比高至少10%、高至少20%、高至少30%、高至少40%、高至少50%、高至少60%、高至少70%、高至少80%、高至少90%、高至少1倍、高至少2倍、高至少5倍、高至少10倍、高至少100倍、高至少1000倍或高更多。术语“对照处理群”在本文中用于描述除了未添加结合2号染色体的60,716,189-60,728,612位置处的基因组DNA的药剂这一例外,用相同的培养基、病毒诱导、核酸序列、温度、汇合、烧瓶尺寸、pH等处理的细胞群。在一个实施方式中,可使用本领域中已知的任何方法来对胎儿血红蛋白表达的增加进行测量,例如,胎儿γ-珠蛋白的蛋白质印迹分析以及对胎儿γ-珠蛋白的mRNA进行定量。

本文所使用的术语“分离的细胞”是指从最初被发现的有机体中移除的细胞,或此类细胞的后代。任选地,该细胞已在体外培养,例如在其它细胞的存在下培养。任选地,该细胞随后被引入第二有机体,或将该细胞(或起源于该细胞的细胞)重新引入到从中分离出它的有机体中。

对于分离的细胞群,本文所使用的术语“分离的群”是指已被移除并从混合或非均质细胞群分离的细胞群。在一些实施方式中,所述分离的群与非均质群(从中分离或富集细胞)相比是实质上纯的细胞群。在一些实施方式中,所述分离的群是分离的人造血祖细胞群,例如,与包含人造血祖细胞和作为人造血祖细胞来源的细胞的非均质细胞群相比实质上纯的人造血祖细胞群。

关于特定的细胞群,术语“实质上纯”是指就构成总细胞群的细胞而言至少约75%、优选至少约85%、更优选至少约90%、且最优选至少约95%纯的细胞群。另外,对于造血祖细胞群,术语“实质上纯”或“基本上纯化的”是指包含少于约20%,更优选少于约15%、10%、8%、7%,最优选少于约5%、4%、3%、2%、1%,或少于1%的不是本文的术语所定义的造血祖细胞的细胞的细胞群。

本文所使用的术语“治疗”包括降低或减轻病症、疾病或紊乱的至少一种不良影响或症状。例如,术语“治疗(treating/treatment)”是指给予受试者有效量的组合物(例如,有效量的包含造血祖细胞群的组合物),以使该受试者在疾病的至少一种症状方面有所降低或疾病有所改善(例如,有益的或期望的临床结果)。为了本公开的目的,有益的或期望的临床结果包括但不限于:减轻一种或多种症状、降低疾病程度、稳定疾病(例如,不恶化)、延迟或延缓疾病进展、改善或缓和疾病状态、以及缓解(无论是部分还是全部),无论是可检测的还是不可检测的。在一些实施方式中,治疗可以是指与未接受治疗的情况下的预期生存期相比而言延长了生存期。因此,本领域技术人员了解治疗可以改善疾病状况,但可能不能完全治愈所述疾病。在一些实施方式中,治疗可包括预防。然而,在替代的实施方式中,治疗不包括预防。

短语“药学上可接受的”在本文中用来指在健全的(sound)医学判断范围内,适合用于与人类和动物组织相接触而无过度的毒性、刺激、过敏反应或其它问题或并发症(complication),具有合理的利益/风险比的化合物、材料、组合物和/或剂型。

当涉及组合物、载体、稀释剂和试剂时,本文所使用的术语“药学上可接受的”、“生理上可耐受的”及它们的语法变体可互换使用,并表示该材料能够给予至哺乳动物或施用在哺乳动物上而不产生不期望的生理效应(如恶心、眩晕、胃不适等)。药学上可接受的载体不会促使引发针对与其混合的药剂的免疫应答,除非希望如此。包含溶解或分散于其中的活性成分的药物组合物的制备/制剂在本领域中是众所周知的,并且不必根据配方(formulation)作出限制。通常,可将此类组合物制备为可注射的液体溶液剂或混悬剂,然而,也可以制备适于在使用前在液体中形成溶液剂或混悬剂的固体形式。也可以将制剂乳化为脂质体组合物或以脂质体组合物提供。可以将活性成分与药学上可接受的并与该活性成分相容的赋形剂以适合用于本文所述的治疗方法的量相混合。合适的赋形剂例如为水、盐水、葡聚糖、甘油、乙醇等以及它们的组合。此外,如果需要的话,组合物可以包含增强活性成分效力的少量辅助物质,例如,润湿剂或乳化剂、pH缓冲剂等。本发明的治疗组合物可包含其中的组分的药学上可接受的盐。药学上可接受的盐包括与无机酸(例如盐酸或磷酸)或有机酸(例如乙酸、酒石酸、扁桃酸等)形成的酸加成盐(与多肽的游离氨基形成的盐)。与游离羧基形成的盐也可以衍生自无机碱(例如钠、钾、铵、钙或铁的氢氧化物)和有机碱(如异丙胺、三甲胺、2-乙氨基乙醇、组氨酸、普鲁卡因等)。生理上可耐受的载体在本领域中是众所周知的。示例性液体载体是不包含除活性成分和水以外的物质的无菌水溶液,或是含有缓冲剂(例如处于生理pH值的磷酸钠)、生理盐水或这两者(例如磷酸盐缓冲盐水)的无菌水溶液。更进一步而言,水性载体可以含有多于一种的缓冲盐,以及盐(例如氯化钠和氯化钾)、葡聚糖、聚乙二醇和其它溶质。液体组合物还可以在水的基础之上和在排除水的情况下包含液相。示例性的此类另外的液相为甘油、植物油(如棉籽油)和水-油乳剂。本文所述的方法中使用的活性药剂的量(所述活性药剂将在特定紊乱或病症的治疗中有效)将取决于所述紊乱或病症的性质,并可以通过标准临床技术来确定。

在用于提及疾病、紊乱或其症状时,本文所使用的“预防(prevention/preventing)”是指降低个体发展成疾病或紊乱(例如,血红蛋白病)的可能性。例如,当具有疾病或紊乱的一个或多个风险因素的个体并未发展成所述病症;或者从统计学角度看,相对于具有相同风险因素且未接受本文所述的治疗的群体,这些个体在较晚的时间或以较轻的严重程度发展成此类疾病或紊乱时,则发展成疾病或紊乱的可能性降低。未发展出疾病的症状、或者症状发展降低(例如,用于所述疾病或紊乱的临床上接受的评分降低至少10%)或延迟(例如,延迟数天、数周、数月或数年)均被认为是有效的预防。

关于将细胞与DNA靶向核酸内切酶进行接触以减少BCL11A表达,短语“增加细胞中的胎儿血红蛋白水平”表示相比不存在DNA靶向核酸内切酶的可比的对照群,用DNA靶向核酸内切酶处理的细胞或细胞群中的细胞或细胞群中的胎儿血红蛋白高至少5%。优选地,相比可比的对照处理群,DNA靶向核酸内切酶处理的细胞中的胎儿血红蛋白表达高至少10%、高至少20%、高至少30%、高至少40%、高至少50%、高至少60%、高至少70%、高至少80%、高至少90%、高至少1倍、高至少2倍、高至少5倍、高至少10倍、高至少100倍、高至少1000倍或高更多。术语“对照处理群”在本文中用来描述除了未添加BCL11A抑制剂这一例外,用相同的培养基、病毒诱导、核酸序列、温度、汇合、烧瓶尺寸、pH等处理的细胞群。

术语“哺乳动物”意在涵盖单数的“哺乳动物”和复数的“哺乳动物”,并包括但不限于人;灵长类动物,如猿(apes)、猴、猩猩(orangutans)和黑猩猩;犬科动物,如狗和狼;猫科动物,如猫、狮子和老虎;马科动物,如马、驴和斑马;食用动物,如牛、猪和羊(sheep);有蹄类动物,如鹿和长颈鹿;啮齿动物,如小鼠、大鼠、仓鼠和豚鼠;以及熊。在一些优选的实施方式中,哺乳动物是人。

因此,在一个实施方式中,所述哺乳动物已被诊断为患有血红蛋白病。在进一步的实施方式中,所述血红蛋白病为β-血红蛋白病。在一个优选的实施方式中,所述血红蛋白病为镰状细胞病。本文所使用的“镰状细胞病”可为镰状细胞贫血、镰状-血红蛋白C病(HbSC)、镰状β+地中海贫血(HbS/β+)、或镰状β0地中海贫血(HBS/β0)。在另一个优选的实施方式中,所述血红蛋白病是β-地中海贫血。

本文所使用的术语“血红蛋白病”意思是指在个体的任何血红蛋白的结构或功能方面的任何缺陷,包括由任何突变所造成的血红蛋白的一级结构、二级结构、三级结构或四级结构中的缺陷,所述突变例如为β-珠蛋白基因的编码区域中的删除突变或取代突变,或使得所产生的血红蛋白量与正常或标准状况相比有所降低的此类基因的启动子或增强子中的突变或删除。该术语进一步包括由外部因素(如疾病、化学疗法、毒素、毒物等)引起的在血红蛋白的量或有效性方面的任何减少,无论上述情况是正常的还是异常的。

在一个实施方式中,本文所使用的术语“有效量”是指安全且足以治疗血红蛋白病、减少血红蛋白病的可能性、或延迟血红蛋白病发展的细胞组合物的量。因此,该量可以治愈血红蛋白病的症状或使血红蛋白病的症状有所改善、延缓血红蛋白病的疾病进展过程、延缓或抑制血红蛋白病的症状、延缓或抑制血红蛋白病继发症状的建立、或者抑制血红蛋白病继发症状的发展。治疗血红蛋白病的有效量取决于待治疗的血红蛋白病的类型、症状的严重程度、所治疗的受试者、受试者的年龄和总体状况、给药方式等。因此,不可能规定精确的“有效量”,或者规定精确的“有效量”是不明智的。然而,对于任何给定情况,适当的“有效量”可由本领域普通技术人员仅使用常规实验来确定。

本文所使用的术语“包含/包括/含有(comprising或comprises)”用于涉及对本发明必要的组合物、方法及其各自的组成部分,并且无论是否必要都仍然对未指定的要素保持开放。

本文所使用的术语“基本上由…组成”涉及给定的实施方式所需的那些元素。该术语允许存在实质上不影响本发明实施方式的基础和新颖性或起作用的特征的额外元素。

术语“由…组成”涉及本文所述的组合物、方法及其各自的组成部分,排除没有在实施方式的描述中详述的任何元素。

除非上下文明确地另有所指,在本说明书和所附权利要求书中使用的单数形式“一(a/an)”和“该/所述(the)”涵盖复数的所指物。因此,例如,提及“所述/该方法”时包括一种或多种本文所述的方法和/或步骤类型和/或阅读本公开后对本领域技术人员而言变得显而易见的方法和/步骤类型等。应当理解的是,前面的详细描述和下面的实施例仅是说明性的,并不应被理解为对本发明范围的限制。在不脱离本发明的精神和范围的前提下可以对所公开的实施方式进行各种改变和修改,这对于本领域技术人员而言将是显而易见的。另外,出于描述和公开的目的,以引用的方式将标明的所有专利、专利申请和出版物明确地并入本文,例如在此类出版物中描述的可用于本发明的方法学。这些出版物仅仅由于它们的公开早于本申请的申请日而提供。在这一方面不应当视作承认本发明人没有权利借助于先前的发明或因为任何其它原因而将公开的内容提前。所有关于这些文件的日期的声明或这些文件的内容的表述是基于申请人可得的信息,并且不构成关于这些文件的日期或这些文件的内容的正确性的任何承认。

血红蛋白病

胎儿血红蛋白(HbF)是两个成体α-珠蛋白多肽和两个胎儿β样γ-珠蛋白多肽的四聚体。妊娠期间,重复的γ-珠蛋白基因构成β-珠蛋白基因座所转录的主要基因。出生后,γ-珠蛋白被成体β-珠蛋白逐步取代,该过程被称为“胎儿转换”(3)。这一转换的根本分子机制仍然很不明确,并一直是集中研究的课题。从主要产生胎儿血红蛋白或HbF(α2γ2)到产生成体血红蛋白或HbA(α2β2)的发育转换起始于妊娠的约28-34周,并在出生后短暂地持续,此时HbA成为主导。这种转换主要是由γ-珠蛋白基因转录的减少以及β-珠蛋白基因转录的增加而引起。尽管在健康成体中的残留HbF水平具有超过20倍的差异,但通常正常成体的血液中仅含有约2%的HbF(Atweh,Semin.Hematol.38(4):367-73(2001))。

血红蛋白病涵盖了许多种基因起因的贫血,其中,存在有减少的红血细胞(RBC)产生和/或增加的红血细胞破坏(溶血)。这些紊乱还包括导致伴随有保持氧浓度的能力受损的异常血红蛋白产生的遗传缺陷。一些此类紊乱包括不能产生足够量的正常β-珠蛋白,而另一些紊乱包括完全不能产生正常β-珠蛋白。与β-珠蛋白特异性相关的这些紊乱通常被称作β-血红蛋白病。例如,β-地中海贫血症由(导致有缺陷的HbA或使HbA缺失的)β-珠蛋白基因表达的部分缺陷或完全缺陷造成。镰状细胞贫血由(导致异常(镰状)血红蛋白(HbS)产生的)β-珠蛋白结构基因中的点突变造成。HbS RBC比正常RBC更脆弱,并且更容易发生溶血,最终导致贫血(Atweh,Semin.Hematol.38(4):367-73(2001))。此外,一种BCL11A遗传变体(HBS1L-MYB变异)的存在改善了β-地中海贫血的临床严重程度。已经证明这种变体与HbF水平有关。已经证明高HbF变体具有较低严重程度的β-地中海贫血的优势比(odds ratio)为5(Galanello S.等,2009,Blood,出版中)。

旨在降低患有β-血红蛋白病的患者中的珠蛋白链失衡的治疗研究已集中在胎儿血红蛋白(α2γ2;HbF)的药理学操控上。此类方法的重要治疗潜力由以下结果所暗示:对具有纯合的β-地中海贫血和遗传性胎儿血红蛋白持续存在症(HPFH)的共遗传的个体的轻度表型的观察结果;以及在胎儿血红蛋白浓度增加的情况下观察到无成体血红蛋白合成并具有纯合的β-地中海贫血的那些患者却具有降低的输血需求。此外,已观察到具有β链异常的成体患者的特定群体的胎儿血红蛋白(HbF)水平高于正常水平,并且已经观察到相比具有正常成体HbF水平的患者,该特定群体具有较轻微的疾病临床过程。例如,表达了20%-30%HbF的沙特阿拉伯镰状细胞贫血患者组仅具有轻微的疾病临床表现(Pembrey等,Br.J.Haematol.40:415-429(1978))。现在认可了β-血红蛋白病(如镰状细胞贫血和β-地中海贫血)通过增加HbF的产生而得到改善(详述于Jane和Cunningham Br.J.Haematol.102:415-422(1998)以及Bunn,N.Engl.J.Med.328:129-131(1993)中)。

尽管控制从γ-珠蛋白基因表达到β-珠蛋白基因表达的体内发育转换的分子机制目前尚未知晓,但有越来越多的证据表明,外部因素可影响γ-珠蛋白基因表达。发现的具有HbF再活化活性的第一组化合物是细胞毒性药物。通过药理学操控引起HbF重新合成的能力首次是使用5-氮杂胞苷在实验动物中证明的(DeSimone,Proc Natl Acad Sci U S A.79(14):4428-31(1982))。随后的研究证实了5-氮杂胞苷能够在患有β-地中海贫血和镰状细胞病的患者中增加HbF(Ley等,N.Engl.J.Medicine,307:1469-1475(1982);以及Ley等,Blood,62:370-380(1983))。另外的实验表明,用细胞毒性剂量的阿拉伯糖胞嘧啶(ara-C)处理的狒狒的反应是F-网织红细胞显著升高(Papayannopoulou等,Science,224(4649):617-9(1984)),在猴或狒狒中用羟基脲处理则引起γ-珠蛋白诱导(Letvin等,N Engl J Med.310(14):869-73(1984))。

所研究的具有HbF再活化活性的第二组化合物为短链脂肪酸。对胎儿脐带血祖细胞的初步观察发现γ-氨基丁酸可用作胎儿血红蛋白的诱导剂(Perrine等,Biochem Biophys Res Commun.148(2):694-700(1987))。随后的研究证明,丁酸盐在成年狒狒中刺激珠蛋白产生(Constantoulakis等,Blood,Dec;72(6):1961-7(1988)),并且丁酸盐在患有镰状细胞贫血的成年动物或患者的红系细胞前体中诱导出γ-珠蛋白(Perrine等,Blood.74(1):454-9(1989))。还证明了诸如苯基丁酸盐(Dover等,Br J Haematol.88(3):555-61(1994))和丙戊酸(Liakopoulou等,1:Blood.186(8):3227-35(1995))的短链脂肪酸的衍生物在体内诱导了HbF。考虑到短链脂肪酸类似物或衍生物这个家族的数量巨大,该家族存在有许多比丁酸盐更有效的潜在化合物。在后续研究中发现的苯基乙酸和苯基烷基酸(Torkelson等,Blood Cells Mol Dis.22(2):150-8(1996))被认为是潜在的HbF诱导剂,因为它们是属于这个家族的化合物。然而,丁酸盐或其类似物在镰状细胞贫血和β-地中海贫血中的使用目前仍然是实验性的,并不能被推荐用于临床试验外的治疗。

针对镰状细胞贫血和β-地中海贫血中的胎儿血红蛋白合成的再活化的临床试验包括了短期给予和长期给予诸如5-氮杂胞苷、羟基脲、重组人促红细胞生成素(erythropoietin)和丁酸类似物的此类化合物以及这些药剂的组合。在这些研究后,羟基脲被用于在人中诱导HbF,它后来成为第一个也是唯一一个被美国食品药品管理局(FDA)批准的用于治疗血红蛋白病的药物。然而,多种弊端已使长期使用此类药剂或疗法成为禁忌,包括不想要的副作用和患者应答的多变性。例如,尽管羟基脲刺激HbF产生并已显示出在临床上降低了镰状化危机(sickling crisis),它可能受限于骨髓毒性和致癌风险。潜在的长期致癌性也存在于以5-氮杂胞苷为基础的疗法中。以促红细胞生成素为基础的疗法在一定范围的患者群体中的一致性也未被证明。丁酸在体内的短半衰期一直被认为是将这些化合物应用于治疗干预的潜在障碍。此外,诱导γ-珠蛋白基因表达需要非常高剂量的丁酸,需要导管插入(catheritization)以进行所述化合物的连续输注。此外,这些高剂量丁酸可能与神经毒性和多器官损伤有关(Blau等,Blood.81:529-537(1993))。尽管甚至极小的HbF水平增加都对镰状细胞病有帮助,β-地中海贫血需要高得多的增加,这是由任何目前使用的药剂都无法可靠地或安全地实现的(Olivieri,Seminars in Hematology.33:24-42(1996))。

对HbF诱导和产生的天然调节剂进行鉴别可为制定克服上述化合物的各种弊端的治疗干预提供手段。最近的全基因组关联研究使得对许多复杂疾病和特性的遗传基础有了深入了解(McCarthy等,Nat Rev Genet.9,356(2008)以及Manolio等,J Clin Invest.118,1590(2008))。然而,在绝大多数情况中,遗传关联和基础病理生理学之间的功能性联系仍未揭晓。考虑到胎儿血红蛋白(HbF)在改善主要的β-血红蛋白病、镰状细胞病和β-地中海贫血的严重程度中所具有的上文所述的且已良好表征的作用,胎儿血红蛋白(HbF)的水平作为数量性状(quantitative trait)遗传,并在临床上很重要(Nathan等,Nathan and Oski's hematology of infancy and childhood.第6版,pp.2v.(xiv,1864,xli p.)2003)。两个全基因组关联研究已确定出含有一组五个共同单核苷酸多态性(SNP)的三个主要基因座,这解释了约20%的HbF水平变化(Lettre等,Proc Natl Acad Sci USA(2008);Uda等,Proc Natl Acad Sci U S A 105,1620(2008);以及Menzel等,Nat Genet 39,1197(2007))。此外,这些变体中一些似乎预测了镰状细胞病的临床严重程度(Lettre等,Proc Natl Acad Sci U S A(2008)),并且这些SNP中的至少一个可能还影响β-地中海贫血的临床结果(Uda等,Proc Natl Acad Sci U S A 105,1620(2008))。具有最大效应量(effect size)并解释了HbF中超过10%的变化的SNP位于2号染色体上的一个基因(BCL11A)的第二内含子中。虽然已研究了BCL11A(C2H2型锌指转录因子)在淋巴细胞发育中的作用(Liu等,Nat Immunol.4,525(2003)和Liu等,Mol Cancer.5,18(2006)),先前并未对其在红血细胞产生或珠蛋白基因调控中的作用进行过评价。

在重组DNA时代的开始,珠蛋白基因结构的研究为探询胎儿珠蛋白转换提供了强有力的分子基础。相当大的努力集中在描绘β样珠蛋白簇内的基因的适当调控所需的β-珠蛋白基因座内的顺式元件。这些研究依赖于对成体的HbF水平造成极大影响的天然存在的突变和删除,并通过生产携带有上述簇的部分的转基因小鼠进行了补充(Nathan等,Nathan and Oski's hematology of infancy and childhood,第6版,pp.2v.(xiv,1864,xli p.)(2003)和G.Stamatoyannopoulos,Exp Hematol 33,259(2005))。尽管珠蛋白转换所需的确切顺式元件仍然不清楚,在转基因小鼠中的发现有力地说明,γ-珠蛋白基因在成体阶段自主地沉默,这一发现与胎儿阶段特异性活化剂的缺失或存在阶段特异性阻遏剂最为一致。最近的遗传关联研究的结果提供了候选基因(如BCL11A)来探询它们在γ-珠蛋白基因控制中的参与状况。

造血祖细胞

在一个实施方式中,造血祖细胞离体或在体外进行接触。在一个具体实施方式中,接触的细胞是红系细胞谱系的细胞。在一个实施方式中,细胞组合物包含具有减少的BCL11A表达的细胞。

本文所使用的术语“造血祖细胞”是指产生所有血细胞类型的干细胞谱系的细胞,所述血细胞类型包括骨髓谱系(单核细胞和巨噬细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突细胞)以及淋巴谱系(T细胞、B细胞、NK细胞)。“红系细胞谱系的细胞”表示接触的细胞为经历红细胞生成从而在最终分化中形成红细胞或红血细胞(RBC)的细胞。此类细胞属于起源于骨髓造血祖细胞的三个谱系(红系细胞谱系、淋巴谱系和骨髓谱系)之一。在暴露于特定生长因子和造血微环境的其它成分后,造血祖细胞可以经过一系列中间分化细胞类型(红系细胞谱系的所有中间体)而成熟变为RBC。因此,本文所使用的术语“红系细胞谱系”的细胞包括造血祖细胞、原红细胞(rubriblasts)、早幼红细胞(prorubricytes)、成红细胞、晚幼红细胞(metarubricytes)、网织红细胞和红细胞。

在一些实施方式中,造血祖细胞具有造血祖细胞的特征性细胞表面标志物中的至少一种:CD34+、CD59+、Thy1/CD90+、CD38lo/-和C-kit/CD117+。优选地,所述造血祖细胞具有这些标志物中的数种。

在一些实施方式中,红系细胞谱系的造血祖细胞具有红系细胞谱系的特征性细胞表面标志物:CD71和Ter119。

干细胞(例如造血祖细胞)能够增殖并生成具有能够生产大量母细胞的能力的更多祖细胞,所述母细胞转而可生成分化的子细胞或可分化的子细胞(daughter cells)。子细胞本身可被诱导增殖,并产生后续分化成一种或多种成熟细胞类型的后代,同时还保留了具有亲代发育潜力的一个或多个细胞。然后,术语“干细胞”是指在特定环境下具有分化为更特化的表型或更分化的表型的能力或潜力、并在某些环境下保留其增殖而基本上不分化的能力的细胞。在一个实施方式中,术语祖细胞或干细胞是指广义的(generalized)母细胞,其子代(后代)通过分化(例如,通过获得完全个体特征)发生特化(通常向不同的方向),如在胚胎细胞和组织的逐步分异(progressive diversification)中所发生的。细胞分化是复杂的过程,通常通过许多细胞分裂而发生。分化的细胞可能来源于专能细胞(multipotent cell),所述专能细胞本身来源于专能细胞等。虽然这些专能细胞中的每个均可被认为是干细胞,各自可产生的细胞类型的范围可发生极大变化。一些分化的细胞仍具有生成具有更大发育潜能的细胞的能力。这种能力可以是天然的,或者可以通过用各种因子处理来人工诱导。在许多生物学情况中,干细胞也是“专能的”,因为它们可以产生多于一种的不同细胞类型的后代,但这并不是“干性(stem-ness)”所必需的。自我更新是干细胞定义的另一经典部分,并且当用于本文中时,这一点很关键。从理论上讲,自我更新可以通过两种主要机制中的任一种而发生。干细胞可不对称地分裂,一个子代保持干(stem)的状态,而另一子代表达一些不同的其它特定功能和表型。或者,群中的一些干细胞可对称地分裂成两个干细胞,从而在群中保留作为整体的一些干细胞,而群中的其它细胞仅生成分化的后代。通常,“祖细胞”具有更原始的细胞表型(即,相比完全分化的细胞,祖细胞在发育途径或进程中处于更为早期的步骤)。通常,祖细胞也具有显著或非常高的增殖潜能。祖细胞可生成多个不同的分化细胞类型或生成单一的分化细胞类型,这取决于发育途径以及细胞发育和分化的环境。

在细胞个体发生的背景下,形容词“分化的(differentiated/differentiating)”是相对的概念。“分化细胞”是比与它进行比较的细胞的发育途径进展更深远的细胞。因此,干细胞可以分化为谱系限制的前体细胞(如造血祖细胞),其转而可进一步向深远的途径分化为其它类型的前体细胞(如红细胞前体),然后分化为终末期分化细胞(如红细胞),其在特定组织类型中起特征性作用,并可能会或可能不会保留进一步增殖的能力。

诱导多能干细胞

在一些实施方式中,本文所述的基因工程人细胞来源于分离的多能干细胞。使用iPSC的优势是,细胞可以来自于将要给予祖细胞的同一受试者。即,可从受试者中获得体细胞,将其重编程成诱导多能干细胞,然后再分化成造血祖细胞以给予所述受试者(例如,自体细胞)。由于祖细胞基本上来源于自体来源,与使用来自另一受试者或另一组受试者的细胞相比,降低了植入排斥(engraftment rejection)或过敏反应的风险。在一些实施方式中,造血祖细胞来源于非自体来源。此外,iPSC的使用消除了对从胚胎来源中获得的细胞的需求。因此,在一个实施方式中,所公开的方法中使用的干细胞不是胚胎干细胞。

尽管在生理环境下分化通常是不可逆的,但最近已开发出将体细胞重编程成诱导多能干细胞的几种方法。示例性的方法是本领域技术人员已知的,并在下文中进行简要描述。

本文所使用的术语“重编程”是指改变或回逆分化细胞(例如,体细胞)的分化状态的过程。换句话说,重编程是指驱使细胞分化回较不分化或更原始类型的细胞的过程。应当指出的是,在培养中放置许多原代细胞可使得完全分化特征出现一定损失。因此,对包含于术语分化细胞中的细胞进行简单培养不会使得这种细胞成为非分化细胞(例如,未分化的细胞)或多能细胞。除了在培养中使得分化特征部分损失的刺激之外,分化细胞向多能性的转变需要重编程刺激。相对于原代细胞亲本(在培养中通常仅能够分裂有限次),重编程细胞还具有能够延长传代而不使生长潜力失去的特征。

待进行重编程的细胞在重编程之前可以是部分分化的或终末分化的。在一些实施方式中,重编程包括将分化细胞(如体细胞)的分化状态完全回逆成多能状态或专能状态(multipotent state)。在一些实施方式中,重编程包括将分化细胞(如体细胞)的分化状态完全或部分回逆成未分化细胞(例如,胚胎样细胞)。重编程可使得细胞表达特定基因,所述基因的表达进一步有助于重编程。在本文所述的某些实施方式中,分化细胞(如体细胞)的重编程使得所述分化细胞呈现未分化状态(例如,为未分化细胞)。所得到的细胞被称为“重编程细胞”或“诱导多能干细胞(iPSC或iPS细胞)”。

重编程可涉及细胞分化过程中发生的核酸修饰(例如,甲基化)、染色质凝缩、表观遗传变化、基因组印记等的遗传模式中的至少一些的变化(例如回逆)。重编程不同于简单地维持已是多能性的细胞存在的未分化状态、或维持已是专能细胞(例如,造血干细胞)的细胞存在的较完全分化状态低的分化状态。重编程也不同于促进已是多能性或专能性的细胞的自我更新或增殖,尽管在一些实施方式中,本文所述的组合物和方法也可用于上述目的。

用于由体细胞生成多能干细胞的具体手段或方法(广义地称作“重编程”)并不是所请求保护的发明的关键。因此,将体细胞重编程成多能表型的任何方法都将适于在本文所述的方法中使用。

使用确定的转录因子组合生产多能细胞的重编程方法学已被描述来诱导多能干细胞。Yamanaka和Takahashi通过直接转导Oct4、Sox2、Klf4和c-Myc将小鼠体细胞转化成具有扩展的发育潜能的ES细胞样细胞(Takahashi和Yamanaka,2006)。iPSC类似于ES细胞,因为它们恢复了表观遗传图谱(epigenetic landscape)的muc和多能性相关的转录线路(transcriptional circuitry)。此外,小鼠iPSC满足多能性的所有标准分析:特别是,在体外分化成三个胚层的细胞类型、畸胎瘤形成、促成嵌合体、种系传递(germline transmission)(Maherali和Hochedlinger,2008)以及四倍体互补(Woltjen等,2009)。

随后的研究表明,可使用类似的转导方法获得人iPS细胞(Lowry等,2008;Park等,2008;Takahashi等,2007;以及Yu等,2007b);并且,转录因子三元组OCT4、SOX2和NANOG已被确定为管理多能性的核心转录因子集(Jaenisch和Young,2008)。iPS细胞的生产可以通过将编码干细胞相关基因的核酸序列引入成体的体细胞(以往使用病毒载体)来实现。

iPS细胞可产生自或来源自终末分化体细胞、以及产生自或来源自成体干细胞、或体干细胞。也就是说,可以通过重编程使非多能祖细胞成为多能或专能的。在此类情况中,可能没有必要包括与重编程终末分化细胞所需的重编程因子一样多的重编程因子。此外,重编程可通过重编程因子的非病毒引入而诱导,例如,通过引入蛋白本身、或通过引入编码所述重编程因子的核酸、或通过引入翻译时产生所述重编程因子的信使RNA(参见例如,Warren等,Cell Stem Cell,2010Nov 5;7(5):618-30)。可通过引入编码干细胞相关基因的核酸的组合来实现重编程,所述干细胞相关基因包括例如Oct-4(也称为Oct-3/4或Pouf51)、Sox1、Sox2、Sox3、Sox 15、Sox 18、NANOG、Klf1、Klf2、Klf4、Klf5、NR5A2、c-Myc、l-Myc、n-Myc、Rem2、Tert和LIN28。在一个实施方式中,使用本文所述的方法和组合物进行的重编程可进一步包括将Oct-3/4、Sox家族的成员、Klf家族的成员和Myc家族的成员中的一个或多个引入体细胞。在一个实施方式中,本文所述的方法和组合物进一步包括引入用于重编程的Oct4、Sox2、Nanog、c-MYC和Klf4的每一个中的一个或多个。如上所述,用于重编程的确切方法不一定是本文所述的方法和组合物的关键。然而,当由重编程细胞分化而来的细胞用于例如人的治疗时,在一个实施方式中,重编程不受对基因组进行改变的方法影响。因此,在此类实施方式中,例如,在不使用病毒载体或质粒载体的情况下实现重编程。

来源于起始细胞群的重编程的效率(即,重编程细胞的数量)可以通过加入下列文献中所示的各种小分子而得到增强:Shi,Y.等(2008)Cell-Stem Cell 2:525-528;Huangfu,D.等(2008)Nature Biotechnology 26(7):795-797;以及Marson,A.等(2008)Cell-Stem Cell 3:132-135。因此,增强诱导多能干细胞产生的效率或速率的药剂或药剂组合可用于生产患者特异性iPSC或疾病特异性iPSC。增强重编程效率的药剂的一些非限制性实例包括可溶性Wnt、Wnt条件培养液(conditioned media)、BIX-01294(G9a组蛋白甲基转移酶)、PD0325901(MEK抑制剂)、DNA甲基转移酶抑制剂、组蛋白脱乙酰酶(HDAC)抑制剂、丙戊酸、5'-氮杂胞苷、地塞米松、辛二酰苯胺异羟肟酸(SAHA)、维生素C和曲古抑菌素(TSA)等。

重编程增强剂的其它非限制性实例包括:辛二酰苯胺异羟肟酸(SAHA(例如,MK0683、伏立诺他)及其它异羟肟酸)、BML-210、Depudecin(例如,(-)-Depudecin)、HC毒素、Nullscript(4-(1,3-二氧代-1H,3H-苯并[脱]异喹啉-2-基)-N-羟基丁酰胺)、苯基丁酸盐/酯(例如,苯基丁酸钠)和丙戊酸((VPA)以及其它短链脂肪酸酸)、Scriptaid、苏拉明钠、曲古抑菌素A(TSA)、APHA化合物8、Apicidin、丁酸钠、新戊酰氧基甲基丁酸盐/酯(Pivanex,AN-9)、Trapoxin B、Chlamydocin、缩酚酸肽(也称为FR901228或FK228)、苯甲酰胺(例如,CI-994(例如,N-乙酰基地那林)和MS-27-275)、MGCD0103、NVP-LAQ-824、CBHA(间羧基肉桂酸二异羟肟酸)、JNJ16241199、Tubacin、A-161906、proxamide、oxamflatin、3-Cl-UCHA(例如,6-(3-氯苯基脲)己异羟肟酸)、AOE(2-氨基-8-氧代-9,10-环氧癸酸)、CHAP31以及CHAP 50。其它重编程增强剂包括例如,HDAC的显性负性形式(dominant negative forms)(例如,无催化活性的形式)、HDAC的siRNA抑制剂以及特异性结合于HDAC的抗体。此类抑制剂例如可得自BIOMOL International、Fukasawa、Merck Biosciences、Novartis、Gloucester Pharmaceuticals、Aton Pharma、Titan Pharmaceuticals、Schering AG、Pharmion、MethylGene以及Sigma Aldrich。

为了证实多能干细胞的诱导以用于本文所述的方法,可以就干细胞标志物的表达来对分离的克隆进行测试。来源于体细胞的细胞中的此类表达将细胞标识为诱导多能干细胞。干细胞标志物可选自于包括以下标志物的非限制性组:SSEA3、SSEA4、CD9、Nanog、Fbx15、Ecat1、Esg1、Eras、Gdf3、Fgf4、Cripto、Dax1、Zpf296、Slc2a3、Rex1、Utf1和Nat1。在一个实施方式中,将表达Oct4或Nanog的细胞标识为多能的。用于检测此类标志物表达的方法可以包括例如RT-PCR以及检测所编码的多肽的存在的免疫学方法,例如蛋白质印迹或流式细胞分析。在一些实施方式中,检测不仅包括RT-PCR,还包括检测蛋白标志物。细胞内标志物可由RT-PCR最好地识别,而细胞表面标志物容易被例如免疫细胞化学识别。

分离的细胞的多能干细胞特征可通过评价iPSC分化成三个胚层各层细胞的能力的测试进行确证。作为一个实例,可将裸鼠中的畸胎瘤形成用于评价分离的克隆的多能特征。将细胞引入裸鼠,并在由所述细胞产生的肿瘤上实施组织学和/或免疫组织化学。例如,包含来自于所有三个胚层的细胞的肿瘤的生长进一步表明所述细胞是多能干细胞。

用于重编程的体细胞

本文所使用的术语体细胞是指除了生殖细胞以外,形成有机体的机体的任何细胞。哺乳动物机体中,除了精子和卵子、获得它们的细胞(配子)和未分化的干细胞外的所有细胞类型均为分化的体细胞。例如,内脏、皮肤、骨、血液和结缔组织均由分化的体细胞构成。

用于本文所述的组合物和方法中的其它体细胞类型包括:成纤维细胞(例如,原代成纤维细胞)、肌肉细胞(例如,肌细胞)、卵丘细胞、神经细胞、乳腺细胞、肝细胞和胰岛细胞。在一些实施方式中,所述体细胞是原代细胞系或者是原代细胞系或次级细胞系的后代。在一些实施方式中,所述体细胞获得自人样品,例如,毛囊、血液样品、活组织检查物(例如,皮肤活组织检查物或脂肪活组织检查物)、以及拭子样品(例如,口腔拭子样品),因此它是人的体细胞。

分化的体细胞的一些非限制性实例包括但不限于:上皮细胞、内皮细胞、神经元细胞、脂肪细胞、心脏细胞、骨骼肌细胞、免疫细胞、肝细胞、脾细胞、肺细胞、循环血细胞、胃肠细胞、肾细胞、骨髓细胞和胰腺细胞。在一些实施方式中,所述体细胞可为分离自任何身体(somatic)组织的原代细胞,所述身体组织包括但不限于脑、肝、肠管(gut)、胃、肠、脂肪、肌肉、子宫、皮肤、脾、内分泌器官、骨等。此外,所述体细胞可以来自任何哺乳动物物种,非限制性实例包括鼠科动物细胞、牛科动物细胞、猿类(simian)细胞、猪细胞、马科动物细胞、羊类细胞或人细胞。在一些实施方式中,所述体细胞是人的体细胞。

当将重编程细胞用于生成造血祖细胞以在疾病的治疗处理中使用时,使用从待治疗的患者中分离的体细胞是理想的,但不是必需的。例如,可以使用疾病所牵连的体细胞以及参与疾病的治疗处理的体细胞等。在一些实施方式中,可以通过任何已知的手段来实施用于从非均质群中选择重编程细胞的方法,所述非均质群包含重编程的细胞和得到或或产生它们的体细胞。例如,可将药物抗性基因等(如选择标记基因)用于对使用该选择标记作为指标(index)的重编程细胞进行分离。

本文所公开的重编程体细胞可以表达任何数量的多能细胞标志物,所述多能细胞标志物包括:碱性磷酸酶(AP);ABCG2;阶段特异性胚胎抗原-1(SSEA-1);SSEA-3;SSEA-4;TRA-1-60;TRA-1-81;Tra-2-49/6E;ERas/ECAT5,E-钙粘蛋白;β-III-微管蛋白;α-平滑肌肌动蛋白(α-SMA);成纤维细胞生长因子4(Fgf4),Cripto,Dax1;锌指蛋白296(Zfp296);N-乙酰转移酶-1(Nat1);ES细胞相关转录物1(ECAT1);ESG1/DPPA5/ECAT2;ECAT3;ECAT6;ECAT7;ECAT8;ECAT9;ECAT10;ECAT15-1;ECAT15-2;Fthl17;Sal14;未分化的胚胎细胞转录因子(Utf1);Rex1;p53;G3PDH;端粒酶,包括TERT;沉默X染色体基因;Dnmt3a;Dnmt3b;TRIM28;含F-box的蛋白15(Fbx15);Nanog/ECAT4;Oct3/4;Sox2;Klf4;c-Myc;Esrrb;TDGF1;GABRB3;Zfp42,FoxD3;GDF3;CYP25A1;发育多能性相关蛋白2(DPPA2);T细胞淋巴瘤断点1(Tcl1);DPPA3/Stella;DPPA4;用于多能性的其它常用标志物等。其它标志物可包括Dnmt3L、Sox15、Stat3、Grb2、β-连环蛋白和Bmi1。此类细胞的特征还在于作为该诱导多能干细胞来源的体细胞的特征性标志物的下调。

基因组编辑(Genome editing)和DNA靶向核酸内切酶

本文所使用的术语“基因组编辑”是指使用人工工程化核酸酶在基因组中的期望位置处切割并产生特定双链断裂的反向遗传学方法(reverse genetics method),该断裂随后被细胞内源过程(例如,同源重组(HR)、同源介导的修复(HDR)以及非同源末端连接(NHEJ))修复。在双链断裂中NHEJ直接连接DNA末端,而HDR利用同源序列作为模板以在断点处重新产生所缺失的DNA序列。

使用传统的限制性核酸内切酶不能实施基因组编辑,因为大多数限制性酶识别DNA上的几个碱基对作为它们的目标,而所识别的碱基对组合存在于整个基因组的很多位置处从而产生多个切口(即,不限于期望的位置)的情况的概率很高。为了克服这一难题并造成位点-特异性双链断裂,迄今已发现并生物工程化了数种不同种类的核酸酶。这些核酸酶是大范围核酸酶、锌指核酸酶(ZFN)、Cas9/CRISPR系统和转录激活因子样效应物核酸酶(TALEN)。

大范围核酸酶一般分为四个家族:LAGLIDADG(SEQ ID NO:1)家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族的特征在于影响催化活性和识别序列的结构基序。例如,LAGLIDADG(SEQ ID NO:1)家族成员的特征在于具有一拷贝或两拷贝的保守LAGLIDADG(SEQ ID NO:1)基序(见Chevalier等(2001),Nucleic Acids Res.29(18):3757-3774)。具有单个拷贝LAGLIDADG(SEQ ID NO:1)基序的LAGLIDADG(SEQ ID NO:1)大范围核酸酶形成同二聚体,而具有两拷贝LAGLIDADG(SEQ ID NO:1)的成员以单体存在。类似地,GIY-YIG家族成员具有GIY-YIG模块(70-100个残基长),并且包含4个或5个保守序列基序(具有4个不变的残基),其中两个是活性必需的(参见Van Roey等(2002),Nature Struct.Biol.9:806-811)。His-Cys盒大范围核酸酶的特征在于在包含几百个氨基酸残基的区域中具有高度保守的一连串组氨酸和半胱氨酸(参见Chevalier等(2001),Nucleic Acids Res.29(18):3757-3774)。在NHN家族的情况中,所述成员通过含有由天冬酰胺残基包围的两对保守组氨酸的基序来界定(参见Chevalier等(2001),Nucleic Acids Res.29(18):3757-3774)。大范围核酸酶的这四个家族在保守结构元件方面彼此充分分离,从而使得DNA识别序列特异性和催化活性也彼此充分分离。

大范围核酸酶通常发现于微生物物种中,并且持有具有很长的识别序列(>14bp)的独特特性,从而使它们天生非常特异性地在期望位置进行切割。可以利用这一点在基因组编辑中产生位点特异性双链断裂。本领域技术人员可以使用这些天然存在的大范围核酸酶,然而,此类天然存在的大范围核酸酶的数量有限。为了克服这一难题,已使用诱变和高通量筛选方法来制造识别独特序列的大范围核酸酶变体。例如,已将不同的大范围核酸酶融合来制造识别新序列的杂合酶。或者,可改变大范围核酸酶的DNA相互作用氨基酸来设计序列特异性的大范围核酸酶(参见例如,美国专利8,021,867)。可使用例如Certo,MT等,Nature Methods(2012)9:073-975;美国专利号8,304,222、8,021,867、8,119,381、8,124,369、8,129,134、8,133,697、8,143,015、8,143,016、8,148,098或8,163,514中所述的方法来设计大范围核酸酶,以引用的方式将它们各自的内容整体并入本文。或者,可使用可商购的技术(例如,Precision BioSciences的Directed Nuclease EditorTM基因组编辑技术)来获得具有位点特异性切割特征的大范围核酸酶。

ZFN和TALEN限制性内切酶技术利用了连结至特异性DNA序列识别肽(例如,锌指和转录激活因子样效应物(TALE))的非特异性DNA切割酶。通常,选择其DNA识别位点和切割位点彼此分离的核酸内切酶,将其切割部分分离然后连接至序列识别肽,从而生成对期望序列具有非常高特异性的核酸内切酶。具有此类特性的示例性限制性酶是FokI。此外,FokI具有需要二聚化来具有核酸酶活性的优点,这意味着在每个核酸酶伴侣识别独特的DNA序列时特异性急剧增加。为了增强这一效果,已对FokI核酸酶进行了只能作为异二聚体起作用的工程化,并且具有增加的催化活性。以异二聚体起作用的核酸酶避免了不想要的同二聚体活性的可能性,从而提高了双链断裂的特异性。

尽管ZFN和TALEN二者的核酸酶部分具有类似特性,这些工程化核酸酶之间的差异在于它们的DNA识别肽。ZFN依赖于Cys2-His2锌指,而TALEN依赖于TALE。这些DNA识别肽结构域均具有以下特征:在天然情况中它们在其蛋白质中以组合出现。Cys2-His2锌指通常以相距3bp的重复出现,并以不同组合出现在各种核酸相互作用蛋白(如转录因子)中。另一方面,TALE以氨基酸和所识别的核苷酸对之间具有一对一的识别比例的重复存在。因为锌指和TALE二者均以重复模式出现,可尝试不同组合以制造多种多样的序列特异性。用于制造位点特异性锌指核酸内切酶的方法包括例如,模块化装配(其中,将与三联体序列(triplet sequence)相关的锌指连成串以覆盖所需序列)、OPEN(肽结构域与三联体核苷酸的低严格选择,继以肽组合与细菌系统中的最终目标的高严格选择)以及锌指文库的细菌单杂交筛选等。用于本文所述的方法和组合物的ZFN可商购自例如Sangamo BiosciencesTM(Richmond,CA)。

本文中考虑了将基因组编辑的Cas9/CRISPR系统与本文所述的方法和组合物一起使用。簇生的规律间隔的短回文重复(CRISPR)/CRISPR相关(Cas)系统对于RNA可编程基因组编辑是有用的(参见例如,Jinek,M等,Science(2012)337(6096):816-821)。

或者,基因组编辑可使用基于重组腺相关病毒(rAAV)的基因组工程进行,这是以rAAV载体的使用为中心的基因组编辑平台,所述rAAV载体使得能够在活哺乳动物细胞的基因组中进行DNA序列插入、删除或置换。rAAV基因组是长约4.7千碱基的或正义或反义的单链脱氧核糖核酸(ssDNA)分子。这些单链DNA病毒载体具有高转导率,并且在不在基因组中造成双链DNA断裂的情况下具有刺激内源性同源重组的独特特性。本领域技术人员可将rAAV载体设计用来靶向期望的基因组基因座以及在细胞中进行庞大的内源基因改变和/或细微的内源基因改变(例如删除)。rAAV基因组编辑具有靶向单一等位基因以及不产生任何脱靶基因组改变的优势。rAAV基因组编辑技术是可商购的,例如,来自HorizonTM(Cambridge,UK)的rAAV GENESISTM系统。

药学上可接受的载体

本文所述的给予受试者人造血祖细胞的方法涉及包含造血祖细胞的治疗组合物的使用。治疗组合物含有生理上可耐受的载体和细胞组合物,并任选地含有至少一种本文所述的另外的生物活性剂(作为活性成分溶解或分散于其中)。在优选的实施方式中,当出于治疗目的给予哺乳动物或人类患者时,所述治疗组合物实质上不具有免疫原性,除非希望如此。

通常,将本文所述的造血祖细胞与药学上可接受的载体作为混悬剂来进行给药。本领域技术人员将认识到,待用于细胞组合物中的药学上可接受的载体将不会以实质上干扰要递送至受试者的细胞的存活力的量包含缓冲剂、化合物、冷冻保存剂、防腐剂或其它药剂。包含细胞的制剂例如可包含使得细胞膜完整性得以维持的渗透缓冲剂,以及任选地包含在给药后维持细胞存活力或增强植入的营养物。此类制剂和混悬剂对本领域技术人员而言是众所周知的,和/或可适合于使用常规实验来与本文所述的造血祖细胞一起使用。

细胞组合物还可以被乳化为脂质体组合物或以脂质体组合物形式提供,前提是乳化过程不会对细胞存活力产生不良影响。可以将细胞和任何其它活性成分与药学上可接受的并与该活性成分相容的赋形剂以适合用于本文所述的治疗方法的量相混合。

本文所述的细胞组合物中所包含的另外的药剂可以包括其中的组分的药学上可接受的盐。药学上可接受的盐包括与无机酸(例如盐酸或磷酸)或有机酸(例如乙酸、酒石酸、扁桃酸等)形成的酸加成盐(与多肽的游离氨基形成的盐)。与游离羧基形成的盐也可以衍生自无机碱(例如钠、钾、铵、钙或铁的氢氧化物)和有机碱(如异丙胺、三甲胺、2-乙氨基乙醇、组氨酸、普鲁卡因等)。生理上可耐受的载体在本领域中是众所周知的。示例性液体载体是不包含除活性成分和水以外的物质的无菌水溶液,或是含有缓冲剂(例如处于生理pH值的磷酸钠)、生理盐水或这两者(例如磷酸盐缓冲盐水)的无菌水溶液。更进一步而言,水性载体可以含有多于一种的缓冲盐,以及盐(例如氯化钠和氯化钾)、葡聚糖、聚乙二醇和其它溶质。液体组合物还可以在水的基础之上和在排除水的情况下包含液相。示例性的此类另外的液相为甘油、植物油(如棉籽油)和水-油乳剂。本文所述的细胞组合物中使用的活性化合物的量(所述活性化合物将在特定紊乱或病症的治疗中有效)将取决于所述紊乱或病症的性质,并可以通过标准临床技术来确定。

给药&效力

在通过使得引入的细胞在期望位点(例如,损伤或修复的位点)至少部分定位的方法或途径,将如本文所述的细胞(例如,造血祖细胞)放置于受试者中以产生所期望的效果的情况下,本文所使用的术语“给予/给药(administering)”、“引入”和“移植”可互换使用。所述细胞(例如造血祖细胞)或其分化后代可通过任何适当的途径给予,所述途径实现了递送至受试者中的期望位点,其中,至少部分所植入的细胞或所述细胞的成分仍然有活力。给予受试者之后,所述细胞的存活力周期可为短短几小时(如24小时)、至数天、乃至长达数年(即长期植入)。例如,在本文所述方面的一些实施方式中,通过全身给药途径(例如,腹膜内途径或静脉内途径)给予有效量的造血祖细胞。

当预防性地提供时,可以在血红蛋白病的任何症状之前(例如,在从胎儿γ-珠蛋白转换成主要为β-珠蛋白之前)将本文所述的造血祖细胞给予受试者。因此,如本文所公开的,造血祖细胞群的预防性给予发挥预防血红蛋白病的作用。

当治疗性地提供时,在血红蛋白病的症状或指征(indication)发作时(或之后)提供造血祖细胞,例如,在镰状细胞病发作时。

在本文所述方面的一些实施方式中,根据本文所述的方法所给予的造血祖细胞群包含获得自一个或多个供体的同种异体(allogeneic)造血祖细胞。本文所使用的“同种异体”是指包含获得自同一物种的一个或多个不同供体的造血祖细胞的造血祖细胞样品或生物样品,其中,一个或多个基因座处的基因是不同的。例如,将要给予受试者的造血祖细胞群可来源于从一个或多个非亲缘的供体受试者中获得的脐带血,或者来源于从一个或多个异卵兄弟姐妹(non-identical siblings)中获得的脐带血。在一些实施方式中,可以使用同系(syngeneic)造血祖细胞群,例如,从遗传上相同的动物中获得的造血祖细胞群,或从同卵双胞胎中获得的造血祖细胞群。在这一方面的其它实施方式中,所述造血祖细胞是自体细胞,即,所述造血祖细胞获得自或分离自受试者,并将所述造血祖细胞给予至同一受试者,即,供体和受体是相同的。

对于在本文所述的各个方面中使用,有效量的造血祖细胞包含至少102个造血祖细胞、至少5×102个造血祖细胞、至少103个造血祖细胞、至少5×103个造血祖细胞、至少104个造血祖细胞、至少5×104个造血祖细胞、至少105个造血祖细胞、至少2×105个造血祖细胞、至少3×105个造血祖细胞、至少4×105个造血祖细胞、至少5×105个造血祖细胞、至少6×105个造血祖细胞、至少7×105个造血祖细胞、至少8×105个造血祖细胞、至少9×105个造血祖细胞、至少1×106个造血祖细胞、至少2×106个造血祖细胞、至少3×106个造血祖细胞、至少4×106个造血祖细胞、至少5×106个造血祖细胞、至少6×106个造血祖细胞、至少7×106个造血祖细胞、至少8×106个造血祖细胞、至少9×106个造血祖细胞、或上述造血祖细胞的量的倍数。所述造血祖细胞可来源于一个或多个供体,或者可以从自体来源获得。在本文所述方面的一些实施方式中,在给予有需要的受试者之前,将造血祖细胞在培养中扩增。

在一个实施方式中,本文所使用的术语“有效量”是指减轻血红蛋白病的至少一种或多种症状所需的人造血祖细胞群或其后代的量,并且涉及足以提供所期望的效果(例如,治疗患有血红蛋白病的受试者)的组合物的量。因此,术语“治疗有效量”是指当给予典型的受试者(例如患有血红蛋白病或具有血红蛋白病风险的受试者)时,足以产生特定效果的造血祖细胞或包含造血祖细胞的组合物的量。本文所使用的有效量还将包括足以防止或延迟疾病症状的发展、改变疾病症状的病程(例如但不限于,延缓疾病症状的进展)、或逆转疾病症状的量。应当理解的是,对于任何给定情况,适当的“有效量”可由本领域普通技术人员使用常规实验来确定。

本文所使用的“给予/给药(administered)”是指通过使得细胞组合物在所期望的位点处至少部分定位的方法或途径,将如本文所述的造血干细胞组合物递送至受试者中。细胞组合物可通过在受试者中引起有效治疗的任何合适途径进行给药,即,给药使得递送至受试者中的期望位点,其中,所递送的组合物的至少一部分(即,至少1×104个细胞)在一段时间中被递送至所述期望位点。给药模式包括注射、输液、滴注或摄食。“注射”包括但不限于:静脉内注射和输注、肌内注射和输注、动脉内注射和输注、鞘内注射和输注、室内注射和输注、囊内注射和输注、眶内注射和输注、心内注射和输注、皮内注射和输注、腹膜内注射和输注、经气管注射和输注、皮下注射和输注、表皮下注射和输注、关节内注射和输注、囊下注射和输注、蛛网膜下注射和输注、脊柱内注射和输注、脑脊髓内注射和输注以及胸骨内注射和输注。对于细胞的递送,通常优选通过注射或输注进行给药。

在一个实施方式中,对本文所述的细胞进行全身给药。本文使用的短语“全身给药/给予(systemic administration/administered systemically)”和“外周给药/给予(peripheral administration/administered peripherally)”是指造血祖细胞群的此类给药:使得造血祖细胞群进入受试者的循环系统而非直接进入靶位点、组织或器官,从而经历代谢和其它类似过程。

包含本文所述的组合物的治疗在治疗血红蛋白病方面的效力可由有经验的临床医生确定。然而,如果在用抑制剂处理后,疾病的任何一个迹象(sign)或症状或所有迹象或症状(仅作为一个例子,胎儿β-珠蛋白的水平)以有益的方式改变,疾病的其它临床上接受的症状或标志物例如改善了或减轻了至少10%,治疗被认为是“有效的治疗”(作为在本文中使用的术语)。效力还可以通过个体未恶化(由住院治疗或对医疗干预的需求来评估)(例如,疾病的进展中止或至少延缓)进行测量。测量这些指标的方法是本领域技术人员已知的和/或在本文中有所描述。治疗包括在个体或动物(一些非限制性的实例包括人或哺乳动物)中对疾病的任何治疗,包括:(1)抑制所述疾病,例如,阻止或延缓脓毒症(sepsis)的进展;或(2)缓解所述疾病,例如,使得症状消退;以及(3)预防或降低感染或脓毒症发展的可能性。

根据本发明的治疗通过增加个体中胎儿血红蛋白的量而使与β-珠蛋白紊乱有关的一个或多个症状得到改善。通常与血红蛋白病有关的症状包括例如,贫血、组织缺氧、器官功能障碍、异常血细胞比容值、无效的红细胞生成、异常网织红细胞(红细胞)计数、异常铁负荷、存在环状铁粒幼红细胞(ring sideroblasts)、脾肿大、肝肿大、受损的外周血流、呼吸困难、增加的溶血、黄疸、贫血性疼痛危机(anemic pain crises)、急性胸部综合征、脾隔离症(splenic sequestration)、阴茎异常勃起(priapism)、中风、手足综合征以及疼痛(如心绞痛)。

在一个实施方式中,造血祖细胞与DNA靶向核酸内切酶离体或在体外进行接触,并将所述细胞或其后代给予哺乳动物(例如人)。在进一步的实施方式中,所述造血祖细胞是红系细胞谱系的细胞。在一个实施方式中,将包含之前与DNA靶向核酸内切酶接触的造血祖细胞和药学上可接受的载体的组合物给予哺乳动物。

在一个实施方式中,可使用本领域中已知的任何方法来对胎儿血红蛋白表达的增加进行测量,例如,胎儿血红蛋白的蛋白质印迹分析以及对胎儿γ-珠蛋白的mRNA进行定量。

在一个实施方式中,造血祖细胞与DNA靶向核酸内切酶在体外或离体进行接触。在一个实施方式中,所述细胞是人来源的(例如,自体细胞或异体细胞)。在一个实施方式中,所述组合物使得胎儿血红蛋白表达有所增加。

本发明可被以下按字母顺序排列的段落中的任一项所定义:

[A].一种用于生产具有减少的BCL11A mRNA或蛋白表达的祖细胞的方法,所述方法包括将分离的祖细胞与药剂进行接触,从而使BCL11A的mRNA或蛋白表达降低,所述药剂结合2号染色体的60,716,189-60,728,612位置(根据UCSC基因组浏览器的hg 19人类基因组组装)上的所述细胞的基因组DNA。

[B].一种用于生产具有至少一种遗传修饰的分离的基因工程人细胞的方法,所述方法包括将分离的细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰。

[C].如段落[A]或[B]所述的方法,其中,所述分离的祖细胞或所述分离的细胞为造血祖细胞。

[D].如段落[C]所述的方法,其中,所述造血祖细胞为红系细胞谱系的细胞。

[E].如段落[A]或[B]所述的方法,其中,所述分离的祖细胞或所述分离的细胞为诱导多能干细胞。

[F].如段落[C]所述的方法,其中,所述造血祖细胞离体或在体外进行接触。

[G].如段落[A]-[F]中任一项所述的方法,其中,所述至少一种遗传修饰为删除。

[H].如段落[G]所述的方法,其中,所述删除将2号染色体的60,716,189-60,728,612位置之间的整个区域移除、或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。

[I].根据段落[B]-[H]所述的在2号染色体的60,716,189-60,728,612位置上具有至少一种遗传修饰的分离的基因工程人细胞。

[J].一种包含段落[I]所述的分离的基因工程人细胞的组合物。

[K].一种增加细胞中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:将分离的细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述细胞或其后代中的胎儿血红蛋白表达相对于所述接触之前的所述细胞有所增加。

[L].如段落[K]所述的方法,其中,所述分离的细胞为造血祖细胞。

[M].如段落[K]或[L]所述的方法,其中,所述造血祖细胞为红系细胞谱系的细胞。

[N].如段落[K]所述的方法,其中,所述分离的细胞为诱导多能干细胞。

[O].如段落[L]或[M]所述的方法,其中,所述造血祖细胞离体或在体外进行接触。

[P]如段落[K]-[O]中任一项所述的方法,其中,所述至少一种遗传修饰为删除。

[Q].如段落[P]所述的方法,其中,所述删除将2号染色体的60,716,189-60,728,612位置之间的整个区域移除、或者将所述区域的一部分移除,导致一个或多个DNA酶1超敏感位点(DHS)的破坏。

[R].一种用于增加有需要的哺乳动物中的胎儿血红蛋白水平的方法,所述方法包括以下步骤:在所述哺乳动物中将分离的造血祖细胞与有效量的组合物进行接触,所述组合物至少包含DNA靶向核酸内切酶或者携带有DNA靶向核酸内切酶的编码序列的载体,其中,所述DNA靶向核酸内切酶在2号染色体的60,716,189-60,728,612位置上对所述细胞的基因组DNA进行切割,从而在其中造成至少一种遗传修饰,由此所述哺乳动物中的胎儿血红蛋白表达相对于所述接触之前的表达有所增加。

通过下列实施例对本发明进行进一步说明,不应将所述实施例解释为限制性的。将在本申请全文中引用的所有参考文献的内容以及附图和表格以引用的方式并入本文。

实施例

本发明人发现并表征了在红系细胞谱系细胞中对BCL11A基因表达至关重要的BCL11A基因的调控元件。这些序列中常见的遗传变体与胎儿血红蛋白水平以及β-珠蛋白紊乱的严重程度有关。这些序列包含具有增强子染色质标记的远端调控元件,所述远端调控元件具有可接近的染色质、活化的组蛋白标记,并被红系细胞转录因子占据。这些元件与BCL11A启动子相互作用,并促进红系细胞、而非表达BCL11A的其它谱系(例如B淋巴细胞)中的基因表达。可关注这些调控元件来用于治疗目的,以实现BCL11A的抑制和胎儿血红蛋白的再诱导。这可以通过不限于基因组编辑、核酸结合或蛋白结合以及表观遗传修饰的机制来实现。本方法的优点包括:破坏胎儿血红蛋白水平的生理调节物使得γ-珠蛋白生产增加以及β-珠蛋白生产降低;对珠蛋白整体产量(output)或对红血细胞的生产或功能影响最小;对红系细胞谱系以外的细胞的影响有限,从而降低了潜在的毒性。

材料和方法

细胞培养

来自于健康供体的动员外周血的人CD34+细胞获得自耶鲁大学的分子血液学卓越中心(Centers of Excellence in Molecular Hematology)(New Haven,Connecticut)和Fred Hutchinson癌症研究中心(Seattle,Washington)。用如先前所述的两阶段无血清液体培养方案,使所述细胞经历离体红系细胞成熟(39)。外周血单核细胞(PBMC)获得自来自波士顿儿童医院的健康供体。如前所述进行PBMC的红系细胞分化(40)。如前所述对小鼠红白血病(MEL)细胞和293T细胞进行培养(39)。在添加2%青霉素-链霉素、15%FCS、2%HEPES、1%非必需氨基酸、1%丙酮酸钠、1%L-谷氨酰胺和100μMβ-巯基乙醇的RPMI中培养稳定v-abl转化的前B淋巴细胞鼠细胞(如前所述得到(41))。

ChIP和DNA酶I敏感性

如前所述进行染色质免疫沉淀和大规模并行测序(39)。使用了以下抗体:H3K27me3(Millipore,07-449)、H3K4me3(Millipore,04-745)、H3K4me1(Abcam,ab8895)、H3K27ac(Abcam,ab4729)、RNA聚合酶II(PolII,Santa Cruz,sc-899)、GATA1(Abcam,ab11852)以及TAL1(Santa Cruz,sc-12984)。如前所述实施和分析DNA酶I切割密度(42)。对于ChIP-qPCR,通过经ΔCt法比较ChIP材料的扩增与1%投入染色质的扩增来确定相对富集。将以前报道的被GATA1和TAL1占用的和未被GATA1和TAL1占用的基因座分别用作阳性对照和阴性对照(39)。

染色体构象捕获(3C)

除了以下内容外,如先前所述进行3C分析(39)。在连接和逆转交联之前,使用HindIII对来自于甲醛交联的原代人红系细胞前体的细胞核进行消化。使用iQ SYBR Green Supermix(Bio-Rad,170-8880)进行定量实时PCR。将含有BCL11A启动子的片段用作锚定区域。为了校正不同引物的扩增效率,通过对两个包含完整人BCL11A基因座(RP11-606L8和RP11-139C22)的细菌人工染色体(BAC)和一个人β-珠蛋白簇(CTD-3055E11)的等摩尔混合物进行消化和连接来制备对照模板。将人β-珠蛋白基因座控制区域(LCR)的HS1/HS2和HS3中的片段之间的相互作用作为阳性对照。将相互作用频率表示为相对于已知的LCR相互作用的扩增,针对BAC对照模板进行归一化。

精细定位BCL11A基因座

标志物(全部坐标hg19)由三个BCL11A内含子-2DHS+62(chr2:60,717,492-60,718,860)、+58(chr2:60,721,411-60,722,674)以及+55(chr2:60,724,802-60,726,084)之中进行选择。使用北欧(CEU)、尼日利亚(YRI)和非洲裔美国人(ASW)参考群体对来自1000基因组计划数据库的21个标志物进行识别(表S1)。38个另外的变体存在于dbSNP135中(表2)。本发明人通过Sanger化学对分别来自具有高(>8%)HbF水平和低(<2%)HbF水平的CSSCD定群的52名和36名镰状细胞病(SCD)患者中的DNA中的三个DHS间隔(intervals)进行测序。从这个测序努力中识别出七种新的序列变体(表3)。由于大多数标志物簇生在小的基因组间隔中,不可能设计出针对其中一些的基因分型分析。对于在这三个DHS中识别出的66个非冗余变体(non-redundant variants),对来自CSSCD非洲裔美国人SCD定群的1,263名患者中的40个标志物进行了基因分型分析,其中,所述非洲裔美国人SCD定群的基因组DNA(gDNA)是可得的并且HbF水平是已知的(21)。使用Sequenom iPLEX平台对标志物进行基因分型。将基因分型成功率<90%的个体和DNA序列变体排除在外。由三重复估算出的整体基因型一致性为100%。通过质量控制(QC;n=38)的SNP列于表2和表3中,并示意性地示于图11A和图11B的三个DHS下。基因分型的SNP的相当大一部分在参考群体中是罕见的,在CSSCD(n=18)中的单态(monomorphic)并不奇怪。在QC后,留下1,178个个体和20个多态SNP用于分析。如前所述对HbF水平进行建模(9、43)。在加性遗传模型(additive genetic model)下,使用线性回归用PLINK(44)进行单一变体(MAF>1%)的相关性和条件分析。常见变体(MAF>1%)的分析显示,DHS+62中的rs1427407与HbF水平关联最强(P=7.23×10-50;图11A和图3B)。条件分析表明,在rs1427407和rs7606173上进行条件分析后,没有更多SNP是显著的(图3B)。在855个个体(他们的全基因组基因分型数据是可得的)上调整主成分(PC)来解释混合(admixture)和其它混杂因素(confounders)产生了相似的结果。

对于稀有的低频率变体(MAF<5%),本发明人使用三个DHS+62、+58和+55中的每一个作为测试单元进行了基于集合的(set-based)分析。关于这些分析,我们使用了具有缺省参数的序列核关联性检验(sequence kernel association test,SKAT-O)程序(45)。考虑到我们有限的样本大小,本发明人为MAF选择了5%的阈值以使统计能力最大化,但要注意的是,MAF为1%-5%的标志物也在以上给出的单一变体分析中进行了分析。利用与HbF水平独立相关的常见变体,采用条件分析对这种变体重叠进行说明。发现两个集合(即DHS+62和DHS+55)在统计学上是显著的,但在rs1427407和rs7606173上进行条件分析后,结果不再是统计学显著的,表明稀有/低频率变体和常见SNP之间具有弱LD(表5)。尽管对具有极端HbF表型的88位受试者中的这些DHS进行了Sanger再测序,本发明人并未发现关于BCL11A DHS中稀有的低频率序列变体影响SCD受试者的HbF水平的证据。

CSSCD中的rs1427407-rs7606173单倍型频率为:T-G 24.5%、T-C0.085%、G-C 42.3%、以及G-G 33.1%。213个rs1427407-rs7606173G-C个体中的平均HbF水平为4.05%(SD 3.10);254个rs1427407-rs7606173T-G/G-C杂合子中的平均HbF水平为7.08%(SD 4.50);以及60个rs1427407-rs7606173T-G个体中的平均HbF水平为11.21%(SD 4.37)(图3C)。对于基因型间HbF水平的比较,P值通过单尾学生t检验来确定。

分子单倍型分型

对于同一染色体上的2个杂合SNP,存在两种可能的相位(phases):A-B/a-b(模式1)和A-b/a-B(模式2)。对于12kb BCL11A内含子-2片段+52.0-64.4kb中的SNP,通过克隆PCR产物并测定SNP等位基因的共同分布来确定相位。为了确定rs7569946和rs1427407等位基因(在2号染色体上由30.1kb隔开)的相位,如先前所述进行乳液融合PCR(稍加修改)(24、25)。融合PCR使来自于同一染色体不同部分的两个感兴趣的区域一起成为单一产物。通过在水性微滴被油包围的乳液中进行反应,由单一模板分子生成占优势的扩增子。在下列100μl反应(列出了终浓度)中将来自已知对于rs7569946和rs1427407为双重杂合的个体的基因组DNA作为模板:KOD热启动DNA聚合酶(14U,Novagen,71086)、KOD缓冲液(1×)、MgSO4(1.5mM)、dNTP(各0.2mM)、rs7569946-F和rs1427407-R引物(各1μM)、rs7569946-R引物(30nM)、rs7569946-R-revcomp-rs1427407-F桥接内引物(30nM)、gDNA(200ng)。在搅拌下,将100μl水性反应物滴加至200μl油相中以生成乳液。将两个等分的125μl乳液在下列条件下进行扩增:95度2分钟;95度20秒、60度10秒、70度30秒,45个循环;70度2分钟。使己烷萃取的融合PCR产物经历如下25μl的巢式PCR:KOD热启动DNA聚合酶(0.5U)、KOD缓冲液(1×)、MgSO4(1.5mM)、dNTP(各0.2mM)、rs7569946-巢式-F和rs1427407-巢式-R引物(各300nM)、萃取的融合PCR产物(75nl);95度2分钟;95度20秒,60度10秒,70度30秒,35个循环;70度2分钟。通过琼脂糖凝胶电泳证实巣式产物构成预期大小的单一条带。用Zero Blunt PCR Cloning试剂盒(Life Technologies,K2700-20)对纯化的产物进行克隆。融合扩增子的Sanger测序列举出了4个可能序列的克隆:A-B、a-b、A-b和a-B。基于多项分布假设对每种相位的可能性进行了计算(表6)。对两种构型的似然比进行计算,以衡量拟合单倍型模式1(相对于模式2)的数据的统计学显著性。接近无穷大的比率表示模式1,比率为1表示均势,比率接近0表示模式2。

焦磷酸测序

筛选健康的CD34+细胞供体以识别出五个rs1427407杂合子供体。使这些CD34+细胞经历离体红系细胞分化。分离染色质,并用GATA1和TAL1抗体进行ChIP。相比GATA1或TAL1沉淀材料,使投入染色质经历焦磷酸测序,以测定rs1427407的等位基因平衡。对健康的CD34+供体进行筛选,以识别出三个具有rs1427407-rs7606173G-C/T-G单倍型杂合子的供体。使这些CD34+细胞经历离体红系细胞分化。使互补DNA(cDNA)和gDNA经历焦磷酸测序,以测定rs7569946的等位基因平衡。

PCR条件如下:2×HotStarTaq预混液(QIAGEN,203443)、MgCl2(终浓度3mM)、模板DNA(0.1-1ng)以及SNP特异性正向和反向生物素化引物(各200nM)。PCR循环条件为:94℃15min;94℃30s,60℃30s,72℃30s,45个循环;72℃5min。将每对中的一个引物生物素化。将含有生物素化引物的PCR产物链连接至链霉亲和素珠,并与特异性测序引物混合。使用Pyrosequencing PSQ96HS系统(QIAGEN Pyrosequencing)根据制造商的说明,对准备好的单链DNA进行测序和基因分型分析。

转基因小鼠

增强子报告子构建体pWHERE-Dest获得自Dr.William Pu。如先前所述的(46),由pWHERE(Invitrogen,pwhere)修饰而来的构建体具有由最小Hsp68最小启动子驱动的、以鼠H19绝缘子作为侧翼的不含CpG的lacZ变体,在上游MCS处具有Gateway目的盒。从小鼠gDNA中扩增出增强子片段,通过BP克隆酶(Invitrogen,11789020)重组至pDONR221载体(Invitrogen,12536-017)中,然后用LR克隆酶(Invitrogen,11791020)重组至pWHERE-Dest载体中。用PacI对质粒进行消化以除去载体骨架。通过凝胶电泳对lacZ增强子报告子片段进行纯化,然后使用Wizard DNA Clean-Up系统(Promega,A7280)进行浓缩。通过原核注射至FVB受精卵生成转基因小鼠。将约10ng/μl的DNA溶液用于一系列注射。将CD-1雌性个体用作注射的胚胎的接受者。如先前所述,将10.5dpc至14.5dpc的胚胎从代孕母亲中整体切出并进行组织X-gal染色(47)。用核固红(Vector Laboratories,H-3403)对X-gal染色的离心涂片进行复染色。将尾部用于PCR基因分型。动物程序由儿童医院机构动物管理和使用委员会批准。

人红系细胞前体增强子分析

如先前所述(39),将含有假定增强子元件的基因组DNA片段克隆至pLVX-Puro(Clontech,632164)的最小TK启动子和GFP报告基因的上游。根据制造商的方案,用FuGene 6试剂(Promega,E2691)对293T细胞进行转染。24小时后将培养基换为补充有2%青霉素-链霉素的SFEM培养基,并在36小时后收集上清液并过滤。如先前所述(39),通过悬浮离心感染(spin-infection),在扩增第4天和第5天用慢病毒对CD34+细胞来源的红系细胞培养物进行转导。在第二次感染后24小时,将细胞重悬于红系细胞分化培养基中。在感染后48小时,用1μg/ml嘌呤霉素开始进行筛选。在分化培养基中五天之后,通过流式细胞术分析转导细胞的GFP平均荧光强度。

流式细胞术

通过排除7-氨基放线菌素D(7-AAD,BD Pharmingen,559925)对活细胞进行设门(gated)。从青年转基因小鼠中分离骨髓(对于成红细胞)和脾(对于淋巴细胞)悬浮液。在将成熟红血细胞低渗裂解后,基于用CD71-生物素(BD,557416)、链霉亲和素-APC(BD,554067)、Ter-119-PE(BD,553673)、CD19-APC(BD,550992)或CD3-PE(BD,100308)进行的染色,来对活细胞(7-AAD-)进行分选。将CD71+Ter119+、CD19+以及CD3+的分选群用于离心涂片和RNA分离。

TALEN介导的染色体删除

将转录激活因子样效应物核酸酶(TALEN)设计用于在小鼠Bcl11a内含子-2中在相对于TSS的位点+50.4kb(称为5’位点)和+60.4kb(3’位点)处产生切割。TALEN识别以下序列:CTTAAGGCAAGAATCACT(SEQ ID NO:2)(5’左)、CCATGCCTTTCCCCCCCT(SEQ ID NO:3)(5’右)、GAGTTAAAATCAGAAATCT(SEQ ID NO:4)(3’左)和CTGACTAATTGATCAT(SEQ ID NO:5)(3’右)。使用NN RVD,用Golden Gate cloning(48)合成TALEN,以对G进行识别。如先前所述(49),将合成的DNA结合结构域克隆至具有FokI核酸酶结构域、A152N-末端结构域和+63C-末端结构域的pcDNA3.1(Invitrogen,V790-20)中。根据制造商的方案(Lonza,VCA-1005),通过电穿孔将2.5μg四种TALEN质粒中的每种与0.5μg pmaxGFP(Lonza)递送至2×106MEL或前B细胞。48小时后通过流式细胞术分选GFP阳性细胞。通过有限稀释将细胞接种在96孔板中以分离个体克隆。通过gDNA的PCR来检测由5’位点上游和3’位点下游而来的短产物(表明介于中间的区段的删除)的扩增,从而对克隆进行筛选。对单等位基因删除的克隆进行第二轮TALEN介导的删除,以获得双等位基因删除的克隆。通过检测来自删除片段内的扩增的缺失,识别出双等位基因删除的克隆。删除频率大约为50个等位基因中一个。用Southern印迹对删除进行验证。用BmtI对基因组DNA进行消化;将561bp探针(从5’位点上游的gDNA扩增)杂交至来自野生型等位基因的3.6kb片段和来自Δ50.4-60.4删除的等位基因的8.9kb片段。

RT-qPCR和免疫印迹

如先前所述(39),实施用RNeasy柱(Qiagen,74106)进行的RNA分离、用iScript cDNA合成试剂盒(Bio-Rad,170-8890)进行的逆转录、用iQ SYBR Green Supermix(Bio-Rad,170-8880)进行的qPCR以及免疫印迹。对于小鼠β-珠蛋白簇基因,共同引物对识别成体β-珠蛋白β2和β1,而独立引物识别胚胎β-珠蛋白εy和βH1。将以下抗体用于免疫印迹:BCL11A(Abcam,ab19487)、GAPDH(Santa Cruz,sc-25778)。

结果

全基因组关联研究(GWAS)已确定了许多与特性(traits)有关的常见基因变体,其常常定位于调控DNA。调控变体可能作用于实质的遗传力的假设还缺乏实验评价。此处,本发明人显示了,与胎儿血红蛋白(HbF)水平有关的BCL11A处的常见基因变异暗示了被红系细胞增强子染色质标记修饰的非编码序列。在这个假定调控DNA中的精细定位揭示了基序破坏常见变体与降低的转录因子结合、减弱的BCL11A表达以及升高的HbF有关。周围序列在体内作为发育阶段特异性的谱系限制性增强子起作用。通过基因组工程,表明了这个增强子是红系细胞BCL11A表达所需的,而对于红系细胞谱系以外的细胞而言则是可有可无的。这些结果说明了GWAS如何能够突出对于合适的基因表达而言必不可少的在病因元件(causal elements)中具有适度影响的功能性变体。GWAS标出的BCL11A增强子代表了对于β-珠蛋白紊乱而言有利的治疗靶标。

GWAS已非常成功地识别出了与人特性和疾病相关的数千个常见单核苷酸多态性(SNP)。然而,从遗传关联前进至致病生物过程通常很困难。挑战包括可能与个体特性(由于连锁不平衡(LD))有关的大量相关变体、许多变体-特性相关性的适度效应量、以及许多相关变体位于非编码基因组中。最近的基因组规模的染色质图谱研究已凸显了GWAS变体在调控DNA元件中的富集,表明很多病因变体可能影响基因调控。但是,几乎没有已得到实验证实的证实病因变体或元件的显著性的实例。

HbF水平的GWAS一直特别引人注目。仅三个基因座(HBB、HBS1L-MYB和BCL11A)处的遗传变异就占据了HbF水平中高达50%的遗传变异。同一变体还与主要的β-珠蛋白病镰状细胞病和β-地中海贫血的临床严重程度有关,因为HbF是这些紊乱的主要调节物,因此这也许并不令人惊讶。本发明人的实验室和其他人的工作已证实,BCL11A是HbF水平的直接调节物。BCL11A是转录阻遏物,存在于占据β-珠蛋白基因簇的多蛋白复合物中。尽管组成型BCL11A缺陷导致胚胎致死和受损的淋巴细胞发育,BCL11A的红系细胞特异性缺陷阻碍胚胎和胎儿珠蛋白的发育沉默,并足以复苏(rescue)小鼠模型中镰状细胞病的血液学特征和病理学特征。因此,BCL11A已成为β-珠蛋白紊乱的新型治疗靶标。了解受损的BCL11A的影响势在必行。尽管付出了大规模测序的努力,人BCL11A的编码变体尚未被描述。与HbF水平有关的BCL11A变体存在于BCL11A的非编码区域。为了进一步了解常见的遗传变异如何影响BCL11A、HbF水平和β-珠蛋白紊乱严重程度,对HbF相关变体的作用进行了详细研究。

红系细胞增强子附近的特性相关变体

已对红系细胞特性(包括表型,如红细胞数量和体积;血红蛋白浓度;以及HbF水平)进行了许多GWAS以及后续精细定位研究,识别了636个具有全基因组显著性(p<5e-8)的特性相关SNP。相比随机SNP,这些SNP富集在启动子区域和编码区域中(图1)。仍然有多数SNP存在于基因组中其它地方。进行了原代人红系细胞前体的全面染色质谱分析,确定了远端红系细胞增强子(由特征性组蛋白修饰和DNA酶I超敏感性限定)的一个广泛集合。相比非红系细胞特性相关SNP、常用基因分型阵列上发现的SNP或随机排列的SNP,观察到红系细胞GWAS SNP与增强子的强共定位。13.5%的红系细胞特性相关SNP直接落入红系细胞增强子中,相比随机排列的增强子为11.4倍的富集(P<1×10-4),相比1.4%的非红细胞特性相关SNP,表示1.4倍的富集(P=0.0013)。发现红系细胞特性相关SNP中的许多极为靠近红系细胞增强子(图1B)。红系细胞特性相关SNP到红系细胞增强子的中位值距离为16.0千碱基(kb);相比而言,非红系细胞特性相关SNP、基因分型阵列SNP和随机排列的SNP分别为238.0kb、392.6kb和482.4kb。这些结果表明,与红系细胞特性相关的常见变体的很大一部分存在于或接近于红系细胞增强子,并且与病因变体通常影响相关基因调控的这一假设一致。

HbF GWAS标出了红系细胞增强子标记

已进行了HbF水平(或高度相关的特性F细胞数量)的6个GWAS,包括欧洲、非洲和亚洲血统的群体。每个都识别出BCL11A中的特性相关变体。估计BCL11A处的变异解释了约15%的特性变异。四个不同的SNP已被确定为与特性最高度相关(rs1427407、rs11886868、rs4671393和rs766432);这些所谓的“前哨”SNP簇生在BCL11A内含子-2中彼此的3kb内(图2A)。包含所述前哨SNP的单倍型似乎比任何单个SNP都更好地解释了HbF相关性。BCL11A基因座处的50个SNP和内含子-2中的27个SNP以至少全基因组显著性(P<5×10-8)与HbF水平相关。

将BCL11A处的HbF相关SNP的分布与DNA酶I敏感性(暗示调控潜能的染色质状态指标)相比较。在人红系细胞前体中,在内含子-2中观察到DNA酶I超敏感性的三个峰,其邻近并覆盖了HbF相关变体(图2A),基于距BCL11A的TSS的距离(以kb计),被称为DNA酶I超敏感位点(DHS)+62、+58和+55。表达高水平BCL11A的两种组织(脑和B淋巴细胞)以及不表达显著的BCL11A的T淋巴细胞在BCL11A基因座处显示出不同的DNA酶I敏感性模式,其中,少量DNA酶I超敏感性覆盖了特性相关SNP(图2A)。

通过染色质免疫沉淀和大规模并行测序(ChIP-seq),对BCL11A基因座周围的染色质标记进行进一步分析。来自原代人红系细胞前体的ChIP-seq揭示了组蛋白修饰,增强子标记覆盖了BCL11A内含子-2处的特性相关SNP,包括存在H3K4me1和H3K27ac以及缺失H3K4me3和H3K27me3标识(图2A)。主要红系细胞转录因子GATA1和TAL1占据了该增强子区域(图2A)。ChIP-qPCR实验证明了BCL11A内含子-2中GATA1和TAL1结合的三个离散峰,每个都落入了红系细胞DHS中(图2B)。

远端调控元件的一个共同特征是与表达受它们调控的启动子具有远距离相互作用。对BCL11A启动子和跨越BCL11A基因座250kb的片段之间的相互作用进行了评价,包括上游、下游和基因内(intragenic)序列。在含有红系细胞DHS和特性相关SNP的内含子-2区域内观察到最大的启动子相互作用(图2C)。这些结果表明这些序列具有调控潜能。

调控变体

据推测,病因特性相关的SNP可以通过调制关键顺式调控元件来发挥作用。因此,在来自镰状细胞病协作研究(CSSCD,非洲裔美国人镰状细胞病定群,其基因组DNA是可得的并且HbF水平已知)的1263个DNA样品中的三个红系细胞DHS+62、+58和+55内进行大量SNP基因分型。从1000基因组计划中的参考群体CEU、YRI和ASW中识别出位于三个DHS(来自dbSNP)中的66个DNA序列变体,并对来自CSSCD的具有极端HbF表型的88个个体进行Sanger测序。26个标志物无法进行基因分型分析设计,18个是单态(表1和表2)。质量控制后,将1178个个体和20个多态性SNP留下用于相关性测试。对常见变体的分析(次要等位基因频率(MAF)>1%)表明,DHS+62中的rs1427407与HbF水平具有最强的相关性(P=7.23×10-50;表1)。

此前,发明人使用CSSCD对BCL11A基因座处与HbF相关的信号进行精细定位,并报道了与rs4671393具有强相关性;在该项研究中,估算出rs1427407。在以前的研究中,还识别出另外两个SNP(rs766432和rs11886868)为与HbF水平(或F细胞数量)最高度相关的前哨SNP。在其中所有四个前哨SNP处的基因型均已知的个体的子集(N=728)中,在rs1427407处进行基因型条件分析时,rs4671393、rs766432和rs11886868处的相关性结果均不显著;相反,在rs4671393、rs766432或rs11886868上进行条件分析后,rs1427407的相关性仍高度显著(表3)。因此,rs1427407是红系细胞DHS内与HbF最强相关的SNP,并且,比起其它此前描述的前哨SNP,它更好地解释了特性相关性。

当在rs1427407上进行条件分析时,发现三个DHS中未完全丧失的与HbF水平的其它相关性(表1)。在该条件分析中,最显著的残差相关性在DHS+55中是关于rs7606173(P=5.11×10-10);在DHS+58中是关于rs7599488(P=1.71×10-9)(之前已有报道,显著性仅是略低)。当在rs1427407和rs7606173上进行条件分析后,没有更多SNP是显著的(表1)。在855个个体(他们的全基因组基因分型数据是可得的)上调整主成分(PC)来解释混合和其它混杂因素产生了相似的结果(数据未示出)。将rs1427407-rs7606173T-G单倍型定义为与HbF水平最高度相关。

对于稀有的低频率变体(MAF<5%),还使用三个DHS+62、+58和+55中的每一个作为测试集合对它们与HbF水平的相关性进行了分析。发现两个集合(即DHS+62和DHS+55)是显著的,但在rs1427407和rs7606173上进行条件分析后,结果不再是显著的,表明稀有/低频率变体和常见SNP之间具有弱LD(表4)。因此,尽管对来自CSSCD的具有极端HbF表型的88个个体进行了Sanger再测序,未发现关于BCL11A DHS中稀有的低频率序列变体影响SCD患者中的HbF水平的证据。

SNP rs1427407落入由ChIP-seq和ChIP-qPCR测定的GATA1和TAL1结合的峰内(图2A和图2B)。次要T-等位基因破坏了高度类似于半-E-盒/GATA复合基序[CTG(n9)GATA(SEQ ID NO:6)]的序列元件的G-核苷酸。通过ChIP-seq实验,发现这种基序在红系细胞中被GATA1和TAL1复合物高度富集。对来自在rs1427407处主要G-等位基因和次要T-等位基因呈杂合的个体的原代红系细胞样品进行识别,并使这些样品依次经历ChIP和焦磷酸测序。本发明人确定在投入的DNA中等位基因恰好平衡。然而,在GATA1和TAL1免疫沉淀的染色质样品中,观察到与G-等位基因的结合比T-等位基因更频繁(约为60:40)(图3A)。

据此前报道,rs4671393的高HbF相关的A-等位基因与人淋巴母细胞(lymphoblastoid)细胞系中的BCL11A表达相关。对于分析较大的淋巴母细胞细胞系集合,本发明人无法重现BCL11A基因型与表达水平之间的显著相关性(数据未显示)。据推测,在红系细胞特异性情况下,高HbF相关的rs1427407-rs7606173单倍型影响BCL11A表达。常见的同义SNP rs7569946位于BCL11A的外显子-4内,可作为等位基因表达的标志物。将三个原代人红系细胞样品确认为关于rs1427407-rs7606173单倍型和rs7569946的双重杂合子。通过乳液融合PCR使样品经历分子单倍型分型。该单倍型分型表明,对于每个样品,主要rs7569946G-等位基因与低HbF相关的rs1427407-rs7606173G-C单倍型同相(in phase)。通过rs7569946的焦磷酸测序对基因组DNA和cDNA进行分析以测定等位基因平衡。尽管等位基因在基因组DNA中是平衡的,观察到在cDNA中的显著不平衡偏向于增加rs7569946的低HbF关联的G-等位基因的表达(图3B)。这些结果表明,高HbF rs1427407T-等位基因(破坏半-E-盒/GATA基序)与红系细胞前体中降低的GATA1和TAL1结合以及降低的BCL11A表达相关。相比213个低HbF rs1427407-rs7606173G-C单倍型纯合子个体中的4.05%,在60个高-HbF rs1427407-rs7606173T-G单倍型纯合子个体中的平均HbF水平为11.21%(P=2.5×10-19)(图3C)。总而言之,下面的证据表明rs1427407为HbF水平的病因SNP:它与任何已知变体的表型具有最高的相关性,它解释了先前所述的前哨SNP所观察到的相关性,它影响GATA1和TAL1结合所需的基序,并且它与GATA1和TAL1结合以及BCL11A表达相关。然而,在常见单倍型的背景下,该位置处的变异仅与BCL11A表达的适度扰乱有关。

满足红系细胞表达的增强子

为了了解这些明显的调控性特性相关SNP发挥其作用的环境,对所携有的顺式调控元件的功能进行了探索。本发明人克隆了含有三个红系细胞DHS的约12kb(距TSS+52.0-64.4kb),并在转基因报告子分析中对增强子潜能进行了分析。在该分析中,假定的增强子序列位于最小启动子(Hsp68)和周围为绝缘子序列的报告基因(lacZ)的上游。将构建体引入鼠受精卵,并在整个发育过程中监测报告基因表达。在整个发育的中枢神经系统中,内源小鼠BCL11A显示出大量表达,而在胎儿肝脏中则观察到少得多的表达。与此相反,在转基因胚胎中观察到报告基因表达主要限于胎儿肝脏(次级红细胞生成(definitive erythropoiesis)的部位),并注意到在中枢神经系统中较少表达(图4A)。

珠蛋白基因的典型特征是它们的发育调控。在人发育过程中,在头三个月中卵黄囊来源的ε-珠蛋白被胎儿肝脏来源的γ-珠蛋白取代。出生前后,γ-珠蛋白逐渐沉默,而β-珠蛋白被活化。在小鼠个体发生期间仅出现一次基因表达转换。在发生在妊娠中期的这一转换期间,循环的卵黄囊来源的原始红细胞表达胚胎阶段的珠蛋白εy和βH1,而胎儿肝脏次级成红细胞表达成体阶段的珠蛋白β1和β2。与这一发育转换相协调的是,BCL11A表达在次级阶段、而非原始阶段的红系细胞谱系中表达。稳定的转基因谱系来源于BCL11A+52.0-64.4报告子小鼠。在这些E12.5小鼠中,循环红细胞不被X-gal染色,而肝脏成红细胞被强染色为阳性(图4B)。在E10.5,lacZ表达仅在胎儿肝原基中观察到,而并未在卵黄囊、胎盘、或胚胎中的循环血液中观察到(图6A)。这些结果表明,GWAS标出的BCL11A内含子-2调控序列足以指定发育上适宜的基因表达。

在造血隔室(compartment)内,BCL11A表达存在于红系细胞前体和B淋巴细胞中。从转基因青年动物中分离红系细胞前体和B淋巴细胞,并对lacZ报告基因的表达进行评价。相比于骨髓红系细胞前体,内源性BCL11A在脾B淋巴细胞中以10.4倍高的水平表达。然而,lacZ表达局限于红系细胞前体,在B淋巴细胞中未观察到(图4C)。这些结果表明了这些调控序列的红系细胞特异性。

生成了一系列删除突变体以细化红系细胞增强子活性所需的最小元件。含有中央+58DHS的序列对于红系细胞增强子活性是足够的。仅含有侧翼+62或+55元件的那些序列不能指导红系细胞基因表达(图6B)。还对这些DHS在原代人红系细胞前体中增强基因表达的能力进行了测试。本发明人使用了如前所述的具有最小TK启动子的GFP报告子系统的慢病毒递送。类似地,在这个报告子分析中,只有+58DHS、而非+55或+62DHS能够使基因表达增强(图7)。

红系细胞表达的增强子需求

接下来,本发明人选择对BCL11A和珠蛋白基因的适当表达对这些调控序列的需要进行测定。在先前公开的小鼠红系细胞全面染色质谱分析中对Bcl11a基因座的检查显示出,内含子-2这一区域拥有直系同源增强子标记,存在H3K4me1和H3K27ac并缺乏H3K4me3和H3K27me3,并且被GATA1和TAL1所占据(图8)。此外,在这些序列处观察到红系细胞特异性DNA酶I超敏感性。在人红系细胞DHS+62、+58和+55的每个中,观察到了进化序列保守性的证据,特别是在+62和+55内。为了确定BCL11A表达对这些直系同源调控序列的需要,使用了小鼠红白血病细胞系(MEL)。这些细胞依赖于BCL11A表达来进行适当的成体阶段模式珠蛋白基因表达。序列特异性核酸酶会导致生产小的染色体删除。将TALEN工程化,以将双链断裂引入至携带有红系细胞增强子染色质标记的直系同源10kb Bcl11a内含子-2序列的侧翼。就NHEJ介导的修复来对克隆进行筛选,并将具有双等位基因删去的三个独特克隆分离。PCR和Southern印迹验证了克隆内的内含子区段的删去(图9)。Sanger测序的断点是具有后续NHEJ修复的TALEN介导的切割的特征(图10)。

对具有双等位基因10kb内含子删除的MEL细胞中的BCL11A表达进行分析。观察到BCL11A表达显著降低至基线水平的约3%(图5A)。使用对位于该删除上游、跨越该删除、或位于该删除下游的外显子连接进行检测的引物对,注意到了类似的降低。通过蛋白质印迹,BCL11A表达在10kb增强子删除的克隆中是不可检测的(图5B)。MEL细胞通常表达高水平的成体珠蛋白基因β1和β2以及低水平的胚胎珠蛋白基因εy和βH1。在缺乏BCL11A的10kb增强子的情况下,成体珠蛋白基因的表达减少了约2-5倍,而胚胎珠蛋白基因显著地脱阻遏(derepressed)。在三个缺乏直系同源BCL11A红系细胞增强子的克隆中,胚胎εy与成人β1/2的比平均增加了364倍(图5C)。

为了确定+50.4-60.4kb内含子序列是否是BCL11A表达普遍需要的,在非红系细胞环境中对它们的缺失进行评价。在pro-B淋巴细胞细胞系中,使用引入两对TALEN来获得具有NHEJ介导的Δ50.4-60.4删除的克隆的相同策略。将两个独特的Δ50.4-60.4克隆分离,并通过PCR、Southern印迹和Sanger测序进行确证(图9和图10)。与红系细胞相反,在Δ50.4-60.4kb增强子删除的pro-B细胞克隆中,BCL11A表达在RNA水平和蛋白水平上均得到保留(图5A和图5B)。这些结果表明,直系同源红系细胞增强子序列对于从Bcl11a基因座转录的完整性不是必需的,其仅对红系细胞基因表达而言是必不可少的。

在BCL11A的内含子-2处发现了增强子染色质标记,其直接覆盖了HbF相关SNP。这个区域具有增强子的许多生化特征,包括在缺乏H3K4me3和H3K27me3的情况下被组蛋白标志H3K4me1和H3K27ac占据、红系细胞TF GATA1和TAL1的结合、红系细胞特异性DNA酶I超敏感位点、以及通过3C进行的长距离启动子相互作用。此外,本发明人能够使用DHS作为指导对该基因座进行精细定位,从而识别出SNP rs1424707与所述特性最高度相关,并且完全解释了先前所述的特性相关性和高度关联的前哨SNP。此外,本文证明了,rs1427407破坏了红系细胞前体中被转录因子GATA1和TAL1占据的半-E-盒/GATA基序。然而,即使在rs1427407上进行条件分析后,仍存在与相邻DHS中的数个其它SNP的相关性,表明了单倍型作用。发现在相邻元件中具有SNP基因型组合(其中的每个均调制调控功能)的单倍型协作提供BCL11A表达的最终表型。使用杂合子供体,证明了高HbF相关的单倍型对TF结合和BCL11A表达这二者具有适度影响。

这些研究有助于估计导致患有β-珠蛋白紊乱的患者中HbF水平出现临床意义增加所需的BCL11A表达的变化。高HbF rs1427407-rs7606173T-G和低HbF G-C单倍型之间的BCL11A表达差异为1.7倍;T-G纯合子和G-C纯合子的HbF水平分别为11.2%和4.1%(图3B和图3C)。已经预测出>20%的HbF水平防止SCD的不良后果。BCL11A表达的数倍降低将可能达到该HbF目标。

该研究识别出影响红系细胞增强子的BCL11A处的调控性变异。许多特性相关SNP是非编码的,并且具有相对小的效应量。由于这些特征,有时认为这些SNP具有可忽略不计的临床重要性。该研究表明,由单个非编码变体造成的小效应量并不妨碍基础调控元件的大效应量。例如,尽管功能性SNP对根本的基因靶标BCL11A的表达具有相对适度的影响,病因调控元件对于成体阶段红系细胞前体中BCL11A和珠蛋白基因的表达是必不可少的。在非红系细胞谱系中,同一调控元件对于BCL11A表达而言是可有可无的。研究保护性等位基因的目标在于试图了解其根本的分子机制,以使处于风险的个体重现这种生物效应。因此,许多特性相关的多态性会存在于环境特异性(context-specific)的关键调控元件中,其功能可进一步阐明所述特性的深层生物学,而不是仅识别出调控的基因。例如,BCL11A缺失在引起受损的血红蛋白转换的同时,还导致受损的神经形成和淋巴细胞生成(lymphopoeisis),并导致胚胎死亡。最终,对特性的深层病因调控元件和相关调控网络更好的了解能够识别出新的治疗靶标。BCL11A的红系细胞增强子自身便可构成用于治疗性基因组编辑的有利靶标,其中,切除(ablation)可能阻碍红系细胞前体中的BCL11A表达,从而使得HbF脱阻遏;同时,非红系细胞谱系中的BCL11A表达得到保留。

参考文献:

1.L.Fugger,G.McVean,J.1.Bell,N.Engl.J.Med.367,2370-2371(2012).

2.J.Ernst et al.,Nature.473,43-49(2011).

3.D.S.Paul et al.,PLoS Genet.7,e1002139(2011).

4.M.T.Maurano et al.,Science.337,1190-1195(2012).

5.P.van der Harst et al.,Nature.492,369-375(2012).

6.ENCODE Project Consortium et al.,Nature.489,57-74(2012).

7.S.Menzel et al.,Nat.Genet.39,1197-1199(2007).

8.M.Udaet al.,Proc.Natl.Acad.Sci.U.S.A.105,1620-1625(2008).

9.G.Lettre et al.,Proc.Natl.Acad.Sci.U.S.A.105,11869-11874(2008).

10.M.Nuinoon et al.,Hum.Genet.127,303-314(2010).

11.N.Solovieffet al.,Blood.115,1815-1822(2010).

12.P.Bhatnagar et al.,J.Hum.Genet.56,316-323(2011).

13.V.G.Sankaran et al.,Science.322,1839-1842(2008).

14.J.Xu et al.,Genes Dev.24,783-798(2010).

15.J.Xu et al.,Proc.Natl.Acad.Sci.U.S.A.110,6518-6523(2013).

16.V.G.Sankaran et al.,Nature.460,1093-1097(2009).

17.J.Xu et al.,Science.334,993-996(2011).

18.F.Esteghamat et al.,Blood.121,2553-2562(2013).

19.P.Liu et al.,Nat.Immunol.4,525-532(2003).

20.Y.Yu et al.,J.Exp.Med.209,2467-2483(2012).

21.M.D.Farber,M.Koshy,T.R.Kinney,J.Chronic Dis.38,495-505(1985).

22.E.Soler et al.,Genes Dev.24,277-289(2010).

23.M.T.Kassoufet al.,Genome Res.20,1064-1083(2010).

24.D.J.Turner,M.E.Hurles,Nat.Protoc.4,1771-1783(2009).

25.J.Tyson,J.A.Armour,BMC Genomics.13,693-2164-13-693(2012).

26.M.Leid et al.,Gene Expr.Patterns.4,733-739(2004).

27.M.S.Kowalczyk et al.,Mol.Cell.45,447-458(2012).

28.H.J.Lee,E.Kim,J.S.Kim,Genome Res.20,81-89(2010).

29.D.E.Bauer,S.C.Kamran,S.H.Orkin,Blood.120,2945-2953(2012).

30.A.John et al.,Development.139,1831-1841(2012).

31.R.P.Patwardhan et al.,Nat.Biotechnol.30,265-270(2012).

32.A.Melnikov et al.,Nat.Biotechnol.30,271-277(2012).

33.K.A.Frazer,S.S.Murray,N.J.Schork,E.J.Topol,Nat.Rev.Genet.10,241-251(2009).

34.A.N.Koehler,Curr.Opin.Chem.Biol.14,331-340(2010).

35.F.D.Urnov,E.J.Rebar,M.C.Holmes,H.S.Zhang,P.D.Gregory,Nat.Rev.Genet.11,636-646(2010).

36.J.K.Joung,J.D.Sander,Nat.Rev.Mol.Cell Biol.14,49-55(2013).

37.J.van der Oost,Science.339,768-770(2013).

38.Thanks to A.Woo,A.Cantor,M.Kowalczyk,S.Burns,J.Wright,J.Snow,J.Trowbridge and members of the Orkin laboratory,particularly C.Peng,P.Das,G.Guo,M.Kerenyi,and E.Baena,for discussions.C.Guo and F.Alt provided the pre-B cell line,A.He and W.Pu the pWHERE lacZ reporter construct,C.Currie and M.Nguyen technical assistance,D.Bates and T.Kutyavin expertise with sequence analysis,R.

39.J.Xu et al.,Dev.Cell.23,796-811(2012).

40.E.van den Akker,T.J.Satchwell,S.Pellegrin,G.Daniels,A.M.Toye,Haematologica.95,1594-1598(2010).

41.A.L.Bredemeyer et al.,Nature.442,466-470(2006).

42.R.E.Thurman et al.,Nature.489,75-82(2012).

43.G.Galarneau et al.,Nat.Genet.42,1049-1051(2010).

44.S.Purcell et al.,Am.J.Hum.Genet.81,559-575(2007).

45.M.C.Wu et al.,Am.J.Hum.Genet.89,82-93(2011).

46.A.He,S.W.Kong,Q.Ma,W.T.Pu,Proc.Natl.Acad.Sci.U.S.A.108,5632-5637(2011).

47.M.A.McDevitt,Y.Fujiwara,R.A.Shivdasani,S.H.Orkin,Proc.Natl.Acad.Sci.U.S.A.94,7976-7981(1997).

48.T.Cermak et al.,Nucleic Acids Res.39,e82(2011).

49.J.C.Miller et al.,Nat.Biotechnol.29,143-148(2011).

50.R.Galanello et al.,Blood.114,3935-3937(2009).

51.H.T.Bae et al.,Blood.120,1961-1962(2012).

52.K.E.McGrath et al.,Blood.117,4600-4608(2011).

53.D.Noordermeer,W.de Laat,IUBMB Life.60,824-833(2008).

54.D.R.Higgs,D.Vernimmen,B.Wood,Adv.Genet.61,143-173(2008).

55.E.Pinaud et al.,Adv.Immunol.110,27-70(2011).

表1.BCL11A DHS+62、+58或+55中常见SNP的相关性分析

来自1178个个体(来自可用于分析的CSSCD)的BCL11A DHS+62、+58或+55中的常见(MAF>1%)SNP的相关性分析。DHS:DNA酶I超敏感位点;MAF:次要等位基因频率。

表2.BCL11A DHS+62、+58或+55内的SNP

落入BCL11A DHS+62、+58或+55内以及存在于dbSNP或1000基因组数据(关于YRI、CEU和ASW参考群体)中的SNP。确定了基因分型的SNP,并且列出了在CSSCD内的MAF。基因组坐标hg19。

表3.由Sanger再测序发现的另外的标志物

对具有极端HbF表型的88个个体(来自CSSCD)中BCL11A内的三个DHS进行Sanger再测序。列出了所识别出的新标志物。确定了基因分型的SNP,并列出了在CSSCD内的MAF。基因组坐标hg19。

表4.四个前哨SNP的条件分析

先前与HbF水平有关的四种常见前哨SNP的条件分析{{44;20;19;36;37;515}}。对来自CSSCD的728个个体中的全部四种SNP进行基因分型。当在rs4671393上进行条件分析时,无法计算关于rs766432的P(反之亦然),这是由于这两种标志物具有过强的关联(r2=0.997)。rs1427407和rs766432之间r2=0.848;rs1427407和rs11886868之间r2=0.709;rs1427407和rs4671393之间r2=0.850;rs766432和rs11886868之间r2=0.761;rs11886868和rs4671393之间r2=0.758。

表5.稀有的低频率变体的分析

稀有的低频率变体的分析结果(MAF<5%)。使用基于集合的SKAT-O算法,用单个DHS+62、+58和+55作为三个不同的集合来进行分析。最后一行的“全部”显示了所述三个区域折叠(collapsed)在一起时的测试结果。

表6.乳液融合单倍型分型PCR测序

rs7569946-rs1427407单倍型的乳液融合PCR分析。在乳液中进行来自对于rs7569946和rs1427407呈双重杂合的三个个体供体的融合PCR,从而产生包含这两种SNP的融合扩增子。对所述融合扩增子进行克隆,并对各个克隆进行Sanger测序。列出了每个基因型的克隆数目。计算了关于G-G/A-T相位与G-T/A-G相位相比的似然比。

表7.用于报告子分析的片段的坐标

在增强子报告子分析中克隆的假定的增强子片段的坐标。列出了在hg19中的2号染色体坐标以及相对于BCL11A TSS的坐标。

表8.寡核苷酸序列

在所标示的实验中使用的寡核苷酸。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1