用于治疗法布里病的方法和组合物与流程

文档序号:18183980发布日期:2019-07-17 05:18阅读:711来源:国知局
用于治疗法布里病的方法和组合物与流程

本专利申请要求2016年10月20日提交的美国临时申请no.62/410,543、2017年1月9日提交的美国临时申请no.62/444,093、2017年2月13日提交的美国临时申请no.62/458,324、2017年5月5日提交的美国临时申请no.62/502,058、2017年6月7日提交的美国临时申请no.62/516,373和2017年8月31日提交的美国临时申请no.62/552,792的权益,这些临时申请的公开内容据此以引用的方式整体并入。

本公开涉及预防和/或治疗法布里病(fabrydisease)和基因治疗领域。



背景技术:

基因治疗在人类治疗的新时代具有巨大的潜力。这些方法将允许治疗迄今为止通过标准医疗实践尚未解决的病症。一个特别有希望的领域是能够将转基因加入细胞中以使该细胞表达此前未在该细胞中产生或次优产生的产物。该技术的用途的实例包括插入编码治疗性蛋白的基因,插入在细胞或个体中某种程度上缺乏的编码蛋白质的编码序列,以及插入编码结构性核酸(诸如微rna)的序列。

转基因可以通过多种方式递送至细胞,使得转基因整合到细胞自身的基因组并维持在其中。近年来,已经开发了转基因整合策略,该策略使用通过位点特异性核酸酶进行的切割,以便靶向插入选定的基因组基因座中(参见例如,共同拥有的美国专利7,888,121)。核酸酶(诸如锌指核酸酶(zfn)、转录激活因子样效应物核酸酶(talen))或核酸酶系统(诸如rna指导的crispr/cas系统(利用经工程化的指导rna))对靶基因具有特异性,并且可以用于产生这样的结果:使转基因构建体通过同源介导的修复(hdr)或在非同源性末端接合(nhej)驱动的过程期间通过末端捕获来插入。参见例如美国专利no.9,394,545、9,255,250、9,200,266、9,045,763、9,005,973、9,150,847、8,956,828、8,945,868、8,703,489、8,586,526、6,534,261、6,599,692、6,503,717、6,689,558、7,067,317、7,262,054、7,888,121、7,972,854、7,914,796、7,951,925、8,110,379、8,409,861;美国专利公开20030232410、20050208489、20050026157、20050064474、20060063231、20080159996、201000218264、20120017290、20110265198、20130137104、20130122591、20130177983、20130196373、20140120622、20150056705、20150335708、20160030477和20160024474,这些专利的公开内容以引用的方式整体并入。

可以以多种方式将转基因引入和维持在细胞中。按照“cdna”方法,转基因被引入细胞中,从而使转基因维持在染色体外,而不是通过整合到细胞的染色质中。转基因可以维持在环状载体(例如,质粒或非整合性病毒载体(诸如aav或慢病毒))上,其中该载体可以包括转录调控序列(诸如启动子、增强子、多聚a信号序列、内含子和剪接信号)(美国公开no.20170119906)。另一种方法涉及将转基因插入高表达的安全港位置,诸如白蛋白基因(参见美国专利no.9,394,545)。该方法称为体内蛋白质替代平台(invivoproteinreplacement)或ivprp。按照这种方法,通过核酸酶介导的靶向插入将转基因插入安全港(例如,白蛋白)基因,其中转基因的表达由白蛋白启动子驱动。转基因被工程化为包含信号序列以帮助由转基因编码的蛋白质的分泌/外排。

“安全港”基因座包括诸如人类细胞中的aavs1、hprt、白蛋白和ccr5基因,以及鼠科动物细胞中的rosa26的基因座。参见例如美国专利no.7,888,121、7,972,854、7,914,796、7,951,925、8,110,379、8,409,861、8,586,526、美国专利公开20030232410、20050208489、20050026157、20060063231、20080159996、201000218264、20120017290、20110265198、20130137104、20130122591、20130177983、20130177960和20140017212。与依赖于转基因的随机整合的经典整合方法相比,核酸酶介导的整合提供了改善的转基因表达、增加的安全性和表达持久性的前景,因为它允许精确的转基因定位以使基因沉默或附近癌基因的活化的风险最小化。

虽然将转基因递送至靶细胞是完全实施该技术必须克服的一个障碍,但是必须克服的另一个问题是确保在转基因被插入细胞中并表达之后,这样编码的基因产物必须达到生物体的必要位置,并且在足够的局部浓度下有效。对于以缺乏蛋白质或存在异常非功能性蛋白质为特征的疾病,转基因编码的野生型蛋白质的递送可以是非常有帮助的。

溶酶体贮积病(lsd)是一组罕见的代谢单基因病,它们的特征为缺乏通常参与废脂质、糖蛋白和粘多糖分解的各种功能性溶酶体蛋白。这些疾病的特征为这些化合物在细胞中的积累,因为由于特定酶的功能丧失而不能将它们加工用于再循环。最常见的例子是戈谢(gaucher)病(葡萄糖脑苷脂酶缺乏-基因名称:gba)、法布里病(α半乳糖苷酶a缺乏-gla)、亨特氏(hunter)症(艾杜糖醛酸-2-硫酸酯酶缺乏-ids)、贺勒氏(hurler)症(α-l-艾杜糖醛酸酶缺乏-idua)、庞贝氏(pompe)症(α-葡萄糖苷酶(gaa))和尼曼-匹克(niemann-pick)病(神经鞘磷脂磷酸二酯酶1缺乏-smpd1)。当把所有组合在一起时,lsd在7000名新生儿群体中的发病率约为1。另见美国专利公开no.20140017212、2014-0112896和20160060656。

例如,法布里病是α半乳糖苷酶a(α-gala)缺乏所导致的x连锁的鞘糖脂代谢病。它与鞘糖脂(包括球形三酰基神经酰胺(也称为gl-3和gb3)和球形三酰基鞘氨醇(lyso-gb3)、球形二酰基神经酰胺(galabioasylceramide)和b血型物质)的进行性沉积相关。疾病的症状多种多样,可以包括灼热、刺痛(肢端感觉异常)或剧烈疼痛发作(它们称为“法布里危象”),这些症状可以持续数分钟至数天。其他症状包括出汗减少、运动耐受性低、红紫色皮疹(称为血管角化瘤)、眼部异常、胃肠道问题、心脏问题(诸如心脏扩大和心脏病发作)、可导致肾功能衰竭的肾脏问题和cns问题以及一般情况下法布里病患者的预期寿命大幅缩短。

目前对法布里病的治疗可涉及使用两种不同的人类α-gala制剂(即,阿加糖酶(agalsidase)β或阿加糖酶α)进行的酶替代疗法(ert),这需要每两周一次对患者进行昂贵和耗时的输注(通常在约0.2-1mg/kg之间)。这种疗法仅用于治疗症状并且不是治愈性的,因此在患者的余生中必须重复给患者施用这些蛋白质,并且可能产生针对所注射的蛋白质的中和抗体。

此外,不良反应与ert(包括免疫反应)诸如在用α-gala制剂治疗的受试者中产生抗α-gala抗体相关联。事实上,50%的用阿加糖酶α治疗的男性和88%的用阿加糖酶β治疗的男性产生了α-gala抗体。重要的是,这些抗体中的很大一部分是中和抗体,因此降低了疗法的治疗效果(meghdari等人(2015)plosone10(2):e0118341.doi:10.1371/journal.pone.0118341)。此外,ert不会阻止所有患者的疾病进展。

因此,仍然需要可用于治疗法布里病的非ert方法和组合物,包括通过基因组编辑进行治疗,例如以治疗相关水平递送所表达的转基因编码的基因产物。



技术实现要素:

本文公开了用于治疗和/或预防法布里病的方法和组合物。本发明描述了用于将转基因序列插入合适的靶细胞(例如,患有法布里病的受试者)的方法,其中所述转基因编码治疗所述疾病的至少一种蛋白质(例如,至少一种α-gala蛋白)。所述方法可以是体内的(将转基因序列递送至活体受试者中的细胞)或离体的(将经修饰的细胞递送至活体受试者)。本发明还描述了用于通过表达系统来转染和/或转导合适的靶细胞以使得编码α-gala的转基因表达治疗疾病(例如,减轻一种或多种疾病相关的症状)的蛋白质的方法。α-gala蛋白可以从靶细胞外排(分泌),以使得α-gala蛋白能够影响不携带转基因的其他细胞或被这些细胞吸收(交叉矫正)。本发明还提供了用于制备产生高水平α-gala的细胞(例如,成熟的或未分化的细胞)的方法,其中将这些改变的细胞群引入患者中将提供治疗疾病或病症所需的蛋白质。此外,本发明提供了用于制备产生高活性形式(治疗性)的α-gala的细胞(例如,成熟的或未分化的细胞)的方法,其中这些改变的细胞群引入患者中或在患者中形成这些改变的细胞群将提供治疗法布里病(例如,减少或消除一种或多种症状)所需的蛋白质活性。如本文所述产生的高活性形式的α-gala也可以从如本文所述的细胞分离,并使用技术人员已知的标准酶替代程序施用于有需要的患者。

本文描述了用于表达至少一种α半乳糖苷酶a(α-gala)蛋白的方法和组合物。所述组合物和方法可以体外、体内或离体使用,并且包括将编码至少一种α-gala蛋白的gla转基因(例如,具有野生型或密码子优化的gla序列的cdna)施用于细胞,以使得α-gala蛋白在细胞中表达。在某些实施方案中,细胞处于患有法布里病的受试者中。在本文所述的任何方法中,转基因可以施用于受试者的肝脏。任选地,所述方法还包括施用一种或多种核酸酶,所述核酸酶在受试者的肝细胞中切割内源性白蛋白基因,以使得转基因整合到白蛋白基因中并由白蛋白基因表达。在本文所述的任何方法中,由转基因表达的α-gala蛋白可使受试者中的鞘糖脂的量降低至少2倍。gla转基因还可以包含其他元件,包括例如信号肽和/或一种或多种控制元件。还提供了包含外源性gla转基因(整合的或染色体外的)的经基因修饰的细胞(例如,干细胞、前体细胞、肝细胞,肌细胞等),包括通过本文描述的方法制备的细胞。这些细胞可用于将α-gala蛋白提供给患有法布里病的受试者,例如通过将一种或多种细胞施用于有需要的受试者,或者通过分离由所述细胞产生的α-gala蛋白以及将所述蛋白质施用于有需要的受试者(酶替代疗法)。还提供了包含gla转基因的载体(例如,病毒载体,诸如aav或ad或脂质纳米颗粒),所述gla转基因用于本文所述的任何方法,包括用于治疗法布里病。

在一个方面,本发明描述了一种在受试者的细胞中表达编码一种或多种矫正性gla转基因的转基因的方法。转基因可以插入合适的靶细胞(例如,血细胞、肝细胞、脑细胞、干细胞、前体细胞等)的基因组中,以使得由所述矫正性转基因编码的α-gala产物稳定整合到细胞的基因组中(也称为方法),或者转基因可以在染色体外维持在细胞中(也称为“cdna”方法)。在一个实施方案中,将矫正性gla转基因(稳定地或染色体外)引入细胞系的细胞中,用于体外产生替代蛋白质,然后可以将所述替代蛋白质(任选地纯化的和/或分离的)施用于受试者,用于治疗患有法布里病的受试者(例如,通过减少和/或消除与法布里病相关的一种或多种症状)。在某些实施方案中,与未经治疗的受试者相比,由所述矫正性转基因编码的α-gala产物使受试者组织中的α-gala活性增加任何量,例如2至多于1000倍(或其间的任何值),包括但不限于2至100倍(或其间的任何值,包括10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍)、100至500倍(或其间的任何值)、或500至1000倍或更多。

在另一个方面,本文描述了治疗患有法布里病的受试者的离体或体内方法(例如,通过减少和/或消除与法布里病相关的一种或多种症状),所述方法包括将gla转基因插入如本文所述的细胞(cdna和/或ivprp方法),以使得在患有法布里病的受试者中产生所述蛋白质。在某些实施方案中,包含gla转基因的分离的细胞可用于例如通过将所述细胞施用于患有法布里病的受试者来治疗有需要的患者。在其他实施方案中,将矫正性gla转基因插入体内的靶组织中,以使得所述替代蛋白质在体内产生。在一些优选的实施方案中,将矫正性转基因插入靶组织中的细胞的基因组中,而在其他优选的实施方案中,将矫正性转基因插入靶组织的细胞中,并在染色体外维持在细胞中。在本文所述的任何方法中,所表达的α-gala蛋白可以从细胞中外排以作用于次级靶标或被次级靶标(包括被缺乏gla转基因的其他组织中的其他细胞(例如,通过输出到血液中))吸收(交叉矫正)。在一些情况下,初级和/或次级靶组织是肝脏。在其他情况下,初级和/或次级靶组织是脑。在其他情况下,初级和/或次级靶标是血液(例如,血管系统)。在其他情况下,初级和/或次级靶标是骨骼肌。

在某些实施方案中,本文所述的方法和组合物用于减少沉积于患有法布里病的受试者的组织中的鞘糖脂(包括球形三酰基神经酰胺(也称为gl-3和gb3)和球形三酰基鞘氨醇(lyso-gb3)、球形二酰基神经酰胺)的量。在某些实施方案中,与未经治疗的受试者相比,由所述矫正性转基因编码的α-gala产物使受试者组织中的鞘糖脂减少任何量,例如2至多于100倍(或其间的任何值),包括但不限于2至100倍(或其间的任何值,包括10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍)。

在本文所述的任何方法中,矫正性gla转基因包含功能性gla基因的野生型序列,而在其他实施方案中,矫正性gla转基因的序列以某种方式改变,以提供增强的生物学活性(例如,优化密码子以增加生物学活性和/或改变转录和翻译调控序列以改善基因表达)。在一些实施方案中,修饰gla基因以改善表达特征。此类修饰可以包括但不限于插入翻译起始位点(例如甲硫氨酸)、添加优化的科扎克(kozak)序列、插入信号肽和/或密码子优化。在一些实施方案中,信号肽可以选自白蛋白信号肽、f.ix信号肽、ids信号肽和/或α-gala信号肽。在本文所述的任何实施方案中,gla供体可以包括如图1b、1c、10和/或13中的任一者所示的供体。

在本文所述的任何方法中,可以使用核酸酶将gla转基因插入靶细胞的基因组中。合适的核酸酶的非限制性实例包括锌指核酸酶(zfn)、talen(转录激活因子样蛋白质核酸酶)和/或crispr/cas核酸酶系统,这些核酸酶包括结合细胞基因组中所关注的区域(例如,疾病相关基因、高表达的基因、白蛋白基因或其他或安全港基因)以及一个或多个核酸酶结构域(例如,切割结构域和/或切割半结构域)中的靶点的dna结合分子。切割结构域和切割半结构域可以例如从各种限制性核酸内切酶、cas蛋白和/或归巢核酸内切酶获得。在某些实施方案中,锌指结构域识别红细胞前体细胞(rbc)中的白蛋白基因或珠蛋白基因中的靶点。参见例如美国专利公开no.2014001721,该专利公开以引用的方式整体并入本文。在其他实施方案中,核酸酶(例如,zfn、talen和/或crispr/cas系统)结合和/或切割安全港基因,例如ccr5基因、ppp1r12c(也称为aavs1)基因、白蛋白、hprt或rosa基因。参见例如美国专利no.7,888,121、7,972,854、7,914,796、7,951,925、8,110,379、8,409,861、8,586,526、美国专利公开20030232410、20050208489、20050026157、20060063231、20080159996、201000218264、20120017290、20110265198、20130137104、20130122591、20130177983、20130177960和20140017212。核酸酶(或其组分)可以作为编码本文所述的一种或多种核酸酶(例如,zfn、talen和/或crispr/cas系统)的多核苷酸提供。多核苷酸可以是例如mrna。在一些方面,mrna可以是经化学修饰的(参见例如kormann等人,(2011)naturebiotechnology29(2):154-157)。在其他方面,mrna可以包含arca帽(参见美国专利7,074,596和8,153,773)。在另外的实施方案中,mrna可以包括未经修饰的核苷酸和经修饰的核苷酸的混合物(参见美国专利公开20120195936)。在另外的实施方案中,mrna可以包含wpre元件(参见美国专利公开no.20160326548)。

在另一个方面,本发明包括具有所需gla转基因(任选地使用核酸酶整合)的经基因修饰的细胞(例如,干细胞、前体细胞、肝细胞、肌细胞等)。在一些方面,然后扩增经编辑的干细胞或前体细胞,并且可以诱导它们离体分化为成熟的经编辑的细胞,然后将这些细胞给予患者。因此,可以选择如本文所述的经遗传编辑的(经修饰的)产生gla的干细胞或前体细胞的后代细胞以用于本发明。在其他方面,经编辑的前体细胞(例如,cd34+干细胞)在骨髓移植中给予,所述前体细胞在成功移植后增殖产生经编辑的细胞,然后体内分化和成熟并且含有由gla转基因表达的生物剂。在一些实施方案中,将经编辑的cd34+干细胞静脉内给予患者,以使得经编辑的细胞迁移至骨髓、分化和成熟、产生α-gala蛋白。在其他方面,经编辑的干细胞是肌肉干细胞,然后将所述肌肉干细胞引入肌肉组织。在一些方面,经工程化的核酸酶是锌指核酸酶(zfn)(术语“zfn”包括一对zfn),在其他方面,核酸酶是tale核酸酶(talen)(术语“talen”包括一对talen),在其他方面,使用crispr/cas系统。可以将核酸酶工程化为对安全港基因座(与疾病相关的基因)或对在细胞中高表达的基因具有特异性。仅作为非限制性实例,安全港基因座可以是aavs1位点、ccr5基因、白蛋白或hprt基因,而疾病相关基因可以是编码α-半乳糖苷酶a的gla基因。

在另一个方面,本文描述了核酸酶(例如,zfn、zfn对、talen、talen对和/或crispr/cas系统)表达载体,所述核酸酶表达载体包含编码如本文所述的可操作地连接至启动子的一种或多种核酸酶的多核苷酸。在一个实施方案中,表达载体是病毒载体。在另一个方面,本文描述了gla表达载体,所述gla表达载体包含编码如本文所述的可操作地连接至启动子的α-gala的多核苷酸。在一个实施方案中,表达是病毒载体。

在另一个方面,本文描述了包含一种或多种核酸酶(例如,zfn、zfn对、talen、talen对和/或crispr/cas系统)表达载体和/或如本文所述的α-gala表达载体的宿主细胞。宿主细胞可以用一种或多种核酸酶表达载体稳定转化或瞬时转染或它们的组合。在一些实施方案中,宿主细胞是肝细胞。

在其他实施方案中,提供了用如本文所述的治疗性gla转基因替代任何靶基因中的基因组序列的方法,例如使用如本文所述的核酸酶(例如,zfn、zfn对、talen、talen对和/或crispr/cas系统)(或编码所述核酸酶的一种或多种载体)以及用核酸酶靶向切割后插入基因的“供体”序列或gla转基因。供体gla序列可以存在于携带核酸酶(或其组分)的载体中,存在于单独的载体(例如,ad、aav或lv载体或mrna)中,或者可以使用不同的核酸递送机制导入细胞中。这种供体核苷酸序列插入靶基因座(例如,高表达的基因、疾病相关基因、其他安全港基因等)将导致gla转基因在靶基因座的(例如,白蛋白、珠蛋白等)内源性遗传控制元件的控制下表达。在一些方面,gla转基因插入例如靶基因(例如,白蛋白)导致完整的α-gala蛋白序列的表达,并且缺少由靶标(例如,白蛋白)编码的任何氨基酸。在其他方面,所表达的外源性α-gala蛋白是融合蛋白,并且包含由gla转基因编码的氨基酸和gla转基因所插入的内源性基因座(例如,来自内源性靶基因座,或者来自编码靶基因座序列的转基因上的序列)。靶标可以是任何基因,例如安全港基因,诸如白蛋白基因、aavs1基因、hprt基因;ccr5基因;或高表达的基因,诸如rbc前体细胞中的珠蛋白基因(例如,β珠蛋白或γ珠蛋白)。在一些情况下,内源性序列将存在于外源性α-gala蛋白的氨基(n)-末端部分上,而在其他情况下,内源性序列将存在于外源性α-gala蛋白的羧基(c)-末端部分上。在其他情况下,内源性序列将存在于α-gala外源性蛋白的n-和c-末端部分上。在一些实施方案中,内源性序列编码分泌信号肽,该分泌信号肽在从细胞分泌α-gala蛋白的过程中被除去。内源性序列可以包括全长野生型或突变型内源性序列,或者可以包括部分内源性氨基酸序列。在一些实施方案中,内源性基因-转基因融合体位于细胞内的内源性基因座处,而在其他实施方案中,内源性序列-转基因编码序列插入基因组内的另一个基因座中(例如,插入白蛋白、hprt或ccr5基因座的gla-转基因序列)。在一些实施方案中,表达gla转基因,以使得治疗性α-gala蛋白产物保留在细胞(例如,前体细胞或成熟细胞)内。在其他实施方案中,gla转基因融合至膜蛋白的胞外结构域,以使得在表达后,转基因α-gala融合体将引发治疗性蛋白的表面定位。在一些方面,胞外结构域选自表1中列出的那些蛋白质。在一些方面,经编辑的细胞还包含将细胞运输至特定组织类型的跨膜蛋白。在一个方面,跨膜蛋白包含抗体,而在其他方面,跨膜蛋白包含受体。在某些实施方案中,细胞是前体细胞(例如,cd34+或造血干细胞)或成熟rbc(起源于如本文所述的经基因修饰的产生gla的细胞)。在一些方面,转基因上编码的治疗性α-gala蛋白产物被输出到细胞外,以影响缺乏转基因的细胞或被缺乏转基因的细胞吸收。在某些实施方案中,细胞是肝细胞,所述肝细胞将治疗性α-gala蛋白释放至血流中以作用于远端组织(例如,肾脏、脾脏、心脏、脑等)。

本发明还提供用于产生携带用于治疗法布里病的α-gala治疗性蛋白的细胞(例如,rbc)的方法和组合物,所述α-gala治疗性蛋白可作为同种异体产物普遍用于所有患者。例如,这允许研发用于治疗患有法布里病的患者的单一产物。这些载体可以包括帮助细胞的运输的跨膜蛋白。在一个方面,跨膜蛋白包含抗体,而在其他方面,跨膜蛋白包含受体。

在一个实施方案中,gla转基因在插入到白蛋白基因座之后由白蛋白启动子表达。如果转基因体内插入肝细胞中,那么由gla转基因编码的生物剂可以释放到血流中。在一些方面,gla转基因在病毒载体中通过静脉内施用体内递送至肝脏。在一些实施方案中,供体gla转基因在α-gala编码序列之前包含kozak共有序列(kozak(1987)nuclacidres15(20):8125-48),以使得所表达的产物缺乏白蛋白信号肽。在一些实施方案中,供体α-gala转基因含有代替天然gla信号序列的替代性信号肽,例如来自白蛋白、ids或f9基因的信号肽。因此,供体可以包括如seqidno:1至5中的任一者所示的信号肽或显示出与这些充当信号肽的序列的同源性的序列(参见例如图1b、10、13和25)。

在一些实施方案中,将gla转基因供体转染或转导至细胞中,以用于转基因的附加体或染色体外维持。在一些方面,将gla转基因供体维持在包含调控结构域的载体上,以调节转基因供体的表达。在一些情况下,调节转基因表达的调控结构域是所表达的转基因的内源结构域,而在其他情况下,调控结构域对于转基因是异源性的。在一些实施方案中,gla转基因维持在病毒载体上,而在其他实施方案中,gla转基因维持在质粒或小环上。在一些实施方案中,病毒载体是aav、ad或lv。在其他方面,将包含转基因供体的载体体内递送至合适的靶细胞,以使得当转基因供体载体递送至肝细胞时,由转基因供体编码的α-gala治疗性蛋白释放至血流中。

在另一个实施方案中,本发明描述了gla转基因所插入的前体细胞(肌肉干细胞、祖细胞或cd34+造血干细胞(hspc)细胞),以使得来源于这些前体细胞的成熟细胞含有高水平的由转基因编码的α-gala产物。在一些实施方案中,这些前体是诱导性多能干细胞(ipsc)。

在一些实施方案中,本发明的方法可以在转基因动物系统中体内使用。在一些方面,转基因动物可用于模型开发,其中转基因编码人类α-gala蛋白。在一些情况下,转基因动物可以在相应的内源性基因座处敲除,从而允许开发其中人类蛋白质可以以分离形式研究的体内系统。此类转基因模型可用于筛选目的,以鉴定小分子、或大生物分子或可与所关注的人类蛋白质相互作用或修饰所关注的人类蛋白质的其他实体。在一些方面,gla转基因整合到选定的基因座(例如,高表达的或安全港)中,进入干细胞(例如,胚胎干细胞、诱导性多能干细胞、肝干细胞、神经干细胞等)或通过本文所述的任何方法和本领域的标准获得的非人类动物胚胎中,然后移植所述胚胎使得活体动物出生。然后将动物培养至性成熟并使其产生后代,其中至少一些后代包含整合的gla转基因。

在另一个方面,本文提供了用于将核酸序列位点特异性整合到染色体(例如整合到非人类胚胎的染色体)的内源性基因座(例如,疾病相关的基因座,高表达的基因座诸如肝细胞中的白蛋白基因座,或rbc前体细胞中的珠蛋白基因座)中的方法。在某些实施方案中,所述方法包括:(a)用(i)至少一种dna载体,其中所述dna载体包含上游序列和侧接待整合的α-gala编码核酸序列的下游序列,和(ii)识别靶基因座中的整合位点的至少一种编码至少一种核酸酶(锌指、zfn对、tale核酸酶、talen对或crispr/cas系统)的多核苷酸分子来注射非人类胚胎,以及(b)培养胚胎以允许核酸酶(zfn、talen和/或crispr/cas系统)的表达,其中经由与dna载体的同源重组通过核酸酶修复引入整合位点的双链断裂,以将核酸序列整合到染色体。在一些实施方案中,编码核酸酶的多核苷酸是rna。

在任何前述实施方案中,本发明的方法和化合物可以与其他治疗剂组合,用于治疗患有法布里病的受试者。在一些实施方案中,所述方法和组合物包括使用分子伴侣(hartl等人(2011)nature465:324-332)来确保法布里蛋白的正确折叠。在一些方面,分子伴侣可以选自熟知的伴侣蛋白,诸如at1001(benjamin等人(2012)molther20(4):717-726)、at2220(khanna等人(2014)plosone9(7):e102092,doi:10.1371)和migalastat(benjamin等人(2016)genetmeddoi:10.1038/gim.2016.122)。在一些方面,所述方法和组合物与允许穿过血脑屏障的方法和组合物组合使用。在其他方面,所述方法和组合物与已知抑制受试者的免疫响应的化合物组合使用。

还提供了包括如本文所述的核酸酶系统和/或gla供体的试剂盒。试剂盒可以包括编码一种或多种核酸酶(zfn、zfn对、talen、talen对和/或crispr/cas系统)的核酸(例如,编码合适的表达载体中含有的基因的rna分子或zfn、talen和/或crispr/cas系统)、供体分子、编码适用于宿主细胞系的单指导rna的表达载体、用于实施本发明的方法的说明书等等。

根据作为整体的公开内容,这些和其他方面对于技术人员将是显而易见的。

附图说明

图1a至1c示出了通过野生型α-gala酶和初始供体和转基因表达盒来进行的酶反应。图1a示出了通过α-gala来进行的反应,其中在野生型哺乳动物中,gb3底物被分解。在法布里生物中,gb3底物积累至毒性水平。图1b示出了用于从cdna表达α-gala的初始病毒载体,而图1c示出了在核酸酶介导的白蛋白基因插入之后用于表达α-gala的初始病毒载体。

图2是示出在用白蛋白特异性核酸酶(zfn)转导的细胞的七天期间在hepg2/c3a细胞培养基中检测到的α-gala活性和图1c中描绘的供体的图示(右图中示出了标记为ivprp的“体内蛋白质替代平台(invivoproteinreplacement)”的首字母缩写词)。来自经历空白对照(mock)转导程序的细胞的培养基中的活性水平在左图中示出。从左到右的条柱示出了第3天、第5天、第7天和仅细胞的活性。

图3a和3b是示出使用cdna方法检测的α-gala活性水平的图示。图3a示出了在不同剂量的aav病毒中在6天的时间内检测到的hepg2/c3a细胞培养基中的活性,所述aav病毒包含图1b中所示的cdna表达盒(从左到右的条柱示出了空白对照转染、10k、30k、100k、300k、1000k、3000k和9000k)。图3b是示出在实验的最后时间点在图3a的细胞的细胞沉淀中检测到的活性的图示。

图4a和4b是描绘用含有aav的cdna处理的glako小鼠中的体内活性的图示。图4a示出了用2.0e12个载体基因组/千克体重(vg/kg)aav2/6处理的每只单独的小鼠的结果,所述aav2/6包含cdna构建体,而图4b示出了用2.0e13vg/kgaav2/6-cdna处理的每只小鼠的结果。在图4a中,在指定日另外用分子伴侣dgj处理一只小鼠。两幅图中的虚线还示出了野生型小鼠中存在的α-gala活性水平。如图所示,经处理的小鼠显示出高于野生型的水平(表示治疗有益水平)。

图5a至5f是描绘glako小鼠和用包含cdna构建体的aav2/6处理的小鼠中gb3脂质底物水平的图示。图5a示出了在血浆中检测到的底物水平,图5b示出了心脏组织中的底物。图5c示出了在肝脏中检测到的底物,图5d示出了在肾脏组织中检测到的底物。在所示的所有组织中,gb3的水平低于未经处理的glako小鼠。图5d中还示出了该测定的最低定量水平(lloq)。经处理的小鼠中gb3和lyso-gb3的水平也以相对于未经处理的小鼠存在的底物量表示。图5e示出了相对于未经处理的glako小鼠,保留在特定组织中的gb3的百分比,图5f示出了相对于未经处理的glako小鼠,保留在特定组织中的lyso-gb3的百分比。5e和5f中的组织数据集在每个处理组(未经处理的glako)、低剂量和高剂量处理的glako和野生型小鼠中示出,其中条柱代表来自(从左到右)血浆、肝脏、心脏和肾脏的数据。

图6a至6e描绘了体内测试的ivprp方法的结果。图6a描绘了在用包含图1c中所示的转基因供体的aav2/8病毒处理的glako小鼠的血浆中检测到的随时间变化的α-gala活性,其中一些小鼠接受免疫抑制剂(参见实施例4)。还示出了野生型小鼠中存在的水平。图6b是示出在第90天经处理的动物的肝脏中检测到的插入缺失(indel)水平的图示。插入缺失(插入和/或缺失)是核酸酶活性的指示。图6c、6d和6e是在接近30天的时间内在经处理的小鼠的血浆中检测到的活性的时间过程。图6c示出了另外用小量免疫抑制剂处理的动物中的活性,而图6d示出了用中等水平的免疫抑制剂处理的动物中的活性,图6e示出了用高水平的免疫抑制剂处理的动物。图6c、6d和6e中还示出了野生型小鼠中存在的水平(虚线),以用于比较。

图7a至7c是描绘在用免疫抑制剂(“is”)和dgj分子伴侣二者处理的动物中检测到的随时间变化的α-gala活性的图示。图7a示出了用低水平的免疫抑制剂处理的动物的结果,其中箭头描绘了分子伴侣剂量的时间和经处理的小鼠。在图7a中,用分子伴侣处理所有小鼠,结果表明活性增加。图7b示出了中等水平的免疫抑制剂之下的动物的结果,其中两只小鼠用dgj处理。这两只小鼠的血浆中的α-gala活性增加。图7c描绘了在高剂量免疫抑制剂下的小鼠的结果,并且还标明了何时用dgj处理三只小鼠。这些结果表明分子伴侣增加了所检测的活性的量。虚线表示野生型小鼠中存在的活性水平,以用于比较。

图8是示出通过cdna或ivprp方法处理的小鼠组织中α-gala活性的比较的图示。还示出了野生型小鼠和未经处理的glako小鼠中的水平,以用于比较。所示的组织为肝脏、血浆、脾脏、心脏和肾脏。注意y轴是断开的,表明cdna方法在2.0e13vg/kg剂量下产生的α-gala活性几乎是野生型水平的100倍,并且在所有测试的组织中都可检测到活性。

图9a至9c描绘了作为cdna和体内蛋白质替代平台(invivoproteinreplacement)(ivprp)方法的结果检测到的α-gala活性和gb3脂质底物的水平。图9a示出了从不同处理组检测到的平均活性数。图9b示出了各组的血浆、肝脏和心脏组织中检测到的gb3的量,并且证明了cdna方法导致接近野生型小鼠的gb3减少,表明由转基因表达的蛋白质在对其靶底物的作用方面是有效的。图9c是示出来自9a中的表格的各个小鼠中α-gala活性的量的图示(zfn+供体+dgj组未示出)。cdna高剂量小鼠(2.0e13vg/kgcdna供体载体)以黑线上的实心圆圈显示。cdna低剂量小鼠(2e12vg/kgcdna供体载体)以虚线上的阴影三角形显示。野生型小鼠以灰线上的黑色空心圆圈显示,并且glako小鼠以黑线上的黑色方块显示。四只高剂量cdna小鼠中有三只的水平超过野生型小鼠的水平100倍。

图10是示出用于方法的各种示例性供体构建体(变体#a至#l,也称为变体a至l)的示意图。示意图中的缩写如下:“itr”是aav反向末端重复区域。“ha-r”和“ha-l”是右(r)和左(l)同源臂,它们与侧接zfn切割位点的白蛋白序列具有同源性。“sa”是f9基因的剪接受体位点,而“hbb-igg”是内含子序列,“glaco”是密码子优化的α-gala编码序列,而“glacov.2”是α-gala编码序列的交替密码子优化,“bghpa”是来自牛生长激素的多聚a序列,“gla信号肽”是来自gla基因的信号肽,“融合”是指在剪接受体位点和gla转基因之间再插入2-5个氨基酸的构建体,“t2a”和“f2a”是分别来自t.assigna和口蹄疫病毒的自切割序列。“ids信号肽”是ids基因的信号肽,而“fix信号肽”是来自fix基因的信号肽。“ti”是在转基因的3'末端添加的5'ngs引物结合序列,其后是具有与野生型基因座相同的碱基组成的靶向整合(ti)特异性序列,所述靶向整合(ti)特异性序列允许下一代测序来同时测量插入缺失和hdr介导的转基因整合。有关更多详细信息,请参见实施例。

图11a和11b是描绘hepg2/c3a细胞中的α-gala体外活性的图示。图11a中示出了使用如图10所示的初始供体和供体变体#a、#b和#e在细胞和细胞上清液中检测到的活性。“z+d”是指zfn和供体施用。数据表明变体#a和#b具有比初始供体更大的活性。图11b是示出在低剂量(300,000/600,000vg/细胞zfn/供体)或高剂量(600,000/1,200,000vg/细胞zfn/供体)的zfn和gla供体下,比较变体#a、#k、#j、#h和#i(变体a、k、j、h和i)的α-gala活性的图示。‘仅供体’数据集表示仅使用供体构建体而不使用任何zfn处理的细胞。条柱表示组平均值,其中标准偏差以误差棒表示。数据表明变体#k在该集合中产生最高活性。

图12是示出变体#a、#b和#e的体内活性的图示。使用glako小鼠并且每周采集血浆样品一次。图12示出了直到注射后第56天的每组的数据,并且还示出了用于比较的cdna方法的数据。在第28天,用“新”变体供体处理的小鼠具有比初始供体更大的α-gala活性。“初始”供体是指在优化之前使用的供体,参见图10并且在图12中以每个分组左边的黑色条柱示出。仅在图的最右边展示第56天的cdna结果。虚线表示野生型小鼠活性水平的50倍,表明所有样品在第28天显示出比野生型大至少40倍的活性。

图13a和13b是示例性cdna表达盒的示意图。图13a示出了此前描述的cdna表达系统的布置(参见美国专利公开no.20170119906),其中使用不同的密码子优化方案(dna2.0v1与geneartv2,“glacov.2”)插入了gla编码序列。图13b示出了使用替代密码子优化方案的本研究中使用的cdna表达盒,并且示出了使用来自ids、fix或alb基因的信号肽与gla编码序列(使用两种不同的方案优化)组合的变体#1至#6(也称为变体1至6)。

图14a和14b是示出使用cdna方法来表达α-gala活性的图示。在该图中,用包含所示的cdna构建体的aav转导hepg2/c3a细胞,其中测试了如图13b所示的不同信号肽的作用。测量第3天和第5天的细胞上清液中的α-gala活性,结果表明ids和fix(f9)前导序列产生比gla或白蛋白(alb)前导序列更高的活性水平。图14b示出了变体#1、#2、#4、#5和#6在第5天的α-gala活性。对于这些研究,细胞接受3.0e5vg/细胞的aav2/6glacdna载体。条柱表示组平均值,误差棒表示标准偏差。

图15a至15c是描绘血浆(图15a)或选定组织(图15b)中的α-gala活性的图示。给glako小鼠注射3e11vg的zfn,这些zfn被设计用于在白蛋白内含子1和1.2e12vg的初始gla供体构建体或变体a、b、e或j(总aav剂量/小鼠=6e13vg/kg)中产生双链断裂。图15a描绘了小鼠中的质粒α-gala活性,随后每周或每两周评估该活性达2个月。左图示出了接受初始供体、变体a、变体e或变体b的动物的结果。右图示出了野生型动物或接受变体e或j的动物的结果。图15b示出了如图15a所示的动物处死之后测定的在肝脏、心脏、肾脏和脾脏中测量的α-gala活性。图15b的左图示出了用初始gla供体构建体(在每组的最左边条柱中显示“初始”)处理之后、在用变体a(每组中左边第二个条柱)、变体b(每组的中间条柱)、变体e(每组中右边第二个条柱)处理之后2个月以及野生型动物(在每组的最右边条柱中显示“野生型”)中的数据。图15b的右图描绘了变体e和j的活性,其中在每个数据集中,未经处理的glako小鼠中的活性在最左边条柱中示出;野生型小鼠中的活性在每组左边第二个条柱中示出;用变体#e处理的glako小鼠中的活性在左边第三个条柱中示出,而用变体j处理的glako小鼠中的活性在最右边条柱中示出。对于gla供体变体a、b、e和j,血浆和所有测量组织中的α-gala比野生型高很多倍。图15c描绘了血浆α-gala活性的水平,其中用zfn处理的每只小鼠的数据是成对的,并且示出了变体a供体。注意,这是与图15a中所示的标记为变体a的实验相同的实验,不同的是在图15a中,示出了作为一组的小鼠的数据,而在图15c中,示出了每个经处理的小鼠的数据。

图16a和16b是描绘在用zfn+不同供体变体处理后剩余的α-gala糖脂底物(gb3和lyso-gb3)的量的图示。通过质谱分析来测量血浆、心脏、肝脏、肾脏和脾脏中的gb3(图16a)和lyso-gb3(图16b)含量(脾脏数据未示出)。每个数据集以4个为一组示出,它们描绘了血浆、肝脏、心脏和肾脏中的水平(每组从左到右)。与未经处理的glako小鼠相比,底物的量以剩余的部分表示。用gla供体变体a、b或e处理的小鼠组织中gb3和lyso-gb3的量均大大减少。

图17a至17c示出了用脱糖基化酶pngasef或endoh处理α-gala蛋白的作用。图17a示出了从来源于通过ivprp方法处理的动物的小鼠肝脏的匀浆物的进行的蛋白质印迹。上图(标记为‘gla供体变体a’)示出了三个小鼠样品以及来自野生型小鼠(‘wt’)、未经处理的glako小鼠(‘glako’)的样品和重组人类gala的样品(‘rec.hgala’)。在下图(标记为‘gla供体变体j’)中,示出了两个小鼠样品以及野生型小鼠样品和未经处理的glako小鼠样品,以及重组人类gala.(+)和(-)的样品,两个印迹均标示用pngasef或endoh的处理。图17b示出了如图17a所述进行的蛋白质印迹,不同的是使用cdna方法处理小鼠(“初始”构建体)。图17c是描绘复合糖基化结构的pngasef切割的示意图。数据表明,在或cdna方法之后,在经处理的glako动物中表达的gala酶显示出与pngasef处理后的脱糖基化的人类重组蛋白相似的脱糖基化。

图18a至18c是描绘与变体#4(如上文13b中所示)相比,使用初始cdna构建体测量的活性的图示。图18a描绘了用所示的包含aav2/6的2e12vg/kgglacdna处理的glako小鼠中的血浆α-gala活性。在注射后测量活性长达60天。图18b示出了如图18a的小鼠中所示的组织中的α-gala活性。从左到右的数据集示出了glako未处理小鼠(最左边条柱);野生型小鼠(左边第二个条柱);用初始cdna变体处理的glako小鼠(左边第三个条柱);以及用cdna变体d处理的glako小鼠中的α-gala活性。水平虚线表示对应于野生型水平10倍的活性,以供参考。图18c描绘了检测用cdna变体#4处理的3个glako小鼠的肝脏中的人类α-gala的蛋白质印迹。为了比较,示出了野生型小鼠(“wt”)和未经处理的glako小鼠中的活性。为了进行比较,还示出了重组hgala。如图17所示,用pngasdf或endoh处理样品。

图19是描绘用初始cdna构建体(如图13所示)处理的小鼠血浆中的α-gala活性水平的图示。每组均用包含从1.25e11至5.0e12vg/kg的指定剂量的构建体的aav处理(实线,以误差棒表示的组平均值)。还包括野生型和未经处理的glako小鼠,并在图中示出。

图20a和20b是描绘在变体e和j的体内表达后检测到的α-gala活性的图示。图20a示出了在用白蛋白和变体e或变体j供体(参见图10)特异性的zfn处理glako小鼠后在血浆中检测到的α-gala活性。图20b示出了在各种所关注的组织(肝脏、心脏、肾脏和脾脏)中检测到的α-gala活性。在图20b的从左到右的每个数据集中,条柱示出了glako小鼠、野生型(wt)小鼠、变体e供体或变体j供体的结果。

图21a和21b是描绘在各种所关注的组织(血浆、肝脏、心脏和肾脏)中检测到的α-gala底物的量的图示。图21a描绘了检测到的gb3的量,该量以glako小鼠中检测到的gb3的量(设定为100%)的百分比表示。图21b描绘了检测到的lyso-gb3的量,该量以glako小鼠中检测到的lyso-gb3的量(设定为100%)的百分比表示。在图21a和21b中,从左到右的每个数据集示出了在血浆、肝脏、心脏和肾脏中检测到的结果。

图22是描绘在核酸酶介导的gla转基因的靶向整合之后法布里病的glako小鼠模型中肝细胞的永久性修饰的图示,并且示出了在指定条件下处理的肝细胞中插入缺失的百分比。

图23a和23b是描绘由整合的转基因表达、分泌到血流中并被次生组织吸收的α-gala的图示。用zfn和两种hgla供体构建体之一处理glako小鼠。图23a描绘了用指定构建体处理的动物或未经处理的动物的血浆中的gala活性。图23b示出了在指定条件下指定组织(肝脏、脾脏、心脏和肾脏)中的gala活性。最左边条柱示出了未经处理的动物中的gala活性;左边第二个条柱示出了仅用供体变体e处理的动物中的gala活性;中间条柱示出了野生型动物中的gala活性;右边第二个条柱示出了用zfn和供体变体a处理的动物中的gala活性;最右边条柱示出了用zfn和供体变体e处理的动物中的gala活性。未经处理的glako小鼠、未经处理的野生型小鼠以及用供体但不用zfn处理的glako小鼠作为对照。稳定的血浆活性达到野生型的80倍。图中示出了研究终止时(第56天)随时间变化的血浆α-gala活性和组织活性。

图24a和24b是描绘指定组织中法布里底物含量的图示。图24a示出了gb3含量,图24b示出了lyso-gb3含量,这些含量以指定条件下未经处理的glako小鼠的减少百分比表示。每种情况下的条柱从左到右示出了血浆、肝脏、心脏和肾脏中的水平。用zfn和任一种hgla供体变体处理的小鼠的底物含量大大减少。

图25a和25b示出了变体l和变体m以及靶向整合到野生型白蛋白基因座的示意图。图25a描绘了变体l和m,并且示出了变体m与变体l的不同之处在于变体m包含ids信号肽而不是gla信号肽。缩写如图10所示。图25b示出了gla转基因整合到白蛋白基因座中。“ti”是在转基因的3’末端添加的5’新一代测序(ngs)引物结合序列,其后是具有与野生型基因座相同的碱基组成的靶向整合(ti)特异性序列,所述靶向整合(ti)特异性序列允许新一代测序同时测量插入缺失和hdr介导的转基因整合。

图26a和26b是描绘使用以指定剂量进入人类血细胞瘤细胞系hepg2的指定供体的修饰(插入缺失的百分比或ti的百分比)的图示。图26a示出了使用变体l供体的结果,图26b示出了使用变体m供体的结果。

图27a和27b是描绘肝脏产生的α-gala如何分泌到血流中并被次生组织吸收的图示。使用含有ids信号肽和用于分析靶向整合(ti)的3’序列的gla供体构建体来处理glako小鼠。图27a描绘了用指定构建体处理的动物或未经处理的动物的血浆中的gala活性。图27b示出了在指定条件下指定组织(肝脏、脾脏、心脏和肾脏)中的gala活性。最左边条柱示出了未经处理的动物中的gala活性;左边第二个条柱示出了仅用供体变体m处理的动物中的gala活性;中间条柱示出了野生型动物中的gala活性;右边第二个条柱示出了用低剂量的zfn和供体变体m处理的动物中的gala活性;最右边的条柱示出了用高剂量zfn和供体变体m处理的动物中的gala活性。如图所示,观察到高达野生型的250倍的稳定的血浆活性,并且心脏和肾脏中的α-gala活性分别超过野生型20倍和4倍。

图28a和28b是描绘用包含gla构建体的肝脏特异性构建体处理的细胞中α-gala活性的图示。图28a示出了hepg2细胞上清液中的活性,图28b示出了在存在经处理的或未经处理的如图28a所示的hepg2细胞的上清液的情况下,所培养的k562细胞沉淀中的活性。

图29是描绘glaxo小鼠血浆中的α-gala活性的图示,所述glaxo小鼠以1.25e11至5.0e12vg/kg的初始cdna构建体给药(实线,组平均值,每组n=4至7)并跟踪6个月。还示出了野生型(灰色虚线,以箭头表示)和未经处理的glako小鼠(黑色虚线,以箭头表示)。

图30示出了以指定剂量处理后6个月指定组织(肝脏、脾脏、心脏和肾脏)中的α-gala活性的图示。还示出了野生型和未经处理的动物。

图31示出了在1.25e11至5.0e12vg/kg的初始cdna构建体处理的glako小鼠中指定组织(肝脏、脾脏、心脏和肾脏)中的法布里底物gb3含量的剂量依赖性减少的图示,该数据以从未经处理的glako小鼠的减少百分比表示(组平均值,每组n=4至7)。在小鼠的所有测量组织中显示出gb3含量的剂量依赖性减少。

图32a和32b描绘了在指定治疗方案之后保留在各种所关注组织(血浆、肝脏、心脏和肾脏)中的gb3底物的百分比的图示(另见图18)。图32a描绘了检测到的gb3的量,该量以未经处理的glako小鼠中检测到的gb3的量(设定为100%)的百分比表示。图32b描绘了检测到的lyso-gb3的量,该量以未经处理的glako小鼠中检测到的lyso-gb3的量(设定为100%)的百分比表示。在图32a和32b中,从左到右的每个数据集示出了在血浆、肝脏、心脏和肾脏中检测到的结果。

图33a和33b是描绘在指定治疗方案之后保留在各种所关注组织(血浆、肝脏、心脏和肾脏)中的gb3底物的百分比的图示(另见图27)。图33a描绘了检测到的gb3的量,该量以未经处理的glako小鼠中检测到的gb3的量(设定为100%)的百分比表示。图33b描绘了检测到的lyso-gb3的量,该量以未经处理的glako小鼠中检测到的lyso-gb3的量(设定为100%)的百分比表示。在图33a和33b中,从左到右的每个数据集示出了在血浆、肝脏、心脏和肾脏中检测到的结果。

具体实施方式

本文公开了用于治疗或预防法布里病的方法和组合物。本发明提供了用于插入编码蛋白质的gla转基因以使得所述基因在肝脏中表达并使治疗性(替代)蛋白质表达的方法和组合物,所述蛋白质在患有法布里病的受试者中是缺乏的或不充分表达的。本发明还描述了细胞(例如,前体细胞或成熟rbc、ipsc或肝细胞)的改变,以使所述细胞产生高水平的治疗剂,并且将这些改变的细胞群引入患者将提供所需的蛋白质。转基因可以编码在有需要的患者中具有治疗有益性的所需蛋白质或结构rna。

因此,本发明的方法和组合物可以用于由转基因表达来自任何基因座(例如,高表达的白蛋白基因座)的一种或多种治疗有益性α-gala蛋白,以替代法布里病缺陷的和/或缺乏的酶。另外,本发明提供了用于通过将转基因序列插入细胞(诸如肝细胞)中的高表达的基因座中来治疗(包括减轻一种或多种症状)法布里病的方法和组合物。本发明包括用于通过病毒载体将编码α-gala的转基因递送至有需要的受试者的肝脏的方法和组合物,其中所述病毒可以通过注射至外周静脉系统中或通过直接注射至肝脏导向的血管(例如,门静脉)中而引入。所述方法和组合物可用于诱导转基因插入安全港基因座(例如,白蛋白)或可用于引发肝细胞中病毒cdna构建体的染色体外维持。在任一情况下,转基因都是高表达的,并为有需要的法布里病患者提供治疗有益效果。

此外,可以将转基因引入患者来源的细胞,例如患者来源的诱导性多能干细胞(ipsc)或其他类型的干细胞(胚胎干细胞或造血干细胞)中,以用于最终移植。将治疗性转基因插入造血干细胞中以移植到有需要的患者中是特别有用的。当干细胞分化为成熟细胞时,它们将含有高水平的治疗性蛋白,以用于递送至组织。

概述

除非另外指明,否则方法的实施以及本文公开的组合物的制备和使用将采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组dna以及本领域技术内的相关领域中的常规技术。这些技术在文献中有充分解释。参见例如sambrook等人molecularcloning:alaboratorymanual,第二版,coldspringharborlaboratorypress,1989和第三版,2001;ausubel等人,currentprotocolsinmolecularbiology,johnwiley&sons,newyork,1987和定期更新版;methodsinenzymology系列,academicpress,sandiego;wolffe,chromatinstructureandfunction,第三版,academicpress,sandiego,1998;methodsinenzymology,第304卷,“chromatin”(p.m.wassarman和a.p.wolffe编),academicpress,sandiego,1999;以及methodsinmolecularbiology,第119卷,“chromatinprotocols”(p.b.becker编)humanapress,totowa,1999。

定义

术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,是指呈线性或环状构象、单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开的目的,这些术语不应解释为对聚合物的长度进行限制。这些术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸骨架)中具有修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,a的类似物将与t碱基配对。

术语“多肽”、“肽”和“蛋白质”可互换使用,是指氨基酸残基的聚合物。该术语还适用于其中一个或多个氨基酸是对应的天然存在的氨基酸的化学类似物或经修饰的衍生物的氨基酸聚合物。

“结合”是指大分子之间(例如,蛋白质和核酸之间)的序列特异性、非共价相互作用。并不要求结合相互作用的所有组分都具有序列特异性(例如,与dna骨架中的磷酸残基接触),只要该相互作用整体具有序列特异性即可。此类相互作用的特征通常在于解离常数(kd)为10-6m-1或更小。“亲和力”是指结合的强度:结合亲和力增加与kd减小相关。

“结合结构域”是能够非共价结合另一种分子的分子。结合分子可以结合至例如dna分子(dna结合蛋白,诸如锌指蛋白或tal效应结构域蛋白或单指导rna)、rna分子(rna结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。就蛋白质结合分子而言,所述结合分子可以与自身结合(以形成同源二聚体、同源三聚体等),和/或可以结合至一种或多种不同的蛋白质的一个或多个分子。结合分子可以具有多于一种类型的结合活性。例如,锌指蛋白具有dna结合活性、rna结合活性和蛋白质结合活性。因此,dna结合分子(包括人工核酸酶和转录因子的dna结合组分)包括但不限于zfp、tale和sgrna。

“锌指dna结合蛋白”(或结合结构域)是通过一个或多个锌指以序列特异性方式结合dna的蛋白质或大型蛋白质内的结构域,所述锌指是结合结构域内的氨基酸序列区域,所述结合结构域的结构通过锌离子配位而稳定。术语锌指dna结合蛋白通常缩写为锌指蛋白或zfp。人工核酸酶和转录因子可包括zfpdna结合结构域和功能结构域(zfn的核酸酶结构域或zfp-tf的转录调控结构域)。术语“锌指核酸酶”包括一个zfn以及二聚化以切割靶基因的一对zfn。

“taledna结合结构域”或“tale”是包含一个或多个tale重复结构域/单元的多肽。这些重复结构域涉及tale与其同源靶dna序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33至35个氨基酸,并且表现出与天然存在的tale蛋白内的其他tale重复序列的至少一定的序列同源性。参见例如美国专利no.8,586,526。人工核酸酶和转录因子可以包括taledna结合结构域和功能结构域(talen的核酸酶结构域或talen-tf的转录调控结构域)。术语“talen”包括一个talen以及二聚化以切割靶基因的一对talen。

锌指和tale结合结构域可以“工程化”以结合预定的核苷酸序列,例如通过天然存在的锌指或tale蛋白的识别螺旋区的工程化(改变一个或多个氨基酸)。因此,经工程化的dna结合蛋白(锌指或tale)是非天然存在的蛋白质。用于工程化dna结合蛋白的方法的非限制性实例是设计和选择。经设计的dna结合蛋白是自然界中不存在的蛋白质,该蛋白质的设计/组成主要来自合理标准。用于设计的合理标准包括应用取代规则以及用于处理数据库中的信息的计算机化算法,所述数据库存储现有的zfp和/或tale设计和结合数据的信息。参见例如美国专利no.8,568,526、6,140,081、6,453,242和6,534,261;另见wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496。

“经选择的”锌指蛋白或tale是自然界中不存在的蛋白质,该蛋白质的产生主要来自经验过程(诸如噬菌体展示、相互作用捕获或杂交选择)。参见例如专利no.8,586,526、5,789,538、us5,925,523、us6,007,988、us6,013,453、us6,200,759、wo95/19431、wo96/06166、wo98/53057、wo98/54311、wo00/27878、wo01/60970、wo01/88197、wo02/099084。

“重组”是指两个多核苷酸之间的遗传信息的交换过程。出于本公开的目的,“同源重组(hr)”是指这种交换的特殊形式,这种交换在例如经由同源性指导的修复机制进行的细胞中的双链断裂修复期间发生。该过程需要核苷酸序列同源性,使用“供体”分子作为“靶标”分子(即,经历双链断裂的分子)的修复模板,并且由于该过程导致遗传信息从供体转移到靶标,所以被冠以不同的名称,如“无交叉基因转换”或“短序列段基因转换”。不希望被任何特定的理论束缚,这种转移可以涉及在断裂的靶标和供体之间形成的异源双链dna的错配修正,和/或其中使用供体来重新合成将成为靶标的一部分的遗传信息的“合成依赖性链退火”,和/或相关的过程。这种特殊的hr通常导致靶标分子的序列改变,以使得供体多核苷酸的部分或全部序列并入靶标多核苷酸中。

在本公开的方法中,如本文所述的一种或多种靶向核酸酶在预定位点处的靶序列(例如,细胞染色质)中产生双链断裂,并且“供体”多核苷酸(与断裂区域中的核苷酸序列具有同源性)可以引入细胞。已显示双链断裂的存在促进了供体序列的整合。供体序列可以是物理整合的,或者供体多核苷酸用作通过同源重组来修复断裂的模板,导致供体中的全部或部分核苷酸序列引入细胞染色质中。因此,可以改变细胞染色质中的第一序列,并且在某些实施方案中,可以将所述第一序列转化为供体多核苷酸中存在的序列。因此,术语“替代”或“替换”的使用可以理解为代表一个核苷酸序列被另一个核苷酸序列替代(即,替代信息意义上的序列),并且不一定需要将一种多核苷酸物理或化学替换为另一种多核苷酸。

在本文所述的任何方法中,另外的锌指或talen蛋白对可以用于细胞内其他靶点的另外双链切割。

在用于细胞染色质中所关注的区域中的序列的靶向重组和/或替换和/或改变的方法的某些实施方案中,通过与外源“供体”核苷酸序列的同源重组来改变染色体序列。如果存在与断裂区域同源的序列,则通过在细胞染色质中提供双链断裂来刺激这种同源重组。

在本文所述的任何方法中,第一核苷酸序列(“供体序列”)可以含有与所关注的区域中的基因组序列同源但不相同的序列,从而刺激同源重组,以在所关注的区域中插入不相同的序列。因此,在某些实施方案中,与所关注的区域中的序列同源的供体序列的部分表现出与被替换的基因组序列的约80-99%(或其间的任何整数)序列同一性。在其他实施方案中,例如如果只有1个核苷酸在超过100个连续碱基对的供体和基因组序列之间不同,则供体和基因组序列之间的同源性大于99%。在某些情况下,供体序列的非同源部分可以含有不存在于所关注的区域中的序列,以将新序列引入所关注的区域中。在这些情况下,非同源序列通常侧接50-1,000个碱基对(或其间的任何整数值)或大于1,000的任何数量的碱基对的序列,所述序列与所关注的区域中的序列同源或相同。在其他实施方案中,供体序列与第一序列不同源,并且通过非同源重组机制插入基因组中。

本文所述的任何方法均可用于通过供体序列的靶向整合来使细胞中的一个或多个靶序列部分或完全失活,所述供体序列破坏所关注的一个或多个基因的表达。还提供了具有部分或完全失活的基因的细胞系。

此外,如本文所述的靶向整合方法也可以用于整合一个或多个外源序列。外源核酸序列可以包括例如一个或多个基因或cdna分子、或任何类型的编码或非编码序列以及一个或多个控制元件(例如,启动子)。此外,外源核酸序列可以产生一种或多种rna分子(例如,小发夹rna(shrna)、抑制性rna(rnai)、微rna(mirna)等)。

“切割”是指dna分子的共价骨架的断裂。切割可以由多种方法引发,包括但不限于磷酸二酯键的酶或化学水解。单链切割和双链切割都是可能的,并且作为两个不同的单链切割事件的结果,可以发生双链切割。dna切割可以导致钝端或交错末端的产生。在某些实施方案中,融合多肽用于靶向双链dna切割。

“切割半结构域”是与第二多肽(相同的或不同的)一起形成具有切割活性(优选地双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”、“+和-切割半结构域”以及“右和左切割半结构域”可互换使用,是指二聚化的切割半结构域对。

“工程化的切割半结构域”是已被修饰为与另一个切割半结构域(例如,另一个工程化的切割半结构域)形成专性异源二聚体的切割半结构域。参见美国专利no.7,888,121、7,914,796、8,034,598和8,823,618,这些专利以引用的方式整体并入本文。

术语“序列”是指任何长度的核苷酸序列,它可以是dna或rna;可以是直链的、环状的或支链的,并且可以是单链的或双链的。术语“供体序列”是指插入基因组中的核苷酸序列。供体序列可以具有任何长度,例如2和10,000个(或它们之间的任何整数值或之上的整数值)核苷酸之间的长度、优选地约100和1,000个(或它们之间的任何整数)核苷酸之间的长度、更优选地约200和500个核苷酸之间的长度。

“疾病相关基因”是在单基因病中以某种方式存在缺陷的基因。单基因病的非限制性实例包括严重联合免疫缺陷、囊性纤维化、血友病、溶酶体贮积病(例如,戈谢病、贺勒氏症、亨特氏症、法布里病、尼曼-匹克病、戴-萨克斯(tay-sach)病等)、镰状细胞性贫血和地中海贫血。

“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是dna)和蛋白质,包括组蛋白和非组蛋白染色体蛋白。大多数真核细胞染色质以核小体的形式存在,其中核小体核心包含与包含两个单独的组蛋白h2a、h2b、h3和h4的八聚体相关的dna的大约150个碱基对;并且接头dna(不同长度,取决于生物体)在核小体核心之间延伸。组蛋白h1的分子通常与接头dna相关。出于本公开的目的,术语“染色质”旨在涵盖所有类型的细胞核蛋白,包括原核的和真核的。细胞染色质包括染色体和附加体染色质。

“染色体”是包含细胞的基因组的全部或一部分的染色质复合物。细胞的基因组通常以其核型表征,核型是构成细胞的基因组的所有染色体的集合。细胞的基因组可以包含一个或多个染色体。

“附加体”是复制性核酸、核蛋白复合物或包含不是细胞的染色体核型的一部分的核酸的其他结构。附加体的实例包括质粒和某些病毒基因组。

“靶点”或“靶序列”是定义结合分子将结合(只要存在足以结合的条件)的核酸的一部分的核酸序列。

“外源性”分子是通常不存在于细胞中,但可以通过一种或多种遗传学、生物化学或其他方法引入细胞中的分子。“通常存在于细胞中”是相对于细胞的特定发育阶段和环境条件来确定的。因此,例如仅在肌肉的胚胎发育期间存在的分子相对于成体肌细胞是外源性分子。类似地,热休克诱导的分子相对于非热休克细胞是外源性分子。外源性分子可以包括例如功能失常的内源性分子的功能形式,或功能正常的内源性分子的功能失常形式。

外源性分子可以尤其是小分子(诸如通过组合化学过程产生的小分子),或大分子(诸如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖),上述分子的任何经修饰衍生物,或包含一种或多种上述分子的任何复合物。核酸包括dna和rna,可以是单链的或双链的;可以是直链的、支链的或环状的;并且可以具有任何长度。核酸包括能够形成双链的那些核酸,以及形成三链体的核酸。参见例如美国专利no.5,176,996和5,422,251。蛋白质包括但不限于dna结合蛋白、转录因子、染色质重塑因子、甲基化的dna结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰化酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。

外源性分子可以是与内源性分子相同类型的分子,例如外源性蛋白质或核酸。例如,外源性核酸可以包括感染性病毒基因组、引入细胞中的质粒或附加体、或通常不存在于细胞中的染色体。用于将外源性分子引入细胞中的方法是本领域的技术人员已知的,并且包括但不限于脂质介导的转移(即脂质体,包括中性脂质和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、deae-葡聚糖介导的转移以及病毒载体介导的转移。外源性分子也可以是与内源性分子相同类型的分子,但是来源于与细胞来源的物种不同的物种。例如,可以将人类核酸序列引入最初来源于小鼠或仓鼠的细胞系中。

相比之下,“内源性”分子是在特定环境条件下、特定发育阶段中通常存在于特定细胞中的分子。例如,内源性核酸可以包括染色体、线粒体、叶绿体或其他细胞器的基因组,或天然存在的附加体核酸。另外的内源性分子可以包括蛋白质,例如转录因子和酶。

“融合”分子是其中两个或更多个亚基分子连接(优选地共价连接)的分子。亚基分子可以是相同化学类型的分子,或者可以是不同化学类型的分子。第一类融合分子的实例包括但不限于融合蛋白(例如,zfp或taledna结合结构域与一个或多个活化结构域之间的融合)和融合核酸(例如,编码上文所述的融合蛋的核酸)。第二类融合分子的实例包括但不限于形成三链体的核酸与多肽之间的融合,以及小沟结合物与核酸之间的融合。

细胞中融合蛋白的表达可以是融合蛋白递送至细胞或通过将编码融合蛋白的多核苷酸递送至细胞的结果,其中所述多核苷酸被转录,然后翻译转录物以产生融合蛋白。反式剪接、多肽切割和多肽连接也可以涉及细胞中蛋白质的表达。用于将多核苷酸和多肽递送至细胞的方法在本公开别处提供。

出于本公开的目的,“基因”包括编码基因产物(参见下文)的dna区域,以及调节基因产物的产生的所有dna区域,无论此类调控序列是否邻接编码序列和/或转录的序列。因此,基因包括但未必限于启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质结合位点和基因座控制区域。

“基因表达”是指将基因中包含的信息转换为基因产物。基因产物可以是基因的直接转录产物(例如,mrna、trna、rrna、反义rna、核酶、结构rna或任何其他类型的rna),或通过mrna的翻译而产生的蛋白质。基因产物还包括通过诸如加帽、多腺苷酸化、甲基化和编辑的过程来修饰的rna,以及通过例如甲基化、乙酰化、磷酸化、泛素化、adp核糖基化、豆蔻酰化和糖基化来修饰的蛋白质。

基因表达的“调控”是指基因活性的改变。表达的调控可以包括但不限于基因活化和基因阻遏。可以使用基因组编辑(例如,切割、改变、失活、随机突变)来调控表达。基因失活是指与不包含如本文所描述的zfp、tale或crispr/cas系统的细胞相比,基因表达的任何减少。因此,基因失活可以是部分的或完全的。

“所关注的区域”是细胞染色质的任何区域,例如基因或基因内或与基因邻接的非编码序列,其中所述区域结合外源性分子是所期望的。结合可以是出于靶向dna切割和/或靶向重组的目的。所关注的区域可以存在于例如染色体、附加体、细胞器基因组(例如,线粒体基因组、叶绿体基因组)或感染性病毒基因组中。所关注的区域可以在基因编码区内、在转录的非编码区(例如,前导序列、尾随序列或内含子)内,或在编码区上游或下游的非转录区内。所关注的区域的长度可以小至单个核苷酸对或最多2,000个核苷酸对,或为任何整数个核苷酸对。

“真核”细胞包括但不限于真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞(例如,肝细胞、肌细胞、rbc、t细胞等),包括干细胞(多能和多分化能干细胞)。

“红细胞”(rbc)或红血球是来源于造血干细胞的终末分化细胞。它们缺乏核酸酶和大部分细胞器。红细胞含有将氧气从肺部运送到周围组织的血红蛋白。事实上,单个rbc的33%是血红蛋白。它们还将代谢过程中细胞产生的co2带出组织并返回肺部,以便在呼气时释放。rbc是响应于血液缺氧而在骨髓中产生的,血液缺氧由肾脏释放促红细胞生成素(epo)而介导。epo导致原成红细胞的数量增加并且缩短了完全rbc成熟所需的时间。在大约120天后,由于rbc不含有细胞核或任何其他再生能力,所以通过肝脏、脾脏和淋巴结中巨噬细胞的吞噬活性(~90%)或通过血浆中的溶血作用(~10%)将细胞从循环中移除。在巨噬细胞吞噬后,由于溶酶体酶的作用,rbc的化学成分在巨噬细胞的空泡中被分解。体外或体内的rbc可以是如本文所述的经基因修饰的干细胞或rbc前体细胞的后代。

“分泌性组织”是将产物从单个细胞分泌到某些类型的腔中的动物中的那些组织,所述腔通常来源于上皮组织。定位于胃肠道的分泌性组织的实例包括排列于肠、胰腺和胆囊的细胞。其他分泌性组织包括肝脏、与眼睛和粘膜相关的组织(诸如唾液腺、乳腺、前列腺、脑垂体和内分泌系统的其他成员)。另外,分泌性组织包括能够分泌的组织类型的单个细胞。

关于两种或更多种组分(诸如序列元件)的并置的术语“操作连接”或“操作地连接”(或“可操作地连接”)可互换使用,其中这些组分被布置为使得两种组分能够正常发挥功能,并且允许这些组分中的至少一种能够介导针对其他组分中的至少一种所发挥的功能。举例来说,如果转录调控序列响应于存在或不存在一种或多种转录调控因子而控制编码序列的转录水平,则该转录调控序列可操作地连接至该编码序列。转录调控序列通常以顺式与编码序列可操作地连接,但不需要与该编码序列直接相邻。例如,增强子是可操作地连接至编码序列的转录调控序列,即使它们并不邻接。

关于融合多肽,术语“可操作地连接”可以指以下事实:每个组分在与另一个组分连接时发挥与其未如此连接时相同的功能。例如,关于其中zfp、tale或casdna结合结构域融合至活化结构域的融合多肽,如果在融合多肽中,zfp或taledna结合结构域部分能够结合其靶点和/或其结合位点,同时活化结构域能够上调基因表达,那么zfp或taledna结合结构域和活化结构域是可操作连接的。在其中zfp或taledna结合结构域融合至切割结构域的融合多肽的情况下,如果在融合多肽中,zfp或taledna结合结构域部分能够结合其靶点和/或其结合位点,同时切割结构域能够在靶点附近切割dna,那么zfp或taledna结合结构域和切割结构域是可操作连接的。

蛋白质、多肽或核酸的“功能片段”是序列不同于全长蛋白质、多肽或核酸但保留与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能片段可以具有与对应的天然分子相比更多、更少或相同数量的残基,和/或可以含有一个或多个氨基酸或核苷酸置换。确定核酸功能的方法(例如,编码功能、与另一种核酸杂交的能力)是本领域熟知的。类似地,确定蛋白质功能的方法是熟知的。例如,多肽的dna结合功能可以例如通过过滤结合、电泳迁移率变化或免疫沉淀测定来确定。dna切割可以通过凝胶电泳来分析。参见ausubel等人,出处同上。一种蛋白质与另一种蛋白质相互作用的能力可以例如通过免疫共沉淀、双杂交测定或互补作用(遗传和生物化学)来确定。参见例如fields等人(1989)nature340:245-246;美国专利no.5,585,245和pctwo98/44350。

“载体”能够将基因序列转移至靶细胞。通常,“载体构建体”、“表达载体”和“基因转移载体”意指能够引导所关注的基因的表达并且可以将基因序列转移至靶细胞的任何核酸构建体。因此,该术语包括克隆和表达媒介物,以及整合载体。

“报告基因”或“报告序列”是指产生这样的蛋白质产物的任何序列:所述蛋白质产物是易于测量的,优选地(尽管不一定)易于在常规测定法中测量的。合适的报告基因包括但不限于编码介导抗生素抗性(例如,氨苄青霉素抗性、新霉素抗性、g418抗性、嘌呤霉素抗性)的蛋白质的序列、编码有色或荧光或发光蛋白(例如,绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、荧光素酶)的序列、以及介导增强的细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸还原酶)。表位标签包括例如一个或多个拷贝的flag、his、myc、tap、ha或任何可检测出的氨基酸序列。“表达标签”包括编码报告基因的序列,所述报告基因可以可操作地连接至所需的基因序列,以监测所关注的基因的表达。

术语“受试者”和“患者”可互换使用,并且是指哺乳动物,诸如人类患者和非人类灵长类动物,以及实验动物,诸如兔、狗、猫、大鼠、小鼠和其他动物。因此,如本文所用的术语“受试者”或“患者”意指可以施用本发明的改变的细胞和/或本发明的改变的细胞所产生的蛋白质的任何哺乳动物患者或受试者。本发明的受试者包括具有lsd的那些受试者。

核酸酶

任何核酸酶均可用于本发明的实践,包括但不限于至少一种zfn、talen、归巢核酸内切酶和包含crispr/cas和/或ttago指导rna的系统(用于携带转基因的供体分子的体内切割)以及用于切割细胞基因组的核酸酶(以使转基因以靶向方式整合到基因组中)。因此,本文描述了包含切割选定的基因的一种或多种核酸酶的组合物,该切割导致基因的基因组修饰(例如,插入和/或缺失至被切割的基因中)。在某些实施方案中,一种或多种核酸酶是天然存在的。在其他实施方案中,一种或多种核酸酶是非天然存在的,即在dna结合分子(也称为dna结合结构域)和/或切割结构域中工程化的。例如,可以改变天然存在的核酸酶的dna结合结构域以结合选定的靶点(例如,被工程改造为结合选定的靶点的crispr/cas的zfp、tale和/或sgrna)。在其他实施方案中,核酸酶包含异源性dna结合和切割结构域(例如,锌指核酸酶;tal效应结构域dna结合蛋白;具有异源性切割结构域的大范围核酸酶dna结合结构域)。在其他实施方案中,核酸酶包含系统,诸如ttago系统的crispr/cas。

a.dna结合结构域

在某些实施方案中,本文所述的组合物和方法采用大范围核酸酶(归巢核酸内切酶)dna结合结构域来结合供体分子和/或结合细胞基因组中的所关注的区域。天然存在的大范围核酸酶识别15-40个碱基对切割位点,并且通常分为四个家族:laglidadg家族、giy-yig家族、his-cyst盒家族和hnh家族。示例性归巢核酸内切酶包括i-scei、i-ceui、pi-pspi、pi-sce、i-sceiv、i-csmi、i-pani、i-sceii、i-ppoi、i-sceiii、i-crei、i-tevi、i-tevii和i-teviii。它们的识别序列是已知的。另见美国专利no.5,420,032;美国专利no.6,833,252;belfort等人(1997)nucleicacidsres.25:3379–3388;dujon等人(1989)gene82:115–118;perler等人(1994)nucleicacidsres.22,1125–1127;jasin(1996)trendsgenet.12:224–228;gimble等人(1996)j.mol.biol.263:163–180;argast等人(1998)j.mol.biol.280:345–353和newenglandbiolabs产品目录。此外,归巢核酸内切酶和大范围核酸酶的dna结合特异性可以被工程化为结合非天然靶点。参见例如chevalier等人,(2002)molec.cell10:895-905;epinat等人(2003)nucleicacidsres.31:2952-2962;ashworth等人(2006)nature441:656-659;paques等人(2007)currentgenetherapy7:49-66;美国专利公开no.20070117128。归巢核酸内切酶和大范围核酸酶的dna结合结构域可以在核酸酶作为整体的情况下改变(即,使得核酸酶包括同源切割结构域)或可以融合至异源性切割结构域。

在其他实施方案中,本文所述的方法和组合物中使用的一种或多种核酸酶的dna结合结构域包含天然存在的或工程化的(非天然存在的)tal效应子dna结合结构域。参见例如美国专利no.8,586,526,该专利以引用的方式整体并入本文。已知黄单胞菌属(xanthomonas)的植物病原菌在重要的作物中引起了许多疾病。黄单胞菌属的病原性取决于保守的iii型分泌(t3s)系统,该系统将超过25种不同的效应子蛋白注射到植物细胞中。在这些注射的蛋白质中存在模拟植物转录激活因子和操纵植物转录物组的转录激活因子样(tal)效应子(参见kay等人(2007)science318:648-651)。这些蛋白质含有dna结合结构域和转录活化结构域。最充分表征的tal效应子之一是来自xanthomonascampestgrispv.vesicatoria的avrbs3(参见bonas等人,(1989)molgengenet218:127-136和wo2010079430)。tal效应子含有串联重复的集中结构域,每个重复含有大约34个氨基酸,这些氨基酸对于这些蛋白质的dna结合特异性是至关重要的。此外,它们含有核定位序列和酸性转录活化结构域(关于综述,参见schornacks等人(2006)jplantphysiol163(3):256-272)。此外,在植物病原菌青枯雷尔氏菌(ralstoniasolanacearum)中,已经发现称为brg11和hpx17的两个基因,这两个基因与青枯雷尔氏菌生物变种1菌株gmi1000和生物变种4菌株rs1000中的黄单胞菌属的avrbs3家族同源(参见heuer等人(2007)applandenvirmicro73(13):4379-4384)。这些基因在核苷酸序列上是彼此98.9%相同的,但不同的是在重复结构域hpx17中缺失1,575bp。然而,这两种基因产物均与黄单胞菌属的avrbs3家族蛋白具有小于40%的序列同一性。参见例如美国专利no.8,586,526,该专利以引用的方式整体并入本文。

这些tal效应子的特异性取决于串联重复中存在的序列。该重复序列包含大约102bp,并且这些重复序列通常彼此具有91%至100%的同源性(bonas等人,出处同上)。这些重复序列的多态性通常位于位置12和13,并且在位置12和13处的高变双残基(rvd)的同一性与tal效应子的靶序列中的邻接核苷酸的同一性之间似乎存在一一对应的关系(参见moscou和bogdanove,(2009)science326:1501以及boch等人,(2009)science326:1509-1512)。已经通过实验确定了这些tal效应子的dna识别的天然密码,从而引发位置12和13的hd序列与胞嘧啶(c)的结合,ng与t结合,ni与a、c、g或t结合,nn与a或g结合,并且ing与t结合。这些dna结合重复序列已组装为具有重复序列的新组合和数量的蛋白质,以制备能够与新序列相互作用并活化植物细胞中的非内源性报告基因的表达的人工转录因子(boch等人,出处同上)。已将经工程化的tal蛋白连接至foki切割半结构域,以产生在酵母报告基因测定中显示出活性的tal效应结构域核酸酶融合体(talen)(基于质粒的靶标)。参见例如美国专利no.8,586,526;christian等人((2010)geneticsepub10.1534/genetics.110.120717)。

在某些实施方案中,用于体内切割和/或靶向切割细胞基因组的一种或多种核酸酶的dna结合结构域包含锌指蛋白。优选地,锌指蛋白是非天然存在的,因为它被设计为结合选定的靶点。参见例如beerli等人(2002)naturebiotechnol.20:135-141;pabo等人(2001)ann.rev.biochem.70:313-340;isalan等人(2001)naturebiotechnol.19:656-660;segal等人(2001)curr.opin.biotechnol.12:632-637;choo等人(2000)curropin.struct.biol.10:411-416;美国专利no.6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美国专利公开no.2005/0064474;2007/0218528;2005/0267061,所有专利均以引用的方式整体并入本文。

与天然存在的锌指蛋白相比,经工程化的锌指结合结构域可以具有新型结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包含三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关联。参见例如共同拥有的美国专利6,453,242和6,534,261,这两个专利以引用的方式整体并入本文。

示例性选择方法(包括噬菌体展示和双杂交系统)在美国专利5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568;以及wo98/37186、wo98/53057、wo00/27878和wo01/88197中有所公开。此外,例如在共同拥有的wo02/077227中已经描述了针对锌指结合结构域的结合特异性的增强。

此外,如在这些和其他参考文献中所公开,锌指结构域和/或多指锌指蛋白可以使用任何合适的接头序列(包括例如长度为5个或更多个氨基酸的接头)连接在一起。关于示例性接头序列,另见美国专利no.8,772,453、6,479,626、6,903,185和7,153,949。本文描述的蛋白质可以包括蛋白质的单个锌指之间的合适的接头的任何组合。

靶点的选择;zfp和用于设计和构建融合蛋白(以及编码它们的多核苷酸)的方法是本领域的技术人员已知的并且在美国专利no.6,140,081、5,789,538、6,453,242、6,534,261、5,925,523、6,007,988、6,013,453、6,200,759、wo95/19431、wo96/06166、wo98/53057、wo98/54311、wo00/27878、wo01/60970、wo01/88197、wo02/099084、wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496中详细描述。

此外,如在这些和其他参考文献中所公开,锌指结构域和/或多指锌指蛋白可以使用任何合适的接头序列(包括例如长度为5个或更多个氨基酸的接头)连接在一起。关于长度为6个或更多个氨基酸的示例性接头序列,另见美国专利no.6,479,626、6,903,185和7,153,949。本文描述的蛋白质可以包括蛋白质的单个锌指之间的合适的接头的任何组合。

在某些实施方案中,dna结合结构域是crispr/cas核酸酶系统的一部分,包括例如单指导rna(sgrna)。参见例如美国专利no.8,697,359和美国专利公开no.20150056705。crispr(成簇规律间隔短回文重复序列)基因座(编码系统的rna组分)和cas(crispr相关)基因座(编码蛋白质)(jansen等人,2002.mol.microbiol.43:1565-1575;makarova等人,2002.nucleicacidsres.30:482-496;makarova等人,2006.biol.direct1:7;haft等人,2005.ploscomput.biol.1:e60)构成了crispr/cas核酸酶系统的基因序列。微生物宿主中的crispr基因座含有crispr相关(cas)基因以及能够对crispr介导的核酸切割的特异性进行编程的非编码rna元件的组合。

ii型crispr是最充分表征的系统之一,并且在四个连续步骤中进行靶向dna双链断裂。第一步,从crispr基因座转录两个非编码rna,即前crrna阵列和tracrrna。第二步,将tracrrna与前crrna的重复区域杂交,并介导前crrna加工为含有单个间隔区序列的成熟crrna。第三步,成熟crrna:tracrrna复合物经由crrna上的间隔区与靶dna上紧接着原型间隔区邻近基序(pam)(靶标识别的另外要求)的原型间隔区之间的沃尔森-克里克(watson-crick)碱基配对将cas9引导至靶dna。最后一步,cas9介导靶dna的切割,以形成原型间隔区内的双链断裂。crispr/cas系统的活性包括三个步骤:(i)将外来dna序列插入crispr阵列中,以便在称为“适应”的过程中防止未来的攻击;(ii)表达相关蛋白质,以及表达和加工该阵列,随后是(iii)用外来核酸进行rna介导的干扰。因此,在细菌细胞中,几种所谓的‘cas’蛋白与crispr/cas系统的天然功能有关,并在诸如外来dna的插入等的功能中发挥作用。

在某些实施方案中,cas蛋白可以是天然存在的cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽共同的定性生物学性质的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,前提条件是它们具有与对应的天然序列多肽共同的生物学活性。本文考虑的生物学活性是功能衍生物将dna底物水解为片段的能力。术语“衍生物”既涵盖多肽的氨基酸序列变体,也涵盖这些变体的共价修饰和融合体。cas多肽或其片段的合适衍生物包括但不限于cas蛋白或其片段的突变体、融合体、共价修饰。cas蛋白(包括cas蛋白或其片段)以及cas蛋白或其片段的衍生物可以从细胞或通过化学合成或者通过这两种程序的组合获得。细胞可以是天然产生cas蛋白的细胞,或者天然产生cas蛋白并且被基因工程改造为以更高的表达水平产生内源性cas蛋白或从外源引入的核酸以产生cas蛋白的细胞,该核酸编码与内源性cas相同或不同的cas。在一些情况下,细胞不会天然产生cas蛋白,并且被基因工程改造为产生cas蛋白。可以与cas蛋白一起使用和/或代替cas蛋白使用的rna指导的核酸酶的其他非限制性实例包括2类crispr蛋白,诸如cpf1。参见例如zetsche等人,(2015)cell163:1-13。

在弗朗西丝氏菌属(francisellaspp)中鉴定的crispr-cpf1系统是介导人类细胞中的强烈dna干扰的2类crispr-cas系统。虽然cpf1和cas9在功能上是保守的,但是它们在很多方面不同,包括它们的指导rna和底物特异性(参见fagerlund等人,(2015)genombio16:251)。cas9和cpf1蛋白之间的主要差异在于cpf1不利用tracrrna,因此仅需要crrna。fncpf1crrna的长度为42-44个核苷酸(19个核苷酸的重复序列和23-25个核苷酸间隔区)并且含有单个茎环,该茎环能耐受保留二级结构的序列变化。此外,cpf1crrna明显短于cas9所需的~100个核苷酸工程化的sgrna,并且fncpf1的pam要求是置换链上的5'-ttn-3'和5'-cta-3'。虽然cas9和cpf1都在靶dna中产生双链断裂,但是cas9使用其ruvc和hnh样结构域在指导rna的种子序列内进行平端切割,而cpf1使用ruvc样结构域来在种子外产生交错切割。因为cpf1从关键种子区域切出交错切口,所以nhej不会破坏靶点,因此确保cpf1可以继续切割同一位点,直到发生所需的hdr重组事件。因此,在本文所述的方法和组合物中,应当理解术语“cas”包括cas9和cfp1蛋白。因此,如本文所用,“crispr/cas系统”是指crispr/cas和/或crispr/cfp1系统,包括核酸酶和/或转录因子系统。

在一些实施方案中,dna结合结构域是ttago系统的一部分(参见swarts等人,出处同上;sheng等人,出处同上)。在真核生物中,基因沉默由argonaute(ago)蛋白家族介导。在该范例中,ago与小(19-31个核苷酸)rna结合。该蛋白质-rna沉默复合物通过小rna和靶标之间的沃尔森-克里克碱基配对来识别靶rna,并且通过内切核酸切割靶rna(vogel(2014)science344:972-973)。相比之下,原核ago蛋白结合小单链dna片段,可能起到检测和移除外源(通常是病毒)dna的作用(yuan等人,(2005)mol.cell19,405;olovnikov等人,(2013)mol.cell51,594;swarts等人,出处同上)。示例性原核ago蛋白包括来自aquifexaeolicus、类球红细菌(rhodobactersphaeroides)和嗜热栖热菌(thermusthermophilus)的蛋白质。

最充分表征的原核ago蛋白之一是来自嗜热栖热菌的蛋白质(ttago;swarts等人,出处同上)。ttago与15个核苷酸或13-25个核苷酸的具有5'磷酸基团的单链dna片段结合。ttago结合的这种“指导dna”用于指导蛋白质-dna复合物结合第三方dna分子中的沃尔森-克里克互补dna序列。一旦这些指导dna中的序列信息允许鉴定靶dna,ttago-指导dna复合物即可切割靶dna。这种机制也受到ttago-指导dna复合物结构的支持,同时与其靶dna结合(g.sheng等人,出处同上)。来自类球红细菌的ago(rsago)具有相似的性质(olivnikov等人,出处同上)。

可以将任意dna序列的外源性指导dna加载到ttago蛋白上(swarts等人,出处同上)。由于ttago切割的特异性是由指导dna来指导的,因此用外源的、研究者指定的指导dna形成的ttago-dna复合物将指导ttago靶dna切割为互补的研究者指定的靶dna。以这种方式,可以在dna中形成靶向双链断裂。ttago-指导dna系统(或来自其他生物的直系同源的ago-指导dna系统)的使用允许靶向切割细胞内的基因组dna。这种切割可以是单链的或双链的。对于哺乳动物基因组dna的切割,使用针对在哺乳动物细胞中表达而优化的ttago密码子的形式将是优选的。此外,用体外形成的ttago-dna复合物处理细胞可为优选的,其中ttago蛋白与细胞穿透肽融合。此外,使用已经通过诱变来改变的ttago蛋白的形式,从而在37摄氏度下获得改善的活性可为优选的。ttago-rna介导的dna切割可用于影响一系列结果,包括基因敲除、靶向基因添加、基因矫正、使用本领域标准技术开发dna断裂而产生的靶向基因缺失。

因此,核酸酶包含dna结合结构域,从而特异性结合希望插入供体(转基因)的任何基因中的靶点。

b.切割结构域

任何合适的切割结构域均可以与dna结合结构域可操作地连接以形成核酸酶。例如,zfpdna结合结构域已经与核酸酶结构域融合形成zfn(一种能够通过其工程化的(zfp)dna结合结构域来识别其预期核酸靶标并且导致在zfp结合位点附近通过核酸酶活性切割dna的功能性实体)。参见例如kim等人(1996)procnatlacadsciusa93(3):1156-1160。术语“zfn”包括二聚化以切割靶基因的一对zfn。最近,zfn已被用于多种生物中的基因组修饰。参见例如美国专利公开20030232410、20050208489、20050026157、20050064474、20060188987、20060063231和国际公开wo07/014275。同样,taledna结合结构域已经与核酸酶结构域融合以形成talen。参见例如美国专利no.8,586,526。还描述了包含结合dna并与切割结构域(例如,cas结构域)相关联以诱导靶向切割的单指导rna(sgrna)的crispr/cas核酸酶系统。参见例如美国专利no.8,697,359和8,932,814以及美国专利公开no.20150056705。

如上所述,切割结构域可以是dna结合结构域异源的,例如锌指dna结合结构域和来自核酸酶或talendna结合结构域的切割结构域以及来自核酸酶的切割结构域;sgrnadna结合结构域和来自核酸酶的切割结构域(crispr/cas);和/或大范围核酸酶dna结合结构域和来自不同核酸酶的切割结构域。异源性切割结构域可以从任何核酸内切酶或外切核酸酶获得。可以衍生出切割结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如2002-2003产品目录,newenglandbiolabs,beverly,ma;和belfort等人(1997)nucleicacidsres.25:3379-3388。切割dna的其他酶也是抑制的(例如,s1核酸酶、绿豆核酸酶、胰dnasei、微球菌核酸酶、酵母ho核酸内切酶;另见linn等人(编)nucleases,coldspringharborlaboratorypress,1993)。这些酶中的一种或多种(或其功能片段)可以用作切割结构域和切割半结构域的来源。

类似地,切割半结构域可以来源于如上文所述的需要二聚化来产生切割活性的任何核酸酶或其部分。一般而言,如果融合蛋白包含切割半结构域,则需要两个融合蛋白来进行切割。或者,可以使用包含两个切割半结构域的单一蛋白质。这两个切割半结构域可以来源于相同的核酸内切酶(或其功能片段),或每个切割半结构域可以来源于不同的核酸内切酶(或其功能片段)。此外,优选地将两个融合蛋白的靶点彼此相对设置,以使得这两个融合蛋白与它们各自的靶点的结合将切割半结构域彼此以空间取向放置,以允许切割半结构域例如通过二聚化来形成功能性切割结构域。因此,在某些实施方案中,靶点的近边缘被5-8个核苷酸或15-18个核苷酸分隔开。然而,任何整数个核苷酸或核苷酸对可以介入两个靶点之间(例如,2至50个核苷酸对或更多)。通常,切割位点位于靶点之间。

限制性核酸内切酶(限制性酶)存在于许多物种中,并且能够与dna(在识别位点)发生序列特异性结合,并且在结合位点处或附近切割dna。某些限制性酶(例如,iis型)在从识别位点移除的位点处切割dna,并具有可分离的结合和切割结构域。例如,iis型酶foki催化dna的双链切割,所述双链切割在来自一条链上的识别位点的9个核苷酸处和来自另一条链上的识别位点的13个核苷酸处进行。参见例如美国专利5,356,802;5,436,150和5,487,994;以及li等人(1992)proc.natl.acad.sci.usa89:4275-4279;li等人(1993)proc.natl.acad.sci.usa90:2764-2768;kim等人(1994a)proc.natl.acad.sci.usa91:883-887;kim等人(1994b)j.biol.chem.269:31,978-31,982。因此,在一个实施方案中,融合蛋白包含来自至少一种iis型限制性酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域,所述锌指结合结构域可以是或可以不是工程化的。

示例性iis型限制性酶(该限制性酶的切割结构域可与结合结构域分离)是foki。这种特定的酶以二聚体发挥活性。bitinaite等人(1998)proc.natl.acad.sci.usa95:10,570-10,575。因此,出于本公开的目的,在所公开的融合蛋白中使用的foki酶的一部分被认为是切割半结构域。因此,对于使用锌指-foki融合体的靶向双链切割和/或细胞序列的靶向替换,可以使用两种融合蛋白(每种融合蛋白包含foki切割半结构域)来重构催化活性切割结构域。或者,也可以使用含有锌指结合结构域和两个foki切割半结构域的单个多肽分子。使用锌指-foki融合体来进行靶向切割和靶向序列改变的参数在本公开的别处提供。

切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如,二聚化)以形成功能性切割结构域的能力的蛋白质的任何部分。

示例性iis型限制性酶在美国专利7,888,121中有所描述,该专利整体并入本文。其他限制性酶还含有可分离的结合和切割结构域,本公开考虑了这些内容。参见例如roberts等人(2003)nucleicacidsres.31:418-420。

在某些实施方案中,切割结构域包含最小化或防止同源二聚化的一个或多个经工程化的切割半结构域(也称为二聚化结构域突变体),如例如美国专利no.8,772,453、8,623,618、8,409,861、8,034,598、7,914,796和7,888,121所述,所有这些专利的公开内容均以引用的方式整体并入本文。foki的第446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538位的氨基酸残基都是影响foki切割半结构域的二聚化的靶标。

形成专性异源二聚体的foki的示例性经工程化的切割半结构域包括一对这样的切割半结构域:其中第一切割半结构域包括foki的第490和538位氨基酸残基处的突变,第二切割半结构域包括氨基酸残基486和499处的突变。

因此,在一个实施方案中,第490位的突变用lys(k)替换glu(e);第538位的突变用lys(k)替换iso(i);第486位的突变用glu(e)替换gln(q);并且第499位的突变用lys(k)替换iso(i)。具体地讲,通过以下方法来制备本文所述的经工程化的切割半结构域:使一个切割半结构域中的位置490(e→k)和538(i→k)发生突变,以产生称为“e490k:i538k”(“kk”)的经经工程化的切割半结构域,并通过使另一个切割半结构域中的位置486(q→e)和499(i→l)发生突变,以产生称为“q486e:i499l”(“el”)的经工程化的切割半结构域。本文所述的经工程化的切割半结构域是其中异常切割被最小化或消除的专性异源二聚体突变体。美国专利no.7,914,796和8,034,598,这两个专利的公开内容以引用的方式整体并入。在某些实施方案中,经工程化的切割半结构域包含第486、499和496位的突变(相对于野生型foki编号),例如在第486位用glu(e)残基替换野生型gln(q)残基、在第499位用leu(l)残基替换野生型iso(i)残基、在第496位用asp(d)或glu(e)残基替换野生型asn(n)残基(也分别称为“eld”和“ele”结构域)的突变。在其他实施方案中,经工程化的切割半结构域包含第490、538和537位的突变(相对于野生型foki编号),例如在第490位用lys(k)残基替换野生型glu(e)残基、在第538位用lys(k)残基替换野生型iso(i)残基、在第537位用lys(k)残基或arg(r)残基替换野生型his(h)残基(也分别称为“kkk”和“kkr”结构域)的突变。在其他实施方案中,经工程化的切割半结构域包含第490和537位的突变(相对于野生型foki编号),例如在第490位用lys(k)残基替换野生型glu(e)残基、在第537位用lys(k)残基或arg(r)残基替换野生型his(h)残基(也分别也称为“kik”和“kir”结构域)的突变。参见例如美国专利no.8,772,453。在其他实施方案中,经工程化的切割半结构域包含“sharkey”突变(参见guo等人,(2010)j.mol.biol.400(1):96-107)。

本文所述的经工程化的切割半结构域可以使用任何合适的方法制备,例如通过野生型切割半结构域(foki)的定点诱变,如美国专利no.8,623,618、8,409,861、8,034,598、7,914,796和7,888,121所述。

方法和组合物也用于相对于其他非预期的切割位点(称为脱靶点)而增加核酸酶对针对其预期靶标的特异性(参见美国专利公开no.us-2017-0218349-a1)。因此,本文所述的核酸酶可以包含一个或多个它们的dna结合结构域骨架区中的突变和/或它们的核酸酶切割结构域中的一个或多个突变。这些核酸酶可以包括zfpdna结合结构域内的氨基酸突变(‘zfp骨架’),所述氨基酸可以与dna骨架上的磷酸非特异性相互作用,但是它们不包含dna识别螺旋的变化。因此,本发明包括zfp骨架中的阳离子氨基酸残基的突变,所述氨基酸不是核苷酸靶特异性必需的。在一些实施方案中,zfp骨架中的这些突变包括使阳离子氨基酸残基突变为中性或阴离子氨基酸残基。在一些实施方案中,zfp骨架中的这些突变包括使极性氨基酸残基突变为中性或非极性氨基酸残基。在优选的实施方案中,相对于dna结合螺旋在第(-5)、(-9)位和/或第(-14)位进行突变。在一些实施方案中,锌指可以包含在(-5)、(-9)和/或(-14)处的一个或多个突变。在另外的实施方案中,多指锌指蛋白中的一个或多个锌指可以包含(-5)、(-9)和/或(-14)中的突变。在一些实施方案中,(-5)、(-9)和/或(-14)(例如,精氨酸(r)或赖氨酸(k))处的氨基酸突变为丙氨酸(a)、亮氨酸(l)、ser(s)、asp(n)、glu(e)、tyr(y)和/或谷氨酰胺(q)。

在某些实施方案中,经工程化的切割半结构域来源于foki核酸酶结构域,并且包含氨基酸残基416、422、447、448和/或525(相对于野生型全长foki编号)中的一个或多个的突变。在一些实施方案中,氨基酸残基416、422、447、448和/或525中的突变被引入如上文所述的foki“eld”、“ele”、“kkk”、“kkr”、“kk”、“el”、“kik”、“kir”和/或sharkey。

此外,本文描述了通过独立滴定核酸酶复合物的经工程化的切割半结构域配偶体来增加切割活性特异性的方法。在一些实施方案中,两个配偶体(半切割结构域)的比率以1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20比率,或它们之间的任何值给出。在其他实施例中,两个配偶体的比率大于1:30。在其他实施例中,两个配偶体以被选为不同于1:1的比率采用。当单独或组合使用时,本发明的方法和组合物通过降低脱靶切割活性来提供惊人和意外地增加的靶向特异性。在这些实施方案中使用的核酸酶可以包含zfn、一对zfn、talen、一对talen、crispr/cas、crispr/dcas和ttago或它们的任何组合。

或者,可以使用所谓的“分裂酶”技术在核酸靶点处体内组装核酸酶(参见例如美国专利公开no.20090068164)。此类分裂酶的组分可以在独立的表达构建体上表达,或可以在其中各个组分例如通过自切割性2a肽或ires序列分离的一个开放阅读框中连接。组分可以是各个锌指结合结构域,或大范围核酸酶核酸结合结构域的多个区域。

可以在使用之前筛选具有活性的核酸酶,例如在基于酵母的染色体系统中进行筛选,如美国专利no.8,563,314中所述。融合蛋白的表达可以在组成型启动子或诱导型启动子的控制下,例如在存在棉子糖和/或半乳糖的情况下活化(去阻遏)并且在存在葡萄糖的情况下阻遏的半乳糖激酶启动子。

cas9相关的crispr/cas系统包含两个rna非编码组分:tracrrna和pre-crrna阵列,所述pre-crrna阵列含有被相同的直接重复序列(dr)间隔开的核酸酶指导序列(间隔区)。为了使用crispr/cas系统来进行基因组工程,必须存在这些rna的两种功能(参见cong等人,(2013)sciencexpress1/10.1126/science1231143)。在一些实施方案中,tracrrna和pre-crrna通过单独的表达构建体或作为单独的rna提供。在其他实施方案中,构建嵌合rna,其中将经工程化的成熟crrna(赋予靶特异性)与tracrrna融合(提供与cas9的相互作用),以形成嵌合cr-rna-tracrrna杂合体(也称为单指导rna)。(参见jinek,出处同上和cong,出处同上)。

靶点

如上文所详细描述,可以将dna结构域工程化为结合基因座中的任何选定序列,例如白蛋白或其他安全港基因。与天然存在的dna结合结构域相比,经工程化的dna结合结构域可以具有新型结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包含三联体(或四联体)核苷酸序列和单个(例如,锌指)氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的dna结合结构域的一个或多个氨基酸序列相关联。参见例如共同拥有的美国专利6,453,242和6,534,261,这两个专利以引用的方式整体并入本文。也可以进行tal效应结构域的合理设计。参见例如美国公开no.20110301073。

适用于dna结合结构域的示例性选择方法(包括噬菌体展示和双杂交系统)在美国专利5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568以及wo98/37186、wo98/53057、wo00/27878、wo01/88197和gb2,338,237中有所公开。

靶点的选择;用于设计和构建融合蛋白(以及编码它们的多核苷酸)的核酸酶和方法是本领域技术人员已知的,并且在美国专利no.7,888,121和8,409,891中详细描述,这两个专利以引用的方式整体并入本文。

此外,如在这些和其他参考文献中所公开,dna结合结构域(例如,多指锌指蛋白)可以使用任何合适的接头序列(包括例如5个或更多个氨基酸的接头)连接在一起。关于长度为6个或更多个氨基酸的示例性接头序列,参见例如美国专利no.6,479,626、6,903,185和7,153,949。本文描述的蛋白质可以包括蛋白质的单个dna结合结构域之间的合适的接头的任何组合。另见美国公开no.20110301073。

供体

如上所述,提供了外源性序列(也称为“供体序列”或“供体”)的插入,例如用于矫正突变基因或用于增加编码法布里病缺乏或缺陷蛋白质(例如,α-gala)的基因的表达。供体序列通常与它所放置的基因组序列不同是显而易见的。供体序列可以含有两个同源区(“同源臂”)侧接的非同源序列,以允许在所关注的位置处发生有效hdr。另外,供体序列可以包含含有与细胞染色质中所关注的区域不同源的序列的载体分子。供体分子可以含有几个与细胞染色质同源的不连续区域。例如,对于通常不存在于所关注的区域中的序列的靶向插入,所述序列可以存在于供体核酸分子中,并且侧接与所关注的区域中的序列同源的区域。

本文描述了靶向插入编码α-gala蛋白的转基因,以插入选定位置的方法。gla转基因可以编码全长α-gala蛋白或可以编码截短的α-gala蛋白。用于插入的多核苷酸也可以称为“外源性”多核苷酸、“供体”多核苷酸或分子或“转基因”。非限制性示例性gla供体如图1b、1c、10、13和25所示。

供体多核苷酸可以是单链和/或双链dna或rna,并且可以以线性或环状形式引入细胞中。参见例如美国专利no.8,703,489和9,255,259。一个或多个供体序列也可以包含在dnamc中,所述dnamc可以以环状或线性形式引入细胞中。参见例如美国专利公开no.20140335063。如果供体序列以线性形式引入,则可以通过本领域技术人员已知的方法保护供体序列的末端(例如,免于核酸外切降解)。例如,将一个或多个双脱氧核苷酸残基加入线性分子的3'末端和/或将自身互补的寡核苷酸连接至一端或两端。参见例如chang等人,(1987)proc.natl.acad.sci.usa84:4959-4963;nehls等人(1996)science272:886-889。用于保护外源性多核苷酸免于降解的其他方法包括但不限于添加末端氨基和使用经修饰的核苷酸间键,例如硫代磷酸、氨基磷酸和o-甲基核糖或脱氧核糖残基。

可以将多核苷酸作为病毒或非病毒载体分子的一部分引入细胞中,所述病毒或非病毒载体分子具有另外的序列,例如复制起点、启动子和编码抗生素抗性的基因。此外,供体多核苷酸可以作为裸核酸引入,作为与诸如脂质体或泊洛沙姆的试剂复合的核酸,或者可以通过病毒(例如,腺病毒、aav、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷型慢病毒(idlv))来递送。

通常插入供体以使该供体的表达由整合位点处的内源性启动子(即驱动供体所插入的内源性基因的表达的启动子)驱动(例如,高表达的白蛋白、aavs1、hprt等等)。然而,显而易见的是,供体可以包含启动子和/或增强子,例如组成型启动子或诱导型或组织特异性启动子。在一些实施方案中,供体在表达质粒中维持在细胞中,以使得基因在染色体外表达。

可以将供体分子插入内源性基因中,以表达全部、一些内源性基因或不表达任何内源性基因。例如,可以将如本文所述的转基因插入白蛋白或其他基因座中,以表达一些(编码溶酶体酶的转基因的n-末端和/或c-末端)内源性白蛋白序列或不表达任何内源性白蛋白序列,例如与编码一种或多种α-gala蛋白的转基因融合。在其他实施方案中,将转基因(例如,含有或不含有另外的编码序列,例如白蛋白)整合到任何内源性基因座中,例如安全港基因座。

当用转基因表达内源性序列(内源性或转基因的一部分)时,内源性序列(例如,白蛋白等)可以是全长序列(野生型或突变型)或部分序列。优选地,内源性序列是功能性的。这些全长或部分序列(例如,白蛋白)的功能的非限制性实例包括增加由转基因(例如,治疗性基因)表达的多肽的血清半衰期和/或充当载体。

此外,虽然不是表达所需的,但是外源性序列还可以包括转录或翻译调控序列,例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2a肽的序列和/或多腺苷酸化信号。

与转基因连锁的外源序列还可以包括信号肽,以帮助所编码的蛋白质加工和/或分泌。这些信号肽的非限制性实例包括来自白蛋白、ids和因子ix的那些信号肽(参见例如图13)。

在某些实施方案中,外源序列(供体)包含所关注的蛋白质的融合体和作为其融合配偶体的膜蛋白的胞外结构域,以使融合蛋白定位于细胞表面上。这允许由转基因编码的蛋白质在血清中潜在地发挥作用。就法布里病而言,由转基因融合体编码的α-gala酶作用于从其在细胞(例如,rbc)表面上的位置在血清中积累的代谢产物。此外,如果rbc如正常的降解过程那样被脾脏巨噬细胞吞噬,那么巨噬细胞吞噬细胞时形成的溶酶体将使膜结合的融合蛋白暴露于溶酶体中对该酶天然更有利的ph下的高浓度代谢产物中。潜在的融合配偶体的非限制性实例如下表1所示。

表1:潜在的融合配偶体的实例

在一些情况下,供体可以是已经修饰的内源性基因(gla)。例如,可以对内源性基因进行密码子优化以产生供体。此外,虽然针对所讨论的特定治疗性酶和对于个体患者,对酶替代疗法产生响应的抗体是不同的,但是在使用野生型α-gala的酶替代所治疗的许多法布里病患者中,已经观察到显著的免疫响应。与不含转基因的受试者相比,转基因被认为在增加蛋白质的量(和/或其活性)时提供治疗性蛋白。此外,这些抗体与治疗功效的相关性也是可变的(参见katherineponder,(2008)jclininvest118(8):2686)。因此,与野生型gla相比,本发明的方法和组合物可以包括具有经修饰的序列的供体的产生,包括但不限于在已知作为内源性免疫响应的引发表位的位点处产生功能性沉默的氨基酸改变的修饰,和/或使得由这种供体产生的多肽的免疫原性较低的截短。

由于法布里病患者缺乏大脑中缺失的α-gala酶,他们通常具有神经系统后遗症。不幸的是,由于血脑屏障的不可渗透性,通常难以通过血液将治疗剂递送至大脑。因此,本发明的方法和组合物可以与增加治疗剂至大脑的递送的方法组合使用,包括但不限于导致大脑毛细管细胞之间紧密连接的瞬时打开的方法,诸如通过使用高渗甘露糖醇溶液的颈动脉内施用,使用聚焦超声和缓激肽类似物的施用进行瞬时渗透性破坏(matsukado等人(1996)neurosurgery39:125)。或者,可以将治疗剂设计为利用受体或转运机制来进行向大脑的特异性转运。可以使用的特异性受体的实例包括转铁蛋白受体、胰岛素受体或低密度脂蛋白受体相关蛋白1和2(lrp-1和lrp-2)。已知lrp与一系列分泌的蛋白质(诸如apoe、tpa、pai-1等)相互作用,因此将来自这些蛋白质中的一者的识别序列与lrp融合可以在治疗性蛋白在肝脏中表达和分泌至血流中之后,促进酶转运至大脑中(参见gabathuler,(2010),出处同上)。

细胞

本文还提供了经基因修饰的细胞,例如包含编码α-gala蛋白的转基因的肝细胞或干细胞,包括通过本文所述方法产生的细胞。gla转基因可以是全长的或经修饰的,并且可以在染色体外表达,或者可以使用一种或多种核酸酶以靶向方式整合到细胞的基因组中。与随机整合不同,核酸酶介导的靶向整合确保转基因整合到特定的基因中。转基因可以整合到靶基因中的任何位置。在某些实施方案中,转基因整合在核酸酶结合和/或切割位点处或附近,例如在切割位点和/或结合位点上游或下游的1-300个碱基对(或它们之间的任何数量的碱基对)内,更优选地在切割和/或结合位点任一侧的1-100个碱基对(或它们之间的任何数量的碱基对)内,甚至更优选地在切割和/或结合位点任一侧的1至50个碱基对(或它们之间的任何数量的碱基对)内。在某些实施方案中,整合的序列不包括任何载体序列(例如,病毒载体序列)。

可以如本文所述对任何细胞类型进行基因修饰以包含转基因,包括但不限于细胞或细胞系。如本文所述的经基因修饰的细胞的其他非限制性实例包括t细胞(例如,cd4+、cd3+、cd8+等);树突状细胞;b细胞;自体细胞(例如,患者来源细胞)、肌细胞、大脑细胞等等。在某些实施方案中,细胞是肝细胞并且是体内修饰的。在某些实施方案中,细胞是干细胞,包括异源性多能干细胞、全能干细胞或多分化能干细胞(例如,cd34+细胞、诱导性多能干细胞(ipsc)、胚胎干细胞等)。在某些实施方案中,如本文所述的细胞是来源于患者的干细胞。

如本文所述的细胞可用于例如通过体内疗法来治疗和/或预防患有法布里病的受试者的病症。例如当可以扩增核酸酶修饰的细胞,然后使用标准技术重新引入患者中时,还提供离体疗法。参见例如tebas等人(2014)newengjmed370(10):901。就干细胞而言,在输注到受试者中后,这些前体细胞也会体内分化为表达功能性蛋白(来自所插入的供体)的细胞。

还提供了包含如本文所述细胞的药物组合物。此外,细胞可以在施用于患者之前冷冻保存。

递送

本文所述的核酸酶、编码这些核酸酶的多核苷酸、供体多核苷酸和/或组合物(例如,细胞、蛋白质、多核苷酸等)可以通过任何合适的方式体内或离体递送。

如本文所述的递送核酸酶的方法在例如美国专利no.6,453,242、6,503,717、6,534,261、6,599,692、6,607,882、6,689,558、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824中有所描述,所有这些专利的公开内容以引用的方式整体并入本文。

还可以使用含有编码锌指、talen和/或一种或多种cas蛋白中的一者或多者的序列的载体递送如本文所述的核酸酶和/或供体构建体。可以使用任何载体系统,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体;疱疹病毒载体和腺相关病毒载体等。另见美国专利no.6,534,261、6,607,882、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824,这些专利以引用的方式整体并入本文。此外,显而易见的是,这些载体中的任何一种均可包含治疗所需的一种或多种序列。因此,当将一种或多种核酸酶和供体构建体引入细胞时,核酸酶和/或供体多核苷酸可以携带在相同载体上或不同载体上。当使用多个载体时,每个载体可以包含编码一种或多种核酸酶和/或供体构建体的序列。

常规的基于病毒和非病毒的基因转移方法可以用于将编码核酸酶和供体构建体的核酸引入细胞(例如,哺乳动物细胞)和靶组织中。非病毒载体递送系统包括dna质粒、裸核酸以及与递送媒介物(诸如脂质体或泊洛沙姆)复合的核酸。病毒载体递送系统包括dna和rna病毒,这些病毒在递送至细胞之后具有附加体基因组或整合基因组。关于基因治疗程序的综述,参见anderson,science256:808-813(1992)、nabel&felgner,tibtech11:211-217(1993)、mitani&caskey,tibtech11:162-166(1993)、dillon,tibtech11:167-175(1993)、miller,nature357:455-460(1992)、vanbrunt,biotechnology6(10):1149-1154(1988)、vigne,restorativeneurologyandneuroscience8:35-36(1995)、kremer&perricaudet,britishmedicalbulletin51(1):31-44(1995)、haddada等人,载于currenttopicsinmicrobiologyandimmunologydoerfler和(编)(1995年)以及yu等人,genetherapy1:13-26(1994)。

核酸的非病毒递送方法包括电穿孔、脂质转染、微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸dna、人工病毒颗粒以及试剂增强的dna摄入。使用例如sonitron2000系统(rich-mar)的声孔效应也可以用于递送核酸。

另外的示例性核酸递送系统包括由amaxabiosystems(cologne,germany)、maxcyte,inc.(rockville,maryland)、btxmoleculardeliverysystems(holliston,ma)和copernicustherapeuticsinc提供的那些(参见例如us6008336)。脂质转染在例如美国专利no.5,049,386、4,946,787和4,897,355中有所描述,并且脂质转染试剂是市售的(例如,transfectamtm和lipofectintm)。适用于多核苷酸的高效受体识别脂质转染的阳离子脂质和中性脂质包括felgner、wo91/17424、wo91/16024的那些脂质。

脂质:核酸复合物(包括靶向脂质体,诸如免疫脂质复合物)的制备本领域的技术人员熟知的(参见例如crystal,science270:404-410(1995);blaese等人,cancergenether.2:291-297(1995);behr等人,bioconjugatechem.5:382-389(1994);remy等人,bioconjugatechem.5:647-654(1994);gao等人,genetherapy2:710-722(1995);ahmad等人,cancerres.52:4817-4820(1992);美国专利no.4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。

本文所述的组合物(cdna和/或核酸酶)也可以使用纳米颗粒,例如脂质纳米颗粒(lnp)来递送。参见例如lee等人,(2016)amjcancerres6(5):1118-1134;美国专利公开no.20170119904;和美国临时申请62/559,186。

另外的递送方法包括将待递送的核酸包裹于engeneic递送媒介物(edv)中的使用。使用双特异性抗体(其中该抗体的一条臂具有针对靶组织的特异性,而另一条臂具有针对edv的特异性)将这些edv特异性地递送至靶组织。该抗体将edv带至靶细胞表面,随后edv通过胞吞作用被带入细胞中。一旦进入细胞,即释放内容物(参见macdiarmid等人(2009)naturebiotechnology27(7):643)。

使用基于rna或dna病毒的系统来递送编码经工程化的zfp的核酸利用将病毒靶向体内的特定细胞并且将病毒有效载荷运输至核的高度进化的方法。病毒载体可以直接施用于受试者(体内),或者它们可以用于体外处理细胞,并且将经修饰的细胞施用于受试者(离体)。用于递送zfp的常规的基于病毒的系统包括但不限于用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、痘苗病毒载体和单纯疱疹病毒载体。可以使用逆转录病毒、慢病毒和腺相关病毒基因转移法来进行宿主基因组中的整合,这通常导致所插入的转基因的长期表达。此外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。

逆转录病毒的趋向性可以通过掺入外源包膜蛋白、扩增靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并且通常产生高病毒滴定度的逆转录病毒载体。对逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体包含具有包裹高达6-10kb外源序列的能力的顺式作用长末端重复序列。最小顺式作用ltr足以用于载体的复制和包裹,然后用于将治疗性基因整合到靶细胞中,以提供永久转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)以及它们的组合的那些(参见例如buchscher等人,j.virol.66:2731-2739(1992);johann等人,j.virol.66:1635-1640(1992);sommerfelt等人,virol.176:58-59(1990);wilson等人,j.virol.63:2374-2378(1989);miller等人,j.virol.65:2220-2224(1991))。

在其中瞬时表达是优选的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中能够具有非常高的转导效率,并且不需要细胞分裂。使用这样的载体已经获得了高滴定度和高表达水平。该载体可以在相对简单的系统中大量产生。腺相关病毒(aav)载体还用于利用靶核酸转导细胞,例如在核酸和肽的体外产生中,以及用于体内和离体基因治疗程序(参见例如west等人,virology160:38-47(1987);美国专利no.4,797,368;wo93/24641;kotin,humangenetherapy5:793-801(1994);muzyczka,j.clin.invest.94:1351(1994))。重组aav载体的构建在许多出版物中有所描述,包括美国专利no.5,173,414;tratschin等人,mol.cell.biol.5:3251-3260(1985);tratschin等人,mol.cell.biol.4:2072-2081(1984);hermonat&muzyczka,pnas81:6466-6470(1984);以及samulski等人,j.virol.63:03822-3828(1989)。

目前至少有六种病毒载体方法可用于临床试验中的基因转移,这些临床试验利用涉及通过插入辅助细胞系中的基因与缺陷型载体互补的方法来生成转导剂。

plasn和mfg-s是已用于临床试验的逆转录病毒载体的实例(dunbar等人,blood85:3048-305(1995);kohn等人,nat.med.1:1017-102(1995);malech等人,pnas94:2212133-12138(1997))。pa317/plasn是在基因治疗试验中使用的第一种治疗载体。(blaese等人,science270:475-480(1995))。已经观察到mfg-s包裹载体的转导效率为50%或更高(ellem等人,immunolimmunother.44(1):10-20(1997);dranoff等人,hum.genether.1:111-2(1997))。

重组腺相关病毒载体(raav)是基于缺陷型和非病原性细小病毒腺相关2型病毒的有前景的替代性基因递送系统。所有载体均来源于仅保留了侧接转基因表达盒的aav145bp反向末端重复序列的质粒。由于整合到转导细胞的基因组中而产生的高效基因转移和稳定的转基因递送是该载体系统的重要特征。(wagner等人,lancet351:91171702-3(1998),kearns等人,genether.9:748-55(1996))。其他aav血清型,包括aav1、aav3、aav4、aav5、aav6、aav8、aav8.2、aav9和aavrh10以及假型aav(诸如aav2/8、aav2/5和aav2/6)也可以根据本发明使用。

复制缺陷型重组腺病毒载体(ad)能够以高滴定度产生,并且容易感染许多不同的细胞类型。大多数腺病毒载体被工程改造为使转基因替换ade1a、e1b和/或e3基因;随后,复制缺陷型载体在人类293细胞中繁殖,所述复制缺陷型载体以反式提供缺失的基因功能。ad载体可以在体内转导多种类型的组织,包括非分裂的分化细胞,诸如在肝脏、肾脏和肌肉中存在的那些细胞。常规ad载体具有较大的携带能力。在临床试验中使用ad载体的实例涉及利用肌肉内注射来进行抗肿瘤免疫的多核苷酸疗法(sterman等人,hum.genether.7:1083-9(1998))。在临床试验中使用腺病毒载体进行基因转移的其他实例包括rosenecker等人,infection24:15-10(1996);sterman等人,hum.genether.9:71083-1089(1998);welsh等人,hum.genether.2:205-18(1995);alvarez等人,hum.genether.5:597-613(1997);topf等人,genether.5:507-513(1998);sterman等人,hum.genether.7:1083-1089(1998)。

包裹细胞用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包裹腺病毒的293细胞,以及包裹逆转录病毒的ψ2细胞或pa317细胞。在基因治疗中使用的病毒载体通常由将核酸载体包裹到病毒颗粒中的生产细胞系产生。载体通常含有包裹和随后整合到宿主中(如果适用)所需的最小病毒序列,其他病毒序列被编码待表达的蛋白质的表达盒替换。缺失的病毒功能由包裹细胞系以反式提供。例如,在基因治疗中使用的aav载体通常仅具有来自aav基因组的反向末端重复(itr)序列,这些序列是包裹和整合到宿主基因组中必需的。病毒dna被包裹在细胞系中,该细胞系含有编码其他aav基因(即rep和cap)但缺乏itr序列的辅助质粒。该细胞系还用腺病毒(作为辅助病毒)感染。辅助病毒促进aav载体的复制和来自辅助质粒的aav基因的表达。由于缺乏itr序列,辅助质粒的量不足以被包裹。可以通过例如热处理来减少受腺病毒的污染,腺病毒对所述热处理的敏感度比aav更大。

在许多基因治疗应用中,将基因治疗载体以高度特异性递送至特定组织类型是所期望的。因此,可以通过在病毒的外表面上表达配体(作为与病毒外壳蛋白的融合蛋白)来将病毒载体修饰为对给定细胞类型具有特异性。选择对已知存在于所关注的细胞类型上的受体具有亲和力的配体。例如,han等人,proc.natl.acad.sci.usa92:9747-9751(1995)报道了moloney鼠白血病病毒可以被修饰为表达与gp70融合的人类调蛋白(heregulin),并且该重组病毒感染表达人类表皮生长因子受体的某些人类乳腺癌细胞。该原理可以扩展到其他病毒-靶细胞对,其中该靶细胞表达受体,而该病毒表达包含细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可以被工程化为展示对几乎任何选定的细胞受体具有特异性结合亲和力的抗体片段(例如,fab或fv)。虽然上述描述主要应用于病毒载体,但是相同的原理可以应用于非病毒载体。此类载体可以被工程化为包含有利于被特定靶细胞摄入的特定摄入序列。

基因治疗载体可以通过施用于个体患者而体内递送,通常通过全身施用(例如,静脉内输注、腹膜内输注、肌肉内输注、皮下输注或颅内输注)或局部施用,如下文所述。或者,可以将载体离体递送至细胞,诸如从个体患者外植的细胞(例如,淋巴细胞、骨髓抽出物、组织活检)或通用供体造血干细胞,随后将这些细胞重新植入患者(通常在选择已经掺入该载体的细胞之后)。

含有核酸酶和/或供体构建体的载体(例如,逆转录病毒,腺病毒,脂质体等)也可以直接施用于生物体,以用于体内转导细胞。或者,可以施用裸dna。通过通常用于将分子引入与血液或组织细胞最终接触的任何途径(包括但不限于注射、输注、局部施用和电穿孔)来施用。施用此类核酸的合适方法是可用的,并且是本领域的技术人员熟知的,虽然可以使用多于一种途径来施用特定组合物,但是特定途径通常可以提供比另一途径更直接和更有效的反应。

适用于引入本文所述的多核苷酸的载体包括非整合型慢病毒载体(idlv)。参见例如ory等人(1996)proc.natl.acad.sci.usa93:11382-11388;dull等人(1998)j.virol.72:8463-8471;zuffery等人(1998)j.virol.72:9873-9880;follenzi等人(2000)naturegenetics25:217-222;美国专利公开no2009/054985。

药学上可接受的载体部分由正在施用的特定组合物以及用于施用该组合物的特定方法来确定。因此,如下文所述,可以使用许多不同的合适的药物组合物制剂(参见例如remington’spharmaceuticalsciences,第17版,1989年)。

核酸酶编码序列和供体构建体可以使用相同或不同的系统来递送是显而易见的。例如,供体多核苷酸可以由质粒携带,而一种或多种核酸酶可以由aav载体携带。此外,不同的载体可以通过相同或不同的途径施用(肌肉内注射、尾静脉注射、其他静脉内注射、腹膜内施用和/或肌肉内注射)。载体可以同时或以任何顺序递送。

用于离体和体内施用的制剂包括液体或乳化液体中的悬浮液。活性成分通常与赋形剂混合,该赋形剂是药学上可接受的并且与活性成分相容。合适的赋形剂包括例如水、盐水、葡萄糖、甘油、乙醇等等,以及它们的组合。此外,组合物可以含有少量辅助物质,诸如润湿剂或乳化剂、ph缓冲剂、稳定剂或增强药物组合物有效性的其他试剂。

应用

本发明的方法考虑治疗和/或预防法布里病(例如,溶酶体贮积病)。治疗可以包括将矫正性疾病相关的gla转基因插入细胞中的安全港基因座(例如,白蛋白),以表达所需的酶并释放到血流中。编码矫正性α-gala的转基因可以编码野生型或经修饰的蛋白质;和/或可以包含密码子优化的gla转基因;和/或转基因,其中可以移除表位而不在功能上改变该蛋白质。在一些情况下,该方法包括将表达编码α-gala的转基因的附加体插入细胞中,以表达所需的酶并释放到血流中。插入分泌性细胞(诸如肝细胞,用于将产物释放到血流中)是特别有用的。本发明的方法和组合物也可以用于其中需要在造血干细胞中提供编码一种或多种治疗剂的gla转基因的任何情况,以使得来源于这些细胞(这些细胞的后代)的成熟细胞(例如,rbc)含有治疗性α-gala蛋白。这些干细胞可以体外或体内分化,并且可以来源于可以用于所有患者的通用供体细胞类型。另外,细胞可以含有跨膜蛋白以在体内运输细胞。治疗还可包括使用含有治疗性转基因的患者细胞,其中细胞离体发育,然后引回患者中。例如,可以通过骨髓移植将含有合适的编码α-gala的转基因的hsc插入患者中。或者,已经使用编码α-gala的转基因编辑的干细胞(诸如肌肉干细胞或ipsc)也可以注射到肌肉组织中。

因此,该技术可用于其中患者由于问题(例如,表达水平的问题或表达的蛋白质功能低下或无功能的问题)而缺乏某些蛋白质的情况。本发明特别有用的是转基因的表达,以矫正或恢复患有法布里病的受试者的功能。

作为非限制性实例,实施了生产功能性α-gala蛋白的不同方法,以替换缺陷或缺失的α-gala蛋白,这些方法用于治疗法布里病。编码蛋白质的核酸供体可以插入安全港基因座(例如,白蛋白或hprt),并使用外源性启动子或使用存在于安全港的启动子来表达。特别有用的是在肝细胞中的白蛋白基因座中插入gla转基因,其中gla转基因还包含编码信号肽的序列,该信号肽介导所表达的α-gala蛋白从肝细胞分泌到血流中。或者,供体可用于原位矫正缺陷基因。可以将所需的编码α-gala的转基因插入cd34+干细胞中并在骨髓移植期间返回患者。最后,可以将核酸供体插入β珠蛋白基因座处的cd34+干细胞中,以使得来源于该细胞的成熟红细胞具有高浓度的由核酸供体编码的生物剂。然后可以通过跨膜蛋白(例如,受体或抗体)使含有生物剂的rbc靶向正确的组织。另外,可以通过电致敏化来使rbc离体致敏,以使它们在暴露于能量源后更容易破裂(参见wo2002007752)。

在一些应用中,可以通过使用本发明的方法和组合物敲除内源性基因。这方面的实例包括敲除异常基因调控子或异常疾病相关基因。在一些应用中,可以用野生型基因在功能上或原位替换异常的内源性基因。还可以改变所插入的基因,以改善治疗性α-gala蛋白的表达或降低其免疫原性。在一些应用中,所插入的编码α-gala的转基因是融合蛋白,以增加其向选定组织(诸如大脑)的转运。

以下实施例涉及本公开的示例性实施方案,其中核酸酶包括锌指核酸酶(zfn)(或一对zfn)或talen(或一对talen)。应当理解,这仅用于举例说明的目的,并且可以使用其他核酸酶或核酸酶系统,例如具有经工程化dna结合结构域的归巢核酸内切酶(大范围核酸酶),和/或天然存在的经工程化的归巢核酸内切酶(大范围核酸酶)dna结合结构域和异源性切割结构域的融合体,和/或包含工经程化的单指导rna的crispr/cas系统。类似地,应当理解,合适的gla供体不限于下文示例的那些,而是包括任何gla转基因。

实施例

实施例1:编码α-gala的转基因的设计和构建

采用两种方法来表达gla转基因。一种方法称为(“ivprp”),它利用经工程化的核酸酶在白蛋白基因座处插入转基因,以使得表达由白蛋白启动子驱动(参见美国专利no.9,394,545和9,150,847)。第二种方法涉及用包含转基因的cdna拷贝的aav转导细胞,其中cdna还包含启动子和其他调控序列。用于这两种方法的gla转基因表达盒设计如图1所示。

实施例2:方法

hepg2/c3a和k562细胞转导

在cdna和系统二者中使用标准技术来转导hepg2细胞。

a.cdna

cdna方法可以包括使用aav递送的表达构建体,该表达构建体包含连接至haat启动子的apoe增强子(okuyama等人(1996)humgenether7(5):637-45)、hbb-igg内含子(由来自人类β-珠蛋白基因的第一内含子的5'-供体位点和来自免疫球蛋白基因重链可变区的内含子的分支和3'-受体位点组成的嵌合内含子)、信号肽、编码序列(其中编码序列是任选地密码子优化的)和牛生长激素(bgh)多聚a信号序列。

对于cdna系统,如本文所述用aavglacdna载体转导hepg2细胞,收集上清液并测试α-gala活性。此外,在不存在和存在过量甘露糖-6-磷酸(m6p,5mm)的情况下,在从转导的hepg2细胞收集的上清液中培养k562细胞,所述甘露糖-6-磷酸使细胞表面上的m6p受体饱和,并阻断α-gala的摄入。收集细胞沉淀并测试α-gala活性。

b.

法布里有三个组分:两个raav2/6载体,其编码zfnsbs47171和sbs47898,被设计为切割人类白蛋白内含子1中的特定基因座;以及一个raav2/6载体,其编码hgla供体模板。供体hgla模板是同源臂侧接的hglacdna的密码子优化形式,以促进供体至人类白蛋白中的同源性指导的修复(hdr)整合。

将hepg2/c3a细胞(也称为“hepg2”细胞)(atcc,crl10741)维持在含有厄尔盐(earle’ssalt)和l谷氨酰胺(corning,)的最低必需培养基(mem)中,所述最低必需培养基还含有10%胎牛血清(fbs)(lifetechnologies)和1x青霉素链霉素谷氨酰胺(lifetechnologies),并在37℃和5%co2下孵育。使细胞每34天传代一次。

对于转导,冲洗细胞并用0.25%胰蛋白酶/2.21mmedta(corning)进行胰蛋白酶消化,并重悬于生长培养基中。将一小份等分试样与溶于磷酸盐缓冲盐水(pbs;corning)的台盼蓝溶液0.4%(w/v)1:1混合,并在tc20自动细胞计数器(biorad)上计数。将细胞以2e5/ml的密度重悬于生长培养基中,并在每孔0.5ml培养基中以1e5接种于24孔板(corning)中。将重组aav2/6颗粒以适当的感染复数(moi)与生长培养基混合,并加入细胞中。

hepg2细胞仅用hgla供体(一式两份;对照)或用两个halbzfnsb47171和sb47931加sbids供体转导(一式三份)。仅供体转导的moi为6e5载体基因组(vg)/细胞。zfn+供体转导的moi对于每个zfn为3e5vg/细胞,对于hgla供体为6e5vg/细胞。这表示zfn1:zfn2:供体比率为1:1:2,该比率此前已被确定为体外实验的最佳比率。在加入zfn载体之后24小时加入hgla供体,以使体外转导效率最大化。

转导后,将细胞培养6-10天。在第3、5、7和10天(如果适用)收集上清液,并更换为新鲜培养基。在最终上清液收集步骤之后,将细胞用胰蛋白酶消化并如上文所述重悬,然后离心以形成细胞沉淀,用pbs洗涤,并储存在-80c下。

使用类似的方法用glacdna构建体转导hepg2细胞。glacdna构建体的moi为3e4、1e5、3e5或1e6vg/细胞。

α-gala活性测定

使用合成底物4-甲基伞形基-α-d-吡喃半乳糖苷(4mu-α-gal,sigma)在荧光测定法中评估α-gala活性。

简而言之,将10微升hepg2细胞培养物上清液与溶解于磷酸盐缓冲液(0.1m柠檬酸盐/0.2m磷酸盐缓冲液,ph4.6,1%tritonx-100)的40μl5mm4mu-α-gal混合。在37℃下孵育反应,并且通过加入100μl0.5m甘氨酸缓冲液(ph10.3)来终止反应。通过使用spectramaxgeminixs荧光读数器(moleculardevices,sunnyvaleca)测量荧光(ex365/em450)来测定4甲基伞形酮(4mu)的释放。

使用4mu的连续2倍稀释液生成标准曲线。将所得的数据与对数对数曲线拟合;使用该最佳拟合曲线来计算测试样品中4mu的浓度。酶活性以每ml细胞培养物上清液每小时测定孵育时间释放的nmol4mu(nmol/hr/ml)表示。

gb3的检测

gb3和lyso-gb3底物定量和分析:

通过质谱法在选定的鼠血浆和组织中测量法布里底物球形三酰基神经酰胺(gb3)。简而言之,将组织称重并在组织破坏液(5%meoh、95%水和0.1%苦味酸(asceticacid))中以每mg组织5ml液体的比率机械破碎。然后将10μl血浆或组织浆液加入硅化管中的90μl沉淀溶剂(meoh,内标n-二十三酰神经酰胺三己糖苷(c23:0,matreya)加标溶液)中,涡旋并在振荡板上室温下放置30分钟。然后离心样品并将10μl样品加入玻璃lc-ms小瓶中的90μl单一空白基质(dmso/meoh1:1+0.1%fa)中。分析样品的gb3链长度24:0(glako小鼠中存在的主要gb3物质),并且针对由神经酰胺三己糖苷(gb3,matreya)组成的标准曲线进行测量。

使用葡糖基鞘氨醇(matreya)作为内标以及溶血-神经酰胺三己糖苷(lyso-gb3,matreya)以类似的方式测量球形三酰基鞘氨醇(lyso-gb3),以生成标准曲线。

基因修饰的评估(%插入缺失)

使用miseq系统(illumina,sandiegoca)对zfn靶点进行序列分析。设计一对寡核苷酸引物来扩增跨越人类白蛋白基因座或小鼠白蛋白基因座中的zfn靶点的194bp片段,并引入结合序列用于第二轮扩增。纯化此pcr扩增产物,并用经设计以引入扩增子特异性标识符序列(“条形码”)的寡核苷酸,以及经设计用于结合测序寡核苷酸引物的末端区域进行第二轮pcr。然后对混合的条形码化扩增子群进行miseq分析,miseq分析是允许在单个测定芯片上平行分析数千个样品的固相测序程序。

在glako小鼠模型中对法布里和cdna载体进行体内测试

为了证明这些治疗剂在法布里病的动物模型中的功效,用与hepg2细胞中使用的相同的aav2/6glacdna构建体转导glako小鼠。用法布里ivprp的小鼠型转导其他glako小鼠,法布里ivprp的小鼠型由两个raav2/8载体(编码zfnsb-48641和sb-31523,经设计用于切割小鼠白蛋白)和一个raav2/8载体(编码具有小鼠同源臂的hglacdna供体模板)组成。作为对照,用不含载体颗粒的aav载体制剂缓冲液(pbs、35nmnacl、1%蔗糖、0.05%普兰尼克f-68ph7.1)注射另外的glako小鼠和野生型小鼠。从aav注射前一天开始,动物每两周接受50mg/kg环磷酰胺。所有小鼠在注射时均为4-12周龄。监测小鼠2-3个月,每周或每两周通过下颌下穿刺抽取血浆,以测量血浆α-gala活性。在实验结束时对小鼠实施安乐死,并如上文所述测量血浆、肝脏、肾脏、心脏和脾脏中的α-gala活性。通过质谱法测量血浆、肝脏、肾脏、心脏和脾脏中的gb3和lyso-gb3底物水平。对于用法布里ivprp处理的小鼠,如上文所述通过miseq测量肝脏组织中的插入缺失。

蛋白质印迹和脱糖基化程序

在0.1m柠檬酸盐/0.2m磷酸盐缓冲液(ph4.6)中对小鼠肝脏进行匀浆。将肝脏匀浆物煮沸10分钟,然后根据neb方案通过用pngasef(newenglandbiolabs,neb)处理1小时来使每个样品的等分试样脱糖基化。

将1ug总蛋白负载到nupage4-12%bis-trismidi凝胶(invitrogen)上。在pngasef处理之前和之后负载的0.5ng重组人类gla(r&dsystems)作为大小参照物包括在内。

用于蛋白质印迹的抗体为:一抗:α-gla,sinobiological兔单克隆抗体,1:1000;二抗:山羊α-兔igg-hrp,thermofisher,1:10,000。

实施例3:gla转基因的体外表达

方法:方法在以上实施例2中有所描述。简而言之,用aav2/6zfn和hgla供体载体,以100kvg/细胞的剂量(对于每种zfn)和200kvg/细胞(对于gla供体)或300k/600k的剂量(分别对于zfn和供体)转导hepg2/c3a细胞。

如图2所示,转导的细胞在上清液和细胞沉淀中具有增加的α-gala活性,并且活性在zfn+供体组中达到3x空白对照转导的hepg2水平。对于gla供体构建体a和b,在每个载体剂量下测量白蛋白基因座上的插入缺失(zfn活性的量度)。供体a和b中的插入缺失对于300/600载体剂量为43.46%和39.81%,对于100/200载体剂量为8.81%和9.69%。

cdna方法:如上文所述,还在hepg2/g3细胞中测试图1b所示的cdna构建体。如图3所示,用aav2/6glacdna载体转导的hepg2/c3a细胞在上清液和细胞沉淀中具有剂量依赖性增加的α-gala活性。每个剂量在图3中标记,并标示每个细胞的千(k)个病毒载体拷贝数。在高cdna剂量下,上清液α-gala活性达到200x空白对照水平。

可以分离蛋白质并在酶替代疗法中施用于受试者。

实施例4:两种方法的体内测试

接下来,对两种类型的方法(cdna和)进行体内测试。将构建体包裹到aav2/6或aav2/8中,然后静脉内注射到gla敲除(glako)小鼠中。这是法布里病的小鼠模型(bangari等人,(2015)amjpathol.185(3):651-65)。测试项目(表2)以及给药方案(表3)如下所示。

表2:和cdna方法的测试项目

表3:和cdna方法的体内测试的给药方案

*动物给药以vg/小鼠为计。假设所有小鼠的体重为0.020kg,对于接受zfn+供体的动物,总aav剂量水平为7.5e13vg/kg。

cdna方法

如图4所示,来自cdna处理组的glako小鼠早在aav施用后第7天就在血浆中显示出超生理学α-gala活性。图中示出了单个小鼠的结果。每周测量血浆α-gala活性,并且在整个研究期间维持高剂量依赖性活性水平。在低剂量(2.0e12vg/kg)组中血浆活性高达6x野生型,在高剂量(2.0e13vg/kg)组中达到280x野生型。在两个月后对小鼠实施安乐死,并分析肝脏和次级远端组织中的α-gala活性和gb3积累。

如图5所示,在肝脏、心脏和肾脏中发现α-gala活性的剂量依赖性增加,以及gb3底物含量的相应减少。在施用高aav2/6cdna剂量的一些glako小鼠的组织中不可检测出gb3。还根据相对于未经处理的glako小鼠的底物清除量来分析数据(图5e和图5f),并且证明以高cdna剂量处理的小鼠具有平均小于未经处理的glako小鼠中发现的底物的10%。

方法:

在90天的时间内,对方法给药的galko小鼠采集血浆水平。数据(图6a)表明,在血清中检测到的α-gla蛋白活性水平为野生型小鼠所见的大约25-30%。在该实验中,对一组细胞给予轻度免疫抑制方案(每2周50mg/kg环磷酰胺)。肝脏中的zfn活性测量(插入缺失)发现,用轻度免疫抑制治疗的动物具有稍高水平的插入缺失(图6b),但是两组均具有预期的插入缺失百分比范围。

使用越来越严格的免疫抑制(剂量如下表4中所示)进行第二次实验,数据(图6c、6d和6e)表明免疫抑制不会显著增加α-gala蛋白活性。

表4:体内研究#2,免疫抑制滴定

α-gala被认为易于因错误折叠而失活,因为位于蛋白质活性位点的远端的一些突变导致法布里病(garman和garboczi(2004)jmolbiol337(2):319-35),并且已经提出使用分子伴侣(包括脱氧半乳糖野尻霉素(dgj))来与一些gla突变体一起使用(moise等人,(2016)j.am.soc.massspectrom27(6):1071-8)。因此,在上述研究中,在大约第30-35天加入dgj。具体地讲,每天通过经口管饲给予在200ul水中稀释的3mg/kg。在用dgj处理的动物中检测到α-gala活性快速升高(图7)。

如上文所述,还检查了该研究中来自动物的组织的α-gla活性。结果(图8)表明,可以在组织中特别是在肝脏和脾脏中检测到活性。在所有组织中,检测到的高剂量cdna方法的活性高于野生型小鼠。

如上文所述,还在血浆、肝脏和心脏组织中测量α-gala主要底物的水平。数据(图9)显示,样品的血浆中可检测出的gb3减少,而cdna样品(相当于野生型小鼠)中不存在可检测出的gb3。对于肝脏和心脏组织,样品也显示出可检测出的gb3减少,这对于低剂量cdna样品也是如此。对于高剂量cdna样品,水平与野生型样品几乎相同。

这些结果表明,通过如本文所述的cdna或方法提供的gla转基因提供了体内治疗益处。

实施例5:供体设计的优化

还研究了方法的供体设计以优化gla编码区设计和优化信号肽。首先,改变供体设计以在gla编码序列之前引入α-gala(gla)信号肽(序列:mqlrnpelhlgcalalrflalvswdipgara,seqidno:1),并且在α-gala信号肽之前插入kozak序列(序列:gccaccatg,seqidno:2),以引发与白蛋白信号肽分开的新翻译事件(参见图10,实例为变体#a、变体#b)。此外,分析了替代ids信号肽(序列:mppprtgrgllwlglvlssvcvalg,seqidno:3)的使用(图10,变体#h),包括和使用来自t.aszgna的2a样序列(“t2a”)(luke等人,(2008)jgenvirol.89(pt4):1036–1042),以在翻译过程中移除信号肽的序列5'。如前所述,在hepg2/c3a细胞中测试新构建体。

结果显示,变体#a和变体#b在体外具有比初始供体(图11a)高得多的α-gala活性水平。此外,与变体a或初始供体相比,变体k表现出甚至更高的α-gala活性水平(图11b)。

然后使用下表5中列出的给药方案在glako小鼠中体内测试构建体。

表5:glako小鼠中供体设计的体内测试

如上文所述,每周一次采集血浆以测量α-gala活性。在每只小鼠的所有样品中发现活性,新设计显示出优于初始供体的改善(图12),并且在第28天水平比野生型高至少40倍(以虚线表示)。样品随时间推移显示出增加,其中活性为第2组的大约80x野生型水平(供体#a)和第4组的50xwt(供体#e)的量度。从小鼠中取出组织样品,测量gb3的水平,发现与未经处理的glako小鼠相比减少。

上述实验进行56天,此时处死动物,并分析肝脏、心脏、肾脏和脾脏中的α-gala活性。扩展数据(图15)表明,这种方法导致测试组织中的α-gala活性增加,包括与野生型动物的血浆相比经处理的动物血浆中的α-gala活性增加100倍,与野生型(未经处理的)动物的心脏相比经处理的动物心脏中的α-gala活性增加9倍,并且与未经处理的(野生型)动物相比经处理的动物肾脏中的α-gala活性增加80%。

然后进行组织分析以测定处理后各种组织(血浆、肝脏、心脏和肾脏)中α-gala糖脂底物(gb3(图16a)和lyso-gb3(图16b))的水平。如图16所示,与处理前(初始)和未经处理的(野生型)动物相比,在用a、b或e变体处理的动物的所有测试组织(血浆、肝脏、心脏和肾脏)中,如本文所述的处理导致两种底物(gb3和lyso-gb3)的水平降低,表明本文所述的组合物和方法在体内提供了治疗有益的蛋白质水平。

如上文所述重复实验,以测定在用白蛋白靶向的zfn施用变体e和变体j(参见图10)之后,血浆和各种组织(肝脏、心脏、肾脏和脾脏)中的α-gala活性。如图20和21所示,接受变体j供体的动物的血浆中(图20a)和肝脏、心脏、肾脏和脾脏中(图20b)的α-gala活性产生的血浆α-gala活性几乎是野生型的300x,并且肝脏、心脏和脾脏中的组织α-gala活性比野生型高10-100x或更多。

如本文所述测量处理后各种组织(血浆、肝脏、心脏和肾脏)中的α-gala糖脂底物(gb3(图21a)和lyso-gb3(图21b))的浓度。如图21所示,变体j的表达大大地降低了底物水平。

实施例6:用于cdna方法的gla转基因盒设计的优化

还优化了用于cdna方法的gla转基因盒。转基因连接至编码不同信号肽的序列,包括α-gala肽、ids基因的信号肽(艾杜糖醛酸2-硫酸酯酶)、fix基因(因子ix,(序列:mqrvnmimaespgliticllgyllsaec,seqidno:4))和白蛋白(序列:mkwvtfisllflfssays,seqidno:5)

信号肽(图13b)。此外,将gla转基因插入到替代的优化的cdna表达载体中(图13a,也是美国公开no.20170119906)。如上文所述在hepg2/c3a细胞中以每个细胞30,000至600,000(k)个病毒载体拷贝的剂量范围体外测试所有构建体,表明ids和fix(f9)前导序列产生比使用gla或alb(白蛋白)前导序列更大的α-gala活性(图14a)。cdna变体#4、#5和#6的数据(图13)如图14b所示。

如上文所述,还在glako小鼠中测试构建体,并且该构建体在体内是有活性的。

实施例7:通过蛋白质印迹和脱糖基化分析α-gala蛋白

如实施例2中所述,分析来自用方法或cdna方法处理的小鼠的血浆中α-gala蛋白的存在。此外,还用pngasef处理样品以引起脱糖基化。

如图17所示,在(图17a描绘了变体a和变体j的结果)或初始cdna构建体(图13b中描绘的构建体,数据在图17b中显示)处理之后,在glako小鼠中体内产生α-gala蛋白的表现与重组hgala蛋白类似,表明本文所述的组合物和方法提供了临床相关水平(即与目前用于酶替代疗法的那些重组治疗性蛋白类似的治疗水平)的蛋白质。

实施例8:cdna施用后的体外蛋白质产生

如实施例2所述,用aavglacdna变体#4转导hep2g细胞,在5天后收集上清液并测试α-gala活性,且上清液用于培养k562细胞。

如图28a所示,在用aavglacdna变体#4转导hepg2细胞后5天收集的上清液显示出大量α-gala活性。图28b显示来自hepg2上清液的α-gala在24小时内被k562摄入,并且摄入被m6p阻断。

因此,如本文所述的细胞大量产生和分泌α-gala,然后分泌的α-gala被其他细胞摄入。因此,本文所述的系统可用于产生α-gala,用于例如在酶替代疗法中施用于有需要的受试者。

实施例9:用cdna变体#4处理的小鼠的体内活性

用含有5.0e10vg(2.0e12vg/kg)aav的200μl制剂缓冲液静脉内处理glako小鼠,所述aav包含cdna变体#4(参见图13)或初始cdna构建体(图13b),并且分析血浆α-gala活性2个月的时间。用变体#4处理的glako小鼠的血浆中的α-gala活性是针对初始cdna构建体观察到的大约10x(图18a)。如上文所述,对于两个治疗组,还测量了肝脏、心脏、肾脏和脾脏的活性,且在图18b中示出。此外,在经处理小鼠的肝脏中分析α-gala蛋白,如上文所讨论用pngasef或endoh处理后观察到分子量的变化(图18c)。另外,如图32所示,用初始和变体#4cdna二者处理的glako小鼠在所有测试组织中表现出降低的法布里底物浓度。

这些数据表明,cdna方法也是产生体内治疗有益水平α-gala蛋白的稳健平台。

实施例10:用初始cdna构建体处理的小鼠中的体内剂量滴定

用一定剂量的aav静脉内处理glako小鼠,所述aav包含1.25e11vg/kg至5.0e12vg/kg范围内的初始cdna构建体(图13b),并且如实施例4和5所述分析血浆α-gala活性6个月的时间。

用初始cdna处理的glako小鼠在血浆中具有1x野生型多至40x野生型的范围内的剂量依赖性α-gala活性(图19)。此外,如图29所示,在转导后6个月α-gala活性维持在治疗水平(以剂量依赖性方式),表明长期治疗益处。图30显示出第180天(治疗后6个月)肝脏、脾脏、心脏和肾脏中的α-gala活性,并且还显示出这些组织中的治疗水平。α-gala活性的剂量依赖性增加也对应于gb3底物含量的降低。参见图31和32,图中显示出所评估的所有组织中gb3含量的剂量依赖性降低。

数据表明,在用本文所述的cdna方法处理的受试者中产生治疗水平的α-gala蛋白。

实施例11:其他体内研究

用zfn和各种示例性hgla供体构建体处理glako小鼠,并且如上文所述评估基因组修饰、体内gla活性和体内法布里底物的减少。参见实施例5。

如图22所示,核酸酶介导的gla供体整合导致法布里病的glako小鼠模型中肝细胞的永久性修饰。图23示出了在核酸酶和gla供体施用于动物后,随时间推移(图23a)和两个月时(图23b)指定组织中的α-gala活性。如图所示,肝脏产生的α-gala分泌到血流中并被次生组织吸收,包括稳定的血浆活性达到多至野生型的80倍。图24示出了与未经处理的动物、野生型动物和仅用供体处理的动物相比,用核酸酶和供体处理的动物在所有测试组织中表现出大大降低的底物浓度。

使用变体l和称为变体m的经修饰的供体在hepg2和glako小鼠中进行实验(图25),变体m包括代替变体l的gla信号肽的ids信号肽。

为了检测l和m供体整合,使用基于无偏pcr方案的ngs方法,与缺乏整合事件的野生型基因产生的产物相比,当供体整合时所述无偏pcr方案产生不同的产物。简而言之,在转基因的3’末端添加5-ngs引物序列(与图25b中的引物1相同)(参见图25a)。紧接着在ngs引物序列的下游添加靶向整合(ti)序列。ti序列具有与白蛋白基因座中的相应序列相同的碱基组成和长度,但是碱基序列是乱序的,使得与包含转基因整合的基因座相比,对于无整合的野生型基因座相关的pcr产物的扩增,不引入pcr偏差。因此,两种pcr产物利用相同的引物,并且产生相同大小和组成但具有不同序列的pcr产物,允许通过ngs容易地鉴定ti事件,以及通过ngs同时分析插入缺失和ti事件。

对于人类细胞中的整合事件的分析,使用的引物如下:

引物1:5’gcactaaggaaagtgcaaag(seqidno:6)

引物2:5’taatactcttttagtgtcta(seqidno:7)

人类细胞中使用的ti序列如下所示,其中乱序序列以斜体显示,而引物1结合位点的位置以下划线显示:

5’gcactaaggaaagtgcaaagtaagattgaccagaccagatagaagaatgtaactgtagttctaataggacttattatcccaaagac(seqidno:8)。

使用两种引物扩增产生222bp的扩增子,如下所示:

野生型扩增子(无插入):

ti扩增子(斜体表示乱序序列):

类似地,用于小鼠细胞的ti序列和引物如下所示。对于整合事件的分析,使用的引物如下:

引物1:5’ttgagtttgaatgcacagat(seqidno:11)

引物2:5’gaaacagggagagaaaaacc(seqidno:12)。

小鼠细胞中使用的ti序列如下所示,其中乱序序列以斜体显示,而引物1结合位点的位置以下划线显示:

使用两种引物扩增产生247bp的扩增子,如下所示:

野生型扩增子(无插入):

ti扩增子(斜体表示乱序序列):

此外,该技术可以与非人类灵长类动物(恒河猴,nhp)一起使用,使用如下所示的引物和插入的ti序列:

引物1:5’ccactaaggaaagtgcaaag(seqidno:16)

引物2:5’tgaaagtaaatataaatacaagttc(seqidno:17)

nhp细胞中使用的ti序列如下所示,其中乱序序列以斜体显示,而引物1结合位点的位置以下划线显示:

使用两种引物扩增产生173bp的扩增子,如下所示:

野生型扩增子(无插入):5’ccactaaggaaagtgcaaagtaacttagagtgacttaaacttcacagaacagagttgaagattgaattcataactgtccctaagacctatccattgcactatgctttatttaaaagccacaaaacctgtgctgttgatctcataaatagaacttgtatttatatttactttca(seqidno:19)

ti扩增子(斜体表示杂乱序列):

因此,用zfn和gla供体变体#l处理来自肝癌细胞系hepg2的人类细胞,变体#l含有用于hdr分析的ti序列。在转导后7天从转导的细胞纯化dna,并通过ngs进行分析。

如图26所示,体外插入缺失和ti(hdr)显示出对固定比率的zfn和ti供体的剂量依赖性响应。此外,如glako小鼠所示,变体m的核酸酶介导的靶向整合(ti)产生高达野生型的250倍的稳定的血浆活性,并且心脏和肾脏中的α-gala活性分别超过野生型20倍和超过野生型4倍。

还进行了测定以进一步评估在gla供体构建体的核酸酶介导的ti之后α-gala是否被次生组织吸收。简而言之,如上文所述,含有ids信号肽和用于分析靶向整合(ti)(供体变体m)的3’序列的gla供体构建体用于治疗glako小鼠,并且测定血浆和组织样品(例如,肝脏、心脏、脾脏、肾脏、大脑等)的α-gala活性和底物浓度。

如图27所示,α-gala稳定的血浆活性高达野生型的250倍,并且心脏和肾脏中的α-gala活性分别超过野生型20倍和4倍。

数据表明,在用本文所述的ivprp方法处理的受试者(包括次生组织)中产生治疗水平的α-gala蛋白。

本文提及的所有专利、专利申请和出版物据此以引用的方式整体并入。

虽然为了清楚理解的目的,已通过说明和实施例详细地提供了公开内容,但是对于本领域的技术人员显而易见的是,可以在不脱离本公开的实质或范围的情况下实施各种变化和修改。因此,上文描述和实施例不应当理解为限制性的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1