酸性α-糖苷酶及其片段的制作方法

文档序号:707888阅读:703来源:国知局
专利名称:酸性α-糖苷酶及其片段的制作方法
相关申请的引用本申请要求在2004年2月10日提交的申请号为No.60/543,812的美国专利申请的优先权,通过引用将其内容并入本申请。
背景技术
酸性α-糖苷酶(GAA)是一种溶酶体酶,它水解麦芽糖和其他线性寡糖中的α1-4连键,所述线性寡糖包括糖原的外侧支,因此GAA分解了溶酶体内过多的糖原(Hirschhorn et al.(2001)in The Metabolic andMolecular Basis of Inherited Disease,Scriver,etal.,eds.(2001),McGraw-HillNew York,p.3389-3420)。与其他的哺乳动物的溶酶体酶一样,GAA是在细胞浆内合成,并经过ER,其中它以高甘露糖型碳水化合物进行N连接的糖基化。在高尔基体中,通过添加使得这些蛋白导向溶酶体的甘露糖-6-磷酸(M6P)而修饰溶酶体蛋白上的高甘露糖型碳水化合物。通过与两种M6P受体中的一种受体的相互作用将M6P修饰蛋白转运到溶酶体。最好的修饰形式是两种M6P都被添加到高甘露糖型碳水化合物中。
溶酶体内GAA活性的不足造成了Pompe病,一种也被称作酸性麦芽糖酶缺乏症(AMD)、II型糖原贮积病(GSDII)、II型糖原病、或GAA缺乏症的疾病。酶活性减低的发生是因为编码GAA的基因内的各种错义和无义突变。其结果是糖原蓄积在Pompe病患者的所有细胞的溶酶体内。具体地,糖原蓄积在心肌和骨骼肌、肝脏、和其他组织的溶酶体内是最为显著的。蓄积的糖原最终损害了肌肉功能。在Pompe病的最严重形式中,在2岁前即因为心肺衰竭而发生死亡。
现在,还没有得到经批准的能治愈或减缓Pompe病进展的治疗方法。当前处于临床试验的酶替代疗法要求施用被肌肉和肝脏组织的细胞摄取并经M6P依赖性方式被转运到这些细胞的溶酶体的重组GAA。但是,在遗传工程化的CHO细胞中以及在转基因兔的乳汁中所产生的重组GAA(最近在Pompe酶替代治疗试验中所用的酶的两种来源)只含有极少量的M6P(Van Hove et al.(1996)Proc Natl Acad Sci USA,93(1)65-70;和美国专利No.6,537,785)。因此,重组GAA向溶酶体的M6P依赖性转运是不充分的,需要高剂量及频繁输注。所以,仍需要用于将治疗性GAA酶导向患者溶酶体的新的、更简单的、更有效的、和更低成本的方法。

发明内容
本发明通过利用基于肽标记(peptide tag)的导向策略能够将人GAA或GAA样酶M6P非依赖性地导向患者的溶酶体。因此,本发明提供了GAA或GAA样酶向靶细胞内的有效转运。
本发明部分涉及利用多种编码代表GAA蛋白的不同部分的多肽的开放读框能重组表达GAA这一发现。当一起提供时,所形成的多肽可以协同提供所需的酶活性。
因此,本发明的一个方面涉及一种编码包括与人GAA的第70-790位氨基酸残基或其片段具有至少50%相同性(例如,至少60%、至少70%、至少80%、至少90%、至少95%、或100%相同性)的氨基酸序列的多肽的开放读框的核酸序列(例如DNA序列)。该开放读框不包括与人GAA的第880-952位氨基酸残基具有至少50%相同性(例如,至少60%、至少70%、至少80%、至少90%、至少95%、或100%相同性)的氨基酸序列。
在另一个方面,本发明涉及一种编码包括与人GAA的第880-952位氨基酸残基或其片段具有至少50%相同性(例如,至少60%、至少70%、至少80%、至少90%、至少95%、或100%相同性)的氨基酸序列的多肽的开放读框的核酸序列(例如DNA序列)。该开放读框不包括与人GAA的第70-790位氨基酸残基具有至少50%相同性(例如,至少60%、至少70%、至少80%、至少90%、至少95%、或100%相同性)的氨基酸序列。
本发明也涉及含有此类核酸序列之一或两者的细胞。
在一个实施方式中,本发明的核酸也编码与GAA多肽融合的肽标记。优选的肽标记是一种细胞外受体的配体。在一些实施方式中,肽标记是一种导向结构域(targeting domain),它与靶细胞表面上的受体的细胞外结构域结合,在受体内化之后,使得多肽定位于人溶酶体。在一个实施方式中,导向结构域包括能结合阳离子非依赖性甘露糖-6-磷酸受体的尿激酶型纤溶酶原受体部分。在另一个实施方式中,导向结构域整合了与阳离子非依赖性甘露糖-6-磷酸受体结合的IGF-II的一个或多个氨基酸序列(例如至少第48-55位氨基酸;至少第8-28和41-61位氨基酸;或至少第8-87位氨基酸)或其序列变体(例如R68A)或其截短形式(例如在C末端从第62位起被截短)。在一个实施方式中,肽标记直接与GAA多肽的N或C末端融合。在另一个实施方式中,肽标记经间隔物与GAA多肽的N或C末端融合。在一个具体的实施方式中,肽标记经10-25个氨基酸长度的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经包含多个甘氨酸残基的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经包含α螺旋结构的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经与序列GGGTVGDDDDK具有至少50%相同性的间隔物与GAA多肽融合。
本发明也涉及本发明的核酸所编码的多肽以及整合了这些多肽的药物制剂。
本发明也部分涉及对肽标记所能融合的GAA的特殊位点的鉴定。因此,在一个方面,本发明涉及一种导向治疗药物,包括一种与人GAA或其一部分的第68、69、70、71、72、779、787、789、790、791、792、793、或796位氨基酸融合的肽标记。导向治疗药物可以包括例如人GAA的第70-952位氨基酸残基,或更小的部分例如第70-790位氨基酸残基。在一个实施方式中,肽标记与氨基酸70融合,或与氨基酸70一或两个位点范围内的氨基酸融合。在一些实施方式中,肽标记是一种细胞外受体的配体。例如,一些肽标记是导向结构域,它与靶细胞表面上的受体的细胞外结构域结合,在受体内化之后,使得治疗药物定位于人溶酶体。在一个实施方式中,导向结构域包括能结合阳离子非依赖性甘露糖-6-磷酸受体的尿激酶型纤溶酶原受体部分。在另一个实施方式中,导向结构域整合了与阳离子非依赖性甘露糖-6-磷酸受体结合的IGF-II的一个或多个氨基酸序列(例如至少第48-55位氨基酸;至少第8-28和41-61位氨基酸;或至少第8-87位氨基酸)或其序列变体(例如R68A)或其截短形式(例如在C末端从第62位起截短)。肽标记直接或经间隔物与GAA多肽融合。在一个具体的实施方式中,肽标记经10-25个氨基酸长度的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经包含多个甘氨酸残基的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经包含α螺旋结构的间隔物与GAA多肽融合。在另一个具体的实施方式中,肽标记经与序列GGGTVGDDDDK具有至少50%相同性的间隔物与GAA多肽融合。


图1-1到1-14描述了选定的糖苷水解酶家族31的成员的氨基酸序列对比。
图2是GAA蛋白的图解说明。
图3描述了用于生成肽标记的GAA的示例性策略。
图4描述了利用野生型GAA和SS-GAAΔ1-69的示例性摄取试验。
图5描述了利用SS-GAAΔ1-69和SS-GILTΔ2-7-GAAΔ1-69的示例性摄取试验。
图6是对1-87-IGF-II标记的GAA蛋白的示例性Western印迹分析左边是用抗GAA抗体检测;右边是用抗IGF-II抗体检测。道1pCEP-GILT1-87-GAA56-952;道2pCEP-GILT1-87-R68A-GAA56-952-1;道3pCEP-GILT1-87-R68A-ΔGS-GAA56-952-1;道4pCEP-GILTΔ2-7-spcrl-GAA70-952-1;道5pCEP-GAA;道6pCEP-GILT-GAA29-952。
图7是比较野生型GAA和GAA-791Asc的蛋白裂解物的示例性Western印迹分析。
图8是对野生型GAA和具有经下游X因子蛋白酶位点遗传工程化的GILT标记的GAA构建体GAA787GILTXa、GAA779GILTXa、以及GAA796GILTXa的示例性Western分析。也描述了GAA C末端的加工模型。
具体实施例方式
本发明提供了一种生产能更有效地导向哺乳动物细胞(例如人的心肌和骨骼肌细胞)的溶酶体的GAA的方法。GAA是糖苷水解酶家族31中的一个成员(图1-1到1-14)。人GAA被合成作为110kDa的前体(Wisselaar et al.(1993)J.Biol.Chem.268(3)2223-31)。酶的成熟形式是70和76kDa单体的混和物(Wisselaar et al.(1993)J.Biol.Chem.268(3)2223-31)。前体酶具有7个潜在的糖基化位点,并且成熟酶仍然保留了其中的4个位点(Wisselaar et al.(1993)J.Biol.Chem.268(3)2223-31)。产生成熟酶的蛋白裂解的降解事件发生在晚期内含体或发生在溶酶体(Wisselaar et al.(1993)J.Biol.Chem.268(3)2223-31)。
成熟的70和76kDa类型都缺少C末端的160个氨基酸。但是,造成GAA活性完全丢失的某些Pompe等位基因就位于这个区域,例如Val949Asp(Becker et al.(1998)J.Hum.Genet.62991)。这种突变体的表型说明尽管蛋白的C末端部分不是70或76kDa类型的一部分,但它仍在蛋白的功能中起到了重要的作用。最近已经报道尽管蛋白的C末端部分在加工过程中与蛋白的其他部分分离,但它仍与主要类型(major species)相关(Moreland et al.(Nov.1,2004)J.Biol.Chem.,Manuscript 404008200)。因此,C末端的残基能在蛋白的催化活性中起到直接作用。或者,C末端的残基可能涉及促进蛋白的N末端部分的正确折叠。
一种相关蛋白蔗糖酶-异麦芽糖酶的某些等位基因的行为支持了后一种可能性。该家族包括蔗糖酶-异麦芽糖酶(SI)蛋白,它在单个多肽上含有两个串联排列的不同的但同源的糖苷水解酶催化结构域。每个催化结构域在大小上都与整个GAA多肽相似,并且这两个区域与GAA具有36%和39%的相同性。SI在肠涮状缘细胞内表达,并位于这些极性细胞的顶膜上,其催化结构域通过氨基末端的跨膜结构域面向肠腔。一旦到达顶膜,通过胰蛋白酶将蔗糖酶结构域与氨基近端的异麦芽糖酶结构域分开,而异麦芽糖酶结构域仍与膜相连。最近研究表明蔗糖酶结构域是异麦芽糖酶结构域的正确折叠以及之后的转运所必需的;蔗糖酶被称为折叠异麦芽糖酶结构域所需的分子内伴侣(Jacob et al.(2002)J.Biol.Chem.27732141)。
对大量遗传工程化的GAA表达盒的表达的分析已经能够鉴定出两种尽管与成熟多肽分离的但仍是哺乳动物细胞分泌功能性蛋白所必需的区域。图2概括了现在我们所了解的GAA的结构组成。前体多肽具有一个信号序列和一个邻近的推定跨膜结构域、三叶形结构域(PFAMPF00088)(它是一种含有3个二硫键的约45个氨基酸的富含半胱氨酸的结构域,并认为其涉及蛋白-蛋白或蛋白-糖的相互作用(Thim(1989)FEBS Lett.25085))、成熟70/76kDa多肽所确定的区域、和C末端结构域域。SI的三叶形结构域内的突变对SI的顶膜分选模式具有影响(Spodsberg(2001)J.Biol.Chem.27623506)。实施例1和2中的数据表明三叶形结构域和C末端结构域都是生产功能性GAA所必需的结构。可能是因为在蛋白折叠期间,C末端结构域与三叶形结构域的相互作用有助于三叶形结构域内的正确的二硫键的形成。
在本发明的一个实施方式中,编码肽标记的DNA序列的骨架与编码除C末端结构域外的整个GAA多肽的GAA表达盒的3’末端融合。该表达盒在哺乳动物细胞内共表达,哺乳动物细胞也将GAA的C末端表达为一种单独的多肽。
然后C末端结构域结合70/76kDa类型反式地发挥作用,以生成活性GAA。催化结构域和C末端结构域之间的边界出现在第791位氨基酸残基的附近,依据于它存在于绝大多数水解酶家族31的成员所不具有的小于18个氨基酸的短区域上,以及它含有GAA中的4个连续的脯氨酸残基。事实上,现在已经报道,与成熟类型相连的C末端结构域开始于氨基酸残基792(Moreland et al.(Nov.1,2004)J.Biol.Chem.,Manuscript404008200)。
通过驱动被引入到哺乳动物细胞内的一个质粒构建体表达两种多肽以生成稳定的细胞系,可以实现共表达。通过这样一种质粒上的两个启动子或通过一个驱动其中由IRES元件分开两个表达盒的双顺反子构建体的表达的启动子可以驱动表达。或者,用采用不同选择标记物的单独的质粒可以次序地构建出表达两种蛋白的细胞系。
在这些融合体中所用的导向CI-MPR的肽标记可以来自IGF-II。或者,可以采用优先与肌管表面上的受体结合的肽标记。已经描述了这些多肽(Samoylova et al.(1999)Muscle and Nerve 22460;美国专利No.6,329,501)。其他细胞表面受体例如Fc受体、LDL受体、或转铁蛋白受体也都是合适的靶点并能促进GAA的靶向作用。
在本发明的另一个实施方式中,在成熟70/76kDa多肽与C末端结构域的交界处(例如位点791),将编码肽标记的表达盒插入到天然的GAA编码序列内。这就生成了单一的嵌合多肽。因为这种构型的肽标记可能不能与它的同源受体结合,因此可以正好在肽标记的下游位置中插入蛋白酶裂解位点。一旦产生了正确折叠形式的蛋白,通过蛋白酶处理就可以裂解C末端结构域。
采用一种正常存在于人血清中的蛋白酶所作用的蛋白裂解位点可能是有益的。这样,可以将药物前体形式的标记GAA引入到血流内,并通过血清固有的蛋白酶作用而成为可摄取的活化的GAA。这可能改善酶的分布。如前所述,肽标记可以是GILT标记或肌肉特异性标记。
在本发明的另一个实施方式中,标记与GAA的N末端融合,以便保留酶的活性(实施例3)。对于与N末端的融合,通过用异源性信号肽取代天然的GAA信号肽而影响酶分泌的水平是有可能的。
在ER内GAA信号肽不会裂解,因此这引起GAA在ER内是膜结合的(suji et al.(1987)Biochem.Int.15(5)945-952)。在一些细胞类型中,可以发现酶与细胞膜结合,保留了ER的膜拓扑学,这可能是因为不能裂解信号肽的结果(Hirschhorn et al.,in The Metabolic and Molecular Basis ofInherited Disease,Valle,ed.,2001,McGraw-HillNew York,pp.3389-3420)。序列分析说明了在信号肽的附近存在着跨膜结构域,这可能使得酶在某些条件下保持了与膜相连。
有可能的是,GAA经其信号肽的膜关联对于酶的正确的溶酶体的靶向作用是一种重要的作用因素。它可以作用于两个方面首先,膜关联可以直接地引导蛋白导向溶酶体。其次,膜关联可以增加GAA在高尔基体内的停留时间,因此增加了添加到蛋白上的甘露糖-6-磷酸的水平。这使得具有增加储存到溶酶体内的酶的比例的净效应。在任一情况中,如果消除了这种膜关联,那么更多的所产的酶可以被分泌,如果后一模型是正确的,那么所分泌的酶将具有更少的甘露糖-6-磷酸。
通过用GAA的另一种信号肽取代GAA信号肽和邻近序列可以实现对GAA的膜关联的中断。在GAA的GILT标记的背景中,嵌合基因含有包括它的在天然信号肽的裂解位点或在合适的下游位点上与GAA的N末端融合的信号肽的IGF-II标记。这样一种嵌合融合体将指导重组GAA酶的生成,该酶被高水平地分泌并含有M6P/IGF-II受体的高亲和配体。
亚细胞的导向结构域利用一种与蛋白的细胞受体特异性结合的蛋白或蛋白的类似物,本发明可将治疗药物导向溶酶体。细胞表面的外表面在拓扑学上等价于内含体的、溶酶体的、高尔基体的和内质网的隔室(compartment)。因此,分子经与合适受体的相互作用的细胞内吞作用可使得将分子不跨膜地转运到任一隔室内。如果遗传学缺陷造成了任一隔室内的特殊的酶活性的缺陷,通过用合适受体的配体标记治疗蛋白都可以实现治疗蛋白的转运。
已经描述了多个指导与受体结合的蛋白从细胞膜到高尔基体和/或内质网的途径。因此,通过利用来自例如SV40、霍乱毒素、或植物毒素蓖麻毒素的导向部分(每一种都对应于(coopt)一种或多种亚细胞的运输途径),可以将治疗药物导向细胞内的所需位置。在各种情况中,都通过物质与细胞外表面的结合触发摄取,例如,SV40与I型MHC受体结合、霍乱毒素与GM1神经节苷酯分子结合,以及蓖麻毒素与细胞表面上的具有末端半乳糖的糖脂和糖蛋白结合。在该初始步骤之后,分子通过各种途径到达ER。例如,SV40进行小泡样细胞内吞作用(caveolarendocytosis),并经两步过程绕过高尔基体到达ER,而霍乱毒素进行小泡样细胞内吞作用,但在到达ER之前经过高尔基体。
如果使用与霍乱毒素或蓖麻毒素相关的导向部分,那么避免霍乱毒素或蓖麻毒素的毒性是重要的。霍乱毒素和蓖麻毒素都是异聚体蛋白,并且细胞表面结合区和引起毒性的催化活性位于不同的多肽上。因此,可以构建包含受体结合多肽,但不包含引起毒性的多肽的导向部分。例如,对于蓖麻毒素,B亚基具有引起蛋白内摄作用的半乳糖结合活性,并且能与治疗蛋白融合。如果A亚基的存在进一步地提高了亚细胞定位,可以与B亚基-治疗药物融合蛋白一起提供正确折叠的但催化惰性的突变形式A链(突变蛋白)。
经KDEL受体可以将转运到高尔基体的蛋白转运到内质网(ER),这就回收了已经逃逸到高尔基体的ER导向蛋白。因此,在指导治疗蛋白进入高尔基体的导向结构域的末端包含KDEL基序,这使得蛋白随后定位于ER。例如,与阳离子非依赖性M6P受体结合的导向结构域(例如,经高通量筛选例如噬菌体展示、酵母双杂交、基于芯片的检测、以及基于溶液的检测所鉴定到的抗体、或肽)在pH 7.4或左右以及在pH 5.5或左右都使得治疗药物导向高尔基体,KDEL基序的进一步加入则使得导向ER。
溶酶体导向部分本发明能够将一种治疗药物导向溶酶体。例如,通过与随后穿过溶酶体的细胞膜受体的结合可以发生导向作用。或者,通过与随后进入晚期内含体的胞浆受体的结合可以发生导向作用;然后治疗药物可以从晚期内含体转移到溶酶体。一个优选的溶酶体导向机制涉及与阳离子非依赖性M6P受体的结合。
阳离子非依赖性M6P受体阳离子非依赖性M6P受体是一种在哺乳动物组织中到处表达的275kDa的单链跨膜糖蛋白。它是两种与M6P结合的哺乳动物受体之一第二种被称作阳离子依赖性M6P受体。阳离子依赖性M6P受体与M6P的结合需要二价阳离子;阳离子非依赖性M6P受体则不需要。这些受体通过识别溶酶体酶上的高甘露糖型M6P部分在运输溶酶体酶中起到了重要作用。阳离子非依赖性M6P受体的细胞外结构域含有15个与受体的分开位置上的不同(diverse)组配体结合的同源结构域(“重复”)。
阳离子非依赖性M6P受体含有两个M6P的结合位点一个位于重复1-3,另一个位于重复7-9。受体以μM级的解离常数与单价M6P配体结合,同时以nM级的解离常数与二价M6P配体结合,可能是因为受体寡聚化。通过伴发的多价M6P配体例如溶酶体酶与受体的结合增强了受体对IGF-II的摄取。
阳离子非依赖性M6P受体也含有至少三个可被用作为导向部分的不同配体的结合位点。阳离子非依赖性M6P受体在pH 7.4或其左右以约14nM的解离常数与IGF-II结合,主要是通过与重复11的相互作用。与其将IGF-II导向溶酶体的功能一致的是,解离常数在pH 5.5或其左右增加了近100倍,有助于IGF-II在酸性的晚期内含体内的裂解。受体能够结合高分子量的O-糖基化的IGF-II形式。
阳离子非依赖性M6P受体的另一种有用的配体是维甲酸。维甲酸以2.5nM的解离常数与受体结合。阳离子非依赖性M6P受体与维甲酸的光标记性(photolabeling)亲和不干扰IGF-11或M6P与受体的结合,说明维甲酸与受体上的不同位点结合。维甲酸与受体的结合改变了受体的细胞内分布(受体更多地蓄积在细胞质囊泡内),也增强了对M6P修饰的β葡糖醛酸酶的摄取。维甲酸具有光敏部分,该部分可以被用于连接于治疗药物,而不干扰治疗药物与阳离子非依赖性M6P受体结合的能力。
阳离子非依赖性M6P受体也以9μM的解离常数与尿激酶型纤溶酶原受体(uPAR)结合。uPAR是绝大多数细胞类型表面上的一种GPI锚定的受体,其中它作用为一种粘附分子,并在纤溶酶原和TGF-β的蛋白裂解激活中发挥作用。uPAR与CI-M6P受体的结合可以将其导向溶酶体,并调节其活性。因此,治疗药物与uPAR的细胞外结构域,或它的结合阳离子非依赖性M6P受体的组分的一部分的融合使得将药物导向溶酶体。
IGF-II在一个优选的实施方式中,溶酶体的导向部分是一种以甘露糖-6-磷酸非依赖性方式与阳离子非依赖性M6P/IGF-II受体结合的蛋白、肽、或其他部分。该实施方式模拟了用于摄取LSD蛋白的正常的生物学机制,以独立于甘露糖-6-磷酸的方式进行摄取。
例如,通过编码成熟IGF-II多肽的DNA与LSD基因表达盒的3’末端的融合,生成了可以被各种细胞类型所摄取并转移到溶酶体的融合蛋白。或者,编码前体IGF-II多肽的DNA可以与LSD基因表达盒的3’末端融合;前体包括在哺乳动物细胞内被裂解以生成成熟IGF-II多肽的羧基末端的部分,但是优选地删除了IGF-II信号肽(或移到了LSD基因表达盒的5’末端)。这个方法相对于包含糖基化的方法有着很多优点,包括简单性和效价比,因为一旦分离到蛋白,就不需要进行进一步的修饰。
IGF-II被优选地特异地导向M6P受体。特别有用的是IGF-II多肽内的造成蛋白以更高的亲和力与M6P受体结合、同时不再以可测的亲和力与其他两种受体结合的突变。IGF-II也被修饰以最小化地与血清IGF结合蛋白结合(Baxter(2000)Am.J.Physiol Endocrinol Metab.278(6)967-76),以避免IGF-II/GILT构建体的隔离。大量研究已经定位出了IGF-I和IGF-II结合IGF-结合蛋白所必需的残基。可以筛选具有这些残基的突变的构建体是否保留了与M6P/IGF-II受体的高亲和力的结合以及是否降低了与IGF-结合蛋白的亲和力。例如,报道了用Ser取代IGF-II的Phe26降低了IGF-II与IGFBP-1的亲和力,且对与M6P/IGF-II的结合没有作用(Bach et al.(1993)J.Biol.Chem.268(13)9246-54)。其他的取代(例如Ser取代Phe19以及Lys取代Glu9)也是有用的。IGF-I中的一个与IGF-II高度保守的区域内的类似突变单独地或联合地造成了IGF-BP结合力的大幅度降低(Magee et al.(1999)Biochemistry 38(48)15863-70)。
另一种方法是鉴定出能以高亲和力与M6P/IGF-II受体结合的IGF-II的最小区。已经被涉及于IGF-II与M6P/IGF-II受体结合的残基绝大多数都簇集在IGF-II的一个面上(Terasawa et al.(1994)EMBO J.13(23)5590-7)。尽管IGF-II四级结构是由三个分子内二硫键正常维持的,但是整合了IGF-II的M6P/IGF-II受体结合表面上的氨基酸序列的肽可以被设计成正常地折叠并具有结合活性。这样一种最小结合肽是高度优选的导向部分。可以测试根据第48-55位氨基酸周围的区域所设计出的肽与M6P/IGF-II受体的结合力。或者,可以通过酵母双杂交检测法或通过噬菌体展示类型检测法筛选肽随机文库与M6P/IGF-II受体结合的能力。
血脑屏障在溶酶体病贮积病的治疗中的一个挑战是这些疾病中的多种疾病都有显著的神经受累。施用到血流内的治疗酶一般都不能跨过血脑屏障,因此不能缓解疾病相关的神经症状。但是,已经报道了IGF-II可以经跨细胞作用促进转运而通过血脑屏障(Bickel et al.(2001)Adv.Drug Deliv.Rev.46(1-3)247-79)。因此,合理设计的GILT构建体应当能跨过血脑屏障,这第一次提供了一种治疗溶酶体贮积病相关的神经症状的方法。如在实施例12中所述的,可以用GUS阴性小鼠测试构建体。在2001年10月16日提交的美国Serial No.60/329,650和在2002年8月30日提交的美国Serial No.10/136,639中阐述了关于可以从血液中达到神经元组织的导向治疗药物的设计、构建和测试的其他细节。
IGF-II的结构两个小组已经解答了IGF-II的NMR结构(Terasawa et al.(1994)EMBO J.13(23)5590-7;Torres et al.(1995)J.Mol.Biol.248(2)385-401)(见例如蛋白数据库记录1IGL)。IGF-II结构的一般特征与IGF-I和胰岛素相似。IGF-II的A和B结构域对应于胰岛素的A和B链。二级结构的特征包括通过残基22-25的回折与残基26-28的短β链相连接的B结构域的残基11-21的α螺旋。残基25-27表现出形成了小的反向平行的β片;残基59-61和残基26-28可能也参与了分子间的β片的形成。在IGF-II的A结构域中,跨越残基42-49和53-59的α螺旋排列成一种与B结构域螺旋垂直的反向平行的构型。三个二硫键中的两个所形成的疏水残基以及保守的亲水残基稳定了这些二级结构特征。N和C末端仍被不肯定地确定为残基31-40之间的区域。
IGF-II以相当高的亲和力与IGF-II/M6P和IGF-I受体结合,并且以较低的亲和力与胰岛素受体结合。IGF-II也与大量的血清IGFBP相互作用。
与IGF-II/M6P受体的结合用来自胰岛素的相应残基(Thr Ser Ile)取代IGF-II的残基48-50(PheArg Ser),或用来自IGF-I的相应残基(Arg Arg)取代残基54-55(Ala Leu)都造成了与IGF-II/M6P受体的结合力的减低,但保留了与IGF-I和胰岛素受体的结合力(Sakano et al.(1991)J.Biol.Chem.266(31)20626-35)。
IGF-I和IGF-II在残基48-50的区域上具有相同性的序列和结构,但是在对IGF-II受体的亲和力上却有着1000倍的差异。NMR结构发现了在IGF-II残基53-58(IGF-I残基54-59)区域上的IGF-I和IGF-II之间的结构差异在IGF-II中比在IGF-I中更好地确定了α螺旋,以及和IGF-I不同的是,在残基53和54周围骨架没有发生转折(Torres et al.(1995)J.Mol.Biol.248(2)385-401)。这种结构差异与IGF-1中的Arg55和Arg56对IGF-II中的Ala54和Leu55的取代有关。通过这个区域内所具有的带电残基直接阻断了与IGF-II受体的结合,或通过带电残基所引起的结构变化使得与IGF-II受体的结合力发生变化都是有可能的。在任一情况中,不带电残基对IGF-I中的两个Arg残基的取代造成了更高的与IGF-II受体的亲和力(Cacciari et al.(1987)Pediatrician 14(3)146-53)。因此,带正电残基在这些位点上的存在和与IGF-II受体的结合的缺失相关。
IGF-II与阳离子非依赖性M6P受体的重复11结合。事实上,其中仅有重复11与阳离子非依赖性M6P受体的跨膜结构域域及细胞质区域相融合的微受体能结合IGF-II(亲和力近似为全长受体的亲和力的十分之一),并介导IGF-II的细胞内吞作用以及IGF向溶酶体的转运(Grimme etal.(2000)J.Biol.Chem.275(43)33697-33703)。M6P受体的11区的结构是已知的(Protein Data Base entries 1GPO and 1GP3;Brown et al.(2002)EMBO J.21(5)1054-1062)。推定的IGF-II结合位点是相信与IGF-II的疏水性氨基酸相互作用的疏水口袋;IGF-II的侯选氨基酸包括亮氨酸8、苯丙氨酸48、丙氨酸54、和亮氨酸55。尽管重复11足以结合IGF-II,包括阳离子非依赖性M6P受体的更大部分(例如重复10-13、或1-15)的构建体一般以更高的亲和力以及以增加了的pH依赖性结合IGF-II(见,例如Linnell et al.(2001)J.Biol.Chem.276(26)23986-23991)。
与IGF-I受体的结合用Leu对IGF-II残基Tyr27的取代、Val对Leu43或Phe对Ser26的取代分别都降低了IGF-II与IGF-I受体的亲和力94、56、和4倍(Torreset al.(1995)J.Mol.Biol.248(2)385-401)。人IGF-II的残基1-7的缺失造成了与人IGF-I受体的亲和力降低了30倍,同时造成了与大鼠IGF-II受体的亲和力增加了12倍(Hashimoto et al.(1995)J.Biol.Chem.270(30)18013-8)。IGF-II的NMR结构显示Thr7位于残基48Phe和50Ser附近以及9Cys-47Cys二硫键附近。Thr7与这些残基的相互作用被认为能稳定与IGF-I受体结合所需的可变形的N末端的六肽(Terasawa et al.(1994)EMBO J.13(23)5590-7)。同时,这种相互作用可以调控与IGF-II受体的结合力。IGF-II的C末端(残基62-67)的截短也使得IGF-II与IGF-I受体的亲和力降低了5倍(Roth et al.(1991)Biochem.Biophys.Res.Commun.181(2)907-14)。
IGF-II的缺失型突变体与IGF-I和阳离子非依赖性M6P受体的结合表面位于IGF-II的不同的面上。根据结构和突变的数据,可以构建出基本上比IGF-II更小的功能性的阳离子非依赖性M6P结合区。例如,可以缺失或取代氨基末端的氨基酸1-7和/或羧基末端的残基62-67。另外,有可能可以去除或取代氨基酸29-40,而不改变多肽的剩余部分的折叠或与阳离子非依赖性M6P受体的结合。因此,可以构建出包括第8-28和41-61位氨基酸的导向部分。氨基酸的这些链可以被直接地连接在一起或通过接头分开连接。或者,可以在分开的多肽链上提供第8-28和41-61位氨基酸。与IGF-II同源的以及具有与IGF-II的结构紧密相关的四级结构的胰岛素的可比结构域具有足够多的结构信息,以便使得其正确地再折叠成合适的四级结构,甚至当存在于分开的多肽链中(Wang et al.(1991)Trends Biochem.Sci.279-281)。因此,例如氨基酸8-28或它的保守的取代变体可以与治疗药物融合,所形成的融合蛋白可以与氨基酸41-61、或它的保守的取代变体混和,并施用给患者。
为了促进IGF-II标记的正确的呈递和折叠,可以使用IGF-II蛋白的更长的部分。例如,可以使用包括氨基酸残基1-67、1-87、或整个前体形式的IGF-II。
与IGF结合蛋白的结合IGF-II以及相关的构建体可以被修饰以降低它们与IGFBP的亲和力,据此增加导向蛋白的生物利用度。
以丝氨酸取代IGF-II的残基苯丙氨酸26使得IGF-II与IGFBP的结合力降低了5-75倍(Bach et al.(1993)J.Biol.Chem.268(13)9246-54)。苏氨酸-丝氨酸-异亮氨酸对IGF-II残基48-50的取代使得与大多数IGFBP的结合力降低了100倍以上(Bach et al.(1993)J.Biol.Chem.268(13)9246-54);但是,这些残基对于与阳离子非依赖性甘露糖-6-磷酸受体的结合也是重要的。阻断与IGF-I受体结合的Y27L取代干扰了与IGFBP3及酸敏感性亚基的三元复合物的形成(Hashimoto etal.(1997)J.Biol.Chem.272(44)27936-42);这个三元复合物代表了循环中的大多数IGF-II(Yu et al.(1999)J.Clin.Lab Anal.13(4)166-72)。IGF-II的前6个残基的缺失也干扰了IGFBP结合(Luthi et al.(1992)Eur.J.Biochem.205(2)483-90)。
对IGF-I与IGFBP的相互作用的研究还发现了丝氨酸对苯丙氨酸16的取代不影响二级结构,但使得IGFBP结合降低了约40和300倍之间(Magee et al.(1999)Biochemistry 38(48)15863-70)。谷氨酸9变为赖氨酸也造成了IGFBP结合的显著降低。此外,双重突变(赖氨酸9/丝氨酸16)表现出与IGFBP的最小亲和力。尽管先前在IGF-II中没有测试这些突变,但IGF-I和IGF-II的这个区域之间的序列的保守性提示将观察到相似的作用,当在IGF-II中生成类似的突变时(谷氨酸12赖氨酸/苯丙氨酸19丝氨酸)。
IGF-II同系物影响与阳离子非依赖性M6P受体结合的人IGF-II或其一部分的氨基酸序列可以被用作为确定侯选序列是否具有足够的氨基酸相似性使得能合理地期望在本发明的方法中的成功的参照序列。优选地,变体序列与人IGF-II具有至少70%相似性或60%相同性,更优选地具有至少75%相似性或65%相同性,以及最优选地具有80%相似性或70%相同性。
为了确定侯选肽区域是否具有所必需的与人IGF-II的相似性或相同性百分比,首先用在Smith和Waterman(1981)J.Mol.Biol.147195-197中所述的动态程序算法联合在Henikoff和Henikoff(1992)PNAS 8910915-10919的图2中所述的BLOSUM62取代矩阵对比侯选氨基酸序列和人IGF-II。对于本发明,缺口插入补偿的适当值是-12,以及缺口延伸补偿的适当值是-4。利用Smith-Waterman的算法和BLOSUM62矩阵进行对比的计算机程序例如GCG程序套装(Oxford Molecular Group,Oxford,England)是商品化可获得的,并被本领域人员广泛使用。
一旦进行了侯选序列和参照序列之间的对比,就可以计算出相似性百分比积分。根据它们彼此之间的相似性,次序地比较每个序列的单个氨基酸。如果对应于两个对比的氨基酸的BLOSUM62矩阵中的数值是0或负值,则配对相似性积分为0;否则,配对相似性积分为1.0。原始(raw)相似性积分是所对比的氨基酸的配对相似性积分的总和。然后通过用其除以侯选或参照序列中的较小序列的氨基酸数目可以将原始积分标准化。标准化的原始积分就是相似性百分比。或者,为了计算相同性百分比,再次次序地比较每个序列的所对比的氨基酸。如果氨基酸是非相同性的,配对相同性积分是0;否则配对相同性积分是1.0。原始相同性积分是相同性的所对比的氨基酸的总和。然后通过用其除以侯选或参照序列中的较小序列的氨基酸数目将原始积分标准化。标准化的原始积分是相同性百分比。为了计算相似性和相同性百分比的目的,忽略插入和缺失。因此,在这种计算中没有使用缺口补偿,不过,它们被用于最初的对比。
IGF-II结构类似物人IGF-II和阳离子非依赖性M6P受体的已知结构使得利用例如在美国专利Nos.6,226,603和6,273,598中所讨论的计算机辅助设计原理设计出IGF-II类似物和其他的阳离子非依赖性M6P受体结合蛋白。例如,可以给安装有传统的计算机模型设计程序(例如从Biosym,Technologies Inc.商品化获得的INSIGHTII、DISCOVER、或DELPHI,或从MolecularSimulations,Inc.商品化获得的QUANTA、或CHARMM)的计算机提供IGF-II的已知的原子坐标。这些以及其他的软件程序能够分析预测分子变化对结构和分子间相互作用的作用的分子结构和模拟。例如,可以用软件鉴定出具有形成附加的分子间氢键或离子键的能力的修饰类似物,提高类似物与靶受体的亲和力。
软件也使得设计出具有结构和化学特征的肽和有机分子,所述特征模拟在IGF-II的阳离子非依赖性M6P受体结合面的至少一部分表面上所展示的相同特征。因为对受体结合表面的主要贡献是在氨基酸的侧链内所具有的化学相互作用部分的空间排列,所述氨基酸一起确定了受体结合表面,因此,本发明的一个优选的实施方式涉及设计并生成一种具有带有化学相互作用部分的骨架的合成的有机分子,所述化学相互作用部分的空间关系模拟了在构成IGF-II的阳离子非依赖性M6P受体结合面的氨基酸侧链上所排列的化学部分的空间关系。优选的化学部分包括但不限定于由构成IGF-II的阳离子非依赖性M6P受体结合面的氨基酸的氨基酸侧链所确定的化学部分。因此,要明白IGF-II类似物的受体结合面不必包括在其上所排列的氨基酸残基,但要包括所排列的化学部分。
例如,在鉴定出相关的化学基团之后,熟练人员利用常规计算机程序可以设计出具有排列在合适的载体骨架上的受体相互作用的化学部分的小分子。在例如Dixon(1992)Tibtech 10357-363;Tschinke et al.(1993)J.Med.Chem 363863-3870;和Eisen el al.(1994)ProteinsStructure,Function,and Genetics 19199-221中描述了有用的计算机程序,在此通过引用将其阐述并入本申请。
用一个名为“CAVEAT”的特殊的计算机程序搜索数据库(例如剑桥结构数据库)中的具有所需化学部分的空间定位的结构(Bartlett et al.(1989)in″Molecular RecognitionChemical and Biological Problems″(Roberts,S.M.,ed)pp 182-196)。已经用CAVEAT程序根据所选的氨基酸侧链在tendamistat的三维结构中的定位(Bartlett et al.(1989)见上)设计出tendamistat的类似物(tendamistat是一种74个残基的α淀粉酶的抑制物)。
或者,在鉴定出一系列模拟IGF-II的阳离子非依赖性M6P受体结合活性的类似物之后,本领域熟练人员可以使用各种计算机程序,这些程序有助于本领域熟练人员开发定量结构活性关系(QSAR)以及还有助于原位设计另外的成形素(morphogen)类似物。例如在Connolly-Martin(1991)Methods in Enzymology 203587-613;Dixon(1992)见上;和Waszkowycz et al.(1994)J.Med.Chenm.373994-4002中描述了其他有用的计算机程序。
融合结点对于GAA被表达为一种具有肽标记或导向结构域的融合蛋白的情况,肽标记可以与GAA多肽直接融合,或者可以通过接头将肽标记与GAA多肽分开。氨基酸接头整合了不同于在天然蛋白的位点上所出现的氨基酸序列的氨基酸序列,并且通常被设计成为柔性的或在两个蛋白部分之间插入一个结构例如α螺旋。接头可以是相当短的,例如序列Gly-Ala-Pro或Gly-Gly-Gly-Gly-Gly-Pro,或者可以是更长的例如10-25个氨基酸长度。例如,已经描述了3-4个拷贝的序列(GGGGS)的柔性的重复接头以及2-5个拷贝的序列(EAAAK)的α螺旋的重复接头(Araiet al.(2004)ProteinsStructure,Function and Bioinformatics 57829-838)。也已经报道了另一种接头GGGGTVGDDDDK在IGF-II融合蛋白的背景中的应用(DiFalco et al.(1997)Biochem.J.326407-413)。整合了人血清蛋白的α螺旋部分的接头可以被用于最小化接头区域的免疫原性。
应当仔细地选择融合结点的位置,以促进两种融合配体的正确折叠和活性,并阻止肽标记与GAA多肽的过早分离。根据在图2中所图解说明的GAA蛋白的组成的模型,图3图解说明了四种用于生成GILT标记的GAA的示例策略。
1.在氨基末端融合标记。
2.在三叶形结构域和成熟区之间插入标记。
3.在成熟区和C末端结构域之间插入标记。
4.在截短GAA的C末端融合标记,并共表达C末端结构域。
例如,可以将导向结构域直接地或经间隔物与GAA的氨基酸70融合,氨基酸70是一个使得蛋白表达、GAA部分的催化活性、以及在实施例4中所述的导向结构域的正确导向作用的位点。或者,可以在分离GAA的C末端结构域与成熟多肽的裂解位点上或附近融合导向结构域。这使得合成具有内在导向结构域的GAA蛋白,根据裂解位点的布置,任选地可以裂解所述蛋白以使得可以从导向结构域中释放出成熟多肽或C末端结构域。或者,成熟多肽可以被合成为在大约位点791上的融合蛋白,而没有将C末端序列整合入表达构建体的开放读框中。
为了促进GILT标记的折叠,可以修饰与融合结点相邻近的GAA氨基酸残基。例如,因为GAA半胱氨酸残基干扰GILT标记的正确折叠是有可能的,所以可以删除或用丝氨酸取代GAA半胱氨酸952以调节C末端的GILT标记。也可以在终末的Cys952上即刻地融合GILT标记。倒数第二位的Cys938可以被改变为脯氨酸,结合终末的Cys952向丝氨酸的突变。
或者,标记可以与GAA多肽化学结合。
导向部分的亲和力优选的导向部分以亚微摩尔的解离常数与它们所导向的受体结合。一般而言,越是更低的解离常数(例如,小于10-7M,小于10-8M,或小于10-9M)越是优选的。用在Linnell et al.(2001)J.Biol.Chem.276(26)23986-23991中所述的表面等离子共振优选地进行解离常数的测定。生成导向受体的细胞外结构域的可溶形式(例如阳离子非依赖性M6P受体的重复1-15),并通过抗生物素蛋白-生物素的相互作用将其固定到芯片上。将导向部分流经过芯片,并通过测定与芯片表面相关的物质的变化检测并计算出动力学和平衡常数。
序列相似性的计算为了生成也可以作为催化结构域、伴侣分子区或亚细胞导向结构域的所述序列的变体,在此所述的任一种或多种天然发生的α-糖苷酶或亚细胞导向结构域例如IGF-II都可以作为确定侯选序列是否具有足够的氨基酸相似性使得能合理地期望在本发明的方法中的成功的参照序列。例如,催化结构域的变异序列与酸性α-糖苷酶的其中一种所述的天然存在的催化结构域具有至少50%相似性或30%相同性,优选地具有至少55%相似性或35%相同性,更优选地具有至少60%相似性或40%相同性,更优选地具有至少65%相似性或45%相同性,更优选地具有至少70%相似性或50%相同性,更优选地具有至少75%相似性或55%相同性,更优选地具有至少80%相似性或60%相同性,更优选地具有至少85%相似性或65%相同性,更优选地具有至少90%相似性或70%相同性,更优选地具有至少95%相似性或75%相同性,以及最优选地具有80%相同性、85%相同性、90%相同性、或95%相同性。伴侣分子区的变异序列与酸性α-糖苷酶的其中一种所述的天然存在的伴侣分子区具有至少40%相似性或20%相同性,优选地具有至少45%相似性或25%相同性,更优选地具有至少50%相似性或30%相同性,更优选地具有至少55%相似性或35%相同性,更优选地具有至少60%相似性或40%相同性,更优选地具有至少65%相似性或45%相同性,更优选地具有至少70%相似性或50%相同性,更优选地具有至少75%相似性或55%相同性,更优选地具有至少80%相似性或60%相同性,更优选地具有至少85%相似性或65%相同性,更优选地具有至少90%相似性或70%相同性,更优选地具有至少95%相似性或75%相同性,以及最优选地具有80%相同性、85%相同性、90%相同性、或95%相同性。导向结构域的变异序列与其中一种所述的天然存在的导向结构域具有至少70%相似性或60%相同性,更优选地具有至少75%相似性或65%相同性,更优选地具有至少80%相似性或70%相同性,更优选地具有至少85%相似性或75%相同性,更优选地具有至少90%相似性或80%相同性,更优选地具有至少95%相似性或85%相同性,以及最优选地具有90%相同性、或95%相同性。
为了确定侯选肽区域是否具有所必需的与参照多肽或肽寡聚体的相似性或相同性百分比,首先用在Smith and Waterman(1981)J.Mol.Biol.147195-197中所述的动态程序算法联合在Henikoff and Henikoff(1992),″Amino acid substitution matrices from protein blocks″,PNAS(1992Nov),8910915-10919的图2中所述的BLOSUM62取代矩阵对比侯选氨基酸序列和参照氨基酸序列。对于本发明,缺口插入补偿的适当值是-12,以及缺口延伸补偿的适当值是-4。利用Smith-Waterman的算法和BLOSUM62矩阵进行对比的计算机程序例如GCG程序套装(Oxford Molecular Group,Oxford,England)是商品化可获得的,并被本领域人员广泛使用。
一旦进行了侯选序列和参照序列之间的对比,就可以计算出相似性百分比积分。根据它们彼此之间的相似性,次序地比较每个序列的单个氨基酸。如果对应于两个对比的氨基酸的BLOSUM62矩阵中的数值是0或负值,配对相似性积分为0,否则配对相似性积分为1.0。原始相似性积分是所对比的氨基酸的配对相似性积分的总和。然后通过用其除以侯选或参照序列中的较小序列的氨基酸数目可以将原始积分标准化。标准化的原始积分是相似性百分比。或者,为了计算相同性百分比,再次次序地比较每个序列的所对比的氨基酸。如果氨基酸是非相同性的,配对相同性积分是0;否则配对相同性积分是1.0。原始相同性积分是相同性的所对比的氨基酸的总和。然后通过用其除以侯选或参照序列中的较小序列的氨基酸数目将原始积分标准化。标准化的原始积分是相同性百分比。为了计算相似性和相同性百分比的目的,忽略了插入和缺失。因此,在这种计算中没有使用缺口补偿,尽管它们被用于最初的对比。
施用通过任何途径都可以给哺乳动物宿主施用本发明所产的导向治疗药物。因此,合适的施用可以是口服或肠外包括静脉内和腹腔内途径的施用。另外,施用可以是周期性的弹丸式注射治疗药物或者可以是通过外在容器(例如静脉内用袋)的静脉内或腹腔内施用所进行的更为连续的施用。在某些实施方式中,本发明的治疗药物可以是药物级的。也就是说,某些实施方式符合了施用给人体所需的纯度和治疗控制的标准。兽医学上的应用也在在此所用的预期含义之内。
用于兽医及人体医学应用的本发明的治疗药物的剂型通常都包括这些与药用可接受载体和任选的其他组分相结合的治疗药物。载体可以是“可接受的”,意思是与剂型中的其他组分是兼容的并且对其受者无害。在这个方面,药用可接受载体预期包括任何的和所有的与药物施用相兼容的溶剂、分散剂、涂层、抗细菌剂和抗真菌剂、等张和吸收延迟剂等等。这些媒介和试剂用于药物活性组分的用途在本领域是已知的。除了任何与活性化合物不相兼容的常用媒介或试剂的范围之外,预期了常用媒介或试剂在组合物中的应用。补充的活性化合物(根据本发明或本领域已知的方法所鉴定出的)也可以被整合到组合物中。剂型可以被便利地呈递为剂量单位形式并被药物/微生物领域的任一公知的方法所制备。一般而言,通过将治疗药物与液体载体或精细分离的固体载体或两者进行结合制备出一些剂型,按需将产物成型为所需的剂型。
本发明的药物组合物可以被制剂成与其预期的施用途径相兼容。施用途径的实例包括口服或肠外例如静脉内、皮内、吸入、经皮(局部)、经粘膜、和直肠施用。用于肠外、皮内或皮下应用的溶液或悬浮液可以包括下面的组分无菌稀释剂例如注射用水、盐水、非挥发性油、聚乙二醇、甘油、丙二醇或其他合成溶剂;抗菌剂例如本甲醇或尼泊金甲酯;抗氧化剂例如抗坏血酸或亚硫酸氢钠;螯合剂例如依地酸钙钠;缓冲剂例如乙酸、柠檬酸或磷酸以及用于调整张力的试剂例如氯化钠或葡萄糖。可以用酸或碱例如盐酸或氢氧化钠调整pH值。
用在药物领域公知的任一方法(例如在Remington′s PharmaceuticalSciences,(Gennaro,A.,ed.),Mack Pub.,1990中所述的方法)可以制备用于口服或肠外施用的有用溶液。用于肠外施用的剂型也可以包括用于口腔施用的甘氨胆酸、用于直肠施用的甲氧水杨酸、或用于阴道施用的cutric acid。肠外制剂可以被封装在玻璃或塑料所制成的安瓿、一次性注射器或多剂量瓶内。通过混和药物和非刺激性赋形剂例如可可脂、其他甘油酯、或其他在室温下为固态以及在体温下为液态的组合物也可以制备出经直肠施用的栓剂。制剂也可以包括例如聚烯烃乙二醇例如聚乙二醇、植物来源的油、氢化的萘等等。用于直接施用的剂型可以包括甘油和高粘度的其他组合物。这些治疗药物的其他潜在有用的肠外载体包括乙烯-醋酸乙烯酯共聚物颗粒、渗透泵、可植入的输注系统、和脂质体。用于吸入施用的剂型可以含有例如作为赋形剂的乳糖,或者可以含有例如聚氧乙烯-9-十二烷基醚、甘氨胆酸和脱氧胆酸的水溶液,或者可以是用于以鼻滴液的形式施用的油性溶液,或者是用于鼻内施用的凝胶。保留灌肠剂也可以被用于直肠转运。
适用于口服施用的本发明的剂型可以是分离的单位形式例如胶囊、凝胶胶囊、囊剂、片剂、含片、或锭剂,每个单位都含有预定量的药物,剂型可以是粉末或颗粒形式;水性液体或非水性液体的溶液或悬浮液的形式;或水包油型乳剂或油包水型乳剂的形式。也可以以药丸、舔剂或糊剂的形式施用治疗药物。通过压缩或模制药物以及任选的一种或多种辅助成分都可以制备片剂。通过在合适机器中压缩不流动形式(例如粉末或颗粒)的药物可以制备压缩片剂,任选地与结合剂、润滑剂、惰性稀释剂、表面活性或分散剂混和。通过在合适的机器中模制粉末药物以及被惰性液体稀释剂所湿化的合适载体的混和物可以制备模制片剂。
口服组合物一般包括一种惰性稀释剂或一种可食用载体。对于口服治疗性施用的目的,活性化合物可以与赋形剂整合。利用用作漱口剂的液体所制备的口服组合物包括液体载体中的化合物,其被口服施用并嗖嗖地漱口和吐出或吞咽。药用兼容的结合剂和/或辅助材料可以被包含作为组合物的一部分。片剂、丸剂、胶囊、锭剂等等都可以含有任一下面的组分,或相似性能的化合物结合剂例如淀粉或乳糖、崩解剂例如藻朊酸、Primogel或玉米淀粉;润滑剂例如硬脂酸镁或Sterotes;助流剂例如二氧化硅胶体;甜味剂例如蔗糖或糖精;或调味剂例如薄荷、水杨酸甲酯、或橙调味剂。
适合于注射应用的药物组合物包括无菌水溶液(如果是水溶性的)或分散相以及用于临时制备无菌可注射溶液或分散相的无菌粉末。对于静脉内施用,合适的载体包括生理盐水、抑菌水、Cremophor ELTM(BASF,Parsippany,NJ)或磷酸缓冲盐水(PBS)。在所有情况中,组合物都是无菌的并且可以被液体化到具有容易可注射器化的程度。在生产和储存的条件下,它可以是稳定的,并可以被保存对抗微生物例如细菌和真菌的污染作用。载体可以是溶剂或含有例如水、乙醇、多元醇(例如甘油、丙二醇、和液态聚乙二醇等等)的分散媒介,以及它们的合适的混和物。例如,通过使用涂层例如卵磷脂、通过维持分散相中的所需的颗粒大小以及通过施用表面活性剂都可以维持适当的流动性。通过各种抗细菌剂和抗真菌剂例如尼泊金类、三氯叔丁醇、苯酚、抗坏血酸、柳硫汞等等都可以实现对微生物作用的预防。在多种情况中,组合物优选地包括等张剂例如糖、多元醇例如甘露糖醇、山梨糖醇和氯化钠。通过在组合物中包含延迟吸收的试剂例如单硬脂酸铝和凝胶可以引起可注射组合物的吸收延长。
通过将所需量的活性化合物掺合在按需具有一种上面所列举的组分或其组合物的合适溶剂中,以及随后的过滤灭菌可以制备出无菌的可注射溶液。一般而言,通过将活性化合物掺合到含有基本的分散媒介以及所需的来自上面所列举的那些组分的其他组分的无菌载体中可以制备出分散相。对于用于制备无菌可注射溶液的无菌粉末,制备的方法包括真空干燥和冷冻干燥,这使得可以从先前经无菌过滤的溶液中生成了活性组分加上任何附加的所需组分的粉末。
合适于关节内施用的剂型可以是治疗药物的无菌的水性制剂的形式,所述药物可以是微晶体的形式,例如水性微晶体悬浮液的形式。脂质体剂型或生物可降解多聚体系统可以被用于呈递用于关节内和眼部施用的治疗药物。
适合于局部施用(包括眼部治疗)的剂型包含液态或半液态制剂例如搽剂、洗剂、凝胶剂、敷剂(applicants)、水包油或油包水型乳剂例如乳膏、软膏或糊剂;或溶液或悬浮液例如滴剂。通过用可皮肤用载体例如洗剂、乳膏、软膏或皂剂分散治疗药物可以制备用于给皮肤表面局部施用的剂型。在一些实施方式中,有用的载体是能在皮肤上形成薄膜或薄层以便固定药物并抑制清除的载体。对于需要与组织表面粘附时,组合物可以包含分散在纤溶酶原-凝血酶组合物或其他生物粘附剂中的治疗药物。然后可以将治疗药物涂到、喷到或以其他的方法施用到所需的组织表面上。对于内在组织表面的局部施用,试剂可以被分散在液体组织粘附剂或其他的已知的增强组织表面吸附的物质中。例如,优先地施用羟丙纤维素或纤溶酶原/凝血酶溶液。或者,可以使用组织涂层溶液例如含果胶的剂型。
对于例如哮喘的吸入治疗,可以使用吸入经喷雾罐、喷雾器、或雾化器所调配的粉末(自我推进或喷雾的剂型)。这些剂型可以是来自粉末吸入设备的用于肺部施用的精细粉碎的粉末形式或自我推进的粉末调配的剂型。对于自我推进的溶液和喷雾剂型,通过选择具有所需喷雾特征的阀门(即能产生具有所需颗粒大小的喷雾)或通过将活性组分整合为可控颗粒大小的悬浮粉末都可以实现这种效果。对于经吸入施用,也可以以来自含合适推进剂(例如气体如二氧化碳)的加压容器或分散器或喷雾器的喷雾剂的形式转运治疗药物。也可以使用鼻滴剂。
全身施用也可以是经粘膜或经皮的方法。对于经粘膜或经皮的施用,在剂型中使用了适合于所穿透屏障的穿透剂。这些穿透剂在本领域一般都是已知的,以及对于经粘膜施用,例如包括去污剂、胆盐、和filsidic酸衍生物。通过使用鼻喷雾剂或栓剂都可以实现经粘膜施用。对于经皮施用,如在本领域普遍所知的那样,治疗药物通常被制剂成软膏、药膏、凝胶或乳剂。
在一个实施方式中,用将保护性对抗治疗药物从体内被快速清除的载体(例如控释剂型,包括植入物和微胶囊的转运系统)制备治疗药物。可以施用生物可降解的、生物兼容的多聚体例如乙撑乙酸乙烯酯、聚酐、聚乙醇酸、胶原、多正酯类、和聚乳酸。用于制备这些剂型的方法对于本领域熟练人员将是显而易见的。也可以从Alza Corporation和NovaPharmaceuticals,Inc.中商品化地得到材料。脂质体悬浮液也能被用作为药用可接受载体。根据本领域那些熟练人员所已知的方法可以制备这些载体,例如在美国专利No.4,522,811中所述的方法。也可以施用微粒体和微颗粒。
为了施用便利和剂量的统一性,口服或肠外组合物可以被制剂成剂量单位形式。剂量单位形式指的是适合作为治疗对象的单一剂量的物理上不同的单位;每个单位都含有能计算出生成所需治疗作用的预定量的活性化合物以及所需的药物载体。本发明的剂量单位形式的规范是由活性化合物的独特特征和所实现的特殊治疗作用、以及组合这样一种用于个体治疗的活性化合物的领域中所固有的局限性所决定的,并且直接依赖于这些因素。
一般而言,本发明所鉴定出的治疗药物可以被制剂成用于给人或其他哺乳动物肠外或口服施用例如治疗有效剂量,即给靶组织提供适当浓度的药物一段足以诱导所需作用的时间。另外,可以单独或联合其他已知对特殊疾病或相关适应症具有有益作用的分子可以施用本发明的治疗药物。仅仅作为实例的方式,有用的辅助因子包括缓解症状的辅助因子,包括防腐剂、抗生素、抗病毒剂和抗真菌剂和镇痛剂和麻醉剂。
在治疗组合物中被转运的本发明所鉴定的治疗药物的有效浓度有所不同,这依赖于多种因素,包括所施用药物的最终所需的剂量和施用途径。优选的所施用的剂量也可能依赖于这些变量如所治疗的疾病或适应症的类型和程度、特殊患者的总体健康状态、所转运的治疗药物的相对生物学疗效、治疗药物的剂型、赋形剂在剂型中的存在和类型、以及施用途径。在一些实施方式中,利用从较早描述的利用非人的灵长类和啮齿类哺乳动物研究中推导出的经典的剂量单位,可以给个体提供本发明的治疗药物。如上所述的,剂量单位指的是单一剂量,即能施用给患者的单一剂量,其能被便利地操作并包装,仍是包括治疗药物以及治疗药物和固体或液体药物稀释剂或载体的混和物的物理和生物稳定的单位剂量。
在某些实施方式中,遗传工程化生物体以生成本发明所鉴定的治疗药物。这些生物体可以释放用于收集或能被直接引入到患者体内的治疗药物。在另一系列的实施方式中,细胞可以被用作本发明所鉴定的治疗药物的载体。
本发明的治疗药物也包括“前体药物”衍生物。术语前体药物指的是需要在生物体内的生物转化(或自发的或酶的生物转化)以释放或活化活性组分的亲代分子的无药物活性的(或部分物活性的)衍生物。前体药物是本发明的治疗药物的变体或衍生物,它们具有在代谢条件下可被裂解的基团。当前体药物在生理条件下进行溶剂裂解或进行酶降解时,前体药物变成在体内具有药用活性的本发明的治疗药物。本发明的前体药物可以被称作单个、双重、三重前体药物等等,依赖于在生物体内释放或活化活性药物所需的生物转化步骤的数目,并说明了在前体类型形式中所具有的功能性基团的数目。前体药物形式常常提供了溶解性、组织相容性、或在哺乳动物生物体内延迟释放的优点(见,Bundgard,Designof Prodrugs,pp.7-9,21-24,Elsevier,Amsterdam 1985and Silverman,TheOrganic Chemistry of Drug Design and Drug Action,pp.352-401,AcademicPress,San Diego,Calif.,1992)。此外,本发明的前体药物衍生物可以组合有其他增强生物利用度的特点。
实施例实施例1GAA的反式表达用下面的引物生成含有与人GAA残基791-952(C末端结构域)融合的人IGF-II序列的基因表达盒。
GAA41GGAATTCAGGCGCGCCGGCAGCTCCCCGTGAGCCAGCC(SEQ ID NO_)GAA27GCTCTAGACTAACACCAGCTGACGAGAAACTGC(SEQ ID NO_)用GAA41和GAA27经PCR扩增GAA的C末端结构域。所扩增的片段在5’末端上含有AscI位点。然后将在3’末端具有AscI位点的编码IGF-II信号序列(残基1-25)的SS N-标记在AscI位点上与GAA的C末端结构域融合,并将表达盒克隆到pCEP4中,以生成质粒pCEP-SS-GAA-791-952。如下显示了SS N-标记的核酸序列。
SS N-标记的DNA序列gaattcACACCAATGGGAATCCCAATGGQGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTggcgcgccg相似地生成了下面的附加质粒缺乏C末端的GAA残基817-952的pCEP-GAAΔ817-952以及与pCEP-GAAΔ817-952相似但添加了C末端的GILTΔ1-7标记的pCEP-GAAΔ817-952-GILTΔ1-7。通过在氨基酸残基816之后引入终止密码子生成了GAAΔ817-952。为了有助于克隆过程,在终止密码子之后的是3’末端的XbaI限制性酶切位点,并且在5’端含有EcoRI限制性酶切位点。下面显示了GAAΔ817-952的氨基酸序列。
GAAΔ817-952的DNA序列gaattcCAAACCATGGGAGTGAGGCACCCGCCCTGCTCCCACCGGCTCCTGGCCGTCTGCGCCCTCGTGTCCTTGGCAACCGCTGCACTCCTGGGGCACATCCTACTCCATGATTTCCTGCTGGTTCCCCGAGAGCTGAGTGGCTCCTCCCCAGTCCTGGAGGAGACTCACCCAGCTCACCAGCAGGGAGCCAGCAGACCAGGGCCCCGGGATGCCCAGGCACACCCCGGCCGTCCCAGAGCAGTGCCCACACAGTGCGACGTCCCCCCCAACAGCCGCTTCGATTGCGCCCCTGACAAGGCCATCACCCAGGAACAGTGCGAGGCCCGCGGCTGCTGCTACATCCCTGCAAAGCAGGGGCTGCAGGGAGCCCAGATGGGGCAGCCCTGGTGCTTCTTCCCACCCAGCTACCCCAGCTACAAGCTGGAGAACCTGAGCTCCTCTGAAATGGGCTACACGGCCACCCTGACCCGTACCACCCCCACCTTCTTCCCCAAGGACATCCTGACCCTGCGGCTGGACGTGATGATGGAGACTGAGAACCGCCTCCACTTCACGATCAAAGATCCAGCTAACAGGCGCTACGAGGTGCCCTTGGAGACCCCGCGTGTCCACAGCCGGGCACCGTCCCCACTCTACAGCGTGGAGTTCTCtGAGGAGCCCTTCGGGGTGATCGTGCACCGGCAGCTGGACGGCCGCGTGCTGCTGAACACGACGGTGGCGCCCCTGTTCTTTGCGGACCAGTTCCTTCAGCTGTCCACCTCGCTGCCCTCGCAGTATATCACAGGCCTCGCCGAGCACCTCAGTCCCCTGATGCTCAGCACCAGCTGGACCAGGATCACCCTGTGGAACCGGGACCTTGCGCCCACGCCCGGTGCGAACCTCTACGGGTCTCACCCTTTCTACCTGGCGCTGGAGGACGGCGGGTCGGCACACGGGGTGTTCCTGCTAAACAGCAATGCCATGGATGTGGTCCTGCAGCCGAGCCCTGCCCTTAGCTGGAGGTCGACAGGTGG
GATCCTGGATGTCTACATCTTCCTGGGCCCAGAGCCCAAGAGCGTGGTGCAGCAGTACCTGGACGTTGTGGGATACCCGTTCATGCCGCCATACTGGGGCCTGGGCTTCCACCTGTGCCGCTGGGGCTACTCCTCCACCGCTATCACCCGCCAGGTGGTGGAGAACATGACCAGGGCCCACTTCCCCCTGGACGTCCAATGGAACGACCTGGACTACATGGACTCCCGGAGGGACTTCACGTTCAACAAGGATGGCTTCCGGGACTTCCCGGCCATGGTGCAGGAGCTGCACCAGGGCGGCCGGCGCTACATGATGATCGTGGATCCTGCCATCAGCAGCTCGGGCCCTGCCGGGAGCTACAGGCCCTACGACGAGGGTCTGCGGAGGGGGGTTTTCATCACCAACGAGACCGGCCAGCCGCTGATTGGGAAGGTATGGCCCGGGTCCACTGCCTTCCCCGACTTCACCAACCCCACAGCCCTGGCCTGGTGGGAGGACATGGTGGCTGAGTTCCATGACCAGGTGCCCTTCGACGGCATGTGGATTGACATGAACGAGCCTTCCAACTTCATCAGGGGCTCTGAGGACGGCTGCCCCAACAATGAGCTGGAGAACCCACCCTACGTGCCTGGGGTGGTTGGGGGGACCCTCCAGGCGGCAACCATCTGTGCCTCCAGCCACCAGTTTCTCTCCACACACTACAACCTGCACAACCTCTACGGCCTGACCGAAGCCATCGCCTCCCACAGGGCGCTGGTGAAGGCTCGGGGGACACGCCCATTTGTGATCTCCCGCTCGACCTTTGCTGGCCACGGCCGATACGCCGGCCACTGGACGGGGGACGTGTGGAGCTCCTGGGAGCAGCTCGCCTCCTCCGTGCCAGAAATCCTGCAGTTTAACCTGCTGGGGGTGCCTCTGGTCGGGGCCGACGTCTGCGGCTTCCTGGGCAACACCTCAGAGGAGCTGTGTGTGCGCTGGACCCAGCTGGGGGCCTTCTACCCCTTCATGCGGAACCACAACAGCCTGCTCAGTCTGCCCCAGGAGCCGTACAGCTTCAGCGAGCCGGCCCAGCAGGCCATGAGGAAGGCCCTCACCCTGCGCTACGCACTCCTCCCCCACCTCTACACGCTGTTCCACCAGGCCCACGTCGCGGGGGAGACCGTGGCCCGGCCCCTCTTCCTGGAGTTCCCCAAGGACTCTAGCACCTGGACTGTGGACCACCAGCTCCTGTGGGGGGAGGCCCTGCTCATCACCCCAGTGCTCCAGGCCGGGAAGGCCGAAGTGACTGGCTACTTCCCCTTGGGCACATGGTACGACCTGCAGACGGTGCCAATAGAGGCCCTTGGCAGCCTCCCACCCCCACCTGCAGCTCCCCGTGAGCCAGCCATCCACAGCGAGGGGCAGTGGGTGACGCTGCCGGCCCCCCTGGACACCATCAACGTCTAGtctagaGAAΔ817-952的氨基酸序列MGVRHPPCSHRLLAVCALVSLATAALLGHILLHDFLLVPRELSGSSPVLEETHPAHQQGASRPGPRDAQAHPGRPRAVPTQCDVPPNSRFDCAPDKAITQEQCEARGCCYIPAKQGLQGAQMGQPWCFFPPSYPSYKLENLSSSEMGYTATLTRTTPTFFPKDILTLRLDVMMETENRLHFTIKDPANRRYEVPLETPRVHSRAPSPLYSVEFSEEPFGVIVHRQLDGRVLLNTTVAPLFFADQFLQLSTSLPSQYITGLAEHLSPLMLSTSWTRITLWNRDLAPTPGANLYGSHPF
YLALEDGGSAHGVFLLNSNAMDVVLQPSPALSWRSTGGILDVYIFLGPEPKSVVQQYLDVVGYPFMPPYWGLGFHLCRWGYSSTAITRQVVENMTRAHFPLDVQWNDLDYMDSRRDFTFNKDGFRDFPAMVQELHQGGRRYMMIVDPAISSSGPAGSYRPYDEGLRRGVFITNETGQPLIGKVWPGSTAFPDFTNPTALAWWEDMVAEFHDQVPFDGMWIDMNEPSNFIRGSEDGCPNNELENPPYVPGVVGGTLQAATICASSHQFLSTHYNLHNLYGLTEAIASHRALVKARGTRPFVISRSTFAGHGRYAGHWTGDVWSSWEQLASSVPEILQFNLLGVPLVGADVCGFLGNTSEELCVRWTQLGAFYPFMRNHNSLLSLPQEPYSFSEPAQQAMRKALTLRYALLPHLYTLFHQAHVAGETVARPLFLEFPKDSSTWTVDHQLLWGEALLITPVLQAGKAEVTGYFPLGTWYDLQTVPIEALGSLPPPPAAPREPAIHSEGQWVTLPAPLDTINV.
为了确定当反式表达时,GAA的C末端结构域是否发挥了功能,单独地或联合质粒pCEP-GAAΔ817-952或pCEP-GAAΔ817-952-GILTΔ1-7将pCEP-SS-GAA-791-952转染到HEK293细胞内。作为对照,pCEP-GAAΔ817-952和pCEP-GAAΔ817-952-GILTΔ1-7也被单独地转染到HEK293细胞内。在试验中使用了标准的转染方法。对于单个质粒的转染,使用1μg质粒DNA。对于共转染,使用了0.5μg每种质粒。如产家所指导的,将1μg总DNA与96μl无血清的HEK293生长培养基以及4μl FuGene6(Roche)混和。往生长在12孔板内的HEK293细胞的每个复孔内都加入50μl混和物,每孔都含有1ml加有1.5g/L碳酸钠、10%热灭活FBS、和4mM L-谷氨酰胺的Dulbecco修饰Eagles培养基。细胞在37℃、5%下孵育2-3天。
收集生长培养基,并如所述的(Reuser,A.J.et al.(1978)Am.J.Hum.Genet.30132-143)对生长培养基进行检测以确定出GAA活性。在从经单一质粒所转染的HEK293细胞中所收集到的培养基中没有检测到GAA活性。相反地,在经pCEP-SS-GAA-791-952和pCEP-GAAΔ817-952或pCEP-GAAΔ817-952-GILTΔ1-7共转染的HEK293细胞中收集到的生长培养基中具有GAA活性(表1)。
因此,仅仅当与C末端结构域质粒pCEP-SS-GAA-791-952共表达时,两种C末端缺失型构建体pCEP-GAAΔ817-952和pCEP-GAAΔ817-952-GILTΔ1-7才表达功能性蛋白。这个试验证实当反式共表达时,C末端的GAA区与成熟的、N末端结构域整合。
表1GAA C末端结构域和N末端结构域的瞬时共表达

实施例2有效的GAA反式表达所需的区域在实施例1中所述的瞬时共转染试验中,反式表达构建体的两半都具有包含氨基酸残基792-817的GAA区域。为了确定这个区域的重叠对于有效的反式表达是否是必需的,设计了一对构建体pCEP-GAAΔ791-952-GILTΔ1-7和pCEP-SS-GAA-791-952,它们之间没有重叠并且GILT标记融合在791位点上。如表2所示的,瞬时共转染试验证实了有效的GAA反式表达需要C末端结构域内的氨基酸残基792-817的存在。
表2有效的GAA反式表达需要氨基酸残基792-817

实施例3具有内在GLIT标记的GAA蛋白的构建首先用PCR生成在完整人GAA序列(SEQ ID NO)的2370位核苷酸后的核苷酸序列GGCGCGCCG(SEQ ID NO)的插入。这个插入生成了Ala791前的AscI限制性酶切位点。用下面的DNA寡聚体PCR扩增GILT标记IGF7gctctagaggcgcgccCTCGGACTTGGCGGGGGTAGC(SEQ ID NO)IGF8ggaattcaggcgcgccgGCTTACCGCCCCAGTGAGAC(SEQ ID NO)所扩增的GILT标记在每个末端都含有一个AscI限制性酶切位点。用AscI消化该GILT标记,并如上所述将其插入到GAA的Ala791前的AscI位点内。DNA测序确定了GILT插入的骨架内的定位。在载体pCEP4中表达这个在Ala791前含有内在GLIT标记的GAA表达盒,称之为质粒pCEP-GAA-IRGILT-4。发现pCEP-GAA-IRGILT-4在GAA编码序列内含有PCR生成的突变T712C。这个构建体产生了功能性GAA蛋白。
实施例4具有N末端GILT标记的GAA缺失型构建体利用在表3中所示的引物用PCR扩增生成了一组适合于N末端的GAA表达的5种标记(N-标记)。GILT N-标记含有天然的IGF-II信号序列以及完整的GILT表位。SS N-标记只含有IGF-II信号序列。
例如,GILTΔ1-7N-标记含有IGF-II信号序列以及GILT表位残基8-67。用三个PCR反应生成该标记(1)利用引物IGF1和IGF4PCR扩增人IGF-II DNA模板;(2)利用引物IGF2和IGF7PCR扩增人IGF-II DNA模板;和(3)利用引物IGF1和IGF7PCR扩增前两个PCR反应的产物。
GILTΔ2-7N-标记含有IGF-II信号序列以及GILT表位残基1和随后的残基8-67。用三个PCR反应生成该标记(1)利用引物IGF1和IGF5PCR扩增人IGF-II DNA模板;(2)利用引物IGF3和IGF7PCR扩增人IGF-II DNA模板;和(3)利用引物IGF1和IGF7PCR扩增前两个PCR反应的产物。
SS GAA-GILT N-标记含有残基1-69内的信号序列和随后的完整的GILT表位。用三个PCR反应生成该标记(1)利用引物GAA13和GI1PCR扩增人IGF-II模板;(2)利用引物GI2和IGF7PCR扩增人IGF-II模板;和(3)利用引物GAA13和IGF7PCR扩增前两个PCR反应的产物。
每个N-标记都含有5’EcoRI限制性酶切位点以及3’AscI和XbaI位点。AscI位点被用于融合每个标记与下面所述的GAA N末端的缺失构建体。
表3N末端的标记构建体

删除人GAA DNA序列的N末端部分,并利用PCR技术用AscI限制性酶切位点将其取代。下面罗列了用于确定删除位点的5’DNA寡聚体(表4)。5’寡聚体与GAA编码序列内的不同的3’寡聚体配对,所形成的DNA片段随后与完整C末端的GAA编码序列融合。N末端的AscI位点与上面所列的5种N末端标记(N-标记)之一的标记融合,以完成表达盒(表4)。
表4GAA N末端缺失构建体大写字母表示与GAA编码序列互补的序列。小写字母表示EcoRI和AscI限制性酶切位点。

表4中所列的表达盒都含有在共同的AscI位点上与缺失N末端的GAA融合的N末端标记(N-标记)。将表达盒克隆到表达载体pCEP4的多个克隆位点内,并用FuGene6转染试剂(Roche)将其转染到HEK293细胞内。在转染后2-3天收集瞬时转染的培养基,并用标准的酶检测法检测所分泌的GAA活性(Reuser,A.J.,et al.(1978)Am.J.Hum.Genet.30132-143)。
表5N标记的GAA构建体的相对瞬时表达


如这些数据所示的那样,包括1-80的GAA的N末端部分对于瞬时表达并非必需,但是中断或去除三叶形结构域的缺失则不能生成功能性蛋白。
此外,如表6所示,对于IGF-11信号肽,通过合适地定位异源信号肽可以提高GAA的分泌。将IGF-II信号肽定位于GAA的残基56或70使得GAA的分泌比天然GAA的分泌增加了3倍,而将IGF-II信号肽定位于位点29却没有增加分泌。这可能是因为推定的邻近于GAA信号肽的跨膜结构域的保留。
表6改变GAA信号肽位置影响了GAA分泌。

但是,用异源性信号肽对天然的GAA信号肽和跨膜结构域的取代降低了与蛋白相关的甘露糖-6-磷酸依赖性的细胞摄取的水平(图4)。在美国专利申请Nos.20040005309和20040006008中描述了摄取试验,在此通过引用将其内容并入本申请。如图4所示,Pompe成纤维细胞所摄取的pCEP-SS-GAAΔ1-69量是野生型pCEP-GAA量的1/3。
相反地,如图5所示,通过比较对pCEP-SS-GAAΔ1-69和对具有GILT标记的构建体pCEP-SS-GILTΔ2-7-GAAΔ1-69的摄取的比较,显而易见的是GILT标记促进了IGF-II所竞争的特异性摄取。因此,肽标记在位点70上的取代不仅使得有效地表达融合蛋白和GAA活性,还提供了被正确折叠并可接近的肽标记,使得被受体介导地摄取到靶细胞内。
实施例5具有GILT1-87标记及变体的构建体为了增加N末端的GLIT标记的正确折叠的可能性,生成了跨越IGF残基1-87的更长形式的GILT标记。附加的IGF-II序列仍应当能够结合受体,并且也为标记核心提供了更为天然的折叠环境。GILT1-87标记与GAA的位点56及70融合,分别形成了GILT1-87-GAA56-952和GILT1-87-GAA70-952。下面显示了GILT1-87-GAA56-952的DNA和氨基酸序列。
GILT1-87-GAA56-952的DNA序列ggtaccACACCAATGGGAATCCCAATGGGGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGAGAGGGACGTGTCGACCCCTCCGACCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCggcgcgccgCACCAGCAGGGAGCCAGCAGACCAGGGCCCCGGGATGCCCAGGCACACCCCGGCCGTCCCAGAGCAGTGCCCACACAGTGCGACGTCCCCCCCAACAGCCGCTTCGATTGCGCCCCTGACAAGGCCATCACCCAGGAACAGTGCGAGGCCCGCGGCTGCTGCTACATCCCTGCAAAGCAGGGGCTGCAGGGAGCCCAGATGGGGCAGCCCTGGTGCTTCTTCCCACCCAGCTACCCCAGCTACAAGCTGGAGAACCTGAGCTCCTCTGAAATGGGCTACACGGCCACCCTGACCCGTACCACCCCCACCTTCTTCCCCAAGGACATCCTGACCCTGCGGCTGGACGTGATGATGGAGACTGAGAACCGCCTCCACTTCACGATCAAAGATCCAGCTAACAGGCGCTACGAGGTGCCCTTGGAGACCCCGCGTGTCCACAGCCGGGCACCGTCCCCACTCTACAGCGTGGAGTTCTCtGAGGAGCCCTTCGGGGTGATCGTGCACCGGCAGCTGGACGGCCGCGTGCTGCTGAACACGACGGTGGCGCCCCTGTTCTTTGCGGACCAGTTCCTTCAGCTGTCCACCTCGCTGCCCTCGCAGTATATCAC
AGGCCTCGCCGAGCACCTCAGTCCCCTGATGCTCAGCACCAGCTGGACCAGGATCACCCTGTGGAACCGGGACCTTGCGCCCACGCCCGGTGCGAACCTCTACGGGTCTCACCCTTTCTACCTGGCGCTGGAGGACGGCGGGTCGGCACACGGGGTGTTCCTGCTAAACAGCAATGCCATGGATGTGGTCCTGCAGCCGAGCCCTGCCCTTAGCTGGAGGTCGACAGGTGGGATCCTGGATGTCTACATCTTCCTGGGCCCAGAGCCCAAGAGCGTGGTGCAGCAGTACCTGGACGTTGTGGGATACCCGTTCATGCCGCCATACTGGGGCCTGGGCTTCCACCTGTGCCGCTGGGGCTACTCCTCCACCGCTATCACCCGCCAGGTGGTGGAGAACATGACCAGGGCCCACTTCCCCCTGGACGTCCAATGGAACGACCTGGACTACATGGACTCCCGGAGGGACTTCACGTTCAACAAGGATGGCTTCCGGGACTTCCCGGCCATGGTGCAGGAGCTGCACCAGGGCGGCCGGCGCTACATGATGATCGTGGATCCTGCCATCAGCAGCTCGGGCCCTGCCGGGAGCTACAGGCCCTACGACGAGGGTCTGCGGAGGGGGGTTTTCATCACCAACGAGACCGGCCAGCCGCTGATTGGGAAGGTATGGCCCGGGTCCACTGCCTTCCCCGACTTCACCAACCCCACAGCCCTGGCCTGGTGGGAGGACATGGTGGCTGAGTTCCATGACCAGGTGCCCTTCGACGGCATGTGGATTGACATGAACGAGCCTTCCAACTTCATCAGGGGCTCTGAGGACGGCTGCCCCAACAATGAGCTGGAGAACCCACCCTACGTGCCTGGGGTGGTTGGGGGGACCCTCCAGGCGGCAACCATCTGTGCCTCCAGCCACCAGTTTCTCTCCACACACTACAACCTGCACAACCTCTACGGCCTGACCGAAGCCATCGCCTCCCACAGGGCGCTGGTGAAGGCTCGGGGGACACGCCCATTTGTGATCTCCCGCTCGACCTTTGCTGGCCACGGCCGATACGCCGGCCACTGGACGGGGGACGTGTGGAGCTCCTGGGAGCAGCTCGCCTCCTCCGTGCCAGAAATCCTGCAGTTTAACCTGCTGGGGGTGCCTCTGGTCGGGGCCGACGTCTGCGGCTTCCTGGGCAACACCTCAGAGGAGCTGTGTGTGCGCTGGACCCAGCTGGGGGCCTTCTACCCCTTCATGCGGAACCACAACAGCCTGCTCAGTCTGCCCCAGGAGCCGTACAGCTTCAGCGAGCCGGCCCAGCAGGCCATGAGGAAGGCCCTCACCCTGCGCTACGCACTCCTCCCCCACCTCTACACGCTGTTCCACCAGGCCCACGTCGCGGGGGAGACCGTGGCCCGGCCCCTCTTCCTGGAGTTCCCCAAGGACTCTAGCACCTGGACTGTGGACCACCAGCTCCTGTGGGGGGAGGCCCTGCTCATCACCCCAGTGCTCCAGGCCGGGAAGGCCGAAGTGACTGGCTACTTCCCCTTGGGCACATGGTACGACCTGCAGACGGTGCCAATAGAGGCCCTTGGCAGCCTCCCACCCCCACCTGCAGCTCCCCGTGAGCCAGCCATCCACAGCGAGGGGCAGTGGGTGACGCTGCCGGCCCCCCTGGACACCATCAACGTCCACCTCCGGGCTGGGTACATCATCCCCCTGCAGGGCCCTGGCCTCACAACCACAGAGTCCCGCCAGCAGCCCATGGCCCTGGCTGTGGCCCTGACCAAGGGTGGAGAGGCCCGAGGGGAGCT
GTTCTGGGACGATGGAGAGAGCCTGGAAGTGCTGGAGCGAGGGGCCTACACACAGGTCATCTTCCTGGCCAGGAATAACACGATCGTGAATGAGCTGGTACGTGTGACCAGTGAGGGAGCTGGCCTGCAGCTGCAGAAGGTGACTGTCCTGGGCGTGGCCACGGCGCCCCAGCAGGTCCTCTCCAACGGTGTCCCTGTCTCCAACTTCACCTACAGCCCCGACACCAAGGTCCTGGACATCTGTGTCTCGCTGTTGATGGGAGAGCAGTTTCTCGTCAGCTGGTGTTAGtctagaGILT1-87-GAA56-952的氨基酸序列MGIPMGKSMLVLLTFLAFASCCIAAYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSERDVSTPPTVLPDNFPRYPVGGAPHQQGASRPGPRDAQAHPGRPRAVPTQCDVPPNSRFDCAPDKAITQEQCEARGCCYIPAKQGLQGAQMGQPWCFFPPSYPSYKLENLSSSEMGYTATLTRTTPTFFPKDILTLRLDVMMETENRLHFTIKDPANRRYEVPLETPRVHSRAPSPLYSVEFSEEPFGVIVHRQLDGRVLLNTTVAPLFFADQFLQLSTSLPSQYITGLAEHLSPLMLSTSWTRITLWNRDLAPTPGANLYGSHPFYLALEDGGSAHGVFLLNSNAMDVVLQPSPALSWRSTGGILDVYIFLGPEPKSVVQQYLDVVGYPFMPPYWGLGFHLCRWGYSSTAITRQVVENMTRAHFPLDVQWNDLDYMDSRRDFTFNKDGFRDFPAMVQELHQGGRRYMMIVDPAISSSGPAGSYRPYDEGLRRGVFITNETGQPLIGKVWPGSTAFPDFTNPTALAWWEDMVAEFHDQVPFDGMWIDMNEPSNFIRGSEDGCPNNELENPPYVPGVVGGTLQAATICASSHQFLSTHYNLHNLYGLTEAIASHRALVKARGTRPFVISRSTFAGHGRYAGHWTGDVWSSWEQLASSVPEILQFNLLGVPLVGADVCGFLGNTSEELCVRWTQLGAFYPFMRNHNSLLSLPQEPYSFSEPAQQAMRKALTLRYALLPHLYTLFHQAHVAGETVARPLFLEFPKDSSTWTVDHQLLWGEALLITPVLQAGKAEVTGYFPLGTWYDLQTVPIEALGSLPPPPAAPREPAIHSEGQWVTLPAPLDTINVHLRAGYIIPLQGPGLTTTESRQQPMALAVALTKGGEARGELFWDDGESLEVLERGAYTQVIFLARNNTIVNELVRVTSEGAGLQLQKVTVLGVATAPQQVLSNGVPVSNFTYSPDTKVLDICVSLLMGEQFLVSWC.
GILT1-87-GAA70-952的DNA序列ggtaccACACCAATGGGAATCCCAATGGGGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGA
GAGGGACGTGTCGACCCCTCCGACCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCggcgcgccgGCACACCCCGGCCGTCCCAGAGCAGTGCCCACACAGTGCGACGTCCCCCCCAACAGCCGCTTCGATTGCGCCCCTGACAAGGCCATCACCCAGGAACAGTGCGAGGCCCGCGGCTGCTGCTACATCCCTGCAAAGCAGGGGCTGCAGGGAGCCCAGATGGGGCAGCCCTGGTGCTTCTTCCCACCCAGCTACCCCAGCTACAAGCTGGAGAACCTGAGCTCCTCTGAAATGGGCTACACGGCCACCCTGACCCGTACCACCCCCACCTTCTTCCCCAAGGACATCCTGACCCTGCGGCTGGACGTGATGATGGAGACTGAGAACCGCCTCCACTTCACGATCAAAGATCCAGCTAACAGGCGCTACGAGGTGCCCTTGGAGACCCCGCGTGTCCACAGCCGGGCACCGTCCCCACTCTACAGCGTGGAGTTCTCtGAGGAGCCCTTCGGGGTGATCGTGCACCGGCAGCTGGACGGCCGCGTGCTGCTGAACACGACGGTGGCGCCCCTGTTCTTTGCGGACCAGTTCCTTCAGCTGTCCACCTCGCTGCCCTCGCAGTATATCACAGGCCTCGCCGAGCACCTCAGTCCCCTGATGCTCAGCACCAGCTGGACCAGGATCACCCTGTGGAACCGGGACCTTGCGCCCACGCCCGGTGCGAACCTCTACGGGTCTCACCCTTTCTACCTGGCGCTGGAGGACGGCGGGTCGGCACACGGGGTGTTCCTGCTAAACAGCAATGCCATGGATGTGGTCCTGCAGCCGAGCCCTGCCCTTAGCTGGAGGTCGACAGGTGGGATCCTGGATGTCTACATCTTCCTGGGCCCAGAGCCCAAGAGCGTGGTGCAGCAGTACCTGGACGTTGTGGGATACCCGTTCATGCCGCCATACTGGGGCCTGGGCTTCCACCTGTGCCGCTGGGGCTACTCCTCCACCGCTATCACCCGCCAGGTGGTGGAGAACATGACCAGGGCCCACTTCCCCCTGGACGTCCAATGGAACGACCTGGACTACATGGACTCCCGGAGGGACTTCACGTTCAACAAGGATGGCTTCCGGGACTTCCCGGCCATGGTGCAGGAGCTGCACCAGGGCGGCCGGCGCTACATGATGATCGTGGATCCTGCCATCAGCAGCTCGGGCCCTGCCGGGAGCTACAGGCCCTACGACGAGGGTCTGCGGAGGGGGGTTTTCATCACCAACGAGACCGGCCAGCCGCTGATTGGGAAGGTATGGCCCGGGTCCACTGCCTTCCCCGACTTCACCAACCCCACAGCCCTGGCCTGGTGGGAGGACATGGTGGCTGAGTTCCATGACCAGGTGCCCTTCGACGGCATGTGGATTGACATGAACGAGCCTTCCAACTTCATCAGGGGCTCTGAGGACGGCTGCCCCAACAATGAGCTGGAGAACCCACCCTACGTGCCTGGGGTGGTTGGGGGGACCCTCCAGGCGGCAACCATCTGTGCCTCCAGCCACCAGTTTCTCTCCACACACTACAACCTGCACAACCTCTACGGCCTGACCGAAGCCATCGCCTCCCACAGGGCGCTGGTGAAGGCTCGGGGGACACGCCCATTTGTGATCTCCCGCTCGACCTTTGCTGGCCACGGCCGATACGCCGGCCACTGGACGGGGGACGTGTGGAGCTCCTGGGAGCAGCTCGCCTCCTCCGTGCCAGAAATCCTGCAGTTTAACCTGCTGGGGGTGCCTCTGGTCGGGGCCGACGTCT
GCGGCTTCCTGGGCAACACCTCAGAGGAGCTGTGTGTGCGCTGGACCCAGCTGGGGGCCTTCTACCCCTTCATGCGGAACCACAACAGCCTGCTCAGTCTGCCCCAGGAGCCGTACAGCTTCAGCGAGCCGGCCCAGCAGGCCATGAGGAAGGCCCTCACCCTGCGCTACGCACTCCTCCCCCACCTCTACACGCTGTTCCACCAGGCCCACGTCGCGGGGGAGACCGTGGCCCGGCCCCTCTTCCTGGAGTTCCCCAAGGACTCTAGCACCTGGACTGTGGACCACCAGCTCCTGTGGGGGGAGGCCCTGCTCATCACCCCAGTGCTCCAGGCCGGGAAGGCCGAAGTGACTGGCTACTTCCCCTTGGGCACATGGTACGACCTGCAGACGGTGCCAATAGAGGCCCTTGGCAGCCTCCCACCCCCACCTGCAGCTCCCCGTGAGCCAGCCATCCACAGCGAGGGGCAGTGGGTGACGCTGCCGGCCCCCCTGGACACCATCAACGTCCACCTCCGGGCTGGGTACATCATCCCCCTGCAGGGCCCTGGCCTCACAACCACAGAGTCCCGCCAGCAGCCCATGGCCCTGGCTGTGGCCCTGACCAAGGGTGGAGAGGCCCGAGGGGAGCTGTTCTGGGACGATGGAGAGAGCCTGGAAGTGCTGGAGCGAGGGGCCTACACACAGGTCATCTTCCTGGCCAGGAATAACACGATCGTGAATGAGCTGGTACGTGTGACCAGTGAGGGAGCTGGCCTGCAGCTGCAGAAGGTGACTGTCCTGGGCGTGGCCACGGCGCCCCAGCAGGTCCTCTCCAACGGTGTCCCTGTCTCCAACTTCACCTACAGCCCCGACACCAAGGTCCTGGACATCTGTGTCTCGCTGTTGATGGGAGAGCAGTTTCTCGTCAGCTGGTGTTAGtctagaGILT1-87-GAA70-952的氨基酸序列MGIPMGKSMLVLLTFLAFASCCIAAYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSERDVSTPPTVLPDNFPRYPVGGAPAHPGRPRAVPTQCDVPPNSRFDCAPDKAITQEQCEARGCCYIPAKQGLQGAQMGQPWCFFPPSYPSYKLENLSSSEMGYTATLTRTTPTFFPKDILTLRLDVMMETENRLHFTIKDPANRRYEVPLETPRVHSRAPSPLYSVEFSEEPFGVIVHRQLDGRVLLNTTVAPLFFADQFLQLSTSLPSQYITGLAEHLSPLMLSTSWTRITLWNRDLAPTPGANLYGSHPFYLALEDGGSAHGVFLLNSNAMDVVLQPSPALSWRSTGGILDVYIFLGPEPKSVVQQYLDVVGYPFMPPYWGLGFHLCRWGYSSTAITRQVVENMTRAHFPLDVQWNDLDYMDSRRDFTFNKDGFRDFPAMVQELHQGGRRYMMIVDPAISSSGPAGSYRPYDEGLRRGVFITNETGQPLIGKVWPGSTAFPDFTNPTALAWWEDMVAEFHDQVPFDGMWIDMNEPSNFIRGSEDGCPNNELENPPYVPGVVGGTLQAATICASSHQFLSTHYNLHNLYGLTEAIASHRALVKARGTRPFVISRSTFAGHGRYAGHWTGDVWSSWEQLASSVPEILQFNLLGVPLVGADVCGFLGNTSEELCVRWTQLGAFYPFMRNHNSLLSLPQEPYSFSEPAQQAMRKALTLRYALLPHLYTLFHQAHVAGETVARPLFLEFPKDSSTWTVDHQLLWGEALLITPVLQAGKAEVTGYFPLGTWYDLQT
VPIEALGSLPPPPAAPREPAIHSEGQWVTLPAPLDTINVHLRAGYIIPLQGPGLTTTESRQQPMALAVALTKGGEARGELFWDDGESLEVLERGAYTQVIFLARNNTIVNELVRVTSEGAGLQLQKVTVLGVATAPQQVLSNGVPVSNFTYSPDTKVLDICVSLLMGEQFLVSWC.
将5’Asp718位点克隆到pCEP4的Asp718位点内,用Kelnow blunt3’Xba位点并将其克隆到pCEP4的HindIII位点内,分别形成了pCEP-GILT1-87-GAA56-952和pCEP-GILT1-87-GAA70-952。构建体也含有Gly-Ala-Pro接头序列(AscI位点)。这些构建体表达具有GAA酶活性的蛋白。
另外,往GLIT1-87中引入修饰R68A以去除GILT标记内潜在的蛋白裂解位点(GLIT1-87-R68A)。下面显示了GLIT1-87-R68A的DNA(SEQID NO)和氨基酸(SEQ ID NO)序列(给突变序列加上了下划线)。
GLIT1-87-R68A的DNA序列(SEQ ID NO)GGTACCACACCAATGGGAATCCCAATGGGGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGAGGCGGACGTGTCGACCCCTCCGACCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCGGCGCGCCGGLIT1-87-R68A的氨基酸序列(SEQ ID NO)MGIPMGKSMLVLLTFLAFASCCIAAYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSEADVSTPPTVLPDNFPRYPVGGAP该标记与GAA位点56和70的融合生成了pCEP-GILT1-87-R68A-GAA56-952和pCEP-GILT1-87-R68A-GAA70-952。这些构建体表达具有GAA酶活性的蛋白。
另外,也引入点突变取代GILT1-87标记内的三个Ser/Thr残基,以去除糖基化位点(ΔGS)(GILT-1-87-ΔGS)。下面显示了GLIT1-87-ΔGS的DNA(SEQ ID NO_)和氨基酸(SEQ ID NO_)序列(给突变序列加上了下划线)。
GLIT1-87-ΔGS的DNA序列GGTACCACACCAATGGGAATCCCAATGGGGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGAGAGGGACGTGGCGGCCCCTCCGGCCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCGGCGCGCCGGLIT1-87-ΔGS的氨基酸序列MGIPMGKSMLVLLTFLAFASCCIAAYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSERDVAAPPAVLPDNFPRYPVGGAP该修饰的GLIT标记与GAA的位点70融合,生成了pCEP-GILT1-87-ΔGS-GAA70-952。该构建体表达具有GAA酶活性的蛋白。
另外,生成了整合有R68A和ΔGS修饰的GLIT标记(GILT1-87-R68A-ΔGS)。下面显示了GILT1-87-R68A-ΔGS的DNA(SEQID NO_)和氨基酸(SEQ ID NO_)序列(给突变序列加上了下划线)。GILT1-87-R68A-ΔGS的DNA序列(SEQ ID NO_)GGTACCACACCAATGGGAATCCCAATGGGGAAGTCGATGCTGGTGCTTCTCACCTTCTTGGCCTTCGCCTCGTGCTGCATTGCTGCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGAGGCGGACGTGGCGGCCCCTCCGGCCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCGGCGCGCCG
GILT1-87-R68A-ΔGS的氨基酸序列(SEQ ID NO_)MGIPMGKSMLVLLTFLAFASCCIAAYRPSETLCGGELVDTLQFVCGDRGFYFSRPASRVSRRSRGIVEECCFRSCDLALLETYCATPAKSEADVAAPPAVLPDNFPRYPVGGAP用修饰的GILT1-87-R68A-ΔGS生成构建体pCEP-GILT1-87-R68AΔGS-GAA56-952和pCEP-GILT1-87-R68AΔGS-GAA70-952。两种构建体都表达具有GAA酶活性的蛋白。
对上面的具有与GAA位点56融合的GLIT标记的蛋白进行western印迹。如图6所示,前体蛋白是全长的蛋白并含有IGF-II标记。ΔGS突变显示生成了具有稍快迁移率的蛋白,与缺少碳水化合物部分相一致。
实施例6其他的具有更长的及修饰GILT标记的构建体为了给IGF-II标记提供天然的折叠环境,用包含第8-156位氨基酸的IGF-II前体形式作为与GAA位点791融合的内在标记。另外,为了促进IGF-II标记内的位点87的下游部分的裂解,在IGF-II序列上形成突变E67A和D69S以便引入P2/P1蛋白裂解处理位点。所形成的构建体pCEP-GAA-791IGF2-P2/P1生成具有GAA酶活性的蛋白。下面显示了pCEP-GAA-791IGF2-P2/P1的DNA和氨基酸序列。
pCEP-GAA-791IGF2-P2/P1的DNA序列ATGGGAGTGAGGCACCCGCCCTGCTCCCACCGGCTCCTGGCCGTCTGCGCCCTCGTGTCCTTGGCAACCGCTGCACTCCTGGGGCACATCCTACTCCATGATTTCCTGCTGGTTCCCCGAGAGCTGAGTGGCTCCTCCCCAGTCCTGGAGGAGACTCACCCAGCTCACCAGCAGGGAGCCAGCAGACCAGGGCCCCGGGATGCCCAGGCACACCCCGGCCGTCCCAGAGCAGTGCCCACACAGTGCGACGTCCCCCCCAACAGCCGCTTCGATTGCGCCCCTGACAAGGCCATCACCCAGGAACAGTGCGAGGCCCGCGGCTGCTGCTACATCCCTGCAAAGCAGGGGCTGCAGGGAGCCCAGATGGGGCAGCCCTGGTGCTTCTTCCCACCCAGCTACCCCAGCTACAAGCTGGAGAACCTGAGCTCCTCTGAAATGGGCTACACGGCCACCCTGACCCGTACCACCCCCACCTTCTTCCCCAAGGACATCCTGACCCTGCGGCTGGACGTGATGATGGAGACTGAGAACCGCCTCCACTTCACGATCAAAGATCCAGCTAACAGGCGCTACGAGGTGCCCTTGGAGACCCCGCGTGTCCACAGCCGGGCACCGTCC
CCACTCTACAGCGTGGAGTTCTCtGAGGAGCCCTTCGGGGTGATCGTGCACCGGCAGCTGGACGGCCGCGTGCTGCTGAACACGACGGTGGCGCCCCTGTTCTTTGCGGACCAGTTCCTTCAGCTGTCCACCTCGCTGCCCTCGCAGTATATCACAGGCCTCGCCGAGCACCTCAGTCCCCTGATGCTCAGCACCAGCTGGACCAGGATCACCCTGTGGAACCGGGACCTTGCGCCCACGCCCGGTGCGAACCTCTACGGGTCTCACCCTTTCTACCTGGCGCTGGAGGACGGCGGGTCGGCACACGGGGTGTTCCTGCTAAACAGCAATGCCATGGATGTGGTCCTGCAGCCGAGCCCTGCCCTTAGCTGGAGGTCGACAGGTGGGATCCTGGATGTCTACATCTTCCTGGGCCCAGAGCCCAAGAGCGTGGTGCAGCAGTACCTGGACGTTGTGGGATACCCGTTCATGCCGCCATACTGGGGCCTGGGCTTCCACCTGTGCCGCTGGGGCTACTCCTCCACCGCTATCACCCGCCAGGTGGTGGAGAACATGACCAGGGCCCACTTCCCCCTGGACGTCCAATGGAACGACCTGGACTACATGGACTCCCGGAGGGACTTCACGTTCAACAAGGATGGCTTCCGGGACTTCCCGGCCATGGTGCAGGAGCTGCACCAGGGCGGCCGGCGCTACATGATGATCGTGGATCCTGCCATCAGCAGCTCGGGCCCTGCCGGGAGCTACAGGCCCTACGACGAGGGTCTGCGGAGGGGGGTTTTCATCACCAACGAGACCGGCCAGCCGCTGATTGGGAAGGTATGGCCCGGGTCCACTGCCTTCCCCGACTTCACCAACCCCACAGCCCTGGCCTGGTGGGAGGACATGGTGGCTGAGTTCCATGACCAGGTGCCCTTCGACGGCATGTGGATTGACATGAACGAGCCTTCCAACTTCATCAGGGGCTCTGAGGACGGCTGCCCCAACAATGAGCTGGAGAACCCACCCTACGTGCCTGGGGTGGTTGGGGGGACCCTCCAGGCGGCAACCATCTGTGCCTCCAGCCACCAGTTTCTCTCCACACACTACAACCTGCACAACCTCTACGGCCTGACCGAAGCCATCGCCTCCCACAGGGCGCTGGTGAAGGCTCGGGGGACACGCCCATTTGTGATCTCCCGCTCGACCTTTGCTGGCCACGGCCGATACGCCGGCCACTGGACGGGGGACGTGTGGAGCTCCTGGGAGCAGCTCGCCTCCTCCGTGCCAGAAATCCTGCAGTTTAACCTGCTGGGGGTGCCTCTGGTCGGGGCCGACGTCTGCGGCTTCCTGGGCAACACCTCAGAGGAGCTGTGTGTGCGCTGGACCCAGCTGGGGGCCTTCTACCCCTTCATGCGGAACCACAACAGCCTGCTCAGTCTGCCCCAGGAGCCGTACAGCTTCAGCGAGCCGGCCCAGCAGGCCATGAGGAAGGCCCTCACCCTGCGCTACGCACTCCTCCCCCACCTCTACACGCTGTTCCACCAGGCCCACGTCGCGGGGGAGACCGTGGCCCGGCCCCTCTTCCTGGAGTTCCCCAAGGACTCTAGCACCTGGACTGTGGACCACCAGCTCCTGTGGGGGGAGGCCCTGCTCATCACCCCAGTGCTCCAGGCCGGGAAGGCCGAAGTGACTGGCTACTTCCCCTTGGGCACATGGTACGACCTGCAGACGGTGCCAATAGAGGCCCTTGGCAGCCTCCCACCCCCACCTggcgcgccgCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGT
GGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGcGAGGtcCGTGTCGACCCCTCCGACCGTGCTTCCGGACAACTTCCCCAGATACCCCGTGGGCAAGTTCTTCCAATATGACACCTGGAAGCAGTCCACCCAGCGCCTGCGCAGGGGCCTGCCTGCCCTCCTGCGTGCCCGCCGGGGTCACGTGCTCG CCAAGGAGCTCGAGGCGTTCAGGGAGGCCAAACGTCACCGTCCCCTGATTGCTCTACCCACCCAAGACCCCGCCCACGGGGGCGCCCCCCCAGAGATGGCCAGCAATCGGAAGggcgcgccgGCAGCTCCCCGTGAGCCAGCCATCCACAGCGAGGGGCAGTGGGTGACGCTGCCGGCCCCCCTGGACACCATCAACGTCCACCTCCGGGCTGGGTACATCATCCCCCTGCAGGGCCCTGGCCTCACAACCACAGAGTCCCGCCAGCAGCCCATGGCCCTGGCTGTGGCCCTGACCAAGGGTGGAGAGGCCCGAGGGGAGCTGTTCTGGGACGATGGAGAGAGCCTGGAAGTGCTGGAGCGAGGGGCCTACACACAGGTCATCTTCCTGGCCAGGAATAACACGATCGTGAATGAGCTGGTACGTGTGACCAGTGAGGGAGCTGGCCTGCAGCTGCAGAAGGTGACTGTCCTGGGCGTGGCCACGGCGCCCCAGCAGGTCCTCTCCAACGGTGTCCCTGTCTCCAACTTCACCTACAGCCCCGACACCAAGGTCCTGGACATCTGTGTCTCGCTGTTGATGGGAGAGCAGTTTCTCGTCAGCTGGTGTTAGpCEP-GAA-791IGF2-P2/P1的氨基酸序列MGVRHPPCSHRLLAVCALVSLATAALLGHILLHDFLLVPRELSGSSPVLEETHPAHQQGASRPGPRDAQAHPGRPRAVPTQCDVPPNSRFDCAPDKAITQEQCEARGCCYIPAKQGLQGAQMGQPWCFFPPSYPSYKLENLSSSEMGYTATLTRTTPTFFPKDILTLRLDVMMETENRLHFTIKDPANRRYEVPLETPRVHSRAPSPLYSVEFSEEPFGVIVHRQLDGRVLLNTTVAPLFFADQFLQLSTSLPSQYITGLAEHLSPLMLSTSWTRITLWNRDLAPTPGANLYGSHPFYLALEDGGSAHGVFLLNSNAMDVVLQPSPALSWRSTGGILDVYIFLGPEPKSVVQQYLDVVGYPFMPPYWGLGFHLCRWGYSSTAITRQVVENMTRAHFPLDVQWNDLDYMDSRRDFTFNKDGFRDFPAMVQELHQGGRRYMMIVDPAISSSGPAGSYRPYDEGLRRGVFITNETGQPLIGKVWPGSTAFPDFTNPTALAWWEDMVAEFHDQVPFDGMWIDMNEPSNFIRGSEDGCPNNELENPPYVPGVVGGTLQAATICASSHQFLSTHYNLHNLYGLTEAIASHRALVKARGTRPFVISRSTFAGHGRYAGHWTGDVWSSWEQLASSVPEILQFNLLGVPLVGADVCGFLGNTSEELCVRWTQLGAFYPFMRNHNSLLSLPQEPYSFSEPAQQAMRKALTLRYALLPHLYTLFHQAHVAGETVARPLFLEFPKDSSTWTVDHQLLWGEALLITPVLQAGKAEVTGYFPLGTWYDLQTVPIEALGSLPPPPGAPLCGGELVDTLQFVCGDRGFYFSRPAS
RVSRRSRGIVEECCFRSCDLALLETYCATPAKSARSVSTPPTVLPDNFPRYPVGKFFQYDTWKQSTQRLRRGLPALLRARRGHVLAKELEAFREAKRHRPLIALPTQDPAHGGAPPEMASNRKGAPAAPREPAIHSEGQWVTLPAPLDTINVHLRAGYIIPLQGPGLTTTESRQQPMALAVALTKGGEARGELFWDDGESLEVLERGAYTQVIFLARNNTIVNELVRVTSEGAGLQLQKVTVLGVATAPQQVLSNGVPVSNFTYSPDTKVLDICVSLLMGEQFLVSWC.
为了进一步地提高与N末端(例如位点70)融合的GILT标记的呈递和/或折叠,在N末端的GILTΔ2-7标记和GAA融合点位点70之间插入具有序列Gly-Gly-Gly-Gly-Gly-Pro的间隔物,生成了GILTΔ2-7-spcrl-GAA70-952。这个构建体表达具有GAA酶活性的蛋白。
实施例7具有AscI限制性酶切位点插入的GAA构建体根据标准生物技术制备在GAA的氨基酸残基783-791区域内包含有Gly-Ala-Pro序列(一个AscI限制性酶切位点)插入的构建体。如表7所示,AscI限制性酶切位点的插入增加了瞬时GAA酶表达水平。这个插入可能可以引起酶向高亲和力形式的转换。在裂解了783-791边界区域之后,前体GAA正常地成熟为高亲和力的GAA形式(Moreland et al.,2004)。有报道显示,在裂解之后N末端结构域和C末端结构域仍是相连的(Moreland et al.,2004)。
表7限制性酶切位点插入增加了瞬时表达。

为了确定三个残基的插入是否促进了前体GAA的裂解,利用抗GAA多克隆抗体进行Western印迹分析比较野生型GAA和GAA-791Asc蛋白。如图7所示,GAA-791Asc以与野生型GAA相似的迁移率移动,说明三个残基的插入没有促进蛋白裂解。
酶活性增加的另一种解释是在边界区内的残基插入使得构象转换为高亲和力形式,而不需裂解两个区域。利用亲和色谱法以及如在Moreland等2004中所述的通过比较GAA-791Asc和野生型GAA在Superdex200柱上的结合亲和力可以测试这一点。
另外,联合791AscI位点插入以及位点69上的N末端的GILT标记制备构建体pCEP-GILTΔ2-7-GAA70-952-791Asc。
实施例8具有遗传工程化的蛋白裂解位点的内在GILT标记为了生成活性的内在GILT标记,设计试验,将标记放置在经标记下游的X因子限制性蛋白酶位点所遗传工程化的GAA779-796区域内。Xa因子对所表达蛋白的处理将释放出GAA的C末端部分,并且可能显露出一个暴露的和活性的GILT标记。
因此,将具有下游X因子蛋白酶位点的GILT标记放置在GAA的位点787、779、和796内。所有三种所形成的蛋白都具有GAA酶活性。在Western分析中,如图8所示,所有三种蛋白都含有被抗IGF-II抗体所探查到的GILT标记。所有的蛋白制剂都含有具有与存在全长前体相一致的相对迁移率(Mr 120,000-140,000)的条带。所有三种蛋白制剂也都含有保留有GILT标记的更快迁移的中间条带(Mr 85,000-100,000)。在用Xa因子处理蛋白之后,去除了大多数全长条带,中间条带的迁移率稍微减低。GLIT标记仍被保留在经Xa处理过的中间条带内。
在GAA序列内所含的GILT Xa标记促进了因子X位点下游位点上的蛋白裂解是有可能的。位点816已经被报道为GAA成熟加工的一个位点。
图8举例说明了可能的GAA的C末端加工的模型。
实施例9人/鼠GAA杂合体为了改善GILT标记的折叠,用人GAA的氨基酸位点791、796、816、881、和920上的融合点构建出了由N末端的人GAA和C末端的鼠GAA构成的嵌合蛋白。在融合点上引入了一个包括序列Gly-Ala-Pro的AscI限制性酶切位点。
具体地,用相应的鼠GAA的C末端序列取代人GAA的C末端部分制备出嵌合的人/鼠GAA蛋白。通过在通用接头序列ggcgcgccg上融合人和鼠部分构建出DNA表达盒,所述接头序列含有唯一的AscI位点并编码序列Gly-Ala-Pro(GAP)。用下面所列的引物经PCR生成GAA杂合体的小鼠部分,其含有用于与N末端的人GAA序列融合的5’AscI位点以及用于克隆到pCEP载体的NotI位点内的3’NotI位点。
表8人/鼠GAA杂合体

小鼠GAA核苷酸序列ATGAATATACGGAAGCCCCTCTGTTCGAACTCCGTGGTTGGGGCCTGCACCCTTATCTCTCTGACTACAGCGGTCATCCTGGGTCATCTCATGCTTCGGGAGTTAATGCTGCTTCCCCAAGACCTTCATGAGTCCTCTTCAGGACTGTGGAAGACGTACCGACCTCACCACCAGGAAGGTTACAAGCCAGGGCCTCTGCACATCCAGGAGCAGACTGAACAGCCCAAAGAAGCACCCACACAGTGTGATGTGCCCCCCAGCAGCCGCTTTGACTGTGCCCCCGACAAAGGCATCTCACAGGAGCAATGCGAGGCCCGCGGCTGCTGCTATGTCCCAGCAGGGCAGGTGCTGAAGGAGCCGCAGATAGGGCAGCCCTGGTGTTTCTTCCCTCCCAGCTACCCAAGCTACCGTCTAGAGAACCTGAGCTCTACAGAGTCGGGGTACACAGC
CACCCTGACCCGTACCAGCCCGACCTTCTTCCCAAAGGATGTGCTGACCTTACAGCTGGAGGTGCTGATGGAGACAGACAGCCGCCTCCACTTCAAGATCAAAGATCCTGCTAGTAAGCGCTACGAAGTGCCCCTGGAGACCCCACGTGTGCTGAGCCAGGCACCATCCCCACTTTACAGCGTGGAATTCTCAGAGGAACCCTTTGGAGTGATCGTTCGTAGGAAGCTTGGTGGCCGAGTGTTGCTGAACACAACCGTGGCCCCCCTGTTCTTCGCTGACCAGTTCCTGCAGCTGTCCACTTCCCTGCCCTCCCAGCACATCACAGGCCTGGGGGAACACCTCAGCCCACTCATGCTCAGCACCGACTGGGCTCGTATCACCCTCTGGAACCGGGACACACCACCCTCGCAAGGTACCAACCTCTACGGGTCACATCCTTTCTACCTGGCACTGGAGGACGGTGGCTTGGCTCACGGTGTCTTCTTGCTAAACAGCAATGCCATGGATGTCATCCTGCAACCCAGCCCAGCCCTAACCTGGAGGTCAACGGGCGGGATCCTGGATGTGTATGTGTTCCTAGGCCCAGAGCCCAAGAGCGTTGTGCAACAATACCTGGATGTTGTGGGATACCCCTTCATGCCTCCATACTGGGGCCTCGGCTTCCACCTCTGCCGCTGGGGCTACTCCTCGACCGCCATTGTCCGCCAGGTAGTGGAGAACATGACCAGGACACACTTCCCGCTGGATGTGCAATGGAATGACCTGGACTACATGGACGCCCGAAGAGACTTCACCTTCAACCAGGACAGCTTTGCCGACTTCCCAGACATGGTGCGGGAGCTGCACCAGGGTGGCCGGCGCTACATGATGATCGTGGACCCTGCCATCAGCAGCGCAGGCCCTGCTGGGAGTTACAGGCCCTACGACGAGGGTCTGCGGAGGGGTGTGTTCATCACCAACGAGACTGGGCAGCCGCTGATTGGGAAGGTTTGGCCCGGAACCACCGCCTTCCCTGATTTCACCAACCCTGAGACCCTTGACTGGTGGCAGGACATGGTGTCTGAGTTCCACGCCCAGGTGCCCTTCGATGGCATGTGGCTCGACATGAACGAACCGTCCAACTTCGTTAGAGGCTCTCAGCAGGGCTGCCCCAACAATGAACTGGAGAACCCCCCCTATGTGCCCGGGGTGGTTGGCGGGATCTTGCAGGCAGCCACCATCTGTGCCTCCAGCCACCAATTCCTCTCCACACACTACAACCTCCACAACCTGTACGGCCTCACTGAAGCTATCGCCTCCAGCAGGGCCCTGGTCAAGACTCGGGGAACACGACCCTTTGTGATCTCCCGCTCAACCTTCTCGGGCCACGGCCGGTACGCTGGTCACTGGACAGGGGATGTGCGGAGCTCTTGGGAGCATCTTGCATACTCTGTGCCAGACATCCTGCAGTTCAACCTGCTGGGCGTGCCCCTGGTCGGGGCGGACATCTGCGGCTTCATAGGAGACACGTCAGAAGAGCTGTGTGTGCGCTGGACCCAGTTGGGGGCCTTCTACCCCTTCATGCGGAACCACAATGACCTGAATAGCGTGCCTCAGGAGCCGTACAGGTTCAGCGAGACGGCGCAGCAGGCCATGAGGAAGGCCTTCGCCTTACGCTATGCCCTTCTGCCCTACCTGTACACTCTCTTCCACCGCGCCCACGTCAGAGGAGACACGGTGGCCCGGCCCCTCTTCCTGGAGTTCCCTGAGGATCCCAGCACCTGGTCTGTGGACCGCCAGCTCTTGTGGGGGCCGGCCCTGC
TCATCACACCTGTGCTTGAGCCTGGGAAAACTGAAGTGACGGGCTACTTCCCCAAGGGCACGTGGTACAACATGCAGGTGGTGTCAGTGGATTCCCTCGGTACTCTCCCTTCTCCATCATCGGCTTCATCCTTCAGATCTGCTGTCCAGAGCAAGGGGCAGTGGCTGACACTGGAAGCCCCACTGGATACCATCAACGTGCACCTGAGGGAGGGGTACATCATACCGCTGCAGGGTCCCAGCCTCACAACCACGGAGTCCCGAAAGCAGCCCATGGCTCTGGCTGTGGCATTAACAGCAAGCGGCGAGGCCGATGGGGAGCTGTTCTGGGACGACGGGGAGAGCCTTGCAGTTCTGGAGCGTGGGGCCTACACACTGGTCACCTTCTCAGCCAAGAACAATACCATTGTGAACAAGTTAGTGCGTGTGACCAAGGAGGGAGCTGAGCTACAACTGAGGGAGGTGACCGTCTTGGGAGTGGCCACAGCTCCTACCCAGGTCCTTTCCAACGGCATCCCTGTCTCCAATTTCACCTACAGCCCTGACAACAAGAGCCTGGCCATCCCTGTCTCACTGCTGATGGGAGAGCTGTTTCAAATCAGCTGGTCCTAG小鼠GAA氨基酸序列MNIRKPLCSNSVVGACTLISLTTAVILGHLMLRELMLLPQDLHESSSGLWKTYRPHHQEGYKPGPLHIQEQTEQPKEAPTQCDVPPSSRFDCAPDKGISQEQCEARGCCYVPAGQVLKEPQIGQPWCFFPPSYPSYRLENLSSTESGYTATLTRTSPTFFPKDVLTLQLEVLMETDSRLHFKIKDPASKRYEVPLETPRVLSQAPSPLYSVEFSEEPFGVIVRRKLGGRVLLNTTVAPLFFADQFLQLSTSLPSQHITGLGEHLSPLMLSTDWARITLWNRDTPPSQGTNLYGSHPFYLALEDGGLAHGVFLLNSNAMDVILQPSPALTWRSTGGILDVYVFLGPEPKSVVQQYLDVVGYPFMPPYWGLGFHLCRWGYSSTAIVRQVVENMTRTHFPLDVQWNDLDYMDARRDFTFNQDSFADFPDMVRELHQGGRRYMMIVDPAISSAGPAGSYRPYDEGLRRGVFITNETGQPLIGKVWPGTTAFPDFTNPETLDWWQDMVSEFHAQVPFDGMWLDMNEPSNFVRGSQQGCPNNELENPPYVPGVVGGILQAATICASSHQFLSTHYNLHNLYGLTEAIASSRALVKTRGTRPFVISRSTFSGHGRYAGHWTGDVRSSWEHLAYSVPDILQFNLLGVPLVGADICGFIGDTSEELCVRWTQLGAFYPFMRNHNDLNSVPQEPYRFSETAQQAMRKAFALRYALLPYLYTLFHRAHVRGDTVARPLFLEFPEDPSTWSVDRQLLWGPALLITPVLEPGKTEVTGYFPKGTWYNMQVVSVDSLGTLPSPSSASSFRSAVQSKGQWLTLEAPLDTINVHLREGYIIPLQGPSLTTTESRKQPMALAVALTASGEADGELFWDDGESLAVLERGAYTLVTFSAKNNTTVNKLVRVTKEGAELQLREVTVLGVATAPTQVLSNGIPVSNFTYSPDNKSLAIPVSLLMGELFQISWS.
如在实施例1中所述的将嵌合的GAA表达盒转染到HEK293细胞内。从两种稳定的转染体中测定出GAA表达水平。如表8所示,位点881上的融合给出了最高的酶表达水平。对位点881融合的杂合体的western分析显示出所表达的前体蛋白与野生型GAA的大小相似。
表9人/鼠GAA杂合体表达

进行了其他试验以确定杂合体的C末端的小鼠GAA序列的存在是否能调节GLIT标记的存在。因此,将GLITΔ1-7标记与上面所列的5种全长人/鼠杂合体中的每种杂合体的C末端融合,并确定出每种情况中的表达水平。也制备了联合C末端位点881的小鼠GAA杂合体与位点29、56、70、或81上的N末端的GILT标记的构建体。如上所述的确定出表达水平。
权利要求
1.一种多肽,其包括与人酸性α-糖苷酶(GAA)的第70-790位氨基酸残基或其片段具有至少50%相同性的氨基酸序列以及与靶细胞表面上的受体的细胞外结构域结合的导向结构域,其中所述多肽和与人GAA的第880-952位氨基酸残基具有至少50%相同性的序列无关联。
2.权利要求1的多肽,其中所述氨基酸序列包括人GAA的第70-790位氨基酸残基或其片段。
3.权利要求1的多肽,其中导向结构域使得多肽定位于人溶酶体。
4.权利要求3的多肽,其中导向结构域包括尿激酶型纤溶酶原受体部分。
5.权利要求3的多肽,其中导向结构域包括人IGF-II的第48-55位氨基酸。
6.权利要求3的多肽,其中导向结构域包括人IGF-II的第8-28和41-61位氨基酸或其序列变体,其中序列变体与人阳离子非依赖性甘露糖-6-磷酸受体结合。
7.权利要求3的多肽,其中导向结构域包括人IGF-II的第8-27位残基或其序列变体,其中序列变体与人阳离子非依赖性甘露糖-6-磷酸受体结合。
8.权利要求7的多肽,其中导向结构域包括人IGF-II的R68A突变。
9.权利要求5的多肽,其中导向结构域包括人IGF-II的C末端截短形式或其序列变体,其中截短从第62位开始。
10.权利要求1的多肽,其中导向结构域直接与所述氨基酸序列的N末端融合。
11.权利要求1的多肽,其中导向结构域通过导向结构域和所述氨基酸序列之间的间隔物与所述氨基酸序列的N末端融合。
12.权利要求11的多肽,其中间隔物的长度为10-25个氨基酸。
13.权利要求11的多肽,其中间隔物包括多个甘氨酸残基。
14.权利要求11的多肽,其中间隔物包括α-螺旋结构。
15.权利要求11的多肽,其中间隔物包括与Gly-Gly-Gly-Gly-Thr-Val-Gly-Asp-Asp-Asp-Asp-Lys具有至少50%相同性的氨基酸序列。
16.一种药物组合物,其包括权利要求1的多肽。
17.一种导向治疗药物,其包括治疗剂和肽标记,所述治疗剂包括人酸性α-糖苷酶(GAA)的至少一部分,其中所述肽标记直接或间接地连接于选自人GAA的第68、69、70、71、72、789、790、791、792、和793位氨基酸残基的氨基酸残基。
18.权利要求17的导向治疗药物,其中氨基酸残基选自人GAA的第68-72位氨基酸残基。
19.权利要求17的导向治疗药物,其中治疗剂包括人GAA的第70-952位氨基酸残基。
20.权利要求19的导向治疗药物,其中肽标记连接于人GAA的第70位氨基酸残基。
21.权利要求17的导向治疗药物,其中肽标记是细胞外受体的配体。
22.权利要求21的导向治疗药物,其中肽标记是导向结构域,其与靶细胞表面上的受体的细胞外结构域结合,并在受体内化之后使得治疗剂定位于人溶酶体。
23.权利要求22的导向治疗药物,其中导向结构域包括尿激酶型纤溶酶原受体部分。
24.权利要求22的导向治疗药物,其中肽标记包括人IGF-II的第48-55位氨基酸残基。
25.权利要求22的导向治疗药物,其中肽标记包括人IGF-II的第8-28和41-61位氨基酸残基或其序列变体,其中序列变体与人阳离子非依赖性甘露糖-6-磷酸受体结合。
26.权利要求22的导向治疗药物,其中肽标记包括人IGF-II的第8-87位残基或其序列变体,其中序列变体与人阳离子非依赖性甘露糖-6-磷酸受体结合。
27.权利要求26的导向治疗药物,其中肽标记包括人IGF-II的R68A突变。
28.权利要求24的导向治疗药物,其中导向结构域包括人IGF-II的C末端截短形式或其序列变体,其中截短从第62位开始。
29.权利要求17的导向治疗药物,还包括治疗剂和肽标记之间的间隔物。
30.权利要求29的导向治疗药物,其中间隔物包括多个甘氨酸残基。
31.权利要求29的导向治疗药物,其中间隔物包括α-螺旋结构。
32.权利要求29的导向治疗药物,其中间隔物包括与Gly-Gly-Gly-Gly-Thr-Val-Gly-Asp-Asp-Asp-Asp-Lys具有至少50%相同性的氨基酸序列。
33.一种包括一种多肽的开放读框的核酸序列,所述多肽包括与人酸性α-糖苷酶(GAA)的第70-790位氨基酸残基或其片段具有至少50%相同性的氨基酸序列,其中开放读框不包括与人GAA的第880-952位氨基酸残基具有至少50%相同性的氨基酸序列。
34.权利要求33的核酸序列,其中所述多肽包括人GAA的第70-790位氨基酸残基或其片段。
35.权利要求33的核酸序列,其中核酸序列是DNA序列。
36.权利要求33的核酸序列,其中所述多肽还包括导向结构域,所述导向结构域与靶细胞表面上的受体的细胞外结构域结合,并在受体内化之后使得所述多肽定位于人溶酶体。
37.权利要求36的核酸序列,其中导向结构域包括人IGF-II的第8-87位氨基酸残基或其序列变体,其中序列变体与人阳离子非依赖性甘露糖-6-磷酸受体结合。
38.权利要求37的核酸序列,其中导向结构域包括人IGF-II的R68A突变。
39.一种包括权利要求33的核酸序列的细胞。
40.一种包括一种多肽的开放读框的核酸序列,所述多肽包括与人酸性α-糖苷酶(GAA)的第880-952位氨基酸残基或其片段具有至少50%相同性的氨基酸序列,其中开放读框不包括与人GAA的第70-790位氨基酸残基具有至少50%相同性的氨基酸序列。
41.权利要求40的核酸序列,其中多肽包括人GAA的第880-952位氨基酸残基或其片段。
42.权利要求41的核酸序列,其中核酸序列是DNA序列。
43.一种包括权利要求40的核酸序列的细胞。
44.一种多肽,其包括与人酸性α-糖苷酶(GAA)的第880-952位氨基酸残基或其片段具有至少50%相同性的氨基酸序列,其中所述多肽和与人GAA的第70-790位氨基酸残基具有至少50%相同性的氨基酸序列无关联。
45.权利要求44的多肽,其中所述氨基酸序列包括人GAA的第880-952位氨基酸残基或其片段。
46.一种包括第一核酸序列和第二核酸序列的细胞,所述第一核酸序列包括第一多肽的第一开放读框,所述第一多肽包括与人酸性α-糖苷酶(GAA)的第70-790位氨基酸残基或其片段具有至少50%相同性的氨基酸序列,所述第二核酸序列包括第二多肽的第二开放读框,所述第二多肽包括与人酸性α-糖苷酶(GAA)的第880-952位氨基酸残基或其片段具有至少50%相同性的氨基酸序列,其中(i)第一开放读框不包括与人GAA的第880-952位氨基酸具有至少50%相同性的氨基酸序列;和(ii)第二开放读框不包括与人GAA的第70-790位氨基酸具有至少50%相同性的氨基酸序列。
全文摘要
本发明提供了定位于溶酶体的导向酸性α-糖苷酶治疗药物。导向治疗药物包括一种治疗剂GAA和一种与细胞外表面上的受体结合的、在受体内化之后使得导向治疗药物实现正确的亚细胞定位的导向部分。本发明也提供了与实施本发明相关的核酸、细胞、和方法。
文档编号A61K38/47GK1922313SQ200580004562
公开日2007年2月28日 申请日期2005年2月10日 优先权日2004年2月10日
发明者乔纳森·莱博维茨, 约翰·马加 申请人:齐斯特治疗公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1