具有增加的体内和/或体外稳定性的生物学活性蛋白的制作方法

文档序号:528868阅读:1417来源:国知局
专利名称:具有增加的体内和/或体外稳定性的生物学活性蛋白的制作方法
具有增加的体内和/或体外稳定性的生物学活性蛋白本发明涉及包含至少两个结构域的生物学活性蛋白,其中所述至少两个结构域的第一结构域包含具有和/或介导所述生物学活性的氨基酸序列,所述至少两个结构域的第 二结构域包含形成无规卷曲构象的由优选至少约100个氨基酸残基构成的氨基酸序列,其 中所述无规卷曲构象介导了所述生物学活性蛋白增加的体内和/或体外稳定性。此外,还 公开了编码本发明生物学活性蛋白的核酸分子以及包含所述核酸分子的载体和细胞。另 夕卜,本发明提供了包含本发明化合物的组合物以及本发明生物学活性蛋白、核酸分子、载体 和细胞的具体用途。常见的血浆蛋白如人血清白蛋白(HSA)和免疫球蛋白(Ig),包括人源化抗体,都 显示出长半衰期,一般为2至3周,这可归结于它们与新生儿Fc受体(FcRn)的特异相互 作用,而这导致内体循环(Ghetie (2002) Immunol Res, 25 :97_113)。相反,大多数从药物学 角度受到关注的其它蛋白,尤其是重组抗体片段、激素、干扰素等,遭遇到快速(血液)清 除。对于大小低于约70kDa的肾过滤阈值的蛋白而言尤其如此(Caliceti (2003)Adv Drug Deliv Rev 55 :1261_1277)。这些情况下,未修饰药物蛋白的血浆半衰期可能大大低于1小 时,因此使得其对于大多数治疗应用而言基本上是无价值的。为了实现持续的药理作用并 且改善患者顺从性,将所需的给药间隔延长至几天或甚至几星期,出于生物制药学药物开 发的目的之前已建立了几种策略。首先,通过产生与Ig的Fc部分融合的或者与血清白蛋白融合的蛋白来利用天 然血浆蛋白的循环机制,例如Enbrel 为TNFα受体的胞外结构域与人IgGl的结合体 (Goldenberg (1999) Clin Ther 21 :75_87),而Albuferon .为 IFN α 与 HSA 的相应融合物 (Osborn (2002) J Pharmacol ExpTher 303 :540_548)。具有 600 μ M 的高血菜浓度的白蛋白 也以间接方式被利用,用作例如通过与来自链球菌蛋白G的细菌白蛋白结合结构域(ABD) 融合(Makrides (1996) J Pharmacol Exp Ther 277:534-542)或者与从噬菌体展示文库 中针对 HSA 选择的肽融合(Dennis (2002) J Biol Chem, 277 35035-35043 ;Nguyen (2006) Protein Eng Des Sel 19:291-297)而具备白蛋白结合功能的生物药物的运载工具。其次,延长生物药物的血浆半衰期的完全不同的方法为偶联高度溶剂化的和生 理学上惰性的化学聚合物,由此有效地扩大治疗蛋白的流体动力学半径,超出约3-5nm 的肾小球孔径(Caliceti (2003)上文引用)。在温和的生物化学条件下,经由Lys侧 链随机地(Clark(1996) J Biol Chem271 :21969_21977)或通过特异引入的Cys残基 (Rosendahl (2005)BioProcess International 52-60)与活化的聚乙二醇(PEG)衍生 物的共价偶联已取得中等成功,目前用于几种被批准的药物。特别是在与具有特异药 理学活性的小蛋白结合中已经获得了相应的优势,例如Pegasys ,一种PEG化的重组 IFN- α -2a(Harris(2003)Nat Rev Drug Discov,2 214~221 ;Walsh(2003)Nat Biotechnol 21 865-870)。但是,就生物药物开发和生产而言,生物学活性蛋白与合成聚合物的化学偶联可 能有缺点。适合的PEG衍生物昂贵,尤其是当需要高纯度时,并且它们与重组蛋白的偶联需 要额外的体外加工和纯化步骤,这降低了产率且增加了生产成本。事实上,PEG经常被醛类和过氧化物类污染(Ray (1985) Anal Biochem 146 :307_312),并且在氧存在下储存时易于 化学降解。另外,如果治疗蛋白的生物化学活性位点附近的氨基酸侧链被PEG化过程所修 饰,其药物功能则可能被损害。此外,与合成聚合物的化学偶联一般产生不均一的分子混合 物,它们可能在体内活性方面显示出重大差异。第三,已提出了使用在其中引入了新的N连接糖基化共有序列的生物学活性蛋白 的糖基化类似物来延长血清半衰期;参见WO 02/02597 ;Perlman(2003) J Clin Endocrinol Metab 88 :2327_2335 ;或 Elliott (2003)NatBiotechnol 21:414-420)。但是,所述经糖基 化改造的蛋白表现出改变的体内活性,这表明新碳水化合物侧链影响了工程化蛋白的生物 学活性。此外,该额外的碳水化合物侧链很可能增加所得到的生物学活性分子的抗原性,这 又引起了重大的安全性问题。此外,据报道包含来源于枯氏锥虫(Trypanosoma cruzi)的人工重复序列PSTAD 的融合蛋白诱使反式唾液酸酶的血浆半衰期延长(Alvarez (2004)PNAS 279 :3375_3381)。 然而,报道称这种枯氏锥虫衍生的重复序列引起了体液免疫应答(Alvarez (2004)上文引 用)。因此,需要延长生物学活性蛋白的作用的其它手段。本发明基本的技术问题是提供具有增加的体内和/或体外稳定性的生物学活性 蛋白。通过提供在权利要求书中表征的实施方案实现了对以上技术问题的解决。 因此,本发明涉及包含至少两个结构域的生物学活性蛋白,其中(a)所述至少两个结构域的第一结构域包含具有和/或介导所述生物学活性的氨 基酸序列,以及(b)所述至少两个结构域的第二结构域包含形成无规卷曲构象的由优选至少约 100个氨基酸残基构成的氨基酸序列。根据本发明,形成/采取无规卷曲构象的所述第二结构域能够介导所述生物学活 性蛋白的体内和/或体外稳定性的增加。因此,所述第二结构域导致具有和/或介导指定 生物学活性的指定蛋白(或其片段)的体内和/或体外稳定性增加,如下文所定义的。如下文以及所附的实施例中所记载的,令人惊讶地发现,与未经修饰(即缺乏所 述无规卷曲结构域)的生物学活性蛋白相比,静脉内给予的经修饰而包含无规卷曲结构域 /部分的生物学活性蛋白显示出出乎意料的延长的血浆半衰期。用在本文时,术语“无规卷曲”指包括氨基酸聚合物在内的聚合物分子的任 何构象,其中形成所述聚合物结构的各个单体元件相对于邻近单体元件基本上随机地 定向,而仍与所述邻近单体元件化学结合。具体来说,采取/具有/形成“无规卷曲构 象”的多肽或氨基酸聚合物基本上缺乏确定的二级和三级结构。多肽无规卷曲的性质 和它们的实验鉴定方法为本领域技术人员所知,并在科学文献中有描述(Cantor(1980) Biophysical Chemistry,2nd ed. ,W. H. Freeman and Company,New York ;Creighton(1993) Proteins-Structures and Molecular Properties,2nd ed. , W. H. Freeman and Company, New York ;Smith (1996) Fold Des 1 :R95_R106)。本发明的生物学活性蛋白包含在生理条件下采取/形成无规卷曲构象的结构域 (上文中定义为本发明生物学活性蛋白的所述“第二结构域”)。术语“生理条件”在本领 域中是已知的,指蛋白通常在其中采取它们的天然构象的那些条件。更具体地,术语“生理 条件”指生物物理参数,它们通常对于高等形式的生命(尤其是哺乳动物,最优选人)是有效的。术语“生理条件”可以指生物化学和生物物理参数,它们正常地存在于哺乳动物体内 (特别是体液内),尤其是人体内。所述“生理条件”可以指存在于健康身体内的相应参数 以及存在于患病的哺乳动物或人患者中的参数。例如,当所述哺乳动物或所述人发热时,该 患病哺乳动物或人患者可以具有较高的、但仍为“生理”的温度状况。就蛋白采取它们的天 然构象/状态的“生理条件”而言,最重要的参数为温度(对人为37°C )、pH(对人血液为 7. 35-7. 45)、渗透压(280-300mmol/kg H2O),如果需要,还有蛋白含量(66_85g/l血清)。然 而,本领域技术人员了解,在生理条件下,这些参数可以变动,例如温度、PH、渗透压和蛋白 含量在指定的体液或组织液,诸如血液、脑脊液、腹膜液和淋巴中可能不同(Klinke (2005) Physiologie, 5th ed. , Georg Thieme Verlag, Stuttgart)。在脑脊液中,例如渗透压可以 为290mmol/kg H2O,蛋白浓度可以在0. 15g/l至0. 45g/l之间。在淋巴中,pH可以为约7. 4, 蛋白浓度可以在3g/l至5g/之间。当采用下文描述的方法在实验条件下确定氨基酸聚合物/序列是否形成/采取无 规卷曲构象时,诸如温度、pH、渗透压和蛋白含量的生物物理参数可能与体内一般存在的生 理条件不同。1°C至42°C或优选4°C至25°C的温度可以被认为是可用于在体外生理条件下 检验和/或确认蛋白的生物物理性能和生物学活性。几种缓冲液,尤其是在实验情景中(例如在确定蛋白结构中,特别是在使得本 领域技术人员能确定一段蛋白/氨基酸的结构特性的圆二色性(CD)测量以及其它方法 中)或在用于药物组合物的缓冲液、溶剂和/或赋形剂中,被认为可以在体外代表“生理溶 液”/“生理条件”。这类缓冲液的实例有例如磷酸盐缓冲盐水(PBS :115mM NaCl,4mM KH2PO4, 16mMNa2HP04pH 7. 4)、Tris缓冲液、醋酸盐缓冲液、柠檬酸缓冲液或诸如那些用在所附实施 例中的类似缓冲液。一般地,代表“生理溶液条件”的缓冲液的pH应位于6. 5至8. 5的范 围、优选7. O至8. O的范围、且最优选7. 2至7. 7的范围内,渗透压应位于10至lOOOmmol/ kg H2O的范围、更优选50至500mmol/kg H2O的范围、且最优选200至350mmol/kg H2O的范 围内。任选地,代表生理溶液条件的缓冲液的蛋白含量可以位于0至100g/l的范围内,忽 略具有生物学活性的蛋白本身,由此可以使用典型的稳定化蛋白,例如人或牛血清白蛋白。相应地,在本发明上下文中还设想,包含在以上定义的本发明生物学活性蛋白的 “第二结构域”中的无规卷曲构象在药物组合物(如液体药物)中得以保持。优选地,“生 理条件”要用于相应的缓冲系统、溶剂和/或赋形剂。然而,例如在冻干的或干燥的组合物 (例如药物组合物)中,可以想像包含在本发明生物学活性蛋白的“第二结构域”中的无规 卷曲构象暂时不存在和/或不能被检测到。但是,根据本发明的蛋白构建体,所述“第二结 构域”在相应的缓冲液/溶液/赋形剂/溶剂中重建后将重新采取/形成其无规卷曲。例 如,当本发明的蛋白构建体被冻干或干燥时(例如,处于药物组合物的形式)就是这样。在 包含如本文所定义的“第一”和“第二”结构域的这种冻干/干燥的本发明蛋白构建体重建 后,无规卷曲部分/结构域再次存在,并且相应的本发明构建体可例如给予需要医疗干预 的哺乳动物或人患者。如上文所提及的,本发明的生物学活性蛋白包含生理条件时/生理条件下采取/ 形成无规卷曲构象的结构域(上文定义为本发明生物学活性蛋白的所述“第二结构域”)。与本发明的生物学活性蛋白相反,变性蛋白为丧失了它们的功能性构象的蛋白, 并且因为所述变性而部分地采取无规卷曲构象。可通过各种手段使蛋白变性,包括暴露于非生理温度、PH和/或盐浓度,或暴露于变性剂如脲/盐酸胍和去垢剂。因此,当在生理条 件下研究蛋白时应避免存在有已知对蛋白有变性作用的化合物,如脲、盐酸胍或十二烷基 磺酸钠。当研究蛋白生理条件下在人血液或尿中的应用时,分别可以忍耐至多lOmmol/1或 甚至300mmol/l的脲。与变性多肽相反,本发明蛋白构建体中包含的无规卷曲结构域(所述“第二结构 域”)的氨基酸序列天然地采取/具有无规卷曲构象,尤其是在体内以及当给予需要医疗干 预的哺乳动物或人患者时。因此,可以想像本发明的蛋白构建体(包含以上定义的“第一” 和“第二结构域”)可以包含本文鉴定的丙氨酸、丝氨酸和脯氨酸段(或在生理条件下形成 /具有/采取无规卷曲的其它氨基酸段)形式的“第二”形成/采取无规卷曲的结构域,但 是可以(例如,处于特定的组合物形式,如冻干或干燥组合物)暂时或临时不为无规卷曲形 式。然而,重要的是,例如在相应的缓冲液(优选“生理”缓冲液/赋形剂和/或溶剂)中 重建后,本发明蛋白构建体的“第二结构域”重新采取本文所定义的无规卷曲。所述“第二 结构域”(在相应的重建后)能够介导本发明生物学活性蛋白的增加的体内和/或体外稳 定性。本发明的生物学活性蛋白与不包含额外的这里定义的“第二结构域”的相同“目的蛋 白” / “第一结构域”相比具有更长的体内和/或体外半衰期和稳定性。用在本文时,术语“结构域”指能够自主地采取特异结构和/或功能的任何氨基酸 序列区域/部分。相应地,在本发明上下文中,“结构域”可以代表功能性结构域或结构性结 构域。如本文所述,本发明的蛋白包含至少一个具有和/或介导生物学活性的结构域/部 分以及至少一个形成无规卷曲构象的结构域/部分。然而,本发明的蛋白还可以由两个以 上的结构域组成,并且在本文所定义的两结构域/部分之间可以包含例如其它连接分子结 构或另一结构域/部分,如蛋白酶敏感的切割位点、诸如His6标签或Strep标签的亲和标 签、信号肽、保留肽(retention ρ印tide)、靶向肽如膜转位肽,或其它的效应子结构域,如 与抗肿瘤毒素结合的用于肿瘤靶向的抗体片段或者用于前药活化的酶等。确定氨基酸聚合物是否形成/采取无规卷曲构象的方法在本领域是已知的 (Cantor (1980)上文引用;Creighton (1993)上文引用;Smith (1996)上述引文)。这类方法 包括如下文举例说明的圆二色性(CD)光谱法。CD光谱法代表了光吸收光谱法,其中测量物 质吸收右和左旋圆偏振光的差异。可采用波长在约190和250nm之间的远紫外光谱通过CD 光谱法确定蛋白的二级结构。在这些波长,由于α-螺旋、平行和反平行β-折叠以及无规 卷曲构象各自产生特征性形状和数值的CD光谱,可以分析多肽中常见的不同二级结构。因 此,通过⑶光谱测定法,技术人员能够容易地确定氨基酸聚合物是否在生理条件下形成/ 采取无规卷曲构象。其它成熟的生物物理方法包括核磁共振(NMR)光谱法、吸收光谱测定 法、红外和拉曼光谱测定法、通过大小排阻层析法测量流体力学体积、分析超速离心或动态 /静态光散射,以及测量摩擦系数或特性粘度(Cantor (1980)上文引用;Creighton(1993) 上文引用;Smith (1996)上文引用)。在另一实施方案中,通过分析凝胶过滤(也称为大小排阻层析,SEC)确定,本发 明的生物学活性蛋白具有至少70kDa、优选至少80kDa、更优选至少90kDa、甚至更优选至少 lOOkDa、特别优选至少125kDa以及最优选至少150kDa的流体力学体积。本领域技术人员 能够容易地确定特定蛋白的流体力学体积。这类方法可以包括如下文举例说明的动态/静 态光散射、分析超速离心或分析凝胶过滤。分析凝胶过滤代表了本领域中测量高分子的流
7体力学体积的已知方法。可选择地,球状多肽的流体力学体积可通过其分子量估计。但是, 如下文所述,与根据分子量估计的相应折叠、球状蛋白的流体力学体积相比,包含以上定义 的第二结构域(即包含至少100个氨基酸残基且具有无规卷曲构象的结构域)的本发明蛋 白的流体力学体积具有出人意料的高流体力学体积。除了上述方法,还描述了预测蛋白中二级结构的理论方法。这种理论方法的一个 ^J Chou-Fasman ^ (Chou and Fasman (1974) Biochemistry 13 222-245),
以X射线晶体学解析的已知蛋白结构中每种氨基酸在α-螺旋、β-折叠以及转角中的相 对频率的分析。但是,蛋白二级结构的理论预测已知是不可信的。如下文举例说明的,根据 Chou-Fasman法预期采取α-螺旋二级结构的氨基酸序列被发现形成了无规卷曲。因此,诸 如Chou-Fasman算法的理论方法对于指定氨基酸聚合物是否采取无规卷曲构象仅具有有 限的预测价值。在一个实施方案中,采取/具有/形成无规卷曲构象的氨基酸序列由至少约100 个氨基酸残基、优选至少约150个氨基酸残基、更优选至少约200个氨基酸残基、甚至更优 选至少约250个氨基酸残基、特别优选至少约300个氨基酸残基、更特别优选至少约350个 氨基酸残基、以及最优选至少约400个氨基酸残基组成。在另一实施方案中,形成无规卷曲 构象的氨基酸序列由最多约1000个氨基酸残基、优选最多约900个氨基酸残基、更优选最 多约800个氨基酸残基、甚至更优选最多约700个氨基酸残基、尤其优选最多约600个氨基 酸残基组成。因此,形成无规卷曲构象的氨基酸序列可以由最多约500个氨基酸残基或最 多约450个氨基酸残基组成。这里还设想形成无规卷曲构象的氨基酸序列可以由最多约 1200个、约1500个以及至多约3000个氨基酸残基组成。因此,形成无规卷曲构象的氨基酸 序列可以由约100个至约3000个氨基酸残基组成。在具体实施方案中,所述形成无规卷曲 构象的氨基酸序列由约100个至1000个本文描述的氨基酸残基组成,即如下定义的包含丙 氨酸、丝氨酸和脯氨酸作为主要或唯一的残基种类。因此,本发明的关键在于提供在生理条 件下形成无规卷曲构象并主要由这三种氨基酸残基组成的氨基酸聚合物,其中脯氨酸残基 占该无规卷曲形成结构域的优选约4%至约40%。丙氨酸和丝氨酸残基构成所述无规卷曲 形成结构域的剩余至少60%至96%。但是,如下文详述的,所述无规卷曲形成结构域还可 以包含不同于丙氨酸、丝氨酸和脯氨酸的其它氨基酸,即作为次要成分。用语“至少约100/150/200/250/300/300/350 (等)个氨基酸残基”并不限于所述 确切数量的氨基酸残基,而是还包含含有增加10%至20%残基或含有减少10%至20%残 基的氨基酸段。例如“至少约100个氨基酸残基”也可以包含80至100个以及约100至120 个氨基酸残基,而不脱离本发明的要点。优选地,本发明生物学活性蛋白/多肽的“第二结 构域”包含最长约1000个氨基酸残基。但是,在本发明上下文中还设想了更长的“第二结构 域”,即“第二结构域”在生理条件下提供所期望的无规卷曲构象并包含至多约3000个氨基 酸残基。还有,本文中用语“约”不限于或约束至确定量的氨基酸残基,而是还包含+/_约 10%或+/-约20%,而不脱离本发明。在本发明上下文中,令人惊讶地发现,主要由丙氨酸和丝氨酸残基组成的氨基酸 聚合物,或者在优选的实施方案中主要由丙氨酸、丝氨酸和脯氨酸残基组成的氨基酸聚合 物在生理条件下形成无规卷曲构象。因此,本发明提供了由丙氨酸、丝氨酸和脯氨酸组成的 模块/序列单元/聚合物重复/聚合物盒/构建板块,其可用作本文定义的生物学活性蛋白/多肽的“第二结构域”的一个或多个部分。然而,技术人员了解,当不同于丙氨酸、丝氨 酸和脯氨酸的其它残基作为次要成分包含进所述“第二结构域”中时,氨基酸聚合物也可以 形成无规卷曲构象。用在本文时,用语“次要组分”指最多10%,S卩100个氨基酸中最多10 个氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;优选最多8%,即100个氨基酸中最多8个 氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;更优选最多6%,即100个氨基酸中最多6个 氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;甚至更优选最多5%,即100个氨基酸中最多5 个氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;特别优选最多4%,即100个氨基酸中最多4 个氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;更特别优选最多3%,即100个氨基酸中最 多3个氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;甚至更特别优选最多2%,即100个氨 基酸中最多2个氨基酸可以不同于丙氨酸、丝氨酸和脯氨酸;以及最优选最多1%,即编码 该无规卷曲形成结构域的100个氨基酸中最多1个氨基酸可以不同于丙氨酸、丝氨酸和脯 氨酸。所述不同于丙氨酸、丝氨酸和脯氨酸的氨基酸可以选自Arg、Asn、ASp、CyS、Gln、Glu、 Gly、His、lie、Leu、Lys、Met、Phe、Thr、Trp、Tyr 禾口 Val。令人惊讶地发现,本文描述的并根据本发明由丙氨酸、丝氨酸和脯氨酸种类组成 的氨基酸聚合物在生理条件下采取无规卷曲构象。因此,它们为提供这里定义的发明所述 生物学活性蛋白/多肽的“第二结构域”的有利分子,即在生理条件下形成无规卷曲构象并 由此介导生物学活性(功能性)蛋白或多肽增加的体内和/或体外稳定性的多肽段。与 所述无规卷曲结构域融合的功能性蛋白的流体力学体积显著增加,这可通过采用本文提到 的标准方法来评估,并且也在所附实施例中有阐述。因为该无规卷曲结构域自身被认为不 会采取稳定结构或功能,所以与其融合的目的功能性蛋白所介导的生物学活性基本上保持 了。此外,本文所公开的形成无规卷曲结构域的氨基酸聚合物被认为是生物学惰性的,尤其 是就它们在血浆中的蛋白水解、免疫原性、等电点/静电行为、结合细胞表面受体以及内化 而言,但是仍然是可生物降解的,这相对于诸如PEG的合成聚合物提供了明显的优势。在另一实施方案中,在生理条件下采取无规卷曲构象的氨基酸聚合物包含多个 “氨基酸重复” / “氨基酸盒” / “盒式重复”,其中所述“氨基酸重复” / “氨基酸盒” / “盒式 重复”由Ala、Ser和Pro残基组成(本文中描述为“PAS”或“APS”),其中至多6个连续氨 基酸残基相同,且所述脯氨酸残基构成形成无规卷曲的所述第二结构域氨基酸的4%以上 和40%以下。在生理条件下采取无规卷曲构象的氨基酸聚合物可以包含多个相同氨基酸 重复/盒式重复或多个不同氨基酸重复。下文提供了由Ala、Ser和Pro残基组成的“氨基 酸重复”、“构件”、“模块”、“氨基酸盒”等的非限定性实例;参见SEQ ID N0:18、SEQ ID NO 20,SEQ ID NO 22,SEQ ID NO 24、SEQ ID NO :26 禾口 SEQ ID NO :28 或这些序列的片段或多 聚体。“片段”包含至少3个氨基酸且包含至少一个丙氨酸、一个丝氨酸和/或一个脯氨酸。根据本发明,氨基酸重复可以由至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30或更多个氨基酸残基组成,其中每一重复都包 含Ala、Ser和Pro残基。在一个实施方案中,根据本发明,所述氨基酸重复包含不超过100 个氨基酸残基。优选地,本文中定义的氨基酸重复/盒式重复包含约4%以上、优选约5%以 上、甚至更优选约6%以上、特别优选约8%以上、更特别优选约10%以上、甚至更特别优选 约15%以上以及最优选约20%以上的脯氨酸残基。本文定义的这种氨基酸重复/盒式重 复优选包含约40%以下或约35%以下的脯氨酸残基;还可以参见下文提供的PAS构建体。
在另一实施方案中,在生理条件下形成无规卷曲构象的氨基酸聚合物具有通式 ⑴SerJAlay SerJn其中根据式(I)的所述氨基酸聚合物如本文定义还包含脯氨酸残基,其中χ独立 地选自0至6的整数。另外,对于每一 n,y都独立地选自1至6的整数,每一 ζ都独立地选 自1至6的整数。最后,η为使得所述第二结构域由至少约100个氨基酸残基组成的任何整 数,尤其是由至少约100至约3000个氨基酸残基、优选至约2000个并更优选至约1000个 氨基酸残基组成的任何整数。在优选的实施方案中,包含以上定义的“氨基酸重复”/ “氨基酸盒”/ “盒式重复” 并形成无规卷曲构象的氨基酸聚合物包含至多5个相同的连续氨基酸残基、更优选至多4 个相同的连续氨基酸残基并最优选最多3个相同的连续氨基酸残基。如上文已经说明的,形成无规卷曲构象的本发明氨基酸聚合物包含脯氨酸残基, 其中所述脯氨酸残基占组成无规卷曲形成结构域的氨基酸的约4%以上,优选约5%以上, 甚至更优选约6%以上,特别优选约8%以上,更特别优选约10%以上,甚至更特别优选约 15%以上以及最优选约20%以上。形成无规卷曲构象的这种本发明氨基酸聚合物优选占组 成无规卷曲形成结构域的氨基酸的约40%以下,或约35%以下。如所附实施例13中所显 示的,具有较小比例Pro残基的PAS#1P2聚合物在其⑶光谱中200nm附近显示了较不明显 的最小值,表明本发明氨基酸聚合物的无规卷曲特征依赖于脯氨酸残基的含量。在另一优选实施方案中,包含以上定义的“氨基酸重复” / “氨基酸盒” / “盒式重 复”并形成无规卷曲构象的氨基酸聚合物在组成该无规卷曲形成结构域的氨基酸中包含约 4%以上但约50%以下、优选约10%以上但约50%以下且最优选约20%以上但约50%以下 的丙氨酸残基。在另一优选的实施方案中,包含以上定义的“氨基酸重复” / “氨基酸盒” / “盒式 重复”并形成无规卷曲构象的氨基酸聚合物在组成该无规卷曲形成结构域的氨基酸中包含 约4%以上但约50%以下、优选约10%以上但约50%以下且最优选约20%以上但约50% 以下的丝氨酸残基。因此,形成无规卷曲构象的氨基酸聚合物可以在组成该无规卷曲形成结构域的氨 基酸中包含约35%脯氨酸残基、约50%丙氨酸残基和约15%丝氨酸残基。或者,形成无规 卷曲构象的氨基酸聚合物可以在组成该无规卷曲形成结构域的氨基酸中包含约35%脯氨 酸残基、约15%丙氨酸残基和约50%丝氨酸残基。用在本文时,用语“约”还指给定百分比 的精确值。本文还描述了包含选自下述氨基酸序列的氨基酸聚合物 AAAASSASSASSSSSAAASA(piSA ;SEQ ID NO 2)AASAAASSAAASAAAASASS (SEQ ID NO: 4),ASASASASASASSAASAASA(SEQ ID NO :6),SAASSSASSSSAASSASAAA (SEQ ID NO 8), SSSSAASAASAAAAASSSAS(SEQ ID NO 10),SSASSSAASSSASSSSASAA(SEQ ID NO: 12), SASASASASASAASSASSAS (SEQ ID NO 14)和 ASSAAASAAAASSAASASSS (SEQ ID NO: 16)。如果 如上文所定义,在所得到的氨基酸序列中还包含脯氨酸残基,则所述丙氨酸_丝氨酸模块/ 序列单元的多聚体可以形成无规卷曲构象。这些示例性模块/序列单元可以由包含以下序 列的核酸分子编码
GCCGCTGCTGCATCCTCTGCAAGCTCCGCTTCTTCCTCTAGCTCCGCAGCTGCATCTGCT (SEQ ID NO 1),GCTGCTTCCGCTGCTGCTTCCTCCGCTGCTGCTTCCGCTGCTGCTGCTTCCGCTTCCTCC(SEQ ID NO 3),GCTTCCGCTTCCGCTTCCGCTTCCGCTTCCGCTTCCTCCGCTGCTTCCGCTGCTTCCGCT(SEQIDN0 5),TCCGCTGCTTCCTCCTCCGCTTCCTCCTCCTCCGCTGCTTCCTCCGCTTCCGCTGCTGCT(SEQ ID NO 7),TCCTCCTCCTCCGCTGCTTCCGCTGCTTCCGCTGCTGCTGCTGCTTCCTCCTCCGCTTCC(SEQ ID NO 9),TCCTCCGCTTCCTCCTCCGCTGCTTCCTCCTCCGCTTCCTCCTCCTCCGCTTCCGCTGCT(SEQ ID NO 11),TCCGCTTCCGCTTCCGCTTCCGCTTCCGCTTCCGCTGCTTCCTCCGCTTCCTCCGCTTCC(SEQ ID NO: 13)以及GCTTCCTCCGCTGCTGCTTCCGCTGCTGCTGCTTCCTCCGCTGCTTCCGCTTCCTCCTCC(SEQ ID NO :15)。在优选的实施方案中,形成无规卷曲构象的氨基酸聚合物包含选自下述的氨基 酸序列ASPAAPAPASPAAPAPSAPA(PAS#1 ;SEQ ID NO 18), AAPASPAPAAPSAPAPAAPS(PAS#2 ; SEQ ID NO: 20),SAPSSPSPSAPSSPSPASPS (修饰的 PAS#3 ;修饰的 SEQ ID NO 22), APSSPSPSAPSSPSPASPSS (PAS#3,SEQ ID No. 22,未修饰的)。在备选方案中,稍稍改动, 但依然有活性的PAS#3可以具有以上列出的序列SAPSSPSPSAPSSPSPASPS (SEQ ID NO 63)。该序列对应这里提供的SEQID No. 22的循环重排列的形式,其中最后的丝氨酸被 移除,添加了另一丝氨酸作为起始氨基酸。结果,本发明的这一修饰的序列的多聚体具 有与未改动序列的多聚体基本上相同的内部重复单元,除了第一个和最后一个残基。因 此,这种修饰的PAS#3(SEQ ID NO :63)可以被认为是文中提供的本发明氨基酸聚合物的 另外的“模块” / “构件”的实例。本领域技术人员清楚的是,这里提供的氨基酸聚合物的 其它“模块”和(较短)片段或循环重排列的形式也可以用作提供的生物学活性蛋白的 文中定义的“第二结构域”的“模块”、“重复”和/或构件。然而,形成无规卷曲构象的其 它和阐述性氨基酸聚合物可以包含选自SSPSAPSPSSPASPSPSSPA(PAS#4 ;SEQ ID NO 24), AASPAAPSAPPAAASPAAPSAPPA(PAS#5 ; SEQ ID NO 26)和 ASAAAPAAASAAASAPSAAA(PAS#1P2 ; SEQ ID NO 28)的氨基酸序列。还有,这些序列和上文提供的序列的片段或多聚体或循环 重排列形式在本发明情境中可以作为本发明生物学活性蛋白/多肽的文中定义的“第二结 构域”的构件。本领域技术人员能够容易地生成在生理条件下形成无规卷曲构象并如本文 所定义主要由丙氨酸、丝氨酸和脯氨酸构成的其它氨基酸聚合物。可用作本发明生物学活 性蛋白/多肽的本文定义“第二结构域”的构件的无规构象形成氨基酸聚合物的这类其它 和进一步的实例可以包含以上显示的具体“构件”、“聚合物盒”或“聚合物重复”的组合和/ 或片段或循环重排列形式,等等。因此,所述无规卷曲结构域的示例性模块/序列单元/聚 合物重复/聚合物盒也可以提供单独片段,所述单独片段可以重组组合以形成本发明的其 它模块/序列单元/聚合物重复/聚合物盒。术语“模块”、“序列单元”、“聚合物重复”、“聚合物盒”和“构件”在本文中作为同 义词使用,指可以用于形成本发明生物学活性蛋白/多肽的本文定义的“第二结构域”的各 氨基酸段。所述第二结构域包含由至少约100个氨基酸残基组成并在生理条件下形成无规 卷曲构象的氨基酸序列。以上举例说明的本发明生物学活性蛋白/多肽的无规卷曲结构域(即所述生物学 活性蛋白/多肽的本文定义的“第二结构域”)的模块/序列单元/聚合物重复/聚合物盒 /构件可以由包含以下序列的核酸分子编码
11
GCCTCTCCAGCTGCACCTGCTCCAGCAAGCCCTGCTGCACCAGCTCCGTCTGCTCCTGCT(SEQ ID NO 17),GCTGCTCCGGCTTCCCCGGCTCCGGCTGCTCCGTCCGCTCCGGCTCCGGCTGCTCCGTCC(SEQ ID NO 19),GCTC0GTCCTCCC0GTCCC0GTC0GCTC0GTCCTCCC0GTCCC0GGCTTCCC0GTCC-TCC(SEQ ID NO 21),TCCTCCCCGTCCGCTCCGTCCCCGTCCTCCCCGGCTTCCCCGTCCCCGTCCTCCCCGGCT(SEQ ID NO 23),GCCGCTTCTCCAGCAGCTCCTTCTGCTCCACCAGCAGCTGCAAGCCCTGCTGCACCAAGCGCACCTCCT GCT(SEQ ID NO 25)和 / 或 GCCTCTGCTGCAGCACCTGCAGCAGCAAGCGCAGCTGCATCTGCTCCATCTGC AGCTGCT(SEQ ID NO 27)。如上文描述的经修饰的PAS#3 GfWWSEQ ID NO 22)可以由以下核酸序列编码 TCCGCTCCGTCCTCCCCGTCCCCGTCCGCTCCGTCCTCCCCGTCCCCGGCTTCCCCGTCC GfWWSEQ ID NO 21)。对本发明而言值得注意且非限定性的是,按照技术人员的理解,根据简并性遗传 密码,即不同的核苷酸三联体密码子可以编码相同的氨基酸残基,这里描述并举例说明的 无规卷曲结构域的模块/序列单元/聚合物重复/聚合物盒/构件(或其片段或多聚体或 其循环重排列形式)可以由不同核酸序列编码。另外,取决于本发明核苷酸序列盒的设计 和用于获得其多聚体的连接策略,末端残基可以不同。例如,SEQ ID NO :18和30中显示的 “模块”PAS#1可以分别由核酸序列SEQ ID NO 17和29编码。与SEQ ID NO 18不同,SEQ ID NO :30在C末端包含了额外的丙氨酸,如果各个核苷酸序列盒如所附实施例中所描述的 通过粘末端连接则其密码子可以删除。根据上文,形成无规卷曲构象的氨基酸聚合物可以包含由具有上文公开的SEQ ID NO :18、20、22、24、26或28的氨基酸序列中任一种组成的多聚体,或者包含由氨基酸序列 SEQ ID N0:18、20、22、24、26和28中的一种以上组成的多聚体。另外,也设想了这些示例 性序列的片段或循环重排列形式用于构建本发明生物学活性蛋白/多肽的无规卷曲结构 域(“第二结构域”)的其它模块/序列单元/聚合物重复/聚合物盒/构件。在另一实施方案中,形成无规卷曲构象的氨基酸聚合物可以包含由选自 ASPAAPAPASPAAPAPSAPA (SEQ ID NO 18)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO :20)、 APSSPSPSAPSSPSPASPSS (SEQ ID NO :22 或作为修饰的序列 S-APSSPSPSAPSSPSPASPS (SEQ ID NO :63)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO :24)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO: 26)和ASAAAPAAASAAASAPSAAA(SEQ ID NO 28)的氨基酸序列的(循环)重排列组成的多 聚体,或者这些(循环)重排列序列的多聚体。在另一实施方案中,形成无规卷曲构象的氨基酸聚合物可以包含由选自 ASPAAPAPASPAAPAPSAPA(SEQ ID NO 18)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO :20)、 APSSPSPSAPSSPSPASPSS (SEQ ID NO 22 ;或作为修饰的序列 S-APSSPSPSAPSSPSPASPS ((SEQ ID NO :63))、SSPSAPSPSSPASPSPSSPA(SEQ ID NO :24)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO 26)和ASAAAPAAASAAASAPSAAA(SEQ ID NO 28)的氨基酸序列的片段/部分组成的多聚 体,或者这些示例性模块/序列单元/聚合物重复/聚合物盒/建筑模块的多聚体。根据 本发明所使用的用于生成本发明生物学活性蛋白/多肽的“第二结构域”的这些序列的“片 段”可以由选自所述SEQ IDNOs :18、20、22、24、26和28的氨基酸序列中至少3个、优选至 少4个、更优选至少5个、甚至更优选至少6个、还更优选至少8个、特别优选至少10个、更 特别优选至少12个、甚至更特别优选至少14个、还更特别优选至少16个、以及最优选至少18个连续氨基酸组成。如上文所提及的,文中提供的无规卷曲结构域的模块/序列单元/构件等仅为在 生理条件下形成无规卷曲构象的本发明氨基酸聚合物的实例。根据本发明的要点,这些“模 块”、“序列单元”和/或“重复”包含以上确认的丙氨酸、丝氨酸和脯氨酸含量/份额。因 此,普通技术人员能够生成其它的这种本发明“模块”、“序列单元”和/或“重复”。例如,这 里确认的本发明“模块”、“序列单元”和/或“重复”的各个片段可以组合成其它的各个“模 块”、“序列单元”和/或“重复”,只要遵守以上确认的关于丙氨酸、丝氨酸和脯氨酸的总体分 布和含量规则。另外,这些“模块”、“序列单元”和/或“重复”也可以包含其它氨基酸残基, 但是仅作为最少的或次要的组分(最多占各个“模块”、“序列单元”和/或“重复”的10%, 优选最多2% )。根据本发明,所述各个“模块”、“序列单元”和/或“重复”由至少100个 氨基酸残基组成。各个“模块”、“序列单元”和/或“重复”可以组合以形成更长的无规卷 曲形成氨基酸聚合物,由此生物学活性蛋白的本文定义“第二结构域”的最大长度为约3000 个氨基酸。在本发明上下文中,生物学活性蛋白优选包含至少两个结构域,其中所述至少两 个结构域的上文定义第一结构域包含具有和/或介导所述生物学活性的氨基酸序列;本文 定义的所述至少两个结构域的第二结构域包含由优选至少约100个氨基酸残基组成并在 生理条件下形成无规卷曲构象的氨基酸序列。本文所定义并主要由丙氨酸、丝氨酸和脯氨 酸组成的所述无规卷曲构象介导了所述生物学活性蛋白的增加的体内和/或体外稳定性。 所述第二结构域可以由本文提供的各个“模块”、“序列单元”和/或“重复”构成,或者可以 包含这些单独的示例性“模块”、“序列单元”和/或“重复”的片段或部分。但是,所述第二 结构域可以由其它单个“模块”、“序列单元”、“构件”和/或“重复”构建,它们遵守和遵循本 文提供的教导,并且在以下的说明书和所附实施例中有举例说明。例如,所附的实验部分显 示了充分证据,说明与未修饰的生物学活性蛋白相比,包含在生理条件下提供无规卷曲构 象的本文定义的额外“第二结构域”(例如由约200或约400或约600个氨基酸残基组成并 包含 PAS#1/SEQ IDNO. 18、PAS#2/SEQ ID No. 20、PAS#3/SEQ ID N022、PAS#5/SEQ ID NO. 26 和/或PAS#1P2/SEQ ID NO 28作为“构件”的聚合物)的蛋白具有有利的血清稳定性或血 浆半衰期,甚至在体内也是如此。作为本发明的非限定性实例,将未修饰的IFNa2b的体内 稳定性与经修饰IFNa2b的体内稳定性进行比较,所述经修饰IFNa2b包含在生理条件下采 取无规卷曲构象的额外的本文定义“第二结构域”。大多数氨基酸,尤其是疏水氨基酸的同聚物,通常在水溶液中是不溶的 (Bamford(1956)Synthetic Polypeptides-Preparation, Structure, andProperties,2nd ed. ,Academic Press, New York)。几种亲水氨基酸的同聚物已知形成二级结构,例如对 于 Ala 为 α -螺旋(Shental-Bechor (2005) BiophysJ 88 2391-2402),对于 Ser 为 β -折 叠(Quadrifoglio (1968) J Am Chem Soc90 :2760_2765),而最坚硬的同聚寡肽聚脯氨酸 (Schimmel (1967)Proc NatlAcad Sci USA 58:52-59)则在水溶液中形成 II 型反式螺旋 (Cowan (1955) Nature 176:501-503)。采用聚合物生物物理学理论原则,例如对于聚甘氨酸,200个氨基酸残基链 的无规卷曲直径总计约75 a-计算为末端距离的平均均方根
权利要求
包含至少两个结构域的生物学活性蛋白,其中(a)所述至少两个结构域的第一结构域包含具有和/或介导所述生物学活性的氨基酸序列;以及(b)所述至少两个结构域的第二结构域包含形成无规卷曲构象的优选由至少约100个氨基酸残基组成的氨基酸序列,其中所述无规卷曲构象介导所述生物学活性蛋白体内和/或体外稳定性的增加。
2.如权利要求1所述的生物学活性蛋白,其中所述形成无规卷曲构象的第二结构域由 丙氨酸、丝氨酸和脯氨酸残基组成。
3.如权利要求1或2所述的生物学活性蛋白,其中所述形成无规卷曲构象的第二结构 域包含多个氨基酸重复,其中所述重复由Ala、Ser和Pro残基组成,并且不超过6个连续氨 基酸残基是相同的。
4.如权利要求1至3中任一项所述的生物学活性蛋白,其中所述脯氨酸残基占所述形 成无规卷曲构象的第二结构域的氨基酸的4%至40%。
5.如权利要求1至4中任一项所述的生物学活性蛋白,其中第二结构域包含选自下述 的氨基酸序列ASPAAPAPASPAAPAPSAPA(SEQ ID NO 18);AAPASPAPAAPSAPAPAAPS(SEQ ID NO 20);APSSPSPSAPSSPSPASPSS(SEQ ID NO 22),SAPSSPSPSAPSSPSPASPS(SEQ ID NO 63),SSPSAPSPSSPASPSPSSPA(SEQ ID NO 24),AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO 26)以及ASAAAPAAASAAASAPSAAA (SEQ ID NO :28),或者这些序列的整体或部分的循环重排列形 式或多聚体。
6.如权利要求1至5中任一项所述的生物学活性蛋白,其中所述至少两个结构域的所 述第二结构域包含形成无规卷曲构象的由约100至3000个氨基酸残基组成的氨基酸序列。
7.如权利要求1至6中任一项所述的生物学活性蛋白,其中所述具有生物学活性的多 肽选自结合分子、抗体片段、细胞因子、生长因子、激素或酶。
8.如权利要求7所述的生物学活性蛋白,其中所述结合分子选自抗体、Fab片段、 F(ab' )2片段、⑶R衍生的拟肽类、单链可变片段(scFv)、凝集素类和脂质运载蛋白类。
9.如权利要求1至8中任一项所述的生物学活性蛋白,其中所述具有生物学活性的多 肽选自粒细胞集落刺激因子、人生长激素、α -干扰素、β -干扰素、γ -干扰素、肿瘤坏死因 子、红细胞生成素、凝血因子VIII、gpl20/gpl60、可溶性肿瘤坏死因子I和II受体、瑞替普 酶、exendin-4、阿那白滞素、白介素-2和嗜中性粒细胞明胶酶相关脂质运载蛋白。
10.如权利要求1至9中任一项所述的生物学活性蛋白,其中所述生物学活性蛋白的所 述增加的体内稳定性为,当与缺乏所述无规卷曲形成第二结构域的所述生物学活性蛋白相 比时,包含所述无规卷曲形成第二结构域的所述生物学活性蛋白的延长的血浆半衰期。
11.包含权利要求1至10中任一项所述的生物学活性蛋白的组合物。
12.如权利要求11所述的组合物,其为药物组合物,任选地还包含药物可接受的载体。
13.编码权利要求1至10中任一项所述的生物学活性蛋白的核酸分子。
14.包含权利要求13的核酸的载体。
15.包含权利要求13所述的核酸或权利要求14所述的载体的细胞。
16.制备权利要求1至10中任一项所述的生物学活性蛋白的方法,包括培养权利要求 15所述的细胞并从培养物中分离所述生物学活性蛋白。
17.权利要求1至10中任一项所述的生物学活性蛋白、权利要求13所述的核酸、权利 要求14所述的载体或权利要求15所述的细胞在制备具有所述生物学活性蛋白的增加的体 内和/或体外稳定性的药物中的用途,所述药物用于治疗激素缺陷相关病症、自身免疫疾 病、癌症、贫血症、新生血管性疾病、感染/炎性疾病、血栓形成、心肌梗死、糖尿病和再灌注 损伤或其它肾病。
18.权利要求1至10中任一项所述的生物学活性蛋白、权利要求13所述的核酸、权利 要求14所述的载体或权利要求15所述的细胞作为具有所述生物学活性蛋白的增加的体内 和/或体外稳定性的药物的用途。
19.试剂盒,其包含权利要求1至10中任一项所述的生物学活性蛋白、权利要求13所 述的核酸、权利要求14所述的载体或权利要求15所述的细胞。
全文摘要
本发明涉及包含至少两个结构域的生物学活性蛋白,其中所述至少两个结构域的第一结构域包含具有和/或介导所述生物学活性的氨基酸序列,所述至少两个结构域的第二结构域包含形成无规卷曲构象的由优选至少约100个氨基酸残基构成的氨基酸序列,其中所述无规卷曲构象介导了所述生物学活性蛋白增加的体内和/或体外稳定性。此外,还公开了编码本发明生物学活性蛋白的核酸分子以及包含所述核酸分子的载体和细胞。另外,本发明提供了包含本发明化合物的组合物以及本发明生物学活性蛋白、核酸分子、载体和细胞的具体用途。
文档编号C12N15/62GK101970678SQ200880019017
公开日2011年2月9日 申请日期2008年6月20日 优先权日2007年6月21日
发明者伊纳·希奥伯德, 阿恩·斯科拉, 马丁·斯拉珀斯其 申请人:慕尼黑科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1