使用寡糖基转移酶的多肽的糖缀合的制作方法

文档序号:3566148阅读:1221来源:国知局
专利名称:使用寡糖基转移酶的多肽的糖缀合的制作方法
使用寡糖基转移酶的多肽的糖缀合
与相关申请的交叉参照
本申请要求于2008年1月8日提交的美国临时专利申请号61/019,805的利益, 所述美国临时专利申请号的内容为了所有目的通过引用整体合并入本文。发明领域
本发明涉及通过糖基化的多肽修饰领域。特别地,本发明涉及使用短的酶识别的 N联糖基化序列制备糖基化多肽的方法。
发明背景
用于造成特定的生理学应答的糖基化和非糖基化多肽的施用是医学领域众所周 知的。例如,经纯化的和重组的人生长激素(hGH)用于治疗与hGH缺陷相关的病状和疾病, 例如儿童中的侏儒症。其他例子涉及具有已知的抗病毒活性的干扰素,以及刺激白血细胞 产生的粒细胞集落刺激因子(G-CSF)。
可以用于制造具有野生型糖基化模式的多肽的表达系统的缺乏已限制了此类多 肽作为治疗试剂的用途。本领域已知不适当或不完全糖基化的多肽可以是免疫原性,导致 肽的快速中和和/或变应性应答的发展。重组产生的糖肽的其他缺陷包括亚最佳的效力和 从血流中的快速清除。
解决糖基化多肽治疗剂产生中固有的问题的一种方法已在其表达后在体外修饰 多肽。多肽的表达后体外修饰已用于现有聚糖结构的修饰和糖基部分与非糖基化的氨基酸 残基的附着。重组真核生物糖基转移酶的广泛选择已变得可获得的,使得具有定制设计的 糖基化模式和糖基结构的哺乳动物糖缀合物的体外酶促合成成为可能。参见例如,美国专 利号 5,876,980 ;6,030,815 ;5, 728,554 ;5,922,577 ;以及 W0/9831826 ;US2003180835 ;和 WO 03/031464。
此外,糖肽已用一种或多种非糖修饰基团例如水溶性聚合物进行衍生。已与肽缀 合的示例性聚合物是聚(乙二醇)(“PEG”)。增加多肽的分子大小的PEG缀合已用于减少 免疫原性,并且延长PEG缀合的多肽的血液清除时间。例如,给予Davis等人的美国专利号 4,179,337公开了与聚乙二醇(PEG)或聚丙二醇(PPG)偶联的非免疫原性多肽,例如酶和多 肽-激素。
用于使PEG及其衍生物与多肽附着的主要方法涉及通过氨基酸残基的非特异性 键合(参见例如,美国专利号4,088,538美国专利号4,496,689、美国专利号4,414,147、美 国专利号4,055,635和PCT W087/00056)。PEG缀合的另一种方法涉及糖肽的糖基残基的 非特异性氧化(参见例如,WO 94/05332)。
在这些非特异性方法中,PEG以随机、非特异性方式加入多肽主链上的反应残基 中。这种方法具有明显缺点,包括最终产物的同质性的缺乏,和经修饰的多肽的生物学或酶 促活性减少的可能性。因此,高度需要用于治疗多肽的衍生方法,所述方法导致特异性标记 的、可容易表征和基本上同质的产物的形成。
特异性修饰的、同质的多肽治疗剂可以通过使用酶在体外产生。与用于使修饰基团例如合成聚合物与多肽附着的非特异性方法不同,基于酶的合成具有区域选择性和立体 选择性的优点。用于在经标记的多肽的合成中使用的2个主要类别的酶是糖基转移酶(例 如,唾液酸转移酶、寡糖基转移酶、N-乙酰葡糖氨基转移酶)和糖苷酶。这些酶可以用于糖 的特异性附着,所述糖随后可以经改变以包括修饰基团。备选地,糖基转移酶和经修饰的糖 苷酶可以用于将经修饰的糖直接转移给多肽主链(参见例如,美国专利6,399,336以及美 国专利申请公开 20030040037、20040132640、20040137557、20040126838 和 20040142856, 其各自通过引用合并入本文)。使化学和酶促方法相组合的方法也是已知的(参见例如, Yamamoto 等人,Carbohydr. Res. 305 :415-422(1998)和美国专利申请公开 20040137557,其 通过引用合并入本文)。
碳水化合物以几种方法与糖肽附着,其中N联至天冬酰胺和0联至丝氨酸和苏氨 酸是对于重组糖蛋白治疗剂最相关的。
并非所有多肽都包括糖基化序列作为其氨基酸序列的部分。此外,现有的糖基化 序列可能不适合于附着修饰基团。此类修饰可以例如引起经修饰的多肽的生物活性中不希 望有的降低。因此,本领域需要精确和可重现的糖基化和糖修饰方法。本发明解决了这些 和其他需要。
发明概述
本发明包括酶促糖缀合或糖基PEG化反应可以特异性靶向多肽内的特定N联糖基 化序列的发现。在一个例子中,通过突变将所靶向的糖基化序列引入亲本多肽(例如野生 型多肽)内,产生包括N联糖基化序列的突变体多肽,其中N联糖基化序列不存在于相对应 的亲本多肽(外源N联糖基化序列)中,或不存在于相同位置处。此类突变体多肽命名为 “序列子(sequon)多肽”。
在一个方面,本发明提供了包括至少一个外源N联糖基化序列的多肽和制备此类 多肽的方法。本发明还提供了序列子多肽的文库。在一个代表性实施方案中,文库包括多 个不同成员,其中文库的每个成员与共同的亲本多肽相对应,并且其中文库的每个成员包 括本发明的外源N联糖基化序列。还提供的是制备且使用此类文库的方法。
在一个实施方案中,每个N联糖基化序列是酶的底物,所述酶例如寡糖基转移酶, 例如本文描述的那些(例如,?818或乂〖3),所述酶可以将经修饰的或未经修饰的糖基部分 从糖基供体种类转移到N联糖基化序列的天冬酰胺残基上。因此,在另一个方面,本发明提 供了在糖基化多肽和修饰基团(例如,聚合修饰基团)之间的共价缀合物,其中多肽包括外 源N联糖基化序列。聚合修饰基团经由糖基连接基团在N联糖基化序列内的天冬酰胺残基 处与多肽缀合,所述糖基连接基团插入多肽和聚合修饰基团之间,并且与多肽和聚合修饰 基团共价连接,其中糖基连接基团是选自单糖和寡糖的成员。本发明进一步提供了包括本 发明的多肽缀合物的药物组合物。
在本发明的多肽中使用的示例性N联糖基化序列选自SEQ ID NO :1和SEQ ID NO: 2
X1NX2X3X4 (SEQ ID NO 1);禾口
X1DX2 ‘ NX2X3X4 (SEQ ID NO 2),
其中N是天冬酰胺;D是天冬氨酸;X3是选自苏氨酸⑴和丝氨酸⑶的成员;X1 存在或不存在,并且当存在时是氨基酸;X4存在或不存在,并且当存在时是氨基酸;并且X2
其中w是选自1至20的整数。在一个例子中,w选自1-8。整数ρ选自0和1。F 是脂质部分;Ζ*是选自单糖和寡糖的糖基部分;每个La是独立地选自单键、官能团、取代或 未取代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基、和 取代或未取代的杂环烷基的连接体部分;每个Rfk是独立地选择的修饰基团,例如本文描述 的线性或分支聚合修饰基团(例如,PEG) ;A1是选自P(磷)和C(碳)的成员;Y3是选自氧 (0)和硫(S)的成员;Y4是选自0、S、SR1、OR1、0Q、CR1R2和NR3R4的成员;E2、E3和E4是独立 地选自CR1! 2、0、S和NR3的成员;并且每个W是独立地选自SR1、OR1、0Q、NR3R4、取代或未取 代的烷基、取代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基、和取代 或未取代的杂环烷基的成员,其中每个Q是独立地选自H、单个负电荷和阳离子(例如,Na+ 或K+)的成员。每个R1、每个R2、每个R3和每个R4是独立地选自H、取代或未取代的烷基、取 代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基、和取代或未取代的杂 环烷基的成员。
本发明的另外方面、优点和目的由于下述详述将是显而易见的。
附图简述
图IA和

图1B(分别为SEQ ID NO 8禾口 SEQ ID NO 9)各自显示因子VIII的示例性氨基酸序列。
图2是示例性因子VIII氨基酸序列,其中B结构域(氨基酸残基741-1648)被去和X2'是独立地选择的氨基酸。在一个实施方案中,X2和X2'不是脯氨酸(P)。
本发明进一步提供了制备且使用多肽缀合物的方法。在一个例子中,使用无细胞 的体外方法形成在多肽和修饰基团(例如,聚合修饰基团)之间的多肽缀合物。多肽包括 包含天冬酰胺残基的本发明的N联糖基化序列。修饰基团经由糖基连接基团在天冬酰胺残 基处与多肽共价连接,所述糖基连接基团插入多肽和修饰基团之间,并且与多肽和修饰基 团共价连接。该方法包括在寡糖基转移酶的存在下,在足以使寡糖基转移酶将糖基部分从 糖基供体种类转移到N联糖基化序列的天冬酰胺残基上的条件下,使本发明的多肽和糖基 供体种类相接触。
形成多肽和修饰基团(例如,聚合修饰基团)之间的共价缀合物的另一个示例性 方法涉及多肽在其中表达的宿主细胞内的细胞内糖基化。该方法利用内源和/或共表达的 寡糖基转移酶。该方法包括在细胞内酶(例如,寡糖基转移酶)的存在下,在足以使酶将糖 基部分从糖基供体种类转移到N联糖基化序列的天冬酰胺残基上的条件下,使包括N联糖 基化序列的多肽(例如,本发明的多肽)和糖基供体种类相接触。在一个例子中,将糖基供 体种类加入细胞培养基中,被宿主细胞内在化,并且用作通过细胞内(内源或共表达)寡糖 基转移酶的底物。
在另一个方面,本发明提供了在本发明的方法中使用的糖基供体种类。示例性糖 基供体种类具有根据式(X)的结构
除(SEQ ID NO :3)。本发明的示例性多肽包括其中缺失的B结构域用至少一个氨基酸残基 替换的那些(B结构域替换序列)。在一个实施方案中,在Arg74°和Glu1649之间的B结构域 替换序列包括至少一个0联或N联糖基化序列。
图3是B结构域缺失的因子VIII的示例性氨基酸序列(SEQ IDNO 4)。
图4是B结构域缺失的因子VIII的示例性氨基酸序列(SEQ IDNO 5)。
图5B结构域缺失的因子VIII的示例性氨基酸序列(SEQ ID NO 6)。
图6是描述本发明的示例性实施方案的表,其中本发明的特定多肽与本发明的特 定N联糖基化序列结合使用。图6中的每行代表本发明的一个示例性实施方案,其中在多 肽的氨基酸序列内的所示位置处将N联糖基化序列引入多肽内。
发明详述
I.缩写
PEG,聚(乙二醇);m-PEG,甲氧基-聚(乙二醇);PPG,聚(丙二醇);m_PPG,甲氧 基-聚(丙二醇);Fuc,岩藻糖或岩藻糖基;foil,半乳糖或半乳糖基;GalNAc,N-乙酰半乳 糖胺或N-乙酰半乳糖胺基;Glc,葡萄糖或葡萄糖基;GlcNAc,N-乙酰葡糖胺或N-乙酰葡糖 胺基;Man,甘露糖或甘露糖基;ManAc,乙酸甘露糖胺或乙酸甘露糖胺基;Sia,唾液酸或唾 液酸基;和NeuAc,N-乙酰神经酰胺或N-乙酰神经酰胺基。
II.定义
除非另有说明,本文使用的所有技术和科学术语一般具有与本发明所属领域普通 技术人员通常理解相同的含义。一般地,本文使用的命名法以及细胞培养、分子遗传学、有 机化学和核酸化学和杂交中的实验室操作是本领域众所周知且通常采用的那些。标准技术 用于核酸和肽合成。技术和操作一般根据本领域的常规方法和各种一般参考文献来执行 (一般参见,Sambrook 等人Molecular Cloning :A Laboratory Maniml,第 2 版(1989) Cold Spring Harbor Laboratory Press, Cold SpringHarbor, N. Y.,其通过弓I用合并入本文), 所述参考文献在本文件自始至终提供。本文使用的命名法以及下文描述的分析化学和有机 合成化学的实验室操作是本领域众所周知且通常采用的那些。标准技术或其修饰用于化学 合成和化学分析。
本文描述的所有寡糖用关于非还原糖的名称或缩写(S卩,Gal)进行描述,随后为 糖苷键的构型(α或β )、环键(1或2)、键中涉及的还原糖的环位置0、3、4、6或8),并且 随后为还原糖的名称或缩写(即,GlcNAc)。每种糖优选是吡喃糖。关于标准糖生物学命名 法的综述,参见例如,Essentials of Glycobiology Varki 等人编辑 CSHL Press (1999)。 寡糖可以包括糖基模拟部分作为糖组分之一。寡糖被视为具有还原末端和非还原末端,糖 是否在还原末端处事实上是还原糖。
术语“糖基部分”意指衍生自糖残基的任何原子团。“糖基部分”包括单和寡糖并 且包括“糖基模拟部分”。
如本文所使用的,术语“糖基模拟部分”指在结构上与糖基部分(例如己糖或戊 糖)类似的部分。“糖基模拟部分”的例子包括这样的部分,其中糖基部分的糖苷氧或环氧 或两者已用键或另一个原子(例如,硫)或另一个部分(例如碳(例如,CH2)或含氮基团 (例如,NH))替换。例子包括取代或未取代的环己基衍生物、环硫醚、环仲胺、包括硫代糖苷 键的部分等。在一个例子中,“糖基模拟部分”在酶促催化的反应中转移到多肽的氨基酸残基或糖肽的糖基部分上。这可以例如通过用离去基团例如卤素激活“糖基模拟部分”来完 成。
术语“核酸”或“多核苷酸”指以单链或双链形式的脱氧核糖核酸(DNA)或核糖 核酸(RNA)及其聚合物。除非明确限制,否则该术语包括包含天然核苷酸的已知类似物的 核酸,所述天然核苷酸的已知类似物具有与参考核酸相似的结合性质,并且以与天然存在 的核苷酸相似的方式代谢。除非另有说明,否则特定核酸序列还暗示包括其保守修饰的变 体(例如简并密码子置换)、等位基因、直向同源物、SNP和互补序列以及明确指示的序列。 特别地,简并密码子置换可以通过产生这样的序列来达到,在所述序列中一个或多个所选 择的(或所有)密码子的第三个位置由混合碱基和/或脱氧肌苷残基置换(Batzer等人, Nucleic AcidRes. 19:5081(1991) ;Ohtsuka 等人,J. Biol. Chem. 260 :2605-2608 (1985);和 Rossolini 等人,Mol. Cell. Probes 8:91-98(1994))。术语核酸可与基因、cDNA 和由基因 编码的mRNA互换使用。
术语“基因”意指涉及产生多肽链的DNA区段。它可以包括在编码区前和后的区 域(前导区和尾部)以及个别编码区段(外显子)之间的间插序列(内含子)。
术语“经分离的”当应用于核酸或蛋白质时,指核酸或蛋白质基本上不含它在自然 状态下与之结合的其他细胞组分。它优选处于同质状态,尽管它可以在干燥或水溶液中。纯 度和同质性一般使用分析化学技术进行测定,所述分析化学技术例如聚丙烯酰胺凝胶电泳 或高效液相色谱法。其为制剂中存在的占优势种类的蛋白质或核酸是基本上纯化的。特别 地,经分离的基因与开放读码框分开,所述开放读码框侧接基因并且编码除目的基因外的 蛋白质。术语“经纯化的”指核酸或蛋白质在电泳凝胶中基本上产生一个条带。特别地,它 意指核酸或蛋白质是至少85%纯的,更优选至少95%纯的,并且最优选至少99%纯的。
术语“氨基酸”指天然存在的和合成氨基酸,以及以与天然存在的氨基酸相似的方 式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基 酸,以及随后被修饰的氨基酸,例如羟脯氨酸、Y-羧基谷氨酸和0-磷酸丝氨酸。氨基酸类 似物指这样的化合物,其具有与天然存在的氨基酸相同的基本化学结构,即与氢结合的α 碳、羧基、氨基和R基,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲锍。此类类似物 具有经修饰的R基(例如,正亮氨酸)或经修饰的肽主链,但保留与天然存在的氨基酸相同 的基本化学结构。“氨基酸模拟物”指这样的化学化合物,其具有与氨基酸的一般化学结构 不同的结构,但以与天然存在的氨基酸相似的方式起作用。
术语“不带电的氨基酸”指不包括酸性(例如,-C00H)或碱性(例如,-NH2)官能团 的氨基酸。碱性氨基酸包括赖氨酸(K)和精氨酸(R)。酸性氨基酸包括天冬氨酸(D)和谷 氨酸(E)。“不带电的氨基酸”包括例如甘氨酸(G)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、 苯丙氨酸(F),以及包括-0H、-SH或-SCH3基团的氨基酸(例如,苏氨酸(T)、丝氨酸(S)、酪 氨酸(Y)、半胱氨酸(C)和甲硫氨酸(M))。
存在允许以位点特异性方式将非天然氨基酸衍生物或类似物掺入多肽链内的本 领域已知的各种方法,参见例如,WO 02/086075。
氨基酸在本文中可以通过通常已知的三字母符号或通过由IUPAC-Ira Biochemical Nomenclature Commission推荐的单字母符号提及。同样地,核苷酸可以通过 其通常公认的单字母编码提及。
“保守修饰的变体”应用于氨基酸和核酸序列。就特定的核酸序列而言,“保守修 饰的变体”指编码等同或基本上等同的氨基酸序列的核酸,或当核酸不编码氨基酸序列时, 指基本上等同的序列。由于遗传密码的简并性,大量功能上等同的核酸编码任何给定蛋白 质。例如,密码子GCA、GCC、GCG和G⑶全都编码氨基酸丙氨酸。因此,在其中丙氨酸由密 码子指定的每个位置处,密码子可以改变为所述的任何相对应密码子而不改变所编码的多 肽。此类核酸变异是“沉默变异”,其为保守修饰的变体的一个种类。本文编码多肽的每一 个核酸序列也描述核酸的每一个可能的沉默变异。技术人员应认识到核酸中的每个密码子 (除AUG和TGG外,所述AUG通常为甲硫氨酸的唯一密码子,所述TGG通常为色氨酸的唯一 密码子)可以进行修饰,以产生功能上等同的分子。因此,编码多肽的核酸的每个沉默变异 在每个所述序列中暗示。
就氨基酸序列而言,技术人员应认识到关于核酸、肽、多肽或蛋白质序列的个别置 换、缺失或添加(其改变、添加或缺失编码序列中的单个氨基酸或小百分比的氨基酸)是 “保守修饰的变体”,其中改变导致氨基酸由化学上相似的氨基酸置换。提供功能上相似的 氨基酸的保守置换表是本领域众所周知的。此类保守修饰的变体附加于并且不排除本发明 的多态变体、种间同系物和等位基因。
下述8个组各自包含彼此为保守置换的氨基酸
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);
6)苯丙氨酸(F)、酪氨酸⑴、色氨酸(W);
7)丝氨酸(S)、苏氨酸(T);和
8)半胱氨酸(C)、甲硫氨酸(M)
(参见例如,Creighton, Proteins (1984))
“肽”指包括通过酰胺键连接在一起的衍生自氨基酸的单体。本发明的肽在大小方 面可以从例如2个氨基酸到数百或数千个氨基酸不等。较大的肽(例如至少10、至少20、至 少30或至少50个氨基酸残基)备选地称为“多肽”或“蛋白质”。另外,还包括非天然氨基 酸,例如β-丙氨酸、苯基甘氨酸、高精氨酸和高苯丙氨酸。非基因编码的氨基酸也可以在 本发明中使用。此外,已进行修饰以包括反应基团、糖基化序列、聚合物、治疗部分、生物分 子等的氨基酸也可以在本发明中使用。在本发明中使用的所有氨基酸都可以是D-或L-同 分异构体。L-同分异构体一般是优选的。此外,其他模拟肽在本发明中也是有用的。如本 文所使用的,“肽”或“多肽”指糖基化和非糖基化的肽或“多肽”。还包括的是通过表达多肽 的系统不完全糖基化的多肽。关于一般综述,参见Spatola,A.F.,inChemistry and Biochemistry ofAmino Acids,Peptides and Proteins'B· Weinstein,Marcel Dekker7NewYork,% 267 ]λΙ (1983)。 术语“多肽”还包括那种多肽的所有可能形式,例如突变形式(一个或多个突变)、截短形 式、延长形式、包括多肽的融合蛋白、加标记的多肽、变体,其中特定结构域被去除或部分去 除。术语“多肽”包括那种多肽的单体、寡聚物和聚合物。例如,术语“血管性血友病因子 (von Willebrand Factor) " (vffF)包括vWF的单体、二聚和寡聚形式。19
在本申请中,氨基酸残基根据其距离多肽的N末端氨基酸(例如,N末端甲硫氨 酸)的相对位置进行编号(一般为上标),所述N末端氨基酸编号为“1”。N末端氨基酸可 以是甲硫氨酸(M),编号为“1”。如果多肽的N末端不由甲硫氨酸开始,那么与每个氨基酸 残基相关的编号可以容易地进行调整,以反映N末端甲硫氨酸的不存在。应当理解示例性 多肽的N末端可以由或不由甲硫氨酸开始。
术语“亲本多肽”指这样的任何多肽,其具有不包括本发明的“外源”N联糖基化序 列的氨基酸序列。然而,“亲本多肽”可以包括一个或多个天然存在的(内源)N联糖基化序 列。例如,野生型多肽可以包括N联糖基化序列“NLT”。术语“亲本多肽”指任何多肽,包括 野生型多肽、融合多肽、合成多肽、重组多肽(例如,治疗多肽)以及其任何变体(例如,先 前通过氨基酸的一个或多个替换、氨基酸插入、氨基酸缺失等进行修饰的),只要此类修饰 不等于形成本发明的N联糖基化序列。在一个实施方案中,亲本多肽的氨基酸序列、或编码 亲本多肽的核酸序列是限定的且是以任何方式可公开获得的。例如,亲本多肽是野生型多 肽,并且野生型多肽的氨基酸序列或核苷酸序列是可公开获得的蛋白质数据库(例如,EMBL Nucleotide Sequence Database、NCBIEntrez、ExPasy、Protein Data Bank ^ ) ^^Pio 在另一个例子中,亲本多肽不是野生型多肽,但用作治疗多肽(即,经认可的药物),并且此 类多肽的序列可在科学出版物或专利中公开获得。在另外一个例子中,亲本多肽的氨基酸 序列或编码亲本多肽的核酸序列在本发明的时间处以任何方式是可公开获得的。在一个实 施方案中,亲本多肽是较大结构的部分。例如,亲本多肽与抗体的恒定区(F。)或(^2结构域 相对应,其中这些结构域可以是完整抗体的部分。在一个实施方案中,亲本多肽不是具有已 知序列的抗体。
术语“突变体多肽”或“多肽变体”指这样的多肽形式,其中它的氨基酸序列不同 于其相对应野生型形式、天然存在的形式或其他亲本形式的氨基酸序列。突变体多肽可以 包含一个或多个突变,例如替换、插入、缺失等,这导致突变体多肽。
术语“序列子多肽”指在其氨基酸序列中包括“外源N联糖基化序列”的多肽变体。 “序列子多肽”包含至少一个外源N联糖基化序列,还可以包括一个或多个内源(例如,天然 存在的)N联糖基化序列。
术语“外源N联糖基化序列”指引入亲本多肽(例如,野生型多肽)的氨基酸序列 内的N联糖基化序列,其中亲本多肽不包括N联糖基化序列,或包括在不同位置处的N联糖 基化序列。在一个例子中,将N联糖基化序列引入不具有N联糖基化序列的野生型多肽内。 在另一个例子中,野生型多肽天然地包括在第一个位置处的第一个N联糖基化序列。将第 二个N联糖基化在第二个位置处引入这个野生型多肽内。这种修饰导致在第二个位置处具 有“外源N联糖基化序列”的多肽。外源N联糖基化序列可以通过突变引入亲本多肽内。备 选地,具有外源N联糖基化序列的多肽可以通过化学合成进行制备。
术语“与亲本多肽相对应”(或这个术语的语法变异)用于描述本发明的序列子 多肽,其中序列子多肽的氨基酸序列仅由于本发明的至少一个外源N联糖基化序列的存在 而不同于相对应亲本多肽的氨基酸序列。一般地,序列子多肽和亲本多肽的氨基酸序列显 示高同一性百分比。在一个例子中,“与亲本多肽相对应”意指序列子多肽的氨基酸序列与 亲本多肽的氨基酸序列具有至少约50 %同一性,至少约60 %、至少约70 %、至少约80 %、至 少约90%、至少约95%或至少约98%同一性。在另一个例子中,编码序列子多肽的核酸序列与编码亲本多肽的核酸序列具有至少约50%同一性,至少约60%、至少约70%、至少约 80%、至少约90%、至少约95%或至少约98%同一性。。
术语“将糖基化序列(例如,N联糖基化序列)引入(或加入等)亲本多肽”(或 其语法变异)内,或“修饰亲本多肽”以包括糖基化序列(或其语法变异),不一定意指亲本 多肽是用于此类转变的物理原材料,而是意指亲本多肽提供用于制备另一个多肽的指导氨 基酸序列。在一个例子中,“将糖基化序列引入亲本多肽内”意指关于亲本多肽的基因通过 合适突变进行修饰,以产生编码序列子多肽的核苷酸序列。在另一个例子中,“将糖基化序 列引入亲本多肽内”意指所得到的多肽使用亲本多肽序列作为指导在理论上进行设计。所 设计的多肽随后可以通过化学或其他方式产生。
术语“引导多肽”指本发明的序列子多肽,其可以是例如通过本发明的方法有效糖 基化的和/或糖缀合的(例如,糖基PEG化的)。对于作为引导多肽合适的本发明的序列子 多肽,当实施合适的发育条件时,此类多肽优选是糖基化的或糖缀合的(例如,糖基PEG化 的),其中反应得率为至少约50 %,优选至少约60 %,更优选至少约70 %,并且更加优选约 80%、约85%、约90%或约95%。最优选的是这样的本发明的引导多肽,其可以是糖基化的 或糖缀合的(例如,糖基PEG化的),其中反应得率超过80 %、超过85 %、超过90 %、或超过 95%。在一个优选实施方案中,引导多肽是以这样的方式糖基化的或糖基PEG化的,使得每 个N联糖基化序列的仅一个氨基酸残基是糖基化的或糖缀合的(例如,糖基PEG化的)(单 糖基化)。在各种实施方案中,糖基化的或糖缀合的单个氨基酸残基位于外源N联糖基化序 列内。
术语“文库”指不同多肽的集合,文库的每个成员与共同的亲本多肽相对应。文库 中的每个多肽种类称为文库的“成员”。优选地,本发明的文库是具有足够数目和多样性的 多肽的集合,以提供从其中鉴定引导多肽的群体。文库包括至少2个不同多肽。在一个实 施方案中,文库包括约2至约10个成员。在另一个实施方案中,文库包括约10至约20个 成员。在另外一个实施方案中,文库包括约20至约30个成员。在一个进一步的实施方案 中,文库包括约30至约50个成员。在另一个实施方案中,文库包括约50至约100个成员。 在另外一个实施方案中,文库包括超过100个成员。文库的成员可以是混合物的部分或可 以彼此分离。在一个例子中,文库的成员是任选包括其他组分的混合物的部分。例如,至少 2个序列子多肽存在于大量细胞培养肉汤中。在另一个例子中,文库的成员可以各自分开表 达并且是任选分离的。经分离的序列子多肽可以任选包含在多孔容器中,其中每个孔包含 不同类型的序列子多肽。
术语本发明的“CH2”结构域意欲描述免疫球蛋白重链恒定Ch2结构域。在限定免 疫球蛋&CH2结构域中,参考一般而言的免疫球蛋白且特别参考如通过Kabat Ε. A. (1978) Adv. Protein Chem. 32 :1-75应用于人IgGl的免疫球蛋白的结构域结构。
术语“包括CH2结构域的多肽”或“包括至少一个CH2结构域的多肽”意欲包括完 整抗体分子、抗体片段(例如,Fc结构域)、或包括与免疫球蛋白的(^2区域等价的区域的 融合蛋白。
术语“多肽缀合物”指其中如本文所述多肽用糖部分(例如,经修饰的糖)进行糖 缀合的本发明的种类。在一个代表性例子中,多肽是具有外源0联糖基化序列的序列子多 肽。
如本文所使用的,“接近脯氨酸残基”或“与脯氨酸残基接近”指这样的氨基酸,其 远离脯氨酸残基小于约10个氨基酸,优选地,远离脯氨酸残基小于约9、8、7、6或5个氨基 酸,更优选地,远离脯氨酸残基小于约4、3或2个氨基酸。“接近脯氨酸残基”的氨基酸可以 在脯氨酸残基的C或N末端侧上。
术语“唾液酸”指九碳羧化糖家族的任何成员。唾液酸家族的最常见成员是N-乙 酰-神经氨酸(2-酮-5-乙酰胺-3,5-双脱氧-D-甘油-D-galactononulopyranos-Ι-酮酸 (通常缩写为Neu5AC、NeuAC或NANA)。该家族的第二个成员是N-羟乙酰-神经氨酸(Neu5Gc 或NeuGc),其中NeuAc的N-乙酰基是羟基化的。第三个唾液酸家族成员是2-酮-3-脱 氧-nonulosonic acid (KDN)(Nadano 等人(1986)J. Biol. Chem. 261 11550—11557 ; Kanamori 等人,J. Biol. Chem. 265 :21811-21819 (1990))。还包括的是 9-取代唾液酸例如 9-0-C「C6 酰基-Neu5Ac,如 9_0_ 乳酰-Neu5Ac 或 9_0_ 乙酰-Neu5Ac、9_ 脱氧-9-氟-Neu5Ac 和9-叠氮基-9-脱氧-Neu5Ac。关于唾液酸家族的综述,参见例如,Varki,Glycobiology 2 :25-40 (1992) ;Sialic Acids :Chemistry, Metabolism and Function, R. Schauer,编辑 (Springer-Verlag,New York(1992))。在唾液酸化操作中唾液酸化合物的合成和使用公开 于1992年10月1日公开的国际申请WO 92/16640中。
如本文所使用的,术语“经修饰的糖”指天然或非天然存在的碳水化合物。在一个 实施方案中,“经修饰的糖”使用本发明的方法酶促加入多肽的氨基酸或糖基残基上。经修 饰的糖选自许多酶底物,包括但不限于糖核苷酸(单、二和三磷酸盐)、活化糖(例如,糖基 卤化物、糖基甲磺酸盐)和既未活化也不是核苷酸的糖。“经修饰的糖”用“修饰基团”共价 官能化。有用的修饰基团包括但不限于,聚合修饰基团(例如,水溶性聚合物)、治疗部分、 诊断部分、生物分子等。在一个实施方案中,修饰基团不是天然存在的糖基部分(例如,天 然存在的多糖)。修饰基团优选是非天然存在的。在一个例子中,“非天然存在的修饰基团” 是聚合修饰基团,其中至少一个聚合部分是非天然存在的。在另一个例子中,非天然存在的 修饰基团是经修饰的碳水化合物。用修饰基团官能化的部位这样进行选择,使得它不阻止 “经修饰的糖”酶促加入多肽。“经修饰的糖”也指任何糖基模拟部分,其用修饰基团官能化, 并且是天然或经修饰的酶例如糖基转移酶的底物。
如本文所使用的,术语“聚合修饰基团”是包括至少一个聚合部分(聚合物)的修 饰基团。在一个例子中,当加入多肽时,聚合修饰基团可以改变此类多肽的至少一种生物学 性质,例如它的生物利用度、生物活性、它的体内半衰期或免疫原性。示例性聚合物包括水 溶性和水不溶性聚合物。聚合修饰基团可以是线性或分支的,并且可以包括一个或多个独 立选择的聚合部分,例如聚(亚烷基二醇)及其衍生物。在一个例子中,聚合物是非天然存 在的。在一个示例性实施方案中,聚合修饰基团包括水溶性聚合物,例如聚(乙二醇)及其 衍生物(PEG,m-PEG)、聚(丙二醇)及其衍生物(PPG,m_PPG)等。在一个优选实施方案中, 聚(乙二醇)或聚(丙二醇)具有基本上均勻分散的分子量。在一个实施方案中,聚合修 饰基团是天然存在或非天然存在的多糖(例如,多唾液酸)。
术语“水溶性的”指在水中具有一定可检测程度的溶解性的部分。检测和/或定 量水溶性的方法是本领域众所周知的。示例性水溶性聚合物包括肽、寡糖和多糖、聚(醚)、 聚(胺)、聚(羧酸)等。肽可以具有混合序列或可以由单一氨基酸组成[聚(氨基酸), 例如聚(赖氨酸)]。示例性多糖是多(唾液酸)。示例性聚(醚)是聚(乙二醇),例如,m-PEG。聚(乙烯亚胺)是示例性聚胺,并且聚(丙烯)酸是代表性聚(羧酸)。
水溶性聚合物的聚合物主链可以是聚(乙二醇)(S卩,PEG)。然而,应当理解其他 相关聚合物也适合于在本发明的实践中使用,并且术语PEG或聚(乙二醇)的使用在这方 面意欲是包括的而不是排除的。术语PEG包括以其任何形式的聚(乙二醇),包括烷氧基 PEG、双功能PEG、多臂PEG、叉状PEG、分支PEG、悬垂PEG (即,具有与聚合物主链悬垂的一个 或多个官能团的PEG或相关聚合物)、或其中具有可降解连接的PEG。同样地,术语聚(环 氧烷)意欲包括此类材料的所有形式,并且包括掺入超过一个类型的聚(环氧烷)的材料, 例如PEG和PPG的组合。
聚合物主链可以是线性或分支的。分支聚合物主链是本领域一般已知的。一般 地,分支聚合物具有中心分支核心部分和与中心分支核心连接的多条线性聚合物链。PEG通 常以分支形式使用,其可以通过将环氧乙烷加入各种多元醇中进行制备,所述多元醇例如 甘油、季戊四醇和山梨糖醇。中心分支部分也可以衍生自几种氨基酸,例如赖氨酸或半胱氨 酸。在一个例子中,分支聚(乙二醇)可以以一般形式表示为R(-PEG-0H)m,其中R表示核心 部分,例如甘油或季戊四醇,并且m表示臂的数目。多臂PEG分子例如美国专利号5,932,462 中描述的那些也可以用作聚合物主链,所述专利通过引用整体合并入本文。
许多其他聚合物也适合于本发明。非肽和水溶性的聚合物主链在本发明中特别有 用。合适的聚合物的例子包括但不限于,其他聚(亚烷基二醇),例如聚(丙二醇)(“PPG”)、 乙二醇和丙二醇的共聚物等、聚(氧乙基化多元醇)、聚(烯属醇)、聚(乙烯吡咯烷酮)、 聚(羟丙基甲基丙烯酰胺)、聚(α-羟酸)、聚(乙烯醇)、聚膦腈、聚噁唑啉、聚(N-丙酰基 吗啉),例如通过引用整体合并入本文的美国专利号5,629,384中描述的,以及其共聚物、 三聚物和混合物。尽管聚合物主链的每条链的分子量可以改变,但它一般为约IOODa至约 100,OOODa,通常约 5,OOODa 至约 80,OOODa0
如本文所使用的,术语“糖缀合”指酶促介导的经修饰的糖种类与多肽的氨基酸或 糖基残基的缀合,所述多肽例如本发明的突变型人生长激素。在一个例子中,经修饰的糖与 一个或多个修饰基团共价附着。“糖缀合”的亚属是“二醇glycol-PEG化”或“糖基PEG化”, 其中经修饰的糖的修饰基团是聚(乙二醇)或其衍生物,例如烷基衍生物(例如,m-PEG)或 具有反应性官能团的衍生物(例如,H2N-PEG, H00C-PEG)。
术语“大规模”和“工业规模”可互换使用,并且指这样的反应循环,其在单个反应 循环完成时产生至少约250mg、优选至少约500mg、和更优选至少约1克糖缀合物。
术语“N联糖基化序列”或“序列子”指包括至少一个天冬酰胺(N)残基的任何氨 基酸序列(例如包含约3至约9个氨基酸、优选约3至约6个氨基酸)。在一个实施方案 中,N联糖基化序列是酶例如寡糖基转移酶的底物,优选当多肽的氨基酸序列的部分时。在 一个一般的实施方案中,酶通过修饰上述天冬酰胺残基的氨基将糖基部分转移到N联糖基 化序列上,所述天冬酰胺残基被称为“糖基化位点”。本发明区分在野生型多肽或其任何其 他亲本形式中天然存在的N联糖基化序列(内源N联糖基化序列)和“外源N联糖基化序 列”。包括外源N联糖基化序列的多肽被称为“序列子多肽”。亲本多肽的氨基酸序列可以 通过重组技术、化学合成或其他方式进行修饰,以包括外源N联糖基化序列。
如本文所使用的,术语“糖基连接基团”指修饰基团(例如,PEG部分、治疗部分、 生物分子)与之共价附着的糖基残基;所述糖基连接基团使修饰基团与缀合物的其余部分连接。在本发明的方法中,“糖基连接基团”变得与糖基化或未糖基化的多肽共价附着,从 而使修饰基团与多肽的氨基酸和/或糖基残基连接。“糖基连接基团” 一般通过“经修饰的 糖”与多肽的氨基酸和/或糖基残基的酶促附着而衍生自“经修饰的糖”。糖基连接基团可 以是糖衍生的结构,其在修饰基团-经修饰的糖盒形成过程中降解(例如,氧化一希夫碱形 成一还原),或糖基连接基团可以是“完整的糖基连接基团”。“糖基连接基团”可以包括糖 基模拟部分。例如,用于将经修饰的糖加入糖基化多肽中的糖基转移酶(例如,唾液酸转移 酶)显示出对于糖基模拟底物的耐受性(例如,其中糖部分是糖基模拟部分例如唾液酸模 拟部分的经修饰的糖)。经修饰的糖基模拟糖的转移导致具有糖基连接基团的缀合物,所述 糖基连接基团为糖基模拟部分。
术语“完整的糖基连接基团”指衍生自糖基部分的糖基连接基团,其中使修饰基团 与缀合物的其余部分连接的糖单体未降解,例如使用的酶促氧化。例如,环结构通过经由高 碘酸钠氧化而打开,或其中。本发明的示例性“完整的糖基连接基团”是唾液酸部分,其中 C-6 侧链是完整的(choh-choh-ch2oh)。
如本文所使用的,术语“靶向部分”指将选择性定位在身体的特定组织或区域中 的种类。定位通过分子决定簇的特异性识别、靶向试剂或缀合物的分子大小、离子相互作 用、疏水性相互作用等介导。使试剂靶向特定组织或区域的其他机制是本领域技术人员已 知的。示例性靶向部分包括抗体、抗体片段、转铁蛋白、HS-糖蛋白、凝血因子、血清蛋白质、 β _ 糖蛋白、G-CSF、GM-CSF、M-CSF, EPO 等。
术语“连接基团”是使2个部分连接的任何化学基团。在一个例子中,连接基团包 括至少一个杂原子。示例性连接基团包括醚、硫醚、胺、甲酰胺、磺胺、胼、羰基、氨基甲酸盐、 尿素、硫脲、酯和碳酸酯。
如本文所使用的,“治疗部分”指对于治疗有用的任何试剂,包括但不限于抗生素、 抗炎剂、抗肿瘤药物、细胞毒素和放射性试剂。“治疗部分”包括生物活性试剂的药物前体、 其中超过一个治疗部分与载体结合的构建体,例如多价试剂。治疗部分还包括蛋白质和包 括蛋白质的构建体。示例性蛋白质包括但不限于,促红细胞生成素(EPO)、粒细胞集落刺激 因子(GCSF)、粒细胞巨噬细胞集落刺激因子(GMCSF)、干扰素(例如,干扰素-α、-β、-Y)、 白介素(例如,白介素II)、血清蛋白质(例如,因子VII、Vila、VIII、IX和X)、人绒毛膜促 性腺素(HCG)、促卵泡激素(FSH)和促黄体激素(LH)和抗体融合蛋白(例如肿瘤坏死因子 受体((TNFR)/Fe结构域融合蛋白))。
如本文所使用的,“抗肿瘤药物”意指对抗癌症有用的任何试剂,包括但不限于细 胞毒素和试剂例如抗代谢药、烷化剂、蒽环类、抗生素、抗有丝分裂药、丙卡巴胼、羟基脲、天 冬酰胺酶、皮质类固醇、干扰素和放射性试剂。在术语“抗肿瘤药物”的范围内还包括的是 具有抗肿瘤活性的多肽例如TNF-α的缀合物。缀合物包括但不限于在治疗蛋白质和本发 明的糖蛋白之间形成的那些。代表性缀合物是在PSGL-I和TNF-α之间形成的那种。
如本文所使用的,“细胞毒素或细胞毒素剂”意指对细胞有害的任何试剂。例子 包括泰素、细胞松弛素B、短杆菌肽D、溴化乙啶、依米丁、丝裂霉素、依托泊苷、替尼泊苷 (tenoposide)、长春新碱、长春碱、秋水仙碱、多柔比星、柔红霉素、二羟基蒽二酮、米托蒽 醌、光辉霉素、放线菌素D、l-去氢睾酮、糖皮质激素、普鲁卡因、丁卡因、利多卡因、普萘洛 尔和嘌呤霉素及其类似物或同系物。其他毒素包括但不限于例如蓖麻蛋白、CC-1065和类似物——多卡米星。另外其他的毒素包括白喉毒素和蛇毒(例如,眼镜蛇毒)。
如本文所使用的,“放射性试剂”包括在诊断或破坏肿瘤中有效的任何放射性同位 素。例子包括但不限于铟-111、钴-60。此外,天然存在的放射性元素例如铀、镭和钍(其 一般代表放射性同位素的混合物)是放射性试剂的合适例子。金属离子一般与有机螯合部 分进行螯合。
许多有用的螯合基团、冠醚、穴状配体等是本领域已知的,并且可以掺入本发明的 化合物内(例如,EDTA、DTPA、DOTA、NTA、HDTA等及其膦酸酯类似物,例如DTPP、EDTP、HDTP、 NTP 等)。参见例如 Pitt 等人,"The Design of Chelating Agents for the Treatment oflron Overload,”In,Inokganic Chemistey in BiologyandMedicine ;Martel 1, ;American Chemical Society, Washington, D. C. , 1980,第 279-312 页;Lindoy, The Chemistey of MaceocyclicLigand Complexes ;Cambridge University Press, Cambridge, 1989 ;Dugas, B100RGANIC Chemistey ; Springer-Verlag, New York, 1989,和其中包含的参考文献。
此外,允许螯合剂、冠醚和环糊精与其他分子附着的许多途径是本领域技术人员 可用的。参见例如,Meares 等人,"Properties of In VivoChelate-Tagged Proteins and Polypeptides. In,Modification ofProteins :Food‘ Nutriti0nal,and Pharmacological Aspects ; Feeney, 人’编辑,American Chemical Society, Washington, D. C. , 1982,第 370-387 页;Kasina 等 人,Bioconjugate Chem. ,9 :108-117 (1998) ;Song 等 人’ Bioconjugate Chem. ,8 249-255(1997)。
如本文所使用的,“药学上可接受的载体”包括这样的任何材料,当与缀合物相组 合时,所述材料保留缀合物的活性并且与受试者的免疫系统不反应。“药学上可接受的载 体”包括固体和液体例如媒介物、稀释剂和溶剂。例子包括但不限于,标准药学载体中的任 何,例如磷酸盐缓冲盐水溶液、水、乳状液例如油/水乳状液、和各种类型的湿润剂。其他载 体还可以包括无菌溶液、片剂包括包衣片和胶囊。一般地,此类载体包含赋形剂例如淀粉、 乳、糖、特定类型的粘土、明胶、硬脂酸或其盐、硬脂酸镁或钙、滑石、蔬菜脂肪或油、树胶、二 醇或其他已知赋形剂。此类载体还可以包括调味和颜色添加剂或其他成分。包括此类载体 的组合物通过众所周知的常规方法进行配制。
如本文所使用的,“施用”意指经口施用,作为栓剂施用,局部接触,静脉内、腹膜 内、肌内、损伤内或皮下施用,通过吸入施用,或给受试者植入缓慢释放装置例如微型渗透 泵。施用通过任何途径包括肠胃外和经粘膜(例如,经口、鼻、阴道、直肠或经皮),特别是 通过吸入。肠胃外施用包括例如静脉内、肌内、小动脉内、真皮内、皮下、腹膜内、心室内和颅 内。此外,当注射是治疗肿瘤例如诱导细胞凋亡时,施用可以直接对于肿瘤和/或进入肿瘤 周围的组织内。其他递送方式包括但不限于,脂质体制剂的使用、静脉内输注、经皮贴剂等。
术语“改善”指病理状态或病状的治疗中的任何成功标记,包括任何客观或主观参 数,例如症状的减轻、缓解或减少,或患者的身体或精神正常中的改善。症状的改善可以基 于客观或主观参数;包括体格检查和/或精神评估的结果。
术语“疗法”指疾病或病状的“治疗”或“处理”,包括预防疾病或病状在受试者(例 如,人)中发生,所述受试者可能对该疾病易感但仍未经历或显示出疾病的症状(预防治 疗),抑制疾病(减缓或阻止其发展)、提供来自疾病的症状或副作用的缓解,和缓解疾病 (引起疾病的消退)。
术语“有效量”或“有效的量”或“治疗有效量”或任何语法上等价的术语意指这样 的量,当施用于动物或人用于治疗疾病时,所述量足以实现对于那种疾病的治疗。
术语“经分离的”指基本上或实际上不含用于产生材料的组分的材料。对于本发 明的多肽缀合物,术语“经分离的”指基本上或实际上不含组分的材料,所述组分通常在用 于制备多肽缀合物的混合物中伴随材料。“经分离的”和“纯的”可互换使用。一般地,本发 明的经分离的多肽缀合物具有优选表示为范围的纯度水平。关于多肽缀合物的纯度范围的 下限是约60 %、约70 %或约80 %,并且纯度范围的上限是70 %、约80 %、约90 %或超过约 90%。
当多肽缀合物超过约90%纯时,其纯度也优选表示为范围。纯度范围的下限是约 90 %、约92 %、约94 %、约96 %或约98 %。纯度范围的上限是约92 %、约94 %、约96 %、约 98%或约100%纯度。
纯度通过任何领域公认的分析方法(例如,在银染色的凝胶上的条带强度、聚丙 烯酰胺凝胶电泳、HPLC、质谱法或相似方法)进行测定。
如本文所使用的,“群体的基本上每个成员”描述本发明的多肽缀合物群体的特 征,其中将加入多肽中的所选择百分比的经修饰的糖加入多肽上的多个等同的受体位点 中。“群体的基本上每个成员”说的是与经修饰的糖缀合的多肽上的位点的“同质性”,并且 指本发明的缀合物,所述本发明的缀合物是至少约80%、优选至少约90%和更优选至少约 95%同质的。
“同质性”指跨越经修饰的糖与之缀合的受体部分群体的结构一致性。因此,在其 中每个经修饰的糖部分与受体位点(其具有和每一个其他经修饰的糖与之缀合的受体位 点相同的结构)缀合的本发明的多肽缀合物中,多肽缀合物被说成是约100%同质的。同质 性一般表示为范围。关于多肽缀合物的同质性范围的下限是约50%、约60%、约70%或约 80 %,并且纯度范围的上限是约70 %、约80 %、约90 %或超过约90 %。
当多肽缀合物超过或等于约90%同质时,其同质性也优选表示为范围。同质性 范围的下限是约90 %、约92 %、约94 %、约96 %或约98 %。纯度范围的上限是约92 %、约 94%、约96%、约98%或约100%同质性。多肽缀合物的纯度一般通过本领域技术人员已知 的一种或多种方法进行测定,例如液相色谱法-质谱法(LC-MQ、基质辅助的激光解吸飞行 时间质谱法(MALDIT0F)、毛细管电泳法等。
“基本上均勻的糖型”或“基本上均勻的糖基化模式”当指糖肽种类时,指通过目的 糖基转移酶(例如,GalNAc转移酶)而被糖基化的受体部分的百分比。例如,在α 1,2岩 藻糖基转移酶的情况下,如果基本上所有(如下定义)Gali3 l,4-GlcNAc-R及其唾液酸化类 似物在本发明的肽缀合物中是岩藻糖基化的,那么显示基本上均勻的岩藻糖基化模式。本 领域技术人员应当理解,原材料可以包含糖基化的受体部分(例如,岩藻糖基化的Galii 1, 4-GlcNAc-R部分)。因此,经计算的糖基化百分比将包括通过本发明的方法糖基化的受体 部分,以及在原材料中已糖基化的那些受体部分。
在“基本上均勻的”上文定义中的术语“基本上”一般意指对于特定糖基转移酶至 少约40 %、至少约70 %、至少约80 %,或更优选至少约90 %,且更加优选至少约95 %的受体 部分是糖基化的。
当取代基通过其从左到右书写的常规化学式指定时,它们相等地包括化学上等同26的取代物,这将起因于从右到左书写结构,例如-CH2O-意欲还描述-0CH2_。
除非另有说明,否则术语“烷基”本身或作为另一个取代物的部分意指直链或支 链、或环状(即环烷基)烃原子团,或其组合,其可以是完全饱和的、单或多不饱和的,并且 可以包括具有指定碳原子数目(即,C1-Cltl意指1至10个碳)的二价(例如烷撑)和多价原 子团。饱和烃原子团的例子包括但不限于基团,例如甲基、乙基、正丙基、异丙基、正丁基、叔 丁基、异丁基、仲丁基、环己基、(环己基)甲基、环丙基甲基,例如正戊基、正己基、正庚基、 正辛基的同系物和同分异构体等。不饱和的烷基是具有一个或多个双键或三键的基团。不 饱和的烷基的例子包括但不限于,乙烯基、2-丙烯基、丁烯基、2-异戊烯基、2-( 丁二烯基)、 2,4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1和3-丙炔基、3- 丁炔基、以及更高级的同系 物和同分异构体。除非另有说明,否则术语“烷基”也意欲包括在下文更详细地定义的那些 烷基衍生物,例如“杂烷基”。局限于烃基团的烷基命名为“同烷基(homoalkyl) ”。
术语“烷撑”本身或作为另一个取代物的部分意指衍生自烷烃的二价原子团,例如 但不限于-CH2CH2CH2CH2-,并且进一步包括下文描述为“杂烷撑”的那些基团。一般地,烷基 (或烷撑)基团将具有1至M个碳原子,其中具有10个或更少碳原子的那些基团在本发明 中优选。“低级烷基”或“低级烷撑”是一般具有8个或更少碳原子的较短链的烷基或烷撑 基团。
术语“烷氧基”、“烷氨基”和“烷硫基”(或硫代烷氧基)以其常规意义使用,并且 分别指经由氧原子、氨基或硫原子与分子的其余部分附着的那些烷基。
除非另有说明,否则术语“杂烷基”本身或与另一个术语相组合意指稳定的直链或 支链、或环状烃原子团、或其组合,由所述数目的碳原子和选自0、N、Si和S的至少一个杂 原子组成,并且其中氮和硫原子可以任选是氧化的,并且氮杂原子可以任选是季铵化的。杂 原子0、N、S和Si可以置于杂烷基的任何内部位置处或在其上烷基与分子的其余部分附着 的位置处。例子包括但不限于-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3) -CH3> -CH2 -S-CH2-CH3、-CH2-CH2, -S (0) -CH3、-CH2-CH2-S (0) 2_CH3、-CH = CH-O-CH3、-Si (CH3) 3、-CH2-CH =N-OCH3、和-CH = CH-N (CH3) -CH3。高达2个杂原子可以是相邻的,例如-CH2-NH-OCH3 和-CH2-O-Si (CH3) 3。类似地,术语“杂烷撑”本身或作为另一个取代物的部分意指衍生自杂 烷基的二价原子团,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。对于杂 烷撑基团,杂原子也可以占据一个或两个链末端(例如,烷撑氧基(alkyleneoxy)、烷撑二 氧基、烷撑氨基、烷撑二氨基等)。再进一步地,对于烷撑和杂烷撑连接基团,连接基团的方 向不由其中连接基团的式书写的方向暗示。例如,式-CO2R'-代表-C(O)OR’和-0C(0)R,。
除非另有说明,否则术语“环烷基”和“杂环烷基”本身或与其他术语相组合分别 代表“烷基”和“杂烷基”的环状形式。此外,对于杂环烷基,杂原子可以占据在其上杂环 与分子的其余部分附着的位置。环烷基的例子包括但不限于环戊基、环己基、1-环己烯基、 3-环己烯基、环庚基等。杂环烷基的例子包括但不限于,1-(1,2,5,6_四氢吡啶基)、1_哌 啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢 噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。
除非另有说明,否则术语“卤素”或“卤代”本身或作为另一个取代物的部分意指 氟、氯、溴或碘原子。此外,术语例如“卤烷基”意欲包括单卤烷基和多卤烷基。例如,术语 “卤(C1-C4)烷基”意欲包括但不限于,三氟甲基、2,2,2_三氟乙基、4-氯丁基、3-溴丙基等。
除非另有说明,否则术语“芳基”意指其可以为单环或多环(优选1至3个环)的 多不饱和、芳香族取代基,所述环融合在一起或共价连接。术语“杂芳基”指包含选自N、0、 S、Si和B的1至4种杂原子的芳基(或环),其中氮和硫原子任选是氧化的,并且氮原子 任选是季铵化的。杂芳基可以通过杂原子与分子的其余部分附着。芳基和杂芳基的非限制 性例子包括苯基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、 2-咪唑基、4-咪唑基、批嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异 噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、 2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑 基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹噁啉基、5-喹噁啉 基、3-喹啉基、和6-喹啉基。关于上述芳环和杂芳环系统各自的取代物选自下文描述的可 接受的取代物。
为了间短起见,术语“芳基”当与其他术语相组合使用时(例如,芳氧基、芳硫氧基 (arylthioxy)、芳烷基)包括如上定义的芳环和杂芳环。因此,术语“芳烷基”意欲包括其 中芳基与烷基附着的那些原子团(例如苯甲基、苯乙基、吡啶甲基等),包括其中碳原子(例 如,亚甲基)已由例如氧原子替换的那些烷基(例如,苯氧甲基、2-吡啶氧基甲基、3-(1-萘 氧基)丙基等)。
上述术语(例如,“烷基”、“杂烷基”、“芳基”和“杂芳基”)各自意欲包括取代或未 取代形式的所示原子团。关于每种类型原子团的优选取代物在下文提供。
关于烷基和杂烷基原子团(包括通常称为烷撑、烯基、杂烷撑、杂烯基、炔基、环烷 基、杂环烷基、环烯基和杂环烯基的那些基团)的取代物在属类上称为“烷基取代物”,并且 它们可以是选自但不限于下述的各种基团中的一种或多种数目为0至Cm’ +1)的取代 或未取代的芳基、取代或未取代的杂芳基、取代或未取代的杂环烷基、-OR’、= 0、= NR’、= N-0R,、-NR,R”、-SR,、_ 卤素、-SiR,R” R”,、-OC (0) R,、-C (0) R,、_0)2R,、-C0NR,R”、-OC(O) NR,R,,、-NR,,C(0)R,、-NR,-C (0) NR,,R,”、-NR" C (O)2R', -NR-C (NR,R,,R,,,)= NR,,”、-NR-C (NR,R”) = NR”,、_S (0) R,、_S (0) 2R,、_S (0) 2NR,R”、-NRS&R,、_CN 和-NO2,其中 m’是此类原子团中的碳原子的总数目。R’、R”、R”’和R””各自优选独立地指氢,取代或未 取代的杂烷基,取代或未取代的芳基例如由1-3个卤素取代的芳基,取代或未取代的烷基、 烷氧基或硫代烷氧基、或芳烷基。当本发明的化合物包括超过一个R基团时,例如R基团各 自独立地选择为每个R’、R”、R”’和R””基团,当存在这些基团中的超过一个时。当R’和R” 与相同氮原子附着时,它们可以与氮原子相组合,以形成5-、6_或7-成员环。例如,-NR’R” 意欲包括但不限于,1-吡咯烷基和4-吗啉基。根据取代物的上文讨论,本领域技术人员应 当理解术语“烷基”意欲包括包含这样的基团,其包括与除氢基团外的基团结合的碳原子, 例如卤烷基(例如,-CF3 和-CH2CF3)和芳基(例如,-C (0) CH3、-C (0) CF3、-C (0) CH2OCH3 等)。
类似于对于烷基原子团描述的取代物,关于芳基和杂芳基的取代物在属类上称 为“芳基取代物”。取代物选自例如取代或未取代的烷基、取代或未取代的杂烷基、取代 或未取代的芳基、取代或未取代的杂芳基、取代或未取代的杂环烷基、-OR’、= 0、= NR’、= N-0R,、-NR,R”、-SR,、_ 卤素、-SiR,R” R”,、-OC (0) R,、-C (0) R,、_C02R,、-C0NR,R”、-OC(O) NR,R,,、-NR,,C(0)R,、-NR,-C (0) NR,,R,”、-NR" C (O)2R', -NR-C (NR,R,,R,,,)= NR,”,、-NR-C (NR,R,,)= NR,”、-S (0) R,、-S (0) 2R,、-S (0) 2NR,R,,、-NRSO2R'、-CN和-N02、-R,、-N3、-CH(Ph)2、氟(C1-C4)烷氧基和氟(C1-C4)烷基,数目为0至芳环系统上的 开放效价的总数目;并且其中R’、R”、R”’和R””优选独立地选自氢、取代或未取代的烷基、 取代或未取代的杂烷基、取代或未取代的芳基、和取代或未取代的杂芳基。当本发明的化合 物包括超过一个R基团时,例如R基团各自独立地选择为每个R’、R”、R”’和R””基团,当存 在这些基团中的超过一个时。
芳环或杂芳环的邻近原子上的2个取代物可以任选由式-T-C(O) _(CRR’ ) q-U_的 取代物替换,其中τ和U独立地是-NR-、-0-、-CRR'-或单键,并且q是0至3的整数。备 选地,芳环或杂芳环的邻近原子上的2个取代物可以任选由式-A-(CH2)^B-的取代物替换, 其中 A 和 B 独立地是-CRR,-、-0-、-NR-、-S-、-S (0) -、-S (0) 2_、-S (0) 2NR,-或单键,并且 r 是1至4的整数。如此形成的新环的单键之一可以任选由双键替换。备选地,芳环或杂芳 环的邻近原子上的2个取代物可以任选由式-(CRR’)S-X-(CR”R”’ )d-的取代物替换,其中 s 和 d 独立地是 0 至 3 的整数,并且 X 是-0-、-NR,-、-S-、-S (0) -、-S (0) 2_ 或-S (0) 2NR,-。 取代物R、R’、R”和R”’优选独立地选自氢或取代或未取代的(C1-C6)烷基。
如本文所使用的,术语“酰基”描述包含羰基残基C(O)R的取代物。关于R的示例 性种类包括H、卤素、烷氧基、取代或未取代的烷基、取代或未取代的芳基、取代或未取代的 杂芳基、和取代或未取代的杂环烷基。
如本文所使用的,术语“融合的环系统”意指至少2个环,其中每个环具有与另一 个环共同的至少2个原子。“融合的环系统可以包括芳香族以及非芳香族环。“融合的环系 统”的例子是萘、喷哚、喹啉、色烯等。
如本文所使用的,术语“杂原子”包括氧(0)、氮(N)、硫(S)、硅(Si)、硼(B)和磷 ⑵。
符号“R”是代表取代基的一般缩写。示例性取代基包括取代或未取代的烷基、取 代或未取代的杂烷基、取代或未取代的芳基、取代或未取代的杂芳基、和取代或未取代的杂环烷基。
术语“药学上可接受的盐”包括依赖于在本文描述的化合物上发现的具体取代物, 用分别地无毒酸或碱制备的盐。当本发明的化合物包含相对酸性的功能性时,通过使此类 化合物(例如,其中性形式)与足够量的所需碱纯粹或在合适的惰性溶剂中相接触,可以 获得碱加成盐。药学上可接受的碱加成盐的例子包括钠、钾、钙、铵、有机氨基或镁盐、或相 似盐。当本发明的化合物包括相对碱性的功能性时,通过使此类化合物(例如,其中性形 式)与足够量的所需酸纯粹或在合适的惰性溶剂中相接触,可以获得酸加成盐。药学上可 接受的酸加成盐的例子包括衍生自无机酸的那些,所述无机酸如盐酸、磺酸、氢溴酸、硝酸、 碳酸、单氢碳酸、磷酸、单氢磷酸、二氢磷酸、硫酸、单氢硫酸、氢碘酸或亚磷酸等,以及衍生 自相对无毒的有机酸的盐,所述有机酸如乙酸、丙酸、异丁酸、马来酸、丙二酸、苯甲酸、琥 珀酸、辛二酸、延胡索酸、乳酸、扁桃酸、苯二甲酸、苯磺酸、对甲苯磺酸、柠檬酸、酒石酸、甲 磺酸等。还包括的是氨基酸的盐例如精氨酸盐(arginate)等,和有机酸例如葡糖醛酸或 半乳糖醛酸)的盐等(参见例如,Berge 等人,Journal ofPharmaceutical Science,66 1-19(1977))。本发明的特定特异性化合物包含碱性和酸性功能性,其允许化合物转变成碱 或酸加成盐。
化合物的中性形式优选通过使盐与碱或酸相接触并且以常规方式分离亲本化合物而再生。化合物的亲本形式在特定物理性质(例如在极性溶剂中的溶解性)方面不同于 各种盐形式,但在其他方面盐等价于化合物的亲本形式用于本发明的目的。
除盐形式外,本发明提供了以药物前体形式的化合物。本文描述的化合物的药物 前体是在生理条件下容易地经历化学变化以提供本发明的化合物的那些化合物。此外,药 物前体可以在离体环境中通过化学或生物化学方法转变成本发明的化合物。例如,当与合 适的酶或化学试剂一起置于经皮贴剂储库中时,药物前体可以缓慢地转变成本发明的化合 物。
本发明的特定化合物可以以非溶剂化形式以及溶剂化形式包括水合物形式存在。 一般而言,溶剂化形式等价于非溶剂化形式,并且包括在本发明的范围内。本发明的特定化 合物可以以多结晶或无定形形式存在。一般而言,所有物理形式对于由本发明考虑的用途 是等价的,并且预期在本发明的范围内。
本发明的特定化合物具有不对称碳原子(光学中心)或双键;外消旋物、非对映异 构体、几何异构体和个别同分异构体包括在本发明的范围内。
本发明的化合物可以制备为单一同分异构体(例如,对映体、顺式-反式、位置、 非对映体)或制备为同分异构体的混合物。在一个优选实施方案中,化合物制备为基本上 单一的同分异构体。制备基本上同分异构纯的化合物的方法是本领域已知的。例如,对映 体富集的混合物和纯的对映体化合物可以通过使用对映体纯的合成中间产物与这样的反 应相组合进行制备,所述反应使得手性中心处的立体化学不改变或导致其完全倒置。备选 地,沿着合成途径的最终产物或中间产物可以解析(resovle)成单一立体异构体。用于 使特定立体中心倒置或不改变的技术,以及用于解析立体异构体的混合物的技术,是本领 域众所周知的,并且选择用于特定情况的合适方法完全在本领域技术人员的能力内。一 般参见,Furniss 等人(编辑),V0GEL,s Encyclopedia of PeacticalOkganic Chemistey 第 5 版,Longman Scientific and Technical Ltd. , Essex,1991,第 809-816 页;禾口 Heller, Acc. Chem. Res. 23 :128(1990)。
本文使用的外消旋、ambiscalemic和scalemic或对映体纯的化合物的图示取自 Maehr, J. Chem. Ed. ,62 :114-120(1985)实心和折断的(broken)楔形用于指示手性单元的 绝对构型;波浪线指示它代表的键可以产生的任何立体化学牵涉的否认;实心和折断的粗 线是指示所示相对构型但不暗示任何绝对立体化学的几何学描述符;并且楔形轮廓和虚线 或折线指示不确定的绝对构型的对映体纯的化合物。
术语“对映体过量”和非对映体过量”在本文中可互换使用。具有单个立体中心的 化合物被称为以“对映体过量”存在,具有至少2个立体中心的化合物被称为以“非对映体过量”存在。
本发明的化合物还可以包含在构成此类化合物的一个或多个原子处的非天然比 例的原子同位素。例如,化合物可以用放射性同位素进行放射性标记,所述放射性同位素例 如氘(3H)、碘-125 (125I)或碳-14(1 )。放射性或非放射性的本发明的化合物的所有同位素 变异意欲包括在本发明的范围内。
如本文所使用的,“活性官能团”指基团,包括但不限于,烯属烃、乙炔、醇、酚、醚、 氧化物、商化物、醛、酮、羧酸、酯、酰胺、氰酸酯、异氰酸酯、硫氰酸酯、异硫氰酸酯、胺、胼、 腙、酰胼、重氮基、重氮、硝基、腈、硫醇、硫化物、二硫化物、亚砜、砜、磺酸、亚磺酸、缩醛、缩酮、酐、硫酸盐、次磺酸异腈、脒、酰亚胺、亚氨酸酯(imidates)、硝酮、羟胺、肟、羟肟酸、硫 羟肟酸、丙二烯、原酸酯、亚硫酸盐、烯胺、炔胺、尿素、假尿素、氨基脲、碳化二亚胺、氨基甲 酸酯、亚胺、叠氮化物、偶氮化合物、氧化偶氮化合物、和亚硝基化合物。反应性官能团还包 括用于制备生物缀合物的那些,例如,N-羟基琥珀酰亚胺酯、马来酰亚胺等。制备这些官 能团中每一种的方法是本领域众所周知的,并且其用于具体用途的应用或修饰在本领域技 术人员的能力内(参见例如,Sandler和Karo,编辑Okganic Functional GeoupP reparations‘ Academic Press,San Diego,1989)。
“非共价蛋白质结合基团”是以结合方式与完整或变性多肽相互作用的部分。相互 作用在生物环境中可以是可逆的或不可逆的。“非共价蛋白质结合基团”掺入本发明的螯合 剂或复合物内,给试剂或复合物提供了以非共价方式与多肽相互作用的能力。示例性非共 价相互作用包括疏水性-疏水性和静电相互作用。示例性“非共价蛋白质结合基团”包括 阴离子基团,例如磷酸盐、硫代磷酸盐、膦酸盐、羧酸盐、硼酸盐、硫酸盐、砜、磺酸盐、硫代硫 酸盐和硫代磺酸盐。
“酶截短”或“截短的酶”或语法变体以及“结构域缺失的酶”或语法变体指这样的 酶,其具有比相对应天然存在的酶更少的氨基酸残基,但保留特定酶促活性。可以缺失任何 数目的氨基酸残基,只要酶保留活性。在某些实施方案中,可以缺失结构域或结构域的部 分,例如,可以缺失膜锚着结构域,留下可溶性酶。某些feilNAcT酶例如fetlNAc-T2具有C 末端凝集素结构域,其可以缺失而不减少酶促活性。
“重折叠表达系统”指具有氧化细胞内环境的细菌或其他微生物,当在这种微生物 中表达时,其具有以其正确/活性形式重折叠含二硫化物蛋白质的能力。例子包括基于大 肠杆菌的系统(例如,Origami (经修饰的大肠杆菌trxB-/g0r-),Origami 2 等、假单 胞菌属(I^eudomonas)(例如,荧光)。关于Origami 技术的示例性参考文献,参见例如, Lobel 等人(2001) Endocrine 14 (2),205-212 ;和 Lobel 等人(2002) Protein Express. Purif. 25(1),124-133。
III.前言
本发明提供了包括至少一个外源N联糖基化序列(序列子多肽)的多肽。每个多 肽与亲本多肽相对应。亲本多肽可以是任何多肽,包括野生型多肽和对于其氨基酸序列或 核苷酸序列是已知的其他多肽(例如药学药物)。在一个实施方案中,亲本多肽不包括N 联糖基化序列。在另一个实施方案中,亲本多肽(例如,野生型多肽)天然地包括N联糖基 化序列。与此类亲本多肽相对应的序列子多肽包括在不同位置处的另外N联糖基化序列。 在一个实施方案中,亲本多肽是治疗多肽,例如人生长激素(hGH)、促红细胞生成素(EPO)、 治疗抗体、骨形态生成蛋白(例如,BMP-7)或血液因子(例如,因子VI、因子VIII或因子 IX)。因此,本发明提供了治疗多肽变体,其在其氨基酸序列内包括一个或多个外源N联糖 基化序列。
在一个实施方案中,N联糖基化序列是酶(例如寡糖基转移酶,例如I^glB)的底 物。酶催化糖基部分从糖基供体种类(例如,脂质-焦磷酸盐连接的糖基部分)到天冬酰 胺(N)残基的转移,所述天冬酰胺(N)残基是N联糖基化序列的部分。可以与糖基化序 列缀合的示例性糖基部分包括 GlcNAc、GlcNH、bacillosamine、6-hydroybacillosamine、 GalNAc, GalNH、GlcNAc—GlcNAc、GlcNAc—GlcNH、GlcNAc-Gal、GlcNAc—GlcNAc—Gal—Sia、GlcNAc-Gal-Sia,GlcNAc-GlcNAc-Man 和 GlcNAc-GlcNAc-Man (Man) 2。示例性糖基供体种类 在本文中描述。
因此,本发明提供了多肽缀合物,其中经修饰的或未经修饰的糖部分与本发明的N 联糖基化序列附着。本发明进一步提供了制备此类多肽缀合物的方法。在一个代表性实 施方案中,该方法是无细胞的体外方法,其中在糖基供体种类是其的底物的寡糖基转移酶 的存在下,使多肽与糖基供体种类(例如脂质-焦磷酸盐连接的糖基部分,例如十一异戊 烯-焦磷酸盐连接的糖基部分)相接触(例如,在反应容器中)。在这个糖基供体种类中的 糖基部分是任选用修饰基团例如水溶性聚合修饰基团衍生的。该酶将经修饰的或未经修饰 的糖基部分转移到多肽上,从而产生多肽缀合物。当修饰基团包括至少一个聚(乙二醇) 部分时,那么此类糖基化反应被称为糖基PEG化。
在另一个代表性方法中,上述酶促反应在多肽在其中表达的宿主细胞内发生。寡 糖基转移酶可以内源存在于宿主细胞中,或可以在宿主细胞中过表达。根据这种方法的细 胞内糖基化提供了超过无细胞的体外糖基化的各种优点。例如,不需要在糖基化前从细胞 培养中纯化多肽。此外,可以利用其他内源或共表达的酶,其可以用于进一步修饰最初形成 的糖基化多肽。
本发明的糖修饰(例如糖基PEG化)方法可以对掺入N联糖基化序列的任何多肽 进行实践。在一个实施方案中,由于例如通过免疫系统或网状内皮系统(RES)减少的清除 率或减少的摄取率,本发明的方法提供了具有增加的治疗半衰期的多肽缀合物。在另一个 实施方案中,本发明的方法提供了用于掩蔽多肽上的抗原决定簇的方法,从而减少或消除 针对多肽的宿主免疫应答。使用合适的经修饰的糖使靶向试剂与多肽选择性附着,可以用 于将多肽靶向对于特定靶向试剂特异的特定组织或细胞表面受体。还提供的是显示出针对 经由蛋白水解的降解增强的抗性的多肽,通过改变多肽上由蛋白水解酶切割或识别的特定 位点达到的结果。在一个实施方案中,此类位点由本发明的N联糖基化序列替换,或部分由 本发明的N联糖基化序列替换。
此外,本发明的方法可以用于调节亲本多肽的“生物活性谱”。本发明人已认识 到使用本发明的方法使修饰基团例如水溶性聚合物(例如,mPEG)与亲本多肽附着,不仅 可以改变所得到的多肽种类的生物利用度、药效性质、免疫原性、代谢稳定性、生物分布和 水溶性,还可以导致不希望有的治疗活性的减少或所需治疗活性的增加。例如,前者已对 于造血试剂促红细胞生成素(EPO)观察到。例如,特定以化学方法PEG化的EPO变体显示 减少的促红细胞生成素活性,而野生型多肽的组织保护活性得到维持。此类结果在例如美 国专利 6,531,121 ;W02004/096148、W02006/014466、W02006/014349、W02005/025606 和 W02002/053580中描述。对于评估所选多肽的差异生物活性有用的示例性细胞系概括于下 表1中
表1 用于多种多肽的牛物学评估的细胞系
多肽细胞系生物活性EPOUT7红血球生成SY5Y神经保护BMP-7MG-63骨诱导HK-2肾毒性NT-3Neuro2神经保护(TrkC结合)NIH3T3神经保护(p75结合)
在一个实施方案中,本发明的多肽缀合物显示对于生物学靶蛋白质(例如,受 体)、天然配体或非天然配体例如抑制剂减少或增强的结合亲和力。例如,取消对于一类特 异性受体的结合亲和力可以减少或消除相关的细胞信号传导和下游生物学事件(例如,免 疫应答)。因此,本发明的方法可以用于制备多肽缀合物,和缀合物与之相对应的亲本多肽 相比较,其具有等同、相似或不同的治疗谱。本发明的方法可以用于鉴定具有特定(例如, 改善的)生物学功能的糖基PEG化治疗剂,并且用于“微调”任何治疗多肽或其他生物学活 性多肽的治疗谱。GlycoPEGylation 是Neose Technologies的商标,并且指共同拥有的 专利和专利申请例如,(W02007/053731 ;W02007/022512 ;W02006/127896 ;W02005/055946 ; W02006/121569 ;和 W02005/070138)中公开的技术。
IV.组合物
^li
在一个方面,本发明提供了具有氨基酸序列的多肽,所述氨基酸序列包括本发明 的至少一个外源N联糖基化序列(序列子多肽)。N联糖基化序列在本文下文中描述。在 一个实施方案中,多肽的氨基酸序列包括外源N联糖基化序列,其是一种或多种野生型、突 变型或截短的寡糖基转移酶的底物。示例性寡糖基转移酶在本文下文中描述,并且包括本 文描述的那些酶的全长或截短形式(例如,SEQ ID NO 102至114)。
在一个示例性实施方案中,通过重组技术经由改变相对应亲本多肽(例如,野生 型多肽)的氨基酸序列来产生本发明的多肽。用于制备重组多肽的方法是本领域技术人员 已知的。示例性方法在本文下文中描述。多肽的氨基酸序列可以包括天然存在的和外源 (即,非天然存在的)N联糖基化序列的组合。
本发明的多肽或亲本多肽可以是任何多肽。在多种实施方案中,多肽是治疗多肽。 在一个例子中,多肽是重组多肽。多肽可以是糖肽并且可以具有任何数目的氨基酸。在一 个实施方案中,本发明的多肽具有约5kDa至约500kDa的分子量。在另一个实施方案中,多 肽具有约IOkDa至约400kDa、约IOkDa至约350kDa、约IOkDa至约300kDa、约IOkDa至约 250kDa、约IOkDa至约200kDa或约IOkDa至约150kDa的分子量。在另一个实施方案中,多 肽具有约IOkDa至约IOOkDa的分子量。在另外一个实施方案中,多肽具有约IOkDa至约 50kDa的分子量。在一个进一步的实施方案中,多肽具有约IOkDa至约25kDa的分子量。
示例性多肽包括野生型多肽及其片段,以及由其天然存在的配对物进行修饰(例 如,通过突变或截短)的多肽。多肽还可以是融合蛋白。示例性融合蛋白包括其中多肽与 荧光蛋白质(例如,GFP)、治疗多肽、抗体、受体配体、蛋白质性质的毒素、MBP、His-标签等 融合的融合蛋白。
在一个例子中,本发明的多肽包括本发明的N联糖基化序列,并且另外包括0联糖 基化序列。示例性O联糖基化序列和用于糖基化0联糖基化序列的示例性酶在2007年7 月23日提交的美国专利申请11/781,885中描述,所述美国专利申请通过引用整体合并入 本文。使用GIcNAC转移酶的0联糖基化序列在2008年6月4日提交的美国临时专利申请 60/941,926和PCT/US2008/065825中描述,所述专利的公开内容也整体合并入本文。
在一个实施方案中,多肽是治疗多肽,例如目前用作药学试剂(即,经认可的药 物)的那些。多肽的非限制性选择显示于2006年6月8日提交的美国专利申请10/552,896 的图观中,所述美国专利申请通过引用合并入本文。
示例性多肽包括生长因子,例如肝细胞生长因子(HGF)、神经生长因子(NGF)、表 皮生长因子(EGF)、成纤维细胞生长因子(例如,FGF-I、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、 FGF-7、FGF-8、FGF-9、FGF-10、FGF-IU FGF-12, FGF-13, FGF-14、FGF-15, FGF-16、FGF-17, FGF-18、FGF-19、FGF-20、FGF-21、FGF-22 和 FGF-23)、角质化细胞生长因子(KGF)、巨核细 胞生长和发育因子(MGDF)、血小板衍生的生长因子(PDGF)、转化生长因子(例如,TGF-α、 TGF-β、TGF-β 2、TGF-β 3)、血管内皮生长因子(VEGF ;例如,VEGF-2)、VEGF抑制剂例如 VEGF-TRAP(Aflibercept)、骨生长因子(BGF)、神经胶质生长因子、肝素结合的促神经突生 长因子(HBNF)、C1酯酶抑制剂,激素例如人生长激素(hGH)、促卵泡激素(FSH)、促甲状腺激 素(TSH)和甲状旁腺激素、促滤泡素(例如,促滤泡素-α、促滤泡素-β)、滤泡抑素、促黄 体激素(LH),以及细胞因子,例如白介素(例如,IL-1、IL-2、IL-3、IL_4、IL_5、IL_6、IL-7、 IL-8、IL-9、IL-10、IL-IU IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18)、干扰素(例 如,INF-α、INF-β、INF- γ , INF-ω、INF- τ )禾口月夷岛素。
其他示例性多肽包括酶,例如葡糖脑苷酯酶、α-半乳糖苷酶(例如, Fabrazyme )、酸性- α -葡糖苷酶(酸性麦芽糖酶)、艾杜糖醛酸酶例如α -L-艾杜糖醛 酸酶(例如,Aldurazyme )、甲状腺过氧化物酶(TPO)、β-葡糖苷酶(参见例如,美国 专利申请号10/411,044中描述的酶)、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神经酰胺酶 (glucoceramidase)(例如,伊米苷酶)、鞘磷脂酶、丁酰胆碱酯酶、尿激酶和α-半乳糖苷酶 A(参见例如,美国专利号7,125,843中描述的酶)。
其他示例性亲本多肽包括骨形态发生蛋白质(例如,BMP-I、ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、 BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10, BMP-IU BMP-12, BMP-13, BMP-14、BMP-15)、 神经营养素(例如,NT-3、NT-4、NT-5)、促红细胞生成素(EPO)、新红细胞生成刺激蛋白质 (NESP;例如,Aranesp)、生长分化因子(例如,⑶F-5)、神经胶质细胞系衍生的神经营养 因子(⑶NF)、脑源性神经营养因子(BDNF)、肌肉生长抑制素(myostatin)、神经生长因子 (NGF)、粒细胞集落刺激因子(G-CSF ;例如,Neupogeu 、Neulasta )、粒细胞-巨噬 细胞集落刺激因子(GM-CSF)、α 1-抗胰蛋白酶(ATT或α _1蛋白酶抑制剂)、组织型纤溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白质(HbsAg)、人 绒毛膜促性腺素(hCG)、骨桥蛋白、护骨素(osteoprotegrin)、蛋白质C、生长调节素-1、促 生长素、生长激素、嵌合白喉毒素-IL-2、胰高血糖素样肽(例如,GLP-I和GLP-2)、凝血酶、 血小板生成素、凝血酶敏感蛋白-2、抗凝血酶III (AT-III)、前动力蛋白(prokinetisin)、 CD4、α -CD20、肿瘤坏死因子(例如,TNF- α ) ,TNF- α抑制剂、TNF受体(TNF-R)、Ρ_选择素 糖蛋白配体-1 (PSGL-I)、补体、转铁蛋白、糖基化依赖性细胞粘附分子(GlyCAM)、神经细胞粘附分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、extendin-4、BDNF、β -2-微球蛋白、睫 状神经营养因子(CNTF)、淋巴毒素-β受体(LT-β受体)、纤维蛋白原、⑶F(例如,⑶F-1、 GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶ F-10、⑶ F-11、⑶ F-12、⑶ F-13、 ⑶F-14、⑶F-15)、GLP-1、胰岛素样生长因子(例如,IGF1)、胰岛素样生长因子结合蛋白(例 如,IGB-5)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/ IBP-8、IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12 和 IGF/IBP-13。关于上文列出的 多肽中的某些的示例性氨基酸序列在美国专利号7,214,660中描述,所述所有专利通过 引用合并入本文。
在一个例子中,多肽是血管性血友病因子(vWF)或vWF的部分。重组vWF已得到描 述(参见例如,Fischer B. Ε.等人,Cell. Mol. Life Sci. 1997,53 :943_950,其通过引用合 并入本文。在另一个例子中,多肽是切割vWF的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)。
在一个例子中,本发明的多肽是血液凝固因子(血液因子)。示例性血液因子包括 因子V、因子VII、因子VIII (例如,因子VIII-2、因子VIII-3)、因子IX、因子X和因子XIII。 在另一个例子中,多肽是血液因子抑制剂(例如,因子)(a抑制剂)。
在一个具体例子中,多肽是因子VIII。因子VIII和因子VIII变体是本领域已知 的。例如,美国专利号5,668,108描述了因子VIII变体,其中在位置1241处的天冬氨酸由 谷氨酸替换。美国专利号5,149,637描述了包括糖基化或未糖基化的C末端部分的因子 VIII变体,并且美国专利号5,661,008描述了包括通过至少3个氨基酸残基与氨基酸1649 至2332连接的氨基酸1-740的因子VIII变体。因此,因子VIII的变体、衍生物、修饰和复 合物是本领域众所周知的,并且包括在本发明的范围内。用于产生因子VIII的表达系统也 是本领域众所周知的,并且包括原核和真核细胞,如美国专利号5,633,150,5, 804,420和 5,422,250中例示的。上文讨论的因子VIII序列中的任何都可以进行修饰,以包括外源0 联、S联或N联糖基化序列。
在一个例子中,因子VIII是全长或野生型因子VIII多肽。关于全长因子VIII多 肽的示例性氨基酸序列显示于图IA和IB(SEQ ID N0:8,SEQ ID NO 9)中。在另外一个例 子中,多肽是因子VIII多肽,其中B结构域包括比野生型或全长因子VIII的B结构域更 少的氨基酸残基。这些因子VIII多肽被称为B结构域缺失的或部分B结构域缺失的因子 VIII。本领域技术人员将能够鉴定在给定因子VIII多肽内的B结构域。在一个例子中,B 结构域包括在2个侧翼序列IEPR(在N末端侧上)和EITR(在C末端侧上)之间的氨基酸 残基。然而,本领域技术人员应当理解这2个侧翼序列可以不存在,或可以例如通过突变进 行修饰。在因子VIII多肽内的B结构域的一般定位在下图中举例说明
在示例性因子VIII多肽内的B结构域
......IEPR-B 结构域-EITR...。
在一个例子中,B结构域在全长因子VIII序列(例如,图IB中所示的序列)的氨 基酸残基Arg74°和Glu1649之间发现
... IEPR740-B 结构域-E1649ITR. · ·。
在一个实施方案中,本发明的因子VIII多肽不包括通常与B结构域结合的任何氨 基酸残基(完全B结构域缺失)。根据这个实施方案的示例性氨基酸序列显示于图2中, 其中全长因子VIII序列(图1B)的Arg74tl和Glu1649之间的所有氨基酸残基被去除。在另35一个实施方案中,原始B结构域替换为另一个序列(B结构域替换序列)。在一个例子中, 因子VIII多肽的B结构域替换序列包括至少2个氨基酸。例如,至少2、至少3、至少4、至 少5、至少6、至少7、至少8、至少9或至少10个氨基酸残基在图2中的Arg74°和Glu1649之 间发现。替换序列可以包括任何数目的氨基酸残基,并且可以具有任何氨基酸序列。
在一个例子中,替换B结构域的序列包括部分B结构域序列。例如,替换B结构域 的序列包括B结构域的约2、约4、约6、约8、约10、约12、约14或超过14个N末端氨基酸 (例如,在图2中的Arg740和Glu1649之间)。例如,替换序列可以包括选自SFSQN、SFSQNS, SFSQNSR和SFSQNSRH的部分N末端B结构域序列。在另一个例子中,替换B结构域的序列 包括原始B结构域的约2、约4、约6、约8、约10、约12、约14或超过14个C末端氨基酸(例 如,在图2中的Arg74tl和Glu1649之间)。例如,替换序列可以包括选自QR、HQR、RHQR、KRHQR、 LKRHQR、VLKRHQR和PPVLKRHQR的部分C末端B结构域序列。在另外一个例子中,替换B结 构域的氨基酸序列包括超过一个部分序列的组合。例如,替换序列包括与原始B结构域的 部分C末端序列连接的部分N末端序列,其中N末端和C末端B结构域任选经由另外的氨 基酸残基例如一个或多个精氨酸残基连接。关于B结构域缺失的因子VIII多肽的示例性 氨基酸序列包括图3-5 (SEQ ID NO :4-6)中所示的那些序列。
在一个实施方案中,B结构域替换序列包括天然或非天然存在的(例如,外源)N 联或0联糖基化序列。在一个例子中,原始B结构域以这样的方式进行截短,以便使得原始 B结构域中天然存在的0联或N联糖基化序列中的至少一个保持完整。在另一个例子中, 如上所述的部分B结构域序列的组合导致糖基化序列的形成。例子可以在图5中观察到 P749SQNP0
在另外一个例子中,B结构域替换序列包括天然存在的B结构域中不存在的氨基 酸序列,其中这个非天然存在的序列包括外源0联或N联糖基化序列(例如,本发明的0联 糖基化序列)。在一个例子中,B结构域替换序列包括本发明的外源0联糖基化序列,例如 PTP、PTE I、PTE IP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP、TETP、PTVL、 PTVLP、PTLSP、PTDAP、PTENP、PTQDP、PTASP、PTTVSP、PTQGA、PTSAV、PTTLYV、PTTLYVP、PSSGP 或PSDGP。在另一个例子中,B结构域替换序列包括本发明的外源N联糖基化序列,例如NLT。
在一个实施方案中,本发明提供了这样的因子VIII多肽,其包括根据图1A、图1B、 图2、图3、图4或图5的氨基酸序列,并且进一步包括在N末端处或在选自1至740的氨基 酸位置处(重链)引入所述氨基酸序列内的外源N联糖基化序列。在另一个示例性实施方 案中,本发明提供了这样的因子VIII多肽,其包括根据图4的氨基酸序列,并且进一步包括 在选自782至1,465的氨基酸位置处(轻链)引入所述氨基酸序列内的外源N联糖基化序 列。在另一个示例性实施方案中,本发明提供了这样的因子VIII多肽,其包括根据图1A、 图1B、图2、图3、图4或图5的氨基酸序列,并且进一步包括在所述因子VIII多肽的轻链内 的氨基酸位置处弓I入所述氨基酸序列内的外源N联糖基化序列。在另一个示例性实施方案 中,本发明提供了这样的因子VIII多肽,其包括根据图4的氨基酸序列,并且进一步包括在 选自741至781的氨基酸位置处(B结构域片段)引入所述氨基酸序列内的外源N联糖基 化序列。在另一个示例性实施方案中,本发明提供了这样的因子VIII多肽,其包括根据图 1A、图1B、图2、图3、图4或图5的氨基酸序列,并且进一步包括在所述因子VIII多肽的B 结构域或B结构域片段内引入所述氨基酸序列内的外源N联糖基化序列。在一个例子中,本发明的因子VIII多肽在CHO细胞中产生。在另一个例子中,因子VIII多肽使用本领域 已知的trxB gor突变型大肠杆菌表达系统(Origami)产生。
在另一个例子中,多肽是2个或更多个多肽之间的融合蛋白。在另一个例子中,多 肽是2个或更多个多肽之间的复合物。在一个示例性实施方案中,复合物包括血液因子。在 另一个示例性实施方案中,复合物包括因子VIII。这种复合物中的因子VIII多肽可以是 全长、B结构域缺失、或部分B结构域缺失的因子VIII。在一个例子中,复合物在因子VIII 和血管性血友病因子(vWF)之间形成。
还在本发明的范围内是其为抗体的多肽。术语抗体意欲包括免疫球蛋白、抗体片 段(例如,Fc结构域)、单链抗体、Lama抗体、纳米抗体等。在该术语中还包括的是抗体融 合蛋白,例如Ig嵌合体。优选的抗体包括人源化、单克隆抗体或其片段。此类抗体的所有 已知同种型在本发明的范围内。示例性抗体包括针对生长因子的那些,所述生长因子例如 内皮生长因子(EGF)、血管内皮生长因子(例如针对VEGF-A的单克隆抗体,例如雷尼珠单 抗(ranibizumab) (Lucentis ))和成纤维细胞生长因子,例如FGF_7、FGF_21和FGF-23)和 针对其分别受体的抗体。其他示例性抗体包括抗TNF抗体,例如抗TNF-α单克隆抗体(参 见例如,美国专利申请号10/411,043)、TNF受体-IgG Fc区融合蛋白(例如,Enbre 1 )、 抗HER2单克隆抗体(例如,Herceptin )、针对呼吸道合胞病毒的蛋白质F的单克隆抗体 (例如,Synagis )、针对TNF-α的单克隆抗体(例如,Remicade ),针对糖蛋白例如IIb/ IIIa 的单克隆抗体(例如,Reopro ),针对 CD20 (例如,Rituxan )、⑶4、α -CD3、CD40L 和 CD154(例如,鲁利单抗)的单克隆抗体,针对PSGL-I和CEA的单克隆抗体。上文列出的多 肽中任何的任何经修饰的(例如突变的)形式也在本发明的范围内。
在一个示例性实施方案中,亲本多肽是包括(SEQ ID NO 7)的氨基酸序列的ΕΡ0, 其在下文显示
Ala Pro Pro Arg Leu lie Cys Asp Ser Arg Val Leu Glu Arg Tyr LeuLeu Glu Ala Lys Glu Ala Glu Asn24Ile Thr Thr Gly Cys Ala Glu HisCys Ser Leu Asn Glu Asn38 lie Thr Val Pro Asp Thr Lys Val Asn PheTyr Ala Trp Lys Arg Met Glu Val Gly Gln Gln Ala Val Glu Val TrpGln Gly Leu Ala Leu Leu Ser Glu Ala Val Leu Arg Gly Gln Ala LeuLeu Val Asn83 Ser Ser Gln Pro Trp Glu Pro Leu Gln Leu His Val AspLys Ala Val Ser Gly Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala LeuGly Ala Gln Lys Glu Ala lie Ser Pro Pro Asp Ala Ala Ser126 Ala Ala ProLeu Arg Thr lie Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr SerAsn Phe Leu Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys ArgThr Gly Asp。
在一个示例性实施方案中,亲本多肽包括具有由不带电的氨基酸(例如甘氨酸或 丙氨酸)替换碱性氨基酸残基(例如精氨酸或赖氨酸)的至少一个突变的氨基酸序列。在 另一个实施方案中,EPO多肽包括具有选自Arg139至Ala139、Arg143至Ala143和Lys154至Ala154 的至少一个突变的氨基酸序列。
N联糖基化序列
本发明的N联糖基化序列可以是任何的短氨基酸序列。在一个实施方案中,N联 糖基化序列包括约3至约20、优选约3至约10、更优选约3至约9且最优选约3至约7个 氨基酸残基。本发明的N联糖基化序列包括具有氨基的至少一个氨基酸残基。在一个实施方案中,本发明的N联糖基化序列包括至少一个天冬酰胺(N)残基。在另一个实施方案中, 当对序列子多肽实施酶促糖基化或糖缀合反应时,天冬酰胺残基的氨基是糖基化的。在这 个反应过程中,氨基的氢原子由糖基部分替换。接受糖基部分的氨基酸残基被称为“糖基化 的位点”或“糖基化位点”。
在一个实施方案中,本发明的N联糖基化序列天然存在于野生型多肽中。此类野 生型多肽的多肽缀合物在本发明的范围内。在另一个实施方案中,N联糖基化序列不存在 于相对应的亲本多肽(外源N联糖基化序列)中,或不存在于其的相同位置处。外源N联 糖基化序列引入亲本多肽内产生本发明的序列子多肽。N联糖基化序列可以通过突变引入 亲本多肽内。在另一个例子中,N联糖基化序列通过序列子多肽的化学合成引入亲本多肽 的氨基酸序列内。
在一个实施方案中,本发明的N联糖基化序列包括根据式⑴(SEQID NO 1)的氨 基酸序列。在另一个实施方案中,N联糖基化序列包括根据式(II) (SEQ ID NO 2)的氨基 酸序列。在另外一个实施方案中,N联糖基化序列由根据式(I)的氨基酸序列组成。在一 个进一步的实施方案中,N联糖基化序列由根据式(II)的氨基酸序列组成
X1NX2X3X4(I) (SEQ ID NO 1)
X1DX2' N X2X3X4(II) (SEQ ID NO :2)。
在式⑴和式(II)中,N是天冬酰胺,并且D是天冬氨酸。在一个实施方案中,X3 是苏氨酸(T)。在另一个实施方案中,X3是丝氨酸(S)。X1存在或不存在。当存在时,X1可 以是任何氨基酸。在一个实施方案中,X1是选自甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸 (L)、异亮氨酸(I)、苯丙氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺(Q)、 组氨酸(H)、赖氨酸(K)、精氨酸(R)、丝氨酸(S)、苏氨酸(T)、酪氨酸(Y)、色氨酸(W)、半胱 氨酸(C)和脯氨酸(P)的成员。X4存在或不存在。当存在时,X4可以是任何氨基酸。在一个 实施方案中,X4是选自甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、苯丙 氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺(Q)、组氨酸(H)、赖氨酸(K)、 精氨酸(R)、丝氨酸(S)、苏氨酸(T)、酪氨酸(Y)、色氨酸(W)、半胱氨酸(C)、脯氨酸(P)的 成员。
在式(I)和式(II)中,X2可以是任何氨基酸。在一个优选实施方案中,X2不是脯 氨酸(P)。X2’可以是任何氨基酸。在一个实施方案中,X2’不是脯氨酸。在一个实施方案 中,X2和X2,是独立地选自甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、 苯丙氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺⑴)、组氨酸(H)、赖氨酸 (K)、精氨酸(R)、丝氨酸(S)、苏氨酸(T)、酪氨酸(Y)、色氨酸(W)和半胱氨酸(C)的成员。 N联糖基化序列可以包括另外的C或N末端氨基酸残基。在一个实施方案中,另外的氨基酸 用于调节在糖基化位点附近的多肽的三级结构。
在一个实施方案中,式(I)中的X2是不带电的氨基酸。在一个示例性实施方案中, N 联糖基化序列是选自 X1NGSX4 J1NGTX4 J1NASX4 J1NATX4 JiNVSX4J1NVTX^ XWLSX4、X^LTX4、 X1NISX4, X1NITX4, X1NFSX4, X1NFTX4, X1NSSX4, X1NSTX4, X1NTSX4, X1NTTX4, X1NCSX4, X1NCTX4, X1NYSX4和X1NYTX4的成员,其中X1和X4如上定义。在根据这个实施方案的一个例子中,X1 不存在。在另一个例子中,X4不存在。在另外一个实施方案中,X1和X4都不存在。
因此,在另一个例子中,N联糖基化序列是选自NGS、NGT、NAS、NAT、NVS、NVT、NLS、NLT、NIS、NIT、NFS、NFT、NSS、NST、NTS、NTT、NCS, NCT、NYS 和 NYT 的成员。
在一个实施方案中,N联糖基化序列是根据式(II)的延长的糖基化序列。在另一 个实施方案中,当寡糖基转移酶是细菌起源的酶(例如,PglB)时,使用延长的糖基化序列。 在另一个实施方案中,式(II)中的X2是不带电的氨基酸。在根据这个实施方案的一个例 子中,N 联糖基化序列是选自 Xl X2' NGSX4, X1DX2' NGTX4, X1DX2' NASX4, X1DX2' NATX4, X1DX2 ‘ NVSX4、X1DX2 ‘ NVTX4、X1DX2 ‘ NLSX4、X1DX2 ‘ NLTX4、X1DX2 ‘ NISX4, X1DX2 ‘ NITX4, X1DX2‘ NFSX4和XlX2' NFTX4的成员,其中X1J2'禾Π X4如上定义。
在另一个例子中,N联糖基化序列是选自D X2' NGS, DX2 ‘ NGT, DX2 ‘ NAS, DX2' NAT, DX2' NVS, DX2' NVT, DX2' NLS,DX2' NLT,DX2' NIS, DX2' NIT, DX2' NFS 和 DX2' NFT的成员,其中X2'如上定义。在另一个例子中,上述实施方案的任何中的X2'选 自不带电的氨基酸。在一个例子中,X2'是G。在另一个例子中,X2'是A。在另外一个例 子中,X2'是V。在一个进一步的例子中,X2'是L。在一个进一步的例子中,X2'是I。在 一个进一步的实施方案中,X2'是F。
N联糖基化序列的定位
在一个实施方案中,当多肽的部分(例如,本发明的序列子多肽)时,N联糖基化 序列是寡糖基转移酶(例如,Stt3p或I^glB)的底物。在另一个例子中,糖基化序列是经修 饰的酶例如具有缺失或截短的膜锚着结构域的酶的底物。本发明的每个N联糖基化序列在 合适的糖基化反应过程中糖基化的效率可以依赖于酶的类型和性质,并且还可以依赖于糖 基化序列的前后关系,特别是糖基化位点周围的多肽的三维结构。
一般地,N联糖基化序列可以在多肽的氨基酸序列内的任何位置处引入。在一个 优选实施方案中,N联糖基化序列(在所使用的反应条件下)对于寡糖基转移酶是易接近 的。在一个例子中,糖基化序列在亲本多肽的N末端处引入(即,在第一个氨基酸前或紧在 第一个氨基酸后)(氨基末端突变体)。在另一个例子中,N联糖基化序列接近亲本多肽的 氨基末端引入(例如,在N末端的10个氨基酸残基内)。在另一个例子中,N联糖基化序列 紧在亲本多肽的最后一个氨基酸后定位于亲本多肽的C末端处(羧基末端突变体)。在另 外一个例子中,N联糖基化序列接近亲本多肽的C末端引入(例如,在C末端的10个氨基 酸残基内)。在另外一个例子中,N联糖基化序列定位于亲本多肽的N末端和C末端之间的 任何地方(内部突变体)。一般优选经修饰的多肽是生物活性的,即使该生物活性由相对应 的亲本多肽的生物活性改变。
影响序列子多肽的糖基化效率的重要因素是糖基化位点(例如,天冬酰胺侧链) 对于糖基/糖基(saccharyl)转移酶和其他反应配偶体包括溶剂分子的易接近性。如果糖 基化序列定位在多肽的内部结构域内,那么糖基化将可能是无效的。因此,在一个实施方案 中,糖基化序列在与多肽的溶剂暴露表面相对应的多肽区域处引入。示例性多肽构象是其 中糖基化序列的靶氨基不在内部定向的构象,与多肽的其他区域形成氢键。另一个示例性 构象是其中氨基不太可能与附近蛋白质形成氢键的构象。
在一个例子中,N联糖基化序列在亲本蛋白质的预先选择的特定区域内产生。在 自然界中,多肽主链的糖基化通常在多肽的环区域内出现,并且一般不在螺旋或β -片层 结构内出现。因此,在一个实施方案中,通过将N联糖基化序列引入与环结构域相对应的亲 本多肽区域内来产生本发明的序列子多肽。
例如,蛋白质BMP-7的晶体结构包含在Ala72和Ala86以及Ilei36和Proltl3之间的2 个延长的环区域。产生其中N联糖基化序列置于多肽序列的这些区域内的BMP-7突变体, 可以导致其中突变引起多肽的原始三级结构的很少破坏或无破坏的多肽。
然而,在β-片层或α-螺旋构象内包括的氨基酸位置处引入N联糖基化序列也 可以导致序列子多肽,其在新近引入的N联糖基化序列处被有效糖基化。N联糖基化序列引 入β-片层或α-螺旋结构域内可以引起多肽的结构改变,这进而使有效糖基化成为可能。
蛋白质的晶体结构可以用于鉴定野生型或亲本多肽的结构域,所述结构域最适合 于引入N联糖基化序列,并且可以允许预先选择有希望的修饰位点。
当晶体结构无法获得时,多肽的氨基酸序列可以用于预先选择有希望的修饰位点 (例如,环结构域与α-螺旋结构域的预测)。然而,即使多肽的三级结构是已知的,但结构 动力学和酶/受体相互作用在溶液中也是可变的。因此,合适的突变位点的鉴定以及合适 的糖基化序列的选择,可能涉及几种序列子多肽(例如,本发明的序列子多肽的文库)的产 生,并且使用合适的筛选方案例如本文描述的那些就所需特征测试这些变体。
在一个实施方案中,其中亲本多肽是抗体或抗体片段,抗体或抗体片段的恒定区 (例如,CH2结构域)用本发明的N联糖基化序列进行修饰。在一个例子中,N联糖基化序 列以这样的方式引入,使得天然存在的糖基化序列被替换或在功能上受损。关于抗体的恒 定区的氨基酸和核酸序列是本领域技术人员已知的。
在一个实施方案中,经过CH2结构域的所选区域执行序列子扫描,产生各自包括本 发明的外源N联糖基化序列的抗体的文库。在另外一个实施方案中,对所得到的多肽变体 实施旨在给糖基化序列添加糖基部分的酶促糖基化反应。充分糖基化的那些变体可以就 其结合合适受体(例如,F。受体,例如F。γ RIIIa)的能力进行分析。在一个实施方案中, 当与亲本抗体或其天然糖基化形式相比较时,此类糖基化抗体或抗体片段显示出对于F。受 体增加的结合亲和力。本发明的这个方面在2007年1月18日提交的美国临时专利申请 60/881,130中进一步描述,所述美国临时专利申请的公开内容整体合并入本文。所述修饰 可以改变抗体的效应子功能。在一个实施方案中,糖基化的抗体变体显示出减少的效应子 功能,例如对于天然杀伤细胞表面上或杀伤T细胞表面上发现的受体减少的结合亲和力。 在另一个例子中,当与未经修饰的抗体相比较时,抗体的糖缀合用于修饰经修饰的抗体的 药代动力学和/或药效性质。例如,糖缀合的抗体具有比未经修饰的抗体更长的体内半衰 期。
包括N联糖基化序列的肽连接体片段
在另一个实施方案中,不是将N联糖基化序列引入亲本多肽序列内,而是通过将 肽连接体片段加入亲本多肽的N或C末端来延长亲本多肽的序列,其中肽连接体片段包括 本发明的N联糖基化序列,例如“NLT”或“DFNVS”。肽连接体片段可以具有任何数目的氨 基酸。在一个实施方案中,肽连接体片段包括至少约5、至少约10、至少约15、至少约20、至 少约30、至少约50或超过50个氨基酸残基。肽连接体片段任选包括内部或末端氨基酸残 基,其具有反应性官能团,例如氨基(例如,赖氨酸)或巯基(例如,半胱氨酸)。此类反应 性官能团可以用于使多肽与另一个部分连接,所述另一个部分例如另一个多肽、细胞毒素、 小分子药物或本发明的另一个修饰基团。本发明的这个方面在2007年1月18日提交的美 国临时专利申请60/881,130中进一步描述,所述美国临时专利申请的公开内容整体合并入本文。
在一个实施方案中,由本发明的肽连接体片段修饰的亲本多肽是抗体或抗体片 段。在根据这个实施方案的一个例子中,亲本多肽是scFv。本文描述的方法可以用于制 备本发明的scFv,其中scFv或连接体用糖基部分或通过糖基连接基团与肽附着的修饰基 团进行修饰。糖基化和糖缀合的示例性方法在例如PCT/US02/32263和美国专利申请号 10/411,012中阐述,所述专利各自通过引用整体合并入本文。
在一个实施方案中,特定氨基酸残基包括在N联糖基化序列内,以调节突变多肽 在特定生物体例如大肠杆菌的表达性、蛋白水解稳定性、多肽的结构特征和/或其他性质。
示例性多肽
本发明的N联糖基化序列可以引入任何亲本多肽内,产生本发明的序列子多肽。 本发明的序列子多肽可以使用本领域已知和本文下文描述的方法来产生(例如,通过重组 技术或化学合成)。在一个实施方案中,亲本序列以这样的方式进行修饰,使得N联糖基化 序列插入亲本序列内,给亲本多肽的氨基酸序列添加氨基酸的整个长度和各自的数目。在 另一个实施方案中,N联糖基化序列替换亲本多肽的一个或多个氨基酸。在另一个实施方案 中,使用一个或多个预先存在的氨基酸将N联糖基化序列引入亲本多肽,以成为糖基化序 列的部分。例如,维持亲本肽中的天冬酰胺残基,并且使紧在脯氨酸后的那些氨基酸突变, 以产生本发明的N联糖基化序列。在另外一个实施方案中,采用氨基酸插入和已有氨基酸 替换的组合,产生N联糖基化序列。
在特定实施方案中,本发明的特定亲本多肽与本发明的特定N联糖基化序列结合 使用。示例性亲本多肽/N联糖基化序列组合概括于图6中。图6中的每行代表本发明的 一个示例性实施方案。所示组合可以在本发明的所有方面使用,包括单个序列子多肽、多肽 的文库、多肽缀合物和本发明的方法。本领域技术人员应当理解对于所示亲本多肽在图6 中所述的实施方案可以同样地应用于本文阐述的其他亲本多肽。本领域技术人员还应当理 解所列出的多肽可以以举例说明性方式与本文阐述的任何糖基化序列一起使用。
多肽的文库
用于鉴定多肽(当实施糖基化或糖缀合(例如,糖基PEG化)时,其是有效(例如, 具有满意的得率)糖基化或糖缀合的(例如,糖基PEGKW))的一个策略是在亲本多肽的 氨基酸序列内的各种不同位置处插入本发明的N联糖基化序列,例如包括β -片层结构域 和α -螺旋结构域,并且随后就其充当寡糖基转移酶的有效底物的能力测试许多所得到的 序列子多肽。
因此,在另一个方面,本发明提供了包括多个不同成员的序列子多肽的文库,其中 文库的每个成员与共同的亲本多肽相对应,并且包括至少一个独立选择的本发明的外源N 联糖基化序列。在一个实施方案中,文库的每个成员包括相同的N联糖基化序列,各自在亲 本多肽内的不同氨基酸位置处。在另一个实施方案中,文库的每个成员包括不同的N联糖 基化序列,然而,在亲本多肽的相同氨基酸位置处。与本发明的文库结合有用的N联糖基化 序列在本文中描述。在一个实施方案中,在本发明的文库中有用的N联糖基化序列具有根 据式(I) (SEQ ID NO 1)的氨基酸序列。在另一个实施方案中,在本发明的文库中有用的N 联糖基化序列具有根据式(II) (SEQ ID NO 2)的氨基酸序列。式(I)和式(II)在本文上 文中描述。
在一个优选实施方案中,与本发明的文库结合有用的N联糖基化序列具有 选自下述的氨基酸序列 iNGSX4、X1NGTX4, X1NASX4, X1NATX4, X1NVSX4, X1NVTX4, X1NLSX4, X1NLTX4、X1NISX4, X1NITX4, X1NFSX4 和 X1NFTX^ X1D X2 ‘ NGSX4、X1DX2 ‘ NGTX4、X1DX2 ‘ NASX4、 X1DX2 ‘ NATX4, X1DX2' NVSX4, X1DX2' NVTX4, X1DX2' NLSX4, X1DX2' NLTX4, X1DX2' NISX4s, X1DX2 ‘ NITX^XiDX2' NFSX4SnX1DX2' NFTX4,其中 X1、X2 ‘和 X4 如上定义。
在一个实施方案中,其中文库的每个成员具有共同的N联糖基化序列,亲本多肽 具有包括“III”个氨基酸的氨基酸序列。在一个例子中,序列子多肽的文库包括(a)在亲本 多肽内的第一个氨基酸位置(AA)n处具有N联糖基化序列的第一个序列子多肽,其中η是 选自1至m的成员;和(b)至少一个另外的序列子多肽,其中在每个另外的序列子多肽中, N联糖基化序列在另外的氨基酸位置处引入,每个另外的氨基酸位置处选自(AA)n+x和(AA) n-x’其中χ是选自1至(m-n)的成员。例如,第一个序列子多肽通过在第一个氨基酸位置处 引入所选N联糖基化序列而产生。后续序列子多肽随后可以通过在氨基酸位置处引入相同 的N联糖基化序列而产生,所述N联糖基化序列进一步朝向亲本多肽的N或C末端定位。
在这个背景中,当n-x是O(AAtl)时,那么糖基化序列紧在亲本多肽的N末端氨基 酸前引入。示例性序列子多肽可以具有部分序列ZNLTM1...,,
第一个氨基酸位置(AA)n可以是亲本多肽的氨基酸序列内的任何地方。在一个实 施方案中,选择第一个氨基酸位置处(例如,在环结构域的开始处)。
每个另外的氨基酸位置可以是亲本多肽内的任何地方。在一个例子中,序列子多 肽的文库包括在选自(AA)n+p和(AA) n_p的氨基酸位置处具有N联糖基化序列的第二个序列 子多肽,其中P选自1至约10、优选1至约8、更优选1至约6、更加优选1至约4且最优选 1至约2。在一个实施方案中,序列子多肽的文库包括在氨基酸位置(AA)n处具有N联糖基 化序列的第一个序列子多肽,和在氨基酸位置(AA) _或(AA)lri处具有N联糖基化序列的第 二个序列子多肽。
在另一个例子中,另外的氨基酸位置各自与先前选择的氨基酸位置紧邻。在另外 一个例子中,每个另外的氨基酸位置确切地远离先前选择的氨基酸位置1、2、3、4、5、6、7、8、 9或10个氨基酸。
在亲本多肽的“给定氨基酸位置处”引入N联糖基化序列意指突变紧接着给定氨 基酸位置(朝向C末端)的开始引入。引入可以通过完全插入(不替换任何已有氨基酸) 或通过替换任何数目的已有氨基酸而发生。
在一个示例性实施方案中,如下产生序列子多肽的文库通过在亲本多肽的连续 氨基酸位置处引入N联糖基化序列,各自定位紧邻先前选择的氨基酸位置,从而在氨基酸 链中“扫描”序列子多肽,直至达到所需的最终氨基酸位置。紧邻意指进一步朝向亲本多肽 的N或C末端确切地一个氨基酸位置。例如,第一个突变体通过在氨基酸位置AAn处引入 糖基化序列而产生。文库的第二个成员通过在氨基酸位置AAn+1处引入糖基化位点而产生, 第三个突变体在AAn+2处,等等。这个操作已命名为“序列子扫描”。本领域技术人员应当理 解序列子扫描可以涉及如此设计文库,使得第一个成员具有在氨基酸位置(AA)n处的糖基 化序列,第二个成员在氨基酸位置(AA)M处,第三个在(AA)n+4处等。同样地,文库的成员可 以通过糖基化序列的其他策略放置进行表征。例如
A)成员 1 (AA)n ;成员 2 (AA) n+3 ;成员 3 (AA) n+6 ;成员 4 (AA) n+9 等。
B)成员 1 (AA)n ;成员 2 (AA) n+4 ;成员 3 (AA) n+8 ;成员 4 (AA) n+12 等。
C)成员 1 (AA)n ;成员 2 (AA) n+5 ;成员 3 (AA) n+10 ;成员 4 (AA) n+15 等。
在一个实施方案中,通过在亲本多肽的特定区域(例如从特定环区域的开始到那 个环区域的结束)中扫描本发明的所选N联糖基化序列,制备序列子多肽的第一个文库。随 后通过在多肽的另一个区域中扫描相同糖基化序列,制备第二个文库,“跳过”定位在第一 个区域和第二个区域之间的那些氨基酸位置。省去的多肽链的部分可以例如对应于对于生 物活性重要的结合结构域或已知不适合于糖基化的多肽序列的另一个区域。通过对于另外 的多肽段执行“序列子扫描”,可以制备任何数目的另外文库。在一个示例性实施方案中,通 过在整个多肽中扫描N联糖基化序列,在亲本多肽内的每个氨基酸位置引入突变而制备文 库。
在一个实施方案中,文库的成员可以是多肽的混合物的部分。例如,用多种表达载 体感染细胞培养,其中每个载体包括关于本发明的不同序列子多肽的核酸序列。在表达后, 培养肉汤可以包含多个不同的序列子多肽,并且因此包括序列子多肽的文库。这种技术可 以用于测定文库的哪个序列子多肽在给定表达系统中最有效地表达。
在另一个实施方案中,文库的成员彼此分离存在。例如,可以分离上述混合物的至 少2个序列子多肽。经分离的多肽一起代表文库。备选地,分开表达文库的每个序列子多 肽,并且任选分离序列子多肽。在另一个例子中,文库的每个成员通过化学方法进行合成并 且任选进行纯化。
示例性多肽和多肽文库
示例性亲本多肽是重组人BMP-7。BMP-7作为示例性亲本多肽的选择用于举例说 明性目的,并且不意欲限制本发明的范围。本领域技术人员应当理解任何亲本多肽(例如, 本文阐述的那些)同样地适合于下述示例性修饰。因此获得的任何多肽变体都包括在本发 明的范围内。本发明的生物活性的BMP-7变体包括部分或完整的任何BMP-7多肽,其包括 不导致其生物活性基本上或完全丧失的至少一个修饰,如通过本领域技术人员已知的任何 合适的功能测定法测量的。下述序列(140个氨基酸)代表全长BMP-7序列(序列S. 1)的 生物活性部分
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 10)
基于上述亲本多肽序列的示例性BMP-7变体多肽在下表3_11中列出。
在一个示例性实施方案中,将突变引入野生型BMP-7氨基酸序列S. 1 (SEQ ID NO 10)内,替换亲本序列中相对应数目的氨基酸,导致包含与亲本多肽相同数目的氨基酸残基 的序列子多肽。例如,用N联糖基化序列“精氨酸-亮氨酸-苏氨酸”(NLT)直接置换通常 在BMP-7中的3个氨基酸,并且随后朝向多肽的C末端顺次移动NLT序列,提供各自包括 NLT的137个BMP-7变体。根据这个实施方案的示例性序列在下表3中列出。
表3 包括140个氨基酸的BMP-7变体的示例性文库,其中3个已有氨基酸由N联 糖基化序列“NLT”替换
在位置1处的引入,替换3个已有氨基酸
M'NLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC43EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 11)
^W 2处的引入,替换3个^有氨某酸
M'SNLTKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 12)
^W 3处的引入,替换3个^有氨某酸
M'STNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 13)
通过以上述方式在整个序列中“扫描”糖基化序列,可以产生另外的BMP-7变体。 因此获得的所有变体BMP-7序列在本发明的范围内。如此产生的最终序列子多肽具有下述 序列
^W 137处的引入,替换3个^有氨某酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACNLT(SEQ ID NO 14)
在另一个示例性实施方案中,通过给亲本序列添加一个或多个氨基酸,将N联糖 基化序列引入野生型BMP-7氨基酸序列S. 1 (SEQ ID NO=IO)内。例如,将N联糖基化序列 NLT加入亲本BMP-7序列中,替换亲本序列中的2、1或0个氨基酸。在这个例子中,所加入的 氨基酸残基的最大数目与所插入的糖基化序列的长度相对应。在一个示例性实施方案中, 亲本序列延长确切地一个氨基酸。例如,将N联糖基化序列NLT加入亲本BMP-7肽中,替换 通常存在于BMP-7中的2个氨基酸。根据这个实施方案的示例性序列在下表4中列出。
表4 包括141个氨基酸的突变型BMP-7多肽的示例性文库,其中2个已有氨基酸 由N联糖基化序列“NLT”替换
在位置1处的引入,替换2个氨基酸(ST)
M'NLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDW IIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDD S SNVILKKYRNMVVRACGCH(SEQ ID NO :15)
在位置2处的引入,替换2个氨基酸(TG)
M'SNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 16)
在位置3处的引入,替换2个氨基酸(GS)
M'STNLTKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :17)
在位置4处的引入,替换2个氨基酸(SK)
M'STGNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 18)
在位置5处的引入,替换2个氨基酸O(Q)
M'STGSNLTRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 19)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到下述序列,可以产生另 外的BMP-7变体
^W 138处的引入,替换2个^有氨某酸(CH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGNLT(SEQ ID NO 20)
因此获得的所有BMP-7变体在本发明的范围内。
另一个例子涉及给亲本多肽(例如,BMP-7)添加N联糖基化序列(例如,NLT),替 换亲本多肽中通常存在的1个氨基酸(双重氨基酸插入)。根据这个实施方案的示例性序 列在下表5中列出。
表5 包括NLT的BMP-7突变体的示例性文库;1个已有氨基酸的替换(142个氨基 酸)
在位置1处的引入,替换1个氨基酸(S)
M'NLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :21)
在位置2处的引入,替换1个氨基酸(T)
M'SNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 22)
在位置3处的引入,替换1个氨基酸(G)
M'STNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH ( SEQ ID NO 23)
在位置4处的引入,替换1个氨基酸(S)
M'STGNLTKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 24)
在位置5处的引入,替换1个氨基酸(K)
M'STGSNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :25)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到下述序列,可以产生另外的BMP-7变体
^W 139处的引入,替换1个^有氨某酸(H)
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCNLT(SEQ ID NO :26)
因此获得的所有BMP-7变体在本发明的范围内。
另外一个例子涉及在亲本多肽(例如,BMP-7)内的N联糖基化序列(例如,NLT) 的制备,不替换亲本多肽中通常存在的氨基酸,并且添加糖基化序列的整个长度(例如,关 于NLT的三重氨基酸插入)。根据这个实施方案的示例性序列在下表6中列出。
表6 包括NLT的BMP-7变体的示例性文库;3个氨基酸的添加(143个氨基酸)
在位置1处的引入,添加3个氨基酸
M'NLTSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 27)
在位置2处的引入,添加3个氨基酸
M'SNLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :28)
在位置3处的引入,添加3个氨基酸
M'STNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 29)
在位置4处的引入,添加3个氨基酸
M'STGNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 30)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7突变体
在位置140处的引入,添加3个氨基酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCHNL T(SEQ ID NO 31)
因此获得的所有BMP-7变体在本发明的范围内。
使用本发明的任何N联糖基化序列,可以产生与表3-6中的这些例子类似的 BMP-7变体。所有所得到的BMP-7变体在本发明的范围内。例如,代替NLT,可以使用序列 DRNLT(SEQ ID NO :32)。在一个示例性实施方案中,将DRNLT引入亲本多肽内,替换BMP-7 中通常存在的5个氨基酸。根据这个实施方案的示例性序列在下表7中列出
表7 包括DRNLT的BMP-7变体的示例性文库;5个氨基酸的替换(140个氨基酸)
M'DRNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no 33)
M'SDRNLTRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 34)
M'STDRNLTSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 35)
MiTCDRNLTQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 36)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的bmp-7突变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvrdrnlt(seq id no 37)
因此获得的所有突变型bmp-7序列在本发明的范围内。
在另一个例子中,将n联糖基化序列drnlt加入亲本多肽(例如,bmp-7)中在亲 本序列的n或c末端处或接近于亲本序列的n或c末端,给亲本多肽添加1至5个氨基酸。 根据这个实施方案的示例性序列在下表8中列出。
表8 包括drnlt的bmp-7变体的示例性文库
(141-145 个氨基酸)
氨基末端突变体
在位置1处的引入,添加5个氨基酸
M'DRNLTSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :38)
^l1 1处的弓丨入,添力d 41个氨(s)
M'DRNLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :39)
^l1 1 处的弓丨入,添力d 32 个氨(st)
M'DRNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYV SFRDLGffQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :40)
在位置1处的引入,添加2个氨基酸,替换3个氨基酸(STG)
MiDrnltskqrsqnrsktpknqealrmanvaens s sdqrqackkhelyvsfrdlgwqdwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(s eq id no 41)
^W 1处的引入,添加1个氨某酸,替换4个氨某酸(STGS)
MiDrnltkqrsqnrsktpknqealrmanvaens s sdqrqackkhelyvsfrdlgwqdWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :42)
羧基末端突变体
在位置140处的引入,添加5个氨基酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCHDRNL T(SEQ ID NO 43)
^W 139处的引入,添加4个M某酸,替换1个M某酸(H)
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMWRACGCDRNLT(SEQ ID NO :44)
^W 138处的引入,添加3个氨某酸,替换2个M某酸(CH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRAC⑶RNL T(SEQ ID NO 45)
^W 137处的引入,添加2个氨某酸,替换3个氨某酸(GCH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACDRNLT( SEQ ID NO 46)
在位置136处的引入,添加1个氨基酸,替换4个氨基酸(CGCH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRADRNLT(SEQ ID NO 47)
另外一个例子涉及将N联糖基化序列DFNVS (SEQ ID NO 48)插入亲本多肽(例 如,BMP-7)内,给亲本多肽添加1至5个氨基酸。根据这个实施方案的示例性序列在下表9 中列出。
表9 包括DFNVS的BMP-7变体的示例性文库
1个氨基酸的插入
M'DFNVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 49)
M'SDFNVSQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 50)
M'STDFNVSRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYV SFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 51)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7突变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRADFNVS(SEQ ID NO 52)
因此获得的所有BMP-7变体在本发明的范围内。
2个氨基酸的插入
M'DFNVSSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH( SEQ ID NO 53)
M'SDFNVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 54)
M'STDFNVSQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(S EQ ID NO 55)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACDFNVS ( SEQ ID NO 56)
因此获得的所有BMP-7变体在本发明的范围内。
3个氨基酸的插入
M'DFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 57)
M'SDFNVSSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH( SEQ ID NO 58)
MiStdfnVSKQRS QNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH (SEQ ID NO 59)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGDFNVS( SEQ ID NO 60)
因此获得的所有BMP-7变体在本发明的范围内。
4个氨基酸的插入
M'DFNVSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGC H(SEQ ID NO 61)
M'SDFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ DWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :62)
MiSTDFNVS SKQRS QNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH (SEQ ID NO 63)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCDFNV S (SEQ ID NO 64)
因此获得的所有BMP-7变体在本发明的范围内。
5个氨基酸的插入
M'DFNVSSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEG YAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACG CH(SEQ ID NO 65)
M'SDFNVSTGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGff QDffIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :66)
M'STDFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ DWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :67)
通过以上述方式在整个序列中“扫描”糖基化序列直至达到最终序列,可以产生另 外的BMP-7变体
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCHDFN VS (SEQ ID NO 68)
因此获得的所有BMP-7变体在本发明的范围内。
在一个例子中,通过已有氨基酸的置换和/或通过插入,将N联糖基化序列(例 如,NLT或NVQ放置在所选择的多肽区域内的所有可能的氨基酸位置处。根据这个实施方 案的示例性序列在下表10和11中列出。
表10 包括在A73和A82之间的NLT的BMP-7变体的示例性文库
已有氨基酸的置换
---A73FPLNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SE Q IDNO 69)(亲本)
---N73LTLNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SEQID NO :70)
---A73NLTNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SEQID NO :71)50—a73fnltsymna82tnhaivqtlvhfi95npetvpkp103-—(seqidno :72)---a73fpnltymna82tnhaιvqtlvhfι95Npetvpkp103--- (seqidno :73)---a73fplnltmna82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :74)---a73fplnnltna82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :75)---a73fplnsnlta82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :76)-—a73fplnsynlt82tnhaivqtlvhfi95npetvpkp103-—(seqidno :77) 表11 :何括在i95和pltl3之间的nlt的bmp-7变体的示例性文库 r有氨某酸的置换—a73fplnsymna82tnhaivqtlvhfn95ltetvpkp103-—(seqid no :78)—a73fplnsymna82tnhaivqtlvhfi95nlttvpkp103-—(seqidno :79)-—a73fplnsymna82tnhaivqtlvhfi95nnltvpkp103—(seqidno :80)—a73fplnsymna82tnhaivqtlvhfi95npnltpkp103-—(seqidno :81)—a73fplnsymna82tnhaivqtlvhfi95npenltkp103-—(seqidno :82)—a73fplnsymna82tnhaivqtlvhfi95npetnltp103-—(seqidno :83)—a73fplnsymna82tnhaivqtlvhfi95npetvnlt103-—(seqidno :84) 在r有氨某丨旬6勺捅入(添加1个氨某酸)
---n73ltplnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:85)
---a73nltlnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:86)
---a73fnltnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:87)
---a73fpnltsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:88)
---a73fplnltymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:89)
---a73fplnnltmna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:90)
---a73fplnsnltna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:91)
---a73fplnsynlta83tnhaivqtlvhfi96npetvpkp104-—(seqidno:92)
---a73fplnsymnlt83tnhaivqtlvhfi96npetvpkp104-—-(seqidno:93)在酸少间的插入(添加1个氨基酸)
---a73fplnsymna82tnhaivqtlvhfn95ltpetvpkp104-—(seqidno:94)
---a73fplnsymna82tnhaivqtlvhfi95nltetvpkp104-—(seqidno:95)
---a73fplnsymna82tnhaivqtlvhfi95nnlttvpkp104-—-(seqidno:96)
---a73fplnsymna82tnhaivqtlvhfi95npnltvpkp104-—-(seqidno:97)
---a73fplnsymna82tnhaivqtlvhfi95npenltpkp104-—-(seqidno:98)
---a73fplnsymna82tnhaivqtlvhfi95npetnltkp104-—-(seqidno:99)
---a73fplnsymna82tnhaivqtlvhfi95npetvnltp104-—-(seqidno:100)
---a73fplnsymna82tnhaivqtlvhfi95npetvpnlt104-—-(seqidno:101)
上述置换和插入可以使用本发明的任何n联糖基化序列例如nlt 禾口 seq32和48来进行。因此获得的所有bmp-7变体在本发明的范围内。
在另一个示例性实施方案中,将一个或多个n联糖基化序列(例如上文阐述的那 些)插入血液凝固因子内,例如因子vii、因子viii或因子ix多肽。如在bmp-7背景中所 述,n联糖基化序列可以插入用bmp-7例示的多种基序中的任何中。例如,n联糖基化序列可以插入野生型序列内而不替换野生型序列天然的任何一个或多个氨基酸。在一个示例性 实施方案中,N联糖基化序列插入在多肽的N或C末端处或接近多肽的N或C末端。在另 一个示例性实施方案中,在插入N联糖基化序列前,去除野生型多肽序列天然的一个或多 个氨基酸残基。在另外一个示例性实施方案中,野生型多肽序列天然的一个或多个氨基酸 残基是N联糖基化序列的组分(例如,天冬酰胺),并且N联糖基化序列包括一个或多个野 生型氨基酸。一个或多个野生型氨基酸可以在N联糖基化序列的任一末端处或N联糖基化 序列的内部。
此外,任何预先存在的N联或0联糖基化序列可以替换为本发明的N联糖基化序 列。此外,N联糖基化序列可以插入邻近一个或多个0联糖基化序列。在一个实施方案中, N联糖基化序列的存在阻止0联糖基化序列的糖基化。
在一个代表性例子中,亲本多肽是因子VIII。在这个实施方案中,N联糖基化序列 可以插入根据上文阐述的任何基序的A、B或C结构域内。超过一个N联糖基化序列可以插 入单个结构域或超过一个结构域内;再次,根据上文的任何基序。例如,N联糖基化序列可 以插入A、B和C结构域、A和C结构域、A和B结构域或B和C结构域各自内。备选地,N联 糖基化序列可以侧接A和B结构域或B和C结构域。关于因子VIII的示例性氨基酸序列 在图2中提供。
在另一个示例性实施方案中,因子VIII多肽是B结构域缺失(BDD)的因子VIII 多肽。在这个实施方案中,N联糖基化序列可以插入使因子VIII异二聚体的SOKd和90Kd 亚单位连接的肽连接体内。备选地,N联糖基化序列可以侧接A结构域和连接体或C结构域 和连接体。如上文在BMP-7背景中所述,N联糖基化序列可以插入而不替换已有氨基酸,或 可以插入而替换亲本多肽的一个或多个氨基酸。关于B结构域缺失(BDD)的因子VIII的 示例性序列在图3中提供。
其他B结构域缺失的因子VIII多肽也适合于与本发明一起使用,包括例如 Sandberg 等人,kminars in Hematology 38(2) :4-12(2000)中公开的 B 结构域缺失的因 子VIII多肽,其公开内容通过引用合并入本文。
如对于本领域技术人员显而易见的,包括本发明的超过一个突变型N联糖基化序 列的多肽也在本发明的范围内。可以引入另外的突变,以允许调节多肽性质,例如生物活 性、代谢活性(例如,减少的蛋白水解)、药代动力学等。
制备多种变体后,它们可以就其充当用于N联糖基化或糖基PEG化的底物的能力 进行评估。成功的糖基化和/或糖基PEG化可以使用本领域已知的方法进行检测且定量, 所述方法例如质谱法(例如,MALDI-T0F或Q-T0F)、凝胶电泳(例如,与光密度法相组合) 或色谱分析(例如,HPLC)。生物测定法例如酶抑制测定法、受体结合测定法和/或基于细 胞的测定法可以用于分析给定多肽或多肽缀合物的生物活性。评估策略在本文下文中更详 细地描述(参见例如,“引导多肽的鉴定”)。选择和/或开发用于每种多肽的化学和生物评 估的合适测定法系统在本领域技术人员的能力内。
多肽缀合物
在另一个方面,本发明提供了在多肽(例如,序列子多肽)和所选择的修饰基团 (例如,聚合修饰基团)之间的共价缀合物,其中修饰基团经由糖基连接基团(例如,完整 的糖基连接基团)与多肽缀合。糖基连接基团插入多肽和修饰基团之间,并且与多肽和修饰基团连接。在制备目前的多肽缀合物中有用的示例性方法在本文中阐述。其他有用的 方法在美国专利号 5,876,980 ;6,030,815 ;5,728,554 ;和 5,922,577,以及 WO 98/31826 ; W02003/031464 ;W02005/070138 ;W02004/99231 ;W02004/10327 ;W02006/074279 ;和美国专 利申请公开2003180835中阐述,所有所述专利为了所有目的通过引用合并入本文。
本发明的缀合物将一般对应于一般结构
权利要求
1.在糖基化或非糖基化多肽和聚合修饰基团之间的共价缀合物,所述多肽包括选自 SEQ ID NO 1和SEQ ID NO 2的外源N联糖基化序列X1N X2X3X4 (SEQ ID NO 1);禾口 X1D X2’ N X2X3X4 (SEQ ID NO 2), 其中N是天冬酰胺; D是天冬氨酸;X3是选自苏氨酸⑴和丝氨酸⑶的成员; X1存在或不存在,并且当存在时是氨基酸; X4存在或不存在,并且当存在时是氨基酸;和 X2和X2,是独立地选择的氨基酸,前提是X2和X2,不是脯氨酸(P), 其中所述聚合修饰基团经由糖基连接基团在所述N联糖基化序列的所述天冬酰胺残 基处与所述多肽共价缀合,所述糖基连接基团插入所述天冬酰胺和所述聚合修饰基团之 间,并且与所述天冬酰胺和所述聚合修饰基团共价连接,其中所述糖基连接基团是选自单 糖和寡糖的成员。
2.根据权利要求1的共价缀合物,其中所述外源N联糖基化序列是选自NX2T和N X2S 的成员。
3.根据权利要求1的共价缀合物,其中所述聚合修饰基团是选自线性和分支聚合部分 的成员。
4.根据权利要求3的共价缀合物,其中所述聚合修饰基团是水溶性聚合物。
5.根据权利要求4的共价缀合物,其中所述水溶性聚合物是选自聚环氧烷、右旋糖酐 和多唾液酸的成员。
6.根据权利要求5的共价缀合物,其中所述聚环氧烷是选自聚(乙二醇)(PEG)、聚(丙 二醇)(PPG)及其衍生物的成员。
7.根据权利要求1的共价缀合物,所述多肽与亲本多肽相对应,所述亲本多肽是治疗 性多肽。
8.根据权利要求1的共价缀合物,其中所述多肽与亲本多肽相对应,所述亲本多肽是 选自下述的成员肝细胞生长因子(HGF)、神经生长因子(NGF)、表皮生长因子(EGF)、成 纤维细胞生长因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、 FGF-10、FGF-ll、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、 FGF-21、FGF-22、FGF-23、角质化细胞生长因子(KGF)、巨核细胞生长和发育因子(MGDF)、血 小板衍生的生长因子(PDGF)、转化生长因子-α (TGF- α )、TGF- β、TGF- β 2、TGF- β 3、血管 内皮生长因子(VEGF)、VEGF抑制剂、骨生长因子(BGF)、神经胶质生长因子、肝素结合的促 神经突生长因子(HBNF)、Cl酯酶抑制剂、人生长激素(hGH)、促卵泡激素(FSH)、促甲状腺 激素(TSH)、甲状旁腺激素、促滤泡素-α、促滤泡素-β、滤泡抑素、促黄体激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干扰素- a (INF-α )、INF-β、INF-γ、INF-ω、INF- τ、 胰岛素、葡糖脑苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麦芽糖酶)、艾杜糖醛 酸酶、甲状腺过氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神经酰胺酶、鞘磷脂酶、丁酰胆碱酯酶、尿激酶、α -半乳糖苷酶Α、骨形态发生蛋白质-1 (BMP-I)、 ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、ΒΜΡ-5、ΒΜΡ-6、ΒΜΡ-7、ΒΜΡ-8、ΒΜΡ-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促红细胞生成素(EPO)、新红细胞生成刺激蛋白质 (NESP)、生长分化因子(⑶F)、神经胶质细胞系衍生的神经营养因子(⑶NF)、脑源性神经营 养因子(BDNF)、肌肉生长抑制素、神经生长因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬 细胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或α-1蛋白酶抑制剂)、组织型纤溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白质(HbsAg)、人 绒毛膜促性腺素(hCG)、骨桥蛋白、护骨素、蛋白质C、生长调节素-1、促生长素、生长激素、 嵌合白喉毒素-IL-2、胰高血糖素样肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、α -CD20、肿瘤坏死因子(TNF) ,TNF- α 抑制剂、 TNF受体(TNF-R)、Ρ-选择素糖蛋白配体-I(PSGL-I)、补体、转铁蛋白、糖基化依赖性细胞粘 附分子(GlyCAM)、神经细胞粘附分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫状神经营养因子(CNTF)、淋巴毒素-β受体(LT-β受体)、纤维 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、 ⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰岛素样生长因子、胰岛素样生长因子结合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之间的复合物、针对内皮生长 因子(EGF)的抗体、针对血管内皮生长因子(VEGF)的抗体、针对成纤维细胞生长因子(FGF) 的抗体、抗TNF抗体、TNF受体-IgG Fc区融合蛋白、抗HER2抗体、针对呼吸道合胞病毒的 蛋白质F的抗体、针对TNF-α的抗体、针对糖蛋白nb/IIIa的抗体、针对CD20的抗体、针 对⑶4的抗体、针对α -⑶3的抗体、针对⑶40L的抗体、针对⑶IM的抗体、针对PSGL-I的 抗体和针对癌胚抗原(CEA)的抗体。
9.根据权利要求1的共价缀合物,其中所述外源N联糖基化序列是寡糖基转移酶的底物。
10.根据权利要求9的共价缀合物,其中所述寡糖基转移酶是重组酶。
11.根据权利要求9的共价缀合物,其中所述寡糖基转移酶是选自I^glB和Stt3p及其 可溶性变体的成员。
12.根据权利要求1的共价缀合物,其中所述糖基连接基团是完整的糖基连接基团。
13.根据权利要求1的共价缀合物,其中所述糖基连接基团是其为选自下述的成 员的残基GlcNAc、GlcNH、baci 1 losamine、6-hydroxybaci 1 losamine、 GalNAc、 GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybaciIlosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia、GlcNAc-Gal 、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man, GlcNAc-GlcNAc-Man (Man)2 及其组合。
14.组合物,其包括根据权利要求1的共价缀合物和所述多肽在其中表达的细胞。
15.药物组合物,其包括根据权利要求1的共价缀合物和药学上可接受的载体。
16.化合物,其具有根据式(X)的结构
17.根据权利要求16的化合物,其中所述聚合修饰基团是选自线性和分支聚合部分的 成员。
18.根据权利要求17的化合物,其中所述聚合修饰基团是水溶性聚合物。
19.根据权利要求18的化合物,其中所述水溶性聚合物是选自聚环氧烷、右旋糖酐和 多唾液酸的成员。
20.根据权利要求19的化合物,其中所述聚环氧烷是选自聚(乙二醇)(PEG)、聚(丙 二醇)(PPG)及其衍生物的成员。
21.根据权利要求16的化合物,其中Z*是选自单触角、二触角、三触角和四触角聚糖的 成员。
22.根据权利要求16的化合物,其中Z*是选自下述的成员GlcNAc、GlcNH、 bacillosamine、6_hydroxybacillosamine、GalNAc、GalNH、GlcNAc—GlcNAc、GlcNAc—GlcNH、 6-hydroxybacilIosamine-GalNAc> GalNAc-Gal-Sia 、GlcNAc-GlcNAc-Gal-Sia 、 GlcNAc-Gal 、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man、GlcNAc-GlcNAc-Man (Man)2 及其组口 O
23.根据权利要求16的化合物,其中所述脂质部分包括在直链或支链中排列的1至约 100个碳原子,所述链包括独立地选自饱和和不饱和的碳-碳键,所述链任选包括一个或多 个芳香族或非芳香族环结构且任选包括至少一个官能团。
24.根据权利要求23的化合物,其中所述官能团是选自醚、硫醚、胺、甲酰胺、磺胺、胼、 羰基、氨基甲酸酯、尿素、硫脲、酯和碳酸酯的成员。
25.根据权利要求16的化合物,其中所述脂质部分是取代的烷基。
26.根据权利要求25的化合物,其中所述脂质部分是选自多萜醇、还原或部分还原的 多萜醇、异戊二烯基部分、还原的异戊二烯基部分、聚-异戊二烯基部分和还原或部分还原 的聚-异戊二烯基部分的成员。
27.根据权利要求沈的化合物,其中所述聚-异戊二烯基部分是十一异戊烯。
28.根据权利要求25的化合物,其中所述脂质部分具有选自下述的成员的结构
29.根据权利要求16的化合物,其中Rfc具有选自下述的成员的结构
30.根据权利要求16的化合物,其具有下述结构
31.根据权利要求30的化合物,其具有选自下述的成员的结构
32.根据权利要求31的化合物,其具有选自下述的成员的结构
33.组合物,其包括细胞和根据权利要求16的化合物。
34.多肽,其包括选自SEQID NO 1和SEQ ID NO 2的外源N联糖基化序列 X1N X2X3X4 (SEQ ID NO 1);禾口X1D X2' NX2X3X4 (SEQ ID NO 2), 其中N是天冬酰胺; D是天冬氨酸;X3是选自苏氨酸⑴和丝氨酸⑶的成员;X1存在或不存在,并且当存在时是氨基酸;X4存在或不存在,并且当存在时是氨基酸;和X2和X2,是独立地选择的氨基酸,前提是X2和X2,不是脯氨酸(P)。
35.经分离的核酸,其编码权利要求34的所述多肽。
36.表达载体,其包括权利要求35的所述核酸。
37.细胞,其包括权利要求35的所述核酸。
38.包括多个不同成员的多肽的文库,其中所述文库的每个成员与共同的亲本多肽相 对应,并且其中所述文库的每个成员包括外源N联糖基化序列,其中所述N联糖基化序列各 自是独立地选自SEQ ID NO 1和SEQ ID NO 2的成员X1NX2X3X4 (SEQ ID NO 1);禾口 X1D X2,N X2X3X4(SEQ ID NO 2) 其中N是天冬酰胺; D是天冬氨酸;X3是选自苏氨酸⑴和丝氨酸⑶的成员;X1存在或不存在,并且当存在时是氨基酸;X4存在或不存在,并且当存在时是氨基酸;和X2和X2'是独立地选择的氨基酸,前提是X2和X2,不是脯氨酸(P)。
39.根据权利要求38的文库,其中所述外源N联糖基化序列是选自NX2T和N X2S的 成员。
40.根据权利要求38的文库,其中所述文库的每个成员包括在所述亲本多肽内的不同 氨基酸位置处的相同N联糖基化序列。
41.根据权利要求38的文库,其中所述文库的每个成员包括在所述亲本多肽内的相同 氨基酸位置处的不同N联糖基化序列。
42.根据权利要求38的文库,其中所述N联糖基化序列是寡糖基转移酶的底物。
43.根据权利要求42的文库,其中所述寡糖基转移酶是重组酶。
44.根据权利要求42的文库,其中所述寡糖基转移酶是选自I^glB和及其可溶性 变体的成员。
45.根据权利要求38的文库,其中所述亲本多肽是选自下述的成员肝细胞生长因子 (HGF)、神经生长因子(NGF)、表皮生长因子(EGF)、成纤维细胞生长因子-I(FGF-I)、FGF-2、 FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、FGF-11、FGF-12、FGF-13、FGF-14、 FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、FGF-22、FGF-23、角质化细胞生长 因子(KGF)、巨核细胞生长和发育因子(MGDF)、血小板衍生的生长因子(PDGF)、转化生长因 子-α 0^^-0)、16卩-0、16卩-0 2、16卩-0 3、血管内皮生长因子(VEGF)、VEGF抑制剂、骨生 长因子(BGF)、神经胶质生长因子、肝素结合的促神经突生长因子(HBNF)、Cl酯酶抑制剂、 人生长激素(hGH)、促卵泡激素(FSH)、促甲状腺激素(TSH)、甲状旁腺激素、促滤泡素-α、促滤泡素- β、滤泡抑素、促黄体激素(LH)、白介素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、 IL-7、IL-8、IL-9、IL-10、IL-IU IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、干扰 素-a (INF- α ), INF-β、INF- γ , INF-ω, INF-τ、胰岛素、葡糖脑苷酯酶、α -半乳糖苷 酶、酸性-α-葡糖苷酶(酸性麦芽糖酶)、艾杜糖醛酸酶、甲状腺过氧化物酶(ΤΡ0)、β_葡 糖苷酶、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神经酰胺酶、鞘磷脂酶、丁酰胆碱酯酶、尿激 酶、α -半乳糖苷酶 Α、骨形态发生蛋白质-1 (BMP-I)、ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、ΒΜΡ-5、ΒΜΡ-6、 ΒΜΡ-7、ΒΜΡ-8、ΒΜΡ-9、BMP-10、BMP-11、BMP-12、BMP-13、BMP-14、BMP-15、ΝΤ-3、ΝΤ-4、ΝΤ-5、 促红细胞生成素(EPO)、新红细胞生成刺激蛋白质(NESP)、生长分化因子(⑶F)、神经胶质 细胞系衍生的神经营养因子(⑶NF)、脑源性神经营养因子(BDNF)、肌肉生长抑制素、神经 生长因子(NGF)、血管性血友病因子(vWF)、切割vWF的蛋白酶(vWF-蛋白酶、vWF-降解蛋白 酶)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、α r抗胰 蛋白酶(ATT或α-1蛋白酶抑制剂)、组织型纤溶酶原激活物(TPA)、水蛭素、瘦素、尿激酶、 人DNA酶、胰岛素、乙型肝炎表面蛋白质(HbsAg)、人绒毛膜促性腺素(hCG)、骨桥蛋白、护 骨素、蛋白质C、生长调节素-1、促生长素、生长激素、嵌合白喉毒素-IL-2、胰高血糖素样肽 (GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、抗凝血酶III (AT-III)、prokinetisin、 CD4、α-CD20、肿瘤坏死因子(TNF)、TNF-α抑制剂、TNF受体(TNF-R)、P-选择素糖蛋白配 体-1 (PSGL-I)、补体、转铁蛋白、糖基化依赖性细胞粘附分子OnyCAM)、神经细胞粘附分子 (N-CAM)、TNF受体-IgG Fc区融合蛋白、extendin_4、BDNF、β -2-微球蛋白、睫状神经营养 因子(CNTF)、淋巴毒素-β受体(LT-β受体)、纤维蛋白原、⑶F-1、⑶F-2、⑶F-3、⑶F-4、 GDF-5, GDF-6, GDF-7, GDF-8, GDF-9, GDF-10, GDF-IU GDF-12, GDF-13, GDF-14, GDF-15, GLP-1、胰岛素样生长因子、胰岛素样生长因子结合蛋白(IGB)、IGF/IBP-2、IGF/IBP-3、 IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、IGF/IBP-9、IGF/IBP-10、IGF/ IBP-IU IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子 IX、因子 X、血管性血 友病因子(vWF)和因子VIII之间的复合物、针对内皮生长因子(EGF)的抗体、针对血管内 皮生长因子(VEGF)的抗体、针对成纤维细胞生长因子(FGF)的抗体、抗TNF抗体、TNF受 体-IgG Fc区融合蛋白、抗HER2抗体、针对呼吸道合胞病毒的蛋白质F的抗体、针对TNF- α 的抗体、针对糖蛋白Ilb/IIIa的抗体、针对⑶20的抗体、针对⑶4的抗体、针对α -⑶3的 抗体、针对CD40L的抗体、针对CDlM的抗体、针对PSGL-I的抗体和针对癌胚抗原(CEA)的 抗体。
46.形成在多肽和聚合修饰基团之间的共价缀合物的无细胞的体外方法,其中所述多 肽包括包含天冬酰胺残基的N联糖基化序列,所述修饰基团经由糖基连接基团在所述天冬 酰胺残基处与所述多肽共价连接,所述糖基连接基团插入所述天冬酰胺和所述修饰基团之 间,并且与所述天冬酰胺和所述修饰基团共价连接,所述方法包括在寡糖基转移酶的存在 下,在足以使所述寡糖基转移酶将糖基部分从所述化合物转移到所述N联糖基化序列的所 述天冬酰胺残基上的条件下,使所述多肽和根据权利要求16的化合物相接触,从而形成所 述共价缀合物。
47.根据权利要求46的方法,其进一步包括在宿主细胞中表达所述多肽。
48.根据权利要求47的方法,其进一步包括产生包括编码所述多肽的核酸序列的表 达载体。
49.根据权利要求48的方法,其进一步包括用所述表达载体转染所述宿主细胞。
50.根据权利要求46的方法,其进一步包括分离所述共价缀合物。
51.根据权利要求46的方法,其中所述聚合修饰基团是选自线性和分支聚合部分的成员O
52.根据权利要求51的方法,其中所述聚合修饰基团是水溶性聚合物。
53.根据权利要求52的方法,其中所述水溶性聚合物是选自聚环氧烷、右旋糖酐和多 唾液酸的成员。
54.根据权利要求53的方法,其中所述聚环氧烷是选自聚(乙二醇)(PEG)、聚(丙二 醇)(PPG)及其衍生物的成员。
55.根据权利要求46的方法,其中所述多肽与亲本多肽相对应,所述亲本多肽是治疗 多肽。
56.根据权利要求46的方法,其中所述多肽与亲本多肽相对应,所述亲本多肽是选自 下述的成员肝细胞生长因子(HGF)、神经生长因子(NGF)、表皮生长因子(EGF)、成纤维细 胞生长因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、 FGF-11、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、 FGF-22、FGF-23、角质化细胞生长因子(KGF)、巨核细胞生长和发育因子(MGDF)、血小板衍 生的生长因子(PDGF)、转化生长因子-α (TGF-α)、TGF-β、TGF-β 2、TGF-β 3、血管内皮 生长因子(VEGF)、VEGF抑制剂、骨生长因子(BGF)、神经胶质生长因子、肝素结合的促神 经突生长因子(HBNF)、Cl酯酶抑制剂、人生长激素(hGH)、促卵泡激素(FSH)、促甲状腺激 素(TSH)、甲状旁腺激素、促滤泡素-α、促滤泡素-β、滤泡抑素、促黄体激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干扰素- a (INF-a )、INF-β、INF-γ、INF-ω、INF- τ、 胰岛素、葡糖脑苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麦芽糖酶)、艾杜糖醛 酸酶、甲状腺过氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、a -葡糖神经酰 胺酶、鞘磷脂酶、丁酰胆碱酯酶、尿激酶、a -半乳糖苷酶A、骨形态发生蛋白质-1 (BMP-I)、 BMP-2、BMP-3、BMP-4、BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促红细胞生成素(EPO)、新红细胞生成刺激蛋白质 (NESP)、生长分化因子(⑶F)、神经胶质细胞系衍生的神经营养因子(⑶NF)、脑源性神经营 养因子(BDNF)、肌肉生长抑制素、神经生长因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬 细胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或a-1蛋白酶抑制剂)、组织型纤溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白质(HbsAg)、人 绒毛膜促性腺素(hCG)、骨桥蛋白、护骨素、蛋白质C、生长调节素-1、促生长素、生长激素、 嵌合白喉毒素-IL-2、胰高血糖素样肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、a -CD20、肿瘤坏死因子(TNF) ,TNF- α 抑制剂、 TNF受体(TNF-R)、P-选择素糖蛋白配体-I(PSGL-I)、补体、转铁蛋白、糖基化依赖性细胞粘 附分子(GlyCAM)、神经细胞粘附分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫状神经营养因子(CNTF)、淋巴毒素-β受体(LT-β受体)、纤维 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰岛素样生长因子、胰岛素样生长因子结合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之间的复合物、针对内皮生长 因子(EGF)的抗体、针对血管内皮生长因子(VEGF)的抗体、针对成纤维细胞生长因子(FGF) 的抗体、抗TNF抗体、TNF受体-IgG Fc区融合蛋白、抗HER2抗体、针对呼吸道合胞病毒的 蛋白质F的抗体、针对TNF-α的抗体、针对糖蛋白nb/IIIa的抗体、针对CD20的抗体、针 对⑶4的抗体、针对α -⑶3的抗体、针对⑶40L的抗体、针对⑶154的抗体、针对PSGL-I的 抗体和针对癌胚抗原(CEA)的抗体。
57.根据权利要求46的方法,其中所述寡糖基转移酶是重组酶。
58.根据权利要求46的方法,其中所述寡糖基转移酶是选自I^glB和及其可溶性 变体的成员。
59.根据权利要求46的方法,其中所述糖基连接基团是完整的糖基连接基团。
60.根据权利要求46的方法,其中所述糖基连接基团是其为选自下述的成员 的残基GlcNAc、GlcNH、bacillosamine、6-hydroxybacillosamine、 GalNAc、GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybacillosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia 、GlcNAc-Gal 、GlcNAc-Gal-Sia 、GlcNAc-GlcNAc-Man, GlcNAc-GlcNAc-Man (Man) 2 及其组合。
61.形成在多肽和聚合修饰基团之间的共价缀合物的方法,所述多肽包括包含天冬酰 胺残基的N联糖基化序列,所述修饰基团经由糖基连接基团在所述天冬酰胺残基处与所述 多肽共价连接,所述糖基连接基团插入所述天冬酰胺和所述修饰基团之间,并且与所述天 冬酰胺和所述修饰基团共价连接,所述方法包括(i)在寡糖基转移酶的存在下,在足以使所述寡糖基转移酶将与所述修饰基团共价连 接的糖基部分从所述化合物转移到所述N联糖基化序列的所述天冬酰胺残基上的条件下, 使所述多肽和根据权利要求16的化合物相接触,其中所述接触在所述多肽在其中表达的 宿主细胞内发生,从而形成所述共价缀合物。
62.根据权利要求61的方法,其进一步包括( )使所述宿主细胞与所述化合物相接触;和(iii)在足以使所述宿主细胞内在化所述化合物的条件下温育所述宿主细胞。
63.根据权利要求61的方法,其中所述细胞存在于细胞培养基中,所述细胞培养基补 充有所述化合物。
64.根据权利要求61的方法,其进一步包括分离所述共价缀合物。
65.根据权利要求61的方法,其进一步包括产生包括编码所述多肽的核酸序列的表 达载体。
66.根据权利要求65的方法,其进一步包括用所述表达载体转染所述宿主细胞。
67.根据权利要求61的方法,其中所述聚合修饰基团是选自线性和分支聚合部分的成员。
68.根据权利要求61的方法,其中所述聚合修饰基团是水溶性聚合物。
69.根据权利要求68的方法,其中所述水溶性聚合物是选自聚环氧烷、右旋糖酐和多 唾液酸的成员。
70.根据权利要求69的方法,其中所述聚环氧烷是选自聚(乙二醇)(PEG)、聚(丙二 醇)(PPG)及其衍生物的成员。
71.根据权利要求61的方法,其中所述多肽与亲本多肽相对应,所述亲本多肽是治疗 性多肽。
72.根据权利要求61的方法,其中所述多肽与亲本多肽相对应,所述亲本多肽是选自 下述的成员肝细胞生长因子(HGF)、神经生长因子(NGF)、表皮生长因子(EGF)、成纤维细 胞生长因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10, FGF-11、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、 FGF-22、FGF-23、角质化细胞生长因子(KGF)、巨核细胞生长和发育因子(MGDF)、血小板衍 生的生长因子(PDGF)、转化生长因子-α (TGF-α)、TGF-β、TGF-β 2、TGF-β 3、血管内皮 生长因子(VEGF)、VEGF抑制剂、骨生长因子(BGF)、神经胶质生长因子、肝素结合的促神 经突生长因子(HBNF)、Cl酯酶抑制剂、人生长激素(hGH)、促卵泡激素(FSH)、促甲状腺激 素(TSH)、甲状旁腺激素、促滤泡素-α、促滤泡素-β、滤泡抑素、促黄体激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干扰素- a (INF-a )、INF-β、INF-γ、INF-ω、INF- τ、 胰岛素、葡糖脑苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麦芽糖酶)、艾杜糖醛 酸酶、甲状腺过氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、a -葡糖神经酰 胺酶、鞘磷脂酶、丁酰胆碱酯酶、尿激酶、a -半乳糖苷酶A、骨形态发生蛋白质-1 (BMP-I)、 BMP-2、BMP-3、BMP-4、BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促红细胞生成素(EPO)、新红细胞生成刺激蛋白质 (NESP)、生长分化因子(⑶F)、神经胶质细胞系衍生的神经营养因子(⑶NF)、脑源性神经营 养因子(BDNF)、肌肉生长抑制素、神经生长因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒细胞集落刺激因子(G-CSF)、粒细胞-巨噬 细胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或a-1蛋白酶抑制剂)、组织型纤溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰岛素、乙型肝炎表面蛋白质(HbsAg)、人 绒毛膜促性腺素(hCG)、骨桥蛋白、护骨素、蛋白质C、生长调节素-1、促生长素、生长激素、 嵌合白喉毒素-IL-2、胰高血糖素样肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、a -CD20、肿瘤坏死因子(TNF) ,TNF- α 抑制剂、 TNF受体(TNF-R)、P-选择素糖蛋白配体-I(PSGL-I)、补体、转铁蛋白、糖基化依赖性细胞粘 附分子(GlyCAM)、神经细胞粘附分子(N-CAM)、TNF受体-IgG Fc区融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫状神经营养因子(CNTF)、淋巴毒素-β受体(LT-β受体)、纤维 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、 ⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰岛素样生长因子、胰岛素样生长因子结合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之间的复合物、针对内皮生长 因子(EGF)的抗体、针对血管内皮生长因子(VEGF)的抗体、针对成纤维细胞生长因子(FGF)的抗体、抗TNF抗体、TNF受体-IgG Fc区融合蛋白、抗HER2抗体、针对呼吸道合胞病毒的 蛋白质F的抗体、针对TNF-α的抗体、针对糖蛋白Ilb/IIIa的抗体、针对CD20的抗体、针 对⑶4的抗体、针对α -⑶3的抗体、针对⑶40L的抗体、针对⑶154的抗体、针对PSGL-I的 抗体和针对癌胚抗原(CEA)的抗体。
73.根据权利要求61的方法,其中所述寡糖基转移酶是在所述宿主细胞中共表达的重 组酶。
74.根据权利要求61的方法,其中所述寡糖基转移酶对于所述宿主细胞是内源的。
75.根据权利要求61的方法,其中所述寡糖基转移酶是选自I^glB和及其可溶性 变体的成员。
76.根据权利要求61的方法,其中所述糖基连接基团是完整的糖基连接基团。
77.根据权利要求61的方法,其中所述糖基连接基团是其为选自下述的成员 的残基GlcNAc、GlcNH、bacillosamine>6-hydroxybacillosamine> GalNAc> GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybacillosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia、 GlcNAc-GaU GlcNAc-Gal_Sia、 GlcNAc_GlcNAc_Man、 GlcNAc-GlcNAc-Man (Man)2 及其组合。
全文摘要
本发明提供了包括外源N联糖基化序列的多肽和多肽缀合物。N联糖基化序列优选是寡糖基转移酶(例如,细菌PglB)的底物,其可以催化糖基部分从脂质结合的糖基供体分子(例如,脂质-焦磷酸盐连接的糖基部分)到糖基化序列的天冬酰胺(N)残基的转移。在一个例子中,天冬酰胺残基是本发明的外源N联糖基化序列的部分。本发明进一步提供了制备多肽缀合物的方法,其包括在寡糖基转移酶的存在下,在足以使酶将糖基部分转移至N联糖基化序列的天冬酰胺残基的条件下,使具有本发明的N联糖基化序列的多肽和脂质-焦磷酸盐连接的糖基部分(或磷脂连接的糖基部分)相接触。可以与糖基化序列缀合的示例性糖基部分包括GlcNAc、GlcNH、bacillosamine、6-hydroybacillosamine、GalNAc、GalNH、GlcNAc-GlcNAc 、GlcNAc-GlcNH、GlcNAc-Gal、GlcNAc-GlcNAc-Gal-Sia、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man和GlcNAc-GlcNAc-Man(Man)2。经转移的糖基部分任选由修饰基团例如聚合物(例如,PEG)进行修饰。在一个例子中,经修饰的糖基部分是GlcNAc或唾液酸部分。
文档编号C07K1/107GK102037004SQ200980106134
公开日2011年4月27日 申请日期2009年1月8日 优先权日2008年1月8日
发明者S·德弗里斯 申请人:生物种属学股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1