改造的构象稳定蛋白质的制作方法

文档序号:1252222阅读:530来源:国知局
改造的构象稳定蛋白质的制作方法
【专利摘要】本文提供构象稳定的遍在蛋白;及用该构象稳定的遍在蛋白来鉴定结合稳定的遍在蛋白的物质,或结合与稳定形式的遍在蛋白相互作用的蛋白质的物质,或加工稳定形式的遍在蛋白的蛋白质的物质的方法。本文还提供用于筛选构象稳定的蛋白质的方法,与野生型形式的蛋白质和结合配偶体的结合亲和力相比,该构象稳定的蛋白质具有提高的和结合配偶体的结合亲和力。
【专利说明】改造的构象稳定蛋白质
[0001] 相关申请的交叉参考
[0002] 本申请要求2012年3月16日提交的美国临时专利申请号61/612, 228的优先权, 其公开内容在此完整引入作为参考。

【技术领域】
[0003] 本文提供用于筛选和使用构象动态蛋白质的构象稳定形式,如构象稳定的遍在蛋 白(ubiquitin protein)的方法,以及包含此构象动态蛋白质的构象稳定形式的组合物。

【背景技术】
[0004] 蛋白质是非常动态的大分子,构象运动在多种过程中发挥作用,如产生机械能、进 行酶促反应和介导信号转导。由于分子的多种状态可以执行不同的功能,对产生特异性识 别离散构象状态的试剂的能力存在相当大的兴趣。U
[0005] 遍在蛋白(ubiquitin)是见于真核生物的几乎所有组织中(遍在地)的小调节蛋 白。蛋白质遍在蛋白化介导许多细胞过程,如细胞周期控制、凋亡、表观遗传学和转录调节。 4但是,遍在蛋白最广为人知的可能是它在标记将要通过细胞的蛋白水解机器破坏和回收 的蛋白质中发挥的作用。在遍在蛋白共价"标记"蛋白质时,遍在蛋白分子将蛋白质定向至 蛋白酶体,蛋白酶体是细胞中降解和回收标记待破坏的蛋白质的大的多成分蛋白复合物。 遍在蛋白本身由76个氨基酸组成,分子量约为8. 5kDa。主要特征包括其C端尾和7个赖氨 酸残基。6遍在蛋白的氨基酸序列在真核物种间保守,人和酵母遍在蛋白具有约96%序列 同一性。在哺乳动物中,遍在蛋白由4个分开的基因编码。基因 UBA52和RPS27A分别编码 与核糖体蛋白L40和S27a融合的单拷贝遍在蛋白,而UBB和UBC基因编码多聚遍在蛋白前 体蛋白。
[0006] 遍在蛋白化是酶促的翻译后修饰过程,其中来自活化的遍在蛋白形式的遍在蛋白 C端二甘氨酸基序的末端甘氨酸与修饰蛋白质中赖氨酸残基的ε胺形成酰胺键。遍在蛋 白由Ε1遍在蛋白活化酶在需要ΑΤΡ作为能量来源的过程中以两步反应活化。这涉及产生 遍在蛋白-腺甘酸中间体,然后将遍在蛋白转移至Ε1活性部位半胱氨酸残基,在遍在蛋白 C端羧基和Ε1半胱氨酸巯基之间产生硫酯键。然后,通过转(硫)酯反应将遍在蛋白从Ε1 酶转移至Ε2遍在蛋白缀合酶的活性部位半胱氨酸。遍在蛋白化酶级联最后的步骤在靶蛋 白中的赖氨酸和遍在蛋白的C端甘氨酸之间产生异肽键。通常,此步骤需要数百种已知的 Ε3遍在蛋白-蛋白连接酶(常简称为"遍在蛋白连接酶")之一的活性。5Ε3酶作为该系统 的底物识别模块发挥作用,且能够与Ε2和修饰的蛋白底物二者相互作用。
[0007] 单个遍在蛋白加至蛋白质(单遍在蛋白化)之后,可以在它的7个赖氨酸残基中 的一个或多个上将其他遍在蛋白加至该第一遍在蛋白分子,产生多聚遍在蛋白链。此外, 一些底物是通过在称为多遍在蛋白化的过程中将遍在蛋白分子加至多个赖氨酸残基来修 饰。研究最多的多聚遍在蛋白链是用于蛋白酶体中的蛋白酶解的赖氨酸48连接的靶蛋白。 为了能被细胞的蛋白水解机器识别,将要降解的蛋白质必须通过至少四个遍在蛋白分子修 饰。遍在蛋白分子在破坏(destruction)前由隶属于遍在蛋白C末端水解酶(UCH)家族脱 遍在蛋白酶(deubiquitinase)的酶从蛋白质切下并回收用于其他用途。
[0008] 脱遍在蛋白酶(DUB)是一类通过去组装遍在蛋白链或从底物去除单遍在蛋白化 来调节遍在蛋白介导的信号发放的特化蛋白。 7DUB还常称为脱遍在蛋白肽酶、脱遍在蛋白 异肽酶、脱遍在蛋白酶、遍在蛋白蛋白酶、遍在蛋白水解酶、遍在蛋白异肽酶或Dub。人基因 组在五个基因家族中编码近100种对遍在蛋白具有特异性的DUB。DUB可以作为遍在蛋白 系统的负调节物和正调节物。除遍在蛋白回收外,它们还涉及遍在蛋白如体的最初加工、蛋 白质遍在蛋白化的校正及抑制性遍在蛋白链的去组装。此外,诸如遍在蛋白特异性蛋白酶 (USP)家族DUB的DUB逆转靶蛋白的遍在蛋白化或遍在蛋白样修饰,而诸如UCH家族DUB的 成员的DUB负责从未锚定的多聚遍在蛋白(即通过缀合机从头合成或通过其他DUB从靶蛋 白释放的游离多聚遍在蛋白)再生单遍在蛋白。
[0009] 大多数DUB尚未得到充分表征。一个例外是USP7 (HAUSP),其在肿瘤发生中具有 已经确定的作用。USP7的关键功能是通过脱遍在蛋白化和稳定癌蛋白质Mdm2从而下调p 53 肿瘤抑制物来调节细胞存活。w由于USP7直接去稳定化p53并调节其他肿瘤抑制物(包括 F0X04和PTEN),抑制USP7是有吸引力的治疗策略。8'9另一实例是USP14,认为其在降解涉 及淀粉状蛋白生成性神经变性的蛋白质中发挥作用。 32
[0010] 本文引用的所有专利、专利申请、出版物、文件、核苷酸及蛋白质序列数据库检索 号、其所指的序列和文章在此全都以其整体引入作为参考。
[0011] 发明概述
[0012] 本文提供的发明尤其公开了包含构象稳定的遍在蛋白的组合物和用该组合物来 抑制与这些蛋白质的稳定形式结合的一种或多种酶的作用的方法,以及用于鉴定与这些稳 定蛋白质结合的物质的方法。本文还提供用于筛选蛋白质的构象稳定形式的方法。
[0013] 在一方面,本申请提供相对于野生型遍在蛋白具有一个或多个氨基酸取代的构象 稳定的遍在蛋白。在一些实施方案中,该一个或多个氨基酸取代稳定该构象稳定的遍在蛋 白的β 1/β 2环,使该β 1/β 2环限制于蛋白质数据库(Protein Data Bank)编号3NHE链 B的约1.6 Λ均方根偏差内的区域。在一些实施方案中,如通过NMR馬分散(dispersion) 所测量,与野生型遍在蛋白相比,该构象稳定的遍在蛋白的β1/β2环区显示更慢的构象 动态。在上述实施方案中任一个的一些实施方案中,如通过NMR R2分散所测量,与野生型遍 在蛋白相比,构象稳定的遍在蛋白的β?/β 2环附近区域中的微秒Rex值高至多40倍。在 上述实施方案中任一个的一些实施方案中,该构象稳定的遍在蛋白在选自A7、A8、A13、A34、 A36、A69和A71的位置处包含一个或多个氨基酸取代,其中该位置是相对于A1-A76(SEQ ID NO: 1)。在一些实施方案中,该构象稳定的遍在蛋白包含(a)取代A7(C)或取代A8(C);和 (b)取代A69(C)。在一些实施方案中,该构象稳定的遍在蛋白进一步包含选自A13(N、R、G、 K、Y、A、S、H、E、L、T、V、I、M*P)、A34(I、F、L、V、S、M*T)、A36(Y、F、L、H、A、V、W、I、M* N)和八71〇?、1(3、〇、1、6、!1、1、1?或6)的一个或多个取代。在一些实施方案中,该构象稳定 的遍在蛋白包含选自 A7 (D、F、R 或 S)、A8 (Y、A、G、Q、R 或 Y)、A13 (R、Y、E 或 P)、A34 (I、L 或 1')、六36〇^、¥、六或沁、六69仏、6、1、1(、¥或1)和471仏、1?、〇、1?或6)的一个或多个取代。在 上述实施方案中任一个的一些实施方案中,该构象稳定的遍在蛋白进一步包含定位在A42、 A46、A49、A62、A65、A68或A70处的一个或多个氨基酸取代,其中该氨基酸残基位置对应于 SEQ ID NO: 1中的位置。在上述实施方案中任一个的一些实施方案中,该构象稳定的遍在蛋 白进一步包含定位在 A40、A42、A46、A47、A49、A62、A65、A68、A70、A71、A72、A73、A74、A75 或A76处的一个或多个氨基酸取代,其中该氨基酸残基位置对应于SEQ ID NO: 1中的位置。 在上述实施方案中任一个的一些实施方案中,与野生型遍在蛋白相比,该构象稳定的遍在 蛋白显示与遍在蛋白特异性蛋白酶(USP)家族的脱遍在蛋白酶的结合增加。在上述实施方 案中任一个的一些实施方案中,该构象稳定的遍在蛋白以纳摩尔范围内Kd与该脱遍在蛋 白酶结合。在上述实施方案中任一个的一些实施方案中,该构象稳定的遍在蛋白以比野生 型蛋白质的亲和力高至少1000倍的亲和力与该脱遍在蛋白酶结合。在上述实施方案中任 一个的一些实施方案中,该构象稳定的遍在蛋白抑制该脱遍在蛋白酶的活性。在上述实施 方案中任一个的一些实施方案中,与野生型遍在蛋白相比,该构象稳定的遍在蛋白显示与 遍在蛋白C末端水解酶(UCH)家族的脱遍在蛋白酶无结合或减少的结合。
[0014] 在一方面,提供编码上述实施方案中任一个的构象稳定的遍在蛋白的核酸。
[0015] 在一方面,提供包含上述实施方案中任一个的核酸的载体。在一些实施方案中,该 载体是表达载体。
[0016] 在一方面,提供包含上述实施方案中任一个的核酸或载体的细胞。在一些实施方 案中,该细胞选自动物细胞、细菌细胞、昆虫细胞、线虫细胞和酵母细胞。在一些实施方案 中,该动物细胞是人细胞或非人细胞。
[0017] 在一方面,提供包含上述实施方案中任一个的构象稳定的遍在蛋白和USP家族的 成员的脱遍在蛋白酶的蛋白复合物。在一些实施方案中,该脱遍在蛋白酶是USP7、USP5或 USP14。在一些实施方案中,该脱遍在蛋白酶是USP7。
[0018] 在一方面,提供与上述实施方案中任一个的构象稳定的遍在蛋白中的一个或多个 共价连接的蛋白质。
[0019] 在一方面,提供包含固定在其上的上述实施方案中任一个的构象稳定的遍在蛋白 的固体支持物。在一些实施方案中,该固体支持物是适合用于表面等离振子共振的表面。在 一些实施方案中,该固体支持物是纳米颗粒、球珠(bead)或玻璃。
[0020] 在一方面,提供包含在其表面表达上述实施方案中任一个的构象稳定的遍在蛋白 的细胞的群体。
[0021] 在一方面,提供抑制USP家族的脱遍在蛋白酶的方法,其包括使该脱遍在蛋白酶 与上述实施方案中任一个的构象稳定的遍在蛋白接触。在一些实施方案中,该抑制是体内 抑制或体外抑制。
[0022] 在一方面,提供鉴定与遍在蛋白的构象形式结合的物质的方法,该构象形式有利 于与USP家族的脱遍在蛋白酶结合,其包括:a)使该物质与上述实施方案中任一个的构象 稳定的遍在蛋白接触;和b)测定该物质是否与该构象稳定的遍在蛋白结合。在一些实施方 案中,该物质是小分子化合物、抗体、蛋白质、抑制性核酸或其任意组合。
[0023] 在一方面,提供鉴定与包含USP家族的脱遍在蛋白酶和遍在蛋白的蛋白复合物结 合的物质的方法,该方法包括:a)使该物质与21-23项中任一项的蛋白复合物接触;和b) 测定该物质是否能够与该蛋白复合物结合。在一些实施方案中,该物质是小分子化合物、抗 体、蛋白质、抑制性核酸或其任意组合。在一些实施方案中,该物质破坏脱遍在蛋白酶和遍 在蛋白之间的相互作用。
[0024] 在一个实施方案中,提供通过上述实施方案中任一个的方法鉴定的物质。
[0025] 在一方面,提供筛选蛋白质的构象稳定形式的方法,其中该构象稳定形式与野生 型蛋白质相比具有增加的与结合配偶体的结合亲和力,或具有增加的调节该结合配偶体的 活性的能力,该方法包括:a)使该结合配偶体与该蛋白质的突变体形式的文库接触,其中 该突变体形式的文库是通过在一个或多个预先选择的位置处用另一氨基酸残基取代构象 动态蛋白质中的氨基酸残基而产生,其中该预先选择的位置定位在该蛋白质的内部;和b) 根据与该结合配偶体的结合或与野生型蛋白质相比增加的调节该结合配偶体的活性的能 力来鉴定该构象稳定形式。在一些实施方案中,根据每个位置处的氨基酸残基对该蛋白质 内或该蛋白质的区域内的构象动态的贡献来选择该预先选择的位置。在上述实施方案中任 一个的一些实施方案中,该文库是编码该蛋白质的突变体形式的核酸的文库。在一些实施 方案中,该文库是噬菌体展不文库。在一些实施方案中,用于该噬菌体展不文库的载体选自 M13噬菌体、Π 噬菌体、fd噬菌体、Ike噬菌体、N1噬菌体、肠细菌噬菌体T4、噬菌体T7和 肠细菌噬菌体λ。在上述实施方案中任一个的一些实施方案中,该方法进一步包括用其他 氨基酸残基取代一个或多个表面氨基酸残基来在所鉴定出的构象稳定蛋白质的表面上突 变一个或多个氨基酸残基,并筛选与不含一个或多个取代的表面氨基酸残基的构象稳定蛋 白质相比具有增加的结合亲和力或调节能力的蛋白质。在上述实施方案中任一个的一些实 施方案中,该蛋白质选自G蛋白偶联受体(GPCR)、核激素受体、酪氨酸激酶受体和配体门控 型离子通道。在一些实施方案中,该蛋白质是遍在蛋白。在一些实施方案中,该结合配偶体 选自脱遍在蛋白酶、Ε1遍在蛋白活化酶、Ε2遍在蛋白缀合酶、Ε3遍在蛋白-蛋白连接酶及 细胞蛋白酶体复合物的一个或多个成员。在一些实施方案中,该结合配偶体是脱遍在蛋白 酶。在一些实施方案中,该脱遍在蛋白酶是遍在蛋白特异性蛋白酶(USP)家族脱遍在蛋白 酶的成员。在一些实施方案中,该脱遍在蛋白酶选自USP7、USP5和USP14。在一些实施方 案中,该脱遍在蛋白酶是USP7。
[0026] 附图简述
[0027] 图1显示通过构象展示鉴定对USP7(U7Ub)具有高亲和力的两类遍在蛋白变体。 A)构象展示筛选使构象平衡崩解为单状态的核心突变。在遍在蛋白的情况下,已有的构象 平衡介导几种蛋白质相互作用,预测单构象的选择既降低结合的熵成本又提供特异性。B) 上部:大多数U7Ub包含位置7或8和位置69之间的二硫键,突出显示可以如何通过共价 分子内交联介导构象稳定化。下部:少数U7Ub不含二硫键,通过非共价重包装达到相同的 终点。C)通过噬菌体斑点ELISA显示基于二硫键(例如克隆7)和不基于二硫键(例如克 隆25)的U7Ub25变体都特异性结合USP7。D)非二硫键U7Ub25变体以193± 17. 3nM的亲 和力结合 USP7 的催化核心(Δ Η = -16. 67±0· 1562kcal/mol,Δ S = -7. 48kcal/mol,N = 0. 92±0. 0062)。
[0028] 图2显示蛋白复合物内的遍在蛋白的β 1-β 2区的聚类均方根偏差(RMSD)分析, 其揭示了影响DUB结合的两种不同构象。A)配对比对球状核心(残基1-5和11-70)的其 余部分后,遍在蛋白复合物的所有高分辨率结构中遍在蛋白的β?-β 2区(残基6-10)的 RMSD的聚类热图。Β)在不检查聚类RMSD的情况下,β 1-β 2区所采用的构象作为可能的 构象体的弥散出现。C) "上"和"下" β 1-β 2构象体的比较。D)UCH型DUB与β 1-β 2的 "上"构象结合(UCHL3-Ub复合物PDB编号lxd3),而USP型DUB结合"下"状态(USP14-Ub 复合物PDB编号2ayo)。遍在蛋白显示为红色,DUB显示为蓝色。包装β1-β2从而限制其 构象的DUB残基(UCHL3-Leu220,USP14-Phel68)显示为球体。Ε)在与UCH(淡紫色,PDB编 号lcmx、lxd3和3ifw)和USP (粉红色,PDB编号2ayo、2hd5和2ibi)的复合物中解析的三 种遍在蛋白结构的置加。显不允许在噬菌体文库中突变的残基的侧链。
[0029] 图3用可变表面化学显示接触遍在蛋白(橙色)的β 1_β2环区的USP型脱遍在 蛋白酶(蓝色)。与遍在蛋白接触的脱遍在蛋白酶残基和允许在构象展示期间改变的遍在 蛋白残基显示为棍。所显示的脱遍在蛋白酶是USP7(PDB编号1NBF)、USP14(PDB编号2ΑΥ0)、 USP2 (PDB 编号 2IBI)和 USP21 (PDB 编号 3I3T)。
[0030] 图4显示A)通过生物层干涉量度法筛选U7Ub变体。将等量的USP7催化结构域活 性部位突变体(USP7catC223A)偶联至各传感器尖端,并浸没在恒定浓度的各U7Ub中。根 据稳态反应及表观结合速率和解离速率来选择变体。B) U7Ub7变体对USP7catC223A的滴定 显示约200nM的解离常数。
[0031] 图5显示非二硫键U7Ub表面的亲和力成熟进一步改善对USP7的亲和力。A) 基于U7Ub25支架的亲和力成熟的克隆的序列包含少量表面突变。B)亲和力成熟的克隆 U7Ub25. 2540是蛋白质ELISA测定中最有效的USP7催化结构域结合剂。C)生物层干涉量度 法显示U7Ub25以90nM的解离常数结合USP7的催化结构域,而亲和力成熟的U7Ub25. 2540 具有增强3倍的亲和力。
[0032] 图6显示A)U7Ub7和B)U7Ub25. 2540的按1 ζ描绘的2F〇-Fc电子密度。显示最 终的细化模型用于参考。
[0033] 图7显示U7Ub的晶体结构,揭示改变的主链构象或核心包装。A)显示野生型 遍在蛋白的结构用于参考,最初选择的变体中突变的位置显示为棍,并标记β1-β2区。 B)U7Ub7的结构揭示了位置8和69之间形成的二硫键,其扭曲了 β1-β2环的构象。C) U7Ub25. 2540变体的主链构象与野生型遍在蛋白的主链构象几乎相同,但在β 1-β 2区周 围具有改变的包装。亲和力成熟的表面突变显示为黄色。
[0034] 图8显示U7Ub变体的结构分析。Α)类似于USP7结合的遍在蛋白且不同于apo遍 在蛋白,U7Ub7的β 1-β2环向下扭曲。B)包装及U7Ub7的C端和蛋白质的其余部分之间 的氢键相互作用。C)U7Ub25. 2540的β 1-β 2环的构象类似于apo遍在蛋白的构象。
[0035] 图9显示异核1?} -15Ν Ν0Ε数据,显示Ub7. 7的C端在溶液中可移动,但相对于野 生型受限。
[0036] 图10显示核心重包装和溶剂暴露突变都为U7Ub25达到高亲和力所必需。虽然在 U7Ub25核心(U7Ub25_L71和U7Ub25. 2540_L71)的背景中将Leu71Arg突变回复为其野生 型同一性强烈降低亲和力,但将Arg71引入野生型遍在蛋白(Ubwt_R71)对紧密结合而言是 不够的。类似地,具有表面突变的所有组合的野生型遍在蛋白核心具有受损的与USP7的结 合(Ubwt_R71,Ubwt. 2540_L71,Ubwt. 2540_R71)。将重包装的核心与野生型遍在蛋白表面 (U7Ub25_L71)组合对紧密结合而言也是不够的。因此,新选择的核心和重新排列的表面都 为高亲和力结合所需(U7Ub25_R71,U7Ub25. 2540_R71)。
[0037] 图11显示U7Ub25具有类似于野生型遍在蛋白的微秒运动。U7Ub25在毫秒时间尺 度上没有可检测到的运动,因为针对U7Ub25测定的R 2值显示对CPMG重聚焦脉冲的频率没 有依赖性(数据未显示)。
[0038] 图12显示,酶促测定揭示U7Ub25和U7Ub25. 250是全长USP7的有效抑制剂。A) U7Ub25和U7Ub25. 2540都强烈抑制全长USP7 (IC5(I分别为172nM和104nM)。C端二甘氨酸 基序的缺失(U7Ub25dGG)对抑制潜能无影响。B)U7Ub不抑制高活性的USP2催化结构域。 C)细胞功能与USP7的细胞功能完全相反的USP10不受U7Ub抑制。D)虽然USP47是与 USP7最密切相关的脱遍在蛋白酶,但U7Ub是比USP7有效性更低的此DUB的抑制剂(IC5Q? 10 μ M)。E)上部:U7Ub 以 373nM(U7Ub25)和 253nM(U7Ub25. 2540)的 IC5(I 抑制全长 USP5。 但是,C端二甘氨酸的缺失(U7Ub25dGG)废除了 USP5的抑制。下部:USP5由野生型遍在蛋 白而不由U7Ub强烈激活。除对初始延迟期后测量的最大速率归一化的"USP5 (最大速率)" 夕卜,所有活性均对零浓度遍在蛋白下的初始速率归一化。
[0039] 图13显示抗-USP7变体未通过E1和E2酶有效掺入Lys48_或Lys63_连接的 链。U7Ub3和U7Ub7都未在利用E1UBE1和E2Cdc34(其促进K48多遍在蛋白化)或Uevla/ UbcH13(其促进K63多遍在蛋白化)的生化连接测定中有效掺入K48-或K63-连接的链; 单体遍在蛋白库的排除支持变体部分占用所评价的E1和/或E2酶。相反,用U7Ub25未达 到可检测到的多聚化。
[0040] 图14显示U7Ub25. 2540变体是细胞环境中的内源性USP7的选择性抑制剂。A) U7Ub25. 2540在细胞中微弱地掺入多聚遍在蛋白链;U7Ub25. 2540AGG废除了链掺入。图15 中显示特异性遍在蛋白链连接的研究。用所示表达构建体转染HCT116细胞,裂解物按所示 印迹或用所以抗体免疫沉淀;同种型对照(C)抗体是细胞培养级赫赛汀(Herceptin)。抝相 对于其他细胞DUB,U7Ub25. 2540 Λ GG选择性结合内源性USP7。用抗所示蛋白质的抗体印迹 抗-ΗΑ抗体或同种型抗体对照(抗-c-myc)免疫沉淀或细胞裂解物。用HCT116USP7-/-细 胞系作为USP7结合的附加对照。C)U7Ub25. 2540AGG在细胞中的表达促进MDM2多遍在 蛋白化(内源性USP7抑制的指示)。用所示构建体转染U20S细胞,用对照(曲妥珠单抗 (Trastuzumab))或K48谱系选择性抗体免疫沉淀细胞裂解物并印迹,以揭示MDM2遍在蛋白 化。D)U7Ub25. 2540AGG在细胞中的表达增加了 MDM2翻转(内源性USP7抑制的反映)。用 所示构建体转染U20S细胞,用100 μ Μ环己酰亚胺处理,在所示时间点收集,并用所示抗体 印迹裂解物。E) U7Ub25. 2540 Λ GG在细胞中的表达稳定化ρ53,随后上调ρ53响应基因 p21。 用所示表达构建体转染U20S或SiHa细胞,并用所示抗体印迹裂解物。
[0041] 图15显示微弱地掺入细胞中的多聚遍在蛋白链的U7Ub25. 2540 ; U7Ub25. 2540 Λ GG废除了链掺入。用所示表达构建体转染HCT116细胞,并用所示抗体免疫 沉淀裂解物;同种型对照(C)抗体是曲妥珠单抗。
[0042] 图16显示,相对于其他细胞DUB,U7Ub25. 2540与内源性USP7和USP5结合。按所 示转染HCT116细胞,并用抗所示蛋白质的抗体印迹抗-HA免疫沉淀或细胞裂解物。
[0043] 图17显示U7Ub25. 2540 AGG富集细胞裂解物中的内源性USP7。通过质谱法分析 了对应于图14B的抗-HA免疫沉淀。显示了针对所示DUB检测到的肽总数,独特肽的数目 显示在括号中。
[0044] 图18显示A)针对USP14的5轮噬菌体淘选后分离的23个噬菌体克隆的序列偏 好。B)蛋白质ELISA证明U14Ub对USP14具有增加的亲和力,对UCHL3和UCHL1的亲和力 具有相应的降低。野生型遍在蛋白曲线以蓝色显示,多种U14Ub以黑色显示。C)用U14Ub2 和U14Ubl4生物层干涉量度法滴定USP14。两阶段结合速率的慢成分显示对U14Ub的浓度 的依赖性,指示诱导契合结合机制。4(1通过稳态和动力学拟合测定的解离常数相符。
[0045] 图19显示U14Ub apo动态相对于野生型减慢。A)U14Ub对野生型的1H-15N HSQC 光谱中酰胺共振的强度的比值。将该比值对显示无交换的共振归一化。插图显示将这些比 值标示在野生型遍在蛋白的结构(PDB编号lubi)上;最显著的改变发生在β 1-β2区中。 Β)针对U14Ubl4、U14Ub2和野生型遍在蛋白通过Rex测量定量的毫秒(蓝色)和微秒(红 色)运动。U14Ubl4和U14Ub2图中的插图分别显示ms和ys Rex测量的原始数据的实例。 由于交换扩大或光谱重叠而缺乏数据的共振用X表示。野生型遍在蛋白显示在这些条件下 无 ms Rex〇
[0046] 图20显示遍在蛋白能量景貌的扰动影响USP14结合的机制,并产生不能支持体内 生长的遍在蛋白变体。A)遍在蛋白结合可以通过构象选择或诱导契合而发生。野生型遍 在蛋白的构象子态之间的相互转换很快,因此分开子态的能障是适度的。B)U14Ub的运动 比野生型慢得多,通过该途径的构象选择臂减少流出,并导致结合机制由诱导契合主导。C) 尽管它们具有连入Lys48连接链的能力,但与人遍在蛋白不一样,U14Ub不能取代酵母中的 内源性遍在蛋白。
[0047] 图21显示PDB中的所有Ub-配偶体结构的β l-β 2RMSD的聚类热图。按结果和 方法中所述比对并聚类结构。沿每个轴列出的复合物为〈PDB编号X遍在蛋白链字母>-〈 配偶体链字母〉的形式。例如,2ibiB-A表示在PDB编号2ibi中与USP2(链Α)结合的来自 遍在蛋白(链B)的β 1-β2环。
[0048] 图22显示来自U14Ub改造实验的设计结果。Α)单状态设计和Β)多状态设计的共 有序列偏好。
[0049] 图23显示5种U14Ub和野生型遍在蛋白的分配的4-1? HSQC光谱。突出显示所 选择的β 1-β 2区周围显示显著交换扩大的残基。U14Ubl4显示最严重的交换扩大,与它具 有最大的ms Rex值一致。
[0050] 图 24 显不全部 5 种 U14Ub 的 CS-Rosetta 模型。全部 5 种 U14Ub 的 CS-Rosetta 模型(带状)与野生型遍在蛋白的CS-Rosetta模型(卡通)重叠。显示各变体的两个最 低能量模型。按图19中的方案给U14Ub涂色:1为紫色,2为蓝色,14为红色,22为橙色,24 为绿色。各变体的折叠与野生型遍在蛋白不可区分。
[0051] 图25显示所有变体的微秒和毫秒Rex值。在18. 8T和297K测量Rex值。通过50 和950Hz的CPMG场的R2()bs之间的差异来估计各残基的毫秒R ex。
[0052] 图26显示两种场下的R2分散数据的组拟合。对于U14Ubl、U14Ub2和U14Ubl4,将 显示并未太过杂乱而不可拟合的R 2分散的残基显示为定位至野生型遍在蛋白的晶体结构 上的橙色球体。显示显著的ms Rex值的残基在结构中聚在一起。对于U14Ubl和U14Ub2,针 对突出显示的所有残基整体获得Carver Richards方程的拟合。针对U14Ubl4突出显示残 基的三个聚类既由于其空间分开而作为独立的组拟合,也整体拟合,产生相似的k ex值。此 处显示的U14Ubl4的拟合是对于残基4、14和15的聚类。
[0053] 图27显示用微分静态光散射进行的U14Ub和野生型遍在蛋白的热稳定性测量,其 显示没有一种突变体相对于野生型显著去稳定化。为了清楚而显示激酶的转换。在至多 81°C (设备的高温极限)也未观察到野生型遍在蛋白和U14Ub的转换。将数据对低温基线 的强度归一化。
[0054] 图28显示生物层干涉量度法滴定拟合至两阶段结合模型。通过生物层干涉量度 法检测的U14Ub对USP14的滴定(黑色)良好地拟合至两阶段结合模型(红色)。用于测 定的 U14Ub 的浓度为 0· 068、0· 206、0· 618、1· 85、5· 17、16· 7 和 50μ M。
[0055] 图29显示来自稳态响应和用诱导契合模型拟合的kslOT^^U14Ub的浓度的 作图的平衡K D。结合的慢速阶段良好地拟合至Hammes等,Proc. Natl. Acad. Sci. U. S. A. 106, 13737-13741 (2009)所述的诱导契合模型。
[0056] 图30显示交叉停靠,表明遍在蛋白状态可以区分USP-和UCH-型脱遍在蛋白 酶。A)各遍在蛋白-脱遍在蛋白酶组合的得分对Ca作图,各模型的PDB编号在各图上 方列出。先列出遍在蛋白部分(〈PDB编号〉B),随后是脱遍在蛋白酶(〈PDB编号〉A)。例 如,2ibiB_2ayoA是来自2ibi(USP2结合的Ub)的遍在蛋白停靠至来自2ayo(USP14)的脱 遍在蛋白酶上,而lxd3B_2ayoA是来自lxd3(UCHL3结合的Ub)的遍在蛋白,停靠至来自 2ayo(USP14)的脱遍在蛋白酶上。按方法中所述制备和停靠结构,排除遍在蛋白的C末端 尾,以避免晶体学偏差。B)图A中交叉停靠结果的总结。将来自各交叉停靠实验的最低的 5个RMSD平均,并呈现为聚类热图。注意,来自USP结合的遍在蛋白的所有遍在蛋白都更 易于停靠至USP-型DUB上(较低的RMSD),UCH结合的遍在蛋白更易于停靠至UCH-型DUB 上,但交叉家族停靠通常不成功。
[0057] 图31显示U14Ub2的晶体结构。A)U14Ub2(蓝色)与野生型遍在蛋白(小麦,TOB 编号:1UBI)的叠加。U14Ub2的总体折叠与野生型一样,β1-β2区中的偏差可能是由晶 体包装引起。Β)色氨酸71包装入不对称单元中邻近分子的疏水核,扭曲β 1-β 2的构象。 U14Ub2的结构以与图Α中相同的取向显示为表面表示。不对称单元中的邻近分子以浅橙色 显不。
[0058] 图32显示掺入K48连接的链。显示通过UBEland cdc34以类似于野生型的程度 掺入K48连接的链的U14Ub变体的SDS-Page。U14Ub和野生型遍在蛋白之间的重链差异是 由于6xHis标记的存在,其尚未从突变体切割。
[0059] 图33显示衍生自第二代亲和力成熟的U7Ub25的高亲和力克隆。术语"s/n比"指 信号:噪音比,其中"信号"是针对通过包被在384孔Maxisorp板上的NeutrAvidin捕获的 生物素化USP7catC223A检测到的斑点噬菌体ELISA信号;"噪音"是针对NeutrAvidin单 独的ELISA信号。显示遍在蛋白中的位置编号。
[0060] 图34显示通过ELISA测定的U7Ub25亲和力成熟变体的亲和力排序。
[0061] 图35显示生物层干涉量度法滴定(黑色)未拟合至单阶段解离模型(红色)。用 于测定的 U14Ub 的浓度为 0· 068、0· 206、0· 618、1· 85、5· 17、16· 7 和 50μ M。
[0062] 图36显示生物层干涉量度法滴定(黑色)拟合至单阶段解离模型(红色)。用于 测定的 U14Ub 的浓度为 0· 068、0· 206、0· 618、1· 85、5· 17、16· 7 和 50μ Μ。
[0063] 发明详述
[0064] 本发明提供可以用来鉴定和/或筛选能够以高亲和力结合一种或多种结合配偶 体的构象稳定蛋白质的方法(称为"构象展示"(CD))。与传统噬菌体展示(其通常突变表 面氨基酸位置来发现新的焓接触)不同,CD提供了改变埋藏在蛋白质的三级结构内的氨基 酸残基来鉴定产生最佳结合构象的新包装排列的方法。本申请的方法与之前已在本领域中 实施的方法的不同在于,本文公开的方法提供了调节蛋白质构象动态的能量学的能力,从 而代表了通过调节界面动态来调节蛋白质-蛋白质相互作用的亲和力和选择性二者而不 是仅调节焓接触的手段。
[0065] 用CD来鉴定具有定位在遍在蛋白内部的氨基酸取代的构象稳定的遍在蛋白,从 而相对于野生型蛋白质的主要构象状态将遍在蛋白的β1_β2环区改变为"下"构象。与 野生型遍在蛋白相比,遍在蛋白的这些构象稳定形式能够以高得多的亲和力结合遍在蛋白 特异性蛋白酶(USP)家族脱遍在蛋白酶的脱遍在蛋白酶。此外,通过CD产生的构象稳定的 遍在蛋白可以用作新的工具来鉴定和筛选一种或多种物质,该物质:1)能够结合遍在蛋白 的特定构象形式;2)与优选结合遍在蛋白的特定构象形式的遍在蛋白加工酶结合;或3)能 够破坏USP-脱遍在蛋白酶/遍在蛋白复合物。
[0066] I. 一般技术
[0067] 除非另有说明,本发明的实施将利用分子生物学(包括重组技术)、微生物学、细 胞生物学、生物化学和免疫学的常规技术,其在本领域的技术范围之内。这类技术充分阐述 于文献中,如"Molecular Cloning:A Laboratory Manual",第 2 版(Sambrook 等,1989); "Oligonucleotide Synthesis"(M.J. Gait 编辑,1984) ;"Animal Cell Culture"(R. I. Freshney 编辑,1987) ;"Methods in Enzymology"(Academic Press, Inc.) ;"Current Protocols in Molecular Biology,'(F.M.Ausubel 等编辑,1987,及定期更新);"PCR:The Polymerase Chain Reaction",(Mullis等编辑,1994) ;"APractical Guide to Molecular Cloning"(Perbal Bernard V.,1988)。
[0068] 本发明中利用或描述的寡核苷酸、多核苷酸、肽、多肽和小分子可以用本领域已知 的标准技术产生。
[0069] II.定义
[0070] 在提到分子时,"分离的"指已鉴定并从其天然环境的成分分开和/或回收的分子。 其天然环境的污染成分是干扰诊断或治疗用途的物质。
[0071] 本文所用的术语"多肽"包括蛋白质、多肽的片段和融合蛋白质。
[0072] "活性"多肽或其片段保留了该活性多肽的天然或天然存在的对应物的生物活 性。生物活性指由该活性多肽的天然或天然存在的对应物介导的功能。例如,结合或蛋白 质-蛋白质相互作用构成生物活性。
[0073] "亲和力"指分子(例如遍在蛋白,如遍在蛋白的构象稳定形式)的单个结合部位 与它的结合配偶体之间非共价相互作用的总和的强度。除非另有说明,本文所用的"结合亲 和力"指内在的结合亲和力,其反映结合对的成员之间的1:1相互作用。分子X对它的配偶 体Y的亲和力一般可通过解离常数(Kd)来表示。亲和力可以通过本领域公知的方法来测 量,包括本文中描述的那些。测量结合亲和力的具体的说明性和示例性实施方案在下文中 描述。
[0074] 术语"抗体"在本文中以最广泛的含义使用并涵盖多种抗体结构,包括但不限于单 克隆抗体、多克隆抗体、多特异性抗体(例如双特异性抗体)和抗体片段,只要它们显示希 望的抗原结合活性。在一些实施方案中,抗体可以是嵌合抗体、人抗体、人源化抗体和/或 亲和力成熟抗体。
[0075] "抗体片段"指除完整抗体以外的包含完整抗体的部分的分子,其结合该完整抗体 所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab' -SH、F(ab')2 ;双抗体; 线性抗体;单链抗体分子(例如scFv);及从抗体片段形成的多特异性抗体。
[0076] 与参考抗体"结合相同表位的抗体"指在竞争测定中将参考抗体与其抗原的结合 阻断50%或更多的抗体,相反,参考抗体在竞争测定中将该抗体与其抗原的结合阻断50% 或更多。本文提供示例性竞争测定。
[0077] 术语"嵌合"抗体指其中部分重链和/或轻链衍生自特定来源或物种,而重链和/ 或轻链的其余部分衍生自不同的来源或物种的抗体。
[0078] 抗体的"种类"指其重链所具有的恒定结构域或恒定区的类型。存在五个主要种 类的抗体 :IgA、IgD、IgE、IgG和IgM,这些种类中的几种可以进一步划分为亚类(同种型), 例如IgGp IgG2、IgG3、IgG4、IgAi和IgA2。对应于不同种类免疫球蛋白的重链恒定区分别称 为 α、δ、ε、γ 和 μ。
[0079] 根据其恒定结构域的氨基酸序列,可将来自任意脊椎动物物种的抗体的轻链分配 至称为κ和λ的两个明显不同的类型之一。
[0080] 本文所用的术语"单克隆抗体"指获自基本上同质的抗体群体的抗体,即除例如包 含天然存在的突变或在产生单克隆抗体制剂的过程中出现的可能的变体抗体(这类变体 通常以较小的量存在)外,包含该群体的单种抗体相同和/或结合相同表位。与通常包含 抗不同决定簇(表位)的不同抗体的多克隆抗体制剂不同,单克隆抗体制剂中的每种单克 隆抗体抗抗原上的单个决定簇。因此,修饰词"单克隆"表示抗体获自基本上同质的抗体群 体的特性,而不解释为需要通过任意特定方法产生抗体。例如,待用于本发明的单克隆抗体 可以通过多种技术制备,包括但不限于杂交瘤法、重组DNA法、噬菌体展示法及利用含有全 部或部分人免疫球蛋白基因座的转基因动物的方法,本文描述用于制备单克隆抗体的这类 方法和其他示例性方法。
[0081] 术语"嵌合"抗体指其中部分重链和/或轻链衍生自特定来源或物种,而重链和/ 或轻链的其余部分衍生自不同来源或物种的抗体。
[0082] "人源化"抗体指包含来自非人高变区(HVR)的氨基酸残基和来自人构架区(FR) 的氨基酸残基的嵌合抗体。在某些实施方案中,人源化抗体将包含至少一个(通常两个) 可变结构域的基本上全部,其中全部或基本上全部HVR (例如CDR)对应于非人抗体,而全部 或基本上全部FR对应于人抗体的那些。人源化抗体可选地包含至少部分衍生自人抗体的 抗体恒定区。抗体(例如非人抗体)的"人源化形式"指已经历人源化的抗体。
[0083] "人抗体"是这样的抗体,其具有对应于由人或人细胞产生的抗体的序列或衍生自 利用人抗体库或其他人抗体编码序列的氨基酸序列。人抗体的此定义明确排除了包含非人 抗原结合残基的人源化抗体。
[0084] "亲和力成熟的"抗体指在一个或多个HVR中具有一个或多个改变的抗体,与不具 有这类改变的亲本抗体相比,这类改变导致抗体对抗原的亲和力的改善。
[0085] "表位标记的"多肽指与"标记多肽"融合的嵌合抗体。这类标记提供可以针对其 制备抗体或可获得针对其的抗体的表位,但基本上不干扰多肽活性。为了减少抗-标记抗 体与内源表位的反应性,标记多肽通常是独特的。适宜的标记多肽通常具有至少6个氨基 酸残基,通常在约8个和50个氨基酸残基之间,优选在8个和20个氨基酸残基之间。附加 表位序列的实例包括来自流感病毒Α的ΗΑ、⑶和c-myc、poly-His和FLAG。
[0086] 本文中可互换使用的"多核苷酸"或"核酸"指任意长度的核苷酸聚合物,且包括 DNA和RNA。核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、修饰的核苷酸或碱基、和/或其类 似物,或可以通过DNA或RNA聚合酶或通过合成反应掺入聚合物中的任意底物。如果存在, 对核苷酸结构的修饰可以在组装聚合物之前或之后进行。核苷酸的序列可以由非核苷酸成 分中断。多核苷酸可以在合成后进一步修饰,如通过与标记缀合。其他类型的修饰包括例 如"帽",用类似物取代一个或多个天然存在的核苷酸,核苷酸间修饰,例如具有不带电荷的 连接(例如磷酸甲酯、磷酸三酯、磷酰胺、氨基甲酸酯等)和具有带电荷的连接(例如硫代 磷酸酯、二硫代磷酸酯等)的那些,包含悬垂部分(例如蛋白质(例如核酸酶、毒素、抗体、 信号肽、聚-L-赖氨酸等))的那些,具有嵌入剂(例如吖啶、补骨脂素等)的那些,包含螯 合剂(例如金属、放射性金属、硼、氧化性金属等)的那些,包含烷化剂的那些,具有修饰连 接的那些(例如α异头核酸等),以及未修饰形式的多核苷酸。另外,通常存在于糖中的 任意羟基可以例如通过膦酸基团、磷酸基团取代,通过标准保护基团保护,或活化以制备与 附加核苷酸的附加连接,或可以缀合至固体或半固体支持物。5'和3'端0Η可以磷酸化或 用1至20个碳原子的胺或有机帽化基团部分取代。其他羟基也可以衍生至标准保护基团。 多核苷酸还可以包含本领域公知的核糖或脱氧核糖的类似物形式,包括例如2' -0-甲基-、 2' -〇_烯丙基、2' -氟-或2' -叠氮基-核糖,碳环糖类似物,α -异头糖,差向异构糖如阿 拉伯糖、木糖或来苏糖,吡喃糖,呋喃糖,景天庚酮糖,无环类似物和无碱基核苷类似物如甲 基核苷。可以用备选的连接基团取代一个或多个磷酸二酯键。这些备选的连接基团包括但 不限于其中用?(〇)3("硫代")、?(5)5("二硫代")、(0)顺2("酰胺")、?(0)1^(0)(?'、0) 或CH2( "formacetal")取代磷酸的实施方案,其中每个R或R'独立地是Η或可选地包含 醚(-〇-)键的取代或未取代的烷基(1-20C)、芳基、链烯基、环烷基、环烯基或araldyl。多核 苷酸中的所有键无需相同。前面的描述适用于本文提到的所有多核苷酸,包括RNA和DNA。 [0087] 本文所用的"寡核苷酸"泛指短的、通常为单链、通常为合成的多核苷酸,其长度通 常但并非必然小于约200个核苷酸。术语"寡核苷酸"和"多核苷酸"并非相互排斥。上文 针对多核苷酸的描述同等地和完全地适用于寡核苷酸。
[0088] 本文在蛋白质或蛋白质区域的背景中所用的"运动"或"动态"指蛋白质或蛋白质 区域的结构中的构象变化。
[0089] 本文所用的"构象动态蛋白质"指能够进行一种或几种运动的蛋白质或蛋白质区 域。
[0090] 在本文中使用时,"构象稳定的"指且包括任意蛋白质或蛋白质区域,其就野生型 蛋白质而言发生改变,使得它与野生型蛋白质或蛋白质区域相比经历较少的运动。例如,可 以通过R 2分散实验(对毫秒时间尺度上的运动敏感)和/或HZNZ RiL测量(对微秒时间 尺度上的运动敏感)来测量蛋白质主链的构象稳定性程度。
[0091] 在本文中使用时,"构象稳定的遍在蛋白"指且包括任意遍在蛋白,就β 1_β 2环区 的运动而言,与野生型遍在蛋白中此区域的运动相比,其以一种或多种构象状态存在。
[0092] 术语"野生型遍在蛋白"在本文中指天然序列遍在蛋白多肽。本文所述的遍在蛋 白多肽可以是从多种来源(如从人组织类型或从另一来源)分离或通过重组或合成方法制 备的遍在蛋白多肽。"天然序列遍在蛋白多肽"包含具有与对应的衍生自自然界的遍在蛋白 多肽相同的氨基酸序列的多肽。
[0093] 本文所用的定位在蛋白质"内部"的氨基酸残基意指不处于蛋白质表面的氨基酸 残基。可以通过例如溶剂可及性研究、X射线晶体学结构、NMR结构或基于一级氨基酸序列 的预测来确定氨基酸残基是否定位在蛋白质表面。
[0094] "突变"包括确定的一级氨基酸序列中至少一个氨基酸的氨基酸缺失、氨基酸插入 和氨基酸取代。在一些方面,一级氨基酸序列中一个或多个氨基酸的突变可以导致由该氨 基酸序列编码的蛋白质在细胞内具有改变的活性或表达水平。在其他方面,一级氨基酸序 列中一个或多个氨基酸的突变(如保守性突变)可以不导致由该氨基酸序列编码的蛋白质 在细胞内具有活性或表达水平的实质性改变。
[0095] 氨基酸"取代"意指用另一氨基酸取代确定的一级氨基酸序列的至少一个氨基酸 成分。本文所用的"包含A n(x、y或z)的取代的蛋白质"意指就确定的氨基酸序列而言包 含定位在位置η的氨基酸残基取代的蛋白质,用X、y或z取代野生型氨基酸残基。
[0096] "小分子"指具有例如小于约5kD、小于约4kD和小于0. 6kD的分子量的组合物。
[0097] 术语"肽"通常指通过肽键连接的氨基酸的连续和相对短的序列。通常,但并非必 然,肽具有约2至约50个氨基酸、约4-40个氨基酸或约10-30个氨基酸的长度。虽然术语 "多肽"通常指更长形式的肽,但两个术语在本文中在某种程度可互换使用。
[0098] 术语"氨基酸"和"残基"在本文中可互换使用。
[0099] 多肽的"区域"是2个或多个氨基酸的连续序列。在一些实施方案中,区域至少约 为3、5、10、15个连续氨基酸中的任一个。"C端区域"或其变体指包含最靠近多肽的C端定 位的1-5个残基的多肽区域。"N端区域"或其变体指包含最靠近多肽的N端定位的1-5个 残基的多肽区域。多肽的"内部"区域指既不定位在多肽的N端也不定位在多肽的C端的 多肽区域。
[0100] 就参考多肽序列而言的"百分比(%)氨基酸序列同一性"定义为在比对序列并在 必要时引入缺口来达到最大百分比序列同一性,而不将任意保守取代视为序列同一性的部 分之后,候选序列中与参考多肽序列中的氨基酸残基相同的氨基酸残基的百分比。可以以 本领域技术之内的多种方式来达到以测定百分比氨基酸序列同一性为目的的比对,例如, 使用公开可得的计算机软件,如BLAST、BLAST-2、ALIGN或Megalign (DNASTAR)软件。本领域 技术人员可以确定用于比对序列的适当参数,包括在所比较的序列的全长内达到最大比对 所需的任意算法。但是,为了本文的目的,用序列比较计算机程序ALIGN-2来产生%氨基酸 序列同一'丨生值。ALIGN-2序列比较计算机程序由Genentech, Inc.编写,源代码已随用户文 件提交美国版权办公室,Washington D. C.,20559,它在美国版权办公室注册在美国版权注 册号TXU510087之下。ALIGN-2程序从Genentech, Inc.,South San Francisco, California 公开可得,或者可以从源代码编译。ALIGN-2程序应编译用在UNIX操作系统上,包括数字 UNIX V4.0D。所有序列比较参数由ALIGN-2程序设定且不变动。
[0101] 在利用ALIGN-2来进行氨基酸序列比较的情况下,按以下计算给定氨基酸序列A 与给定氨基酸序列B的%氨基酸序列同一性(其可以备选地叙述为,具有或包含与给定氨 基酸序列B的某%氨基酸序列同一性的给定氨基酸序列A):
[0102] 100乘以分数X/Y
[0103] 其中X是在该程序的A和B的比对中通过序列比对程序ALIGN-2评分为相同的匹 配的氨基酸残基的数目,且其中Y是B中的氨基酸残基的总数。应理解,在氨基酸序列A的 长度不等于氨基酸序列B的长度时,A与B的%氨基酸序列同一性将不等于B与A的%氨 基酸序列同一性。除非明确地另有说明,本文中使用的所有%氨基酸序列同一性值都是用 ALIGN-2计算机程序按前一段落中所述获得。
[0104] "融合蛋白质"指具有共价连接在一起的两个部分的多肽,其中每个部分衍生自不 同的蛋白质。两个部分可以通过单个肽键直接连接或通过包含一个或多个氨基酸残基的肽 接头连接。通常,两个部分和接头将相互符合读框,并用重组技术产生。
[0105] "障碍"或"病理性病症"是将从本发明的物质/分子或方法的治疗受益的任意病 症。这包括慢性和急性障碍或疾病,包括使哺乳动物易患所讨论的障碍的那些病理性病症。 本文中的待治疗的障碍的非限制性实例包括恶性和良性肿瘤;淋巴恶性肿瘤;神经元、胶 质细胞、星形细胞、下丘脑和其他腺体、巨噬细胞、上皮、基质和囊胚腔障碍;炎性、免疫性和 其他血管发生相关障碍。
[0106] 本文所用的"治疗"(及其语法变形)指改变所治疗的个体的自然过程的尝试中的 临床干预,且可以为了预防而进行或在临床病理的过程中进行。希望得到的治疗作用包括 但不限于防止疾病的发生或复发、减轻症状、减少疾病的任意直接或间接的病理结果、防止 转移、降低疾病进展的速率、改善或缓和疾病状态及消退或改善的预后。
[0107] 术语"抗癌疗法"指用于治疗癌症的疗法。抗癌治疗剂的实例包括但不限于例如化 疗剂、生长抑制剂、细胞毒剂、用于放射疗法的药剂、抗血管发生剂、凋亡剂、抗微管蛋白剂, 及治疗癌症的其他药剂、抗-⑶20抗体、血小板衍生生长因子抑制剂(例如Gleevec?(甲 磺酸伊马替尼(Imatinib Mesylate)))、C0X_2抑制剂(例如塞来昔布(celecoxib))、干扰 素、细胞因子、结合一种或多种以下靶标roGFR-β、BlyS、APRIL、BCMA受体、TRAIL/Apo2的 拮抗剂(例如中和抗体)及其他生物活性剂和有机化学剂等。本发明还包括其组合。
[0108] 本文所用的术语"细胞毒剂"指抑制或阻止细胞的功能和/或引起细胞的破 坏的物质。该术语旨在包括放射性同位素(例如At 211、I131、I125、Y9°、Re186、Re 188、Sm153、 Bi212、P32和Lu的放射性同位素),化疗剂,例如氨甲喋呤、阿霉素、长春花生物碱(长春 花新碱(vincristine)、长春灭癌碱(vinblastine)、依托泊苷(etoposide))、多柔比星 (doxorubicin)、苯丙氨酸氮芥(melphalan)、丝裂霉素 C、苯丁酸氮芥(chlorambucil)、柔 红霉素(daunorubicin)或其他嵌入剂,酶及其片段,如核溶解酶,抗生素,及毒素,如细菌、 真菌、植物或动物来源的小分子毒素或酶活性毒素,包括其片段和/或变体,及下文公开的 多种抗肿瘤或抗癌剂。下文描述其他细胞毒剂。杀肿瘤剂引起肿瘤细胞的破坏。
[0109] "化疗剂"指用于治疗癌症的化合物。化疗剂的实例包括:烷化剂,如噻替 派(thiotepa)和环磷酰胺(CYTOXAN?);烧基磺酸盐,如白消安(busulfan)、 英丙舒凡(improsulfan)和哌酰硫烧(piposulfan);氮丙陡,如benzodopa、卡波醌 (carboquone)、meturedopa 和 uredopa ;氮丙陡和 methylamelamine,包括六甲蜜胺 (altretamine)、三亚胺嗪(triethylenemelamine)、三亚乙基磷酰胺、三亚乙基硫代磷酰 胺和 trimethylolomelamine ;多聚乙醜(acetogenin)(尤其是番蒸枝内酯(bullatacin) 和布拉它辛酮(bul latacinone)) ; δ -9-四氢大麻酚(屈大麻酚(dronabinol), MARINOL? ) ; β -拉帕醌(beta-lapachone);拉帕醇(lapachol);秋水仙喊;枠木 酸;喜树碱(包括合成类似物拓扑替康(topotecan) (HYCAM_n:V?)、CPT-11 (伊 立替康(irinotecan),CAMPTOSAR?)、乙酰喜树碱、莨菪亭(scopolectin)和 9-氨基喜树碱);苔藓抑素(bryostatin) ;callystatin ;CC-1065 (包括其阿多来新 (adozelesin)、卡折来新(carzelesin)和比折来新(bizelesin)合成类似物);鬼臼毒素; 鬼白酸;替尼泊音(teniposide) ;cryptophycin (尤其是 cryptophycin 1 和 cryptophycin 8);多拉司他汀(dolastatin) ;duocarmycin(包括合成类似物 KW-2189 和 CB1-TM1); eleutherobin ;pancratistatin ;sarcodictyin ;spongistatin ;氮芥,如苯丁 酸氮芥、萘 氮芥(chlornaphazine)、氯憐酉先胺(chlorophosphamide)、憐雌氮芥(estramustine)、 异环憐酸胺(ifosfamide)、氮芥(mechlorethamine)、盐酸氧氮芥(mechlorethamine oxide hydrochloride)、苯丙氨酸氮芥、新氮芥(novembichin)、胆固醇对苯乙酸氮 芥(phenesterine)、松龙苯芥(prednimustine)、氯乙环憐酸胺(trofosfamide)、尿 啼陡氮芥(uracil mustard);亚硝脲(nitrosourea),如卡莫司汀(carmustine)、氯 脲菌素(chlorozotocin)、福莫司汀(fotemustine)、洛莫司汀(lomustine)、尼莫司 汀(nimustine)和雷莫司汀(ranimnustine);抗生素,如 enediyne antibiotics (例 如棘孢霉素,尤其是棘孢霉素 Yll和棘孢霉素 ΩΙ1(见例如Nicolaou等,Angew. Chem Intl.Ed.Engl.,33:183-186(1994)) ;CDP323, 口服 α-4 整联蛋白抑制剂;蒽环类抗生 素(dynemicin),包括蒽环类抗生素 A ;esperamicin ;以及新制癌菌素色基和相关色蛋白 enediyne抗生素色基)、阿克拉霉素(aclacinomycin)、放线菌素、authramycin、重氮丝氨 酸(azaserine)、博来霉素、放线菌素 C、carabicin、洋红霉素、嗜癌素(carzinophilin)、 色霉素(chromomycin)、更生霉素(dactinomycin)、柔红霉素、地托比星(detorubicin)、 6-重氮-5-氧代-L-正亮氨酸、多柔比星(包括ADRIAMYCIN?、吗啉基-多 柔比星、氰基吗啉基-多柔比星、2-吡咯啉基-多柔比星、盐酸多柔比星脂质体注射液 (DOXIL?)、脂质体多柔比星tlc d-9<MYOCET⑩)、聚乙二醇化脂质体多柔比星 .(CAELYX?)和脱氧多柔比星)、表柔比星(epirubicin)、依索比星(esorubicin)、 伊达比星(idarubicin)、麻西罗霉素(marcellomycin)、丝裂霉素(如丝裂霉素 C)、 霉酚酸、诺加霉素(nogalamycin)、橄榄霉素(olivomycin)、派来霉素(peplomycin)、 泊非霉素(porfiromycin)、_呤霉素(puromycin)、三铁阿霉素(quelamycin)、罗多 比星(rodorubicin)、链黑菌素(streptonigrin)、链唑霉素(streptozocin)、杀结 核菌素(tubercidin)、乌苯美司(ubenimex)、新制癌菌素(zinostatin)、佐柔比星 (zorubicin);抗代谢剂,如氨甲碟呤、吉西他滨(gemcitabine) (GEMZL4R?)、替 加氟(tegafur) (UFTORAIJ?)、卡培他滨(capecitabine) (XELODA?)、埃坡 霉素(epothilone)和5-氟尿啼陡(5-FU);叶酸类似物,如二甲叶酸(denopterin)、 氨甲碟呤、蝶酰三谷氨酸(pteropterin)、三甲曲沙(trimetrexate) ; _呤类似 物,如氟达拉滨(fludarabine)、6_巯基票呤、硫咪票呤(thiamiprine)、硫鸟票呤 (thioguanine);啼陡类似物,如盐酸环胞苷(ancitabine)、氮杂胞苷(azacitidine)、 6-氮尿苷(6-azauridine)、卡莫氟(carmofur)、阿糖胞苷(cytarabine)、双脱氧 尿苷(dideoxyuridine)、去氧氟脈苷(doxifluridine)、依诺他宾(enocitabine)、 去氧氟脲苷(floxuridine);雄激素,如卡普睾酮(calusterone)、丙酸甲雄焼酮 (dromostanolone propionate)、环硫雄酉享(epitiostanol)、美雄焼(mepitiostane)、睾 内酯(testolactone);抗肾上腺素(anti-adrenal),如氨鲁米特(aminoglutethimide)、 米托坦(mitotane)、曲洛司坦(trilostane);叶酸补充剂,如frolinic acid ;醋葡 内酯(aceglatone);醒磷酰胺糖苷;氨基乙酰丙酸;恩尿啼陡(eniluracil);安吖陡 (amsacrine) ;bestrabucil ;比生群(bisantrene);依达曲沙(edatraxate);地憐酉先 胺(defofamine);秋水仙胺(demecolcine);地卩丫醌(diaziquone) ;elfornithine;醋 酸轻卩比咔唑(elliptinium acetate) ;epothilone;乙环氧陡(etoglucid);硝酸嫁;轻 基脲;香菇多糖;氯尼达明(lonidainine);美登木素生物碱,如美登素和美登木素柄型 菌素;米托月瓜月宗(mitoguazone);米托葱酉昆(mitoxantrone) ;mopidanmol ;nitraerine ; 喷司他丁(pentostatin);蛋氨氮芥(phenamet);卩比柔比星(pirarubicin);洛索蒽 醌(losoxantrone) ;2_ethylhydrazide;甲基节餅(procarbazine) ; PSK? 多糖复合 物(JHS Natural Products,Eugene,OR);丙亚胺(razoxane);根霉素(rhizoxin);西佐 喃(sizofiran);螺旋锗(spirogermanium);细格孢氮杂酸(tenuazonic acid);三亚胺 醌(triaziquone) ;2, 2',2"-三氯三乙胺;单端孢霉烯(trichothecene)(尤其是T-2 毒素 、verracurin Α、杆抱菌素(roridin)A 和 anguidine);乌拉坦(urethan);长春喊 酉先胺(vindesine) (ELDISINE? % F1LDES1N馨);达卡巴曝(dacarbazine); 甘露莫司汀(mannomustine);二溴甘露醇(mitobronitol);二溴卫矛醇(mitolactol); 溴丙哌嗪(pipobroman) ;gacytosine ;阿糖胞苷(arabinoside) ( "Ara_C");噻替派 (thiotepa) ;taxoid,例如紫杉醇(paclitaxel) (TAXOL?)、紫杉醇的清蛋白改造纳米 颗粒制剂(ABRAXANE?)和 doxetaxel (TA.XOTERE?>; chloranbucil ;6_ 硫鸟噪呤; 巯基噪呤;氨甲碟呤;钼药剂,如顺钼、奥沙利钼(oxaliplatin)(例如ELOXATIN? )和卡钼;vincas,其阻止微管蛋白聚合形成微管,包括长春灭瘟碱(VELBAN?)、 长春花新碱(ONCOViN?)、长春碱酰胺(ELMSINE?、F1LDESIN?):和 长春瑞滨(vinorelbine) (NAVELB丨.NE?);依托泊苷(VP-16);异环磷酰胺;米 托蒽醌;亚叶酸(leucovorin);诺消灵(novantrone);依达曲沙(edatrexate);柔 红霉素;氨基喋呤;伊班磷酸盐(ibandronate);拓扑异构酶抑制剂RFS 2000 ;二 氟甲基鸟氨酸(DMF0);类视黄醇,如视黄酸,包括贝沙罗汀(TAKCRtynN?); 二膦酸盐,如氯膦酸二钠(例如,BONEFOSi)或OSTAC? )、依替膦酸钠 (etidronate) (Ι)ΙΙ)ΚΧ)〇ΑΙ_:..Β))、NE-58095、唑来勝酸(zoledronic acid)/唑来勝酸盐 (zoledronate) (ZOMETA?)、阿仑膦酸钠 (alendronate) (FOSAMAX?)、氨 轻二憐酸二钠(pamidronate) (AREDIA?)、替鲁膦酸钠(tiludronate) (SICELjID?) 或利塞勝酸钠(risedronate) (ACTONEL?);曲沙他滨(troxacitabine) (1,3_ 二 氧戊环核苷胞嘧啶类似物);反义寡核苷酸,尤其是抑制涉及异常细胞增殖的信号传 导途径中的基因(例如PKC-α、Raf、H-Ras和表皮生长因子受体(EGF-R))的表达的 那些;疫苗,如THERATOPE?疫苗和基因疗法疫苗,例如AIXOVECTIN⑩ 疫苗、LEUVECT丨N?疫苗和VAXID?疫苗;拓扑异构酶1抑制剂(例如 LURTOTECAN? ) ;rmRH(例如 ABAREL1X⑩);BAY439006(索拉非尼 (sorafenib) ;Bayer) ;SU_11248 (舒尼替尼(sunitinib), SUTENT?,Pfizer);哌立 福新(perifosine),C0X-2抑制剂(例如塞来昔布或etoricoxib),蛋白体抑制剂(例 如 PS341);波替单抗(bortezomib) (VELCADE?) ; CCI-779 ;tipifarnib (R11577); orafenib, ABT510 ;Bcl_2 抑制剂,如 oblimersen 钠盐(GENASENSE?);匹克生琼 (pixantrone) ;EGFR抑制剂(见下文定义);酪氨酸激酶抑制剂(见下文定义);丝氨酸-苏 氨酸激酶抑制剂,如雷帕霉素(西罗莫司(sirolimus),RAPAMUNE?);法尼基转移 酶抑制剂,如l〇nafarnib(SCH 6636, SARASARTM);以上任一种的可药用盐、酸或衍生物;以 及以上两种或多种的组合,如CHOP(环磷酰胺、多柔比星、长春花新碱和强的松龙的联合治 疗的缩写)和F0LF0X (奥沙利钼(EL0XATIN?)与5-FU和亚叶酸组合的治疗方案的缩写)。 [0110] 本文定义的化疗剂包括"抗激素剂"或"内分泌治疗剂",其发挥作用来调节、减 少、阻断或抑制可促进癌症生长的激素的作用。它们本身可以是激素,包括但不限于:具有 混合的激动剂/拮抗剂谱的抗雌激素,包括他莫昔芬(tamoxifen) (NOLVADEX?)、 4-轻基他莫昔芬(4-hydroxytamoxifen)、托瑞米芬(toremifene) (FARESTON?)、艾 多昔芬(idoxifene)、屈洛昔芬(droloxifene)、雷洛昔芬(raloxifene) (EVISTA?)、 曲沃昔芬(trioxifene)、盐酸雷洛昔芬(keoxifene)和选择性雌激素受体调节剂 (SERM),如SERM3 ;无激动剂特性的纯抗雌激素,如fulvestrant (FASLODEX?)和 EM800(这类药剂可以阻断雌激素受体(ER)二聚化,抑制DNA结合,增加 ER翻转,和/或 抑制ER水平);芳香酶抑制剂,包括类固醇芳香酶抑制剂,如福美坦(formestane)和 依西美坦(exemestane) (A ROM AS丨:S?),及非类固醇芳香酶抑制剂,如阿那曲唑 (anastrazole) (ARiMIDEX?)、来曲唑(letrozole) (FEMAJRA?)和氛鲁米特 (aminoglutethimide),及其他芳香酶抑制剂,包括伏氯唑(vorozole) (MVISOR?)、 醋酸甲地孕酮(megestrol acetate) (MEGASE?)、法倔唑(fadrozole)和 4(5)-咪 唑;促黄体激素释放激素激动剂,包括醋酸亮丙瑞林(leuprolide) (UJPRON⑩和 E3LIGARJD? )、戈舍瑞林(goserelin)、布舍瑞林(buserelin)和 tripterelin ;性类固 醇,包括progestine,如醋酸甲地孕酮和醋酸甲轻孕酮(medroxyprogesterone acetate), 雌激素,如己烯雌酚(diethylstilbestrol)和马雌激素(premarin),及雄激素/类视黄 醇,如氟轻甲睾酮(fluoxymesterone)、全反式维甲酸和芬维A胺(fenretinide);奥那司酮 (onapristone);抗孕酮;雌激素受体下调剂(ERD);抗雄激素,如氟他胺(flutamide)、尼鲁 米特(nilutamide)和比卡米特(bicalutamide);及以上任一种的可要用盐、酸或衍生物; 以及以上两种或多种的组合。
[0111] 本申请中所用的术语"前体药物"指药物活性物质的前体或衍生形式,与亲本 药物相比,其对肿瘤细胞的细胞毒性较低,且能够通过酶激活或转化为更具活性的亲本 形式。见例如 Wilman, "Prodrugs in Cancer Chemotherapy,'Biochemical Society Transactions, 14, 375-382页,615th Meeting Belfast(1986);和Stella等,"Prodrugs:A Chemical Approach to Targeted Drug Delivery,,'Directed Drug Delivery, Borchardt 等,(编辑),247-267页,Humana Press (1985)。本发明的前体药物包括但不限于:包含磷 酸的前体药物、包含硫代磷酸的前体药物、包含硫酸的前体药物、包含肽的前体药物、D-氨 基酸修饰的药物、糖基化的前体药物、包含β-内酰胺的前体药物、包含可选地取代的苯氧 乙酰胺的前体药物或包含可选地取代的苯乙酰胺的前体药物、5-氟胞嘧啶及可以转化为更 具活性的细胞毒性游离药物的其他5-氟胞嘧啶前体药物。可以衍生为用于本发明的前体 药物形式的细胞毒性药物的实例包括但不限于上文所述的那些化疗剂。
[0112] 在本文中使用时,"生长抑制剂"指抑制细胞生长的化合物或组合物。生长 抑制剂的实例包括阻断细胞周期进程(在S期以外的地方)的药剂,如诱导G1阻滞 和Μ期阻滞的药剂。经典的Μ期阻断剂包括长春碱(例如长春花新碱和长春灭瘟碱)、 紫杉烷(taxane)及诸如多柔比星、表柔比星、柔红霉素、依托泊苷和博来霉素的拓扑 异构酶II抑制剂。阻滞G1的那些药剂也涉及S期阻滞,例如DNA烷化剂,如他莫昔 芬、强的松、达卡巴嗪、氮芥、顺钼、氨甲喋呤、5-氟尿嘧啶和阿糖胞苷。其他信息可以 见于 The Molecular Basis of Cancer, Mendelsohn 和 Israel,编辑,第 1 章,标题 ''Cell cycle regulation, oncogenes, and antineoplastic drugs^by Murakami 等(WB Saunders:Philadelphia, 1995),尤其是第13页。紫杉烧(紫杉醇和紫杉廠(docetaxel)) 二者都是衍生自紫杉的抗癌药物。衍生自欧洲紫杉的紫杉廠(TAXOTERE?, Rhone-Poulenc Rorer)是紫杉醇(_IAXOL?,Bristol-Myers Squibb)的半合成类似 物。紫杉醇和紫杉萜促进从微管蛋白二聚体组装微管,并通过阻止解聚来稳定微管,这导致 细胞有丝分裂的抑制。
[0113] "放射疗法"意指用定向的Y射线或β射线来诱导对细胞的足够损伤,以限制其 正常执行功能的能力或完全破坏细胞。应理解,将存在本领域已知的许多方式来确定处理 的剂量和持续时间。典型的处理作为一次性施用提供,典型的剂量在每天10至200单位 (Gray)范围内。
[0114] 药剂(例如药物制剂)的"有效量"指对在必要的剂量和时间下达到希望的治疗 或预防结果有效的量。本发明的物质/分子、激动剂或拮抗剂的"治疗有效量"可以根据诸 如个体的疾病状态、年龄、性别和体重、物质/分子、激动剂或拮抗剂在个体中引出希望的 反应的能力的因素而变。治疗有效量还是这样的量,其中物质/分子、激动剂或拮抗剂的治 疗有益作用超过了任意毒性作用或有害作用。"预防有效量"指对在必要的剂量和时间下达 到希望的预防结果有效的量。通常但并非必然,由于预防性剂量是在疾病之前或疾病的早 期阶段用于个体,预防有效量将低于治疗有效量。
[0115] 术语"药物制剂"指这样的制剂,其处于这样的形式,使得允许包含在其中的活性 成分的生物学活性有效,且其不包含对将施用该制剂的个体具有不可接受的毒性的附加成 分。
[0116] "可药用载体"指药物制剂中除活性成分外的成分,其对个体无毒性。可药用载体 的实例包括但不限于缓冲剂、赋形剂、稳定剂或防腐剂。
[0117] "个体"或"受试者"是哺乳动物。哺乳动物包括但不限于家养动物(例如牛、绵羊、 猫、狗和马)、灵长类(例如人类和非人灵长类,如猴)、兔和啮齿类(例如小鼠和大鼠)。在 某些实施方案中,该个体或受试者是人。
[0118] 用术语"包装说明书"来指通常包含在治疗性产品的商业包装中的说明,其包含关 于适应症、用途、剂量、施用、组合疗法、禁忌症的信息和/或关于这类治疗性产品的用途的 敬生 目R 〇
[0119] 如本领域技术人员所理解,本文提到"约"某个值或参数包括(和描述)指向该值 或参数本身的实施方案。例如,提到"约X"的描述包括"X"的描述。
[0120] 应理解,本文所述的本发明的方面和实施方案包括"由方面和实施方案组成"和/ 或"基本由方面和实施方案组成"。除非另有说明,本文所用的单数形式"一"、"一个"和"该" 包括复数指代物。
[0121] III.本发明的组合物
[0122] 本文提供相对于野生型遍在蛋白的氨基酸序列具有一个或多个氨基酸取代的构 象稳定的遍在蛋白。在一些方面,与野生型遍在蛋白与遍在蛋白加工酶的结合亲和力相比, 该构象稳定的遍在蛋白显示提高的与一种或多种遍在蛋白加工酶(如但不限于遍在蛋白 特异性蛋白酶(USP)家族脱遍在蛋白酶的一个或多个成员)的结合亲和力。在一些方面, 如通过NMR R2分散所测量,与野生型遍在蛋白中β?/β 2环区的动态相比,该构象稳定的 遍在蛋白的此区域显示更慢的构象动态。本文还提供编码该构象稳定的遍在蛋白的核酸, 用于表达和分离该构象稳定的遍在蛋白的载体和细胞,以及包含构象稳定的遍在蛋白和以 高亲和力结合遍在蛋白的特定构象形式的结合配偶体的蛋白复合物。
[0123] Α.构象稳定的遍在蛋白
[0124] 在一些方面,本文所述的构象稳定的遍在蛋白以纳摩尔范围内的Kd与结合配偶 体(例如USP家族脱遍在蛋白酶)结合。在一些方面,该构象稳定的遍在蛋白以比野生型 蛋白质的亲和力高至少1000倍的亲和力与结合配偶体(例如USP家族脱遍在蛋白酶,如 USP7)结合。在一些方面,该构象稳定的遍在蛋白抑制一种或多种遍在蛋白加工酶或脱遍在 蛋白酶的活性。在一些方面,与野生型蛋白质的结合相比,该构象稳定的遍在蛋白显示与结 合配偶体(例如UCH家族脱遍在蛋白酶的成员)无结合或具有减少的结合。
[0125] 在一些实施方案中,本文公开的构象稳定的遍在蛋白与结合配偶体(例如USP家 族脱遍在蛋白酶)具有通过Kd测定的小于约1. 0mM、500 μ M、100 μ Μ、50 μ Μ、25 μ M、10 μ M、 5μ Μ、1μΜ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、100ηΜ、90ηΜ、 80ηΜ、70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5ηΜ 或 ΙηΜ (包含,包 括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中,该结合配偶 体是遍在蛋白加工酶,如但不限于任意Ε1、Ε2或Ε3遍在蛋白加工酶或脱遍在蛋白酶。在一 些实施方案中,该结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和 /或USP14)。在一些实施方案中,通过本领域已知的任意方法(尤其是本文所述的方法) 来测定结合亲和力。
[0126] 在一些方面,与结合配偶体与野生型遍在蛋白的结合相比,本文公开的构象稳定 的遍在蛋白以更高的亲和力与结合配偶体结合。在一些方面,与结合配偶体与野生型遍 在蛋白的结合相比,构象稳定的遍在蛋白以高至少10、20、30、40、50、60、70、80、90、100、 200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、 6000、7000、8000、9000或10,000(包含,包括这些数字之间的任意值)倍中任一个的亲和 力与结合配偶体结合。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意 E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家族 脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中,结合配 偶体是USP7。在一些实施方案中,通过本领域已知的任意方法(尤其是本文所述的方法) 来测定结合倍数亲和力。
[0127] 在一些方面,与野生型蛋白质的结合相比,本文提供的构象稳定的遍在蛋白显示 与结合配偶体无结合或具有减少的结合。在一些实施方案中,与结合配偶体与野生型遍 在蛋白的结合相比,构象稳定的遍在蛋白以减少至少10、20、30、40、50、60、70、80、90、100、 200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、 6000、7000、8000、9000或10, 000 (包含,包括这些数字之间的任意值)倍中任一个的亲和力 与结合配偶体结合。在一些实施方案中,与结合配偶体与野生型遍在蛋白的结合相比,构象 稳定的遍在蛋白以低至少 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、 60%、65%、70%、75%、80%、85%、90%、95%或100%(包含,包括这些值之间的任意百分 比)中任一个的亲和力与结合配偶体结合。在一些实施方案中,构象稳定的遍在蛋白不与 结合配偶体结合。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意E1、 E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是UCH家族脱 遍在蛋白酶的成员。在一些实施方案中,与野生型遍在蛋白相比,本文提供的构象稳定的遍 在蛋白显示与UCH家族脱遍在蛋白酶的成员无结合或具有减少的结合,同时显示增加的与 USP家族脱遍在蛋白酶的成员的结合。在一些实施方案中,通过本领域已知的任意方法(尤 其是本文所述的方法)来测定通过Kd测定的结合亲和力。
[0128] 在另一方面,本文提供的构象稳定的遍在蛋白抑制(例如完全抑制)一种或多种 遍在蛋白加工酶或一种或多种脱遍在蛋白酶的活性。在一些实施方案中,与野生型遍在蛋 白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一种或多种遍在蛋白加工酶(如但不 限于El、E2或E3遍在蛋白加工酶)或一种或多种脱遍在蛋白酶的活性抑制约5%、10%、 15 %,20 %,25 %,30 %,35 %,40 %,45 %,50 %,55 %,60 %,65 %,70 %,75 %,80 %,85 %, 90%、95%或100% (包含,包括这些值之间的任意百分比)中的任一个。在一些实施方 案中,构象稳定的遍在蛋白不能掺入多聚遍在蛋白链或单遍在蛋白化靶蛋白。在一些实施 方案中,构象稳定的遍在蛋白能够掺入多聚遍在蛋白链或单遍在蛋白化靶蛋白。在一些实 施方案中,构象稳定的遍在蛋白能够掺入多聚遍在蛋白链,但与野生型遍在蛋白掺入多聚 遍在蛋白链相比,以低约 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、 60%、65%、70%、75%、80%、85%、90%、95%或100%(包含,包括这些值之间的任意百分 比)中任一个的效率掺入。
[0129] 在本文公开的构象稳定的遍在蛋白中任一个的一些方面,一个或多个氨基酸取代 稳定化蛋白质的β?/β 2环,使得β?/β 2环的构象动态相对于野生型遍在蛋白中此区域 的运动减慢。在一些实施方案中,与野生型遍在蛋白中此区域所显示构象动态相比,构象稳 定的遍在蛋白中的β 1/β 2环区显示慢约10%、20%、30%、40%、50%、60%、70%、80%、 90%或100% (包含,包括这些值之间的任意百分比)中任一个的构象动态。在一些实施方 案中,构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3ΝΗΕ链Β的约0. 5 至3 A (包括约0.7至2.7 Α、1.0至2.4 Α、1.3至2.1 Α、1.6至1.8Α.)均方根偏差 (RMSD)内的区域。在一个实施方案中,构象稳定的遍在蛋白中的β?/β 2环区限制于蛋白 质数据库编号3ΝΗΕ链Β的约1J赢RMSD内的区域。在一些实施方案中,与野生型遍在蛋 白相比,本文公开的任意构象稳定的遍在蛋白的β 1/β 2环周围的区域中的微秒值高至 多约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包 含,包括这些值之间的任意数字)倍中的任一个。在具体实施方案中,与野生型遍在蛋白相 t匕,本文公开的任意构象稳定的遍在蛋白的β 1/β 2环周围的区域中的微秒Rex值高至多约 40倍。在一些实施方案中,通过本领域已知的任意方法(尤其是本文所述的方法)来测定 本文公开的遍在蛋白变体的β?/β 2环区较慢的构象动态的程度。在一个实施方案中,该 方法是NMR R2分散。
[0130] 本文提供构象稳定的遍在蛋白。在一些方面,本文公开的构象稳定的遍在蛋白在 遍在蛋白的三级结构内部具有一个或多个氨基酸取代,其稳定化该蛋白质为特定的构象状 态。
[0131] 在一些实施方案中,构象稳定的遍在蛋白在选自47、48313334、436、469和八71 的氨基酸残基处包含一个或多个取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些 实施方案中,构象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1. OmM、500 μ Μ、 100 μ Μ、50 μ Μ、25 μ Μ、10 μ Μ、5 μ Μ、1 μ Μ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、 200ηΜ、150ηΜ、100ηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、 15ηΜ、ΙΟηΜ、5ηΜ或ΙηΜ (包含,包括这些数字之间的任意值)中的约任一个的结合亲和力。在 一些实施方案中,与野生型遍在蛋白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一 种或多种酶促遍在蛋白结合配偶体的活性抑制约5%、10%、15%、20%、25%、30%、35%、 40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%(包含,包括 这些值之间的任意百分比)中的任一个。在一些实施方案中,结合配偶体是遍在蛋白加工 酶,如但不限于任意El、Ε2或Ε3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结 合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一些 实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中, 与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、 200、300、400、500、600、700、800、900或1000 (包含,包括这些值之间的任意数字)倍中任 一个的亲和力与USP7结合。在另一实施方案中,构象稳定的遍在蛋白与USP14结合但不能 与USP7结合。在一个实施方案中,结合配偶体是USP7。在一个实施方案中,如通过NMRR 2 分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的β1/β2环周围的区域中的 微秒 Rex 值高至多约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、 900或1000(包含,包括这些值之间的任意数字)倍中的任一个。在具体实施方案中,如通 过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的β 1/β 2环周围的区 域中的微秒Ιζχ值高至多约40倍。在一些实施方案中,构象稳定的遍在蛋白中的β?/β 2 环区限制于蛋白质数据库编号3NHE链B的约0.5至3 i (包括约0.7至2.7 1、1.0至 2,4 1.3至2.1 1.6至丨,8.\)RMSD内的区域。在一个实施方案中,构象稳定的遍 在蛋白中的β 1/β 2环区限制于蛋白质数据库编号3NHE链B的约1J ▲ RMSD内的区域。 在一些实施方案中,取代导致在遍在蛋白中形成一个或多个二硫键。在另一实施方案中,取 代未导致在遍在蛋白中形成一个或多个二硫键。
[0132] 在一些方面,构象稳定的遍在蛋白在选自A7(C)、A8(C)和A69(C)的氨基酸残基处 包含一个或多个取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在具体实施方案中,蛋 白质包含A7(C)或A8(C)和A69(C)。在一些实施方案中,构象稳定的遍在蛋白在A13处具 有进一步的取代。在一个实施方案中,A13处的取代是取代为极性氨基酸残基。在另一实 施方案中,蛋白质包含A13 (R、N、D、C、E、Q、Η、K、S、T或Y)。在一些实施方案中,蛋白质包 含A13 (N、R、G、K、Y、A、S或H)。还在另一实施方案中,构象稳定的遍在蛋白在A71处具有 进一步的取代。在一个实施方案中,A71处的取代是取代为碱性氨基酸。在另一实施方案 中,蛋白质包含A71(R、K或H)。在一些实施方案中,蛋白质包含A13(R或K)。在另一实施 方案中,构象稳定的遍在蛋白在A13处和A71处都具有进一步的取代,其中A13处的取代是 取代为极性氨基酸残基,而A71处的取代是取代为碱性氨基酸。在一些实施方案中,蛋白质 包含八13〇?、队0、(:4、〇、!1、1(、5、1'或¥)和471〇?、1(或!1)。在另一实施方案中,蛋白质包含 八13(队1?、6、1(、¥、4、3或!1)和六71〇?或1()。在另一实施方案中,蛋白质包含47(〇、48(〇 或 A69 (C),且可以在 A36 (Y、F、L 或 Η)、A34 (I、F、L 或 V)、A13 (N、R、G、K、Y、A、S 或 H)或 A71(R或K)中的一处或多处具有附加的取代。在一些实施方案中,构象稳定的遍在蛋白与 结合配偶体具有通过Kd测定的小于约1. 0mM、500 μ M、100 μ Μ、50 μ Μ、25 μ M、10 μ Μ、5 μ M、 1 μ Μ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、100ηΜ、90ηΜ、80ηΜ、 70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、10ηΜ、5ηΜ 或 ΙηΜ(包含,包括这 些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中,与野生型遍在蛋 白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体 的活性抑制约 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、 70%、75%、80%、85%、90%、95%或100%(包含,包括这些值之间的任意百分比)中的任 一个。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意E1、E2或E3遍在 蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家族脱遍在蛋白酶的 成员(如但不限于USP7、USP5和/或USP14)。在一些实施方案中,构象稳定的遍在蛋白与 USP7结合但不能与USP14结合。在一些实施方案中,与野生型遍在蛋白相比,构象稳定的遍 在蛋白以高约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施 方案中,构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一个实施方案中,结合 配偶体是USP7。在一个实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构 象稳定的遍在蛋白的β 1/β2环周围的区域中的微秒Rex值高至多约10、20、30、40、50、60、 70、80、90、100、200、300、400、500、600、700、800、900 或 1000 (包含,包括这些值之间的任意 数字)倍中的任一个。在具体实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白 相比,构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒Rex值高至多约40倍。在一 些实施方案中,构象稳定的遍在蛋白中的β?/β 2环区限制于蛋白质数据库编号3NHE链B 的约 0.5 至3 A (包括约 〇·7 至 2J Α、1·〇 至 2.4 A、1.3 至 2.1 A、1.6 至1.8A) RMSD内的区域。在一个实施方案中,构象稳定的遍在蛋白中的β?/β 2环区限制于蛋白质 数据库编号3ΝΗΕ链Β的约1J 1 RMSD内的区域。在一些实施方案中,取代导致在遍在蛋 白中形成一个或多个二硫键。
[0133] 在一些方面,构象稳定的遍在蛋白在氨基酸残基Α71处包含取代,其中氨基酸残 基位置是相对于SEQ ID Ν0:1。在一些实施方案中,蛋白质包含A71(R、K、A、Q、G、W、H、I* R)。在一些实施方案中,蛋白质包含A71(R)。在一些实施方案中,蛋白质包含A71(K)。在 一些实施方案中,蛋白质包含A71(W)。在一些实施方案中,蛋白质包含A71(G)。在一些实 施方案中,在A71处具有取代的蛋白质可以在A69 (C、G、A、W、K、Y、V、F或I)、A36 (Y、F、L、 H、A、V、W、I、M*N)、A34(I、F、L、V、S、M*T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M* ?)、六8(1\(:、0、1?、6、(:、1\六、〇、?、1^或¥)和/或六7((:、队?、5、1?、6、¥或0)中的一处或多 处具有附加的取代。在一些实施方案中,构象稳定的遍在蛋白与结合配偶体具有通过Kd测 定的小于约 1. 0mM、500 μ M、100 μ Μ、50 μ Μ、25 μ M、10 μ Μ、5 μ Μ、1 μ M、900nM、800nM、700nM、 600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、1ΟΟηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、 35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5ηΜ或ΙηΜ (包含,包括这些数字之间的任意值)中的约 任一个的结合亲和力。在一些实施方案中,与野生型遍在蛋白引起的这些酶的抑制相比,构 象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制约5%、10%、15%、 20 %,25 %,30 %,35 %,40 %,45 %,50 %,55 %,60 %,65 %,70 %,75 %,80 %,85 %,90 %, 95%或100% (包含,包括这些值之间的任意百分比)中的任一个。在一些实施方案中,结合 配偶体是遍在蛋白加工酶,如但不限于任意El、Ε2或Ε3遍在蛋白加工酶或脱遍在蛋白酶。 在一些实施方案中,结合配偶体是USP家族脱遍在蛋白酶的成员(如但不限于USP7、USP5 和/或USP14)。在一个实施方案中,结合配偶体是USP7。在一些实施方案中,构象稳定的遍 在蛋白与USP7结合但不能与USP14结合。在一些实施方案中,与野生型遍在蛋白相比,构 象稳定的遍在蛋白以高约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、 800、900或1000 (包含,包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。 在另一实施方案中,构象稳定的遍在蛋白与USP14结合但不能与USP7结合。在一些实施方 案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的β?/β 2 环周围的区域中的微秒 Rex 值高至多约 10、20、30、40、50、60、70、80、90、100、200、300、400、 500、600、700、800、900或1000(包含,包括这些值之间的任意数字)倍中的任一个。在具 体实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的 β 1/β 2环周围的区域中的微秒值高至多约40倍。在一些实施方案中,构象稳定的遍 在蛋白中的β 1/ β 2环区限制于蛋白质数据库编号3NHE链B的约0. 5至3 ▲(包括约〇. 7 至2,71、ι·〇至2,4赢、1.3至2.1 1.6至l,ft|)RMSD内的区域。在一个实施方案 中,构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库编号3NHE链B的约1.魯▲ RMSD内的区域。
[0134] 在一些方面,构象稳定的遍在蛋白在氨基酸残基Α34处包含取代,其中氨基酸残 基位置是相对于SEQ ID NO: 1。在一些实施方案中,A34处的取代是取代为疏水性氨基酸。 在一些实施方案中,蛋白质包含六34仏、¥、1、1^、厘、?、¥或吣。在一些实施方案中,蛋白质 包含A34(I、F、L、V、T、S、Μ或T)。在一些实施方案中,在A34处具有取代的蛋白质可以在 Α71 (R、K、A、Q、W、G、Η、I、R 或 G)、Α69 (C、G、A、W、Κ、Υ、V、F 或 I)、Α36 (Y、F、L、H、A、W、I、Μ *N)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M*P)、A8(T、C、D、R、G、C、T、A、Q、F、L*Y) 和/或八7((:、队?、5、1?、6、¥或0)中的一处或多处具有附加的取代。在一些实施方案中,构 象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1. 0mM、500 μ Μ、100 μ Μ、50 μ Μ、 25 μ Μ、10 μ Μ、5 μ Μ、1 μ Μ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、 ΙΟΟηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5ηΜ 或 ΙηΜ(包含,包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中, 与野生型遍在蛋白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在 蛋白结合配偶体的活性抑制约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、 55%、60%、65%、70%、75%、80%、85%、90%、95% 或 100% (包含,包括这些值之间的任 意百分比)中的任一个。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任 意Ε1、Ε2或Ε3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家 族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中,结合 配偶体是USP7。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。 在一些实施方案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、 60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包括这些值之间的 任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中,构象稳定的遍在蛋白与 USP14结合但不能与USP7结合。在一些实施方案中,如通过NMR R2分散所测量,与野生型 遍在蛋白相比,构象稳定的遍在蛋白的β 1/β 2环周围的区域中的微秒值高至多约10、 20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包括 这些值之间的任意数字)倍中的任一个。在具体实施方案中,如通过NMR R2分散所测量,与 野生型遍在蛋白相比,构象稳定的遍在蛋白的β 1/β 2环周围的区域中的微秒值高至多 约40倍。在一些实施方案中,构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据库 编号3ΝΗΕ链Β的约0.5至3 ▲(包括约0.7至2,7 1.0至2.4 1.3至2.1 Α、 1.6至ljl)RMSD内的区域。在一个实施方案中,构象稳定的遍在蛋白中的β 1/β2环区 限制于蛋白质数据库编号3ΝΗΕ链Β的约1.6 A RMSD内的区域。
[0135] 在一些方面,构象稳定的遍在蛋白在氨基酸残基Α7处包含取代,其中氨基酸残基 位置是相对于SEQ ID Ν0:1。在一个实施方案中,蛋白质包含A7(C、N、F、S、D、F、R、G*V)。 在一些实施方案中,蛋白质包含A7 (G)。在一些实施方案中,在A7处具有取代的蛋白质可 以在 A71 (R、K、A、Q、W、G、Η、I、R 或 G)、A69 (C、G、A、W、K、Y、V、F 或 I)、A34 (I、F、L、V、S、Μ *T)、A13(N、R、G、K、Y、A、S、H、E、L、T、V、I、M*P)、A8(T、C、D、R、G、C、T、A、Q、F、L*Y) 和/或八36(¥、?、1^、!1、1、4或沁中的一处或多处具有附加的取代。在一些实施方案中,构 象稳定的遍在蛋白与结合配偶体具有通过Kd测定的小于约1. 0mM、500 μ Μ、100 μ Μ、50 μ Μ、 25 μ Μ、10 μ Μ、5 μ Μ、1 μ Μ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、 ΙΟΟηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5ηΜ 或 InM(包含,包括这些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中, 与野生型遍在蛋白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在 蛋白结合配偶体的活性抑制约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%或 100% (包含,包括这些值之间的任 意百分比)中的任一个。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任 意E1、E2或E3遍在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家 族脱遍在蛋白酶的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中,结合 配偶体是USP7。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结 合。在一些实施方案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、 50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包括这些值之间 的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中,构象稳定的遍在蛋白 与USP14结合但不能与USP7结合。在一些实施方案中,如通过NMR R2分散所测量,与野生 型遍在蛋白相比,构象稳定的遍在蛋白的β 1/ β 2环周围的区域中的微秒值高至多约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包 括这些值之间的任意数字)倍中的任一个。在具体实施方案中,如通过NMR R2分散所测量, 与野生型遍在蛋白相比,构象稳定的遍在蛋白的β 1/β 2环周围的区域中的微秒值高至 多约40倍。在一些实施方案中,构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据 库编号3ΝΗΕ链Β的约0.5至3 A (包括约〇·7至2.7 Α、1·〇至2.4 1.3至2.1 Α、 1.6至1.8l)RMSD内的区域。在一个实施方案中,构象稳定的遍在蛋白中的β 1/β2环区 限制于蛋白质数据库编号3ΝΗΕ链Β的约1J A RMSD内的区域。
[0136] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A36处包含取代,其中氨基酸残 基位置是相对于SEQ ID N0:1。在一些实施方案中,A36处的取代是取代为芳族氨基酸。在 一个实施方案中,蛋白质包含A36 (W或Y)。在另一实施方案中,蛋白质包含A36 (L、F、W、M、 Y、Η、I、A或N)。在一些实施方案中,在A36处具有取代的蛋白质可以在A71 (R、K、A、Q、W、 G、Η、I、R 或 G)、A69 (C、G、A、W、K、Y、V、F 或 I)、A34 (I、F、L、V、S、Μ 或 T)、A13 (N、R、G、K、 ¥、八、5、!^、1^、1\¥、1、]\1或?)、八8(1\(:、0、1?、6、(:、1\八、〇、卩、1^或¥)和/或八7((:、队卩、5、 R、G、V或D)中的一处或多处具有附加的取代。在一些实施方案中,构象稳定的遍在蛋白与 结合配偶体具有通过Kd测定的小于约1. 0mM、500 μ M、100 μ Μ、50 μ Μ、25 μ M、10 μ Μ、5 μ M、 1μΜ、900ηΜ、800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、100ηΜ、90ηΜ、80ηΜ、 70ηΜ、60ηΜ、50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、10ηΜ、5ηΜ 或 ΙηΜ(包含,包括这 些数字之间的任意值)中的约任一个的结合亲和力。在一些实施方案中,与野生型遍在蛋 白引起的这些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体 的活性抑制约 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、 70%、75%、80%、85%、90%、95%或100%(包含,包括这些值之间的任意百分比)中的任 一个。在一些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意El、E2或E3遍 在蛋白加工酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家族脱遍在蛋白酶 的成员(如但不限于USP7、USP5和/或USP14)。在一个实施方案中,结合配偶体是USP7。 在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方 案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、 100、200、300、400、500、600、700、800、900或1000 (包含,包括这些值之间的任意数字)倍中 任一个的亲和力与USP7结合。在另一实施方案中,构象稳定的遍在蛋白与USP14结合但不 能与USP7结合。在一些实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构 象稳定的遍在蛋白的β 1/β2环周围的区域中的微秒Rex值高至多约10、20、30、40、50、60、 70、80、90、100、200、300、400、500、600、700、800、900 或 1000 (包含,包括这些值之间的任意 数字)倍中的任一个。在具体实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白 相比,构象稳定的遍在蛋白的β1/β2环周围的区域中的微秒Rex值高至多约40倍。在一 些实施方案中,构象稳定的遍在蛋白中的β?/β 2环区限制于蛋白质数据库编号3NHE链B 的约 0.5 至3 A (包括约 0.7 至 2JA、1.0 至 2.4 Α、1.3 至 2.1 Α、1.6 至 l.8A)RMSD 内的区域。在一个实施方案中,构象稳定的遍在蛋白中的β1/β2环区限制于蛋白质数据 库编号3ΝΗΕ链Β的约1,6 A RMSD内的区域。
[0137] 在一些实施方案中,构象稳定的遍在蛋白在氨基酸残基A7或A8处及A69和A71 处包含取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含 A7(C)或A8(C)和A69(C),且A71处的取代是取代为碱性氨基酸。在一个实施方案中,蛋白 质包含A7(C)、A71(R或K)和△8(1\0、1?、6、(:、1\4、〇、?、1^或¥)。在另一实施方案中,蛋白 质包含A8 (C)、A71 (R或K)和A7 (N、F、S、R、G、V或D)。在一些实施方案中,构象稳定的遍 在蛋白进一步在八34(1、卩、1^、¥、5、]?或1')、八13(队1?、6、1(、¥、八、5、!13儿、1'、¥、1、]\1或?)和 /或A36 (Y、F、L、Η、I、A或N)中的任意处包含一个或多个取代。
[0138] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A7或A8处以及A69和A34处包含 取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含A7(C) 或A8(C)、A69(C)和A34(I)。在一个实施方案中,蛋白质包含A7(C)和A8(T、D、R、G、C、T、 A、Q、F、L或Y)。在另一实施方案中,蛋白质包含A8(C)和六7(队?、5、1?、6、¥或0)。在一些 实施方案中,构象稳定的遍在蛋白进一步在A13 (N、R、G、K、Y、A、S、Η、E、L、T、V、I、Μ或P)、 八71〇?、1(、六、〇、1、6、!1、1、1?或6)和/或六36(¥、?、1^!1、1、4或吣中的任意处包含一个或多 个取代。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一 些实施方案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、 70、80、90、100、200、300、400、500、600、700、800、900 或 1000 (包含,包括这些值之间的任意 数字)倍中任一个的亲和力与USP7结合。
[0139] 在一些方面,构象稳定的遍在蛋白在氨基酸残基Α7或Α8处以及Α69、Α34和Α36 处包含取代,其中氨基酸残基位置是相对于SEQ ID Ν0:1。在一些实施方案中,蛋白质包含 A7 (C)或A8 (C)、A69 (C)、A34 (I),且A36处的取代是取代为芳族氨基酸。在一个实施方案 中,蛋白质包含47(〇、436$或¥)和48(1\0、1?、6、(:、1\4、0、?、1^或¥)。在一个实施方案 中,蛋白质包含A8(C)、A36(F或Y)和八7(队?、5、1?、6、¥或0)。还在另一实施方案中,构象 稳定的遍在蛋白进一步在 A13 (N、R、G、K、Y、A、S、Η、E、L、T、V、I、Μ 或 P)和 / 或 A71 (R、K、 A、Q、W、G、H、I、R或G)处包含一个或多个取代。在一些实施方案中,构象稳定的遍在蛋白与 USP7结合但不能与USP14结合。在一些实施方案中,与野生型遍在蛋白相比,构象稳定的遍 在蛋白以高约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。
[0140] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A7、A13和A71处包含取代,其中 氨基酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含A7(F)、A13(Y)和 A71(R)。在一些实施方案中,构象稳定的遍在蛋白进一步在A34(I、F、L、V、S、M或T)、A69(C、 6、八、1、1(、¥、¥、卩或1)、六8(1\(:、0、1?、6、(:、1\六、〇、卩、1^或¥)和/或六36(¥、卩、1^、!1、1、八或 N)处包含一个或多个取代。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与 USP14结合。在另一实施方案中,构象稳定的遍在蛋白与USP14结合但不能与USP7结合。
[0141] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A7、A13、A34、A36和A71处包含 取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含A7(F)、 A13(Y)、A71(R)、A34(I或L)和A36(I或L)。在一些实施方案中,蛋白质包含A34(L)和 A36(I)。在一些实施方案中,蛋白质包含A34(I)和A36(L)。在一些实施方案中,构象稳定 的遍在蛋白进一步在 A69 (C、G、A、W、K、Y、V、F 或 I)和 / 或 A8 (T、C、D、R、G、C、T、A、Q、F、L 或Y)处包含一个或多个取代。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不 能与USP14结合。在一些实施方案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 或 1000(包含,包 括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另一实施方案中,构象稳 定的遍在蛋白与USP14结合但不能与USP7结合。
[0142] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A7、A13、A34、A36、A69和A71处 包含取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含 A7 (F)、A13 (Y)、A71 (R)、A34 (I 或 L)、A36 (I 或 L)和 A69 (G 或 W)。在一个实施方案中,蛋 白质包含A69G)、A34(L)和A36(I)。在一些实施方案中,蛋白质包含A69(G)、A34(I)和 A36(L)。在一个实施方案中,蛋白质包含A69(W)、A34(L)和A36(I)。在另一实施方案中, 蛋白质包含A69(W)、A34(I)和A36(L)。在一些实施方案中,构象稳定的遍在蛋白进一步在 八8(1\(:、0、1?、6、(:、1\4、〇、?、1^或¥)处包含取代。在一些实施方案中,构象稳定的遍在蛋 白与USP7结合但不能与USP14结合。在一些实施方案中,与野生型遍在蛋白相比,构象稳 定的遍在蛋白以高约 10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、 900或1000(包含,包括这些值之间的任意数字)倍中任一个的亲和力与USP7结合。在另 一实施方案中,构象稳定的遍在蛋白与USP14结合但不能与USP7结合。
[0143] 在一些方面,构象稳定的遍在蛋白在氨基酸残基A7和A71处包含取代,其中氨基 酸残基位置是相对于SEQ ID N0:1。在一些实施方案中,蛋白质包含A7(G)和A71(W)。在 一个实施方案中,蛋白质在A8处具有进一步的取代,取代为F或L。在一些实施方案中,蛋 白质包含A8(F)。在另一实施方案中,蛋白质包含A8(L)。在一些实施方案中,构象稳定的 遍在蛋白进一步在 A34 (I、F、L、V、S、Μ 或 T)、A69 (C、G、A、W、K、Y、V、F 或 I)、A13 (N、R、G、 1(、¥、4、5、!^、1^、1\¥、1、]\1或?)和/或436(¥、?、1^、!1、1、4或吣处包含一个或多个取代。 在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方 案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、 100、200、300、400、500、600、700、800、900或1000 (包含,包括这些值之间的任意数字)倍中 任一个的亲和力与USP7结合。在另一实施方案中,构象稳定的遍在蛋白与USP14结合但不 能与USP7结合。
[0144] 在一些方面,构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69 和A71的一个或多个取代,其中氨基酸残基位置是相对于SEQ ID N0:1,且其中取代导致至 少一个二硫键的形成。在一些方面,蛋白质包含A7 (C)、A8 (L)、A13 (N)、A34 (I)、A36 (Y)、 A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (T)、A13 (R)、A34 ⑴、A36 (F)、A69 (C) 和 A71 (R)。在一些方面,蛋白质包含 A7 (N)、A8 (C)、A13 (G)、A34 (F)、A36 (Y)、A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (L)、A13 (N)、A34 (I)、A36 (Y)、A69 (C)和 A71 (R)。 在一些方面,蛋白质包含六7(〇、六8(0)、六13〇()、六34(1)、六36(1^、六69(〇和六71〇〇。在一 些方面,蛋白质包含六7(〇、六8(0)、六13〇〇、六34(1)、六36的、六69(〇和六71〇()。在一些方 面,蛋白质包含 A7 (C)、A8 (T)、A13 (R)、A34 (I)、A36 (F)、A69 (C)和 A71 (R)。在一些方面,蛋 白质包含八7的、八8〇〇、八13(¥)、八34仏)、八36(1)、八69(6)和八71〇〇。在一些方面,蛋白质 包含六7(〇、六8(1')、六13〇〇、六34〇^)、六36的、六69(〇和六71〇〇。在一些方面,蛋白质包含 A7 (C)、A8 (G)、A13 (A)、A34 (V)、A36 ⑶、A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、 A8 ⑴、A13 (R)、A34 (L)、A36 (F)、A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (R)、 A13 ⑶、A34 (L)、A36 ⑴、A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (L)、A13 (N)、 A34 (I)、A36 (Y)、A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (D)、A13 (K)、A34 (I)、 A36 (F)、A69 (C)和 A71 (K)。在一些方面,蛋白质包含 A7 (C)、A8 (R)、A13 (S)、A34 (L)、A36 (Y)、 A69 (C)和 A71 (R)。在一些方面,蛋白质包含 A7 (C)、A8 (D)、A13 ⑷、A34 ⑴、A36 (L)、A69 (C) 和 A71 (R)。在一些方面,蛋白质包含 A7 (S)、A8 (C)、A13 (Η)、A34 (I)、A36 (Y)、A69 (C)和 A71(R)。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一 些实施方案中,与野生型遍在蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、 70、80、90、100、200、300、400、500、600、700、800、900 或 1000 (包含,包括这些值之间的任意 数字)倍中任一个的亲和力与USP7结合。在一些方面,蛋白质包含表1中所示的任意克隆 的取代。
[0145] 表l.U7Ub二硫键克隆
[0146] UTOb 二iSfcitA 隆 克隆 ID A7 AS ...U4 ..\允.\沾..\7i \u i L 丨 Li L L 171 hi C L N ? Y C R L71 b3 C: T R I F C it L7U?4 、 C G F Y C R vn:h7 C L N I Y (:: 1 L:7U>9 C: D K I L ( 1 17Π>15 C D K I F (.: K L 71 bl? (:: T R I F ( K l:7Lh25 l· R 、 L I C 1 171 h30 C T R L F ( m Vll:h3^ C C Λ ¥ H C: R l:7U>4i) C T R L F C R i:7L:h50 C; E S L Y C; R 17LU5I C L N I Y C Μ l;7lb55 C D K I F C K VH:h59 i R S L Y (.: K l:7U>74 C D K I L ( 1 UTOMS S C H 1 Y C M
[0147] 在一些方面,构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69 和A71的一个或多个取代,其中氨基酸残基位置是相对于SEQ ID N0:1,且其中取代未导致 至少一个二硫键的形成。在一些方面,蛋白质包含A7 (D)、A8 (Y)、A13 (R)、A34 (L)、A36 (I)、 A69 (A)和 A71 (A)。在一些方面,蛋白质包含 A7 (F)、A8 (A)、A13 ⑴、A34 (L)、A36 ⑴、A69 (G) 和 A71 (R)。在一些方面,蛋白质包含 A7 (F)、A8 (G)、A13 (Y)、A34 (I)、A36 (L)、A69 (W)和 八71〇〇。在一些方面,蛋白质包含六7$)、六8仰、六13(¥)434仏)436(1)、六69(6)和六71〇〇。 在一些方面,蛋白质包含六7的、六8〇〇、六13以)、六34仏)、六36(1)、六69(6)和六71〇〇。在一 些方面,蛋白质包含六7〇〇、六8仰、六13缶)、六34仏)、六36以)、六69〇〇和六71仰。在一些方 面,蛋白质包含 Α7 (R)、Α8 (R)、Α13 (Ρ)、Α34 (Τ)、Α36 (A)、Α69 (Υ)和 Α71 (R)。在一些方面,蛋 白质包含六7(3)、六8(¥)、六13(丫)、六34(1)、六36(吣、六69(1)和六71(6)。在一些实施方案中, 构象稳定的遍在蛋白与USP7结合但不能与USP14结合。在一些实施方案中,与野生型遍在 蛋白相比,构象稳定的遍在蛋白以高约10、20、30、40、50、60、70、80、90、100、200、300、400、 500、600、700、800、900或1000(包含,包括这些值之间的任意数字)倍中任一个的亲和力与 USP7结合。在一些方面,蛋白质包含表2中所示的任意克隆的取代。
[0148] 表2. U7Ub非二硫键克隆
[0149] l!7L b非二硫键克隆 克隆 11) A7 A8 A13 A34 Α3β Α69 Α?. νν ? JfL# 夏 JEi!# ? U71 b55i D Y R L I A A L 7L b490 F A ¥ L I G R U7Lh5ll F G Y I L W R L71 b432 F Q Y L 1 G R U7l:b523(l:7Uh25) F R Y L I G R U71 b526 R Q E L ¥ K Q U7Lb402 E R P T A Y R U7l:h455 S Y Y I M 1 G
[0150] 在一些方面,构象稳定的遍在蛋白包含选自氨基酸残基A7、A8、A13、A34、A36、A69 和A71的一个或多个取代,其中氨基酸残基位置是相对于SEQ ID N0:1。在一些方面,蛋白 质包含六7(6)、六8(1^)、六13(1')434(1')、六36仏)46"1)和六71〇¥)。在一些方面,蛋白质包含 A7 (G)、A8 (F)、A13 (L)、A34 ⑴、A36 (L)、A69 ⑶和 A71 (W)。在一些方面,蛋白质包含 A7 (G)、 A8 (L)、A13 (V)、A34 (V)、A36 (L)、A69 ⑴和 A71 (W)。在一些方面,蛋白质包含 A7 (G)、A8 (L)、 A13 (L)、A34 ⑶、A36 (L)、A69 (V)和 A71 (W)。在一些方面,蛋白质包含 A7 (G)、A8 (F)、A13 (L)、 A34(T)、A36(W)、A69(Y)和A71(H)。在一些实施方案中,构象稳定的遍在蛋白与USP14结合 但不能与USP7结合。在一些方面,蛋白质包含表3中所示的任意克隆的取代。
[0151] 表 3.U14Ub 克隆
[0152] 1:141.丨> 克隆 克隆丨[)Λ7 A8 Λ13 Λ34 Λ36 Λ69 Α7Ι wt 1 L I E I I, I. 1141 bi ('; L T T L 1 W l'14lbi4 G F L T L S W 1141..,1)2 C L V V L I \\ li 141: 1.)22 G L L S L ¥ W l:14U?24 (, F L T W ¥ H
[0153] 在一些方面,构象稳定的蛋白质包含任意U7Ub25、U7Ub7或U14Ub2克隆的取代。
[0154] 在另一方面,本文所述的任意构象稳定的遍在蛋白可以进一步在蛋白质的表面上 具有一个或多个增加其对一种或多种结合配偶体的亲和力的氨基酸取代。在一些实施方案 中,构象稳定的蛋白质在A42、A46、A49、A62、A65、A68或A70处具有一个或多个表面氨基酸 取代,其中氨基酸残基位置对应于SEQ ID N0:1的A1-A76。在一个实施方案中,构象稳定 的遍在蛋白在 A42 (K、T 或 W)、A46 (G 或 S)、A49 (T、N、L 或 R)、A62 (E)、A65 (T 或 A)、A68 (R) 或A70(I)中的一处或多处具有表面氨基酸取代。在另一实施方案中,构象稳定的遍在蛋 白在A42(W)、A49(R)和A68(R)处具有表面氨基酸取代。在一些方面,构象稳定的蛋白质 包含克隆U7Ub25. 2540的取代。在一些实施方案中,构象稳定的遍在蛋白与结合配偶体具 有通过 Kd 测定的小于约 1. OmM、500 μ M、100 μ M、50 μ M、25 μ M、10 μ M、5 μ Μ、1 μ Μ、900nM、 800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、100ηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、 50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5ηΜ 或 ΙηΜ (包含,包括这些数字之间 的任意值)中的约任一个的结合亲和力。在一些实施方案中,与野生型遍在蛋白引起的这 些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制 约 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、 80%、85%、90%、95%或100% (包含,包括这些值之间的任意百分比)中的任一个。在一 些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意El、E2或E3遍在蛋白加工 酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家族脱遍在蛋白酶的成员(如但 不限于USP7、USP5和/或USP14)。在一个实施方案中,结合配偶体是USP7。在一些实施方 案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的β1/β2 环周围的区域中的微秒 Rex 值高至多约 10、20、30、40、50、60、70、80、90、100、200、300、400、 500、600、700、800、900或1000(包含,包括这些值之间的任意数字)倍中的任一个。在具 体实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的 β 1/β 2环周围的区域中的微秒Rex值高至多约40倍。在一些实施方案中,构象稳定的遍在 蛋白中的β 1/β 2环区限制于蛋白质数据库编号3NHE链B的约0. 5至3 ▲(包括约0. 7 至2.7 A、L〇至2,4 Α、1.3至2.1 Α、1.6至1.8A)RMSD内的区域。在一个实施方案 中,构象稳定的遍在蛋白中的β 1/ β 2环区限制于蛋白质数据库编号3NHE链B的约1J ▲ RMSD内的区域。在一些方面,蛋白质包含表4中所示的任意克隆的取代。
[0155] 表4.表面残基取代
[0156] 克隆 ID A2 A4 A14 A40 A42 A46 A47 A49 A62 A64 A65 A66 Λ68 Λ70 Wt QFTQKAGQQE S T HV llb7.25 / w( qfxqraGTQETTHV uh-?v25RI51 QFTQRGGMQES T II V uh7\2?RI54 QFTQRAGQQES T II V 猶.25 QFTQTSGLIEATHI uh7^25RI55;S QFTQRGGLEES T Η V uh-7>25RI554 Q F T Q K A G Q Q E S T II V ub7v25RI52 QFTQWAGRQES T R V
[0157] 还在其他方面,本文所述的任意构象稳定的遍在蛋白可以进一步在蛋白质的C端 区域的表面上具有一个或多个增加其对一种或多种结合配偶体的亲和力的氨基酸取代。在 一些实施方案中,构象稳定的蛋白质在A40、A42、A46、A47、A49、A62、A65、A68、A70、A71、 A72、A73、A74、A75或A76处具有一个或多个表面氨基酸取代,其中氨基酸残基位置对应于 SEQ ID N0:1的A1-A76。在一个实施方案中,构象稳定的遍在蛋白在A42(M)、A46(L或N)、 A49 (V、Y、L 或 T)、A62 (G 或 R)、A65 (A)、A68 (Q)、A70 (R)、A72 (W 或 H)、A73 (A、R 或 K)、A74 (S、 V、G、Y或W)、A75 (A、R、P、E、V、H或Y)或A76 (R、S、V、A或L)中的一处或多处具有表面氨 基酸取代。在另一实施方案中,构象稳定的遍在蛋白在A42 (Μ)、A49 (V)、A70 (R)、A72 (W)、 A73(K)、A74(K)、A75(R)和A76(V)处具有表面氨基酸取代。在一些方面,构象稳定的蛋白 质包含克隆Ub7. 25. 216的取代。在一些实施方案中,构象稳定的遍在蛋白与结合配偶体 具有通过 Kd 测定的小于约 1. 0mM、500 μ M、100 μ Μ、50 μ Μ、25 μ M、10 μ Μ、5 μ Μ、1 μ M、900nM、 800ηΜ、700ηΜ、600ηΜ、500ηΜ、400ηΜ、300ηΜ、200ηΜ、150ηΜ、100ηΜ、90ηΜ、80ηΜ、70ηΜ、60ηΜ、 50ηΜ、45ηΜ、40ηΜ、35ηΜ、30ηΜ、25ηΜ、20ηΜ、15ηΜ、ΙΟηΜ、5nM 或 InM (包含,包括这些数字之间 的任意值)中的约任一个的结合亲和力。在一些实施方案中,与野生型遍在蛋白引起的这 些酶的抑制相比,构象稳定的遍在蛋白使一种或多种酶促遍在蛋白结合配偶体的活性抑制 约 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、 80%、85%、90%、95%或100% (包含,包括这些值之间的任意百分比)中的任一个。在一 些实施方案中,结合配偶体是遍在蛋白加工酶,如但不限于任意El、E2或E3遍在蛋白加工 酶或脱遍在蛋白酶。在一些实施方案中,结合配偶体是USP家族脱遍在蛋白酶的成员(如但 不限于USP7、USP5和/或USP14)。在一个实施方案中,结合配偶体是USP7。在一些实施方 案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的β1/β2 环周围的区域中的微秒 Rex 值高至多约 10、20、30、40、50、60、70、80、90、100、200、300、400、 500、600、700、800、900或1000(包含,包括这些值之间的任意数字)倍中的任一个。在具 体实施方案中,如通过NMR R2分散所测量,与野生型遍在蛋白相比,构象稳定的遍在蛋白的 β 1/β 2环周围的区域中的微秒值高至多约40倍。在一些实施方案中,构象稳定的遍 在蛋白中的β 1/ β 2环区限制于蛋白质数据库编号3NHE链B的约0. 5至3 Λ (包括约〇. 7 至2.71、1.0至2.4 Α、1.3至2.1 Α、1.6至1.8i)RMSD内的区域。在一个实施方案 中,构象稳定的遍在蛋白中的β 1/ β 2环区限制于蛋白质数据库编号3NHE链B的约1J A RMSD内的区域。在一些方面,蛋白质包含表5中所示的任意克隆的取代。
[0158] 表5. C端区域表面残基取代
[0159] 克麽 0> A聊 A42 A46 A47 A49 A62 A65 A68 A70 A72 A73 Α?4 A75 Λ76 \\i Q R Λ (, Q Q S If V R L K (, <; i Q R L G Q (; Λ II V Η V S Λ R { 〇 U A G Q C. S II V W R K (>; S " (J M A G ¥ S II K 、\ K V U \ i g κ A G L g s Q v 、v κ R p λ i h7,25.225 〇 R A G ¥ 〇 S II V k K G i R l:h7,25.226 Q R N G ¥ Q S li V k R Y \ L l hi 25.227 〇 R A G Q 〇 S Η V W K S H G l h7,25.23S Q R A G T R S Η V l\ K S V A l Q R A G Q Q S Η V \V K W \ S
[0160] 除本文公开的在构象上稳定化遍在蛋白的具体氨基酸残基取代外,遍在蛋白还可 以包含并不特异性影响构象稳定性的附加突变。这些突变导致本文定义的遍在蛋白多肽与 本文公开的任意天然序列遍在蛋白多肽具有至少约80%氨基酸序列同一性。这类遍在蛋 白多肽变体包括,例如,其中在天然氨基酸序列的N-或C-端(如遍在蛋白C端二甘氨酸基 序)添加或缺失了一个或多个氨基酸残基的遍在蛋白多肽。通常,遍在蛋白多肽变体将与 本文公开的天然序列遍在蛋白多肽序列具有至少约80%氨基酸序列同一性,备选地,至少 约 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96 %、97 %、98 %或99 %氨基酸序列同一性。可选地,与天然遍在蛋白多肽序列相比,遍在蛋 白变体多肽将具有不超过一个保守氨基酸取代,备选地,与天然遍在蛋白多肽序列相比不 超过2、3、4、5、6、7、8、9或10个保守氨基酸取代。
[0161] 通常,本文所述的构象稳定的遍在蛋白变体包括已用其他氨基酸取代序列中特定 位置处的残基的变体,且进一步包括在亲本蛋白质/肽的两个残基之间插入一个或多个附 加残基的可能性,以及从亲本序列缺失一个或多个残基或向亲本序列添加一个或多个残基 的可能性。本发明可以涵盖任意氨基酸取代、插入或缺失。在一些实施方案中,优选在保留 和稳定化蛋白质的部分或全部构象时,取代是本文所述的保守取代。
[0162] 在一些方面,本文所述的构象稳定的遍在蛋白包含一个或多个氨基酸残基的缺 失。在一些实施方案中,蛋白质包含A75和A76的缺失,其中氨基酸残基位置是相对于SEQ ID NO: 1。在一些实施方案中,构象稳定的遍在蛋白与USP7结合但不能与USP5结合。在另一 实施方案中,构象稳定的遍在蛋白使USP7的酶促活性抑制约5 %、10 %、15 %、20 %、25 %、 30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 或 100% (包含,包括这些值之间的任意百分比)中的任一个,但不抑制USP5的酶促活性。在一些方 面,构象稳定的遍在蛋白包含克隆U7Ub25A AGG的取代和缺失。
[0163] 肽/多肽的保守取代显示在表6中的表头"优选的取代"之下。如果这类取代导 致生物学活性的变化,则可以引入表6中称为"示例性取代"或下文中参考氨基酸种类进一 步描述的更实质性的变化,并筛选产物。
[0164] 表6.潜在的氨基酸取代
[0165]

【权利要求】
1. 构象稳定的遍在蛋白,其相对于野生型遍在蛋白包含一个或多个氨基酸取代。
2. 权利要求1的构象稳定的遍在蛋白,其中所述一个或多个氨基酸取代稳定蛋白质的 β 1/ β 2环,使得β 1/ β 2环限制于蛋白质数据库编号3NHE链B的约1.6 ▲均方根偏差内 的区域。
3. 权利要求1或2的构象稳定的遍在蛋白,其中如通过NMR R2分散所测量,与野生型 遍在蛋白相比,所述蛋白质的β 1/β 2环区显示更慢的构象动态。
4. 权利要求1-3中任一项的构象稳定的遍在蛋白,其中如通过NMRR2分散所测量,与野 生型遍在蛋白相比,所述β 1/β 2环周围的区域中的微秒Rex值高至多40倍。
5. 权利要求1-4中任一项的构象稳定的遍在蛋白,其中所述蛋白质在选自A7、A8、A13、 A34、A36、A69和A71的位置处包含一个或多个氨基酸取代,其中位置相对于A1-A76(SEQ ID ΝΟ:1)。
6. 权利要求5的构象稳定的遍在蛋白,其包含(a)取代A7(C),或取代A8(C);及(b)取 代 A69 (C)。
7. 权利要求6的构象稳定的遍在蛋白,其进一步包含选自A13(N、R、G、K、Y、A、S、H、E、 L、T、V、I、Μ 或 P)、A34 (I、F、L、V、S、Μ 或 T)、A36 (Y、F、L、Η、A、V、W、I、Μ 或 N)和 A71 (R、K、 八、〇、1、6、!1、1、1?或6)的一个或多个取代。
8. 权利要求5的构象稳定的遍在蛋白,其包含选自A7(D、F、R或S)、A8(Y、A、G、Q、R* Y)、A13 (R、Y、E 或 P)、A34 (I、L 或 T)、A36 (L、Y、A 或 N)、A69 (A、G、W、K、Y 或 I)和 A71 (A、R、 Q、R或G)的一个或多个取代。
9. 权利要求5-8中任一项的构象稳定的遍在蛋白,其进一步包含定位在A42、A46、A49、 A62、A65、A68或A70处的一个或多个氨基酸取代,其中氨基酸残基位置对应于SEQ ID ΝΟ:1 中的位置。
10. 权利要求5-9中任一项的构象稳定的遍在蛋白,其进一步包含定位在A40、A42、 A46、A47、A49、A62、A65、A68、A70、A71、A72、A73、A74、A75 或 A76 处的一个或多个氨基酸取 代,其中氨基酸残基位置对应于SEQ ID NO: 1中的位置。
11. 权利要求1-10中任一项的构象稳定的遍在蛋白,其中与野生型遍在蛋白相比,构 象稳定的遍在蛋白显示与遍在蛋白特异性蛋白酶(USP)家族的脱遍在蛋白酶的结合增加。
12. 权利要求1-11中任一项的构象稳定的遍在蛋白,其中构象稳定的遍在蛋白以纳摩 尔范围内的Kd与脱遍在蛋白酶结合。
13. 权利要求1-12中任一项的构象稳定的遍在蛋白,其中构象稳定的遍在蛋白以比野 生型蛋白质的亲和力高至少1000倍的亲和力与脱遍在蛋白酶结合。
14. 权利要求1-13中任一项的构象稳定的遍在蛋白,其中构象稳定的遍在蛋白抑制脱 遍在蛋白酶的活性。
15. 权利要求1-14中任一项的构象稳定的遍在蛋白,其中与野生型遍在蛋白相比,构 象稳定的遍在蛋白显示与遍在蛋白C端水解酶(UCH)家族的脱遍在蛋白酶无结合或结合减 少。
16. 核酸,其编码权利要求1-15中任一项的构象稳定的遍在蛋白。
17. 载体,其包含权利要求16的核酸。
18. 权利要求17的载体,其中载体是表达载体。
19. 细胞,其包含权利要求15的核酸,或权利要求17或18的载体。
20. 权利要求19的细胞,其中细胞选自动物细胞、细菌细胞、昆虫细胞、线虫细胞和酵 母细胞。
21. 权利要求20的细胞,其中动物细胞是人细胞或非人细胞。
22. 蛋白复合物,其包含权利要求1-15中任一项的构象稳定的遍在蛋白,和USP家族的 成员的脱遍在蛋白酶。
23. 权利要求22的蛋白复合物,其中脱遍在蛋白酶是USP7、USP5或USP 14。
24. 权利要求23的蛋白复合物,其中脱遍在蛋白酶是USP7。
25. 蛋白质,其共价连接至权利要求1-15中任一项的构象稳定的遍在蛋白中的一种或 多种。
26. 固体支持物,其包含固定在其上的权利要求1-15中任一项的构象稳定的遍在蛋 白。
27. 权利要求26的固体支持物,其中固体支持物是适合用于表面等离振子共振的表 面。
28. 权利要求26的固体支持物,其中固体支持物是纳米颗粒、球珠或玻璃。
29. 细胞的群体,其细胞包含表达在其表面上的权利要求1-15中任一项的构象稳定的 遍在蛋白。
30. 抑制USP家族的脱遍在蛋白酶的方法,其包括使脱遍在蛋白酶与权利要求1-15中 任一项的构象稳定的遍在蛋白接触。
31. 权利要求30的方法,其中抑制是体内的或体外的。
32. 鉴定结合遍在蛋白的构象形式的物质的方法,所述构象形式有利于与USP家族的 脱遍在蛋白酶结合,所述方法包括: a) 使物质与权利要求1-15中任一项的构象稳定的遍在蛋白接触;和 b) 测定物质是否与所述构象稳定的遍在蛋白结合。
33. 权利要求32的方法,其中物质是小分子化合物、抗体、蛋白质、抑制性核酸,或其任 意组合。
34. 鉴定与蛋白复合物结合的物质的方法,所述蛋白复合物包含遍在蛋白和USP家族 的脱遍在蛋白酶,所述方法包括: a) 使物质与权利要求22-24中任一项的蛋白复合物接触;和 b) 测定物质是否能够与所述蛋白复合物结合。
35. 权利要求34的方法,其中物质是小分子化合物、抗体、蛋白质、抑制性核酸,或其任 意组合。
36. 权利要求34的方法,其中物质破坏脱遍在蛋白酶和遍在蛋白之间的相互作用。
37. 物质,其通过权利要求32-36中任一项的方法鉴定。
38. 筛选蛋白质的构象稳定形式的方法,其中与野生型蛋白质相比,构象稳定形式具有 提高的与结合配偶体的结合亲和力,或具有提高的调节结合配偶体的活性的能力,所述方 法包括: a)使结合配偶体与蛋白质的突变体形式的文库接触,其中突变体形式的文库是通过在 一个或多个预先选择的位置处用另一氨基酸残基取代构象动态蛋白质中的氨基酸残基而 产生,其中预先选择的位置定位在蛋白质的内部;和 b)根据与结合配偶体的结合或与野生型蛋白质相比提高的调节结合配偶体的活性的 能力来鉴定构象稳定形式。
39. 权利要求38的方法,其中根据每个位置处的氨基酸残基对蛋白质内或蛋白质的区 域内的构象动态的贡献来选择预先选择的位置。
40. 权利要求38或39的方法,其中文库是编码所述蛋白质的突变体形式的核酸的文 库。
41. 权利要求40的方法,其中文库是噬菌体展示文库。
42. 权利要求41的方法,其中用于噬菌体展示文库的载体选自M13噬菌体、Π 噬菌体、 fd噬菌体、Ike噬菌体、N1噬菌体、肠细菌噬菌体T4、噬菌体T7和肠细菌噬菌体λ。
43. 权利要求38-42中任一项的方法,其进一步包括通过用其他氨基酸残基取代一个 或多个表面氨基酸残基来突变所鉴定的构象稳定蛋白质的表面上的一个或多个氨基酸残 基,并筛选与不含一个或多个取代的表面氨基酸残基的构象稳定蛋白质相比具有提高的结 合亲和力或调节能力的蛋白质。
44. 权利要求38-43中任一项的方法,其中蛋白质选自G蛋白偶联受体(GPCR)、核激素 受体、酪氨酸激酶受体和配体门控型离子通道。
45. 权利要求38-44中任一项的方法,其中蛋白质是遍在蛋白。
46. 权利要求38的方法,其中结合配偶体选自脱遍在蛋白酶、Ε1遍在蛋白活化酶、Ε2 遍在蛋白缀合酶、Ε3遍在蛋白-蛋白质连接酶,和细胞蛋白酶体复合物的一个或多个成员。
47. 权利要求46的方法,其中结合配偶体是脱遍在蛋白酶。
48. 权利要求47的方法,其中脱遍在蛋白酶是遍在蛋白特异性蛋白酶(USP)家族脱遍 在蛋白酶的成员。
49. 权利要求48的方法,其中脱遍在蛋白酶选自USP7、USP5和USP14。
50. 权利要求49的方法,其中脱遍在蛋白酶是USP7。
【文档编号】A61P35/00GK104254541SQ201280071486
【公开日】2014年12月31日 申请日期:2012年6月19日 优先权日:2012年3月16日
【发明者】J·E·科恩, Y·张, A·H·菲利普斯 申请人:弗·哈夫曼-拉罗切有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1