工程化CD25多肽及其用途的制作方法

文档序号:27380334发布日期:2021-11-15 19:46阅读:341来源:国知局
工程化CD25多肽及其用途的制作方法
工程化cd25多肽及其用途
相关申请的交叉引用
1.本技术要求2019年9月18日提交的美国临时申请号62/902,334和2018年11月14日提交的美国临时申请号62/767,431的权益,将这些申请的公开内容通过引用以其整体并入本文。


背景技术:

1.cd25蛋白是白细胞介素

2(il

2)受体的α链,并且是存在于调节性t细胞和激活t细胞上的跨膜蛋白。在正常状态下,调节性t细胞组成性地表达cd25并起到抑制效应t细胞扩增的作用。调节性t细胞维持健康状态并抑制效应t细胞对自身抗原的反应或对外来抗原的过度反应。在正常的保护性免疫应答中,效应t细胞在与外来抗原接触后繁殖,并克服了调节性t细胞的抑制作用。然而,在增殖性疾病的情况下,癌细胞可以通过增加调节性t细胞的量使健康的免疫应答失能,从而限制针对它们的效应t细胞的产生。因此,存在用于改变例如可抑制免疫系统的cd25表达调节性t细胞的增殖的治疗剂以用于癌症疗法的兴趣。这些治疗剂可以包括cd25靶向抗体。
2.cd25靶向抗体可以通过使用cd25免疫原对动物进行免疫接种来产生,然而,目前开发cd25免疫原的方法往往导致不可预测的、不期望的特征,如抗体乱交或跨物种的低交叉反应性。
3.因此,本领域所需要的是与cd25或其部分具有结构和/或动力学相似性的新工程化多肽,例如设计成模拟il

2结合位点之外的表位的工程化多肽。


技术实现要素:

4.在一方面,本公开文本提供了一种工程化多肽,其中所述工程化多肽与cd25参考靶标共有至少46%结构和/或动力学同一性,其中所述cd25参考靶标是选自cd25残基55

63、13

20:127

132、5

17、5

11:156

163、77

89、147

157、11

14或44

56的cd25的一部分。
5.在实施方案中,所述工程化多肽与所述cd25参考靶标共有至少60%结构和/或动力学同一性。在实施方案中,所述工程化多肽与所述cd25参考靶标共有至少80%结构和/或动力学同一性。在实施方案中,所述工程化多肽与选自seq id no:1

16的氨基酸序列共有至少80%序列同一性。在实施方案中,所述工程化多肽与cd25参考靶标共有至少46%结构和/或动力学同一性,其中所述cd25参考靶标是选自cd25残基55

63、13

20:127

132、5

17、5

11:156

163、77

89、147

157、11

14或44

56的cd25的一部分。在实施方案中,所述工程化多肽与所述cd25参考靶标共有至少80%结构和/或动力学同一性。在实施方案中,使用以pdb id no:2erj,链a储存的cd25的结构来确定与cd25参考靶标的结构和/或动力学同一性。在实施方案中,所述工程化多肽包含n末端修饰或c末端修饰、任选n末端生物素

peg2‑
或c末端

gsgsgk

生物素。
6.在实施方案中,所述工程化多肽的10%至98%之间的氨基酸满足一个或多个cd25参考靶标衍生约束。在实施方案中,满足所述一个或多个cd25参考靶标衍生约束的所述氨
基酸与所述cd25参考靶标具有小于基酸与所述cd25参考靶标具有小于骨架均方根偏差(rsmd)结构同源性。在实施方案中,满足所述一个或多个cd25参考靶标衍生约束的所述氨基酸与所述参考具有至之间的范德华表面积重叠。在实施方案中,所述cd25参考靶标衍生约束独立地选自:原子距离、原子波动、原子能、化学描述符、溶剂暴露、氨基酸序列相似性、生物信息学描述符、非共价键合倾向、角、ψ角、范德华半径、二级结构倾向、氨基酸邻接、和氨基酸接触。在实施方案中,所述工程化多肽与所述参考靶标在满足所述一个或多个参考靶标衍生约束的多肽的氨基酸中共有46%

96%rmsip或更多结构相似性。
7.在另一个方面,本公开文本提供了一种包含抗原结合结构域的cd25特异性抗体,所述抗原结合结构域特异性地结合选自cd25残基55

63、13

20:127

132、5

17、5

11:156

163、77

89、147

157、11

14或44

56的cd25表位。在实施方案中,所述抗体与表位特异性参考结合剂竞争结合cd25,其中所述表位特异性结合剂是il

2、达利珠单抗、巴利昔单抗(basioliximab)和/或7g7b6。在实施方案中,所述抗体不与脱靶参考结合剂竞争,其中所述脱靶结合剂是il

2、达利珠单抗、巴利昔单抗和/或7g7b6。在实施方案中,所述抗体具有小于10
‑2/s、小于10
‑3/s或小于10
‑4/s的k
off
,其中所述k
off
是使用采用可溶性人cd25的生物层干涉法测量的。在实施方案中,所述抗体具有在10
‑2/s与10
‑5/s之间的k
off
,其中所述k
off
是使用采用可溶性人cd25的生物层干涉法测量的。在实施方案中,所述抗体具有小于100nm、小于25nm或小于5nm的k
d
,其中所述k
d
是使用采用可溶性人cd25的生物层干涉法测量的。在实施方案中,所述抗体具有在100nm与1nm之间的k
d
,其中所述k
d
是使用采用可溶性人cd25的生物层干涉法测量的。
8.在实施方案中,所述抗体特异性地结合表达cd25的细胞。在实施方案中,所述抗体以至少104或至少105的平均荧光强度(mfi)结合表达cd25的细胞。在实施方案中,所述抗体以在104与106之间的平均荧光强度(mfi)结合表达cd25的细胞。在实施方案中,所述抗体不结合cd25(

)细胞。在实施方案中,所述抗体以小于103的平均荧光强度(mfi)结合cd25(

)细胞。在实施方案中,所述抗体包含表7d的组合1

126中任一种的六个cdr。
9.在实施方案中,所述抗体包含用于的yu390

b12、yu397

f01、yu397

d01、yu398

a11、yu404

h01、yu400

b07、yu400

d09、yu401

b01、yu401

g07、yu404

c02、yu403

g07、yu403

g05、yu391

b12、yu400

a03、yu400

d02、yu392

a09、yu392

b11、yu392

b12、yu392

e05、yu392

e06、yu392

g08、yu389

a03、yu392

g09、yu392

g12、yu392

h02、yu392

h04、yu402

f01、yu389

b11、yu394

d08或yu390

a11中任一个的如表3a和表3b中提供六个互补决定区(cdr)。
10.在实施方案中,所述抗体包含重链可变区和轻链可变区,其各自与如表5中提供的yu390

b12、yu397

f01、yu397

d01、yu398

a11、yu404

h01、yu400

b07、yu400

d09、yu401

b01、yu401

g07、yu404

c02、yu403

g07、yu403

g05、yu391

b12、yu400

a03、yu400

d02、yu392

a09、yu392

b11、yu392

b12、yu392

e05、yu392

e06、yu392

g08、yu389

a03、yu392

g09、yu392

g12、yu392

h02、yu392

h04、yu402

f01、yu389

b11、yu394

d08或yu390

a11的重链可变区和轻链可变区共有至少90%、95%、99%或100%序列同一性。在实施方案中,所述抗体是全长免疫球蛋白g单克隆抗体。在实施方案中,所述抗体包含单链可变片段(scfv),其与如表5中提供的yu390

b12、yu397

f01、yu397

d01、yu398

a11、yu404

h01、
yu400

b07、yu400

d09、yu401

b01、yu401

g07、yu404

c02、yu403

g07、yu403

g05、yu391

b12、yu400

a03、yu400

d02、yu392

a09、yu392

b11、yu392

b12、yu392

e05、yu392

e06、yu392

g08、yu389

a03、yu392

g09、yu392

g12、yu392

h02、yu392

h04、yu402

f01、yu389

b11、yu394

d08或yu390

a11的scfv序列共有至少90%、95%、99%或100%序列同一性。
11.在实施方案中,所述抗体是人抗体。在实施方案中,所述抗体是人源化抗体。在实施方案中,所述抗体是嵌合抗体。在实施方案中,所述抗体包含小鼠可变结构域和人恒定结构域。在实施方案中,所述抗体还结合食蟹猴cd25。
12.在另一个方面,本公开文本提供了一种药物组合物,其包含本公开文本的任何抗体和任选地药学上可接受的赋形剂。在另一个方面,本公开文本提供了一种治疗需要治疗的受试者的方法,其包括向所述受试者施用治疗有效量的本公开文本的任何抗体或药物组合物。在实施方案中,所述受试者患有癌症。在实施方案中,所述受试者患有自身免疫性疾病或障碍。在另一个方面,本公开文本提供了一种耗尽受试者中调节性t细胞的数量的方法,其包括向所述受试者施用治疗有效量的本公开文本的任何抗体或药物组合物。在实施方案中,所述受试者患有癌症。在实施方案中,所述受试者患有自身免疫性疾病或障碍。
13.在另一个方面,本发明提供了一种试剂盒,其包含本公开文本的任何抗体或药物组合物。
14.在一些方面,本文提供了一种工程化免疫原,其与选自seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10和seq id no:11的序列具有至少60%序列相似性。在一些实施方案中,所述工程化免疫原与所述序列具有至少80%相似性。在其他实施方案中,所述工程化免疫原与所述序列具有至少90%相似性。在某些实施方案中,所述工程化免疫原与cd25共有至少一个特征。在仍其他实施方案中,所述工程化免疫原与cd25的抗体结合。在一些实施方案中,与在约7.3与约7.5之间的ph下的结合亲和力相比,所述工程化免疫原在低于7.0的ph下具有对cd25的抗体的更高结合亲和力。在一些实施方案中,与在约7.3与约7.5之间的ph下的结合亲和力相比,所述工程化免疫原在约6.4与约6.6之间的ph下具有对cd25的抗体的更高结合亲和力。
15.在又其他实施方案中,本文提供了一种产生抗体的方法,其包括用工程化免疫原对动物进行免疫接种,所述工程化免疫原与选自seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10和seq id no:11的序列具有至少60%序列相似性;以及产生抗体。在所述方法的一些实施方案中,所述抗体是针对cd25的抗体。在某些实施方案中,与在约7.3与约7.5之间的ph下的结合亲和力相比,所述抗体在低于7.0的ph下展现出对cd25的更高结合亲和力。在仍其他实施方案中,与在约7.3与约7.5之间的ph下的结合亲和力相比,所述抗体在约6.4与约6.6之间的ph下展现出对cd25的更高结合亲和力。在一些实施方案中,所述抗体不阻断cd25与il

2的结合。在其他实施方案中,所述抗体阻断cd25与il

2的结合。根据权利要求8至11中任一项所述的方法,其中所述抗体不阻断cd25与il

2的结合。在一些实施方案中,所述抗体阻止il

2r

α、il

2r

β和il

2r

γ的异三聚化。在某些实施方案中,所述抗体能够结合顺式取向和反式取向的cd25。
附图说明
16.所述专利或申请文件含有至少一张彩色附图。在请求并支付必要的费用后,官方将会提供带有一张或多张彩色附图的本专利或专利申请公开案的副本。通过结合附图参考以下描述,可以理解本技术。
17.图1提供了展示用于选择如本文所述的工程化多肽的三个空间相关拓扑约束的示例性组合的构建的示意图。
18.图2提供了在确定源自参考的空间相关拓扑约束的一些示例性方法中涉及的步骤及其在选择工程化多肽中的用途的示意图。所述工程化多肽在本文中被称为中尺度分子、mem或中尺度肽。
19.图3a

图3c提供了展示使用本文所述方法选择一组工程化多肽的示意图。图3a显示了关于参考中的目的界面的空间相关拓扑信息的提取以及其在定义用于选择工程化多肽的拓扑约束中的用途。图3b提供了详细说明计算机模拟筛选步骤的示意图,其展示了如何在保留与拓扑结构匹配的候选物的同时舍弃不匹配的候选物。图3c呈现了所鉴定的前12种选择的工程化多肽候选物。
20.图4a

图4b提供了第二个示意图集合,其展示了使用本文所述的方法基于不同的参考参数集合选择不同的工程化多肽组。图4a显示了空间相关拓扑信息的提取和拓扑矩阵的构建。图4b提供了通过将候选物与拓扑约束进行计算机模拟比较而选择的前8种工程化多肽候选物的列表。
21.图5是提供使用如本文所述的工程化多肽并且还使用天然蛋白质作为阳性(t)或阴性(x)选择分子进行示例性可编程体外选择的设计概述的示意图。
22.图6显示了用于产生本公开文本的工程化多肽的cd25上在il

2界面之外的所靶向的八个表位的图。
23.图7显示了被设计成模拟cd25上在il

2界面之外的八个表位的16种工程化多肽。在每个图中,所述cd25靶表位残基以金色显示。设计成支持这些表位残基的支架残基以灰色显示。
24.图8显示了经计算确定的工程化多肽与靶表位的偏差的图。所述工程化多肽显示出与靶表位在结构和动力学上的相似性(46%至96%rmsip)。
25.图9显示了按照体外选择策略所得的384个抗cd25 scfv克隆的elisa分析。用32种程序化选择策略靶向八个cd25表位。这些图显示了来自每种选择策略的单独scfv的elisa分析。每个scfv均通过elisa针对全长cd25进行测试。选择策略s1

s32按表位编号1

8排序,所述表位编号对应于图6中所示的表位。
26.图10显示了mem程序化选择方案富集了不同的高亲和力克隆子集。显示了三种mem多肽中每一种的两种不同选择策略(方案a和方案b)的直方图。右图中的方案导致更高数量的高亲和力克隆。用全长cd25淘选导致相对较少的高亲和力克隆。
27.图11显示了对于通过噬菌体展示淘选鉴定的1433个抗cd25scfv的生物层干涉法的数据。y轴绘制每个克隆的k
off
(1/s)。观察到的中值k
on
为1.35
×
105(1/ms)。k
d
估计值假定k
on
为4.5
×
104(1/ms)。1475个测试的筛选命中中的1433个(97%)被确认为结合cd25。所述图描绘了1433个确认的命中的解离速率分布。
28.图12显示了对于通过噬菌体展示淘选鉴定的抗cd25 scfv的生物层干涉法的数
据。命中是通过所使用的淘选策略来鉴定的。仅显示k
off
小于10
‑3/s的命中的数据。
29.图13显示了对于通过噬菌体展示淘选鉴定的抗cd25 scfv的流式细胞术的数据。使用表达cd25[cd25(+)]或不表达cd25[cd25(

)]的细胞在流式细胞仪上评价不同scfv抗体的cd25特异性。
[0030]
图14a

图14b显示了对于通过噬菌体展示淘选鉴定的抗cd25scfv的流式细胞术的数据。命中是通过所使用的淘选策略来鉴定的。图14a显示了与cd25(+)细胞的结合。图14b显示了与对照cd25(

)细胞的结合。
[0031]
图15显示了代表性富集策略(s12)中每个cdr h3位置处的氨基酸残基富集。
[0032]
图16显示了在每一回合的mem或cd25操纵的体外选择过程中的序列多样性的图。
[0033]
图17显示了在每一回合的mem或cd25操纵的体外选择过程中的cdr长度的图。
[0034]
图18显示了cd25的带状图,其指示用于使用四个靶标竞争性结合测定的表位拆分中的il

2和三种抗体(达利珠单抗、tusk 7g7b6和巴利昔单抗)的接近的结合位点。
[0035]
图19显示了全长cd25淘选克隆以il

2界面表位为主。大多数克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。
[0036]
图20显示了147

157表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被达利珠单抗阻断,但不被il

2、巴利昔单抗或7g7b6阻断。
[0037]
图21显示了6

17表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。
[0038]
图22显示了13

20:127

132表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。
[0039]
图23显示了44

56表位mem操纵的克隆主要在预期的表位处结合。所述克隆分为两个概况。在概况1中,克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。在概况2中,克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。
[0040]
图24显示了55

63表位mem操纵的克隆主要在预期的表位处结合。所述克隆分为三个概况。在概况1中,克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。在概况2中,克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。在概况3中,克隆被il

2和7g7b6阻断,但不被达利珠单抗或巴利昔单抗阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。
[0041]
图25显示了被设计成批准或拒绝mem操纵的克隆对预期的表位分组的丙氨酸突变。这八个表位以颜色指示。红色条显示了突变为丙氨酸的残基的位点。
[0042]
图26显示了147

157cd25表位中的丙氨酸突变不影响整体或局部稳定性。对于每个突变体和野生型:使用晶体结构作为参考,对于8个不同的起始apo

cd25构型中每一个,在明确溶剂中来自3个独立的100ns md模拟的rmsd。
[0043]
图27显示了用巴利昔单抗对照抗体证明的ala突变体表位定位的可靠性。ala突变体结合反应证实了巴利昔单抗表位的晶体结构。从x射线晶体结构已知的巴利昔单抗

cd25表位以橙色显示。
[0044]
图28显示了用达利珠单抗对照抗体证明的ala突变体表位定位的可靠性。ala突变体结合反应证实了达利珠单抗表位的晶体结构。从x射线晶体结构已知的达利珠单抗

cd25
表位以橙色显示。左下角的插图显示了表位放大,显示了t175a对达利珠单抗结合的影响。
[0045]
图29显示了用7g7b6对照抗体证明的ala突变体表位定位的可靠性。ala突变体结合反应证实了7g7b6表位的肽定位。
[0046]
图30显示了用于147

157表位的mem程序化选择命中的表位定位。大多数命中显示预期表位中的ala突变敏感性。
[0047]
图31显示了对各种mem操纵的抗体命中的丙氨酸取代的敏感性。观察到功能性表位多样性。mem操纵的命中具有明显的表位内丙氨酸取代位置敏感性。
[0048]
图32呈现了cd25(带)与il

2配体(空间填充)、il

2r

γ和il

2r

β的结合的模型。左右箭头指示cd25的选择的节段,其用于开发模拟cd25的工程化免疫原。
[0049]
图33a是使用图32中的左箭头指示的cd25的节段作为初始输入而开发的工程化免疫原在生理ph下的分子稳定性与均方根偏差(rmsd)评价的示例性图。
[0050]
图33b是使用图32中的右箭头指示的cd25的节段作为初始输入而开发的工程化免疫原在生理ph下的分子稳定性与均方根偏差(rmsd)评价的示例性图。
[0051]
图33c是图2b中的工程化免疫原(使用图32中用右箭头指示的cd25的节段作为初始输入而开发的)在肿瘤微环境ph(较低ph)下的分子稳定性与均方根偏差(rmsd)评价的示例性图。
[0052]
图34a是il

2与il

2r复合物的结合的模型,显示了cd25节段(带)、il

2(1)、il

2r

γ(2)和il

2r

β(3)。
[0053]
图34b是il

2与cd25的il

2r复合物所列区域的结合的另一视图,所列区域被用作开发不同的所选择的示例性工程化免疫原的输入。
[0054]
图34c是il

2与cd25的il

2r复合物所列区域的结合的另一视图,所列区域被用作开发不同的所选择的示例性工程化免疫原的输入。
具体实施方式
[0055]
本文提供了与参考cd25靶标的一部分共有结构和/或动力学同一性的工程化多肽。目的表位包括但不限于图6中所示的八个表位。在一些实施方案中,所选择的表位与对于il

2、达利珠单抗和/或巴利昔单抗的结合位点(表位)不重叠。在一些实施方案中,所述表位与对于7g7b6的表位重叠。在一些实施方案中,所选择的表位选自55

63、12

20:127

132(不连续表位)、5

17、5

11:156

163(不连续表位)、77

89、147

157、11

14或44

56。在一些实施方案中,所述工程化多肽是构象稳定的并且代表涉及与特异性结合至cd25的抗体的相互作用的cd25表位。在一些实施方案中,所述工程化多肽代表已知不与特异性结合至cd25的抗体相互作用的cd25表面部分。此类工程化多肽可以用于例如选择和/或产生特异性结合至cd25的抗体。i.工程化多肽.
[0056]
在一些实施方案中,本文提供的工程化多肽与cd25参考靶标共有至少46%结构和/或动力学同一性,其中所述cd25参考靶标是选自下表中列出的那些的cd25的一部分。如本文一般提供的,所述结构/动力学同一性%是均方根内积(rmsip)同一性(如本文以上提供的)x 100%。在一些实施方案中,所述结构同一性是指序列同一性。参考靶标编号cd25残基序列
155

63swdnqcqct213

20:127

132atfkama:mvyyqc35

17ddppeiphatfka45

11:156

163ddppeip:rwtqpqli577

89qpeeqkerkttem6147

157vckmthgktrw711

14ipha844

56ymlctgssshssw
[0057]
在一些实施方案中,本文提供的工程化多肽与选自以下的氨基酸序列具有80%序列同一性:
[0058]
在一些实施方案中,所述多肽与所述cd25参考靶标共有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%结构和/或动力学同一性。在一些实施方案中,所述多肽与所述cd25参考靶标共有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列同一性。
[0059]
在一些实施方案中,所述工程化多肽被设计成模拟所选择的cd25表位。例如,在一些实施方案中,所述多肽包含中尺度工程化分子,例如中尺度工程化多肽。本文提供了选择中尺度工程化多肽的方法,以及包含所述工程化多肽的组合物及其使用方法。例如,本文提供了在抗体的体外选择中使用工程化多肽的方法。
[0060]
本公开文本的工程化多肽在1kda与10kda之间,其在本文中称为“中尺度”。在一些实施方案中,这种大小的工程化多肽可以具有某些优点,例如蛋白质样功能性、选择候选物的巨大理论空间、细胞通透性和/或结构和动力学可变性。术语中尺度肽和中尺度多肽在本文中可互换使用,并且术语中尺度分子(mem)旨在覆盖这些。
[0061]
本文提供的方法包括鉴定多个空间相关的拓扑约束,其中一些可以源自cd25参考靶标;构建所述约束的组合;将候选肽与所述组合进行比较;以及选择具有与所述组合重叠的约束的候选物。通过使用空间相关的拓扑约束,根据预期的用途或所需的功能或另一所需的特征,工程化多肽的不同方面可以包括在所述组合中。此外,在一些实施方案中,并非所有约束都必须源自cd25参考靶标。通过此类方法,在一些实施方案中,所选择的工程化多肽不简单地是cd25参考靶标的变体(如可以是通过单个参考的肽诱变或渐进修饰获得的),而是可以具有与参考肽不同的整体结构,同时仍保留所需的功能特征和/或关键子结构。
[0062]
本文还提供了使用所述工程化多肽的方法,其包括使用一种或多种工程化多肽进行可编程体外选择的方法。这种选择可以用于例如抗体的鉴定。
[0063]
下面更详细地描述了这些方法和工程化多肽。ii.选择工程化多肽的方法
[0064]
在一些方面,本文提供了选择工程化多肽的方法,其包括:鉴定cd25参考靶标的一个或多个拓扑特征;设计针对每个拓扑特征的空间相关约束,以产生cd25参考靶标衍生约束的组合;比较候选肽的空间相关拓扑特征与源自cd25参考靶标的组合;以及选择具有与源自所述cd25参考靶标的约束组合重叠的空间相关拓扑特征的候选肽。
[0065]
在一些实施方案中,非源自cd25参考靶标的一个或多个另外的空间相关拓扑约束包括在所述组合中。a.空间相关拓扑约束
[0066]
本文所述的工程化多肽是基于它们与空间相关拓扑约束的组合匹配的紧密程度来选择的。该组合也可以使用“张量”的数学概念来描述。在这种组合(或张量)中,每个约束在三维空间(例如,空间相关)中被独立地描述,并且在三维空间中这些约束的组合提供例如不同的所需特征及其相对于位置的所需水平(如果适用)的代表性“定位”。在一些实施方案中,该定位不是基于线性或以其他方式预定的氨基酸骨架,并且因此可以允许可满足所需组合的结构的柔性,如所描述的。例如,在一些实施方案中,所述“定位”包括这样的空间区域,其中两个相邻氨基酸可以充分满足规定的约束限制,在一些实施方案中,这些氨基酸可以直接键合(例如,两个连续氨基酸),而在其他实施方案中,所述氨基酸不直接彼此键合,而是可以通过肽的折叠在空间中聚集在一起(例如,非连续氨基酸)。单独的约束本身也不一定是基于结构,而是可以包括例如化学描述符和/或功能描述符。在一些实施方案中,约束包括结构描述符,如所需的二级结构或氨基酸残基。在某些实施方案中,每个约束是独立选择的。
[0067]
例如,图1是展示空间相关拓扑约束的代表性组合的构建的示意图。图1中的三个约束是序列、最近的邻近距离和原子运动,其中最近的邻近距离和原子运动组合在一张图中。如图所示,一些约束独立于骨架的位置而定位(例如,某些侧链的原子运动),因此与仅改变参考支架上的一个或多个位置相比,允许尝试更多种类的结构构型。将三个不同的约束及其空间描述组合成矩阵(例如,张量),然后可以将一系列候选肽与该组合进行比较,以鉴定满足所需标准的新工程化多肽。在一些实施方案中,所述组合中还包括一个或多个另外的非参考衍生约束。可以进行候选肽与定义的组合的比较,例如,使用计算机模拟方法以所需组合为背景来评价每个候选肽的约束,并评定候选物匹配程度。然后,可以使用本领域技术人员已知的标准肽合成方法合成与规定的组合具有所需水平的重叠的所述候选物,并对其进行评价。
[0068]
在一些实施方案中,约束的组合包括至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、在3至12个之间、在3至10个之间、在3至8个之间、在3至6个之间、或3、或4、或5、或6个独立选择的空间相关拓扑约束。所述约束中的一个或多个源自cd25参考靶标。在一些实施方案中,所述约束中的每一个源自所述cd25参考靶标。在其他实施方案中,至少一个约束源自所述cd25参考靶标,并且其余约束不是源自所述参考靶标。例如,在一些实施方案中,在1与9个之前的约束、在1与7个之间的约束、在1与5个之间的约束、或在1与3个之间的约束源自所述cd25参考靶标,并且在1与9个之间的约束、在1与7个之间的约束、在1与5个之间的约束、或在1与3个之间的约束不是源自所述cd25参考靶标。
[0069]
一旦已经构建了约束的组合,就将一系列候选肽与所述组合进行比较,以鉴定满足所需标准的一种或多种新工程化多肽。在一些实施方案中,将至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少125、至少150、至少175、至少200、或至少250种或更多种候选肽与所述组合进行比较,以鉴定满足所需标准的一种或多种新工程化多肽。在一些实施方案中,例如,比较了多于250种候选肽、多于300种候选肽、多于400种候选肽、多于500种候选肽、多于600种候选肽、或多于750种候选肽。在一些实施方案中,拓扑特征模拟用于评价候选肽与约束的组合相比的拓扑特征重叠(如果有的话)。在一些实施方案中,还将一种或多种候选肽与所述cd25参考靶标进行比较,并且评价了候选肽拓扑特征与cd25参考靶标拓扑特征的重叠(如果有的话)。在一些实施方案中,从多于5、多于10、多于20、多于30、多于40、多于50、多于60、多于70、多于80、多于90、或多于100种不同的肽和拓扑特征模拟的计算样品中鉴定所述工程化多肽,并且选择这样的工程化多肽,其中在总采样群体中所选择的工程化多肽具有最高的与所述cd25参考靶标相比的拓扑特征重叠。
[0070]
用于构建所需组合(例如,所需张量)的空间相关拓扑约束可以各自独立地从广泛的可能特征组选择。这些可以包括例如描述结构、动力学、化学或功能特征或其任何组合的约束。
[0071]
结构约束可以包括例如原子距离、氨基酸序列相似性、溶剂暴露、角、ψ角、二级结构或氨基酸接触或其任何组合。
[0072]
动力学约束可以包括例如原子波动、原子能、范德华半径、氨基酸邻接或非共价键合倾向。原子能可以包括例如两个原子之间的成对吸引能、两个原子之间的成对排斥能、原子级溶剂化能、两个原子之间的成对带电吸引能、两个原子之间的成对氢键合吸引能、或非共价键合能、或其任何组合。
[0073]
化学特征可以包括例如化学描述符。此类化学描述符可以包括例如疏水性、极性、原子体积、原子半径、净电荷、logp、hplc保留、范德华半径、电荷分布或h键合分布或其任何组合。
[0074]
功能特征可以包括例如生物信息学描述符、生物反应或生物功能。生物信息学描述符可以包括例如blosum相似性、pka、zscale、cruciani特性、kidera因子、vhse尺度、protfp、ms

whim得分、t尺度、st尺度、跨膜趋势、蛋白质掩埋区域、螺旋倾向、折叠倾向、卷曲倾向、转角倾向、免疫原性倾向、抗体表位发生、和/或蛋白质界面发生、或其任何组合。
[0075]
在一些实施方案中,设计所述约束并入了关于以下的信息:每残基能量、每残基相互作用、每残基波动、每残基原子距离、每残基化学描述符、每残基溶剂暴露、每残基氨基酸序列相似性、每残基生物信息学描述符、每残基非共价键合倾向、每残基角、每残基范德华半径、每残基二级结构倾向、每残基氨基酸邻接、或每残基氨基酸接触。在一些实施方案中,这些特征用于所述cd25参考靶标中的总残基的子集、或约束的总组合的总残基的子集、或其组合。在一些实施方案中,一个或多个不同的特征用于一个或多个不同的残基。也就是说,在一些实施方案中,一个或多个特征用于残基的子集,并且至少一个不同的特征用于残基的不同子集。在一些实施方案中,用于设计一个或多个约束的所述特征中的一个或多个是通过计算机模拟来确定的。合适的计算机模拟方法可以包括例如分子动力学模拟、蒙特卡罗模拟、粗粒度模拟、高斯网络模型、机器学习、或其任何组合。
[0076]
在一些实施方案中,多个约束是从一个类别中选择的。例如,在一些实施方案中,所述组合包括两个或更多个约束,所述两个或更多个约束独立地是一种类型的生物反应。在一些实施方案中,两个或更多个约束独立地是一种类型的二级结构。在某些实施方案中,两个或更多个约束独立地是一种类型的化学描述符。在其他实施方案中,所述组合不包括重叠的约束类别。
[0077]
在一些实施方案中,一个或多个约束独立地与生物反应或生物功能相关。在一些实施方案中,所述约束是空间定义的原子级约束、或空间定义的形状/面积/体积级约束(如可由若干种不同原子组成满足的特征形状/面积/体积)、或空间上定义的动力学级约束(如可由若干种不同的原子组成满足的特征动力学或动力学集合)。
[0078]
在一些实施方案中,一个或多个约束源自与生物功能或生物反应相关的蛋白质结构或肽结构。例如,在一些实施方案中,一个或多个约束源自胞外结构域,如g蛋白偶联受体(gpcr)胞外结构域或离子通道胞外结构域。在一些实施方案中,一个或多个约束源自蛋白质

蛋白质界面接合。在一些实施方案中,一个或多个约束源自蛋白质

肽界面接合,如mhc

肽或gpcr

肽界面。在某些实施方案中,受这种蛋白质或肽结构约束的原子或氨基酸是与生物功能或生物反应相关的原子或氨基酸。在一些实施方案中,受这种蛋白质或肽结构约束的工程化多肽中的原子或氨基酸是源自cd25参考靶标的原子或氨基酸。在一些实施方案中,一个或多个约束源自cd25参考靶标的多态性区域(例如,个体之间经受等位基因变异的区域)。
[0079]
在一些实施方案中,与生物功能或生物反应相关的一个或多个原子选自碳、氧、氮、氢、硫、磷、钠、钾、锌、锰、镁、铜、铁、钼和镍。在某些实施方案中,所述原子选自氧、氮、硫和氢。
[0080]
在一些实施方案中,其中所述约束之一是与生物功能或生物反应相关的一个或多个氨基酸,和/或所述工程化多肽包含与生物功能或生物反应相关的一个或多个氨基酸,所述一个或多个氨基酸独立地选自20种蛋白质来源的天然存在的氨基酸、非蛋白质来源的天然存在的氨基酸和非天然氨基酸。在一些实施方案中,所述非天然氨基酸是化学合成的。在某些实施方案中,所述一个或多个氨基酸选自20种蛋白质来源的天然存在的氨基酸。在其他实施方案中,所述一个或多个氨基酸选自非蛋白质来源的天然存在的氨基酸。在仍其他实施方案中,所述一个或多个氨基酸选自非天然氨基酸。在仍其他实施方案中,所述一个或多个氨基酸选自20种蛋白质来源的天然存在的氨基酸、非蛋白质来源的天然存在的氨基酸和非天然氨基酸的组合。
[0081]
虽然用于选择如本文所述的工程化多肽的约束的组合包括源自cd25参考靶标的至少一个约束,但在一些实施方案中,所述组合的一个或多个约束不是源自cd25参考靶标。因此,在某些实施方案中,所选择的工程化多肽包含非与所述cd25参考靶标共有的一个或多个特征。
[0082]
在一些实施方案中,源自所述cd25参考靶标并在所述组合中使用的一个或多个约束描述如在所述cd25参考靶标中观察到的特征的反面。因此,例如,cd25参考靶标可以具有某种正电荷分布,与电荷有关的约束源自所述cd25参考靶标,并且所得到的约束描述了相似但是中性电荷或负电荷的分布。因此,在一些实施方案中,一个或多个相反约束源自所述cd25参考靶标并包括在所述组合中。此类相反约束可能是有用的,例如,在选择工程化多肽
作为用于某些测定或淘选方法的对照分子时,或者在本文所述的可编程体外选择方法中作为阴性选择分子时是有用的。
[0083]
在一些实施方案中,空间定义的拓扑约束的组合包括一个或多个非参考衍生的拓扑约束。在一些实施方案中,所述一个或多个非参考衍生的拓扑约束实施或稳定一种或多种二级结构元件、实施原子波动、改变肽总疏水性、改变肽溶解度、改变肽总电荷、使得能够在标记或无标记的测定中进行检测、使得能够在体外测定中进行检测、使得能够在体内测定中进行检测、使得能够从复杂混合物中捕获、使得能够进行酶处理、使得能够实现细胞膜通透性、使得能够与二级靶标结合、或者改变免疫原性。在某些实施方案中,所述一个或多个非参考衍生的拓扑约束约束了源自所述cd25参考靶标的约束(或随后选择的肽)的组合中的一个或多个原子或氨基酸。例如,在一些实施方案中,所述约束的组合包括源自cd25参考靶标的二级结构,并且约束的组合还包括使二级结构元件稳定的约束(例如,通过另外的氢键合、或疏水相互作用、或侧链堆叠、或盐桥、或二硫键),其中所述稳定约束不存在于所述cd25参考靶标中。在另一个例子中,在一些实施方案中,约束的组合(或随后选择的肽)包含源自cd25参考靶标的一个或多个原子或氨基酸,并且约束的组合还包括实施源自所述靶标参考的原子或氨基酸的至少一部分中的原子波动的约束,其中所述约束不存在于所述靶标参考中。在一些实施方案中,一个或多个非参考衍生约束是相反约束。例如,在一些实施方案中,构建两个约束组合以选择具有相反特征的工程化多肽。在一些此类实施方案中,第一约束组合将包括源自cd25参考靶标的一个或多个约束以及非源自cd25参考靶标的一个或多个约束;并且第二约束组合将包括源自cd25参考靶标的相同的一个或多个约束,以及所述第一组合的一个或多个非cd25参考靶标约束的相反约束。b.cd25参考靶标
[0084]
任何合适的cd25参考靶标可以用于得出用于本文提供的方法中的一个或多个空间相关的拓扑约束。在一些实施方案中,所述cd25参考靶标是全长天然蛋白质。在其他实施方案中,所述cd25参考靶标是全长天然蛋白质的一部分。在仍其他实施方案中,所述cd25参考靶标是非天然蛋白质或其部分。
[0085]
在一些实施方案中,cd25参考靶标选自:
[0086]
例如,在一些实施方案中,所述cd25参考靶标是cd25的一部分,如表位或预测的表位。在一些实施方案中,本文提供的方法可以用于选择一种或多种工程化多肽,所述一种或多种工程化多肽是免疫原,并且其可以用于产生与靶标参考所源自的蛋白质特异性结合的一种或多种抗体。在仍其他实施方案中,本文提供的方法可以用于选择一种或多种工程化多肽,所述一种或多种工程化多肽转而可以用于选择目的蛋白质的一种或多种结合配偶体,如抗体、fab展示噬菌体或scfv展示噬菌体。c.约束的比较
[0087]
在一些实施方案中,所述一个或多个约束(例如,参考衍生或非参考衍生的)是通过分子模拟(例如,分子动力学)、或实验室测量(例如,nmr)、或其组合来确定的。在一些实施方案中,一旦得出并组合所述约束,就使用计算蛋白质设计(例如,rosetta)生成工程化多肽候选物。在一些实施方案中,使用采样肽空间的其他方法。然后可以对候选工程化多肽进行动力学模拟,以获得已经选择的约束的参数。产生了针对cd25参考靶标的原子波动的协方差矩阵,产生了针对每个候选工程化多肽中的残基的协方差矩阵,并且比较这些协方差矩阵以确定重叠。进行主成分分析以计算每个协方差矩阵的特征向量和特征值

cd25参考靶标的一个协方差矩阵和每个候选工程化多肽的一个协方差

并且保留具有最大特征值的那些特征向量。
[0088]
所述特征向量描述了在模拟的分子结构集合中观察到的最多、第二多、第三多、第n多的主导运动。不希望受任何理论束缚,如果候选工程化多肽像cd25参考靶标一样移动,则其特征向量将类似于cd25参考靶标的特征向量。特征向量的相似性对应于所比对的其分量(以每个ca原子为中心的3d向量)指向相同的方向。
[0089]
在一些实施方案中,使用两个特征向量的内积来计算候选工程化多肽与cd25参考靶标特征向量之间的这种相似性。如果两个特征向量彼此成90度,则内积值为0;如果两个特征向量精确地指向同一方向,则内积值为1。不希望受到理论束缚,因为特征向量的排序是基于它们的特征值,并且由于分子动力学(md)模拟对那些不同分子的潜在能量图景进行采样的随机性质而导致两个不同分子之间的特征值可能不一定相同,所以在一些实施方案中需要多个不同排名的特征向量之间的内积(例如,工程化多肽的特征向量1乘cd25参考靶标的特征向量2、3、4等)。另外,分子运动是复杂的,并且可能涉及多于一种(或多于几种)的主导/主要运动模式。因此,在一些实施方案中,计算了在候选工程化多肽与cd25参考靶标中的所有特征向量对之间的内积。这产生了内积矩阵,其维度由所分析的特征向量的数量
确定。例如,对于10个特征向量,内积的矩阵是10乘10。该内积矩阵可以通过计算100个(如果10乘10)内积的均方根值而被提取为单个值。这是均方根内积(rmsip)。根据该比较,选择与定义的约束组合具有相似性的一种或多种候选工程化多肽。d.另外的步骤
[0090]
在一些实施方案中,一种或多种工程化多肽的选择包括一个或多个另外的步骤。例如,在一些实施方案中,如本文所述,基于与定义的空间相关拓扑约束组合的相似性来选择工程化多肽候选物,然后经历一个或多个分析以确定一个或多个另外的特征,以及一个或多个结构调整以赋予或实施所述需要的特征。例如,在一些实施方案中,如通过分子动力学模拟来分析所选择的候选物,以确定分子的总体稳定性和/或特定折叠结构的倾向。在一些实施方案中,对所述工程化多肽进行一种或多种修饰,以赋予或增强所需的稳定性水平,或所需折叠结构的所需倾向。此类修饰可以包括例如安装一个或多个交联(如二硫键)、盐桥、氢键合相互作用、或疏水相互作用、或其任何组合。
[0091]
本文提供的方法还可以包括测定一种或多种所选择的工程化多肽的一个或多个所需特征,如所需的结合相互作用或活性。视情况可以使用任何合适的测定,以测量所需的特征。
[0092]
在其他方面,本文提供了工程化多肽,如通过本文所述的方法选择的工程化多肽。在一些实施方案中,所述工程化多肽具有在1kda与10kda之间的分子量,并且包含至多50个氨基酸。在某些实施方案中,所述工程化多肽具有如下分子量:在2kda与10kda之间、2kda与10kda之间、3kda与10kda之间、4kda与10kda之间、5kda与10kda之间、6kda与10kda之间、7kda与10kda之间、8kda与10kda之间、9kda与10kda之间、1kda与9kda之间、1kda与8kda之间、1kda与7kda之间、1kda与6kda之间、1kda与5kda之间、1kda与4kda之间、1kda与3kda、或在1kda与2kda之间。在某些实施方案中、所述工程化多肽包含至多45个氨基酸、至多40个氨基酸、至多35个氨基酸、至多30个氨基酸、至多25个氨基酸、至多20个氨基酸、至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸、至少35个氨基酸、或至少40个氨基酸。
[0093]
在某些实施方案中,所述工程化多肽包含空间相关拓扑约束的组合,其中所述约束中的一个或多个是cd25参考靶标衍生约束。在一些实施方案中,本文所述的任何约束可以在所述组合中使用。在仍其他实施方案中,所述工程化多肽的在10%至98%之间的氨基酸满足一个或多个cd25参考靶标衍生约束(例如,如果所述工程化多肽包含50个氨基酸,则在5至49个之间的氨基酸满足所述一个或多个cd25参考靶标衍生约束)。在一些实施方案中,所述工程化多肽的在20%至98%之间、在30%至98%之间、在40%至98%之间、在50%至98%之间、在60%至98%之间、在70%至98%之间、在80%至98%之间、在90%至98%之间、在10%至90%之间、在10%至80%之间、在10%至70%之间、在10%至60%之间、在10%至50%之间、在10%至40%之间、在10%至30%之间、或在10%至20%之间的氨基酸满足所述一个或多个cd25参考靶标衍生约束。在仍其他实施方案中,满足所述一个或多个cd25参考靶标衍生约束的一个或多个氨基酸与cd25参考靶标具有小于小于小于小于小于小于小于或小于的骨架均方根偏差(rsmd)结构同源性。在一些实施方案中,所述工程化多肽具有:在1kda与10kda之间的分子量;包含至多50
个氨基酸;空间相关拓扑约束的组合,其中所述约束中的一个或多个是cd25参考靶标衍生约束;所述工程化多肽的在10%至98%之间的氨基酸满足所述一个或多个cd25参考靶标衍生约束;并且满足所述一个或多个cd25参考靶标衍生约束的氨基酸与cd25参考靶标具有小于的骨架均方根偏差(rsmd)结构同源性。
[0094]
在一些实施方案中,所述工程化多肽的满足所述一个或多个cd25参考靶标衍生约束的氨基酸与cd25参考靶标具有在10%与90%之间的序列同源性、在20%与90%之间的序列同源性、在30%与90%之间的序列同源性、在40%与90%之间的序列同源性、在50%与90%之间的序列同源性、在60%与90%之间的序列同源性、在70%与90%之间的序列同源性、或在80%与90%之间的序列同源性。在一些实施方案中,满足所述一个或多个cd25参考靶标衍生约束的氨基酸与参考具有如下的范德华表面积重叠:在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间、或在至之间。
[0095]
所述工程化多肽所满足的约束的组合可以包括两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、或七个或更多个cd25参考靶标衍生约束。如在本公开文本的其他地方所述,所述组合可以包括非源自cd25参考靶标的一个或多个约束。这些参考衍生约束和非参考衍生约束(如果存在的话)可以独立地是本文所述的任何约束,如本文所述的结构、动力学、化学或功能特征中的任何一个、或其任何组合。
[0096]
在一些实施方案中,当与cd25参考靶标相比时,所述工程化多肽包含至少一种结构差异。这种结构差异可以包括例如以下方面的差异:序列、氨基酸残基数量、原子总数、总亲水性、总疏水性、总正电荷、总负电荷、一个或多个二级结构、形状因子、zernike描述符、范德华表面、结构图节点和边缘、表面容积、静电势表面、疏水电势表面、局部直径、局部表面特征、骨架模型、电荷密度、亲水密度、表面体积比、两亲性密度或表面粗糙度、或其任何组合。在一些实施方案中,当与cd25参考靶标中的特征(如适用于特征类型时)相比时,一个或多个特征(如本文所述的一个或多个特征)的差异是至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、或大于100%。例如,在一些实施方案中,所述差异是原子总数,并且所述工程化多肽具有比cd25参考靶标多至少10%、至少20%、或至少30%的原子,或比cd25参考靶标少至少10%、至少20%、或至少30%的原子。在一些实施方案中,所述差异在于总正电荷,并且所述工程化多肽的总正电荷比cd25参考靶标大至少10%、至少20%、至少30%、至少40%、或至少50%(例如,更多正电荷),而在其他实施方案中,所述工程化多肽的总正电荷比cd25参考靶标小至少10%、至少20%、至少30%、至少40%、或至少50%(例如,较少正电荷)。
[0097]
在一些实施方案中,空间定义的拓扑约束的组合包括在cd25参考靶标中不存在的一个或多个二级结构元件。因此,在一些实施方案中,所述工程化多肽包括在cd25参考靶标中不存在的一个或多个二级结构元件。在一些实施方案中,所述组合和/或工程化多肽包括
在cd25参考靶标中未发现的一个二级结构元件、两个二级结构元件、三个二级结构元件、四个二级结构元件或多于四个二级结构元件。在一些实施方案中,每个二级结构元件独立地选自螺旋、折叠、环、转角和卷曲组成的组中选择。在一些实施方案中,cd25参考靶标中不存在的每个二级结构元件独立地是α

螺旋、β

桥、β

链、3
10
螺旋、π

螺旋、转角、环或卷曲。
[0098]
在某些实施方案中,所述cd25参考靶标包含与生物反应或生物功能相关的一个或多个原子(如本文所述的一个);所述工程化多肽包含与生物反应或生物功能相关的一个或多个原子(如本文所述的一个);并且所述工程化多肽中的所述原子的原子波动与cd25参考靶标中的所述原子的原子波动重叠。因此,例如,在一些实施方案中,所述原子本身是不同的原子,但是它们的原子波动重叠。在其他实施方案中,所述原子是相同的原子,并且它们的原子波动重叠。在仍其他实施方案中,所述原子独立地是相同或不同的。在一些实施方案中,所述重叠是大于0.25的均方根内积(rmsip)。在一些实施方案中,所述重叠是大于0.3、大于0.35、大于0.4、大于0.45、大于0.5、大于0.55、大于0.6、大于0.65、大于0.7、大于0.75、大于0.8、大于0.85、大于0.9、或大于0.95的rmsip。在某些实施方案中,rmsip通过以下方式计算:其中n是所述工程化多肽拓扑约束的特征向量,并且v是cd25参考靶标拓扑约束的特征向量。
[0099]
在一些实施方案中,所述工程化多肽包含与生物反应或生物功能相关的原子或氨基酸(或其组合),并且所述原子或氨基酸或组合的至少一部分源自cd25参考靶标,并且可以通过矩阵描述所述工程化多肽中的原子或氨基酸集合和cd25参考靶标中的所述集合的某些约束。在一些实施方案中,所述矩阵是lxl矩阵。在其他实施方案中,所述矩阵是sxsxm矩阵。在仍其他实施方案中,所述矩阵是lx2角矩阵
[0100]
例如,在一些实施方案中,所述工程化多肽中与生物反应或生物功能相关的原子或氨基酸的原子波动通过lxl矩阵来描述;所述原子或氨基酸的一部分源自cd25参考靶标;并且所述部分在cd25参考靶标中的原子波动通过lxl矩阵来描述。在一些实施方案中,每个集合的邻接(与氨基酸位置有关)通过相应的lxl矩阵来描述。在某些实施方案中,对于源自cd25参考靶标的工程化多肽的级分,所述工程化多肽lxl原子波动或邻接矩阵的所有矩阵元(i,j)的平均百分比误差(mpe)是相对于cd25参考靶标原子波动或邻接矩阵中的相应(i,j)元的小于或等于75%。在一些实施方案中,对于源自cd25参考靶标的工程化多肽的级分,所述mpe是相对于cd25参考靶标矩阵中的相应元的小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、或小于40%。在一些实施方案中,其中所述矩阵代表原子波动,l是氨基酸位置的编号,并且如果(i,j)原子距离小于或等于,则原子波动矩阵元中的(i,j)值是分别第i个和第j个氨基酸的分子内原子波动的总和,或如果(i,j)原子距离大于或如果(i,j)在对角线上,则为零。可替代地,在一些实施方案中,原子距离可以用作原子波动矩阵元(i,j)的加权因子,而不是0或1乘数。在某些实施方案中,第i个和第j个原子波动和距离可以通过分子模拟(例如分子动力学)和/或实验室测量(例如nmr)来确定。在其他实施方案中,其中所述矩阵代表邻接,l是氨基酸位置的编号,并且如果原子距离小于或
等于,则邻接矩阵元(i,j)中的值是分别第i个与第j个氨基酸之间的分子内原子距离,或如果原子距离大于或如果(i,j)在对角线上,则为零。可替代地,在一些实施方案中,原子距离可以用作邻接矩阵元(i,j)的加权因子,而不是0或1乘数。在某些实施方案中,第i个和第j个原子距离可以通过分子模拟(例如分子动力学)和/或实验室测量(例如nmr)来确定。
[0101]
在某些实施方案中,对于源自cd25参考靶标的工程化多肽的级分,所述工程化多肽中与反应或功能相关的原子或氨基酸具有拓扑约束化学描述符向量和相对于由相同化学描述符描述的参考的小于75%的平均百分比误差(mpe),其中化学描述符向量中的每个第i个元对应于一个氨基酸位置索引。在一些实施方案中,对于源自cd25参考靶标的工程化多肽的级分,所述mpe是相对于由相同化学描述符描述的参考的小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、或小于40%。
[0102]
在仍其他实施方案中,所述矩阵是lx2角矩阵,并且所述工程化多肽中与反应或功能相关的原子或氨基酸具有如下mpe,其是相对于源自参考靶标的工程化多肽的级分中的参考角矩阵的小于75%,其中l是氨基酸位置的编号并且ψ值分别是以维度(l,1)和(l,2)的形式。在一些实施方案中,在源自参考靶标的工程化多肽的级分中,所述mpe是相对于参考角矩阵的小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、或小于40%。在一些实施方案中,所述值是通过分子模拟(例如,分子动力学)、基于知识的结构预测或实验室测量(例如,nmr)来确定的。
[0103]
在一些实施方案中,所述矩阵是sxsxm二级结构元件相互作用矩阵,并且在源自参考靶标的工程化多肽的级分中,所述工程化多肽中与反应或功能相关的原子或氨基酸具有相对于所述参考二级结构元件关系矩阵的小于75%的平均百分比误差(mpe),其中s是二级结构元件的数量,并且m是相互作用描述符的数量。在一些实施方案中,在源自参考靶标的工程化多肽的级分中,所述mpe是相对于所述参考二级结构元件关系矩阵的小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、或小于40%。相互作用描述符可以包括例如氢键合、疏水性堆积(packing)、范德华相互作用、离子相互作用、共价桥、手性、取向、或距离、或其任何组合。在二级结构元件相互作用矩阵索引中,(i,j,m)=第i个与第j个二级结构元件之间的第m个相互作用描述符值。
[0104]
如本文所述的不同矩阵的平均百分比误差(mpe)可以通过以下方式计算:其中n是工程化多肽(eng
n
)和相应参考(ref
n
)的拓扑约束向量或矩阵位置索引,总计为向量或矩阵位置n。
[0105]
在一些实施方案中,与cd25参考靶标相比,所述工程化多肽具有小于75%的mpe。在某些实施方案中,与cd25参考靶标相比,所述工程化多肽具有小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、或小于40%的mpe。在一些实施方案中,所述mpe是通过以下来确定的:总拓扑约束距离(tcd)、拓扑聚类系数(tcc)、欧几里德(euclidean)距离、权力距离、泽格尔(soergel)距离、堪培拉(canberra)距离、索伦森(sorensen)距离、杰卡德
(jaccard)距离、马氏(mahalanobis)距离、汉明(hamming)距离、相似性的定量估计(qel)、或链拓扑参数(ctp)。e.二级结构元件
[0106]
在一些实施方案中,所述工程化多肽的至少一部分受到一个或多个二级结构元件的拓扑约束。在一些实施方案中,所述工程化多肽中与生物反应或生物功能相关的原子或氨基酸受到一个或多个二级结构元件的拓扑约束。在一些实施方案中,所述二级结构元件独立地是折叠、螺旋、转角、环或卷曲。在一些实施方案中,所述二级结构元件独立地是α

螺旋、β

桥、β

链、3
10
螺旋、π

螺旋、转角、环或卷曲。在某些实施方案中,所述工程化多肽的至少一部分受到其拓扑约束的二级结构元件中的一个或多个存在于所述cd25参考靶标中。在一些实施方案中,所述工程化多肽的至少一部分受到二级结构元件的组合的拓扑约束,其中每个元件独立地选自折叠、螺旋、转角、环和卷曲。在仍其他实施方案中,每个元件独立地选自α

螺旋、β

桥、β

链、3
10
螺旋、π

螺旋、转角、环和卷曲。
[0107]
在一些实施方案中,所述二级结构元件是平行或反平行折叠。在一些实施方案中,折叠二级结构包含大于或等于2个残基。在一些实施方案中,折叠二级结构包含小于或等于50个残基。在仍其他实施方案中,折叠二级结构包含在2与50个之间的残基。折叠可以是平行的或反平行的。在一些实施方案中,平行折叠二级结构可以被描述为具有平行的两条链i、j(i和j链的n末端为相反取向)以及残基i:j的氢键合分布。在一些实施方案中,反平行折叠二级结构还可以被描述为具有反平行的两条链i、j(i和j链的n末端为相同取向)以及残基i:j

1、i:j+1的氢键合分布。在某些实施方案中,链的取向和氢键合可以通过基于知识或分子动力学模拟和/或实验室测量来确定。
[0108]
在一些实施方案中,所述二级结构元件是螺旋。螺旋可以是右旋或左旋的。在一些实施方案中,所述螺旋具有在2.5与6.0之间的每转残基(残基/转数)值和在与之间的螺距。在一些实施方案中,所述残基/转数和螺距是通过基于知识或分子动力学模拟和/或实验室测量来确定的。
[0109]
在一些实施方案中,所述二级结构元件是转角。在一些实施方案中,转角包含在2至7个之间的残基和1个或更多个残基间氢键。在一些实施方案中,所述转角包含2、3或4个残基间氢键。在某些实施方案中,所述转角是通过基于知识或分子动力学模拟和/或实验室测量来确定的。
[0110]
在仍其他实施方案中,所述二级结构元件是卷曲。在某些实施方案中,所述卷曲包含在2至20个之间的残基和零个预测的残基间氢键。在一些实施方案中,这些卷曲参数是通过基于知识或分子动力学模拟和/或实验室测量来确定的。
[0111]
在仍其他实施方案中,所述工程化多肽包含一个或多个源自cd25参考靶标的原子或氨基酸,其中所述原子或氨基酸具有二级结构。在一些实施方案中,这些原子或氨基酸与生物反应或生物功能相关。在一些实施方案中,对于源自cd25参考靶标的工程化多肽的级分,所述工程化多肽中的原子或氨基酸的二级结构基序向量具有相对于cd25参考靶标二级结构基序向量的大于0.25的余弦相似性,其中所述向量的长度是二级结构基序的数量,并且在第i个向量位置处的值定义了从查找表得出的二级结构基序的身份(例如,螺旋、折叠)。在一些实施方案中,每个基序包含两个或更多个氨基酸。在某些实施方案中,基序包括例如α

螺旋、β

桥、β

链、3
10
螺旋、π

螺旋、转角和环。在一些实施方案中,对于源自cd25参考
靶标的工程化多肽的级分,所述余弦相似性是相对于cd25参考靶标二级结构基序向量的大于0.3、大于0.35、大于0.4、大于0.45、或大于0.5。余弦相似性可以通过以下方式计算:其中a是二级结构基序标识符的肽向量,b是二级结构基序标识符的参考向量,n是二级结构基序向量的长度,并且i是第i个二级结构基序。
[0112]
在一些实施方案中,可以使用总拓扑约束距离(tcd)将源自cd25参考靶标的工程化多肽的一个或多个原子或氨基酸与相应的cd25参考靶标原子或氨基酸进行比较。在一些实施方案中,源自cd25参考靶标的所述工程化多肽原子或氨基酸的总tcd是相对于cd25参考靶标中的相应原子的tcd距离的+/

75%,其中如果两个分子内拓扑约束的成对距离小于或等于则它们相互作用。在一些实施方案中,所比较的工程化多肽中的原子或氨基酸与生物功能或生物反应相关。在一些实施方案中,两个原子或氨基酸的第i个、第j个成对距离可以通过分子模拟(例如,分子动力学)和/或实验室测量(例如,nmr)来确定。计算总拓扑约束距离(tcd)的示例性方程是:其中i、j是氨基酸(i,j)的分子内位置索引,s
ij
是约束s(i)与s(j)之间的差,如果氨基酸(i,j)在相互作用阈值内则δ(i,j)=1,并且l是所述肽或相应的cd25参考靶标中氨基酸位置的编号。可替代地,在一些实施方案中,δ(i,j)可以用作s
ij
差的加权因子,而不是0或1乘数。
[0113]
在一些实施方案中,可以使用链拓扑参数(ctp)将源自cd25参考靶标的工程化多肽的一个或多个原子或氨基酸与相应的cd25参考靶标原子或氨基酸进行比较。在一些实施方案中,所述工程化多肽原子或氨基酸的ctp是相对于cd25参考靶标中的相应原子或氨基酸的ctp的+/

50%,其中链内拓扑相互作用是小于或等于的成对距离。在一些实施方案中,所比较的工程化多肽中的原子或氨基酸与生物功能或生物反应相关。在一些实施方案中,第i个、第j个成对距离可以通过分子模拟(例如分子动力学)和/或实验室测量(例如nmr)来确定。用于评价ctp的示例性方程是:其中i、j是氨基酸(i,j)的位置索引,s
ij
是拓扑约束s(i)与s(j)之间的差,如果氨基酸(i,j)在链拓扑相互作用阈值内则δ(i,j)=1,l是所述肽或相应的cd25参考靶标中氨基酸位置的编号,并且n是工程化多肽或cd25参考靶标中满足拓扑相互作用阈值的链内接触的总数量。可替代地,在一些实施方案中,δ(i,j)可以用作s
ij
差的加权因子,而
不是0或1乘数。
[0114]
在一些实施方案中,可以使用相似性的定量估计(qel)将源自cd25参考靶标的工程化多肽的一个或多个原子或氨基酸与相应的cd25参考靶标原子或氨基酸进行比较。在一些实施方案中,所述工程化多肽原子或氨基酸的qel是相对于cd25参考靶标中的相应原子或氨基酸的qel的+/

50%。在一些实施方案中,所比较的工程化多肽中的原子或氨基酸与生物功能或生物反应相关。用于确定qel的示例性方程是:其中di是针对第i个氨基酸或原子位置的拓扑约束,或组合了针对第i个氨基酸或原子位置的多个拓扑约束的复合函数(例如,线性回归函数),并且n是所述肽或cd25参考靶标中氨基酸或原子位置的编号。
[0115]
在一些实施方案中,可以使用拓扑聚类系数(tcc)向量和平均百分比误差(mpe)将源自cd25参考靶标的工程化多肽的一个或多个原子或氨基酸与相应的cd25参考靶标原子或氨基酸进行比较。在一些实施方案中,所述tcc向量和mpe是相对于cd25参考靶标中的相应原子或氨基酸的tcc的小于75%,其中所述向量的每个元(i)是对于第i个氨基酸位置的拓扑聚类系数,分子内簇是由小于或等于的相互作用边缘距离和从第i个氨基酸位置的两个边缘i

j、j

l来定义的。在一些实施方案中,所比较的工程化多肽中的原子或氨基酸与生物功能或生物反应相关。在一些实施方案中,第i个、第j个和第l个边缘距离可以通过分子模拟(例如分子动力学)和/或实验室测量(例如nmr)来确定。用于评价第i个位置的拓扑聚类系数的示例性方程是:其中如果分子内氨基酸位置:(i,j)、(i,l)、(j,l)分别在相互作用边缘阈值内,则δ(i,j)=1,δ(i,l)=1,δ(j,l)=1,s
ijl
是对于第i个、第j个和第l个氨基酸的拓扑约束的组合(例如,总和),l是肽向量或相应的cd25参考靶标向量中氨基酸位置的编号,n
c
是对于第i个氨基酸的分子内相互作用氨基酸位置的编号,其满足边缘阈值和从第i个氨基酸的两个边缘i

j、j

l。可替代地,在一些实施方案中,δ(i,j)、δ(i,l)和δ(j,l)可以用作聚类系数向量元(i)的加权因子,而不是0或1乘数。
[0116]
在仍其他实施方案中,可以使用lxm拓扑约束矩阵和以下的平均百分比误差(mpe)将源自cd25参考靶标的工程化多肽的一个或多个原子或氨基酸与相应的cd25参考靶标原子或氨基酸进行比较:跨m维度的欧几里得距离、权力距离、泽格尔距离、堪培拉距离、索伦森距离、杰卡德距离、马氏距离、或汉明距离。所述lxm矩阵元(l,m)含有第l个氨基酸位置的第m个约束值,其中l是氨基酸位置的编号,并且m是不同拓扑约束的数量。在一些实施方案中,工程化多肽lxm矩阵的mpe是相对于相应的cd25参考靶标原子或氨基酸的矩阵的小于75%。在一些实施方案中,所述mpe小于70%、小于65%、小于60%、小于55%、小于50%、或小于45%。在一些实施方案中,所比较的工程化多肽中的原子或氨基酸与生物功能或生物
反应相关。iii.可编程的体外选择
[0117]
在其他方面,本文还提供了使用本文所述的工程化多肽选择结合配偶体的方法,其中至少一个选择步骤包括评价潜在结合配偶体的池与工程化多肽的相互作用。
[0118]
在一些实施方案中,本文提供了使用两种或更多种选择分子来操纵结合分子的选择的方法。在一些实施方案中,所述方法包括使候选结合分子的池进行至少一个回合的选择,其中每个回合包括至少一个阴性选择步骤,其中所述池的至少一部分是针对阴性选择分子进行筛选;以及至少一个阳性选择步骤,其中所述池的至少一部分是针对阳性选择分子进行筛选。在一些实施方案中,所述方法包括至少两个回合、至少三个回合、至少四个回合、至少五个回合、至少六个回合、至少七个回合、至少八个回合、至少九个回合、至少十个回合、或更多个回合,其中每个回合独立地包括至少一个阴性选择步骤和至少一个阳性选择步骤。在一些实施方案中,每个回合独立地包括多于一个阴性选择步骤、或多于一个阳性选择步骤、或其组合。图5提供了详细描述三个回合的选择的示例性示意图,其中第一回合和第三回合包括多于一个阴性选择步骤,并且第一回合还包括多于一个阳性选择回合。如该方案所示,在第一回合中使用了两种阴性选择分子(“诱饵”),并且在第三回合中使用了三种阴性选择分子。另外,在第一回合中使用了两种阳性选择分子。
[0119]
在一些实施方案中,其中所述方法包括多于一个回合,每种阴性和阳性选择分子是独立选择的。在其他实施方案中,可以在多于一个回合中使用相同的阴性选择分子、或相同的阳性选择分子、或其组合。例如,在图5中,在第3回合中再次使用在第1回合中使用的相同的阴性选择分子,并且在第3回合中还包括另外的第三种阴性选择分子。在某些实施方案中,可以在每个回合的选择中独立地选择阴性和阳性选择步骤的顺序。因此,例如,在一些实施方案中,所述方法包括一个或多个回合的选择,其中每个回合首先包括阴性选择步骤,然后包括阳性选择步骤。在其他实施方案中,所述方法包括一个或多个回合的选择,其中每个回合首先包括阳性选择步骤,然后包括阴性选择步骤。在仍其他实施方案中,所述方法包括一个或多个回合的选择,其中每个回合独立地包括阴性选择步骤和阳性选择步骤,其中在每个回合中,所述阴性选择步骤独立地在所述阳性选择步骤之前或所述阳性选择步骤之后。
[0120]
此类选择方法使用阳性(+)和阴性(

)步骤来操纵候选结合分子的文库趋向和远离某些所需的特征,如结合特异性或结合亲和力。通过使用具有阳性选择分子和阴性选择分子二者的多个步骤,可以以逐步的方式引导候选物的池以选择期望的特征和以不期望的特征为背景进行选择。另外,在一些实施方案中,每个回合内的每个步骤的顺序以及回合相对于彼此的顺序可以将选择引导至不同方向。因此,例如,在一些实施方案中,与在首先(

)、接着(+)选择的情况下相比,包括具有(+)选择、接着(

)选择的一个回合的方法将导致候选物的不同最终池。将其外推至包括多个回合的方法,选择步骤的顺序可以导致选择的候选物的不同最终池,即使总体上使用相同的阳性选择和阴性选择分子。
[0121]
在一些实施方案中,使用这样的选择分子,其具有另一选择分子的相反特征。这可能是有用的,例如以确保使用阳性选择分子(或由于阴性选择分子而被排除)鉴定的候选结合配偶体是由于所需的特点(或不需要的特点),而不是由于单独的、不相关的结合相互作用被鉴定出的。为了去除通过不相关的相互作用结合的结合配偶体,可以使用具有与所述
选择分子相似或相同的结构和特征的相反选择分子,但传输所需特点(或不需要的特点)的残基/结构除外。例如,如果需要与阳性选择分子中的特定电荷分布相互作用,则可以使用相反阴性选择分子,其已经用不带电残基和/或具有相反电荷的残基代替提供所述电荷分布的残基。因此,对于某些选择分子,可以存在多种不同的相应相反选择分子。
[0122]
在本文提供的选择方法中,所述选择分子中的至少一种是如本文所述的工程化多肽。在一些实施方案中,使用多于一种工程化多肽。在一些实施方案中,每种工程化多肽独立地是阳性或阴性选择分子。在某些实施方案中,在所述一个或多个回合的选择中使用的每种选择分子独立地是工程化多肽。在其他实施方案中,不是工程化多肽的至少一种分子用作选择分子。此类不是工程化多肽的选择分子可以包括例如天然存在的多肽或其一部分。在其他实施方案中,不是工程化多肽的一种或多种选择分子可以包括例如非天然存在的多肽或其部分。例如,在一些实施方案中,一种或多种选择分子(例如,阳性选择分子或阴性选择分子)是免疫原、抗体、细胞表面受体、或跨膜蛋白、或信号传导蛋白、或多蛋白复合物、或肽

蛋白复合物,或其任何部分、或其任何组合。在一些实施方案中,一种或多种选择分子是cd25或任何cd25的一部分。
[0123]
在每个步骤中选择的或以其为背景选择的阳性特征和阴性特征可以选自多种特点,并且可以根据所获得的最终一种或多种结合分子的所需特征进行调整。此类所需的特征可以取决于,例如所述一种或多种结合分子的预期用途。例如,在一些实施方案中,本文提供的方法用于针对一种或多种阳性特征(如高特异性)和以一种或多种阴性特征(如交叉反应性)为背景来筛选抗体候选物。应当理解,在一种情境下被认为是阳性特征的特征在另一种情境下可能是阴性特征,反之亦然。因此,在一些实施方案中,一系列选择回合中的阳性选择分子可以是在不同系列的选择回合中、或者在选择不同类型的结合分子时、或者在选择相同类型的结合分子但用于不同目的时的阴性选择分子。
[0124]
在一些实施方案中,每个选择特征独立地选自氨基酸序列、多肽二级结构、分子动力学、化学特征、生物功能、免疫原性、一种或多种cd25参考靶标多特异性、跨物种cd25参考靶标反应性、一种或多种所需cd25参考靶标相对于一种或多种不需要的参考靶标的选择性、序列和/或结构同源家族内一种或多种参考靶标的选择性、具有相似蛋白质功能的一种或多种参考靶标的选择性、来自具有高序列和/或结构同源性的不需要的靶标的较大家族的一种或多种不同的所需参考靶标的选择性、不同参考靶标等位基因或突变的选择性、针对不同参考靶标残基水平化学修饰的选择性、针对细胞类型的选择性、针对组织类型的选择性、针对组织环境的选择性、对一种或多种参考靶标结构多样性的耐受性、对一种或多种参考靶标序列多样性的耐受性、以及对一种或多种参考靶标动力学多样性的耐受性。在一些实施方案中,每个选择特征是不同类型的选择特征。在其他实施方案中,两个或更多个选择特征是不同的特征,但具有相同的类型。例如,在一些实施方案中,两个或更多个选择特征是多肽二级结构,其中一个是针对所需的多肽二级结构的阳性选择,并且一个是针对不需要的多肽二级结构的阴性选择。在一些实施方案中,两个或更多个选择特征是针对细胞类型的选择性,其中阳性选择特征是针对特定所需的细胞类型的选择性,并且阴性选择特征是针对特定不需要的细胞类型的选择性。在一些实施方案中,两个或更多个、三个或更多个、四个或更多个、五个或更多个、或六个或更多个选择特征具有相同类型。
[0125]
在一些实施方案中,所述选择特征是与本发明的工程化多肽结合。例如,图7、表1、
表8和表9中所示的工程化多肽可以用于选择与图6和表7中所示的表位特异性结合的抗体(或其他结合剂)。表10中提供了说明性的选择策略。
[0126]
在又另一个方面,本文提供了一种包含两种或更多种选择操纵多肽的组合物,其中每种多肽独立地是包含一种或多种阳性操纵特征的阳性选择分子或包含一种或多种阴性操纵特征的阴性选择分子。在一些实施方案中,此类特征可以选自氨基酸序列、多肽二级结构、分子动力学、化学特征、生物功能、免疫原性、一种或多种参考靶标多特异性、跨物种参考靶标反应性、一种或多种所需参考靶标相对于一种或多种不需要的参考靶标的选择性、序列和/或结构同源家族内一种或多种参考靶标的选择性、具有相似蛋白质功能的一种或多种参考靶标的选择性、来自具有高序列和/或结构同源性的不需要的靶标的较大家族的一种或多种不同的所需参考靶标的选择性、不同参考靶标等位基因或突变的选择性、针对不同参考靶标残基水平化学修饰的选择性、针对细胞类型的选择性、针对组织类型的选择性、针对组织环境的选择性、对一种或多种参考靶标结构多样性的耐受性、对一种或多种参考靶标序列多样性的耐受性、以及对一种或多种参考靶标动力学多样性的耐受性。
[0127]
因此,在其他方面,本文提供了一种用如本文所述的选择操纵组合物筛选结合分子的文库的方法,其中每个回合的选择包括:以阴性选择分子为背景筛选所述池的至少一部分的阴性选择步骤;以及针对阳性选择分子筛选所述池的至少一部分的阳性选择步骤;其中每个回合内的选择步骤的顺序以及回合的顺序导致选择所述池的与替代顺序不同的子集。
[0128]
在一些实施方案中,使用如本文所述的选择操纵多肽的组合物或如本文所述的筛选方法评价的结合配偶体是噬菌体文库,例如含fab的噬菌体文库;或细胞文库,例如b细胞文库或t细胞文库。
[0129]
在本文提供的筛选方法的一些实施方案中,所述方法包括两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、或七个或更多个回合的选择。在一些实施方案中,其中存在多于一个回合,每个回合包含不同的选择分子集合。在其他实施方案中,其中存在多于一个回合,至少两个回合包含相同的阴性选择分子、相同的阳性选择分子或二者。
[0130]
在所述筛选方法的一些实施方案中,所述方法包括在进行下一回合的选择之前分析所述池的子集。在某些实施方案中,每个子集池分析独立地选自肽/蛋白质生物传感器结合、肽/蛋白质elisa、肽文库结合、细胞提取物结合、细胞表面结合、细胞活性测定、细胞增殖测定、细胞死亡测定、酶活性测定、基因表达谱、蛋白质修饰测定、蛋白质印迹和免疫组织化学。在一些实施方案中,基因表达谱包括所述子集池的全序列库分析,如下一代测序。在一些实施方案中,统计和/或信息评分或机器学习训练用于评价在一个或多个选择回合中所述池的一个或多个子集。
[0131]
在一些实施方案中,通过分析来自一个选择回合的子集池来确定用于后续回合的阳性选择和/或阴性选择分子的身份和/或顺序。在一些实施方案中,统计和/或信息评分或机器学习训练用于评价一个或多个选择回合中所述池的一个或多个子集,以确定用于后续回合(如下一回合或程序中更向前的回合)的阳性选择和/或阴性选择分子的身份和/或顺序。
[0132]
在仍其他实施方案中,所述选择方法包括在进行下一选择回合之前修饰从选择回
合获得的子集池。此类修饰可以包括例如子集池的基因突变、子集池的基因耗尽(例如,选择子集池的子集以在选择中前进)、子集池的基因富集(例如,增加所述池的大小)、子集池的至少一部分的化学修饰、或所述子集池的至少一部分的酶促修饰、或其任何组合。在一些实施方案中,统计和/或信息评分或机器学习训练用于评价子集池并且确定在选择中使经修饰的子集池前进之前要做出的一种或多种修饰。在某些实施方案中,此类统计和/或信息评分或机器学习训练也用于确定用于后续回合的选择的阳性选择和/或阴性选择分子的身份和/或顺序。
[0133]
在每个步骤中,可以使用任何合适的测定来评价结合配偶体的池与选择分子的结合。在一些实施方案中,例如通过直接检测所述结合配偶体上的标记直接评价结合。此类标记可以包括例如荧光标记,如荧光团或荧光蛋白。在其他实施方案中,例如使用夹心测定间接评价结合。在夹心测定中,结合配偶体与选择分子结合,然后添加二级标记试剂以标记结合的结合配偶体。然后检测到该二级标记试剂。夹心测定组分的例子包括用抗his标签抗体或his标签特异性荧光探针检测的his标记的结合配偶体;用标记的链霉亲和素或标记的亲和素检测的生物素标记的结合配偶体;或用抗结合配偶体抗体检测的未标记的结合配偶体。
[0134]
在一些实施方案中,使用任意数量的可用检测方法基于结合信号或剂量反应来鉴定在每个步骤中选择的结合配偶体。这些检测方法可以包括例如成像、荧光激活细胞分选(facs)、质谱法或生物传感器。在一些实施方案中,定义了命中阈值(例如,中值信号),并且具有高于该信号的任一种都被标记为推定的命中基序。iv.使用工程化多肽产生抗体
[0135]
本文提供的和通过本文提供的方法鉴定的工程化多肽可以用于例如产生一种或多种抗体。在一些实施方案中,所述抗体是单克隆或多克隆抗体。因此,在一些实施方案中,本文提供了通过用免疫原对动物进行免疫而产生的抗体,其中所述免疫原是如本文提供的工程化多肽。在一些实施方案中,所述动物是人、兔子、小鼠、仓鼠、猴子等。在某些实施方案中,所述猴子是食蟹猴、猕猴或恒河猴。用工程化多肽对动物免疫可以包括例如向动物施用至少一剂包含所述肽和任选佐剂的组合物。在一些实施方案中,从动物产生抗体包括分离表达所述抗体的b细胞。一些实施方案还包括将b细胞与骨髓瘤细胞融合以产生表达所述抗体的杂交瘤。在一些实施方案中,使用所述工程化多肽产生的抗体可以与人和猴子(例如食蟹猴)交叉反应。a.工程化多肽的特征
[0136]
本文提供的工程化多肽具有与cd25共同的一个或多个特征。在一些实施方案中,它们展现出cd25的表面的至少一个特征,例如与cd25的结合配偶体结合的功能性界面表面。在一些实施方案中,所述结合配偶体是与cd25特异性结合的抗体。在一些实施方案中,所述工程化多肽展现出cd25表面的已知不与针对cd25的抗体相互作用的一部分的至少一个特征。
[0137]
在某些类型的特征的一些实施方案中,所述工程化多肽呈现cd25的功能界面的模拟物(如结合表面),但是由所述工程化多肽共有的特征可以最好地描述为与作为整体的cd25共有。例如,共有的一个特征可以是cd25的配偶体与cd25之间的结合,其中所述结合与cd25的功能结合界面一起发生,但是所述功能结合界面的结构和取向由所述cd25蛋白的其
余部分支持。
[0138]
此类共有特征可以包括例如结构度量或功能度量或其组合。所述至少一个共有特征可以包括例如一个或多个结构相似性、构象熵的相似性、一个或多个化学描述符相似性、一个或多个功能结合相似性、或一个或多个表型相似性、或其任何组合。在某些实施方案中,所述工程化多肽与cd25表面的至少一部分(如功能界面,例如结合表面)共有这些特征中的一个或多个。
[0139]
在一些实施方案中,所述工程化多肽具有与cd25(或cd25表面的一部分,如结合表面)的结构相似性,并且该结构相似性通过骨架均方根偏差(rmsd)或侧链rmsd来评价。rmsd评价原子之间的平均距离,并且可以应用于三维结构,以比较两个单独的结构在三维空间中的相似程度。在一些实施方案中,所述工程化多肽与cd25(或cd25的功能界面)之间的骨架或氨基酸侧链或二者的rmsd低于cd25(或cd25的功能界面)与不同分子之间的rmsd。在一些实施方案中,将cd25的一部分(或cd25的功能界面的一部分)与所述工程化多肽进行比较。例如,可以使用所述工程化多肽的经实验测量的结构或模拟结构;以及cd25(或其功能界面)的经实验测量的结构或模拟结构来评价rmsd。在一些实施方案中,如果工程化多肽的骨架相对于cd25的x射线结构的骨架具有小于或等于的平均rmsd,则认为所述工程化多肽在结构上类似于cd25。
[0140]
在一些实施方案中,所述工程化多肽具有与cd25(或cd25表面的一部分,如结合表面)相似的构象熵,并且例如,使用所述工程化多肽的经实验测量的结构或模拟结构以及cd25(或其部分)的经实验测量的结构或分子动力学模拟运动来评价该构象熵。在此类模拟中,在一些实施方案中,使用cd25(或其部分,如结合表面的一部分)的经实验测量的结构或分子动力学模拟运动。在某些实施方案中,如果在标准生理条件下运行的工程化多肽分子动力学系综具有如下所有状态,其中相对于已知的cd25(或其部分)x射线晶体结构的所有非氢原子位置,则认为所述工程化多肽的构象熵与cd25(或其部分)的构象熵相似。
[0141]
在其他实施方案中,所述工程化多肽具有与cd25(或其一部分,如结合表面)相似的一种或多种化学描述符。在其他实施方案中,所述工程化多肽具有与cd25的结合配偶体(例如,针对cd25的抗体)互补的一种或多种化学描述符。此类化学描述符(可以是相似的或互补的)可以包括例如疏水性分布、h键合分布、原子体积/半径、电荷分布、或原子占位分布、或其任何组合。在一些实施方案中,可以使用所述工程化多肽的经实验测量的结构或模拟结构以及cd25(或其一部分,如结合表面)的经实验测量的结构或模拟结构来评价这些化学描述符。
[0142]
在其他实施方案中,所述工程化多肽具有与cd25相似的功能结合。例如,在一些实施方案中,所述工程化多肽具有与cd25结合配偶体或其片段的结合。在一些实施方案中,所述结合配偶体是天然结合配偶体的片段,或者是经修饰的天然结合配偶体。此类修饰可以包括例如包含天然结合配偶体的至少一个片段的融合蛋白;用发色团标记;用荧光团标记;用生物素标记;或用his标签标记。在一些实施方案中,所述工程化多肽具有与cd25的结合配偶体的结合,所述结合在cd25与结合配偶体的结合的约两个数量级内、或约一个数量级内。在一些实施方案中,通过比较结合对的结合常数(k
d
)、或抑制常数(k
i
)、或结合缔合速率、或结合解离速率、或结合亲和力、或结合的吉布斯自由能(δg)来评价结合的相似性。在
一些实施方案中,所述结合配偶体是针对cd25的抗体。
[0143]
在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合常数(k
d
)在cd25与所述结合配偶体的k
d
的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体的抑制常数(k
i
)在cd25与所述结合配偶体的k
i
的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在仍其他实施方案中,所述工程化多肽与cd25结合配偶体的结合缔合速率类似于cd25与所述结合配偶体的结合缔合速率。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合缔合速率在cd25与所述结合配偶体的缔合速率的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体的结合解离速率类似于cd25与所述结合配偶体的结合解离速率。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合解离速率在cd25与所述结合配偶体的解离速率的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在仍其他实施方案中,所述工程化多肽与cd25结合配偶体的结合亲和力类似于cd25与所述结合配偶体的结合亲和力。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合亲和力在cd25与所述结合配偶体的结合亲和力的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体结合的吉布斯自由能在cd25与所述结合配偶体结合的吉布斯自由能的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在一些实施方案中,所述cd25结合配偶体是cd25的抗体。
[0144]
在又其他实施方案中,所述工程化多肽与cd25或其一部分(如cd25的结合表面)共有序列相似性。所述相似性可以是与cd25的连续氨基酸序列(或其部分)或cd25的非连续序列(或其部分)比较的。例如,在某些实施方案中,cd25的结合表面由非连续的氨基酸序列形成,并且所述工程化多肽与形成所述表面的非连续序列的至少一部分具有序列相似性。在其他实施方案中,所述工程化多肽与形成cd25的结合表面的连续氨基酸序列的至少一部分具有序列相似性。在一些实施方案中,cd25的结合表面包含与针对cd25的抗体结合的表位。
[0145]
在一些实施方案中,所述工程化多肽具有与cd25的连续序列(例如形成cd25的结合表面的连续序列)的一部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相
同、或至少90%相同的序列。在某些实施方案中,所述工程化多肽具有与cd25的非连续序列(例如,形成cd25的结合表面的非连续序列)的一部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、或至少90%相同的序列。在某些实施方案中,所述工程化多肽具有与cd25的结合表面的连续部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、或至少90%相同的序列。在一些实施方案中,所述工程化多肽具有与cd25的结合表面的两个或更多个非连续部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同的序列、至少85%相同、或至少90%相同的序列。在一些实施方案中,所述工程化多肽具有与cd25的结合表面至少部分相同(如本文所述)的序列,其中所述结合表面包含与cd25的一种或多种抗体结合的表位。
[0146]
在某些实施方案中,使用所述工程化多肽的一个或多个肽部分(不包括接头,如果存在的话)来评价所述工程化多肽与cd25(或其部分)的序列相似性。在某些实施方案中,也考虑一个或多个连接部分,例如如果所述工程化多肽包含一个或多个含有氨基酸的接头。b.工程化多肽
[0147]
在一些实施方案中,所述工程化多肽包含多于一个肽,例如至少两个肽、或至少三个肽、或更多个。在一些实施方案中,所述工程化多肽包含在1与10个之间的肽、在1与8个之间的肽、在1与6个之间的肽、在1与4个之间的肽、在2与10个之间的肽、在2与8个之间的肽、在2与6个之间的肽、或在2与4个之间的肽。
[0148]
在一些实施方案中,所述工程化多肽包含在2至100个之间的氨基酸,例如在2至80个之间的氨基酸、在2至70个之间的氨基酸、在2至60个之间的氨基酸、在2至50个之间的氨基酸、在2至40个之间的氨基酸、在2至30个之间的氨基酸、在2至25个之间的氨基酸、在2至20个之间的氨基酸、在2至15个之间的氨基酸、在5至30个之间的氨基酸、在5至25个之间的氨基酸、在5至20个之间的氨基酸、在5至15个之间的氨基酸、或在9至15个之间的氨基酸。
[0149]
在某些实施方案中、所述工程化多肽包含多于一个肽、例如至少两个肽、或至少三个肽、或至少四个肽、或更多个,并且每个肽独立地包含在1至100个之间的氨基酸、或在2至100个之间的氨基酸,例如在2至80个之间的氨基酸、在2至70个之间的氨基酸、在2至60个之间的氨基酸、在2至50个之间的氨基酸、在2至40个之间的氨基酸、在2至30个之间的氨基酸、在2至25个之间的氨基酸、在2至20个之间的氨基酸、在2至15个之间的氨基酸、在5至30个之间的氨基酸、在5至25个之间的氨基酸、在5至20个之间的氨基酸、在5至15个之间的氨基酸、或在9至15个之间的氨基酸。
[0150]
在一些实施方案中,所述工程化多肽仅包含天然存在的氨基酸。在其他实施方案中,所述工程化多肽包含非天然氨基酸,例如天然存在的氨基酸和非天然氨基酸的组合。
[0151]
在一些实施方案中,其中所述工程化多肽包含两个或更多个肽,每个肽独立地展现出cd25或其一部分(如结合表面)的至少一个特征。在一些实施方案中,每个肽独立地展现出cd25或其一部分的1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、1至4个、1至3个、或1个、或2个特征。在一些实施方案中,所述特征是cd25中与cd25的抗体相互作用的一部分共有的。
[0152]
在一些实施方案中,所述工程化多肽具有与cd25的结合配偶体(例如cd25的抗体)互补的至少一个特征。
[0153]
在一些实施方案中,所述工程化多肽的肽与cd25或其一部分共有一个或多个结构相似性。在一些实施方案中,可以通过骨架rmsd或侧链rmsd来评价所述结构相似性。例如,在某些实施方案中,在所述工程化多肽的肽与cd25(或其一部分)之间的骨架或氨基酸侧链或二者的rmsd低于cd25(或其部分)与不同分子(如不同肽)之间的rmsd。在一些实施方案中,将cd25的一部分(例如cd25的表面(如与针对cd25的抗体相互作用的表面)的一部分)与所述肽进行比较。例如,可以使用所述肽的经实验测量的结构或模拟结构以及cd25或其部分的经实验测量的结构或模拟结构来评价结构相似性的rmsd。在一些实施方案中,如果所述工程化多肽的骨架相对于cd25或其部分的已知x射线结构的骨架具有小于或等于的平均rmsd,则认为所述工程化多肽的肽在结构上类似于cd25(或其所述部分)。
[0154]
在一些实施方案中,所述工程化多肽与cd25或其一部分具有相似的构象熵。在一些实施方案中,所述肽的经实验测量的结构或分子动力学模拟运动用于与cd25或其一部分的经实验测量的结构或模拟结构比较构象熵。在一些实施方案中,如果在标准生理条件下运行的肽分子动力学系综具有如下所有状态,其中相对于cd25或其部分的已知x射线晶体结构的所有非氢原子部分,则认为构象熵相似。在一些实施方案中,将cd25的一部分(例如cd25的与cd25的抗体相互作用的表面部分)与所述肽进行比较。
[0155]
在其他实施方案中,所述工程化多肽的肽与cd25(或其部分)之间的相似性可以是一个或多个化学描述符。在一些实施方案中,所述肽具有与cd25(或其一部分)共同的一个或多个化学描述符,或与cd25的结合配偶体(例如,针对cd25的抗体)互补的一个或多个化学描述符。化学描述符可以包括例如疏水性分布、h键合分布、原子体积/半径、电荷分布、或原子占位分布、或其任何组合。在一些实施方案中,所述工程化多肽的肽具有一个或多个疏水性分布、h键合分布、原子体积/半径、电荷分布、或原子占位分布、或其任何组合,这类似于cd25或其一部分中的那些,或与cd25的结合配偶体(如针对cd25的抗体)互补。在一些实施方案中,所述相似性是共同具有相同的化学描述符,如相同的疏水性分布、h键合分布、原子体积/半径、电荷分布或原子占位分布中的一个或多个。互补的化学描述符包括例如具有正电荷分布的肽,所述正电荷分布与cd25的结合配偶体(如针对cd25的抗体)的负电荷分布互补。在一些实施方案中,可以使用所述肽的经实验测量的结构或模拟结构以及cd25或cd25结合配偶体(例如,用于互补评价)的经实验测量的结构或模拟结构来评价这些化学描述符。
[0156]
例如,在一些实施方案中,所述工程化多肽结合cd25的结合配偶体,这类似于cd25与结合配偶体(例如,il

2)的结合。在一些实施方案中,所述结合配偶体是天然结合配偶体、天然结合配偶体的片段、或经修饰的天然结合配偶体或其片段、或与cd25特异性结合的抗体。在一些实施方案中,所述结合配偶体在特定情形下结合,但在其他情况下不结合。在一些实施方案中,所述结合配偶体在病理条件下结合或在非病理条件下结合。所述结合配偶体可以是例如组成性表达的或者是兼性基因的产物或者包含蛋白质或其片段。在某些实施方案中,所述结合配偶体是天然结合配偶体的片段,或者是经修饰的天然结合配偶体。在一些实施方案中,修饰可以包括例如包含天然结合配偶体的至少一个片段的融合蛋白;用
发色团标记;用荧光团标记;用生物素标记;或用his标签标记。
[0157]
在一些实施方案中,所述工程化多肽具有与cd25的结合配偶体的结合,所述结合在cd25与结合配偶体的结合的约两个数量级内、或约一个数量级内。在一些实施方案中,通过比较结合对的结合常数(k
d
)、或抑制常数(k
i
)、或结合缔合速率、或结合解离速率、或结合亲和力、或结合的吉布斯自由能(δg)来评价结合的相似性。在一些实施方案中,所述结合配偶体是针对cd25的抗体。
[0158]
在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合常数(k
d
)在cd25与所述结合配偶体的k
d
的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体的抑制常数(k
i
)在cd25与所述结合配偶体的k
i
的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在仍其他实施方案中,所述工程化多肽与cd25结合配偶体的结合缔合速率类似于cd25与所述结合配偶体的结合缔合速率。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合缔合速率在cd25与所述结合配偶体的缔合速率的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体的结合解离速率类似于cd25与所述结合配偶体的结合解离速率。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合解离速率在cd25与所述结合配偶体的解离速率的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在仍其他实施方案中,所述工程化多肽与cd25结合配偶体的结合亲和力类似于cd25与所述结合配偶体的结合亲和力。在一些实施方案中,所述工程化多肽与cd25结合配偶体的结合亲和力在cd25与所述结合配偶体的结合亲和力的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在其他实施方案中,所述工程化多肽与cd25结合配偶体结合的吉布斯自由能在cd25与所述结合配偶体结合的吉布斯自由能的1000倍之内、800倍之内、600倍之内、400倍之内、200倍之内、100倍之内、90倍之内、80倍之内、70倍之内、60倍之内、50倍之内、40倍之内、30倍之内、20倍之内、10倍之内、8倍之内、6倍之内、4倍之内、2倍之内、1.5倍之内、1.2倍之内,或与其大致相同。在一些实施方案中,所述cd25结合配偶体是cd25的抗体。
[0159]
在一些实施方案中,所述工程化多肽与cd25或其一部分具有序列相似性。在一些实施方案中,所述工程化多肽与cd25的表面的一部分具有序列相似性,所述cd25与cd25的抗体结合。在某些实施方案中,所述序列相似性是与cd25的连续氨基酸序列比较的。在其他实施方案中,所述序列相似性是与cd25的非连续序列比较的。例如,在某些实施方案中,折
叠的cd25的结合表面由非连续的氨基酸序列形成,并且所述工程化多肽与形成所述表面的非连续序列的至少一部分具有序列相似性。在一些实施方案中,所述工程化多肽与形成cd25的结合表面的连续氨基酸序列的至少一部分具有序列相似性。在一些实施方案中,所述工程化多肽具有与cd25的连续序列(如形成结合表面的连续序列)的至少一部分至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、或至少99%相同的序列。在某些实施方案中,所述工程化多肽具有与cd25的非连续序列(例如,形成结合表面的非连续序列)的至少一部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、或至少90%相同的序列。在某些实施方案中,所述工程化多肽具有与cd25的连续部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同、至少85%相同、或至少90%相同的序列。在一些实施方案中,所述工程化多肽具有与cd25的两个或更多个非连续部分至少40%相同、至少45%相同、至少50%相同、至少55%相同、至少60%相同、至少65%相同、至少70%相同、至少75%相同、至少80%相同的序列、至少85%相同、或至少90%相同的序列。在一些实施方案中,对于包含至少两个肽的工程化多肽,所述工程化免疫原的两个或更多个肽独立地与cd25共有序列相似性,如与cd25的结合表面共有序列相似性。在一些实施方案中,与所述工程化多肽共有序列相似性的cd25的所述部分是与针对cd25的抗体结合的表面。c.连接部分
[0160]
本文提供的工程化多肽任选地包含连接部分。当存在时,所述连接部分可以例如独立地是交联或接头。
[0161]
在一些实施方案中,所述工程化多肽包含n个肽和n

1个连接部分;或n个肽和n

1个连接部分;或n个肽和n个连接部分;或n个肽和n+1个连接部分;或n个肽和n+2个连接部分;或n个肽和n

2个连接部分,其中n为3或更大。
[0162]
在一些实施方案中,所述工程化多肽包含至少一个连接部分、至少两个连接部分、至少三个连接部分、至少四个连接部分、至少五个连接部分、至少六个连接部分、在一至六个之间的连接部分、在一至五个之间的连接部分、在一至四个之间的连接部分、在一至三个之间的连接部分、一个连接部分、或两个连接部分。在一些实施方案中,每个连接部分独立地是交联或接头。在某些实施方案中,每个连接部分是交联。在其他实施方案中,每个连接部分是接头。在仍其他实施方案中,至少一个连接部分是交联,并且其余的连接部分独立地是交联或接头。在其他实施方案中,至少一个连接部分是接头,并且其余的连接部分独立地是交联或接头。
[0163]
交联包括例如一个氨基酸的侧链与另一个氨基酸的部分之间的共价键。所述氨基酸可以独立地是天然或非天然氨基酸。在一些实施方案中,交联包括两个氨基酸的侧链之间或一个氨基酸的侧链与另一个氨基酸的胺或羧基基团之间的共价键。交联可以在一个肽内或在两个单独的肽之间形成。在一些实施方案中,本文提供的工程化多肽包括肽内和肽间交联二者的混合物。在一些实施方案中,所述交联是氨基酸侧链的两个硫醇基团之间的二硫键,如两个半胱氨酸之间的二硫键。在一些实施方案中,所述交联是两个氨基酸的胺基团与羧酸基团之间的酰胺键,其中所述胺基团与所述羧酸基团中的至少一个位于氨基酸的
侧链上(例如,所述酰胺键不是骨架酰胺键)。在一些实施方案中,所述交联是在二氨基庚二酸与天冬氨酸之间形成的酰胺键。在一些实施方案中,酰胺交联是内酰胺。在一些实施方案中,所述交联是肟。在一些实施方案中,所述交联是腙。在一些实施方案中,交联包含氨基酸的侧链与另一个氨基酸的部分之间的共价键,其中所述侧链和所述部分中之一或二者被修饰以形成所述共价键。此类修饰可以包括例如氧化、还原、与催化剂反应以形成中间体、或本领域技术人员已知的其他修饰。
[0164]
接头包括例如共价键合至肽的至少两个位点或在至少两个肽之间的分子。接头可以键合至一个肽内的两个位点或两个单独的肽之间,或二者的组合。例如,包含多于两个肽附接位点的接头可以形成肽内和肽间键二者。在包含至少两个肽和至少一个接头的工程化多肽中,所述肽和接头可以以多种不同的构型连接。例如,工程化多肽可以具有肽

接头



等分布,以肽结束。在一些实施方案中,工程化多肽包含形成分支点的接头,例如独立地附接至三个肽的接头。在一些实施方案中,工程化多肽包含具有三个肽附接位点的接头,其中所述接头仅附接至两个肽。
[0165]
在一些实施方案中,接头包含一个或多个氨基酸。在一些实施方案中,形成接头的一部分的氨基酸可以与所述工程化多肽分开鉴定。在某些实施方案中,所述接头是这样的区域,其以结构、化学和/或动力学方式隔开和呈现所述工程化多肽的肽,所述结构、化学和/或动力学方式反映了所述界面蛋白的功能界面的结构和/或功能。在仍其他实施方案中,当不与工程化多肽的肽连接时,所述接头本身不具有功能,例如不展现出与cd25的结合配偶体的结合。在一些实施方案中,每个接头独立地包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、或更多个氨基酸。在一些实施方案中,每个接头独立地包含一个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、或六个氨基酸。在一些实施方案中,形成接头的一部分的氨基酸可以是天然存在的氨基酸或非天然存在的氨基酸。在一些实施方案中,每个接头可以独立地包含一个或多个α

氨基酸、一个或多个β

氨基酸、或一个或多个γ

氨基酸、或其任何组合。在某些实施方案中,接头独立地包含环状β残基。环状β残基可以包括例如apc或acpc。在仍其他实施方案中,接头可以包含一个或多个甘氨酸残基、一个或多个丝氨酸残基、或一个或多个脯氨酸残基。在一些实施方案中,接头具有选自ap、gp、gsg、(ggggs)n、(gsg)n、gggsggggs、ggggsgggs、(pgsg)n和pgsgsg的氨基酸序列,其中n是在1与10之间的整数。在一些实施方案中,所述工程化多肽包含至少一个接头,其中每个接头不包含氨基酸,或其中每个接头不包含天然氨基酸,或其中每个接头包含至少一个非天然氨基酸。
[0166]
在一些实施方案中,接头包含聚合物。在一些实施方案中,所述聚合物是聚乙二醇(peg)。包含peg的接头可以包含例如至少3个peg单体单元、至少4个peg单体单元、至少5个peg单体单元、至少6个peg单体单元、至少7个peg单体单元、至少8个peg单体单元、至少9个peg单体单元、至少10个peg单体单元、至少11个peg单体单元、至少12个peg单体单元、或大于12个peg单体单元。在包含peg的接头的一些实施方案中,所述peg包含在3至12个之间的单体单元、在3至6个之间的单体单元、在6至12个之间的单体单元、或在4至8个之间的单体单元。在一些实施方案中,所述工程化多肽包含至少一个接头,所述接头包含peg3(包含3个单体单元)、peg6、或peg12。在一些实施方案中,至少一个接头独立地是peg3、peg6、或peg12。在其他实施方案中,所述接头包含多臂peg。例如,在某些实施方案中,至少一个接头
独立地包含4臂peg或8臂peg。在某些实施方案中,每个臂独立地包含在3至12个之间的单体单元、或在3至6个之间的单体单元、或在6至12个之间的单体单元、或在4至8个之间的单体单元。在某些实施方案中,所述多臂peg的每个臂包含相同数量的单体单元,例如4臂或8臂peg,其中每个臂包含3个单体单元、6个单体单元、或12个单体单元。
[0167]
在其他实施方案中,接头包含树状大分子。树状大分子包括例如具有树状分支架构的分子,其包括对称核心,分子部分从该对称核心径向延伸,且分支点在所述分子中形成新的层。每个新的分支点都会引入一个新的更大的层,并且这些径向延伸通常在树状大分子的外末端表面终止于官能团。因此,增加分支点的数量转而会放大可能存在于表面的末端官能团的数量。
[0168]
在一些实施方案中,至少一个接头包含不是氨基酸或聚合物的小分子。在一些实施方案中,至少一个接头包含苯二氮卓。在一些实施方案中,所述接头包含作为巯基

马来酰亚胺反应的产物的部分,其可以是吡咯烷二酮部分(例如吡咯烷

2,5

二酮部分)。在一些实施方案中,所述接头包含脒部分。在一些实施方案中,所述接头包含硫醚部分。
[0169]
在一些实施方案中,至少一个接头包含反式

吡咯烷

3,4

二甲酰胺。
[0170]
在一些实施方案中,其中所述工程化多肽包含至少两个接头(例如,在其中所述工程化多肽包含至少两个连接部分、其中每个连接部分独立地是接头或交联、或其中每个连接部分独立地是接头的实施方案中),每个接头独立地是本文所述的任何接头。例如,在一些实施方案中,每个接头独立地是包含一个或多个氨基酸的接头、包含聚合物的接头、包含树状大分子的接头、或包含不是氨基酸或聚合物的小分子的接头。
[0171]
所述工程化多肽的一个或多个连接部分可以赋予特定的目的结构或功能特征或其组合。例如,在一些实施方案中,连接部分存在于所述工程化多肽中以赋予结构特征或功能特征或其组合。此类结构特征可以包括例如增加的结构柔性、减小的结构柔性、方向特征、增加的长度、或减小的长度。可能关注的方向特征可以包括例如结构转角或保持线性结构。功能特征可以包括例如增加的溶解度、一个或多个质子化位点、一个或多个蛋白水解位点、一个或多个酶促修饰位点、一个或多个氧化位点、标记、或捕获柄。在一些实施方案中,接头包含一个或多个功能特征、或一个或多个结构特征、或其组合。
[0172]
在一些实施方案中,一个或多个接头独立地将结构“转角”引入所述工程化多肽中。这种接头的例子包括gly

pro、ala

pro和反式

吡咯烷

3,4

二甲酰胺。在一些实施方案中,与不存在接头或选择不同接头相比,存在于所述工程化多肽中的一个或多个接头增加了所述工程化多肽的结构柔性。例如,在一些实施方案中,与在不存在接头的情况下或在使用另一种接头代替的情况下相比,比另一种接头更长和/或更少空间受阻的接头可以导致所述分子具有更大的结构柔性。在其他实施方案中,一个或多个连接部分独立地减小所述工程化多肽中的结构柔性,所述一个或多个连接部分如包括比另一种接头更短和/或更多空间受阻的接头、或在降低一个或多个肽的柔性的位置处的交联或降低一个或多个肽的柔性的交联类型。与所述交联在不同位置处或在不同侧链之间(例如,二硫化物或酰胺交联)的情况下或者在不存在交联的情况下相比,在某些肽之间或某些氨基酸侧链之间的特定位置处存在的交联可能导致所述分子具有更小的结构柔性。d.另外的组分
[0173]
在一些实施方案中,本文提供的工程化多肽包含一个或多个另外的组分。例如,在
一些实施方案中,所述工程化多肽包含一个或多个部分,所述一个或多个部分将所述工程化多肽附接至固体表面,如珠或平坦表面。在一些实施方案中,所述附接部分包括聚合物(如peg)或生物素或其组合。在一些实施方案中,将所述工程化多肽附接至固体表面可以例如使得能够评估所述工程化多肽的一个或多个特征,如评估与cd25的结合配偶体(例如,针对cd25的抗体)的结合。e.序列相似性
[0174]
在一些实施方案中,本文提供的工程化多肽具有表1中列出的序列之一:表1
[0175]
在一些实施方案中,所述工程化多肽与seq id no:1

21中的任一个具有至少60%序列相似性。在一些实施方案中,所述工程化多肽与seq id no:1

21中的任一个具有至少70%序列相似性。在一些实施方案中,所述工程化多肽与seq id no:1

21中的任一个具有至少80%序列相似性。在一些实施方案中,所述工程化多肽与seq id no:1

21中的任一个具有至少90%序列相似性。在一些实施方案中,所述工程化多肽与seq id no:1

21中的任一个具有至少95%序列相似性。在一些实施方案中,所述工程化多肽包含seq id no:1

21中的任一个。在某些实施方案中,所述工程化多肽具有seq id no:1

21中的任一个。
[0176]
在一些实施方案中,所述工程化多肽包含seq id no:1

21中的任一个;并且在n末端或c末端或二者处进行修饰。例如,在一些实施方案中,所述c末端或所述n末端共价键合至另一个分子。在仍其他实施方案中,所述工程化多肽包含seq id no:1

21中的任一个;以及在n末端或c末端或二者处的一个或多个氨基酸。
[0177]
在一些实施方案中,所述n末端分子是生物素

peg2:
[0178]
在一些实施方案中,所述c末端分子是接头,接着是生物素(例如

gsgsgk

生物素)。适合于将生物素附接至所述工程化多肽的c末端的其他接头包括gsg、gss、ggs、ggsggs、gssgss、gsgk、gssk、ggsk、ggsggsk、gssgssk等。v.选择工程化多肽的方法
[0179]
本文还提供了选择如本文所述的工程化多肽的方法。此类方法可以包括例如使用
工程化多肽结构特征的迭代优化。
[0180]
在一些实施方案中,cd25的一个或多个节段被鉴定为靶标界面。在一些实施方案中,所鉴定的一个或多个节段的至少一部分与cd25的抗体结合。因此,例如,在一些实施方案中,作为对于一种或多种抗体的表位的cd25的一部分被鉴定为靶标界面。在其他实施方案中,cd25的节段被鉴定为不与抗体结合的靶标界面,或者未知是否发生抗体结合的靶标界面。在某些实施方案中,cd25的至少一部分的晶体结构是未知的,并且靶标界面的初始选择包括cd25和cd25结合的分子动力学模拟。在一些实施方案中,从所鉴定的一个或多个节段获得一个或多个初始输入序列,其中每个序列独立地是连续或非连续的。在开发工程化多肽候选物时,每个序列的至少一些界面残基被保留,并且一个或多个连接部分被掺入序列中以提供所需的结构和动力学特征。在一些实施方案中,将一个或多个非界面残基添加至序列中,或者用一个或多个非界面残基替代所述输入序列中的一个或多个残基,以实现相对于同源靶标结构和动力学的所需的结构和动力学特征。在一些实施方案中,这些非界面残基不是来自cd25的靶标界面,或者不与cd25的靶标界面共有一个或多个特征,或者与所保留的界面残基相比,与cd25的靶标界面共有更少的特征和/或不太强烈地共有特征。在一些实施方案中,这些中间的非界面残基可以形成氨基酸接头的部分或全部。
[0181]
接下来,在一些实施方案中,产生初始设计(或多个设计)并且模拟分子动力学以确定设计的柔性和总体稳定性。如果该初始设计不满足rmsd要求,则在一些实施方案中,其可以使用计算诱变对一个或多个连接部分(如一个或多个交联,或中间接头残基)进行迭代优化。在该优化过程中,在一些实施方案中,在改变、或去除、或添加一个或多个连接部分的同时,所述界面残基被固定。可以重复所述迭代优化,直到相对于靶标界面的工程化多肽rmsd界面残基位置和结构顺序度量满足特定要求(例如,分别为和≥0.25,其中结构顺序在0

1归一化尺度上,其中1=完美的结构稳定性)。
[0182]
在一些实施方案中,所述中间的结构稳定性残基区域可以在1

50个氨基酸的长度范围内。在某些实施方案中,这些中间的结构稳定性残基区域是接头,例如氨基酸接头。在一些实施方案中,通过本文提供的方法的某些实施方案产生的工程化多肽的相对较小大小(与例如将界面移植到大的结构稳定支架上的方法相比)可以实现分子的化学合成,与可能需要体外表达系统的较大分子形成对照。此外,在一些实施方案中,本文提供的方法能够将非天然氨基酸掺入中间位置或界面位置,这可以允许精细控制用新的部分和特性(如翻译后修饰、溶解度、细胞通透性、酶反应性、ph敏感性、氧化敏感性等)进行的界面工程化。在仍其他实施方案中,当工程化多肽用作免疫原或表位诱饵时,可以选择在所选择的抗体中具有物种交叉反应性或疾病相关突变反应性的较高可能性的工程化多肽。
[0183]
在一些实施方案中,优化的分子是本文提供的工程化多肽。在其他实施方案中,优化的分子是候选工程化多肽,其可以经历进一步评价、进一步调整或用于产生肽文库或候选工程化多肽文库或其任何组合。在某些实施方案中,所述方法还包括使用所述工程化多肽候选物产生肽文库或工程化多肽候选物文库,然后使所述文库与cd25的结合配偶体(如针对cd25的抗体)接触。所述肽文库可以包括例如如下肽,其小于工程化多肽候选物并且与工程化多肽候选物共有至少一些序列相似性,并且其中任选地用其他残基替代某些残基。工程化多肽候选物文库可以包括例如所述工程化多肽候选物的变体。
[0184]
在一些实施方案中,所述肽文库的肽包含在2至15个之间的氨基酸、在5至15个之
间的氨基酸、在10至15个之间的氨基酸、在2至10个之间的氨基酸、或在5至10个之间的氨基酸。在一些实施方案中,所述文库的每个肽中的氨基酸总数包括界面氨基酸和结构氨基酸二者,其可以包括例如接头氨基酸。所述工程化多肽候选物文库可以通过例如改变候选物中的一个或多个氨基酸或连接部分以形成新的文库成员来制备。在一些实施方案中,所述工程化多肽候选物文库中的工程化多肽候选物独立地包含在5至40个之间的氨基酸、在10至35个之间的氨基酸、在15至35个之间的氨基酸、或在20至30个之间的氨基酸。在一些实施方案中,在所述候选物文库的每个工程化多肽候选物中的氨基酸总数可以包括界面氨基酸和结构氨基酸二者,其可以包括例如接头氨基酸。在一些实施方案中,所述肽文库和所述工程化多肽候选物文库可以独立地包含在5,000与100,000个之间的成员、在5,000与80,000个之间的成员、在5,000与60,000个之间的成员、在5,000与40,000个之间的成员、在5,000与30,000个之间的成员、在10,000与25,000个之间的成员、在15,000与20,000个之间的成员、或约17,000个成员(例如,不同的肽或不同的工程化多肽候选物)。在一些实施方案中,产生和评价多个单独的文库。在某些实施方案中,所述文库成员不包含某些交联。例如,在一些实施方案中,评价文库,其中所述文库成员不具有二硫化物交联。
[0185]
在一些实施方案中,为了产生候选物文库的候选物,在原始工程化多肽候选物的设计中添加或去除一个或多个连接部分或改变其位置。例如,在一些实施方案中,去除或添加二硫化物交联,或移动其位置。在其他实施方案中,去除或添加内酰胺交联,或移动其位置。在一些实施方案中,一个或多个氨基酸残基被替代。cd25结合配偶体与所述肽文库或工程化多肽候选物文库或二者(如果存在的话)的结合可以提供另外的信息,所述另外的信息可以用于进一步完善所述工程化多肽的设计,或用于选择工程化多肽。例如,从筛选这些文库得到的另外的信息可以用于改变所述工程化多肽,例如以增加与cd25的结合配偶体的结合亲和力。在一些实施方案中,所述工程化多肽候选物文库可以提供关于某些接头部分(如包括二硫键和内酰胺的交联)对结合相互作用(包括此类部分的存在或位置)的影响的另外的信息。在一些实施方案中,所述肽或工程化多肽候选物文库或二者可以用于鉴定可增加对于cd25的结合配偶体的结合亲和力或结合特异性或提供其他所需特征的共有基序(例如,氨基酸分布或连接部分或其组合)。对同源结合配偶体与所述肽或工程化多肽候选物文库或二者的成员的结合的评价可以提供另外的结构和功能信息,其可以用于进一步完善所述工程化多肽设计或选择工程化多肽候选物。a.通过在可变ph下结合进行选择
[0186]
在一些实施方案中,至少部分地基于在生理ph下的结构柔性与较低ph下的结构柔性的比较来选择工程化多肽。例如,cd25可以在肿瘤细胞上过表达,因此在一些实施方案中,可能需要抗体在肿瘤微环境中以更大亲和力与cd25结合。因此,在一些实施方案中,可能期望选择如下工程化多肽,与在生理ph下相同工程化多肽相比,所述工程化多肽在较低ph下刚性更大,或者其中一个或多个氨基酸在较低ph下具有特定取向,或者在较低ph下具有更大的结合亲和力或结合选择性。在许多癌性肿瘤中,癌细胞的生长速度可以超过部分肿瘤中可用的氧气供应的速度,从而导致肿瘤内的低氧微环境。组织中的氧气水平可以影响组织环境的ph,并且低氧水平可以导致ph降低(包括例如通过厌氧糖酵解产生的酸性代谢物的积累所致)。因此,在一些实施方案中,选择在低ph下具有更大结合(例如,具有期望的导致结合相互作用的结构特征)但在生理ph下具有降低的结合(例如,减小的、更少的、或
没有期望的导致结合相互作用的结构特征)的工程化多肽可以导致这样的工程化多肽,与不在肿瘤中的结合相比,所述工程化多肽可以产生与肿瘤中的所需靶标具有更大结合的抗体。生理ph通常在约7.35与约7.45之间,例如约7.4。肿瘤微环境的ph可以是例如小于约7.45、小于约7.45、在约7.45与约6.0之间、在约7.0与约6.0之间、在约6.8与约6.2之间、在约6.7与约6.3之间、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9、或约7.0。在一些实施方案中,可以使用计算方法(例如,分子动力学模拟)在不同的ph下评价工程化多肽。在其他实施方案中,使用体外方法基于不同的ph特征选择工程化多肽。合适的体外方法可以包括例如在不同的ph下进行噬菌体淘选。例如,抗体噬菌体展示文库可以用于在生理ph下淘选一种或多种工程化多肽,并且可以丢弃在该ph下结合的噬菌体。然后,可以在较低ph下进行第二回合的淘选,并且可以选择在较低ph下与所述一种或多种工程化多肽结合的噬菌体。在一些实施方案中,在较低ph下不与噬菌体结合或在较低ph和生理ph下以相似亲和力与噬菌体结合的工程化多肽可能不太被期望用于产生靶向肿瘤细胞的抗体。b.相反肽评价
[0187]
在仍其他实施方案中,选择工程化多肽可以包括将工程化多肽的结合与相反工程化多肽的结合进行比较。相反工程化多肽可以基于工程化多肽,但是用展现出相反特征的氨基酸替代一个或多个界面相互作用的氨基酸残基(例如,基于cd25的表面)。例如,具有大的、空间体积庞大的疏水性侧链的氨基酸可以被具有较小侧链或亲水性侧链或既较小又亲水性的侧链的氨基酸替代。在一些实施方案中,具有氢键供给侧链的氨基酸可以被具有氢键接受侧链的氨基酸替代,或者被具有不含氢键的侧链的氨基酸替代。在一些实施方案中,可使用所述工程化多肽和所述相反工程化多肽进行比较的结合特征可以包括特异性和/或亲和力。在一些实施方案中,将工程化多肽的结合特性与相反工程化多肽的结合特性进行比较可能有助于如下选择工程化多肽,在所述工程化多肽中界面相互作用的氨基酸驱动结合相互作用,而不是连接部分(如接头)的特征驱动结合相互作用。在一些实施方案中,其中通过连接部分(如接头)驱动结合的工程化多肽可能不太理想,因为它们可能展现出脱靶结合或其他不期望的结合特征。
[0188]
在其他实施方案中,所述方法还包括修饰所选择的工程化多肽。c.结合评价
[0189]
如本文所述,在一些实施方案中,选择本文提供的工程化多肽的方法包括评价工程化多肽候选物与蛋白质或其片段(例如cd25的结合配偶体,如针对cd25的抗体)的结合。例如,在一些实施方案中,针对与cd25的结合配偶体的结合来筛选工程化多肽候选物文库或肽文库。
[0190]
可以以各种方式评价蛋白质或其片段(例如,cd25的结合配偶体)与一种或多种肽或工程化多肽候选物(如文库的成员)的结合。在一些实施方案中,例如通过直接检测所述蛋白质或其片段上的标记直接评价结合。此类标记可以包括例如荧光标记,如荧光团或荧光蛋白。在其他实施方案中,例如使用夹心测定间接评价结合。在夹心测定中,肽或工程化多肽候选物(如文库的成员)与结合配偶体结合,然后添加二级标记试剂以标记结合的结合配偶体。然后检测到该二级标记试剂。夹心测定组分的例子包括用抗his标签抗体或his标签特异性荧光探针检测的his标记的结合配偶体;用标记的链霉亲和素或标记的亲和素检测的生物素标记的结合配偶体;或用抗结合配偶体抗体检测的未标记的结合配偶体。
[0191]
在一些实施方案中,使用任意数量的可用检测方法基于结合信号或剂量反应来鉴定目的肽或工程化多肽候选物。这些检测方法可以包括例如成像、荧光激活细胞分选(facs)、质谱法或生物传感器。在一些实施方案中,定义了命中阈值(例如,中值信号),并且具有高于该信号的任一种都被标记为推定的命中基序。
[0192]
为了组合文库的开发,在一些实施方案中,可以使用序列或结构信息或其组合将基于与所述蛋白质或其片段的结合而从所述肽文库鉴定的肽进一步聚类成不同的组。例如,可以使用通常可用的序列比对、化学描述符、结构预测和熵预测信息学工具(例如,muscle、clustalw、psipred、amber、hydropathy calculator和isoelectric point calculator)和聚类算法(例如,k

means、gibbs和hierarchical)进行这种分组。可以从该分析中鉴定肽命中中存在的基序(例如,结构或功能基序)簇。也可以鉴定单独肽基序命中。在一些实施方案中,使用这些基序簇和单独基序,可以制定设计规则,其定义显现出驱动靶标界面处的蛋白质相互作用的基序的序列、结构和化学特征中的一个或多个。在一些实施方案中,靶标界面的结构对于鉴定这些界面基序设计规则不是必需的。相反,在一些实施方案中,所述设计规则可以从对通过筛选肽文库鉴定的肽的分析而得出。
[0193]
在一些实施方案中,所述结合测定具有约105的灵敏度动力学范围。因此,在一些实施方案中,如果工程化多肽候选物与cd25结合配偶体具有在天然cd25:结合配偶体信号的105信号等级内的结合事件,则所述工程化多肽候选物被鉴定为目的工程化多肽。信号的类型可以不同,这取决于正在使用的测定类型或如何评价它。例如,在一些实施方案中,所述信号是传感图中的响应单位、基于图像的读出中的荧光信号、或基于酶的测定中的酶的读出。对于结合事件的信号可以是相对于cd25:结合配偶体信号来测量的。
[0194]
在一些实施方案中,所述工程化多肽候选物在评价结合之前进行修饰。例如,在一些实施方案中,生物素、peg或另一个附接部分或其组合键合至所述肽的c末端或n末端,以使其能够与结合评价系统一起使用。例如,在一些实施方案中,将生物素

peg12

共价附接至所述工程化多肽的n末端。在其他实施方案中,所述工程化多肽候选物在c末端用

gsgsgk

peg4

生物素修饰。在某些实施方案中,这种生物素修饰的工程化多肽候选物随后通过生物素部分与链霉亲和素珠结合,并且评价珠支持的免疫原与cd25的结合配偶体的结合。vi.工程化多肽和cd25抗体的使用
[0195]
本文提供的和通过本文提供的方法鉴定的工程化多肽可以用于例如产生与cd25特异性结合的一种或多种抗体。在一些实施方案中,所述抗体是单克隆或多克隆抗体。
[0196]
如本文所用,术语“抗体”是指源自免疫球蛋白分子的蛋白质或多肽序列,其与抗原特异性地结合。抗体可以是多克隆或单克隆来源的完整免疫球蛋白或其片段,并且可以源自天然或重组来源。
[0197]
术语“抗体片段”或“抗体结合结构域”是指抗体或其重组变体的至少一部分,所述至少一部分含有抗原结合结构域(即完整抗体的抗原决定可变区),所述抗原结合结构域足以赋予抗体片段对靶标(如抗原及其定义的表位)的识别和特异性结合。抗体片段的例子包括但不限于fab、fab

、f(ab

)2和fv片段、单链(sc)fv(“scfv”)抗体片段、线性抗体、单结构域抗体(缩写为“sdab”)(vl或vh)、骆驼vhh结构域、以及由抗体片段形成的多特异性抗体。
[0198]
术语“scfv”是指包含含有轻链可变区的至少一个抗体片段和含有重链可变区的
至少一个抗体片段的融合蛋白,其中所述轻链可变区和重链可变区经由短柔性多肽接头连续地连接,并且能够表示为单个多肽链,并且其中scfv保留衍生其的完整抗体的特异性。
[0199]
关于抗体的“重链可变区”或“vh”(或者在单结构域抗体,例如纳米抗体的情况下,为“vhh”)是指重链的片段,其含有在称为框架区的侧翼延伸段之间的三个cdr,这些框架区通常比cdr更高度保守,并形成支持cdr的支架。
[0200]
除非具体说明,否则如本文所用,scfv可以具有例如关于多肽的n末端和c末端的任何顺序的vl和vh可变区,所述scfv可以包含vl

接头

vh或可以包含vh

接头

vl。
[0201]
术语“抗体轻链”是指抗体分子中以其天然存在的构象存在于抗体分子中的两种类型的多肽链中的较小者。kappa(“k”)。
[0202]
因此,在一些实施方案中,本文提供了通过用免疫原对动物进行免疫而产生的抗体,其中所述免疫原是如本文提供的工程化多肽。在一些实施方案中,所述动物是人、兔子、小鼠、仓鼠、猴子等。在某些实施方案中,所述猴子是食蟹猴、猕猴或恒河猴。用工程化多肽对动物免疫可以包括例如向动物施用至少一剂包含所述免疫原和任选佐剂的组合物。在一些实施方案中,从动物产生抗体包括分离表达所述抗体的b细胞。一些实施方案还包括将b细胞与骨髓瘤细胞融合以产生表达所述抗体的杂交瘤。在一些实施方案中,使用所述工程化多肽产生的抗体可以与人和猴子(例如食蟹猴)交叉反应。
[0203]
在某些实施方案中,所述产生抗体的方法还包括确定对于所述抗体的一个或多个表位。在一些实施方案中,所述方法包括通过以下方式针对与两个或更多个表位的结合来筛选所述抗体:例如通过使表位文库与所述抗体接触,以及评价所述抗体与所述文库的表位的结合。在某些实施方案中,丢弃与两个或更多个表位结合的抗体。在一些实施方案中,所述工程化多肽模拟cd25的一个表位。在其他实施方案中,所述工程化多肽模拟cd25的两个或更多个表位。在某些实施方案中,针对与两个或更多个表位(其中所述工程化多肽模拟cd25的两个或更多个表位)的结合来筛选抗体包括:使表位文库与所述抗体接触,以及评价所述抗体与所述文库的表位的结合,以及丢弃与两个或更多个表位结合的一种或多种抗体,其中所述表位不是由所述工程化多肽模拟的那些。
[0204]
在一些实施方案中,使用如本文提供的工程化多肽产生的抗体与cd25特异性地结合。在某些实施方案中,当所述抗体与cd25结合时,所述抗体不阻断il

2与cd25的结合。
[0205]
在一些实施方案中,所述抗体是非il

2阻断抗体(非il

2阻断剂),即所述抗体与cd25的结合不破坏或阻止il

2配体与cd25(il

2α链)的结合,并且不影响il

2介导的信号转导,例如,通过il

2/jak3/stat

5信号传导途径的信号传导。在一些实施方案中,所述抗体不破坏il

2配体与cd25(il

2α链)的结合,并且与7g7b6抗体所结合的表位不同的表位结合。在一些实施方案中,所述抗体不破坏il

2配体与cd25(il

2α链)的结合,但破坏il

2受体的β、γ和α链(cd25)的三聚化。
[0206]
在一些实施方案中,所述抗体是il

2阻断抗体,例如所述抗体破坏或阻止il

2配体与所述受体的α、β和/或γ链的结合,并减少或抑制il

2介导的信号转导。在某些实施方案中,所述抗体破坏或阻止il

2配体与cd25的结合。在一些实施方案中,所述抗体破坏或阻止il

2配体与cd25的结合,并与达利珠单抗或巴利昔单抗所结合的表位不同的表位结合。
[0207]
在一些实施方案中,所述cd25抗体是部分阻断抗体,并且部分但不完全破坏il

2配体与il

2受体的α(cd25)、β和/或γ链的结合,和/或部分但不完全减少il

2介导的信号
转导。
[0208]
在一些实施方案中,所述抗体破坏或阻止α、β和γil

2链的异三聚化。在一些实施方案中,所述抗体不阻断il

2配体与cd25的结合,但破坏或阻止α、β和γil

2r链的异三聚化。在某些实施方案中,所述抗体与treg细胞选择性地结合。在其他实施方案中,所述抗体与teff细胞选择性地结合。
[0209]
在仍其他实施方案中,评价了使用如本文提供的工程化多肽产生的抗体是否阻断cd25与il

2的结合。在一些实施方案中,选择不阻断cd25与il

2结合的抗体。在其他实施方案中,选择阻断cd25与il

2结合的抗体。可以通过以下方式来评价这种阻断或非阻断:例如通过将cd25偶联至生物传感器尖端,并在存在和不存在il

2的情况下评价所述抗体的结合。在一些实施方案中,所述抗体与6xhis标签一起表达,所述6xhis标签可以在流式细胞术中与ni

nta一起使用以评价所述抗体的结合以及il

2与cd25结合的阻断或非阻断。在某些实施方案中,在生理ph(例如,在约ph 7.3与约ph 7.5之间,或约ph 7.4)下以及也在肿瘤微环境的ph(例如,在约ph 6.4与约ph6.6之间,或约ph 6.5)下评价所述抗体的结合。在某些实施方案中,阻断/非阻断活性是与il

2阻断剂抗体(例如,达利珠单抗或巴利昔单抗)的结合比较的。在某些实施方案中,阻断/非阻断活性是与il

2非阻断剂抗体(例如,抗体7g7b6)的结合比较的。在某些实施方案中,阻断/非阻断活性是与il

2阻断剂抗体和il

2非阻断剂抗体二者比较的。
[0210]
在一些实施方案中,所述抗体是针对cd25的激动剂抗体。在其他实施方案中,所述抗体是针对cd25的拮抗剂抗体。
[0211]
在一些实施方案中,所述抗体与呈反式取向的cd25结合。在其他实施方案中,所述抗体与呈顺式取向的cd25结合。在仍其他实施方案中,所述抗体能够与呈顺式或反式构型的cd25结合。
[0212]
抗体克隆来源可以通过所示的id(例如表2中的克隆id)来鉴定。例如,所述抗体可以包含如表2的第1行所示的抗体克隆“yu389

a01”的重链互补决定区。
[0213]
在一些实施方案中,所述抗体具有cdr

h1、cdr

h2、cdr

h3、cdr

l1、cdr

l2和cdr

l3,每一个独立地选自表2中公开的那些。表2
[0214]
在一些实施方案中,所述cdr

h1选自:ggtfssya、ggsissggyy、gftfssyg、gytftsyy、gytftsyg、gytftdyy、ggsissggys、ggsisssnw、gysftsyw、gftfsnyg、gftfsssa、gftfssyw、gfifsrha、gytfnnyg、gftfssya、gytfttya、gftfnnaw、gftfssye、gysfttyw、gysfntyw、gftfrryw、gysfstyw、gfafssyg、gykfanyw、gytfknfg、gftfssys、gdsissssyy和ggsisrsnw;
[0215]
在一些实施方案中,所述cdr

h2选自:iipifgta、iipifgta、iyysgst、isydgsnk、inpsggst、isayngnt、impifdta、vdpedget、iyhsgst、iypgdsdt、ishdghvk、ikqdgsek、isvyngdi、intntgdp、iksktdggtt、isssgsti、issrgsti、iypsdsdt、isgrkgnt、isssssyi、inhsgst、iyhtgst和isydgnnk;
[0216]
在一些实施方案中,所述cdr

h3选自:aremyyyygmdv、aremyyyygmdv、argnlwsgyyf、akellegafdi、ardrvtmvrgalay、arersyygmdv、aswserigyqygldv、ardilgldy、atedtamggidy、ategrygmdv、aveggrapgtyyydssglay、aragyyygmdv、ardlgtmvrgviepyyfdy、argvrgtgfdp、ardrngyfqh、akdllgelsffdy、arlennwdyggwfdp、ardrsyygmdv、ardkgyygmdv、akeisprssvgwpldy、ardfwsgynelggmdv、artwfgeffdy、arviggwfdp、argrlaygdtegfdy、ardilrgessildh、ardryyygmdv、ardllgsgydiidy、arvwgkngdfdy、ardrfhygmdv、ardrgdy、ttegvellsfggapfdy、arrrgggfdy、arekgswfdp、ardrgdrvgglvfdy、arqvaggldy、ardrgyygmdv、frfgegfdy、ardggyyfdd、ardfrmdv、ardayaygldv、ardlmnygmdv、areydygdyvfdy、arlennwnyggwfdp、ardyyyygmdv、ardigyyygmdv、arvgdgysldy、akaitsiepy、akgqgdgmdv、arlgwgmdv、arvwgdttlgygmdv、aipwdaelgnygmdv、argrwsglgdy、ararggryfdy、ardqlaarrgyyygmdv、akgdvnygmdv、ardfyygsgsypngyyygmdv、ardfnpfsitifemdv、anlamgqyfdy、ardlgeaksssphepdy、ardqemyyfdy、argkgsyafdi和
akgyssspgdy;
[0217]
在一些实施方案中,所述cdr

l1选自:qsissy、qsissy、ssnignnf、qsisny、nietks、klgdky、qsvsny、qtisqw、ssnigsny、nfnignnl、rniwsy、qsissw、qsvssr、qtisgl、diesem、nigsks、qsigny、qgissw、qsvssty、qdisny、nieses、ssdvgayny、qdinny、qgisns、ssnignny、egirts、qgtssw、ssdvggyny、qsvsnny、qginsy、qavrid、qsisry、qsigyw、ssnvgsny、qsikny、qdikrr、sgsiassy、nsnvgnny、slrsyy、klgerf、sgsvstsyy、ssnigrny、edirmy、qgisty、ssnvgsrt、nigtks、nigskt、qsinsy、ssnigsnt、qsiity、qsllhsdgkty和ggniarny。
[0218]
在一些实施方案中,所述cdr

l2选自:aas、aas、dst、ddd、kdn、gas、kas、rnn、snn、and、daf、dds、aat、avs、das、gvs、dnn、dvs、ras、gts、edn、dnd、gkn、qyi、ntd、rnh、egs、dgr、tas、ddt、evs和edd。
[0219]
在一些实施方案中,所述cdr

l3选自:qqsystppt、qqsystppt、gswdtnlsgyv、qvwdsssghrev、qawdsstyv、qqynhwppl、qqysgdsmyt、aawddslsgvv、aawddslngvv、atwddslsgvv、qqshstpit、qqynsysrt、qqytnwpqt、lqydrysga、qvwhttndhvl、qvwdsssdhwv、qqskqipyt、qqsyslplt、qqfdisggli、qqydnlplt、qvwdsssdhtva、ssytttdtfv、qqydnlpyt、qqyystpph、qqsystplt、qvwdsssdhvv、gtwdsslsayv、qqthtwpwt、qqansfplt、qqsystpyt、ssytssstyv、qrygsspr、qqvhsfpft、lqhntfpyt、qqshstplt、qqynsypft、qqynssplmyt、qqtystplt、qqantfpqt、qsydgssvv、gswearesvfv、qqtyndppt、nsrdssgnhvv、qtwdgsivv、vlymgsgiwv、atwddalsgwv、ssytssstlvv、qqsystpwt、ssytssstwv、lqdynyppa、qqyyddpq、qqlngyptt、aawddslighv、qvwdtsgdlhwa、qqsyttplt、qvwdsssdllwv、gtwdsslsalv、aawddslngpv、mqtkqlplt、qqansfppt、qsydgnnhmv和ssytssstlwv。
[0220]
在一些实施方案中,所述抗体具有cdr

h1、cdr

h2、cdr

h3、cdr

l1、cdr

l2和cdr

l3,每一个独立地选自表3a和表3b中公开的那些。可以将来自不同抗体的cdr以任何组合进行组合从而产生新抗体。基因合成和高通量筛选技术使技术人员能够在无需进行过多的实验的情况下测试六个cdr的所有组合。表3a
表3b
[0221]
在一些实施方案中,所述抗体具有表4中提供的任何一种组合的六个cdr。表4
[0222]
在一些实施方案中,所述抗体是选自表5的scfv,或具有源自表5中的scfv的抗原结合结构域的任何抗体。在实施方案中,从表5中的scfv序列提取全长重链和轻链可变区,并将其用于产生可溶性fab片段、单克隆抗体、双特异性抗体、或本领域已知的任何其他类型的抗体。在表5中的scfv是vh:vl scfv的情况下,可以反转重链和轻链的顺序从而产生vl:vh scfv。在表5中的scfv是vl:vh scfv的情况下,可以反转重链和轻链的顺序从而产生
vh:vl scfv。表5
[0223]
在一些实施方案中,所述抗体具有cdr

h1、cdr

h2、cdr

h3、cdr

l1、cdr

l2和cdr

l3,每一个独立地选自表14a和表14b中公开的那些。在一些实施方案中,所述抗体具有cdr

h1、cdr

h2、cdr

h3、cdr

l1、cdr

l2和cdr

l3,每一个独立地选自表14a和表14b中列出的任一种克隆。在一些实施方案中,所述抗体具有cdr

h1、cdr

h2、cdr

h3、cdr

l1、cdr

l2和cdr

l3,每一个独立地选自表15a和表15b中以组的形式公开的那些。本公开文本提供了如下抗体,其具有来自单独克隆的cdr或来自将任一个cdr与任何其他五个cdr匹配。表14a和表14b中鉴定的抗体源自小鼠噬菌体展示文库。可以使用已知的方法将这些cdr转化为人源化或嵌合抗体。vii.cd25抗体的用途
[0224]
在一些实施方案中,本文提供的cd25抗体可用于治疗剂,例如以用于增殖性疾病或障碍(如癌症)或用于自身免疫性疾病中。
[0225]
因此,本文提供了治疗癌症的方法,所述方法包括向有需要的受试者施用治疗有效量的治疗性cd25抗体。在一些实施方案中,所述癌症是原发性癌症。在一些实施方案中,所述癌症是转移性癌症。在一些实施方案中,所述癌症涉及实体瘤;在其他实施方案中,所述癌症涉及液体肿瘤,例如基于血液的癌症。在示例性实施方案中,所述cd25抗体是非il

2阻断抗体。
[0226]
因此,本文提供了治疗自身免疫相关的疾病或障碍的方法,所述方法包括向有需要的受试者施用治疗有效量的治疗性cd25抗体。在示例性实施方案中,所述cd25抗体是非il

2阻断抗体。
[0227]
如本文所用,受试者是指被分类为哺乳动物的任何动物,包括人、家畜和农场动物,以及动物园、体育或宠物动物,如狗、马、兔子、牛、猪、仓鼠、沙鼠、小鼠、雪貂、大鼠、猫等。受试者可以是雄性或雌性。
[0228]
本文提供的任何治疗性cd25抗体的施用可以与其他已知药物/治疗(例如小分子药物或生物制剂)组合施用。所述施用可以是依序的或并行的。
[0229]
本文所述的治疗性cd25抗体的体内施用可以通过静脉内、瘤内、颅内、病灶内(例如病灶内注射、直接接触扩散)、腔内(腹膜内、胸膜内、子宫内、直肠内)、腹膜内、肌肉内、皮下、局部、口服、透皮、通过植入、通过吸入、鞘内、心室内或鼻内来进行。在一个示例性实施例中,所述施用途径是通过静脉内注射。
[0230]
通常将施用治疗有效量的治疗性抗体。所述治疗性抗体的适当剂量可以基于疾病的严重程度、受试者的临床病症、受试者的临床病史和对治疗的反应以及主治医师的判断来确定。viii.诊断用途
[0231]
本文提供的cd25抗体可以用于诊断和检测目的。根据应用,可以在体内或体外检测和定量所述cd25抗体。
[0232]
本文提供的cd25抗体可适用于多种免疫测定。这些免疫测定包括但不限于酶联免疫吸附测定(elisa)、蛋白质印迹、放射免疫测定(ria)、流式细胞术、放射免疫测定、免疫荧光测定、分光光度法、射线照相术、电泳、高效液相色谱法(hplc)或薄层色谱法(tlc)。
[0233]
本文提供的cd25抗体可以包含可检测标记,例如通过光谱学、光化学、生物化学、免疫化学、荧光、电、光学或化学方法可检测的标记。本发明中有用的标记包括但不限于荧光染料、放射性标记、酶、比色标记、亲和素或生物素。
[0234]
在一些实施方案中,将所述cd25抗体用同位素进行放射性标记,所述同位素可用于通过核医学设备(spect、pet或闪烁法)成像。viii.药物组合物
[0235]
本公开文本提供了包含治疗性cd25抗体的组合物,在一些实施方案中,所述组合物是无菌的。所述药物组合物通常包含在药学上可接受的赋形剂中的有效量的所述治疗性抗体。ix.试剂盒和制品
[0236]
本公开文本还提供了包含例如用于治疗或诊断用途的本文所述的任何cd25抗体的试剂盒。在一些实施方案中,该试剂盒进一步含有选自以下中的任一种的组分:二级抗体、用于免疫组织化学分析的试剂、药学上可接受的赋形剂和说明书及其任何组合。在一些实施方案中,所述试剂盒包含本文所述治疗性组合物中的一种或多种,以及一种或多种药学上可接受的赋形剂。
[0237]
本技术还提供了包含本文所述治疗性或诊断组合物或试剂盒中的任一种的制品。制品的例子包括小瓶(例如密封小瓶)。
[0238]
本文提供的描述阐述了许多示例性构型、方法、参数等。然而,应认识到,这样的描述并不旨在作为对本公开文本的范围的限制,而是旨在作为示例性实施方案的描述而提供。实施例
[0239]
以下实施例仅是说明性的,并不意味着以任何方式限制本公开文本的任何方面。实施例1:共有cd25的特征的工程化免疫原的开发
[0240]
获得cd25的晶体结构。对于cd25可获得的许多晶体结构缺少蛋白质的移动环节段。进行了分子动力学模拟,以获得对该移动环以及cd25与il

2的结合相互作用的更好理解。
[0241]
选择cd25的不同节段作为开发工程化免疫原的输入。这些区域中的一些示于图34b和图34c中。这些输入与rosetta程序一起使用,以改善界面残基的总体期望结构和动力学特性。在衍生界面残基的天然cd25的情境下,该过程改变了区段的结构(非界面)部分,以稳定和重演结构、构象、动力学和界面残基的其他特性。还分析了正在开发的区段的稳定性
和柔性,并在需要改变这些参数时调整所述序列。例如,可以通过添加一个或多个氨基酸来延伸n或c末端,以添加所需的特性。还使用在不同氨基酸残基的侧链之间的二硫键形成评价了交联对工程化免疫原候选物的影响。在设计工程化的每个阶段:氨基酸添加、交联和结构残基优化,rosetta程序的天然评分和能量函数用于定量地评价许多设计候选物中的每一个。那些具有最佳rosetta能量的候选物将进入随后的设计阶段,并最终通过分子动力学模拟进行评价和验证。除了在生理ph(例如,约ph 7.4)下评价这些参数之外,在一些情况下还在肿瘤微环境ph(例如,约ph 6.5)下评价参数。
[0242]
使用分子动力学(md)模拟对不同设计进行排名的定量度量包括与cd25的相似性,通过rmsd进行评价;以及候选物的结构柔性。图33a和图33b显示了对于使用图32中所示的输入节段(对于图33a,为左箭头;对于图33b,为右箭头)开发的示例性工程化免疫原在生理ph下的稳定性与rmsd的示例性比较。图33c是对于图33b的示例性免疫原在肿瘤微环境ph下的稳定性与rmsd的示例性比较。下面呈现了代表性的评分算法。f
i
=系综的分数k
max
=相似性截断值
[0243]
使用与参考结构进行rms比对后在md系综中每个肽构象与参考结构的原子坐标之间的均方根偏差(rmsd)计算结构相似性。使用计算设计的工程化免疫原候选物结构作为参考结构或通过使用实验表征的(例如,x射线晶体结构)结构作为参考来计算所述rmsd。在这些模拟中,将候选物的功能界面残基(在一些模拟中)和包括候选物的结构残基在内的所有残基(在其他模拟中)与参考进行了比较。
[0244]
将通过md采样的构象系综聚类分成基于rmsd而在结构上彼此相似的组(簇)。无序被评价为所述md系综中如下构象的分数,所述构象由于结构上与所述系综中的所有其他构象不相似(例如,高rmsd)而不能分组至相似构象的簇。因此,与替代候选物相比更无序的工程化免疫原候选物更具柔性。有序被评价为所述md系综中如下构象的分数,所述构象被分组至相似构象(低rmsd)的簇。当与替代候选物相比,其构象系综的较高分数落入较少的簇中时,与替代候选物相比,更有序的工程化免疫原候选物的柔性更小。
[0245]
使用rmsd将由工程化免疫原候选物构成的簇与参考结构进行比较。如果簇的rmsd低于4埃的阈值,则认为所述簇是有序的(例如,低柔性)并且类似于所述参考(结构相似性)。预测高分数的其系综满足该低柔性和高结构相似性标准的工程化免疫原候选物比低分数的其系综满足该低柔性和高结构相似性标准的替代候选物更具活性。
[0246]
将该定量分析与有关生物物理学、生物学和物理化学相互作用的md轨迹的定性分析相结合,并用于选择给定的免疫原候选物进行体外评价。下面的表6列出了如上所述制备的十一种工程化免疫原。表6.工程化免疫原
实施例2:工程化免疫原的体外评价
[0247]
使用针对cd25的抗体评价实施例1中制备的工程化免疫原的结合。用

gsgsgk

生物素基团在c末端修饰工程化免疫原,然后将其单独地与链霉亲和素包被的生物传感器尖端结合。含有cd25抗体的缓冲液在300秒的缔合阶段期间流过尖端,然后将流过的溶液换成不含cd25抗体的缓冲液,并且将测量从生物传感器尖端的解离。还运行了对照,其中尖端最初没有任何工程化免疫原或蛋白质结合,以评价cd25抗体与尖端的任何背景结合。进行了第二个对照,其中全长cd25被生物素化并与生物传感器尖端结合,以证明cd25抗体与全长cd25的结合水平。从这些生物传感器实验获得的数据用于对工程化免疫原的结合进行定性排名。实施例3:用噬菌体淘选评价工程化免疫原
[0248]
使用噬菌体淘选技术来评价本文提供的工程化免疫原。
[0249]
通过在tg1中电穿孔转化小鼠hucd25免疫的噬菌体文库,并使用标准噬菌体展示方案通过添加cm13繁殖噬菌体。分泌噬菌体的tg1培养物在冰上孵育一小时后用peg/nacl进行peg沉淀。可以使用的示例性文库包括7807、7808、7809和7810。
[0250]
肿瘤微环境(tme)ph消减选择:噬菌体淘选是在生理ph和tme ph下进行的。为了耗尽在生理ph下以高亲和力与全长cd25结合的抗体,消减淘选首先是通过如下方式进行的:通过在用pbst(ph 7.4)中的10ug/ml全长cd25(400nm)包被的elisa板上吸收1小时,在ph 7.4下对3x10^11pfu噬菌体(3x 10^8的1000倍表示)进行反选择。收集所得噬菌体上清液并用pbst将ph调节至ph 6.5。随后的噬菌体淘选选择是在ph 6.5下进行的。
[0251]
孵育一小时后,用25微升不含抗原的链霉亲和素dynabeads预先清除淘选选择物。然后将噬菌体添加至新的预封闭的eppendorf lobind管中。以100nm浓度添加生物素化的工程化免疫原(如实施例1中所述的那些)(在一些情况下,添加另外的500mm nacl以减少免
疫原与噬菌体的非特异性结合),持续40min至一小时。然后将样品与25微升链霉亲和素珠或链霉亲和素包被的板在rt下孵育一小时。使用磁铁/磁珠或用板将样品沉淀并洗涤,用pbst洗涤7

10次。更换试管两次以去除残留的噬菌体。
[0252]
为了洗脱噬菌体,将50

800μl甘氨酸(ph 2.2)分别添加至珠和板中,并孵育不超过十分钟,然后用高ph tris 9.0中和。将洗脱的噬菌体添加至新鲜生长的1

5ml tg1(od600为约0.5)中,孵育20

30分钟。
[0253]
将分次对数稀释系列铺板,并将剩余物转移至25ml 2x yt。保存1ml甘油原液用于随后的淘选回合,并在约0.5的od600下添加辅助噬菌体/iptg。
[0254]
再次进行在ph 6.5下针对工程化免疫原的选择与在ph 7.4下的反选择。随后使用噬菌体elisa和octet筛选来评价周质提取物。
[0255]
为了确保fab噬菌体除了结合工程化免疫原之外还结合全长cd25,可以任选地进行使用全长cd25的最终选择,其中全长cd25代替工程化免疫原(针对工程化免疫原的2个回合选择,然后针对全长cd25的1个回合选择)。
[0256]
为了用全长cd25进行选择,在用25微升链霉亲和素dynabeads预先清除淘选选择物并将噬菌体添加至新的预封闭的eppendorf lobind管中之后,以100nm浓度添加生物素化的全长cd25,持续一小时。然后将样品与25微升链霉亲和素珠在rt下孵育一小时。如上所述,遵循沉淀、洗涤和洗脱步骤。实施例4:噬菌体elisa方案和生物传感器/octet筛选
[0257]
elisa/提取物制备:进行噬菌体elisa和周质提取物制备,以用于fab octet筛选。
[0258]
将cd25抗原稀释,添加至elisa平板孔中,并孵育。孵育后,将孔用pbs洗涤两次,然后通过添加bsa封闭,接着在25℃下孵育2小时。将噬菌体在1xpbst 1.0%bsa(ph 6.5)中稀释两倍,每孔添加50微升,并在室温下孵育5分钟。将封闭溶液从孔中摇出,并将50μl的稀释噬菌体制剂添加至每个孔中,并在室温下孵育1小时。将elisa板孔用200微升pbst(ph 6.5)洗涤3

5次。将hrp缀合的抗m13抗体用1xpbst 1.0%bsa(ph 6.5)稀释(abcam,ab50370)1:5000。将50微升稀释的二抗缀合物添加至每个孔中,并在室温下孵育1小时。将elisa板孔用200微升pbst(ph 6.5)洗涤3

5次。如所述将ecl lumo底物(例如超信号elisa pico化学发光底物)制备成1:1混合物。将50微升底物溶液添加至每个孔中,在室温下孵育5至60分钟,然后读数。
[0259]
将菌落接种在具有0.1ml过夜培养物(在96孔板中的1ml培养物或在14ml falcon管中的4ml培养物)的0.03

4ml 2xyt 0.2%葡萄糖中。将它们在37℃下以250

700rpm孵育直到od600为约0.5

1.0。用50

400μl 0.025

0.1m iptg诱导培养物。在一些情况下,温度降低至30℃且以250rpm摇动。然后将它们孵育过夜。通过以3400rcf沉淀10

15分钟收获1

4ml培养物。丢弃上清液。将培养物用50

75μl ppb缓冲液(30mm tris

hcl,ph 8.0,1mm edta,20%蔗糖)与1x halt蛋白酶抑制剂重悬,并在摇摆平台上在室温下孵育15分钟或在4℃下孵育10min。然后,将培养物用150

225μl冷ddh20与1x halt蛋白酶抑制剂重悬,并在摇摆平台上在室温下孵育一小时或在4℃下孵育1

2小时。将裂解悬浮液在4℃下以15000rcf旋转10

15min。收集上清液并稀释。
[0260]
fab表达和纯化方案:将细胞培养物接种,过夜生长,然后用50μl 25mm

1m iptg诱导。将温度降低至30℃,并将rpm降低至150。孵育是过夜进行的。通过以3400rcf沉淀15分钟
收获50ml培养物或板。丢弃上清液。将来自50ml培养物的细胞沉淀物放置在

80℃冰箱中1小时,而在板中生长的培养物中添加了75μl ppb与无edta的1x halt蛋白酶抑制剂(thermo fisher scientific)并涡旋。板在4℃下以1000rpm摇动10分钟。将225ul体积的冷水与无edta的1x halt蛋白酶抑制剂(thermo fisher scientific)添加至每个孔中。将样品混合并在4℃下以最大速度即1000rpm摇动1

2小时。将板在4℃下以3500rpm旋转10min。将上清液(ppe)转移至新的板中,并在

20℃下储存。从冰箱取出来自50ml培养物的细胞沉淀物,并添加5ml pbs、10mm咪唑与2.5mg/ml溶菌酶和无edta的1x halt蛋白酶抑制剂(thermo fisher scientific)。沉淀物在室温下解冻30分钟后,将裂解物以3400rcf离心15分钟。取出上清液并丢弃沉淀物。添加500μl ni

nta树脂(预洗涤并沉淀)或使用ni

nta旋转柱进行fab纯化。用清除的裂解物孵育30min

1h。这是以1500rcf进行旋转。将这些用1ml pbs、10mm咪唑洗涤5次。每次旋转后都丢弃缓冲液。添加1ml pbs、200mm咪唑并混合、孵育30分钟,并以1500rcf旋转15分钟。在确定蛋白质浓度后,将洗脱的蛋白质在4℃或20℃下储存。zeba柱用于脱盐/缓冲液更换。
[0261]
octet/生物传感器筛选:对于在原始上清液中的octet koff速率筛选,在384孔pall fortebio octet板中使用50μl裂解物。在octet red 384(md fortebio)上收集数据。简而言之,人cd25偶联至ar2g尖端(1ug/ml)。为了收集数据,在pbst 1%bsa缓冲液中评估基线60秒。然后将尖端移动至50μl裂解物并测量缔合300秒。最后,将尖端移动至pbst 1%bsa缓冲液。然后用200mm tris

甘氨酸(ph 2.5)再生尖端,并用pbst 1%bsa中和。为了进行数据分析,在octet ht 11.0软件上进行双重参考(尖端上没有cd25以及空白参考孔)以用于参考消减。实施例5:从免疫原产生的抗体的评价
[0262]
通过用本文所述的工程化免疫原对小鼠进行免疫来产生抗体。评价这些抗体的交叉反应性、交叉阻断、亲和力和解离速率估计。
[0263]
通过生物传感器(octet red 384,pall forte bio)进行交叉反应性确定的方案:该方案用于确定单独测试克隆(抗人cd25小鼠单克隆)结合来自人、食蟹猴和小鼠物种的靶标(抗原)的能力。靶蛋白经由伯胺共价偶联至葡聚糖包被的传感器尖端或通过在抗6x

his单克隆抗体包被的传感器尖端上亲和捕获6x

his标记的靶蛋白进行偶联。将溶液中的单克隆上清液与生物传感器尖端上的抗原结合。净结合信号是减去了空白介质或缓冲液与空白或抗原包被的尖端结合的相应信号的结合信号。信号>3倍背景结合被视为真正的结合事件。
[0264]
通过生物传感器进行交叉阻断的方案:该方法是确定单独测试克隆(抗人cd25小鼠单克隆)是否能够交叉阻断对照抗体。交叉阻断可能表明测试克隆识别与对照抗体的相应表位重叠的表位。另外,这可能意味着测试抗体可以具有与对照抗体相似的功能特性。对于该方案,对照抗体经由伯胺共价偶联至葡聚糖包被的传感器尖端。将溶液中的靶抗原与对照抗体结合。在该步骤之后,将溶液中的测试抗体以夹心形式与抗原结合。如果测试抗体可以与抗原结合,则表明它不会交叉阻断对照抗体,而不结合可以被解释为交叉阻断对照抗体的能力。
[0265]
通过生物传感器进行亲和力确定的方案:该方法用于确定当已知测试抗体的浓度时单独测试克隆与抗原的亲和力。将捕获分子(如蛋白g或抗小鼠igg单克隆或抗人igg单克
隆)包被在生物传感器尖端上。测试克隆被捕获在捕获分子包被的表面上。对于这些测试克隆,使溶液中的抗原缔合并解离一定的时间段,缔合阶段在60至600秒的范围内且解离阶段在60至1800秒的范围内。然后使用1:1朗缪尔模型或2:1非均匀模型拟合结果数据(或“传感图”)。前者假定相互作用对是均匀的,如果用于拟合数据的2:1模型导致更好的拟合,则表明由于固有的不均匀性,克隆需要进一步的亚克隆。数据曲线拟合提供作为缔合和解离速率常数的比率的解离常数。
[0266]
通过生物传感器进行解离速率估计的方案:该方法用于当未知抗体浓度或测试克隆需要进一步亚克隆时估计测试克隆的解离速率常数。将捕获分子(如蛋白g或抗小鼠igg单克隆或抗人igg单克隆)包被在生物传感器尖端上。测试克隆被捕获在捕获分子包被的表面上。对于这些测试克隆,使溶液中的抗原缔合并解离一定的时间段,缔合阶段在60至600秒的范围内且解离阶段在60至1800秒的范围内。然后使用1:1朗缪尔模型或2:1非均匀模型拟合结果数据(或“传感图”)。前者假定相互作用对是均匀的,如果用于拟合数据的2:1模型导致更好的拟合,则表明由于固有的不均匀性,克隆需要进一步的亚克隆。数据仅适用于解离速率常数,而不适用于缔合速率(或缔合)速率常数。这提供了解离速率常数的估计值,其可用于对测试克隆进行排序。实施例6:使用cd25部分作为参考靶标进行的工程化多肽的选择
[0267]
从蛋白质数据库(pdb)(pdb id no:2erj,链a)检索cd25的序列和三维(3d)结构:elcdddppeiphatfkamaykegtmlnceckrgfrriksgslymlctgssshsswdnqcqctssatrsttkqvtpqpeeqkerkttemqspmqpvdqaslpghcrepppweneateriyhfvvgqmvyyqcvqgyralhrgpaesvckmthgktrwtqpqlictg
[0268]
如图6所示,cd25的推定治疗性表位被鉴定为工程化多肽选择的参考靶标。关于seq id no:1的残基位置和表位序列提供于表7中。表7
[0269]
确定了原子距离和氨基酸描述符拓扑结构。使用动力学模拟获得了参考靶标的原子距离和氨基酸描述符拓扑结构,并对于参考靶标中的表位产生了原子波动的协方差矩阵。接下来,使用计算蛋白质设计(例如,rosetta)产生了不同的工程化多肽候选物,对候选物进行动力学模拟,并确定原子距离和氨基酸描述符拓扑结构。对于参考靶表位以及对于候选物中对应于参考靶标的表位中残基的残基产生了原子波动的协方差矩阵。
[0270]
进行主成分分析以计算每个协方差矩阵的特征向量和特征值

每个参考靶标的一个协方差矩阵和每个候选物的一个协方差

并且仅保留具有最大特征值的那些特征向量。特征向量描述了在模拟的分子结构集合中观察到的最多、第二多、第三多、第n多的主导运动。如果候选物像参考表位一样移动,则其特征向量将与参考靶标(表位)的特征向量相似。特征向量的相似性对应于所比对的其分量(以每个ca原子为中心的3d向量)指向相同的方向。使用两个特征向量的内积来计算候选物与参考靶标特征向量之间的这种相似性。如果两个特征向量彼此成90度,则内积值为0;如果两个特征向量精确地指向同一方向,则内积值为1。
[0271]
因为特征向量的排序是基于它们的特征值,并且由于分子动力学模拟对那些不同分子的潜在能量图景进行采样的随机性质而导致两个不同分子之间的特征值可能不一定相同,所以需要多个不同排名的特征向量之间的内积(例如,候选物的特征向量1乘参考靶标的特征向量2、3、4等)。另外,不希望受到任何理论束缚,分子运动是复杂的,并且可能涉
及多于一种(或多于几种)的主导/主要运动模式。
[0272]
为了解决这两个挑战,计算了候选物和参考靶标中所有特征向量对之间的内积。这产生了内积矩阵,其维度由所分析的特征向量的数量确定,对于10个特征向量,内积矩阵为10乘10。该内积矩阵通过计算内积的均方根值而被提取为单个值。这是均方根内积(rmsip)。
[0273]
主成分分析(pca)将3lx3l维坐标协方差矩阵(l是原子数)简化为特征向量φ(参考靶标)和ψ(mem)以及特征值λ的集合。集合φ含有参考靶标的n个特征向量,并且集合ψ含有mem的n个特征向量ψ
j
,其中特征向量在其各自的集合中按其相关特征值排序。特征值最大的特征向量占总坐标协方差(covariation)的最大分数。计算每个和ψ
j
特征向量的内积,以比较参考靶标与mem之间的运动相似性。和ψ
j
特征向量的所有内积组合的均方根赋予了工程化多肽候选物(mem)与参考靶标(rmsip)的运动的总体相似性。
[0274]
如图7所示,在每个工程化多肽中,表位残基(金色)和通过添加支架残基(灰色)而在3d空间中的位置是通过该计算设计程序来选择的。关于pdb id no:2erj,链a的残基位置和表位序列提供于表8和表9中。交联位置是指每个mem序列中预期发生的细胞内二硫键形成。表8
*生物素

peg2=生物素

聚乙二醇(2)
表9实施例7:使用mem编程的体外选择进行的抗体选择
[0275]
策划了三十二种不同的淘选策略(s1

s32),每种策略包括三个回合的阳性选择
(表10)。每个程序使用至少一种工程化多肽作为选择分子。使用常规方法(cd25作为阳性靶标)的常规选择也被包括在内。牛血清白蛋白(bsa)用作针对非特异性结合的阴性靶标。
[0276]
淘选方案从人天然scfv文库开始,并在溶液中进行淘选,选择分子与生物素结合(但仍在溶液中)。对于每个回合,首先将起始池与阴性选择分子(bsa)在溶液中组合,然后将链霉亲和素包被的底物(例如,磁珠)施加至混合物以结合阴性选择分子。因此,池中与阴性选择分子结合的任何噬菌体也与链霉亲和素包被的支持物结合。去除剩余的溶液,然后将该流动进入阳性选择步骤。将流动与阳性选择分子(抗原1)组合,使其结合,然后将链霉亲和素包被的固体底物施加至混合物。在该步骤中,保留结合的噬菌体,同时去除其余未结合的噬菌体。然后洗脱结合的噬菌体。使用30分钟培育用洗脱的噬菌体转染大肠杆菌(e.coli),将转染的细胞分离以进行下一代测序和dna分离以供分析,然后扩增噬菌体以用于随后的淘选回合。对于每个淘选程序,在每个回合中,首先进行阴性选择,其次进行阳性选择。表10
主elisa筛选和命中选择
[0277]
对于每种策略选择384个克隆用于在三个回合的淘选后对全长cd25的elisa反应
分析(图9)。数据显示为按表位排序的分类策略(图6)。每个表位的至少一种策略产生了能够与cd25结合的克隆。观察到使用相同工程化多肽的不同策略富集了不同的高亲和力克隆子集(图10,黑色条)。如表11所示,与常规的全长淘选相比,大多数mem编程的选择策略更有效地产生抗cd25命中。表11策略cd25表位抗hu cd25命中率%s16865.0s2159.0s12651.0s6446.0s10530.0s33全长cd2519.0s4317.0s14716.0
[0278]
选择了1475个命中进行进一步表征,因为它们满足elisa中的两个标准之一:1)全长cd25 elisa中>10:1的信噪比(s/n);或2)mem elisa中>3:1的s/n和cd25 elisa中>5:1的s/n。通过生物层干涉法进行验证性测试
[0279]
使用单循环动力学测定设计在octet red384
tm
生物层干涉法仪器上评价了不同scfv抗体的亲和力。将his标记的scfv固定在抗his生物传感器(his1k)上。将全长cd25分析物冲刷传感器尖端,并记录分析物中分子与scfv的结合。每个测定都一式两份地运行。还仅使用缓冲液(以对照传感器漂移)和从人血清纯化的多克隆igg同种型抗体的单独对照(以对照非特异性igg结合)来运行对照。
[0280]
如图11所示,通过噬菌体展示淘选鉴定了1475个抗cd25 scfv的生物层干涉法。显示1433个命中(97%)被确认为结合cd25。观察到的命中的k
d
范围为10

200nm,且中值k
d
为28.5nm。如图11所示,大多数筛选策略产生了对cd25具有高亲和力的scfv。仅显示了k
off
小于10
‑3/s的scfv。在y轴上给出了近似k
d
值。如图12所示,大多数淘选策略导致至少一个命中,其k
off
小于10
‑3/s。通过流式细胞术进行验证性测试
[0281]
使用表达cd25[cd25(+)]或不表达cd25[cd25(

)]的细胞在流式细胞仪上评价不同scfv抗体的cd25特异性。如图13所示,在该测定中分析的1248个scfv命中中,1160个(93%)与cd25(+)细胞特异性地结合。命中的序列分析
[0282]
对每个回合淘选的噬菌体进行下一代测序。如图15所示,mem操纵的淘选以策略依赖性方式聚焦了抗体文库的cdr多样性。每个回合的选择减少了库多样性(图16),并将cdr长度聚焦至对于每个mem的优选长度(图17)。
[0283]
使用桑格测序方法对单独scfv进行测序。表5提供了对于每个scfv的完整蛋白质序列。表12和表2分别提供了免疫球蛋白基因使用和互补决定区。表12
[0284]
对cdr和种系使用的分析表明,测序的1475个scfv代表至少126个不同的克隆。所述集合包括40种不同的vh+jh框架选择和35种vl+jl框架选择。独特的cdr序列包括:
[0285]
施加至针对单独靶表位的scfv的序列分析鉴定了每个抗体集合内常见的cdr使用分布:
[0286]
对于cd25表位1(55

63),使用的cdr包括:
cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3gftfssygisydgsnkakgdvnygmdvnigsksddtqvwdsssdllwv
ꢀꢀꢀ
nigsktdgrqvwdtsgdlhwa isydgnnkakgyssspgdyssdvgaynydvsssytssstlwvggtfssyaiipifgtaardfnpfsitifemdvssnignnydnngtwdsslsalvggsisssnwiyhsgstardfyygsgsypngyyygmdvqsinsytasqqsyttpltgysfntywiypsdsdtardggyyfddqsvsstygtsqqynssplmytggtfssyaiipifgtaardyyyygmdvqsisrygasqqtyndppt
ꢀꢀ
aremyyyygmdvqsissyaasqqsystppt
ꢀꢀꢀ
qsisny
ꢀꢀꢀꢀꢀ
qsiity
ꢀꢀꢀꢀꢀ
qsissy
ꢀꢀ
ggsisrsnwiyhtgstargkgsyafdiggniarnyeddqsydgnnhmv
[0287]
对于cd25表位2(13

20:127

132),使用的cdr包括:
cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3gftfssygisydgsnkanlamgqyfdyssnigsntsnnaawddslngpvgftfssya ardlgeaksssphepdyqsllhsdgktyevsmqtkqlpltgdsissssyyinhsgstardqemyyfdyqgisswaasqqansfpptggtfssyaiipifgtaaremyyyygmdvqsissyaasqqsystppt
[0288]
对于cd25表位3(5

17),使用的cdr包括:cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3gftfssygisydgsnkakaitsiepysgsvstsyyntdvlymgsgiwvgftfssygisydgsnkakellegafdinietksdddqvwdsssghrevggtfssyaiipifgtaaremyyyygmdvqsissyaasqqsystppt
ꢀꢀꢀ
qsisny
ꢀꢀ
[0289]
对于cd25表位4(5

11:156

163),使用的cdr包括:cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3ggtfssyaiipifgtaaremyyyygmdvqsisnyaasqqsystpptgytftsygisayngntarersyygmdvqsvsnygasqqynhwppl
[0290]
对于cd25表位5(77

89),使用的cdr包括:cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3gftfssygisydgsnkakellegafdinietksdddqvwdsssghrevgytftsyyinpsggstardrvtmvrgalayklgdkykdnqawdsstyv
[0291]
对于cd25表位6(147

157),使用的cdr包括:
cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3gftfssygisydgsnkakgqgdgmdvssnvgsrtsnnaawddslighvggsissggysiyhsgstaragyyygmdvrniwsygasqqshstpitgytftsygisayngntardigyyygmdvslrsyygknnsrdssgnhvvgytftsyyinpsggstardilgldyssnigsnyrnnaawddslsgvv
ggtfssyaiipifgtaaremyyyygmdvqsissyaasqqsystppt
ꢀꢀꢀ
qsisny
ꢀꢀ
gftfssywikqdgsekareydygdyvfdynsnvgnnydndgswearesvfvgysftsywiypgdsdtarlennwdyggwfdpnigsksddsqvwdsssdhwv iypgdsdt
ꢀꢀꢀꢀ
gytftdyyvdpedgetatedtamggidyssnigsnysnnaawddslngvv
ꢀꢀ
ategrygmdvnfnignnlandatwddslsgvv
ꢀꢀ
aveggrapgtyyydssglayssnigsnysnn [0292]
对于cd25表位7(11

14),使用的cdr包括:cdr

h1cdr

h2cdr

h3cdr

l1cdr

l2cdr

l3ggtfssyaiipifgtaaremyyyygmdvqsissyaasqqsystppt
[0293]
对于cd25表位8(44

56),使用的cdr包括:
实施例8:通过竞争性结合确认表位特异性
[0294]
将126个抗cd25克隆用四个靶标竞争性结合测定进行表位拆分,如图18所描绘。图中所示的对于il

2、达利珠单抗和巴利昔单抗的结合位点是基于x射线晶体结构测定。对于7g7b6的结合位点是基于肽定位。
[0295]
交叉竞争测定以经典的夹心形式进行,包括将第一抗体固定至生物传感器上,接着与抗原一起孵育,然后是第二夹心抗体。his标记的scfv被表达并使用his标签从上清液捕获而在生物传感器上原位纯化。通过监测尖端加载反应直到在所有scfv测量中一致的水平,将生物传感器his标签捕获在scfv克隆之间归一化。scfv各自被单独地捕获至抗his生物传感器(fortebio his1k)。在运行缓冲液中进行基线测量。然后cd25被捕获至抗体。最后添加各种竞争性分析物中的每一种,包括il

2、7g7b6、巴利昔单抗或达利珠单抗。只有当竞争性分析物的结合表位不与固定化scfv的结合表位重叠时,竞争性分析物才能结合捕获的cd25。
[0296]
如图19所示,全长cd25淘选克隆以il

2界面表位为主。大多数克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。
[0297]
如图20所示,147

157表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被达利珠单抗阻断,但不被il

2、巴利昔单抗或7g7b6阻断。
[0298]
如图21所示,6

17表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。
[0299]
如图22所示,13

20:127

132表位mem操纵的克隆主要在预期的表位处结合。大多数克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。
[0300]
如图23所示,44

56表位mem操纵的克隆主要在预期的表位处结合。所述克隆分为两个概况。在概况1中,克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。在概况2中,克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。
[0301]
如图24所示,55

63表位mem操纵的克隆主要在预期的表位处结合。所述克隆分为三个概况。在概况1中,克隆被7g7b6阻断,但不被il

2、达利珠单抗或巴利昔单抗阻断。在概况2中,克隆被il

2、达利珠单抗和巴利昔单抗阻断,但不被7g7b6阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。在概况3中,克隆被il

2和7g7b6阻断,但不被达利珠单抗或巴利昔单抗阻断。这些阻断概况表明从不同的接近角度与预期的表位结合。实施例9:通过丙氨酸诱变定位功能表位
[0302]
设计丙氨酸突变以批准或拒绝mem操纵的克隆将预期的表位分组(图25)。丙氨酸诱变被选择为用于将抗体分组的正交方法,因为它对功能表位起作用,而不是对竞争测定所定义的结构表位起作用。选择对各种表面可及的残基对进行诱变。计算机建模用于确认选择用于这些测定的丙氨酸突变不会影响整体或局部稳定性。例如,图26显示了对145

157表位内的丙氨酸突变建模的结果。对于每个突变体和野生型:使用晶体结构作为参考,对于8个不同的起始apo

cd25构型中每一个的明确溶剂中来自3个独立的100ns md模拟的rmsd。如图27

图29所示,cd25的丙氨酸突变体形式分别对巴利昔单抗、达利珠单抗和7g7b6具有结合反应。
[0303]
如所预期的,关于对于cd25的预期部分的特异性,来自用147

157表位靶向的工程化多肽体外选择的结合scfv命中是一致的。
[0304]
针对四个丙氨酸突变对测试来自筛选活动的117个scfv中的每一个(图31)。观察到功能性表位多样性。mem操纵的命中具有明显的表位内丙氨酸取代位置敏感性。实施例10:免疫球蛋白g(igg1)形式的抗体的验证性测试
[0305]
选择了三十种抗体作为全长免疫球蛋白进行另外的测试。将重链和轻链序列克隆至人免疫球蛋白g(igg1)形式中并表达和纯化。如表13所示通过评估与cd25的结合。表13:人igg1克隆选择/表位详情和生物物理学测量
实施例11:淘选小鼠抗体序列的偏向文库
[0306]
从用全长cd25免疫的小鼠的免疫球蛋白基因产生噬菌体展示文库。针对所示的工程化多肽对偏向于cd25结合抗体的该文库进行淘选,从而产生表14a和表14b所示的互补决定区序列。
[0307]
序列分析表明,这些抗体源自克隆谱系,其可以如表15a和表15b所示进行分组。表15a
表15b
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1