从头抗体设计的制作方法

文档序号:15307474发布日期:2018-08-31 21:14阅读:258来源:国知局

靶向正确的表位是选择单克隆抗体以实现所需作用机制的关键步骤。目前用于发现用于治疗和诊断用途的新型抗体的方法依赖于在经免疫的动物中产生针对靶蛋白的抗体,或使用展示技术体外筛选未经免疫或免疫的文库。这两种方法都不能完全控制亲和力、特异性、表位和结合模式。

sormanni等(sormanni,p.,aprile,f.a.,vendruscolo,m.rationaldesignofantibodiestargetingspecificepitopeswithinintrinsicallydisorderedproteins.proc.natl.acad.sci.usa.112,9902-9907(2015)),robinson等(robinson,l.n.,etal.structure-guideddesignofananti-dengueantibodydirectedtoanon-immunodominantepitope.cell162,493-504(2015)),lippow等(lippow,s.m.,wittrup,k.d.&tidor,b.computationaldesignofantibody-affinityimprovementbeyondinvivomaturation.nat.biotechnol.25,1171-1176(2007))以及kuroda等(kuroda,d.,shirai,h.,jacobson,m.p.&nakamura,h.computer-aidedantibodydesign.proteineng.des.sel.,25,507-521(2012))已显示在尝试合理地工程化抗体方面取得了一些成功,而且靶向靶蛋白上预先选择的表位的抗体的计算设计仍然是一个具有挑战性的问题。

计算抗体设计使得能够合理地工程化抗体以通过对界面cdr序列空间进行计算机扫描来增强亲和力和稳定性(参见lippow等(上文)和jordan等(jordan,a.l.等structuralunderstandingofstabilizationpatternsinengineeredbispecificig-likeantibodymolecules.proteins77,832-841(2009)))。一般抗体设计方法如optmaven(li,t.,pantazes,r.j.,maranas,c.d.optmaven—anewframeworkforthedenovodesignofantibodyvariableregionmodelstargetingspecificantigenepitopes.plosone.9,e105954(2014))和abdesign(lapidoth,g.d.etal.abdesign:analgorithmforcombinatorialbackbonedesignguidedbynaturalconformationsandsequences.proteins83,1385-1406(2015))的最近发展是基于蛋白质-蛋白质对接来对人造抗体支架的可能结合姿态进行取样,随后生成组合主链构型和序列空间扫描。然而,如果没有到目前为止从这些方法实验验证设计抗体的最终证明,靶向精确表位的高亲和力抗体的计算设计仍然是在很大程度上未解决的问题。用于设计在预先选择的表位上以高亲和力结合的抗体的计算方法的发展将具有广泛的应用,诸如实现作用的表位依赖性机制以及获得通常为生物学相关的保守的正构位点的免疫盲点。

本发明的一个目的是提供用于抗体的计算设计的替代构架。

根据本发明的一个方面,提供了设计将与靶表位结合的抗体的计算机实现的方法,其包括:a)鉴定一个或多个热点残基,所述热点残基将各自与靶表位上的一个或多个热点位点中的相应的一个位点结合,每个热点残基包含含有一个或多个热点子结构特征性原子的热点子结构;b)从抗体结构的数据库中选择一个或多个候选抗体结构,每个候选抗体结构具有一个或多个匹配残基,每个匹配残基均包含含有一个或多个匹配残基子结构特征性原子的匹配残基子结构,其中这样进行所述选择,使得当与靶表位结合时,抗体结构内的匹配残基子结构特征性原子的相对位置和热点子结构特征性原子的相对位置是可将至少三个匹配残基子结构特征性原子在计算上叠加在相应的至少三个热点子结构特征性原子上,其中在所有对上平均的每对叠加的特征性原子之间的空间偏差小于预定阈值;和c)通过修饰所述候选抗体结构之一来产生设计的抗体,所述修饰包括用不同的残基替换至少一个匹配残基,使得所述设计的抗体与所述靶表位之间的预测的亲和力高于所述候选抗体结构与靶表位之间的预测的亲和力,或者在其中每个匹配残基已经是与所述匹配残基匹配的热点残基相同的氨基酸的残基的情况下,将候选抗体结构之一输出为设计的抗体结构。

本发明人已证明基于上述构架有可能设计在天然存在的蛋白质结合部位处结合(其由预先鉴定的热点介导的相互作用引导)的新型抗体。该新颖的计算方法使得有可能基于结构合理设计用于治疗和诊断应用的具有结合模式精确控制的新型抗体。

所设计的抗体的结合亲和力任选地通过计算机交换(insilicoswap)和cdr序列的重新设计来进一步优化。通过计算设计在核因子-样2(nrf2)结合部位处对kelch-样ech相关蛋白1(keap1)具有纳摩尔浓度级结合亲和力的抗体已经实现了示例。所设计的抗体之一的x射线共晶结构显示原子水平上与相应的计算模型一致,证明了针对预先选择的表位的抗体的实验验证的计算设计的成功应用。

在一个实施方案中,使用基于特征性原子之间的匹配距离的预选来从数据库选择候选抗体结构,然后基于确定匹配残基子结构特征性原子中的至少三个是否可被叠加在相应的至少三个热点子结构特征性原子上来进一步选择,其中在所有对上平均的每对重叠原子之间的空间偏差小于预定阈值。该两步法使得能够特别高效地从数据库中选择候选抗体结构。预计随着抗体结构的可用数据库变大,该效率的提高将变得越来越重要。

在一个实施方案中,产生设计的抗体还包括将候选抗体结构的一个或多个cdr环与来自cdr环数据库的cdr环迭代交换以增加候选抗体结构与靶表位之间的预测的亲和力。本发明人已经发现,该步骤有利地提供了另外的构象自由度,其允许在设计的抗体和靶表位之间获得改善的亲和力。在该步骤不存在的情况下,数据库中可用的抗体结构的相对有限数量意味着找到具有与靶蛋白上的选定表位形成最佳形状/静电互补性的cdr的高亲和力抗体是具有挑战性的。cdr环交换利用大量序列和来自其他抗体结构的实验确定的cdr构型来构建新的嵌合抗体模型。将cdr环交换与本发明的其他步骤组合允许快速产生靶向所选择的结合部位的高亲和力抗体。

现在将参考附图仅以示例的方式描述本发明的实施方案,其中对应的参考符号表示对应的部分,并且其中:

图1描绘了设计将结合靶表位的抗体的一个示例性方法中的步骤;

图2描绘了从数据库中选择候选抗体结构的步骤的示例执行;

图3描绘了多个匹配残基的预选过程;

图4描绘了用于计算三个热点子结构的第一组距离的示意性示例几何结构;

图5描述了单个匹配残基的预选择过程;

图6描绘了用于计算具有涉及叠加的三个特征性原子的热点子结构中的第一组距离的示意性示例几何结构;

图7描绘了用于计算具有涉及叠加的四个特征性原子的热点子结构中的第一组距离的示意性示例几何结构;

图8描绘了用于确定特征性原子何时以平均空间偏差在预定阈值内叠加的示例性过程;

图9描绘了用于在检测到几何冲突时精炼设计的抗体的示例性程序;

图10描绘了靶向nrf2结合部位点的抗-keap1抗体中的热点引导的抗体支架移植物设计的示例性工作流程;

图11描绘了g54.1/keap1和g85/keap1相互作用的spr动力学分布图,其中使keap1的滴定液流过包含固定的抗-keap1fabs的芯片表面,并且其中fab设计源自移植的nrf2热点;

图12描绘了两个最佳热点移植设计g54(a)和g85(b)的vh区与相应的原始pdb支架结构和来自计算机模拟诱变的变体的序列比对。标记为“m”的残基代表在热点移植和丙氨酸诱变(以减少冲突)后与支架不同的氨基酸。“g”表示在计算机模拟诱变过程中被引入以分别产生变体g54.1和g85.1的残基。被移植的三个nrf2激发的热点标以星号;

图13描述了在与keap1结合部位相互作用的同源高亲和力nrf2肽区段的竞争性滴定存在的情况下,g54.1/keap1和g85/keap1相互作用的spr动力学分布,从而证明了设计抗体与keap1的nrf2结合部位的特异性结合;

图14描绘了在靶向nrf2结合部位的抗-keap1抗体中与keap1复合的设计的抗体g54.1(左)和g85(右)的模型化结合姿态;将cdrh2环上的三个热点残基(描绘为棒状)与nrf2肽叠加;

图15描绘了g54.1抗体的亲和力提高中的cdrh3环交换设计的工作流程;

图16描绘了设计的g54.1抗体的cdr-环逐步rosettaδg评分分解;通过截短来自模型化g54.1/keap1复合结构的fv片段的每个cdr环来估计单个cdr环对g54.1与keap1之间的rosettaδg评分的贡献;

图17描绘了通过cdrh3环交换对g54.1抗体进行的亲和力提高中g54.1的cdrh3交换变体中的cdrh3环的序列比对;

图18描绘了设计的cdrh3交换变体相对于亲本g54.1fab的相对结合亲和力提高;

图19描绘了通过cdrh3环交换进行的g54.1抗体的亲和力提高中计算模型化的cdrh3构象以及亲本g54.1和4个最高亲和力提高的cdrh3交换设计与keap1的相互作用模式;cdrh3环中的关键接触残基被描绘为棒状;

图20描绘了4种最高亲和力提高的cdrh3交换设计的分离的模型化cdrh3环与keap1的构象和相互作用模式的特写(a,ls171;b,ls145;c,ls168;d,ls146);从顶视(左)和侧视(右)显示cdrh3(浅灰色)与keap1(深灰色)的构象和相互作用模式;cdrh3环中的关键接触残基被描绘为棒状;清楚地显示了ls171中的vh99l和vh100y、ls168中的vh97w和ls146中的vh97y占据未被ls145或g54.1占据的抗体与keap1之间的界面空隙(关于比较,也参见图19);

图21描绘了ls146-scfv/keap1复合物的晶体结构,显示了计算设计的精确度;

图22描述了ls146-scfv/keap1复合物中的晶体堆积;不对称单位包含两个拷贝的ls146-scfv/keap1复合物;

图23描绘了ls146-scfv/keap1复合物的移植的热点结合部位2fo–fc图;2fo–fc省略了不对称单元中的两个分子的移植热点和与keap1相互作用的其他ls146-scfvcdrh2残基的图谱电子密度(灰色网格,以1.0σ形成轮廓);结晶水显示为灰色球体;

图24描述了证实keap1中nrf2结合部位的占据的ls146-scfv/keap1复合物的晶体结构;

图25描绘了ls146-scfv/keap1复合物的晶体结构,其显示了计算设计的精确度-cdrh2的ls146-scfv表位的特写,其中关键接触残基被描绘为棒状,氢键描被绘为虚线;

图26描绘了ls146-scfv表位的特写,所述表位被映射到对接触cdr着色的keap1分子表面上;

图27描述了ls146-scfv/keap1复合物的晶体结构,其显示了计算设计的精确度-cdrh3的ls146-scfv表位的特写,其中关键接触残基被描绘为棒状,氢键被描绘为虚线;

图28描述了ls146-scfv/keap1复合物的晶体结构,其显示了计算设计的精确度-cdrh1的ls146-scfv表位的特写,其中关键接触残基被描绘为棒状,氢键被描绘为虚线;

图29描绘了ls146-scfv/keap1复合物的晶体结构,其显示了计算设计的精确度-vh构架3(fr3)的ls146-scfv表位的特写,其中关键接触残基被描绘为棒状,氢键被描绘为虚线;

图30描绘了ls146-scfv/keap1复合物的晶体结构,其显示了计算设计的精确度-通过叠加到keap1侧比较晶体ls146-scfv与模型化ls146-fab的结合模式;

图31描绘了ls146-scfv/keap1复合物的晶体结构,显示了计算设计的精确度-来自ls146fv区域的晶体(左)和模型化(右)结构的cdrh2环(热点受体)的主链构象和侧链取向的比较;关键的cdrh3残基被描绘为棒状,并且影响来自预测模型的vh52d的构象的氢键被描绘为虚线;

图32描绘了ls146-scfv/keap1复合物的晶体结构,其显示计算设计的精确度-来自晶体(左)和模型化(右)结构的堆积在vh/vl界面处的残基的比较;经历与预测相比的明显构象变化的关键堆积残基被描绘为棒状;

图33描绘了biacore竞争测定中ls146-scfv相对ls146-fab的效力的比较;通过与对数浓度相对标准化的反应/可变斜率模型拟合来计算ic50值:

图34描绘了通过转移组合受体激发的和夫苏木单抗激发的热点残基实例进行的泛tgfb阻断fab片段设计中的tgfβr1&2和夫苏木单抗的组合热点残基;

图35描绘了fab184/tgfβ复合物的spr动力学分布,其中在通过转移组合受体激发的和夫苏木单抗激发的热点残基实例进行泛tgfb阻断fab片段设计中设计的抗体fab被固定在芯片上;

图36描绘了在通过转移组合受体激发的和夫苏木单抗激发的热点残基实例进行的泛tgfb阻断fab片段设计中,在hekblue报告基因细胞测定中通过fab184tgfβ的滴定对tgfβ-受体结合的中和;

图37描绘了在通过转移组合受体激发的和夫苏木单抗激发的热点残基实例进行的泛tgfb阻断fab片段设计中,通过叠加到tgfβ1侧来比较晶体fab184的结合模式与模型化的结合模式。

根据一个实施方案,提供了设计将与靶表位结合的抗体的计算机执行方法。图1-9以流程图形式示意性地示出了该方法的示例性方面。

该方法包括:a)鉴定一个或多个热点残基,所述热点残基将各自与靶表位上的一个或多个热点部位中的相应的一个结合(图1中的步骤100)。每个热点残留物包含热点子结构。热点子结构包括一个或多个热点子结构特征性原子。热点子结构特征性原子是将被用于匹配与热点残基潜在不同的残基(即来源于不同氨基酸)的原子。因此,特征性原子是不同氨基酸类型的残基所共有的原子。

该方法还包括b)从抗体结构数据库中选择一个或多个候选抗体结构(图1中的步骤200)。抗体结构或抗体结构的相关部分可被称为抗体支架。进行选择以发现能够被修饰以具有与热点残基匹配的残基的抗体结构或支架(如下所述)。数据库的性质或来源不受特别限制。数据库条目可根据需要进行过滤或重新格式化。例如,在一个实施方案中,仅使用代表已经通过x射线晶体学解析的结构的数据库条目。在一个实施方案中,如果多个晶体拷贝可用于具有不同链标识符的相同抗体结构,则只有出现在pdb文件中的第一拷贝才可能被保留以供使用。在一个实施方案中,从fab结构只保留fv区域。在一个实施方案中,使用abnum程序(abhinandan,k.r.&martin,a.c.r.analysisandimprovementstokabatandstructurallycorrectnumberingofantibodyvariabledomains.mol.immunol.45,3832–3839(2008))按照chothia编号方案(al-lazikani,b.,lesk,a.m.&chothia,c.standardconformationsforthecanonicalstructuresofimmunoglobulins.j.mol.bio.273,927–948(1997))将fv结构中的残基重新编号。在一个实施方案中,弃去具有破坏的多肽cdr环的任何结构。

每个候选抗体结构具有一个或多个匹配残基。每个匹配残基匹配热点残基(在下面所解释的意义上)中的相应的一个热点残基。每个匹配残基包含匹配残基子结构。每个匹配残基子结构包含一个或多个匹配残基子结构特征性原子。进行选择,使得抗体结构内匹配的残基子结构特征性原子的相对位置和热点子结构特征性原子在与靶表位结合时的相对位置能够使得至少三个匹配残基子结构特征性原子可被计算地叠加在相应的至少三个热点子结构特征性原子上,其中在所有对上平均的每对叠加的特征性原子之间的空间偏差小于预定阈值。例如可通过计算每对叠加的特征性原子之间的空间间隔并计算空间间隔的均值平均值或均方根均值来实现平均。每个相应的匹配残基子结构特征性原子和热点子结构特征性原子通常具有相同的特征性原子类型(例如α碳、源于羧基的主链碳、主链氮、主链氧、侧链的β碳等)。因此,当来自两个残基中的每一个的相应特征性原子可以以相对高的精确度彼此叠加(总体上,平均偏差满足如上所述的预定阈值)时,匹配残基与热点残基相匹配。匹配残基不需要与热点残基具有相同的氨基酸类型(即具有相同的侧链)。匹配仅取决于两个残基是否在子结构中具有可以以相对高的精确度叠加的特征性原子。下面参照图8描述用于确定对于给定的抗体结构该要求是否得到满足的示例性方法。

使用至少三个匹配残基子结构特征性原子和相应的至少三个热点子结构特征性原子的匹配约束了候选抗体结构相对于靶表位的位置和取向,以至少部分地保留所述一个或多个鉴定的热点残基和靶表位的互补位/表位相互作用几何结构的功能相关方面。匹配超过三个特征性原子和/或使用不止一个匹配残基进行匹配将趋于增加几何约束和更紧密地保持互补位/表位相互作用几何结构(参见下面的实例)。

在一个实施方案中,步骤(b)的选择通过仅在抗体结构上的相互作用部位内寻找匹配残基来进行,所述相互作用部位由cdr环或cdr环以及抗体fv结构域表面上的任何区域组成。

该方法进一步包括c)使用在步骤b)中选择的候选抗体结构中的一种产生设计的抗体(图1中的步骤300)。在一个实施方案中,通过用不同的残基替换至少一个匹配残基来修饰候选抗体结构,使得设计的抗体与靶表位之间的预测的亲和力高于候选抗体结构与靶表位之间的预测的亲和力。例如,不同的残基可以是与相应的热点残基相同的氨基酸类型的残基。用不同的残基替换匹配残基可被称为不同残基的移植。在另一个实施方案中,在每个匹配残基已经是与匹配残基匹配的热点残基相同的氨基酸的残基的情况下,将候选抗体结构作为设计的抗体结构输出,在这个阶段没有修饰。可以在随后的步骤中修饰根据上面论述的任何程序产生的设计的抗体结构,以进一步提高设计的抗体与靶表位之间的亲和力。

在一个实施方案中,步骤(b)中使用的预定阈值为2.0埃,任选地为1.75埃,任选地为1.5埃,任选地为1.25埃,任选地为1.0埃。选择预定阈值有一定的自由度。选择相对高的阈值可导致从数据库中选择更多的候选抗体结构。这可增加找到具有高亲和力的设计抗体结构的机会,但会倾向于增加对用于例如评估(例如通过评估真实或预测的亲和力以及进一步修饰可改善亲和力的程度)所选候选抗体结构的潜力的进一步处理步骤的要求。选择相对较低的阈值可导致从数据库中选择较少的候选抗体结构,但这些选择的结构可能平均具有更大的潜力。这可使得进一步的处理步骤更加集中,从而可能更快地发现高亲和力的新型抗体结构。

在一个实施方案中,在步骤(c)中,所述修饰包括用与和所述匹配残基匹配的热点残基相同的氨基酸的残基替换匹配残基中的至少一个中的每一个。在许多情况下,这将导致设计的抗体结构通过呈现至少一个残基来实现相对高的亲和力,所述残基与热点残基的侧链相同并且以与在热点残基与靶表位结合(根据定义其以高亲和力发生)时的热点残基非常相似的方式定位和定向。然而,用与相应的热点相同的氨基酸类型的残基替换所有匹配残基不是必需的。在一些情况下,对于至少一个亚组的匹配残基,可通过不替换匹配残基或通过用与相应的热点残基不同的氨基酸类型的残基替换匹配残基来获得更高的亲和力。

特征性原子(热点残基子结构或匹配残基子结构中的任一种)可包括以下中的一种或多种:α碳、源自羧基的主链碳原子、主链氮、主链氧和侧链的β碳。

在一个实施方案中,至少一个匹配残基的α碳原子位于叠加的特征性原子对之一中。

在一个实施方案中,叠加的特征性原子对包含匹配残基中的至少一个的每一个的α碳和源自羧基的主链碳原子、主链氮、主链氧和侧链的β碳中的至少一种。因此在该实施方案中,至少一个匹配残基具有涉及叠加过程的两个特征性原子。这提供了在位置和方向上相对良好的匹配,而不会过度地限制选择过程。

在一个实施方案中,叠加的特征性原子对包含和匹配残基中的至少一个中的每一个的α碳和源自羧基的主链碳原子、主链氮、主链氧侧链的β碳中的至少两种。因此在该实施方案中,至少一个匹配残基具有涉及叠加过程的三个特征性原子。这提供了残基的位置和取向的相对高度的匹配。

在一个实施方案中,所述一个或多个匹配残基仅由单个匹配残基组成。在此类实施方案中,叠加的特征性原子对中的每一对将包含与单个匹配残基不同的特征性原子。在这种类型的示例性实施方案中,可以叠加在对应的至少三个热点子结构特征性原子上的匹配残基子结构特征性原子中的至少三个任选地包含匹配残基的α原子和源自匹配残基的羧基的主链碳、匹配残基的主链氮、匹配残基的主链氧和匹配残基的侧链的β碳中的至少两种。

在一个实施方案中,所述一个或多个匹配残基由第一匹配残基和第二匹配残基(任选地,仅第一匹配残基和第二匹配残基)组成。在这种类型的实施方案的一个实例中,第一匹配残基包含可被叠加在相应的热点子结构特征性原子上的匹配残基子结构特征性原子中的至少两个特征性原子,并且第二匹配残基包含可被叠加在相应的热点子结构原子上的匹配残基子结构特征性原子中的至少一个。

在一个实施方案中,所述一个或多个匹配残基由第一匹配残基、第二匹配残基和第三匹配残基(任选地仅第一匹配残基、第二匹配残基和第三匹配残基)组成。在这种类型的实施方案的一个实例中,第一匹配残基、第二匹配残基和第三匹配残基中的每一个包含可以叠加在相应的热点子结构特征性原子上的匹配残基子结构特征性原子中的3个特征性原子。该方法对所述三个匹配残基的相对位置和取向施加相对较高的约束,由此提供了具有相对高的平均亲和力(相对于限制较少的候选抗体结构的选择)的候选抗体结构的相对集中的选择,甚至无需进一步修饰以提高亲和力。在该实施方案的一个具体实例中,参与叠加的三个匹配残基中的每一个中的所述三个匹配残基子结构特征性原子包含α碳原子、主链碳原子和主链氮原子。本发明人已发现这种组合是特别有效的,如在下面论述的详细的keap1实例中所证明的。

如图2所示,在一个实施方案中,所述一种或多种候选抗体结构的选择(图1中的步骤200)包括预先选择一个亚组的抗体结构(图2中的步骤210),随后进一步选择(图2中的步骤220)。

在一个实施方案中,预先选择(步骤210)包括图3中阐述的和参考图4中描绘的示意性实例的几何结构在下文中解释的步骤。预先选择包括(步骤211a)确定表示热点残基的不同子结构中的相同特征性原子之间的所有可能配对之间的间隔的第一组距离。这在图4中进行了示意性地举例说明,简化成二维视图。图4显示三个不同热点残基的热点残基子结构特征性原子:圆圈a1-a3表示第一热点残基的特征性原子,圆圈b1-b3表示第二热点残基的特征性原子,圆圈c1-c3表示第三热点残基的特征性原子。虚线将相同特征性原子类型(例如α碳、源自羧基的主链碳、主链氮、主链氧、侧链的β碳等)的所有可能的特征性原子对连接在一起。所有虚线的长度表示第一组距离:{s11,s12,s13,s21,s22,s23,s31,s32,s33}。

预先选择还包括(步骤212a)确定代表匹配残基的不同子结构中的相同特征性原子之间的所有可能配对之间的间隔的第二组距离。除使用匹配残基的特征性原子代替热点残基外,该过程与步骤211a的过程相同。第二组距离将采用与第一组距离相同的形式(例如,包含9个数字的组)。在一个实施方案中,所述数字被表达为预定精度水平(例如,四舍五入到最接近的埃)。在一个实施方案中,第一和第二组距离被表示为规范化形式中的数字序列,以允许在从不同抗体结构获得的序列之间容易地进行比较。数字序列可以用作搜索抗体结构数据库的指标(参见下面论述的keap1实例)。

预先选择还包括(步骤213a)将第一组距离与第二组距离进行比较,以确定是否已经在预定的间隔阈值内获得了匹配。例如,将表示第一组的数字序列(表示为预定精度水平(其有效地定义预定间隔阈值-较低的精度水平将对应于较大的预定间隔阈值,反之亦然))与表示第二组的数字序列(表示为相同的预定精度水平)进行比较。如果是,则过程进行到步骤215a,并输出抗体结构以用于进一步处理。如果否,则该过程通过步骤214a、212a和213a循环以迭代重复第二组距离的确定以及与第一组距离的比较,直至获得匹配。该过程还可在输出步骤215a之后通过步骤214a、212a和213a循环,以便选择多个抗体结构用于进一步处理。

在一个实施例中,预先选择(步骤210)包括图5中阐述的和参考图6和7中描绘的示意性示例性几何结构在下面解释的步骤。在该实施方案中,预先选择包括(步骤211b)确定代表单个热点残基的子结构的不同特征性原子之间的所有可能配对之间的间隔的第一组距离。这在图6和7中针对不同的示例性热点子结构进行了示意性举例说明,被简化为二维视图。图6显示示例性热点子结构,其中三个特征性原子a1、a2和a3涉及与相应匹配残基子结构(具有相应类型的相应三个特征性原子)的叠加。图7显示可选的示例性热点子结构,其中四个特征性原子a1、a2,a3和a4涉及与相应匹配残基子结构(具有相应类型的相应四个特征性原子)的叠加。在图6和7中,虚线将热点残留物中所有可能的特征性原子对连接在一起。根据定义,每对将涉及不同类型的特征性原子彼此之间的配对,因为它们在相同的残基中。所有虚线的长度代表第一组距离:图6中的{d1,d2,d3}和图7中的{d1,d2,d3,d4,d5,d6}。

预先选择还包括(步骤212b)确定代表匹配残基的子结构的不同特征性原子之间的所有可能配对之间的间隔的第二组距离。除使用匹配残基的特征性原子代替热点残基的特征性原子外,该过程与步骤s211b的过程相同。第二组距离将采用与第一组距离相同的形式(例如对于图6和7中所示的特定几何结构包含3或6个数字的组)。在一个实施方案中,所述数字被表达为预定精度水平(例如,四舍五入到最接近的埃)。在一个实施方案中,第一和第二组距离被表示为规范化形式中的数字序列,以允许在从不同抗体结构获得的序列之间容易地进行比较。

预先选择还包括(步骤213b)将第一组距离与第二组距离进行比较,以确定是否在预定隔离阈值内获得了匹配。例如,将表示第一组的数字序列(表示为预定精度水平(其有效地定义预定间隔阈值-较低水平的精度将对应于较大的预定间隔阈值,反之亦然))与表示第二组的数字序列(表示为相同的预定精度)进行比较。如果是,则过程进行到步骤215b并输出抗体结构以用于进一步处理。如果否,则该过程通过步骤214b、212b和213b循环以迭代重复第二组距离的确定以及与第一组距离的比较,直至获得匹配。该过程也可以在输出步骤215b之后通过步骤214b、212b和213b循环,以便选择多个抗体结构以用于进一步处理。

在一个实施方案中,图2的进一步选择步骤220包括确定匹配残基子结构特征性原子中的至少三个是否可被叠加在对应的至少三个热点子结构特征性原子上,其中在所有对上平均的每对叠加的原子之间的空间偏差小于预定阈值。图8描绘了用于确定何时给定的抗体结构满足了该要求的示例性方法。

在图8的步骤221中,将匹配残基子结构特征性原子在热点子结构特征性原子在它们与靶表位结合时所占据的一个或多个相对位置上计算地叠加(即覆盖)在所述热点子结构特征性原子上。该初始叠加的执行方式不受特别的限制。在步骤222中,针对每对匹配残基和相应热点残基中的每对相同特征性原子计算空间偏差。然后获得这些空间偏差的平均值,例如通过计算均值平均值或均方根平均值。如果特征性原子均被精确地叠加,则平均空间偏差将为零。否则,平均空间偏差将是特征性原子对的组针对抗体结构的特定相对位置和取向叠加(以进行该迭代)的程度的量度。在步骤223中,确定平均空间偏差是否低于预定阈值。该确定测试该拟合是否足够接近令人满意。如果是,则得出抗体结构是候选抗体结构的结论,并且将结果输出以用于进一步处理(步骤227)。如果否,则该过程通过步骤224、225、222和223循环,其中抗体结构相对于热点残基发生位移,并重新计算平均空间偏差并将其与阈值进行比较。该过程继续进行,直至获得足够好的匹配(通过到达步骤227)或已经实现了预定的最大迭代次数,在该情况下,步骤224的“是”分支到达步骤226,并且对于不同的抗体结构,该过程再次从步骤221开始。

在一个实施方案中,设计的抗体的产生包括一个或多个另外的处理步骤以修饰候选抗体结构,以进一步提高与靶表位的预测亲和力(例如通过迭代突变残基或迭代交换cdr环-见下文)或弃去不起作用(例如由于冲突而导致的-见下文)的抗体结构。这些另外的处理步骤包括计算修饰候选抗体结构,同时设计的抗体处于通过匹配到所鉴定的热点残基而限定的结合位置。因此,相对于与相应热点子结构特征性原子相同的位置处的靶表位,对与上述选择步骤(b)的叠加中使用的子结构特征性原子相对应的抗体结构的子结构原子进行定位。这样,重叠过程不仅有助于从数据库中选择最合适的候选抗体结构,而且还有助于提供用于以保留关键互补位/表位相互作用几何结构的方式固定抗体结构,从而使得另外的处理步骤能够以高效和有效的方式进行的高效参考。

在一个实施方案中,设计的抗体的产生包括检测几何冲突。几何冲突是其中一个或多个原子经预测占据比当候选抗体结构计算地结合到靶表位时物理上可能的位置更加靠近在一起的位置。图9中描绘了处理几何冲突的示例性程序。

在步骤301中,确定是否已发生几何冲突,如果是,则确定哪些原子参与几何冲突。如果否,则该过程进行到步骤306,其中将候选抗体结构输出以用于进一步处理。如果是,则处理进行至步骤302。

在步骤302中,确定几何冲突是否涉及任何候选抗体残基的主链。如果是,则过程进行到步骤304和301,由此弃去候选抗体结构,并对不同的候选抗体结构重复该过程。如果否,则过程进行到步骤303。

在步骤303中,确定几何冲突是否涉及任何候选抗体残基的β碳原子。如果是,则过程进行到步骤304和301,由此弃去候选抗体结构,并对不同的候选抗体结构重复该过程。如果否,则过程进行到步骤305。

在步骤305中,确定几何冲突是否涉及候选抗体结构的残基的侧链。如果是,则该过程进行到步骤307,在该步骤中修饰侧链。该修饰可涉及将侧链换成不同氨基酸(例如较小的氨基酸)的侧链。例如,侧链可被修饰为丙氨酸侧链、甘氨酸侧链、缬氨酸侧链、丝氨酸侧链、苏氨酸侧链或高丙氨酸侧链。过程然后进行到步骤301,在该步骤中确定是否仍然存在几何冲突。如果在步骤305为否,则过程进行到步骤306,其中将候选抗体结构输出以用于进一步处理。

在一个实施方案中,产生设计的抗体还包括迭代突变候选抗体结构中的残基的氨基酸类型以增加设计的抗体与靶表位之间的预测亲和力。这个过程可被称为计算机模拟诱变。在一个实施方案中,限制被迭代突变的残基的选择,使得热点残基不被突变。在其他实施方案中,不限制残基的选择以避免热点残基的突变。受制于上述潜在的限制,迭代突变可包括单独突变预期明显参与与靶表位相互作用的候选抗体上的区域(例如界面区域)中的所有残基,例如所有其他氨基酸类型(不包括甘氨酸、脯氨酸和半胱氨酸)。本领域技术人员将了解用于执行涉及残基的迭代突变的计算分析以减少与蛋白质对靶的结合相关的自由能的各种算法。例如,可以使用rosetta软件包(https://www.rosettacommons.org/)。

在一个实施方案中,产生设计的抗体还包括将候选抗体结构的一个或多个cdr环中的每一个与来自cdr环数据库的cdr环进行迭代交换,以增加候选抗体结构和靶表位之间的预测亲和力。例如可使用公共可用的软件(诸如rosetta软件包)来预测亲和力。交换cdr环大大增加了设计的自由度,相对于原始数据库中可用的抗体结构的数量,有效地增加了可以测试的抗体结构的数量。

在一个实施例中,限制cdr环的交换,使得所有热点残基得到保留。本发明人已经发现,该方法允许获得具有高亲和力的设计残基而不会对计算资源提出过多要求。

在一个替代性实施方案中,限制cdr环的交换,使得至少一个热点残基得到保留。本发明人已经发现,与其中需要所有热点残基的实施方案相比,该方法提供了更多的突变自由度,从而可能允许找到具有更高亲和力的抗体,而不需要增加太多的计算资源。

在一个实施方案中,cdr环的交换包括交换cdrh3环和cdrl3环中的至少一个。这些循环显示出最大的可变性。重点放在交换这些环上可以使亲和力得到最高效的提高。

在一个实施方案中,cdr环的交换包括交换至少cdrh3环。该环是最可变的。重点放在交换该环上可使得亲和力得到更有效提高。

在一个实施方案中,cdr环的交换还包括迭代突变交换cdr环中的残基的氨基酸类型,以增加候选抗体结构与靶表位之间的预测亲和力。该步骤使得亲和力能够得到进一步增加。

一个或多个热点残基本身可以以各种不同的方式来鉴定(图1中的步骤100)。在一个实施方案中,从已知与靶表位结合的同源蛋白质结合物鉴定热点残基。该方法提供了具有高度可靠性和可预测亲和力的热点残基。然而,可以以这种方式鉴定的热点残基的范围是有限的。在下面详细论述的keap1实例中,基于已知的同源结合伙伴nrf2确定热点残基。

可选地或另外地,可以使用数值方法来鉴定一个或多个热点残基以迭代地发现经预测提供与靶表位的相互作用的残基,这与提供不成比例的量的包含所述残基的抗体与靶表位之间的结合能相符。

蛋白质结合背景下的术语“热点”在本领域中是公知的。本领域技术人员将理解,靶表位上的每对热点残基和相应热点位点定义了热点残基与靶表位之间的相互作用,这与提供不成比例的量的包含所述热点残基的抗体与靶表位之间的结合能相符。参见,例如:fleishman,s.j.等computationaldesignofproteinstargetingtheconservedstemregionofinfluenzahemagglutinin.science332,816-821(2011);liu,s.等nonnaturalprotein-proteininteraction-pairdesignbykeyresiduesgrafting.proc.natlacad.sci.usa,104,5330-5335(2007);和fleishman,s.j.等hotspot-centricdenovodesignofproteinbinders.j.mol.biol.413,1047-1062(2011)。

在一个实施方案中,获得多种设计的抗体,并基于其对靶表位的真正亲和力(例如使用表面等离子体共振测定的)选择优选的设计抗体。

可使用本领域技术人员已知的计算装置结合适当的软件和/或固件来执行本发明的实施方案的任何或全部步骤。软件可被作为来自外部源的信号提供,或可被记录在存储器或计算机可读介质中。

进一步的细节、具体的实施例和结果

keap1实施例

在一个具体的实施例中,将本发明的实施方案用于设计结合keap1的抗体,所述keap1是响应于氧化应激而调节nrf2(一种bzip转录因子)的稳态水平的btb-kelch底物接头蛋白。nrf2通过两个发夹环基序以1:2的化学计量比结合keap1,结合亲和力分别为5μm和5nm力。将三个相互作用的模式(源自高亲和力nrf2环中的热点残基glu79、thr80和glu82(参见补充表1))移植到设计的抗体的结合界面,并通过计算结合能排序(图10和补充表2)。选择五种设计并对其进行计算机模拟诱变,以鉴定对keap1具有改善的结合能的cdr环中的额外潜在界面点突变,从而导致原始设计的变体产生。在计算机模拟诱变之前和之后,将10种设计的抗体以fab形式表达,并且通过表面等离子体共振(spr)测量其结合亲和力。10个选定的抗体fab设计中有8个显示出可检测的对keap1的结合,最好的两个(g54.1和g85)显示在低至中纳摩尔浓度范围内的结合亲和力(图11,图12和补充表2-4)。当添加同源nrf2肽结合剂作为竞争剂时结合减少(图13),表明keap1上的设计抗体的表位与nrf2的表位重叠。g54.1和g85(蛋白质数据库(pdb)登录码分别为3ivk和2jb5)的原始抗体支架不与keap1结合,并且相应的天然抗原没有一种与keap1或nrf2生物学相关(补充表4),强烈地暗示着两种抗体的keap1结合均是通过计算设计的界面介导的。模型化结构表明移植到两个抗体支架的cdrh2环上的三个nrf2热点呈现与nrf2肽类似的构象,并且完全占据了keap1上的nrf2结合部位以及cdrh1和cdrh3环(图14)。

设计高亲和力抗体的障碍在于目前的方法将其支架作为具有最小的其主链自由度扰动的刚性结构处理。然而,存在由于不同环类型的结构保守而将cdr环移植到不同抗体构架中的实验验证的先例,因此提供了迄今为止尚未被刚性支架设计方法所利用的可选的额外的构象自由度。例如参见以下出版物:clark,l.a.等anantibodyloopreplacementdesignfeasibilitystudyandaloop-swappeddimerstructure.proteineng.des.sel.22,93-101(2009);e.等recombininggermline-derivedcdrsequencesforcreatingdiversesingle-frameworkantibodylibraries.nat.biotechnol.18,852-856(2000);north,b.,lehmann,a.,dunbrack,r.l.anewclusteringofantibodycdrloopconformations.j.mol.bio.406,228-256(2011)。

为了进一步提高结合亲和力,鉴于cdrh3在6个cdr中在长度和构象方面被认为是最多样化的抗体环,并且在该情况下不存在任何热点残基(图14和图16),已开发了计算方法来将g54.1的cdrh3环与来自精心组织的cdrh3环片段结构文库的cdrh3环交换(图15)。产生的与keap1复合的嵌合fv片段的cdrh3序列使用rosettadesign(kuhlman,b.等designofanovelglobularproteinfoldwithatomic-levelaccuracy.science302,1364-1368(2003))进一步优化,并根据计算结合能排序。选择g54.1的19个cdrh3-交换变体(图17和补充表5-7),其中四个显示出明显提高的亲和力,从ls171和ls145测量的4.1和5.4nm的最佳亲和力分别代表相对于亲本g54.1有30倍和23倍亲和力提高(图18和补充表7),与同源nrf2的亲和力相媲美。ls148和ls146尽管亲和力较弱,分别显示出13倍和6倍的提高。这四种cdrh3交换设计具有全新的cdrh3环(序列和长度,图17),具有来自g54.1的不同构象,表现出提高的与keap1的形状互补性评分(补充表5)。如模型化结构(图19和图20)所示,这些亲和力提高的g54.1变体或者采用更短(10对比g54.1的13)的cdrh3中的芳香族残基取代(如ls171中的vh99l和vh100y,ls168中的vh97w和ls146中的vh97y)以填充g54.1与keap1表面之间的空隙,或者具有更大的cdrh3与keap1的接触表面积(如ls168的对比g54.1的)。

由于另外三种最高亲和力cdrh3-交换设计的晶体学试验不能产生衍射质量的晶体,因此解析了与ls146复合的keap1的高分辨率晶体结构(图21-23)。格式化为单链fv(scfv)的ls146几乎如在keap1上的nrf2结合部位中所设计的一样精确地结合(图24),cdrh2与keap1残基形成最广泛的接触(界面氢键网络)(图25和26)。正如预测的那样,12-聚体长的cdrh3环折叠成发夹状构象并与两个keap1螺旋桨叶片末端的环相互作用(图27)。参与结合的其他cdr环是cdrh1(图28)和vh构架3的一部分(图29)。结合到keap1上的ls146-scfv的结构显示了与设计模型(界面-cα-原子均方根偏差其中两种复合结构叠加在keap1侧上;图30)一致的一般原子水平。如所预测的,除由于与vh52d的主链酰胺的意外分子内氢键而导致的vh52d的翻转侧链外,3个移植的热点采用几乎相同的侧链取向(重原子图31)。在由vh96y、vh100cy、vl49y和vl55y(图32)的侧链重组织导致的cdrh3环尖端处发生明显的构象漂移,这改变了cdrh1与l1之间的扭转角并将vl从keap1完全分离(补充表8)。已知转化为scfv可导致vh/vl取向的变化和随后的亲和力损失,这可以解释ls146-scfv的效力为何是其fab形式的效力的1/3(图33)。

尽管ls146的cdrh2显示与热点残基供体nrf2‘deetge’肽区段相似的结构构型(cα-原子)以及高序列同一性(83%),但cdrh2不是在抗体支架移植中鉴定的唯一热点残基受体。因为针对所有表面cdr残基进行了三重散列(见下文),因此在一些设计中也发现cdrh3具有nrf2激发的热点,尽管亲和力弱得多(补充表4)。强与弱结合设计的性质的比较表明,更有利的计算keap1抗体结合能,更大的界面表面积和更少的埋藏不饱和极性原子是最重要的因素(图11和补充表2)。这些让人联想起计算抗原-抗体界面设计的众所周知的挑战(大的极性结合表面主导的环相互作用)。cdr构型的合理交换使得能够探究未被热点引导的移植设计触及的可选形状和化学互补性的利用,这依赖于有限数量的支架结构(补充表5)。具有不同cdrh3主链构象和序列的测试环交换设计通过靶向相同表位而显示提高的结合亲和力,表明所述的计算cdr交换策略的使用能够优化用于实验选择较高亲和力变体的计算机设计抗体。

尽管鉴于其为细胞内蛋白质从而不是治疗性抗体的常规靶标,但keap1-nrf2相互作用表征可容易鉴定的热点残基,为靶向预先选择的表位的新型抗体的基于结构的设计提供了理想的概念验证系统,所述新型抗体可直接阻断同源蛋白质间的相互作用,或可选地捕获预测的过渡态,避开对隔离或稳定瞬态构象的需要。随着计算精度的进一步提高和对设计序列空间的平行探测,使用现代寡核苷酸装配方法(诸如聚焦显示文库设计和下一代测序)进行更强的结合变体的高效选择,基于结构的设计方法提供了快速产生用于治疗和诊断应用的抗体的潜力。

应用于keap1实施例的计算方法的更多细节

一般计算方法

通过基于残基的三元组散列法设计靶向nrf2结合部位的抗keap1抗体,以搜索能够在cdr中的几何匹配的位置中容纳nrf2热点介导的相互作用模式的抗体支架晶体结构,然后进行cdrh3交换以探究所选设计的替代环构型。利用rosettadesign在这两个阶段期间优化设计的cdr环的序列,以提高对keap1的预测结合能。在本说明书的结尾处提供了用于热点移植、cdrh3交换和rosettascripts设计方案的伪代码。

热点移植

在其中使用三个匹配残基(每个残基具有涉及叠加的3个子结构特征性原子)的情况下,基于三元组的散列法是在上文中参考图1中的步骤200描述的过程的实例。关于更一般地进行三元组散列的更多信息可见于以下出版物中:wolfson,h.j.&rigoutsos,i.geometrichashing:anoverview.j.comput.sci.eng.4,10-21(1997)。实施三元组散列法以搜索能够在sabdab数据库(补充表9)中承载(host)来自1417抗体晶体结构的热点介导的相互作用模式的抗体结构(“支架”)。“三元组”被定义为由三个虚拟三角形组成,所述虚拟三角形分别连接三个残基的主链cα、n和c原子。任何三个nrf2热点被编译成三元组,并用唯一的密钥索引以进行查找。计数抗体支架结构中cdr残基的所有可能三元组并以相同的方式进行索引。通过比较各自的索引密钥来鉴定来自热点和抗体支架的相同三元组。通过将支架三元组叠加到相应的相同热点三元组上以最小化3个三元组三角形中两组九个顶点之间的rmsd,来将抗体支架移植到热点上。用相应的热点三元组残基替换3个支架三元组残基。如果移植的抗体支架中的任何残基的主链原子与keap1发生冲突,则弃去三重叠加和热点移植物后的设计结构。

cdrh3环交换

从上述1417个抗体支架结构中拆分出所有外源cdrh3环。以相同的方式从g54.1/keap1复合物结构中除去原始cdrh3环,通过叠加锚定残基的主链原子移植每个外源cdrh3环,然后通过将新的cdrh3锚定残基与相邻的g54.1构架残基连接来将其连接到g54.1构架上。如果新的cdrh3环的主链原子与原始g54.1fv或keap1发生冲突,则弃去设计的结构。

rosetta序列设计

使用两轮rosetta序列设计,目的是优化分别从热点移植和cdrh3环交换获得的设计的计算结合能。在第一轮中,从5个设计的抗体结构(该结构容纳三个nrf2热点介导的相互作用模式)开始,将抗体侧中的每个界面位置单独突变为所有其他氨基酸类型(不包括甘氨酸、脯氨酸和半胱氨酸)。通过重新打包和最小化所有界面残基来优化每个突变结构。使用具有远程静电校正的rosetta全原子评分项评估每个点突变的计算结合能的变化(称为δδg)(参见fleishman,s.j.等rosettascripts:ascriptinglanguageinterfacetotherosettamacromolecularmodellingsuite.plosone6,e20161(2011))。选择最多排名前五位的单点突变(根据最低δδg评分)用于手动并入每个原始设计的组合突变型变体中。在第二轮中,允许g54.1的cdrh3交换变体中的所有cdrh3残基同时突变为所有其他氨基酸类型(不包括甘氨酸、脯氨酸和半胱氨酸),其中cdr和keap1上的所有界面残基的主链构象使用backrub方法来进行局部扰动,所述方法经报道有助于改善突变侧链预测(smith,c.a.,kortemme,t.backrub-likebackbonesimulationrecapitulatesnaturalproteinconformationalvariabilityandimprovesmutantside-chainprediction.j.mol.biol.380,742-756(2008))。始于软排斥势(soft-repulsivepotential)并以默认的标准范德华参数结束,将顺序设计的三次迭代用于增加发现较高亲和力相互作用的可能性。

设计评分

通过计算结合能(rosettaδg分数)、埋藏的溶剂可及表面积(sasa)和形状互补性(sc)评分评估设计(参见lawrence,m.c.,colman,p.m.shapecomplementarityatprotein/proteininterfaces.j.mol.biol.234.946-950(1993))。通过拒绝在热点移植中sc<0.5并且在cdrh3交换中sc<0.6的设计来加强高形状互补性。也将每个设计的复合物结构的rosetta总能量以及埋藏的不饱和极性原子的数量(stranges,p.b.&kuhlman,b.acomparisonofsuccessfulandfailedproteininterfacedesignshighlightsthechallengesofdesigningburiedhydrogenbonds.proteinsci.22,74-82(2013))用作设计质量评估的参考。

一般实验方法

关于keap1蛋白以及抗体表达、克隆、纯化、结晶的详细方法在下面和补充表10、11中给出。

结合分析

在biacore3000系统(gehealthcare)上进行表面等离子体共振(spr)实验,详细的实验细节在下面给出。简言之,将含有表达的fab的上清液(或假转染的上清液对照)注射到cm5芯片上的固定的抗人f(ab’)2多克隆抗体上方。keap1滴定或零分析物对照的第二次注射允许监测结合和解离动力学。芯片再生完成每个传感图周期。通过减去相邻的零分析物对照循环,针对由捕获的fab的缓慢解离导致的基线漂移校正传感图。keap1在各浓度下的非特异性结合通过减去等效的基线校正的对照上清液循环传感图来校正。使用biaevaluationtm软件来拟合结合和解离动力学,并由此确定亲和常数(kd)。通过相同的方案,通过针对恒定浓度的keap1滴定nrf2肽类似物来评估fab与keap1结合的特异性。

补充信息

nrf2热点鉴定

使用rosetta计算机模拟丙氨酸扫描脚本alascan.xml(参见das,r.,baker,d.macromolecularmodelingwithrosetta.annu.rev.biochem.77,363–382(2008))鉴定控制与keap1的结合的三个nrf2热点残基。复合物结构(pdb登录号2flu–参见lo,s.c.,li,x.,henzl,m.t.,beamer,l.j.&hannink,m.structureofthekeap1:nrf2interfaceprovidesmechanisticinsightintonrf2signalling.emboj.25,3605–3617(2006))中的nrf2和keap1的结合能通过使用默认的全原子力场(分数12权重)计算结合与未结合的结构之间的rosetta总能量差(在下文中称为rosettaδg分数)来预测。将每个nrf2残基计算机模拟突变为丙氨酸,丙氨酸突变后rosettaδg分数减少至少0.8rosetta能量单位(reu)的排名最前的三个nrf2残基(glu79、thr80和glu82)被确认热点(补充表1)。使用rosetta脚本inverserotamers.xml,从最靠近keap1表面的侧链原子开始产生反旋转异构体(inverserotamer),由此使热点构象多样化。在所有侧链扭转角周围进行额外的旋转异构体取样(两个半步标准偏差)。

抗体v区支架结构

2014年从sabdab(http://opig.stats.ox.ac.uk/webapps/sabdab)数据库中提取了具有至少一个储存在pdb中的配对vh/vl的抗体v区支架结构。只使用通过x射线晶体学解析的结构,包括fab和scfv形式。如果多个晶体拷贝可用于具有不同链标识符的相同抗体结构,则只保留出现在pdb文件中的第一个拷贝。只有fv区域与fab结构分开。使用abnum(abhinandan,k.r.&martin,a.c.r.analysisandimprovementstokabatandstructurallycorrectnumberingofantibodyvariabledomains.mol.immunol.45,3832–3839(2008))根据chothia编号方案(al-lazikani,b.,lesk,a.m.&chothia,c.standardconformationsforthecanonicalstructuresofimmunoglobulins.j.mol.bio.273,927–948(1997))将fv结构中的残基重新编号。弃去具有破碎的多肽cdr环的任何结构。最后保留1417个抗体fv支架结构用于热点移植设计(补充表8)。

将nrf2热点移植到抗体支架结构上

实施基于残基的三元组散列法以搜索最佳抗体支架结构来移植三个nrf2热点,同时维持与keap1的热点原始相互作用模式。我们将“残基三元组”定义为由三个虚拟三角形组成,所述个虚拟三角形分别连接三个残基的主链cα、n和c原子。三元组的特征在于九个顶点(vα1、vα2、vα3、vn1、vn2、vn3、vc1、vc2和vc3,对应于由三元组组成的三个残基的九个主链cα、n和c原子的位置)和九条边(eα1、eα2、eα3、en1、en2、en3、ec1、ec2和ec3,对应于三个三角形的边)。在热点侧,从三个nrf2热点残基(glu79、thr80和glu82)中列举出任何三个逆旋转异构体,并将其编译成残基三元组。通过确保最长和第二长的cα边总是分别对应于eα1和eα2来规范化每个三元组。通过按顺序串连六条边的四舍五入(ro)的长度将每个三元组索引为唯一的字符串密钥。例如,对于eα1=6.32、eα2=4.67、eα3=8.8、en1=4.3、en2=3.93、en3=7.21、ec1=5.28、ec2=5.4和ec3=9.82的给定三元组,该密钥表示为:

密钥=串联[ro(e)]=6594475510

将热点三元组的所有非冗余索引密钥存储到查找表中以快速访问相应的热点三元组的信息(包括顶点残基类型和原子坐标),以便于以后移植到抗体支架结构的cdr上。

在抗体支架侧上,列举任何三个cdr残基,并将其编译成三元组。以与针对热点三元组相同的方式产生索引密钥查找表。为了找到能够在cdr中的几何匹配位置中容纳三个热点残基的抗体支架结构,通过直接比较各个索引密钥来鉴定相同的热点和抗体支架三元组。通过将支架三元组叠加到相应的相同热点三元组上以最小化三个三元组三角形的两组九个顶点之间的rmsd,来将抗体支架移植到热点上。通过将热点主链原子拟合到抗体三元组残基的那些主链原子上,将3个支架三元组残基替换为相应的热点残基。

对于从热点移植获得的每种抗体设计,将抗体支架中与keap1原子发生冲突的界面残基侧链突变为丙氨酸以减少冲突。计算替换前后热点侧链原子的重原子rmsd。使用rosettappk.xml脚本对所有残基进行重新打包和最小化。将下述几种过滤器用于分类设计:

·替换到抗体支架上之前和之后热点的重原子rmsd小于

·结合后埋藏的溶剂可及表面积(sasa)大于(hu,z.,ma,b.,wolfson,h.&nussinov,r.conservationofpolarresiduesashotspotsatproteininterfaces.proteins39,331–342(2000)。

·形状互补性(sc)分数大于0.5。

·rosettaδg分数(结合能)低于0.0reu。

通过这些过滤规则的存活设计最终通过rosettaδg分数排序。

cdrh3环交换

通过从模型化的g54.1/keap1复合物结构的fv区域截短每个cdr环来计算单个cdr环对g54.1的rosettaδg评分的贡献(图16)。重新计算每个cdr截短突变体的rosettaδg分数。通过计算每个cdr截短突变体与原始g54.1抗体之间的rosettaδg分数差异来估计cdr个体对结合的贡献。

先前的热点移植阶段中使用的抗体支架晶体结构的所有外源cdrh3环均在fv结构的vh93至vh103(根据chothia编号方案)的位置处被切割出来,并被标记为cdrh3锚定残基。为了将外源cdrh3环移植到g54.1上,将g54.1的原始cdrh3环从vh94到vh102的位置去除,留下vh93和vh103作为fv锚定残基。通过叠加来自两组锚定残基的主链原子,将每个外源cdrh3环拟合到g54.1fv结构上。随后去除g54.1的fv锚定残基,并通过连接cdrh3锚定残基与相邻的g54.1残基(vh92和vh104),来将移植的外源cdrh3环连接到g54.1fv上。如果新的cdrh3环的主链原子与原始g54.1/keap1复合物结构有冲突,则弃去所得的结构。将与g54.1/keap1残基有冲突的任何cdrh3残基侧链突变为丙氨酸以减少冲突。如步骤2中使用rosettappk.xml脚本重新打包从cdrh3交换获得的最终结构并使之最小化,并通过rosettaδg分数对其进行排序。

rosetta序列设计

进行两轮rosetta序列设计以分别优化来自热点移植和cdrh3交换的设计抗体的结合亲和力。

在第一轮中,从容纳三种nrf2热点介导的keap1相互作用模式的五种设计抗体结构开始,将抗体侧中的每个界面cdr残基突变为其他氨基酸类型(除半胱氨酸、甘氨酸和脯氨酸外)以探测突变对rosettaδg分数的影响,以便鉴定可能能够提高设计抗体与keap1的计算结合能的突变体。将rosetta脚本mutationscanpb.xml(用于使用具有改进的静电评分项的评分函数计算结合自由能在计算机模拟诱变期间的变化)用于产生单点突变体列表。通过计算rosettaδg分数的变化或每个突变型体结构与相应的野生型结构之间的变化来对点突变进行排序。选择排名最前的单点突变并组合(最多5个突变)以产生原始抗体移植物的变体。

在第二轮中,使g54.1上的交换的cdrh3环的所有残基同时突变为所有其他氨基酸类型(不包括甘氨酸、脯氨酸和半胱氨酸),其中使用rosettaflexbb-interfacedesign.xml脚本,使用backrub方法来局部扰乱cdr和keap1上的所有界面残基的主链构象。评分函数中未使用显式静电(explicitelectrostatics)。从软排斥势(soft_rep权重)开始并以默认的全原子力场(分数12权重)结束,使用重新设计和最小化的三次迭代来增加发现更高亲和力的相互作用的可能性。将先前针对热点移植设计所描述的类似过滤器规则用于对所得的cdrh3-交换设计的结构进行分类和排序:

·结合后埋藏的sasa大于

·rosettaδg分数低于-20.0reu。

·sc分数大于0.6。

设计评分

通过rosetta3.4interfaceanalyzer应用计算所有先前描述的用于对设计进行过滤或排序的计算特征(补充表2,5):

·rosettaδg分数或结合能被定义为结合状态与未结合状态的总系统能量之间的差异。在每种状态下,使界面残基重新打包。

·模型化的复合物结构的rosetta总能量。

·埋藏的溶剂可及表面积(sasa)被定义为结合状态与未结合状态下总系统sasa之间的差异。

·模型化抗体/keap1复合物结构的形状互补性(sc)分数。

·埋藏的不饱和极性原子。

最后,将热点移植后5个独特支架中的10个设计(补充表3)和g54.1的19个cdrh3交换变体选择用于实验测试(补充表6)。

keap1表达和纯化

将编码keap1的kelch结构域的基因与n-末端his标签和tev蛋白酶切割位点框内克隆入表达载体pet-28a中。将该构建体转化入大肠杆菌(e.coli)菌株bl21(de3)中,随后在37℃下在含有25ug/ml卡那霉素的2ty培养基中培养。在o.d.600为4时用0.3mm异丙基β-d-1-硫代半乳糖吡喃糖苷(iptg)诱导蛋白质产生。添加iptg后,立即向培养物中添加甘油基补料(50mmmops、1mmmgso4/mgcl2、2%甘油),并将培养物在17℃下进一步孵育过夜。通过离心收获细胞并将其在含有50mmtrisph8.5、50mmnacl、10%甘油、0.5%tritom-x100、20mm咪唑和足够量的蛋白酶抑制剂(roche)的缓冲液中进行裂解。将通过离心预澄清的裂解物用0.2μm过滤器过滤,然后与ni-nta珠(qiagen)混合。用50mmtrisph8、150mmnacl、50mm咪唑和1mmdtt洗涤珠粒,然后用补充有咪唑的前一缓冲液将keap1洗脱至250mm的浓度。切掉his标签后,将样品施加到ni-nta(qiagen)柱上以除去任何结合ni的污染性蛋白质。收集流出物并通过尺寸排阻(superdex75,gehealthcare)进一步纯化,并且如果需要,进行离子交换(monoq,gehealthcare)层析。将纯化的keap1浓缩并在-80℃下贮存于20mmtrisph7.5和5mmdtt中。

抗体克隆和表达

通过dna2.0,inc.化学合成计算机模拟设计的重链和轻链可变区基因。采用转录活性pcr(tap)分别扩增重链和轻链可变区,随后引入编码hcmv启动子序列、人γ1ch1和cκ(km3同种异型)恒定区和poly(a)尾的dna序列。所得到的构建体含有瞬时细胞表达所需的所有组分。为了产生fab片段用于spr分析,使用293fectin脂质转染(lifetechnologies,根据制造商的说明书),用tap产物瞬时转染hek-293细胞。

呈fab形式的前4种高亲和力cdrh3-交换抗体的结晶学试验未能产生与keap1复合的衍射质量晶体。为了将ls146从fab转化为scfv构建体,由dna2.0,inc.合成编码与vl(通过(gly4ser)4接头)、his10标签以及tev蛋白酶切割位点融合的vh的基因,并将其克隆入ucb专享表达载体中。在补充表10中给出了基因产物的氨基酸序列。使用电穿孔,用质粒dna瞬时转染cho-sxe细胞(来源于cho-k1的细胞系)。通过离心除去细胞,并将scfv-tev-his标记的蛋白质通过imac纯化。上清液用0.2um过滤器过滤,然后加载到histrapexcel柱(gehealthcare)中。用50mmtrisph8、150mmnacl、45mm咪唑洗涤柱子,然后用50mmtrisph8、150mmnacl、250mm咪唑洗脱抗体。去除his标签后,再次将样品施加到histrapexcel柱以除去结合ni的污染性蛋白质。收集流通液并通过尺寸排阻(superdex75,gehealthcare)层析进一步纯化。将纯化的抗体在50mmhepesph7.5、150mmnacl、5%甘油中浓缩,并在-80℃下等分贮存直至需要。

结合分析

使用来自同一制造商的试剂在biacore3000系统(gehealthcare)上进行表面等离子体共振(spr)实验。通过特异于抗-人f(ab’)2的亲和纯化的山羊多克隆f(ab’)2片段(jackson109-006-097)将fab捕获在cm5传感器芯片的表面上。如下通过胺偶联将后者固定在活化的羧甲基葡聚糖表面上:将50mmn-羟基琥珀酰亚胺和200mm1-乙基-3-(3-二甲氨基丙基)-碳二亚胺的新鲜混合物以10μl/分钟的流速注射5分钟,随后以相同的流速将10mm乙酸盐ph5.0缓冲液中的50μg/ml抗-人f(ab’)2注射5分钟。最后用10分钟的1m乙醇胺·hcl(ph8.5)的脉冲使表面失活。参考流动池在芯片上,通过从上述步骤中省略蛋白质来制备,从而在以下实验中获得作为抗f(ab')2与参考流动池之间的响应单位差的传感图。通过以10μl/分钟的流速在参考和抗-f(ab’)2流动池上方注射以1:5于运行缓冲液中稀释的50μl上清液,然后以30μl/分钟的流速注射运行缓冲液中的150μl的0、500或5000nmkeap1来评估keap1与表达的fab的初步结合。在持续至少5分钟的解离期后,用两个60秒的40mmhcl脉冲(其间以相同的流速间插30秒的5mmnaoh脉冲)再生芯片表面。利用相同的方案在至少8个以下浓度值下测定keap1与捕获的fab结合的结合和解离动力学:75、100、150、250、350、500、750、1000、1500、2500、3500和5000nm。将零keap1对照分散在先前的循环之间以校正基线漂移,并在每个keap1浓度下评估假转染的上清液以确定并校正keap1的非特异性结合。fab与keap1结合的特异性通过与高亲和力nrf2肽类似物、生物素-peg-lqldeetgeflpiq-酰胺(对应于包含更强的keap1结合环基序的nrf2残基74至87)的竞争来评估。使用上述方案跟踪在对捕获的fab的肽滴定存在的情况下的肽keap1结合。使用biaevaluationtm软件,首先通过减去零keap1对照循环和相应的非特异性对照循环,然后拟合解离和结合动力学,转化所有传感图。解离常数(kd)据估计为在至少6个keap1浓度下测量的值的对数平均值。使用graphpadprismtm软件,通过拟合由以下方程式表示的对数浓度对标准化的反应/变量斜率模型来计算ic50值,其中在每一个浓度下重复处理三个报告点的百分比抑制值:

结晶

在复合物形成之前,将keap1缓冲液交换到ls146-scfv的贮存缓冲液(50mmhepesph7.5,150mmnacl和5%甘油)中。这从keap1贮存缓冲液中去除了dtt并防止其破坏抗体中的二硫键。然后将keap1与ls146-scfv以1:1.5的摩尔比混合并在室温下孵育30分钟。通过尺寸排阻层析(superdex75tm26/60,gehealthcare)纯化复合物并浓缩至5mg/ml。以坐滴蒸汽扩散(sitting-dropuapor-diffusion)形式利用200nl蛋白质溶液加200nl贮存溶液(qiagen)的最初结晶试验,在两种条件下产生晶体。使用从初始筛选中获得的晶种再生和优化命中结晶条件(0.2m乙酸钠和20%peg3500)之一,产生衍射质量的晶体。将晶体在母液(补充peg3350达到35%(w/v))中进行低温保护,并在数据收集之前将其在液氮中进行玻璃化。

晶体学数据收集和处理

在diamondlightsource同步加速器设备(didcot,unitedkingdom)上针对波长为的束线104-1收集来自晶体ls146-scfv/keap1复合物的数据集。使用keap1(pdb登录码1x2j12),无cdr环的vh和vk构架(pdb登录号3ivk13)作为模型,使用ccp4软件包10,11中的程序phaser9进行分子置换。参见:mccoy,a.j.等phasercrystallographicsoftware.j.appl.crystallogr.40,658–674(2007);potterton,e.,briggs,p.,turkenburg,m.,&dodson,e.agraphicaluserinterfacetotheccp4programsuite.actacrystallogr.sect.d59,1131–1137(2003);winn,m.d.等overviewoftheccp4suiteandcurrentdevelopments.actacrystallogr.sect.d67,235–242(2011);padmanabhan,b.等structuralbasisfordefectsofkeap1activityprovokedbyitspointmutationsinlungcancer.mol.cell3,689–700(2006);和shechner,d.m.等crystalstructureofthecatalyticcoreofanrna-polymeraseribozyme.science326,1271–1275(2009)

晶体的溶剂含量经测定为46.09%,并且在非对称单元中有两个拷贝的复合物。解析见于三个阶段;首先检索并获得两个拷贝的keap1的位置,然后获得两个拷贝的重链和两条轻链的位置。使用refmac5.4(refinementofmacromolecularstructures)和coot(crystallographyobject-orientedtoolkit)分别进行细化和模型构建(refinementandmodelbuilding)。使用rampage、procheck、sfcheck和由rcsb蛋白质数据库提供的验证工具对最终模型的几何质量进行验证。补充表11提供了ls146-scfv/keap1的数据收集和细化统计。参见:murshudov,g.n.,vagin,a.a.&dodson,e.j.refinementofmacromolecularstructuresbythemaximum-likelihoodmethod.actacryst.d53,240–255(1997);emsley,p.&cowtan,k.coot:model-buildingtoolsformoleculargraphics.actacrystallogr.sect.d60,2126–2132(2004);lovell,c.structurevalidationbycalphageometry:phi,psiandcbetadeviation.proteins50,437–450(2002).17.laskowski,r.a.,macarthur,m.w.,moss,d.s.,&thornton,j.m.procheck:aprogramtocheckthestereochemicalqualityofproteinstructures.j.appl.crystallogr.26,283–291(1993);和vaguine,a.a.,richelle,j.,&wodak,s.j.sfcheck:aunifiedsetofproceduresforevaluatingthequalityofmacromolecularstructure-factordataandtheiragreementwiththeatomicmodel.actacrystallogr.sect.d55,191–205(1999)。

另外的实施例-通过移植来自天然tgfβ受体和已知的抗tgfβ抗体的组合热点残基来计算设计新型泛tgfβ阻断抗体fab片段

受到靶向keap1的抗体设计成功的启发,我们对tgfβ应用相同的方法来设计泛特异性抗-tgfβ抗体。tgfβ被广泛表达并具有多种不同的功能,包括免疫稳态和纤维化调节。tgfβ以同二聚体形式存在,并且存在至少三种同源同种型(tgfβ1、tgfβ2和tgfβ3),其通过相同的受体复合物(由tgfβ二聚体和三种膜受体(tgfβr1、tgfβr2和tgfβr3)组成)发信号。tgfβr2最初结合在tgfβ上的“指”的尖端,随后招募另外两种受体与tgfβ二聚体界面结合。已经解析了tgfβ1与tgfβr1和tgfβr2的胞外结构域的晶体复合物结构。我们试图通过移植来自两种受体的五个界面热点残基来设计在与两种受体相同的区域结合的抗体,但不幸的是未能产生任何经实验验证的结合。据推测受体启发的热点不够强,从而不足以将抗体支架模板固定在期望的结合部位,因为热点供体(tgfβ受体)的亲和力非常弱(对于tgfβr1和tgfβr2,kd值分别为2.5μm和0.4μm)。夫苏木单抗(gc-1008)是具有低纳摩尔浓度亲和力的泛tgfβ阻断抗体。与tgfβ3复合的夫苏木单抗的晶体结构显示夫苏木单抗的表位与受体结合部位高度重叠。因此,通过将来自这两种受体和夫苏木单抗的热点残基混合来推测,因为组合查询将增加在相同区域产生抗体结合剂结合的机会。通过虚拟丙氨酸扫描选择来自受体1和2的5个残基和来自夫苏木单抗的9个残基,并将其用作混合查询热点。值得注意的是,我们的热点移植方法是基于残基三元组散列法,所述方法每次首先只移植14个热点残基中的3个以确定给定的抗体模板的取向,通过检查其余热点的主链原子的位置与当前热点三元组所固定的抗体模板的取向上的任何残基的位置是否接近来将其余热点移植至所述给定的抗体模板上。在热点移植后,使用前面在keap1案例中提及的相同方法,通过rosetta突变抗体模板的cdr环上的残基,以产生新的序列来稳定当前的移植物和取向。鉴于三种tgfβ在受体结合部位处的高度同源性,只有来自与tgfβr1和tgfβr2的复合物的tgfβ1结构被用作抗原靶标来计算每个设计的抗体fab结构模型的rosetta结合能。

使用上述biacore测量设计的抗体fab片段的亲和力。只有一种设计的fab对tgfβ1和tgfβ3显示明显的亲和力(kd分别为106和32.9nm),并且对tgfβ2的亲和力弱得多(标准曲线难以拟合)。亲和力比参考抗体夫苏木单抗弱得多,但稍强于受体。为了测试设计的抗体是否能够阻断受体的结合并破坏启动的下游信号传导,开发了由tgfβ结合驱动的细胞报道基因测定来确定设计的抗体的阻断效力。证明了在抗体结合后,通过所有三种tgfβ与相应受体的结合引发的下游信号传导以浓度依赖性方式被部分破坏。测定ic50,显示其与来自生物物理结合测定的kd的相关性。这表明所设计的抗体fab虽然表现出弱亲和力,但可能在与受体和夫苏木单抗表位重叠的区域结合,因此以泛特异性方式阻断受体结合。

将设计的fab与tgfβ1的复合物结晶并且解析结构。正如预测的那样,fab完全占据tgfβ1上的两个受体结合部位,并且与预测的结合位置很好地重叠。抗体的重链使用疏水性残基占据结合部位的大部分,包括具有来自受体和夫苏木单抗的四个热点残基的cdrh2和h3。

补充表12显示了来自热点移植物的有序抗体fab设计的结合亲和力。解离常数(kd)通过spr测定。

补充表13显示来自热点移植物的有序抗体设计的fv区的氨基酸序列。

补充表14显示报道基因测定(n=2)中来自热点移植物的fab184设计的泛阻断ic50。

图34-37描绘了通过转移组合的受体激发的和夫苏木单抗激发的热点残基进行的泛tgfb阻断fab片段设计:图34-来自tgfβr1和2以及夫苏木单抗的组合热点残基;图35-具有固定在芯片上的设计的抗体fab的fab184/tgfβ复合物的spr动力学分布;图36-在hekblue报道基因细胞测定中通过滴定fab184tgfβ来中和tgfβ-受体结合;和图37-通过叠加到tgfβ1侧上比较晶体fab184与模型化fab184的结合模式。

补充表

补充表1.通过计算机模拟丙氨酸扫描鉴定nrf2热点

补充表2.来自热点移植物的有序抗体设计的计算特征。

补充表3.来自热点移植物的有序抗体设计的fv区/氨基酸序列。

补充表4.来自热点移植物的有序抗体fab设计的结合亲和力,通过spr测定解离常数(kd)

1pdb结构中的原始抗原:ahen溶菌酶;brna片段;c,dhiv-1包膜糖蛋白gp120;e诊断性染料分子。

2nd:未测定的

3检测限=0.008

4kd的95%置信区间

补充表5.g54.1的有序cdrh3交换变体的计算特征

补充表6.g54.1的有序cdrh3交换变体的fv区的氨基酸序列。所有cdrh3-交换vl序列与g54.1的相同。

补充表7.g54.1的cdrh3交换变体的有序抗体fab片段的结合亲和力。解离常数(kd)通过spr测定。

1外源性cdrh3环的pdb抗体结构

补充表8.使用abangle18的结构vh/vl取向分析。两个参考帧平面被映射到fv结构上。如18所述,通过在每个平面上定义矢量c和三个点,将vh/vl取向描述为等同于测量两个平面之间的取向

1hi与li之间的扭转角度;2hi与c之间的弯曲角度;3h2与c之间的弯曲角度;4li与c之间的弯曲角度;5l2与c之间的弯曲角度;6c的长度。

补充表9.本研究中用于热点移植物设计的抗体v区支架结构列表。每个支架被命名为:pdb代码+“_”+vh链id+vl链id。

补充表10.用于结晶的keap1和ls146-scfv构建体的氨基酸序列

补充表11.晶体学数据收集和结构细化统计。

补充表12.来自热点移植物的有序抗体fab设计的结合亲和力。解离常数(kd)通过spr测定。

补充表13.来自热点移植物的有序抗体设计的fv区氨基酸序列。

补充表14.在报道基因测定中(n=2),接受者的来自热点移植物的fab184设计的泛阻断ic50。

伪码

移植到抗体支架结构上的热点伪码:

#主要功能:迭代所有抗体支架结构,进行

graftscaffoldontohotspots

defmain(stringantigenpdb,stringhotspotspdb,string

scaffoldspath):

#加载抗原和热点

proteinantigen=readpdb(antigenpdb)

proteinhotspots=readpdb(hotspotspdb)

#重复每个模板

forscaffoldpdbinscaffoldspath:

proteinscaffold=readpdb(scaffoldpdb)

#生成移植的复合物结构

proteingraft=graftscaffoldontohotspots(antigen,hotspots,scaffold)

#转储消除移植物结构

dumppdb(graft)

#functiongraftscaffoldontohotspots:将一个抗体支架移植到热点上

defgraftscaffoldontohotspots(proteinantigen,proteinhotspots,proteinscaffold):

#枚举所有热点三元组并存储在热点三元组列表中

listhotspotstripletlist=[]

forr1,r2,r3inhotspots:

triplethotspotstriplet=setuptriplet(r1,r2,r3)

hotspotstripletlist.append(hotspotstriplet)

#枚举所有模板cdr三元组并存储在scaffoldtripletlist中

listscaffoldtripletlist=[]

forr1,r2,r3inscaffold’scdrresidues:

tripletscaffoldtriplet=setuptriplet(r1,r2,r3)

scaffoldtripletlist.append(scaffoldtriplet)

#迭代每对支架三元组和热点三元组,找到具有相同密钥的对,并比对相应的三元组

listsolutionlist=[]

forhotspotstripletinhotspotstripletlist:

forscaffoldtripletinscaffoldtripletlist:

ifhotspotstriplet.key==scaffoldtriplet.key:

#比对和残基突变

使用rms拟合,通过相应的三元组将抗体模板对齐热点将三个模板三元组残基替换为相应的热点

#冲突检查

将抗体与抗原主链上的任何冲突残基突变为丙氨酸

如果丙氨酸突变后冲突仍然发生:

弃去当前的移植物

否则:

将当前移植物添加到solutionlist

按升序热点rmsd对solutionlist进行排序

#输出抗原与移植抗体支架(具有突变的热点)的复合物结构

返回solutionlist.top

#class三元组和功能setuptriplet:建立残基三元组

class三元组:

残留残基1,残基2,残基3

字符串密钥

defsetuptriplet(残基r1,残基r2,残基r3):

#残基三角形的边长(由残基1.cα,残基2.cα,残基3.cα决定)

dcα12=距离(r1.cα,r2.cα),dcα23=距离(r2.cα,r3.cα),dcα13=距离(r1.cα,r3.cα)

#残基三角形的边长(由残基1.n,残基2.n,残基3.n决定)

dn12=距离(r1.n,r2.n),dn23=距离(r2.n,r3.n),dn13=距离(r1.n,r3.n)

#残基三角形的边长(由残基1.c,残基2.c,残基3.c决定)

dc12=距离(r1.c,r2.c),dc23=距离(r2.c,r3.c),dc13=距离(r1.c,r3.c)

#过滤任何长度小于3.5a的三角形

如果任何dcα,dn或dc<=3.5:

返回假的

#r1和r2对应最长的cα边,r1和r3对应最短的cα边将r1,r2,r3重新排序,对应于降序dcα12,dcα23,dcα13

#通过四舍五入边长并连接成字符串来索引三元组的密钥

key=字符串(四舍五入(dcα1))+字符串(四舍五入(dcα2))+字符串(四舍五入(dcα3))+字符串(四舍五入(dn1))+字符串(四舍五入(dn2))+字符串(四舍五入(dn3))+字符串(四舍五入(dc1))+字符串(四舍五入(dc2))+字符串(四舍五入(dc3))

#将r1,r2,r3和密钥重新排序成三元组

返回三元组(r1,r2,r3,密钥)

g54.1的cdrh3环交换的伪码:

#主要功能:迭代所有抗体cdrh3环结构,做swapcdrh3

defmain(stringantibodyantigencomplexpdb,stringcdrh3spath):

#加载抗体-抗原复合物pdb结构

蛋白质系统=readpdb(antibodyantigencomplexpdb)

#切掉wtcdrh3环

蛋白质截短的h3系统=chopcdrh3(系统)

#迭代每个外源性cdrh3环结构

forcdrh3looppdbincdrh3spath:

proteinh3loop=readpdb(cdrh3looppdb)

#生成h3交换的复合物结构

proteinloopswap=swapcdrh3(truncatedh3system,h3loop)

#转储移植结构

dumppdb(loopswap)

#functionswapcdrh3:将一个外源cdrh3环移植到cdrh3截短的抗体-抗原复合物结构上

defswapcdrh3(proteintruncatedh3system,proteinh3loop):

#外源性h3环的锚定残基与cdrh3-截短的fv的锚定残基的比对

将h3loop锚定残基(vh93和vh103)与截短的h3系统对齐从截短的h3系统中除去原始的vh93和vh103残基

将新的h3loop的vh93和vh103的主链分别与截短的h3系统的vh92和vh104连接,产生swappedh3system(将新h3环插入与抗原复合的原始fv中)

#冲突检查

对于h3loop上的任何冲突残基以及swappedh3system的主链的其余残基,将它们突变为丙氨酸

如果丙氨酸突变后冲突仍然发生:

则弃去当前的swappedh3system

否则:

#输出抗原-fv和移植的新h3环的复合物结构

返回当前的swappedh3system

rosettascripts:alascan.xml:

rosettascripts:ppk.xml:

rosettascripts:mutationscanpb.xml:

rosettascripts:flexbbinterfacedesign.xml:

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1