异源二聚化的Ig结构域的制作方法

文档序号:20602176发布日期:2020-05-01 21:44阅读:8084来源:国知局
异源二聚化的Ig结构域的制作方法

本发明提供包含异源二聚化区域hri和hrii的蛋白质复合物,异源二聚化区域hri和hrii各自由反向平行的β链和间隔区构成,其中hri和hrii各自为免疫球蛋白或免疫球蛋白样蛋白的两种人恒定区穿插的融合蛋白(interspersedfusionprotein)。本发明还提供了包含编码该蛋白质复合物的序列的核酸分子和包含该核酸的载体。本发明还提供了用作药物的蛋白质复合物、核酸和载体。本发明进一步提供了确定hri的氨基酸序列和/或hrii的氨基酸序列的方法。本发明还提供了产生hri的氨基酸链和/或hrii的氨基酸链的方法。本发明进一步提供了用于预防、治疗或诊断病症或疾病的蛋白质复合物。



背景技术:

双特异性抗体在诊断和治疗上的应用越来越引起人们的兴趣。kontermannre和brinkmannu(2015)drugdiscoverytoday;20(7):883及其引用的参考文献中提供了全面的综述。天然抗体是单特异性的,而双特异性抗体识别相同或不同抗原上的两个不同表位。双特异性抗体的应用涵盖了诊断、成像和治疗的广泛领域。最初,治疗应用主要集中于重靶向癌症治疗的效应细胞,包括不能通过正常抗体募集到肿瘤细胞的t细胞。然而,在过去的十年中,已经建立了许多基于双特异性抗体的其他治疗策略,除效应分子、细胞和遗传载体的重靶向外,还包括双重靶向策略、半衰期延长和通过血脑屏障的递送。适应症包括癌症、慢性炎症性疾病、自身免疫性疾病、出血性疾病和感染。

具有确定特异性的双特异性抗体是人工分子,其本身在自然界中不存在。因此,它们必须通过分子或遗传手段产生。由于抗原结合位点是由轻链和重链的可变域(vl、vh)建立的,因此双特异性igg分子的产生面临两个主要问题。第一,双特异性抗体需要两条不同的重链,第二,它还需要两条不同的轻链。因此,由于至少两个不同的可变域(fv)区域的存在,双特异性igg抗体表现出不对称性。在一个细胞中表达的两种抗体的重链和轻链的混杂配对理论上可以产生10种不同的组合,其中只有一种是双特异性的,其余的配对则导致无功能或单特异性的分子(schaefer等人,2016)。指导并迫使正确结合位点即重链和轻链的正确组装是产生双特异性抗体的挑战之一。

以下章节中描述的迫使重链异源二聚化的基因工程将双特异性igg形成的问题之一作为目标。尽管异源二聚体重链仍可与两种不同的轻链组装,从而产生四种可能的组合,一种双特异性分子,一种非功能性组合和两种单特异性分子,但它将可能的组合从10种不同的分子减少为4种组合。重链配对由恒定区的最后一个结构域介导,即igg分子中的ch3,它形成高亲和力的同源二聚体复合物。进一步的相互作用存在于负责两条重链共价连接的铰链区,其在重链组装后形成。

各种策略使用空间或静电转向效应或其组合以产生相对于同源二聚化更有利于异源二聚化的互补界面。

ridgway及同事通过在一个ch3界面上将小侧链置换为较大的侧链以产生杵,并另一个ch3结构域上将大侧链置换成较小侧链以产生臼,从而生成有利于异源二聚体组装的ch3界面(ridgway等人,1996)。测试了各种变体证明优先的异源二聚化,其中一条链上具有置换t366y,另一条链上具有y407t。这些最初的杵臼突变(knobs-into-holesmutation)例如用于产生针对her2和igf-1r的igg。随后扩展了“杵臼”方法,通过噬菌体展示确定了其他合适的组合。然后将这些突变用于生成双特异性igg抗体,测试另外的替换以允许形成二硫键。一种变体显示>95%的异源二聚体形成(s354c、t366w/y349c、t366s、l368a、y407v)。然后将该异源二聚体重链应用于使用相同的vl结构域从单链可变片段(scfv)构建针对mlp和her3的双特异性抗体,从而表达共同轻链(merchant等人,1998)。异源重链产生功能性双特异性抗体,允许通过蛋白a色谱法纯化,并保留fc介导的效应功能,例如adcc。该方法被采用以产生各种双特异性抗体,并且如今形成了产生双特异性igg分子及其衍生物的通用基础,igg分子的衍生物包括三价ig样抗体以及双特异性fc和ch3融合蛋白。

一个例子是t细胞重靶向双特异性抗体。为了避免t细胞通过与cd3的二价结合而全身性激活,设计了仅表现出一个cd3结合位点的分子。这包括scfv-fc(kih)(在每条fc链上带有一个scfv)和串联scfv-fc(kih)(bite-kih),其中串联scfv与fc链之一融合(xu等人,2015年)。在这项研究中,cd3结合部分分别与含杵或含臼的fc链(kih,kihr)融合。令人感兴趣的是,就表达效价而言,bite-kihr优于bite-kih。然而,在t细胞活化和肿瘤细胞裂解方面未观察到差异。以相似的方法,fc-kih用于产生针对cd16和her2的二价、双特异性scfv-fc融合蛋白,以使nk细胞重新靶向肿瘤细胞(xie等人,2005)。

单价结合以避免受体交联和激活对于靶向细胞表面受体(例如c-met)的抗体可能也是必不可少的。通过将fab臂融合到fc臼链的n端和将二硫键稳定的scfv融合到相同fc臼链的c端,并与未融合的fc杵共表达,从而产生了与细胞表面受体单价结合的双特异性抗体,其应用两种不同受体的双重靶向和中和作用。

vh结构域与一条fc(kih)链的c末端融合,而vl结构域单独表达或与另一条fc(kih)链的c末端融合,产生双特异性三价igg-fv(mab-fv)融合蛋白,其中fv片段通过域间二硫键稳定化(metz等人,2012)。igg-fv融合物中fv片段的灵活性可以通过引入蛋白水解切割位点来增加,例如对于弗林蛋白酶或mmp,在连接vl结构域和fc链的接头中引入。切割后,产生双特异性分子,其c端fv片段仅通过vh结构域连接至igg。同样,生成的scfv-fc-fv融合蛋白对egfr表现出两个结合位点(与fc链的n端融合的scfv),对lps表现出一个结合位点(与fc(杵)的c端融合的vh和与fc(臼)的c端融合的vl)。双特异性igg(kih)抗体的其他衍生物包括trimab。在此,将一个或两个二硫键稳定的scfv与一条或两条fc(kih)链融合,分别得到三特异性、三价或四价抗体。对于靶向egfr、igf-1r和cmet,或egfr、igf-1r和her3的trimab,这已显示出来。在这种方法中,fab片段由具有二硫键稳定的fv结构域的单链fab片段组成。

近来,杵臼策略被扩展到其他igg同型以产生igg4异源二聚体,其本身缺乏fc介导的效应功能,例如产生针对il-4和il-13的双特异性抗体。

使用基于结构和序列的方法探索跨ch3二聚体的界面上配对变体组合的能量,产生了ha-tf变体(s364h、f405a/y349t、394f),该变体在开发用于共靶向her2(二价结合)和cd3(单价结合)的双特异性mab-fv(igg-fv)分子的情况下显示出约83%的异源二聚体形成。使用此ch3异源二聚体的其他例子包括单价和二价scfv-fc融合蛋白。

另一种合理的结构指导的方法导致了一组突变,据报道这些突变具有很高的热稳定性,并形成了纯的异源二聚体,而没有可检测的同源二聚体。fc设计(zw1)在第一条fc链中包括t350v、l351y、f405a和y407v置换,在第二条fc链中包括t350v、t366l、k392l和t394w置换。

尽管上述策略主要依赖于疏水相互作用,但其他方法也利用静电相互作用(转向)通过静电排斥作用来避免ch3结构域的同源二聚化,并通过静电吸引来引导异源二聚化。在野生型ch3域中,在ch3-ch3界面处发现了k409和d399之间的两种电荷相互作用。发现在一个ch3结构域k409中用天冬氨酸置换,在另一个ch3结构域d399中用赖氨酸置换有利于ch3异源二聚体的形成。进一步引入置换,例如一条链中的k392d和另一条链中的e356k。进一步引入的带电对会降低产率。该方法使用两个电荷对置换(k409d、k392d/d399k、e356k;ch3电荷对)生成了针对cd3和tartk的双特异性scfv-fc融合蛋白,最近又生成了针对egfr和her2、或者硬化蛋白和dkk-1的双特异性igg。这包括在fab臂中引入新的电荷对,以指导正确的轻链配对。

静电转向效应还用于biclonics,利用常见轻链和异源二聚化重链的双特异性抗体(geuijen等人,2014)。在此,一个ch3(366、366+351)中的残基被带正电荷的赖氨酸残基置换,第二个ch3中的一个或多于一个残基(例如349、351、355、368)被带负电荷的谷氨酸或天冬氨酸残基置换。一种针对her2和her3的基于该技术的双特异性抗体(mcla-128)目前正在临床i/ii期试验中。

还已经实现了优选的重链异源二聚化,将电荷对引入igg1和igg2的铰链区。对于igg1,这些铰链替换包括第一个铰链中的d221e、p228e和第二个铰链中的d221r和p228r。对于igg2,置换包括在一个铰链区中的c223e和p228e以及在另一个铰链区中的c223r、e225r、p228r。在此,e225r能够在位置225与天然存在的谷氨酸形成静电相互作用,因此在第一个igg2铰链中仅需要两个置换。这些突变分别与l368e和k409r结合,以迫使ch3域中的异源二聚体组装。通过使用两种抗体的单独表达和随后从半抗体的组装,显示了抗egfr×抗her2双特异性igg抗体以及抗ce×抗cd20抗体的适用性。

在另一项研究中,通过以下方法鉴定了有利于ch3结构域异源二聚体组装的突变:首先,将保留的疏水性核心(l351、t366、l368、y407)边缘周围的带电荷残基置换为较大或较小的疏水性氨基酸,以使用不对称的疏水相互作用代替对称的静电相互作用,然后,将具有弱相互作用的氨基酸置换为带电荷的长侧链的氨基酸,从而形成不对称的长程静电相互作用。这导致了一个ch3中的k360e、k409w与另一个ch3中的q347r、d399v、f405t(ew-rvt)的最终组合。证实了靶向vegfr-2和met的双特异性scfv-fc异源二聚体的功能。将二硫键引入ch3结构域(第一个结构域中的y349c和第二个结构域中的s354c)增加异源二聚体的形成和热力学稳定性。此外,使用酵母表面展示的组合fc文库,选择携带不同突变并表现出高异源二聚化产率(80-90%)的变体。

基于igg4抗体能够交换其fab臂的结果,动态过程涉及两条重链的分离并重新组装为完整的igg4。该过程归因于igg4核心铰链序列与ch3结构域中的残基缀合。igg4中这种fab臂交换的自然过程适合通过受控fab臂交换(cfae)生成双特异性igg1分子。在ch3结构域中对突变的筛选允许在对应的ch3中发生k409r突变的情况下产生cfae,从而鉴定出突变f405l,其允许在混合并用-巯基乙醇轻度还原后有效交换单独表达的抗体的半抗体。对于抗egfr×抗cd20双特异性igg(duobody),证明了该过程的可规模化,可产生>95%的双特异性分子。

通过设计链交换工程化结构域(seed)异源二聚体,开发了允许fc链异源二聚体组装的ch3界面中的互补性。这些seedch3结构域由衍生自人iga和iggch3序列的交替片段(agseedch3和gaseedch3)组成,并用于生成所谓的seedbody(davis等人,2010)。由于分子模型表明在agseedch3中与初生fc受体(fcrn)的相互作用受到损害,因此ch2-ch3连接处的残基返回到igg序列。药代动力学研究证实,seedbody的半衰期可与其他fc融合蛋白和igg1相当(muda等人,2011)。seedbody的一个例子是生成靶向egfr上两个不同表位的双特异性fab-scfv-fc融合蛋白。这种双对位抗体显示出增强的活性,类似于两种亲本抗体的组合。

通过模拟t细胞受体α和β链的自然缀合,进一步生成ch3异源二聚体界面。为了避免轻链错配,应用了该beat技术(基于t细胞受体的抗体的双特异性结合)来生成fab/scfv-fc融合蛋白。该方法用于产生针对cd3和her2的双特异性抗体,用于t细胞重靶向。

leaver-fay和同事(leaver-fay等人,2016)应用了多阶段设计(msd),该方法可同时设计多个蛋白质阶段,从而在fc界面产生一组ch3突变。结合使用两组(7.8.60和20.8.34)用于生成源自帕妥珠单抗(抗her2)、马妥珠单抗(抗egfr)、bha10(抗)和metmab(抗cmet)的双特异性igg,以及具有正交fab界面突变的抗体,在所有情况下均产生至少93%的双特异性抗体。

重链的异源二聚体组装也可以通过使用单独的异源二聚化模块来实现,该模块随后从双特异性抗体中去除。通过采用从与两个重链的c端融合的acid.p1(ap1)和base.p1(bp1)肽衍生的亮氨酸拉链结构来应用该策略。该luz-y平台用于产生单价fab-fc融合蛋白,但也产生基于针对egfr和her3的常见轻链或scfab臂的双特异性igg。在fc链的c末端和亮氨酸拉链序列之间引入蛋白水解切割位点允许去除亮氨酸拉链,从而产生具有天然组成的双特异性igg抗体。

尽管使用修饰来迫使fc区异源二聚化把重链问题作为目标,但是这些方法仍然遭受轻链问题。因此,使用两条不同的轻链仍然允许产生四种不同的组合,其中只有一种是双特异性的。因此,已经开发出以与fc修饰的重链结合的同源重链和轻链的正确配对为目标的方法。

所描述的第一种方法是使用普通轻链(merchant等人,1998)。这是基于以下观察结果的:从噬菌体展示文库分离的针对多种抗原的抗体通常使用相同的vl结构域,这反映了噬菌体文库中l链库的大小非常有限。结合重链的杵臼修饰,产生例如针对her3和mp1的双特异性igg分子。随后使用例如杵臼修饰还有其他fc修饰生产了具有共同轻链的各种双特异性igg。

为了规避轻链问题,上述几种fc修饰利用与fc链融合的scfv片段产生双特异性抗体。基于fab片段可以表达为单链衍生物(将轻链的c末端与vh结构域的n末端相连的scfab)的发现,通过表达包含与重链连接的轻链的单个多肽可生成完整的igg分子。利用长度为30(例如(g4s)6))至38个残基的接头,包括ch1和cl之间的连接二硫键的缺失。描述了使用60个柔性残基的接头用于二硫键连接的scfab分子的改进的scfab平台。应用g4s6接头结合fc区的杵臼突变生成双特异性fab-fc融合蛋白,并通过scfv片段的c端融合进一步修饰以获得三特异性、三价和四价分子,例如靶向egfr、igf-1r和cmet,或egfr、igf-1r和her3。scfab格式还与luz-yfc异源二聚化策略结合。在此,将蛋白水解切割位点引入fab接头,以允许从正确组装的双特异性igg分子中除去接头。此外,scfab与未修饰的fab片段结合以与fc(kih)结合生成双特异性fab-scfab-fc融合蛋白(oascfab-igg格式),如靶向egfr和igf-1r的双特异性igg所示,其可以以高产率表达。

crossmab技术采用了另一种方法。在此,在杵臼重链的情况下,一个fab臂的轻链被相应重链的fd片段(crossmabfab)交换,或仅一对变量(crossmabvh-vl)或一个fab的恒定区(crossmabch1-cl)在轻链和重链之间交换。这导致未修饰的轻链与相应的未修饰的重链配对以及经修饰的轻链与相应的经修饰的重链配对。对于针对vegf和ang-2的双特异性crossmab的示例,证明了同时的抗原结合且亲和力不变,crossmabch1-cl显示出优异的副产物谱。在随后的研究中,该抗体(a2v)显示出能够重编程与肿瘤相关的巨噬细胞,从而导致许多颅外肿瘤模型中的生存期延长。抗体(rg7716)目前正在临床开发中。在最近的一项研究中,将crossmabch1-cl格式用于产生针对hivenv蛋白和cd4/ccr5的双特异性抗体,以中和病毒。在这里,由于未修饰的轻链的错配,在原始的crossmab中观察到异质性,这可以通过在该链中引入其他突变来改善。crossmab方法已发展成为一种通用的平台技术,不仅可以生成二价双特异性igg分子,而且还可以生成三价和四价的双特异性igg融合蛋白,例如通过将一个额外的fab片段融合到杵臼重链之一的n端或将两个crossmabfab臂融合到同源二聚化重链的c端,crossmab技术支持许多其他形式,包括双特异性、三价和四价igg-fab融合蛋白,例如用以产生双特异性分子,其一个结合位点与cd3结合,两个结合位点与肿瘤相关的抗原结合。通过将杵臼fc区和crossmab技术应用于二合一fab臂,该构思进一步发展为生成四价、四特异性四合一抗体。

解决轻链问题的另一种方法是对轻链和重链界面进行基因工程,以生成正交界面,从而使轻链以更高的亲和力与其同源重链相互作用。在此,改变了可变结构域(vh-vl对)和第一恒定结构域(ch1-cl)之间的相互作用。测试通过多阶段设计应用程序识别的各种修饰,建立了一组突变,这些突变有利于正交fab片段的配对。应用这些修饰以通过结合曲妥珠单抗和帕妥珠单抗的结合位点产生各种双特异性igg分子,例如针对egfr×cmet、egfr×her2、axl×cmet和egfr×ltβrh或针对her2上的两个表位。在这里,fc异源二聚化是通过引入ch3结构域的静电转向效应实现的(gunasekaran等人,2010)。例如,通过在帕妥珠单抗中替换重链的q39k、r62e、h172a、f174g和d1r并且替换轻链的d1r、q38r、l135y、s176w(vrd1、crd2修饰),结合在马妥珠单抗中替换重链的q39y并且替换轻链的q38r(vrd2修饰)来产生具有正交fab臂的、基于具有λ轻链的帕妥珠单抗(抗her2)和马妥珠单抗(抗egfr)的双特异性抗体,获得90%正确的轻链组装。

指导轻链与其同源重链fc片段配对的另一种尝试是用来自t细胞受体(tcr)的cα和cβ结构域替换一个fab臂的ch1和cl结构域。将其用于产生带有(g4s)5接头与重链n-端融合的fab臂的fab-igg分子,或带有(g4s)4接头与重链c-端融合的fab臂的igg-fab分子,例如衍生自曲妥珠单抗和帕妥珠单抗的双特异性抗体。然而,可能由于曲妥珠单抗结合位点的强vh/vl相互作用,只有一小部分显示出正确的fab臂配对。通过在vl结构域(y36f)中引入另外的突变以减弱vh-vl相互作用以及在曲妥珠单抗fv中在vl和vh结构域之间(vlq38d,vhq39k)引入电荷-电荷相互作用,这一点得到了一定程度的改善。

然而,尽管存在许多指导多特异性抗体异源二聚化的方法,但是这些分子是人工的。尤其地,免疫原性仍然是要解决的重要问题。此外,异源二聚化的程度通常不令人满意,并且热稳定性和生物物理性质例如半衰期往往不如预期。

为了克服现有技术中的缺点,本发明人进一步研究了组装成异源二聚体的ig结构域的产生,所述异源二聚体可用作构建用以产生具有一种、两种或更多种特异性和价的分子的单元。关键特征是这些异源二聚体对仅由人类序列组成,并且这些对提供了完全天然的异源二聚体界面,而没有任何引入的突变,因此将诱导免疫应答的可能性降至最低。另外,异源二聚化的ig结构域可以通过二硫键连接,该二硫键形成于天然存在的序列中所包含的半胱氨酸残基之间,并以其进化发展的并由此获得的最佳构象呈现。而且,这些结构域可以进一步具有与例如fcrn或邻近的ig结构域(如ch2或可变结构域)相互作用的能力,它们为异源二聚体结构域提供了进一步的有利特性。令人惊讶地,发现所产生的二价形式的终末半衰期可以被改善并且生物利用度得以增加。此外,这些异源二聚化的ig结构单元用于生成二价或三价和双特异性scfv-fc融合蛋白,以使表达cd3的t细胞重靶向至表达fap(成纤维细胞活化蛋白)或her3的肿瘤细胞或重靶向至被表达fap的成纤维细胞包围的肿瘤细胞。



技术实现要素:

本发明的基本原理是产生可以包含在蛋白质复合物的两种或多于两种蛋白质中的新的异源二聚化区域或异源二聚化蛋白结构域(hri和hrii),其中恒定的免疫球蛋白结构域是天然异源二聚化的(第一cri和第三cri),并且是经修饰的以给hri和hrii提供其他特性。通过将异源二聚化恒定免疫球蛋白结构域(第一cri和第三cri)的氨基酸置换成其他恒定免疫球蛋白结构域的氨基酸(第二cri和第四cri),将这些特性从不同于第一cri和第三cri的一种或多种其他恒定免疫球蛋白结构域(第二cri和第四cri)转移到异源二聚化恒定免疫球蛋白结构域(第一cri和第三cri)。这些特性例如是与初生fc受体(fcrn)的相互作用或与n端或c端连接的蛋白质结构域(例如,不是第一cri、第二cri、第三cri或第四cri的其他恒定免疫球蛋白结构域)的相互作用。

因此,本发明在第一方面提供了一种蛋白质复合物,其包含至少两个氨基酸链i和ii,它们通过包含在氨基酸链i中的异源二聚化区域i(hri)和包含在氨基酸链ii中的异源二聚化区域ii(hrii)彼此非共价结合,其中hri和hrii分别包含免疫球蛋白或免疫球蛋白样蛋白的人恒定区的异源二聚化结构域,其中每个异源二聚化结构域被修饰为其他免疫球蛋白或免疫球蛋白样蛋白的氨基酸序列插入相应的异源二聚化结构域中的至少两个、优选至少三个区域中,该区域在相应的hri和hrii的异源二聚化界面之外,即,优选在hri和hrii的异源二聚化之后是溶剂可及的。

更具体地,本发明的蛋白质复合物包含至少两个氨基酸链i和ii,它们通过包含在氨基酸链i中的异源二聚化区域i(hri)和包含在氨基酸链ii中的异源二聚化区域ii彼此非共价结合,其中

(a)hri包括按以下顺序从n端到c端布置的七个反向平行的β链ai、bi、ci、di、ei、fi和gi,六个间隔区bi、ci、di、ei、fi和gi,n端区域ai和c端区域hi:

ai-ai-bi-bi-ci-ci-di-di-ei-ei-fi-fi-gi-gi-hi,

其中hri是穿插有免疫球蛋白或免疫球蛋白样蛋白的第二人恒定区的氨基酸(第二cri,供体)的免疫球蛋白或免疫球蛋白样蛋白的第一人恒定区(第一cri,受体)的融合蛋白,

其中第一cri包含按以下顺序从n端到c端布置的七个反平行的β链a1、b1、c1、d1、e1、f1和g1,六个间隔区b1、c1、d1、e1、f1和g1,n端区域a1和c端区域h1:

a1-a1-b1-b1-c1-c1-d1-d1-e1-e1-f1-f1-g1-g1-h1,

其中第二cri包含按以下顺序从n端到c端布置的七个反平行的β链a2、b2、c2、d2、e2、f2和g2,六个间隔区b2、c2、d2、e2、f2和g2,n端区域a2和c端区域h2:

a2-a2-b2-b2-c2-c2-d2-d2-e2-e2-f2-f2-g2-g2-h2,

其中hri具有第一cri的氨基酸序列,并且其中第一cri的至少以下氨基酸被第二cri的以下氨基酸置换:

(i)a1的至少一个氨基酸被a2的至少1个氨基酸置换(置换1);

(ii)c1的至少一个氨基酸被c2的至少1个氨基酸置换(置换2);和

(iii)g1的至少一个氨基酸被g2的至少1个氨基酸置换(置换3);其中

(b)hrii包括按以下顺序从n端到c端布置的七个反向平行的β链aii、bii、cii、dii、eii、fii和gii,6个间隔区bii、cii、dii、eii、fii和gii,n端区域aii和c端区域hii:

aii-aii-bii-bii-cii-cii-dii-dii-eii-eii-fii-fii-gii-gii-hii,

其中hrii是穿插有免疫球蛋白或免疫球蛋白样蛋白的第四人恒定区的氨基酸(第四cri,供体)的免疫球蛋白或免疫球蛋白样蛋白的第三人恒定区的融合蛋白(第三cri,受体),

其中第三cri包含按以下顺序从n端到c端布置的七个反向平行的β链a3、b3、c3、d3、e3、f3和g3,六个间隔区b3、c3、d3、e3、f3和g3,n端区域a3和c端区域h3:

a3-a3-b3-b3-c3-c3-d3-d3-e3-e3-f3-f3-g3-g3-h3,

其中第四cri包含按以下顺序从n端到c端布置的七个反平行的β链a4、b4、c4、d4、e4、f4和g4,六个间隔区b4、c4、d4、e4、f4和g4,n端区域a4和c端区域h4:

a4-a4-b4-b4-c4-c4-d4-d4-e4-e4-f4-f4-g4-g4-h4,

其中hrii具有第三cri的氨基酸序列,并且其中第三cri的至少以下氨基酸被第四cri的以下氨基酸置换:

(i)a3的至少一个氨基酸被a4的至少1个氨基酸置换(置换4);

(ii)c3的至少一个氨基酸被c4的至少1个氨基酸置换(置换5);和

(i)g3的至少一个氨基酸被g4的至少1个氨基酸置换(置换6);

其中第一cri和第三cri彼此不同,并且在生理条件下彼此特异性地结合。

本发明第二方面提供编码第一方面的氨基酸链i和/或氨基酸链ii的核酸。

本发明第三方面提供包含第二方面核酸的载体。

本发明第四方面提供一种确定(定义)a的hri的氨基酸序列、氨基酸链i和/或氨基酸序列ii的hrii的氨基酸序列的方法,包括以下步骤:

(i)选择第一cri、第二cri、第三cri和第四cri;

(ii)确定(定义)第一cri、第二cri、第三cri和第四cri的7个β链a、b、c、d、e、f和g,第一cri、第二cri、第三cri和第四cri的间隔序列b、c、d、e、f和g,第一cri、第二cri、第三cri和第四cri各自的n端和c端序列a和h;

(iii)将第一cri的a的至少1个氨基酸置换成第二cri的a的至少1个氨基酸(置换1);将第一cri的c的至少1个氨基酸置换成第二cri的a的至少1个氨基酸(置换2);将第一cri的g的至少1个氨基酸置换成第二cri的g的至少1个氨基酸(置换3);将第三cri的a的至少1个氨基酸置换成第四cri的a的至少1个氨基酸(置换4);将第三cri的c的至少一个氨基酸置换成第四cri的c的至少1个氨基酸(置换5);以及将将第三cri的g的至少1个氨基酸置换成第四cri的g的至少1个氨基酸(置换6),

其中第一cri和第三cri彼此不同,并且在生理条件下彼此特异性地结合。

本发明在第五方面提供一种产生包含根据第四方面确定(定义)的hri序列的氨基酸链i和/或包含根据第四方面确定(定义)的hrii序列的氨基酸链ii的方法。

在第六方面,本发明提供第一方面的蛋白质复合物,其用作药物。

附图列表

图1.恒定ig结构域序列的示意图。代表的是ig结构域序列的动画,箭头表示β链的位置,条形图表示环区域。

图2.异源二聚化ig结构域的示意图。具有免疫球蛋白或免疫球蛋白样蛋白的人恒定区(cri)的异源二聚化区域i和ii(hri和hrii)的示例集。可能的第一和第三cri序列源自两个不同的异源二聚化ig结构域(白色部分,第一cri和第三cri),其例如具有形成链间二硫键的潜力(黑条)。ig结构域的可能的第二和第四cri序列,其与fcrn或其他ig结构域相互作用,第二cri和第四cri用黑色表示。

图3.关于一组ig结构域的图形研究。所显示的是一组ig结构域的氨基酸骨架(参见图4)重叠的动画,其中β链显示为黑色,而环区显示为灰色。

图4.几个ig结构域的序列比对。黑色字体和深灰色背景突出显示了预计会形成β链的残基。黑色字体和亮灰色背景突出显示了预计会形成β链但由于结构或序列比对而从β链a-g中排除的残基。白色字体和深灰色背景突出显示了预测不会形成β链但由于结构或序列比对而包括在β链a-g中的残基。

图5.第二/四cri和第一/三cri序列定义的示意图。代表的是异源二聚化ig结构域的序列,而箭头表示β链的位置,条形描述了环区。白色表示第一/第三cri序列,而黑色表示第二cri/第四cri序列产生的序列延伸。不同的第二/第四cri序列长度说明了具体应用(a:ch31,b:ch3k,c:其他结构域)。

图6.用第二cri/第四cri氨基酸额外置换第一/第三cri残基的图形研究。a)igg1ch3的val37(灰色棒状)与ile46和val48(灰色球形)的相互作用,从igg1ch3(灰色)插入到第一cri结构域/第三cri结构域(黑色)。b)来自iggch3的glu49、ala47和met107(灰色棒状)与融合到异源二聚化ig结构域(黑色)的n端的iggch2结构域(灰色球形)的残基的相互作用。c)来自iggch1(灰色棒状)或任何轻链恒定结构域的tyr81与融合至异源二聚化ig结构域(黑色)n端的可变结构域(灰色球状)的相互作用。

图7.异源二聚化ig结构域的延伸。多功能蛋白质复合物的n端和c端(例如具有fcrn结合能力的共价连接的异源二聚体)可能与其他蛋白质结构域融合,其他蛋白质结构域包括不同的ig结构域,tnfsf成员、其他细胞因子、毒素等。

图8.ch31(hri)和ch3k(hrii)ig结构域的序列比对。显示的是igg1-ch1(第一cri)与igg1-ch3(第二cri,上图)的比对和igκ-cl(第三cri)与igg1-ch3(第四cri,下图)的比对。用下划线标出用于产生具有fcrn结合能力的异源二聚化ig结构域的序列部分。黑色字体和深灰色背景突出显示了预计会形成β链的残基。黑色字体和亮灰色背景突出显示了预计会形成β链但由于结构或序列比对而从β链a-g中排除的残基。白色字体和深灰色背景突出显示了预测不会形成β链但由于结构或序列比对而包括在β链a-g中的残基。

图9.fc部分异源二聚化。实施例1显示了提供的系统在产生异源二聚化抗体fc部分中的应用。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有插入的igg1-ch3的第二cri和第四cri序列,并与igg1铰链和ch2序列的c端融合(称为fc1k)。

图10.对照构建体scfv13.7-fc1k和scfv13.7-fc的基因型。a)包括用于克隆的限制位点的scfv13.7-fc1k重链和轻链的异源二聚体igg结构域的基因排布。b)包括用于克隆的限制位点的scfv13.7-fc重链和轻链的同源二聚体igg结构域的基因排布。

图11.对照构建体scfv13.7-fc1k和scfv13.7-fc的表达。a)scfv13.7-fc1k的示意图。b)纯化的scfv13.7-fc1k的sds-page(5%浓缩胶、12%分离胶)。c)scfv13.7-fc1k的体积排阻色谱。d)scfv13.7-fc的示意图。e)纯化的13.7-fc的sds-page(5%浓缩胶、12%分离胶)。f)scfv13.7-fc的体积排阻色谱。

图12.实施例2的示意图;fv13.7-fc1k。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl用作第一cri和第三cri,其分别具有插入的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将vh13.7或vl13.7融合到通过接头序列连接的每个ch2域中,导致单价fv13.7-fc1k的产生。下图,包括用于克隆的限制位点的fv13.7-fc1k重链和轻链igg结构域的基因排布。

图13.fv13.7-fc1k的表达。a)fv13.7-fc1k的示意图。b)纯化的fv13.7-fc1k的sds-page(5%浓缩胶、12%分离胶)。c)fv13.7-fc1k体积排阻色谱。

图14.fv13.7-fc1k与人tnfr1-fc的平衡结合。在elisa中测试其以增加的浓度与人tnfr1-fc的结合(n=3,平均值±sd)。fab13.7用作对照。

图15.fv13.7-fc1k的生物活性。a)由fv13.7-fc1k触发的il-8从ht1080细胞释放。未受刺激的细胞,tnf(33nm)、atrosab和fab13.7用作对照。提供两个单独实验的平均值和sd值。b)提供由0.1nmtnf诱导的il-8的抑制。atrosab、fab13.7、0.1nmtnf和未受刺激的细胞用作对照。显示两个单独实验的平均值和sd值。

图16.fv13.7-fc1k的药代动力学研究。单剂量注射(25μg)后的初始和终末血浆半衰期以及生物利用度(曲线下面积)使用在小鼠基因座处纯合地具有人tnfr1的胞外结构域的c57bl/6j小鼠(对于atrosab,n=3/n=4)进行测定。通过elisa检测血清样品中残留的活性抗体。atrosab和fab13.7用作对照。

图17.实施例3-fapn-ch3n-hfc和fapn-ch3n-fc的示意图。将靶向fap或cd3的两个scfv片段在n端融合至异源二聚化fc部分fc1k的铰链区(实施例3a)。使用不含半胱氨酸的铰链序列产生相同的构建体,以避免铰链介导的共价交联(实施例3b)。

图18.实施例4-fapn-ch3n-hfc和fapn-ch3n-fc的示意图。将靶向fap或cd3的两个scfv片段在n端(fap)或在c端(cd3)融合至异源二聚化fc部分fc1k(实施例4a)。使用不含半胱氨酸的铰链序列产生相同的构建体,以避免铰链介导的共价交联(实施例4b)。

图19.实施例5-fapn-ch3n-hfc和fapn-ch3n-fc的示意图。将靶向fap的两个scfv片段在n端融合至异源二聚化的fc部分fc1k,另一靶向cd3的scfv在c端融合至fc1k(实施例5a)。使用不含半胱氨酸的铰链序列产生相同的构建体,以避免铰链介导的共价交联(实施例5b)。

图20.实施例6-fapnc-ch3c-hfc和fapnc-ch3c-fc的示意图。将靶向fap的两个scfv片段在n端或c端融合至异源二聚化的fc部分fc1k,另一靶向cd3的scfv在c端融合至fc1k(实施例6a)。使用不含半胱氨酸的铰链序列产生相同的构建体,以避免铰链介导的共价交联(实施例6b)。

图21.第一cri/第三cri序列与第二cri/第四cri序列的序列比对以产生双特异性igg。fcrnα3和β2微球蛋白的第一cri和第三cri结构域序列与iggch3第二cri和第四cri结构域序列比对(a),而tcrα2和tcrβ2的第一cri和第三cri结构域序列分别与iggch1和igκ恒定结构域第二cri和第四cri序列比对(b)。用下划线标出用于产生具有fcrn结合能力(a)或ig结构域间相互作用能力(b)的异源二聚化ig结构域的序列部分。黑色字体和深灰色背景突出显示了预计会形成β链的残基。黑色字体和亮灰色背景突出显示了预计会形成β链但由于结构或序列比对而从β链a-g中排除的残基。白色字体和深灰色背景突出显示了预测不会形成β链但由于结构或序列比对而包括在β链a-g中的残基。

图22.实施例7-双特异性igg的示意图。为了提供fc异源二聚化作用并解决轻链问题,必须创建两个多功能ig结构域。fcb2rn由fcrnα3和β2微球蛋白的第一cri和第三cri结构域序列以及嫁接的iggch3的第二cri和第四cri序列组成(7a)。fabtcr由tcrα2和tcrβ2的第一cri和第三cri结构域序列以及插入的iggchi和igκ恒定结构域第二cri和第四cri序列组成(7b)。

图23.实施例8-fv13.7x-fc1k的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl用作第一cri和第三cri,分别具有插入的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将vh13.7或vl13.7融合到通过接头序列连接的每个ch2域中,导致单价fv13.7x-fc1k的产生。下图,包括用于克隆的限制位点的fv13.7x-fc1k重链和轻链igg结构域的基因排布。

图24.fv13.7x-fc的产生和生物活性。a)fv13.7xfc1k的基因型。b)通过sds-page(10%,考马斯染色)和随后的sec(c,yarrasec-3000色谱柱,流速0.5ml/分钟)分析经纯化的蛋白质。d)通过elisa测试fv13.7xfc1k与人tnfr1-fc的结合(n=1,重复的平均值±sd,atrosab和fab13.7作为对照)。e)分析了由fv13.7xfc1k触发的ht1080细胞i的l-8释放(n=1,重复的均值±sd,atrosab,fab13.7,未刺激的细胞和重组人tnf作为对照),以及使用0.1nm重组人tnf(f,n=1,重复的均值±sd,atrosab,fab13.7,未刺激的细胞和重组人tnf作为对照),抑制由tnf诱导的il-8释放。

图25.实施例9-fvcd3-fc1k-scfvher32的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有接枝的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端(称为fc1k)融合。将vhcd3或vlcd3融合到每个通过接头序列连接的ch2结构域上,此外,将一个靶向her3的scfv片段融合到fc1k的每个c端上,从而产生了双特异性三价fvcd3-fc1k-scfvher32。下图,fvcd3-fc1k-scfvher32链igg结构域的遗传排列,包括用于克隆的限制位点。

图26.实施例10-13.7ncd3n-hfc1k的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有嫁接的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将靶向人tnfr1(scfv13.7)或cd3的两个scfv片段在n端融合至异源二聚化fc部分fc1k的铰链区。下图,13.7ncd3n-hfc1k链igg结构域的遗传排列,包括用于克隆的限制位点。

图27.13.7ncd3n-hfc1k的产生和生物活性。a)13.7ncd3n-hfc1k的基因型。b)通过sds-page(10%,考马斯染色)和然后的sec(c,yarrasec-3000色谱柱,流速0.5ml/分钟)分析纯化的蛋白质。d)通过elisa测试13.7ncd3n-hfc1k与人tnfr1-fc的结合(n=1,重复的平均值±sd)。e)通过流式细胞术分析13.7ncd3n-hfc1k与表达tnfr1的ht1080细胞(n=1,重复的平均值±sd)以及与表达cd3的jurkat细胞的结合(f,n=1,重复的平均值±sd)。g)在刺激5天后,通过存活的靶细胞的结晶紫染色在体外测试人外周血单核细胞对表达tnfr1的ht1080细胞的招募和活化(n=1,重复的平均值±sd)。

图28.实施例10-her3ncd3n-hfc1k的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有嫁接的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将靶向her3或cd3的两个scfv片段在n端融合至异源二聚化fc部分fc1k的铰链区。下图,her3ncd3n-hfc1k链igg结构域的遗传排列,包括用于克隆的限制位点。

图29.her3ncd3n-hfc1k的产生和生物活性。a)her3ncd3n-hfc1k的基因型。b)通过sds-page(10%,考马斯染色)和然后的sec(c,yarrasec-3000色谱柱,流速0.5ml/分钟)分析纯化的蛋白质。d)通过elisa测试her3ncd3n-hfc1k与her3-fc的结合(n=1,重复的平均值±sd)。

图30.实施例10-mscpncd3n-hfc1k的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有嫁接的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将靶向mcsp或cd3的两个scfv片段在n端融合至异源二聚化fc部分fc1k的铰链区。下图,mcspncd3n-hfc1k链igg结构域的遗传排列,包括用于克隆的限制位点。

图31.mscpncd3n-hfc1k的产生和生物活性。a)mscpncd3n-hfc1k的基因型。b)通过sds-page(10%,考马斯染色)和然后的sec(c,yarrasec-3000色谱柱,流速0.5ml/分钟)分析纯化的蛋白质。d)刺激5天后,对存活的靶细胞进行结晶紫染色,检测体外培养的人外周血单核细胞对表达mcsp的wm35细胞的招募和活化(n=1,重复的平均值±sd)。

图32.实施例10-her3ncd3c-hfc1k的示意图。上图,多功能ig结构域的产生。因此,将igg1-ch1和igκcl分别用作第一cri和第三cri,其具有嫁接的igg1-ch3的第二cri和第四cri序列,并与igg1-ch2的c端融合(称为fc1k)。将靶向her3或cd3的两个scfv片段在n端或c端融合至异源二聚化fc部分fc1k的铰链区。下图,her3ncd3c-hfc1k链igg结构域的遗传排列,包括用于克隆的限制位点。

图33.her3ncd3c-hfc1k的产生和生物活性。a)her3ncd3c-hfc1k的基因型。b)通过sds-page(10%,考马斯染色)和然后的sec(c,yarrasec-3000色谱柱,流速0.5ml/分钟)分析纯化的蛋白质。d)通过elisa测试her3ncd3c-hfc1k与her3-fc的结合(n=1,重复的平均值±sd)。

图34.序列

序列表——自由文本信息

seqidno:1igg1的ch1的氨基酸序列

seqidno:2igg2的ch1的氨基酸序列

seqidno:3igg3的ch1的氨基酸序列

seqidno:4igg4的ch1的氨基酸序列

seqidno:5iga1的ch1的氨基酸序列

seqidno:6iga2的ch1的氨基酸序列

seqidno:7igd的ch1的氨基酸序列

seqidno:8ige的ch1的氨基酸序列

seqidno:9igm的ch1的氨基酸序列

seqidno:10tcrα的氨基酸序列

seqidno:11tcrβ的氨基酸序列

seqidno:12fcrnα3的氨基酸序列

seqidno:13β2微球蛋白的氨基酸序列

seqidno:14hla-a的氨基酸序列

seqidno:15hla-bα3的氨基酸序列

seqidno:16hla-dα2的氨基酸序列

seqidno:17hla-dβ2的氨基酸序列

seqidno:18igκ恒定区的氨基酸序列

seqidno:19igλ恒定区的氨基酸序列

seqidno:20ch31,第一cri:ch1(igg1),第二cri:ch3(igg1)的氨基酸序列

seqidno:21ch3κ,第三cri:clκ,第二cri:ch3(igg1)的氨基酸序列

seqidno:22ch1h3,第一cri:ch1(igg1),第二cri:ch3(igg1)的氨基酸序列

seqidno:23clkh3,第三cri:clκ,第四cri:ch3(igg1)的氨基酸序列

seqidno:24b2mh3,第一cri:β2微球蛋白,第二cri:ch3(igg1)的氨基酸序列

seqidno:25fcrnh3,第三cri:fcrnα3结构域,第四cri:ch3(igg1)的氨基酸序列

seqidno:26tcrah3,第一cri:tcrα链恒定结构域,第二cri:ch3(igg1)的氨基酸序列

seqidno:27tcrbh3,第三cri:tcrβ链恒定结构域,第四cri:ch3(igg1)的氨基酸序列

seqidno:28tcrah1,第一cri:tcrα链恒定结构域,第二cri:ch1(igg1)的氨基酸序列

seqidno:29tcralk,第三cri:tcrα链恒定结构域,第四cri:clκ的氨基酸序列

seqidno:30tcrall,第三cri:tcrα链恒定结构域,第四cri:clλ的氨基酸序列

seqidno:31tcrbh1,第一cri:tcrβ链恒定结构域,第二cri:ch1(igg1)的氨基酸序列

seqidno:32tcrb1lk,第三cri:tcrβ链恒定结构域,第四cri:clk的氨基酸序列

seqidno:33tcrbll,第三cri:tcrβ链恒定结构域,第四cri:clλ的氨基酸序列

seqidno:34vh13.7-ch2-ch31的氨基酸序列

seqidno:35vl13.7-ch2-ch3κ的氨基酸序列

seqidno:36scfv13.7-铰链-ch2-ch31的氨基酸序列

seqidno:37铰链-ch2-ch3κ的氨基酸序列

seqidno:38scfvhuu3-铰链-ch2-ch3κ的氨基酸序列

seqidno:39scfv3-43-铰链-ch2-ch31的氨基酸序列

seqidno:40scfhumcsp-铰链-ch2-ch31的氨基酸序列

seqidno:41vh13.7-ch2-ch3k的氨基酸序列

seqidno:42vl13.7-ch2-ch31的氨基酸序列

seqidno:43vhcd3-ch2-ch3k-scfvher3的氨基酸序列

seqidno:44vlcd3-ch2-ch31-scfvher3的氨基酸序列

seqidno:45igg1ch3的氨基酸序列

seqidno:46igg2ch3的氨基酸序列

seqidno:47igg3ch3的氨基酸序列

seqidno:48igg4ch3的氨基酸序列

seqidno:49igmch4的氨基酸序列

seqidno:50iga1ch3的氨基酸序列

seqidno:51iga2ch3的氨基酸序列

seqidno:52igdch3的氨基酸序列

seqidno:53igech4的氨基酸序列

seqidno:54igλ恒定区的氨基酸序列

seqidno:55igλ恒定区的氨基酸序列

seqidno:56igλ恒定区的氨基酸序列

seqidno:57tcrβ1的氨基酸序列

seqidno:58hla-dβ2的氨基酸序列

图35.fv13.7x-fc1k的生化特性。在稳定的慢病毒转导后,从cho细胞库中产生fv13.7x-fc1k,并通过蛋白a层析和随后的制备型sec进行纯化。通过分析型sec(a,tskgelsuperswmabhr,流速0.5ml/min,流动相na2hpo4/nah2po4)和sds-page(b,nupagetm4-12%bis-trismidigel)在还原(r)和非还原条件(nr)下进行表征。m:标记。c)通过动态光散射和对所得结果的目视判读确定熔融温度。在人血浆中孵育指定的时间点后,进行血浆稳定性分析,然后通过elisa分析残留结合蛋白的ec50值(d)。

图36.fv13.7x-fc1k的抗原和fc受体结合。在elisa(a,n=3,平均值±sd)和qcm(b)中分析了fv13.7x-fc1k与人tnfr1-fc的结合。在b)中使用128nm和4nm之间的五个浓度生成动力学数据,并使用一对一结合算法进行拟合。c)在elisa中分析了人fcγ受体i、iib和iii以及补体蛋白c1q与固定的fv13.7x-fc1k的结合。利妥昔单抗(野生型fc部分)和atrosab(沉默fc)用作对照(n=2,平均值±sd)。

图37.fv13.7x-fc1k激动和拮抗生物活性的缺乏。fv13.7x-fc1k在tnfr1激活方面固有的缺乏激动活性,这在三个独立的实验中得到了证实。a)从hela细胞释放il6,b)从ht1080细胞释放il-8,和使用kym1细胞的细胞死亡诱导测定法(c)。在使用hela细胞的il-6释放测定法(d)、使用ht1080细胞的il-8释放测定法(e)和使用kym-1细胞的细胞死亡诱导测定法(f)中,也显示出fv13.7x-fc1k的抑制潜力,这些测定法在恒定浓度的0.1nmtnf(d和e)或0.01nmtnf(f)的存在下进行。单独的fab13.7、atrosab和tnf用作激活tnfr1的控制分子(a,b和c中的tnf和atrosab)以及抑制tnf诱导的tnfr1激活的控制分子(d、e和f中的fab13.7和atrosab)。所有图表代表三次独立实验的平均值,误差线代表sd。

图38.在抗人igg抗体存在的情况下,fv13.7x-fc1k的激动生物活性缺乏。通过检测il-8释放到培养上清液中,确定在恒定浓度(约15.8nm)的三种不同抗人igg血清制剂(a,b和c)存在下,fv13.7x-fc1k对ht1080细胞表面上tnfr1的激活作用。单独的细胞和33nmtnf用作对照。将潜在交联抗体的激动作用与fab13.7和atrosab进行比较。所有实验均显示三次独立实验的均值±sd。

图39.fv13.7x-fc1k的药代动力学分析。将400μgfv13.7x-fc1k注射到敲入c56bl/6j的小鼠中,其携带连接到小鼠跨膜和细胞内结构域的人tnfr1细胞外结构域基因,而不是野生型小鼠基因。在指示的时间点结合tnfr1后,通过elisa测定血清中剩余的完整蛋白。显示的是五只小鼠的平均值±sd。

详细说明

在下面详细描述本发明之前,应当理解,本发明不限于本文描述的特定方法、方案和试剂,因为它们可以变化。还应理解,本文所使用的术语仅出于描述特定实施方案的目的,而不旨在限制本发明的范围,本发明的范围仅由所附权利要求书来限制。除非另有定义,否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。

优选地,本文所用的术语如″amultilingualglossaryofbiotechnologicalterms:(iupacrecommendations)″,leuenberger,h.g.w,nagel,b.andh.eds.(1995),helveticachimicaacta,ch-4010basel,switzerland)中所定义。

在本说明书的全文中引用了一些文件。本文上文或下文中引用的每个文件(包括所有专利、专利申请、科学出版物、制造商的说明书、说明,genbank登录号序列提交的文件等)均通过引用全文并入本文。本文中的任何内容均不得解释为承认本发明无权凭借在先发明而早于此类公开。

定义

术语“包含”和其变体例如“包括”、“含有”将被理解为意味着涵盖所陈述的元素或步骤或元素组或步骤组但不排除任何其他元素或步骤或元素组或步骤组。

如本说明书和随附的权利要求书中所使用的,要素前面不使用数量词可以包括多个指代物,除非上下文另有明确指示。

浓度、量和其他数值可以在本文表达或呈现为“范围”的形式。应理解,这种范围形式仅仅出于方便和简洁而使用,因此应该被灵活地解释为不仅包括如范围的限制所明确记载的数值,如果明确记载了各个数值和子范围,则也包括范围中包含的全部独立的数值或子范围。作为示例,数值范围“150mg至600mg”应该被解释为不仅包括明确记载的数值150mg至600mg,也包括所示出的范围中的独立的数值和子范围。因此,该数值范围包括的是单个数值例如150mg、160mg、170mg、180mg、190mg、……580mg、590mg、600mg和子范围例如150至200mg、150至250mg、250至300mg、350至600mg等。仅记载一个数值的范围适用于相同原则。此外,无论所描述的范围或特征的宽度,这种解释都应该适用。

与数值范围结合使用的术语“约”旨在涵盖在下限比所指示的数值小5%,上限比所指示的数值大5%的范围中的数值。

术语“核酸”和“核酸分子”在本文中同义使用并理解为单链或双链脱氧核糖核苷酸或核糖核苷酸碱基或二者的寡聚物或聚合物。核苷酸单体由核碱基、五碳糖(例如但不限于核糖或2′-脱氧核糖)和一至三个磷酸基团构成。通常,核酸是通过各个核苷酸单体之间的磷酸二酯键形成的。在本发明的情况下,术语核酸包括但不限于核糖核酸(rna)和脱氧核糖核酸(dna)分子,但也包括合成形式的包含其他连接的核酸(例如,如nielsen等人(science254:1497-1500,1991)中描述的肽核酸。通常,核酸是单链或双链分子,并且由天然存在的核苷酸组成。核酸单链的描述也(至少部分地)限定了互补链的序列。核酸可以是单链或双链的,或可以包含双链和单链序列的一部分。示例性的双链核酸分子可具有3′或5′突出端,因此不需要或假定在其整个长度上都完全是双链的。可以通过生物、生化或化学合成方法或本领域已知的任何方法获得核酸,包括但不限于扩增和rna逆转录的方法。术语核酸包括染色体或染色体区段、载体(例如表达载体)、表达盒、裸露的dna或rna聚合物、引物、探针、cdna、基因组dna、重组dna、crna、mrna、trna、微小rna(mirna)或小干扰rna(sirna)。核酸可以是例如单链、双链或三链,并且不限于任何特定的长度。除非另有说明,否则除明确指出的任何序列外,特定的核酸序列还包含或编码互补序列。

核酸可以被核酸内切酶或核酸外切酶降解,特别是被可见于细胞中的脱氧核糖核酸酶和核糖核酸酶降解。因此,修饰本发明的核酸以使其对降解稳定从而确保核酸在细胞中长时间保持高浓度可能是有利的。通常,可以通过引入一个或多于一个核苷酸间磷酸基团或通过引入一个或多于一个非含磷核苷酸间类似物来获得这种稳定。因此,核酸可以由非天然存在的核苷酸和/或对天然存在的核苷酸的修饰和/或分子骨架的改变构成。核酸中修饰的核苷酸间磷酸基团和/或非含磷桥包括但不限于甲基膦酸酯、硫代磷酸酯、氨基磷酸酯、二硫代磷酸酯和/或磷酸酯,而非含磷核苷酸间类似物包括但不限于硅氧烷桥、碳酸酯桥、羧甲基酯、乙酰胺桥和/或硫醚桥。核苷酸修饰的其他实例包括但不限于:5′或3′核苷酸的磷酸化以分别允许连接或防止核酸外切酶降解/聚合酶延伸;氨基、巯基、炔基或生物素基修饰以实现共价和近共价连接;荧光团和淬灭剂;以及修饰的碱基,例如脱氧肌苷(di)、5-溴-脱氧尿苷(5-bromo-du)、脱氧尿苷、2-氨基嘌呤、2,6-二氨基嘌呤、倒置dt、倒置的二脱氧-t、双脱氧胞苷(ddc5-甲基脱氧胞苷(5-甲基dc)、锁核酸(lna)、5-硝基吲哚、iso-dc和-dg碱基、2′-o-甲基rna碱基、羟甲基dc、5-羟基丁炔-2′-脱氧尿苷、8-氮杂-7-脱氮鸟苷和氟修饰的碱基。因此,核酸也可以是人工核酸,其包括但不限于聚酰胺或肽核酸(pna)、吗啉代和锁核酸(lna),以及乙二醇核酸(gna)和苏糖核酸(tna)。

当核酸与另一核酸序列处于功能性关系时,该核酸是“可操作地连接的”。例如,如果启动子或增强子影响编码序列的转录,则该启动子或增强子可操作地连接至编码序列;或如果核糖体结合位点被定位以便于翻译,则该核糖体结合位点可操作地连接至编码序列。

当在本发明的情况下使用时,术语“多核苷酸”是指长度大于约50个(例如长度为51个或更多核苷酸)核苷酸的核酸。

本发明的多肽通过任何合适方法制备,包括但不限于现有或天然序列的分离、dna复制或扩增、适当序列的逆转录、克隆和限制性酶切,或通过例如以下方法的直接化学合成:narang等人的磷酸三酯法(meth.enzymol.68:90-99,1979)、brown等人的磷酸二酯法(meth.enzymol.68:109-151,1979);beaucage等人的二乙基亚磷酰胺法(tetrahedronlett.22:1859-1862,1981);matteucci等人的三酯法(j.am.chem.soc.103:3185-3191,1981);自动合成法;或美国专利no.4,458,066的固相载体法,或本领域技术人员已知的其他方法。

如本文所用,术语“载体”是指能够被引入细胞或将其中包含的蛋白质和/或核酸引入细胞中的蛋白质或多核苷酸或其混合物。载体的实例包括但不限于质粒、黏粒、噬菌体、病毒或人工染色体。特别地,载体用于将目的基因产物例如外源或异源dna运送至合适的宿主细胞。载体可以包含“复制子”多核苷酸序列,从而促进载体在宿主细胞中的自主复制。外源dna被定义为异源dna,其是不在宿主细胞中天然存在的dna,其例如复制载体分子、编码可选择或可筛选的标志物或编码转基因。一旦进入宿主细胞,载体就可以独立于宿主染色体dna进行复制或与宿主染色体dna重合,并且可以生成载体及其插入的dna的多个拷贝。另外,载体还可包含必要的元件,其允许插入的dna转录成mrna分子或以其他方式引起插入的dna复制成rna的多个拷贝。载体还可以涵盖调控目的基因表达的“表达控制序列”。通常,表达控制序列是多肽或多核苷酸,例如但不限于启动子、增强子、沉默子、绝缘子或阻遏物。在包含多于一种编码一种或多于一种目的基因产物的多核苷酸的载体中,表达可通过一个或多于一个表达控制序列一起或分开地控制。更具体地,可以通过单独的表达控制序列来控制载体上包含的每种多核苷酸,或者可以通过单一表达控制序列来控制载体上包含的所有多核苷酸。由单一表达控制序列控制的单一载体上包含的多核苷酸可以形成开放阅读框。一些表达载体还包含与插入的dna相邻的序列元件,其增加表达的mrna的半衰期和/或允许mrna翻译成蛋白质分子。因此,可以快速合成许多由插入的dna编码的mrna和多肽分子。

术语“氨基酸”通常是指包含经取代或未经取代的氨基、经取代或未经取代的羧基以及一个或多于一个侧链或基团或这些基团中的任一个的类似物的任何单体单元。示例性的侧链包括例如巯基、硒代、磺酰基、烷基、芳基、酰基、酮基、叠氮基、羟基、肼、氰基、卤代、酰肼、烯基、炔基、醚、硼酸盐、硼酸酯、磷酸、膦酰基、膦、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺或这些基团的任何组合。其他代表性的氨基酸包括但不限于包含光活化交联剂的氨基酸、金属结合氨基酸、自旋标记氨基酸、荧光氨基酸、含金属氨基酸、具有新型官能团的氨基酸、与其他分子共价或非共价相互作用的氨基酸、光笼化和/或光异构性氨基酸、放射性氨基酸、包含生物素或生物素类似物的氨基酸、糖基化氨基酸、其他碳水化合物修饰的氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学可裂解的和/或光可裂解的氨基酸、碳连接的含糖氨基酸、氧化还原活性氨基酸、含氨基硫代酸的氨基酸以及包含一个或多于一个毒性部分的氨基酸。如本文所用,术语“氨基酸”包括以下二十种天然或遗传编码的α-氨基酸:丙氨酸(ala或a)、精氨酸(arg或r)、天冬酰胺(asn或n)、天冬氨酸(asp或d)、半胱氨酸(cys或c)、谷氨酰胺(gln或q)、谷氨酸(glu或e)、甘氨酸(gly或g)、组氨酸(his或h)、异亮氨酸(ile或i)、亮氨酸(leu或l)、赖氨酸(lys或k)、蛋氨酸(met或m)、苯丙氨酸(phe或f)、脯氨酸(pro或p)、丝氨酸(ser或s)、苏氨酸(thr或t)、色氨酸(trp或w)、酪氨酸(tyr或y)和缬氨酸(val或v)。在“x”残基未定义的情况下,这些应定义为“任何氨基酸”。该二十种天然氨基酸的结构示于例如stryer等人,biochemistry,第5版,freemanandcompany(2002)。其他氨基酸例如硒代半胱氨酸和吡咯赖氨酸也可以被基因编码(stadtman(1996)“selenocysteine”,annurevbiochem.65:83-100和ibba等人(2002)“geneticcode:introducingpyrrolysine,”currbiol.12(13):r464-r466)。术语“氨基酸”还包括非天然氨基酸、经修饰的氨基酸(例如具有修饰侧链和/或主链)和氨基酸类似物。参见例如zhang等人(2004)“selectiveincorporationof5-hydroxytryptophanintoproteinsinmammaliancells,”proc.natl.acad.sci.u.s.a.101(24):8882-8887,anderson等人(2004)“anexpandedgeneticcodewithafunctionalquadrupletcodon”proc.natl.acad.sci.u.s.a.101(20):7566-7571,ikeda等人(2003)“synthesisofanovelhistidineanalogueanditsefficientincorporationintoaproteininvivo,”proteineng.des.sel.16(9):699-706,chin等人(2003)“anexpandedeukaryoticgeneticcode,”science301(5635):964-967,james等人(2001)“kineticcharacterizationofribonucleasesmutantscontainingphotoisomerizablephenylazophenylalanineresidues,”proteineng.des.sel.14(12):983-991,kohrer等人(2001)“importofamberandochresuppressortrnasintomammaliancells:ageneralapproachtosite-specificinsertionofaminoacidanaloguesintoproteins,”proc.natl.acad.sci.u.s.a.98(25):14310-14315,bacher等人(2001)“selectionandcharacterizationofescherichiacolivariantscapableofgrowthonanotherwisetoxictryptophananalogue,”j.bacteriol.183(18):5414-5425,hamano-takaku等人(2000)“amutantescherichiacolityrosyl-trnasynthetaseutilizestheunnaturalaminoacidazatyrosinemoreefficientlythantyrosine,”j.biol.chem.275(51):40324-40328,和budisa等人(2001)“proteinswith{beta}-(thienopyrrolyl)alaninesasalternativechromophoresandpharmaceuticallyactiveaminoacids,”proteinsci.10(7):1281-1292。氨基酸可以合并成肽、多肽或蛋白质。

在本发明的情况下,术语“肽”指由肽键连接的氨基酸的短聚合物。其与蛋白质具有相同的化学键(肽键),但通常在长度上较短。最短的肽是二肽,由通过单个肽键连接的两个氨基酸组成。还可以存在三肽、四肽、五肽等。通常肽具有最多8、10、12、15、18或20个氨基酸的长度。除非肽为环状肽,否则肽具有氨基端和羧基端。

在本发明的情况下,术语“多肽链”或“氨基酸链”是指通过肽键结合在一起的氨基酸的单个线性链,并且通常包含至少约21个氨基酸。

如本文所用,术语“蛋白质复合物”是指两个或多于两个相关多肽或氨基酸链的组。不同的多肽链可以具有不同的功能。蛋白质复合物是四级结构的一种形式。蛋白质复合物中的蛋白质通过非共价的蛋白质-蛋白质相互作用,以及任选地另外通过共价键(例如,在两条不同的多肽链中的两个相邻的cys残基之间形成)连接。根据非共价键和任选的共价键的稳定性,不同的蛋白质复合物随时间具有不同程度的稳定性。

在本发明的情况下,术语“免疫球蛋白或免疫球蛋白样蛋白的人恒定区(cri)”用于指长度为60至150个氨基酸的氨基酸序列,其包含七个反向平行的β链,从而形成两个半胱氨酸连接的β片层的三明治状球状结构。示例性片层结构如图3所示。在本发明的情况下使用的最优选的cri的氨基酸序列示于图4。该术语还包括具体指出的序列的变体,只要该变体仍可以折叠成基于β片层的ig结构域样三明治构象。

如本文所用,术语“异源二聚化区域”(hri,hrii)是指各自较大的氨基酸链i和ii内的氨基酸序列区段,其优选地在生理条件下彼此特异性结合,并因此导致氨基酸链i和ii的异源二聚化。术语异源二聚化区域也意味着氨基酸链i和ii的氨基酸序列是不同的。至于上面定义的蛋白质复合物,hri和hrii之间的结合主要是通过非共价相互作用来介导的。然而,如果hri和hrii各自在hri和hrii的结合界面内的相邻位置处包含cys残基,则这些cys残基之间的共价键可以稳定hri和hrii之间的结合。hri和hrii各自形成类似于图3所示的β片层结构。

术语“fc功能”用于指免疫球蛋白刺激吞噬细胞或细胞毒性细胞通过抗体介导的吞噬作用、抗体依赖性细胞介导的细胞毒性或补体介导的细胞溶解来破坏微生物或感染细胞的能力。该功能基于抗体与存在于免疫细胞的一些细胞表面的fc受体的结合,这些细胞特别是b淋巴细胞、滤泡树突状细胞、自然杀手细胞、巨噬细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、人血小板和肥大细胞。“fc功能”还指与介导半衰期延长的初生fc受体(fcrn)结合的能力。技术人员非常了解如何测定抗体或抗体片段的fc功能。免疫球蛋白的fc功能主要在ch2和/或ch3结构域中,特别是在igg的ch2和/或ch3结构域中。

在本发明的情况下,蛋白质或多肽的“一级结构”为多肽链中的氨基酸序列。蛋白质的“二级结构”为蛋白质局部区段的一般三维形式。但是,它没有描述被认为是三级结构的在三维空间中的特定原子位置。在蛋白质中,二级结构由主链酰胺和羧基之间的氢键模式所限定。蛋白质的“三级结构”是由原子坐标确定的蛋白质的三维结构。“四级结构”是在多亚基复合物中的多个折叠或卷曲的蛋白质或多肽分子的排列。

如本文所用,术语“折叠”或“蛋白质折叠”是指蛋白质呈现其三维形状或构象的过程,即由此蛋白质通过非共价和/或共价相互作用形成特定的三维形状的过程,非共价和/或共价相互作用例如但不限于氢键、金属配位、疏水力、范德华力、π-π相互作用、静电效应和/或分子内cys键。因此,术语“折叠的蛋白质”是指具有三维形状的蛋白质,例如其二级结构、三级结构或四级结构。

在本发明的情况下使用的术语“β链”是指多肽链内5至10个氨基酸长的区段,其中主链中的n-cα-c-n的扭转角为约120度。通过从pdb文件中获取注释,可以在(多个)序列比对(例如使用clustalomega)后预测给定蛋白质序列中的β链。如果未指定所有7条β链(例如,在图4中用星号表示),则可以使用常用软件工具例如jpred另外进行β链的预测(对于图4中的比对,使用了采用默认设置的最长累积预测)。可以使用pymol通过pdb文件的另外结构比对来确定7条β链的起始和终止位置。在以下情况可以根据结构保守的残基来改良多序列比对:(i)在链中包含形式上未指定的残基,或(ii)从链中排除先前指定的残基,以及(iii)删除通过多序列比对引入序列中的β链内的空位,或(iv)通过在β链外部插入新的空位(如图4中4个例外情况所进行的操作,d_ch3:位置111;m_ch1:位置#72;hlaa/hlab:位置#60)。插入/延伸或缺失/减少的空位位置应通过分别在多序列比对期间引入序列的已存在的空位中删除或插入空位位置来补偿,以使序列维持在更靠近c端的区域进行比对。因此,可以通过以下方式定义七条β链:

a)在保守脯氨酸残基n端之后到预测的第一预测β链的六个残基(图4中的位置13-18)。

b)与第二预测β链中所包含的保守半胱氨酸残基相邻的、n端的四个残基和c端的五个残基(图4中的位置13-18、31-40)。

c)与第三预测β链中所包含的保守色氨酸残基相邻的、n端的四个残基和c端的两个残基(图4中的位置46-52)。

d)在图4中的位置63-70,但是,在整个比对中与保守残基的连接是不可行的。

e)从保守酪氨酸/苯丙氨酸残基开始的八个残基,位于第四预测β链的开始或n-末端(图4中的位置81-89)。

f)定义为与第六预测β链中所包含的保守半胱氨酸残基相邻的、n端的两个残基和c端的四个残基(图4中的位置102-108)。

g)在图4中的位置128-133,但是,在整个比对中与保守残基的连接是不可行的。

对于免疫球蛋白或免疫球蛋白样蛋白(cri)的给定恒定区,本领域技术人员可以容易地确定7个β链。或者,图4中不包括的给定cri可以被添加到图4的比对中。β链a跨越iglcrc的位置13至18,β链b跨越iglcrc的位置31至40,β链c跨越iglcrc的位置46至52,β链d跨越iglcrc的位置63至70,β链e跨越iglcrc的位置81至89,β链f跨越iglcrc的位置102至108,β链g跨越iglcrc的位置128至133。

在本发明的情况下使用的术语“β片层”是指形成β折叠的反向平行取向的β链。β片层是蛋白质中规则二级结构的常见基序。因为肽链具有由n末端和c末端赋予的方向性,所以也可以说β链是有方向性的。它们通常在蛋白质拓扑图中以指向c端的箭头表示。相邻的β链可以以反向平行、平行或混合排列形式形成氢键。在反向平行排列中,连续的β链交替取向,以使一条链的n端与另一条链的c端相邻。这是产生最强链间稳定性的排列,因为它允许羰基和胺之间的链间氢键是平面的,这是它们的优选取向。β结构的特征在于长的延伸的多肽链。β链的氨基酸组成趋向有利于疏水性(憎水)的氨基酸残基。这些残基的侧链往往比亲水性(亲水)残基的侧链难溶于水。β结构倾向于存在于蛋白质的核心结构内部,在蛋白质的核心结构中,链之间的氢键受到保护而不会与水分子竞争。由图3显而易见的是,包含在每个cri中并因此包含在分别衍生自两个cri的hri和hrii的7个反向平行β链形成β片层结构。

在人免疫球蛋白或人免疫球蛋白样蛋白上下文中使用的术语“间隔区”指在两个β链之间的氨基酸链。间隔区是较低程度结构化的例如形成环,并可包含短α螺旋,对于给定cri,本领域技术人员可以通过结构和序列比对来确定间隔区。图4中不包含的cri可以被添加到比对中。比对时,间隔区“b”、“c”、“d”、“e”、“f”和“g”分别跨越iglcrc的位置19至30、iglcrc的位置41至45,iglcrc的位置53至62,iglcrc的位置71至80,iglcrc的位置90至101,和iglcrc的位置109至127。每个间隔区可包含一个或多于一个氨基酸删除,只要7个反向平行的β链仍可形成β片层。因此,相比于间隔区的iglcrc位置所暗示的,该间隔区可以含有更少或更多的氨基酸。通过本发明的人免疫球蛋白或人免疫球蛋白样蛋白的β折叠的氨基酸的n端和c端来确定间隔区氨基酸的n端和c端以及由此获得的长度。因此间隔区“b”的长度可为5至12个、特别是6至11个、特别是7至10个、更特别是8至9个氨基酸,间隔区“c”的长度可为1至5个、特别是2至4个、更特别是3个氨基酸,间隔区“d”的长度可为1至10个、特别是3至8个、更特别是4至6个氨基酸,间隔区“e”的长度可为1至10个、特别是2至8个、更特别是4至6个氨基酸,间隔区“f”的长度可为1至12个、特别是3至10个、更特别是5至8个氨基酸,间隔区“g”的长度可为4至19个、特别是5至15个、更特别是7至11个氨基酸。如所指出的,一些人免疫球蛋白或人免疫球蛋白样蛋白的间隔区可以比上面指出的典型长度更长。如果间隔区包含的氨基酸比该间隔区所跨越的iglcrc位置多,例如特定人免疫球蛋白或人免疫球蛋白样蛋白的间隔区“b”可能具有15个氨基酸的长度,而间隔区“b”仅跨越iglcrc的位置19至30。在这种情况下,将间隔区的氨基酸对齐,不能很好地对齐的过量氨基酸被赋予iglcrc位置,并带有另外的符号“a”,“b”等。因此,15个氨基酸的间隔区“b”可跨越以下iglcrc名称:19、19a、19b、19c和20至30。

术语“n端区域a”和“c端区域h”分别是指在cri以及由此衍生的hri和hrii的各个末端的较低程度结构化的部分。n端区域a可以跨越iglcrc位置1至12(见图4)。长度特别地可以为4至12个氨基酸,特别地为5至10个氨基酸,更特别地为6至8个氨基酸。c端区域h可以跨越iglcrc位置134至144(见图4)。长度特别地可以为4至11个氨基酸,特别地为5至10个氨基酸,更特别地为6至8个氨基酸。

本文使用的术语“片段”是指天然存在的片段(例如剪接变体)以及人工构建的片段,特别是指通过基因技术手段获得的片段。通常,与亲本多肽相比,片段在其n端和/或c端和/或内部,优选在其n端、在n端和c端或在其c端最多可缺失1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或300个氨基酸。

“表位”也称为抗原决定簇,是被免疫系统特别是抗体、b细胞或t细胞识别的大分子的部分。此类表位是大分子能够结合抗体或其抗原结合片段的部分或片段。在本文中,术语“结合”优选地涉及特异性结合。在本发明的情况下,优选术语“表位”是指被免疫系统识别的蛋白质或多蛋白的区段。表位通常由分子例如氨基酸或糖侧链的化学活性表面类别组成,并通常具有特定的三维结构特征以及特定的电荷特征。构象性表位和非构象性表位的区别在于,在存在变性溶剂的情况下,与前者的结合丧失而与后者的结合不丧失。

如本文所用,“构象性表位”是指由所述大分子的三维结构形成的线性大分子(例如多肽)的表位。在本申请的情况下,“构象性表位”是“非连续表位”,即大分子(例如多肽)上的构象性表位,其由大分子一级序列(例如,多肽的氨基酸序列)中的至少两个单独区域形成。换句话说,如果表位由本发明的结合部分(例如其抗体或抗原结合片段)同时结合的一级序列中的至少两个单独区域组成,则该表位在本发明的情况下被认为是“构象性表位”,其中这些至少两个单独区域被不与本发明的结合部分结合的一级序列中的一个或多于一个区域中断。特别地,这样的“构象性表位”存在于多肽上,并且一级序列中的两个单独的区域是与本发明的结合部分(例如其抗体或其抗原结合片段)结合的两个单独氨基酸序列,其中这些至少两个单独氨基酸序列被不与本发明的结合部分结合的一级序列中的一个或多于一个氨基酸序列中断。特别地,中断的氨基酸序列是包含两个或多于两个不与结合部分结合的氨基酸的连续氨基酸序列。与本发明的结合部分结合的至少两个单独的氨基酸序列的长度不进行特别限制。这样的单独氨基酸序列可仅由一个氨基酸组成,只要在所述至少两个单独氨基酸序列之内的氨基酸总数足够大以实现结合部分和构象性表位之间的特异性结合。

“互补位”是识别表位的抗体部分。在本发明的情况下,“互补位”是识别表位的本文所述结合部分(例如其抗体或抗原片段)的一部分。

本发明情况下的“肽接头”指氨基酸序列,其在空间上分开复合物的两部分例如两个肽或蛋白质。通常这种接头由1至100个氨基酸组成,其最小长度为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个氨基酸,最大长度为至少100、95、90、85、80、75、70、65、60、55、50、45、40、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、或15个氨基酸或更少。根据本发明的肽接头的指定优选最小和最大长度可以,条件是这样的组合在数学上有意义,例如该接头可以由1至15或12至40或25至75或1至100个氨基酸组成。肽接头还可以提供连接在一起的两部分之间的柔性。如果氨基酸很小,这种柔性通常会增加。因此,柔性肽接头包含含量增加的小氨基酸,特别是甘氨酸和/或丙氨酸,和/或亲水性氨基酸例如丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺。优选地,肽接头中超过20%、30%、40%、50%、60%或更多的氨基酸是小氨基酸。

如本文所用,术语“变体”应理解为以下多肽或多核苷酸,其与其所来源的多肽或多核苷酸的不同在于长度或序列的一个或多于一个变化。衍生多肽或多核苷酸变体的多肽或多核苷酸也被称为亲本多肽或多核苷酸。术语“变体”包括亲本分子的“片段”或“衍生物”。通常,“片段”的长度或大小小于亲本分子,而“衍生物”与亲本分子相比在其序列上表现出一个或多个差异。还包括修饰的分子,例如但不限于翻译后修饰的蛋白质(例如糖基化、生物素化、磷酸化、泛素化、棕榈酰化或蛋白水解切割的蛋白质)和修饰的核酸,例如甲基化的dna。术语“变体”也涵盖不同分子的混合物,例如但不限于rna-dna杂合体。通常,优选通过基因技术手段人工构建变体,而亲本蛋白质或多核苷酸是野生型蛋白质或多核苷酸或其共有序列。然而,天然存在的变体也应理解为被本文所用的术语“变体”所涵盖。此外,可用于本发明的变体还可以衍生自亲本分子的同源物,直系同源物或旁系同源物或人工构建的变体,条件是该变体表现出亲本分子的至少一种生物学活性,即具有功能活性。特别地,术语“肽变体”、“多肽变体”、“蛋白质变体”应被理解为与以下肽、多肽或蛋白质,其与其素来源的肽、多肽或蛋白质相比区别在于一个或多于一个氨基酸序列的变化。衍生出肽、多肽或蛋白质变体的肽、多肽或蛋白质也被称为亲本肽、多肽或蛋白质。此外,可用于本发明的变体还可以衍生自亲本肽、多肽或蛋白质的同源物、直系同源物或旁系同源物或人工构建的变体,条件是该变体表现出亲本肽、多肽或蛋白质的至少一种生物学活性,即具有功能活性。氨基酸序列的变化可以是氨基酸交换、插入、缺失、n末端截短或c末端截短,或这些变化的任何组合,这些变化可以发生在一个或几个位点。

通过在比较窗口比较两个最佳比对序列来确定“序列同一性的百分比”,其中与参考序列(不包含添加或缺失)相比,比较窗口中的序列部分可以包括添加或缺失(即空位)以优化两个序列的比对。通过确定两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配位置数,将匹配位置数除以比较窗口中的位置总数,并将结果乘以100来计算百分比,从而得出序列同一性的百分比。

在两个或多于两个核酸或多肽序列的上下文中,术语“同一”是指两个或多于两个相同的序列或子序列,即包含相同的核苷酸或氨基酸序列。当在比较窗口或指定区域为获得最大一致性而比较并对齐时,其中使用以下序列比较算法或通过手动对齐和目视检查之一来测量比较窗口或指定区域,如果序列具有指定百分比的相同的核苷酸或氨基酸残基(例如,在指定区域中至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性),则序列彼此“基本相同”。这些定义也指测试序列的互补体。因此,说明书全文中关于多肽和多核苷酸序列比较使用术语“至少80%序列同一性”。该表述优选指相对于各自的参考多肽或各自的参考多核苷酸,至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

术语“序列比较”指其中一个序列作为参考序列,测试序列与该参考序列进行比较的过程。当使用序列比较算法时,将测试序列和参考序列输入计算机,需要时指定子序列坐标并指定序列算法程序参数。通常使用默认程序参数或可指定选择参数。然后序列比较算法基于程序参数计算测试序列与参考序列的序列同一性或相似性。在比较两个序列且未指定要计算序列同一性百分比的参考序列的情况下,如果没有特别说明,则应参考两个待比较序列中较长的一个来计算序列同一性。如果没有另外特别说明,如果指定了参考序列,则序列同一性基于seqidno所示的参考序列的全长来确定。

在序列比对中,术语“比较窗口”是指序列的连续位置的那些区段,其与具有相同数目的位置的序列的连续位置的参考区段进行比较。所选连续位置的数量可以为4至1000,即可以包括4、5、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个连续位置。通常,连续位置的数量为约20至800个连续位置,约20至600个连续位置,约50至400个连续位置,约50至约200个连续位置,约100至约150个连续位置。

用于比较的序列比对方法是本领域众所周知的。用于比较的序列的最佳比对可以例如通过smith和waterman的局部同源性算法(adv.appl.math.2:482,1970)、needleman和wunsch的同源性比对算法(j.mol.biol.48:443,1970)、pearson和lipman的相似性检索方法(proc.natl.acad.sci.usa85:2444,1988)进行,这些算法(例如gap、bestfit、fasta、和tfasta,在wisconsingeneticssoftwarepackage中,geneticscomputergroup,575sciencedr.,madison,wis.)通过计算机执行或通过手动比对或目视检查(参见例如ausubel等人,currentprotocolsinmolecularbiology(1995年增刊))。适合于确定序列同一性和序列相似性百分比的算法为blast和blast2.0算法,其分别见述于altschul等人(nuc.acidsres.25:3389-402,1977)和altschul等人(j.mol.biol.215:403-10,1990)。用于执行blast分析的软件是公众可通过nationalcenterforbiotechnologyinformation(http://www.ncbi.nlm.nih.gov/)获得的。该算法涉及首先通过确定在查询序列中长度w的短字(word)来确定高得分序列对(hsp),查询序列在与数据库序列中相同长度的字比对时匹配或满足一些正值阈值得分t。t被称为邻域字得分阈值(altschul等人,supra)。这些最初的邻近字命中充当启动搜索以查找包含它们的较长hsp的种子。字命中沿着每个序列在两个方向上延伸,直到可以增加累积比对得分为止。对于核苷酸序列,使用参数m(成对匹配残基的奖励分数;始终>0)和n(错配残基的罚分;始终<0)来计算累积分数。对于氨基酸序列,使用得分矩阵来计算累积得分。在以下情况下,将停止字命中在每个方向上的延伸:累积比对得分比其最大实现值减少数量x;由于一个或多个负得分残基比对的累积,累积得分变为零或更低;或到达任一序列的末尾。blast算法参数w、t和x确定比对的灵敏度和速度。blastn程序(用于核苷酸序列)默认使用字长(w)为11,期望值(e)为10,m=5,n=-4以及两条链的比较。对于氨基酸序列,blastp程序默认使用字长为3和期望值(e)为10以及blosum62评分矩阵(参见henikoff和henikoff,proc.natl.acad.sci.usa89:10915,1989)比对(b)为50,期望值(e)为10,m=5,n=-4,以及两条链的比较。blast算法还对两个序列之间的相似性进行统计分析(参见,例如,karlin和altschul,proc.natl.acad.sci.usa90:5873-87,1993)。blast算法提供的一种相似性度量是最小总和概率(p(n)),其指示偶然发生两个核苷酸或氨基酸序列匹配的概率。例如,如果在测试核酸与参考核酸的比较中最小的总和概率小于约0.2,通常小于约0.01,并且更通常小于约0.001,则认为核酸与参考序列相似。

优选半保守的氨基酸置换,尤其是保守的氨基酸置换,其中氨基酸被化学相关的氨基酸置换。典型的置换是在脂肪族氨基酸之间、在具有脂肪族羟基侧链的氨基酸之间、在具有酸性残基的氨基酸之间、在酰胺衍生物之间、在具有碱性残基的氨基酸之间或具有芳香族残基的氨基酸之间。典型的半保守置换和保守置换为:

如果新的半胱氨酸仍以游离硫醇形式存在,则从a、f、h、i、l、m、p、v、w或y变为c是半保守的。此外,本领域技术人员会理解在空间需求位置上的甘氨酸不应被置换,并且不应将p引入具有α-螺旋或β-折叠结构的蛋白质部分中。

标签(或标志物或标记)是任何种类的能够表明存在另一种物质或物质复合物的物质。标志物可以是与待检测物质连接或被引入待检测物质中的物质。可检测的标志物用于分子生物学和生物技术中以检测例如蛋白质、酶促反应产物、第二信使、dna、分子相互作用等。合适的标签或标记的例子包括荧光团、发色团、放射性标记、金属胶体、酶或化学发光或生物发光分子。在本发明的情况下,合适的标签优选是蛋白质标签,其肽序列以基因方式移植到重组蛋白之中或之上。蛋白质标签例如涵盖亲和标签、增溶标签、色谱标签、表位标签或荧光标签。

将“亲和标签”附加到蛋白质上,以可以使用亲和技术从其原始生物来源中纯化蛋白质。这些标签包括几丁质结合蛋白质(cbp)、麦芽糖结合蛋白(mbp)和谷胱甘肽s-转移酶(gst)。这些多组氨酸(poly(his))标签是广泛使用的与金属基质结合的蛋白质标签。

“增溶标签”特别是用于在伴侣分子缺陷物种中表达的重组蛋白质以有助于蛋白质中适当地折叠并防止其沉淀。这些标签包括硫氧化还原蛋白(trx)和多(nanp)。一些亲和标签具有作为增溶剂的双重作用,例如mbp和gst。

“色谱标签”用于改变蛋白质的色谱性能以提供在特定分离技术中的不同解析度。通常这些标签由多阴离子氨基酸组成,例如flag标签。

本发明情况下使用的术语“表位标签”是短肽序列,其由于高亲和性抗体能够在许多不同物种中可靠地制备而选择。这些标签通常来自于病毒基因,这解释了其高免疫反应性。表位标签包括v5标签、myc标签和ha标签。这些标签特别用于蛋白免疫印迹、免疫荧光和免疫沉淀实验,但还发现其用于抗体纯化。

“荧光标签”用于提供蛋白质上的目视读数。gfp及其变体是最常用的荧光标签。gfp更高级的应用包括其作为折叠报告分子(折叠时显示荧光,否则无色)。荧光团的其他实例包括荧光素、罗丹明和硫吲哚花青染料cy5。

根据本发明的术语“结合”优选地涉及特异性结合。术语“结合亲和力”通常是指分子(例如抗体)的单个结合位点与其结合伴侣(例如靶标或抗原)之间的非共价相互作用的总和的强度。除非另有说明,否则如本文所用,“结合亲和力”是指固有结合亲和力,其反映结合对的成员(例如抗体和抗原)之间的1∶1相互作用。分子x与其伴侣y的亲和力通常可以用解离常数(kd)表示。“特异性结合”是指相比于与另一靶标结合,结合部分(例如抗体)更牢固地与靶标例如特异性表位结合。如果结合部分结合第一靶标的解离常数(kd)比结合第二靶标的解离常数低,则与第二靶标相比,结合部分与第一靶标的结合力更强。不与结合部分特异性结合的靶标的解离常数(kd)是与结合部分特异性结合的靶标的解离常数(kd)的大于10倍、优选大于20倍、更优选大于50倍、甚至更优选比低大于100倍、200倍、500倍或1000倍。

因此,术语“kd”(以“mol/l”计,有时缩写为“m”)旨在指结合部分(例如抗体或其片段)和靶标分子(例如抗原或其表位)特定相互作用的解离平衡常数。可以通过本领域已知的常规方法来测量亲和力,包括但不限于基于表面等离子体共振的测试(例如bia核测试)、石英晶体微量天平测定法(例如attana测定法)、酶联免疫吸附测定(elisa)和竞争性分析(例如ria)。低亲和力抗体通常缓慢结合抗原并倾向于易于分离,而高亲和力抗体通常较快结合抗原并倾向于保持更长时间的结合。本领域已知多种测量结合亲和力的方法,任何方法可用于本发明的目的。

通常,包含在氨基酸链i和/或ii中的抗体或抗体模拟物以足够的亲和力结合于其靶标,其kd值例如为500nm至1pm,即500nm、450nm、400nm、350nm、300nm、250nm、200nm、150nm、100nm、50nm、10nm、1nm、900pm、800pm、700pm、600pm、500pm、400pm、300pm、200pm、100pm、50pm、1pm。

如本文所使用的术语“免疫球蛋白(ig)”指免疫球蛋白超家族的赋予免疫力的糖蛋白。“表面免疫球蛋白”通过其跨膜区域连接到例如效应细胞或内皮细胞的膜上,并且包括例如但不限于初生fc受体、b细胞受体、t细胞受体、i和ii类主要组织相容性复合物(mhc)蛋白、β-2微球蛋白(β2m)、cd3、cd4和cd8的分子。

通常,本文所用的术语“抗体”是指分泌的免疫球蛋白,其缺乏跨膜区,因此可以释放到血流和体腔中。人类抗体根据其拥有的重链分为不同的同种型。用希腊字母表示的人类ig重链有五种类型:α、γ、δ、ε和μ。存在的重链类型定义了抗体的类别,即这些链分别存在于iga、igd、ige、igg和igm抗体中,其各自发挥不同的作用,并指导针对不同类型抗原的适当免疫应答。不同重链在大小和组成方面不同并可以包括约450个氨基酸(janeway等人(2001)immunobiology,garlandscience)。iga见于黏膜区例如消化道、呼吸道和泌尿生殖道,以及唾液、眼泪和母乳,并防止病原体的定植(underdown&schiff(1986)annu.rev.immunol.4:389-417)。igd主要在未暴露于抗原的b细胞上充当抗原受体,并参与活化嗜碱性粒细胞和肥大细胞以产生抗菌因子(geisberger等人(2006)immunology118:429-437;chen等人(2009)nat.immunol.10:889-898)。ige通过与变应原结合,触发肥大细胞和嗜碱性粒细胞释放组胺,从而参与变应性反应。ige还参与防护寄生虫(pier等人(2004)immunology,infection,andimmunity,asmpress)。igg提供主要的针对入侵病原体的基于抗体的免疫力,并且是唯一能够穿过胎盘为胎儿提供被动免疫力的抗体同种型(pier等人(2004)immunology,infection,andimmunity,asmpress)。人体中存在四种不同的igg亚类(igg1、igg2、igg3和igg4),按其在血清中的丰度命名,其中igg1(~66%)是最大量的,然后是igg2(~23%)、igg3(~7%)和igg(~4%)。不同igg类别的生物学特征由各自铰链区的结构决定。igm以非常高的亲和力以单体形式和分泌的五聚体形式在b细胞表面表达。在产生足够的igg之前,igm参与消除b细胞介导的(体液)免疫的早期病原体(geisberger等人(2006)immunology118:429-437)。抗体不仅作为单体存在,而且还已知形成两个ig单元(例如iga)的二聚体,四个ig单元(例如硬骨鱼的igm)的四聚体或五个ig单元的五聚体(例如哺乳动物igm)。抗体通常由包含两条相同的重链和两条相同的轻链的四个多肽链制成,两条重链和两条轻链通过二硫键连接并且类似于“y”形大分子。每条链包含许多免疫球蛋白结构域,其中一些是恒定结构域而其他是可变结构域。免疫球蛋白结构域由排列在两个β折叠中的7至9个反向平行β链的2层三明治结构组成。通常,抗体的重链包含四个ig结构域,其中三个是恒定的(ch结构域:ch1、ch2、ch3)结构域,其中一个是可变结构域(vh)。轻链通常包含一个恒定的ig结构域(cl)和一个可变的ig结构域(vl)。vh和vl区可以进一步细分为高可变区,称为互补决定区(cdr),其间穿插着更为保守的区,称为框架区(fr)。每个vh和vl由三个cdr和四个fr组成,从氨基端到羧基端按以下顺序排列:fr1、cdr1、fr2、cdr2、fr3、cdr3、fr4。重链和轻链的可变区包含与抗原相互作用的结合域。抗体的恒定区可以介导免疫球蛋白与宿主组织或因子的结合,所述宿主组织或因子包括免疫系统的各种细胞(例如,效应细胞)和经典补体系统的第一组分(c1q)。

术语“ig样恒定区共有序列(iglcrc)”描述了源自人免疫球蛋白或人免疫球蛋白样蛋白比对的编号,如图4所示。技术人员知道如何使用序列同一性和/或结构信息将其他人免疫球蛋白或人免疫球蛋白样蛋白添加至该比对。因此,技术人员可以针对给定的人免疫球蛋白或人免疫球蛋白样蛋白的每个氨基酸确定其各自的iglcrc编号。例如igg1的ch3的6个间隔区“b”、“c”、“d”、“e”、“f”和“g”跨越iglcrc19至30(不包含iglcrc的位置26至28的氨基酸)、iglcrc41至45(不包含iglcrc的位置43的氨基酸)、iglcrc53至62(不包含iglcrc的位置59至61的氨基酸),e跨越iglcrc位置71至80(不包含iglcrc的位置72至76的氨基酸)、iglcrc90至101(不包含iglcrc的位置98和99的氨基酸)和iglcrc109至127(不包含iglcrc的位置112至124的氨基酸)。igg1的ch3在某些iglcrc位置缺少氨基酸。这是由于在人免疫球蛋白或人免疫球蛋白样蛋白的这些较低程度结构化的区域中较高的变异性,其可适应氨基酸缺失和插入而不会改变人免疫球蛋白或人免疫球蛋白样蛋白的整体结构。类似地,igg1的ch3的7条β链a”、“b”、“c”、“d”、“e”、“f”和“g”可以跨越iglcrc的位置13至18、31至40、46至52、63至70、81至89、102至108和128至133。此外,igg1的ch3的n端区域“a”跨越iglcrc7至12,c端区域“h”跨越iglcrc134至139。以类似的方式,技术人员还可以针对每个给定的人免疫球蛋白或人免疫球蛋白样蛋白,分别确定给定的人免疫球蛋白或人免疫球蛋白样蛋白内每个元件的n末端和c末端。给定比对的人免疫球蛋白或人免疫球蛋白样蛋白的氨基酸序列中的空位数目可以变化。然而β链a跨越ch3的iglcrc的位置13至18,β链b跨越ch3的iglcrc的位置31至40,β链c跨越ch3的iglcrc的位置46至52,β链d跨越ch3的iglcrc的位置63至70,β链e跨越ch3的iglcrc的位置81至89,β链f跨越ch3的iglcrc的位置102至108,β链g跨越ch3的iglcrc的位置128至133,间隔区b跨越ch3的iglcrc的位置19至30,间隔区c跨越ch3的iglcrc的位置41至45,间隔区d跨越ch3的iglcrc的位置53至62,间隔区e跨越ch3的iglcrc的位置71至80,间隔区f跨越ch3的iglcrc的位置90至101和间隔区g跨越ch3的iglcrc的位置109至127。n端区域a跨越iglcrc的位置1至12,c端区域h跨越iglcrc的位置134直至相应的人免疫球蛋白或人免疫球蛋白样蛋白的c末端。

对于图4中未包括的氨基酸序列,其可包含一个或多于一个间隔区,该间隔区的长度超过本文定义的间隔区b(22个残基)、c(5个残基)、d(10个残基)、e(12个残基)、f(19个残基)或包含长度超过本文定义的n端区域a(12个残基)的n端区域,可以通过指定其他残基6a、6b、6c等将其他残基引入位置6之后的iglcrc编号方案,或通过指定其他残基25a、25b、25c等引入位置25之后,或通过指定其他残基42a、42b、42c等引入位置42之后,或通过指定其他残基58a、58b、58c等引入位置58之后,或通过指定其他残基71a、71b、71c等引入位置71之后,或通过指定其他残基91a、91b、91c等引入位置91之后,或通过指定其他残基111a、111b、111c等引入位置111之后。此外,由于给定的人免疫球蛋白或人免疫球蛋白样蛋白的相应氨基酸序列不一定始于iglcrc位置1,并且如图4所示进行比对时也可能存在空位,因此iglcrc位置不直接反映序列表中包括的序列内氨基酸的位置。例如,优选的igg1的ch3具有根据seqidno:45的氨基酸序列。n端区域跨越iglcrc的位置7至12,其对应于seqidno:45的氨基酸1至6,igg1的ch3的β链a”、“b”、“c”、“d”、“e”、“f”和“g”跨越iglcrc的位置13至18、31至40、46至52、63至70、81至89、102至108、和128至133,其分别对应于seqidno:45的氨基酸7至12、23至32、37至43、51至58、64至72、83至88、95至100。c端区域跨越氨基酸101至107。igg1的ch3的五个间隔区“b”、“c”、“d”、“e”、“f”和“g”跨越iglcrc的位置19至30、41至45、53至62、71至80、90至101、和109至127,其分别对应于seqidno:45的氨基酸13至22、33至36、44至50、53至63、59至63、73至82、89至94。鉴于这些考虑,本领域技术人员可以确定第一cri、第二cri、第三cri和第四cri的每个元件而无需过度负担。一旦确定了元件,则一方面将第一cri和第二cri的序列进行比对,另一方面将第三cri和第四cri的序列进行比对,对于本领域技术人员而言遵照以下指示并将第一cri和第三cri的氨基酸分别置换成第三cri和第四cri的氨基酸是简单的。

如本文所用,术语“抗原结合蛋白”是指免疫球蛋白分子和免疫球蛋白分子的免疫学活性部分,即,具有免疫特异性结合抗原的抗原结合位点的分子。还包括免疫球蛋白样蛋白,其通过包括例如噬菌体展示的技术进行选择以特异性结合靶分子或靶表位。在评估抗原结合蛋白,例如抗体或其免疫功能片段的结合和/或特异性时,当过量的抗体使结合至配体的结合配偶体的量减少至少约1至20%、20至30%、30至40%、40至50%、50至60%、60至70%、70至80%、80至85%、85至90%、90至95%、95至97%、97至98%、98至99%或更高(例如,在体外竞争性结合试验中测得)时,抗体或片段可以基本上抑制配体与其结合配偶体的结合。中和能力可以用ic50或ec50值来描述。

“ic50”值是指物质的最大抑制浓度的一半,因此是物质抑制特定生物学或生化功能有效性的量度。该值通常表示为摩尔浓度。可以通过构建剂量反应曲线并检查不同浓度下所检查物质的抑制作用,在功能拮抗试验中确定药物的ic50。或者,可以进行竞争结合测定以确定ic50值。通常,本发明的抑制性抗体表现出50nm至1pm,即50nm、10nm、1nm、900pm、800pm、700pm、600pm、500pm、400pm、300pm、200pm、100pm、50pm、1pm的ic50值。

“ec50”值是指物质的最大有效浓度的一半,因此是在规定的暴露时间后,在基线和最大值之间引起响应的一半的所述物质浓度的量度。它通常用作药物效力的量度。因此,分级剂量反应曲线的ec50表示物质的浓度,在该浓度下可观察到其最大作用的50%。定量剂量反应曲线的ec50表示指定暴露时间后50%群体表现出反应的化合物的浓度。通常本发明的抑制性抗体表现出50nm至1pm,即50nm、10nm、1nm、900pm、800pm、700pm、600pm、500pm、400pm、300pm、200pm、100pm、50pm或1pm的ec50值。

如本文所用,术语抗体的“抗原结合片段”(或简称为“结合部分”)是指保留特异性结合抗原的能力的抗体的一个或多于一个片段。已经显示抗体的抗原结合功能可以通过全长抗体的片段来执行。

如本文所用,“人抗体”包括具有源自人种系免疫球蛋白序列的可变区和恒定区的抗体。本发明的人抗体可包括不由人种系免疫球蛋白序列编码的氨基酸残基(例如,由体外随机或位点特异性诱变或体内体细胞突变引入的突变)。本发明的人抗体包括从人免疫球蛋白文库或从一种或多种人免疫球蛋白的转基因动物中分离出来的并且不表达内源性免疫球蛋白的抗体,如例如在kucherlapati&jakobovits的美国专利号5,939,598中所述。

如本文所用,术语“单克隆抗体”是指单一分子组成的抗体分子的制剂。单克隆抗体显示出对特定表位的单一结合特异性和亲和力。在一个实施方案中,单克隆抗体是由杂交瘤产生的,该杂交瘤包括获自非人类动物例如小鼠的与永生细胞融合的b细胞。

如本文所用,术语“重组抗体”包括通过重组方式制备、表达、产生或分离的所有抗体,例如(a)从对于免疫球蛋白基因是转基因的或转染色体的动物(例如小鼠)或由其制备的杂交瘤分离的抗体,(b)从转化以表达抗体的宿主细胞中分离的抗体,例如从转染瘤分离的抗体,(c)从重组组合抗体文库中分离的抗体,和(d)通过涉及将免疫球蛋白基因序列剪接至其他dna序列的任何其他方式制备、表达、产生或分离的抗体。

术语“嵌合抗体”是指这样的抗体,其中重链和轻链的每个氨基酸序列的一部分与衍生自特定物种或属于特定类别的抗体中的相应序列同源,而链的其余片段与另一物种或类别中的相应序列同源。通常,轻链和重链的可变区都模仿衍生自一种哺乳动物的抗体的可变区,而恒定部分与衍生自另一种哺乳动物的抗体的序列同源。这种嵌合形式的一个明显的优点是可变区可以方便地从现今已知的来源中使用现成的b细胞或来自非人类宿主生物的杂交瘤获得,并与衍生自例如人类细胞制剂的恒定区相组合。可变区具有易于制备的优点,并且特异性不受来源的影响,同时当注射抗体时,人来源的恒定区与来自非人类来源的恒定区相比,不太可能引起来自人对象的免疫应答。但是,定义不限于该特定实例。

术语“人源化抗体”是指具有抗原结合位点的分子,该抗原结合位点基本上衍生自非人类物种的免疫球蛋白,其中分子的其余免疫球蛋白结构基于人免疫球蛋白的结构和/或序列。抗原结合位点可以包含融合到恒定结构域上的完整可变结构域,或者仅包含连接至可变结构域中适当框架区上的互补决定区(cdr)。抗原结合位点可以是野生型的,也可以被一个或多于一个氨基酸置换修饰,例如被修饰以更类似于人免疫球蛋白。某些形式的人源化抗体保留了所有cdr序列(例如,包含来自小鼠抗体的所有六个cdr的人源化小鼠抗体)。其他形式具有相对于原始抗体发生改变的一个或多于一个cdr。

如almagro&fransson,2008所综述,用于使抗体人源化的不同方法是本领域技术人员已知的,其内容通过引用整体并入本文。almagro&fransson的综述文章在以下简要总结。almagro&fransson区分了推理法和经验法。推理法的特征在于生成工程抗体的少量变体并评估其结合特性或其他任何感兴趣的特性。如果设计的变体没有产生预期的结果,则将启动新的设计和结合评估周期。推理法包括cdr嫁接、抗体镶面(resurfacing)、超人源化和人序列含量优化(humanstringcontentoptimization)。相反,经验法是基于人源化变体的大型文库的产生,以及使用富集技术或高通量筛选来选择最佳克隆。因此,经验法取决于能够在广阔空间中搜索抗体变体的可靠选择和/或筛选系统。如噬菌体展示和核糖体展示之类的体外展示技术满足了这些要求,并且是技术人员众所周知的。经验法包括fr文库、指导性选择、框架改组和humaneering。

“二价抗体”包含两个抗原结合位点。二价抗体可以是单特异性或双特异性的。在二价抗体是单特异性的情况下,抗体的两个结合位点具有相同的抗原特异性。“双特异性”或“双功能”抗原结合蛋白或抗体分别是具有两个不同抗原结合位点的杂交抗原结合蛋白或抗体。双特异性抗原结合蛋白或抗体的两个结合位点与位于相同或不同抗原上的两个不同表位结合。双特异性抗原结合蛋白和抗体是多特异性抗原结合蛋白抗体的一种,并且可以通过多种方法产生,包括但不限于杂交瘤融合、igg或igg片段如fab′的化学连接或基因方法。参见例如songsivilai和lachmann,1990,clin.exp.lmmunol.79:315-321;kostelny等人,1992,j.lmmunol.148:1547-1553;kontermann,2014,mabs4:182-197。

“三功能抗体”是一种双特异性抗体,其包括靶向不同抗原的两个结合位点以及完整fc部分,该fc部分可以结合辅助细胞(例如单核细胞/巨噬细胞、自然杀伤细胞、树突状细胞或其他)上的fc受体。例如,三功能抗体可包含靶向癌细胞表面上的表位的结合位点,第二结合位点可靶向t细胞(例如,cd3)表面上的表位,而fc部分可结合至巨噬细胞表面的fc受体。因此,这种三功能抗体能够将t细胞和巨噬细胞连接至肿瘤细胞,从而导致其破坏。

抗体的木瓜蛋白酶消化会产生两个相同的抗原结合片段,称为“fab片段”(也称为“fab部分”或“fab区”),每个片段均具有单个抗原结合位点;和“fc片段”(也称为“fc部分”或“fc区”),其名称反映了其容易结晶的能力。已经确定了人iggfc区的晶体结构(deisenhofer(1981)biochemistry20:2361-2370)。在igg、iga和igd同种型中,fc区由两个相同的蛋白质片段组成,它们分别来自抗体两条重链的ch2和ch3结构域。在igm和ige同种型中,fc区在每个多肽链中包含三个重链恒定结构域(ch2-4)。另外,较小的免疫球蛋白分子天然存在或已经人工构建。术语“fab′片段”是指另外包含ig分子的铰链区的fab片段,而“f(ab′)2片段”应理解为包含两个通过二硫键化学连接的fab′片段。“单结构域抗体(sdab)”(desmyter等人(1996)nat.structurebiol.3:803-811)和“纳米抗体”仅包含单个vh结构域,“单链fv(scfv)”片段包含通过短接头肽连接至轻链可变结构域的重链可变结构域(huston等人(1988)proc.natl.acad.sci.usa85,5879-5883)。二价单链可变片段(di-scfv)可以通过连接两个scfvs(scfva-scfvb)而工程化。这可以通过产生具有两个vh区和两个vl区的单条肽链来实现,从而产生“串联scfv”(vha-vla-vhb-vlb)。另一个可能性是创建带有接头的scfv,该接头足够短,以致两个可变区无法折叠在一起,从而迫使scfv二聚化。通常使用长度为5个残基的接头来生成这些二聚体。这种类型称为“双抗体”。vh结构域和vl结构域之间更短的接头(一个或两个氨基酸)导致单特异性三聚体的形成,所谓的“三抗体”(triabody或tribody)。双特异性双抗体通过分别表达为具有排列vha-vlb和vhb-vla或vla-vhb和vlb-vha的链而形成。单链双抗体(scdb)包含vha-vlb和vhb-vla片段,它们通过12至20个氨基酸,优选14个氨基酸的连接肽(p)连接(vha-vlb-p-vhb-vla)。“双特异性t细胞衔接子(bite)”是由不同抗体的两个scfv组成的融合蛋白,其中一个scfv通过cd3受体与t细胞结合,另一个通过肿瘤特异性分子与肿瘤细胞结合(kufer等人(2004)trendsbiotechnol.22:238-244)。双亲和力重靶向分子(“dart”分子)是另外通过c端二硫键稳定的双抗体。

如本文所用,术语“抗体样蛋白”或免疫球蛋白样蛋白是指已经被工程化(例如通过环的诱变)以特异性结合靶分子的蛋白。通常,这种抗体样蛋白包含至少一个可变肽环,该可变肽环的两端均连接至蛋白支架。这种双重结构限制极大地增加了抗体样蛋白的结合亲和力直至与抗体相当的程度。可变肽环的长度通常为10至20个氨基酸。支架蛋白可以是任何具有良好溶解性的蛋白。优选地,支架蛋白是小球状蛋白。抗体样蛋白包括但不限于亲和体、anticalin和设计的锚蛋白重复蛋白(综述参见:binzh.k.等人(2005)engineeringnovelbindingproteinsfromnonimmunoglobulindomains.nat.biotechnol.23(10):1257-1268)。抗体样蛋白可以衍生自大的突变体文库,例如可以从大型噬菌体展示文库中淘选,并且可以类似于常规抗体进行分离。而且,可以通过球状蛋白质中表面暴露残基的组合诱变获得抗体样结合蛋白。抗体样蛋白有时被称为“肽适体”。

如本文所用,“拟肽”是被设计为模拟肽的小蛋白样链。拟肽通常来自对现有肽的修饰,以改变分子性质。例如,它们可来自改变分子稳定性或生物活性的修饰。这可在从现有肽开发药物样化合物中起作用。这些修饰涉及不会自然发生的肽改变(例如骨架改变和非天然氨基酸的掺入)。

术语“靶标”是指能够被抗原结合蛋白结合的分子或分子的一部分。在某些实施方案中,靶标可具有一个或多个表位。在某些实施方案中,靶标是抗原。短语“抗原结合蛋白”中“抗原”的使用仅表示包含抗原的蛋白序列可以被抗体结合。在这种情况下,不需要该蛋白质是外源的或能够诱导免疫应答。

术语“重组”是指通过重组方法有意修饰的氨基酸序列或核苷酸序列。如本文所用,术语“重组核酸”是指在体外形成的核酸,并且任选地被核酸内切酶进一步操纵以形成自然界通常不存在的核酸分子。示例性的重组核酸包括线性形式的cdna,以及通过连接通常不连接的dna分子而在体外形成的载体。应当理解,一旦制备了重组核酸并将其引入宿主细胞中,它将非重组地复制,即使用宿主细胞的体内细胞机制而不是进行体外操纵。因此,重组产生的核酸可随后以非重组方式复制。“重组蛋白”是使用重组技术例如通过如上所述重组核酸的表达来制备的蛋白。如本文所用,术语“重组载体”包括技术人员已知的任何载体,包括质粒载体、黏粒载体、噬菌体载体(例如λ噬菌体)、病毒载体(例如腺病毒或杆状病毒载体)或人工染色体载体(例如细菌人工染色体)(bac)、酵母人工染色体(yac)或p1人工染色体(pac)。所述载体包括表达载体和克隆载体。表达载体包含质粒以及病毒载体,并且通常包含期望的编码序列和在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)或者在体外表达系统中表达可操作的连接的编码序列所必需的合适的dna序列。克隆载体通常用于工程化和扩增某些期望的dna片段,并且可缺少表达期望dna片段所需的功能序列。

术语“宿主细胞”是指带有载体(例如质粒或病毒)的细胞。这样的宿主细胞可以是原核细胞(例如细菌细胞)或真核细胞(例如真菌、植物或动物细胞)。宿主细胞包括单细胞原核生物和真核生物(例如细菌、酵母和放线菌),以及在细胞培养中生长时来自高级植物或动物的单细胞。如本文所用,“重组宿主细胞”是指包含编码目的多肽片段(即,根据本发明的病毒pa亚基或其变体的片段)的多核苷酸的宿主细胞。该多核苷酸可(i)原样自由分散地存在于宿主细胞内,(ii)掺入重组载体中,或(iii)整合入宿主细胞基因组或线粒体dna中。重组细胞可用于表达目的多核苷酸或用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括已被本发明的多核苷酸或重组载体转化、转染或感染的原始细胞的后代。重组宿主细胞可以是细菌细胞,例如大肠杆菌细胞、酵母细胞,例如酿酒酵母(saccharomycescerevisiae)或毕赤酵母(pichiapastoris);植物细胞、昆虫细胞例如sf9或highfive细胞;或哺乳动物细胞。哺乳动物细胞的优选实例是中国仓鼠卵巢(cho)细胞、非洲绿猴肾(cos)细胞、人胚肾(hek293)细胞、hela细胞等。

术语“个体”、“对象”或“患者”在本文可互换使用,并且是指可以从本发明中受益的任何哺乳动物、爬行动物或鸟类。特别地,个体选自实验动物(例如小鼠、大鼠或兔子)、家畜(包括豚鼠、兔子、马、驴、牛、绵羊、山羊、猪、鸡、鸭、骆驼、猫、狗、海龟、乌龟、蛇或蜥蜴)或灵长类动物,包括黑猩猩、倭黑猩猩、大猩猩和人。特别地,“个体”是人。

术语“疾病”和“病症”在本文中可互换使用,指的是异常状况,尤其是异常的医学状况,例如疾病或损伤,其中组织、器官或个体不再能够有效地履行其功能。通常,但非必须地,疾病与表明该疾病存在的特定症状或体征相关联。因此,这些症状或体征的存在可以指示患有疾病的组织、器官或个体。这些症状或体征的改变可指示这种疾病的进展。疾病的进展通常以这种症状或体征的增加或减少为特征,这可以指示疾病的“恶化”或“改善”。疾病的“恶化”以组织、器官或生物体有效履行其功能的能力下降为特征,而疾病的“改善”通常以组织、器官或器官有效履行其功能的能力增强为特征。处于“患病风险”的组织、器官或个人处于健康状态,但显示出疾病发作的可能。通常,发生疾病的风险与此类疾病的早期或较弱的体征或症状相关联。在这种情况下,仍然可以通过治疗来预防疾病的发作。疾病的实例包括但不限于传染性疾病、创伤性疾病、炎性疾病、皮肤病、内分泌疾病、肠道疾病、神经系统疾病、关节疾病、遗传疾病、自身免疫性疾病和各种类型的癌症。

“肿瘤”是指细胞或组织的异常组,其通过快速、不受控制的细胞增殖而生长,并在引发新的生长的刺激停止后继续生长。肿瘤显示出部分或完全缺乏与正常组织的结构化组织和功能协调,并且通常形成明显的组织块,可能是良性或恶性的。

“转移”是指癌细胞从其原始部位扩散到身体的另一部分。转移的形成是非常复杂的过程,取决于恶性细胞从原发肿瘤的分离、细胞外基质的侵袭、内皮基底膜的渗透进入体腔和血管,然后经血液运输、渗透到目标器官。最后,新肿瘤在靶部位的生长取决于血管生成。即使在去除原发肿瘤之后,肿瘤转移也经常发生,因为肿瘤细胞或组分可能保留并发展出转移潜力。在一个实施方案中,根据本发明的术语“转移”涉及“远端转移”,其涉及远离原发肿瘤和区域淋巴结系统的转移。

疾病或病症的“症状”是具有这种疾病或病症的组织、器官或生物体可察觉的疾病或病症暗示,包括但不限于组织、器官或个体的疼痛、虚弱、压痛、劳损、僵硬和痉挛,以及特定指标(例如生物标志物或分子标志物)的存在、不存在、增加、减少。如本文所用,术语“疾病”和“病症”是指异常状况,特别是诸如疾病或损伤的异常医学状况,其中组织、器官或个体不再能够有效地履行其功能。通常,但非必须地,疾病或病症与指示此类疾病或病症的存在的特定症状或体征相关联。疾病或病症包括但不限于自身免疫性疾病、变态反应性疾病、癌症类型的疾病、皮肤病、内分泌疾病、血液疾病和失调、眼部疾病和失调、遗传性疾病、炎性疾病、传染病、肠道疾病、神经系统疾病和精神疾病。举例来说,癌症类型的疾病包括但不限于基底细胞癌、膀胱癌、骨癌、脑肿瘤、乳腺癌、伯基特淋巴瘤、宫颈癌、结肠癌、皮肤t细胞淋巴瘤、食道癌、视网膜母细胞瘤、胃部(胃)癌、胃肠道间质瘤、神经胶质瘤、霍奇金淋巴瘤、卡波西肉瘤、白血病、淋巴瘤、黑色素瘤、口咽癌、卵巢癌、胰腺癌、胸膜肺母细胞瘤、前列腺癌、喉癌、甲状腺癌和尿道癌。

如本文所用,疾病或病症的“治疗”是指实现以下一项或多于一项:(a)减轻病症的严重程度;(b)限制或预防所治疗疾病特征性症状的发展;(c)抑制所治疗病症特征性症状的恶化;(d)限制或预防先前患有病症的个体的病症复发;(e)限制或预防先前有病症症状的个体的症状复发。因此,具有治疗作用的部分通过实现一种或多于一种上述作用(a)至(e)来治疗疾病或病症的症状。

如本文所用,“预防”疾病或病症是指预防这种疾病或病症在患者中发生。

本文使用的术语“igg1、igg2、igg3、igg4、iga1、iga2、igd、ige、igm、igκ、igλ、tcr”描述了包含ig超家族结构域的抗体或分子,并且可以是人、鼠、大鼠、其他啮齿动物、牛和其他来源,尤其是人来源。

本文使用的术语“hla”描述了人白细胞抗原,也称为mhc(主要组织相容性复合物),包括mhci类和ii类分子,含有ig超家族的结构域,可以是人、鼠、大鼠、其他啮齿动物、牛和其他来源。

如本文所用,术语“asl”描述了抗原特异性配体。因此,aslan1是指对抗原1具有特异性的抗原特异性配体,aslan2是指对抗原2具有特异性的抗原特异性配体,aslan3是指对抗原3具有特异性的抗原特异性配体,依此类推。

术语“药”、“药物”和“药剂”在本文中可互换使用,是指用于识别、预防或治疗疾病或病症的物质和/或物质的组合。

“atrosab”是人源化单克隆抗体,可特异性阻断促炎性tnf受体1(tnfr1),而不与tnf受体2(tnfr2)相互作用。atrosab目前正在开发中,以进行进一步的临床研究。

实施方案

本发明的第一方面提供蛋白质复合物,其包含至少两个氨基酸链i和ii,它们通过包含在氨基酸链i的异源二聚化区域i(hri)和包含在氨基酸链ii的异源二聚化区域ii(hrii)彼此非共价结合,其中

(a)hri包含按以下顺序从n端到c端布置的7个反向平行的β链ai、bi、ci、di、ei、fi和gi,6个间隔区bi、ci、di、ei、fi和gi,n端区域ai和c端区域hi:

ai-ai-bi-bi-ci-ci-di-di-ei-ei-fi-fi-gi-gi-hi,

其中hri是穿插有免疫球蛋白或免疫球蛋白样蛋白的第二人类恒定区的氨基酸(第二cri,供体)的免疫球蛋白或免疫球蛋白样蛋白的第一人类恒定区(第一cri,受体)的融合蛋白,

其中第一cri包含按以下顺序从n端到c端布置的7个反向平行的β链a1、b1、c1、d1、e1、f1和g1,六个间隔区b1、c1、d1、e1、f1和g1,n端区域a1和c端区域h1:

a1-a1-b1-b1-c1-c1-d1-d1-e1-e1-f1-f1-g1-g1-h1,

其中第二cri包含按以下顺序从n端到c端布置的7个反向平行的β链a2、b2、c2、d2、e2、f2和g2,六个间隔区b2、c2、d2、e2、f2和g2,n端区域a2和c端区域h2:

a2-a2-b2-b2-c2-c2-d2-d2-e2-e2-f2-f2-g2-g2-h2,

其中hri具有第一cri的氨基酸序列,其中第一cri的至少以下氨基酸被第二cri的以下氨基酸置换:

(i)a1的至少一个氨基酸被a2的至少1个氨基酸置换(置换1);在优选的实施方案中,a1的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸被a2的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸置换;和

(ii)c1的至少一个氨基酸被c2的至少1个氨基酸置换(置换2),在优选的实施方案中,由c1的1至5个氨基酸(即1、2、3、4或5个氨基酸)和c1的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段,更优选包含或组成为c1的2至5个氨基酸和c1的4至6个氨基酸的连续氨基酸区段被由c2的1至5个氨基酸(即1、2、3、4或5个氨基酸)和c2的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段置换,更优选被包含或组成为c2的2至5个氨基酸和c2的4至6个氨基酸的连续氨基酸区段置换;更优选地,c1的1至5个氨基酸被c2的1至5个氨基酸置换;优选地,在置换2中置换的残基包括iglcrc的位置47和49;优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)g1的至少一个氨基酸被g2的至少1个氨基酸置换(置换3);在优选的实施方案中,包含或组成为g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选f1的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和g1的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含或组成为g2的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选f2的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和g2的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换;优选地,被置换的连续氨基酸区段的总长度为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸;和其中

(b)hrii包含按以下顺序从n端到c端布置的7个反向平行的β链aii、bii、cii、dii、eii、fii和gii,6个间隔区bii、cii、dii、eii、fii和gii,n端区域aii和c端区域hii:

aii-aii-bii-bii-cii-cii-dii-dii-eii-eii-fii-fii-gii-gii-hii,

其中hrii是穿插有免疫球蛋白或免疫球蛋白样蛋白的第四人恒定区的氨基酸(第四cri,供体)的免疫球蛋白或免疫球蛋白样蛋白的第三人恒定区(第三cri,受体)的融合蛋白,

其中第三cri包含按以下顺序从n端到c端布置的7个反向平行的β链a3、b3、c3、d3、e3、f3和g3,六个间隔区b3、c3、d3、e3、f3和g3,n端区域a3和c端区域h3:

a3-a3-b3-b3-c3-c3-d3-d3-e3-e3-f3-f3-g3-g3-h3,

其中第四cri包含按以下顺序从n端到c端布置的7个反向平行的β链a4、b4、c4、d4、e4、f4和g4,六个间隔区b4、c4、d4、e4、f4和g4,n端区域a4和c端区域h4:

a4-a4-b4-b4-c4-c4-d4-d4-e4-e4-f4-f4-g4-g4-h4,

其中hrii具有第三cri的氨基酸序列,其中第三cri的至少以下氨基酸被第四cri的以下氨基酸置换:

(i)a3的至少一个氨基酸被a4的至少1个氨基酸置换(置换4);在优选的实施方案中,a3的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至10个氨基酸被a4的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至10个氨基酸置换;和

(ii)c3的至少一个氨基酸被c4的至少1个氨基酸置换(置换5),在优选的实施方案中,由c3的1至5个氨基酸(即1、2、3、4或5个氨基酸)和c3的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段,更优选由c3的2至5个氨基酸和c3的4至6个氨基酸组成的连续氨基酸区段被由c4的1至5个氨基酸(即1、2、3、4或5个氨基酸)和c4的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段置换,更优选被由c4的2至5个氨基酸和c4的4至6个氨基酸组成的连续氨基酸区段置换;

更优选地,c3的1至5个氨基酸被c4的1至5个氨基酸置换,

更优选地,在置换5中置换的残基包括iglcrc的位置47和49,

优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)g3的至少一个氨基酸被g4的至少1个氨基酸置换(置换6);在优选的实施方案中,包含或组成为g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选f3的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和g3的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含或组成为f4的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选f4的1至6个氨基酸(即1、2、3、4、5或6个氨基酸);和g4的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换,

优选地,被置换的连续氨基酸区段的总长度为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸;

其中第一cri和第三cri彼此不同,并且在生理条件下彼此特异性结合。

因此,hri优选具有以下氨基酸结构:

(i)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置1至12的a1的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置1至12的a2的至少1个氨基酸置换;在优选的实施方案中,跨越iglcrc位置1至12的a1的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸,被跨越iglcrc位置1至12的a2的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸置换;和

(ii)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c1的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c2的至少1个氨基酸置换,在优选的实施方案中,由跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c1的1至5个氨基酸(即1、2、3、4或5个氨基酸),和跨越iglcrc位置46至52的c1的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段,更优选包含或组成为跨越iglcrc位置41至45的c1的2至5个氨基酸和跨越iglcrc位置46至52的c1的4至6个氨基酸的连续氨基酸区段被由跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c2的1至5个氨基酸(即1、2、3、4或5个氨基酸),和跨越iglcrc位置46至52的c2的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段置换,更优选被包含或组成为跨越iglcrc位置41至45的c2的2至5个氨基酸和跨越iglcrc位置46至52的c2的4至6个氨基酸的连续氨基酸区段置换,

更优选地,c1的1至5个氨基酸被c2的1至5个氨基酸置换,

优选地,在置换2中置换的残基包括iglcrc的位置47和49,

优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g1的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g2的至少1个氨基酸置换,在优选的实施方案中,包含或组成为跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选跨越iglcrc位置102至108的f1的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸);和跨越iglcrc位置128至133的c1的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含或组成为跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g2的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选跨越iglcrc位置102至108的f2的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸);和跨越iglcrc的位置128至133的g2的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换,优选地,被置换的连续氨基酸区段的总长为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸。

相应地,hr2优选具有以下氨基酸结构:

(i)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置1至12的a3的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置1至12的a4的至少1个氨基酸置换;在优选的实施方案中,跨越iglcrc位置1至12的a3的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸,被跨越iglcrc位置1至12的a4的至少4至12个氨基酸,即4、5、6、7、8、9、10、11、或12个氨基酸,更优选6至8个氨基酸置换;和

(ii)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c3的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c4的至少1个氨基酸置换,在优选的实施方案中,由跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c3的1至5个氨基酸(即1、2、3、4或5个氨基酸),和跨越iglcrc位置46至52的c3的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段,更优选包含或组成为跨越iglcrc位置41至45的c3的2至5个氨基酸和跨越iglcrc位置46至52的c3的4至6个氨基酸的连续氨基酸区段被由跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置41至45的c4的1至5个氨基酸(即1、2、3、4或5个氨基酸),和跨越iglcrc位置46至52的c4的1至6个氨基酸(即1、2、3、4、5或6个氨基酸)组成的连续氨基酸区段置换,更优选被包含或组成为跨越iglcrc位置41至45的c4的2至5个氨基酸和跨越iglcrc位置46至52的c4的4至6个氨基酸的连续氨基酸区段置换,

更优选地,c3的1至5个氨基酸被c4的1至5个氨基酸置换,

优选地,在置换2中置换的残基包括iglcrc的位置47和49,

优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g3的至少一个氨基酸被跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g4的至少1个氨基酸置换,在优选的实施方案中,包含或组成为跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g3的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选跨越iglcrc位置102至108的f3的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸);和跨越iglcrc位置128至133的g3的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含或组成为跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g4的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),优选跨越iglcrc位置102至108的f4的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g3的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸);以及跨越iglcrc的位置128至133的g4的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换,优选地,被置换的连续氨基酸区段的总长度为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸。

更优选的实施方案中hr1具有以下氨基酸结构:

(i)跨越iglcrc位置1至12的a3的至少4至12个氨基酸(即4、5、6、7、8、9、10、11或12个氨基酸)、更优选6至8个氨基酸被跨越iglcrc位置1至12的a4的至少4至12个氨基酸(即4、5、6、7、8、9、10、11或12个氨基酸)、更优选6至8个氨基酸置换;和

(ii)包含或组成为跨越iglcrc位置41至45的c3的2至5个氨基酸和跨越iglcrc位置46至52的c3的4至6个氨基酸的连续氨基酸区段被包含或组成为跨越iglcrc位置41至45的c4的2至5个氨基酸和跨越iglcrc位置46至52的c4的4至6个氨基酸的连续氨基酸区段置换,

c3的1至5个氨基酸被c4的1至5个氨基酸置换,更优选地,置换2中置换的残基包括iglcrc的位置47和49,

优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)包含跨越iglcrc位置102至108的f1的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g1的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和跨越iglcrc位置128至133的g1的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含跨越iglcrc位置102至108的f2的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),跨越iglcrc位置109至127的g2的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和跨越iglcrc位置128至133的g2的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换,优选地,被置换的连续氨基酸区段的总长度为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸。

相应地,更优选的hr2具有以下氨基酸结构:

(i)跨越iglcrc位置1至12的a3的至少4至12个氨基酸(即4、5、6、7、8、9、10、11或12个氨基酸)、更优选6至8个氨基酸被跨越iglcrc位置1至12的a4的至少4至12个氨基酸(即4、5、6、7、8、9、10、11或12个氨基酸)、更优选6至8个氨基酸置换;和

(ii)包含或组成为跨越iglcrc位置41至45的c3的2至5个氨基酸和跨越iglcrc位置46至52的c3的4至6个氨基酸的连续氨基酸区段被包含或组成为跨越iglcrc位置41至45的c4的2至5个氨基酸和跨越iglcrc位置46至52的c4的4至6个氨基酸的连续氨基酸区段置换,

c3的1至5个氨基酸被c4的1至5个氨基酸置换,更优选地,置换2中置换的残基包括iglcrc的位置47和49,

优选地,被置换的连续氨基酸区段的总长度为5至11个氨基酸,更优选5至9个氨基酸,甚至更优选5至7个氨基酸;和

(iii)包含跨越iglcrc位置102至108的f3的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),g3的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸),和跨越iglcrc位置128至133的g3的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段被包含跨越iglcrc位置102至108的f4的1至6个氨基酸(即1、2、3、4、5或6个氨基酸),跨越免疫球蛋白或免疫球蛋白样蛋白的iglcrc位置109至127的g4的1至10个氨基酸(即1、2、3、4、5、6、7、8、9或10个氨基酸);和跨越iglcrc的位置128至133的g4的0至3个氨基酸(即0、1、2或3个氨基酸)的连续氨基酸区段置换,优选地,被置换的连续氨基酸区段的总长度为3至20个氨基酸,更优选3至18个氨基酸,甚至更优选3至15个氨基酸。

优选的是,hri包含a2的6至8个氨基酸;c2和c2的5至11个氨基酸、更优选5至9个氨基酸、甚至更优选5至7个氨基酸;并且在置换3中,第一cri的3至20个氨基酸、更优选3至18个氨基酸、甚至更优选3至15个氨基酸的连续氨基酸区段被第二cri的3至20个氨基酸、更优选3至18个氨基酸、甚至更优选3至15个氨基酸的连续氨基酸区段置换。优选地,hrii包含a4的6至8个氨基酸;c4和c4的5至11个氨基酸、更优选5至9个氨基酸、甚至更优选5至7个氨基酸;并且在置换6中,第三cri的3至20个氨基酸、更优选3至18个氨基酸、甚至更优选3至15个氨基酸的连续氨基酸区段被第四cri的3至20个氨基酸、更优选3至18个氨基酸、甚至更优选3至15个氨基酸的连续氨基酸区段置换。

还优选地,置换不是无效置换,即,如果第一cri和第二cri的氨基酸在待置换的iglcrc位置处是相同的,则这不被认为是本发明意义上的置换。分别用第二cri的氨基酸置换第一cri的氨基酸,以及用第四cri的氨基酸置换第三cri的氨基酸,分别改变了第一cri和第三cri区域的序列。

在优选的实施方案中,hri与hrii结合的亲和力是第一cri与第三cri的亲和力的至少50%,优选地,所述结合的亲和力为至少60%、70%、80%、90%或者更多。特别优选地,hri与hrii结合的亲和力相比于第一cri与第三cri的亲和力未发生变化。本领域技术人员清楚地知道如何确定两种蛋白质之间的结合亲和力。在本发明的情况下确定结合亲和力的优选方式是使用biacore或石英晶体微量天平(qcm)测量。

为了维持受体蛋白即第一cri和第三cri的整体结构,优选地,用相同数目的供体氨基酸置换作为反向平行β链的一部分的第一cri和第三cri的受体氨基酸。这适用于可包括将c1的一部分置换为c2的一部分的置换2,可包括将f1和/或g1的一部分置换为f2和/或g2的一部分的置换3,可包括将c3的一部分置换为c4的一部分的置换5,以及可包括将f3和/或g3的一部分置换为f4和/或g4的一部分的置换6。由于在免疫球蛋白或免疫球蛋白样蛋白的两个不同人恒定区之间间隔区的长度可变性更大,因此在置换1至6中被置换的间隔区的长度不必相同。通常,被置换的氨基酸数量与插入的氨基酸数量相同,即总长度不变,或者被置换的氨基酸数量比从相应中间区域插入的氨基酸数量高或低1、2或3个氨基酸,例如a1的10个氨基酸被a2的7至13个氨基酸置换。对于置换1至6的这些原则在图8示例性概述。

优选地,在给定iglcrc位置处的第一cri的氨基酸被位于相同iglcrc位置的第二cri的氨基酸置换。类似地,优选在给定iglcrc位置处的第三cri的氨基酸被位于相同iglcrc位置的第四cri的氨基酸置换。在最优选的实施方案中,分别被第二cri和第四cri的氨基酸置换的第一cri和第三cri的氨基酸对于hri和hrii位于iglcrc的相同位置。

例如,hri可以在iglcrc的位置7至13包含a2的氨基酸,其置换在iglcrc的位置7至13的a1氨基酸和/或hrii可以在iglcrc的位置7至13包含a4的氨基酸,其置换iglcrc的位置7至13的a3氨基酸。

在特定实施方案中,第一cri和/或第三cri不包含在氨基酸链i中。在另一特定的实施方案中,第一cri和/或第三cri不包含在氨基酸链ii中。在另一个特定的实施方案中,第一cri和/或第三cri不包含在氨基酸链i和ii中。各受体序列的省略防止了不希望的异源二聚化。但是,只要在hri和hrii中仅包含第一cri或第三cri中的一个,就不会发生异源二聚化。因此,包含第一cri或第三cri将允许本发明的蛋白质复合物与另外的蛋白质链或复合物异源二聚化。注意,由于hri和hrii内的氨基酸置换,因此在本发明的情况下不再将hri视为第一cri,以及不再将hrii视为第三cri。因此,优选第一cri和/或第三cri不包含在hri外部的氨基酸链i和hrii外部的氨基酸链ii中。

在优选的实施方案中,第二cri和第四cri是相同的,更优选在生理条件下彼此特异性结合,即形成同源二聚体。

在其中第二cri和第四cri具有fc功能的特定实施方案中,优选地,当第二cri和第四cri的氨基酸序列分别插入到hri的第一cri和hrii的第三cri中时,保持fc功能。在本发明的情况下,如果hri具有第二cri的fc功能的至少30%并且hrii具有第四cri的fc功能的至少30%,则保持了fc功能。在第二cri和第四cri彼此特异性结合并具有fc功能的情况下,特别优选异源二聚化的hri和hrii具有二聚的、优选均二聚的第二cri和第四cri的至少30%的fc功能。

在优选的实施方案中,置换1、置换2、置换3、置换4、置换5和/或置换6,优选置换1至6不将新的b细胞表位引入hri和/或hrii。优选地,没有新的人b细胞表位。在优选的实施方案中,置换1、置换2、置换3、置换4、置换5和/或置换6,优选置换1至6不将新的t细胞表位引入hri和/或hrii。优选地,没有新的人t细胞表位。

在特定的实施方案中,免疫球蛋白或免疫球蛋白样蛋白选自igg1、igκ、t细胞受体(tcr)α、tcrβ、初生fc受体(fcrn)、β2微球蛋白、igλ、igg2、igg3、igg4、iga1、iga2、igd、ige、igm、白细胞抗原(la)a或b和la-d。特别地来自人igg1、igκ、t细胞受体(tcr)α、tcrβ、初生fc受体(fcrn)、β2微球蛋白、igλ、igg2、igg3、igg4、iga1、iga2、igd、ige、igm、人白细胞抗原(hla)a或b和hla-d。

在特定实施方案中,第一cri和第三cri独立地选自igg1的重链恒定区1(ch1),优选具有根据seqidno:1的氨基酸序列;igκ恒定区,优选具有根据seqidno:18的氨基酸序列;tcrα的恒定区,优选具有根据seqidno:10的氨基酸序列;tcrβ的恒定区,优选具有根据seqidno:11的氨基酸序列;fcrnα3,优选具有根据seqidno:12的氨基酸序列;β2微球蛋白,优选具有根据seqidno:13的氨基酸序列;igλ恒定区,优选具有根据seqidno:19、54、55、56、57或58的氨基酸序列;igg2,优选具有根据seqidno:2的氨基酸序列;igg3,优选具有根据seqidno:3的氨基酸序列;igg4,优选具有根据seqidno:4的氨基酸序列;iga1,优选具有根据seqidno:5的氨基酸序列;iga2,优选具有根据seqidno:6的氨基酸序列;igd,优选具有根据seqidno:7的氨基酸序列;ige,优选具有根据seqidno:8的氨基酸序列;igm,优选具有根据seqidno:9的氨基酸序列;人白细胞抗原(hla)a,优选具有根据seqidno:14的氨基酸序列;或hla-bα3,优选具有根据seqidno:15的氨基酸序列;hla-dα2,优选具有根据seqidno:16的氨基酸序列;和hla-dβ2,优选具有根据seqidno:17的氨基酸序列。

在特定实施方案中,第一cri和第三cri的组合选自

(i)第一cri:igg1、igg2、igg3、igg4、iga1、iga2、igd、ige或igm的ch1,第三cri:igκ恒定区和igλ恒定区,即第一cri为igg1的ch1且第三cri为igκ,第一cri为igg2的ch1且第三cri为igκ,第一cri为igg3的ch1且第三cri为igκ,第一cri为igg4的ch1且第三cri为igκ,第一cri为iga1的ch1且第三cri为igκ,第一cri为iga2的ch1且第三cri为igκ,第一cri为igd的ch1且第三cri为igκ,第一cri为ige的ch1且第三cri为igκ,第一cri为igm的ch1且第三cri为igκ,第一cri为igg1的ch1且第三cri为igλ,第一cri为igg2的ch1且第三cri为igλ,第一cri为igg3的ch1且第三cri为igλ,第一cri为igg4的ch1且第三cri为igλ,第一cri为iga1的ch1且第三cri为igλ,第一cri为iga2的ch1且第三cri为igλ,第一cri为igd的ch1且第三cri为igλ,第一cri为ige的ch1且第三cri为igλ或第一cri为igm的ch1且第三cri为igλ;

(ii)第一cri:tcrα的恒定区,第三cri:tcrβ的恒定区;

(iii)第一cri:fcrnα3、hla-aα3、或hla-bα3,第三cri:β2微球蛋白;和

(iv)第一cri:hla-dα2,第三cri:hla-dβ2。

在特定实施方案中,(i)第二cri和第四cri相同且选自igg1、igg2、igg3、igg4、iga1、iga2的ch3;igg1、igg2、igg3、igg4、iga1、iga2、igd、ige或igm或igd的ch1;ige或igm的ch4;和igκ或igλ恒定区;或(ii)第二cri和第四cri独立地选自igg1的ch1;igκ或igλ恒定区;igg2、igg3、igg4、iga1、iga2、igd、ige或igm的ch1;igg1、igg2、igg3、igg4、iga1、iga2或igd的ch3和ige或igm的ch4。

在特定实施方案中,第二cri和第四cri独立地选自igg1的重链恒定区3(ch3),其优选具有根据seqidno:45的氨基酸序列;igg2的ch3,其优选具有根据seqidno:46的氨基酸序列;igg3的ch3,其优选具有根据seqidno:47的氨基酸序列;igg4的ch3,其优选具有根据seqidno:48的氨基酸序列;igm的重链恒定区4(ch4),其优选具有根据seqidno:49的氨基酸序列;iga1的ch3,其优选具有根据seqidno:50的氨基酸序列;iga2的ch3,其优选具有根据seqidno:51的氨基酸序列;igd的ch3,其优选具有根据seqidno:52的氨基酸序列;和ige的ch4,其优选具有根据seqidno:53的氨基酸序列。

因此,在特定的实施方案中,本发明提供了蛋白质复合物,

(i)其中在置换1和/或4中,优选在置换1和4中,第一cri和/或第三cri,优选第一cri和第三cri的n端至β折叠a(ig样恒定区共有序列,iglcrc位置1至12)的所有氨基酸分别被第二cri和/或第四cri,优选第二cri和第四cri的n端至β折叠a(iglcrc位置1至12)的所有氨基酸置换;

(ii)其中在置换2和/或5中,优选在置换2和5中,第一cri和/或第三cri,优选第一cri和第三cri的iglcrc位置41至45、41至46、41至47、41至48、41至49、41至50、41至51、42至45、42至46、42至47、42至48、42至49、42至50、42至51、43至45、43至46、43至47、43至48、43至49、43至50、43至51、44至45、44至46、44至47、44至48、44至49、44至50、44至51、45至45、45至46、45至47、45至48、45至49、45至50或45至51的氨基酸分别被第二cri和/或第四cri,优选第二cri和第四cri的igcrc位置41至45、41至46、41至47、41至48、41至49、41至50、41至51、42至45、42至46、42至47、42至48、42至49、42至50、42至51、43至45、43至46、43至47、43至48、43至49、43至50、43至51、44至45、44至46、44至47、44至48、44至49、44至50、44至51、45至45、45至46、45至47、45至48、45至49、45至50或45至51的氨基酸置换;和

(iii)其中在置换3和/或6中,优选在置换3和6中,第一cri和/或第三cri,优选第一cri和第三cri的iglcrc位置103-127、103至128、103至129、103至130、103至131、103至132、104至127、104至128、104至129、104至130、104至131、104至132、105至127、105至128、105至129、105至130、105至131、105至132、106至127、106至128、106至129、106至130、106至131、106至132、107至127、107至128、107至129、107至130、107至131、107至132、108至127、108至128、108至129、108至130、108至131、108至132、109至127、109至128、109至129、109至130、109至131或109至132的氨基酸分别被第二cri和/或第四cri,优选第二cri和第四cri的igcrc位置103至127、103至128、103至129、103至130、103至131、103至132、104至127、104至128、104至129、104至130、104至131、104至132、105至127、105至128、105至129、105至130、105至131、105至132、106至127、106至128、106至129、106至130、106至131、106至132、107至127、107至128、107至129、107至130、107至131、107至132、108至127、108至128、108至129、108至130、108至131、108至132、109至127、109至128、109至129、109至130、109至131或109至132的氨基酸置换。

hri主要包含或组成为第一cri的氨基酸序列,而hrii主要包含或组成为第三cri的氨基酸序列,即受体cri。优选地,分别在第一cri和第三cri中置换的氨基酸总数,即从第二cri插入第一cri和从第四cri插入第三cri的氨基酸的数目为14至30个氨基酸,即14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个氨基酸,特别是15至29个氨基酸,特别是16至19个氨基酸。

在特定的实施方案中,本发明提供了蛋白质,其中除了置换1至6之外:(i)第一cri或第三cri的iglcrc位置37和/或47、和/或49、和/或81和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置37、和/或47、和/或49、和/或81、和/或107的氨基酸。这些置换进一步改善了hri和hrii的性能,例如稳定性或二聚化强度。在特定的实施方案中,第一cri或第三cri的iglcrc位置37和47处的氨基酸,以及任选地iglcrc位置49、和/或81和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置37和47的氨基酸,以及任选地被置换为iglcrc位置49、和/或81和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置37和49处的氨基酸,以及任选地iglcrc位置47、和/或81和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置37和49的氨基酸,以及任选地被置换为iglcrc位置47、和/或81和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置37和81处的氨基酸,以及任选地iglcrc位置47、和/或49和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置37和81的氨基酸,以及任选地被置换为iglcrc位置47、和/或49和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置37和107处的氨基酸,以及任选地iglcrc位置47、和/或49和/或81处的氨基酸被置换为第二cri或第四cri的iglcrc位置37和107的氨基酸,以及任选地被置换为iglcrc位置47、和/或49和/或81处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置47和49处的氨基酸,以及任选地iglcrc位置37、和/或81和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置47和49的氨基酸,以及任选地被置换为iglcrc位置37、和/或81和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置47和81处的氨基酸,以及任选地iglcrc位置37、和/或49和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置47和81的氨基酸,以及任选地被置换为iglcrc位置37、和/或49和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置47和107处的氨基酸,以及任选地iglcrc位置37、和/或49和/或81处的氨基酸被置换为第二cri或第四cri的iglcrc位置47和107的氨基酸,以及任选地被置换为iglcrc位置37、和/或49和/或81处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置49和81处的氨基酸,以及任选地iglcrc位置37、和/或47和/或107处的氨基酸被置换为第二cri或第四cri的iglcrc位置49和81的氨基酸,以及任选地被置换为iglcrc位置37、和/或47和/或107处的氨基酸。在特定的实施方案中,第一cri或第三cri的iglcrc位置49和107处的氨基酸,以及任选地iglcrc位置37、和/或47和/或81处的氨基酸被置换为第二cri或第四cri的iglcrc位置49和107的氨基酸,以及任选地被置换为iglcrc位置37、和/或47和/或81处的氨基酸。

在特定实施方案中,hri和hrii各自包含至少一个cys残基,其被布置为在hri和hrii之间在iglcrc位置20(igg2、igg3、igg4或igm的ch1)、21(igd的ch1)、135(iga1或iga2的ch1)、138(igg1或ige的ch1、igκ的cl、igλ的cl)、139(tcrβ的恒定结构域)或141(tcra的恒定结构域)处形成共价键,如图4所描绘的,其来自第一cri和第三cri的以下组合:

(i)第一cri:igg1、igg2、igg3、igg4、iga1、iga2、igd、ige或igm的ch1,第三cri:igκ恒定区和/或igλ恒定区;

(ii)第一cri:tcrα的恒定区,第三cri:tcrβ的恒定区。

在具体的实施方案中,本发明提供了蛋白质复合物,其中hri和hrii包含在蛋白质复合物中并且分别具有根据seqidno:20和21、seqidno:22和23、seqidno:24和25、seqidno:26和27、seqidno:28和32、seqidno:28和33、seqidno:31和29以及seqidno:31和30的氨基酸序列。

在特定实施方案中,氨基酸链i和/或氨基酸链ii还包含一种或多于一种选自以下的氨基酸元件:抗体的ch2或ch3结构域;一种或多于一种抗原特异性配体(asl),其优选选自fv、单链fv(scfv)、二硫键稳定的fv、二硫键稳定的scfv、fab、单链fab、单结构域抗体、可变重链结构域(vh)、可变轻链结构域(vl)、两个或多于两个连接的可变链结构域,形成例如双抗体样结合位点、纳米抗体、vhh、一种或多于一种抗体样结合蛋白(例如darpin、anticalin、affibody、纤连蛋白样结构域等);抗体铰链区(hr)、一种或多于一种接头序列(l)、一种或多于一种细胞因子(c、例如tnf超家族成员、白介素(il、例如il-2)、干扰素(例如ifng)、生长因子、激素、配体、肽、具有配体结合活性的受体片段、螯合剂、酶、凝血因子和抗凝血剂及其衍生物。

在特定实施方案中,氨基酸链i从n端到c端包括:

(i)对抗原1(aslan1)-l-ch2-hri特异的asl;

(ii)ch2-hri;

(iii)aslan1-l-ch2-hri;

(iv)ch2-hri-l-aslan1;

(v)ch2-hri;

(vi)ch2-hri-l-aslan1;

(vii)对抗原2(aslan2)特异的aslan1-l-ch2-hri-l-asl;

(viii)aslan1-l-ch2-hri;

(ix)ch2-hri;

(x)ch2-hri-l-aslan1;

(xi)aslan1-l-ch2-hri-l-aslan2;

(xii)aslan1-l-ch2-hri-l-aslan2;

(xiii)ch2-hri-l-aslan1;

(xiv)aslan1-l-ch2-hri;

(xv)aslan1-l-ch2-hri-l-aslan2;

(xvi)(i)至(xv)所述的任何氨基酸链,其含有n端至ch2的铰链区;

(xvii)(i)至(xvi)所述的任何氨基酸链,其含有细胞因子(c)或白介素(il)而不含有一个或多于一个asl;

(xviii)aslan1a(例如vl)-hria+aslan1b(例如vh)-hriia-l/hr-ch2-hrib;

氨基酸链ii从n端到c端包括:

(i)ch2-hrii;

(ii)aslan1-l-ch2-hrii;

(iii)对抗原2(aslan2)-l-ch2-hrii特异的asl;

(iv)ch2-hrii;

(v)ch2-hri-l-aslan1;

(vi)ch2-hri-l-aslan2;

(vii)ch2-hrii;

(viii)ch2-hrii-l-aslan2;

(ix)aslan1-l-ch2-hrii-l-aslan2;

(x)aslan2-l-ch2-hrii;

(xi)对抗原3(aslan3)特异的ch2-hrii-l-asl;

(xii)aslan3-l-ch2-hrii;

(xiii)aslan2-l-ch2-hrii-l-aslan3;

(xiv)aslan2-l-ch2-hrii-l-aslan3;

(xiv)对抗原4(aslan4)特异的aslan3-l-ch2-hrii-l-asl;

(xvi)(i)至(xv)所述的任何氨基酸链,其含有n端至ch2的铰链区;

(xvii)(i)至(xvi)所述的任何氨基酸链,其含有细胞因子(c)或白介素而不含有一个或多于一个asl;

(xviii)aslan2a(例如vl)-hric+aslan2b(例如vh)-hriic-l/hr-ch2-hriib。

在特定的实施方案中,氨基酸链i包含一个或多于一个抗原特异性配体(asl)和/或一个或多于一个效应分子,氨基酸链ii包含一个或多于一个抗原特异性配体(asl)和/或一个或多于一个效应分子,其中asl模块选自与例如以下分子特异性结合的分子:细胞表面蛋白(受体、黏附分子、通道、转运蛋白等)、激素、生长因子、细胞因子、配体、血清蛋白、凝血因子、纤溶因子、趋化因子、酶,其中效应分子选自例如以下分子:细胞表面蛋白(受体、黏附分子、通道、转运蛋白等)、激素、生长因子、细胞因子、配体、血清蛋白、凝血因子、纤溶因子、趋化因子、酶。

在特定的实施方案中,本发明提供了氨基酸链i或ii,优选氨基酸链的组合,其中链i和链ii分别包含、基本上组成为或组成为能够异源二聚化并特异性结合同一靶标的根据以下的氨基酸序列:seqidno:41和seqidno:42,seqidno:34和seqidno:35,seqidno:43和seqidno:44,seqidno:36和seqidno:37(scfv13.7-fc1k),seqidno:36和seqidno:38(scfv13.7-cd3-铰链-fc1k),seqidno:39和seqidno:38(scfv3-43-cd3-铰链-fc1k)或seqidno:40和seqidno:38(scfvhumcsp-cd3-铰链-fc1k)及其变体,该变体与分别指示的序列具有至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、甚至更优选至少98%的序列同一性。

本发明第二方面提供编码氨基酸链i和/或ii的核酸。

本发明第三方面提供包含第二方面核酸的载体。

本发明第四方面提供一种确定(定义)氨基酸链i的hri的氨基酸序列和/或氨基酸序列ii的hrii的氨基酸序列的方法,其包括以下步骤:

(i)选择第一cri、第二cri、第三cri和第四cri;

(ii)分别确定(定义)第一cri、第二cri、第三cri和第四cri的7个β链a、b、c、d、e、f和g,第一cri、第二cri、第三cri和第四cri的间隔序列b、c、d、e、f和g,第一cri、第二cri、第三cri和第四cri的n端和c端序列a和h;

(iii)将第一cri的a的至少一个氨基酸置换成第二cri的a的至少1个氨基酸(置换1);将第一cri的c的至少一个氨基酸置换成第二cri的c的至少1个氨基酸(置换2);将第一cri的g的至少一个氨基酸置换成第二cri的g的至少1个氨基酸(置换3);将第三cri的a的至少一个氨基酸置换成第四cri的a的至少1个氨基酸(置换4);将第三cri的c的至少一个氨基酸置换成第四cri的c的至少1个氨基酸(置换5);以及将第三cri的g的至少一个氨基酸置换成第四cri的g的至少1个氨基酸(置换6),

其中第一cri和第三cri彼此不同,并且在生理条件下彼此特异性结合。

优选地,确定hri和hrii两者,因为两者都需要允许两个氨基酸链的异源二聚化。

步骤(ii)涉及每个给定的cri的序列比对以及β链的n端和c端各自的氨基酸和间隔序列的命名。

在第五方面,本发明提供了一种产生具有确定的(定义的)hri序列的氨基酸链i和/或具有确定的(定义的)hrii序列的氨基酸链ii的方法,该方法包括将编码氨基酸链i和/或氨基酸链ii的核酸引入宿主细胞并表达氨基酸链i和/或ii的步骤。

在第六方面,本发明提供了用作药物的蛋白质复合物。

在实施方案中,蛋白质复合物用于预防、治疗或诊断病症或疾病,例如但不限于炎性疾病、自身免疫疾病、变应性疾病、增生性疾病、癌症类型的疾病、皮肤病、内分泌疾病、眼睛疾病和病症、遗传疾病、代谢疾病、传染病、肠道疾病、神经系统疾病和精神疾病。

下列实施例仅是对本发明的示例性说明,而不应以任何方式解释为限制本发明的范围,本发明的范围如所附权利要求书所示。

实施例

实施例1:异源二聚化fc部分

分别使用igg1ch1和igκ恒定结构域的组合作为第二cri和第四cri,以及使用igg1ch3残基作为第一cri和第三cri序列来产生二聚化抗体fc部分,其中对于ch1-ch3组合(ch31),序列组成为1,2(#43-51)和3(#103-132),对于clk-ch3组合(ch3k),序列组成为1,2(#45-51)和3(#103-129)。除了指示的序列外,ch3的残基37就其潜在参与ch3元件的结构稳定化而言,已被转移到clk第三cri序列中,按照序列1-3引入。ch31和ch3k的序列如图8所示。为了生成称为fc1k的功能齐全的fc部分,两个结构域都融合了igg1铰链-ch2结构域的c端(图9)。为了证实fc1k的异源二聚化潜力,克隆并产生了两个分子,两个分子均包含通过igg1铰链序列和第二链与第一fc链连接的scfv13.7(抗肿瘤坏死因子受体1,tnfr1),该第二链仅包含铰链序列和fc结构域(图10)。一个构建体带有ch2-ch31/ch2-ch3k异源二聚化fc部分,而第二个分子则包含未修饰的ch2-ch3野生型fc部分。两种蛋白均通过蛋白a亲和层析纯化。在还原条件下,scfv13.7-铰链-fc1k显示出两个主要条带,分别对应于计算出的分子量(图11a-c,重链50kda,轻链24kda)。另外,较低分子量的第二条带出现在轻链下方,这指示了未糖基化或更少糖基化的轻链。在非还原条件下,可见一个主要条带,其类似于正确形成的异源二聚体(74kda)。但是,较低分子量的附加条带表明存在单体重链或二聚化轻链(约50kda)和较小的降解产物或未连接的轻链(约25kda)。sec分析证实了该观察结果。约14.5分钟处的主峰代表正确组装的scfv13.7-fc1k蛋白,而约16.5分钟处的次要峰可再次归属于单体重链或二聚化轻链。相反,如在sds-page(约160kda,图11d-e)和sec分析(约13.8分钟)中所见,scfv13.7-fc另外形成了重链的二聚体。与scfv13.7-fc1k相比,sds-page中的小条带减少(约50kda)或sec分析中的小峰减少(约16.5分钟处)表明轻链形成同源二聚体的趋势较小,从而支持以下假设:在scfv13.7-fc1k的情况下,较小的条带代表单体重链而不是二聚化轻链。在sec分析中观察到了较短保留时间的其他次要峰,这表明这两种蛋白均发生了聚集或多聚化。

实施例2:fv13.7-fc1k

将fab13.7的可变域分别通过gtg3sg接头融合到一条由ch2和ch31或ch2和ch3k组成的fc链上后,就形成了包含功能性二价fc部分的fab样抗体形式(图12)。此外,在ch2中引入突变(a327g、a330s和p331s,eu编号),以避免与fcγ受体和补体蛋白c1q结合(richter等,2013)。通过kpni和ecori消化后,将含有n端接头(gtg3sg)、经过密码子优化的ch2-ch31和ch2-ch3k(genearttm)的dna序列插入包含vh13.7或vl13.7的psectaga-l1中。

在使用聚乙烯亚胺作为转染试剂共同施用编码vh13.7-ch2-ch31或vl13.7-ch2-ch3k的两种质粒后,fv13.7-fc1k在瞬时转染的hek293-6e细胞中表达。分泌到细胞培养上清液中的蛋白质通过蛋白a亲和色谱法纯化(14.6mg/l,请参阅表1),然后进行制备型尺寸排阻色谱法步骤(sec,最终产量为4.1mg/l)。测试各个级分诱导tnfr1活化的能力。收集表明正确组装的蛋白质的阴性级分(数据未显示)(卡通图见图13a)。在sds-page中,fv13.7-fc1k在还原条件下显示出两条大小略有不同的条带,在非还原条件下显示出一条条带,均与计算的分子量相对应(图13b)。同样,在sec分析的自然条件下,可以看到一个主峰,伴随有次峰,这代表聚集或多聚化蛋白种类的微小比例(图13c)。

表1.fv13.7-fc1k的产生和纯化

fv13.7-fc1k在elisa中以1.2nm的ec50值与固定的人tnfr1结合,这与fab13.7相比,结合亲和力降低了1.9倍(表2,图14)。与fab13.7一致,fv13.7-fc1k未诱导tnfr1介导的从ht1080细胞释放il-8,这与在atrosab情况下观察到的受体激活相反(图15a)。此外,fv13.7-fc1k抑制tnfr1介导的il-8释放,该释放是由0.1nmtnf诱导的从ht1080细胞的释放,其中ic50值为39.7nm。与fab13.7相比,fv13.7-fc1k的生物活性降低了1.5倍,但是,与atrosab相比,抑制潜力提高了2.5倍(图15b,表2)。为了进一步阐明fv13.7-fc1k用作治疗剂的潜力,使用人tnfr1ecd敲入型小鼠在体内确定了药代动力学特征,该小鼠经过基因工程改造以表达人tnfr1的胞外域而不表达小鼠蛋白。对于atrosab,测定的终末半衰期为29.1h,曲线下面积为526.4h*μg/ml,这代表了治疗剂生物利用度的相对量度(图16,表2)。由于其大分子量和fcrn介导的药物循环利用的可能性,预计对于atrosab的值会更高。但是,在此处应用的低剂量注射(25μg/动物)和靶抗原(人tnfr1)存在的实验条件下,atrosab通过靶标介导的清除的次级作用而被清除(richter等人,正在制备)。与atrosab相比,fv13.7-fc1k显示出降低的终末半衰期和曲线下面积的值,分别降低了2.1倍和2.0倍。但是,更重要的是,与fab13.7相比,fv13.7-fc1k的终末半衰期提高了10倍,曲线下面积增加了65倍。

表2.fv13.7-fc1k的功能性数据

实施例3-6:二价或三价和双特异性scfv-fc融合蛋白的产生

此外,使用异源二聚化fc部分fc1k来产生二价或三价和双特异性scfv-fc融合蛋白,以将表达cd3的t细胞重靶向至表达fap的肿瘤细胞或被表达fap的成纤维细胞包围的肿瘤细胞。因此,scfvhu36(靶向fap)和scfvhuu3(靶向cd3)部分与fc1k的n端或c端融合。还使用不含半胱氨酸的igg1铰链区创建所有构建体,以研究铰链介导的共价连接的重要性。产生的构建体在n端含有一个靶向fap的部分和一个靶向cd3的部分(fapn-ch3n-hfc[具有在铰链区的半胱氨酸],实施例3a,和fapn-ch3n-f[不具有在铰链区的半胱氨酸],实施例3b,图17),或产生的构建体在n末端具有一个靶向fap的部分,在c端具有一个靶向cd3的部分(fapn-ch3c-hfc,实施例4a,和fapn-ch3c-fc,实施例4b,图18)。另外,产生在n端含有两个靶向fap的部分和在c端具有一个靶向cd3的部分的构建体(fapnn-ch3c-hfc,实施例5a,和fapnn-ch3c-fc,实施例5b,图19),以及产生在n端含有一个靶向fap的部分、在c端具有一个靶向fap的部分和在c端具有一个靶向cd3的部分的构建体(fapnc-ch3c-hfc,实施例6a,和fapnc-ch3c-fc,实施例6b,图20)。这些融合蛋白的产生和表征仍在进行中。

实施例7:二价igg样抗体的产生

本文提出的用于产生异源二聚化ig结构域的工具箱提供了产生二价igg样抗体的可能性。因此,必须产生异源二聚化fc部分,其中第一cri和第三cri序列不能来自于ch1和clκ/λ。可以使用例如来自fcrn-α3和β2-微球蛋白的第一cri和第三cri序列并结合来自ch3的第二cri和第四cri序列,从而产生新的结构域fcrnh3和b2mh3。预期的供体序列组成(1、2[41-45]、3[109-127]和其他残基[47、49和107])显示在图21a中。与fc1k类似,可以进一步产生完整的fc部分(fcb2rn)。

为了产生igg样分子,一个fab臂可以保持不变。然而,为了避免重链和轻链错配,必须产生另一个异源二聚化结构域对作为fab样第二igg臂的基础。可以使用例如分别来自tcr-α2和tcr-β2的第一cri和第三cri序列,以及分别来自ch1和clk的第二cri和第四cri序列,从而产生新的结构域tcrah1和tcrblk,其在融合到具有期望特异性的vh和vl的c末端后将会组装成fabtcr。预期的第二cri和第四cri序列组成(1、2[41-45],3[109-127]和其他残基[81])显示在图21a中。整个分子排列如图22所示。

实施例8:fv13.7x-fc1k

将fab13.7的可变域分别通过gtg3sg接头融合到一条由ch2和ch31或ch2和ch3k组成的fc链上后,形成了包含功能性二价fc部分的fab样抗体形式(图23)。此外,为了避免与fcγ受体和补体蛋白c1q结合,在ch2中引入突变(a327g、a330s和p331s,eu编号)(richter等人,2013)。通过kpni和ecori消化后,将含有n端接头(gtg3sg)、经过密码子优化的ch2-ch31和ch2-ch3k(genearttm)的dna序列插入包含vh13.7或vl13.7的psectaga-l1中。与先前描述的fv13.7-fc1k(实施例2)相反,在fv13.7x-fc1k的情况下,vh13.7在n端融合到包含ch2和ch3k的多肽链,而vl13.7在n端融合到包含ch2和ch31的多肽链。

使用聚乙烯亚胺作为转染试剂,共同施用两种编码vh13.7-ch2-ch3k或vl13.7-ch2-ch31的质粒后,fv13.7x-fc1k在瞬时转染的hek293-6e细胞中表达。分泌到细胞培养上清液中的蛋白质通过蛋白a亲和层析纯化,然后进行制备型尺寸排阻层析步骤。收集代表完整的和异源二聚化组装的蛋白质的所收集的峰级分(图24a)。蛋白l纯化后,在sds-page中,fv13.7x-fc1k在还原条件下显示两条大小不同的条带,在非还原条件下显示一个条带,均与计算分子量相对应(图24b)。同样,在sec分析的天然条件下,可以看到一个主峰,伴随着次要峰,其代表聚集/多聚化蛋白种类的微小比例,或者最小比例的游离单多肽链(图24c)。

fv13.7x-fc1k以1.9nm的ec50值在elisa中与固定的人tnfr1结合,与fab13.7相比,其结合亲和力降低了2.1倍(表3,图24d)。与fab13.7一致,fv13.7x-fc1k未诱导tnfr1介导的从ht1080细胞释放il-8(图24e),这与先前在atrosab情况下观察到的受体激活相反(图15a)。值得注意的是,在il-8释放分析中无法始终观察到atrosab对ht1080细胞表面上的tnfr1的激活,这很可能是由于所用材料(elisa试剂盒)或细胞批次之间的差异而引起的。但是,fv13.7x-fc1k抑制了tnfr1介导的il-8释放,该释放由0.1nm的tnf诱导,其中ic50值为48nm。与fab13.7相比,fv13.7x-fc1k显示出生物活性降低了3.7倍,但是,与atrosab相比,抑制潜力提高了2.8倍(图24f,表3)。该融合蛋白的进一步生产和表征仍在进行中。

表3.fv13.7x-fc1k功能性数据

实施例9:fvcd3-fc1k-scfvher32

通过将靶向her3的抗体的两个单链可变片段(scfv)与含有ch31和ch3k的cd3特异性fv-fc1k模块的多肽链的c端融合,生成基于实施例2和8中所述的fab样抗体形式的双特异性分子(图25)。使用限制性位点kasi和ecori,通过铰链衍生的多肽接头(表5)完成连接。通常,这种形式具有被用作平台技术的潜力,可以在用替代性scfv或针对一种或可能是两种不同的肿瘤抗原或肿瘤相关抗原的任何类型的结合域来置换靶结合的scfv部分后,开发出多样化的双特异性和多特异性免疫细胞结合分子。该融合蛋白的产生和表征仍在进行中。

实施例10:对人tnfr1和cd3具有特异性的双特异性scfv-fc融合蛋白

基于实施例3a所描述的分子,产生另一双特异性scfv-fc融合蛋白(13.7n-cd3n-hfc1k),其含有直接针对cd3和人tnfr1的scfv部分,其融合到fc1k含铰链的链的n端(图26)。

使用聚乙烯亚胺作为转染试剂瞬时转染两个psectagal1载体后,13.7n-cd3n-hfc1k在hek293-6e细胞中产生,两个载体各自编码两个多肽链中的一个。在使用蛋白a亲和色谱和随后的制备型sec进行纯化之后的sds-page分析在还原条件下显示出两个条带,在非还原条件下显示出一个主要条带,二者均表示计算的分子量(图27b)。在两种条件下观察到的小条带可代表所表达蛋白质的糖基化状态方面的部分差异。另外,在分析sec中,13.7n-cd3n-hfc1k显示出一个单峰(图27c)。13.7n-cd3n-hfc1k与人tnfr1-fc融合蛋白的结合通过elisa来分析,其显示出3.5nm的ec50值(图27d,图4)。另外,13.7n-cd3n-hfc1k结合至ht1080(图27e)和cd3转染的jurkat细胞(图27f)表面的tnfr1和cd3的ec50值分别为3.7nm和1.6nm。最后,测定由存在外周血单核细胞(pbmc)时降低靶细胞活力(表达tnfr1的ht1080细胞)的能力所反映的13.7n-cd3n-hfc1k的生物活性,其ic50值为0.8nm,浓度高于10nm时残留活力为40%(图27g)。该融合蛋白的进一步产生和表征仍在进行中。

实施例11:对人her3和cd3具有特异性的双特异性scfv-fc融合蛋白

基于实施例3a所描述的分子,产生另一双特异性scfv-fc融合蛋白(her3n-cd3n-hfc1k),其含有直接针对cd3和her3(人表皮生长因子受体3,也称为erbb3)的scfv部分,其融合到fc1k含铰链的链的n端(图28)。

使用聚乙烯亚胺作为转染试剂瞬时转染两个psectagal1载体后,her3n-cd3n-hfc1k在hek293-6e细胞中产生,两个载体各自编码两个多肽链中的一个。在使用蛋白a亲和色谱和随后的制备型sec进行纯化之后的sds-page分析在还原条件下显示出两个条带,在非还原条件下显示出一个主要条带,二者均表示计算的分子量(图29b)。在两种条件下观察到的小条带可代表所表达的蛋白质的糖基化状态方面的部分差异。另外,在分析sec中her3n-cd3n-hfc1k显示出一个单峰(图29c)。her3n-cd3n-hfc1k与固定化her3-fc融合蛋白的结合通过elisa来分析,其显示出1.0nm的ec50值(图29d,图4)。该融合蛋白的进一步产生和表征仍在进行中。

实施例12:对人mcsp和cd3具有特异性的双特异性scfv-fc融合蛋白

基于实施例3a所描述的分子,产生另一双特异性scfv-fc融合蛋白(mcspn-cd3n-hfc1k),其含有直接针对cd3和人mcsp的(黑色素瘤相关硫酸软骨素蛋白多糖)的scfv部分,其融合到fc1k含铰链的链的n端(图30)。

使用聚乙烯亚胺作为转染试剂瞬时转染两个psectagal1载体后,mcspn-cd3n-hfc1k在hek293-6e细胞中产生,两个载体各自编码两个多肽链中的一个。在使用蛋白a亲和色谱和随后的制备型sec进行纯化之后的sds-page分析在还原条件下显示出两个条带,在非还原条件下显示出一个主要条带,二者均对应于计算的分子量(图31b)。在两种条件下观察到的小条带可代表所表达的蛋白质的糖基化状态方面的部分差异。另外,在分析sec中,mcspn-cd3n-hfc1k显示出一个单峰(图31c)。使用表达mcsp的wm35细胞来确定由存在外周血单核细胞(pbmc)时降低靶细胞活力的能力所反映出的mcspn-cd3n-hfc1k的生物活性,其中ic50值为0.2nm(图31d,表4)。该融合蛋白的进一步产生和表征仍在进行中。

实施例13:具有相反取向的对her3和cd3具有特异性的双特异性scfv-fc融合蛋白

基于实施例4a所描述的分子,产生另一双特异性scfv-fc融合蛋白(her3n-cd3c-hfc1k),其含有直接针对cd3和her3(人表皮生长因子受体3,也称为erbb3)的scfv部分,其分别融合到fc1k的含铰链的ch2-ch31链n端和ch2-ch3k链的c端(图32)。

使用聚乙烯亚胺作为转染试剂瞬时转染两个psectagal1载体后,her3n-cd3c-hfc1k在hek293-6e细胞中产生,两个载体各自编码两个多肽链中的一个。在使用蛋白a亲和色谱和随后的制备型sec进行纯化之后的sds-page分析在还原条件下显示出两个条带,在非还原条件下显示出一个主要条带,二者均对应于计算的分子量(图33b)。在两种条件下观察到的小条带可代表所表达的蛋白质的糖基化状态方面的部分差异。her3n-cd3c-hfc1k与固定化her3-fc融合蛋白的结合通过elisa来分析,其显示出0.1nm的ec50值(图33c,图4)。该融合蛋白的进一步产生和表征仍在进行中。

表4.实施例10-13的功能性数据

表5.在实施例1-13中使用的接头变体

下标(n/c)表示scfv相对于fc1k部分的位置(n端/c端)。

实施例14:fv13.7x-fc1k的其他表征

在通过catalentpharmasolutions(somerset,ewing,nj,us)进行的稳定慢病毒转染后,在来自细胞池的cho细胞中表达了实例8中所述的fab样单价分子。首先使用蛋白a纯化蛋白,然后通过fplc-sec进一步分离单体级分。fv13.7x-fc1k的最终制备在分析型hplc-sec中显示出单峰(图35a),对应于计算出的72kda分子量。在还原条件下的sds-page中,观察到两个条带,它们的迁移类似于35kda和40kda的参考条带,这很好地对应于计算出的35kda和37kda的分子量。在非还原条件下,观察到的单个条带迁移类似于70kda参考条带,因此表明链间二硫键的正确形成。fv13.7x-fc1k显示出聚集温度为64℃,这是通过动态光散射和检测到的平均计数率的目视判读来确定的(图35c)。此外,fv13.7x-fc1k在人血浆中在37℃下稳定至少7天(图35d),这是通过hutnfr1-fc结合elisa确定的保留结合活性所指示的。

在elisa中fv13.7x-fc1k以0.37nm的ec50值与人tnfr1-fc结合(图36a),这表明与显示ec50值为0.09nm和0.17nm的对照蛋白atrosab和fab13.7相比结合减少。在使用qcm(attana,斯德哥尔摩,瑞典)进行的实时结合分析中,fv13.7x-fc1k以2.66nm的kd值与人tnfr1-fc结合(图36b),其来自于koff值为9.83×104s-1以及kon值为3.69×105m-1s-1。此外,fv13.7x-fc1k在fc部分内携带修饰以降低介导adcp、adcc和cdc的倾向(armour等人(1999)eurjimmunol。29(8):2613-24,shields等人(2001)jbiolchem。276(9):6591-604)。一致地,与含有野生型fc部分的对照抗体瑞妥昔单抗相比,人fcγ受体i、iib和iii以及人补体蛋白c1q与fv13.7x-fc1k的结合明显减少(图36c)。相似地,fcγri、iib和iii以及c1q显示出与类似突变抗体atrosab的结合减少,这表明adcc和cdc在先前发表的实验中的介导减少(richter等人,(2013)plosone8(8):e72156)。

与单价对照蛋白fab13.7类似,fv13.7x-fc1k在il-6和il-8释放实验以及分别使用hela.ht1080和kym-1细胞的细胞死亡诱导试验(图37a-c)中,本身未显示任何tnfr1激活的迹象。这与对照蛋白atrosab形成鲜明对比,后者在1至100nm的浓度下在il-6和il-8释放实验中诱导边际细胞应答(图37a和b)。此外,fv13.7x-fc1k在il-6和il-8释放和细胞死亡诱导试验中显示出对tnf介导的tnfr1激活的有效抑制(图37d-f),其中ic50值分别为54.5nm、24.2nm和16.2nm。但是,这些值表明,在il-6和il-8释放实验以及分别使用hela和ht1080以及kym-1细胞进行的细胞死亡诱导试验中,对于ic50值为31.7nm、12.7nm、9.5nm的fab13.7所确定的生物学活性略弱。值得注意的是,与二价对照蛋白atrosab相比,fv13.7x-fc1k的抑制活性仍得到明显改善,而对照蛋白在il-6和il-8释放实验和细胞死亡诱导试验中,ic50值分别为164.7nm、84.1nm和64.4nm。

表6.fv13.7x-fc1k的生物活性

为了进一步评估fv13.7x-fc1k在抗体介导的交联条件下的生物活性,在恒定浓度的药物特异性抗体存在下,在il-8释放实验中分析了fv13.7x-fc1k(图38a-c)。与对照抗体atrosab相比,fv13.7x-fc1k和相应的fab13.7在使用三种不同的山羊抗人igg血清制剂的il-8释放测定中显示出完全缺乏激动活性(图38a:southernbiotechcat.:2010-01[igg_a],图38b:mybiosourcecat.:mbs571163[igg_b],图38c:mybiosourcecat.:mbs571678[igg_c])。总之,该结果表明,在抗药物免疫应答条件下,fv13.7x-fc1k体外激活tnfr1的风险降低。

最后,在c56bl/6j敲入型小鼠(在相应的小鼠基因座携带人tnfr1胞外域基因)中单剂量注射400μg(20mg/kg)之后,fv13.7x-fc1k分别显示出初始半衰期为2.2±1.2h和最终半衰期为41.8±18.1h,曲线下面积为5856±1370μg/ml*h。

材料

辣根过氧化物酶(hrp)偶联的抗人igg(fab特异性)抗体购自sigma(taufkirchen,德国)。ht1080野生型细胞在rpmi1640培养基,5%fcs,2mml-谷氨酰胺中生长。balirosharmag(瑞士巴塞尔)提供atrosab和人tnfr1-fc融合体。化学品购自roth(德国卡尔斯鲁厄),酶(克隆和pcr)和补充试剂购自thermofisher(德国慕尼黑)。以下明确说明了任何其他消耗品来源。

方法

异源二聚化和功能性ig和ig样结构域的比对

1)使用clustalomega在线工具进行多序列比对。

2)在序列中突出显示了pdb文件中β片层的定义。

3)如果未分配或没有分配所有二级结构β片层(图4中以星号表示),则根据jpred进行二级结构的预测(使用默认设置的最长累积预测)。

4)在将形式上未分配的残基包含到片层中或从片层中排除先前分配的残基以及删除由多序列比对引入的空位后,或者在4个例外情况中,即在β片层之外插入了新空位(d_ch3:iglcrc的位置111;m_ch1:iglcrc的位置72;hlaa/hlab:iglcrc的位置60,图4),根据pdb文件的其他结构对齐方式,使β片层a至g的起始和末端位置对齐。插入/延长或缺失/缩减的空位位置通过分别在多序列比对期间引入的以下已存在的空位中删除或插入空位位置来补偿,以使序列维持在更靠近c端的区域进行比对。

5)通过这些手段将β片层a定义为在预测的第一β片层的n端保守脯氨酸残基之后的六个残基(iglcrc位置13至18)。

6)将β片层b定义为与第二预测β片层中包含的保守半胱氨酸残基相邻的n端的四个残基和c端的五个残基(iglcrc位置31至40)。

7)将β片层c定义为与第三预测β片层中包含的保守色氨酸残基相邻的n端的四个残基和c端的两个残基(iglcrc位置46-52)。tcrα链和β2微球蛋白除外。在这些情况下,由于进行了β片层预测而进行了比对,并在使用pymol进行结构比对后得到了证实。

8)将β片层d定义为iglcrc的位置63至70,但是,在整个比对过程中与保守残基的连接是不可行的。

9)将β片层e定义为iglcrc的位置81至89的八个残基,其起始于位于第四预测β片层的起始或n端的保守酪氨酸/苯丙氨酸残基。

10)将β片层f定义为与第六预测β片层中包含的保守半胱氨酸残基相邻的n端的两个残基和c端的四个残基(iglcrc的位置102至108)。

11)将β片层g定义为iglcrc的位置128至133,但是,在整个比对过程中与保守残基的连接是不可行的。

fab13.7、fv13.7-fc1k、scfv13.7-fc1k、scfv13.7-fc的表达

hek293-6e细胞在含有4mmglutamax-1和0.1%kolliphorp188(f17++)的freestylef17培养基中以指数增长的条件悬浮培养。使用1μg/ml质粒dna(最终浓度)和3μg/ml聚乙烯亚胺(pei,终浓度)制备1.5*10^6个细胞/ml用于转染。将dna和pei分别稀释在1ml的f17++培养基/20ml细胞悬液中,然后混合在一起。在室温下孵育15至30分钟后,将dna混合物添加到细胞中,并在37℃和5%的co2振荡下孵育过夜。24小时后,每20ml细胞悬浮液加入0.5ml胰蛋白酶n1。在37℃和5%co2下再孵育4天后,从上清液中纯化蛋白质。

蛋白质纯化-抗体和蛋白a亲和色谱

通过离心从培养上清液中除去hek293-6e细胞(步骤1∶500g,15分钟;步骤2:5000g,5分钟)。将上清液与afrproteina-650f(蛋白a树脂,22805,tosoh,斯图加特,德国)或hitrapkappaselect(与琼脂糖基质偶联的κ链选择性抗体片段,17-5458-12,gehealthcare,chalfontstgiles,gb)树脂过夜滚动孵育。通过离心收集树脂,并通过重力流将其加载到色谱柱上。使用pbs进行洗涤,并用ph2至3的100mm甘氨酸从树脂上洗脱蛋白。直接合并洗脱的级分,并立即用pbs透析。

制备型尺寸排阻色谱

对于制剂中聚集的或多聚体组装蛋白,使用纯化器进行额外的尺寸排阻步骤。使用pbs作为液相,在superdex20010/300gl色谱柱上以0.5ml/min的流速分离蛋白质。收集200μl的级分,合并含峰的样品以进行进一步的实验。

蛋白质表征-聚丙烯酰胺凝胶电泳(sds-page)

严格按照laemmli1970进行sds-page,使用3μg蛋白制剂和所示百分比的堆积和分离凝胶。

蛋白质表征-尺寸排阻色谱(sec)

为了确定流体动力学半径,使用waters2695hplc和phenomenexyarrasec-2000色谱柱(300×7.8mm,流速0.5ml/min)分析30μg纯化的蛋白质样品。流动相为0.1mna2hpo4/nah2po4、0.1mna2so4,ph6.7。使用了以下标准蛋白质:甲状腺球蛋白(669kda)、脱铁铁蛋白(443kda)、乙醇脱氢酶(150kda)、bsa(66kda)、碳酸酐酶(29kda)、flag肽(1kda)。

酶联免疫吸附测定(elisa)

用100μltnffr1-fc融合蛋白(在pbs中1μg/ml)包被微量滴定板,并在4℃下孵育过夜。在室温下用2%mpbs(pbs中的脱脂乳,每孔200μl)封闭残留的结合位点2小时,然后用pbs洗涤两次。将100μl用2%mpbs稀释的样品在室温下孵育1小时,然后将其与100μl在2%mpbs中hrp偶联的检测抗体进行最后的孵育步骤。用100μltmb底物溶液检测结合的蛋白,通过添加50μl的1mh2so4停止hrp反应,并使用无限微量滴定板读数器(tecan,maennedorf,瑞士)测量在450nm波长处的吸光度。在每个孵育步骤之间和检测之前,将板用pbst洗涤3次,并用pbs洗涤两次。

流式细胞术

分离细胞,并以在100μlpba(2%fcs,0.2%nan3在无菌pbs中)中每孔100.000至250.000的浓度将其转移到96孔微量滴定板中。将样品以两倍在pba中稀释至最终期望浓度,并将100μl加入细胞中,孵育1小时。随后,在使用分析仪(miltenyibiotec,bergischgladbach,德国)进行检测之前,将细胞与偶联至荧光染料的抗体一起孵育。在每次孵育步骤之后,通过离心(500*g,5分钟)并在150μlpba中重悬来洗涤细胞两次。

白介素释放测定

在96孔微量滴定板中接种每孔2×104个hela或ht1080细胞,在100μlrpmi1640+5%fcs中过夜。第二天,更换上清液以除去组成型产生的细胞因子。在37℃和5%的co2条件下将细胞与rpmi1640+5%fcs中的一系列稀释样品一起孵育。在竞争实验条件下,单独制备分析的蛋白样品(滴定或稀释至单一浓度),然后添加到板中。未刺激的细胞用作对照。16至20小时之后,将板在500g下离心5分钟,直接根据制造商的方案用elisa分析细胞上清液。上清液在rpmi1640(无fcs)中稀释,抗体在试剂稀释剂(0.1%bsa,0.05%tween20,20mmtris,150mmnacl,ph7.5)中稀释。使用pbs中的1%bsa(牛血清白蛋白)封闭经包被的微孔滴定板,并洗涤,如同elisa所述进行检测和测量。在细胞培养上清液中检测il-6和il-8的三明治elisa试剂盒从immunotools,(friesoythe,德国)购买。

细胞毒性/细胞活力测定

将细胞(每孔2*104个)接种到96孔微量滴定板中,并在37℃和5%的co2下孵育过夜。将蛋白质在rpmi1640+10%fcs中稀释,并与2*105个pbmc/孔组合添加到细胞中。将细胞毒性测定在37℃、5%co2下孵育3至5天,然后弃去上清液并将50μl结晶紫溶液添加到细胞。然后,将板在ddh2o中洗涤20次并干燥。通过添加100μl甲醇,在室温下摇动10分钟后,溶解由活细胞和贴壁细胞产生的、由染色溶液中所含的甲醇固定的剩余紫染料。使用无限微量滴定板读数器(tecan,maennedorf,瑞士)测量板。

药代动力学

在特定小鼠基因座携带人tnfr1胞外域基因的转基因c57bl/6j小鼠(c57bl/6j-hutnfrsf1aecdtm1ueg/izi)通过静脉注射25μg分析蛋白。3分钟、30分钟、1小时、3小时和6小时以及3天和7天之后收集血液样品,并立即在冰上孵育。通过离心(13.000g,4℃,10分钟)分离血清,并在-20℃下保存。如上所述通过结合elisa检测血清中的剩余蛋白。从分析蛋白的现制的标准结合曲线内插elisa信号。使用microsoftexcel的pksolver加载项进行分析后,将确定的浓度相对于时间作图,并获得药代动力学常数。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1