包含肽接头的用于化学部分位点-特异性偶联的靶向化合物的制作方法

文档序号:16806842发布日期:2019-02-10 13:07阅读:173来源:国知局
包含肽接头的用于化学部分位点-特异性偶联的靶向化合物的制作方法
本发明涉及由于无二级或三级结构的嵌入特定氨基酸中的限定位置处的限定个数的偶联位点而具有化学部分位点-特异性偶联能力的靶向化合物。所述靶向化合物包含至少一个靶向域,其选自能够结合靶标的非免疫球蛋白蛋白质或抗体片段。所述靶向化合物还包含由多达80个氨基酸,优选地丙氨酸、脯氨酸和丝氨酸组成的至少一个连接部分。所述靶向化合物还包含至少一个由一个半胱氨酸或富含半胱氨酸的肽基序组成的偶联位点。所述连接部分将所述靶向域和偶联位点相连和/或所述连接部分连接两个偶联位点。本发明具体的特征在于具有作为非-ig靶向域的泛素突变蛋白的融合蛋白。本发明还涉及所述靶向化合物在疾病的治疗或诊断中用于医学应用的用途。
背景技术
:抗体-药物缀合物(adc)选择性地将药物靶向所需位置并且由单克隆抗体和细胞毒性剂(毒素)组成。所述抗体将试剂靶向细胞表面上的特定靶标并将所述缀合物结合至细胞,其中所述药物可以破坏所述细胞。adc的未解决的问题在于化学部分的偶联,因为抗体不具有允许(例如毒素)位点特异性偶联的限定的游离半胱氨酸。作为替代,试剂与抗体的偶联通常通过赖氨酸残基进行,其导致产生了就毒素偶联位置和偶联至缀合物的毒素数目而言不均一的产物。药物与单克隆抗体缀合的另一种已建立的方法利用存在于抗体中的半胱氨酸残基之间的二硫键的还原来将药物缀合至还原的半胱氨酸残基的游离硫醇基团。然而,这些缀合物可能在结构上是不稳定的,这是用于进一步治疗或诊断应用以及用于生产的主要缺点。由于抗体-化学部分缀合物的一些限制,因此急需提供具有克服所述缺点的改善性质的新型化合物。因此,在本领域中需要提供具有允许限定数目的化学部分与靶向化合物特异性偶联的偶联位点的新型化合物以产生均一的靶向产物。因此,本发明的目标在于提供具有限定数目和限定位置的偶联位点,同时维持所述靶向域的结构和功能特征的新型靶向载体蛋白。本发明提供化合物,其包含基于非-ig蛋白或抗体片段的靶向部分和无二级或三级结构的嵌入特定氨基酸中的限定位置处的限定个数的偶联位点。这些化合物特别适合于医学应用,其克服了上述缺点。上述概述不必需描述本发明所解决的所有问题。技术实现要素:本发明涉及用于化学部分偶联的靶向化合物,其包含至少一个靶向域,所述靶向域能够以500nm或以下的结合常数kd结合靶标,和至少一个连接部分,所述连接部分由多达约80个氨基酸组成,其中所述连接部分包含丙氨酸、脯氨酸和丝氨酸或基本由其组成,和位于连接部分的c末端或n末端的至少一个偶联位点,其中所述偶联位点由一个半胱氨酸或者富含半胱氨酸的肽基序cxc、cxxc或cxxxc组成,其中x选自非芳香族氨基酸,并且其中连接部分连接靶向域和偶联位点和/或其中连接部分连接两个偶联位点。优选地,所述连接部分基本由或者由20%至60%的丙氨酸残基、20%至40%的脯氨酸残基和10%至60%的丝氨酸残基组成。任选地,所述靶向化合物在位于最末端的偶联位点之后或者在位于最末端的靶向域之后另外包含多达80个氨基酸(“帽”)的氨基酸序列。优选地,所述靶向化合物包含tmlnso,其中m是1、2、3、4、5,并且n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,并且o=n或者o=n-1,和任选地tmlnso帽。因此,所述靶向化合物包含至少一个靶向域和1至20个连接部分和偶联位点。本发明还涉及靶向化合物,其中偶联位点中的x选自非芳香族和非疏水性氨基酸,优选地选自小的或亲水性氨基酸,如脯氨酸、丙氨酸、丝氨酸、缬氨酸、甘氨酸、苏氨酸、天冬酰胺、门冬氨酸、谷氨酰胺、谷氨酸、赖氨酸、组氨酸或精氨酸。本发明还涉及靶向化合物,其中所述靶向域是非免疫球蛋白蛋白质,优选地选自(但不限于)泛素突变蛋白葡萄球菌蛋白a域的突变蛋白、锚蛋白重复蛋白突变蛋白、脂质运载蛋白突变蛋白、人fynsh3域的突变蛋白、人纤连蛋白第十域的突变蛋白、多种蛋白酶抑制剂的kunitz域的突变蛋白、sac7d突变蛋白、chagasin突变蛋白、或者多聚化低密度脂蛋白受体-a的突变蛋白、fn3域的突变蛋白、半胱氨酸-结微小蛋白的突变蛋白、armadillo-重复蛋白的突变蛋白、四连接素的突变蛋白、c-型凝集素域的突变蛋白或者ctla4的突变蛋白,或者抗体片段或抗体衍生物。优选地,所述靶向化合物的靶向域是非免疫球蛋白蛋白质,更优选地是对亲代蛋白显示出80%至94%的同一性的突变蛋白,更优选地是对泛素(seqidno:1)显示出80%至94%的同一性或者对双-泛素(seqidno:2)显示出80%至94%的同一性的泛素突变蛋白(affilin)。此外,本发明涉及靶向化合物,其中所述靶向化合物是融合蛋白或者其中所述靶向化合物包含位于靶向域和第一连接部分之间的共价键。本发明涉及靶向化合物,其中生物学活性部分化学偶联至偶联位点。所述生物学活性部分可以选自化学部分,如药物、毒素、小分子、螯合剂和染料。本发明涉及所述靶向化合物在诊断或治疗中的用途,优选在体外诊断或治疗应用中的用途。本发明涉及包含如本文所述的靶向化合物的组合物和包含所述组合物的试剂盒。本发明涉及制备靶向化合物的方法。本发明的概述不必需描述本发明的全部特征。通过阅读随后的详细说明,其它实施方式将变得容易理解。附图说明图1.本发明的所选择的靶向化合物的示意图。显示了化合物的实例,即融合蛋白,其具有非抗体的靶向域(作为椭圆以浅灰色显示并且称为t)、由氨基酸ala、pro和ser组成的2至4个连接部分(作为矩形以中等灰色显示并且称为l1、l2、l3或l4),其连接由cys或富含cys的肽基序组成的2至4个偶联位点(对于位点特异性偶联,作为三角形以深灰色显示),和在位于最末端的偶联位点之后的10至80个氨基酸的氨基酸区域(作为矩形显示;称为“帽”)。图2.融合蛋白的表达和纯化。图2a.融合蛋白146414的sec谱图。图2b.融合蛋白143276的sec谱图。图2c.融合蛋白146414的sec部分的sds-page分析。泳道1:分子量标志物,泳道2至7:部分。图2d.融合蛋白140353(偶联位点:cxxc)的sec部分的sds-page分析。泳道1:分子量标志物,泳道2:上清液,泳道3:沉淀颗粒,泳道4:流穿液,泳道5至10:部分。图3.融合蛋白和edans标记的融合蛋白的spr分析以确认标记的融合蛋白与靶标的特异性结合亲和力。黑线代表未修饰的融合蛋白,灰线代表edans-标记的融合蛋白。图3a.融合蛋白146414和标记的146414(2个偶联位点)。图3b.融合蛋白146416和标记的146416(4个偶联位点),图3c.融合蛋白146418和标记的146418(4个偶联位点),图3d显示了融合蛋白143276与egfr(2个偶联位点)的结合动力学;分析了不同浓度的融合蛋白143276(0、1.9、3.9、7.8、15.6、31.3、62.5、125、250、500nm)。图4.maldi-tof分析以确认融合蛋白的均一标记。融合蛋白和edans-c2-maleimid标记的融合蛋白的maldi-tof质谱图,图4a融合蛋白146414(图左侧)和edans-标记的融合蛋白146414(图右侧)。图4b.融合蛋白146416(图左侧)和edans-标记的融合蛋白146416(图右侧)。图4c.融合蛋白146418(图左侧)和edans-标记的融合蛋白146418(图上部分),图4d.融合蛋白143276(图下部分)和edans-标记的融合蛋白143276。图4e.具有肽基序“cpac”作为偶联位点(6个偶联位点)的融合蛋白140343。图4f.具有肽基序“cpac”作为偶联位点(6个偶联位点)的融合蛋白140350。具体实施方式在以下详细描述本发明之前,应理解本发明不局限于本文所述的特定方法、方案和试剂,因为它们可以变化。还应理解本文所使用的术语仅是出于说明特定实施方式的目的,而不意欲限制本发明的范围,本发明的范围仅通过所附权利要求限制。除非另外定义,否则本文所使用的所有技术和科学术语的含义与本发明所属领域技术人员通常理解的含义相同。优选地,本文所使用的术语的定义如“amultilingualglossaryofbiotechnologicalterms:(lupacrecommendations)”,leuenberger,h.g.w,nagel,b.andh.主编(1995),helveticachimicaacta,ch-4010basel,switzerland中所述。在整个说明书及其所附的权利要求中,除非上下文中另外要求,否则单词“包含”及其变化形式(诸如“包括”或“含有”)将理解为包含所说明的整数或步骤或者整数或步骤的组,但不排除任何其它整数或步骤或者整数或步骤的组。在本说明书的正文中引用了一些文档(例如:专利、专利申请、科学出版物、生产商的技术规范、说明书等)。不应将本文中的任何内容视作是对由于这些较早的发明公开而通过在先发明不授权本发明的许可。本文引用的一些文档的特征在于“作为参考并入”。如果这些并入的参考文献的定义或教导内容与本说明书中列举的定义或教导内容之间存在矛盾,则以本说明书的正文为准。在所附序列表中公开了本文所提及的全部序列,所述序列表以其全部内容和发明公开作为本说明书的一部分。定义如本文所使用的术语“约”涵盖了明确列举的量以及最多±20%的偏差。更优选地,术语“约”涵盖了最多±15%,更优选地最多±10%,并且最优选地最多5%的偏差。术语“至少约10、20、30、40、50、60、70、80个氨基酸残基”不局限于简明的氨基酸残基数目,而且还包含含有增加多达20%或者包含减少多达20%的残基的氨基酸延伸。例如,“约70个氨基酸残基”也可以包含56至84个氨基酸残基,而不会背离本发明。如本文所使用的,“化合物”是指包含至少两种组分的物质组合物,其中这些至少两种组分通过任何种类的相互作用保持在一起,例如,通过共价键、通过离子键、通过氢键、通过范德华相互作用或者通过疏水性相互作用。术语“组分”或“部分”或“域”或“位点”在本文中可互换使用并且表示作为化合物的一部分的亚结构。如以下更详细地解释的,本发明所述的“靶向化合物”包含至少三种组分,即(i)至少一个靶向域和(ii)至少一个连接部分和(iii)至少一个偶联位点,每个算作一个组分。如本文所使用的,“靶向化合物”因此是指包含至少三种组分的物质组合物。本发明的化合物可以是融合蛋白或缀合物。术语“蛋白”和“多肽”表示任何通过肽键连接的两个或更多个氨基酸的链,并且不表示产物的具体长度。因此,用于表示两个或更多个氨基酸的链的“肽”、“蛋白”、“氨基酸链”或者任何其它术语包含在“多肽”的定义内,并且可以作为替代使用术语“多肽”,或者它与任何这些术语可互换使用。术语“多肽”还旨在表示多肽的翻译后修饰产物,所述修饰无限制地包括糖基化、乙酰化、磷酸化、酰胺化、蛋白水解切割、通过非天然存在的氨基酸修饰以及在本领域中是熟知的类似修饰。因此,包含两种或更多种蛋白质部分的融合蛋白也在术语“蛋白质”或“多肽”的定义之内。术语“融合蛋白”涉及包含遗传学上与至少第二氨基酸链连接的至少第一氨基酸链的蛋白质。因此,融合蛋白可以包含作为单一、直链多肽表达的蛋白/肽的多聚体。它可以包含1、2、3、4或甚至更多的蛋白/肽。例如,可以通过连接最初编码单独的蛋白/肽的两种或更多种基因产生融合蛋白。术语“融合”表示通过肽键(直接或通过肽接头)连接的组分。如本文所使用的术语“缀合物”是指包含与其它物质(如第二蛋白或非蛋白部分)化学连接的至少第一蛋白或基本由其组成的蛋白质。可以通过有机合成或者通过使用酶(包括酶促转化后修饰的天然方法)进行的缀合。蛋白缀合物的实例为糖蛋白(蛋白质缀合碳水化合物组分)或者脂蛋白(蛋白质缀合脂质组分)。所述分子可以(例如在一个或一些位点)通过任何形式的接头连接。可以通过本领域技术人员熟知的化学法实施化学偶联,包括取代(例如,n-琥珀酰亚胺基化学法)、加成或环化加成(例如,马来酰亚胺化学法或点击化学)或氧化化学(例如,二硫化物形成)。可以化学连接到本发明的化合物上的一些非蛋白聚合物分子的实例为羟乙基淀粉、聚乙二醇、聚丙二醇、树枝状聚合物、聚氧化烯、螯合剂、药物、毒素、小分子、染料等。融合蛋白或蛋白缀合物还可以包含一个或多个反应基团或者肽或非肽组分,如配体或者治疗或诊断相关分子,如放射性核素或毒素。它还可以包含小的有机或非氨基酸基物质,例如,糖、低聚糖或多糖、脂肪酸等。用于将所关心的蛋白质连接到这些非蛋白组分上的方法在本领域中是熟知的,因此并未在本文中进一步详细描述。在整个说明书中,术语“非免疫球蛋白蛋白质”通常缩写为“非-ig蛋白质”。有时,详细形式和缩写形式两者同时使用,例如,在“非免疫球蛋白(ig)蛋白质”的表示形式中。当应用于对象时,如本文所使用的术语“天然存在的”是指以下事实:所述对象可以在自然界中存在。例如,存在于生物中的多肽或多核苷酸序列是天然存在的,其可以从天然来源中分离并且未被人在实验室中有意修饰。与其相反,如本文可互换使用的术语“非天然的”或“人造的”是指非天然存在的对象,即该术语是指通过人创造、生产或修饰的对象。例如,由人在实验室中有意修饰或产生的多肽或多核苷酸序列是“非天然的”。例如,本发明所述的非-ig蛋白是非天然存在的人造蛋白。根据本发明所述的术语“结合”优选地表示特异性结合。术语“解离常数”或“kd”定义了特异性结合亲和力。如本文所使用的,术语“kd”(通常以“mol/l”为单位测量,有时该单位缩写为“m”)旨在表示第一和第二化合物之间特定相互作用的离解平衡常数。在本发明的背景中,术语kd具体地用于描述结合蛋白和靶标蛋白(或靶向域)之间的结合亲和力。如本文所使用的,术语“特异地结合”和“特异性结合”应理解为表示本发明所述的靶向化合物的靶向域对特定靶标具有选择性结合亲和力,其解离常数kd为1μμ(10-6m)或以下,优选地100nm(10-7m)或以下,优选地10nm(10-8m)或以下,优选地1nm(10-9m)或以下,优选地100pm(10-10m)或以下或者优选地10pm(10-11m)或以下。高亲和力对应于低kd值。在本文中“特异性结合”表示与结合至另一种分子相比,蛋白质与它所特异的靶标的结合更强。优选地,化合物特异性结合的靶标的解离常数(kd)比所述结合蛋白不特异性结合的靶标的解离常数大10倍,优选地大20倍,更优选地大50倍,甚至更优选地大100倍、200倍、500倍或1000倍。本领域技术人员已知的适当的对照可以用于区分“特异性”和“非特异性”结合。术语“能够结合的蛋白质”或“结合蛋白”或“靶向域”表示能够结合至靶标蛋白(例如,肿瘤特异性蛋白;在肿瘤细胞或循环肿瘤细胞表面上表达的蛋白或者基质蛋白或其它蛋白)的氨基酸序列(蛋白)。任何这些结合蛋白可以包含其它组分,如多聚化部分、多肽标签、多肽接头和/或非蛋白聚合物分子。如本文所使用的术语(navigoproteinsgmbh的注册商标,该公司先前称为scilproteinsgmbh)是指基于泛素突变蛋白的非免疫球蛋白来源的结合蛋白。术语“affilin”和“泛素突变蛋白”和“修饰的泛素”均以相同含义使用并且可以交换。如本文所使用的术语是指通过氨基酸更换、插入、缺失或它们的任意组合所产生的不同于未修饰的泛素(例如,seqidno:1)或者双-泛素(例如,seqidno:2)的泛素衍生物,只要affilin在未修饰的泛素或双-泛素中对靶标的特异性结合亲和力低至少10倍或不存在。affilin的这种功能性质是全新产生的性质。affilin不是存在于自然界中或从自然界中分离的天然存在的泛素。根据本发明的affilin分子包含至少一个修饰的泛素部分或者以头-尾融合连接在一起的两个修饰的泛素部分或者由其组成。“头-尾融合”应理解为通过以(头)n-c-n-c-(尾)的方向连接它们来将两个泛素融合在一起,如在ep2379581b1中所述,该专利作为参考并入本文。可以直接连接泛素部分而不使用任何接头或肽接头。术语“泛素”或“未修饰的泛素”是指根据seqidno:1的泛素(野生型泛素)或者与seqidno:1具有至少95%的氨基酸同一性的蛋白质(例如,具有不影响结合至靶标的点突变f45w、g75a、g76a)。来自哺乳动物,例如,人、灵长类、猪和啮齿类的泛素是特别优选的。另一方面,应注意泛素来源不是非常重要的,因为根据现有技术,所有真核泛素是高度保守的并且到目前为止所检验的哺乳动物泛素对于它们的氨基酸序列来说甚至是相同的。在这种意义上,来自任何其它真核来源的泛素可以用于进一步修饰以产生新型结合能力。例如,酵母泛素仅在三个氨基酸上不同于野生型人泛素(seqidno:1)。术语“双-泛素”是指其中两个泛素部分以头至尾的方向直接彼此融合的直链蛋白。术语“双-泛素”是指seqidno:2或者与seqidno:2具有至少95%的氨基酸同一性的蛋白质(例如,具有选自f45w、g75a、g76a、f121w、g151a、g152a的点突变)。如本文所使用的,将“取代”定义为另一种氨基酸对一种氨基酸的交换。考虑到已知的遗传密码以及重组和合成dna技术,技术熟练的科学家可以容易地构建编码氨基酸变体的dna。术语“插入”包含了氨基酸向原始氨基酸序列中的添加,其中所述原始氨基酸保持稳定且无显著结构改变。术语“缺失”是指从原始序列中去除一个或多个氨基酸并且最初在缺失氨基酸的n末端和c末端的氨基酸现在直接连接并形成连续的氨基酸序列。术语“氨基酸序列同一性”是指两种或更多种蛋白质的氨基酸序列的同一性(或者差异)的定量比较。将相对于参考多肽序列的“氨基酸序列同一性百分比(%)”定义为在序列比对并且(必要时)引入缺口后以达到最大序列同一性百分比之后,与参考多肽序列中氨基酸残基相同的序列中的氨基酸残基的百分比。为了确定序列同一性,将要查询的蛋白质序列与参考蛋白质序列比对。比对方法在本领域中是熟知的。例如,优选地使用sim局部相似性程序(xiaoquinhuangandwebbmiller(1991),advancesinappliedmathematics,vol.12:337-357),它是免费可获得的(另见:http://www.expasy.org/tools/sim-prot.html)。对于多个比对分析,优选地使用clustalw(thompson等人,(1994)nucleicacidsres.,22(22):4673-4680)。将给定位置处不同于参考氨基酸序列的查询序列的每个氨基酸计为一个差异。查询序列中的插入或缺失也算作一个差异。例如,与参考序列相比,两个泛素部分之间接头的插入算作一个差异。然后,将差异之和相对于参考序列的长度以获得非同一性百分比。将同一性的定量百分比计算为100减去非同一性百分比。在与未修饰的泛素比对,确定泛素突变蛋白的同一性的具体情况下,具体地,不计算位置45、75和/或76处的差异,这是因为它们对于泛素突变蛋白的新型结合能力无关,而是仅与特定实验背景有关的修饰。如本文所使用的,术语“接头”或者“连接部分”是指将功能组分与至少第二功能组分连接的部分。例如,本发明的接头连接两个偶联位点或者连接靶向域和偶联位点。其它接头可以连接两个靶向域。本发明优选的实施方式包含肽接头。例如,肽接头是通过肽键连接两个功能组分(例如肽)以产生单一、直链多肽链的氨基酸序列。在本发明的说明书中,术语“靶标”和“结合配偶体”均以相同含义使用并且可以交换。目标是任何蛋白、肽、肽片段或其它分子,如能够以如上定义的亲和力与靶向域结合的糖基结构。优选的靶标分子是肿瘤抗原,如存在于肿瘤细胞之外但在非肿瘤细胞上不存在或很少表达的或者存在于肿瘤组织中但在正常组织上不存在或少见的蛋白、糖基结构或其它表位。术语“抗体片段”是指对抗原具有特异性结合亲和力的抗体片段。抗体片段的实例包括单链抗体、双链抗体、三链抗体、四链抗体、fab片段、f(ab')片段、scfv、域抗体、微抗体、单链抗体和抗体恒定区的衍生物。如本文所使用的术语“偶联位点”是指能够与其它化学基团反应以将本发明所述的化合物与其它化学部分偶联的半胱氨酸或富含半胱氨酸的氨基酸序列。术语“药物”表示可以影响生物(包括但不限于病毒、细菌、真菌、植物、动物和人)的任何物理或生物化学性质的任何物质。具体地,该术语包括用于生物,特别是人或动物的疾病的诊断、治疗或预防的任何物质。在以下连续修订的出版物中完整描述了分子生物学、细胞生物学、蛋白质化学和抗体
技术领域
中通常已知的和实践的方法:“molecularcloning:alaboratorymanual”(sambrook等人,coldspringharbor);currentprotocolsinmolecularbiology(f.m.ausubel等人主编,wiley&sons);currentprotocolsinproteinscience(j.e.colligan等人主编,wiley&sons);currentprotocolsincellbiology(j.s.bonifacino等人,wiley&sons)和currentprotocolsinimmunology(j.e.colligan等人主编,wiley&sons)。在“largescalemammaliancellculture”(d.hu等人,curr.opin.biotechnol.8:148-153,1997);“serumfreemedia”(k.kitano,biotechnol.17:73-106,1991);和“suspensioncultureofmammaliancells”(j.r.birch等人bioprocesstechnol.10:251-270,1990)中描述了与细胞培养和培养基有关的已知技术。本发明的实施方式现将更详细地进一步描述本发明。除非明确相反指明,否则以下所定义的每个实施方式可以与任何其它实施方式组合。具体地,指明是优选的或有利的任何特征可以与指明是优选的或有利的任何其它特征组合。本发明涉及用于化学部分偶联的靶向化合物,其包含至少一个靶向域,所述靶向域选自能够以500nm或以下的结合常数kd结合靶标的非免疫球蛋白蛋白质或抗体片段,和至少一个连接部分,所述连接部分包括多达约80个氨基酸,其中所述连接部分基本由或者由丙氨酸、脯氨酸和丝氨酸组成,和位于连接部分的c末端或n末端的至少一个偶联位点,其中所述偶联位点由cys(c)、cxc、cxxc或cxxxc组成,其中x选自非芳香族氨基酸,并且其中连接部分连接靶向域和偶联位点和/或其中连接部分连接两个偶联位点。用于偶联化学部分的一个或多个位点包括一个半胱氨酸或者中间插入了1、2或3个非芳香族氨基酸残基的两个半胱氨酸。在优选的实施方式中,偶联位点位于连接部分的c末端。从n-末端至c-末端或者从c-末端至n-末端的靶向化合物的结构。优选实施方式包括t[ls]n,任选地t[ls]n帽,其中n=1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或者20。在本发明的一些实施方式中,靶向化合物包括tmlnso,其中m=1或2,n=1、2、3或4,o=1、2、3或4,任选地具有帽。所述化合物组分从n-末端至c-末端或者从c-末端至n-末端的顺序(例如)如下所示:靶向域、连接部分1、偶联位点1、连接部分2、偶联位点2、连接部分3、偶联位点3。其它实施方式从n-末端至c-末端可以包含:(i)靶向域、连接部分1、偶联位点1、连接部分2、偶联位点2;任选的另外具有帽;(ii)靶向域、连接部分1、偶联位点1、连接部分2、偶联位点2、连接部分3、偶联位点3、连接部分4、偶联位点4,任选的另外具有帽;(iii)靶向域、连接部分1、偶联位点1、连接部分2、偶联位点2、连接部分3、偶联位点3,任选的另外具有帽;(iv)偶联位点1、连接部分1、靶向域、连接部分2、偶联位点2,任选的另外具有帽;(v)靶向域1、连接部分1、偶联位点1、连接部分2、偶联位点2、靶向域、连接部分3、偶联位点3,任选的另外具有帽;(vi)靶向域1、靶向域2、连接部分1、偶联位点1、连接部分2、偶联位点2,任选的另外具有帽;(vii)靶向域1、连接部分1、偶联位点1、连接部分2、偶联位点2、靶向域2,任选的另外具有帽;有关i)、ii)和iii)的图示,参见图1。例如,如以上作为(iii)所述的实施方式包括用于在无二级或三级结构的嵌入亲水性氨基酸中的限定位置(即连接部分和帽)处的偶联化学部分的三个偶联位点。靶向部分、连接部分和偶联位点的其它排列是可能的。末端“帽”氨基酸。在本发明的一个实施方式中,本发明所述的偶联位点不直接位于所述化合物的c-或n-末端。在这些实施方式中,所述化合物还包含“帽”,即在位于最末端的偶联位点之后的10至80个氨基酸的氨基酸序列。例如,在其中所述靶向化合物是融合蛋白的一个实施方式中,至少约5,优选地约10个氨基酸位于末端氨基酸和用于位点-特异性偶联的偶联位点之间。优选地,所述帽基本由或由除芳香族氨基酸或半胱氨酸之外的任何氨基酸组成,因此优选地选自丙氨酸、脯氨酸、丝氨酸、缬氨酸、亮氨酸、蛋氨酸、异亮氨酸、赖氨酸、精氨酸、谷氨酸、门冬氨酸、苏氨酸、谷氨酰胺、甘氨酸、天门冬酰胺或组氨酸。选自丙氨酸、脯氨酸和丝氨酸的氨基酸是优选的。在优选的实施方式中,所述帽基本由或由丙氨酸、脯氨酸和丝氨酸组成。靶向化合物的连接部分/偶联位点(lnso)的大小。在一个实施方式中,所述靶向化合物包含以下化学式:tmlnso帽,其中n或o=1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。因此,lnso包含最少约5,优选地约10至最大约1800个氨基酸。lnso帽的氨基酸总数在约20至1800个氨基酸之间,优选地,25至1000个氨基酸之间,优选地50至800个氨基酸之间,优选地70至500个氨基酸之间,并且优选地100至300个氨基酸之间。连接部分的限定数目和位置。本发明所述的靶向化合物包含至少一个将靶向域和偶联位点共价连接的肽接头和/或至少一个连接两个偶联位点的肽接头。在一个实施方式中,所述化合物包含两个10至80个氨基酸的肽接头,一个肽接头连接靶向域和第一偶联位点,而第二肽接头位于第一和第二偶联位点之间。在另一个实施方式中,所述化合物包含三个10至80个氨基酸的肽接头,一个肽接头连接靶向域和第一偶联位点,第二肽接头位于第一和第二偶联位点之间,而第三肽接头位于第二和第三偶联位点之间。在其它实施方式中,所述化合物包含四个10至80个氨基酸的肽接头,一个肽接头连接靶向域和第一偶联位点,第二肽接头位于第一和第二偶联位点之间,第三肽接头位于第二和第三偶联位点之间,而第四肽接头位于第三和第四偶联位点之间。因此,本发明的其它实施方式由多达20个接头组成。偶联位点的限定数目和位置。根据本发明的偶联位点由cys或cysxaacys或cysxaaxaacys或cysxaaxaaxaacys组成,其中xaa不是芳香族氨基酸(即xaa不是phe、trp、tyr)或者优选地不选自cys或met或ile或leu。偶联位点的限定数目和限定位置使得能够将化学部分位点-特异性偶联至靶向化合物,即偶联至靶标融合蛋白。本发明所述的化合物含有一些半胱氨酸残基(至少1至多达最大40)以用于缀合化学部分。因此,如果需要,可以将大量化学部分偶联至本发明的化合物,并且具有所述偶联化学部分的化合物可以特异性靶向靶标。对于特定应用,本领域技术人员可以将偶联位点(即半胱氨酸或者含有半胱氨酸的肽基序)数目调节至最优数目,从而相应地调节化学部分的量。在一个实施方式中,本发明的化合物包含位于连接部分的n-和c-末端的两个偶联位点(例如,cys或富含cys的基序)。在本发明的某些具体实施方式中,在所述化合物的两个偶联位点之间,所述连接部分由约20至30个氨基酸(pro、ser和ala)组成,例如,由18至33个氨基酸组成。化合物中的偶联位点是相同的或不同的。在优选的实施方式中,化合物中所有的偶联位点是相同的。无二级或三级结构的连接部分。本发明还涉及靶向化合物,其中连接部分由20-60%的丙氨酸、20-40%的脯氨酸和10-60%的丝氨酸组成。因此,用于本发明所述的化合物的接头是亲水的并且无二级或三级结构。因此,由于接头部分无二级或三级结构,因此在所述靶向化合物中以限定的偶联位点数目和位置维持了所述靶向域的功能和结构特征。多达80个氨基酸的连接部分的限定长度。所述肽接头的长度在至少约10个至多达最大约80个氨基酸之间改变。更优选地,本发明所述的肽接头的长度在约10至约80个氨基酸之间。在优选的化合物中,所述连接部分由约10至约60个氨基酸或者约20至约60个氨基酸或者约40至约60个氨基酸或者约60至约80个氨基酸组成。接头可以独立地由约10至约80个氨基酸组成。例如,在本发明的一个实施方式中,所述第一肽接头由约50个氨基酸组成,并且所述第二肽接头由约25个氨基酸组成。例如,在本发明的一个实施方式中,所述第一肽接头由约10个氨基酸组成,所述第二肽接头由约25个氨基酸组成,所述第三肽接头由约30个氨基酸组成。例如,在本发明的另一个实施方式中,所述第一肽接头由约50个氨基酸组成,所述第二肽接头由约60个氨基酸组成,所述第三肽接头由约60个氨基酸组成。例如,在本发明的另一个实施方式中,所述第一肽接头由约50个氨基酸组成,所述第二肽接头由约75个氨基酸组成,所述第三肽接头由约75个氨基酸组成,并且所述第四肽接头由约60个氨基酸组成。在一个构建体中,所述肽接头的长度可以是不同的或相同的。连接部分的氨基酸组成。在一个化合物中,所述肽接头的组成可以是不同的或相同的。在本发明优选的实施方式中,所述化合物的肽接头独立地由选自ala、pro或ser的氨基酸组成。优选地,所述肽接头由约30%至约60%的丙氨酸,约20%至约45%的脯氨酸和约10%至约60%的丝氨酸组成,优选地,由约40%至约60%的丙氨酸,约20%至约40%的脯氨酸和约10%至约30%的丝氨酸组成。在一个实施方式中,所述肽接头由约50%的丙氨酸,约30%的脯氨酸和约20%的丝氨酸组成。进一步优选地,所述氨基酸丙氨酸、脯氨酸和丝氨酸在整个接头氨基酸序列中均匀分布,从而不超过最多2、3、4或5个相同氨基酸残基相邻,优选地,最多3个氨基酸。本发明优选的接头是蛋白水解稳定的。表1a显示了适合于本发明的靶向化合物的连接部分的示例性氨基酸组成。表1a.适合于靶向化合物的连接部分的氨基酸组成在本发明的一个实施方式中,所述偶联位点是位于连接部分的c末端的半胱氨酸。表1b中显示了具有c末端偶联位点(半胱氨酸)的连接部分的所选实例的氨基酸组成。表1b.具有c末端偶联位点的连接部分的实例的氨基酸组成氨基酸序列sapapsapaasappapaapcapaapasapapasapaaspcsapapsapaasappapaapaapaapasapapacapaaspspaapapspaspapaspasapsapasc可以将分别具有c末端偶联位点的两个连接部分连接,例如:sapapsapaasappapaapcapaaapasapapasapaaspc(seqidno:73),sapapsapaasappapaapcapaapasapapasapaaspc(seqidno:75)。在优选的实施方式中,c末端“帽”添加在最靠c末端的偶联位点之后:sapapsapaasappapaapcapaaapasapapasapaaspcpaapapspaspapaspasap(seqidno:74),sapapsapaasappapaapcapaapasapapasapaaspcpaapapspaspapaspasap(seqidno:76)。优选地,所述连接部分的氨基酸序列包含或基本由seqidno:3至34和seqidno:55至76或者与seqidno:3至34和seqidno:55至76具有至少85%的同一性的氨基酸序列组成。例如,示例性靶向化合物在限定位置具有嵌入在无二级或三级结构的连接部分中的两个限定偶联位点,从而提供化学部分的特异性偶联并且维持所述靶向域的功能和结构特征。偶联位点的限定组成。根据本发明的偶联位点由半胱氨酸(c)或者cxc或cxxc或cxxxc组成。本发明还涉及靶向化合物,其中x选自非芳香族氨基酸。两个半胱氨酸之间的偶联位点中作为x所排除的氨基酸是芳香族氨基酸(phe、tyr、trp),并且优选地疏水性氨基酸(lie、leu、met、cys)。优选地,两个半胱氨酸之间的偶联位点中的氨基酸选自小或亲水性氨基酸,如pro、ser、ala、val、gly、thr、asn、asp、gln、glu、lys、arg和his。具有cxxc基序(seqidno:35)的偶联位点的非限制性实例为cpac(seqidno:36)、cssc(seqidno:37)、caac(seqidno:38)或者casc(seqidno:39)。本发明所述的化合物包含1、2、3、4、5、6或更多个,多达20个偶联位点。靶向域。在一个实施方式中,本发明的靶向化合物包含非-ig蛋白或抗体片段(例如,fab片段)作为靶向域。本发明所述的靶向化合物不包含全长抗体。全长抗体的缺点在于所述抗体的fc部分可以结合至细胞受体,而与可变域的靶向特异性无关并借此引起不希望的反应。与全长单克隆抗体相反,非-ig蛋白或抗体片段特异地结合至所期望的靶标,但是不结合其它蛋白。此外,非-ig蛋白是小蛋白,易于工程设计并且可以在微生物中产生,由此提供技术优势。在一个实施方式中,靶向域是非-ig蛋白,其与靶标的解离常数kd在0.001nm至500nm之间,优选地小于100nm,优选地小于10nm,更优选地小于1nm。在本发明的一些实施方式中,靶向化合物,例如,靶向融合蛋白包含1、2或更多个靶向域。在一些实施方式中,两个相同的靶向域通过肽接头连接。在其它实施方式中,两个不同的靶向域通过肽接头连接。不同的靶向域可以对相同表位或相同靶标蛋白具有特异性,但对不同表位不具有特异性。在另一个实施方式中,不同的靶向域可以对不同靶标蛋白具有特异性,即所述化合物是双重特异的。在一个实施方式中,可以将两个靶向域在它们的n-和c-末端两者上连接至连接部分。在其它实施方式中,一个靶向域位于所述化合物的n-或c-末端,而第二靶向域在其n-和c-末端两者上连接至连接域。在另一个实施方式中,将两个靶向域仅在它们的n-或c-末端之一上连接至连接域,即所述融合蛋白在n-末端包含第一靶向域,在c-末端包含第二靶向域。靶向域结合亲和力的确定。确定结合亲和力,即确定解离常数kd的方法是本领域常规技术人员所知的并且可以选自例如下列本领域中已知的方法:表面等离子共振(spr)基技术、生物膜干涉技术(bli)、酶联免疫吸附测定(elisa)、流式细胞术、荧光光谱学技术、等温滴定量热法(itc)、分析超速离心、放射免疫测定(ria或irma)和增强化学发光(ecl)。在以下实施例中更详细地描述了所述方法中的一些。通常,在约20℃至约37℃之间的温度确定解离常数kd。如果未明确另外指出,则本文所列的kd值是在25℃通过spr分析确定的。靶向化合物的进一步表征。可以以分离的可溶性蛋白的形式进行本发明所述的靶向化合物,例如,本发明所述的融合蛋白或者非-ig-蛋白,例如,泛素突变蛋白的进一步表征。适当的方法是本领域技术人员所知的或者在文献中有所描述。这些方法包括蛋白质物理学、生物物理学和功能特征的确定。可以通过如以上和在实施例中所讨论的并且如本领域技术人员已知的生物化学标准方法检测所分离的变体的亲和力和特异性。对于稳定性分析,例如,与化学或热去折叠有关的分光光度或荧光-基方法是本领域技术人员已知的,其包括(例如)差示扫描荧光法(dsf)。作为靶向域适合的非-ig蛋白。适合的非-ig蛋白的实例选自(但不限于)下列蛋白:affilin(泛素突变蛋白)、darpin(锚蛋白重复蛋白突变蛋白)、anticalin(脂质运载蛋白突变蛋白)、affibody(葡萄球菌蛋白a的z域的突变蛋白)、fynomer(人fynsh3域的突变蛋白)、adnectin(人纤连蛋白第十域的突变蛋白)、kunitz域肽(多种蛋白酶抑制剂的kunitz域的突变蛋白)、nanofitins(sac7d突变蛋白)、avimers(多聚化低密度脂蛋白受体-a的突变蛋白)、chagasin支架或chagasin-样蛋白酶抑制剂蛋白、adnexin支架、centryrin(fn3域突变蛋白)、knottin(半胱氨酸-结微小蛋白的突变蛋白)、armadillo-重复蛋白突变蛋白、atrimers(四连接素突变蛋白;c-型凝集素域突变蛋白)或者ctla4基突变蛋白。有关基于非-ig蛋白的支架的其它信息提供于例如vazquez-lombardi等人,drugdiscov.today,201520:1271-1283或weidle等人,cancergenomicsandproteomics201310:155-168中。作为靶向域适合的抗体片段。来源于抗体的适合片段的所选实例为单链抗体、抗体恒定区衍生物、双链抗体、三链抗体、四链抗体、fab片段、f(ab')片段、scfv或域抗体(例如,纳米抗体或abdurins)。适合靶标的实例。非-ig蛋白以可检测的特异性结合亲和力结合至靶标,例如,与某些疾病有关的靶标,例如,癌症、自身免疫或心血管疾病中的靶标。靶向域结合配偶体的实例为细胞表面表达的靶标,其选自(但绝不限于)her2、egfr、ed-b、psma或vegf-a。应注意可以使用多种可能的靶标。本发明包含两个或更多个靶向域的化合物可以结合至相同靶标,但是结合至不同表位。例如,具有两个不相同的靶向域(但分别对her2具有亲和力)的化合物可以结合至不同的her2-表位。本发明包含两个或三个靶向域的化合物可以是双重特异性的或三重特异性的并且结合至两个或三个不同的靶标。例如,具有对her2具有亲和力的靶向域和对egfr具有亲和力的第二靶向域的化合物结合至her2和egfr两者。作为靶向域实例的affilin。优选地,所述靶向化合物的靶向域为对泛素(seqidno:1)显示出80%至94%的同一性或者对双-泛素(seqidno:2)显示出80%至94%的同一性的泛素突变蛋白(affilin),只要affilin对靶标具有特异性结合亲和力。换言之,与seqidno:1相比,泛素突变蛋白在5、6、7、8、9、10、11、12、13、14、15或16个氨基酸中进行修饰,优选地,在seqidno:1的6、7、8、9、10或11个氨基酸中进行修饰,或者与seqidno:2相比,在10至32个氨基酸中修饰,优选地在seqidno:2的12至22个氨基酸中修饰,以产生对靶标抗原具有新产生的可测量结合特性的非天然蛋白。靶向域的鉴定。在现有技术中已描述了产生特异性结合至特定靶标抗原的突变蛋白的非-ig蛋白,例如,泛素的衍生化。例如,可以产生文库,其中例如已改变了如seqidno:1或者seqidno:2中所示的序列。优选地,所述改变为如现有技术所述的取代、插入或缺失。可以对任何所期望的氨基酸实施用于产生来源于泛素的新型结合蛋白的氨基酸残基取代。这在ep1626985b1、ep2379581b1和ep2721152中进行了详细描述,以上专利作为参考并入本文。根据本发明,优选地通过所选氨基酸的随机突变在基因水平上实施所选氨基酸的修饰步骤。可以基于对要修饰的泛素蛋白可用的结构信息实施通过取代、插入或缺失修饰的氨基酸的预选择。优选地,通过用于改变属于各自蛋白质的dna的基因工程方法实施非-ig蛋白的修饰。要进行随机化的不同的氨基酸组的选择导致产生了不同的文库。可以将所得的基因混合文库与使得蛋白质对于选择方法(如展示法)能够表达的适当功能基因元件组合。将所表达的蛋白质与靶标分子接触,以使得如果存在结合亲和力,伴侣彼此能够结合。该方法使得能够鉴别对靶标分子具有结合活性的那些蛋白质。根据本发明的接触优选地通过适合的呈现和选择方法进行,如噬菌体展示、核糖体展示、mrna展示或细胞表面展示、酵母表面展示或细菌表面展示法,优选地通过如本领域技术人员已知的噬菌体展示法进行。然后,对所鉴别的具有所期望的结合特性的克隆进行测序以显示突变蛋白的氨基酸序列。可以对所鉴别的结合蛋白进行进一步成熟步骤,例如,通过基于所鉴别的序列变化和如上所述的并且如本领域技术人员已知的重复噬菌体展示、核糖体展示、淘选和筛选步骤产生其它文库。在本发明的一个实施方式中,为了产生对靶标的kd为至少例如10-7m的可测量的结合亲和力,对泛素至少在5个氨基酸中进行取代,所述5个氨基酸选自seqidno:1的位置62、63、64、65、66、67或68。此外,可以修饰1、2、3、4、5或6个氨基酸以产生对靶标可测量的结合亲和力。在一个实施方式中,本发明的化合物的靶向部分包含基于seqidno:1的泛素突变蛋白,其中所述改变是在位于(i)区域2至11,或者(ii)区域62至68,或者(iii)同时在两个区域中的1、2、3、4、5、6、7、8、9、10或11个,优选地,总计5、6、7、8或9个氨基酸处进行的。还可以改变这些区域未包含的其它位置。作为靶向域的affilin蛋白的具体实例。在本发明的一个实施方式中,为了产生对靶标的kd为至少例如10-7m的可测量的结合亲和力,对泛素部分至少在对应于seqidno:1的位置62、63、64、65、66的5个氨基酸中进行取代,优选地,结合对应于seqidno:1的位置8至11(优选地,seqidno:1的位置9至10之间)是环区中的2-10个氨基酸插入(例如,egfr-特异性affilin-139819;seqidno:41)。在本发明的另一个实施方式中,将两个泛素部分独立地至少在5、6、7、8或9个氨基酸中进行取代,其选自并且对应于区域2至11和62至68,例如,选自seqidno:1的位置2、4、6、8、62、63、64、65、66、68,并且将两个泛素部分直接连接或通过肽接头连接,优选地直接连接。在另一个实施方式中,本发明所述的结合部分涉及对靶标的结合亲和力(kd)小于500nm的结合蛋白,其中所述靶标结合蛋白包含其中两个泛素部分独立地在至少7个氨基酸中取代的氨基酸序列,其中所述第一泛素部分中的取代至少选自seqidno:1的位置42、44、68、70、72、73和74,并且其中所述第二泛素部分中的取代至少选自seqidno:1的位置6、8、62、63、64、65、66,并且其中所述两个泛素部分直接连接而无任何接头。此外,所述结合蛋白对双-泛素(seqidno:2)具有至少85%的序列同一性。靶标结合泛素突变蛋白可以包含1、2、3、4、5或6个其它取代以产生对靶标具有高亲和力的结合蛋白,例如,her2-特异性结合蛋白(affilin-142628;seqidno:40)。在另一个实施方式中,靶标结合泛素突变蛋白可以包含第一泛素部分中的取代,其至少选自seqidno:1的位置6、8、62、63、64、65、66和第二泛素部分中的取代,其至少选自seqidno:1的位置6、8、62、63、64、65、66,并且其中所述两个泛素部分通过短肽接头连接以产生对靶标具有高亲和力的结合蛋白,例如,ed-b-特异性结合蛋白,如ep2513138b1中所公开的,该专利作为参考并入本文。在wo2012/172054中提供了vegf-a特异性affilin蛋白的实例。在其它优选实施方式中,本发明的融合蛋白包含选自seqidno:42至51的氨基酸序列或者与seqidno:42至51具有至少85%同一性的氨基酸序列或其功能变体,由其组成或基本由其组成。本发明还涉及靶向化合物,其中所述靶向化合物是融合蛋白。在氨基酸序列seqidno:42至51中显示了融合蛋白的实例。化学部分的具体实例。本发明涉及靶向化合物,其中偶联至所述化合物的偶联位点的所述化学部分选自染料、螯合剂、药物、毒素和小分子。小分子的实例为低分子量(低于约5000道尔顿)有机化合物。适合的染料的实例为edans(5-[(2-氨乙基)氨基]萘-1-磺酸)。螯合剂的实例为dota,其可以用作具有多种结构的分子(包括放射性同位素)的络合剂。可以将所得化合物与一些(例如)放射性同位素一起(具体地)用于在医学应用中使用。毒素的实例选自(但绝不限于)奥瑞他汀、微管溶素(tubulysin)、鹅膏菌素、多柔比星、美登素、卡里奇霉素(calicheamicin)、长春花生物碱、喜树碱和倍癌毒素。靶向化合物的用途。本发明还涉及靶向化合物在诊断或治疗应用中的用途。具有偶联的螯合剂、药物、毒素和小分子的靶向化合物可以具体地用于治疗应用,例如,癌症疗法。例如,具有偶联至偶联位点的染料的化合物可以用于诊断应用,例如,癌症诊断。例如,具有偶联至偶联位点的螯合剂的化合物可以用于诊断或治疗应用;例如,可以将其它物质,如放射性同位素偶联至螯合剂。靶向化合物的组合物。本发明还涉及靶向化合物的组合物以及包含所述靶向化合物的组合物的试剂盒。试剂盒包含以下组合物:处于预定量的靶向化合物和任选地其它组分,如溶液、缓冲液、处理装置等,其适合于处理所述化合物或制备用于其它用途的靶向化合物。靶向化合物的制备方法。本发明还涉及如以上详细说明的制备根据本发明的靶向化合物的方法,所述方法包括以下步骤:制备编码如上定义的融合蛋白的核酸;将所述核酸引入表达载体;将所述表达载体引入宿主细胞;培养所述宿主细胞;使所述宿主细胞处于融合蛋白表达的培养条件,借此产生如上所述的融合蛋白;任选地,分离步骤(e)中产生的融合蛋白;和任选地将所述融合蛋白与如上所述的其它功能部分缀合。出于蛋白质生产的目的,应用本领域技术人员熟知的技术,可以在任何规模上(从小体积振荡烧瓶至大的发酵罐)进行细胞培养和蛋白质表达。实施例提供下列实施例用于进一步描述本发明。然而,本发明不限于这些实施例,并且以下实施例仅基于上述说明显示本发明的实用性。对于本发明的完整公开,还参考本发明申请中引用的文献,其作为参考完全并入到本发明申请中。实施例1.表达构建体的产生图1提供了本发明优选的化合物的示意图。融合蛋白具有下列结构特征:靶向域-(接头-偶联位点)n-帽。产生了具体的融合蛋白,其包含(i)作为靶向域的her2-特异性结合蛋白或者egfr-特异性结合蛋白;(ii)作为连接部分的选自ala、pro、ser(在表2中称为“aps”)的22至74个氨基酸,在融合蛋白中具有2、3或4个连接部分;(iii)作为偶联位点的氨基酸cys或肽基序cys-pro-ala-cys,其在连接部分之间规则分布,每个偶联之间的最小距离为22个氨基酸,最大距离为74个氨基酸;(iv)作为帽位于c-末端的10至30个氨基酸(选自ala、pro、ser)以避免偶联位点的末端位置。表2.融合蛋白的实例用作靶向域的affilin蛋白:egfr-特异性affilin-139819(seqidno:41),其对egfr的kd为约20nm,在73℃具有热稳定性;her2-特异性affilin-142628(seqidno:40),其对her2的kd为约0.4nm,在62℃具有热稳定性。可以使用这些affilin结合蛋白的任何其它靶标特异性功能变体或者其它靶标特异性非-ig蛋白或者靶标-特异性抗体片段。使用本领域技术人员已知的标准方法合成基因并克隆至大肠杆菌(e.coli)表达载体中。加入c末端标签(例如,streptagll、seqidno:54或/和his标签,seqidno:53)以使得能够进行标准纯化规程。将dna测序用于验证融合蛋白的正确序列。实施例2.融合蛋白的表达用表达质粒转化hms174(de3)感受态细胞。将细胞涂布到选择性琼脂平板(卡那霉素)上并在37℃培育过夜。将来自单一集落的预培养物接种到100ml极富型培养基(改良的h15培养基,2%葡萄糖、5%酵母提取物、1%酪蛋白氨基酸、0.76%甘油、0.7%乳糖、1%圆酵母rna、250mmmops、202mmtris、10mg/lrnasea,ph7.4,消泡剂se15)中并在37℃,以160rpm在常规定轨振荡器中,在添加有150μg/ml卡那霉素但没有乳糖和消泡剂的1l挡板式锥形瓶中培养16小时。将来自上述过夜培养的主要培养物以0.5的调节的初始-od600接种到添加有甘油、葡萄糖、乳糖、消泡剂和150μg/ml卡那霉素的1l厚壁锥形瓶中的400ml极富型培养基中。将所述培养物转移至共振声混合器(rambio)并在37℃,以20×g培育。通过oxy-pump盖辅助通气。通过代谢葡萄糖和随后允许乳糖进入细胞来诱导重组蛋白表达。在预定时间点测量od600,将调节至5/od600的样品取出、沉淀成粒并在-20℃冷冻。使细胞生长过夜约24小时以达到最终od600为约45-60。为了收集生物量,将细胞在20℃以16000×g离心10min。对颗粒称重(湿重)并测量上清液中的ph。处理前,将细胞储存在-20℃。实施例3:融合蛋白的表达和溶解度的分析将发酵期间采集的样品在300μl提取缓冲液(添加有0.2mg/ml溶菌酶,0.5×bugbuster,7.5mmmgso4,40u核酸酶的pbs)中再悬浮,并通过在室温下,在恒温混合器(thermomixer)中以700rpm搅拌15min使其溶解。通过离心将可溶性融合蛋白与不溶性融合蛋白分离(16000×g,2min,rt)。取出上清液(可溶性部分),并将颗粒(不溶性部分)在等量脲缓冲液(8m脲,0.2mtris,2mmedta,ph8.5)中再悬浮。从可溶性和不溶性部分两者中采集s0μl,并且加入12μl5×样品缓冲液以及5μl0.5mdtt。将样品在95℃煮沸5min。最后,将8μl那些样品应用于sds-凝胶,接着根据生产商的建议运行。实施例4:融合蛋白的纯化。在具有c末端streptagll的大肠杆菌(e.coli)的可溶性部分中表达所有融合蛋白。通过超声使细胞裂解(1g生物量),并根据生产商的说明,使用1mlhitrapsphp柱,50mm乙酸钠ph4.0,通过阳离子交换色谱法进行第一纯化步骤。将洗脱部分进样至用20mm柠檬酸盐ph6.0和150mmnacl平衡的尺寸排阻色谱柱xk16/600superdex200pg(gehealthcare)。混合峰值部分,并通过sds-page分析。表3.融合蛋白的纯化。融合蛋白生物量得率(mg/g)1464145.21464168.01464185.51432764.01403500.2实施例5.靶标-特异性融合蛋白的热稳定性通过差示扫描荧光法确定本发明的融合蛋白的热稳定性。以0.1μgμl的浓度,将每种探针转移至optical384-孔板(thermofisher),并以适当稀释度加入syproorange染料。以每分钟1℃的加热速率,使温度从25℃程序升高至95℃(viia-7appliedbiosystems)。在520nm的激发波长和623nm的发射波长恒定测量荧光(viia-7,appliedbiosystems)。类似的熔点与相关的蛋白结构有关。实施例6.通过elisa分析靶向结合使用酶联免疫吸附测定(elisa)确定融合蛋白对特定靶标(例如,her2、egfr)的亲和力。将所述靶标固定在96孔nuncmaxisorbelisa板(2μgml)上。在4℃培育16h后,用pbst(pbs+0.1%吐温20)清洗孔三次,并用3%bsa在pbs中的溶液封闭孔(在室温下2h)。阴性对照为仅用bsa封闭的孔。封闭后,用pbst清洗孔三次,并与融合蛋白(在pbst中)在室温下培育1h。培育后,用pbst清洗孔三次,随后与strep-tactin-hrp(1∶10000)(来自iba)在室温下培育1h。然后,用pbst清洗孔三次,用pbs清洗三次。通过添加tmb-plus底物,使辣根过氧化物酶的活性显象。30min后,通过添加0.2mh2so4终止反应,并在450nm测量吸光度。实施例7:通过表面等离子共振分析靶向结合用spr运行缓冲液平衡cm5传感器芯片(gehealthcare)。通过将edc和nhs的混合物流过来激活表面-暴露的羧基以获得反应性酯基。将700-1500(1028)ru的结合配体(on-ligand)(rproteina)固定在流通池上,将解离配体(off-ligand)固定在另一个流通池上。配体固定化后,注入乙醇胺以除去非共价键结合的配体(对于affilin-142628、融合蛋白146414、146416和146418,hher2-fc;对于affilin-139819、融合蛋白143276和140350,hegfr-fc)。一旦配体结合,则蛋白分析物在表面上积累,从而提高了折光率。实时测量折光率变化,并以响应或共振单位(ru)相对于时间作图。将分析物以连续稀释,在适合的流速(30μl/min)下应用于芯片。每次运行后,用再生缓冲液使芯片表面再生并用运行缓冲液平衡。将对照样品应用于基质。如先前所提及的实施再生和再平衡。通过使用3000(gehealthcare)进行结合研究;通过生产商所提供的biaevaluation3.0软件,通过使用langmuir1:1模型(ri=0)进行数据评价。将所评价的解离常数(kd)相对于脱靶进行标准化。结果如表4所示(参见实施例9)。实施例8.融合蛋白的标记a.用edans-c2-maleimid标记融合蛋白将35μμ融合蛋白(her2特异性cids146414、146416和146418;egfr特异性cid143276;具有三个连接部分和三个偶联位点“cpac”,其位于affilin的c末端(cid140350)或affilin的n末端(cid140353))(每个0.632mg/ml)与10倍过量的edans(5-((2-氨乙基)氨基)萘-1-磺酸)在20mm磷酸盐缓冲液ph7.0中的溶液一起在室温下培育1h。在rt用1m半胱氨酸封闭非反应性的马来酰亚胺(maleimids)1h后,使用hitrap柱(5ml,gehc)并以pbs作为运行缓冲液对样品脱盐。将maldi-tof分析用于确定标记程度。b.用dota标记融合蛋白将包含两个连接域和位于每个连接域的c-末端作为偶联位点的两个半胱氨酸和位于融合蛋白c-末端的“帽”的融合蛋白与20-倍过量的马来酰亚胺-dota(2,2',2”-(10-(2-((2-(2,5-二氧代-2,5-二氢-1h-吡咯-1-基)乙基)氨基)-2-氧乙基)-1,4,7,10-四氮杂环十二烷-1,4,7-三基)三乙酸,chematech)在50mmhepes、150mm氯化钠、5mmedtaph7.0中在室温下培育3h。为了减少可以与dota-分子相互作用的金属离子,将所有柱和akta装置(gehealthcare)与0.1medta溶液一起培育30分钟。为了制备溶液,仅使用不含金属或金属减少的组分。培育后,通过尺寸排除(superdexs200,gehealthcare)在100mm乙酸钠ph5.0-5.8中将样品与未结合的dota分子分离。还将标记的蛋白质样品与5mm氯化铁(ii)在室温下培育1h以证明dota-分子对于和放射性同位素的偶联可用。培育后,使用hitrap脱盐柱(gehealthcare)除去未结合的铁。将maldi-tof分析用于确定标记程度。实施例9:基质辅助激光解吸/电离质谱(maldi-tof)以确认融合蛋白的均一标记如下所示进行基质辅助激光解吸/电离质谱(maldi-tofms):使用c18-p10-ziptips(millipore;产品目录号ztc18s096)纯化和浓缩融合蛋白。用0.1%(v/v)三氟乙酸(tfa)在水中的溶液清洗微量层析柱(tips)并用50%(v/v)乙腈/0.1%tfa洗脱。用2%(v/v)tfa在水中的溶液处理样品并将其包埋在2,5-二羟基苯乙酮(dhap)基质(bruker,产品目录号8231829)中。在autoflextm高速质谱仪(bruker)上测量融合蛋白的分子量。将蛋白质校准标准品(bruker,部件号no.8206355和部件号no.8207234)用于autoflex高速质谱仪的调节。通过maldi-tof质谱分析具有和不具有edans标记的融合蛋白并比较峰值。图4显示了结果,并且所述结果确认2或4或6个染料分子均一标记了融合蛋白。maldi-tof分析显示6个染料分子标记了融合蛋白140350和140353,其对应于融合蛋白中的6个半胱氨酸。通过maldi-tof质谱分析具有和不具有dota标记的融合蛋白并比较峰值。所述分析确认2个马来酰亚胺-dota分子均一标记了融合蛋白。maldi-tof分析还显示标记至具有两个偶联位点的融合蛋白的dota分子对于和氯化铁(ii)分子的偶联可用。尽管在融合蛋白标记之后kd轻微改变,但是标记不会显著影响融合蛋白对靶标的亲和力。表4中总结了结果(n.d.,未确定)。表4.使用spr的标记的融合蛋白的亲和力分析序列表<110>纳维格蛋白质有限公司(scilproteinsgmbh)<120>包含肽接头的用于化学部分位点-特异性偶联的靶向化合物<130>pw98206<160>76<170>patentinversion3.5<210>1<211>76<212>prt<213>artificialsequence<220><223>泛素<400>1metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrilegluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnargleuilephealaglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleuhisleuvalleuargleuargglygly657075<210>2<211>152<212>prt<213>artificialsequence<220><223>双-泛素<400>2metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrilegluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnargleuilephealaglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleuhisleuvalleuargleuargglyglymetglnilephe65707580vallysthrleuthrglylysthrilethrleugluvalgluproser859095aspthrilegluasnvallysalalysileglnasplysgluglyile100105110proproaspglnglnargleuilephealaglylysglnleugluasp115120125glyargthrleuserasptyrasnileglnlysgluserthrleuhis130135140leuvalleuargleuargglygly145150<210>3<211>49<212>prt<213>artificialsequence<220><223>接头<400>3seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530proalaproalaalaserproserproalaalaproalaproserpro354045ala<210>4<211>24<212>prt<213>artificialsequence<220><223>接头<400>4proalaproalaserproalaseralaproseralaproalaserala151015proproalaalaproseralaala20<210>5<211>24<212>prt<213>artificialsequence<220><223>接头<400>5proalaproseralaproalaproalaalaserproalaalaalapro151015alaseralaalaproalaserala20<210>6<211>39<212>prt<213>artificialsequence<220><223>接头<400>6seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530proalaproalaproalaala35<210>7<211>49<212>prt<213>artificialsequence<220><223>接头<400>7alaserproalaproalaproserproalaserproalaproalaser151015proalaseralaproseralaproalaseralaproproalaalapro202530seralaserproalaproseralaproalaproalaalaalaserpro354045ala<210>8<211>49<212>prt<213>artificialsequence<220><223>接头<400>8alaproalaseralaalaproalaseralaseralaproalaproser151015alaproalaalaseralaproproalaproalaalaproalaalapro202530alaalaproalaseralaproalaproalaproalaproalaalaala354045pro<210>9<211>39<212>prt<213>artificialsequence<220><223>接头<400>9proalaalaproalaproserproseralaproalaproalaserpro151015alaseralaproseralaproalaseralaproproalaalaproser202530alaalaserproalaproser35<210>10<211>20<212>prt<213>artificialsequence<220><223>接头<400>10proalaproalaseralaserproalaalaalaproalaseralaala151015proalaserala20<210>11<211>59<212>prt<213>artificialsequence<220><223>接头<400>11seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530proalaproalaalaalaproserproalaalaproalaproserpro354045alaserproalaproalaserproalaserala5055<210>12<211>74<212>prt<213>artificialsequence<220><223>接头<400>12alaserproseralaproalaproproalaalaproseralaalaser151015proalaproseralaproalaproalaalaalaserproalaalaala202530proseralaalaproalaseralaseralaproalaproseralapro354045alaalaproproalaproalaalaproalaalaproalaalaproala505560seralaproalaproalaproalaproala6570<210>13<211>74<212>prt<213>artificialsequence<220><223>接头<400>13alaproserproalaalaproalaproserproalaseralaalaala151015proalaproalaserproalaseralaproseralaproalaserala202530proproalaalaproseralaalaserproalaproseralaproala354045proalaseralaserproalaalaalaproseralaalaproalaala505560seralaseralaproalaproserproala6570<210>14<211>59<212>prt<213>artificialsequence<220><223>接头<400>14alaproserproalaproalaalaproalaalaproalaseralaala151015alaproalaseralaproalaproalaproalaproalaalaalapro202530serproalaalaproalaproserproalaalaproalaproalaser354045proalaseralaproseralaproalaproser5055<210>15<211>30<212>prt<213>artificialsequence<220><223>接头<400>15alaproalaproseralaalaserproalaproseralaproalapro151015alaseralaserproalaalaalaproalaseralaproala202530<210>16<211>10<212>prt<213>artificialsequence<220><223>接头<400>16alaserproalaseralaalaproalaala1510<210>17<211>26<212>prt<213>artificialsequence<220><223>接头<400>17alaproalaproalaseralaproalaalaalaproserproalaala151015proalaproserproalaproalaproala2025<210>18<211>28<212>prt<213>artificialsequence<220><223>接头<400>18alaproseralaproalaseralaserproproseralaproserala151015seralaalaserseralaseralaproalaalaala2025<210>19<211>22<212>prt<213>artificialsequence<220><223>接头<400>19alaproalaseralaalaproalaseralaseralaproalaproser151015seralaproalaalaser20<210>20<211>74<212>prt<213>artificialsequence<220><223>接头<400>20alaproalaproalaserproalaseralaproseralaproalaser151015alaproproalaalaproseralaalaserproalaproseralapro202530alaproalaseralaserproalaalaalaproseralaalaproala354045alaseralaseralaproalaproseralaproalaalaproserpro505560alaproalaalaproalaalaproalaser6570<210>21<211>75<212>prt<213>artificialsequence<220><223>接头<400>21alaalaproalaseralaproalaproalaproalaproalaalaala151015proserproalaalaproalaproserproalaalaproalaproala202530serproalaseralaproseralaproalaseralaproproalaala354045proseralaalaserproalaproseralaproalaproalaserala505560serproalaalaalaproalaseralaproala657075<210>22<211>49<212>prt<213>artificialsequence<220><223>接头<400>22seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530proalaproalaalaalaproserproalaalaproalaproserpro354045ala<210>23<211>50<212>prt<213>artificialsequence<220><223>接头<400>23proalaproalaserproalaseralaproseralaproalaserala151015proproalaalaproseralaalaserproalaproseralaproala202530proalaseralaserproalaalaalaproalaseralaalaproala354045serala50<210>24<211>21<212>prt<213>artificialsequence<220><223>接头<400>24seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaala20<210>25<211>46<212>prt<213>artificialsequence<220><223>接头<400>25seralaproseralaproalaalaseralaproproalaproalaala151015proalaalaproalaproalaseralaproalaproalaproalapro202530alaalaproserproalaalaproalaproserproalaala354045<210>26<211>47<212>prt<213>artificialsequence<220><223>接头<400>26alaserproalaproalaseralaproseralaproalaseralapro151015proalaalaproseralaalaserproalaproseralaproalapro202530alaseralaserproalaalaalaproalaseralaproserala354045<210>27<211>46<212>prt<213>artificialsequence<220><223>接头<400>27alaserproseralaproseralaproserproproalaproalaala151015proalaalaproalaproalaalaalaproalaproalaproalapro202530alaalaproserproalaalaproalaproserproalaala354045<210>28<211>47<212>prt<213>artificialsequence<220><223>接头<400>28alaserproalaproseralaalaproseralaproalaseralapro151015proalaalaproseralaalaalaproalaproserproalaproala202530proalaseralaalaproalaalaproalaseralaproserala354045<210>29<211>46<212>prt<213>artificialsequence<220><223>接头<400>29seralaproseralaproalaalaproserproproalaproalaala151015proalaalaproalaproalaseralaproalaproalaproalapro202530alaalaproserproalaalaproalaproserproalaala354045<210>30<211>47<212>prt<213>artificialsequence<220><223>接头<400>30alaserproalaproalaseralaproseralaproalaseralapro151015proalaalaproseralaalaserproalaproserproalaproala202530proalaseralaserproalaalaproalaseralaproserala354045<210>31<211>46<212>prt<213>artificialsequence<220><223>接头<400>31seralaproseralaproalaalaproserproproalaproalaala151015proalaalaproalaproalaalaalaproalaproalaproalapro202530alaalaproserproalaalaproalaproserproalaala354045<210>32<211>47<212>prt<213>artificialsequence<220><223>接头<400>32alaserproalaproalaalaalaproseralaproalaseralapro151015proalaalaproseralaalaalaproalaproserproalaproala202530proalaseralaalaproalaalaproalaseralaproserala354045<210>33<211>24<212>prt<213>artificialsequence<220><223>接头<400>33seralaproalaproserseralaproalaalaseralaproproala151015alaalaseralaalaproalaala20<210>34<211>10<212>prt<213>artificialsequence<220><223>接头<400>34alaproalaseralaalaproalaserala1510<210>35<211>4<212>prt<213>artificialsequence<220><223>偶联位点<220><221>variant<222>(2)..(4)<223>xaa可以是选自pro,ala,ser,val,gly,thr,ser,asn,asp,gln,glu,lys,arg,his中任一个的氨基酸<220><221>variant<222>(2)..(3)<223>xaa可以是选自pro,ala,ser,val,gly,thr,ser,asn,asp,gln,glu,lys,arg,his中任一个的氨基酸<400>35cysxaaxaacys1<210>36<211>4<212>prt<213>artificialsequence<220><223>偶联位点<400>36cysproalacys1<210>37<211>4<212>prt<213>artificialsequence<220><223>偶联位点<400>37cyssersercys1<210>38<211>4<212>prt<213>artificialsequence<220><223>偶联位点<400>38cysalaalacys1<210>39<211>4<212>prt<213>artificialsequence<220><223>偶联位点<400>39cysalasercys1<210>40<211>152<212>prt<213>artificialsequence<220><223>her2-特异性affilin142628<400>40metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrthrgluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnthrleualaphevalglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleutrpleutyrleuthrtrptyralaalametargilephe65707580valthrthrhisthrglylysthrilethrleuaspvalgluproser859095aspthrilegluasnvallysalalysileglnasplysgluglyile100105110proproaspglnglnargleuiletrpalaglylysglnleugluasp115120125glyargthrleuserasptyrasnileserglutrpalaileleuhis130135140leuvalleuargleuargalaala145150<210>41<211>82<212>prt<213>artificialsequence<220><223>egfr-特异性affilin139891<400>41metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaala<210>42<211>182<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白143276<400>42metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproseralaproalaalaseralapropro859095alaproalaalaproalaalaproalaalaproalaseralaproala100105110proalaproalaproalaalaserproserproalaalaproalapro115120125serproalacysproalaproalaserproalaseralaproserala130135140proalaseralaproproalaalaproseralaalacysserproala145150155160proseralaproalaproalaalaserproalaalaalaproalaser165170175alaalaproalaserala180<210>43<211>252<212>prt<213>artificialsequence<220><223>her2特异性融合蛋白146414<400>43metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrthrgluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnthrleualaphevalglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleutrpleutyrleuthrtrptyralaalametargilephe65707580valthrthrhisthrglylysthrilethrleuaspvalgluproser859095aspthrilegluasnvallysalalysileglnasplysgluglyile100105110proproaspglnglnargleuiletrpalaglylysglnleugluasp115120125glyargthrleuserasptyrasnileserglutrpalaileleuhis130135140leuvalleuargleuargalaalaseralaproalaproseralapro145150155160alaalaseralaproproalaproalaalaproalaalaproalaala165170175proalaseralaproalaproalaproalaproalaalaserproser180185190proalaalaproalaproserproalacysproalaproalaserpro195200205alaseralaproseralaproalaseralaproproalaalaproser210215220alaalacysserproalaproseralaproalaproalaalaserpro225230235240alaalaalaproalaseralaalaproalaserala245250<210>44<211>352<212>prt<213>artificialsequence<220><223>her2特异性融合蛋白146416<400>44metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrthrgluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnthrleualaphevalglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleutrpleutyrleuthrtrptyralaalametargilephe65707580valthrthrhisthrglylysthrilethrleuaspvalgluproser859095aspthrilegluasnvallysalalysileglnasplysgluglyile100105110proproaspglnglnargleuiletrpalaglylysglnleugluasp115120125glyargthrleuserasptyrasnileserglutrpalaileleuhis130135140leuvalleuargleuargalaalaseralaproalaproseralapro145150155160alaalaseralaproproalaproalaalaproalaalaproalaala165170175proalaseralaproalaproalaproalaproalaproalaalacys180185190alaserproalaproalaproserproalaserproalaproalaser195200205proalaseralaproseralaproalaseralaproproalaalapro210215220seralaserproalaproseralaproalaproalaalaalaserpro225230235240alacysalaproalaseralaalaproalaseralaseralaproala245250255proseralaproalaalaseralaproproalaproalaalaproala260265270alaproalaalaproalaseralaproalaproalaproalaproala275280285alaalaprocysproalaalaproalaproserproseralaproala290295300proalaserproalaseralaproseralaproalaseralapropro305310315320alaalaproseralaalaserproalaprosercysproalaproala325330335seralaserproalaalaalaproalaseralaalaproalaserala340345350<210>45<211>452<212>prt<213>artificialsequence<220><223>her2特异性融合蛋白146418<400>45metglnilephevallysthrleuthrglylysthrilethrleuglu151015valgluproseraspthrthrgluasnvallysalalysileglnasp202530lysgluglyileproproaspglnglnthrleualaphevalglylys354045glnleugluaspglyargthrleuserasptyrasnileglnlysglu505560serthrleutrpleutyrleuthrtrptyralaalametargilephe65707580valthrthrhisthrglylysthrilethrleuaspvalgluproser859095aspthrilegluasnvallysalalysileglnasplysgluglyile100105110proproaspglnglnargleuiletrpalaglylysglnleugluasp115120125glyargthrleuserasptyrasnileserglutrpalaileleuhis130135140leuvalleuargleuargalaalaseralaproalaproseralapro145150155160alaalaseralaproproalaproalaalaproalaalaproalaala165170175proalaseralaproalaproalaproalaproalaalaalaproser180185190proalaalaproalaproserproalaserproalaproalaserpro195200205alaseralacysalaserproseralaproalaproproalaalapro210215220seralaalaserproalaproseralaproalaproalaalaalaser225230235240proalaalaalaproseralaalaproalaseralaseralaproala245250255proseralaproalaalaproproalaproalaalaproalaalapro260265270alaalaproalaseralaproalaproalaproalaproalacysala275280285proserproalaalaproalaproserproalaseralaalaalapro290295300alaproalaserproalaseralaproseralaproalaseralapro305310315320proalaalaproseralaalaserproalaproseralaproalapro325330335alaseralaserproalaalaalaproseralaalaproalaalaser340345350alaseralaproalaproserproalacysalaproserproalapro355360365alaalaproalaalaproalaseralaalaalaproalaseralapro370375380alaproalaproalaproalaalaalaproserproalaalaproala385390395400proserproalaalaproalaproalaserproalaseralaproser405410415alaproalaprosercysalaproalaproseralaalaserproala420425430proseralaproalaproalaseralaserproalaalaalaproala435440445seralaproala450<210>46<211>282<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白144646<400>46metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproseralaproalaalaseralapropro859095alaproalaalaproalaalaproalaalaproalaseralaproala100105110proalaproalaproalaalaalaproserproalaalaproalapro115120125serproalaserproalaproalaserproalaseralaproserala130135140proalaseralaproproalaalaproseralaalaserproalapro145150155160seralaproalaproalaalaalaserproalaalaalaproalaser165170175alaalaproalasercyssersercysseralaproseralaproala180185190alaproserproproalaproalaalaproalaalaproalaproala195200205alaalaproalaproalaproalaproalaalaproserproalaala210215220proalaproserproalaalacyssersercysalaserproalapro225230235240alaalaalaproseralaproalaseralaproproalaalaproser245250255alaalaalaproalaproserproalaproalaproalaseralaala260265270proalaalaproalaseralaproserala275280<210>47<211>311<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白144647<400>47metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproseralaproalaalaseralapropro859095alaproalaalaproalaalaproalaalaproalaseralaproala100105110proalaproalaproalaalaalaproserproalaalaproalapro115120125serproalaserproalaproalaserproalaseralaproserala130135140proalaseralaproproalaalaproseralaalaserproalapro145150155160seralaproalaproalaalaalaserproalaalaalaproalaser165170175alaalaproalasercysproalacysseralaproseralaproala180185190alaseralaproproalaproalaalaproalaalaproalaproala195200205seralaproalaproalaproalaproalaalaproserproalaala210215220proalaproserproalaalacysproalacysalaserproalapro225230235240alaseralaproseralaproalaseralaproproalaalaproser245250255alaalaserproalaproseralaproalaproalaseralaserpro260265270alaalaalaproalaseralaproseralagluthrvalargphegln275280285serglyserserhishishishishishisserserglyseralatrp290295300serhisproglnpheglulys305310<210>48<211>282<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白144648<400>48metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproseralaproalaalaseralapropro859095alaproalaalaproalaalaproalaalaproalaseralaproala100105110proalaproalaproalaalaalaproserproalaalaproalapro115120125serproalaserproalaproalaserproalaseralaproserala130135140proalaseralaproproalaalaproseralaalaserproalapro145150155160seralaproalaproalaalaalaserproalaalaalaproalaser165170175alaalaproalasercysalaalacysseralaproseralaproala180185190alaproserproproalaproalaalaproalaalaproalaproala195200205seralaproalaproalaproalaproalaalaproserproalaala210215220proalaproserproalaalacysalaalacysalaserproalapro225230235240alaseralaproseralaproalaseralaproproalaalaproser245250255alaalaserproalaproserproalaproalaproalaseralaser260265270proalaalaproalaseralaproserala275280<210>49<211>282<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白144649<400>49metglnilephevallysthrleuthrtyrasnprometargtyrgly151015lysthrilethrleugluvalgluproseraspthrilegluasnval202530lysalalysileglnasplysgluglyileproproaspglnglnarg354045leuiletrpalaglylysglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproseralaproalaalaseralapropro859095alaproalaalaproalaalaproalaalaproalaseralaproala100105110proalaproalaproalaalaalaproserproalaalaproalapro115120125serproalaserproalaproalaserproalaseralaproserala130135140proalaseralaproproalaalaproseralaalaserproalapro145150155160seralaproalaproalaalaalaserproalaalaalaproalaser165170175alaalaproalasercysalasercysalaserproseralaproser180185190alaproserproproalaproalaalaproalaalaproalaproala195200205alaalaproalaproalaproalaproalaalaproserproalaala210215220proalaproserproalaalacysalasercysalaserproalapro225230235240seralaalaproseralaproalaseralaproproalaalaproser245250255alaalaalaproalaproserproalaproalaproalaseralaala260265270proalaalaproalaseralaproserala275280<210>50<211>182<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白140153<400>50metglnilephevalargthrleuthrtyrasnprometargtyrgly151015argthrilethrleugluvalgluproseraspthrilegluasnval202530argalaargileglnasparggluglyileproproaspglnglnarg354045leuiletrpalaglyargglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproserseralaproalaalaseralapro859095proalaalaalaseralaalaproalaalacysproalacysalapro100105110alaproalaseralaproalaalaalaproserproalaalaproala115120125proserproalaproalaproalacysproalacysalaproserala130135140proalaseralaserproproseralaproseralaseralaalaser145150155160seralaseralaproalaalaalacysproalacysalaproalaser165170175alaalaproalaserala180<210>51<211>182<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白140350<400>51metglnilephevalargthrleuthrtyrasnprometargtyrgly151015argthrilethrleugluvalgluproseraspthrilegluasnval202530argalaargileglnasparggluglyileproproaspglnglnarg354045leuiletrpalaglyargglnleugluaspglyargthrleuserasp505560tyrasnileargasnproaspileleuhisleuvalleuargleuarg65707580alaalaseralaproalaproserseralaproalaalaseralapro859095proalaalaalaseralaalaproalaalacysproalacysalapro100105110alaproalaseralaproalaalaalaproserproalaalaproala115120125proserproalaproalaproalacysproalacysalaproserala130135140proalaseralaserproproseralaproseralaseralaalaser145150155160seralaseralaproalaalaalacysproalacysalaproalaser165170175alaalaproalaserala180<210>52<211>175<212>prt<213>artificialsequence<220><223>egfr特异性融合蛋白140353<400>52metalaserproalaseralaalaproalaalacysproalacysala151015proalaproalaseralaproalaalaalaproserproalaalapro202530alaproserproalaproalaproalacysproalacysalaproser354045alaproalaseralaserproproseralaproseralaseralaala505560serseralaseralaproalaalaalacysproalacysalaproala65707580seralaalaproalaseralaseralaproalaproserseralapro859095alaalasermetglnilephevallysthrleuthrglylysthrile100105110thrleugluvalgluproseraspthrilegluasnvallysalalys115120125ileglnasplysgluglyileproproaspglnglnargleuilephe130135140alaglylysglnleugluaspglyargthrleuserasptyrasnile145150155160glnlysgluserthrleuhisleuvalleuargleuargalaala165170175<210>53<211>6<212>prt<213>artificialsequence<220><223>his标签<400>53hishishishishishis15<210>54<211>10<212>prt<213>artificialsequence<220><223>streptag<400>54seralatrpserhisproglnpheglulys1510<210>55<211>32<212>prt<213>artificialsequence<220><223>接头<400>55seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530<210>56<211>32<212>prt<213>artificialsequence<220><223>接头<400>56alaproalaalaserproserproalaalaproalaproserproala151015serproalaproalaserproalaseralaproseralaproalaser202530<210>57<211>34<212>prt<213>artificialsequence<220><223>接头<400>57proproalaalaproseralaalaserserproalaproseralapro151015alaproalaalaserproalaalaalaproalaseralaalaproala202530serala<210>58<211>19<212>prt<213>artificialsequence<220><223>接头<400>58seralaproalaproseralaproalaalaseralaproproalapro151015alaalapro<210>59<211>19<212>prt<213>artificialsequence<220><223>接头<400>59alaproalaalaproalaseralaproalaproalaseralaproala151015alaserpro<210>60<211>21<212>prt<213>artificialsequence<220><223>接头<400>60proalaalaproalaproserproalaserproalaproalaserpro151015alaproserserala20<210>61<211>40<212>prt<213>artificialsequence<220><223>接头<400>61seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaproalaalaproalaseralaproalaproala202530proalaproalaalaserproser3540<210>62<211>40<212>prt<213>artificialsequence<220><223>接头<400>62seralaproalaalaserproserproalaalaproalaproserpro151015alaserproalaproalaserproalaseralaproseralaproala202530seralaproproalaalaserala3540<210>63<211>20<212>prt<213>artificialsequence<220><223>接头<400>63proalaalaproalaproserproalaserproalaproalaserpro151015alaseralapro20<210>64<211>33<212>prt<213>artificialsequence<220><223>接头<400>64seralaproalaproseralaproalaalaseralaproproalapro151015alaalaalaproalaalaproalaalaproalaseralaproalapro202530ala<210>65<211>33<212>prt<213>artificialsequence<220><223>接头<400>65alaproalaalaserproserproalaalaalaproalaproserpro151015alaserproalaproalaserproalaseralaproseralaproala202530ser<210>66<211>35<212>prt<213>artificialsequence<220><223>接头<400>66proproalaalaproseralaalaserserproalaproseralapro151015alaproalaalaalaserproalaalaalaproalaseralaalapro202530alaserala35<210>67<211>20<212>prt<213>artificialsequence<220><223>接头<400>67seralaproalaproseralaproalaalaalaseralaproproala151015proalaalapro20<210>68<211>20<212>prt<213>artificialsequence<220><223>接头<400>68alaproalaalaalaproalaseralaproalaproalaseralapro151015alaalaserpro20<210>69<211>22<212>prt<213>artificialsequence<220><223>接头<400>69proalaalaalaproalaproserproalaserproalaproalaser151015proalaproserserala20<210>70<211>41<212>prt<213>artificialsequence<220><223>接头<400>70seralaproalaproseralaproalaalaseralaproproalapro151015alaalaproalaalaalaproalaalaproalaseralaproalapro202530alaproalaproalaalaserproser3540<210>71<211>41<212>prt<213>artificialsequence<220><223>接头<400>71seralaproalaalaserproserproalaalaalaproalaproser151015proalaserproalaproalaserproalaseralaproseralapro202530alaseralaproproalaalaserala3540<210>72<211>21<212>prt<213>artificialsequence<220><223>接头<400>72proalaalaalaproalaproserproalaserproalaproalaser151015proalaseralapro20<210>73<211>41<212>prt<213>artificialsequence<220><223>接头和偶联位点l1c1-l2c2<400>73seralaproalaproseralaproalaalaseralaproproalapro151015alaalaprocysalaproalaalaalaproalaseralaproalapro202530alaseralaproalaalaserprocys3540<210>74<211>61<212>prt<213>artificialsequence<220><223>接头和偶联位点l1c1-l2c2-帽<400>74seralaproalaproseralaproalaalaseralaproproalapro151015alaalaprocysalaproalaalaalaproalaseralaproalapro202530alaseralaproalaalaserprocysproalaalaproalaproser354045proalaserproalaproalaserproalaseralapro505560<210>75<211>40<212>prt<213>artificialsequence<220><223>接头和偶联位点l1c1-l2c2<400>75seralaproalaproseralaproalaalaseralaproproalapro151015alaalaprocysalaproalaalaproalaseralaproalaproala202530seralaproalaalaserprocys3540<210>76<211>60<212>prt<213>artificialsequence<220><223>接头和偶联位点l1c1-l2c2-帽<400>76seralaproalaproseralaproalaalaseralaproproalapro151015alaalaprocysalaproalaalaproalaseralaproalaproala202530seralaproalaalaserprocysproalaalaproalaproserpro354045alaserproalaproalaserproalaseralapro505560当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1