稳定的多肽组合物的制作方法

文档序号:3560990阅读:429来源:国知局

专利名称::稳定的多肽组合物的制作方法稳定的多肽组合物相关申请本申请要求享有以下美国临时专利申请的优先权,其每一篇为所有目的而全文纳入本文参考1)美国临时专利申请60/783,622号,其提交于2006年3月17日,其名称为"稳定化的多肽和用于评估和增加其稳定性的方法";2)美国临时专利申请60/812,688号,其提交于2006年6月9日,其名称为"稳定化的多肽和用于评估和增加其稳定性的方法";3)美国临时专利申请60/873,502号,其提交于2006年12月8曰,其名称为"用于评估和增强多肽生物物理性质的方法";和4)美国临时专利申请60/873,996号,其提交于2006年12月8日,其名称为"稳定化的多肽组合物"。本说明书中引用的任何专利、专利申请、和参考文献的内容都全文纳入本文参考。
背景技术
:现在,蛋白质稳定性被认为是蛋白质(如,抗体分子)开发和升级的中心议题。抗体的重链和轻链可变区序列处在选择压力之下,其序列可在不同抗体之间有显著差别(Wu和Kabat,1970)。在人基因组内嵌有大量功能性胚系可变重链(40;Tomlinson等,1992;Tomlinson等,1994;Matsuda和kmjo,1996)、可变K链(40;Meindl等,1989;Cox等,1994;Barbie和Lefranc,1998)和可变人链(30;Williams等,1996;Kawasaki,等,1997)基因。免疫系统产生许多重链和轻链可变区胚系组合的能力是产生抗体多样性的一种机制(Edelman,1959;Frafiek,1961)。其它多才羊性源自在可变区和恒定结构域之间插入可变连接肽区域——J-连接肽(加上重链的D-连接肽)(Leder,1982)。选择抗特定抗原的胚系抗体,接着,表达单一抗体(所述抗体带有所选择的可变区胚系和(D-)J-连接肽)的B细胞在可变重链和轻链结构域内进行超体细胞突变(hypersomatic)过程,从而增加针对抗原的抗体亲和性(Leder,1982;Tomlinson等,1996)。在可变区内也经常可观察到超体细胞插入或缺失,然而其比超体细胞突变频率低得多(deWildt等,1999)。因而,抗特定抗原而加以选择的成熟的抗体将具有高度独特的可变区序列,不必对其稳定性进行优化。当在多种细胞系统中(如在细菌或哺乳动物表达系统中)表达时,稳定性差可影响抗体或抗体结构域适当折叠的能力。错误折叠或稳定性不良也可导致部分非功能性材料群体(Martsev等,1998)和/或有形成大的可溶聚集体倾向的抗体,所述聚集体在用于治疗时有潜在危险或有免疫原性。其他稳定性问题包括重折叠受阻、降解、亲合性削弱、聚集,或储存后丧失活性。稳定性问题不限于天然产生的抗体,也可发生在基因工程化的抗原结合分子中,例如用于生产和临床目的的重组抗体文库(Hoogenboom,2005)、抗体片段(Holt等,2003;Todorovska等,2001;Worn和Pliickthun,2001;Reiter和Pastan,1996)和基因工程化的或人源化的治疗性抗体(Ewert等,2004;Carter和Merchant,1997)。另外,多价形式的抗体(如双特异性分子)可有稳定性的问题。尽管双特异性抗体因其能用于人的治疗所以是所希望的,但是其生产是不可预测的。例如,双特异性抗体可导致热稳定性、产品产量的实质性减少,或导致形成低分子量聚集体。在人源化啮齿动物抗体时,也可出现Vh和Vi结构域的非天然改变。通常将啮齿动物互补决定区(CDR)移植到最相似的人胚系可变区上来进行人源化(Hurle和Gross,1994)。被选择来进行人源化的胚系不可能以高频率地被免疫系统所使用,而且为获得足够的抗原结合性经常需要改变人框架。蛋白质不稳定会产生许多问题,包括以下的一个或多个不适合在生物反应器中规模化生产(例如因为产量低,不需要的副产品(如未组装的产物和/或聚集材料)的水平显著高),蛋白质难以纯化,和不适于药物制备和使用(如,由于分解产物的水平显著高、产品质量差、和/或药物动力学性质不良)。抗体、Fab、Fv、或单《连Fv(scFv)的可变区内的不稳定性可导致这些问题中的许多问题。scFv构建体尤其已显示出稳定性、溶解性、表达、聚集、分解产物、和在细菌和哺乳动物表达系统中整体可制造性的问题(参见Worn和Pluckthun,2001)。另外,将scFv分子整合入原本稳定的重组抗体产物中,经常给新的重组设计带来这些通常不需要的特性。因此,需要预测蛋白质(如抗体)稳定性的改进方法和对于适于规模化生产的改进的稳定化抗原结合分子。也需要一些改进的方法,以规模化生产适于药物应用的稳定化的抗原结合分子群。发明简述本发明至少部分基于开发改进的多肽组合物(如改进的结合分子)和制备它们的方法,所述多肽组合物包括稳定性改善的scFv分子,或由稳定性改善的scFv分子组成。在一个方面,本发明涉及稳定化的scFv分子群,其中稳定化的scFv分子包含i)插入VH结构域和VL结构域之间的scFv接头,其中VH和VL结构域由Vn结构域中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中scFv分子的Vn和VL结构域具有大于55。C的Tm值;或ii)插入VH结构域和结构域之间的scFv接头,其中VH和VL结构域由V中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中scFv分子具有大于49°C的T50。在另一个方面,本发明涉及稳定化的scFv分子,其中稳定化的scFv分子包含i)scFv接头,其具有插入VH结构域和VL结构域之间的氨基酸序列(Gly4Ser)n,其中Vh和Vi结构域由VH氨基酸44位和VL氨基酸100位之间的二硫键连接;ii)Vn结构域和V^结构域,其中该分子具有至少一个替换,所述替换选自由如下组成的组a)在VH的Kabat13位上进行氨基酸替换;b)在VH的Kabat16位上进行氨基酸替换;c)在VL的Kabat46位上进行氨基酸替换;d)在VL的Kabat49位上进行氨基酸替换;e)在VL的Kabat50位上进行氨基酸替换;f)在VL的Kabat49和50位上进行氨基酸替换;g)在VH的Kabat101位上进行氨基酸*#换;h)在VH的Kabat20位上进行氨基酸替换;i)在VH的Kabat48位上进行氨基酸替换;j)在VL的Kabat3位上进行氨基酸替换;k)在VH的Kabat55位上进行氨基酸替换;1)在VH的Kabat67位上进行氨基酸替换;m)在VH的Kabat6位上进行氨基酸替换;n)在VH的Kabat32位上进行氨基酸替换;o)在VH的Kabat49位上进行氨基酸替换;p)在VH的Kabat43位上进行氨基酸替换;q)在VH的Kabat72位上进行氨基酸替换;r)在VH的Kabat79位上进行氨基酸替换;s)在VL的Kabat50位上进行氨基酸替换;t)在VL的Kabat75位上进行氨基酸替换;u)在VH的Kabat80位上进行氨基酸替换;v)在VH的Kabat83位上进行氨基酸替换;或iii)在scFv的VH和VL之间带有稳定界面的VH结构域和VL结构域,其中所述分子在直接位于界面内的氨基酸位置上和/或在支撑VH和VL间相互作用的氨基酸位置上具有至少一个替换,其中所述至少一个氨基酸位置选自由如下所组成的组按照Kabat编号的47H,37H,45H,46H,51H,59H,109H,14H,26H,27H,40H,69H,103H,29H,38H,44H,49H,5511,63H,54H,68H,72H,74H,7附,82bH,8H,32H,39H,41H,6211,85H,91H,24H,60H,37L,36L,44L,59L,57L,64L,46L,48L,63L,67L,68L,39L,45L,47L,54L,56L,79L,85L,98L,58L,74L,77L,83L,89L,和104L,而且其中该稳定化的scFv分子的T50大于没有经过替换的scFv分子的T50。在另一个方面,本发明涉及稳定化的scFv分子,其包含插入VH结构域和V,.结构域之间的(Gly4Ser)4scFv接头,其中Vh和VL结构域由VH中的氨基酸和Vt中的氨基酸间的二硫键连接。在另一个具体实施方式中,本发明涉及包含vh结构域和vl结构域的稳定化的scFv分子,其中该分子具有至少一组选自由如下所组成的组的替换a)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;和在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;b)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;和在VH的Kabat55位上进行氨基酸替换,例如用甘氨酸;和c)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;在VH的Kabat55位上进行氨基酸替换,例如用甘氨酸;和在VH的Kabat101位上进行氨基酸替换,例如用天冬氨酸。在另一个具体实施方式中,稳定化的scFv分子具有在热攻击条件下与常规Fab片段相等的稳定性。在一个具体实施方式中,稳定性通过测量结合靶分子的能力而测量。在一个具体实施方式中,scFv分子包含氨基酸序列,其由选自由SEQIDNO:9、14、16、和18组成的组的核苦酸序列编码。在一个具体实施方式中,scFv分子包含选自由SEQIDNO:10、15、17、和19组成的组的氨基酸序列。在另一个具体实施方式中,本发明涉及包含稳定化的scFv分子的融合蛋白。在一个具体实施方式中,融合蛋白包含至少2个抗原结合位点。在另一个方面,本发明涉及稳定化的多价抗原结合分子群,其中稳定化的结合分子包含至少一个稳定化的scFv分子,所述稳定化的scFv分子包含插入Vn结构域和Vt结构域之间的scFv接头,其中Vh和Vl結枸域由二硫键连接,所述二硫键位于V中的氨基酸和VL结构域中的氨基酸之间,而且其中稳定化的结合分子群包含单体形式的可溶蛋白,其中不超过10%以聚集形式呈现。在一个具体实施方式中,稳定化的多价抗原结合分子在CHO或NSO细胞中表达。在另一个方面,本发明涉及稳定化的多价抗原结合分子群,其中每个多价抗原结合分子包含i)至少一个scFv分子,其包含插入VH结构域和VL结构域之间的scFv接头,其中VH和VL结构域由VH中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中至少一个scFv分子的Vh和VL结构域具有大于55°C的TnW直;或ii)至少一个scFv分子,其包含插入VH结构域和Vl^结构域之间的scFv接头,其中Vh和Vl結枸域由VH中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中多价抗原结合分子的至少一个scFv分子具有大于490C的T50。在另一个具体实施方式中,本发明涉及稳定化的多价抗原结合分子,其包含i)至少一个稳定化的scFv分子,其中稳定化的scFv分子包含插入VH结构域和VL结构域之间的(Gly4Ser)nscFv接头,而且其中VH和VL结构域由二石克《建连4妄;ii)至少一个稳定化的scFv分子,其包含具有插入VH结构域和Vi结构域之间的氨基酸序列(Gly4Ser、的scFv接头,其中VH和Vi结构域由VH第44位氨基酸和VL第100位氨基酸之间的二辟^A连接;iii)至少一个稳定化的scFv分子,其中该稳定化的scFv分子包含至少一个选自由如下所组成的组的替才灸a)在VH的Kabat13位上进行氨基酸替换;b)在VH的Kabat16位上进行氨基酸替换;c)在VL的Kabat46位上进行氨基酸替换;d)在VL的Kabat49位上进行氨基酸替换;e)在VL的Kabat50位上进行氨基酸替换;0在VL的Kabat49和50位上进行氨基酸一夺换;g)在VH的Kabat101位上进行氨基酸替换;h)在VH的Kabat20位上进行氨基酸替换;i)在VH的Kabat48位上进行氨基S交替换;j)在VL的Kabat3位上进行氨基酸替换;k)在VH的Kabat55位上进行氨基酸替换;1)在VH的Kabat67位上进行氨基酸替换;m)在VH的Kabat6位上进行氨基酸替换;n)在VH的Kabat32位上进行氨基酸替换;o)在VH的Kabat49位上进行氨基酸替换;p)在VH的Kabat43位上进行氨基酸替换;q)在VH的Kabat72位上进行氨基酸替换;r)在VH的Kabat79位上进行氨基酸替换;s)在VL的Kabat50位上进行氨基酸替换;t)在VL的Kabat75位上进行氨基酸替换;u)在VH的Kabat80位上进行氨基酸替换;v)在VH的Kabat83位上进行氨基酸替换;或iv)VH结构域和VL结构域,其带有位于scFv的VH和VL之间的稳定界面,其中该分子在直接位于界面内的氨基酸位置上和/或在支撑VH和VL间相互作用的氨基酸位置上具有至少一个替换,其中该至少一个氨基酸位置选自由如下所组成的组按照Kabat编号的47H,37H,45H,46H,5IH,59H,109H,14H,26H,27H,40H,69H,103H,29H,38H,44H,49H,55H,63H,54H,68H,72H,74H,79H,82bH,8H,32H,39H,41H,62H,85H,91H,24H,60H,37L,36L,44L,59L,57L,64L,46L,48L,63L,67L,68L,39L,45L,47L,54L,56L,79L,85L,98L,58L,74L,77L,83L,89L,和104L。在另一个方面,本发明涉及稳定化的多价抗原结合分子,其包含至少一个稳定化的scFv分子,所述稳定化的scFv分子包含插入VH结构域和VL结构域之间的(Gly4Ser)4ScFv接头,其中VH和VL结构域由二硫键连接,所述二硫键位于vh中的氨基酸和Vt结构域中的氨基酸之间。ii)至少一个稳定化的scFv分子,其包含scFv接头,所述接头具有插入Vh結枸域和VL结构域之间的氨基酸序列(Gly4Ser)n,其中VH和VL结构域由二硫键连接,所述二裙^定位于VH44位氨基酸和VL100位氨基酸之间;或iii)至少一个稳定化的scFv分子,其中该稳定化的scFv分子包含至少一个选自由如下所组成的组的替换a)替换在VL的Kabat3位上的氨基酸(如,谷氨酰胺),例如用丙氨酸、丝氨酸、缬氨酸、天冬氨酸、或甘氨酸;b)替换在VL的Kabat恥位上的氨基酸(如,丝氨酸),例如用亮氨酸;c)替换在VL的Kabat49位上的氨基酸(如,丝氨酸),例如用酪氨酸或丝氨酸;d)替换在VL的Kabat50位上的氨基酸(如,丝氨酸或缬氨酸),例如用丝氨酸、苏氨酸、和精氨酸、天冬氨酸、甘氨酸、或赖氨酸;e)分别用酪氨酸和丝氨酸;酪氨酸和苏氨酸;酪氨酸和精氨酸;酪氨酸和甘氨酸;丝氨酸和精氨酸;或丝氨酸和赖氨酸替换在VL的Kabat49位上的氨基酸(如,丝氨酸)和Kabat50位上的氨基酸(如,丝氨酸);f)替换在VL的Kabat75位上的氨基酸(如,缬氨酸),例如用异亮氨酸;g)替换在VL的Kabat80位上的氨基酸(如,脯氨酸),例如用丝氨酸或甘氨酸;h)替换在VL的Kabat83位上的氨基酸(如,苯丙氨酸),例如用丝氨酸、丙氨酸、甘氨酸、或苏氨酸;i)替换在VH的Kabat6位上的氨基酸(如,谷氨酸),例如用谷氨酰胺;j)替换在VH的KabatD位上的氨基酸(如,赖氨酸),例如用谷氨酸;k)替换在VH的Kabat16位上的氨基酸(如,或谷氨酰胺;1)替换在VH的KabatZO位上的氨基酸(如,萨i义;m)替换在VH的KabatW位上的氨基酸(如,酸;n)替换在VH的Kabat"位上的氨基酸(如,酸或精氨酸;o)替换在VH的Kabat化位上的氨基酸(如,氨酸或甘氨酸;p)替换在VH的Kabat49位上的氨基酸(如,或丙氨酸;q)替换在VH的Kabat"位上的氨基酸(如,r)替换在VH的Kabat67位上的氨基酸(如,酸或亮氨酸;s)替换在VH的Kabat72位上的氨基酸(如,酸或天冬酰胺;t)替换在VH的Kabat"位上的氨基酸(如,丝氨酸),例如用谷氨酸缬氨酸),例如用异亮氨天冬酰胺),例如用丝氨谷氨酰胺),例如用赖氨曱硫氨酸),例如用异亮丝氨酸)。例如用甘氨酸缬氨酸),例如用甘氨酸;缬氨酸),例如用异亮氨谷氨酸),例如用天冬氨苯丙氨酸),例如用丝氨酸、缬氨酸、或酪氨酸;和u)替换在VH的Kabat101位上的氨基酸(如,脯氨酸),例如用天冬氨酸。在另一个方面,本发明涉及多价抗原结合分子,其包含至少一个稳定化的scFv分子,其中该稳定化的scFv分子包含至少一组选自由如下所组成的组的替换a)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;和在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;b)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;和在VH的Kabat55位上进行氨基酸替换,例如用甘氨酸;和c)在VH的Kabat16位上进行氨基酸替换,例如用谷氨酸或谷氨酰胺;在VL的Kabat46位上进行氨基酸替换,例如用赖氨酸;在VH的Kabat55位上进行氨基酸替换,例如用甘氨酸;和在VH的Kabat101位上进4于氨基酸替换,例如用天冬氨酸。在一个具体实施方式中,至少一个稳定化的scFv分子是通过基因工程与抗体融合的。在另一个具体实施方式中,两个稳定化的scFv分子是通过基因工程与抗体融合的。在一个具体实施方式中,至少一个稳定化的scFv分子是通过基因工程与抗体轻链或重链的羧基末端融合。在一个具体实施方式中,至少一个稳定化的scFv分子通过基因工程与抗体轻链或重链的氨基末端融合。在一个具体实施方式中,本发明结合分子包含至少一个结合位点,该位点结合优先在癌细胞上表达的分子。在一个具体实施方式中,本发明的scFv分子Vw结构域源自BHA10抗体。在一个具体实施方式中,本发明的scFv分子VL结构域源自BHA10抗体。在一个具体实施方式中,本发明的结合分子包含至少一个结合位点,该位点特异于选自由下列所组成的组的分子HER1,HER3,CD80,CD86,PD-l,CTLA4,B7-H4,RON,CD200,CD4,BAFR,EGFR,IGFR,VEGFR,受体TNF家族的成员,Tie受体,MET,IGFl,IGF2,TNF,TNF配体,1L-6,TWEAK,Fnl4,CD20,CD23,CRIPTO,HGF,a邻l整联蛋白,a5|31整联蛋白,a6p4整联蛋白,和aVp6整联蛋白。在一个具体实施方式中,本发明的结合分子包含至少一个结合位点,该位点结合参与调节免疫应答的分子。在一个具体实施方式中,所述分子是Fc受体。在一个具体实施方式中,本发明的结合分子包含至少一个结合位点,该位点结合参与调节血管生成的分子。在一个具体实施方式中,本发明的所述结合分子结合VEGF或血管生成素(angiopoitin)。在一个具体实施方式中,本发明的结合分子包含至少一个结合位点,该位点结合神经学上的靶。在一个具体实施方式中,本发明的结合分子是多特异性的。在一个具体实施方式中,本发明的结合分子是双特异性的。在另一个具体实施方式中,本发明的结合分子结合TNF受体家族的两个成员。在一个具体实施方式中,本发明的结合分子结合LT(3R和TrailR2。在一个具体实施方式中,本发明的结合分子包括通过基因工程方法与14A2抗体融合的BHA10scFv分子。在一个具体实施方式中,本发明的结合分子包含具有下述序列的重链,所述序列选自由SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,和SEQIDNO:55所组成的组。在一个具体实施方式中,本发明的结合分子包含编码权利要求4-8、11、12、和18-22之任一的分子的多肽的核苷酸序列。在一个具体实施方式中,本发明涉及含核苷酸序列的核酸分子,该核苷酸序列编码稳定化的scFv分子或编码含本发明的稳定化的scFv分子的结合分子。在一个具体实施方式中,核酸分子在载体中。在另一个具体实施例方式中,本发明涉及包含这种载体的宿主细胞。在一个具体实施方式中,宿主细胞是哺乳动物宿主细胞,如CHO细胞或NSO细胞。在一个具体实施方式中,本发明涉及结合分子的群体,所述结合群体含scFv分子,该群体的聚集度与表达含常规scFv分子的结合分子群体的宿主细月包相比至少j氐10%。在一个方面,本发明涉及产生稳定化的结合分子的方法,包括在能产生稳定化的结合分子的条件下培养宿主细胞。在一个具体实施方式中,每升宿主细胞培养基产生至少10mg稳定化的结合分子,而且其中以聚集形式呈现的结合分子不超过10%。在一个方面,本发明涉及治疗会受益于用本发明的结合分子治疗的受试者的方法,包括向受试者施用结合分子,以使所述治疗发生。在一个具体实施方式中,受试者患有选自由下列所组成的组的疾病或病症癌症、自身免疫性疾病或病症、和神经学上的疾病或病症。在一个方面,本发明涉及稳定化scFv分子的方法,其包括用(Gly4Ser)nscFv接头通过基因工程方法融合VH结构域和VL结构域,并基因工程化VH结构域以在44位氨基酸上包含半胱氨酸,和基因工程化VJ吉构域以在100位氨基酸上包含半胱氨酸,从而形成稳定化的scFv分子。在一个方面,本发明涉及制备包含稳定化的scFv分子的稳定化的多价抗体的方法,该方法包括通过基因工程方法将稳定化的scFv分子与抗体分子轻链或重链的氨基末端或羧基末端融合。在一个具体实施方式中,本发明涉及制备稳定化的scFv分子的方法,包括替换在scFv分子的VH/VL界面中的至少一个氨基酸和/或支撑scFv分子的VH/VL界面的至少一个氨基酸。与常失见scFv分子相比,所述一个或多个替换同时改善scFv分子VH和VL结构域的热稳定性。在又一具体实施方式中,本发明涉及制备稳定化的scFv分子的方法,包括替换在VH结构域或VL结构域中至少一个与VH和VL结构域之间界面上的两个或多个氨基酸共变(covary)的氨基酸。在又一具体实施方式中,本发明涉及制备含scFv分子的稳定化的融合蛋白分子的方法,包括替换在scFv分子的VH/VL界面中的至少一个氨基酸和/或替换在scFv分子的VH/VL支架(scaffold)中的至少一个氨基酸,并通过基因工程方法将scFv分子与多肽融合,由此制备稳定化的融合蛋白。在又一具体实施方式中,本发明涉及改善含至少一个scFv分子的多价分子的稳定性的方法,该方法包括将至少一个稳定化突变导入所述至少一个scFv分子中,由此改善多价分子的稳定性。在又一具体实施方式中,本发明涉及改善scFv分子的稳定性的方法,该方法包括将至少一个稳定化突变导入scFv分子中,由此改善scFv分子的稳定性。在又一方面,本发明涉及大规模制备稳定化的融合蛋白的方法,该方法包4舌(a)进行scFv分子的热稳定性测试以确定候选scFv分子的热稳定性;(b)将候选scFv分子的热稳定性与合适对照比较,以鉴定与对照相比热稳定性增加的稳定化scFv分子,(c)选择步骤(b)中鉴定出的稳定化的scFv分子;(d)通过基因工程方法将至少一个稳定化的scFv分子与蛋白质融合,以形成稳定化的融合蛋白;(e)用带有编码稳定化的融合蛋白的核酸分子转染哺乳动物宿主细胞,(g)在能使稳定化的融合蛋白表达的条件下培养步骤(f)的宿主细胞;其中当在10L或更大的培养基中生长时,稳定化的融合蛋白被表达后蛋白质聚集不超过10%。在又一方面,本发明涉及从含候选氨基酸序列的免疫球蛋白(Ig)超家族多肽中确定蛋白质折叠的热稳定性的方法,该方法包括以下步骤a)提供序列的辅助参考集(curatedreferenceset)的比对,所述序列与多肽的Ig4斤叠对应;b)计算比对的序列氨基酸残基之间的共变(covariation),以产生出共变数据;c)从共变数据内的共变中确定候选序列内氨基酸位置的序列位置特异性共变^平分;和d)储存或输出氨基酸位置特异性序列共变评分以作为多肽稳定性量度。在一个具体实施方式中,对于数种免疫球蛋白(Ig)超家族多肽,该方法包括至少重复步骤c)和d)。在又一具体实施方式中,基于候选序列的序列位置特异性共变评分,该方法进一步包括从数种免疫球蛋白(Ig)超家族多肽中选出用于生产的Ig超家族多肽的步骤。在另一个具体实施方式中,该方法进一步包括生产所选择的Ig超家族多肽和为治疗用途而制备它的步骤。在另一个具体实施方式中,Ig超家族多肽源自选自由下列所组成的组的蛋白质免疫球蛋白或其抗原结合片段、免疫球蛋白受体、细胞粘附蛋白、整联蛋白、过敏原、T-细胞受体、和主要组织相容性复合物(MHC)。在一个具体实施方式中,Ig超家族多肽选自由重链可变区(VH)、轻链可变区(VL)、和单链抗体(scFv)所组成的组。在另一个具体实施方式中,Ig折叠选自由V类折叠、I类折叠、Cl类折叠、和C2类折叠所组成的组。在一个具体实施方式中,辅助参考集或比对具有至少50。/。的多样性。具有小于90。/。的同一性。在另一个具体实施方式中,至少一个序列来自哺乳动物物种,而且至少一个序列来自非哺乳动物物种。在一个具体实施方式中,对于在比对的相应位置上找到的令人满意的正共变,候选序列被赋予残基位置特异性共变正评分。在一个具体实施方式中,对于在比对的相应位置上找到的令人满意的负共变,候选序列被赋予残基位置特异性共变负评分。在一个具体实施方式中,正共变的O关耳关系凄t(phiassociationcoefficient)(0))约+0.25至约+1.0。在一个具体实施方式中,负共变的(D关联系数(O)约-0.25至约-1.0。在一个具体实施方式中,比对选自由下列所组成的组基于结构的序列比对、基于序列的序列比对、和基于结构的结构比对。在一个具体实施方式中,确定比对中每个残基位置上的所有可能残基对的位置特异性共变评分。在一个具体实施方式中,比对通过如下来获得(i)由初始比对产生隐马尔可夫模型(HiddenMarkovModel,HMM);(ii)用HMM获得其他序列;和(iii)将其他序列与初始比对进行比对。在一个方面,本发明涉及计算机程序或计算机程序产品或计算机可读介质,其具有处理器可执行指令集,当执行时,所述指令集使处理器进行本发明的方法。在又一具体实施方式中,本发明涉及适用于电子设备中的计算机程序或计算机程序产品或计算机可读介质,其包括对应于本发明方法的比对的数据。在又一具体实施方式中,本发明涉及适用于电子设备中的计算机程序或计算机程序产品或计算机可读介质,其包括本发明方法的共变数据。在一个具体实施方式中,本发明涉及被安排来执行本发明方法的设备。在一个方面,本发明涉及计算设备中的系统,包括(i)初始序列收集过程;(ii)能从权利要求58-74之任一的比对中保存序列数据的储存位置(storagelocation);(iii)分析工具(analysisfacility),其程序性地分析比对内残基对之间的共变以获得共变数据;(iv)与所述电子设备有交互界面的输出设备,所述输出设备输出所述共变数据。在一个具体实施方式中,本发明涉及计算设备中的介质,其保存进行包括本发明方法任何步骤的方法的可执行步骤。在又一具体实施方式中,对残基使用频率数据的显示包括矩阵,其包括(i)对应于多肽序列的连续残基位置;和(ii)针对每个残基位置上的残基类型的残基使用频率。在又一具体实施方式中,符号化描述残基使用频率。在一个具体实施方式中,要表示所有20种天然氨基酸、缺口、和不明确的残基。在一个具体实施方式中,残基使用频率与符号大小相关。在一个具体实施方式中,残基使用频率与符号大小正相关。在一个具体实施方式中,(i)残基位置以列显示;和(ii)残基使用频率以行显示。在另一个具体实施方式中,共变残基中的共变由网络覆盖图来描述。在一个方面,本发明涉及图形用户界面(graphicaluserinterface),包括用图形显示(i)栅格布局(gridlayout),其包括多肽序列参考集的残基使用频率数据集;和(ii)共变覆盖图(covariationoverlay)。在一个具体实施方式中,界面进一步包括(iii)对感兴趣的序列的显示。在一个方面,本发明涉及产生具有改善的生物物理性质的免疫球蛋白(Ig)超家族多肽的方法,所述方法包括以下步骤a)提供对应于多肽的Ig折叠的序列辅助参考集的比对;b)计算比对的序列残基之间的共变以鉴定出共变的残基;c)替换未能满足与在比对的相应位置上找到的共变残基的共变的多肽残基。在另一个具体实施方式中,生物物理性质选自由下列所组成的组热稳定性、pH解折叠谱、糖基化的稳定去除、溶解性、生化功能、和其组合。在一个具体实施方式中,生化功能选自由蛋白质靶或化学部分的识别所组成的组,该化学部分选自由磷酸、曱基、乙酰基、脂、去污剂、金属离子、卣素、RNA、DNA、寡核苷酸、和寡核苷所组成的组。在一个具体实施方式中,ig超家族多肽源自蛋白质,所述蛋白质选自由抗体或其抗原结合片段、免疫球蛋白受体、细胞粘附蛋白、整联蛋白、过敏原、T-细胞受体、和主要组织相容性复合物(MHC)分子所组成的组。在一个具体实施方式中,lg超家族多肽选自由重链可变区(VH)、轻链可变区(VO、和单链抗体(sFv)所组成的组。在一个具体实施方式中,Ig折叠选自由V类折叠、I类折叠、Cl类折叠、和C2类折叠所组成的组。在另一个具体实施方式中,Ig超家族多肽是修饰的抗体,所述修饰的抗体选自由结构域抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体所组成的组。在一个具体实施方式中,共变的残基是选自由二硫键、盐桥、配体结合口袋或表面的一部分、和范德华网络、氢键、和/或电荷-电荷相互作用所组成的组的结构特征的一部分。在另一个具体实施方式中,本发明涉及产生具有改善的稳定性的抗体或修饰的抗体的方法,所述方法包括以下步骤a)提供经实验确认为稳定的模板抗体的高解析度结构模型;b)用结构模型鉴定模板抗体中的VH/VL界面和/或支撑界面的残基;c)用同源模型鉴定抗体或修饰的抗体中对稳定界面至关重要的相应VH/VL界面残基;和d)用来自模板蛋白质的界面残基替换抗体或修饰的抗体中的相应VH/VL界面残基。在一个具体实施方式中,模板蛋白质的界面残基掩盖(bury)该界面中至少10人2的表面区域。在一个具体实施方式中,修饰的抗体选自由单结构域抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体所组成的组。在另一个具体实施方式中,本发明涉及本发明的方法产生的多肽。在一个具体实施方式中,多肽显示出生物物理性质有改善,所述生物物理性质选自由热稳定性、pH解折叠谱、糖基化的稳定去除、溶解性、生化功能、和其组合所组成的组。在一个具体实施方式中,生化功能是配体结合亲和性或特异性。在另一个方面,本发明涉及产生含稳定化的scFv分子的文库的方法,该方法包括(a)提供对应于scFv分子可变区序列的序列参考集;(b)鉴定可变区内在参考集中相应位置上缺失或以低频率存在的氨基酸;和(c)将该信息与共变数据相组合,所述共变数据提示修饰参考集中以低频率鉴定出的氨基酸可满足可变区内现有的共变限制;和(d)用候选稳定化氨基酸替换步骤(b)的氨基酸,由此产生含稳定化的scFv分子的文库。在一个具体实施方式中,步骤(b)的氨基酸具有小于0.5的共有(concensus)评分。在另一个具体实施方式中,步骤(b)的氨基酸在参考集的序列中少于10%。在另一个具体实施方式中,步骤(b)的氨基酸是非共有残基。在一个具体实施方式中,候选的稳定化氨基酸在参考集内相应位置上被发现。在又一具体实施方式中,候选的稳定化氨基酸是共有氨基酸。在一个具体实施方式中,通过分析可变区序列的3-D结构来鉴定候选的稳定化氨基酸。在另一个具体实施方式中,通过侧链重包装计算(side-chainrepackingcalculation)来鉴定稳定化氨基酸。在又一方面,本发明涉及产生稳定化的scFv分子的方法,该方法包括(a)提供根据权利要求56的方法设计的scFv文库,(b)用热攻击试验筛选scFv文库以鉴定候选scFv分子,(c)将scFv文库的候选scFv分子的热稳定性与合适对照比较,由此,候选scFv分子的热稳定性相对于对照增加,则鉴定出作为稳定化的scFv分子的候选scFv分子。在另一个具体实施方式中,本发明涉及用本发明的方法鉴定出的稳定化的scFv分子或含本发明稳定化的scFv分子的融合蛋白。在另一个方面,本发明涉及预测候选蛋白质的稳定性的方法,所述候选蛋白质含具有候选结构域序列的氨基酸序列,该方法包括-.(a)提供氨基酸序列参考集,其对应于候选蛋白质的候选结构域序列;(b)确定在测试结构域序列内的各氨基酸位置上的残基频率以获得共有评分;和(c)用共有评分预测候选蛋白质的稳定性,其中共有评分与候选蛋白质的稳定性相关。在另一个方面,本发明涉及预测候选蛋白质的稳定性的方法,该方法包括(a)提供序列参考集,其对应于候选蛋白质的测试结构域序列;(b)确定在测试结构域序列内的各氨基酸位置上的残基频率以获得共有评分;和(c)用共有评分预测候选蛋白质的稳定性,其中共有评分与候选蛋白质的稳定性相关。在另一个具体实施方式中,本发明涉及预测候选蛋白质的稳定性的方法,该方法包才舌(a)提供序列参考集,其对应于候选蛋白质的测试结构域序列;(b)确定在测试结构域序列内的氨基酸位置上的残基频率以获得共有评分;(c)确定在参考集序列内的相应氨基酸位置上的残基频率以确定平均共有评分;(d)比较共有评分与平均共有评分以确定序列评分;和(e)用序列评分预测候选蛋白质的稳定性,其中共有评分与候选蛋白质的稳定性直接相关。在又一具体实施方式中,本发明涉及预测候选抗体或候选修饰的抗体的稳定性的方法,该方法包括(a)提供VH结构域的序列参考集,其对应于候选抗体或修饰的抗体的测试VH结构域序列;(b)确定在测试VH结构域序列内的氨基酸位置上的残基频率以获得共有评分;(c)确定在参考集序列内的相应氨基酸位置上的残基频率以确定平均共有评分;(d)比较共有评分与平均共有评分以确定序列评分;和(e)用序列评分预测候选抗体或修饰的抗体的稳定性,其中共有评分与候选抗体或修饰的抗体的稳定性直接相关。在一个具体实施方式中,参考集包含蛋白质序列,所述蛋白质序列来自带有与候选蛋白质类别相同的蛋白质折叠的蛋白质。在另一个具体实施方式中,参考集包含直系同源序列(orthologoussequence》在一个具体实施方式中,参考集包含人序列,如人VH序列,诸如同一Kabat类别的人VH序列。在一个具体实施方式中,参考集包含人VH胚系序列。在一个具体实施方式中,测试结构域序列是候选蛋白质的结构域序列的一部分。在一个具体实施方式中,确定测试序列每个位置的共有评分,以获得总共有评分,其中总共有评分与蛋白质稳定性相关。在另一个具体实施方式中,用以下公式计算总共有评分其巾等于共有序列的氨基酸位置上的共有残基频率,等于测试序列的氨基酸位置的测试残基频率,和/等于测试序列内氨基酸位置数。在一个具体实施方式中,通过比较候选蛋白质的共有评分与合适对照的共有评分,来确定蛋白质稳定性。在另一个具体实施方式中,通过比较候选蛋白质的共有评分与候选蛋白质的完美共有评分,来确定蛋白质稳定性。在又一具体实施方式中,通过比较候选蛋白质的序列评分与合适对照的序列评分,来确定稳定性。在另一个具体实施方式中,通过比较候选抗体或修饰的抗体的序列评分与合适对照的序列评分,来确定稳定性。在一个具体实施方式中,蛋白质是多结构域蛋白,而且其中靶结构域序列源自多结构域蛋白的最不稳定的结构域。在又一个具体实施方式中,蛋白质是选自由骆駝(camelid)抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体所组成的组的修饰的抗体。在另一个具体实施方式中,本发明涉及选择用于表达的候选蛋白质的方法,包括用本发明的方法确定候选蛋白质的稳定性,其中如果其共有评分或序列评分预示高稳定性,则选择该候选蛋白质用于表达。在另一个具体实施方式中,本发明涉及选择用于表达的候选蛋白质的方法,包括用本发明的方法确定候选蛋白质的稳定性,其中如果其序列位置特异性共变评分预示高稳定性,则选择该候选蛋白质用于表达。在另一个具体实施方式中,本发明涉及选择接纳体免疫球蛋白可变区测试序列以用于人源化供体抗体的方法,包括用本发明的方法确定候选序列的稳定性,其中如果其序列评分预示高稳定性,则选择该候选序列。在又一具体实施方式中,本发明涉及选择接纳体免疫球蛋白可变区测试序列以用于人源化供体抗体中的方法,该方法包括用本发明的方法确定候选序列的稳定性,其中如果其位置特异性共变评分预示高稳定性,则选择该候选序列。在另一个具体实施方式中,测试序列是人胚系序列。附图简述图1A显示了DNA序列(SEQIDNO:3),其编码含(Gly4Ser)3接头(粗体所示)的常规BHA10scFv构建体。图lB显示了常规BHA10scFv构建体的氨基酸序列(SEQIDNO:4)。图2描述了BHA10的纯化的常规Fab或scFv片段的差示扫描量热法(DSC)度量结果。图2A描述了比较BHA10常规Fab和scFv片段解折叠的DSC研究结果。图2B描述了纯化的BHA10scFv以l。C/分钟和2。C/分钟扫描率进行DSC扫描的结果。图3A描述了DNA序列(SEQIDNO:9),其编码含(Gly4Ser)3接头(粗体所示)的VH44/VL100二硫键稳定化的稳定化的BHA10scFv构建体。图3B显示了VH44/VL100二疏键稳定化的BHA10scFv构建体的氨基酸序列(SEQIDNO:10)。形成VH44/VL100二硫键的半胱氨酸残基以粗体和斜体显示。图4A描述了DNA序列(SEQIDNO:14),其编码含(Gly4Ser)4接头(粗体所示)的稳定化的BHAIOscFv。图4B显示了(Gly4Ser)4BHA10scFv构建体的氨基酸序列(SEQIDNO:15)。其注释与图4A中的相同。图5A描述了DNA序列(SEQIDNO:16),其编码含(Gly4Ser)5接头(粗体所示)的BHAIOscFv。图5B描述了(Gly4Ser)5BHA10scFv构建体的氨基酸序列(SF,QIDNO:17)。其注释与图5A中的相同。图6描述了Western印迹分析的结果,以比较常规BHAIOscFv(泳道l)和本发明的稳定化的BHAIOscFv分子(泳道2-4)的表达水平。每个样品都在还原(左栏)和非还原(右栏)的条件下电泳。图7A描述了DNA序列(SEQIDNO:18),其编码含(Gly4Ser)4接头(粗体所示)的VH44/VL100二硫键稳定化的BHA10scFv。图7B描述了VH44/VL100二硫键+(Gly4Ser)4稳定化的BHA10scFv的氨基酸序列(SEQIDNO:19)。注释与图7A中的相同。形成VH44/VL100二疏键的半胱氨酸残基以粗体和斜体显示。图8描述了热攻击试验的结果,其中比较了本发明的稳定化的BHA10scFv分子与常规BHA10scFv分子的热稳定性。在图例中显示50。/。的scFv分子保持其结合活性的温度(T50)。图9描述了用常规BHA10scFv和BHA10VH44:VL100/(Gly4Ser)4scFv进行的差示扫描量热法(DSC)分析结果。图IO显示了疏水焚光染料l-苯胺基-8-磺酸萘(l-anilino-8-naphthalinesulfonate,ANS)与常规BHAIOscFv、BHA10(Gly4Ser)4scFv、和BHAIOVH44:VL100/(Gly4Ser)4scFv结合的结果。图11描述了BHA10VH和VL结构域的残基频率分析结果。图11A罗列了BHA!OVH文库位置,其用于基于IgG可变区序列的残基频率分析而筛选。图1B罗列了BHAIOVL文库位置,其用于基于IgG可变区序列的残基频率分析而筛选。图12描述了热攻击试验的结果,其中评估了稳定化的BHAIOscFv突变对热稳定性的影响和稳定化突变的可加性(additivity)。(GS3表示(G4S)3,而GS4表示(G^)4;SS表示二硫键)。图13描述了本发明示例性的稳定化的LT(3R/TRAIL-R2双特异性抗体("Hercules"抗体)。通过融合本发明的稳定化的BHAIOscFv分子与14A2IgG抗体,形成Hercules抗体。scFv分子可融合于重链的C末端或N末端(C-Hercules或NH-Hercules),或融合于轻链的N末端(NL-Hercules)。图14示意性地描述了用于将常规的和工程化的BHAIOscFv融合于14A2重链的氨基末端(图14A)或羧基末端(图14B)的连续PCR反应。图15A描述了含信号肽(右下划线)的嵌合14A2轻链的DNA序列(SEQIDNO:28)。图15B显示了嵌合14A2轻链的氨基酸序列(SEQIDNO:29)。图16描述了常规BHAIOscFvNH-Hercules的重链的DNA序列(SEQIDNO:30)。图17描述了常规BHA10scFvNH-Hercules的重链的氨基酸序列(SEQIDNO:31)。图18描述了BHA10scFv(Gly4Ser)4NH-Hercules的重链的DNA序列(SEQIDNO:32)。图19描述了BHA10scFv(Gly4Ser)4NH-Hercules的重《连的氨基酸序列(SF々IDNO:33)。图20描述了BHA10scFvVH44:VL100N-Hercules的重链的DNA序列(SEQIDNO:34)。图21描述了BHA10scFvVH44:VL100NH-Hercules的重链的氨基酸序列(SEQIDNO:35)。图22描述了BHA10scFvVH44:VL100/(Gly4Ser)4NH-Hercules的重链的DNA序列(SEQIDNO:36)。图23描述了BHA10scFvVH44:VL100/(Gly4Ser)4NH-Hercules的重链的氨基酸序列(SEQIDNO:37)。图24描述了常规BHAIOscFvC-Hercules的重链的DNA序列(SEQIDNO:44。图25描述了常规BHAIOscFvC-Hercules的重链的氨基酸序列(SEQIDNO:45)。图26描述了BHA10scFv(Gly4Ser)4C-Hercules的重链的DNA序列(SEQIDNO:46)。图27描述了BHA10scFv(Gly4Ser)4C-Hercules的重链氨基酸序列(SEQIDNO:47)。图28描述了BHA10scFvVH44:VL100C-Hercules的重链的DNA序列(SEQIDNO:48)。图29描述了BHA10scFvVH44:VL100C-Hercules的重链的氨基酸序列(SEQIDNO:49)。图30描述了BHA10scFvVH44:VL100/(Gly4Ser)4C-Hercules的重链的DNA序列(SEQIDNO:50)。图31描述了BHA10scFvVH44:VLl00/(Gly4Ser)4C-Hercules的重链的氨基酸序列(SEQIDNO:51)。图32显示了在CHO细胞中瞬时表达的C-和NH-Hercules双特异性抗体的Western印迹分析结果。左栏是在非还原条件下分析的,而右栏是在还原条件下分析的。图33描述了ELISA结果,以评估本发明的稳定化的Hercules抗体与TRAILR2受体的结合活性。图33A描述了使用稳定化的C-Hercules抗体的结果。图33B描述了使用稳定化的NHHercules抗体的结果。"wt"是常失见NHHercules抗体。"GS4"是穂定化的NhHercules抗体,其含稳定化的(Gly4Ser)4sd。"ds"是稳定化的NHHercules抗体,其含包含VH44/VL100二硫键接头的稳定化的scFv。图34描述了ELISA结果,以评估本发明的稳定化的Hercules抗体与LT卩R受体的结合活性。图34A描述了使用稳定化的C-末端的Hercules抗体的结果。图34B描述了使用稳定化的NhHercules抗体的结果。"wt"是常规NHHercules抗体。"GS4"是稳定化的NHHercules抗体,其含稳定化的(Gly4Ser)4scFv。"ds"是穩定化的NhHercules抗体,其包含含VH44/VL100二硫键接头的稳定化的scFv。图35显示了蛋白A层析后稳定化的C-Hercules双特异性抗体的SEC分析结果。图36描述了纯化的稳定化的Hercules双特异性抗体的SDS-PAGE分析结果。图36A描述了使用NH-Hercules双特异性抗体的结果。图36B描述了使用C-Hercules双特异性抗体的结果。每个泳道上样5ug样品。结果。栏A显示了蛋白A层析后带有VH44:VL100BHA10scFv的N-Hercules的图语,而栏B是制备性SEC后的。栏C显示了蛋白A层析后带有VH44:VL00/(G4S)4BHA10scFv的N-HercuIes的图谱,而栏D是制备性SEC后的。析结果。栏A显示了蛋白A层析后带有VH44:VL100BHA10scFv的C-Hercules的图谱,而栏B是制备性SEC后的。栏C显示了蛋白A层析后带有Vn44:Vi,100/(G4S)4BHA10scFv的C-Hercules的图谱,而栏D是制备性SEC后的。图39显示了用带有VH44:VL100/(G4S)4BHA10scFv的C-Hercules和带有常规BHA10scFv的C-Hercules进行的差示扫描量热法(DSC)分析的结果。图40描述了F丄ISA结果,以评估本发明稳定化的Hercules抗体与TRAJL-R2和LT(3RIg受体的双特异性结合活性。"N-"Hercules"Cys和C-"Hercuies"Cys是Hercules抗体,其含有具有VH44/VL100二硫键的N『或C-末端的scFv。"N-"Hercules"Cys和N-"Hercules"DM,,是Hercules抗体,其含有N-或C-末端的scFv,所述scFv含VH44/VL1OO二硫键和(Gly4Ser)4接头。CBE11五聚体是带有单特异性LT(3R结合活性的对照抗体。图41描述了稳定化的N-和C-Hercules双特异性和单特异性抗体对肿瘤细胞生长的影响。图41A-41D分别描述了对WiDr肿瘤细胞、Mel80肿瘤细胞、MDA231肺瘤细胞、和HUVEC细胞的影响。图42描述了含稳定化的scFv的稳定化的双链二聚微型抗体(minibody)的示意图。示例性的微型抗体含有第一链部分和第二链部分,所述第一链部分含具有对TRAILR2抗原的结合特异性的稳定化的scFv,所述第二链部分含具有对LTPR抗原的结合特异性的稳定化的scFv。scFv中的VH和VL结构域的方向可以改变,而且各结合特异性可改变。图43描述了示例性的稳定化双特异性双链二聚四价微型抗体(稳定化的双特异性的N-scFv四价微型抗体)的示意图,其包含附在氨基末端的本发明的稳定化的scFv片段。示例性的稳定化的二价四价微型抗体含有第一链部分和第二链部分,第一链部分含两个具有TRAILR2抗原结合特异性的稳定化的scFv,所述第二链部分含两个具有LTPR抗原结合特异性的稳定化的scFv。其他构象也是可能的,例如,也可构建四价微型抗体,使每条链部分含两个具有不同特异性的稳定化的scFv片段。另一个具体实施方式中,scFv中的VH和VL结构域的方向可以改变。另一个具体实施方式中,不是所有的scFv都是稳定化的。图44描述了示例性的稳定化双特异性双链二聚四价微型抗体(稳定化的双特异性的C-scFv四价微型抗体)的示意图,其包含附在二价微型抗体羧基末端的稳定化的scFv片段。示例性的稳定化的二价四价微型抗体含有第一链部分和第二链部分,所述第一链部分含2个具有TRAILR2抗原结合特异性的稳定化的scFv,所述第二链部分含2个具有LT(3R抗原结合特异性的稳定化的scFv。其他构象也是可能的,例如,也可构建双特异性的双链二聚四价微体实施方式中,scFv中的VH和VL结构域的方向可以改变。另一个具体实施方式中,不是所有的scFv都是稳定化的。图45显示了稳定化双特异性的四链二聚双体的示意图,其含本发明稳定化的scFvs。其他构象也是可能的,例如,也可构建稳定化的双特异性的双链二聚四价微型抗体,使每个臂含带有不同特异性的稳定化的scFv片段。VH和VL结构域的方向可以改变。在另一个具体实施方式中,不是所有的scFv都是稳定化的。图46显示了稳定化的双特异性的四链二聚四价scFv抗体(稳定化的C-scFv四价抗体)的示意图,其包含附在CH3和铰链连接肽羧基末端的稳定化的scFv。scFv中的VH和VL结构域的方向可以改变。可选的是,稳定化的scFv片段可附在重链或轻链部分的氨基末端,从而分别形成Nh-scFv四价抗体或Nl-scFv四^f介^t体。图47显示了稳定化的四链四价scFvCH2结构域缺失的双特异性抗体(稳定化的C-scFv四价CH2结构域缺失的双特异性抗体)的示意图,其包含附在CH3和铰链连接肽羧基末端的稳定化的scFv。双特异性抗体的每个重链部分含有Fv区和稳定化的scFv区,所述Fv区具有TRAILR2抗原结合特异性,所述稳定化的scFv区具有LT卩R抗原结合特异性。稳定化的scFv中的VH和VL结构域的方向可以改变,而且各抗原结合特异性可以改变。在另一个具体实施方式中,不是所有的scFv都是稳定化的。图48显示了稳定化的四链四价scFvCH2结构域缺失的双特异性抗体(稳定化的HrscFv四价CH2结构域缺失的双特异性抗体)的示意图,其包含附在VH氨基末端的稳定化的scFv,并包含铰链连接肽。双特异性抗体的每个重链部分含有Fv区和稳定化的scFv区,所述Fv区具有TRAILR2抗原结合特异性,所述稳定化的scFv区具有LTpR抗原结合特异性。稳定化的scFv中的VH和VL结构域的方向可以改变,而且各抗原结合特异性可以改变。在另一个具体实施方式中,不是所有的scFv都是稳定化的。图49显示了稳定化的四链四价scFvCH2结构域缺失的双特异性抗体(稳定化的Nt-scFv四价CH2结构域缺失的双特异性抗体)的示意图,其包含附在VL氨基末端的稳定化的scFv,并包含铰链连接肽。双特异性抗体的每个重链部分含有Fv区和稳定化的scFv区,所述Fv区具有TRAILR2抗原结合特异性,所述稳定化的scFv区具有LT(3R抗原结合特异性。稳定化的scFv中的VH和VL结构域的方向可以改变,而且各抗原结合特异性可以改变。在另一个具体实施方式中,不是所有的scFv都是稳定化的。图50描述了野生型BHA10scFv(实心圓)相对含VL—S46L(图15A,空心圓)、VH—V55G(图15B,空心圓)、和VHP101D(空心圓)(图15C)稳定化突变的BHAIOscFV的T50曲线。图51描述了野生型VH-(GS)4-VL-6HisBHA10scFv(灰线)相对含VLS46L(黑线)(图51A)和VHV55G(黑线)(图51B)稳定化突变的BH10scFv的DSC曲线。图52描述了野生型VH-(GS)4-VL-6HisBHA10scFv(灰线)相对含VII—P101D的稳定化突变的BH10scFv(黑线)的DSC曲线。图53描述了野生型("WT(G4S)X3")和稳定化的突变scFv的SDS-Page分析。所有突变的scFv在N-末端的VH和C-末端的VL("(G4S)X4")之间含式(Gly4Ser)4的gly-ser连接肽。描述了每个泳道中的scFv的身份。泳道12-14含BIIA10scFv,其在VH44和VL110之间具有二硫键。(G4S)X4/二硫键稳定化的scFv用'DM'表示'双重突变体,。最后两个泳道包括设计的突变,其对二硫键连接的scFv也起稳定作用。图54A描述了野生型("VH-(GS)4-VL-6His")BHA10scFv(虚线)、VHS16r:突变的scFv(细灰线)、VLS46L突变的scFv(细黑线)、VHV55G突变的scFv(粗灰线)、和VHP101D突变的scFv(粗黑线)的DSC曲线。图54B描述了10mMANS在PBS(空心圓)中或在野生型("VH-(GS)4-VL-6His")BHA10sd'V(灰实心圓)、VHS16E突变的scFv(菱形)、VLS46L突变的scFv(方块)、VHV55G突变的scFv(倒三角形)、和VHP101D突变的scFv(三角形)存在情况下的温度依赖性荧光。穿过曲线的线是对双状态解折叠模型的拟合。图55描述了野生型和突变scFv存在的情况下15。C时的ANS荧光。每种scFv所诱导的ANS焚光相对如DSC所确定的同一scFv的VH结构域的TM而作图(图55A),而且相对由于每种scFv的解折叠转变而使ANS荧光出现的温度依赖性增加而作图(图55B)。图56描述了高浓度的稳定化的N-Hercules(XWU028;BHA10scFvVH44:VL100/(Gly4Ser)4N-Hercules;图56A)、稳定化的C-Hercules(XWU036;(BHA10scFvVH44:VL100/(Gly4Ser)4C-Hercules;图56B)和野生型BHA10抗体(图56C)在6个时间点(T二0,T^l周,丁=2周,T=l个月,T二2个月,和T二3个月)和低温(2-8。C)下的大小排阻层析(SEC)。x轴是时间(分钟),而y轴是280nm处的mAU(吸收单位)。洗脱语随着时间进程没有观察到显著的改变。图57描述了于2-8。C储存3个月前后的XWU028和XWU036的SDS-PAGE分析。栏A.样品是非还原的(被称为"NR")。针对双特异性样品,观察到预期的分子量200kDa。BHA10在其预期的分子量150kDa处出现。泳道l-4是XWU028样品。泳道5-8是XWU036样品。泳道9-10是BHA10IgG样品.栏B.样品用DTT还原(称为"Red"表示还原的)。针对还原条件下的双特异性样品,观察到预期的分子量,重链为75kDa,而轻链为25kDa。BHA10重链和轻链在还原条件下分別在其预期的50kDa和25kDa分子量处出现。泳道1、2、6、和7是XWU028样品。泳道3、4、8、和9是XWU036样品。泳道5和IO是BIIAIOIgG样品。图58描述了XWU028(栏A)和XWU036(栏B)在TM)、T二l个月、和丁=3个月时的完整质量分析。每个蛋白质都观察到多个峰,这是由于N-端连接的碳水化合物在CH2处的多水平唾液酸化造成的。双特异性的碳水化合物分布对于标准IgGl蛋白来说是典型的。图59描述了夹心ELISA测试结果,其测量了含N-末端1Iercules(XWU028;图56A)或C-末端Hercules(XWU036;图56B)的血清样品与TRAIL-R2和LT(3R受体的双特异性结合。图60描述了实验结果,该实验评估了稳定化的双特异性抗体(XWU028(菱形)和XWUO36(空心方块))、未稳定化的双特异性抗体(hCBE11(实心三角))和单独施用的单特异性抗体(hBHA10(倒三角型)和chl4A2(菱形))以及组合(空心三角)针对肿瘤异种移植物小鼠模型的相对体内活性。给药始于第13天。hCBEll相对于VC:PO.001;hBHA10相对于VC:P〈0.001;cM4A2相对于VC:P<0.01;Hercules-IIXWU028相对于VC:P〈0.001;Hercules-IIXWU028相对于hBHA10:PO.05;Hercules-IIXWU028相对于chl4A2:PO.005;Hercules-IIXWU036相对于VC:P〈0.001;Hercules-IIXWU036相对于hBHA10:PO.01;Hercules-IIXWU036相对于chl4A2:PO.05;combo相对于V.C:PO.OOl。图61描述了C-HerculesBHA10scFvVHS16E+VLS46L双特异性抗体的重链DNA序列(SEQIDNO:52)。图62描述了C-HerculesBHA10scFvVHS16E+VLS46L双特异性抗体的重链氨基酸序列(SEQIDNO:53)。图63描述了C-HerculesBHA10scFvVH44-VL100/VHS16E+VLS46L双特异性抗体的重链DNA序列(SEQIDNO:54)。图64描述了C-HerculesBHA10scFvVH44-VL100/VHS16E+VLS46L双特异性抗体的重链氨基酸序列(SEQIDNO:55)。图65描述了来自上清液的蛋白A洗脱物的大小排阻层析(SEC)分析结果,该上清液含带有稳定化的VHS16E+VLS46LBHA10scFv(XWU054)的C-1Icrcules和带有常规("WT,,)BHA10scFv的C-Hercules。图66描述了带有VHS16E+VLS46LBHA10scFv的纯化的C-末端Hercules(图66A)和带有VH44:VL100/VHS16E+VLS46LBHA10scFv的纯化的C-末端Hercules(图66B)的SDS-PAGE凝月交。图67显示了在初始蛋白A纯化步骤后,帶有VhS16E+VlS46LBHA10scFv的C-末端Hercules(图67A)和带有VH44:VL100/VHS16E+VLS46LBHA10scFv的C-末端Hercules(图67B)的分析性SEC洗脱i普。图68显示了带有VHS16E+VLS46LBHA10scFv(XWU054)的C-末端Hercules和带有vh44:VL100/VHS16E+VLS46LBHA10scFv(XWU055)的C-末端Hercules的活性的体外肿瘤细胞增殖测试结果。向MDA231(图68A)和WiDr细胞(图68B)施用抗体。这两个Hercules抗体的活性与单独或组合施用的稳定化的XWU036双特异性抗体和相应的单特异性抗体(hBHA10和chl4A2)比较。到的BIIB7IgGl的DSC解折叠曲线(实线)。DSC曲线内明显的各Fab、Ch2和ch3转换被标记,并用点线绘图。图69B描述了IgGl和IgG4型的BIIB7抗体的DSC解折叠曲线。图70描述了4种人(人源化的)IgGl抗体BIIB16、BIIB6、BIIB4和I川B1的热解折叠曲线。所有4种IgGl构建体的CH2和CH3结构域解折叠转换是相同的,而Fab解折叠转换是高度可变的。图7描述了182个人抗体可变区参照序列和各亚型共有序列的共有评分结果。a.通过针对哺乳动物vh数据库的残基频率分析获得的vh亚型序列评分。B.来自选自NCBI的参照VH序列的评分分布。根据亚型对Vh序列评分分群。C,通过针对哺乳动物V数据库的残基频率分析获得的Vk亚型共有序列评分。D.来自选自NCBI的参照vk序列的评分分布。根据亚型对v序列评分分群。图72描述了二維图,比较了18个BIIB抗体的序列评分与由DSC所测量的相应FabTM。图72A描述了BIIB1-18VH评分针对FabTm作图。每个点的身份可在表20中找到。BIIB15和BIIB16的Vh在其CDR中含不寻常的插入/缺失。BIIB15和BIIB16的结果用方块显示。BIIB18因缺乏表达而不能测量其tm,故将BIIB18的l,m人为标记为57.2。C(以与从BIIB17测量到的最低丁m相匹配)。根据其极低的序列评分和其不具有表达能力,BIIB18的Tm很可能要低得多。BIIB18的Fab结果用三角形显示。剩余的BIIB抗体vh结果用圆显示。图72B描述了针对FabTm作图的BIIB1-18VK评分。符号与图(A)所述的相同,只是评分是Vj勺。图73描述了V类、C类、和I类Ig折叠的代表性结构。图74描述了得自SCOP的V类、I类、Cl类、和C2类Ig折叠序列长度的柱状图。图75描述了C类数据集内每种残基组合所计算得到的f-值相关系数的柱状图。图76显示了NAPMAPVisualTool的输出结果,其包括在其上重叠了共变分析的那部分比对平台。平台为V区内每个位置(残基位置#)显示了包含所有氨基酸且包括缺口在内的列(残基类型)。图77描述了将Ig-折叠共变统计数据覆盖在NAPMAP模板上。感兴趣的序列显示为经过相关氨基酸的曲线。共变显示为相关共变氨基酸残基间的窄条。图78显示了来自BHAIOVL共变分析的细节,突出显示了如实施例7所述的Kabat36位上的Tyr(残基位置糾8)和在Kabat46位(残基位置#67)上的突变Ser—Leu之间的共变。图79显示了来自BHAIOVH共变分析的细节,突出显示了Kabat67位上的Val(残基位置弁100)、Kabat70位上的Thr(残基位置弁104)、和Kabat80位上的突变Met—Leu(残基位置#116)之间的冲突共变(conflictingcovariation)。图80(SEQIDNO:63)显示了含常规scFv的重链C-末端四价PRIMATIZEDp5E8抗体的单链DNA序列。图81(SEQIDNO:64)显示了含常规scFv的重链C-末端四价PRIMATIZEDp5E8抗体的氨基酸序列。图82A(SEQIDNO:65)显示了PRIMATIZED⑧p5E8轻链的单链DNA序列。信号肽序列以下划线显示。图82B(SEQIDNO:66)显示了PRIMATIZEDp5E8轻链的氨基酸序列。图83A(SEQIDNO:67)显示了常规PRIMATIZED⑧p5E8(VL/VH)scFv的单链DNA序列。信号肽序列以下划线显示。图83B(SEQIDNO:68)显示了常规PRIMATIZED⑧p5E8(VL/VH)scFv的氨基酸序列。图84A(SEQIDNO:69)显示了常规PRIMATIZED⑧p5E8(VH/VL)scFv的单链DNA序列。图84B(SEQIDNO:70)显示了常规PRIMATIZEDp5E8(VH/VL)scFv的氨基酸序列。图85描述了常规p5E8(VH/VL)scFv(实心圆)相对常规p5E8(VL/VH)scFv(空心圓)的T50曲线。图86描述了实验结果,该实验评估了稳定化的双特异性"Hercules-n"抗体(XWU036(实心圓》和单独施用的单特异性抗体(hBHA10(倒实心三角形)和chl4A2(实心菱形))以及组合施用的单特异性抗体(空心倒三角形)在人乳腺癌肿瘤异种移植物的小鼠模型(MDA-MB-23l)的相对体内活性。图87描述了对界面保持至关重要的参与共变网络的VH残基(图87A)和涉及与VH/VL界面直接接触并直接映射到VH结构域表面的界面残基(图87B)。箭头指示实际界面之外的残基位置,所述实际界面是经共变分析获知对于稳定VH/VL相互作用和VH/VL的稳定性至关重要的。装入框中的是在VH和VL间的界面上进行直接接触的高变CDR3残基的位置。图88描述了对界面保持至关重要的参与共变网络的VL残基(参见图88A)和涉及与VH/VL界面直接接触并直接映射到VL表面的界面残基(图88B)。箭头指示实际界面之外的残基位置,所述实际界面是经共变分析获知对于稳定VH/VL相互作用和VH/VL的稳定性至关重要的。装入框中的是在VH和VL间的界面上进行直接接触的高变CDR3残基的位置。图90是本发明的具体实施方式可遵循的步骤的示例性顺序的流程图,以确定作为多肽稳定性的度量所使用的序列共变评分。图91是本发明的具体实施方式可遵循的步骤的示例性顺序的流程图,以确定候选蛋白质的稳定性并使用共有评分来预测候选蛋白质的稳定性。图92是本发明的具体实施方式可遵循的步骤的示例性顺序的流程图,以确定并使用平均共有评分作为候选蛋白稳定性的度量。图93是本发明的具体实施方式可遵循的步骤的示例性系列的流程图,以使用替换的多肽残基而确定多肽的改进序列。图94A和94B显示了含S46L(VL)稳定化突变(SEQIDNO:137)和V55G(VH)稳定化突变(SEQIDNO:138)的稳定化的BHA10scFV的氨基酸序列。稳定化突变由框中的残基显示。前导序列、gly/ser连接肽、和CH1结构域分别以下划线、4且体、和在牛体残基显示。发明详述本发明至少部分基于开发稳定化的靶结合分子和制备这类稳定化的结合分子的方法,所述靶结合分子由稳定化的scFv分子组成,或包含稳定化的sc:Fv分子。另外,本发明提供了设计稳定化的蛋白质(如抗体分子)的方法。本发明的稳定化的scFv分子尤其用于产生稳定化的多特异性(如双特异性)分子。本发明的稳定化的结合分子(如多特异性结合分子)可在培养基中稳定地表达,适于大规模生产,并在体内是稳定的。本发明还至少部分基于开发稳定化的结合分子和制备这类稳定化的结合分子的方法,所述结合分子由稳定化的scFv分子组成或包含稳定化的scFv分子。另外,本发明提供了设计稳定的蛋白质和预测蛋白质(如抗体分子)稳定性的方法。进一步说明本发明前,为了方便起见,某些术语如下所述1.定义本文所用的术语"scFv分子"包括由一个轻链可变区(VL)或其部分、和一个重链可变区(VH)或其部分组成结合分子,其中每个可变区(或其部分)源自相同抗体或不同抗体。scFv分子优选包含插入VH结构域和VL结构域之间的scFv接头。scFv分子是现有已知的,并在诸如美国专利5,892,019;Ho等1989Gene77:51;Bird等1988&/e"ce242:423;Pantoliano等1991./;/0c/^脂.Wf730:10117;Milenic等1991.Cawceri^eorc/z51:6363;Takkinen等1991./Vofe/w五wg7'weer/wg4:837中有4苗述。本文所用的"scFv接头"指插入scFv的VL和VH结构域之间的部分。scFv接头优选使scFv分子保持抗原结合构型。在一个具体实施方式中,scFv接头包含scFv接头肽或由scFv接头肽組成。在某些具体实施方式中,scFv接头肽包含gly-ser连接肽或由gly-ser连接肽组成。在其它具体实施方式中,scFv接头包含二硫键。如本文所用的,术语"gly-ser连接肽"指由甘氨酸和丝氨酸残基组成的肽。示例性的gly/ser连接肽包含氨基酸序列(Gly4Ser)n。在一个具体实施方式中,n=l。在一个具体实施方式中,n=2。在另一个具体实施方式中,n=3。在优选的具体实施方式中,n=4,W(Gly4Ser)4。在另一个具体实施方式中,n=5。在又一具体实施方式中,n=6。另一个示例性的gly/ser连接肽包含氨基酸序列Ser(Gly4Ser)n。在一个具体实施方式中,n=l。在一个具体实施方式中,n=2。在优选的具体实施方式中,n=3。在另一个具体实施方式中,n=4。在另一个具体实施方式中,n=5。在又一具体实施方式中,n=6。本文所用的术语"二硫键"指两个硫原子间形成的共价键。氨基酸半胱氨酸包含能与第二个琉基形成二硫键或桥的巯基。本文所用的术语"常规scFv分子"指不是稳定化的scFv分子的scFv分子。例如,典型的常规scFv分子缺乏稳定化突变和包含由(G4S)3接头相连的VH和VL结构i或。本发明的"稳定化的scFv分子"是与常规scFv分子相比包含至少一个变化或改变从而导致scFv分子稳定化的scFv分子。如本文所用的,术语"稳定化的突变"包括赋予scFv分子和/或含所述scFv分子的较大蛋白质增高了的蛋白质稳定性(如热稳定性)的突变。在一个具体实施方式中,稳定化的突变包含用蛋白质稳定性提高的替代氨基酸(本文中的"稳定化的氨基酸")来替换去稳定化(destabilizing)氨基酸。在一个具体实施方式中,稳定化突变是其中scFv接头长度被优化的突变。在一个具体实施方式中,本发明的稳定化的scFv分子包含一个或多个氨基酸替换。例如,在一个具体实施方式中,稳定化的突变包含替换至少一个氨基酸残基,该替换导致scFv分子中VH和VL界面的稳定性增加。在一个具体实施方式中,氨基酸位于界面内。在另一个具体实施方式中,氨基酸是支持VH和VL间相互作用的氨基酸。在另一个具体实施方式中,稳定化突变包括在VH结构域或VL结构域中替换至少一个与两个或多个在VH和VL结构域间界面上的氨基酸共变的氨基酸。在另一个具体实施方式中,稳定化突变是其中导入至少一个半胱氨酸(即,工程化入一个或多个VH或VL结构域中)从而使VH和VL结构域由至少一个二石克键相连,该二硫键位于VH中的氨基酸和VL结构域中的氨基酸之间。在某些优选的具体实施方式中,本发明的稳定化的scFv分子是其中scFv接头长度被优化而且至少一个氨基酸残基被替换和/或VH和VL结构域由二硫键连接的分子,所述二硫键位于VH中的氨基酸和VL结构域中的氨基酸之间。在一个具体实施方式中,可在scFv分子中形成一个以上的本文所述的稳定化突变。在一个具体实施方式中,对scFv分子进行一个或多个稳定化突变与常规scFv分子相比同时改善了scFv分子VH和VL结构域的热稳定性。本发明的一个或多个稳定化的scFv分子的群体优选以单体可溶蛋白群体的形式表达。在一个具体实施方式中,聚集形式不超过10%。在一个具体实施方式中,群体中的稳定化的scFv分子可包含相同的稳定化突变或稳定化突变的组合。在其它具体实施方式中,群体中的各稳定化的scFv分子包含不同的稳定化突变。作为本发明主题的稳定化scFv分子可单独使用以结合靶分子,或可与另一多肽相连以形成包含稳定化的scFv分子的稳定化的结合分子。例如,本发明的结合分子可包含与第二scFv分子或非scFv分子(如提供靶结合特异性的分子,如抗体)相连的scFv分子。本文所用的术语"蛋白质稳定性"指现有技术中公认的对保持蛋白质的一个或多个物理性质以应对环境条件(如温度提高或降低)的度量。在一个具体实施方式中,物理性质是蛋白质共价结构的保持(如没有蛋白水解酶裂解、不希望的氧化或脱酰胺作用)。在另一个具体实施方式中,物理性质是蛋白质以合适的折叠状态呈现(如没有可溶或不可溶的聚集体或沉淀)。在一个具体实施方式中,蛋白质稳定性通过测试蛋白质生物物理性质来度量,例如测量热稳定性、pH解折叠谱、糖基化的稳定去除、溶解性、生化功能(如结合蛋白质(如配体、受体、抗原等)或化学部分等的能力)、和/或其组合。在另一个具体实施方式中,生化功能由相互作用的结合亲和性来证明。在一个具体实施方式中,蛋白质稳定性的量度是热稳定性,即对热攻击的抗性。稳定性可用现有已知的和/或本文所述的方法来测量。scFv分子的VL和VH结构域源自一个或多个抗体分子。本领域普通技术人员也将理解,本发明的scFv分子的可变区可被修饰,以使它们与其所来源的抗体分子在氨基酸序列上有所变化。例如,在一个具体实施方式中,可进行导致氨基酸残基保守替换或改变的核苷酸或氨基酸替换(如在CDR和/或框架残基中)。或者或另外,用现有公认的技术可对CDR氨基酸残基进行突变以优化抗原结合。本发明的结合分子保持结合抗原的能力。本文所用的术语"源自指定的蛋白质"指多肽的来源。在一个具体实施方式中,源自特定起始多肽的多肽或氨基酸序列是可变区序列(如VH或VL)或与之相关的序列(如CDR或框架区)。在一个具体实施方式中,源自特定起始多肽的氨基酸序列是不连续的。例如,在一个具体实施方式中,一、二、三、四、五、或六个CDR源自起始抗体。在一个具体实施方式中,源自特定起始多肽或氨基酸序列的多肽或氨基酸序列具有基本上与起始序列或其部分相同的氨基酸序列,其中所述部分由至少3-5个氨基酸、5-10个氨基酸、至少10-20个氨基酸、至少20-30个氨基酸、或至少30-50个氨基酸组成,或其以另外的方式被本领域普通技术人员确认为其源自起始序列。通过将一个或多个核苷酸替换、添加或缺失导入其所来源的常^见scFv分子或免疫球蛋白的核苷酸序列中,从而使一个或多个氨基酸替换、添加或缺失被导入编码的蛋白质中,由此产生编码稳定化的scFv分子或其部分的分离的核酸分子。可通过标准技术来导入突变,如定点诱变和PCR介导的诱变。在一个具体实施方式中,保守氨基酸替换在一个或多个非必需氨基酸残基处进行。"保守氨基酸替换"是其中氨基酸残基用具有相似侧链的氨基酸残基代替的替换。具有相似侧链的氨基酸残基家族在现有技术中已经有定义了,包括碱性侧链(如,赖氨酸,精氨酸,组氨酸)、酸性侧链(如,天冬氨酸,谷氨酸)、不带电荷的极性侧链(如,甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸)、非极性侧链(如,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,曱好u氨酸,色氨酸)、(3分支的侧链(如,苏氨酸,缬氨酸,异亮氨酸)和芳香族侧链(如,酪氨酸,苯丙氨酸,色氨酸,组氨酸)。因而,免疫球蛋白多肽中的氨基酸残基可用来自相同侧链家族的另一个氨基酸残基代替。在另一个具体实施方式中,一串氨基酸可用结构相似的、侧链家族成员顺序和/或组合不同的串来代替。在另一个具体实施方式中,导入突变,从而将至少一个半胱氨酸分子导入VH和VL结构域中,由此将二硫键导入scFv分子中。在另一个具体实施方式中,常规scFv分子的氨基酸可用具有相似物理(如空间)或功能性质的氨基酸来替换。替换入常规scFv分子中的氨基酸优选适合Vi7VH界面、CDR构型、和Vh和/或V^斤叠的完整性。可选的是,在另一个具体实施方式中,突变可沿着所有或部分免疫球蛋白编码序列而随机导入。本发明的稳定化的scFv分子或含稳定化的scFv分子的多肽是结合分子,即,它们结合感兴趣的靶分子(如,抗原)。本发明的稳定化的scFv分子与第二分子融合时,第二分子也可给融合蛋白带来结合特异性。本发明的结合分子由scFv分子(如,通过scFv接头连接的VH和VL结构域)组成,或包含本发明的稳定化的scFv分子。在一个具体实施方式中,本发明的结合分子是单价的,即,包含一个靶结合位点(例如在scFv分子的情况下的)。在一个具体实施方式中,本发明的结合分子是多价的,即,包含多于一个靶结合位点。在另一个具体实施方式中,结合分子包含至少两个结合位点。在一个具体实施方式中,结合分子包含两个结合位点。在一个具体实施方式中,结合分子包含三个结合位点。在另一个具体实施方式中,结合分子包含四个结合位点。在另一个具体实施方式中,结合分子包含多于四个结合位点。在一个具体实施方式中,本发明的结合分子是单体。在另一个具体实施方式中,本发明的结合分子是多聚体。例如,在一个具体实施方式中,本发明的结合分子是二聚体。在一个具体实施方式中,本发明的二聚体是同二聚体,其包含两个相同的单体亚基。在另一个具体实施方式中,本发明的二聚体是异二聚体,其包含两个不相同的单体亚基。二聚体的亚基可包含一个或多个多肽链。例如,在一个具体实施方式中,二聚体包含至少两个多肽链。在一个具体实施方式中,二聚体包含两个多肽链。在另一个具体实施方式中,二聚体包含四个多肽链(如在抗体分子的情况下)。本文所用的术语"价"指多肽中潜在的靶结合位点数。每个靶结合位点特异结合一个靶分子或靶分子上特异位点。当多肽包含一个以上的靶结合位点时,每个靶结合位点可特异结合相同或不同的分子(如可结合不同的分子(如不同的抗原),或相同分子上的不同表位)。术语"特异性,,指特异结合给定靶位(如与之发生免疫反应)的能力。多肽可以是单特异性的并包含一个或多个特异结合靶位的结合位点,或者多肽可以是多特异性的(如双特异性的或三特异性的)并包含两个或多个特异结合相同或不同靶的结合位点。特异结合性可由本发明的稳定化的scFv分子和/或与本发明的稳定化的scFv分子相连的非scFv部分带来。在一个具体实施方式中,本发明的结合分子是多特异性的。例如,在一个具体实施方式中,本发明的多特异性的结合分子是双特异性分子(如,抗体,微型抗体,结构域缺失的抗体,或融合蛋白,含至少一个稳定化的scFv分子的单结构域抗体(如,骆駝(camelid)、鲨鱼、人)),其对至少2个靶(例如一个以上的耙分子或相同靶分子上一个以上的表位)具有结合特异性。在一个具体实施方式中,多特异性分子具有至少一个结合位点,其特异针对被靶向用来减少或消除的分子和细胞上的靶分子。在另一个具体实施方式中,多特异性分子具有至少一个特异针对被靶向用来减少或消除的分子的靶结合位点和至少一个特异于药物的结合位点。在又一具体实施方式中,多特异性分子具有至少一个特异针对靶向用来减少或消除的分子的结合位点和至少一个特异于前药的结合位点。在一个具体实施方式中,多特异性的分子包括一个针对可溶分子的特异性和一个针对细胞表面分子的特异性。在另一个具体实施方式中,多特异性分子具有2个针对出现在一个或多个可溶分子上的2个靶位的结合特异性。在另一个具体实施方式中,多特异性分子具有2个针对出现在一个或多个细胞表面分子上的2个靶位(其可出现在一个或多个细胞上)的结合特异性。在一个具体实施方式中,结合分子具有至少一个靶结合位点,其特异针对介导生物效应的分子(如,其调节细胞活化(如,通过结合细胞表面受体并导致活化或抑制信号的传递或抑制来进行),其造成细胞死亡(如,通过细胞信号诱导的途径、通过补体结合或暴露于结合分子上存在的有效载荷来进行),或其调节受试者中的疾病或病症(如,通过介导或促进细胞杀伤、通过促进纤维蛋白凝块溶解或促进凝块形成、或通过调节生物可利用的物质的量(如,通过提高或减少受试者中配体(如TNF)的量)来进行)。在另一个具体实施方式中,本发明的结合分子结合至少一个靶,其诸如通过结合细胞表面受体(如TNF家族受体)将信号传递给细胞。"传递信号"其意指通过结合细胞,结合分子将对细胞表面受体的细胞外影响转换成细胞应答,如通过调节信号转导途径来进行。在一个具体实施方式中,结合分子结合至少一个靶结合位点,其特异针对被靶向用来减少或消除的分子,如细胞表面抗原或可溶抗原。在一个具体实施方式中,结合分子与靶的结合导致靶的减少或消除,如从组织或从循环中减少或消除。在另一个具体实施方式中,结合分子具有特异于能用于检测靶分子的存在的分子(如,检测污染物或诊断病况或病症)的至少一个结合位点。在又一具体实施方式中,本发明的结合分子包含至少一个将结合分子靶向于受试者中的特异位点(如,肿瘤细胞或血凝块)的结合位点。在优选的具体实施方式中,多特异性分子是四价抗体,其具有4个结合位点。四价分子可以是双特异性的,而且每个特异性都是二价的。以下提供了示例性的双特异性分子的进一步描述。本发明优选的结合分子包含源自人氨基酸序列的框架区和恒定区氨基酸序列。可是,结合多肽可包含源自另一种哺乳动物物种的框架区和/或恒定区序列。例如,含鼠序列的结合分子可适于某些应用。在一个具体实施方式中,灵长动物框架区(如非人灵长动物)、重^4部分、和/或铰链部分可包括在受试的结合分子中。在一个具体实施方式中,一个或多个鼠氨基酸可出现在结合多肽的框架区中,如,人或非人灵长动物框架氨基酸序列可包含一个或多个氨基酸回复突变,其中存在相应鼠氨基酸残基、和/或可包含一个或多个向在起始鼠抗体中没找到的不同氨基酸残基的突变。本发明的优选的结合分子比鼠抗体免疫原性低。"融合,,或嵌合蛋白包含与第二氨基酸序列相连的第一氨基酸序列,所述第二氨基酸序列在自然界中并不与第一氨基酸序列天然相连。氨基酸序列通常可存在于分开的蛋白质中,这些分开的蛋白质因融合多肽而被组合在一起,或者它们通常可存在于相同的蛋白质,但在融合多肽中被重新排列安置。例如,可通过化学合成,或通过产生并翻译多核苷酸来产生融合蛋白,在所述多核香酸中肽区域以所希望的关系被编码。术语"异源"在用于多核苷酸或多肽时,意味着该多核苷酸或多肽来源于与之进行比较的实体的基因型不同的实体。例如,异源多核苷酸或抗原可以来源于不同物种、个体的不同细胞类型,或不同个体的相同或不同细月包类型。术语"配体结合区"或"配体结合部分"用于本文是指任何天然受体(例如,细胞表面受体)或该受体的任何区域或衍生物,这些区域或衍生物保持了至少一定性质的配体结合能力,优选保持了相应天然受体的生物活性。术语"受体结合区"或"受体结合部分"用于本文是指任何天然配体或该配体的任何区域或衍生物,这些区域或衍生物保持了至少一定性质的受体结合能力,优选保持了相应天然配体的生物活性。在一实施方案中,本发明的结合分子是"抗体"或"免疫球蛋白"分子,例如天然抗体或免疫球蛋白分子(或其抗原结合片段),或者基因工程化抗体分子,它们结合抗原的方式与抗体分子类似,并包含本发明的scFv分子。本文中,术语"免疫球蛋白"包括这样的多肽,无论是否具备任何相关的特异免疫反应性,它都有组合在一起的两条重链和两条轻链。"抗体"是指那些对目标抗原(例如,肺瘤相关抗原)有明显的已知特异免疫反应活性的组合。抗体和免疫球蛋白包含轻链和重链,它们之间有或没有链间共价键。脊推动物系统的基本免疫球蛋白结构已有了较好的理解。如下文将详细讨论的,一般意义上术语"免疫球蛋白"包含可以从生物化学属性加以区别的5类不同抗体。抗体的所有五个种类均在本发明的范围内,以下讨论一般是针对免疫球蛋白分子中的IgG类。就IgG而言,免疫球蛋白包含两个相同的分子量约23,000道尔顿的轻链多肽链,和两个相同的分子量为53,000-70,000的重链。这四条链通过二石克键连接成Y形构型,其中轻链从"Y"的开口处开始,一直延续到可变区承托着重链。轻链和重链均被划分成结构和功能同源的一些区域。术语"恒定"和"可变"是就功能而言的。就此而言,轻链部分的可变区(VL)和重链部分的可变区(VH)均参与决定抗原的识别和特异性。相反地,轻链的恒定区(CL)和重链的恒定区(CH1、CH2或CH3)赋予重要的生物特性,比如分泌、经胎盘传递、Fc受体结合、补体结合等。传统上,恒定区结构域的编号随着它们离抗原结合位点或抗体的氨基端更远而增加。N末端是可变区,C末端是恒定区;CH3和CL结构域实际上分别包含重链和轻链的羧基端。对scFv分子的稳定化突变可在CDR的氨基酸中进行,和/或在scFv可变重链和/或可变轻链框架区的氨基酸中进行。本文中,术语"可变区CDR氨基酸残基"包括利用基于序列或结构的方法鉴定到的CDR或互补性决定区中的氨基酸。本文中,术语"CDR"或"互补性决定区"意味着可见于重链和轻链多肽之可变区的非连续性抗原结合部位。这些特定区域已由Kabat等(J.Biol.Chem.252,6609-6616(1977)和Sequencesofproteinofimmunologicalinterest.(1991))、Chothia等(J.Mol.Biol.196:901-917(1987))以及MacCallum等(J.Mol.Biol.262:732-745(1996))描述过,在这些文献中,定义包括了在相互之间进行比较时,氨基酸残基重叠或亚组。我们列出了涵盖以上引用的每个文献所定义的CDR的氨基酸残基进行比较。优选地,术语"CDR"是Kabat在序列比较的基础上所定义的CDR。<table>tableseeoriginaldocumentpage51</column></row><table>1残基编码按照Kabat等的系统命名法,同上2残基编码按照Chothia等的命名法,同上3残基编码按照MacCallum等的命名法,同上本文中,术语"可变区框架(FR)氨基酸残基"是指那些位于Ig链的框架区中的氨基酸。用于本文的术语"框架区"或"FR区"包括属于可变区,但不属于CDR(例如,按照Kabat对CDR的定义)的氨基酸残基。因此,可变区框架约长100-120氨基酸,但只包括CDR之外的那些氨基酸。作为重链可变区和Kabat等定义的CDR的具体例子,框架区l对应涵盖氨基酸l-30的可变区结构域;框架区2对应涵盖氨基酸36-49的可变区结构域;框架区3对应涵盖氨基酸66-94的可变区结构域;框架区4对应从氨基酸103到可变区末端的可变区结构域。轻链框架区类似地;故每个轻链可变区CDR分隔开。类似的,采用Chothia等或者McCallum等对CDR的定义,框架区被上面分别描述的CDR末端分隔开。在优选实施方案中,CDR是按照Kabat的定义。在天然抗体中,每个单体抗体中的六个CDR是短的非连续氨基酸序列,当抗体在水性环境中呈现其三维构型时,这些序列处于特异性的位置从而构成抗原结合位点。重链和轻链可变区其它部分的氨基酸序列的分子间差异小,被命名为框架区。框架区基本上采取(3-折叠构型,CDR形成连接[3折叠的一些环,在一些情况中构成(3折叠的一部分。因此,这些框架区形成了一个支架,通过链间、非共价相互作用保证六个CDR处于正确的方位。被定位的CDR所构成的抗原结合位点界定出一个与免疫反应性抗原上的表位互补的表面。这一互补表面会促进抗体与免疫反应性抗原表位的非共价结合。本领域普通技术人员可以容易地鉴定出CDR的位置。如前所示,几个免疫球蛋白类型的亚基结构和恒定区三维构型是公知的。如本文所用的,术语"VH结构域"包括免疫球蛋白重链的氨基末端可变区。如本文所用的,术语"VL结构域"包括免疫球蛋白轻链的氨基末端可变区。术语"片段"是指多肽(例如抗体或抗体链)的一部分或组成部分,其包含的氨基酸残基比完整或整个多肽要少。术语"抗原结合片段"是指免疫球蛋白或抗体的一个多肽片段,该片段能结合抗原或与完整抗体(即它所来源的完整抗体)竟争结合抗原(即,特异性结合)。本文中,术语抗体分子的"片段"包括抗体的抗原结合片段,例如,抗体轻链(VL)、抗体重链(VH)、单链抗体(scFv)、F(ab,)2片段、Fab片段、Fd片段、Fv片段和单结构域抗体片段(DAb)。可以将完整抗体或抗体链通过例如化学或酶法处理来获得所述片段,或者通过重组手段。本文中,术语"结合位点"包含多肽这样的区域,其负责选择性地与目标分子(例如,抗原、配体、受体、底物或抑制剂)结合。结合结构域包含至少一个结合位点。示范性的结合结构域包括抗体可变区、配体的受体结合区、受体的配体结合区或者酶促结构域。本发明的结合分子可利用现有已知的技术制备。在一个具体实施例方式中,本发明的多肽是"重组制备的",即利用重组DNA技术制备的。制备这类分子的示例性的技术将在以下详述。在一个具体实施方式中,本发明的结合分子是与稳定化的scFv分子融合的天然产生的抗体。在一个具体实施方式中,本发明的结合分子是与稳定化的scFv分子融合的修饰的抗体。如本文所用的,术语"修饰的抗体"包括合成形式的抗体,其已被改变从而不是天然存在的。在另一个具体实施方式中,本发明的结合分子是含至少一个scFv分子的融合蛋白。在优选的具体实施方式中,本发明的多肽不会在人中引发有害的免疫应答。在一个具体实施方式中,本发明的结合分子包含恒定区,如重链恒定区。在一个具体实施方式中,该恒定区与野生型恒定区相比是被修饰的。即,本文公开的本发明的多肽可包含对3个重链恒定结构域(CH1,CH2或CH3)之一个或多个和/或对轻链恒定区结构域(CL)进行的改变或修饰。示例性的修饰包括在一个或多个结构域中添加、缺失或替换一个或多个氨基酸。可进行这类改变,以优化效应器功能、半衰期等。本文中,术语"恶性肺瘤(malignancy)"是指非良性的肿瘤或癌症。本文中,术语"癌症"包括以不受调节或失去控制的细胞生长为特点的恶姓肿瘤(癌)。癌症的例子包括:癌、肉瘤、白血病和淋巴瘤。术语"癌症"包括原发性恶性肿瘤(例如,那些细胞没有转移到肿瘤开始的部位之外的位点)和继发性恶性/]中瘤(例如,通过转移,即肿瘤细胞迁移到肿瘤开始的部位之外的位点形成的)。本文中,术语"工程化的,,包括通过合成手段(例如,通过重组技术、体外肽合成、肽的酶法或化学偶联,或者这些技术的组合)对核酸或多肽分子进行操作。优选的,本发明的结合分子是利用这类方法制备的。本文中,术语"连接了"、"融合了"或者"融合"可以交换使用。这些术语是指通过包括化学偶联或重组这样的手段将两个以上的元件或成分联系到一起。融合的多肽优选通过基因工程融合,即利用重组DNA技术融合。"符合读框的融合"是指将两个或以上的开放阅读框(ORFs)连在一起形成一个连续的更长的ORF,连接方式保证了处于起始ORF的正确阅读框。因此,得到的重组融合蛋白是含有两个或以上片段的单个蛋白质,其中的片段对应由起始ORF编码的多肽(这些片段在自然界中通常不会连在一起)。虽然全部融合片段的阅读框被制成了连续的,这些片段可以被例如符合读框的scFv接头序列物理上或立体地分隔开。在讨论多肽时,"线性序列"或"序列"是指多肽中氨基酸的顺序处于从氨基到羧基的方向,其中序列中相邻的残基在该多肽的一级结构中是连续的。本文中,短语"因给予结合分子而受益的受试者,,包括这样一些受试者(比如哺乳动物受试者),它们因给予所述结合分子而受益,这些结合分子是用来例如检测该结合分子能识别的抗原(例如对于诊断过程而言),以及/或者受益于用该结合分子进行处理从而减少或去除这些分子能够识别的目标物。例如,在一实施方案中,受试者可能受益于减少或去除循环系统或血清中的可溶性或颗粒性分子(例如毒素或病原菌),或者受益于减少或去除表达靶分子的细胞群(例如肿瘤细胞)。正如文中更详细的描述,所述结合分子可以以非偶联的形式使用,或者偶联到例如药物、前药或表位上来使用。术语"TNF受体"或"TNF受体家族成员"指属于肿瘤坏死因子("TNF,)受体超家族的任何受体。TNF受体超家族("TNFRSF,)的成员的特征在于细胞外区,其带有两个或多个排列成半胱氨酸结的富含半胱氨酸的结构域(每个40氨基酸)(参见Dempsey等,FactorWev.(2003).14(3-4):193-209)。在结合它们的相关TNF配体后,TNF受体通过与一皮称为TRAF(TNFreceptorassociatefactors,TNF受体相关因子)的细胞质衔接子(adaptor)蛋白的直接或间接相互作用来转导信号。TRAF可诱导几种激酶级联的活化,最终导致信号转导途径如NF-kB、JNK、ERK、p38和PI3K的活化,继而调控从免疫功能和组织分化至凋亡的细胞进程。几种TNF受体家族成员的核苷酸和氨基酸序列是现有已知的,包括至少29种人基因TNFRSF1A(TNFR1,也被称为DR1,CD120a,TNF-R-Ip55,TNF-R,TNFRI,TNFAR,TNF-R55,p55TNFR,p55R,或TNFR60,GenBankGI号4507575;也可参见US5,395,760)),TNFRSFlB(CD120b,也被称为p75,TNF-R,TNF-R-II,TNFR80,TNFR2,TNF-R75,TNFBR,或p75TNFR;GenBankGI号4507577),TNFRSF3(淋巴毒素卩受体(LT卩R),也被称为TNFR2-RP,CD18,TNFR-RP,TNFCR,或TNF陽R-III;GI号4505038和20072212),TNFRSF4(OX40,也被称为ACT35,TXGP1L,或CD134抗原;GI号4507579和8926702),TNFRSF5(CD40,也被称为p50或Bp50;GI号4507581和23312371),TNFRSF6(FAS,也寻皮称为FAS-R,DcR-2,DR2,CD95,APO-l,或APT1;GenBankGI号4507583,23510421,23510423,23510425,23510427,23510429,23510431,和23510434》,TNFRSF6B(DcR3,DR3;GenBankGI号4507569,23200021,23200023,23200025,23200027,23200029,23200031,23200033,23200035,23200037,和23200039),TNFRSF7(CD27,也被称为Tp55或S152;GenBankGI号4507587),TNFRSF8(CD30,也被称为Ki-1,或D1S166E;GenBankGI号4507589和23510437),TNFRSF9(4-1-BB,也被称为CD137或ILA;GI号5730095和728738),TNFRSF10A(TRAIL-R1,也被称为DR4或Apo2;GenBankGI号21361086),TNFRSF10B(TRAIL-R2,也被称为DR5,KILLER,TRICK2A,或TRICKB;GenBankGI号22547116和22547119),TNFRSF10C(TRAIL-R3,也被称为DcRl,LIT,或TRID;GenBankGI号22547121),TNFRSF10D(TRAIL-R4,也#皮称为DcR2或TRUNDD),TNFRSF11A(RANK;GenBankGI号4507565;参见美国专利6,562,948;6,537,763;6,528,482;6,479,635;6,271,349;6,017,729),TNFRSFllB(护骨蛋白(OPG),也被称为OCIF或TR1;GI号38530116,22547122和33878056),TNFRSF12(转座链相关膜蛋白质(Translocatingchain-AssociationMembraneProtein,TRAMP),也被称为DR3,WSL-l,LARD,WSL-LR,DDR3,TR3,APO-3,Fnl4,或TWEAKR;GenBankGI号7706186;美国专利申请公开号2004/0033225A1),TNFRSF12L(DR3L),TNFRSF13B(TACI;GI号6912694),TNFRSF13C(BAFFR;GI号16445027),TNFRSF14(疱渗病毒进入调控因子(HerpesVirusEntryMediator,HVEM),也被称为ATAR,TR2,LIGHTR,或HVEA;GenBankGI号23200041,12803895,和3878821),TNFRSF16(低亲和性神经生长因子受体(Low-AffinityNerveGrowthFactorReceptor,LNGFR),也被称为神经营养素受体或p75(NTR);GenBankGI号128156和4505393),TNFRSF17(BCM,也被称为BCMA;GI号23238192),TNFRSF18(AITR,也被称为GITR;GenBankGI号4759246,23238194和23238197),TNFRSF19(Troy/Trade,也被称为TAJ;GenBankGI号23238202和23238204),TNFRSF20(RELT,也被称为FLJ14993;GI号21361873和23238200),TNFRSF21(DR6),TNFRSF22(SOBa,也被称为Tnfrh2或2810028K06Rik),和TNFRSF23(mSOB,也被称为Tnfrhl)。其他TNF家族成员包括EDAR1(外部发育异常蛋白A受体(ectodysplasinAreceptor),也被称为Downless(DL),ED3,ED5,ED1R,EDA3,EDA1R,EDA-A1R;GenBankGI号11641231;美国专利号6,355,782),XEDAR(也被称为EDA-A2R;GenBankGI号11140823);和CD39(GI号2135580和765256)。术语"TNF配体"或"TNF配体家族成员"指属于肿瘤坏死因子(TNF)超家族的配体。TNF配体结合TNF受体超家族的不同受体,并相互显示出15-25%的氨基酸序列同源性(Gaur等,所oc/^附./^amzaco/.(2003),66(8):1403-8)。几种TNF受体(配体)超家族("TNFSF")成员的核苷酸和氨基酸序列是现有已知的,包括至少16种人基因TNFSFl(也被称为淋巴毒素-ct(LTA),TNF)3或LT,GINo.:34444和6806893),TNFSF2(也被称为TNF,TNFot,或DIF;GI号25952111),TNFSF3(也被称为淋巴毒素-f3(LTB),TNFC,或p33),TNFSF4(也被称为OX-40L,gp34,CD134L,或tax转录活化的糖蛋白1(tax-transcriptionallyactivatedglycoprotein1),34kD(TXGPl);GI号4507603),TNFSF5(也被称为CD40LG,IMD3,HIGM1,CD40L,hCD40L,TRAP,CD154,或gp39;GI号4557433),TNFSF6(也被称为FasL或APT1LG1;GenBankGI号4557329),TNFSF7(也被称为CD70,CD27L,或CD27LG;GI号4507605),TNFSF8(也被称为CD30LG,CD30L,或CD153;GI号4507607),TNFSF9(也被称为4-1BB-L或ILA配体;GI号4507609),TNFSF10(也被称为TRAIL,Apo-2L,或TL2;GI号4507593),TNFSF11(也被称为TRANCE,RANKL,OPGL,或ODF;GI号4507595和14790152),TNFSF12(也被称为Fnl4L,TWEAK,DR3LG,或AP03L;GI号4507597和23510441),TNFSF13(也被称为APRIL),TNFSF14(也被称为LIGHT,LTg,或HVEM-L;GI号25952144和25952147),TNFSF15(也^L称为TL1或VEGI),或TNFSF16(也被称为AITRL,TL6,hGITRL,或GITRL;GI号4827034)。其他TNF配体家族成员包括EDAR1和XEDAR配体(ED1;GI号4503449;Monreal等(1998)爿wJ/fwmGem/.63:380),Troy/Trade配体,BAFF(也被称为TALL1;GI号5730097),和NGF配体(如NGF-(GI号4505391),NGF-2/NTF3;GI号4505469),NTF5(GI号5453808)),BDNF(GI号25306267,25306235,25306253,25306257,25306261,25306264;IFRD1(GI号4504607》。术语"Tm",也被称为"转换温度",是50%的大分子(如结合分子)被变性的温度,而且被认为是描述蛋白质热稳定性的标准参数。本文所用的术语"支持残基(scaffoldingresidue)"指不在界面(如VH/VL界面)中但对于保持界面至关重要的氨基酸残基或残基位置。这些氨基酸残基并不在物理上与在相对结构域上的界面残基相互作用或为界面提供表面区域,但对为界面残基提供正确的结构关系来说是至关重要的。这类氨基酸残基支持了VH和VL间的相互作用。候选多肽序列内通常一起出现的两个或多个氨基酸残基位置被称为"共变"("共变残基位置"或"共变的残基位置")。当在第一氨基酸位置上发现的氨基酸的类型依赖于在另一氨基酸位置上发现的氨基酸的类型的时候,就观察到了两个或多个氨基酸位置间的共变。即,当一个特定氨基酸在序列内第一个位置上被发现时,第二个特定的氨基酸通常在序列内第二个位置上被发现。本文所用的术语"Ig折叠"包括蛋白质的免疫球蛋白超家族的蛋白质中的蛋白质结构域。现有公知的是,Ig折叠是免疫球蛋白超家族的独特特征(如参见,Bork,P.,Holm,L.&Sander,C,1994.TheImmunoglobulinFold.乂Mo/,肌o/.242,309-320)。每类Ig折叠的有代表性的结构如图73中所描述的。lI.稳定化的scFv分子在一个具体实施方式中,本发明的结合分子是稳定化的scFv分子。本发明的稳定化的scFv分子可包含插入Vh結构域和VJ吉构域之间的scFv接头,其中VH和VJ吉构域由VH中的氨基酸和Vt结构域中的氨基酸之间的二疏键连接。在其它具体实施方式中,本发明的稳定化的scFv分子包含scFv接头,其具有优化的长度或组成。在另外其他的具体实施方式中,本发明的稳定化的scFv分子包含具有至少一个稳定化的氨基酸替换的VH或Vt结构域。在又一具体实施方式中,本发明的稳定化的scFv分子包含至少两个以上所列的稳定化特征。本发明的稳定化的scFv分子具有改进的稳定性。在一个具体实施方式中,本发明的稳定化的scFv分子或含该分子的多肽的群体被以单体可溶蛋白的形式表达,其中二聚、四聚、或其他聚集形式不多于10%。在另一个具体实施方式中,本发明的稳定化的scFv分子群体具有大于55。C的Tm值的VH和VL结构域。在另一个具体实施方式中,本发明的稳定化的scFv分子群体具有大于49。C的T50。在另一个具体实施方式中,本发明的稳定化的scFv分子群体具有大于40、41、42、43、44、45、46、47、或48。C的T50。在又一具体实施方式中,本发明的稳定化的scFv分子群具有大于50、51、52、53、54、55、56、57、58、或49。C的T50。本发明的scFv分子结合感兴趣的靶分子。用于制备scFv的VH和VL结构域可源自相同或不同的抗体。在另一个具体实施方式中,用于本发明的稳定化的scFv中的VH或VL可包含结合感兴趣的靶的一个或多个CDR,而VH或VL结构域的剩余部分源自不同的抗体或是合成的。在优选的具体实施方式中,本发明的结合分子包含抗体(如现有已知的抗体)的至少一个CDR以结合感兴趣的靶。在另一个具体实施方式中,本发明的结合分子包含给定抗体的至少2个CDR。在另一个具体实施方式中,本发明的结合分子包含给定抗体的至少3个CDR。在另一个具体实施方式中,本发明的结合分子包含给定抗体的至少4个CDR。在另一个具体实施方式中,本发明的结合分子包含给定抗体的至少5个CDR。在另一个具体实施方式中,本发明的结合分子包含给定抗体的至少6个CDR。在优选的具体实施方式中,本发明的结合分子包含抗体(如现有已知的抗体)的至少一个VH结构域以结合感兴趣的靶。在优选的具体实施方式中,本发明的结合分子包含给定抗体的至少一个VL结构域。在另一个优选的具体实施方式中,本发明的结合分子包含现有已知抗体的至少一个VH结构域和一个VL结构域以结合感兴趣的靶。scFv分子可以VH-接头-VL方向或VL-接头-VH方向构建。本发明的scFv分子或包括它们的融合蛋白的稳定性可参照常规(非稳定化的)scFv分子或含常规scFv分子的结合分子的生物物理性质(如,热稳定性)来评估。在一个具体实施方式中,本发明的结合分子具有比对照结合分子(如常规scFv分子)高大约O丄约0.25、约0.5、约0.75、约l、约1.25、约1.5、约1.75、约2、约3、约4、约5、约6、约7、约8、约9、或约10摄氏度的热稳定性。本发明的稳定化的scFv分子包括用本发明下文第VIII节所述方法而鉴定出的那些。在其它具体实施方式中,本发明的稳定化的scFv分子包含具有优化的长度和/或氨基酸组成的scFv接头。本发明优选的scFv接头相对于常规结合分子改进本发明结合分子的热稳定性至少约2。C或3。C。在一个具体实施方式中,本发明的结合分子相对于常规结合分子具有rc的改进的热稳定性。在另一个具体实施方式中,本发明的结合分子对于常规结合分子具有2。C的改进的热稳定性。在另一个具体实施方式中,本发明的结合分子对于常规结合分子具有4、5、6。C的改进的热稳定性。例如,可在本发明的scFv分子和用现有技术方法制备的scFv分子之间、或在由scFvVH和VL衍生的抗体scFv分子和fab片段之间进行比较。可用现有已知的方法测量热稳定性。例如,在一个具体实施方式中,可测量Tm。以下将更详细地讨"i仑测量Tm的方法和确定蛋白质稳定性的其它方法。在一个具体实施方式中,scFv接头由氨基酸序列(Gly4Ser)4组成或包含(Gly4Ser)4序列。其他示例性的接头包含(Gly4Ser)3和(Gly4Ser)5序列或由(Gly4Ser)3和(Gly4Ser)s序列组成。本发明的scFv接头长度可以改变。在一个具体实施方式中,本发明的scFv接头长度从约5至约50个氨基酸。在另一个具体实施方式中,本发明的scFv接头长度从约10至约40个氨基酸。在另一个具体实施方式中,本发明的scFv接头长度从约15至约30个氨基酸。在另一个具体实施方式中,本发明的scFv接头长度从约17至约28个氨基酸。在另一个具体实施方式中,本发明的scFv接头长度从约19至约26个氨基酸。在另一个具体实施方式中,本发明的scFv接头长度从约21至约24个氨基酸。可用现有已知的技术将scFv接头导入多肽序列中。例如,在一个具体实施方式中,可用PCR突变。可通过DNA序列分析来确认修饰。可用质粒DNA转化宿主细胞来稳定生产所产生的多肽。在某些具体实施方式中,本发明的稳定化的scFv分子包含至少一个二硫键,其将VL结构域中的氨基酸与VH结构域中的氨基酸连接。半胱氨酸残基对于提供二硫键来说是必需的。二硫键可包括在本发明的scFv分子中,如用以连接VL的FR4和VH的FR2,或用以连接VL的FR2和VH的FR4。示例性的二好^定合位置包括Kabat编号的VH43,44,45,46,47,103,104,105,和106,和VL的42,43,44,45,46,98,99,100,和IOI。示例性的突变成半胱氨酸残基的氨基酸位置组合包括VH44-VL100,VH105-VL43,VH105-VL42,VH44-VL101,VH106画VL43,VH104-VL43,VH44-VL99,VH45-VL98,VH46-VL98,VH103-VL43,VH103-VL44,和VH103-VL45。在一个具体实施方式中,二石危键连接VH44位上的氛基酸和Vl100位上的氨基酸。修饰编码VH和VL结构域的基因可利用现有已知的技术(例如,定点诱变)来实现。在一个具体实施方式中,本发明的稳定化的scFv分子包含scFv接头,其具有插入VH结构域和Vt结构域之间的氨基酸序列(Gly4Ser)4,其中Vh和V^结构域由VH44位上的氨基酸和V^IOO位上的氨基酸之间的二硫键连接。在其它具体实施方式中,本发明的稳定化的scFv分子在scFv可变区(VH或VL)内包含一个或多个稳定化突变。在一个具体实施方式中,稳定化突变选自由以下所组成的组a)替换在VL的Kabat3位上的氨基酸(如谷氨酰胺),例如用丙氨酸、丝氨酸、缬氨酸、天冬氨酸、或甘氨酸;b)替换在VL的Kabat46位上的氨基酸(如丝氨酸),例如用亮氨酸;c)替换在VL的Kabat49位上的氨基酸(如丝氨酸),例如用酪氨酸或丝氨酸;d)替换在VL的Kabat50位上的氨基酸(如丝氨酸或缬氨酸),例如用丝氨酸、苏氨酸、和精氨酸、天冬氨酸、甘氨酸、或赖氨酸;e)分别用酪氨酸和丝氨酸;酪氨酸和苏氨酸;酪氨酸和精氨酸;酪氨酸和甘氨酸;丝氨酸和精氨酸;或丝氨酸和赖氨酸替换在VL的Kabat49位上的氨基酸(如丝氨酸)和在Kabat50位上的氨基酸(如丝氨酸);f)替换在VL的Kabat75位上的氨基酸(如,缬氨酸),例如用异亮氨酸;g)替换在VL的Kabat80位上的氨基酸(如,脯氨酸),例如用丝氨酸或甘氨酸;h)替换在VL的Kabat83位上的氨基酸(如苯丙氨酸),例如用丝氨酸、丙氨酸、甘氨酸、或苏氨酸;i)替换在VH的Kabat6位上的氨基酸(如谷氨酸),例如用谷氨酰胺;j)替换在VH的Kabat13位上的氨基酸(如赖氨酸),例如用谷氨酸;k)替换在VH的Kabat16位上的氨基酸(如丝氨酸),例如用谷氨酸或谷氨酰胺;1)替换在VH的Kabat20位上的氨基酸(如缬氨酸),例如用异亮氨酸;m)替换在VH的Kabat32位上的氨基酸(如天冬酰胺)。例如用丝氨酸;n)替换在VH的Kabat43位上的氨基酸(如谷氨酰胺),例如用赖氨酸或精氨酸;o)替换在VH的Kabat48位上的氨基酸(如曱硫氨酸),例如用异亮氨酸或甘氨酸;p)替换在VH的Kabat49位上的氨基酸(如丝氨酸),例如用甘氨酸或丙氨酸;q)替换在VH的Kabat55位上的氨基酸(如缬氨酸),例如用甘氨酸;r)替换在VH的Kabat67个位上的氨基酸(如缬氨酸),例如用异亮氨酸或亮氨酸;s)替换在VH的Kabat72位上的氨基酸(如谷氨酸),例如用天冬氨酸或天冬酰胺;t)替换在VH的Kabat79位上的氨基酸(如苯丙氨酸),例如用丝氨酸、缬氨酸、或酪氨酸;和u)替换在VH的Kabat101位上的氨基酸(如脯氨酸),例如用天冬氨酸。v)在示例性的具体实施方式中,本发明的稳定化的scFv分子包含以上a)至u)中所述的两个或多个稳定化突变。在示例性的具体实施方式中,本发明的稳定化的scFv分子包括例如用酪氨酸或丝氨酸在VLKabat49位上进行氨基酸替换、和例如用苏氨酸、和精氨酸、天冬氨酸、甘氨酸、或赖氨酸在VLKabat50位上进行氨基酸替换。在另一个示例性的具体实施方式中,本发明的稳定化的scFv分子包括例如用谷氨酸或谷氨酰胺在VH的Kabat16位上进行氨基酸替换和例如用赖氨酸在VL的Kabat46位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用谷氨酸或谷氨酰胺在VH的Kabat16位上进行氨基酸替换;例如用赖氨酸在VL的Kabat46位上进行氨基酸替换;和例如用甘氨酸在VH的Kabat55位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用谷氨酸或谷氨酰胺在VH的Kabat16位上进行氨基酸替换;例如用赖氨酸在VL的Kabat46位上进行氨基酸替换;例如用甘氨酸在VH的Kabat55位上进行氨基酸替换;和例如用天冬氨酸在VH的KabatIOI位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用谷氨酰胺在VH的Kabat6位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用谷氨酸在VHKabat13位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用谷氨酸或谷氨酰胺在VH的Kabat16位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用异亮氨酸在VH的Kabat20位上进行氨基酸替换;在另一个具体实施方式中,本发明的结合分子包括例如用丝氨酸在VHKabat32位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用赖氨酸或精氨酸在VHKabat43位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用异亮氨酸或甘氨酸在VHKabat48位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用甘氨酸或丙氨酸在VHKabat49位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用甘氨酸在VH的Kabat55位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用异亮氨酸或亮氨酸在VIIKabat67位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用天冬氨酸或天冬酰胺在VHKabat72位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用丝氨酸、缬氨酸、或酪氨酸在VHKabat79位上进行氨基酸替换。在另一个具体实施方式中,本发明的结合分子包括例如用天冬氨酸在VH的KabatIOI位上进行氨基酸替换。在另一个示例性的具体实施方式中,本发明的稳定化的scFv分子包含一个或多个本文所述的稳定化的氨基酸替换和具有优化长度或组成的scFv接头(例如(Gly4Ser)4)。在另一个示例性的具体实施方式中,本发明的稳定化的scFv分子包含一个或多个本文所述的氨基酸替换和连接VL结构域中的氨基酸和VH结构域中的氨基酸(例如VH44-VL100)的二硫键。在另外一个示例性的具体实施方式中,本发明的稳定化的scFv分子包含一个或多个本文所述的氨基酸替换、具有优化长度或组成的scFv接头(例如(Gly4Ser)4)、和连接VL结构域中的氨基酸和VH结构域中的氨基酸(例如VH44-VL100)的二硫键。稳定化的scFv分子可用现有公认的技术来表达。例如,在一个具体实施方式中,这类分子可用适于在细胞表达系统(例如细菌或哺乳动物表达系统)中表达的表达载体来表达。在一个具体实施方式中,scFv分子可在大肠杆菌中表达,例如用适于周质表达的载体进行。可包括额外的序列以优化表达,例如信号序列和/或标签来方便纯化和/或4全测scFv。在一个具体实施方式中,可加入添加剂(例如1-2°/。三硝基甲苯(例如,三硝基曱苯x-1OO)或1-2%甘氨酸或其组合(例如,1%甘氨酸和1%三硝基曱苯))以方便从周质分泌入培养基中。ni.预测/确定蛋白质稳定性的方法在某些方面,本发明提供了预先预测涉及为大规模表达而选择的蛋白质(例如治疗性蛋白质或工业用酶)的潜在的生物物理问题的方法。在某些示例性的方面,本发明的方法能使所属领域技术人员避免表达那些预计在重在可选的方面,可利用本发明的方法鉴定预计具有改进的生物物理性质的蛋白质序列变体,包括但不限于改进的稳定性(针对pH变化的改进的稳定性)和增强的生化功能。在某些方面,本发明提供了基于候选蛋白质多肽序列(例如氨基酸序列)预测候选蛋白质、或其序列变体或同源体生物物理性质(例如热稳定性)的计算方法。在其他方面,本发明的方法利用结构建模来预测候选蛋白质的稳定性或鉴定带有已知示例性的稳定性、可用于改善候选蛋白质(例如scFv分子)的稳定性的候选蛋白质变体或同源体。a.共变分析在某些示例性的方面,本发明提供了被称为"共变分析"的预测生物物理性质(例如蛋白质稳定性)的改进的计算方法。如本文所用的,"共变分析"指鉴定候选多肽序列内在候选序列同源体中通常一起出现、或共变的两个或多个氨基酸残基位置(本文中的"共变残基位置"或"共变的残基位置")的计算方法。当在第一氨基酸位置上发现的氨基酸的类型依赖于在另一氨基酸位置上发现的氨基酸的类型的时候,就观察到了两个或多个氨基酸位置间的共变。即,当一个特定氨基酸在序列内第一个位置上被发现时,第二个特定的氨基酸通常在序列内第二个位置上被发现。由于共变的残基可能协同进化,观察到共变表明位于通常共变的位置上的氨基酸残基的相容性可能对于功能或结构因素来说是至关重要的。因此,本发明的共变方法可用于鉴定多肽序列(例如候选i肽序列)内一个或多个共变残基或残基组(例如共变的残基对)。如本文所用的,"共变残基"(也被称为"连锁的残基")是在多肽序列内共变的残基位置上有统计学优势的氨基酸。在某些具体实施方式中,本发明的共变方法可用于鉴定候选序列中重要的功能性残基。而且,由于候选多肽内共变的残基数据可预计其是否稳定,因此本发明的共变方法可用于预测候选蛋白质的稳定性。在其他某些具体实施方式中,本发明的共变方法可用于指导成功的蛋白质设计。在一个示例性的具体实施方式中,本发明的共变方法可用于鉴定候选序列内的共变氨基酸。如果存在,则在随后进行蛋白质序列工程化时优选保留共变的残基。在另一个示例性的具体实施方式中,本发明的共变方法可用于鉴定候选多肽序列内非共变残基的氨基酸位置,其中在其他蛋白质(例如对应于参考集序列的蛋白质)中的相应氨基酸通常是共变的氨基酸。一旦鉴定出,则可用相应共变的残基替换非共变的残基(例如用重组DNA方法)从而增强功能或改善候选多肽序列的生物物理性质(例如稳定性)。共变的残基位置可通过相关多肽序列数据库(例如比对的参考集或多个序列比对)内残基位置的统计分析(例如相关性分析)来鉴定。在优选的具体实施方式中,共变分析涉及统计学比较候选多肽序列与具有相同结构性折叠(例如Ig折叠)的多种多肽序列的辅助(curated)数据库。在本文所述的新的共变分析中,进行以下基本步骤以预测候选多肽的稳定性1.提供对应于候选多肽或结构域或其部分的序列(本文中的"测试结构域序列")的同源序列集(本文中的"参考集")。2.比对参考集序列以产生同源序列的比对集(本文中的"比对集)。3.确定参考集内两个或多个残基位置(例如至少一对氨基酸)之间的共变以产生共变数据或共变数据集("共变数据集,,)。4.利用共变数据预测候选多肽的稳定性。,嚴/:提供^孝桌本发明的共变方法利用了序列集("参考集"),其与感兴趣的序列或"测试序列"同源(即有亲缘关系的)。参考集可包含与测试序列具有中至高度的相似性的同源序列集。在某些具体实施方式中,参考集的同源序列具有中至高度的氨基酸序列相似性。在更优选的具体实施方式中,参考集的同源序列具有中至高度的结构相似性。在更加优选的具体实施方式中,参考集的同源序列具有高度的结构相似性。(例如它们共有至少一个蛋白质结构域或折叠)。同源序列集无需大,只要能得到适度无偏好的选择就行。在示例性的具体实施方式中,本发明的共变方法使用了辅助参考集(curatedreferenceset)。如本文所用的,术语"辅助参考集"指其中作为组成成分的序列根据一定的选择标准而被缺失或额外序列被添加的参考集。因此,库由有偏好的选择而产生。例如,可以对同源序列的参考集进行挑选以去除某些序列,例如冗余序列。可选的是,可扩展辅助数据库,例如使之包括合适数量的非冗余序列或非同一序列。在某些具体实施方式中,辅助数据库包含至少100个序列(例如100、150、200、250、300、400、500、750、或更多个序列)。在一个具体实施方式中,辅助数据库包含至少1000个序列(例如1000、2000、3000、4000、5000、6000、7000、8000、卯00、或更多个序列)。在另一个具体实施方式中,辅助数据库包含至少一万个序列(例如IO,000、20,000、50,000、100,000、250,000、500,000、750,000或更多个序列)。在一个具体实施方式中,辅助数据库包含至少l百万个独立的序列(例如l百万、2百万、5百万、l千万,或更多个序列)。.在优选的具体实施方式中,本发明的共变方法使用了具有至少50%的多样性(例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%的多样性、至少97%、至少98%、至少99%或更大的多样性)的辅助参考集,从而使人为的或不能提供有益信息的共变最小化。如本文所用的,术语"%多样性,,指参考集中非冗余或非同一序列的百分比。如本文所用的,术语"非冗余,,指与参考集中其他每一个序列有小于100%的序列同一性的序列,即与参考集中其他每一个序列至少有一个氨基酸区别的序列。在某些具体实施方式中,参考集的序列与参考集中其他每一个序列有小于"°/。、小于95%、小于90%、或小于85%的序列同一性。在优选的具体实施方式中,参考集的序列与参考集中其他每一个序列有小于80%的序列同一性(例如小于75%、小于70%、小于65%、小于60%、或小于50%的序列同一性)。在尤其优选的具体实施方式中,参考集的每一个序列与参考集中其他每一个序列有小于80%的序列同一性。在示例性的具体实施方式中,利用挑选含较常见的序列类型的序列的过滤工具(例如,Henikoff分拣工具),帮助参考集的序列得到优选的多样性。当两个序列等长,通过Henikoff权重进行的分拣确保带有罕见残基类型的序列被保留,而带有较常见残基类型的序列被弃去(Henikoff等,/Mo/.所o/.,243:574-578(1994》。在其他优选的具体实施方式中,参考集包含在进化上与数据库中编码其他序列的基因不相近的基因所编码的序列。例如,为了增加多样性,参考集可包含一个或多个直系同源序列,其为来自不同物种(例如不同的哺乳动物物种)、但具有相同或相似的生化功能的序列。在一个示例性的具体实施方式中,参考集可包含一个人类序列和至少一个非人序列(例如非人哺乳动物序列)。在另一个示例性的具体实施方式中,参考集可包含哺乳动物物种(例如人、黑猩猩、狗、奶牛、猪、猫、大鼠、或小鼠)的至少一个序列和非哺乳动物的至少一个序列(例如非哺乳动物的脊推动物序列(例如,硬骨鱼或鸟类序列)、无脊推动物序列(例如昆虫(例如果蝇)或线虫(例如C.elegans)序列)、或真菌、植物、细菌、或病毒序列)。在其它具体实施方式中,参考集可包含一个或多个旁系同源序列,其是来自与第一序列相同物种、但具有相同或相似的生化功能的序列。在另外其他的具体实施方式中,参考集的序列大于某个阈值长度。参考集的序列长度优选有至少20个残基(例如长度有25、30、或40个残基)。参考集的序列长度更优选有至少50个残基(例如长度有60、65、70、75、80、85、90、或95个残基)。更加优选的是序列长度有至少100个残基(例如长度有110、120、130、140、150、160、170、180、或更多的残基)。在示例性的具体实施方式中,利用过滤工具(例如非缺口残基计数),帮助参考集的序列得到优选的长度。通过减少非缺口残基计数而得的等级排列确保了较短的序列(例如有缺口的序列)从较长的序列中过滤出去。通过对现有已知的任何序列数据库(例如NCBI、TIGR数据库)基于序列同源性进行检索,可得到序列。在示例性的具体实施方式中,可对测试序列进行带有默认参数的标准BLAST检索以提取出感兴趣的同源序列。同测试序列相比具有最小百分比的序列同一性(例如大于25%、30%、35%、40%、45%或50%的序列同一性,优选大于30%的序列同一性)的序列可被选入参考集中。在某些优选的具体实施方式中,对参考集进行帮助(curate),使其包含来自具有同类蛋白质折叠的蛋白质(例如,具有SH3、TPR、GPCR、丝氨酸蛋白酶、天冬氨酰蛋白酶、球蛋白、免疫球蛋白、或其他折叠的蛋白质)的序列。通过现有已知的生物信息学技术(例如,用国家卫生研究所的保守结构域数据库(CDD)基于结构进行检索,或通过用所需的SCOP分类检索ASTRAL数据库或RCSB蛋白质数据库(proteindatabase,PDB》,可鉴定并收集这类蛋白质或结构。序列优选源自其三维结构用诸如X射线结晶学而以高解析度解析的蛋白质。在优选的具体实施方式中,用现有公认的技术过滤对应于所收集的结构的序列,从而去除错误分类的、不完整的、冗余的、或结构域交换的结构。在一个具体实施方式中,直观地检查结构(例如,用SwissPDB阅读程序),以;险查相应序列中由于未解决的密度(unresolveddensity)或结构域交换而造成的中断。从结构的相应集合中手工去除不完美结构的蛋白质数据库文件。在另一个具体实施方式中,过滤对应于所收集的结构的序列(例如FASTA序列),从而去除任何100%相同的序列、或剩余序列的完美匹配的子串(substring)。在另外其他的具体实施方式中,从结构数据集里挑选带有异常长或短的氨基酸序列(错误结构分类的标志)的蛋白质数据库结构。例如,通过检测参考集序列的所有序列长度的柱状图,可确定长度截止标准。在其他的具体实施方式中,直观地(例如用SwissPDB阅读程序)检查结构中的错误折叠。不符合蛋白质折叠的标准拓朴结构的任何结构优选被弃去。在示例性的具体实施方式中,辅助参考集包含对应于属于蛋白质的免疫球蛋白超家族的蛋白质的免疫球蛋白型折叠("Ig折叠")的序列。现有公知的是,Ig折叠是免疫球蛋白超家族的独特特点(例如参见Bork,P.,Holm,L.&Sander,C.1994.TheImmunoglobulinFold.JA^/.S/o/.242,309-320)。lg折叠通常在哺乳动物蛋白质中出现并用作各种功能一一尤其是蛋白质-蛋白质相互作用的平台。例如,所有免疫球蛋白和大多数免疫球蛋白受体包括多个Ig-折叠结构域。Ig折叠可再划分为几个亚家族,包括C1、C2、I、和V。尽管所有亚家族的成员都包含2个P折叠拓朴结构,但是这些亚家族的区别在于每个折叠上的P-链数不同和P-折叠间的连接不同(例如参见,AFWilliams,/wm丽o/ogy7btfo;/,8,(1987》。每类Ig折叠的有代表性的结构在图73中有描述。在一个具体实施方式中,参考集包含免疫球蛋白超家族蛋白质的Ig-折叠序列,所述免疫球蛋白超家族蛋白质选自由细胞粘附蛋白、整联蛋白、过敏原、T-细胞受体、主要组织相容性复合物蛋白质(例如,I类MHC或II类MHC蛋白质)、免疫球蛋白受体(例如Fey受体(例如FcyRI,FcYRIIa))、和免疫球蛋白(例如IgG、IgM、IgA、或IgE免疫球蛋白)所组成的组。在某些优选的具体实施方式中,参考集的所有序列对应于Ig-折叠或其部分。在一个具体实施方式中,Ig-折叠是C1折叠。在另一个具体实施方式中,Ig-折叠是C2-折叠。在另一个具体实施方式中,Ig-折叠是V-折叠。在又一具体实施方式中,Ig-折叠是I-折叠。在另一个具体实施方式中,参考集的所有序列对应于C1折叠。在另一个具体实施方式中,参考集的所有序列对应于C2-折叠。在另一个具体实施方式中,参考集的所有序列对应于I-折叠。在某些优选的具体实施方式中,Ig-折叠参考集的序列的长度在约75至约150个残基以内。^乂/參考桌在第二步中,精确比对参考集的序列以产生序列的比对集(或比对)。在一个具体实施方式中,用序列比对算法(例如LALIGN或BLAST和上述其他的现有公认的比对)对参考集的序列进行比对以产生序列的比对集(本文中的"基于序列的序列比对")。在另一个具体实施方式中,用结构比对算法(例^口利用Schr6dingerStmctalign库欠<牛包的二级纟吉片勾匹酉己(SecondaryStructureMatching,SSM))比对对应于参考集序列的结构,以产生结构的比对集(本文中的"结构比对,,)。结构比对算法优选能确保每个结构的核心区(例如卩链)而不是介于其间的环被比对。在又一具体实施方式中,通过基于结构的方法(例如,通过基于多肽骨架a-碳间最短距离来匹配来自一个重叠放置的结构上的氨基酸与来自另一个重叠放置的结构上的氨基酸,例如可利用Schr6dinger软件包),来比对参考集的序列。在另一个具体实施方式中,既用基于序列的、又用基于结构的比对算法来比对参考集的序列。优选首先用基于结构的比对算法或其他结构支配的比对工具来比对对应于参考集序列的结构,然后用基于序列的算法比对相应序列。更优选首先比对对应于参考集的序列的结构,然后用基于结构的序列比对比对序列。在某些可选的具体实施方式中,进一步对序列的比对集进行辅助(curate)。例如,可扩展序列的比对集(例如通过无缺口分拣或通过Henikoff分拣)以增加其多样性(例如,获得具有相同折叠的同源序列的非常大的集合)。在其它具体实施方式中,可进一步对序列的比对集进行几轮辅助,并任选进一步比对(例如基于结构的比对)。在某些优选的具体实施方式中,本发明提供了对含相对少的数量的序列的比对集进行辅助以增强其多样性的方法。通过增加比对中的序列数,来增加共变分析的坚强度。在一个具体实施方式中,方法可利用启发式所衍生的模型或谱来从大的、公共可得的序列数据库(例如,由NCBI维护的NR数据库)中搜索额外的同源序列。启发式所衍生的模型可用一个或多个基于回归的算法来产生,所述算法选自诸如偏最小二乘回归(partialleastsquaresregression)、多元线性回归(multiplelinearregression)、逆最小二乘回归(inverseleastsquaresregression)、主成分回归(principlecomponentregression),投影殳量重要性(variableimportanceforprojection)等。在其它具体实施方式中,启发衍生模型可用一个或多个基于模式的算法来产生,所述算法选自诸如隐马尔可夫模型(HiddenMarkovmodel)、SmithWaterman算法、神经网络、分类和回归树、多元适应回归仿样等。在示例性的具体实施方式中,模式识别算法是隐马尔可夫模型。HMM是统计学模型,其中建模的系统含有隐参数,该隐参数可利用可观察到的参数来提取,并用于分析模式识别。例如,现有公认的HMM可利用预测的二级结构来搜索与给定抗体折叠相同的抗体,而不是具有纯粹基于序列的亲缘性的抗体(例如参见,尸ra/e/ra36(1),68-76)。MetaFam(Silverstein等.AWe/c^c油Zes29(1),49-51(2001))、Interpro(Apweiler,等,M^/e/c^cWsWes,29(1),37-40,(2001))和IIMMER(Bateman等,A^c/e/c爿czAiw27(1),260-2(1999))是示例性的基于HMM的模式识别工具。在某些额外的具体实施方式中,用HMM算法提取的序列可用现有公认'的生物信息学软件来确认其正确的结构类型指定。示例性的确认工具是由WellcomeTrustSangerInstitute维护的PFAM分类工具,而且它在互联网上可公共使用。例如,PFAM工具'pfamverify,可用于每个提取的序歹'〗,以确认它通过从基于结构的结构比对中产生的类别特异性HMM而被正确分类(Finn等,A^c/e/c爿c/A24(数据库期),D247-51,(2006)。对应于PFAM集群(或相关蛋白质家族,例如Ig-折叠集群)的HMM谱可从PFAM网站下载从而方便对提取序列进行评分。评分低于推荐的截止值的提取的序列优选从参考集中去除。在其它具体实施方式中,用HMM算法提取的序列也可用HMMC算法来比对。由于这些HMM算法基于仔细的结构比对,因此该过程确保了对额外提取的序列的结构支配的比对。例如,HMMER软件包可用于产生FASTA,命出才各式的'mapali,比只于。在优选的具体实施方式中,本发明的方法提供了新的HMM,其不仅找到了与比对集的那些序列相似的序列,而且比对了新的序列以确保正确的核心区比对。例如,本发明的新的HMM算法可检索单个蛋白质(例如,免疫球蛋白超家族成员)内分散的结构域(例如,Ig-折叠结构域),分别提取出每个结构域,并将其加入序列的比对集中。HMM算法或谱可从基于结构的序列比对中构建(例如使用HMMER软件包,其在互联网上为公众所得,例如在www.psc.edu)。对于每个结构特异性HMM搜索,高于标准评分阈值的命中序列优选被保留为其HMM被使用的结构类型的候选成员。对于那些是命中序列的亚序列的命中区来说,可从完整序列中提取出精确的亚序列命中物。在其他示例性的具体实施方式中,本发明提供了对序列的比对集提供辅助以减少其冗余的方法。例如,尽管结构比对集(例如,Ig-折叠比对集)中的大量序列代表了丰富来源的序列,一些亚家族(例如某些Ig-折叠亚类)可能被很大程度上过高代表了,而另外的则被很大程度上过低代表了。过共变分析的整体有用性。因此,在优选的具体实施方式中,使比对进行进一步的过滤步骤以减少比对冗余。在优选的具体实施方式中,至少一个与另一序列有大于90。/。同一性(例如,91%、92%、93%、95%、96%、97%、98%、99%或更大序列同一性)的序列从比对中去除。在尤其优选的具体实施方式中,至少一个与另一序列有大于80%序列同一性(例如,81%、82%、83%、84%、87%、88%、89%、或90%序列同一性)的序列从比对中去除。在示例性的具体实施方式中,本发明提供了减少比对内冗余的新方法。这类方法包括使用启发式算法来寻找并对具有所需序列同一性截止值的序列进行排序。这类方法包括以下多步顺序步骤之一步或多步(l)计算比对中所有序列对的百分比同一性;(2)将同一性值分入一个或多个百分比同一性仓(bin)中;(3)通过减少非缺口残基计数和/或通过Henikoff序列权重来对每个残的序列进行排序;和(4)根据截止标准(例如,%同一性截止水平)去除冗余序列。可以多种方式进行冗余序列的去除。在一个具体实施方式中,被排等级的序列被分入多个序列同一性仓(例如,99%仓、98%仓、97%仓等)中。然后根据等级(例如,首先是最高等级的序列)从最高°/。同一性仓(即,99%仓,然后98%仓,然后97%仓等)中有系统地去除序列。在每一个去除步骤后,任选重复同一性计算、分组和/或排等级步骤(步骤(1)-(3)),直至最后一个达到截止标准的仓被去除。在另一个具体实施方式中,在截止标准处产生含被排等级的序列的单个仓,并通过仓中的等级有系统地去除序列。在每一个去除步骤后,任选重复同一性计算和/或排序步骤(步骤(l)和(3))。在优选的具体实施方式中,截止标准是90%或更高(例如,91%、92%、93%、95%、96%、97%、98。/。、99%或更大的序列同一性)。在尤其优选的具体实施方式中,截止标准是80%或更高(例如,81%、82%、83%、84%、87%、88%、89%,或90%序列同一性)。在另一个可选的步骤中,可截断被比对的参考集中的序列的长度。在一个具体实施方式中,可去除比对内的缺口区以避免对这些提供较少信息的区域进行计算。例如,那些在用于找出序列的HMMi普中不处于匹配状态的列被去除。在另一个具体实施方式中,裁剪比对内超过比对的共有长度的序列,以去除序列的突出部分。在其他具体实施方式中,突出的序列从比对中除去。,黎3,比7/襄的4f为V^一旦汇编好比对集的序列,就对比对集中的一个或多个氨基酸残基对进行共变分析。共变分析导致产生了新的数据集(本文中的"共变数据集"),其描述了比对内相关残基的统计学显著性。在某些具体实施方式中,共变数据集罗列了比对内每个可能的残基对间的相关性。在优选的具体实施方式中,共变计算是计算机执行的过程(例如,可用Java执行的过程)。共变计算可产生几个现有公认的统计学参数。在一个具体实施方式中,用卡方分析计算共变的统计学显著性(例如x2-值)。在另一个具体实施方式中,计算共变的统计学强度(例如())值)。例如,负的ff直可预示负相关。即,比对中第一个位置上一个氨基酸的存在偏好在第二个位置上另一个特定的氨基酸的缺失。相反,正的(j)值可预示正相关,由此表明第一个位置上的氨基酸偏好在第二个位置上存在的氨基酸。在一个具体实施方式中,小值用公式I计算崎^,A)(1)V(化+aj7)*(^A其中a,b」是分别在相同序列中位置i和j上找到"a"或"b"类型的残基的次数;&^是相同序列中这两个残基类型都缺少的次数;ai^是发现a存在而b缺失的次数;和乂^b,是a缺失而b存在的次数。在一个具体实施方式中,(j)值用公式II计算其中c至j由以下矩阵定义a;&总和bjCdg^efh总和ij而且c=aibi,d=§ibj,e二ajZ^.f=5i~g=c+d,h=e+f,i=c+e,和j=d+f。在某些具体实施方式中,f值用基于"发生频率"的公式计算。在其它具体实施方式中,f值用"基于事件"的公式(即发生次数)计算。示例性的基于事件的公式如公式III所示2一力一(p(oco))]2(m)其中p(i)和p(j)分别是比对的序列集中分别在位置i和j上任何两个感兴趣的残基类型的残基频率;c(i,j)是在相同序列中观察到p(i)和p(j)的次数;和c(t)是比对中序列总数;而且其中残基频率被定义为在比对中特定位置上观察到一种残基类型的次数除以比对中序列总数。在某些具体实施方式中,仅有天然氨基酸残基被认为是用于共变计算目的的"残基类型"。可是,在优选的具体实施方式中,残基类型还可包括缺口作为特别的残基类型,因为缺口(尤其在环部分中的)经常帮助将一个模组与另一个相区分。在某些具体实施方式中,共变计算可包括多样性权重函数(例如,Henikoff权重方案)。在其它具体实施方式中,序列平均同一性(SequenceAverageIdentities,SAI)可用于过滤掉共变对。例如,SAI可用于从大于平均序列同一性的共变对中过滤掉共变,以去除由密切相关序列产生的潜在的假共变。在通过高同一性阈值(例如,80%同一性作为截止标准)对比对进^"辅助的具体实施方式中,优选省略SAI计算。在某些具体实施方式中,计算对共变对并不报告,除非以最小的次数观察到它们(本文中的"事件截止,,)。在一个具体实施方式中,事件截止为10或更多个事件。在更优选的具体实施方式中,事件截止约为2或更多个事件,并小于10个事件(例如,9、8、7、6、或5个事件)。紫4;^^^凝^资都蛋4^^體;t#在某些具体实施方式中,共变数据集内统计学上有显著意义的共变被用于搜索候选或测试序列内相应的共变。尤其是,参考集的一个或多个共变氨基酸在候选或测试序列内相应氨基酸位置上得以保留,表明这些残基在功能上是重要的,而且预示良好的蛋白质稳定性。因此,在候选或测试序列内保守的共变的氨基酸的数量被用于预测序列的稳定性。在某些示例性的方面,用本发明的图形用户界面(GUI)(例如以下第V节所述的NAPMAP工具)可使相关共变可视化,从而用于分析共变数据集。因为解释共变数据集中的数据可能是麻烦的,因此图形用户界面可方便进行数据分析并方便快速进行蛋白质设计和功能分析。在示例性的具体实施方式中,参考集或比对内存在或缺失在候选序列内存在或缺失的共变残基可用于建立与蛋白质稳定性相关的评分。例如,当发现共变的(例如,正共变的)残基对被保留在候选序列内时,可给予候选序列第一个评分(例如正评分)。相反,当在候选序列中缺少共变(例如,正共变的)残基对时,可给予候选序列与第一评分符号相反的第二个评分(例如负评分)。在一个优选的具体实施方式中,测试序列内缺失负共变的残基对被给予正评分,而存在负共变的残基对被给予负评分。在另一个优选的具体实施方式中,测试序列存在正共变的残基对被给予正评分,而测试序列缺失正共变残基对被给予负评分。在某些具体实施方式中,仅对满足统计学显著性阈值水平的共变生成共变评分。在一个具体实施方式中,仅对大于(或小于)某一f值或(l)值的共变生成共变评分。例如,给予负共变评分的截止值可以是(!)关联系数(0))小于+0.2(约+0.2至约-1.0)、并更优选小于-0.2的共变。在另一个示例性的具体实施方式中,如果共变的①关联系数大于-0.2,优选大于+0.2,则给予该共变正共变评分。在优选的具体实施方式中,给予①关联系数(O)小于-0.5(例如,-0.5、-0.6、-0.7、-0.8、-0.9、或-1.0)的共变负共变评分,而给予①关联系数((D)大于+0.5(例如,+0.5、+0.6、+0.7、+0.8、+0.9、或+1.0)的共变正共变评分,而所有其他共变则通过给予中性评分(例如零)而被掩盖。在某些具体实施方式中,可对负或正的共变评分设权重以反映出相应共变的统计显著性或强度。在一个示例性的具体实施方式中,如果正共变的小关联系数也是高的,则给予其高的正共变评分;或者对于其小值低的,则给予较低的正共变评分。例如,对于具有第一和第二共变的候选序列,其第一和第二共变的小值分别为+0.5和+1.0,可给予第一共变低的正共变评分(例如+l),对第二共变给予较高的正共变评分(例如+2)。在其它具体实施方式中,共变评分仅分配给那些由计算出的统计显著性之外的方法证实的共变。几个非统计学标准可用于证实计算出的共变是显著的并有生物学意义。在一个具体实施方式中,通过检测相互共变的残基之间是否有相关性或倾向、而且在相应蛋白质结构模型中是否相互邻近,来证实共变。如果所述残基在结构上相互密切邻近(例如30A或更小,优选ioA或更小),则将预测的共变证实为真的共变。在另一个具体实施方式中,通过确定共变的氨基酸是否形成已知存在于对应于参考集序列的蛋白质子集中的连接(例如已知的二硫键),来证实共变。例如,已知人或鼠IgG可变重链折叠的N末端上的6-10位残基采用了基于共变氨基酸对的非常特别的保守性构型(Ewert等,MeAoA,34:184-199(2004))。在另外其他的具体实施方式中,可对候选序列中氨基酸的共变评分设权重以反映出其所满足(或违反)的参考集或比对内的共变的数量。在一个具体实施方式中,对于候选序列,给予其所满足的参考集或比对内的每个共变正共变评分,和给予其所违反的参考集内的每个共变负共变评分。在优选的具体实施方式中,针对测试序列的特定氨基酸的共变评分是正共变评分总和减去负共变评分总和。例如,当在参考集内对应于候选序列氨基酸的氨基酸位置上观察到2个负共变和9个正共变时,候选序列氨基酸可被给予的总共变评分为7。在某些具体实施方式中,对候选序列(或其部分)中所有氨基酸的总共变评分求和,以获得"序列共变评分"。可用该序列共变评分预测序列的稳定性。一般而言,负序列共变评分预计蛋白质稳定性低,而正序列共变评分预计蛋白质稳定性高。b.共有评分在其它具体实施方式中,本发明的计算方法利用了被称为"基于共有的评分(consensus-basedscoring),,的新评分技术,其比较候选多肽序列与相关多肽序列数据库以鉴定出带有潜在低稳定性的蛋白质。如本文所用的"基于共有的评分"指根据得自相关蛋白质序列汇编的信息而计算的蛋白质(例如,测试蛋白质)内的非共有氨基酸数。该计算导致得到蛋白质的"共有评分"。如以下实施例所示,蛋白质的共有评分与根据经验确定的蛋白质稳定性高度相关。因此,本发明的目标是利用基于共有的评分预测蛋白质稳定性。测试蛋白质序列与共有序列的偏差越大,共有评分越高,测试蛋白质也更可能包含有损于其稳定性的氨基酸。在本文所述的新的共有评分方法中,进行以下基本步骤以预测候选或测试蛋白质的稳定性l.提供对应于候选蛋白质结构域(或其部分)的序列(本文中的"测试结构域序列,,)的同源序列集(本文中的"参考集")。2.确定测试结构域序列(或其部分)内每个残基位置上的残基频率以获得共有评分。3.利用共有评分预测候选或测试蛋白质的稳定性。在某些示例性的具体实施方式中,利用以下可选的步骤以增加共有评分的预测值4.确定参考集(或其子集)每个序列内每个相应残基位置上的残基频率以获得平均评分。5.比较共有评分与平均共有评分以确定序列评分。6.利用序列评分预测候选或测试蛋白质的稳定性。#嚴".'提供參^襄基于本发明方法的共有评分利用了与感兴趣的序列或"测试序列"同源(即,有亲缘关系)的序列集("参考集")。参考集可包含与测试序列具有中至高度相似性的同源序列集。同源序列集可由所属领域技术人员确定以包括合适数量的非冗余序列。同源序列集无需大,而只要能得到适度无偏好的选择。重要的不是序列数量,而是频率比率。通过对现有已知的任何序列数据库(例如NCBI、TIGR数据库)进行基于同源性的检索,可得到这类序列。在示例性的具体实施方式中,可用测试序列进行带有默认参数的标准BLAST检索以提取出感兴趣的同源序列。具有最小百分比的序列同一性(例如大于25%、30%、35%、40%、45%或50%的序列同一性,优选大于30%的序列同一性)的序列可被选入参考集中。在某些具体实施方式中,那些具有高度序列同一性(例如,大于85%、90%、95%、或98%序列同一性,优选大于95%序列同一性)的序列被排除出参考集以避免偏好。在某些具体实施方式中,可对参考集加以辅助,以使其仅包括那些满足被包括入该集合的标准的一个或多个序列。例如,在某些具体实施例方式中,参考集可包含直系同源序列(例如来自不同物种(例如不同哺乳动物物种)但具有相同生化功能的序列)。在其它具体实施方式中,参考集包含人序列。在示例性的具体实施方式中,同源序列集仅包括哺乳动物胚系序列。在优选的具体实施方式中,参考集包括来自具有与测试蛋白质(例如具有免疫球蛋白型折叠的蛋白质)同种类蛋白质折叠(例如相似蛋白质结构域)的蛋白质的序列。这类蛋白质可通过现有已知的生物信息学技术(例如搜索国立卫生研究院的保守结构域数据库(CDD))来鉴定。#4f2:确定W/试淨/(/的^才译为、一旦汇集好参考集的序列,为了方便本发明的共有评分方法,确定参考集的共有序列。如本文所用的,术语"共有序列,,指序列,其中序列内每个位置上的残基(例如氨基酸残基)对应于相关序列比对集(即,参考集)中位置上最常见的残基。为了确定共有序列,首先用现有已知的序列比对算法比对参考集内的序列。用于比较序列的局部比对算法的优选而非限制性的例子是Karlin和Altschul((19卯)尸racAto/.』c"df/<S^87:2264-68)的算法,其在Karlin和Altschu1(1993)尸rac.7Vw/.Jcc^t/5^90:5858-77中有修改。该算法被整合入Altschul等((19卯)J.7kfo/.历o/.215:403-IO)的BLAST程序(2.0版)中。在另一个具体实施方式中,通过导入合适的缺口来优化比对并在被比对序列的长度上来确定百分比同一性(即有缺口的比对)。为了获得有缺口的比对以用于比较,可如Altschul等,(1997)7Vwc/e/c25(17):3389-3402所述,使用有缺口的BLAST。在另一个具体实施方式中,通过(即全局比对)。用于序列全局比较的数学算法的优选而非限制性的例子是Myers和Miller(C45/OS(1989))的算法。该算法被整合入ALIGN程序(2.0版)中,其是GCG序列比对软件包的一部分。当使用ALIGN程序比较氨基酸序列时,使用PAM120权重残基表,缺口长度罚分为12,而且缺口罚分为4。为了确定被比对的参考集的共有序列,确定被比对的参考集内每个位置上最常出现的残基。可以直观地确定共有序列,或通过计算分析利用公共可得到的生物信息学程序(例如,可得自国立卫生研究所HelixSystems的HMBOSSCONS工具)来确定。共有序列用于本发明的方法中以确定共有评分。在某些具体实施方式中,共有评分是数字值,其使共有序列中氨基酸位置上的共有残基在参考集内的残基频率或发生率(即"共有残基频率")等于在测试序列中相应位置上的氨基酸在参考集内的残基频率或发生率(即"测试残基频率")。通过对该位置上的氨基酸在被比对的参考集的相应位置上出现的次数求和,并将该总和值除以参考集内序列总数,来计算测试或共有序列内位置上的残基频率。在示例性的具体实施方式中,通过将测试残基频率除以共有残基频率得到介于1和0之间的非零评分,来计算每个氨基酸位置上的共有评分。例如,与该位置上的共有氨基酸相同的残基一皮分配完美的评分1,而共有评分越接近零,在该位置上的氨基酸越不常见。在某些优选的具体实施方式中,可对测试序列(或其部分)的每个位置的共有评分求和以获得总共有评分。例如,完美的总共有评分是测试序列中的氨基酸数,这表明测试序列与其相应共有序列相同。计算蛋白质总共有评分的示例性的公式如下所示其中等于共有序列氨基酸位置上的共有残基频率,等于测试序列氨基酸位置的测试残基频率,和/等于测试序列的氨基酸位置数。,潔3:^^^#^分资^/蛋^#潜定#然后可用共有评分预测测试蛋白质的稳定性。一^1而言,共有评分值越高,则测试蛋白质将具有足够的稳定性以用于其所需的可能性越大。在某些具体实施方式中,测试蛋白质的共有评分可与对照序列的共有评分作比较。在一个示例性的具体实施方式中,对照序列来自已知稳定性差或不良的蛋白质(本文中的"阴性对照")。因此,如果测试蛋白质的共有评分高于阴性对照的共有评分,则预计测试蛋白质具有改善的稳定性。在另一个示例性的具体实施方式中,对照序列来自已知具有所需稳定性质的蛋白质(本文中的"阳性对照,,)。因此,如果其共有评分基本类似于或高于阳性对照的共有评分,则预计测试蛋白质具有改善的稳定性。在其它具体实施方式中,测试序列的共有评分可与其假设的完美共有评分作比较,其值对应于测试序列中的氨基酸总数。步-萦4,确定#孝桌的坊^^"^分在某些具体实施方式中,确定参考集内序列的一些或所有氨基酸位置上的平均共有评分,用以与测试序列内相应位置上的共有评分作比较。在优选的具体实施方式中,确定参考集的平均总共有评分,用以与测试序列的总共有评分作比较。参考集的平均总共有评分是参考集内序列的所有氨基酸位置的残基频率总和除以该参考集中的序列总数。确定^为、在某些具体实施方式中,通过比较参考集的平均共有评分与测试序列的共有评分,来确定序列评分。这些值的差是测试序列的"序列评分"(在本文中也被称为"A评分")。通过从平均共有评分中减去共有评分,来确定序列评分。,-聚6:^7^/{/^分銜源蛋力|《|定#序列评分提供了测试序列的共有评分与参考集平均共有评分的偏差的度量值。以下实施例证明了,蛋白质的序列评分与蛋白质的稳定性(例如热稳定性)高度相关。因此,在某些具体实施方式中,序列评分可用于预测蛋将预计感兴趣的蛋白质稳定性将比参考集内多数蛋白质低。",""在某些具体实施方式中,本发明的方法中所用的测试序列是单结构域蛋白质。如本文所用的,"单结构域蛋白质"是包含一个或多个结构域的蛋白质,其中每个结构域类型相同(例如可变的重链(VH)结构域)。在其它具体实施方式中,本发明的方法中所用的测试序列是多结构域蛋白质。如本文所用的,"多结构域蛋白质"是包含两个或多个结构域的蛋白质,其中至少两个结构域类型不同。例如,抗体通常是含6个结构域(即,VH,VL,CL,CH1,CH2,和CH3)的蛋白质。在优选的具体实施方式中,用本发明的方法预测多结构域蛋白质的最不稳定的结构域的稳定性。以下实施例证明了,当将多结构域蛋白质的最不稳定的结构域(或其部分)(例如抗体的VH结构域)用作测试序列时,本发明的方法尤其能有效地预测热稳定性。'如果预先不知道最不稳定的结构域,则可用现有已知的实验方法(例如利用任何上述方法,例如差示扫描量热法(DSC)、温度依赖性圓二色性(CD)、或荧光测量法)来确定。这类方法能确定多重热解折叠转换,在多重热解折叠转换中最不稳定的结构域或者首先解折叠(参见图69A)、或者限制协同解折叠的多结构域单位(即展示出单个解折叠转换的多结构域蛋白质)的整体稳定性阈值。最不稳定的结构域可以多种额外的方式来鉴定。可进行诱变以探测哪个结构域限制了整体稳定性。另外,在通过DSC或其他分光方法知道最不稳定的结构域发生内在解折叠的条件下,进行多结构域蛋白质的蛋白酶抗性测试(Fontana,等,2:R17-26,1997)。一旦鉴定出最不稳定的结构域,将编码该结构域(或其部分)的序列可被用作本发明方法中的测试序列。在某些示例性的具体实施方式中,用本发明方法评估的多结构域蛋白质是抗体。本发明的方法能使所属领域技术人员从由免疫系统多样性机制示例性的具体实施方式中,可用本发明的方法鉴定含相对高稳定性(例如热稳定性)的可变区(Fv)结构域的scFv分子或抗体分子,并将其选择出来。在其他示例性的具体实施方式中,用本发明的方法可鉴定出具有可接受的稳定性的人免疫球蛋白可变区(Fv)结构域,并选择用作抗体人源化中的接纳体免疫球蛋白链。在其他示例性的具体实施方式中,可用本发明的方法来筛选候选的工程化的抗体可变序列(例如,人源化VL或VH序列)的合适稳定性,然后继续合成含候选序列的结合分子。现有已知的是,基于天然或构建的抗体中许多可能的变化,蛋白质稳定性在不同抗体中有所区别。例如,免疫系统产生天然抗体可变区内多样性的选择性压力可负面影响它们在重组表达系统中的稳定性或可折叠性(Knappik和Pluckthun,尸rafe/w五,g,8:81-89,(1995);Wall和Pluckthun,Prato."五"g"g,12:605-11(1999);Knappik等,Mo/.,296:57-86,(2000);Ewert等,Mo/.3325:531-33,(2003))。由相同同种型和亚型组成的抗体(其中人IgGl最常见被用于抗体治疗),其稳定性主要根据它们可变区中的差异而变化,这是因为它们余下的序列是相同的。抗体Fab片段的热解折叠主要发生在单个表观转换中。除了其中Fv(或单个Vh或VO的稳定性非常低或非常高而且Fv解折叠转换与CH1/CL区相脱节的少数情况,在多数情况下,抗体Fv区限制了Fab的整体热稳定性(Shimba,等,1995;R6thlisberger等,2005)。在某些具体实施方式中,本发明的方法将抗体的可变区序列用作测试序列。在某些优选的具体实施方式中,本发明的方法将重链可变区(VH)(或其部分)用作测试序列。以下实施例证明了VH结构域可高度预测含所述结构域的抗体的稳定性。在某些具体实施方式中,可变区测试序列与包含可变区序列或仅由可变区序列组成的参考集作比较。所述可变区序列可从免疫球蛋白序列的Kabat数据库中汇集出来(Kabat等,"DistributionFilesoftheFifthEditionofSequencesofProteinsofImmunologicalInterest",1992)。在某些4尤选的具体实施方式中,参考集可包含人免疫球蛋白序列或由人免疫球蛋白序列组成。在其他优选的具体实施方式中,参考集可包含人胚系序列或仅由人胚系序列组成。在一个具体实施方式中,参考物包含来自相同Kabat亚型的抗体序列的可变区序列。在其它具体实施方式中,可变区(例如VH结构域)的一部分被用作本发明的方法中的测试序列。示例性的可变区是含不包括可变区序列框架区或CDR所有序列的序列(例如被截短以去除CDR3和FR4的VH序列)。在一个具体实施方式中,VH结构域序列是VHlKabat胚系亚型的。在另一个具体实施方式中,可交区序列是Vh2Kabat胚系亚型的。在另一个具体实施方式中,可变区序列是V0Kabat胚系亚型的。在另一个具体实施方式中,可交区序列是Vh4Kabat胚系亚型的。在另一个具体实施方式中,可变区序列是Vn5Kabat胚系亚型的。在另一个具体实施方式中,可变区序列是V7Kabat胚系亚型的。本发明的方法可用于现有已知的蛋白质。在一个具体实施方式中,蛋白质是抗体或其部分。在某些具体实施方式中,抗体是人源化抗体。在其它具体实施方式中,抗体是人抗体。在其它具体实施方式中,抗体是非人抗体(例如,小鼠单克隆抗体)。在其它具体实施方式中,抗体是单结构域抗体(例如,骆驼、鲨鱼、人的)。在另外其他的具体实施方式中,抗体是嵌合抗体。其他示例性的用于本发明方法中的修饰的抗体包括结构域缺失的抗体和双特异性结合分子。其他示例性的抗体包括含scFv的抗体或上述修饰的抗体。在优选的具体实施方式中,用其重链可变的序列(或其部分)作为本发明的方法中的测试序列来评估前述结合蛋白的稳定性。在本发明的一个具体实施方式中,得自给定多肽的数据被储存并作为多肽稳定性的度量值输出。在一个具体实施方式中,对数个多肽重复本文所述的方法。在一个具体实施方式中,可根据得到的数据选择多肽。在另一个具体实施方式中,可将选择的多肽配成制剂,用于治疗用途。IV.设计/产生具有增强的生物物理性质(例如蛋白质稳定性)的蛋白质的方法(a)共变设计在另一个方面,本发明提供了用共变分析结果设计相对于其所衍生的亲本分子增强了生物物理性质的蛋白质变体的方法。有许多类型的蛋白质工程工作可利用共变数据以帮助设计,包括但不限于增强的蛋白质稳定性设计、修饰pH解折叠语、稳定解除糖基化、和改变生化功能。在某些具体实施方式中,本发明提供了设计具有稳定性增强的设计的蛋白质的方法,其基于鉴定共变评分(或共变本身),所述共变评分(或共变本身)根据以上第III节的方法预示蛋白质稳定性的增强或减少。例如,如果属于感兴趣的蛋白质的序列缺失或不遵守几个关键的共变,则可进行蛋白质设计以对其进行纠正。也可包括改进计算出的单个序列内观察到的强共变的数目的修饰。已开发出了许多设计来稳定化BHA10scFvVH和VL结构域。尤其是,对初始文库进行两个scFvBHA10结构域筛选的结果证实了共变分析工具(CovariationAnalysisTool)用于蛋白质稳定性设计的能力。第一个例子涉及成功预测BHAIOVl結枸域内的稳定化突变(S46L),如热攻击试验所测量的,其使热稳定性显著改善(+10。C的ATsq)。第46位(Kabat编号系统)上的Ser至Lcu的突变导致与残基36位上存在的Tyr正向相关,工具(theTool)显示该残基与Lcu46有强共变(图78)。证明共变分析工具有用的第二个例子是在分析上肯定了BHA10VnQ6E突变的负面效应。单个残基频率分析提示了,突变成在该位置上更常观察到的Glu会导致稳定性增加。可是,共变分析工具显示,向Glu的单个突变违反了BHAlOVh序列内出现的几个已有的共变。为了使稳定性改善,人们必须替换几个优先稳定该位置上的GIu的氨基酸。共变分析工具预测值的另一例子如图79所示。作为单残基文库设计的一部分,将Met80突变成Leu。据认为该单个突变将具有高度稳定性,因为Leu是序列数据库内该位置上观察到的频率最高的氨基酸。可是,共变分析表明,为了得到共变协调性,必须突变另两个氨基酸(V67F和T70S)。(b)界面设计在其他的方面,本发明提供了用第一蛋白质作为合理设计的模板蛋白质,而增强第二或候选蛋白质(例如抗体)生物物理性质(例如蛋白质稳定性)的方法。本文所用的术语"模板蛋白质,,指带有所希望的生物物理性质(例如高蛋白质热稳定性)的蛋白质,其用于为第二种蛋白质的相同性质提供模型,在该第二种蛋白质中也希望改善该生物物理性质。在优选的具体实施方式中,模板蛋白质与第二蛋白质有相同的结构类型(例如如果第二蛋白质是抗体,则将抗体用作模板蛋白质)。在某些具体实施方式中,根据本发明的方法,鉴定出模板蛋白质具有所希望的生物物理性质(例如蛋白质稳定性)。在一个示例性的具体实施例方式中,用那些诸如实施例15所述的实验方法,将带有所希望的稳定性质的模板蛋白质从蛋白质组(表20中所述的如BIIBl-4,同上)中鉴定出来。然后,该模板蛋白质可用作序列设计平台。在一个示例性的具体实施方式中,通过以上所列的本发明的共变分析方法,预计模板蛋白质具有改进的生物物理性质(例如蛋白质稳定性)。在其他示例性的具体实施方式中,通过以上所列的共有评分方法,预测模板蛋白质是所希望的蛋白质(例如稳定化的蛋白质)。在另外一个示例性的具体实施方式中,根据本发明的筛选方法鉴定模板蛋白质。在其它具体实施方式中,模板蛋白质是根据本发明的方法设计的蛋白质。在一个示例性的具体实施方式中,根据本发明的共变方法将模板蛋白质设计成具有改进的生物物理性质(例如增强的蛋白质稳定性)。在另一个示例性的具体实施方式中,根据共有评分方法将模板蛋白质设计成具有改进的生物物理性质。本发明的该方面的方法涉及以下步骤(1)提供模板蛋白质和候选蛋白质的结构模型;(2)鉴定模板蛋白质中对稳定性至关重要的残基;和(3)替换候选蛋白质中对应于重要的模板蛋白质残基的残基。在一个具体实施方式中,模板蛋白质结构模型是晶体结构(例如X射线晶体结构),而且候选蛋白质通过同源性建模利用模板蛋白质的结构模型来建模。在另一个具体实施方式中,重要的残基是VH/VL界面残基。如本文所用的,"界面残基,,是参与蛋白质之内或之间的结构域-结构域相互作用的残基。界面残基优选位于边界上,即2个蛋白质结构域间的"界面"上,而且提供给其表面区域至少一个结构域(优选两个)。相对于在界面上的其他更显著埋入表面区域的残基,即并不更显著地将其表面暴露于折叠的蛋白质表面的残基,被认为对于界面稳定性来说是至关重要的。每个残基为界面提供的表面区域可用现有公认的技术(例如,用MOLMOL软件分析)来确定。在某些具体实施方式中,界面残基埋入表面区域至少10A"(例如,10A2、15A2、20A2、25A2或更多埋入的表面区域)。如果它们不是相同的类型,则优选替换位于对应于那些模板蛋白质重要残基(例如,埋入的界面残基)的氨基酸位置上的候选蛋白质残基。在某些具体实施方式中,仅进行非保守替换。在其它具体实施方式中,仅进行保守替换。在示例性的具体实施方式中,模板和候选蛋白质是结合分子(例如,抗体或其变体(例如scFv分子))。在一个具体实施方式中,;险测的界面是介于一个Fc结构域(例如,铰链、CH2、和CH3)和另一个Fc结构域之间的。在另一个具体实施方式中,界面在VH结构域和VL结构域之间形成。在优选的具体实施方式中,设计集中于抗体VH和VL结构域间的界面上。生物物理数据(参见DSC数据-实施例15)提示了VH和VL相互的亲和性在scFv形式(即在缺少Fab的CHl和CL结构域的情况下)中是最低限度的。尤其是,VH和VL相互作用不总是足够强(即无足够的亲和性形成协同折叠的单个实体。因此,改善VH/VL界面的稳定性(即增强VH和VL结构域间的亲和性)可以是增强抗体/scFv稳定性的优选途径。通过稳定界面,抗体的折叠转换可转换成单个事件,提高结构域相互的亲和性,并取得较少的动态波动,其可形成暴露的疏水表面区域(例如由ANS-结合实验所观察到的)。在另外其他的具体实施方式中,可用差分扫描量热法(DSC)实验来确认设计,其使所属领域技术人员非定量地观察到VH和VL之间真实的亲和性增力口。(c)组合共变和界面设计在本发明的其他的方面,基于本文所述的设计工具的两个或多个序列可用于设计优化的蛋白质变体。在一个示例性的具体实施方式中,界面设计可与共变分析一起用于确定对蛋白质结构和功能(包括例如,蛋白质稳定性)至关重要的残基或残基位置。在一个示例性的具体实施方式中,共变^析用于确定界面外的残基或残基位置(在本文中被称为"支持残基"),其不与反向结批但是对提供合适的界面残基结构关系来说是重要的。例如,可在位于界面内的残基上进行共变分析以鉴定与界面残基共变的支持残基。优选选择深度埋入表面区域的界面残基(辦如,埋入表面区域至少40A2的残基)进行共优选选择强共变(例如,至少0.25的①值)的支持残基。在另一个优选的具体实施方式中,如果它们与至少2个界面残基(例如,2、3、4、5、6、7、8、9、IO或更多的界面残基)共变,则选择支持残基。共变数越大,可得到越高的针对支持残基的共变评分,这是因为预计共变数由稳定VH/VL界面的支持残基给予支撑。本发明该方面的方法涉及以下步骤(1)提供模板蛋白质和候选蛋白质的结构模型;(2)鉴定模板蛋白质中对稳定性至关重要的界面残基(例如,VH/VL);(3)鉴定与步骤(2)的界面残基共变的支持残基,例如用本文所述的共变分析工具进行;(4)用步骤(2)和(3)中鉴定出的相应残基或支持残基替换候选蛋白质中一个或多个界面残基或支持残基。如果它们是不同类型的,则优选替换位于对应于那些模板蛋白质的重要残基(例如,界面或支持残基)的氨基酸位置上的候选蛋白质残基。在某些具体实施方式中,仅进行非保守替换。在其它具体实施方式中,仅进行保守替换。在本发明的一个具体实施方式中,储存给定的多肽的改进的序列并输出。在另一个具体实施方式中,可将选择的多肽配成制剂,用于治疗用途。V.系统、界面、和计算机执行的方法计算机执行的方法)、设备、和软件。在示例性的具体实施方式中,本发明提供了鉴定候选序列中的氨基酸残基(例如,共变的氨基酸残基)的计算机执行的方法和设备。在另一个具体实施方式中,本发明提供了通过评分(例如,共有评分或共变评分)排序一个或多个预计有生物物理性质(例如,蛋白质稳定性、催化活性、治疗活性、对病原体或毒素、毒性的抗性等)的测试或候选序列的计算机执行的方法和设备。计算机执行的方法方面可通过以下操作顺序描述(a)接受特征为参考集和测试序列的数据(例如,序列或结构数据);(b)从数据中,计算评分(例如,共变评分或共有评分);(c)排序评分以鉴定一个或多个感兴趣的序列或氨基酸残基。在一些具体实施方式中,排序评分以鉴定一个或多个仍固定在测试或候选序列中的氨基酸残基。在其它具体实施方式中,排序评分以鉴定一个或多个用于替换候选的氨基酸残基。在一个示例性的具体实施方式中,计算机执行的方法以共变评分的顺序排序残基位置(或某些位置上的特定的残基)。在另一个示例性的具体实施方式中,计算机执行的方法以共有评分的顺序排序候选序列。本发明的又一方面涉及设备和机器可读的介质,其上提供了程序指令和/或数据排列用以执行上述方法。通常,程序指令以编码形式提供用以进行某些方法操作。如果用于执行本发明的特征,可提供数据用作为数据结构、数据库表、数据对象、或其它专门信息的合适排列。可总体上或部分将本发明的任何方法或系统表示为这类机器可读的介质上提供的程序指令和/或数据。本发明的计算机执行的方法可包括输出设备,其向用户显示信息(例如,CRT显示器、LCD、打印机、通讯设备,如调制解调器、声频输出等)。另外,可将计算的指令(例如算法)置于适于在执行指令的电子设备中使用的介质上。因而,本发明的方法是用于高通量方法,其包括软件(例如,计算机-可读指令)和硬件(例如,计算机、机器人、和芯片)。计算机执行的进程不限于特定计算机平台、特定处理器、或特定高水平编程语言。在某些具体实施方式中,通过与计算机编程语言(例如PERL)—起使用的计算机算法进行用于本发明的方法中的计算。在示例性的具体实施方式中,设计计算机算法以识别(i)参考集的序列比对和/或(ii)一个或多个测试序列作为算法输入。(i)计算机执行的共有评分本发明的一个方面涉及用计算机执行的算法进行上述本发明共有评分方法的计算机执行的方法、设备、和软件。在示例性的具体实施方式中,设计算法以进行一个或多个以下步骤(1)裁出比对的每个残基位置作为列,并计算那个位置上的共有残基频率;(2)裁出测试序列的每个残基位置并计算那个位置上的测试残基频率,和(3)将测试残基频率除以共有残基频率以得到共有评分;和/或(4)在每个位置上对共有评分求和以得到总共有评分。在其它具体实施方式中,设计算法以进行一个或多个以下额外的步骤(5)计算参考集的平均共有评分、和/或(6)测试序列的序列评分。本发明的这些方面也可嵌入进行本发明共有评分方法的系统中。该系统包括(a)计算机,其包括能储存至少一个参考集群的数据库、和(b)系统软件。该系统软件包括一个或多个逻辑指令,用以进行计算机执行的共有评分方法步骤(1)-(6)之任意。本发明还提供了计算机程序产品,用以进行本发明的共有评分方法。计算机程序产品包括计算机-可读介质,其具有一个或多个逻辑指令,用以进行步骤(l)-(6)之任意。计算机执行的共变分析本发明的另一方面涉及用计算机执行的算法进行上述本发明共变分析方法的计算机执行的方法。在示例性的具体实施方式中,方法进4亍一个或多个以下步骤(l)裁出比对集的每个残基位置作为列;(2)将列排在矩阵中;(3)计算矩阵中各列间的相关性以得出关联关系;(4)将关联关系加入线性关系中,其对应于氨基酸残基,从而产生扩大的预报矩阵;(5)从扩大的预报矩阵中产生启发衍生的模型(例如隐马尔可夫模型)以鉴定出重要的相关性。本发明的这些方面也可嵌入进行本发明共变分析方法的系统中。该系统包括(a)计算机,其包括能储存至少一个字符串库群的数据库,和(b)系统软件。该系统软件包括一个或多个逻辑指令,用以进行计算机执行的共变评分方法步骤(l)-(5)之任意。本发明还提供了计算机程序产品,用以进行本发明的共变评分方法。计算机程序产品包括计算机-可读介质,其具有一个或多个逻辑指令,用以进行步骤(l)-(5)之任意。用于共变分析的图形用户界面在某些示例性的方面,本发明提供了与本发明的共变方法一起使用的新的图形用户界面(GUI)。该名为NAPMAP的共变分析工具帮助用户使序列比对集关系中的共变可视化。新的图形用户界面是用现有公认的编程语言(例如用Java1.4.2,其用了来自processing.org的进程库)执行的计算机。(a)栅格布局在一个方面,本发明的图形用户界面包括比对(例如,根据以上本发明的方法产生的序列比对)或其相应数据的图形描述。该显示的简单形式是栅格布局。本文所用的术语"栅格布局"(也被称为比对平台)指代表比对性质的矩阵。在一个具体实施方式中,栅格布局图形化地表现了比对序列的残基位置。在另一个具体实施方式中,栅格布局图形化地表现了比对内序列的残基类型。在另一个具体实施方式中,栅格布局图形化地表现了比对内残基类型的频率(或"残基使用频率")。在另外其他的具体实施方式中,栅格布局表现了比对内一个或多个残基性质(例如,疏水、电荷、大小、pKa等)。在某些示例性的具体实施方式中,栅格布局包括有代表性的显示(i)对应于比对序列的连续残基位置;和(ii)比对序列的每个残基位置上残基类型的残基使用频率。在一个具体实施方式中,符号化描述残基使用频率(辨如,通过圓或方块)。在其它具体实施方式中,代表了所有20种天然氨基酸、缺口、和不清楚的残基。在某些具体实施方式中,残基位置在行中显示,而残基使用频率在列中显示。在某些具体实施方式中,残基位置在列中显示,而残基使用频率在行中显示。在一个具体实施方式中,残基使用频率与符号大小(例如,圆的大小)相关(例如,正或负相关),从而使更保守的残基与较不常观察到的残基区分开来。例如,可将残基频率表示为各种与其使用频率成比例的圆面积大小的圆。利用根据以下式(IV)计算的椭圆函数使用每个圓的半径(R)画出节点M(IV)其中A=所有节点所需的平均面积N二使用该残基的序列数M=使用该残基的平均序列数在示例性的具体实施方式中,栅格布局包括连续列和行的矩阵,其中(i)连续列图形化地表现了比对的相应连续残基位置;(ii)每个连续行图形化地表现了特定氨基酸类型;和(iii)在每个矩阵单元中图形化地表现了每个残基位置上的残基使用频率。优选所有的残基类型(例如,所有20种氨基酸和/或可能缺口)通过栅格布局中分开的行来表示。更优选在每个矩阵单元中用符号(例如,圆)图形化地表现了比对的每个残基位置上的残基使用频率,所述符号大小与残基使用频率相关(例如,正相关)。示例性的栅格布局描述于图76中。(b)共变覆盖图在其他方面,本发明的图形用户界面包括图形化描述一个或多个共变(例如,根据以上本发明的方法鉴定出的共变)或其相应数据。在某些具体实施方式中,本发明的图形用户界面包括图形化地描述了(i)栅格布局;和(ii)一个或多个共变。在这些具体实施方式中,栅格布局可用作比对平台用以显示共变数据。例如,通过用共变数据覆盖栅格布局来显示共变数据。以该形式排列的共变数据被称为"共变覆盖图"。例如,共变可在共变覆盖图中描述成栅格布局内图形化描述的线或连接两个或多个共变氨基酸的线的网络。共变覆盖图的线可以有各种厚度(例如,细线或柱)或连惯性(例如,虛或实、直或锯齿形的),只要能向用户显示两个或多个共变氨基酸间的连接(如参见图77,其中共变被描迷成连接2个共变氨基酸的半透明柱)。在某些示例性的具体实施方式中,共变的图形化表示可进一步表现出共变的统计显著性(例如,其小或xM直)。在一个示例性的具体实施方式中,共变覆盖图内线的厚度可与共变的统计显著性成比例。例如,共变覆盖图线的厚度可才艮据公式V与小值成比例地画出沐、1+(A/.(I)、)(V)其中W=线的厚度(D二(D(相关系数)N二扩大乘凄tM=最大的线厚度在另一个示例性的具体实施方式中,正和负共变可相互图形化地区分(例如,通过不同颜色的线或厚度)。在其它的示例性的具体实施方式中,仅向用户显示高于统计显著性阈值水平的共变。例如,在某些具体实施方式中,小值截止值可用于仅观察带有所需相关性强度的共变。(C)序列轨迹在另外可选的方面,图形用户界面包括图形化描述感兴趣的序列以辅助可能的蛋白质设计工作。感兴趣的序列可以是测试或候选序列(即,输入序列)或者它可以是整合有所需共变的序列(即,输出序列)。可将感兴趣的序列图形化表示为线。在一个具体实施方式中,图形界面包括(i)感兴趣的序列的描述;和(ii)栅格布局(例如,加在栅格布局上的感兴趣的序列)。在另一个具体实施例方式中,图形界面包括(i)感兴趣的序列的描述;和(ii)共变覆盖图(例如,加在共变覆盖图上的感兴趣的序列)。在另外其他的具体实施方式中,图形界面包括(i)感兴趣的序列的描述;(ii)共变覆盖图;和(iii)栅格布局(例如,感兴趣的序列加(例如,描绘)在共变覆盖图上,共变覆盖图接着加在栅格布局上)。感兴趣的序列可显示在栅格布局上,例如,显示为曲线,其连接用图像描绘于柵格布局内的邻近的氨基酸。以该形式显示的感兴趣的序列被称为"序列轨迹"。在优选的具体实施方式中,对于代表特定残基位置的栅格布局的特定行或列,序列轨迹应该仅穿过或通过一个单元(或用图形表示的氨基酸类型)。序列轨迹更优选穿过用图形表示感兴趣的序列内特定残基位置上出现的残基类型的单元。序列轨迹可穿过栅格布局的每一个单元,其代表感兴趣的序列内的残基,或它可仅穿过代表感兴趣的序列部分的细胞。示例性的感兴趣的序列的序列轨迹在图77中有述。用贝塞尔函数画出本文中所述的序列轨迹(catmull-rom样条)。给定两个节点来画出序列转换贝塞尔曲线,将节点对的以前和接下来的节点用作定位点,并将2个节点本身用作第一和第二对照点。对于第一列中的节点(表示氨基酸序列的第一残基),第一对照点兼饰其定位点两角;对于最后一列中的节点,其第二对照点兼饰其定位点两角。在优选的具体实施方式中,序列轨迹图由用户操作而相互交互。例如,选择的单元可被分配特定选择状态(例如,正、中性、或负的选择状态)。在一个示例性的具体实施方式中,用户可正向选择代表特定残基的细胞,由此可折回序列轨迹从而穿过选4奪的单元。例如,如果用户选4奪正的单元,则可产生针对所有感兴趣的序列(例如,参考集或比对内所有序列)的多个序列轨迹,其利用了由正选择的单元代表的残基。在可选的具体实施方式中,用户可负向选择代表特定残基的细胞,由此可使序列轨迹不穿过选择的单元。因此,可产生针对每一个感兴趣的序列(例如,参考集或比对内所有序歹'J)的序列轨迹,其排除了由负选择的单元代表的残基。可图形化显示多个感兴趣的序列,只要它们可由用户区分(例如,用不同的线厚度或连贯性)。例如,为了比较不同的序列比对,栅格布局上可覆盖代表来自两个或多个比对的多个感兴趣的序列的序列轨迹(例如,用不同颜色,优选反色),用以使整体范围上的不同残基使用情况可视化。(d)显示纟莫式图形用户界面可方便任何现有公认的功能。例如,在某些具体实施方式中,图形用户界面能在栅格布局的不同部分上平移或缩放。例如,栅格布局的视口大小可根据用户计算机屏幕分辨率而改变,并可放大或平移图像用以查看起先视口中不合适的比对。在优选的具体实施方式中,使用了数据屏蔽,例如用以强调最重要的共变对和/或几对交叉而成的网络。本发明的图形用户界面可用一个或多个显示模式显示共变(例如,统计学显著的共变)。当查看感兴趣的序列的序列轨迹时,所述显示模式优选可用于交互图中。示例性的查看模式如下查看模式#1:仅显示也存在于感兴趣的序列中残基间的共变。这些共变被认为是假设的残基-残基相互作用(例如,由统计残基对频率分析发现的那些),其将相应蛋白质分子保持在一起并对其功能至关重要。查看模式#2:仅显示的共变是残基对之间的那些,其仅具有感兴趣的序列中存在的残基对的一个残基。这些共变是残基-残基相互作用,其倾向于是保守的但不存在于感兴趣的序列中,而且缺失其会对蛋白质稳定性有害。当将共变分析工具用于蛋白质设计(参见上文第IV节)时,尤其优选该查看模式。查看模式#3:仅显示的共变是残基对之间的那些,其不具有感兴趣的序列中存在的共变对的氨基酸成员。在某些具体实施方式中,向用户显示所有查看模式,但每一个以不同的显示模式显示。在另一个具体实施方式中,所有查看模式分开显示(例如,以分开的显示窗口显示)。图89描述了适于实施本发明具体实施方式的示例性的环境。计算设备8900支持最初的序列收集过程8902和分析工具8904。计算设备8900可以是装有一个或多个处理器并能支持最初序列收集过程8902和分析工具8904的工作站、服务器、膝上型电脑、主机、PDA或其他计算设备。计算设备8卯0可以有单个处理器或多个处理器,每个处理器可以有一个核心或多个核心。分析工具8904以软件执行,并程序性地分析比对内残基对间的共变以获得共变数据。计算设备8900与输出显示设备8910通信并输出数据。输出显示设备8910显示由分析工具8卯4产生的图形用户界面(GUI)8912。GUI8912可包括栅格布局8914和共变覆盖图8916。计算设备8卯0也可与网络8920通信,所述网络带有一个或多个分别保留序列数据8932和8942的储存位置8930和8940。基于用户提供的和/或预先确定的参数,最初的序列收集过程8卯2程序性地从序列数据8932和8942中提取出候选序列。用分析工具8904分析提取的序列数据。所属领域技术人员将理解的是,尽管最初的序列收集过程8902和分析工具8904在图89中分开描述,但是它们可作为整合的应用、进程或外挂而执行。相似地,应理解最初的序列收集过程8902和分析工具分别可以是作业、线程、进程、应用或外挂。计算设备8900可用大量不同介质和配置通过网络8920与储存位置8930和8940通信。例如,网络8920可被排成局域网(LAN)、广域网(WAN)、内部网、互联网,和/或可以是无线网络和/或电话线、或一些其它类型的使计算设备8900与储存位置8930和8940通信的网络。储存位置8930和8940可以是计算设备所带有的数据库或一些其它类型的储存数据结构,所述计算设备可进入网络8920。应当注意,尽管本发明的成分在图89中以特定配置描述,但是其它组成配置也可能在本发明的范围内。例如,最初的序列收集过程8902和分析工具8904可位于分开的计算设备上,和/或序列数据8932和8942可位于一个或多个计算设备8900所带有的数据库上。图90是示例性的步骤顺序的流程图,其遵循本发明的具体实施方式从而能确定可用于度量多肽稳定性的序列共变评分。顺序始于最初的序列收集过程8902,其提供了对应于多肽Ig折叠的序列辅助参考集的比对(步骤9000)。然后,分析工具8904计算出如本文所述的比对序列的残基之间的共变,用以产生共变数据(步骤9002)。分析工具8904使用共变数据内的共变确定候选序列的序列共变评分(步骤9004)。确定的序列共变评分提供了度量多肽稳定性的指示说明,并可通过GUI8912或以一些其它方式储存和/或向用户输出(步骤9006)。如上所示,分析工具8904也可用于确定共有评分。图91是示例性的步骤顺序的流程图,其遵循本发明的具体实施方式从而能确定并^f吏用共有评分以预测候选蛋白质的稳定性。通过使用最初的序列收集过程8902来开始该顺序,从而提供对应于候选蛋白质测试结构域序列的序列参考集(步骤9100)。分析工具8904接着确定了测试结构域序列内氨基酸位置上的残基频率以获得共有评分(步骤9102)。然后,可储存确定的共有评分和/或向用户输出,用以预测候选蛋白质的稳定性(步骤9104)。分析工具8904也可用于确定平均共有评分。图92是示例性的步骤顺序的流程图,其遵循本发明的具体实施方式从而能确定并使用平均共有评分以度量候选蛋白质的稳定性。通过使用最初的序列收集过程8902来开始该顺序,从而提供对应于候选蛋白质测试结构域序列的序列参考集(步骤9200)。分析工具8904接着确定了测试结构域序列内氨基酸位置上的残基频率以获得共有评分(步骤9202)。分析工具8904还确定了参考集的序列内的残基频率以确定平均共有评分(步骤9204)。将共有评分与平均共有评分作比较,用以确定序列评分(步骤9206),然后可储存确定的序列评分和/或向用户输出,用以预测候选蛋白质的稳定性(步骤9206)。图93是示例性的步骤系列的流程图,其遵循本发明的具体实施方式从而能鉴定并用比对中相应位置上的共变的残基替代不满足共变的氨基酸残基,用意确定改进的多肽氨基酸序列。通过使用最初的序列收集过程8902来开始该顺序,从而提供对应于多肽Ig折叠的序列辅助参考集的比对(步骤9300)。分析工具8904接着计算了比对序列的残基间的共变,用以鉴定共变的残基(步骤9302)。分析工具8904可鉴定多肽不满足共变的特定残基,并可替换比对中相应位置上发现的共变的残基(步骤9304),从而改进多肽序列。然后,可储存改进的序列或向用户输出(步骤9306).本发明可提供嵌入一个或多个介质之上或之中的一个或多个计算机-可读程序。介质可以是软盘、硬盘、光盘、通用数字盘、闪存卡、PROM、MRAM、RAM、ROM、或磁带。一般而言,计算机-可读程序可以用任何编程语言来实现。可用的语言的一些例子包括FORTRAN、C、C++、C#、Python或Java。可将软件程序作为目标代码储存于一个或多个介质之上或之中。可使用硬件加速,而且所有或部分的代码可运行于FPGA、ASIP、或ASIC之上。代码可运行于可^L化环境(例如虚拟木L)中。运行代码的多个虚拟机可常驻于单个处理器上。VI.评估蛋白质稳定性的方法可用现有已知的方法分析本发明的组合物的稳定性质。可利用现有技术中合意的稳定性参数。以下更详细地描述了示例性的参数。在示例性的具体实施方式中,评估热稳定性。在优选的具体实施方式中,评估本发明的组合物的表达水平(例如,用%产量所测量的)。在其他优选的具体实施方式中,评估本发明的组合物的聚集水平。在某些具体实施方式中,本发明的组合物的稳定性质与合适对照的作比较。示例性的对照包括常规scFv分子。尤其优选的对照是(Gly4Ser)3scFv分子。在一个具体实施方式中,测量下述一个或多个参数。在一个具体实施方式中,在哺乳动物细胞表达后测量这些参数的一个或多个。在一个具体实施方式中,在大规模的生产条件(例如,在生物反应器中表达scFv或含scFv的分子)下测量下述一个或多个参数。a)热稳定性合物的热稳定性。在某些具体实施方式中,通过分析性光谱评估热稳定性。示例性的分析性光语方法是差示扫描量热法(DSC)。DSC使用了对热吸收敏感的量热计,所述热吸收伴随着大多数蛋白质或蛋白质结构域的解折叠(例如参见Sanchez-Ruiz,等,所0c/7em/^^,27:1648-52,1988)。为了确定蛋白质的热稳定性,将蛋白质样品插入量热计中并升高温度直至Fac或scFv解折叠。蛋白质解折叠的温度指示了整体上的蛋白质稳定性。另一个示例性的分析性光谱方法是圆二色性(CD)光语。CD光语将组合物的光学活性度量为温度渐增的函数。圓二色性(CD)光谱测量出由于结构对称性造成的左极化光对右极化光的差异。混乱的或解折叠的结构导致CD谱与有序的或折叠的结构的有很大差异。CD谱反映出蛋白质针对温度渐增的变性效应的敏感性,并因此指示出蛋白质的热稳定性(参见vanMierlo和Steemsma,J!所ofec/wo/.,79(3):281-98,2000)。另一个测量热稳定性的示例性的分析性光谱方法是荧光发射光镨(参见vanMierlo和Steemsma,同上)。而另一个测量热稳定性的示例性的分析性光谱方法是核一磁共振(NMR)i普(例如参见vanMierlo和Steemsma,同上)。在其它具体实施方式中,本发明的组合物的热稳定性通过生化方式测量。评估热稳定性的示例性的生化方法是热攻击试验。在"热攻击试验"中,本发明的组合物在一定时间期内经受一定范围的升高的温度。例如,在一个具体实施方式中,测试scFv分子或含scFv分子的分子诸如在l-1.5中经受一定范围的增加的温度。然后通过相关的生化测试来测试蛋白质活性。例如,如果蛋白质是结合蛋白质(例如本发明的scFv或含scFv的多肽),则结合蛋白质的结合活性可通过功能性或定量ELISA来确定。在一个具体实施方式中,该测试可以高通量形式来进行。在另一个具体实施方式中,可用现有已知的方法产生scFv变体文库。可诱导scFv表达,可使scFv进行热攻击。可对受竟争的测试样品测试结合,并按比例增加那些稳定的scFv并进一步表征。在某些具体实施方式中,用任何以上技术(例如分析性光镨技术)通过测量本发明组合物的熔解温度(Tm)来评估热稳定性。熔解温度是热转变曲线中点上的温度,其上50%的组合物分子呈折叠状态。在其它具体实施方式中,用分析性量热技术(例如DSC)通过测量本发明的组合物的比热或热容(Cp)来评估热稳定性。组合物的比热是使lmol水温度升高rC的能量(例如以kcal/mol表示)。而大的Cp是变性的或无活性的蛋白质组合物的标志。在某些具体实施方式中,通过确定组合物在其热转变之前和后的比热来测量组合物热容的变化(ACp)。在其它具体实施方式中,通过测量或确定其它热力学稳定性参数,包括解折叠的Gibbs自由能(AG)、解折叠的焓(AH)、或解折叠的熵(AS),可评估热稳定性。在其它具体实施方式中,一个或多个以上生化测试(例如热攻击试验)被用于确定50Q/o的组合物保留其活性(例如结合活性)的温度(即Tc值)。b)%聚集度在某些具体实施方式中,通过测量其聚集倾向而确定本发明的组合物的稳定性。通过大量非限制性的生化或生物物理技术可测量聚集度。例如,用层析(例如大小排阻层析(SEC))可评估本发明的组合物的聚集度。SEC基于大小来分离分子。柱用半固体的多聚凝胶珠来填充,所述凝胶容许离子和小分子进入它们内部,而不容许大分子。当蛋白质组合物上样到柱顶端时,紧密折叠的蛋白质(即非聚集的蛋白质)分布于比适于大蛋白质聚集体更大体积的溶剂中。因此,大聚集体大聚集体能更迅速地穿过柱,并以该方式将混合物分离或分开其组分。每个级分从凝胶中洗脱时可定量分离(例如通过光散射)。因此,通过比较级分的浓度与上样于凝胶的蛋白质总浓度,可确定本发明的组合物的。/。聚集度。稳定的组合物作为基本单一的级分从柱中洗脱,并在洗脱谱或层析中表现为单峰。在优选的具体实施方式中,SEC与串联光散射(例如经典或动态光散射)联用以确定组合物的%聚集度。在某些优选的具体实施方式中,用静态光散射测量每个级分或峰的质量,而不依赖于分子形状或洗脱位置。在其他优选的具体实施方式中,用动态光散射测量组合物的流体力学大小。评估蛋白质稳定性的另一个示例性的方法包括高速SEC(例如参见Corbett等,Biochemistry.23(8):1888-94,1984)。在优选的具体实施方式中,通过测量蛋白质样品内的蛋白质聚集体的级分,来确定%聚集度。在优选的具体实施方式中,通过测量蛋白质样品内折叠的蛋白质级分,来确定组合物的%聚集度。C)。/o产量在其它具体实施方式中,通过测量蛋白质表达(例如重组表达)后收获的蛋白质的量(本文中的"%产量"),来评估本发明的组合物的稳定性。例如,可通过确定每ml宿主培养基收获的蛋白质毫克数(即mg/ml蛋白质),来测量%产量。在优选的具体实施方式中,哺乳动物宿主细胞(例如CHO细胞)中表达后评估%产量。d)y。损失在另外其他的具体实施方式中,通过监测储存一定时期后温度范围内(例如从-80至25。C)蛋白质的损失,来评估本发明的组合物的稳定性。用任何现有已知的蛋白质定量方法并与蛋白质最初浓度作比较,可确定收获的蛋白质的量或浓度。示例性的蛋白质定量方法包括SDS-PAGE分析或Bradford测试(Bradford,等,爿"a/.所oc/ze附.72,248,(1976))。优选的评估%损失的方法利用了任何上述分析性的SEC方法。将会理解的是,%损失的量度可在任何所需的储存条件或储存配方(包括例如冻干的蛋白质制剂)下确定。e)%蛋白水解在其他的具体实施方式中,通过确定在标准条件下储存后水解的蛋白质的量,来评估本发明的组合物的稳定性。在示例性的具体实施方式中,通过SDS-PAGE蛋白质样品来确定蛋白水解,其中完整蛋白质的量与显示在SDS-PAGE胶上的低分子量片段的量作比较。在另一个示例性的具体实施方式中,通过质谱(MS)确定蛋白水解,其中预期分子量的蛋白质的量与样品中低分子量蛋白质片段的量作比较。f)结合亲和性在其他的具体实施方式中,可通过确定其靶结合亲和性来评估本发明的组合物的稳定性。大量确定结合亲和性的方法是现有已知的。确定结合亲和性的示例性的方法利用了表面等离子体共振。表面等离子体共振是光学现象,例如使用BIAcore系统(PharmaciaBiosensorAB,Uppsala,瑞典和Piscataway,NJ),其能通过生物传感器基质内蛋白质浓度的变化来实时分析生物特异性的相互作用。进一步的描述可参见J6nsson,U.,等(1993)」"".C7/".51:19-26;J6nsson,U.,等(1991)5/ofec/zm々wes11:620-627;Johnsson,B.,等(1995)J.Mo/.Wecog"".8:125-131;和Johnnson,B.,等(1991)爿腦/.肠c/z簡.198:268-277。g)其它结合研究在其他另外的具体实施方式中,可通过定量标记的化合物与结合分子的变性或未折叠部分的结合,来评估本发明的组合物的稳定性。该分子优选是疏水的,因为它们优选与通常埋入天然蛋白质内部但在变性或未折叠的结合分子中暴露出来的氨基酸的大疏水片段结合或相互作用。示例性的标记的化合物是疏水荧光染料一l-苯胺基-8-磺酸萘(ANS)。vn.选择稳定的蛋白质的方法可用上述预测蛋白质稳定化性的方法选择候选蛋白质(例如抗体)进行进一步应用。在某些具体实施方式中,用本发明的方法选择蛋白质用以表达。在其它具体实施方式中,用本发明的方法选择蛋白质用以修饰。在示中(例如用以选择接纳体免疫球蛋白)。用本发明的方法基于其确定的总共有评分或序列评分,可选择候选蛋白质。在某些具体实施方式中,如果其共有评分大于合适的阴性对照(例如大于5%、优选大于10%、更优选大亍20%),则选择候选蛋白质。在其它具体实施方式中,如果其共有评分基本相似于(例如在20%、10%、或5%以内)或大于(例如大于5%、优选大于10%、更优选大于20%)合适的阳性对照,则选择候选蛋白质。在其它具体实施方式中,如果其共有评分基本相似于其理想的或完美的共有评分(例如在30%以内、优选在20%以内、更优选在10%以内),则选择候选蛋白质。在其它具体实施方式中,如果其序列评分大于零,则选择候选蛋白质。在一个具体实施方式中,如果其序列评分大于0.5,则选择候选蛋白质。在另一个具体实施方式中,如果其序列评分大于l,则选择候选蛋白质。在其他具体实施方式中,如果其序列评分大于2,则选择候选蛋白质。在优选的具体实施方式中,如果其序列评分大于3,则选择候选蛋白质。在其它具体实施方式中,如果其A评分至少-3,至少-2,或至少-1,优选至少O,更优选至少l,则选择候选蛋白质。a.选择用于抗体人源化的接纳体免疫球蛋白可用重组DNA技术生产人源化的抗体,例如参见诸如,Queen等,尸rac.〃"//.yic"dOS丄(1989),86:10029-10033;Jones等,A^w",(1986),321:522-25;Riechmann等,A^fw,。988),332:323-27;Verhoeyen等,Sc/ewce,(1988),239:1534-36;Orlandi等,尸rac.A^7"」c"t/.OS^,(1989),86:3833-37;美国专利US5,225,539;5,530,101;5,585,089;5,693,761;5,693,762;6,180,370。当优选选出的非人供体抗体用于人源化时,这时例如可从人抗体基因的序列数据库中、从几种人抗体的胚系Ig序列或共有序列中得到表达合适的人接纳体抗体。如果人可变区框架采用与CDR来源的非人可变框架相同或相似的构型,则将非人CDR替换入人可变区框架中最可能导致保持它们正确的空间方向。通过获得来自人接纳体抗体的人可变区,其中框架序列显示出与CDR来源的非人可变的框架结构域有高度的序列同一性,由此可实现这个方法。重和轻链可变框架区可源自相同或不同的人抗体序列。优选人接纳体抗体保留供体抗体的规范和界面残基。另外,人接纳体抗体优选在CDR环的长度上基本相似。参见Kettleborough等,尸rae/"五"g/"eer/"g4:758(1991);Kolbinger等,Prafe/"五"g/"een'"g6:971(1993)和Carter等,WO92/22653。鉴定出供体抗体和合适的人接纳体抗体的CDR,接下来的步骤是确定,如果有,那么这些组分的哪些残基应被替换以优化得到的人源化抗体的性质。通常,一些或全部抗原结合所需的非人供体免疫球蛋白轻链或重链氨基酸(例如,一个或多个CDR)被用于替换人接纳体抗体轻链或重链的相应氨基酸。人接纳体抗体保留一些或全部抗原结合所不需要的氨基酸。需要时,可将人框架区中的一个或多个残基变为鼠抗体相应位置上的残基,从而保持人源化抗体与抗原的结合亲和性。该变化有时^f皮称为"回复突变"。基于它们对CDR构型和/或结合抗原的可能影响,选择某些来自人可变区框架残基的氨基酸用以回复突变。可是在一些情况下,人源化过程导致可变区非天然的改变,其对人源化抗体带来了不希望的不稳定性。例如,接纳体免疫球蛋白可具有带来低稳定性的罕见序列。这对某些胚系序列来说尤其真实,其不被免疫系统以大频率使用。本发明的方法提供了改进的人源化方法。尤其是,本发明的方法能使普通技术人员预测候选接纳体序列(例如胚系序列)参考集内的测试序列(例如测试胚系序列)有适宜的稳定性,可用于人源化接纳体序列中。可选择具有预计有可接受的稳定性的评分(例如相对于参考集的平均共有评分,有高共有评分)的测试接纳体序列(例如胚系序列)作为接纳体免疫球蛋白。V1H.基于文库的鉴定稳定化的scFv分子的方法在另一个方面,本发明提供了鉴定带有改进的蛋白质稳定性(例如改进的热稳定性)的scFv分子的方法。本发明的方法包括(i)提供含候选scFv分子的文库;和(ii)筛选文库以鉴定相对于合适对照(例如对照scFv分子)改进蛋白质稳定性的候选scFv分子。如本文所用的,"候选scFv分子"是通过将一个或多个候选稳定化突变导入scFv分子而形成的scFv分子,其中候选稳定化突变对scFv分子稳定性的作用事先并不知道,即是scFv分子,其中有突变被导入而且必须评估其以确定突变是否造成scFv分子增加了稳定性。在一个具体实施方式中,候选scFv分子是通过将一个或多个候选稳定化突变导入常规(即非稳定化的)scFv分子而形成的。在另一个具体实施方式中,候选scFv分子是通过将一个或多个候选稳定化突变导入以上第II节所述的稳定化的scFv分子而形成的。本文中的"候选scFv分子的文库"是指至少2个非冗余的候选scFv分子,优选有至少约10个,尤其优选至少约100个,并尤其优选至少约1000个(例如至少约104、105、106、107、或108scFv分子)。在一个具体实施方式中,随机化文库,在任何位置随机产生非特异性突变。在另一个具体实施方式中,scFv文库是部分随机化的或设计的。即,特定的氨基酸残基或氨基酸残基种类被随机导入scFv的任意位置,或选择特定的氨基酸位置用非特异氨基酸、特定种类的氨基酸、或特定氨基氨基酸进行突变。在优选的具体实施方式中,用确定种类的氨基酸替换所选的scFv分子残基,例如用疏水氨基酸、石咸性氨基酸、亲水氨基酸、带电氨基酸、有空间偏好(小或大)的氨基酸、或能形成二硫键的半胱氨酸,来设计scFv文库。在某些具体实施方式中,scFv文库包含候选带有候选稳定化突变的scFv分子,所述突变被导入scFv分子的可变区(VL和/或VH)内。在其它具体实施方式中,scFv文库包含带有候选稳定化突变的候选scFv分子,所述突变被导入scFv分子的scFv接头内。在其它具体实施方式中,scFv文库包含带有候选稳定化突变的scFv分子,所述突变被导入scFv分子的scFv接头内,而且候选a.scFv文库的i殳计通过分子或计算机建模,可辅助设计scFv文库的方法。在某些具体实施方式中,可在硅片上进行文库设计。在某些具体实施方式中,可通过以下两步法设计scFv文库1)鉴定scFv中的靶氨基酸残基,当通过突变(例如,通过氨基酸替换)改变时,其被预测能造成改进的scFv稳定性(本文中的"候选去稳定化的残基");和2)用候选稳定化氨基酸残基替换靶氨基酸残基。.鉴定候选去稳定化的残基在某些具体实施方式中,可通过基于序列的分析来鉴定候选去稳定化的氨基酸残基。例如,可通过比较scFv可变区序列与可变区序列参考集(例如来自天然产生的人抗体的可变区序列),并选择那些参考集内其相应氨基酸位置上不常见或罕见的scFv可变区氨基酸残基,来鉴定候选去稳定化的氨基酸残基。在优选的具体实施方式中,仅分析scFv可变区序列的框架区,而保留可变区的互补决定区(CDR)以避免破坏scFv分子的结合活性。在某些具体实施方式中,候选去稳定化的氨基酸残基是同源可变区序列参考集内相应位置上缺少的或以低频率找到的氨基酸。编辑参考集的方法在上文第III-V节中有描述。在优选的具体实施方式中,候选去稳定化的氨基酸残基是参考集内相应位置上序列以小于10%出现的氨基酸。在更优选的具体实施方式中,候选去稳定化的氨基酸残基是参考集内相应位置上序列以小于5%出现的氨基酸。在尤其优选的具体实施方式中,候选去稳定化的氨基酸残基是参考集内相应位置上序列以小于2%(例如0.5%、0.75%、或1%)出现的氨基酸。在另一个具体实施方式中,候选去稳定化的氨基酸残基是区别于可变区序列参考集共有序列中相应位置上的氨基酸(即共有氨基酸残基)的氨基酸。确定参考集共有序列的方法在上文第III和V节中有描述。在另一个具体实施方式中,候选去稳定化的氨基酸残基是具有低共有评分的氨基酸。确定氨基酸共有评分的方法在上文第III和V节中有描述。在一个具体实施方式中,候选去稳定化的氨基酸残基是共有评分小于0.5(例如小于0.4,小于0.3,小于0.2,或小于O.l)的氨基酸。在优选的具体实施方式中,候选去稳定化的氨基酸残基是共有评分小于0.3的氨基酸。选择候选稳定化突变鉴定出一个或多个候选去稳定化的氨基酸,接下来的步骤是为每个去稳定化的氨基酸选择一个或多个候选稳定化突变。然后,可设计scFv文库,使每个所选择的候选稳定化突变包括在有代表性的候选scFv分子中。在某些具体实施方式中,选择特定去稳定化的氨基酸的每个天然氨基酸变体作为候选稳定化突变(即每个去稳定化的氨基酸有19个候选稳定化突在更优选的具体实施方式中,选择特定去稳定化的氨基酸的天然氨基酸变体子集用作为候选稳定化突变(即每个去稳定化的氨基酸有1-18个候选稳定化氨基酸)。在一个具体实施方式中,候选稳定化突变子集包括用特定种类的氨基酸的替换,例如用疏水氨基酸、碱性氨基酸、亲水氨基酸、带电氨基酸、或有空间偏好(小或大)的氨基酸。在一个具体实施方式中,候选稳定化突变子集包括用对应于同源可变区序列参考集内去稳定化的氨基酸的位置上以高频率出现的氨基酸替换。在优选的具体实施方式中,候选稳定化突变包括用数据库以大于10%频率出现的氨基酸替换。在更优选的具体实施方式中,氨基酸以大于15%的频率出现。在更加优选的具体实施方式中,氨基酸以大于20%的频率出现。在更加优选的具体实施方式中,氨基酸以大于25。/。的频率出现。在另一个具体实施方式中,候选稳定化突变是用在参考集内去稳定化的氨基酸位置上发现的共有氨基酸(即最高频率的残基)的替换。在另一个具体实施方式中,候选稳定化突变子集包括用同源可变区序列参考集内发现的每个氨基酸在去稳定化的氨基酸位置上的替换。因此之后,可设计scFv文库,使每个参考集中呈现的候选稳定化突变包括在有代表性的候选scFv分子中。在其它具体实施方式中,通过分析(例如视觉观察或计算机分析)scFv分子可变区的三维结构或模型,鉴定出或排序候选稳定化突变子集用以筛选。多肽三维结构影响其生物活性和稳定性,而且可以大量方式确定或预测该结构。用构筑一个或多个已知三维结构的同源蛋白质(或蛋白质复合物)的三维结构模型可预测三级结构。X射线结晶学可能是确定蛋白质结构的已知最佳方式(因此,术语"晶体结构"可用于替代术语"结构"),也可用圓二色性、光散射、或通过测量辐射能吸收和放射来进行评估。其他有用的技术包括中子衍射、核^t共振(NMR)、和同源建模。所有这些方法是本领域普通技术人员已知的,而且它们在标准教科书和大量出版物中有很好描述(例如参见,尸/又vw.ca/C7^mz。Wr_y,第4版,W丄Moore,Prentiss-Hall,N丄,1972,或户/z"z.ca//,V3c/ze附/^y,K.E,VanHolde,Prentiss-Hall,N丄,1971))。可进行任何这些技术以确定含scFv分子可变区的分子(例如抗体、Fab、或scFv分子本身)的结构。在硅片上可对可变区结构建模。例如,可通过计算机建模用候选稳定化突变替换去稳定化突变,来分析候选稳定化突变与三维结构的兼容性。如果它与scFv分子整体结构兼容,则可选择候选稳定化突变包括在scFv文库中。在一个具体实施方式中,如果它不影响scFv分子可变区或其一个或多个互补决定区(CDR)的天然折叠或构型,则可选择候选稳定化突变。在另一个具体实施方式中,如果它不影响可变区形成天然VL/VH界面的能力,则可选择候选稳定化突变。在某些具体实施方式中,可对可变区结构(例如晶体结构或模型)应用侧链重包技术来选择候选稳定化突变。在侧链重包计算中,可通过计算修饰候选稳定化残基,并通过计算评估得到的突变体的稳定性。侧链重包计算产生了具有改变的稳定性(即,改变的分子间能量)的突变体排序列表。通过计算评估的蛋白质突变体的数量可以是非常大的,这是因为可将每个可变的氨基酸位置突变成所有20种标准氨基酸。用于排序计算分析结果的示例性的计算算法包括尽头排除和树搜索算法(参见例如,Lasters等g:815-822,1995),Looger和HellingaG/Mo/.S/o/.巡429-445,2001),和Dahiyat和Mayo(尸rafe/w》895-903,1996))。因此之后,可设计scFv文库,为侧链重包计算产生的突变排序列表中每个顶级候选稳定化突变包括在有代表性的候选scFv分子中。在某些具体实施方式中,至少选4奪顶级突变(例如,选4奪第一位、前二位、前三位、前四位、或前五位突变)。b.构建scFv文库确定候选稳定化突变包括在scFv文库中,人们可使用任何各种可用的方法来生产含突变的候选scFv分子。例如,这类多肽可通过重组方法产生。此外,由于遗传密码子的简并性,可用各种核酸序列编码每个所需的scFv。示例性的制备编码候选scFv分子的核酸分子的公认方法包括但不限于,通过早期制备的编码候选scFv的DNA的定点(或寡核苷酸介导的)突变、PCR突变、和表达盒突变来制备。定点突变是优选的制备替换变体的方法。该技术是现有公知的(例如参见,Carter等NucleicAcidsRes.13:4431-4443(1985)和Kunkel等,Proc.Natl.Acad.Sci.USA82:488(1987))。简而言之,在进行DNA定点突变时,首先通过将编码所需突变的寡核普酸与该亲本DNA单链杂交,来改变亲本DNA。杂交后,将杂交的寡核苷酸用作为引物,并将单链亲本DNA用作为模板,用DNA聚合酶合成完整的第二链。因此,将编码所需突变的寡核苷酸整合入得到的双链DNA中,然后其可被连接入质粒或其他合适的载体中。PCR突变也适于制备4矣选scFv分子。参见Higuchi,PCRProtocols,pp.l77-183(AcademicPress,1990);和Vallette等,Nuc,AcidsRes,17:723-583(1989)。简而言之,当少量模板DNA被用作PCR中的起始材料时,DNA片段,其仅在引物与模板有区别的位置上与模板序列有差异。也可设计PCR引物来整合限制性酶切位点,从而之后使PCR反应的DNA产物直接连接入质粒或其他合适的载体中。另一个制备变体、表达盒突变的方法基于Wells等,Gene34:315-323(1985)所述的技术。起始材料是含要突变的起始多肽DNA的质粒(或其他载体)。鉴定要突变的亲本DNA密码子。在筌定出的突变位置的每一边上必须有独特的限制性内切酶位点。如果没有这类限制性酶切位点存在,则利用上述寡核苷酸介导的突变方法产生它们以在起始多肽DNA中合适的位置上导入它们。在这些位点上切割质粒DNA以使其线性化。用标准流程合成编码限制性酶切位点间DNA序列的但含所需突变的双链寡核苷酸,其中分别合成寡核苷酸的两条链,然后用标准技术杂交在一起。该双链寡核芬酸被称为表达盒。设计该表达盒使之具有与线性化的质粒相容的5'和3'末端,由此使它可直接与质粒相连。用以上方法可产生每个候选scFv分子的有代表性的核酸。然后,可将核酸克隆入表达载体中以形成表达载体文库。然后,可用得到的载体文库转化宿主细胞,并在适于表达这类候选scFv分子的条件下培养宿主细胞。c.筛选方法可在测试(例如高通量测试)中筛选本发明的scFv文库用以鉴定带有所需蛋白质稳定性的候选scFv分子。该测试可利用任何上文第VI节所述的评估蛋白质稳定性的方法。特别优选的方法是热攻击试验。该测试方法一般涉及将候选scFv分子的热稳定性与合适对照的做比较,并在热稳定性大于对照的时候选择候选scFv分子。示例性的合适对照包括常规scFv分子,例如(Gly4Ser)3scFv分子。如果它们具有大于对照的约O.l、约0.25、约0.5、约0.75、约l、约1.25、约1.5、约1.75、约2、约3、约4、约5、约6、约7、约8、约9、或约10摄氏度的热稳定性,则可选择候选scFv分子。在示例性的具体实施方式中,如果它具有大于对照的约3摄氏度的热稳定性,则可选择候选scFv分子。scFv文库可以不同测试形式呈现。例如,scFv分子可呈现在溶液中(例如,Houghten(1992)S/otec/7刚々M^13:412-421)、在珠(Lam(1991)Atowre354:82-84)、芯片(Fodor(1993)A^we364:555-556)、细菌(LadnerUSP5,223,409)、孢子(LadnerUSP'409)上、或在噬菌体上(Scott和Smith(1990)Sc/ewce249:386-390);(Devlin(1990)SWe"ce249:404-406);(Cwirla等(1990)A^/.Jc^/.87:6378-6382);(Felici(1991)JMo/.肠/.222:301-310);(Ladner,同上)。在某些示例性的具体实施方式中,候选scFv分子以溶液形式测试。在一个具体实施方式中,每个样品包含等量的具有相同候选稳定化突变或多个突变的候选scFv分子的溶液。通过,从用表达质粒文库转化的宿主细胞文库中分离出宿主细胞克隆,并在方便scFv分子表达的条件下在合适的容器中培养宿主细胞,产生该溶液。在一个具体实施方式中,候选scFv分子可乂人宿主细胞中纯化并重新溶解在合适的测试溶液中。在更优选的具体实施方式中,将候选scFv分子融合于可裂解的信号肽序列上,从而使宿主细胞将scFv分子分泌入宿主细胞培养基中。在其他优选的具体实施方式中,可在能使候选scFv分子与宿主细胞蛋白一起释放入介质的条件下,培养宿主细胞。希望自动操作以上任何测试形式。例如,可用机器人快速连续地分离scFv文库的每个成员(例如作为各宿主细胞克隆),由此使它们可在分开的容器中被测试。测试容器的例子包括微滴定板(例如96孔微滴定板)、试管、和微离心管。d.进一步优化稳定化scFv分子可重新对以上筛选方法鉴定出的稳定化scFv分子建模并进一步改进其蛋白质稳定性。因而,可用在初始优化轮中鉴定出的稳定化scFv分子重复上述步骤。可选的是,两个或多个稳定化scFv分子的稳定化突变可被整合在单个scFv分子中以进一步改善蛋白质稳定性。在某些具体实施方式中,可进一步优化由本发明的方法鉴定出的稳定化scFv分子。例如,可进行以下一个或多个额外的改变。在一个具体实施方式中,通过导入连接VL结构域中氨基酸和VH结构域中氨基酸的二硫键,可使稳定化scFv分子进一步稳定。示例性的二硫键包括任何上文第II节所述的二硫键。尤其优选的二硫键是VH44-VL100。在其它具体实施方式中,通过导入优化长度或组成的scFv接头进一步优化本发明的方法鉴定出的稳定化scFv分子。示例性的scFv接头在上文第II节有描述。尤其优选的scFv接头是(Gly4Ser)4。在另一个具体实施方式中,通过将稳定化突变导入至少一个VH或VL结构域中进一步优化本发明的方法鉴定出的稳定化scFv分子。IX.稳定结合分子的方法在其他方面,本发明提供了改善结合分子稳定性质的方法。这些方法一般涉及将本发明的稳定化scFv分子整合或附加在结合分子上。令人惊讶的是,如本文工作实施例所示,本发明的scFv分子不仅其本身是稳定的,而且它们也为它们所整合的结合分子带来了改进的稳定性。因此,本发明的方法提供了便利和可靠的方式来改善商业上有价值的结合分子的稳定性,所述分子的大规模生产通常受限于不良的蛋白质(例如多特异性抗体(#/如双特异性抗体)和其它修饰的抗体)稳定性。用现有已知的蛋白质偶联方法可将稳定化scFv分子整合入结合分子中。在一个具体实施方式中,稳定的scFv直接与多肽(例如抗体分子)的N-或C末端融合。在另一个具体实施方式中,使用非肽接头将稳定的scFv与多肽N-或C末端连接。在另外其他的具体实施方式中,用连接肽将稳定的scFv与多肽连接。在示例性的具体实施方式中,连接肽是富含gly/ser的短肽。示例性的富含Gly/Ser的肽罗列于下表l中。其他示例性的连接肽是现有已知的(例如参见,国际PCT申请WO2005/000898和WO2005/000899)。在一个具体实施方式中,用S(G4S)3接头将本发明的稳定的scFv与结合分子(如抗体分子)的C-末端连接。在另一个具体实施方式中,用(G4S)5接头将本发明的稳定的scFv与结合分子(例如抗体分子)的N-末端连接。表l:连接肽<table>tableseeoriginaldocumentpage106</column></row><table><formula>formulaseeoriginaldocumentpage107</formula>在一个具体实施方式中,至少一个稳定化scFv分子附在抗体分子上以制备双特异性分子。在另一个具体实施方式中,两个稳定化scFv分子附在抗体分子上以制备双特异性分子。在某些具体实施方式中,本发明的稳定的结合分子相对于常规scFv分子或含常规scFv分子的结合分子产量增加。评估产量的方法在上文第VI节中有描述。在一个具体实施方式中,本发明的方法产生的稳定的结合分子相对于不稳定的结合分子产量增加至少1%。在其它具体实施方式中,稳定的结合分子相对于不稳定的结合分子产量增加至少2%、至少5%、至少10%、至少20%、至少30%、至少50%、至少75%、或至少100%。在某些具体实施方式中,本发明的结合分子相对于常规scFv分子或含常规scFv分子的结合分子聚集减少。评估聚集的方法在上文第VI节中有描述。在一个具体实施方式中,本发明的方法产生的稳定的结合分子相对于不稳定的结合分子聚集减少至少1%。在其它具体实施方式中,稳定的结合分子相对于不稳定的结合分子聚集减少至少2°/。、至少5%、至少10%、至少20%、至少30%、至少50%、至少75%、或至少100%。在其它具体实施方式中,本发明的结合分子相对于常规scFv分子或含常规scFv分子的结合分子增加长期稳定性或保存期。评估保存期的方法包括上文第Vl节中所述的。/。损失或。/。蛋白水解。在一个具体实施方式中,本发明的方法产生的稳定的结合分子相对于不稳定的结合分子保存期增加至少l天。这意味着,结合分子制品具有稳定的结合分子在前一天所呈现的基本相同的量。在其它具体实施方式中,稳定的结合分子相对于不稳定的结合分子保存期增加至少2天、至少5天、至少1周、至少2周、至少1月、至少2月、至少6月、或至少1年。在其它具体实施方式中,本发明的结合分子相对于常规scFv分子或含常规scFv分子的结合分子,改善诸如在特定宿主细胞类型中表达时的稳定性。在示例性的具体实施方式中,本发明的方法导致产生具有在宿主细胞(例如细菌或真核(例如,酵母或哺乳动物)宿主细胞)中表达结合分子时增加稳定性(例如增加产量)的结合分子。示例性的哺乳动物宿主细胞包括中国仓鼠卵巢(CHO)细胞、HELA(人宫颈癌)细胞、CVI(猴肾系)细胞、COS(带有SV40T抗原的CVI衍生)细胞、R1610(中国仓鼠成纤维细胞)细胞、BALBC/3T3(小鼠成纤维细胞)细胞、HAK(仓鼠肾系)细胞,SPWO(小鼠骨髓瘤)细胞、BFA-c1BPT细胞(牛内皮细胞),RAJI(人淋巴细胞)细胞和293细胞(人肾)。在优选的具体实施方式中,两个稳定化scFv分子附在抗体分子上以产生稳定的双特异性分子用以在CHO细胞中分泌。在其它具体实施方式中,可筛选能表达稳定的结合分子的宿主细胞以选择能表达高水平溶解的和正确折叠的稳定的结合分子的单细胞分离体(例如显示小于10%聚集度的结合分子)。该方法可使用荧光活化的细胞分选(r,ACS)技术(例如参见,Brezinky等,JImmunolMeth(2003)277:141-155)。在一个具体实施方式中,单细胞分离体适于在无血清条件下建立稳定的生产细胞系。然后,可培养稳定的生产细胞系以方便大规模生产本发明的稳定的结合分子。在其它具体实施方式中,可用本发明的方法改善宿主细胞在大体积培养基中表达的结合分子的稳定性。在示例性的具体实施方式中,本发明的方法导致在至少l升培养基中表达结合分子时增加稳定性(例如增加产量)。在其它具体实施方式中,本发明的方法用于宿主细胞在至少2升、至少10升、至少20升、至少50升、至少75升、至少100升、至少200升、或至少500升的培养基中表达时产生增加了稳定性(例如产量)的稳定的结合分子。在示例性的具体实施方式中,本发明的方法用于为每升培养基产生至少10mg稳定的结合分子。X.含稳定化scFv分子的稳定的结合分子在一个具体实施方式中,本发明的稳定的结合分子是融合蛋白。例如,本发明的稳定化scFv分子可与第二scFv分子或非scFv分子相连。在一个具体个额外的结合位点。例如,本发明的结合分子中包括的示例性的结合位点包括配体的受体结合部分、受体的配体结合部分、酶的底物结合部分、底物的酶结合部分、或抗体的一个或多个抗原结合部分。scFv分子可与诸如抗体分子连接形成修饰的抗体分子或与其他多肽连接形成融合蛋白。以下描述一些例子。A.修饰的抗体分子在一个具体实施方式中,本发明的稳定化scFv分子与抗体或其片段连接形成稳定的结合蛋白,其是修饰的抗体。在另一个具体实施方式中,本发明的稳定的scFv与修饰的抗体(即,非天然产生的抗体分子)连接形成稳定的结合蛋白。以下更详细地描述优选的修饰的抗体构建体。本文所用的术语"修饰的抗体"包括合成形式的抗体,其被改变由此它们不是天然产生的,例如包含至少2个链部分但没有完整重链的抗体(例如,结构域缺失的抗体或微体);多特异性形式的抗体(例如,双特异性的、三特异性的等),其被改变以结合两个或多个不同抗原或单个抗原上的不同表位)。另外,术语"修饰的抗体"包括多价形式的抗体(例如,三价、四价等抗体,其结合3或更多拷贝的相同抗原)。将会理解的是,当讨论本发明的结合分子时,本发明的稳定化scFv分子、含本发明scFv分子的结合分子或这两者可带来本文所述的示例性的结合特异性。在一个具体实施方式中,本发明的稳定的结合蛋白质与一个或多个肿公开的结合分子的结合位点(即可变区或其免疫反应性或重组的片段)在恶性肿瘤位点上结合所选的与肿瘤相关的抗原。相似地,在一个具体实施方式中,结合分子可结合至少一个免疫细胞上出现的选择的标记。给定报道的与肿瘤和免疫疾病相关的抗原数、和相关抗体数,所属领域技术人员将理解当前公开的结合分子可由此源自大量完整抗体之任一。更一般的是,用于本发明中的多肽可得自或源自任何与分子或与选择条件相关的标记反应的抗体(包括以前在文献中报道的那些)。另外,用于产生本发明的稳定的结合分子的亲本或前体抗体、或其片段可以是鼠、人、嵌合、人源化、非人灵长动物或灵长动物化的。如本文所用的,"与肿瘤相关的抗原"包括通常与肿瘤细胞相关的抗原,例如肿瘤细胞上表达的抗原。更一般的是,与肿瘤相关的抗原包括使免疫反应性抗体在瘤细胞上定位的抗原,而无论其是否在非恶性肺瘤细胞上表达。这类抗原可相对有肿瘤特异性,例如限于在恶性肿瘤细胞表面上表达。可选的是,这类抗原在恶性肿瘤和非恶性肿瘤细胞上都可找到。例如,CD20是泛B抗原,其在被证明是治疗非霍奇金氏淋巴瘤的免疫治疗性抗体最有效靶位的恶性肿瘤B细胞和非恶性肺瘤B细胞表面上都被发现过。在此意义上,泛T细胞抗原(例如CD2,CD3,CD5,CD6和CD7)也包括在本发明所指意思之内的与肺瘤相关的抗原。其他示例性的与肺瘤相关的抗原还包括但不限于MAGE-1,MAGE-3,MUC-1,HPV16,HPVE6和E7,TAG-72,CEA,L6-抗原,CD19,CD22,CD37,CD52,HLA-DR,EGF受体和HER2受体。在许多情况下,文献中已经报道过这些抗原中每一个的免疫反应性抗体。所属领域技术人员将会理解,这些抗体中每一个可用作根据本发明的本发明抗体的前体。在一个具体实施方式中,本发明的稳定的结合分子优选连接于并结合于上述与肿瘤或免疫相关的抗原上。因此,如以下将详细讨论的,本发明的稳定化的结合分子可衍生自、产生自或制备自大量与肿瘤相关抗原反应的抗体中的任一种。在某些具体实施方式中,本发明的稳定化的结合分子是结构域缺失的抗体,其利用基因工程技术衍生,由此缺失或改变一个或多个恒定区结构域的至少一部分,从而提供所需的生化特征,如减少的血清半衰期。更特别的是,所属领域技术人员可方便地分离对应于稳定化的受试结合分子的可变和/或恒定区的基因序列,并缺失或改变合适的核苷酸,从而提供本发明的多肽用作本发明所述的单体亚基。可以如本文所述来稳定化以前报道的与肿瘤相关抗原反应的抗体,从而提供本发明的稳定化的结合分子。用于提供抗原结合区以产生或衍生所公开的稳定化的结合分子的示例性的抗体包括但不限于2B8和C2B8(Zevalin⑧和Rituxan⑧,IDECPharmaceuticalsCorp.,SanDiego),Lyml和Lym2(Techniclone),LL2(ImmunomedicsCorp.,NewJersey),HER2(Herceptin,GenentechInc.,SouthSanFrancisco),Bl(Bexxar,CoulterPharm.,SanI;rancisco),Campath(MillenniumPharmaceuticals,Cambridge),abagovomab(Menarini,Italy),CEA-ScanTM(Immunomedics,MorrisPlains,NJ),卡罗单抗(capromab)(Prostascint,CytogenCorp.),依决洛单抗(edrecolomab)(Panorex,Johnson&Johnson,NeWBrunswick,NJ),伊戈伏单抗(igovomab)(CISBioIntl.,France),米妥莫单抗(mitumomab)(BEC2,ImcloneSystems,Somerville,NJ),nofetumomab(Verluma,BoehringerIngleheim,Ridgefield,CT),OvaRex(AltarexCorp,,Waltham,MA),沙妥莫单抗(satumomab)(Onoscini:,CytogenCorp.),西妥昔单抗(Erbitux⑧,ImcloneSystems,NewYork,NY),贝伐珠单抗(AVASTIN,GenentechInc.,S.SanFrancisco,CA),阿泊珠单抗(apolizumab)(REMITOGEN,ProteinDesignLabs,Fremont,CA),拉贝珠单抗(labetuzumab)(CEACIDETM,ImmunomedicsInc.,MorrisPlains,NJ),培妥珠单抗(pertuzumab)(OMNITARGTM,GenentechInc.,S.SanFrancisco,CA),MB1,BH3,B4,B72.3(CytogenCorp.),CC49(国立癌症研究所)和5E10(爱荷华大学)。其他可以整合在受试的结合分子中的结合位点包括在如下中所找到的那些OrthocloneOKT3(CD3),ReoPro(Gpllb/glla),Zenapax(C25),Remicade(TNF-a),Simulect(CD25),Synagis(RSV),Mylotarg(CD33),和Campath(CD52)。在优选的具体实施方式中,抗原。在尤其优选的具体实施方式中,稳定的结合分子将源自2B8、C2B8、CC49和C5E10或与2B8、C2B8、CC49和C5E10结合相同的抗原,更优选其将缺少所有或部分的CH2结构域。在一个具体实施方式中,本发明的结合分子可具有源自一个或多个以下抗体的一个或多个结合位点托西莫单抗(BEXXAR),莫罗单抗(muromonab)(ORTHOCLONE)和替伊莫单抗(ZEVALIN),西妥昔单抗(KRBITUX),利妥昔单抗(MABTHERA/RITUXAN),英利昔单抗(RI':MICADE),阿昔单抗(REOPRO⑧)和巴利昔单抗(SIMULECT),efaliz丽b(RAPTIVA,贝伐珠单抗(AVASTIN),阿伦;朱单抗(CAMPATH),曲司珠单抗(HERCEPTIN),吉妥珠单抗(gemtuzumab)(MYLOTARG),帕利珠单抗(palivizumab)(SYNAGIS⑧),奥马珠单抗(XOLA鹏),daclizumab(ZENAPAX),那他珠单抗(natalizumab)(TYSABRI)和雷珠单抗(ranibizumab)(LUVENTIS),阿达木单抗ailJMIRA⑧)和帕木单抗(panitumumab)(VECTIBIX⑧)。在一个具体实施方式中,本发明的稳定的结合分子结合CD23(美国专利6,Oil,138)。在优选的具体实施方式中,本发明的稳定的结合分子与5E8抗体结合相同的表位。在另一个具体实施方式中,本发明的结合分子包含来自抗CD23抗体(例如5E8抗体)的至少一个CDR(例如,至少1、2、3、4、5、或6个CDR)。在一个具体实施方式中,本发明的稳定的结合分子结合TNF受体。在一个示例性的具体实施方式中,本发明的稳定的结合分子结合LTPR。在另一个示例性的具体实施方式中,本发明的稳定的结合分子结合TRAIL受体。在另一个具体实施方式中,本发明的稳定的结合分子包含来自抗TRAIL-R2抗体(例如鼠或嵌合14A2)的至少一个CDR(例如,至少1、2、3、4、5、或6个CDR)。在另一个具体实施方式中,本发明的稳定的结合分子包含来自抗LT卩R抗体的至少一个CDR。抗LT(3R抗体的例子包4舌BKA11,CDH10,BCG6,AGH1,BDA8,CBE11和BHA10。在一个具体实施方式中,本发明的稳定化的结合分子结合CRIPTO-I抗原(WO02/088170A2或WO03/083041A2)。在优选的具体实施方式中,本发明的稳定的结合分子与B3F6抗体结合相同的表位。在另一个具体实施方式中,本发明的稳定的结合分子包含来自抗CRIPTO-I抗体(例如,B3F6抗体)的至少一个CDR。在一个具体实施方式中,稳定化的结合分子将与Rituxan⑧结合相同的肿瘤相关抗原。RituxarA;又称为利妥昔单抗、IDEC-C2B8和C2B8)是第一个n〕A批准的用于治疗人B细胞淋巴瘤的单克隆抗体(参见美国专利5,843,439;5,776,456和5,736,137,这些专利均以参考文献的方式引入本文)。Y2B8(90Y标记的2B8;Zevalin;替伊莫单抗)是C2B8的小鼠亲本。Rituxan是一种嵌合的抗CD20的单克隆抗体,该抗体具有生长抑制性,并且有报道说它能体外致敏一些淋巴瘤细胞系,使其被化疗剂细胞凋亡。所述抗体能够有效地结合人补体,具有强FcR结合能力,并且能借助补体依赖性(CDC)和抗体依赖性(ADCC)机制体夕卜有效地杀伤人淋巴细胞(Reff"a/.,祝oo"83:435-445(1994))。本领域技术人员明白,根据本公开修饰的C2B8或2B8的二聚变体(同二聚体或异二聚体)可以偶联的或非偶联的形式使用,有效治疗患有CD20+恶性肿瘤的患者。更一般地说,我们要重申本文公开的稳定化的结合分子可以以"棵露,,或未偶联状态使用或者偶联至细胞毒试剂,来有效地治疗多种病患之任一种。在本发明的其他优选的具体实施方式中,本发明的稳定化的结合分子将与CC49源自、或结合相同的胂瘤相关抗原。CC49结合人肿瘤相关抗原TAG-72,其连接于某些人源肿瘤细胞(尤其是LS174T肿瘤细胞系)表面。LS174T[美国典型培养物保藏中心(本文中的ATCC)第CL1SS号]是LS180(ATCC第CL187号)结肠腺癌细胞系的变体。我们还知道,已开发了对TAG-72有结合特异性的许多小鼠单克隆抗体。这些单克隆抗体中的一个,被称为B72.3是由杂交瘤B72.3(ATCCNo.HB-8108)产生的小鼠IgGl。B72.3是用人乳腺癌提取物作为免疫原开发出的第一代单克隆抗体(参见Colcheretal.,Proc.Natl.Acad.Sci.(USA),78:3199-3203(1981);以及美国专利4,522,918和4,612,282,这些出版物均以参考文献的方式引入本文)。其它针对TAG-72的单克隆抗体被命名为"CC"(表示结肠癌)。正如Schlom等(美国专利5,512,443,以参考文献的方式引入本文)描述的,CC单克隆抗体是用TAG-72从B72.3中纯化制备的第二代小鼠单克隆抗体家族。由于它们对TAG-72的结合亲和性相对较好,以下CC抗体已被保存在ATCC,其获取受到限制CC49(ATCCNo.HB9459);CC83(ATCCNo.HB9453);CC46(ATCCNo.HB9458);CC92(ATTCCNo.HB9454);CC30(ATCCNo.HB9457);CC1l(ATCCNo.9455);和CC15(ATCCNo.HB9460)。美国专利申请公开号5,512,443进一步教导了,可以利用本领域已知的重组DNA技术将公开的抗体改变成它们的嵌合形式,例如通过用人恒定区结构域(Fc)取代小鼠恒定区。除了公开了小鼠和嵌合抗TAG-72抗体,Schlom等还制备了PCT/US99/25552中公开的人源化CC49抗体的变体,和美国专利5,892,019中公开的单链构建体,这两份专利均以参考文献的方式引入本文。本领域技术人员明白,以上提到的抗体、构建体或重组体,以及它们的变体可以是修饰的,并用于制备发明所述多肽。除了上面讨论过的抗TAG-72抗体,多个研究小组还报道过结构域删除CC49和B72.3抗体的构建和部分研究情况(例如,Calvoetal.Ca"cer胸/zer,,8(1):95-109(1993)、Slavin-Chiorinietal.MCer53:97-103(1993)和Slavin-Chiorinietal.C""cer.55:5957-5967(1995)。本发明的其它优选实施方案包含来源于C5E10抗体的一个结合位点、或者是与C5E10抗体结合相同肺瘤相关性抗原的结合位点。正如同时待审的专利申请09A04,717中提出的,C5E10是一种约115kDa的识别糖蛋白决定物的抗体,它似乎是前列腺肿瘤细胞系(例如,DU145、PC3或ND1)所特有的。因此,结合本发明来看,可以产生特异结合C5E10所识别的相同肿瘤相关抗原的稳定化的结合分子(例如,CH2区删除抗体),并以偶联或未偶联形式用于治疗赘生性紊乱。在特别优选的实施方案中,所述结合分子来源于或者包含C5E10抗体之抗原结合区的全部或部分,象ATCC保藏号为PTA-865的杂交瘤细胞系所分泌的。然后可以将得到的结合分子象下文描述的那样偶联上放射性核素,并按照本文的方法给予患有前列腺癌的患者。在某些具体实施方式中,本发明的稳定的结合分子具有至少一个本文(如以上第C节中)所述的结合特异性。在另一个具体实施方式中,本发明的稳定的结合分子可结合诸如本文(如以上第B或C节中)所述的感兴趣的耙分子。如本文所述,可稳定化以前才艮道的与免疫细"包病症(例如,B细力包病症)相关抗原反应的抗体,用以提供本发明的稳定化的结合分子。用于提供抗原结合区以产生或衍生出所公开的稳定化的结合分子的示例性的抗体包括但不限于抗TNFa抗体(例如,英利昔单抗(infliximab)(Remicade⑧,Centocor,Horsham,PA);MAK195-F(AbbottLabs.,AbbottPark,IL);阿达木单抗(adalimumab)(Humira,AbbottLabs,AbbottPark,IL);4元CD3^L体(例3口,()rthoclone(OKT3,OrthoBiotech,Bridgewater,NJ);MEDI陽500(Medimm画,Gaithersburg,MD);维西珠单抗(visilizumab)(NUVION,ProteinDesignLabs(Fremont,CA,USA)),抗IgE抗体(例如,奥马珠单抗(omalizumab),X()LA鹏,Genentech,SouthSanFrancisco,CA),抗VLA-4抗体(例如,TYSABRI,Biogenldec,Cambridge,MA),抗CD147抗体(例如,ABX-CBL(Abgenix,Fremont,CA)),抗CD25抗体(例如,巴利昔单抗(basiliximab),Simulcct(EastHanover,NJ);Inolimomab(OPI,France),4元CD184元体(例^口,odulimomab,Antilfa,PateurMeriuex,法国),^tNCA90(例长口,sulesomab,Leukoscan,Immunomedics,MorrisPlains,NJ),^tGpnb/glIa^元体(侈'H口阿昔单抗(abciximab),ReoPro,Centocor,Horsham,PA),抗C25抗体(例如,Zenapax),抗CD33抗体(例如,Myotarg),和抗CD25抗体(例如,阿伦珠单4元,Campath(MilleneumPharmaceuticals,Cambridge,MA)。在4尤选的具体实施方式中,本发明的稳定化的结合分子将与上面刚刚列举的抗体结合相同的免疫细胞相关抗原。在一个具体实施方式中,本发明所迷的术语"修饰的抗体"包括免疫球蛋白、抗体、或其免疫反应性的片段或重组体,其中缺失或以其他方式改变一个或多个恒定区结构域的至少一部分,用以与大致相同免疫原性的完整、未改变的抗体相比提供所需的生化特性,例如非共价二聚化的能力,提高定位于肿瘤位置的能力,或降低血清半衰期。在优选的具体实施方式中,本发明的多肽是结构域缺失的抗体,其包含与免疫球蛋白重链相似的多肽链,但其缺少一个或多个重链结构域的至少一部分。在一个具体实施方式中,将缺失稳定化的结合蛋白质的恒定区的一个完整结构域。在另一个具体实施方式中,将缺失CH2结构域的全部或部分。在一个具体实施方式中,本发明的稳定化的结合蛋白质是微型抗体。微型抗体是由两个多肽链构成的二聚分子,其每个链包含稳定化的scFv分子(包含一个或多个抗原结合位点的单个多肽,例如通过柔性接头将VL结构域与VH结构域连接,VH结构域通过连接肽融合CH3结构域。用现有所述方法通过构建scFv组分和连接肽-CH3组分,可制造孩i型抗体(例如参见,美国专利5,837,821或WO94/09817Al)。这些组分可以作为限制性片段分离自彼此分开的质粒,然后连接并重新克隆入合适的载体中。通过限制性消化和DNA序列分析可确认合适的组装。在另一个具体实施方式中,可构建四价微型抗体。可以与微型抗体相同的方式构建四价微型抗体,不同的是两个scFv分子用柔性接头(例如具有氨基酸序列(G4S)4GgAS的柔性接头)连接。在一个具体实施方式中,通过组合编码抗体的DNA序列和scFv分子,可产生四价抗体。例如,在一个具体实施方式中,组合这些序列,-使scFv分子通过柔性接头(例如,gly/ser接头,例如(Gly4Ser)3)在其N末端连接于抗体CH3结构i或。在另一个具体实施方式中,通过将稳定化的scFv分子融合于连接肽可制备四价抗体,该连接肽融合于CH1结构域以构建稳定化的scFv-Fab四价分子(Coloma和Morrison.1997.NatureBiotechnology.15:159;WO95/09917)。在一个具体实施方式中,本发明的稳定化的结合分子包含四价或双特异性四价抗体,其中scFv附在轻链N末端上。在本发明的另一个具体实施方式中,结合分子包含四价或双特异性四《介CH2结构域缺失的抗体,其中scFv附在重链N末端上。在一个具体实施方式中,scFv附在N末端上导致与scFv附在羧基末端的分子相比减少了分子聚集。利用现有公认的规程可得到用于本发明的稳定化的结合分子中的抗体或其片段,例如,优选通过多次皮下或腹膜内注射相关抗原(例如,纯化的与肺瘤相关的抗原或细胞或含这类抗原的细胞提取物)和佐剂,在哺乳动物产生抗体。该免疫通常引发免疫应答,其包括从活化的脾细胞或淋巴细胞中产生抗原反应性抗体。尽管可从动物血清中收集产生的抗体以提供多克隆制品,而通常希望从脾脏、淋巴结或外周血中分离出各个淋巴细胞,用以提供均一的单克隆抗体(MAb)制品。淋巴细胞优选得自脾脏。在这个众所周知的方法(Kohleretal.,A^we,256:495(1975))中,将来自被注射了抗原的哺乳动物中相对生命期短或者会死亡的淋巴细胞与永生的肿瘤细胞系(例如,骨髓瘤细胞系)融合,乂人而制备出杂交细月包或"杂交瘤",它们既可以无限增殖又能产生遗传编码的B细胞抗体。经过挑选、稀释并与含有特定基因的单个林重新生长将所得杂交瘤分离成单个基因抹以便形成单种抗体。它们产生的抗体均一地抗目的抗原,就其纯基因家系而言,被称为"单克隆的"。将这样制备的杂交瘤细胞接种并生长在合适的培养基中,优选培养基含有一或多种能够抑制未融合之亲本骨髓瘤细胞的生长或存活的物质。本领域技术人员知道,用于形成、挑选和培养杂交瘤的试剂、细胞系和培养基可以从多种来源购买,标准方法已建立完善。通常,要检测杂交瘤生长所用培养基中产生的针对目的抗原的单克隆抗体。优选的,通过免疫沉淀或者体外测试法(比如放射免疫测定法(RJA)或酶联免疫吸附法(ELISA))来确定杂交瘤细胞产生的单克隆抗体的结合特异性。鉴定到能产生所需特异性、亲和性或/或活性的抗体的杂交瘤细胞后,克隆可以经有限稀释步骤进行亚克隆并用标准方法培养(Goding,Mwoc/o"a/爿w幼0(i/esv/V/w一/acw(iiVac"ce,pp59-103(AcademicPress,1986))。更好的是通过常规纯化方法,比如蛋白A、羟基磷灰石层析、凝胶电泳、透析或亲和层析,将亚克隆分泌的单克隆抗体从培养基、腹水或血清中分离出来。在另一实施方案中,可以利用常规步骤(例如,利用能够特异结合编码小鼠抗体重链和轻链的基因的寡核苷酸探针)容易地分离出编码所需单克隆抗体的DNA并测序。分离并亚克隆的杂交瘤细胞是这类DNA的优选来源。一经分离,I)NA可以引入表达载体,然后将后者转染到否则不会产生免疫球蛋白的原核或真核宿主细胞中,比如EcoZ/细胞、猴COS细胞、中国仓鼠卵巢(CHO)细胞或骨髓瘤细胞。更具体地说,可以按照Newman等1995年l月25日提交的美国专利5,658,570(全文以参考文献方式引入本文)中描述的,用分离的DNA(可以是如本文描述的合成DNA)来克隆恒定和可变区序列以便制备抗体。基本上,该专利详述了从所选细胞中提取RNA、转换成cDNA以及用Ig特异引物经PCR扩增。适用于该目的的引物在美国专利5,658,570中也有描述。如下文更详细描述的,表达所需抗体的转化细胞可以较大量地培养以使j是供免疫球蛋白的临床和商业供应。本领域技术人员还会理解,编码抗体或抗体片段(例如,抗原结合位点)的DNA还可以例如利用pd噬菌体或Fd噬菌粒技术,来源于抗体噬菌体文库。示范性的方法在例如EP368684Bl、美国专利5,969,108、Hoogenboom,H.R.andChames.2000.7wmwwo/.7b(iay21:371、Nagyetal.2002.A^af.8:801、Huieetal.2001.尸roc.胸/.yW.,98:2682、Luietal.2002.J.Mo/.S/o/.315:1063中有描述,这些文献均以参考文献的方式引入本文。有些出版物(例如Marksetal.所o/rec/wo/ogy10:779-783(1992))描述过通过链改组来产生高亲和性人抗体、以及用组合感染和体内重组作为构建大噬菌体文库的策略。在另一实施方案中,可以利用核糖体展示代替噬菌体作为展示平台(参见例如,Hanesetal.2000.A^f.说otec/wo/.18:1287;Wilsonetal.2001.A^/.JcW.园98:3750;或Irvingetal.2001J/画,/.MeAoA248:31)。在再一实施方案中,可以筛选细胞表面文库来获4寻抗体(Boderetal.2000.Proc.Natl.Acad.Sci.USA97:10701;Daughertyetal.2000J./mw朋o/.Me^xfe243:211)。这些提供了用于分离以及随后克隆单克隆抗体的传统杂交瘤技术的替代方法。在本发明的另一实施方案中,发明所述结合分子的结合位点可以由人抗体或基本上是人抗体提供。人抗体或基本上是人抗体可以在不能自身产生免疫球蛋白的转基因动物(例如小鼠)中制备(参见例如,美国专利6,075,181、5,939,598、5,591,669和5,589,369,均以参考文献方式引入本文)。例如,有人描述过将嵌合和胚系突变小鼠中抗体的重链连接区做纯合删除,导致内源抗体产生被完全抑制。将人免疫球蛋白基因阵列转移到这样的种系突变小鼠中,使得它在抗原攻击时产生人抗体。另一种优选的利用SCID小鼠产生人抗体的手段在美国专利5,811,524中有描述,该专利以参考文献方式引入本文。如果与这些人抗体相关的基因物质也能如文中所述进行分离和操作会很有益。还有一种高效率产生重组抗体的途径在Newman,所otec/z"o/ow,10:1455-1460(1992)中公开了。具体来说,这个技术使得产生了含有猴可变区和人恒定区序列的灵长类源化抗体。该文献以引用的方式全文引入本文。此外,这一技术在共同转让的美国专利5,658,570、5,693,780和5,756,096中也有描述,这些专利均以参考文献的方式引入本文。在另一实施方案中,可以通过显微操作挑选淋巴细胞,并分离可变区基因。例如,可以从接种的哺乳动物中分离外周血单核细胞,体外培养约7天。在培养物中筛选符合标准的特异IgG。分离阳性孔中的细胞。经FACS分离单个产生Ig的B细胞,或者在补体介导的溶血斑实验中鉴定它们。产生Ig的B细胞可以显微操作到一个试管中,利用例如RT-PCR扩增VH和VL基因。将VH和VL基因克隆到抗体表达载体中,转染到细胞(例如,真核或原核细月包)内进4亍表达。此外,用于产生发明所述结合分子的基因序列可以得自许多不同来源。例如,象上面大量讨论过的,许多人抗体基因是公众可以获取的保存形式。许多抗体和抗体编码基因的序列已^皮公开了,可以利用本领域认可的技术由这些序列化学合成合适的抗体基因。与本发明这一方面相符的寡核苷酸合成技术是技术人员熟知的,可以利用任何商品自动合成仪来实现。另外,文中给出的编码不同种类重链和轻链的DNA序列可以通过商业的DNA合成服务获得。然后可以将利用任何以上方法得到的遗传物质进行改变或合成从而得到本发明的多肽。替代的,可以用技术人员熟知的技术挑选和培养抗体产生细胞系。这类技术在许多实验室手册和主流出版物中都有描述。就此而言,适用于本发明的4支术在CreW尸ratoco/s7mmwwo/ogy,Coliganetal.,Eds.,GreenPublishingAssociatesandWiley-Interscience,JohnWileyandSons,NewYork(1991)中有描述,该书以参考文献的方式全文引入本文,包括补充内容。还将理解的是,本发明的范围涵盖了稳定化的结合分子,其含现有公认的抗原结合DNA序列的等位基因、变体和突变体和本发明的稳定化scFv分子。众所周知,RNA可以从起始杂交瘤细胞或其它转化细胞中通过标准才支术分离到,所述技术是比如异石充氰酸胍提取和沉淀,随后进行离心或层析。如果需要,可以通过标准技术(比如在oligodT纤维素上进行层析)从总RNA中分离mRNA。合适的技术是本领域所熟悉的。在一实施方案中,编码抗体轻链和重链的cDNA可以同时或分别用逆转录酶和DNA聚合酶,根据公知方法制备。可以在已公开的重链和轻链DNA和氨基酸序列的基础上,用共有恒定区引物或更特异的引物引发PCR。如上面讨论过的,PCR也可以用于分离编码抗体轻《连和重链的DNA克隆。在这种情况中,可以用共有引物或更大的同源探针,比如小鼠恒定区探针来筛选文库。可以采用领域已知的技术从细胞中分离DNA(通常是质粒DNA),并按照在例如前面与重组DNA技术相关的参考文献中详细描述的标准公知4支术做限制酶切图谱和测序。当然,根据本发明,在分离或随后的分析过程中,DNA可以是合成的。用于发明所述结合分子的示范性抗体或其片段包括能够识别文中给出的耙物质的抗体。在一些实施方案中,可用本领域公知技术制备抗体的抗原结合片段。在一个具体实施方式中,本发明的结合分子可包含完整的抗体分子和稳定化的scFv分子。在另一个具体实施方式中,本发明的结合分子可包含抗体分子的一部分和稳定化的scFv分子。在一个具体实施方式中,本发明的结合分子包含抗体的片段或部分和稳定化的scFv分子。例如,在一个具体实施方式中,本发明的结合分子可包含结构域缺失的抗体和稳定化的scFv分子。结构域缺失的抗体是其中一个或多个结构域部分或完全缺失的抗体分子。在尤其优选的具体实施方式中,相容的稳定化的结合分子将包含结构域缺失的构建体或变体,其中去除了整个CH2结构域(ACH2构建体)。对于其他优选的具体实施方式,可用短的连接肽替代缺失的结构域,为可变区提供柔性和移动自由。所属领域技术人员会理解,由于CH2结构域对抗体分解代谢率的调节性质,这类构建体是尤其优选的。用编码IgG,人恒定结构域(例如参见,WO02/060955A2和WO02/096948A2)的载体(例如,来自于IDECPharmaceuticals,SanDiego)可衍生出结构域缺失的构建体。将会注意到,将这些示例性的构建体工程化,使CH3结构域直接融合于本发明各多肽的铰链区。在其他构建体中,希望在铰链区和合成的CH2和/或CH3结构域之间提供肽间隔序列。例如,可表达相容的构建体,其中缺失了CH2结构域,而余下的CH3结构域(合成或非合成的)用5-20个氨基酸间隔序列连接于4交链区。例如,可加入这类间隔序列以确保恒定结构域的调节元件仍旧自由并可接近,或者铰链区仍旧是柔性的。例如,可使用结构域缺失的B3F6构建体,其用短的氨基酸间隔序列来替换CH2结构域和较低的铰链区(B3F6.ACH2[gly/ser])。其他示例性的连接肽是现有已知的(例如参见,国际PCT申请WO2005/000898和WO2005/000899)。这些连接肽可用于连接本发明的结合分子。连接肽优选与缺少CH2重链结构域的多肽一起使用。任何本发明相容的连接肽优选将相对无免疫原性,而且不抑制本发明多肽的非共价连接。在一个具体实施方式中,本发明的结合分子包含免疫球蛋白重链,其缺失或替换一些或甚至一个氨基酸,只要它能使单体亚基之间进行所希望的共价或非共价连接。例如,CH2结构域的被选择的区域中的单个氨基酸突变基本足以实质上降低Fc结合,并由此增加肿瘤定位。相似地,可能只希望缺失掉一个或多个恒定区结构域的控制效应器调节功能(例如补体结合)的那部分。恒定区的这类部分缺失可改善所选的抗体特征(血清半衰期),而使其他所希望的与受试恒定区结构域相关的功能保留完整。此外,如上所提到的,通过对增强所得到的构建体的轮廓的一个或多个氨基酸加以突变或替换,可合成公开的抗体的恒定区。在这方面,有可能破坏保守结合位点所带来的活性(例如Fc结合),而基本上保留稳定化的结合分子的构型和免疫原性i普。其他优选的具体实施方式还可包括将一个或多个氨基酸添加到恒定区,以增强所希望的性质(例如效应器功能),或使更多细胞毒素或碳水化合物附着。在这类具体实施方式中,可能希望插入或复制源自所选的恒定区结构域的特定序列。现有已知的是,恒定区介导几种效应器功能。例如,补体C1成分与抗体的结合激活补体系统。在细胞病原体的调理作用和裂解中,补体的活化是重要的。补体的活化还刺激炎症应答并还可以参与自体免疫超敏。另外,抗体通过Fc区结合细胞,其中抗体Fc区上的Fc受体位点结合细胞上的Fc受体(FcR)。有大量特异于不同类型抗体的Fc受体,包括特异于IgG的Y受体,特异于IgE的s受体,特异于IgA的a受体,和特异于IgM的ia受体。抗体与细胞表面上的Fc受体的结合引发大量重要和多样的生物应答,包括抗体包被的颗粒的内吞和破坏,清除免疫复合物,由杀伤细胞裂解抗体包被的靶细胞(这被称为抗体依赖性细胞介导的细胞毒性或ADCC),释放炎性调节剂,胎盘转移和控制免疫球蛋白产生。在一个具体实施方式中,用lgG4抗体恒定区可消除或减少效应器功能,IgG4抗体恒定区被认为不能清除靶细胞或制备Fc变体,其中用现有已知的技术(例如,美国专利5,585,097)突变Fc区中对效应器功能至关重要的残基。例如,恒定区结构域(通过点突变或其它方式)的缺失或失活可减少循环中的稳定化的结合分子的FC受体结合性,由此增加肿瘤定位。在其他情况下可以是,与本发明相一致的恒定区修饰緩解补体结合,并由此降低血清半衰期和偶联的细胞毒素的非特异性连接。其他恒定区修饰还可用于修饰二硫键连接或寡糖分子,由于增强抗原特异性或抗体柔性,其能增强定位。更一般地,所属领域技术人员将意识到,如本文所述而^f'务饰的抗体可发挥大量微妙的、可或不可被迅速体会的作用。可是,用公知的免疫学技术无需过度实验,可容易地测量和定量修饰所得到的生理图谱、生物利用度和其他生化效应(例如肿瘤定位、生物分布和血清半衰期)。在一个具体实施方式中,用现有已知的^支术可由完整的前体或亲本抗体制备修饰形式的抗体。示例性的技术在本文中有更详细的讨论。B.修饰的融合蛋白在某些具体实施方式中,本发明的稳定化的结合分子是修饰的融合蛋白。在一个示例性的具体实施方式中,本发明的结合分子是包含稳定化的scFv分子的融合蛋白,所述scFv分子连接于受体的配体结合区、粘附分子、配体、或酶。在另一个示例性的具体实施方式中,本发明的结合分子是包含稳定化的scFv分子的融合蛋白,所述scFv分子连接于配体的受体结合部分。例如,本发明的结合分子是包含稳定化的scFv分子的融合蛋白,所述scFv分子连接于一个或多个以下分子细胞因子和细胞因子受体细胞因子对淋巴细胞的增殖、分化和功能性活化有多效性效应。各种细胞因子或其受体结合部分可以用在本发明的融合蛋白中。细胞因子的例子有,白细胞介素(例如IL-1、IL-2、1L-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-IO、IL-11、IL-12、IL-13和IL-18)、集落刺激因子(CSF)(例如,粒细胞CSF(G-CSF)、粒细胞-巨噬细胞CSF(GM-CSF),和单核细胞巨噬细胞CSF(M-CSF))、肿瘤坏死因子(TNF)a和(3,以及干扰素比如干扰素-a、卩或y(美国专利4,925,793和4,929,554)。细胞因子受体通常由配体特异性a链和共有的P链构成。细胞因子受体的例子有,GM-CSF、IL-3(美国专利5,639,605)、IL-4(美国专利5,599,905)、正-5(美国专利5,453,491)、IFNy(EP02409"75)的受体,及TNF受体家族(如TNFa(例如TNFR-l(EP417,563)、TNFR-2(EP417,014)淋巴毒素)3受体)。在另一个具体实施方式中,本发明的scFv分子可结合细胞因子或细胞因子受体。粘附蛋白粘附蛋白是使得细胞能够相互作用的膜结合蛋白质。各种粘附蛋白,包括白细胞归巢受体和细胞粘着分子,以及它们的受体结合部分可以引入到本发明的结合分子中。白血病归巢受体在发炎过程中表达在白细胞表面上,其包含卩-l整合蛋白(例如,VLA-1,2,3,4,5和6)和p2-整合蛋白(例如,LFA-1,LPAM-1,CR3和CR4),前者介导该受体与月包外基质成分的结合,后者能结合到血管内皮细胞上的细胞粘着分子(CAM)。示范性的CAM包括ICAM-1、ICAM-2、VCAM-l和MAdCAM-l。其它CAM包括选才奪蛋白家族成员,包括E-选择蛋白、L-选择蛋白、和P-选择蛋白。在另一个具体实施方式中,本发明的scFv分子可结合粘附蛋白或粘附蛋白受体。趋化因子刺激白细胞向感染部位迁移的趋化因子和趋化蛋白或其细胞因子受体结合部分也可以引入到发明所述结合分子中。示范性的趋化因子包括巨噬细胞炎性蛋白(MIP-l-a和MIP-l-(3)、嗜中性白细胞趋化因子以及RANTES(调节活化的正常T纟田胞表达和分泌的(regulatedonactivationnormallyT-cellexpressedandsecreted))。在另一个具体实施方式中,本发明的scFv分子可结合趋化因子或受体。生长因子和生长因子受体生长因子或其受体(或其受体结合或配体结合部分)或能与它们结合的分子也可以引入本发明的结合分子中。生长因子的例子有,血管生成素;血管内皮生长因子(VEGF)及其同种型(美国专利5,194,596);内皮细胞生长因子(JiGF);成纤维细胞生长因子(FGF),包括aFGF和bFGF;心钠素(ANF);肝细胞生长因子(HGF;美国专利5,227,158和6,099,841);神经营养因子,比如骨衍生的神经营养因子(BDNF)、神经营养蛋白-3,-4,-5或-6^丁-3,NT-4,NT-5或NT-6);或者神经生长因子,比如NGF-B血小板衍生的生长因子(PDGF)(美国专利4,889,919,4,845,075,5,910,574和5,877,016);转化生长因子(TGF),比如TGF-a和TGF-(3(WO90/14359);骨诱导生长因子,包括骨形态发生蛋白(BMP);类胰岛素生长因子-I和-II(IGF-I和IGF-II;美国专利6,403,764和6,S0《8M);促红细胞生成素(EPO);干细胞因子(SCF),血小板生成素(c-7l^/酉己体)和Wnt多肽(美国专利6,159,462)。可以使用的示范性生长因子受体包括EGF受体(EGFR);VEGF受体(例如Fltl或Flkl/KDR),PDGF受体(WO90A4425);HGF受体(美国专利5,648,273和5,686,292);IGF受体(例如,IGFR1和IGFR2)以及神经营养受体,包括低亲和性受体(LNGFR),又称为p75NTR或p75,该受体能够结合NGF、BDNF和NT-3;和高亲和性受体,该受体是受体酪氨酸激酶trk家族的成员(例如,trkA,trkB(EP455,460),trkC(EP522,530))。在另一实施方案中,针对的是IGFR1和VEGF。还有一实施方案中,针对的是VLA4和VEGF。还可以针对其它细胞表面受体和/或它们的配体(例如,TNF家族受体或其配体,在本文有更详细的描述)。在另一个具体实施方式中,本发明的scFv分子可结合生长因子或生长因子受体。激素生长激素,或能结合这些激素作为发明所述结合分子的靶向剂的分子的例子有,肾素、人生长激素(HGH;美国专利5,834,598)、N-曱硫氨酰人生长激素;牛生长激素;生长激素释放因子;曱状旁腺激素(PTH);促甲状腺素(TSH);曱状腺素;胰岛素原和胰岛素(美国专利5,157,021和6,576,608);促卵泡激素(FSH),降钙素,黄体生成素(LH),脂激素(leptin),胰高血糖素;蛙皮素;基因重组人生长激素;缪勒管抑制因子;松弛素和松弛素原;促性腺素关联肽;催乳素;胎盘催乳素;OB蛋白;或缪勒管抑制因子。在另一个具体实施方式中,本发明的scFv分子可结合激素或激素受体。凝血因子用来作为发明所述结合分子的靶向剂的血液凝集因子的例子有,凝血因子(例如,因子V,VII,Vm,X,IX,XI,XII和Xin,vonWillebrand因子);组织因子(美国专利5,346,991、5,349,991、5,726,147和6,596,84);凝血酶和;疑血酶原;纤维蛋白和纤维蛋白原;血纤蛋白溶酶和血纤蛋白溶酶原;纤溶酶原激活物,比如尿激酶或者人尿或组织型纤溶酶原激活物(t-PA)。在另一个具体实施方式中,本发明的scFv分子可结合凝血因子在其它具体实施方式中,本发明的稳定的结合蛋白质是修饰的免疫粘附素。现有公知的是,免疫粘附素是受体、粘附分子、配体、或酶的靶位结合区与抗体FC区的融合蛋白。例如,示例性的免疫粘附素被描述于美国专利5,116,964;5,428,130;5,714,147;和6,406,697,其每一篇都纳入本文参考。在一个具体实施方式中,通过将稳定化scFv分子与免疫粘附素连接,形成本发明的修饰的免疫粘附素。可如本文所述而对以前报道的免疫粘附素加以稳定化,用以提供本发明的修饰的免疫粘附素。用于产生或衍生所公开的修饰的免疫粘附素的示例性的免疫粘附素包括但不限于,abatecept(Orencia,Bristol-MeyersSquibb,Princeton,NJ),alefacept(Amevive⑧,Biogenldec,Cambridge'MA),ctanercept(Enbrel,Amgen,ThousandOaks,CA),SMARTTM抗y干护b素(ProteinDesignLabs,Fremont,CA),SMARTtm抗L-逸才奪蛋白(ProteinDesignLabs.Fremont,CA),rilonacept(RegeneronPharmaceuticalsInc.,Tarrytown,NY),regavirumab(丁I-23,TeijinAmerica,NewYork,NY),R24(国立癌症研究所(Bethesda,MD),Oprelvekin(NEUMEGA⑧,GeneticsInstitute,Cambridge,MA),ONCOLYSINB,ONCOLYSINCD6,ONCOLYSINM,和ONCOLYSINS(均来自ImmunoGenInc.,Cambridge,MA,美国),ONCOLYMTM131(TechnicloneCorp.,Tustin,CA),ImmuRAIT-LL2(ImmunomedicsInc.,MorrisPlains,NJ)'IL-4RA(BAY16-9996;BayerCorp.,Berkeley,CA),IC14(ICOSCorporation,Bothell,WA),CYT-356-Y-卯(ONCORAD⑧PR,CytogenCorp.,Princeton,NJ),COTARATM(TechnicloneCorp,,Tustin,CA),CMB-401(WyethPharmaceuticals,Madison,NJ),AVICIDIN共專厄物(NeoRxCorp.,Seattle,WA)和抗CD18免疫粘附素(GenentechInc.,S.SanFrancisco,CA)。包括在本发明的结合分子之内的另一个示例性的分子是免疫球蛋白超家族成员9(IGSF9;Genomics.2002.79:663-70)。C.结合特异性在一个具体实施方式中,本发明的结合分子结合出现在细胞表面上的或可溶的靶分子。在一个具体实施方式中,本发明的结合分子的至少一个结合特异性是利6,590,080,美国专利5,658,753)。催化性结合特异性可经大量类似于酶鉴定中稳定化转换状态的那些基础机制起作用,由此降低活化的自由能。例如,可对参与催化活性位点内催化的一般的酸性和碱性残基优化定位;可形成共价酶-底物中间体;催化抗体也可处在正确的反应方向中并增加反应物的有效浓度至少7个数量级(Fersht,A.R.,等,Am.Chem.Soc.卯(968):5833),由此大大降低化学反应嫡。最后,催化抗体可转化由底物结合得到的能量,用以使反应向类似转换状态的结构扭转。在一个具体实施方式中,用互补电荷分子作为免疫原将酸性或碱性残基带入结合位点中。该技术证明了能成功地用带有含正电铵离子的半抗原引发出抗体(Shokat,等,Chem.Int.Ed.Engl.27(1988):269-271)。在另一途径中,可针对稳定的化合物来引发抗体,该化合物与所希望的反应的转换状态有类似大小、形状和电荷(即,转换状态类似物)。参见美国专利4,792,446和美国专利4,963,355,其描述了^f吏用转换状态类似物来免疫动物并产生催化性抗体。这些专利都纳入本文参考。在一个具体实施方式中,这类分子可作为免疫偶联物的一部分,例如与免疫原性载体分子(例如KLH)—起来施用。示例性的催化结合特异性可有诸如酯酶活性(涉及带电荷的转换状态,其静电和形状特征被膦酸酯结构模拟;Jacobs,等,J.Am.Chem.Soc.l09(1987):2174-2176;Durfor,等,J.Am.Chem.Soc.110(1988):8713-8714;Tramontano,等,丄Am.Chem.Soc.110(1988):2282;Pollack,等,J.Am.Chem.Soc.111(1989):5961-5962);肽酶或酰胺酶活性(Janda,等,Science241(1988):1188-1191;Iverson,等,Science243(1989):1184-1188;Paul,等,Science244(1989):1158-1162);克莱125森重朝卜(Claisonrearrangement)(Jackson,等,J,Am.Chem.Soc.110(1988):4841-4842;Hilvert,等,Proc.Natl.Acad.Sci.USA85(1988):4953-4955;Hilvert,等,J.Am.Chem.Soc.l10(1988):5593-5594);氧化还原反应(Shokat,等,Angew.Chem.Int.Ed.Engl.27(1989):269-271);光化学裂解胸腺嘧吱二聚体(Cochran,等,J.Am.Chem.Soc.110(1988):7888-7890);立体特异性酯基转移重排(Napper,等,Science237(1987):1041-1043);或双分子酰胺合成(Benkovic,等,Proc.Natl.Acad.Sci.USA85(1988):5355-5358;Janda,等,Science241(1988):1188-1191)。在另一途径中,可对常规的结合特异性进行突变使它们具有催化性。催化性抗体活性的筛选方法是现有公知的(例如,Reymond,J丄.2002.JournalofImmunologicalMethods269:125;Mouratou等2002.J.ofImmunologicalMethods.269:147。在又一具体实施方式中,如美国专利6,590,080所述,利用被构建成方便催化性B细胞的选择的分子,可选择催化性B细胞。在另一个具体实施方式中,可开发作为二步过程的一部分的催化性结合特异性。仅当展现出以下结合特征时,才能选择催化抗体以使得底物基团和反应基团处在相互面对的反应位置上的方式结合底物和反应基团。其次,通过将反应基团共价结合入抗体结合口袋中,可化学工程化所选的抗体。JImmunolMethods.2002.269:81-98。在一个具体实施方式中,催化结合特异性特异针对前药。这类结合特异性可用于催化前药向体内有效的药物的转化。催化反应优选是天然酶在体内不能实现的反应。抗体活化前药的例子是现有已知的(例如参见,Miyashita等1993.Proc.Natl.Acad.Sci.USA卯5337)。在一个具体实施方式中,本发明的结合分子包括针对靶细胞的至少一个结合特异性和针对前药的至少一个结合特异性。例如,在优选的具体实施方式中,本发明的稳定的结合分子分子包括针对肿瘤细胞的至少一个结合特异性和针对可转化成细胞毒性药物的前药的至少一个结合特异性。在一个例子中,本发明的稳定的结合分子包括针对氨基甲酸酯前药4-[N,N,-双(2-氯乙基)]氨苯基-N-[(lS-(l,3-二羧基)丙基)氨基曱酸酯的结合特异性,并产生相应细胞毒性氮芥(Wentworth等1996.ProcNatl.Acad.Sci.USA.93:799)。在一个具体实施方式中,施用前药前施用结合分子以使其在靶细胞位点上积聚。示例性的前药是现有已知的。也可通过参入被设计成由催化作用释放的部分,例如通过带有醛缩酶活性的抗体所催化的连续的反向羟醛/反向Michael反应,来合成前药。(Shabat等2001.Proc.Natl.Acad.Sci.USA98:7428)。例如通过修饰药物的羟基或巯基,可制备这类覆盖药物的部分。在一个具体实施方式中,本发明的结合分子是多特异性的,即具有至少一个结合第一靶分子或靶分子的表位的结合位点和至少一个结合第二不同的靶分子或第一靶分子的第二不同的表位的第二结合位点。在某些具体实施方式中,本发明的多特异性结合分子(例如双特异性结合分子)包含至少一个来自本文(例如上文第A节)中所述的任何抗体的结合位点。在一个具体实施方式中,本发明的结合分子是双特异性的。双特异性对于抗体,双特异性的分子能结合诸如在相同抗原上的或两个不同抗原上的两个不同的表位。双特异性的分子可用于诸如诊断和治疗应用。例如,它们可用于固定免疫测试中所用的酶。它们还可以用于诊断和治疗癌症,如通过将这两者与肿瘤相关分子和可检测的标记(例如紧密结合放射性核素的螯合剂)结合。双特异性的分子也可用于人的疗法,例如通过将细胞毒性导向特定靶位(例如通过结合病原体或肿瘤细胞并结合细胞毒性引发分子,例如T细胞受体或Fcy受体。双特异性抗体也可用作诸如溶血纤剂或疫苗佐在一个具体实施方式中,本发明的多特异性结合分子包括带有至少一个针对细胞表面分子的臂(即结合位点)和至少一个对准可溶分子的臂的那些结合分子。在另一个具体实施方式中,本发明的多特异性抗体具有两个结合可溶分子的结合位点。在另一个具体实施方式中,本发明的多特异性抗体具有结合细胞表面分子的两个结合位点。本发明的多特异性结合分子对于每种特异性来说可以是单价的,或对于每种特异性来说可以是多价。在一个具体实施方式中,本发明的双特异性结合分子可包含一个与第一靶分子反应的结合位点和一个与第二靶分子反应的结合位点(例如双特异性抗体分子、融合蛋白、或微型抗体)。在另一个具体实施方式中,本发明的双特异性结合分子可包含两个与第一靶分子反应的结合位点和两个与第二靶分子反应的结合位点(例如双特异性的scFv2四^介抗体、四<介孩£型抗体、或只又^t体)。在某些具体实施方式中,本发明多特异性结合分子的至少一个结合位点是抗体的抗原结合区或其抗原结合片段。在一个具体实施方式中,本发明的多特异性结合分子是二价抗体或抗体变体,其中一个臂含至少一个针对第一靶分子的稳定化的scFv,而且第二个臂含至少一个针对第二靶分子的稳定化的scFv。在一个具体实施方式中,本发明的多特异性结合分子包含至少一个连接于重链C末端的稳定的scFv(例如2、3、或4个scFv),其中scFv具有相同或不同的结合特异性。示例性的这类结合分子("C-Hercules"抗体)如图13所示。在另一个具体实施方式中,本发明的多特异性结合分子包含至少一个连接于重链N末端的稳定化的scFv(例如2、3、或4个scFv),其中scFv具有相同或不同的结合特异性。示例性的这类结合分子("NH-Hercules"抗体)如图13所示。在另一个具体实施方式中,本发明的多特异性结合分子包含至少一个连接于轻链N末端的稳定化的scFv(例如2、3、或4个scFv),其中scFv具有相同或不同的结合特异性。示例性的这类结合分子("NL-Hercules"抗体)如图13所示。在另一个具体实施方式中,本发明的多特异性结合分子包含至少一个连接于重链或轻链N末端的稳定化的scFv(例如2、3、或4个scFv)和至少一个连接于重链C末端的稳定化的scFv(例如2、3、或4个scFv),其中scFv具有相同或不同的结合特异性。在一个具体实施方式中,本发明的多特异性结合分子是二价微型抗体,其中一个臂含至少一个针对第一靶分子的scFv片段,而且第二个臂含至少一个针对第二耙分子的稳定化的scFv,其中至少一个scFv分子是稳定化的。示例性的双特异性二价微型抗体构建体如图42所示。在图42中,CH3结构域在其N末端上与连接肽融合,所述连接肽在其N末端上与VH结构域融合,所述VII结构域通过其N末端与(Gly4Ser)n柔性接头融合,所述接头在其N末端上与VL结构i戈融合。在另一个具体实施方式中,本发明的多特异性结合分子是scFv四价微型抗体,其中scFv四价微型抗体的每个重链部分含第一和第二scFv片段,其中至少一个scFv分子是稳定化的。所述第二scFv片段可连接于第一scFv片段的N末端(例如双特弄性的NhscFv四价微型抗体或双特弄性的NlscFv四价微型抗体)。双特异性的N-scFv四价微型抗体的例子如图43所示。可选的是,128第二scFv片段可连接于含所述第一scFv片段的所述重链部分的C末端(例如双特异性的C-scFv四价微型抗体)。双特异性的C-scFv四价微型抗体的例子如图44所示。在一个具体实施方式中,第一和第二scFv片^殳可结合相同或不同的靶分子。当双特异性四价微型抗体第一重链部分的第一和第二scFv片段结合相同的靶分子时,双特异性四价微型抗体的第二重链部分的第一和第二scFv片段中至少一个结合不同的靶分子。在另一个具体实施方式中,本发明的多特异性结合分子是双特异性的双抗体,其中双抗体的每个臂包含串联的scFv片段,其中至少一个是稳定化的。在一个具体实施方式中,双特异性双抗体可包含带有第一结合特异性的第一臂和带有第二结合特异性的第二臂(例如参见图45)。在另一个具体实施方式中,双体的每个臂可包含带有第一结合特异性的第一scFv片段和带有第二结合特异性的第二scFv片段。在另一个具体实施方式中,本发明的多特异性结合分子是scFv2四价抗体,其中scFv2四价抗体的每个重链部分含scFv分子,其中至少一个scFv分子是稳定化的。scFv片段可连接于重链部分可变区的N-末端(例如双特异性的NuscFv2四价抗体或双特弄性的NlscFv2四价抗体)。可选的是,scFv片段可连接于scFv2四价抗体重链部分的C-末端(例如双特异性的C-scFv2四价抗体,例如参见图46)。scFv2四价抗体的每个重链部分可具有结合相同或不同靶分子的可变区和scFv片段。当双特异性的scFc2四价抗体第一重链部分的scFv片段和可变区结合相同的靶分子时,双特异性的四价微型抗体的第二重链部分的第一和第二scFv片段中至少一个结合不同的靶分子。在另一个具体实施方式中,本发明的多特异性结合分子是scFv2四价结构域缺失的抗体,其中scFv2四价抗体的每个重链部分含scFv片段,其中至少一个是稳定化的。scFv片段可连接于重链部分可变区的N-末端(例如双特异性的NnscFv2四价结构域缺失的抗体(参见图48)或双特异性的NLScFvZ四价抗体(参见图49)。可选的是,scFv片段可连接于scFv2四价结构域缺失的抗体重链部分的C-末端(例如双特异性的C-scFv2四价结构域缺失的抗体,例如参见图47)。本发明的结合分子可与之结合的示例性的细胞表面分子包括在肿瘤或瘤细胞表面上过量表达的受体或肿瘤细胞抗原、以及任何本文中(例如上文第B节)所述的细胞因子受体、粘附分子、或生长因子受体。示例性的可溶分子包括本文中(例如上文第A节)所述的抗肿瘤剂(例如毒素、化疗药、和其前药)、可溶性酶(例如转化前药的酶)、细胞因子、趋化因子、激素、生长因子、或凝血因子。因此,结合肿瘤细胞抗原和抗肿瘤剂或可溶性酶的双特异性分子可将抗癌剂定位于表达所述肿瘤细胞抗原的肺瘤细胞上,由此使抗癌剂对肿瘤细胞的毒性效应最大化并使抗癌剂对正常细胞的毒性效应最小化。带有至少一个针对肿瘤抗原的结合位点和至少一个针对毒素的结合位点的示例性的双特异性结合分子包括抗皂草毒素(saporiny抗Id-1、抗CD22/抗皂草毒素、抗CD7/抗皂草毒素、抗CD38/抗皂草毒素、抗CEA/抗蓖麻毒素A链、抗干扰素-a(IFN-a)/抗杂交瘤独特型、抗CEA/抗长春花属生物石威)。带有至少一个针对细胞表面分子的结合位点和至少一个针对转化前药的酶的结合位点的示例性的双特异性结合分子包括例如,抗CD30/抗碱性磷酸酯酶(其催化将磷酸丝裂霉素前药转化成化疗的丝裂霉素醇(mitomycinalcohol))。在其它具体实施方式中,双特异性结合分子既结合肿瘤细胞抗原也结合诊断剂,由此将所述诊断剂定位于表达所述肿瘤细胞抗原的肿瘤细胞上,并方便在体外或体内的肿瘤^^测。示例性的双特异性结合分子包括抗CEA/抗KOTUBE、抗CEA/抗DPTA、抗CEA/抗p-半乳糖苷酶、和抗pl85HER2/抗-半抗原)。在其它具体实施方式中,本发明的双特异性结合分子既结合可溶分子(例如可溶性抗原)又结合非肿瘤细胞(例如免疫细胞)上的表面分子。例如,可用于将可溶性免疫复合物靶向免疫细胞上的细胞表面受体,由此方便它们通过细胞介导的免疫机制从机体中清除掉。这类示例性的双特异性分子包括抗低密度脂蛋白(LDL)/抗Fc受体(例如FcyRI,FcyRII或FcyRIII))和用于治疗传染病的双特异性结合分子(例如抗CD3/抗单纯疱疹病毒(HSV)、抗T细胞受体CD3复合物/抗流感、抗FcyR/抗HIV。在其它具体实施方式中,本发明的双特异性结合分子能既结合细胞表面受体又结合其可溶性配体。在一个具体实施方式中,配体是TNF家族受体的同源配体。双特异性结合分子可结合的示例性的细胞表面受体是肿瘤细胞抗原或免疫细胞受体。示例性的细胞表面受体还包括在本文(例如在上文第B节)中所述的细胞因子受体、粘附分子、或生长因子受体。示例性的可溶性配体包括例如在上文第B节中所述的细胞因子、趋化因子、激素、生长因子、或凝血因子。示例性的双特异性结合分子包括抗VLA4/抗Mac-l、抗VLA4/抗VEGF、抗VLA4/抗血管生成素、抗VLA4/抗TNFa、抗IGFR1/抗VEGF、抗IGFR1/抗血管生成素、抗IGFR1/抗EGFR、抗HGF-SF/抗VEGF、抗HGF-SF/抗血管生成素、和HGF-SF/任何第二抗原(例如参见,Cao等Proc.Natl.Acad.Sci2001.98:7443;Lu等2004.J.Biol.Chem.279:2856)。在其它具体实施方式中,本发明的双特异性结合分子包括带有至少一个针对第一可溶分子(例如可溶性配体)的臂(即结合位点)和至少一个针对第二可溶分子(例如可溶性配体)的臂的那些结合分子。这类双特异性结合分子可用作为诊断工具(例如抗兔IgG/抗铁蛋白、抗辣根过氧化物酶(HRP)/抗激素、抗生长激素抑制素/抗物质P,抗HRP/抗FITC(参见Nolan等,同上))或溶血纤剂(例如抗纤维蛋白/抗组织纤溶酶原激活因子(tPA)、抗纤维蛋白/抗尿激酶型纤溶酶原激活因子(uPA))。在优选的具体实施方式中,本发明双特异性的结合分子结合的可溶性分子是TNF家族的可溶性配体。TNF家族配体的例子包括但不限于,LTA(其结合TNFR1/TNFRSF1A),TNF(其结合CD120b/TNFRSF1B),LTB(其结合LTBR/TNFRSF3),OX40L(其结合OX40/TNFRSF4),CD40L(其结合CD40/TNFRSF5),(其结合Fas/TNFRSF6和DcR3/TNFRSF6B),CD27L(其结合CD27/TNFRSF7),CD30L(其结合CD30/TNFRSF8),4-l-BB-L(其结合4-1-BB/TNFRSF9),TRAIL(其结合TRAIL-R1/TNFRSF10A,TRAIL-R2/TNPRSF10B,TRAIL-R3/TNFRSF10C,和TRAIL-R4/TNFRSF10D),RANKL(其结合RANK/TNFRSF11A和护骨素/TNFRSF11B),APO-3L(其结合APO-3/TNFRSF12和DR3L/TNFRSF12L),APRIL(其结合TACI/TNFRSF13B),BAFF(其结合BAFFR7TNFRSF13A),LIGHT(其结合HVEM/TNFRSF14),NGF配体(其结合LNGFR,例如.NGF-p,NGF-2/NTF3,NTF5,BDNF,IFRD1),GITRL(其结合GITR/TNFRSF18),EDAR1和XEDAR配体,Fnl4配体,和Troy/Trade配体。在其他示例性的具体实施方式中,本发明的双特异性结合分子具有至少一个针对第一细胞表面分子的结合位点和至少一个针对第二细胞表面分子的结合位点。在一个具体实施方式中,第一和第二细胞表面分子位于不同的细胞(例如不同细胞类型)上。例如,双特异性分子可具有针对肿瘤细胞抗原的至少一个臂和针对非胂瘤细胞(例如免疫细胞)上细胞-表面受体的至少一个臂。这类示例性的双特异性结合分子包括具有至少一个针对肿瘤细胞抗原的结合位点和至少一个针对免疫效应器细胞的细胞毒性引发分子的结合位点的那些结合分子(所述引发分子例如抗FcyRI/抗CD15,抗pl85.sup.HER2/FcyRIII(CD16),抗pl85.sup.HER2/抗VEGF,抗CD3/抗恶性肿瘤B细胞(1D10),抗CD3/抗pl85.sup,HER2,抗CD3/抗p97,抗CD3/抗肾细胞癌,抗CD3/抗OVCAR-3,抗CD3/L-D1(抗结肠癌),抗CD3/抗黑素细胞刺激激素类似物,抗EGF受体/抗CD3,抗CD3/抗CAMA1,抗CD3/抗CD19,抗CD3/MoV18,抗神经细胞粘附分子(NCAM)/抗CD3,抗叶酸结合蛋白质(FBP)/抗CD3,和抗癌相关的泛抗原(AMOC-31)/抗CD3))。既结合肺瘤细胞抗原又结合细胞毒性引发分子的双特异性分子能有效将肿瘤细胞与免疫效应器细胞并置,由此通过细胞介导的免疫机制活化效应器细胞来破坏肿瘤细胞。在另一个具体实施方式中,双特异性结合分子能结合的第一和第二细胞表面分子位于相同的细胞或细胞类型上。通过在相同细胞上交联第一和第二受体,本发明的双特异性结合分子可抑制或增强与第一和第二受体之一或两者相关的活性(例如信号转换活性)。在一个具体实施方式中,第一和第二细胞表面分子是相同类型的(例如,是同一分子家族的)。在另一个具体实施方式中,所述第一和第二细胞表面分子是不同类型的(例如,是不同分子家族的)。双特异性结合分子结合的示例性的细胞表面受体包括肿瘤细胞抗原或免疫细胞受体。示例性的细胞表面受体包括任何上文第B节所述的细胞因子受体、粘附分子、或生长因子受体。在一个具体实施方式中,本发明的结合分子结合的示例性的靶分子包括,诸如硫酸肝素、生长因子或它们的受体(例如,表皮生长因子受体、胰岛素样生长因子受体、肝细胞生长因子(HGF/SF)受体的一个或多个表位(例如参见,Cao等Proc.Natl.Acad.Sci.2001.98:7443;Lu等2004.J,BioLChem.279:2856)。在示例性的具体实施方式中,本发明的双特异性结合分子结合的至少一个分子是TNF受体(TNFR)家族的成员。在另一个示例性的具体实施方式中,本发明的双特异性结合分子结合的第一和第二靶分子都是TNFR家族成员。在另一个具体实施方式中,本发明的结合分子结合TNFR家族配体。在又一具体实施方式中,本发明的结合分子结合一个TNFR家族成员和在肺瘤细胞表面上表达的(例如优选在肺瘤细胞上表达的)抗原。用单特异性TNFR结合分子治疗肿瘤的限制因素是通常仅有一部分肿瘤表现出对这类疗法敏感。多特异性的TNFR结合分子可特异活化TNFR,并诸如通过将TNFR带到近邻位来增强受体信号。本发明提供了改进的双特异性的TNFR结合分子,其靶向一个以上的TNFR或TNFR类型并增强信号,由此提供改进的治疗癌症的方法。在一个具体实施方式中,双特异性的TNFR结合分子通过结合两个或多个同类TNFR,增强聚在一起的TNFR数,来增加信号强度。在另一个更优选的具体实施方式中,双特异性的TNFR结合分子能结合两个不同的TNF家族的受体。在一个具体实施方式中,双特异性的TNFR结合分子结合的至少一个TNFR含死亡结构域。术语"死亡结构域"指TNF家族受体的细胞质区,其参与TNF-介导的细胞死亡或凋亡信号传递和这些受体介导的细胞-细胞毒性。该区偶联受体,从而通过适配蛋白级联活化,造成外表死亡途径的活化。含死亡结构域的TNF受体的例子包括但不限于,TNFRI(TNFRSFIA),1,as(TNFRSF6),DR-3(TNFRSF6B),LNGFR(TNFRSF16)TRAIL-R1(TNFRSF10A),TRAIL-R2(TNFRSF1OB)和DR6(TNFRSF21)。通过结合同源配体并形成以下受体-配体对之任一个,来调节这些受体的凋亡信号传递TNFRl/TNFa,Fas/FasL,DR-3/DR-3LG,TRAIL-R1/TRAIL,或TRAIL-R2/TRAIL。靶向含死亡结构域的TNF家族受体的双特异性的TNFR结合分子用于治疗癌,因为该类TNFR通常在肿瘤细胞上过量表达,刺激受体能激活肿瘤细胞凋亡。在优选的具体实施方式中,本发明双特异性的TNFR结合分子结合的含死亡结构域的TNFR是TRAIL-R2。TRAIL-R2优选用于人肿瘤的治疗,因为其活化不引发肝细胞凋亡,因此应该能降低毒性。一些含死亡结构域的受体(例如TNFR1或Fas)的活化对体内应用有毒性,而将这些受体束缚在其他TNF受体上则可能减小毒性,因此使有毒抗体毒性较小。在一个具体实施方式中,本发明的双特异性TNFR结合分子包含至少一个4十对含死亡结构域的TNFR的结合位点和至少一个4"M十缺乏死亡结构域的TNFR的结合位点。在某些示例性的具体实施方式中,缺乏死亡结构域的TNFR包括参与组织分化的TNFR。参与组织分化的TNFR受体的例子包括LT(3R,RANK,EDAR1,XEDAR,Fnl4,Troy/Trade,和NGFR。结合同类配体后,参与组织分化的TNFR可影响组织分化。耙向参与组织分化的TNFR的TNFR结合分子能以几种方式影响肿瘤。首先,它们具有通过改变细胞周期进程直接降低肺瘤生长的潜力。其次,与肿瘤细胞转化有联系的组织分化可导致细胞周期沖突并一般会凋亡。第三,这类沖突输入可使细胞对化疗更敏感。在某些优选的具体实施方式中,参与组织分化的TNFR是淋巴毒素卩受体(LTPR)。LT(3R参与控制免疫系统中各种专门的基质细胞的成熟状态,并在淋巴结原基基质元件发育期间起关键作用。有人提议,与转化的细胞有联系的上皮或成纤维样(fibroblastoid)细胞的发育过程的激活,将对它们的存活有害,该作用可解释LT(3R活化的一些抗肿瘤活性。这些受体也能引发炎性过程,其包括趋化因子释放或促进抗肿瘤免疫应答。这类释放可能影响肿瘤的炎症状态和/或使淋巴元件渗透,促进对肿瘤的免疫学反应。因而,单独结合L'rpR、或与含死亡结构域的TNF受体一起结合LT(3R的双特异性的TNFR结合分子(例如TRAIL-R2)也为本发明所涵盖。在某些示例性的具体实施方式中,缺乏死亡结构域的TNFR包括参与免疫调节的TNFR。这类受体包括TNFR2,HVEM,CD27,CD30,CD40,4-1BB,0X40,GITR,TACI,BAFF-R,BCMA,和RELT。其他参与免疫调节的TNF家族受体包括TRAIL-R3和TRAIL-R4。用现有的在各种细胞类型上进行受体表达的RNA数据库,可鉴定出其他具有肿瘤形成作用的靶TNF家族受体,从而确定在各种肿瘤上出现或理想地过量表达的TNF家族受体。此外,现有的RNA数据库提供了额外的优点,即通过鉴定那些在肿瘤类型或肿瘤子集上较特异地表达但在正常组织(尤其是肝和血管)上不丰富的受体对,可鉴定出本发明双特异性的TNFR结合分子结合的TNF家族受体对。以该方式,可鉴定向肿瘤和少量正常组织传递有效信号的受体对(或更多受体)。产生多特异性的分子的方法是现有公知的。例如,可用重组技术来产生多特异性的分子,例如双抗体、单链双体、串联scFv等。产生多特异性分子的示例性的技术是现有已知的(例如,Kontermann等MethodsinMolecularBiology,248巻AntibodyEngineering:MethodsandProtocols.Pp227-242US2003/0207346Al和其中引用的文献)。在一个具体实施方式中,用如US2003/0207346Al或美国专利5,821,333、或US2004/0058400所述的那些方法制备多聚多特异性分子。在另一个具体实施方式中,本发明的多特异性结合分子是多特异性的融合蛋白。本文所用的短语"多特异性融合蛋白"指融合蛋白(例如上文中定义的),其具有至少两个结合特异性(即结合了配体或受体的结合结构域)。可将多特异性融合蛋白装配成诸如异二聚体、异三聚体或异四聚体,这基本在WO89/02922(公开于1989年4月6日)、EP314,317(公开于1989年5月3曰)、和美国专利5,116,9M(颁布于19M年5月2日)中有公开。优选的多特异性融合蛋白是双特异性的。双特异性融合蛋白的例子包括CD4-scFv/TNF受体-IgG和CD4-scFv/L-选择素-IgG。前述分子组合了淋巴细胞归巢受体(LHR,L-选择素)的淋巴结结合功能和CD4的HIV结合功能,并发现可潜在应用于预防或治疗HIV感染、相关病况,或用于诊断。在另一个具体实施方式中,本发明涉及多特异性的稳定化的结合分子,例如双特异性结合分子(例如抗体),其整合了至少一个结合已知靶的结合位点和至少一个识别未知輩巴的结合位点。(例如,在一个具体实施方式中,双特异性分子整合了选自半合成抗体噬菌体展示文库的结合位点和本发明的稳定化的scFv。在本发明的一个具体实施方式中,本领域普通技术人员可以已知特异性的单链抗体开始并用现有已知的技术构建Fab文库,或者可选的是,普通技术人员可以已知特异性的Fab片段开始并用现有已知的技术构建稳定化的单链文库。现有已知的是,可使用来自未免疫来源的、和通过V-基因序列的合成性重组(优选用DH和JH重组VH,并用JL序列重组VL)制备的文库来分离针对任何抗原的抗体。例如,专利申请WO92/01047教导了可将抗体片段展示在噬菌体表面上,并且它们将结合抗原。用该特点可直接选出抗体片段(例如,Fab、Fv、scFv和VH)。其他现有已知的方法包括诸如美国专利5,698,426;6,291,159;5,658,727;5,667,988;和5,969,108所教导的那些。在另一个具体实施方式中,识别已知靶的scFv可与分离自半合成人噬菌体抗体展示文库的scFv二聚化。(例如参见,Kruif和Logtenberg1996.J.Biol.Chem.271:7630)。在一个具体实施方式中,受试多特异性分子在用于表达抗体分子的表达系统中表达,例如在哺乳动物细胞、诸如毕氏酵母的酵母、大肠杆菌、杆状病毒等中。在一个具体实施方式中,受试双特异性分子在NEOSPLA载体系统中表达(例如参见,美国专利6,159,730)。该载体含巨细胞病毒启动子/增强子、小鼠(3球蛋白主要启动子、SV40复制起始点、牛生长激素多聚腺苷酸化序列、新霉素磷酸转移酶外显子1和外显子2、二氢叶酸还原酶基因和前导序列。在一个具体实施方式中,受试多特异性的分子包含合成的连接肽。这些多特异性分子具有一个或多个针对已知靶位的结合位点,并在一个或多个结合位点上表达文库。这类多特异性的分子可用于诸如鉴定与已知靶位紧密相邻或相连的分子。例如,普通技术人员用现有公知的筛选方法在测试中使用受试的多特异性分子,来选出诱导特定应答(例如凋亡或细胞活化)的那些多特异性分子。然后可鉴定鉴定为产生所筛选的应答的双特异性分子,并确定其特异性。利用该方法可能鉴定与感兴趣的特定靶位紧密相连的分子,例如T细胞标记或其他信号分子(例如CRIPTO-I、死亡结构域分子、或参与凋亡的分子)。用免疫沉淀或本领域普通技术人员已知的其他技术,可确认已知靶位和新鉴定为"最接近的邻居"的分子是否接近。利用这些方法可能将分子鉴定为调节特定细胞应答的靶位。带有结合特异性的多特异性结合分子(尤其是本发明的多特异性抗体或抗体变体)抗原识别位点或完整可变区可源自一个或多个亲本抗体。亲本抗体可包括天然产生的抗体或抗体片段、根据天然产生的抗体改造的抗体或抗体片段、用已知特异于靶分子的抗体或抗体片段序列重新构建的抗体。源自亲本抗体的序列包括重和/或轻链可变区和/或CDR、框架区或其其他部分。在本发明的一个示例性的具体实施方式中,用于构建多特异性的TNFR结合分子的亲本抗体是抗TRAIL-R2抗体(例如14A2)和抗LT(3R抗体(例如CBE11或BHA10)。多价的、多特异性的抗体可含有包含两个或更多可变区的重链和/或包含一个或多个可变区的轻链,其中至少两个可变区识别L邓R的不同表位。可利用各种不同的源自亲本抗LTPR抗体的序列,包括鼠或人源化的BHA10(Browning等,乂/wmw"o/.154:33(1995);Browning等j:Med183:867(1996))、鼠或人源化的CBE11(美国专利6,312,691和WO02/30986)、和/或亲本抗TRAIL-R2鼠或嵌合14A2,以各种不同方式来构建多特异性(例如双特异性)TNFR结合分子。可用于本发明的双特异性TNFR结合分子的抗LT(3R抗体的例子包括BKA11,CDH10,BCG6,AGH1,BDA8,CBE11和BHA10或BHA10。以下产生单克隆抗LT-p-R抗体的杂交瘤细胞系可用于产生抗LT(3R抗体,由该抗LT(3R抗体衍生出抗体构建体序列,这些杂交瘤细胞系以前根据布达佩斯条约被保藏于美国典型培养物保藏中心(ATCC)并被分配有所示的ATCC登录号<table>tableseeoriginaldocumentpage137</column></row><table>可用于本发明多特异性TNFR结合分子的抗TNF受体抗体的其他例子包括针对含死亡结构域的TNF受体的抗体。已经产生大量针对含死亡结构域的TNF受体的抗体,而且它们是现有公知的。这类抗体包括抗TNF-R1单克隆抗体(R&Dsystems的抗TNF-R1;TularikmAb#985,美国专利6,110,690;6,437,113),抗Fas受体mAbCH-11(美国专利号6,312,691;WO95/10540),抗DR3抗体(美国专利号5,985,547;Johnson,等(1984)JmmunoBiologyofHLA,Dupont,B.O.编,Springer,NewYork;美国专利6,462,176;6,469,166),和抗TRAIL-R抗体(美国专利5,763,223;6,072,047;6,284,236;6,521,228;6,569,642;6,642,358;和美国专利6,417,328)。也已经产生大量针对参与组织分化的TNF受体的抗体,而且它们是现有已知的。特异于参与组织分化的TNF受体的抗TNF受体抗体的例子包括抗RANK单克隆抗体(Immunex-美国专利6,562,948;6,537,763;6,528,482;6,479,635;6,271,349;6,017,729;Komed-WO03/080671),抗EDAR多克隆(抗人)和单克隆(抗小鼠)抗体(R&DSystems-MAB745,BAF157;Elomaa等(2001)HumanMolecularGenetics.10:953),抗XEDAR单克隆和多克隆抗体(R&DSystems-MAB1093和AF1093),抗Fnl4单克隆抗体(Nakayama等(2003)J.Immunology170:341;可得自eBioscience的ITEM-l、ITEM-2、和ITEM-4克隆),抗TROY抗体(来自Sigma-Aldrich的T3323),和抗NGFR(抗啮齿类)抗体(ChemiconUSA)。也已经产生大量针对参与免疫调节的TNF受体的抗体,而且它们是现有已知的。特异于参与免疫调节的TNF受体的抗TNF受体抗体的例子包括抗HVEM抗体(HGSI-WO03/086301),抗CD40抗体(Biogen-WO97/20063;Chiron-美国专利5,677,165;5,874,082;6,004,552;6,056,959;6,315,998;美国申请公开号2002/0106371;美国申请公开号2003/0059427;US20030118588A1;2003/0211100A1;US2002020142358A1;美国专利US6312693;US6051228;Fanslow等一US5801227),抗4-lBB(PCT公开号WO03/084999;EP0948353;美国专利号6210669;Genecraft—WO03/083069),和抗BAFF-R抗体(兔多克隆-ProSci目录#3097),还有许多其他的针对免疫调节受体的抗体。本领域普通技术人员利用常规重组DNA技术可开发出各种其他多价抗体构建体,例如如以下文献所述的PCT国际申请号PCT/US86/02269;欧洲专利申请号184,187;欧洲专利申请号171,496;欧洲专利申请号173,494;PCT国际公开号WO86/01533;美国专利4,816,567;欧洲专利申请号125,023;Better等(1988)>SWe"ce240:1041-1043;Liu等(1987)户rac。Ato/.」cadSc/.OS^84:3439-3443;Liu等(1987)乂/mww"o/.139:3521-3526;Sun等(1987)尸rac.A^//.爿cad5W.6^484:214-218;Nishimura等(1987)Cfl"c'wW^.47:999-1005;Wood等(1985)Atoww314:446-449;Shaw等(198S)乂Ato/.Ca"cer/"W.80:1553-1559);Morrison(1985)Sc/e"ce229:1202-1207;()i等(1986)S/orec/7m-,es4:214;美国专利5,225,539;Jones等(1986)7Va^re321:552-525;Verhoeyan等(1988)5We"ce239:1534;Beidler等(1988),/./mm画/.141:4053-4060;和Winter和Milstein,Nature,349'pp.接而"人源化,,(例如Cabilly等,美国专利4,816,567;Morrison等,Proc.Natl.Acad.Sci.U.S.A.,81,pp.6851-55(1984》。其他用于制备多价抗体构建体的方法在以下公开出版物中有描述Ghetie,Maria-Ana等(2001)97:1392-1398;Wolff,EdithA.等(1993)C騰erie廳w/753:2560-2565;Ghetie,Maria-Ana等(1997)Prac.淑/.Jcad7509-75",'X/w,乂C.爭f2002;/W.■/Ca"cer97(4):542-547;Todorovska,Aneta等(2001)JbwvW0/7m附wMo/og7'ca/Mef/zo<is248:47-66;ColomaM丄等(1997)Atowe所ofec/z"o/。^15:159-163;Zuo,Zhuang等(2000)/)r。to."w/"g(^wp//.」13(5):361-367;SantosA.D.,等(1999)C//m'ca/Caw〔,'er7exe(3n:'/75.','尸mto,LecwaniGf2002)CWrew//J/ztarmacei^/ca///o/ec/zwo/ogv3:237-256;vanSpriel,A認miek等,(2000)Wev/ew/〃謂謂o/(9gv7b(i"721(8)391-397。XI.结合分子的表达如上所述对分离的遗传物质进行操作以便提供发明所述多肽之后,通常要将基因插入表达载体来弓1入宿主细胞,该宿主细胞可以用于表达所需量的多肽,进而提供要求保护的结合分子。为了说明书和权利要求,名词"载体"或"表达载体"用在本文中意味着作为将所需基因导入细胞并进行表达的媒介物(vehicle)的载体。正如本领域技术人员已知的,这类载体可以容易地从质粒、噬菌体、病毒和逆转录病毒中选择。通常,适用于本发明的载体包含选择标记、协助克隆所需基因的合适的酶切位点以及进入真核或原核细胞并且/或者在真核或原核细胞中复制的能力。用于本发明时,有大量表达载体系统可以采用。例如,一类是利用来源于动物病毒的DNA元件的载体,其中所述动物病毒是比如牛乳头瘤病毒、多瘤病毒、腺病毒、痘苗病毒、杆状病毒、逆转录病毒(RSV、MMTV或MOMLV)或SV40病毒。其它载体涉及到利用带有内部核糖体结合位点的多顺反子系统。此外,可以通过导入一或多个能够用来挑选被转染宿主细胞的标记物来挑出DNA整合到染色体中的细胞。所述标记物可以给营养缺陷型宿主提供原养型能力、提供对杀生物剂的抗性(例如,抗生素)或对重金属(比如铜)的抗性。选择标记基因可以直接连在待表达DNA序列上,或者通过共转化导入相同的细胞。合成mRNA的最佳条件可能还需要另外的元件。这些元件可以包括信号序列、切割信号,以及转录启动子、增强子和终止信号。在特别优选的实施方案中,将克隆的可变区基因和按照上面的讨论合成的重链和轻链恒定区基因(优选人的)一起插入表达载体。优选的,用IDEC,Inc.的专有表达载体NEOSPLA(美国专利6159730)来实施。该载体含有巨细胞病毒启动子/增强子、小鼠P球蛋白主启动子、SV40复制原点、牛生长激素多腺苷酸化序列、新霉素磷酸转移酶外显子1和2、二氢叶酸还原酶基因和引导序列。在后面的实施例中会看到,在该载体中引入可变和恒定区基因,转染CHO细胞,然后在含有G418的培养基中进行挑选和氨曱喋呤扩增会造成抗体的高水平表达。美国专利5736137和5658570中也有关于载体系统的教导,这两篇专利均以参考文献的方式全文引入本文。该系统提供了高表达水平,例如〉30pg/细胞/天。其它示范性的载体系统在例如美国专利6413777中有公开。在其它优选实施方案中,本发明的多肽可以用多顺反子构建体来表达,比如2001年11月16日提交的待审美国临时申请60/331,481中公开的那些,该申请全文引入本文。在这些新的表达系统中,多个目的基因产物,比如抗体的重链和轻链可以由单个多顺反子构建体产生。这些系统有利地利用了一个内部核糖体进入位点(IRES)来提供在真核细胞内较高水平表达发明所述多肽。适用的IRES序列在美国专利6,193,980中有公开,该专利同样引入本文。本领域技术人员能够意识到,可以利用这类表达系统来高效地产生本申请公开的各种多肽。更一般地,一旦准备好了编码某多肽(例如,经修饰的抗体)之单体亚基的载体或DNA序列,可以将表达载体导入合适的宿主细胞。即可以转化宿主细胞。质粒可以通过本领域4支术人员所熟知的多种4支术导入宿主细胞。这些技术包括,但不限于,转染(包括电泳和电穿孔)、原生质体融合、磷酸4丐沉淀、与包被DNA进行的细胞融合、显微注射以及用完整病毒进行感染。参见,Ridgway,A.A.G."Mawwa/Zaw£bc//^57'owKector'Chapter24.2,pp.470—472Vectors,RodriguezandDenhardt,Eds.(Butterworths,Boston,Mass.1988)。最优选的,质粒借助电穿孔导入宿主。将转化细胞在适合产生轻链和重链的条件下生长,检测重链和/或轻链蛋白合成。示范性的检测技术包括酶联免疫吸附检定法(ELISA)、放射免疫分析(RIA)或焚光激活的细胞分选法(FACS)、免疫组织化学法等。本文中,术语"转化"是从广义上指将能改变表现型的DNA导入受体宿主细胞从而造成了受体细胞的变化。在同样的那些话语中,"宿主细胞"是指利用重组DNA技术转化了编码至少一种异源基因的载体构建体的细胞。在描述从重组宿主中分离抗体的过程时,名词"细胞"和"细胞培养物"可以交换使用来指示抗体的来源,除非另外清楚地说明。换句话说,从"细胞"中回收多肽可能意味着离心沉淀完整细胞,或从含有培养基和悬浮细胞的细胞培养物中回收。用于蛋白质表达的宿主细胞最优选是来源于哺乳动物的;本领域技术人员有能力确定最适用于待表达基因产物的具体细胞系。示范性的宿主细胞系包括,但不限于DG44和DUXB11(中国仓鼠卵巢细胞系,DHFR册ll除)、IffiLA(人宫颈癌细胞)、CVI(猴肾细胞系)、COS(带有SV40T抗原的CVI衍生物)、R1610(中国仓鼠成纤维细胞)、BALBC/3T3(小鼠成纤维细胞)、IIAK(仓鼠肾细胞系)、SP2/0(小鼠骨髓瘤)、P3.times.63-Ag3,653(小鼠骨髓瘤)、BFA-lclBPT(牛内皮细胞)、RAJI(人淋巴细胞)和293(人肾)。尤其优选CHO细胞。宿主细胞系通常可以得自商业服务才几构、AmericanTissueCultureCollection或已发表的文献。体外制备保证了能够扩大规模产生大量的所需多肽。在组织培养条件下培养哺乳动物细胞的技术是本领域已知的,包括均匀悬浮培养(例如,在气升式反应器或连续搅拌反应器中),或者固定化或截留细胞培养(例如,在中空纤维、微嚢、琼脂糖微珠或陶瓷柱上进行)。如果需要并且/或者希望,可以在例如优选地生物合成了合成绞链区多肽之后,或者在进行文中描述的HIC层析步骤之前,通过常规的层析方法将多肽溶液进行纯化,例如凝胶过滤、离子交换层析、DEAE-纤维素层析或(免疫-)亲和层析。细菌或酵母或植物细胞。就此而言,应该意识到各种单细胞非哺乳动物微生物比如细菌也可以被转化;即那些能够在培养基中或发酵生长的。易于被转化的细菌,包括肠杆菌科的成员,比如大肠杆菌或沙门氏菌菌抹;芽孢杆菌科,比如枯草芽孢杆菌;肺炎球菌;链球菌和流感嗜血杆菌。还应该进一步意识到,在细菌中进行表达时,多肽通常成为内涵体的一部分。多肽必须被分离、纯化,然后组装成功能性分子。当需要四价形式的抗体时,然后就将亚基自组装成四Y介抗体(WO02/096948A2)。除了原核细胞,还可以使用真核微生物。虽然也可以购买到大量其它菌株,但酿酒酵母,或普通面包酵母是最常用的真核微生物。对于在酵母中进行表达,通常使用例如质粒YRp7(Stinchcombetal.,Nature,282:39(1979);Kingsmanetal"Gene,7:141(1979);Tschemperetal"Gene,10:157(1980))。这个质粒已含有TRP1基因,该基因给不能在色氨酸上生长的酵母突变抹(例如ATCCNo.44076或PEP4-1(Jones,Genetics,85:12(1977))提供了选择标记。然后酵母宿主细胞基因组中特征性的trpl损伤为通过在没有色氨酸的情况下的生长来探测转化提供了有效的环境。xn.结合分子的标记或偶联本发明的结合分子可以以非偶联形式来使用,或者偶联多种效应物(即功能部分)中的至少一种,从而例如协助探测目标分子或者给患者成像或治疗。发明所述多肽可以在纯化之前或之后,或进行纯化时估支标记或偶联。具体来说,本发明的多肽可以偶联上细胞毒素(比如放射性同位素、细胞毒性药物或毒素)、治疗剂、细胞生长抑制剂、生物毒素、前药、肽、蛋白质、病毒、脂类、生物应答调节剂、药剂、免疫活性配体(例如淋巴因子或其它抗体,其中所得分子既能结合赘生性细胞,又结合效应细胞,比如T细胞)、PEG或用于成像的可检测部分。在另一实施方案中,本发明的多肽可以偶联到能降低肿瘤血管形成的分子上。在其它实施方案中,文中公开的组合物可能包含偶联了药物或前药的发明所述多肽。本发明的再一些实施方案包括偶联了特异性生物毒素(比如蓖麻毒蛋白、白树毒蛋白(gelonin)、假单胞菌外毒素或白喉毒素)或其生物毒素片段之发明所述多肽的用途。选择使用偶联或未偶联多肽取决于癌症的类型和发展阶段、所用的辅助治疗(例如化疗或外部放疗)以及患者的状态。应当意识到,本领域4支术人员根据本文的教导可以容易地作出这类选择。应当意识到,在以前的研究中,标记了同位素的抗肿瘤抗体已被成功地用于在动物模型中,一些例子中是在人中破坏实体瘤以及淋巴瘤/白血病细胞。示范性的放射性同位素包括:,、125I、13II、123I、mIn、105Rh、153Sm、67Cu、67Ga、l66Ho、177Lu、欣Re和^Re。放射性核素的作用是通过产生在核DNA中造成多个链断裂的电离辐射,从而导致细胞死亡。用于产生治疗偶联物的同位素通常产生高能量ot-或(3-粒子,这些粒子路径长度短。这类放射核素能够杀死与它们靠近的细胞,例如被偶联分子吸附或进入的赘生性细胞。它们对非域化细胞有很小的或没有效果。放射核素大体上是非免疫原性的。在与本发明相关的放射标记偶联物的使用方面,本发明的多肽可以直接标记(比如通过电离)或利用螯合剂来间接标记。本文中,短语"间接标记"和"间接标记方法"均意味着螯合剂共价地连接着所迷结合分子,而至少一种放射性核素与该螯合剂相关联。这些螯合剂通常是指双功能螯合剂,因为它们既能结合多肽,又能结合放射性核素。特别优选的螯合剂包括l-异硫氰笨-3-methyldiothelene三胺五乙酸("MX-DTPA")和环己基二乙三胺五乙酸("CHX-DTPA")衍生物。其它螯合剂包括P-DOTA和EDTA衍生物。特别优选的用于间接标记的放射性核素包括1'4n和卯Y。本文中,短语"直接标记"和"直接标记方法"均意味着放射性核素直接共价地连到多肽上(通常借助氨基酸残基)。更具体的说,这些连接技术包括随机标记和定点标记。在后一种情况中,标记定点到多肽上的特定位点,比如仅存在于偶联物Fc部分的N-连接的糖残基。此外,各种直接标记技术和实验方案是适用于本发明的。例如,锝-99m标记的多肽可以通过配体交换过程来制备,即通过用锡离子溶液还原锝酸盐(pertechnate(Tc(V)),将被还原的锝螯合到Sephadex柱子上,将多肽上样到该柱子上;或者通过批量标记技术,例如将锝酸盐、还原剂(比如SnCl2)、緩冲液(比如苯二曱酸钠钾溶液),以及抗体一起保温。在任何情况中,用于直接标记抗体的优选放射性核素是本领域公知的,特别优选用于直接标记的放射性核素是通过酪氨酸残基共价连接的1311。根据本发明,多肽可以用例如放射性钠或钾碘化物和化学氧化剂(比如次氯酸钠、氯氨T等),或者酶学氧化剂(乳过氧化物酶、葡萄糖氧化酶和葡萄糖)来进行衍生。但是,为了本发明的目的,特别优选的是间接标记方法。关于螯合剂和螯合偶^f关物的专利是本领J或已知的。例如,Gansow的美国专利4,831,75涉及多重取代的二乙三胺五乙酸螯合物,和含有该螯合物的蛋白偶联体,以及它们的制备方法。Gansow的美国专利5,099,069、5,246,692、5,286,850、5,434,287和5,124,471还涉及到多重取代的DTPA螯合物。这些专利均全文引入本文。其它适用的金属螯合剂的例子是乙二胺四乙酸(EDTA)、二乙三胺五乙酸(DPTA)、1,4,8,11-四氮四癸烷(tetraazatetradecane)、1,4,8,11-四氮四癸烷-1,4,8,1l誦四乙酸、1-氧代-4,7,12,15-四氮七癸烷-4,7,12,15-四乙酸等等。环己基-DTPA或CHX-DTPA是特别优选的,在下文有大量的例子。还有其它一些适用的螯合剂,包括有待发现的,可能很容易地被技术人员识别,显然在本发明的范围内。优选待审专利申请序列号08/475,813,08/475,815和08/478,967中用于协助螯合的相容螯合剂,包括特异性双功能螯合剂来提供对三价金属的高亲和性,显示升高的肿瘤对非肺瘤比率,骨吸收下降以及在更高的核素在体内目标部位(即B细胞淋巴瘤肿瘤位点)的累积。但是,其它具备或不具备所有这些特点的双功能性螯合剂也是本领域已知的,并且有益于肿瘤治疗。还应当意识到,与本文的教导一致的,为了诊断和治疗目的,多肽可以偶联不同的放射性标记。为了这个目的,前面提到的待审专利申请(以参考文献的方式全文卩1入本文)公开了放射性标记的治疗偶联物,其用于在给予治疗抗体前进行肿瘤诊断"成像"。"ln2B8"偶联物包含小鼠单克隆抗体2B8,该抗体对人CD20抗原具有特异性,借助双功能螯合剂连接111111,其中所述螯合剂是包含l:l混合的l-异硫氰苯-3-曱基-DTPA和l-曱基-3-异硫氰苯-DTPA的MX-DTPA(二乙三胺五乙酸)。11'ln是特别优选的诊断放射核素,因为在约1到0mCi可以安全地给药而没有可检测到的毒性;成像数据通常可以预测后续的^Y标记的抗体分布。多数成像研究使用5mCi"'In标记的抗体,因为这个剂量既安全又比更低剂量的成像效果好,最佳成像效果在给予抗体后的3到6天。参见,例如Murray,/TVwc.Mec/.26:3328(1985)和Carraguilloe"/.,J.淑.26:67(1985)。如上文所述,有许多核素可以用于本发明,本领域技术人员可以容易地确定各种情况下,哪种核素是最合适的。例如,1311是公知用于定向免疫治疗的核素。然而,|3|1的临床应用可能受到几个因素的限制物理半衰期为8天;碘化抗体在血液和肿瘤部位的脱卣作用;以及发射特性(例如,Y组分高),这对肿瘤局部剂量蓄积可能是亚适状态。随着更佳螯合剂的出现,在蛋白质上连接金属螯合基团的能力提高了利用其它核素,比如min和^Y的机会。9()Y提供了几个用于放射免疫治疗的优势9Gy的半衰期是64小时,足够抗体在肿瘤部位的积累;并且与例如1311不同,^Y是单纯的高能(3射线源,在衰变过程中不产生Y辐射;辐射范围限于ioo到iooo细胞直径的组织内。另外,最低贯穿辐射量使得可以门诊给予卯Y标记的抗体。此外,细胞杀伤不要求标记抗体必须内在化,电离辐射的局部发射对没有靶分子的临近肿瘤细胞是致死的。本领域技术人员会意识到,这些非放射活性的偶联物也可以根据要偶联的试剂利用多种技术来组装。例如,通过例如将多肽与生物素的活化酯(比如生物素N-羟基琥珀酰胺酯)进行反应来制备与生物素形成的偶联物。类似的,带有荧光标记的偶联物可以在有偶联剂(例如前面列举的)的情况下制备,或者通过与异硫氰酸酯,优选异硫氰酸荧光素进行反应来制备。发明所述多肽与细胞生长抑制剂/细胞毒性物质以及金属螯合剂的偶联物可以通过类似的方式制备。许多效应物部分缺少合适的抗体可以连接的功能基团。在一实施方案中,效应物部分,例如药物或前药通过连4妄部分连到抗体上。在一实施方案中,所述连接部分含有能够在特定位点激活细胞毒性的化学键。合适的化学键是本领域公知的,包括二硫键、酸敏性键、光敏性键、肽酶敏感性键、在巯基和顺丁烯二酰亚胺之间形成的硫醚键,以及酯酶敏感性键。最优选,所述连接部分包含二碌u键或辟u醚4建。与本发明一致的,所述连接部分优选包含活性化学基团。特别优选的活性化学基团是N-琥珀酰亚胺酯和N-磧基琥珀酰亚胺酯。在一个优选实施方案中,所述活性化学基团可以借助巯基之间的二^i键共价结合到效应物上。在一实施方案中,效应物分子被修饰以便含有巯基。本领域技术人员明白,巯基含有与氢原子结合的硫原子,通常又称为硫氢基,可以用"—SH"或"RSH"表示。在一实施方案中,可以用连接部分将效应物部分与结合分子连接起来。本发明的连接部分可以是可切割的或不可切割的。在一实施方案中,可切割连接部分是氧化还原切割性连接部分,因此该连接部分在较低氧还电势的环境中是可切割的,这种环境是比如细胞质和其它带有游离硫氢基的分子浓度较高的区域。因为氧还电势的改变而被切割的连接部分的例子包括那些含有二硫键的。促进切割的因素可以通过发明所迷结合蛋白被吸收到胞内提供,细胞质的较低氧还电势促使连接部分被切割。在另一实施方案中,pll降低引发美登木素生物碱释放到靶细胞内。在许多生理或病理过程中涉及到pH的下降,比如内体转运、肿瘤生长、发炎和心肌局部缺血。pH由生理值7.4下降到内体中的5-6,或者溶酶体中的4-5。可以用来导靶到肿瘤细胞的溶酶体或内体的酸敏感性连接部分的例子包括,在比如乙缩醛、缩酮、原酸酯、腙、三苯曱基、cis-aconityls或thiocarbamoyls中可以发现的带有酸敏性键的那些(参见,例如Willnerda/"l993),所oco"/C7^w.,4:521-7;美国专利4,569,789、4,631,190、5,306,809和5,665,358)。其它示范性的酸敏感性连接部分包含二肽序列Phe-Lys和Val-Lys(Kingda/.,f2002),/Med45:4336-43)。促进切割发生的因素可以由摄取到胞内并运输到低pH的内体区室(例如溶酶体)来提供。其它示范性的酸敏性连接部分是那些含有两个或多个供两个或多个美登木素生物碱附着的酸切割性键(King"a/"1999),倫—C/7em.'10:279-88;WO98/19705)。可切割的连接部分可以是对生物供应的与特定靶细胞(例如,溶酶体或肿瘤相关酶)相关的切割试剂敏感。可以通过酶法切割的连接部分的例子包括,但不限于肽和酯。示范性的可酶切连接部分包括对肿瘤相关性蛋白酶,比如组织蛋白酶B或血纤蛋白溶酶敏感的那些(Dubowchik"/.,"999),尸Z謹.77zer,83:67-123;Dubowchik"a/"fl998),MedC7缀丄饥,8:3341-52;deGroota/"2000),J她t/.C7z皿,43:3093-102;deGroot"a/.,(a999)m42:5277-83)。CathepsinB可切割的位点包括二肽序列颉氨酸-瓜氨酸和笨丙氨酸-赖氨酸(Doronina"a/.,f2003),淑.所血'/z.,21(7):778-84);DubowchikWfl/.,p002),BzVxw/Mg'C/z艮,13:855-69)。其它示范性的酶切位点包括由4到16个氨基酸的寡肽序列形成的(例如,Suc-卩-Ala-Leu-Ala-Leu),该位点可以被trouse蛋白酶,比如曱拌磷寡肽酶(TOP)识别,该酶优选由嗜中性粒细胞、巨噬细胞和其它粒细胞释放。在进一步的实施方案中,连接部分的形成是通过将发明所述结合分子与公式为X-Y-Z的连接分子进行反应其中X是附着部分;Y是间隔部分;以及Z是效应物附着部分。名词"结合分子附着部分"包括使得接头能共价附着到发明所述结合分子上的部分。所述附着部分可以包含,例如l-60个碳、氧、氮、硫原子的共价链,任选以氢原子取代和其它使得结合分子能行使其预期功能的取代。附着部分可以包含肽、酯、烷基、烯基、炔基、芳香基、乙醚、硫醚等功能基团。优选的,附着部分的选择保证它能与包含至少一个抗原结合位点的多肽上的活性功能基团发生反应,形成本发明的结合分子。附着部分的例子包括,例如氨基、羧基和巯基附着部分。氨基附着部分包括与多肽上的氨基反应,从而形成本发明的结合分子的一部分。氨基附着部分是本领域已知的。氨基附着部分的例子包括,活化脲(例如,与结合分子上的氨基发生反应形成包含脲基团的连接部分)、醛(例如,能与结合分子上的氨基发生反应的),以及活化异硫氰酸酯(其能与结合分子上的氨基发生反应形成包含脲基团的连接部分)。氨基附着部分的例子包括,但不限于N-琥珀酰亚胺基、N-磺基琥珀酰亚胺、N-对酞内酰胺(phthalimidyl)、N-磺基对酞内酰胺、2-硝基苯、4-硝基苯、2,4-二硝基苯、3-磺酰基-4-硝基苯或3-羧基-4-硝基苯部分。羧基附着部分包括能与多肽上的羧基基团发生反应,从而形成发明所述结合分子的一部分。羧基附着部分是本领域已知的。羧基附着部分的例子包括,但不限于活化的酯中间体和活化的羰基中间体,它们能与结合分子上的COOH基团发生反应,形成包含酯、硫酯或酰胺基团的连接部分。巯基附着部分包括能与多肽上的巯基基团发生反应,从而形成发明所述结合分子的一部分。巯基附着部分是本领域已知的。巯基附着部分的例子包括,但不限于活化的酰基(能与结合分子上的硫氢基发生反应形成包含硫酯的连接部分)、活化的烷基(能与结合分子上的疏氢基发生反应形成包含硫酯的连接部分)、Michael受体,比如马来酰亚胺或丙烯基团(能与结合分子上的硫氢基发生反应形成Michael型添加反应产物)、以还原氧化反应与硫氢基发生反应的基团、活化的二硫化物基团(能与结合分子上的硫氢基团发生反应形成,例如包含二硫化物部分的连接部分)。其它巯基附着部分包括丙烯酰胺、a-碘乙酰胺以及环丙烷-l,l-二羰基化合物。此外,巯基附着部分可能含有这样的部分,其能将结合分子上的巯基修饰形成另外的活性基团,连接分子结合其上形成本发明的结合分子。间隔部分,Y是一个含有一或多个氨基酸残基的共价键或原子共价链。它还可能包含0-60个碳、氧、硫或氮原子,任选被氢或其它使得结合分子能行使其预期功能的取代物所取代。在一实施方案中,Y包含烷基、烯基、炔基、酯、醚、羰基或酰胺部分。在另一实施方案中,结合分子上的巯基被转化为活性基团,比如活性羰基基团,比如酮或醛。然后所述附着部分与酮或醛反应形成本发明所需的化合物。羰基活性附着部分的例子包括,但不限于肼、酰肼、O-取代的羟胺、a-(3-不饱和酮,以及H2OCH-C0-NH-NH2。可以用于形成发明所述结合分子的其它附着部分的例子以及修饰巯基部分的方法在Pratt,M.L.efa/,JAmChemSoc.2003May21;125(20):6149-59;和Saxon,E.Science.2000Mar17;287(5460):2007-10中有描述。连接分子可以是任何能与效应物部分,或效应物的衍生物发生反应,形成发明所述结合分子的分子。例如,效应物部分可以借助二硫键连接到分子的其它部分。在这种情况中,连接部分的选择保证它能与合适的效应物部分衍生物发生反应,从而使得该效应物部分附着到发明所述结合分子上。如上所述,可以选择在合适的环境中,接头能被切割的连接部分和/或整个接头。特别优选的接头分子包括,例如N-琥珀酰亚胺3-(2-嘧啶二硫)丙酸酯(SPDP)(参见,例如Carlssonetal.,Biochem.J"173,723-737(1978))、N-琥珀酰亚胺4-(2-嘧咬二硫)丁酸酯(SPDB)(参见,例如美国专利4,563,304)、N-琥珀酰亚胺4-(2-嘧。定二硫)戊酸酯(SPP)(参见,例如CASRegistrynumber341498-08-6)、N-琥珀酰亚胺4-(N-马来酰亚胺曱基)环己烷-l-羧酸酯(SMCC)(参见,例如Yoshitakeetal.,Eur.J.Biochem.,101,395-399(1979))和N-琥珀酰亚胺4-曱基-4-[2-(5-硝基-p比啶基)一二硫]戊酸酯(SMNP)(参见,例如美国专利4,563,304)。最优选的用于发明所述組合物的接头分子是SPP、SMCC和SPDB。在一个优选实施方案中,用SPDB将效应物部分连接到发明所述结合分子上。优选用于本发明的细胞毒性效应物部分是细胞毒性药物,特别是用于癌症疗法的。本文中,"细胞毒素或细胞毒试剂"意味着任何对细胞生长和增殖有害的试剂,其可能表现为使细胞和恶性肿瘤减少、抑制或破坏。示范性的细胞毒素包括,但不限于,放射性核素、生物毒素、酶学活性毒素、细胞生长抑制剂或细胞毒性治疗剂、前药、免疫活性配体和生物应答调节剂(比如细胞因子)。任何阻滞或减慢免疫反应性细胞或恶性肿瘤细胞生长的细胞毒素均在本发明范围内。细胞毒素的例子通常包括,细胞生长抑制剂、烷基化试剂、抗代谢物、抗增殖剂、微管蛋白结合剂、激素和激素拮抗剂等等。与本发明相容的示范性的细胞生长抑制剂包括烷基化物质,比如双氯乙基亚胺(mechlorethamine)、三亚乙基磷酰胺、环磷酰胺、异环磷酰胺、苯丁酸氮芥、白消安、美法仑或三亚胺S毘,还有亚硝基脲化合物,比如卡莫司汀、洛莫司汀或司莫司汀。特别优选的偶联部分是美登木素生物碱。美登木素生物碱最初分离自东非一种属于美登木属的灌木,但后来发现它也是土壤细菌如珍贵束丝放线菌04c""o^朋ewapre/7a^m)的代谢物(参见,例如美国专利3,896,111)。本领域已知美登木素生物碱包括美登素(maytansine)、美登木醇(maytansinol)、美登木醇的C-3酯以及其它美登木醇类似物和衍生物(参见,例如美国专利5,208,020和6,441,163)。美登木醇的C-3酯可以是天然的或合成的。并且,天然和合成C-3美登木醇酯可以归类为简单羧酸的C-3酯,或与N-甲基-L-丙氨酸形成的C-3酯,后者比前者细胞毒性更强。合成的美登木素生物碱类似物是本领域已知的,在例如Kupchanetal.,丄Med.Chem.,21,31-37(1978)中有描述,制备美登醇及其类似物和衍生物的方法在例如美国专利4,151,042中有描述。然来源分离,合成制备,或者半合成制备。此外,可以通过任何合适的方式对美登木素生物碱进行修饰,只要最后的偶联物分子保留了足够的细胞毒性。特别优选的包含连接部分、含有活性化学基团的美登木素生物碱是美登木醇的C-3酯和它们的类似物,其中连接部分含有二石克键,附着部分包含N-琥珀酰亚胺或N-磺基琥珀酰亚胺酯。美登木素生物碱上的许多位点可以作为通过化学#:与连接部分连在一起的位置,例如通过效应物附着部分。例如,带有羟基的C-3位点、修饰有羟甲基的C-14位点、修饰有羟基的C-15位点以及带有鞋基基团的C-20位点都很有用。最优选的连接部分是与美登木醇的C-3位点连在一起。最优选的,与发明所述组合物联系在一起使用的美登木素生物碱是N.sup.2'-去乙酰-N.sup.2'-(-3-巯基-l-氧代丙基)-美登木素(DM1)或N.sup.2'-去乙酰-N.sup.2'-(4—巯基-4-曱基-l-氧代戊基)-美登木素(DM4)。带有其它化学键的连接部分,和其它美登木素生物碱一样也可以用于本发明的情况中。可以引入所述连接部分的其它化学键的特定例子包括以上描述的,比如酸敏性键、硫醚键、光敏键、对肽酶敏感键和对酯酶敏感键。制备带有连接部分和/或效应物附着部分的美登木素生物碱在例如美国专利5,208,020、5,416,064和6,333,410中有描述。美登木素生物碱的连接部分(和/或效应物附着部分)通常,并且优选是更大的接头分子的一部分,所述接头分子是用来将抗体与美登木素生物碱连在一起的。任何合适的接头分子都可以用于本发明,只要该接头分子保证美登木素生物碱和抗体分别保留了它们的细胞毒性和导向特点。连接分子通过化学键(如上所述)将美登木素生物碱连到抗体上,因此美登木素生物碱和抗体是化学偶联(例如,共价结合)在一起的。希望连接分子通过二硫键或硫醚键将美登木素生物碱化学偶联到抗体上。最优选的,抗体是借助二硫键偶联到美登木素生物碱上的。其它优选的细胞毒试剂种类包括,例如蒽环霉素(anthracycline)族药物、长春花药物、丝裂霉素、博莱霉素、细胞毒性核苷酸、蝶啶族药物、diynenes以及鬼臼毒素。这些种类中特别有用的包括,例如阿霉素、洋红霉素(carminomycin)、柔红霉素daunorubicin(daunomycin)、多柔比星(doxorubicin)、氨基喋呤(aminopterin)、曱氨蝶呤、曱氨蝶呤(methopterin)、普卡霉素(mithramydn)、链黑菌素(streptonigrin)、二氯曱胺蝶呤、丝裂霉素C,放线菌素D、泊非霉素(porfiromycin)、5-氟脲嘧咬、氟尿苷、喃氟啶(ftorafur)、6-巯基噤呤、阿糖月包苷(cytarabine)、阿糖月包嗜咬(cytosinearabinoside),鬼臼毒素(podophyllotoxin)或鬼臼毒素衍生物,比如依托泊芬(etoposide)或磷酸依才乇泊芬,马'法兰(melphalan),长春花石咸(vinblastine),长春豸斤石咸(vincristine),异长春碱(leurosidine),长春地辛(vindesine),环氧长春械(leurosine)等等。还有一些与本文的教导相容的细胞毒素包括紫杉醇、紫杉烷(taxane),松胞菌素B(cytochalasinB),短杆菌肽D(gramicidinD)、溴化乙锭、吐4艮石威(emetine),鬼臼p塞口分戒(tenoposide),牙大水仙石咸(colchicin)、二羟基炭疽菌素、二酮(dione)、米托蒽醌(mitoxantrone)、普鲁卡因(procaine)、丁卡因(tetracaine)、利多卡因(lidocaine)、心得安(propranolol)和噤呤霉素(puromycin)以及它们的类似物或同系物。激素和激素拮抗剂,比如皮质类固醇激素,例如泼尼松(prednisone);孕激素,例如羟基孕酮或medroprogesterone;雌激素,例如己烯雌酚(diethylstilbestrol);抗雌激素,例如他莫昔芬;雄激素,例如睾酮,以及芳香酶抑制剂,例如氨鲁米特(aminogluthetimide)也与本文的教导相容。正如前面提到的,本领域技术人员可以对所需化合物进行修饰,从而使得该化合物的反应更方便制备发明所述偶联物。一例特别优选的细胞毒素包含抗肺瘤抗生素中烯二炔(enediyne)家族的成员或书亍生物,包4舌力口里车霉素(calicheamicin)、esperamicins或dynemicins。这些毒素非常强力,通过切割核DNA导致细胞死亡。与能被体内切割产生许多无活性但是有免疫原性的多肽片段的蛋白质毒素不同,象加里刹霉素、esperamicins和其它烯二炔这样的毒素是基本没有免疫原性的小分子。这些非肽毒素是通过以前用于标记单克隆抗体和其它分子的技术化学连接到二聚体或三聚体上的。这类连接技术包括借助仅存在于构建物Fc部分上的N-连接的糖残基发生的位点特异性连接。这种定点连接技术的优势是减少了连接对构建体的结合特性的可能影响。应当意识到,在其它细胞毒素中,多肽也可以与生物毒素相关联,比如蓖麻毒蛋白(ricin)亚基A、相思豆毒素(abrin)、白喉毒素、肉毒毒素(botulinum)、cyanginosins、石房給毒素(saxitoxin)、志贺毒素(shigatoxin)、破伤风、河豚毒素(tetrodotoxin)、单端孢霉毒素(trichothecene)、致震颤真菌毒素(verrucologen)或是毒性酶。优选的,利用能直接表达抗体-毒素构建体的基因工程技术来制备这些构建体。其它能与发明所述多肽相关联的生物应答调节剂包含细胞毒素,比如淋巴因子和干扰素。就本说明书公开内容而言,本领域技术人员应当能很容易地利用常规技术制成这类构建体。另一类可以与所公开多肽联合使用的相容生物毒素是放射增敏药物,其可能能被有效地定向到肿瘤或免疫反应性细胞。这类药物增加了它们对电离辐射的敏感性,从而提高了放疗法的效果。被肺瘤细胞内在化的抗体偶联物会将放射增敏剂递送到细胞核附近,那里的放射增敏作用最强。没有发生结合的连接有放射增敏剂的发明所述多肽会很快从血液中被清除,使其余的放射增敏试剂局限于目标肿瘤中,而在正常组织中只有最低的摄取。从血液中迅速清除后,以三种方式之一进行辅助放疗1)特异针对肿瘤的体外照射,2)直接植入肿瘤的放射性或3)用相同的导向抗体进行系统;故射免疫疗法。这免疫偶联物上,从而给患者提供了给予单种药物的方便。在一实施方案中,可以偶联一个能够提高多肽稳定性或效力的部分。例如,在一实施方案中,可以给发明所述多肽偶联上PEG以便提高它们的体内半衰期(Leong,S.R.,etal.2001.CytoAi"e16:106;2002;A/v.Z>wg/>/iv.細.54:531;orWeiretal.2002.Biochem.Soc.Transactions30:512)。如前面提到的,相容细胞毒素可以包含前药。本文中,名词"前药"是指药物活性物质的前体或衍生物,与亲本药物相比,它们对肺瘤细胞的细胞毒性低,能被酶法激活或转化成活性更高的亲本形式。与发明相容的前药包括,但不限于,含磷酸盐的前药、含硫代磷酸盐的前药、含硫酸盐的前药、含肽的前药、含P-内酰胺的前药,任选含有被取代苯氧乙酰胺的前药或任选含有被取代的苯乙酰胺的前药、5-氟胞嘧啶和其它5-氟尿嘧啶前药,它们能被转化为细胞毒性更高的游离型药物。在一实施方案中,细胞毒性试剂,比如美登木素生物碱被以前药的形式给予,在二硫键被水解后释放。可以衍生成前药形式用于本发明的细胞毒性药物的进一步例子包括上面描述过的那些化疗试剂。XIII.结合分子的给药制备并向受试者给药本发明的结合分子的方法是所属领域技术人员公知的或能容易确定的。给药本发明的结合分子的途径可以经口、非肠道、通过吸入或表面局部(t叩ical)给药。本文所用的术语非肠道包括静脉内、动脉内、腹膜内、肌肉内、皮下、直肠或阴道给药。静脉内、动脉内、皮下和肌肉内形式的非肠道给药一般是优选的。所有这些给药形式都清楚地被视为在本发明的范围内,但是给药形式最好是注射用溶液,尤其是静脉内或动脉内注射或点滴用的溶液。通常,合适的注射用药物组合物可包含緩冲液(如乙酸、磷酸或柠檬酸緩沖液)、表面活性剂(如聚山梨酸酯(polysorbate)),任选有稳定剂(如人白蛋白(albumin))等。可是,在其它适用于本文的方法中,可直接将多肽递送至不良细胞群体所处部位,由此增加患病组织对治疗剂的暴露。非肠道给药制剂包括无菌水或非水溶液、悬浮液、和乳剂。非水性溶剂的例子是丙二醇、聚乙二醇、植物油(如橄榄油)、和可注射的有机酯(如油酸乙酯)。水性载体包括水、醇/水溶液、乳液或悬浮液,包括盐水(saline)和緩冲介质。在本发明中,药学上可接受的载体包括但不限于,0.01-0.1M(优选0.05M)磷酸緩沖液或0.8。/。盐水。其它常用的非肠道载体包括磷酸钠溶152液、Ringer氏葡萄糖(dextrose)、葡萄糖和氯化钠、乳酸化的Ringer氏液、或不挥发性油。静脉内载体包括流体和营养补充剂、电解质补充剂,如基于Ringer氏葡萄糖等的那些。也可有防腐剂和其他添加剂,例如,抗微生物剂、抗氧化剂、螯合剂、和惰性气体等。更特别地,适于注射应用的药物组合物包括无菌水溶液(水溶于其中)或分散剂和用于临时准备无菌注射溶液或分散剂的无菌粉末。在这类情况下,组合物必须是无菌的,并且且流动性应当达到方便注射的程度。它在生产和储存条件下应当是稳定的,并优选能抗;煤生物(如细菌和真菌)污染作用而保存。载体可以是溶剂或分散介质,其含诸如水、乙醇、多元醇(如,甘油、丙二醇、和液体聚乙二醇等)、和其合适的混合物。例如,可通过使用包衣(如卵磷脂),通过在分散时保持所需颗粒大小,并通过使用表面活性剂,来保持适当的流动性。通过各种抗细菌剂和抗真菌剂,例如,尼泊金(paraben)、氯代丁醇、笨酚、抗坏血酸、柳硫汞等,可防止微生物作用。在许多情况中,组合物中优选包括等渗剂,例如,糖、聚醇(如甘露醇、山梨醇)、或氯化钠。通过在组合物中包括延迟吸收剂(例如,单硬脂酸铝和白明胶(gelatin)),可延长可注射的组合物的p及收。在任何情况下,可通过将必需量的活性化合物(如,多肽本身或与其它活性试剂联用)混合入根据需要含本文列举的成分之一或其组合的合适的溶剂中,之后过滤除菌,由此制备无菌、可注射的溶液。一般而言,通过将活性化合物混入含基本分散介质和以上列举的那些所需的其他成分的无菌载体中,来制备分散剂。对于用于制备无菌、可注射的溶液的无菌粉末的情况,优选的制备方法是真空干燥和冻干,其能产生活性成分和其以前无菌过滤溶液中其他所希望的任何成分的粉末。根据现有已知的方法,处理注射用制剂,装入容器(如安瓿、袋、瓶、注射器或小瓶)中,并在无菌条件下密封。另外,如未决的美国申请09/259,337和美国申请09/259,338(其每一篇都纳入本文参考)所述的那样,可包装制剂并以试剂盒的形式出售。这类制品将优选有标签或包装插页,用以标明相关组合物用于治疗患有或易患有自身免疫病或瘤形成疾病的受试者。本发明的稳定化结合分子用于治疗上述病况的有效剂量根据许多不同因素而变化,因素包括给药方式、靶位、患者的生理状态、患者是人还是动物、给药的其他药物、和治疗是预防性的还是治疗性的。患者通常是人,但也可治疗非人哺乳动物(包括转基因哺乳动物)。用本领域普通技术人员已知的常规方法可准确测量最佳安全性和功效的治疗剂量。如对于用本发明的结合分子进行被动免疫,剂量范围可从约0.0001至100mg/kg宿主体重,更常用的是O.Ol至5mg/kg(如,0.02mg/kg,0.25mg/kg,0.5mg/kg,0.75mg/kg,lmg/kg,2mg/kg等)。例如,剂量可以是lmg/kg体重或IOmg/kg体重或在1-10mg/kg的范围内,优选至少1mg/kg。以上范围内的中间剂量也是要在本发明的范围内的。每天、隔天、每周或根据通过经验分析而确定的其他时间表,可向受试者给药上述剂量。示例性的治疗需要在长时间内以多剂给药,例如在至少6个月内。另外的示例性的治疗方案需要每2周一次或一月一次或每3至6月一次给药。示例性的给药时间表包括连续每天l-10mg/kg或15mg/kg,隔天30mg/kg或每周60mg/kg。在一些方法中,同时给药带有不同结合特异性的两种或多种单克隆抗体,其中每种抗体的给药剂量落在所示范围内。在多种情况下可给药本发明的结合分子。如单次给药间的间隔可以是一天、一周、一月或一年。也可通过测量患者血液中多肽或靶分子水平来指示,以无规律的间隔来进行。在一些方法中,调节剂量以达到某种血浆结合分子或毒素浓度,如1-1000吗/ml或25-300|ig/ml。可选的是,结合分子可以持续释放剂型来给药,其中给药频率需要得较少。剂量和频率可根据患者中抗体半衰期而变化。一般而言,人源化抗体显示出最长的半衰期,然后是嵌合抗体和非人抗体。在一个具体实施方式中,本发明的结合分子以非偶联的形式给药,在另一个具体实施方式中,本发明的多肽以偶联的形式多次给药。在另一个具体实施方式中,本发明的结合分子可以非偶联的形式给药,然后以偶联的形式给药,或反之。给药剂量和频率可根据治疗是预防性的还是治疗性的而变化。在预防应用中,向没有处于患病状态的患者给药含本抗体或其混合物的组合物以增强患者抵抗力。该量被定义为"预防有效剂量"。在该应用中,精确量也取决于患者健康状态和综合免疫力,但一般每剂介于0.1至25mg,每剂尤其是0.5至2.5mg。以相对不频繁的间隔在较长期间内给药相对低的剂量。一些患者余生持续接受治疗。在治疗应用中,有时需要以相对短的间隔给予相对高的剂量(如,每剂约l至400mg/kg的结合分子(如抗体),对于放射性免疫偶联物,较常用的剂量是5至25mg,而对于细胞毒素-药物偶联的分子,剂量较高),使用到减轻或终止疾病进程,优选使用到患者显示出部分或完全改善了疾病症状。之后,患者可进行预防性给药。在一个具体实施方式中,可用(如,在载体中的)编码本发明的多肽的核酸分子治疗受试者。每个患者的编码多肽的核酸剂量介于约10ng至lg,100ng至100mg,l吗至10mg,或30-300吗DNA。感染性病毒载体每剂剂量变化范围为10-100、或更多个病毒粒子。可通过非肠道、表面局部、静脉内、口服、皮下、动脉内、颅内、腹膜内、鼻内或肌肉内方式给药治疗剂,用于预防和/或治疗。本发明的结合分子优选以肌肉内注射或静脉内输注来给药。在一些方法中,将特定治疗性结合分子直接注射在头盖骨内。在一些方法中,结合分子以持续释放组合物或设备(如MedipadTM设备)来给药。本发明的试剂可任选在需要治疗(如,预防或治疗)时与其他能有效治疗病症或病况的试剂联合给药。优选的其他试剂是现有公认的和作为标准向特定病症给药的那些。90Y-标记的本发明的多肽的有效的单次治疗剂量(即,治疗有效量)范围介于约5至约75mCi,更优选介于约10至约40mCi。1311-标记的抗体的有效的单次治疗非骨髓破坏剂量(non-marrowablativedosages)范围介于约5至约70mCi,更优选介于约5至约40mCi。1311-标记的抗体的有效的单次治疗破坏剂量(即,需要自体同源骨髓移植)范围介于约30至约600mCi,更优选介于约50至小于约500mCi。与嵌合修饰的抗体联合使用时,由于鼠抗体有较长的循环半衰期,碘-131标记的嵌合抗体的有效的单次治疗非骨髓破坏剂量范围介于约5至约40mCi,更优选小于约30mCi。诸如如^In标记的成像标准通常小于约5mCi。大量临床经验通过B'I和^Y获得,但其他放射性标记也是现有已知的并可用于相似目的。其他放射性同位素也用于成像。例如,适用于本发明范围内的其他放射性同位素包括但不限于,123I,125I,32P,57Co,64Cu,67Cu,77Br,81Rb,81Kr,87Sr,113In,'27Cs,129Cs,132I,197Hg,2。3Pb,2。6Bi,177Lu,'86Re,212Pb,212Bi,47Sc,105Rh,鹏Pd,153Sm,188Re,199Au,225Ac,211At,和犯Bi。在这方面,alpha、gamma和beta发射分子都适用于本发明中。另夕卜,根据本文公开内容,无需过度实验,所属领域技术人员应当能容易地确定哪种放射性核素适用于所选的治疗过程中。所以,已经用于临床诊断中的其他放射性核素包括1251,1231,"Tc,43K,52Fe,67Ga,68Ga,以及mIn。有抗体也标记有各种放射性核素,可用用于靶向免疫治疗(Peirersz等/wmww/.CW/^o/.65:111-125(1987))。这些放射性核素包括'88Re和186116以及少数为,Au和6701。美国专利5,460,785提供了关于这类放射性同位素的额外的数据,其纳入本文参考。无论本发明的结合分子是否以偶联的或非偶联的形式使用,将理解的是,本发明的主要优点是能在骨髓受损的患者中使用这些多肽,尤其是正在或曾经接受辅助治疗(如放疗或化疗)的那些。在其他优选的具体实施方式中,多肽(还是以偶联的或非偶联的形式)可用于与化疗剂治疗方案组合使用。所属领域技术人员会理解,这类治疗方案可包括顺序、同时、协同或共同扩张给药所公开的抗体和一个或多个化疗剂。本发明这方面尤其优选的具体实施方式将包括给药偶联毒素的结合分子,如偶联美登素类(如D4美登素类)分子的。可如以上所述来给药结合分子,但必须强调,在其它具体实施方式中,偶联的和非偶联的多肽可作为第一线的治疗剂,以不同的方式向健康患者给药。在这类具体实施方式中,可向具有正常或平均红骨髓量的患者和/或向未曾并未在接受辅助治疗(如外部光线辐射或化疗)的患者,给药多肽。可是如上所述,本发明所选的具体实施方式包括向骨髓受损的患者给药结合分子或与一个或多个辅助疗法(如放疗或化疗)组合或联合给药(即组合治疗方案)。如本文所用的,与辅助疗法给药组合或联合给药多肽指顺序、同时、共同扩张、协同、伴随或同时期给药或运用疗法和所公开的结合分子。所属领域技术人员会理解,可定时给药或运用组合治疗方案的各种成份,以增强治疗的整体有效性。例如,可在标准、公知的治疗进程中,在用本发明的放射性免疫偶联物后的几周内给药化疗剂。相反地,可静脉内给药细胞毒素相连的多肽,然后进行肿瘤定位外部光辐射。在另外其他的具体实施方式中,多肽可与一或多种所选的化疗剂以一次处理的方式协同给药。根据所选的辅助疗法和本说明书的教导,普通技术人员(如有经验的肿瘤学家)能容易地识别有效的组合治疗方案而无须过度的实验。对此,将理解的是,可以能为患者提供治疗益处的任何次序并在任何时限内组合给药(偶联的或非偶联的)结合分子和化疗剂。即,可以任何次序或协同给药化疗剂和多肽。可分开给药或以一个組合物的形式给药结合分子和化疗剂。在所选的具体实施方式中,将向以前接受过化疗的患者给药本发明的多肽。在另外其他的具体实施方式中,多肽和化疗疗法将基本同时或协同施用。例如,在接受化疗过程时,患者可被给予结合分子。在优选的具体实施方式中,将在任何化疗剂或疗法施用的l年内给药结合分子。在其他优选的具体实施方式中,将在任何化疗剂或疗法施用的IO、8、6、4、或2个月内给药多肽。在其他优选的具体实施方式中,将在任何化疗剂或疗法施用的4、3、2或1周内给药多肽。在另外其他的具体实施方式中,将在所选的化疗剂或疗法施用的5、4、3、2或1天内给药多肽。还将理解的是,可在几小时或几分钟(即基本同时)内向患者施用2种试剂或疗法。此外,根据本发明,骨髓受损的患者应当指任何表现为低血球数量的患者。所属领域技术人员会理解,有几种血球计数参数常用作骨髓受损的临床指标,而且人们可容易地测量患者骨髓受损的程度。现有接受的测量骨髓受损的例子是绝对嗜中性粒细胞计数(ANC)或血小板计数。这类骨髓受损或部分骨髓消逝可能是各种生化病症或疾病的结果,或更可能地,是以前化疗或放疗的结果。在这方面,所属领域技术人员会理解,接受过传统化疗的患者通常显示出降低的红骨髓量。如上所述,这类受试者通常由于不可接受的副作用(如贫血)或导致增加死亡率或发病率的免疫抑制,而不能用最佳水平的细胞毒素(即放射性核素)来治疗。更特别地,本发明的偶联的或非偶联的多肽可用于有效治疗ANC低于约2000/miT^或血小板计数低于约150,000/mn^的患者。本发明的多肽更优选用于治疗患者,其具有的ANC小于约1500/mm,小于约1000/mr^或甚至更优选小于约500/mm3。相似地,本发明的多肽可用于治疗患者,其具有的血小板计数小于约75,000/mm3,小于约50,000/mmS或甚至小于约10,000/mm3。对于更普通的理解,所属领域、汰术人员将能用政府颁布的指南和流程容易地确定患者何时是骨髓受损的。如上所示,许多骨髓受损的患者经受过治疗过程,包括化疗、植入放射性疗法或外部光线放射性疗法。对于后者,外部辐射源用于局部照射恶性肿瘤。为了进行放射性植入治疗法,放射活性试剂通过外科手术植入恶性肿瘤中,由此选择性照射病灶。在任何事件中,所公开的多肽可用于治疗患者的157病症,所述患者展示出骨髓受损而无论成因。对此,还将理解的是,本发明的多肽可与任何化疗剂或试剂协同或组合使用(如用以提供组合治疗方案),所述化疗剂或试剂能消除、降低、抑制或控制瘤细胞在体内生长。如所述的..这类试剂通常导致红骨髓量的减少。该减少可以通过消除本发明化合物的骨髓毒性而全部或部分抵消,其中本发明化合物能侵入性治疗所述患者中的瘤。在其他优选的具体实施方式中,本文公开的放射性标记的免疫偶联物可与放射性敏化剂一起有效使用,所述敏化剂能增加瘤细胞对放射性核素的易感性。例如,放射性标记的结合分子大部分从血流中清除出,但仍在肿瘤或多种肿瘤位点上保留治疗有效水平的分子,之后可给药放射性敏化化合物。对于本发明的这些方面,适用于本发明的示例性的化疗剂包括烷化剂、长春花属生物石威(如,长春花新石成(vincristine)和长春花石咸(vinblastine))、丙卡巴腈(procarbazine)、氨曱虫某p令(methotrexate)和泼尼4公(prednisone)。4种药物组成的MOPP(双氯乙基曱胺(mechlethamine)(氮芥(nitrogenmustard))、长春花新石咸(vincristine)(安可平(Oncovin))、丙卡巴腈(procarbazine)和)发尼(prcdnisone))能非常有效地治疗各类淋巴瘤,而且其包括本发明的优选的具体实施方式。在MOPP-耐受性患者中,可使用ABVD(如,如亚德利亚霉素(adriamycin)、博来霉素(bleomycin)、长春花石咸(vinblastine)和达卡巴口秦(dacarbazine))、ChlVPP(氯氨布西(chlorambucil)、长春花石咸(vinblastine)、丙卡巴腈(procarbazine)和泼尼^Kprednisone))、CABS(洛莫司汀(lomustine)、阿霉素(doxorubicin)、博来霉素(bleomycin)和链脲佐菌素(streptozotocin))、MOPP加上ABVD、MOPP加上ABV(阿霉素(doxorubicin)、博来霉素(bleomycin)和长春花碱(vinblastine))或BCVPP(卡莫司汀(carmustine)、环磷酰月'要(cyclophosphamide)、长春花石咸(vinblastine)、丙卡巴腈(procarbazine)和泼尼才公(prednisone))的纟且合物。ArnoldS.Freedman和LeeM.Nadler,vWa/z'g"""丄v附p/70ma,Harrison'sPrinciplesofInternalMedicine1774-1788(KurtJ.Isselbacher等编,第13版.1994)和V.T.DeVita等,(1997)和本文中引用的有关标准给药和时序安排的文献。可不加改变地与一个或多个本文所述的本发明的多肽组合使用这些疗法,或根据特定患者的需要而改变使用。其他用于本发明方案中的方案包括使用单一烷化剂(如环磷酰胺(cyclophosphamide)或氯氨布西(chlorambucil))或组合,如CVP(环磷酰胺(cyclophosphamide)、长春花新减(vincristine)和泼尼松(prednisone))、CHOP(CVP和阿霉素(doxombicin))、C-MOPP(环磷酰胺(cydophosphamide)、长春花新械(vincristine)、泼尼松(prednisone)和丙卡巴腈(procarbazine))、CAP-BOP(CHOP加上丙卡巴腈(procarbazine)和博来霉素(bleomycin))、m-BACOD(CHOP加上氨甲蝶呤(methotrexate)、博来霉素(bleomycin)和亚叶酸(leucovorin))、ProMACE-MOPP(泼尼松(prednisone)、氨曱蝶呤(methotrexate)、阿霉素(doxombicin)、J不石粦酰胺(cyclophosphamide)、依4乇泊苷(etoposide)和亚叶S臾(leucovorin)加上标准MOPP)、ProMACE-CytaBOM(泼尼松(prednisone)、阿霉素(doxorubicin)、环磷酰胺(cyclophosphamide)、依托泊苷(etoposide)、阿糖胞苷(cytarabine)、博来霉素(bleomycin)、长春花新碱(vincristine)、氨甲虫茱口令(methotrexate)和亚叶酸(leucovorin))和MACOP-B(氨曱蝶呤(methotrexate)、阿霉素(doxombicin)、环磷酰胺(cyclophosphamide)、长春花新碱(vincristine)、固定剂量的泼尼松(prednisone)、博来霉素(bleomycin)和亚叶酸(leucovorin))。所属领域技术人员能容易地确定这些方案之每一个的标准剂量和时序安排。CHOP也与博来霉素(bleomycin)、氨曱蝶呤(methotrexate),丙卡巴月青(procarbazine)、氮芥(nitrogenmustard)、月包口密口定阿4立伯糖苷(cytosinearabinoside)和依4乇泊苷(etoposide)组合。其他相容的化疗剂包括但不限于,2-氯脱氧腺苷(2-CDA)、2'-脱氧助间型霉素和氟达^i滨(fludarabine)。对于未能康复或复发的中期和高期NHL患者,则使用抢救疗法。抢救疗法可单独或组合寸吏用药物,如月包嘧。定阿4立伯糖苷(cytosinearabinoside)、顺柏(cisplatin)、依托泊苷(etoposide)和宜佛斯酰胺(ifosfamide)。对于复发或侵入型的某些肿瘤疾病,通常使用以下规程IMVP-16(宜佛斯酰胺(ifosfamide)、氨甲蝶呤(methotrexate)和依托泊苷(etoposide))、MIME(丙米腙、宜佛斯酰胺(ifosfamide)、氨曱蝶呤(methotrexate)和依托泊苷(etoposide))、DHAP(地塞米4公(dcxamethasone)、高剂量的阿#唐月包苦(cytarabine)和顺柏(cisplatin))、ESHAP(依托泊苷(etoposide)、甲基泼尼松龙、HD阿糖胞苷、顺铂(cisplatin))、CHPP(B)(环磷酰胺(cyclophosphamide)、依托泊苷(etoposide)、丙卡巴腈(procarbazine)、泼尼松(prednisone)和博来霉素(bleomycin))和CAMP(洛莫司汀(lomustine)、米托蒽醌(mitoxantrone)、阿糖月包普(cytarabine)和泼尼松(prednisone)),其每一个都使用公知的剂量和时序方案。与本发明的多肽组合使用的化疗剂的量可根据受试者变化或可根据现有已知的内容主合药。如参见,BruceAChabner等,^m/"eo//aWc^ge"&,Goodman&Gilman'sThePharmacologicalBasisofTherapeutics1233-1287((JoelG.Hardman爭,编,第9版.1996)。在一个具体实施方式中,本发明的结合分子可向受试者给药,所述受试者曾经、正在、或正在经受外科手术过程,所述手术如用切除原发性肿瘤、转移或癌前期生长或组织而用作为预防性治疗。在另一个具体实施方式中,本发明的结合分子与生物制剂协同给药。用于治疗癌的生物制剂是现有已知的,而且可给药本发明的结合分子,例如与这类已知生物制剂协同给药。例如,FDA已批准了以下生物制剂用于治疗乳腺癌Herceptin(曲司3朱单抗(trastuzumab),GenentechInc.,SouthSanFrancisco,CA;对imR2-阳性乳腺癌具有抗肿瘤活性的人源化单克隆抗体);?3310£16乂@(氟维斯群(fulvestrant),AstraZenecaPharmaceuticals,LP,Wilmington,DE;用于治疗乳腺癌的雌激素受体拮抗剂);Arimidex(瑞宁德(anastrozole),AstraZenecaPharmaceuticals,LP;阻断芳香酶(制备雌激素所需的酶)的非类固醇芳香酶抑制剂);Aromasin⑧(依西美坦(exemestane),PfizerInc.,NewYork,NY;用于治疗乳腺癌的不可逆类固醇芳香酶灭活剂);l;emara(来曲哇(letrozole),NovartisPharmaceuticals,EastHanover,NJ;l,'DA批准治疗乳腺癌的非类固醇芳香酶抑制剂);和Nolvadex(他莫昔芬(tamoxifen),AstraZenecaPharmaceuticals,LP;FDA批准治疗乳腺癌的非类固醇抗雌激素)。其他可与本发明的结合分子组合的生物制剂包括AvastinTM(贝伐珠单抗(Bevacizumab),GenentechInc.;FDA批准的第一个设计用于抑制血管生成的治疗剂);和Zevalir^(替j尹莫单抗(ibritumomab)tiuxetan,Biogenldec,Cambridge,MA;当前批准用于治疗B细胞淋巴瘤的放射性标记的单克隆抗体)。另外,FDA批准了以下生物制剂用于治疗结肠直肠癌Avastin;ErbituxTM(西妥昔单抗(Cetuximab),ImCloneSystemsInc.,NewYork,NY,和Bristol-MyersSquibb,NewYork,NY;它是针对表皮生长因子受体(EGFR)的单克隆抗体);Gleevec⑧(曱磺酸伊马替尼(imatinibmesylate);蛋白质激酶抑制剂);和Ergamisol⑧(盐酸左咪唑(levamisolehydrochloride),JanssenPharmaceuticaProducts,LP,Titusville,NJ;FDA在1990批准用于在患Dukes氏C阶段结肠癌的患者中与5-氟尿嘧啶组合辅助治疗的免疫调节剂)。当前批准用于治疗非霍奇金氏淋巴瘤的疗法包括Bexxar(托西莫单抗(tositumomab)和石典1-131托西莫单抗,GlaxoSmithKline,ResearchTrianglePark,NC;多步疗法,其涉及与放射活性分子(碘1-131)连接的小鼠单克隆抗体(托西莫单抗));IntronA(干扰素alfa-2b,ScheringCorporation,Kenilworth,NJ;—类批准与包括小红莓类分子(如,环磷酰胺(cyclophosphamide)、阿霉素(doxombicin)、长春花新碱(vincristine)、和泼尼松(prednisone)[CHOP])的组合化疗协同治疗滤泡非霍奇金氏淋巴瘤的干4尤素);Rituxan⑧(利妥昔单4元(rituximab),GenentechInc.,SouthSanFrancisco,CA,和BiogenIdee,Cambridge,MA;批准治疗非霍奇金氏淋巴瘤的单克隆抗体;Ontak(denileukindiftitox,LigandPharmaceuticalsInc.,SanDiego,CA;由白喉毒素片段通过基因工程融合于白细胞介素-2纟且成的融合蛋白);和Zevalin⑧(ibritumomabtiuxetan,BiogenIdee;FDA糸匕准治疗B细胞非霍奇金氏淋巴瘤的放射性标记的单克隆抗体)。对于治疗白血病,可与本发明的结合分子组合Y吏用的示例性的生物制剂包括Gleevec;Campath-1H(阿伦珠单抗(Alemtuzumab),BerlexLaboratories,Richmond,CA;—类用于治疗慢性淋巴细胞白血病的单克隆击"t体)。另夕卜,可^l,Genasense(oblimersen,GentaCorporation,BerkleyHeights,NJ;可用在开发中的治疗白血病的BCL-2反义疗法(如,其单独或与一个或多个化疗药物(如氟达拉滨(fludambine)和环磷酰胺组合使用)与要求保护的结合分子一起给药。对于治疗肺癌,示例性的生物制剂包括TarcevaTM(盐酸埃罗替尼(crlotinibHCL),OSIPharmaceuticalsInc.,Melville,NY;设计靶向人表皮生长因子受体l(HERl)途径的小分子)。对于治疗多发性骨髓瘤,示例性的生物制剂包括VelcadeVelcade(bortezomib,MillenniumPharmaceuticals,CambridgeMA;蛋白酶体)。其j也生4勿制剂包4舌Thalidomid⑧(沙'矛J度胺(thalidomide),ClegeneCorporation,Warren,NJ;免疫调节剂,其表现出具有多种作用,包括能抑制骨髓瘤细胞的生长和存活并抗血管生成)。161其他示例性的生物制剂包括MOABIMC-C225,其由ImCloneSystems,Inc.,NewYork,NY开发。另外,要求保护的结合分子可与调节抗癌免疫应答的疫苗或其他试剂(如,纟田月包因子)协同给药。例如,Melacine(CorixaCorporation,Seattle,WA)是异源肿瘤疫苗,据报道其有希望治疗T3N0M0切除的黑素瘤。GMK(ProgenicsPharmaceutical,Inc.,Tarrytown,NY)是可作为辅助III期试剂在黑素瘤复发风险高的患者中给药的神经节苷脂抗原。抗胃泌激素的治疗性疫苗*(八口111011Corporation,Miami,FL)中和掉激素G17和gly扩展的G17,现处在III期临床试验治疗患结肠直肠、胰腺、和胃癌的患者。CeaVac,TitanPharmaceuticals,Inc.,SouthSanFrancisco,CA)是研咒用于结肠直肠癌的抗独特型抗体疫苗。最后,Theratope(BiomiraInc.,Edmonton,Alberta,Canada)是合成的碳水化合物治疗性疫苗,其作为HI期试剂在患转移性乳月泉癌的患者中进行研究(PharmaceuticaIResearchandManufacturersofAmerica,2000)。在另一个具体实施方式中,本发明的结合分子可与抗血管生成剂协同给药抗血管生成剂,如,内皮抑制素(endostatin)(内源性肿瘤源的内皮特异性抑制剂,其中断微血管内皮细胞的产生);抗VEGF抗体;沙利度胺(thalidomide);或基质金属蛋白酶抑制剂,其抑制血管血管基质膜的合成和降解)。如前所述,本发明的结合分子、免疫反应性的片段或其重组体可以药物有效量沐力给药用以治疗哺乳动物病症。对此,将理解的是,将所公开的结合分子配成制剂,从而方便给药并提高活性试剂的稳定性。本发明所述的药物组合物优选包含药学上可接受的、无毒、无菌载体(如生理盐水)、无毒緩沖液、防腐剂等。为了本申请的目的,偶联或非偶联于治疗剂的本发明的结合分子的药物有效量应当指量,其足以达到有效结合靶位并实现益处,如用以改善疾病或病症的症状或才全测物质或细胞。对于肿瘤细^^,多用,并增加那些细胞的死亡。当然,本发明的药物组合物可以单剂或多剂给药以提供药物有效量的多肽。在本文公开的范围内的是,根据前述治疗方法本发明的多肽可向人或其他动物以足以产生治疗或预防效果的量来给药。本发明的多肽可根据已体或稀释剂的常规给药形式来给药。本领域普通技术人员将认识到,通过要组合的活性成分的量、给药途径和其他公知变化来规定药学上可接受的载体或稀释剂的形式和特征。所属领域技术人员还将理解,含一或多种本发明所述多肽的混合物证明是尤其有效的。XIV.应用方法
技术领域
:本发明的分子可在希望使用稳定化scFv分子或含这类scFv分子的组合物的情况下使用,如用于诊断或治疗目的。本发明优选的具体实施方式提供了诊断和/或治疗会受益于给药本发明结合分子的病症(如需要这样治疗的哺乳动物受试者中的肿瘤疾病)的化合物、组合物试剂盒和方法。受试者优选是人。在一个具体实施方式中,测试中可用受试结合分子来体外检测肿瘤抗原,如使用ELISA测试进行。示例性的测试是现有已知的,如参见美国申请号20040077025。在另一个具体实施方式中,利用成像技术,受试结合分子用于检测含肿瘤抗原的细胞的存在与否。如以下进一步所述的,对于这类应用,希望在另一个具体实施方式中,受试结合分子用于减少或消除带有本发明结合分子识别的表位(如,Cripto表位或TNF受体家族成员(如TRAIL-R2或L—卬R)的表位)的细胞(如通过凋亡)。在另一个具体实施方式中,受试结合分子有效降低或消除循环中的可溶靶分子浓度。在另一个具体实施方式中,本发明的结合分子减小肿瘤大小,抑制肿瘤生长和/或延长患肿瘤的受试者的生存期。因此,本发明还涉及通过向人或动物给药有效并无毒剂量的多肽来治疗人或其他动物的肿瘤的方法。所属领域技术人员通过常规实验能确定为了治疗恶性肿瘤,需要多少有效并无毒剂量的多肽。例如,治疗活性量的多肽可根据以下因素而变化,如疾病状态(如,I期和IV期)、年龄、性别、医学并发症(如,免疫抑制状态或疾病)和受试者体重、和结合分子在受试者中引发所希望的应答的能力。可调节给药方案以提供最佳治疗响应。例如,每天可分开给药几次药剂,或者根据治疗状况的紧急程度来按比例减少药剂。可是,一般而言,预计有效剂量介于约0.05至100毫克每千克体重每天,更优选为约0.5至10毫克每千克体重每天。为了清楚表示,"哺乳动物"指任何哺乳动物类的动物,包括人、驯养和畜牧动物、和动物园、运动或宠物动物,如狗、马、猫、奶牛等。哺乳动物优选是人。"处理"指治疗性处理和预防或防止性4晉施。需要处理的那些包括已经患有疾病或病症的那些以及要预防疾病或病症的那些。因此,可将哺乳动物诊断为患有疾病或病症或倾向于或易于患病。一般而言,所公开的组合物可用于预防或治疗。例如,用本发明的结合分子可检测或抑制(如,杀死)含标记的瘤,所述标记能使结合分子靶向癌细胞。在优选的具体实施方式中,本发明的结合分子可用于实体瘤。可治疗的示例性的癌包括但不限于,前列腺、胃癌,如结肠、皮肤、乳腺、卵巢、肺和胰腺癌。在另一个具体实施方式中,本发明的抗体可用于治疗卡波西肉瘤(Kaposi'ssarcoma)、中枢神经系统瘤形成(CNSneoplasias)(毛细血管-學纟田月包瘤(capillaryhemangioblastomas)、脑月莫瘤(meningiomas)和月卤瘤4争移(cerebralmetastases))、黑素瘤(melanoma)、胃肠禾口肾肉瘤(gastrointestinalandrenalsarcomas)、斗黄纟丈月几肉瘤(rhabdomyosarcoma)、成月交质纟田月包瘤(glioblastoma)(优选多形性成胶质细胞瘤(glioblastomamultiforme))、平滑肌肉瘤(leiomyosarcoma)、^L网月莫母细月包瘤(retinoblastoma)、卯巢的乳头状嚢性A袈癌(papillarycystadenocarcinomaoftheovary)、维尔姆其斤瘤(Wilm'stumor)或小细胞肺癌(smallcelllungcarcinoma)。将理解的是,根据本文公开,合适的多肽可源于与以上每种瘤相关的与肿瘤相关的分子,而无需过度的实验。所公开的发明能治疗的示例性的恶性血液肿瘤包括霍奇金和非霍奇金淋巴瘤以及白血病,包括ALL-L3(Burkitt氏型白血病)、慢性淋巴细l包白血病(CI丄)和单核细胞白血病。将理解的是,本发明的化合物和方法能尤其有效地治疗各种B细胞淋巴瘤,包括低级/滤泡非霍奇金氏淋巴瘤(NHL)、细胞淋巴瘤(FCC)、皮质细胞淋巴瘤(mantlecelllymphoma,MCL)、弥散性大细胞淋巴瘤(DLCL)、小淋巴细胞(SL)NHL、中级/滤泡NHL、中级弥散性NHL、高级免疫母细胞NHL、高级淋巴母细菌NHL、高级小非裂解细胞NHL、巨大症NHL和Waldenstrom氏巨球蛋白血症。本领域普通技术人员应当清楚的是,由于变化的分类系统,这些淋巴瘤通常会有不同的名称,而且患有不同分类名称的淋巴瘤的患者也可受益于本发明的组合治疗方案。除了前述肿瘤疾病,将理解的是,所公开的发明可有益地用于治疗其他带有与胂瘤相关的相容分子的恶性肺瘤。在一个具体实施方式中,本发明的结合分子能特异结合肺瘤细胞抗原并抑制患者的肿瘤细胞。在某些具体实施方式中,肿瘤细胞是脑、头部、颈部、前列腺、乳腺、睾丸、结肠、肺、卵巢,膀胱、子宫、宫颈、胰腺和胃肿瘤细胞。在其它具体实施方式中,本发明的结合分子特异结合肿瘤细胞抗原并抑制过量表达抗原的肺瘤细胞的生长。在一个具体实施方式中,肿瘤细胞是过量表达抗原的细胞系,如源自脑、乳腺、睾丸、结肠、肺、卵巢、膀胱、子宫、宫颈、胰腺和胃癌的细胞系。在另外其他的具体实施方式中,本发明的结合分子可用于治疗免疫疾病,其包括但不限于,变应性支气管肺曲菌病(allergicbronchopulmonaryaspergillosis);变应性鼻炎自身免疫性溶血性贫血(AllergicrhinitisAutoimmunehemolyticanemia);黑l束皮病(Acanthosisnigricans);哭应性才妾触性皮炎(Allergiccontactdermatitis);艾迪生病(Addison'sdisease);特应性皮炎(Atopicdermatitis);斑壳(Alopeciaareata);普壳(Alopeciauniversalis);淀粉样变(Amyloidosis);过敏性样紫癜(Anaphylactoidpurpura);过敏性样反应(Anaphylactoidreaction);再生障碍性贫血(Aplasticanemia);遗传性血管性水月中(Angioedema,hereditary);特发性血管性水肿(Angioedema,idiopathic);强直性脊^t炎(Ankylosingspondylitis);卢贞动月永炎(Arteritis,cranial);巨细月包动月永炎(Arteritis,giantcell);高安动脉炎(Arteritis,Takayasu's);颞动月永炎(Arteritis,temporal);哮喘(Asthma);共济失调-毛细血管扩张症(Ataxia-telangiectasia);自身免疫性卵巢炎(Autoimmuneoophoritis);自身免疫性睾丸炎(Autoimmuneorchitis);自身免疫性多内分泌腺衰竭Autoimmunepolyendocrinefailure);贝3赤+刀4争病(Behcet'sdisease);贝热龙病(Berger'sdisease);伯才各病(Buerger'sdisease);支气管炎(bronchitis);大疱性天'庖裔Bullouspemphigus);'l"曼'性3f'占月莫皮月夫念5朱菌病(Candidiasis,chronicmucocutaneous);卡普兰综合症(Caplan'ssyndrome);心肌才更死后综合症(I)ost-myocardialinfarctionsyndrome);心、包士刀开后纟宗合症(Post-pericardiotomysyndrome);心脏炎(Carditis);乳糜泻(Celiacsprue);查力口斯病(Chagas'sdisease);i射-希综合4正(Chediak-Higashisyndrome);丘-斯纟宗合j正(Chediak-Higashisyndrome);牙牛根综合征(Cogan'ssyndrome);冷凝集素病165(Coldagglutinindisease);CREST综合症(CRESTsyndrome);克隆病(Crohn'sdisease);冷球蛋白血症(Cryoglobulinemia);隐原性纤维性肺泡炎(Cryptogenicfibrosingalveolitis);疱渗样皮炎(Dermatitisherpetifomis);皮肌炎(Dermatomyositis);jf唐尿病(Diabetesmellitus);戴-布纟宗合症(Diamond-Blackfansyndrome);迪乔治综合症(DiGeorgesyndrome);盘3夫纟工扭王《良痴(Discoidlupuserythematous);嗜酸性细胞增多性肌膜炎(Eosinophilicfasciitis);巩膜外层炎(Episcleritis);持久隆起性红斑(Erythemaelevatumdiutinum);边纟彖性纟工扭王(I':rythemamarginatum);多形性红斑(Erythemamultiforme);结节性红斑(卜:rythemanodosum);家族性地中海热(FamilialMediterraneanfever);费尔蒂综合征(Felty'ssyndrome);肺纤维化(Fibrosispulmonary);过每文性样肾小i求肾炎(Glomerulonephritis,anaphylactoid);自身免疫性肾小球肾炎(Glomerulonephritis,autoimmune);链J求菌感染后肾小J求肾炎(Glomerulonephritis,post-streptococcal);移植后肾小球肾炎(Glomerulonephritis,post-transplantation);月莫性肾小;求肾炎(Glomerulopathy,membranous);古德、帕其斤丘综合4i(Goodpasture'ssyndrome);免疫介导的斗立纟田胞减少(Granulocytopenia,immune-mediated);环形肉芽月中(Granulomaannulare);变态性肉芽月中病(Granulomatosis,allergic);肉芽月中月几炎(Granulomatousmyositis);才各雷夫斯病(Grave'sdisease);桥本曱状月泉炎(Hashimoto'sthyroiditis);新生儿溶血性疾病(Hemolyticdiseaseofthenewborn);特发性血色素沉着病(Hemochromatosis,idiopathic);亨-舍紫癜(1lenoch-Schoenleinpurpura);'l"曼'性;舌动'l"生和'l"曼'l"生进孑亍'I"生肝炎(Hepatitis,chronicactiveandchronicprogressive);组织纟田胞增多症X(HistiocytosisX);嗜酸性细胞增多综合征(Hypereosinophilicsyndrome);特发性血小4反减少性紫癜(Idiopathicthrombocytopenicpurpura);乔布综合征(Job'ssyndrome);幼年型皮月几炎(Juveniledermatomyositis);幼年型类风湿关节炎(Juvenilerheumatoidarthritis)(幼年型'l"曼性关节炎(Juvenilechronicarthritis));川崎综合征(Kawasaki'sdisease);角膜炎(Keratitis);干燥性角结膜炎(Keratoconjunctivitissicca);才各4木—巴矛J纟宗合4正(Landry-Guillain-Barre-Strohlsyndrome);结节寸生麻疯(Leprosy,lepromatous);萆力.夫勒纟宗合4正(Loeffler'ssyndrome);《良痴(lupus);莱尔综合4正(Lyell'ssyndrome);莱姆病(Lymedisease);淋巴瘤样肉芽月中病(Lymphomatoidgranulomatosis);全身性月巴大细月包病(Mastocytosis,systemic);混合')"生结皇争ia织病(Mixedconnectivetissuedisease);多发性单神经炎(Mononeuritismultiplex);穆-韦综合征(Muckle-Wellssyndrome);粘膜皮月夫淋巴结综合4正(Mucocutaneouslymphnodesyndrome);粘月莫皮月夫'淋巴结综合4正(Mucocutaneouslymphnodesyndrome);多中心网状组织细胞增多症(Multicentricreticulohistiocytosis);多发性硬化(Multiplesclerosis);重症肌无力(Myastheniagravis);蕈样肉芽月中病(Mycosisfungoides);全身坏死性血管炎(Necrotizingvasculitis,systemic);肾病综合征(Nephroticsyndrome);重叠综合征(Overlapsyndrome);脂月莫炎(Panniculitis);阵发'I"生寒,令'l"生血纟工蛋白尿(Paroxysmalcoldhemoglobinuria);阵发'l"生睡目民'l"生血纟工蛋白尿(Paroxysmalnocturnalhemoglobinuria);类天疱痴(Pemphigoid);天疱裔(Pemphigus);纟工J赶'l"生天疱痴(Pemphiguserythematous);落口十'l"生天疱掩(Pemphigusfoliaceus);寻常'I"生天疱齊(Pemphigusvulgaris);如]鴒者病(Pigeonbreeder'sdisease);过敏性月巿炎(Pneumonitis,hypersensitivity);结节性多动脉炎(Polyarteritisnodosa);风湿性多月几痛(Polymyalgiarheumatic);多肌炎(Polymyositis);特发性多神经炎(Polyneuritis,idiopathic);葡萄牙型家族性多神经病(Portuguesefamilialpolyneuropathies);惊厥前期(Prc-eclampsia)/围产期惊厥(eclampsia);原发性胆汁性肝石更化(Primarybiliarycirrhosis);进4亍性系纟克性石更4匕症(Progressivesystemicsclerosis)(石更皮病(Scleroderma));银屑病(Psoriasis);4艮屑病关节炎(Psoriaticarthritis);肺泡蛋白';兄着y直(Pulmonaryalveolarproteinosis);肺纤纟1M匕(Pulmonaryfibrosis),雷i若现象/纟宗合症(Raynaud'sphenomenon/syndrome);里德尔曱一犬月泉炎(Reidel'sthyroiditis);赖特尔综合征(Reiter'ssyndrome),复发性多软骨炎(Relapsingpolychondritis);风湿热(Rheumaticfever);类风湿性关节炎(Rheumatoidarthritis);结节病(Sarcoidosis);巩膜炎(Scleritis);硬化性胆管炎(Sclerosingcholangitis);血清病(Semmsickness);塞泽里综合j正(Sezarysyndrome);舍冲各伦纟宗合症(Sjogren'ssyndrome);斯-约综合症(Stevens-Johnsonsyndrome);斯蒂尔病(Still'sdisease);亚急性硬化性全脑炎(Subacutesclerosingpanencephalitis);交感性眼炎(Sympatheticophthalmia);全身性红斑狼痴(Systemiclupuserythematous);移才直排斥反应(Transplantrejection);溃疡性结肠炎(Ulcerativecolitis);未分4匕结締纟且织病(Undifferentiatedconnectivetissuedisease);慢性荨麻疹(Urticaria,chronic);寒冷性荨麻疹(Urticaria,cold);眼167色素层炎(Uveitis);白斑(Vitiligo);韦-克病(Weber-Christiandisease);韦格纳肉芽肿症(Wegener'sgranulomatosis)和维陽奥综合4正(Wiskott-Aldrichsyndrome)。在另一个具体实施方式中,本发明的结合分子可用于预靶向应用。例如,用于化学治疗药物递送的预靶向应用中将明显有同样的优势。例如,预靶向时,用结合构建体预靶向肿瘤,如,所述构建体一方面具有针对与肿瘤相关的抗原的亲和性并且另一方面具有放射性标记的半抗原。之后给药放射性标记的半抗原,优选在清除掉对与肿瘤相关的抗原有亲和性的结合构建体之后(如参见,Boerman等2003.J.NuclearMed.44:400)。在另一个例子中,抗体无毒,但在结合分子结^^时,能与有毒药物或前药反应而衍生出。根据本实施例的生物分布数据,本发明的结合分子很适于用于预靶向应用中。在一个具体实施方式中,用本结合分子可在预靶向法中去除掉清除剂。本发明进一步通过以下实施例来说明,其不应当被解释为限制性实施例。本申请引用的所有文献、专利和公开的专利申请全文都纳入本文参考。实施例除非另有说明,将下列材料和方法用于所有实施例中。一般材料和方法除非另外指出,本发明的实施通常使用化学、生物物理学、分子生物学、重组I)NA技术、免疫学(特别地,例如,抗体技术)的常规技术,以及电泳中的标准技术。参见,例如Sambrook,Fritsch禾口Maniatis,MolecularCloning:ColdSpringHarborLaboratoryPress(1989);AntibodyEngineeringProtocols(MethodsinMolecularBiology),510,Paul,S.,HumanaPr(1996);AntibodyEngineering:APracticalApproach(PracticalApproachSeries,169),McCafferty,Ed"IrlPr(1996);Antibodies:ALaboratoryManual,Harlow等人,C.S,II丄.Press,Pub.(1999);和CurrentProtocolsinMolecularBiology,编者Ausubel等人,JohnWiley&Sons(1992)。表达构建体除非另外指出,下列实施例中的scFvs表达构建体包4舌N末端GeneIII信号肽以及C末端纯化肽,该纯化肽包含Myc和His标签以及肠激酶切割位点。各种肽的DNA序列如下所示N末端GeneIII信号肽DNA序列GCCATAGT(SEOIDNO:25)N末端GeneIII信号肽DNA序列MKKLLFAIPLVVPFYSHS(SEOIDNO:26)C末端纯化肽:DNA序列AGAG(IDNO:27)C末端纯化肽DNA序列DDDDKSFLEQKLISEEDLNSAVDHHHHHH(SEQIDNO:58)抗体某些实施例中所使用的BIIB抗体(BIIB1-BIIB18)是具有多特异性的多种治疗性抗体的集合。这18种抗体中的17种是表达自稳定的大量(bulk)或克隆化CHO细胞系,1种抗体(BIffil3)是利用HEK293E细胞中的瞬时转染来表达的。所有18种抗体均含有Kappa轻链。抗体中的大部分是人IgGl,然而BI旧2、BIIB5和BIIB11是人IgG4。18种抗体种的17种是人的或人源化的。BIIB15是灵长类化的(PRIMATIZED⑧,Nakamura等人,2000)。对于每种抗体的人种系(humangermine)的同一性是通过将BIIBVH或Vk序列与公开提供的人种系进行ClustalW比对(位于欧洲生物信息学协会的ClustalWWWWService,Thomapson等人,1994)来评估的。全部18种抗体中的15种是IgGl亚类,而剩余的3种是IgG4(BIIB2、BIIB5和BIIBll)。IgGl和IgG4CH1序列具有10个氨基酸的差异(6个是保守的)以及另一种与轻链进行二硫键结合的形式。将具有双重Fv区域的IgGl和IgG4构建体用于研究IgG亚类对Fab稳定性的影响。产生了两种构建体,其含有移植至IgGl或IgG4重链恒定区上的BIIB7的VH区域。实施例1.制备常规BHA10scFv和Fab蛋白质利用下列表2中所示的寡核苷酸引物通过聚合酶链式反应(PCR)从质粒pXWU034亚克隆BHA10scFv。正向引物BHA10-01F含有唯一的Sp/zl限制性内切酶位点(划线的序列),其后是与BHAION末端重链可变区基因互补的18个碱基的序列。反向引物,BHA10-01R,含有与BHA10C末端轻《连可变区基因互补的24个碱基的序列、与肠激酶位点互补的15个碱基的序列以及相邻的///^/m和Z5aI限制性内切酶位点(限制性位点是划线的)。PCR扩增之后,符合预期大小的PCR产物通过琼脂糖凝胶电泳分辨、切出并利用MilliporeUltrafree-DA提取试剂盒(Millipore;Bedford,MA)根据厂商的说明书对其进行纯化。用S;/zI消化所纯化的PCR产物,通过用DNA聚合酶I在dNTPs存在下的消化来制备平端,然后用历mHII来消化。将平端的〃//"^m消化过的PCR产物连接至1////"din消4匕的pKJS216。pKJS216是一种大肠杆菌载体,其驱动在诱导型araC启动子控制下的重组蛋白表达。将部分连接混合物用于转化的大肠杆菌菌株XL1-Blue。筛选氨千青霉素药物抗性菌落,且DNA序列分析确认了最终pIEH003构建体的正确序列。BIIA10scFv的DNA和氨基酸序列分别显示于图1A和1B中。表2.用于常规BHA10scFv的PCR扩增的寡核苷酸<table>tableseeoriginaldocumentpage170</column></row><table>为表达BHA10scFv,在1L带挡板的摇瓶中将新鲜分离的经质粒PmiI003转化的大肠杆菌菌抹W3110(ATCC,Manassas,Va.Cat.#27325)菌落培养于4x250ml含有50(ig/ml羧千青霉素的SB培养基(Teknova,HalfMoonBay,Ca.Cat.#S0140)中,直至OD600三0.8,通过添加0,02%的阿拉伯糖来诱导,并培养过夜。通过离心收集细菌。利用40mLB-PER蛋白质提取试剂(Cat存78243,Pierce)溶解并裂解沉淀物。将溶解的scFv上样到5mLNi-NTA-超流体柱(Cat存30410,Qiagen)。用60mM、pH8.0的咪唑洗涤结合的scFv,并用300mM、pH8.0的咪哇洗脱。将洗脱的scFv上样于6mLProteinL琼脂糖柱(Ca估20510,Pierce)上。用磷酸緩沖盐水(PBS)洗涤并用0.1M、pH3.0的甘氨酸洗脱。将纯化的scFvs经PBS透析并储存于-20。C。利用s280圆=2.1mlmg"cm-1测定蛋白质浓度。为酶解制备BHA10Fab,将BHA10IgG与4pl浓缩的木瓜蛋白酶储液(0.3mg/mL,30Units/mg-Cat#108014,Roche)混和于含有2.4mg/mLBHA10IgGl、100mMTris-HCl、20mMEDTA的8.3ml、pH7.0的溶液中。使反应在25°C进行90分钟。用pH5.0的20mM醋酸将消化溶液以1:5进行稀释,并将其上样至经稀释缓冲液平衡的6mlSP-SepharoseFF柱上。用2倍柱体积的稀释緩冲液洗涤柱子。用30倍柱体积的0-200mMNaCl线性梯度洗脱粗制的Fab片段。收集了中心位于140mMNaCl(总共~24mL)的宽峰,其包含已消化的IgG物质的大部分。通过浓縮将洗脱体积降低至2mL并将其上样至经PBS平tf的制备型G300SWTosohaasSEC柱(109mL)上。在0.8个柱体积时洗脱出Fab15mL。将纯化的Fab浓缩至2-11mg/mL。利用e280nm二1.5mLmg-1cm-1测定Fab浓度。实施例2.常规BHA10scFv分子的热稳定性使用差示扫描量热法(DSC)测试分离的BHA10scFv本质上是否比其h'ab对应物更不稳定。利用自动毛细管差示扫描量热器(capDSC,MicroCal,LLC)进行扫描。利用自动装置从96孔板中取样蛋白质和参考溶液。在每次蛋白质扫描之前,样品细胞用緩冲液进行两次扫描并用于背景扣除。在每次蛋白质扫描之后利用5%Liquinox进行一次清洗扫描。每次扫描之后,仪器自动用2ml含有0.01%叠氮化钠的蒸馏的去离子水清洗参考和样品细胞3次。为获得增强的峰分辨度,利用培养基反馈(mediumfeedback)模式以每分钟1。C进行扫描。扫描范围为20-95。C。将所有含有蛋白质的96孔板在6°C储存于仪器中。图2显示了用纯化的HBA10Fab和scFv抗体片段进行的DSC测定。在量热器内,将温度升高直至Fab或scFv解折叠。每种蛋白质解折叠的温度(即,]M值)可指示总体稳定度。BHA10Fab的所有四种结构域(Vn、VL、CH1和C。共同在78°C解折叠(图2A)。scFv结构域缺少CH1和CL结构域。没有这个支架结构,scFv的结构域在比Fab低很多的温度下解折叠,且结构域的量热焓有显著降低,这表明稳定相互作用的丧失。Vi结构域在68。C的TM解折叠,而VH结构域在58°C解折叠,比所观察到的BHA10Fab的解折叠转变温度低20。C(图2B)。另外,存在丁M的扫描速度依赖性,表明在加热过程中正在发生蛋白质聚集,其随着扫描速度的降低人为地降低了scFv的TM(Sanchez-Ruiz等人,Biochemistry,27:1648-1652,1988)。低的表观稳定性和聚集的倾向也许是CHO细胞不能产生显著量的含有scFv的稳定、非聚集性材料例如常规Hercules双特异性抗体分子的决定性因素。实施例3.具有增强的热稳定性的BHA10scFv分子的构建由于得知如实施例2中所证实的,BHAIOscFv结构域是本质上不稳定的,那么假设,通过使用重组DNA技术改造scFV,来产生修饰的scFv,使其在热挑战条件下热力学或功能上等同于Fab,应能获得对构建双特异性抗体有用的scFv结构域。而且,还可假设,分离的scFv结构域被其自身改造后,应能获得当被重新引入作为完全双特异性分子的组件时所能获得的任何有益的生物物理学特性。为此目的,开始努力利用大肠杆菌表达系统增加BHAIOscFv结构域的生物物理学稳定性,并通过测定热挑战试验中耐热scFv结构域对配体的结合来监测稳定性的提高。为稳定scFv结构域使用了两种方法1)在BHA10scFv的^t和VL结构域之间引入二硫键;和2)使连接BHAIOscFv的VH和VL结构域的(Gly4Ser)n连接体长度优化。A.二硫键稳定的BHAIOscFv的构建利用生成BHAIOscFv的细菌表达载体,pIEH003作为亲代载体。根据广商的说明书,使用QuickChange定点诱变试剂盒(Stratagene;LaJolla,CA)将可参与形成稳定二硫键的两个半胱氨酸残基其中之一引入VH、第二个引入VL。使用引物对VH44-F和VH44-R(表3)将BHAIO可变重链44位上(Kabat编号系统)的Gly残基(GGA)诱变为Cys残基(TGC)。根据试剂盒的方案用甲基化敏感的酶"/wI消化诱变产物,并将其转化进大肠杆菌菌抹XLl0-GOLD(Stratagene;LaJolla,CA)。通过DNA序列分析,筛选转化了氨苄青霉素药物抗性的大肠杆菌菌落中正确的序列突变。将所获得的质粒pIEH004用于随后的反应,从而利用引物对VL100-F和VL100-R(表3)将位于BHAIO可变轻链100位上(Kabat编号系统)的Gin残基(CAG)突变为Cys残基(TGC)。正向(VH44-F)和反向(VH44-R)引物将位于VH位置44上的Gly(GGA)突变为Cys(丁GC)(TGC由划线序列表示)。正向(VLIOO-F)和反向(VLIOO-R)引物将位于VL100位上的Gln(CAG)突变为Cys(TGC)(TGC由划线序列表示)。通过序列分析筛选转化了氨苄青霉素药物抗性的XL10-GOLD大肠杆菌菌落中正确的序列突变,并鉴定质粒pIEH006为在VH44和VL100位上含有双半胱氨酸突变。VH44/VL100二硫4t稳定的BHAIOscFv的DNA和氨基酸序列分别显示于图3A和3B中。表3.用于构建VH44/VL100二硫键稳定的BHA10scFv的寡核苦酉臾。<table>tableseeoriginaldocumentpage173</column></row><table>B.用备选的(Gl^Serk连接体构建BHA10scFv利用表4中所述的寡核苷酸引物通过PCR扩增,对具有常规(Gly4Ser)3连接体的编码BHA10scFv的质粒p正H003进行修饰,使其含有(Gly4Ser)4或(Gly4Serh连接体。利用按正向5'PCR引物命名的pXWU002-Fl和按反向3'PCR引物命名的XWU002-R组装BHAIOscFv(Gly4Ser)4。5,VHPCR引物XW002-F1包括定位于BHA10VH羧基端的份gl限制性内切酶位点(划线序列),其后是编码(Gly4Ser)4连接体的序列。3,VLPCR引物XW002-R包括laI位点和部分肠激酶位点。利用XW002-F1/XW002-RPCR引物组在PCR反应中从质粒DNAp正H003(实施例1中所述)扩增部分BHAIOVH+(Gly4Ser)4连接体+BHA10VL区域。通过琼脂糖凝胶电泳分辨符合预期大小的部分BHAIOscFv-(Gly4Ser)4连接体基因片段、将其切出并利用MilliporeUltrafree-DA提取试剂盒(Millipore;Bedford,MA)根据厂商的说明书对其进行纯化。消化纯化的PCR产物并将其克隆进份gI/XfeaI消化的pIEH003载体中,获得编码含有(Gly4Ser)4连接体的BHAIOscFv的pXWU002质粒。利用PCR引物XW003-F和XW002-R以类似的方式构建含有(Gly4Ser)5连接体的BHA10scFv,从而产生质粒pXWU003。正向5'PCR引物(XWU003-F)含有份gl位点(划线序列),其后是编码BHAIOVH羧基端的几个氨基酸的序列和编码部分(Gly4Ser)s连接体的序列。通过DNA序列分析确认正确的序列。含有(Gly4Ser)4连接体的BHAIOscFv的DNA和氨基酸序列分别显示于图4A和4B中。含有(Gly4Ser)s连接体的BHA10scFv的DNA和氨基酸序列分别显示于图5A和5B中。表4.用于构建具有(Gly4Ser)4或(Gly4Ser)5连接体的BHA10scFv的寡核苷酸。<table>tableseeoriginaldocumentpage174</column></row><table>实施例4.具有增强的热稳定性的BHA10scFv分子的表征A.工程化BHA10scFv的表达和蛋白质印迹分析为表达工程化BHA10scFv,用质粒pIEH003,pXWU002,pXWU003和pini1006转化大肠杆菌菌抹W3110(ATCC,Manassas,Va.Cat.#27325),筛选氨千青霉素抗性克隆,并将其培养于在50mi尖底离心管中的10ml含有50吗/ml羧千青霉素的SB培养基(Teknova,HalfMoonBay,Ca.Cat.#S0140)中,直至OD柳,s0.8,通过添加0.02%的阿拉伯糖来诱导,并培养过夜。通过离心收集细菌并将沉淀物重悬于1/20体积的冰冷的等渗溶液中并在冰上冷卸,所述等渗溶液为50mMTris-HCl,pH8.0,1mMEDTA,和20%蔗糖(w/v)。向细菌悬浮液中添加等体积含有2mg/ml溶菌酶(Sigma)的50mMTris-nCl,pH8.0,1mMEDTA,和20。/。蔗糖(w/v),并在水上孵育伴有偶尔的搅拌,共计10分钟。将细菌悬浮液在8000xg、4。C离心10分钟,并保留胞质组分。用天然样品緩冲液或含有还原剂二硫苏糖醇的样品援冲液与样品混和并在90°C加热3分钟。将还原的和非还原的样品在SDS-PAGETris-甘氨酸聚丙烯酰胺凝胶上电泳,并电泳转移至硝酸纤维素膜上(Invitrogen,LifeTechnologies,Carlsbad,CA)。用含有5%(w/v)脱脂牛奶和0.1%TritonX-100的PBS封闭月莫,并与4元人kappa抗体(RocheAppliedScience,Indianapolis,IN)孵育。洗涤膜,然后与抗兔HRP抗体(AmershamBiosciences,Piscataway,NJ)孵育。利用ECL蛋白质印迹分析系统才艮据厂商说明书(AmershamBiosciencesPiscataway,NJ)检测免疫复合物。发现所测试的三对二石克化物之一,即Vh44:VlJ00,当在大肠杆菌中表达时产生了合适量的蛋白质(图6,第2道)。(所测试的VH44:VL105和VH106:VL43二硫化物未产生如完整scFv—样多的蛋白质)。类似地,延长(Gly4Ser)n连接体的长度至n二4(第3道)或n^5(未显示)也在大肠杆菌中产生了合适量的蛋白质。利用实施例3中所述的方法将VH44:VLl00和(Gly4Ser)4连接体修饰组合成BHAIOscFv也表达了合适量的蛋白质(图6,第4道)。含有V44:VL100和(Gly4Ser)4连接体修饰的组合的BHA10scFv的DNA和氤基酸序列分别显示于图7A和图7B中。在其中BHA10scFv含有Vh44:V,.100突变的两种情况下,均发现scFvs以增强的迁移率在变性的、非还原性聚丙烯酰胺凝胶中移动,而在变性的、还原性条件下以类似于常规BHA10scFv的迁移率迁移(图6,第2和4道)。该分析表明含有V"4:VL100突变的BHA10scFv变体很可能形成完整的二硫键并可能获得更紧密的结构。B.热变性试验。然后在热挑战试验中比较了常规和工程化BHA10scFv的活性,该试验可用于测定在热挑战事件之后50%的scFv分子保持其抗原结合活性的温度。对应于此温度的数值称为"1V,值,单位为。C。在此试验中,将scFv置于包含常规BHA10scFv的热跃迁温度在内的系列温度下。用编码在诱导型araC启动子控制下的常规和工程化BHA10scFvs的质粒转化大肠杆菌菌抹(ATCC,Manassas,Va.Cat.#27325)。在由SB(Teknova,HalfMoonBay,Ca.Cat.#S0140)组成的、补充了1%甘氨酸、1%TritonX100、0.02%阿拉伯糖和50昭/ml羧千青霉素的表达培养基中,在37°C或32。C下培养转化体。通过离心沉淀细菌并收获上清液用于后续处理。培养基中包含甘氨酸和TritonX-100导致周质内含物(天然大肠杆菌蛋白质和scFv)向i咅养基的牙,》文(Yang等人,AppliedandEnviromentalMicrobiology.(998)64:2869-2874)。上清液中大肠杆菌蛋白质的存在对该试验的完成是必需的,因为热变性蛋白质作为"槽(sink)",瞬时捕集非折叠的scFv分子使之成为不可逆的非活性聚集体。利用热挑战试验一式两份地筛选每个文库,将来自一个副本的上清液置于处理条件,而第二份上清液用作未处理参考。可在单个或系列温度下进行热变性试验来测量稳定性。将能够产生稳定的热梯度的热循环器用于处理样品上清液(iCycler,Bio-Rad,Gaithersburg,Md)。挑战温度依亲本BHA10scFv变体的特性而不同,通常比实验所测定的Ts()值高出2至3摄氏度。将冷冻的主皿解冻并用于接种每孔含有250^1表达培养基的深孔微量滴定板,并将培养物在32°C下培养过夜。作为对照,将含有亲本质粒的培养物培养在相同条件下并随文库同时进行处理。沉淀细菌并将50-100^1等分试样的测试上清液置于PCR带状管(AppliedBiosystems,FosterCity,Ca,Cat.#N801-535)中,或96孑L板(AppliedBiosystems,FosterCity,Ca,Cat.#N801-560)中,将样品加热60-90分钟将样品转移至96孔v形底的板(Coming,Corning,NY,Cat.#3357)中,在冷冻医用离心才几(正Cmodel8R,ThermoElectron,Waltham,Ma)中离心30分钟,转移100(il上清液至标准微滴板(Corning,Corning,NY,Cat.#3357)中。储备一等分试样的上清液用作参考DELFIA。对于大多数文库,将含有上清液残余部分的板密封(NalgeNunc,Rochester,NY,CatJ235205)并于设置到合适挑战温度的培养箱中(EchoTherm,TorreyPinesScientific,SanMarcos,Ca)放置90分钟。对于需要多重挑战温度的筛选而言(或对于高于75°C的温度),将上清液转移至96孔PCR板(AppliedBiosystems,FosterCity,Ca,Cat.#N801-560)中,并在目的温度孵育90分钟。在热挑战之后,在2000RPM/分钟离心样品以除去聚集的材料。将处理的清澈的上清液中所保留的可溶性BHA10scFv样品用于通过DELFIA试验来测定其对同类(cognate)LT(3RIg抗原的结合。用由LT卩受体(LT(3R)的外功能区与人的Fc区域相融合组成的融合蛋白以存在于0.1M、pH9.5的碳酸納li沖液中的1)Ltg/ml来包#皮96孑(4反(MaxiSorp,NalgeNunc,Rochester,NY,Cat.#437U1)。4。C将平板包被过夜,并用DELFIA试验緩冲液(DAB,10mMTrisHC1,150mMNaCl,20(iMEDTA,0.5%BSA,0.02%Tween20,0,01%NaN3,pH7.4)在室温振荡封闭1小时。用不含BSA的DAB(洗涤緩沖液)洗涤平板3次,添加稀释于DAB中的测试样品至平板中,达到终体积100pl。将平板在室温振荡孵育1小时,用洗涤緩冲液洗涤3次以除去未结合的和功能失活的scFv分子。通过添加每孔lOO)il含有40ng/ml的经Eu标记的抗His6抗体(PerkinElmer,Boston,MA,Cat.#AD0109)的DAB,并在室温振荡孵育l小时,来检测结合的BHA10scFv。用洗涤缓冲液洗涤平板3次,并添加每孔100plDELFIA增强緩冲液(PerkinElmer,Boston,MA,Cat.#4001-0010)。在15分钟孵育之后,利用铕方法在Victor2(PerkinElmer,Boston,MA)上读取平板。利用SpotfireDecisionSite软件(Spotfire,Somerville,Ma.)对试-睑数据进行加工,并将其表达为每个克隆在挑战温度下与在参考温度下所观察到的DP:LFA数量的比率。将那些重复给出高于或等于亲本质粒所观察到数量的两倍的克隆视为命中(hit)。通过小量制备(WizardPlus,Promega,Madison,WI)分离这些阳性克隆的质粒DNA,并将其再转化回大肠杆菌W3110来证实第二轮热挑战试验。为分析热梯度,利用Prism4软件(GraphPadSoftware,SanDiego,Ca)分析数据,利用具有可变斜率的S形剂量响应作为模型。将热变性曲线的中点所获得的值称为Ts。值,且不能将其解释为等同于生物物理学上派生的Tm值。图8中描述了热挑战实验的结果。如图8中所示,与常规scFv相比,本发明的所有稳定化scFv分子均导致了结合活性的增强(T5G>49°C)。特别是,BHA10文库位置VL46scFv(S46L)、文库位置VH16scFv(S16E和S16Q)、和文库位置VL49:VL50scFv的T5o值显示出热稳定性相对于常规BHA10scl',v增加了+3。C至+12。C。另外,BHA10文库位置VL3scFv(Q3A,Q3G,Q3S,Q3V,和Q3D)、文库位置VH67scFv(V671和V67L)、文库位置VH48scFv(M481和M48G)、文库位置VH20scFv(V20I)和文库位置VH101scFv(P101D)的T50值显示出热稳定性相对于常规811\1050"增加了+4。(至+18。C。稳定化突变之一(V^K13E)是偶然的PCR错误。将这些稳定化突变中的一个并入pII':H009发现热稳定性进一步提高,甚至超过了BHA10Fab在这些条件下的稳定性。重要地,从四种设计方法(Vi/VH界面同源性模拟(interfacehomologymodeling)、共有序歹'J"^平分(consensusscoring)、i十算才几才莫3以(computationalmodeling),和共变分析)中的一种或多种方法得到的非共价Vt,46、VH101突变和VH55突变导致了scFv热稳定性的增加,几乎达到了二硫化物突变所观察到的稳定性,证实了这些设计工具的实用性和新颖性。特别是,p正H006构建体BHA10VH44:VL100scFv的Tso(59。C)与BHA10Fab的(62。C)仅相差3°C,而观察到pIEH009构建体BHA10scFvVH44:VLl00/(Gly4Ser)4连接体在这些条件下功能上等价于BHA10Fab。这些结果证实本发明的稳定化scFv在热挑战事件后具有增强的活性。C.亲和力测定使用等温滴定量热法(ITC)测定sLT13R对BHA10IgGl分子经酶切割所获得的BHA10Fab的亲和力。如先前所述的(Eldredge爭乂,/,》c/ze冊:y/^'(2006))制备sLT(3R。利用Amicon超离心过滤装置(MWCOIO,OOO)将Fab和sLT[3R分别浓缩至6.0和2.0mg/mL。在ITC测定之前将浓缩的储液同时用PBS进行透析。在设置为30。C的VP-ITC单元(MicroCalLLC,Northampton,MA)上进行ITC。向样品细胞中加入大约500pL的7jaMsLT(3R溶液并向参考细胞中加入PBS透析物。将全部234的70pMBHA10Fab以7x10|iL、12x7pL逐步滴加到样品细胞中,之后注射8x10(iL。反应化学计量1:1。利用厂商提供的OriginSoftware分析ITC曲线。实施例3中所述的和利用实施例1中所述的方法表达和纯化的常规BI1A10scFv、BHA10(Gly4Ser)4scFv和BHA10VH44:VL100/(Gly4Ser)4scFv制备物的KD测定是在Biacore3000仪器(BiacoreInc.,Piscataway,NJ)上利用表面质子共振(SPR)完成的。所有实验均在pH7.4的HBS-EP緩冲液中进行。将生物素化的PENTA-His抗体(20|ig/mL,Cat#34440,Qiagen)以10pl/min的流速进行大约1分钟固定于链霉亲和素包被的CM5芯片上。以5pl/min流速进行10分钟将测试scFvs的0.1|uM溶液注入到芯片上,并通过固定化的PENTA-His抗体将其捕获在表面上。为研究sLT(3R和捕获的scFv之间的结合,将系列浓度的sLT卩R(l,2,5,10,25,50,100,和200nM)以30pl/min的流速重复注入(doubleinject)到scFv包被的表面上。利用来自仅含有緩沖-液的;充动纟田月包的sensorgram凄t才居禾口来自PENTA-His表面的sensorgram凄t氺居从测试样品sensorgrams中扣除背景,所述PENTA-His表面是在注入scFv之后再用緩冲液取代sLT卩R进行注入的。利用BiaEval3.0厂商的软件分析曲线。通过将动力结合和解离曲线按1:1朗繆尔(Langmuir)结合模型调整来计算K[〕值。通过两次连续注入10pLpH3.0的0.1M甘氨酸来再生芯片表面。表5显示了Biacore亲和力试验的结果。重组产生的BHA10scFv的结合亲和力与按实施例1中所述的制备的BHA10Fab基本相同。另外,(G4S)4连接体的单独引入或在稳定的二硫化物(VH44:VLl00)存在下引入、或两者的结合并未导致对抗原亲和力的显著丧失。表5.Biacore亲和力试验——结合至LT(3R<table>tableseeoriginaldocumentpage179</column></row><table>*通过等温滴定量热法测定。D.差示扫描量热法研究利用BHAIOscFv、BHA10(Gly4Ser)4scFv、和BHAIOVn44:VLl00/(Gly4Ser)4scFv制备物进行差示扫描量热法(DSC)分析。如上文中对常规scFv与酶法产生的Fab的初始比较所述进行实验,不同的是在扫描速度4°C/min时进行实验。BHAIOVH44:VL100/(Gly4Ser)4scFv证实了相对于野生型scFv更优良的热稳定特性。特别是,两个结构域中较不稳定的一个,BHAIOV44:VL100/(Gy4Ser)4scFv的VH结构域比常规BHAIOscFv的相应结构域变性温度高大约5。C(图9)。"解链温度,,或丁M的增加可归因于两个单独的因素,(i)平衡折叠状态的热稳定性的增加,或(ii)聚集倾向的下降。常规BHAIOscFv和BHAIOVH44:VL100/(Gly4Ser)4scFv之间~5。C的温度差别相对独立于扫描速度(在0.2至4,0。C/min之间),这表明所观察到的TM改变是由于平衡折叠状态的稳定。E.ANS结合研究结合疏水焚光染料1-苯胺基-8-萘磺酸盐(l-anilino-8-naphthalinesulfonate,ANS)的能力常常是以蛋白质的天然状态或部分未折叠状态与相当大的疏水区域相互作用的标志,所述部分未折叠状态可发生于用温度进行增强处理时。染料的内焚光在溶剂中被淬灭,而当暴露于打的疏水表面区域时显著增加。常规BHAIOscFv本质上比BHA10(Gly4Ser)4scFv或BHAIOVH44:VL100/(Gly4Ser)4scFv以更强得多的水平结合ANS,表明了通过不适当大小的连接体强加于scFv的疏水暴露的存在。添加更长的连接体,特别是(Gly^er)4似乎中和该效应。在其它蛋白质或分子存在下,或甚至在独立形式的其本身的存在下,常规BHA10scFv的明显的疏水表面暴露可导致聚集水平的增加。有趣地,常规BHAIOscFv显示出在ANS结合上的梯度增加,由于增加的温度的功能,这表明在低于TM的温度例如用于细菌或哺乳细胞培养的温度(即37。C)下疏水暴露可能增加,(图10)。相反,BHA10(Gly4Ser)4和BHA10VH44:VL100/(Gly4Ser)4scFvs并未显示出该特性,这表明在减少的疏水表面区域暴露的基础上,本发明所述的稳定突变降低了自身结合或于其它细胞培养蛋白质成分的结合。实施例5.促使增强内在蛋白质稳定性的稳定突变的鉴定(i)稳定化突变的鉴定使用了多种基于序列的方法(例如,共有序列评分、共变分析、VH/VL界面同源性模拟)来鉴定稳定突变,这些突变增强了蛋白质对目的结合分子的稳定性。将这些稳定突变用于抗体可变区表达文库的设计和构建。A.共变分析基于在单一序列中的两个或多个残基所显示出的强共变,开发了多种设计用于稳定BHA10scFvVH和VL结构域。共变分析是在BHA10scFvVn和Vi结构域上利用类似于下文实施例17中所述的那些方法来完成的,该分析是为了鉴定缺失的或错误的共变,从而可以预测稳定突变并将其包括进抗体可变区表达文库用于实验筛选。在第一个实施例中,BHA10Vl内46位上的Ser至Leu的突变(S46L,Kabat编号系统)显示出与36位残基上所存在的Tyr的阳性关联,共变分析工具显示出所述的36位残基与Leu46的强烈的共变(见图78)。通过残基频率分析也预测出该突变是稳定的。除了S46L,通过共变预测为稳定的第二个突变是BHAIOVH结构域内的V55G突变。尽管残基频率表明在此位置上很少观察到Val,但此位置包埋于CDR2内部并且是可变的。因此,没有任何另外的信息,先前没有预期过此位置的任何变化。然而,基于共变分析的调查,共变数据表明此位置与至少IO个已经存在于BHAIOVH结构域的其它氨基酸是高度相关的。55位上向Gly的突变满足了所有IO个共变。共变分析工具的效用的另一个实施例是预测的BHA10VHQ6E突变的副作用。单残基频率分析表明在此位置上突变为更常见的Glu将导致稳定性的提高。然而,共变分析工具表明单突变至Glu干扰了几个存在于BHA10Vu序列内部的已有共变。为获得稳定性的提高,必需替换几个能够在此位置上优先稳定Glu的氨基酸。另外,共变分析工具的预测值的另一实施例显示于图79中。作为单残基文库设计的一部分,将Met80突变为Leu。认为此单突变将是高度稳定的,因为Leu是序列数据库内此位置所观察到的最常见的氨基酸。然而,共变分析表明为了获得共变和谐性必须将两个其它氨基酸突变(V67F和T70S)。B.共有序列评分使用共有序列评分作为鉴定scFvVh和Vl区域内的氨基酸残基的方法,所述氨基酸用于诱变从而增加scFv的内在稳定性。评分评价了由于hypersomatic突变和进化种系变化而发生的从共有VH和VK序列的相对漂移。然后将得自该分析的信息用于设计文库来筛选具有增强的稳定性的scl7v变体。如前所述(Demarest等人,乂Mo/.S/o/.335,41-48(2004);Demarest等人,Z)ay./"Pmw,广2006))使用哺乳动物Vh和Vlkappa序歹'j的参考组来推导用于评分的共有序列,并对每个残基位置上的单个氨基酸频率进行收集、分类和淘汰。自然地构建哺乳动物参考组从而包括来自多种哺乳动物的V基因,以便获得种间经过进化漂移而得的多样性。VH哺乳动物参考组含有主要来自NCBI和TIGR的61条Vh序歹'],其代表了总共17种不同的哺乳动物种类。VK哺乳动物参考组含有来自13种不同哺乳动物种类的53条Vk序列。利用习惯设计的IgG数据库和修饰的PERL本(Demarest爭入2004;Demarest爭乂,2006)来完成BHA10VH和VL的统计学分析。从习惯数据库中计算BHA10Vh和Vl内的每一个残基的氨基酸频率。BHA10Vh和Vl内每个氨基酸的残基频率,&勿,对于单个序列内的每个位置,/,是通过数据组中所观察到的特定残基类型(r-A、C、D…V、W、Y)的次数除以序列总数来计算的。图11显示了BHA10Vh和VL残基频率除以数据库共有残基的残基频率。通过除以共有残基频率,获得了用于在常规Vh和Vl序列内不常观察到BHA10氨基酸的残基位置上产生文库的严格截断值。文库位置是通过那些其残基频率除以最频繁的残基频率(Si(r)/MFRj(r))小于0.3的来确定。列于残基频率计算结果右侧的残基是那些如所公开的通常发现于人序列中的残基(Chothia等人,组脂.278,457-479,(1998)),并可在文库形式中对其进行特异靶向来筛选最稳定的氨基酸。由于与LTPR相互作用的潜在破坏,并不考虑对BHA10Vh和VL的CDRs进行稳定性优化,但可考虑进行第二轮设计。C.VH/VL界面同源性模拟如下文实施例15所述的,对17种人类抗体进行了差示扫描量热法分析。最佳候选者,BIIBl-4均具有极好的(即,非常高和所期望的)稳定特性。这些高度稳定的抗体可用作改善具有低内在稳定性的scFv或抗体结构域的稳定性的平台。特别是,将重点放在Vh和Vi之间的界面上,以便提供潜在的更高水平的稳定特性。将BHAIOFab转化为scFv形式导致了DSC热解曲线的改变,预示着如通过单一的、较高温度解折叠跃迁(Fab)所观察到的完全协作性解折叠事件,向如通过双个体的、较低温度解折叠跃迁(scFv)所观察到的大量非协作性解折叠事件改变。换句话说,在Fab的形式下,域间接触是足够强的从而将所有结构域锁定为单一的、较高温度的解折叠跃迁。一旦除去Ch1和C,一结构域,scFv的Vh和V^结构域则不再具有驱动解折叠跃迁进入合作性事件的能力。假定通过稳定界面不仅可同时稳定Vh和Vl結枸域,还可促进Vh/Vl界面的附着并防止聚集。通过两步法利用前4种最稳定的BIIB抗体(BIIB-4)来向BHA10scFvFab中设计稳定突变。首先,使用人源化BHAIOFab的晶体结构计进行结构分析。特别地,使用晶体结构来鉴定位于Vh和Vj'司界面的所有残基以及每个残基所占界面的表面积的量(利用MOLMOL软件)。将那些在界面上比其它残基覆盖显著多的表面积的残基认为是对界面更加关键的。作为一种任意的限制优化,将那些覆盖30至40人2的视为是重要的。覆盖>40A2的视为是关键的。这两种类别给出了同源性模拟和突变方面的最高优先级。每个残基在街面上覆盖的表面积的量列于表6中。其次,将Vh和VJ'司界面上的氨基酸类型与存在于BIIBl-4(即,非常稳定的抗体)中相同位置的氨基酸进行比较。改方法促使了大量用于稳定BHA10scFv的重要突变的鉴定。如实施例8中所述的,两种突变——VL中的S46L和Vh中的P101D通过实验得以证实。事实上,这两种突变是在热挑战试验中所测试的单个最稳定突变(例如,见图50A)。两种突变同时稳定Vh和Vt结构域,表明它们有助于在结构域之间构建合作。表6,BHA10VHVL表面积分析<table>tableseeoriginaldocumentpage183</column></row><table><table>tableseeoriginaldocumentpage184</column></row><table>(用'*,标记的残基位置表明用于稳定性设计的好机会——通过突变至BIIB1、2、3或4中所发现的残基)。D.计算机分析使用计算机方法分析BHA10来对氨基酸替换可促进稳定性的位置提出建议。这些方法包括两个步骤基于序列的分析(步骤1);和基于结构的分析(步骤2)。在第一步中,使用了抗体的可变域的序列数据库。选择在其各自位置以低频率存在的氨基酸(低于10%的数据库序列)或那些未与相应的共有氨基酸匹配的氨基酸,将之替换为高频率或共有氨基酸(候选突变)。在第二步中,使用了抗体的Fab片段的三维结构或模型。在其结构背景中评估候选突变,并将其区分优先次序用于以结构特性、与互补决定区(CDRs)构象的相容性、在Vh/Vl界面包装中的作用、以及重链和轻链折叠为基础的实验检测。BHA10在轻链的46位上具有丝氨酸这方面是不常见的。在数据库中,大约1%的VL(kappa亚型)序列拥有S46,而大约79%的VL(kappa亚型)具有L46。而且,人类共有的KV1具有L46。一旦将S46L替换鉴定为候选突变,便在BHA10Fab的三维模型的环境下对其进行评估。发现46位位于V^/Vh界面上,与Vh的Y101和W103以及Vl的Y36和Y55相接触。基于结构的分析揭示出S46L替换与Vl/Vh界面、CDR构象和V^折叠的完整性是相容的。丝氨酸是重链的16位上的非常见氨基酸。在数据库中,大約5。/。的Vh序列拥有S16、25%具有八16、2T/。具有G16、11。/。具有EI6、以及大约10'X)是Q16。而且人类共有的HV1具有A16。一旦将S16A、G、E和Q替换鉴定为候选突变,便在BHA10Fab的三维模型的环境下对其进行评估。发现16位位于邻近VH/C1界面的环中,与Vh的K13和S16相接触。基于结构的分析揭示出S16A、G、E和Q替换与Vl/Vh界面、CDR构象和Vt折叠的完整性是相容的。另外推断出E16和Q16的长的亲水侧链将是优选的。因此,VL46位和VH16位在文库设计中得以体现。与计算分析互补的方法使用了基于结构的蛋白质工程技术,例如Rosetta(KuhlmanB等人,PNAS200198(19):10687-9l)和DEEK(HanfK丄,Ph.D.Thesis,MIT,2002)。给定一个蛋白质界面的三维结构,这些方法可获得氨基酸序列中的突变,所述突变导致增强的Vh与Vl結合的AAG(結合与非结合状态的差)和/或增强的VH与Vl折叠的△AG(折叠与参考的非折叠状态的差)。E.组合的界面和共变设计方法使用共变分析来确定对于提供和支持VH和VL之间界面以及维持VH/V,J'司强亲和力从而导致增强的scFv稳定性来说重要的残基网络。直接与BHA10scFv的VH和VL之间界面有关的残基是如实施例5C中所述来鉴定的,并将其列于前面的表6中。那些列于表6中的与最高度隐蔽的残基强烈共变的残基是利用前面第m(a)部分中所述的共变方法学来计算的。用于共变分析的HMM除去了研究隐蔽于界面中的VH和VL结构域的CDR2和CDR3中残基的能力。尽管如此,仍然相信没有强共变产生于这些残基位置,因为它们是高度可变的,之所以是高度可变的则是由于为抗体能以高亲和力识別抗原而存在的强选择压力。因此,用于确定是否存在共变网络以支持VH和VL间界面的残基是VH(kabat#)VL(kabat#)V37/I37Y36Q39Q38G44A43L45P44W47L46W50Y49Y91Y95W103F98其在V类序》:寸比对中的出i々|、叫7^公叮PJ入wv〃广S7^公疋利用phi值截断X).25来确定的。如果不与正上方所列的界面残基中的至少2个相关,则无任何残基被认为是对维持VH和VL间的强界面而言重要的。表7和8分别列出了VH和VL结构域内的那些残基,其显示出与界面残基的2个或更多的关联。连接数目越大,则认为这些氨基酸位置中的每个对于稳定V11和VL间的界面具有更大的影响。表7-在BHA10X射线晶体结构的界面上观察到的与结构残基具有多重强关联的VH的残基<table>tableseeoriginaldocumentpage187</column></row><table><table>tableseeoriginaldocumentpage188</column></row><table>粗体的残基覆盖界面上的表面积。斜体的残基是那些在一级序列中与覆盖界面表面的残基直接相邻的残基。*区别亚类特征**与许多与原始残基相同的残基共变,但由于较弱的残基频率而具有较低的相关性水平。表8.在BHAIOX射线晶体结构的界面上观察到的与结构残基具有多重强关联的VL的残基。<table>tableseeoriginaldocumentpage188</column></row><table><table>tableseeoriginaldocumentpage189</column></row><table>粗体的残基覆盖界面上的表面积。斜体的残基是那些在一级序列中与覆盖界面表面的残基直接相邻的残基。*Q50、A89、Y135在重链和轻链中均是保守的,且共变似乎与轻链位置并无关联。已经分别将来自表7和8的残基绘制于BHA10VH和VL的表面,并将这些残基与那些同两结构域之间的界面直接接触的实际残基进行比较(见图87和88)。两点得到了该分析的支持。首先,共变并不提供有关涉及界面上CDR2和CDR3残基的网络信息(在此阶段)。其次,共变表明不仅是那些在界面内部直接接触的残基对于界面的维持是重要的,而且在直接界面残基外的许多其它残基对于支撑和支持界面残基的位置也是重要的。这一点是通过下述残基而得以证实的,那些残基被证实存在于共变网络的表面上,但在仅仅利用结构来计算直接覆盖界面表面的那些残基而获得的表面上是缺失的。发现BHA10或p5E8(下面实施例21中所述)scFvs:VH或VL序列内部存在与这些界面共变网络中的少数相违背的情况。这些位置的天然/非理想化氨基酸向表7和8中所述的理想地支持性界面氨基酸残基的突变显示出对于BHA10或p5E8scFvs是高度稳定性的(a)BHA10BLS46L,和(b)Idecl52VHS49G(Kabat和X射线弁)E72D(73,对于X射线)。这些残基之一(S46LvO是直接位于界面上的,其中之一(S49GvH)是直接与界面相邻的,而其中之一则是位于界面远侧的(E72DvH)。然而,所有这三者均是基于共变分析而预测为对于界面而言是稳定的。由于Vh和Vt两者热稳定性的增加,利用DSC检测可观察到界面的稳定性。U)构建和筛选具有增强的热稳定性的BHA10scFv文库A)构建scFv文库利用实施例4、5和6中所述的方法i殳计出的在常规BHA10scFv(pXWU002)中含有目的氨基酸替换的文库是按照厂商(Stratagene,LaJolla,Ca.)^是供的说明书利用QuikChangeII定点诱变试剂盒、利用表9中所列的寡核苷酸来产生的。常规scFv的DNA序列描述于图1中。挑选单个转化的克隆置于深孔的96孔皿中(Corning,Coming,NY,Cat.#3960),其中含有每孔400|ilLB加上50mg/ml羧千青霉素,于37。C培养过夜。主亚是通过下述步骤来产生的,向深孔96孔皿的每孔添加等体积含20%甘油的LB并转移5(^1等分试样的细菌悬液至无菌微量滴定板(Corning,Coming,NY,Cat.#3359)中、并于-80°C冷冻贮存。表9.用于BHA10scFv稳定性工程的寡核苷酸<table>tableseeoriginaldocumentpage190</column></row><table><formula>formulaseeoriginaldocumentpage191</formula>卞定向诱变的位置通过下划线进行标示。不确定的碱基如下进行简写W-A或T、V二A或CorG、Y^C或T、S二C或G、M二A或C、N=A或C或G或T、R-A或G、K-G或T、B-C或G或T(J伤o/C/zem.26](1):13-7(1986))。B.热挑战试验然后在热挑战试验中比较了常规和工程BHA10scFv的活性,该试验可用于测定在热挑战事件之后50%的scFv分子保持其抗原结合活性的温度。对应于此温度的数值称为"Tso"值,单位为。C。在此试验中,将scFv置于包含常规BHA10scFv的热跃迁温度在内的系列温度下。用编码常规和工程BHAIOscFvs的质粒在诱导型araC启动子的控制下转化大肠杆菌菌株(ATCC,Manassas,Va.Cat.#27325)。在由SB(Teknova,HalfMoonBay,Ca.Cat.#S0140)组成的、补充了1%甘氨酸、1%TritonX100、0,02。/。阿拉伯糖和50吗/ml羧千青霉素的表达培养基中,在37°C或32°C下培养转化体。通过离心沉淀细菌并收获上清液用于后续处理。培养基中包含甘氨酸和TritonX-100导致增强了胞质内含物(天然大肠杆菌蛋白质和scFv)向培养基的释放。上清液中大肠杆菌蛋白质的存在对该试验的完成是必需的,因为热变性蛋白质作为"sink,,,瞬时地将非折叠的scFv分子捕集为不可逆的非活性聚集体。利用热挑战试验一式两份地筛选每个文库,将来自一个副本的上清液置于处理条件,而第二份上清液用作未处理参考。可在单个或系列温度下进行热变性试验来测量稳定性。将能够产生稳定的热梯度的温度循环器用于处理样品上清液(iCycler,Bio-Rad,Gaithersburg,Md)。挑战温度依亲本BHAIOscFv变体的特性而不同,通常比实验所测定的Tso值高出2至3摄氏度。将冷冻的主皿解冻并用于接种每孔含有250^1表达培养基的深孔微量滴定板,并将培养物在32。C下培养过夜。作为对照,将含有亲本质粒的培养物培养在相同条件下并随文库同时进行处理。通过1912000转/分钟离心将细菌沉淀于深孑L板中(正Cmodel8R,ThermoElectron,Waltham,Ma)并将100^1上清液转移至标准微量滴定板(Corning,Corning,NY,CatJ3357)中。储备一等分试样的上清液用作参考DELFIA。对于大多数文库,将含有上清液残余部分的板密封(NalgeNunc,Rochester,NY,Cat.#235205)并置于设置到合适挑战温度的培养箱中(EchoTherm,TorreyPinesScientific,SanMarcos,Ca)共计卯分钟。对于需要多重挑战温度的筛选而言(或对于高于75°C的温度),将上清液转移至96孔PCR板(AppliedBiosystems:FosterCity,Ca,Cat.#N801-560)中,并在目的温度下孵育90分钟。在热挑战之后,通过离心除去聚集的材料,并将处理的清澈的上清液中所保留的可溶性BHA10scFv样品用于通过DELFIA试验来测定其对相关的LT(3RIg抗原的结合。用由LT卩受体(LT卩R)的外功能区与人的Fc区域相融合组成的融合蛋白以存在于0.1M、pH9.5的碳酸钠缓沖液中的lpg/ml来包被96孔板(MaxiSorp,NalgeNunc,Rochester,NY,Cat.#437111)。4°C下将平板包被过夜,并用DELFIA试验缓沖液(DAB,10mMTrisHCl,150mMNaCl,20|iiMFX)TA,0.5%BSA,0.02%Tween20,0.01%NaN3,pH7.4)在室温振荡封闭1小时。用不含BSA的DAB(洗涤緩沖液)洗涤平板3次,添加稀释于DAB中的测试样品至平板中,达到终体积lOOpl。将平板在室温振荡孵育1小时,用洗涤緩冲液洗涤3次以除去未结合的和功能失活的scFv分子。通过添加每孔100pl含有40ng/ml的Eu标记的抗His6抗体(PerkinElmer,Boston,MA,Cat.存AD0109)来检测结合的BHA10scFv,并在室温振荡孵育1小时。用洗涤緩冲液洗涤平板3次,并添加每孔lOOplDELFIA增强緩沖液(PerkinElmer,Boston,MA,Cat.#4001-0010)。在15分钟孵育之后,利用铕方法在Victor2(PerkinElmer,Boston,MA)上读耳又平一反。利用SpotfireDecisionSite软件(Spotfire,Somerville,Ma.)对试验数据进行加工,并将其表达为每个克隆在挑战温度下与在参考温度下所观察到的DHLFIA数量的比率。将那些重复给出高于或等于亲本质粒所观察到数量的两倍的克隆^L为命中。通过小量制备(WizardPlus,Promega,Madison,WI)分离这些阳性克隆的质粒DNA,并将其再转化回大肠杆菌W3110来证实第二4仑热44战试一验。为分析热梯度,利用Prism4软件(GraphPadSoftware,SanDiego,Ca)分析数据,利用具有可变斜率的S形剂量响应作为模型。将耐热曲线的中点所获得的值称为Tso值,且不能将其解释为等同于生物物理学上派生的Tm值。这些试验的首次和证实性结果显示于表10中。与常规scFv相比,本发明的几个稳定化scFv分子导致了结合活性的增强(丁5。〉49°C)。特别是,BHA10文库位置VL46scFv(S46L)、文库位置VH16scFv(S16E和S16Q)、和文库位置VL49:VL50scFv显示出热稳定性相对于常规BHA10scFv增加了+3。C至屮12°C。另外,BHA10文庠位置Vl3scFv(Q3A,Q3G,Q3S,Q3V,和Q3D)、文库位置V67scFv(V671和V67L)、文库位置VH48scFv(M481和M48G)、文库位置VH20scFv(V20I)和文库位置VH101scFv(P101D)显示出热稳定性相对于常规BHAIOscFv增加了十4。C至十18°C。稳定突变之一(VLK13E)是从PCR错误中偶然发现获得的。将这些稳定突变并入pIEH009发现了热稳定性的进一步提高,甚至超过了BHA10Fab在这些条件下的稳定性(图12)。重要地,衍生自四种设计方法(VL/VH界面同源性模拟、共有序列、计算模拟、和共变分析)中的一种或更多种的非共价VJ6、V101突变和V55突变导致了scFv热稳定性的增加,几乎达到了二硫化物突变所观察到的稳定性,证实了这些设计工具的实用性和新颖性。图1B显示了常规BHA10scFv(SEQIDNO:4)的氨基酸序列,而图94A和B显示了分别含有S46L(VL)稳定突变(SEQIDNO:137)和V55G(VH)稳定突变(SEQII)NO:138)的稳定BHA10scFv的氨基酸序列。野生型BHA10scl(SEQII)NO:3)的DNA序列描述于图]A中。稳定突变由框起来的残基来表示。前导序列、gly/ser连接肽和CH1结构域分别由下划线、粗体和斜体的残基来表示。表10.BHA10VH和VL文库位置、文库组分和筛选结果<table>tableseeoriginaldocumentpage193</column></row><table><table>tableseeoriginaldocumentpage194</column></row><table>na=不适用表1显示了对引入常规scFv的多种单独的和组合的稳定突变的综合热稳定分析的结果。这些结果表明活性的增加是附加的,且表明本发明所述的方法能够增强scFv的热稳定特性,甚至高于天然Fabs的热稳定特性。甚至在VH44-VJ00位上缺乏共价二硫键的情况下,鉴定出稳定突变在组合时显示出热稳定性相对于常规BHA10scFv增加19。C至33°C。表11.用于生产变体蛋白质的BHA10构建体的特征和获得自热挑战试验的T50。<table>tableseeoriginaldocumentpage194</column></row><table><table>tableseeoriginaldocumentpage195</column></row><table>no=不适用aa=氛基酉炱总结三种稳定突变(V:而得以实验证实。基于前面实施例S46L、VH—V55G和VH—P101D)通过热挑战(T5。)试验中所述的共变分析,预测VL—S46L和VH—V55G突变对单独的VH和VL结构域都是稳定性的。如图50A和B中所述,这两种突变都导致BHA10scFv的T5Q显著增加。特别是,VL—S46L突变通过7-8。C来稳定scFv,而VH—V55G突变通过12。C来稳定scFv。如通过DSC所测定的,这两种突变也都显著缩短了Vh和Vc之间的TM间隙(见图51)。DSC显示两种突变导致VH和VL结构域两者的TM的(热解折叠跃迁的中点)以及scFv的量热焓(即曲线下方的面积)的显著增加。这些值的增加为这些预测的稳定突变事实上稳定scFv提供了实验证实。而且,因为两种突变同时稳定了VH和VJ吉构域,它们在建立Vh和Vt结构域之间的协同性上可能是重要的。因此,可以预期加强Vh和VL之间的界面不仅可以帮助增加稳定性,也同样可减少形成聚集物的趋势。基于前面实施例4中所述的VH/VL界面同源性模拟,还预测了Vlr—S46L稳定突变和第三种稳定突变(VH—P101D)也是稳定性的。如通过热挑战试验所测定的,VH一P101D稳定性突变通过15。C稳定了scFv(图50C)。此外,DSC(见图52)显示出此稳定突变导致了VH和VL结构域两者的TM和量热焓的显著增加,表明此突变也可能经VH/VL界面作为一个整体来协同稳定scFv。实施例6.包含稳定突变的稳定的BHA10scFv的生物物理学特征将来自表11中所列的多种质粒的V区基因序列亚克隆进改良的大肠杆菌表达载体以驱动在诱导型araC启动子控制下的重组蛋白质表达。表达变体BHAIOscFv并利用前述方法进行纯化。如通过SDS-聚丙烯酰胺凝"交电泳分析所推断的,位于Vl_结构域N末端的明显切割位点导致了大多数scFv制备物中Vl的低水平(團53)。通过具有静态光散射和折射指数检测器(MiniDAWN/ReX,WyattTechnology)的大小排阻HPLC(AgilentTechnologies)来研究每个scFv的流体动力学性质。发现每种scFv主要是单体的,然而,少数scFvs,包括野生型(不稳定的)scFv,显示出低水平的二聚体物质(表12)。没有任何纯化的scFvs具有可检测水平的大于二聚体的寡聚体。表12.scFvs的SEC/光散射结果<table>tableseeoriginaldocumentpage196</column></row><table><table>tableseeoriginaldocumentpage197</column></row><table>无标准误差一次表达的蛋白质'n.d.未测定这些值是在完成了为减少聚集物的制备型SEC之后测定的。该实验的最终目标是研究所设计的突变是否增强稳定性并导致聚集物的较低倾向。每种scFv的热稳定性是利用两种单独的方法评估的。首先,利用DSC(图54A)分析scFvs的热解折叠。其次,通过在荧光疏水染料1-苯胺基—8-磺酸盐存在下加热蛋白质来研究每种scFv的热稳定性(ANS,图54B)。ANS通常结合至部分解折叠的蛋白质或处于紧密的解折叠状态中的热变性蛋白质上。一旦与暴露的疏水表面区域相结合,由于溶剂淬灭作用的隔绝ANS的荧光可能显著增强。将温度依赖型ANS曲线调整至如下所述的双态蛋白质解折叠跃迁。緩冲液是PBS且每个实验中所用的scFv浓度均为750nM。荧光测定是在装有peltier加热装置和外部水浴的JASCOmodel812圓二色光i普仪上完成的。利用含有垂直于光路的光电倍增管的附件收集焚光。该附件装备有设定至480nm的可调节的单色仪。灵敏度设定为600V。以每分钟120。C的连续速率完成加热。激发单色仪设定为370nm。此研究中的每种scFv的热解折叠均导致了ANS荧光的增加。每种scFv蛋白质结构域的热解折叠的中点(即Tm)是利用DSC通过使用厂商(MicroCal,Inc)提供的Origin7.0软件将每种解折叠峰调整至吉黑二氏方程式来测定的。TMs也是利用ANS荧光通过将吉黑二氏方程式合并至KaleighdaGraph中的非线性曲线拟合程序来推导的.△g^。("=a//"—ta^。(r)(l)其中AGV。(r)是在解折叠状态下吉布思自由能的温度依赖性变化,八//,,°(7')是与解折叠相关的热含量变化,而A&,。(r)是与解折叠相关的熵。方程式可展开至AGV(7')=A〃',o0-{-)-AC/一r+7'ln7'『,似其中TM是解折叠曲线的中点,而ACf。是折叠和解折叠状态之间热容量的改变。此方程式可用于推导ANS荧光强度的温度依赖性,通过假设荧光强度是折叠和解折叠scFv存在下内在ANS荧光的总和,其中,',(')是温度依赖性总荧光信号,,v和分别是折叠和解折叠状态的荧光强度,而厶和/;,分别是在给定温度下折叠和解折叠scFv的分数。折叠的分数与平衡解折叠常数和解折叠的自由能相关A(7')=广ag厂。(r)、exp(——^r^)../,,灯通过将&,(r)和A&。(r)因子代入方程式(3)并假设折叠和解折叠scFv的存在下ANS的荧光强度是对温度线性依赖的(即/,.=/,+/271和~=/3+/4r),获得了下列方程式/—/,+/2(,)+(/3+"r)exp「ag(,。(r)]l+exp为获得用于适合数据的最终方程式,将方程式(2)中的ag(,。(r)关系式代入方程式(5)中,假设AC/是不依赖于温度的,且与折叠和解折叠状态之间的溶剂暴露表面积的差别呈比例(Haynie&Friere,16:115-140,(1993);Myers爭乂,5W.4:2138-2148(1995))。对所有scFvs的衍生自DSC和ANS结合实验的热稳定性测定都是类似的。每种scFv的解折叠都是不可逆的,因此聚集对于通过DSC或ANS结合所测定的绝对TM是有影响的。由于两种技术不同地且以不同的速率加热样品,经过实验形式后TMs并不能预期一致(SSnchez-Ruiz爭乂,所oc/em/W乂27:1648-1652(1988))。然而,每一种实验技术所观察到的趋势是一致的(见表13)。DSC实验容易地区分了Vh和Vi解折叠跃迁。ANS结合实验不能精确地区分两种跃迁(即VHvsV^解折叠);因此,ANS结合实验进提供了表观TM。通过ANS结合所观察到的表观TM显示出与通过DSC所测定的解折叠的最后一个结构域的TM显著相关,eitherVHorVLdependingonthemutation,。由于两种试验形式中非折叠物质的聚集,将丁MS用作对每种突变所提供的稳定性增强进行排序的指导,不存在对解折叠的scFv自由能等的附加解释。表13.每种scFv的热稳定性测量<table>tableseeoriginaldocumentpage199</column></row><table><table>tableseeoriginaldocumentpage200</column></row><table>所有从文库筛选中所挑选的设计的单个突变VHS16E、S16Q、V55G、P10]D和VlS46L均显著稳定了VH结构域以及再一些情况下稳定了V〖,结构域(图53)。测试这些用于增强稳定性的位置之后的理论常常来自多重形式的分析。共有序列方法预测了突变VHS16E、S16Q、V55G、P101D和VLS46L中的所有均稳定BHA10scFv(实施例3)。然而,VHV55G和P101D(顺便说一句,两种最稳定的突变)是分别定位于Vh的CDR2和CDR3内部的,直到搜集到有关这两个位置的突变可导致稳定事件的进一步预测证据之前,并未考虑对其进行诱变。基于共变分析还将VHV55G和S46L预测为稳定性的。最终,基于高度稳定的人类抗体的界面组合,预测VHP101D和V,.S化L对于VH/VL是潜在稳定性的(实施例3)。位于VH/VL界面上的单个突变增强了两结构域的稳定性,而处于界面外的Vn突变则仅稳定了Vw结构域本身。VHS16E、S16Q和V55G是在界面外的,其分别提高了BHA10Vh的表現Tm3、2和irC。Vt稳定性则相对未受到这些突变的影响。VV55G突变似乎增强了Vh的穗定性从而与V^结构域的稳定性相匹配,并未导致Vt稳定性的可检测的增加。界面上的两种突变,VP101D和VLS46L显著增加了两结构域的稳定性。特别是P101D突变导致了Vh和VL结构域的完全协作的解折叠,表明Vh和Vl之200间的协作和折叠得到显著加强。因此,VH/VL界面上的突变可提供形成稳定Fv区域的最有效方式,并提供一种关于将涉及SCFVVH/VL界面的稳定性设计优先于那些直接针对Fv界面外残基上的设计的理论。组合的Vw突变最终导致VH/VL解折叠的协作间的分离(表13)。随着VhTm升至75。C(vh突变组合的结果),Vl的tm开始朝着更低的温度移动。这表明在VL结构域内部未建立补偿性突变的情况下VH结构域的超稳定性可导致折叠协作性降低和两结构域之间相互作用的减弱。尽管Vh和W结构域的TmS(包括野生型BHA10scFv的Tm)常常是十分不同的,两结构域之间的界面上的突变可同时稳定两结构域的证据表明两结构域在一定水平上是相互作用的,尽管并不预期两分离的结构域之间的表观亲和力非常高,除了可能在VP101D稳定变体中(Brandts&Lin,i/oc/7ew/w7,29:6927-6940,(1990》。增加scFv的稳定性导致室温疏水荧光染料ANS内在结合的降低(15。C,图55)。野生型scFv^:弱地结合至ANS表明该蛋白质可永久地或短暂地向溶剂暴露疏水表面。稳定化scFvs显示出在室温完全失去结合ANS的能力一在最稳定化scFvs存在下ANS的荧光并不比ANS单独处于溶剂中时的荧光更强。15。C在折叠蛋白存在下,VH—TM(通过DSC或温度依赖性ANS结合实验测定)与ANS荧光相比的曲线证实scFv依赖性ANS荧光随scFv稳定性增加而降低(图55)。由scFv稳定性引起的ANS结合的减少可表明更少的疏水表面积暴露于溶剂,且表明稳定化scFvs可具有更低的聚集的内在倾向性。多种单个或组合的稳定性BHAIOscFv突变的KD检测是在Biacore3000仪器上利用表面质子共振来完成的。表13表明Biacore亲和试验的结果。变体BHA10scFvs的结合亲和力是亲本BHA10scFv的1-2.5倍。实施例7.稳定的双特异性"Hercules"抗体的生产将常规BHA10scFv和本发明的稳定的BHA10scFv用于构建一系列称为"Hercules,,的双特异性抗体。Hercules双特异性抗体包含结合至TRAILR2受体的嵌合型14A2IgG抗体与结合至LT(3R的BHA10scFv的融合。Hercules抗体是按照N末端和C末端BHA10scFv融合来构建的(见图13)。N末端scFv融合可构建为轻链和/或重链融合(分别是"NL-Hercules"或"N『Hercules")。关于选择哪个氨基末端V区(重链或轻链)用于连接scFv的决定主要是受哪条链可以承受融合scFv来驱动的,所述融合scFv能够识别第一目标抗原,同时不明显干扰Fab结构域与第二目标抗原的结合。还可利用本发明所述的方法构建四价或双特异性抗体,其单独由直接融合至抗体铰链区或融合至CH2或CH3结构域的稳定化scFvs组成,如例如图42-49中所述的。所述抗体可包含全长Fc区(见例如图46)或CH2结构域缺失的Fc区(见例如图42)。在另一典型的实施方案中,可将两个或更多稳定化scFv结构域融合至重链或轻链的相同末端(见,例如,图43)。A.构建具有BHA10常规、(G4SVVH44:VL100和VH44:VL100/(Gly4Ser)4scFvs的"N『Hercules"四种抗-LT(3R(BHA10)x抗-TRAILR2(chil4A2)双特异性抗体设计是以将常规和变体BHAIOscFvs添加至抗-TRAILR2抗体重链的氨基末端为基础的。使用实施例3中所述的BHA10scFvsDNAs利用表14中所述的寡核芬酸通过PCR扩增来构建一系列NH-Hercules双特异性抗体。利用(Gly4Ser)5连接体将BHAIOscFvs连接至chil4A2重链的成熟氨基末端。正向5'VHPCR引物(scFvBHA10-Fl)包括用于克隆的I限制性内切酶位点(划线序列),其后是编码重链信号肽的最后三个氨基酸和BHAIOVH的氨基末端的序列。利用两个反向的3'PCR引物来产生PCR产物,内部反向引物XWU005-R编码BHAIOVL羧基端,其后是(Gly4Ser)5连接体,而反向引物scl'VBHA10-Rl编码部分抗-TRAILR2VH区域和用于克隆的Sg/II位点(划线序列)。表14.用于PCR扩增具有常规(Gly4Ser)4,VH44:VL100和V44:VL100/(Gly4Ser)4BHAIOscFvs的N-Hercules的寡核香酸。scFvBHA10-Fl(SEQIDNO:134)5'-AGAGAGACGCGTGTCCTGTCCCAGGTCCAACTGGTGCAG-3'XWU005-R(SEQIDNO:135)5'-AGCCACCTCCCCCCGATCCACCGCCCCCTGAACCGCCCCCTCCAGAGCCCCCTCCACCGGACCCTCCACCGCCTTTGATCTCCACCTTG-3'scFvBHAlO-Rl(SEQIDNO:136)5'-AGAGAGAGATCTTGACTGTCTCTCCAGGCTTCTTCAGCCCCCCCGATCCAC-3'BHAIOscFv+(Gly4Ser)5连接体+部分抗-TRAILR2VH基因序列是在两个连续的PCR反应中扩增的,通过如图14A中所列的编码(Gly4Ser)5连接体的通用重叠序列来从质粒DNApXWU034中制备常规scFv、从质粒pXWU002中制备BHAIOscFv(Gly4Ser)4、从质粒p正H006中制备BHAIOscFvVH44:VL100、以及从质粒pIEH009中制备BHAIOscFvVn44:Vt,100/(Gly4Ser)4。将这些来自一系列扩增的BHAIOscFvs的PCR产物通过琼脂糖凝胶电泳利用MilliporeUltrafree-DA提取试剂盒根据厂商说明书(Millipore;Bedford,MA)进行纯化。用M/wI/Sg/II限制性内切酶消化纯化的PCR产物并将其连接至M/wII消化过的含有chil4A2IgGl的pN5KGl载体上,所述chil4A2IgGl先前经修饰除去了存在于chil4A2IgGl编码序列中的固有的6g/II位点。哺乳动物表达载体pN5KGl含有用于筛选转录活性的整合事件的翻译受损的、修饰的(含有内含子的)新霉素磷酸转移酶基因,以及用于允许利用氨曱喋呤的扩增的鼠二氢叶酸还原酶基因(BamcU等人,AntibodyExpressionandEngineering.(Imanaka,H.Y.W.a.T.,cd),pp.27-40,OxfordUniversityPress,NewYork,NY,(1995))。所获得的系列构建体通过25个氨基酸的(Gly4Ser)5连接体形成变体BIIAIOscFvs与抗-TRAILR2抗体VH结构域氨基末端的融合蛋白。常规BHAIOscFv基因序列与抗-TRAILR2抗体重链基因序列氨基末端的融合产生了质粒pXWU005。BHA10scFv(Gly4Ser)4基因序列与抗-TRAILR2抗体重链基因序列氨基末端的融合产生了质粒pXWU026。BHAIOscFvV44:00基因序列与抗-TRAILR2抗体重链基因序列氨基末端的融合产生了质粒pXWU027。BHA10scFvVH44:VL100/(Gly4Ser)4基因序列与抗-TRAILR2抗体重链基因序列氨基末端的融合产生了质粒pXWU028。使用连接混合物转化大肠杆菌菌抹TOP10感受态细胞(InvitrogenCorporation,Carlsbad,CA)。为了插入物的存在,筛选转化为氨千青霉素药物抗性的大肠杆菌克隆。DNA序列分析证实了最终构建体的正确序列。使用的嵌合14A2轻链在所有N-和C-Hercules双特异性抗体中是通用的,DNA(SEQIDNO:28)和氨基酸序列(SEQIDNO:29)显示于图15A和15B中。嵌合14A2轻链是用N末端信号肽来表达的,其具有下列DNA和氨基酸序列GTCTTTCTCC(SEQIDNO:59)MAWTPLFFFFVLHCSGSFS(SEQIDNO:60)用于常规BHA10scFvNH-Hercules的重链DNA(SEQIDNO:30)和氨基酸序列(SEQIDNO:31)分别显示于图16和17中。用于BHA10scFv(Gly4Ser)4N-Hercules的重链DNA(SEQIDNO:32)和氨基酸(SEQIDN():33)序列分别显示于图18和19中。用于BHA10scFvVn44:V[J00N-IIercules的重链DNA(SEQIDNO:34)和氨基酸(SEQIDNO:35)序列分别显示于图20和21中。用于BHA10scFvVH44:VL100/(Gly4Ser)4N-Hercules的重链DNA(SEQIDNO:36)和氨基酸(SEQIDNO:37)序列分别显示于图22和23中。每种重链均利用具有下列DNA和氨基酸序列的N末端信号肽来表达GTGTCCTGTCC(SEOIDNO:61)MGWSLILLFLVAVATRVLS(SEQIDNO:62)B.构建具有BHA10常规、(G4S)4,VH44:VL100和VH44:VL100/(Gly4Ser)4scFvs的C-scFv"Hercules"四种抗-LT(3R(BHA10)x抗-TRAILR2(chil4A2)双特异性抗体设计是以将常规和变体BHAIOscFvs添加至抗-TRAILR2抗体重链的羧基末端为基础的。使用实施例3中所述的BHA10scFvsDNAs利用表15中所述的寡核苷酸引物通过PCR扩增来构建一系列C-Hercules双特异性抗体。利用Ser(Gly4Ser)3连接体将BHAIOscFvs连接至chil4A2重链的羧基末端。正向5'VHPCR引物(XWU006-F1)包括用于克隆的SamHI限制性内切酶位点(划线序列),其后是编码部分Ser(Gly4Ser)3连接体肽和BHAIOVH的氨基末端的序列。利用反向3'VLPCR引物(XWU006-Rl)扩增BHA10scFv轻链并包括终止密码子,其后是用于克隆的5awHI位点(划线序列)。反向3,内部重叠PCR引物(XWU006-R2)包括编码(Gly4Ser)3连接体的序列并含有用粗体标示的沉默突变从而除去定位于BHAIOscFv(Gly4Ser)3连接体区域的5amHI位点。表15.用于PCR扩增具有BHAIO常规、(G4S)4,V44:VL100和V44:VL100/(Gly4Ser)4scFvs的C-Hercules的寡核苷酸。XW謂6-F1(SEQIDNO:38)5'-GGGGGTGGATCCGGTGGAGGGGGCTCCGGCGGTGGCGGGTCCCAGGTCCAACTGGTGCAGTCTG-3'XWU006-F2(SEQIDNO:39)5'-TGGGGGCGGCGGGTCCGGTGGTGGTGGTAG-3'XWU006-R2(SI':QIDNO:40)5,陽TACCACCACCACCGGACCCGCCGCCCCCAG-3'XWU006-R1(SEQIDN():41)5'-GTTAACGGATCCTCATTTGATCTCCACCTTGG-3'如图14B中所示,BHAIOscFv基因序列是利用5'VHXWU006-Fl+3'VLXWU006-RlPCR引物组以及设计用于除去BHAIOscFv(Gly4Ser)3连接体区域内的BawHI位点的一组内在重叠PCR引物(XWU006-F2andXWU006-R2)在两步PCR反应中扩增的。使用这些PCR条件来从质粒pXWU034中制备常规BHAIOscFv、从质粒pXWU002中制备BHAIOscl:v(Gly4Ser)4、从质粒pIEH006中制备BHAIOscFvVH44:VL100、和从质粒pIEH009中制备BHA10scFvVH44:VL100/(Gly4Ser)4。将这些来自一系列扩增的BHAIOscFvs的PCR产物通过琼脂糖凝月交电泳利用MilliporeUltrafree-DA提取试剂盒根据厂商说明书(Millipore;Bedford,MA)进行纯化。用BawHI限制性内切酶消化纯化的PCR产物并将其连接至pN5KGl载体的单个6amHI位点上,该载体先前经工程设计从而含有几种修饰。简要地,含有chil4A2IgGl的pN5KGl载体经修饰除去了位于重链基因3'末端的终止密码子并引入了编码氨基酸序列Ser-Gly-Gly-Gly的核苷酸,其后紧跟用于克隆的5awHI限制性内切酶位点(编码Gly-Ser)。最后,还除去了chil4A2VL区域中固有的不需要的BamHI限制性内切酶位点。所获得的系列构建体通过16个氨基酸的Ser(Gly4Ser)3连接体形成变体BHA10scFvs与抗-TRAILR2抗体重链羧基末端的融合蛋白。常规BHA10scFv基因序列与抗-TRAILR2抗体重链基因序列羧基末端的融合产生了质粒pXWU006。BHAIOscFv(Gly4Ser)4基因序列与抗-TRAILR2抗体重链基因序列羧基末端的融合产生了质粒pXWU034。BHA10scFvVh44:V]J00基因序列与抗-TRAILR2抗体重链基因序列羧基基末端的融合产生了质粒pXWU035。BHAIOscFvVH44:VL100/(Gly4Ser)4基因序列与抗-TRAILR2抗体重链基因序列羧基末端的融合产生了质粒pXWU036。使用连接混合物转化大肠杆菌菌抹TOP10感受态细胞(InvitrogenCorporation,Carlsbad,CA)。为了插入物的存在,筛选转化为氨千青霉素药物抗性的大肠杆菌克隆。DNA序列分析证实了最终构建体的正确序列。使用的嵌合14A2轻链在所有N-和C-Hercules双特异性抗体中是通用的,DNA和氨基酸序列显示于图15A和15B中。用于常规BHA10scFvC-Hercules的重链DNA和氨基酸序列分别显示于图24和25中。用于BHA10scFv(Gly4Ser)4C-Hercules的重链DNA和氨基酸序列分别显示于图26和27中。用于BHA10scFvVh44:Vl100C-Hercules的重链DNA和氨基酸序列分别显示于图28和29中。用于BHAIOscFvVH44:VL100/(Gly4Ser)4C-Hercules的重链DNA和氨基酸序列分别显示于图30和31中。C末端双特异性Hercules构建体的总结见于表16中。表16.编码'Hercules,的中间和表达质粒。<table>tableseeoriginaldocumentpage206</column></row><table><table>tableseeoriginaldocumentpage207</column></row><table>C.双特异性抗体在CHO细胞中的瞬时表达将质粒DNAspXWU005、pXWU026、pXWU027、pXWU028以及pXWU006、pXWU034、pXWU035和pXWU036(表16)用于转化CHODG44细胞用于抗体蛋白质的瞬时生产。将每种20ug的质粒DNA于4x106细胞组合于0.4mls体积的1xPBS中。将混合物加入0.4cm试管(BioRad)中并置于冰上15分钟。用GenePulser电穿孔仪(BioRad)在600pF和350volts下对细胞进行电穿孔。将细胞置于T-25瓶中的含有100pM次黄嘌呤和16jliM胸腺嘧啶核苷的CHO-SSFMII培养基中,并在37。C孵育4天。收集含有由此瞬时CHO表达系统产生的Hercules蛋白质的上清液并通过蛋白质印迹来评估。图32显示了含有Vh44:Vl100(c1s^二硫化物)orVH44:VLl00/(Gly4Ser)4连接体稳定的BHA10scFvs的Hercules抗体剧烈地增加了表达产量,无论scFv是否融合至N『或C-末端(第3、4、7、8道)。令人惊讶地,野生型BHAIOscFv和(Gly4Ser)4连接体BHAIOscFvN-末端融合物均未检测出分泌蛋白质,这表明了scFv稳定对表达的益处。另外,常规BHAIOscFv和(Gly4Ser)4连接体BHAIOscFvC-末端融合物显示了大量55-60分子量的副产品,该副产品在稳定的构建体中大量减少,表明scFv稳定可增强产物质量。D.双特异性结合ELISA试验在ELISA试验中测试上清液以检测对于重组生产的TRAILR2和LT卩R受体的单独结合活性。在两种试验中,将受体固定于板上并將育测试样品以允许其结合至受体上。用标记的抗体检测结合的样品。用每孔100pl的在pH9.5的Na2C03/NaHC03缓沖液中的2jug/mlLT(3R-Ig包被96孔微量滴定ImmulonII板(Fisher,Cat#14245-61),在4。C过夜,并用200}il稀释缓沖液(PBS中0.5%脱脂奶粉力口0.01%硫柳汞)在37"C下封闭1小时。在下面的步骤中,将100pl单独的'Hercules,上清液或稀释緩冲液中的纯化蛋白质加入双分孔中并在37。C下孵育1小时。在用自来水洗涤之后,将100^1的100ng/mlTRAIL-R2Fc6X-His标记的融合蛋白(R&DSystems,Minneapolis,MN)力。入孔中并在37。C下孵育1小时。洗涤后,向每孔加入100jil1/2000稀释的Penta-HisHRP偶联物(QIAGEN,Cat#34460)并在37。C下孵育1小时。洗涤后,加入每孔100^1的HRPO底物结合的TMB过氧化物酶底物/过氧化物酶溶液B(KirdgaardandPerryLabs,Cat.50-76-00)。5至10分钟后用lOOfil的2M化804终止反应。利用MolecularDevices板阅读器在450nm和540nm下测定OD并产生结合曲线。图33和34显示,含有VH44:VL100(ds=二硫化物)或VH44:V,.100/(Gly4Ser)4连接体稳定的BHA10scFv的N-末端(图33A,34A)和C陽末端(图33B,34B)Hercules抗体与含有常规BHA10scFv(wt)的Hercules相比,均显示出分别对LT(3R(图33)和TRAILR2(图34)结合的增强。R双特异性抗体在CHO细胞中的稳定表达、抗体纯化和表征用质粒DNAspXWU027、pXWU028、以及pXWU006、pXWU035和pXWU036(表16)转化DHFR缺陷的CHODG44细胞用于抗体蛋白质的稳定生产。将转染的细胞培养在含有2mM谷胺酰胺、补充有10%透析了的胎牛血清的负型MEM培养基(InvitrogenCorporation)中,并利用荧光标记的抗体和反复荧光激活细胞分选(FACS)浓缩为稳定的大量培养物池(Brezinsky等人,J/附mw"o/MeAoA.277(1-2):141-55(2003))。FACS还可用于产生单个的细胞系。使细胞池和细胞系适应无血清条件并依比例决定将其用于抗体生产。收集来自转染的CHO细胞池或细胞系以及克隆CHO细胞系的上清液并使用ProteinASepharoseFF(6mL)柱利用PBS、10mMEDTA流动緩冲液进行纯化,所述CHO细胞池或细胞系表达l)具有Vh44:VlJ00稳定的BIIA10scFv的C-末端Hercules和2)具有VH44:VL100/(Gly4Ser)4连接体稳定的BHA10scFv的C-末端Hercules;所述克隆CHO细胞系表达3)具有V44:VL100稳定的BHA10scFv的N-末端Hercules和4)具有Vn44:VLl00/(Gly4Ser)4连接体稳定的BHAIOscFv的N-末端Hercules。利用pH3.0的0.1M甘氨酸洗脱Hercules蛋白质并立即利用Tris碱中和至pH7.5-8.5。此外,表达含有常规BHAIOscFv的C-Hercules并通过A蛋白层析法纯化它用于比较。通过分析型大小排阻层析检测来自含有常规BHAIOscFv的C-Hercules、含有VH44:VL100BHAIOscFv的C-末端Hercules、和含有VH44:VL100/(Gly4Ser)4BHAIOscFv的C-末端Hercules的A蛋白洗脱物中聚集物的存在(图35)。含有常规BHAIOscFv的C-Hercules的层析图显示了40%的聚集物。相反,含有Vh44:Vl100BHAIOscFv的C-末端Hercules将聚集物的水平降低至20%,且通过含有V44:VL100/(Gly4Ser)4BHAIOscFv的C-末端Hercules将聚集物的水平减少到10%而获得了更强的稳定性。聚集物的水平似乎取决于scFv的特性,而无论其连接于14A2IgG的Nh或C末端(数据未显示)。通过在pH5.0、0.1M的醋酸中透析来进一步纯化A蛋白Hercules洗脱物,并通过MonoS(GEHealthcare)阳离子交换层析利用相同的流动缓沖液作为透析液来纯化。利用达到0.1M醋酸、pH5.0,0.5MNaCl的不连续梯度洗脱Hercules蛋白质。收集MonoS洗脱液并将其通过TosoHaas制备型SEC以除去聚集物。图36A和36B分别显示了纯化的下列Hercules的SDS-PAGE凝胶具有VH44:VL100稳定的BHAIOscFv的N-末端Hercules和具有VH44:VLj00/(Gly4Ser)4连接体稳定的BHAIOscFv的N-末端Hercules、以及具有V44:VL100稳定的BHAIOscFv的C-末端Hercules和具有V44:VL100/(Gly4Ser)4连接体稳定的BHAIOscFv的C-末端Hercules。Reduced道显示了重链和轻链蛋白质的预期大小。重要地,没有显著水平的降解的或不需要的低分子量副产品,这些副产品常常在利用含有野生型scFv结构域的Hercules时见察到。图37(小图A和C)分别显示了具有VH44:VL100稳定的BHAIOscFv的N-末端Hercules和具有VH44:VL100/(Gly4Ser)4连接体稳定的BHAIOscFv的N-末端Hercules的分析型SEC洗脱图,该洗脱图是在最初的A蛋白纯化步骤之后的。图37(小图B和D)也分别显示了具有Vh44:Vl100穗定的BHAIOscFv的N-末端Hercules和具有VH44:VL100/(Gly4Ser)4连接体稳定的BHAIOscFv的N-末端Hercules的分析型SEC洗脱图,该洗脱图是在制备型SEC去除残留的非单体蛋白质污染物之后的。类似地,图38(小图A和C)分别显示了具有V44:VL100稳定的BHAIOscFv的C-末端Hercules和具有VH44:VU00/(Gly4Ser)4连接体稳定的BHAIOscFv的C-末端Hercules的分析型SEC洗脱图,该洗脱图是在最初的A蛋白纯化步骤之后的。图38(小图B和I))分别显示了具有VH44:VL100稳定的BHAIOscFv的C-末端Hercules和具有VH44:VLl00/(Gly4Ser)4连接体稳定的BHAIOscFv的C-末端Hercules的分析型SEC洗脱图,该洗脱图是在制备型SEC去除残留的非单体蛋白质污染物之后的。这些研究"i正实通过添加VH44:VL100二^l化物或VH44:VL100二硫化物和(Gly^er)4连接体来稳定BHAIOscFv获得了>98%纯的、单体Hercules双特异性抗体的制备量,这基本上不存在更高级分子量的种类。在相同条件下进行的DSC研究证实C-HerculesVH44:VL100/(Gly4Ser)4BHAIOscFv比含有常规BHAIOscFv的C-Hercules更加耐热(图39)。含有常规BHAIOscFv的C-Hercules变性图语比C-HerculesVn44:V,.100/(Gly4Ser)4BHAIOscFv所观察到的图谱低5°C起始。这些结果表明scFv可限制Hercules分子的整体热稳定性。这与所观察到的V44:VL100/(Gly4Ser)4BHAIOscFv的TM比常规BHAIOscFv的TM高出5°C相关。然后在ELISA试验中测试稳定Hercules构建体的纯化物对重组产生的TRAIL-R2和LT卩R受体的双特异性结合活性。在此试验中,将LT(3RIg受体固定于板上,然后孵育样品以促使其与受体结合。在用TRAILR2-(His)6进行的第二轮孵育步骤之后通过洗涤除去未结合的样品。在洗涤步骤后,用标记的抗-(His)6抗体检测双重结合的复合物。该研究的结果和每种构建物的有效浓度(EC50,昭/ml)描述于图40中。图40显示具有VH44:VL100(ds=二硫化物)或VH44:VLl00/(Gly4Ser)4连接体稳定的BHA10scFv的N-末端和C-末端Hercules抗体均证实了对LT(3R和TRAIL-R2清楚的双特异性结合。使用LT卩R-结合抗体的多价体(五聚体)形式(CBE11)作对照证实了在此结合试验中单独LTPR的单个识别并不诱发信号。实施例8稳定的双特异的"Hercules"抗体在CHO细胞中的放大生产稳定转染质粒DNApXWU028和pXWU036的DHFR-缺陷的CHO细胞系(表16)被筛选,以选择单个细胞分离群,其能够表达高水平的用本发明的方法进行稳定化的溶解的和正确折叠的Hercules分子。细胞筛选方法使用Brezinky等的荧光活化细胞分选(FACS)分析(Brezinky等,JImmunolMeth(2003).277:141-155)。简要地,荧光标记的抗-Hercules抗体被用于标记显示出在其表面瞬时表达Hercules抗体的CHO细胞。然后,显示信号突光强度的细胞通过调整针对该信号的细胞分选仪的圈门被选择。显示高水平生产率的单个细胞群因此被选出,并适应于无血清环境以建立稳定的生产细胞系。该生产细胞系接着被放大,用于生产和纯化双特异的抗体蛋白。来自生物反应器运行11天的80L包含VH44:VL100/(Gly4Ser)4BHA10scFv的N-末端Hercules(XWU028)上清被收集并通过超滤法预清除。该双特异的抗体被蛋白A色谱法捕获并在1218ml容积中洗脱。通过阴离子交换色谱法,接着制备型分子排阻色谱法,蛋白A部分在两个分离批次中被进一步纯化。第一批次产生了825.5mg,在PBS中4.85mg/ml的浓度,98.9%的纯度,0.13EU/mg的内毒素载量。第二批次产生了318mg,10.3mg/ml的浓度,99.1%的纯度,2.37EU/mg的内毒素载量。共1143.5mg高度纯化的,包含V44:VL100/(Gly4Ser)4BHA10scFv的单体N-末端Hercules被回收。来自生物反应器运行11天的24L包含VH44:VL100/(Gly4Sei')4BHA10scFv的C-末端Hercules(XWU036)上清被收集并通过超滤法预清除。利用蛋白A色谱法捕获粗制品,接着阴离子交换色谱法和制备型分子排阻色谱法,该双特异的抗体在两个分离批次中被纯化,如上面所述的那样。第一批次产生了985.5mg,13mg/ml的浓度,98.5%的纟屯度,0.01EU/mg的内毒素载量。第二批次产生了570mg,11.42mg/ml的浓度,99%的纯度,1.91EU/mg的内毒素载量。共1555.5mg高度纯化的,包含VH44:VL100/(Gly4Ser)4BHA10scFv的单体C-末端Hercules;波回收。产生XWU054双特异的抗体的CHO细胞系被分离,并被发现产生21.5mg/L。这在研究阶段的非扩增CHO细胞系的预期范围内,如果我们发展生产细胞系,我们将预期更高的生产率。这些放大生产研究是在非扩增CHO细胞系上实施的,但是产生了产量超过lgm的高质量,生物物理学稳定的双特异的抗体。推测起来,细胞系扩增策略将大大提高转染的CHO细胞系的细胞生产率,使能够发展适合商业应用的工序。这些研究例证本发明中描述的方法能够在适于生产的细胞系(如,CHO)中放大生产稳定的,双特异的抗体的有效性。实施例9双特异的"Hercules"抗体的生物活性肿瘤细胞系WiDr,(ATCCCCL-218),人类结肠癌细胞系,Mel80,(ATCCHTB33)人类颈上皮癌细胞系,和MDA231,(Dr.DajunYang,UniversityofMichigan)人类乳腺癌细胞系在具有10%FCS,2mML-谷氨酰胺,1X非必需氨基酸,0.5mM丙酮酸钠和青霉素/链霉素的MEM-Earles中培养。肿瘤细胞系用PBS清洗一次,并且细胞通过用胰蛋白酶消化而释放。细胞通过离心被收集,在完全培养基中混悬,计数并且以WiDr和Me1805000细胞/孔,MDA2311500细胞/孔种于96-孔组织培养板。人类IFNy(BiogenIdec,Coi'p)被加入到细胞悬液,以产生WiDr和MDA23180U/ml,Me18050U/ml的细胞因子终浓度。50pl肿瘤细胞/IFNy悬液与50)!l在完全培养基中制备的2X浓缩的3倍连续稀释的检测抗体混合。典型地,检测抗体的终浓度从5000pM到0.07pM变化。细胞在37°C,5%C02的增湿孵箱中生长4天(WiDr&Md80)或3天(MDA231),并且通过加入20pL/孔的PromegaCellTiter96AQueous,一种纟田月包增生分片斤i式剂的;容液(PromegaCorporation,Madison,WI),评估细胞杀伤。在纟效量滴定板阅读器上490nM(SpectromaxPlus,MolecularDevicesSunnyvaleCA)读板。数据使用孩i软Excel作图(MicrosoftInc,WA)。这些研究的结果显示在图41A-41D中。图41A表明14A2IgG抗体在抑制WiDr肿瘤细胞生长上具有中等活性,并且相比于单独BHAIOIgG,与BHA10IgG联合显示了抗肿瘤细胞活性的轻度增加。相反,两个双特异的Hercules抗体都显示了增强的WiDr细胞的肿瘤细胞杀伤。图41B显示了14A2IgG和BHA10IgG抗体,做为单独试剂或联合起来,都具有抑制Mel80肿瘤细胞生长的中等的,如果不是忽略不计的,活性。相反地,两个双特异的Herclues抗体都显示了Mel80细胞的肿瘤细月包杀伤。图41C表明14A2IgG和BHA10IgG抗体,在抑制MDA231肺瘤细胞生长上,^f故为单独试剂,具有的活性都可忽略不计,当联合使用时,可能具有一些活性。相反地,双特异的Hercules抗体XWU036(具有VH44:VL100/(Gly4Ser)4连接子稳定的BHA10scFv的C-末端Hercules)显示了MDA231细月包的肺瘤细胞杀伤。图41D表明,没有一个抗体证实了对对照培养的人脐静脉内皮细胞(HUVEC)通过FACS分析,HUVEC显示LT(3R和TRAIL-R2的阳性染色(数据未显示),表明受体的出现和该双特异的抗体的活性可能依赖于触发肿瘤细胞内特异的或独特的旁路元件。实施例10双特异的Hercules抗体的稳定性研究实施了储存于2-8。C三个月的N-和C-末端双特异的抗体样品XWU02S(BHA10scFvV44:VL100/(Gly4Ser)4N-Hercules)和XWU036(BHA10scFvV44:VL100/(Gly4Ser)4C-Hercules)的实时稳定性研究。蛋白质量被评估,对于(l)聚集反应,(2)沉淀,("多肽裂解或蛋白分解,和(4)翻译后修饰,例如脱酰胺作用或氧化。该研究中使用的高和低浓度的N-和C-末端双特异的抗体样本是1.8mg/mL(低)和10.3mg/mL(高)的XWU028,5.0mg/mL(低)和11.4mg/mL(高)的XWU036。抗体在PBS中配制。对于该稳定性研究,初始的(TK)),中期的(丁=1周,2周,l个月,2个月),和最终的(T二3个月)时间点的样品样品在收集后立即被分析。而且,初始的样品被冷冻和储存于-7(TC直至该三个月的研究结束时为继发的分析解冻。BHA10IgG(8.7mg/mL)被用作对照并且被简单处理。A.蛋白聚集和沉淀分析使用分析型分子排阻色镨法(SEC)联合主测线光散射和反射指数检测器(WyattTechnologies,MiniDawn和rEX,分别地)监测蛋白聚集或沉淀。SKC/光散射分析表明没有可能发生于沉淀过程中的聚集或物质损失的证据。XWU028,XWU036,和BHA10抗体的初始的,T^0和最终的,T=3个月,时间点的SEC洗脱图几乎相同(图56A,56B,56C,分别地)。到研究完成时,XWU028和XWU036样品都蓄积了约1%的聚集物质;但是,这些聚集物的检测接近于该方法确定的检测下P艮(表17)。聚集物形成不依赖于蛋白浓度。基于使用光散射检测决定的分子量,检测样品中低水平的聚集物或许是单体种类转变为二聚体的产物,这是可能的。两个双特异的抗体样品,XWU028或XWU036,都没有积累可检测水平的高位聚集物,即使此类聚集物使用这些方法很容易被观察到。BHA10抗体在该研究的3个月过程中没有显示聚集物的增加(表17)。表17使用分析型分子排阻色谱法检测单体百分比<table>tableseeoriginaldocumentpage214</column></row><table>B.蛋白分解和翻译后修饰分析使用SDS-PAGE和液相色语法/质谱法(LC/MS)完整质量分析(AgilentLC/MSI)TOF通过电喷射接口耦联于Agilent1100LC系统)监测蛋白分解。对于SDS-PAGE分析,每泳道上样5|ig蛋白。衰减的样品在包含5%(3-巯基乙醇的IXTris-甘氨酸样品緩沖液中制备。通过非衰减的和衰减的SDS-PAGE分析确定,XWU028和XWU036表明没有在2-8°C3个月储存期间蛋白分解的证据(图57A和B)。相似地,通过LC/MS分析确定,XWU028和XWU036表明没有在2-8°C3个月储存期间较低分子重量的蛋白分解产物的—迹象(图58)。使用LC/MS监测翻译后修饰。TM),T-1个月,和T二3个月的样品以非衰减和衰减两种形式被分析。衰减的样品通过在50mMDTT/4M盐酸胍中37。C处理1小时制备。HPLC緩沖液A包含在水中0.03%的TFA,HPLC緩冲液B包含在乙腈中0.025%的TFA。流速恒常保持在lOOpl每分钟。7.5吗的每个样品(衰减的和非衰减的)一皮注射到2,1X50mmC4柱上,并且通过AgilentESI-TOF分析。结合-和-洗脱的方法被用于非衰减的样品,而梯度方法被用于衰减的样品。使用系统分析专家和使用包含探测的MaxEntl软件程序包反巻积获得光谱。XWU028和XWU036(高浓度)在T=0,T=l个月,和T=3个月的反巻积质谱显示在图58中。XWU028和XWU036都没有表现出其质谱内任何可检测到的变化,表明了缺乏能够潜在负面影响双特异的抗体功能或稳定性的翻译后修饰。综上,这些数据表明,在长期的保存条件下,如生物药产品要求的那些保存条件,两个包含稳定化scFv结构域的N-和C-末端双特异的抗体都是稳定的。这些结果尤其鼓舞人心,因为这些稳定性研究是用在简单缓冲液(PBS)中制备的N-和C-末端双特异的抗体,而不是用以优化组分制备的溶液实施的。实施例ll.双特异的"Hercules,,抗体体内的药物代谢动力学活性和血清稳定性单次推注的10mg/kg(lmg/ml)的在磷酸盐-緩冲液(PBS)中稀释的N-末端Hercules(XWU028)或C-末端Hercules(XWU036)被腹膜内施用给联合重症免疫缺陷的雄性CB17-小鼠。小鼠在注射后O,0.5,2,6,24,48,72,96,168,240和336小时一皮处死,对于每个双特异的抗体,每个时间点^f吏定量化水平。ELISA板用羊抗人IgG包被,用PBS/1%BSA封闭,包含双特异的抗体的血清稀释物在PBS/1%BSA中被连续地稀释,加入板内并孵育。用羊抗人K链-HRP-连接的抗体检测捕获抗体。药物代谢动力学研究的结果在表18中显示。N-末端Hercules(XWU028)具有10.3天的清除半衰期(tl/2),伴随85.67吗/ml的峰值血清浓度。C-末端Hercules(XWU036)具有15.1天的更长的清除半衰期(t,/2),伴随105.67吗/ml的峰值血清浓度。尽管没有为生物利用度调整这些数值,两个分子都具有相似的分配容积(Vd)。表18.药物代谢动力学参数参数单位N-末端Hercules(XWU028)值C-末端Hercules(XWU036)值T1/2小时247.9386362,3607Cmax4設克/毫升85.67105.67Vd*升/千克0.17070.1748C1*毫升/分钟/千克0.0080馬6血清样本也在实施例7中描述的双特异结合ELISA中被分析。在该分析中,上述包含N-末端Hercules(XWU028)或C-末端Hercules(XWU036)的215血清样本在ELISA分析中被检测了对于重组产生的TRAIL-R2和L寧受体的双特异的结合活性。图59A和B表明来自于N-和C-末端Hercules治疗的小鼠的血清样本包含双特异结合于TRAIL-R2和LT卩R以及接近平行于从PK研究中观察到的清除图的抗体,表明双特异性的抗体在长期期限的生理条件下保持完整。实施例12.双特异的"Hercules"抗体的体内生物活性(A)在结肠癌肿瘤模型中双特异的"Hercules,,抗体的体内生物活性WiDr人类结肠癌(每只小鼠2X10E6个细胞)细胞被皮下输注到125只无胸腺棵鼠体内。肿瘤生长直至它们达到约100mg,在这个时间点总共70只小鼠被选择用于研究,分成7組,每组10只小鼠。从输注后13天开始,给予如下IP治疗组1=无致热源的PBS;组2=CBE1l,2mg/kg,lx/周;组3=hBHA10,2mg/kg,2x/周;组4=chl4A2,2mg/kg,2x/周;组5=1Icrcules-llXWU028,2mg/kg,lx/周;组6=Hercules-IIXWU036,2mg/kg,lx/周;组7=hBHA10+chl4A2,每种lmg/kg,2x/周。肿瘤大小和体重两周记录一次。当赋形剂组的平均肿瘤大小达到约2000mg时,研究被终止。应用公式(LxW"2)计算肿瘤体积。与PBS赋形剂对照相比,用XWU028和XWU036治疗的小鼠的中期分析显示了两个双特异的抗体的显著抗肿瘤活性(pO,001)(图60)。对于XWU028,与单独hBHA10爲ch14A2单克隆抗体治疗的反应相比,观察到了显著的抗肿瘤反应(p0.05)。对于XWU036,与chMA2单克隆抗体治疗的反应相比,观察到了显著的抗肿瘤反应(p0.05),和,特别地,与hBHA10单克隆抗体相比,更显著的反应(pO.Ol)。重要地,通过一周只施用一次,双特异的抗体表现了优良的体内抗肿瘤活性,表明本发明中描述的稳定性提高致成了生理学条件下改进的抗体性质和物理稳定性。(B)在乳腺癌肿瘤模型中双特异的"HercuIes"抗体的体内生物活性MDA-MB-231人类乳腺癌细胞^皮皮下输注到135只无胸腙j果鼠体内(每只小鼠2X10E6个细胞)。肿瘤生长直至13天,在该时间点平均大小约168mg的负荷肿瘤的小鼠,被分配为治疗(N-10)和赋形剂对照(N45)组。小鼠从13天开始接受抗体和赋形剂IP。示范组表示如下组1=无致热源的PBS;lx/周;组2二hBHA10,2mg/kg,2x/周;纟且3-chl4A2,2mg/kg,2x/周;组4=Hercules-IIXWU036,2mg/kg,lx/周;组5=hBHA10+chl4A2,每种lmg/kg,2x/周。肿瘤大小和体重每两周记录一次。当赋形剂组平均肿瘤大小达到约2800mg时,研究被终止。使用公式(LxW"2)计算肿瘤体积。与或者用hBHA10或chl4A2单克隆抗体单独治疗,或者用此两个抗体混合物治疗相比,XWU036表示出了统计上显著(pO.001)的抗肿瘤活性。重要地,以每周一次定量计划施用,双特异的抗体XWU036表示出了良好的体内抗肿瘤活性,表明本发明中描述的稳定性提高致成了生理学条件下改进的抗体性质和物理稳定性(见图86)。实施例13.包含非共价稳定scFv突变的稳定双特异的"Hercules"抗体的生产本发明中包含单独非共价稳定突变联合VH44-VL100二硫化键的BIIA10scFvs被用于构建稳定的双特异的C-Hercules抗体,该抗体包含结合于TRAILR2受体的嵌合14A2IgG抗体与结合于LT卩R的BHAIOscFv的融合物。使用本质上为实施例7中描述的方法,该双特异的抗体被构建为C-末端BHAIOscFv融合物。A.用BHAIOVHS16E+VLS46L和VH44-VL100/VHS16E+VLS46LscFvs的构建C-Hercules双特异的抗体利用表19中描述的寡核苷酸引物,使用PCR从分别包含BHAIOVHS161+VLS46L和V44-VL100/VS16E+VL,S46LscFvs的质粒DNAspIKH-050(高表达质粒pIEH076的亲代质粒)和pIEH-052(高表达质粒pffil1080的亲代质粒)扩增变异的BHA10scFv基因片段。变异的BHAIOscFv基因片段被凝胶分离。根据质粒pIEH-050和pIEH-052连接区内的BamHI位点,基因片段使用pPuMI和Kpnl限制性内切酶消化,并连接于用同样的限制性内切酶消化的修饰的质粒PN5KG1,形成稳定的通过16个氨基酸结构域的羧基末端的融合产物。通过DNA序列分析证实正确的序列。表19.用于PCR扩增BHAIOVHS16E+VlS46L和VH44-VL100/VHS161HVLS46LscFvs的寡核苷酸<table>tableseeoriginaldocumentpage217</column></row><table>(SEQIDNO:56)GGGTCCCAGGTCCAACTGGTGCAGTCTG-3'XWU006-R1(SliQIDNO:57)5'-GTTAACGGATCCTCATTTGATCTCCACCTTGG-3,BHA10scFvVHS16E+VLS46L基因序列与抗-TRAILR2抗体重链基因序列的羧基末端融合产生了质粒pXWU054。BHA10scFvVH44-VL100/VHS16E+VLS46L基因序列与抗-TRAILR2抗体重链基因序列的羧基末端融合产生了质粒PXWU055。连接混合物被用于转化大肠杆菌抹TOP10感受态细胞(InvitrogenCo卬aration,Carlsbad,CA)。筛选转化为氨比西林药物抗性的大肠杆菌克隆为存在插入片段。DNA序列分析证实了最终构建物的正确序列。嵌合的14A2轻链DNA(SEQIDNO:28)和氨基酸序列(SEQIDNO:29)在图15A和15B中显示。C-HerculesBHA10scFvVHS16E+VLS46L双特异的抗体的重链DNA(SEQII)NO:52)和氨基酸序列(SEQIDNO:53)分别显示在图61和62中。C-HerculesBHA10scFvVH44-VL100/VS16E+VLS46L双特异的抗体的重链DNA(S「二QIDNO:54)和氨基酸序列(SEQIDNO:55)分别在图63和64中显示。所述重链使用与以前应用的相同的信号肽。B.双特异的抗体在CHO细胞中的稳定表达,抗体纯化,和鉴定如实施例8中描述的那样,稳定转染质粒DNApXWU054和pXWU055并适合无血清条件的DHFR-缺陷的CHO细胞系被扩增用于生产双特异的抗体蛋白和蛋白纯化。蛋白A洗脱液,来自于包含具有稳定VS16E+VLS46LBIIA10scFv的C-Hercules和具有稳定VH44-VL100/VHS16E+VL,S46LBHA10scFv的C-双特异的抗体的上清液,通过分析型分子排阻色谱法被检测聚集物的存在(图65)。包含保守的BHAIOscFv的C-Hercules的色谱图显示约40%的聚集物。相反地,具有稳定VHS16E+VLS46LBHAIOscFv的C-末端Hercules将聚集物显著降低到可与标准IgGs观察到的水平相比较的程度。图66A和66B分别显示了纯化的具有VHS16E+VLS46LBHAIOscFv的C-末端Hercules和具有VH44:VL100/VHS16E+VLS46LBHAIOscFv的C-末端Hercules的SDS-PAGE胶。衰减的泳道显示重链和轻链蛋白的预期大小。重要地,没有明显程度的降解或不必要的低分子量副产品,这些经常在包含野生型scFv结构域的Hercules被观察到。图67A和67B分别显示了具有VHS16E+VLS46LBHA10scFv的C-末端Hercules和具有VH44:VL100/VHS16E+VLS46LBHA10scFv的C-末端Hercuks的分析型分子排阻色谱洗脱图,其在初始的蛋白A纯化步骤之后。这些研究表明,通过添加单独VHS16E+VLS46L突变和联合Vw44:VL100二硫化物,BHA10scFv的稳定产生了制备量>980/。纯度,基本上没有高级分子量种类的单体Hercules双特异的抗体。实施例14.包含非共价稳定scFv突变的双特异的"Hercules"抗体的生物活性具有VS16E+VLS46LBHA10scFv的C-末端Hercules(XWU054)和具有v44:VL100/VHS16E+VLS46LBHA10scFv的C-末端Hercules(XWU055)的体外生物活性如实施例7中描述的那样在肿瘤细胞增生分析中被检测。这些研究的结果在图68中显示。图68B表明14A2IgG抗体具有抑制WiDr肿瘤细胞生长的中等活性,并且与BHA10IgG联合,相比于单独BHAlOIgG,显示出抗肿瘤细胞活性的轻度增加。相反地,两个双特异的抗体(XWU054和XWU055)都显示出增加的WiDr细胞的肿瘤细胞杀伤,其可与实施例10中描述的XWU036分子(具有VH44:VU00/(Gly4Ser)4连接子稳定BHA10scFv的C-末端Hercules)观察到的相比较。图68A表明14A2IgG和BIIA10IgG抗体做为单剂在抑制MDA231肿瘤细胞生长上都具有微小的活性,当联合应用时也是如此。相反地,双特异的Hercules抗体(XWU054和XWU055)显示出增强的MDA231细胞的胂瘤细胞杀伤,其可与实施例10中描述的XWU036分子(具有V44:VLl00/(Gly4Ser)4连接子稳定BHA10scFv的C-末端Hercules)观察到的相比较。实施例15:应用示差扫描量热法(DSC)检测人或人源化抗体序列的热稳定性为了评价抗体表观稳定性的范围,示差扫描量热法(DSC)在17个人或人源化的一组BIIB抗体上实施。BI1B抗体用20mM柠檬酸钠,150mMPH6.0的氯化钠緩沖液被彻底透析。透析液在量热器的参比池内使用,以限定每个抗体扫描的基线。透析之后,BIIB-17的浓度用280nm吸光度检测(Pace等,ProteinSci.4,2411-2423,1995)。通过用其透析液稀释浓缩的原料,用于DSC的抗体溶液一船j皮制备为lmg/mL。使用自动化毛细管示差扫描量热法(capDSC,MicroCal,LLC)实施扫描。蛋白和参照溶液利用机器人装置从96孔板自动取样。每个蛋白扫描之前,用緩冲液在样品池内实施2次扫描,并用于本底扣除。每次蛋白扫描之后,利用5%的liquinox进行单次清洗扫描。每次扫描之后,仪器用3X-2mL包含0.01%叠氮化钠的蒸馏去离子水自动清洗参比池和样品池。为了增强的峰分辨率,利用介质反馈方式以rC/分钟实施扫描。扫描范围为20-95°C。所有包含蛋白的96孔板于6r被储存在仪器内。利用制造商提供的原始软件分析扫描。本底扣除之后,利用三阶多项式校正非零基线。通过调整多峰曲线适合3个分离的转换,每个IgGl结构域的解折叠转换被去巻积。重组的IgGl和IgG4Fcy结构域被用于鉴别每个转换内的C2和CH3峰。剩余的转换假定符合该抗体的Fab部分的解折叠。17个抗体的大多数Fab部分在表观单个转换内解折叠,伴随热解折叠中点(TmS)从57到82。C变化,其依赖于每个个体Fv的独特性质。只有3个抗体,BIIB15,BIIB16,和BIIB17显示了4个转换。典型的IgGlDSC记录显示在图69A中。Fab部分的Cpmax(即,DSC峰值的高度)通常明显大于C2或CH3结构域的Cpmax。认为抗体内Fab蛋白质量比C2或者CH3结构域的蛋白质量高4倍,并且与其每个转换包含只一个单独同型二聚体连接面断裂的CH2和CH3结构域相反,抗体的Fab部分也包含4个结构域之间的隐藏表面区,这是合理的。一般而言,每个IgGl抗体的CH2和CH3结构域观察到的转换很好地重叠到另外一个上面。对于3IgG4s的CH2和CH3结构域,同样如此。由于这些原因,每个IgGl或IgG4分子的Fab转换容易被鉴定。一个抗体(BIIB18)没有被DSC研究。BIIB18表达很少并且从不产生可溶的/非聚集的物质。该抗体被包括在实施例16中描述的序列分析中。这些抗体中的一个,BIIB7,以人IgGl和lgG4形式都被分析。人IgGl和IgG4形式的BIIB7的表观Fab热稳定性,通过其热解折叠转换中点0m)检测,是非常相似的(见图69B)。保守结构域亚类的变异不影响FabTm或Fab解折叠量热焓。与IgG4Fc的C2和CH3结构域相应的重叠转换发生于明显比IgGl低的温度,并且人为地使Ig4的Fab转换看来低约1-2°C。一旦IgG转换完全被去巻积,FabTMs比它们在DSC记录中显示的更加"l妾近(厶TM《rC)。IgGl和IgG4形式的BIIB7的FabDSC曲线高度相似的事实表明IgGlFab和IgG4Fab的热稳定性是可以直接比较的。17个人源化BIIB抗体的DSC检测表明Fv区严重影响它们各自Fab的表观稳定性。例如,图70显示了从BIIB1,BIIB4,BIIB6和BIIB16获得的非常不同的DSC曲线。四个抗体都是IgGl,且它们之间仅有的序列差异存在于Fv区。所有17个抗体的CH2和C3DSC转换的位置和强度不依赖于它们连接于的Fab(见图70)。表20中上面的17个抗体的FabTMs的范围在57,2和81.6°。之间(+/-24.4°(:),BIIB1显示了最高的表观Fab稳定性,BHB7显示了最低的表观Fab稳定性。具有最低可检测FabTM值的三个抗体,BIIB15,BIIB16,和BIIB17,证实了Fab内的结构域解折叠转换之间的分离(见图70BIIB16的DSC曲线)。预期的Fab峰被分为两个分离的转位。较低的TM转换被列在表20中,但可以代表CHl/d.结构单元解折叠的另外的转换,对于BIIB15,BIIB16,和BIIB17,分別以Tms74,72和70。C发生。BIIB18被包括在本研究中,做为不表达和其VH序列明显不同于共有序列的抗体示例(见实施例16)。DSC分析清楚地表明个体的Fv-区独特的性质能够高度减少抗体的完整Fab部分的TMs。在BIIB15,BIIB16,和BIIB17的极端例子中,表观Fv稳定性足够低,以致Fab部分内的结构域的解折叠转换从另外一个解耦联。为了保持Fab全部四个结构域的解折叠的表观单个转换,可能有一个最小的总丁m限值(在此处描述的扫描条件下,对于IgGl>70°C),否则出现多个转换。分配BIIB15,BIIB16,和BIIB17的低温解折叠转换给Fv,另外的更高温的转换,给CHl/CL结构域,这是合适的。但是,Ewert和同事已经指出Vn/VL结构域解折叠不总是偶联的,并且可能依赖亚类,Vh/Vl穗定性,和Vn/VL互补性(Ewert等,J.Mol.Biol.325:531-553,2003)。事实上,很少具有共有序列来源框架的其VH/VLscFv构建物显示协作的解折叠。因此,作为转换解耦联,解折叠方案可能比简单地分为代表Fv-区和Ch1/Cl-区的两个转换更复杂,这是可能的。即使在两个亚类之间存在CH1序列和二硫键的实质上固有的差异,通过DSC检测的BIIB7IgGl和IgG4Fab的表观稳定性高度相似。对此有很多可能的解释,例如(l)不管CH1是IgGl或IgG4,Fv的生物物理学性质规定BIIB7Fab的热稳定性最高限度,(2)IgGl和IgG4之间C1/CL区的表观稳定性是相同的,或(3)CHl/Ct结构单元在DSC实验的时帧内不解折叠。以IgGl和IgG4形式,BIIB7Fab都以单一TM和相似的量热焓解折叠的事实表明潜在稳定性依赖于Fv,而不是保守区。表20.BIIBIgGFabTM值,VH和Vk评分和种系<table>tableseeoriginaldocumentpage222</column></row><table><table>tableseeoriginaldocumentpage223</column></row><table>J.Mol.Biol.335:41-48,2004)。为了获得由物种间进化漂移而成的多样性,哺乳动物的参考集首次被构建,其包括来自不同哺乳动物的V-基因。Vh哺乳动物参考集包括基本来自于NCBI和TIGR的61个Vh序列,其代表总共17个不同的哺乳动物物种。vk哺乳动物参考集包括53个来自13个不同哺乳动物物种的Vk序列。用于构建参考集(或用作测试序列)的人类Vh和VK序列是分别使用检索条件"人类抗体可变重链"和"人类抗体k可变轻链,,从NCBI数据库收集的。共182个人类V-基因序列,U4个Vh和68个Vk,从NCBI数据库中被半随机地选出,比较于人类Vh和Vk数据庠。通过NCBI数据库半随枳^cherry-挑选获得的人类VH和VK序列的亚类分布产生了基于自然种系VH或vk应用的预期亚类表征(Guigou等,1990),这表明从NCBI中选择了邻近序列中很少的偏性。通过3炎自Aho,sAmazingAtlasofAntibodyAnatomy互if关网站点的亚类共有序列的ClustalW比对,这些序列于是被分类到它们各自的可变区亚类(V1-VH7和VK1-VK4)。这些亚类又通过与可公开得到的人类种系序列比对被证实(Lefranc等,NucleicAcidRes.27,209-212,1999)。不超过5个来自任一多重序列NCBI提交的人类序列被包含在参考集内,以减少由引物系列或基于抗原的V-基因应用而引入的潜在偏性。序列收集首次完成;因此,亚类分型后有VH3和VK1序列的自然富集。使用25VH1,3VH2,44VH3,34V4,5VH5,3V7,29VK1,4VK2,19VK3和16VK4人类序列计算每个亚类的平均评分和标准差(在下文和表20中描述)。18个抗体中只有2个(BIIB5和BIIB14)包含具有最小亚族序列群体的Vh結枸域(即Vh2,Vh5或V7)。18个抗体中的4个(BIIB3,BIIB4,BIIB17和BIIB18)包含VK2亚类可变区,其亚类在序列空间内未被充分代表,且其评分精确度不明确。在人类vh序列参考集内没有自然的VH6序列被发现。这个并不重要,因为没有BIIB抗体构建物包含vH6结构域。18个BIIB抗体的可变区序列和从NCBI获得的182个人类Vh和Vk序列相对于哺乳动物抗体序列参考集^C评分。所有的VH和Vk序列在CDR3(共有序列YYC残基后面的两个残基)前被截短,以降低由V-(D)-J-C连接区的高变性导致的不可预知性。在哺乳动物数据库内每个位置的残基频率(pi(r)),通过数据库内每个残基位置上每个氨基酸(A,C,D...V,W,Y-)出现的次数加和,除以序列的总数量而被计算。使用下列公式评价每个人类V和VK测试序列的评分wore二〉~^-其中C/0)等于哺乳动物可变区数据库每个位置上共有残基频率,且hi(r)等于人类可变区测试序列的每个氨基酸的检验残基频率。哺乳动物数据库的共有序列理想的共有序列评分为V104和VK100。A.使用哺乳动物V-基因数据库给随机VH和VK序列评分VH和VK亚类共有序列对照哺乳动物数据库共有序列被评分并分别绘制在图71A和71C中。VH3亚类共有序列评分只比哺乳动物数据库共有序列假设的"理想"评分低1点,并且通过共3个残基不同于哺乳动物数据库共有序列。这样,哺乳动物数据库向VH3-样序列偏移是显然的。所有其它的人类vh亚类共有序列评分显著较低。哺乳动物VK数据库被发现向Vk4序列偏移(图71C)。人类或人源化的BIIB序列评分以人类NCB1序列可比较的亚类的性能为基础被分析。个体Vn序列评分的分布显示在图71B中,和个体vk序列评分的分布^皮显示在图71D中。B.BIIB1-BIIB18的评分结果18个BIIB抗体的Vh和VK评分被计算并与从NCBI人类V-基因序列参考集获取的相关数目比较(表20)。BIIBV-基因评分和平均亚类评分间的差异也包括在表20中。这些评分之间的差异被用于检测潜在的稳定性倾向。B1IB1到BIIB18以它们被测量的Fab稳定性的降序被标记。V-基因亚类和BIIBVh和VK基因的最接近的个体人类种系由ClustalW分析决定。获得18个BIIB抗体的基于共有序列的评分并与实验确定的Fab热解折叠分析相比较。具有BIIBV-基因评分和它们的平均亚类评分之间最大差异(即最低序列评分)的BIIB抗体与实施例15中测量的低FabTMS(表20,图72A)相关联。没有VK评分和DSC测量的TMs相关i[关的明显倾向(图72B)。事实上,最低评分的VK序列属于具有第二高表观Fab稳定性的的BIIB2。不常见的CDR氨基酸插入和缺失在BIIB15和BIIB16中,也在所有BIIB抗体中具有最低Vh评分和从不以可观察到的水平表达的BIIB18中发现。VH评分没有提示BIIB15和BIIB16的潜在稳定性问题;但是,它们的FabTMs是被检测的两个最低值(图72A)。BIIB15包含一个少见长的CDR1(在长度上有13个氨基酸,并比任何我们哺乳动物数据库内的VH3-样结构域或我们人类序列集内的VH3结构域长2个氨基酸),和BIIB16包含一个少见短的CDR2(在长度上有15个氨基酸,并比我们哺乳动物Vn数据库和我们人类vs参考集中的其它VH3CDR2中的绝大多数短1个氨基酸)。C.小哺乳动物序列数据库对于残基频率分析和BIIBFab的稳定性预测的有效性相对哺乳动物数据库的VH序列给BIIBVH结构域评分,-〖正实是确定每个Vn结构域内非最佳氨基酸丰度的有用工具,其可能反过来限制Fab的整体稳定性。该评分对于挑选出具有低稳定性和减少体外寿命及增加聚集率潜力的Fab是有用的。基于哺乳动物V-基因数据库观察到的亚类偏性,人们可能怀疑严格使用人类V-基因数据库来进行共有序列评分,其与此处应用的哺乳动物数据库相反,是否是最好的。但是,基于评分没有反映的大量决定稳定性的变数,例如非共有序列氨基酸的确切残基位置,Vh/Vl相互作用的强度,V-(D-)J-C连接的性质和超体的插入或缺失的发生率,很难相信一个全-人类VII的数据库会提供显著的进步。用于评分的一个严密的人类数据库可能还要求更大数量的序列,以匹配自然包括在哺乳动物数据库内的进化多样性。表明哺乳动物数据库方法工作良好的一项数据是人亚类共有区VH序列以它们的基因组亚类丰度和表观亚类应用的升序评分(Guigou等,1990;Teale和Medina,1992;Tomli励n等,1992)。哺乳动物Vu数据库看来适当地强调了人类VH亚类的全部贡献。每个Vh和VK亚类共有区序列通常比从NCBI挑选的绝大多数个别的和独特的人类序列评分高,这个事实表明哺乳动物数据库收集所有亚类的共有序列信息,尽管存在向VH3的偏移。因此,由于存在评分没有结合到的其它稳定性影响因素,在图72A中观察到的倾向不太可能通过微调用于评分的Vh序列数据庠而改善。V,,结构域内不常见的插入或缺失似乎对不被共有序列评分反映的稳定性有明显的效应。少见长(13个氨基酸)的BIIB15的CDR1和少见短(15个氨基酸)的BIIB16的CDR2可能是来自原始小鼠序列的人源化存留物。事实上,BIIB16VH序列与我们哺乳动物数据库内的也包含15个氨基酸CDR2的两个小鼠Vh序列排列接近。将不常见的小CDR强加到人类框架可能对该抗体的稳定性有负面影响。BIIB18不仅显示了所有BIIB序列的最低VH评分,而且包含了一个不寻常长的CDR2(22个残基,比较于通常19个氨基酸的最大值)。于是,认为诸多可能的问题固有存在于从来没有达到表达水平的BIIB18序列内并不奇怪,所述表达水平允许以非纯化上清进行的极粗糙生物学分析以外的任何生物学实验。BIIB15,BIIB16和BIIB18的结果表明,不常见的VH插入或缺失可能比大多数单个点突变对抗体热稳定性有更大的效应。基于涂草地扫视其序列,BIIB18异常弱的性能不能被预测,因为其Fv包含所有V-基因折叠内严格保守的"必要"氨基酸。具有利用几分细致的搜索挑选出棘手的抗体的能力是评分方法真正的实用性。当比较检测的Fab稳定性和VK评分时,没有明显的倾向。联合VK评分和V评分简单地降低了单独V评分观察到的倾向。不像V评分结果,人类VK共有序列评分不与VK种系和基因应用的自然丰度一致(Guigou等,1990;Meindl等,1990;Cox等,1994);即使所有共有序列评分自己都比它们各自的人类k亚类序列评分好(图72B)。这些从VK共有序列评分的预期顺序的偏离可能阻碍了哺乳动物数据库准确预测低稳定性VK结构域的能力,这只是推测。也没有足够的Vk2序列用于限定VK2亚类平均评分。在68个人类VK序列的亚类分布确定以后,只有4个是Vk2(其非常好地表現了Vk2的应用),.,尽管有这些缺点,该Vk結果仍然表明Vh基因更大的序列变异可能,多半,使VH结构域成为Fab的稳定性决定成分(Demarest等,2006)。尽管相反的例子能够在文献中获得(Rothlisberger等,2006)。1).稳定性依赖于VH或VL种系和VH/VL配对18个抗体中的多数包含重叠的种系V-基因,其CDR和超体突变不同,并且其Vh或VK配对相同或不同。这允许了抗体Fab稳定性和它们获自的各自种系间的比较。两个最稳定的Fab,BIIB1和BIIB2,具有相同的VhI和Vk1神系結合。基于Winter与同事的研究,VH和VK配对看来不具有明确固有的偏性,但被认为是"受体驱使"的(deWildt等,1999b)。BIIBl和BIIB2结合于相对不同的抗原,CCL2和VLA4;因此,结合或者随机发生或者是人源化的结果。在最不稳定的Fab,BIIB17和BIIB18的VH结构域内有非最佳氨基酸的明显的富集(即低序列评分和BIIB18包含一个不常见的插入)。这两个抗体也都包含相同的VK2种系,潜在地表明在基于VH的问题之上的轻链蛋白稳定性问题由评分来鉴定。有趣的进一步研究将确定是否该独特的VK2是造成这两个抗体弱生物物理学性质的原因。由于BIIB3和BIIB4也包含VK2亚类基因,VK2亚类通常与弱Fab稳定性没有联系。AB019438VH1种系(Lefranc等,1999)偶然出现了四次。这些Fab(BIIB12,BIIBll,BIIB7和BIIB3)的Tm-但从71.2到78.2变化。有趣的是,它们的Vw序列评分与它们的表观Fab稳定性有关(BIIB12〈BIIB1KBIIB7-BIIB3)。阳性的VH评分联系也被发现于上述具有相同VH1种系的BIIB1和BIIB2抗体。vh评分明显的不精确,不管怎样,^^都包含M99649Vh3种系的BIIB4和BIIB6观察到的阴性稳定性3f关系所强调。虽然成年人类中的VH种系家族的使用看来是很随机的,VH3家族包含了人类中的大多数成员。VH3或VH3-样基因在人类参考集和哺乳动物数据库中更经常地随机出现。Ewert和Pluckthun的结果证明源自共有序列的人类VH3序列是最稳定的获自共有序列的VH结构域(Ewert和Pluckthun,2003)。考虑到同其它亚类相比,VH3亚类具有更多的促成理想共有区产生的种系序列,这个结果可能不是完全出乎预料的。我们的稳定性数据表明包含VH3种系的IgG通常不表现更高的FabT『值。在稳定性列表的上端和下端,都有Vh3和Vh1亚类基因。尽管很多其它的因素,尤其是Fv内Vk相似物的性质,对Fab的整体稳定性起作用,如果VH3结构域一般而言比其它亚类更稳定,人们可以预料那些包含VH3亚类种系的Fab更高的Fab稳定性的倾向。这似乎不是来自此处描述的有限稳定性研究的范例。实施例17.Ig-折叠多肽的共变分析A.收集和滤过Ig-折叠结构Ig-折叠蛋白或来自于多结构域蛋白的Ig-折叠结构域的结构从ASTRAL数据库中,其包含与SCOP分类相匹配的结构域结构,被收集。免疫球蛋白特异的Ig-结构域在SCOP分类内的下述级别下被发现"所有的卩蛋白"—"免疫球蛋白-样(3三明治"—"免疫球蛋白"。在免疫球蛋白下,可获得四组结构"V组","C1组","C2组,,和"I组"。四个常^见下载扭卩本分别运行,以获得"V-级","Cl-级","l-级"和"C2-级"pdb文件。一旦每个亚家族的结构文件被下载,进行一些滤过以移除错误分类的,不完整的,多余的,或结构域-交换的结构(LiuY等,ProteinSci.(2002),1285-1299)。有4个主要的滤过步骤,描述如下步骤1清除有断裂的序列使用SwissPDB检视器,来自每个亚类的结构在视觉上被检查序列中的断裂(由于结构域交换,或者不能分辨密度或者部分缺失)。有缺陷的结构的PDB文件被手动从V-,Cl-,C2-,和I-级结构资料组中移除。步骤2.清除100%相同的序列PDB格式的结构被转换为FASTA格式的氨基酸序列,并且被滤过以移除或者与剩下的序列100%相同,或者与剩下的序列的子串完美匹配的任何序列。步骤3.清除长度异常的序列具有异常长或短氨基酸序列的PDB结构从结构资料组中被移除。长度cutoff标准通过检测所有序列长度的直方图确定(图74)。该直方图看起来有些呈正态分布。在离均数两个标准差以外的序列从每个亚家族资料组中被移除。免疫球蛋白超家族的残基整体平均数是106.10,标准差是12.19。所以,使用的总体cutoff值是<=81和>=131个残基。平均长度和标准差的分析统计显示在表21中。表21结构资料组的序列长度标准<table>tableseeoriginaldocumentpage229</column></row><table>步骤4.清除错误折叠的序列使用SwissPDB检视器,结构被从视觉上检查错误折叠。不符合两个卩-片层三明治拓朴的任何结构被清除。由于从SCOP只获得了5个C2-级结构域,C-2亚类Ig-折叠没有被进一步追踪。此后,C1-级被称为C-级。B.从结构比对获得序列比对对于每个单独的级别,使用Schr6dinger结构比对程序包内的二级结构匹配(见Schr6dinger指导产生重叠的基本程序文件),Ig-折叠结构被互相重叠的。重叠以"全部对全部"或"全部对一个"为基础进行。每个公式导致相似特性的比对,所以"全部对一个,,被选择用于重叠。一些重叠被修正,以确保每个结构的核心区而不是环状结构被重叠。该重叠于是被用于产生每个结构比对内的所有V-级,I-级,和C-级序列的基于结构的序列比对。以多肽骨架的a-碳原子之间的最短距离为基础,使用Schr6dinger程序包,通过匹配一个序列的氨基酸到另一个序列的氨基酸,实施每个序列比对于另一个序列。C.经专家注解的Ig-折叠序列数据库的构建建立许多确定的步骤以产生一个经专家注解的Ig-折叠数据集,用于计算坚固共变统计量步骤1.HMM框架的构建三个隐马尔可夫模型(HMM)框架被构建,各自以三个Ig-折叠分级中的一个的基于结构的序列比对为基础。该框架用HMMER软件包(版本1.8)创建,使用标准选项的"hmmbuild"和"hmmcalibrate"命令。这些HMM于是用于检测和比对保留在NCBI中的NR-数据库内附加的Ig-折叠序列。步骤2.使用新的V-,I-,和C-级HMM框架搜索NR三个级别-特异性的HMM被用于在本地NR数据库中搜索相似的序列。NR数据库是包含约3百万非冗余蛋白序列的大文件。对于V-,I-,和C-级HMM的每一个,HMMER命令"hmmsearch"被用于搜索NR。每次输出通过与使用的HMM相关的其评分排序,并提供关于HMM击中区的数量和每个NR序列内击中区位置的信息。对于每个Ig-折叠级别-特异性HMM搜索,在推荐的标准评分阈值之上的击中NR序列被保留为其HMM被使用的Ig-折叠级别的候选成员。对于那些是NR序列的子序列的击中区,使用自定义程序,从整个NR序列中提取出击中的确切NR子序列。步骤3.使用PFAM验证Ig-折叠分级的排布PFAM是蛋白家族和结构域分类工具,在WellcomeTrustSanger研究所产生和保存(Fin等,Nuc.Acids.Res.,(2006),34:D247-D251),其可以用于个体的蛋白序列。Pfam工具"pfamverify"用于从上述步骤2中获得的每个Ig-折叠候选序列,以确证通过从基于结构的序列比对中产生的Ig-折叠级别-特异性的HMM,其4皮正确分类。PFAM的Ig-族HMM框架(包括V-,1-,Cl-,C2-,和较小特异性的IgHMM)从PFAM网站下载。来自NR的每个序列通过Ig-族HMM被评分,揭示每个序列符合每个PFAMHMM的程度。评分在V-,I-,或C-分级推荐的cutoff值(TC1-在PFAM网站上规定)以下的序列从各自的序列集中被清除。这样,只有其PFAM评分验证了它们的Ig-折叠分级的排布,在步骤2中发现的候选分级-特异的Ig-折叠序列才被保留。步骤4.比对新的Ig-折叠序列用HMM搜索从NR中选出的,并在上述步骤3中幸存的Ig-折叠序列,接下来比对于其排布级别的我们自定义的HMM。由于这些HMM已经以仔细的结构比对为基础,这个过程保证了新序列的结构引导的比对。HMMER程序包被用于产生fasta输出格式的"mapali"比对,其被用于下述的序列共变工具。该比对也以"Stockholm,,输出格式输出,并且检查异常的或错误排布的序列,其被手动略去。结果序列,包含原始的结构-比对的序列和来自NR的附加的HMM-比对的序列,包含下列凄t目的序列V-级约50,000;C-级约10,000;I-级约10,000。步骤5.清除冗余的或相似的序列我们料想这些比对偏向经常观察到的序列,伴随未被充分代表的少有序列和序列多样性必然的掩蔽。例如,我们预期在V-级Ig-折叠序列比对中向小鼠和人类免疫球蛋白可变区的巨大偏移。由于特殊序列类型的超额代表限制了共变分析的有效性,建立了滤过工具并用于减少比对的冗余度。该工具使用新的启发式的运算规则来找到与其它序列有>80%相同的序列,并从比对中将它们清除。简要地,计算所有序列配对的同一性百分比。同一性值于是被分组为同一性百分比群(即99%群,98%群,97%群等)。在简化每个群的过程中,每个群里的序列通过减少非间断残基计数,然后通过其henikoff序列重量被排序(HenikoffS和HenikoffJG,J.Mol.Biol,,(1994),243:184-199)。这个步骤之后,每个比对中的序列剩余数量为V-级2,786;I-级1,587;和C-纟及518。步骤6.清除断裂以产生最终的比对在最终的比对中,在用于寻找这些序列的HMM框架中(见HMMER指南),与状态不匹配的列被清除。因此,当很多序列包含比最终的比对长度更多的氨基酸,长度被截短以避免计算比对的提供信息较少的断裂区。在比对中残基(包括断裂)的最终数目是V-级144,1-级60,和C-级lll。D.最终比对的概述a)V-级231最终的80%滤过实施后,2,786个V-级序列能够被分成三类(l)免疫球蛋白可变基因类,49%,其包括不同免疫球蛋白的Vh和Vt两个结构域;(2)T-细胞受体V-级基因,16%,其包含超变结构域;和(3)其它的V-级基因,35%。免疫球蛋白V-级基因来自于从软骨鱼到灵长类的大量的各种各样的物种。出现了向人类V-级序列(1272个序列中的537个)的偏移。但是,其它的脊推动物物种只被最低程度地代表小鼠(33),奶牛(5),骆驼(23),美洲驼羊(31),短尾猴(17),小鸡(6)等。T-细胞受体集的序列几乎是多种多样,从鱼到灵长类变动,不包含向人类序列的偏移。"其它"种类包含大量的不同序列,不具有真正的子类目,包含超过1-2%的剩余序列。"其它"种类包含甚至更广系列的物种,包括脊索动物(原始的),软骨鱼,头足动物,和昆虫。b)C-级最终的80%滤过实施后,518个C-级序列能够被分成三类(l)免疫球蛋白保守结构域,44%;(2)MHC-类Ig-折叠,21%;和(3)其它的C-级Ig-折叠,35%。免疫球蛋白保守结构域类包含从软骨鱼到灵长类的不同的序列。C-级免疫球蛋白子类目不向灵长类甚至哺乳动物序列偏移(只有3个人类序列保持未被过滤IgE-CH4,kCl,和XCl)。MHC子类目也从软骨鱼到灵长类变动,也显示很少的向一个进化组的偏移。"其它,,C-级分类包含很多未知的蛋白,不同(3-2-微球蛋白的一个非常小的子类目,和很多不能以够得上一个子类目的频率观察到的其它蛋白。c)I-级I-级不具有任何明确的子类目。titan或titan-样分子通常偶然出现,象细胞粘附或细胞粘附-样分子一样,共变统计学的计算以本领域公知的方法为基础,比对内的所有可能的氨基酸配对之间的共变的相关性强度(以cp值的方式)和显著性(以f值的方式)被计算,但包括下述的变异l)包括断裂,做为特殊的残基类型;(2)Henikoff加权方式没有实施;(3)序列平均同源性(SAI)没有用于滤出共变对;(4)f值计算使用基于事件的计数,而不是频度;和(5)共变对不被该程序报告,除非它们被观察到的次数达到一个最小值。建立了两个统计学主体,第一个(较小集)的事件cutoff值为10,另外一个(更大的集)的事件cutoff值为6件。计算任何给定序列比对的这些参数的能力被编码到Java可执行包,并用Java虚拟机(JRE)版本1.4.2一企测。以该比对内的位置数量和在每个位置上总共23个可能的残基(包括断裂,B和Z不明确的残基)为基础,C-级计算的相关性有2,400,000,I-级计算的为700,000,V-级计算的为4,100,000。图75显示了V-级计算的具有高X2显著性的的cp值。cp值在-l到+1之间变化。由于阳性的cp值从O离开(即朝向+l),在比对内确定位置的两个氨基酸之间的相关性强度(即共变)增加。当cp值移向-l,阴性的相关性(即在比对的一个位点出现一个氨基酸,迫使在另外一个位点缺失另一个特异的氨基酸)增加。正真共变的cutoff值是有几分随意的,但cp值〉0.5的那些与另夕l、一个强烈相关。这样,根据图75,C-级中可能的2,400,000相关性中只有370是强烈的。但是,0.3以上的相关性已经被报道为重要的,并且会增加所有三个分级观察到的阳性相关性的数量约10倍。这些相关性代表了用于进一步研究,产生蛋白设计,或预测功能残基位置的数据集很小的,但是重要的部分。F.共变统计学的验证有几个标准用于验证来自于Ig-折叠数据库的强共变是显著地和有意义地远离基于计算的统计学强度的。第一个是分析是否有与另外残基共变的残基之间的倾向和其在已知结构的Ig-折叠中的相似性。文献中以前的研究已经证实了共变位置间的相关性和其相互的近似性确实存在-尽管很微弱-与我们的结果一致。另外一个标准看Ig-折叠共变计算是否产生了氨基酸位置间的已知联系,其已经被报道存在于已知的Ig-折叠亚类内。一个明确的检测用例是在人类/小鼠IgG可变重链折叠(V-级的一部分)的N-末端。残基6-10已知采取非常特异的构象,其基于氨基酸共变对的保守(EwertS等,Methods,(2004),24:184-199)。三个已才艮道的共变氨基酸对中的两个被发现具有0.3以上的(p值-明显高于数据集的表观背景。实施例18.包含保守p5E8scFv的PRIMATIZEDp5E8四价抗体的制备PRIMATIZEDp5E8Gl是一个嵌合的短尾猴/人(PRIMATIZED⑧)单克隆抗体,包含分别融合于人y1和k保守区的短尾猴重链和轻链可变区。PRIMATIZEDp5E8Gl结合于IgE的低亲和力受体人CD23(FcdlII)(Mavromatis和Cheson.2003丄Clin.Onco1.21:1874;美国专利申233请20030059424)。使用与实施例1-8中描述的策略相似的策略构建四价的PRJMATIZEDp5E8抗体。用于构建该四价抗体的的PRIMATIZEDp5E8scFv包含p5E8的VL和VH区序列,其以VL—(Gly4Ser)3连接子—VH的方向通过一个短连接子连接,并在实施例19中更详细地描述。通过DNA序列分析确定正确的序列。质粒DNA被用于转化CHODG44细胞,以稳定生产抗体蛋白。图80显示包含保守scFv的重链C-末端四Y介PRIMATIZEDp5E8抗体的DNA序列。图81显示包含保守scFv的重链C-末端四价PRIMATIZEDp5E8抗体的氨基酸序列。图82A显示PRIMATIZEDp5E8轻链的DNA序列。图82B显示PRIMATIZEDp5E8轻链的氨基酸序列。实施例19.PRIMATIZEDp5E8scFv和Fab蛋白的制备两个方向的(VL—(Gly4Ser)3连接子—VH(VL/VH)和VH—(Gly4Ser)3连接子—VL(VH/VL))的PRIMATIZEDp5E8scFv是通过从美国专利申请20050163782中描述的质粒进行PCR扩增亚克隆的。构建中使用的寡核苷酸显示在表22中。使用包含编码部分gpIII前导序列的29个碱基,跟随序列互补于p5E8N-末端轻链可变区基因的15个碱基的正向引物p5E8-VL01F,和负向引物,p5E8-VH01R,其包含序列互补于p5E8C-末端重链可变区的15个碱基,跟随一个特异的毗邻的SaI核酸内切酶位点(核酸内切酶位点加下划线),通过PCR构建PRIMATIZEDp5E8scFv(VL/VH)。相似地,使用包含编码部分gpIII前导序列的29个碱基,跟随序列互补于p5E8N-末端可变重链结构域基因的18个碱基的正向引物p5E8-VH01F,和负向引物,p5E8-VL01R,其包含序列互补于p5E8C-末端可变轻链结构域基因的12个碱基,跟随一个特异的毗邻的SaI核酸内切酶位点(核酸内切酶位点加下划线),通过PCR构建PRIMATIZEDp5E8scFv(VH/VL)。表22.PCR扩增保守的PRIMATIZEDp5E8scFv的寡核普酸<table>tableseeoriginaldocumentpage234</column></row><table><table>tableseeoriginaldocumentpage235</column></row><table>PCR扩增之后,引物p5E8-Leader01被加入到两个反应中,用于第二次PCR反应。引物p5E8-LeaderOl包含特异的NdeI核酸内切酶位点,跟随编码gpIII前导序列N-末端部分的25个碱基,跟随互补于p5E8-VL01F和p5E8-VH01F的5,末端的22个碱基,再次PCR扩增。符合预期大小的PCR产物通过琼脂糖凝胶电泳分辨,切除,使用MilliporeUltrafree-DA提取试剂盒,根据制造商(Millipore;Bedford,MA)的说明书,纯化。纯化的PCR产物接着用Ndel和Sal消化,并且克隆到修饰的大肠杆菌表达载体的Nde1/SaI位点,该载体被设计用于在可诱导的araC启动子的控制下驱动重组蛋白表达。该表达载体包含编码重叠于BHA10scFv的起始密码子的特异NdeI位点的修饰。用每个胶纯化PCR产物和消化的表达载体实施各个连接反应,每个连接混合物的一部分用于转化大肠杆菌抹XL1-Blue。氨比西林药物抗性的克隆纟皮筛选,并且DNA序列分析确证最终的编码PIEH-162的p5E8(VH/VL)和编码PIEH-163的p5E8(VL/VH)构建物的正确序列。p5E8(VL/VH)scFv的DNA和氨基酸序列分别显示在图83A和图83B中。p5E8(VH/VL)scFv的DNA和氨基酸序列分别显示在图84A和图84B中。为了表达常规p5E8scFv,如实施例4中描述的那样,转化了质粒Plh:H-162和PlEH-163的大肠杆菌才朱W3110(ATCC,Manassas,Va.号#27325)的新鲜分离克隆被培养,并且制备培养上清或者胞质提取物。通过酶消化PRIMATIZEDp5E8IgG,接着用实施例1中描述的方法,制备PRIMATIZEDp5E8Fab。纯化的Fab被浓缩到2-1Img/mL之间。Fab浓度-使用s280nm=1.5mLmg"cm"确定。实施例20.常规p5E8scFv抗体的热稳定性由于在使用实施例4和5中描述的热挑战试验获得的T50值和通过DSC分析(r2=0.93)计算的Tm值之间观察到了很好的相关性,热挑战试验被用于评价p5E8(VL/VH)和p5E8(VH/VL)scFv的相对热稳定性。热挑战试验如实施例4和5中描述的那样被应用,除了l吗/ml的可溶CD23抗原被用于包#皮4反和Eu-标记的抗-6His抗体(PerkinElmer,Boston,MA,货号弁AD0109)的浓度被增加到250ng/ml。该试验的结果确定了p5E8(VL/VH)的T50值为38。C,p5E8(VH/VL)稍低,在34。C(图85)。鉴于两个scFv非常低的T50值和两个p5E8中的那个(VL/VH)稍微更热稳定的观察,p5E8(VL/VH)被选择用于进一步的稳定性工程。实施例21.具有改进热稳定性的p5E8scFv分子的构建用实施例3和5的方法设计的、在常规p5E8scFv(VL/VH)中包含所需氨基酸替换的变体和文库,用表23中列出的寡核苷酸按前述创建。在表23中,根据Kabat编号系统,每个寡核苷酸的名称提供了VH或VL的位置上氨基酸取代的参考。"原理"指应用的设计方法。所述方法在前面实施例5中详细地描述。诱变残基以大写字母显示。用于引入VH/VL二硫化物的寡核苷酸对被框入。缩写为"COMP"-计算分析,"COVAR"-共变分析,"CONS"-共有序列评分,"INTER-VH/VL"相互作用设计,"SS"-VH/VL二硫键,和"TBD"-待确定地。表23.用于构建变异的p5E8(VL/VH)scFv变体的寡核芬酸和原理寡核香酸名原理序列+SEQIDNO:VH—E6QCOMPgaggtgcagctggtgCagtctgggggcggcttg76VH—L"SDGCOMPgagtctgggggcggcRRCgcaaagcctgggggg77VHA12VKK13QER—COVARgtctgggggcggcttgRHGKAGcctggggggtccctg78VH—N32SCONSgttcaggttcaccttcAGCaactactacatggac79VH_D35bHSNINTERcaataactactacatgMRCtgggtccgccaggctc80VHQ43KRCOVARcgccaggctccagggARGgggctggagtgggtc81VH_S49GACOVARgggctggagtgggtcGSCcgtsttagtagtagtg82VH一I51MCOMPgagtgggtctcacgtatGagtagtagtggtgatc83VLQ37ACOMPggtattatttaasttggtatGCCcagaaaccaggaasag84VH一D55GSCONSgtattagtagtagtggtRGCcccacstggtacgcaig85VH一P56STDCONSgtagtagtggtgatRVCacatggtacgcagac86VHW58YNINTERgtggtgatcccacaWACtacgcagactccgtg87VH_E72DNCOVARgattcaccatctccagaRACaacgccaagaacacac88VH—A74SCOVARcatctccagagagaacAGCaagaacacatctgtttc89VHF79丫SVCOVARgcca5Lga_acaca_ctgKHCcttca_a_atga_3cagc90VH—Q81ECOMPgaacacactgtttcttGfaaatgaacagcctgagag91VHA84GCOMPcaaatgaacagcctgagaGGCgaggacacggctgtc92VH—V89AGTCOMPgagetgaggacacggctRSCtattactgtgcg93VHS94RKCONSgtctattactgtgcgARGttgactacagggtctg94VHV107TCOVARTBDVHL108AGSCOMPTBDVHT110VSCOVARTBD<table>tableseeoriginaldocumentpage237</column></row><table>十诱变的目标位置用下划线表示。不确定的碱基缩写如下W二A或T,V-A或C或G,Y-C或T,S-C或G,M二A或C,N-A或C或G或T,R^A或G,K-G或T,BC或G或T(JBiolChem.261(1):13-7(1986))。根据实施例5中详述的方法,个体的转化克隆被挑选至深孔的96孔盘中,处置,和筛选。转化体在包含SB(Teknova,HalfMoonBay,Ca.货号#S0140),添加0.6%的甘氨酸,0.6%的TritonXI00,0.02%的阿拉伯糖和5(Vg/ml羧节西林的表达介质中,在37X:或者32。C,生长过夜热挑战后,聚集的物质通过离心被移除,并且如实施例3中描述的那样在可溶的CD23DELFIA中分析。分析数据使用SpotfireDedsionSite软件(Spotfirc,Somerville,Ma.)处理,并且表达为每个克隆在激发温度与参考温度观察到DELFIA计数的比例。重复产生高于或等于亲代质粒观察到的比例两倍的比例的克隆被认为是击中物。来自这些阳性克隆的质粒DNA通过mini-prep(WizardPlus,Promega,Madison,WI)^皮分离,并且再4争4匕回大肠杆菌W3110,用于证实第二次热4兆战试验,也用于DNA序列确定。来自这些分析的初始和确证的结果在表24中显示。当与常规p5E8scFv相比时,本发明中几个稳定化scFv分子致成结合活性的改进(Ts(^38。C)。尤其,p5E8库位置VH6(E6Q),库位置VH49(S49G和S49A),库位置VH43(Q43K),库位置VH72(E72D和E72N),和库位置VH79(F79S)的T50值,相对于常规p5E8scFv,显示了从+4。C到+5°C的热稳定性的增力口。p5E8库位置Vl50(V50D和V50S),库位置VL75(V75I),库位置VL80(P80S),和庠位置Vl83(F83A,F83G,F83S和F83T)的Ts。值,相对于常规p5E8scFv,显示了从+3。C到+7。C的热稳定性的增加。另外,相对于常规p5E8scFv,p5E8库位置VH32(N32S)和库位置Vh79(F79Y)的Ts()值显示了+2°〇的热稳定性的增加。使用实施例5中描述的各种各样的设计方法,稳定化突变被鉴定-VH6(H6Q),VL75(V751),Vl80(P80S)和Vl83(F83A,F83G,F83S和F83T)突变使用计算分析获得,V32(N32S)突变使用共有序列评分获得,四个突变V49(S49G和S49A),VH43(Q43K),VH72(E72D和E72N),VH79(F79S和F79Y)突变使用共变突变获得,Vl50(V50D和V50S)突变使用VH/VL相互作用分析获得,验证了这些设计工具的有效性和新颖性。Vh43Q和VH32S突变与Vn49G,VH72D,或V49A稳定化的突变结合提高了p5E8的热稳定性(丁50)到53。C,相对于常规p5E8scFv,增加了15°C。表24.p5E8VH和VL库位置,,库组成,和筛选结果<table>tableseeoriginaldocumentpage238</column></row><table>表25显示了引入到保守scFv中的不同个体的和联合的稳定化的突变的广泛热稳定性分析结果。稳定化突变被鉴定,其基于联合,显示了相对于常规p5E8scFv,从+l(TC到+15°C的热稳定性的增加。这些结果证明,与实施例5中显示的相似,活性的改进是累积的,并且本发明中描述的方法能够改进第二次检测的scFv的热稳定性质,证明了这些方法的普遍有效性。表25用于产生不同蛋白的p5E8构建物的特性和来自于热挑战试验的<table>tableseeoriginaldocumentpage239</column></row><table><table>tableseeoriginaldocumentpage240</column></row><table>na=未应用aa=氨基酸TBD=待确定的实施例22.稳定的p5E8四价抗体的生产本发明中稳定的p5E8scFv被用于构建四价抗体,N-末端和C-末端scFv的融合在构型上都与图13中显示的相似。A.NH-p5E8四价抗体的构建与在前的实施例7中描述的相似,实施例21中描述的p5E8scFvDNA被用于构建NH-p5E8四价抗体。一个(Gly4Ser)s连接子被用于连接p5E8scFv到PRIMATIZEDp5E8IgG重链的成熟氨基端。分子的结构是p5E8sd-(Gly4Ser)5连接子-PRIMATIZED⑧p5E8IgG重链。该分子与轻链装配以形成四价抗体。正确的序列通过DNA序列分析确证。该构建物可以用于转染CHO细胞,如实施例8中描述的那样,以放大生产NH-p5E8四价抗体。通过I)KLFIA分析,可以筛选结合于固定的CD23抗原的转染CHO细胞。%孔4反,例如(MaxiSorp,NalgeNunc,Rochester,NY,货号#437111),可以用PH9.5,O.IM碳酸钠緩冲液中的l吗/ml的可溶CD23抗原包被,板在4。C被包被过夜,用DELFIA分析緩沖液(DAB,l0mMTrisHC1,150mMNacl,20MmEDTA,0.50/。BSA,0.02%Tween20,0.01%NaN3,PH7.4)在室温摇动封闭一小时。板用没有BSA的DAB(清洗緩冲液)清洗3次,在DAB中稀释的检测样品以终体积lOO(il加入到板中。该板在室温摇动孵育一个小时,然后用清洗缓冲液洗涤3次以清除未结合的物质。结合抗体通过加入每孔lOOfil包含250ng/mlEu-标记的抗-人抗体(PerkinElmer,Boston,MA,货号#1244-330)的DAB并且在室温摇动孵育一小时被检测。该板用清洗緩冲液洗涤3次,并且每孔加入100plDELFIA增强液(PerkinElmer,Boston,MA,货号#4001-0010)。孵育15分钟之后,在Victor2读板仪(PerkinElmer,Boston,MA)上利用Europium方法读寺反。B.C-p5E8四价抗体的构建在前的实施例21中描述的p5E8scFvDNA,如在前的实施例7中描述的那样,被用于构建C-p5E8四价抗体。一个(Gly4Ser)3连接子肽被用于连接p5E8scFv到RIMATIZEDp5E8IgG重链的羧基端。分子的结构是PRIMATIZEDp5E8IgG重链-(Gly4Ser)3连接子-p5E8scFv。该分子与轻链装配以形成四价抗体。正确的序列通过DNA序列分析确证。该构建物可以用于转染CHO细胞,如实施例8中描述的那样,以放大生产C-p5E8四价抗体。如上所述,转染的CHO细胞可以被筛选。等效方案本领域技术人员会识别,或能够确定,仅使用常规实验,在此描述的本发明的特殊实施例的很多等效方案。这些等效方案将被后面的权利要求包括。24权利要求1.稳定化scFv分子群,其中所述稳定化scFv分子包含i)插入VH结构域和VL结构域之间的scFv接头,其中VH和VL结构域由VH结构域中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中scFv分子的VH和VL结构域具有大于55℃的Tm值;或ii)插入VH结构域和VL结构域之间的scFv接头,其中VH和VL结构域由VH中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中scFv分子具有大于49℃的T50。2.稳定化scFv分子,其包含i)具有插入VH结构域和Vi结构域之间的氨基酸序列(Gly4Ser、的scFv接头,其中Vh和VJ吉构域由VH位置44的氨基酸和VL位置100的氨基酸之间的二硫键连接;ii)Vh結枸域和Vt结构域,其中该分子具有至少一个选自由如下所组成的组的替换a)在VH的Kabat位置13上替换氨基酸;b)在VH的Kabat位置16上替换氨基酸;c)在VL的Kabat位46上替换氨基酸;d)在VL的Kabat位置49上替换氨基酸;e)在VL的Kabat位置50上替换氨基酸;f)在VL的Kabat位置49和50上替换氨基酸;g)在VII的Kabat位置101上替换氨基酸;h)在VH的Kabat位置20上替换氨基酸;i)在VH的Kabat位置48上替换氨基酸;j)在VL的Kabat位置3上替换氨基酸;k)在Kabat位置55上替换氨基酸;l)在VH的Kabat位置67上替换氨基酸;m)在VH的Kabat位置6上替换氨基酸;n)在VH的Kabat位置32上替换氨基酸;o)在VH的Kabat位置49上替换氨基酸;p)在VH的Kabat位置43上替换氨基酸;q)在VH的Kabat位置72上替换氨基酸;r)在VH的Kabat位置79上替换氨基酸;s)在VL的Kabat位置50上替换氨基酸;t)在VL的Kabat位置75上替换氨基酸;u)在VH的Kabat位置80上替换氨基酸;v)在VH的Kabat位置83上替换氨基酸;或iii)带有位于scFv的VH和VL之间的稳定化界面的VH结构域和VL结构域,其中该分子在直接位于所述界面内的氨基酸位置上和/或在支撑VH和VL间相互作用的氨基酸位置上具有至少一个替换,其中该至少一个氨基酸位置选自由如下所组成的组按照Kabat编号的47H,37H,45H,46H,51H,59H,109H,14H,26H,27H,40H,69H,103H,29H,38H,44H,49H,55H,63H,54H,68H,72H,74H,79H,82bH,8H,32H,39H,41H,62H,85H,91H,24H,60H,37L,36L,44L,59L,57L,64L,46L,48L,63L,67L,68L,39L,45L,47L5礼,56L,79L,85L,亂,58L,74L,77L,83L,89L,和104L,3.权利要求2的稳定化scFv分子,其在热挑战条件下具有等同于常规Fab片段的稳定性。4.融合蛋白,其包含权利要求2的稳定化scFv分子。5.稳定化多价抗原结合分子群,其中所述稳定化结合分子包含至少一个稳定化scFv分子,其包含插入VH结构域和VL结构域之间的scFv接头,其中Vn和VJ吉构域由Vw中的氨基酸和VL结构域中的氨基酸之间的二疏键连接,而且其中所述稳定化结合分子群包含单体的可溶蛋白,这种蛋白中不超过10%以聚集形式呈现。6.权利要求5的群,其中所述稳定化多价抗原结合分子在CHO或NS0细胞中表达。7.稳定化多价抗原结合分子群,其中每个多价抗原结合分子包含i)至少一个scFv分子,其包含插入VH结构域和VL结构域之间的scFv接头,其中VH和VL结构域由VH中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中至少一个scFv分子的Vh和VL结构域具有大于55。C的Tm^直;或ii)至少一个scFv分子,其包含插入VH结构域和V^结构域之间的scFv接头,其中VH和VL结构域由VH中的氨基酸和VL结构域中的氨基酸之间的二硫键连接,而且其中多价抗原结合分子的至少一个scFv分子具有大于490C的T50。8.稳定化多价抗原结合分子,其包含i)至少一个稳定化scFv分子,其包含插入VH结构域和Vj吉构域之间的(Gy4Ser)nscFv接头,而且其中VH和VL结构域由二硫键连接;ii)至少一个稳定化scFv分子,其包含scFv接头,所述接头具有插入Vu结构域和VL结构域之间的氨基酸序列(Gly4Ser)n,其中VH和V,J吉构域由由V位置44的氨基酸和VL位置100的氨基酸之间的二硫键连接;iii)至少一个稳定化scFv分子,其中该稳定化scFv分子包含至少一个选自由如下所组成的组的替换a)在VH的Kabat位置13上替换氨基酸;b)在VH的Kabat位置16置上替换氨基酸;c)在VL的Kabat位置46上替换氨基酸;d)在VL的Kabat位置49上替换氨基酸;e)在VL的Kabat位置50上替换氨基酸;f)在VL的Kabat位置49和50上替换氨基酸;g)在VH的Kabat位置101上替换氨基酸;h)在VH的Kabat位置20上替换氨基酸;i)在VH的Kabat位置48上替换氨基酸;j)在VL的Kabat位置3上替换氨基酸;k)在VH的Kabat位置55上替换氨基酸;1)在VH的Kabat位置67上替换氨基酸;m)在VH的Kabat位置6上替换氨基酸;n)在VH的Kabat位置32上替换氨基酸;o)在VH的Kabat位置49上替换氨基酸;p)在VH的Kabat位置43上替换氨基酸;q)在VH的Kabat位置72上替换氨基酸;r)在VH的Kabat位置79上替换氨基酸;s)在VL的Kabat位置50上替换氨基酸;t)在VL的Kabat位置75上替换氨基酸;u)在VH的Kabat位置80上替换氨基酸;v)在VH的Kabat位置83上替换氨基酸;或iv)带有位于scFv的VH和VL之间的稳定化界面的VH结构域和VL结构域,其中该分子在直接位于所述界面内的氨基酸位置上和/或在支撑VH和VL间相互作用的氨基酸位置上具有至少一个替换,其中该至少一个氨基酸位置选自由如下所组成的组按照Kabat编号的47H,37H,45H,46H,51H,59H,109H,14H,26H,27H,40H,69H,103H,29H,38H,44H,49H,55H,63H,54H,68H,72H,74H,79H,82bH,8H,32H,39H,4111,62H,85H,91H,24H,60H,37L,36L,44L,59L,57L,64L,46L,48L,63L,67L,68L,39L,45L,47L,54L,56L,79L,85L,98L,58L,74L,77L,83L,89L,和04L。9.权利要求8的多价抗原结合分子,其中该至少一个稳定化scFv分子通过基因工程与抗体融合。10.权利要求8的多价抗原结合分子,其中两个稳定化scFv分子通过基因工程与抗体融合。11.权利要求9的多价抗原结合分子,其中该至少一个稳定化scFv分子通过基因工程与抗体轻或重链的羧基末端融合。12.权利要求9的多价抗原结合分子,其中该至少一个稳定化scFv分子通过基因工程与抗体轻链或重链的氨基末端融合。13.权利要求8-12之一的多价抗原结合分子,其包含至少一个结合位点,该位点优先结合癌细胞表面表达的分子。14.权利要求8-12之一的多价抗原结合分子,其中该分子与选自由下列所组成的组中的抗原结合HERl,HER3,CD80,CD86,PD-1,CTLA4,B7-H4,RON,CD200,CD4,BAFR,EGFR,IGFR,VEGFR,受体的TNF家族成员,Tie受体,MET,IGF1,IGF2,TNF,TNF配体,IL-6,TWEAK,l:nl4,CD20,CD23,CRIPTO,HGF,alpha4betal整耳关蛋白,alpha5betal整联蛋白,alpha6beta4整联蛋白,和alphaVbeta6整联蛋白。15,权利要求8-12之一的多价抗原结合分子,其包含至少一个结合位点,该位点结合参与调节免疫应答的分子。16.权利要求8-12之一的多价抗原结合分子,其包含至少一个结合位点,该位点结合参与调节血管生成的分子。17.权利要求8-12之一的多价抗原结合分子,其包含至少一个结合位点,该位点结合神经学把位。18.权利要求8-12之任一的多价抗原结合分子,其是多特异性的。19.权利要求8-12之任一的多价抗原结合分子,其是双特异性的。20.权利要求19的多特异性抗原结合分子,其结合TNF受体家族的两个成员。21.核酸分子,其包含编码权利要求2或3的稳定化scFv分子的核普酸序列或其互补体。22.权利要求21的核酸分子,其在载体中。23.宿主细胞,其包含权利要求22的载体。24.权利要求23的宿主细胞,其中细胞是CHO细胞或NS0细胞。25.权利要求23的宿主细胞,其表达包含scFv分子的结合分子群,该群与表达含常规scFv分子的结合分子群的宿主细胞相比,聚集物至少少10%。26.产生稳定化结合分子的方法,包括在使稳定化结合分子产生的条件下培养权利要求23的宿主细胞。27.权利要求26的方法,其中每升宿主细胞培养基产生至少10mg稳定化结合分子,而且其中不超过10%的结合分子以聚集形式呈现。28.治疗受试者的方法,所述受试者是会受益于用权利要求8-12之一的结合分子治疗的受试者,所述方法包括向受试者给药所述结合分子以进行治疗。29.权利要求28的方法,其中受试者患有选自由癌、自身免疫性疾病或病症、和神经学疾病或病症所组成的组的疾病或病症。30.稳定scFv分子的方法,其包括用(Gly4Ser)nScFv接头通过基因工程将Vn结构域和VL结构域融合,并改造VH结构域使之在位置44的氨基酸上包含半胱氨酸和改造Vf」结构域使之在氨基酸100位上包含半胱氨酸,从而形成稳定化scFv分子。31.制备包含稳定化scFv分子的稳定化多价抗体的方法,该方法包括通过基因工程将稳定化scFv分子与抗体分子轻或重链的氨基末端或羧基末端融合。32.制备稳定化scFv分子的方法,包括替换scFv分子的VH/VL界面中的至少一个氨基酸和/或替换支撑scFv分子的VH/VL界面的至少一个氨基酸,其中所述替换使scFv分子的VH结构域和VL结构域两者的热稳定性都比常规scFv分子的提高。33.制备稳定化scFv分子的方法,包括替换VH结构域或VL结构域中的至少一个氨基酸,该氨基酸与位于所述VH和VL结构域之间界面上的两个或多个氨基酸一起变化。34.制备含scFv分子的稳定化融合蛋白的方法,包括替换scFv分子的VH/VL界面中的至少一个氨基酸和/或scFv分子的VH/VL支架中的至少一个氨基酸,并通过基因工程将所述scFv分子与多肽融合,由此制备稳定化融合蛋白。35.改善含至少一个scFv分子的多价分子的稳定性的方法,该方法包括将至少一个稳定化突变导入至少一个scFv分子中,由此改善多价分子的稳定性。36.大规模制备稳定化融合蛋白的方法,该方法包括(a)提供至少一个候选scFv分子;(b)将所述至少一个候选scFv分子的热稳定性与合适对照比较,以鉴定出至少一个比该对照热稳定性增加的稳定化scFv分子,(c)选择步骤(b)中鉴定出的至少一个稳定化scFv分子;(d)通过基因工程将所述至少一个稳定化scFv分子与蛋白质融合,以形成稳定化融合蛋白;(e)用编码所述稳定化融合蛋白的核酸分子转染哺乳动物宿主细胞,(f)在能使所述稳定化融合蛋白表达的条件下培养步骤(e)的宿主细胞;其中当在10L或更大的培养基中生长时,所述稳定化融合蛋白得以表达,且不超过10%的蛋白质聚集。37.图形用户界面,包括显示下列信息的图形(i)栅格布局,其中含有由多个多肽序列组成的参考集的残基使用频率数据的集合;和(ii)共变覆盖图。38.产生具有改善的生物物理性质的免疫球蛋白(Ig)超家族多肽的方法,所述方法包括以下步骤a)提供由多个序列组成的辅助参考集的配对排列,所述序列对应于所述多肽的Ig折叠;b)计算该配对排列中所述序列的残基之间的共变,以鉴定出共变残基;c)将所述多肽中未能满足共变条件的残基,替换为所述配对排列中相应位置上找到的共变残基。39.权利要求38的方法,其中所述生物物理性质选自由热稳定性、pH解折叠语、稳定解除糖基化、溶解性、生化功能、和其组合所组成的组。40.权利要求39的方法,其中所述生化功能选自由识别蛋白质靶或识别化学部分所组成的组,该化学部分选自由磷酸根、曱基、乙酰基、月旨、去污剂、金属离子、卣素、RNA、DNA、寡核苷酸、和寡核香所组成的组。41.权利要求38的方法,其中所述Ig超家族多肽源自选自由下列所组成的组的蛋白质抗体或其抗原结合片段、免疫球蛋白受体、细胞粘附蛋白、整联蛋白、过敏原、T-细胞受体、和主要组织相容性复合物(MHC)分子。42.权利要求38的方法,其中所述Ig折叠选自由V类折叠、I类折叠、Cl类折叠、和C2类折叠所组成的组。43.权利要求38的方法,其中所述Ig超家族多肽是选自由下列所组成的组的修饰的抗体结构域抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体。44.权利要求38的方法,其中共变残基是选自由下列所组成的组的结构特征的一部分二硫键,盐桥,配体结合口袋或表面的一部分,和范德华网络,氬键,和/或电荷-电荷相互作用。45.产生稳定性改善的抗体或修饰抗体的方法,包括以下步骤a)提供经实验确认为稳定的模板抗体的高解析度结构模型;b)用该结构模型鉴定所述模板抗体中的VH/VL界面和/或支撑界面的残基;c)用同源性模型鉴定所述抗体或修饰抗体中对稳定所述界面至关重要的相应VH/VL界面残基;和d)将所述抗体或修饰抗体中的相应VH/VL界面残基,替换为来自所述模板蛋白质的界面残基。46.权利要求45的方法,其中所述模板蛋白质的界面残基在所述界面中掩盖至少10A2的表面区域。47.权利要求45的方法,其中所述修饰抗体选自由单结构域抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体所组成的组。48.多肽,由权利要求38-47之一的方法产生。49.权利要求48的多肽,其中所述多肽的选自由下列所组成的组的生物物理性质得到改善热稳定性、pH解折叠谱、稳定解除糖基化、溶解性、生化功能、和其组合。50.权利要求49的多肽,其中所述生化功能是配体结合亲和性或特异性。51.权利要求48的多肽,其源自选自由下列所组成的组的蛋白质抗体或其抗原结合片段、免疫球蛋白受体、细胞粘连蛋白、整联蛋白、过敏原、T-细胞受体、和主要组织相容性复合物(MHC)分子。52.权利要求48的多肽,其选自由重链可变区(Vw)、轻链可变区(V。、和单链抗体(sFv)所组成的组。53.权利要求48的多肽,其中所述Ig折叠选自由V类折叠、I类折叠、Cl类折叠、和C2类折叠所组成的组。54.权利要求48的多肽,其是选自由下列所组成的组的修饰抗体单结构域抗体、人源化抗体、人抗体、非人单克隆抗体、嵌合抗体、双特异性抗体、含scFv的抗体、和结构域缺失的抗体。55.产生含稳定化scFv分子的文库的方法,该方法包括(a)提供对应于scFv分子可变区序列的序列参考集;(b)鉴定可变区内的氨基酸,其在参考集中相应位置上缺失或以低频率被发现;(c)将该信息与共变数据合并,提示对参考集中低频氨基酸进行修饰可满足该可变区内已有的共变限制条件;和(d)用候选稳定化氨基酸替换步骤(b)的氨基酸,由此产生含稳定化scl;v分子的文库。56.权利要求55的方法,其中步骤(b)的氨基酸具有小于0.5的共有序列评分。57.产生稳定化scFv分子的方法,该方法包括(a)提供根据权利要求56的方法设计的scFv文库,(b)用热挑战试—睑筛选该scFv文库以鉴定候选scFv分子,(c)将该scFv文库的候选scFv分子的热稳定性与合适对照比较,当候选scFv分子的热稳定性比对照提高时,将该候选scFv分子鉴定为稳定化scFv分子。58.稳定化scFv分子,用权利要求57的方法鉴定。59.融合蛋白,包含权利要求58的稳定化scFv分子。60.预测候选蛋白质的稳定性的方法,所述蛋白质含有具有候选结构域序列的氨基酸序列,该方法包括(a)提供对应于候选蛋白质候选结构域序列的氨基酸序列参考集;(b)确定所测试的结构域序列内各氨基酸位置上的残基频率,以荻得共有序列评分;和(c)用该共有序列评分预测该候选蛋白质的稳定性,其中该共有序列评分与该候选蛋白质的稳定性相关。全文摘要本发明至少部分基于开发由稳定化scFv组成或包含它的稳定化结合分子和制备这些稳定的分子的方法。文档编号C07K16/00GK101448853SQ200780017774公开日2009年6月3日申请日期2007年3月19日优先权日2006年3月17日发明者亚历克西·A·卢戈夫斯科伊,吴秀凤,威廉·B·斯奈德,布赖恩·R·米勒,斯科特·格拉泽,斯蒂芬·德马雷斯特,莉萨·J·克罗纳,诺曼·王申请人:比奥根艾迪克Ma公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1