引起紧密结构形成的肽的制作方法

文档序号:560416阅读:362来源:国知局

专利名称::引起紧密结构形成的肽的制作方法
技术领域
:本发明的组合物和方法涉及可自联合(self-associate)的二聚作用肽的使用和它们与其它蛋白质一起引起紧密结构形成的用途。这样的受限制肽可形成新配基和受体分离的基础,以及随后作为合理开发可用作药物的小分子的基础。利用已用于发现和提纯各种受体强配基[O’Neil等,蛋白质结构功能和遗传学14:509-515(1992);Giebel等,Biochem.34:15430-35(1995);Spatola和Crozet,J.Med.Chem.39:3842-46(1996);Koivunen等,生物化学杂志268:20205-10(1993);Koivunen等,细胞生物学杂志124:373-380(1994)]、酶[MeBride等,分子生物学杂志259:819-27(1996);Eichler等,Mol.Divers.1:233-240(1996)]和其它蛋白质[Wang等,生物化学杂志270:23239-42(1995)]的环形肽文库已说明了对此方法的需求。在文献中描述了能将目的蛋白质展示为构象受限制结构域的数种受约束的蛋白质支架,包括微体结构(Bianchi等,分子生物学杂志236(2):649-59(1994))、在β-折叠转角处的回折、卷曲螺旋主干结构(Myszka和Chaiken,生物化学33:2363-2372(1994))、锌指结构域、半胱氨酸连接(二硫化物)结构、转谷氨酰胺酶连接结构、环肽、螺旋桶或束、亮氨酸拉链基元(Martin等,EMBOJ.13(22):5303-5309(1994);O’Shea等,科学243:538-42(1993))等。此外,已描述了调节肽的自聚集,例如神经肽头部激活剂[进一步概述于Bodenmuller等,EMBOJ5(8):1825-1829(1986)]、P物质[Poujade等,Biochem.Biiophys.Res.Commun.114:1109-1116(1983)]、蛋内啡肽(metenkephalin)[Mastropaolo等,Biophys.Res.Commun.134:698-703(1986)]和神经肽Y[Minakata等,生物化学杂志264:7907-7913(1989)]的自聚集。与本发明对象相关的是从分离自淡水腔肠动物水螅(Hydra)之神经肽头部激活剂(HA)来源的肽(Bodenmuller等,见上文)。Bodenmuller等证实,在生理条件下HA肽(pEPPGGSKVILF)二聚化以形成无生物学活性的分子。单体形式的二聚化产生了稳定的结构,它在浓度低达10-13M时不解离成其单体组分。对于HA片段的进一步分析表明,只含HA肽羧基末端最后6个氨基酸残基的片段(pSKVILF)比HA本身更有效地二聚化。不过,只含最后4个氨基酸残基的片段(pVILF)和来自HA氨基末端的片段(pEPPGGSK)不会导致二聚体形成。最重要的是,他们的分析表明羧基末端苯丙氨酸的置换及其修饰(如在芳香环的对位(4’)引入碘)可完全消除二聚化作用或极大降低二聚化的倾向。将SKVILF称为“联合肽”(associationpeptide)的Aldwin等人(美国专利5491074)在其氨基末端序列或其羧基末端添加另外的氨基酸残基并发现一些产生的蛋白质能形成二聚肽。不过,Aldwin等人未证实或预期在目的多肽上添加一个以上的“联合肽”。因此,本发明的一个目的是提供二聚化肽以用于多种用途中。具有自聚集特性的肽在此被称为二聚作用肽(DP)。本发明的二聚作用肽含序列FLIVK(从氨基末端至羧基末端)。增强目的蛋白质折叠的二聚化序列例子包括,但不局限于,FLIVK、EFLIVKS、KFVLIKS、VSIKFEL、LIVKS、EFLIVK、KFLIVK、FESIKVL和LKSIVEF。这些二聚作用肽(DP)可以多种联合形式使用以产生一般结构为‘DP-蛋白质’或‘DP-蛋白质-DP’的蛋白质,其中‘DP’是二聚作用肽,蛋白质’包括至少两个氨基酸残基。此外,其它的氨基酸序列,包括但不局限于连接序列、标记序列、定向序列和稳定序列也一般性地包括在内。其它的序列包括那些具高含量疏水氨基酸和1或2个带电残基侧链的序列。通常地,在带至少3-4个高度疏水残基(取自F、I、L、M、V、W和Y)由5、6、7和8个氨基酸组成之二聚作用肽各端的序列将以此形式起作用。本发明的组合物可被细胞内或细胞外展示,并可用于鉴别结合蛋白质和分子及调整细胞内信号传导途径。本发明的一方面是评估受约束蛋白质文库的体内生物活性潜能。因此,本发明可涉及活细胞内的分子或靶目标并可用于分离在该活细胞上具表型效应的受约束蛋白质。此方法包括步骤a)将编码受约束蛋白质的文库引入细胞群中;和b)筛选具由文库成员赋予细胞之改变表型的细胞群。此方法还可包括以下步骤c)分离具改变表型的细胞及d)分离引起改变表型的文库成员。另一方面,本发明的组合物可用于鉴别能与受约束蛋白质结合的体外结合蛋白质和其它小分子。此方法包括以下步骤a)提供受约束的目的蛋白质;b)将受约束的目的蛋白质与固相支持物结合;c)提供含个体成员群的分子文库;和d)提供允许个体成员与受约束目的蛋白质结合的条件。此方法还可包括步骤e)分离结合的文库成员。另一方面,本发明可用于构建含多数受约束蛋白质的分子文库。此受约束蛋白质文库可用于体外结合试验以鉴别能结合目的蛋白质的个体成员。该方法包括以下步骤a)提供目的蛋白质;b)将目的蛋白质与固相支持物结合;c)提供含受约束蛋白质群的分子文库;和d)提供允许受约束蛋白质与目的蛋白质结合的条件。此方法还可包括步骤e)分离结合的受约束蛋白质。本发明的组合物因此可用作基因治疗的支架并具有在生理液中作为治疗剂的潜在用途。在本发明的另一方面,将受约束肽与融合对象连接或定向于特异亚细胞区室。本发明还提供了编码受约束蛋白质的分子文库,包括质粒和逆转录病毒组分以及含这些分子文库的宿主细胞。图2A、2B和2C描述复合DP-蛋白质的示意图。图2A共价交联的双环结构。由于DPhyd:DPhyd和DPLys:DPGlu的特异二聚化,在一DP-蛋白质内形成两个受约束肽并预期为一双环结构。两双环结构通过柔性甘氨酸接头共价连接。图2B非共价交联的双环结构。制备两DP-蛋白质,一个含P1,另一个含P2,由于DPhyd:DPhyd的二聚化各产生紧密的结构。当它们结合时,由于DPhyd:DPhyd和DPLys:DPGlu的特异二聚化,这两个受约束的结构结合产生双环结构。两二聚作用肽DPhyd和DPLys或DPhyd和DPGlu通过柔性甘氨酸接头连接。图2C非共价交联的双环结构,其中由于DPhyd:DPhyd和DPLys:DPGlu的特异二聚化,未受约束的蛋白质P1和P2被压缩成紧密的结构。不过,交联的二聚作用肽局限于不同的DP-蛋白质,当两DP-蛋白质合并时,它们相互结合。图2A-C:DPhyd是主要含疏水氨基酸的二聚作用肽;DPLys是主要含赖氨酸的二聚作用肽;DPGlu是主要含谷氨酸的二聚作用肽;LP是含脯氨酸的接头,LG是含谷氨酸的接头;P1和P2是蛋白质,它们可以相同或不同。图3A和3B显示新肽形成可见的二聚体。图3A:SKVILFE-酰胺和EFLIVKS-酰胺的二聚化。图3B在pH约2.5时用约25%乙腈从C18反相柱上洗脱下的EFLIVKS-酰胺的二聚化。图4显示对来自EFLIVKS-酰胺所有单偶联fmoc合成之粗合成产物的LC/MS检测,以获得电喷射离子化后可二聚化的较短序列。图5A、5B和5C显示蛋白水解抗性结构。图5A:18mer的检测蛋白质序列CGTIVTMEYRIDRTRSFC的弹性蛋白酶消化产物。图5B:18mer的检测蛋白质序列CGTIVTMEYRIDRTRSFC的弹性蛋白酶消化产物,其中在加下划线的两个半胱氨酸之间有二硫键。图5C:EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS的弹性蛋白酶消化产物。图5A-C用与质谱探测结合的反相hplc监测蛋白水解片段并鉴定之。图6EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS的45个最低能量结构的轮廓(只显示了肽主链)。发明详述环化或受约束肽与其线性类似物相比具有许多有用的特征,包括增强了对蛋白酶水解的稳定性,且由于降低了结合的熵值,因此受限制构象空间可导致对关连结合蛋白质有较高的亲和性。这些受限制肽可形成随后设计可用作药物的小分子的基础。最小化的蛋白质中所含的受约束肽在阻断蛋白质-蛋白质相互作用的试剂设计中也可用作中间步骤[Cunningham和Wells,Curr.Opin.Struct.Biol.7:457-462(1997),收编在此作为参考],它可能提供了调节细胞内信号途径的新方法。当肽在细胞内表达时,它们可调节细胞内的信号途径[Souroujon和Mochly-Rosen,Nat.Biotechnol.16(10):919-24(1998)]。如果在活的哺乳动物细胞中表达该肽,可通过细胞表型中限定的改变对它们进行筛选,产生的生用语活性肽可为其结合目标的亲和分离提供路径。因此,本发明提供了二聚作用肽。“二聚作用肽”、“DP”或“联合肽”或语法上的相当用语在此表示自聚集或与第二种肽二聚化或联合的肽。此处的“自聚集”或“二聚化”或“联合”表示肽具有对另一肽的亲和性并自身非共价地附着到此肽上。能相互结合的两个分子(如两个肽)间的相互作用通常以这些分子相互作用力的形式描述,即分子相互间具有的“亲和力”。被检测的亲和力常数范围,例如,对于抗体-抗原的结合是从105升/mol至大于1012升/mol(Harlow和Lane,抗体实验室手册,冷泉港实验室出版社,1988)。相比之下,胰蛋白酶对其底物的亲和力约为1.25X104升/mol,而λ阻遏物对DNA的亲和力是1010升/mol(Harlow和Lane,见上文)。本发明提供的二聚作用肽相互间通常具有约105升/mol-1O13升/mol的亲和力,更通常为约106升/mol-1013升/mol,优选约107升/mol-1013升/mol,更优选约108升/mol-1013升/mol,最优选约109升/mol-1013升/mol,尤其优选约1010升/mol-1013升/mol。如本领域所已知的,亲和常数的检测受温度、pH和溶剂的影响。此处的“肽”表示至少含两个共价附着氨基酸的化合物,包括蛋白质、多肽、寡聚肽和肽。所说的肽可由天然发生的氨基酸和肽键或合成的类肽结构组成。因此此处所用的“氨基酸”或“氨基酸残基”或“肽残基”表示天然存在的和合成的氨基酸。例如,同型苯丙氨酸、瓜氨酸和正亮氨酸为本发明目的也视作氨基酸。“氨基酸”还包括亚氨基酸残基,如脯氨酸和羟脯氨酸。侧链可以是(R)或(S)构型。在优选的实施方案中,氨基酸是(S)或L-构型。例如,若使用非天然存在的侧链,则可利用非氨基酸取代物以防止或阻碍体内降解。本发明的肽,包括DP和测试肽,通常含至少约3个氨基酸长,通常约3-100个氨基酸长,优选约3-50个氨基酸长,更优选约3-10个氨基酸长,最优选约4-10个氨基酸长,且尤其优选约5-9个氨基酸长;优选5、6、7、8、9和10个氨基酸长的肽。同样的,当使用较长的测试蛋白质时,它们可能包含至少约3个氨基酸长,通常约为3-1000个氨基酸长,优选约3-600个氨基酸长,更优选约3-400个氨基酸长,最优选约3-200个氨基酸长,尤其优选约3-100个氨基酸长。本发明的二聚作用肽(DP)包含序列NH2-X1-X2-X3-X4-X5-COOH且通常不超过9个氨基酸长,其中X1、X2、X3和X4通常选自氨基酸A、V、I、L、W、F、M和Y,而X5通常选自K、R、D和E。在优选的实施方案中,二聚作用肽(DP)包含序列NH2-FLIVK-COOH。如上所概述的,其它的序列包括那些具高含量疏水氨基酸和1或2个带电氨基酸残基的序列。大体上,由5、6、7和8个氨基酸与至少3-4个高度疏水残基(选自A、F、I、L、W、V、M和Y)组成的序列将以此方式起作用。在优选的实施方案中,二聚作用序列是NH2-XFLIVK-COOH,其中X是D、E、K或R。在另一优选的实施方案中,二聚化序列是NH2-FLIVKS-COOH。在优选的实施方案中,二聚化序列是NH2-XFLIVKS-COOH,其中X是谷氨酸、天冬氨酸、赖氨酸或精氨酸。在另一实施方案中,如下文所详述的,DP-蛋白质包括含有与蛋白质一端融合之(Lys)4-8或(Arg)4-8以及与蛋白质另一端融合之(Asp)4-8或(Glu)4-8的序列。预期这样的DP-蛋白质会形成紧密的结构,末端形成4-8个残基的离子对延长排列。特别优选的实施方案包括但不局限于序列EFLIVKS、KFLIVKS、EEFLIVKKS、EEFLIVKKS-酸、VSIKFEL、SKVILFE、AFLIVKS、EALIVKS、EFAIVKS、EFLAVKS、EFLIAKS、EFLIVAS、EFLIVKA、EFLKVKS、SKVILFE、EFLIVES、EKLKVKS、ESLSVKS、EFLIVES、VSIKFEL、LIVKS、FESIKVL和LKSIVEF。在优选的实施方案中,本发明的DP与目的蛋白质或肽共价结合,在此通常依其大小被称为“目的蛋白质”、“目的肽”、“检测蛋白质”或“检测肽”。“目的蛋白质”、“目的肽”、“检测蛋白质”或“检测肽”或语法上的相当用语在此表示通常待寻求其功能或具有某些待测特征的蛋白质。通常,检测蛋白质由获自基因组DNA、cDNA或来自随机核酸的核酸编码。这些核酸被表达(如下所详述)以产生检测蛋白质。较小的检测蛋白质,通常称为检测肽,还可在肽合成仪上合成。在肽合成仪上的合成可允许掺入合成类似物,包括,但不局限于,非天然氨基酸或拟肽键以增强检测蛋白质或检测肽的效力和稳定性。在优选的实施方案中,检测肽被随机化。“随机”或“随机化”或语法上相当用语在此表示各核酸和肽基本上分别由随机核苷酸和随机氨基酸组成。通常从分子文库中表达这些随机检测肽。在优选的实施方案中,分子文库包含至少两种不同的随机化核酸序列,优选具有多种不同随机化的核酸序列。可化学合成这些核酸序列,并可在任何位置掺入任何核苷酸。该合成方法可设计为产生随机化的核酸,以允许整个序列长度上产生所有或大部分可能组合的形成,从而形成编码随机化候选蛋白质分子(如随机化候选DP-蛋白质)的随机化核酸文库。随机化核酸序列因而产生了片段文库,这些片段分别编码不同的蛋白质,如本文所概述,将它们与合适载体连接并转化入细胞。在一实施方案中,文库是完全随机化的,在任何位置都无优选序列或恒定序列。在另一优选的实施方案中,文库是有偏向性的。即,序列中的一些位置或保持恒定,或选自有限数量的可能性。例如,在优选的实施方案中,随机化核苷酸三联体(NNN)以编码限定种类内的氨基酸残基,例如,疏水氨基酸、亲水残基、立体偏向性(或小或大)残基,编码半胱氨酸用于交联、编码脯氨酸用于SH-3结构域、编码丝氨酸、苏氨酸、酪氨酸或组氨酸以获得磷酸化位点等,或对嘌呤的偏爱,等等。术语“随机肽文库”或“随机蛋白质文库”在此表示包含编码随机肽(或随机蛋白质)的重组载体、由那些重组载体编码的随机肽(或随机蛋白质)、编码含随机肽(或随机蛋白质)之融合蛋白质的重组载体以及由那些重组载体编码的包括随机肽(随机蛋白质)在内的融合蛋白质。在优选的实施方案中,候选DP-蛋白质的序列用于产生最初分离的候选DP-蛋白质的衍生物。例如,候选DP-蛋白质的序列可以是第二轮(偏向性)随机化的基础,从而产生具增加或改变活性的衍生DP-蛋白质。或者,第二轮随机化可改变生物活性剂的亲和性。而且,将已鉴定DP-蛋白质的蛋白质组分与不同的随机化序列可操作性地连接比过去用于分离原始候选DP-蛋白质的方法更合乎需要。这可产生更多或更少受限制的融合蛋白质,并因此可能具有改变的活性。以类似于结合口袋诱变的方式,通过保持配体一端区域恒定而随机化另一端以改变周围肽的结合从而巡游潜在结合位点也是合乎需要的。在优选的实施方案中,检测蛋白质包括野生型或天然存在序列。或者可以是其衍生蛋白质,即它可包括最初分离的DP-蛋白质中不曾有的氨基酸取代、插入或缺失或它们的组合形式。这些修饰通常通过编码目的蛋白质的核酸体外诱变来进行。体外诱变方法对本领域技术人员来说是众所周知的,例如,可见以下文献中Sambrook等,分子克隆实验室手册(纽约冷泉港实验室出版社,1989)和Ausubel等,分子生物学中的简短流程(JohnWiley&amp;Sons,Inc.,1995)。本发明的DP与检测蛋白质共价连接。“共价附着”或“共价连接”或语法上同等物在此表示两部分通过至少一个键连接,包括σ键、π键和配位键。正如下文所要更完整叙述的,本发明的DP与融合对象和/或检测肽共价连接。通过应用半胱氨酸(二硫键)连接、肽键连接、各种双功能试剂(交联剂,如马来酰亚胺基苯甲酸、甲基二硫代乙酸、巯基苯甲酸、S-吡啶基二硫丙酸,等等)或通过非肽键附着完成与融合对象和检测肽的共价连接。非肽键的例子包括,但不局限于,retroinverso键、N-甲基胺键、depspeptide键、hydroaminopeptideisotere、硫代酰胺键、peptoids[Simon等,美国国家科学院院报899367-71(1992)]、双键、还原肽键、亚乙基键、酮拟肽键类似物、亚甲亚砜和亚甲基硫化醚[Rizo和Gierasch,生化年鉴61387-418(1992)]。通常,如下所详述,例如通过表达编码DP和相应的目的肽或蛋白质的核酸,用肽键将DP与肽或蛋白质连接。在优选的实施方案中,正如本领域技术人员应理解的,本发明的DP以多种方式与检测蛋白质连接形成融合蛋白质。如下所更详述的,它们可与一个或多个内部位置连接,或优选与N-和C-末端之一或二者连接。DP与融合对象的连接产生的结构在此被称为DP-蛋白质。“DP-蛋白质”在此表示含至少一个与至少一肽共价连接之二聚作用肽的化合物。如下文所定义的,DP-蛋白质包括候选DP-蛋白质。如本领域技术人员所应理解的,在利用单个DP时,本发明的组合物和方法在两个检测肽的联合中能够起作用。即,可将第一DP(DP1)与第一检测蛋白质(蛋白质1)连接,而将第二DP(DP2)与第二检测蛋白质(蛋白质2)连接。当使用两个DP时,组合物可以在受约束检测肽的产生中起作用。在优选的实施方案中,至少一DP与检测蛋白质的N-末端连接,优选有两个DP附着。在此实施方案中,当两个或多个DP与检测蛋白质连接时,各DP可以是序列相同的或可以具有不同的序列。如下文所进一步叙述的,DP可以被连接序列分隔或不被分隔。在一个实施方案中,其中将相同的DP或相互间具亲和力的两个不同DP与两不同的检测蛋白质(蛋白质1和蛋白质2)的N-末端连接,产生如DP-蛋白质1和DP-蛋白质2,两DP相互联合,使蛋白质1和蛋白质2接近。由于相同DP序列的存在,除蛋白质1蛋白质2异二聚体外,还可制备蛋白质1蛋白质1同二聚体和蛋白质2蛋白质2同二聚体。在优选的实施方案中,至少一DP与检测蛋白质的C-末端连接,优选两DP附着。如上,各DP可以是序列相同的或可以具不同的序列。如下文所进一步叙述的,DP可以被连接序列分隔或不被分隔。在一个实施方案中,其中将相同的DP或相互间具亲和力的两个不同DP与两不同的检测蛋白质(蛋白质1和蛋白质2)的C-末端连接,产生如蛋白质1-DP和蛋白质2-DP,两DP相互联合,使蛋白质1和蛋白质2接近。由于相同DP序列的存在,除蛋白质1蛋白质2异二聚体外,还形成蛋白质1蛋白质1同二聚体和蛋白质2蛋白质2同二聚体。在优选的实施方案中,将至少一个DP与检测蛋白质内在位置连接,优选两个DP附着。如上所述,各DP可以是序列相同的或可能具有不同的序列。如下文所述,这些DP可以被接头序列分隔,或不被分隔。当两个或多个DP与内在位置连接时,DP可以是并置的,即它们被插入相同的内在位置,例如,产生N蛋白质I-DP1-DP2-I蛋白质C,或者DP可以被分隔开并插入不同的内在位置,例如,产生N蛋白质I-DP1-I蛋白质I-DP2-I蛋白质C,其中‘N’是检测蛋白质的氨基末端部分,‘C’是检测蛋白质的羧基末端部分,‘I’是蛋白质的内在部分,侧翼是二聚作用肽--DP1和DP2。在一实施方案中,其中DP1和DP2具有相同序列或相互间具有亲和性,它们联合起来,DP1和DP2之间包含的检测蛋白质部分(即I蛋白质I)形成环状结构。在优选实施方案中,DP与检测蛋白质的键合是直接的;即,DP序列与检测蛋白质序列直接融合为融合体。在优选的实施方案中,DP与检测蛋白质的键合是非直接的;即利用了接头或间隔子。术语“接头”或“间隔子”或“粘连序列”或语法上相当用语在此表示包含连接两个分子的一分子或一组分子。通常接头的包含可用于将两分子安置成优选的构型,例如,使两分子的构型更受约束(此时使用含脯氨酸的接头)或使两分子的构型更松弛(即,最小的位阻;此时使用含丝氨酸和甘氨酸的接头)。在优选的实施方案中,接头序列可包含于任何位置,即,在DP和目的蛋白质之间,在两不相关的DP间,或在两融合对象间。如本文所概述的,接头序列可以是蛋白质的或非蛋白质的。化合物中各组分间的接头序列可能是合乎需要的,例如,可允许目的蛋白质与不受阻碍的潜在目标相互作用,约束目的蛋白质,或允许赋予目的蛋白质的新特性起作用(如亚细胞定位)。为了约束目的蛋白质,尤其优选含脯氨酸的接头。如本领域所已知的,脯氨酸赋予多肽链独特的构象约束。有用的脯氨酸接头包括脯氨酸-甘氨酸聚合体(包括,但不局限于,(PG)n、(PPGG)n、(PP)n及其组合,其中n是至少为1的整数)。如本领域技术人员应理解的,允许多肽具有一些柔性的优选接头包括甘氨酸-丝氨酸聚合体(包括,但不局限于,(GS)n、(GSGGS)n、(GGGS)n及其组合,其中n是至少为1的整数)、甘氨酸-丙氨酸聚合体、丙氨酸-丝氨酸聚合体及其它的柔性接头,如用于变动钾通道的粘连物,以及多种其它柔性接头。尤其优选甘氨酸-丝氨酸聚合体。在优选的实施方案中,DP-蛋白质含两个DP。在此实施方案中,两DP用于构象性受限制检测蛋白质。DP在与目的蛋白质(3-50个或更多个氨基酸残基)N-和C-末端共价连接时,有助于目的蛋白质折叠成紧密结构(在此也称为受约束的结构),它比单独的线性蛋白质序列对蛋白水解更具抗性。在筛选相互作用分子时,此实施方案中尤其优选随机的检测蛋白质。在优选的实施方案中,第一个DP(DP1)与检测蛋白质的N-末端(N)融合,第二个DP(DP2)与检测蛋白质(蛋白质)的C-末端(C)融合,产生例如DP1-N蛋白质C-DP2。在此实施方案中,第一和第二个DP可以是相同或不同的。在利用可自聚集的两DP时,两DP结合并赋予两DP间所含检测蛋白质受约束的结构。当两个不同的DP(DP1和DP2)与检测蛋白质的N-端和C-端连接时,假如DP1和DP2相互间具有亲和力,这两个不同的DP仍然可结合并赋予检测蛋白质受约束的结构。可结合的不同DP序列是例如KFLIVKS和EFLIVES。尤其优选的DP-蛋白质实施例包括,但不局限于(ⅰ)EFLIVKS-蛋白质-EFLIVKS;(ⅱ)KVLIKS-蛋白质-EFLIVES;(ⅲ)VSIKFEL-蛋白质-VSIKFEL;(ⅳ)LIVKS-蛋白质-LIVKS;(ⅴ)EFLIVK-蛋白质-EFLIVK;(ⅵ)FESIKVL-蛋白质-FESIKVL;和(ⅶ)LKSIVEF-蛋白质-LKSIVEF。更具体地说,本发明提供的DP1-蛋白质-DP2类化合物包含(ⅰ)EFLIKS-VGTIVTMEYRIDRTRSFV-EFLIFKS,其中蛋白质序列获自大麦c2-糜蛋白酶抑制物[VGTIVTMEYRIDRTRSFV;Leatherbarrow和Salacinski,生物化学30:10717-21(1991)]且DP1和DP2是相同的;(ⅱ)EFLIKS-VGTIVTMEYRIDRTRSFV-SKVILFE,其中DP1与DP2序列反向;(ⅲ)SKVILFE-VGTIVTMEYRIDRTRSFV-EFLIVKS,其中DP1与DP2序列反向;(ⅳ)SKVILFE-VGTIVTMEYRIDRTRSFV-SKVILFE,其中DP1和DP2是相同的,不过与(ⅰ)中所示DP1和DP2反向;(ⅴ)KFLIVKS-VGTIVTMEYRIDRTRSFV-KFLIVKS,其中DP1和DP2是相同的;(ⅵ)KFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVES,其中DP1和DP2是不同的;(ⅶ)EFLKVES-VGTIVTMEYRIDRTRSFV-KFLIVES,其中DP1和DP2是相同的;(ⅱⅹ)EKLKVKS-VGTIVTMEYRIDRTRSFV-EKLKVKS,其中DP1和DP2是相同的;(ⅸ)ESLSVKS-VGTIVTMEYRIDRTRSFV-ESLSVKS,其中DP1和DP2是相同的;(ⅹ)EFLKVKS-VGTIVTMEYRIDRTRSFV-EFLKVKS,其中DP1和DP2是相同的;(ⅹⅰ)EEFLIVKKS-VGTIVTMEYRIDRTRSFV-EEFLIVKKS,其中DP1和DP2是相同的;(ⅹⅱ)MGEFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKSGPP,其中DP1和DP2是相同的,且为了增加稳定性,DP1包含氨基酸MG而DP2包含氨基酸GPP;(ⅹⅲ)KKKKKKGGGGEFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS,其中DP1和DP2是相同的且为了增加溶解性,DP1包含氨基酸KKKKKKGGGG;(ⅹⅳ)KKKGSGSEFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS,其中DP1和DP2是相同的,且为了增加溶解性,DP1包含氨基酸KKKGSGS;(ⅹⅴ)EFLIVKS-STKSIPPQS-EFLIVKS,其中9聚体插入片段代表了蛋白酶抑制物的类似物[Gariani和Leatherbarrow,肽研究杂志49:467-75(1997)];(ⅹⅵ)MGEFLIVKS-GGGGDYKDDDDKGGGG-EFLIVKSGPP,其中DP1和DP2是相同的,且为了增加稳定性,DP1包含氨基酸MG而DP2包含氨基酸GPP,蛋白质包含带甘氨酸间隔子的标记表位(DYKDDDDK);(ⅹⅶ)MGEFLIVKS-GGGGYPYDVPDYASLGGGG-EFLIVKSGPP,其中DP1和DP2是相同的,且为了增加稳定性,DP1包含氨基酸MG而DP2包含氨基酸GPP,该蛋白质包含带甘氨酸间隔子的流感血凝素表位标记(YPYDVPDYASL)。所有以上实施例中二聚作用肽序列均用下划线标出。在优选的实施方案中,第一个DP(DP1)与检测蛋白质的N-末端连接,第二个DP(DP2)与检测蛋白质的内在位置连接。产生了诸如DP1-N蛋白质I-DP2-I蛋白质C之类的结构。在一实施方案中,其中DP1和DP2序列相同或相互间具亲和性,它们联合起来,DP1和DP2之间包含的检测蛋白质部分(即N蛋白质I)形成环状。在优选的实施方案中,第一个DP(DP1)与检测蛋白质的C-末端连接,第二个DP(DP2)与检测蛋白质的内在位置连接。产生了诸如N蛋白质I-DP2-I蛋白质C-DP1之类的结构。在一实施方案中,其中DP1和DP2序列相同或相互间具亲和性,它们联合起来,DP1和DP2之间包含的检测蛋白质部分(即I蛋白质C)形成环状。在优选的实施方案中,将第一个DP(DP1)和第二个DP(DP2)与检测蛋白质的内在位置连接,或优选与检测蛋白质的两个不同内在位置连接,产生诸如N蛋白质I-DP1-I蛋白质I-DP2-I蛋白质C之类的结构。一实施方案中,其中DP1和DP2序列相同或相互间具亲和性,它们联合起来,DP1和DP2之间包含的检测蛋白质部分(即I蛋白质I)形成环状。在优选的实施方案中,不同的二聚作用肽与将相互共价结合的一个以上蛋白质融合。在此实施方案中,还可通过插入DP和蛋白质和/或各DP间的接头分隔各个二聚作用肽。例如,可制备如DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu(见图2A)之类的DP融合蛋白质,其中DPhyd是主要含疏水性氨基酸残基的DP,DPLys是主要含赖氨酸残基的DP,DPGlu是主要含谷氨酸残基的DP,Lp是含脯氨酸残基的接头,LG是含甘氨酸残基的接头,蛋白质1和蛋白质2含不同蛋白质序列。上述二价DP蛋白质将使得两受约束蛋白质在一融合蛋白质内共价交联,形成‘双环’结构。在这样的结构中,通过第一个DPhyd和第二个DPhyd的二聚化形成第一个环(含蛋白质1),而通过DPLys和DPGlu的二聚化形成第二个环(含蛋白质2)。可通过如甘氨酸或丝氨酸/甘氨酸接头之类上述柔性接头分隔这两个环结构。在优选的实施方案中,将不同的二聚作用肽与一个以上的蛋白质融合,它们相互间非共价联合。在此实施方案中,在此实施方案中,还可通过插入DP和蛋白质间和/或各DP间的接头分隔各个二聚作用肽。例如,可制备以下DP融合蛋白质(ⅰ)DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys和(ⅱ)DPhyd-Lp-蛋白质2-Lp-DPhyd-LG-DPGlu(见图2B),其中DPhyd是主要含疏水性氨基酸残基的DP,DPLys是主要含赖氨酸残基的DP,DPGlu是主要含谷氨酸残基的DP,Lp是含脯氨酸残基的接头,LG是含甘氨酸残基的接头,蛋白质1和蛋白质2是含不同蛋白质序列的蛋白质。如上所述,由于相应DP的联合,两个别蛋白质(蛋白质1和蛋白质2)分别保持在紧密结构中。通过混合两DP-融合蛋白质,由于DPLys与DPGlu的特异结合,它们形成非共价结合的二聚物,产生含两种不同紧密蛋白质(蛋白质1和蛋白质2)的二聚体结构。在另一实施方案中,插入两DPhyd之间的蛋白质序列是相同的(ⅰ)DPhyd-Lp-蛋白质l-Lp-DPhyd-LG-DPLys和(ⅱ)DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPGlu,产生含相同蛋白质两并置紧密结构的非共价双环结构。对本领域技术人员显而易见的是,除本文所述外还可制备多种DP融合蛋白质。在优选的实施方案中,将不同的二聚作用肽与一个以上的蛋白质融合,它们相互间非共价联合。在此实施方案中,产生DP-蛋白质,其中DP用于非共价结合两个或多个未受约束的蛋白质以形成受约束的结构(见图2C)。在此实施方案中,通过插入DP和蛋白质间的接头还可方便地分隔各个二聚作用肽。例如,可制备以下DP融合蛋白质(ⅰ)DPhyd-Lp-蛋白质1-Lp-DPLys和(ⅱ)DPhyd-Lp-蛋白质2-Lp-DPGlu,其中DPhyd是主要含疏水氨基酸残基的DP,DPLys是主要含赖氨酸残基的DP,DPGlu是主要含谷氨酸残基的DP,Lp是含脯氨酸残基的接头,LG是含甘氨酸残基的接头,蛋白质1和蛋白质2是含不同蛋白质序列的蛋白质。如上所述,由于相应DP的联合,两蛋白质(蛋白质1和蛋白质2)分别保持在紧密结构中。通过混合两DP-融合蛋白质,由于DPLys与DPGlu的特异结合,它们形成非共价结合的二聚物,产生含两个不同紧密蛋白质(蛋白质1和蛋白质2)的二聚体结构。在另一实施方案中,插入两DPhyd之间的蛋白质序列是相同的(ⅰ)DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys和(ⅱ)DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPGlu,产生含相同蛋白质的两并置紧密结构的非共价双环结构。对本领域技术人员显而易见的是,除本文所述外还可制备多种DP融合蛋白质。其它的二聚蛋白质序列在本领域是已知的,或可用已知筛选系统分离,如酵母双杂交系统。在一个实施方案中,例如上述DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu中的两蛋白质序列(蛋白质1和蛋白质2)分别具有特异的生物活性,以如上所述结构组合时产生的二价DP融合蛋白质具有比它们单独时更大的生物活性。例如,两紧密结构都可与相同目标蛋白质结合,不过亲和力较低。如上所述将两紧密结构结合成单个二价DP-融合蛋白质时,可能产生对目标蛋白质高得多的亲和力,因此单个DP-融合蛋白质与每个分离的DP-蛋白质相比可以是更强的激活剂或拮抗物。在另一实施方案中,如上所述的DP-融合蛋白质,如具有二价结合特异性的DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu还可用于使与它们具有亲和力的两个蛋白质结合。在此实施方案中,含蛋白质1的紧密结构对蛋白质X具亲和力;而含蛋白质2的紧密结构对蛋白质Y具亲和力。将此DP-融合蛋白质引入表达蛋白质X和蛋白质Y的细胞中,将导致二价DP-融合蛋白质与蛋白质X和蛋白质Y的结合,从而使它们紧密地接近。同样地,如上所述的DP-融合蛋白质结构,如具有二价结合特异性的DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu还可用于联系两细胞。这两细胞可以是相同或不同的。在此实施方案中,含蛋白质1的紧密结构对展示于第一细胞表面的细胞表面组分X具亲和力。含蛋白质2的紧密结构对展示于第二细胞表面的细胞表面组分Y具亲和力。共培养第一和第二细胞并提供此二价DP-融合蛋白质,将导致DP-融合蛋白质与细胞表面组分X和细胞表面组分Y结合,这将使第一和第二细胞紧密地接近。将目的基因运送至特异靶细胞,试图纠正其中的遗传缺陷,这是基因治疗中最具挑战性的方面之一。本领域技术人员已知的数个基因运送系统包括,但不局限于,裸DNA、脂质体包含的DNA和病毒系统,包括逆转录病毒、腺病毒、疱疹病毒、HIV等等。不过,不管应用什么系统,细胞类型特异性的运送仍然是基因治疗最关键的方面。在优选的实施方案中,上述DP-融合蛋白质结构,如具二价结合特异性的DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPG1u还可用作将预期靶细胞与病毒颗粒(如运送目的基因的病毒)联系起来的工具。在此实施方案中,含蛋白质1的紧密结构对展示于病毒上的细胞表面组分X具亲和性,而含蛋白质2的紧密结构对展示于靶细胞上的细胞表面组分Y具亲和性。共培养病毒和靶细胞并提供此二价DP-融合蛋白质,将导致二价DP-融合蛋白质与病毒表面组分X和靶细胞表面组分Y都结合,这将使病毒紧紧地靠近其靶细胞。病毒颗粒因此可以停泊到预期靶细胞上并与膜融合,保证基因运送。进行适当的控制以使在未加入二价DP-融合蛋白质时病毒不停泊到其靶细胞上。在另一实施方案中,插入两DPhyd间和DPLys与DPGlu间的蛋白质序列是相同的,产生含相同蛋白质的两并置紧密结构的双环结构。此实施方案允许相同蛋白质的二聚化,它可以是细胞蛋白质或细胞外蛋白质组分。对于本领域技术人员显而易见的是,除本文所述外,还可制备多种DP-融合蛋白质。如下文所更完整描述的,本发明的DP或DP-蛋白质还可被修饰,以形成含DP或DP-蛋白质和另一异源蛋白质或氨基酸序列(通常被称为融合对象)的融合蛋白质。术语“融合蛋白质”或“嵌合蛋白质”指至少由两蛋白质组成的蛋白质,所说的两蛋白质在其天然状态通常不连接,它们一般通过它们的相应氨基和羧基端的肽键连接形成一个连续蛋白质。应当理解,蛋白质组分可直接连接或通过肽接头/间隔子连接。“融合对象”在此指与DP或DP-蛋白质联合并赋予DP或DP-蛋白质附加作用或能力的序列。合适的融合对象包括,但不局限于a)如下所定义的标记序列(也称拯救序列),它可方便DP或DP-蛋白质或者编码它们的核酸的纯化或分离;b)定义如下的定向序列,它们可将DP或DP-蛋白质定位于亚细胞或细胞外区室;c)稳定性序列,赋予DP或DP-蛋白质稳定性或保护其免于降解,例如抵抗蛋白酶的降解;或d)a)、b)和c)的任何组合,以及所需的接头序列。本领域技术人员众所周知融合蛋白质优选通过体外诱变和遗传工程产生,从而编码相应融合蛋白质的核酸被修饰。在以下文献中可找到合适的方法,例如,Sambrook等,分子克隆实验室手册(纽约冷泉港实验室出版社,1989)和Ausubel等,分子生物学中的简短流程(JohnWiley&amp;Sons,Inc.1995)。在优选的实施方案中,融合对象包含标记多肽,此标记多肽提供了抗标记抗体可选择性结合的表位或含纯化序列的表位。表位标记通常,但不局限于,被放置于DP或DP-蛋白质的氨基或羧基末端。用抗标记多肽的抗体可检测DP或DP-蛋白质这些被表位标记的形式的存在。此外,标记的使用使蛋白质能通过亲和纯化用抗标记抗体或者与表位标记结合的其它类型亲和基质方便地纯化。在另一实施方案中,嵌合分子可包含DP或DP-蛋白质与免疫球蛋白或免疫球蛋白特异区域的融合体。对于嵌合分子的二价形式,这样的融合可以是与IgG分子的Fc区域或与GST(谷胱甘肽S转移酶)的融合。多种标记多肽和它们各自的抗体在本领域是众所周知的。例子包括多组氨酸(poly-his)或多-组氨酸-甘氨酸(poly-his-gly)标记;fluHA标记多肽和它的抗体12CA5[Field等,分子细胞生物学,8:2159-2165(1988)];c-myc标记和它们的8F9、3C7、6E10、G4、B7和9E10抗体[Evan等,分子细胞生物学,5:3610-3616(1985)];和单纯疱疹病毒糖蛋白D(gD)标记和其抗体[Paborsky等,蛋白质工程,3(6):547-553(1990)]。其它的标记多肽包含Flag肽[Hopp等,分子免疫学,33:601-8(1996);Brizzard等,生物技术16(4):730-735(1994);Knappik和Pluckthun,生物技术17(4):754-61(1994)]、KT3表位肽[Martin等,科学255:192-194(1992)]、微管蛋白表位肽[Skinner等,生物化学杂志266:14163-14166(1991)]和T7基因10蛋白质肽标记[Lutz-Freyermuth等,美国国家科学院院报87:6393-6397(1990)]。或者,例如,在金属(镍)亲和树脂上有效纯化包含多组氨酸标记的融合蛋白质。在优选的实施方案中,标记序列(也称拯救序列)被用于分离编码DP-蛋白质的核酸(也见下文)。在此实施方案中,拯救序列可能是用作探测靶位点的独特寡核苷酸序列,从而可通过PCR、杂交或相关技术快速和方便地纯化核酸构建体(见下文)。在优选的实施方案中,融合对象是定向序列。正如本领域技术人员应理解的,细胞内蛋白质的定位是提高有效浓度和确定作用的简单方法。这些机制被认为依赖于受限制对配基的搜寻空间的原理,也就是说,蛋白质在质膜上的定位使得对其配体的搜寻局限于膜附近的有限空间,而不是胞浆的三维空间。或者,也可通过定位特性简单地提高蛋白质的浓度,例如,将蛋白质转移入核中使它们被受限制在较小的空间内,从而提高浓度。因此,合适的定向序列包括,但不局限于:(ⅰ)在保持表达产物生物活性的条件下能使相应蛋白质与预定分子或分子种类结合的序列(例如,通过使用酶抑制剂或底物序列定向于相关种类酶);(ⅱ)自身或共结合蛋白质信号选择降解的序列;和(ⅲ)能组成型地定位候选表达产物至预定细胞位置的信号序列,包括(a)亚细胞位置,如高尔基体、内质网、核、核仁、核膜、线粒体、叶绿体、分泌泡、溶酶体和细胞膜;以及(b)通过分泌信号的细胞外位置[见,vonHeijne,EXS73:67-76(1995);vonHeijne,Subcell.Biochem.22:1-19(1994)和vonHeijne,Curr.Opin.Cell.Biol.2(4):604-8(1990)]。尤其优选定位至亚细胞位置或通过分泌定位至细胞外。在优选的实施方案中,融合对象是核定位信号(NLS)。NLS通常是短的带正电荷(碱性)结构域,用于指导含有它们的整个蛋白质至细胞核。许多NLS氨基酸序列已被报道,包括:(ⅰ)单个的碱性NLS,如SV40(猿猴病毒)大T抗原的NLS[ProLysLysLysArgLysVal;Kalderon等,细胞39:499-509(1984)];人视黄酸受体β核定位信号(ARRRRP,1029(1990));NFκBp65[EEKRKRTYE;Nolan等,细胞64:961-969(1991)];和其它[参阅,例如Boulikas,细胞生化杂志55(1):32-58(1994)](在此收编作为参考),以及(ⅱ)双碱性NLS,例如Xenopuslaevis(非洲爪蟾)蛋白质核质蛋白的NLS[AlaValLysArgProAlaAlaThrLysLysAlaGlyGlnAlaLysLysLysLysLeuAsp;Dingwall等,细胞30:449-458(1982)和Dingwall等,细胞生物学杂志107:841-849(1988)]。许多定位研究已证实,掺入合成肽或移植入通常不定向于细胞核的报道蛋白质的NLS引起这些肽和蛋白质集中于核中。参阅,例如,Dingwall和Laskey,细胞生物学年鉴2:367-390(1986);Bonnerot等,美国国家科学院院报84:6795-6799(1987)和Galileo等,美国国家科学院院报87:458-462(1990)。在优选的实施方案中,融合对象是膜锚定信号序列。这一点特别有用,因为许多寄生虫和病原体与膜结合,除此之外,许多细胞内的活动发生于质膜上。因此,膜结合的DP-蛋白质对于这些过程中重要元件的鉴定及有效抑制剂或激活剂的发现都是有用的。本发明提供了在胞外或细胞质空间内展示DP蛋白质的方法。为了胞外呈现,在DP-蛋白质的羧基末端提供了膜锚定区域。DP-蛋白质暴露于细胞表面并呈现于胞外空间,以使其能与其它表面分子(影响其功能)或呈现于胞外介质中的分子结合。这样的分子结合可赋予表达结合该分子之DP-蛋白质的细胞以功能。细胞质区域可以是中性的或可包含一结构域,当胞外DP-蛋白质被靶蛋白或检测蛋白质结合时,此结构域赋予细胞以功能(激酶、磷酸化酶的活化、其它细胞组分的结合以发挥功能)。同样地,含DP-蛋白质的区域可包含于细胞质区域中,跨膜区域和胞外区域保持恒定或具有确定的功能。膜锚定序列在本领域是众所周知的,并以哺乳动物跨膜分子的遗传几何学为基础。以分泌信号序列为基础将肽插入膜并需要一疏水跨膜结构域。当然,如果跨膜结构域被置于DP-蛋白质区域的氨基末端,它将用于锚定DP-蛋白质作为细胞内结构域,这在某些实施方案中是合乎需要的。已知多种膜结合蛋白质的分泌信号序列和跨膜结构域,因此这些序列可作为特殊蛋白质的配对或与取自不同蛋白质的分泌信号序列和跨膜结构域使用,或者,这些序列可以是合成并完全来自人造运送结构域的共有区。正如本领域技术人员应理解的,已知多种蛋白质的膜锚定蛋白质序列,包括SS和TM,这些序列中的任一种均可使用。尤其优选的膜锚定序列包括,但不局限于,来自CD8、ICAM-2、IL-8R、CD4和LFA-1的膜锚定序列。有用的序列包括来自以下种类的序列(ⅰ)Ⅰ类整合膜蛋白,如IL-2受体β链[残基1-26是信号序列,残基241-265是跨膜残基;参阅Hatakeyama等,科学244:551-556(1989)和yonHeijne和Gavel,欧洲生化杂志174:671-678(1988)]和胰岛素受体β链[[残基1-27是信号序列,残基957-959是跨膜结构域,而残基960-1382是细胞质结构域;参阅Hatakeyama,见上文,和Ebina等,细胞40:747-758(1985)];(ⅱ)Ⅱ类整合膜蛋白质,如中性内肽酶[残基29-51是跨膜结构域,残基2-28是细胞质结构域;参阅Malfroy等,Biochem.Biophys.Res.Commun.144:59-66(1987)];(ⅲ)Ⅲ类蛋白质,如人细胞色素P450NF25(Hatakeyama,见上文);和(ⅳ)Ⅳ类蛋白质,如人的P-糖蛋白(Hatakeyama,见上文)。尤其优选的是CD8和ICAM-2。例如,来自CD8和ICAM-2的信号序列位于转录物的5’末端尽头。这些序列编码CD8中的氨基酸1-32[MASPLTRFLSLNLLLLGESILGSGEAKPQAP;Nakauchi等,美国国家科学院院报82:5126-30(1985)]和ICAM-2中的氨基酸1-21[MSSFGYRTLTVALFTLICCPG;Staunton等,自然339:61-64(1989)]。前导序列运送构建体至膜上疏水跨膜结构域置于DP-蛋白质区域羧基末端时可锚定构建体于膜上。这些跨膜结构域包括CD8的氨基酸145-195(PQRPEDCRPRGSVKGTGLDFACDIYIWAPLAGICVALLLSLIITLICYHSR;Nakauchi,见上文)和ICAM-2的氨基酸224-256(MVIIVTVVSVLLSLFVTSVLLCFIFGQHLRQQR;Staunton,见上文)。或者,膜锚定序列包括GPI锚,它通过例如在DAF中的糖基-磷脂酰肌醇键产生分子和脂双层之间的共价键[PNKGSGTTSGTTRLLSGHTCFTLTGLLGTLVTMGLLT,下划线的丝氨酸是锚的位置;见Homans等,自然333(6170):269-72(1988),和Moran等,生物化学杂志266:1250-1257(1991)]。为此,来自Thy-1的GPI序列可插入可变区的3’代替跨膜序列。在病毒、古细菌、原核和真核细胞来源的膜上展示DP-蛋白质属于本发明的范围内。在此实施方案中,DP-蛋白质与膜蛋白质融合,以致在插入膜内后,DP-蛋白质区域将定位于病毒、古细菌、原核和真核细胞的外面,从而可接近结合的靶分子,例如,当筛选结合的靶分子时。原核表面展示系统包括,例如与鞭毛蛋白[Lu等,生物技术13(4):366-72(1995)]和冰晶核蛋白[Jung等,Nat.Biotechnol.16(6):576-80(1998)]之类表面蛋白的功能性融合体。其它的原核蛋白质展示系统综述于Stahl和Uhlen,TrendsBiotechnol.15(5):185-92(1997)和Georgiou等,Nat.Biotechnol.15(1):29-34(1997)。病毒展示系统包括,但不局限于(ⅰ)丝状噬菌体,如M13及其衍生物[综述参见Felici等,生物技术年鉴1:149-83(1995)];(ⅱ)T4噬菌体[Jiang等,Infect.Immun.65(11):4770-7(1997)];(ⅲ)λ噬菌体[Stolz等,FEBSLett.440(1-2):213-7(1998)];(ⅳ)番茄丛矮病毒[Joelson等,遗传病毒学杂志78(Pt6):1213-7(1997)];和(ⅴ)逆转录病毒[Buchholz等,Nat.Biotechnol.16(10):951-4(1998)]。酵母展示系统,例如,应用与酿酒酵母Aga2p接合粘附受体的C-末端融合体[Boder和Wittrup,Nat.Biotechnol.15(6):553-7(1997)]。利用上述系统或哺乳动物跨膜蛋白质(其中一些描述于本文中)进行的蛋白质展示通常通过将编码DP-蛋白质(或任何其它目的蛋白质)的核酸读框一致地插入具氨基端分泌信号和C-末端跨膜锚定结构域而完成(如下文将进一步描述的)。同样地,十四烷基化序列可用作膜锚定序列。已知c-src的十四烷基化使其募集至质膜上。这是膜定位的一个简单和有效的方法,因为已知该蛋白质头14个氨基酸主要负责此功能MGSSKSKPKDPSQR(见Cross等,细胞分子生物学4(9):1834-1842(1984);Spencer等,科学262:1019-1024(1993),两篇均在此收编作为参考)。已显示此基元在报道基因定位中是有效的并可用于锚定TCR的zeta链。为了定位此融合蛋白质至质膜上,将此基元放于可变区的氨基末端。其它诸如棕榈酰化之类的修饰可用于锚定融合蛋白质至质膜中;例如,来自G蛋白偶联受体激酶GRK6序列的棕榈酰化序列[LLQRLFSRQDCCGNCSDSEEELPTRL,下划线的半胱氨酸被棕榈酰化;Stoffel等,生物化学杂志269:27791-4(1994)];来自视紫红质的棕榈酰化序列[KQFRNCMLTSLCCGKNPLGD;Barnstable和Morabito,J.Mol.Neurosci.5(3):207-9(1994)];和p21H-ras1蛋白质[LNPPDESGPGCMSCKCVLS;Capon等,自然302:33(1983);Cadwallader等,细胞分子生物学14(7):4722-30(1994)]。在优选的实施方案中,融合对象是溶酶体定向序列,包括,例如,溶酶体降解序列,如Lamp-2[KFERQ;Dice,Ann.N.Y.Acad.Sci.674:58-64(1992)];或来自Lamp-1的溶酶体降解序列[MLIPIAGFFALAGLVLIVLIAYLIGRKRSHAGYQTI,Uthayakumar等,细胞分子生物学研究41:405-20(1995)]或来自Lamp-2的溶酶体降解序列[LVPIAVGAALAGVLILVLLAYFIGLKHHHAGYEQF,Konecki等,Biochem.Biophys.Comm.205:1-5(1994)],二者均显示了斜线部分的跨膜结构域和下划线部分的细胞质定向信号。或者,融合对象可以是线粒体定位序列,包括线粒体基质序列[如酵母乙醇脱氢酶Ⅲ;MLRTSSLFTRRVQPSLFSRNILRLQST;Schatz,欧洲生化杂志165:1-6(1987)];线粒体内膜序列(酵母细胞色素c氧化酶亚基Ⅳ;MLSLRQSIRFFKPATRTLCSSRYLL;Schatz,见上文);线粒体膜间间隙序列(酵母细胞色素cl;MFSMLSKRWAQRTLSKSFYSTATGAASKSGKLTQKLVTAGVAAAGITASTLLYADSLTAEAMTA;Schatz,见上文)或线粒体外膜序列(酵母70kD外膜蛋白质;MKSFITRNKTAILATVAATGTAIGAYYYYNQLQQQQQRGKK;Schatz,见上文)。融合对象还可来自内质网序列,包括来自钙网蛋白[KDEL;Pelham,Proc.R.Soc.Lond.B.BioL.Sci.,250:1-10(1992)]或腺病毒E3/19K蛋白[LYLSRRSFIDEKKMP;Jackson等,EMB0J.9:3153-62(1990)]的序列。此外,定向序列还包括过氧化物酶体序列[例如,来自荧光素酶的过氧化物酶体基质序列;SKL;Keller等,美国国家科学院院报84:3264-8(1987)];法尼基化序列[例如,P21H-ras1;LNPPDESGPGCMSCKCVLS,下划线的半胱氨酸被法尼基化;Capon,见上文;Zhang等,生物化学,35(25):8166-71(1996)];香叶基香叶基化序列[例如,蛋白质rab-5A;LTEPTQPTRNQCCSN,下划线的半胱氨酸被香叶基香叶基化(geranylgeranylated);Farnsworth,美国国家科学院院报91:11963-7(1994)];或破坏序列[细胞周期蛋白B1;RTALGDIGN;Klotzbucher等,EMBOJ.15(12):3053-64(1996)]。在优选的实施方案中,定向序列是能影响DP-蛋白质分泌的分泌信号序列。例如,存在大量已知的分泌信号序列,它们被置于DP-蛋白质区域的氨基末端时将在分泌过程中从各自的融合蛋白质上被切割下来。合适的分泌信号序列包括来自IL-2[MYRMQLLSCIALSLALVTNS;Villinger等,免疫学杂志155:3946-54(1995)]、生长激素[MATGSRTSLLLAFGLLCLPWLQEGSAFPT;Roskam和Rougeon,核酸研究7:305-20(1979)]的信号序列;前胰岛素原[MALWMRLLPLLALLALWGPDPAAAFVN;Bell等,自然284:26-32(1980)];和流感HA蛋白质[MKAKLLVLLYAFVAGDQI;Sekiwawa和Lai,美国国家科学院院报80:3563-71(1983)]的信号序列,在非下划线-下划线连接处之间断裂。特别优选的分泌信号序列是来自分泌细胞因子IL-4的分泌信号序列,它包括IL-4的如下头24个氨基酸MGLTSQLLPPLFFLLACAGNFVHG。其它的分泌信号肽论述于vonHeinje,见上文。在优选的实施方案中,融合对象是赋予DP或DP-蛋白质或编码它们的核酸以稳定性的稳定性序列。因此,例如,为了保护蛋白质免于按perVarshavsky’sN-端规则[Bachmair等,科学234:179-86(1986);Gonda等,生物化学杂志264:16700-12(1989);Varshsfsky,基因细胞,2(1):13-28(1997)]的遍在蛋白化,通过在起始甲硫氨酸后掺入甘氨酸(MG或MGG)可稳定蛋白质,从而使其在细胞质中有较长的半寿期。同样地,C-末端有一个或两个脯氨酸将赋予肽较强的抗羧肽酶抗性。脯氨酸前两甘氨酸的存在保证了柔韧性并防止双脯氨酸中的结构起始活动被扩展到候选肽结构中。因此,优选的稳定序列如下MG(X)nGGPP、MG(X)nGPP、MGG(X)nGGPP和MGG(X)nGPP,其中X是任何氨基酸,而n是至少为4的整数。在优选的实施方案中,为了提高DP-蛋白质的溶解性,将赖氨酸加入N-末端,其中可以包含或不包含甘氨酸间隔子。例如,可制备DP-蛋白质K6G4-EFLIVKS-蛋白质-EFLIVKS,它具有与未添加K6G4的DP-蛋白质不同的特性(见实施例)。在此实施方案中,可实验性地测定赖氨酸残基和接头序列的数目,以保证产生的DP-蛋白质具有预期的特性。在优选的实施方案中,使用了融合对象的联合。因此,例如,可使用任何数目的融合对象、定向序列、挽救序列和稳定序列的组合,有或无接头序列均可。如下文所进一步详述的,通过利用至少含一个克隆位点用于接收随机和/或偏性文库的基础载体,可将编码DP-蛋白质的核酸5’和3’端插入编码多种融合对象的核酸中。在优选的实施方案中,DP、DP-蛋白质、与融合对象融合的DP或与本发明融合对象融合的DP-蛋白质可被进一步修饰。如上所详述,至少一个二聚作用肽(DP)与目的蛋白质(P)融合的化合物,例如,产生DP-P、P-DP、DP-P-DP或类似化合物(其中DP是二聚作用肽而P是目的蛋白质),它们均共同被称为“DP-蛋白质”。DP和DP-蛋白质的共价修饰包括在本发明的范围内。一种类型的共价修饰包括用能与DP或DP-蛋白质所选侧链或者N-或C-末端残基反应的有机衍生剂与目标氨基酸残基反应。双功能试剂的衍生化作用是有用的,例如,用于将DP或DP-蛋白质与水不溶性支持基质或表面交联,以便在纯化抗DP或抗DP-蛋白质抗体的方法或者筛选试验中使用,下文对此有更详细的描述。通常使用的交联试剂包括,如,1,1-双(重氮基乙酰基)-2-苯乙烷、戊二醛、N-羟基-琥珀酰亚胺酯,如,与4-叠氮基水杨酸的酯、同双功能性亚氨酸酯,包括诸如3,3’-二硫代(琥珀酰亚胺基丙酸酯)之类的二琥珀酰亚胺基酯、诸如双-N-马来酰亚胺基-1,8-辛烷之类的双功能性马来酰亚胺类和诸如3-[(对叠氮基苯基)二硫代]丙亚氨酸甲酯之类的试剂。其它的修饰包括谷氨酰胺酰基和天冬酰胺酰基脱酰氨基化相应的谷氨酰和天冬氨酰残基、脯氨酸和赖氨酸的羟基化、丝氨酰和苏氨酰残基上羟基的磷酸化作用、赖氨酸、精氨酸和组氨酸侧链氨基的甲基化作用[T.E.Creighton,蛋白质结构和分子特性,W.H.Freeman&amp;Co.,旧金山,第79-86页(1983)]、N-末端氨基的乙酰化和任何C-末端羧基的酰氨化。包含于本发明范围内的DP或DP-蛋白质的另一类型共价修饰包括改变多肽的天然糖基化模式。“改变天然的糖基化模式”指,为本发明目的缺失DP或DP-蛋白质中的一个或多个碳水化合物部分,并/或添加一个或多个不存在于DP或DP-蛋白质内的糖基化位点。通过改变其氨基酸序列可以添加糖基化位点至DP或DP-蛋白质上。例如,通过添加或取代一个或多个丝氨酸或苏氨酸残基至DP或DP-蛋白质的天然序列中(用于0-连接糖基化位点)可进行变更。可任选地通过DNA水平的改变变换DP或DP-蛋白质氨基酸序列,尤其是通过在预选碱基处突变编码DP或DP-蛋白质的DNA以便产生将翻译成预期氨基酸的密码子。通过体外诱变在DNA中引入突变的方法对本领域技术人员来说是众所周知的,并可在以下文献中找到,例如,Sambrook等,分子克隆实验室手册(纽约冷泉港实验室出版社,1989)和Ausubel等,分子生物学中的简短流程(JohnWiley&amp;Sons,Inc.,1995)。增加DP或DP-蛋白质中碳水化合物部分数目的另一方式是将糖苷化学或酶促偶联至多肽上。在本领域中这样的方法描述于,例如,发表于1987年9月11日的WO87/05330,和Aplin和Wriston,CRCCrit.Rev.Biochem.,10(4):259-306(1981)。通过化学或酶促方法或者突变取代编码作为糖基化目标之氨基酸残基的密码可完成DP或DP-蛋白质上碳水化合物部分的去除。化学去糖基化技术是本领域是已知的,例如,描述于文献,Sojar和Bahl,Arch.Biochem.Biophys.,259:52-57(1987)和Edge等,Anal.Biochem.,118:131-137(1981)。如文献Thotakura和Bahl,酶学方法138:350-359(1987)中描述的,通过使用各种内切和外切糖苷酶可完成多肽上碳水化合物部分的酶促切割。另一类型的共价修饰包括,以美国专利号4640835、4496689、4301144、4670417、4791192或4179337中所示的方式连接DP或DP-蛋白质至各种非蛋白聚合物之一上,如,聚乙二醇、聚丙二醇或聚氧化烯。如本领域技术人员应理解的,可以多种方式制备本发明的DP、DP-蛋白质和融合蛋白质。在优选的实施方案中,如本领域所众所周知的,可合成制备DP、DP-蛋白质和融合蛋白质。在优选的实施方案中,如本领域所众所周知的,用核酸编码DP、DP-蛋白质和融合蛋白质。在优选的实施方案中,包括候选DP-蛋白质在内的DP-蛋白质是核酸的翻译产物。候选DP-蛋白质包含随机化检测蛋白质。即,如上所述,每个候选DP-蛋白质具有一随机化部分,这是下述筛选方法的基础。此外,除随机化部分之外,候选DP-蛋白质还可包括融合对象。在此实施方案中,核酸被引入细胞内,细胞表达该核酸以产生DP-蛋白质(或候选DP-蛋白质)。如上所概述的,DP-蛋白质由核酸编码。“核酸”或“寡核苷酸”或其语法上相当用语在此表示共价连接在一起的至少两个核苷酸残基。本发明的核酸通常将包括磷酸二酯键。可进行核糖-磷酸主链的修饰以方便加入如标记之类的附加部分,或提高生理环境中所说分子的稳定性和半寿期。核酸分子可以是单链或双链的,或同时包含双链和单链序列部分。核酸可以是RNA,包括RNA、mRNA和确定或随机的寡核糖核苷酸。核酸可以是DNA,包括基因组DNA、cDNA和确定或随机的寡脱氧核糖核苷酸。核酸还可以是杂合的,其中核酸包含脱氧核糖核苷酸和核糖核苷酸的任何组合以及核苷酸碱基的任何组合。如果存在,核酸编码DP-蛋白质和融合对象。此外,在需要时,核酸通常还将包含引起翻译或转录的额外序列。通常,编码DP蛋白质的核酸被掺入诸如质粒载体或逆转录病毒载体之类的合适载体中。在优选的实施方案中,当质粒载体被用于表达DP-蛋白质时,该核酸通常是DNA。在另一优选的实施方案中,当逆转录病毒载体被用于表达DP-蛋白质时,核酸通常是RNA。在优选的实施方案中,载体被用于表达候选DP-蛋白质。此处的“载体”表示含核酸并能用于转化宿主细胞的复制子。载体可以是自主复制的染色体外载体,称为“质粒”或“质粒载体或整合入宿主基因组的载体。优选的实施方案利用逆转录病毒载体,如下文更详述的。对于非逆转录病毒的实施方案,合适的载体来自任何数目的已知载体,包括,但不局限于,pcDNA3.1(Invitrogen)、pSI(PromegaCorporation)和pBI(ClontechLaboratories,Inc.)。基本上,任何带诸如CMV之类强启动子的哺乳动物表达载体可用于构建表达DP-蛋白质的载体。一般说来,这些表达载体包括可操作性地与待表达核酸连接的转录和翻译调节核酸。此上下文中的“可操作性地连接”表示转录和翻译调节核酸相对于编码序列(如,编码DP-蛋白质)所处位置能起始转录并保证蛋白质的翻译。通常,这将意味着启动子和转录起始或开始序列定位于编码区的5’端。如本领域技术人员将理解的,转录和翻译调节核酸对于所用宿主细胞通常应是合适的。已知在本领域中有许多合适的表达载体和合适的调节序列可用于各种宿主细胞。大体上,转录和翻译调节序列可包括,但不局限于,启动子序列(包括CAAT盒和TATA盒)、核糖体结合位点(包括内部核糖体进入位点(IRES))、转录起始和终止序列(包括mRNA聚腺苷酸化序列5’-AATAAA-3’)、RNA剪接序列、翻译起始和终止序列(包括5’和3’非翻译区、起始密码子(ATG)、冈崎共有序列(5’-A/GNNATGG-3’)和无义密码子(UAA、UAG、UGA))、组成型或诱导型增强子、激活子或阻遏子序列(位于启动子上游、下游或与其重叠,是细胞系依赖型、组织特异型或时间依赖型的)和蛋白质定向信号(包括内质网保持和细胞外分泌的信号,定位于质膜、过氧化物酶体、核、线粒体、溶酶体、高尔基复合体和粘着斑的信号)。在优选的实施方案中,调节序列包括启动子和转录起始和终止序列。启动子序列包括组成型和诱导型启动子序列[例如,见Walther和Stein,J.Mol.Med.74(7):379-92(1996)]。在优选的实施方案中,启动子是组成型的,并驱动如DP-蛋白质编码核酸的高水平表达。启动子可以是天然存在启动子,杂合或合成启动子。联合一个以上启动子的元件的杂合启动子是本领域所已知的,并可用于本发明中。尤其优选用于哺乳动物细胞中表达的启动子是CMV启动子。优选的逆转录病毒启动子论述如下。在优选的实施方案中,启动子与至少一拷贝编码DP-蛋白质的核酸联合。编码融合蛋白质部分的各个组分,如二聚蛋白质、目的蛋白质和一个或多个融合对象,可插入含至少一个合适克隆位点的亲代载体中,优选插入到启动子序列的3’端。在优选的实施方案中,融合蛋白质编码核酸由各个组分组成,产生融合蛋白质如DP-L-蛋白质-L-DP或N-DP-L-蛋白质-L-DP,其中‘N’是核定位信号,‘DP’是二聚作用肽,‘L’是接头序列,而‘蛋白质’是目的蛋白质。如上所详述的,编码融合蛋白质各个组分的核酸组分的许多可能组合可被构建。用本领域技术人员已知的方法产生这样的载体,参见,例如,Sambrook等,分子克隆实验室手册(纽约冷泉港实验室出版社,1989)和Ausubel等,分子生物学中的简短流程(JohnWiley&amp;Sons,Inc.,1995)。预定构象的载体适于包含于试剂盒中。所说载体的最终使用者将必须把编码目的蛋白质的核酸或目的蛋白质的文库插入便利的克隆位点中。在另一优选实施方案中,挽救序列被用于分离编码DP-蛋白质的核酸。在此实施方案中,挽救序列可以是用作探测靶位点的独特寡核苷酸序列,它允许通过PCR、杂交或相关技术快速和方便地分离核酸构建体。此外,载体可包含如复制起点、选择基因等附加元件,详述于以下文献中Kriegler,基因转移和表达实验室手册,FreemanandCompany,纽约,(1990)和Murray,分子生物学方法,卷7基因转移和表达方法,HumanaPress(1991)。编码目的蛋白质的核酸可获自基因组DNA、cDNA及确定的寡核苷酸或随机核苷酸。通常DP-蛋白质和DP-融合蛋白质将由核酸编码并在其转录和相应mRNA的翻译后产生。在优选的实施方案中,编码例如上述DP融合肽(DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu)的核酸多联体可被插入合适的克隆载体(如下文所详述),导致诸如(DPhyd-Lp-蛋白质1-Lp-DPhyd-LG-DPLys-Lp-蛋白质2-Lp-DPGlu)n之类的串联DP-融合蛋白质的产生,其中n是至少为2的整数。正如本领域技术人员所显而易见的,除本文所述外,包括其二价和单价衍生物在内的多数DP融合蛋白质编码核酸可结合于合适载体中并可制备相应的DP-蛋白质。在一个实施方案中,逆转录病毒载体被用于表达候选DP-蛋白质,且编码候选DP-蛋白质的核酸通常是RNA。特别适合的逆转录病毒转染系统描述于以下文献中Mann等,细胞33:153-159(1983);Pear等,美国国家科学院院报90(18):8392-6(1993);Kitamura等,美国国家科学院院报92:9146-9150(1995);Kinsella等,人类基因治疗7:1405-1413(1996);Hofmann等,美国国家科学院院报93:5185-5190(1996);Choate等,人类基因治疗7:2247-53(1996);和WO94/19478和PCT/US97/01019;和其中引用的参考文献,所有这些均清楚地收编作为参考。可使用任何数目的合适逆转录病毒载体。优选的逆转录病毒表达载体包括基于鼠干细胞病毒[MSCV;参阅Hawley等,基因疗法1:136-8(1994)]和修饰的MFG病毒[Riviere等,美国国家科学院院报92:6733-7(1995)]的载体,以及pBABE(见PCTUS97/01019,收编作为参考)。其它的合适逆转录病毒表达载体来源于莫洛尼鼠类白血病毒并包括诸如pLNCX、pLXSN、pLAPSN之类的载体;自失活表达载体,如pSIR;双顺反子表达载体,如pLXIN;诱导型表达载体,如pRevTet-On、pRevTet-Off[ClontechLaboratories;还参阅Coffin和Varmus,在逆转录病毒(冷泉港实验室出版社,纽约,1996)]中。如上对于其它载体所述,逆转录病毒载体可包含诱导型和组成型启动子。优选组成型启动子并包括,但不局限于,CMV、SV40、Srα、RSV、EF-1a、UbC和TK启动子。一般说来,考虑到双顺反子操纵子,逆转录病毒表达载体可包含在内在核糖体进入位点(IRES)控制下的一个或多个选择基因(也称选择标记基因),并因此极大地促进了对一律高水平表达融合构建体的细胞的选择;还可包含驱动第二个基因表达的启动子,该基因相对于5’LTR为有义或反义方向。选择基因允许选择含载体的转化宿主细胞,尤其是哺乳动物细胞,保证载体的稳定性,因为不含载体的细胞通常会死亡。选择基因在本领域是众所周知的,且随所用的宿主细胞而变化。“选择基因”在此指编码赋予对选择剂之抗性的基因产物的任何基因或编码可选择表达此标记之细胞的标记的基因。合适的选择剂包括,但不局限于,新霉素(或其类似物G418)、杀稻瘟素S、histinidolD、博来霉素、嘌呤霉素、潮霉素B及其它药物。可插入双顺反子转录单元(见上文)并随后鉴定表达目的基因之宿主细胞的合适标记基因包括,但不局限于,如绿色荧光蛋白之类的自荧光标记、如lacZ之类的酶促标记和如CD8之类的表面蛋白质,等等。如对于其它载体的叙述,逆转录病毒载体可包含多种转录和翻译调节序列及用于亚克隆至少一个重组DNA片段的至少一个克隆位点。可将本发明的组合物引入宿主细胞以筛选能改变表达目的基因或目的蛋白质之细胞表型的生物活性剂。“引入”或语法上相当用语在此表示核酸以适于其随后表达的方式进入细胞。如下文所述,引入方法主要由靶向的细胞类型确定。方法例子包括CaPO4沉淀、脂质体融合、Lipofectin、电穿孔、病毒感染等[见Kriegler,基因转移和表达实验室手册(纽约牛津大学出版社,1991);Roth,动物细胞中的蛋白质表达,细胞生物学中的方法,卷43(圣地哥学术出版社,1994);和Murray,基因转移和表达方法,分子生物学中的方法,卷7(Clifton:HumanaPress,1991)]。本发明的组合物可稳定整合入宿主细胞基因组中(例如,使用逆转录病毒颗粒),或可瞬时或稳定地存在于细胞质中(即通过使用常规质粒,利用标准调节序列、选择标记等等)。因为许多药学上重要的筛选要求人或哺乳动物模型细胞目标,所以优选能转染所说目标的逆转录病毒载体。正如本领域技术人员应理解,本发明的细胞类型可广泛地变化。基本上,可使用任何细胞,优选哺乳动物细胞,尤其优选小鼠、大鼠、灵长类和人细胞。正如下文所更完整描述的,进行筛选以便细胞在存在候选DP-蛋白质时呈现可选择的表型。正如下文所更完整描述的,多种病理状况中所涉及的细胞类型尤其有用,只要设计合适的筛选方法选择由于其中存在候选DP-蛋白质而展示改变表型的细胞即可。因此,合适的细胞类型包括,但不局限于,所有类型的肿瘤细胞(尤其是黑素瘤、骨髓瘤、肺癌、乳癌、卵巢癌、结肠癌、肾癌、前列腺癌、胰腺癌和睾丸癌)、心肌细胞、内皮细胞、表皮细胞、淋巴细胞(T-细胞和B细胞)、肥大细胞、嗜酸性粒细胞、血管内膜细胞、肝细胞、包括单核白细胞在内的白细胞、诸如造血干细胞、神经、皮肤、肺、肾、肝和肌干细胞之类的干细胞(用于筛选分化和去分化因子)、破骨细胞、软骨细胞和其它结缔组织细胞、角质细胞、黑色素细胞、肝细胞、肾细胞和脂肪细胞。合适的细胞还包括已知的研究细胞,包括但不局限于,JurkatT细胞、NIH3T3细胞、CHO、Cos等。参阅ATCC细胞系目录,在此清楚地收编作为参考。在一个实施方案中,细胞可被遗传工程改造,即,除本发明的组合物外还包含外源核酸(例如,编码靶分子的核酸)。制备完成后,本发明的组合物在许多应用中都有用。本发明提供了可用于鉴定能相互作用、结合或调节第二种蛋白质活性的体内和体外蛋白质。在优选的实施方案中,本发明提供了产生、有效引入细胞并筛选影响信号途径之化合物的方法和组合物。除需要了解推测的信号活动和靶细胞中可观察到的生理变化外,对此信号途径可以了解不多或根本不了解。公开的方法包括进入胞内信号传导机制的策略。本发明还提供了信号途径要素的分离、将信号途径定性的工具和用于药物开发的前导化合物。本发明提供了筛选化合物,在此称为DP-蛋白质的方法,其能改变包含此蛋白之细胞的表型。“候选DP-蛋白质”在此指被研究功能、内在特性或与第二种蛋白质之相互作用的DP-蛋白质。候选DP-蛋白质的“DP”组分通常在分子文库内不改变,而候选DP-蛋白质的“蛋白质”组分是可变的。在一个实施方案中,多数候选DP-蛋白质是以分子文库的形式提供的。术语“分子文库”在此表示包括多种不同的DP-蛋白质、编码多种不同DP-蛋白质之多种分离的不同核酸和编码多种不同DP-蛋白质并包含于载体中的多种不同核酸。本发明的方法可用于体内快速筛选含大量候选DP-蛋白质的分子文库,其中DP-蛋白质的“蛋白质”组分由含随机寡核苷酸、cDNA片段或基因组DNA的候选核酸编码。因此,通过运送随机寡核苷酸、cDNA片段和基因组DNA至细胞,细胞机制产生候选DP-蛋白质。无需收集或体外合成候选DP-蛋白质,通过筛选相同的细胞即可完成高效的筛选。因此,本发明提供了筛选多种候选DP-蛋白质的方法及能改变细胞表型的效应子。细胞中的信号途径经常涉及导致细胞生理学中可用表型描述的改变的效应子刺激物(如,趋化因子、生长因子、激素等等)。尽管胞内信号途径在疾病发病机理中起关键作用,但在多数情况下,除起始刺激物和最终细胞应答外对信号途径所知甚少。当肽在胞内表达时,它们可调节胞内信号途径(Souroujon和Mochly-Rosen,Nat.Biotechnol.16(10):919-24(1998))并因此可参与蛋白质-蛋白质相互作用。可在化合物或肽的分子文库中筛选调节(如,正调节或负调节)信号途径的效应分子。从而在最小化蛋白质内所含的受约束肽也可用于设计调节胞内蛋白质-蛋白质相互作用的物质[Cunningham和Wells,Curr.Opin.Struct.Biol.7:457-462(1997)],它可能提供了调节胞内信号途径的一种新方法。如果用例如逆转录病毒载体将肽表达于活的哺乳动物细胞内,可通过细胞表型中确定的改变对其进行筛选,产生的活性肽可能提供了亲和分离其结合目标的路径。一些形式的构象受约束肽在用于活哺乳动物细胞中胞内组合化学的展示肽里可以是有用及甚至是必须的。不象噬菌体展示文库中的肽,胞内肽可能受分解代谢的影响并因此优选这些肽应是对细胞蛋白酶相对惰性的。尽管细胞内的肽分解代谢还未很好的定性,但已知在蛋白质的降解中涉及泛素-蛋白酶体系统[Goldberg等,生物化学378:131-140(1997);Hilt和Wolf,TrendsBiochem.Sci.21:96-l02(1996)],并可用作羧基八肽酶。可能涉及氨肽酶的进一步蛋白水解可导致肽降解成氨基酸[Lee和Goldberg,TrendsCellBiol.8:397-403(1998)]。在抗原呈递细胞中,产生自细胞质蛋白水解的短线性肽可通过肽转运蛋白TAPl和TAP2迁移至内质网上[Belich和Trowsdale,Mol.Biol.Rep.21:53-56(1995)]。发展用于表达肽胞内展示的支架可能是非常有用的,它(ⅰ)对蛋白水解相对惰性,导致表达蛋白质增强的胞内稳定性和更高的稳态浓度和(ⅱ)它还小到足以允许进入蛋白质上诸如活性位点裂缝之类的结合位点。此支架的紧密特性应可降低所表达蛋白质的柔性并减少构象熵值、有效提高各构象体浓度。这一点和提高的对蛋白水解的稳定性应反过来使这些支架(如当用作肽文库时)更可能包含活性蛋白质,因为需较高的浓度使较弱结合相互作用饱和。这有利于通过较低亲和性肽的表型选择筛选生物活性肽,并因此可检测具更大生物活性的肽。这样的增强蛋白水解稳定性和减少构象熵的特性还可使更紧密的结构更利于作为潜在的治疗剂。添加特异短序列至肽的N-和C-末端可能对于增强上述特性是有用的。环状结构[Leszczynski和Rose,科学234:849-855(1986)]可能是尤其令人感兴趣的,因为环是球状和紧密的,通常位于蛋白质的表面,并常常可能涉及蛋白质功能和蛋白质-蛋白质相互作用。在优选的实施方案中,本发明的组合物被用于筛选候选的生物活性物;即DP-蛋白质(见上文)中的检测蛋白质是生物活性物。作为分子文库的一部分,候选DP-蛋白质被引入合适的宿主细胞内,以筛选能改变包含或表达该候选DP-蛋白质的宿主细胞表型的DP-蛋白质。若需要,将细胞处理成适于表达编码候选DP-蛋白质的基因(例如,当使用诱导型启动子时)的状态,从而产生候选表达产物。在优选的实施方案中,筛选第一细胞群。即通过改变的表型筛选分子文库被引入、提供候选DP-蛋白质的细胞。因此,在此实施方案中,在产生其的同一细胞中可观察到候选DP-蛋白质的作用,即自泌作用。“细胞群”在此指大约103-108或109,优选106-108个细胞。此细胞群包含细胞文库,其中此细胞文库中的各细胞通常包含分子文库中的一员,即一种不同的候选DP-蛋白质或一种不同DP-蛋白质的编码核酸,尽管如本领域技术人员理解的,细胞文库中的一些细胞可能不包含分子文库的一员,而一些可能包含一个以上成员。当使用除逆转录病毒感染外的方法将候选DP-蛋白质引入细胞群时,细胞文库各细胞成员中候选核酸的分配变化可能较大,因为通常难于控制电穿孔等过程中进入细胞的核酸数目。在优选的实施方案中,将分子文库引入第一细胞群中,在不同于第一细胞群,即通常是不同的细胞类型的第二或第三细胞群中筛选所表达候选DP-蛋白质的作用。即,候选DP-蛋白质的效果是由于对第二细胞的胞外作用;即内分泌或旁分泌作用。这一点通过使用标准技术完成。第一细胞群可生长于培养基中或培养基上,使培养基(称“条件培养基”)接触第二细胞群和检测效果。或者,在细胞间可能存在直接的接触。因此,“接触”是功能性的接触,包括直接和间接的。在此实施方案中,第一细胞群可以被筛选或不被筛选。因此,本发明的方法包括将随机候选核酸的分子文库引入细胞群中,产生细胞文库。每种核酸包含编码不同DP-蛋白质的、不同且通常是随机化的核酸序列。如下文所更完整描述的,筛选细胞群中呈现改变表型的细胞。表型的改变是由于存在DP-蛋白质。“改变的表型”或“变化的生理状态”或其它语法上的相当用语在此表示细胞表型以某种方式改变,优选以一些可探测和/或可检查的方式。如本领域技术人员将理解的,本发明涉及广泛种类的细胞类型和可用本发明方法检测的潜在表型改变。因此,任何可观察、探测或检查的表型改变可以是本文筛选方法的基础。合适的表型改变包括,但不局限于总的物理变化,如细胞形态、细胞生长、细胞生存力、对基质或其它细胞的粘附及细胞密度的改变;一种或多种RNA、mRNA、蛋白质、脂类、激素、细胞因子或其它分子的变化;一种或多种RNA、mRNA、蛋白质、脂类、激素、细胞因子或其它分子平衡态(即半寿期)的变化;一种或多种RNA、mRNA、蛋白质、脂类、激素、细胞因子或其它分子定位的变化;一种或多种RNA、mRNA、蛋白质、脂类、激素、细胞因子、受体或其它分子生物活性或比活性的变化;离子、细胞因子、激素、生长因子、蛋白质或其它分子分泌的变化;细胞膜电势、极化、整合或转运的改变;病毒和细菌病原体传染性、易感性、潜伏期、粘附和吸收的改变;等等。“能改变表型”或语法上的相当用语在此表示候选DP-蛋白质可以某种可探测和/或可检查方式改变细胞表型。如下文和PCT/US97/01019中更完整描述的,改变的表型可以多种方式被检测,并通常将取决和相应于被改变的表型。一般说来,用下述方法检测改变的表型,例如细胞形态的显微分析;标准细胞生存力试验,包括增加的细胞死亡和增加的细胞生存力,例如,目前抵抗由于病毒、细菌或者细菌的或合成的毒素引起的细胞死亡的细胞;标准标记试验,如用于指示特异细胞或分子存在情况或水平的荧光指示试验,包括FACS或其它染色技术;在杀死细胞后靶化合物表达的生化检测;监测靶细胞中基因表达的改变,等。如本文所更完整描述的,在某些情况下,检测细胞中改变的表型,所说细胞中引入了含随机化核酸或随机化蛋白质的分子文库;在其它实施方案中,检测对第一细胞的某些分子信号应答的第二细胞中改变的表型。在优选的实施方案中,通过其进入核的转位,DP-蛋白质调节基因表达,引起靶基因增加或降低表达。在一个实施方案中,转录活化蛋白质与DP-蛋白质结合并因此可被失活或防止它激活其靶基因。在此实施方案中,DP-蛋白质包含对靶转录激活剂例如HIVtat蛋白质具亲和性的蛋白质。在另一实施方案中,由于包含与转录阻遏子具亲和性的蛋白质组分,DP-蛋白质可导致靶基因增加表达。通过转录阻遏子与DP-蛋白质的结合,它可被失活或被阻止与其靶基因的结合,因此导致目的基因的更高表达。在优选的实施方案中,一旦具改变表型的细胞被检测出来,即将细胞自不具改变表型的细胞群中分离出。如本领域已知的,这可以任何数目的方法进行,在某些情况下依赖于试验或筛选。合适的分离技术包括,但不局限于,FACS、利用补体的溶胞选择、细胞克隆、利用Fluorimager的扫描、“存活”蛋白质的表达、细胞表面蛋白质或可发荧光或可标记用于物理分离的其它分子的诱导表达;将非荧光分子转变成荧光分子的酶的表达;相对无或慢生长背景的过生长;细胞死亡和DNA的分离或其它细胞生存力的指示染料,等。在优选的实施方案中,编码候选DP-蛋白质的候选核酸分子和/或候选DP-蛋白质被分离自具改变表型的细胞。这可用许多方式进行。在优选的实施方案中,与载体中共有DNA区域或分子文库特异组分如上文所述挽救序列互补的引物,被用于“挽救”编码候选DP-蛋白质的独特随机核酸。或者,用可操作性地连接于候选DP-蛋白质的挽救序列分离候选DP-蛋白质(如上所述)。因此,例如,利用免疫沉淀或亲和柱,可用含表位标记或纯化序列的挽救序列挑选出生物活性剂。在某些情况下,如下概述,如果在生物活性剂和靶分子间存在足够强的结合相互作用,这还可以挑选出主要的靶分子。或者,可用质谱检测此肽。一旦挽救出,可测定编码候选DP蛋白质的候选核酸序列和/或候选DP-蛋白质的序列。此信息可用于许多方面。通常,当基因组文库或cDNA文库或获自其中的DNA片段用于本文所列筛选方法中时(即,当它们用于编码候选DP-蛋白质时),编码检测蛋白质的核酸序列是非全长的,即,该核酸序列不编码完整的检测蛋白质。“全长”cDNA、基因、mRNA、RNA或语法上相当用语在此表示编码如同其相应细胞遗传位置所编码一样的完整蛋白质的任何核酸。除完整蛋白质编码序列外,全长cDNA、基因、mRNA或RNA可任选地包含5’和3’非翻译核酸序列。完整的蛋白质可包括通过相应mRNA翻译掺入并可随后从天然蛋白质上去除的氨基酸,如分泌信号肽序列或蛋白质剪接和蛋白质加工中涉及的序列。“全长蛋白质”或语法上相当用语在此表示由全长cDNA、基因、mRNA或RNA编码的蛋白质。正如本领域技术人员所理解的,全长蛋白质可包括翻译后修饰,包括,但不局限于,信号肽切割、蛋白质剪接、蛋白质前体加工、糖基化作用,等等。因此,“部分cDNA”、“部分基因”、“部分mRNA”、“部分RNA”或“部分蛋白质”或语法上相当用语意指代表全长cDNA、基因、mRNA、RNA或蛋白质一片段的cDNA、基因、mRNA、RNA或蛋白质。因此,在优选的实施方案中,测定的部分挽救蛋白质核酸序列信息可用于分离DP-蛋白质的全长编码序列。用部分序列信息分离和鉴定全长编码序列是本领域所众所周知的。在优选的实施方案中,为了证实细胞中最初观察到的改变表型,将编码候选DP-蛋白质的核酸,或者编码其全长形式或全长形式任何片段的核酸,或候选DP-蛋白质的衍生物(见下文)引入宿主细胞。这些细胞可以与最初的筛选实验中所用细胞相同或不同。这可通过使用逆转录病毒或者使用与HIV-1Tat蛋白质和类似物及相关蛋白质的融合体进行,它可被高吸收入靶细胞。参见,例如,Fawell等,美国国家科学院院报91:664-8(1994);Frankel和Pabo,细胞55:1189-93(1988);Sayion等,生物化学杂志256:1149-54(1981);Derossi等,生物化学杂志269:10444-50(1994);和Baldin等,EMBOJ.9:1511-7(1990),所有均收编作为参考。在优选的实施方案中,重组DP-蛋白质被产生(如下文所进一步概述的)并用于证实靶细胞表型的改变。当在上述第二或第三细胞群中观察到表型改变时,这是一优选的实施方案。即,候选DP-蛋白质的作用可归因于它从产生它的第一细胞中分泌出来,然后与第二细胞(即不同细胞)上的细胞受体结合或用不同方式内在化并随后在此第二细胞上行使其功能。在此实施方案中,重组DP-蛋白质或其衍生物被提供给第二细胞并监测表型的改变。在优选的实施方案中,编码DP-蛋白质或其衍生物(在此也称为目的蛋白质)的核酸被用于表达相应的重组蛋白质。可制备包括病毒和非病毒表达载体在内的各种表达载体,用于在各种系统中重组蛋白质的表达,包括,但不局限于,酵母、细菌、古细菌、真菌、昆虫细胞和动物细胞,包括哺乳动物细胞。目的蛋白质还可作为融合蛋白质表达,包括与融合对象的融合体(如前所概述的),或与其它蛋白质序列的融合体。通过培养编码目的蛋白质的核酸(通常作为表达载体)已引入的宿主细胞,在合适条件下诱导或引起重组蛋白质的表达,生产重组目的蛋白质。在优选的实施方案中,在表达后纯化重组蛋白质。用于重组蛋白质表达的许多合适方法,包括表达载体的产生、融合蛋白质的产生、将表达载体引入宿主细胞、宿主细胞中的蛋白质表达和纯化方法在本领域中都是已知的,并被描述于以下书本中,例如Ausubel等,分子生物学中的简短方法(JohnWiley&amp;Sons,Inc.,1995);O’Reilly等,杆状病毒表达载体实验室手册(纽约牛津大学出版社,1994);Kriegler,基因转移和表达实验室手册(纽约牛津大学出版社,1991);和Deutscher,蛋白质纯化指导,酶学方法,卷182(圣地哥AcademicPress,Inc.,1990)。在优选的实施方案中,DP-蛋白质或编码它的核酸被用于鉴别靶分子,即DP-蛋白质与其相互作用的分子。正如本领域技术人员将理解的,可以是DP-蛋白质直接结合或作用的初级靶分子,也可以是被DP-蛋白质影响的信号途径一部分的次级靶分子。在优选的实施方案中,DP-蛋白质被用于挑选靶分子。例如,如本文概述的,如果靶分子是蛋白质,使用与DP-蛋白质可操纵连接的表位标记或纯化序列通过生化方法可纯化初级靶分子[共免疫沉淀、亲和柱等,例如,参见Deutscher,蛋白质纯化指导,酶学方法,卷182(圣地哥AcademicPress,Inc.,1990);Harris和Angal,蛋白质纯化方法实用方法(牛津牛津大学出版社的IRL出版社,1994);Harris和Angal,蛋白质纯化方法实用方法(牛津牛津大学出版社的IRL出版社,1990)]。或者,当表达于细菌中并已纯化时,重组DP-蛋白质可用作探测制备自靶细胞类型mRNA的cDNA表达文库的探针。或,在酵母或哺乳动物双或三杂交系统中,DP-蛋白质可用作“诱饵”蛋白质(如当确定序列的DP-蛋白质用于筛选中以鉴定未知结合蛋白质时)或用作“检测”蛋白质(如,当已知蛋白质被用作诱饵并筛选含候选DP-蛋白质的分子文库时)(如,参见Fields和Song,自然340:245-6(1989);Vasavada等,美国国家科学院院报88:10686-90(1991);Fearon等,美国国家科学院院报89:7958-62(1992);Dang等,分子与细胞生物学11:954-62(1991);Chien等,美国国家科学院院报88:9578-82(1991);Luo等,生物技术22(2):350-352(1997)和美国专利号5283173、5667973、5468614、5525490和5637463)。这样的相互作用克隆方法已可非常有效用于分离DNA-结合蛋白质和其它相互作用的蛋白质组分。此DP-蛋白质可与其它药理激活剂联合用于研究正被讨论的信号转导途径的相互关系。还可能通过合成制备标记的DP-蛋白质或其衍生物并将其用于在表达于噬菌体、细菌或真核细胞的cDNA文库中筛选结合DP-蛋白质或其衍生物的cDNA。此外,还可能利用cDNA克隆技术通过逆转录病毒文库“补充”由DP-蛋白质诱导的作用。在这样的策略中,要求用化学计量滴定测量除特异信号途径的某些重要因子外还需多少DP-蛋白质。如果通过来自cDNA文库的cDNA的过表达可补充此分子或活性,就可克隆此目标。同样的,由任何上述酵母或噬菌体系统克隆的cDNA可以此方式被重引入哺乳动物细胞中,从而证实它们的作用补足了肽在所作用系统中的功能。一旦初级靶分子已被鉴定和证实,可用初级靶分子作“诱饵”以同一方式鉴定次级靶分子。以这种方式可说明信号途径。同样地,还可发现特异于次级靶分子的生物活性剂,从而可以有许多生物活性剂作用于一个信号途径中,例如用于联合疗法。在优选的实施方案中,将重组DP-蛋白质的分子文库用于体外结合试验中以鉴定能结合所选靶蛋白的成员,如受体、配基、酶,等等。通常,在本文方法的优选实施方案中,靶蛋白(可以是重组蛋白质或天然存在蛋白质)被非扩散性地结合于具分离样品接收区的不溶支持物上(如微量滴定板,阵列,等等)。不溶支持物可由靶蛋白可结合的任何组合物制备,它被方便地与可溶材料分离,并在其它方面与整个筛选方法相容。这样的支持物表面可以是固体或多孔的和任何方便的形状。合适的不溶支持物例子包括微量滴定板、阵列、膜和珠。这些通常用玻璃、塑料(如聚苯乙烯)、多糖、尼龙或硝酸纤维素、teflonTM,等等。微量滴定板和阵列尤其方便,因为可用小量试剂和样品同时进行大量试验。靶蛋白的特殊结合方式不是至关重要的,只要它与本发明的试剂和整个方法一致,保持靶蛋白的特性并为非扩散的即可。靶蛋白可直接(如通过交联)或间接(如通过抗体、其它蛋白质或核酸,等等)地与不溶支持物结合。优选的结合方法包括抗体的使用(不会空间性地封闭检测蛋白质的蛋白质-蛋白质相互作用表面,并优选直接抗可掺入重组诱饵蛋白质中的标记多肽)、直接与“粘性”或离子支持物结合、化学交联,等等。靶蛋白结合后,洗涤去除过量未结合物质。然后可通过与牛血清白蛋白(BSA)、酪蛋白或其它无毒蛋白质保温封闭样品接收区。将包含重组DP-蛋白质群的分子文库加入结合试验中。在促进最适结合的任何温度下进行结合试验,通常为4-40℃。为了最适的结合选择保温时间,但它还可被最优化以促进高流通量的筛选。通常时间在0.1-1小时就足够了。可用多种试验进行DP-蛋白质与靶蛋白结合的测定,包括体外蛋白质-蛋白质结合标记试验、电泳迁移率变动分析(EMSA)、蛋白质结合的免疫试验、功能性试验(磷酸化试验,等等)等等(例如,参阅Harlow和Lane,抗体实验室手册(纽约,冷泉港实验室出版社,1988)和Ausubel等,分子生物学中的简短流程(JohnWiley&amp;Sons,Inc.,1995)。本发明的筛选方法可用于在多种条件下筛选大量细胞类型。一般说来,宿主细胞是疾病状态中涉及的细胞,它们在通常于细胞上产生不合需要的结果的条件下被检测或筛选。当找到合适生物活性剂时,不合需要的后果可被降低或消除。或者,可降低或消除正常合乎需要的结果,以阐释与疾病状态或信号途径相关的细胞机制。这些方法概述于PCT/US97/01019,在此收编作为参考。以下实施例用于更完整地描述使用上述发明的方式,及提出预期执行本发明多种方面的最佳模式。应理解为这些实施例决非用于受限制本发明的真正范围,只是用于例证性的目的。所有此处引用的参考文献均全文收编作为参考。实施例1在苛刻条件下形成可观察二聚体的新肽通过灌注3×10-4M、pH6.4的EFLIVKS-酰胺溶液入电喷射源的FinniganLCQ离子诱捕质谱仪中,此肽看起来自联合形成二聚体(图3A),经过入口毛细管210℃的温度及苛刻的电喷射条件后,在气相中正好检测到分子量为单体分子量的两倍,因此预期其在水溶液中明显较低的浓度下发生二聚化。该肽在大约25%乙腈、约pH2.5条件下洗脱自C18反相柱时也形成二聚体(也可用质谱检测到)(图3B)。当两者均通过电喷射界面被连续灌注入离子诱捕质谱仪中时,比较图3A和检测肽SKVILFE(它在10-13M的水溶液中形成二聚体(Bodenmuller等,见上文))的二聚化作用,结果显示两种肽均有类似程度的二聚化(在大约10系数内)。这表明EFLIVKS可在很低的浓度下于水溶液中二聚化。EFLIVKS的二聚化不能从SKVILFE的二聚化中预计到,因为反向序列通常用作生物活性肽的无活性对照。对来自EFLIVKS-酰胺全单偶联fmoc合成的粗合成产物进行LC/MS检查,以寻求可在电喷射离子化后二聚化的较短序列的结果显示于图4。用99.9%水-0.1%TFA至99.9%乙腈-0.1%TFA的梯度HPLC洗脱二聚体。用括号内的乙腈百分比通过质谱检测以下截短序列的二聚体,所有的均在约为pH2.5下进行峰1,LIVKS-酰胺(23.5%),单体m/z=705.3,二聚体m/z=1409.3;峰4,EFLIVKS-酰胺(25%),单体m/z=834.4,二聚体m/z=1667.3;峰5,EFLIVK-酰胺(32%),单体m/z=747.4,二聚体m/z=1493.1。这些结果显示N-末端EF和C-末端S可被删除而不丧失二聚化作用。对被设计成形成短β折叠的肽VSIKFEL的检测显示,通过洗脱自C18反相柱,用质谱检测,在电喷射入离子室中后除单体形式(m/z=834.5)外还检测到肽的二聚化形式(m/z=1667.5)。这表明此包含改变亲水和疏水残基并因此可能形成β折叠的肽也可形成稳定的二聚体。实施例2加入18mer的检测肽N-和C-末端时EFLIVKS可形成紧密的蛋白水解抗性结构当与18mer检测多肽的N-和C-末端融合时,肽EFLIVKS可形成此多肽(在此也称为肽1)的紧密结构。此18mer多肽序列是VGTIVTMEYRIDRTRSFV,来自大麦c2-糜蛋白酶抑制剂[Leatherbarrow和Salacinski,生物化学30:10717-21(1991)]。在N-和C-末端均用半胱氨酸取代缬氨酸的该肽类似物,被认为折叠成与大麦糜蛋白酶抑制剂-2中环相似的紧密结构。这样的紧密结构应为诸如弹性蛋白酶之类蛋白酶的不良底物,且实际上已建议作为弹性蛋白酶、糜蛋白酶和枯草杆菌蛋白酶两个变体的抑制剂。此二硫基环化类似物已被我们合成和检测,它实际上是一较差的蛋白酶底物,但仍然是一底物,而非抑制剂。线性肽CGTIVTMEYRIDRTRSFC是弹性蛋白酶的一良好底物,保温3小时后产生大约15种肽(图5A),通过将反相hplc与蛋白水解片段的质谱检测和鉴定结合监测蛋白水解作用。在两半胱氨酸间具二硫键的同一肽也是弹性蛋白酶的底物,但具有较少的肽产物,且主要的起始切割发生于酪氨酸之后(图5B)。将二聚作用肽EFLIVKS与N-和C-末端融合(EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS-酰胺)产生更具蛋白水解抗性的构建体(图5C),大约3小时后几乎无蛋白水解迹象,只有很少量的一些不同切割产物。实施例3肽1低能构象体的检测为了检测肽1紧密结构的结构特性,用与发表的文献Nilges等,蛋白质工程2:27-38(1988)中相似的高温分子动力学模拟退火方法获得低能构象体,如Discover95中进行。每2psec保存一次结构(来自900K,持续时间400-1400psec的不同轨迹),用5ps的时间冷却至300K,并以距离依赖电介质常数(在80埃间隔时ε=80到1埃间隔时ε=1间线性变化)用200步最陡下降运算法则进行最小化,然后以必需多的步骤用结合梯度运算法则给出小于0.001kcal/A的最大量衍生物。从起始于以下结构的轨道收集和比较产生的低能结构a)肽1,该18mer多肽由其在大麦糜蛋白酶抑制剂1中的构象,[McPhalen和James,生物化学26:261-269(1987)],并随后用Discover2.9.5最小化,附着于自伸展构象最小化的两二聚作用肽;b)来自起始于最后结构之a)中轨迹后续的结构,但使用不同dseed(不同的起始速率)修饰轨道;c)具第三dseed的b)轨迹延伸;d)如a)起始的轨迹,只是二聚作用肽形成起始β折叠结构;e)如a)起始的轨迹,只是二聚作用肽形成起始右手α螺旋构象二聚体;f)起始自完全伸展的肽1的轨迹。收集和比较来自轨迹a-f在20kcal/mole最低能结构内的所有结构。图6显示了在肽主链最小平方排列后来自所有轨迹的45个最低能结构(只显示了肽主链)。检测时,所有的结构分别看起来是紧密的。主链构象的检测表明18mer多肽以不同方式折叠至二聚作用肽表面。空间填充模型显示产生的低能结构是包装良好的。这表明对于18个残基水平的多肽长度,这些构建体的文库可能是极小蛋白质或紧密结构的文库。这些微型蛋白质相对小的尺寸使得很容易确定nmr结构并因此建立结构-活性关系。这些紧密低能构象体还与观察到的此构建体对弹性蛋白酶的惰性一致。实施例4附着于多肽N-和C-末端的折叠肽帮助形成紧密结构所必需亲和性的估计结合非共价连接之第二肽序列的肽发挥功效,需要极高的亲和性,与此不同,此处制备紧密结构所需的亲和性要求较低。高亲和性肽很好,但非必需的。第二个拷贝的同型二聚作用肽粘连于离第一个二聚作用肽固定距离处(由多肽分隔),将导致第二个二聚作用肽有很高的局部浓度。此局部浓度的估计来自如下将二者粘连在一起的8mer多肽当完全伸展时,线性8mer约为3埃/残基×8残基或24埃长。因此离第二拷贝二聚作用肽的距离粗略估计应为20埃或更小,因为此肽不会在所有的(或甚至许多)构象中完全伸展。每隔20埃含一第二附着拷贝的二聚作用肽的溶液将具有约0.2mM的有效浓度。因此在此浓度的1/100,或2uM和更小浓度下形成同型或异型二聚体的肽将通过这样的二聚作用肽而99%环化。因此结合常数(对其自身或其二聚配体)在2uM或以下的任何同型或异型二聚作用肽将足以形成99%的环化肽。基于肽1的最小化结构,第二拷贝二聚作用肽可更接近第一拷贝而不到20埃,取决于插入折叠肽之间的多肽的折叠状态。如果平均距离是10埃,它的局部浓度将大约为1.6mM,从自结合常数为16uM或更小的二聚作用肽将获得99%的环化肽。实施例5肽构建体的合成以下材料获自指示来源受保护的N-αFmoc氨基酸衍生物购自AdvancedChemTech(Louisville,KY),所有的肽合成试剂,如二异丙基碳二亚胺(DIC)、N-羟基苯并三唑(HOBt)、2-(1-H-苯并三唑-1-基)1,1,3,3-四甲基脲六氟磷酸盐(HBTU)、三氟乙酸(TFA)、N,N-二异丙基乙胺(DIPEA)、哌啶、茴香硫醚、乙二硫醇和茴香醚购自Sigma(St.Louis,MO)。预装Fmoc-Xaa-Wang-树脂和H-Pro-2-Cl-Trt-树脂(用于合成C-末端Pro肽)购自Novabiochem(LaJolla,CA)。诸如二甲基甲酰胺(DMF)和二氯甲烷(DCM)之类有机溶剂购自FisherScientific(SantaClara,CA)并为分析级的。在ProteinTechnologiesInc.(Tucson,AZ)的自动Symphonyl/Multiplex多样肽合成仪上合成二聚化支架肽,随后是传统的Fmoc-化学。将偶联(1.5小时/偶联)和去保护(3X20分钟)步骤的持续时间稍微改变成现存的默认程序以获得高产量的预期肽。小心利用搅拌树脂混合物的氮气脉冲速率以保证树脂珠与加入试剂完全混合。标准的Fmoc相容性侧链保护基团,如用于丝氨酸、苏氨酸、谷氨酸、天冬氨酸、酪氨酸的叔丁基(tBu);用于谷氨酰胺、组氨酸、天冬酰胺的三苯甲游基(Trt);用于赖氨酸、色氨酸的叔丁氧羰基(Boc),用于相应的氨基酸衍生物。同样地,2,2,4,6,7-五甲基二氢苯并呋喃-5-磺酰基(Pbf)基团用作精氨酸的侧链保护[Fields和Fields,TetrahedronLett.34:6661(1993)]。用DMF和DCM混合物(50%,v/v)中5倍过量的Fmoc-保护的α氨基酸通过DIC/HOBt介导的偶联步骤进行两次偶联反应[Fields和Noble,Int.J.Pept.ProteinRes.35:161-214(1990);Hudson,有机化学杂志53:617-624(1988)]。在某些情况下(精氨酸、组氨酸和赖氨酸的偶联),为了保证反应的完成进行三份氨基酸偶联,且在困难条件下还采用了HBTU/HOBt偶联方法[Knorr等,TetrahedronLett.30:1927-1930(1989)]。未反应的氨基基团用DMF中的50%无水乙酸酐加帽。以自动方式在每个序列中偶联5个氨基酸后,暂停合成,用Kaiser’s检测[Kaiser等,Anal.Biochem.34:595-598(1970)]检查偶联反应的完成并进一步进行。合成末期,用DMF中的25%哌啶在30分钟内将N-末端的Fmoc基团去保护,用大量DCM洗涤树脂,然后用无水乙醇洗涤。在用无水乙醇进一步洗涤后,通过用由TFA(82.5%)/苯酚(5%)、茴香硫醚(5%)/乙二硫醇(2.5%)/水(5%)组成的King’s切割混合剂(试剂K)在室温处理3小时使肽以手工方式自树脂上裂解下来,在此期间,所有的侧链保护也均被同时去除[King等,Int.J.Pept.ProteinRes.36:255-266(1990)]。裂解下来后,用冷的二乙醚沉淀粗制肽,之后将沉淀溶于水/乙腈溶液中并如前所述冻干[Gururaja和Levine,肽研究9:283-289(1996)]。用与保护柱(10X50mm)偶联的半制备Rainin(Woburn,MA)Dynamax60埃反相氰柱(10X250mm)通过反相高效液相层析(RP-HPLC)(Hewlett-Packardmodel1100系列HPLC系统,具有UV可变波长DAD检测仪;旧金山,CA,USA)纯化冻干的粗肽提取物至均质。移动相缓冲液由A溶于水中的0.1%TFA和B溶于乙腈中的0.1%TFA组成。40分钟内0-40%缓冲液B的线性梯度被用于洗脱肽,流速2.0ml/分钟,如前所述用230和280nm的双波长检测方式(Gururaja和Levine,见上文)。收集含纯肽的部分并冻干。用实时电喷射离子化质谱(ESI-MS)技术确认纯化的合成肽的完整性和同一性,其中HPLC柱出口直接与装备有标准ESI源的FinniganLCQ质谱仪(SanJose,CA,USA)连接。质谱数据与预期值完全一致。用LC/MS测定,用于nmr研究的肽EFLIVKS-STKSIPPQS-EFLIVKS纯度超过99%。实施例6质谱观察到的肽二聚化作用将冻干白粉状肽溶于pH5.0的水中,检查最浓的母液的pH。纯化粗肽时,当开始观察到二聚体时,将Finnigan(SanJose,CA)LCQ质谱仪调到pH5.0时二聚体有最适信号强度。最适参数是被加热的入口毛细管,130-150℃,源电压4.0kV,毛细管电压38v,显象管镜头偏差(tubelensoffset)24v,外壳气体(sheathgas)40-80l/分钟,以及辅助气体20l/分钟。用连续注入速率5-1510ul/分钟进行所有的结合检测。二聚作用肽的相对离子流计算为S(所有二聚体离子的强度)/[S(所有的二聚体离子)+S(所有的单体离子)];在观察到时,将钠加合物离子也包括在内。为了用自联肽在各末端构建支架,我们检查了计划自联肽激素-神经肽头部激活剂部分序列的变体(Bodenmuller等,见上文)。经最初的检测后,含部分肽反向序列的类似物被用于进一步研究。为了建立此类似物EFLIVKS结合的化学计量,用电喷射质谱检查自联。为了结合研究,将质谱仪按肽的二聚化形式调整(见图3,数据未显示)。无证据显示找到三聚和四聚肽结合。当二聚体的相对离子电流强度对注入来源的肽浓度作图时,可见很符合直角双曲线的曲线(数据未显示)。此饱和二聚体的形成得到EFLIVKS表观结合常数为7.8uM。用该序列的不同类似物重复此实验(表1)。用赖氨酸置换N-末端的谷氨酸不会明显改变结合,显示这些肽不是仅仅由于形成相互的赖氨酸-谷氨酸相互作用而二聚化的。添加谷氨酸和赖氨酸以制备EEFLIVKKS导致自结合亲和力明显提高4倍。用丙氨酸分别置换各残基,监测二聚化作用。N-末端谷氨酸和C-末端丝氨酸的置换对表观二聚化常数几乎无影响,而F2、L3、I4、V5和K6用丙氨酸置换分别削弱结合5.4倍、9.7倍、5.4倍、10倍和超过6倍。表1.质谱检测的自二聚化常数<tablesid="table1"num="001"><table>肽序列Kd(app)μM肽序列Kd(app)μMEFLIVKS7.8AFLIVKS12KFLIVKS6.8EALIVKS42VSIKFEL13EFAIVKS76SKVILFE12EFLAVKS42EEFLIVKKS-酸2.1EFLIAKS82EFLIVAS>50EFLIVKA9.9</table></tables>实施例7由肽构建体抑制弹性蛋白酶100nM猪胰弹性蛋白酶(SigmaChemicalCo.,St.Louis,MO)在0.1MTris缓冲液,pH7.88,25℃的活性通过对100uM琥珀酰-丙氨酰-丙氨酰-丙氨酰-N-对硝基苯胺切割后在412nm监测1-2分钟。在此期间实验动力学是线性的。不同肽构建体的抑制作用测定进行如下将10uM肽与弹性蛋白酶保温1-1.5分钟,然后加入底物。抑制百分比计算为[1-{试验斜率(肽+弹性蛋白酶)/试验斜率(只用弹性蛋白酶)}]X100%。这些试验条件与Leatherbarrow和Salacinski所用的相同,见上文。作为插入N-和C-末端用于约束检测序列的肽序列EFLIVKS之间的检测序列,我们选择18merCi2b蛋白酶抑制环序列的一种变体。此序列已被报道(Leatherbarrow和Salacinski,见上文)为枯草杆菌蛋白酶、糜蛋白酶和弹性蛋白酶的极强抑制剂。为了检测这一点,我们测定了在与报道用二硫基环化形式以及EFLIVKS-受约束类似物相同的条件下弹性蛋白酶的抑制作用。结果如表2所示。在浓度500nM时,二硫基环化肽环化[CGTIVTMEYRIDRTRSFC]只引起猪胰弹性蛋白酶轻微的抑制作用,6.2%(n=3)。基于其所报道的390pM表观抑制常数(Leatherbarrow和Salacinski,见上文)及试验中所用底物浓度和Km,假设此推断的抑制肽是与底物竞争性的,估计会有99.9%的抑制作用。此相同的18mer序列,其中天然序列的N-和C-末端缬氨酸替换为半胱氨酸,也检测与其N-和C-末端融合之二聚作用肽的不同组合。它们均未明显抑制弹性蛋白酶(表2)。表2.猪胰弹性蛋白酶的肽抑制作用*试验在pH7.88,25℃条件下进行,用100μM琥珀酰-丙氨酰-丙氨酰-丙氨酰对硝基苯胺作为底物,于412nm观察。各个值均来自3-5份重复试样。**估计为%=100[抑制剂]/[抑制剂]+Ki(1+[底物]/Km),假设肽为竞争性抑制剂,其Ki为390pM。实施例8肽构建体的弹性蛋白酶水解为了检查弹性蛋白酶对不同肽的作用,将纯化的合成肽(10uM)在25℃溶于0.1MTrispH7.88。将弹性蛋白酶加到100nM。在时间0、15分钟和1、2、3、24小时时,将反应混合物部分试样加到0.1X25cmC18反相hplc柱(VydacInc.,HesperiaCA)上。用100%A(99.9%水,0.1%v/v三氟乙酸)的梯度洗涤反应混合物10分钟,然后用1%/分钟速度增加B梯度(99.9%乙腈,0.1%v/v三氟乙酸)至60%B的梯度洗涤,然后以5%/分钟速度增加至100%B的梯度洗脱。将肽直接从柱上洗脱至FinniganLCQ离子诱捕质谱仪的源中并检测之。自300-2000amu扫描肽,用MacBioSpec(惠赠自PE-Sciex,FosterCity,CA)通过搜寻其质量及全长肽不同片段的质量或将它们的质量与环肽存在情况下预期弹性蛋白酶水解片段不同的质量进行比较来鉴定它们。在2mM二硫苏糖醇(Sigma)存在下进行还原肽CGTIVTMEYRIDRTRSFC的蛋白水解。氧化肽的切割产物或不进行还原而直接层析,或在一部分试样先用1mMPMSF处理1小时、然后用30mMDTT处理10分钟后层析。为了进一步检查环[CGTIVTMEYRIDRTRSFC]缺乏预期弹性蛋白酶抑制活性的原因,以及检查表1中一些肽构建体弹性蛋白酶水解的稳定性,我们将浓度为10uM的各肽与100nM弹性蛋白酶在pH7.8,25℃保温3小时。然后将各反应混合物在微内径的C18反相柱上层析,用质谱鉴定肽片段。在经或不经随后的还原反应情况下检查环肽反应(数据未显示)。线性肽CGTIVTMEYRIDRTRSFC对弹性蛋白酶水解高度敏感,得到约11种不同的可鉴定到的肽(表3)。主要的切割是在Y9之后,另外的切割在I4、V5、T6、M7、T14和F17之后。环[CGTIVTMEYRIDRTRSFC]看起来比线性类似物断裂更慢,3小时后只在较少的位点被切割,主要是在Y9之后,也有在M7、T14和F17之后。在各末端附着有EFLIVKS的Ci2b环18mer被弹性蛋白酶作用3小时后未受明显攻击,最初只观察到在Y16之后有切割。层析中观察到的大部分低水平峰主要是合成的杂质,在未加入弹性蛋白酶时也存在。24小时后,产生足够的蛋白酶水解作用,在构建体中V5、M14、T21、F27和I29之后产生另外的弹性蛋白水解位点。因而在线性和环肽中切割产生于许多相同的残基处,但环肽中的速率大大降低。表3.Ci2b环肽和类似物的弹性蛋白酶水解肽鉴定。<tablesid="table3"num="003"><table>肽底物*肽底物肽底物线性CGTIVTMEYRIDRTRSFC环[CGTIVTMEYRIDRTRSFC]EFLIVKS-Ci2b插入片段-EFLIVKS亲本肽2150.2/2151.0亲本肽2149.8/2150.5亲本肽3775.2/3775.1CGTIVTMEY1016.3/1016.44c[CGTIVTMEYRIDRTRSFC]H2O2168.3/2168.5-于环中单一切割EFLIVKSVGTIVTMEY1828.6/1828.98RIDRTRSF1050.6/1050.58CGTIVTMEY1016.3/1016.44RIDRTRSFVEFLIVKS1965.1/1965.14RIDRTRSFC1152.6/1153.54RIDRTRSFC1153.3/1152.6EFLIV或VEFLI620.2/620.37CGTIVTMEYRIDRTRSF2048.2/2048.0RIDRTRSF1050.6/1050.58VEFLI或EFLIV620.1/620.37(第二峰二者均可能存在)CGTIVTMEYRIDRT1658.0/1658.0EYRIDRT952.4/952.49RSFVEF784.4/784.4CGTIVTM724.2/724.34KSVGTIVTM935.4/935.52EYRIDRTRSFC1444.9/1445.7EYRIDRT952.4/952.49VTMEYRIDRTRSF1673.8/1673.84MEYRIDRTRSFC1576.9/1576.74MEYRIDRT1083.6/1083.53TIMEYRIDRT1184.6/1184.57</table></tables>*呈现为肽片段/观察到的单种同位素质量/预计的单种同位素质量实施例9利用受约束的环肽进行氘交换实验通过溶解目的肽至pH5的水中,并在t=0时稀释此肽10倍至D2O中进行氘交换实验。对于最初的检测构建体来说,稀释于D2O后的肽浓度在10μM范围内。对于其它的时间点,通过在0℃或25℃添加含1%甲酸的2.5倍过量1∶1H2O∶MeCN淬灭部分肽溶液试样并立即注入质谱仪中。此酸性pH的升高减慢了用溶剂交换酰胺键中氢的速率。对于选定时间点,将注入头2分钟的质量与稍后2分钟的质量比较,以评估回交的显著性,它通常是1个质子或更少。可交换质子的总数用以下步骤得到1)最初溶解肽于DMSO中,淬灭前直接稀释其于D2O中并在数分钟后检测肽的新质量;2)将溶解于5%DMSO的肽稀释10倍至D2O中;或3)在100℃加热稀释于D2O中的肽溶液15分钟。其中涉及DMSO,因为在预备实验中将低水平的DMSO加入肽水溶液中似乎大大加速了质子的交换。用EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS进行3种方法实验,它们的结果相同。总交换质子的计算包括对稀释于D2O中后存在的10%体积的H2O进行校正。对于1mM范围内可溶的肽,来自pH5的10倍D2O溶液的样品被直接注入质谱仪中,无需淬灭。通过将质量高于全质子化形式的增益随时间的进程拟合成单指数函数,得到氘交换的速率常数和幅度。相对于暴露于表面的残基,当它们埋藏于蛋白质内部(水不可接触时)或包含于稳定的氢键中时,用氘化水进行的肽和蛋白质的酰胺主链质子交换将更慢[Englander等,蛋白质科学6:1101-1109(1997)]。质谱已用于检查各种不同蛋白质的氢交换特性(见Chung等,蛋白质科学6:1316-24(1997)和Smith等,质谱杂志32:135:146(1997)中最近的例子),以及慢交换质子的存在已用于推断三级结构的存在[McKnight等,分子生物学杂志12:126-34(1996)]。此处的氘交换研究于pH5的条件下进行,因为在pH4.5以下受约束的环看起来不保持用园二色性测定的结构(参见下文)。为了检测二聚作用肽受限制的Ci2b环肽的紧密度,测定通过稀释至D2O中时掺入氘的速率和化学计量。多种不同构建体的结果总结于表4。表4.受约束的Ci2b肽插入片段和其它肽插入片段的氘交换速率和幅度11数据表示的是二聚化物-插入片段-二聚化物形式的肽;除如提到的之外,二聚化物序列在N-和C-末端是相同的。218mer标准插入片段是Ci2b序列-VGTIVTMEYRIDRTRSFV-3快阶段幅度计算为最快的交换数据,最多持续约1小时测定氘交换构建体EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS-酰胺中质子的动力学(数据未显示)。通过完全的质子交换将总共66.5Da加到肽的零时刻质量中。在质子交换的快阶段,交换了29个质子;如果暴露于水中,预计大约33个侧链、N-和C-末端质子可在此pH被快速交换。另有16个质子以中等速率交换,速率常数为0.054/小时。这样留下了21个质子,它们的交换被认为比以此时间标准可观察到的更慢。来自与EFLIVKS中发现的质子最近邻的两类质子交换速率均慢于所检测到的表面暴露质子交换速率[Bai等,蛋白质结构、功能和遗传学67:75-86(1993)]。这些对照质子在pH5时以6-60/小时范围内的速度常数被氘交换。对附着于18mer插入片段同一末端的反向二聚作用肽序列得到相似的结果。对此18mer插入片段,明显更强的二聚作用肽EEFLIVKKS(表3)附着于插入片段的各端,还获得相似的结果。在这种情况下,1小时内70个可交换质子中有39个被氚交换,8个质子的交换速率常数为0.15/小时,而余下的23个质子交换得比这慢。此类似物中总共31个慢交换质子比亲代肽的37个质子稍少,显示在两构建体间有一些细微的结构改变。对于具与亲代肽N-端融合之赖氨酸6-甘氨酸4-的肽类似物(设计成增强肽的溶解力),1小时内除约5个质子外几乎交换所有质子。此N-端的融合体因此可使该结构不稳定或至少使其更易移动。通常位于此肽第4位的异亮氨酸侧链在获自高温分子动力学轨迹(参阅下文)的低能构象体中似乎被埋于折叠肽内。因此我们建立了在各二聚作用肽第4位的单点突变(得到EFLKVKS),并通过氘交换检测此突变对18mer插入片段的影响。如果此突变以重要方式破坏该结构,慢交换质子的数目可能会减少。在检测氘交换动力学时,1小时内除1个质子外几乎所有质子被交换。我们还检查了当EFLIVKS或其类似物与这些插入片段两端融合时,这些不同于Ci2b的插入片段对整个肽之交换动力学的影响。一插入片段STKSIPPQS代表了蛋白酶抑制剂环[CTKSIPPQC]的类似物[Gariani和Leatherbarrow,肽研究杂志49:467-75(1997)]。在加热时,此短构建体具有36个可交换质子,其中33个在1小时内交换。因此如果此肽具有折叠结构,它应只包含一些慢交换质子。第二个插入片段包括旗帜表位标记(flagepitopetag)DYKDDDDK,为了提高其柔性,两端侧翼有4个甘氨酸,以便表位与抗旗帜标记抗体结合。将它与MGEFLIVKS-在N-端、与-EFLIVKSGPP在C-端融合。此肽具有36个可交换质子,其中35个在1小时内被交换。用流感红凝素表位标记替代旗帜标记,合成由于存在7个甘氨酸而预期也有稍许柔韧性的相似构建体。在约1小时内所有的质子被交换成氘。因此短插入片段或在各端具多个甘氨酸以保证其柔韧性的插入片段不具有慢交换质子。实施例10肽构建体模型迄今为止测定的具慢交换质子的二聚作用肽构建体还未有在毫摩尔浓度范围内可溶的,因此利用nmr进行结构测定不易完成。为了得到所选结构的工作模型,可大致与来自园二色性的二级结构内容相比,我们利用高温分子动力学产生构象体[Brooks,Chem.Scripta29A:165-169(1989);Bruccoleri和Karplus,生物聚合体29:1847-62(1990);Auffinger和Wipff,J.Comput.Chem.11:190(1990)],并随后彻底最小化至能量等级不同的构象体。然后比较最低的5-7千卡/摩尔能量带宽的构象体。此“淬灭分子动力学”的方法已用于一种肿瘤表面八肽和不同蛋白质的肽片段(Brooks,见上文)、吞噬作用激素及其环状类似物[O’Connor等,J.Med.Chem.35:2870-81(1992)],以及线性和环状促黑激素[Al-Obeidi等,肽以及杂志51:420-31(1998)]。同时此方法也已应用于诸如抗体高变环中70个残基之类较大系统中[Bruccoleri和Karplus,生物聚合体29:1847-62(1990)],对于这样大的系统未产生足够用于提供完全构象覆盖度的构象异构体[Dill,生物化学24:1501-9(1985)]。因而当此方法应用于32mer肽时,将只能检查一些预期的低能构象,从而只能获得对整体折叠的粗略认识。它仍可显著覆盖环18mer或两线性7mer肽的构象空间。我们首先将此方法学应用于二硫键受限制的环18mer肽,环[CGTIVTMEYRIDRTRSFC],它被认为是弹性蛋白酶和其它蛋白酶的亚nM抑制剂(Leatherbarrow和Salacinski,见上文)。对于此环肽作为与Ci2b具相似效力的抑制剂,推测它应具有与Ci2b抑制剂环相似的结构和刚性的低能构象体。在其游离状态或与枯草杆菌蛋白酶Novo[MoPhalen和James,生物化学26:261-9(1987)]的复合体中,抑制剂环的整体主链大致是平面的,R65、R67和F69侧链填充于环的内部。进入枯草杆菌蛋白酶结合位点内部的边缘是一不规则的β折叠,I56、T58、M59和Y61的侧链伸展入溶液中或结合复合物的枯草杆菌蛋白酶中,当与枯草杆菌蛋白酶复合时M59的侧链显著地从溶液结构中弯曲出来。测定此天然环的结构和此环肽最小化构象异构体(两个轨道,5.4ns,2700个结构)的能量分配(数据未显示)。这大致是高斯形式的,如对于环促黑激素类似物所示一样(Al-Obeidi等,见上文)。对模拟此环的环肽寻找到的低能构象体似乎比天然抑制剂环明显地更紧密和球状化(数据未显示),且它们对于18mer抑制剂环的主链原子均方根差分别为6.22、6.12、5.46、6.31、5.72、5.69和5.64埃。形成大部分枯草杆菌蛋白酶接触区并围绕抑制剂环活性位点(甲硫氨酸7-谷氨酸8)的残基3-10相对于天然环中相同残基的重原子均方根差分别为5.65、6.40、3.95、5.54、5.20、5.07和4.59埃。此外,R65、R67和F69的侧链不埋入这些低能构象体任何之一的环区中。在与Ci2b抑制环比较时,这些结果与低能构象异构体显著不同的结构一致。这些重要的结构差异符合未观察到此环18mer肽对弹性蛋白酶的抑制作用的结果。其次,我们应用淬灭分子动力学来研究二聚化时EFLIVKS的低能构象体。这些气相计算可能与质谱观察到的肽二聚体低能形式尤其有关。通过大约在它们的质量中心将两肽粘连起来,或在开始构象搜寻前将不同的平行和反向平行起始构象(见方法部分)在气相中结合在一起,构建肽二聚体。总共运行7个轨道,包含5250个最小化结构和10.5ns(数据未显示),并进行来自所有轨道的14个最低能二聚体的主链重叠,包含最低的7千卡/摩尔能量带宽(数据未显示)。通过二聚作用肽之一的所有主链原子的最小平方重合完成这一点。两肽似乎都采取转角构象,但沿二聚体间轴并不对称。除了将各构象异构体主链原子与每个其它构象异构体主链原子比较的、14个最低能构象异构体的一簇图表外,还建立了RMSD偏差(A)(数据未显示)。如果它们的RMSD差异在0-1埃范围内,则两构象异构体最为相似。看来存在一主要的低能构象异构体家族,以及数个其它的独特构象(数据未显示)。对于所有肽来说,在这些模拟中带电荷的二聚体第一个肽的N-和C-末端似乎都与第二个肽的N-和C-末端接近。因为每个肽有两个酸性和两个碱性基团,所以存在许多不同的二聚体内可能的离子对。检测在所有14个低能构象异构体中的所有可能二聚体间离子对的距离显示,最稳定的离子对是a)肽1肽2的N末端谷氨酸1侧链羧基;b)肽1肽2的赖氨酸6ε-氨基谷氨酸1侧链羧基;和c)肽2肽1C-末端赖氨酸6ε-氨基。所有的肽均在其自身N-和C-末端之间形成稍微稳定的分子内离子对。淬灭分子动力学还用于检查在各端与EFLIVKS融合的Ci2b18mer检测插入片段的低能结构(数据未显示)。此肽对弹性蛋白酶相对惰性,具有37个慢交换质子,且用质谱观察时未显示更高级别的聚合体(数据未显示)。从动力学轨道的12.3ns收集总共6900个不同的结构。这些结构以高斯形式分布(数据未显示)。两个构象异构体比所有其它的能量至少低7千卡/摩尔(数据未显示)。两构象异构体看来是紧密和球状的,与以上其它实验结果一致。正如用以上示范的EFLIVKS二聚体一样,附着于18mer插入片段的各末端EFLIVKS看来形成了转角,它们的N-和C-末端在3.8-4.3埃之间。不过,与EFLIVKS二聚体的结构不同,它们现与18mer插入片段融合的第二末端不绕回分子中心,而在两构象异构体中分隔11.5-15埃。此距离显著大于天然Ci2b结构(4.1埃)和环肽低能构象异构体(平均6.88埃)中的可比较距离,这显示二聚作用肽,至少与此插入片段一起时,形成具相当宽基面的“环”。此18mer插入片段似乎还包含显著比例的转角结构,与园二色性测量一致。实施例11肽构建体的园二色性研究、NMR测量和肽构象搜寻园二色性测量在装配有Peltier温度控制装置的AVIV62ADSCD分光偏振计(Lakewood,NJ,USA)上记录CD光谱。用NeslabCFT-33冷却循环水浴维持仪器温度恒定于20℃以下。按制造商的推荐用(+)-10-樟脑磺酸的铵盐周期性地校准设备。在25℃记录250和195nm之间0.2nm间隔的光谱,时间常数是1s。从5次独立的扫描中收集数据并用IBMPS/2计算机平均。光程0.1cm的圆筒形石英杯用于此光谱范围内,所用的样品浓度按氨基酸分析测定是0.02-0.05mM。除了指出之外,用含100mMKF的10mMKPO4缓冲液,pH7.5制备肽母液(1mM)。为了进行pH滴定实验,在添加以上肽母液前,用0.1MHCl或0.1MNaOH将缓冲液的pH小心调到需要值。通过以下方程式获得平均残基椭圆率(MRE),以deg.cm2.dmol-1表示MRE(λ)=(λ)/10/cn其中(λ)是波长λ时的椭圆率(以度表示),1是光路长度(cm),c是浓度(M),而n是肽/蛋白质中的残基数[Schmidt,蛋白质结构实用方法,IRL出版社,纽约,第251-285(1989)]。将收集自各个实验的原始数据转换成ASCII形式,并用MicrosoftExcel软件包如前所述作图[Gururaja和Levine,肽研究9:283-289(1996)]。从含20uM肽的样品获得热变性数据(样品溶于含100mMKF的10mMKPO4缓冲液,pH7.5)。在220nm4-98℃的范围内测定热变性,每步温度提高2℃,2分钟的平衡时间和60秒的信号平均时间。以220nm处的CD信号一次导数的最大值计算表观Tm,为T-1。用软件将CD光谱消卷积。用软件Dichroprotv.2.4将CD光谱消卷积,该软件使用了Johnson的可变选择方法。NMR检测用于NMR实验的所有氘化溶剂,如D2O(99.96%D)和DC1(99.5%D)均购自CambridgeIsotopeLaboratories(Andover,MA)。通过将合成肽溶于0.7mlH2O:D2O90:10(v/v)或100%D2O中制备样品(~1mM)。通过溶解HPLC纯化肽并用HCl或DCl调节pH至4.0,制备水溶液样品。室温检测所有的pH值;此处所报道的值是表观pH值,并未为氘同位素作用而校正。TSP[3(三甲基甲硅烷基)丙-2,2,3,3-d4酸,钠盐]用作内部的化学转移标准。在如前所述装配有Sunsparcstation5的VarianUnityINOVA-500分光计上25℃进行1HNMR实验[Naganagowda等,生物分子结构动力学杂志16:91-107(1998)]。用超复数的方法[States等,J.Magn.Reson.,48:286-292(1982)]以纯状态吸收形式t1度积分检测完成二维双量子过滤相关光谱学(TwodimensionalDoubleQuantumFilteredCorrelatedSpectroscopy,DQF-COSY)[Rance等,Biochem.Biophys.Res.Commun.117:479-485(1983)]、总相关光谱学(TotalCorrelationSpectroscopy,TOCSY)[Bax和Dayis,J.Magn.Reson.65:355-360(1985)]、回转台极化增强光谱学(RotatingframeOverhauserenhancementSpectroscopy,ROESY)[Bothner-By等,J.Am.Chem.Soc.106:811-813(1984)]及核极化增强光谱学(NuclearOverhauserEnhancementSpectroscopy,NOESY)[Macura和Ernst,分子物理学41:95-117(1980)]实验。载体被放于水中介中以使在NOESY实验的弛豫延迟阶段(1.5-2.5秒)和混合时间内水能被照射到。对于TOCSY光谱,MLEV-17序列被使用,自旋锁闭时间(spinlocktime)是50-85毫秒。对于ROESY实验使用200和250毫秒的自旋转锁闭时间,而对于NOESY,使用200和300毫秒的混合时间。各维的水中的1HNMR光谱具有5400Hz的光谱宽度。在D2O溶剂中,酰胺质子完全交换后,通过降低各维的光谱宽度至3000Hz记录光谱。用1024或2048个据点得到256或512t1增量。通过溶解样品于D2O中并立即记录1D和TOCSY光谱而鉴定慢交换酰胺质子。为进行酰胺质子的温度系数测定,在25-50℃间完成1D和TOCSY实验,每步温度变化5℃。对于DQF-COSY和TOCSY光谱一般收集16或32个扫描图,对于ROESY和NOESY光谱收集64个扫描图。在进行傅立叶变换前,自由感应衰减(freeinductiondecay,FID)在各维都零填充一次。为了加工DQF-COSY光谱,各维均使用变换90°的钟形窗口正弦平方函数(squaredsine-bellwindowfunction),而对于TOCSY、ROESY和NOESY光谱,使用变换90度和45度的钟形窗口正弦平方函数对数据进行分别加工。从用水里混合时间200毫秒获得的2D-NOESY光谱中的NOE交叉峰(crosspeak)强度推断结构测定的1H-1H距离。对于距离几何学计算,通过比较交叉峰的体积计算质子间距离的范围并分为三类,1.8-2.5埃(强),2.5-3.5埃(中等),3.5-5.0埃(弱)。从NMR研究中得到各残基的邻近偶联常数3JNH-CαH并用于通过Karplus关系式估计可能的扭转角度[Karplus,生物物理学杂志30:11-15(1959)]:3JNH-CαH=Acos2θ-Bcosθ+C,其中-θ=|Ф--60°|。由文献Pardi等,分子生物学杂志180:741-751(1984)提出的A、B和C常数值分别是6.4、1.4和1.9。用于获得构象数据的技术将只略述于此,因为这些已详述于其它地方。来自NMR技术的构象描述纯粹基于用高磁场强度下获得的二维NMR数据进行的沿多肽链的扭转角测定值。更具体地说,为了分配通过键偶联的质子,进行TOCSY实验。相继的分配,例如Hα(ⅰ)-NH(i+1),是基于NOESY和ROESY实验,其中观察到空间上密切接近相关性,这是构象的指示。肽构象搜索不同肽构建体的低能构象异构体产生如下。用InsightⅡ95.0(MolecularSimulationsInc.,圣地哥,CA)和cff91力场[Maple等,J.Comp.Chem.15:162-182(1994)]建立肽构建体的显原子模型。肽被模拟为两性离子,除N-末端氨基和C-末端羧基之外,赖氨酸、精氨酸、天冬氨酸和谷氨酸也被完全离子化。通过利用线性距离依赖型介电常数模拟水性溶剂环境和平衡离子屏蔽的作用。时间步幅1fs的Verlet运算法则[Verlet,Phys.Rev.159:98-103(1967)]被用于对运动方程式积分;这是按Discover2.9.7的默认跳步算法(defaultleapfrogalgorithm)进行的。一15A的临界值被用于非键的相互作用。用5千卡/摩尔/rad2的扭转约束力受限制肽键在高温下为反式构象。在动力学方法中,基于对Mackay等人[Mackey等,蛋白质结构的预测和蛋白质构象的原理,(Fasman,编辑;纽约,PlenumPress)第317-358页(1989)]所写的方法的修改,首先用300步最速下降法和1000步或如结合梯度最小化所需步骤数将起始肽结构最小化,以使最大能量偏差小于0.1千卡/A,从而去除分子构建中产生的高能结构。用dseed变量指定肽原子的随机起始速率,并将肽在2ps的时间加热到900K。继续各个轨迹,时间变化从400ps-3ns,每1-2ps收集各个结构一次用于随后的最小化作用。各收集的结构平衡于900K50fs,经5ps冷却至300K,并用300步最速下降的运算法则将其最小化,然后用所需的步骤进行Fletcher-Reeves结合梯度最小化,以使最大能量偏差小于0.001千卡/摩尔/A。将各肽的最小化总能量对各5千卡/摩尔范围内的构象异构体数目作图。选择最低能量以上5千卡/摩尔范围内的构象异构体用于进一步的分析[O’Connor等,J.Med.Chem.35:2870-81(1992)]。不同肽的起始结构按如下步骤获得。对于二聚化EFLIVKS,以平行或反平行方式排列伸展的结构,其中Ile4的Cγ1间距离约7A,得到4个不同的起始结构。当两肽的异亮氨酸4之Cγ1间距离在1.5-12A范围外时,用100千卡/摩尔的能量罚分将两伸展结构(平行和反平行)粘连起来。对于推认的蛋白酶抑制剂环[CGTIVTMEYRIDRTRSFC]来说,起始结构是右手α螺旋和β折叠的混合体,从而可在两末端半胱氨酸间形成二硫键。第二轮循环以第一次结构的部分最小化形式开始。对于受肽二聚体约束的构建体EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS来说,使用了几种不同的起始结构。一种结构起始自18mer插入片段之以Ci2b为基础的结构(PDB文件2CI2),它是通过从晶体结构中除去除抑制环之外的所有残基,并突变个别残基产生Leatherbarrow和Salacinski(见上文)报道的18mer序列而得到的。伸展构象中的EFLIVKS融合于肽的各端并如上所述最小化所产生的构建体。第二种结构起始于作为β折叠融合于18merCi2b插入片段各端的EFLIVKS。第三种结构起始于作为右手α螺旋融合于18merCi2b插入片段各端的EFLIVKS。第四种结构起始自整个构建体的伸展构象,第五种结构起始自部分不同的伸展构象。由整个构建体作为β折叠起始第六个结构。既然此处研究的肽可以大大低于nmr结构测定所需之毫摩尔浓度的水平溶于中性或近中性pH中,我们用园二色性(CD)检查它们的溶液结构。园二色性测定对肽和蛋白质的二级结构均灵敏,并已被广泛用于检测二者的构象[Bloemendal和Johnson,Pharm.Biotechnol.7:65-100(1995);Woody,酶学方法246:34-71(1995);Greenfield,生化分析235:1-10(1996)]。在此这些测定被用于检测二级结构形成和稳定性的pH依赖性,比较不同二聚作用肽对插入片段结构的作用,检查二聚作用肽中突变的影响,并查看不同插入片段序列对受二聚作用肽约束的环整体结构的作用。当这些测定与蛋白水解敏感性、氘交换和构象搜索的结果测定结合时,它们给出了整体结构和此处检测的微环折叠的信息。EFLIVKS二聚化的9mer插入片段检测的第一个插入片段是EFLIVKS-STKSIPPQS-EFLIVKS。该9mer插入片段代表蛋白酶抑制剂环[CTKSIPPQC]的类似物(Gariani和Leatherbarrow,见上文)。记录pH3.5-8.5之间的CD光谱(数据未显示)。观察二级结构的pH-依赖型转换。pH3.5时,在201nm处可见具强最小值的二级结构。而此接近于195-197nm的预期随机缠绕最小值[Greenfield和Fasman,生物化学8:4108-4116(1969)],光谱的形状也与短肽中观察到的1型β转角的光谱相似[Perczel等,Int.J.PeptideProtein41:223-236(1993)]。低pH结构的1H-NMR测定因为可在确定条件下观察到许多其它插入片段的CD光谱,且因为此肽可很好地溶解于低pH,故我们用nmr检查此结构。用标准的连续排列步骤完成在水中9mer插入片段之1H-NMR光谱的共振排列[wuthrich,《蛋白质和核酸的NMR》,纽约,Wiley-Interscience,pp166ff(1986)]。通过2D-TOCSY和2D-NOE光谱的联合分析完成1H共振的排布。还在多种温度(25-50℃)记录2D-TOCSY光谱以分辨明确排布的重叠连通性,且还用于测定NH化学移动的温度系数。通过记录100%D2O中的光谱排布埋藏于水信号(在90%H2O中)下的共振。所有排布质子的化学移动列于表5中。NH化学转移的温度系数、酰胺基团的1H/2H交换速率、JNH-CαH值和一套特征性的强、中等和弱NOE连通性已被用作标准检查肽在水溶液中是否具有任何优选主链构象。发现所有酰胺共振的温度系数是0.004ppm/K(数据未显示),表明主链NH基团暴露于溶剂中并不参与任何分子内氢键相互作用。因为对所有主链酰胺共振观察到1H/2H交换速率较快,进一步显示酰胺基团不参与任何分子内氢键。在缺乏任何可观察到的dNNNOE相互作用情况下,强dαN(i,i+1)和弱dαN(i,i)NOE以及弱和中等dβ(i,i)和dαβ(i,i)NOE连续伸展的优势表明主链二面角主要在Ф,ψ-空间的未折叠伸展区[Rance等,Biochem.Biophys.Res.Commun.117:479-485(1983);Pardi等,分子生物学杂志180:741-751(1984)]。除丝氨酸-7之外,对于所有残基,表5中提供的JNH-CαH值均在6.5-8.4Hz范围内。对于规则的β-链,预期JNH-CαH值为~9Hz,而对于α-螺旋则是~4.0Hz[Rance等,Biochem.Biophys.Res.Commun.117:479-485(1983);Pardi等,分子生物学杂志180:741-751(1984)]。观察到此肽偶联常数为6.5-8.4Hz,显示所具Ф值超过规则螺旋区、具可比较能量的未折叠非氢键构象的存在。总之,NMR数据证实EFLIVKS-STKSIPPQS-EFLIVKS在水溶液中是未结构化的。表5.pH4.0时EFLIVKS-STKSIPPQS-EFLIVKS化学移动值的汇编pH4.5时,观察到不同的二级结构,直至pH8.5它仍保持稳定。pH4.5-7.5时CD光谱在202nm处具有一弱很多的带,表明了随机螺旋有丢失。它们还在210-215nm处有一弱正性带,及228-230nm附近有一负性带,显示存在β转角[Brahms和Brahms,分子生物学138:149-178(1980)]。因为在pH5.0此构建体具有3个或更少个慢交换质子(表4),肽在此pH可能是非折叠的(即无三级结构),但具有包含一些β转角和明显比pH3.5时更少的随机缠绕的二级结构。或者,如果它折叠并具有一些三级结构,主链是足够可动的,以致无酰胺质子与溶剂隔离较长时间。当于225nm处观察CD光谱时,pH7.5中存在的结构具有Tm为39.6+-1℃(数据未显示)。EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS用CD检测的第二个构建体含Ci2b18mer插入片段,EFLIVKS-VGTIVTMEYRIDRTRSFV-EFLIVKS。测定此肽的CD光谱的pH依赖性(数据未显示)。与以上测定的第一个肽不同,CD光谱不是pH依赖型的,且看来不具有大量的随机缠绕。210nm附近的强最大值和225-230nm的强最小值符合在所有检测转角的pH值条件下的β转角结构的显著含量[Brahms和Brahms,分子生物学138:149-178(1980)]。在约200nm处观察到的较小最小值与小百分比的随机缠绕或Ⅱ型β转角一致[Perczel等,Int.J.PeptideRes.41:223-236(1993)]。利用225nm处的信号,肽可随温度融化,Tm为39.85±1.6℃。具N-末端MG-和C-末端-GPP的构建体为了于活细胞中表达肽,将MG-加入许多肽构建体的N-末端,将-GPP加入C-末端,以阻断细胞羧肽酶的蛋白水解[Vanhoof等,FASEBJ.9:736-44(1995)]。然后将这些肽的CD光谱在pH7.5时比较(数据未显示)。完成对MGEFLIVKS-Ci2b插入片段-EFLIVKSGPP之CD光谱的pH依赖性测定(数据未显示),显示与EFLIVKS-Ci2b插入片段-EFLIVKS相比,附加的5个残基引起CD光谱显著改变。208nm处的正带不再清楚,而200nm处的负带已消失。225nm附近的主要最小值(一些β转角结构的特性)保留。因而这5个残基的添加看来引起了明显的构象改变,但不是结构的打开。其它插入片段序列的加入也导致了相当不同的CD光谱。由带甘氨酸间隔子之旗帜表位标记-G4DYKDDDDKG4-组成的插入片段,设计成可用Western印迹探测细胞中的表达肽,得到含约202nm处的最小值和约220nm处的小最小值的CD光谱(数据未显示)。基于此光谱与EFLIVKS-STKSIPPQS-EFLIVKS光谱的相似性,此肽在pH3.5-8.5时似乎主要是随机缠绕。此构建体不具有慢交换质子,与其未折叠结构一致。由带甘氨酸间隔子之流感血凝素表位标记-G4YPYDVPDYASLG3-组成的插入片段的CD光谱在205-207nm处有最小值,在约220nm处有第二个较小的最小值(数据未显示)。这可能是由于一些二级结构的不同组成,且可包括一些α螺旋(由于在205-207nm处的最小值)以及随机缠绕或β转角。因为此构建体也不具有慢交换质子(表4),故此CD光谱可能反映只有二级结构的存在。对EFLIVKS序列的其它添加测定EFLIVKS序列中的突变对Ci2b肤插入片段CD光谱的影响(数据未显示)。肽EEFLIVKKS-Ci2b肽插入片段-EEFLIVKKS尤其令人感兴趣,因为它具有23个慢交换质子和8个中速交换质子(表4),因而可能具有三级结构,还因为此二聚作用肽可能具有比EFLIVKS稍高的自亲和力。除了它在202nm处的最小值缺少,在210nm处的最大值(对照肽)变成更近207nm外,它的CD光谱与对照肽相似。此肽看来具有β转角结构和少于对照肽的随机缠绕。为了提高结构的溶解性,将赖氨酸加入具甘氨酸间隔子的N-末端。至于构建体K6G4-EFLIVKS-Ci2b肽插入片段-EFLIVKS,得到与对照肽很不相同的CD光谱,在约220nm处有一宽的最小值(数据未显示)。此光谱看来不是任一主要二级结构的特性,但可被消卷积成β折叠和β转角(58%)、α螺旋(14%)和余下的随机缠绕的混合体。既然此结构具有最多5个慢交换质子(表4),加入N-末端的附加残基似乎动摇了对照肽的三级结构,而产生了不同的二级结构。EFLIVKS序列中的突变在pH7.0检测二聚作用肽序列的3个电荷改变。其中一种肽是在二聚作用肽之间转换单个赖氨酸和谷氨酸,得到KFLIVKS-Ci2b插入片段-EFLIVES。第二种肽是将各二聚作用肽中的谷氨酸突变成赖氨酸,得到KFLIVKS-Ci2b插入片段-KFLIVKS。第三种肽是将各二聚作用肽中的赖氨酸突变成谷氨酸,得到EFLIVES-Ci2b插入片段-EFLIVES。各肽具有与对照肽EFLIYKS-Ci2b插入片段-EFLIVKS相似的CD光谱(数据未显示)。在第二套突变中,二聚作用肽的疏水特性被改变。首先,两EFLIVKS序列中的F2和I4突变成赖氨酸或丝氨酸,使Ci2b插入片段各末端的二聚作用肽序列为EKLKVKS或ESLSVKS。这导致CD光谱发生较大改变,在202-205nm处有大负带出现,显示随机缠绕结构显著增加,或变性(数据未显示)。其次,在各二聚作用肽中只有I4突变成赖氨酸。这也以相似方式改变了CD光谱(数据未显示)。此构建体最多具有1-2个慢交换质子,表明EFLIVKS序列疏水核心中的此单个改变足以破坏整个肽构建体的结构。序列表&lt;110&gt;RigelPharmaceuticals,Inc.&lt;120&gt;引起紧密结构形成的肽&lt;130&gt;FP-66103-1/DJB/RMS/SJR&lt;140&gt;PCT/US/99/07374&lt;141&gt;1999-04-02&lt;150&gt;60/080,444&lt;151&gt;1998-04-02&lt;160&gt;150&lt;170&gt;PatentInVer.2.0&lt;210&gt;1&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;水螅&lt;400&gt;1GluProProGlyGlySerLysValIleLeuPhe1510&lt;210&gt;2&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;水螅&lt;400&gt;2SerLysValIleLeuPhe15&lt;210&gt;3&lt;211&gt;4&lt;212&gt;PRT&lt;213&gt;水螅&lt;400&gt;3ValIleLeuPhe1&lt;210&gt;4&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;水螅&lt;400&gt;4GluProProGlyGlySerLys15&lt;210&gt;5&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;5PheLeuIleValLys15&lt;210&gt;6&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;6GluPheLeuIleValLysSer15&lt;210&gt;7&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;7LysPheValLeuIleLysSer15&lt;210&gt;8&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;8ValSerIleLysPheGluLeu15&lt;210&gt;9&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;9LeuIleValLysSer15&lt;210&gt;10&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;10GluPheLeuIleValLys15&lt;210&gt;11&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;11LysPheLeuIleValLys15&lt;210&gt;12&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;12PheGluSerIleLysValLeu15&lt;210&gt;13&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;13LeuLysSerIleValGluPhe15&lt;210&gt;14&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;14SerLysValIleLeuPheGlu15&lt;210&gt;15&lt;211&gt;18&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;15CysGlyThrIleValThrMetGluTyrArgIleAspArgThrArgSer151015PheCys&lt;210&gt;16&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;16GluPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValGluPheLeuIleValLysSer202530&lt;210&gt;17&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(1)..(4)&lt;223&gt;X可以是A,V,I,L,W,F,M和Y.&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(5)&lt;223&gt;X可以是K,R,D或E.&lt;400&gt;17XaaXaaXaaXaaXaa15&lt;210&gt;18&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;18PheLeuIleValLys15&lt;210&gt;19&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(1)&lt;223&gt;X可以是D,E,K或B.&lt;220&gt;&lt;230&gt;人工序列描述合成的&lt;400&gt;19XaaPheLeuIleValLys15&lt;210&gt;20&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;20PheLeuIleValLysSer15&lt;210&gt;21&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;221&gt;位点&lt;222&gt;(1)&lt;223&gt;x可以是Z,E,D或R.&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;21XaaPheLeuIleValLysSer15&lt;210&gt;22&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;22LysPheLeuIleValLysSer15&lt;210&gt;23&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;23GluGluPheLeuIleValLysLysSer15&lt;210&gt;24&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;24ValSerIleLysPheGluLeu15&lt;210&gt;25&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;25AlaPheLeuIleValLysSer15&lt;210&gt;26&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;26GluAlaLeuIleValLysSer15&lt;210&gt;27&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;27GluPheAlaIleValLysSer15&lt;210&gt;28&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;28GluPheLeuAlaValLysSer15&lt;210&gt;29&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;29GluPheLeuIleAlaLysSer15&lt;210&gt;30&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;30GluPheLeuIleValAlaSer15&lt;210&gt;31&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;31GluPheLeuIleValLysAla15&lt;210&gt;32&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;32GluPheLeuLysValLysSer15&lt;210&gt;33&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;33SerLysValIleLeuPheGlu15&lt;210&gt;34&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;34GluPheLeuIleValGluSer15&lt;210&gt;35&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;35ValSerIleLysPheGluLeu15&lt;210&gt;36&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;36PheGluSerIleLysValLeu15&lt;210&gt;37&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;37LeuLysSerIleValGluPhe15&lt;210&gt;38&lt;211&gt;4&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;38ProProGlyGly1&lt;210&gt;39&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;39GlySerGlyGlySer15&lt;210&gt;40&lt;211&gt;4&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;40GlyGlyGlySer1&lt;210&gt;41&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(8)..(10)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;41GluPheLeuIleValLysSerXaaXaaXaaGluPheLeuIleValLys151015Ser&lt;210&gt;42&lt;211&gt;16&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(7)..(9)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;42LysValLeuIleLysSerXaaXaaXaaGluPheLeuIleValGluSer151015&lt;210&gt;43&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(8)..(10)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;43ValSerIleLysPheGluLeuXaaXaaXaaValSerIleLysPheGlu151015Leu&lt;210&gt;44&lt;211&gt;13&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(6)..(8)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;44LeuIleValLysSerXaaXaaXaaLeuIleValLysSer1510&lt;210&gt;45&lt;211&gt;15&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(7)..(9)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;45GluPheLeuIleValLysXaaXaaXaaGluPheLeuIleValLys151015&lt;210&gt;46&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(8)..(10)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;46PheGluSerIleLysValLeuXaaXaaXaaPheGluSerIleLysVal151015Leu&lt;210&gt;47&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(8)..(10)&lt;223&gt;x可以是任何氨基酸&lt;400&gt;47LeuLysSerIleValGluPheXaaXaaXaaLeuLysSerIleValGlu151015Phe&lt;210&gt;48&lt;211&gt;31&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;48GluPheLeuIleLysSerValGlyThrIleValThrMetGluTyrArg151015IleAspArgThrArgSerPheValGluPheLeuIlePheLysSer202530&lt;210&gt;49&lt;211&gt;18&lt;212&gt;PRT&lt;213&gt;大麦&lt;400&gt;49ValGlyThrIleValThrMetGluTyrArgIleAspArgThrArgSer151015PheVal&lt;210&gt;50&lt;211&gt;31&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;50GluPheLeuIleLysSerValGlyThrIleValThrMetGluTyrArg151015IleAspArgThrArgSerPheValSerLysValIleLeuPheGlu202530&lt;210&gt;51&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;51SerLysValIleLeuPheGluValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValGluPheLeuIleValLysSer202530&lt;210&gt;52&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;52SerLysValIleLeuPheGluValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValSerLysValIleLeuPheGlu202530&lt;210&gt;53&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;53LysPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValLysPheLeuIleValLysSer202530&lt;210&gt;54&lt;211&gt;31&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;54LysPheLeuIleValLysSerValGlyThrIleValMetGluTyrArg151015IleAspArgThrArgSerPheValGluPheLeuIleValGluSer202530&lt;210&gt;55&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;55GluPheLeuIleValGluSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValGluPheLeuIleValGluSer202530&lt;210&gt;56&lt;211&gt;33&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;56GluLysLeuIleLysValLysSerValGlyThrIleValThrMetGlu151015TyrArgIleAspArgThrArgSerPheValGluLysLeuLysValLys202530Ser&lt;210&gt;57&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;57GluSerLeuSerValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValGluSerLeuSerValLysSer202530&lt;210&gt;58&lt;211&gt;34&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;58GluPheLeuIleLysValLysSerValGlyThrIleValThrMetGlu151015TyrArgIleAspArgThrArgSerPheValGluPheLeuIleLysVal202530LysSer&lt;210&gt;59&lt;211&gt;36&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;59GluGluPheLeuIleValLysLysSerValGlyThrIleValThrMet151015GluTyrArgIleAspArgThrArgSerPheValGluGluPheLeuIle202530ValLysLysSer35&lt;210&gt;60&lt;211&gt;37&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;60MetGlyGluPheLeuIleValLysSerValGlyThrIleValThrMet151015GluTyrArgIleAspArgThrArgSerPheValGluPheLeuIleVal202530LysSerGlyProPro35&lt;210&gt;61&lt;211&gt;42&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;61LysLysLysLysLysLysGlyGlyGlyGlyGluPheLeuIleValLys151015SerValGlyThrIleValThrMetGluTyrArgIleAspArgThrArg202530SerPheValGluPheLeuIleValLysSer3540&lt;210&gt;62&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;62LysLysLysLysLysLysGlyGlyGlyGly1510&lt;210&gt;63&lt;211&gt;39&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;63LysLysLysGlySerGlySerGluPheLeuIleValLysSerValGly151015ThrIleValThrMetGluTyrArgIleAspArgThrArgSerPheVal202530GluPheLeuIleValLysSer35&lt;210&gt;64&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;64LysLysLysGlySerGlySer15&lt;210&gt;65&lt;211&gt;23&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;65GluPheLeuIleValLysSerSerThrLysSerIleProProGlnSer151015GluPheLeuIleValLysSer20&lt;210&gt;66&lt;211&gt;35&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;66MetGlyGluPheLeuIleValLysSerGlyGlyGlyGlyGluTyrLys151015AspAspAspAspLysGlyGlyGlyGlyGluPheLeuIleValLysSer202530GlyProPro35&lt;210&gt;67&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;67AspTyrLysAspAspAspAspLys15&lt;210&gt;68&lt;211&gt;38&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;68MetGlyGluPheLeuIleValLysSerGlyGlyGlyGlyTyrProTyr151015AspValProAspTyrAlaSerLeuGlyGlyGlyGlyGluPheLeuIle202530ValLysSerGlyProPro35&lt;210&gt;69&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;流感病毒&lt;400&gt;69TyrProTyrAspValProAspTyrAlaSerLeu1510&lt;210&gt;70&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;猴病毒&lt;400&gt;70ProLysLysLysArgLysVal15&lt;210&gt;71&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;71AlaArgArgArgArgPro15&lt;210&gt;72&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;72GluGluValGlnArgLysArgGlnLysLeu1510&lt;210&gt;73&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;73GluGluLysArgLysArgThrTyrGlu15&lt;210&gt;74&lt;211&gt;20&lt;212&gt;PRT&lt;213&gt;爪蟾&lt;400&gt;74AlaValLysArgProAlaAlaThrLysLysAlaGlyGlnAlaLysLys151015LysLysLeuAsp20&lt;210&gt;75&lt;211&gt;31&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;75MetAlaSerProLeuThrArgPheLeuSerLeuAsnLeuLeuLeuLeu151015GlyGluSerIleLeuGlySerGlyGluAlaLysProGlnAlaPro202530&lt;210&gt;76&lt;211&gt;21&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;76MetSerSerPheGlyTyrArgThrLeuThrValAlaLeuPheThrLeu151015IleCysCysProGly20&lt;210&gt;77&lt;211&gt;51&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;77ProGlnArgProGluAspCysThrProArgGlySerValLysGlyThr151015GlyLeuAspPheAlaCysAspIleTyrIleTrpAlaProLeuAlaGly202530IleCysValAlaLeuLeuLeuSerLeuIleIleThrLeuIleCysTyr354045HisSerArg50&lt;210&gt;78&lt;211&gt;33&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;78MetValIleIleValThrValValSerValLeuLeuSerLeuGlyVal151015ThrSerValLeuLeuCysPheIlePheGlyGlnHisLeuArgGlnGln202530Arg&lt;210&gt;79&lt;211&gt;37&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;79ProAsnLysGlySerGlyThrThrSerGlyThrThrArgLeuLeuSer151015GlyHisThrCysPheThrLeuThrGlyLeuLeuGlyThrLeuValThr202530MetGlyLeuLeuThr35&lt;210&gt;80&lt;211&gt;14&lt;212&gt;PRT&lt;213&gt;鸡病毒&lt;400&gt;80MetGlySerSerLysSerLysProLysAspProSerGlnArg1510&lt;210&gt;81&lt;211&gt;26&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;81LeuLeuGlnArgLeuPheSerArgGlnAspCysCysGlyAsnCysSer151015AspSerGluGluGluLeuProThrArgLeu2025&lt;210&gt;82&lt;211&gt;20&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述来自视红紫质&lt;400&gt;82GluGlnPheArgAsnCysMetLeuThrSerLeuCysCysGlyLysAsn151015ProLeuGlyAsp20&lt;210&gt;83&lt;211&gt;19&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;83LeuAsnProProAspGluSerGlyProGlyCysMetSerCysLysCys151015ValLeuSer&lt;210&gt;84&lt;211&gt;36&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述来自Lamp-1的溶酶体膜蛋白&lt;400&gt;84MetLeuIleProIleAlaGlyArgArgAlaLeuAlaGlyLeuValLeu151015IleValLeuIleAlaTyrLeuIleGlyArgLysArgSerHisAlaGly202530TyrGlnThrIle35&lt;210&gt;85&lt;211&gt;35&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述来自Lamp-1的溶酶体膜蛋白&lt;400&gt;85LeuValProIleAlaValGlyAlaAlaLeuAlaGlyValLeuIleLeu151015ValLeuLeuAlaTyrPheIleGlyLeuLysHisHisHisAlaGlyTyr202530GluGlnPhe35&lt;210&gt;86&lt;211&gt;27&lt;212&gt;PRT&lt;213&gt;酵母&lt;400&gt;86MetLeuArgThrSerSerLeuPheThrArgArgValGlnProSerLeu151015PheSerArgAsnIleLeuArgLeuGlnSerThr2025&lt;210&gt;87&lt;211&gt;25&lt;212&gt;PRT&lt;213&gt;酵母&lt;400&gt;87MetLeuSerLeuArgGlnSerIleArgPhePheLysProAlaThrArg151015ThrLeuCysSerSerArgTyrLeuLeu2025&lt;210&gt;88&lt;211&gt;64&lt;212&gt;PRT&lt;213&gt;酵母&lt;400&gt;88MetPheSerMetLeuSerLysArgTrpAlaGlnArgThrLeuSerLys151015SerPheTyrSerThrAlaThrGlyAlaAlaSerLysSerGlyLysLeu202530ThrGlnLysLeuValThrAlaGlyValAlaAlaAlaGlyIleThrAla354045SerThrLeuLeuTyrAlaAspSerLeuThrAlaGluAlaMetThrAla505560&lt;210&gt;89&lt;211&gt;41&lt;212&gt;PRT&lt;213&gt;酵母&lt;400&gt;89MetLysSerPheIleThrArgAsnLysThrAlaIleLeuAlaThrVal151015AlaAlaThrGlyThrAlaIleGlyAlaTyrTyrTyrTyrAsnGlnLeu202530GlnGlnGlnGlnGlnArgGlyLysLys3540&lt;210&gt;90&lt;211&gt;4&lt;212&gt;PRT&lt;2l3&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述来自钙网蛋白的序列&lt;400&gt;90LysAspGluLeu1&lt;210&gt;91&lt;211&gt;15&lt;212&gt;PRT&lt;213&gt;腺病毒&lt;400&gt;91LeuTyrLeuSerArgArgSerPheIleAspGluLysLysMetPro151015&lt;210&gt;92&lt;211&gt;19&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;92LeuAsnProProAspGluSerGlyProGlyCysMetSerCysLysCys151015ValLeuSer&lt;210&gt;93&lt;211&gt;15&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述香叶基化序列&lt;400&gt;93LeuThrGluProThrGlnProThrArgAsnGlnCysCysSerAsn151015&lt;210&gt;94&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述破坏序列&lt;400&gt;94ArgThrAlaLeuGlyAspIleGlyAsn15&lt;210&gt;95&lt;211&gt;20&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;95MetTyrArgMetGlnLeuLeuSerCysIleAlaLeuSerLeuAlaLeu151015ValThrAsnSer20&lt;210&gt;96&lt;211&gt;29&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;96MetAlaThrGlySerArgThrSerLeuLeuLeuAlaPheGlyLeuLeu151015CysLeuProTrpLeuGlnGluGlySerAlaPheProThr2025&lt;210&gt;97&lt;211&gt;27&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;97MetAlaLeuTrpMetArgLeuLeuProLeuLeuAlaLeuLeuAlaLeu151015TrpGlyProAspProAlaAlaAlaPheValAsn2025&lt;210&gt;98&lt;211&gt;18&lt;212&gt;PRT&lt;213&gt;流感病毒&lt;400&gt;98MetLysAlaLysLeuLeuValLeuLeuTyrAlaPheValAlaGlyAsp151015GlnIle&lt;210&gt;99&lt;211&gt;25&lt;212&gt;PRT&lt;213&gt;人&lt;400&gt;99MetGlyLeuThrSerGlnLeuLeuProProLeuGluPhePheLeuLeu151015AlaCysAlaGlyAsnPheValHisGly2025&lt;210&gt;100&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(8)..(10)&lt;223&gt;x可以是任何氨基酸&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;100MetGlyXaaXaaXaaXaaGlyGlyProPro1510&lt;210&gt;101&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(3)..(6)&lt;223&gt;x可以是任何氨基酸&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;101MetGlyXaaXaaXaaXaaGlyProPro15&lt;210&gt;102&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(4)..(7)&lt;223&gt;x可以是任何氨基酸&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;102MetGlyGlyXaaXaaXaaXaaGlyGlyProPro1510&lt;210&gt;103&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(4)..(7)&lt;223&gt;x可以是任何氨基酸&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;103MetGlyGlyXaaXaaXaaXaaGlyProPro1510&lt;210&gt;104&lt;211&gt;27&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(18)..(20)&lt;223&gt;x可以是任何氨基酸&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;104LysLysLysLysLysLysGlyGlyGlyGlyGluPheLeuIleValLys151015SerXaaXaaXaaGluPheLeuIleValLysSer2025&lt;210&gt;105&lt;211&gt;4&lt;212&gt;DNA&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述启动子序列&lt;400&gt;105caat4&lt;210&gt;106&lt;211&gt;4&lt;212&gt;DNA&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述启动子序列&lt;400&gt;106tata4&lt;210&gt;107&lt;211&gt;6&lt;212&gt;DNA&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述mRNA聚腺苷酸化序列&lt;400&gt;107aataaa6&lt;210&gt;108&lt;211&gt;7&lt;212&gt;DNA&lt;213&gt;未知&lt;220&gt;&lt;221&gt;miscdifference&lt;222&gt;(1)..(3)&lt;223&gt;n可以是任何氨基酸&lt;220&gt;&lt;223&gt;未知生物描述Kozak共有序列&lt;400&gt;108nnnatgg7&lt;210&gt;109&lt;211&gt;23&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;109GluPheLeuIleValLysSerSerThrLysSerIleProProGlnSer151015GluPheLeuIleValLysSer20&lt;210&gt;110&lt;211&gt;32&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;110GluPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValSerLysValIleLeuPheGlu202530&lt;210&gt;111&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;111CysGlyThrIleValThrMetGluTyr15&lt;210&gt;112&lt;211&gt;16&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;112GluPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015&lt;210&gt;113&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;113ArgIleAspArgThrArgSerPhe15&lt;210&gt;114&lt;211&gt;16&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;114ArgIleAspArgThrArgSerPheValGluPheLeuIleValLysSer151015&lt;210&gt;115&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;115ArgIleAspArgThrArgSerPheCys15&lt;210&gt;116&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;116GluPheLeuIleVal15&lt;210&gt;117&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;117ValGluPheLeuIle15&lt;210&gt;118&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;118CysGlyArgIleValThrMetGluTyrArgIleAspArgThrArgSer151015Phe&lt;210&gt;119&lt;211&gt;14&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;119CysGlyThrIleValThrMetGluTyrArgIleAspArgThr1510&lt;210&gt;120&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;120GluTyrArgIleAspArgThr15&lt;210&gt;121&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;121ArgSerPheValGluPhe15&lt;210&gt;122&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;122CysGlyThrIleValThrMet15&lt;210&gt;123&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;123LysSerValGlyThrIleValThrMet15&lt;210&gt;124&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;124GluTyrArgIleAspArgThrArgSerPheCys1510&lt;210&gt;125&lt;211&gt;13&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;125ValThrMetGluTyrArgIleAspArgThrArgSerPhe1510&lt;210&gt;126&lt;211&gt;12&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;126MetGluTyrArgIleAspArgThrArgSerPheCys1510&lt;210&gt;127&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;127MetGluTyrArgIleAspArgThr15&lt;210&gt;128&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;128ThrIleMetGluTyrArgIleAspArgThr1510&lt;210&gt;129&lt;211&gt;39&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;129LysLysLysGlySerGlySerGluPheLeuIleValLysSerValGly151015ThrIleValThrMetGluTyrArgIleAspArgThrArgSerPheVal202530GlySerGlySerLysLysLys35&lt;210&gt;130&lt;211&gt;37&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;130MetGlyGluPheLeuIleValLysSerGlyGlyGlyGlyTyrProTyr151015AspValProAspTyrAlaSerLeuGlyGlyGlyGluPheLeuIleVal202530LysSerGlyProPro35&lt;210&gt;131&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;131SerThrLysSerIleProProGlnSer15&lt;210&gt;132&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;未知&lt;220&gt;&lt;223&gt;未知生物描述蛋白酶抑制剂&lt;400&gt;132CysThrLysSerIleProProGlnCys15&lt;210&gt;133&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;133MetGlyGluPheLeuIleValLysSer15&lt;210&gt;134&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;134GluPheLeuIleValLysSerGlyProPro1510&lt;210&gt;135&lt;211&gt;16&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;135GlyGlyGlyGlyGluTyrLysAspAspAspAspLysGlyGlyGlyGly151015&lt;210&gt;136&lt;211&gt;18&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;136GlyGlyGlyGlyTyrProTyrAspValproAspTyrAlaSerLeuGly151015GlyGly&lt;210&gt;137&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(1)&lt;223&gt;x可以是E,D,K或R.&lt;220&gt;&lt;221&gt;位点&lt;222&gt;(6)&lt;223&gt;x可以是E,D,K或R.&lt;400&gt;137XaaPheLeuIleValXaa15&lt;210&gt;138&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;138GluTyrArgIleAspArgThrArgSerPhe1510&lt;210&gt;139&lt;211&gt;6&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;139CysGlyThrIleValThr15&lt;210&gt;140&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;140ThrIleValThrMetGluTyrArg15&lt;210&gt;141&lt;211&gt;13&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;141ThrMetGluTyrArgIleAspArgThrArgSerPheCys1510&lt;210&gt;142&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;142CysGlyThrIleVal15&lt;210&gt;143&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;143SerValGlyThrIle15&lt;210&gt;144&lt;211&gt;27&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;144GluPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThrArgSerPheValGluPhe2025&lt;210&gt;145&lt;211&gt;21&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;145GluPheLeuIleValLysSerValGlyThrIleValThrMetGluTyr151015ArgIleAspArgThr20&lt;210&gt;146&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;146SerPheValGluPheLeuIleVal15&lt;210&gt;147&lt;211&gt;7&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;147PheValGluPheLeuIleVal15&lt;210&gt;148&lt;211&gt;5&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;148SerPheValGluPhe15&lt;210&gt;149&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;149SerPheValGluPheLeuIleValLysSer1510&lt;210&gt;150&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;人工序列&lt;220&gt;&lt;223&gt;人工序列描述合成的&lt;400&gt;150ServalGlyThrIleThrTyrMet1权利要求1.至少含第一个二聚作用肽的组合物,其中所述肽包含不超过8个氨基酸长的序列NH2-X1-X2-X3-X4-X5-COOH,其中X1、X2、X3和X4选自氨基酸A、V、I、L、W、F、M和Y,而X5选自K、R、D和E。2.按权利要求1的组合物,其中进一步包含第二二聚作用肽,该肽包含不超过8个氨基酸长的序列NH2-X1-X2-X3-X4-X5-COOH,其中X1、X2、X3和X4选自氨基酸A、V、I、L、W、F、M和Y,而X5选自K、R、D和E。3.按权利要求1或2的组合物,其中至少所说的第一二聚作用肽包含序列NH2-FLIVK-COOH。4.按权利要求1、2或3的组合物,其中至少所说的第一二聚作用肽包含序列NH2-X0FLIVKX5-COOH,其中X0和X5选自氨基酸E、D、K和R。5.按权利要求1、2、3或4的组合物,其进一步包含第一蛋白质,其中至少所说的第一二聚作用肽与所说的第一蛋白质共价连接形成第一融合蛋白质。6.按权利要求5的组合物,其进一步包含共价连接于所说融合蛋白质上的第二二聚作用肽,其中所说的第二二聚作用肽包含不超过8个氨基酸长的序列NH2-X1-X2-X3-X4-X5-COOH,其中X1、X2、X3和X4选自氨基酸A、V、I、L、W、F、M和Y,而X5选自K、R、D和E。7.按权利要求6的组合物,其中所说的第一二聚作用肽与所说的第一蛋白质N-末端连接,所说的第二二聚作用肽与所说的第一蛋白质的C-末端连接。8.按权利要求6的组合物,其中所说第一二聚作用肽或第二二聚作用肽至少之一共价连接至所说蛋白质的内部位置。9.按权利要求5、6、7或8的组合物,其中所说的第一二聚作用肽或所说的第二二聚作用肽至少之一通过连接子与所说的第一蛋白质共价连接。10.按权利要求1、2、3、4、5、6、7、8或9的组合物,其中进一步包含融合对象。11.含多个成员的分子文库,其中每个成员包含按权利要求5、6、7、8、9或10的组合物,并且每个所说的成员包含不同的第一蛋白质。12.编码权利要求1、2、3、4、5、6、7、8、9、10或11的组合物的重组核酸。13.含权利要求12之重组核酸的表达载体。14.含权利要求12之重组核酸的宿主细胞。15.产生权利要求1、2、3、4、5、6、7、8、9、10或11的组合物的方法,包括a)提供按权利要求14的细胞;及b)将所说的细胞放到一定的条件中,从而表达该组合物。16.筛选能改变细胞表型的组合物的方法,所说的方法包括a)将按权利要求12的重组核酸引入细胞群中;b)将所说的细胞群放于一定条件下,从而表达由所说核酸编码的蛋白质;c)从所说的细胞群中筛选呈现改变表型的细胞。17.按权利要求16的方法,其中进一步包括分离呈现改变表型的所说细胞。18.按权利要求16的方法,其中进一步包括从所说细胞中分离核酸。19.按权利要求16的方法,其中进一步包括分离靶分子。全文摘要本发明涉及包括相互间具高度亲和性的肽的组合物和方法,该肽与蛋白质连接时可帮助蛋白质折叠成紧密结构。凭借其稳定性和约束力,此支架可延长任何内含蛋白质序列在细胞蛋白酶和其他蛋白酶存在时的活性。该紧密结构可具有其它内含功能性序列,对于文库筛选、建立结构偏性肽库及定向于特异细胞内和细胞外区室,其优于线性和较少受限制的肽。本发明的组合物可展示于病毒、古细菌、原核和真核细胞表面上,用于文库筛选、药物筛选和展示。本发明的方法对于调节信号途径的细胞内效应蛋白质体内筛选是有用的,并可用于体外鉴定相互作用的蛋白质。因此,本发明可用作基因治疗的支架,用于新治疗药物的分离,并且对于在生理液中用作治疗剂具有潜在利用价值。文档编号C12P21/02GK1302305SQ99806463公开日2001年7月4日申请日期1999年4月2日优先权日1998年4月2日发明者D·安德森,T·格鲁拉加申请人:里格尔制药公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1