丝蛋白的制作方法

文档序号:3558408阅读:738来源:国知局

专利名称::丝蛋白的制作方法
技术领域
:本发明涉及丝蛋白,以及编码此类蛋白的核酸。本发明也涉及合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途,如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。
背景技术
:丝是表现出特别强度和韧性的纤维状蛋白质分泌物,因此是广泛研究的对象。超过30,000种蜘蛛和许多昆虫产丝。其中很少得到性质描述,而大部分研究集中在家蚕(Sow^x的茧丝和织网蜘蛛棒络新妇蛛(iV印/n7flc/"w》m)的拖丝上。在鳞翅目和蜘蛛中,丝心蛋白基因编码的蛋白一般很大,在两个末端都有显著的亲水末端结构域,其间跨过疏水块和亲水块交替出现的大范围的区域(Bini等人,2004)。这些蛋白一般包括与e折叠、P螺旋((3-spirals)、a螺旋和无定形区松散关联的e折叠层的晶列(crystallinearrays)的不同组合(见Craig和Riekel,2002年综述)。由于丝纤维代表了一些己知最强的自然纤维,人们对其进行了广泛的研究,以期能重现其合成过程。然而,由于丝基因中存在重复核苷酸基序(motifs),它们会导致有害重组事件发生,而且丝基因很大,基因中每个氨基酸使用少数密码子导致宿主细胞tRNA库耗尽,上述因素的组合使得在许多不同重组表达系统中表达鳞翅目和蜘蛛丝心蛋白基因时,经常出现低表达率的问题。重组表达会导致翻译过程中的困难,如由于密码子偏爱和密码子需求而导致翻译中止,以及由于高重组率导致基因截断。至今为止,较短和较少的重复序列可以避免许多与丝基因表达有关的问题。与对鳞翅目(特别是家蚕的茧丝)和蜘蛛(特别是棒络新妇蛛的拖丝)所积累的广泛知识相比,人们对其它昆虫丝的化学组成和分子组织所知甚少。在20世纪60年代早期,对蜜蜂幼虫唾液腺丝纤维的X射线衍射图谱分析表明针尾类膜翅目昆虫的丝具有a-螺旋结构(Rudall,1962)。同时证明该丝是螺旋的,获得的图谱显示了a-螺旋i连的巻曲螺旋(coiled-coil)系统(Atkins,1967)。来源于其它针尾类物种包括黄蜂(wasp),^^"錄尸化/wm6oto)(Rudall,1962)和熊蜂(bumblebee),努^^蒂錄(5ow6zw/"coram)(Lucas和Rudall,1967)的茧丝显示出相似的X射线衍射图谱。与针尾类丝中(x-螺旋结构形成对比的是,与针尾类相关的进化枝上的姬蜂总科(Ichneumonoidea)的丝的特点是具有平行-P结构。人们已经对具有这种结构的茧蜂科四例(粉蝶盘绒茧蜂,CofeH'a—^ewfeMs:」g/owerate,atew'fl(^4;7e"&fes:」go"opfcjg/j1,'jpe"fe/es//g"e〃/)禾口姬蜂禾斗三例(Diwcwfirsj9.;/Vzyto^fe,/^^p.,.Bra"c/n^/emorafc)的X射线衍射图谱进行了描述(Lucas和Rudall,1967)。此外已经对一个茧蜂科(粉蝶盘绒茧蜂fCWe'ag/omemfe刀丝的序列进行了描述(Genbank数据库登录号为AB188680;Yamada等人,2004)。这一部分的蛋白序列包括一个高度保守的28X-天冬酰胺重复(其中X为丙氨酸或丝氨酸),并未预测到含有形成巻曲螺旋的七肽重复(heptadrepeats)。对茧蜂科茧丝氨基酸组成的广泛分析表明小腹茧蜂亚科的丝具有高天冬酰胺和丝氨酸成分而与其它丝不同(Lucas等人,I960;Quicke等人,2004)。相关亚科产生具有显著不同氨基酸组成的丝表明小腹茧蜂亚科在其亚科内是特异进化的(Yamada等人,2004)。使用根据分离茧丝蛋白内部肽序列设计的PCR引物分离了粉蝶盘绒茧蜂的部分cDNA序列。根据这一部分序列预测的氨基酸组成和來源于该种的广泛水洗丝(extensivelywashedsilk)氨基酸组成十分相似。其它非针尾类细蜂亚目和其余的膜翅目昆虫(广腰亚目)的丝是十分普通的平行-P折叠,叶蜂科产生类胶原和多聚甘氮酸两种丝(Lucas和Rudall,1967)。蜜蜂丝蛋白在末龄幼虫中期合成,可视为解聚丝蛋白的混合(Silva-Zacarin等人,2003)。随着龄期的进行,腺体中的水被去除,脱水导致丝蛋白聚合形成组织有序的丝标记的类晶团聚体(SiWa-Zacarin等人,2003)。进行性脱水导致类晶团聚体进一歩重组织(Silva-Zacarin等人,2003)并可能在丝间形成新的丝间结合(Rudall,1962)。从蜜蜂丝腺分离的原纤维电镜图片显示直径约20-25埃的结构(Flower和Kenchington,1967)。这一数值与3-、4-、5-股巻曲螺旋(coiledcoil)一致。Lucas和Rudall确定了不同针尾类膜翅目种的丝的氨基酸组成(1967),发现与经典丝心蛋白相比其包括高含量的丙氨酸、丝氨酸、酸性残基、天冬氨酸、谷氨酸,以及低含量的甘氨酸。针尾类膜翅目昆虫的丝的螺旋结构被认为是由于低甘氨酸含量和高酸性残基含量的结果(Rudall和Kenchington,1971)。人们对于草蜻蛉(lacewing,也称草蛉、草蛉虫)(目脉翅目)幼虫的丝所知甚少。其茧包括两层,一个内层固体层和一个外层纤维层。以前该茧被描述为包括壳脂蛋白丝(Rudall和Kenchington,1971),这一描述仅与内层固体层有关。LaMunyon(1988)描述了一种构成外层纤维的马氏管分泌的物质。这一层沉积之后,有大量绒毛的内腔表皮细胞的分泌物构成固体内壁(LaMunyon,1988)。同样已知的是草蜻蛉幼虫所有龄期都从马氏管产生蛋白质粘性物质将幼虫粘到基质上,将伪装物粘到背上或使猎物陷入(Speilger,1962)。Zomam^a6BwtoAi&eJ属的幼虫同时产生丝和粘性物质,人们推定这它们很可能是相同物质(Speilger,1962)。该粘性分泌物是高度可溶的,也被认为与抵抗捕食者的防卫有关(LaMunyon&Adams,1987)。考虑到诸如膜翅目和脉翅目昆虫所产生丝的独特属性,有必要从这些生物中鉴定新的编码丝蛋白的氨基酸。发明概述本发明已从昆虫中鉴定出数目众多的丝蛋白。这些丝蛋白与其它已知丝蛋白在一级序列、二级结构和/或氨基酸含量方面有惊人的差异。因此,本发明第一方面提供一种基本上纯化的和/或重组的丝多肽,其中至少该丝多肽的一部分具有巻曲螺旋结构。现有技术己知多肽的巻曲螺旋结构具有特征性七肽重复序列,以共有序列(ak^e/g^"表示,其中"和t/位一般为疏水残基,其余位置一般为极性残基。令人吃惊的是,本发明多肽的七肽总体看来具有新颖的组成——在疏水七肽位置"和d位异乎寻常地富含丙氨酸。此外,在这些位置含有高水平的小的极性残基。更进一步而言,e位也有高水平的丙氨酸和小的疏水残基。相应地,在一个特别优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列"k^e/g,并且至少25%的a和d位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列ak"A/g,并且至少25%的"、t/和e位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列Wafe/g,并且至少25%的"位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列ak^e/g,并且至少25%的d位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列Wafe/g,并且至少25%的e位氨基酸是丙氨酸残基。在一个特别优选实施方式中,所述的至少IO拷贝的七肽序列是连续的。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列Wafe/g,并且至少15%的a和i/位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列ak:tfe/g,并且至少15%的"、d和e位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列WcA/g,并且至少15%的"氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列Wc血/g,并且至少15%的d位氨基酸是丙氨酸残基。在另一个优选实施方式中,具有巻曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列Wctfe/g,并且至少15%的e位氨基酸是丙氨酸残基。在一个特别优选实施方式中,所述的至少5拷贝的七肽序列是连续的。在一个实施方式中,所述的多肽包括选自下述的序列-i)SEQIDN0:1、SEQIDN0:2、SEQIDNO:22、SEQIDNO:23、SEQIDNO:40、SEQIDNO:41、SEQIDNO:56以及SEQIDNO:57所提供的任何一条氨基酸序列;ii)与SEQIDNO:l、SEQIDNO:2、SEQIDNO:22、SEQIDNO:23、SEQIDNO:40、SEQIDNO:41、SEQIDNO:56以及SEQIDNO:57中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。在另外一个实施方式中,所述的多肽包括选自下述的序列i)SEQIDNO:3、SEQIDNO:4、SEQIDNO:24、SEQIDNO:25、SEQIDNO:42、SEQIDNO:43、SEQIDNO:58以及SEQIDNO:59所提供的任何一条氨基酸序列;ii)与SEQIDNO:3、SEQIDNO:4、SEQIDNO:24、SEQIDNO:25、SEQIDNO:42、SEQIDNO:43、SEQIDNO:58以及SEQIDNO:59中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。在另外一个实施方式中,所述的多肽包括选自下述的序列i)SEQIDNO:5、SEQIDNO:6、SEQIDNO:26、SEQIDNO:27、SEQIDNO:44、SEQIDNO:45、SEQIDNO:60以及SEQIDNO:61所提供的任何一条氨基酸序列;ii)与SEQIDNO:5、SEQIDNO:6、SEQIDNO:26、SEQIDNO:27、SEQIDNO:44、SEQIDNO:45、SEQIDNO:60以及SEQIDNO:61中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。在另外一个实施方式中,所述的多肽包括选自下述的序列i)SEQIDNO:7、SEQIDNO:8、SEQIDNO:28、SEQIDNO:29、SEQIDNO:46、SEQIDNO:47、SEQIDNO:62以及SEQIDNO:63所提供的任何一条氨基酸序列;ii)与SEQIDNO:7、SEQIDNO:8、SEQIDNO:28、SEQIDNO:29、SEQIDNO:46、SEQIDNO:47、SEQIDNO:62以及SEQIDNO:63中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。在另外一个实施方式中,所述的多肽包括选自下述的序列i)SEQIDNO:72或SEQIDNO:73所提供的氨基酸序列;ii)与SEQIDNO:72和/或SEQIDNO:73具有至少30%同源性的氨基酸序11列;以及iii)i)或ii)的生物活性片段。与本发明第一方面有关的更多丝蛋白已得到鉴定。这些蛋白其中之一(SEQIDNO:IO)被PR0Fsec预测为含有4P/。的a螺旋、8%的(3折叠和50%的环的二级结构,因而被归入混合结构蛋白一类。对该蛋白的MARCOIL分析仅预测出一个短的七肽重复区,这是具有巻曲螺旋结构蛋白的特征性结构。相应地,本发明第二方面提供一种基本上纯化的和/或重组的丝多肽,其包括选自下述的序列i)SEQIDNO:9、SEQIDNO:IO以及SEQIDNO:30所提供的任何一条氨基酸序列;ii)与SEQIDNO:9、SEQIDNO:IO以及SEQIDNO:30具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。若不被理论所限,似乎第一方面的四种蛋白质的螺旋轴相互平行地缠绕形成束,这些束沿轴向延长形成原纤维。此外,据预测至少在象蜜蜂和熊蜂这样的物种中,第二方面的蛋白起"胶"的作用,辅助将许多第一方面的巻曲螺旋蛋白束粘合在一起形成纤维蛋白复合体。然而,即使没有第二方面的多肽,仍然可以形成丝纤维和共聚物。在一个优选实施方式中,本发明的多肽可从膜翅目或脉翅目昆虫的物种中纯化获得,或是纯化获得的多肽的突变体。优选地,膜翅目昆虫的物种为意大利蜂"p/s舰〃i/fem)、黄猄虫义(Oeco/7/^〃a駕aragti/朋)、牛头犬虫义(Afy削ec/"》"'c"to)或授粉熊蜂(BowZ^few欲/5)。优选地,脉翅目昆虫的物种为玛草蛉(M〃atfa另一方面,本发明提供本发明多肽与至少一种其他多肽融合。在一个优选的实施方式中,所述的至少一种其他多肽选自提高本发明多肽稳定性的多肽、辅助所述的融合蛋白纯化的多肽或辅助本发明的多肽从细胞中分泌的多肽(例如从植物细胞中分泌)。另一方面,本发明提供编码丝多肽的分离的和/或外源多核苷酸,其中该丝多肽至少一部分具有巻曲螺旋结构。在一个实施方式中,所述的多核苷酸包括选自下述的序列-i)SEQIDNO:ll、SEQIDNO:12、SEQIDNO:31、SEQIDNO:32、SEQIDNO:48、SEQIDNO:49、SEQIDNO:64以及SEQIDNO:65所提供的任何一条核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:ll、SEQIDNO:12、SEQIDNO:31、SEQIDNO:32、SEQIDNO:48、SEQIDNO:49、SEQIDNO:64以及SEQIDNO:65中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。在另一个实施方式中,所述的多核苷酸包括选自下述的序列i)SEQIDN0:13、SEQIDNO:14、SEQIDNO:33、SEQIDNO:34、SEQIDNO:50、SEQIDNO:51、SEQIDNO:66以及SEQIDNO:67所提供的任何一条核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:13、SEQIDNO:14、SEQIDNO:33、SEQIDNO:34、SEQIDNO:50、SEQIDNO:51、SEQIDNO:66以及SEQIDNO:67中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。在另外一个实施方式中,所述的多核苷酸包括选自下述的序列i)SEQIDNO:15、SEQIDNO:16、SEQIDNO:35、SEQIDNO:36、SEQIDNO:52、SEQIDNO:53、SEQIDNO:68以及SEQIDNO:69所提供的任何一条核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:15、SEQIDNO:16、SEQIDNO:35、SEQIDNO:36、SEQIDNO:52、SEQIDNO:53、SEQIDNO:68以及SEQIDNO:69中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到m)中任何一条杂交的序列。在另一个实施方式中,所述的多核苷酸包括选自下述的序列i)SEQIDNO:17、SEQIDNO:18、SEQIDNO:37、SEQIDNO:38、SEQIDNO:54、SEQIDNO:55、SEQIDNO:70、SEQIDNO:71以及SEQIDNO:76所提供的任何一条核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:17、SEQIDNO:18、SEQIDNO:37、SEQIDNO:38、SEQIDNO:54、SEQIDNO:55、SEQIDNO:70、SEQIDNO:71以及SEQIDNO:76中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。在另一个实施方式中,所述的多核苷酸包括选自下述的序列i)SEQIDNO:74或SEQIDNO:75所提供的核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:74和/或SEQIDNO:75具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。另一方面,本发明提供分离的和/或外源多核苷酸,该多核苷酸包括选自下述的序列i)SEQIDN0:19、SEQIDNO:20、SEQIDNO:21以及SEQIDNO:39所提供的任何一条核苷酸序列;ii)编码本发明多肽的核苷酸序列,iii)与SEQIDNO:19、SEQIDNO:20、SEQIDNO:21以及SEQIDNO:39中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。在一个优选实施方式中,本发明的多核苷酸可从膜翅目或脉翅目昆虫的物种中分离获得,或是分离获得的多核苷酸的突变体。优选地,膜翅目昆虫的物种为意大禾U蜂(Jf、we//z/era)、黄猄虫义(6>ecop/z_y〃"5W<3rag<i/"")、牛头犬虫义(踏rwec/a/on'cata)或授粉熊蜂(Bow&iw/erresfr/s)。优选地,脉翅目昆虫的物种为玛草蛉(Mx〃"6as/gato)。另一方面,本发明提供包括至少一种本发明多核苷酸的载体。优选地,该载体为表达载体。另一方面,本发明提供包括至少一种本发明多核苷酸和/或至少一种本发明载体的宿主细胞。该宿主细胞可为任何类型的细胞,其例子包括但不限于细菌、酵母或植物细胞。本发明也提供制备本发明多肽的方法,该方法包括在允许编码所述多肽的多核苷酸表达条件下,培养本发明的宿主细胞,或本发明的载体,以及回收所表达的多肽。可想而知转基因植物在生产本发明多肽中特别有用。因此,另一方面,本发明提供包括包括外源多核苷酸,编码至少一种本发明的多肽的转基因植物。另一方面,本发明提供包括外源多核苷酸,编码至少一种本发明的多肽的非人类转基因动物。另一方面,本发明提供特异性结合本发明多肽的抗体。另一方面,本发明提供包括至少一种本发明多肽的丝纤维。优选地,该多肽是一种重组多肽。在一个实施方式中,至少一些所述的多肽是交联的。在一个实施方式中,至少所述的多肽的一些赖氨酸残基是交联的。另一方面,本发明提供包括至少两种本发明多肽的共聚物。优选地,所述的多肽是重组多肽。在一个实施方式中,所述的共聚物包括至少四种不同的第一方面的多肽。在另一个实施方式中,所述的共聚物进一步包括一种第二方面的多肽。在一个实施方式中,至少一些所述的多肽是交联的。在一个实施方式中,至少所述的多肽的一些赖氨酸残基是交联的。本领域技术人员会理解本发明多肽具有如所属领域其它类型丝蛋白一样具有广泛的己知的用途。因此,另一方面,本发明提供包括至少一种本发明多肽,本发明丝纤维和/或本发明共聚物的产品。产品的例子包括但不限于个人护理产品、纺织品、塑料制品和生物医学产品。另一方面,本发明提供包括至少一种本发明多肽、本发明丝纤维和/或本发明共聚物,以及一种或一种以上可接受的载体的组合物。在一个实施方式中,所述的组合物进一歩包括药物。在另一个实施方式中,所述的组合物用作药物、或者在医疗器械或化妆品中使用。另一方面,本发明提供包括至少一种本发明多核苷酸,以及一种或一种以上可接受的载体的组合物。在一个优选实施方式中,本发明的组合物、丝纤维、共聚物和/或产品不包括昆虫产生的王浆蛋白。另一方面,本发明提供一种治疗或预防疾病的方法,该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物,其中药用载体选自至少一种本发明多肽、本发明丝纤维和/或本发明共聚物。另一方面,本发明提供至少一种本发明多肽、本发明丝纤维和/或本发明共聚物,以及药物,在制备治疗或预防疾病的药物中的用途。另一方面,本发明提供包括至少一种本发明多肽、至少一种本发明多核苷酸、至少一种本发明载体、至少一种本发明丝纤维和/或本发明共聚物的试剂盒。优选地,所述的试剂盒进一步包括使用该试剂盒的信息和/或说明。很明显,本发明一个方面的优选特征和特性也可用于本发明其他许多方面。整个说明书中所用的词语"包括(comprise)"或其变体"包括(comprises)"或"包括(comprising)",应理解为是指含有所述的成分、整体或歩骤,或成分、整体或歩骤组成的组,但不排除任何其他成分、整体或歩骤,或成分、整体或步骤组成的组。下文中本发明通过下述非限定实施例并对附图附有参考的方式进行描述。图l.下列丝的酰胺I区和II区的傅立叶变换红外光谱1)蜜蜂丝,2)熊蜂丝,3)牛头犬蚁(bulldogant)丝,4)织工蚁(weaverant)丝,5)草蜻蛉(lacewing)幼虫丝。上述所有的丝都具有光谱预期的螺旋蛋白。膜翅目昆虫的丝(蚂蚁和蜜蜂)在1645-1646cm"具有光谱最大值(标记的),比典型a螺旋低,移动10cm—1并变宽,这是典型的巻曲螺旋蛋白的特征(Heimburg等人,1999)。图2.SDS洗涤过的蜜蜂巢房(broodcomb)丝氨基酸组成与Xenospira蛋白(即,Xenospira1、Xenospira2、Xenospira3、Xenospira4)(等摩尔数总计65%)及Xenosin氨基酸(35%)组成的比较。图3.丝氨基酸组成与丝基因编码蛋白预测的氨基酸组成的比较。图4.蜜蜂丝蛋白巻曲螺旋区的预测。COILS是将一个序列与已知平行双股巻曲螺旋数据库比较的程序,并取得相似性得分。通过将该得分与球形和巻曲螺旋蛋白得分的分布相比较,程序计算该序列采取巻曲螺旋构象的概率,如Lupas等人所述(1991)。使用窗口大小28,本程序预测下列每个蛋白的巻曲螺旋结构域中存在下述残基数目Xenospira3:77;Xenospira4:35;Xenospira1:28;Xenospira2:80。图5.蜜蜂丝蛋白比对显示形成巻曲螺旋的主要七肽的MARCOIL预测结果。七肽序列显示在氨基酸上面,"位和d位的丙氨酸残基突出显示。图6.Marciol预测的膜翅目昆虫(蜜蜂和蚂蚁)丝蛋白巻曲螺旋区比对显示七肽位置分配。Amd,蜜蜂;BB,熊蜂;BA,牛头犬蚁;WA,织工蚊;Fl-4,丝心蛋白1-4。七肽序列显示在氨基酸上面,"位、d位和e位的丙氨酸残基突出显示。图7.玛草蛉(MW/"cfow'gw"to)幼虫丝蛋白和膜翅目昆虫丝蛋白直系同源簇(orthologousclusters)的预测的巻曲螺旋区中七肽位置的氨基酸特征。图8.晚末龄幼虫唾液腺蛋白的SDS聚丙烯酰胺凝胶电泳。在胰蛋白酶切后分析质谱数据组对蛋白进行鉴定。通过安捷伦公司SpectmmMill软件将质谱数据与从cDNA序列确定蛋白的预测蛋白序列相匹配,从而得到质谱分析结果。该软件对实验观察到的肽片段数据组与根据已有数据库中蛋白序列产生的可能的预测片段之间的每个匹配的质量给出得分。此处显示的所有序列匹配的SpectrumMill软件得分都大于20,而20的得分足以自动的有把握的认定一个有效的匹配。图9.丝蛋白巻曲螺旋区简约性分析。四个巻曲螺旋蛋白的相关性暗示该基因在真针尾类(Euaculeata)分化之前从共同的祖先进化而来。虚线包围的区域显示在侏罗纪晚期蚂蚁和蜜蜂(胡蜂总科)从蜜蜂(蜜蜂总科)分化之前所出现的变异(155myrs(百万年);Grimaldi和Engel,2005)。图中给出了做1000次重复抽样(iterations)之后,每个分支的自信自展值(bootstrapvalues)。图10.A)对蜜蜂丝胰蛋白酶切产生的肽进行质谱分析,鉴定蜜蜂丝蛋白。阴影表示质谱分析鉴定的肽。此处显示的所有序列匹配的SpectrumMill软件得分都大于20,而20的得分足以自动的有把握的认定一个有效的匹配。B)熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白全长氨基酸序列。图11.编码蜜蜂、熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白的开放读码框(Openreadingframes)。图12.编码Xenosin的基因序列。提供了完整编码序列,其中插入了一个内含子(突出显示处)。图13.丝蛋白在烟草中的表达。对下列来源的蛋白进行蛋白印迹分析(westernblotanalysis),检测带组氨酸标签的蛋白1.空表达载体转化的大肠杆菌(£.co//),2.包括AmelF4(Xenospira4)编码区的表达载体转化的大肠杆菌(£.co//),3.空表达载体转化的烟草,4.包括AmelF4编码区的表达载体转化的烟草。图14.重组蜜蜂丝蛋白制成的纤维表现出双折射线。生物折射表明线中存在结构。A-D每组显示了不同的重组蜜蜂的线,E组中显示了重组的草蜻蛉的线。序列表索引SEQIDNO:l-此处称为Xenospiral的蜜蜂丝蛋白(也称为AmelFl)(减去信号肽)。SEQIDNO:2-此处称为Xenospiral的蜜蜂丝蛋白。SEQIDNO:3-此处称为Xenospira2的蜜蜂丝蛋白(也称为AmelF2)(减去信号肽)。SEQIDNO:4-此处称为Xenospira2的蜜蜂丝蛋白。SEQIDNO:5-此处称为Xenospira3的蜜蜂丝蛋白(也称为AmelF3)(减去信号肽)。SEQIDNO:6-此处称为Xenospira3的蜜蜂丝蛋白。SEQIDNO:7-此处称为Xenospira4的蜜蜂丝蛋白(也称为AmelF4)(减去信号肽)。SEQIDNO:8-此处称为Xenospira4的蜜蜂丝蛋白。SEQIDNO:9-此处称为Xenosin的蜜蜂丝蛋白(也称为AmelSAl)(减去信号肽)。SEQIDNO:IO-此处称为Xenosin的蜜蜂丝蛋白。SEQIDNO:ll-编码蜜蜂丝蛋白Xenospiral的核苷酸序列(减去编码信号肽的区)。SEQIDNO:12-编码蜜蜂丝蛋白Xenospiral的核苷酸序列。SEQIDNO:13-编码蜜蜂丝蛋白Xenospira2的核苷酸序列(减去编码信号肽的区)。SEQIDNO:14-编码蜜蜂丝蛋白Xenospira2的核苷酸序列。SEQIDNO:15-编码蜜蜂丝蛋白Xenospim3的核苷酸序列(减去编码信号肽的区)。SEQIDNO:16-编码蜜蜂丝蛋白Xenospira3的核苷酸序列。SEQIDNO.17-编码蜜蜂丝蛋白Xenospira4的核苷酸序列(减去编码信号肽的区)。SEQIDNO:18-编码蜜蜂丝蛋白Xenospira4的核苷酸序列。SEQIDNO:19-编码蜜蜂丝蛋白Xenosin的核苷酸序列(减去编码信号肽的区)。SEQIDNO:20-编码蜜蜂丝蛋白Xenosin的核苷酸序列。SEQIDN0:21-编码蜜蜂丝蛋白Xenosin的基因序列。SEQIDNO:22-此处称为BBF1的熊蜂丝蛋白(减去信号肽)。SEQIDNO:23-此处称为BBF1的熊蜂丝蛋白。SEQIDNO:24-此处称为BBF2的熊蜂丝蛋白(减去信号肽)。SEQIDNO:25-此处称为BBF2的熊蜂丝蛋白。SEQIDNO:26-此处称为BBF3的熊蜂丝蛋白(减去信号肽)。SEQIDNO:27-此处称为BBF3的熊蜂丝蛋白。SEQIDNO:28-此处称为BBF4的熊蜂丝蛋白(减去信号肽)。SEQIDNO:29-此处称为BBF4的熊蜂丝蛋白。SEQIDNO:30-此处称为BBSA1的熊蜂丝蛋白部分氨基酸序列。SEQIDNO:31-编码熊蜂丝蛋白BBF1的核苷酸序列(减去编码信号肽的区)。SEQIDNO:32-编码熊蜂丝蛋白BBF1的核苷酸序列。SEQIDNO:33-编码熊蜂丝蛋白BBF2的核苷酸序列(减去编码信号肽的区)。SEQIDNO:34-编码熊蜂丝蛋白BBF2的核苷酸序列。SEQIDNO:35-编码熊蜂丝蛋白BBF3的核苷酸序列(减去编码信号肽的区)。SEQIDNO:36-编码熊蜂丝蛋白BBF3的核苷酸序列。SEQIDNO:37-编码熊蜂丝蛋白BBF4的核苷酸序列(减去编码信号肽的区)。SEQIDNO:38-编码熊蜂丝蛋白BBF4的核苷酸序列。SEQIDNO:39-编码熊蜂丝蛋白BBSA1的部分核苷酸序列。SEQIDNO:40-此处称为BAF1的牛头犬蚁丝蛋白(减去信号肽)。SEQIDNO:41-此处称为BAF1的牛头犬蚁丝蛋白。SEQIDNO:42-此处称为BAF2的牛头犬蚁丝蛋白(减去信号肽)。SEQIDNO:43-此处称为BAF2的牛头犬蚁丝蛋白。SEQIDNO:44-此处称为BAF3的牛头犬蚁丝蛋白(减去信号肽)。SEQIDNO:45-此处称为BAF3的牛头犬蚁丝蛋白。SEQIDNO:46-此处称为BAF4的牛头犬蚁丝蛋白(减去信号肽)。SEQIDNO:47-此处称为BAF4的牛头犬蚁丝蛋白。SEQIDNO:48-编码牛头犬蚁丝蛋白BAF1的核苷酸序列(减去编码信号肽的区)。SEQIDNO:49-编码牛头犬蚁丝蛋白BAF1的核苷酸序列。SEQIDNO:50-编码牛头犬蚁丝蛋白BAF2的核苷酸序列(减去编码信号肽的区)。SEQIDNO:51-编码牛头犬蚁丝蛋白BAF2的核苷酸序列。SEQIDNO:52-编码牛头犬蚁丝蛋白BAF3的核苷酸序列(减去编码信号肽的区)。SEQIDNO:53-编码牛头犬蚁丝蛋白BAF3的核苷酸序列。SEQIDNO:54-编码牛头犬蚁丝蛋白BAF4的核苷酸序列(减去编码信号肽的区)。SEQIDNO:55-编码牛头犬蚁丝蛋白BAF4的核苷酸序列。SEQIDNO:56-此处称为GAF1的织工蚁丝蛋白(减去信号肽)。SEQIDNO:57-此处称为GAF1的织工蚁丝蛋白。SEQIDNO:58-此处称为GAF2的织工蚁丝蛋白(减去信号肽)。SEQIDNO:59-此处称为GAF2的织工蚁丝蛋白。SEQIDNO:60-此处称为GAF3的织工蚁丝蛋白(减去信号肽)。SEQIDNO:61-此处称为GAF3的织工蚁丝蛋白。SEQIDNO:62-此处称为GAF4的织工蚁丝蛋白(减去信号肽)。SEQIDNO:63-此处称为GAF4的织工蚁丝蛋白。SEQIDNO:64-编码织工蚁丝蛋白GAF1的核苷酸序列(减去编码信号肽的区)。SEQIDNO:65-编码织工蚁丝蛋白GAF1的核苷酸序列。SEQIDNO:66-编码织工蚁丝蛋白GAF2的核苷酸序列(减去编码信号肽的区)。SEQIDNO:67-编码织工蚁丝蛋白GAF2的核苷酸序列。SEQIDNO:68-编码织工蚁丝蛋白GAF3的核苷酸序列(减去编码信号肽的区)。SEQIDNO:69-编码织工蚁丝蛋白GAF3的核苷酸序列。SEQIDNO:70-编码织工蚁丝蛋白GAF4的核苷酸序列(减去编码信号肽的区)。SEQIDNO:71-编码织工蚁丝蛋白GAF4的核苷酸序列。SEQIDNO:72-此处称为MalFl的草蜻蛉丝蛋白(减去信号肽)。SEQIDNO:73-此处称为MalFl的草蜻蛉丝蛋白。SEQIDNO:74-编码草蜻蛉丝蛋白MalFl的核苷酸序列(减去编码信号肽的区)。SEQIDNO:75-编码草蜻蛉丝蛋白MalFl的核苷酸序列。SEQIDNO:76-对密码子为植物表达而进行优化(在亚克隆到pET14b和pVEC8之前)的编码此处称为Xenospira4蜜蜂丝蛋白核苷酸序列。SEQIDNO:77-为植物表达而进行优化的蜜蜂丝蛋白(Xenospira4)开放读码框(无翻译融合)。
发明内容普通技术和定义除非另有特别定义,此处使用的所有科技术语应与本领域(例如细胞培养、分子遗传学、免疫学、免疫组化、蛋白质化学和生物化学领域)普通技术人员通常理解的意思相同。除非另有说明,本发明使用的重组蛋白、细胞培养和免疫技术采用标准操作,是本领域技术人员熟知的。这些技术在下列文献中有描述和解释,如J.Perbal,APracticalGuidetoMolecularCloning(实用分子克隆指南),JohnWiley禾nSons(1984)、J.Sambrook等人,MolecularCloning:ALaboratoryManual(分子克隆实验指南),ColdSpringHarbourLaboratoryPress(1989)、T.A.Brown(编辑),EssentialMolecularBiology:APracticalApproach(基本分子生物学实用方法),第1和第2巻,IRLPress(1991)、D.M.Glover和B.D.Hames(编辑),DNACloning:APracticalApproach(DNA克隆实用方法),1-4巻,IRLPress(1995和1996)以及F.M.Ausubel等人(编辑),CurrentProtocolsinMolecularBiology(现代分子生物学实验方案),GreenePub.Associates和Wiley-Interscience(1988,包括至今所有的更新)、EdHarlow禾口DavidLane(编辑),Antibodies:ALaboratoryManual(抗体:实验指南),ColdSpringHarbourLaboratory(1988)和J.E.Coligan等人(编辑)CurrentProtocolsinImmunology(现代免疫学实验方案),JohnWiley&Sons(包括至今所有的更新),这些文献通过引用合并于此。此处所用的术语"丝蛋白"和"丝多肽"是指能用来生产丝纤维和/或纤维状蛋白复合体的纤维状蛋白质/多肽。自然存在的丝蛋白诸如蜜蜂等昆虫的巢房(broodcomb)丝是本发明的一部分,然而,如此处所述,如果在合适的昆虫中表达,可执行同样功能的这些蛋白质的变体很容易生产出来。此处所用的"丝纤维"是指包括本发明蛋白质可被织成不同物品如纺织品的丝。此处所用的"共聚物"是指包括两种或两种以上本发明丝蛋白的组合物。该术语不包括自然存在的如昆虫巢房之类的共聚物。术语"植物"包括整个植物、营养结构(例如叶、茎)、根、花器官/结构、种子(包括胚、胚乳和种皮)、植物组织(例如维管组织、基本组织之类)、细胞以及同类的子代。"转基因植物"是指包括未在同种、变种或栽培品种的野生型植物中发现的基因构建物("转基因")的植物。此处所指"转基因"与生物
技术领域
正常的意思相同,包括通过重组DNA或RNA技术产生的或改变的基因序列,并被引入植物细胞。转基因可包括从植物细胞中获得的序列。典型地,该转基因通过诸如转化之类的人工操作引入植物中,但是该操作可以是任何所属领域技术人员认可的方法。"多核苷酸"是指寡核苷酸、核酸分子或其任何片段。可以是基因组来源或合成的DNA或RNA,可以是双链或单链的,可以结合糖类、脂质、蛋白质或其他材料来行使此处限定的特定功能。此处所用的"可操作的连接"是指两个或两个以上的核酸(例如DNA)片段之间的功能关系。典型地,是指转录调节元件对所转录的序列之间的功能关系。例如,如果启动子在适当的宿主细胞中促进或调节编码序列的转录,则启动子与编码序列之间是可操作的连接,该编码序列可以是如此处所限定的多核苷酸之类的序列。一般而言,可操作的连接到转录序列的启动子转录调节元件与所转录的序列是实体上连续的,即它们是顺式作用(&m>7g)。然而,有些转录调节元件,如增强子,不必与它们所增强转录的编码序列在实体上连续或位于其附近。术语"信号肽"是指成熟的分泌蛋白质之前的氨基末端多肽。信号肽从蛋白质中切除,因而并不出现在成熟蛋白质中。信号肽具有指导和反式定位(trans-locating)分泌蛋白质穿过细胞膜的功能。信号肽也称为信号序列。此处所用的"转化"是指细胞通过包括新的多核苷酸而获得新的基因。此处所用术语"药物"是指能被用来治疗或预防特定疾病的任何化合物,可通过本发明的丝蛋白制成的药物的例子包括但不限于蛋白质、核酸、抗肿瘤试剂、镇痛药、抗生素、抗炎化合物(类固醇类和非类固醇类都包括)、激素、疫苗、标记物质等等。多肽本发明所述"基本上纯化的多肽"意思是指一般的从脂质、核酸、其他多肽和其他污染分子诸如天然状态下结合的蜡中分离的多肽。所述的基本上纯化的多肽优选地至少60%的游离,更优选地至少75%的游离,更优选地至少90%的游离于其天然结合的其他成分,上述限定不包括本发明的其他蛋白。在多肽的背景中使用的术语"重组"是指细胞或无细胞表达系统中,与其天然状态相比,通过改变产量或产率而产生多肽。在一个实施方式中,所述的细胞是天然不产生该多肽的细胞。然而,所述的细胞可以是包括导致该多肽产量改变,优选地为增加该多肽产量的非内源基因的细胞。本发明的重组多肽包括尚未从产生它的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多肽,以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多肽。术语"多肽"和"蛋白质"一般可相互替换的使用,是指单多肽链,其可能通过添加非氨基酸基团而修饰,也可能不修饰。此处所用的术语"蛋白质"和"多肽"也包括此处所述的本发明的多肽的变异体、突变体、修饰物、模拟物和/或衍生物。多肽的%同源性(也称同一性,identity)通过GAP(Needleman和Wunsch,1970)分析(GCG程序)确定,其缺口产生罚分(gapcreationpenalty)=5,缺口延伸罚分(gapextensionpenalty)=0.3。査询序列至少15个氨基酸长,GAP分析在至少15个氨基酸的区域比对两条序列。更优选地,查询序列至少50个氨基酸长,GAP分析在至少50个氨基酸的区域比对两条序列。更优选地,查询序列至少100个氨基酸长,GAP分析在至少IOO个氨基酸的区域比对两条序列。更优选地,21查询序列至少250个氨基酸长,GAP分析在至少250个氨基酸的区域比对两条序列。更优选地,GAP分析对两条序列的全长进行比对。此处所用"生物活性"片段是指本发明多肽的一部分,其保持了该全长多肽的确定的活性,即用来产生丝的能力。生物活性片段可为任意长度,只要它们保持了所述的确定的活性。对于所限定的多肽,应理解比上述%同源性高的数值包括了优选的实施方式。因此,在适用的情况下,根据最低%同源性数值,所述的多肽包括的氨基酸序列,与相应的指定SEQIDNO具有下述同源性优选地至少40%,更优选地至少45%,更优选地至少50%,更优选地至少55%,更优选地至少60%,更优选地至少65%,更优选地至少70%,更优选地至少75%,更优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,更优选地至少93%,更优选地至少94%,更优选地至少95%,更优选地至少96%,更优选地至少97%,更优选地至少98%,更优选地至少99%,更优选地至少99.1%,更优选地至少99.2%,更优选地至少99.3%,更优选地至少99.4%,更优选地至少99.5%,更优选地至少99.6%,更优选地至少99.7%,更优选地至少99.8%,更优选地至少99.9%。本发明多肽的氨基酸序列突变体可通过向本发明的核酸中引入适当的改变的核苷酸而制备,或通过体外合成所需的多肽。所述的突变体包括,例如在氨基酸序列内进行残基的删除、插入或替换。可组合运用删除、插入和替换来获得最终的构建物,只要最终的多肽产物具有所需的特性。突变(改变的)多肽可通过本领域已知的任何技术制备。例如,可对本发明的多核苷酸进行体外诱变。所述的体外诱变技术包括将该多核苷酸亚克隆到适当的载体,转化该载体到"突变"株如大肠杆菌XL-1红(Stratagene),并使转化的细菌繁殖适当的世代。另一个例子中,对本发明的多核苷酸使用DNA穿梭技术,该技术己被Harayama明白的描述(1998)。这些DNA穿梭技术可包括本发明的基因,并可能还有与本发明基因相关的基因,如来源于此处所述具体物种之外的其他膜翅目和脉翅目物种的丝基因。突变/改变的DNA获得的产物可通过此处描述的技术容易得筛选确定它们能否用作丝蛋白。在涉及氨基酸序列突变体过程中,突变位点的位置和突变的性质依赖于将要修饰的性状。可对突变的位点进行单个修饰,或进行一系列修饰,例如通过(1)首先进行保守氨基酸替换,然后根据获得的结果进行更激进的替换,(2)删除目标残基,或(3)在该位点附近插入其他残基。删除的氨基酸序列一般在约1到15个残基的范围内,更优选地约1到10个残基,典型地约1到5个连续残基。替换突变中该多肽分子去除至少一个氨基酸残基并在该位置插入一个不同残基。最感兴趣的替换诱变位点包括已鉴定为重要的功能位点。其他感兴趣的位点是那些不同株或物种中特定残基相同的位点。这些位点可能对于生物活性是重要的。对这些位点,尤其是至少三个其他完全相同的保守位点,优选地通过一种相对保守的方式进行替换。这些保守的替换列在标题为"典型的替换"的表l中。如上所述,一些本发明多肽的一部分具有巻曲螺旋结构,多肽的巻曲螺旋结构特征为七肽重复,以一致序列"6c^/gJ"表示。在一个优选的实施方式中,该多肽具有巻曲螺旋结构的部分包括至少10拷贝的七肽序列Wofe/g,并且至少25%的fl和d为氨基酸为丙氨酸残基。表l.典型的替换<table>tableseeoriginaldocumentpage23</column></row><table>在一个优选的实施方式中,具有巻曲螺旋结构的多肽包括至少12个连续拷贝,更优选地至少15个连续拷贝,更优选地至少18个连续拷贝的七肽。进一歩的实施方式中,所述的具有巻曲螺旋结构的多肽含有达到至少28拷贝的七肽。典型地,该七肽的拷贝是串联重复的(tandemlyrepeated)。然而,它们不一定必须是精确的串联重复,例如,如图5和图6所示,可能在两个七肽间发现一些氨基酸,或可能发现一些截断的七肽(例如,见图5中Xenospiral)。图5和图6以及表6-]0提供了对具有巻曲螺旋结构的本发明多肽可进行的氨基酸替换的指南。当此处提供的基于实验数据的预测有用的氨基酸替换与表1提供的典型的替换有任何形式的冲突时,优选地使用基于实验数据的替换。本发明多肽的巻曲螺旋结构具有高丙氨酸残基含量,特别是在七肽的a、J和e氨基酸位。然而,6、c、/和g位也有高频率的丙氨酸残基。在一个优选实施方式中,至少15%的七肽的"、"和/或e位氨基酸是丙氨酸残基是丙氨酸残基,更优选地至少25%,更优选地至少30%,更优选地至少40%,更优选地至少50%。在进一歩的优选实施方式中,至少25%的七肽的《和d位氨基酸都是丙氨酸残基,更优选地至少30%,更优选地至少40%,更优选地至少50%。此外,优选地至少15%的七肽6、c、/和g位氨基酸是丙氨酸残基,更优选地至少20%,更优选地至少25%。典型地,该七肽不包括脯氨酸或组氨酸残基。而且,该七肽中,下列残基如果有,也是很少的(l或2个),这些残基为苯丙氨酸、甲硫氨酸、酪氨酸、半胱氨酸、甘氨酸或色氨酸残基。除了丙氨酸,该七肽中通常的(例如,多于5%,更优选地多于10%)氨基酸包括亮氨酸(特别是在6和d位)、丝氨酸(特别是在6、e和/位)、谷氨酸(特别是在c、e和/位)、赖氨酸(特别是在6、c、d、/和g位),以及g位的精氨酸。本发明的多肽(和多核苷酸)可从广泛的膜翅目和脉翅目昆虫物种中纯化(分离)获得。膜翅目昆虫的例子包括但不限于细腰(Apocrita)亚目的任何种(蜜蜂、蚂蚁和黄蜂),其包括下列各科昆虫青蜂科(Chrysididae)(青蜂,cuckoowasps)、蚁科(Formicidae)(蚂蚁,ants)、蚁蜂科(Mutillidae)(蚁蜂,velvetants)、蛛蜂科(Pompilidae)(蛛蜂,spiderwasps)、土蜂科(Scoliidae)、胡蜂科(Vespidae)(黄蜂,paperwasps、蜾赢potterwasps、虎头蜂hornets)、榕小蜂禾斗(Agaonidae)(榕小蜂,figwasps)、小蜂科(Chalcididae)(小蜂,chalcidids)、蚁小蜂科(Eucharitidae)(蚁小蜂,eucharitids)、旋小蜂科(Eupelmidae)(旋小蜂,eupelmids)、金小蜂科(Pteromalidae)(金小蜂,pteromalids)、旗腹姬蜂科(Evaniidae)(痩蜂,ensignwasps)、茧蜂禾斗(Braconidae)、姬蜂禾斗(Ichneumonidae)(姬蜂,ichneumons)、切叶峰科(Megachilidae)、蜜蜂科(Apidae)、分舌花蜂科(Colletidae)、集蜂科(Halictidae)和准蜜蜂科(Melittidae)(集油蜜蜂,oilcollectingbees)。脉翅目昆虫的例子包括下列各科昆虫的种螳蛉科(Mantispidae)、草蛉科(Chrysopidae)(草虫青岭,lacewings)、虫义岭科(Myrmeleontidae)(奴卿antlions)和蝶角蛉科(Ascalaphidae)(枭蝇,owlflies)。这类更多的多肽(和多核苷酸)可用此处描述的同样程序从来源于授粉熊蜂(万om^^tore对r")、牛头犬蚁(A^77nec/a/or/c"to)、黄猄蚁((9ecop/z>>〃fir5warag&wi!)和玛草蛉(Afa//"tfaWg"ata)的丝中鉴定其特性。此外,如果需要,非自然存在的氨基酸或化学氨基酸类似物可通过替代或加入而引入本发明的多肽中。这些氨基酸包括但不限于一般氨基酸的右旋体、2,4-二氨基丁酸、a-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、鸟氨酸、正亮氨酸、正缬氨酸、羟脯氨酸、肌氨酸、瓜氨酸、高瓜氨酸、磺丙氨酸、叔丁基甘氨酸、叔丁基丙氨酸、苯基甘氨酸、丙氨酸环己酯、P-丙氨酸、氟氨基酸、设计的氨基酸如p-甲基氨基酸、Ca-甲基氨基酸、Na-甲基氨基酸以及一般的氨基酸类似物。本发明的范围内也包括在合成过程中或合成后进行不同修饰的本发明多肽,例如,生物素化、苄基化、糖基化、乙酰化、磷酸化、酰胺化、己知保护/封闭基团衍生化、蛋白水解性裂解、结合抗体分子或其他细胞配基等。这些修饰可能起到增强本发明多肽的稳定性和/或生物活性的作用。本发明多肽可通过许多方法生产,包括自然多肽的生产和回收、重组多肽的生产和回收以及化学合成这些多肽。在一个实施方式中,分离的本发明多肽通过在有效产生该多肽的条件下培养能够表达所述的多肽的细胞,并回收该多肽而获得。优选的要培养的细胞为本发明的重组细胞。有效的培养条件包括但不限于允许多肽生产的有效的培养基、生物反应器、温度、pH和氧气条件。有效的培养基是指用来培养产生本发明多肽细胞的任何培养基。该培养基典型地包括含有可同化碳、氮和磷酸盐来源,以及适当的盐、矿物质、金属和其他营养素如维生素的水性培养基。本发明的细胞可通过传统的发酵生物反应器、摇瓶、试管、微量滴定盘以及培养皿中培养。培养可在适合重组细胞的温度、pH和氧气环境中进行。该培养条件在本领域普通技术人员的技术范围内。多核苷酸所述的"分离的多核苷酸",包括DNA、RNA或其组合、单链或双链、正义链或反义链方向或其组合、dsRNA或其他,是指至少部分地从它天然状态下结合或连接的多核苷酸序列中分离出来的多核苷酸序列。优选地,分离的多核苷酸至少60%游离、优选地至少75%游离、最优选地至少90%游离于它们自然状态下结合的其他成分。此外,此处使用的术语"多核苷酸"与术语"核酸"可相互替换。在多核苷酸语境中使用的术语"外源的"是指与其天然状态相比以一种数量发生改变的方式出现在细胞或无细胞表达系统中。在一个实施方式中,所述的细胞是在天然状态下不包括该多核苷酸的细胞。然而,所述的细胞可以是包括导致其编码多肽的产量发生改变,优选的为增加的非外源多核苷酸的细胞。本发明的外源多核苷酸包括尚未从存在该多核苷酸的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多核苷酸,以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多核苷酸。多核苷酸的%同源性(identity)通过GAP(Needleman和Wunsch,1970)分析(GCG程序)确定,其缺口产生罚分(gapcreationpenalty)=5,缺口延伸罚分(gapextensionpenalty)=0.3。除非另有说明,查询序列至少45个核苷酸长,GAP分析在至少45个核苷酸的区域比对两条序列。优选地,查询序列至少150个核苷酸长,GAP分析在至少150个核苷酸的区域比对两条序列。更优选地,査询序列至少300个核苷酸长,GAP分析在至少300个核苷酸的区域比对两条序列。更优选地,GAP分析对两条序列的全长进行比对。对于所限定的多核苷酸,应理解比上述%同源性高的数值包括了优选的实施方式。因此,在适用的情况下,根据最低%同源性数值,所述的多核苷酸包括的序列,与相应的指定SEQIDNO具有下述同源性优选地至少40%,更优选地至少45%,更优选地至少50%,更优选地至少55%,更优选地至少60%,更优选地至少65%,更优选地至少70%,更优选地至少75%,更优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,更优选地至少93%,更优选地至少94%,更优选地至少95%,更优选地至少96%,更优选地至少97%,更优选地至少98%,更优选地至少99%,更优选地至少99.1%,更优选地至少99.2%,更优选地至少99.3%,更优选地至少99.4%,更优选地至少99.5%,更优选地至少99.6%,更优选地至少99.7%,更优选地至少99.8%,更优选地至少99.9%。本发明的多核苷酸可包括与天然存在的分子相比具有一个或一个以上的核苷酸残基缺失、插入或替换的突变。突变体可以是自然发生的(即,从自然来源分离的),也可以是合成的(例如,在该核酸上进行定向诱变)。本发明的寡核苷酸和/或多核苷酸在严谨的条件下与本发明的丝基因或所述的基因的侧翼区杂交。此处所用的术语"严谨的杂交条件"等是指本领域熟悉的参数,包括随寡核苷酸长度改变杂交温度。核酸杂交参数可在编辑该方法的参考文献中找到,如Sambrook等人(见前述)和Ausubd等人(见前述)。例如,此处所用的严谨的杂交条件,可指在杂交缓冲液(3.5xSSC、0.02%聚蔗糖、0.02%聚乙烯吡咯烷酮、0.02。/。牛血清白蛋白(BSA)、2.5mMNaH2P04(pH7)、0.5%SDS、2mMEDTA)中65。C杂交,然后在50°C0.2xSSC,0.01%BSA中洗一次或一次以上。另外,核酸和/或寡核苷酸(也可称为"引物"或"探针")在核酸扩增技术如PCR中使用的条件下与感兴趣的昆虫基因组区杂交,如蜜蜂的基因组。本发明的寡核苷酸可为RNA、DNA或其衍生物。尽管术语多核苷酸和寡核苷酸的意思有重叠的地方,寡核苷酸典型地是指相对短的单链分子。该寡核苷酸的最小值为寡核苷酸与目标核酸分子上的互补序列形成稳定杂交分子所需的大小。优选地,该寡核苷酸至少有15个核苷酸,更优选地至少有18个核苷酸,更优选地至少有19个核苷酸,更优选地至少有20个核苷酸,更优选地至少有25个核苷酸长度。一般而言,多核苷酸或寡核苷酸单体通过磷酸二酯键或其类似连接连接形成从相对短的单体单元如12-18个到几百个单体单元大小的寡核苷酸。磷酸二酯键的类似连接包括磷硫酰、二硫代磷酸酯、磷硒酰(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、硫代磷酸苯胺(phosphoroanilothioate)、磷酸苯胺(phosphoranilidate)、氨基磷酸酉旨(phosphoramidate)。本发明包括可用于鉴别核酸分子的探针或产生核酸分子的引物之类的寡核苷酸。用作探针的本发明寡核苷酸典型地与放射性同位素、酶、生物素、荧光分子或化学发光分子之类的可检测的标记物相结合。重组载体本发明的一个实施方式包括一种重组载体,该重组载体包括至少一种插入到任何能够将本发明多核苷酸传递到宿主细胞的载体中的本发明的分离多核苷酸。所述的载体包括异源多核苷酸序列,即那些并不天然出现在本发明多核苷酸分子附近的多核苷酸序列,并且优选地该多核苷酸序列来源于与本发明多核苷酸序列不同的物种。该载体可为RNA或DNA,原核的或真核的,且典型地为转座子(诸如US5,792,294中所描述的)、病毒或质粒。一种类型的重组载体包括可操作的连接到表达载体的本发明的多核苷酸分子。可操作的连接是指将多核苷酸分子以转化入宿主细胞中时该分子能够表达的方式插入到表达载体中。此处所用的表达载体是指能够转化宿主细胞并能够有效表达指定多核苷酸分子的DNA或RNA载体。优选地,该表达载体也能够在宿主细胞内复制。表达载体可为原核的或真核的,典型地为病毒或质粒。本发明的表达载体包括任何在本发明重组细胞中发挥功能(即指导基因表达)的载体,包括在细菌、真菌、内寄生物、节肢动物、动物和植物细胞中。本发明特别优选的表达载体能够在植物细胞中指导基因表达。本发明的载体也能用于在无细胞表达系统中产生多肽,该系统是本领域熟知的。特别地,本发明的表达载体包括如转录控制序列、翻译控制序列、复制起始点等调节序列,以及其他与重组细胞相容的和控制本发明多核苷酸分子表达的调节序列。特别地,本发明的重组分子包括转录控制序列。转录控制序列是控制转录起始、延伸和终止的序列。特别重要的转录控制序列是控制转录起始的序列,如启动子、增强子、操纵子和阻遏物序列。适当的转录控制序列包括能够在至少一种本发明重组细胞中发挥功能的任何转录控制序列。许多这样的转录控制序列是本领域技术人员已知的。优选的转录控制序列包括在细菌、酵母、节肢动物、植物或哺乳动物细胞中发挥功能的序列,如下所述但并不局限于此tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、噬菌体X、噬菌体T7、T71ac、噬菌体T3、噬菌体SP6、噬菌体SPOl、金属硫蛋白、a交配因子、毕赤酵母乙醇氧化酶、a病毒亚基因组启动子(如Sindbis病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾昆虫病毒、痘苗病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(如中间体早期启动子)、猿猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复、劳氏肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列,以及其他能够在原核或真核细胞中控制基因表达的序列。特别优选的转录控制序列为在植物中有指导转录活性的启动子,可以是组成型的或阶段和/或组织特异性的,取决于所用的植物或植物部分。植物启动子包括但不限于组成型表达的启动子,如花椰菜花叶病毒(CaMV)的35S启动子,叶特异性表达的,如二磷酸核酮糖羧化酶小亚基基因启动子,根特异性表达的,如谷氨酰胺合酶基因启动子,种子特异性表达的,如甘蓝型油菜cmciferinA基因启动子,块茎特异性表达的,如马铃薯I类patatin基因启动子,以及果实特异性表达的,如番茄的多聚半乳糖醛酸酶(PG)启动子。本发明的重组分子也可包括(a)分泌信号(即信号片段核酸序列),以使本发明的表达多肽从产生该多肽的细胞分泌出来和/或(b)融合序列,以便以融合蛋白的形式表达本发明的核酸分子。信号片段的例子包括能够指导本发明多肽分泌的任何信号片段。优选的信号片段包括但不限于组织纤维蛋白溶酶原激活物(t-PA)、干扰素、白介素、生长激素、病毒被膜糖蛋白信号片段、Nicotiananectarin信号肽(US5,939,288)、烟草伸展蛋白信号、大豆油质蛋白油体结合蛋白信号、拟南芥液泡碱性几丁质酶信号肽,以及本发明多肽的天然信号序列。此外,本发明核酸分子可连接到指导所编码的多肽到蛋白体(proteosome)的融合片段上,如泛素融合片段。重组分子也可包括本发明核酸序列周围和/或内部插入的和/或非翻译序列。宿主细胞本发明另外一个实施方式包括一种重组细胞,该重组细胞包括一种或一种以上本发明重组分子转化的宿主细胞,或其子代细胞。可通过任何能够将多核苷酸分子插入细胞中的方法将多核苷酸分子转化进入细胞。转化技术包括但不限于转染、电穿孔、显微注射、脂质转染、吸附和原生质融合。重组细胞可保持为单细胞或长成组织、器官或多细胞生物体。转化的本发明多核苷酸分子可保持在染色体外,也可以保留表达能力的方式整合到被转化(即重组)细胞染色体上的一个或一个以上的位点。适当的将要进行转化的宿主细胞包括任何能用本发明多核苷酸转化的细胞。本发明宿主细胞可为能够产生本发明多肽的内源的(即天然的)细胞,也可为通过至少一种本发明多核苷酸分子转化后能够产生所述的多肽的细胞。本发明的宿主细胞可为任何能够产生至少一种本发明蛋白质的细胞,包括细菌、真菌(包括酵母)、寄生虫、节肢动物、动物和植物细胞。宿主细胞的例子包括沙门氏菌、埃希菌属、杆菌、李斯特菌属、酵母、夜蛾(Spodoptera)、分枝杆菌、Trichoplusia、BHK(幼仓鼠肾)细胞、MDCK细胞、CRFK细胞、CV-1胞、COS(例如COS-7)细胞和Vero细胞。更多的宿主细胞例子如大肠杆菌,包括大肠杆菌K-12衍生物;伤寒沙门氏菌;鼠伤寒沙门氏菌,包括减毒菌株;贪食夜蛾;粉纹夜蛾;以及非致瘤性小鼠生肌G8细胞(例如ATCCCRL1246)。其他适当的哺乳动物宿主细胞包括其他肾细胞系、其他成纤维细胞系(如人、鼠、鸡胚成纤维细胞系)骨髓瘤细胞系、中国仓鼠卵巢细胞、小鼠NIH/3T3细胞、LMTK细胞和/或HeLa细胞。t寺另'J优选的宿主细胞是可从DeutscheSammlungvonMikroorganismenundZellkulturenGmbH(德国微生物和细胞培养物收藏所)等处获得的植物细胞。重组DNA技术可用来改善转化的多核苷酸分子的表达,通过操作如宿主细胞内多核苷酸分子的拷贝数,多核苷酸分子转录的效率、产生的转录本翻译的效率,以及翻译后修饰的效率等。可用于提高本发明多核苷酸分子表达的重组技术包括但不限于多核苷酸分子可操作的连接到高拷贝数的质粒、多核苷酸分子整合到一个或一个以上的宿主细胞染色体中、向质粒中加入载体稳定性序列、替换或修饰转录控制信号(如启动子、操纵子、增强子)、替换或修饰翻译控制信号(如核糖体结合位点,Shine-Dalgarno序列)、修饰本发明多核苷酸分子以符合宿主细胞使用的密码子,以及删除使转录本不稳定的序列。转基因植物术语"植物"是指整株植物、植物器官(如叶、茎、根等)、种子、植物细胞等等。本发明使用的植物包括单子叶植物和双子叶植物。目标植物包括但不限于下列植物谷类(小麦、大麦、黑麦、燕麦、稻、高粱和相关作物);甜菜属(甜菜和饲用甜菜);梨果、核果和软果(苹果、梨、李子、桃、扁桃、樱桃、草莓、覆盆子和黑莓);豆科植物(豆类、扁豆、豌豆、大豆);油类植物(油菜、芥菜、罂粟、橄榄、向R葵、椰子、蓖麻油类植物、可可豆、落花生);黄瓜植物(marrows、黄瓜、瓜类);纤维植物(棉花、亚麻、大麻、黄麻);柑橘类水果(橙、柠檬、葡萄柚、蜜桔);蔬菜(菠菜、莴苣、芦笋、巻心菜、胡萝卜、洋葱、番茄、马铃薯、红辣椒);樟科(酪梨、肉桂、樟脑);或如玉米、烟草、坚果、咖啡、甘蔗、茶、藤、蛇麻花、草、香蕉和天然橡胶之类的植物,以及观赏植物(花、灌木、阔叶树和常绿植物如松柏类植物)。本发明文中限定的转基因植物包括植物(即所述植物的部分和细胞)及其子代,其子代通过使用重组技术进行基因修饰,以在所需的植物或植物器官中产生至少一种本发明的多肽。转基因植物可通过本领域已知的技术产生,如A.Slater等人在PlantBiotechnology-TheGeneticManipulationofPlants(植物生物技术-植物基因操作),(OxfordUniversityPress(2003)),以及P.Christou和H.Klee在HandbookofPlantBiotechnology(植物生物技术手册),JohnWileyandSons(2004))中广泛描述的。本发明多核苷酸可在转基因植物所有发育阶段组成型表达。根据所用植物或植物器官,所述的多肽可通过阶段特异性的方式表达。此外,所述的多核苷酸可组织特异性的表达。己知的或发现能够使编码感兴趣多肽的基因在植物中表达的调节序列可用于本发明。对所用调节序列的选择取决于感兴趣的目标植物和/或植物器官。所述的调节序列可取自植物或植物病毒,或可通过化学合成。所述的调节序列是本领域技术人员熟知的。组成型植物启动子是人们熟知的。除上述提到的启动子外,一些其他适当的启动子包括但不限于胭脂碱合酶启动子、章鱼碱合酶启动子、CaMV35S启动子、核酮糖-1,5二磷酸羧化酶启动子、Adhl-basedpEmu、Actl、SAM合酶启动子、Ubi启动子以及叶绿素a/b结合蛋白启动子。另外可能需要转基因以一种受调节的方式表达。通过将丝蛋白的编码序列置于组织特异性、发育特异性或可诱导启动子的控制下,对多肽调节表达是可能的。已经有一些植物中组织特异性的调节基因和/或启动子的报道。其包括编码种子贮藏蛋白(如napin、cruciferin、P-conglycinin、大豆球蛋白和菜豆球蛋白)、玉米醇溶蛋白或油体蛋白(如油质蛋白)、或涉及脂肪酸生物合成的基因(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad2-l))和其他胚胎发育过程中表达的基因(如Bce4)。对种子特异性表达特别有用的为豌豆球蛋白启动子。其他用于成熟叶中表达的启动子是那些开启衰老起始的启动子,如拟南芥中SAG启动子)。US4,943,674讨论了一类在开花期或在开花期经过果实发育,至少到开始成熟的过程中果实特异性表达的启动子。其他组织特异性启动子的例子包括在块茎中(如patatin基因启动子)和纤维细胞中(一个受发育调节的纤维细胞蛋白的例子是E6纤维)指导表达的启动子。其他调节序列如终止子序列和多腺苷酸化信号包括任何在植物中发挥该功能的序列,其选择对于本领域技术人员是显而易见的。由于终止区似乎是相对可相互替换的,因而主要根据方便选择表达盒中使用的终止区。所用的终止区可能是与转录起始区天然配套的、可能是与感兴趣的多核苷酸序列天然配套的或者是来自于其他来源的。终止区可以是天然存在的,也可以是完全或部分合成的。方便的终止区可从农杆菌(A.tumefaciens)Ti质粒中获得,如章鱼碱合酶和胭脂碱合酶终止区,或从e菜豆球蛋白基因、化学诱导的lant基因pIN中获得。一些技术可用于将包括编码感兴趣的多肽的核酸序列的表达构建物引入目标植物中。该技术包括但不限于用钙/聚乙二醇方法转化原生质体、电穿孔和显微注射或(包被的)粒子轰击。除了这些称为直接DNA转化法之外,涉及载体的转化系统是广泛可得的,如病毒和细菌载体(例如来自于农杆菌属)。在选择和/或筛选后,被转化的原生质体、细胞或植物部分可通过本领域已知的方法再生成整株植物。转化和/或再生技术的选择对本发明来说并不严谨。为证实转基因存在与转基因细胞和植物中,可通过本领域技术人员已知的方法进行聚合酶链反应(PCR)扩增或Southern印迹分析。可用诸多可用方法中的任何一种检测转基因的表达产物,取决于产物的性质,包括Western印迹和酶鉴定。一种定量蛋白表达及检测不同植物组织中复制的特别有用的方法是应用报告基因,如GUS。获得转基因植物后,可对其进行栽培以产生具有所需表型的植物组织或植物部分。可收割该植物组织或植物部分,和/或采集种子。该种子可作为栽培具有所需性状组织或部分的植物的来源。非人类转基因动物产生转基因动物的方法是本领域所熟知的。对这一主题有用的全面的教科书是Houdebine的Transgenicanimals-GenerationandUse(转基因云力物-产生禾口用途)(HarwoodAcademic,1997)。异源DNA可引入如哺乳动物受精卵中。例如,全能或多能干细胞可通过显微注射、磷酸钙沉淀、脂质体融合、逆转录病毒感染或其他方法转化,转化的细胞引入胚胎中,胚胎发育成转基因动物。在高度优选的方法中,用含有所需DNA的逆转录病毒感染发育的胚胎,然后感染的胚胎产生转基因动物。然而,在最优选的方法中,适当的DNA共注射到胚胎的前核或胞质中,优选地在单细胞期,该胚胎发育成成熟的转基因动物。用来产生转基因动物的另外一种方法涉及使用标准方法将核酸显微注射到前核期卵中,然后在移植到假孕受者的输卵管中之前培养注射的卵。转基因动物也可通过核移植技术产生。在该方法中,使用包括在调节序列控制下的感兴趣的结合结构域或结合配偶体(bindingpartner)的编码序列的质粒稳定地转染供者动物的成纤维细胞。然后将稳定的转染子与去核的卵母细胞融合,培养并移植到雌性受者中。丝的回收方法和生产本发明的丝蛋白可从重组细胞,如植物、细菌或酵母细胞中提取和纯化,通过多种方法生产所述的蛋白。在一个实施方式中,该方法涉及通过降低pH和加热,然后采用硫酸铵分级分离从同质化(homogenized)的细胞/组织/植物等中去除天然的细胞蛋白。简单的说,通过同质化细胞/组织/植物提取总可溶性蛋白。通过pH4.7沉淀然后6(TC处理去除天然蛋白。产生的上清液用40%饱和度的硫酸铵分级分离。产生的蛋白质将具有95%级的纯度。可通过常规的胶或亲和层析获得进一歩的纯化。在另外一个例子中,使用高浓度的酸,如HCl或丙酸降低pH到l-2—小时或一小时以上处理细胞裂解物,该处理将使丝蛋白溶解但使其他蛋白沉淀。当蛋白浓度超过关键值时,本发明丝蛋白通过自发的自组装从溶液中形成纤维状聚集物。可按照O'Brien等人的方法收集该聚集物并将其机械纺织成肉眼可见的纤维(I.O'Brien等人"Design,SynthesisandFabricationofNovelSelf-AssemblingFibrillarProteins(新的自组装纤维状蛋白质的设计、合成和组装)",SilkPolymers:MaterialsScienceandBiotechnology,pp.104-117,Kaplan,Adams,Farmer禾口Viney,eds.,c.1994,AmericanChemicalSociety,Washington,D.C)。根据巻曲螺旋二级结构的固有性质,诸如Xeriospiral-4、BBF1-4、BAF1-4和GAFl-4在脱水时会自发形成巻曲螺旋的二级结构。如下所述,可通过对临近31赖氨酸进行酶或化学交联增强巻曲螺旋的强度。本发明的丝纤维和/或共聚物对加工处理的要求不高。本发明的丝蛋白要求最小的加工处理,例如纺织形成强纤维,因为它们自发形成强的巻曲螺旋,并可通过如赖氨酸交联等交联而进一歩增强。这与家蚕和蜘蛛的重组丝多肽形成对比,后者需要复杂的纺织技术以获得二级结构(e-片层)和纤维的强度。然而,纤维可从具有液晶相特征属性的溶液中抽出。能够产生相变的纤维浓度取决于溶液中一种蛋白质的组成或几种蛋白质的组合。相变可通过监测溶液的透明度和双折射来进行检测。当溶液具有半透明的表现并且通过交叉的偏振滤光片观察时记录有双折射时,可检测到液晶相的起始。在一种形成纤维的技术中,纤维可首先通过一个孔口(orifice)从蛋白溶液中拉出并进入甲醇中,直到产生足够使用机械装置拾起的长度。然后通过该机械装置拉出纤维通过甲醇溶液,收集并干燥。拉拔纤维的方法被认为是本领域熟知的。US2004/0170827和US2005/0054830描述了更多可用来生产本发明丝纤维和/或共聚物的方法的例子。在一个优选的实施方式中,本发明丝纤维和/或共聚物是交联的。在一个实施方式中,所述的丝纤维和/或共聚物通过本领域己知的方法交联到感兴趣的表面/物品/产品等上。在另一个实施方式中(或与前面的实施方式结合),丝纤维和/或共聚物中至少一些丝蛋白相互交联。优选地,丝蛋白通过蛋白质中的赖氨酸残基交联。该交联可通过本领域已知的化学和/或酶技术进行。例如酶交联可被赖氨酸氧化酶催化,而非酶交联可通过糖化的赖氨酸残基产生(Reiser等人,1992)。抗体本发明也提供本发明多肽或其片段的单克隆或多克隆抗体。因此,本发明进一步提供生产本发明多肽的单克隆或多克隆抗体的方法。术语"结合特异性"是指抗体结合至少一种本发明多肽而不是其他已知丝蛋白的能力。此处所用的术语"表位"是指被抗体结合的本发明多肽的区。表位可给予动物以产生抗该表位的抗体,然而,本发明的抗体优选地在整个多肽的环境中特异性的结合表位区。如果需要多克隆抗体,使用本发明的免疫原性多肽免疫选定的哺乳动物(小鼠、兔、山羊、马等)。根据已知的程序收集和处理免疫动物的血清。如果包括多克隆抗体的血清包括对其他抗原的抗体,该多克隆抗体可通过免疫亲和层析进行纯化。生产和处理多克隆抗血清的技术是本领域已知的。为制造所述的抗体,本发明也提供本发明多肽或其片段作为半抗原连接到另外的多肽用作动物中的免疫原。本领域技术人员也可以容易地生产抗本发明多肽的单克隆抗体。通过杂交瘤制作单克隆抗体的一般方法是人们熟知的。产生永生抗体的细胞系可通过细胞融合产生,也可通过其他技术如致癌DNA转化B淋巴细胞,或EB病毒(Epstein-Barrvirus)转染。可根据不同的特性筛选单克隆抗体组;即同种型和表位亲和力。另外一种技术涉及筛选噬菌体展示库,其中,例如噬菌体在其被膜上表达带有大量多种互补决定区(CDRs)的scFV片段。该技术是本领域熟知的。为本发明的目的,术语"抗体",除非有相反的说明,包括保留了对目标抗原结合活性的完整抗体片段。所述的片段包括Fv、F(ab')和F(ab')2片段,以及单链抗体(scFv)。此外,抗体及其片段可为人源化抗体,例如EP-A-239400中描述的。本发明的抗体可结合到固相支持物和/或同适当的试剂、对照、说明书之类的一起装入适当的容器包装到试剂盒中。优选地,本发明的抗体带有可检测的标记。代表性的允许直接检测抗体结合的可检测标记包括放射性标记、荧光团、染料、磁珠、化学发光基团、胶体颗粒等等。允许直接测量结合的标记的例子包括底物提供有色或荧光产物的酶。另外的代表性可检测的标记包括加入适当底物后能提供可检测产物信号的共价结合的酶。用来结合的适当的酶的例子包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶等等。若商业上不可获得,所述的抗体-酶结合物可通过本领域技术人员己知的技术容易的生产。更多的代表性的可检测的标记包括对抗生物素蛋白或抗生物素蛋白链菌素有高亲和力的生物素;可与荧光激活细胞分类器一起使用的荧光色素(例如藻胆蛋白、藻红蛋白和别藻蓝蛋白;荧光素和德克萨斯红);及其类似物质。优选地,可检测标记允许在光度计盘中直接测量,例如生物素。所述的标记抗体可通过本领域已知的方法检测本发明的多肽。组合物本发明的组合物可包括"可接受的载体",该可接受的载体的例子包括水、盐水、任氏液、葡萄糖溶液、Hank's液,以及其他含水生理平衡盐溶液。也可使用非水性载体,如不挥发油、麻油、油酸乙酯或甘油三酯。在一个实施方式中,"可接受的载体"是"药学上可接受的载体"。术语药学上可接受的载体是指给予动物,特别是哺乳动物,更特别的是人的时候不产生过敏,毒性或不良反应的分子实体或组合物。有用的药学上可接受的载体或稀释剂的例子包括但不限于不影响本发明多肽活性的溶剂、分散剂、包衣、稳定剂、保护性胶体、粘合剂、增稠剂、摇溶剂、渗透剂、掩蔽剂和等渗和缓释剂。可通过,例如使用包衣,如卵磷脂,在分散时维持所需的粒子大小以及使用表面活性剂来维持适当的流动性。更普遍地,本发明多肽可通过相应的通常使用的配制技术和任何无毒的固体或液体添加剂联合使用。如此处概括的,在一些实施方式中,本发明的多肽、丝纤维和/或共聚物用作药学上可接受的载体。下面描述了本发明多肽具体用途的其他适当组合物,具有具体的参考资料。用途由于其特别的韧性和强度,丝蛋白可用于创造新的生物材料。然而,至今为止蜘蛛和昆虫的纤维状蛋白质是大蛋白(大于lOOKDa),并由高度重复的氨基酸序列组成。这些蛋白质由包括高度偏爱性的密码子的大基因编码,使他们特别难以在重组系统中生产。相比之下,本发明的丝蛋白是短的和非重复的。这些特性使得编码这些蛋白的基因对于通过重组生产新的生物材料特别有吸引力。本发明的丝蛋白、丝纤维和/或共聚物在医学、军事、工业和商业应用等广泛和多种领域中可以应用。纤维可用于制造医学用具如缝合、植皮、细胞生长基质、置换韧带、外科修补网状织物,以及用于工业和商业产品的广泛领域,如线缆、绳、网、鱼线、衣服织物、防弹背心、容器织物、背包、背囊、袋或钱包带、粘性结合材料、非粘性结合材料、带材料、帐篷织物、帆布、库覆盖物、车辆覆盖物、围墙材料、封闭剂、建筑材料、耐风雨材料、韧性隔离材料、运动器材;以及事实上可用于任何需要高拉伸强度和弹性特性的纤维和织物中。本发明的丝蛋白、丝纤维和/或共聚物也可用于个人护理产品组合物中,如化妆品、皮肤养护、护发和染发中;以及粒子的涂层,如色料。丝蛋白可用其天然形式或修饰成具有更有益效果的衍生物。例如,丝蛋白可通过结合反应修饰成聚合物以降低变异原型,如US5,981,718禾nUS5,856,451所述。适当的修饰聚合物包括但不限于聚烯化氧化物(polyalkyleneoxides)、聚乙烯醇(polyvinylalcohol)、聚羧酸盐(poly-carboxylates)、聚乙烯吡咯烷(poly(vinylpyrolidone))、和葡聚糖(dextrans)。在另外的例子中,丝蛋白的修饰可通过选择性消化和剪切其他蛋白修饰物。例如,丝蛋白可通过提高温度约6CTC酸处理切成更小的肽单位。有用的酸包括但不限于稀盐酸、含硫和含磷酸。另外,丝蛋白的消化可通过碱处理完成,如氢氧化钠,或可使用适当的蛋白酶进行酶消化。所述的蛋白质可通过进一步修饰以提供在个人护理产品中具有有益的特别用途的性能特性。对用于个人护理产品的蛋白修饰是本领域所熟知的。例如,常用的方法在US6,303,752、US6,284,246和US6,358,501中有描述。修饰的例子包括但不限于乙氧基化以促进水乳化的增强、硅氧基化(siloxylation)以提供亲脂相容性、酯化以协助肥皂和洗涤剂组合物相容性。另外,丝蛋白可通过功能集团产生衍生物,功能基团包括但不限于胺、环氧乙烷、氰酸盐、羧酸酯、硅酮多羟基化合物(siliconecopolyols)、硅氧烷酯、季铵化脂肪胺、氨基甲酸乙酯、聚丙烯酰胺、二羧酸酯和卤代酯。丝蛋白也可通过和二亚胺酯反应和形成金属盐产生衍生物。与上述对"多肽"(及"蛋白质")的定义一致,所述的衍生物和/或修饰分子此处也概括的称之为"多肽"和"蛋白质"。本发明丝蛋白可与其他类型纤维纺在一起和/或成束或编织。其例子包括但不限于聚合纤维(如聚丙烯、尼龙、聚酯)、其他植物和动物来源的纤维或丝(如棉、毛、家蚕或蜘蛛丝)和玻璃纤维。优选的实施方式是丝纤维和10%的聚丙烯纤维编织。本发明包括可容易的用来增强任何想要特性的纤维组合的产物,例如外观、柔软性、重量、耐久性、抗水性、改善制造成本,这些可能是在制造和生产医学、工业或商业应用纤维过程中所一般寻求的性质。个人护理产品化妆品和皮肤养护组合物可为无水组合物,包括在化妆用介质中有效量的丝蛋白。这些组合物的用途包括但不限于皮肤养护、皮肤清洁、化妆和抗皱纹产品。化妆品和皮肤养护组合物中有效量的丝蛋白此处定义为约10—4到约30%的重量比例,但优选的从约10—3到15%重量,相对于组合物的总重量。该比例可根据化妆品或皮肤养护组合物的类型成函数变化。US6,280,747中描述了化妆用介质的适当组合物。例如,化妆用介质可包括一般从相对于组合物总重约10到约90%重量比例的脂质,其中脂相包括至少一种液体、固体或半固体脂质。脂质包括但不限于油、蜡、树胶和所谓的糊状脂质。另外,组合物可为稳定分散的形式,如作为油包水或水包油乳状液。此外,该组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂,包括但不限于抗氧化剂、保藏剂、赋形剂、表面活性剂、UVA和/或UVB遮光剂、芳香剂、增稠剂、湿润剂和阴离子、非离子或两性聚合物,以及染料或色素。包括至少一种本发明丝蛋白的使用乳化材料的可生产的乳化化妆品和准药物包括,例如,清洁化妆品(美容香皂、洁面、香波、淋洗等)、护发产品(染发剂、美发剂之类)、基本化妆品(一般乳膏、乳液、剃毛膏、调节剂、科隆香水、修面液、美容油、面膜等等)、化妆美容用品(底、画眉笔、眼膏、眼影、修眉液等等)、芳香化妆品(香水之类)、晒黑和防晒化妆品(晒黑和防晒霜、晒黑和防晒露、晒黑和防晒油等)、指甲化妆品(指甲油之类)、眼线化妆品(眼线膏之类)、唇化妆品(唇膏、唇霜之类)、口腔护理用品(牙刷之类)、洗浴用品(洗浴产品之类)等等。化妆品组合物也可以指甲护理产品的形式,如指甲油。此处指甲油定义为处理和染色指甲的组合物,包括化妆用介质中有效量的丝蛋白。指甲油组合物中有效量的丝蛋白此处定义为相对于油总重约l(T4到约30。/。的重量比例。US6,280,747描述了指甲油化妆用介质的组成。指甲油典型的包括溶剂和膜形成物质,如纤维素衍生物、聚乙烯衍生物、丙烯酸脂聚合物或共聚物、乙烯共聚物或聚酯聚合物。该组合物也可包括有机或无机色素。护发组合物此处定义为处理头发的组合物,包括但不限于香波、调节剂、洗液、气雾剂、凝胶剂和奶油冻剂,其中在化妆用介质中包括有效量的丝蛋白。护发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约10-2到约90%的重量比例。US2004/0170590、US6,280,747、US6,139,851和US6,013,250中描述了护发组合物中化妆用介质的组成。例如护法组合物可为水、醇或水醇溶液,对于水醇溶液,醇优选地为乙醇或异丙醇,相对于总重约1-约75%的重量比例。此外,护发组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂,如上所述。染发组合物此处定义为着色、染色、脱色的组合物,包括在化妆用介质中有效量的丝蛋白。染发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约l(T4到约60%的重量比例。US2004/0170590、US6,398,821和US6,129,770中描述了染发组合物中化妆用介质的组成。例如,染发组合物一般包括无机过氧化染料氧化剂和可氧化着色剂。过氧化染料氧化剂最通常的是过氧化氢。氧化染发剂通过氧化偶联初级中间物(例如对苯二胺、对氨基苯酚、对二氨基嘧啶、羟基口引哚、吲哚胺、胸腺嘧啶胺或青色苯酚(cyanophenols)与次级中间物(例如苯酚、间苯二酚、m-氮基苯酚、m-苯二胺、萘酚、吡哇酮、羟基B引哚、儿茶酚或吡唑)而形成。另外,染发组合物可包括氧化酸、多价螯合剂、稳定剂、增稠剂、缓冲载体、表面活性剂、溶剂、抗氧化剂、聚合物、非氧化染料和调节剂。丝蛋白也可用来包被色素和化妆品颗粒,以改善该颗粒的分散性,用于化妆品和包被组合物。化妆品颗粒此处定义为化妆品组合物中应用的如色素或惰性粒子之类的粒状物质。适当的色素和化妆品颗粒包括但不限于无机有色色素、有机色素和惰性粒子。无机有色色素包括但不限于二氧化钛、氧化锌、以及铁、镁、钴、铝氧化物。有机有色色素包括但不限于D&C红No.36、D&C橙No.17、D&C红Nos.7,11,31和34钙色淀、D&C红No.12钡色淀、D&C红No.13锶色淀、FD&C黄No.5铝色淀和炭黑粒子。惰性粒子包括但不限于碳酸钙、硅酸铝、硅酸钙、硅酸镁、云母、滑石、硫酸钡、硫酸钙、粉末尼龙(powderedNylon)、全氟化烃和其他惰性塑料。丝蛋白也可用于牙线(例如,见US2005/0161058)。该线可为单丝线或多丝线,纤维可以扭曲也可以不扭曲。牙线可包装成单个或包装成带有切割工具可切割成任意长度的巻。牙线可提供成除丝状之外的许多形状,例如但不限于贴或片之类。该线可包被不同的材料,例如但不限于蜡、牙线用聚四氟乙烯单纤丝。丝蛋白也可用于肥皂(如,见US2005/0130857)。色素和化妆品粒子包被用于色素和化妆品粒子包被有效量的丝蛋白此处定义为相对于干重粒子的约10—4到约50%,但优选地从约0.25到约15%的重量比例。所用的最优丝蛋白量取决于要包被色素或化妆品粒子的类型。例如无机有色色素的丝蛋白用量优选地在约0.01%到20%重量之间。对于有机色素,优选的丝蛋白量在约1%到约15%重量,而对于惰性粒子,优选的量在约0.25%到约3%重量。US5,643,672中描述了制备包被色素和粒子的方法。这些方法包括在搅拌混合的同时加入丝蛋白水溶液,形成丝蛋白和该粒子的浆并千燥,喷雾干燥丝蛋白溶液到粒子上或低压冻干丝蛋白和粒子浆。包被的色素和化妆品颗粒可用于化妆品组分、油漆、墨水之类。生物医学丝蛋白可用于包被绷带以促进伤口愈合。为此,绷带材料用有效量的丝蛋白包被。对于伤口愈合绷带的目的,有效量的丝蛋白此处定义为相对于绷带材料重量的约1(T4到约30%的重量比例。要包被的材料可为任何柔软的、生物惰性的、多孔的布或纤维。例子包括但不限于棉、丝、人造丝、醋酸盐、丙烯酸树脂、聚乙烯、聚酯及其组合。布或纤维的包被可通过许多本领域已知的方法完成。例如,被包被的材料浸入含有丝蛋白的水溶液中。另外,包括丝蛋白的溶液也可使用喷枪喷洒到要包被材料的表面上。此外,包括丝蛋白的溶液也可通过滚动包被印刷方法包被到表面上。伤口绷带可包括其他添加剂,包括但不限于消毒剂如碘、碘化钾、碘化聚烯吡酮、利凡诺、过氧化氢、苄垸铵氯化物、醋酸氯己啶;加速治愈剂如尿囊素、盐酸狄布卡因和苹果酸氯化苯胺;收縮血管剂如盐酸萘甲唑啉;收敛剂如氧化锌;和结痂剂如硼酸。本发明丝蛋白也能以薄膜的形式用作伤口敷料。US6,175,053描述了丝蛋白以无定形薄膜的形式用作伤口敷料。无定形薄膜包括结晶度低于10%的致密无孔且包括有效量丝蛋白的膜。对于创伤护理的膜,有效量丝蛋白此处定义为约1到99%重量比例。该膜也可包括其他成分包括但不限于其他蛋白如丝胶蛋白和消毒剂、加速治愈剂、收縮血管剂、收敛剂和结痂剂,如上面所述。其他蛋白如丝胶蛋白可包括1到99%组合物重量。所列其他物质的总量优选地低于约30%重量,更优选地在约0.5到20%组合物重量。伤口敷料薄膜可通过在水溶液中溶解上述材料,通过过滤或离心去除不溶物,将溶液浇铸到光滑固体表面如丙烯酸盘,然后干燥。本发明丝蛋白也可用于缝合(如,见US2005/0055051)。该缝合的特征是用超高分子量纤维和丝纤维做成编织套。聚乙烯提供强度。聚酯纤维和高分子量的聚乙烯编织在一起而提供了改良的拴系特性。该丝可用对比色以提供改良的缝合识别和鉴定痕迹。丝比其他纤维更能和组织的相适应,允许在靠近打结的地方剪掉末端而不必担心缝合末端和周围组织的有害相互作用。高强度缝合线的处理特性也可通过使用不同材料包被缝合线而得到增强。该缝合线有利具有Ethibond5号线的强度,而其直径、感觉和拴系能力和2号缝合线一样。因此,该缝合线对于大部分整形外科操作,如旋转套修复术、跟骨腱修复术、髌韧带修复术、ACL/PCL重建、肩臀重建操作,以及代替用于缝合锚中以及和缝合锚一起使用的缝合线来说是理想的。该缝合线可不包被,或用蜡(蜂蜡、石油蜡、聚乙烯蜡或其他)、硅酮(DowCorning硅酮流体202A或其他)、硅酮橡胶、PBA(聚丁酸)、乙基纤维素(Filodel)或其他包被物包被,以改善编织物的润滑性、结安全性或耐磨性等等。本发明丝蛋白也可用于支架(如,见US2004/0199241)。例如,支架移植物包括管腔内支架和移植物,其中支架移植物包括丝。该丝诱导接受支架移植物的宿主的应答,而该应答能使丝支架移植物与接近丝支架移植物的丝的组织之间的粘连增强。所述的丝可通过多种方法中的任何一种结合到移植物上,例如,通过将丝交织到移植物上或通过附着到移植物上(例如通过粘合剂或缝合的方法)。丝的形式可以为线、穗带、片层、粉末等等。对于丝在支架移植物上的位置,可仅附着到支架的表面,和/或附着到支架移植物的远端区,以协助远端区固定在宿主中的邻近组织。在本发明的背景中可使用多种支架移植物,取决于所需治疗的位置和性质。支架移植物可以是,例如分叉的或管状移植物、圆柱状或逐渐变细、可自展或球形展开的、单片或组件等等。除了丝以外,支架移植物可在一些或所有丝上进行包被,其中该包被在支架移植物插入宿主时降解,因此该包被延缓丝和宿主之间接触的时间。适当的包被包括而不限于明胶、可降解聚酯(例如PLGA、PLA、MePEG-PLGA、PLGA-PEG-PLGA及其共聚物和掺和物)、纤维素和纤维素衍生物(例如羟丙基纤维素)、多糖(例如透明质酸、葡聚糖、硫酸葡聚糖、壳聚糖)、脂质、脂肪酸、糖脂、核酸酯、聚酐、多正酯类和聚乙烯醇(PVA)。含丝的支架移植物可包括生物活性剂(药物),其中该制剂从支架移植物中释放而后诱导增强的细胞应答(例如,细胞或细胞外基质沉淀)和/或插入支架移植物宿主的纤维变性反应。本发明丝蛋白也可用于体外生产韧带和腱的基质中(例如,见US2005/0089552)。多能细胞,如骨髓基质细胞(BMSCs)种植在丝纤维基质中。生物工程韧带或腱的有利特点是在应用机械力方向上的细胞定向和/或基质巻曲模式,以及若施加了机械力,沿着该机械力或刺激所产生的机械负荷的轴上产生的韧带和腱特异性标记包括胶原i型、胶原m型和纤连蛋白。在一个优选实施方式中,所述的韧带或腱的特点是螺旋组织排列的纤维束。一些能够生产的韧带或腱的例子包括前十字韧带、后十字韧带、回旋肌腱群、肘和膝的内侧副韧带、手的屈肌腱、踝的外侧韧带以及颌和颞颌关节的腱和韧带。本发明可生产的其他组织包括软骨(关节和半月板都包括)、骨、肌肉、皮肤和血管。本发明丝蛋白也可用于水凝胶(例如,见US2005/0266992)。丝心蛋白水凝胶具有开孔结构特征,使它们可在细胞培养、伤口和烧伤敷料、软组织替代物、骨赋形剂中用作组织工程支架和底物,以及药学或生物学活性化合物的支持物。所述的丝蛋白也可用于皮肤病学组合物(例如,见US2005/0019297)。此外,本发明丝蛋白及其衍生物也可用于持续释放组合物(例如,见US2004/0005363)。纺织本发明丝蛋白也可用于纤维表面而后用于纺织中。这将在纤维上提供单层蛋白膜而产生光滑产品。US6,416,558和US5,232,611描述了加入抹光包被到纤维上。这些揭示中描述的方法提供了多种抹光纤维以提供良好感觉和光滑表面的例子。用于这种用途时,使用有效量丝蛋白包被纤维。为用于纺织中包被纤维的目的,有效量丝蛋白此处定义为相对于纤维材料重量的约1到约99%重量比例。纤维材料包括但不限于棉纺织纤维、聚酯如人造丝和LycraTM、尼龙、毛织物和其他天然纤维包括土丝。适合将丝蛋白用于纤维上的组合物可包括助溶剂如乙醇、异丙醇、己莉醇(hexafluoranols)、异硫代氰酸盐(isothiocyanouranates)和其他能够和水混合形成溶液或微乳化液的极性溶剂。包括丝蛋白的溶液可喷到纤维上或将纤维浸到溶液中。尽管不是必须的,包被材料优选地进行快速干燥。另一种方案是将丝蛋白组合物应用到编织纤维上。该应用理想的实施方式为将丝蛋白用于包被可伸展的编织物如用于长袜。复合材料丝纤维可加入到聚氨酯、其他树脂或热塑性填充物中制备面板和其他建筑材料或替代木材和颗粒板用模型器具和台阶顶(benchtop)。该复合材料也可用于建筑和汽车制造特别是屋顶和门板。丝纤维增强树脂使该材料更强且允许与其他颗粒板和组合材料相比相同或更高强度而重量轻的构造。丝纤维可分离并加入合成的形成复合材料的树脂中或与从植物中获得的蛋白质、淀粉和油联合使用以生产生物复合材料。JP2004284246、US2005175825、US4,515,737、JP47020312和WO2005/017004描述了生产这种材料的方法。纸添加物本发明的丝的纤维性质可增加造纸的强度和品质结构。通过棉浆中斑纹丝线制作的丝纸,以制备超平滑手工纸,可用于礼品包装、笔记本封面、纸袋中。JP2000139755中一般描述了生产包括本发明丝蛋白纸制品的方法。高级材料本发明的丝具有相当的韧性,并且变湿的时候在维持这些性质方面与其他丝不同(Hepburn等人,1979)。服装纺织工业的技术和智能纺织领域具有实质性的增长。对健康、高功能值、环境友好型和个人化的织品需求越来越多。如本发明所述的纤维在变湿的时候不改变其性质,特别是维持了它们的强度和伸展性,可用于运动休闲的功能性服装以及工作服和保护服装中。武器和监视技术的发展促进了个人防护设备和战场相关系统和结构的创新。除了可满足常规需要,如长时间暴露的耐用性、重型服装和对外部环境的保护之外,本发明丝织品可加工成抗发射物冲击、火和化学品的织品。WO2005/045122和US2005268443描述了生产上述材料的方法。实施例实施例l-晚末龄幼虫唾液腺cDNA的制备和分析在真针尾类和脉翅目昆虫(意大利蜂,〃z>ra)、授粉熊蜂。om6Mtore血、)、牛头犬虫义(Jl^T匿c/fl/or/cato)、黄猄虫义(Oeo/^〃as腿rag(i/ra)、玛草蛉(M"//^toWg"ato))丝中发现的蛋白通过将胰蛋白酶消化该丝,获得多肽的离子阱连续质谱(MS/MS)片段模式与从晚末龄幼虫唾液腺中分离的cDNA编码蛋白的预测质谱数据进行匹配来鉴定。为确定通过这种方法对蜜蜂进行分析时不39遗漏任何蛋白,肽质谱分析数据也和蜜蜂基因组计划预测的,以及Amd3蜜蜂基因组序列所有六个读码框翻译的意大利蜂U/^mW/^ra)蛋白质的虚拟胰蛋白酶消化产物相比较。蜜蜂意大利蜂幼虫从驯养蜂房中得到。以前研究表明意大利蜂丝的产生限制在末龄幼虫后半段时的唾液腺中(Silva-Zacarin等人,2003)。在此阶段,RNA在该腺的后端更丰富(Flower和Kenchington,1967)。从浸在磷酸盐缓冲盐水中晚五期蜜蜂幼虫中分离50个唾液腺的立方形细胞区。分离唾液腺的后端立即放入RNA/afer(Ambion,Austin,TX,USA)中以稳定mRNA,然后保存在4°C。使用Ambion(Austin,TX,USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唾液腺中分离总RNAG5pg)。使用Invitrogen(Calsbad,CA,USA)Micro-FastTrack2.0mRNA分离试剂盒按制造商说明从总RNA中分离信使RNA,分离的mRNA洗脱到10pi无RNAse水中。使用Invitrogen(Calsbad,CA,USA)CloneMinercDNA文库构建试剂盒用从蜜蜂幼虫中分离的mRNA构建cDNA文库,对标准方案进行下述修改第一条链合成,6pmol.nl"生物素-attB2-Oligo(dT)引物0.5pl及每种2mMdNTPs加入到%1mRNA中。65°C温育5min然后45。C2min,加入2^15x第一条链缓冲液,lpl0.1MDTT,以及0.5pl200U.^r1SuperscriptIIRT。对于第二条链合成,所有试剂的总体积减半,乙醇沉淀后,用5plDEPC处理水重悬浮cDNA。aatBl接头(lpl)在总体积10^1中连接,其中5plcDNA,2pl5x接头缓冲液,lpl0.1MDTT以及1^1T4DNA连接酶(lU41r1),在16。C连接48hrs,16小时候额外加入0.5plT4DNA连接酶(1U.W1)。按照制造商说明根据cDNA大小进行分选,对300-50(^1样品进行洗脱,乙醇沉淀,重悬浮并转化入大肠杆菌DH10BtmTl抗噬菌体细胞中,如推荐的那样。cDNA文库包括大约1,200,000集落形成单位(cfu),带有大约1%原载体。平均插入大小为1.3±1.4kbp。随机挑选82个集落,使用GenomeLabDTCSQuickstart试剂盒(BeckmanCoulter,FullertonCAUSA)在CEQ8000Biorad测序仪上测序。其聚类到54个组(表2)。编码丝蛋白的cDNA的鉴定如下所述。其他物种使用Ambion(Austin,TX,USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唇腺中从下述物种中分离总RNA:4熊蜂(授粉熊蜂,万0m6ra^reW&)(2吗RNA)、4牛头犬蚁(Mjrwec/a/w/cato)(3昭腦A)约100织工蚁(黄猄蚁,Oecop/^〃aswamgt/!'ra)(0.4吗RNA)和约50绿草蜻蛉(玛草蛉,7Vfa//WaWg"ato)。使用Invitrogen(Calsbad,CA,USA)Micro-FastTrack2.0mRNA分离试剂盒从总RNA中分离mRNA,溶入终体积10|al水中。使用Invitrogen(Calsbad,CA,USA)CloneMinercDNA试剂盒用从mRNA构建cDNA文库,对标准方案进行下述修改第一条链合成,3pmo1生物素-attB2-01igo(dT)引物及lnmol每种dNTPs加入到1(^1mRNA中。65。C温育5min然后45°C2min,加入2pl5x第一条链缓冲液,50nmolDTT,以及100USuperscriptIIRT。表2.蜜蜂末龄唾液腺cDNA以及SDS处理巢房丝胰蛋白酶消化肽的MS离子阱片段模式<table>tableseeoriginaldocumentpage41</column></row><table>对于第二条链合成,所有试剂的总体积根据制造商推荐量减半,乙醇沉淀后,用5|alDEPC处理水重悬浮cDNA。aatBl接头(1W)在总体积10|al中连接,其中5|ilcDNA,2pl5x接头缓冲液,50nmolDTT,以及1UT4DNA连接酶,在16。C连接12hrs。cDNA文库包括大约2.4x107(熊蜂),5.0,7(牛头犬蚁)和6000(绿蚂蚁)集落形成单位(cfu),带有对于牛头犬蚁和熊蜂文库低于1%以及在绿蚂蚁文库中大于80%原载体。文库中平均插入大小为1.3Kbp。序列数据从熊蜂和牛头犬蚁cDNA文库中多于100个随机克隆、蜜蜂82个克隆及草蜻蛉60个克隆中获得。从绿蚂蚁(大约lmm长)中获得唾液腺存在技术困难,降低了该物种文库的效率,因而仅检查了40条序列。表3提供了所鉴定的丝蛋白的总结。表3.真针尾类丝蛋白的鉴定和特性<table>tableseeoriginaldocumentpage42</column></row><table>*此处也分别称为Xenospiral-4和Xenosin,**PROFsec预测,***MARCOIL以90%阈值预测实施例2土丝的制备和蛋白分析去除幼虫后的蜜蜂巢房、去除幼虫后的熊蜂茧、去除幼虫后的的牛头犬蚁茧或织工蚁丝层在温水中广泛洗三次去除水溶性污染物,然后在用氯仿广泛洗三次除蜡。通过蒸馏水淋洗除氯仿,保留一团所述的丝用于分析。一团膜翅目昆虫(蚂蚁和蜜蜂)丝样品进一步在0.05%煮沸碳酸钠溶液中洗涤30分钟,这是蚕茧丝脱胶的标准程序,然后用蒸馏水淋洗。草蜻蛉丝仅用蒸镏水淋洗。一团草蜻蛉丝样品通过在0.05%碳酸钠溶液煮沸30分钟脱胶。一团蜜蜂材料在2%SDS9^C浸湿过夜,然后用蒸馏水淋洗三次。热SDS溶液提取溶解了大部分蛋白,但丝层保持了其构象。清洁的丝通过液相层析,然后通过串联质谱(LCMS)分析,如下所述。清洁的丝团放在Millipore'zipplate'96孔微滴定板的孔中,该板的每个孔包括通过该孔底部的C18反相层析介质栓塞,并在其中加入20pl25mM含有160ng测序级纯胰蛋白酶(Promega)的碳酸氢铵溶液。然后该板在3(TC增湿塑料袋中温育过夜。通过在每个孔的边上吸入乙腈(lOpl)润湿C18材料,在37"保温该板15分钟。每孔中加入甲酸溶液(130^1,l%v/v),30分钟后,通过逐渐降低真空从板底缓慢抽吸每个孔的溶液收获C18材料上的消化蜜蜂蛋白的肽。通过抽吸lOOpl甲酸溶液两次洗涤C18材料。通过直接加入C18材料中6pl1%甲酸加入70%甲醇后立即离心,将肽通过C18栓塞洗脱到下面的微滴定板中。该板置入真空中,直到通过蒸发每孔中的体积降低约2倍。每孔中加入甲酸溶液(10^U),并将该板转移到Agilent1100毛细管液相层析系统的孔板取样器中。丝提取物中的肽(8u1)结合到AgilentZorbaxSB-C185fim150x0.5mm柱中,以0.1%甲酸/5%乙腈2(^1.1^11-|1分钟然后用逐渐增加乙腈浓度到0.1%甲酸/20%乙腈的梯度5pl.min—^先脱超过1分钟,然后到0.1%甲酸/50%乙腈超过28分钟,然后到0.1%甲酸/95%乙腈超过1分钟。该柱子通过0.1%甲酸/95%-100%乙腈以20pl.min—1洗超过5分钟,并下一孔样品肽上样前以0.1%甲酸/5%乙腈重平衡7分钟。柱中的洗脱物通过仪器的电喷雾离子源微喷雾器引.入AgilentXCT离子阱质谱仪中。简单的说,当肽从柱中洗脱时,离子阱收集全谱阳性离子扫描(100-2200m/z),然后两次MS/MS扫描在全谱扫描中观察到的离子,避免选择带有单电荷的离子。当选定进行MS/MS分析的离子后,所有其他离子都从离子阱排除,选定的离子根据仪器推荐的"SmartFrag"和"PeptideScan"设置片段化。一旦收集到任何特定m/z值的两个片段谱,其在另外30秒被排除在选定的分析外,以避免收集冗余数据。整个实验的质谱数据组使用Agilent'sSpectrumMill软件分析,与从cDNA文库中预测的蛋白序列数据匹配。软件产生实验观察到的肽片段质量组与根据提供的数据库中蛋白序列可能产生的预测片段之间每个匹配质量的得分值。此处报告所有序列匹配的得分大于20,这是自动有把握接受有效匹配的缺省设置。本分析鉴定出五种唇腺中高水平表达的蛋白质与来源于每个蜜蜂种同源的丝匹配(如表2和表3所示),以及四种唇腺中到水平表达的蛋白质与来源于每个蚂蚁种同源的丝匹配(如表3所示)。幼虫唇腺中编码这些蛋白的信使RNA丰度与所产生蛋白的丰度一致(信使的丰度如表3所示)。为保证通过这种鉴定方法没有遗漏任何蜜蜂丝蛋白,我们也将蜜蜂丝胰蛋白酶肽质谱数据与一组公众可获得的蜜蜂基因组计划预测的蛋白序列相比较,其通过计算机算法为努力识别蜜蜂全部基因组DNA序列中可转录的基因而产生。此外,我们根据蜜蜂基因组计划提供的每个连续的基因组DNA序列的六个可能的读码框产生翻译数据库(Amel3公布)。这些翻译的DNA序列呈现到SpectrumMill软件,如同它们是非常大的蛋白质序列一样。匹配MS/MS肽数据鉴定出编码部分分离的蜜蜂蛋白质的基因组序列内的开放读码框,而不必首先预测基因的组织。通过这种方法没有鉴定出丝中另外的蛋白。实施例3-土丝的结构分析土丝样品如实施例2描述的进行制备。丝样品通过带有PikeMiracle钻石衰减全反射附件的BrukerTensor37傅立叶变换红外光谱仪检查。对蜜蜂、熊蜂、绿蚂蚁、牛头犬蚁和草蜻蛉幼虫丝(图1)的酰胺I区、n区光谱分析表明所有这些丝都有主要的a螺旋二级结构。真针尾类的丝具有在FT-IR光谱1645-1646cm—1处的优势峰,比经典的a螺旋信号向下移动大约lOcm"并加宽。这种a螺旋信号的移动是典型的巻曲螺旋蛋白(Heimburg等人,1999)。脱胶样品的光谱没有发生变化。实施例4-土丝的氨基酸组成与鉴定的丝蛋白十分相似土丝的氨基酸组成通过使用AustralianProteomeAnalysisFacilityLtd(MacquarieUniversity,Sydney)的WatersAccQTag化学ll(TC气相水解24小时后确定。测得的SDS洗涤丝的氨基酸组成与鉴定的丝蛋白序列预测的相似(图2和3)。实施例5-丝蛋白结构分析预测的分泌肽一.如对丝蛋白预期的一样,使用两个模型鉴定信号肽的SignalP3.0信号预测程序(Bendtsen等人,2004)预测所有鉴定的编码蛋白的丝基因包括将它们从细胞中定向分泌的信号肽(数据未示)。该多肽预测的切割位点如下Xenospiral(AmelFl)-在pos19和20(ASA-GL)之间,Xenospira2(AmelF2)-在pos19禾tl20(AEG-RV)之间,Xenospira3(AmelF3)-在pos19禾卩20(VHA-GV)之间,Xenospim4(AmelF4)-在pos19禾口20(ASG-AR)之间,Xenosin(AmelSAl)-在pos19和20(VCA-GV)之间,BBF1-在pos19和20(ASA-GQ)之间,BBF2-在pos20禾Q21(AEG-HV)之间,BBF3-在pos19禾tl20(VHA-GS)之间,BBF4-在pos19和20(ASA-GK)之间,BAF1-在pos19和20(ASA-SG)之间,BAF2-在pos19禾B20(ASG-RV)之间,BAF3-在pos19和20(ASG-NL)之间,BAF4-在pos19和20(VGA-SE)之间,GAF1-在pos19和20(ADA-SK)之间,GAF2-在pos19和20(ASG-GV)之间,GAF3-在pos19和20(ASG-GV)之间,GAF4-在pos19和20(VGA-SE)之间,MalFl-在pos26和27(SST-AV)之间。蚂蚁所有的四种和蜜蜂五种丝蛋白中的四种丝蛋白是螺旋的并具有巻曲螺旋结构。蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成巻曲螺旋的螺旋蛋白。PROFsec(Rost禾卩Sander,1993)和NNPredict(McClelland和Rumelhart,1988;Kndler等人,1990)算法被用于研究鉴定的丝基因的二级结构。这些算法鉴定出Xenospiral[GB12184陽PA](SEQIDNO:l)、Xenospira2[GB12348-PA](SEQIDIDNO:7)是高度螺旋蛋白,具有76-85%之间的螺旋结构(表4)。Xenosin[GB15233-PA](SEQIDNO:10)具有显著少的螺旋结构。表4.PROFsec(Rost和Sander,1993)预测的意大利蜂丝蛋白二级结构显示螺旋、延伸片层和环的百分数蛋白质螺旋伸展片层环PROFsecNNPredictPROFsecNNPredictPROTsecNNPredictXenospira37770362027Xenospira48582261416Xenospiral8073141926Xenospira27769252129Xenosin4141895150更多的蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成巻曲螺旋的螺旋蛋白。PredictProtein(Rost等人,2004)算法被用来研究鉴定丝基因的二级结构。这些算法鉴定出Xenospiral(SEQIDNO:l)、Xenospira2(SEQIDNO:3)、Xenospira3(SEQIDNO:5)、Xenospira4(SEQIDNO:7)、BBFl(SEQIDNO:22)、BBF2(SEQIDNO:24)、BBF3(SEQIDNO:26)、BBF4(SEQIDNO:28)、BAFl(SEQIDNO:40)、BAF2(SEQIDNO:42)、BAF3(SEQIDNO:44)、BAF4(SEQIDNO:46)、GAF1(SEQIDNO:56)、GAF2(SEQIDNO:58)、GAF3(SEQIDNO:60)、GAF4(SEQIDNO:62)和MalFl(SEQIDNO:72)是高度螺旋蛋白,具有69-88%之间的螺旋结构(表3)。AmelSAl[GB15233-PA](Xenosin)(SEQIDNO:10)和BBSA1(SEQIDNO:30)具有显著少的螺旋结构。螺旋蛋白的超螺旋(巻曲螺旋)来自于一般记为k^fe/g入的特征性七肽重复序列,"和d位残基一般为疏水残基,剩余位置一般为带电或极性残基。模式识别程序(MARCOIL(Delorenzi和Speed,2002)、COILS(Lupas等人,199l))在Xenospiral[GB12184-PA](SEQIDNO:l)、Xenospira2[GB12348-PA](SEQIDNO:3)、Xenospira3[GB17818-PA](SEQIDNO:5)和Xenospira4[GB19585-PA](SEQIDNO:7)(MARCOIL:表5,COILS:图4),以及BBF1(SEQIDNO:22)、BBF2(SEQIDNO:24)、BBF3(SEQIDNO:26)、BBF4(SEQIDNO:28)、BAFl(SEQIDNO:40)、BAF2(SEQIDNO:42)、BAF3(SEQIDNO:44)、BAF4(SEQIDNO:46)、GAF1(SEQIDNO:56)、GAF2(SEQIDNO:58)、GAF3(SEQIDNO:60)、GAF4(SEQIDNO:62)和MalFl(SEQIDNO:72)(MARCOIL:表3)中鉴定出无数的巻曲螺旋典型的七肽重复。蜜蜂丝蛋白中一种新的巻曲螺旋序列的鉴定在Xenospiral[GB12184-PA]、Xenospira2[GB12348-PA]、Xenospira3[GB17818-PA]、Xenospria4[GB19585-PA]序列中鉴定出的七肽氨基酸残基重复每个都高度指示一种巻曲螺旋二级结构(图5)(置信水平见表5)。发现的七肽数目众多并且连续暗示该蛋白采取一种非常规则的结构。在两种蜜蜂蛋白中鉴定出了重叠的多肽Xenospiral的主要巻曲螺旋区包括有3个残基偏移的重叠七肽,接着有5个残基的空隙,然后是4个连续的七肽;Xenospira2整个巻曲螺旋区有多个重叠七肽,有一个单个偏移和4个残基偏移(相当于3个残基偏移)。主要七肽不同位置的氨基酸组成显示在表6的第一栏,重叠七肽的位置显示在邻近的栏里。表5.MARCOIL(Delorenzi和Speed,2002)模式识别算法预测的鉴定丝蛋白中以巻曲螺旋存在的残基百分数。<table>tableseeoriginaldocumentpage46</column></row><table>令人惊奇的是当集中起来看时主要七肽具有新颖的组成——在"疏水"七肽位a和c/具有非同寻常高含量的丙氨酸(见表6和图5)。另外,很大比例的七肽在同一个七肽内部的a和d两个位置都是丙氨酸(Xenospiral[GB12184-PA]中33%;Xenospira2[GB12348-PA]中36%;Xenospira3[GB17818-PA]中27%以及Xenospira4[GB19585-PA]中38%;见表6和7)。表6.蜜蜂丝蛋白巻曲螺旋区不同七肽位置每种氨基酸残基数目的总结。<table>tableseeoriginaldocumentpage47</column></row><table>表7.蜜蜂丝蛋白七肽中丙氨酸残基的总结。<table>tableseeoriginaldocumentpage48</column></row><table>PROFsec预测,NNPredict的预测显示在括号中。图6和图7总结了膜翅目丝巻曲螺旋区中不同七肽位置的氨基酸组成。如上所述,七肽内的位置具有新颖的组成——蜜蜂和蚂蚁丝的"疏水"七肽位置"和"包括非常高水平的丙氨酸(平均58%)以及高水平的极性残基(平均21%),相对于其他巻曲螺旋来说。此外,e位非同寻常的小并疏水(表8、图7)。该位置在七肽地形上位于"位残基邻近。a和"位残基的组成相似性暗示该丝采取每个a螺旋三个核心残基的巻曲螺旋结构。核心中三个残基核心比两个残基贡献更大的疏水界面(Deng等人,2006)——这一特征将有助于巻曲螺旋的形成和稳定性。此外,集中看来七肽内6、c、e、/和g位比以前确定的蛋白巻曲螺旋区一般更为疏水,极性更小且带电更少(见图7,表8和9)。因此,尽管历史上认为有刺的膜翅目昆虫丝的螺旋含量是甘氨酸含量降低和酸性残基成分的增加导致的(RudallandKenchington,1971),我们发现并非甘氨酸/酸性残基决定了新颖的丝结构,而是多肽链中丙氨酸残基的位置决定的。表8.直系同源膜翅目丝蛋白和绿草蜻蛉丝蛋白(MalFl)的每个七肽位的平均大小和疏水性显示a、d和e位(核心)比其他位置更小且更疏水。有些例子中,b位(部分浸水)也小且疏水。<table>tableseeoriginaldocumentpage49</column></row><table>实施例6-蜜蜂丝蛋白似乎是广泛交联的蜜蜂丝蛋白都包括高含量的赖氨酸(6.5%-16.3%)。比较测定的蜜蜂丝氨基酸组成和鉴定的丝蛋白的序列显示赖氨酸残基数目的大量不匹配,在丝中检测到的赖氨酸比预期的要少很多(图2和3)。这暗示丝中赖氨酸残基被修饰了,所以通过标准的氨基酸分析不能鉴定出来。已知赖氨酸形成多种交联或者被赖氨酸氧化酶催化的酶交联,或者糖化赖氨酸残基产生的非酶交联(Reiser等人,1992)。蜜蜂和熊蜂丝氨基酸分析中赖氨酸的低代表性与存在的赖氨酸交联一致。表9.丝蛋白巻曲螺旋区不同七肽位置每类氨基酸中残基的数目<table>tableseeoriginaldocumentpage50</column></row><table>共价交联的蛋白SDS聚丙烯酰胺胶电泳(PAGE)预期交联复合体的分子量迁移。我们对晚末龄蜜蜂唇腺蛋白SDSPAGE并测量相对于标准蛋白标记的丝蛋白迁移。每个鉴定的丝蛋白单体都观察到了相应的带,然而含有这些蛋白的高分子量带也存在,如在交联系统中所预期的那样(图8)。如上所述,蜜蜂唇腺包括有组织和无组织丝蛋白的混合物。观察到的交联蛋白可能相应于该腺的前端区蛋白群,该丝即从那里挤出。有理由推测细胞外蜜蜂丝包括大量高比例交联蛋白,比在所有阶段唾液腺丝蛋白异源混合物中观察到的比例要高。键似乎不是半胱氨酸交联,因为还原性处理对该丝没有影响,且鉴定的丝蛋白中包括很少或没有半胱氨酸残基。实施例7-真针尾类丝蛋白与其他丝蛋白显著不同真针尾类丝与其他所描述的丝基因在氨基酸组成(表10)、涉及蛋白的分子量、二级结构和物理性质(表11和12)方面显著不同。鳞翅类丝主要由小氨基酸残基丙氨酸、丝氨酸和甘氨酸组成(例如家蚕,表io),并且支配性的二级结构是广泛的e片层。粉蝶盘绒茧蜂(。to"g/o縦rato)含有大量天冬酰胺和丝氨酸-大量的后一残基是鳞翅目丝胶蛋白(丝胶)的特征(表IO)。粉蝶盘绒茧蜂(Coto/"g/omerato)的丝蛋白模型并没有在二级结构中鉴定出螺旋或巻曲螺旋。相比之下,蜜蜂、蚂蚁和草蜻蛉的丝富含丙氨酸(表IO),包括形成巻曲螺旋的高水平的螺旋二级结构。表10.不同昆虫丝的氨基酸组成,最多的残基以黑体显示。<table>tableseeoriginaldocumentpage51</column></row><table>表ll.昆虫丝之间的不同<table>tableseeoriginaldocumentpage52</column></row><table>四种膜翅目物种丝蛋白巻曲螺旋区支序分析(图9)暗示该基因在真针尾类从寄生蜂分化前由共同的袓先进化而来。该丝的序列广泛分化,我们仅能比对组成每个蛋白巻曲螺旋区的210个氨基酸。此处提供的每个丝蛋白巻曲螺旋区之间的氨基酸序列同源性显示在表13,且相应区的DNA同源性显示在表14。尽管所述的蛋白质氨基酸含量(特别高水平的丙氨酸)和三级结构相似,主要氨基酸序列的同源性非常低。事实上,编码玛草蛉丝蛋白的基因是独立进化的,因此丝蛋白序列不能和膜翅目序列相比对。这表明氨基酸的同源性可出现相当大的变化,而不影响该蛋白的生物功能。支序分析预测真针尾蜂的丝包括蚂蚁和蜜蜂丝相关蛋白,尽管这些蛋白与此处描述的蛋白有相似的组成和结构,它们具有高度分化的主序列。此处提供的丝蛋白氨基酸序列(图10)和蛋白数据库相比较,然而,没有发现具有合理水平序列同源性的(例如丝蛋白序列长度上不大于30%同源性)任何现有技术蛋白。表13.蚂蚁和蜜蜂中纤维蛋白巻曲螺旋区蛋白序列间同源性百分数。<table>tableseeoriginaldocumentpage53</column></row><table>表14.蚂蚊和蜜蜂中纤维蛋A编码巻曲螺旋区核苷酸序列之间的同源性百分数。<table>tableseeoriginaldocumentpage53</column></row><table>编码这些丝蛋白(图ll所提供的)的开放读码框按上述方法进行相似的数据库检索。鉴定出的仅有的相关分子是作为蜜蜂基因组计划的一部分发表的(www.ncbi.nlm.nih.gov/genome/guide/bee)。蜜蜂基因组计划已经预测了开放读码框,然而并没有提示编码蛋白的功能。此外,对于任何这些分子,没有证据表明曾经产生过包括该mRNA开放读码框的多核苷酸。编码Xenospiral、Xenospira2、Xenospira3和Xenospira4的基因包括一个覆盖整个单开放读码框的外显子,而编码Xenosin的基因包括至少一个内含子(见图12)。实施例8-丝蛋白在转基因植物中的表达编码本发明丝蛋白的植物表达载体可由置于包括卡那霉素抗性基因(NptII)的双元载体骨架中CaMV35S启动子下游的编码所述蛋白的重组核酸分子(例如SEQIDNO's:11到21、31到39、48到55、64到71、74或75所提供的任何一条多核苷酸)组成。对于包括SEQIDNO's11、13、15、17、19、31、33、35、37、48、50、52、54、64、66、68、70或74中任一条的多核苷酸,构建物可进一歩包括信号肽编码区,如拟南芥液泡碱性几丁质酶信号肽,其置于编码该丝蛋白序列的框架内或上游。在转化到拟南芥中前通过电穿孔将载有编码多肽丝蛋白的构建物分别转化根癌农杆菌。下胚轴转化法可用于转化拟南芥,其可在包括卡那霉素培养基的选择培养基上选择存活植株。重生体中根形成后,转移到土壤中建立一代转基因植物。转化过程的验证可通过PCR筛选完成。多核苷酸的掺入和表达通过PCR、Southern印迹分析和/或胰蛋白酶切表达蛋白的LC/MS测定。同一载体可提供两种或两种以上不同丝蛋白编码构建物,或每个编码一种不同蛋白的许多不同载体可转化到植物中。作为植物表达的实验实施例,启动子优化版的AmelF4(Xenospira4)(SEQIDNO:76)克隆到pET14b(Novagen)产生pET14b-6xHis:F4op,形成蛋白N端带有6x组氨酸的框内翻译融合蛋白。编码蛋白"6x组氨酸:F4op"的序列克隆到pVEC8(Wang等人,1992),置于CaMV35S启动子和ocs多腺苷酸化调节元件的控制之下,产生pVEC8-35S-6xHis:F4op-ocs。pET14b-6xHis:F4op转化到化学感受态E.coli中,且pVEC8-35S-6xffis:F4叩通过农杆菌介导转化到烟草叶片中。从抗生素抗性co//(诱导表达)和烟草叶中获得的蛋白分离并使用四组氨酸抗体(Qiagen,Karlsrule,Germany)进行western印迹分析检测。空载体pET14b和pVEC8-35S-ocs用于相应的宿主背景中作为负对照。如图13所示,这些实验获得了能产生Xenospira4(AmelF4)蛋白的植物。实施例9-丝蛋白的发酵和纯化蜜蜂基因AmelFl-F4(分别为Xenospiral到4)和草蜻蛉MalFl基因通过PCR扩增并克隆到pET14b表达载体(Novagen,Madison,WI)后构建表达构建物。产生的表达质粒电穿孔到E.coliBL21(DE3)Rosetta细胞中并在含有氨节青霉素的LB琼脂培养基中生长过夜。单集落接种到包括氨苄青霉素的LB肉汤培养基然后在37。C生长过夜。通过离心收集细胞并用洗涤剂(Bugbuster,Novagen)溶解。包涵体广泛洗涤并重溶入6M胍盐中。该过程产生95%以上纯度的蜜蜂蛋白混合物和50%以上纯度的草蜻蛉MalFl蛋白混合物。通常可获得达到50%产量的湿重大肠杆菌细胞片状沉淀,表明通过这种方法可容易的表达该蛋白。溶解的蜜蜂重组蛋白加到按制造商说明制备的Talon树脂柱上。然后通过100mMTris.HCL,150mMpH8咪唑洗脱。实施例10-丝蛋白加工成线蜜蜂和草蜻蛉丝蛋白通过多种方法(见图14)使用下述歩骤很容易制作成线。晚末龄意大利蜂唾液腺前段在磷酸缓冲盐溶液中分离并移到一滴缓冲液中的平面内。用镊子夹住该段的两端。一端以恒定的速率抬离缓冲液并和另一端分离。这样可以拉出很好的迅速在空气中固化的线。蜜蜂和草蜻蛉幼虫重组丝蛋白脱水或浓縮后形成线或片层。例如,通过将可溶蛋白滴入丁醇溶液中或通过在Talon树脂柱上浓縮。线的获得也可通过蜜蜂或草蜻蛉重组丝蛋白和有机溶剂(如己垸)混合以在界面上以正确的构象浓縮,然后加入试剂从界面上排除(如丁醇)。通过这一过程形成的线与土丝具有相似的FT-IR光谱,表明它们包括相同的巻曲螺旋结构。此处描述的其他物种的丝蛋白也可通过这一程序加工。本领域技术人员应理解本发明可进行许多改变和/或修饰,如具体实施方式中所示的,而并不脱离本发明的精神或范围,如此处广泛描述的。因此,本实施方式应全面理解,作为说明而不是限制。所有上述讨论的出版物都完整的并入此处。本说明书包括的任何所讨论的文件、文字记录、材料、装置、物品之类的目的仅是提供本发明的上下文环境。并不因为其存在于本申请每项权利要求的优先权日之前而被当作承认这些事项的任何一项构成现有技术基础的部分或本发明相关领域的公知常识。9S:ra八j3Sipress3"asppv3问onis[OOO。TP朋.£>八BptpB入"3ISO66S-l78S:Z£ZA§op!g呵tw3iow.f(£661)'0"PubSpire'g}soh'6i7廿乙-6Et^:9IBwno〖叫工(Z66I)'3'"Hw^ptra'5p!uucooj^'J3s!9"aA[MBqs'TTCIsp!n。.£^-£17^朴"I。诏.f(0i6I)'(TO'qosun丛puB.g.s'ireuraip39NVIM鄉!罕。'ss3Jdjj]A[79£-81£dd力i。a_gu!ss3。owpqnqpis!al叩B:redmsu0pEK)idx3(8861).3.<3讽qpunrapuB'了fpueipicPI^'i79lH9n:ZSZ9,。s(1661)'〖WSPTO'W一auB八"vsb—'urep鄉iuv早ss但6"-S"dd,p八(hz柳sptrewuphold'p3)yCxjs!uiOTpoyg[。Aysu9tp;iduio;3iq(厶961),PNT^SIIBPn"HPUB'JsBoni.61^-6££:乙.10!3T(0961).D.S朋iuspire.g'j;r丛BqsSB3tr['808寸08:08Boysuivjo《岡oos同3。iouio呵叫}josiBuuy(乙g61)surepyp朋i,uo人u喷Bi'60乙40S:S6巧3人sd(8861)'AV'3uoAim,,.ZSH厶r巾k.p旧1。w,f(0661)M3§p!jSubipire.33u叫oo"9.a岡I9U^99:6,山3tpo!gpssiq(6乙61)'"H'WJJ0P!ABaP现.a'H"raiP加to""H'HmnqdsH卞an-"ZXI:8£^i岡uiaipo!8(6661).JS["is!30priB'"q3丛"fmreui3umps'工3mqtupH"qo9p旧spu3j工(站61)'SBUiBifereHamj。n^s(900。'IA[nqpire'^'nqoBqu3nB2"aJ9Z叩g"。3usqz"〖nn"人3xraag[:jjBc[A3oio!s/Cqtipirny(^s!ui3iioo!g9八卩WBdiuo;3(zoo乙)'OPub'i';3§!8.13'0tr厶乙:SK'R8'p]Ai〖(K)OZ)'TCIuBdr^puB'd'cn^FX"31W-6n:Wio旧PPN[r(A96I)'工'a'3suppvRudallK.M.(1962)InComparativeBiochemistry(Ed.ByFlorkinMandMasonHS)Vol4,pp.297-435.AcademicPress,NewYork.RudallK.M.andKenchingtonW.(1971)AnnualReviewsinEntomology16:73-96.Silva-ZacarinE.C.M.,SilvaDeMoraesR丄.M.andTabogaS.R.(2003)J.Biosci.6:753-764.SpeilgerP.E.(1962)AnnalsoftheEntomologicalSocietyofAmerica,55:69-77.WangM.B.,LiZ.Y.etal.(1998).ActaHort.461:401-407.YamadaH.,ShigesadaK.,IgarashiY.,TakasuY.,TsubouchiK.andKatoY.(2004)Int.J.WildSilkmothandSilk9:61-66.权利要求1、一种基本上纯化的和/或重组的丝多肽,其中至少该丝多肽的一部分具有卷曲螺旋结构。2、根据权利要求1所述的多肽,其中具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列ak^e/g,并且其中至少25%的"和d位氨基酸是丙氨酸残基。3、根据权利要求1所述的多肽,其中具有巻曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列Wafe/g,并且至少25%的fl、d和e位氨基酸是丙氨酸残基。4、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列i)SEQIDNO:l、SEQIDNO:2、SEQIDNO:22、SEQIDNO:23、SEQIDNO:40、SEQIDNO:41、SEQIDNO:56以及SEQIDNO:57所提供的任何一条氨基酸序列;ii)与SEQIDNO:l、SEQIDNO:2、SEQIDNO:22、SEQIDNO:23、SEQIDNO:40、SEQIDNO:41、SEQIDNO:56以及SEQIDNO:57中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。5、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列i)SEQIDNO:3、SEQIDNO:4、SEQIDNO:24、SEQIDNO:25、SEQIDNO:42、SEQIDNO:43、SEQIDNO:58以及SEQIDNO:59所提供的任何一条氨基酸序列;ii)与SEQIDNO:3、SEQIDNO:4、SEQIDNO:24、SEQIDNO:25、SEQIDNO:42、SEQIDNO:43、SEQIDNO:58以及SEQIDNO:59中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。6、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列i)SEQIDNO:5、SEQIDNO:6、SEQIDNO:26、SEQIDNO:27、SEQIDNO:44、SEQIDNO:45、SEQIDNO:60以及SEQIDNO:61所提供的任何一条氨基酸序列;ii)与SEQIDNO:5、SEQIDNO:6、SEQIDNO:26、SEQIDNO:27、SEQIDNO:44、SEQIDNO:45、SEQIDNO:60以及SEQIDNO:61中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。7、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列i)SEQIDNO:7、SEQIDNO:8、SEQIDNO:28、SEQIDNO:29、SEQIDNO:46、SEQIDNO:47、SEQIDNO:62以及SEQIDNO:63所提供的任何一条氨基酸序列;ii)与SEQIDNO:7、SEQIDNO:8、SEQIDNO:28、SEQIDNO:29、SEQIDNO:46、SEQIDNO:47、SEQIDNO:62以及SEQIDNO:63中任何一条或多条具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。8、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列i)SEQIDNO:72或SEQIDNO:73所提供的氨基酸序列;ii)与SEQIDNO:72和/或SEQIDNO:73具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。9、一种基本上纯化的和/或重组的丝多肽,其包括选自下述的序列i)SEQIDNO:9、SEQIDNO:IO以及SEQIDNO:30所提供的任何一条氨基酸序列;ii)与SEQIDNO:9、SEQIDNO:IO以及SEQIDNO:30具有至少30%同源性的氨基酸序列;以及iii)i)或ii)的生物活性片段。10、根据权利要求1到9中任何一项所述的多肽,其可从膜翅目昆虫或脉翅目昆虫的一个物种中纯化获得。11、根据权利要求10所述的多肽,其中所述的膜翅目昆虫的物种为意大利蜂jp/sme〃i/^ra、黄《京虫义(9gcop/zy〃as附fln3gtft"a、牛头犬虫义il^r附ec/a/on'cata或授^b乂熊蜂万owZwsfm"e欲&。12、根据权利要求10所述的多肽,其中所述的脉翅目昆虫的物种为玛草蛉13、根据权利要求1到12中任何一项所述的多肽,其与至少一种其他多肽融14、一种编码丝多肽的分离的和/或外源多核苷酸,其中至少丝多肽的一部分具有巻曲螺旋结构。15、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列i)SEQIDNO:ll、SEQIDNO:12、SEQIDNO:31、SEQIDNO:32、SEQIDNO:48、SEQIDNO:49、SEQIDNO:64以及SEQIDNO:65所提供的任何一条核苷酸序列;ii)编码如权利要求1到4或10到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:ll、SEQIDNO:12、SEQIDNO:31、SEQIDNO:32、SEQIDNO:48、SEQIDNO:49、SEQIDNO:64以及SEQIDNO:65中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。16、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列i)SEQIDNO:13、SEQIDNO:14、SEQIDNO:33、SEQIDNO:34、SEQIDNO:50、SEQIDNO:51、SEQIDNO:66以及SEQIDNO:67所提供的任何一条核苷酸序列;ii)编码如权利要求1到3、5或10到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:13、SEQIDNO:14、SEQIDNO:33、SEQIDNO:34、SEQIDNO:50、SEQIDNO:51、SEQIDNO:66以及SEQIDNO:67中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。17、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列i)SEQIDNO:15、SEQIDNO:16、SEQIDNO:35、SEQIDNO:36、SEQIDNO:52、SEQIDNO:53、SEQIDNO:68以及SEQIDNO:69所提供的任何一条核苷酸序列;ii)编码如权利要求1到3、6或10到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:15、SEQIDNO:16、SEQIDNO:35、SEQIDNO:36、SEQIDNO:52、SEQIDNO:53、SEQIDNO:68以及SEQIDNO:69中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。18、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列i)SEQIDNO:17、SEQIDNO:18、SEQIDNO:37、SEQIDNO:38、SEQIDNO:54、SEQIDNO:55、SEQIDNO:70、SEQIDNO:71以及SEQIDNO:76所提供的任何一条核苷酸序列;ii)编码如权利要求1到3、7或10到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:17、SEQIDNO:18、SEQIDNO:37、SEQIDNO:38、SEQIDNO:54、SEQIDNO:55、SEQIDNO:70、SEQIDNO:71以及SEQIDNO:76中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。19、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列i)SEQIDNO:74或SEQIDNO:75所提供的核苷酸序列;ii)编码如权利要求1到3、8或10到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:74和/或SEQIDNO:75具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。20、一种分离的和/或外源多核苷酸,该多核苷酸包括选自下述的序列-i)SEQIDNO:19、SEQIDNO:20、SEQIDNO:21以及SEQIDNO:39所提供的任何一条核苷酸序列;ii)编码如权利要求1到3或9到13中任何一项所述的多肽的核苷酸序列,iii)与SEQIDNO:19、SEQIDNO:20、SEQIDNO:21以及SEQIDNO:39中任何一条或多条具有至少30%同源性的核苷酸序列,以及iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。21、包括至少一种如权利要求14到20中任何一项所述的多核苷酸的载体。22、根据权利要求21所述的载体为表达载体。23、包括至少一种如权利要求14到20中任何一项所述的多核苷酸,和/或至少一种如权利要求21或22所述的载体的宿主细胞。24、根据权利要求23所述的宿主细胞是细菌、酵母或植物细胞。25、制备如权利要求1到13中任何一项所述的多肽的方法,该方法包括在允许编码所述多肽的多核苷酸表达的条件下,培养如权利要求23或24所述的宿主细胞,或者如权利要求22所述的载体,以及回收所表达的多肽。26、包括外源多核苷酸,编码至少一种如权利要求1到13中任何一项所述的多肽的多核苷酸的转基因植物。27、包括外源多核苷酸,编码至少一种如权利要求1到13中任何一项所述的多肽的非人类转基因动物。28、特异性结合如权利要求1到12中任何一项所述的多肽的抗体。29、包括至少一种如权利要求1到13中任何一项所述的多肽的丝纤维。30、根据权利要求29所述的丝纤维,其中至少一些所述的多肽是交联的。31、根据权利要求30所述的丝纤维,其中至少所述的多肽的一些赖氨酸残基是交联的。32、包括至少两种如权利要求1到13中任何一项所述的多肽的共聚物。33、根据权利要求32所述的共聚物,其包括如权利要求4所述的多肽,如权利要求5所述的多肽,如权利要求6所述的多肽,以及如权利要求7所述的多肽。34、根据权利要求33所述的共聚物,其进一歩包括如权利要求9所述的多肽。35、根据权利要求33或34所述的共聚物,其中至少一些所述的多肽是交联的。36、根据权利要求35所述的共聚物,其中至少所述的多肽的一些赖氨酸残基是交联的。37、包括至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的产品。38、根据权利要求37所述的产品,其中该产品选自个人护理产品、纺织品、塑料制品或生物医学产品组成的群组。39、包括至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物,以及一种或一种以上可接受的载体的组合物。40、根据权利要求39所述组合物进一步包括药物。41、用作药物、或者在医疗器械或化妆品中使用的如权利要求39所述组合物。42、包括至少一种如权利要求14到20任何一项所述的多核苷酸,以及一种或一种以上可接受的载体的组合物。43、一种治疗或预防疾病的方法,该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物,其中所述的药用载体选自至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物。44、至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物,以及药物,在制备治疗或预防疾病的药物中的用途。45、包括至少一种如权利要求1到13中任何一项所述的多肽,至少一种如权利要求14到20任何一项所述的多核苷酸,至少一种如权利要求21或22所述的载体,至少一种如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的试剂盒。全文摘要本发明提供丝蛋白,以及编码这些蛋白的核酸。本发明也提供合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途,如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。文档编号C07H21/04GK101321777SQ200680045666公开日2008年12月10日申请日期2006年10月4日优先权日2005年10月5日发明者A·斯里斯坎瑟,H·特鲁曼,P·M·坎贝尔,S·韦斯曼,T·D·萨瑟兰,V·S·哈里托斯申请人:联邦科学工业研究组织
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1