重组蜘蛛丝蛋白的制作方法

文档序号:1755053阅读:547来源:国知局
专利名称:重组蜘蛛丝蛋白的制作方法
技术领域
本发明涉及重组蜘蛛丝蛋白,核酸,编码这些重组蜘蛛丝蛋白的核酸,以及适合于表达那些核酸的宿主。此外,本发明涉及聚集蜘蛛丝蛋白的方法和这些蛋白质在生物技术和/或药物和其它工业领域中的应用,特别地在制备汽车部件(automotive parts),在飞行器构建中,在加工纺织品和皮革制品,以及在制备和加工纸,化妆品,食物,电子装置,药物递送等中的应用。
在本申请中,使用下列缩写NR--非重复性的;Apr,氨苄青霉素抗性基因;IPTG,异丙基-β-D-硫代半乳糖苷;GdmCl,氯化胍(guanidinium chloride);GdmSCN,异硫氰酸胍;SDS,十二烷基硫酸钠;PAGE,聚丙烯酰胺凝胶电泳;Tris,三(羟甲基)氨基甲烷;CD,圆二色性;rep-蛋白质,重复蛋白质;Da,道尔顿;cps,每秒计数;MRW,平均残基重量;n.d.,不确定。
蜘蛛丝是显示优越物理性质的蛋白聚合物(1)。在不同类型的蜘蛛丝中,拖丝是被最集中研究的。拖丝的丝被圆网蜘蛛(orb weaving spiders)用于构建它们的网的框架和半径并作为总是拖在后面的生命线。为这些目的,需要高的拉伸强度和弹性。这些性质的组合导致与大多数其它已知材料相比,更高的韧性(1;2)。拖丝的丝通常由两种主要的蛋白组成,其主要结构具有共同的重复结构(3;4)。
可以包含多到60个氨基酸的单重复单位的变化被重复数次来表示拖丝的丝序列的最大部分。这些重复单位表示有限组的独特的氨基酸基序。在所有的拖丝的丝重复单位中发现的一个基序是典型地6-9个丙氨酸残基的区组。在丝线中,数种聚丙氨酸基序形成晶态的β-折叠堆积,产生拉伸强度(5;6)。
富含甘氨酸的基序诸如GGX或GPGXX采用柔性的螺旋状结构,其连接晶态区域并给线提供弹性(7)。
此外,所有的被研究的拖丝的丝蛋白在它们的羧基端包含不显示明显的重复模式的区域(非重复的或NR-区域)。到目前为止,在最终的线中没有功能与这些区域相关。
丝的体内装配是引入注意的过程。蜘蛛的拖丝丝蛋白在所谓的主要的壶腹腺中以多到50%(w/v)(8)的浓度贮存。尽管已经提出在主要的壶腹腺中关于这些蛋白质的“动态松散螺旋结构”(8),更近的数据提示对于所述蛋白质的所谓A-区的随机卷曲构象,其代表所述腺体的最大部分(9;10)。高度浓缩的蛋白质溶液形成丝粘稠物(纺丝溶液(spinning solution)),其显示液态晶体的性质(11-13)。
线的装配在粘稠物通过纺织导管的通道中开始,伴随水、钠和氯化物的提取(14;15)。同时,易溶离子钾和磷酸盐的浓度增加,pH从6.9降到6.3(14-16)。装配最终由机械应力引发,其由线被推出蜘蛛的腹部而导致(17)。
出于一些目的,天然丝线不能直接使用,而必须溶解并且再装配成其它形态,诸如薄膜、泡沫、球体、纳米纤维、水凝胶等。
已经关于丝的丝心蛋白进行了涉及由丝蛋白制备的薄膜的大部分研究,所述丝的丝心蛋白是衍生自家蚕家蚕蛾(Bombyx mori)的丝的主要蛋白质成分。丝的丝心蛋白薄膜可以从水溶液或包含六氟异丙醇(HFIP)、甲酸和三氟乙酸的溶液中铸塑成。在溶液中,根据所用的溶剂,丝的丝心蛋白倾向于采取螺旋或随机卷曲构象。当铸塑成薄膜时,蛋白质维持可溶性状态的构象或采取更多的富含β-折叠的构象。在大多数情形中,用甲醇处理薄膜导致β-折叠含量和结晶度的进一步增加。除了丝的丝心蛋白之外,还将其它的丝蛋白用于铸塑成薄膜。Vollrath及同事研究从提取自蜘蛛Nephila senegalensis的主要壶腹腺的蛋白质制成的薄膜。当从水溶液中制备时,这样铸塑成的薄膜主要包含随机卷曲构象的蛋白质。它们的结构在添加氯化钾后改变成β-折叠。此外,使用HFIP作为溶剂,从蜘蛛Nephilaclavipes的拖丝的丝蛋白MaSpI来源的合成丝蛋白质制备薄膜。在溶液中,蛋白质采取α-螺旋结构,当被铸塑成薄膜时,其改变为富含更多的β-折叠的构象。
不幸的是,其氨基酸序列局限了从天然的丝的丝心蛋白产生功能性薄膜材料。由于包含硫醇、氨基或羧基基团的化学反应性氨基酸侧链的低丰度(<1.5%),丝的丝心蛋白的选择性化学修饰仅可能是非常有限的。此外,在天然宿主中改变丝蛋白并因此改变薄膜的性质的遗传修饰则很慢。
尽管蜘蛛丝蛋白的某些结构方面已经清楚,但是关于个体丝蛋白和它们的主要结构元件对于装配过程的贡献则知道的很少。关于花园蜘蛛十字园蛛(Aranus diadematus)的两种主要的拖丝丝蛋白,ADF-3和ADF-4的竞争性研究揭示,尽管它们的氨基酸序列非常相似(4),它们显示相当不同的溶解度和装配特性尽管ADF-3甚至在高浓度仍是可溶的(18),ADF-4实际上是不可溶的,并且在特定条件下自装配为丝状结构(未公开的结果)。
科学和商业利益促进了蜘蛛丝的工业规模生产的研究。由于蜘蛛的同种相残,天然的蜘蛛丝生产是不切实际的,而人工生产在获得足够的蛋白质产量和出众的线-装配中遇到问题。细菌的表达产生低蛋白水平,这可能是由于细菌和蜘蛛的不同的密码子选择导致的。具有适应于表达宿主的密码子选择的合成基因导致更高的产量,但是其合成的蛋白质显示与天然蜘蛛丝不同的性质。部分拖丝的丝cDNAs在哺乳动物细胞系中的表达确实产生了丝蛋白(例如ADF-3),其可以以人工方式纺丝(spin)为“丝样”的线,尽管在品质上仍旧很差。
WO03060099涉及将生物丝蛋白纺丝为纤维的方法和装置。该发明特别用于从水溶液中纺丝重组的丝蛋白,并增加纤维的强度和制品的实用性从而使这些纤维的商业生产和应用是可实践的。其中,公开了在哺乳动物细胞,例如转基因的山羊乳腺细胞中表达蜘蛛丝蛋白。
在细菌宿主中的真正的蜘蛛丝基因的表达-如上提及-是无效的(24),因为一些基因部分包含不能有效在细菌中翻译的密码子。此外,由于丝的重复性性质,通过PCR进行基因操作和扩增是困难的。为了研究蜘蛛丝蛋白的性质,使用具有适应于相应的表达宿主的密码子选择的合成DNA组件进行克隆策略。获得编码类似于蜘蛛丝的重复区的蛋白质的合成基因(25-28)。然而,发现这些蛋白质的设计都不包含在所有的拖丝的丝中发现的羧基端NR-区。
因此,本发明的目的是提供具有提高的特性,如具体而言以高产量表达的提高的能力和提高的强度和柔性,即更好的质量的重组蜘蛛丝蛋白。此外,本发明的目的是提供可以方便地在已经了解的表达系统中表达的重组蜘蛛丝蛋白。本发明的另一个目的是提供用于聚集蜘蛛丝蛋白的改善的方法和由这些蛋白质形成线的方法。此外,本发明的目的是提供改善的纸、纺织品和皮革制品。另一个目的是提供新的蛋白质和基于蜘蛛丝蛋白的其它的材料诸如球体,纳米纤维,水凝胶,线,泡沫,薄膜以用在生物技术、药物、药学和食品应用,化妆品,电子装置中和用于其它的商业目的。
这些目的通过独立权利要求的主题而得以实现。优选的实施方案在从属权利要求中提出。
提供包含合成的重复蜘蛛丝蛋白序列和/或真正的NR-(非重复性)区域或由其组成的重组蜘蛛丝蛋白的现有蛋白质改造方法揭示与真正的丝蛋白非常相似的蛋白质可以以高产量产生。具体而言,本文提供的可以容易地按比例放大的细菌表达系统和简单便宜的纯化方法,提供了以经济有效的工业规模生产蜘蛛丝样蛋白的基础。
已经对蜘蛛丝蛋白主要就它们对于丝线的机械性质的贡献进行了研究。然而,关于丝装配的分子机制仍知道的很少。作为要表征该过程的第一个步骤,本发明人鉴定了决定蛋白质溶解性的花园蜘蛛(十字园蛛)的主要拖丝的丝蛋白ADF-3和ADF-4的一级结构元件。此外,研究了涉及介导天然线装配的条件对蛋白质聚集的影响。使用新开发的克隆策略产生了编码蜘蛛丝样蛋白的基因,其基于合成DNA组件和PCR扩增的真正基因序列的组合。比较二级结构,合成的蛋白质的溶解度和聚集性质揭示单一的一级结构元件对蛋白质性质具有不同的影响。代表拖丝的丝蛋白的最大部分的重复区域决定合成蛋白质的溶解度,其在衍生自ADF-3和ADF-4的构建体之间非常不同。促进丝体内装配的因素,诸如酸化和磷酸盐浓度的增加通常减少丝蛋白的体外溶解度。引人注目的是,这种效果在包含ADF-3或ADF-4的羧基端非重复性区域的被改造蛋白中出现,说明这些区域在起始蜘蛛丝蛋白的装配中具有重要作用。
按照第一个方面,本发明涉及重组的蜘蛛丝蛋白,其包含a)一个或多个合成的重复性蜘蛛丝蛋白序列,和/或b)一个或多个真正的非重复性蜘蛛丝蛋白序列。
要了解的是,用于本文时,术语“合成的重复性序列”指不能天然发现的,然而,其衍生自在蜘蛛丝蛋白中天然存在的重复单位的重组蛋白质序列。如上所示,那些重复序列包含一个或多个包含多到60个氨基酸的单一重复单位。天然存在的重复单位包含有限组的独特的氨基酸基序。那些重复单位特别将拉伸强度和弹性赋予可以在后来由蜘蛛丝蛋白形成的线。
下面将详细解释可能形成本发明的合成的重复序列的基础的不同类型的重复单位。
可以与合成的重复序列一起存在,或可以单独存在的本发明的重组蜘蛛丝蛋白的第二种组分包含一种或多种真正的非重复性蛋白质序列。这些非重复性序列在线的装配中具有重要的功能作用。
要注意的是,在本发明中,还意欲仅包含合成的重复性序列的重组的蜘蛛丝蛋白。尽管本发明的重组蛋白显示两种组分,即合成的重复序列以及真正的非重复序列,其具有更宽范围的应用性并且可以以更高的量产生(见下面的实施例章节),可以将仅具有合成的重复序列的重组蜘蛛丝蛋白用于一些特定的应用。
这些应用是汽车和飞行器部件,表面涂层,以及伤口闭合系统和伤口敷料等。或换言之,其中不需要蜘蛛丝蛋白的线结构的应用。
用于本文时,术语“真正的”意味着基本的核酸序列分离自它们的天然环境而在其序列本身中没有进行实质上的改变。允许的仅有的改变是其中将真正的非重复性核酸序列进行修饰从而使所述序列在不改变编码的氨基酸序列的情况下,在宿主中表达。优选的序列是NR3(SEQ ID NO10;衍生自ADF-3)和NR4(SEQ ID NO11;衍生自ADF-4)。在两个序列中,使用PCR诱变将很少在大肠杆菌(E.coli)中翻译的密码子AGA(Arg)突变为CGT(Arg)以进行更有效的翻译。
优选的鞭形蛋白的真正的非重复性序列是FlagN-NR(SEQ ID NOs31和32)和FlagC-NR(SEQ ID NOs33和34)的氨基酸序列和核酸序列。
按照优选的实施方案,本发明的重组蜘蛛丝蛋白通常衍生自蜘蛛主要壶腹腺的蜘蛛拖丝蛋白和/或鞭状腺的蛋白。
按照另一个优选的实施方案,真正的非重复性序列衍生自天然存在的蜘蛛丝蛋白的氨基端非重复性区域(鞭形蛋白)和/或羧基端非重复性区域(鞭形和拖丝蛋白)。下面将指出那些蛋白的优选实例。
通常优选选择衍生自圆网蜘蛛(园蛛科(Araneidae)和Araneoids)的拖丝或鞭形蛋白的拖丝和/或鞭形序列。
更优选地,所述拖丝蛋白和/或鞭形蛋白衍生自下列蜘蛛的一种或多种希氏尾园蛛(Arachnura higginsi),Araneus circulissparsus,十字园蛛,Argiopepicta,条带园蛛(Banded Garden Spider)(三带蜘蛛(Argiope trifasciata)),Batik Golden Web Spider(Nephila antipodiana),Beccari′s Tent Spider(Cyrtophora beccarii),鸟粪蛛(Bird-dropping Spider)(Celaenia excavata),黑白棘蛛(Black-and-White Spiny Spider)(库氏棘腹蛛(Gasteracantha kuhlii)),黑黄园蛛(Black-and-yellow Garden Spider)(Argiope aurantia),流星锤蛛(Bolas Spider)(Ordgarius furcatus),流星锤蛛-巨蜘蛛(Bolas Spider-Magnificent Spider)(Ordgarius magnificus),棕色水手蛛(Brown SailorSpider)(嗜水新园蛛(Neoscona nautica)),棕腿蛛(Brown-LeggedSpider)(Neoscona rufofemorata);Capped Black-Headed Spider(帆楚蛛(Zygiella calyptrata)),普通园蛛(Common Garden Spider)(Parawixiadehaani),普通园蛛(Common Orb Weaver)(Neoscona oxancensis),蟹样棘园蛛(Crab-like Spiny Orb Weaver)(Gasteracantha cancriformis(elipsoides)),Curved Spiny Spider(Gasteracantha arcuata),皿云斑蛛(Cyrtophora moluccensis),Cyrtophora parnasia,Dolophones conifera,Dolophones turrigera,Doria′s Spiny Spider(Gasteracantha doriae),双点棘蛛(Double-Spotted Spiny Spider)(Gasteracantha mammosa),Double-TailedTent Spider(方格云斑蛛(Cyrtophora exanthematiea)),塞若尖腹蛛(Aculeperia ceropegia),Eriophora pustulosa,Flat Anepsion(Anepsiondepressium),Four-spined Jewel Spider(Gasteracantha quadrispinosa),花园圆网蛛(Garden Orb Web Spider)(Eriophora transmarina),Giant LichenOrbweaver(Araneus bicentenarius),金色网蛛(Golden Web Spider)(Nephilamaculata),Hasselt′s棘蛛(Hasselt′s Spiny Spider)(Gasteracantha hasseltii),Tegenaria atrica,Heurodes turrita,Island Cyclosa Spider(岛艾蛛(Cyclosainsulana)),Jewel or Spiny Spider(Astracantha minax),肾形园蛛(KidneyGarden Spider)(丽园蛛(Araneus mitificus)),Laglaise′s园蛛(Laglaise′sGarden Spider)(Eriovixia laglaisei),Long-Bellied Cyclosa Spider(Cyclosabifida),Malabar Spider(Nephilengys malabarensis),Multi-Coloured StAndrew′s Cross Spider(多色金蛛(Argiope versicolor)),观赏性树干蛛(Ornamental Tree-Trunk Spider)(裂腹蛛(Herennia omatissima)),Oval St.Andrew′s Cross Spider(好胜金蛛(Argiope aemula)),Red Tent Spider(单色云斑蛛(Cyrtophora unicolor)),Russian Tent Spider(Cyrtophora hirta),SaintAndrew′s Cross Spider(凯氏金蛛(Argiope keyserlingi)),猩红阿秋蛛(猩红阿秋蛛(Acusilas coccineus)),银色金蛛(Argiope argentata),Spinybacked Orbweaver(Gasteracantha cancriformis),斑点园蛛(SpottedOrbweaver)(Neoscona domiciliorum),St.Andrews Cross (Argiopeaetheria),St.Andrew′s Cross Spider(Argiope Keyserlingi),Tree-StumpSpider(无鳞波蛛(Poltys illepidus)),Triangular Spider(Arkys clavatus),Triangular Spider(Arkys lancearius),Two-spined Spider(Poecilopachysaustralasia),络新妇蛛属(Nephila)物种,例如Nephila clavipes,Nephilasenegalensis,Nephila madagascariensis和更多(对于另外的蜘蛛物种,还见下)。最优选的是,衍生自十字园蛛的拖丝蛋白和衍生自Nephila clavipes的鞭形蛋白。
在本发明的背景下,应该清楚的是重组蜘蛛丝蛋白可以不仅包含来自一个物种的蛋白质序列,还可以包含衍生自不同蜘蛛物种的序列。作为实例,一个或多个合成的重复性蜘蛛丝蛋白序列可以衍生自一个物种,一个或多个真正的非重复性蜘蛛丝蛋白序列可以衍生自另一个物种。作为另一个实例,还可能是设计重组蜘蛛丝蛋白,其包含超过一种类型的重复序列,其中不同的类型衍生自不同的物种。
按照一个优选的实施方案,拖丝蛋白质是野生型ADF-3,ADF-4,MaSpI,MaSp II,鞭形蛋白是FLAG。术语ADF-3/-4用在由十字园蛛产生的MaSp蛋白质的背景下(十字园蛛丝心蛋白-3/-4)。两种蛋白质ADF-3和-4属于MaSp II类蛋白质(主要的壶腹状spidroin II)。
丝纤维具有类似于液态结晶聚合物的在弹性非晶形部分之间散布β-折叠的晶态区域。这两个部分由被不同基因编码的两种不同的蛋白质类,MaSp I(主要的壶腹状spidroin I)和MaSp II(主要的壶腹状spidroin II)代表。
在另一个实施方案中,提供的核酸序列是ADF-3(SEQ ID NO1)和/或ADF-4(SEQ ID NO2),或其变体。
要注意的是,本发明意欲两种不同种类的ADF-3和ADF-4编码序列和蛋白质首先,已经公开的ADF-3和ADF-4序列(本文野生型序列)和第二,由SEQ ID NO1(ADF-3)和2(ADF-4)编码的其变体。所述野生型序列已经公开并且在登记号U47855和U47856(SEQ ID NO8和9)下获得。
可以在本发明中使用(即,单独的或组合以其它蛋白质)的另外的蜘蛛丝蛋白和它们的数据库登记号是spidroin 2[Araneus bicentenarius]gi|2911272主要的壶腹状腺体拖丝丝蛋白质-1[大腹园蛛(Araneus ventricosus)]gi|27228957主要的壶腹状腺体拖丝丝蛋白质-2[大腹园蛛]gi|27228959壶腹状spidroin 1[Nephila madagascariensis]gi|13562006主要的壶腹状spidroin 1[Nephila senegalensis]gi|13562010主要的壶腹状spidroin 1[Latrodectus geometricus]gi|13561998主要的壶腹状spidroin 1[三带金蛛]gi|13561984主要的壶腹状spidroin 1[Argiope aurantia]gi|13561976拖丝丝蛋白spidroin 2[棒络新妇蛛(Nephila clavata)]gi|16974791主要的壶腹状spidroin 2[Nephila senegalensis]gi|13562012主要的壶腹状spidroin 2[Nephila madagascariensis]gi|13562008主要的壶腹状spidroin 2[Latrodectus geometricus]gi|13562002按照另一个优选的实施方案,鞭形蛋白是SEQ ID NO6(Flag-N)和/或SEQ ID NO7(Flag-C)或其变体,其构成由本发明人衍生的新序列。
本文可以使用已知的并且公开的鞭形序列,具体如下鞭形丝蛋白部分cds[Nephila clavipes]gi|2833646鞭形丝蛋白部分cds[Nephila clavipes]gi|2833648在一个优选的实施方案中,重组的蜘蛛丝蛋白包含一个或多个合成的重复性序列,其包含一个或多个包含聚丙氨酸的共有序列。那些聚丙氨酸序列可以包含6-9个丙氨酸残基。见,例如SEQ ID NO1,包含几个6个丙氨酸残基的聚丙氨酸基序。
优选地,包含聚丙氨酸的共有序列衍生自ADF-3,并且具有SEQ IDNO3或其变体的氨基酸序列(组件A)。组件A包含具有6个丙氨酸残基的聚丙氨酸。衍生自ADF-4的包含另外的优选的聚丙氨酸的共有序列是组件C(SEQ ID NO5),其包含8个丙氨酸残基。
按照另一个优选的实施方案,在本发明的重组蜘蛛丝蛋白中,合成的重复序列衍生自ADF-3并且包含SEQ ID NO4(组件Q)或其变体的氨基酸序列的一个或多个重复序列。
更通常地,合成的重复序列还可以包含一般基序GGX或GPGXX,即富含甘氨酸的区域。如上提及,这些区域将给蛋白质提供柔性并且因此给形成自包含所述基序的重组蜘蛛丝蛋白的线提供柔性。
要注意的是,本发明的合成性重复序列的具体组件还可以彼此组合,即组合A和Q的组件(重复单位),组合Q和C的组件等也包括在本发明中。尽管没有局限被引入蜘蛛丝蛋白的组件的数量,优选的是对每个重组蛋白使用许多合成的重复序列,所述数量优选地在5-50个组件,更优选地在10-40个和最优选地在15-35个组件范围内。
所述合成的重复性序列优选地包含一个或多个(AQ)和/或(QAQ)作为重复单位。甚至更优选的是,所述合成的重复性序列是(AQ)12,(AQ)24,(QAQ)8或(QAQ)16。
只要合成的重复性序列衍生自ADF-4,其可以优选地包含如上提及的SEQ ID NO5(组件C)或其变体的氨基酸序列的一个或多个重复序列,其中总的合成的重复性序列是C16或C32。
本发明的完整重组蜘蛛丝蛋白的优选实施方案是(QAQ)8NR3,(QAQ)16NR3,(AQ)12NR3,(AQ)24NR3,C16NR4和C32NR4,即包含所述序列或由其组成的蛋白质。
要注意的是,上述合成的重复性序列的构型(使用A,Q和C系统)还应用于上述公开的所有其它的重复单位,例如,可以将所有的包含聚丙氨酸的序列作为A和/或C,并且可以将所有的富含甘氨酸的序列作为Q。
衍生自鞭形序列的用于合成的重复性序列的新组件是组件K(SEQ IDNO35和36),sp(SEQ ID NO37和38),X(SEQ ID NO39和40),和Y(SEQ ID NO41和42)所述合成的重复性序列还优选地包含Y8,Y16,X8,X16,K8,K16或由其组成。
此外,还可能的是,将衍生自ADF-3和ADF-4的那些序列和Flag组合在一个重组序列中。
如上所释,本文公开的氨基酸序列并不局限于在SEQ ID Nos中提供的确切序列。本文指出的氨基酸序列还包含变体。因此,本发明的蛋白质的氨基酸序列还包含通过氨基酸插入、缺失和取代而不同于本文公开的序列的所有序列。
优选地,氨基酸“置换(substitution)”是一种氨基酸被具有类似结构和/或化学性质的另一种氨基酸取代,即保守性氨基酸取代的结果。氨基酸置换可以在涉及的残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性性质的类似性基础上进行。例如,非极性(疏水)氨基酸包括,丙氨酸,亮氨酸,异亮氨酸,缬氨酸,脯氨酸,苯丙氨酸,色氨酸和甲硫氨酸;极性中性氨基酸包括甘氨酸,丝氨酸,苏氨酸,半胱氨酸,酪氨酸,天冬酰胺和谷氨酰胺;带正电荷(碱性)氨基酸包括精氨酸,赖氨酸和组氨酸;带负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。
“插入”或“缺失”典型地在约1-5个氨基酸,优选地约1,2或3个氨基酸范围内。氨基酸添加典型地不超过100,优选地不超过80,更优选地不超过50,最优选地不超过20个氨基酸,其添加在本发明的蛋白质上和/或插入其中。注意到本发明仅意欲那些添加,其不会对本文公开的蛋白质需要的性质具有不利影响。
通过使用重组DNA技术系统进行蛋白质中的氨基酸的插入、缺失或置换并评估得到的重组变体的活性来实验性地确定容许的变化。这不需要本领域技术人员进行超出常规的实验。
按照第二个方面,本发明涉及编码如上公开的重组蜘蛛丝蛋白的核酸序列。编码优选的蛋白质的优选序列是SEQ ID NO12(ADF-3),13(ADF-4),14(NR3),15(NR4),16(FLAG-NT),17(FLAG-CT),32(FlagN-NR),34(FlagC-NR)。
本发明还包括那些核酸的变体。将这些变体每个被限定为与SEQ IDNO12-17,32和34的序列比较,具有一个或多个取代,插入和/或缺失,在所述变体在适度严格条件下与包含SEQ ID NO12-17,32和34的序列的核酸杂交的条件下,或在所述变体包含由于遗传密码子的简并性所造成的核酸变化的条件下,其编码与SEQ ID NO12-17,32和34的核酸序列相同或功能上等价的氨基酸。
术语“核酸序列”指这些核苷酸的杂聚物或这些核苷酸的序列。术语“核酸”和“多核苷酸”在本文交互地使用来指核苷酸的杂聚物。
杂交的严格性,用于本文时,指这样的条件,在所述条件下,所述多核苷酸双链体是稳定的。如本领域那些技术人员已知的,双链体的稳定性是钠离子浓度和温度的函数(见,例如Sambrook et al.,Molecular CloningALaboratory Manual 2ndEd.(Cold Spring Harbor Laboratory,(1989))。用于杂交的严格性水平可以容易地由本领域那些技术人员来改变。
用于本文时,短语“适度严格条件”指这样的条件,其容许DNA结合于互补核酸,所述互补核酸与所述DNA具有约60%的同一性,优选地约75%的同一性,更优选地约85%的同一性;其中与所述DNA大于约90%的同一性是尤其优选的。优选地,适度严格条件是这样的条件,其等价于在50%甲酰胺,5×Denhart′s溶液,5×SSPE,0.2%SDS中于42℃进行杂交,随后在0.2×SSPE,0.2%SDS,于65℃进行洗涤。
按照第三个方面,提供包含上述提及的核酸的载体。优选地,提供包含所述核酸的表达载体。该表达载体优选地包含一个或多个调节序列。术语“表达载体”通常指从DNA(RNA)序列表达多肽/蛋白质的质粒或噬菌体或病毒或载体。表达载体可以包含转录单位,其包含(1)遗传元件或在基因表达中具有调节作用的元件,例如启动子或增强子,(2)被转录成mRNA并翻译成蛋白质的结构或编码序列,和(3)适合的转录起始和终止序列的组合。倾向于用在酵母或真核生物表达系统中的结构单位优选地包括能够使宿主细胞胞外分泌翻译的蛋白质的前导序列。备选地,当在无前导或转运序列的情况下表达重组蛋白时,其可以包括氨基端甲硫氨酸残基。随后该残基可以或可以不从表达的重组蛋白上裂解来提供最终的产物。
按照优选的实施方案,所述载体是质粒或病毒载体,其优选地是杆状病毒载体系统或痘苗病毒载体系统。还可以在本发明中使用另外的病毒载体系统。根据不同的情况,可能需要对载体进行修饰。另外的病毒载体的实例是腺病毒和所有的负链RNA-病毒,例如狂犬病毒,麻疹病毒,RSV,等。
按照优选的实施方案,所述载体是如在图6中或在SEQ ID NO55中所显示的克隆载体pAZL,或如上定义的其变体。该载体显示下列性质和优势1.高扩增(比其它克隆载体更高)2.容许合成基因的受控的和连续的构建(已知没有其它的载体提供这种能力)。
本发明的第四个方面包含宿主,其已经用如上定义的载体进行了转化。
所述宿主可以是原核生物细胞。在这种情况下,优选大肠杆菌(E.coli)或枯草芽孢杆菌(Bacillus subtilis)。
此外,宿主可以是真核细胞,优选地哺乳动物细胞,植物细胞,酵母细胞或昆虫细胞。
所述哺乳动物细胞优选地是CHO,COS,HeLa,293T,HEH或BHK细胞。
还优选使用酵母细胞作为宿主细胞,其优选地是酿酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),巴斯德毕赤酵母(Pichia pastoris),白色念珠菌(Candida albicans)或多形汉森酵母(Hansenula polymorpha)。
作为昆虫细胞,可以优选使用鳞翅目(Lepidoptera)昆虫细胞,更优选使用来自Spodoptera frugiperda和来自粉夜蛾(Trichoplusia ni)的细胞。最优选地,所述昆虫细胞是Sf9,Sf21或高效(high five)细胞。
昆虫细胞表达系统,例如相对于细菌系统的一个优势在于这样的事实,即产生的蛋白质被糖基化,由此作为微生物降解的靶标。这种性质例如在药物领域,只要丝蛋白质倾向于其中需要生物降解的体内应用,可能是重要的。该性质可以特别应用在缝线材料和伤口闭合和覆盖系统中。
当宿主是植物细胞时,植物细胞优选地来自烟草、马铃薯、玉米和西红柿。
按照第五个方面,提供聚集蜘蛛丝蛋白的方法,其包括下列步骤a)制备包含如上定义的非取向的(unoriented)蜘蛛丝蛋白的蛋白质溶液;b)使在a)中制备的溶液暴露于聚集引发物;和c)回收沉淀的蜘蛛丝蛋白。
优选地,通过用本文公开的载体或核酸转化如上定义的适合的宿主,并且在适合的条件下表达所述蜘蛛丝基因来产生用在步骤a)中的蜘蛛丝蛋白。
所述聚集引发物优选地选自优选地到约1的pH的酸化,磷酸钾和优选地旋转所述蛋白质溶液并应用切应力的机械应力。引发步骤证实是对于进行本发明的方法所必需的。
本发明人令人惊奇地显示,特别地,上述提及的引发因素增加了蜘蛛丝蛋白的聚集,这特别地从工业观点来看极为理想的。与此有关的参考见下面的“结果”章节,其中这些引发因子对本发明的重组蜘蛛丝蛋白的影响被解释如下每种引发因素的影响可以在本发明的不同的重组蜘蛛丝蛋白之间变化,然而可以被视为一般概念的是,那些引发因素在体外显示对所有的包含本发明的成分,即重复和/或非重复的区域的重组蛋白的意料外的高度影响。此外,其可以衍生自本文提供的结果,即不仅单一的引发因素,而且那些因素的组合可以导致本发明的聚集蜘蛛丝蛋白的最佳方式。
然而,应该注意的是该方法不局限于本发明的蜘蛛丝蛋白质,其还可以用于无论是天然存在还是合成的所有的其它可获得的蜘蛛丝蛋白。
所述方法还优选地包含通过适合的方法将在步骤a)中制备或在c)中回收的所述蛋白纺丝为丝,纳米纤维和线的步骤。
为此目的,可以使用本身为本领域已知的纺丝方法。例如,蜘蛛丝蛋白的粘稠物溶液通过吐丝器挤压形成生物丝。得到的生物丝可以被牵引或伸长。只要分子的晶体和非晶形排列存在于生物丝中,牵引或伸长将施加足以使分子定向使它们更加平行于丝壁的切应力并增加生物丝的拉伸强度和韧性。
粘稠物溶液可以包含衍生自一种或多种蜘蛛物种的本发明的重组丝蛋白和/或真正的丝蛋白,或衍生自不同产丝种属的丝蛋白,例如衍生自蜘蛛和B.mori的丝蛋白的混合物。在大多数优选的实施方案中,所述的丝蛋白是来自N.clavipes或A.diadematus的拖丝的丝和/或鞭形的丝,尤其是蛋白MaSpI,MaSpII,ADF-3,和ADF-4和Flag。在备选实施方案中,粘稠物溶液包含丝蛋白和一种或多种合成聚合物或天然或合成生物丝蛋白的混合物。
优选地,粘稠物溶液是至少1%,5%,,10%,15%重量/体积(w/v)丝蛋白。更优选地,所述粘稠物溶液是多到20%,25%,30%,35%,40%,45%,或50%w/v的丝蛋白。在优选的实施方案中,粘稠物溶液包含基本纯的蜘蛛丝蛋白。在优选的实施方案中,粘稠物具有约6.9的pH。
所谓“粘稠物溶液”指包含丝蛋白的任何液体混合物,并且易于挤压来形成生物丝或薄膜铸塑。除了蛋白质单体之外,粘稠物溶液还可以包含更高级的团聚体,其包括,例如二聚体,三聚体和四聚体。通常,粘稠物溶液是pH 4.0-12.0的水溶液并具有少于40%的有机或离液序列高的试剂(w/v)。优选地,所述粘稠物溶液不包含任何有机溶剂或离液序列高的试剂,但是可以包括添加剂来增加溶液的防腐性、稳定性或可使用性。
至于“丝”,是指不确定长度的纤维,范围从纳米等级和极微的长度到一英里或更长的长度。丝(silk)是天然的丝,同时尼龙和聚酯作为合成丝的实例。
关于怎样纺织(spin)蜘蛛丝蛋白纤维的另外的信息可以见于WO03060099(Karatzas et al.),其公开于2003年7月24日,将其并入本文作为参考。
此外,本发明的蜘蛛丝蛋白可以作为薄膜等进行提供,即作为对于其不需要纺丝步骤的蜘蛛丝蛋白产物进行提供。
关于制备薄膜的方法的更详细的描述参考实施例章节。
另外,本发明的方法可以优选地在步骤a)和/或c)中包括纯化方法,所述方法包括使被表达的蜘蛛丝蛋白暴露于在60-90,优选地在70-80℃的热变性,随后添加600-1400mM,优选地800-1200mM的硫酸铵。
如已经在上面解释,本文定义的蛋白质/线可以用在生物技术和/或药物的领域中,优选地用于制备伤口闭合或覆盖系统,用在神经外科手术或眼科外科手术的缝线材料中。
此外,蛋白质/线可以优选地用于制备替代材料,优选地人造软骨或腱材料。
另外,本发明的线/纤维可以用于制备医学装置诸如医学粘附带,皮肤移植物,替代的韧带,和外科手术网眼;和用于制备广泛范围的工业和商业产品诸如衣服织物,防弹衣衬里,容器织物,包或钱包带,缆,绳,粘附性结合材料,非粘附性结合材料,皮带材料,汽车覆盖物和部件,飞行器构建材料,抗风化材料,柔性分割材料,运动设备;和事实上需要高拉伸强度和弹性特性的纤维或织物的几乎任何应用中。本发明还意欲以其它形式存在的稳定的纤维产品,诸如干的喷雾涂层,珠子样颗粒的适应性和应用,或在与其它的组合物的混合物中的应用。
要清楚地注意到本发明的蜘蛛丝蛋白的最优选的应用是制备和加工衣服织物(纺织品)和皮革,汽车覆盖物和部件,飞行器构建材料以及制备和加工纸。
本发明的重组蜘蛛丝蛋白可以添加到纤维素和角蛋白和胶原蛋白产物,并且因此,本发明还涉及包含纤维素和/或角蛋白和/或胶原蛋白和蜘蛛丝蛋白的纸或皮肤护理和头发护理产品。其中结合了本发明的蛋白的纸和皮肤护理和头发护理产品显示改善的特性,具体而言提高的拉伸强度或抗撕裂强度。
此外,还可以将本发明的重组蜘蛛丝蛋白用作纺织品和皮革制品的涂层,由此赋予被涂布的产品以稳定性和耐久性。丝蛋白特别显示对于涂布皮革制品的应用性,并且因此,鞣革及其对环境的负作用可以避免或至少减少。
除非另外指出,本文所用的所有的技术和科学术语与本发明所属领域的普通技术人员公知的具有相同的含义。将所有的出版物,专利申请,专利,和本文提及的其它的参考文献全部内容并入本文作为参考。如有冲突,本说明书,包括定义将进行控制。此外,所述材料,方法和实施例仅是举例说明性的,而不倾向于限制。
现在,本发明还通过实施例和附图进行举例说明,所述附图显示如下

图1构建合成的蜘蛛丝基因的克隆策略。(A)克隆盒包含组件多聚化所需要的限制酶切位点(BsgI和BseRI)和切除组合的基因所需要的限制酶切位点(NcoI,BamHI,HindIII)。在基因构建过程中,间隔区域被组件和组件多聚体所替代。(B)通过连接两个适合的质粒片段来实现两个组件的定点连接。重新构建载体的氨苄青霉素抗性基因(Apr)。(C)将连接两个组件所需要的核苷酸限定在每个组件的第一个密码子中。(D)组件多聚体象单一组件一样连接,导致了合成基因的受控制的装配。(E)被设计的丝组件的氨基酸序列衍生自拖丝的丝蛋白ADF-3和ADF-4。
图2蜘蛛丝蛋白的分析。(A)在用抗-T7-标记抗体进行蛋白质印迹后检测重组丝蛋白的T7-标记。(B)将蛋白质进行SDS-PAGE,随后进行银染。由于(AQ)12和(QAQ)8的弱染色,图像的对比度通过电子仪器被增加。(C)分别用280nm(直线)或295nm(虚线)的激发波长显示纯化的C16NR4的荧光发射光谱。
图3蜘蛛丝蛋白的二级结构和温度转变。(A)在20℃记录rep-蛋白质(直线),repNR-蛋白质(虚线)和NR-蛋白质(长虚线)的CD-光谱。(B)当将合成的丝蛋白加热到90℃(直线),随后冷却到20℃(虚线)时,在220nm测量可溶性蜘蛛丝蛋白的平均残基重量(MRW)的椭圆度。
图4合成的蜘蛛丝蛋白的聚集。在缓冲液中,在存在300mM NaCl或300mM KCl的情况下,在pH1的情况下,或在存在300mM磷酸钾的情况下,温育1小时后,确定蛋白质的聚集。衍生自ADF-3的蛋白质的棒条浅灰色;衍生自ADF-4的蛋白质的棒条深灰色。
图5构建合成的鞭形蜘蛛丝基因的克隆策略(见,图1)。将单一组件连接于同型-多聚体(a)以及异型-多聚体(b)。(c)显示衍生自Nephilaclavipes的鞭形丝蛋白(Flag)的被设计的鞭形丝组件的氨基酸序列。
图6显示载体pAZL的限制性酶切图谱。
图7蜘蛛丝蛋白的装配形式。(A)通过扫描电镜(SEM)观察的由C16形成的球体。(B)通过原子力显微镜观察的由C16NR4形成的纳米纤维(高度信息)。(C,D)通过SEM研究由(AQ)24NR3形成的微纤维(C)。对于切割纤维并随后观察截面,使用聚焦的Ca+离子束(D)。(E)产生自(AQ)24NR3溶液的泡沫。(F)产生自C16NR4溶液的泡沫。(G)由C16NR4纳米纤维形成的交联的凝胶。
图8合成丝蛋白(AQ)24NR3和C16的CD-光谱,所述合成丝蛋白(AQ)24NR3和C16溶解在6M硫氰酸胍,随后针对5mM磷酸钾pH 8.0进行透析(直线)或溶解在HFIP中(虚线)。
图9从在HFIP中的2%w/v C16溶液中铸塑的C16薄膜。
图10制备自(AQ)24NR3和C16的蛋白质薄膜的CD-光谱。薄膜直接在单色(plain)石英玻璃上,从在HFIP中的蛋白质溶液中进行铸塑,并通过CD-光谱学进行分析(虚线)。随后用1M的磷酸钾来处理薄膜并再次进行分析。由于在确定薄膜的厚度上的误差,不能确定□θMRW。
图11从HFIP溶液中铸塑并用磷酸钾处理的C16薄膜的修饰。(A)当使用EDC来活化(+)C16的羧基基团时,仅发生荧光素(黄色)的有效偶联。与此相对,在没有EDC激活的情况下(-),仅有少量荧光素结合于薄膜。(B)使用X-Gal作为底物,检测偶联的β-半乳糖苷酶的活性。蓝色沉淀物的发生指示仅在用EDC活化的薄膜上具有酶活性(+),而未活化的薄膜仅显示残余的酶活性(-)。
图12C16纳米纤维的AFM图像。
图13C16纳米纤维制备的水凝胶。
图14交联的和非交联的水凝胶在10mg/ml浓度上的应力/张力表现。
图15对于在20mg/ml浓度的交联的和非交联的纤维网络的取决于恢复模量(G′)和损失模量(G″)的频率。
图16对于交联的和非交联的水凝胶,取决于在0.5Hz频率上的恢复模量的浓度。两种网络具有与浓度的平方[c]2成比例的恢复模量。
实施例实验方法材料.如果没有另外指出,化学品获自Merck KGaA(Darmstadt,德国)。如前所述(19)进行DNA的操作和修饰。限制性酶获自New England Biolabs(Beverly,MA,USA),连接酶获自Promega Biosciences Inc.(San Luis Obispo,CA,USA)。使用来自Qiagen(Hilden,德国)的试剂盒来进行DNA纯化。合成的寡核苷酸获自MWG Biotech AG(Ebersberg,德国)。所有的克隆步骤在来自Novagen(Madison,WI,USA)的大肠杆菌菌株DH10B中进行。
克隆载体pAZL的构建。通过使两个合成的寡核苷酸CC1(GATCGAGGAGGATCCATGGGACGAATTCACGGCTAATGAAAGCTTACTGCAC)(SEQ ID NO18)和CC2(AGCTGTGCAGTAAGCTTTCATTAGCCGTGAATTCGTCCCATGGATCCTCCTC)(SEQ ID NO19)退火来产生具有黏性末端的克隆盒,所述黏性末端互补于由BgIII和HindIII产生的那些。通过将50pmol/μl(每种)寡核苷酸溶液的温度以0.1℃/s的微量从95℃减少到20℃来完成退火。错配的双链在70℃变性,随后减少到20℃。在重复20℃-70℃-20℃循环10次后,以65℃的变性温度进行另外的循环。将得到的克隆盒与用BgIII和HindIII消化的pFastbacl载体(Invitrogen,Carlsbad,Califomia,USA)进行连接。在此克隆步骤后,两个限制性酶识别序列被破坏。将得到的新的克隆载体称为pAZL。
将丝组件和NR-区域克隆到pAZL载体中。在考虑细菌密码子选择的情况下,将衍生自拖丝的丝蛋白ADF-3和ADF-4的三个氨基酸组件(图1E)回译为DNA序列。如上所述,来合成相应的互补DNA寡核苷酸A1(TCCGTACGGCCCAGGTGCTAGCGCCGCAGCGGCAGCGGCTGGTGGCTACGGTCCGGGCTCTGGCCAGCAGGG)(SEQ ID NO20)和A2(CTGCTGGCCAGAGCCCGGACCGTAGCCACCAGCCGCTGCCGCTGCGGCGCTAGCACCTGGGCCGTACGGACC)(SEQ ID NO21),Q1(TCCGGGCCAGCAGGGCCCGGGTCAACAGGGTCCTGGCCAGCAAGGTCCGGGCCAGCAGGG)(SEQ ID NO22)和Q2(CTGCTGGCCCGGACCTTGCTGGCCAGGACCCTGTTGACCCGGGCCCTGCTGGCCCGGACC)(SEQ ID NO23),C1(TTCTAGCGCGGCTGCAGCCGCGGCAGCTGCGTCCGGCCCGGGTGGCTACGGTCCGGAAAACCAGGGTCCATCTGGCCCGGGTGGCTACGGTCCTGGCGGTCCGGG)(SEQ ID NO24)和C2(CGGACCGCCAGGACCGTAGCCACCCGGGCCAGATGGACCCTGGTTTTCCGGACCGTAGCCACCCGGGCCGGACGCAGCTGCCGCGGCTGCAGCCGCGCTAGAACC)(SEQ ID NO25)并对其进行退火,将其与用BsgI和BseRI消化的pAZL载体连接。使用下列引物通过PCR扩增蜘蛛丝基因adf-3(gi|1263286)和adf-4(gi|1263288)(获自Prof.Gosline,Vancouver,Canada)的NR-区域NR3f(GAAAAACCATGGGTGCGGCTTCTGCAGCTGTATCTG)(SEQ IDNO26),NR3r(GAAAAGAAGCTTTCATTAGCCAGCAAGGGCTTGAGCTACAGATTG)(SEQ ID NO27),NR4f(GAAAAACCATGGGAGCATATGGCCCATCTCCTTC)(SEQ ID NO28)和NR4r(GAAAAGAAGCTTTCATAGCCTGAAAGAGCTTGGCTAATCATTTG)(SEQ ID NO29)。
对于Flag序列,可以使用下列引物和盒PCR-引物FLAG-N-chr-有义(SEQ ID NO43)5’-GAAAAACCATGGGCGAAAGCAGCGGAGGCGAT-3’FLAG-N-chr-反(SEQ ID NO44)5’-GAAAAGAAGCTTTCATTAGCCTGGGCTGTATGGTCC-3’FLAG-C-chr反义(SEQ ID NO45)5’-GAAAAACCATGGGTGCTTATTAtCCTAGCTCGC-3’FLAG-C-chr-反(SEQ ID NO46)5’-GAAAAGAAGCTTTCATTAGCCATAAGCGAACATTCTTCCTAC-3’产生盒的重复序列的寡核苷酸组件Y-(GPGGX)-ds(SEQ ID NO47)5’-TCCGGGCGGTGCGGGCCCAGGTGGCTATGGTCCGGGCGGTTCTGGGCCGGGTGGCTACGGTCCTGGCGGTTCCGGCCCGGGTGGCTACGG-3’组件Y-(GPGGX)-cs(SEQ ID NO48)
5’-GTAGCCACCCGGGCCGGAACCGCCAGGACCGTAGCCACCCGGCCCAGAACCGCCCGGACCATAGCCACCTGGGCCCGCACCGCCCGGACC-3’组件sp-(间隔区)-ds(SEQ ID NO49)5’-TGGCACCACCATCATTGAAGATCTGGACATCACTATTGATGGTGCGGACGGCCCGATCACGATCTCTGAAGAGCTGACCATCGG-3’组件sp-(间隔区)-cs(SEQ ID NO50)5’-GATGGTCAGCTCTTCAGAGATCGTGATCGGGCCGTCCGCACCATCAATAGTGATGTCCAGATCTTCAATGATGGTGGTGCCACC-3’组件K-(GPGGAGGPY)-ds(SEQ ID NO51)5’-TCCGGGCGGTGCTGGCGGTCCGTACGGCCCTGGTGGCGCAGGTGGGCCATATGGTCCGGGCGGTGCGGGCGGTCCGTACGG-3’组件K-(GPGGAGGPY)-cs(SEQ ID NO52)5’-GTACGGACCGCCCGCACCGCCCGGACCATATGGCCCACCTGCGCCACCAGGGCCGTACGGACCGCCAGCACCGCCCGGACC-3’组件X-(GGX)-ds(SEQIDNO53)5’-TGGCGCTGGTGGCGCCGGTGGCGCAGGTGGCTCTGGCGGTGCGGGCGGTTCCGG-3’组件X-(GGX)-cs(SEQ ID NO54)5’-GGAACCGCCCGCACCGCCAGAGCCACCTGCGCCACCGGCGCCACCAGCGCCACC-3’在用NcoI和HindIII消化后,连接PCR产物和pAZL载体。克隆合成的组件和PCR产物导致取代克隆的盒间隔区,保持其元件的排列。对于更有效的翻译,使用PCR诱变(79)将NR3和NR4中的极少在大肠杆菌中翻译的密码子AGA(精氨酸)突变为CGT(精氨酸)。
合成的物蛛丝基因的构建。连接两个基因片段,例如单组件,组件多聚体或NR-区域代表克隆策略的基本步骤。为此目的,将包含指定得到5′-端基因片段的pAZL载体用Bsal和BsgI消化,同时分别用BseRI和BsaI消化包含3′-端基因片段的载体(图1B)。适合的质粒片段的连接产生了两个基因片段的连接并导致促进鉴定正确的构建体的pAZL载体的氨苄青霉素抗性基因(Apr)的重构。
对于基因构建,首先将单一组件连接从而产生重复单位(图1D+图5)。这些被逐渐多聚化并任选地连接以NR-区域。最终,用BamHI和HindIII将合成的基因构建体以及NR-区从pAZL载体上切除下来,并连接以以同样方式消化的细菌表达载体pET21a(Novagen),提供T7-标记(MASMTGGQQMGR)(SEQ ID NO30)编码序列(20)。通过DNA测序来证实所有的构建体的忠实性。
基因表达。所有的丝基因在大肠杆菌菌株BLR[DE3](Novagen)中进行表达。将细胞于37℃在LB培养基中培养到OD600=0.5。在用1mM IPTG(异丙基-β-D-硫代半乳糖苷)诱导前,分别对于(AQ)12,(AQ)12NR3,(QAQ)8,和(QAQ)8NR3,将细胞变化到30℃,对于C16,C16NR4,NR3和NR4,将细胞变化到25℃。备选地,使用复合培养基(21)和补料分批技术(22),将细胞在发酵罐中培养到OD600=40-50。此外,在用1mM IPTG诱导前,分别将细胞变化到25℃或30℃。在诱导3-4小时后,收集表达(AQ)12,(AQ)12NR3,(QAQ)8,(QAQ)8NR3,C16和C16NR4的细胞,而在诱导后16小时收集表达NR3和NR4的细胞。
蛋白质纯化。将细胞用包含20mM N-(2-羟乙基)哌嗪-N′-(2-乙磺酸)(HEPES)pH7.5,100mM NaCl,0.2mg/ml溶菌酶(Sigma-Aldrich,St.Louis,MO,USA)的5ml/g的缓冲液重悬,并在4℃温育30分钟。使用HD/UW2200/KE76超声发生器(Bandelin,Berlin,德国)通过声波振荡裂解细胞,并通过用0.1mg/ml脱氧核糖核酸酶I(Roche,Mannheim,德国)和3mM的MgCl2在4℃温育细胞裂解物60分钟来消化基因组DNA。于50,000xg和4℃沉淀不可溶的细胞片段30分钟。通过在80℃热变性20分钟,来将包含(AQ)12,(AQ)12NR3,(QAQ)8,(QAQ)8NR3,C16和C16NR4的裂解物的可溶性大肠杆菌蛋白质沉淀下来,而将包含NR3和NR4的裂解物加热到70℃达相同的时间长度。通过在50,000xg的30分钟的沉淀来去除沉淀的蛋白质。将在热变性过程中仍旧可溶的丝蛋白用20%硫酸铵(800mM)((AQ)12,(AQ)12NR3,(QAQ)8,(QAQ)8NR3,C16和C16NR4)或30%硫酸铵(1200mM)(NR3和NR4),于室温进行沉淀,并在10,000xg离心10分钟进行收集。用包含与用于沉淀时相同的浓度的硫酸铵的溶液来漂洗(AQ)12,(AQ)12NR3,(QAQ)8,(QAQ)8NR3,NR3和NR4的沉淀物并将其溶解在6M的氯化胍(GdmCl)中。与此相反,用8M尿素来洗涤C16和C16NR4,并将其溶解在6M硫氰酸胍(GdmSCN)中。针对10mM NH4HCO3来透析所有的蛋白质。通过在50,000xg沉淀30分钟来去除在透析过程中形成的沉淀物并将余下的可溶性丝蛋白冻干。在分析前,将冻干的蛋白质溶解在6M GdmSCN中,随后进行针对适合的缓冲液的透析。通过在125,000xg沉淀30分钟去除团聚体。使用计算的消光系数(表1)(23),在1cm通径长的比色杯中于276nm通过光度法确定蛋白质的浓度。通过十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE;对于>20kDa的蛋白质,10%Tris-甘氨酸凝胶,对于<20kDa的蛋白质,10-20%Tris-麦黄酮(Tricine)凝胶(Invitrogen)),随后在聚偏氟乙烯(PVDF)膜(Millipore,Billerica,MA,USA)上进行印迹法并使用小鼠抗-T7单克隆抗体(Novagen,110,000)作为一抗,使用抗-小鼠IgG过氧化物酶缀合物(Sigma-Aldrich,15,000)作为二抗来证实鉴定的蛋白质。使用来自Amersham Biosciences(Piscataway,NJ,USA)的ECLplus蛋白质印迹检测试剂盒观察过氧化物酶的活性。
荧光.在FluoroMax分光荧光计(Jobin Yvon Inc,Edison,NJ,USA)上记录荧光光谱。在室温,使用在10mM Tris(羟甲基)氨基甲烷(Tris)/HCl(pH8.0)中的100μg/ml蛋白质浓度来记录光谱。整合时间是1s,步长(step size)是0.5nm,带宽分别是5nm(激发)和5nm(发射)。
二级结构分析.使用装备了温度控制装置(Jasco International Co.Ltd.,Tokyo,日本)的Jasco 715分光偏振仪来获得Far-UV园二色性(CD)光谱。于20℃,在0.1cm通径长的石英比色杯中,以在5mM Tris/HCl(pH8.0)中的150μg/ml蛋白质浓度记录所有的光谱。扫描速度是20nm/min,步长是0.2nm,整合时间设定为1s,带宽是1nm。将四次扫描平均,并用缓冲液校正。
在220nm,以1℃/分的加热/冷却变化来分析热转化。
溶解度测定.
为了确定可溶性蛋白质的最大浓度,使用10,000Da分子量的截留值的聚醚砜膜(Vivascience AG,Hannover,德国)通过超滤作用来浓缩在10mM Tris/HCl pH8.0中的1mg/ml(=0.1%(w/v))溶液。以不同的间隔,从溶液中取出样品直到蛋白质开始沉淀。在10mM Tris pH8.0中稀释样品来通过光度法来确定蛋白质浓度。
聚集测定.将所有的样品在10mM Tris/HCl pH8.0中调节到1mg/ml。为了测试离子对丝蛋白聚集的影响,将盐添加到300mM的最终浓度。通过将HCl添加到100mM的最终浓度(pH=1)来研究酸化的作用。将所有的样品在室温温育1小时。将蛋白质沉淀物通过在125,000xg沉降25分钟,从所有的样品中去除,通过光度法确定剩余的可溶性蛋白的量。由于可溶性和聚集的蛋白质的总量必须等于开始的可溶性蛋白的量,可以通过将可溶性蛋白的量从开始使用的蛋白质的量中扣除来计算聚集的蛋白质的百分比。
结果设计丝样蛋白的克隆策略.真正的蜘蛛丝基因在细菌宿主中的表达是不充分的(24),因为一些基因部分包含在细菌中不能有效翻译的密码子。此外,由于丝的重复性质,通过PCR进行基因操作和扩增的是困难的。为了研究蜘蛛丝蛋白的性质,使用具有适应于相应的表达宿主的密码子选择的合成的DNA组件来应用克隆策略。获得编码与蜘蛛丝的重复区域相似的蛋白质的合成基因(25-28)。重要的是,这些蛋白质设计中没有一个包括在所有的拖丝的丝中发现的羧基端的NR-区。
发明人开发了容许不同的合成DNA组件以及真正的基因片段的受控制的组合的连续的克隆策略(29)。设计包含克隆盒和限制性酶识别位点BseRI和BsgI的克隆载体pAZL(图1A),所述克隆盒具有间隔区,其充当合成基因的占位符。因为这些酶的识别和裂解位点是8(BseRI)或12(BsgI)核苷酸间隔(apart),翻译起始和终止密码子以及切除组装的基因所需要的另外的限制酶切位点可以在位置上邻近于间隔区。
在第一个克隆步骤中,pAZL的间隔区被合成的DNA组件所取代(见下面的组件设计)。随后,可以以定点的方式连接两个组件(见材料和方法以及图1B)。将通过用BsgI和BseRI裂解产生的互补的3′-单链延伸GG(有义)和CC(反义)用于连接两个组件(图1C)。因此,将连接两个组件所需要的DNA序列限制到甘氨酸密码子(GGX)。甘氨酸天然在蜘蛛丝蛋白中是丰富的(~30%),因此,可以在不需要搜索限制性核酸内切酶识别位点的情况下设计组件,其在翻译后,匹配真正的氨基酸序列。因为在克隆和多聚化后,克隆盒元件的排列保持不变,可以构建多种组件的组合(图1D)。
合成的蜘蛛丝的设计、合成和纯化.发明人选择来自园蛛十字园蛛的拖丝的丝蛋白ADF-3和ADF-4(3)作为合成构建体的模板。部分确定的ADF-3的一级结构主要由重复单位组成,其都包含包括聚丙氨酸基序的共有序列。通过改变基序GPGQQ的数量来确定个体重复单位的长度。为了模拟ADF-3的重复序列,我们设计了两个组件。一个组件,被称为A,来自包含聚丙氨酸的共有序列(图1E)。第二个组件被称为Q,包含GPGQQ基序的四个重复序列。为了研究不同长度的重复单位,将一个或两个Q组件组合以一个A组件以获得(AQ)或(QAQ)。将这些重复单位多聚化以产生用于编码重复蛋白质(rep-蛋白质)(AQ)12和(QAQ)8的合成基因。
ADF-4的重复部分通常由仅显示轻微变化的单一保守的重复单位组成。发明人将这些变化组合并设计一个被称为C的共有组件(图1E),发明人将所述共有组件多聚化以获得rep-蛋白C16。选择在所有的合成基因中的组件重复序列的数量来编码具有类似分子量(~50kDa)的蛋白质。
ADF-3和ADF-4在它们的羧基端都显示同源的NR-区,其分别包含124和109个氨基酸。通过PCR来扩增编码这些区域的基因序列,并通过定点诱变(见材料和方法)将对于细菌的表达存在问题的密码子改变为更适合的密码子。因此,所有的所用合成基因可以组合以适合的真正的NR-区,产生编码repNR-蛋白质(AQ)12NR3,(QAQ)8NR3和C16NR4的基因。另外,NR3和NR4可以单独表达。
细菌合成后,丝蛋白通过加热步骤随后进行硫酸铵沉淀来进行纯化。通过使用针对连接于所有的丝蛋白的氨基端末端的T7肽标记序列的抗体,通过免疫印迹法证实蛋白质的鉴定(图2A)。尽管所有的rep-蛋白质和所有的repNR-蛋白质具有类似的分子量(表1),当进行SDS-PAGE时,它们显示不同的迁移速度。这种效果可能是因为十二烷基硫酸盐由于不同的氨基酸组成,与蛋白质异常结合,使蛋白质净电荷变化而导致的。除了全长蛋白质,免疫印迹法显示在制备repNR-蛋白质中具有低分子量的痕量蛋白质的存在。抗T7-标记抗体与这些蛋白质的结合将它们鉴定为缺乏它们的羧基端末端部分的丝蛋白质。通过SDS-PAGE和银染分析每种纯化的蛋白质,在所有的蛋白质制备物中没有检测到另外的蛋白质(图2B)。另外通过测量荧光发射来确定蛋白质纯度。280nm波长的入射光导致酪氨酸和色氨酸的激发和荧光发射,而295nm的光专门激发后者。因为所设计的蜘蛛丝蛋白中没有一种包含色氨酸,在用295nm激发后荧光发射指示污染了大肠杆菌的蛋白质,其平均包含1.5%的色氨酸(30)。所有的丝蛋白制备物的荧光测量揭示与酪氨酸的光谱类似的发射光谱,其在丝蛋白中大量存在。与此相反,检测不到色氨酸荧光,显示蛋白质制备物的高纯度(在图2B中显示对于C16NR4的数据)。
在锥形瓶中进行的合成丝蛋白的细菌生产,对于所有的构建体产生了类似的蛋白质产量。个体制备物的产量在每升培养基10到30mg纯化的蛋白质的范围内。应用细胞发酵以研究高质量蛋白质合成的可能性。因此,(QAQ)8NR3和C16NR4的产量可以分别增加到140和360mg/l。RepNR-蛋白质由较差结构的重复区域和高度结构的非重复结构域组成。通过CD光谱学研究二级结构。Rep-蛋白质揭示对于内部无结构蛋白质的典型的光谱。与此相对,NR-蛋白质揭示指示高二级结构含量的光谱。这些区域似乎独立代表折叠的蛋白质结构域。repNR-蛋白质的光谱大致相应于按照它们在repNR-蛋白质中的分配加载的rep-和NR-光谱的组合。尽管在相互连接后,不能排除在rep-区域或NR-结构域中的微小结构变化,可能的是,repNR-蛋白质由大部分显示随机卷曲结构的区域和羧基端折叠蛋白质结构域组成。令人惊奇的是,repNR-蛋白质的光谱类似于获自直接提取自蜘蛛(Nephila clavipes)的主要壶腹状丝粘稠物的光谱(9)。
在热和化学变性后的丝蛋白质再折叠在加热后,通过CD-光谱学研究结构变化,没有观察到在20℃和90℃之间的对于rep-蛋白质的协同温度变化(31;32)(图3)。因为repNR-蛋白质至少是部分结构化的,应该在升高的温度上可检测到结构化区域的热伸展。因此,观察到协同的温度转变。温度转变的中点分别是67℃((QAQ)8NR3),66℃((AQ)12NR3)和72℃(C16NR4),(图3B和表1)。此外,所有的温度转变可以彻底逆转。加热后的结构变化的可逆性解释了在蛋白质纯化过程中应用加热步骤后的可溶性丝蛋白的高度恢复。因为Tris的良好光谱性质和不会促进丝蛋白质聚集的能力,将Tris用于缓冲通过CD光谱学研究的所有溶液。由于Tris缓冲溶液的强烈的温度依赖性,预期样品的pH在从20℃加热到90℃后,从pH8变化到pH6(19)。然而,在pH8的磷酸缓冲液中的丝蛋白的温度转变,显示温度与pK-值不相关,揭示尽管它们可能由于蛋白质聚集(见下)不可完全逆转,但具有相同的中点温度(数据未显示)。这指示丝蛋白的温度转变没有被温度诱导的在Tris-缓冲溶液中的pH的变化所影响。
通过在针对6M GuaHCl透析,和通过针对Tris缓冲液透析复性后测量在Tris缓冲液中的repNR-蛋白质的园二色性来研究化学变性和复性对二级结构的影响。开始和再折叠的蛋白质的相同的光谱指示化学变性是可逆的(数据未显示)。
通过它们的重复序列来确定丝蛋白的溶解度.为了获得在粘稠物中的高蛋白质浓度,丝蛋白必须是高度可溶的。我们测试了其中rep-和repNR-蛋白质仍旧可溶的最大浓度,来确定决定溶解度的一级结构元件。可以通过超滤到超过30%w/v来浓缩包含组件A和Q的所有蛋白质,而在不管是否存在NR-结构域的情况下不形成可见的团聚体。与此相对,可以分别仅将包含组件C的蛋白质浓缩到8%w/v(C16)和9%w/v(C16NR4)(表1)。两种蛋白质在进一步浓缩后形成凝胶样固体(数据未显示)。因此,丝蛋白的溶解度仅通过它们的重复序列来确定并且不被NR-结构域所影响。
不依赖它们的一级结构,钾不促进合成的丝蛋白的聚集.PH,离子,诸如钾和磷酸盐以及机械应力涉及天然丝装配。在本文,我们意欲研究这些因子怎样促进合成丝蛋白的装配。因为我们不能起始真正的装配过程,其需要如在液体结晶粘稠物中发现的涉及的蛋白质的预先定向(33),我们进行以不显示取向顺序的蛋白质溶液开始的聚集测定。当在缓冲液中温育时,测试的rep-,repNR-和NR-蛋白质没有一种显示明显的聚集(<5%),显示所有的蛋白质在测试条件下本质上是可溶的(图4)。为了研究添加离子是否通过离子强度的增加导致聚集,用氯化钠来温育蛋白质。然而,没有观察到任何聚集。与钠相反,已经报道了钾特异性地促进丝的聚集(34)。但是,氯化钾还显示对合成的丝蛋白的溶解度没有任何影响(图4)。
根据它们的一级结构,酸化和磷酸盐的添加促进了rep-蛋白质的聚集.在蜘蛛丝装配的过程中的酸化的精确功能尚未被确定。但是,似乎可能的是,带负电荷的基团(例如,磷酰基团)被质子化,由此减少蜘蛛丝蛋白的净电荷和排斥。因为合成的丝蛋白不包含显示在纺丝过程中观察到的pH-变化范围内的pKA-值的化学基团,发明人的目的是通过将所有的末端和侧链羧基基团进行质子化来模拟这种效果。仅显示末端羧基基团的(QAQ)8和(AQ)12,在pH1显示无聚集(<5%)和弱的聚集(18%)。有趣的是,对C16′的16个谷氨酸残基的质子化也仅导致了弱的聚集(8%)(图4)。已经描述了在纺丝过程中将磷酸盐添加到粘稠物中没有导致(QAQ)8的聚集和C16的弱的沉淀(12%)。与此相反,在用磷酸钾处理后,(AQ)12显示聚集的倾向增加(47%)。使用磷酸钠获得类似的结果,提示所述效果特异性地由磷酸盐离子所导致(数据未显示)。
NR-结构域增强对促进聚集的因子的反应为了研究NR-结构域的影响,测试了在低pH和在用磷酸盐处理后的repNR-蛋白质和NR-蛋白质的聚集。(QAQ)8NR3和(AQ)12NR3,以及NR3的酸化导致了弱的聚集(10%,15%和13%),其在由相应的rep-蛋白质所展示的范围内。有趣的是,尽管NR4-结构域在pH1没有沉淀(0%),C16NR4在pH1显示了强烈的聚集(70%)。因此,在酸化后没有明显聚集的重复的C16和NR4-结构域的组合,导致蛋白质对于这种聚集促进因子高度敏感。对于添加磷酸盐获得的了类似的结果。尽管NR3和NR4在存在磷酸盐的情况下,都未显示聚集(1%和0%),将NR-结构域添加到重复区域中导致了与rep-蛋白质相比,repNR-蛋白质的增加的聚集((QAQ)8NR357%,(AQ)12NR381%,C16NR480%)。
使用使DNA组件连续和受控装配的克隆策略,构建了编码蜘蛛丝样蛋白质的合成基因。蛋白质的设计产生了重复单位和天然存在的NR-区域的不同组合,以系统性测试这些单一一级结构元件的性质。由CD-光谱学进行的结构分析揭示了重复区域在它们的可溶状态时大部分是无结构的,显示了与其它内部伸展蛋白质共有的性质(31;32)。关于主要壶腹状成分的最大的部分已经提出了相同的构象状态(10),其中重复性蛋白质序列占优势。与此相反,发现NR-区域独立地代表折叠蛋白质结构域,其在热变性以及用离液序列高的试剂处理后采取它们的构象。因为它们与重复区域比较相对较小的大小,在repNR-蛋白质中对总的结构性质的影响很小。
在显示数百kDa的重复区域的天然蜘蛛丝中,可以预期NR-区域的结构贡献甚至更小,解释了关于它们在研究主要壶腹状成分中存在的证据缺失。因为repNR-蛋白质的热和化学变性的可逆性以及在该研究中显示的CD数据和获自天然丝粘稠物的CD数据的类似性,可以设想甚至在纯化和样品制备的过程中用热和离液序列高的试剂处理后,所有的在水溶液中的被研究的蜘蛛丝成分以与在粘稠物中的天然丝蛋白相当的构象状态存在。
按照Uversky等,可以基于它们的净电荷和平均亲水性来预期蛋白质的内部伸展。将蛋白质的净电荷用于计算“边界”亲水性。如果蛋白质的平均亲水性低于“边界”值,预期蛋白质是内部伸展的(35;36)。按照存在的结果,预期重复序列(QAQ)8和(AQ)12是内部伸展的(表1)。蛋白质的内部伸展意味着氨基酸残基与周围溶剂的相互作用,比与相同的或其它多肽链的氨基酸的相互作用更为有利。因此,(QAQ)8和(AQ)12甚至在高浓度也是可溶的。与此相反,C16显示稍高于边界值的亲水性。尽管仍然揭示了内部伸展的蛋白质的性质,多肽链之间的相互作用在高浓度变得更为有利,导致了蛋白质的聚集并导致了与(QAQ)8和(AQ)12比较更低的溶解度(表1)。
因为重复序列组成蜘蛛丝蛋白的最大部分,它们可能决定许多蛋白质的性质。因此,repNR-蛋白质的溶解度并未与rep-蛋白质的溶解度明显不同。(QAQ)8和(AQ)12的溶解度和计算的亲水性与真正的ADF-3的值良好相关(表1)。尽管C16并不具有ADF-4的高度固有不溶性,C16和ADF-4都显示了更低的溶解度。这种差异可以通过ADF-4与C16比较的更高亲水性和更低的净电荷来解释。
与重复区域相反,NR-结构域仅占蜘蛛丝蛋白的小部分。两种NR-结构域显示富含α-螺旋的结构。由于在ADF-3和ADF-4的NR-结构域之间的高度相似性(81%相似性和67%同一性),可以设想两者可能履行相关的功能。当在用已知体内诱导丝蛋白的装配的因子处理后,研究丝蛋白的聚集时,获得了关于NR-结构域的功能的进一步的信息。预期由丝蛋白的羧基基团的质子化减少负电荷主要影响包含C组件的蛋白质。因此,不包含天冬氨酸或谷氨酸,由组件A和Q组成的蛋白质显示弱聚集。C16甚至在其16个负电荷中和后仍旧保持大部分的可溶性。引人注目的是,不显示对其酸化的任何反应的NR4-结构域,和弱聚集的C16的组合导致了蛋白质对质子化的高度敏感。因此,对于有效聚集,需要重复区域的电荷减少和NR-结构域的存在。当将磷酸盐加入蛋白质溶液中时,获得了类似的结果。已知,磷酸盐象其它的易溶离子一样增加水的表面张力,促进疏水相互作用(37)。对于蜘蛛丝蛋白而言,可能的是,添加磷酸盐促进了在疏水的聚丙氨酸基序之间的相互作用,导致蛋白质的聚集。因此,(AQ)12的聚集比(QAQ)8的聚集要高,所述(QAQ)8包含的聚丙氨酸基序少于(AQ)12包含的聚丙氨酸基序的三分之一。C16显示最长和最高数目的聚丙氨酸基序,然而在磷酸盐处理后没有显示最强的聚集。关于这种意外的结果的可能的解释是带负电荷的谷氨酸侧链和磷酸盐离子的排斥导致了它们从周围的溶剂中排出,并弱化它们的易溶效果。甚至即使两种NR-结构域并未对磷酸盐的添加作出反应,它们向rep-蛋白质的加入强烈增加了磷酸盐的敏感性。尽管给出的数据对于得到最终结论是不充分的,似乎NR-结构域可能作为对聚集促进因子的敏感性的非特异性增强物发挥功能。对于有效聚集,它们的存在与重复区域对这些因子的反应的能力一样重要。
这种提高的机制可能包括在丝蛋白的寡聚状态中的变化。已发现NR-结构域形成二硫键连接的二聚体(38)。另外的寡聚化可能导致起始聚集所需要的多肽序列的增加的局部浓度,其由促进分子内相互作用形成的溶剂条件辅助。
将合成的重复序列与真正的NR-区域组合起来的目前的蛋白质改造方法,显示可以以高产量产生与真正的丝蛋白十分相似的蛋白质。可以易于按比例放大的细菌表达系统以及简单廉价的纯化方法提供了以经济有效的工业规模生产蜘蛛丝样蛋白的基础。基于目前的研究,可以进一步研究蜘蛛丝装配的分子机制,其将提供从重组蛋白中人工纺丝丝线和获得生物技术和医学应用的新材料所需要的知识。
蜘蛛丝衍生的蛋白质的装配进行下列实验来证实衍生自蜘蛛丝序列ADF-3(SEQ ID NO1)或ADF-4(SEQ ID NO2)的蛋白质可被装配成形态上独特的形式。如在Biochemistry 2004 Vo1.43 pp.13604-11362中所述,在水溶液中构建、产生和制备蛋白质(AQ)24NR3和C16NR4。如果没有另外提及,蛋白质溶液包含10mM Tris-(羟甲基)-氨基甲烷(Tris)pH8.0。
1.球体通过将0.8M的硫酸铵加入0.2%(w/v)的C16溶液来产生显示直径范围在0.5到2μm之间(图7a)的蛋白质球体。
2.纳米纤维通过将1%(w/v)C16NR4溶液在室温温育2周来形成显示直径在0.7和4nm之间(图7b)的纳米纤维。
3.微纤维为了形成微纤维,将5-10μl的25%(w/v)的基于(AQ)24NR3溶液缓慢注射到0.5M的磷酸钾pH8.0中,形成稳定的蛋白质溶液液滴。在温育1分钟后,使用镊子将蛋白质液滴从溶液中去除。在空气中再温育1分钟后,使用第二组镊子可以将蛋白质纤维从蛋白质液滴中以约2cm/s的速率进行抽提。所述纤维显示具有4μm的直径的圆形截面(图7c,d)。
4泡沫将蛋白质泡沫(图7e,f)产生自包含2.5mM的过二硫酸铵(APS),100μM的tris(2,2′-二吡啶基)二氯钌(II)(Rubpy)和10%(w/v)的(AQ)24NR3或2%(w/v)的C16NR4的溶液。所述蛋白质溶液用空气发泡。为了稳定得到的泡沫结构,将蛋白质通过暴露于来自钨灯的可见光达1分钟来进行交联(ProtocolPNAS 1999 Vol.96 pp.6020-6024)。随后在95℃对泡沫进行干燥。
5.凝胶在1%(w/v)浓度的C16NR4纳米纤维显示凝胶样的外观,其可容易地通过搅拌或剪切而被破坏。为了改善凝胶的机械性质,容许APS和Rubpy通过扩散进入凝胶来产生10mM APS和100μM Rubpy的终浓度。在光诱导交联后(见,节4),可以获得在尺寸上稳定的凝胶(图5g)。
6.薄膜6.1蜘蛛丝蛋白的可溶性状态为了铸塑薄膜,发明人使用两种合成的丝蛋白,(AQ)24NR3和C16,其衍生自来自园蛛十字园蛛的拖丝的丝蛋白ADF-3和ADF-4(还见上面的进一步解释)。他们基于以前的观察,即ADF-3和ADF-4及其衍生物显示显著不同的关于溶解度和装配的表现,选择了这两种不同的蛋白质。可以通过将冻干的蛋白质溶解在6M硫氰酸胍中并随后通过针对低盐缓冲液诸如5mM磷酸钾pH8.0进行透析来去除所述盐以制备两种蛋白质的水溶液。还可以将冻干的蛋白质直接溶解在HFIP中。测量蛋白质溶液的园二色性(CD)揭示两种溶剂对二级结构的不同影响。在水溶液中,两种蛋白质显示在低于200nm的波长上具有单一最小值的CD-光谱,其指示主要的随机卷曲蛋白质(图8)。与此相反,在HFIP中的两种蛋白质的光谱显示在201-202nm的一个最小值和另一个最小值((AQ)24NR3)或在220nm的肩值(shoulder)(C16),其显示增加的α-螺旋含量(图8)。
6.2薄膜形成在聚苯乙烯表面(或在用于CD测量的石英玻璃上)从包含2%w/v蛋白质的HFIP溶液中铸塑薄膜。在蒸发溶剂后,(AQ)24NR3和C16都形成可以易于从所述表面剥离的透明薄膜(图9和未显示的数据)。假定溶剂完全蒸发并且蛋白质薄膜的密度与报道的蜘蛛拖丝的丝的1.3g/cm3的值相同,计算薄膜的厚度在0.5到1.5μm的范围内。制备自任一蛋白质的铸态(as cast)(新鲜制备)的薄膜在与水接触后溶解。因为不可溶于水是对于蛋白质薄膜的大部分应用而言的先决条件,发明人寻找处理方法来使薄膜不可溶。已知磷酸钾诱导所用的丝蛋白的化学稳定结构的聚集和形成。因此,用1M磷酸钾处理(温育)铸态的薄膜导致薄膜转化为不可溶于水的状态。
6.3二级结构为了研究蛋白质薄膜的结构性质,通过CD光谱学来研究它们的二级结构。铸态的薄膜显示在208nm和220nm具有两个最小值的光谱,指示高α-螺旋含量(图10)。在用1M的磷酸钾处理后,薄膜显示在218nm具有单一最小值的光谱,其对于富含β-折叠的结构是典型的。因此,从水溶性向水不溶性的转变伴随蛋白质二级结构从α-螺旋向β-折叠的转化。
6.4化学稳定性为了测试化学稳定性,使薄膜与8M尿素,6M盐酸胍和6M硫氰酸胍接触(表2)。两种蛋白质的铸态的薄膜和(AQ)24NR3的处理的薄膜在这些变性剂中是可溶的。与此相反,可以将C16的处理的薄膜仅溶解在硫氰酸胍中。C16薄膜的这种显著的化学稳定性与重组产生的和装配的ADF-4的化学稳定性以及天然拖丝的丝的化学稳定性相同。以前的研究使装配的结构的装配性质和稳定性与丝蛋白的氨基酸序列直接相关。因此,可以推断,蜘蛛丝薄膜的性质可以通过操作相应的丝基因改变丝蛋白的一级结构来直接进行改变。
6.5薄膜修饰蛋白质薄膜的许多应用需要在薄膜表面上的特异性官能度的存在。为了证实我们的蜘蛛丝蛋白薄膜可以用小有机分子以及生物大分子如蛋白质进行修饰,将生色团荧光素和酶β-半乳糖苷酶以化学方法偶联于处理的C16薄膜。通过使用1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)来活化表面接触的C16的羧基基团实现偶联(对于反应的细节,见下面指出的补充材料)。接着,将薄膜与乙二胺一起温育,导致酰胺的形成。随后,将乙二胺的余下的游离氨基基团与异硫氰酸荧光素偶联,导致荧光素通过形成稳定的硫脲衍生物而有效共价结合(图11A)。类似地,β-半乳糖苷酶与EDC-激活的C16薄膜一起温育导致在C16的羧基基团和β-半乳糖苷酶的伯胺(例如,来自赖氨酸残基)之间的酰胺键的形成,其可以在酶的表面进行。在重复洗涤这些修饰的薄膜后,可以使用5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷(X-Gal)作为底物来检测β-半乳糖苷酶的活性(图11B)。
6.6结论在本文,可以证实蛋白质薄膜可以从合成的蜘蛛丝蛋白获得。可以用磷酸钾处理开始可以溶于水的薄膜,从而得到对于许多应用而言非常需要的水不溶性。制备自两种不同的合成蜘蛛丝蛋白的薄膜的化学稳定性的比较提示薄膜的性质基于蛋白质的一级结构。因此,产生形成显示特异性质的薄膜的丝蛋白是可能的。因为可以将不同的功能分子共价连接于薄膜的表面,在未来可以实现大量技术或医学应用。
6.7补充的材料和结果蛋白质溶液的制备如前所述进行蛋白质的产生和纯化。为了获得(AQ)24NR3和C16的水溶液,将冻干的蛋白质以10mg/ml的浓度溶解在6M硫氰酸胍中并随后针对5mM磷酸钾8.0进行透析。通过在15,000xg沉淀10分钟来去除团聚体。使用对于(AQ)24NR3的73950 M-1cm-1的计算消光系数和对于C16的46400M-1cm-1的计算消光系数,在276nm,在1cm通径长的比色杯中以光度法测定蛋白质浓度。备选地,将冻干的丝蛋白直接溶解在六氟异丙醇(HFIP)中。
二级结构分析使用Jasco 715分光偏振仪(Jasco International Co.Ltd.,Tokyo,Japan)获得Far-UV园二色性(CD)光谱。在20℃,在0.1cm通径长的石英比色杯中,在5mM的磷酸钾(pH8.0)或HFIP中的200μg/ml的蛋白质浓度,获取可溶性蛋白的光谱。对于测量薄膜而言,将100μl的2mg/ml的在HFIP中的蛋白质溶液分散在4cm2的单色石英玻璃上并在CD-测量之前风干。扫描速度是20nm/min,步长是0.2nm,整合时间设定为1s,并且带宽是1nm。将四次扫描平均起来。
薄膜修饰1.荧光素与C16薄膜表面的偶联通过将每孔15μl的在HFIP中的20mg/ml C16分散在24-孔板的底部制备薄膜。在蒸发HFIP后,将薄膜与1M磷酸钾一起温育5分钟。用水漂洗后,通过与100mM 2-(N-吗啉代)乙磺酸(MES)pH 5.0,100mM 1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和20mM N-羟基硫代-琥珀酰亚胺(NHS)一起温育15分钟来活化羧基基团。随后,加入乙二胺以产生500mM的最终浓度。温育2小时后,用水彻底漂洗薄膜。最终,将薄膜与在100mM碳酸钠pH9.0中的1mg/ml的异硫氰酸荧光素一起温育1小时,随后用水漂洗并进行风干。
2.β-半乳糖苷酶与C16薄膜表面的偶联如上所述制备薄膜并进行活化。用EDC/NHS温育15分钟后,用水漂洗薄膜并随后与包含100μg/ml的β-半乳糖苷酶,4mM KH2PO4,16mMNa2HPO4,115mM NaCl(PBS)的溶液一起温育2小时。用PBS彻底漂洗后,在薄膜表面上测试酶活性。
β-半乳糖苷酶测定将β-半乳糖苷酶偶联的薄膜在室温,与包含100mM磷酸钠pH7.0,10mM氯化钾,1mM硫酸镁,50mM巯基乙醇和2mg/ml的5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷(X-Gal)的溶液一起温育16小时。
7.另外的水凝胶ADF-4的重复部分通常由仅显示微小变化的单一保守重复单位组成。发明人组合这些变化并且设计被称为C的一个共有组件(GSSAAAAAAAASGPGGYGPENQGPSGPGGYGPGGP)(SEQ ID NO5),其被多聚化以获得rep-蛋白质C16,这将得到分子量为48kDa的蛋白质。
在大肠杆菌菌株BLR[DE3](Novagen)中表达C16丝基因。将细胞于37℃在LB培养基中培养到OD600=0.5。在用1mM IPTG(异丙基-β-D-硫代半乳糖苷)诱导前,将细胞改变到25℃。诱导3-4小时后,收集细胞。
如在Huemmerich et al(40)中所述纯化C16蛋白。用8M尿素洗涤C16的沉淀,并将其溶解在6M的异硫氰酸胍(GdmSCN)中,之后针对10mMNH4HCO3进行透析。通过在50,000xg沉淀30分钟来去除在透析过程中形成的沉淀物,并将余下的可溶性丝蛋白冻干。在分析前,将冻干的蛋白质溶解在6M GdmSCN中,随后针对10mM Tris/HCl进行透析。通过在125,000xg沉淀30分钟来去除团聚体。使用计算消光系数,在276nm,在1cm通径长的比色杯中,以光度法测定蛋白质浓度(40)。
在添加10%w/v的甲醇后,在5和30mg/ml之间的浓度将C16自装配为纳米纤维(图12)。引人注意的是,在所用的浓度,纳米纤维导致表示水凝胶的纤维网络的形成。C16水凝胶可以容易地通过搅拌或剪切被破坏。为了提高凝胶的机械性质,使用过二硫酸铵(APS)和Tris(2,2′-二吡啶基)二氯钌(II)(Rubpy)通过扩散进入凝胶以产生10mM APS和100μM Rubpy的最终浓度。为了获得在大小上稳定的凝胶,通过暴露于来自钨灯的可见光达1分钟来交联蛋白质(IV)(图13)。
使用具有25mm Plate-Plate几何形状的Physica MCR 301来进行交联和非交联水凝胶的动态流变测量。通过首先将约2mm的上板移动到样品表面上面来设定上板和样品碟之间的间隙。上板降低地非常缓慢(5μm/s),同时检测正交力并在0.1N的限度正交力终止。
在发现样品具有的足够间隙大小后,在0.5Hz和1%的变形上剪切样品直到正交力平衡于恒定值。在室温,通过将不变的应力应用于样品进行动态流变测量。在蛋白质浓度的范围在5到30mg/ml的样品上进行流变测量。
干燥的水凝胶的AFM图像显示纳米纤维的直径是约3nm,并且似乎是半柔韧的,其中相关长度与它们的长度在相同的数量级上(图12)。许多纳米纤维还似乎具有分枝结构。从AFM图像,不能确定分枝样结构是在每个聚合物纤维中的物理分枝还是纳米纤维集束的结果。
类似于大多数浓缩的聚合物网络,重组C16蜘蛛丝蛋白的水凝胶显示了粘弹性性状。当将应力应用到粘弹性C16丝网络时,张力随时间缓慢变化并且与应用的应力成比例。图14显示在10mg/ml的浓度,交联的和非交联的水凝胶的应力/张力表现。非交联的C16丝水凝胶具有38Pa的起始剪切模量。然而,当应力增加时,非交联的水凝胶显示相应于应力的更高的变性,并且在20%的张力后,反应成为相对线性的。当应力增加时,网络继续变形直到达到90%的张力,其中非交联的水凝胶破裂并且流动。不象非交联的纤维网络,交联的网络显示对于所有张力的线性粘弹性反应,具有820Pa的高得多的剪切模量,并且在30%的更低张力破裂。
在20mg/ml的聚合物浓度上的非交联纤维网络的动态粘弹性测量揭示储存模量(G’)和损失模量(G”)在高ω和低ω范围上都非常依赖于振动频率(ω)(图15)。网络显示低频的粘性表现和在具有0.49Hz的重叠的中度频率的弹性表现。观察到的水凝胶的表现类似于对于缠结的聚合物网络所预期的并且与对于液态结晶溶液或粘性流体所预期的不相似。
非交联的C16丝水凝胶还显示动态粘弹性表现,其与在化学交联的水凝胶中观察到的十分不同(图15)。与非交联的纤维网络的表现不同,除了在测试的最高频率,交联的纤维网络的储存模量几乎在所有的频率上是恒定的。与在非交联的网络中观察到的相比,交联的C16丝水凝胶还显示更高的储存和更低的损失模量。
如预期,对于所有测试的浓度,交联的水凝胶的储存模量高于非交联的网络的储存模量(图16)。但是,意外的是,交联的和非交联的网络的储存模量随浓度[c]增加,并具有[c]2相关性。在交联的线性半柔性生物高分子网络的情形中,其中相关长度大于网眼大小,预期聚合物网络的储存模量具有[c]的相关性,其接近于交联的C16丝水凝胶的[c]的相关性。在缠结但是非交联的线性半柔性生物高分子网络的情形中,预期储存模量具有低得多的[c]的浓度相关性。已经显示这样的相关性对于其它的生物高分子诸如F-肌动蛋白是有效的,但是并未描述非交联的丝水凝胶的相关性。
如果在AFM图像中观察到的分枝样结构是在聚合物网络中的真正的物理分枝,可以解释这种矛盾。预期分枝的半柔性聚合物网络的储存模量显示在对于所预期的交联的和非交联的聚合物网络之间的浓度相关性。
AFM图像和流变数据与从分枝的半柔性聚合物网络的模型所知的一致。然而,水凝胶的储存模量缩放表现不能在对于线性半柔性聚合物网络的最广泛接受(excepted)的模型的框架中进行解释。
表1合成的丝构建体和真正的蜘蛛丝蛋白ADF-3和ADF-4的选择的性质
a包括T7-标记的工程化蛋白质的分子量.
b按照Gill&Hippel(23)计算消光系数.
c带电的氨基酸残基仅指丝基因序列;T7-标记包括另外的精氨酸.
d如前所述计算亲水性(39)。疏水性随亲水性值增加。
e将亲水性标准化为在0和1之间的范围。按照Uversky et al.(35;36)来计算“边界”亲水性。如果标准化的亲水性值低于“边界”值,预期蛋白质是内部伸展的。ADF-3和ADF-4的值仅指它们的重复序列。
f通过CD光谱学确定中点温度。
g从(18)和未公开的结果取ADF-3和ADF-4的值。
表2蛋白质薄膜在变性剂中的溶解度。将薄膜视为不可溶的(-),将其完全进入各种试剂并且在5分钟内重复摇动并未导致光学外观的变化。与此相反,通过在相同的条件下彻底分解薄膜来显示溶解度。
参考文献1.Gosline,J.M.,Guerette,P.A.,Ortlepp,C.S.,and Savage,K.N.(1999)The mechanical design of spider silksfrom fibroin sequence to mechanicalfunction,J.Exp.Biol.202 Pt 23,3295-3303.
2.Vollrath,F.and Knight,D.P.(2001)Liquid crystalline spinning ofspider silk,Nature410,541-548.
3.Guerette,P.A.,Ginzinger,D.G.,Weber,B.H.,and Gosline,J.M.(1996)Silk properties determined by gland-specific expression of a spiderfibroin gene faily,Science 272,112-115.
4.Gatesy,J.,Hayashi,C.,Motriuk,D.,Woods,J.,and Lewis,R.(2001)Extreme diversity,conservation,and convergence of spider silk fibroinsequences,Science 291,2603-2605.
5.Simmons,A.H.,Ray,E.,and Jelinski,L.W.(1994)Solid-State13CNMR of Nephila clavipes Dragline Silk Establishes Structure and Identity ofCrystalline Regions,Macromolecules 27,5235-5237.
6.Parkhe,A.D.,Seeley,S.K.,Gardner,K.,Thompson,L.,and Lewis,R.V.(1997)Structural studies of spider silk protein in the fiber,J. Mol.Recognit.10,1-6.
7.van Beek,J.D.,Hess,S.,Voollrath,F.,and Meier,B.H.(2002)Themolecular structure of spider dragline silkfolding and orientation of theprotein backbone,Proc.Natl.Acad. Sci.U.S.A 99,10266-10271.
8.Hijirida,D.H.,Do,K.G.,Michal,C.,Wong,S.,Zax,D.,and Jelinski,L.W.(1996)13C NMR of Nephila clavipes major ampullate silk gland,Biophys.J.71,3442-3447.
9.Kenney,J.M.,Knight,D.,Wise,M.J.,and Vollrath,F.(2002)Amyloidogenic nature of spider silk,Eur.J.Biohem.269,4159-4163.
10.Hronska,M.,Van Beek,J.D.,Williamson,P.T.,Vollrath,F.,andMeier,B.H.(2004)NMR characterization of native liquid spider dragline silkfrom Nephila edulis,Biomacromolecules.5,834-839.
11.Kerkam,K.,Viney,C.,Kaplan,D.,and Lombardi,S.(1991)Liquidcrystallinity of natural silk secretions,Nature 349,596-598.
12.Knight,D.P.and Vollrath,F.(1999)Liquid crystals and flowelongation in a spider′s silk production line,Proc.R.Soc.Lond.519-523.
13.Willcox,J.,Gido,S.,Muller,W.,and Kaplan,D.(1996)Evidenceof a Cholesteric Liquid Crystalline Phase in Natural Silk Spinning Processes,Macromolecules 29,5106-5110.
14.Knight,D.P.and Vollrath,F.(2001)Changes in elementcomposition along the spinning duct in a Nephila spider,Naturwissenschaften88,179-182.
15.Vollrath,F.,Knight,D.,and Hu,X.W.(1998)Silk production in aspider involves acid bath treatment,Proc.R.Soc.Lond B Biol.Sci.265,817-820.
16.Tillinghast,E.K.,Chase,S.F.,and Townley,M.A.(1984)Waterextraction by the major ampullate duct during silk formation in the spider,Argiope aurantia Lucas,J.Insect Physiol.30,591-596.
17.Knight,D.P.,Knight,M.M.,and Vollrath,F.(2000)Betatransition and stress-induced phase separation in the spinning of spider draglinesilk,Int.J.Biol.Macromol.27,205-210.
18.Lazaris,A.,Arcidiacono,S.,Huang,Y.,Zhou,J.F.,Duguay,F.,Chretien,N.,Welsh,E.A.,Soares,J.W.,and Karatzas,C.N.(2002)Spidersilk fibers spun from soluble recombinant silk produced in mammalian cells,Science 295,472-476.
19.Sambrook,J.and Russell,D.(2001)Molecular Cloning.
20.Kroll,D.J.,Abdel-Malek Abdel-Hafiz,H.,Marcell,T.,Simpson,S.,Chen,C.Y.,Gutierrez-Hartmann,A.,Lustbader,J.W.,and Hoeffler,J.P.(1993)A multifunctional prokaryotic protein expression systemoverproduction,affinity purification,and selective detection,DNA Cell Biol.12,441-453.
21.Reiling,H.E.,Laurila,H.,and Fiechter,A.(1985)Mass-Culture ofEscherichia-Coli-Medium Development for Low and High-DensityCultivation of Escherichia Coli-B/R in Minimal and Complex Media,Journalof Biotechnology 2,191-206.
22.Yee,L.and Blanch,H.W.(1992)Recombinant protein expressionin high cell density fed-batch cultures of Escherichia coli,Biotechnology(N.Y.)10,1550-1556.
23.Gill,S.C.and von Hippel,P.H.(1989)Calculation of ProteinExtinction Coefficients from Amino-Acid Sequence Data,AnalyticalBiochemistry 182,319-326.
24.Arcidiacono,S.,Mello,C.,Kaplan,D.,Cheley,S.,and Bayley,H.(1998)Purification and characterization of recombinant spider silk expressedin Escherichia coli,Appl.Microbiol.Biotechnol.49,31-38.
25.Prince,J.T.,McGrath,K.P.,DiGirolamo,C.M.,and Kaplan,D.L.(1995)Construction,cloning,and expression of synthetic genes encodingspider dragline silk,Biochemistry 34,10879-10885.
26.Fahnestock,S.R.and Irwin,S.L.(1997)Synthetic spider draglinesilk proteins and their production in Escherichia coli,Appl.Microbiol.Biotechnol.47,23-32.
27.Lewis,R.V.,Hinman,M.,Kothakota,S.,and Fournier,M.J.(1996)Expression and purification of a spider silk proteina new strategy forproducing repetitive proteins,Protein Expr.Purif.7,400-406.
28.Scheller,J.,Guhrs,K.H.,Grosse,F.,and Conrad,U.(2001)Production of蜘蛛丝蛋白in tobacco and potato,Nat.Biotechnol.19,573-577.
29.Padgett,K.A.and Sorge,J.A.(1996)Creating seamless junctionsindependent of restriction sites in PCR cloning,Gene 168,31-35.
30.Blattner,F.R.,Plunkett,G.,III,Bloch,C.A.,Perna,N.T.,Burland,V.,Riley,M.,Collado-Vides,J.,Glasner,J.D.,Rode,C.K.,Mayhew,G.F.,Gregor,J.,Davis,N.W.,Kirkpatrick,H.A.,Goeden,M.A.,Rose,D.J.,Mau,B.,and Shao,Y.(1997)The complete genome sequence of Escherichia coliK-12,Science 277,1453-1474.
31.Kim,T.D.,Ryu,H.J.,Cho,H.I.,Yang,C.H.,and Kim,J.(2000)Thermal behavior of proteinsheat-resistant proteins and their heat-inducedsecondary structural changes,Biochemistry 39,14839-14846.
32.Uversky,V.N.,Lee,H.J.,Li,J.,Fink,A.L.,and Lee,S.J.(2001)Stabilization of partially folded conformation during alpha-synucleinoligomerization in both purified and cytosolic preparations,J.Biol.Chem.276,43495-43498.
33.Knight,D.P.and Vollrath,F.(2002)Biological liquid crystalelastomers,Philos.Trans.R.Soc.Lond B Biol.Sci.357,155-163.
34.Chen,X.,Knight,D.P.,and Vollrath,F.(2002)Rheologicalcharacterization of nephila spidroin solution,Biomacromolecules.3,644-648.
35.Uversky,V.N.,Gillespie,J.R.,and Fink,A.L.(2000)Why are″natively unfolded″ proteins unstructured under physiologic conditions?,Proteins 41,415-427.
36.Uversky,V.N.(2002)Natively unfolded proteinsa point wherebiology waits for physics,Protein Sci.11,739-756.
37.Arakawa,T.and Timasheff,S.N.(1985)Theory of proteinsolubility,Methods Enzymol.114,49-77.
38.Sponner,A.,Unger,E.,Grosse,F.,and Weisshart,K.(2004)Conserved C-termini of Spidroins are secreted by the major ampullate glandsand retained in the silk thread,Biomacromolecules.5,840-845.
39.Kyte,J.and Doolittle,R.F.(1982)A simple method for displayingthe hydropathic character of a protein,J.Mol.Biol.157,105-132.
40.Huemmerich,D.,Helsen,C.W.,Oschmann,J.,Rudolph,R.andScheibel,T.(2004)Primary structure elements of dragline silks and theircontribution to protein solubility and assembly,Biochemistry 43,13604-13612.
序列表<110>慕尼黑技术大学<120>重组蜘蛛丝蛋白<130>P19310<140>
<141>
<150>US 60/590,196<151>2004-07-22<160>55<170>PatentIn version 3.1<210>1<211>653<212>PRT<213>十字园蛛<400>1Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Asn Ser1 5 10 15Ala Arg Ala Gly Ser Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly20 25 30Gln Gln Gly Pro Gly Gln Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala35 40 45Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly50 55 60Pro Ser Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro
65 70 75 80Tyr Gly Pro Gly Ala ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly85 90 95Pro Gly Ser Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro100 105 110Gly Ser Ser Ala Ala Ala Ala Ala Ala Gly Gly Asn Gly Pro Gly Ser115 120 125Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly130 135 140Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly145 150 155 160Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly165 170 175Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly180 185 190Ser Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro195 200 205Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly210 215 220Pro Gly Ser Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln225 230 235 240Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala245 250 255Ala Ala Ala Gly Gly Tyr Gly Pro Gly Tyr Gly Gln Gln Gly Pro Gly260 265 270Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala275 280 285Ala Ser Ala Ala Ser Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly290 295 300Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala305 310 315 320
Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln325 330 335Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln340 345 350Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala355 360 365Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly Pro Gly370 375 380Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln385 390 395 400Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln405 410 415Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Ala Tyr Gly Pro Gly420 425 430Ala Ser Ala Ala Ala Gly Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly435 440 445Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln450 455 460Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln465 470 475 480Gly Pro Gly Gln Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala485 490 495Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly Pro Gly500 505 510Gln Gln Gly Pro Gly Gln Gln Gly Pro Val Gly Gln Gly Pro Tyr Gly515 520 525Pro Gly Ala Ala Ser Ala Ala Val Ser Val Gly Gly Tyr Gly Pro Gln530 535 540Ser Ser Ser Ala Pro Val Ala Ser Ala Ala Ala Ser Arg Leu Ser Ser545 550 555 560Pro Ala Ala Ser Ser Arg Val Ser Ser Ala Val Ser Ser Leu Va1 Ser565 570 575
Ser Gly Pro Thr Asn Gln Ala Ala Leu Ser Asn Thr Ile Ser Ser Val580 585 590Val Ser Gln Val Ser Ala Ser Asn Pro Gly Leu Ser Gly Cys Asp Val595 600 605Leu Val Gln Ala Leu Leu Glu Val Val Ser Ala Leu Val Ser Ile Leu610 615 620Gly Ser Ser Ser Ile Gly Gln Ile Asn Tyr Gly Ala Ser Ala Gln Tyr625 630 635 640Thr Gln Met Val Gly Gln Ser Val Ala Gln Ala Leu Ala645 650<210>2<211>671<212>PRT<213>十字园蛛<400>2Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Ala Ala Arg Ala1 5 10 15Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly Ser Gly Gly Tyr20 25 30Gly Pro Glu Asn Gln Gly Pro Ser Gly Pro Val Ala Tyr Gly Pro Gly35 40 45Gly Pro Val Ser Ser Ala Ala Ala Ala Ala Ala Ala Gly Ser Gly Pro50 55 60Gly Gly Tyr Gly Pro Glu Asn Gln Gly Pro Ser Gly Pro Gly Gly Tyr65 70 75 80Gly Pro Gly Gly Ser Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala85 90 95Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro100 105 110Gly Gly Ser Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro115 120 125
Gly Ala Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly130 135 140Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Ala Tyr Gly145 150 155 160Pro Gly Gly Pro Gly Ser Ser Ala Ala Ala Ser Gly Pro Gly Gly Tyr165 170 175Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Gly Ser Gly Gly Tyr180 185 190Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Gly Pro Gly Ala Ser195 200 205Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gly Tyr Gly2l0 2l5 220Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Ala Tyr Gly Pro Gly Gly225 230 235 240Pro Gly Ser Ser Ala Ala Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly245 250 255Ser Gln Gly Pro Ser Gly Pro Gly Ala Tyr Gly Pro Gly Gly Pro Gly260 265 270Ser Ser Ala Ala Ala Ala Ala Ala Ala Gly Ser Gly Pro Gly Gly Tyr275 280 285Gly Pro Gly Asn Gln Gly Pro Ser Gly Pro Gly Gly Tyr Gly Pro Gly290 295 300Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly305 310 315 320Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Val Tyr Gly325 330 335Pro Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Gly Ser340 345 350Gly Pro Gly Gly Tyr Gly Pro Gly Asn Gln Gly Pro Ser Gly Pro Gly355 360 365Gly Tyr Gly Pro Gly Gly Ser Gly Ser Ser Ala Ala Ala Ala Ala Ala
370 375 380Ala Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser385 390 395 400Gly Pro Gly Gly Ser Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser405 410 415Gly Pro Gly Ala Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly420 425 430Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Ala435 440 445Tyr Gly Pro Gly Gly Pro Gly Ser Ser Ala Ala Ala Ser Gly Pro Gly450 455 460Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Ala Tyr Gly465 470 475 480Pro Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly485 490 495Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Gly500 505 510Ser Arg Gly Tyr Gly Pro Gly Ser Gln Gly Pro Gly Gly Pro Gly Ala515 520 525Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gly Tyr530 535 540Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Tyr Gln Gly Pro Ser545 550 555 560Gly Pro Gly Ala Tyr Gly Pro Ser Pro Ser Ala Ser Ala Ser Val Ala565 570 575Ala Ser Arg Leu Ser Ser Pro Ala Ala Ser Ser Arg Val Ser Ser Ala580 585 590Val Ser Ser Leu Val Ser Ser Gly Pro Thr Asn Gly Ala Ala Val Ser595 600 605Gly Ala Leu Asn Ser Leu Val Ser Gln Ile Ser Ala Ser Asn Pro Gly610 615 620
Leu Ser Gly Cys Asp Ala Leu Val Gln Ala Leu Leu Glu Leu Val Ser625 630 635 640Ala Leu Val Ala Ile Leu Ser Ser Ala Ser Ile Gly Gln Val Asn Val645 650 655Ser Ser Val Ser Gln Ser Thr Gln Met Ile Ser Gln Ala Leu Ser660 665 670<210>3<211>24<212>PRT<213>人工序列<220>
<223>组件A(ADF-3)<400>3Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly1 5 10 15Tyr Gly Pro Gly Ser Gly Gln Gln20<210>4<211>20<212>PRT<213>人工序列<220>
<223>组件Q(ADF-3)<400>4Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly1 5 10 15Pro Gly Gln Gln20<210>5
<211>35<212>PRT<213>人工序列<220>组件C(ADF-4)<223>
<400>5Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gly1 5 10 15Tyr Gly Pro Glu Asn Gln Gly Pro Ser Gly Pro Gly Gly Tyr Gly Pro20 25 30Gly Gly Pro35<210>6<211>942<212>PRT<213>Nephila clavipes<400>6Ala Cys Phe Thr Ser Ala Val Ile Phe Leu Phe Leu Ala Gln Cys Ala1 5 10 15Ser Thr Tyr Gly Arg Gly Ile Ile Ala Asn Ser Pro Phe Ser Asn Pro20 25 30Asn Thr Ala Glu Ala Phe Ala Arg Ser Phe val Ser Asr Ile Val Ser35 40 45Ser Gly Glu Phe Gly Ala Gln Gly Ala Glu Asp Phe Asp Asp Ile Ile50 55 60Gln Ser Leu Ile Gln Ala Gln Ser Met Gly Lys Gly Arg His Asp Thr65 70 75 80Lys Ala Lys Ala Lys Ala Met Gln Val Ala Leu Ala Ser Ser Ile Ala85 90 95Glu Leu Val Ile Ala Glu Ser Ser Gly Gly Asp Val Gln Arg Lys Thr
100 105 110Asn Val Ile Ser Asn Ala Leu Arg Asn Ala Leu Met Ser Thr Thr Gly115 120 125Ser Pro Asn Glu Glu Phe Val His Glu Val Gln Asp Leu Ile Gln Met130 135 140Leu Ser Gln Glu Gln Ile Asn Glu Val Asp Thr Ser Gly Pro Gly Gln145 150 155 160Tyr Tyr Arg Ser Ser Ser Ser Gly Gly Gly Gly Gly Gly Gln Gly Gly165 170 175Pro Val Val Thr Glu Thr Leu Thr Val Thr Val Gly Gly Ser Gly Gly180 185 190Gly Gln Pro Ser Gly Ala Gly Pro Ser Gly Thr Gly Gly Tyr Ala Pro195 200 205Thr Gly Tyr Ala Pro Ser Gly Ser Gly Ala Gly Gly Val Arg Pro Ser210 215 220Ala Ser Gly Pro Ser Gly Ser Gly Pro Ser Gly Gly Ser Arg Pro Ser225 230 235 240Ser Ser Gly Pro Ser Gly Thr Arg Pro Ser Pro Asn Gly Ala Ser Gly245 250 255Ser Ser Pro Gly Gly Ile Ala Pro Gly Gly Ser Asn Ser Gly Gly Ala260 265 270Gly Val Ser Gly Ala Thr Gly Gly Pro Ala Ser Ser Gly Ser Tyr Gly275 280 285Pro Gly Ser Thr Gly Gly Thr Tyr Gly Pro Ser Gly Gly Ser Glu Pro290 295 300Phe Gly Pro Gly Val Ala Gly Gly Pro Tyr Ser Pro Gly Gly Ala Gly305 310 315 320Pro Gly Gly Ala Gly Gly Ala Tyr Gly Pro Gly Gly Val Gly Thr Gly325 330 335Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala Gly Pro Gly Gly340 345 350
Tyr Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala355 360 365Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly370 375 380Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala Gly Pro385 390 395 400Gly Gly Tyr Gly Pro Gly Gly Thr Gly Pro Gly Gly Tyr Gly Pro Gly405 410 415Gly Thr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Pro Gly Gly420 425 430Tyr Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala435 440 445Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly450 455 460Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Pro465 470 475 480Ser Gly Ala Gly Leu Gly Gly Ala Gly Pro Gly Gly Ala Gly Leu Gly485 490 495Gly Ala Gly Pro Gly Gly Ala Gly Thr Ser Gly Ala Gly Pro Gly Gly500 505 510Ala Gly Pro Gly Gly Ala Gly Gln Gly Asp Ala Gly Pro Gly Gly Ala515 520 525Gly Arg Gly Gly Ala Gly Arg Gly Gly Val Gly Arg Gly Gly Ala Gly530 535 540Arg Gly Gly Ala Gly Arg Gly Gly Ala Arg Gly Ala Gly Gly Ala Gly545 550 555 560Gly Ala Gly Gly Ala Gly Gly Ser Gly Gly Thr Thr Ile Val Glu Asp565 570 575Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly ProIle Thr Ile Ser Glu580 585590Glu Leu Thr Ile Gly Gly Ala Gly Ala Gly Gly Ser Gly Pro Gly Gly595 600 605
Ala Gly Pro Gly Asn Val Gly Pro Gly Arg Ser Gly Pro Gly Gly Val610 615 620Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Ser Phe Gly625 630 635 640Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Ser645 650 655Gly Gly Ser Gly Gln Gly Gly Val Arg Pro Ser Gly Ser Gly Pro Gly660 665 670Gly Val Gly Thr Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr675 680 685Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Ser Ala Gly Gly Thr690 695 700Tyr Gly Pro Gly Gly Phe Gly Gly Pro Gly Gly Phe Gly Gly Pro Gly705 710 715 720Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly725 730 735Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro740 745 750Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly755 760 765Gly Ser Tyr Gly Leu Gly Gly Ala Gly Gly Ser Gly Gly Val Gly Pro770 775 780Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala Gly Pro Gly785 790 795 800Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly805 810 815Ser Gly Ser Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Ser820 825 830Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr Gly Pro Gly Gly Ser Glu835 840 845Ser Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Ser Gly Pro850 855 860
Gly Gly Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly865 870 875 880Gly Ser Gly Pro Ser Ser Phe Val Pro Gly Gly Ser Gly Pro Gly Gly885 890 895Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Val900 905 910Gly Leu Gly Gly Ala Gly Arg Gly Gly Ala Gly Arg Gly Gly Ala Gly915 920 925Ser Val Gly Ala Gly Arg Gly Gly Ala Gly Arg Gly Gly Thr930 935 940<210>7<211>907<212>PRT<213>Nephila clavipes<400>7Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly1 5 10 15Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro20 25 30Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly35 40 45Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly50 55 60Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Tyr65 70 75 80Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr Gly85 90 95Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro100 105 110Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly
115 120 125Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly130 l35 140Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Phe145 150 155 160Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly165 170 175Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro180 185 190Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly195 200 205Gly Ala Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala210 215 220Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr Thr Ile Ile Glu225 230 235 240Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro Ile Thr Ile Ser245 250 255Glu Glu Leu Thr Ile Ser Gly Ala Gly Gly Ser Gly Pro Gly Gly Ala260 265 270Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly275 280 285Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro290 295 300Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly305 310 315 320Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro Gly Gly Ala Tyr325 330 335Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly Gly Pro Gly Gly340 345 350Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly355 360 365
Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly370 375 380Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly Pro Tyr Gly Pro385 390 395 400Gly Gly Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly405 4l0 4l5Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro420 425 430Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr435 440 445Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ala Gly450 455 460Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro465 470 475 480Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly485 490 495Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Ser Gly Gly500 505 510Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr515 520 525Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr Gly530 535 540Pro Gly Gly Thr Gly Pro Gly Gly Ser Gly Pro Gly Gly ryr Gly Pro545 550 555 560Gly Gly Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Ser Gly Pro Gly565 570 575Gly Tyr Gly Pro Ser Gly Ser Gly Pro Gly Gly Tyr Gly Pro Ser Gly580 585 590Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr595 600 605Gly Pro Gly Gly Ser Gly Ala Gly Gly Thr Gly Pro Gly Gly Ala Gly610 615 620
Gly Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly625 630 635 640Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Val Gly Gly Ser645 650 655Gly Gly Thr Thr Ile Thr Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala660 665 670Asp Gly Pro Ile Thr Ile Ser Glu Glu Leu Thr Ile Ser Gly Ala Gly675 680 685Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly690 695 700Ser Gly Pro Gly Gly Val Gly Pro Gly Val Ser Gly Pro Gly Gly Val705 710 715 720Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Ser Gly Gly Ser Gly725 730 735Pro Gly Gly Val Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Ser740 745 750Gly Gly Val Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Gly Phe755 760765Tyr Gly Pro Gly Gly Ser Glu Gly Pro Tyr Gly Pro Ser Gly Thr Tyr770 775 780Gly Ser Gly Gly Gly Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly785 790 795 800Pro Gly Ser Pro Gly Gly Ala Tyr Gly Pro Gly Ser Pro Gly Gly Ala805 810 815Tyr Tyr Pro Ser Ser Arg Val Pro Asp Met Val Asn Gly Ile Met Ser820 825 830Ala Met Gln Gly Ser Gly Phe Asn Tyr Gln Met Phe Gly Asn Met Leu835 840845Ser Gln Tyr Ser Ser Gly Ser Gly Thr Cys Asn Pro Asn Asn Val Asn850 855 860Val Leu Met Asp Ala Leu Leu Ala Ala Leu His Cys Leu Ser Asn His865 870 875 880
Gly Ser Ser Ser Phe Ala Pro Ser Pro Thr Pro Ala Ala Met Ser Ala885 890 895Tyr Ser Asn Ser Val Gly Arg Met Phe Ala Tyr900 905<210>8<211>636<212>PRT<213>十字园蛛<400>8Ala Arg Ala Gly Ser Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly1 5 l0 15Gln Gln Gly Pro Gly Gln Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala20 25 30Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly35 40 45Pro Ser Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro50 55 60Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly65 70 75 80Pro Gly Ser Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro85 90 95Gly Ser Ser Ala Ala Ala Ala Ala Ala Gly Gly Asn Gly Pro Gly Ser100 105 110Gly Gln Gln Gly Ala Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly115 120 125Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly130 135 140Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly145 150 155 160Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly
165 170 175Ser Gly Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr180 185 190Gly Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro195 200 205Gly Ser Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly210 215 220Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala225 230 235 240Ala Ala Gly Gly Tyr Gly Pro Gly Tyr Gly Gln Gln Gly Pro Gly Gln245 250 255Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala260 265 270Ser Ala Ala Ser Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly Pro275 280 285Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser290 295 300Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln305 310 315 320Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly325 330 335Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala340 345 350Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly Pro Gly Gln355 360 365Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln370 375 380Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly385 390 395 400Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Ala Tyr Gly Pro Gly Ala405 410 415
<213>十字园珠<400>9Ala Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly Ser Gly Gly1 5 10 15Tyr Gly Pro Glu Asn Gln Gly Pro Ser Gly Pro Val Ala Tyr Gly Pro20 25 30Gly Gly Pro Val Ser Ser Ala Ala Ala Ala Ala Ala Ala Gly Ser Gly35 40 45Pro Gly Gly Tyr Gly Pro Glu Asn Gln Gly Pro Ser Gly Pro Gly Gly50 55 60Tyr Gly Pro Gly Gly Ser Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala65 70 75 80Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly85 90 95Pro Gly Gly Ser Gly Gly Tyr Gly Pro Gly Ser Gln Gly Ala Ser Gly100 105 110Pro Gly Gly Pro Gly Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala115 120 125Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly Pro Ser Gly130 135 140Pro Gly Ala Tyr Gly Pro Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala145 150 155 160Ala Ala Ala Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln Gly165 170 175Pro Ser Gly Pro Gly Val Tyr Gly Pro Gly Gly Pro Gly Ser Ser Ala180 185 190Ala Ala Ala Ala Ala Ala Gly Ser Gly Pro Gly Gly Tyr Gly Pro Glu195 200 205Asn Gln Gly Pro Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly210 215 220Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gly Tyr
ser Ala Ala Ala Gly Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln420 425430Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln435 440 445Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly Pro Gly Gln Gln Gly450 455 460Pro Gly Gln Gln Gly Pro Tyr Gly Pro Gly Ala Ser Ala Ala Ala Ala465 470 475 480Ala Ala Gly Gly Tyr Gly Pro Gly Ser Gly Gln Gln Gly Pro Gly Gln485 490 495Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro500 505 510Gly Ala Ala Ser Ala Ala Val Ser Val Gly Gly Tyr Gly Pro Gln Ser515 520 525Ser Ser Val Pro Val Ala Ser Ala Val Ala Ser Arg Leu Ser Ser Pro530 535 540Ala Ala Ser Ser Arg Val Ser Ser Ala Val Ser Ser Leu Val Ser Ser545 550 555 560Gly Pro Thr Lys His Ala Ala Leu Ser Asn Thr Ile Ser Ser Val Val565 570 575Ser Gln Val Ser Ala Ser Asn Pro Gly Leu Ser Gly Cys Asp Val Leu580 585 590Val Gln Ala Leu Leu Glu Val Val Ser Ala Leu Val Ser Ile Leu Gly595 600 605Ser Ser Ser Ile Gly Gln Ile Asn Tyr Gly Ala Ser Ala Gln Tyr Thr610 615 620Gln Met Val Gly Gln Ser Val Ala Gln Ala Leu Ala625 630 635<210>9<211>410<212>PRT
225 230 235 240Gly Pro Gly Ser Gln Gly Pro Ser Gly Pro Gly Gly Ser Gly Gly Tyr245 250 255Gly Pro Gly Ser Gln Gly Gly Ser Gly Pro Gly Ala Ser Ala Ala Ala260 265 270Ala Ala Ala Ala Ala Ser Gly Pro Gly Gly Tyr Gly Pro Gly Ser Gln275 280 285Gly Pro Ser Gly Pro Gly Tyr Gln Gly Pro Ser Gly Pro Gly Ala Tyr290 295 300Gly Pro Ser Pro Ser Ala Ser Ala Ser Val Ala Ala Ser Val Tyr Leu305 310 315 320Arg Leu Gln Pro Arg Leu Glu Val Ser Ser Ala Val Ser Ser Leu Val325 330 335Ser Ser Gly Pro Thr Asn Gly Ala Ala Val Ser Gly Ala Leu Asn Ser340 345 350Leu Val Ser Gln Ile Ser Ala Ser Asn Pro Gly Leu Ser Gly Cys Asp355 360 365Ala Leu Val Gln Ala Leu Leu Glu Leu Val Ser Ala Leu Val Ala Ile370 375 380Leu Ser Ser Ala Ser Ile Gly Gln Val Asn Val Ser Ser Val Ser Gln385 390 395 400Ser Thr Gln Met Ile Ser Gln Ala Leu Ser405 410<210>10<211>140<212>PRT<213>人工序列<220>
<223>NR3(ADF-3)<400>10
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly1 5 10 15Ala Ala Ser Ala Ala Val Ser Val Gly Gly Tyr Gly Pro Gln Ser Ser20 25 30Ser Ala Pro Val Ala Ser Ala Ala Ala Ser Arg Leu Ser Ser Pro Ala35 40 45Ala Ser Ser Arg Val Ser Ser Ala Val Ser Ser Leu Val Ser Ser Gly50 55 60Pro Thr Asn Gln Ala Ala Leu Ser Asn Thr Ile Ser Ser Val Val Ser65 70 75 80Gln Val Ser Ala Ser Asn Pro Gly Leu Ser Gly Cys Asp Val Leu Val85 90 95Gln Ala Leu Leu Glu Val Val Ser Ala Leu Val Ser Ile Leu Gly Ser100 105 110Ser Ser Ile Gly Gln Ile Asn Tyr Gly Ala Ser Ala Gln Tyr Thr Gln115 120 125Met Val Gly Gln Ser Val Ala Gln Ala Leu Ala Gly130 135140<210>11<211>125<212>PRT<213>人工序列<220>
<223>NR4(ADF-4)<400>11Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly1 5 10 15Ala Tyr Gly Pro Ser Pro Ser Ala Ser Ala Ser Val Ala Ala Ser Arg20 25 30Leu Ser Ser Pro Ala Ala Ser Ser Arg Val Ser Ser Ala Val Ser Ser35 40 45
Leu Val Ser Ser Gly Pro Thr Asn Gly Ala Ala Val Ser Gly Ala Leu50 55 60Asn Ser Leu Val Ser Gln Ile Ser Ala Ser Asn Pro Gly Leu Ser Gly65 70 75 80Cys Asp Ala Leu Val Gln Ala Leu Leu Glu Leu Val Ser Ala Leu Val85 90 95Ala Ile Leu Ser Ser Ala Ser Ile Gly Gln Val Asn Val Ser Ser Val100 105 110Ser Gln Ser Thr Gln Met Ile Ser Gln Ala Leu Ser Gly115 120 125<210>12<211>1959<212>DNA<213>十字园蛛<400>12atggctagca tgactggtgg acagcaaatg ggtcgggatc cgaattcggc acgagccgga 60tctggacaac aaggacccgg acaacaagga cccggacaac aaggacccgg acaacaagga120ccatatggac ccggtgcatc cgccgcagca gcagccgctg gaggttatgg acccggatct180ggacaacaag gacccagcca acaaggacct ggccaacaag gacccggtgg tcaaggacca240tatggacccg gtgcatccgc cgccgcagca gccgctggtg gatatggacc cggttccgga300caacaaggac caggaggtca aggaccatat ggacctggtt catccgctgc cgcagcagcc360gctggaggta atggacccgg atctggacaa caagggcccg gtcaacaagg tcctggacaa420caaggacccg gtgcatccgc cgccgcagca gccgctggag gatacggacc cggatctgga480caacaaggac ccggacaaca aggaccagga ggtcaaggac catatggacc tggtgcatcc540gccgctgcag cagccgctgg aggatacgga cccggatctg gacaacaagg acccggacaa600caaggaccag gaggtcaagg accatatgga cccggtgcat ccgctgcagc agcagccgct660ggaggttatg gacccggatc tggacaacaa ggacccggac aacaaggacc tggacaacaa720ggacccggtg gtcaaggacc atatggaccc ggtgcatccg ccgccgcagc agccgctgga780ggatacggac ccggttatgg acagcaagga ccaggacaac aaggaccagg aggtcaagga840ccatatggac ctggtgcatc cgccgcctca gcagcctctg gaggatacgg acccggatct900ggacaacaag gacccggaca acaaggacct ggaggtcaag gaccatatgg acctggtgca960
tccgccgcag cagcagccgc tggaggttat ggacccggat ctggacaaca aggaccaggc1020caacaaggac ccggtcaaca aggacctgga caacaaggac ccggtggtca aggaccatat1080ggacctggtg catccgccgc agcagcagcc gctggaggtt atggacccgg atctggacaa1140caaggacccg gtcaacaagg acccggtcaa caaggacccg gtcaacaagg acccggtcaa1200caaggacccg gccaacaagg acccggtcaa caaggacccg gccaacaagg acctggtcaa1260caaggtcccg gtggtcaagg ggcatatgga cctggtgcat ccgccgcagc aggagccgct1320ggaggttatg gacccggatc tggacaacaa ggacccggac aacaaggacc cggacaacaa1380ggacccggac aacaaggacc cggacaacaa ggacccggac aacaaggacc cggacaacaa1440ggacccggac aacaaggacc atatggacct ggtgcatccg ccgcagcagc agccgctgga1500ggttatggac ccggatctgg acaacaagga cccggccaac aaggacctgg acaacaagga1560cccgctggtc aaggaccata tggacctggt gcggcttctg cagctgtatc tgttggagga1620tatggaccac aaagctcctc ggctcctgtt gcatcagcag ccgcttctcg cctttcttct1680ccagcggcca gttctagagt ttcatcggct gtatcatctt tggtatctag tggacctact1740aatcaagctg cactttctaa tactatcagt agcgttgtat cgcaagttag tgcaagtaat1800cctggtcttt ctggttgcga tgtacttgtg caagcattgc tcgaagttgt atcggccctg1860gtatctatcc ttggatcttc tagtatcggg caaattaact atggtgcctc tgctcagtac1920acccaaatgg taggtcaatc tgtagctcaa gcccttgct 1959<210>13<211>2013<212>DNA<213>十字园蛛<400>13atggctagca tgactggtgg acagcaaatg ggtcgcgcgg cacgagcagg atcttcagca 60gcagcggccg cggcagcaag tggatctgga ggatacggac ctgaaaacca aggaccatct120ggacctgtag catatggacc tggtggaccc gtatcttcag ctgcagcagc agccgctgca180ggaagtggac ctggtggata cggacctgaa aaccaaggac catctggacc cggaggatat240ggacctggtg gttccggatc ttcagcagca gcagcagccg ctgcagcaag tggacctgga300ggatatggac ctggaagcca aggaccatct ggacctggtg gatccggagg atatggtccc360ggaagccaag ggccatctgg acctggtgca tcttcggcag cagcagcagc cgctgcagca420agtggacctg gaggatatgg acctggaagc caaggaccat ctggacctgg agcatatgga480
cctggtggac ccggatcttc agctgcagca agtggacctg gaggatatgg acctggaagc 540caaggaccat ctggacctgg tggatccgga ggatatggtc ccggaagcca agggccatct 600ggacctggtg ggcctggtgc atctgcggca gcagcagcag ccgctgcagc aagtggacct 660ggaggatatg gacctggaag ccaaggacca tctggacctg gagcatatgg acctggtgga 720cccggatctc cagctgcagc aagtggacct ggaggatatg gacctggaag ccaaggacca 780tctggacctg gagcatatgg acctggtgga cccggatctt cagctgcagc agcagccgct 840gcaggaagtg gacctggtgg atacggacct ggaaaccaag gaccatctgg accoggagga 900tatggacctg gtggtcccgg atcttcagca gcagcagccg ctgcagcaag tggacctgga 960ggatatggac ctggaagcca aggaccatct ggacctggag tatatggacc tggtggaccc1020ggatcttcag ctgcagcagc agccgctgca ggaagtggac ctggtggata cggacctgga1080aaccaaggac catctggacc cggaggatat ggacctggtg gttccggatc ttcagcagca1140gcagcagccg ctgcagcaag tggacctgga ggatatggac ctggaagcca aggaccatct1200ggacctggtg gatccggagg atatggtccc ggaagccaag ggccatctgg acctggtgca1260tcttcggcag cagcagcagc cgctgcagca agtggacctg gaggatargg acctggaagc1320caaggaccat ctggacctgg agcatatgga cctggtggac ccggatcttc agctgcagca1380agtggacctg gaggatatgg acctggaagc caaggaccat ctggtcctgg agcatatgga1440cctggtggac ccggatcttc agctgcagca gccgctgcag caagtggacc tggaggatat1500ggacctggaa gccaaggacc atctggacct ggtggatccc gaggatatgg tcccggaagc1560caaggacctg gtgggcctgg agcatctgcg gcagcagcag cagccgctgc agcaagtgga1620cctggaggat atggacctgg aagccaagga ccatctggac ctggatatca aggccctagt1680ggtcctggag caratggccc atctccttct gcttccgcat ccgttgcagc ctctcgttta1740tcttcgcctg cagcctcgtc tagagtgtct tccgctgtat cgtctttagt gtctagcgga1800cctacgaatg gtgctgctgt ttctggagct ttgaatagtt tagratctca gattagtgca1860agtaatccag gtttatcggg atgtgatgct cttgtgcagg cattattgga attagtgtct1920gctcttgtgg caattctttc atctgcaagt attggccaag tcaacgtcag ctctgttagt1980cagtcaactc aaatgattag ccaagctctt tca 2013<210>14<211>420<212>DNA<213>人工序列
<220>
<223>NR3(ADP-3)<400>14atggctagca tgactggtgg acagcaaatg ggtcgcggat ccatgggtgc ggcttctgca 60gctgtatctg ttggaggata tggaccacaa agctcctcgg ctcctgttgc atcagcagcc120gcttctcgcc tttcttctcc agcggccagt tctcgtgttt catcggctgt atcatctttg180gtatctagtg gacctactaa tcaagctgca ctttctaata ctatcagtag cgttgtatcg240caagttagtg caagtaatcc tggtctttct ggttgcgatg tacttgtgca agcattgctc300gaagttgtat cggccctggt atctatcctt ggatcttcta gtatcgggca aattaactat360ggtgcctctg ctcagtacac ccaaatggta ggtcaatctg tagctcaagc ccttgctggc420<210>15<211>37 5<212>DNA<213>人工序列<220>
<223>NR4ADF-4)<400>15atggctagca tgactggtgg acagcaaatg ggtcgcggat ccatgggagc atatggccca 60tctccttctg cttccgcatc cgttgcagcc tctcgtttat cttcgcctgc agcctcgtct120cgtgtgtctt ccgctgtatc gtctttagtg tctagcggac ctacgaatgg tgctgctgtt180tctggagctt tgaatagttt agtatctcag attagtgcaa gtaatccagg tttatcggga240tgtgatgctc ttgtgcaggc attattggaa ttagtgtctg ctcttgtggc aattctttca300tctgcaagta ttggccaagt caacgtcagc tctgttagtc agtcaactca aatgattagc360caagctcttt caggc 375<210>16<211>2828<212>DNA<213>Nephila clavipes<400>6gcttgcttta cctcggcagt gatatttctt ttcttagcgc agtgtgcgtc gacgtacgga60
agggggatta tagccaactc ccctttctca aaccctaaca cagcggaagc ttttgcacga 120tctttcgtga gcaatattgt ttctagtgga gaatttggag cccaaggagc cgaagacttc 180gatgacataa ttcagagtct catacaggcc cagagcatgg gcaaagggcg gcatgatacg 240aaggccaagg cgaaagcgat gcaggtagcc cttgcttctt ctatagccga attggttatt 300gcagaaagca gcggaggcga tgtgcaacgc aaaaccaacg ttatctccaa cgctttgaga 360aacgccttga tgtctacaac aggcagccca aacgaagagt tcgtccatga agttcaagac 420ctcatccaga tgttatctca agaacagatc aacgaggtag atacttcagg accagggcag 480tactacaggt cgtcttcttc cggtggagga ggtggaggac aaggaggtcc tgtagttact 540gaaacactga ccgttacagt tggcggatcc ggtggagggc aaccttcagg tgcaggtcct 600agtggtacag gtggatatgc accaactgga tacgccccaa gcggctcagg tgcaggtggc 660gttcgaccta gtgcctccgg tccaagtggt agtggaccta gtggtggatc tcgtcctagt 720agtagtggac ctagtggaac tcgtcccagc cctaatggtg caagtggatc tagccctggt 780ggtatcgcac ctggtggatc caattctggt ggtgctggag tatccggcgc aactggagga 840cctgcatcca gcggctccta cggaccagga agtacaggtg gaacatatgg acctagtgga 900ggaagtgaac ctttcggacc aggagtggct ggaggaccat acagcccagg tggagctgga 960cctggtggtg caggtggagc ctatggacca ggaggtgtag gaactggtgg agccggacca1020ggaggttacg gacctggtgg agccggacca ggaggttatg gacctggtgg agccggacca1080ggaggttacg gacctggtgg agctggacca ggaggttacg gacctggtgg agctgggcct1140ggaggttacg gacctggtgg agctggacct ggaggttacg gacctggtgg agctggacct1200ggaggttacg gacctggtgg aactggacct ggtggatacg gacctggtgg aactggacct1260ggaggagttg gacctggagg agctggacca ggaggatatg gacctggtgg tgctggacct1320ggtggtgctg gacctggtgg tgctggacct ggtggtgctg gacctggtgg tgctggacct1380ggtggtgctg gacctggtgg atacggccct ggtggatctg gacctggtgg tgctggacct1440agtggtgccg gacttggtgg tgctggacct ggaggtgcgg gacttggtgg agcaggacct1500ggaggagcag gaaccagtgg tgccggaccc ggtggagcag gacccggtgg agcaggacaa1560ggtgatgctg gacccggtgg tgcaggacgt ggaggagcag gtcgtggtgg tgtaggtcgt1620ggtggtgcag gtcgtggagg tgcaggacgt ggtggagcta gaggtgctgg tggagcagga1680ggtgctggtg gagcaggagg atccggcggc acaacaatcg tagaggactt ggatattaca1740attgatggtg cagatggccc gataacaata tcagaagaat taacaatcgg tggagcaggc1800gctggaggtt ccggacccgg tggtgctgga ccaggaaacg ttggacctgg tcgctctgga1860ccaggaggag taggacctgg tggctctgga ccaggaggcg taggacctgg tagctttgga1920ccaggaggcg taggacctgg tggctccgga ccaggaggcg taggatctgg tggctccgga1980
caaggaggag taagacctag tggctccgga ccaggtggcg taggaactgg aggcgtagga2040cccggtggtg ctggaggacc ttacggtcct ggtggttccg gacccggagg tgcaggaagc2100gctggaggaa cttatggacc tggtggtttc ggaggacccg gtggtttcgg aggacccggt2160ggtgctggtg gaccctacgg tccaggtggt gctggtggac cctacggacc aggtggtgct2220ggtggaccct acggaccagg tggtgctggt ggaccctacg ggccgggtgg tgctggtgga2280ccctacgggc cgggaggtgc tggtggatcc tacgggctgg gtggtgctgg tggatcagga2340ggtgtaggac ctggtggaag tggacctgga ggttatggac ccggtggagc gggacctgga2400ggttacggac ccggtggttc tggtccaggt ggatacggac ctggcggttc tggatctggt2460ggatacggac ctggaggttc tggacctggt ggttctggac ctggtggata cggacctggt2520ggtactggac ctggtggttc tgaatctggt ggatacggac ctggtggatc tggacctggc2580ggttctggac ctggtggatc tggacctggc ggttctggac ctggtggata cggacctggt2640ggttctggac ctagcagttt tgtacctggc ggttctggac ctggtggctc tggacccggt2700ggcgctggac ccggtggcgc tggacccggt ggtgttggac ttggaggtgc tggacgtggt2760ggagctggac gtggtggagc tggaagtgtt ggagctggac gtggtggagc tggacgtggt2820ggaactgg 2828<210>17<211>724<212>DNA<213>Nephila clavipes<400>17ggaccaggag gtgtaggacc tggtggaagt ggacctggag gttatggacc cggtggagct 60ggacctggag gttacggacc tggtggttct ggtccaggtg gatacggacc cggtggttcg120ggaccaggag gatacggacc tggcggttct ggacctggtg gatacggacc aggcggttct180ggacctggtg gatacggacc aggcggttct ggacctggtg gatacggacc tggtggatat240ggacctggtg gttctggacc tggtggatat ggacctggtg gtactggacc tggtggttct300ggacccggcg gatacggacc tggtggttct ggacctggcg gttctggacc tggtggatac360ggacctggtg gttctggacc tggcggtttt ggacctggcg gttctggacc tggtggatac420ggacctggtg gctctggacc cggtggtgct ggtcccggtg gtgttggacc cggtggtttt480ggacctggtg gtgctggacc cggtggagct ggacctggtg gtgctggacc tggtggtgct540ggacctggtg gtgctggacc tggtggagct ggacctggtg gtgctggacc tggtggagct600
ggacctggtg gtgctggacc tggtggagct ggacctggtg gtgctggtgg cgctggagga660gcaggcggag caggaggttc aggtggagca ggaggatccg gcggtacaac aatcatagaa720gacttggata ttacaattga tggcgctgat ggcccgataa cgatttcaga agaattaaca780attagtggtg ctggaggttc cggacccggt ggtgctggac caggaggtgt agggcctggt840ggctccggac caggaggtgt aggacctgga ggctctggac caggaggtgt aggacctggt900ggttctggtc caggaggcgt aggacctggt ggtgctggtg gaccttacgg acctggcggt960tctggacctg gaggtgcagg cggagctgga ggacctggtg gagcatacgg acctggtgga 1020tcatatggac ctggtggttc cggaggaccc ggtggtgctg gcggaccata cggacctgga 1080ggtgaaggac ccggtggtgc tggcggaccc tacggacctg gtggtgcagg tggaccttac 1140ggcccaggtg gtgcaggtgg accctacgga ccaggtggtg aaggtggacc ctacggacca 1200ggtggatcat acggaccggg tggtgctggt ggaccatacg gaccaggtgg accctacgga 1260cctggaggtg aaggaccagg tggtgctggc ggaccctatg gaccaggagg tgtaggacct 1320ggtggaagtg gacctggagg ttatggacct ggtggaagtg gacctggagg ttatggacct 1380ggtggagctg gacctggagg ttacggacct ggtggttctg gtccaggtgg atacggaccc 1440ggtggttctg gtccaggtgg atacggaccc ggtggttccg gaccaggagg atacggacct 1500ggcggttctg gacctggtgg atacggatct ggcggtgctg gacctggtgg atacggacct 1560ggcggttctg gacctggtgg atacggtcct ggaggttctg gacctggtgg ttatggacct 1620ggtggtactg gacctggtgg tactggacct ggtggttctg gacctggcgg atacggacct 1680ggtggttctg gacctggcgg ttctggacct ggcggttctg gacctggtgg atacggacct 1740agtggttcgg gacctggtgg acacggacct agtggttctg gacctggcgg atacggtcct 1800ggcggttctg gacctggtgg atacggaccg ggtggctctg gagccggtgg tactggacct 1860ggtggcgctg gaggagcagg cggagcagga ggttcaggtg gagcaggagg ttcaggtggt 1920gcaggaggtt caggtggagc aggaggttca ggtggagtag gaggatccgg cggtacaaca 1980atcaccgaag acttggatat tacaattgat ggcgcagatg gcccgataac gatttcagaa 2040gaattaacaa ttagtggtgc tggaggttct ggacccggtg gtgctggacc aggtggtgta 2100gggcctggtg gctctggacc aggaggtgta ggacctggag tctctggacc aggaggcgta 2160ggacctggtg gttctggacc aggaggcgta ggttctggtg gttctggacc aggaggcgta 2220ggacctggtg gttacggacc tggaggttct ggatcaggag gcgtaggacc tggtggttac 2280ggacctggag gttcaggagg attttacgga cctggaggtt cagaaggacc ttatggacct 2340agtggaactt atggttctgg aggaggatat ggtcctggtg gtgctggagg accatatgga 2400cctggaagtc ctggaggagc ttatggacct ggaagccctg gaggagctta ttatcctagc 2460tcgcgtgttc ccgatatggt gaatggtata atgagtgctat gcaaggatc tggttttaac 2520
taccaaatgt ttggtaatat gctatcacaa tattcgtctg gttcaggaac atgcaatcca 2580aataatgtta atgttttgat ggatgctttg ttagctgctt tgcactgtct aagtaaccac 2640ggatcatcat cttttgcacc ttctccaact ccggctgcta tgagtgcgta ttctaattct 2700gtaggaagaa tgttcgctta ttaa 2724<210>18<211>52<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>18garcgaggag gatccatggg acgaattcac ggctaatgaa agcttactgc ac 52<210>19<211>52<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>19agctgtgcag taagctttca ttagccgtga attcgtccca tggatcctcc tc 52<210>20<211>72<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>20tccgtacggc ccaggtgcta gcgccgcagc ggcagcggct ggtggctacg gtccgggctc 60
tggccagcag gg72<210>21<211>72<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>21ctgctggcca gagcccggac cgtagccacc agccgctgcc gctgcggcgc tagcacctgg60gccgtacgga cc72<210>22<211>60<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>22tccgggccag cagggcccgg gtcaacagggtcctggccag caaggtccgg gccagcaggg60<210>23<211>60<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>23ctgctggccc ggaccttgct ggccaggacc ctgttgaccc gggccctgct ggcccggacc 60<210>24<211>105
<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>24ttctagcgcg gctgcagccg cggcagctgc gtccggcccg ggtggctacg gtccggaaaa 60ccagggtcca tctggcccgg gtggctacgg tcctggcggt ccggg105<210>25<211>105<212>DNA<213>人工序列<220>
<223>成的寡核苷酸<400>25cggaccgcca ggaccgtagc cacccgggcc agatggaccc tggttttccg gaccgtagcc 60acccgggccg gacgcagctg ccgcggctgc agccgcgcta gaacc105<210>26<211>36<212>DNA<213>人工序列<220>
<223>引物<400>26gaaaaaccat gggtgcggct tctgcagctg tatctg 36<210>27<211>45<212>DNA<213>人工序列
<220>
<223>引物<400>27gaaaagaagc tttcattagc cagcaagggc ttgagctaca gattg 45<210>28<211>34<212>DNA<213>人工序列<220>
<223>引物<400>28gaaaaaccat gggagcatat ggcccatctc cttc 34<210>29<211>45<212>DNA<213>人工序列<220>
<223>引物<400>29gaaaagaagc tttcattagc ctgaaagagc ttggctaatc atttg 45<210>30<211>12<212>PRT<213>人工序列<220>
<223>T7标记<400>30Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
1 5 10<210>31<211>216<212>PRT<213>人工序列<220>
<223>FlagN-NR<400>31Gly Glu Ser Ser Gly Gly Asp Val Gln Arg Lys Thr Asn Val Ile Ser1 5 10 15Asn Ala Leu Arg Asn Ala Leu Met Ser Thr Thr Gly Ser Pro Asn Glu20 25 30Glu Phe Val His Glu Val Gln Asp Leu Ile Gln Met Leu Ser Gln Glu35 40 45Gln Ile Asn Glu Val Asp Thr Ser Gly Pro Gly Gln Tyr Tyr Arg Ser50 55 60Ser Ser Ser Gly Gly Gly Gly Gly Gly Gln Gly Gly Pro Val Val Thr65 70 75 80Glu Thr Leu Thr Val Thr Val Gly Gly Ser Gly Gly Gly Gln Pro Ser85 90 95Gly Ala Gly Pro Ser Gly Thr Gly Gly Tyr Ala Pro Thr Gly Tyr Ala100 105 ll0Pro Ser Gly Ser Gly Ala Gly Gly Val Arg Pro Ser Ala Ser Gly Pro115 120 125Ser Gly Ser Gly Pro Ser Gly Gly Ser Arg Pro Ser Ser Ser Gly Pro130 135 140Ser Gly Thr Arg Pro Ser Pro Asn Gly Ala Ser Gly Ser Ser Pro Gly145 150 155 160Gly Ile Ala Pro Gly Gly Ser Asn Ser Gly Gly Ala Gly Val Ser Gly165 170 175
Ala Thr Gly Gly Pro Ala Ser Ser Gly Ser Tyr Gly Pro Gly Ser Thr180 185 190Gly Gly Thr Tyr Gly Pro Ser Gly Gly Ser Glu Pro Phe Gly Pro Gly195 200 205Val Ala Gly Gly Pro Tyr Ser Pro2l0 215<210>32<211>648<212>DNA<213>人工序列<220>
<223>FlagN-NR<400>32ggcgaaagca gcggaggcga tgtgcaacgc aaaaccaacg ttatctccaa cgctttgaga 60aacgccttga tgtctacaac aggcagccca aacgaagagt tcgtccatga agttcaagac120ctcatccaga tgttatctca agaacagatc aacgaggtag atacttcagg accagggcag180tactacaggt cgtcttcttc cggtggagga ggtggaggac aaggaggtcc tgtagttact240gaaacactga ccgttacagt tggcggatcc ggtggagggc aaccttcagg tgcaggtcct300agtggtacag gtggatatgc accaactgga tacgccccaa gcggctcagg tgcaggtggc360gttcgaccta gtgcctccgg tccaagtggt agtggaccta gtggtggatc tcgtcctagt420agtagtggac ctagtggaac tcgtcccagc cctaatggtg caagtggatc tagccctggt480ggtatcgcac ctggtggatc caattctggt ggtgctggag tatccggcgc aactggagga540cctgcatcca gcggctccta cggaccagga agtacaggtg gaacatatgg acctagtgga600ggaagtgaac ctttcggacc aggagtggct ggaggaccat acagccca 648<210>33<211>93<212>PRT<213>人工序列<220>
<223>FlagC-NR
<400>33Gly Ala Tyr Tyr Pro Ser Ser Arg Val Pro Asp Met Val Asn Gly Ile1 5 10 15Met Ser Ala Met Gln Gly Ser Gly Phe Asn Tyr Gln Met Phe Gly Asn20 25 30Met Leu Ser Gln Tyr Ser Ser Gly Ser Gly Thr Cys Asn Pro Asn Asn35 40 45Val Asn Val Leu Met Asp Ala Leu Leu Ala Ala Leu His Cys Leu Ser50 55 60Asn His Gly Ser Ser Ser Phe Ala Pro Ser Pro Thr Pro Ala Ala Met65 70 75 80Ser Ala Tyr Ser Asn Ser Val Gly Arg Met Phe Ala Tyr85 90<210>34<211>279<212>DNA<213>人工序列<220>
<223>FlagC-NR<400>34ggtgcttatt atcctagctc gcgtgttccc gatatggtga atggtataat gagtgctatg 60caaggatctg gttttaacta ccaaatgttt ggtaatatgc tatcacaata ttcgtctggt120tcaggaacat gcaatccaaa taatgttaat gttttgatgg atgctttgtt agctgctttg180cactgtctaa gtaaccacgg atcatcatct tttgcacctt ctccaactcc ggctgctatg240agtgcgtatt ctaattctgt aggaagaatg ttcgcttat 279<210>35<211>27<212>PRT<213>人工序列
<220>
<223>组件K<400>35Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly1 5 10 15Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr20 25<210>36<211>81<212>DNA<213>人工序列<220>
<223>组件K<400>36ggtccgggcg gtgctggcgg tccgtacggc cctggtggcg caggtgggcc atatggtccg60ggcggtgcgg gcggtccgta c 81<210>37<211>28<212>PRT<213>人工序列<220>
<223>组件sp<400>37Gly Gly Thr Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala1 5 10 15Asp Gly Pro Ile Thr Ile Ser Glu Glu Leu Thr Ile20 25<210>38<211>84
<212>DNA<213>人工序列<220>
<223>组件sp<400>38ggtggcacca ccatcattga agatctggac atcactattg atggtgcgga cggcccgatc60acgatctctg aagagctgac catc 84<210>39<211>18<212>PRT<213>人工序列<220>
<223>组件X<400>39Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly1 5 10 15Gly Ser<210>40<211>54<212>DNA<213>人工序列<220>
<223>组件X<400>40ggtggcgctg gtggcgccgg tggcgcaggt ggctctggcg gtgcgggcggttcc 54<210>41<211>30
<212>PRT<213>人工序列<220>
<223>组件Y<400>41Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly1 5 10 15Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr20 25 30<210>42<211>90<212>DNA<213>人工序列<220>
<223>组件Y<400>42ggtccgggcg gtgcgggccc aggtggctat ggtccgggcg gttctgggcc gggtggctac60ggtcctggcg gttccggccc gggtggctac 90<210>43<211>32<212>DNA<213>人工序列<220>
<223>PCR-引物<400>43gaaaaaccat gggcgaaagc agcggaggcg at 32<210>44<211>36
<212>DNA<213>人工序列<220>
<223>PCR-引物<400>44gaaaagaagc tttcattagc ctgggctgta tggtcc 36<210>45<211>33<212>DNA<213>人工序列<220>
<223>PCR-引物<400>45gaaaaaccat gggtgcttat tatcctagct cgc 33<210>46<211>42<212>DNA<213>人工序列<220>
<223>PCR-引物<400>46gaaaagaagc tttcattagc cataagcgaa cattcttcct ac42<210>47<211>90<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸
<400>47tccgggcggt gcgggcccag gtggctatgg tccgggcggt tctgggccgg gtggctacgg60tcctggcggt tccggcccgg gtggctacgg 90<210>48<211>90<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>48gtagccaccc gggccggaac cgccaggacc gtagccaccc ggcccagaac cgcccggacc60atagccacct gggcccgcac cgcccggacc 90<210>49<211>84<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>49tggcaccacc atcattgaag atctggacat cactattgat ggtgcggacg gcccgatcac60gatctctgaa gagctgacca tcgg 84<210>50<211>84<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>50gatggtcagc tcttcagaga tcgtgatcgg gccgtccgca ccatcaatag tgatgtccag 60
atcttcaatg atggtggtgc cacc 84<210>51<211>81<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>51tccgggcggt gctggcggtc cgtacggccc tggtggcgca ggtgggccat atggtccggg60cggtgcgggc ggtccgtacg g 81<210>52<211>81<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>52gtacggaccg cccgcaccgc ccggaccata tggcccacct gcgccaccag ggccgtacgg60accgccagca ccgcccggac c 81<210>53<211>54<2l2>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>53tggcgctggt ggcgccggtg gcgcaggtgg ctctggcggt gcgggcggtt ccgg 54
<210>54<211>54<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>54ggaaccgccc gcaccgccag agccacctgc gccaccggcg ccaccagcgc cacc54<210>55<211>3238<212>DNA<213>人工序列<220>
<223>克隆载体pAZL<400>55tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc 60tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt 120tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 180cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 240atcttatcat gtctggatct gatcactgct tgagcctagg agatccgaac cagataagtg 300aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac 360ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc 420cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt 480tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc 540tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa 600tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 660gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 720ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 780ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 840aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 900
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 960cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct1020attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa1080cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat1140ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc1200aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct1260tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag1320atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta1380agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc1440tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca1500tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg1560atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg1620ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca1680tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa1740acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa1800ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata1860aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat1920ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc1980cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata2040gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt2100actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga2160agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag2220cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa2280tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag2340agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg2400tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat2460acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta2520ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg2580gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc2640gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa2700gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc2760tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttgt gatgctcgt2820
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct2880tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc2940gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg3000agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt3060gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa3120taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa3180tagatcgagg aggatccatg ggacgaattc acggctaatg aaagcttact gcacagct 3238
权利要求
1.一种重组蜘蛛丝蛋白,其包括a)一个或多个合成的重复性蜘蛛丝蛋白序列,和/或b)一个或多个真正的非重复性蜘蛛丝蛋白序列。
2.权利要求1的重组蜘蛛丝蛋白,其中所述序列衍生自主要壶腹腺的蜘蛛拖丝蛋白和/或鞭状腺的蛋白。
3.权利要求1或2的重组蜘蛛丝蛋白,其中所述真正的非重复性序列衍生自天然存在的蜘蛛丝蛋白的氨基端非重复性区域(鞭形蛋白)和/或羧基端非重复性区域(鞭形和拖丝蛋白)。
4.权利要求3的重组蜘蛛丝蛋白,其中所述真正的非重复序列被修饰从而使所述序列适应于在宿主中表达,并且其优选地是SEQ ID NO14,15,32和34或其变体。
5.权利要求1-4的一项或多项的重组蜘蛛丝蛋白,其中所述拖丝和/或鞭形蛋白选自圆网蜘蛛(园蛛科)的拖丝或鞭形蛋白。
6.权利要求5的重组蜘蛛丝蛋白,其中所述拖丝蛋白衍生自十字园蛛并且所述鞭形蛋白衍生自Nephila clavipes。
7.权利要求1-6中的一项或多项的重组蜘蛛丝蛋白,其中所述拖丝蛋白是野生型ADF-3,ADF-4,MaSp I或MaSp II,所述鞭形蛋白是FLAG。
8.权利要求1-6的一项或多项的重组蜘蛛丝蛋白,其中所述拖丝蛋白是由SEQ ID NO1编码的ADF-3和/或由SEQ ID NO2编码的ADF-4或所述鞭形蛋白是SEQ ID NO6(Flag-N)和/或SEQ ID NO7(Flag-C),或其变体。
9.权利要求1-8的一项或多项的重组蜘蛛丝蛋白,其中所述合成的重复序列包括一个或多个包含聚丙氨酸的共有序列。
10.权利要求9的重组蜘蛛丝蛋白,其中包含聚丙氨酸的共有序列衍生自ADF-3,并具有SEQ ID NO3(组件A)的氨基酸序列或其变体。
11.前述权利要求的一项或多项的重组蜘蛛丝蛋白,其中所述合成的重复序列衍生自ADF-3,并包含SEQ ID NO4(组件Q)的氨基酸序列或其变体的一个或多个重复序列。
12.权利要求9-11的一项或多项的重组蜘蛛丝蛋白,其中所述合成的重复序列包含一个或多个(AQ)和/或(QAQ)作为重复单位。
13.权利要求12的重组蜘蛛丝蛋白,其中所述合成的重复序列是(AQ)12,(AQ)24,(QAQ)8或(QAQ)16。
14.权利要求1-13的一项或多项的重组蜘蛛丝蛋白,其中所述合成的重复序列衍生自ADF-4,并包含SEQ ID NO5(组件C)的氨基酸序列或其变体的一个或多个重复序列。
15.权利要求14的重组蜘蛛丝蛋白,其中所述合成的重复序列是C16或C32。
16.前述权利要求的一项或多项的重组蜘蛛丝蛋白,其中所述合成的重复序列衍生自鞭形蛋白并且是组件K(SEQ ID NO35),组件sp(SEQ ID NO37),组件X(SEQ ID NO39),和组件Y(SEQ ID NO41)。
17.权利要求16的重组蜘蛛丝蛋白,其是Y8,Y16,X8,X16,K8,或K16。
18.前述权利要求的一项或多项的重组蜘蛛丝蛋白,其中所述完整的重组蜘蛛丝蛋白包括式(QAQ)8NR3,(QAQ)16NR3,(AQ)12NR3,(AQ)24NR3,C16NR4或C32NR4,(QAQ)8,(QAQ)16,(AQ)12,(AQ)24,C16或C32。
19.一种核酸序列,其编码权利要求1-18的一项或多项的重组蜘蛛丝蛋白。
20.一种载体,其包括权利要求19的核酸序列,并且其优选地衍生自图6的克隆载体,或SEQ ID NO55,或其变体的克隆载体。
21.一种表达载体,其包括权利要求19的核酸序列和一个或多个调节序列。
22.权利要求20或21的载体,其是质粒或病毒载体,优选地是杆状病毒系统或痘苗病毒载体系统。
23.一种宿主,其已经用权利要求20-22中任一项的载体进行转化。
24.权利要求23的宿主,其是原核细胞。
25.权利要求24的宿主,其是大肠杆菌或枯草芽孢杆菌。
26.权利要求25的宿主,其是真核细胞。
27.权利要求26的宿主,其是哺乳动物细胞,植物细胞,酵母细胞或昆虫细胞。
28.权利要求27的哺乳动物细胞,其是CHO,COS,HeLa,293T,HEH或BHK细胞。
29.权利要求27的宿主,其是酵母细胞。
30.权利要求29的宿主,其是酿酒酵母,粟酒裂殖酵母,巴斯德毕赤酵母,白色念珠菌,多形汉森酵母。
31.权利要求27的宿主,其中所述昆虫细胞选自鳞翅目昆虫细胞,优选地选自Spodoptera frugiperda和粉夜蛾。
32.权利要求31的宿主,其中所述昆虫细胞是Sf9,Sf21或高效细胞。
33.权利要求27的宿主,其中所述植物细胞衍生自烟草、马铃薯、玉米,豌豆和西红柿。
34.一种蜘蛛丝蛋白聚集的方法,其包括下列步骤a)制备包含权利要求1-17的一项或多项中所定义的非取向的蜘蛛丝蛋白的蛋白质溶液;b)使在a)中制备的溶液暴露于聚集引发物;和c)回收所述沉淀的蜘蛛丝蛋白。
35.权利要求34的方法,其中在步骤a)中所用的蜘蛛丝蛋白通过用权利要求20-22的载体或权利要求19的核酸转化权利要求23到33的一项或多项的适合的宿主,并在适合的条件下表达所述蜘蛛丝蛋白来产生。
36.权利要求34或35的方法,其中所述聚集引发物选自优选地到约1的pH的酸化,磷酸钾和优选地旋转所述蛋白质溶液并应用切应力的机械应力。
37.权利要求34-36的一项或多项的方法,其还包括将在步骤a)中提供的或在步骤c)中回收的所述蛋白质通过适合的方法纺丝为丝,纳米纤维和线或形成薄膜的步骤。
38.在前述权利要求的一项或多项中定义的蛋白质/线在生物技术和/或药物领域中的应用。
39.在前述权利要求的一项或多项中定义的蛋白质/线用于制备伤口闭合或覆盖系统的应用。
40.权利要求39用于制备缝线材料的应用。
41.权利要求40的应用,其中所述缝线材料倾向于用在神经外科手术或眼科外科手术中。
42.在前述权利要求的一项或多项中定义的蛋白质/线用于制备替代材料,优选地人工软骨或腱材料中的应用。
43.在权利要求1-17的一项或多项中定义的蛋白质/线在制备汽车和飞行器部件中的应用。
44.伤口闭合或覆盖系统,缝线材料,替代材料,优选地人工软骨,腱材料,汽车部件或用在飞行器构建中的部件,其包括权利要求1-17的一项或多项的线/蛋白质或其可以通过权利要求33-36的一项或多项的方法获得。
45.一种纸产品,其包括权利要求1-17的一项或多项的重组蜘蛛丝蛋白。
46.一种纺织品或皮革制品,其包括权利要求1-17的一项或多项的重组蜘蛛丝蛋白。
47.权利要求45的纺织品或皮革制品,其中所述重组蜘蛛丝蛋白以涂层的形式存在。
48.一种凝胶或泡沫,其包括权利要求1-17的一项或多项的蛋白质或由其组成。
49.权利要求48的凝胶,其包括基于(QAQ)8NR3,(QAQ)16NR3,(AQ)12NR3,(AQ)24NR3,C16NR4或C32NR4,(QAQ)8,(QAQ)16,(AQ)12,(AQ)24,C16或C32的蛋白质或由其组成。
50.用于植入物和斯滕特固定模的涂层,其包括权利要求1-17的一项或多项的蛋白质或由其组成。
51.一种线或纤维,其包括权利要求1-17的一项或多项的蛋白质/线和另外的纤维,所述纤维不是蜘蛛来源的并且优选地是植物来源的纤维或合成纤维。
52.一种薄膜,其包括权利要求1-17的一项或多项的蛋白质或基于(QAQ)8NR3,(QAQ)16NR3,(AQ)12NR3,(AQ)24NR3,C16NR4或C32NR4,(QAQ)8,(QAQ)16,(AQ)12,(AQ)24,C16或C32的蛋白质,或由其组成。
53.权利要求52的薄膜,其包括基于(AQ)24NR3或C16的蛋白质或由其组成。
54.权利要求52或53的薄膜,其中所述薄膜表面用小有机分子和/或生物大分子,例如蛋白质、荧光素或β-半乳糖苷酶进行修饰。
全文摘要
本发明涉及重组蜘蛛丝蛋白,编码这些重组蜘蛛丝蛋白的核酸,以及适合于表达那些核酸的宿主。另外,本发明涉及聚集蜘蛛丝蛋白的方法和将所述蛋白质用在生物技术和/或药物领域和其它工业领域,特别是在制备汽车部件,在飞行器构建,在加工纺织品和皮革,以及在制备和加工纸等中的应用。
文档编号D01F4/00GK101018806SQ200580027435
公开日2007年8月15日 申请日期2005年7月21日 优先权日2004年7月22日
发明者T·沙伊贝尔, D·许梅里希, C·阿克朔特 申请人:慕尼黑技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1