蜘蛛丝蛋白和用于产生蜘蛛丝蛋白的方法

文档序号:3558742阅读:601来源:国知局

专利名称::蜘蛛丝蛋白和用于产生蜘蛛丝蛋白的方法
技术领域
:本发明涉及蛋白质的重组产生的领域。更特别地,本发明涉及蜘蛛丝蛋白的重组产生。本发明提供了新的分离的大壶腹腺蛛丝蛋白(majorampullatespidroin)和大壶腹腺蛛丝蛋白融合蛋白,以及用于产生此类蛋白的方法和多聚核酸分子。还提供了大壶腹腺蛛丝蛋白的多聚体和用于产生此类多聚体的方法。发明背景蜘蛛丝是天然的高性能多聚体,由于强度和弹性的组合,其获得了极其高的韧性。在蜘蛛中存在高达7个专门化的腺体,所述腺体产生多种具有不同机械性质和功能的丝纤维类型。由大壶腹腺(majorampullategland)产生的拖丝(draglinesilk)是韧性最强的纤维,并且基于重量其性能优于人造材料例如高强度钢和芳纶(Kevlar)。拖丝的性质在开发用于医疗或技术目的的新材料中是非常吸收人的。拖丝由两种主要的多肽(通常称为大壶腹腺蛛丝蛋白(MaSp)1和2,但在十字园妹(^T5/e^心a^迈"^)中称为ADF-3和ADF-4)组成。取决于分析的取样年龄(sampleage)和条件,这些蛋白质具有200至720kDa的表观分子量,但至今未报导过全长蜘蛛拖丝基因。在Huemmerich,D.等人,Novelassemblypropertiesofrecombinantspiderdraglinesilkproteins.Curr.Biol.14,2070-2074(2004)中描述了拖丝多肽的性质。已知的拖丝蛛丝蛋白(spidroin)由交替出现的富含丙氨酸的区段(其在纤维中形成结晶P-折叠)和富含甘氨酸的区段(其更柔韧并且大部分缺乏有序结构)的高度重复的嵌段(block)组成。C-末端区域是非重复的,是物种间高度保守的,并且采取cc-螺旋构象。拖丝蛋白的N-末端区域直至最近才得到表征,其中揭示出了在不同蛛丝蛋白之间并且还在不同蜘蛛种类之间高度保守的N-末端结构域(Rising,A.等人,N-terminalnonrepetitivedomaincommontodragline,flagel1iform,andcylindriformspidersilkproteins.Biomacromolecules7,3120-3124(2006))。拖丝的机械性质在物种之间是变化的;^//7roW力e/o;^s;的拖丝比来自例如十字园蛛或棒络新妇蛛(#e/7h7ac/aw》es)的拖丝更硬、更强(需要更大的力才能扯断)和可延伸性更低。来自^//^oW力e/7o;^M的拖丝看起来具有比来自十字园蛛的拖丝更大比例的结晶P-折叠结构,这很可能是由于^/iro^力e/2o;^MaSp在到目前为止所分析的所有种类中具有最高的聚丙氨酸含量(Pouchkina-Stantcheva,N.N.&McQueen-Mason,S.J.Molecularstudiesofanoveldraglinesilkfromanurserywebspider,Euprosthenopssp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))。产生人造蜘蛛丝的尝试已使用了天然或合成的编码拖丝蛋白的基因片段,因为至今还未曾报导过全长基因。已在各种不同的系统(包括细菌、酵母、哺乳动物细胞、植物、昆虫细胞、转基因蚕和转基因山羊)中表达重组拖丝蛋白。参见,例如Lewis,R.V.等人,Expressionandpurificationofaspidersilkproteins:anewstrategyforproducingrepetitiveproteins.ProteinExpr.Purif-7,400-406(1996);Fahnestock,S.R.&Irwin,S,L.SyntheticspiderdraglinesilkproteinsandtheirproductioninEscherichiacoli.Appl.Microbiol.Biotechnol.47,23-32(1997);Arcidiacono,S.等人,PurificationandcharacterizationofrecombinantspidersilkexpressedinEscherichiacoli.Appl,Microbiol.Biotechnol-49,31-38(1998);Fahnestock,S.R.&Bedzyk,LA.ProductionofsyntheticspiderdraglinesilkproteininPichiapastoris.Appl.Microbiol.Biotechnol.47,33-39(1997);和Lazaris,A.等人,Spidersilkfibersspun'fromsolublerecombinantsilkproducedinmammaliancells.Science295,472-476(2002)。W02004/016651(TheUniversityofYork)^^开了编码来自^"/7roW力e力o戸sp的MaSpl蛋白的内部重复部分的核酸序列。没有表达蛋白质。Huemmerich,D.等人,Primarystructureelementsofspiderdraglinesilksandtheircontributiontoproteinsolubility.Biochemistry43,13604-13612(2004)公开了合成基因"(AQ)12NR3,,,其编码重复的富含Ala和富含Gly/Gln的片段以及非重复片段(所有片段都来源于来自园蛛属(Jrs/2ez^)的ADF3)。该基因被表达成可溶性蛋白质(59.8kD,>528个氨基酸),所述蛋白质聚集但不形成多聚体或纤维。该蛋白质的丙氨酸含量是10-15%。W003/057727公开了可溶性重組丝多肽在哺乳动物细胞系和动物中的表达。一种经表达的丝多肽(ADF-3;60kD,652个氨基酸)由重复单元和非重复亲水性结构域组成。另一种经表达的丝多肽(ADF-3His;63kD,677个氨基酸)由重复单元、非重复亲水性结构域、c-myc表位和六组氨酸标签组成。所述重复单元具有低含量的Ala(10-20%)。所获得的丝多肽在水性介质中展现出差的溶解性和/或形成沉淀。因为所获得的丝多肽不会自发地聚合,因而需要进行纺丝(spinning)以获得多聚体或纤维。几个因素使拖丝蛋白的表达变得复杂。由于基因的高度重复的性质以及相伴随的所述蛋白质的受限制的氨基酸组成,因而发生转录和翻译错误。另一个原因可能是微生物表达系统中tRNA库的耗竭,以及随后的不连续翻译,从而导致蛋白质合成的过早终止。关于蛋白质合成的截短所讨论的其他原因是mRNA的二级结构的形成以及基因的重组。大于2.5kb的天然MaSp已显示在细菌宿主中是不稳定的。此外,在以可溶形式保持重组丝蛋白方面存在许多困难,因为天然来源的拖丝蛋白片段以及经设计的嵌段共聚物特别是来源于MaSpl/ADF-4的蛋白,容易地自装配成无定形聚集体,从而引起蛋白质的沉淀和损失。参见Huemmerich,D.等人,Primarystructureelementsofspiderdraglinesilksandtheircontributiontoproteinsolubility.Biochemistry43,13604-13612(2004);和Uzaris,A.等人,Spidersilkfibersspunfromsolublerecombinantsilkproducedinmammaliancells.Science295,472-476(2002)。发明概述本发明的目的是提供新的蜘蛛丝蛋白,其可提供蜘蛛丝纤维。本发明的另一个目的是提供水溶性蜘蛛丝蛋白,其可容易地进行操作以便按希望地自体聚合成纤维。这允许独特的应用,例如在纤维上培养真核细胞。此外,该性质允许在生理条件下进行所有下列步骤,这减少了毒性和蛋白质变性的风险。本发明的另外一个目的是提供新的蜘蛛丝蛋白的纤维。本发明的一个目的是以大规模提供蜘蛛丝蛋白,其可容易地进行操作以便按希望地自体聚合成纤维。本发明的目的还在于提供用于产生丝蛋白和蜘蛛丝蛋白的纤维的方法。关于根据下列公开内容将变得显而易见的这些和其他目的,根据一个方面,本发明提供了分离的大壶腹腺蛛丝蛋白或其衍生物,其中所述蛋白质由150至420个氨基酸残基组成并且由式REP-CT定义,其中REP是具有80至300个氨基酸残基的蛋白质片段,其中所述片段选自L(AG)丄、L(AG)nAL、L(GA)丄、L(GA)nGL,其中n是4至8的整数;每个独个A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0至3个不是Ala,而其余的氨基酸残基是Ala;每个独个G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly;和每个独个L区段是0至20个氨基酸残基的连接体氨基酸序列;以及CT是具有70至120个氨基酸残基的蛋白质片段,该片段是源自大壶腹腺蛛丝蛋白的C-末端片段。本发明基于鉴定足以形成丝样纤维的蛋白质基元以及所述基元用于构建重组MaSp蛋白的用途,所述重组MaSp蛋白可能在合适的宿主,例如细菌,优选大肠杆菌co//)中产生。在本发明的某些实施方案中,每个独个A区段与选自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸残基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-楊、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸残基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸残基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸残基31-42;和SEQIDNO:15的氨基酸残基122-135。在特定的实施方案中,每个独个A片段是选自该组氨基酸序列的氨基酸序列。在本发明的一些实施方案中,每个独个G区段与选自下列的氨基酸序列具有至少80°/。的同一性SEQIDNO:3的氨基酸残基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435—457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:5;SEQIDNO:6;SEQIDNO:7;SEQIDNO:9的氨基酸残基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸残基l-ll、26-45、61-74、89-111、120-149和159-172。在特定的实施方案中,每个独个G片段与选自该组氨基酸序列的氨基酸序列相同。在本发明的某些实施方案中,所述CT片段与SEQIDNO:8具有至少50%的同一性,或与选自SEQIDNO:4、SEQIDNO:9的氨基酸残基172-269、SEQIDNO:13的氨基酸残基181-276和SEQIDNO:16的氨基酸残基172-269以及图3的任何氨基酸序列(特别是图3的MaSpl序列)的氨基酸序列具有至少80%的同一性。在特定的实施方案中,所述CT片段是选自改组氨基酸序列的氨基酸序列。在本发明的某些实施方案中,在所述分离的大壶腹腺蛛丝蛋白中脂多糖(LPS)和其他致热原的含量是l个内毒素单位(EU)/mg蛋白质或更低。根据另一个方面,本发明提供了分离的融合蛋白,所述融合蛋白由作为大壶腹腺蛛丝蛋白的第一蛋白质片段和第二蛋白质片段组成,其中所述第二蛋白质片段包含融合伙伴和切割试剂识别位点,其中所述第一蛋白质片段通过所述切割试剂识别位点偶联至所述融合伙伴。本发明提供了选自X-REP-CT和REP-CT-X的分离的融合蛋白,其中REP和CT是本发明的蛋白质片段;和X是包含融合伙伴和切割试剂识别位点的蛋白质片段;其中组合的蛋白质片段REP-CT通过所述切割试剂识别位点偶联至所述融合伙伴。在本发明的某些实施方案中,在所述分离的融合蛋白中LPS和其他致热原的含量是lEU/mg蛋白质或更低。根据另外一个方面,本发明提供了用于产生本发明的大壶腹腺蛛丝蛋白的方法,其包括下列步骤(i)提供本发明的融合蛋白在液体介质中的溶液,(ii)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;和任选地,(iii)从所述液体介质中分离在步骤(ii)中获得的大壶腹腺蛛丝蛋白。本发明还提供了用于产生本发明的大壶腹腺蛛丝蛋白的多聚体的方法,其包括下列步骤(i)提供本发明的融合蛋白在液体介质中的溶液,(ii)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;(iii)允许在步骤(ii)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合;和任选地,(iv)从所述液体介质中分离在步骤(iii)中获得的多聚体。在优选的方法中,所述步骤(iii)还包括提供所述液体介质与选自气相、液相和固相的另一相之间的界面,其中所述聚合在所述界面处或在围绕所述界面的区域中开始。在优选的方法中,所述液体介质是水性介质,并且所述其他相选自空气和与水不能混溶的有机溶剂。根据另一个方面,本发明提供了分离的多聚核酸分子,其包含编码本发明的大壶腹腺蛛丝蛋白的核酸序列或其互补核酸序列。根据另外一个方面,本发明提供了分离的多聚核酸分子,其包含编码本发明的融合蛋白的核酸序列或其互补核酸序列。本发明的另一个方面在于用于产生本发明的可溶性融合蛋白的方法,其包括下列步骤(i)在合适的宿主中表达编码本发明的可溶性融合蛋白的多聚核酸分子;和(ii)分离在步骤(U中获得的可溶性融合蛋白。任选地,分离可溶性融合蛋白的所述步骤(ii)包括除去LPS和其他致热原。本发明还提供了用于产生本发明的大壶腹腺蛛丝蛋白的方法,其包括下列步骤(i)在合适的宿主中表达编码本发明的可溶性融合蛋白的多聚核酸分子;(ii)分离在步骤(i)中获得的可溶性融合蛋白;(iii)提供在步骤(ii)中获得的所述可溶性融合蛋白在液体介质中的溶液;(iv)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;和任选地,(v)从所述液体介质中分离在步骤(iv)中获得的大壶腹腺蛛丝蛋白。此外,任选地,分离可溶性融合蛋白的所述步骤(ii),和任选地,分离大壶腹腺蛛丝蛋白的所述步骤(v),包括除去LPS和其他致热原。本发明还提供了用于产生本发明的大壶腹腺蛛丝蛋白的多聚体的方法,其包括下列步骤(i)在合适的宿主中表达编码本发明的可溶性融合蛋白的多聚核酸分子;(ii)分离在步骤(i)中获得的可溶性融合蛋白;(Hi)提供在步骤UO中获得的所述可溶性融合蛋白在液体介质中的溶液;(iv)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;(v)允许在步骤(iv)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合;和任选地,(vi)从所述液体介质中分离在步骤(V)中获得的多聚体。在优选的方法中,所述步骤(v)还包括提供所述液体介质与选自气相、液相和固相的另一相之间的界面,其中所述聚合在所述界面处或在围绕所述界面的区域中开始。在优选的方法中,所述液体介质是水性介质,并且所述其他相选自空气和与水不能混溶的有机溶剂。根据另一个方面,本发明提供了本发明的大壶腹腺蛛丝蛋白的多聚体。本发明还提供了可通过本发明的方法获得的大壶腹腺蛛丝蛋白的多聚体。在优选的实施方案中,所述多聚体是纤维。在其他优选的实施方案中,所述多聚体形成选自泡沫、凝胶、网状物或薄膜的结构。根据另外一个方面,本发明提供了包含融合伙伴和切割试剂识别位点的蛋白质片段在制备融合蛋白中的新用途,所述融合蛋白包含通过所述切割试剂识别位点偶联至蜘蛛丝蛋白质片段的所述蛋白质片段。在优选的实施方案中,所述蜘蛛丝蛋白片段由lso至4"个氨基酸残基组成。根据最后的方面,本发明提供了分离的多聚核酸分子,其包含选自SEQIDNO:1和编码SEQIDNO:2-16的核酸序列的核酸序列,或其互补核酸序列。本发明还提供了所述分离的多聚核酸分子在制备编码蜘蛛丝蛋白的非天然基因中的用途。附图简述图1是在^w;i^st力e/70/^MaSpl蛋白茛卩SEQIDNO:3的重复部分内的区段的比对。图2A图解说明了细ro"力e卿sai/"ra//sMaSpl蛋白(SEQIDNO:3)的重复部分的示意性的、预测的结构组织。图2B图解说明了根据实施例5-8构建的蛛丝蛋白(SEQIDNO:9-13)的示意性的、预测的结构组织。C-末端区域的比对,其中图解说明了它们的保守性质。图4图解说明了从根据实施例5-8构建的蛛丝蛋白形成的纤维的肉眼可见的外观。(A):6Gly/Ala-CT一蛋白(SEQIDNO:13)纤维,标尺O.5cm;(B):5Gly/Ala-CTnat蛋白(SEQIDNO:9)纤维,标尺lcm;(C):5Gly/Ala-CTnat蛋白(SEQIDNO:9)纤维,标尺1cm。图5显示了从根据实施例5-8构建的蛛丝蛋白形成的纤维的扫描电子显微术(SEM)显微照片。来自6Gly/Ala-CThyb(SEQIDNO:13)的单根纤维(a)和凝胶相(b、c)。在75%甲醇中进行拉伸的、经空气干燥的并放置在SEM-样品台(SEM-stubs)上的5Gly/Ala-CTnat(SEQIDNO:9)的纤维(d、e、f)。在空气干燥前扭曲的纤维(e),纤维的末端(f)。图6展示了6Gly/Ala-CThyb(SEQIDNO:13)纤维的圆二色性(CD)光谱。图7图解说明了来自小鼠肥大细胞毒性研究的结果,所述结果显示了在体外产生的丝纤维存在或不存在的情况下培养3天后,活细胞和死细胞的数目。图8是在生物相容性研究中,在暴露于体外产生的丝纤维后HEK293细胞的照片。图9是应力(stress)-应变(strain)曲线,其展示了来自5Gly/Ala-CTnat(SEQIDNO:9)的双拉伸纤维(doubledrawnfiber)的拉伸强度(tensilestrength)。图IO显示了来自5Gly/Ala-CTnat(SEQIDNO:9)的重組纤维的SEM显微照片。a、b,自发形成的纤维。特写图像(b)显示了原纤维亚结构。凸出的原纤维(箭头)具有大约300nm的宽度。c-f,在2轮绷紧-松弛循环后的纤维。c和d显示了不同放大倍数下的相同纤维。e显示了经切割的纤维末端,和f显示了在拉伸试验后的断裂点。发明详述总的来说,本发明基于鉴定足以用于重组产生蜘蛛丝纤维的蛛丝蛋白基元。所述基元基于从来自^"/7roW力e/70/^s〃"/^h的部分主要蛛丝蛋白1(majorspidroin1,MaSpl)的cDNA的克隆和测序中推导出的氨基酸序列。由此断定,该分离的MaSplcDNA可用作用于构建新的蛛丝蛋白基因(例如此处报导的那些基因)的起始点。从由所述新的蛛丝蛋白cDNA产生的蛋白质形成的多聚体就它们的物理性质特别是高强度、弹性和轻重量的有用组合而言是有用的。就它们支持细胞粘着和生长的能力而言,它们也是有用的。拖丝的性质在开发用于医疗或技术目的的新材料方面是有吸引力的。特别地,本发明的蜘蛛丝可用于医疗装置例如植入物,和医疗产品例如用作伤口闭合系统(woundclosuresystem)、急救绷带(band-aid)、缝线、伤口敷料(wounddressing)以及用于组织工程和受指导的细胞再生的支架。本发明的蜘蛛丝还特别地可用于在例如降落伞、防弹服、座椅安全带等中用作织品或织物。此处所使用的术语"纤维"涉及厚度为至少ljim的多聚体,优选地涉及肉眼可见的(macroscopic)多聚体,所迷肉眼可见的多聚体是人眼可见的,即厚度为至少ljam,并且在长度上与其厚度相比具有相当大的延伸,优选大于5mm。术语"纤维"不包括未组织的聚集体或沉淀0术语"大壶腹腺蛛丝蛋白"、"蛛丝蛋白,,在整个本说明书中可互换使用,并且包括所有已知的"大壶腹腺蛛丝蛋白",通常缩写为"MaSp,,,或在十字园蛛的情况下缩写为"ADF"。这些大壶腹腺蛛丝蛋白通常为两种类型,即类型1和2。此外,这些术语还包括所附权利要求书中定义的本发明的新型蛋白质,以及与已知的大壶腹腺蛛丝蛋白具有高度同一性和/或相似性的其他非天然蛋白质。本发明者已利用鉴定出的蛛丝蛋白基元来构建编码非天然蛛丝蛋白的新型基因构建体。已发现,由150至420个氦基酸残基,即大于或等于150个,优选大于或等于220个,优选大于或等于个氨基酸残基,并且小于或等于420个,优选小于或等于380个,优选小于或等于320,优选小于或等于280个氨基酸残基,例如220-360个氨基酸残基组成的大壶腹腺蛛丝蛋白可以例如在细菌或其他合适的生产生物中重组产生。所得到的蛛丝蛋白自发地形成本发明的肉眼可见的丝纤维。这是令人吃惊的结果,因为天然发生的蛛丝蛋白以及先前已知的、重组产生的、形成纤维的蛛丝蛋白比本发明的蛋白长得多。此外,天然发生的蛛丝蛋白以及先前已知的、重组产生的、形成纤维的蛛丝蛋白倾向于包含大量的内部重复序列并且需要使用纺丝和/或烈性(harsh)溶剂来进行聚合。在此处第一次显示了,蛛丝蛋白可自发地在体外形成纤维。此处提供的数据还显示,只需要提供一部分的蛛丝蛋白序列来指导纤维形成。此外,包含^/;7roW/e/^ps重复结构域和新妇蛛(非重复C-末端结构域的种间杂合体(参见实施例6C)也形成纤维,这表明该基元的形成纤维的潜能是很强的。在其总的方面,本发明的大壶腹腺蛛丝蛋白由式REP-CT来定义。REP蛋白片段和CT蛋白片段通常通过肽键而共价偶联。蛋白质片段REP具有重复的特征,在富含丙氨酸的片段和富含甘氨酸的片段之间交替。REP片段通常包含大于80个,例如大于140个,并且小于300个,优选小于240,例如小于200个氨基酸残基,并且其本身可分成几个L(连接体)区段、A(富含丙氨酸的)区段和G(富含甘氨酸的)区段,如将在下面更详细地解释的。通常,所述连接体区段(其为任选的)位于REP片段末端,而其余的区段依次为富含丙氨酸的和富含甘氨酸的区段。因此,REP片段通常可具有下列结构中的任一种,其中n是整数L(AGKL,伊J3口LA^iA^AsGsA^AsGsL;L(AG)nAL,例如LA^A^AsG^AsGsAsL;L(GA)丄,LdAiGaA^^^A^sAsL;或L(GA)nGL,例如LG^A^A^GsAsG^由此断定,富含丙氨酸或富含甘氨酸的区段是否与N-末端或C-末端连接体区段相邻不是至关重要的。优选地,n是4至8的整数,更优选4至6的整数,即n-4、r^5或n-6。在优选的实施方案中,本发明的REP片段的丙氨酸含量高于20%,优选高于25%,更优选高于30%,并且低于50%,优选低于40%,更优选低于35%。这是有利的,因为可预见更高的丙氨酸含量提供更硬的和/或更强的和/或可延伸性更低的纤维。对此的原因可能是,更高的丙氨酸含量与纤维中更高含量的P-折叠结构相关。因此,在优选的实施方案中,在本发明的大壶腹腺蛛丝蛋白的多聚体例如纤维中的p-折叠含量高于50%,即该蛋白质的超过50%的二级结构是P-折叠形式。在某些实施方案中,REP片段缺乏脯氨酸残基,即在REP片段中没有Pro残基。现在转向构成本发明的REP片段的区段,将要强调的是,每个区段是独个的(individual),即特定的REP片段的任何两个A区段、任何两个G区段或任何两个L区段可以是相同的或可以不是相同的。因此,各类型的区段在特定REP片段内是相同的这一点不是本发明的一般特征。相反地,下列公开内容为本领域技术人员提供了关于如何设计独个区段并将它们集合至REP片段中的指导方针,所述REP片段是本发明的功能性蛛丝蛋白的部分。从此处提供的实验数据中得出结论,每个独个A区段是具有8至18个氨基酸残基的氨基酸序列。优选地,每个独个A区段包含13至15个氨基酸残基。还可能地,大部分或超过两个的A区段包含13至15个氨基酸残基,以及少数例如一个或两个A区段包含8至18个氨基酸残基,例如8-12个或16-18个氨基酸残基。这些氨基酸残基的绝大部分是丙氨酸残基。更特别地,Q至3个氨基酸残基不是丙氨酸残基,并且其余的氨基酸残基是丙氨酸残基。因此,无例外地或除了1、2或3个氨基酸残基可以是任意氨基酸外,每个独个A区段中的所有氨基酸残基是丙氨酸残基。优选的是,取代丙氨酸的氨基酸是天然氨基酸,优选独个地选自丝氨酸、谷氨酸、半胱氨酸和甘氨酸,更优选丝氨酸。当然,可能的是,一个或多个A区段是全丙氨酸区段,而其余的A区段包含l至3个非丙氨酸残基例如丝氨酸、谷氨酸、半胱氨酸或甘氨酸。在优选的实施方案中,每个A区段包含13-15个氨基酸残基,其中包括10-15个丙氨酸残基和0-3个上述的非丙氨酸残基。在更优选的实施方案中,每个A区段包含13-15个氨基酸残基,其中包括12-15个丙氨酸残基和0—1个上述的非丙氨酸残基。优选地,每个独个A区段与选自SEQIDNO:3的氨基酸残基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073的氨基酸序列具有至少80%的同一性。该组的各序列相应于^/pr0^力e/o;^sws"a/"MaSpl蛋白的天然发生的序列的区段,所述序列是从相应的cDNA的克隆过程中推导出来的(参见实施例1-2和图1-2A)。备选地,每个独个A区段与选自SEQIDNO:9的氨基酸残基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸残基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸残基31-42;和SEQIDNO:15的氨基酸残基122-135的氨基酸序列具有至少80%的同一性。该组的各序列相应于经表达的本发明的非天然蛛丝蛋白的区段,所述蛋白具有在合适的条件下形成丝纤维的能力。参见实施例5-8、12,以及图2B。不希望受任何特定理论的束绰,设想了,本发明的A区段形成螺旋结构或0-折叠。如下计算了在整个说明书和所附权利要求书中所使用的术语"同一性百分比,,。使用CLUSTALW算法(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.,NucleicAcidsResearch,22:4673-4680(1994))将查询序列与靶序列进行比对。比较每个位置上的氨基酸残基,并将查询序列中具有在靶序列中的相同的相应残基的位置的百分比报道为同一性百分比。如对于"同一性百分比"所描述的,计算在整个说明书和所附权利要求书中所使用的术语"相似性百分比",除了疏水残基Ala、Val、Phe、Pro、Leu、Ile、Trp、Met和Cys是相似的;碱性残基Lys、Arg和His是相似的;酸性残基Glu和Asp是相似的;以及亲水性的、不带电荷的残基Gln、Asn、Ser、Thr和Tyr是相似的外。在该情形下,剩下的天然氨基酸Gly与任何其他氨基酸都不相似。在整个本说明书中,本发明的备选的实施方案并不满足指定的同一性百分比,而是满足相应的相似性百分比。其他备选的实施方案满足指定的同一性百分比,以及另一个更高的相似性百分比,其选自对于各序列的优选同一性百分比。例如,序列可以与另一个序列70%相似;或者其可以与另一个序列70%同一;或者其可以与另一个序列70%同一和90%相似。在本发明的优选实施方案中,每个独个A区段与选自下列的氨基酸序列具有至少90%,更优选95°/。,最优选100°/。的同一性SEQIDNO:3的氨基酸残基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸残基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸残基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸残基31-42;和SEQIDNO:15的氨基酸残基122-135。因此,在本发明的某些实施方案中,每个独个A区段与选自上述氨基酸区段的氨基酸序列相同。此外,从此处提供的实验数据中得出结论,每个独个G区段是l2至30个氨基酸残基的氨基酸序列。优选地,每个独个G区段由14至23个氨基酸残基组成。每个G区段的至少40%的氨基酸残基是甘氨酸残基。通常,每个独个G区段的甘氨酸含量在40。/。至60y。的范围内。优选地,每个独个G区段与选自SEQIDNO:3的氨基酸残基20-42、57-70、84-106、121-134、148-170、184—197、212-234、249—265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092的氨基酸序列具有至少80°/。的同一性。该组的各序列相应于i^/7ro^力e"Oj^aw"ra/"MaSpl蛋白的天然发生的序列的区段,所述序列是从相应的cDNA的克隆过程中推导出来的(参见实施例1-2和图l-2A)。备选地,每个独个G区段与选自SEQIDNO:9的氨基酸残基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸残基l-ll、26-45、61-74、89-111、120-149和159-172的氨基酸序列具有至少80%的同一性。该组的各序列相应于经表达的本发明的非天然蛛丝蛋白的区段,所述蛋白具有在合适的条件下形成丝纤维的能力。参见实施例5-8、12,以及图2B。在本发明的优选实施方案,每个独个G区段与选自下列的氨基酸序列具有至少90%,更优选95%,最优选100%的同一性SEQIDNO:3的氨基酸残基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:9的氨基酸残基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸残基1-11、26-45、61-74、89-111、120-149和159-172。因此,在本发明的某些实施方案中,每个独个G区段与选自上述氨基酸区段的氨基酸序列相同。在某些实施方案中,本发明的每个G区段的前两个氨基酸残基不是-Gln-Gln-。在某些实施方案中,相应于保守的Tyr残基(即相应于SEQIDNO:5中的位置16,SEQIDNO:6中的位置10,和SEQIDNO:7中的位置7)的位置在本发明的任何G区段中不是Phe。在某些实施方案中,相应于保守的Tyr残基(即相应于SEQIDNO:5中的位置16,SEQIDNO:6中的位置10,和SEQIDNO:7中的位置7)的位置在本发明的每个G区段中是Tyr。由此断定,本发明蛋白质的某些实施方案展示了上述限制条件的组合,即本发明的每个G区段的前两个氨基酸残基不是-Gin-Gln-,并且保守的Tyr残基(即相应于SEQIDNO:5的位置16,SEQIDNO:6中的位置IO,和SEQIDNO:7中的位置7)在本发明的每个G区段中是Tyr。在某些实施方案中,上述限制条件(分开地或以任何可能的组合形式采用)可进一步与REP片段缺乏脯氨酸残基这一上文所述的限制条件相组合。参考图1-2以及实施例3-4,存在3个亚型的本发明的G区段。i亥分类基于^"/7rosf力e/20psMaSpl蛋白质序歹'J(图1-2A)的仔细分析,并且已在构建新的非天然蜘蛛丝蛋白中釆用和验证了所述信息(图2B)。本发明的G区段的第一种亚型由氨基酸单字母共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(如图2A和SEQIDNO:5中所示的)表示。该第一种并且通常最长的G区段亚型通常包含23个氨基酸残基,但可包含少至17个氨基酸残基,并且不存在带电荷的残基或包含一个带电荷的残基。因此,优选的是,该第一种G区段亚型包含17-23个氨基酸残基,但可预见其可包含少至12个或多至30个氨基酸残基。不希望受任何特定理论的束缚,设想了,该亚型形成巻曲结构(coilstructure)或3广螺旋结构。该第一种亚型的代表性G区段是SEQIDNO:3的氨基酸残基20-42、84-106、148-170、212-234、307-329、371-393、435-457、530-552、595-617、689-711、753-775、817-839、881-903、946-968、1043-1059和1074-1092;SEQIDNO:9的氨基酸残基11-30、105-121和136-152;和SEQIDNO:13的氨基酸残基26-45和89-lll。该第一种亚型的备选的G区段是SEQIDNO:13的氨基酸残基120-149和159-172。在某些实施方案中,本发明的该第一种亚型的每个G区段的前两个氨基酸残基不是-Gln-Gln-。本发明的G区段的第二种亚型由氨基酸单字母共有序列GQGGQGQG(G/R)YGQG(A/S)G(S/G)S(如图2A和SEQIDNO:6中所示的)表示。该第二种并且通常中等大小的G区段亚型通常包含17个氨基酸残基,并且不存在带电荷的残基或包含一个带电荷的残基。优选的是,该第二种G区段亚型包含14-20个氨基酸残基,但可预见其可包含少至12个或多至30个氨基酸残基。不希望受任何特定理论的束繂,设想了,该亚型形成巻曲结构。该第二种亚型的代表性G区段是SBQIDNO:3的氨基酸残基249-265、471-488、631-647和982-998;和SEQIDNO:9的氨基酸残基43-60。本发明的G区段的第三种亚型由氨基酸单字母共有序列G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(如图2A和SEQIDNO:7中所示的)表示。该第三种G区段亚型通常包含14个氨基酸残基,并且通常是最短的本发明的G区段亚型。优选的是,该第三种G区段亚型包含12-17个氨基酸残基,但可预见其可包含多至23个氨基酸残基。不希望受任何特定理论的束繂,设想了,该亚型形成转角结构。该第三种亚型的代表性G区段是SEQIDNO:3的氨基酸残基57-70、121-134、184-197、280-293、343-356、407-420、503-516、567-580、662-675、726-739、790-803、854-867、918-931、1014-1027;SEQIDNO:9的氨基酸残基76-89;和SEQIDNO:13的氨基酸残基61-74。该第三种亚型的备选的G区段是SEQIDNO:13的氨基酸残基1-11。因此,在优选的实施方案中,每个独个G区段与选自SEQIDNO:5、SEQIDNO:6和SEQIDNO:7的氨基酸序列具有至少80%、优选90%、更优选95%的同一性。在REP片段的A和G区段的交替排列性序列的优选实施方案中,每第二个G区段是第一种亚型,而其余的G区段是第三种亚型,例如...A1G短A2G长A3G短A4G长A5G短...。在REP片段的另一个优选实施方案中,一个第二种亚型的G区段通过插入而打断了G区段的规律性(regularity),例如...AG短A2G长A3G中等A4G短A5G长...。每个独个L区段代表可有可无的连接体氨基酸序列,其可包含0至20个氨基酸残基,例如0至IO个氨基酸残基。虽然该区段是可有可无的,并且对于蛛丝蛋白在功能上不是至关重要的,但是其的存在仍然允许荻得完全功能性的蛛丝蛋白,从而形成本发明的蜘蛛丝纤维。在来自^7/7rost/e/K7;7sau"rs//s的MaSpl蛋白的经推导的氨基酸序列的重复部分(SEQIDNO:3)中也存在连接体氨基酸序列。特别地,连接体区段的氨基酸序列可与所描述的A或G区段中任一个相似,但通常不足以满足它们的在此处定义的标准。如图2A中所示的,排列在REP片段的C-末端部分的连接体区段可由富含丙氨酸的氨基酸单字母共有序列ASASAAASAASTVANSVS和ASAASAAA代表。事实上,可以认为第二种序列是本发明的A区段,而第一种序列与本发明的A区段具有高度的相似性。本发明的连接体区段的另一个实例具有单字母氨基酸序列GSAMGQGS,该序列富含甘氨酸并且与本发明的G区段具有高度的相似性。代表性的L区段是SEQIDNO:3的氨基酸残基1-6和1093-1110;SEQIDNO:9的氨基酸残基1-10和153-171;和SEQIDNO:13的氨基酸残基173-180,但本领域技术人员将容易地认识到,对于这些区段存在许多合适的备选的氨基酸序列。在本发明的REP片段的一个实施方案中,所述L区段之一包含O个氨基酸,即所述L区段之一是没有的。在本发明的REP片段的另一个实施方案中,两个L区段都包含0个氨基酸,即两个L区段都是没有的。因此,本发明的REP片段的这些实施方案可如下示意性地表示(AG)nL、(AG)nAL、(GA)丄、(GA)nGL;L(AG)n、L(AG)nA、L(GA)n、L(GA)nG;和(AG)。、(AG)nA、(GA)n、(GA)nG。这些REP片段中的任一片段适合于与下面定义的任何CT片段一起使用。本发明的蛛丝蛋白的C-末端(CT)片段与蛛丝蛋白的C-末端氨基酸序列具有高度的相似性。如图3中所示的,该氨基酸序列在各种不同的物种以及蛛丝蛋白(包括MaSpl和MaSp2)中是非常保守的。在下列实施例中证明了,哪一个特定的CT片段存在于本发明的蛛丝蛋白中不是至关重要的,只要CT片段不完全丢失。因此,本发明的CT片段可选自图3中显示的氨基酸序列中的任一序列或具有高度相似性的序列。值得注意的是,SEQIDNO:13的CThyb片段与共有氨基酸序列SEQIDNO:8具有96。/。的同一性,而SEQIDNO:9的CX"片段只展示出与共有氨基酸序列SEQIDNO:8具有59%的同一性。这说明,各种各样的C-末端序列可以用于本发明的蛛丝蛋白。本发明的CT片段的序列与共有氨基酸序列SEQIDNO:8(其基于图3的氨基酸序列)具有至少50%的同一性,优选至少60%的同一性。在优选的实施方案中,本发明的CT片段的序列与共有氨基酸序列SEQIDNO:8的氨基酸残基1-71具有至少65%的同一性,优选至少70%的同一性。在优选的实施方案中,本发明的CT片段进一步地与共有氨基酸序列SEQIDNO:8或其氨基酸残基1-71具有70%,优选80%的相似性。本发明的代表性CT片段是fuproW力e/7o;^ai^m/"序列SEQIDNO:4、fw/7ro"力e/20;^SiAJ"a/2来源的SEQIDNO:9的氨基酸残基172-269和SEQIDNO:13的氨基酸残基181-276,其据称来源于fz;/7ro"力e/7op";7(Pouchkina-Stantcheva,N.N.&McQueen-Mason,S.J.Molecularstudiesofanoveldraglinesilkfromanurserywebspider,五i/;ro"/fe/7o;^sp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004)),但与来自棒络新妇妹和塞内力口尔络新妇珠(seiega/e/3S2's)的MaSpl具有高度的相似性。因此,根据本发明的优选方面,CT片段与SEQIDN0:4;SEQIDNO:9的氨基酸残基172-269;SEQIDNO:13的氨基酸残基181-276;SEQIDNO:16的氨基酸残基172-269;或图3和实施例4的任何独个MaSpl/ADF-4氨基酸序列具有至少80°/。的同一性。在本发明的优选方面,CT片段与SEQIDNO:4;SEQIDNO:9的氨基酸残基172-269;SEQIDNO:13的氨基酸残基181-276;SEQIDNO:16的氨基酸残基172-269;或图3和实施例4中的任何独个MaSpl/ADF-4氨基酸序列具有至少90%,例如至少95%的同一性。在本发明的优选方面,CT片段与SEQIDNO:4;SEQIDNO:9的氨基酸残基172-269;SEQIDNO:13的氨基酸残基181-276;SEQIDNO:16的氨基酸残基172-269;或图13和实施例4的任何独个MaSpl/ADF-4氨基酸序列相同。CT片段通常由70至120个氨基酸残基组成。优选的是,CT片段包含至少70个,或大于80个,优选大于90个氨基酸残基。也优选的是,CT片段包含至多120个,或小于110个氨基酸残基。典型的CT片段包含大约100个氨基酸残基。根据另一个方面,本发明提供了分离的融合蛋白,其由作为大壶腹腺蛛丝蛋白的第一蛋白质片段(优选地由150至420个氨基酸残基组成)和包含融合伙伴及切割试剂识别位点的第二蛋白质片段组成。第一蛋白质片段通过切割试剂识别位点偶联至融合伙伴,即,可通过用合适的切割试剂在合适的条件下处理融合蛋白来切掉融合伙伴,从而提供大壶腹腺蛛丝蛋白,其优选地由150至420个氨基酸残基组成。该融合蛋白的优点是,当在合适的宿主,例如细菌,优选大肠杆菌中产生时,可在溶液中,优选在生理学介质中,通常在緩冲水性介质例如10-100mMTris-HCl緩冲液,pH6-9中产生大量的融合蛋白,而不引起沉淀和其他生产问题。溶液中的融合蛋白在长时间内,通常在数天或数周内是溶解的,这有利于大规模生产且降低了蛋白质聚集的风险。术语"溶解的,,和"在溶液中"是指,所述蛋白质不以可见的方式聚集,并且在60OOOxg下不会从溶剂中沉淀出来。根据所希望的,溶液中的融合蛋白可经历使用合适的切割试剂进行的切割,从而提供自发形成丝纤维的大壶腹腺蛛丝蛋白。在优选的方面,本发明提供了选自X-REP-CT和REP-CT-X的分离的融合蛋白,优选X-REP-CT。REP和CT是本发明的蛋白质片段,这暗示着所得到的REP-CT这种形式的MaSp蛋白是本发明的MaSp蛋白。X是此处定义的包含融合伙伴和切割试剂识别位点的蛋白质片段。该组合的蛋白质片段REP-CT通过切割试剂识别位点与融合伙伴偶联。本发明的融合伙伴包括提高其伙伴蛋白质片段(此处为本发明的MaSp蛋白)的溶解性和/或稳定性的任何蛋白质片段。融合伙伴也提供了用于亲和純化的合适的手段。不局限于此,本发明的融合伙伴的实例包括硫氧还蛋白、麦芽糖结合蛋白、谷胱甘肽S-转移酶(GST)、MTB32-C、Gbl、ZZ和NusA。本领域技术人员熟知备选的合适的融合伙伴。在本发明的优选实施方案中,融合伙伴是与His标签以及S标签相组合的硫氧还蛋白部分(ThrX)。在本发明的一个优选实施方案中,融合伙伴是与2个His标签相组合的ThrX部分,即His标签/ThrX/His标签。在本发明的另一个优选实施方案中,融合伙伴是多克氧还蛋白部分(ThrX)。切割试剂识别位点位于偶联至MaSp蛋白片段的该X蛋白片段末端,从而在该识别位点处的切割导致产生MaSp蛋白和融合伙伴。不局限于此,本发明的切割试剂识别位点的实例包括具有氨基酸序列LVPRGS(在R和G之间切割)的凝血酶识别位点;具有氨基酸序列DDDK(在K后切割)的肠激酶识别位点;具有氨基酸序列NG(在N和G之间切割)的羟胺识别位点;具有氨基酸序列LGVLFQGP(在Q和G之间切割)的HRV3C蛋白酶识别位点;具有氨基酸序列I(E/D)GR(在R后切割)的凝血因子Xa识别位点;具有氨基酸序列EXXYXQ(G/S),通常ENLYFQG(在Q和G/S之间切割)的TEV识别位点;具有氨基酸序列EDNLYFQG(在Q和G之间切割)的Ac-TEV识别位点;和具有氨基酸序列LEVLFQGP(在Q和G之间切割)的PreScission识别位点。其他合适的识别位点是关于胰蛋白酶、内切蛋白酶、V8蛋白酶、胃蛋白酶和CNBr的切割位点。合适的切割识别位点的其他实例完全在本领域技术人员能力所达的范围内。在本发明的优选实施方案中,切割试剂识别位点是凝血酶识别位点。在优选的实施方案中,本发明的X片段具有结构ThrX/His-标签/S-标签/凝血酶切割位点,并且X片段偶联至本发明的REP-CT蛋白质片段的N-末端。在一个优选的实施方案中,本发明的X片段具有结构His-标签/ThrX/His-标签/凝血酶切割位点,并且X片段偶联至本发明的REP-CT蛋白质片段的N-末端。根据另一个方面,本发明提供了用于产生本发明的大壶腹腺蛛丝蛋白的方法。在第一个步骤中,提供本发明的融合蛋白在液体介质中的溶液。优选地,融合蛋白不聚集,从而不需要再溶解过程。可重组产生融合蛋白,并使用在融合蛋白上的亲和手段例如His-标签或在融合蛋白中的任何合适表位来纯化所述融合蛋白。液体介质可以是任何合适的介质,优选生理学介质,通常为緩冲水性介质,例如10-lOOmMTris-HCl緩冲液,pH6-9。在第二个步骤中,为了在切割试剂识别位点处获得融合蛋白的切割,向液体介质中加入本发明的切割试剂。如上面所公开的,由此获得本发明的大壶腹腺蛛丝蛋白。在第三个任选的步骤中,使用合适的分离技术例如层析和/或过滤从液体介质中分离如此获得的大壶腹腺蛛丝蛋白。根据另一个方面,本发明提供了用于产生本发明的大壶腹腺蛛丝蛋白的多聚体的方法。在第一个步骤中,提供本发明的融合蛋白在液体介质中的溶液。优选地,融合蛋白不聚集,从而不需要再溶解过程。可重组产生融合蛋白,并使用在融合蛋白上的亲和手段例如His-标签或在融合蛋白中的任何合适表位来纯化所述融合蛋白。液体介质可以是任何合适的介质,优选生理学介质,通常为緩沖水性介质,例如10-100mMTris-HCl緩冲液,pH6-9。在第二个步骤中,为了在切割试剂识别位点处获得融合蛋白的切割,向液体介质中加入本发明的切割试剂。如上面所公开的,由此获得本发明的大壶腹腺蛛丝蛋白。在第三个步骤中,使如此获得的大壶腹腺蛛丝蛋白在液体介质中聚合。聚合通常在两种不同相之间的界面例如液/空气、液/固和水/油界面处开始。因此,该第三个步骤还可进一步包括提供液体介质和另一相之间的界面。所述另一相选自气相、液相和固相。如上所述,液体介质通常是水性介质,并且合适的其他相例如为空气和与水不能混溶的有机溶剂,例如油,例如适合用于PCR反应的矿物油。所得到的界面的存在刺激在该界面处或在围绕该界面的区域中的聚合,所述区域延伸入液体介质中,从而所述聚合在所述界面处或在所述界面区域中开始。优选的界面包括水/空气和水/油界面。当在室温下温育时,聚合通常在数分钟或数小时内,例如在1分钟至5小时内自发发生。在第四个任选的步骤中,使用合适的分离技术从液体介质中分离如此获得的大壶腹腺蛛丝蛋白的多聚体。如上所述,通过从融合蛋白中蛋白水解释放小型的蛛丝蛋白来引起纤维形成。如果在从一侧至另一侧轻轻地摇动的试管中进行切割反应,则纤维沿着试管在空气-水界面处形成。试管可由任何合适的材料例如塑料或玻璃制成。如果允许切割混合物静置,则在空气-水界面处形成薄膜。如果在水性切割混合物之上加入油,则在油-水界面处形成薄膜,其中让其静置或摇动。如果例如通过空气起泡或搅打来使切割混合物发泡,则泡沫是稳定的,并且如果允许干燥则发生凝固。通过使用本发明的方法,可能重组产生大量的本发明的融合蛋白,所述融合蛋白可被切割,并且被允许按所希望的进行聚合。这提供了聚合过程的更好的控制,并允许优化参数以获得具有所需性质的丝纤维。通常使用各种合适的宿主来重组产生本发明的大壶腹腺蛛丝蛋白。根据另一个方面,本发明因此提供了分离的多聚核酸分子,其包含编码本发明的大壶腹腺蛛丝蛋白的核酸序列或其互补核酸序列,例如SEQIDNO:9-13,优选SEQIDNO:9、12和13。这些多聚核酸分子以及编码此处公开的各种不同蛋白质的多聚核酸分子(SEQIDNO:2-16)还可用于进一步开发非天然蛛丝蛋白或其生产系统。通常使用各种合适的宿主例如细菌、酵母、哺乳动物细胞、植物、昆虫细胞和转基因动物来重组产生本发明的融合蛋白。优选的是,在细菌中产生本发明的融合蛋白。根据另一个方面,本发明因此提供了分离的多聚核酸分子,其包含编码本发明的融合蛋白的核酸序列或其互补核酸序列。所述多聚核酸分子还可用于进一步开发非天然蛛丝蛋白或其生产系统。本发明的多聚核酸分子可以是DM分子,包括cDNA分子或RNA分子。正如本领域技术人员所充分意识到的,核酸序列同样可通过其互补核酸序列来描述。因此,与本发明的核酸序列互补的核酸序列也包括在本发明的保护范围内。根据一个方面,本发明提供了用于产生本发明的可溶性融合蛋白的方法。在第一个步骤中,在合适的宿主中表达编码本发明的融合蛋白的多聚核酸分子。在第二个步骤中,例如使用层析和/或过滤来分离在前述步骤中如此获得的可溶性融合蛋白。任选地,分离可溶性融合蛋白的所述第二个步骤包括除去LPS和其他致热原。本发明还提供了用于产生本发明的大壶腹腺蛛丝蛋白的方法。在第一个步骤中,在合适的宿主中表达编码本发明的融合蛋白的多聚核酸分子。在第二个步骤中,例如使用层析和/或过滤来分离如此获得的可溶性融合蛋白。在第三个步骤中,提供所述分离的融合蛋白的溶液,并在第四个步骤中,向液体介质中加入合适的切割试剂。这实现了在切割试剂识别位点处切割融合蛋白,并从而提供了大壶腹腺蛛丝蛋白。在任选的第五个步骤中,从液体介质中分离如此获得的大壶腹腺蛛丝蛋白。进一步任选地,分离可溶性融合蛋白的所述第二个步骤,以及任选地,分离大壶腹腺蛛丝蛋白的所述第五个步骤,包括除去LPS和其他致热原。本发明还提供了用于产生本发明的大壶腹腺蛛丝蛋白的多聚体的方法。在第一个步骤中,在合适的宿主中表达编码本发明的融合蛋白的多聚核酸分子。在第二个步骤中,例如使用层析和/或过滤来分离如此获得的可溶性融合蛋白。在第三个步骤中,提供所述分离的融合蛋白的溶液,并在第四个步骤中,向液体介质中加入合适的切割试剂。这实现了在切割试剂识别位点处切割融合蛋白,并从而提供了大壶腹腺蛛丝蛋白。在第五个步骤中,使如此获得的大壶腹腺蛛丝蛋白在液体介质中聚合。聚合通常在两种不同相之间的界面例如液/空气、液/固和水/油界面处开始。因此,该第五个步骤还可进一步包括提供液体介质和另一相之间的界面。所述另一相选自气相、液相和固相。如上所述,液体介质通常是水性介质,并且合适的其他相例如为空气和与水不能混溶的有机溶剂,例如油,例如适合用于PCR反应的矿物油。所得到的界面的存在刺激在该界面处或在围绕该界面的区域中的聚合,所述区域延伸入液体介质中,从而所述聚合在所述界面处或在所述界面区域中开始。优选的界面包括水/空气和水/油界面。当在室温下温育时,聚合通常在数分钟或数小时内,例如在1分钟至5小时内自发发生。在任选的第六个步骤中,从液体介质中分离如此获得的多聚体。为了获得具有低致热原含量的蛋白质(这对于用作体内生物材料来说是强制性的),已开发了对于除去脂多糖(LPS)来说经优化的纯化方案。为避免被所释放的LPS污染,将生产性细菌细胞经历使用改变的CaCl2和EDTA的洗涤步骤。在细胞裂解后,在低导电性緩沖液中进行所有随后的纯化步骤,以便使靶蛋白和LPS之间的疏水相互作用减少至最低。通过将蛋白质溶液通过Endotrap柱来使LPS的含量进一步降至最低,所述Endotrap柱具有特异性吸附LPS的配体。为了确保恒定的低含量的LPS和其他致热原,使用体外致热原测试(IPT)和/或鲎变形细胞溶解物(LAL)动力学测定法来分析所有批次。尽管在革兰氏阴性细菌宿主中产生,但可如此纯化出重組蛛丝蛋白,即LPS和其他致热原的残留水平低于动物测试所要求的限度,即低于25EU/植入物。在本发明的某些实施方案中,在分离的融合蛋白中LPS和其他致热原的含量是1EU/mg蛋白质或更低。在本发明的某些实施方案中,在分离的大壶腹腺蛛丝蛋白中LPS和其他致热原的含量是1EU/mg蛋白质或更低,优选O.25EU/mg蛋白质或更低。根据另一个方面,本发明提供了本发明的大壶腹腺蛛丝蛋白的多聚体。在优选的实施方案中,该蛋白质的多聚体可通过本发明的用于此的任一种方法获得。在优选的实施方案中,本发明的大壶腹腺蛛丝蛋白的多聚体的P一折叠含量高于50%,即该蛋白的多聚体的超过50%的二级结构是以P-折叠形式存在的。这是有利的,因为可以预见,更高含量的P-折叠结构提供了更硬和/或更强和/或可延伸性更低的纤维。优选的是,本发明的蛛丝蛋白的多聚体是具有肉眼可见的大小,即具有大于1jum,优选大于lOiam的直径和大于5mm的长度的纤维。优选的是,所述纤维的直径在10-400jam,优选60-120jim的范围内,以及长度在0.5-300cm,优选1-100cm的范围内。其他优选的范围是0.5-30cm和l-20cm。也优选的是,本发明的蛛丝蛋白的多聚体具有大于1MPa,优选大于2MPa,更优选10MPa或更高的拉伸强度。优选的是,本发明的蛛丝蛋白的多聚体具有大于100MPa,更优选20GMPa或更高的拉伸强度。所述纤维具有在物理操作过程中保持完整的能力,即可用于纺丝、织造、加捻、钩织和相似的操作。在其他优选的实施方案中,本发明的蛛丝蛋白的多聚体形成泡沫、凝胶、网状物或薄膜。根据另一个方面,本发明提供了包含融合伙伴和切割试剂识别位点的蛋白质片段用于制备融合蛋白的新用途。所述融合蛋白包含所述蛋白质片段和本发明的蜘蛛丝蛋白片段,并且这两个片段通过所述切割试剂识别位点偶联。所述蜘蛛丝蛋白片段优选由150至420个氨基酸残基组成。将在下面通过下列非限定性实施例来进一步举例说明本发明。实施例实施侈<formula>formulaseeoriginaldocumentpage32</formula>的克隆和观,J序将来自在南非收集的大约100个成年雌性^7/7roW力e/7o;sa^"a/h蜘蛛的大壶腹腺用于构建定制的基于pD0NR222的CloneMinerc薩文库(Invitrogen,Paisley,UK)。通过用cDNA探针篩选该文库来获得编码MaSpl蛋白的cDNA克隆,所述cDNA探针编码来源于未知亚种的^//^"^e/o;^蜘蛛的富含丙氨酸和富含甘氨酸的片段。按照厂商说明书,使用ECL直接标记和检测系统(AmershamBiosciences,Uppsala,Sweden)来进行菌落印迹和检测。选择一个单个的克隆以进行进一步的表征。为了从该克隆中获得cDNA插入片段的全长序列,4吏用Erase-a-Base系统(Promega,Southa即ton,UK)来产生嵌套缺失,并在MegaBase1000设备(AfflershamBiosciences)上进行测序。所得到的3,8kbcDNA(SEQIDNO:1)编码1207个氨基酸残基的MaSpl蛋白(SEQIDNO:2),该蛋白包含34个富含丙氨酸和富含甘氨酸的区段的重复片段(SEQIDNO:3),以及97个氨基酸残基的C-末端非重复片段(SEQIDNO:4)。实施例2.f";roWAe力Oj^s^"a/hMaSpl蛋白的重复片段的序列分析通过该片段的重复区段的比对来进一步分析实施例1的A";7ro"/e/70/7sai;Wra/"MaSpl蛋白序列的重复片段(SEQIDNO:3),参见图1。仔细查看该比对,并得出下列结构信息。S";7r0"力e卿sfii/"r"/yMaSpl蛋白的富含丙氨酸的区段的长度为13-15个氨基酸残基,并且只由丙氨酸残基组成或除了一个残基(该残基是丝氨酸、谷氨酸或甘氨酸残基)外全部由丙氨酸残基组成。^/prcW力e/K/^MaSpl蛋白的重复片段还包含3个相关的、但不同的类型的富含甘氨酸的区段,参见图2A。富含甘氨酸的区段中的两个区段几乎只在长度和出现率上不同;最常见的富含甘氨酸的区段包含23个氨基酸残基,而丰度较低的变体包含17个氨基酸残基。这两种富含甘氨酸的区段通常都不包含带电荷的残基或包含一个带电荷的残基。相反地,包含14个氨基酸残基的最短的富含甘氨酸的片段独特地在N-末端包含序列GRGQG或GQGQG,和在C-末端包含GN。最长的富含甘氨酸的区段由氨基酸单字母共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(SEQIDNO:5)表示,并且不包含带电荷的残基。预测该区段形成巻曲结构或3广螺旋结构。中等大小的富含甘氨酸的区段由氨基酸单字母共有序列GQGGQGQG(G/R)YGQG(A/S)G(S/G)S(SEQIDNO:6)表示,并且不包含带电荷的残基或包含一个带电荷的残基。预测该区段形成巻曲结构。最短的富含甘氨酸的区段由氨基酸单字母共有序列G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(SEQIDNO:7)表示。预测该区段形成转角结构。从交替的富含丙氨酸和富含甘氨酸的区段(例々口…AiGiA2G2A3G3A4G4A5G5...)建立j^//7ros^e/2o;7sai/stra//sMaSpl蛋白的重复片段。观察到,上面鉴定的最短和最长的富含甘氨酸的区段中的每一个通常以每隔一富含甘氨酸的区段的形式出现,例如.,.A工短A2G长A3G短A4G长A5G短...。相反地,较不丰富的、中等大小的、富含甘氨酸的片段通常在更长类型的富含甘氨酸的区段和更短类型的富含甘氨酸的区段之间出现,例如...AiG短A^长A]G中等AX短A5G长-0实施例3.f";7roWAej70;^MaSpl蛋白的重复片段的二级和三级结构的预测溶液中的蛛丝蛋白多肽通常通过形成发夹结构而折叠,所述发夹结构预示了成熟纤维的反平行P-折叠结构。为了辨别实施例1-2的^/jW^y^e/o/^5M"a/"MaSpl蛋白的重复片段(SEQIDNO:3)的可能的折叠模式,鉴定了与发夹或转角结构的形成相容的蛋白质区域。富含丙氨酸的区段不可能是转角形成的候选者,因为它们预期形成螺旋结构,并且更重要地,这些区段在纤维中通常被保持用于构成P-折叠。通过使用最近描述的关于转角预测的算法(Fuchs,PF&Alix,AJ,Highaccuracypredictionofbeta-turnsandtheirtypesusingpropensitiesandmultiplealignments.Proteins59,828-839(2005)),最短的富含甘氨酸的区段显示出关于形成II型p-转角的高度可能性,而两个更长的富含甘氨酸的区段预测形成巻曲结构。在更长的富含甘氨酸的区段中高含量的GGX三联体暗示了,它们可形成3r螺旋结构。蛛丝蛋白氨基酸序列的重复性质暗示了折叠模式的同样地重复的性质。综合起来,这些观察结果导致图2A中所示的^//7ro^力e/3o/7Sa"〃ra/hMaSpl蛋白的重复片段的折叠。值得注意的是,带正电荷的残基几乎总是位于所提及的转角结构中。根据^//7ro"力e/7o;^flu"ra//、MaSpl蛋白的重复区段的折叠模式,可辨别由富含丙氨酸的区段/(更长的)富含甘氨酸的巻曲区段/富含丙氨酸的区段/(更短的)富含甘氨酸的转角区段/富含丙氨酸的区段/(更长的)富含甘氨酸的巻曲区段/富含丙氨酸的区段组成的基元(图2A中示意性地图解说明的)。实施例4.MaSpl蛋白的非重复C-末端片段的序列分析将实施伊J1中获得的来自f^e力o/^aus^raJ/s的MaSpl蛋白的C-末端非重复片段(SEQIDN0:4)的一级结构与许多已知的MaSpl和MaSp2蛋白的C-末端片段进行比对,所述MaSpl和MaSp2蛋白尤其来自S"/7ro"力e力o/^(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,^/pro"力e/2o;";7.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))、棒络新妇珠P19837-5(Xu,M&Lewis,RV,Structureofaproteinsuperfiber:spiderdraglinesilk.ProcNatlAcadSciUSA87,7120-7124(1990))和其他种类。根据在图3中显示的从重复片段中的最后Ser开始的比对,显而易见的是,MaSpl和MaSp2的C-末端区域是十分保守的。^/;7r^"eiK7;7ssp和才奉络新妇妹具有95%的相同残基;^/AToW/e/zo/^<2^"3//<和棒络新妇蛛具有54%的相同残基;以及^/;rc^Me/7(7j^a"s"a//、和^//7ro^力e/2o;^具有55%的相同残基。作为SEQIDNO:8提供了MaSpl和MaSp2的C-末端区域的共有序列。在图3中,比对了下列MaSp蛋白,它们用GenBank登录号(使用这些登录号可获得这些蛋白)进行了标注物种和蛛丝蛋白A"jwosf力e/JOpsMaSpl(Pouchkina—Stantcheva,NN&McQueen-Mason,SJ,同前)f"/^ro"力e/Jopsaw"ra"sMaSpl(SEQIDNO:4)登录号Cthyb—EspCTnat—Eau三带金珠(爿i^/o/eW尸asc/"a)MaSpl皿云斑蛛(Cyr一Aora/z/o/i/cce"s/s)Spl棕寡妇蛛(Ls/:rofl^c加geo迈ef"'cws)MaSpl黑寡妇珠""rotfe""sAespe信)MaSpl赫氏沭立突妹(#acro/^e/eSpl棒络新妇蛛MaSpl毛络新妇珠(^ep//7a;7/7/;es)MaSpl马达力口斯加络新妇珠(jVep力i/s/Z7a(/agascar/e/3s/s)塞内加尔络新妇蛛MaSpl变异满蛛(0c加o6ara/7s/s)Spl中华褛网珠(/^ec力rwss/'/2e/Js/s)Spl考艾岛肖虫肖(r"r柳"Aai:aua/e頻's)MaSpl花斑肖虫肖(Tefi"ag/3atAaFers/co7or)MaSplMaSplAF350266-AtlAY666062.-CmlAF350273.-LglAY953074一LhlAY666068.—MhlU20329—1NclAY666076—NplAF350277一NmlAF350279一NslAY666057一0vlAY666064一PslAF350285—TklAF350286一Tvl大腹园珠(Jra刀eus6/ce/3fe/3ar/j/51)Sp2悦目金珠(Jrg/opea顶oe/a)MaSp2橙色金妹(~/,awaj7〃a)MaSp2三带金蛛MaSp2乳头棘腹妹((7as^eraca/fAa迈a鹏oa)MaSp2棕寡妇蛛MaSp2黑寡妇蛛MaSp2棒络新妇蛛MaSp2马达加斯加络新妇蛛MaSp2塞内加尔络新妇蛛MaSp2ABU20328-Ab2AY365016-Aam2AF350263-Aau2AF350267—At2AF350272一Gm2AF350275-Lg2AY953075—Lh2AY654293-Nc2AF350278—Nm2AF350280—Ns2黑狡蛛("o7。迈etfes"/2e6ro禱)Fbl黑狡蛛Fb2AF350269一DtFblAF350270—DtFb2十字园蛛ADF-1十字园蛛ADF-2U47853—ADF1U47854一ADF2十字园蛛ADF-3U47855—ADF3十字园蛛ADF-4U47856—ADF4实施例5.MaSpl基因的构建使用来自实施例1的cDNA文库的MaSpl克隆作为模板,利用AdvantageGC2试剂盒(BDBiosciences,SanJose,CA,USA),通过PCR来扩增编码f";7ro"力e/70;7sau"ra7/s来源的蛋白质5Gly/Ala-CTnat(SEQIDNO:9)的DNA序列。在5,-和3,-末端分别导入限制性内切酶识别位点^g/z^/和#//^///,并通过使用经设计的引物在W/^/i7位点的上游引入终止密码子。然后将5緒^/-1^7//4/(3-67;"-#/;^///构建体亚克隆入按下面实施例6(C)中所述进行制备的经修饰的pET32载体(MerckBiosciences,Darmstadt,Germany)中。实施例6.嵌合MaSpl基因的构建(A)REP基因片段使用编码^//roi^7ei30i^^MaSpl蛋白的重复区域的部分cDNA克隆(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,^"/7rc^f力e/7o/7S(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))(GenBank登录号CQ974358或CQ816656)作为模板,在甜菜碱(HenkeW等人,BetaineimprovesthePCRamplificationofGC-richDNAsequences.NucleicAcidsRes25,3957-3958(1997))存在的情况下,利用"~(TaKaRaBio;SaintGe面in-en-laye,France),通过PCR来扩增编码标示为3Gly/Ala和4Gly/Ala的部分重复片段(REP)的DNA序列。在5,-和3,-末端引入限制性内切酶识别位点,从而得到下列构建体待与CT片段(见下面)进行连接的A^o/-3Gly/Ala_A%e/和化o/-4Gly/Ala-励e/;和待独个地表达的^oJ-4Gly/Ala-I力o/克隆,其中直接在J力o/位点的上游插入终止密码子。(B)CT基因片段使用编码C-末端MaSpl结构域的基因组DNA克隆,通过PCR来扩增编码来自^i/;ro^力e力o/^^的非重复C-末端结构域(但与来自棒络新妇蛛和塞内加尔络新妇蛛的MaSpl具有高度的相似性)的DNA序歹'J(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,i"wpTC^f力e/0/7Ssp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))。在5,-和3'-末端引入限制性内切酶识别位点,从而得到待与3Gly/Ala和4Gly/Ala部分REP克隆(见上面)进行连接的Ae/-2Gly/Ala-CThyb-J力o/,和待独个地表达的#co/-2Gly/Ala-CThyb-^o/。(C)REP-CT杂合MaSpl基因的构建使用pCR2.l-T0P(f载体(Invitrogen),将3Gly/Ala和4Gly/AlaREP克隆与CT克隆连接在一起。然后,用^co/和J力o/切出所得的融合的5Gly/Ala-CT一和6Gly/Ala-CT一克隆,并将其亚克隆入经修饰的pET32栽休(Novagen)中,在该栽体中除去了原始凝血酶切割位点,并在肠激酶切割位点下游引入了新的凝血酶位点。实施例7.MaSpl融合蛋白的表达使用经修饰的pET32载体编码硫氧还蛋白/HisjS-标签/凝血酶切割位点/MaSpl蛋白的硫氧还蛋白-标签/His-标签/S-标签/凝血酶切割位点/MaSpl基因和氨千青霉素抗性基因(在T7启动子控制下),如下将由在实施例5一6中构建的基因编码的MaSpl蛋白表达为融合蛋白(X-REP-CT类型)。将pET32表达载体中的不同的MaSpl构建体转化入大肠杆菌BL21(DE3)细胞(MerckBiosciences)中。使细胞在30。C下在含有氨苄青霉素的Luria-Bertani培养基中生长至1.0-1.5的OD固,用IPTG进行诱导,并在室温下再温育4小时。通过离心收获细胞,和用在20mMTris-HCl(pH8.0)、20mM咪哇(含0.5MNaCl)中的DNA酶I和溶菌酶来进行裂解,并通过在Ni-NTA琼脂糖(Qiagen,WestSussex,UK)上的His-标签亲和层析来进一步纯化。使用200mM在20mMTris-HCl(pH8.0)(含0.5MNaCl)中的咪唑从Ni-NTA柱上洗脱结合的融合蛋白,并将其针对20mMTris-HCl(pH8.Q)进行透析。如通过经考马斯染色的SDS聚丙烯酰胺凝胶所判定的,所得到的融合蛋白的纯度>90%,并且溶解在20mMTris-HCl(pH8.0)中。该方法产生大约40mg融合蛋白/l培养物,该融合蛋白在数周内是稳定的而无明显的沉淀。在另一个实验中,从包含有在T7启动子控制之下的相应基因和卡那霉素抗性基因的质粒中,将融合蛋白表达为His6/石危氧还蛋白/HisJ凝血酶切割位点/MaSpl蛋白。实施例8.从MaSpl蛋白形成纤维在室温下在非常温和的摇动下,在20mMTris-HCl(pH8)中,以1:1000(w/w)的凝血酶融合蛋白比率,将标签从得自实施例7的融合蛋白中切除。如通过SDS-PAGE所判定的,在30至60分钟内完成了凝血酶切割。所得到的MaSpl蛋白(图2B,SEQIDNO:9-13)自发地聚合成不同程度的肉眼可见的纤维,参见表1。所述纤维最初在水/空气界面处形成。从温育大约1小时后开始可通过棵眼观察到这种形成(参见图4A,4B),并且在大约5小时后没有出现进一步的纤维生长。6Gly/Ala-CT一纤维的长度直到大约2cm,并且5Gly/Ala-CTnat纤维的长度》10cm。重复的实验产生长度>20cm(参见图4C),甚至>2m的5Gly/Ala-CT组纤维。从温育大约10分钟后开始可通过棵眼观察到纤维形成。分离纤维,并使用緩冲液进行洗涤,然后使其经历N-末端氨基酸序列分析,所述分析只显示了MaSpl蛋白的序列。这表明,在所述纤维中不存在经切割的标签。实施例9.MaSpl蛋白纤维的分析A.拉伸强度测量如下测定实施例8的6Gly/Ala-CT一(SEQIDNO:13)和5Gly/Ala-CTnat(SEQIDNO:9)纤维的拉伸强度。为了操作较短(1-2cm)的6Gly/Ala-CThyb纤维以进行拉伸强度测量,在将它们进行空气干燥之前,将它们在15%的甘油水溶液中短时间温育。较长(IOcm)的5Gly/Ala-C乙t纤维在空气干燥之前不进行处理,在15%的甘油中短时间温育,或在75%的甲醇中用手进行拉伸。通过在ZwickMaterialTester中以10inm/分钟的速率牵拉所述纤维来测量经空气干燥的纤维的拉伸强度。参见表l。经甘油处理的、经空气干燥的、l-2cm长的来自6Gly/Ala-CThyb(SEQIDNO:13)的纤维的拉伸强度为大约2MPa,来自5Gly/Ala-CTnat(SEQIDNO:9)的10cm纤维的强度为4-5MPa。在空气干燥之前在脱水溶剂甲醇中进行拉伸的10cm长的5Gly/Ala-CT磁纤维展示出2-3MPa的拉伸强度,该拉伸强度略低于经甘油处理的相同类型的纤维。目前测得的最高拉伸强度为10MPa,该强度是对于无进一步处理的经空气千燥的10cm长的5Gly/Ala-CL"纤维而发现的。拉伸强度的范围(2-10MPa)与对于再生的蜘蛛丝纤维而报导的较低值(2-320MPa)相当。最长的自发形成的纤维来源于5Gly/Ala-CL"构建本,并且此类经空气干燥的纤维也显示出最大的拉伸强度。可能地,这可以是由于其12-15个残基长的多聚Ala区段(相对于在6Gly/Ala-CThyb中的8-14个残基的Ala区段),该区段可在先前的蛋白质中产生更大比例的结晶P-折叠构象。表l.MaSpl蛋白的纤维形成能力<table>tableseeoriginaldocumentpage41</column></row><table>n.a.=不可应用n.d.=未测定B.扫描电子显微术使用扫描电子显微术(SEM)来分析6Gly/Ala-CThyb和5Gly/Ala-C乙t纤维的显微结构(图5)。简而言之,将样品放置在SEM-样品台上,并用6nm的金和铂层真空覆盖所述样品。使用10kV的加速电压,在LEO1550FEGSEM中观察试样并进行照相。该分析揭示出单根纤维的直径为10-30pm,其中独个纤维展示出相当均一的直径(图5a,其显示了6Gly/Ala-CThyb,SEQIDNO:13)。除了肉眼可见的纤维外,还发现了凝胶样颗粒。于直接在SEM-样品台上对6Gly/Ala-CThyb的此类颗粒进行空气千燥后,看到直径大约10-15|am的纤维(图5b,c)。在75%甲醇中进行拉伸并经空气干燥的5Gly/Ala-CTnat(SEQIDNO:9)的肉眼可见的纤维的直径为60-120iam,并且它们似乎包含几种经排列的纤维(图5d-f)。在空气千燥前扭曲的纤维(图5e),纤维的末端(图5f)。C.圓二色性光谱学在20mM磷酸盐緩冲液(pH7)中洗涤在实施例8中制备的由6Gly/Ala-CThyb蛋白(SEQIDNO:13)或5Gly/Ala-CTnat(SEQIDNO:9)组成的纤维,并将所述纤维悬浮于在相同緩冲液中的2。/。SDS之中。使用JascoJ-810旋光分光计,在22X:下在0.1cm光程长度的石英杯中记录从250至190認的圆二色性光谱。扫描速度为50認/分钟,响应时间为2秒,采集间隔为0.1nm,和带宽为1nm。图6中显示的光谱是6Gly/Ala-CThyb蛋白(SEQIDNO:13)的纤维的三次扫描的累积。其在220nm处展示出最小值和在195mn处展示出最大值,这些特征是反平行P-折叠结构所特有的。对于5Gly/Ala-CT^的纤维获得了的高度相似的光镨(未显示)。因此,所述自发形成的纤维展示了与天然的和再生的蜘蛛丝纤维相似的形态学和结构。实施例10.重组蜘蛛丝的生物相容性因为希望将蜘蛛丝纤维用于生物医学应用,因此通过使用两种不同细胞类型研究重组产生的丝的效应来评估纤维的生物相容性。如实施例7-8中所述,在细菌中表达MaSpl蛋白5Gly/Ala-CTnat(SEQIDNO:9)。将纯化的蛋白质用于产生具有>10cm,甚至>20-200cm的长度和大约100nm的直径的人造丝纤维。A.胚胎小鼠肥大细胞以两种不同的细胞密度接种胚胎(第12.5天)小鼠肥大细胞(使用IL-8和肥大干细胞因子体外增殖8周),较高的密度为较低密度的大约4倍。这些细胞不粘着至塑料表面,但以悬浮形式生长。向小孔中加入各自大约0.5cm长的丝纤维小段。在丝纤维存在或不存在的情况下,将肥大细胞温育3天,并在这之后在用台盼蓝染色后计数活细胞和死细胞(图7)。这些柱条显示了具有标准误差的平均值,n-2,每个样品重复计数3次。丝纤维的存在不影响肥大细胞。在3天的生长后,与在没有丝纤维的情况下生长的负对照相比,细胞的死亡或增殖没有显著的差异。B.人胚胎肾(HEK)293细胞通过让它们从小体积的緩冲液中干燥来将大约0.5cm长的丝纤维小段吸附至6孔微量滴定板的底部。当加入细胞生长培养基时,纤维不脱离。然后,以不同的细胞密度将人胚胎肾(HEK)293细胞进行铺板,并让其生长总共6天。HEK-293细胞粘着并生长附着至塑料小室的表面。研究HEK-293细胞在纤维附近生长的能力,和细胞对纤维的物理附着。HEK-293细胞在包含丝纤维的小孔中正常附着和生长(如在光学显微镜下观察到的)。细胞非常紧密地沿着纤维边缘生长,并且很明显地,甚至在部分脱离的纤维下生长(图8)。7天后,小心地从塑料表面上分离纤维,并且清楚地看到细胞群与纤维发生物理附着。纤维覆盖了该图的右上一半部分。看到HEK293细胞附着至纤维的边缘,并且也在纤维下面生长。重组丝纤维的存在不影响所研究的两种不同的细胞类型(肥大细胞、HEK-293),即使在相当高的数量的丝存在下亦如此。这表明,受试人造丝纤维在非毒性和生物相容性方面与^/proW力e/70/7i的野生型拖丝相似。因此,所述人造丝纤维看起来适合用于生物医学应用。实施例11.MaSpl蛋白纤维的机械性质和结构使用用于产生应力-应变曲线而实施的拉伸试验来检查来自5Gly/Ala-CL"(SEQIDNO:9)的纤维的机械性质(图9)。使用ZwickRoellZ2.5材料测试器(Zwick,Ulm,Germany)来表征拉伸性能。在环境条件(20X:和52%相对湿度)下,使用10mm/分钟的负载速度在空气中进行所述试验。直接从緩冲液中转移出纤维小段,安放,和经历2轮绷紧-松弛循环。为了产生适合于拉伸试验的均一的丝线,使用绷紧-松弛循环来伸长纤维。首先,通过牵拉直至O.IN的力来使纤维伸长。在松驰后,再次拉伸它们直至施加了0.25N的力。该处理产生具有大约80jam的直径(通过使用MitutoyoIDC-IHB设备(MitutoyoCorp,Tokyo,Japan)进行高度测量所确定的,并如下通过扫描电子显微术(SEM)所确认的)的伸长的均一纤维。在绷紧-松弛循环之前和之后,将纤维小段施加在SEM样品台上并在空气干燥过夜。使用6nm的金和铂层真空覆盖所述样品。使用10kV的加速电压,用LE01550FEG显孩吏镜(CarlZeiss,0berkochen,Germany)观察试样并进行照相。将经拉抽的纤维切成小段,用胶(Loctite420,Loctite,G5teborg,Sweden)将所述小段的末端固定在卡纸板纸(cardboardpaper)之间。然后将纤维样品固定在材料测试仪的夹具(grip)上,并绷紧直至它们断裂。使用拉伸前的纤维的初始横截面积(假定为圆形橫截面)来构建应力-应变曲线。将应力值对纤维的初始横截面积进行标准化。应变相应于dL/L。,其中L。是纤维的初始长度,和dL是纤维长度的变化。在图9中,显示了5Gly/Ala-CTnat(SEQIDNO:9)的双拉伸纤维的三个不同样品的应力-应变曲线,和经测量为大约0.2GPa的它们的拉伸强度。通过SEM来分析纤维的显微构造(图10)。自发形成的纤维具有均一的扁平的外观和直至数百微米的宽度,而高度经测量为大约10微米(图10a,b)。在纤维经历绷紧-松驰循环后,它们的横截面采取更圆的形状,该性状具有紧密排列的原纤维的致密的亚结构(图lOc-f)。切面或断裂面的外观(图10e,f)进一步证明了所产生的纤维的致密性。总之,自发形成的纤维显示出与天然的或再生的蜘蛛丝纤维相似的形态学和机械性质,即使在不进行纺丝的情况下。实施例12.蛛丝蛋白变体强的分子间相互作用被认为促成了蜘蛛丝的令人印象深刻的拉伸强度。因此,产生了小型蛛丝蛋白的变体,其允许纤维中的分子间共价交联。通过定向诱变来构建两种不同的突变型蛛丝蛋白,所述定向诱变分别在笫一(SEQIDNO:14,位置36和37)和第四(SEQIDNO:15,位置128和129)丙氨酸嵌段(alanineblock)中引入2个半胱氨酸残基。表达这些变体,并使用与在实施例7-8中对于在实施例5-6中构建的基因所描述的方案相同的方案来进行分离。这些变体(SEQIDNO:14-15)以与5Gly/Ala-CTn"(SEQIDNO:9)相同的方式形成纤维。为了阐明C-末端结构域的二聚化的重要性,已构建了一种变体,其中将C-末端结构域中的半胱氨酸残基交换为丝氨酸残基(SEQIDNO:16,位置222)。然而,该变体(SEQIDNO:16)以与5Gly/Ala-CTnat(SEQIDNO:9)相同的方式形成纤维。实施13.从表达的蛛丝蛋白中除去LPS和其他致热原使用下列緩冲液来洗涤表达所需蛛丝蛋白融合蛋白的大肠杆菌细胞A.100mMTris,pH8,B5mMCaCl2,100mMTris,PH8,C10mMEDTA,100mMTris,PH8,D100mMTris,pH8,和E:100mMTris,pH8。然后,在补充有溶菌酶和DNA酶I的20mMTris(pH8)中裂解细胞。然后将蛋白质样品加载至Ni-sepharose基质上,并用20mMTris,10-100mM咪唑,pH8进行洗涤,随后用20mMTris,100-300mM咪唑,pH8进行洗脱。汇集相关级分,并针对20mMTris(pH8)透析过夜。然后用lOOiaMCaCl2补充蛋白质样品,最后使其通过事先用20mMTris,100|iMCaCl2,pH8平衡的EndoTrapBlue柱。以这种方式,可获得致热原含量为1EU/mg蛋白质的蛋白质样品,如通过IPT和LAL动力学测定法所判定的。然后,以1:1000(w/w)凝血酶融合蛋白比例,用凝血酶通过蛋白水解来切割融合蛋白,这引起纤维形成(如上所述的)。将纤维在20niMTris(pH8)中洗涤3次,最后在水中洗涤3次。这产生了致热原含量为0.25EU/mg纤维的纤维。在125。C和1.5巴下高压灭菌10分钟后,纤维的结构特征未受影响,这使得能够对所述材料进行有效的灭菌。所述纤维在化学上是稳定的,并且不能溶解于8M尿素、6MGuaHCl或纯HAc中。然而,所述纤维可溶解在纯HFIP或曱酸中。权利要求1.分离的大壶腹腺蛛丝蛋白,其特征在于,所述蛋白质由150至420个氨基酸残基组成并且由式REP-CT定义,其中REP是具有80至300个氨基酸残基的蛋白质片段,其中所述片段选自L(AG)nL、L(AG)nAL、L(GA)nL、L(GA)nGL,其中n是4至8的整数;每个独个A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0至3个不是Ala,而其余的氨基酸残基是Ala;每个独个G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly;和每个独个L区段是0至20个氨基酸残基的连接体氨基酸序列;以及CT是具有70至120个氨基酸残基的蛋白质片段,该片段是源自大壶腹腺蛛丝蛋白的C-末端片段。2.权利要求1的分离的蛋白质,其中每个独个A区段与选自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸残基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸残基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸残基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸残基31-42;和SEQIDNO:15的氨基酸残基122-135。3.权利要求2的分离的蛋白质,其中每个独个A区段是选自权利要求2的氨基酸序列的氨基酸序列。4.前述权利要求中任一项的分离的蛋白质,其中每个独个G区段与选自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸残基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817—839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:5-7;SEQIDNO:9的氨基酸残基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸残基1-11、26-45、61-74、89-111、120-149和159-172。5.权利要求4的分离的蛋白质,其中每个独个G区段与选自权利要求4的氨基酸序列的氨基酸序列相同。6.前述权利要求中任一项的分离的蛋白质,其中所述CT片段与SEQIDNO:8具有至少50%的同一性,或与选自SEQIDNO:4、SEQIDNO:9的氨基酸残基172-269、SEQIDNO:13的氨基酸残基181-276和SEQIDNO:16的氨基酸残基172-269的氨基酸序列具有至少80%的同一性。7.权利要求6的分离的蛋白质,其中所述CT片段是选自权利要求6的氨基酸序列的氨基酸序列。8.—种分离的融合蛋白,所述融合蛋白由作为大壶腹腺蛛丝蛋白的第一蛋白质片段和第二蛋白质片段组成,其特征在于,所述第二蛋白质片段包含融合伙伴和切割试剂识别位点,其中所述第一蛋白质片段通过所述切割试剂识别位点偶联至所述融合伙伴。9.选自X-REP-CT和REP-CT-X的分离的融合蛋白,其中REP和CT是权利要求l-7中任一项的蛋白质片段;和X是包含融合伙伴和切割试剂识别位点的蛋白质片段;其中组合的蛋白质片段REP-CT通过所述切割试剂识别位点偶联至所述融合伙伴。10.用于产生权利要求1-7任一项中定义的大壶腹腺蛛丝蛋白的方法,其包括下列步骤(i)提供权利要求8-9中任一项的融合蛋白在液体介质中的溶液,(ii)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;和任选地(iii)从所述液体介质中分离在步骤(ii)中获得的大壶腹腺蛛丝蛋白。11.用于产生权利要求1-7任一项中定义的大壶腹腺蛛丝蛋白的多聚体的方法,其包括下列步骤(i)提供权利要求8-9中任一项的融合蛋白在液体介质中的溶液,(ii)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;(iii)允许在步骤(ii)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合;和任选地(iv)从所迷液体介质中分离在步骤(iii)中获得的多聚体。12.—种分离的多聚核酸分子,其包含编码权利要求1-7中任一项的大壶腹腺蛛丝蛋白的核酸序列或其互补核酸序列。13.—种分离的多聚核酸分子,其包含编码权利要求8-9中任一项的融合蛋白的核酸序列或其互补核酸序列。14.用于产生权利要求8-9中任一项的可溶性融合蛋白的方法,其包括下列步骤(i)在合适的宿主中表达权利要求13的多聚核酸分子;和(ii)分离在步骤(i)中获得的可溶性融合蛋白。15.用于产生权利要求1-7中任一项的大壶腹腺蛛丝蛋白的方法,其包括下列步骤(i)在合适的宿主中表达权利要求13的多聚核酸分子;(ii)分离在步骤(i)中获得的可溶性融合蛋白;(iii)提供在步骤(ii)中获得的所述可溶性融合蛋白在液体介质中的溶液;(iv)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;和任选地(v)从所述液体介质中分离在步骤(iv)中获得的大壶腹腺蛛丝蛋白。16.用于产生权利要求1-7的大壶腹腺蛛丝蛋白的多聚体的方法,其包括下列步骤(i)在合适的宿主中表达权利要求13的多聚核酸分子;(ii)分离在步骤(i)中获得的可溶性融合蛋白;(iii)提供在步骤(ii)中获得的所述可溶性融合蛋白在液体介质中的溶液;(iv)向所述液体介质中加入合适的切割试剂,所述切割试剂用于在切割试剂识别位点处实现融合蛋白的切割,从而获得大壶腹腺蛛丝蛋白;(v)允许在步骤(iv)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合;和任选地(vi)从所述液体介质中分离在步骤(v)中获得的多聚体。17.权利要求1-7中任一项的大壶腹腺蛛丝蛋白的多聚体。18.可通过权利要求11和16中任一项的方法获得的大壶腹腺蛛丝蛋白的多聚体。19.包含融合伙伴和切割试剂识别位点的蛋白质片段在制备融合蛋白中的用途,所述融合蛋白包含通过所述切割试剂识别位点偶联至蜘蛛丝蛋白质片段的所述蛋白质片段。20.—种分离的多聚核酸分子,其包含选自SEQIDNO:1和编码SEQIDNO:2-16的核酸序列的核酸序列,或其互补核酸序列。21.权利要求20的分离的多聚核酸分子在制备编码蜘蛛丝蛋白的非天然基因中的用途。22.权利要求11的方法,其中允许在步骤(ii)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合的所述步骤(iii)还包括,提供所述液体介质与选自气相、液相和固相的另一相之间的界面,其中所述聚合在所述界面处或在围绕所述界面的区域中开始。23.权利要求16的方法,其中允许在步骤(iv)中获得的大壶腹腺蛛丝蛋白在液体介质中聚合的所述步骤(v)还包括,提供所述液体介质与选自气相、液相和固相的另一相之间的界面,其中所述聚合在所述界面处或在围绕所述界面的区域中开始。24.权利要求22或权利要求23的方法,丼中所述液体介质是水性介质,并且所述其他相选自空气和与水不能混溶的有机溶剂。25.权利要求14的方法,其中分离可溶性融合蛋白的所述步骤(ii)包括除去LPS和其他致热原。26.权利要求15的方法,其中分离可溶性融合蛋白的所述步骤(ii),和任选地,分离大壶腹腺蛛丝蛋白的所述步骤(v),包括除去LPS和其他致热原。27.权利要求8或9的分离的融合蛋白,其中LPS和其他致热原的含量为1EU/mg蛋白质或更低。28.权利要求1-7中任一项的分离的大壶腹腺蛛丝蛋白,其中LPS和其他致热原的含量为1EU/mg蛋白质或更低。全文摘要本发明提供了分离的大壶腹腺蛛丝蛋白,其由150至420个氨基酸残基组成并且由式KEP-CP定义。KEP是重复的、具有80至300个氨基酸残基的N-末端衍生的蛋白质片段。CT是具有70至120个氨基酸残基的C-末端衍生的蛋白质片段。本发明进一步提供了分离的融合蛋白,其由作为大壶腹腺蛛丝蛋白的第一蛋白质片段和包含融合伙伴及切割试剂识别位点的第二蛋白质片段组成。第一蛋白质片段通过所述切割试剂识别位点偶联至融合伙伴。本发明还提供了用于产生大壶腹腺蛛丝蛋白及其多聚体的方法。文档编号C07K14/435GK101395178SQ200680053590公开日2009年3月25日申请日期2006年12月28日优先权日2005年12月30日发明者A·里辛,G·耶尔姆,J·约翰松,M·斯塔克,M·赫德哈马尔,S·格里普,W·恩斯特伦申请人:思百博技术股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1