生产蜘蛛丝蛋白聚合物的方法

文档序号:1714192阅读:492来源:国知局
专利名称:生产蜘蛛丝蛋白聚合物的方法
技术领域
本发明涉及蛋白质重组生产的领域,更具体地涉及蜘蛛丝蛋白(蛛丝蛋白 (spidroin))的重组生产。本发明提供了生产分离的蜘蛛丝蛋白的聚合物的方法。还提供了新的蜘蛛丝蛋白以及用于生产这种蛋白质及其聚合物的方法和多核酸分子。
背景技术
蜘蛛丝是天然的高性能聚合物,由于强度和弹性的结合,获得非凡的韧性和延伸性。蜘蛛具有多至七种的不同腺体,其产生多种具有不同机械特性和功能的丝类型。由主壶腹腺(major ampul late gland)产生的拖丝(dragline silk)是韧性最大的纤维,并且以重量为基础时,其优于人造材料,如抗拉钢(tensile steel)。拖丝的所述特性在用于医疗或技术目的的新材料的研发中是具有吸引力的。拖丝由两种主要的多肽组成,通常称为主壶腹蛛丝蛋白(MaSp) 1和2,但在十字圆蛛(Araneus diadematus)中称为例如ADF-3和ADF-4。这些蛋白质具有200_720kDa范围内的分子量。编码黑寡妇蜘蛛(Latrodectus hesperus)的拖丝蛋白的基因是唯一已经完全表征的基因,并且MaSpl和MaSp2基因分别编码31 和3779个氨基酸(Ayoub NA等,PloS ONE 2(6) :e514,2007)。Huemmerich,D.等,Curr.Biol.(当代生物学)14,2070-2074 Q004) 中讨论了拖丝多肽的性质。蜘蛛拖丝蛋白或MaSp具有三部分的组成非重复的N-端结构域、由许多重复的聚-Ala/Gly区段组成的中心重复区、和非重复的C-端结构域。通常认为重复区形成丝纤维中的分子间接触,而末端结构域的确切功能还不太清楚。还认为与纤维形成相关,重复区经历了从无规卷曲和α-螺旋构象至β-折叠结构的结构转变。蛛丝蛋白的C-端区在蜘蛛物种和丝类型之间通常是保守的。蜘蛛丝的N-端结构域是最保守的区域,但其功能尚未了解。Rising, A 等,Biomacromolecules (生物大分子)7,3120-31 (2006)表征了 Euprosthenops australis MaSpl基因的5,端,并且推导出相应的氨基酸序列。重组表达 MaSpl蛋白的N-端结构域。蜘蛛丝蛋白及其片段难以以可溶形式来重组产生。大部分之前的生产人造蜘蛛丝纤维的尝试包括在非生理溶剂中的增溶步骤。几种因素使得拖丝蛋白的表达变得复杂。由于基因的高重复性,以及伴随的蛋白质的受限的氨基酸组成,产生了转录和翻译错误。微生物表达系统中tRNA库的耗尽,和随后的不连续翻译,导致蛋白质合成的过早终止,可能是另一个原因。对蛋白合成切断讨论的其他原因是mRNA的二级结构形成和基因的重组。大于2.51Λ的天然MaSp基因已经显示出在细菌宿主中是不稳定的。此外,维持可溶形式的重组丝蛋白存在困难,因为两种天然衍生的拖丝片段和设计的嵌段共聚物,尤其是MaSpl/ ADF-4衍生的蛋白质,容易自我装配成无定形聚集物,引起蛋白质的沉淀和损耗。参见 Huemmerich, D.等,Biochemistry (生物化学)43,13604-13612 Q004)和 Lazaris,Α.等, Science (科学)295,472-476 (2002)。生产人造蜘蛛丝的尝试中已经使用了编码拖丝蛋白的天然或合成的基因片段。已经在包括细菌、酵母、哺乳动物细胞、植物、昆虫细胞、转基因蚕和转基因山羊的各种系统中表达了重组拖丝蛋白。参见,例如,Lewis, R. V.等,Protein Expr. Purif.(蛋白表达和纯化)7,400-406(1996) ;Fahnestock, S. R. & Irwin, S. L. Appl. Microbiol. Biotechnol. (应用微生物学和生物技术)47,23-32 (1997) ;Arcidiacono, S.等,Appl. Microbiol. Biotechnol.(应用微生物学和生物技术)49,31-38 (1998) ;Fahnestock, S. R. & Bedzyk, L. A. Appl. Microbiol. Biotechnol.(应用微生物学和生物技术)47,33-39 (1997);和 Lazaris, A.等,Science (科学)295,472-476 (2002)。Huemmerich, D.等,Biochemistry (生物化学)43,13604-13612 Q004)公开了一种合成基因,“ (AQ)12NR3”,编码重复的富含Ala和富含Gly/Gln的片段以及非重复片段,所有片段都源自来自园蛛属(Araneus)的ADF3。该基因表达成可溶性蛋白质,该蛋白质聚集,但没有形成聚合物或纤维。WO 03/057727公开了可溶性重组丝多肽在哺乳动物细胞系和动物中的表达。所获得的丝多肽在含水介质中呈现出低溶解性和/或形成沉淀物。由于所获得的丝多肽没有自发地聚合,需要纺织(spinning)来获得聚合物或纤维。所表达的丝多肽含有多个重复单位和源自蜘蛛丝蛋白羧基端区域的非重复单位。WO 07/078239 和 Stark, M 等,Biomacromolecules (生物大分子)8,1695-1701, (2007),公开了由具有高含量的Ala和Gly的重复片段和蛋白质的C-端片段组成的微型蜘蛛丝蛋白,以及包含蜘蛛丝蛋白的可溶性融合蛋白。在蜘蛛丝蛋白从其融合配偶体中释放出来时,自发获得蜘蛛丝蛋白的纤维。小的融合单位对于纤维形成是足够的,并且是必需的。Hedhammer,M等,Biochemistry(生物化学)47,3407-3417,(2008)研究了热、pH和盐对重组N-和C-端蛛丝蛋白结构域和含有四个聚-Ala和富含Gly的嵌合块(co-block) 的重复蛛丝蛋白结构域的结构和聚集和/或聚合的影响。公开了 N-端结构域的二级和三级结构与PH无关,保持未改变,并且唯一检测到的由N-端结构域形成的稳定装配体是二聚体。相反,表明C-端结构域在蜘蛛丝蛋白的装配中具有主要作用。发明概述本发明的一个目的是提供一种生产蜘蛛丝蛋白的聚合物的方法,其中控制蜘蛛丝蛋白的溶解性和聚合。本发明的再一个目的是提供一种生产蜘蛛丝蛋白的纤维的方法,其中控制蜘蛛丝蛋白的溶解性和纤维形成。本发明的另一个目的是提供一种新的蜘蛛丝蛋白,其可以提供蜘蛛丝纤维、薄膜、 泡沫、网(net)和网状物(mesh)。本发明的一个目的是提供一种水溶性蜘蛛丝蛋白,其可以容易地处理,以在需要时聚合成纤维。该特性使得以后的所有步骤可以在生理条件下进行,这降低了毒性和蛋白质变性的风险。本发明的再一个目的是提供新的蜘蛛丝蛋白的纤维。本发明的一个目的是大规模地提供蜘蛛丝蛋白,其可以容易地处理,以在需要时聚合成纤维。本发明的再一个目的是提供生产蜘蛛丝蛋白和蜘蛛丝蛋白纤维的方法。为了从以下公开内容能清楚这些和其他目的,根据第一个方面,本发明提供了一种生产分离的蜘蛛丝蛋白的聚合物的方法,所述方法包括下述步骤(i)提供由170至760个氨基酸残基组成的蜘蛛丝蛋白,并且该蜘蛛丝蛋白包含由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选70至120个氨基酸残基的C-端片段,该片段源自蜘蛛丝蛋白的C-端片段;(ii)提供所述蜘蛛丝蛋白在液体介质中的溶液,所述液体介质具有6. 4或更高的 PH和/或防止所述蜘蛛丝蛋白聚合的离子组成,任选涉及除去脂多糖和其他致热原;(iii)将所述液体介质的性质调节至6. 3或更低的pH和允许所述蜘蛛丝蛋白聚合的离子组成;(iv)允许所述蜘蛛丝蛋白在所述液体介质中形成聚合物,优选形成固体聚合物, 所述液体介质具有6. 3或更低的pH和允许所述蜘蛛丝蛋白聚合的离子组成;和(ν)从所述液体介质中分离出所述蜘蛛丝蛋白聚合物。在一个实施方案中,步骤(iii)和(iv)的所述液体介质的pH为6. 2或更低,如6. 0 或更低。在一个实施方案中,步骤(iii)和(iv)的所述液体介质的PH为3或更高,如4. 2 或更高。在特定的实施方案中,步骤(iii)和(iv)的所述液体介质的离子强度在l_250mM 范围内。 在一个实施方案中,步骤(ii)的所述液体介质的pH为6. 7或更高,如7. 0或更高。 在一个实施方案中,步骤(ii)的所述液体介质的PH在6. 4-6. 8的范围内。根据另一个方面,本发明提供了一种蜘蛛丝蛋白的聚合物,所述蛋白由170至760 个氨基酸残基组成并且包含由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选70至120个氨基酸残基的C-端片段,该片段源自蜘蛛丝蛋白的C-端片段。在这两个方面的特定实施方案中,蜘蛛丝蛋白由170至600个氨基酸残基组成并且包含单个源自蜘蛛丝蛋白的N-端片段的100至160个氨基酸残基的N-端片段。在这两个方面的特定的其他实施方案中,蜘蛛丝蛋白的N-端片段包含至少两个源自蜘蛛丝蛋白的N-端片段的100至160个氨基酸残基的片段。在这两个方面的优选实施方案中,蛋白选自由式NT2-REP_CT、NT-REP-CT, NT2-REP 和NT-REP限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,该片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L (AG) nL、L (AG) nAL、L (GA) nL、L (GA) nGL 的组,其中η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,该片段是源自蜘蛛丝蛋白的C-端片段。在一个实施方案中,聚合物由聚合的蜘蛛丝蛋白的二聚体组成。在优选的实施方案中,脂多糖和其他致热原的含量为lEU/mg分离蛋白或更低。在一个实施方案中,聚合物是纤维、薄膜、泡沫、网(net)或网状物(mesh)。在优选的实施方案中,聚合物是具有超过0. 1 μ m的直径和超过5mm的长度的纤维。根据一个方面,本发明提供了一种生产分离的蜘蛛丝蛋白的二聚体的方法,所述方法包括下述步骤(i)提供170至760个氨基酸残基的蜘蛛丝蛋白,所述蛋白包含由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和 70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选70至120个氨基酸残基的C-端片段,该片段源自蜘蛛丝蛋白的C-端片段;(ii)提供蜘蛛丝蛋白的二聚体在液体介质中的溶液,所述液体介质具有6. 4或更高的PH和/或防止所述蜘蛛丝蛋白聚合的离子组成;和(iii)分离步骤(ii)中获得的二聚体,任选涉及除去脂多糖和其他致热原。在一个实施方案中,步骤(ii)的液体介质的PH为6. 7或更高,如7.0或更高。在一个实施方案中,步骤(ii)的液体介质的PH在6. 4-6. 8的范围内。在一个实施方案中,提供所述蜘蛛丝蛋白的步骤(i)包括下述子步骤(a)在合适的宿主中表达编码所述蜘蛛丝蛋白的多核酸分子;和(b)分离子步骤(a)中获得的蛋白,任选涉及除去脂多糖和其他致热原。根据一个方面,本发明提供了蜘蛛丝蛋白的二聚体,所述蛋白由170至760个氨基酸残基组成并包含由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段源自蜘蛛丝蛋白的重复片段的;和任选70至120个氨基酸残基的C-端片段,该片段源自蜘蛛丝蛋白的C-端片段。在这两个方面的特定实施方案中,蜘蛛丝蛋白由170至600个氨基酸残基组成并且包含单个源自蜘蛛丝蛋白的N-端片段的100至160个氨基酸残基的N-端片段。在这两个方面的特定的其他实施方案中,蜘蛛丝蛋白的N-端片段包含至少两个源自蜘蛛丝蛋白的N-端片段的100至160个氨基酸残基的片段。根据另一个方面,本发明提供了分离的蜘蛛丝蛋白,其由170至760个氨基酸残基组成并且选自由式NT2-REP-CT、NT-REP-CT, NT2-REP和NT-REP限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,该片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L (AG) nL、L (AG) nAL、L (GA) nL、L (GA) nGL 的组,其中η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,该片段是源自蜘蛛丝蛋白的C-端片段。在一个实施方案中,蜘蛛丝蛋白由170至600个氨基酸残基组成并且选自由式 NT-REP-CT和NT-REP限定的蛋白组。在特定的实施方案中,蜘蛛丝蛋白选自由SEQ ID NO :3_5、17、19_23、25和31组成的组。根据一个方面,本发明提供了本发明的蜘蛛丝蛋白用于生产蜘蛛丝蛋白的二聚体的用途。根据一个方面,本发明提供了本发明的蜘蛛丝蛋白用于生产蜘蛛丝蛋白的聚合物的用途。根据一个方面,本发明提供了根据本发明的蜘蛛丝蛋白的二聚体用于生产分离的蜘蛛丝蛋白的聚合物的用途。在这些方面的优选实施方案中,在液体介质中生产所述聚合物,该液体介质具有 6. 3或更低pH和允许所述蜘蛛丝蛋白聚合的离子组成。根据一个方面,本发明提供了包括溶解于液体介质中的根据本发明的分离的蜘蛛丝蛋白的组合物,该液体介质具有6. 4或更高pH和/或防止所述蜘蛛丝蛋白聚合的离子组成。在一个实施方案中,液体介质的pH为7.0或更高。在一个实施方案中,液体介质的pH在6. 4-6.8的范围内。在特定的实施方案中,组合物中的脂多糖和其他致热原的含量为lEU/mg分离的蛋白或更低。根据另一个方面,本发明提供了一种分离的多核苷酸分子,其包括选自由SEQ ID NO 14-16、18和24组成的组的核酸序列;编码SEQ ID NO :3_5、17、19_23、25和31的核酸序列;编码根据本发明的蜘蛛丝蛋白的核酸序列;及其互补核酸序列。根据另一个方面,本发明提供了生产根据本发明的蜘蛛丝蛋白的方法,所述方法包括下述步骤(i)在合适的宿主中表达编码所述蜘蛛丝蛋白的多核酸分子;和(ii)分离步骤(i)中获得的蛋白质,任选涉及除去脂多糖和其他致热原。此外,提供了可逆地装配一种类型的分子或几种不同类型的分子的聚合物或寡聚物的方法,所述方法包括下述步骤
(i)提供所述分子,每种分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的 N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分;(ii)提供所述分子在液体介质中的溶液,所述液体介质具有6. 4或更高的pH和/ 或防止所述分子通过所述结合结构部分聚合或寡聚的离子组成;(iii)将所述液体介质的性质调节至6. 3或更低的pH和允许所述分子通过所述结合结构部分聚合或寡聚的离子组成;(iv)允许所述分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物, 所述液体介质具有6. 3或更低的pH和允许所述分子通过所述结合结构部分聚合或寡聚的离子组成。在一个实施方案中,步骤(i)的所述分子是相同的,并且步骤(iv)的所述聚合物或寡聚物是同聚物或同寡聚物。在另一个实施方案中,步骤(i)的所述分子是不同的,并且步骤(iv)的所述聚合物或寡聚物是杂聚物或杂寡聚物。在优选的实施方案中,将步骤(iv)的所述聚合物或寡聚物溶解于所述液体介质中,所述液体介质具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成。在一个实施方案中,步骤(iii)和(iv)的液体介质的pH是6. 2或更低,如6.0或更低,和/或步骤(iii)和(iv)的液体介质的PH为3或更高,如4. 2或更高。在特定的实施方案中,步骤(iv)的液体介质的离子强度在l_250mM的范围内。在一个实施方案中,步骤(ii)的液体介质的pH为6. 7或更高,如7.0或更高。在一个实施方案中,步骤(ii)的液体介质的PH在6. 4-6. 8的范围内。在优选的实施方案中,所述第二结构部分是蛋白质。在一个实施方案中,该方法进一步包括下述步骤(V)将所述液体介质的性质调节至6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成,以分解所述聚合物或寡聚物。在一个实施方案中,步骤(ii)和/或步骤(ν)的液体介质的PH是6. 7或更高,如 7.0或更高。在一个实施方案中,步骤(ii)和/或步骤(ν)的液体介质的PH在6. 4-6. 8的范围内。在优选的实施方案中,将步骤(iv)的聚合物或寡聚物用于相互作用研究、分离、 诱导酶复合物的活性或FRET分析中。在一个实施方案中,将步骤(i)的至少一种分子类型固定于固体支持物或亲和介质的基质上。还提供了一种检测一组分子中包括的分子子集之间的结合相互作用的方法,所述方法包括下述步骤(i)提供所述的一组分子,每个分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的 N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分;(ii)提供所述组的分子在液体介质中的溶液,所述液体介质具有6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成;(iii)将所述液体介质的性质调节至6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成;(iv)允许所述分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物, 所述液体介质具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成;(ν)将所述液体介质的性质调节至6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成,以分解所述聚合物或寡聚物;和(Vi)测定形成所述分子子集的两种或多种不同分子之间不是通过所述结合结构部分介导的结合相互作用的存在。还提供了一种或多种分子用于在溶液中通过所述结合结构部分可逆地装配所述分子的聚合物或寡聚物的新用途,所述溶液具有6. 3或更低的PH和允许所述分子聚合或寡聚的离子组成,每个分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的 N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分。在优选的实施方案中,将聚合物或寡聚物用于相互作用研究、分离、诱导酶复合物的活性或FRET分析中。在另一个方面中,本发明提供了一种亲和介质,其包含基质和用于与所述基质偶联的亲和相互作用的配体,该配体包含至少一个100至160个氨基酸残基的片段,其源自蜘蛛丝蛋白的N-端片段。在优选的实施方案中,基质选自由微粒和滤器组成的组。将从下述描述清楚本发明的其他方面和实施方案。附图简述

图1显示了蛛丝蛋白N-端片段的序列比对。图2显示了蛛丝蛋白C-端片段的序列比对。图3说明了 NT4R印、NT4R印CT、4R印和4R印CT的pH诱导的和盐依赖性的聚合。图4显示了不同pH下的NT和NT4Rep的浊度测定。图5显示了 pH 6和7下的NT的动态光散射。图6显示了在各种离子组成下,在pH 6. 1-7. 2下,NT的动态光散射。图7示意性图示了 NT-融合蛋白的pH依赖性装配。图8显示了融合蛋白的电泳凝胶。所附序列列表SEQ ID NO1 4R 印2 4R 印 CT3 NT4R 印4 NT5R 印5 NT4RepCTHis6 NT
7 CT8 共有NT序列9 共有CT序列10 来自 Euprosthenops australis MaSpl 的重复序列11 共有G区段序列112 共有G区段序列213共有G区段序列314 NT4R印(DNA)15 NT4RepCT (DNA)16 NT5R印(DNA)17 NT4ItepCTHis 218 NT4R印CTHis 2 (DNA)19 ZbasicNT4R 印 CT20 NT4R 印 CT21 HisTrxHisThrNT4R印CT22 NT4R印CT 223 HisNTNT4R 印 CT24 HisNTNT4RepCT(DNA)25 NT8R 印 CT26 HisNTMetSP-C33Leu27 HisNTMetSP-C33Leu(DNA)28 HisNTNTMetSP-C33Leu29 HisNTNTMetSP_C33Leu(DNA)30 NTHis31 NTNT8R 印 CT32 NTNTBrichos发明详述本发明总地基于创造性的见解之前了解得不多的蜘蛛丝蛋白的N-端非重复片段参与这些蛋白的聚合,并且特别地,可以通过改变特定的参数来牢固地控制涉及该片段的聚合物的形成。已经将这种见解发展成一种生产分离的蜘蛛丝蛋白的聚合物的新方法。 尽管实例必然涉及特定的蛋白,在这种情况下,为来自Euprosthenops australis的主要蜘蛛丝蛋白I(MaSpl)的蛋白,但认为在此公开的方法对于产生聚合物的目的适用于任何相似的蛋白。这种见解还导致了新蜘蛛丝蛋白基序的鉴定,该基序足以重组生产蜘蛛丝纤维。 其遵循新的蜘蛛丝蛋白基序用作构建新蜘蛛丝蛋白和基因的起始点,如在此记载的那些蛋白和基因。由从新蛛丝蛋白得到的蛋白质形成的聚合物对于它们的物理特性是有用的,尤其是高强度、弹性和重量轻的有用结合。它们对于支持细胞黏附和生长的能力也是有用的。拖丝的特性在用于医疗或技术目的的新材料的研发中是有吸引力的。特别地,根据本发明的蜘蛛丝在医疗装置中是有用的,如植入物和医疗产品,如伤口闭合系统、创可贴(band-aids)、缝合线、创伤敷料和用于组织改造和引导的细胞再生的支架。根据本发明的蜘蛛丝对于用作织物或织品也是特别有用的,如用于降落伞、防弹布料、座椅安全带等。使用该方法,不再需要引入可分裂的融合配偶体,在需要聚合时的过程中使用分裂剂将所述可分裂的融合配偶体分裂。这有助于蜘蛛丝蛋白及其聚合物的生产和产量,并且提供了在工业化生产过程中的优势。如在此所用的术语“纤维”涉及具有至少0. Ιμπι厚度的聚合物,优选人眼可见的宏观聚合物,即,具有至少1 μ m的厚度,并且与其厚度相比在长度上具有相当的延伸性,优选超过5mm。术语“纤维”不包括未组织的聚集物或沉淀物。术语“蛛丝蛋白(spidroin) ”和“蜘蛛丝蛋白(spider silk protein) ”在整个描述中可以互换使用,并且包括所有已知的蜘蛛丝蛋白,包括在十字圆蛛的情况中通常缩写为“MaSp”或“ADF”的主壶腹蜘蛛丝蛋白。这些主壶腹蜘蛛丝蛋白通常有两种类型,1型和 2型。这些术语还包括根据本发明的新蛋白,如所附权利要求和详述的实施方案中限定的, 以及与已知的蜘蛛丝蛋白具有高度同一性和/或相似性的其他非天然蛋白。因此,本发明提供了一种生产分离的蜘蛛丝蛋白的聚合物的方法。在第一个步骤中,提供了一种重组蜘蛛丝蛋白。蜘蛛丝蛋白典型地由170至760个氨基酸残基组成,如170 至600个氨基酸残基,优选280至600个氨基酸残基,如300至400个氨基酸残基,更优选 340至380个氨基酸残基。小尺寸是有利的,因为较长的蜘蛛丝蛋白趋向于形成无定形的聚集物,其需要使用苛性溶剂用于增溶和聚合。重组的蜘蛛丝蛋白可以含有超过760个残基,特别地在蜘蛛丝蛋白含有超过两个源自蜘蛛丝蛋白的N-端部分的片段的情况中,蜘蛛丝蛋白包含由至少一个源自蜘蛛丝蛋白的相应部分的片段组成的N-端片段(NT),和源自蜘蛛丝蛋白的相应内部片段的重复片段(REP)。任选地,蜘蛛丝蛋白包含源自蜘蛛丝蛋白的相应片段的C-端片段(CT)。蜘蛛丝蛋白典型地包含单个源自蜘蛛丝蛋白的N-端部分的片段(NT),但在优选的实施方案中,N-端片段包括至少两个,如两个源自蜘蛛丝蛋白的N-端部分的片段(NT)。因此,蜘蛛丝蛋白可以通过式NTm-REP或NTm-REP-CT来图示,其中m是1 或更大的整数,如2或更大,优选在1-2、1-4、1-6,2-4或2_6的范围内。优选的蜘蛛丝蛋白可以通过式NT2-REP或NT-REP,或者NT2-REP-CT或NT-REP-CT来图示。蛋白片段是共价偶联的,通常通过肽键偶联。在一个实施方案中,蜘蛛丝蛋白由与REP片段偶联的NT片段组成,该REP片段任选与CT片段偶联。NT片段与蜘蛛丝蛋白的N-端氨基酸序列具有高度相似性。如图1中所示,该氨基酸序列在各种物种和蜘蛛丝蛋白(包括MaSpl和MaSp2)中是非常保守的。在图1中,比对了以下的蛛丝蛋白NT片段,在适用的情况中用GenBank登录号表示表1-蛛丝蛋白NT片段代码物种和蛛丝蛋白
Ea MaSp 1 Euprosthenops australis MaSp 1
Lg MaSpl^MMki-Latrodectus geometricus)MaSp 1
Lh MaSpl 黑寡妇_蛛 i Latrodectus Hesperus)M^l
Nc MaSp 1 Nephila clavipes MaSp 1
At MaSp2 三带金蛛 CArgiope trifasciata) MaSp2
Lg MaSp2 几何寇蛛MaSp2
Lh MaSp2 黑寡妇蜘蛛MaSp2
Nim MaSp2 Nephila inaurata madagascariensis MaSp 2
Nc MaSp2 Nephila clavipes MaSp2
Ab CySpl 横纹金蛛(Argiope bruennichi)圆柱状蛛
丝蛋白1
Ncl CySpl 棒络新妇蛛(Nephila clavata)圆柱状蛛
丝蛋白1
LhTuSpl 黑寡妇蜘蛛管状蛛丝蛋白
Nc标记物 Nephila clavipes鞭状丝蛋白
Nim 标记物 Nephila inaurata madagascariensis 鞭状丝
蛋白
GenBank登录号
AM259067
ABY67420
ABY67414
ACF19411
AAZ15371
ABY67417
ABR68855
AAZ15322
ACF19413
BAE86855
BAE54451
ABD24296 AF027972
AF218623 (翻译的)对于每个序列,只显示了对应于N-端片段的部分,省略了信号肽。根据Rising Α.等,Biomacromolecules (生物大分子)7,3120-3124(2006)翻译和编辑了 Nc标记物和 Nlm标记物。观察到NT具有明显的偶极矩,因为酸性和碱性残基成簇位于相对极上。不希望限于此,考虑了所观察到的NT的聚合可能涉及NT 二聚体的线性阵列的形成,极对极地堆积, 在阵列中的下一个二聚体中,一个亚基的阴极面面对相邻亚基的阳极面。哪个特定的NT片段存在于根据本发明的蜘蛛丝蛋白中不是至关重要的,只要NT 片段没有完全缺失。因此,根据本发明的NT片段可以选自图1中所示的任一个氨基酸序列或具有高度相似性的序列。宽泛种类的N-端序列可以用于根据本发明的蜘蛛丝蛋白中。基于图1的同源序列,以下的序列构成了共有NT氨基酸序列QANTPffSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N/Q)TLMSAMD(N/S/ K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAESGG(G/Q)SVGVKTNAISDALSSAFYQTTGSVNPQFV (N/ S)EIRSLI(G/N)M(F/L) (A/S) QASANEV (SEQ ID NO :8)。根据本发明的NT片段的序列与基于图1的氨基酸序列的共有氨基酸序列SEQ IDNO :8具有至少50%的同一性,优选至少60%的同一性。在优选的实施方案中,根据本发明的NT片段的序列与共有氨基酸序列SEQID NO :8具有至少65%的同一性,优选至少70%的同一性。在优选的实施方案中,根据本发明的NT片段与共有氨基酸序列SEQ ID N0:8进一步具有70 %的相似性,优选80 %的相似性。根据本发明的代表性的NT片段是Euprosthenops australis序列SEQ ID NO :6。 根据本发明的优选实施方案,NT片段与SEQ ID NO :6或图1中的任一单独的氨基酸序列具有至少80%的同一性。在本发明优选的实施方案中,NT片段与SEQ ID N0:6或图1中的任一单独的氨基酸序列具有至少90%的同一性,诸如至少95%的同一性。在本发明的优选实施方案中,NT片段与SEQ ID N0:6或图1中的任一单独的氨基酸序列(特别是fe MaSpl) 相同。NT片段含有100至160个氨基酸残基。优选NT片段含有至少100个,或超过110 个,优选超过120个氨基酸残基。还优选NT片段含有至多160个,或少于140个氨基酸残基。典型的NT片段含有大约130-140个氨基酸残基。当蜘蛛丝蛋白的N-端片段含有两个或多个源自蜘蛛丝蛋白的N-端片段的片段 (NT)时,其还可以含有一个或多个接头肽。接头肽可以排列在两个NT片段之间并提供间隔物。蛋白质片段REP具有重复的特征,在富含丙氨酸的片段和富含甘氨酸的片段之间交替。REP片段通常含有超过70个,如超过140个,并且少于300个,优选少于240个,如少于200个氨基酸残基,并且其自身可以分成几个L (接头)区段、A (富含丙氨酸)区段和 G(富含甘氨酸)区段,如将在下面更详细地解释的。典型地,所述接头区段,其是任选的,位于REP片段末端,而其余的区段依次为富含丙氨酸和富含甘氨酸的区段。因此,REP片段通常具有下列结构中的任一种,其中η是整数L (AG) nL,例如 LA1G1A2G2A3G3A4G4A5G5L ;
L (AG) nAL,例如 LA1G1A2G2A3G3A4G4A5G5A6L ;L (GA) nL,例如 LG1A1G2A2G3A3G4A4G5A5L ;或L (GA) nGL,例如!^八似似似似耻。可以理解富含丙氨酸或富含甘氨酸的区段是否与N-端或C-端接头区段相邻不是至关重要的。优选η是2至10的整数,优选2至8,优选4至8,更优选4至6的整数,即η = 4,η = 5 或 η = 6。在优选的实施方案中,根据本发明的REP片段的丙氨酸含量高于20%,优选高于 25%,更优选高于30%,并且低于50%,优选低于40%,更优选低于35%。这是有利的,因为考虑到更高的丙氨酸含量将提供更硬的和/或更强的和/或可延伸性更低的纤维。在特定的实施方案中,REP片段缺乏脯氨酸残基,即在REP片段中没有Pro残基。现在关注构成根据本发明的REP片段的区段,将要强调的是,每个区段是单独的, 即特定REP片段的任何两个A区段、任何两个G区段或任何两个L区段可以是相同的或可以不同。因此,特定REP片段内的每种类型的区段相同不是本发明的一般特征。相反地,以下的公开内容为本领域技术人员提供了关于如何设计单独的区段并将其集合至REP片段中的指导,所述REP片段是根据本发明的功能性蜘蛛丝蛋白的一部分。每个单独的A区段是具有8至18个氨基酸残基的氨基酸序列。优选每个单独的A区段含有13至15个氨基酸残基。还可能的是,大部分或超过两个的A区段含有13至15个氨基酸残基,以及少数,如一个或两个A区段含有8至18个氨基酸残基,如8-12个或16-18 个氨基酸残基。这些氨基酸残基的绝大部分是丙氨酸残基。更特别地,所述氨基酸残基中的0至3个不是丙氨酸残基,并且其余的氨基酸残基是丙氨酸残基。因此,无例外地或除了一个、两个或三个氨基酸残基可以是任意氨基酸外,每个单独的A区段中的所有氨基酸残基是丙氨酸残基。优选,取代丙氨酸的氨基酸是天然氨基酸,优选单独地选自丝氨酸、谷氨酸、半胱氨酸和甘氨酸的组,更优选丝氨酸。当然,可能的是,一个或多个A区段是全丙氨酸区段,而其余的A区段含有1-3个非丙氨酸残基,如丝氨酸、谷氨酸、半胱氨酸或甘氨酸。在优选的实施方案中,每个A区段含有13-15个氨基酸残基,包括10_15个丙氨酸残基和0-3个上述的非丙氨酸残基。在更优选的实施方案中,每个A区段含有13-15个氨基酸残基,其中包括12-15个丙氨酸残基和0-1个上述的非丙氨酸残基。优选,每个单独的A区段与选自SEQ ID NO 10的氨基酸残基7-19、43_56、71_83、 107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、 394-406,421-434,458-470,489-502,517-529,553-566,581-594,618-630,648-661, 676-688,712-725,740-752,776-789,804-816,840-853,868-880,904-917,932-945, 969-981、999-1013、1028-1042和1060-1073的组的氨基酸序列具有至少80%的同一性,优选至少90%,更优选95%,最优选100%的同一性。该组的每个序列对应于Euprosthenops australis MaSpl蛋白的天然存在序列的区段,所述序列是从相应的cDNA的克隆中推导出来的,参见WO 2007/078239。或者,每个单独的A区段与选自SEQ ID NO 3的氨基酸残基 143-152、174-186、204-218、233-247和洸5_278的组的氨基酸序列具有至少80%的同一性,优选至少90%,更优选95%,最优选100%的同一性。该组的每个序列对应于表达的根据本发明的非天然蜘蛛丝蛋白的区段,该蛋白具有在合适的条件下形成丝纤维的能力(参见实施例2、。因此,在根据本发明的特定实施方案中,每个单独的A区段与选自上述的氨基酸区段的氨基酸序列相同。不希望受到任何特定理论的束缚,设想了根据本发明的A区段形成螺旋结构或β-折叠。如下计算了在整个说明书和所附权利要求中所用的术语“同一性%”。使用 CLUSTAL W 算法(Thompson,J. D.,Higgins, D. G.禾Π Gibson, Τ. J.,Nucleic Acids Research (核酸研究),22 :4673-4680(1994))将查询序列与靶序列进行比对。在对应于比对序列中的最短序列的窗口进行比较。比较每个位置上的氨基酸残基,并将查询序列中具有在靶序列中的相同的对应性的位置的百分比记录为同一性%。如对于“同一性%”所描述的,计算在整个说明书和所附权利要求中所用的术语 “相似性% ”,除了疏水性残基Ala、Val, Phe, Pro, Leu、lie、Trp、Met和Cys是相似的;碱性残基Lys、Arg和His是相似的;酸性残基Glu和Asp是相似的;以及亲水性的、不带电荷的残基Gin、Asn、Ser, Thr和Tyr是相似的外。在该情形下,剩下的天然氨基酸Gly与任何其他氨基酸都不相似。在整个说明书中,根据本发明的备选实施方案满足相应的相似性百分比,而不是满足指定的同一性百分比。其他备选的实施方案满足指定的同一性百分比,以及另一个更高百分比的相似性,其选自对于每个序列优选的同一性百分比组。例如,序列可以与另一个序列70%相似;或者其可以与另一个序列70%相同;或者其可以与另一个序列70%相同和90%相似。此外,从实验数据推导出每个单独的G区段是12至30个氨基酸残基的氨基酸序列。优选每个单独的G区段由14至23个氨基酸组成。每个G区段的至少40%的氨基酸残基是甘氨酸残基。典型地,每个单独的G区段的甘氨酸含量在40-60%的范围内。优选每个单独的G区段与选自SEQ ID NO 10的氨基酸残基20_42、57_70、 84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、 371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、 662-675,689-711,726-739,753-775,790-803,817-839,854-867,881-903,918-931, 946-968、982-998、1014-1027、1043-1059 和 1074-1092 的组的氨基酸序列具有至少 80% 的同一性,优选至少90%,更优选95%,最优选100%的同一性。该组的每个序列对应于 Euprosthenops australis MaSpl蛋白的天然存在序列的区段,所述序列是从相应的cDNA 的克隆推导出来的,参见WO 2007/078239。或者,每个单独的G区段与选自SEQ ID NO 3 的氨基酸残基153-173、187-203、219-232、M8-264和279-296的组的氨基酸序列具有至少 80%的同一性,优选至少90%,更优选95%,最优选100%的同一性。该组的每个序列对应于表达的根据本发明的非天然蜘蛛丝蛋白的区段,该蛋白具有在合适的条件下形成丝纤维的能力(参见实施例幻。因此,在根据本发明的特定实施方案中,每个单独的G区段与选自上述的氨基酸区段的氨基酸序列相同。在特定的实施方案中,根据本发明的每个G区段的前两个氨基酸残基不是-Gin-Gin-。存在3个亚型的根据本发明的G区段。该分类是基于Euprosthenops australis MaSpl蛋白质序列的仔细分析(W02007/078239),并且已在新的非天然蜘蛛丝蛋白的构建中使用并验证了该信息。根据本发明的G区段的第一种亚型由氨基酸单字母共有序列GQG(G/S)QGG(Q/Y) GG(L/Q)GQGGYGQGA GSS (SEQ ID NO :11)来表示。该第一种并且通常最长的G区段亚型典型地含有23个氨基酸残基,但可以含有少至17个氨基酸残基,并且不存在带电荷的残基或含有一个带电荷的残基。因此,优选该第一种G区段亚型含有17-23个氨基酸残基,但可以考虑其含有少至12个或多至30个氨基酸残基。不希望受到任何特定理论的束缚,设想了该亚型形成卷曲结构或31-螺旋结构。该第一种亚型的代表性G区段是SEQ ID N0:10的氨基酸残基 20-42、84-106、148-170、212-2;34、307-3四、371-393、435-457、530-552、595-617、 689-711,753-775,817-839,881-903,946-968,1043-1059 和 1074-1092。在特定的实施方案中,根据本发明的该第一种亚型的每个G区段的前两个氨基酸残基不是-Gln-Gln-。根据本发明的G区段的第二种亚型由氨基酸单字母共有序列GQGGQGQG(G/R)Y GQG(A/S)G(S/G)S(SEQ ID NO :12)来表示。该第二种并且通常中等大小的G区段亚型典型地含有17个氨基酸残基,并且不存在带电荷的残基或含有一个带电荷的残基。优选该第二种G区段亚型含有14-20个氨基酸残基,但考虑了其可以含有少至12个或多至30个氨基酸残基。不希望受到任何特定理论的束缚,设想了该亚型形成卷曲结构。该第二种亚型的代表性 G 区段是 SEQ ID NO 10 的氨基酸残基 249-265、471_488、631_647 和 982-998 ;和 SEQ ID NO 3的氨基酸残基187-203。根据本发明的G区段的第三种亚型由氨基酸单字母共有序列G(R/Q)GQG(G/R)YGQG (A/S/V) GGN (SEQ ID NO 13)来表示。该第三种G区段亚型典型地含有14个氨基酸残基,并且通常是最短的根据本发明的G区段亚型。优选该第三种G区段亚型含有12-17个氨基酸残基,但考虑了其可以含有多至23个氨基酸残基。不希望受到任何特定理论的束缚,设想了该亚型形成转角结构。该第三种亚型的代表性G区段是SEQ ID N0:10的氨基酸残基 57-70、121-134、184-197、280-293、343-356、407-420、503-516、567-580、662-675、 726-739,790-803,854-867,918-931,1014-1027 和 SEQ ID NO 3 的氨基酸残基 219-232。因此,在优选的实施方案中,每个单独的G区段与选自SEQ ID NO=IUSEQ ID NO: 12和SEQ ID NO :13的氨基酸序列具有至少80%、优选90%、更优选95%的同一性。在REP片段的A和G区段的交替序列的优选实施方案中,每个第二个G区段是第一种亚型,而其余的G区段是第三种亚型,例如· · · A1GfiA2G长A3GfiA4G长A5Gfi. · ·。在REP片段的另一个优选实施方案中,一个第二种亚型的G区段通过插入而破坏了 G区段的规律性, 例如· · .A1Gs A2G长 A3G 中等A4G短 A5G长· · ·。每个单独的L区段表示任选的接头氨基酸序列,其可以含有0至20个氨基酸残基,如0至10个氨基酸残基。虽然该区段是任选的,并且对于蜘蛛丝蛋白在功能上不是至关重要的,但是它的存在仍然允许获得完全功能性的蜘蛛丝蛋白,从而形成根据本发明的蜘蛛丝纤维。在来自Euprosthenops australis的MaSpl蛋白的推导的氨基酸序列的重复部分(SEQ ID NO 10)中也存在接头氨基酸序列。特别地,接头区段的氨基酸序列可以与所述的A或G区段中的任一个相似,但通常不足以满足它们在本文中定义的标准。如WO 2007/078239中所示,排列在REP片段的C-端部分的接头区段可以由富含丙氨酸的氨基酸单字母共有序列ASASAAASAA STVANSVS和ASAASAAA来表示。实际上,第二个序列可以认为是根据本发明的A区段,而第一个序列与根据本发明的A区段具有高度的相似性。根据本发明的接头区段的另一个实例具有单字母氨基酸序列GSAMGQGS,该序列富含甘氨酸并且与根据本发明的G区段具有高度相似性。接头区段的另一个实例是SASAG。代表性的L区段是SEQ ID NO 10的氨基酸残基1-6和1093-1110 ;SEQ ID NO 3 的氨基酸残基138-142,但本领域技术人员将容易地认识到,对于这些区段,存在许多合适的备选氨基酸序列。在根据本发明的REP片段的一个实施方案中,L区段之一含有0个氨基酸,即,L区段之一是不存在的。在根据本发明的REP片段的另一个实施方案中,两个L区段都含有0个氨基酸,即两个L区段都不存在。因此,根据本发明的REP片段的这些实施方案可如下示意性地表示(AG) nL、(AG)nAL, (GA)nL, (GA)nGL ;L(AG) n、L (AG)nA、L (GA) n、L(GA) β-M (AG)n, (AG)nA, (GA)n, (GA)nG。这些REP片段中的任一个片段都适合与下面定义的任何CT片段一起使用。根据本发明的蜘蛛丝蛋白的任选CT片段与蜘蛛丝蛋白的C-端氨基酸序列具有高度相似性。如WO 2007/078239中所示,该氨基酸序列在各种物种和蜘蛛丝蛋白(包括 MaSpl和MaSp2)中是非常保守的。提供了 MaSpl和MaSp2的C-端区域的共有序列,为SEQ ID NO :9。在图2中,比对了以下MaSp蛋白,在适用的情况中用GenBank登录条目表示表2-蛛丝蛋白CT片段物种和蛛丝蛋白
Euprosthenops sp MaSpl (Pouchkina-Stantcheva, NN & McQueen-Mason, SJ,同上)
Euprosthenops australis MaSpl
三带金蛛(Argiope trifasciata) MaSpl
皿云斑蛛(Crytophora moluccensis) Spl
几何寇蛛Ma^Dl
黑寡妇蜘蛛MaSpl
赫氏粒突蛛(Macrothele holstf) Spl
Nephila clavipes MaSpl
毛络新妇蛛 QNephilapilipes) MaSpl
金色球体蜘蛛(Nephila madagascariensis) MaSpl
Nephila senegalensis MaSpl
变异虫朱 COctonoba varians) Spl
中华褛网蛛(Psechrus sinensis) Spl
Tetragnatha kauaiensis MaSpl
Tetragnatha versicolor MaSpl
条目
CthybEsp
CTnatEau AF3 50266—Atl AY666062—Cml AF350273_Lgl AY953074—Lhl AY666068—Mhl U20329—Ncl AY666076—Npl AF350277_Nml AF350279—Nsl AY666057 0vl AY666064_Psl AF350285_Tkl AF350286 Tvl
Araneus bicentenarius Sp2 悦目金蛛(Argiope amoena) MaSp2 Argiope aurantia MaSp2 三带金蛛(Argiope trifasciata) MaSp2 Gasteracantha mammosa MaSp2 几何寇蛛
黑寡妇蜘蛛MaSp2
ABU20328_Ab2
AY365016_Aam2
AY350263_Aau2
AF350267_At2
AF3520272_Gm2
AF350275_Lg2
AY953075 Lh2Nephila clavipes MaSp2 金色球体蜘蛛MaSp2 Nephila senegalensis MaSp2
Dolomedes tenebrosus Fbl Dolomedes tenebrosus Fb2
AY654293_Nc2 AF350278 Nm2 AF350280 Ns2
AF350269—DtFbl AF350270 DtFb2
十字圆蛛(.Araneus diadematus) ADF-I 十字圆蛛ADF-2 十字圆蛛ADF-3
U47853 ADF1 U47854 ADF2 U47855 ADF3
十字圆蛛 ADF-4U47856 ADF4如果有的话,哪个特定的CT片段存在于根据本发明的蜘蛛丝蛋白中不是至关重要的。因此,根据本发明的CT片段可以选自图2和表2中所示的任一个氨基酸序列或具有高度相似性的序列。宽泛种类的C-端序列可以用于根据本发明的蜘蛛丝蛋白中。根据本发明的CT片段的序列与基于图2的氨基酸序列的共有氨基酸序列SEQ ID NO 9具有至少50 %同一性,优选至少60 %,更优选至少65 %的同一性,或乃至至少70 %的同一性。根据本发明的代表性CT片段是Euprosthenops austral is序列SEQ ID NO :7。因此,根据本发明的优选方面,CT片段与SEQ ID NO 7或图2和表2的任一个单独的氨基酸序列具有至少80%的同一性,优选至少90%,如至少95%的同一性。在本发明的优选方面中,CT片段与SEQ ID NO 7或图2和表2的任一个单独的氨基酸序列相同。CT片段典型地由70至120个氨基酸残基组成。优选CT片段含有至少70个氨基酸残基,或大于80个,优选大于90个氨基酸残基。还优选CT片段含有至多120个氨基酸残基,或小于110个氨基酸残基。典型的CT片段含有大约100个氨基酸残基。在一个实施方案中,生产分离的蜘蛛丝蛋白的聚合物的方法的第一个步骤涉及在合适的宿主中(如大肠杆菌(Escherichia coli))中表达编码蜘蛛丝蛋白的多核酸分子。 使用标准程序分离由此获得的蛋白质。任选地,在该阶段积极地除去脂多糖和其他致热原。在生产分离的蜘蛛丝蛋白的聚合物的方法的第二个步骤中,提供了蜘蛛丝蛋白在液体介质中的溶液。术语“可溶的”和“在溶液中”意思是蛋白没有明显聚集并且在eooooxg 下没有从溶剂中沉淀出来。所述液体介质可以是任何合适的介质,如含水介质,优选生理介质,典型地是缓冲含水介质,如10-50mM Tris-HCl缓冲液或磷酸盐缓冲液。液体介质具有 6. 4或更高的pH和/或防止蜘蛛丝蛋白聚合的离子组成。即,液体介质具有6. 4或更高的 PH或防止蜘蛛丝蛋白聚合的离子组成,或同时具备两者。本领域技术人员利用在此公开的方法可以容易地制备防止蜘蛛蛋白聚合的离子组成。防止蜘蛛丝蛋白聚合的优选离子组成具有超过300mM的离子强度。防止蜘蛛丝蛋白聚合的离子组成的特定实例包括高于300mMNaCl、100mM磷酸盐和对蜘蛛丝蛋白聚合具有所需防止性作用的那些离子的组合,例如,IOmM磷酸盐和300mM NaCl的组合。已经令人惊讶地发现了 NT片段的存在提高了溶液的稳定性并且防止了在这些条件下的聚合物形成。当立即的聚合不是合乎需要时,例如在蛋白纯化过程中,在大批制备中,或当需要优化其他条件时,这是有利的。优选将液体介质的PH调节至6. 7或更高,如 7. 0或更高,或乃至8. 0或更高,如高至10. 5,以获得蜘蛛丝蛋白的高溶解性。将液体介质的PH调节至6. 4-6. 8的范围也是有利的,这提供了充足的蜘蛛丝蛋白的溶解性,且有助于随后将PH调节至6. 3或更低。在第三个步骤中,将液体介质的性质调节至6. 3或更低的pH和允许聚合的离子组成。即,如果其中溶解蜘蛛丝蛋白的液体介质具有6. 4或更高的pH,将pH降至6. 3或更低。 本领域技术人员将非常清楚实现这的各种方式,典型地涉及添加强酸或弱酸。如果其中溶解蜘蛛丝蛋白的液体介质具有防止聚合的离子组成,改变离子组成,以允许聚合。本领域技术人员将非常清楚实现这的各种方式,例如,稀释、渗析或凝胶过滤。如果需要,该步骤同时涉及将液体介质的PH降至6. 3或更低和改变离子组成,从而允许聚合。优选将液体介质的 PH调节至6. 2或更低,如6. 0或更低。特别地,从实践的观点看,限制将前一步骤中的6. 4 或6. 4-6. 8的pH降至该步骤中的6. 3或6. 0-6. 3 (例如6. 2)是有利的。在优选的实施方案中,该步骤的液体介质的PH是3或更高,如4. 2或更高。所得到的pH范围,例如4. 2-6. 3, 促进了快速聚合。在第四个步骤中,使蜘蛛丝蛋白在具有6. 3或更低pH和允许蜘蛛丝蛋白聚合的离子组成的液体介质中聚合。已经令人惊讶地发现,尽管NT片段的存在提高了蜘蛛丝蛋白在 6. 4或更高的pH和/或防止蜘蛛丝蛋白聚合的离子组成下的溶解性,但在离子组成允许蜘蛛丝蛋白聚合时,该片段促进了在6. 3或更低pH下的聚合物形成。所得到的聚合物优选是固体并且是肉眼可见的,并且它们在具有6. 3或更低的pH和允许蜘蛛丝蛋白聚合的离子组成的液体介质中形成。在优选的实施方案中,该步骤的液体介质的PH为3或更高,如4. 2 或更高。所得到的PH范围,例如,4. 2-6.3,促进了快速聚合。优选的聚合物形状包括纤维、 薄膜、泡沫、网或网状物。优选聚合物是具有超过0.1 μ m(优选超过1 μ m)直径和超过5mm 的长度的纤维。通过本领域技术人员利用在此公开的方法可以容易地制备允许蜘蛛蛋白聚合的离子组成。允许蜘蛛丝蛋白聚合的优选离子组成具有低于300mM的离子强度。允许蜘蛛丝蛋白聚合的离子组成的特定实例包括150mM NaClUOmM磷酸盐、20mM磷酸盐和对蜘蛛丝蛋白聚合缺乏防止性作用的这些离子的组合,例如,IOmM磷酸盐或20mM磷酸盐和150mM NaCl 的组合。优选将该液体介质的离子强度调节至l_250mM的范围内。不希望受到任何特定理论的束缚,设想了 NT片段具有相反电荷的极,并且pH的环境变化影响了聚合后的蛋白表面的电荷平衡,而盐抑制了该相同事件。在中性pH下,预期掩盖酸性极的过量负电荷的能量消耗将防止聚合。然而,随着二聚体在较低PH下接近其等电点,静电吸引力最终将变得明显,这解释了所观察到的NT和含NT的微型蛛丝蛋白的盐和pH-依赖性聚合行为。我们提出,pH-诱导的NT聚合,和NT-微型蛛丝蛋白的提高的纤维装配效率,是由于表面静电势能的变化引起的,并且在NT—个极上的酸性残基的聚集改变了其电荷平衡,使得在6. 3或更低的pH值下发生了聚合转变。
在第五个和最后一个步骤中,从所述液体介质中分离出所得到的优选是固体的蜘蛛丝蛋白聚合物。任选地,该步骤涉及从蛛丝蛋白聚合物中积极地除去脂多糖和其他致热原。不希望受到任何特定理论的限制,已经观察到蛛丝蛋白聚合物的形成通过水溶性蛛丝蛋白二聚体的形成来进行。因此,本发明还提供了一种生产分离的蜘蛛丝蛋白的二聚体的方法,其中前两个方法步骤如上所述。蜘蛛丝蛋白作为二聚体存在于具有6. 4或更高的PH和/或防止所述蜘蛛丝蛋白聚合的离子组成的液体介质中。第三个步骤涉及分离出第二个步骤中所获得的二聚体,并任选除去脂多糖和其他致热原。在优选的实施方案中,本发明的蜘蛛丝蛋白聚合物由聚合的蛋白质二聚体组成。因此,本发明提供了蜘蛛丝蛋白(优选在此公开的那些)用于生产蜘蛛丝蛋白的二聚体的新用途。根据另一个方面,本发明提供了在此公开的蜘蛛丝蛋白的聚合物。在优选的实施方案中,通过根据本发明的任一种方法可获得该蛋白的聚合物。因此,本发明提供了蜘蛛丝蛋白(优选在此公开的那些)用于生产蜘蛛丝蛋白的聚合物的新用途。根据一个实施方案, 本发明提供了蜘蛛丝蛋白的二聚体(优选在此公开的那些)用于生产分离的蜘蛛丝蛋白的聚合物的新用途。在这些用途中,优选在具有6. 3或更低的pH和允许所述蜘蛛丝蛋白聚合的离子组成的液体介质中生产聚合物。在优选的实施方案中,液体介质的PH为3或更高, 如4. 2或更高。所得到的pH范围,例如4. 2-6. 3,促进了快速聚合。使用本发明的方法,可以控制聚合过程,并且这允许优化参数,用于获得具有所需特性和形状的丝聚合物。优选根据本发明的蜘蛛丝蛋白的聚合物是具有肉眼可见大小的纤维,S卩,具有高于0. 1 μ m的直径,优选高于1 μ m的直径,和高于5mm的长度。优选纤维具有1_400 μ m范围内的直径,优选60-120 μ m范围内的直径,和0. 5-300cm范围内的长度,优选I-IOOcm范围内的长度。其他优选的范围是0.5-30cm和l-20cm。还优选根据本发明的蛛丝蛋白的聚合物,如纤维,具有超过IMPa的拉伸强度,优选高于2MPa,更优选IOMI5a或更高的拉伸强度。优选根据本发明的蜘蛛丝蛋白的聚合物,如纤维,具有高于IOOMPa的拉伸强度,更优选 200MI^或更高的拉伸强度。纤维在物理操作过程中具有保持完整的能力,即,可以用于纺织、编织、搓捻、钩编和相似的程序。在其他优选的实施方案中,根据本发明的蛛丝蛋白的聚合物形成泡沫、网、网状物
或薄膜。根据另一个方面,本发明提供了分离的多核酸分子,其包含编码根据本发明的蜘蛛丝蛋白的核酸序列,或其互补核酸序列,如SEQ ID N0:14-16。这些多核酸分子以及编码在此公开的各种蛋白(SEQ ID NO :1-7,10-13)的多核酸分子在非天然的蛛丝蛋白或用于其的生产系统的进一步研发中也是有用的。根据本发明的多核酸分子可以是DNA分子,包括cDNA分子,或RNA分子。如本领域技术人员所公知的,核酸序列也可以通过其互补核酸序列来描述。因此,本发明的保护范围还包括与根据本发明的核酸序列互补的核酸序列。根据一个方面,本发明提供了生产根据本发明的蜘蛛丝蛋白的方法。在第一个步骤中,在合适的宿主中表达编码根据本发明的蜘蛛丝蛋白的多核酸分子。在第二个步骤中, 分离由此获得的可溶性蜘蛛丝蛋白,例如,使用色谱和/或过滤分离。任选地,所述分离可溶性蜘蛛丝蛋白的第二个步骤涉及LPS和其他致热原的去除。典型地使用各种合适的宿主,如细菌、酵母、哺乳动物细胞、植物、昆虫细胞和转基因动物,重组产生根据本发明的蜘蛛丝蛋白。优选在细菌中生产根据本发明的蜘蛛丝蛋白。为了获得具有低致热原含量的蛋白质,所述蛋白是体内专性用作生物材料的物质,已经研发了为除去脂多糖(LPS)优化的纯化实验方案。为了避免释放的LPS的污染,将生产细菌细胞接受洗涤步骤,洗涤步骤使用改变的CaCl2和EDTA。细胞裂解后,在低传导性缓冲液中进行所有随后的纯化步骤,以最小化目标蛋白和LPS之间的疏水性相互作用。通过将蛋白质溶液流过Endotrap柱来进一步最小化LPS含量,所述柱子具有特异性吸收LPS 的配体。为了确保恒定的低含量LPS和其他致热原,使用体外致热原测试(IPT)和/或鲎变形细胞裂解物(LAL)动力学测试来分析所有批次。尽管在革兰氏阴性细菌宿主中生产,但可以纯化重组蛛丝蛋白,使得LPS和其他致热原的残余水平低于动物测试所需的极限,即, 低于25EU/灌输。在根据本发明的特定实施方案中,分离的蜘蛛丝蛋白中的LPS和其他致热原的含量为lEU/mg蛋白或更低。在根据本发明的特定实施方案中,分离的蜘蛛丝蛋白中的LPS和其他致热原的含量为lEU/mg蛋白或更低,优选0. 25EU/mg蛋白或更低。根据一个方面,本发明提供了包含溶解于液体介质中的分离蜘蛛丝蛋白(优选在此公开的那些)的组合物,所述液体介质具有6. 4或更高的pH和/或防止所述蜘蛛丝蛋白聚合的离子组成。液体介质可以是任何合适的介质,如含水介质,优选生理介质,通常是缓冲的含水介质,如10-50mMTris-HCl缓冲液或磷酸盐缓冲液。液体介质具有6. 4或更高的 PH和/或防止蜘蛛丝蛋白聚合的离子组成。即,液体介质具有6. 4或更高的pH或防止蜘蛛丝蛋白聚合的离子组成,或同时具备两者。防止蜘蛛丝蛋白聚合的优选离子组成具有超过300mM的离子强度。防止蜘蛛丝蛋白聚合的离子组成的特定实例包括超过300mM NaCl, IOOmM磷酸盐和对蜘蛛丝蛋白聚合具有所需防止性作用的那些离子的组合,例如,IOmM磷酸盐和300mM NaCl的组合。优选液体介质的pH为6. 7或更高,如7. 0或更高,或乃至8. 0 或更高,如高至10. 5,以获得蜘蛛丝蛋白的高溶解性。液体介质的pH在6. 4-6. 8的范围内也是有利的,这提供了充足的蜘蛛丝蛋白的溶解性,且有助于随后将PH调节至6. 3或更低。 优选所述液体介质中的脂多糖和其他致热原的含量为lEU/mg分离的蛋白或更低。蜘蛛丝蛋白的N-端非重复片段参与这些蛋白的聚合,以及可以通过改变特定的参数来牢固地控制涉及该片段的聚合物的形成的创造性见解已经发展成可逆地装配分子的聚合物或寡聚物的新方法,所述分子携带至少一个源自N-端非重复蛛丝片段的片段。尽管实例必定涉及特定的蛋白,在这种情况下,为含有源自Euprosthenops australis的主要蛛丝蛋白I(MaSpl)的N-端蛋白片段,认为对于生产聚合物或寡聚物的目的,在此公开的方法适于任何相似的蛋白。根据这个方面,本发明提供了可逆地装配一种类型的分子或几种不同类型的分子的聚合物或寡聚物的方法。第一个方法步骤涉及提供所述分子。每个分子包含(a)至少一个第一结合结构部分和(b)携带待研究或利用的生物活性的第二结构部分。在优选的实施方案中,所述分子包含单个结合结构部分(a)。在其他优选实施方案中,所述分子包含至少两个,如两个结合结构部分(a)。每个分子典型地含有选自范围1-2、1-4、1-6、2-4和2_6个的多个结合结构部分(a)。每个结合结构部分(a)由100至160个氨基酸残基组成,并且源自蜘蛛丝蛋白的N-端(NT)片段。NT片段与蜘蛛丝蛋白的N-端氨基酸序列具有高度相似性。如表1和图1中所示,该氨基酸序列在各种物种和蜘蛛丝蛋白(包括MaSpl和MaSp2) 中是非常保守的。观察到NT具有明显的偶极矩,因为酸性和碱性残基成簇位于相对极上。不希望限于此,考虑了所观察到的NT的聚合可能涉及NT 二聚体的线性阵列的形成,极对极地堆积, 在阵列中的下一个二聚体中,一个亚基的阴极面面对相邻亚基的阳极面。哪个特定的NT片段存在于根据本发明这个方面的分子类型中不是至关重要的, 只要NT片段没有完全缺失。因此,根据本发明这个方面的NT片段可以选自表1或图1中所示的任一个氨基酸序列或具有高度相似性的序列。宽泛种类的N-端序列可以用于根据本发明这个方面的分子类型中。根据本发明的NT片段的序列与共有氨基酸序列SEQ ID NO 8具有至少50%的同一性,优选至少60%的同一性,SEQ ID NO :8是基于图1的氨基酸序列。在优选的实施方案中,根据本发明的NT片段的序列与共有氨基酸序列SEQ ID NO :8具有至少65%的同一性,优选至少70%的同一性。在优选的实施方案中,根据本发明的NT片段与共有氨基酸序列SEQ ID NO 8进一步具有70%的相似性,优选80%的相似性。根据本发明的代表性的NT片段是Euprosthenops australis序列SEQ ID NO :6。 根据本发明的优选实施方案,NT片段与SEQ ID NO :6或图1中的任一单独的氨基酸序列具有至少80%的同一性。在本发明的优选实施方案中,NT片段与SEQ ID N0:6或图1中的任一单独的氨基酸序列具有至少90%的同一性,如至少95%的同一性。在本发明的优选实施方案中,NT片段与SEQ ID NO 6或图1中的任一单独的氨基酸序列相同。NT片段含有100至160个氨基酸残基。优选NT片段含有至少100个,或超过110 个,优选超过120个氨基酸残基。还优选NT片段含有至多160个,或少于140个氨基酸残基。典型的NT片段含有大约130-140个氨基酸残基。特定方法的所有分子典型地具有共有的结合结构部分(a),但也可以具有不同的分子类型,其中在使用不同的结构部分(a)中存在差异,只要它们保持在在此列出的PH和离子强度条件下彼此结合的能力。通常,第二结构部分(b)携带待研究或利用的生物活性, 并且典型地当方法涉及超过一种分子类型时,该第二结构部分(b)不同。第二结构部分(b) 独立地选自蛋白质、核酸、碳水化合物和脂质。优选,第二结构部分(b)也是蛋白质。在优选的实施方案中,第一个步骤的分子是相同的,S卩,是一种类型的,并且因此所得到的聚合物(寡聚物)是同聚物(同寡聚物)。在另一个优选实施方案中,第一个步骤的分子是不同的,并且因此所得到的聚合物(寡聚物)是杂聚物(杂寡聚物)。如上所讨论的,分子异质性可能存在于结合结构部分(a)、生物活性结构部分(b)或两者中。在第二个方法步骤中,提供了分子在液体介质中的溶液。液体介质可以是任何合适的介质,如含水介质,优选生理介质,典型地是缓冲的含水介质,如10-50mM Tris-HCl缓冲液或磷酸盐缓冲液。液体介质具有6. 4或更高的pH和/或防止分子通过所述结合结构部分聚合或寡聚的离子组成。即,液体介质具有6. 4或更高的pH或防止分子通过所述结合结构部分聚合或寡聚的离子组成,或同时具备两者。本领域技术人员利用在此公开的方法可以容易地制备防止分子通过所述结合结构部分聚合或寡聚的离子组成。防止分子通过所述结合结构部分聚合的优选离子组成具有超过300mM的离子强度。防止分子通过所述结合结构部分聚合的离子组成的特定实例包括超过300mM NaCl UOOmM磷酸盐和对分子通过所述结合结构部分聚合具有所需防止性作用的这些离子的组合,例如,IOmM磷酸盐和300mM NaCl的组合。已经令人惊讶地发现了至少一个NT片段的存在提高了溶液的稳定性并且防止了在这些条件下的聚合物和寡聚物形成。当立即的聚合或寡聚不是合乎需要时,例如在蛋白纯化过程中,在大批制备中,或当需要优化其他条件时,这是有利的。优选将液体介质的PH 调节至6. 7或更高,如7. 0或更高,或乃至8. 0或更高,如高至10. 5,以获得分子的高溶解性。将液体介质的PH调节至6. 4-6.8的范围也是有利的,这提供了充足的分子的溶解性, 且有助于随后将PH调节至6. 3或更低。在第三个方法步骤中,调节所述液体介质的性质,使得允许分子通过所述结合结构部分聚合或寡聚。因此将液体介质的性质调节至6. 3或更低的pH和允许聚合或寡聚的离子组成。即,如果其中溶解分子的液体介质具有6. 4或更高的pH,则将pH降至6. 3或更低。本领域技术人员公知实现这的各种方式,典型地涉及添加强酸或弱酸。如果其中溶解分子的液体介质具有防止聚合或寡聚的离子组成,则改变离子组成,使得允许分子通过所述结合结构部分聚合或寡聚。本领域技术人员公知实现这的各种方式,例如,稀释、渗析或凝胶过滤。如果需要,该步骤涉及同时将液体介质的PH降至6. 3或更低和改变离子组成,使得允许聚合或寡聚。优选将液体介质的PH调节至6. 2或更低,如6.0或更低。特别地,从实践的观点看,限制将前一步骤中的6. 4或6. 4-6. 8的pH降至该步骤中的6. 3或6. 0-6. 3, 例如6. 2,是有利的。在优选的实施方案中,该步骤的液体介质的pH是3或更高,如4. 2或更高。所得到的PH范围,例如,4. 2-6. 3,促进了快速聚合。在第四个方法步骤中,允许分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物。液体介质具有6. 3或更低的pH和允许分子通过所述结合结构部分聚合或寡聚的离子组成。已经令人惊讶地发现,尽管结合结构部分的存在提高了分子在6. 4或更高的PH和/或防止分子聚合或寡聚的离子组成下的溶解性,在离子组成允许分子聚合或寡聚时,该结合结构部分促进了在6. 3或更低pH下的聚合物和寡聚物形成。在优选的实施方案中,将该步骤的液体介质的PH是3或更高,如4. 2或更高。所得到的pH范围,例如,4. 2-6.3, 促进了快速聚合。在该方法的优选实施方案中,在第四个步骤中获得的聚合物或寡聚物仍然是可溶的,即,其溶解于具有6. 3或更低pH和允许分子聚合或寡聚的离子组成的液体介质中。本领域技术人员利用在此公开的方法可以容易地制备允许分子通过所述结合结构部分聚合或寡聚的离子组成。允许分子通过所述结合结构部分聚合的优选离子组成具有低于300mM的离子强度。允许分子通过所述结合结构部分聚合的离子组成的特定实例包括 150mM NaClUOmM磷酸盐、20mM磷酸盐和对分子通过所述结合结构部分聚合缺乏防止性作用的这些离子的组合,例如,IOmM磷酸盐或20mM磷酸盐和150mM NaCl的组合。优选将该液体介质的离子强度调节至l_250mM的范围内。在优选的实施方案中,根据本发明的这个方面的方法可以包括逆转聚合物或寡聚物装配的第五个步骤。该方法步骤涉及将液体介质的性质调节至6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成。这使得存在于液体介质中的聚合物或寡聚物分解并溶解于所述液体介质中。该第五个方法步骤的液体介质可以具有对第二个方法步骤的液体介质所讨论的相同组成。例如,优选第五个方法步骤的液体介质的PH为6. 7或更高,如7. 0或更高,或乃至8. 0或更高,如高至10. 5。或者,第五个方法步骤的液体介质的pH在6. 4-6. 8 的范围内。步骤(iv)的聚合物或寡聚物可以有利地用于相互作用研究、分离、诱导酶复合物的活性或FRET分析中。在特定的应用中,将第一个方法步骤的至少一种分子类型固定于固体支持物上或亲和性介质的基质上,如以下将列出的。根据一个方面,本发明还提供了检测一组分子中包括的分子子集之间的结合相互作用的方法。在第一个方法步骤中,提供一组分子。按照以上的详述设计这组的每个分子, 即,其包含(a)至少一个第一结合结构部分和(b)携带待研究或利用的第二结构部分。在优选的实施方案中,所述分子包含单个结合结构部分(a)。在其他优选的实施方案中,所述分子包含至少两个,如两个结合结构部分(a)。每个分子通常含有选自范围1-2、1-4、1-6、 2-4和2-6个的多个结合结构部分(a)。每个结合结构部分(a)由100至160个氨基酸残基组成,并且其源自如上所述的蜘蛛丝蛋白的N-端(NT)片段。每个生物活性结构部分(b) 独立地选自蛋白质、核酸、碳水化合物和脂质,优选蛋白质。在第二个方法步骤中,提供了所述分子组在液体介质中的溶液。如上所述,液体介质具有6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成。从之前的公开内容可以清楚优选的液体介质的组成。在第三个方法步骤中,将液体介质的性质调节至允许分子聚合或寡聚。如上所示, 液体介质具有6. 3或更低的pH和允许分子聚合或寡聚的离子组成。从之前的公开内容可以清楚优选的液体介质的组成。在第四个方法步骤中,允许该组分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物。如上所示,液体介质具有6. 3或更低的pH和允许分子聚合或寡聚的离子组成。从之前的公开内容可以清楚优选的液体介质的组成。在第五个方法步骤中,调节液体介质的性质,使得分解聚合物或寡聚物。如上所示,液体介质具有6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成。从之前的公开内容可以清楚优选的液体介质的组成。这通过防止经由NT-衍生的结合结构部分的缔合引起聚合物或寡聚物的分解。在最后一个和第六个方法步骤中,确定两个或多个不同分子之间不是通过所述结合结构部分介导的结合相互作用的存在。这鉴定了没有涉及通过NT-衍生的结合结构部分介导的PH/盐-调节的聚合或寡聚的分子子集之间的相互结合作用。本发明的相关方面是基于以下见解pH从大约7降至6时,或更具体地从高于6. 4 降至低于6. 3时,NT片段将形成大的可溶性装配物。在高于4. 2的pH下,S卩,在4. 2-6. 3 的范围内,如4. 2-6,这种装配将更有效地进行。这种特性可以用于亲和性纯化,例如,如果将NT固定于柱子上。该方法可以通过生理相关间隔内的pH转变使结合的蛋白质释放,因为将PH从大约6升高至7时,装配物将溶解。在根据本发明方法的优选实施方案中,分离蜘蛛丝蛋白的步骤涉及在含有固定的 NT结构部分的亲和性介质(如,亲和性柱)上纯化蜘蛛丝蛋白。优选在6.3或更低的pH 下,优选在4. 2-6. 3范围内,利用与具有固定的NT结构部分的亲和性介质的缔合,接着使用 6. 4或更高pH的和/或具有高离子强度的所需解离介质,从所述亲和性介质解离,而在亲和性介质上进行蜘蛛丝蛋白的纯化。具有高离子强度的解离介质通常具有高于300mM的离子强度,如高于300mM NaCl。这些基于亲和性的程序利用了根据本发明的NT结构部分的固有性质。特别令人感兴趣的是,蛛丝蛋白NT蛋白片段在低于6. 3的pH下、特别是在4. 2-6. 3的范围内缔合的强烈趋势。这可以有利地用作有力的亲和性纯化工具,使得可以从复杂的混合物中一步纯化出根据本发明的蜘蛛丝蛋白。尽管层析是优选的,但显然可以使用层析以外的其他基于亲和性的纯化方法,如具有官能化表面的磁珠或具有官能化表面的滤器。因此,根据本发明的生产蜘蛛丝蛋白的方法可以涉及在具有固定的NT结构部分的亲和性介质上的蜘蛛丝蛋白的纯化。优选地,在6. 3或更低的pH下,利用与具有固定的 NT结构部分亲和性介质的缔合,接着使用6. 4或更高pH的和/或具有高离子强度的所需解离介质,从所述亲和性介质解离,而在亲和性介质上进行融合蛋白的纯化。纯化典型地在柱子中、具有官能化表面的磁珠上或具有官能化表面的滤器上进行。本发明还提供了一种亲和性介质,其包含基质和用于与所述基质偶联(任选通过间隔臂偶联)的亲和性相互作用的配体。配体包含至少一个100至160个氨基酸残基的片段,其源自本发明描述中所述的蜘蛛丝蛋白的N-端片段。在优选的实施方案中,配体包含单个片段。在其他优选的实施方案中,配体包含至少两个,如片段。每个配体典型地含有 1-2、1-4、1-6、2-4和2-6个范围的多个片段。基质通常选自由微粒(例如,多糖微粒)和滤器组成的组。微粒的实例包括多糖珠(例如琼脂糖、S印harose和Superose)和磁珠。根据相关的方面,本发明提供了一个或多个分子的新用途。如上所示,每个分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分。在优选的实施方案中,分子包含单个结合结构部分(a)。在其他优选实施方案中,分子包含至少两个,如两个结合结构部分(a)。每个分子典型地含有选自1-2、1-4、1-6、2-4和2-6个范围的多个结合结构部分(a)。分子用于在溶液中通过结合结构部分可逆地装配分子的聚合物或寡聚物,所述溶液具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成。在优选的实施方案中,溶液的PH为3或更高,如4. 2或更高。所得到的pH范围,例如,4. 2-6. 3,促进了快速聚合。优选,将所得到的聚合物或寡聚物用于相互作用研究、分离、诱导酶复合物的活性或FRET分析中。在此公开的结果和结论提供了分子水平的蜘蛛丝装配中的新见解。不希望受到任何特定理论的束缚,NT的极性和不平衡的电荷分布理想地适于产生可以通过pH和盐浓度简单控制的可聚合模块。这又允许NT通过预防过早的聚集和随着pH降低引发聚合来调控丝装配,这与已知的沿着蜘蛛的吐丝管发生的情况相似。以下将通过下述非限制性实施例来进一步说明本发明。材料和方法蛋白表达和纯化构建表达载体,分别来产生NT (SEQ ID NO 6)、HT Δ His6、NT5Rep (SEQ ID NO :4)、 NT4Rep (SEQ ID NO :3)和 4R印CT (SEQ ID NO :2),作为与 His6TrxHiii6 的 C-端融合体,以及NT4R印CT(SEQ ID NO :5),作为与Hk6的N-端融合体。将不同的载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Bioscience),将所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1的0D600,用异丙基-β -D-硫代吡喃半乳糖苷(isopropyl-β -D-thiogalactopyranoside)诱导,并且在室温下进一步培养长达4小时。按照 Hedhammar M.等,Biochemistry (生物化学)47,;3407_3417“2008)中所述的,进行了裂解、固定化金属亲和性纯化和Hk6TrxHi S6-标记的蛋白水解去除。动态光散射(DLS)在来自 Malvern Instruments (Worcestershire, UK)的装备有 633nm HeNe 激光器 Wktasizer Nano S中,在25士0. 1°C下,测量了 pH和离子强度对NT和NT ΔHis6的流体动力学直径的作用(排除了由位置6的His引起的pH依赖性作用)。在使用前,将缓冲液通过尼龙滤器进行过滤。样品体积为50μ1,使用了 ZEN2112低玻璃小杯。对于所有分析, 小杯壁的衰减和测量位置(4.65mm)保持一致。对于每个样品,进行了六次扫描。所有样品重复分析三次。使用Malvern软件中用于DLS分析的通用目的(General Purpose)算法计算了流体动力学直径(dH),该算法通过Mokes-Einstein等式矫正了流体动力学直径的扩散系数
J1 J1dH
3πη 其中kB是Boltzmarm常数,T是温度,η是粘度,D是平移扩散系数。溶剂的粘度和折射率值获自Malvern软件。使用多窄峰模式(Multiple Narrow Modes)算法来验证通过通用目的(General Purpose)方法获得的结果。在0. 8mg/ml的浓度下分析了 NT和 NTAHis6 样品。浊度测定在装备有OLIS电子仪器和软件(0LIS Inc. Bogart,GA)的SLM 4800S分光荧光计中,在25°C,不同的pH值下,从蛋白质(0.8mg/ml)的340nm处的表观吸光度估算了浊度。 分析了 NT、NT4Rep和NT Δ His6,结果基本上相同。纤维形成和扫描电子显微镜检查(SEM)用于纤维形成的条件基本上与乂3计,见等,Biomacromolecules (生物大分子)8, 1695-1701,O007)所述的相同。将大约25 μ M的每种蛋白质在pH 7或6的20mM磷酸钠缓冲液(含有或不含300mM NaCl)中温育。在不同的时间点,将样品施加于SEM样品支架(stub)上,在那里将其晾干并真空包覆金和钯。用LEO 1550 FEG显微镜(Carl Zeiss, OberkochendiIH )使用5kV的加速电压,将样品拍照。
实施例实施例I-NT和微型蛛丝蛋白的表达和纯化构建表达载体(SEQ ID NO :14_16和其他的),分别来产生NT(SEQ ID NO :6)、 HTAHis6、NT5R印(SEQ ID NO :4)、NT4R印(SEQ ID NO 3)和 4R印CT (SEQ ID N0:2),作为与 Hk6TrxHk6的C-端融合体,以及NT4R印CT (SEQ ID NO :5),作为与Hk6的N-端融合体。将不同的载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Bioscience), 将所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1的0D600,用异丙基-β-D-硫代吡喃半乳糖苷诱导,并且在室温下进一步培养长达4小时。此后,收集细胞并重悬浮于补充了溶菌酶和DNA酶I(DNase I)的2OmM Tris-HCl (pH 8.0)中。完全裂解后,将 15000g 上清液上样于填充了 Ni-NTA Sepharose (GE Healthcare, Uppsala,瑞典)的柱子上。将柱子彻底洗涤,接着用300mM咪唑洗脱结合的蛋白质。合并含有目标蛋白的级分并相对20mM Tris-HCl (pH8. 0)进行透析。使用1 1000 (w/w)的凝血酶融合蛋白比例,在室温下持续l_2h,通过蛋白水解裂解,将MaSpl蛋白从标记中释放出来。为了除去释放的HisTrxHis标记,将分裂混合物上样于第二个Ni-NTA Sepharose柱上,并收集流出物。通过SDS-PAGE分离蛋白样品,然后用考马斯亮蓝R-250染色。使用5kDa分子量截留纤维素滤器(Millipore)通过超滤浓缩蛋白。实施例2-NT和微型蛛丝蛋白的DH依赖件聚合在pH7(图3,时间刻度以上)或pH6(图3,时间刻度以下)下进行了具有 (NT4RepCT或NT4R印)或不具有NT (4RepCT或4Rep)的微型蛛丝蛋白的聚合。由重复区域组成的微型蛛丝蛋白,具有或不具有C-端片段,显示出对环境变化没有敏感性,如对PH波动没有敏感性(4R印和4ItepCT ;图3)。为了测试N-端片段负责pH依赖性蛛丝蛋白聚合的假设,将包括来自Euprosthenops australis主壶腹蛛丝蛋白(MaSp)I 的N-端片段的几个构建体(NT、NT4Rep和NT4R印CT ;图3)用于获得纯化的重组蛋白(实施例1)。将动态散射光、浊度测定和扫描电子显微镜检查用于探测PH和盐浓度对单独的 NT以及微型蛛丝蛋白构建体的溶解性和聚合的影响。将NT和NT4R印进行不同pH值下的浊度测定。NT4R印(圆形)和NT (方形)的平均值(士SD,η = 3)显示于图4中。对于NT5R印,获得了相似结果。将NT在ρΗ6_7和0_300mM NaCl下进行动态光散射。三个实验的代表性实例显示于图5中。还参见表3。^t 3通过动杰光散射测定的蛋白装配物的大小
样品大小(nm) 装配物%
IOOmM 磷酸盐缓冲液,pH7.24.2±0.199.9%
IOOmM 磷酸盐缓冲液,pH6.24.2±0.199.9%
IOmM 磷酸盐缓冲液+150mMNaCl,pH7.2 4.1±0.199.9%
IOmM 磷酸盐缓冲液+150mMNaCl,pH6.1 710±14296.8%
IOmM 磷酸盐缓冲液,pH7.24.5±0.199.8%
IOmM 磷酸盐缓冲液,pH6.0687±50100%
IOmM 磷酸盐缓冲液+300mMNaCl,pH7.2 4.3±0.399.9%
IOmM 磷酸盐缓冲液+300mMNaCl,pH6.2 4.4±0.399.9% 单独的NT在pH7. 0下形成明显可溶(>210mg/ml)的二聚体,但在低于pH 6. 4下立即形成具有 700nm流体动力学粒径(hydrodynamic size)的聚合物(图4和5)。NT聚合容易通过提高PH逆转并且通过高水平的盐而阻断(图5和6)。在NTAHis6中维持了这些特性(浊度测定)并且延伸至包括NT片段(NT4ItepCT、NT4Rep、NTTNT4ItepCI^nNT5Itep) 的微型蛛丝蛋白,其由此在pH7下获得溶解性,但在pH6下快速聚合(图3)。
图3中的箭头表示,当首先检测肉眼可见的形成时,显示了在pH7下,NT的存在延迟了聚合,而在PH6下,其加速了聚合。这与C-端片段(实心圆)存在与否无关(通过带条纹的圆形来表示)。此外,NT的存在导致更有序的聚合,通过图3中的扫描电子显微镜图来举例说明,其是所有构建体在pH7(时间刻度以上)或NT4ItepCT在pH6(时间刻度以下) 的代表性早期聚合物。所观察到的PH和盐的作用表明蛛丝蛋白聚合取决于涉及NT的静电相互作用。種· 3-NT肺DH碰别乍删膽·来自Euprosthenops austral is的拖丝的主壶腹蛛丝蛋白1的N-端片段(NT)在 PH7下是高度可溶的(> 210mg/ml),但在低于6. 4的pH值下通过电荷相互作用聚合成 700nm聚合物(通过动态光散射和浊度测定来显示)。通过pH的提高可以容易地逆转聚合并通过高水平的盐来阻断。这些聚合特性延伸至包括NT片段(例如,NT-X和NT-Y)的融合蛋白,其由此在PH7获得溶解性,但在pH6下快速聚合(图7)。这种装配两种不同蛋白的可逆途径可以用于蛋白质、核酸、碳水化合物或脂质之间的相互作用的研究中,例如,使用荧光共振能量转移分析蛋白-蛋白相互作用,或用于活性诱导中,例如,酶活性,或用于蛋白质、核酸、碳水化合物或脂质的定位或固定,或用于蛋白质、核酸、碳水化合物或脂质的分析或分离中,例如使用阵列技术。实施例4-MetSP_C33Leu融合蛋白的牛产构建了表达载体,其包含编码作为与Hk6的融合体的NT-MetSP-C33Leu(SEQ ID NO :26-27)的基因。将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞 (Merck Biosciences),将所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至0. 9-1的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在25°C下进一步培养3小时。通过离心收集细胞,并重悬浮于20mM Tris-HCl, pH8中。加入溶菌酶,并将细胞在冰上温育30min。加入吐温至0. 7%的终浓度。通过在冰上超声处理5min (交替2秒开和2秒关)来破坏细胞。将细胞裂解物在20000 Xg下离心 30min。将上清液上样于Ni-NTA s印harose柱上,柱子用含有0. 7%吐温的20mM Tris-HCl, PH8的缓冲液平衡。用含有0. 7%吐温的20mM Tris-HCl,pH8的缓冲液洗涤柱子,并用含有 0. 7%吐温的20mM Tris-HCl,pH8,300mM咪唑缓冲液洗脱结合的蛋白。将洗脱液进行在还原条件下的12% Tris-甘氨酸凝胶上的SDS-PAGE。通过图8A 中的箭头来表示对应于融合蛋白的主条带。从1升生长至0D_ = 1的摇瓶培养物以mg纯化的蛋白来测定产量。产量是Mmg/1。推断出在细胞裂解物中存在去污剂的情况下,含有单个NT结构部分的融合蛋白导致令人惊讶的高产量。实施例5-MetSP_C33Leu融合蛋白的生产构建了表达载体,其包含编码作为与Hk6融合体的NT2-MetSP-C33Leu (即, NTNT-MetSP-C33Leu) (SEQ ID NO :28-29)的基因。将所述载体用于转化大肠杆菌 (Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),将所述细胞在含有卡那霉素的 Luria-Bertani培养基中在30°C下生长至0. 9-1的OD6tltl,用异丙基-β -D-硫代吡喃半乳糖苷(IPTG)诱导,并且在25°C下进一步培养3小时。通过离心收集细胞,并重悬浮于20mM Tris-HCl, pH8 中。加入溶菌酶,并将细胞在冰上温育30min。不加入吐温或加入吐温至0. 7 %的终浓度。通过在冰上超声处理5min(交替2秒开和2秒关)来破坏细胞。将细胞裂解物在 20000Xg下离心30min。将上清液上样于Ni-NTAs印harose柱上,柱子用士0.7%吐温的 20mM Tris-HCl, pH8的缓冲液平衡。用士0. 7%吐温的20mM Tris-HCl, pH8的缓冲液洗涤柱子,并用士0. 7%吐温的20mM Tris-HCl,pH8,300mM咪唑缓冲液洗脱结合的蛋白。将洗脱液进行在还原条件下的12% Tris-甘氨酸凝胶上的SDS-PAGE。通过图8B 中的箭头来表示对应于左侧两个泳道中融合蛋白的主条带。从1升生长至0D_ = 1的摇瓶培养物以mg纯化的蛋白来测定产量。在不存在吐温的情况下,产量是40mg/l,在存在0.7% 吐温的情况下,产量为68mg/l。推断出在细胞裂解物中不存在去污剂的情况下,含有两个连续NT结构部分的融合蛋白导致令人惊讶的高产量,并且在细胞裂解物中存在去污剂的情况下,产量甚至进一步提高。实施例6-NT-Sepharose 的制备将CysHis6NT构建体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞 (Merck Biosciences)。细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 0. 8-1的0D600,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mM Tris-HCl, pH8中。完全裂解后,将15000g上清液上样于填充Ni s印harose的柱(GE Healthcare) 上。将柱子彻底洗涤,并用100-300mM咪唑洗脱结合的蛋白质。合并含有目标蛋白的级分并相对20mM Tris-HCl,pH8.0进行透析。使用标准实验方案(GE Healthcare),将纯化的 Cys-HiS6-NT蛋白与激活的硫醇kpharose偶联。实施例7-使用NT Sepharose纯化融合蛋白将来自实施例4和5的细胞裂解物上样于填充NT Sepharose的柱子上,柱子用 20mM磷酸钠,pH6预先平衡。用20mM磷酸钠,pH6彻底洗涤柱子,然后用20mM磷酸钠,pH7 洗脱结合的蛋白质。合并含有目标蛋白的级分。在SDS-PAGE凝胶上分离蛋白样品,然后用考马斯亮蓝R-250染色。从280nm处的吸光值确定蛋白含量。实施例8-NT-REPfCT的产生构建表达载体来产生NT-REP4-CT,其作为与Hi%的N-端融合体(SEQ ID N0 17-18)。将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1 的0D·,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达4 小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mM Tris-HCl (pH8. 0)中。完全裂解后,将15000g上清液上样于填充kpharose的柱子(GE Healthcare, Uppsala,瑞典)上。将柱子彻底洗涤,然后用300mM咪唑洗脱结合的蛋白质。合并含有目标蛋白的级分并相对20mM Tris-HCl (pH8. 0)进行透析。通过SDS-PAGE分离蛋白样品,然后用考马斯亮蓝R-250染色。使用5kDa分子量截留纤维素滤器(Millipore)通过超滤来浓缩所得到的NT-REP4-CT蛋白。实施例9-NT-REPfCT的产生构建表达载体来产生NT-REP4-CT,其作为与Zbas i c的C-端融合体(SEQ ID NO 19) ο将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1
34的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达 2-4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的50mM磷酸钠(pH7. 5)中。完全裂解后,将15000g上清液上样于阳离子交换器上(HiTrap S,GE Healthcare, Uppsala,瑞典)。将柱子彻底洗涤,然后用相对500mM NaCl的梯度洗脱结合的蛋白质。合并含有目标蛋白的级分并相对50mM磷酸钠(pH7.5)进行透析。使用1 50 (w/w)的蛋白酶3C 融合蛋白比例,通过在4°C下蛋白水解分裂过夜,将NT-REP4-CT蛋白(SEQ ID NO: 20)从Zbasic标记中释放出来。为了除去释放的Zbasic标记,将分裂混合物上样于第二个阳离子交换器上,并收集流出液。实施例IO-NT-REP1-CT 的产牛构建表达载体来产生NT-REP4-CT,其作为与HisTrxHis的C-端融合体(SEQ ID NO 21) ο将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1 的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达 2-4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mM Tris-HCl (pH8. 0) 中。完全裂解后,将15000g上清液上样于填充了 Ni-kpharose的柱子(GE Healthcare,Uppsala,瑞典)上。将柱子彻底洗涤,然后用相对500mM NaCl的梯度洗脱结合的蛋白质。合并含有目标蛋白的级分并相对20mM Tris-HCl (pH8. 0)进行透析。使用 1 1000 (w/w)的凝血酶融合蛋白比例,通过在4°C下蛋白水解分裂过夜,将NT-REP4-CT 蛋白(SEQ ID NO 22)从HisTrxHis标记中释放出来。为了除去释放的HisTrxHis,将分裂混合物上样于第二个Ni-S^harose柱上,并收集流出液。实施例Il-NT2-REP1-CT 的产生构建表达载体,其包含编码作为与Hk6融合体的NT2-REP_CT( S卩,NTNT-REP-CT) (SEQ ID NO 23-24)的基因。将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3) 细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C 下生长至0. 9-1的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在25°C下进一步培养3小时。通过离心收集细胞,并重悬浮于20mM Tris-HCl, pH8. 0中。加入溶菌酶和DNA酶,并将细胞在冰上温育30min。将细胞裂解物在20000 X g下离心30min。将上清液上样于Ni-NTA s印harose柱子上,柱子用20mM iTris-HCLpHS的缓冲液平衡。用20mM Tris-HCl, pH8的缓冲液洗涤柱子,并用20mM Tris-HCl, pH8,300mM咪唑缓冲液洗脱结合的蛋白。将洗脱液进行在还原条件下的12% Tris-甘氨酸凝胶上的SDS-PAGE。通过图8C 中的箭头来表示左侧两个泳道中对应于融合蛋白的主条带。从1升生长至OD6tltl = 1的摇瓶培养物以mg纯化的蛋白来测定产量。产量是30mg/l。推断出可以作为与两个NT结构部分的融合体来有利地表达蛛丝蛋白微型蛋白。实施例U-NT-REP1-C^NL-REPi-CT 和 NT-REPg-CT 的产生构建表达载体,其分别包含编码NT-REP4-CT (SEQ ID NO 20和22)、 NT2-REP4-CT (SEQ ID NO 23)和 NT-REP8-CT (SEQ ID NO 25)的基因。将所述载体用于转化大肠杆菌Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至0. 9-1的OD6tltl,用异丙基-β -D-硫代吡喃半乳糖苷(IPTG)诱导,并且在25°C下进一步培养3小时。通过离心收集细胞,并重悬浮于 20mMTri s-HCl,pH8. 0 中。加入溶菌酶,并将细胞在冰上温育30min。不加吐温或加入吐温至0. 7%的终浓度。将细胞裂解物在20000Xg下离心30min。按照实施例6中所述准备NT亲和性介质。 根据实施例7所述,将上清液上样于NT亲和性柱子上。将来自NT亲和性柱子的洗脱液进行凝胶电泳。实施例13-NTHis、NI>REP。_CT 和 NI>Brichos 的产牛A) NTHis构建表达载体,以产生作为与Hk6的N-端融合体的NT(SEQ ID NO :30)。将所述载体用于转化大肠杆菌(Escherichia coli) BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C下生长至 1的OD6tltl,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mM Tris-HCl (pH8. 0)中。完全裂解后,将15000g上清液上样于填充了 Ni-kpharose的柱子(GE Healthcare, Uppsala,瑞典)上。将柱子彻底洗涤,然后用300mM咪唑洗脱结合的蛋白质。 合并含有目标蛋白的级分并相对20mM Tris-HCl (pH8. 0)进行透析。通过SDS-PAGE来分离蛋白样品,然后用考马斯亮蓝R-250来染色。使用5kDa分子量截留纤维素滤器(Millipore) 通过超滤来浓缩所得到的NT蛋白(SEQ ID NO 30)。产量为lUmg/升生长至OD6tltl = 1的摇瓶培养物。B) NT2-REPb-CT构建表达载体,以产生作为与Hi %的N-端融合体的NT2-REP8-CT (NTNT8REPCT) (SEQ ID N0:31)。将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C 下生长至 1的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mM Tris-HCl (pH8. 0)中。通过SDS-PAGE来分离蛋白样品,然后用考马斯亮蓝R-250来染色,以证实蛋白表达。完全裂解后,将15000g上清液上样于填充了 Ni-kpharose的柱子(GE Healthcare,Uppsala,瑞典)上。彻底洗涤柱子,然后用300mM咪唑洗脱结合的蛋白。合并含有目标蛋白的级分,并相对20mM Tris-HCl (pH8. 0)进行透析。通过SDS-PAGE来分离蛋白样品,然后用考马斯亮蓝R-250来染色。C) NT2-Brichos构建表达载体,以产生作为与Hk6的N-端融合体的NT2-Brichos (NT-NT-Brichos) (SEQ ID N0:32)。将所述载体用于转化大肠杆菌(Escherichia coli)BL21 (DE3)细胞(Merck Biosciences),所述细胞在含有卡那霉素的Luria-Bertani培养基中在30°C 下生长至 1的0D_,用异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,并且在室温下进一步培养长达4小时。此后,收集细胞,并重悬浮于补充了溶菌酶和DNA酶I的20mMTris-HCl (pH8. 0)中。通过在冰上超声处理5分钟O秒开和2秒关)来进一步破坏细胞。完全裂解后,将15000g上清液上样于填充了 Ni-kpharose的柱子 (GEHealthcare,Uppsala,瑞典)上。彻底洗涤柱子,然后用300mM咪唑洗脱结合的蛋白。合并含有目标蛋白的级分,并相对20mM Tris-HCl (pH8. 0)进行透析。通过SDS-PAGE来分离蛋白样品,然后用考马斯亮蓝R-250来染色。使用5kDa分子量截留纤维素滤器(Millipore) 通过超滤来浓缩所得到的NT2-Brichos蛋白(SEQ ID NO :3 。产量为20mg/升生长至0D600 =1的摇瓶培养物。实施例14-用于DH依赖件的、可逆捕获的NT目的使用共价固定的NT(和NTNT)来可逆地捕获NT融合蛋白。策略研究NT(和NTNT)融合蛋白利用共价连接的NT(和NTNT)pH依赖性地装配成纤维(和薄膜)。不含NT的纤维和薄膜用过对照。A)纤维将NT-REP4-CT (SEQ ID NO 20)、NT2-REP4-CT (SEQ ID NO 23)和 REP4-CT (SEQ ID NO :2,对照)的纤维( 0. 5cm长, 50μ g)浸入100 μ 1的ρΗ8的5mg/ml可溶性NTHis (SEQ ID NO :30)或NT2-Brichos (SEQ ID NO :32)的溶液中10分钟。通过加入400ul磷酸钠缓冲液(NaP),将pH降至pH6,并温育10分钟,以允许可溶性NT装配成纤维。将纤维转移至 500 μ 1的ρΗ6的NaP中,并洗涤两次。最后,将纤维转移至500 μ 1的ρΗ7的NaP,并温育10 分钟,使可溶性NT释放。在所有pH6NaP缓冲液中,在存在300mM NaCl下,进行了相同的实验。在SDS-PAGE上分析了来自不同溶液的样品。使用NT2-REP4-CT 和 NT-REP4-CT 纤维,在 pH6 捕获了 NTHis 和 NT2-Brichos 二者。 在PH升高至pH7时,NTHis和NT2-Brichos 二者都再次释放,并可以在SDS-PAGE上检测到。 加入300mM NaCl降低了在pH6的捕获。B)薄膜通过将50μ1 3mg/ml的蛋白质溶液浇注在塑料孔中并使其干燥过夜来制备 NT-REP4-CT (SEQ ID NO 20)和 REP4-CT (SEQ ID N0:2,对照)的薄膜。第二天,将 100 μ 1 ρΗ8的5mg/ml可溶性NTHis (SEQ ID NO :30)溶液加入带有薄膜的孔中,并停留10分钟。 然后通过加入400 μ 1 NaP使pH降至6,并温育10分钟,以允许可溶性NT装配成薄膜。然后用500 μ 1ρΗ6的NaP将薄膜洗涤两次。为了释放可溶性NTHis,加入500 μ 1 ρΗ7的NaP, 并温育10分钟。在所有pH6NaP缓冲液中,在存在300mMNaCl下,进行了相同的实验。在 SDS-PAGE上分析了来自不同溶液的样品。SDS-PAGE上的分析显示出NT-REP4-CT薄膜允许在pH6下捕获NTHis,并且在pH升高至7时,再次释放。实施例15-用于融合蛋白的PH-依赖性的、可逆装配的NT目的使用NT作为可逆标记,其允许分析蛋白质结构部分之间的相互作用,例如, 分析Brichos与具有β折叠结构的靶标(例如,表面活性蛋白C(SP-C))的相互作用。将NT2-Brichos (SEQ ID NO 32)与 NT2_MetSP_C33Leu (SEQ ID NO :28)或 NTHis (SEQ ID NO 30)混合至pH8的100 μ 1的总体积。加入NaP缓冲剂(400ul),以获得最终为6的pH,并将混合物温育20分钟,以允许NT装配。然后将pH再次升高至pH7,以允许NT装配逆转。在天然凝胶和大小排阻层析(SEC)上分析来自不同溶液的样品。
权利要求
1.一种生产分离的蜘蛛丝蛋白的聚合物的方法,其包括下述步骤(i)提供由170至760个氨基酸残基组成的蜘蛛丝蛋白,并且所述蜘蛛丝蛋白包含 由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选 70至120个氨基酸残基的C-端片段,所述片段源自蜘蛛丝蛋白的C-端片段; ( )提供所述蜘蛛丝蛋白在液体介质中的溶液,所述液体介质具有6. 4或更高的pH和 /或防止所述蜘蛛丝蛋白聚合的离子组成,任选涉及除去脂多糖和其他致热原;(iii)将所述液体介质的性质调节至6.3或更低的pH和允许所述蜘蛛丝蛋白聚合的离子组成;(iv)允许所述蜘蛛丝蛋白在所述液体介质中形成聚合物,所述液体介质具有6.3或更低的PH和允许所述蜘蛛丝蛋白聚合的离子组成;和(ν)从所述液体介质中分离出所述蜘蛛丝蛋白聚合物。
2.根据权利要求1的方法,其中步骤(iii)和(iv)的所述液体介质的pH为6.2或更低,如6.0或更低,和/或其中步骤(iii)和(iv)的所述液体介质的pH为3或更高,如4. 2或更高。
3.根据权利要求1-2中任一项的方法,其中步骤(iii)和(iv)的所述液体介质的离子强度在l_250mM的范围内。
4.根据权利要求1-3中任一项的方法,其中步骤(ii)的所述液体介质的pH为6.7或更高,如7.0或更高。
5.根据权利要求1-3中任一项的方法,其中步骤(ii)的所述液体介质的pH在6.4-6.8 的范围内。
6.根据权利要求1-5中任一项的方法,其中所述聚合物是纤维、薄膜、泡沫、网或网状物。
7.根据权利要求6的方法,其中所述聚合物是具有大于0.1 μ m的直径和大于5mm的长度的纤维。
8.—种生产分离的蜘蛛丝蛋白的二聚体的方法,其包括下述步骤(i)提供170至760个氨基酸残基的蜘蛛丝蛋白,所述蛋白包含由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选 70至120个氨基酸残基的C-端片段,所述片段源自蜘蛛丝蛋白的C-端片段;(ii)提供蜘蛛丝蛋白的二聚体在液体介质中的溶液,所述液体介质具有6.4或更高的 PH和/或防止所述蜘蛛丝蛋白聚合的离子组成;和(iii)分离步骤(ii)中获得的二聚体,任选涉及除去脂多糖和其他致热原。
9.根据权利要求8的方法,其中步骤(ii)的所述液体介质的pH为6.7或更高,如7.0 或更高。
10.根据权利要求1-9中任一项的方法,其中提供所述蜘蛛丝蛋白的步骤(i)包括下述子步骤(a)在合适的宿主中表达编码所述蜘蛛丝蛋白的多核酸分子;和(b)分离子步骤(a)中获得的蛋白,任选涉及除去脂多糖和其他致热原。
11.根据权利要求1-10中任一项的方法,其中步骤(i)中提供的蜘蛛丝蛋白由170至 600个氨基酸残基组成,并包含单个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的N-端片段。
12.根据权利要求1-10中任一项的方法,其中步骤(i)中提供的所述蜘蛛丝蛋白的 N-端片段包含至少两个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的片段。
13.根据权利要求1-12中任一项的方法,其中所述蛋白选自由式NT2-REP-CT、 NT-REP-CT、NT2-REP和NT-REP限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L(AG)nL、L(AG)nAL、 L (GA) nL、L (GA)nGL 的组,其中 η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0 至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的C-端片段。
14.一种蜘蛛丝蛋白的聚合物,所述蛋白由170至760个氨基酸残基组成并包含 由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选 70至120个氨基酸残基的C-端片段,所述片段源自蜘蛛丝蛋白的C-端片段。
15.根据权利要求14的蜘蛛丝蛋白的聚合物,其中所述蜘蛛丝蛋白由170至600个氨基酸残基组成并包含单个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的N-端片段。
16.根据权利要求14的蜘蛛丝蛋白的聚合物,其中所述蜘蛛丝蛋白的N-端片段包含至少两个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的片段。
17.根据权利要求14-16中任一项的蜘蛛丝蛋白的聚合物,其中所述蛋白选自由式 NT2-REP-CT、NT-REP-CT、NT2-REP 和 NT-REP 限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L(AG)nL、L(AG)nAL、 L (GA) nL、L (GA)nGL 的组,其中 η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的C-端片段。
18.根据权利要求14-17中任一项的蜘蛛丝蛋白的聚合物,其中所述聚合物由所述蛋白的聚合二聚体组成。
19.根据权利要求14-18中任一项的蜘蛛丝蛋白的聚合物,其中脂多糖和其他致热原的含量为lEU/mg分离的蛋白或更低。
20.根据权利要求14-19中任一项的蜘蛛丝蛋白的聚合物,其中所述聚合物是纤维、薄膜、泡沫、网或网状物。
21.根据权利要求20的蜘蛛丝蛋白的聚合物,其中所述聚合物是具有大于0.1 μ m的直径和大于5mm的长度的纤维。
22.—种蜘蛛丝蛋白的二聚体,所述蛋白由170至760个氨基酸残基组成,并且包含 由至少一个100至160个氨基酸残基的片段组成的N-端片段,所述片段源自蜘蛛丝蛋白的N-端片段;和70至300个氨基酸残基的重复片段,所述片段源自蜘蛛丝蛋白的重复片段;和任选 70至120个氨基酸残基的C-端片段,所述片段源自蜘蛛丝蛋白的C-端片段。
23.根据权利要求22的蜘蛛丝蛋白的二聚体,其中所述蜘蛛丝蛋白由170至600个氨基酸残基组成并且包含单个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的N-端片段。
24.根据权利要求22的蜘蛛丝蛋白的二聚体,其中所述蜘蛛丝蛋白的N-端片段包含至少两个源自蜘蛛丝蛋白N-端片段的100至160个氨基酸残基的片段。
25.根据权利要求22-24中任一项的蜘蛛丝蛋白的二聚体,其中所述蛋白选自由式 NT2-REP-CT、NT-REP-CT、NT2-REP 和 NT-REP 限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L(AG)nL、L(AG)nAL、 L (GA) nL、L (GA)nGL 的组,其中 η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0 至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的C-端片段。
26.一种分离的蜘蛛丝蛋白,其由170至760个氨基酸残基组成并选自由式NT2-REP-CT、NT-REP-CT、NT2-REP 和 NT-REP 限定的蛋白组,其中NT是具有100至160个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的N-端片段,REP是具有70至300个氨基酸残基的蛋白片段,其中所述片段选自L(AG)nL、L(AG)nAL、 L (GA) nL、L (GA)nGL 的组,其中 η是2至10的整数;每个单独的A区段是8至18个氨基酸残基的氨基酸序列,其中所述氨基酸残基中的0 至3个不是Ala,并且其余的氨基酸残基是Ala ;每个单独的G区段是12至30个氨基酸残基的氨基酸序列,其中至少40%的氨基酸残基是Gly ;和每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列;和CT是具有70至120个氨基酸残基的蛋白片段,所述片段是源自蜘蛛丝蛋白的C-端片段。
27.根据权利要求沈的分离的蜘蛛丝蛋白,其选自由SEQID NO :3-5、17、19-23、25和 31组成的组。
28.一种组合物,其包含溶解于液体介质中的根据权利要求26-27中任一项的分离的蜘蛛丝蛋白,所述液体介质具有6. 4或更高的pH和/或防止所述蜘蛛丝蛋白聚合的离子组成。
29.根据权利要求观的组合物,所述液体介质具有7.0或更高的pH。
30.根据权利要求观-29中任一项的组合物,其中脂多糖和其他致热原的含量为IEU/ mg分离的蛋白或更低。
31.根据权利要求沈-27中任一项的蜘蛛丝蛋白用于生产蜘蛛丝蛋白的二聚体的用途。
32.根据权利要求沈-27中任一项的蜘蛛丝蛋白用于生产蜘蛛丝蛋白的聚合物的用途。
33.根据权利要求22-25中任一项的蜘蛛丝蛋白的二聚体用于生产分离的蜘蛛丝蛋白的聚合物的用途。
34.根据权利要求32-33中任一项的用途,其中在液体介质中生产所述聚合物,所述液体介质具有6. 3或更低的pH和允许所述蜘蛛丝蛋白聚合的离子组成。
35.一种分离的多核酸分子,其包含选自由SEQ ID而14-16、18和对组成的组的核酸序列;编码SEQ ID NO :3-5、17、19-23、25和31的核酸序列;编码根据权利要求23的蜘蛛丝蛋白的核酸序列;及其互补核酸序列。
36.一种生产根据权利要求沈-27中任一项的蜘蛛丝蛋白的方法,其包括下述步骤 (i)在合适的宿主中表达编码所述蜘蛛丝蛋白的多核酸分子;和( )分离步骤(i)中所获得的蛋白质,任选涉及除去脂多糖和其他致热原。
37.一种可逆地装配一种类型的分子或几种不同类型的分子的聚合物或寡聚物的方法,其包括下述步骤(i)提供所述分子,每种分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分; ( )提供所述分子在液体介质中的溶液,所述液体介质具有6. 4或更高的pH和/或防止所述分子通过所述结合结构部分聚合或寡聚的离子组成;(iii)将所述液体介质的性质调节至6.3或更低的pH和允许所述分子通过所述结合结构部分聚合或寡聚的离子组成;(iv)允许所述分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物,所述液体介质具有6. 3或更低的pH和允许所述分子通过所述结合结构部分聚合或寡聚的离子组成。
38.根据权利要求37的方法,其中步骤(i)的所述分子是相同的,并且其中步骤(iv) 的所述聚合物或寡聚物是同聚物或同寡聚物。
39.根据权利要求37的方法,其中步骤(i)的所述分子是不同的,并且其中步骤(iv) 的所述聚合物或寡聚物是杂聚物或杂寡聚物。
40.根据权利要求37-39中任一项的方法,其中步骤(iv)的所述聚合物或寡聚物溶解于所述液体介质中,所述液体介质具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成。
41.根据权利要求37-40中任一项的方法,其中步骤(iii)和(iv)的所述液体介质的 pH是6. 2或更低,如6.0或更低,和/或其中步骤(iii)和(iv)的所述液体介质的pH为3 或更高,如4. 2或更高。
42.根据权利要求37-41中任一项的方法,其中步骤(iv)的所述液体介质的离子强度在l-250mM的范围内。
43.根据权利要求37-42中任一项的方法,其中步骤(ii)的所述液体介质的pH为6.7 或更高,如7.0或更高。
44.根据权利要求37-42中任一项的方法,其中步骤(ii)的所述液体介质的pH在 6. 4-6. 8的范围内。
45.根据权利要求37-44中任一项的方法,其中所述第二结构部分是蛋白质。
46.根据权利要求37-45中任一项的方法,其进一步包括下述步骤(ν)将所述液体介质的性质调节至6. 4或更高的pH和/或防止所述分子的聚合或寡聚的离子组成,以分解所述聚合物或寡聚物。
47.根据权利要求46的方法,其中步骤(ν)的所述液体介质的pH为6.7或更高,如7.0 或更高。
48.根据权利要求46的方法,其中步骤(ν)的所述液体介质的pH在6.4-6. 8的范围内。
49.根据权利要求46-48中任一项的方法,其中将步骤(iv)的所述聚合物或寡聚物用于相互作用研究、分离、诱导酶复合物的活性或FRET分析中。
50.根据权利要求37-49中任一项的方法,其中将步骤(i)的至少一种分子类型固定于固体支持物或亲和性介质的基质上。
51.一种检测一组分子中包括的分子子集之间的结合相互作用的方法,其包括下述步骤(i)提供所述的一组分子,每个分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的 N-端片段,和(b)独立地选自蛋白质、核酸、碳水化合物和脂质的第二结构部分;( )提供所述组的分子在液体介质中的溶液,所述液体介质具有6. 4或更高的pH和/ 或防止所述分子聚合或寡聚的离子组成;(iii)将所述液体介质的性质调节至6.3或更低的pH和允许所述分子聚合或寡聚的离子组成;(iv)允许所述分子在液体介质中通过所述结合结构部分装配成聚合物或寡聚物,所述液体介质具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成;(ν)将所述液体介质的性质调节至6. 4或更高的pH和/或防止所述分子聚合或寡聚的离子组成,以分解所述聚合物或寡聚物;和(vi)确定形成所述分子子集的两种或多种不同分子之间不是通过所述结合结构部分介导的结合相互作用的存在。
52.一种或多种分子用于在溶液中通过所述结合结构部分可逆地装配所述分子的聚合物或寡聚物的用途,所述溶液具有6. 3或更低的pH和允许所述分子聚合或寡聚的离子组成,每个分子包含(a)至少一个100至160个氨基酸残基的第一结合结构部分,其源自蜘蛛丝蛋白的 N-端片段,和(b)第二结构部分,其独立地选自蛋白质、核酸、碳水化合物和脂质。
53.根据权利要求52的用途,其中将所述聚合物或寡聚物用于相互作用研究、分离、诱导酶复合物的活性或FRET分析中。
54.一种亲和性介质,其包含基质和用于与所述基质偶联的亲和性相互作用的配体,所述配体包含至少一个100至160个氨基酸残基的片段,其源自蜘蛛丝蛋白的N-端片段。
55.根据权利要求M的亲和性介质,其中所述基质选自由微粒和滤器组成的组。
全文摘要
一种生产分离的蜘蛛丝蛋白的聚合物的方法,包括提供所述蜘蛛丝蛋白在液体介质中的溶液,所述液体介质具有6.4或更高的pH和/或防止所述蜘蛛丝蛋白聚合的离子组成。将液体介质的性质调节至6.3或更低的pH和允许蜘蛛丝蛋白聚合的离子组成。使蜘蛛丝蛋白在所述液体介质中形成聚合物,并从所述液体介质中分离出所得到的蜘蛛丝蛋白聚合物。所得到的聚合物可以用作纤维、薄膜、泡沫、网或网状物。
文档编号D01F4/00GK102395601SQ201080016943
公开日2012年3月28日 申请日期2010年4月21日 优先权日2009年4月22日
发明者安娜·里辛, 扬·约翰松, 谢斯廷·努德林, 麦·赫德哈马尔 申请人:思百博技术股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1