电荷逆转的N端蜘蛛丝蛋白结构域及其用途的制作方法

文档序号:15234481发布日期:2018-08-21 20:15阅读:300来源:国知局
本发明涉及蛋白和多肽领域,且更具体地涉及蜘蛛丝蛋白(蛛丝蛋白(spidroin))和其他非蛛丝蛋白的蛋白和多肽的表达和制备。本发明提供了新颖蛋白,其本身和作为新颖融合蛋白中的部分可用于表达和制备期望的蛋白和多肽,以及提供了编码这些新颖蛋白和融合蛋白的核酸分子。本发明还提供了表达和制备期望的蛋白或多肽的方法。发明背景由dna制备蛋白和多肽可在多种宿主中实现,但常见的问题是不溶性蛋白/多肽聚集物的形成。这可严重地妨碍或甚至阻止功能性蛋白/多肽的制备。对于低溶解度蛋白和多肽例如膜相关蛋白和多肽,该问题通常加重。膜相关蛋白占细胞蛋白质组的20-30%,并是许多当前可得的制药药物的靶。为了插入到膜中,蛋白需要至少一段根据生物学疏水性级别促进膜插入的15-20个氨基酸残基。同时,氨基酸侧链的疏水性是聚集潜力的重要决定因素,并且疏水性氨基酸残基(val、ile、phe和cys)促进β-片层形成并且在许多疾病相关蛋白的淀粉样蛋白形成核心区域中被过度呈现。因此,膜相关蛋白易于聚集,这可严重阻碍或甚至阻止功能性重组蛋白的制备。例如,肺表面活性蛋白c(sp-c)是一种跨膜(tm)蛋白,由于其极其疏水的性质,该蛋白难以重组制备。sp-c由肺泡ii型细胞产生并且是防止肺泡在呼气末期萎陷所需要的表面活性物质的成分。新生儿经常因表面活性物质的量不足而罹患呼吸窘迫。如今,用从动物的肺提取的表面活性物质制品例如和治疗该状况。外源性表面活性物质治疗对呼吸窘迫成人患者也有潜在益处,但表面活性物质的供应过于有限,且价格非常高。基于在异源系统中制备的肽的表面活性物质制品由于较低的生产成本和较高的生产量将优于目前使用的天然提取物(和含有化学合成肽的制剂)。从监管的角度来看,这也将是有利的。sp-c33leu是sp-c的变体,其中n端部分被截短了两个残基,两个cys残基被ser取代,一个leu残基被lys取代,且一个met残基被leu取代,并且跨越膜的残基(通常主要是val)被交换为leu以增强跨膜螺旋的稳定性。kl4是另一种设计为模拟肺表面活性蛋白b(sp-b)性质的表面活性物质类似物,并由lys-leu-leu-leu-leu的迭代重复段组成。sp-c33leu和kl4再现了天然表面活性肽的功能,包括跨膜插入,但是不太易于聚集且因此大量生产用于开发合成的表面活性物质制品可以是可行的。这两种肽都可以通过化学合成来制备,但成本相当高,并且该方法产生了可能难以去除和表征的副产物(bi-product)。肺表面活性蛋白a(sp-a)和d(sp-d)不插入膜中,而是通过其碳水化合物结合结构域在肺免疫应答中发挥作用。它们是参与肺第一线防御的大的水溶性蛋白复合物,并调节固有免疫细胞(例如巨噬细胞)以及适应性免疫细胞的功能。这些蛋白属于包括n端胶原蛋白样区域和c端钙依赖性碳水化合物识别结构域的c-型凝集素的胶原凝集素家族。呈其功能形式,这些蛋白通过它们的n端区域排布为三聚多肽链,并进一步组装成不同形状的较大寡聚体。sp-a由排布为“花束”的六个三聚亚基组成,而sp-d排布为四个三聚亚基的十字形。尽管这些蛋白是亲水性的,但它们难以重组制备,并且迄今为止已被表达为不溶性包涵体并通过变性和重折叠纯化。目前,临床使用的表面活性物质制品不含有sp-a或sp-d,并且对研究目前的表面活性物质疗法是否可以通过添加为天然的表面活性物质部分的这些组分来改善存在兴趣。人sp-a和sp-d可从肺泡蛋白沉积症患者或从羊水分离,但产量低且寡聚体状态不均匀。蛋白的重组制备将允许用于治疗用途的规模扩大和可重复的制造,但迄今为止,这些尝试都不能令人信服。当由重组dna表达时遇到困难的蛋白和多肽的其他实例是αβ-肽、iapp、prp、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂(cystatin)、atf和肌动蛋白;sp-b、α-防御素和β-防御素;a-h类载脂蛋白;ll-37、hcap18、sp-c、sp-c33、brichos、gfp、egfp、呆蛋白(nicastrin)、神经丝抑蛋白(neuroserpin);激素,包括epo和gh,及生长因子,包括igf-i和igf-ii;亲和素和链霉亲和素;蛋白酶3c;及免疫球蛋白和其片段。针对该问题的一个解决方案是将期望的蛋白或多肽与溶解度增强肽/结构域(即提供所需要的溶解度的蛋白或多肽)一起作为融合蛋白表达。该融合蛋白可被裂解,从而分离期望的蛋白。可选地,期望的蛋白/多肽可以维持整合在可溶性融合蛋白中,其中它仍然是功能性的并且可以进行进一步表征,例如,活性和相互作用研究、结构确定和结晶。硫氧还蛋白(trx)是应用最广泛的溶解度增强融合伴侣之一,其在大肠杆菌(e.coli)细胞质中积累至高水平,并已被证明显著增加许多异源蛋白和小肽的溶解度。另一种成功的融合伴侣是来自链球菌蛋白g(pgb1)的免疫球蛋白结合结构域b1。该结构域的高稳定性和小尺寸(56个残基)赋予它用于表达小的结构域和肽以及用于下游结构表征的卓越品质。wo2011/115538公开了一种融合蛋白,包含衍生自蜘蛛丝蛋白的n端(nt)片段的溶解度增强部分和为期望的蛋白或多肽的部分。优选ph高于6.4以防止溶解度增强部分的组装。ep2644619a1也公开了一种融合蛋白,包含衍生自蜘蛛丝蛋白的n端(nt)片段的溶解度增强部分和为期望的蛋白或多肽的部分。溶解度增强部分在ph低于6.4也为构成单体,但与野生型nt片段相比,没有增加所得融合蛋白的表达水平。尽管在本领域取得了这些进展,但融合蛋白方法在产物的表达、稳定性和溶解度方面具有限制。融合伴侣在大规模异源蛋白制备中的使用并不常见,这主要是由于需要另外的昂贵的色谱法步骤去除融合伴侣和/或难以去除融合伴侣。发明概述本发明的一个目的是提供一种融合伴侣,即融合蛋白中的部分,其可用于增强融合蛋白中的另一部分的溶解度,所述融合蛋白中的另一部分是期望的蛋白或多肽。本发明的另一个目的是提供用于疏水性蛋白和多肽以及具有疏水性区域的蛋白和多肽的改进的重组制备方法的新颖的蛋白和方法。本发明的另一个目的是提供在宽ph范围为稳定单体的融合伴侣。本发明的另一个目的是提供一种制备和分离期望的蛋白或多肽的简化方法,包括以融合蛋白的形式表达。为了这些目的和根据以下说明书将明显的其他目的,根据第一方面,本发明提供了根据所附权利要求的蛋白。本发明大体上基于这样的发现,即这种电荷逆转的nt突变体不能够二聚化、是稳定的、是超可溶性的(hypersoluble)并且使得能够有效制备跨膜和易于聚集的蛋白。根据本发明的融合蛋白可以有利地形成胶束。根据第二方面,本发明提供了这种蛋白作为融合蛋白中的部分用于增强融合蛋白中的另一部分的溶解度的用途,所述融合蛋白中的另一部分是期望的蛋白或多肽。根据第三方面,本发明提供了制备根据所附权利要求的期望的蛋白或多肽的方法。所附序列的列表seqidnoseqidnoseqidnoseqidnoseqidno附图简述图1是蛛丝蛋白n端结构域的序列比对。图2显示ntd40k/k65d和野生型nt在339nm和351nm处的荧光发射的比率与ph的关系曲线。图3是使用2dhsqcnmr的ntwt和ntd40k/k65d的比较。图4显示ntwt和ntd40k/k65d的尿素诱导的变性,其作为稳定性的量度。图5显示用cd光谱法测量的ntwt和ntd40k/k65d的热稳定性。图6显示用cd光谱法测量的ntwt和ntd40k/k65d的重折叠能力。图7-图8是融合蛋白和得到的纯化的蛋白和肽的sds-page评价。图9显示通过本发明方法制备的sp-c33leu的esi-ms谱图。图10示出rsp-c33leu对潮气量的影响。图11示出rsp-c33leu对肺气体容量的影响。图12是β17融合蛋白和得到的纯化的多肽的sds-page评价。图13显示可溶性ntd40k/k65d-β17融合蛋白的凝胶过滤。图14是示出将融合蛋白用凝血酶进行蛋白水解后β17的原纤化的tht荧光图。图15是bri2brichos融合蛋白表达和溶解度的sds-page评价。图16是bri2brichos纯化的sds-page分析。图17显示确定bri2113-231融合蛋白的寡聚体状态的凝胶过滤。图18显示以与ntwt或ntd40k/k65d融合形式的表达的hcap18的sds-page分析。图19显示ntd40k/k65d-sp-c33leu融合蛋白的sec色谱图。图20显示负染色的含有ntd40k/k65d的蛋白的tem显微照片。发明详述本发明涉及蛋白和多肽的制备和表达。取决于该制备的目的,终产物可变化。例如可能期望获得插入脂质膜中、在溶液中或与其他生物分子缔合的期望的蛋白或多肽。还应认识到,还可能高度期望获得作为融合蛋白的部分的期望的蛋白或多肽,该融合蛋白可提供用于纯化和检测的合适工具(ahandle)和/或提供期望的性质例如稳定性和溶解度。维持期望的蛋白或多肽功能性地整合到可溶性融合蛋白中对于表征和研究期望的蛋白或多肽是有用的。本发明大体上基于由于蜘蛛丝蛋白的n端(nt)片段的特定变体的作为可溶性单体存在而不论周围水性介质的ph如何的出乎意料的能力而对其有用性的洞察;以及由于其极高的溶解度,它作为融合伴侣的优异性能。蜘蛛丝主要由蜘蛛腹部腺体中产生的大的和易于聚集的蛋白(蛛丝蛋白)组成。它们由重复的富含丙氨酸和甘氨酸的区段的大量且主要为疏水性的段、侧翼为在n端(nt)末端和c端(ct)末端的球状且亲水性的结构域构成。在纺丝期间,蛛丝蛋白通过狭窄的管,并在涉及精确控制环境条件(包括水合水平、剪切力、离子组成、ph和二氧化碳压力)的过程中从可溶性蛋白转化为固体纤维。尽管它们的易于聚集的性质,蛛丝蛋白在蜘蛛丝腺中以非常高的浓度(30-50%w/w)储存。nt结构域是蛛丝蛋白的最保守的部分,并折叠成具有偶极电荷分布的可溶性的~130个残基的5-螺旋束。此外,nt在纤维形成中具有重要作用,因为它在ph低于6.5时形成反向平行二聚体,这被认为是在纺丝管中将蛛丝蛋白胶束互相连接的关键步骤。在已知的蜘蛛masp1和masp2丝蛋白种类中(参见例如图1),nt部分(seqidno:9)的d40和k65是保守的并且通过带负电荷的d40与带正电荷的k65的侧链之间的盐桥介导亚基间静电相互作用,这稳定了二聚体构型。类似地,在已知的小壶状蜘蛛丝(misp)种类中存在相应的带相反电荷的氨基酸残基。本申请已经认识到并在实施例中证实,这些残基的电荷逆转突变在位置40处提供带正电荷(碱性)氨基酸残基并且在位置65处提供带负电荷(酸性)氨基酸残基,出乎意料地消除了这些位置之间的亚基间盐桥,这继而对nt片段的ph依赖性二聚化能力具有关键影响。由于这些电荷逆转突变,nt突变体出乎意料地变成在广泛的ph区间的稳定的单体并且获得作为融合伴侣的优异性质,包括得到的与期望的蛋白或多肽一起的融合蛋白的高表达、高稳定性和ph不敏感性。nt突变体在水中是高度可溶性的。考虑到另一种已知的nt变体nta72r获得比相应的融合蛋白的ntwt更低的表达水平,使用根据本发明的电荷逆转的nt突变体得到的融合蛋白的高表达水平是特别出乎意料的。不希望束缚于任何特定的科学理论,认为根据本发明的电荷逆转突变体nt的改进的稳定性和重折叠能力可以通过较少的偶极电荷分布来解释,其减少不稳定电荷簇。在大肠杆菌中表达后,可溶性融合蛋白的产量与常规标签如硫氧还蛋白和pgb1相比通常为至少2倍更高,并且例如通过盐沉淀和/或在有机溶剂中沉淀,融合蛋白可被纯化至均一性的。裂解下来的期望的蛋白或肽是有活性的,例如,在动物疾病模型中是有活性的。电荷逆转的nt突变体不能够二聚化、是稳定的、是超可溶性的,产生更高量的融合蛋白,并且使得能够制备以前难以重组制备的易于聚集的蛋白。不希望受限于任何具体理论,本文公开的实验结果支持,使用根据本发明的电荷逆转的nt突变体作为融合标签可以增强期望的肽或蛋白的重组制备,所述电荷逆转的nt突变体调节溶解度并保护期望的蛋白的疏水性区域免受胶束样颗粒内的水性环境。突变体ntd40k/k65d由于减少的偶极电荷分布而不能够在低ph二聚化,并因此能够在更宽的ph范围中调节溶解度。有趣的是,ntd40k/k65d-sp-c33leu的尺寸排阻色谱法(图19)显示,纯化的两亲融合蛋白排布为510kda组装体,且通过tem观察到尺寸约10-15nm的胶束样颗粒(图20)。因此认为,形成的包含含有根据本发明的电荷逆转的nt突变体的融合蛋白或由其组成的胶束或胶束样颗粒是期望的蛋白和多肽、特别是疏水性蛋白和多肽以及具有疏水性区域的蛋白和多肽(例如膜蛋白和多肽以及膜相关蛋白和多肽)的重组制备中的有用的中间结构。胶束典型地具有在5-100nm,例如5-30nm,且优选地5-20nm或10-15nm的范围内的尺寸。膜相关蛋白和许多其他商业上相关的蛋白由于其疏水性和易于聚集的性质而难以以其天然形式制备和纯化。可持续和通用的制备方案的缺乏使得这些蛋白难以制造和评价,例如,作为药物。根据本发明的不具有二聚化能力的电荷逆转的nt突变体表现出改进的稳定性和重折叠能力,并且被用作用于制备表面活性肽类似物sp-c33leu、kl4、表面活性蛋白sp-a和sp-d及其截短变体、淀粉样蛋白形成多肽β17、aβ和iapp、hcap18、呆蛋白、egfp和bri2-brichos蛋白结构域的高度可溶性的融合伴侣。与pgb1融合蛋白相比,获得的融合蛋白的量为多达8倍更高,并且在去除nt结构域后,所有肽/蛋白可以被制备为可溶性和功能性蛋白。融合伴侣在大规模异源蛋白制备中的使用并不常见,这主要是由于需要另外的昂贵的色谱法步骤去除融合伴侣和/或难以去除融合伴侣。然而,nt和电荷逆转的nt允许使用简单的nacl沉淀和乙醇提取步骤有效地纯化疏水性靶肽,从而避免了对色谱法的需要。本文描述的程序代表一种制备蛋白的廉价、有效且从监管角度看有益的方式,所述蛋白例如,用于合成的肺表面活性物质中临床使用的非动物来源的sp-c33leu。本文显示,重组sp-c33leu与合成肽相同,且重组sp-c33leu和合成磷脂的混合物在呼吸窘迫动物模型中的功能方面与猪来源的表面活性物质类似。表面活性蛋白sp-a和sp-d不插入膜中,而是通过其碳水化合物结合结构域在肺免疫应答中发挥作用。尽管这些蛋白是亲水性的,但它们难以重组制备。使用电荷逆转的nt作为融合伴侣使得sp-a和sp-d的可溶性衍生物的高表达和随后的纯化能够实现。这表明,电荷逆转的nt作为通用的溶解度增强融合伴侣起作用,以用于生物技术应用,使得tm肽以及目前由于其疏水性或聚集倾向而难以制备的蛋白能够异源制备。因此,根据第一方面,本发明提供了一种蛋白,所述蛋白包含100-160个氨基酸残基的部分,所述部分与seqidno:1或seqidno:96具有至少70%同一性,其中对应于seqidno:1中的位置40的氨基酸残基是选自由lys、arg和his组成的组的碱性氨基酸残基;并且其中对应于seqidno:1中的位置65的氨基酸残基是选自由asp和glu组成的组的酸性氨基酸残基。野生型nt是高度水溶性的,且可用作例如融合蛋白中的溶解度增强部分,用于表达期望的蛋白或多肽,但它在5.5-7.2的ph区间也形成二聚体,这增加了融合蛋白的不期望的聚集的风险。该ph区间对于某些期望的蛋白和多肽的功能和稳定性是有用的ph区间。该ph区间对于某些纯化方案(例如,当使用离子交换,诸如阳离子或阴离子交换,或固定金属离子亲和色谱法(imac)作为纯化原理时)也是有用的ph区间。该ph区间对于某些表达宿主例如酵母也是有用的ph区间。现在已经认识到,根据本发明的电荷逆转的双突变体nt降低了蛋白形成二聚体的能力,而不会不利地影响其溶解度或(当其与期望的蛋白或多肽在融合蛋白中连接时)其增强期望的蛋白或多肽的溶解度的能力。因此,根据本发明的突变体nt蛋白本身可用于研究生理学上相关的nt单体本身。根据本发明的突变体nt蛋白也可用作融合蛋白中的溶解度增强部分,因为它降低了融合蛋白的不期望的聚集的风险,并从而开启了新的ph窗口(5.5-7.2),其中来自蜘蛛丝蛋白的电荷逆转的双突变体nt可用于生物化学应用,此时蛋白/多肽单体在水性溶液中的溶解度是期望的(例如在制备或表征期望的蛋白或多肽中)。出乎意料的是,从实验数据确定,尽管位置40和65中的这些变化不会改变所得蛋白的净电荷,但其为与其融合的任何期望的蛋白/多肽部分提供稳定性和溶解度的能力被改进。在优选的实施方案中,根据本发明的融合蛋白作为胶束或胶束样颗粒存在。胶束典型地具有在5-100nm,诸如5-30nm、5-20nm或10-15nm的范围内的尺寸。该中间胶束结构被认为支持融合蛋白、且特别是包含疏水性蛋白和多肽以及具有疏水性区域的蛋白和多肽的融合蛋白的高稳定性和溶解度、以及最终的高产量,从而在水性溶剂中的表达和纯化期间保护水不溶性肽。胶束典型地具有在5-100nm,例如5-30nm,且优选地5-20nm或10-15nm的范围内的尺寸。在优选的实施方案中,对应于seqidno:1中的位置40的氨基酸残基是lys或arg,且优选地是lys。在一个优选的实施方案中,对应于seqidno:1中的位置65的氨基酸残基是asp。关于这两个位置的六种可能的和优选的变体呈现为seqidno:2-7。一种特别优选的变体是seqidno:2,其中对应于seqidno:1中的位置40的氨基酸残基是lys;且其中对应于seqidno:1中的位置65的氨基酸残基是asp。为避免疑问,由于n端末端较短,seqidno:2-7中对应的突变位置是位置36和61。在优选的实施方案中,对应于seqidno:1中的位置72的氨基酸残基不是arg。其优选地是非带电荷的残基,即,不是lys、arg、his、glu或asp。在某些优选的实施方案中,对应于seqidno:1中的位置72的氨基酸残基选自由ala、val、phe、pro、leu、ile、trp、met、cys和gly组成的组;且优选地选自由ala、val、leu、ile和gly组成的组。在优选的实施方案中,对应于seqidno:1中的位置72的氨基酸残基是ala或gly,优选地是ala。如以上所列出的,本发明的部分衍生自蜘蛛丝蛋白或蛛丝蛋白的nt片段。尽管实例必然地涉及特定的nt片段,在这种情况下,为衍生自来自euprosthenopsaustralis的主要蛛丝蛋白1(majorspidroin1,masp1)的蛋白,但认为本文公开的方法可适用于任何相似的蛋白部分。术语“蛛丝蛋白(spidroin)”和“蜘蛛丝蛋白(spidersilkprotein)”遍及说明书可互换地使用并包括所有已知的蜘蛛丝蛋白,包括通常缩写为“masp”或在十字园蛛(araneusdiadematus)的情形中缩写为“adf”的大壶状蜘蛛丝蛋白(majorampullatespidersilkprotein)、和通常缩写为“misp”的小壶状蜘蛛丝蛋白(minorampullatespidersilkprotein)。大壶状蜘蛛丝蛋白通常具有1型和2型两种类型。这些术语还包括如所附权利要求和逐条列举的实施方案中定义的根据本发明的新型nt蛋白片段和与已知的蜘蛛丝nt蛋白片段具有高度同一性和/或相似性的其他非天然蛋白。本发明的部分与蜘蛛丝蛋白的n端(nt)氨基酸序列具有高度相似性。如图1所示,这些氨基酸序列在多个物种和蜘蛛丝蛋白包括masp1、masp2和misp之间相当保守。因此,技术人员非常清楚氨基酸序列可以被如何改变以及改变至何种程度,而不脱离n端蜘蛛丝蛋白片段的性质和功能。表1列出了在图1中比对的蛛丝蛋白nt片段和本发明的其他nt部分,用genbank登录条目表示。表1-蛛丝蛋白nt片段每个序列仅示出了对应于n端结构域的部分,省略了信号肽。ncflag和nimflag根据risinga.等人biomacromolecules7,3120-3124(2006)翻译和编辑。只要nt部分未完全缺失,哪种特定的nt部分存在于根据本发明的蛋白中不是关键的。因此,根据本发明的nt部分可选自图1示出的masp1或masp2氨基酸序列或具有高度相似性的序列或misp氨基酸序列诸如seqidno:96-99中的任何一种。各种各样的序列可用于根据本发明的融合蛋白中。基于图1的同源序列,以下序列构成共有maspnt氨基酸序列:qantpwsspnladafinsf(m/l)sa(a/i)sssgafsadqlddmstig(d/n/q)tlmsamd(n/s/k)mgrsg(k/r)stksklqalnmafassmaeiaaaesgg(g/q)svgvktnaisdalssafyqttgsvnpqfv(n/s)eirsli(g/n)m(f/l)(a/s)qasanev(seqidno:10)。根据本发明的本发明的部分的序列与共有氨基酸序列seqidno:10具有优选地至少50%同一性、优选地至少60%同一性,所述共有氨基酸序列seqidno:10是基于图1的野生型nt氨基酸序列。在优选的实施方案中,根据本发明的本发明的部分的序列与共有氨基酸序列seqidno:10具有至少65%同一性、优选地至少70%同一性。在优选的实施方案中,根据本发明的溶解度增强部分与共有氨基酸序列seqidno:10具有进一步的70%、优选80%的相似性。根据本发明的代表性的本发明的部分是seqidno:2(由seqidno:8编码),其衍生自euprosthenopsaustralisnt部分(seqidno:9),其中位置40中的天冬氨酸被赖氨酸或任何其他碱性残基置换,且位置65中的赖氨酸被天冬氨酸或任何其他酸性残基置换,如上文和seqidno:1中所列出的。根据本发明的优选实施方案,本发明的部分进一步地与seqidno:1或seqidno:96-99中任一个或图1中的任何个体氨基酸序列具有至少70%同一性、例如至少75%同一性、优选地至少80%同一性。在本发明的优选实施方案中,本发明的部分与seqidno:1或seqidno:96-99中任一个或图1中的任何个体氨基酸序列具有至少85%同一性、例如至少90%或甚至95%同一性。在本发明的优选实施方案中,溶解度增强部分与seqidno:9或seqidno:96-99中任一个或图1中的任何个体氨基酸序列相同,条件是位置40中的酸性残基和位置65中的碱性残基(或者其可能的相应位置)如上文所述的被置换。如遍及说明书和所附权利要求使用的术语“%同一性”如下计算。使用clustalw算法(thompson,j.d.,higgins,d.g.和gibson,t.j.,nucleicacidsresearch,22:4673-4680(1994))比对查询序列与靶序列。在对应所比对的序列中的最短序列的窗口上进行比较。比较每个位置的氨基酸残基,并将在靶序列中具有相同对应物的查询序列中的位置的百分比报告为%同一性。遍及说明书和所附权利要求使用的术语“%相似性”如针对“%同一性”所描述的计算,例外是疏水性残基ala、val、phe、pro、leu、ile、trp、met和cys是相似的,碱性残基lys、arg和his是相似的;酸性残基glu和asp是相似的;且亲水性的、不带电荷的残基gln、asn、ser、thr和tyr是相似的之外。在该背景中,剩余的天然氨基酸gly不与任何其他氨基酸相似。遍及本说明书,根据本发明的可选实施方案满足相应的百分比相似性,而不是指定的百分比同一性。其他可选实施方案满足指定的百分比同一性以及另一个(较高百分比的相似性),其选自每个序列的优选百分比同一性的组。例如,某序列可以与另一序列70%相似;或其可以与另一序列70%相同;或其可以与另一序列70%相同且90%相似。本发明的部分包含从100至160个氨基酸残基。优选地,本发明的部分包含至少100个,或多于110个,优选地多于120个氨基酸残基。还优选地,本发明的部分包含至多160个,或少于140个氨基酸残基。典型的本发明的部分包含约130-140个氨基酸残基。如wo2011/115538(其全文并入本文)中详细列出的,蜘蛛丝蛋白的n端(nt)片段在由重组dna制备的融合蛋白中作为溶解度增强部分是特别有用的。根据另一方面,本发明进一步基于由于根据本发明的电荷逆转的双突变体nt作为可溶性单体存在而不论周围水性介质的ph如何的能力而对其在这样的融合蛋白中的有用性的洞察。得到的融合蛋白出乎意料地稳定并且可以以高产量制备。根据这一方面,本发明提供了一种融合蛋白,所述融合蛋白包含:(i)至少一个100-160个氨基酸残基的溶解度增强部分,所述溶解度增强部分与seqidno:1或seqidno:96具有至少70%同一性,其中对应于seqidno:1中的位置40的氨基酸残基选自由lys、arg和his组成的组;并且其中对应于seqidno:1中的位置65的氨基酸残基选自由asp和glu组成的组;和(ii)至少一个为期望的蛋白或多肽的部分。上文给出了溶解度增强部分的优选特征。出乎意料的是,从实验数据确定,尽管溶解度增强部分的位置40和65的这些变化不会改变所得融合蛋白的净电荷,但其为与其融合的任何期望的蛋白/多肽部分提供稳定性和溶解度的能力被改进,并且由于不形成涉及带相反电荷的残基40和65的静电相互作用,融合蛋白的溶解度增强部分出乎意料地防止了二聚化。在优选的实施方案中,融合蛋白由以下组成:(i)至少一个100-160个氨基酸残基的溶解度增强部分,所述溶解度增强部分与seqidno:1或seqidno:96具有至少70%同一性,其中对应于seqidno:1中的位置40的氨基酸残基选自由lys、arg和his组成的组;并且其中对应于seqidno:1中的位置65的氨基酸残基选自由asp和glu组成的组;和(ii)至少一个为期望的蛋白或多肽的部分,所述融合蛋白任选地包括本文公开的其他优选的特征,例如,溶解度增强部分与期望的蛋白或多肽之间的接头肽和/或裂解位点。在实验中,已在大肠杆菌(e.coli)中实现了不同融合蛋白的高产量。融合蛋白本身作为分离的形式可以是有用的,例如,用于以可溶性形式研究本来为聚集的或可溶性差的蛋白,或在与x-射线晶体学相关的结晶中可以是有用的。融合蛋白还可被裂解以释放期望的蛋白或多肽。术语“融合蛋白”在本文意指通过由将通常不会一起出现的两个或更多个核酸序列组合而人工创建的重组核酸,即dna或rna的表达而制备的蛋白(基因工程)。根据本发明的融合蛋白是重组蛋白,且因此其不同于天然存在的蛋白。组合的核酸序列编码具有特定功能特性的不同蛋白、部分蛋白或多肽。所得的融合蛋白或重组融合蛋白是具有来源于原始蛋白、部分蛋白或多肽中的每一个的功能特性的单一蛋白。在某些实施方案中,根据本发明的融合蛋白和相应的基因是嵌合的,即,该蛋白/基因片段来源于至少两种不同的种类。溶解度增强部分衍生自蜘蛛丝蛋白的n端片段。根据该方面,优选期望的蛋白或多肽是非蛛丝蛋白的蛋白。这意指期望的蛋白或多肽不衍生自蜘蛛丝蛋白的c端片段、重复片段或n端片段。根据另一方面,优选期望的蛋白或多肽是蛛丝蛋白的蛋白。这意指期望的蛋白或多肽衍生自蜘蛛丝蛋白的c端片段、重复片段或n端片段。期望的蛋白或多肽继而也可以是蛛丝蛋白的蛋白部分与非蛛丝蛋白的多肽或蛋白部分之间的融合物。典型地,蛛丝蛋白的蛋白部分提供形成有序的聚合物的能力,而非蛛丝蛋白的多肽或蛋白部分可以提供期望的亲和力特性,例如,细胞结合肽、免疫球蛋白及其功能片段。根据本发明的融合蛋白还可包含一个或更多个接头肽。接头肽可设置在溶解度增强部分与期望的蛋白或多肽部分之间,或可设置在溶解度增强部分和期望的蛋白或多肽部分的任一末端。如果融合蛋白包含两个或更多个溶解度增强部分,接头肽还可设置在两个溶解度增强部分之间。接头可在融合蛋白的功能单元之间提供间隔区,但也可构成用于鉴定和纯化该融合蛋白的工具,例如,his和/或trx标签。如果融合蛋白包含用于鉴定和纯化融合蛋白的两个或更多个接头肽,优选它们被间隔序列隔开,例如his6-间隔区-his6-。接头还可构成将融合蛋白指导到膜和/或致使融合蛋白从宿主细胞分泌到周围介质中的信号肽,例如信号识别颗粒底物。融合蛋白还可在其氨基酸序列中包含允许接头和/或一个或更多个溶解度增强部分的裂解和去除的裂解位点。各种裂解位点是本领域技术人员已知的,例如,针对化学剂例如met残基之后的cnbr和asn-gly残基之间的羟胺的裂解位点,针对蛋白酶例如凝血酶或蛋白酶3c的裂解位点,和自我剪接序列,例如内含肽(intein)自我剪接序列。优选的裂解位点在met残基之后。每个溶解度增强部分与期望的蛋白或多肽部分直接或间接连接。直接连接意指两个部分之间的直接共价结合而无间插序列例如接头。间接连接也是意指两个部分通过共价键连接,但是存在间插序列,例如接头和/或一个或更多个另外的溶解度增强部分。至少一个溶解度增强部分可设置在期望的蛋白或多肽的任一末端,即,设置在c端或设置在n端。优选将至少一个溶解度增强部分设置在期望的蛋白或多肽的n端末端。如果融合蛋白包含用于鉴定和纯化融合蛋白的一个或更多个接头肽,例如,his或trx标签,优选地将其设置在融合蛋白的n端末端。至少一个溶解度增强部分还可整合到期望的蛋白或多肽内,例如在期望的蛋白的结构域或部分之间。在优选的实施方案中,至少一个溶解度增强部分构成融合蛋白的n端和/或c端末端,即,无接头肽或其他序列存在于溶解度增强部分的端部。根据本发明的典型的融合蛋白可包含1-6个,例如1-4个,例如1-2个溶解度增强部分。在优选的实施方案中,融合蛋白包含至少两个溶解度增强部分,所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的n端(nt)片段,如上文所列出的。溶解度增强部分,优选地两个溶解度增强部分可连续地设置在期望的蛋白或多肽的任一末端,即,设置在c端或设置在n端。连续地设置的溶解度增强部分还可整合到期望的蛋白或多肽内,例如在期望的蛋白的结构域或部分之间。溶解度增强部分还可不连续地设置,在期望的蛋白或多肽的每个末端,即设置在c端和n端,或在期望的蛋白或多肽的一个末端和整合到期望的蛋白或多肽内。根据本发明的典型的优选的融合蛋白可包含2-6个,例如2-4个溶解度增强部分。在优选的实施方案中,根据本发明的融合蛋白具有设置在至少一个期望的蛋白或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。这允许融合蛋白的裂解和期望的蛋白的纯化。然而应注意,获得作为融合蛋白的部分的期望的蛋白或多肽可以是期望的,该融合蛋白可提供用于纯化和检测的合适工具和/或提供期望的性质例如稳定性和溶解度。在这种情况下,可省略裂解位点,或可包含裂解位点而省略裂解步骤。优选的融合蛋白具有以下形式:设置在n端的溶解度增强部分,其通过1-30个氨基酸残基,例如1-10个氨基酸残基的接头肽偶联到设置在c端的期望的蛋白或多肽。接头肽可包含裂解位点。任选地,融合蛋白具有n端或c端接头肽,所述n端或c端接头肽可包含纯化标签例如his标签和裂解位点。另一种优选的融合蛋白具有以下形式:设置在n端的溶解度增强部分,其直接偶联到设置在c端的期望的蛋白或多肽。任选地,融合蛋白具有n端或c端接头肽,所述n端或c端接头肽可包含纯化标签例如his标签和裂解位点。一种优选的融合蛋白具有以下形式:两个连续的设置在n端的溶解度增强部分,其通过1-30个氨基酸残基,例如1-10个氨基酸残基的接头肽偶联到设置在c端的期望的蛋白或多肽。接头肽可包含裂解位点。任选地,融合蛋白具有n端或c端接头肽,所述n端或c端接头肽可包含纯化标签例如his标签和裂解位点。另一种优选的融合蛋白具有以下形式:两个连续的设置在n端的溶解度增强部分,其直接偶联到设置在c端的期望的蛋白或多肽。任选地,融合蛋白具有n端或c端接头肽,所述n端或c端接头肽可包含纯化标签例如his标签和裂解位点。在本发明的上下文中,要理解的是,期望的多肽是指5-50个氨基酸残基,优选地10-50个、20-50个或40-50个氨基酸残基的多肽。进一步地,在本发明的上下文中,要理解的是,期望的蛋白是指多于50个氨基酸残基、例如多于80个氨基酸残基的蛋白。优选地,期望的蛋白含有少于500个氨基酸残基,例如少于300个或少于200个氨基酸残基。期望的多肽或蛋白的优选尺寸在4-50kda,例如5-50kda、4-45kda和5-45kda,优选地8-30kda且更优选地4-20kda、5-20kda或8-30kda的范围中。在本发明的优选实施方案中,期望的多肽或蛋白是疏水性的,具有65或更高,优选地70或更高的脂溶指数(aliphaticindex),如通过protparam(http://web.expasy.org/protparam/;gasteigere.等人;proteinidentificationandanalysistoolsontheexpasyserver;(in)johnm.walker(ed):theproteomicsprotocolshandbook,humanapress(2005).pp.571-607)确定的。优选地,如通过总平均亲水性指数(thegrandaverageofhydropathy(gravy)index)(kyte,j.和doolittle,r.f.(1982)asimplemethodfordisplayingthehydropathiccharacterofaprotein.j.mol.biol.157,105-132.)定义的,多肽内疏水性残基的比率应该在-1和2之间,优选地在1和2之间。在一个优选的实施方案中,期望的蛋白或多肽选自由淀粉样蛋白形成蛋白和多肽、含二硫化物的蛋白和多肽、载脂蛋白、膜蛋白和多肽、蛋白和多肽药物及药物靶、易于聚集的蛋白和多肽、蛋白酶、和免疫球蛋白及其片段组成的组。在优选的实施方案中,期望的蛋白或多肽选自由淀粉样蛋白形成蛋白和多肽、含二硫化物的蛋白和多肽、载脂蛋白、膜蛋白和多肽、蛋白和多肽药物及药物靶、易于聚集的蛋白和多肽及蛋白酶组成的组。一组优选的期望的蛋白或多肽由以下组成:aβ-肽、iapp、prp、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、atf、肌动蛋白和β17;sp-b、mini-bleu、α-防御素和β-防御素;a-h类载脂蛋白;ll-37、hcap18、sp-c、sp-c33、sp-c33leu、kl4、brichos、gfp、egfp、呆蛋白、神经丝抑蛋白;激素,包括epo和gh、和生长因子,包括igf-i和igf-ii;sp-a、sp-d及其类似物;bri2-brichos及其变体,包括bri2113-231;亲和素和链霉亲和素;蛋白酶3c;以及免疫球蛋白和其片段。一组优选的期望的蛋白或多肽由以下组成:aβ-肽、iapp、prp、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、atf、肌动蛋白和β17;sp-b、mini-bleu、α-防御素和β-防御素;a-h类载脂蛋白;ll-37、hcap18、sp-c、sp-c33、sp-c33leu、kl4、brichos、gfp、egfp、呆蛋白、神经丝抑蛋白;激素,包括epo和gh、和生长因子,包括igf-i和igf-ii;sp-a、sp-d及其类似物;bri2-brichos及其变体,包括bri2113-231;亲和素和链霉亲和素;以及蛋白酶3c。根据本发明的淀粉样蛋白形成蛋白和多肽包括与疾病和功能性淀粉样蛋白相关的蛋白和多肽。淀粉样蛋白形成蛋白和多肽的实例包括淀粉样β肽(αβ-肽)、胰岛淀粉样多肽(胰淀素或iapp)、朊病毒蛋白(prp)、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、心房利钠因子(atf)和肌动蛋白。另一实例是设计的多肽β17。表2中列出了根据本发明的淀粉样蛋白形成蛋白和多肽的实例。表2-淀粉样蛋白形成蛋白和多肽蛋白uniprotid/其他参考aβ1-42p05067载脂蛋白saap02735半胱氨酸蛋白酶抑制剂cp01034运甲状腺素蛋白p02766溶菌酶p61626α-突触核蛋白p37840朊病毒蛋白p04156odama1e959乳凝集素q08431taup10636凝溶胶蛋白p06396abri,adanq9y287胰岛素p01308载脂蛋白a-iip02652载脂蛋白a-ivp06727精胶蛋白ip04279角膜上皮素q15582乳运铁蛋白p02788纤维蛋白原α-链p02671anfp01160iappp10997β2-微球蛋白p61769降钙素p01258催乳素p01236载脂蛋白a-ip02647csgap28307sup35c7gn25pmel17p40967het-sa8hr89ure2pq8nie6β17seqidno:27含二硫化物的蛋白和多肽的实例包括表面活性蛋白b(sp-b)和其变体,例如mini-b、mini-b27、mini-bleu、α-防御素和β-防御素。不被任何具体的理论限制,设想溶解度增强部分促进防御素和其他含二硫化物的蛋白和多肽中期望的链内二硫键的形成超过链间二硫键的形成。表3中列出了根据本发明的含二硫化物的蛋白和多肽的实例。表3-含二硫化物的蛋白和多肽载脂蛋白的实例包括a-h类载脂蛋白。表4中列出了根据本发明的载脂蛋白的实例。表4-载脂蛋白蛋白序列/uniprotid载脂蛋白b-100p04114载脂蛋白c-1p02654载脂蛋白dp05090载脂蛋白ep02649膜蛋白和多肽的实例包括膜相关受体,包括细胞因子受体、kl4、ll-37、hcap18、表面活性蛋白c(sp-c)和其变体例如sp-c(leu)、sp-c33、sp-c30和sp-c33leu。其他具体实例包括任选地通过接头例如,glyn、leun、gly-alan等与mini-b、mini-bleu、1aaa、1baa、0aaaa、1all、1bll、0llll或sp-b蛋白融合的sp-c33leu。sp-c33leu可设置在mini-b、mini-bleu、1aaa、1baa、0aaaa、1all、1bll、0llll或sp-b蛋白的n端,或优选地c端。表5中列出了根据本发明的膜蛋白和多肽的实例。表5-膜蛋白和多肽蛋白和多肽药物及药物靶的实例包括重组制备的激素,包括肽和蛋白激素,例如红细胞生成素(epo)和生长激素(gh)、细胞因子、生长因子,例如胰岛素样生长因子(igf-i和igf-ii)、kl4、ll-37、hcap18、表面活性蛋白c(sp-c)和其变体,例如sp-c(leu)、sp-c33、sp-c30、sp-c33leu。其他具体实例包括任选地通过接头例如,glyn、leun、gly-alan等与mini-b、mini-bleu、1aaa、1baa、0aaaa、1all、1bll、0llll或sp-b蛋白融合的sp-c33leu。sp-c33leu可设置在mini-b、mini-bleu、1aaa、1baa、0aaaa、1all、1bll、0llll或sp-b蛋白的n端,或优选地c端。进一步优选的实例包括表面活性蛋白a(sp-a)和d(sp-d)及其类似物。进一步优选的实例是bri2-brichos及其变体,包括bri2113-231、以及呆蛋白。表6中列出了根据本发明的蛋白和多肽药物及药物靶的实例。表6-蛋白和多肽药物及药物靶易于聚集的蛋白和多肽的实例包括亲和素、链霉亲和素和细胞因子受体的细胞外配体结合部分。表7中列出了根据本发明的易于聚集的蛋白和多肽的实例。表7-易于聚集的蛋白和多肽蛋白酶的实例包括来自柯萨奇病毒或人鼻病毒的蛋白酶3c。表8中列出了根据本发明的蛋白酶的另外的实例。表8-蛋白酶在本发明的优选实施方案中,期望的蛋白或多肽选自表面活性蛋白b(sp-b)及其变体,诸如mini-b、mini-b27、mini-bleu和kl4;aβ、iapp、β17;ll-37、hcap18;表面活性蛋白c(sp-c)及其变体,诸如sp-c(leu)、sp-c33、sp-c30和sp-c33leu;表面活性蛋白a(sp-a)及其变体;和表面活性蛋白d(sp-d)及其变体;和bri2-brichos及其变体,包括bri2113-231。根据本发明的其他优选的蛋白是呆蛋白、神经丝抑蛋白、gfp、egfp和1aaa、1baa、0aaaa、1all、1bll及0llll蛋白。在本发明的某些优选的实施方案中,融合蛋白选自由seqidno56、60、64、66、70-75、82、84、87、90和93;和与这些蛋白中的任何一种具有至少80%,优选地至少90%,更优选地至少95%同一性的蛋白组成的组。根据一个方面,本发明提供了一种包含根据本发明的蛋白的水性溶液的组合物。在优选的实施方案中,组合物由根据本发明的蛋白的水性溶液组成。优选地,蛋白是根据本发明的融合蛋白。优选地,组合物的ph是7.2或更低,诸如5.5-7.2。根据另一方面,本发明提供了一种编码根据本发明的蛋白的分离的核酸,优选地cdna。在优选的实施方案中,分离的核酸选自由seqidno58、62、65、68、76-81、83、85、89、91和95组成的组。根据一个方面,本发明提供了至少一个与seqidno:1具有至少70%同一性的100-160个氨基酸残基的部分作为融合蛋白中的部分用于增强融合蛋白中的另一部分的溶解度的新颖用途,其中对应于seqidno:1中的位置40的氨基酸残基选自由lys、arg和his组成的组;并且其中对应于seqidno:1中的位置65的氨基酸残基选自由asp和glu组成的组;所述融合蛋白中的另一部分是如本文所列出的期望的蛋白或多肽。上文给出了本发明的溶解度增强部分的优选特征。在一个优选的实施方案中,溶解度增强部分用于制备期望的蛋白或多肽。在另一个优选的实施方案中,溶解度增强部分用于研究或表征期望的蛋白或多肽。本发明的部分的有利用途是作为经受ph为7.2或更低,例如5.5-7.2的融合蛋白中的溶解度增强部分。不论周围水性介质的ph如何,蜘蛛丝蛋白的n端(nt)片段的这种特定变体作为可溶性单体存在。野生型nt在5.5-7.2的ph区间形成二聚体,这增加了融合蛋白的不期望的聚集的风险。该ph区间对于某些期望的蛋白和多肽的功能和稳定性是有用的ph区间。该ph区间对于某些纯化方案(例如,当使用离子交换,诸如阳离子或阴离子交换,或固定金属离子亲和色谱法(imac)作为纯化原理时)也是有用的ph区间。该ph区间对于某些表达宿主例如酵母也是有用的ph区间。根据另一方面,本发明提供了一种制备期望的蛋白或多肽的方法。第一步骤包括在合适的宿主中表达根据本发明的包含期望的蛋白或多肽的融合蛋白。溶解度增强部分与seqidno:1-7中所列出的电荷逆转的nt蛋白的任一个或seqidno:96的电荷逆转的变体,优选地seqidno:1-2或seqidno:96的电荷逆转的变体具有至少70%同一性、诸如75%、80%、85%、90%、95%或甚至100%同一性。如本文所列出的,对应于seqidno:1中的位置40的氨基酸残基选自由lys、arg和his组成的组;并且对应于seqidno:1中的位置65的氨基酸残基选自由asp和glu组成的组。在可选的实施方案中,溶解度增强部分与seqidno:9或96中所列出的野生型nt蛋白具有至少70%同一性、诸如75%、80%、85%、90%、95%或甚至100%同一性。为了避免疑问,这意指,该方法也可适用于不是电荷逆转的nt蛋白(例如,不是如seqidno:1-7中所列出的电荷逆转的nt蛋白)的溶解度增强部分。合适的表达宿主是本领域技术人员熟知的且包括例如细菌和真核细胞,例如酵母、昆虫细胞系和哺乳动物细胞系。通常,该步骤包括在大肠杆菌中表达编码融合蛋白的核酸分子。方法的第二步骤包括获得包含融合蛋白的混合物,并任选地分离所述融合蛋白。混合物可例如通过裂解或机械破坏宿主细胞获得。如果宿主细胞分泌融合蛋白,还可通过收集细胞培养基获得混合物。可使用标准程序分离由此获得的蛋白。如果需要,该混合物可经受离心,并收集合适的级分(沉淀物或上清液)。包含融合蛋白的混合物还可经受凝胶过滤、色谱法例如离子交换色谱法,诸如阳离子或阴离子交换色谱法、透析、相分离或过滤以导致分离。在优选的实施方案中,所获得的混合物包含溶解在液体介质,通常是盐缓冲液或细胞培养基中的融合蛋白。不论周围水性介质的ph如何,蜘蛛丝蛋白的n端(nt)片段的这种特定变体作为可溶性单体存在。野生型nt在5.5-7.2的ph区间形成二聚体,这增加了融合蛋白的不期望的聚集的风险。该ph区间对于某些期望的蛋白和多肽,例如淀粉样蛋白形成蛋白/多肽或易于聚集的蛋白/多肽的功能和稳定性是有用的ph区间。该ph区间对于某些表达宿主例如酵母也是有用的ph区间。该ph区间对于某些纯化方案(例如,当使用离子交换,诸如阳离子或阴离子交换,或固定金属离子亲和色谱法(imac)作为纯化原理时)也是有用的ph区间。在优选的实施方案中,该步骤还包括在离子交换介质例如阳离子或阴离子交换介质上纯化融合蛋白。在一个优选的实施方案中,该步骤还包括在imac介质上纯化融合蛋白,优选地使用低ph(低于his的pka,通常为约6的ph)洗脱。因此,融合蛋白通常作为液体介质中的溶液获得。术语“可溶性”和“在溶液中”是指融合蛋白无可见的聚集且在60000×g不从溶剂中沉淀出来。液体介质可以是任何合适的介质,例如水性介质,优选地生理介质,通常是缓冲的水性介质,例如10-50mmtris-hcl缓冲液或磷酸盐缓冲液。已有利地发现,根据本发明的溶解度增强部分的存在在这些条件下改进了期望的蛋白/多肽的稳定性并防止部分的二聚体的形成(moietydimerformation)。当可能不期望立即聚合时(例如在蛋白纯化期间,或在大批量制备时),这可以是有利的。具体地,这对于根据本发明的方法是有利的,所述方法包括涉及使融合蛋白经受7.2或更低例如5.5至7.2的ph的至少一个步骤。如以上所列出的,不论周围水性介质的ph如何,蜘蛛丝蛋白的n端(nt)片段的这种特定变体作为可溶性单体存在。野生型nt在5.5-7.2的ph区间形成二聚体,这增加了融合蛋白的不期望的聚集的风险。该ph区间对于某些期望的蛋白和多肽,例如淀粉样蛋白形成蛋白/多肽或易于聚集的蛋白/多肽的功能和稳定性是有用的ph区间。该ph区间对于某些表达宿主例如酵母也是有用的ph区间。在优选的实施方案中,从混合物分离融合蛋白,而无需涉及凝胶过滤、色谱法或任何其他基于固相吸附的分离的任何分离步骤。在一个优选的实施方案中,通过使融合蛋白沉淀,然后将沉淀的融合蛋白悬浮在水性溶剂中而从混合物分离融合蛋白,其中融合蛋白在水性溶剂中是可溶性的。融合蛋白的沉淀可以通过任何合适的技术进行以降低融合蛋白在溶剂中的溶解度,包括离子强度的变化和可混溶的有机溶剂的添加。优选地,通过在高盐浓度的盐析(即,使融合蛋白经受足够高的盐浓度以使融合蛋白不溶)实现融合蛋白的沉淀。举例来说,0.5m或更高,例如1m或更高的nacl浓度通常足以使融合蛋白沉淀。收集含有融合蛋白的沉淀物,例如,通过过滤或离心,并弃去滤液或上清液。任选地,脂多糖和其他热原在该阶段被有效地去除。如果需要,可以将分离的沉淀的融合蛋白悬浮并溶解在合适的溶剂中。优选地,将沉淀的融合蛋白悬浮在水性溶剂中,其中融合蛋白是可溶性的。在某些实施方案中,方法还包括裂解融合蛋白作为裂解产物以从残余的溶解度增强部分或其片段释放期望的蛋白或多肽;和任选地分离期望的蛋白或多肽的步骤。如果需要,可在该步骤中通过裂解去除接头肽。在这些实施方案中,融合蛋白包含至少一个设置在至少一个期望的蛋白或多肽部分与至少一个溶解度增强部分之间的裂解位点。在典型的融合蛋白中,这意指在一个或更多个溶解度增强部分与期望的蛋白或多肽之间存在单个裂解位点。裂解可使用标准程序实现,例如,通过溴化氰(cnbr)裂解met残基后,通过羟胺裂解asn和gly残基之间,通过蛋白酶3c裂解-xletlfqgx-位点和在本领域技术人员熟知的各种其他蛋白酶位点的gln和gly残基之间。由此获得的期望的蛋白或多肽可使用标准程序分离。如果需要,该混合物也可经受离心,并收集合适的级分(沉淀物或上清液)。包含期望的蛋白或多肽的混合物还可经受凝胶过滤、色谱法、透析、相分离或过滤以导致分离。任选地,脂多糖和其他热原在该阶段被有效地去除。如果需要,可在该步骤中通过裂解去除接头肽。在优选的实施方案中,从混合物分离期望的蛋白或多肽,而无需涉及凝胶过滤、色谱法或任何其他基于固相吸附的分离的任何分离步骤。在一个优选的实施方案中,通过在有机溶剂中的提取(即通过将裂解产物悬浮在有机溶剂中来提取期望的蛋白或多肽)而从混合物分离期望的蛋白或多肽,其中期望的蛋白或多肽是可溶性的并且其中残余的根据本发明的溶解度增强部分或其片段是不溶性的。根据本发明使用的有机溶剂是含碳溶剂并且可以表现出不同程度的极性。尽管被称为“溶剂”,但应理解的是,这些有机溶剂被用于在制造方法期间平衡和改变融合蛋白和/或期望的蛋白或多肽和/或残余的溶解度增强部分或其片段的溶解度。蛋白或多肽在某一有机溶剂浓度区间可以很好地溶解在有机溶剂中,但当有机溶剂浓度升高或降低时则沉降并形成沉淀物。例如,残余的溶解度增强部分或其片段可以溶解在有机溶剂例如低级烷基醇和水的50/50(vol/vol)混合物中,但在90/10或10/90(vol/vol)混合物中则沉降并形成沉淀物。当经受非沉淀条件,例如,50/50或0/100混合物时,蛋白或多肽回到未沉淀的、溶解状态。技术人员完全知晓,其他因素可对用于蛋白或多肽的沉淀的限制性有机溶剂浓度具有影响,所述因素例如温度、ph、离子强度和有机溶剂的类型。在给定条件下用于蛋白或多肽的沉淀的限制性浓度是公知的或可以由本领域技术人员容易地确定。根据本发明的有机溶剂可以选自由以下组成的组但不限于此:戊烷、己烷、环己烷、1,4-二噁烷、n,n-二甲基甲酰胺、n,n-二甲基乙酰胺、氯仿、乙酸乙酯、乙酰胺、二乙醚、四氢呋喃、乙腈、甲基乙基酮、丙酮、低级烷基醇,例如甲醇、乙醇、丙醇、异丙醇和丁醇、或上述溶剂的任何混合物。优选地,根据本发明的有机溶剂是水溶性的。优选的一组有机溶剂是低级烷基醇。术语低级烷基醇包括具有1至6个碳原子的伯、仲和叔烷基醇,即c1-6烷基醇。低级烷基醇的具体实例包括甲醇、乙醇、变性酒精(denaturedspirit)、正-丙醇、异丙醇、正-丁醇、异丁醇和叔-丁醇。由于价格、可得性和易于处理,优选的低级烷基醇是甲醇、乙醇、异丙醇和异丁醇,特别是乙醇。在一个优选的实施方案中,在提取步骤之前,方法还包括使裂解产物沉淀的步骤。裂解产物的沉淀可以通过任何合适的技术进行以降低期望的蛋白或多肽在溶剂中的溶解度,包括离子强度的变化和可混溶的有机溶剂的添加。优选地,通过在高盐浓度的盐析(即,使裂解产物经受足够高的盐浓度以使期望的蛋白或多肽不溶)实现裂解产物的沉淀。举例来说,0.5m或更高,例如1m或更高的nacl浓度通常足以使期望的蛋白或多肽沉淀。收集含有期望的蛋白或多肽的沉淀物,例如,通过过滤或离心,并弃去滤液或上清液。任选地,脂多糖和其他热原在该阶段被有效地去除。如果需要,可以将分离的沉淀的期望的蛋白或多肽悬浮并溶解在合适的溶剂中。因此,一种制备期望的蛋白或多肽的优选方法包括以下步骤:a)在合适的宿主中表达根据本发明的包含期望的蛋白或多肽的融合蛋白;和b)获得包含融合蛋白的混合物,以及b1)分离融合蛋白,包括下列步骤:b1a)使融合蛋白沉淀,优选地通过在高盐浓度的盐析;和b1b)将沉淀的融合蛋白悬浮在水性溶剂中,其中融合蛋白在水性溶剂中是可溶性的;c)裂解融合蛋白作为裂解产物以从残余的溶解度增强部分或其片段释放期望的蛋白或多肽;和c1)分离期望的蛋白或多肽,包括下列步骤:c1a)使裂解产物沉淀;优选地通过在高盐浓度的盐析;c1b)通过将沉淀的裂解产物悬浮在有机溶剂中来提取期望的蛋白或多肽,所述有机溶剂优选地包含低级烷基醇诸如甲醇、乙醇或异丙醇;其中期望的蛋白或多肽在有机溶剂中是可溶性的;并且其中残余的溶解度增强部分或其片段在有机溶剂中是不溶性的。下面,本发明将通过以下非限制性实施例来进一步说明。实施例实施例1-nt和电荷逆转的nt突变体的表达将具有ntwt(seqidno:12,编码seqidno:11)和ntd40k/k65d(seqidno:8,编码seqidno:2)的构建体克隆到pt7表达载体中并转化到化学感受态大肠杆菌bl21(de3)细胞中。将含有质粒的细胞接种到含有70mg/l卡那霉素的10mlluria-bertani(lb)培养基中,并在37℃和180rpm生长过夜。将5ml过夜培养物接种到含有卡那霉素的500mllb培养基中(1/100),并使细胞在30℃进一步生长至od600为~1。通过加入异丙基β-d-1-硫代吡喃半乳糖苷(iptg)至终浓度为0.5mm诱导细胞,并且表达在20℃过夜进行。第二天,通过离心收获细胞,重悬于20mmtris-hcl,ph8中至30ml并在-20℃储存至少24小时。实施例2-ntd40k/k65d与ntwt相比的生物物理特性nt二聚化过程高度依赖于残基d40和k65之间的分子间静电相互作用,其在单体的初始缔合中起关键作用。在该研究中,我们设计并评价了双突变体(ntd40k/k65d;seqidno:2),其中与野生型nt(ntwt;seqidno:11)相比这些残基被交换,同时保持了结构域的净电荷。评价了重要的生物物理特性以确定突变体作为溶解度增强融合伴侣的适用性。(a)色氨酸荧光测量使用具有96个平底孔的黑色聚苯乙烯测定板,在荧光光谱仪(tecansafire2)上分别测量ntd40k/k65d(seqidno:2)和ntwt(seqidno:11)的荧光发射光谱。在以0.4个ph单位的步长调节至ph5.6-8.0的20mmhepes/20mmmes中将蛋白稀释至浓度为5μm。在280nm(5nm带宽)激发样品之后,在300-400nm(10nm带宽)之间以1nm步长记录发射光谱。色氨酸荧光比率根据在339nm和351nm处的强度计算并绘制为ph的函数。由于单体-二聚体平衡的s形行为,将针对ntwt获得的数据拟合到双态结合模型。nt的ph依赖性单体-二聚体平衡可以通过在二聚体中变得更加暴露的单个色氨酸(trp)残基的荧光位移来监测。图2是示出通过trp荧光测量的单体-二聚体平衡的图。在20mmhepes/20mmmes缓冲液中测量在300nm和400nm之间的trp荧光光谱,并且计算在339/351nm(分别对应单体和二聚体构象的波长)处的比率,并且对于ntwt(虚线)和ntd40k/k65d(实线),绘制为ph的函数。对于ntwt,在339和351nm处的荧光的比率作为ph的函数给出s形曲线,在ph6.5具有二聚化的pka。对于突变体ntd40k/k65d未观察到这种荧光位移,并且在整个ph范围内测量到对应于单体的比率(图2)。(b)[15n,1h]-hsqcnmr测量将表达nt变体ntd40k/k65d(seqidno:2)和ntwt(seqidno:11)的细胞过夜培养,并以1/100进一步接种至500ml含有15n-标记的氯化铵和70mg/l卡那霉素的基本培养基m9。将细胞在22℃生长过夜至od600为1.4。如前所述表达和纯化蛋白。在配备有hcn冷探头的varianunityinova600-mhznmr波谱仪上在25℃获取[15n,1h]-hsqcnmr谱图。在20mm磷酸钠、20mmnacl、ph5.5缓冲液或20mm磷酸钠、300mmnacl、ph7.2缓冲液中制备15n-标记的蛋白的nmr样品,并记录2d[15n,1h]-hsqcnmr谱图。使用brukertopspin3.1软件处理和分析谱图。在ph7.2和ph5.5测量hsqcnmr,其中ntwt分别是单体或二聚体,显示出大的化学位移差值。在ph5.5和在ph7.2产生ntwt和ntd40k/k65d的15n-1hhsqcnmr谱图的叠加(未示出)。图3显示在ph5.5(下图)和ph7.2(上图),ntwt和ntd40k/k65d之间的平均主链酰胺1h和15n化学位移差值从ntd40k/k65d获得的谱图在两个ph值处相似并且对应于在ph7.2处单体ntwt的谱图。(c)尿素诱导的变性作为稳定性的量度在以0.5m步长补充有0-7m尿素的20mmhepes/20mmmes中将ntwt(seqidno:11)和ntd40k/k65d(seqidno:2)蛋白稀释至5μm。通过在范围从5.0至7.5的恒定ph值(0.5个单位步长)处的trp荧光来监测每个尿素浓度的蛋白稳定性。对于每个测量的ph,将荧光比率对尿素浓度绘图并拟合到双态解折叠模型(atwo-stateunfoldingmodel)以确定转变点。将ntwt(虚线)和ntd40k/k65d(实线)的数据展示为图4中的天然和变性状态之间的转变点([den]50%)作为ph的函数。参考图4,在低ph,ntwt呈二聚体构象显著更稳定。与之相比,ntd40k/k65d在整个ph区间内表现出增加的整体稳定性,类似于ntwt二聚体并且不依赖于ph的变化。(d)温度扫描作为稳定性的量度用圆二色性(cd)进行温度扫描和分析。使用具有1mm路径长度的300μl比色皿在410型圆cd光谱仪(avivbiomedicalinc.,lakewood,nj,usa)上进行实验。对于所有测量,在ph5.5或ph8.0的5mm磷酸盐缓冲液中将ntwt(seqidno:11)和ntd40k/k65d(seqidno:2)蛋白稀释至10μm。在25℃、在加热到95℃后以及在使样品冷却后再次在25℃记录从260nm到185nm的cd光谱。对于每个温度,数据显示为4次扫描的平均值。通过在温度区间25-95℃内以1℃步长记录在222nm处测量温度扫描,并将数据拟合到双态解折叠模型。图5显示用cd光谱法测量的ntwt和ntd40k/k65d的热稳定性。在ph5.5和ph8.0在222nm处测量以mdegrees计的cd信号,绘制为温度(℃)的函数,并拟合到双态解折叠模型以获得在平衡点处的解链温度(tm)。分别确定了ntd40k/k65d在ph8.0和ph5.5的最高的解链温度。确定了在ph8.0的ntwt单体和在ph5.5的ntwt二聚体的显著较低的解链温度。图6显示用cd光谱法测量的ntwt和ntd40k/k65d的重折叠能力。在25℃、95℃、和冷却后再次在25℃在185nm和260nm之间扫描ntwt((a)ph8.0和(b)ph5.5)以及ntd40k/k65d((c)ph8.0和(d)ph5.5)的摩尔椭圆率。数据表示为平滑的四次测量的平均值。在热变性之前和之后监测的cd光谱表明,尽管ntwt重折叠成α螺旋结构,在ph8在重折叠后存在椭圆率的降低(图6a),这在ph5.5甚至更明显(图6b)。对于ntd40k/k65d,观察到增加的重折叠能力,显示在ph8(图6c)和ph5.5(图6d)在温度诱导的解折叠之前和重折叠之后接近相同的α-螺旋光谱。实施例3-融合蛋白的表达将具有分别与ntd40k/k65d和ntwt融合的靶肽sp-c33leu(seqidno:58-59,编码seqidno:56-57)和kl4(seqidno:62-63,编码seqidno:60-61)的融合蛋白构建体克隆到pt7表达载体中并转化到化学感受态大肠杆菌bl21(de3)细胞中。使具有与pgb1或trx融合的相同靶肽和蛋白的融合蛋白构建体经受相同程序。将含有质粒的细胞接种到含有70mg/l卡那霉素的10mllb培养基中,并在37℃和180rpm生长过夜。将5ml过夜培养物接种到含有卡那霉素的500mllb培养基中(1/100),并使细胞在30℃进一步生长至od600为~1。通过加入iptg至终浓度为0.5mm诱导细胞,并且表达在20℃过夜进行。第二天,通过离心收获细胞,重悬于20mmtris-hcl,ph8中至30ml并在-20℃储存至少24小时。实施例4-纯化融合蛋白用于比较产量测试了与高度可溶的pgb1结构域相比,nt变体ntwt和ntd40k/k65d调节易于聚集的融合伴侣的溶解度的能力。还评价了与sp-c33leu融合的trx,但后来由于其表现差而被排除。通过在上样缓冲液(20mmtris-hcl,ph8)中以80%振幅、1s开启和1s断开持续总计3min进行声处理使实施例3中获得的融合蛋白溶解。通过在27000×g、4℃离心30min,分离可溶性级分和不溶性级分。将澄清的裂解物上样到先前用ni-sepharose(gehealthcare)填充并用上样缓冲液平衡的imac柱中。将结合的蛋白用20mmtris-hcl,5mm咪唑,ph8洗涤,并用20mmtris-hcl,300mm咪唑,ph8洗脱为以1ml计的级分。测量每个级分在280nm处的吸光度,并汇集富含蛋白的级分。使用具有6-8kda截留分子量的透析膜,通过在4℃和5l上样缓冲液中过夜透析去除咪唑。使用考马斯亮蓝染色的15%丙烯酰胺凝胶,通过sds-page确定每个步骤中蛋白的纯度。(a)sp-c33leu融合蛋白图7显示sp-c33leu融合蛋白的sds-page评价。肽与ntwt(泳道1)、ntd40k/k65d(泳道2)、trx(泳道3)或pgb1(泳道4)的c端融合。泳道m表示尺寸标志物,且分子量指示在左侧。图a显示了在20℃在bl21大肠杆菌细胞中在诱导之前和表达过夜之后的表达分析。图b显示了在20mmtris-hcl,ph8中声处理3min、然后分离可溶性(s)和不溶性(p)级分之后的溶解度分析。图c显示比较性ni-sepharose纯化后的融合蛋白。(b)kl4融合蛋白图8显示kl4融合蛋白的sds-page评价。肽与ntwt(泳道1)、ntd40k/k65d(泳道2)或pgb1(泳道3)的c端融合。泳道m表示尺寸标志物,且分子量指示在左侧。图a显示了在20℃在bl21大肠杆菌细胞中在诱导之前和表达过夜之后的表达分析。图b显示了在20mmtris-hcl,ph8中声处理3min、然后分离可溶性(s)和不溶性(p)级分之后的溶解度分析。图c显示比较性ni-sepharose纯化后的融合蛋白。总之,nt变体ntwt和ntd40k/k65d与sp-c33leu(图7a)和kl4(图8a)融合时以相似水平大量表达,并且与pgb1和trx相比以更高水平大量表达。所有蛋白和肽在与nt变体ntwt和ntd40k/k65d融合时表现稳定,但trx-sp-c33leu在表达期间显示降解的迹象。ntd40k/k65d和pgb1二者能够将它们的靶蛋白/肽调节至高溶解度,并且具有一些细微差异,其中大部分差异存在于可溶性级分中(图7-8b)。ntwt与kl4融合时显示~50%的可溶性蛋白(图8b)。在与sp-c33leu融合时观察到nt变体之间的最显著差异,对于ntwt,主要产生不溶性蛋白,且对于ntd40k/k65d,产生完全可溶性蛋白(图7b)。ntd40k/k65d融合蛋白在ni-sepharose上的纯化产生了对于sp-c33leu和kl4分别为284和428mg/l培养物(图7-8c)。这对应于相比于与pgb1融合的蛋白为2和8倍之间更高的量,其主要是由于表达水平更高(表9)。ntwt的产量是中等的,相比于pgb1融合蛋白为约1.3至4倍更高。与sp-c33leu融合的trx给出最低的产量,且融合蛋白在纯化期间持续降解(图7c)。表9实施例5-sp-c33leu和kl4肽的纯化通过以80%振幅持续1.5min、1s开启和1s断开持续总计3min的时间进行声处理使实施例3中获得的表达融合蛋白的细胞裂解。仅在通过沉淀全规模纯化期间,在冰上放置5min后重复声处理程序,并将样品以50000×g离心30min。向上清液中加入氯化钠至终浓度为1.2m,并重复离心。将来自离心的沉淀物溶解于20mmtris-hcl,ph8中,并以60%振幅持续1.5min、1s开启和1s断开持续3分钟进行短暂声处理以完全重新溶解融合蛋白。通过将1.7ml2mhcl加入到30ml溶解的溶液中,然后加入1.7ml1mcnbr进行cnbr裂解。裂解反应在室温过夜进行。第二天,在第二沉淀步骤中将800mm氯化钠加入到裂解反应物中,然后在20000×g离心30min。去除上清液,并将沉淀物在37℃干燥并悬浮于99.9%乙醇中。通过在20000×g离心30min去除不溶性物质。(a)sp-c33leu肽(seqidno:44)将sp-c33leu作为ntd40k/k65d融合蛋白表达,并且在独立于色谱法步骤的程序中制备。图7d显示使用nacl沉淀/乙醇提取方案和cnbr溴化物裂解以去除融合标签来从ntd40k/k65d-sp-c33leu纯化sp-c33leu肽的sds-page评价。p1、s1、p2、s2和t分别表示不溶性级分、可溶性级分、首次沉淀后的沉淀物、首次沉淀后的上清液、和纯化的靶肽。首先,使用1.2m氯化钠在一个简单的步骤中纯化声处理的细胞裂解物以沉淀大部分融合蛋白并去除大部分污染物(图7d)。融合蛋白被设计为具有仅位于肽n端的甲硫氨酸残基,允许用溴化氰(cnbr)裂解。在酸性条件下的cnbr裂解后,使用0.8m氯化钠进行第二次沉淀。sp-c33leu和kl4二者在有机溶剂例如乙醇、甲醇或异丙醇中是可溶性的,并且令人吃惊的是,由cnbr产生的所有nt片段在这些溶剂中仍然是不溶性的。因此,将沉淀的沉淀物通过以下进一步纯化:悬浮在99.9%乙醇中,然后离心以分离20-30mg/l培养物的在可溶性乙醇级分中的高纯度sp-c33leu肽(图7d)。(b)kl4肽(seqidno:46)以上陈述的用于从ntd40k/k65d-sp-c33leu纯化sp-c33leu肽的程序对于从ntd40k/k65d-kl4纯化kl4肽也是可再现的。图8d显示使用nacl沉淀/乙醇提取方案和cnbr溴化物裂解以去除融合标签来从ntd40k/k65d-kl4纯化kl4肽的sds-page评价。p1、s1、p2、s2和t分别表示不溶性级分、可溶性级分、首次沉淀后的沉淀物、首次沉淀后的上清液、和纯化的靶肽。乙醇提取产生10-15mg/l培养物的纯kl4肽(图8d)。实施例6–sp-c33leu的esi-ms表征用esi-ms对实施例5中获得的纯化的sp-c33leu(seqidno:44)的进一步表征表明,重组制备的溶于乙醇的肽具有正确的共价结构。实施例5中获得的sp-c33leu的esi-ms谱图在图9中示出。图a中示出的谱图主要显示具有3或4个电荷的单体sp-c33leu和一个或两个钠加合物,以及具有7个电荷的小部分二聚体。还可以观察到少量的污染物(大约4314.8da,对应于在1079m/z的峰)。图b显示图a中m/z1199.2峰的ms/ms谱图。实施例7-rsp-c33leu对潮气量和肺气体容量的影响sp-c及其衍生物对潮气量和肺气体容量的影响可使用具有呼气末正压(peep)的动物模型评价(almlen,a等,neonatology92,194-200(2007))。用浓度为80mg/ml的二棕榈酰磷脂酰胆碱(dppc)/棕榈酰油酰-磷脂酰甘油(popg)68:31(w/w)中的2%rsp-c33leu(seqidno:44)以200mg/kg在出生时处理未成熟的新生兔(胎龄27天)。接受相同剂量的的动物用作阳性对照,且未处理的同窝出生兔用作阴性对照。使用标准压力顺序对动物进行通气:35/0(峰值吹入压力[cmh2o]/呼气末正压(peep)[cmh2o])持续1min,23/3持续15min,18/3持续5min,13/3持续5min和23/3持续5min。最后,将肺用氮气以23/3cmh2o通气另外的5min,并且然后切除肺用于气体容量测量。潮气量和肺气体容量均作为中值给出。图10示出rsp-c33leu对潮气量的影响。显示用浓度为80mg/ml的dppc:popg(68:31w/w)中的2%rsp-c33leu以200mg/kg在出生时处理的未成熟新生兔在30min通气期间的潮气量,并与接受相同剂量的curosurf、仅dppc:popg的动物(阴性对照)和未处理的动物进行比较。与未处理的阴性对照和用dppc:popg(68:31)处理的对照相比,用dppc:popg(68:31)中的2%rsp-c33leu处理的动物的潮气量显著增加,并接近用处理后获得的潮气量。图11示出rsp-c33leu对肺气体容量的影响。显示用浓度为80mg/ml的dppc:popg(68:31w/w)中的2%rsp-c33leu以200mg/kg在出生时处理的未成熟新生兔的肺气体容量,并与接受相同剂量的仅dppc:popg的动物(阴性对照)和未处理的动物进行比较。用dppc:popg(68:31)中的2%rsp-c33leu和curosurf处理的动物的肺气体容量相等,并且显著高于用dppc:popg(68:31)处理的动物的肺气体容量。在相同的动物模型中使用合成的sp-c33leu肽获得了类似的结果(数据未显示)。实施例8-使用ntd40k/k65d融合蛋白表达β17多肽为了广泛研究淀粉样蛋白聚集机制,研究人员设计了β17(seqidno:27),这是一种非常易于聚集且能够在体外形成淀粉样蛋白样原纤维的多肽。β17包括由5个短的转角隔开的6个β-链,各自包含7个氨基酸。残基以极性非极性模式排列。β17先前已经与myc-标签一起表达用于免疫检测,并且结果是,该肽是不溶性的并且不得不从包涵体纯化。这种纯化程序要求使用变性条件(8m尿素)、耗时且产生不稳定的蛋白。此外,使用硫磺素t(tht)作为报告物研究β17原纤维形成一直受困于过早聚集。根据实施例3克隆和表达了具有与ntd40k/k65d融合(seqidno:65,编码seqidno:64)和与pgb1融合(对照)的β17多肽的构建体。图12是β17融合蛋白和得到的纯化多肽的sds-page评价。β17多肽与ntd40k/k65d(泳道1)或pgb1(泳道2)的c端融合。泳道m表示尺寸标志物,且分子量指示在左侧。图a显示了在20℃在bl21大肠杆菌细胞中在诱导之前和表达过夜之后的表达分析。ntd40k/k65d-β17融合蛋白在大肠杆菌中以超过针对与pgb1融合的β17观察到的丰度水平的丰度水平表达。图b显示了在20mmtris-hcl,ph8中声处理2min、然后分离可溶性(s)和不溶性(p)级分之后的溶解度分析。在对收获的细胞进行声处理2min、随后离心之后,两种融合蛋白主要存在于可溶性级分中。图c显示比较性ni-sepharose纯化后的融合蛋白。在ni-sepharose上纯化分别产生228和92mg/l培养物的与ntd40k/k65d融合的β17和与pgb1融合的β17,并且当用sds-page分析时,该量与条带的强度相关。通过位于β17的n端的凝血酶识别序列的蛋白水解、随后是第二ni-sepharose纯化步骤以将标签与靶蛋白分离来去除ntd40k/k65d溶解度标签。图d显示了使用ni-sepharose色谱法和凝血酶裂解并去除融合标签从ntd40k/k65d-β17纯化β17(seqidno:27)。泳道代表声处理后的上清液(s)、流通液(flow-through)(ft)、纯化的融合蛋白(f)、凝血酶裂解(cl)和纯化的β17靶蛋白(t)。当纯化后立即测量时,可溶性蛋白的产量为7.8mg/l培养物。总之,ntd40k/k65d作为β17的溶解度增强融合标签使得在非变性条件下的有效纯化程序能够实现。实施例9-β17多肽的表征(a)凝胶过滤实施例8中获得的β17多肽(seqidno:27)的流体动力学尺寸使用凝胶过滤来表征。凝胶过滤在24mlsuperdex-200柱上以0.3ml/min运行进行。样品使用200ul环和含有或不含150mmnacl的tbs,1mmedta,ph8作为运行缓冲液注射。柱用分别在10.25、12.54、13.65和16.18ml洗脱的脱铁铁蛋白(443kda)、醇脱氢酶(150kda)、bsa(66kda)和碳酸酐酶(29kda)来校准。图13显示不含盐的运行缓冲液(图13a)和补充有150mmnacl的运行缓冲液(图13b)中可溶性ntd40k/k65d-β17融合蛋白的凝胶过滤。将蛋白于-20℃储存1周(实线)或于4℃储存数日(虚线)后进行分析。当在盐不存在的情况下通过凝胶过滤分析时,ntd40k/k65d融合蛋白在-20℃储存1周或在4℃储存数日后保持为高度可溶性的并作为稳定的八聚体迁移(图13a)。在154mmnacl和1mmedta的存在下获得了类似的结果,但在这些条件下,蛋白作为稳定的二聚体迁移(图13b)。(b)tht测定基于当tht与淀粉样蛋白原纤维结合时其荧光的增强的量子产率,使用tht荧光监测聚集动力学。在微板孔(microplatecorning3881,96孔,低结合,半面积,corningincorporatedlifesciences,acton,ma)中具有10μmtht的情况下,用20mm磷酸钠缓冲液ph8.0,0.2mmedta中的80μmntd40k/k65d-β17进行实验。使用具有440nm激发滤光片和480nm发射滤光片的fluostaromega或optima板阅读器(bmglabtech,offenburg,germany)在37℃在静息条件下记录tht荧光。图14显示在融合蛋白用凝血酶进行蛋白水解后的β17原纤化。在凝血酶(1000:1)的存在下融合蛋白的tht荧光显示β17的原纤化,如通过tht荧光随着时间的推移而增加所示出的(实线)。在凝血酶的不存在下(虚线)没有观察到融合蛋白的原纤化。当在融合标签的不存在的情况下纯化时,β17不会保持在溶液中足够长时间,以便用tht测定研究原纤化(数据未显示)。在本文,我们表明,通过当与ntd40k/k65d融合时将蛋白保持在溶液中、然后在实验开始时通过蛋白水解以释放β17,这是可行的。实施例10-使用ntd40k/k65d融合蛋白表达bri2brichos结构域bri2是一种tm糖蛋白,其包含n端区域、随后为tm结构域、接头区域、brichos结构域和c端区域。功能相对未知,但该蛋白与阿尔茨海默病、aβ前体蛋白加工、aβ内稳态、凋亡、肿瘤抑制和雄性生殖有关。bri2基因的突变与家族性英国型痴呆和家族性丹麦型痴呆相关,这是由淀粉样蛋白原纤维在脑中积累引起的。阿尔茨海默病(ad)中的情况类似,其特征在于淀粉样蛋白β肽(aβ)的积累,最终形成脑斑块。bri2brichos结构域被认为作为抗淀粉样蛋白伴侣分子起作用,防止淀粉样蛋白的形成,且因此作为有前景的治疗靶是令人感兴趣的。将截短的brichos结构域bri2113-231与ntd40k/k65d或ntwt融合(seqidno:68-69,编码seqidno.66-67)表达。基本上根据实施例3,将该蛋白在bl21或origami大肠杆菌细胞中克隆并在20℃表达过夜或在30℃表达4小时。图15是bri2brichos融合蛋白表达和溶解度的sds-page评价。bri2113-231结构域与ntwt(泳道1)或ntd40k/k65d(泳道2)的c端融合。泳道m表示尺寸标志物,且分子量指示在左侧。图a显示在origami大肠杆菌细胞中在诱导之前(泳道b)和在20℃表达过夜(左侧凝胶)或在30℃表达4小时(右侧凝胶)之后(泳道a)的表达分析。两种融合蛋白变体在两种细菌菌株中均显示出高表达水平,尽管ntwt在origami细胞中略微更有效。图b显示溶菌酶处理、然后分离可溶性(泳道s)和不溶性(泳道p)级分之后的溶解度分析。尽管ntd40k/k65d融合蛋白略微更可溶,但收获的细胞的溶菌酶处理是无效的。图c显示了在20mmtris-hcl,ph8中声处理2min、然后分离可溶性(泳道s)和不溶性(泳道p)级分之后的溶解度分析。声处理后,两种融合蛋白主要存在于可溶性级分中。对先前在20℃表达过夜(左侧凝胶)或在30℃表达4小时(右侧凝胶)的细胞进行该分析。在ni-sepharose上纯化融合蛋白,然后为凝血酶裂解和第二纯化步骤以去除标签。使用任一nt变体,bri2113-231蛋白(seqidno:50)的最终产量在origami中为55mg/l培养物,且在bl21中为12mg/l培养物。实施例11-bri2-brichos的表征(a)纯化的bri2-brichos的sds-page分析图16是实施例10中获得的bri2-brichos蛋白(seqidno:50)的纯化的sds-page分析。在还原(图a)和非还原(图b)条件下分析与ntwt(泳道1)或ntd40k/k65d(泳道2)融合的bri2113-231的来自纯化步骤的样品。分子量指示在左侧。将上清液上样于ni-sepharose并收集流通物(ft),然后为用10ml运行缓冲液的4次洗涤步骤(w1-w4)。纯的融合蛋白用咪唑洗脱(f)并用凝血酶裂解(cl)。在还原条件下的sds-page(图16a)显示了两种融合蛋白变体的三种条带(15、12和10kda),并且它们与bri2-brichos(14kda)和nt(12kda,并作为较小的蛋白迁移)的预期尺寸良好相关。12kda条带最可能是被凝血酶非特异性裂解的截短的bri2-brichos。在非还原条件下运行的相同样品(图16b)显示,15kda和12kda条带能够形成寡聚体,如根据bri2-brichos预期的。(b)凝胶过滤基本上如实施例9中所述的,使用凝胶过滤来表征实施例10中获得的bri2-brichos蛋白(seqidno:50)的构象。进行凝胶过滤以估计呈其单体构象的融合蛋白的比例。图17显示凝胶过滤以确定bri2113-231融合蛋白的寡聚体状态。图17a显示在20mmtris,ph8中进行的与ntwt(虚线)或ntd40k/k65d(实线)融合的bri2113-231的凝胶过滤分析。在分析ntwt-bri2-brichos时,区分了四个峰。在25kda的峰接近单体融合蛋白的预期尺寸(29.7kda),但与其他峰相比为小的。观察到两种融合蛋白的二聚体(50kda峰)和三聚体(76kda峰)状态,且ntwt融合蛋白还形成非常大的寡聚体/聚集物(125kda峰)。有趣的是,与ntwt融合蛋白相比,ntd40k/k65d融合蛋白的具有单体构象的蛋白(25kda峰)的量显著更高。结果表明,nt突变体增加bri2-brichos的正确折叠,导致较大部分的可溶性单体bri2-brichos。图17b显示,无nt的bri2113-231的纯化产生了主要为大的寡聚体形式。进行凝胶过滤分析以确定相比于与s标签融合制备的bri2-brichos或单独制备的bri2-brichos,ntd40k/k65d-bri2-brichos融合蛋白的寡聚体状态。在未与nt突变体融合的情况下,蛋白会迁移接近空隙体积,并且会聚集或处于非常大的寡聚体状态。上述数据表明,ntd40k/k65d能够调节bri2-brichos的溶解度和正确折叠,并且还防止不期望的蛋白寡聚化。实施例12-使用ntd40k/k65d融合蛋白表达sp-a和sp-dsp-a和sp-d是肺的基本为可溶性的固有免疫蛋白,其用于调查肺并与病原体结合,导致它们的中和、凝集和清除。它们也是各种免疫细胞和炎性免疫应答功能的重要调节物。sp-a或sp-d缺陷小鼠显示对包括rsv的病原体感染的增加的敏感性,以及感染性细菌攻击后的过度炎性反应。已经做出重大努力来开发重组形式的sp-a和sp-d以了解它们在人类呼吸疾病模型中的肺内的分子作用。重组sp-a和sp-d也可以具有用于治疗各种人类肺疾病的治疗潜力(salgado,d.等.frontimmunol5,623(2014))。三聚体的寡聚化增加了sp-a和sp-d对病原体表面上碳水化合物的亲和力。具有形成三聚体能力的较小片段也显示出活性,但与天然形式相比效率较低。迄今为止,全长sp-a和sp-d的异源表达仅在哺乳动物系统中成功,而在细菌和酵母系统中表达了截短的形式。将全长hsp-a1(uniprotid:q8iwl2)、hsp-a2(uniprotid:q8iwl1)和hsp-d(uniprotid:p35247)以及其截短的片段:hsp-a181-228和hsp-a281-228(silveyra,p.&floros,j.,gene531:126-132(2013);seqidno:47-48)、和hsp-d204-355(hakansson,k.等.structure7:255-264(1999);seqidno:49)与ntd40k/k65d融合(seqidno:70-75,由seqidno:76-81编码)表达。基本上根据实施例3,将这些融合蛋白在bl21或origami大肠杆菌细胞中克隆并在20℃表达过夜或在30℃表达4小时。实施例13-使用ntd40k/k65d融合蛋白表达淀粉样蛋白β(aβ)肽aβ肽负责形成与阿尔茨海默病相关的淀粉样蛋白斑块。这些肽通过用β和γ分泌酶进行蛋白水解裂解而从淀粉样蛋白前体蛋白(app)释放,并且可以聚集形成寡聚体或构成淀粉样蛋白斑块的更大的原纤维。已经使用合成肽广泛研究了aβ错折叠和原纤化的机制以及原纤维和中间的寡聚体状态的体外和体内毒性。已经通过在变性条件下从包涵体的提取证明使用细菌表达系统成功重组制备了aβ1-40和aβ1-42肽。然而,该方法不允许控制肽的寡聚体状态并要求后续的尺寸排阻色谱法以在分析之前获得单体级分。为了克服该限制,将aβ1-42(uniprotidp05067)与ntd40k/k65d融合(seqidno:82,由seqidno:83编码)表达。基本上根据实施例3,将该融合蛋白在bl21或origami大肠杆菌细胞中克隆并在20℃表达过夜或在30℃表达4小时。实施例14-使用ntd40k/k65d融合蛋白表达胰岛淀粉样蛋白多肽(iapp)胰岛淀粉样蛋白多肽(胰淀素或iapp;uniprotidp10997)是与胰岛素一起从胰腺β-细胞共分泌的肽激素,并且在调节血糖水平中具有重要作用。研究表明,由iapp形成的胰腺淀粉样蛋白与ii型糖尿病的发展相关。iapp被表达为称为proiapp的前肽,其在刺激后被加工成iapp。人类proiapp先前已经与trx溶解度标签融合重组表达,并通过在变性条件下从包涵体提取来纯化。重组人类iapp(hiapp)肽从许多商业来源可获得,并以与溶解度标签例如gst融合的形式或与bsa或ova缀合的形式递送以保持肽为可溶性的。将人类iapp与ntd40k/k65d融合(seqidno:84,由seqidno:85编码)表达。基本上根据实施例3,将该融合蛋白在bl21或origami大肠杆菌细胞中克隆并在20℃表达过夜或在30℃表达4小时。实施例15-使用ntd40k/k65d融合蛋白表达hcap18导管素(cathelicidin)是存在于脊椎动物嗜中性粒细胞颗粒中的抗微生物和内毒素结合蛋白家族。该家族的成员共有高度保守的12kdan端,称为cathelin-样结构域。生物功能结构域位于c端,并当通过丝氨酸蛋白酶从前蛋白裂解时变得被激活。仅有的人类形式的导管素,hcap18,是抗微生物肽ll-37的前蛋白,所述抗微生物肽ll-37通过用蛋白酶3的细胞外裂解释放。hcap18以与成熟肽ll-37相当的效率抑制革兰氏阴性细菌的生长。然而,hcap18的重组制备与低产量和未确定的溶解度相关,并且因此,需要重组制备的新策略。将无信号肽的hcap18分别与ntwt或ntd40k/k65d融合(seqidno:86-87,由seqidno:88-89编码)克隆。将两种融合蛋白在origami大肠杆菌细胞中在20℃表达过夜。图18显示在诱导之前(b)和在20℃表达过夜之后(a),表达的与ntwt或ntd40k/k65d融合的hcap18的sds-page分析。箭头指示对应于感兴趣的蛋白的预期条带。使用非变性的量的尿素(2m)、0.7%吐温或10%甘油作为缓冲液添加剂,以80%振幅、1s脉冲开启/断开持续总计2分钟进行声处理后,融合蛋白主要存在于离心后的可溶性级分中,不依赖于缓冲液添加剂。将融合蛋白在ni-sepharose上纯化,最终产量为约50mg/l培养物。实施例16-使用ntd40k/k65d融合蛋白表达呆蛋白γ-分泌酶蛋白复合物是一种四组分蛋白酶,负责加工淀粉样蛋白前体蛋白(app)并产生阿尔茨海默病相关的肽淀粉样蛋白β(aβ)。γ-分泌酶的活性和特异性的调节代表了用于治疗阿尔茨海默病的潜在治疗策略。组分之一,呆蛋白或nct,是具有大的细胞外结构域(ecd)的i型跨膜糖蛋白,其被认为在募集γ-分泌酶底物中起关键作用。迄今为止,还未报道全长呆蛋白ecd的异源大肠杆菌制备。将人类呆蛋白的ecd(uniprotid:q92542)与ntd40k/k65d融合(seqidno:90,由seqidno:91编码)表达。基本上根据实施例3,将该融合蛋白在bl21或origami大肠杆菌细胞中克隆并在20℃表达过夜或在30℃表达4小时。实施例17-使用ntd40k/k65d融合蛋白表达绿色荧光蛋白(gfp)当暴露于蓝色至紫外范围的光时,gfp呈现亮绿色荧光。由于允许在整个细胞中扩散而不干扰任何生物过程的相对小的尺寸,gfp经常用作表达的报告物。已经设计了许多不同的gfp突变体,且最重要的是,s65t突变显著增加了荧光和光稳定性。增强型gfp(egfp)是除s65t突变以外的f64l点突变的产物,其在37℃显示出提高的折叠效率并且允许在哺乳动物细胞中实际使用gfp。将egfp与ntwt和ntd40k/k65d融合(seqidno:92-93,由seqidno:94-95编码)克隆,并在bl21大肠杆菌细胞中在20℃表达过夜。将细胞通过溶菌酶处理而不是声处理破坏。这种方法对于溶解蛋白较不有效,但是是维持gfp荧光所需的,否则gfp荧光在声处理期间会部分损失。约30-40%的融合蛋白仍存在于离心之后的可溶性级分中,并且在ni-sepharose纯化期间回收了大部分蛋白。实施例18-与rsp-c33leu融合的ntd40k/k65d排布为胶束-样颗粒纯化的且可溶性的ntd40k/k65d-sp-c33leu融合蛋白(seqidno56)如实施例3-4中所述的获得,并经受尺寸排阻色谱法(sec)和透射电子显微术(tem)。对于tem,将纯化的且可溶性的ntd40k/k65d蛋白(seqidno:2)用作对照。尺寸排阻色谱法将纯化的融合蛋白在运行缓冲液(20mmtris,150mmnacl,1mmedta,ph8.0)中稀释至2mg/ml。将superdex200柱在运行缓冲液中平衡,并且将200μl样品以0.5ml/min的流速运行通过柱。通过测量在280nm处的吸光度来检测蛋白的洗脱。运行分子量标准物铁蛋白(440kda)、醛缩酶(158kda)、伴清蛋白(75kda)、卵清蛋白(43kda)、碳酸酐酶(29kda)和核糖核酸酶a(13.7kda)(gehealthcare)并分别在8.56ml、10.65ml、12.06ml、12.96ml、14.26ml和15.64ml洗脱。透射电子显微术将样品在20mmtris,ph8中稀释。对于负染色,将3μl样品应用于辉光放电碳涂覆的铜网格,用2%(w/v)乙酸铀酰染色并进行空气干燥。网格使用在200kv运行的jeoljem-2100f透射电子显微镜检查。使用标称放大倍数60000,用tvipstemcam-f4154kx4kccd照相机(tietzvideoandimageprocessingsystemsgmbh,gauting,germany)收集图像。虽然ntd40k/k65d-sp-c33leu单体具有19kda的计算的分子质量,图19中展示的sec分析显示具有估计尺寸为510kda的良好定义的寡聚体群体,对应于具有流体动力学半径约10nm的颗粒。使用负染色透射电子显微术(tem)证实存在尺寸为10-15nm的这样的胶束样颗粒。在图20中,图(a)负染色的ntd40k/k65d-sp-c33leu融合蛋白的tem显示10-15nm尺寸的颗粒。在图(b)中,将相同浓度的负染色的ntd40k/k65d蛋白的tem用作阴性对照。对于单独的ntd40k/k65d蛋白未观察到颗粒。实施例19(比较性)-包含ntwt和nta72r的融合蛋白的蛋白表达ep2644619a1公开了溶解度增强部分nta72r和包含其的融合蛋白。nta72r在ph6.4以下也为构成单体。根据实施例3-4将融合蛋白nta72r-sp-c33leu(seqidno:100)和ntwt-sp-c33leu(seqidno:57)在大肠杆菌bl21(de3)细胞中表达并纯化。通过sds-page分离获得的蛋白并用考马斯染色。研究不同的融合蛋白并发现每个细菌的表达(产生)水平顺序为ntwt-sp-c33leu>nta72r-sp-c33leu。总之,与ntwt相比,nta72r没有改进融合蛋白表达水平。实施例20-修饰的蛛丝蛋白的蛋白的表达和纯化将具有修饰的纤连蛋白来源的rgd环、fncc、重复部分和来自小壶状蛛丝蛋白(misp)的ct部分的蛛丝蛋白的蛋白分别与ntd40k/k65d和z融合(seqidno:101-102)克隆。还克隆了相同的融合蛋白(例外是具有来自大壶状蛛丝蛋白(masp)的ct部分)(seqidno:103-104)。为了测试修饰的蛛丝蛋白的蛋白的表达水平,将融合蛋白克隆到pt7表达载体中并转化到化学感受态大肠杆菌bl21(de3)细胞中。将含有质粒的细胞接种到含有50mg/l卡那霉素的150mllb培养基中,并在30℃和220rpm生长过夜。将5ml过夜培养物接种到含有卡那霉素的500mllb培养基中(1/100),并使细胞在30℃进一步生长至od~1。通过加入iptg至终浓度为0.3mm诱导细胞,并且表达在15℃过夜进行。表达19小时后,通过离心收获细胞,重悬于20mmtris-hcl,ph8中至40ml并在-20℃储存至少24小时。通过添加溶菌酶使细胞溶解。通过在21612×g,4℃离心30min分离可溶性和不溶性级分。在表达期间在诱导4小时和19小时后获取等于od600=1的一式两份培养物样品。通过在13000×g,4℃离心10min使样品沉淀,弃去上清液并将沉淀物在-20℃储存至少24h。使用cellyticbtm通过添加溶菌酶使沉淀的材料裂解。将每个时间点的一个样品用于分析可溶性和不溶性级分,其通过在13000×g,rt离心10min分离。其他样品用于全细胞分析而不分离可溶性和不溶性级分。向样品加入等量的还原性sds-page上样缓冲液,在95℃煮沸5min,且随后在12%丙烯酰胺凝胶上等量上样。使用iblotdryblottingsystem将蛋白转移至膜。将ibindtmwesterndevice用于使用荧光团标记的鸡抗his抗体进行印迹。使用liquorodyssey成像系统进行检测。为了从培养物澄清裂解物,加入nacl和咪唑至终浓度分别为500mm和20mm,并上样至预先用zn-sepharose(gehealthcare)填充并用上样缓冲液(20mmtris,20mm咪唑和500mmnacl,ph8)平衡的imac柱。用20mmtris-hcl,49mm咪唑,500mmnacl,ph8洗涤结合的蛋白,并用20mmtris-hcl,220mm咪唑,500mmnacl,ph8洗脱为以1ml计的级分。测量每个级分在280nm处的吸光度,并汇集富含蛋白的级分。使用具有6-8kda截留分子量的spectra/透析膜,通过在4℃和5l上样缓冲液中过夜透析去除咪唑。使用考马斯亮蓝染色的12%丙烯酰胺凝胶,通过sds-page确定每个步骤中蛋白的纯度。在-20℃储存后,将融合蛋白在4℃解冻,在4570×g离心10min并浓缩。将样品储存在4℃。在数值方面通过使用nanodroptm在3天的跨度内测量浓度以及在视觉方面通过使用用instantbluetm蛋白染色剂染色的12%丙烯酰胺凝胶的sds-page来评价稳定性。结论是,ntd40k/k65d在将高度易于聚集的纯化的蛛丝蛋白的蛋白保持在溶液中方面比z-标签更有效。实施例21-蛛丝蛋白融合蛋白的表达为了测试蛛丝蛋白融合蛋白的表达水平,将与4repct共价连接的igg片段scd40分别与ntd40k/k65d和z融合(seqidno:105-106)克隆到pt7表达载体中并转化到化学感受态大肠杆菌bl21(de3)细胞中。将含有质粒的细胞接种到含有50mg/l卡那霉素的150mllb培养基中,并在30℃和220rpm生长过夜。将5ml过夜培养物接种到含有卡那霉素的500mllb培养基中(1/100),并使细胞在30℃进一步生长至od~1。通过加入iptg至终浓度为0.3mm诱导细胞,并且表达在15℃过夜进行。表达19小时后,通过离心收获细胞,重悬于20mmtris-hcl,ph8中至40ml并在-20℃储存至少24小时。为了分别分析可溶性和不溶性级分中表达的蛋白的量,如实施例20中描述的获取培养物样品并使用蛋白印迹进行分析。实施例22-igg片段的表达将分别与ntd40k/k65d和z融合(seqidno:107-108)的与分选酶识别序列共价连接的igg片段scd40克隆到pt7表达载体中,并转化到化学感受态大肠杆菌bl21(de3)细胞中。将含有质粒的细胞接种到含有50mg/l卡那霉素的20mllb培养基中,并在30℃和220rpm生长过夜。将5ml过夜培养物接种到含有卡那霉素的500mllb培养基中(1/100),并使细胞在30℃进一步生长至od~1。通过加入iptg至终浓度为0.3mm诱导细胞,并且表达在15℃过夜进行。表达19小时后,通过离心收获细胞,重悬于20mmtris-hcl,ph8中至40ml并在-20℃储存至少24小时。为了分别分析可溶性和不溶性级分中表达的蛋白的量,如实施例20中描述的获取培养物样品并使用蛋白印迹进行分析。序列表<110>思百博技术股份公司<120>电荷逆转的n端蜘蛛丝蛋白结构域及其用途<130>pc-21086278<150>ep15194623<151>2015-11-13<150>ep16186679<151>2016-08-31<150>ep16193082<151>2016-10-10<160>108<170>patentinversion3.5<210>1<211>137<212>prt<213>euprosthenopsaustralis<220><221>变体<222>(40)..(40)<223>arg(r)<220><221>变体<222>(40)..(40)<223>his(h)<220><221>诱变剂<222>(40)..(40)<220><221>变体<222>(65)..(65)<223>glu(e)<220><221>诱变剂<222>(65)..(65)<400>1glyserglyasnserhisthrthrprotrpthrasnproglyleuala151015gluasnphemetasnserphemetglnglyleusersermetprogly202530phethralaserglnleuasplysmetserthrilealaglnsermet354045valglnserileglnserleualaalaglnglyargthrserproasn505560aspleuglnalaleuasnmetalaphealasersermetalagluile65707580alaalaserglugluglyglyglyserleuserthrlysthrserser859095ilealaseralametserasnalapheleuglnthrthrglyvalval100105110asnglnpropheileasngluilethrglnleuvalsermetpheala115120125glnalaglymetasnaspvalserala130135<210>2<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>2serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuasplysmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasnaspleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>3<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>3serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuaspargmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasnaspleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>4<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>4serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuasphismetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasnaspleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>5<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>5serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuasplysmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasngluleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>6<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>6serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuaspargmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasngluleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>7<211>133<212>prt<213>euprosthenopsaustralis<220><221>诱变剂<222>(36)..(36)<220><221>诱变剂<222>(61)..(61)<400>7serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuasphismetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasngluleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>8<211>399<212>dna<213>euprosthenopsaustralis<400>8tcacacactacaccatggacaaacccaggactcgcagaaaacttcatgaacagtttcatg60caaggcctgagctcgatgccaggtttcacggcaagccaattggataagatgtcaaccatc120gcacaatccatggtacagtcaatacaatccttggcggcacaaggcaggacatcaccgaat180gacctgcaggcccttaacatggcttttgcatcttcgatggcagaaatcgcggcatccgaa240gaaggagggggaagcctttccaccaaaactagctctatagccagtgcaatgtccaacgcg300tttctgcaaacaactggagtggtaaaccaaccgttcataaatgaaataactcagctcgtt360agcatgtttgctcaagcaggtatgaatgatgtcagtgct399<210>9<211>137<212>prt<213>euprosthenopsaustralis<220><221>变体<222>(6)..(6)<223>缺失(deltahis)<400>9glyserglyasnserhisthrthrprotrpthrasnproglyleuala151015gluasnphemetasnserphemetglnglyleusersermetprogly202530phethralaserglnleuaspaspmetserthrilealaglnsermet354045valglnserileglnserleualaalaglnglyargthrserproasn505560lysleuglnalaleuasnmetalaphealasersermetalagluile65707580alaalaserglugluglyglyglyserleuserthrlysthrserser859095ilealaseralametserasnalapheleuglnthrthrglyvalval100105110asnglnpropheileasngluilethrglnleuvalsermetpheala115120125glnalaglymetasnaspvalserala130135<210>10<211>131<212>prt<213>人工序列<220><223>衍生自蛛丝蛋白nt片段的共有序列<220><221>变体<222>(20)..(20)<223>leu<220><221>变体<222>(42)..(42)<223>asn<220><221>变体<222>(42)..(42)<223>gln<220><221>变体<222>(50)..(50)<223>ser<220><221>变体<222>(50)..(50)<223>lys<220><221>变体<222>(56)..(56)<223>arg<220><221>变体<222>(84)..(84)<223>leu<220><221>变体<222>(114)..(114)<223>ser<220><221>变体<222>(121)..(121)<223>asn<220><221>变体<222>(123)..(123)<223>leu<220><221>变体<222>(124)..(124)<223>ser<400>10glnalaasnthrprotrpserserproasnleualaaspalapheile151015asnserphemetseralaalaserserserglyalapheseralaasp202530glnleuaspaspmetserthrileglyaspthrleumetseralamet354045aspasnmetglyargserglylysserthrlysserlysleuglnala505560leuasnmetalaphealasersermetalagluilealaalaalaglu65707580serglyglyglyservalglyvallysthrasnalaileseraspala859095leuserseralaphetyrglnthrthrglyservalasnproglnphe100105110valasngluileargserleuileglymetphealaglnalaserala115120125asngluval130<210>11<211>133<212>prt<213>euprosthenopsaustralis<400>11serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuaspaspmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasnlysleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspvalserala130<210>12<211>399<212>dna<213>euprosthenopsaustralis<400>12tcacacactacaccatggacaaacccaggactcgcagaaaacttcatgaacagtttcatg60caaggcctgagctcgatgccaggtttcacggcaagccaattggatgatatgtcaaccatc120gcacaatccatggtacagtcaatacaatccttggcggcacaaggcaggacatcaccgaat180aagctgcaggcccttaacatggcttttgcatcttcgatggcagaaatcgcggcatccgaa240gaaggagggggaagcctttccaccaaaactagctctatagccagtgcaatgtccaacgcg300tttctgcaaacaactggagtggtaaaccaaccgttcataaatgaaataactcagctcgtt360agcatgtttgctcaagcaggtatgaatgatgtcagtgct399<210>13<211>131<212>prt<213>euprosthenopsaustralis<400>13serhisthrthrprotrpthrasnproglyleualagluasnphemet151015asnserphemetglnglyleusersermetproglyphethralaser202530glnleuaspaspmetserthrilealaglnsermetvalglnserile354045glnserleualaalaglnglyargthrserproasnlysleuglnala505560leuasnmetalaphealasersermetalagluilealaalaserglu65707580gluglyglyglyserleuserthrlysthrserserilealaserala859095metserasnalapheleuglnthrthrglyvalvalasnglnprophe100105110ileasngluilethrglnleuvalsermetphealaglnalaglymet115120125asnaspval130<210>14<211>127<212>prt<213>几何寇蛛(latrodectusgeometricus)<400>14glnalaasnthrprotrpserserlysglnasnalaaspalapheile151015seralaphemetthralaalaserglnserglyalapheserserasp202530glnileaspaspmetservalileserasnthrleumetalaalamet354045aspasnmetglyglyargilethrproserlysleuglnalaleuasp505560metalaphealaserservalalagluilealaalavalgluglygln65707580asnileglyvalthrthrasnalaileseraspalaleuthrserala859095phetyrglnthrthrglyvalvalasnasnlyspheilesergluile100105110argserleuileasnmetphealaglnalaseralaasnaspval115120125<210>15<211>127<212>prt<213>黑寡妇蜘蛛(latrodectushesperus)<400>15glnalaasnthrprotrpserserlysalaasnalaaspalapheile151015asnserpheileseralaalaserasnthrglyserpheserglnasp202530glnmetgluaspmetserleuileglyasnthrleumetalaalamet354045aspasnmetglyglyargilethrproserlysleuglnalaleuasp505560metalaphealaserservalalagluilealaalasergluglygly65707580aspleuglyvalthrthrasnalailealaaspalaleuthrserala859095phetyrglnthrthrglyvalvalasnserargpheilesergluile100105110argserleuileglymetphealaglnalaseralaasnaspval115120125<210>16<211>130<212>prt<213>金色圆网蛛(nephilaclavipes)<400>16glnasnthrprotrpserserthrgluleualaaspalapheileasn151015alaphemetasnglualaglyargthrglyalaphethralaaspgln202530leuaspaspmetserthrileglyaspthrilelysthralametasp354045lysmetalaargserasnlysserserlysglylysleuglnalaleu505560asnmetalaphealasersermetalagluilealaalavalglugln65707580glyglyleuservalaspalalysthrasnalailealaaspserleu859095asnseralaphetyrglnthrthrglyalaalaasnproglnpheval100105110asngluileargserleuileasnmetphealaglnserseralaasn115120125gluval130<210>17<211>131<212>prt<213>三带金蛛(argiopetrifasciata)<400>17glnglyalathrprotrpgluasnserglnleualagluserpheile151015serargpheleuargpheileglyglnserglyalapheserproasn202530glnleuaspaspmetserserileglyaspthrleulysthralaile354045glulysmetalaglnserarglysserserlysserlysleuglnala505560leuasnmetalaphealasersermetalagluilealavalalaglu65707580glnglyglyleuserleuglualalysthrasnalailealaserala859095leuseralaalapheleugluthrthrglytyrvalasnglnglnphe100105110valasngluilelysthrleuilephemetilealaglnalaserser115120125asngluile130<210>18<211>124<212>prt<213>几何寇蛛(latrodectusgeometricus)<400>18leuargtrpserserlysaspasnalaaspargpheileasnalaphe151015leuglnalaalaserasnserglyalapheserseraspglnvalasp202530aspmetservalileglyasnthrleumetthralametaspasnmet354045glyglyargilethrproserlysleuglnalaleuaspmetalaphe505560alaserservalalagluilealavalalaaspglyglnasnvalgly65707580glyalathrasnalaileserasnalaleuargseralaphetyrgln859095thrthrglyvalvalasnasnglnpheilesergluileserasnleu100105110ileasnmetphealaglnvalseralaasngluval115120<210>19<211>127<212>prt<213>黑寡妇蜘蛛(latrodectushesperus)<400>19glnalaasnthrprotrpserserlysgluasnalaaspalapheile151015glyalaphemetasnalaalaserglnserglyalapheserserasp202530glnileaspaspmetservalileserasnthrleumetalaalamet354045aspasnmetglyglyargilethrglnserlysleuglnalaleuasp505560metalaphealaserservalalagluilealavalalaaspglygln65707580asnvalglyalaalathrasnalaileseraspalaleuargserala859095phetyrglnthrthrglyvalvalasnasnglnpheilethrglyile100105110serserleuileglymetphealaglnvalserglyasngluval115120125<210>20<211>131<212>prt<213>马达加斯加红腿金色圆网蛛(nephilainauratamadagascariensis)<400>20glnalaasnthrprotrpseraspthralathralaaspalapheile151015glnasnpheleuglyalavalserglyserglyalaphethrproasp202530glnleuaspaspmetserthrvalglyaspthrilemetseralamet354045asplysmetalaargserasnlysserserlysserlysleuglnala505560leuasnmetalaphealasersermetalagluilealaalavalglu65707580glnglyglyglnsermetaspvallysthrasnalailealaasnala859095leuaspseralaphetyrmetthrthrglyserthrasnglnglnphe100105110valasnglumetargserleuileasnmetleuseralaalaalaval115120125asngluval130<210>21<211>131<212>prt<213>金色圆网蛛(nephilaclavipes)<400>21glnalaargserprotrpseraspthralathralaaspalapheile151015glnasnpheleualaalavalserglyserglyalaphethrserasp202530glnleuaspaspmetserthrileglyaspthrilemetseralamet354045asplysmetalaargserasnlysserserglnhislysleuglnala505560leuasnmetalaphealasersermetalagluilealaalavalglu65707580glnglyglymetsermetalavallysthrasnalailevalaspgly859095leuasnseralaphetyrmetthrthrglyalaalaasnproglnphe100105110valasnglumetargserleuilesermetileseralaalaserala115120125asngluval130<210>22<211>129<212>prt<213>横纹金蛛(argiopebruennichi)<400>22alavalproservalpheserserproasnleualaserglypheleu151015glncysleuthrpheglyileglyasnserproalapheprothrgln202530gluglnglnaspleuaspalailealaglnvalileleuasnalaval354045serserasnthrglyalathralaseralaargalaglnalaleuser505560thralaleualaserserleuthraspleuleuilealagluserala65707580gluserasntyrserasnglnleusergluleuthrglyileleuser859095aspcyspheileglnthrthrglyseraspasnproalaphevalser100105110argileglnserleuileservalleuserglnasnalaaspthrasn115120125ile<210>23<211>129<212>prt<213>棒络新妇(nephilaclavata)<400>23provalproservalpheserserproserleualaserglypheleu151015glycysleuthrthrglyileglyleuserproalapheprophegln202530gluglnglnaspleuaspaspleualalysvalileleuseralaval354045thrserasnthraspthrserlysseralaargalaglnalaleuser505560thralaleualaserserleualaaspleuleuilesergluserser65707580glysersertyrglnthrglnileseralaleuthrasnileleuser859095aspcysphevalthrthrthrglyserasnasnproalaphevalser100105110argvalglnthrleuileglyvalleuserglnserserserasnala115120125ile<210>24<211>128<212>prt<213>黑寡妇蜘蛛(latrodectushesperus)<400>24alaservalasnilepheasnserproasnalaalathrserpheleu151015asncysleuargserasnilegluserserproalapheprophegln202530gluglnalaaspleuaspserilealagluvalileleuseraspval354045serservalasnthralaserseralathrserleualaleuserthr505560alaleualaserserleualagluleuleuvalthrgluseralaglu65707580gluaspileaspasnglnvalvalalaleuserthrileleusergln859095cysphevalgluthrthrglyserproasnproalaphevalalaser100105110vallysserleuleuglyvalleuserglnseralaserasntyrglu115120125<210>25<211>130<212>prt<213>金色圆网蛛(nephilaclavipes)<400>25ilealaasnserpropheserasnproasnthralaglualapheala151015argserphevalserasnilevalserserglyglupheglyalagln202530glyalagluasppheaspaspileileglnserleuileglnalagln354045sermetglylysglyarghisaspthrlysalalysalalysalamet505560glnvalalaleualaserserilealagluleuvalilealagluser65707580serglyglyaspvalglnarglysthrasnvalileserasnalaleu859095argasnalaleumetserthrthrglyserproasngluglupheval100105110hisgluvalglnaspleuileglnmetleuserglngluglnileasn115120125gluval130<210>26<211>130<212>prt<213>马达加斯加红腿金色圆网蛛(nephilainauratamadagascariensis)<400>26ilevalasnserpropheserasnproasnthralaglualapheala151015argserphevalserasnvalvalserserglyglupheglyalagln202530glyalagluasppheaspaspileileglnserleuileglnalagln354045sermetglylysglyarghisaspthrlysalalysalalysalamet505560glnvalalaleualaserserilealagluleuvalilealagluser65707580serglyglyaspvalglnarglysthrasnvalileserasnalaleu859095argasnalaleumetserthrthrglyserproasngluglupheval100105110hisgluvalglnaspleuileglnmetleuserglngluglnileasn115120125gluval130<210>27<211>80<212>prt<213>人工序列<220><223>设计的多肽<400>27metglygluglnlysleuileserglugluaspleuglymetglnile151015sermetasptyrgluilelysphehisglyaspglyaspasnpheasp202530leuasnleuaspaspserglyglyaspleuglnleuglnilearggly354045proglyglyargvalhisvalhisilehisserserserglylysval505560aspphehisvalasnasnaspglyglyaspvalgluvallysmethis65707580<210>28<211>79<212>prt<213>智人(homosapiens)<220><221>disulfid<222>(8)..(77)<220><221>disulfid<222>(11)..(71)<220><221>disulfid<222>(35)..(46)<220><221>disulfid<222>(48)..(48)<223>分子间cys48-cys48键<400>28pheproileproleuprotyrcystrpleucysargalaleuilelys151015argileglnalametileprolysglyalaleualavalalavalala202530glnvalcysargvalvalproleuvalalaglyglyilecysglncys354045leualagluargtyrservalileleuleuaspthrleuleuglyarg505560metleuproglnleuvalcysargleuvalleuargcyssermet657075<210>29<211>79<212>prt<213>小家鼠(musmusculus)<220><221>disulfid<222>(8)..(77)<220><221>disulfid<222>(11)..(71)<220><221>disulfid<222>(35)..(46)<220><221>disulfid<222>(48)..(48)<223>分子间cys48-cys48键<400>29leuproileproleuprophecystrpleucysargthrleuilelys151015argvalglnalavalileprolysglyvalleualavalalavalser202530glnvalcyshisvalvalproleuvalvalglyglyilecysglncys354045leualagluargtyrthrvalleuleuleuaspalaleuleuglyarg505560valvalproglnleuvalcysglyleuvalleuargcysserthr657075<210>30<211>79<212>prt<213>野猪(susscrofa)<220><221>disulfid<222>(8)..(77)<220><221>disulfid<222>(11)..(71)<220><221>disulfid<222>(35)..(46)<220><221>disulfid<222>(48)..(48)<223>分子间cys48-cys48键<400>30pheproileproleuprophecystrpleucysargthrleuilelys151015argileglnalavalvalprolysglyvalleuleulysalavalala202530glnvalcyshisvalvalproleuprovalglyglyilecysglncys354045leualagluargtyrilevalilecysleuasnmetleuleuasparg505560thrleuproglnleuvalcysglyleuvalleuargcysserser657075<210>31<211>79<212>prt<213>家兔(oryctolaguscuniculus)<220><221>disulfid<222>(8)..(77)<220><221>disulfid<222>(11)..(71)<220><221>disulfid<222>(35)..(46)<220><221>disulfid<222>(48)..(48)<223>分子间cys48-cys48键<400>31pheproileproleuproleucystrpleucysargthrleuleulys151015argileglnalametileprolysglyvalleualametalavalala202530glnvalcyshisvalvalproleuvalvalglyglyilecysglncys354045leualagluargtyrthrvalileleuleugluvalleuleuglyhis505560valleuproglnleuvalcysglyleuvalleuargcysserser657075<210>32<211>79<212>prt<213>褐家鼠(rattusnorvegicus)<220><221>disulfid<222>(8)..(77)<220><221>disulfid<222>(11)..(71)<220><221>disulfid<222>(35)..(46)<220><221>disulfid<222>(48)..(48)<223>分子间cys48-cys48键<400>32leuproileproleuprophecystrpleucysargthrleuilelys151015argvalglnalavalileprolysglyvalleualavalalavalser202530glnvalcyshisvalvalproleuvalvalglyglyilecysglncys354045leualagluargtyrthrvalleuleuleuaspalaleuleuglyarg505560valvalproglnleuvalcysglyleuvalleuargcysserthr657075<210>33<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(1)..(33)<220><221>disulfid<222>(4)..(27)<400>33cystrpleucysargalaleuilelysargileglnalametilepro151015lysglyglyargmetleuproglnleuvalcysargleuvalleuarg202530cysser<210>34<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(1)..(33)<220><221>disulfid<222>(4)..(27)<400>34cystrpleucysargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalcysargleuvalleuarg202530cysser<210>35<211>27<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(1)..(27)<220><221>disulfid<222>(4)..(21)<400>35cysleuleucysargalaleuilelysargpheasnargtyrleuthr151015proglnleuvalcysargleuvalleuargcys2025<210>36<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(1)..(33)<400>36cystrpleualaargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalalaargleuvalleuarg202530cysser<210>37<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(4)..(27)<400>37alatrpleucysargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalcysargleuvalleuarg202530alaser<210>38<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(1)..(33)<400>38cystrpleuleuargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalleuargleuvalleuarg202530cysser<210>39<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<220><221>disulfid<222>(4)..(27)<400>39leutrpleucysargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalcysargleuvalleuarg202530leuser<210>40<211>35<212>prt<213>智人(homosapiens)<400>40pheglyileprocyscysprovalhisleulysargleuleuileval151015valvalvalvalvalleuilevalvalvalilevalglyalaleuleu202530metglyleu35<210>41<211>35<212>prt<213>人工序列<220><223>衍生自sp-c的构建体<400>41pheglyileproserserprovalhisleulysargleulysleuleu151015leuleuleuleuleuleuileleuleuleuileleuglyalaleuleu202530metglyleu35<210>42<211>33<212>prt<213>人工序列<220><223>衍生自sp-c的构建体<400>42ileproserserprovalhisleulysargleulysleuleuleuleu151015leuleuleuleuileleuleuleuileleuglyalaleuleumetgly202530leu<210>43<211>30<212>prt<213>人工序列<220><223>衍生自sp-c的构建体<400>43ileproserserprovalhisleulysargleulysleuleuleuleu151015leuleuleuleuileleuleuleuileleuglyalaleuleu202530<210>44<211>33<212>prt<213>人工序列<220><223>衍生自sp-c的构建体<400>44ileproserserprovalhisleulysargleulysleuleuleuleu151015leuleuleuleuileleuleuleuileleuglyalaleuleuleugly202530leu<210>45<211>37<212>prt<213>智人(homosapiens)<400>45leuleuglyaspphephearglysserlysglulysileglylysglu151015phelysargilevalglnargilelysasppheleuargasnleuval202530proargthrgluser35<210>46<211>21<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<400>46lysleuleuleuleulysleuleuleuleulysleuleuleuleulys151015leuleuleuleulys20<210>47<211>148<212>prt<213>智人(homosapiens)<400>47alahisleuaspglugluleuglnalathrleuhisaspphearghis151015glnileleuglnthrargglyalaleuserleuglnglyserilemet202530thrvalglyglulysvalpheserserasnglyglnserilethrphe354045aspalaileglnglualacysalaargalaglyglyargilealaval505560proargasnproglugluasnglualailealaserphevallyslys65707580tyrasnthrtyralatyrvalglyleuthrgluglyproserprogly859095asppheargtyrseraspglythrprovalasntyrthrasntrptyr100105110argglygluproalaglyargglylysgluglncysvalglumettyr115120125thraspglyglntrpasnaspargasncysleutyrserargleuthr130135140ilecysgluphe145<210>48<211>148<212>prt<213>智人(homosapiens)<400>48alahisleuaspglugluleuglnalathrleuhisaspphearghis151015glnileleuglnthrargglyalaleuserleuglnglyserilemet202530thrvalglyglulysvalpheserserasnglyglnserilethrphe354045aspalaileglnglualacysalaargalaglyglyargilealaval505560proargasnproglugluasnglualailealaserphevallyslys65707580tyrasnthrtyralatyrvalglyleuthrgluglyproserprogly859095asppheargtyrseraspglythrprovalasntyrthrasntrptyr100105110argglygluproalaglyargglylysgluglncysvalglumettyr115120125thraspglyglntrpasnaspargasncysleutyrserargleuthr130135140ilecysgluphe145<210>49<211>152<212>prt<213>智人(homosapiens)<400>49valalaserleuargglnglnvalglualaleuglnglyglnvalgln151015hisleuglnalaalapheserglntyrlyslysvalgluleuphepro202530asnglyglnservalglyglulysilephelysthralaglypheval354045lysprophethrglualaglnleuleucysthrglnalaglyglygln505560leualaserproargseralaalagluasnalaalaleuglnglnleu65707580valvalalalysasnglualaalapheleusermetthraspserlys859095thrgluglylysphethrtyrprothrglygluserleuvaltyrser100105110asntrpalaproglygluproasnaspaspglyglysergluaspcys115120125valgluilephethrasnglylystrpasnaspargalacysglyglu130135140lysargleuvalvalcysgluphe145150<210>50<211>119<212>prt<213>智人(homosapiens)<400>50glnthrileglugluasnilelysilepheglugluglugluvalglu151015pheileservalprovalprogluphealaaspseraspproalaasn202530ilevalhisasppheasnlyslysleuthralatyrleuaspleuasn354045leuasplyscystyrvalileproleuasnthrserilevalmetpro505560proargasnleuleugluleuleuileasnilelysalaglythrtyr65707580leuproglnsertyrleuilehisgluhismetvalilethrasparg859095ilegluasnileasphisleuglyphepheiletyrargleucyshis100105110asplysgluthrtyrlysleu115<210>51<211>398<212>prt<213>智人(homosapiens)<400>51glyproasnserthrglyalathrserprogluglualailealaasp151015leuservalasnmettyrasnargleuargalathrglygluaspglu202530asnileleupheserproleuserilealaleualametglymetmet354045gluleuglyalaglnglyserthrglnlysgluilearghissermet505560glytyraspserleulysasnglygluglupheserpheleulysglu65707580pheserasnmetvalthralalysgluserglntyrvalmetlysile859095alaasnserleuphevalglnasnglyphehisvalasnglugluphe100105110leuglnmetmetlyslystyrpheasnalaalavalasnhisvalasp115120125pheserglnasnvalalavalalaasntyrileasnlystrpvalglu130135140asnasnthrasnasnleuvallysaspleuvalserproargaspphe145150155160aspalaalathrtyrleualaleuileasnalavaltyrphelysgly165170175asntrplysserglnpheargprogluasnthrargthrpheserphe180185190thrlysaspaspglusergluvalglnileprometmettyrglngln195200205glygluphetyrtyrglyglupheseraspglyserasnglualagly210215220glyiletyrglnvalleugluileprotyrgluglyaspgluileser225230235240metmetleuvalleuserargglngluvalproleualathrleuglu245250255proleuvallysalaglnleuvalgluglutrpalaasnservallys260265270lysglnlysvalgluvaltyrleuproargphethrvalgluglnglu275280285ileaspleulysaspvalleulysalaleuglyilethrgluilephe290295300ilelysaspalaasnleuthrglyleuseraspasnlysgluilephe305310315320leuserlysalailehislysserpheleugluvalasngluglugly325330335serglualaalaalavalserglymetilealaileserargmetala340345350valleutyrproglnvalilevalasphisprophephepheleuile355360365argasnargargthrglythrileleuphemetglyargvalmethis370375380progluthrmetasnthrserglyhisasppheglugluleu385390395<210>52<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<400>52alatrpleualaargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalalaargleuvalleuarg202530alaser<210>53<211>34<212>prt<213>人工序列<220><223>衍生自sp-b的构建体<400>53leutrpleuleuargalaleuilelysargileglnalaleuilepro151015lysglyglyargleuleuproglnleuvalleuargleuvalleuarg202530leuser<210>54<211>243<212>prt<213>维多利亚多管水母(aequoreavictoria)<400>54glyproasnserlysglyglugluleuphethrglyvalvalproile151015leuvalgluleuaspglyaspvalasnglyhislyspheservalser202530glygluglygluglyaspalathrtyrglylysleuthrleulysphe354045ilecysthrthrglylysleuprovalprotrpprothrleuvalthr505560thrleuthrtyrglyvalglncyspheserargtyrproasphismet65707580lysglnhisaspphephelysseralametprogluglytyrvalgln859095gluargthrilephephelysaspaspglyasntyrlysthrargala100105110gluvallysphegluglyaspthrleuvalasnargilegluleulys115120125glyileaspphelysgluaspglyasnileleuglyhislysleuglu130135140tyrasntyrasnserhisasnvaltyrilemetalaasplysglnlys145150155160asnglyilelysvalasnphelysilearghisasnilegluaspgly165170175servalglnleualaasphistyrglnglnasnthrproileglyasp180185190glyprovalleuleuproaspasnhistyrleuserthrglnserala195200205leuserlysaspproasnglulysargasphismetvalleuleuglu210215220phevalthralaalaglyilethrleuglymetaspgluleutyrlys225230235240leuileasn<210>55<211>239<212>prt<213>人工序列<220><223>修饰的gfp<400>55lysglyglugluleuphethrglyvalvalproileleuvalgluleu151015aspglyaspvalasnglyhislyspheservalserglygluglyglu202530glyaspalathrtyrglylysleuthrleulyspheilecysthrthr354045glylysleuprovalprotrpprothrleuvalthrthrleuthrtyr505560glyvalglncyspheserargtyrproasphismetlysglnhisasp65707580phephelysseralametprogluglytyrvalglngluargthrile859095phephelysaspaspglyasntyrlysthrargalagluvallysphe100105110gluglyaspthrleuvalasnargilegluleulysglyileaspphe115120125lysgluaspglyasnileleuglyhislysleuglutyrasntyrasn130135140serhisasnvaltyrilemetalaasplysglnlysasnglyilelys145150155160valasnphelysilearghisasnilegluaspglyservalglnleu165170175alaasphistyrglnglnasnthrproileglyaspglyprovalleu180185190leuproaspasnhistyrleuserthrglnseralaleuserlysasp195200205proasnglulysargasphismetvalleuleugluphevalthrala210215220alaglyilethrleuglymetaspgluleutyrlysleuileasn225230235<210>56<211>179<212>prt<213>人工序列<220><223>融合蛋白<400>56metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140sermetileproserserprovalhisleulysargleulysleuleu145150155160leuleuleuleuleuleuileleuleuleuileleuglyalaleuleu165170175leuglyleu<210>57<211>179<212>prt<213>人工序列<220><223>融合蛋白<400>57metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140sermetileproserserprovalhisleulysargleulysleuleu145150155160leuleuleuleuleuleuileleuleuleuileleuglyalaleuleu165170175leuglyleu<210>58<211>537<212>dna<213>人工序列<220><223>融合蛋白<400>58atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattctatgattccgagcagcccggtgcatctgaaacgcctgaaactgctg480ctgctgctgctgctgctgattctgctgctgattctgggcgcgctgctgctgggcctg537<210>59<211>537<212>dna<213>人工序列<220><223>融合蛋白<400>59atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggatgatatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaataagctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattctatgattccgagcagcccggtgcatctgaaacgcctgaaactgctg480ctgctgctgctgctgctgattctgctgctgattctgggcgcgctgctgctgggcctg537<210>60<211>167<212>prt<213>人工序列<220><223>融合蛋白<400>60metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140sermetlysleuleuleuleulysleuleuleuleulysleuleuleu145150155160leulysleuleuleuleulys165<210>61<211>167<212>prt<213>人工序列<220><223>融合蛋白<400>61metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140sermetlysleuleuleuleulysleuleuleuleulysleuleuleu145150155160leulysleuleuleuleulys165<210>62<211>501<212>dna<213>人工序列<220><223>融合蛋白<400>62atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattctatgaaactgcttctgctgaaactcctgttattgaaactactgctg480ttgaaactcctgctgttaaag501<210>63<211>501<212>dna<213>人工序列<220><223>融合蛋白<400>63atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggatgatatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaataagctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattctatgaaactgcttctgctgaaactcctgttattgaaactactgctg480ttgaaactcctgctgttaaag501<210>64<211>231<212>prt<213>人工序列<220><223>融合蛋白<400>64metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglysermetglygluglnlysleuileserglu145150155160gluaspleuglymetglnilesermetasptyrgluilelysphehis165170175glyaspglyaspasnpheaspleuasnleuaspaspserglyglyasp180185190leuglnleuglnileargglyproglyglyargvalhisvalhisile195200205hisserserserglylysvalaspphehisvalasnasnaspglygly210215220aspvalgluvallysmethis225230<210>65<211>693<212>dna<213>人工序列<220><223>融合蛋白<400>65atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctatgggcgaacagaagttaatctccgag480gaggacttgggaatgcagatcagcatggactatgaaattaaatttcacggggatggcgat540aatttcgacctcaatctggatgattcggggggcgatctgcagctgcaaattcgtggtccg600ggcggtcgcgttcatgtacacattcactcaagttctggcaaagtggactttcatgtcaac660aacgatggtggtgatgttgaagtgaaaatgcat693<210>66<211>270<212>prt<213>人工序列<220><223>融合蛋白<400>66metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserglnthrileglugluasnilelysile145150155160pheglugluglugluvalglupheileservalprovalprogluphe165170175alaaspseraspproalaasnilevalhisasppheasnlyslysleu180185190thralatyrleuaspleuasnleuasplyscystyrvalileproleu195200205asnthrserilevalmetproproargasnleuleugluleuleuile210215220asnilelysalaglythrtyrleuproglnsertyrleuilehisglu225230235240hismetvalilethraspargilegluasnileasphisleuglyphe245250255pheiletyrargleucyshisasplysgluthrtyrlysleu260265270<210>67<211>270<212>prt<213>人工序列<220><223>融合蛋白<400>67metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserglnthrileglugluasnilelysile145150155160pheglugluglugluvalglupheileservalprovalprogluphe165170175alaaspseraspproalaasnilevalhisasppheasnlyslysleu180185190thralatyrleuaspleuasnleuasplyscystyrvalileproleu195200205asnthrserilevalmetproproargasnleuleugluleuleuile210215220asnilelysalaglythrtyrleuproglnsertyrleuilehisglu225230235240hismetvalilethraspargilegluasnileasphisleuglyphe245250255pheiletyrargleucyshisasplysgluthrtyrlysleu260265270<210>68<211>810<212>dna<213>人工序列<220><223>融合蛋白<400>68atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctcagacaattgaagaaaatattaaaatc480tttgaagaagaagaagttgaatttatcagtgtgcctgtcccagagtttgcagatagtgat540cctgccaacattgttcatgactttaacaagaaacttacagcctatttagatcttaacctg600gataagtgctatgtgatccctctgaacacttccattgttatgccacccagaaacctactg660gagttacttattaacatcaaggctggaacctatttgcctcagtcctatctgattcatgag720cacatggttattactgatcgcattgaaaacattgatcacctgggtttctttatttatcga780ctgtgtcatgacaaggaaacttacaaactg810<210>69<211>810<212>dna<213>人工序列<220><223>融合蛋白<400>69atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggatgatatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaataagctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctcagacaattgaagaaaatattaaaatc480tttgaagaagaagaagttgaatttatcagtgtgcctgtcccagagtttgcagatagtgat540cctgccaacattgttcatgactttaacaagaaacttacagcctatttagatcttaacctg600gataagtgctatgtgatccctctgaacacttccattgttatgccacccagaaacctactg660gagttacttattaacatcaaggctggaacctatttgcctcagtcctatctgattcatgag720cacatggttattactgatcgcattgaaaacattgatcacctgggtttctttatttatcga780ctgtgtcatgacaaggaaacttacaaactg810<210>70<211>380<212>prt<213>人工序列<220><223>融合蛋白<400>70metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglygluvallysaspvalcysvalgly145150155160serproglyileproglythrproglyserhisglyleuproglyarg165170175aspglyargaspglyleulysglyaspproglyproproglypromet180185190glyproproglyglumetprocysproproglyasnaspglyleupro195200205glyalaproglyileproglyglucysglyglulysglygluprogly210215220gluargglyproproglyleuproalahisleuaspglugluleugln225230235240alathrleuhisaspphearghisglnileleuglnthrargglyala245250255leuserleuglnglyserilemetthrvalglyglulysvalpheser260265270serasnglyglnserilethrpheaspalaileglnglualacysala275280285argalaglyglyargilealavalproargasnproglugluasnglu290295300alailealaserphevallyslystyrasnthrtyralatyrvalgly305310315320leuthrgluglyproserproglyasppheargtyrseraspglythr325330335provalasntyrthrasntrptyrargglygluproalaglyarggly340345350lysgluglncysvalglumettyrthraspglyglntrpasnasparg355360365asncysleutyrserargleuthrilecysgluphe370375380<210>71<211>380<212>prt<213>人工序列<220><223>融合蛋白<400>71metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglygluvallysaspvalcysvalgly145150155160serproglyileproglythrproglyserhisglyleuproglyarg165170175aspglyargaspglyvallysglyaspproglyproproglypromet180185190glyproproglygluthrprocysproproglyasnasnglyleupro195200205glyalaproglyvalproglygluargglyglulysglygluprogly210215220gluargglyproproglyleuproalahisleuaspglugluleugln225230235240alathrleuhisaspphearghisglnileleuglnthrargglyala245250255leuserleuglnglyserilemetthrvalglyglulysvalpheser260265270serasnglyglnserilethrpheaspalaileglnglualacysala275280285argalaglyglyargilealavalproargasnproglugluasnglu290295300alailealaserphevallyslystyrasnthrtyralatyrvalgly305310315320leuthrgluglyproserproglyasppheargtyrseraspglythr325330335provalasntyrthrasntrptyrargglygluproalaglyarggly340345350lysgluglncysvalglumettyrthraspglyglntrpasnasparg355360365asncysleutyrserargleuthrilecysgluphe370375380<210>72<211>507<212>prt<213>人工序列<220><223>融合蛋白<400>72metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglyalaglumetlysthrtyrserhis145150155160argthrmetproseralacysthrleuvalmetcysserservalglu165170175serglyleuproglyargaspglyargaspglyarggluglyproarg180185190glyglulysglyaspproglyleuproglyalaalaglyglnalagly195200205metproglyglnalaglyprovalglyprolysglyaspasnglyser210215220valglygluproglyprolysglyaspthrglyproserglypropro225230235240glyproproglyvalproglyproalaglyarggluglyproleugly245250255lysglnglyasnileglyproglnglylysproglyprolysglyglu260265270alaglyprolysglygluvalglyalaproglymetglnglyserala275280285glyalaargglyleualaglyprolysglygluargglyvalprogly290295300gluargglyvalproglyasnthrglyalaalaglyseralaglyala305310315320metglyproglnglyserproglyalaargglyproproglyleulys325330335glyasplysglyileproglyasplysglyalalysglyglusergly340345350leuproaspvalalaserleuargglnglnvalglualaleuglngly355360365glnvalglnhisleuglnalaalapheserglntyrlyslysvalglu370375380leupheproasnglyglnservalglyglulysilephelysthrala385390395400glyphevallysprophethrglualaglnleuleucysthrglnala405410415glyglyglnleualaserproargseralaalagluasnalaalaleu420425430glnglnleuvalvalalalysasnglualaalapheleusermetthr435440445aspserlysthrgluglylysphethrtyrprothrglygluserleu450455460valtyrserasntrpalaproglygluproasnaspaspglyglyser465470475480gluaspcysvalgluilephethrasnglylystrpasnaspargala485490495cysglyglulysargleuvalvalcysgluphe500505<210>73<211>300<212>prt<213>人工序列<220><223>融合蛋白<400>73metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglyalahisleuaspglugluleugln145150155160alathrleuhisaspphearghisglnileleuglnthrargglyala165170175leuserleuglnglyserilemetthrvalglyglulysvalpheser180185190serasnglyglnserilethrpheaspalaileglnglualacysala195200205argalaglyglyargilealavalproargasnproglugluasnglu210215220alailealaserphevallyslystyrasnthrtyralatyrvalgly225230235240leuthrgluglyproserproglyasppheargtyrseraspglythr245250255provalasntyrthrasntrptyrargglygluproalaglyarggly260265270lysgluglncysvalglumettyrthraspglyglntrpasnasparg275280285asncysleutyrserargleuthrilecysgluphe290295300<210>74<211>300<212>prt<213>人工序列<220><223>融合蛋白<400>74metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglyalahisleuaspglugluleugln145150155160alathrleuhisaspphearghisglnileleuglnthrargglyala165170175leuserleuglnglyserilemetthrvalglyglulysvalpheser180185190serasnglyglnserilethrpheaspalaileglnglualacysala195200205argalaglyglyargilealavalproargasnproglugluasnglu210215220alailealaserphevallyslystyrasnthrtyralatyrvalgly225230235240leuthrgluglyproserproglyasppheargtyrseraspglythr245250255provalasntyrthrasntrptyrargglygluproalaglyarggly260265270lysgluglncysvalglumettyrthraspglyglntrpasnasparg275280285asncysleutyrserargleuthrilecysgluphe290295300<210>75<211>304<212>prt<213>人工序列<220><223>融合蛋白<400>75metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuglualaleupheglnglyvalalaserleuargglnglnval145150155160glualaleuglnglyglnvalglnhisleuglnalaalaphesergln165170175tyrlyslysvalgluleupheproasnglyglnservalglyglulys180185190ilephelysthralaglyphevallysprophethrglualaglnleu195200205leucysthrglnalaglyglyglnleualaserproargseralaala210215220gluasnalaalaleuglnglnleuvalvalalalysasnglualaala225230235240pheleusermetthraspserlysthrgluglylysphethrtyrpro245250255thrglygluserleuvaltyrserasntrpalaproglygluproasn260265270aspaspglyglysergluaspcysvalgluilephethrasnglylys275280285trpasnaspargalacysglyglulysargleuvalvalcysgluphe290295300<210>76<211>1140<212>dna<213>人工序列<220><223>融合蛋白<400>76atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgaagtgaaggacgtttgtgttgga480agccctggtatccccggcactcctggatcccacggcctgccaggcagggacgggagagat540ggtctcaaaggagaccctggccctccaggccccatgggtccgcctggagaaatgccatgt600cctcctggaaatgatgggctgcctggagcccctggtatccctggagagtgtggagagaag660ggggagcctggcgagaggggccctccagggcttccagctcatctagatgaggagctccaa720gccacactccacgactttagacatcaaatcctgcagacaaggggagccctcagtctgcag780ggctccataatgacggtaggagagaaggtcttctccagcaatgggcagtccatcactttt840gatgccattcaggaggcatgtgccagagcaggcggccgcattgctgtcccaaggaatcca900gaggaaaatgaggccattgcaagcttcgtgaagaagtacaacacatatgcctatgtaggc960ctgactgagggtcccagccctggagacttccgctactcagacgggacccctgtaaactac1020accaactggtaccgaggggagcccgcaggtcggggaaaagagcagtgtgtggagatgtac1080acagatgggcagtggaatgacaggaactgcctgtactcccgactgaccatctgtgagttc1140<210>77<211>1140<212>dna<213>人工序列<220><223>融合蛋白<400>77atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgaagtgaaggacgtttgtgttgga480agccctggtatccccggcactcctggatcccacggcctgccaggcagggacgggagagat540ggtgtcaaaggagaccctggccctccaggccccatgggtccgcctggagaaacaccatgt600cctcctgggaataatgggctgcctggagcccctggtgtccctggagagcgtggagagaag660ggggagcctggcgagagaggccctccagggcttccagctcatctagatgaggagctccaa720gccacactccacgacttcagacatcaaatcctgcagacaaggggagccctcagtctgcag780ggctccataatgacagtaggagagaaggtcttctccagcaatgggcagtccatcactttt840gatgccattcaggaggcatgtgccagagcaggcggccgcattgctgtcccaaggaatcca900gaggaaaatgaggccattgcaagcttcgtgaagaagtacaacacatatgcctatgtaggc960ctgactgagggtcccagccctggagacttccgctactcagatgggacccctgtaaactac1020accaactggtaccgaggggagcctgcaggtcggggaaaagagcagtgtgtggagatgtac1080acagatgggcagtggaatgacaggaactgcctgtactcccgactgaccatctgtgagttc1140<210>78<211>1521<212>dna<213>人工序列<220><223>融合蛋白<400>78atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgcagaaatgaagacctactcccac480agaacaatgcccagtgcttgcaccctggtcatgtgtagctcagtggagagtggcctgcct540ggtcgcgatggacgggatgggagagagggccctcggggcgagaagggggacccaggtttg600ccaggagctgcagggcaagcagggatgcctggacaagctggcccagttgggcccaaaggg660gacaatggctctgttggagaacctggaccaaagggagacactgggccaagtggacctcca720ggacctcccggtgtgcctggtccagctggaagagaaggtcccctggggaagcaggggaac780ataggacctcagggcaagccaggcccaaaaggagaagctgggcccaaaggagaagtaggt840gccccaggcatgcagggctcggcaggggcaagaggcctcgcaggccctaagggagagcga900ggtgtccctggtgagcgtggagtccctggaaacacaggggcagcagggtctgctggagcc960atgggtccccagggaagtccaggtgccaggggacccccgggattgaagggggacaaaggc1020attcctggagacaaaggagcaaagggagaaagtgggcttccagatgttgcttctctgagg1080cagcaggttgaggccttacagggacaagtacagcacctccaggctgctttctctcagtat1140aagaaagttgagctcttcccaaatggccaaagtgtcggggagaagattttcaagacagca1200ggctttgtaaaaccatttacggaggcacagctgctgtgcacacaggctggtggacagttg1260gcctctccacgctctgccgctgagaatgccgccttgcaacagctggtcgtagctaagaac1320gaggctgctttcctgagcatgactgattccaagacagagggcaagttcacctaccccaca1380ggagagtccctggtctattccaactgggccccaggggagcccaacgatgatggcgggtca1440gaggactgtgtggagatcttcaccaatggcaagtggaatgacagggcttgtggagaaaag1500cgtcttgtggtctgcgagttc1521<210>79<211>900<212>dna<213>人工序列<220><223>融合蛋白<400>79atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgctcatctagatgaggagctccaa480gccacactccacgactttagacatcaaatcctgcagacaaggggagccctcagtctgcag540ggctccataatgacggtaggagagaaggtcttctccagcaatgggcagtccatcactttt600gatgccattcaggaggcatgtgccagagcaggcggccgcattgctgtcccaaggaatcca660gaggaaaatgaggccattgcaagcttcgtgaagaagtacaacacatatgcctatgtaggc720ctgactgagggtcccagccctggagacttccgctactcagacgggacccctgtaaactac780accaactggtaccgaggggagcccgcaggtcggggaaaagagcagtgtgtggagatgtac840acagatgggcagtggaatgacaggaactgcctgtactcccgactgaccatctgtgagttc900<210>80<211>900<212>dna<213>人工序列<220><223>融合蛋白<400>80atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgctcatctagatgaggagctccaa480gccacactccacgacttcagacatcaaatcctgcagacaaggggagccctcagtctgcag540ggctccataatgacagtaggagagaaggtcttctccagcaatgggcagtccatcactttt600gatgccattcaggaggcatgtgccagagcaggcggccgcattgctgtcccaaggaatcca660gaggaaaatgaggccattgcaagcttcgtgaagaagtacaacacatatgcctatgtaggc720ctgactgagggtcccagccctggagacttccgctactcagatgggacccctgtaaactac780accaactggtaccgaggggagcctgcaggtcggggaaaagagcagtgtgtggagatgtac840acagatgggcagtggaatgacaggaactgcctgtactcccgactgaccatctgtgagttc900<210>81<211>912<212>dna<213>人工序列<220><223>融合蛋白<400>81atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattcactggaagcgctgttccagggcgttgcttctctgaggcagcaggtt480gaggccttacagggacaagtacagcacctccaggctgctttctctcagtataagaaagtt540gagctcttcccaaatggccaaagtgtcggggagaagattttcaagacagcaggctttgta600aaaccatttacggaggcacagctgctgtgcacacaggctggtggacagttggcctctcca660cgctctgccgctgagaatgccgccttgcaacagctggtcgtagctaagaacgaggctgct720ttcctgagcatgactgattccaagacagagggcaagttcacctaccccacaggagagtcc780ctggtctattccaactgggccccaggggagcccaacgatgatggcgggtcagaggactgt840gtggagatcttcaccaatggcaagtggaatgacagggcttgtggagaaaagcgtcttgtg900gtctgcgagttc912<210>82<211>193<212>prt<213>人工序列<220><223>融合蛋白<400>82metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyseraspalagluphearghisaspsergly145150155160tyrgluvalhishisglnlysleuvalphephealagluaspvalgly165170175serasnlysglyalaileileglyleumetvalglyglyvalvalile180185190ala<210>83<211>579<212>dna<213>人工序列<220><223>融合蛋白<400>83atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctgacgctgaattccgtcacgactctggt480tacgaagttcaccaccagaagctggtgttcttcgctgaagacgtgggttctaacaagggt540gctatcatcggtctgatggttggtggcgttgtgatcgcg579<210>84<211>188<212>prt<213>人工序列<220><223>融合蛋白<400>84metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserlyscysasnthralathrcysalathr145150155160glnargleualaasnpheleuvalhisserserasnasnpheglyala165170175ileleuserserthrasnvalglyserasnthrtyr180185<210>85<211>564<212>dna<213>人工序列<220><223>融合蛋白<400>85atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctaaatgcaacactgccacatgtgcaacg480cagcgcctggcaaattttttagttcattccagcaacaactttggtgccattctctcatct540accaacgtgggatccaatacatat564<210>86<211>291<212>prt<213>人工序列<220><223>融合蛋白<400>86metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserglnvalleusertyrlysglualaval145150155160leuargalaileaspglyileasnglnargserseraspalaasnleu165170175tyrargleuleuaspleuaspproargprothrmetaspglyasppro180185190aspthrprolysprovalserphethrvallysgluthrvalcyspro195200205argthrthrglnglnserprogluaspcysaspphelyslysaspgly210215220leuvallysargcysmetglythrvalthrleuasnglnalaarggly225230235240serpheaspilesercysasplysaspasnlysargphealaleuleu245250255glyaspphephearglysserlysglulysileglylysgluphelys260265270argilevalglnargilelysasppheleuargasnleuvalproarg275280285thrgluser290<210>87<211>291<212>prt<213>人工序列<220><223>融合蛋白<400>87metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserglnvalleusertyrlysglualaval145150155160leuargalaileaspglyileasnglnargserseraspalaasnleu165170175tyrargleuleuaspleuaspproargprothrmetaspglyasppro180185190aspthrprolysprovalserphethrvallysgluthrvalcyspro195200205argthrthrglnglnserprogluaspcysaspphelyslysaspgly210215220leuvallysargcysmetglythrvalthrleuasnglnalaarggly225230235240serpheaspilesercysasplysaspasnlysargphealaleuleu245250255glyaspphephearglysserlysglulysileglylysgluphelys260265270argilevalglnargilelysasppheleuargasnleuvalproarg275280285thrgluser290<210>88<211>873<212>dna<213>人工序列<220><223>融合蛋白<400>88atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggatgatatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaataagctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctcaggtcctcagctacaaggaagctgtg480cttcgtgctatagatggcatcaaccagcggtcctcggatgctaacctctaccgcctcctg540gacctggaccccaggcccacgatggatggggacccagacacgccaaagcctgtgagcttc600acagtgaaggagacagtgtgccccaggacgacacagcagtcaccagaggattgtgacttc660aagaaggacgggctggtgaagcggtgtatggggacagtgaccctcaaccaggccaggggc720tcctttgacatcagttgtgataaggataacaagagatttgccctgctgggtgatttcttc780cggaaatctaaagagaagattggcaaagagtttaaaagaattgtccagagaatcaaggat840tttttgcggaatcttgtacccaggacagagtcc873<210>89<211>873<212>dna<213>人工序列<220><223>融合蛋白<400>89atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctcaggtcctcagctacaaggaagctgtg480cttcgtgctatagatggcatcaaccagcggtcctcggatgctaacctctaccgcctcctg540gacctggaccccaggcccacgatggatggggacccagacacgccaaagcctgtgagcttc600acagtgaaggagacagtgtgccccaggacgacacagcagtcaccagaggattgtgacttc660aagaaggacgggctggtgaagcggtgtatggggacagtgaccctcaaccaggccaggggc720tcctttgacatcagttgtgataaggataacaagagatttgccctgctgggtgatttcttc780cggaaatctaaagagaagattggcaaagagtttaaaagaattgtccagagaatcaaggat840tttttgcggaatcttgtacccaggacagagtcc873<210>90<211>787<212>prt<213>人工序列<220><223>融合蛋白<400>90metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserasnservalgluarglysiletyrile145150155160proleuasnlysthralaprocysvalargleuleuasnalathrhis165170175glnileglycysglnserserileserglyaspthrglyvalilehis180185190valvalglulysglugluaspleuglntrpvalleuthraspglypro195200205asnproprotyrmetvalleuleugluserlyshisphethrargasp210215220leumetglulysleulysglyargthrserargilealaglyleuala225230235240valserleuthrlysproserproalaserglypheserproserval245250255glncysproasnaspglypheglyvaltyrserasnsertyrglypro260265270gluphealahiscysarggluileglntrpasnserleuglyasngly275280285leualatyrgluasppheserpheproilepheleuleugluaspglu290295300asngluthrlysvalilelysglncystyrglnasphisasnleuser305310315320glnasnglyseralaprothrpheproleucysalametglnleuphe325330335serhismethisalavalileserthralathrcysmetargargser340345350serileglnserthrpheserileasnprogluilevalcysasppro355360365leuserasptyrasnvaltrpsermetleulysproileasnthrthr370375380glythrleulysproaspaspargvalvalvalalaalathrargleu385390395400aspserargserphephetrpasnvalalaproglyalagluserala405410415valalaserphevalthrglnleualaalaalaglualaleuglnlys420425430alaproaspvalthrthrleuproargasnvalmetphevalphephe435440445glnglygluthrpheasptyrileglyserserargmetvaltyrasp450455460metglulysglylyspheprovalglnleugluasnvalaspserphe465470475480valgluleuglyglnvalalaleuargthrserleugluleutrpmet485490495histhraspprovalserglnlysasngluservalargasnglnval500505510gluaspleuleualathrleuglulysserglyalaglyvalproala515520525valileleuargargproasnglnserglnproleuproproserser530535540leuglnargpheleuargalaargasnileserglyvalvalleuala545550555560asphisserglyalaphehisasnlystyrtyrglnseriletyrasp565570575thralagluasnileasnvalsertyrproglutrpleuserproglu580585590gluaspleuasnphevalthraspthralalysalaleualaaspval595600605alathrvalleuglyargalaleutyrgluleualaglyglythrasn610615620pheseraspthrvalglnalaaspproglnthrvalthrargleuleu625630635640tyrglypheleuilelysalaasnasnsertrppheglnserileleu645650655argglnaspleuargsertyrleuglyaspglyproleuglnhistyr660665670ilealavalserserprothrasnthrthrtyrvalvalglntyrala675680685leualaasnleuthrglythrvalvalasnleuthrarggluglncys690695700glnaspproserlysvalprosergluasnlysaspleutyrglutyr705710715720sertrpvalglnglyproleuhisserasngluthraspargleupro725730735argcysvalargserthralaargleualaargalaleuserproala740745750phegluleuserglntrpserserthrglutyrserthrtrpthrglu755760765serargtrplysaspileargalaargilepheleuilealaserlys770775780gluleuglu785<210>91<211>2361<212>dna<213>人工序列<220><223>融合蛋白<400>91atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctaactcagtggagaggaagatatatatc480cccttaaataaaacagctccctgtgttcgcctgctcaacgccactcatcagattggctgc540cagtcttcaattagtggagacacaggggttatccacgtagtagagaaagaggaggaccta600cagtgggtattgactgatggccccaaccccccttacatggttctgctggagagcaagcat660tttaccagggatttaatggagaagctgaaagggagaaccagccgaattgctggtcttgca720gtgtccttgaccaagcccagtcctgcctcaggcttctctcctagtgtacagtgcccaaat780gatgggtttggtgtttactccaattcctatgggccagagtttgctcactgcagagaaata840cagtggaattcgctgggcaatggtttggcttatgaagactttagtttccccatctttctt900cttgaagatgaaaatgaaaccaaagtcatcaagcagtgctatcaagatcacaacctgagt960cagaatggctcagcaccaaccttcccactatgtgccatgcagctcttttcacacatgcat1020gctgtcatcagcactgccacctgcatgcggcgcagctccatccaaagcaccttcagcatc1080aacccagaaatcgtctgtgaccccctgtctgattacaatgtgtggagcatgctaaagcct1140ataaatacaactgggacattaaagcctgacgacagggttgtggttgctgccacccggctg1200gatagtcgttcctttttctggaatgtggccccaggggctgaaagcgcagtggcttccttt1260gtcacccagctggctgctgctgaagctttgcaaaaggcacctgatgtgaccaccctgccc1320cgcaatgtcatgtttgtcttctttcaaggggaaacttttgactacattggcagctcgagg1380atggtctacgatatggagaagggcaagtttcccgtgcagttagagaatgttgactcattt1440gtggagctgggacaggtggccttaagaacttcattagagctttggatgcacacagatcct1500gtttctcagaaaaatgagtctgtacggaaccaggtggaggatctcctggccacattggag1560aagagtggtgctggtgtccctgctgtcatcctcaggaggccaaatcagtcccagcctctc1620ccaccatcttccctgcagcgatttcttcgagctcgaaacatctctggcgttgttctggct1680gaccactctggtgccttccataacaaatattaccagagtatttacgacactgctgagaac1740attaatgtgagctatcccgaatggctgagccctgaagaggacctgaactttgtaacagac1800actgccaaggccctggcagatgtggccacggtgctgggacgtgctctgtatgagcttgca1860ggaggaaccaacttcagcgacacagttcaggctgatccccaaacggttacccgcctgctc1920tatgggttcctgattaaagccaacaactcatggttccagtctatcctcaggcaggaccta1980aggtcctacttgggtgacgggcctcttcaacattacatcgctgtctccagccccaccaac2040accacttatgttgtacagtatgccttggcaaatttgactggcacagtggtcaacctcacc2100cgagagcagtgccaggatccaagtaaagtcccaagtgaaaacaaggatctgtatgagtac2160tcatgggtccagggccctttgcattctaatgagacggaccgactcccccggtgtgtgcgt2220tctactgcacgattagccagggccttgtctcctgcctttgaactgagtcagtggagctct2280actgaatactctacatggactgagagccgctggaaagatatccgtgcccggatatttctc2340atcgccagcaaagagcttgag2361<210>92<211>390<212>prt<213>人工序列<220><223>融合蛋白<400>92metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserlysglyglugluleuphethrglyval145150155160valproileleuvalgluleuaspglyaspvalasnglyhislysphe165170175servalserglygluglygluglyaspalathrtyrglylysleuthr180185190leulyspheilecysthrthrglylysleuprovalprotrpprothr195200205leuvalthrthrleuthrtyrglyvalglncyspheserargtyrpro210215220asphismetlysglnhisaspphephelysseralametproglugly225230235240tyrvalglngluargthrilephephelysaspaspglyasntyrlys245250255thrargalagluvallysphegluglyaspthrleuvalasnargile260265270gluleulysglyileaspphelysgluaspglyasnileleuglyhis275280285lysleuglutyrasntyrasnserhisasnvaltyrilemetalaasp290295300lysglnlysasnglyilelysvalasnphelysilearghisasnile305310315320gluaspglyservalglnleualaasphistyrglnglnasnthrpro325330335ileglyaspglyprovalleuleuproaspasnhistyrleuserthr340345350glnseralaleuserlysaspproasnglulysargasphismetval355360365leuleugluphevalthralaalaglyilethrleuglymetaspglu370375380leutyrlysleuileasn385390<210>93<211>390<212>prt<213>人工序列<220><223>融合蛋白<400>93metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuasplysmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnaspleuglnalaleuasnmetalaphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralaglyasn130135140serleuvalproargglyserlysglyglugluleuphethrglyval145150155160valproileleuvalgluleuaspglyaspvalasnglyhislysphe165170175servalserglygluglygluglyaspalathrtyrglylysleuthr180185190leulyspheilecysthrthrglylysleuprovalprotrpprothr195200205leuvalthrthrleuthrtyrglyvalglncyspheserargtyrpro210215220asphismetlysglnhisaspphephelysseralametproglugly225230235240tyrvalglngluargthrilephephelysaspaspglyasntyrlys245250255thrargalagluvallysphegluglyaspthrleuvalasnargile260265270gluleulysglyileaspphelysgluaspglyasnileleuglyhis275280285lysleuglutyrasntyrasnserhisasnvaltyrilemetalaasp290295300lysglnlysasnglyilelysvalasnphelysilearghisasnile305310315320gluaspglyservalglnleualaasphistyrglnglnasnthrpro325330335ileglyaspglyprovalleuleuproaspasnhistyrleuserthr340345350glnseralaleuserlysaspproasnglulysargasphismetval355360365leuleugluphevalthralaalaglyilethrleuglymetaspglu370375380leutyrlysleuileasn385390<210>94<211>1170<212>dna<213>人工序列<220><223>融合蛋白<400>94atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggatgatatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaataagctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctaagggcgaggagctgttcaccggggtg480gtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggc540gagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggc600aagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttc660agccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggc720tacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgag780gtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaag840gaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctat900atcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatc960gaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggc1020cccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagacccc1080aacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctc1140ggcatggacgagctgtacaagttaattaac1170<210>95<211>1170<212>dna<213>人工序列<220><223>融合蛋白<400>95atgggccatcatcatcatcatcatatgtcacacactacaccatggacaaacccaggactc60gcagaaaacttcatgaacagtttcatgcaaggcctgagctcgatgccaggtttcacggca120agccaattggataagatgtcaaccatcgcacaatccatggtacagtcaatacaatccttg180gcggcacaaggcaggacatcaccgaatgacctgcaggcccttaacatggcttttgcatct240tcgatggcagaaatcgcggcatccgaagaaggagggggaagcctttccaccaaaactagc300tctatagccagtgcaatgtccaacgcgtttctgcaaacaactggagtggtaaaccaaccg360ttcataaatgaaataactcagctcgttagcatgtttgctcaagcaggtatgaatgatgtc420agtgctgggaattccctggtgccacgcggttctaagggcgaggagctgttcaccggggtg480gtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggc540gagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggc600aagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttc660agccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggc720tacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgag780gtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaag840gaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctat900atcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatc960gaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggc1020cccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagacccc1080aacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctc1140ggcatggacgagctgtacaagttaattaac1170<210>96<211>133<212>prt<213>大腹园蛛(araneusventricosus)<400>96glyserglyasnserglnproiletrpthrasnproasnalaalamet151015thrmetthrasnasnleuvalglncysalaserargserglyvalleu202530thralaaspglnmetaspaspmetglymetmetalaaspservalasn354045serglnmetglnlysmetglyproasnproproglnhisargleuarg505560alametasnthralametalaalagluvalalagluvalvalalathr65707580serproproglnsertyrseralavalleuasnthrileglyalacys859095leuargglusermetmetglnalathrglyservalaspasnalaphe100105110thrasngluvalmetglnleuvallysmetleuseralaaspserala115120125asngluvalserthr130<210>97<211>129<212>prt<213>黑寡妇蜘蛛(latrodectushesperus)<400>97aspalaalaservaltrpaspserthralathralaglualapheile151015glyserpheasnserglymetgluargserglyvalleuserargser202530glnmetaspaspileserserileseraspthrileileseralaile354045gluargasnproasnasnserlysserlysleuglnalaleuasnmet505560alaphealaserservalsergluilealaphesergluasnasngly65707580ileserasnseralalysileglnalaileileaspalaleuarggly859095alapheleuglnthrileglythrvalaspglnthrpheleuasnglu100105110ileserserleuvallysmetpheserglnvalseralagluasnala115120125val<210>98<211>128<212>prt<213>uloborusdiversus<400>98glnglyalaservaltrpserserproglnmetalagluasnphemet151015asnglyphesermetalaleuserglnalaglyalapheserglygln202530glumetlysasppheaspaspvalargaspilemetasnseralamet354045asplysmetileargserglylysserglyargglyalametargala505560metasnalaalapheglyseralailealagluilevalalaalaasn65707580glyglylysglutyrglnileglyalavalleuaspalavalthrasn859095thrleuleuglnleuthrglyasnalaaspasnglypheleuasnglu100105110ileserargleuilethrleupheserservalglualaasnaspval115120125<210>99<211>128<212>prt<213>metepeiragrandiosa<400>99alahisglyhisiletrpglythrproglyalaglylysservalthr151015glyserilevalglncysalaglyglnserglyvalpheserglyasp202530glnmetglnaspleuglyaspmetalaaspalavalasnargglnleu354045aspargleuglyproasnalaproasphisargleulysglyvalthr505560thrmetmetalaalaglyilealaaspalaalavalasnserprogly65707580glnserleuaspvalmetileasnthrileserglycysmetthrgln859095alametserglnalavalglytyrvalaspglnthrleuileargglu100105110valalaglumetvalasnmetleualaasngluasnalaasnalaval115120125<210>100<211>176<212>prt<213>人工序列<220><223>融合蛋白<400>100metglyhishishishishishismetserhisthrthrprotrpthr151015asnproglyleualagluasnphemetasnserphemetglnglyleu202530sersermetproglyphethralaserglnleuaspaspmetserthr354045ilealaglnsermetvalglnserileglnserleualaalaglngly505560argthrserproasnlysleuglnalaleuasnmetargphealaser65707580sermetalagluilealaalaserglugluglyglyglyserleuser859095thrlysthrserserilealaseralametserasnalapheleugln100105110thrthrglyvalvalasnglnpropheileasngluilethrglnleu115120125valsermetphealaglnalaglymetasnaspvalseralametile130135140proserserprovalhisleulysargleulysleuleuleuleuleu145150155160leuleuleuileleuleuleuileleuglyalaleuleuleuglyleu165170175<210>101<211>426<212>prt<213>人工序列<220><223>融合蛋白<400>101metglyserserglyhishishishishishismetglyglyglygly151015serserhisthrthrprotrpthrasnproglyleualagluasnphe202530metasnserphemetglnglyleusersermetproglyphethrala354045serglnleuasplysmetserthrilealaglnsermetvalglnser505560ileglnserleualaalaglnglyargthrserproasnaspleugln65707580alaleuasnmetalaphealasersermetalagluilealaalaser859095glugluglyglyglyserleuserthrlysthrserserilealaser100105110alametserasnalapheleuglnthrthrglyvalvalasnglnpro115120125pheileasngluilethrglnleuvalsermetphealaglnalagly130135140metasnaspvalleuglualaleupheglnglyproasnsercysthr145150155160glyargglyaspserproalacysglyseralaserglyglnglygly165170175tyrglyglyleuglyglnglyglytyrglyglnglyalaglyserser180185190alaalaalaalaalaalaalaalaalaalaalaalaglyglyglngly195200205glyglnglyglnglyglytyrglyglnglyserglyglyseralaala210215220alaalaalaalaalaalaalaalaalaalaalaalaalaglyarggly225230235240glnglyglytyrglyglnglyserglyglyasnalaalaalaalaala245250255alaalaalaalaalaalaalaalaalaalaglyglnglyglyglngly260265270glytyrglyargglnserglnglyalaglyseralaalaalaalaala275280285alaalaalaalaalaalaalaalaalaglyserglyglnglyglytyr290295300glyglyglnglyglnglyglytyrglyglnserseralaseralaser305310315320alaalaalaseralaalaglysertyralaglyalavalasnargleu325330335serseralaglualaalaserargvalserserasnilealaalaile340345350alaserglyglyalaseralaleuproservalileserasniletyr355360365serglyvalvalalaserglyvalserserasnglualaleuilegln370375380alaleuleugluleuleuseralaleuvalhisvalleuserserala385390395400serileglyasnvalserservalglyvalaspserthrleuasnval405410415valglnaspservalglyglntyrvalgly420425<210>102<211>353<212>prt<213>人工序列<220><223>融合蛋白<400>102metglyserserglyhishishishishishismetglyglyglygly151015servalaspasnlyspheasnlysgluglnglnasnalaphetyrglu202530ileleuhisleuproasnleuasnglugluglnargasnalapheile354045glnserleulysaspaspproserglnseralaasnleuleualaglu505560alalyslysleuasnaspalaglnalaprolysleuglualaleuphe65707580glnglyproasnsercysthrglyargglyaspserproalacysgly859095seralaserglyglnglyglytyrglyglyleuglyglnglyglytyr100105110glyglnglyalaglyserseralaalaalaalaalaalaalaalaala115120125alaalaalaglyglyglnglyglyglnglyglnglyglytyrglygln130135140glyserglyglyseralaalaalaalaalaalaalaalaalaalaala145150155160alaalaalaalaglyargglyglnglyglytyrglyglnglysergly165170175glyasnalaalaalaalaalaalaalaalaalaalaalaalaalaala180185190alaglyglnglyglyglnglyglytyrglyargglnserglnglyala195200205glyseralaalaalaalaalaalaalaalaalaalaalaalaalaala210215220glyserglyglnglyglytyrglyglyglnglyglnglyglytyrgly225230235240glnserseralaseralaseralaalaalaseralaalaglysertyr245250255alaglyalavalasnargleuserseralaglualaalaserargval260265270serserasnilealaalailealaserglyglyalaseralaleupro275280285servalileserasniletyrserglyvalvalalaserglyvalser290295300serasnglualaleuileglnalaleuleugluleuleuseralaleu305310315320valhisvalleuserseralaserileglyasnvalserservalgly325330335valaspserthrleuasnvalvalglnaspservalglyglntyrval340345350gly<210>103<211>431<212>prt<213>人工序列<220><223>融合蛋白<400>103metglyserserglyhishishishishishismetglyglyglygly151015serserhisthrthrprotrpthrasnproglyleualagluasnphe202530metasnserphemetglnglyleusersermetproglyphethrala354045serglnleuasplysmetserthrilealaglnsermetvalglnser505560ileglnserleualaalaglnglyargthrserproasnaspleugln65707580alaleuasnmetalaphealasersermetalagluilealaalaser859095glugluglyglyglyserleuserthrlysthrserserilealaser100105110alametserasnalapheleuglnthrthrglyvalvalasnglnpro115120125pheileasngluilethrglnleuvalsermetphealaglnalagly130135140metasnaspvalleuglualaleupheglnglyproasnsercysthr145150155160glyargglyaspserproalacysglyseralaserglyglnglygly165170175tyrglyglyleuglyglnglyglytyrglyglnglyalaglyserser180185190alaalaalaalaalaalaalaalaalaalaalaalaglyglyglngly195200205glyglnglyglnglyglytyrglyglnglyserglyglyseralaala210215220alaalaalaalaalaalaalaalaalaalaalaalaalaglyarggly225230235240glnglyglytyrglyglnglyserglyglyasnalaalaalaalaala245250255alaalaalaalaalaalaalaalaalaalaglyglnglyglyglngly260265270glytyrglyargglnserglnglyalaglyseralaalaalaalaala275280285alaalaalaalaalaalaalaalaalaglyserglyglnglyglytyr290295300glyglyglnglyglnglyglytyrglyglnserseralaseralaser305310315320alaalaalaseralaalaserthrvalalaasnservalserargleu325330335serserproseralavalserargvalserseralavalserserleu340345350valserasnglyglnvalasnmetalaalaleuproasnileileser355360365asnileserserservalseralaseralaproglyalaserglycys370375380gluvalilevalglnalaleuleugluvalilethralaleuvalgln385390395400ilevalserserserservalglytyrileasnproseralavalasn405410415glnilethrasnvalvalalaasnalametalaglnvalmetgly420425430<210>104<211>358<212>prt<213>人工序列<220><223>融合蛋白<400>104metglyserserglyhishishishishishismetglyglyglygly151015servalaspasnlyspheasnlysgluglnglnasnalaphetyrglu202530ileleuhisleuproasnleuasnglugluglnargasnalapheile354045glnserleulysaspaspproserglnseralaasnleuleualaglu505560alalyslysleuasnaspalaglnalaprolysleuglualaleuphe65707580glnglyproasnsercysthrglyargglyaspserproalacysgly859095seralaserglyglnglyglytyrglyglyleuglyglnglyglytyr100105110glyglnglyalaglyserseralaalaalaalaalaalaalaalaala115120125alaalaalaglyglyglnglyglyglnglyglnglyglytyrglygln130135140glyserglyglyseralaalaalaalaalaalaalaalaalaalaala145150155160alaalaalaalaglyargglyglnglyglytyrglyglnglysergly165170175glyasnalaalaalaalaalaalaalaalaalaalaalaalaalaala180185190alaglyglnglyglyglnglyglytyrglyargglnserglnglyala195200205glyseralaalaalaalaalaalaalaalaalaalaalaalaalaala210215220glyserglyglnglyglytyrglyglyglnglyglnglyglytyrgly225230235240glnserseralaseralaseralaalaalaseralaalaserthrval245250255alaasnservalserargleuserserproseralavalserargval260265270serseralavalserserleuvalserasnglyglnvalasnmetala275280285alaleuproasnileileserasnileserserservalseralaser290295300alaproglyalaserglycysgluvalilevalglnalaleuleuglu305310315320valilethralaleuvalglnilevalserserserservalglytyr325330335ileasnproseralavalasnglnilethrasnvalvalalaasnala340345350metalaglnvalmetgly355<210>105<211>661<212>prt<213>人工序列<220><223>融合蛋白<400>105metglyserserglyhishishishishishismetglyglyglygly151015serserhisthrthrprotrpthrasnproglyleualagluasnphe202530metasnserphemetglnglyleusersermetproglyphethrala354045serglnleuasplysmetserthrilealaglnsermetvalglnser505560ileglnserleualaalaglnglyargthrserproasnaspleugln65707580alaleuasnmetalaphealasersermetalagluilealaalaser859095glugluglyglyglyserleuserthrlysthrserserilealaser100105110alametserasnalapheleuglnthrthrglyvalvalasnglnpro115120125pheileasngluilethrglnleuvalsermetphealaglnalagly130135140metasnaspvalleuglualaleupheglnglyproasnsergluval145150155160glnleuleugluserglyglyglyleuvalglnproglyglyserleu165170175argleusercysalaalaserglyphethrphesersertyralamet180185190sertrpvalargglnalaproglylysglyleuglutrpvalsergly195200205ileglysertyrglyglyglythrtyrtyralaaspservallysgly210215220argphethrileserargaspasnserlysasnthrleutyrleugln225230235240metasnserleuargalagluaspthralavaltyrtyrcysalaarg245250255tyrvalasnpheglymetasptyrtrpglyglnglythrleuvalthr260265270valserserglyglyglyglyserglyglyglyglyserglyglygly275280285glyseraspileglnmetthrglnserproserserleuseralaser290295300valglyaspargvalthrilethrcysargalaserglnserileser305310315320sertyrleuasntrptyrglnglnlysproglylysalaprolysleu325330335leuiletyralaalaserserleuglnserglyvalproserargphe340345350serglyserglyserglythraspphethrleuthrileserserleu355360365glnprogluaspphealathrtyrtyrcysglnglntyrglyargasn370375380proprothrpheglyglnglythrlysleugluilelysargglyser385390395400alaserglyglnglyglytyrglyglyleuglyglnglyglytyrgly405410415glnglyalaglyserseralaalaalaalaalaalaalaalaalaala420425430alaalaglyglyglnglyglyglnglyglnglyglytyrglyglngly435440445serglyglyseralaalaalaalaalaalaalaalaalaalaalaala450455460alaalaalaglyargglyglnglyglytyrglyglnglyserglygly465470475480asnalaalaalaalaalaalaalaalaalaalaalaalaalaalaala485490495glyglnglyglyglnglyglytyrglyargglnserglnglyalagly500505510seralaalaalaalaalaalaalaalaalaalaalaalaalaalagly515520525serglyglnglyglytyrglyglyglnglyglnglyglytyrglygln530535540serseralaseralaseralaalaalaseralaalaserthrvalala545550555560asnservalserargleuserserproseralavalserargvalser565570575seralavalserserleuvalserasnglyglnvalasnmetalaala580585590leuproasnileileserasnileserserservalseralaserala595600605proglyalaserglycysgluvalilevalglnalaleuleugluval610615620ilethralaleuvalglnilevalserserserservalglytyrile625630635640asnproseralavalasnglnilethrasnvalvalalaasnalamet645650655alaglnvalmetgly660<210>106<211>588<212>prt<213>人工序列<220><223>融合蛋白<400>106metglyserserglyhishishishishishismetglyglyglygly151015servalaspasnlyspheasnlysgluglnglnasnalaphetyrglu202530ileleuhisleuproasnleuasnglugluglnargasnalapheile354045glnserleulysaspaspproserglnseralaasnleuleualaglu505560alalyslysleuasnaspalaglnalaprolysleuglualaleuphe65707580glnglyproasnsergluvalglnleuleugluserglyglyglyleu859095valglnproglyglyserleuargleusercysalaalaserglyphe100105110thrphesersertyralametsertrpvalargglnalaproglylys115120125glyleuglutrpvalserglyileglysertyrglyglyglythrtyr130135140tyralaaspservallysglyargphethrileserargaspasnser145150155160lysasnthrleutyrleuglnmetasnserleuargalagluaspthr165170175alavaltyrtyrcysalaargtyrvalasnpheglymetasptyrtrp180185190glyglnglythrleuvalthrvalserserglyglyglyglysergly195200205glyglyglyserglyglyglyglyseraspileglnmetthrglnser210215220proserserleuseralaservalglyaspargvalthrilethrcys225230235240argalaserglnserilesersertyrleuasntrptyrglnglnlys245250255proglylysalaprolysleuleuiletyralaalaserserleugln260265270serglyvalproserargpheserglyserglyserglythraspphe275280285thrleuthrileserserleuglnprogluaspphealathrtyrtyr290295300cysglnglntyrglyargasnproprothrpheglyglnglythrlys305310315320leugluilelysargglyseralaserglyglnglyglytyrglygly325330335leuglyglnglyglytyrglyglnglyalaglyserseralaalaala340345350alaalaalaalaalaalaalaalaalaglyglyglnglyglyglngly355360365glnglyglytyrglyglnglyserglyglyseralaalaalaalaala370375380alaalaalaalaalaalaalaalaalaalaglyargglyglnglygly385390395400tyrglyglnglyserglyglyasnalaalaalaalaalaalaalaala405410415alaalaalaalaalaalaalaglyglnglyglyglnglyglytyrgly420425430argglnserglnglyalaglyseralaalaalaalaalaalaalaala435440445alaalaalaalaalaalaglyserglyglnglyglytyrglyglygln450455460glyglnglyglytyrglyglnserseralaseralaseralaalaala465470475480seralaalaserthrvalalaasnservalserargleuserserpro485490495seralavalserargvalserseralavalserserleuvalserasn500505510glyglnvalasnmetalaalaleuproasnileileserasnileser515520525serservalseralaseralaproglyalaserglycysgluvalile530535540valglnalaleuleugluvalilethralaleuvalglnilevalser545550555560serserservalglytyrileasnproseralavalasnglnilethr565570575asnvalvalalaasnalametalaglnvalmetgly580585<210>107<211>414<212>prt<213>人工序列<220><223>融合蛋白<400>107metglyserserglyhishishishishishismetglyglyglygly151015serserhisthrthrprotrpthrasnproglyleualagluasnphe202530metasnserphemetglnglyleusersermetproglyphethrala354045serglnleuasplysmetserthrilealaglnsermetvalglnser505560ileglnserleualaalaglnglyargthrserproasnaspleugln65707580alaleuasnmetalaphealasersermetalagluilealaalaser859095glugluglyglyglyserleuserthrlysthrserserilealaser100105110alametserasnalapheleuglnthrthrglyvalvalasnglnpro115120125pheileasngluilethrglnleuvalsermetphealaglnalagly130135140metasnaspvalleuglualaleupheglnglyproasnsergluval145150155160glnleuleugluserglyglyglyleuvalglnproglyglyserleu165170175argleusercysalaalaserglyphethrphesersertyralamet180185190sertrpvalargglnalaproglylysglyleuglutrpvalsergly195200205ileglysertyrglyglyglythrtyrtyralaaspservallysgly210215220argphethrileserargaspasnserlysasnthrleutyrleugln225230235240metasnserleuargalagluaspthralavaltyrtyrcysalaarg245250255tyrvalasnpheglymetasptyrtrpglyglnglythrleuvalthr260265270valserserglyglyglyglyserglyglyglyglyserglyglygly275280285glyseraspileglnmetthrglnserproserserleuseralaser290295300valglyaspargvalthrilethrcysargalaserglnserileser305310315320sertyrleuasntrptyrglnglnlysproglylysalaprolysleu325330335leuiletyralaalaserserleuglnserglyvalproserargphe340345350serglyserglyserglythraspphethrleuthrileserserleu355360365glnprogluaspphealathrtyrtyrcysglnglntyrglyargasn370375380proprothrpheglyglnglythrlysleugluilelysargglyser385390395400alaserglyserglyserglyserleuprogluthrglygly405410<210>108<211>341<212>prt<213>人工序列<220><223>融合蛋白<400>108metglyserserglyhishishishishishismetglyglyglygly151015servalaspasnlyspheasnlysgluglnglnasnalaphetyrglu202530ileleuhisleuproasnleuasnglugluglnargasnalapheile354045glnserleulysaspaspproserglnseralaasnleuleualaglu505560alalyslysleuasnaspalaglnalaprolysleuglualaleuphe65707580glnglyproasnsergluvalglnleuleugluserglyglyglyleu859095valglnproglyglyserleuargleusercysalaalaserglyphe100105110thrphesersertyralametsertrpvalargglnalaproglylys115120125glyleuglutrpvalserglyileglysertyrglyglyglythrtyr130135140tyralaaspservallysglyargphethrileserargaspasnser145150155160lysasnthrleutyrleuglnmetasnserleuargalagluaspthr165170175alavaltyrtyrcysalaargtyrvalasnpheglymetasptyrtrp180185190glyglnglythrleuvalthrvalserserglyglyglyglysergly195200205glyglyglyserglyglyglyglyseraspileglnmetthrglnser210215220proserserleuseralaservalglyaspargvalthrilethrcys225230235240argalaserglnserilesersertyrleuasntrptyrglnglnlys245250255proglylysalaprolysleuleuiletyralaalaserserleugln260265270serglyvalproserargpheserglyserglyserglythraspphe275280285thrleuthrileserserleuglnprogluaspphealathrtyrtyr290295300cysglnglntyrglyargasnproprothrpheglyglnglythrlys305310315320leugluilelysargglyseralaserglyserglyserglyserleu325330335progluthrglygly340当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1