胶原蛋白样丝基因的制作方法

文档序号:1251697阅读:312来源:国知局
胶原蛋白样丝基因的制作方法
【专利摘要】本发明涉及可用于生产具有胶原蛋白样结构的丝的丝蛋白、以及编码这种蛋白的核酸。本发明还涉及合成丝蛋白的重组细胞和/或生物体。本发明的丝蛋白可用于各种目的,如在生产个人护理产品、塑料、纺织品和生物医学产品中。
【专利说明】胶原蛋白样丝基因
【技术领域】
[0001]本发明涉及可用于生产具有胶原蛋白样结构的丝的丝蛋白,以及编码这样蛋白的核酸。本发明还涉及合成丝蛋白的重组细胞和/或生物体。本发明的丝蛋白可用于各种目的,例如生产个人护理产品、塑料、纺织品和生物医学产品。
【背景技术】
[0002]“丝”已经成为对极其广泛范围的生物材料单一的、包括所有的描述(Sutherland等人,2010),所述生物材料是进化中的古老产品。丝通过广泛范围的昆虫来产生,例如通过昆虫的幼虫在蜕变期间为保护目的所形成的茧,通过成虫如丝蚁(webspinner)在前足上纺具有结构的丝以制造其居住的网样袋或廊,在膜翅目(Hymenoptera)(包括蜜蜂、黄蜂和蚂蚁)中的丝是巢构建的一部分,以及通过大量的其它节肢动物,最著名是各种蛛形纲例如蜘蛛,其中圆网(orb-web)通常用于捕获猎物(Sutherland等人,2010)。
[0003]丝是显示特殊强度和韧性的纤维蛋白分泌物,正因为如此成为广泛研究的靶标。通过超过30000种蜘蛛和很多昆虫产生丝。此外,与其它节肢动物相比,蜘蛛产生多于一种类型的丝,通常在5和7之间,每种具有不同性质对应不同用途,其中多数涉及网构建。这些丝中,用作生命线并用于网外缘和轮福的大壶状丝(major ampul late silk),也称为“曳丝”,已经引起很多关注,因为其每单位重量与钢一样强,却比钢更有韧性。
[0004]尽管结构和分布的多样性,丝有共同的特征,特别是作为半晶体材料,所述材料在无定形基质中具有有序分子结构(微晶)的区域,并且典型地也都显示出类似的蛋白组分,通常富含丙氨酸、丝氨酸和/或甘氨酸(Sutherland等人,2010)。
[0005]总体而言,这些丝已被表征的很少,其中大多数研究集中在家养蚕、家蚕(Bombyxmori)的苗丝和圆网蛛棒络新妇蛛(Nephila clavipes)、欧洲花园蛛、十字园蛛(Araneusdiadematus)和育儿网蛛(nursery web spider)、Euprosthenops australis (无对应中译文)的曳丝。
[0006]在鳞翅目和蜘蛛中,丝蛋白(fibroin)丝基因编码通常很大的蛋白质,所述蛋白覆盖交替疏水和亲水区块的广大区域且在每端具有突出的亲水端结构域(Bini等人,2004)。通常,这些蛋白质包含与β片层、β螺旋、α螺旋和无定形区域松散相关的β折叠片层的晶体阵列的不同组合(参见Craig和Riekel, 2002综述)。
[0007]家养蚕家蚕(B.mori)、丝的齐备商业可用性意味着没有商业的驱动去制造重组蚕丝,尤其是考虑到在制造蛋白的重组产物中的困难,所述蛋白是如此之大且围绕高度重复的结构。这样的丝包括2条链;以1:1的比例的约390kDa的重链和约26kDa轻链,其中这2条链通过一个关键的二硫键相连。
[0008]可用于蜘蛛丝的完整序列数据非常有限。这是因为在研究高度重复结构中的困难(Arcidiacono等人,1998)。主要的实例包括黑寡妇蜘蛛的曳丝(Ayoub等人,2007)和棒络新妇蛛(Nephila clavipes)的鞭状丝(Hayashi和Lewis, 2000)。尽管已经证明对苗丝的培养高度成功,然而对蜘蛛丝而言农业不是一种选择。主要的问题是大多数蜘蛛是非常区域性的、侵略性的以及食人的。然而,这意味着已经有相当大的努力去使用重组技术来生产蜘蛛丝。天然的蜘蛛曳丝非常强,虽然来自不同物种的曳丝表现出不同的性质,存在的丝的实例是重量比比钢强5倍,和/或比凯芙拉(Kevlar) (Dupont)的韧性大3倍(Gosline等人,1999,Volrath 和 Knight,2001)。所有曳丝都具有 250_320kDa 的高 MW(Ayoub 等人,2007),其自身导致重组表达困难。曳丝通常由两种主要蛋白质、主要截断蜘蛛丝蛋白(major ampul ate spidroins)所组成。
[0009]蜘蛛丝蛋白具有高度重复的结构;它们是模块化的,并且包含数百个不同一致基序的串联重复。MaSpl蜘蛛丝蛋白通常包含两个基序:多聚丙氨酸,和GlyGlyXaa,其中Xaa通常是亮氨酸、酪氨酸、谷氨酰胺或丙氨酸。MaSp2蜘蛛丝蛋白还含有聚丙氨酸,以及GlyProGlyXaaXaa重复,其中Xaa通常是甘氨酸、谷氨酰胺或酪氨酸。多聚丙氨酸或聚(甘氨酰-丙氨酸)序列形成紧密包装的片层晶体。
[0010]最近,来自蜜蜂、非洲蜂(Apis melifera)的新结构丝已引起关注。早期X线证据(Rudal1,1962)和不同的氨基酸组成表明具有α螺旋结构的丝分子的不同类存在于蜜蜂丝中。进一步的分析表明,存在四链卷曲螺旋(Atkins, 1967)。最近的分子研究已经证实这点(Sutherland等人,2006)。已经鉴定出四个丝基因(AmelFibroinl_4),其中每个包含单一外显子,被1659-1796个碱基的短区所分开的基因在非洲蜂基因组中顺序地结成簇。它们不含有其它丝的高度重复序列。因此,链的尺寸和结构通过重组方法可更容易地产生。蜜蜂丝可用作新的生物医学材料。例如,它可以被静电纺丝成具有大约200nm均匀纤维的片层。
[0011]由于丝纤维代表了一些已知最强天然纤维,所以丝纤维已经是广泛研究以试图再现其合成的主题。然而,与鳞翅目和蜘蛛丝蛋白的基因表达常出现的问题是在各种重组表达系统的低表达率,这是由于导致有害重组事件的重复核苷酸基序、大的基因尺寸和导致tRNA库消耗的每个氨基酸 密码子数目少的组合。重组表达导致在翻译期间的困难,如作为密码子偏好以及密码子需求结果的翻译暂停、以及广泛的重组率导致基因截断。更短、更少重复序列将避免许多迄今为止与丝基因表达相关的问题。
[0012]很早发现丝作为生物医学材料应用,因为丝通常是生物相容的、可生物降解的并且具有低免疫原性。对生物医学应用而言,重组丝可以制作成各种格式。这些包括制作天然纤维、以及使用物理或化学交联的连接形成的水凝胶。还可以产生在性质上的变化以匹配特定临床需要,所以可以生产丝以应用在失败之前需要高压力中、或者需要延展性中,如在血管中,以及需要合适的系数以修改或控制细胞反应中,例如用于组织工程中(Vepari和Kaplan, 2007)。例如,这种丝已用于形成无纺垫(Dal Pra等人,2004),并已静电纺丝成具有从纳米到微米的纤维尺寸的纤维和纤维垫(Jin等,2002)。丝的丝蛋白薄膜可以从水性和非水性溶剂浇铸(Minoura等人,1990)。可以由丝溶液制造多孔海绵,例如通过使用作为致孔剂的盐或糖和在HFIP中(Nazarov等人,2004)、或者在全水系统(Kim等人,2005)中的丝蛋白进行。
[0013]在20世纪60年代初,通过X射线衍射图谱(pattern)获得的茧或来自醋栗叶蜂(Nematusribesii)的唾液腺提取的丝纤维,表明一些叶蜂(膜翅目)的丝具有胶原蛋白结构(RudalI,1967和1968 ;Lucas和Rudall, 1968)。X射线衍射图谱显示具有30A直径规格的胶原蛋白分子绞合线(twisted cable)-提示有两或三链线(Rudal1,1967年和1968年)。具有胶原蛋白的X射线衍射图谱特征的蛋白质还发现于丝叶蜂(Nematini)族内其它物种的丝腺中:在赤杨条纹叶蜂(Hemichroa)、落叶松叶蜂(Pristiphora)、Pachynemalus (无对应中译文)、黄头叶蜂(Pikonema)和叶蜂属(Nematus)(丝角叶蜂(Nematinae)亚科);在正桂花叶蜂(Tomostethus)和Tethida种(无对应中译文)(蔺叶蜂(Blennocampinae)亚科)的丝腺中的前半部分(Rudall和Kenchington, 1971)。
[0014]醋栗叶蜂丝腺中内容物溶解于0.2M硼酸盐缓冲液之后,随后在乙醇中沉淀,获得下列氨基酸分析(从4种不同制备物中):(甘氨酸:336(标准偏差=16);丙氨酸:122(2);丝氨酸:33(12);脯氨酸:100(3);羟基赖氨酸:37(3);赖氨酸:14(4):RudalI和Kenchington, 1971)。此分析表明,丝具有胶原蛋白特征的高甘氨酸含量以及具有高丙氨酸含量。然而,在茧和蜘蛛丝中也发现高丰度的这些氨基酸。
[0015]考虑由昆虫产生丝的独特性质、以及其仅以微量可被天然利用,需要鉴定编码丝蛋白的其它新核酸。

【发明内容】

[0016]本发明人已经鉴定许多编码与其它丝蛋白不同的丝蛋白的多核苷酸,所述其它丝蛋白已在一级氨基酸序列水平上表征。
[0017]因此,在第一方面本发明提供编码胶原蛋白样丝多肽的分离的和/或外源的多核苷酸。
[0018]在一个实施方案中,所述多核苷酸包含以下的一种或多种:
[0019]i)如SEQ ID NO:7至12、22或23中任一个所示的核苷酸序列;
[0020]ii)编码包含氨基酸序列的多肽的核苷酸序列,所述氨基酸序列如SEQ ID NO:1至6中任一个所示;
[0021]iii)编码包含氨基酸序列的多肽的核苷酸序列,所述氨基酸序列与SEQ ID NO:1至6中任一个或多个至少30%相同;
[0022]iv)编码ii)或iii)的生物活性片段的核苷酸序列;
[0023]V)与SEQ ID N0:7至12、22或23中任一个或多个至少30%相同的核苷酸序列;或

[0024]vi)与i)至V)中的任一个或多个在严谨条件下杂交的序列。
[0025]更优选地,所述多核苷酸包含编码含有氨基酸序列的多肽的核苷酸序列,所述氨基酸序列与SEQ ID NO:1至6中任一个或多个至少95%相同。
[0026]在特别优选的实施方案中,所述多核苷酸编码本发明的多肽。
[0027]在另一方面,本发明提供包含至少一种本发明的多核苷酸的载体。
[0028]在优选的实施方案中,所述载体是表达载体。更优选地,在所述表达载体中所述多核苷酸可操作地连接至启动子。
[0029]在另一方面,本发明提供包含至少一种本发明的多核苷酸、和/或至少一种本发明的载体的宿主细胞。
[0030]所述宿主细胞可为任何细胞类型。实例包括而不限于细菌、酵母、动物或植物细胞。在优选的实施方案 中,所述细胞是细菌细胞。
[0031]在另一方面,本发明提供基本上纯化的和/或重组的胶原蛋白样丝多肽。[0032]在一个实施方案中,所述多肽包含以下的一种或多种:
[0033]i)如SEQ ID NO:1至6中任一个所示的氨基酸序列;
[0034]ii)与SEQ ID NO:1至6中任一个或多个至少30%相同的氨基酸序列;或者
[0035]或ii)的生物活性片段。
[0036]在一个实施方案中,胶原蛋白样丝多肽具有、或能够在合适条件下形成三螺旋结构。
[0037]优选地,所述多肽可从膜翅目种中纯化。
[0038]优选地,所述膜翅目的属是赤杨条纹叶蜂(Hemichroa)、落叶松叶蜂(Pristiphora)、Pachynemalus (无对应中译文)、黄头叶蜂(Pikonema)、正桂花叶蜂(Tomostethus)、Tethida(无对应中译文)或叶蜂属(Nematus)(例如,醋栗叶蜂(Nematusribesii)或寡斑叶蜂(Nematus oligospilus))。
[0039]在另一实施方案中,所述多肽融合到至少一种其它多肽。在优选的实施方案中,至少一种其它多肽选自:提高本发明多肽稳定性的多肽、协助融合蛋白纯化的多肽、促进三螺旋形成的多肽、以及协助本发明的多肽从细胞中分泌(例如,从细菌细胞中分泌)的多肽。这样的融合蛋白的实例如SEQ ID NO: 16至18所示。
[0040]在又一方面,本发明提供非人转基因生物体,其包含本发明的外源多核苷酸,所述多核苷酸编码至少一种根据本发明的多肽。 [0041]在一个实施方案中,所述转基因生物体是植物或转基因非人动物。
[0042]还提供用于制备本发明多肽的方法,所述方法包括在允许编码所述多肽的多核苷酸表达的条件下培养一种或多种本发明的宿主细胞、本发明的载体、本发明的转基因生物体,并回收表达的多肽。本领域技术人员将理解,在表达系统中培养载体也称为无细胞表达。
[0043]模拟天然蛋白的哺乳动物胶原蛋白需要与脯氨酰-4-羟化酶共表达。脯氨酰-4-羟化酶的共表达在细菌中非常有问题,通常在酵母中尤其是毕赤酵母(Pichia)中实现表达。然而,毕赤酵母需要甲醇来诱导,其中存在加入氧气以得到合适的羟基化意味着发酵需要防火系统。因此,在优选的实施方案中,用于制备本发明多肽的方法不包括脯氨酰-4-羟化酶的表达/存在。
[0044]在其它实施方案中,所述方法还包括从多肽中生产产品,例如个人护理产品、纺织品、塑料和生物医学产品。
[0045]在另一方面,本发明提供特异性地结合本发明多肽的分离和/或重组抗体。
[0046]在又一方面,本发明提供包含至少一种本发明多肽的丝纤维、海绵、膜、水凝胶或颗粒。
[0047]优选地,所述多肽是重组多肽。
[0048]在另一方面,本发明提供包含至少两个本发明多肽的共聚物。
[0049]优选的,所述多肽是重组多肽。
[0050]在另一方面,本发明提供包含至少一种本发明多肽、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、或至少一种本发明的共聚物中的一种或多种的产品。
[0051]本发明产品的实例包括而不限于个人护理产品、纺织品、塑料和生物医学产品。
[0052]在一个实施方案中,在本发明的丝纤维、海绵、膜、水凝胶、颗粒、共聚物、或产品中的至少一些多肽是交联的。
[0053]在优选的实施方案中,本发明的产品不是,例如由昆虫诸如叶蜂产生的茧的产品。
[0054]在另一方面,本发明提供组合物,其包含至少一种本发明多肽、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、或至少一种本发明的共聚物中的一种或多种,以及一种或多种可接受的载体。
[0055]在一个实施方案中,所述组合物进一步包含药品。
[0056]在另一个实施方案中,所述组合物用作药物、医疗设备或化妆品。
[0057]在又一方面,本发明提供包含至少一种本发明的多核苷酸、以及一种或多种可接受的载体的组合物。
[0058]在还一方面,本发明提供用于生产含有胶原蛋白样丝多肽的产品的方法,所述方法包括:
[0059]i)获得胶原蛋白样丝多肽;以及
[0060]ii)加工所述多肽以生产产品。
[0061]技术人员将理解,加工步骤的性质将取决于最终产品的形式,以及加工步骤可采取很多在技术人员能力内的不同形式。例如,可通过纺织所述多肽以生产纤维接着编织所述纤维以生产产品来生产含丝纤维的产品。
[0062]通常,胶原蛋白样丝多肽将通过执行用于制备本发明多肽的方法来获得、或获自已经完成此方法的第三方。
[0063]在另一方面,本发明提供治疗或预防疾病的方法,所述方法包括施用含有至少一种用以治疗或预防疾病的药品以及药学上可接受的载体中的一种或多种的组合物,其中所述药学上可接受的载体选自至少一种本发明的多肽、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、至少一种本发明的共聚物、至少一种本发明的产品、或者至少一种本发明的组合物。
[0064]还提供至少一种本发明的多肽、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、至少一种本发明的共聚物、至少一种本发明的产品、或者至少一种本发明的组合物中的一种或多种,以及至少一种药品在制造用于治疗或预防疾病的药物中的用途。
[0065]此外,提供至少一种本发明的多肽、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、至少一种本发明的共聚物、至少一种本发明的产品、或者至少一种本发明的组合物中的一种或多种、以及至少一种药品作为治疗或预防疾病的药物的用途。
[0066]在再一方面,本发明提供试剂盒,其包含至少一种本发明的多肽、至少一种本发明的多核苷酸、至少一种本发明的载体、至少一种本发明的丝纤维、海绵、膜、水凝胶或颗粒、至少一种本发明的共聚物、至少一种本发明的产品、或者至少一种本发明的组合物中的一种或多种。
[0067]除非另有特别说明,在本文中的任何实施方案应当对任何其它实施方案加以必要修正。
[0068]本发明不限于本文所述的具体实施方案的范围,所述具体实施方案仅旨在示例目的。如本文所述,功能等同的产品、组合物和方法明确地在本发明的范围内。
[0069] 整个说明书中,除非另有特别说明或上下文另有要求,提到单一步骤、物质的组合物、步骤组或物质的组合物的组应包含那些步骤、物质的组合物、步骤组或物质的组合物的组中的一个或多个(即,一个或更多个)。
[0070]本发明在下文中通过下述非限制性实例以及参考附加的附图进行描述。
【专利附图】

【附图说明】
[0071]图1:使用ExPASy(ETH)程序比对胶原蛋白样结构域(SEQ ID NO: 13至15)。
[0072]图2:叶蜂丝蛋白表达的考马斯蓝染色SDS PAGE凝胶。
[0073]MW:分子量标记物;A:cDNA SF21 的表达;B:SF9cDNA 的表达;C:V_SF30cDNA 的表达。
[0074]图3:SF9、SF21、SF30、牛胶原蛋白以及纤连蛋白与纤维母细胞的结合。
[0075]图4:重组叶蜂丝蛋白是胶原蛋白的生物物理证据。上(A):经SDS PAGE分离后每种丝蛋白的全长和胃蛋白酶抗性(+P)片段。对SfC B链观察到不完全消化。在左侧显示分子量标准(kDa)。(B)纯化的重组叶 蜂茧胶原蛋白经胃蛋白酶处理后的圆二色性光谱在约220nm处显示表征的胶原蛋白最大值,SfCA (——)> Sf C B (-..-..)和SfCC()。实线(-)显示典型的胶原蛋白光谱。
[0076]序列表索引
[0077]SEQ ID NO:1一叶蜂胶原蛋白样丝多肽A型序列。
[0078]SEQ ID NO: 2—无信号序列的叶蜂胶原蛋白样丝多肽A型序列。
[0079]SEQ ID NO: 3—叶蜂胶原蛋白样丝多肽B型序列
[0080]SEQ ID N0:4—无信号序列的叶蜂胶原蛋白样丝多肽B型序列。
[0081]SEQ ID NO: 5—叶蜂胶原蛋白样丝多肽C型序列。
[0082]SEQ ID N0:6—无信号序列的叶蜂胶原蛋白样丝多肽C型序列。
[0083]SEQ ID NO: 7—编码叶蜂胶原蛋白样丝多肽A型序列的开放阅读框。
[0084]SEQ ID N0:8—编码无信号序列的叶蜂胶原蛋白样丝多肽A型序列的开放阅读框。
[0085]SEQ ID NO:9—编码叶蜂胶原蛋白样丝多肽B型序列的开放阅读框。
[0086]SEQ ID NO: 10—编码无信号序列的叶蜂胶原蛋白样丝多肽B型序列的开放阅读框。
[0087]SEQ ID NO: 11—编码叶蜂胶原蛋白样丝多肽C型序列的开放阅读框。
[0088]SEQ ID NO: 12—编码无信号序列的叶蜂胶原蛋白样丝多肽C型序列的开放阅读框。
[0089]SEQ ID NO: 13:A型丝蛋白的胶原蛋白样结构域(图1)。
[0090]SEQ ID NO: 14:B型丝蛋白的胶原蛋白样结构域(图1)。
[0091]SEQ ID NO: 15:C型丝蛋白的胶原蛋白样结构域(图1)。
[0092]SEQ ID NO: 16:A型胶原蛋白样丝融合蛋白(实施例2)。
[0093]SEQ ID NO: 17:B型胶原蛋白样丝融合蛋白(实施例2)。
[0094]SEQ ID NO: 18:C型胶原蛋白样丝融合蛋白(实施例2)。
[0095]SEQ ID NO: 19:编码 SEQ ID NO: 16 的开放阅读框。
[0096]SEQ ID NO:20:编码 SEQ ID NO: 17 的开放阅读框。
[0097]SEQ ID NO:21:编码 SEQ ID NO: 18 的开放阅读框。
[0098]SEQ ID NO: 22:用于细菌表达的密码子优化的开放阅读框A型(无信号)。
[0099]SEQ ID NO: 23:用于细菌表达的密码子优化的开放阅读框B型(无信号)。【具体实施方式】
[0100]通用技术和定义
[0101]除非另有特别定义,本文使用的所有技术和科学术语应与本领域(例如,在细胞培养、分子遗传学、重组生物学、丝技术、免疫学、蛋白质化学和生物化学)普通技术人员通常理解的意思相同。
[0102]除非另有说明,本发明使用的重组蛋白、细胞培养和免疫技术采用标准操作,是本领域技术人员熟知的。这些技术描述和解释于以下来源的文献中,如:J.Perbal,APractical Guide to Molecular Cloning, John Wiley 和 Sons (1984)、J.Sambrook 等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press (1989)、T.A.Brown (编辑),Essential Molecular B1logy:A Practical Approach,第 I 和第 2 卷,IRL Press (1991)、D.M.Glover 和 B.D.Hames (编辑),DNA Cloning: A Practical Approach,1-4 卷,IRL Press (1995 和 1996)以及 F.M.Ausubel 等人(编辑),Current Protocols inMolecular B1logy, Greene Pub.Associates 和 Wiley-1nterscience (1988,包括至今所有的更新)、Ed Harlow 和 David Lane (编辑),Antibodies:A Laboratory Manual, ColdSpring Harbour Laboratory (1988)和 J.E.Coligan 等人(编辑)Current Protocols inImmunology, John ffiley&Sons (包括至今所有的更新),这些文献通过引用合并于此。
[0103]术语“和/或”,例如“X和/或Y”应理解为意思是“X和Y”或“X或Y”,以及对两个意思或对任一意思提供明确支持。此外,含有在倒数第二个和最后一个特征之间的短语“和/或”的列表或特征指任何一个或多个所列出的特征可以任意组合存在。
[0104]如本文所用 ,除非有相反说明,术语约指的是指定值的+/_20%,更优选为+/-10 %,更优选 +/-5 %,更优选 +/_1 %。
[0105]如本文所用,术语“丝蛋白”和“丝多肽”是可用来生产丝纤维和/或纤维蛋白复合体的纤维蛋白质/多肽。
[0106]胶原蛋白是一种在动物中发现的天然存在的蛋白,尤其是在哺乳动物的肌肉和结缔组织中。胶原蛋白是结缔组织的主要成分,是哺乳动物中最丰富的蛋白,其构成整体蛋白含量的多达约25%至35%。在哺乳动物包括人中,存在29种定义的类型,每个具有不同结构(组成)和功能。细长纤维形式的胶原蛋白主要在纤维组织如腱、韧带和皮肤中发现。胶原蛋白由三螺旋组成,其常存在为两个相同的链(α I)和另一在其化学组成上稍有不同的链(α2)。胶原蛋白的氨基酸组成对蛋白质而言是非典型的,特别是关于其高羟脯氨酸含量的方面。胶原蛋白的氨基酸序列中最常见的基序是甘氨酸-X-羟脯氨酸和甘氨酸-脯氨酸-Y,其中X和Y可以是任何氨基酸,虽然存在对某些组合的优选(Ramshaw等人,1998)。如本文所用,术语“胶原蛋白样”是指包含甘氨酸-X-Y三联体的多肽,其中X和Y可以是任何氨基酸。本发明的丝蛋白也可以被称为“胶原蛋白丝”蛋白。在一个特别优选的实施方案中,与胶原蛋白不同,本发明的胶原蛋白样丝蛋白没有任何羟脯氨酸。优选地,本发明的胶原蛋白样丝蛋白包含至少约40,更优选至少约50个甘氨酸-X-Y三联体。此外,优选甘氨酸-X-Y三联体构成蛋白质的一级氨基酸序列的至少约40%,更优选至少约50%。在一个实施方案中,本发明的胶原蛋白样丝多肽具有,或者是能够在合适条件下形成三螺旋结构。在一个实施方案中,本发明的胶原蛋白样丝蛋白抗胰蛋白酶消化。
[0107]如本文所用,“丝纤维”指含有本发明蛋白质可被织成不同物品如纺织品的长丝(filament)。此术语不包括天然存在的丝纤维,如昆虫的苗。
[0108]如本文所用,“共聚物”是指含有两个或更多本发明丝蛋白(例如,本文定义的A型和B型胶原蛋白样丝蛋白)的组合物。此术语不包括天然存在的共聚物,如昆虫的茧。
[0109]如本文所用,当指如在本发明的丝纤维中的多肽时,术语“至少一个”不意味着丝纤维仅包含单一的多肽分子,而指存在所述多肽的同质群(例如,A型胶原蛋白样丝蛋白),而不存在本发明的其它相关分子(例如,B型和/或C型胶原蛋白样丝蛋白)。
[0110]术语“植物”包括整个植物、营养结构(例如叶、茎、根)、花器官/结构、种子(包括胚、胚乳和种皮)、植物组织(例如维管组织、基本组织等)、细胞以及其后代。
[0111]“转基因植物”是指含有在同种、变种或栽培品种的野生型植物中未发现的基因构建体(“转基因”)的植物。本文所指“转基因”具有生物【技术领域】标准意思,包含通过重组DNA或RNA技术产生的或改变的并被引入植物细胞的遗传序列。转基因可包括源自植物细胞的遗传序列。通常地,转基因通过诸如转化之类的人工操作引入植物中,但如本领域技术人员认可的任何方法都可用。
[0112]“多核苷酸”是指寡核苷酸、核酸分子或其任何片段。其可以是基因组或合成来源的双链或单链的DNA或RNA,可以与糖类、脂质、蛋白质或其它材料组合来执行本文限定的特定活性。
[0113]如本文所用,“可操作地连接”是指两个或更多的核酸(例如DNA)片段之间的功能关系。典型地,是指转录调节元件对所转录的序列之间的功能关系。例如,如果启动子在适当的宿主细胞中刺激或调节编码序列的转录,则启动子可操作地连接到编码序列,如本文所限定的多核苷酸。一般而言,可操作地连接到转录序列的启动子转录调节元件与所转录的序列是物理上相邻的(contiguous),即它们是顺式作用。然而,一些转录调节元件,如增强子不必与其所增强转录的编码序列在物理上相邻或位于紧邻的位置。
[0114]术语“信号肽”是指分泌的成熟蛋白之前的氨基末端多肽。信号肽被切除,因而并不出现在成熟蛋白质中。信号肽具有指导和反式定位分泌蛋白质穿过细胞膜的功能。信号肽也称为信号序列。
[0115]如本文所用,“转化”是指通过并入多核苷酸在细胞中获得新基因。
[0116]如本文所用,术语“药品”是指能被用来治疗或预防特定疾病的任何化合物,可通过本发明的丝蛋白配制的药品的实例包括但不限于蛋白质、核酸、抗肿瘤剂、镇痛剂、抗生素、抗炎化合物(类固醇类和非类固醇类都包括)、激素、疫苗、标记物质等等。
[0117]
[0118]通过“基本上纯化的多肽”或“纯化多肽”意思是一般从在其天然状态下结合的脂质、核酸、其它多肽和其它污染分子诸如蜡中所分离出的多肽。除了本发明的其它蛋白以外,所述的基本上纯化的多肽优选地至少60%的游离,更优选地至少75%的游离,更优选地至少90%的游离于其天然结合的其它成分。在另一方面,本发明涉及天然中不存在的本发明的胶原蛋白样丝蛋白的同质群,或含有其的组合物、单一型。
[0119] 在多肽的背景中,术语“重组”是指通过细胞或在无细胞表达系统中与其天然状态相比以改变量或改变速率而产生多肽。在一个实施方案中,所述的细胞是天然不产生所述多肽的细胞。然而,所述的细胞可以是含有导致所述待产多肽量改变,优选增加的非内源基因的细胞。本发明的重组多肽包括尚未从产生其的转基因(重组)细胞或无细胞表达系统的其它成分中分离出来的多肽,以及在这样细胞或无细胞系统中产生而后从至少一些其它成分中纯化出来的多肽。
[0120]术语“多肽”和“蛋白质”一般可相互替换的使用,指单多肽链,其可或不可通过添加非氨基酸基团而修饰。在一个实施方案中,本文所用的术语“蛋白质”和“多肽”也包括本文所述的本发明的多肽的变体、突变体、修饰物、类似物和/或衍生物。
[0121]多肽的%同一性通过GAP (Needleman和Wunsch, 1970)分析(GCG程序)确定,其缺口产生罚分=5,缺口延伸罚分=0.3。查询序列至少50个氨基酸长,GAP分析在至少跨50个氨基酸的区域比对两条序列。更优选地,查询序列是至少100个氨基酸长,GAP分析在跨至少100个氨基酸的区域比对两条序列。甚至更优选地,查询序列至少250个氨基酸长,GAP分析在跨至少250个氨基酸的区域比对两条序列。甚至更优选地,GAP分析跨两条序列全长进行比对。
[0122]如本文所用,“生物活性”片段是指本发明多肽的一部分,其保持了全长多肽的限定活性,即用于产生丝的能力。只要生物活性片段保持了所述限定活性,其可为任意长度。优选地,生物活性片段是,当相关时,至少100,更优选至少200,以及甚至更优选至少225个氨基酸长。在一个实施方案中,本发明的“生物活性”片段包括本发明多肽的胶原蛋白样结构域,如在图1中所提供的那些。
[0123]对于所限定的多肽,应理解比上述那些%同一性数值高的%同一性数值包括优选的实施方案。因此,在适用的情况下,根据最低%同一性数值,优选所述多肽含有与相应的指定SEQ ID NO具有下述同一'丨生的氨基酸序列:优选至少40%,更优选至少45%,更优选至少50%,更优选至少55%,更优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80 %,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92 %,更优选至少93 %,更优选至少94 %,更优选至少95 %,更优选至少96 %,更优选至少97 %,更优选至少98 %,更优选至少99 %,更优选至少99.1 %,更优选至少99.2 %,更优选至少99.3 %,更优选至少99.4 %,更优选至少99.5 %,更优选至少99.6 %,更优选至少99.7%,更优选至少99.8%,以及甚至更优选至少99.9%。
[0124]本发明多肽的氨基酸序列突变体可通过向本发明的核酸中引入适当核苷酸改变而制备,或通过体外合成所需的多肽。这样的突变体包括,例如在氨基酸序列内进行残基的删除、插入或取代。只要最终多肽产物具有所需特性,可进行删除、插入和取代的组合来实现最终的构建体。
[0125]突变(改变的)多肽可通过本领域已知的任何技术制备。例如,可对本发明的多核苷酸进行体外诱变。这样的体外诱变技术包括将多核苷酸亚克隆到适当的载体,转化载体到“突变”株,如大肠杆菌XL-1红(Stratagene)上,并使转化的细菌繁殖适当代的世代。另一个实例中,对本发明的多核苷酸进行如Harayama(1998)明白描述的DNA改组技术。这些DNA改组技术可包括本发明可能的基因,并还有与本发明那些基因相关的基因,如来自本文表征具体物种之外的其它膜翅目物种的丝基因。突变/改变的DNA来源的产物可通过本文描述的技术容易地筛选确定它们是否可用作丝蛋白。
[0126]在设计氨基酸序列突变体中,突变位点的位置和突变的性质将依赖于待修饰的特征。可对突变的位点进行单独修饰,或进行一系列修饰,例如通过(I)首先用保守氨基酸选择进行取代,然后根据达到的结果用更激进的选择进行取代,(2)删除靶残基,或(3)在定位位点的相邻处插入其它残基。
[0127]氨基酸序列删除一般在约I到150个残基的范围内。
[0128]取代突变体在多肽分子中具有至少一个氨基酸残基的去除并在其位置插入一个不同残基。最感兴趣的取代诱变位点包括鉴定为对功能重要的位点。其它感兴趣的位点是那些获自不同株或物种的特定残基相同的位点。这些位置对于生物活性可以是重要的。对这些位点,尤其是在落入至少三个其它相同保守位点的序列内的那些,优选地通过相对保守的方式进行取代。这样保守取代显示在表1中,标题为“示例取代”。
[0129]表1:示例取代
[0130]
【权利要求】
1.一种编码胶原蛋白样丝多肽的分离的和/或外源的多核苷酸。
2.根据权利要求1所述的多核苷酸,其包含以下的一种或多种:1)如SEQ ID NO:7至12、22或23中任一个所示的核苷酸序列; ?)编码包含氨基酸序列的多肽的核苷酸序列,所述氨基酸序列如SEQ ID NO:1至6中任一个所示; iii)编码包含氨基酸序列的多肽的核苷酸序列,所述氨基酸序列与SEQIDN0:1至6中任一个或多个至少30%相同; iv)编码ii)或iii)的生物活性片段的核苷酸序列; v)与SEQID NO:7至12、22或23中任一个或多个至少30%相同的核苷酸序列;或者 vi)与i)至V)中的任一个或多个在严谨条件下杂交的序列。
3.根据权利要求2所述的多核苷酸,其中所述多核苷酸包含编码含有氨基酸序列的多肽的核苷酸序列,所述氨基酸序列与SEQ ID NO:1至6中任一个或多个至少95%相同。
4.一种载体,其包含至少一种根据权利要求1至3中任一项所述的多核苷酸。
5.根据权利要求4所述的载体,其是表达载体。
6.一种宿主细胞,其包含至少一种根据权利要求1至3中任一项所述的多核苷酸、和/或至少一种根据权利要求4 或权利要求5所述的载体。
7.根据权利要求6所述的宿主细胞,其是细菌、酵母、动物或植物细胞。
8.—种基本上纯化的和/或重组的胶原蛋白样丝多肽。
9.根据权利要求8所述的多肽,其包含以下的一种或多种:1)如SEQID NO:1至6中任一个所示的氨基酸序列; ii)与SEQID ΝΟ:1至6中任一个或多个至少30%相同的氨基酸序列;或
或ii)的生物活性片段。
10.根据权利要求8或权利要求9所述的多肽,其可从膜翅目种中纯化。
11.根据权利要求10所述的多肽,其中膜翅目的属是叶蜂属。
12.根据权利要求8至11中任一项所述的多肽,其融合到至少一种其它多肽。
13.一种转基因的非人生物体,其包含根据权利要求1至3中任一项所述的外源多核苷酸,所述多核苷酸编码至少一种根据权利要求8至12中任一项所述的多肽。
14.一种制备根据权利要求8至12中任一项所述的多肽的方法,所述方法包括在允许编码所述多肽的多核苷酸表达的条件下培养一种或多种根据权利要求6或权利要求7所述的宿主细胞、根据权利要求5所述的载体、根据权利要求13所述的转基因生物体,并回收表达的多肽。
15.一种分离和/或重组抗体,其特异性地结合根据权利要求8至12中任一项所述的多肽。
16.一种丝纤维、海绵、膜、水凝胶或颗粒,其包含至少一种根据权利要求8至12中任一项所述的多肽。
17.根据权利要求16所述的纤维、海绵、膜、水凝胶或颗粒,其中至少一些所述多肽是交联的。
18.一种含有至少两个根据权利要求8至12中任一项所述的多肽的共聚物。
19.根据权利要求18所述的共聚物,其中至少一些所述多肽是交联的。
20.一种产品,其包含至少一种根据权利要求8至12中任一项所述的多肽、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、或者至少一种根据权利要求18或权利要求19所述的共聚物中的一种或多种。
21.根据权利要求20所述的产品,其中所述产品选自:个人护理产品、纺织品、塑料以及生物医学产品。
22.根据权利要求20或权利要求21所述的产品,其中至少一些在所述产品中的多肽是交联的。
23.一种组合物,其包含至少一种根据权利要求8至12中任一项所述的多肽、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、至少一种根据权利要求18或权利要求19所述的共聚物、或者至少一种根据权利要求20至22中任一项所述的产品中的一种或多种、以及一种或多种可接受的载体。
24.根据权利要求23所述的组合物,其进一步包含药品。
25.根据权利要求24所述的组合物,其用作药物、医疗设备或化妆品。
26.一种组合物,其含有至少一种根据权利要求1至3中任一项所述的多核苷酸、以及一种或多种可接受的载体。
27.一种用于生产含有胶原蛋白样丝多肽的产品的方法,所述方法包括:1)获得胶原蛋白样丝多肽;以及 ii)加工所述多肽以生产产品。
28.一种治疗或预防疾病的方法,所述方法包括施用含有至少一种用以治疗或预防疾病的药品以及药学上可接受载体的组合物,其中所述药学上可接受的载体选自至少一种根据权利要求8至12中任一项所述的多肽、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、至少一种根据权利要求18或权利要求19所述的共聚物、至少一种根据权利要求20至22中任一项所述的产品、或者至少一种根据权利要求23至26中任一项所述的组合物中的一种或多种。
29.至少一种根据权利要求8至13中任一项所述的多肽、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、至少一种根据权利要求18或权利要求19所述的共聚物、至少一种根据权利要求20至22中任一项所述的产品、或者至少一种根据权利要求23至26中任一项所述的组合物中的一种或多种、以及至少一种药品在制造用于治疗或预防疾病的药物中的用途。
30.至少一种根据权利要求8至12中任一项所述的多肽、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、至少一种根据权利要求18或权利要求19所述的共聚物、至少一种根据权利要求20至22中任一项所述的产品、或者至少一种根据权利要求23至26中任一项所述的组合物中的一种或多种、以及至少一种药品作为治疗或预防疾病的药物的用途。
31.一种试剂盒,其包含至少一种根据权利要求8至12中任一项所述的多肽、至少一种根据权利要求1至3中任一项所述的多核苷酸、至少一种根据权利要求4或权利要求5所述的载体、至少一种根据权利要求16或权利要求17所述的丝纤维、海绵、膜、水凝胶或颗粒、至少一种根据权利要求18或权利要求19所述的共聚物、至少一种根据权利要求20至22中任一项所述的产品、或者至少一种根据权利要求23至26中任一项所述的组合物中的一种或多种 。
【文档编号】A61K47/42GK104039965SQ201280066644
【公开日】2014年9月10日 申请日期:2012年11月15日 优先权日:2011年11月16日
【发明者】T·萨瑟兰, V·S·哈里斯, S·丰斯曼, J·A·M·拉姆尚, Y·Y·彭, S·岡田, A·A·沃克 申请人:联邦科学工业研究组织
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1