胶原蛋白7及相关方法与流程

文档序号:14705837发布日期:2018-06-15 23:24阅读:1008来源:国知局

本发明涉及胶原蛋白7、胶原蛋白7相关核酸和细胞及相关方法。

背景

胶原蛋白是加强和支持结缔组织,例如皮肤、腱、韧带和骨骼的蛋白质家族。胶原蛋白7作为锚原纤维的主要组分,其功能在于加强和稳定各种组织,包括皮肤(Ricard-Blum,Cold Spring Harb Perspect Biol 3(1):a004978(2011))。

胶原蛋白7合成为三条前-α1(Ⅶ)多肽链,该多肽链随后在内质网中经加工和折叠成三螺旋前胶原蛋白7蛋白质。前胶原蛋白7分泌到细胞外空间中,在那里它被进一步加工为成熟胶原蛋白7(Chung et al.Dermatol Clin 28(1):93-105(2010))。成熟胶原蛋白7经过多步骤的聚合过程以形成结构性锚原纤维(Fritsch et al.J Biol Chem 284(44):30248-30256(2009))。在皮肤中,发现这些锚原纤维在表皮基底膜带内,其是位于皮肤最上层、表皮和真皮底层之间的两层膜。在这里锚原纤维连接表皮基底膜至乳突真皮层。这种连接协助将皮肤的表皮和真皮层连接在一起,为皮肤提供构造和稳定性(Villone et al.J Biol Chem 283(36):24506-24513(2008))。

发明概述

在一个方面,公开的特征在于制造胶原蛋白7或其功能性片段的方法。该方法包括:

提供细胞,例如哺乳动物细胞,例如,CHO或HEK细胞,经基因修饰以表达胶原蛋白7或其功能性片段,和可选地,一种或多种多肽,例如,在细胞中提高胶原蛋白7产量的一种或多种多肽(例如,脯氨酸肽酶和/或脯氨酰羟化酶);以及

在足够用于生产胶原蛋白7或其功能性片段的条件下培养所述细胞,从而制造胶原蛋白7或其功能性片段。

在一个实施方案中,胶原蛋白7是人胶原蛋白7。在一个实施方案中,胶原蛋白7由高甘氨酸密码子优化的序列所编码,例如,本文所描述的高甘氨酸密码子优化的序列。在一个实施方案中,胶原蛋白7具有SEQ ID NO 2的氨基酸序列。在一个实施方案中,胶原蛋白7的氨基酸序列与SEQ ID NO 2至少80、90、95或99%相同。在一个实施方案中,胶原蛋白7的氨基酸序列与SEQ ID NO 2的不同不超过1、2、3、4、5、6、7、8、9、10、15或20个氨基酸残基。

在一个实施方案中,所述细胞经基因修饰以表达脯氨酸肽酶或其功能性片段,并且例如,所述脯氨酸肽酶可以是哺乳动物,例如人脯氨酸肽酶,或者啮齿动物,如小鼠、大鼠或仓鼠脯氨酸肽酶。在一个实施方案中,脯氨酸肽酶是:人脯氨酸肽酶,例如具有SEQ ID NO 4的氨基酸序列的人脯氨酸肽酶;具有与SEQ ID NO 4至少80、90、95或99%相同的氨基酸序列的脯氨酸肽酶;具有与SEQ ID NO 4的不同不超过1、2、3、4、5、6、7、8、9、10、15或20个残基的氨基酸序列的脯氨酸肽酶。

在一个实施方案中,所述细胞经基因修饰以表达脯氨酰羟化酶或其功能性片段,并且例如,所述脯氨酰羟化酶可以是哺乳动物,例如人脯氨酰羟化酶,或者啮齿动物,如小鼠、大鼠或仓鼠脯氨酰羟化酶。在一个实施方案中,脯氨酰羟化酶是:人脯氨酰羟化酶,例如具有SEQ ID NO X的氨基酸序列的人脯氨酰羟化酶;具有与SEQ ID NO X至少80、90、95或99%相同的氨基酸序列的脯氨酰羟化酶;具有与SEQ ID NO X的不同不超过1、2、3、4、5、6、7、8、9、10、15或20个残基的氨基酸序列的脯氨酰羟化酶。

在一个实施方案中,所述细胞经基因修饰以表达糖基转移酶或其功能性片段,例如唾液酸转移酶或其功能片段。糖基转移酶可以是哺乳动物,例如人糖基转移酶,如唾液酸转移酶,或者啮齿动物,如小鼠、大鼠或仓鼠糖基转移酶。

在一个实施方案中,糖基转移酶是唾液酸转移酶,例如具有SEQ ID NO 5的氨基酸序列的唾液酸转移酶;具有与SEQ ID NO:5至少80、90、95或99%相同的氨基酸序列的唾液酸转移酶;具有与SEQ ID NO5的不同不超过1、2、3、4、5、6、7、8、9、10、15或20个残基的氨基酸序列的唾液酸转移酶。

在一个实施方案中,所述经基因修饰的细胞包括编码胶原蛋白7或其功能性片段的核酸,例如高甘氨酸密码子优化的核酸序列,例如SEQ ID NO 1的核酸序列。在一个实施方案中,所述核酸序列与SEQ ID NO 1至少80、90、95或99%相同;所述核酸序列与SEQ ID NO 1的不同不超过1、2、3、4、5、6、7、8、9、10、15或20个残基。在一个实施方案中,至少80、90、95、或99%的密码子具有SEQ ID NO 1的密码子值。

在一个实施方案中,经基因修饰的细胞包括编码脯氨酸肽酶或其功能性片段的核酸。

在一个实施方案中,经基因修饰的细胞包括编码脯氨酰羟化酶或其功能性片段的核酸。

在一个实施方案中,经基因修饰的细胞包括编码糖基转移酶或其功能性片段的核酸。

在一个实施方案中,细胞包括表达载体,所述表达载体包括编码胶原蛋白7或其功能性片段的核酸序列。在一个实施方案中,所述表达载体进一步包括编码脯氨酸肽酶或其功能性片段的核酸序列。在一个实施方案中,所述表达载体进一步包括编码脯氨酰羟化酶或其功能性片段的核酸序列。在一个实施方案中,所述表达载体进一步包括编码糖基转移酶或其功能性片段的核酸序列。在一个实施方案中,所述表达载体进一步包括编码脯氨酸肽酶或其功能性片段的核酸序列,以及编码糖基转移酶或其功能性片段的核酸序列。在一个实施方案中,所述表达载体进一步包括编码脯氨酰羟化酶或其功能性片段的核酸序列,以及编码糖基转移酶或其功能性片段的核酸序列。

在一个实施方案中,细胞包括第二表达载体,所述第二表达载体包括编码脯氨酸肽酶或其功能性片段的核酸序列。

在一个实施方案中,细胞包括第二表达载体,所述第二表达载体包括编码脯氨酰羟化酶或其功能性片段的核酸序列。

在一个实施方案中,细胞包括第三表达载体,所述第三表达载体包括编码糖基转移酶或其功能性片段的核酸序列。

在一个实施方案中,细胞包括第二表达载体和第三表达载体,所述第二表达载体包括编码脯氨酸肽酶或其功能性片段的核酸序列,所述第三表达载体包括编码糖基转移酶或其功能性片段的核酸序列。

在一个实施方案中,细胞包括第二表达载体和第三表达载体,所述第二表达载体包括编码脯氨酰羟化酶或其功能性片段的核酸序列,所述第三表达载体包括编码糖基转移酶或其功能性片段的核酸序列的第三表达载体。

在一个实施方案中,细胞是哺乳动物细胞,例如人或啮齿动物,如大鼠、小鼠或中国仓鼠细胞。

在一个实施方案中,细胞是CHO细胞。

在一个实施方案中,细胞是HEK293细胞。

在一个实施方案中,方法进一步包括从所述经培养的细胞中回收胶原蛋白7或其功能性片段。

在一个实施方案中,从培养基回收胶原蛋白7或其功能性片段。

在一个实施方案中,方法进一步包括从所述培养的细胞中纯化胶原蛋白7或其功能性片段。

在一个实施方案中,方法进一步包括从培养基中纯化胶原蛋白7或其功能片段。

在一个实施方案中,至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入同三聚体中。

在一个实施方案中,至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入六聚体中。

在另一个方面,所公开的特征在于本文所描述的载体。

在另一个方面,所公开的特征在于本文所描述的细胞或经分离的细胞制备物。

在另一个方面,所公开的特征在于编码本文所描述的胶原蛋白7的高甘氨酸优化的序列。

在另一个方面,所公开的特征在于本文所描述的经分离的细胞制备物,其进一步包括任何培养基,和由所述细胞生产的胶原蛋白7或其功能性片段,

在另一个方面,所公开的特征在于制造适合用于表达胶原蛋白7或其功能片段的方法,其包括:

重组地操作细胞,例如哺乳动物细胞,如本文所描述的哺乳动物细胞,以表达重组胶原蛋白7或其功能性片段;

可选地,重组地操作所述细胞以表达一种或多种多肽,例如,提高细胞中胶原蛋白7产量的一种或多种多肽(例如,脯氨酸肽酶和/或脯氨酰羟化酶);

从而制造适合用于表达重组胶原蛋白7的细胞。

在一个实施方案中,方法包括重组地操作细胞以表达由高甘氨酸密码子优化的核酸序列所编码的胶原蛋白7,例如本文所描述的高甘氨酸密码子优化的核酸序列。

在本方法的一个实施方案中,细胞经重组地操作以表达胶原蛋白7或其功能性片段,并且细胞经重组地操作以表达一种或多种多肽,例如,增加细胞中胶原蛋白7的表达的那些。在一个实施方案中,在细胞经重组地操作以表达一种或多种多肽之前,例如在细胞中增强胶原蛋白7的表达的那些,例如一个或多个脯氨酸肽酶、脯氨酰羟化酶、糖基转移酶和其功能性片段,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

在一个实施方案中,在细胞经重组地操作以表达一种或多种多肽之后,例如在细胞中增强胶原蛋白7的表达的那些,例如一个或多个脯氨酸肽酶、脯氨酰羟化酶、糖基转移酶和其功能性片段,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

在本方法的一个实施方案中,在细胞经重组地操作以表达一种或多种多肽的同时,例如在细胞中增强胶原蛋白7的表达的那些,例如一个或多个脯氨酸肽酶、脯氨酰羟化酶、糖基转移酶和其功能性片段,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

在另一个方面,本发明的特征在于通过本文所描述的方法所制造的胶原蛋白7或其功能性片段。

在另一个方面,本发明的特征在于通过本文所描述的方法制造的胶原蛋白7或其功能性片段的经纯化或经分离的制备物。

在另一个方面,本发明的特征在于胶原蛋白7或其功能性片段的经纯化或经分离的制备物,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入同三聚体中。

在另一个方面,本发明的特征在于胶原蛋白7或其功能性片段的经纯化或经分离的制备物,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入六聚体中。

在另一个方面,本发明的特征在于纯化胶原蛋白7或其功能片段的方法,其包括:

提供经调节的细胞培养基,例如,来自于对本文所描述的细胞的培养物;

对得自所述培养基的胶原蛋白7或其功能性片段进行阴离子交换色谱,例如用Q琼脂糖。

从而纯化胶原蛋白7或其功能性片段。

在一个实施方案中,所述方法包括:

提供经调节的细胞培养基,例如,来自对本文所描述的细胞的培养物;

可选地,沉淀蛋白质,例如,用硫酸铵以形成沉淀蛋白质;

溶解所述沉淀蛋白质以形成溶解的蛋白质;

透析所述溶解的蛋白质以形成透析液;

沉降所述经透析的样品以形成上清液;和

对所述上清液进行阴离子交换色谱法分析,例如,用Q琼脂糖;从而纯化胶原蛋白7或其功能性片段。

本发明的一个或多个实施方案的细节将在下面的说明书中阐明。借由说明书和附图以及权利要求书,本发明的其他特征、目的和优点将是显而易见的。

详细说明

定义

“重组地操作以表达”或“经基因操作以表达”,如本文所使用,是指经过修饰的细胞以便表达蛋白质。示例性的修饰包括引入编码蛋白质的核酸,或将编码蛋白质的内源序列置于不是天然内源序列的序列的控制下,例如引入激活内源基因的序列。

分离的核酸分子,如本文所使用,意指已经从它们来源的基因组DNA或细胞RNA的核酸分离出的核酸。这包括通过合适的方法包括但不限于化学方法、化学和生物方法的组合获得的核酸分子,及分离的重组核酸分子。

重组的,如本文所使用,关于核酸分子,属于利用分子生物技术已被工程改造化的核酸分子。重组的,如本文所使用,关于蛋白质或多肽分子,属于使用分离的核酸分子或重组核酸分子表达的蛋白质或多肽分子。

高甘氨酸优化的或高甘氨酸密码子优化的,如本文所使用,是指编码胶原蛋白7或其功能片段的核酸序列。所述序列包括至少一个除最常见的甘氨酸密码子以外的甘氨酸密码子,在本文中称为不常见的密码子。在一个实施方案中,不常见的甘氨酸密码子是除了对于将表达序列的细胞而言最常见的甘氨酸密码子以外的那些。举个例子,如果序列将在CHO细胞中表达,不常见的甘氨酸密码子是除了CHO细胞中的最常见的甘氨酸密码子以外的那些。在一个实施方案中,不常见的甘氨酸密码子是本文所指的细胞的不常见的甘氨酸密码子,例如CHO或HEK细胞。在实施方案中,序列包括至少一个,并且在实施方案中,包括至少10、20或30个不存在于胶原蛋白7的天然人序列中的不常见的甘氨酸密码子。在一个实施方案中,至少10、20、30、40、50、60、70、80、90或100%的甘氨酸密码子是不常见甘氨酸密码子。

胶原蛋白7

作为锚原纤维的主要组分,胶原蛋白7的功能在于维持组织的完整性。锚原纤维在一些组织的上皮和间质层之间的界面上充当附着复合物的结构性成分,包括皮肤、口腔粘膜和子宫颈(Chung et al.Dermatol Clin 28(1):93-105(2010))。在皮肤中,锚原纤维从表皮基底膜的下部延伸到底层真皮乳头层,保护表皮基底膜和真皮乳头层之间的关联(Varki et al.J Med Genet 44:181-192(2007))。这种关联协助在表皮和真皮之间提供并维持凝聚力,促进皮肤的完整性,这对其正常的结构、功能和内环境稳定至关重要(Villone et al.J Biol Chem 283(36):24506-24513(2008))。

编码胶原蛋白7的核酸能用于本文所描述的方法中。高甘氨酸密码子优化的序列尤其适合。如下是人胶原蛋白7的示例性高甘氨酸的密码子优化的核苷酸序列:

aagcttcgaagtttaaactgagtgccgccaccatgaccctgcggctgctggtggctgccctgtgtgctggcatcctggccgaggctcctagagtgcgggcccagcaccgcgagagagtgacctgcaccagactgtacgccgccgatatcgtgttcctgctggacggctcctcctccatcggccggtccaacttccgggaagtgcggtccttcctggaaggcctggtgctgcctttctccggcgctgcctctgcccagggcgtcagattcgccaccgtgcagtactccgacgacccccggaccgagttcggcctggatgctctgggctctggcggcgacgtgatccgggccatcagagagctgtcctacaagggcggcaacacccggacaggcgccgctatcctgcacgtggccgaccatgtgtttctgccccagctggccagacccggcgtgcccaaagtgtgcatcctgatcaccgacggcaagtcccaggacctggtggacaccgccgctcagagactgaagggccagggcgtgaagctgttcgccgtgggcatcaagaacgccgaccccgaggaactgaagcgggtggcctcccagcctacctccgatttcttcttcttcgtgaacgacttctccatcctgcggaccctgctgcccctggtgtctcggagagtgtgtaccaccgctggcggcgtgccagtgacccggcctcctgacgattctacctccgcccctcgggatctggtgctgtccgagccttccagccagtccctgagagtgcagtggaccgccgcctctggccccgtgaccggctacaaggtgcagtacacccctctgaccggcctgggccagcctctgccttctgagcggcaagaagtgaacgtcccagccggcgagacatccgtgcggctgagaggcctgaggcccc tgaccgagtaccaagtgaccgtgatcgccctgtacgccaacagcatcggcgaggccgtgtccggcaccgccagaaccacagccctggaaggacccgagctgaccatccagaacaccaccgcccactccctgctggtcgcttggagatctgtgcctggcgccaccggctatcgcgtgacctggcgagttctgtctggcggccctacccagcagcaagagctgggccctggacagggctctgtgctgctgagggacctggaacccggcaccgactacgaagtgacagtgtccaccctgttcggcagatccgtgggccctgccacctctctgatggccagaaccgacgcctccgtggaacagaccctgaggcctgtgatcctgggccccaccagcatcctgctgagctggaacctggtgcccgaggccagaggctaccggctggaatggcggagagagacaggcctggaacctccccagaaggtggtcctgccctccgacgtgaccagataccagctggatggcctgcagcctggcaccgagtacagactgaccctgtacaccctgctcgagggccacgaggtggccacccctgctacagtggtgcctaccggccctgagctgcccgtgtcccctgtgaccgatctgcaggccaccgagctgcctggccagcgcgtcagagtgtcttggtccccagtgccaggcgctacccagtaccggatcatcgtgcggtccacacagggcgtggaaagaaccctggtgctccccggctcccagaccgccttcgacctggatgatgtgcaggccggcctgagctacaccgtgcgggtgtccgctagagtgggccctagagaaggctccgccagcgtgctgaccgtgcgcagagagcctgaaacccctctggccgtgcccggactgcgggtggtggtgtctgatgccaccagagtcagagtggcctggggccctgtgccaggggcctccggcttcagaatctcctggtccaccggctctggccctgagtcctctcagaccctgccccctgactccaccgccaccgatatcaccggactgcagcccggaaccacctaccaggtggccgtgtctgtgctgaggggcagagaagagggcccagccgccgtgatcgtggccaggacagatcctctgggcccagtgcggaccgtgcacgtgacccaggccagctccagctccgtgaccatcacctggaccagagtccctggcgctacaggctacagagtgtcctggcactctgcccacggccccgagaagtcccagctggtgtctggcgaggccaccgtggctgaactggacggcctcgagcccgacacagagtacacagtgcacgtgcgcgcccatgtggctggcgtggacggacctcctgcttccgtggtcgtgcgcaccgctcctgagcccgtgggaagagtgtcccggctgcagatcctgaacgcctccagcgacgtgctgcggatcacctgggtcggagtgaccggcgctaccgcttacagactggcttggggcagatctgagggcggacccatgcggcatcagatcctgcctggcaacaccgactccgccgagatcagaggactggaaggcggcgtgtcctactctgtgcgcgtgaccgccctcgtgggcgacagagaaggcacccccgtgtccatcgtggtcaccacccctccagaggcccctccagctctgggcaccctgcatgtggtgcagcggggcgagcactccctgagactgagatgggagcctgtgcctcgggcccagggcttcctgctgcattggcagcctgaaggcggccaagagcagtctagggtgctgggccccgagctgtccagctaccacctggacggactggaaccagccacccagtacagagtgcggctgtccgtgctgggacctgccggcgagggaccttctgccgaagtgaccgccaggaccgagtcccctcgggtgccctccatcgagctgagagtggtggataccagcatcgacagcgtgaccctggcctggacccctgtgtcccgggcctcttcctacatcctgtcttggaggcctctgaggggcccaggccaagaggtgccaggctcccctcagacactgccaggcatcagctcctcccagcgcgtgacaggactcgagcctggggtgtcctacatcttctccctgacccccgtcctggacggcgtgcgcggacctgaggcttctgtgacccagaccccagtgtgccccagaggcctggccgacgtggtctttctgcctcacgccacccaggacaacgcccacagagccgaggctaccagacgggtgctcgagagactggtgctggccctgggaccactgggcccacaggctgtgcaagtgggcctgctgtcttactcccaccggccctcccccctgttccccctgaacggctctcacgacctgggcatcatcctgcagcggatccgggacatgccctacatggacccctccggcaacaacctgggcaccgccgtggtcacagcccaccggtacatgctggcccccgatgctcctggcagacggcagcatgtccccggcgtgatggtgctgctcgtggacgagcccctgcggggcgacatcttcagccctatcagagaggcccaggctagcggcctgaacgtggtcatgctgggcatggctggcgccgaccctgagcagctgagaaggctggcccctggcatggactccgtgcagaccttctttgccgtggacgacggccccagcctggatcaggctgtgtctggcctggctaccgccctgtgtcaggcctccttcaccacccagcccagacccgagccttgccccgtgtactgccctaagggccagaagggcgagcccggcgagatgggcctgagaggacaagtgggacctccaggcgatcccggcctgcctggaagaacaggcgctcctggacctcagggccctcctggctctgctaccgctaagggcgagagaggcttcccaggcgccgacggcagacctggctctccaggcagagccggcaatcctggaacacctggcgccccaggcctgaagggatctcctggcttgcctggccctaggggcgaccctggcgaaagaggacctagaggccctaaaggcgagccaggcgcccctggccaagtgatcggcggagaaggacctggactgcccggcagaaagggcgatcctggcccttctggcccacccggcccaagaggtcctctgggagatcctggaccaaggggcccaccaggcctgcccggaacagctatgaagggcgataagggcgacaggggcgagcggggaccaccaggaccaggcgaaggtggaatcgctcccggcgaacctgggctgccaggactgcctggatctcccggaccacagggacctgtgggcccacctggcaagaagggggagaaaggcgactccgaggacggggctccaggattgcccggccaaccaggctctcctggcgaacagggtcccagaggacctcccggcgctatcggcccaaagggggacagaggattccctggcccactgggcgaggctggcgaaaaaggcgaacgcggaccccctggccctgccggcagtagaggacttcctggcgttgccggcagaccaggcgccaagggacctgaaggccctccaggccctaccggaaggcagggcgaaaagggggaacctggcaggccaggcgacccagctgttgtgggaccagccgtggctggacccaaaggcgagaaaggggatgtgggacccgctgggcctagaggcgctactggcgttcagggggaaagaggcccccctggactcgtgctgcctggggatccaggtcctaagggggatcccggcgatagaggcccaatcggcctgaccggcagagctggtccccctggcgattccggtcctcccggggaaaaaggggaccccggtagaccaggtcccccaggccctgttggccctcgcggaagagatggcgaagtgggagaaaagggcgacgaaggacccccaggggacccaggacttccaggcaaggctggggagagaggactgaggggcgctccaggtgtcagaggccctgtcggcgagaagggggatcagggcgatccaggcgaggacggcagaaacggctcccctggctctagtggtccaaaaggcgaccggggagagcctgggcctcctgggccaccaggcagactggtcgataccggacctggggccagagagaagggcgaaccaggggataggggccaagaaggcccacgaggaccaaagggcgacccaggattgcctggcgctcctggcgagaggggcatcgagggctttagaggtccacccggtccccaaggcgaccccggcgttaggggacctgctggggagaagggcgacagaggcccacccggactggacggcagatctggcctggatggcaagcctggcgccgctggcccatctggacctaacggcgctgctggcaaagccggggaccctggacgagatggactgccagggctgcggggagaacagggccttccaggaccttcaggaccacctggcctccctggcaagcccggggaggatggaaagcccggcctgaatggaaaaaacggggaacccggggatcctggggaggacggacgcaagggggaaaagggcgattccggcgcctctggcagagagggcagggacggaccaaaaggggagcgcggagcacccggcattctgggtcctcaggggccacctggattgccaggtccagttggtcctcctggccaggggtttcccggcgtcccaggcggtacagggcctaaaggggatagaggcgagacaggcagcaaaggggaacaggggctcccaggcgaaaggggcttgagaggcgagcctggctccgtgcctaacgtggacagactgctggaaaccgccggcatcaaggcctccgccctgcgcgagatcgtggaaacctgggacgagtcctccggctccttcctgcccgtgcctgagcgcagaaggggcccgaaaggggactctggcgagcaaggaccacccggcaaagagggacccatcggcttccctggggagcgggggttgaaaggcgataggggagatccaggcccacaagggcctccagggctggcacttggagagcgtggtcctccaggaccaagcggactggcaggggagcccggaaagcctggaatccccgggttgcctggtagagccggcggagtgggcgaagcaggcaggcctggggaacgcggagagagaggcgaaaagggcgaaagaggggagcagggccgcgacggtccccccggactacctggaactccagggcccccaggaccccccggacctaaggtgtccgtggatgagcctggccccggactgagcggagaacaaggtccacctggcttgaagggtgccaagggggagccaggctctaacggcgatcaagggcccaagggggatcggggagtgcctggcatcaaaggggaccggggcgaacccggtcctagagggcaagacggaaaccccggcttgccgggcgaacggggaatggctggtcccgagggaaagccaggcttgcagggacctagggggcctcccggtcctgtgggtggacatggcgatccgggtccaccaggtgctccaggactcgctggtccagcaggccctcagggaccatccggcctgaaaggggaaccaggcgaaactggccccccaggcagaggcctgacaggccctactggtgctgtgggcctccctggacctcctggccctagtggactcgtgggccctcagggctctcccggactgccaggccaagtgggcgagactggaaaacccggggctcccggcagggatggcgcttctggaaaagacggcgataggggcagccctggcgtgcccggtagtccagggctacctggccctgtgggtcccaaaggggagcctggacctacaggcgcaccaggccaggctgtagtggggctgcctggcgctaaaggcgagaagggtgctcctggcggcctggctggcgatctcgttggagaacctggcgccaagggcgaccgtggcttgccaggacctcgcggcgagaaaggcgaagctggcagagctggcgagcctggggacccaggcgaagatggccagaaaggcgctcccggccctaagggattcaagggcgatccgggcgtgggcgtgccaggctctccaggtcctcctggaccacccggtgtcaagggcgatttgggccttcctggcctgccaggggcacctggcgtcgtgggctttcctggacagaccggcccacggggagagatgggacagccaggccccagcggagaaagagggctggctggcccgcctggcagggaaggcataccaggcccattggggcctccaggcccacctggatctgtggggcctcctggcgcctctggactgaaaggcgacaaaggcgatcctggtgtcggcctgccaggcccaagaggcgagaggggagagcccggcatcaggggcgaagatggacggcctggccaagagggccctcggggattgaccggccctcctggatccagaggcgaacggggggagaagggggacgtgggctctgctggcctcaaaggcgacaagggggactccgccgtgattctgggccctcccggacctcggggagctaagggggacatgggagagaggggtccacggggactggatggggacaagggaccacgcggagacaacggcgacccgggggataagggctccaagggcgaacctggcgataagggatccgctggactgcctggcctgaggggcctgctgggacctcaaggacaaccaggcgccgcaggcatccctggcgaccctggatctcctggaaaggacggcgtgcccggcatccgcggagaaaagggggatgtcggcttcatgggccccagggggctgaagggggaaaggggagtgaagggcgcttgcggcctcgatggggaaaagggggacaagggggaggctggccctccaggacgacctggactggctggccacaagggcgaaatgggagagccaggcgtgcccggacagtccggcgctccaggcaaagagggcctgatcggccccaaaggcgatagaggatttgacggccagcctggcccaaagggcgatcaaggcgaaaaaggggagagaggcacccccggcatcggcggctttccaggcccctctggaaacgatggctctgccggcccacctgggccacctggtagtgtgggaccaagaggccccgagggactgcagggacagaaaggcgagagagggccccctggcgagagagttgtgggagcacctggcgttcccggcgcacccggcgaaaggggagaacaaggcagacctggaccagccggaccccgtggggaaaaaggcgaggccgccctgaccgaggacgacatcagaggcttcgtgcggcaagagatgtcccagcactgcgcctgtcagggccagtttatcgcctccggcagcagacccctgccttcctacgctgccgataccgccggctctcagctgcacgctgtgcctgtgctccgggtgtcccacgccgaggaagaggaaagagtccctcctgaggacgacgagtacagcgagtactctgagtattccgtggaagagtaccaggatcccgaggccccttgggacagcgacgacccttgctccctgcctctggatgagggctcctgcaccgcctacaccctgagatggtatcaccgggccgtgacaggctccaccgaggcctgtcaccctttcgtgtatggcggctgcggcggcaacgccaatagattcggcacccgcgaggcctgcgagcggagatgtcctcccagagtggtgcagtcccagggcaccggcacagcccaggactgatagtctagagtggccggcc

(SEQ ID NO:1)

如下是人胶原蛋白7的氨基酸序列:

mtlrllvaalcagilaeaprvraqhrervtctrlyaadivflldgsssigrsnfrevrsfleglvlpfsgaasaqgvrfatvqysddprtefgldalgsggdvirairelsykggntrtgaailhvadhvflpqlarpgvpkvcilitdgksqdlvdtaaqrlkgqgvklfavgiknadpeelkrvasqptsdffffvndfsilrtllplvsrrvcttaggvpvtrppddstsaprdlvlsepssqslrvqwtaasgpvtgykvqytpltglgqplpserqevnvpagetsvrlrglrplteyqvtvialyansigeavsgtarttalegpeltiqnttahsllvawrsvpgatgyrvtwrvlsggptqqqelgpgqgsvllrdlepgtdyevtvstlfgrsvgpatslmartdasveqtlrpvilgptsillswnlvpeargyrlewrretgleppqkvvlpsdvtryqldglqpgteyrltlytlleghevatpatvvptgpelpvspvtdlqatelpgqrvrvswspvpgatqyriivrstqgvertlvlpgsqtafdlddvqaglsytvrvsarvgpregsasvltvrrepetplavpglrvvvsdatrvrvawgpvpgasgfriswstgsgpessqtlppdstatditglqpgttyqvavsvlrgreegpaavivartdplgpvrtvhvtqassssvtitwtrvpgatgyrvswhsahgpeksqlvsgeatvaeldglepdteytvhvrahvagvdgppasvvvrtapepvgrvsrlqilnassdvlritwvgvtgatayrlawgrseggpmrhqilpgntdsaeirgleggvsysvrvtalvgdregtpvsivvttppeappalgtlhvvqrgehslrlrwepvpraqgfllhwqpeggqeqsrvlgpelssyhldglepatqyrvrlsvlgpagegpsaevtartesprvpsielrvvdtsidsvtlawtpvsrassyilswrplrgpgqevpgspqtlpgisssqrvtglepgvsyifsltpvldgvrgpeasvtqtpvcprgladvvflphatqdnahraeatrrvlerlvlalgplgpqavqvgllsyshrpsplfplngshdlgiilqrirdmpymdpsgnnlgtavvtahrymlapdapgrrqhvpgvmvllvdeplrgdifspireaqasglnvvmlgmagadpeqlrrlapgmdsvqtffavddgpsldqavsglatalcqasfttqprpepcpvycpkgqkgepgemglrgqvgppgdpglpgrtgapgpqgppgsatakgergfpgadgrpg spgragnpgtpgapglkgspglpgprgdpgergprgpkgepgapgqviggegpglpgrkgdpgpsgppgprgplgdpgprgppglpgtamkgdkgdrgergppgpgeggiapgepglpglpgspgpqgpvgppgkkgekgdsedgapglpgqpgspgeqgprgppgaigpkgdrgfpgplgeagekgergppgpagsrglpgvagrpgakgpegppgptgrqgekgepgrpgdpavvgpavagpkgekgdvgpagprgatgvqgergppglvlpgdpgpkgdpgdrgpigltgragppgdsgppgekgdpgrpgppgpvgprgrdgevgekgdegppgdpglpgkagerglrgapgvrgpvgekgdqgdpgedgrngspgssgpkgdrgepgppgppgrlvdtgpgarekgepgdrgqegprgpkgdpglpgapgergiegfrgppgpqgdpgvrgpagekgdrgppgldgrsgldgkpgaagpsgpngaagkagdpgrdglpglrgeqglpgpsgppglpgkpgedgkpglngkngepgdpgedgrkgekgdsgasgregrdgpkgergapgilgpqgppglpgpvgppgqgfpgvpggtgpkgdrgetgskgeqglpgerglrgepgsvpnvdrlletagikasalreivetwdessgsflpvperrrgpkgdsgeqgppgkegpigfpgerglkgdrgdpgpqgppglalgergppgpsglagepgkpgipglpgraggvgeagrpgergergekgergeqgrdgppglpgtpgppgppgpkvsvdepgpglsgeqgppglkgakgepgsngdqgpkgdrgvpgikgdrgepgprgqdgnpglpgergmagpegkpglqgprgppgpvgghgdpgppgapglagpagpqgpsglkgepgetgppgrgltgptgavglpgppgpsglvgpqgspglpgqvgetgkpgapgrdgasgkdgdrgspgvpgspglpgpvgpkgepgptgapgqavvglpgakgekgapgglagdlvgepgakgdrglpgprgekgeagragepgdpgedgqkgapgpkgfkgdpgvgvpgspgppgppgvkgdlglpglpgapgvvgfpgqtgprgemgqpgpsgerglagppgregipgplgppgppgsvgppgasglkgdkgdpgvglpgprgergepgirgedgrpgqegprgltgppgsrgergekgdvgsaglkgdkgdsavilgppgprgakgdmgergprgldgdkgprgdngdpgdkgskgepgdkgsaglpglrgllgpqgqpgaagipgdpgspgkdgvpgirgekgdvgfmgprglkgergvkgacgldgekgdkgeagppgrpglaghkgemgepgvpgqsgapgkegligpkgdrgfdgqpgpkgdqgekgergtpgiggfpgpsgndgsagppgppgsvgprgpeglqgqkgergppgervvgapgvpgapgergeqgrpgpagprgekgeaalteddirgfvrqemsqhcacqgqfiasgsrplpsyaadtagsqlhavpvlrvshaeeeervppeddeyseyseysveeyqdpeapwdsddpcslpldegsctaytlrwyhravtgsteachpfvyggcggnanrfgtreacerrcpprvvqsqgtgtaqd

(SEQ ID NO:2)

脯氨酸肽酶

脯氨酸肽酶是一种胞质亚胺二肽酶,其特异性地分裂亚胺二肽酶与C-末端脯氨酸或羟脯氨酸残基。所述酶在从亚胺二肽酶中回收脯氨酸起着重要的作用,主要衍生自胶原蛋白的降解产物,用于胶原蛋白和其它含脯氨酸蛋白质的再合成。特异的宿主细胞需要补充脯氨酸肽酶,以确保重组胶原蛋白的适当的合成(如(Miltyk et al.J Biochem 144(3):409-414(2008)中所引用)。本文所描述的宿主细胞重组地操作以表达胶原蛋白7,可被重组地操作也表达人脯氨酸肽酶。如下是人脯氨酸肽的示例性氨基酸序列:

maaatgpsfwlgnetlkvplalfalnrqrlcerlrknpavqagsivvlqggeetqryctdtgvlfrqesffhwafgvtepgcygvidvdtgkstlfvprlpashatwmgkihskehfkekyavddvqdeiasvltsqkpsvlltlrgvntdsgsvcreasfdgiskfevnntilhpeivecrvfktdmelevlrytnkisseahrevmkavkvgmkeyeleslfehycysrggmrhssytcicgsgensavlhgagapndrtiqngmclfdmggeyycfasditcsfpangkftadqkavyeavlrssravmgamkpgvwwpdmhrladrihleelahmgilsgsvdamvqahlgavfmphglghflgidvhdvggypgvridepglrslrtarhlqpgmvltvepgiyfidhlldealadparasflnrevlqrfrgfggvrieedvvvtdsgielltcvprtveeieacmagcdkaftpfsgpk

(SEQ ID NO:4)

编码人脯氨酸肽酶的示例性核酸序列提供如下:

(SEQ ID NO:3)

糖基转移酶

可应用哺乳动物宿主细胞,例如CHO细胞,以生产糖基化的重组蛋白质,例如胶原蛋白7,因为它们配备有类似于人类的糖基化机制。然而,唾液酸化方面有显著区别:人源的N-连接的聚糖在K2,3-和K2,6-键都携带末端唾液酸残基,然而从CHO和BHK细胞的糖蛋白中只发现了K2,3末端唾液酸。确实,这些细胞系缺乏编码K2,6-唾液酸转移酶的功能性拷贝(Bragonzi et al.Biochim Biophys Acta1474(3):273-82(2000))。在操作所述宿主细胞以重组地表达胶原蛋白7或胶原蛋白7和脯氨酸肽酶之前、之后或同时,可重组地操作宿主细胞以表达人糖基转移酶,rST6Gal1。

褐鼠ST6β-半乳糖胺α-2,6-唾液酸转移酶1(St6gal1),转录变体1(rST6Gal1)的氨基酸序列

mihtnlkkkfslfilvfllfavicvwkkgsdyealtlqakefqmpksqekvamgsasqvvfsnskqdpkedipilsyhrvtakvkpqpsfqvwdkdstysklnprllkiwrnylnmnkykvsykgpgvkfsvealrchlrdhvnvsmieatdfpfnttewegylpkenfrtkvgpwqrcavvssagslknsqlgreidnhdavlrfngaptdnfqqdvgskttirlmnsqlvttekrflkdslytegilivwdsyhadipkwyqkpdynffetyksyrrlnpsqpfyilkpqmpwelwdiiqeisadliqpnppssgmlgiiimmtlcdqvdiyeflpskrktdvcyyhqkffdsactmgayhpllfeknmvkhlnegtedylfgkatlsgfrnirc

(SEQ ID NO:5)

人ST6β-半乳糖胺α-2,6-唾液酸转移酶1(St6gal1),转录变体1(rST6Gal1)的核苷酸序列能被优化。

脯氨酰羟化酶

示例性脯氨酰羟化酶如下所描述:

(SEQ ID NO:X)

热休克蛋白质47(HSP47)

HSP47是驻留在内质网中的伴侣蛋白质,其在前胶原的形成中发挥功能。HSP47辅助将前胶原转运至内质网中。HSP47也助于使新生多肽保持非折叠状态直至合成完成,且前胶原在前胶原螺旋构成的驱动下从HSP47中释放出来。在操作所述宿主细胞以重组地表达胶原蛋白7或胶原蛋白7和脯氨酸肽之前、之后或同时,可重组地操作本发明的宿主细胞以表达人HSP47。

亲环素B(Cyp B)

亲环素B是发现于内质网中的肽脯氨酰顺反异构酶。亲环素B的功能在于结合HSP47以促进前胶原蛋白的折叠和运输。在操作所述宿主细胞以重组地表达胶原蛋白7或胶原蛋白7和脯氨酸肽之前、之后或同时,可重组地操作本发明的宿主细胞以表达人亲环素B。

蛋白质二硫键异构酶(PDI)

蛋白质二硫键异构酶(PDI)是ER驻留巯基氧化还原酶蛋白质。PDI辅助蛋白质折叠,一部分是通过催化二硫键的形成、还原和异构化。PDI通过催化C-前肽域之间的链间二硫键的形成促进胶原蛋白三聚体的稳定。在操作所述宿主细胞以重组地表达胶原蛋白7或胶原蛋白7和脯氨酸肽之前、之后或同时,可重组地操作本发明的宿主细胞以表达人PDI。

氧化戊二酸载体(OGC)

氧化戊二酸载体(OGC)是线粒体驻留蛋白质,其转运α-酮戊二酸通过线粒体的内膜并且促进脱羧基的α-酮戊二酸与脯氨酸的缀合。在操作所述宿主细胞以重组表达胶原蛋白7或胶原蛋白7和脯氨酸肽之前、之后或同时,可重组地操作宿主细胞以表达人OGC。

载体

本文所使用的适合的载体是能表达胶原蛋白7、脯氨酸肽酶、糖基转移酶、HSP47、亲环素B、PDI、OGC或者参与前胶原的装配或折叠的分子伴侣或其功能性部分的那些。为了表达本文所描述的蛋白质,编码适当蛋白质的核苷酸序列、或功能性等同物能被插入到适合的载体中。适合的载体含有对插入的核酸序列的表达必要的和适当的转录和翻译控制序列。可使用本领域技术人员已知的标准方法以构建本文所述的含有核酸序列的重组表达载体。这些方法包括,但不限于,体外重组技术、合成技术和体内重组/基因重组;方法的选择取决于特定的核苷酸片段的性质,并可由本领域的技术人员来确定。

用于本文的适合的载体可含有复制起点和限制性内切酶序列位点。本领域技术人员应该具备用于宿主细胞的合适的复制起点和限制性内切酶序列的知识。用于本文的适合的载体可含有以辅助转录的序列元件,包括但不限于启动子和增强子元件。本领域技术人员应该具备多种转录控制元件的知识,包括但不限于适合于宿主细胞的启动子、诱导型启动子和增强子元件。本文所使用的适合的载体也可含有选择性标记基因,其编码宿主细胞在特定条件下生长和生存所需的产物,协助选择载体已被引入其中的宿主细胞。典型的选择基因可包括,但不限于,编码赋予对抗生素、药物或毒素(例如,四环素,氨苄青霉素,新霉素,潮霉素等)的抗性的蛋白质的基因。本领域技术人员应该具备用于宿主细胞中的适合的选择性标记和报告基因的编码序列的知识。

本文所描述的表达载体可通过常规转化或转染技术被引入宿主细胞。转化和转染技术包括,但不限于磷酸钙或氯化钙共沉淀、DEAE-葡聚糖-介导的转染、脂质体转染、电穿孔、显微注射和病毒介导的转染(如美国专利No.6,632,637所引用(McGrew))。本领域技术人员应该具备基于宿主细胞/载体组合的适合的转化和转染方法的知识。长远考虑,重组蛋白质的高产量,重组蛋白质的稳定表达可以是优选的。稳定地表达重组蛋白质的宿主细胞可以被工程化改造。

细胞

本文所描述的重组表达载体可被引入到适合的宿主细胞中,其可包括能够从所定义的重组表达载体表达蛋白质编码区的活细胞。术语“宿主细胞”不仅是指特定的受试细胞,还是指特定的受试细胞的子代或潜在子代。因为某些修饰由于突变或环境影响可能发生于后代,此种子代可能实际上不同于亲本细胞,但仍包括在本文所使用的术语的范围之内。多种宿主细胞表达系统可以被使用以表达本文所描述的核酸分子。这些包括,但不限于用含有适当的核酸序列的重组酵母或真菌表达载体转化的酵母或真菌;感染了重组病毒表达载体或用含有适当的核酸序列的重组质粒表达载体转化的昆虫细胞系统;或用含有适当的核酸序列的表达载体转染的哺乳动物细胞系统(例如,灵长类动物细胞、人细胞、啮齿动物细胞等)。适合的宿主细胞可以包括原发或转化的细胞系,包括但不限于成纤维细胞、CHO、HEK293、C127、VERO、BHK、HeLa、COS、MDCK等(如美国专利No.6,632,637(McGrew)所引用)。其他适合的宿主细胞为本领域技术人员所知。

包括但不限于糖基化、磷酸化和加工蛋白质产物的修饰,对蛋白质的功能是重要的。不同的宿主细胞对于蛋白质的翻译后的加工和修饰具有多种特征和机制。可以选择能够调节包含在载体中的核酸序列的表达、或能够调节所述载体核酸序列的表达、或能够以特定方式修饰和加工在所述载体序列中所编码的基因产物的宿主细胞。可以选择哺乳动物宿主细胞,以确保重组蛋白质的正确修饰和处理。这样的哺乳动物宿主细胞可以包括但不限于CHO、HEK293、人成纤维细胞和人角质形成细胞。

细胞培养

标准的细胞培养的步骤和条件可以用于本文所描述的宿主细胞的培养,并为本领域技术人员所知。为重组胶原蛋白7的表达所培养的宿主细胞,例如HEK293细胞,可以在常规使用的细胞培养基中培养(例如Dulbecco氏改良Eagle培养基(DMEM)/Ham氏F-12(1:1)加入血清、抗生素等的适合补充,取决于用法)如参考((Chen et al.J Bio Chem 277(18):2118-2124(2002)),(Chen et al.J Bio Chem 275:32(11):24429-24435(2000)),(Chen et al.J Bio Chem 276(24):21649-21655(2001))。

宿主细胞可以被工程化改造以表达其他蛋白质以优化重组胶原蛋白7或其功能性片段的生产。这可以包括但不限于本文所描述的加工酶脯氨酸肽酶和/或糖基转移酶的共表达,其通过将分离的核酸或编码适当的核酸序列的重组表达载体外源性引入到包括胶原蛋白7核酸序列或重组表达载体的宿主细胞中。胶原蛋白7的三螺旋装配通常需要羟基化和抗坏血酸在宿主细胞的生长培养基中的存在。如参考文献所证明的(Chen et al.J Bio Chem 277(18):2118-2124(2002)),在抗坏血酸存在下从HEK293细胞生产、回收和纯化的重组7型胶原蛋白分泌为约900-kDa蛋白质,相当于三个7型胶原蛋白单体的联合(每个单体290-kDa)。抗坏血酸可以用在宿主细胞的培养条件中以协助对重组蛋白质的适当加工。可以向细胞培养基加入额外补充以协助对重组蛋白质的适当加工,包括但不限于磷酸-抗坏血酸(PAA)、4mMα-酮戊二酸、FeSO4或Optiferrin。

同源序列

本发明的方法和组合物包括多肽和核酸,其具有指定序列、或与指定序列基本上相同或相似的序列,例如与指定序列至少70%、85%、90%、95%或更高的同一性的序列。在氨基酸序列的上下文中,术语“基本上相同”在本文中用来指包括足够或最少数量的氨基酸残基的第一氨基酸,其是i)相同于,或ii)对第二氨基酸序列中对齐的氨基酸残基的保守取代,使得第一和第二氨基酸序列能具有共同的结构域和/或共同的功能活性。例如所包含的共同结构域与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列被称为是基本上相同。

在核苷酸序列的上下文中,术语“基本上相同”在本文中用来指包括与第二核酸序列中的对齐的核苷酸相同的足够或最小数量的核苷酸的第一核酸序列,使得第一和第二核苷酸序列编码具有共同功能活性的多肽、或编码共同结构性多肽域或共同功能多肽活性。例如,具有与SEQ ID NO:1、3或5至少70%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列被称为是基本上相同。

术语“功能性变体”是指与天然存在的序列具有基本上相同的氨基酸序列的多肽,或由基本上相同的核苷酸序列所编码的多肽,且能够具有天然存在的序列的一个或多个活性的多肽。

序列之间的同源性或序列同一性的计算(该术语在本文可互换使用)执行如下。

为了测定两个氨基酸序列、或两个核酸序列的百分比同一性,出于最佳比较的目的来比对序列(例如,可将缺口引入第一和第二氨基酸或核酸序列之一或两者中为获得最佳比对,且非同源序列可以出于比较的目的不予以考虑)。在一个优选的实施方案中,出于比较的目的比对的参照序列的长度是参照序列长度的至少30%,优选地至少40%,更优选地至少50%、60%,并且甚至更优选地至少70%、80%、90%、100%。然后比较在相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位置由与第二序列中相应位置的相同的氨基酸残基或核苷酸占据时,那么所述分子在那个位置是相同的(如本文所使用,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)

两个序列之间的百分比同一性是在考虑到为了所述两个序列的最佳比对而需要引入的缺口数和各个缺口的长度的条件下,这些序列所共享的相同位置的数的函数。

序列的比较和两个序列之间的百分比同一性的测定可以使用数学算法完成。在一个优选地实施方案中,两个氨基酸序列之间的百分比同一性使用Needleman和Wunsch((1970)J.Mol.Biol.48:444-453)算法测定,该算法已经纳入GCG软件包(可在http://www.gcg.com获得)的GAP程序中,其使用Blossum 62矩阵或PAM250矩阵,和16、14、12、10、8、6或4的缺口加权和1、2、3、4、5或6的长度加权。在又一个优选的实施方案中,两个核苷酸序列之间的百分比同一性使用GCG软件包(可在http://www.gcg.com获得)中的GAP程序测定,其使用NWSgapdna.CMP矩阵和40、50、60、70或80的缺口加权和1、2、3、4、5或6的长度加权。特别优选的参数设定(也是未另外指明时应该使用的参数设定)是Blossum 62得分矩阵,且缺口罚分为12,缺口延伸罚分为4,而移码缺口罚分为5。

两个氨基酸或核苷酸序列之间的百分比同一性可以使用E.Meyers和W.Miller((1989)CABIOS,4:11-17)的算法测定,该算法已经纳入ALIGN程序(2.0版),其使用PAM120重残表,缺口长度罚分为12且缺口罚分为4。

本文所描述的核酸和蛋白质序列可以用作“查询序列”针对公共数据库进行检索,例如,以鉴定其他家族成员或相关序列。这类检索可以使用Altschul,等(1990)J.Mol.Biol.215:403-10的NBLAST和XBLAST程序(2.0版)来进行。BLAST核苷酸检索可以用NBLAST程序,得分=100,字长=12来进行以获得与本发明的BMP-10/BMP-10受体核酸(SEQ ID NO:1)分子同源的核苷酸序列。BLAST蛋白质检索可以用XBLAST程序,得分=50,字长=3来进行以获得与本发明的BMP-10/BMP-10受体(SEQ ID NO:1)蛋白质分子同源的氨基酸序列。为了获得为了比较的目的的含缺口的比对,可以利用如Altschul等,(1997)Nucleic Acids Res.25:3389-3402中所描述的Gapped BLAST。当利用BLAST和Gapped BLAST程序时,可以使用各程序的缺省参数(例如,XBLAST和NBLAST)。参见http://www.ncbi.nlm.nih.gov

本发明还包括在低、中或高严格性下杂交至所述核酸的序列。如本文所使用,术语“在低严格性、中严格性、高严格性或极高严格性条件下杂交”描述了用于杂交和洗涤的条件。执行杂交反应的指导可在Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6中找到,其通过引用合并入本文。含水和不含水的方法均在该参考中描述且任意一种都可以使用。本文提及的具体杂交条件如下:1)低严格性杂交条件是在6X氯化钠/柠檬酸钠(SSC)中在约45℃,然后在0.2X SSC,0.1%SDS中在至少50℃下洗涤两次(对于低严格性条件洗涤液的温度可提高到55℃);2)中等严格性杂交条件是在6X SSC中在约45℃,然后在0.2X SSC,0.1%SDS在60℃中洗涤一次或多次;3)高严格性杂交条件是在6X SSC中在约45℃,然后在0.2X SSC,0.1%SDS在65℃洗涤一次或多次;以及优选地4)极高严格性杂交条件是在0.5M钠磷酸盐,7%SDS在65℃,然后在0.2X SSC,1%SDS在65℃洗涤一次或多次。极高严格条件(4)是优选的条件,且是未另外指明时应该使用的条件。

胶原蛋白7或其功能性片段的纯化

通过本文所描述的重组方法生产的蛋白质可从宿主细胞培养系统根据现有技术的标准规程(如沉淀、离心等)进行回收。本文所描述的重组胶原蛋白7可分泌到宿主细胞培养基中并通过硫酸铵沉淀和随后的离心进行回收;如以下参考中所阐释(Chen et al.J Bio Chem 277(18):2118-2124(2002))。本文所描述的通过重组和分子生物学的方法所生产和回收的蛋白质,可根据现有技术的标准规程(例如,透析、离子交换层析、亲和层析、SDS凝胶电泳等)进行纯化。本文所描述的重组胶原蛋白7可通过离子交换层析纯化;如以下参考中所阐释(Chen et al.J Bio Chem 277(18):2118-2124(2002))。

实施例

实施例1胶原蛋白7的生产和纯化

继代培养和冷冻细胞

1.用PBS(10毫升P150板)洗涤细胞。

2.加入6ml胰蛋白酶(PBS中0.05%胰蛋白酶-EDTA),并在37℃培养箱中孵育4至6分钟。细胞将分离为层。

3.加入6ml生长培养基,然后在圆锥形离心机以2K旋转5分钟。

4.在生长培养基中重悬细胞并以1:5比例继代培养细胞。

5.为冷冻细胞,我们使用含10%DMSO的生长培养基。一个融合P150板将产生大约2千万个细胞。

解冻和细胞再生长

1.取病毒RDEB/FB/C7(5X 106)并在37℃水浴中简单解冻。

2.放入含20ml生长培养基的P150板中并孵育过夜。

3.第二天更换新鲜的培养基。细胞应在2至3天后到达融合。

4.直接取出30μl培养基并接受抗VII型胶原蛋白抗体的免疫印迹以确保VII型胶原蛋白在培养基中的存在。

生长和收获培养基

生长培养基:DMEM/F12(1:1)添加L-谷氨酰胺和L碳酸氢钠(Mediatech,Inc.,DMEM以13.48g/L Cat.No.50-003-PB制备10L和Ham’s F-12培养基以10.64g/L Cat.No.50-040-PB制备10L),10%FBS(Omega Scientific Cat#FB-02)和200μg/ml抗坏血酸(Sigma CAT#A4544)(1ml 100mg/ml的储备溶液加入到500ml培养基)无血清培养基:无血清和抗坏血酸的DMEM/F12。

1.在P150板中20ml生长培养基中培养基因校正RDEB成纤维细胞,直至融合。

2.早上加入15ml无血清培养基(例如周一早上)。

3.第二天下午收获培养基并加回20ml生长培养基至细胞(周二下午)。

4.两天后,还在早上加入无血清培养基(周四早上)。

5.第二天下午收获培养基(周五下午)。

6.在下周一重复这个循环至少3至4个月,直至细胞分离(一段时间细胞可以持续6个月,并仍分泌大量Ⅶ型胶原蛋白)。

基因校正成纤维细胞的无血清培养基中含有大约4至8mg/LⅦ型胶原蛋白。纯化后,0.7至1mg的Ⅶ型胶原蛋白通常从1升培养基获得。

Ⅶ型胶原蛋白的纯化

材料:

硫酸铵

EDTA:500mM,pH 8

NEM:100mM

PMSF:100mM

Q琼脂糖TM Fast Flow(GE Healthcare CAT#17-0510-01)

1X缓冲液A:65mM NaCl

2mM Tris-HCl pH 8.6

1mM EDTA

对于2L 10X缓冲液A:76.11g NaCl

250ml 2M Tris-HCl pH 8.6

40ml 0.5M EDTA

第1天

1.收集经调节的细胞培养基并在4℃下以3000rpm旋转10分钟以除去细胞碎片。

2.测量收获体积(收集的完全培养基)

3.加入抑制剂:5mM EDTA(100倍)、50μM NEM和50μM PMSF(2000倍)

4.在冰上缓慢加入硫酸铵粉:0.3g/mL

5.4℃搅拌过夜。

第2天

6.在Beckman J2-M1转子14中以13,000rpm旋转1.5–2小时

7.弃上清液,然后风干沉淀10-15分钟。

8.把沉淀加入缓冲液A中:每50ml的收获体积使用1ml的缓冲液。

9.用DI H2O冲洗透析膜。

10.针对1X缓冲液A透析3次:每2小时更换一次,每次更换用2升。最新更换用于过夜。将1ml NEM和PMSF加入缓冲液。

第3天

11.以9k旋转透析培养基20分钟。注意体积改变。

12.除去上清液(S1)并放入单独的试管中。

13.重悬沉淀于等体积的缓冲液B中作为透析体积。

14.将其放置于实验台上约10分钟。

15.以9k离心20分钟。

16.除去上清液(S1')并放入另一个试管中。

17.重悬该沉淀于2ml的缓冲液C中以9k离心20分钟并收集上清液(S2)。Ⅶ型胶原蛋白将以不同的纯度在所有馏分中出现。S1馏分含有约50%Ⅶ型胶原蛋白但非常脏。通常该S1馏分不再用于进一步的纯化。良好的透析下,大部分胶原蛋白将在S1’中更纯。次优的透析下,大部分胶原蛋白将在S1馏分中,且非常脏。通常对该S1'馏分进行进一步Q-琼脂糖柱纯化。

来自S1'的Ⅶ型胶原蛋白柱纯化

18.用琼脂糖珠填充柱((使用前珠必须摇匀入溶液),并令其沉淀成所需体积。该柱的体积应是来自S1'的样品的约1/2装填量。

19.不能让该柱变干。用5x柱体积的缓冲液B进行洗涤(因此,如果是4ml柱则用20ml缓冲液B进行洗涤)

20.准备具有与柱体积的等体积的洗涤和洗脱试管。

21.在小eppendorf中保留200μl蛋白质样品并储存在冰上(以在最后运行凝胶作为对照)

22.制成试管并贴标签:2Xwash(缓冲液B),0.3M、0.4M和1.0M。凡是前面有2X的是指2倍柱体积(因此,如果柱体积为4ml,那么就用8ml)。装填样品上柱,小心不要过度搅乱柱表面。放置标有“流过物”的试管以收集流过物

23.所有东西保存在冰上。当样品已被流过一次,装填流过物使其再流一次并用标有“流过物”的试管收集流过物。

24.在柱运行干燥之前,用缓冲液B进行洗涤(相当于样品体积)两次并用标有洗涤的试管(因此如果是4ml,那么就用8ml缓冲液B)收集。继续用不断增加的盐浓度洗脱且以1.0M.2X洗涤(缓冲液B)、2X0.3M、2X 0.4M和1.0M A,1.0M B结束。(注:大部分C7在1.0M出现)。凡是前面有2X的是指2倍柱体积(因此如果柱体积是4ml那么使用8ml)。

25.加入抑制剂PMSF和NEM。1:100倍稀释到各个洗脱试管(因此如果是40ml使用40μl)。大部分C7将在0.5-1M经洗脱的馏分出现。

26.使样品在凝胶上运行(凝胶每次仅容纳9个样品)。给9个小eppendorf管贴标签X2(1个用于western印迹而另一个用于Coomassie染色):装填上样,持续运行,0.3M、0.4M...1.0M。

27.对上样染色:12μl BME/100μl的4X样品缓冲液→旋涡。

28.向所有试管加入10μl染料。

29.向试管中加入10ul样品用于ECL,40μl用于Coomassie亮蓝染色。

30.在6%丙烯酰胺凝胶上运行经收集的馏分用于Western印迹分析和Coomassie亮蓝染色。

VII型胶原蛋白的浓度和过滤

1.混合来自0.5、0.7和1.0M洗脱的VII型胶原蛋白馏分,用缓冲液B 3倍(例如,17ml到50ml)进行稀释。

2.装填50ml经稀释的馏分到1.5ml的Q-琼脂糖柱中两次。

3.用1.5ml缓冲液B洗涤柱两次。

4.用缓冲液B在1.0M盐中洗脱柱三次(将试管标为1.0A、1.0B和1.0C)。

5.用PBS透析浓缩物。

6.用0.2μm Super Membrane Acrodisc Syringe Filter(Pall Life Sciences)过滤。

7.冻存于-80℃冰箱中

其它实施方案包含在以下权利要求范围内。

优选的实施方式:

1.制造胶原蛋白7的方法,包括:

提供细胞,其经重组地操作以表达胶原蛋白7或其功能性片段,以及,可选的一种或多种增强胶原蛋白7的表达的多肽,例如,脯氨酸肽酶;

在足够用于生产胶原蛋白7和脯氨酸肽酶的条件下培养所述细胞,

从而制造胶原蛋白7。

2.项目1的方法,其中所述细胞经基因操作以表达糖基转移酶。

3.项目2的方法,其中所述糖基转移酶是唾液酸转移酶。

4.项目1的方法,其中所述细胞包括外源引入的、编码胶原蛋白7或其功能性片段的核酸,例如,本文所描述的高甘氨酸密码子优化的核酸序列。

5.项目1的方法,其中所述细胞包括外源引入的、编码脯氨酸肽酶的核酸。

6.项目1的方法,其中所述细胞包括外源引入的、编码糖基转移酶的核酸。

7.项目1的方法,其中所述细胞包括表达载体,其包括编码胶原蛋白7的序列。

8.项目7的方法,其中所述细胞包括第二表达载体,其包括编码脯氨酸肽酶的序列。

9.项目7的方法,其中所述细胞包括第三表达载体,其包括编码糖基转移酶的序列。

10.项目7的方法,其中所述细胞包括第二表达载体和第三表达载体,所述第二表达载体包括编码脯氨酸肽酶的序列,所述第三表达载体包括编码糖基转移酶的序列。

11.项目7的方法,其中所述表达载体进一步包括编码脯氨酸肽酶的序列。

12.项目7的方法,其中所述表达载体进一步包括编码糖基转移酶的序列。

13.项目7的方法,其中所述表达载体进一步包括编码脯氨酸肽酶的序列和编码糖基转移酶的序列。

14.项目1的方法,其中所述细胞是哺乳动物细胞。

15.项目1的方法,其中所述细胞是CHO细胞。

16.项目1的方法,其中所述细胞是HEK293细胞。

17.项目1的方法,其中所述胶原蛋白7是人胶原蛋白7。

18.项目1的方法,其中所述脯氨酸肽酶是人脯氨酸肽酶。

19.项目2的方法,其中所述糖基转移酶是人糖基转移酶。

20.项目1的方法,进一步包括从所述已培养的细胞回收胶原蛋白7或其功能性片段。

21.项目1的方法,其中所述胶原蛋白7或其功能性片段回收自培养基。

22.项目1的方法,进一步包括从所述已培养的细胞纯化胶原蛋白7或其功能性片段。

23.项目1的方法,进一步包括从培养基纯化胶原蛋白7或其功能性片段。

24.项目23的方法,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入同三聚体中。

25.项目23的方法,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入六聚体中。

26.本文所描述的载体。

27.载体的集合,包括至少两种本文所描述的载体。

28.本文所描述的细胞。

29.本文所描述的细胞的经分离的制备物。

30.细胞培养物,包括上述项目中任一项的细胞、培养基和由所述细胞生产的胶原蛋白7。

31.制造适合用于表达胶原蛋白7或其功能性片段的细胞的方法,包括:

重组地操作所述细胞以表达重组胶原蛋白7或其功能性片段;以及

可选地,重组地操作所述细胞以表达重组脯氨酸肽酶;

从而制造适合于表达重组胶原蛋白7或其功能性片段的细胞。

32.项目31的方法,其中在所述细胞经重组地操作表达重组糖基转移酶之前,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

33.项目31的方法,其中在所述细胞经重组地操作表达重组糖基转移酶之后,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

34.项目31的方法,其中在所述细胞经重组地操作表达重组糖基转移酶的同时,所述细胞经重组地操作以表达胶原蛋白7或其功能性片段。

35.项目31的方法,其中在操作所述细胞以重组地表达胶原蛋白7或其功能性片段之前,所述细胞经重组地操作以表达重组糖基转移酶。

36.项目31的方法,进一步包括重组地操作所述细胞以表达重组糖基转移酶。

37.项目31的方法,其中在操作所述细胞以重组地表达胶原蛋白7或其功能性片段之前、之后或同时,所述细胞经重组地操作以表达重组糖基转移酶。

38.通过本文所描述的方法所制造的胶原蛋白7或其功能性片段。

39.通过本文所描述的方法所制造的胶原蛋白7或其功能性片段的经纯化或经分离的制备物。

40.胶原蛋白的经纯化或经分离的制备物,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入同三聚体中。

41.胶原蛋白的经纯化或经分离的制备物,其中至少30、40、50、60、70、80、90或95%的所述胶原蛋白7或其功能性片段并入六聚体中。

42.纯化胶原蛋白7或其功能性片段的方法,包括:

提供经调节的细胞培养基;

沉淀蛋白质,例如,用硫酸铵;

溶解所述沉淀的蛋白质;

透析所述溶解的蛋白质;

沉降所述透析的样品以形成上清液;和

对上清液进行阴离子交换色谱法分析,例如,用Q琼脂糖;从而纯化胶原蛋白7或其功能性片段。

序列表

<110> LOTUS TISSUE REPAIR INC.

<120> 胶原蛋白7及相关方法

<130> IIC172651

<140> PCT/US2012/049553

<141> 2012-08-03

<150> 61/514,796

<151> 2011-08-03

<160> 6

<170> SIPOSequenceListing 1.0

<210> 1

<211> 8886

<212> DNA

<213> 智人

<400> 1

aagcttcgaa gtttaaactg agtgccgcca ccatgaccct gcggctgctg gtggctgccc 60

tgtgtgctgg catcctggcc gaggctccta gagtgcgggc ccagcaccgc gagagagtga 120

cctgcaccag actgtacgcc gccgatatcg tgttcctgct ggacggctcc tcctccatcg 180

gccggtccaa cttccgggaa gtgcggtcct tcctggaagg cctggtgctg cctttctccg 240

gcgctgcctc tgcccagggc gtcagattcg ccaccgtgca gtactccgac gacccccgga 300

ccgagttcgg cctggatgct ctgggctctg gcggcgacgt gatccgggcc atcagagagc 360

tgtcctacaa gggcggcaac acccggacag gcgccgctat cctgcacgtg gccgaccatg 420

tgtttctgcc ccagctggcc agacccggcg tgcccaaagt gtgcatcctg atcaccgacg 480

gcaagtccca ggacctggtg gacaccgccg ctcagagact gaagggccag ggcgtgaagc 540

tgttcgccgt gggcatcaag aacgccgacc ccgaggaact gaagcgggtg gcctcccagc 600

ctacctccga tttcttcttc ttcgtgaacg acttctccat cctgcggacc ctgctgcccc 660

tggtgtctcg gagagtgtgt accaccgctg gcggcgtgcc agtgacccgg cctcctgacg 720

attctacctc cgcccctcgg gatctggtgc tgtccgagcc ttccagccag tccctgagag 780

tgcagtggac cgccgcctct ggccccgtga ccggctacaa ggtgcagtac acccctctga 840

ccggcctggg ccagcctctg ccttctgagc ggcaagaagt gaacgtccca gccggcgaga 900

catccgtgcg gctgagaggc ctgaggcccc tgaccgagta ccaagtgacc gtgatcgccc 960

tgtacgccaa cagcatcggc gaggccgtgt ccggcaccgc cagaaccaca gccctggaag 1020

gacccgagct gaccatccag aacaccaccg cccactccct gctggtcgct tggagatctg 1080

tgcctggcgc caccggctat cgcgtgacct ggcgagttct gtctggcggc cctacccagc 1140

agcaagagct gggccctgga cagggctctg tgctgctgag ggacctggaa cccggcaccg 1200

actacgaagt gacagtgtcc accctgttcg gcagatccgt gggccctgcc acctctctga 1260

tggccagaac cgacgcctcc gtggaacaga ccctgaggcc tgtgatcctg ggccccacca 1320

gcatcctgct gagctggaac ctggtgcccg aggccagagg ctaccggctg gaatggcgga 1380

gagagacagg cctggaacct ccccagaagg tggtcctgcc ctccgacgtg accagatacc 1440

agctggatgg cctgcagcct ggcaccgagt acagactgac cctgtacacc ctgctcgagg 1500

gccacgaggt ggccacccct gctacagtgg tgcctaccgg ccctgagctg cccgtgtccc 1560

ctgtgaccga tctgcaggcc accgagctgc ctggccagcg cgtcagagtg tcttggtccc 1620

cagtgccagg cgctacccag taccggatca tcgtgcggtc cacacagggc gtggaaagaa 1680

ccctggtgct ccccggctcc cagaccgcct tcgacctgga tgatgtgcag gccggcctga 1740

gctacaccgt gcgggtgtcc gctagagtgg gccctagaga aggctccgcc agcgtgctga 1800

ccgtgcgcag agagcctgaa acccctctgg ccgtgcccgg actgcgggtg gtggtgtctg 1860

atgccaccag agtcagagtg gcctggggcc ctgtgccagg ggcctccggc ttcagaatct 1920

cctggtccac cggctctggc cctgagtcct ctcagaccct gccccctgac tccaccgcca 1980

ccgatatcac cggactgcag cccggaacca cctaccaggt ggccgtgtct gtgctgaggg 2040

gcagagaaga gggcccagcc gccgtgatcg tggccaggac agatcctctg ggcccagtgc 2100

ggaccgtgca cgtgacccag gccagctcca gctccgtgac catcacctgg accagagtcc 2160

ctggcgctac aggctacaga gtgtcctggc actctgccca cggccccgag aagtcccagc 2220

tggtgtctgg cgaggccacc gtggctgaac tggacggcct cgagcccgac acagagtaca 2280

cagtgcacgt gcgcgcccat gtggctggcg tggacggacc tcctgcttcc gtggtcgtgc 2340

gcaccgctcc tgagcccgtg ggaagagtgt cccggctgca gatcctgaac gcctccagcg 2400

acgtgctgcg gatcacctgg gtcggagtga ccggcgctac cgcttacaga ctggcttggg 2460

gcagatctga gggcggaccc atgcggcatc agatcctgcc tggcaacacc gactccgccg 2520

agatcagagg actggaaggc ggcgtgtcct actctgtgcg cgtgaccgcc ctcgtgggcg 2580

acagagaagg cacccccgtg tccatcgtgg tcaccacccc tccagaggcc cctccagctc 2640

tgggcaccct gcatgtggtg cagcggggcg agcactccct gagactgaga tgggagcctg 2700

tgcctcgggc ccagggcttc ctgctgcatt ggcagcctga aggcggccaa gagcagtcta 2760

gggtgctggg ccccgagctg tccagctacc acctggacgg actggaacca gccacccagt 2820

acagagtgcg gctgtccgtg ctgggacctg ccggcgaggg accttctgcc gaagtgaccg 2880

ccaggaccga gtcccctcgg gtgccctcca tcgagctgag agtggtggat accagcatcg 2940

acagcgtgac cctggcctgg acccctgtgt cccgggcctc ttcctacatc ctgtcttgga 3000

ggcctctgag gggcccaggc caagaggtgc caggctcccc tcagacactg ccaggcatca 3060

gctcctccca gcgcgtgaca ggactcgagc ctggggtgtc ctacatcttc tccctgaccc 3120

ccgtcctgga cggcgtgcgc ggacctgagg cttctgtgac ccagacccca gtgtgcccca 3180

gaggcctggc cgacgtggtc tttctgcctc acgccaccca ggacaacgcc cacagagccg 3240

aggctaccag acgggtgctc gagagactgg tgctggccct gggaccactg ggcccacagg 3300

ctgtgcaagt gggcctgctg tcttactccc accggccctc ccccctgttc cccctgaacg 3360

gctctcacga cctgggcatc atcctgcagc ggatccggga catgccctac atggacccct 3420

ccggcaacaa cctgggcacc gccgtggtca cagcccaccg gtacatgctg gcccccgatg 3480

ctcctggcag acggcagcat gtccccggcg tgatggtgct gctcgtggac gagcccctgc 3540

ggggcgacat cttcagccct atcagagagg cccaggctag cggcctgaac gtggtcatgc 3600

tgggcatggc tggcgccgac cctgagcagc tgagaaggct ggcccctggc atggactccg 3660

tgcagacctt ctttgccgtg gacgacggcc ccagcctgga tcaggctgtg tctggcctgg 3720

ctaccgccct gtgtcaggcc tccttcacca cccagcccag acccgagcct tgccccgtgt 3780

actgccctaa gggccagaag ggcgagcccg gcgagatggg cctgagagga caagtgggac 3840

ctccaggcga tcccggcctg cctggaagaa caggcgctcc tggacctcag ggccctcctg 3900

gctctgctac cgctaagggc gagagaggct tcccaggcgc cgacggcaga cctggctctc 3960

caggcagagc cggcaatcct ggaacacctg gcgccccagg cctgaaggga tctcctggct 4020

tgcctggccc taggggcgac cctggcgaaa gaggacctag aggccctaaa ggcgagccag 4080

gcgcccctgg ccaagtgatc ggcggagaag gacctggact gcccggcaga aagggcgatc 4140

ctggcccttc tggcccaccc ggcccaagag gtcctctggg agatcctgga ccaaggggcc 4200

caccaggcct gcccggaaca gctatgaagg gcgataaggg cgacaggggc gagcggggac 4260

caccaggacc aggcgaaggt ggaatcgctc ccggcgaacc tgggctgcca ggactgcctg 4320

gatctcccgg accacaggga cctgtgggcc cacctggcaa gaagggggag aaaggcgact 4380

ccgaggacgg ggctccagga ttgcccggcc aaccaggctc tcctggcgaa cagggtccca 4440

gaggacctcc cggcgctatc ggcccaaagg gggacagagg attccctggc ccactgggcg 4500

aggctggcga aaaaggcgaa cgcggacccc ctggccctgc cggcagtaga ggacttcctg 4560

gcgttgccgg cagaccaggc gccaagggac ctgaaggccc tccaggccct accggaaggc 4620

agggcgaaaa gggggaacct ggcaggccag gcgacccagc tgttgtggga ccagccgtgg 4680

ctggacccaa aggcgagaaa ggggatgtgg gacccgctgg gcctagaggc gctactggcg 4740

ttcaggggga aagaggcccc cctggactcg tgctgcctgg ggatccaggt cctaaggggg 4800

atcccggcga tagaggccca atcggcctga ccggcagagc tggtccccct ggcgattccg 4860

gtcctcccgg ggaaaaaggg gaccccggta gaccaggtcc cccaggccct gttggccctc 4920

gcggaagaga tggcgaagtg ggagaaaagg gcgacgaagg acccccaggg gacccaggac 4980

ttccaggcaa ggctggggag agaggactga ggggcgctcc aggtgtcaga ggccctgtcg 5040

gcgagaaggg ggatcagggc gatccaggcg aggacggcag aaacggctcc cctggctcta 5100

gtggtccaaa aggcgaccgg ggagagcctg ggcctcctgg gccaccaggc agactggtcg 5160

ataccggacc tggggccaga gagaagggcg aaccagggga taggggccaa gaaggcccac 5220

gaggaccaaa gggcgaccca ggattgcctg gcgctcctgg cgagaggggc atcgagggct 5280

ttagaggtcc acccggtccc caaggcgacc ccggcgttag gggacctgct ggggagaagg 5340

gcgacagagg cccacccgga ctggacggca gatctggcct ggatggcaag cctggcgccg 5400

ctggcccatc tggacctaac ggcgctgctg gcaaagccgg ggaccctgga cgagatggac 5460

tgccagggct gcggggagaa cagggccttc caggaccttc aggaccacct ggcctccctg 5520

gcaagcccgg ggaggatgga aagcccggcc tgaatggaaa aaacggggaa cccggggatc 5580

ctggggagga cggacgcaag ggggaaaagg gcgattccgg cgcctctggc agagagggca 5640

gggacggacc aaaaggggag cgcggagcac ccggcattct gggtcctcag gggccacctg 5700

gattgccagg tccagttggt cctcctggcc aggggtttcc cggcgtccca ggcggtacag 5760

ggcctaaagg ggatagaggc gagacaggca gcaaagggga acaggggctc ccaggcgaaa 5820

ggggcttgag aggcgagcct ggctccgtgc ctaacgtgga cagactgctg gaaaccgccg 5880

gcatcaaggc ctccgccctg cgcgagatcg tggaaacctg ggacgagtcc tccggctcct 5940

tcctgcccgt gcctgagcgc agaaggggcc cgaaagggga ctctggcgag caaggaccac 6000

ccggcaaaga gggacccatc ggcttccctg gggagcgggg gttgaaaggc gataggggag 6060

atccaggccc acaagggcct ccagggctgg cacttggaga gcgtggtcct ccaggaccaa 6120

gcggactggc aggggagccc ggaaagcctg gaatccccgg gttgcctggt agagccggcg 6180

gagtgggcga agcaggcagg cctggggaac gcggagagag aggcgaaaag ggcgaaagag 6240

gggagcaggg ccgcgacggt ccccccggac tacctggaac tccagggccc ccaggacccc 6300

ccggacctaa ggtgtccgtg gatgagcctg gccccggact gagcggagaa caaggtccac 6360

ctggcttgaa gggtgccaag ggggagccag gctctaacgg cgatcaaggg cccaaggggg 6420

atcggggagt gcctggcatc aaaggggacc ggggcgaacc cggtcctaga gggcaagacg 6480

gaaaccccgg cttgccgggc gaacggggaa tggctggtcc cgagggaaag ccaggcttgc 6540

agggacctag ggggcctccc ggtcctgtgg gtggacatgg cgatccgggt ccaccaggtg 6600

ctccaggact cgctggtcca gcaggccctc agggaccatc cggcctgaaa ggggaaccag 6660

gcgaaactgg ccccccaggc agaggcctga caggccctac tggtgctgtg ggcctccctg 6720

gacctcctgg ccctagtgga ctcgtgggcc ctcagggctc tcccggactg ccaggccaag 6780

tgggcgagac tggaaaaccc ggggctcccg gcagggatgg cgcttctgga aaagacggcg 6840

ataggggcag ccctggcgtg cccggtagtc cagggctacc tggccctgtg ggtcccaaag 6900

gggagcctgg acctacaggc gcaccaggcc aggctgtagt ggggctgcct ggcgctaaag 6960

gcgagaaggg tgctcctggc ggcctggctg gcgatctcgt tggagaacct ggcgccaagg 7020

gcgaccgtgg cttgccagga cctcgcggcg agaaaggcga agctggcaga gctggcgagc 7080

ctggggaccc aggcgaagat ggccagaaag gcgctcccgg ccctaaggga ttcaagggcg 7140

atccgggcgt gggcgtgcca ggctctccag gtcctcctgg accacccggt gtcaagggcg 7200

atttgggcct tcctggcctg ccaggggcac ctggcgtcgt gggctttcct ggacagaccg 7260

gcccacgggg agagatggga cagccaggcc ccagcggaga aagagggctg gctggcccgc 7320

ctggcaggga aggcatacca ggcccattgg ggcctccagg cccacctgga tctgtggggc 7380

ctcctggcgc ctctggactg aaaggcgaca aaggcgatcc tggtgtcggc ctgccaggcc 7440

caagaggcga gaggggagag cccggcatca ggggcgaaga tggacggcct ggccaagagg 7500

gccctcgggg attgaccggc cctcctggat ccagaggcga acggggggag aagggggacg 7560

tgggctctgc tggcctcaaa ggcgacaagg gggactccgc cgtgattctg ggccctcccg 7620

gacctcgggg agctaagggg gacatgggag agaggggtcc acggggactg gatggggaca 7680

agggaccacg cggagacaac ggcgacccgg gggataaggg ctccaagggc gaacctggcg 7740

ataagggatc cgctggactg cctggcctga ggggcctgct gggacctcaa ggacaaccag 7800

gcgccgcagg catccctggc gaccctggat ctcctggaaa ggacggcgtg cccggcatcc 7860

gcggagaaaa gggggatgtc ggcttcatgg gccccagggg gctgaagggg gaaaggggag 7920

tgaagggcgc ttgcggcctc gatggggaaa agggggacaa gggggaggct ggccctccag 7980

gacgacctgg actggctggc cacaagggcg aaatgggaga gccaggcgtg cccggacagt 8040

ccggcgctcc aggcaaagag ggcctgatcg gccccaaagg cgatagagga tttgacggcc 8100

agcctggccc aaagggcgat caaggcgaaa aaggggagag aggcaccccc ggcatcggcg 8160

gctttccagg cccctctgga aacgatggct ctgccggccc acctgggcca cctggtagtg 8220

tgggaccaag aggccccgag ggactgcagg gacagaaagg cgagagaggg ccccctggcg 8280

agagagttgt gggagcacct ggcgttcccg gcgcacccgg cgaaagggga gaacaaggca 8340

gacctggacc agccggaccc cgtggggaaa aaggcgaggc cgccctgacc gaggacgaca 8400

tcagaggctt cgtgcggcaa gagatgtccc agcactgcgc ctgtcagggc cagtttatcg 8460

cctccggcag cagacccctg ccttcctacg ctgccgatac cgccggctct cagctgcacg 8520

ctgtgcctgt gctccgggtg tcccacgccg aggaagagga aagagtccct cctgaggacg 8580

acgagtacag cgagtactct gagtattccg tggaagagta ccaggatccc gaggcccctt 8640

gggacagcga cgacccttgc tccctgcctc tggatgaggg ctcctgcacc gcctacaccc 8700

tgagatggta tcaccgggcc gtgacaggct ccaccgaggc ctgtcaccct ttcgtgtatg 8760

gcggctgcgg cggcaacgcc aatagattcg gcacccgcga ggcctgcgag cggagatgtc 8820

ctcccagagt ggtgcagtcc cagggcaccg gcacagccca ggactgatag tctagagtgg 8880

ccggcc 8886

<210> 2

<211> 2944

<212> PRT

<213> 智人

<400> 2

Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala

1 5 10 15

Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr

20 25 30

Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser

35 40 45

Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu

50 55 60

Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala

65 70 75 80

Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala

85 90 95

Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr

100 105 110

Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp

115 120 125

His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys

130 135 140

Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala

145 150 155 160

Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys

165 170 175

Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser

180 185 190

Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu

195 200 205

Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val

210 215 220

Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu

225 230 235 240

Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser

245 250 255

Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu

260 265 270

Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly

275 280 285

Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln

290 295 300

Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser

305 310 315 320

Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln

325 330 335

Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly

340 345 350

Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr

355 360 365

Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp

370 375 380

Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly

385 390 395 400

Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser

405 410 415

Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu

420 425 430

Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp

435 440 445

Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser

450 455 460

Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr

465 470 475 480

Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro

485 490 495

Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr

500 505 510

Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp

515 520 525

Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr

530 535 540

Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe

545 550 555 560

Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser

565 570 575

Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg

580 585 590

Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val

595 600 605

Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala

610 615 620

Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser

625 630 635 640

Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln

645 650 655

Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu

660 665 670

Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro

675 680 685

Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile

690 695 700

Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His

705 710 715 720

Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr

725 730 735

Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His

740 745 750

Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val

755 760 765

Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile

770 775 780

Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr

785 790 795 800

Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro

805 810 815

Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg

820 825 830

Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val

835 840 845

Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro

850 855 860

Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu

865 870 875 880

His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe

885 890 895

Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu

900 905 910

Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr

915 920 925

Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro

930 935 940

Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile

945 950 955 960

Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp

965 970 975

Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu

980 985 990

Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly

995 1000 1005

Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser

1010 1015 1020

Tyr Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro

1025 1030 1035

Glu Ala Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala

1040 1045 1050

Asp Val Val Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg

1055 1060 1065

Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu

1070 1075 1080

Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu Ser Tyr

1085 1090 1095

Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His Asp

1100 1105 1110

Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp

1115 1120 1125

Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg

1130 1135 1140

Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro

1145 1150 1155

Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile

1160 1165 1170

Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val

1175 1180 1185

Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu

1190 1195 1200

Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp

1205 1210 1215

Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu

1220 1225 1230

Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro

1235 1240 1245

Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly

1250 1255 1260

Leu Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly

1265 1270 1275

Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr

1280 1285 1290

Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly

1295 1300 1305

Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly

1310 1315 1320

Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly

1325 1330 1335

Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro Gly

1340 1345 1350

Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly

1355 1360 1365

Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly

1370 1375 1380

Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met

1385 1390 1395

Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro

1400 1405 1410

Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu

1415 1420 1425

Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys

1430 1435 1440

Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro

1445 1450 1455

Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro

1460 1465 1470

Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu

1475 1480 1485

Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala

1490 1495 1500

Gly Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys

1505 1510 1515

Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys

1520 1525 1530

Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala

1535 1540 1545

Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly

1550 1555 1560

Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro Pro Gly

1565 1570 1575

Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly Asp

1580 1585 1590

Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp

1595 1600 1605

Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro

1610 1615 1620

Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu

1625 1630 1635

Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys

1640 1645 1650

Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro

1655 1660 1665

Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg

1670 1675 1680

Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu

1685 1690 1695

Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro

1700 1705 1710

Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly

1715 1720 1725

Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly

1730 1735 1740

Glu Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly

1745 1750 1755

Asp Pro Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly

1760 1765 1770

Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly

1775 1780 1785

Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly

1790 1795 1800

Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly

1805 1810 1815

Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro Gly

1820 1825 1830

Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly

1835 1840 1845

Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly

1850 1855 1860

Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly

1865 1870 1875

Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly

1880 1885 1890

Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly

1895 1900 1905

Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu

1910 1915 1920

Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser

1925 1930 1935

Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala

1940 1945 1950

Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly

1955 1960 1965

Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp

1970 1975 1980

Ser Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe

1985 1990 1995

Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro

2000 2005 2010

Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly

2015 2020 2025

Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly

2030 2035 2040

Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg Pro Gly

2045 2050 2055

Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln Gly

2060 2065 2070

Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly

2075 2080 2085

Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu

2090 2095 2100

Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu

2105 2110 2115

Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val

2120 2125 2130

Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln

2135 2140 2145

Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro

2150 2155 2160

Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro

2165 2170 2175

Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu

2180 2185 2190

Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu

2195 2200 2205

Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr

2210 2215 2220

Gly Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val

2225 2230 2235

Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr

2240 2245 2250

Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp

2255 2260 2265

Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro

2270 2275 2280

Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro

2285 2290 2295

Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys Gly

2300 2305 2310

Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala

2315 2320 2325

Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu

2330 2335 2340

Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln

2345 2350 2355

Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val

2360 2365 2370

Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys

2375 2380 2385

Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val

2390 2395 2400

Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro

2405 2410 2415

Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu

2420 2425 2430

Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val

2435 2440 2445

Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro

2450 2455 2460

Gly Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly

2465 2470 2475

Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly

2480 2485 2490

Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly

2495 2500 2505

Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala

2510 2515 2520

Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly Asp Met

2525 2530 2535

Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro Arg

2540 2545 2550

Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro

2555 2560 2565

Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu

2570 2575 2580

Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro

2585 2590 2595

Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys

2600 2605 2610

Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg

2615 2620 2625

Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys

2630 2635 2640

Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys

2645 2650 2655

Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro

2660 2665 2670

Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp

2675 2680 2685

Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg

2690 2695 2700

Gly Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp

2705 2710 2715

Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg

2720 2725 2730

Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro

2735 2740 2745

Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly

2750 2755 2760

Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly

2765 2770 2775

Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly Phe

2780 2785 2790

Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe

2795 2800 2805

Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr

2810 2815 2820

Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His

2825 2830 2835

Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser

2840 2845 2850

Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala

2855 2860 2865

Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly

2870 2875 2880

Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr

2885 2890 2895

Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly

2900 2905 2910

Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg

2915 2920 2925

Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln

2930 2935 2940

Asp

<210> 3

<211> 1888

<212> DNA

<213> 智人

<400> 3

ccggtgccgg gcgaacatgg cggcggccac cggaccctcg ttttggctgg ggaatgaaac 60

cctgaaggtg ccgctggcgc tctttgcctt gaaccggcag cgcctgtgtg agcggctgcg 120

gaagaaccct gctgtgcagg ccggctccat cgtggtcctg cagggcgggg aggagactca 180

gcgctactgc accgacaccg gggtcctctt cctccaggag tccttctttc actgggcgtt 240

cggtgtcact gagccaggct gctatggtgt catcgatgtt gacactggga agtcgaccct 300

gtttgtgccc aggcttcctg ccagccatgc cacctggatg ggaaagatcc attccaagga 360

gcacttcaag gagaagtatg ccgtggacga cgtccagtac gtagatgaga ttgccagcgt 420

cctgacgtca cagaagccct ctgtcctcct cactttgcgt ggcgtcaaca cggacagcgg 480

cagtgtctgc agggaggcct cctttgacgg catcagcaag ttcgaagtca acaataccat 540

tcttcaccca gagatcgttg agagccgagt gtttaagacg gatatggagc tggaggttct 600

gcgctatacc aataaaatct ccagcgaggc ccaccgtgag gtaatgaagg ctgtaaaagt 660

gggaatgaaa gaatatgggt tggaaagcct cttcgagcac tactgctact cccggggcgg 720

catgcgccac agctcctaca cctgcatctg cggcagtggt gagaactcag ccgtgctaca 780

ctacggacac gccggagctc ccaacgaccg aacgatccag aatggggata tgtgcctgtt 840

cgacatgggc ggtgagtatt actctgtcgc ttccgacatc acctgctcct ttccccgcaa 900

cggcaagttc actgcagacc agaaggccgt ctatgaggca gtgctgctga gctcccgtgc 960

cgtcatgggt gccatgaagc caggtgactg gtggcctgac atcgaccgcc tggctgaccg 1020

catccacctg gaggagctgg cccacatggg catcctgagc ggcagcgtgg acgccatggt 1080

ccaggctcac ctgggggccg tgtttatgcc tcacgggctt ggccacttcc tgggcattga 1140

cgtgcacgac gtgggaggct acccagaggg cgtggagcgc atcgacgagc ccggcctgcg 1200

gagcctgcgc actgcacggc acctgcagcc aggcatggtg ctcaccgtgg agccgggcat 1260

ctacttcatc gaccacctcc tggatgaggc cctggcggac ccggcccgcg cctccttcct 1320

taaccgcgag gtcctgcagc gctttcgcgg ttttggcggg gtccgcatcg aggaggacgt 1380

cgtggtgatc gacagcggca tagagctgct gacctgcgtg ccccgcactg tggaagagat 1440

tgaagcatgc atggcaggct gtgacaaggc ctttaccccc ttctctggcc ccaagtagag 1500

ccagccagaa atcccagcgc acctgggggc ctggccttgc aacctctttt cgtgatgggc 1560

agcctgctgg tcagcactcc agtagcgaga gacggcaccc agaatcagat cccagcttcg 1620

gcatttgatc agaccaaaca gtgctgtttc ccggggagga aacacttttt taattaccct 1680

tttgcaggca ccacctttaa tctgttttat accttgctta ttaaatgagc gacttaaaat 1740

gattgaaaat aatgctgtcc tttagtagca agtaaaatgt gtcttgctgt catttatatt 1800

ccttttccca ggaaagaagc atttctgata ctttctgtca aaaatcaata tgcagaatgg 1860

catttgcaat aaaaggtttc ctaaaatg 1888

<210> 4

<211> 486

<212> PRT

<213> 智人

<400> 4

Met Ala Ala Ala Thr Gly Pro Ser Phe Trp Leu Gly Asn Glu Thr Leu

1 5 10 15

Lys Val Pro Leu Ala Leu Phe Ala Leu Asn Arg Gln Arg Leu Cys Glu

20 25 30

Arg Leu Arg Lys Asn Pro Ala Val Gln Ala Gly Ser Ile Val Val Leu

35 40 45

Gln Gly Gly Glu Glu Thr Gln Arg Tyr Cys Thr Asp Thr Gly Val Leu

50 55 60

Phe Arg Gln Glu Ser Phe Phe His Trp Ala Phe Gly Val Thr Glu Pro

65 70 75 80

Gly Cys Tyr Gly Val Ile Asp Val Asp Thr Gly Lys Ser Thr Leu Phe

85 90 95

Val Pro Arg Leu Pro Ala Ser His Ala Thr Trp Met Gly Lys Ile His

100 105 110

Ser Lys Glu His Phe Lys Glu Lys Tyr Ala Val Asp Asp Val Gln Asp

115 120 125

Glu Ile Ala Ser Val Leu Thr Ser Gln Lys Pro Ser Val Leu Leu Thr

130 135 140

Leu Arg Gly Val Asn Thr Asp Ser Gly Ser Val Cys Arg Glu Ala Ser

145 150 155 160

Phe Asp Gly Ile Ser Lys Phe Glu Val Asn Asn Thr Ile Leu His Pro

165 170 175

Glu Ile Val Glu Cys Arg Val Phe Lys Thr Asp Met Glu Leu Glu Val

180 185 190

Leu Arg Tyr Thr Asn Lys Ile Ser Ser Glu Ala His Arg Glu Val Met

195 200 205

Lys Ala Val Lys Val Gly Met Lys Glu Tyr Glu Leu Glu Ser Leu Phe

210 215 220

Glu His Tyr Cys Tyr Ser Arg Gly Gly Met Arg His Ser Ser Tyr Thr

225 230 235 240

Cys Ile Cys Gly Ser Gly Glu Asn Ser Ala Val Leu His Gly Ala Gly

245 250 255

Ala Pro Asn Asp Arg Thr Ile Gln Asn Gly Met Cys Leu Phe Asp Met

260 265 270

Gly Gly Glu Tyr Tyr Cys Phe Ala Ser Asp Ile Thr Cys Ser Phe Pro

275 280 285

Ala Asn Gly Lys Phe Thr Ala Asp Gln Lys Ala Val Tyr Glu Ala Val

290 295 300

Leu Arg Ser Ser Arg Ala Val Met Gly Ala Met Lys Pro Gly Val Trp

305 310 315 320

Trp Pro Asp Met His Arg Leu Ala Asp Arg Ile His Leu Glu Glu Leu

325 330 335

Ala His Met Gly Ile Leu Ser Gly Ser Val Asp Ala Met Val Gln Ala

340 345 350

His Leu Gly Ala Val Phe Met Pro His Gly Leu Gly His Phe Leu Gly

355 360 365

Ile Asp Val His Asp Val Gly Gly Tyr Pro Gly Val Arg Ile Asp Glu

370 375 380

Pro Gly Leu Arg Ser Leu Arg Thr Ala Arg His Leu Gln Pro Gly Met

385 390 395 400

Val Leu Thr Val Glu Pro Gly Ile Tyr Phe Ile Asp His Leu Leu Asp

405 410 415

Glu Ala Leu Ala Asp Pro Ala Arg Ala Ser Phe Leu Asn Arg Glu Val

420 425 430

Leu Gln Arg Phe Arg Gly Phe Gly Gly Val Arg Ile Glu Glu Asp Val

435 440 445

Val Val Thr Asp Ser Gly Ile Glu Leu Leu Thr Cys Val Pro Arg Thr

450 455 460

Val Glu Glu Ile Glu Ala Cys Met Ala Gly Cys Asp Lys Ala Phe Thr

465 470 475 480

Pro Phe Ser Gly Pro Lys

485

<210> 5

<211> 397

<212> PRT

<213> 褐家鼠

<400> 5

Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val

1 5 10 15

Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr

20 25 30

Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln

35 40 45

Glu Lys Val Ala Met Gly Ser Ala Ser Gln Val Val Phe Ser Asn Ser

50 55 60

Lys Gln Asp Pro Lys Glu Asp Ile Pro Ile Leu Ser Tyr His Arg Val

65 70 75 80

Thr Ala Lys Val Lys Pro Gln Pro Ser Phe Gln Val Trp Asp Lys Asp

85 90 95

Ser Thr Tyr Ser Lys Leu Asn Pro Arg Leu Leu Lys Ile Trp Arg Asn

100 105 110

Tyr Leu Asn Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly Pro Gly Val

115 120 125

Lys Phe Ser Val Glu Ala Leu Arg Cys His Leu Arg Asp His Val Asn

130 135 140

Val Ser Met Ile Glu Ala Thr Asp Phe Pro Phe Asn Thr Thr Glu Trp

145 150 155 160

Glu Gly Tyr Leu Pro Lys Glu Asn Phe Arg Thr Lys Val Gly Pro Trp

165 170 175

Gln Arg Cys Ala Val Val Ser Ser Ala Gly Ser Leu Lys Asn Ser Gln

180 185 190

Leu Gly Arg Glu Ile Asp Asn His Asp Ala Val Leu Arg Phe Asn Gly

195 200 205

Ala Pro Thr Asp Asn Phe Gln Gln Asp Val Gly Ser Lys Thr Thr Ile

210 215 220

Arg Leu Met Asn Ser Gln Leu Val Thr Thr Glu Lys Arg Phe Leu Lys

225 230 235 240

Asp Ser Leu Tyr Thr Glu Gly Ile Leu Ile Val Trp Asp Ser Tyr His

245 250 255

Ala Asp Ile Pro Lys Trp Tyr Gln Lys Pro Asp Tyr Asn Phe Phe Glu

260 265 270

Thr Tyr Lys Ser Tyr Arg Arg Leu Asn Pro Ser Gln Pro Phe Tyr Ile

275 280 285

Leu Lys Pro Gln Met Pro Trp Glu Leu Trp Asp Ile Ile Gln Glu Ile

290 295 300

Ser Ala Asp Leu Ile Gln Pro Asn Pro Pro Ser Ser Gly Met Leu Gly

305 310 315 320

Ile Ile Ile Met Met Thr Leu Cys Asp Gln Val Asp Ile Tyr Glu Phe

325 330 335

Leu Pro Ser Lys Arg Lys Thr Asp Val Cys Tyr Tyr His Gln Lys Phe

340 345 350

Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr His Pro Leu Leu Phe Glu

355 360 365

Lys Asn Met Val Lys His Leu Asn Glu Gly Thr Glu Asp Tyr Leu Phe

370 375 380

Gly Lys Ala Thr Leu Ser Gly Phe Arg Asn Ile Arg Cys

385 390 395

<210> 6

<211> 247

<212> PRT

<213> 智人

<400> 6

Met Ala His His His His His His Leu Pro Ala Leu Lys Leu Ala Leu

1 5 10 15

Glu Tyr Ile Val Pro Cys Met Asn Lys His Gly Ile Cys Val Val Asp

20 25 30

Asp Phe Leu Gly Lys Glu Thr Gly Gln Gln Ile Gly Asp Glu Val Arg

35 40 45

Ala Leu His Asp Thr Gly Lys Phe Thr Asp Gly Gln Leu Val Ser Gln

50 55 60

Lys Ser Asp Ser Ser Lys Asp Ile Arg Gly Asp Lys Ile Thr Trp Ile

65 70 75 80

Glu Gly Lys Glu Pro Gly Cys Glu Thr Ile Gly Leu Leu Met Ser Ser

85 90 95

Met Asp Asp Leu Ile Arg His Cys Asn Gly Lys Leu Gly Ser Tyr Lys

100 105 110

Ile Asn Gly Arg Thr Lys Ala Met Val Ala Cys Tyr Pro Gly Asn Gly

115 120 125

Thr Gly Tyr Val Arg His Val Asp Asn Pro Asn Gly Asp Gly Arg Cys

130 135 140

Val Thr Cys Ile Tyr Tyr Leu Asn Lys Asp Trp Asp Ala Lys Val Ser

145 150 155 160

Gly Gly Ile Leu Arg Ile Phe Pro Glu Gly Lys Ala Gln Phe Ala Asp

165 170 175

Ile Glu Pro Lys Phe Asp Arg Leu Leu Phe Phe Trp Ser Asp Arg Arg

180 185 190

Asn Pro His Glu Val Gln Pro Ala Tyr Ala Thr Arg Tyr Ala Ile Thr

195 200 205

Val Trp Tyr Phe Asp Ala Asp Glu Arg Ala Arg Ala Lys Val Lys Tyr

210 215 220

Leu Thr Gly Glu Lys Gly Val Arg Val Glu Leu Asn Lys Pro Ser Asp

225 230 235 240

Ser Val Gly Lys Asp Val Phe

245

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1