使用修饰的核酸表达多肽的方法

文档序号:467195阅读:310来源:国知局
使用修饰的核酸表达多肽的方法
【专利摘要】本文报道了用于在细胞中重组生产多肽的方法,包括步骤:培养包含编码多肽的核酸的细胞,从细胞或培养基中回收多肽,其中,多肽的每个氨基酸残基都是由至少一个密码子编码的,将编码相同氨基酸残基的不同密码子组合在一个组中,按其在组内的具体使用频率定义组内的每个密码子,一组内所有密码子的具体使用频率之和为100%,其中多肽编码核酸中的密码子使用频率与其在组内的具体使用频率几乎相同。
【专利说明】使用修饰的核酸表达多肽的方法
[0001] 本文报道的方法所属的领域是优化多肽编码核酸,和改善由本文报道的方法优化 的核酸所编码的多肽的表达。
[0002] 发明背景
[0003] Cannarozzi, G.等人报道了在翻译动力学中的密码子顺序的作用(Cell 141(2010)355-367)。Plotkin,J.B.和 Kudla,G.报道了密码子偏爱的原因和后果(Nat. Rev. Gen. 12(2011)32-42)。Weygand_Durasevic,I·和 Ibba,M.报道了密码子使用的新作 用(Science 329(2010) 1473-1474)。Itzkovitz,S.等人报道了蛋白质编码序列中的重叠 代码(Gen. Res. 20 (2010) 1582-1589)。
[0004] W0 97/11086中报道了高水平的蛋白质表达。W0 03/70957中报道了生产植物多 肽。W0 03/85114中(报道了)用于设计在宿主细胞中优化蛋白质表达的合成核酸序列的 方法。US 5, 082, 767中报道了密码子配对优化。W0 2008/000632中报道了用于实现改良 的多肽表达的方法。W0 2007/142954和US 8, 128, 938中报道了密码子优化方法。
[0005] Watkins, Ν· E.等人报道了 DNA二聚体中的脱氧次黄苷(deoxyinosine)对的最近 邻热动力学(Nucl.Acids Res.33(2〇〇5)6258-6267)。
[0006] 发明概沭
[0007] 已发现对于在细胞中表达多肽,使用具有本文报道特征的多肽编码核酸是有利 的。多肽编码核酸的特征是每个氨基酸都是由一组密码子编码的,按组内的具体使用频率 相对于该密码子在细胞基因组中的整体使用频率,来定义密码子组内的每个密码子,(总) 多肽编码核酸中的密码子使用频率与相应组内的使用频率几乎相同。
[0008] 本文报道的一个方面是用于在细胞中重组生产多肽的方法,包括步骤:培养包含 编码多肽的核酸的细胞,从细胞或培养基中回收多肽,
[0009] 其中,多肽的每个氨基酸残基都是由一个或多个(至少一个)密码子编码的,将编 码相同氨基酸残基的(不同)密码子组合在一个组中,按其在组内的具体使用频率定义组 内的每个密码子,一组内所有密码子的具体使用频率之和为100%,
[0010] 其中多肽编码核酸中每个密码子的整体使用频率与其在组内的具体使用频率几 乎相同。
[0011] 在一个实施方案中,氨基酸残基 G、A、V、L、I、P、F、S、T、N、Q、Y、C、K、R、H、D 和 E 分别由一组密码子编码,而氨基酸残基Μ和W由单个密码子编码。
[0012] 在一个实施方案中,氨基酸残基 G、Α、V、L、I、P、F、S、T、N、Q、Y、C、K、R、H、D 和 Ε 分别由包含至少两个密码子的一组密码子编码,而氨基酸残基Μ和W由单个密码子编码。
[0013] 在一个实施方案中,如果氨基酸残基实际只由1个密码子编码,则密码子的具体 使用频率是1〇〇%。
[0014] 在一个实施方案中,氨基酸残基G由最多4个密码子的组编码。在一个实施方案 中,氨基酸残基Α由最多4个密码子的组编码。在一个实施方案中,氨基酸残基V由最多4 个密码子的组编码。在一个实施方案中,氨基酸残基L由最多6个密码子的组编码。在一个 实施方案中,氨基酸残基I由最多3个密码子的组编码。在一个实施方案中,氨基酸残基Μ 实际只由1个密码子编码。在一个实施方案中,氨基酸残基P由最多4个密码子的组编码。 在一个实施方案中,氨基酸残基F由最多2个密码子的组编码。在一个实施方案中,氨基酸 残基W实际只由1个密码子编码。在一个实施方案中,氨基酸残基S由最多6个密码子的 组编码。在一个实施方案中,氨基酸残基T由最多4个密码子的组编码。在一个实施方案 中,氨基酸残基N由最多2个密码子的组编码。在一个实施方案中,氨基酸残基Q由最多2 个密码子的组编码。在一个实施方案中,氨基酸残基Y由最多2个密码子的组编码。在一 个实施方案中,氨基酸残基C由最多2个密码子的组编码。在一个实施方案中,氨基酸残基 K由最多2个密码子的组编码。在一个实施方案中,氨基酸残基R由最多6个密码子的组编 码。在一个实施方案中,氨基酸残基Η由最多2个密码子的组编码。在一个实施方案中,氨 基酸残基D由最多2个密码子的组编码。在一个实施方案中,氨基酸残基Ε由最多2个密 码子的组编码。
[0015] 在一个实施方案中,氨基酸残基G由1至4个密码子的组编码。在一个实施方案 中,氨基酸残基Α由1至4个密码子的组编码。在一个实施方案中,氨基酸残基V由1至4 个密码子的组编码。在一个实施方案中,氨基酸残基L由1至6个密码子的组编码。在一 个实施方案中,氨基酸残基I由1至3个密码子的组编码。在一个实施方案中,氨基酸残基 Μ由1个密码子的组编码,S卩,实际上由1个密码子编码。在一个实施方案中,氨基酸残基P 由1至4个密码子的组编码。在一个实施方案中,氨基酸残基F由1至2个密码子的组编 码。在一个实施方案中,氨基酸残基W由1个密码子的组编码,S卩,实际上由1个密码子编 码。在一个实施方案中,氨基酸残基S由1至6个密码子的组编码。在一个实施方案中,氨 基酸残基T由1至4个密码子的组编码。在一个实施方案中,氨基酸残基N由1至2个密 码子的组编码。在一个实施方案中,氨基酸残基Q由1至2个密码子的组编码。在一个实 施方案中,氨基酸残基Y由1至2个密码子的组编码。在一个实施方案中,氨基酸残基C由 1至2个密码子的组编码。在一个实施方案中,氨基酸残基K由1至2个密码子的组编码。 在一个实施方案中,氨基酸残基R由1至6个密码子的组编码。在一个实施方案中,氨基酸 残基Η由1至2个密码子的组编码。在一个实施方案中,氨基酸残基D由1至2个密码子 的组编码。在一个实施方案中,氨基酸残基Ε由1至2个密码子的组编码。
[0016] 在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率大于5%的密 码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为8%或更高的密 码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为10%或更高的 密码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为15%或更高 的密码子。
[0017] 在一个实施方案中,编码多肽的核酸中特定氨基酸残基的密码子顺序按5'至3' 方向是,即,对应于,相应氨基酸密码子基序中的密码子顺序。
[0018] 在一个实施方案中,对于从多肽的Ν-末端开始,多肽中每个顺序出现的特定氨基 酸,编码核酸包括与各特定氨基酸在氨基酸密码子基序中相应顺序位置上的密码子相同的 密码子。
[0019] 在一个实施方案中,氨基酸密码子基序中的密码子使用频率与其组内的具体使用 频率几乎相同。
[0020] 在一个实施方案中,在多肽中下一次出现的具体氨基酸时,已经到达氨基酸密码 子基序的最后一个密码子后,编码核酸包括位于氨基酸密码子基序的第一位上的密码子。
[0021] 在一个实施方案中,氨基酸密码子基序中的各个密码子随机分布在整个氨基酸密 码子基序中。
[0022] 在一个实施方案中,氨基酸密码子基序选自包含能够通过排列其中的密码子所获 得的所有可能的氨基酸密码子基序的氨基酸密码子基序,其中所有的基序都具有相同数量 的密码子,且每个基序中的密码子都具有相同的具体使用频率。
[0023] 在一个实施方案中,氨基酸密码子基序中的密码子按递减的具体使用频率排列, 使一种使用频率的所有密码子彼此直接连续。在一个实施方案中,将一种密码子使用频率 的密码子分组在一起。
[0024] 在一个实施方案中,氨基酸密码子基序中的(不同)密码子均匀的分布在整个氨 基酸密码子基序中。
[0025] 在一个实施方案中,按递减的具体使用频率排列氨基酸密码子基序中的密码子, 使得在具有最低具体使用频率的密码子之后,或者在具有第二低的具体使用频率的密码子 之后,出现(使用)具有最高具体使用频率的密码子。
[0026] 在一个实施方案中,按递减的具体使用频率排列氨基酸密码子基序中的密码子, 使得在具有最低具体使用频率的密码子之后,出现(使用)具有最高具体使用频率的密码 子。
[0027] 在一个实施方案中,细胞是原核细胞。
[0028] 在一个实施方案中,原核细胞是E. coli细胞。
[0029] 在一个实施方案中,氨基酸密码子基序是
[0030] 丙氨酸选自 SEQ ID N0:01、02、03、04 和 05,和 / 或
[0031] 精氨酸选自SEQ ID N0:06和07,和/或
[0032] 天冬酰胺选自 SEQ ID N0:08、09、10、ll 和 12,和 / 或
[0033] 天冬氨酸选自SEQ ID N0:13和14,和/或
[0034] 半胱氨酸选自SEQ ID N0:15、16和17,和/或
[0035] 谷氨酰胺选自SEQ ID N0:18、19、20和21,和/或
[0036] 谷氨酸选自SEQ ID N0:22、23和24,和/或
[0037] 甘氨酸选自SEQ ID N0:25和26,和/或
[0038] 组氨酸选自SEQ ID N0:27和28,和/或
[0039] 异亮氨酸选自SEQ ID N0:29和30,和/或
[0040] 亮氨酸选自SEQ ID NO: 31、32和33,和/或
[0041] 赖氨酸选自 SEQ ID N0:34、35、36 和 37,和 / 或
[0042] 苯丙氨酸选自SEQ ID N0:38、39和40,和/或
[0043] 脯氨酸选自 SEQ ID 勵:41、42、43、44、45和46,和/或
[0044] 丝氨酸选自SEQ ID N0:47和48,和/或
[0045] 苏氨酸选自SEQ ID N0:49、50和51,和/或
[0046] 酪氨酸选自SEQ ID N0:52和53,和/或
[0047] 缬氨酸选自 SEQ ID N0:54、55 和 56。
[0048] 在一个实施方案中,氨基酸密码子基序是
[0049] 丙氨酸是 SEQ ID NO:03,
[0050] 精氨酸是 SEQ ID NO:07,
[0051] 天冬酰胺是 SEQ ID NO: 10,
[0052] 天冬氨酸是 SEQ ID NO: 13,
[0053] 半胱氨酸是 SEQ ID NO: 17,
[0054] 谷氨酰胺是 SEQ ID NO:20,
[0055] 谷氨酸是 SEQ ID NO :23,
[0056] 甘氨酸是 SEQ ID NO :26,
[0057] 组氨酸是 SEQ ID NO :28,
[0058] 异亮氨酸是 SEQ ID NO:30,
[0059] 亮氨酸是 SEQ ID NO :33 ;
[0060] 赖氨酸是 SEQ ID NO :36,
[0061] 苯丙氨酸是 SEQ ID NO:39,
[0062] 脯氨酸是 SEQ ID NO :43,
[0063] 丝氨酸 is SEQ ID NO:48,
[0064] 苏氨酸是 SEQ ID NO:51,
[0065] 酪氨酸是 SEQ ID NO:53,和
[0066] 缬氨酸是 SEQ ID NO:56。
[0067] 在一个实施方案中,细胞是真核细胞,选自CHO细胞、BHK细胞、HEK细胞、SP2/0细 胞或NS0细胞。
[0068] 在一个实施方案中,真核细胞是CH0细胞。
[0069] 在一个实施方案中,氨基酸密码子基序是
[0070] 丙氨酸选自 SEQ ID N0:64、65、66、67 和 68,和 / 或
[0071] 精氨酸选自SEQ ID N0:69和70,和/或
[0072] 天冬酰胺选自SEQ ID N0:71和72,和/或
[0073] 天冬氨酸选自SEQ ID N0:73和74,和/或,
[0074] 半胱氨酸选自SEQ ID N0:75和76,和/或
[0075] 谷氨酰胺选自SEQ ID N0:77、78、79和80,和/或
[0076] 谷氨酸选自SEQ ID NO: 81和82,和/或
[0077] 甘氨酸选自SEQ ID N0:83和84,和/或
[0078] 组氨酸选自SEQ ID N0:85和86,和/或
[0079] 异亮氨酸选自SEQ ID N0:87和88,和/或
[0080] 亮氨酸选自SEQ ID N0:89、90和91,和/或
[0081] 赖氨酸选自SEQ ID N0:92和93,和/或
[0082] 苯丙氨酸选自SEQ ID N0:94和95,和/或
[0083] 脯氨酸选自SEQ ID N0:96和97,和/或
[0084] 丝氨酸选自SEQ ID N0:98、99和100,和/或
[0085] 苏氨酸选自 SEQ ID N0:101、102 和 103,和 / 或
[0086] 酪氨酸选自SEQ ID N0:104和105,和/或
[0087] 缬氨酸选自 SEQ ID NO: 106、107 和 108。
[0088] 在一个实施方案中,氨基酸密码子基序是
[0089] 丙氨酸是 SEQ ID N0:68,
[0090] 精氨酸是 SEQ ID NO:69,
[0091] 天冬酰胺 is SEQ ID NO:72,
[0092] 天冬氨酸是 SEQ ID NO:74,
[0093] 半胱氨酸是 SEQ ID NO:76,
[0094] 谷氨酰胺 is SEQ ID NO:79,
[0095] 谷氨酸是 SEQ ID N0:82,
[0096] 甘氨酸是 SEQ ID NO:84,
[0097] 组氨酸是 SEQ ID NO :86,
[0098] 异亮氨酸是 SEQ ID NO:88,
[0099] 亮氨酸是 SEQ ID NO :90 ;
[0100] 赖氨酸是 SEQ ID NO:93,
[0101] 苯丙氨酸是 SEQ ID NO:95,
[0102] 脯氨酸是 SEQ ID NO:97,
[0103] 丝氨酸是 SEQ ID NO:99,
[0104] 苏氨酸是 SEQ ID NO: 103,
[0105] 酪氨酸是 SEQ ID NO: 105,和
[0106] 缬氨酸是 SEQ ID NO: 108。
[0107] 在一个实施方案中,多肽是抗体、或抗体片段、或抗体融合多肽。
[0108] 本文报道的一个方面是编码多肽的核酸,其特征是多肽的每个氨基酸残基都是由 一个或多个(至少一个)密码子编码的,
[0109] 使编码相同氨基酸残基的不同密码子组合在一个组内,组内的每个密码子按其在 组内的具体使用频率定义,一组内所有密码子的具体使用频率之和为100 %,
[0110] 其中,在多肽编码核酸中的密码子使用频率与其在其组内的具体使用频率几乎相 同。
[0111] 在一个实施方案中,氨基酸残基 G、A、V、L、I、P、F、S、T、N、Q、Y、C、K、R、H、D 和 E 分别由一组密码子编码,而氨基酸残基Μ和W由单个密码子编码。
[0112] 在一个实施方案中,氨基酸残基 G、Α、V、L、I、P、F、S、T、N、Q、Y、C、K、R、H、D 和 Ε 分别由包含至少两个密码子的一组密码子编码,而氨基酸残基Μ和W由单个密码子编码。
[0113] 在一个实施方案中,如果氨基酸残基实际只由1个密码子编码,则密码子的具体 使用频率是1〇〇%。
[0114] 在一个实施方案中,氨基酸残基G由最多4个密码子的组编码。在一个实施方案 中,氨基酸残基Α由最多4个密码子的组编码。在一个实施方案中,氨基酸残基V由最多4 个密码子的组编码。在一个实施方案中,氨基酸残基L由最多6个密码子的组编码。在一个 实施方案中,氨基酸残基I由最多3个密码子的组编码。在一个实施方案中,氨基酸残基Μ 实际只由1个密码子编码。在一个实施方案中,氨基酸残基Ρ由最多4个密码子的组编码。 在一个实施方案中,氨基酸残基F由最多2个密码子的组编码。在一个实施方案中,氨基酸 残基W实际只由1个密码子编码。在一个实施方案中,氨基酸残基S由最多6个密码子的 组编码。在一个实施方案中,氨基酸残基T由最多4个密码子的组编码。在一个实施方案 中,氨基酸残基N由最多2个密码子的组编码。在一个实施方案中,氨基酸残基Q由最多2 个密码子的组编码。在一个实施方案中,氨基酸残基Y由最多2个密码子的组编码。在一 个实施方案中,氨基酸残基C由最多2个密码子的组编码。在一个实施方案中,氨基酸残基 K由最多2个密码子的组编码。在一个实施方案中,氨基酸残基R由最多6个密码子的组编 码。在一个实施方案中,氨基酸残基Η由最多2个密码子的组编码。在一个实施方案中,氨 基酸残基D由最多2个密码子的组编码。在一个实施方案中,氨基酸残基Ε由最多2个密 码子的组编码。
[0115] 在一个实施方案中,氨基酸残基G由1至4个密码子的组编码。在一个实施方案 中,氨基酸残基Α由1至4个密码子的组编码。在一个实施方案中,氨基酸残基V由1至4 个密码子的组编码。在一个实施方案中,氨基酸残基L由1至6个密码子的组编码。在一 个实施方案中,氨基酸残基I由1至3个密码子的组编码。在一个实施方案中,氨基酸残基 Μ由1个密码子的组编码。在一个实施方案中,氨基酸残基P由1至4个密码子的组编码。 在一个实施方案中,氨基酸残基F由1至2个密码子的组编码。在一个实施方案中,氨基酸 残基W由1个密码子的组编码。在一个实施方案中,氨基酸残基S由1至6个密码子的组 编码。在一个实施方案中,氨基酸残基Τ由1至4个密码子的组编码。在一个实施方案中, 氨基酸残基Ν由1至2个密码子的组编码。在一个实施方案中,氨基酸残基Q由1至2个 密码子的组编码。在一个实施方案中,氨基酸残基Υ由1至2个密码子的组编码。在一个 实施方案中,氨基酸残基C由1至2个密码子的组编码。在一个实施方案中,氨基酸残基Κ 由1至2个密码子的组编码。在一个实施方案中,氨基酸残基R由1至6个密码子的组编 码。在一个实施方案中,氨基酸残基Η由1至2个密码子的组编码。在一个实施方案中,氨 基酸残基D由1至2个密码子的组编码。在一个实施方案中,氨基酸残基Ε由1至2个密 码子的组编码。
[0116] 在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率大于5%的密 码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为8%或更高的密 码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为10%或更高的 密码子。在一个实施方案中,每个组仅包括在细胞基因组中的整体使用频率为15%或更高 的密码子。
[0117] 在一个实施方案中,编码多肽的核酸中特定氨基酸残基的密码子顺序按5'至3' 方向是,即,对应于,相应氨基酸密码子基序中的密码子顺序。
[0118] 在一个实施方案中,对于从多肽的Ν-末端开始,多肽中每个顺序出现的特定氨基 酸,编码核酸包括与各特定氨基酸在氨基酸密码子基序中相应顺序位置上的密码子相同的 密码子。
[0119] 在一个实施方案中,氨基酸密码子基序中的密码子使用频率与其组内的具体使用 频率几乎相同。
[0120] 在一个实施方案中,在多肽中下一次出现的具体氨基酸时,已经到达氨基酸密码 子基序的最后一个密码子后,编码核酸包括位于氨基酸密码子基序的第一位上的密码子。
[0121] 在一个实施方案中,氨基酸密码子基序中的各个密码子随机分布在整个氨基酸密 码子基序中。
[0122] 在一个实施方案中,氨基酸密码子基序中的各个密码子均匀分布在整个氨基酸密 码子基序中。
[0123] 在一个实施方案中,按递减的具体使用频率排列氨基酸密码子基序中的密码子, 使得在具有最低具体使用频率的密码子之后,或者在具有第二低的具体使用频率的密码子 之后,使用具有最高具体使用频率的密码子。
[0124] 在一个实施方案中,按递减的具体使用频率排列氨基酸密码子基序中的密码子, 使得在具有最低具体使用频率的密码子之后,使用具有最高具体使用频率的密码子。
[0125] 本文报道的一个方面是包含本文报道的核酸的细胞。
[0126] 本文报道的一个方面是用于增加原核细胞或真核细胞中的多肽表达的方法,包括 步骤:
[0127] -提供编码多肽的核酸,
[0128] 其中多肽的每个氨基酸残基都是由至少一个密码子编码的,将编码相同氨基酸残 基的不同密码子组合在一个组中,按其在组内的具体使用频率定义组内的每个密码子,一 组内所有密码子的具体使用频率之和为100%,
[0129] 其中多肽编码核酸中的密码子使用频率与其组内的具体使用频率几乎相同。
[0130] 发明详沭
[0131] 定义
[0132] 术语"氨基酸"在本说明书中表示羧基α-氨基酸的类别,是由核酸直接编码或以 前体的形式编码。由编码单个氨基酸的核酸由3个核苷酸组成,被称为密码子或碱基-三 联体。每个氨基酸由至少一个密码子编码。不同密码子编码相同氨基酸被称为"遗传密码 的简并性"。术语"氨基酸"在本说明书中表示天然存在的羧基α-氨基酸,包括丙氨酸(三 字母代码:ala,一字母代码:Α)、精氨酸(arg,R)、天冬酰胺(asn,N)、天冬氨酸(asp,D)、半 胱氨酸(cys,C)、谷氨酰胺(gln,Q)、谷氨酸(glu,E)、甘氨酸(gly,G)、组氨酸(his,H)、异 亮氨酸(ile,I)、亮氨酸(leu,L)、赖氨酸(lys,K)、甲硫氨酸(met, M)、苯丙氨酸(phe,F)、 脯氨酸(pro, P)、丝氨酸(ser,S)、苏氨酸(thr,T)、色氨酸(trp,W)、酪氨酸(tyr,Y)和缴 氨酸(val,V)。
[0133] 术语"抗体"在本文中使用最广泛的含义,涵盖了各种抗体结构,包括但不限于单 克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要其表现出理 想的抗原结合活性。
[0134] "抗体片段"指除完整抗体以外的分子,包括完整抗体的一部分,所述部分结合完 整抗体所结合的抗原。抗体片段的例子包括但不限于Fv、Fab、Fab'、Fab' _SH、F(ab')2 ;二 价体(diabody);线性抗体;单链抗体分子(例如,scFv);和由抗体片段形成的多特异性抗 体。
[0135] 术语"密码子"表示由编码定义氨基酸的3个核苷酸组成的寡核苷酸。由于遗传密 码的简并性,大部分氨基酸都有一个以上的密码子编码。这些编码相同氨基酸的不同密码 子在各宿主细胞中具有不同的相对使用频率。因此,特定的氨基酸实际上是由一个密码子 或者由一组不同的密码子编码的。多肽的氨基酸序列同样可以由不同的核酸编码。因此, 多肽中的特定氨基酸(残基)可以由一组不同的密码子编码,使每个这些密码子在给定的 宿主细胞中具有使用频率。
[0136] 由于可获得大量常用宿主细胞的大量基因序列,因此可以计算密码子使用的相对 频率。可以自例如"Codon Usage Database,'(www.kazusa.or. jp/codon/),Nakamura,Y.等 人,Nucl. Acids Res. 28 (2000) 292中获得计算后的密码子用法表。
[0137] "EMBOSS:The European Molecular Biology Open Software Suite" (Rice,P. 等人,Trends Gen.l6(2000)276-277, Release 6.0.1,15.07.2009)中已经报道了酵母、 E. coli、智人和仓鼠的密码子用法表,显示在下表中。计算了每种氨基酸的20种天然存在 的氨基酸在E.coli、酵母、人细胞和CH0细胞中不同的密码子使用频率,而不是所有64个密 码子。
[0138] 表:酿酒酵母(Saccharomyces cerevisiae)的整体密码子使用频率
[0139] (编码氨基酸|密码子|使用频率[% ])
[0140] Ala GCG 1 Gly GGG 1 Pro CCG 1 Ala GCA 6 Gly GGA 3 Pro CCA 80 Ala GOT 64 Gly GGT 89 Pro CCT 17 Ala GCC 29 Gly GGC 7 Pro CCC 2 Arg AGG 3 His CAT 37 Ser AGT 6 Arg AGA 77 His CAC 63 Ser AGC 5 Arg CGG 0 Ser TCG 2 Arg CGA 0 lie ATA 2 Ser TCA 8
[0141] Arg CGT 19 lie ATT 52 Scr TCT 49 Arg CGC 1 lie ATC 45 Ser TCC 31 Asn AAT 23 Leu CTG 3 Thr ACG 1 Asn A AC 77 Leu CTA 9 Thr ACA 8 Leu CTT 4 Thr ACT 52 Asp GAT 49 Leu CTC 1 Thr ACC 40 Asp GAC 51 Leu TTG 64 Leu TTA 20 Trp TGG 100 Cys TGT 87 Cys TGC 13 Lys AAG 74 Tyr TAT 22 Lys AAA 26 Tyr TAC 78 Gin CAG 6 Gin CAA 94 Met ATG 100 ¥al GTG 4 Yal GTA 3 Glu GAG 11 Phe TTT 29 ¥al GTT 54 Glu GAA 89 Phe TTC 71 Val GTC 38
[0142] 表:大肠埃希氏菌(Escherichia Coli)整体密码子使用频率
[0143] (编码氨基酸I密码子I使用频率[% ])
[0144] Ala GCG 32 Gly GGG 4 Pro CCG 75 Ala GCA 24 Gly GGA 2 Pro CCA 14 Ala GOT 28 Gly GGT 51 Pro CCT 10 Ala GCC 16 Gly GGC 43 Pro CCC 1 Arg AGG 0 His CAT 29 Ser AGT 4 Arg AG A 0 His CAC 71 Ser AGC 25 Arg CGG 1 Ser TCG 7 Arg CGA 1 lie ATA 0 Ser TCA 5 Arg CGT 65 lie ATT 32 Ser TCT 32 Arg CGC 33 lie ATC 68 Ser TCC 27
[0145] Asn A AT 16 Leu CTG 79 Thr ACG 12 Asn AAC 84 Leu CTA 1 Thr AC A 4 Leu CTT 5 Thr ACT 28 Asp GAT 46 Leu CTC 8 Thr ACC 56 Asp GAC 54 Leu TTG 5 Leu TTA 3 Trp TGG 100 Cys TGT 36 Cys TGC 64 Lys AAG 20 Tyr TAT 36 Lys AAA 80 Tyr TAC 64 Gin CAG 82 Gin CAA 18 Met ATG 100 Val GTG 27 Val GTA 20 Glu GAG 24 Phe TTT 2H Val GTT 40 Glu GAA 76 Pile TTC n Val GTC 13
[0146] 表:智人种(Homo sapiens)整体密码子使用频率
[0147] (编码氨基酸I密码子I使用频率[% ])
[0148] Ala GCG 10 Gly GGG 24 Pro CCG 11 Ala GCA 22 Gly GGA 25 Pro CCA 28 Ala GCT 27 Gly GGT 17 Pro CCT 28 Ala GCC 41 Gly GGC 34 Pro CCC 33 Arg AGG 20 His CAT 40 Ser AGT 15 Arg AGA 20 His CAC 60 Ser AGO 25 Arg CGG 20 Ser TCG 6 Arg CGA 11 lie ATA 15 Ser TCA 14 Arg CGT 9 lie ATT 35 Ser TCT 18 Arg CGC 20 lie ATC 50 Ser TCC 23 Asn AAT 45 Leu CTG 42 Thr ACG 12 Asn A AC 55 Leu CTA 7 Thr ACA 27 Leu CTT 13 Thr ACT 24 Asp GAT 46 Leu CTC 20 Thr ACC 37 Asp GAC 54 Leu TTG 12 Leu TTA 7 Trp TGG 100 Cys TGT 44 Cys TGC 56 Lys AAG 59 Tyr TAT 43 Lys AAA 41 Tyr TAG 57 Gin CAG 74 Gin CAA 26 Met ATG 100 Val GTG 47 Val GTA 11
[0149] Glu GAG 58 Phe TTT 45 Val GTT 17 Glu GAA 42 Phe TTC S5 Val GTC 25
[0150] 表:仓鼠整体密码子
[0151] (编码氨基酸I密码子I使用频率[% ])
[0152] Ala GCG 9 Gly GGG 24 Pro CCG 7 Ala GCA 23 Gly GGA 25 Pro CCA 29 Ala GOT 30 Gly GGT 19 Pro CCT 29 Ala GCC 38 Gly GGC 33 Pro CCC 34 Arg AGG 22 His CAT 42 Ser AGT 14 Arg AGA 20 His CAC 58 Ser AGC 24 Arg CGG 19 Ser TCG 5 Arg CGA 9 lie ATA 15 Ser TCA 15 Arg CGT 10 lie ATT 35 Ser TCT 18 Arg CGC 19 lie ATC 51 Ser TCC 24 Asn A AT 39 Leu CTG 44 Thr ACG 10 Asn A AC 61 Leu CTA 6 Thr ACA 29 Leu CTT 13 Thr ACT 21 Asp GAT 39 Leu CTC 19 Thr ACC 40 Asp GAC 61 Leu TTG 12 Leu TTA 6 Tip TGG 100 Cys TGT 42 Cys TGC 58 Lys AAG 67 Tyr TAT 39 Lys AAA j3 Tyr TAG 61 Gin CAG 78 Gin CAA 22 Met ATG 1U0 Val GIG 48 Val GTA 11 Glu GAG 64 Phe TTT 44 Val GTT 16 Glu GAA 36 Phe TTC 56 Val GTC 25
[0153] 术语"表达"在本文中指在细胞在发生的转录和/或翻译过程。可以基于细 胞中存在的相应mRNA的量,确定目标核酸序列在细胞中的转录水平。例如,可以通过 RT-PCR(qRT-PCR)或Northern杂交(参见Sambrook,J.等人,1989,见上文),定量从目标序 列转录的mRNA。可以通过多种方法,例如ELISA、评估多肽的生物学活性或应用不依赖于这 类活性的测定(如使用识别和结合多肽的免疫球蛋白的Western印迹或放射性免疫测定), 定量由目标核酸编码的多肽(参见Sambrook, J.等人,1989,见上文)。
[0154] "表达盒"指含有必需的调控元件的构建体,例如启动子和多聚腺苷酸化位点,用 于在细胞中至少表达所含有的核酸。
[0155] 基因表达的实施是瞬时的或永久的表达。目标多肽一般是分泌型多肽,因此含 有N-末端延伸(也称为信号序列),是多肽通过细胞壁运输/分泌到胞外基质中所必需 的。一般而言,信号序列可以源自任何编码分泌型多肽的基因。如果使用异源的信号序 列,则优选是被宿主细胞识别和加工(即,被信号肽酶切割)的。例如,为了在酵母中分 泌,可以用源自分泌型基因的同源酵母信号序列取代待表达的异源基因的天然信号序列, 如酵母转化酶的信号序列、 α-因子前导序列(包括酵母(Saccharomyces)、克鲁维酵母 (Kluyveromyces)、毕赤酵母(Pichia)和汉逊酵母(Hansenula)的α-因子前导序列,第二 个描述在US 5, 010, 182中)、酸性磷酸酶信号序列,或白色念珠菌(C. albicans)葡糖淀粉 酶信号序列(EP 0362179)。在哺乳动物细胞表达中,目标蛋白质的天然信号序列是令人满 意的,但其他的哺乳动物信号序列也是合适的,如来自相同或相关物种的分泌型多肽的信 号序列,例如来自人或鼠类来源的免疫球蛋白,以及病毒性分泌信号序列,例如单纯疱疹病 毒糖蛋白D的信号序列。将编码这类前片段的DNA片段连接在读码框内,S卩,与编码目标多 肽的DNA片段有效连接。
[0156] 术语"细胞"或"宿主细胞"指可以转染或已转染了例如编码异源多肽的核酸的细 胞。术语"细胞"包括原核细胞,其用于表达核酸和生产编码的多肽,包括扩增质粒;和真核 细胞,其用于表达核酸和生产编码的多肽。在一个实施方案中,真核细胞是哺乳动物细胞。 在一个实施方案中,哺乳动物细胞是CH0细胞,任选的CHO K1细胞(ATCC CCL-61或DSM ACC 110)、或 CHO DG44 细胞(也称为 CH〇-DHFR[-],DSM ACC 126)、或 CHO XL99 细胞、CH0-T 细胞(参见例如 Morgan, D.等人,Biochemistry 26 (1987) 2959-2963)、或 CH0-S 细胞、或 Super-CHO 细胞(Pak, S. C. 0·等人 Cytotechnology 22 (1996) 139-146)。如果这些细胞不 适应在无血清培养基或悬浮液中生长,则在使用本发明方法前进行适应性改动。如本文中 使用的,表达"细胞"包括对象细胞及其后代。因此,词语"转化子"和"转化细胞"包括了原 代对象细胞及其来源的培养物,不论传代或亚培养的次数。还应理解,由于人为突变或自发 突变,所有后代的DNA含量可以不必精确的相同。具有与最初转化细胞所筛选的功能或生 物学活性相同的功能或生物学活性的变体后代也包括在内。
[0157] 在一个实施方案中,真核细胞是酵母细胞。在一个实施方案中,酵母细胞是酵母 属、或毕赤酵母属、或汉逊酵母属、或克鲁维酵母属、或裂殖酵母属的酵母。
[0158] 在一个实施方案中,原核细胞是埃希氏菌(Escherichia)细胞、或沙门氏菌 (Salmonella)细胞、或芽孢杆菌(Bacillus)细胞、或乳球菌(Lactococcus)细胞、或链球菌 (Streptococcus)细胞。
[0159] 在一个实施方案中,真核细胞是植物细胞。在一个实施方案中,植物细胞属于拟南 芥属、烟草属和番茄属。
[0160] 术语"密码子优化"表示用在相应细胞中具有不同使用频率的不同密码子替换多 肽编码核酸中的一个、至少一个、或一个以上密码子。
[0161] 术语"密码子优化的核酸"表示通过用在细胞中具有不同的相对使用频率的编码 相同氨基酸残基的密码子,替换亲代多肽编码核酸中的一个、至少一个、或一个以上密码 子,已经改良而在细胞中具有改善的表达的编码多肽的核酸,例如哺乳动物细胞或细菌细 胞。
[0162] "基因"表示核酸片段,例如位于染色体或质粒上、可以实现肽、多肽或蛋白质表达 的片段。除编码区(即,结构基因)外,基因还包括其他功能元件,例如信号序列、启动子、 内含子和/或终止子。
[0163] 术语"密码子组"及其语义学等价物表示编码一个(即,相同)氨基酸残基的一定 数量的不同密码子。一组的单个密码子在细胞基因组中的整体使用频率不同。根据组内密 码子的数量,密码子组中的每个密码子具有具体的组内使用频率。该具体的组内使用频率 可以不同于细胞基因组中的整体使用频率,但依赖于所述整体使用频率(与其相关)。密码 子组可以仅包含一个密码子,也可以包括多达6个密码子。
[0164] 术语"细胞基因组中的整体使用频率"表示具体密码子在整个细胞基因组中的出 现频率。
[0165] 术语密码子组中的密码子的"具体使用频率"表示密码子组的单个(即,具体)密 码子相对于一组的所有密码子的频率,所述具体使用频率可见于编码多肽的核酸中,用本 文报道的方法获得。具体使用频率的值取决于细胞基因组中的具体密码子的整体使用频率 和组内的密码子数量。因此,由于密码子组不必包含编码一个具体氨基酸残基的所有可能 的密码子,所以密码子组中的密码子的具体使用频率至少与其在细胞基因组中的整体使用 频率相同,最多是100%,即,至少与细胞基因组中的整体使用频率相同,也可以更高。密码 子组的所有成员的具体密码子使用频率的总和总是几乎100%。
[0166] 术语"氨基酸密码子基序"表示密码子的顺序,所述密码子都是相同密码子组的成 员,因此编码相同的氨基酸残基。氨基酸密码子基序中不同密码子的数量与密码子组中的 不同密码子数量相同,但每个密码子可以在氨基酸密码子基序中出现一次以上。此外,每个 密码子以其具体使用频率存在于氨基酸密码子基序中。因此,氨基酸密码子基序代表编码 相同氨基酸残基的不同密码子顺序,其中每个不同的密码子以其具体使用频率存在,其中 顺序以具有最高具体使用频率的密码子开始,且其中按定义的顺序排列密码子。例如,编码 氨基酸残基丙氨酸的密码子组包括4种密码子GCG、GCT、GCA和GCC,具体使用频率分别为 32^^28^^24%和16% (对应于4:4:3:2比例)。氨基酸残基丙氨酸的氨基酸密码子基序 定义为包含4种密码子606、6(:1\604和60:,比例为4 :4:3:2,其中第一密码子是606。丙 氨酸的一种示例性氨基酸密码子基序是gcg gcg gcg gcg get get get get gca gca gca gee gcc(SEQ ID N0:01)。该基序由13个顺序的密码子组成(4+4+3+2 = 13)。在多肽的 氨基酸序列中第一次出现氨基酸残基丙氨酸时,在相应的编码核酸中使用氨基酸密码子基 序的第一个密码子。在第二次出现丙氨酸时,使用氨基酸密码子基序的第二个密码子,依此 类推。在多肽的氨基酸序列中第13次出现丙氨酸时,在相应的编码核酸中使用氨基酸密码 子基序的第13位,S卩,最后一位密码子。在多肽的氨基酸序列中第14次出现氨基酸丙氨酸 时,再次使用氨基酸密码子基序的第一个密码子,依此类推。
[0167] 术语"核酸"或"核酸序列"在本说明书中可以互换的使用,指由单个核苷酸(也 称为碱基)a、c、g和t (或u在RNA中)组成的多聚分子,例如DNA、RNA或其修饰物。该多 核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一个或多个天然存 在的多核苷酸分子与一个或多个合成的多核苷酸分子的组合。该定义还涵盖了天然存在的 多核苷酸分子,其中一个或多个核苷酸是改变的(例如,通过诱变)、删除的、或添加的。核 酸可以是分离的或整合到另一种核酸中,例如表达盒、质粒或宿主细胞的染色体中。核酸的 特征是其由单个核苷酸组成的核酸序列。
[0168] 对于本领域技术人员而言,将氨基酸序列(例如多肽)转化为编码该氨基酸序列 的相应核酸序列的程序和方法是普遍已知的。因此,核酸的特征是其由单个核苷酸组成的 核酸序列,和由其编码的多肽的氨基酸序列。
[0169] "结构基因"表示没有信号序列的基因区域,S卩,编码区。
[0170] "转染载体"是提供包含编码核酸/结构基因的转染载体在宿主细胞中表达必需的 所有元件的核酸(也被称为核酸分子)。转染载体包含原核质粒扩增单元,例如用于E. coli 的,继而包含复制的原核起点,和产生原核选择剂抗性的核酸,还包含转染载体一个或多个 产生真核选择剂抗性的核酸,和一个或多个编码目标多肽的核酸。优选的是产生选择剂抗 性的核酸和编码目标多肽的核酸分别位于表达盒中,使每个表达盒包含启动子、编码核酸 和包含多聚腺苷酸化信号的转录终止子。基因表达通常处于启动子的控制之下,这类结构 基因被称为与启动子"有效连接"。类似的,如果调控元件调节核心启动子的活性,则调控元 件和核心启动子是有效连接的。
[0171] 如本文中使用的,术语"载体"指能够扩增与其相连的另一种核酸的核酸分子。术 语包括作为自主复制型核酸结构的载体,以及整合到所导入的宿主细胞基因组中的载体。 某些载体能够指导与其有效连接的核酸的表达。这类载体在本文中被称为"表达载体"。
[0172] 重组方法
[0173] 可以使用重组方法和组合物生产抗体,例如US 4, 816, 567所述。在一个实施方案 中,提供了本文报道的编码抗体的分离的核酸。这类核酸可以编码包含抗体的VL的氨基酸 序列和/或包含抗体的VH的氨基酸序列(例如,抗体的轻链和/或重链)。在一个实施方 案中,提供了包含这类核酸的一个或多个载体(例如,表达载体)。在一个实施方案中,提供 了包含所述核酸的细胞。在一个实施方案中,细胞包含(例如,已转化了):(1)包含编码包 含抗体的VL的氨基酸序列和包含抗体的VH的氨基酸序列的核酸的载体,或(2)包含编码 包含抗体的VL的氨基酸序列的核酸的第一载体,和包含编码抗体的VH的氨基酸序列的核 酸的第二载体。在一个实施方案中,细胞是真核的,例如中华田鼠卵巢(CH0)细胞或淋巴细 胞(例如,Y0、NS0、Sp2/0细胞)。在一个实施方案中,提供了制备抗体的方法,其中方法包 含在适合抗体表达的条件下,培养本文提供的包含编码抗体的核酸的细胞,和任选的从细 胞(或培养基)回收抗体。
[0174] 为了重组生产抗体,分离编码抗体的核酸,例如本文所述,并将其插入到一个或多 个载体中,用于进一步克隆和/或在细胞中表达。可以使用常规方法方便的分离和测序这 类核酸(例如,使用能够特异性结合编码抗体重链和轻链的基因的寡核苷酸探针)。
[0175] 用于克隆或表达抗体编码载体的合适细胞包括本文所述的原核或真核细胞。 例如,可以在细菌中生产抗体,特别是当不需要糖基化和Fc效应子功能时。关于在细 菌中表达抗体片段和多肽,参见例如US 5, 648, 237、US 5, 789, 199和US 5, 840, 523; Charlton,K.A.,In:Methods in Molecular Biology,第 248 卷,Lo,B.K.C.(编著),Humana Press,Totowa,NJ(2003),第 245-254 页,描述了在E·coli中表达抗体片段。在表达后,可 以在可溶性级分中分离抗体和细菌细胞浆,并可进一步纯化。
[0176] 除原核细胞外,真核微生物(如丝状真菌或酵母)是抗体编码载体的合适的克隆 或表达宿主,包括糖基化通路被"人源化"的真菌和酵母菌株,导致生产具有部分或完全人 糖基化模式的抗体(参见 Gerngross, T. U.,Nat. Biotech. 22 (2004) 1409-1414 ;和 Li, H.等 人,Nat. Biotech. 24 (2006) 210-215)。
[0177] 用于表达糖基化抗体的合适的宿主细胞也源自多细胞生物(无脊椎动物和脊椎 动物)。无脊椎动物细胞的例子包括植物和昆虫细胞。已鉴别了多个可以与昆虫细胞联合 使用的杆状病毒株,特别是用于转染秋粘虫(Spodoptera frugiperda)细胞。
[0178] 也可以利用植物细胞培养物作为宿主(参见例如US 5, 959, 177、US 6, 040, 498、 US 6, 420, 548、US 7, 125, 978和US 6, 417, 429(描述了用于在转基因植物中生产抗体的 PLANTIB0DIES? 技术)。
[0179] 也可以利用脊椎动物细胞作为宿主。例如,可使用适应于在悬浮液中生长的哺 乳动物细胞系。其他有效的哺乳动物细胞系的例子是用SV40转化的猴肾CV1细胞系 (C0S-7);人胚肾细胞系(293 细胞,例如 Graham, RL 等人,J. Gen Virol. 36 (1977) 59-74 所述);幼仓鼠肾细胞(ΒΗΚ);小鼠足细胞(TM4细胞,例如Mather,J. P.,Biol. R印rod.23(1980)243-252 所述);猴肾细胞系(CVl);非洲绿猴肾细胞(VER0-76);人宫颈 癌细胞(HELA);犬肾细胞(MDCK);水牛鼠肝细胞(BRL 3A);人肺细胞(W138);人肝细胞 Ofep G2);小鼠乳腺癌(MMT 060562) ;TRI 细胞,例如Mather, J.P.等人,Annals N.Y. Acad. Sci. 383(1982)44-68所述;MRC 5细胞;和FS4细胞。其他有效的哺乳动物细胞系包括中 华田鼠卵巢(CH0)细胞,包括 DHFR-CH0 细胞(Urlaub,G.等人,Proc.Natl.Acad.Sci.USA 77(1980)4216-4220);和黑色素瘤细胞系,如Y0、NS0和Sp2/0。关于适合抗体生产的某 些哺乳动物宿主细胞系的综述,参见例如Yazaki,P.和Wu,A.M.,Methods in Molecular Biology,第 248 卷,Lo, Β· K. C.(编著),Humana Press, Totowa, NJ(2004),第 255-268 页。
[0180] 密码子用法
[0181] 可方便的获得密码子用法表(例如参见上表),例如可自http://www. kazusa. or. jp/codon/获得的"Codon Usage Database",可以多种方式调整这些表格(Nakamura, Υ· 等人,Nucl. Acids Res. 28 (2000) 292)。
[0182] 编码核酸在重组多肽的高产量表达中发挥了重要作用。天然存在的和自自然界分 离的编码核酸对于高产量表达一般不是优化的,尤其是在异源宿主细胞中表达的话。由于 遗传密码的简并性,一个氨基酸残基可以被一种以上的核苷酸三联体(密码子)编码,氨基 酸色氨酸和甲硫氨酸除外。因此,一个氨基酸序列可以有不同的编码密码子(=相应的编 码核酸序列)。
[0183] 不同的生物体以不同的相对频率使用编码一个氨基酸残基的不同密码子(密码 子用法)。一般一个特定的密码子使用的频率比其他可能的密码子更高。
[0184] W0 2001/088141中报道了根据高表达的哺乳动物基因发现的密码子用法的读码 框优化。出于所述目的,生成了矩阵,几乎只考虑在高表达的哺乳动物基因中最常用的那些 密码子,次优的是第二常用的那些密码子,如下表所述。
[0185] 使用这些来自高表达的人基因的密码子,生成了不存在于自然界中的纯合成读码 框,然而其编码与原始野生型基因构建物完全相同的产物。
[0186] US 8, 128, 938中报道了使用单个密码子的使用频率优化密码子的不同方法,如一 致优化、完全优化和最小优化。
[0187] 下表中显示了在高表达的哺乳动物基因中可见的最常用的密码子(密码子1)和 第二常用的密码子(密码子2)。
[0188] 表
[0189]
【权利要求】
1. 用于在原核细胞中重组生产多肽的方法,包括培养包含编码多肽的核酸的原核细胞 的步骤,和从原核细胞或培养基中回收多肽的步骤, 其中,多肽的每个氨基酸残基都是由至少一个密码子编码的,编码相同氨基酸残基的 密码子组合成组,组内的每个密码子按其在组内的具体使用频率定义,一组内所有密码子 的具体使用频率之和为100%, 其中多肽编码核酸中的每个密码子的整体使用频率与其在组内的具体使用频率几乎 相同。
2. 权利要求1的方法,其特征是组仅包括在细胞基因组中的整体使用频率大于5%的 密码子。
3. 权利要求1的方法,其特征是组仅包括在细胞基因组中的整体使用频率为8%或更 高的密码子。
4. 权利要求1的方法,其特征是组仅包括在细胞基因组中的整体使用频率为10%或更 高的密码子。
5. 权利要求1至4的任一项的方法,其特征是从多肽的N-末端开始,多肽中每个顺序 出现的特定氨基酸在编码核酸的相应位置上使用与特定氨基酸的相应氨基酸密码子基序 中相应顺序位置上存在的密码子相同的密码子。
6. 权利要求5的方法,其特征是: i) 使用氨基酸密码子基序的最后一个密码子后,在多肽中下一次出现特定氨基酸时在 相应的编码核酸中再次使用位于相应氨基酸密码子基序中的第一个密码子, ii) 多肽中再次顺序出现这一特定氨基酸时,在编码核酸的相应位置上,使用位于特定 氨基酸的相应氨基酸密码子基序中相应位置上的密码子。
7. 权利要求5至6的任一项的方法,其特征是氨基酸密码子基序中的密码子是按递减 的具体使用频率排列的,使得在具有最低具体使用频率的密码子之后,或者在具有第二低 的具体使用频率的密码子之后,使用具有最高具体使用频率的密码子。
8. 权利要求7的方法,其特征是氨基酸密码子基序中的密码子是按递减的具体使用频 率排列的,使得在具有最低的具体使用频率的密码子之后,使用具有最高的具体使用频率 的密码子。
9. 权利要求1至8的任一项的方法,其特征是所述细胞是E. coli。
10. 权利要求9的方法,其特征是氨基酸密码子基序是 丙氨酸选自SEQ ID N0:01、02、03、04和05,和/或 精氨酸选自SEQ ID NO:06和07,和/或 天冬酰胺选自SEQ ID N0:08、09、10、ll和12,和/或 天冬氨酸选自SEQ ID NO: 13和14,和/或 半胱氨酸选自SEQ ID N0:15、16和17,和/或 谷氨酰胺选自SEQ ID N0:18、19、20和21,和/或 谷氨酸选自SEQ ID N0:22、23和24,和/或 甘氨酸选自SEQ ID N0:25和26,和/或 组氨酸选自SEQ ID NO: 27和28,和/或 异亮氨酸选自SEQ ID NO: 29和30,和/或 亮氨酸选自SEQ ID N0:31、32和33,和/或 赖氨酸选自SEQ ID N0:34、35、36和37,和/或 苯丙氨酸选自SEQ ID N0:38、39和40,和/或 脯氨酸选自 SEQ ID NO:41、42、43、44、45 和 46,和 / 或 丝氨酸选自SEQ ID NO:47和48,和/或 苏氨酸选自SEQ ID N0:49、50和51,和/或 酪氨酸选自SEQ ID N0:52和53,和/或 缬氨酸选自SEQ ID NO:54、55和56。
11.权利要求1至10的任一项的方法,其特征是所述多肽是抗体、或抗体片段、或抗体 融合多肽。
【文档编号】C12N15/67GK104245937SQ201380020266
【公开日】2014年12月24日 申请日期:2013年4月15日 优先权日:2012年4月17日
【发明者】S·克洛斯特曼, E·科佩茨基, U·施瓦茨 申请人:弗·哈夫曼-拉罗切有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1