Glp-1融合蛋白的制作方法

文档序号：388952阅读：365来源：国知局

专利名称：Glp-1融合蛋白的制作方法
技术领域：
本发明涉及与一些蛋白融合的胰高血糖素样肽，包括其类似物和衍生物，所述蛋白具有延长胰高血糖素样肽的体内半衰期的作用。这些融合蛋白可以用于治疗非胰岛素依赖型糖尿病和各种状况。
胰高血糖素样肽-1(GLP-1)是一个含有37个氨基酸的、可对食物摄入作出应答的肽，是由肠L-细胞分泌的。已经发现胰高血糖素样肽-1可刺激胰岛素分泌(促胰岛素活性)，从而引起细胞对葡萄糖的吸收和血清葡萄糖水平下降(见如Mojsov，S.，Int.J.Peptide ProteinResearch，40333-343(1992))。然而，GLP-1活性很低。随后在第6位和第7位之间的内源性裂解产生了生物活性更强的GLP-1(7-37)OH肽。已知有很多GLP-1类似物和衍生物，在此称作“GLP-1化合物”。这些GLP-1类似物包括GILA毒蜥(monster)毒液中的Exendins。Exendins具有与天然GLP-1同源的序列，结合GLP-1受体并起始由GLP-1(7-37)OH引起的负责多种活性的信号传导级联。
GLP-1化合物具有各种重要的生理活性。例如，已经证明GLP-1刺激胰岛素释放，降低胰高血糖素分泌，抑制胃排空，并且增强葡萄糖利用。[Nauck，M.A.，et al.(1993)Diabetologia 36741-744；Gutniak，M.，et al.(1992)New England J.of Med.32613161322；Nauck，M.A.，et al.，(1993)J.Clin.Invest.91301307]。
GLP-1表现出作为非胰岛素依赖型糖尿病(NIDDM)的治疗方法的最大潜能。市场上已经有许多口服药物，用于治疗与NIDDM相关的胰岛素抵抗。然而，当疾病进展时，患者必须开始刺激胰岛素释放，并最终进行涉及胰岛素注射的治疗。然而，当前刺激胰岛素释放的药物和胰岛素的实际给药也可导致低血糖症。GLP-1活性受血糖水平的控制。当该水平降低到某一域值水平时，GLP-1无活性。因此。没有发生与GLP-1治疗相关的低血糖症的危险。
然而，涉及GLP-1肽的治疗的用途受到了它们的迅速清除和短半衰期的限制。例如，GLP-1(7-37)的血清半衰期仅仅为3-5分钟。当皮下给药时，GLP-1(7-36)酰胺的作用时间为约50分钟。甚至抗内源性蛋白酶裂解的类似物和衍生物也没有足够长的半衰期以避免在24小时的时间段中重复给药。当需要在长时间内维持治疗剂的高血液水平时，治疗剂的迅速清除是不方便的，因为必须重复给药。此外，长作用时间的化合物对于过去的治疗方案只包括口服药物的糖尿病患者特别重要。这些患者通常对于包括多次药物注射的方案具有极为困难的时间过渡。
本发明克服了与递送具有短血清半衰期的化合物相关的问题。本发明包括与另一种具有长的循环半衰期的蛋白，如免疫球蛋白或白蛋白的Fc部分融合的GLP-1化合物。
一般地，小的治疗性肽难以操作，因为即使是它们的结构中的轻微改变也可以影响稳定性和/或生物活性。对于目前开发中的GLP-1化合物来说更是如此。例如，例如，GLP-1(7-37)OH具有进行构象改变的倾向，从主要为α螺旋结构改变成主要为β折叠结构。β折叠的形成导致被认为是无活性的物质的聚集。因此，能够开发半衰期增加的生物活性GLP-1融合蛋白是出乎意料的。因此，由于对GLP-1(737)OH本身和相对于所连接的GLP-1肽来说很大的融合配偶体进行工作的困难，这尤其是预料不到的。
本发明的化合物包括一种异源融合蛋白，它包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)人白蛋白；b)人白蛋白类似物；和c)人白蛋白的片段，并且其中第一个多肽的C末端与第二个多肽的N末端融合。
本发明的化合物还包括一种异源融合蛋白，它包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)人白蛋白；b)人白蛋白类似物；和c)人白蛋白的片段，并且其中第一个多肽的C末端通过肽接头与第二个多肽的N末端融合。肽接头优选选自a)富含甘氨酸的肽；
b)具有序列[Gly-Gly-Gly-Gly-Ser]n的肽，其中n是1，2，3，4，5或6；和c)具有序列[Gly-Gly-Gly-Gly-Ser]3的肽。
本发明的其它化合物包括一种异源融合蛋白，包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)免疫球蛋白的Fc部分；b)免疫球蛋白的Fc部分的类似物；和c)免疫球蛋白的Fc部分的片段，并且其中第一个多肽的C末端与第二个多肽的N末端融合。GLP-1化合物可以通过肽接头与第二个多肽融合。肽接头优选选自a)富含甘氨酸的肽；b)具有序列[Gly-Gly-Gly-Gly-Ser]n的肽，其中n是1，2，3，4，5或6；和c)具有序列[Gly-Gly-Gly-Gly-Ser]3的肽。
作为异源融合蛋白的一部分的GLP-1化合物一般优选具有不超过6个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。GLP-1化合物甚至更优选具有不超过5个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。GLP-1化合物最优选具有不超过4，3或2个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。GLP-1化合物优选为第8位具有甘氨酸或缬氨酸的异源融合蛋白的一部分。
本发明还包括编码此处描述的异源融合蛋白的多核苷酸，包含这些多核苷酸的载体，和用此处描述的载体转染或转化的宿主细胞。还包括一种产生异源融合蛋白的方法，该方法包括在以可检测量表达异源融合蛋白的条件下转录和翻译此处描述的多肽的步骤。
本发明还包括一种使有需要的哺乳动物中的血糖水平正常化的方法，包括给予治疗有效量的此处描述的异源融合蛋白。
参考以下附图对本发明进行进一步描述

图1包括铰链区，CH2和CH3结构域的IgG1 Fc氨基酸序列。
图2人血清白蛋白氨基酸序列。
图3A.SDS-PAGE凝胶和同一凝胶的免疫印迹，描述IgG1-Fc和GLP-1-Fc融合蛋白的分子量(第1道，分子量标准；第2道，纯化的Fc；第3道，伪转化的培养基；第4道，Val8-GLP-1-Fc；第5道，Exendin-4-Fc)。B.SDS-PAGE凝胶和同一凝胶的免疫印迹，描述人HSA和GLP-1-HSA融合蛋白的分子量(第1道，分子量标准；第2道，纯化的HSA；第3道，伪转化的培养基；第4道，Val8-GLP-1-HSA；第5道，Val8-GLP-1-[Gly-Gly-Gly-Gly-Ser]3-HSA；第6道，Exendin-4-HSA；第7道，Exendin-4-[Gly-Gly-Gly-Gly-Ser]3-HSA)。
图4纯化Fc，白蛋白和GLP-1融合蛋白的SDS-PAGE凝胶(第1道，分子量标准；第2道，纯化的Fc；第3道，Val8-GLP-1-Fc；第4道，Exendin-4-Fc；第5道，分子量标准；第6道，Val8-GLP-1-HSA；第7道Exendin-4-HSA；第8道，Exendin-4-[Gly-Gly-Gly-Gly-Ser]3-HSA)。
图5含有图1所示Fc区的表达克隆载体。
图6含有图2所示Fc区的表达克隆载体。
图7含有与图2所示白蛋白序列的5’框内融合的含15个氨基酸的接头的编码DNA的表达克隆载体。
图8GLP-1融合蛋白的体外剂量反应活性。
图9GLP-1 Fc和HSA融合蛋白的药代动力学。
图10两只正常禁食狗中对Exendin-Fc的葡萄糖动力学(Glucodynamic)反应。
图11两只正常禁食狗中对Exendin-Fc的促胰岛素反应。
图12编码人IgG1 Fc区的DNA序列。
图13编码人白蛋白的DNA序列。
本发明的融合蛋白包含与人白蛋白，人白蛋白类似物，人白蛋白的片段，免疫球蛋白的Fc部分，免疫球蛋白的Fc部分的类似物，或免疫球蛋白的Fc部分的片段融合的GLP-1化合物。GLP-1化合物的C末端可以直接或通过肽接头与白蛋白或Fc蛋白的N末端融合。这些异源融合蛋白具有生物学活性并且与天然GLP-1相比，半衰期增加。
组成异源融合蛋白的一部分的GLP-1化合物优选包括具有约25-约39个天然存在的或非天然存在的与天然GLP-1(7-37)OH具有充分同源性的氨基酸的多肽，使得它们可以通过与胰腺β细胞上的GLP-1受体结合而表现出促胰岛素活性。GLP-1化合物一般包括具有GLP-1(7-37)OH，GLP-1(7-37)OH的类似物，GLP-1(7-37)OH的片段或GLP-1(7-37)OH的片段的类似物的氨基酸序列的多肽。GLP-1(7-37)OH具有SEQ ID NO1的氨基酸序列7 8 9 10 11 12 13 14 15 16 17His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys-Glu-Phe-29 30 31 32 33 34 35 36 37Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Gly(SEQ ID NO1)按照本领域中的习惯，GLP-1(7-37)OH的氨基末端定为第7位残基，而羧基末端定为第37位残基。对多肽中的其他氨基酸依次进行编号，如SEQ ID NO1中所示。例如，第12位为苯丙氨酸而第22位为甘氨酸。
GLP-1化合物也包括“GLP-1片段”。GLP-1片段是从GLP-1(7-37)OH或其类似物或衍生物的N-末端或C-末端截掉一个或多个氨基酸后得到的多肽。用于描述GLP-1(7-37)OH的术语也适用于GLP-1片段。例如，GLP-1(9-36)OH表示从N-末端截掉2个氨基酸和从C-末端截掉1个氨基酸后得到的GLP-1。此片段中的氨基酸是用与GLP-1(7-37)OH中相应氨基酸的数字来表示的。例如，GLP-1(9-36)OH中的N-末端谷氨酸在第9位；第12位是苯丙氨酸；而第22位是甘氨酸，这与GLP-1(7-37)OH相同。对于GLP-1(7-36)OH，GLP-1(7-37)OH第37位的甘氨酸被去除。
GLP-1化合物也包括在GLP-1(7-37)OH或其片段或类似物的N-末端和/或C-末端添加一个或多个氨基酸后得到的多肽。这类GLP-1化合物含有的氨基酸优选最多可达约39个。“延长的”GLP-1化合物中的氨基酸是用与GLP-1(7-37)OH中相应氨基酸的数字来表示的。例如，通过在GLP-1(7-37)OH的N-末端添加两个氨基酸得到的GLP-1化合物的N-末端氨基酸在第5位；而通过在GLP-1(7-37)OH的C-末端添加一个氨基酸得到的GLP-1化合物的C-末端氨基酸在第38位；因此，与GLP-1(7-37)OH中的序号相同，在这两类“延长的”GLP-1化合物中第12位是苯丙氨酸；而第22位是甘氨酸。“延长的”GLP-1化合物的1-6位氨基酸优选与GLP-1(7-37)OH中相应的氨基酸相同，或是对GLP-1(7-37)OH中相应氨基酸的保守取代。“延长的”GLP-1化合物的第38-45位氨基酸优选的与胰高血糖素或Exendin-4中相应的氨基酸相同，或是对胰高血糖素或Exendin-4中相应氨基酸的保守取代。
本发明的GLP-1化合物也包括“GLP-1类似物”。GLP-1类似物与GLP-1(7-37)OH或其片段具有充分的同源性，从而这些类似物也具有促胰岛素活性。优选地，GLP-1类似物包含有GLP-1(7-37)OH或其片段的氨基酸序列，对其进行修饰，这样其氨基酸序列中有1、2、3、4或5个氨基酸与GLP-1(7-37)OH或GLP-1(7-37)OH片段中相应位置上的氨基酸不同。在此处用来命名GLP-1化合物的命名法中，取代氨基酸及其位置与母结构相同。例如，Glu22-GLP-1(7-37)OH表示这样一个GLP-1化合物，其中GLP-1(7-37)OH正常的第22位甘氨酸由谷氨酸取代；Val8-Glu22-GLP-1(7-37)OH表示这样一个GLP-1化合物，其中GLP-1(7-37)OH正常的第8位丙氨酸和第22位甘氨酸分别由缬氨酸和谷氨酸取代。
本发明的GLP-1化合物也包括“GLP-1衍生物”。GLP-1衍生物也定义为具有GLP-1或GLP-1类似物的氨基酸序列的分子，但在其一个或多个氨基酸侧基、α碳原子、末端氨基或末端羧基还额外具有化学修饰。化学修饰包括，但不限于，添加化学部分，产生新的键，和去除化学部分。氨基酸侧基的修饰包括，但不限于，赖氨酸ε氨基的酰化，精氨酸，组氨酸，或赖氨酸的N烷基化，谷氨酸或天冬氨酸的羧基的烷基化，以及谷氨酰胺或天冬酰胺的脱酰胺。末端氨基的修饰包括，但不限于，脱氨基、N-低级烷基、N-二-低级烷基和N-酰基修饰。末端羧基的修饰包括，但不限于，酰胺、低级烷基酰基、二烷基酰胺和低级烷基酯修饰。低级烷基为C1-C4烷基。此外，可以用化学领域普通技术人员公知的保护基对一个或多个侧基或端基进行保护。氨基酸的α碳可以被单或二甲基化。
任何GLP-1化合物都可以是本发明的异源融合蛋白的一部分，只要该GLP-1化合物本身可以结合GLP-1受体并通过GLP-1受体诱导信号传递。GLP-1受体结合和信号传导可以分别用EP 619,32 2和美国专利5,120,712中描述的体外测定方法进行评估。
许多有活性的GLP-1片段、类似物和衍生物是本领域公知的，这些类似物和衍生物的任意一个都可以是本发明的异源融合蛋白的一部分。此处提供了新的GLP-1类似物和本领域公知的GLP-1类似物和衍生物的一些例子。
本领域公知的一些GLP-1类似物和GLP-1片段包括，例如，GLP-1(7-34)和GLP-1(7-35)，GLP-1(7-36)，Gln9-GLP-1(7-37)，D-Gln9-GLP-1(7-37)，Thr16-Lys18-GLP-1(7-37)，以及Lys18-GLP-1(7-37)。GLP-1类似物如GLP-1(7-34)和GLP-1(7-35)公开于美国专利5,118,666。具有促胰岛素特征的GLP-1的生物加工形式，例如GLP-1(7-36)是已知的。其它已知的生物活性GLP-1化合物公开于Buckley等人的美国专利5,545,618，以及Adelhorst等，J.Biol.Chem.2696275(1994)。
一组优选的GLP-1类似物由式I(SEQ ID NO2)的GLP-1类似物组成7 8 9 10 11 12 13 14 15 16 17His-Xaa-Xaa-Gly-Xaa-Phe-Thr-Xaa-Asp-Xaa-Xaa-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37 38 39Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-40 41 42 43 44 45Xaa-Xaa-Xaa-Xaa-Xaa-Xaa式 I(SEQ ID NO2)其中第8位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第9位的Xaa是Glu，Asp，或Lys；第11位的Xaa是Thr，Ala，Gly，Ser，Leu，Ile，Val，Glu，Asp，或Lys；
第14位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第16位的Xaa是Val，Ala，Gly，Ser，Thr，Leu，Ile，Tyr，Glu，Asp，Trp，或Lys；第17位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第18位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，Trp，Tyr，或Lys；第19位的Xaa是Tyr，Phe，Trp，Glu，Asp，Gln，或Lys；第20位的Xaa是Leu，Ala，Gly，Ser，Thr，Ile，Val，Glu，Asp，Met，Trp，Tyr，或Lys；第21位的Xaa是Glu，Asp，或Lys；第22位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第23位的Xaa是Gln，Asn，Arg，Glu，Asp，或Lys；第24位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Arg，Glu，Asp，或Lys；第25位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第26位的Xaa是Lys，Arg，Gln，Glu，Asp，或His；第27位的Xaa是Leu，Glu，Asp，或Lys；第30位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第31位的Xaa是Trp，Phe，Tyr，Glu，Asp，或Lys；第32位的Xaa是Leu，Gly，Ala，Ser，Thr，Ile，Val，Glu，Asp，或Lys；第33位的Xaa是Val，Gly，Ala，Ser，Thr，Leu，Ile，Glu，Asp，或Lys；第34位的Xaa是Asn，Lys，Arg，Glu，Asp，或His；第35位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第36位的Xaa是Gly，Arg，Lys，Glu，Asp，或His；
第37位的Xaa是Pro，Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys，或被去除；第38位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第39位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第40位的Xaa是Gly，Asp，Glu，或Lys，或被去除；第41位的Xaa是Ala，Phe，Trp，Tyr，Glu，Asp，或Lys，或被去除；第42位的Xaa是Ser，Pro，Lys，Glu，或Asp，或被去除；第43位的Xaa是Ser，Pro，Glu，Asp，或Lys，或被去除；第44位的Xaa是Gly，Pro，Glu，Asp，或Lys，或被去除；并且第45位的Xaa是Ala，Ser，Val，Glu，Asp，或Lys，或被去除；前提是当第37，38，39，40，41，42，43或44位的氨基酸被去除时，该氨基酸下游的每个氨基酸也被去除。
式I的GLP-1化合物优选具有不超过6个不同于GLP-1(7-37)OH或Exendin-4中的相应氨基酸的氨基酸。更优选具有不超过5个不同于GLP-1(7-37)OH或Exendin-4中的相应氨基酸的氨基酸。甚至更优选具有不超过4个不同于GLP-1(7-37)OH或Exendin-4中的相应氨基酸的氨基酸。
本发明的GLP-1化合物包括式I的衍生物，如其C-1-6-酯或酰胺或C-1-6-烷基酰胺，或C-1-6-二烷基酰胺。WO99/43706描述了式I的GLP-1化合物的衍生物，在此引入作为参考。WO99/43706描述的衍生的式I化合物和未衍生的式I化合物都包括在本发明的范围内。
另一组优选的GLP-1化合物由式II(SEQ ID NO3)的GLP-1类似物组成7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Xaa-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Leu-Glu-Gly-Xaa-Xaa-Ala-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-R式 II(SEQ ID NO3)
其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第9位的Xaa是Thr，Ser，Arg，Lys，Trp，Phe，Tyr，Glu，或His；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Tyr，Glu，或Ala；第18位的Xaa是His，Pro，Asp，Glu，Arg，Ser，Ala，或Lys；第19位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，Gln，或Arg；第24位的Xaa是Glu，Arg，Ala，或Lys；第26位的Xaa是Trp，Tyr，Phe，Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第31位的Xaa是Asp，Glu，Ser，Thr，Arg，Trp，或Lys；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Thr，Ser，Asp，Trp，Tyr，Phe，Arg，Glu，或His；第37位的R是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
另一组优选的GLP-1化合物由式III(SEQ ID NO4)的GLP-1类似物组成
7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Xaa-Xaa-Xaa-Xaa-R式 III(SEQ ID NO4)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Glu，His，Ala，或Lys；第25位的Xaa是Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Arg，Glu，或His；第37位的R是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
另一组优选的GLP-1化合物由式IV(SEQ ID NO5)的GLP-1类似物组成
7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Ala-Ala-Xaa-Glu-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Xaa-Arg-R式 IV(SEQ ID NO5)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第26位的Xaa是Asp，Lys，Glu，或His；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第37位的R是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，-NH2，Gly，Gly-Pro，或Gly-Pro-NH2，或被去除。
另一组优选的GLP-1化合物由式V(SEQ ID NO6)的GLP-1类似物组成
7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Ala-Lys-Glu-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Gly-Arg-R式 V(SEQ ID NO6)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第37位的R是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
式I，II，III，IV和V的优选GLP-1化合物包含GLP-1类似物或GLP-1类似物的片段，其中该类似物或片段在第8位含有除丙氨酸以外的氨基酸(第8位类似)。与天然GLP-1(7-37)OH中的相应氨基酸相比，这些第8位类似物优选含有在9、11、12、16、18、22、23、24、26、27、30、31、33、34、35、36和37位上进行的一或多个额外改变。与天然GLP-1(7-37)OH中的相应氨基酸相比，这些类似物也优选含有6个或少于6个改变。与天然GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸相比，这些类似物更优选含有5个或少于5个改变或含有4个或少于4个改变。与天然GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸相比，这些类似物甚至更优选的含有3个或少于3个改变。与天然GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸相比，这些类似物最优选含有2个或少于2个改变。
已经发现，式II，III，IV和V的化合物降低了聚集并产生不溶形式的倾向。这在融合蛋白的范围中也是重要的，其中相对小的GLP-1肽尽管融合于大得多的蛋白，也必须保持活性构象。本发明的融合蛋白包含的式II，III，IV和V的优选GLP-1化合物包括GLP-1类似物或GLP-1类似物的片段，其中第22的甘氨酸，优选第8位的丙氨酸被其它氨基酸取代。
当第22位氨基酸是天冬氨酸、精氨酸或赖氨酸时，第8位氨基酸优选为甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，而更优选是缬氨酸或甘氨酸。当第22位是磺酸如半胱磺酸时，第8位优选为甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，而更优选为缬氨酸或甘氨酸。
其它优选的GLP-1化合物包括式IV(SEQ ID NO5)的GLP-1类似物，其中该类似物具有GLP-1(7-37)OH的序列，但第8位的氨基酸优选是甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，更优选是缬氨酸或甘氨酸，而第30位是谷氨酸、天冬氨酸、丝氨酸或组氨酸，更优选为谷氨酸。
其它优选的GLP-1化合物包括式IV(SEQ ID NO5)的GLP-1类似物，其中该类似物具有GLP-1(7-37)OH的序列，但第8位氨基酸优选是甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，更优选为缬氨酸或甘氨酸，而第37位是组氨酸、赖氨酸、精氨酸、苏氨酸、丝氨酸、谷氨酸、天冬氨酸、色氨酸、酪氨酸、苯丙氨酸，而更优选是组氨酸。
其它优选的GLP-1化合物包括式IV(SEQ ID NO5)的GLP-1类似物，其中该类似物具有GLP-1(7-37)OH的序列，但第8位氨基酸优选是甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，更优选的为缬氨酸或甘氨酸，而第22位是谷氨酸、赖氨酸、天冬氨酸或精氨酸，更优选的是谷氨酸或赖氨酸，而第23位是赖氨酸、精氨酸、谷氨酸、天冬氨酸和组氨酸，更优选的是赖氨酸或谷氨酸。
其它优选的GLP-1化合物包括式V(SEQ ID NO6)的GLP-1类似物，其中该类似物具有GLP-1(7-37)OH的序列，但第8位氨基酸优选是甘氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸或甲硫氨酸，更优选是缬氨酸或甘氨酸，而第22位是谷氨酸、赖氨酸、天冬氨酸或精氨酸，更优选是谷氨酸或赖氨酸，而第27位是丙氨酸、赖氨酸、精氨酸、色氨酸、酪氨酸、苯丙氨酸或组氨酸，更优选是丙氨酸。
其它优选的GLP-1化合物包括式II的GLP-1类似物，其中该类似物具有GLP-1(7-37)OH的序列，但第8位氨基酸和选自第9位、11位、12位、16位、18位、22位、23位、24位、26位、27位、30位、31位、33位、34位、35位、36位及37位氨基酸的1、2或3个氨基酸与天然的GLP-1(7-37)OH中相应位置的氨基酸不同。
其它优选的式II的GLP-1化合物包括Val8-GLP-1(7-37)OH，Gly8-GLP-1(7-37)OH，Glu22-GLP-1(7-37)OH，Asp22-GLP-1(7-37)OH，Arg22-GLP-1(7-37)OH，Lys22-GLP-1(7-37)OH，Cys22-GLP-1(7-37)OH，Val8-Glu22-GLP-1(7-37)OH，Val8-Asp22-GLP-1(7-37)OH，Val8-Arg22-GLP-1(7-37)OH，Val8-Lys22-GLP-1(7-37)OH，Val8-Cys22-GLP-1(7-37)OH，Gly8-Glu22-GLP-1(7-37)OH，Gly8-Asp22-GLP-1(7-37)OH，Gly8-Arg22-GLP-1(7-37)OH，Gly8-Lys22-GLP-1(7-37)OH，Gly8-Cys22-GLP-1(7-37)OH，Glu22-GLP-1(7-36)OH，Asp22-GLP-1(7-36)OH，Arg22-GLP-1(7-36)OH，Lys22-GLP-1(7-36)OH，Cys22-GLP-1(7-36)OH，Val8-Glu22-GLP-1(7-36)OH，Val8-Asp22-GLP-1(7-36)OH，Val8-Arg22-GLP-1(7-36)OH，Val8-Lys22-GLP-1(7-36)OH，Val8-Cys22-GLP-1(7-36)OH，Gly8-Glu22-GLP-1(7-36)OH，Gly8-Asp22-GLP-1(7-36)OH，Gly8-Arg22-GLP-1(7-36)OH，Gly8-Lys22-GLP-1(7-36)OH，Gly8-Cys22-GLP-1(7-36)OH，Lys23-GLP-1(7-37)OH，Val8-Lys23-GLP-1(7-37)OH，Gly8-Lys23-GLP-1(7-37)OH，His24-GLP-1(7-37)OH，Val8-His24-GLP-1(7-37)OH，Gly8-His24-GLP-1(7-37)OH，Lys24-GLP-1(7-37)OH，Val8-Lys24-GLP-1(7-37)OH，Gly8-Lys23-GLP-1(7-37)OH，Glu30-GLP-1(7-37)OH，Val8-Glu30-GLP-1(7-37)OH，Gly8-Glu30-GLP-1(7-37)OH，Asp30-GLP-1(7-37)OH，Val8-Asp30-GLP-1(7-37)OH，Gly8-Asp30-GLP-1(7-37)OH，Gln30-GLP-1(7-37)OH，Val8-Gln30-GLP-1(7-37)OH，Gly8-Gln30-GLP-1(7-37)OH，Tyr30-
GLP-1(7-37)OH，Val8-Tyr30-GLP-1(7-37)OH，Gly8-Tyr30-GLP-1(7-37)OH，Ser30-GLP-1(7-37)OH，Val8-Ser30-GLP-1(7-37)OH，Gly8-Ser30-GLP-1(7-37)OH，His30-GLP-1(7-37)OH，Val8-His30-GLP-1(7-37)OH，Gly8-His30-GLP-1(7-37)OH，Glu34-GLP-1(7-37)OH，Val8-Glu34-GLP-1(7-37)OH，Gly8-Glu34-GLP-1(7-37)OH，Ala34-GLP-1(7-37)OH，Val8-Ala34-GLP-1(7-37)OH，Gly8-Ala34-GLP-1(7-37)OH，Gly34-GLP-1(7-37)OH，Val8-Gly34-GLP-l(7-37)OH，Gly8-Gly34-GLP-1(7-37)OH，Ala35-GLP-1(7-37)OH，Val8-Ala35-GLP-1(7-37)OH，Gly8-Ala35-GLP-1(7-37)OH，Lys35-GLP-1(7-37)OH，Val8-Lys35-GLP-1(7-37)OH，Gly8-Lys35-GLP-1(7-37)OH，His35-GLP-1(7-37)OH Val8-His35-GLP-1(7-37)OH，Gly8-His35-GLP-1(7-37)OH，Pro35-GLP-1(7-37)OH，Val8-Pro35-GLP-1(7-37)OH，Gly8-Pro35-GLP-1(7-37)OH，Glu35-GLP-1(7-37)OH Val8-Glu35-GLP-1(7-37)OH，Gly8-Glu35-GLP-1(7-37)OH，Val8-Ala27-GLP-1(7-37)OH，Val8-His37-GLP-1(7-37)OH，Val8-Glu22-Lys23-GLP-1(7-37)OH，Val8-Glu22-Glu23-GLP-1(7-37)OH，Val8-Glu22-Ala27-GLP-1(7-37)OH，Val8-Gly34-Lys35-GLP-1(7-37)OH，Val8-His37-GLP-1(7-37)OH，Gly8-His37-GLP-1(7-37)OH，Val8-Glu22-Ala27-GLP-1(7-37)OH，Gly8-Glu22-Ala27-GLP-1(7-37)OH，Val8-Lys22-Glu23-GLP-1(7-37)OH，和Gly8-Lys22-Glu23-GLP-1(7-37)OH.
用于本发明的另一组优选GLP-1类似物和衍生物由式VI(SEQ IDNO7)的分子组成R1-X-Glu-Gly10-Thr-Phe-Thr-Ser-Asp15-Val-Ser-Ser-Tyr-Leu20-Y-Gly-Gln-Ala-Ala25-Lys-z-Phe-IIe-Ala30-Trp-Leu-Val-Lys-Gly35-Arg-R2式 VI(SEQ ID NO7)其中R1选自L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸，和α-甲基-组氨酸；X选自Ala，Gly，Val，Thr，Ile和α-甲基-Ala；Y选自Glu，Gln，Ala，Thr，Ser和Gly；Z选自Glu，Gln，Ala，Thr，Ser和Gly，并且R2是Gly-OH。
用于本发明的另一组优选的GLP-1化合物公开于WO 91/11457，并且基本由以下化合物组成GLP-1(7-34)，GLP-1(7-35)，GLP-1(7-36)，或GLP-1(7-37)，或其酰胺形式，及其可药用盐，它们具有选自下组的至少一种修饰(a)用甘氨酸，丝氨酸，半胱氨酸，苏氨酸，天冬酰胺，谷氨酰胺，酪氨酸，丙氨酸，缬氨酸，异亮氨酸，亮氨酸，甲硫氨酸，苯丙氨酸，精氨酸，或D-赖氨酸取代第26位和/或34位的赖氨酸；或用甘氨酸，丝氨酸，半胱氨酸，苏氨酸，天冬酰胺，谷氨酰胺，酪氨酸，丙氨酸，缬氨酸，异亮氨酸，亮氨酸，甲硫氨酸，苯丙氨酸，赖氨酸，或D-精氨酸取代第36位的精氨酸。
(b)用抗氧化氨基酸取代第31位的色氨酸；(c)以下取代的至少一种用酪氨酸取代第16位的缬氨酸；用赖氨酸取代第18位的丝氨酸；用天冬氨酸取代第21位的谷氨酸；用丝氨酸取代第22位的甘氨酸；用精氨酸取代第23位的谷氨酰胺；用精氨酸取代第24位的丙氨酸；并且用谷氨酰胺取代第26位的赖氨酸，和(d)以下取代的至少-种用甘氨酸，丝氨酸，或半胱氨酸取代第8位的丙氨酸；用天冬氨酸，甘氨酸，丝氨酸，半胱氨酸，苏氨酸，天冬酰胺，谷氨酰胺，酪氨酸，丙氨酸，缬氨酸，异亮氨酸，亮氨酸，甲硫氨酸，或苯丙氨酸取代第9位的谷氨酸；用丝氨酸，半胱氨酸，苏氨酸，天冬酰胺，谷氨酰胺，酪氨酸，丙氨酸，缬氨酸，异亮氨酸，亮氨酸，甲硫氨酸，或苯丙氨酸取代第10位的甘氨酸；用谷氨酸取代第15位的天冬氨酸；以及(e)用甘氨酸，丝氨酸，半胱氨酸，苏氨酸，天冬酰胺，谷氨酰胺，酪氨酸，丙氨酸，缬氨酸，异亮氨酸，亮氨酸，甲硫氨酸，或苯丙氨酸，或组氨酸的D形式或N-酰化或烷基化形式取代第7位的组氨酸；其中，当取代为(a)，(b)，(d)，和(e)时，被取代的氨基酸可以任选为D形式，并且在第7位被取代的氨基酸可以任选为N-酰化或N-烷基化形式。
由于二肽基-肽酶IV(DPP IV)可以负责观察到的所给予的GLP-1的迅速体内灭活[见，例如，Mentlein，R.，et al.，Eur.J.Biochem.，214829-835(1993)]，在融合蛋白范围内防止了DPP IV活性的GLP-1类似物和衍生物是优选的，其中的GLP-1化合物是Gly8-GLP-1(7-37)OH，Val8-GLP-1(7-37)OH，α-甲基-Ala8-GLP-1(7-37)OH，或Gly8-Gln21-GLP-1(7-37)OH的融合蛋白更优选。
用于本发明的另一组优选GLP-1化合物由美国专利5,512,549所要求保护的式VII(SEQ ID NO8)化合物组成，在此引入该文献作为参考。
R1-Ala-Glu-Gly10-Thr-Phe-Thr-Ser-Asp15-Val-Ser-Ser-Tyr-Leu20-Glu-Gly-Gln-Ala-Ala25-Xaa-Glu-phe-Ile-Ala30- 式VII (SEQ ID NO8)其中R1选自4-咪唑丙基，4-咪唑乙基，或4-咪唑-α，α二甲基-乙基，R2选自C6-C10未分支的酰基，或不存在；R3选自Gly-OH或NH2；并且Xaa是Lys或Arg。
用于本发明的更优选的式IV化合物的Xaa是Arg，并且R2是C6-C10未分支的酰基。用于本发明的甚至更优选的式IV化合物的Xaa是Arg，R2是C6-C10未分支的酰基，并且R3是Gly-OH。用于本发明的高度优选的式IV化合物的Xaa是Arg，R2是C6-C10未分支的酰基，R3是Gly-OH，并且R1是4-咪唑丙基。用于本发明的尤其优选的式IV化合物的Xaa是Arg，R2是C8未分支的酰基，R3是Gly-OH，并且R1是4-咪唑丙基。
优选的GLP-1化合物包括GLP-1类似物，其中这些类似物或片段的主链在第8位含有除丙氨酸外的其他氨基酸(8位类似物)。主链的第7位也可包括L-组氨酸、D-组氨酸或修饰形式的组氨酸如脱氨基组氨酸、2-氨基-组氨酸、β-羟基-组氨酸、高组氨酸、α-氟甲基-组氨酸或α-甲基组氨酸。与天然GLP-1(7-37)OH中的相应氨基酸相比，这些第8位类似物优选含有在12、16、18、19、20、22、25、27、30、33和37位上进行的一个或多个额外改变。与天然GLP-1(7-37)OH中的相应氨基酸相比，这些第8位类似物更优选含有在16、18、22、25和33位上进行的一个或多个额外改变。
在一个优选的实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第12位的氨基酸选自色氨酸或酪氨酸。更优选地，除了第12位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第12位和第8位的取代，第22位的氨基酸被谷氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第16位的氨基酸被色氨酸，异亮氨酸，亮氨酸，苯丙氨酸，或酪氨酸取代。更优选地，除了第16位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第12位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第16位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第16位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第18位的氨基酸选自色氨酸，酪氨酸，苯丙氨酸，赖氨酸，亮氨酸，或异亮氨酸，优选色氨酸，酪氨酸，和异亮氨酸。更优选地，除了第18位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第18位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第18位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第18位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第19位的氨基酸选自色氨酸或苯丙氨酸，优选色氨酸。更优选地，除了第19位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第19位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第19位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第19位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第20位的氨基酸选自苯丙氨酸，酪氨酸，或色氨酸。更优选地，除了第20位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第20位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第20位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第20位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第25位的氨基酸选自缬氨酸，异亮氨酸，和亮氨酸，优选缬氨酸。更优选地，除了第25位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第25位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第25位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第25位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第27位的氨基酸选自异亮氨酸或丙氨酸。更优选地，除了第26位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第27位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第27位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第27位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
在另一种优选实施方案中，GLP-1类似物是GLP-1(7-37)OH，其中第33位的氨基酸是异亮氨酸。更优选地，除了第33位的取代，第8位的氨基酸被甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸取代，更优选被缬氨酸或甘氨酸取代。甚至更优选地，除了第33位和第8位的取代，第22位的氨基酸被谷氨酸取代。除了第33位和第8位的取代，第30位的氨基酸也优选被谷氨酸取代。除了第33位和第8位的取代，第37位的氨基酸也优选被组氨酸取代。
GLP-1化合物在以下一个或多个位置具有修饰8、12、16、18、19、20、22、25、27、30、33、和37。这些GLP-1化合物与GLP-1(7-37)OH相比效力增加，并且包含式IX(SEQ ID NO12)的氨基酸序列Xaa7-Xaa8-Glu-Gly-Thr-Xaa12-Thr-Ser-Asp-Xaa16-Ser-Xaa18-Xaa19-Xaa20-Glu-Xaa22-Gln-Ala-Xaa25-Lys-Xaa27-Phe-Ile-Xaa30-Trp-Leu-Xaa33-Lys-Gly-Arg-Xaa37式 IX(SEQ ID NO12)其中Xaa7是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸，或α-甲基-组氨酸；Xaa8是Ala，Gly，Val，Leu，Ile，Ser，或Thr；Xaa12是Phe，Trp，或Tyr；Xaa16是Val，Trp，Ile，Leu，Phe，或Tyr；Xaa18是Ser，Trp，Tyr，Phe，Lys，Ile，Leu，Val；Xaa19是Tyr，Trp，或Phe；Xaa20是Leu，Phe，Tyr，或Trp；Xaa22是Gly，Glu，Asp，或Lys；Xaa25是Ala，Val，Ile，或Leu；Xaa27是Glu，Ile，或Ala；Xaa30是Ala或Glu；Xaa33是Va1，或Ile；并且Xaa37是Gly，His，NH2，或不存在。
一些优选的式IX的GLP-1化合物包括GLP-1(7-37)OH，GLP-1(7-36)-NH2，Gly8-GLP-1(7-37)OH，Gly8-GLP-1(7-36)NH2，Val8-GLP-1(7-37)OH，Val8-GLP-1(7-36)NH2，Leu8-GLP-1(7-37)OH，Leu8-GLP-1(7-36)NH2，Ile8-GLP-1(7-37)OH，Ile8-GLP-1(7-36)NH2，Ser8-GLP-1(7-37)OH，Ser8-GLP-1(7-36)NH2，Thr8-GLP-1(7-37)OH，Thr8-GLP-1(7-36)NH2，Val8-Tyr12-GLP-1(7-
37)OH，Val8-Tyr12-GLP-1(7-36)NH2，Val8-Tyr16-GLP-1(7-37)OH，Val8-Tyr16-GLP-1(7-36)NH2，Val8-Glu22-GLP-1(7-37)OH，Val8-Glu22-GLP-1(7-36)NH2，Gly8-Glu22-GLP-1(7-37)OH，Gly8-Glu22-GLP-1(7-36)NH2，Val8-Asp22-GLP-1(7-37)OH，Val8-Asp22-GLP-1(7-36)NH2，Gly8-Asp22-GLP-1(7-37)OH，Gly8-Asp22-GLP-1(7-36)NH2，Val8-Lys22-GLP-1(7-37)OH，Val8-Lys22-GLP-1(7-36)NH2，Gly8-Lys22-GLP-1(7-37)OH，Gly8-Lys22-GLP-1(7-36)NH2，Leu8-Glu22-GLP-1(7-37)OH，Leu8-Glu22-GLP-1(7-36)NH2，Ile8-Glu22-GLP-1(7-37)OH，Ile8-Glu22-GLP-1(7-36)NH2，Leu8-Asp22-GLP-1(7-37)OH，Leu8-Asp22-GLP-1(7-36)NH2，Ile8-Asp22-GLP-1(7-37)OH，Ile8-Asp22-GLP-1(7-36)NH2，Leu8-Lys22-GLP-1(7-37)OH，Leu8-Lys22-GLP-1(7-36)NH2，Ile8-Lys22-GLP-1(7-37)OH，Ile8-Lys22-GLP-1(7-36)NH2，Ser8-Glu22-GLP-1(7-37)OH，Ser8-Glu22-GLP-1(7-36)NH2，Thr8-Glu22-GLP-1(7-37)OH，Thr8-Glu22-GLP-1(7-36)NH2，Ser8-Asp22-GLP-1(7-37)OH，Ser8-Asp22-GLP-1(7-36)NH2，Thr8-Asp22-GLP-1(7-37)OH，Thr8-Asp22-GLP-1(7-36)NH2，Ser8-Lys22-GLP-1(7-37)OH，Ser8-Lys22-GLP-1(7-36)NH2，Thr8-Lys22-GLP-1(7-37)OH，Thr8-Lys22-GLP-1(7-36)NH2，Glu22-GLP-1(7-37)OH，Glu22-GLP-1(7-36)NH2，Asp22-GLP-1(7-37)OH，Asp22-GLP-1(7-36)NH2，Lys22-GLP-1(7-37)OH，Lys22-GLP-1(7-36)NH2，Val8-Ala27-GLP-1(7-37)OH，Val8-Glu22-Ala27-GLP-1(7-37)OH，Val8-Glu30-GLP-1(7-37)OH，Val8-Glu30-GLP-1(7-36)NH2，Gly8-Glu30-GLP-1(7-37)OH，Gly8-Glu30-GLP-1(7-36)NH2，Leu8-Glu30-GLP-1(7-37)OH，Leu8-Glu30-GLP-1(7-36)NH2，Ile8-Glu30-GLP-1(7-37)OH，Ile8-Glu30-GLP-1(7-36)NH2，Ser8-Glu30-GLP-1(7-37)OH，Ser8-Glu30-GLP-1(7-36)NH2，Thr8-Glu30-GLP-1(7-37)OH，Thr8-Glu30-GLP-1(7-36)NH2，Val8-His37-GLP-1(7-37)OH，Val8-His37-GLP-1(7-36)NH2，Gly8-His37-GLP-1(7-37)OH，Gly8-His37-GLP-1(7-36)NH2，Leu8-His37-GLP-1(7-37)OH，Leu8-His37-GLP-1(7-36)NH2，Ile8-His37-GLP-1(7-37)OH，Ile8-His37-GLP-1(7-36)NH2，Ser8-His37-GLP-1(7-37)OH，Ser8-His37-GLP-1(7-36)NH2，Thr8-His37-GLP-1(7-37)OH，Thr8-His37-GLP-1(7-36)NH2.
一些优选的式IX的GLP-1化合物具有多个取代，包括GLP-1(7-37)OH，其中第8位是缬氨酸或甘氨酸，第22位是谷氨酸，第16位是酪氨酸，亮氨酸或色氨酸，第18位是酪氨酸，色氨酸，或异亮氨酸，第25位是缬氨酸，并且第33位是异亮氨酸。其它优选的GLP-1化合物包括以下化合物Val8-Tyr16-GLP-1(7-37)OH，Val8-Tyr12-Glu22-GLP-1(7-37)OH，Val8-Tyr16-Phe19-GLP-1(7-37)OH，Val8-Tyr16-Glu22-GLP-1(7-37)OH，Val8-Trp16-Glu22-GLP-1(7-37)OH，Val8-Leu16-Glu22-GLP-1(7-37)OH，Val8-Ile16-Glu22-GLP-1(7-37)OH，Val8-Phe16-Glu22-GLP-1(7-37)OH，Val8-Trp18-Glu22-GLP-1(7-37)OH，Val8-Tyr18-Glu22-GLP-1(7-37)OH，Val8-Phe18-Glu22-GLP-1(7-37)OH，和Val8-Ile18-Glu22-GLP-1(7-37)OH.
本发明的GLP-1化合物也包括Exendin化合物。Exendin-3和Exendin-4是首先从Helodermatidae蜥蜴毒液中分离的生物活性肽，并且证明其结合GLP-1受体并且在哺乳动物体壁细胞中刺激cAMP-依赖性H+产生。Exendin-3和Exendin-4都是39个氨基酸的肽，大约53％同源于GLP-1。它们作为GLP-1活性的潜在激动剂。引人注意的是，称作Exendin(9-39个氨基酸)的Exendin的N端截短衍生物是Exendin-3，Exendin-4和GLP-1的抑制剂。
Exendin化合物通常包括具有Exendin-3，Exendin-4或其类似物或片段的氨基酸序列的多肽。Exendin-3和Exendin-4公开于美国专利5,424,286。
Exendin-3具有SEQ ID NO9的氨基酸序列
7 8 9 10 11 12 13 14 15 16 17His-Ser-Asp-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-18 19 20 21 22 23 24 25 26 27 28Lys-Gln-Met-Glu-Glu-Glu-Ala-Val-Arg-Leu-Phe-29 30 31 32 33 34 35 36 37 38 39Ile-Glu-Trp-Leu-Lys-Asn-Gly-Gly-Pro-Ser-Ser-40 41 42 43 44 45Gly-Ala-Pro-Pro-Pro-Ser(SEQ ID NO9)Exendin-3具有SEQ ID NO10的氨基酸序列7 8 9 10 11 12 13 14 15 16 17His-Gly-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-18 19 20 21 22 23 24 25 26 27 28Lys-Gln-Met-Glu-Glu-Glu-Ala-Val-Arg-Leu-Phe-29 30 31 32 33 34 35 36 37 38 39Ile-Glu-Trp-Leu-Lys-Asn-Gly-Gly-Pro-Ser-Ser-40 41 42 43 44 45Gly-Ala-Pro-Pro-Pro-Ser(SEQ ID NO10)GLP-1化合物也包括作为从Exendin或Exendin类似物的N末端和/或C末端截短一个或多个氨基酸而得到的多肽的Exendin片段。此外，GLP-1化合物包括将一个或多个氨基酸添加到Exendin或其片段的N末端和/或C末端得到的Exendin多肽。这种类型的Exendin化合物最多具有约45个氨基酸。
GLP-1化合物也称作“Exendin类似物”。Exendin类似物与Exendin-4，Exendin-3或其片段具有足够同源性，使得该类似物具有促胰岛素活性。可以用例如EP 619,322和美国专利5,120,712中描述的体外测定方法评估Exendin片段和/或类似物的活性。
Exendin类似物优选具有修饰的Exendin-4或其片段的氨基酸序列，使得1、2、3、4或5个氨基酸不同于Exendin-4或Exendin-4片段中相应位置的氨基酸。在此处使用的命名系统中，取代氨基酸及其位置表示于母体结构前。例如Val8-Exendin-4表示通常存在于Exendin-4第8位的甘氨酸被缬氨酸缬氨酸取代的Exendin化合物。
另一组优选的GLP-1化合物由式VIII(SEQ ID NO11)的GLP-1/Exendin-4类似物组成。
7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Glu-Xaa-Xaa-Ala-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Xaa-Xaa-Gly-Xaa-R式 VIII(SEQ ID NO11)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，或Val；第16位的Xaa是Leu或Val；第18位的Xaa是Lys或Ser；第19位的Xaa是Gln或Tyr；第20位的Xaa是Met或Leu；第22位的Xaa是Glu或Gln；第23位的Xaa是Glu，或Gln；第25位的Xaa是Val或Ala；第26位的Xaa是Arg或Lys；第27位的Xaa是Leu或Glu；第30位的Xaa是Glu或Ala；第33位的Xaa是Val或Lys；第34位的Xaa是Asn或Lys；第36位的Xaa是Gly或Arg；并且第37位的R是Gly，Pro，Pro-Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser，或不存在。该类中的18种不同的化合物见表6。
其它用于本发明的Exendin类似物描述于PCT专利申请WO99/25728(Beeleyetal.)，WO 99/25727 Beeley et al.)，WO 98/05351(Young et al.)，WO 99/40788(Young et al.)，WO 99/07404(Beeleyet al)，和WO 99/43708(Knudsen et al)。
本发明的GLP-1融合蛋白可以包含糖基化位点。糖基化是一种化学修饰，其中将糖部分添加到蛋白的特定位点。蛋白的糖基化在保证成熟蛋白的正确电荷、构象和稳定性以及将蛋白导向于细胞表面和蛋白的最终分泌中起作用。最重要的是，糖基化影响了许多蛋白的体内清除速度。糖可以是O-连接的或N-连接的。一般地，O-连接的糖添加到丝氨酸和苏氨酸的羟基氧，而N-连接的糖添加到天冬酰胺的酰胺氮。N糖基化的共有位点是Asn X1 X2其中X1是除Pro外的任何氨基酸，X2是Ser或Thr。
GLP-1化合物在体内一般是不糖基化的；然而，令人感兴趣的是，包含具有与Fc序列融合的C末端延伸片段的本发明的GLP-1化合物在C末端延伸片段的最后一个丝氨酸被糖基化(SSGAPPPS*)，并且在Fc的N末端区的第11位的苏氨酸被糖基化(AEPKSCDKTHT*CPPC...)。
异源Fc融合蛋白此处描述的GLP-1化合物可以直接或通过肽接头与免疫球蛋白的Fc部分融合。
免疫球蛋白是含有由二硫键连接在一起的多肽链的分子，一般具有两条轻链和两条重链。在每条链中，一个结构域(V)具有依赖于分子的抗体特异性的可变氨基酸序列。另一结构域(C)具有同一类分子所共有的恒定序列。
此处用到的免疫球蛋白的Fc部分具有免疫学领域术语的常用含义。具体地，该术语是指通过从抗体去除两个抗原结合区(Fab片段)而得到的抗体片段。去除Fab片段的一种方法是用木瓜蛋白酶消化免疫球蛋白。因此，Fc部分是由两条重链的恒定区的几乎相等大小的片段形成的，这两条链是通过非共价相互作用和二硫键而缔合。Fc部分可以包括铰链区并且延伸通过CH2和CH3结构域到达抗体C末端。人和小鼠免疫球蛋白的代表性铰链区可以见Antibody Engineering，APractical Guide，Borrebaeck，C.A.K.，ed.，W.H.Freeman andCo.，1992，在此引入其教导作为参考。Fc部分可以进一步包括一个或多个糖基化位点。包含铰链区、CH2和CH3结构域，以及第82位的一个N-糖基化位点的代表性Fc部分的氨基酸序列表示于图1。
有5种具有不同作用和药代动力学特征的人免疫球蛋白Fc区IgG，IgA，IgM，IgD，和IgE。IgG是血清中含量最高的免疫球蛋白。IgG在所有免疫球蛋白中也是血清半衰期最长的(23天)。与其它免疫球蛋白不同，IgG在与Fc受体结合后有效再循环。有四种IgG亚类G1，G2，G3，和G4，每一种都有不同的作用或功能。G1，G2和G3可以结合C1q并且固定补体，而G4则不能。尽管G3能够比G1更有效地结合C1q，G1在介导补体导致的细胞裂解中最有效。IgG中的C1q结合位点位于CH2结构域的羧基末端区。
所有的IgG亚类都能够结合Fc受体(CD16，CD32，CD64)，G1和G3比G2和G4更有效。IgG的Fc受体结合区由位于CH2结构域的铰链区和羧基末端区的残基形成。
IgA可以以单体和由J链连接的二聚体形式存在。IgA是血清中其次多的Ig，但其半衰期只有6天。IgA具有三种作用或功能。它结合巨噬细胞和嗜酸性细胞上的IgA特异性受体，分别驱动吞噬和脱颗粒。它也可通过未知的其它途径固定补体。
IgM作为5聚体或6聚体表达，这两者都由J链连接。IgM的血清半衰期为5天。它通过位于其CH3结构域上的结合位点与C1q微弱结合。IgD的血清半衰期为3天。还不清楚这种Ig的作用或功能。IgG是单体Ig，血清半衰期为2.5天。IgE与两个Fc受体结合，驱动脱颗粒并导致促炎剂的释放。
根据需要的体内作用，本发明的异源融合蛋白可以任何上述同种型或可以含有突变的Fc区，其中补体和/或Fc受体结合功能改变。这样，本发明的异源融合蛋白可以含有与GLP-1化合物融合的免疫球蛋白的完整Fc部分、免疫球蛋白Fc部分的片段或其类似物。
本发明的融合蛋白可以由单链蛋白组成或作为多链多肽。可以产生两个或多个Fc融合蛋白，使得它们通过在Fc区之间天然形成的二硫键而相互作用。这些多聚体对于GLP-1化合物来说可以是同源的，或者它们可以含有不同的GLP-1化合物，所述化合物融合在融合蛋白的Fc部分N末端。
不论融合蛋白的最终结构如何，Fc或Fc样区域必须延长在N末端融合的GLP-1化合物的体内血浆半衰期。此外，融合的GLP-1化合物必须保持一定的生物学活性。可以用实施例7描述的方法证明半衰期的增加，其中比较了融合蛋白和单独的GLP-1化合物的半衰期。可以通过本领域公知的体外和体内方法确定生物学活性。代表性的生物测定描述于实施例6、8和9。
由于通过蛋白水解产生的IgG的Fc区与完整的IgG分子具有相同的体内半衰期，并且Fab片段迅速降解，人们认为延迟半衰期的相关序列存在于CH2和/或CH3结构域。此外，文献中证明，不结合高亲和性Fc受体或C1q的IgG变体的分解代谢速度与母体野生型抗体的清除速度相似，表明分解代谢位点不同于参与Fc受体或C1q结合的位点。[Wawrzynczak et al.，(1992)Molecular Immunology 29221]。采用鼠IgG1 Fc区进行的定点诱变表明，控制分解代谢速度的IgG1 Fc区的位点位于CH2-CH3结构域的界面。
基于这些研究，可以在分解代谢位点修饰Fc区，以便优化融合蛋白的半衰期。用于本发明的异源融合蛋白的Fc区优选来源于IgG1或IgG4的Fc区。Fc区甚至更优选是IgG4或来源于IgG4。IgG Fc区优选含有CH2和CH3区，包括铰链区。
异源白蛋白融合蛋白上述GLP-1化合物可以直接或通过肽接头与白蛋白或其类似物、片段或衍生物融合。
构成本发明的融合蛋白的一部分的白蛋白一般可以来源于从任何物种克隆的白蛋白。然而，人白蛋白及其片段和类似物优选减少融合蛋白在人体内产生免疫原性的危险。人血清白蛋白(HSA)由单个未糖基化的585个氨基酸的多肽链组成，式分子量为66,500。人HSA的氨基酸序列见图2。[见Meloun，et al.(1975)FEBS Letters 58136；Behrens，et al.(1975)Fed.Proc.34591；Lawn，et al.(1981)Nucleic Acids Research 96102-6114；Minghetti，et al.(1986)J.Biol.Chem.2616747]。已经描述了白蛋白的多种多形性变体以及类似物和片段。[见Weitkamp，et al.，(1973)Ann.Hum.Genet.37219]。例如，在EP 322,094中，发明人公开了HSA的各种较短形式。这些片段中的一些包括HSA(1-373)，HSA(1-388)，HSA(1-389)，HSA(1-369)，和HSA(1-419)以及1-369和1-419之间的片段。EP 399,666公开了包括HSA(1-177)和HSA(1-200)的片段以及HSA(1-177)和HSA(1-200)之间的片段。
可以理解，本发明的异源融合蛋白包含与任何白蛋白，包括其片段、类似物和衍生物偶联的GLP-1化合物，其中该融合蛋白具有生物学活性并且比单独的GLP-1化合物具有更长的血浆半衰期。因此，融合蛋白的白蛋白部分不必须具有等于天然人白蛋白的血浆半衰期。半衰期比天然人白蛋白和感兴趣的GLP-1化合物长，或半衰期介于两者之间的片段、类似物和衍生物是公知的，或可以产生。
本发明的异源融合蛋白包括在融合蛋白的GLP-1化合物和/或白蛋白部分中具有保守氨基酸取代的蛋白。“保守取代”是指利用另一个与被取代氨基酸具有相同净电荷和具有大约相同大小和形状的氨基酸来取代此氨基酸。当它们侧链上的碳原子和杂原子总数相差不超过4个时，具有脂肪族或取代的脂肪族氨基酸侧链的氨基酸大致上是大小相同的。当它们侧链上的分支数目相差不超过1个时，它们大致具有相同的形状。侧链上具有苯基或取代苯基的氨基酸可认为是大小和形状大约相同的。除非特别指明，保守取代优选通过天然氨基酸来进行。
然而，此处的“氨基酸”是在其最广泛的含义中使用的，包括天然存在的氨基酸和非天然存在的氨基酸，包括氨基酸类似物和衍生物。后者包括含氨基酸部分的分子。本领域技术人员将意识到，根据该广义的定义，此处的氨基酸包括，例如天然存在的形成蛋白的L-氨基酸；D-氨基酸；化学修饰的氨基酸，例如氨基酸类似物和衍生物；天然存在的氨基酸不形成蛋白的氨基酸，例如正亮氨酸、β-丙氨酸、鸟氨酸、GABA等；以及具有本领域公知的氨基酸特征的化学合成的化合物。此处用到的术语“形成蛋白的”表示氨基酸可以通过代谢途径掺入细胞中的肽、多肽或蛋白。
非天然氨基酸，包括合成的非天然氨基酸、取代的氨基酸或一个或多个D-氨基酸插入本发明的异源融合蛋白可以通过许多途径带来益处。含有D-氨基酸的肽等与含有L-氨基酸的对应物相比，表现出体外或体内稳定性增加。因此，当需要或要求更大的细胞内稳定性时，肽的构建，例如掺入D-氨基酸是特别有用的。更具体地，D-肽等抗内源性肽酶和蛋白酶活性，从而在需要时改进分子的生物利用度和延长体内寿命。此外，D-肽等不能进行有效加工以用于向T辅助细胞进行II类主要组织相容性复合物限制的呈递，因此，不容易在整个生物体内诱导体液免疫应答。
本发明除了包括各种多肽的结构/功能分析，选择用于取代的氨基酸还可以考虑许多因素，进行这种改变的一个可以考虑的因素时氨基酸的亲水指数。亲水性氨基酸指数在赋予蛋白上相互作用的生物功能方面的重要性由Kyte和Doolittle进行了讨论(1982，J.Mol.Biol.，157105-132)。已知氨基酸的相对亲水特征是由于得到的蛋白的二级结构。这随后影响了蛋白与酶、底物、受体、配体、DNA、抗体、抗原等分子的相互作用。根据其疏水性和电荷特征，赋予每个氨基酸以下亲水指数异亮氨酸(+4.5)；缬氨酸(+4.2)；亮氨酸(+3.8)；苯丙氨酸(+2.8)；半胱氨酸/胱氨酸(+2.5)；甲硫氨酸(+1.9)；丙氨酸(+1.8)；甘氨酸(-0.4)；苏氨酸(-0.7)；丝氨酸(-0.8)；色氨酸(-0.9)；酪氨酸(-1.3)；脯氨酸(-1.6)；组氨酸(-3.2)；谷氨酸/谷氨酰胺/天冬氨酸/天冬酰胺(-3.5)；赖氨酸(-3.9)；和精氨酸(-4.5)。
如本领域所公知，可以用具有相似亲水指数或评分的其它氨基酸取代肽、多肽或蛋白中的某些氨基酸，以产生例如具有相似或甚至改进的生物活性的肽。在进行这种改变时，优选用具有±2以内的亲水指数的氨基酸互相取代。更优选的取代是其中的氨基酸具有±1以内的亲水指数。最优选的取代是其中的氨基酸具有±0.5以内的亲水指数。
氨基酸也可以根据亲水性进行取代。美国专利4,554,101公开了蛋白的最大局部平均亲水性，这是由其邻近的氨基酸的亲水性决定的，并且与蛋白的生物特征相关。赋予氨基酸以下亲水性值精氨酸/赖氨酸(+3.0)；天冬氨酸/谷氨酸(+3.01)；丝氨酸(+0.3)；天冬酰胺/谷氨酰胺(+0.2)；甘氨酸(0)；苏氨酸(-0.4)；脯氨酸(-0.51)；丙氨酸/组氨酸(-0.5)；半胱氨酸(-1.0)；甲硫氨酸(-1.3)；缬氨酸(-1.5)；亮氨酸/异亮氨酸(-1.8)；酪氨酸(-2.3)；苯丙氨酸(-2.5)；和色氨酸(-3.4)。因此，可以用具有相似亲水性评分的其它氨基酸取代肽、多肽或蛋白中的氨基酸，以产生例如具有相似的生物活性，即仍然保持正确的生物功能的肽。在进行这种改变时，优选用具有±2以内的亲水指数的氨基酸互相取代。更优选±1以内，最优选±0.5以内。
如前面所概括，本发明的融合蛋白中的氨基酸取代可以基于氨基酸侧链取代基的相对相似性，例如，它们的疏水性、亲水性、电荷、大小等。此外，可以基于二级机构特征进行取代。例如，可以用保持螺旋结构的氨基酸取代螺旋状氨基酸。例如，考虑前面的特征以产生在肽中导致沉默改变的保守氨基酸改变的示例性的取代可以选自该天然存在的氨基酸所属类中的其它成员。氨基酸可以分成以下四组(1)酸性氨基酸；(2)碱性氨基酸；(3)中性极性氨基酸；和(4)中性非极性氨基酸。
制备本发明的异源融合蛋白的一般方法尽管可以用各种不同的方法制备本发明的异源融合蛋白，重组方法是优选的。对于此处公开和要求保护的本发明，如下定义了以下通用的分子生物学术语和缩写。除非特别指定，本文中使用的术语和缩写具有其通常的含义。例如，“℃”表示摄氏度；＂mmol＂表示毫摩尔；＂mg＂表示毫克；＂μg＂表示微克；＂ml或mL＂表示毫升；＂μl或μL＂表示微升。氨基酸缩写阐述于37 C.F.R.ζ1.822(b)(2)(1994)。
此处用到的“碱基对”或＂bp＂是指DNA或RNA。当存在于DNA分子中时，缩写A，C，G和T分别对应于脱氧核糖核苷(脱氧)腺苷、(脱氧)胞苷、(脱氧)鸟苷和胸苷的5′-单磷酸酯形式。当存在于RNA分子中时，缩写U，C，G，和A分别对应于核糖核苷尿苷、胞苷、鸟苷和腺苷的5′-单磷酸酯形式。在双链DNA中，碱基对可以指A与T或C与G的配对关系。在DNA/RNA中，异双链体碱基对可以指A与U或C与G的配对关系。(见下文中“互补”的定义)。
DNA的“消化”或“限制”是指用仅仅作用于DNA中的某些序列的限制酶(“序列特异性内切核酸酶”)对DNA进行催化性裂解。此处用到的各种限制酶是可买到的，并且按照本领域技术人员所公知的内容使用它们的反应条件、辅因子和其它要求。用于特定限制酶的适当缓冲液和底物量是由生产商规定的，或可以很容易在文献中找到。
“连接”是指在两个双链核酸片段之间形成磷酸二酯键的过程。除非特别指出，可以用DNA裂解酶，如T4 DNA裂解酶，采用已知的缓冲液和条件完成连接。
“质粒”是指染色体外(通常)自我复制的遗传元件。质粒一般由小写字母“p”和其后的字母和/或数字表示。此处的起始质粒是购买的、可以有限地公共获得的，或者可根据公开的程序用可得到的质粒构建。此外，与描述的质粒等同的质粒是公知的，对本领域技术人员是显而易见的。
此处用到的“重组DNA克隆载体”是指任何自主复制的因子，包括但不限于质粒和噬菌体，包含可以或已经添加的一个或多个额外的DNA片段的DNA分子。
此处用到的“重组DNA表达载体”是指任何DNA克隆载体，其中掺入了控制插入的DNA转录的启动子。
“转录”是指一种使DNA的核苷酸序列中含有的信息转移到互补的RNA序列的过程。
“转染”是指用宿主细胞摄取表达载体，而不论实际上是否表达任何编码序列。许多转染方法是本领域技术人员公知的，例如，磷酸钙共沉淀、脂质体转染和电穿孔。成功的转染一般是当指示该载体的操作在宿主细胞发生时被识别。
“转化”是指将DNA导入生物体，使得DNA可以作为染色体外元件或通过染色体整合而复制。转化细菌和真核宿主的方法是本领域公知的，例如核注射、原生质体融合或用氯化钙进行钙处理，这些方法概括于J.Sambrook，et al.，Molecular CloningA LaboratoryManual，(1989)。一般地，当将DNA导入酵母时，术语转化与术语转染的含义相反。
此处用到的“翻译”是指用信使RNA(mRNA)的遗传信息指定和指导多肽链合成的过程。
“载体”是指用于基因操作中的细胞转染和/或转化的核酸复合物，其携带对应于适当的蛋白分子的多核苷酸序列，该序列适当的控制序列结合时，则赋予被转染和/或转化的宿主细胞特定的属性。质粒、病毒和噬菌体是适当的载体。通过使用限制酶和连接酶从不同来源切割和连接DNA分子而构建人工载体。此处用到的术语“载体”包括重组DNA克隆载体和重组DNA表达载体。
此处用到的“互补的”或“互补”是指在双链核酸中通过氢键缔合的碱基对(嘌呤和嘧啶)。以下碱基对是互补的鸟嘌呤和胞嘧啶；腺嘌呤和胸腺嘧啶；以及腺嘌呤和尿嘧啶。
这里用到的“杂交”是指一条核酸链通过碱基配对与互补链连接。两条不相同但非常相似的互补核酸的杂交所使用的条件根据两条链的互补程度和链长而改变。这种技术和条件是本领域技术人员公知的。
“分离的氨基酸序列”是指任意的位置上不同于天然存在的氨基酸的构建的或合成的氨基酸序列。
“分离的DNA复合物”是指任意的位置上不同于其在基因组中的天然位置的构建的或合成的DNA序列。
“分离的核酸复合物”是指任意的位置上不同于其天然位置的构建的或合成的RNA或DNA序列。
“引物”是指作为用于酶促或合成延伸的起始底物的核酸片段。
“启动子”是指直到从DNA转录为RNA的DNA序列。
“探针”是指与另一种核酸复合物杂交的核酸复合物或其片段。
杂交反应的“严格性”可以由本领域技术人员容易地判断，并且一般是根据探针长度、洗涤温度和盐浓度而进行的经验计算值。一般地，较长的探针需要较高的温度进行适当退火，而短探针需要较低的温度。杂交一般取决于互补链存在于低于其解链温度的环境中时变性的DNA重新退火的能力。探针和可杂交序列间需要的同源性程度越高，可以使用的相对温度越高。因此，越高的相对温度将使反应更严格，而较低的温度使严格性更低。对于杂交反应严格性的其它细节和解释，参见Ausubel et al.，Current Protocols in Molecular Biology，Wiley Intersciernce Publishers，1995。
此处定义的“严格条件”或“高严格性条件”可以通过以下条件鉴定(1)使用低离子强度和高温进行洗涤，例如15mM氯化钠/1.5mM柠檬酸钠/0.1％十二烷基硫酸钠，50℃；(2)在杂交中使用变性剂，例如甲酰胺，例如50％(v/v)甲酰胺，0.1％牛血清白蛋白/0.1％ficol1/01％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液，pH6.5，750mM氯化钠/75mM柠檬酸钠，42℃；或(3)使用50％甲酰胺，5×SSC(750mM氯化钠，75mM柠檬酸钠)，50mM磷酸钠(pH 6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声波处理的鲑鱼精子DNA(50μg/ml)，0.1％SDS，和10％硫酸右旋糖苷，42℃，在42℃，0.2×SSC(30mM氯化钠/3mM柠檬酸钠)，和55℃，50％甲酰胺中洗涤，然后在55℃用含EDTA的0.1×SSC进行高严格性洗涤。
“中等严格条件”可以通过ambrook et al.[Molecular CloningA Laboratory Manual，New YorkCold Spring Harbor Press，(1989)]中的描述进行鉴定，并且包括使用比上述严格性低的洗涤溶液和杂交条件(例如温度、离子强度和％SDS)。中等严格条件的一个例子是在37℃，在含有20％甲酰胺、5×SSC(750mM氯化钠，75mM柠檬酸钠)，50mM pH7.6的磷酸钠，5×Denhardt′s溶液，10％硫酸右旋糖苷和20mg/mL变性的剪切的鲑鱼精子DNA的溶液中孵育过夜，然后在37-50℃，在1×SSC中洗涤滤器。本领域技术人员将理解如何调节温度、离子强度等，以及必要时调节探针长度等因子。
＂PCR＂是指公知的使用热稳定性DNA聚合酶的聚合酶链式反应。
“前导序列”是指可以酶促或化学去除以产生需要的感兴趣多肽的氨基酸序列。
“分泌信号序列”是指一般存在于较大的多肽N末端区的氨基酸序列，其功能是起始该多肽与内质网等细胞膜腔室的缔合和该多肽通过浆膜的分泌。
构建编码本发明的异源融合蛋白的DNA可以从各种来源获得野生型白蛋白和免疫球蛋白。例如，这些蛋白可以从由以可检测水平表达感兴趣的mRNA的组织或细胞制备的cDNA文库获得。可以用特定的感兴趣蛋白的公开DNA或蛋白序列设计探针，对文库进行筛选。例如，免疫球蛋白轻链或重链恒定区描述于Adams，et al.(1980)Biochemistry 192711-2719；Goughet，et al.(1980)Biochemistry 192702-2710；Dolby，et al.(1980)Proc.Natl.Acad.Sci.USA 776027-6031；Rice et al.(1982)Proc.Natl.Acad.Sci.USA 797862-7862；Falkner，et al.(1982)Nature 298286-288；和Morrison，et al.(1984)Ann.Rev.Immunol.2239-256。一些参考文献公开了白蛋白的蛋白和DNA序列，包括Meloun，et al.(1975)FEBS Letters 58136；Behrens，et al.(1975)Fed.Proc.34591；Lawn，et al.(1981)Nucleic Acids Research96102-6114；和Minghetti，et al.(1986)J.Biol.Chem.2616747。
可以采用标准程序，用选择的探针筛选cDNA或基因组文库，例如描述于Sambrook et al.，Molecular CloningA LaboratoryManual，Cold Spring Harbor Laboratory Press，NY(1989)中的程序。分离编码白蛋白或免疫球蛋白的基因的另一种方法是采用PCR方法[Sambrook et al.，supra；Dieffenbach et al.，PCR PrimerALaboratory Manual，Cold Spring Harbor Laboratory Press，NY(1995)]。可以根据公开的序列设计PCR引物。
从特定物种克隆的全长野生型序列一般可以作为模板，用于产生保留赋予作为融合蛋白的一部分的GLP-1化合物更长的血浆半衰期的能力的类似物、片段和衍生物。本发明的异源融合蛋白的Fc和白蛋白部分优选来源于天然人序列，以减少融合蛋白在人体内潜在的免疫原性危险。
具体地，本发明包括的融合蛋白的免疫球蛋白部分优选仅包含免疫球蛋白的Fc片段。根据融合蛋白的所需特定作用或功能以及结构特征，Fc片段可以含有铰链区以及CH2和CH3结构域或一些其它组合。可以使用设计为与相应于片段的所需末端的序列杂交的引物，采用PCR技术产生这些Fc片段。
可以通过各种不同的方法，包括上述克隆方法和化学合成DNA的方法制备编码本发明的GLP-1化合物的DNA。如果所编码的肽较短，则化学合成更好。GLP-1的氨基酸序列和前胰高血糖素原基因已经公开[Lopez，et al.(1983)Proc.Natl.Acad.Sci.，USA 805485-5489；Bell，et al.(1983)Nature，302716-718；Heinrich，G.，et al.(1984)Endocrinol，1152176-2181；Ghiglione，M.，et al.(1984)Diabetologia 27599-600]。因此，可以设计引物以便对天然GLP-1化合物及其片段进行PCR。
然后可以通过框内连接编码GLP-1化合物的DNA与编码白蛋白或Fc部分的DNA而构建编码融合蛋白的基因。也可以通过编码接头肽的基因框内连接编码GLP-1化合物的基因与编码白蛋白或Fc部分的基因。
可以通过添加小肽接头以防止潜在的不希望的结构域相互作用而对本发明的异源融合蛋白的体内功能和稳定性进行优化。尽管这些接头可以是任意长度并且由任意氨基酸组合组成，其长度优选不超过防止不希望的结构域相互作用和/或优化生物功能和/或稳定性所必须的长度。一般地，接头不应该含有具有极大侧链的氨基酸或容易诱导显著的二级结构的氨基酸。接头优选富含丝氨酸-甘氨酸，并且其长度优选不超过30个氨基酸。接头的长度更优选不超过20个氨基酸。接头的长度甚至更优选不超过15个氨基酸。优选的接头含有序列Gly-Gly-Gly-Gly-Ser的重复。优选有2-6个该序列的重复。甚至更优选有3-4个该序列的重复。
编码野生型GLP-1、白蛋白及其Fc多肽和片段的DNA可以在连接之前或在编码整个融合蛋白的cDNA的范围内进行突变。多种诱变技术是本领域公知的。例如，利用链重叠延伸以制备用于改变相应蛋白中的特定氨基酸序列的特定碱基突变的诱变PCR方法。该PCR诱变要求使用四种引物，两个前向(引物A和C)和两个反向(引物B和D)。在两个不同阶段中从野生型模板扩增突变的基因。第一个反应通过进行A到B反应和独立的C到D反应将基因分成两半进行扩增，其中B和C引物定向于待突变的基因区域。当将这些引物与靶区域比对时，它们含有被定向进行改变的碱基的错配。一旦完成了A到B和C到D反应，分离反应产物并且进行混合，用作A到D反应的模板。该反应然后产生完整的突变产物。
一旦产生了编码完整融合蛋白的基因，它可以被克隆到适当的表达载体。可以用于制备本发明的GLP-1融合蛋白的特定策略描述于实施例1。
用于重组表达本发明的异源融合蛋白的一般方法用此处描述的表达或克隆载体转染或转化宿主细胞，用于产生异源融合蛋白，并且在适于诱导启动子的改良的常规营养培养基中培养，选择转化体或扩增编码所需序列的基因。本领域技术人员不需要过多实验就可以选择培养条件，如培养基、温度、pH等。概言之，用于增加细胞培养物产生的原则、方案和实用技术可以参见MammalianCell BiotechnologyA Practical Approach，M.Butler，ed.(IRLPress，1991)和Sambrook，et al.，supra。转染方法是本领域技术人员公知的，例如CaPO4和电穿孔。宿主系统转化的一般方面描述于美国专利4,399,216。一般根据van Solingen et al.，J Bact.130(2)94 6-7(1977)和Hsiao et al.，Proc.Natl.Acad.Sci.USA 76(8)3829-33(1979)的方法转化至酵母。然而，也可以使用其它用于将DNA导入细胞的方法，例如核微量注射、电穿孔、与完整细胞进行细菌原生质体融合或多阳离子，如polybrene或polyomithine。对于转化哺乳动物细胞的各种技术，参见Keown，et al.，Methods in Enzymology185527-37(1990)和Mansour，et al.，Nature 336(6197)348-52(1988)。
用于在此处的载体中克隆或表达核酸(如DNA)的适当宿主细胞包括原核细胞、酵母或高等真核细胞。适当的原核细胞包括，但不限于真细菌，如革兰氏阴性或革兰氏阳性生物，例如肠细菌，如大肠杆菌。可以公共得到各种大肠杆菌株，例如大肠杆菌K12株MM294(ATCC 31.446)；大肠杆菌X1 776(ATCC 31.537)；大肠杆菌株W3 110(ATCC27.325)和K5772(ATCC 53.635)。其它适当的真核宿主细胞包括肠细菌，如埃希氏菌，如大肠杆菌，肠杆菌，欧文氏菌，克雷白氏菌，变形菌，沙门氏菌如伤寒沙门氏菌，沙雷氏菌如粘质沙雷氏菌，和志贺氏菌，以及芽孢杆菌如枯草芽孢杆菌和地衣芽孢杆菌(如公开于1989年4月12日发表的DD266，710的地衣芽孢杆菌41P)，假单孢菌如铜绿假单孢菌和链霉菌。这些例子是说明性的，而不是限制性的。菌株W3110是特别优选的宿主或亲代宿主，因为它是用于重组DNA产物发酵的常用宿主株。优选地，宿主细胞分泌最小量的蛋白水解酶。例如，可以对菌株W3110进行修饰以在编码宿主的内源蛋白的基因中实现基因突变，所述宿主的例子包括具有完整的基因型ronA的大肠杆菌W3110菌株1A2；具有完整的基因型ton4 ptr3的大肠杆菌W3110菌株9E4；具有完整的基因型tonA ptr3 phoA E15(argF-lac)169 degPompT/can′的大肠杆菌W3110菌株27C7(ATCC 55,244)；大肠杆菌W3110菌株40B4，它是具有非卡那霉素抗性degP缺失突变的菌株37D6；以及具有1990年8月7日授权的美国专利4,946,783公开的突变周质蛋白酶的大肠杆菌株。或者，PCR或其它核酸聚合酶反应等体内克隆方法是适用的。
除原核生物外，真核微生物如丝状真菌或酵母是融合蛋白载体的适当克隆或表达宿主。啤酒糖酵母是常用的低等真核宿主微生物。其它包括粟酒裂殖糖酵母[Beach and Nurse，Nature 290140-3(1981)；EP 139,383 published 2 May 1995]；Muyveromyces宿主[美国专利4,943,529；Fleer，et al.，Biol Technology 9(10)968-75(1991)]，如克鲁维氏酵母(MW98-8C，CBS683，CBS4574)[de Louvencourt etal.，J.Bacteriol.154(2)737-42(1983)]；脆壁克鲁维氏酵母(ATCC 12，424)，保加利亚克鲁维氏酵母(ATCC 16,045)，威克曼氏克鲁维氏酵母(ATCC 24,178)，waltii克鲁维氏酵母(ATCC 56,500)，果蝇克鲁维氏酵母(ATCC 36.906)[Van den Berg et al.，BiolTechnology8(2)135-9(1990)]；thermotoierans克鲁维氏酵母和马克斯克鲁维氏酵母；yarrowia(EP 402,226)；巴斯德毕赤氏酵母(EP 183,070)[Sreekrishna et al.，J.Basic Microbiol.28(4)265-78(1988)]；假丝酵母；Trichoderma reesia(EP 244,234)；粗糙链孢霉[Case，et al.，Proc.Natl.Acad Sci.USA 76(10)5259-63(1979)]；许旺氏酵母如西方许旺氏酵母(1990年10月31日公开的EP 394,538)和丝状真菌如链孢霉、青霉、Tolypocladium(1991年1月10日公开的WO 91/00357)；和曲霉宿主如构巢曲霉[Ballance et al.，Biochem.Biophys.Res.Comm.112(1)284-9(1983)]；Tilburn，et al.，Gene 26(2-3)205-21(1983)；Yelton，et al.，Proc.Natl.Acad.Sci.USA 81(5)1470-4(1984)]和黑曲霉[Kelly and Hynes，EMBOJ.4(2)475-9(1985)]。嗜甲烷(Methylotropic)酵母选自以下属汉逊氏酵母属、假丝酵母属、克氏酵母属、毕赤氏酵母属、啤酒糖酵母属、球拟酵母属和红酵母属。这种类型的酵母的示例性具体物种的列表可以见C.Antony，The Biochemistry of Methylotrophs 269(1982)。
用于表达本发明的融合蛋白的适当宿主细胞来源于多细胞生物。无脊椎细胞的例子包括昆虫细胞如果蝇S2和夜蛾，夜蛾high5和植物细胞。有用的哺乳动物宿主细胞系包括中国仓鼠卵巢(CHO)和COS细胞。更具体的例子包括SV40转化的猴肾CV1细胞系(COS-7，ATCC CRL1651)；人胚肾细胞系[亚克隆的用于在悬浮培养基中生长的293或293细胞，Graham，et al.，J.Gen Tirol.，36(1)59-74(1977)]；中国仓鼠卵巢细胞/-DHFR[CHO，Urlaub and Chasin，Proc.Natl.Acad.Sci.USA，77(7)4216-20(1980)]；小鼠支持细胞[TM4，Mather，Biol.Reprod.23(1)243-52(1980)]；人肺细胞(W138.ATCC CCL75)；人肝细胞(Hep G2，HB 8065)和小鼠乳腺肿瘤(MMT 060562，ATCCCCL51)。适当宿主细胞的选择被认为在本领域的技术范围内。
本发明的融合蛋白可以直接重组产生，或作为具有信号序列或其它序列的蛋白产生，所述序列在成熟融合蛋白的N末端产生特异性裂解位点。概言之，信号序列可以是载体的一种成分，或者它可以是插入载体的融合蛋白的编码DNA的一部分。信号序列可以是从例如碱性磷酸酶、青霉素酶1pp，或耐热肠毒素II前导序列中选择的原核信号序列。对于酵母分泌，信号序列可以是，例如，酵母转化酶前导序列，α因子前导序列(包括啤酒糖酵母和克鲁维氏酵母cc因子前导序列，后者描述于美国专利5,010,182)，或酸性磷酸酶前导序列，C.albicans葡糖淀粉酶前导序列(EP 362,179)或描述于WO 90/13646中的信号。在哺乳动物细胞表达中，可以用哺乳动物信号序列指导蛋白分泌，例如来自于相同或相关物种的分泌多肽的信号序列和病毒的分泌性前导序列。
表达和克隆载体都含有使载体能够在一个或多个选择的宿主细胞中复制的核酸序列。这种序列在多种细菌、酵母和病毒中都是公知的。来自于质粒pBR322的复制起点适于大多数革兰氏阴性细菌，2u质粒起点适于酵母，各种病毒(SV40，多瘤病毒，腺病毒，VSV或BPV)起点适用于哺乳动物细胞中的克隆载体。
表达和克隆载体一般含有选择基因，也称作可选择标记。典型的选择基因编码具有以下特征的蛋白(a)赋予抗生素或其它毒素，如氨苄青霉素、新霉素、氨甲喋呤或四环素抗性，(b)补充自养的营养缺陷，或(c)补充复合培养基所不能得到的关键营养，如编码芽孢杆菌的D-丙氨酸消旋酶的基因。
用于哺乳动物细胞的适当可选择标记的例子是使得能够鉴定可以摄取融合蛋白的编码核酸的细胞的标记，如DHFR或胸苷激酶。使用野生型DHFR时的适当宿主细胞是缺乏DHFR活性的CHO细胞系，其制备和增殖方法如[Urlaub and Chasin，Proc.Natl.Acad.Sci.USA，77(7)4216-20(1980)]的描述。用于酵母的适当选择基因是存在于酵母质粒YRp7中的trp1基因[Stinchcomb，et al.，Nature 282(5734)39-43(1979)；Kingsman，et al.，Gene 7(2)141-52(1979)；Tschumper，et al.，Gene 10(2)157-66(1980)]。trp1基因提供了用于缺乏在色氨酸中生长的能力的突变酵母株，例如ATCC No.44076或PEPC1[Jones，Genetics 8523-33(1977)]的选择标记。
表达和克隆载体通常含有与编码融合蛋白的核酸序列可操作性连接的启动子，以指导mRNA合成。通过各种可能的宿主细胞识别启动子是公知的。适用于原核宿主的启动子包括内酰胺酶和乳糖启动子系统[Chang，et al.，Nature 275(5681)617-24(1978)；Goeddel，et al.，Nature 281(5732)544-8(1979)]，碱性磷酸酶，色氨酸(上游)启动子系统[Goeddel，Nucleic Acids Res.8(18)4057-74(1980)；1981年9月30日公开的EP 36,776]，以及杂交启动子如tat启动子[deBoer，et al.，Proc.Natl.Acad.Sci.USA 80(1)21-5(1983)]。用于细菌系统的启动子也将包含与编码融合蛋白的DNA可操作性连接的Shine-Dalgarno(S.D.)序列。
用于酵母宿主的适当启动子序列的例子包括3-磷酸甘油酯激酶的启动子[Hitzeman，et al.，J.Biol.Chem.255(24)12073-80(1980)]或其它糖裂解酶[Hess et al.，J.Adv.Enzyme Reg.7149(1968)；Holland，Biochemistry 17(23)49007(1978)]，例如烯醇酶、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、磷酸果糖激酶、葡萄糖-6-磷酸异构酶、3-磷酸甘油酯变位酶、丙酮酸激酶、丙糖磷酸异构酶、磷酸葡萄糖异构酶和葡萄糖激酶。
其它具有由生长条件控制的额外转录优点的诱导型酵母启动子是醇脱氢酶2、异细胞色素C、酸磷酸酶、与氮代谢相关的降解酶、金属硫蛋白酶、甘油醛-3-磷酸脱氢酶和负责麦芽糖和半乳糖利用的酶的启动子区。用于酵母表达的适当载体和启动子进一步描述于EP73,657。可以通过从多瘤病毒、禽痘病毒、腺病毒(例如腺病毒2)、牛乳头瘤病毒、鸟类肉瘤病毒、巨细胞病毒、逆转录病毒、乙型肝炎病毒和猿猴病毒40(SV40)等病毒基因组获得的启动子、异源哺乳动物启动子如肌动蛋白启动子或免疫球蛋白启动子和热激启动子控制从哺乳动物宿主细胞中的载体转录编码融合蛋白的mRNA，前提是这些启动子与宿主细胞系统相容。
可以通过在载体中插入增强子序列增加高等真核细胞转录编码融合蛋白的多核苷酸。增强子是DNA的顺式作用元件，通常约10-300bp，作用于启动子以增加其转录。已知许多来自于哺乳动物基因(球蛋白、弹性蛋白酶、白蛋白、α-酮蛋白和胰岛素)的增强子序列。然而，一般地，将使用来自于真核细胞病毒的增强子。其例子包括复制起点近侧的SV40增强子(bp100-270)，巨细胞病毒早期启动子增强子，复制起点近侧的多瘤病毒增强子和腺病毒增强子。增强子可以剪切为位于融合蛋白编码序列5’或3’的载体中，但优选位于启动子5’方向的位点。
用于真核宿主细胞(酵母、真菌、昆虫、植物、动物、人或其它多细胞生物的有核细胞)的表达载体也将含有转录终止和稳定mRNA所必须的序列。这些序列通常可以从真核细胞或病毒DNAs或cDNAs的5’区和偶然从其3’非翻译区获得。这些区在编码融合蛋白的mRNA的非翻译部分中含有转录为聚腺苷酸化片段的核苷酸片段。
可以从培养基或宿主细胞裂解物中回收各种形式的融合蛋白。如果是膜包围的，可以使用适当的去污剂溶液(例如Triton-X 100)或通过酶裂解而从膜中释放。在融合蛋白的表达中使用的细胞可以通过各种物理或化学方法破坏，例如冻融循环、超声处理、机械破坏或细胞裂解剂。
纯化本发明的异源融合蛋白一旦本发明的异源融合蛋白在适当的宿主细胞中表达，可以分离和纯化类似物。以下程序是示例性的适当纯化程序在羧甲基纤维素上分级；凝胶过滤如Sephadex G-75；阴离子交换树脂，如DEAE或Mono-Q；阳离子交换树脂如CM或Mono-S；去除IgG等污染物的蛋白A琼脂糖；用金属螯合柱结合表位标记形式的多肽；反相HPLC；层析聚焦；硅胶；乙醇沉淀；和硫酸铵沉淀。
可以使用蛋白纯化的各种方法，并且这些方法是本领域公知的，并且描述于例如，Deutscher，Methods in Enzymology 18283-9(1990)和Scopes，Protein PurificationPrinciples and Practice，Springer-Verlag，NY(1982)。所选择的纯化步骤将取决于使用的生产过程的性质和产生的特定融合蛋白。例如，可以用蛋白A或蛋白G亲和基质有效纯化包含Fc片段的融合蛋白。可以使用低或高pH缓冲液从亲和基质上洗脱融合蛋白。温和的洗脱条件将有助于防止融合蛋白的不可逆变性。也可以使用含咪唑的缓冲液。实施例3描述了用于本发明的融合蛋白的一些成功的纯化方案。
本发明的融合蛋白的表征
可以用许多方法表征本发明的融合蛋白。这些方法中的一些包括与蛋白染色方法偶联的SDS-PAGE或使用抗IgG或抗HSA抗体的免疫印迹。其它方法包括基质辅助的激光解吸/电离质谱(MALDI-MS)、液相色谱/质谱、等电聚焦、分析性阴离子交换、层析聚焦和圆二色散。一些代表性的异源融合蛋白是用免疫印迹偶联的SDS-PAGE以及质谱表征的(见实施例4和5以及图3和4)。
例如表3(见实施例5)说明了代表性的融合蛋白的计算分子量和由质谱仪测定的质量。此外，图3和4说明了由SDS PAGE测定的代表性的融合蛋白的分子量。所有检测的异源融合蛋白都是瞬时表达并且分泌的。此外，切除了Igκ信号序列以产生具有正确N端的蛋白。
此外，表3说明，在一些情况下，由质谱测定的质量高于所预期的。这是因为Fc部分的糖基化和C末端延伸片段。用酶消化融合蛋白，然后通过反相HPLC和质谱可以表征含有糖部分的肽级分。可以对这些级分进行N末端氨基酸测序，以鉴定潜在的糖基化位点。例如，Exendin-4-Fc(SEQ ID NO29)的表征表明，第39位的丝氨酸和第50位的苏氨酸是O-连接糖基化的，第122位的天冬酰胺是N-连接糖基化的。
也检测了代表性的GLP-1融合蛋白的活性，可以用许多方法体外和体内检测GLP-1活性(见，例如实施例6，7，8和9)。表4(实施例6)说明，GLP-1受体活性与一些GLP-1融合相关。其数目是相对于与Val8-GLP-1(7-37)OH相关的活性。所有检测的融合蛋白具有GLP-1受体活性。低水平的体外活性不一定表示体外作用弱。由于这些融合蛋白半衰期的很大增加，体外活性弱一般不是体内活性弱的指标。图7和实施例说明，延长的半衰期与本发明的融合蛋白相关。例如，Val8-GLP-1-Fc在猴中的半衰期为大约45小时，Val8-GLP-1-HSA在猴中的半衰期为大约87小时，Gly8-Glu22-GLP-1-CEx-接头-IgG1在狗中静脉给药后的半衰期为大约55小时，Gly8-Glu2 2-GLP-1-CEx-接头-IgG1在狗中皮下给药后的半衰期为大约38小时。
本发明的组合物物理稳定性也是治疗性蛋白制剂的关键特征。GLP-1化合物特别难以制造和制剂化，因为在加工中存在结构改变。例如，一些GLP-1化合物具有聚集的倾向。此外，已经证明一些GLP-1化合物从可溶的和活性α螺旋形式转化为不溶的和潜在无活性的β折叠形式。GLP-1化合物与大的蛋白如IgG的Fc区或白蛋白的融合不仅增加GLP-1化合物的半衰期，也有助于GLP-1化合物的物理和构象稳定性。例如，Val8-GLP-1-接头-HSA在PBS中可以在37℃稳定约30天。
本发明的异源融合蛋白可以与一种或多种赋形剂进行制剂化。本发明的活性融合蛋白可以与可药用缓冲液组合，并且调节pH以提供可接受的稳定性和适于肠胃外给药等给药的pH。
可以添加一种或多种可药用的抗微生物剂。间甲酚和苯酚是优选的可药用抗微生物剂。可以加入一种或多种可药用盐以调节离子强度或渗透压。可以加入一种或多种赋形剂以进一步调节制剂的等渗性。甘油是调节等渗性的赋形剂的一个例子。适于人或其它动物给药的可药用手段不含毒性元素或不需要的污染物，并且不干扰其活性化合物的活性。
本发明的异源融合蛋白的可药用盐形式可以用于本发明。通常用于形成酸加成盐的酸是无机酸，如盐酸、氢溴酸、氢碘酸、硫酸、磷酸等，和有机酸如对甲苯磺酸、甲烷磺酸、草酸、对溴苯磺酸、碳酸、琥珀酸、柠檬酸、苯甲酸、乙酸等。优选的酸加成盐是与无机酸如盐酸和氢溴酸形成的盐。
碱加成盐包括来源于无机碱，如铵或碱或碱土金属羟化物的盐、碳酸盐、碳酸氢盐等。因此用于制备本发明的盐的这些碱包括氢氧化钠、氢氧化钾、氢氧化铵、碳酸钾等。
组合物的给药可以通过医生和普通技术人员公知的有效途径进行给药。外周肠胃外给药是这样的一种方法。医学文献中通常将肠胃外给药理解为用注射器或一些其它的机械设备如输注泵将剂型注射到体内。外周肠胃外给药可以包括静脉内、肌内、皮下和腹膜内给药途径。
本发明的异源融合蛋白也可以用于通过口服、直肠、鼻内、下呼吸道途径给药，这些都是非肠胃外途径。在这些非肠胃外途径中，优选呼吸道途径和口服途径。
本发明的融合蛋白可用于治疗多种疾病和状况。本发明的融合蛋白主要通过作用于称为“GLP-1受体”的受体来发挥它们的生物学作用。因此，可利用本发明中的GLP-1化合物来治疗患有可对GLP-1受体刺激和/或对GLP-1化合物给药作出有益应答的疾病或状况的患者。这些患者被称作“需要利用GLP-1化合物进行治疗”或“需要GLP-1受体刺激”。这样的患者包括患有胰岛素非依赖型糖尿病、胰岛素依赖型糖尿病、卒中(见WO 00/16979)、心肌梗塞(见WO 98/08531)、肥胖症(见WO 98/19698)、手术后分解代谢改变(见美国专利.NO 6,006,753)、功能性消化不良和肠激惹综合征(见WO 99/64060)的患者。也包括需要利用GLP-1化合物进行预防性处理的患者，如具有发生胰岛素非依赖型糖尿病危险性的患者(见WO 00/07617)。葡萄糖耐受异常或空腹葡萄糖异常的受试者、体重超出相对于患者身高和体格来讲的正常体重25％的受试者、进行了部分胰切除手术的受试者、双亲中有一或多个患有胰岛素非依赖型糖尿病的受试者、患有妊娠期糖尿病的受试者及患有急或慢性胰腺炎的受试者具有患胰岛素非依赖型糖尿病的危险性。
GLP-1化合物的“有效量”是指对需要GLP-1受体刺激的患者给药时，在不造成不需要的副作用的条件下，能够产生所需治疗和/或预防效果的量。“所需的治疗效果”包括下列的一或多个方面1)与疾病和状况相关的症状的改善；2)延缓与疾病或状况相关的症状的出现；3)与没有进行治疗的情况相比寿命增加；以及4)相对于没有进行治疗的情况具有更高的生活质量。例如，用于治疗糖尿病的GLP-1化合物的“有效量”指与没有进行治疗的情况相比，能对血糖浓度进行更大程度上的控制，从而延缓糖尿病并发症如视网膜病变、神经病或肾病出现的量。用于预防糖尿病的GLP-1化合物的“有效量”指与没有进行治疗的情况相比，能延缓升高的血糖水平出现的量，而血糖水平升高是需要用抗高血糖药物如磺脲类、噻唑烷二酮、胰岛素和/或氯苯呱哌嗪来进行治疗的。
有效使患者的血糖正常化的融合蛋白的剂量将取决于许多因素，其中包括但不限于受试者的性别、体重和年龄、不能调节血糖的严重性、给药途径和生物利用度、融合蛋白的药代动力学曲线、效力和制剂。
本发明包括具有通过与白蛋白、白蛋白片段、白蛋白类似物Fc部分、Fc片段或Fc类似物融合而具有改进的生化和生物物理特征的GLP-1化合物。这些异源蛋白可以在宿主细胞中成功表达，保留与GLP-1受体的激活相关的信号传递活性，并且具有延长的半衰期。
提供了以下实施例，以便进一步描述本发明。本发明的范围不是仅仅由以下实施例组成。本领域技术人员将理解，此处描述的特定试剂、设备和程序仅仅是说明性的，并没有以任何方式限制本发明。
实施例1构建编码异源融合蛋白的DNA实施例1a构建编码Val8-GLP-1(7-37)-Fc的DNA从cDNA文库分离人IgG1的Fc部分，并且含有完整的铰链区和CH2和CH3结构域。将含有人IgG1的该Fc部分的696个碱基对的片段亚克隆到哺乳动物表达载体pJB02的NheI和Eco47III位点，以产生pJB02/Fc(见图5)。通过4个重叠和互补的寡核苷酸的体外杂交产生编码与Val8-GLP-1(7-37)融合的Igκ分泌信号的DNA5′-CTAGCCACCATGGAGACAGACACACTCCTGCTATGGGTACTGCTGCTCTGGGTTCCAGGTTCCACTGGTGACCAGTG-3′[SEQ ID NO12]5′-GAGGGCACCTTCACCTCCGACGTGTCCTCCTATCTGGAGGGCCAGGCCGCCAAGGAGTTCATCGCCTGGCTGGTGAAGGGAAGAGGC-3′[SEQ ID NO13]5′-TGAAGGTGCCCTCCACGTGGTCACCAGTGGAACCTGGAACCCAGAGCAGCAGTACCCATAGCAGGAGTGTGTCTGTCTCCATGGTGG-3′[SEQ IDNO14]5′-GCCTCTTCCCTTCACCAGCCAGGCGATGAACTCCTTGGCGGCCTGGCCCTCCAGATAGGAGGACACGTCGGAGG-3′[SEQ ID NO15]采用等量的每种寡核苷酸(每种寡核苷酸的终浓度为1pm/μl)进行杂交反应。将寡核苷酸的化合物在连接缓冲液中100℃下加热5分钟(50mM Tris-HCl，pH 7.5，10mM MgCl2，10mM DTT，1mM ATP，25μg/ml牛血清白蛋白)，然后经至少2小时冷却到30℃。
得到的杂交产物与用NheI和Eco47III消化的pJB02/Fc载体主链在室温下连接2小时或在16℃连接过夜。用连接产物转化感受态的XL-1 Blue细胞(Stratagene)。通过用NcoI消化克隆筛选重组质粒中编码肽的插入序列的存在(编码Kozak序列和信号肽的第一个Met)并且测序。得到的用于转染测定的表达质粒称作pJB02-V8-GLP-1-Fc(图5)。
实施例1b构建编码Val8-GLP-1(7-37)-HSA的DNA质粒HSA/pcDNA3.1GS购自Invitrogen(目录号H-M12523M-pcDNA3.1/GS)并且作为模板分离编码人血清白蛋白(HSA)的cDNA。用PCR制备HSA cDNA，其中从5’末端去除编码前导序列和6个氨基酸的前肽的DNA。此外，在HSA编码序列的3’末端直接添加终止密码子。最后，将限制酶位点工程化在5’和3’末端以促进克隆。与天然人序列相比，存在于购自Invitrogen的原始载体中的HSA DNA序列在基因的3’区(第667位)含有单碱基改变。该改变将产生Asn，而不是Asp的密码子。因此，使用上述链重叠PCR诱变方法，将密码子改变为在此位置编码Asp。将得到的HSA编码DNA克隆到pJB02的NheI和HindIII位点以产生pJB02-HSA(图6)。
按实施例1a的讨论产生与Val8-GLP-1(7-37)序列融合的Igκ前导序列。将该DNA连接到pJB02-HSA的NheI和FspI位点以产生pJB02-Val8-GLP-1-HSA。
实施例1c构建编码Val8-GLP-1(7-37)-接头-HSA的DNA按实施例1b的描述制备载体pJB02-HSA。将编码接头序列[GGGGS]3的DNA框内连接于HAS的编码DNA的5’末端以产生pJB02-接头-HSA(图7)，按实施例1a的描述制备编码融合于Val8-GLP-1(7-37)序列和接头序列的5’部分的IgGκ前导序列的DNA。将该DNA连接于pJB02的NheI和BspEI位点以产生pJB02-Val8-GLP-1-接头-HSA。
实施例1d构建编码Exendin-4-Fc的DNA按实施例1a的描述制备质粒pJB02/Fc。通过以下重叠和互补寡核苷酸的体外杂交产生编码融合于Exendin-4的Igκ信号序列的DNA5′-CTAGCCACCATGGAGACAGACACACTCCTGCTATGGGTACTGCTGCTCTGGGTTCCAGGTTCCACCGGTCAC-3′[SEQ ID NO16]5′-GGAGAGGGAACCTTCACCAGCGACCTGAGCAAGCAGATGGAGGAGGAGGCCGTGAGACTG-3′[SEQ ID NO17 ]
5′-TTCATCGAGTGGCTGAAGAACGGAGGACCAAGCAGCGGAGCCCCTCCTCCTAGC-3′[SEQ ID NO18]5′-GAACCTGGAACCCAGAGCAGCAGTACCCATAGCAGGAGTGTGTCTGTCTCCATGGTGG-3′[SEQ ID NO19]5′-CTCCTCCTCCATCTGCTTGCTCAGGTCGCTGGTGAAGGTTCCCTCTCCGTGACCGGTG-3′[SEQ ID NO20]5′-GCTAGGAGGAGGGGCTCCGCTGCTTGGTCCTCCGTTCTTCAGCCACTCGATGAACAGTCTCACGGC-3′[SEQ ID NO21]按实施例1a的描述进行杂交反应。将杂交的产物连接于用NheI和Eco47III消化的pJB02载体，以产生pJB02-Exendin-4-Fc。
实施例le构建编码Exendin-4-HSA的DNA按实施例1b的描述制备质粒pJB02-HSA。通过描述于实施例1d中的重叠和互补寡核苷酸的体外杂交产生编码融合于Exendin-4的Igκ信号序列的DNA。也按上述内容进行杂交反应。将DNA克隆至pJB02-HSA中的独特NheI和FspI位点，以产生pJB02-Exendin-4-HSA。
实施例1f构建编码Exendin-4-接头-HSA的DNA按实施例1c的描述制备质粒pJB02-接头-HSA。按实施例1d的描述制备编码融合于Exendin-4和接头序列的5’部分的IgGκ前导序列的DNA。将该DNA克隆至pJB02-接头-HSA中的独特NheI和BspEI位点，以产生pJB02-Exendin-4-接头-HSA。
实施例1g构建编码Val8-GLP-1/C-Ex-Fc的DNA按实施例1d的描述制备质粒pJB02-Exendin-4-Fc。用AgeI和Eco47III从载体切除Exendin-4的编码DNA。通过以下重叠和互补寡核苷酸的体外杂交产生编码Val8-GLP-1/C-Ex的DNA
5′-CCGGTCACGTGGAGGGCACCTTCACCTCCGACGTGTCCTCCTATCTGGAGGGCCAGGCCGCCA-3′[SEQ ID NO22]5′-AGGAATTCATCGCCTGGCTGGTGAAGGGCCGGGGCAGCAGCGGAGCCCCTCCTCCTAGC-3′[SEQ ID NO23]5′-CTCCAGATAGGAGGACACGTCGGAGGTGAAGGTGCCCTCCACGTGA-3′[SEQ ID NO24]5′-GCTAGGAGGAGGGGCTCCGCTGCTGCCCCGGCCCTTCACCAGCCAGGCGATGAATTCCTTGGCGGCCTGGCC-3′[SEQ ID NO25]按实施例1a的描述进行杂交反应。将杂交的产物代替Exendin-4连接于pJB02-Exendin-4-Fc表达载体，以产生pJB02-Val8-GLP-1/C-Ex-Fc。
实施例1h构建编码Val8-Glu22-GLP-1-Fc的DNA按实施例1d的描述制备质粒pJB02-Exendin-4-Fc。用AgeI和Eco47III从载体切除Exendin-4的编码DNA。通过以下重叠和互补寡核苷酸的体外杂交产生编码Val8-Glu22-GLP-1的DNA5′-CCGGTCACGTGGAGGGCACCTTCACCTCCGACGTGTCCTCCTATCTCGAGGAGCAGGCCGCCA-3′[SEQ ID NO26]5′-AGGAGTTCATCGCCTGGCTGGTGAAGGGCCGGGGC-3′[SEQ ID NO27]5′-GCCCCGGCCCTTCACCAGCCAGGCGATGAACTCCTTGGCGGCCTGCTC-3′[SEQ ID NO28]5′-CTCGAGATAGGAGGACACGTCGGAGGTGAAGGTGCCCTCCACGTGA-3′[SEQ ID NO29]按实施例1a的描述进行杂交反应。将杂交的产物代替Exendin-4连接于pJB02-Exendin-4-Fc表达载体，以产生pJB02-Val8-Glu22-GLP-1-Fc。
实施例li构建编码Val8-Glu22-GLP-1/C-Ex-Fc的DNA按实施例1d的描述制备质粒pJB02-Exendin-4-Fc。用AgeI和Eco47III从载体切除Exendin-4的编码DNA。通过以下重叠和互补寡核苷酸的体外杂交产生编码Val8-Glu22-GLP-1/C-Ex的DNA5′-CCGGTCACGTGGAGGGCACCTTCACCTCCGACGTGTCCTCCTATCTCGAGGAGCAGGCCGCCA-3′[SEQ ID NO30]5′-AGGAATTCATCGCCTGGCTGGTGAAGGGCCGGGGCAGCAGCGGAGCCCCTCCTCCTAGC-3′[SEQ ID NO31]5′-CTCGAGATAGGAGGACACGTCGGAGGTGAAGGTGCCCTCCACGTGA-3′[SEQ ID NO32]5′-GCTAGGAGGAGGGGCTCCGCTGCTGCCCCGGCCCTTCACCAGCCAGGCGATGAATTCCTTGGCGGCCTGCTC-3′[SEQ ID NO33]按实施例1a的描述进行杂交反应。将杂交的产物代替Exendin-4连接于pJB02-Exendin-4-Fc表达载体，以产生pJB02-Val8-Glu22-GLP-1/C-Ex-Fc。
实施例1j构建编码Gly8-GLP-1-Fc的DNA按实施例1d的描述制备质粒pJB02-Exendin-4-Fc。用AgeI和Eco47III从载体切除Exendin-4的编码DNA。通过以下重叠和互补寡核苷酸的体外杂交产生编码Gly8-GLP-1的DNA5′-CCGGTCACGGCGAGGGCACCTTCACTAGTGACGTGTCCTCCTATCTGGAGGGCCAGGCCGCCA-3′[SEQ ID NO34]5′-AGGAGTTCATCGCCTGGCTGGTGAAGGGCCGGGGC-3′[SEQ ID NO35]5′-CTCCAGATAGGAGGACACGTCACTAGTGAAGGTGCCCTCGCCGTGA-3′[SEQ ID NO36]5′-GCCCCGGCCCTTCACCAGCCAGGCGATGAACTCCTTGGCGGCCTGGCC-3′[SEQ ID NO37 ]
按实施例1a的描述进行杂交反应。将杂交的产物代替Exendin-4连接于pJB02-Exendin-4-Pc表达载体，以产生pJB02-Gly8-GLP-1-Fc。
实施例2表达异源融合蛋白通过瞬时转染HEK 29 3EBNA细胞(贴壁的和悬浮的)表达实施例1中的DNA构建体编码的融合蛋白。在转染前对细胞进行计数和种植。通过将FuGeneTM6转染试剂(Roche Molecular Biochemicals，目录号1814443)与OptiMEM(Gibco/BRL)混合而制备转染混合物，并且在室温下孵育5分钟，此时加入DNA，将混合物再孵育15分钟。转染前，向平板中加入新鲜的生长培养基。表1和2提供了进一步的转染细节。
表1HEK 293EBNA细胞的瞬时转染中使用的试剂
表2培养基组成
对于小规模转染(35mm-10mm容器)，用PBS冲洗细胞，并且在转染后24小时转移到收获培养基，收集培养基并且每24小时更换一次，持续几天。对于大规模转染(700cm2滚瓶)，转染后48小时用PBS冲洗滚瓶并且改变为收获培养基。在至少连续10天中收集培养基并且每24小时更换。一般地，只有10次的收获物用于其后的蛋白纯化。
实施例3异源融合蛋白的纯化实施例3a Val8-GLP-1-Fc的纯化用CUNO过滤系统对来自于大规模转染物的约4.5升条件培养基(融合蛋白表达水平为大约20μg/ml)进行过滤，并且使用具有10K滤膜的ProFlux切向流动式过滤系统浓缩至250ml。用HiTrap蛋白A柱，采用pH7.4的1×PBS，以2ml/min的流速捕获Val8-GLP-1-Fc，并且用pH3.3的50mM柠檬酸洗脱。将级分(1ml)收集在含4ml 1×PBS和1000μl 1M Tris pH8的试管中。
将通过SDS-PAGE和Zorbax C8上的反相HPLC确定的含有融合蛋白的级分进行合并，并且加入Superdex 75 60/60柱，1×PBS pH 7.4中，流速为10ml/min。收集阳性级分(20ml/管)并且合并。然后将合并的级分在0.1％TFA水中以3ml/min的流速进行C4反相层析。在70分钟内用5％B(溶于乙腈的0.1％TFA)-100％B的梯度洗脱Val8-GLP-1-Fc。收集洗脱的级分(3ml/管)。通过真空干燥去除乙腈，并且加入1ml H2O。用4升1×PBS pH7.4透析纯化样品(大约32ml)两次。
然后用MILLEX-GV 0.22μm过滤单位过滤透析过的样品，用280nm处的吸光度确定浓度。
实施例3b Val8-GLP-1-HSA或Val8-GLP-1-接头-HSA的纯化用CUNO过滤系统对约6.5升条件培养基(融合蛋白表达水平为大约10μg/ml)进行过滤，并且使用具有10K滤膜的ProFlux切向流动式过滤系统浓缩至380ml。
用50ml Fast Flow Q柱(Pharmacia)，在流速为5ml/min的20mMTris pH7.4中捕获融合蛋白。采用以下梯度洗脱蛋白0％-50％20mMTris pH7.4，10 CV中的1M NaCl，然后2 CV中的100％B。
合并含融合蛋白的级分，在0.1％TFA水中以5ml/min的流速进行C4反相层析。在120分钟内用20％B(溶于乙腈的0.1％TFA)-90％B的梯度洗脱融合蛋白。收集洗脱的级分(3.5ml/管)。通过真空干燥去除乙腈。
用1×PBS将大约9ml合并的样品稀释至40ml并且用4升1×PBSpH7.4透析过夜。然后过滤样品，用280nm处的吸光度确定浓度。
实施例3c Exendin-4-Fc的纯化用CUNO过滤系统对约4升条件培养基(融合蛋白表达水平为大约8μg/ml)进行过滤，并且使用具有30K滤膜的ProFlux切向流动式过滤系统浓缩至250ml。
用5ml HiTrap蛋白A柱，在流速为2ml/min的1×PBS，pH7.4中捕获Exendin-4-Fc，并且用pH3.3的50mM柠檬酸洗脱。合并含融合蛋白的级分，过滤，并且用4升1×PBS pH7.4透析过夜。然后将透析过的样品加入Superdex 75 60/60柱，1×PBS pH7.4，0.5M Nacl中，流速为10ml/min。收集含融合蛋白的级分(20ml/管)，合并，并且浓缩至大约1mg/ml。然后用MILLEX-GV 0.22um滤器过滤浓缩后的样品。
实施例3d纯化Exendin-4-HSA和Exendin-4-接头-HSA用CUNO过滤系统对约1.1升条件培养基(融合蛋白表达水平为大约6μg/ml)进行过滤，并且使用具有30K滤膜的ProFlux切向流动式过滤系统浓缩至175ml。
然后用50ml HiTrap Q-琼脂糖柱(Pharmacia)，在流速为2ml/min的20mM Tris pH7.4中捕获融合蛋白。采用以下梯度洗脱蛋白0％-50％20mM Tris pH7.4，12 CV中的1M NaCl，然后4 CV中的100％B。
合并含融合蛋白的级分，在0.1％TFA水中以5ml/min的流速进行C4反相层析。在70分钟内用10％B(溶于乙腈的0.1％TFA)-100％B的梯度洗脱融合蛋白。收集洗脱的级分(10ml/管)。通过真空干燥去除乙腈。
用4升1×PBS pH7.4透析大约8ml合并的样品过夜。然后过滤样品，用280nm处的吸光度确定浓度。然后将透析过的样品加入Superdex 200 26/60柱，×PBS pH7.4，0.5M NaCl中，流速为2ml/min。收集、合并、浓缩和过滤含融合蛋白的级分(3ml/管)。
实施例4通过SDS PAGE表征融合蛋白使用SDS-PAGE和其后的免疫印迹分析来自于用各种融合蛋白表达载体转染的纯化融合蛋白和条件培养基。用Novex 16％Tris-甘氨酸Precast凝胶(EC6498)、电泳缓冲液(10x，LC2675)和样品缓冲液(L2676)在Novex Powerease 500系统上进行SDS-PAGE。用50mM DTT还原样品，加样前在95℃加热3-5分钟。
进行SDS-PAGE凝胶电泳后，用水和转移缓冲液(1X Tris-甘氨酸Seprabuff(Owl Scientific目录号ER26-S)，含20％甲醇)从凝胶上冲洗SDS。使用具有PVDF(BioRad，目录号162-0174)和硝酸纤维素膜(BioRad，目录号1703965或1703932)的Novex转移装置。在室温下30-35V转移90min。用含有0.1％Tween-20(Sigma，目录号P7949)和5％乳汁(BioRad，目录号170-6404)的1×PBS将膜在4℃封闭1-12小时。将抗体稀释至1×PBS+5％乳汁中并且在这些溶液中4℃孵育印迹1-2小时。在孵育之间，用1×PBS和0.2％Tween-20在室温下洗涤印迹5分钟，共4次。在25℃用GIBCO 10×PBS(目录号70011)制备PBS以得到1mM磷酸二氢钾、3mM氢二钠、153mM氯化钠，pH7.4的最终组分，或用Sigma的PBS袋(目录号10003)制备PBS以得到120mM NaCl，2.7mM KCl和10mM磷酸盐，pH7.4。
第一抗体为单克隆山羊抗IgG1或兔抗HSA。第二抗体为抗山羊IgGHRP或抗兔IgG HRP。对第二抗体进行1∶5000稀释。用ECL系统(Amersham Pharmacia Biotech，目录号RN2108和目录号RPN1674H)对印迹进行显影。
图3A比较了纯化Fc蛋白与来自pJB02-Val8-GLP-1-Fc和pJB02-Exendin-4-Fc转染的细胞的条件培养基。迁移率的减少与由于融合蛋白的GLP-1部分导致的大小增加相一致。图3B相似地比较了纯化HSA和来自于pJB02-Val8-GLP-2-HSA，pJB02-Val8-GLP-1-接头-HSA，pJB02-Exendin-4-HSA，或pJB02-Exendin-4-接头-HSA转染的细胞的条件培养基。图4鉴定了纯化的融合蛋白制剂。
实施例5用质谱法表征融合蛋白所有实验都是在装备有延时聚焦电子设备、Reflectron(用于分析0-8000 Da的肽范围)、线性检测器(用于高质量/良好信号分析)、和后加速检测器(或P.A.D.，用于高质量/极低信号分析)的MicromassTofSpec-2E质谱仪上进行的。线性模式中仪器的有效径长是1.2米，反射(Reflectron)模式中是2.3米。固定两个双微通道板检测器用于线性和反式模式检测。使用的激光是Laser Science Inc.VSL-337i氮激光，在337nm下，每秒5次激光发射。用2GHz，8比特内部数字化仪获得所有数据，每个谱平均最多50次激光发射。
以线性方式操作仪器，用于分析所考虑的GLP-1融合蛋白。线性检测器是检测沿MALDI-ToF-MS仪器的飞行管向下运行的离子的设备。它检测随时间的离子丰度，并且相数字化仪发送信号用于转换。数字化仪是一种模拟-数字转换器，允许质谱仪的细胞转移到计算机，在其中重建为可用的m/z谱。
用重结晶的饱和芥子酸溶液(在50/50 Acn/H2O和0.1％TFA中稀释)作为离子化基质。芥子酸是大于约10Kda的蛋白的适当基质。将适当的参考蛋白作为内部和外部校准标准，以获得所分析的样品的准确质量测定值。采用样品与基质稀释液1∶2的比例分析样品。起初在以下的线性检测器条件下设定线性检测器条件源电压20.0keV脉冲电压3.0keV萃取电压20.0keV 粗激光50聚焦电压16.0keV 细激光50线性检测器3.7keVP.A.D.(离线)(根据需要)对这些设置进行调整，以得到最佳信/噪比和最高的分辨率。表3提供了不同GLP-1融合蛋白的表征。
表3
Cex称作C末端延伸片段，包含序列Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser。接头是Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser。
实施例6异源融合蛋白的活性用分别描述于Gelfand等的EP 619,322和美国专利5,120,712中的方法等体外测定方法评估本发明的融合蛋白激活GLP-1受体的能力。相对于Val8-GLP-1(7-37)OH活性的这些化合物的活性报道于表4。图8表示Val8-GLP-1和Exendin-4融合蛋白的体外剂量反应曲线。此外，表5a和5b提供了可以与Fc或白蛋白融合以制备生物活性融合蛋白的一大组GLP-1类似物的体外活性。这些活性是与GLP-1(7-37)OH相比的结果。
表4GLP-1融合蛋白的体外活性
Cex称作C末端延伸片段，包含序列Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser。接头是Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser。
C2是Ser-Ser-Gly-Alα-Ser-Ser-Gly-Ala。
描述于表3和4的融合蛋白的氨基酸序列表示于SED ID NO13至SEQ ID NO31。
Val8-GLP-1-人血清白蛋白氨基酸序列由SEQ ID NO13表示。
1 HVEGTFTSDV SSYLEGQAAK EFIAWLVKGR GDAHKSEVAH RFKDLGEENF KALVLIAFAQ61 YLQQCPFEDH VKLVNEVTEF AKTCVADESA ENCDKSLHTL FGDKLCTVAT LRETYGEMAD121 CCAKQEPERN ECFLQHKDDN PNLPRLVRPE VDVMCTAFHD NEETFLKKYL YEIARRHPYF181 YAPELLFFAK RYKAAFTECC QAADKAACLL PKLDELRDEG KASSAKQRLK CASLQKFGER241 AFKAWAVARL SQRFPKAEFA EVSKLVTDLT KVHTECCHGD LLECADDRAD LAKYICENQD301 SISSKLKECC EKPLLEKSHC IAEVENDEMP ADLPSLAADF VESKDVCKNY AEAKDVFLGM361 FLYEYARRHP DYSVVLLLRL AKTYETTLEK CCAAADPHEC YAKVFDEFKP LVEEPQNLIK421 QNCELFEQLG EYKFQNALLV RYTKKVPQVS TPTLVEVSRN LGKVGSKCCK HPEAKRMPCA481 EDYLSVVLNQ LCVLHEKTPV SDRVTKCCTE SLVNRRPCFS ALEVDETYVP KEFNAETFTF541 HADICTLSEK ERQIKKQTAL VELVKHKPKA TKEQLKAVMD DFAAFVEKCC KADDKETCFA601 EEGKKLVAAS QAALGL [SEQ ID NO13]Val8-GLP-1-接头-人血清白蛋白氨基酸序列由SEQ ID NO14表示。
1 HVEGTFTSDV SSYLEGQAAK EFIAWLVKGR GGGGGSGGGG SGGGGSDAHK SEVAHRFKDL61 GEENFKALVL IAFAQYLQQC PFEDHVKLVN EVTEFAKTCV ADESAENCDK SLHTLFGDKL121 CTVATLRETY GEMADCCAKQ EPERNECFLQ NKDDNPNLPR LVRPEVDVMC TAFHDNEETF181 LKKYLYEIAR RHPYFYAPEL LFFAKRYKAA FTECCQAADK AACLLPKLDE LRDEGKASSA241 KQRLKCASLQ KFGERAFKAW AVARLSQRFP KAEFAEVSKL VTDLTKVHTE CCHGDLLECA301 DDRADLAKYI CENQDSISSK LKECCEKPLL EKSHCIAEVE NDEMPADLPS LAADFVESKD361 VCKNYAEAKD VFLGMFLYEY ARRHPDYSVV LLLRLAKTYE TTLEKCCAAA DPHECYAKVF421 DEFKPLVEEP QNLIKQNCEL FEQLGEYKFQ NALLVRYTKK VPQVSTPTLV EVSRNLGKVG481 SKCCKHPEAK RMPCAEDYLS VVLNQLCVLH EKTPVSDRVT KCCTESLVNR RPCFSALEVD541 ETYVPKEFNA ETFTFHADIC TLSEKERQIK KQTALVELVK HKPKATKEQL KAVMDDFAAF601 VEKCCKADDK ETCFAEEGKK LVAASQAALG L[SEQ ID NO14]Gly8-Glu22-GLP-1-CEx-接头-人血清白蛋白氨基酸序列由SEQ ID NO15表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSG GGGGSGGGGS GGGGSDAHKS61 EVAHRFKDLG EENFKALVLI AFAQYLQQCP FEDHVKLVNE VTEFAKTCVA DESAENCDKS121 LHTLFGDKLC TVATLRETYG EMADCCAKQE PERNECFLQH KDDNPNLPRL VRPEVDVMCT181 AFHDNEETFL KKYLYEIARR HPYFYAPELL FFAKRYKAAF TECCQAADKA ACLLPKLDEL241 RDEGKASSAK QRLKCASLQK FGERAFKAWA VARLSQRFPK AEFAEVSKLV TDLTKVHTEC301 CHGDLLECAD DRADLAKYIC ENQDSISSKL KECCEKPLLE KSHCIAEVEN DEMPADLPSL361 AADFVESKDV CKNYAEAKDV FLGMFLYEYA RRHPDYSVVL LLRLAKTYET TLEKCCAAAD421 PHECYAKVFD EFKPLVEEPQ NLIKQNCELF EQLGEYKFQN ALLVRYTKKV PQVSTPTLVE481 VSRNLGKVGS KCCKHPEAKR MPCAEDYLSV VLNQLCVLHE KTPVSDRVTK CCTESLVNRR541 PCFSALEVDE TYVPKEFNAE TFTFHADICT LSEKERQIKK QTALVELVKH KPKATKEQLK601 AVMDDFAAFV EKCCKADDKE TCFAEEGKKL VAASQAALGL [SEQ ID NO15]
Exendin-4-人血清白蛋白氨基酸序列由SEQ ID NO16表示。
1 HGEGTFTSDL SKQMEEEAVR LFIEWLKNGG PSSGAPPPSD AHKSEVAHRF KDLGEENFKA61 LVLIAFAQYL QQCPFEDHVK LVNEVTEFAK TCVADESAEN CDKSLHTLFG DKLCTVATLR121 ETYGEMADCC AKQEPERNEC FLQHKDDNPN LPRLVRPEVD VMCTAFHDNE ETFLKKYLYE181 IARRHPYFYA PELLFFAKRY KAAFTECCQA ADKAACLLPK LDELRDEGKA SSAKQRLKCA241 SLQKFGERAF KAWAVARLSQ RFPKAEFAEV SKLVTDLTKV HTECCHGDLL ECADDRADLA301 KYICENQDSI SSKLKECCEK PLLEKSHCIA EVENDEMPAD LPSLAADFVE SKDVCKNYAE361 AKDVFLGMFL YEYARRHPDY SVVLLLRLAK TYETTLEKCC AAADPHECYA KVFDEFKPLV421 EEPQNLIKQN CELFEQLGEY KFQNALLVRY TKKVPQVSTP TLVEVSRNLG KVGSKCCKHP481 EAKRMPCAED YLSVVLNQLC VLHEKTPVSD RVTKCCTESL VNRRPCFSAL EVDETYVPKE541 FNAETFTFHA DICTLSEKER QIKKQTALVE LVKHKPKATK EQLKAVMDDF AAFVEKCCKA601 DDKETCFAEE GKKLVAASQA ALGL[SEQ ID NO16]Exendin-4-接头-人血清白蛋白氨基酸序列由SEQ ID NO17表示。
1 HGEGTFTSDL SKQMEEEAVR LFIEWLKNGG PSSGAPPPSG GGGGSGGGGS GGGGSDAHKS61 EVAHRFKDLG EENFKALVLI AFAQYLQQCP FEDHVKLVNE VTEFAKTCVA DESAENCDKS121 LHTLFGDKLC TVATLRETYG EMADCCAAKE PERNECFLQH KDDNPNLPRL VRPEVDVMCT181 AFHDNEETFL KKYLYEIARR HPYFYAPELL FFAKRYKAAF TECCQAADKA ACLLPKLDEL241 RDEGKASSAK QRLKCASLQK FGERAFKAWA VARLSQRFPK AEFAEVSKLV TDLTKVHTEC301 CHGDLLECAD DRADLAKYIC ENQDSISSKL KECCEKPLLE KSHCIAEVEN DEMPADLPSL361 AADFVESKDV CKNYAEAKDV FLGMFLYEYA RRHPDYSVVL LLRLAKTYET TLEKCCAAAD421 PHECYAKVFD EFKPLVEEPQ NLIKQNCELF EQLGEYKFQN ALLVRYTKKV PQVSTPTLVE481 VSRNLGKVGS KCCKHPEAKR MPCAEDYLSV VLNQLCVLHE KTPVSDRVTK CCTESLVNRR541 PCFSALEVDE TYVPKEFNAE TFTFHADICT LSEKERQIKK QTALVELVKH KPKATKEQLK601 AVMDDFAAFV EKCCKADDKE TCFAEEGKKL VAASQAALGL[SEQ ID NO17]Val8-GLP-1-IgG1氨基酸序列由SEQ ID NO18表示。
1 HVEGTFTSDV SSYLEGQAAK EFIAWLVKGR GAEPKSCDKT HTCPPCPAPE LLGGPSVFLF61 PPKPKDTLMI SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV121 SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SREEMTKNQV181 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD KSRWQQGNVF241 SCSVMHEALH NHYTQKSLSL SPGK [SEQ ID NO18]Val8-GLP-1-Cex-IgG1氨基酸序列由SEQ ID NO19表示。
1 HVEGTFTSDV SSYLEGQAAK EFIAWLVKGR GSSGAPPPSA EPKSCDKTHT CPPCPAPELL61 GGPSVFLFPP KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ121 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR181 EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LYSKLTVDKS241 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK [SEQ ID NO19]Val8-Glu22GLP-1-IgG1氨基酸序列由SEQ ID NO20表示。
1 HVEGTFTSDV SSYLEEQAAK EFIAWLVKGR GAEPKSCDKT HTCPPCPAPE LLGGPSVFLF61 PPKPKDTLMI SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV121 SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SREEMTKNQV181 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD KSRWQQGNVF241 SCSVMHEALH NHYTQKSLSL SPGK [SEQ ID NO20]Val8-Glu22GLP-1-CEx-IgG1氨基酸序列由SEQ ID NO21表示。
1 HVEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSA EPKSCDKTHT CPPCPAPELL61 GGPSVFLFPP KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ121 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR181 EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LYSKLTVDKS241 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK[SEQ ID NO21]Gly8-Glu22GLP-1-C2-IgG1氨基酸序列由SEQ ID NO22表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGASSGAA EPKSCDKTHT CPPCPAPELL61 GGPSVFLFPP KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ121 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR181 EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPFNNYKTTP PVLDSDGSFF LYSKLTVDKS241 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK[SEQ ID NO22]Gly8-Glu22GLP-1-CEx-接头-IgG1氨基酸序列由SEQ ID NO23表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSG GGGSGGGGSG GGGSAEPKSC61 DKTHTCPPCP APELLGGPSV FLFPPKPKDT LMISRTPEVT CVVVDVSHED PEVKFNWYVD121 GVEVHNAKTK PREEQYNSTY RVVSVLTVLH QDWLNGKEYK CKVSNKALPA PIEKTISKAK181 GQPREPQVYT LPPSREEMTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS241 DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK [SEQ ID NO23]
Gly8-Glu22GLP-1-CEx-接头-IgG4氨基酸序列由SEQ ID NO24表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSG GGGSGGGGSG GGGSAESKYG61 PPCPSCPAPE FLGGPSVFLF PPKPKDTLMI SRTPEVTCVV VDVSQEDPEV QFNWYVDGVE121 VHNAKTKPRE EQFNSTYRVV SVLTVLHQDW LNGKEYKCKV SNKGLPSSIE KTISKAKGQP181 REPQVYTLPP SQEEMTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS241 FFLYSRLTVD KSRWQEGNVF SCSVMHEALH NHYTQKSLSL SLGK [SEQ ID NO24]Gly8-Glu22GLP-1-CEx-2接头-IgG1氨基酸序列由SEQ ID NO25表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSG GGGSGGGGSG GGGSGGGGSG61 GGGSGGGGSA EPKSCDKTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD121 VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN181 KALPAPIEKT ISKAKGQPRE PQVYTLPPSR EEMTKNQVSL TCLVKGFYPS DIAVEWESNG241 QPENNYKTTP PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP301 GK[SEQ ID NO25]Gly8-Glu22GLP-1-2接头-IgG1氨基酸序列由SEQ ID NO26表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GGGGGSGGGG SGGGGSGGGG SGGGGSGGGG61 SAEPKSCDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV VDVSHEDPEV121 KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW LNGKEYKCKV SNKALPAPIE181 KTISKAKGQP REPQVYTLPP SREEMTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT241 TPPVLDSDGS FFLYSKLTVD KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK[SEQ ID NO26]Gly8-Glu22GLP-1-2CEx-IgG1氨基酸序列由SEQ ID NO27表示。
1 HGEGTFTSDV SSYLEEQAAK EFIAWLVKGR GSSGAPPPSS SGAPPPSAEP KSCDKTHTCP61 PCPAPELLGG PSVFLFPPKP KDTLMISRTP EVTCVVVDVS HEDPEVKFNW YVDGVEVHNA121 KTKPREEQYN STYRWWSVLT VLHQDWLNGK EYKCKVSNKA LPAPIEKTIS KAKGQPREPQ181 VYTLPPSREE MTKNQVSLTC LVKGFYPSDI AVEWESNGQP ENNYKTTPPV LDSDGSFFLY241 SKLTVDKSRW QQGNVFSCSV MHEALHNHYT QKSLSLSPGK [SEQ ID NO27]Gly8-Glu22-Val25-Ile33GLP-1-CEx-接头-IgG1氨基酸序列由SEQ ID NO28表示。
1 HGEGTFTSDV SSYLEEQAVK EFIAWLIKGR GSSGAPPPSG GGGSGGGGSG GGGSAEPKSC61 DKTHTCPPCP APELLGGPSV FLFPPKPKDT LMISRTPEVT CVVVDVSHED PEVKFNWYVD121 GVEVHNAKTK PREEQYNSTY RVVSVLTVLH QDWLNGKEYK CKVSNKALPA PIEKTISKAK181 GQPREPQVYT LPPSREEMTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS241 DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK [SEQ ID NO28]Exendin-4-IgG1氨基酸序列由SEQ ID NO29表示。
1 HGEGTFTSDL SKQMEEEAVR LFIEWLKNGG PSSGAPPPSA EPKSCDKTHT CPPCPAPELL61 GGPSVFLFPP KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ121 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR181 EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LYSKLTVDKS241 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK [SEQ ID NO29]Exendin-4-C2-IgG1氨基酸序列由SEQ ID NO30表示。
1 HGEGTFTSDL SKQMEEEAVR LFIEWLKNGG PSSGASSGAA EPKSCDKTHT CPPCPAPELL61 GGPSVFLFPP KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ121 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR181 EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LYSKLTVDKS241 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK [SEQ ID NO30]Exendin-4-接头-IgG1氨基酸序列由SEQ ID NO31表示。
1 HGEGTFTSDL SKQMEEEAVR LFIEWLKNGG PSSGAPPPSG GGGSGGGGSG GGGSAEPKSC61 DKTHTCPPCP APELLGGPSV FLFPPKPKDT LMISRTPEVT CVVVDVSHED PEVKFNWYVD121 GVEVHNAKTK PREEQYNSTY RVVSVLTVLH QDWLNGKEYK CKVSNKALPA PIEKTISKAK181 GQPREPQVYT LPPSREEMTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS241 DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK [SEQ ID NO31]
表5aGLP-1类似物的体外活性GLP-1 受体GLP-1 化合物激活GLP-1(7-37)OH 1.0Val8-GLP-1(7-37)OH 0.47(n＝6)Gly8-His11-GLP-1(7-37)OH0.282Val8-Ala11-GLP-1(7-37)OH0.021Val8-Lys11-GLP-1(7-37)OH0.001Val8-Tyr12-GLP-1(7-37)OH0.81Val8-Glu16-GLp-1(7-37)OH0.047
Val8-Ala16-GLP-1(7-37)OH0.112Val8-Tyr16-GLP-1(7-37)OH1.175Val8-Lys20-GLP-1(7-37)OH0.33Gln22-GLP-1(7-37)OH 0.42Val8-Ala22-GLP-1(7-37)OH0.56Val8-Ser22-GLP-1(7-37)OH0.50Val8-Asp22-GLP-1(7-37)OH0.40Val8-Glu22-GLP-1(7-37)OH1.29Val8-Lys22-GLP-1(7-37)OH0.58Val8-Pro22-GLP-1(7-37)OH0.01Val8-His22-GLP-1(7-37)OH0.14Val8-Lys22-GLP-1(7-36)NH20.53Val8-Glu22-GLP-1(7-36)NH21.0Gly8-Glu22-GLP-1(7-37)OH1.07Val8-Lys23-GLP-1(7-37)OH0.18Val8-His24-GLP-1(7-37)OH0.007
Val8-Lys24-GLP-1(7-37)OH0.02Val8-His26-GLP-1(7-37)OH1.6Val8-Glu26-GLp-1(7-37)OH1.5Val8-His27-GLP-1(7-37)OH0.37Val8-Ala27-GLp-1(7-37)OH0.47Gly8-Glu30-GLP-1(7-37)OH0.29Val8-Glu30-GLp-1(7-37)OH0.29Val8-Asp30-GLP-1(7-37)OH0.15Val8-Ser30-GLP-1(7-37)OH0.19Val8-His30-GLP-1(7-37)OH0.19Val8-Glu33-GLP-1(7-37)OH0.039Val8-Ala33-GLP-1(7-37)OH0.1Val8-Gly33-GLP-1(7-37)OH0.01Val8-Glu34-GLP-1(7-37)OH0.17Val8-Pro35-GLP-1(7-37)OH0.094Val8-His35-GLP-1(7-37)OH0.41Val8-Glu35-GLP-1(7-37)OH0.15
Val8-Glu36-GLP-1(7-37)OH 0.11Val8-His36-GLP-1(7-37)OH 0.22Val8-His37-GLP-1(7-37)OH 0.33Val8-Leu16-Glu26-GLP-1(7-37)OH 0.23Val8-Lys22-Glu30-GLP-1(7-37)OH 0.37Val8-Lys22-Glu23-GLP-1(7-37)OH 0.35Val8-Glu22-Ala27-GLP-1(7-37)OH 1.02Val8-Glu22-Lys23-GLP-1(7-37)OH 1.43Val8-Lys33-Val34-GLP-1(7-37)OH 0.08Val8-Lys33-Asn34-GLP-1(7-37)OH 0.09Val8-Gly34-Lys35-GLP-1(7-37)OH 0.34Val8-Gly36-Pro37-GLP-1(7-37)NH20.53
表5bGLP-1类似物的体外活性
表6GLP-1/Exendin类似物的体外活性
实施例7Val8-GLP-1-IgG1和Val8-GLP-1-HSA的体内药代动力学在cynomologus猴中进行Val8-GLP-1-IgG1和Val8-GLP-1-HSA的药代动力学研究。给予猴5.6nmol/kg的Val8-GLP-1-IgG1或Val8-GLP-1-HSA。通过静脉内给药而给予化合物。在给药前和给药后0.083、0.25、0.5、1、4、8、12、24、48、72、96、120、144、168和216小时采集血液至含EDTA的试管。用放射免疫测定进行具有免疫反应性的Val8-GLP-1的血浆浓度测定，该测定使用主要的特异性是针对Val8-GLP-1(7-37)的N末端(7-16)区的多克隆抗血清。图9描述了对两只cynomologus猴进行单次静脉内给药后Val8-GLP-1-Fc和Val8-GLP-1-接头-HSA的血浆浓度。Fc融合蛋白的半衰期大约为45小时，白蛋白融合体的半衰期大约为87小时。
实施例8Exendin-4-IgG1的体内药代动力学在禁食过夜后研究两只长期插入导管的正常雄性猎犬。通过动脉和静脉血管入口，将导管皮下插入头静脉并且缝合。将动物置于笼子中，将其导管与旋转/束缚系统连接。通过头静脉导管静脉内注射含融合蛋白Exendin-4-IgG1(11.8WM)的溶液(1.0nmol/kg)。然后用10ml盐水清洗导管。2小时后，启动高血糖(150mg/dl)夹，持续3小时。在此5小时的时间段中取出动脉血样品，用于测定融合蛋白、葡萄糖和胰岛素的血浆浓度。
比较此研究的结果和以前的相似研究的结果，在以前的研究中两只动物接受盐水皮下注射，3小时后用3小时高血糖(150mg/dl)夹进行研究。
在两个系列的研究中，使用Beckman血糖分析仪测定血浆葡萄糖浓度。由Linco Research公司的雇员采用他们的实验室开发的RIA试剂盒测定血浆胰岛素浓度。数据表示于图10和11。
实施例9Gly8-Glu22-GLP-1-CEx-接头-IgG1的体内药代动通过皮下(SC)或静脉内(IV)给药使两组各三只正常雄性猎犬接受0.1mg/kg Gly8-Glu22-GLP-1-CEx-接头-IgG1。在IV和SC组中，通过免疫测定在给药前30分钟至给药后216小时中采集的样品中测定Gly8-Glu22-GLP-1-CEx-接头-IgG1的血浆浓度。然后用这些浓度确定报道的药代动力学参数。IV给予Gly8-Glu22-GLP-1-CEx-接头-IgG1的平均清除半衰期为大约55小时，总清除速度是1.5mL/h/kg。SC给予Gly8-Glu22-GLP-1-CEx-接头-IgG1的平均清除半衰期为大约38小时。
序列表序列表<110>伊莱利利公司<120>GLP-1融合蛋白<130>X-13991<150>US 60/251,954<151>2000-06-12<160>35<170>PatentIn version 3.1<210>1<211>31<212>PRT<213>人(Homo sapiens)<400>1His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly20 25 30<210>2<211>39<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(3)..(3)<223>第3位的Xaa是Glu，Asp，或Lys；<220><221>MISC_特征<222>(5)..(5)<223>第5位的Xaa是Thr，Ala，Gly，Ser，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(8)..(8)<223>第8位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Val，Ala，Gly，Ser，Thr，Leu，Ile，Tyr，Glu，Asp，或Lys；<220><221>MISC_特征<222>(11)..(11)<223>第11位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(12)..(12)<223>第12位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，Lys，Trp或Tyr；<220><221>MISC_特征<222>(13)..(13)<223>第13位的Xaa是Tyr，Phe，Trp，Glu，Asp，Gln，或Lys；<220><221>MISC_特征<222>(14)..(14)<223>第14位的Xaa是Leu，Ala，Gly，Ser，Thr，Ile，Val，Glu，Asp，Met，Lys，Trp或Tyr；<220><221>MISC_特征<222>(15)..(15)<223>第15位的Xaa是Glu，Asp，或Lys；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，Trp或Lys；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是Gln，Asn，Arg，Glu，Asp，或Lys；<220><221>MISC_特征<222>(18)..(18)<223>第18位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Arg，Glu，Asp，或Lys；<220><221>MISC_特征<222>(19)..(19)<223>第19位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(20)..(20)<223>第20位的Xaa是Lys，Arg，Gln，Glu，Asp，或His；<220><221>MISC_特征<222>(21)..(21)<223>第21位的Xaa是Leu，Glu，Asp，或Lys；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(25)..(25)<223>第25位的Xaa是Trp，Phe，Tyr，Glu，Asp，或Lys；<220><221>MISC_特征<222>(26)..(26)<223>第26位的Xaa是Leu，Gly，Ala，Ser，Thr，Ile，Val，Glu，Asp，或Lys；<220><22>MISC_特征<222>(27)..(27)<223>第27位的Xaa是Val，Gly，Ala，Ser，Thr，Leu，Ile，Glu，Asp，或Lys；<220><221>MISC_特征<222>(28)..(28)<223>第28位的Xaa是Asn，Lys，Arg，Glu，Asp，或His；<220><221>MISC_特征<222>(29)..(29)<223>第29位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；<220><221>MISC_特征<222>(30)..(30)<223>第30位的Xaa是Gly，Arg，Lys，Glu，Asp，或His；<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Pro，Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys，或去除；<220><221>MISC_特征<222>(32)..(32)<223>第32位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或去除；<220><221>MISC_特征<222>(33)..(33)<223>第33位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或去除；<220><221>MISC_特征<222>(34)..(34)<223>第34位的Xaa是Gly，Asp，Glu，或Lys，或去除；<220><221>MISC_特征<222>(35)..(35)<223>第35位的Xaa是Ala，Phe，Trp，Tyr，Glu，Asp，或Lys，或去除；<220><221>MISC_特征<222>(36)..(36)<223>第36位的Xaa是Ser，Pro，Lys，Glu，或Asp，或去除；<220><221>MISC_特征<222>(37)..(37)<223>第37位的Xaa是Ser，Pro，Glu，Asp，或Lys，或去除；<220><221>MISC_特征<222>(38)..(38)<223>第38位的Xaa是Gly，Pro，Glu，Asp，或Lys，或去除；<220><221>MISC_特征<222>(39)..(39)<223>第39位的Xaa是Ala，Ser，Val，Glu，Asp，或Lys，或去除；<400>2His Xaa Xaa Gly Xaa Phe Thr Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Phe Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Xaa Xaa Xaa Xaa35<210>3<211>32<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；<220><221>MISC_特征<222>(3)..(3)<223>第3位的Xaa是Thr，Ser，Arg，Lys，Trp，Phe，Tyr，Glu，或His；<220><221>MISC_特征<222>(5)..(5)<223>第5位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；<220><221>MISC_特征<222>(6)..(6)<223>第6位的Xaa是His，Trp，Phe，或Tyr；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Tyr，Glu，或Ala；<220><221>MISC_特征<222>(12)..(12)<223>第12位的Xaa是His，Pro，Asp，Glu，Arg，Ser，Ala，或Lys；<220><221>MISC_特征<222>(13)..(13)<223>第13位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是His，Asp，Lys，Glu，Gln，或Arg；<220><221>MISC_特征<222>(18)..(18)<223>第18位的Xaa是Glu，Arg，Ala，或Lys；<220><221>MISC_特征<222>(20)..(20)<223>第20位的Xaa是Trp，Tyr，Phe，Asp，Lys，Glu，或His；<220><221>MISC_特征<221>(21)..(21)<223>第21位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala，Glu，Asp，Ser，或His；<220><221>MISC_特征<222>(25)..(25)<223>第25位的Xaa是Asp，Glu，Ser，Thr，Arg，Trp，或Lys；<220><221>MISC_特征<222>(27)..C27)<223>第27位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；<220><221>MISC_特征<222>(28)..(28)<223>第28位的Xaa是Glu，Lys，或Asp；<220><221>MISC_特征<222>(29)..(29)<223>第29位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；<220><221>MISC_特征<222>(30)..(30)<223>第30位的Xaa是Thr，Ser，Asp，Trp，Tyr，Phe，Arg，Glu，或His；<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，或去除。<220><221>MISC_特征<222>(32)..(32)<223>第31位的Xaa是Pro或去除。<400>3Xaa Xaa Xaa Gly Xaa Xaa Thr Ser Asp Xaa Ser Xaa Xaa Leu Glu Gly1 5 10 15Xaa Xaa Ala Xaa Xaa Phe Ile Xaa Xaa Leu Xaa Xaa Xaa Xaa Xaa Xaa20 25 30<210>4<211>32<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；<220><221>MISC_特征<222>(5)..(5)<223>第5位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；<220><221>MISC_特征<222>(6)..(6)<223>第6位的Xaa是His，Trp，Phe，或Tyr；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是His，Asp，Lys，Glu，或Gln；<220><221>MISC_特征<222>(18)..(18)<223>第18位的Xaa是Glu，His，Ala，或Lys；<220><221>MISC_特征<222>(19)..(19)<223>第19位的Xaa是Asp，Lys，Glu，或His；<220><221>MISC_特征<222>(21)..(21)<223>第21位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala，Glu，Asp，Ser，或His；<220><221>MISC_特征<222>(27)..(27)<223>第27位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；<220><221>MISC_特征<222>(28)..(28)<223>第28位的Xaa是Glu，Lys，或Asp；<220><221>MISC_特征<222>(29)..(29)<223>第29位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；<220><221>MISC_特征<222>(30)..(30)<223>第30位的Xaa是Arg，Glu，或His；<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，或去除。<220><221>MISC_特征<222>(32)..(32)<223>第32位的Xaa是Pro，或去除。<400>4Xaa Xaa Glu Gly Xaa Xaa Thr Ser Asp Xaa Ser Ser Tyr Leu Glu Xaa1 5 10 15Xaa Xaa Xaa Lys Xaa Phe Ile Xaa Trp Leu Xaa Xaa Xaa Xaa Xaa Xaa20 25 30<210>5<211>32<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，Met，或Thr；<220><221>MISC_特征<222>(6)..(6)<223>第6位的Xaa是His，Trp，Phe，或Tyr；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Gly，Asp，Glu，Gln，ASn，Lys，Arg，或Cys；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是His，Asp，Lys，Glu，或Gln；<220><221>MISC_特征<222>(20)..(20)<223>第20位的Xaa是Asp，Lys，Glu，或His；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala，Glu，Asp，Ser，或His；<220><221>MISC_特征<222>(29)..(29)<223>第29位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，或去除。<220><221>MISC_特征<222>(32)..(32)<223>第32位的Xaa是Pro或去除。<400>5Xaa Xaa Glu Gly Thr Xaa Thr Ser Asp Xaa Ser Ser Tyr Leu Glu Xaa1 5 10 15Xaa Ala Ala Xaa Glu Phe Ile Xaa Trp Leu Val Lys Xaa Arg Xaa Xaa20 25 30<210>6<211>32<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是His，Asp，Lys，Glu，或Gln；<220><221>MISC_特征<222>(18)..(18)<223>第18位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala，Glu，Asp，Ser，或His；<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或去除。<220><221>MISC_特征<222>(32)..(32)<223>第32位的Xaa是Pro或去除。<400>6Xaa Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Xaa1 5 10 15Xaa Xaa Ala Lys Glu Phe Ile Xaa Trp Leu Val Lys Gly Arg Xaa Xaa20 25 30<210>7<211>31<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Ala，Gly，Val，Thr，Ile，和α-甲基-Ala；<220><221>MISC_特征<222>(15)..(15)<223>第15位的Xaa是Glu，Gln，Ala，Thr，Ser，和Gly；<220><221>MISC_特征<222>(21)..(21)<223>第21位的Xaa是Glu，Gln，Ala，Thr，Ser，和Gly；<400>7Xaa Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Xaa Gly1 5 10 15Gln Ala Ala Lys Xaa Phe Ile Ala Trp Leu Val Lys Gly Arg Gly20 25 30<210>8<211>30<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(19)..(19)<223>第19位的Xaa是Lys或Arg；<220><221>MOD_RES<222>(27)..(27)<223>乙酰化<220><221>MISC_特征<222>(30)..(30)<223>第30位的Xaa是Gly；<220><221>MOD_RES<222>(30)..(30)<223>酰胺化<400>8Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln1 5 10 15Ala Ala Xaa Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Xaa20 25 30<210>9<211>39<212>PRT<213>人工序列<220><223>合成构建体<400>9His Ser Asp Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser35<210>10<211>39<212>PRT<213>人工序列<220><223>合成构建体<400>10His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser35<210>11<211>39<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>第2位的Xaa是Gly，Ala，或Val；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Leu或Val；<220><221>MISC_特征<222>(12)..(12)<223>第12位的Xaa是Lys或Ser；<220><221>MISC_特征<222>(13)..(13)<223>第13位的Xaa是Gln或Tyr；<220><221>MISC_特征<222>(14)..(14)<223>第14位的Xaa是Met或Leu；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Glu或Gln；<220><221>MISC_特征<222>(17)..(17)<223>第17位的Xaa是Glu或Gln；<220><221>MISC_特征<222>(19)..(19)<223>第19位的Xaa是Val或Ala；<220><221>MISC_特征<222>(20)..(20)<223>第20位的Xaa是Arg或Lys；<220><221>MISC_特征<222>(21)..(21)<223>第21位的Xaa是Leu或Glu；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Glu或Ala；<220><221>MISC_特征<222>(27)..(27)<223>第27位的Xaa是Val或Lys；<220><221>MISC_特征<222>(28)..(28)<223>第28位的Xaa是Asn或Lys；<220><221>MISC_特征<222>(30)..(30)<223>第30位的Xaa是Gly或Arg；和<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Gly，或Pro；<220><221>MISC_特征<222>(32)..(32)<223>第31位的Xaa是Ser，或缺乏。<220><221>MISC_特征<222>(33)..(33)<223>第33位的Xaa是Ser，或缺乏。<220><221>MISC_特征<222>(34)..(34)<223>第34位的Xaa是Gly，或缺乏。<220><221>MISC_特征<222>(35)..(35)<223>第35位的Xaa是Ala，或缺乏。<220><221>MISC_特征<222>(36)..(36)<223>第36位的Xaa是Pro，或缺乏。<220><221>MISC_特征<222>(37)..(37)<223>第37位的Xaa是Pro，或缺乏。<220><221>MISC_特征<222>(38)..(38)<223>第38位的Xaa是Pro，或缺乏。<220><221>MISC_特征<222>(39)..(39)<223>第39位的Xaa是Pro，或缺乏。<220><221>MISC_特征<222>(39)..(39)<223>第38位的Xaa是Ser，或缺乏。<400>11Xaa Xaa Glu Glu Thr Phe Thr Ser Asp Xaa Ser Xaa Xaa Xaa Glu Xaa1 5 10 15Xaa Ala Xaa Xaa Xaa Phe Ile Xaa Trp Leu Xaa Xaa Gly Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Xaa Xaa Xaa Xaa35<210>12<211>31<212>PRT<213>人工序列<220><223>合成构建体<220><221>MISC_特征<222>(1)..(1)<223>第1位的Xaa是L-组氨酸，D-组氨酸，或去除。<220><221>MISC_特征<222>(2)..(2)<223>Xaa at position 2 is Ala，Gly，Val，Leu，Ile，Ser，or Thr；<220><221>MISC_特征<222>(6)..(6)<223>第6位的Xaa是Phe，Trp，或Tyr；<220><221>MISC_特征<222>(10)..(10)<223>第10位的Xaa是Val，Trp，Ile，Leu，Phe，或Tyr；<220><221>MISC_特征<222>(12)..(12)<223>第12位的Xaa是Ser，Trp，Tyr，Phe，Lys，Ile，Leu，Val；<220><221>MISC_特征<222>(13)..(13)<223>第13位的Xaa是Tyr，Trp，或Phe；<220><221>MISC_特征<222>(14)..(14)<223>第14位的Xaa是Leu，Phe，Tyr，或Trp；<220><221>MISC_特征<222>(16)..(16)<223>第16位的Xaa是Gly，Glu，Asp，或Lys；<220><221>MISC_特征<222>(19)..(19)<223>第19位的Xaa是Ala，Val，Ile，或Leu；<220><221>MISL_特征<222>(21)..(21)<223>第21位的Xaa是Glu，Ile，或Ala；<220><221>MISC_特征<222>(24)..(24)<223>第24位的Xaa是Ala或Glu；<220><221>MISC_特征<222>(27)..(27)<223>第27位的Xaa是Val或Ile；和<220><221>MOD_RES<222>(30)..(30)<223>酰胺化<220><221>MISC_特征<222>(31)..(31)<223>第31位的Xaa是Gly，His或缺乏。<400>12Xaa Xaa Glu Gly Thr Xaa Thr Ser Asp Xaa Ser Xaa Xaa Xaa Glu Xaa1 5 10 15Gln Ala Xaa Lys Xaa Phe Ile Xaa Trp Leu Xaa Lys Gly Arg Xaa20 25 30<210>13<211>616<212>PRT<213>人工序列<220><223>合成构建体<400>13His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Asp20 25 30Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu35 40 45Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Gln50 55 60Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe65 70 75 80Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser85 90 95Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg100 105 110Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu115120 125Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro130 135 140Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp145 150 155 160Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Arg165 170 175His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr180 185 190Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Cys195 200 205Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser210 215 220Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Arg225 230 235 240Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Lys245 250 255Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val260 265 270His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg275 280 285Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser290 295 300Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys305 310 315 320Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu325 330 335Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu340345 350Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg355 360 365His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr370 375 380Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys385 390 395400Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln405 410 415Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr420 425 430Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln435 440 445Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val450 455 460Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala465 470 475 480Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu485 490 495Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu500 505 510Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr515 520 525Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile530 535 540Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu545 550 555 560Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys565 570 575Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala580 585 590Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala595 600 605Ala Ser Gln Ala Ala Leu Gly Leu610 615<210>14<211>631<212>PRT<213>人工序列<220><223>合成构建体<400>14His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly20 25 30Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ala35 40 45His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu Asn50 55 60Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys65 70 75 80Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala85 90 95Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu100 105 110His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu115 120 125Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg130 135 140Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro Arg145 150 155 160Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn165 170 175Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His180 185 190Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys195 200 205Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu210 215 220Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala225 230 235 240Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala245 250 255Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala260 265 270Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val His275 280 285Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala290 295 300Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys305 310 315 320Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys Ile325 330 335Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala340 345 350Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala355 360 365Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg His370 375 380Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu385 390 395 400Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr405 410 415Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln Asn420 425 430Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys435 440 445Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln Val450 455 460Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val Gly465 470 475 480Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu485 490 495Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu Lys500 505 510Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val515 520 525Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr Val530 535 540Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile Cys545 550 555 560Thr Leu Ser Glu Lys Glu Arg Gln Ile Lvs Lys Gln Thr Ala Leu Val565 570 575Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala580 585 590Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp595 600 605Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Ala610 615 620Ser Gln Ala Ala Leu Gly Leu625 630<210>15<211>640<212>PRT<213>人工序列<220><223>合成构建体<400>15His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly35 40 45Gly Ser Gly Gly Gly Gly Ser Asp Ala His Lys Ser Glu Val Ala His50 55 60Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile65 70 75 80Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys85 90 95Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu100 105 110Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys115 120 125Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp130 135 140Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His145 150 155 160Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp165 170 175Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys180 185 190Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu195 200 205Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys210 215 220Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu225 230 235 240Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala245 250 255Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala260 265 270Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys275 280 285Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp290 295 300Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Tle Cys305 310 315 320Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys325 330 335Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu340 345 350Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys355 360 365Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met370 375 380Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu385 390 395 400Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys405 410 415Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe420 425 430Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu435 440 445Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val450 455 460Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu465 470 475 480Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro485 490 495Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu500 505 510Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val515 520 525Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Ary Pro Cys Phe Ser530 535 540Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu545 550 555 560Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg565 570 575Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro580 585 590Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala595 600 605Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala610 615 620Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu625 630 635 640<210>16<211>624<212>PRT<213>人工序列<220><223>合成构建体<400>16His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Asp Ala His Lys Ser Glu Val Ala His35 40 45Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile50 55 60Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys65 70 75 80Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu85 90 95Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys100 105110Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp115 120 125Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His130 135140Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp145 150 155 160Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys165 170 175Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu180 185 190Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys195 200 205Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu210 215 220Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala225 230 235 240Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala245 250 255Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys260 265 270Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp275 280 285Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys290 295 300Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys305 310 315 320Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu325 330 335Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys340 345 350Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met355 360 365Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu370 375 380Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys385 390 395 400Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe405 410 415Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu420 425 430Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val435 440 445Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu450 455 460Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro465 470 475 480Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu485 490 495Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val500 505 510Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser515 520 525Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu530 535 540Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg545 550 555 560Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro565 570 575Lys Ala Thr Lys Gly Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala580 585 590Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala595 600 605Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu610 615 620<210>17<211>640<212>PRT<213>人工序列<220><223>合成构建体<400>17His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly35 40 45Gly Ser Gly Gly Gly Gly Ser Asp Ala His Lys Ser Glu Val Ala His50 55 60Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile65 70 75 80Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys85 90 95Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu100 105 110Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys115 120 125Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp130 135 140Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His145 150 155 160Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp165 170 175Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys180 185 190Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu195 200 205Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys210 215 220Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu225 230 235 240Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala245 250 255Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala260 265 270Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys275 280 285Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp290 295 300Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys305 310 315 320Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys325 330 335Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu340 345 350Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys355 360 365Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met370 375 380Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu385 390 395 400Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys405 410 415Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe420 415 430Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu435 440 445Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val450 455 460Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu465 470 475 480Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro485 490 495Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu500 505 510Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val515 520 525Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser530 535 540Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu545 550 555 560Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg565 570 575Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro580 585 590Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala595 600 605Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala610 615 620Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu625 630 635 640<210>18<211>264<212>PRT<213>人工序列<220><223>合成构建体<400>18His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ala20 25 30Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala35 40 45Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro50 55 60Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val65 70 75 80Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val85 90 95Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln100 105 110Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln115 120 125Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala130 135 140Leu Pro Ala Pro Ile Glu Lys Thr Ile ser Lys Ala Lys Gly Gln Pro145 150 155 160Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr165 170 175Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser180 185 190Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr195 200 205Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr210 215 220Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe225 230 235 240Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys245 250 255Ser Leu Ser Leu Ser Pro Gly Lys260<210>19<211>272<212>PRT<213>人工序列<220><223>合成构建体<400>19His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr35 40 45His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser50 55 60Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg65 70 75 80Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro85 90 95Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala100 105 110Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val115 120 125Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr130 135 140Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr145 150 155 160Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu165 170 175Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys180 185 190Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser195 200 205Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp210 215 220Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser225 230 235 240Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala245 250 255Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys260 265 270<210>20<211>264<212>PRT<213>人工序列<220><223>合成构建体<400>20His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ala20 25 30Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala35 40 45Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro50 55 60Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val65 70 75 80Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val85 90 95Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln100 105 110Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln115 120 125Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala130 135 140Leu Pro Ala Pro Ile Glu Lys Thr ILe Ser Lys Ala Lys Gly Gln Pro145 150 155 160Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr165 170 175Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser180 185 190Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr195 200 205Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr210 215 220Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe225 230 235 240Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys245 250 255Ser Leu Ser Leu Ser Pro Gly Lys260<210>21<211>272<212>PRT<213>人工序列<220><223>合成构建体<400>21His Val Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr35 40 45His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser50 55 60Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg65 70 75 80Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro85 90 95Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala100 105 110Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val115 120 125Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr130 135 140Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr145 150 155 160Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu165 170 175Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys180 185 190Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser195 200 205Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp210 215 220Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser225 230 235 240Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala245 250 255Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys260 265 270<210>22<211>272<212>PRT<213>人工序列<220><223>合成构建体<400>22His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Ser Ser Gly Ala Ala Glu Pro Lys Ser Cys Asp Lys Thr35 40 45His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser50 55 60Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg65 70 75 80Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro85 90 95Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala100 105 110Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val115 120 125Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr130 135 140Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr145 150 155 160Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu165 170 175Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys180185 190Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser195 200 205Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp210 215 220Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser225 230 235 240Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala245 250 255Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys260 265 270<210>23<211>287<212>PRT<213>人工序列<220><223>合成构建体<400>23His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly35 40 45Ser Gly Gly Gly Gly Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His50 55 60Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val65 70 75 80Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr85 90 95Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu100 105 110Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys115 120 125Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser130 135 140Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys145 150 155 160Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile165 170 175Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro180 185 190Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu195 200 205Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn210 215 220Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser225 230 235 240Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg245 250 255Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu260 265 270His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys275 280 285<210>24<211>284<212>PRT<213>人工序列<220><223>合成构建体<400>24His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly35 40 45Ser Gly Gly Gly Gly Ser Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro50 55 60Ser Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe65 70 75 80Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val85 90 95Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe100 105 110Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro115 120 125Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr130 135 140Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val145 150 155 160Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala165 170 175Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln180 185 190Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly195 200 205Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro210 215 220Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser225 230 235 240Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu245 250 255Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His260 265 270Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys275 280<210>25<211>302<212>PRT<213>人工序列<220><223>合成构建体<400>25His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Cly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly35 40 45Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser50 55 60Gly Gly Gly Gly Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr65 70 75 80Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe85 90 95Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro100 105 110Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val115 120 125Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr130 135 140Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val145 150 155 160Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys165 170 175Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser180 185 190Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro195 200 205Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val210 215 220Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly225 230 235 240Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp245 250 255Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp260 265 270Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His275 280 285Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys290 295 300<210>26<211>294<212>PRT<213>人工序列<220><223>合成构建体<400>26His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly20 25 30Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly35 40 45Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Pro50 55 60Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu65 70 75 80Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp85 90 95Thr Leu Met Tle Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp100 105 110Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly115 120 125Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn130 135 140Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp145 150 155 160Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro165 170 175Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu180 185 190Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn195 200 205Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile210 215 220Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr225 230 235 240Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys245 250 255Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys260 265 270Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu275 280 285Ser Leu Ser Pro Gly Lys290<210>27<211>280<212>PRT<213>人工序列<220><223>合成构建体<400>27His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Ser Ser Gly Ala Pro Pro Pro Ser Ala35 40 45Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala50 55 60Pro Glu Leu Leu Gly Gly Pro Ser Val phe Leu Phe pro Pro Lys Pro65 70 75 80Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val85 90 95Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val100 105 110Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln115 120 125Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln130 135 140Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala145 150 155 160Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro165 170 175Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr180 185 190Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser195 200 205Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr210 215 220Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr225 230 235 240Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe245 250 255Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys260 265 270Ser Leu Ser Leu Ser Pro Gly Lys275280<210>28<211>287<212>PRT<213>人工序列<220><223>合成构建体<400>28His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu1 5 10 15Gln Ala Val Lys Glu Phe Ile Ala Trp Leu Ile Lys Gly Arg Gly Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly35 40 45Ser Gly Gly Gly Gly Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His50 55 60Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val65 70 75 80Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr85 90 95Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu100 105 110Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys115 120 125Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser130 135 140Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys145 150 155 160Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile165 170 175Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro180 185 190Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu195 200 205Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn210 215 220Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser230 235 240Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg245 250 255Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu260 265 270His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys275 280 285<210>29<211>272<212>PRT<213>人工序列<220><223>合成构建体<400>29His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr35 40 45His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser50 55 60Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg65 70 75 80Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro85 90 95Glu Val Lys phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala100 105 110Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val115 120 125Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr130 135 140Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr145 150 155 160Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu165 170 175Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys180 185 190Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser195 200 205Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp210 215 220Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser225 230 235 240Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala245 250 255Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys260 265 270<210>30<211>272<212>PRT<213>人工序列<220><223>合成构建体<400>30His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Ser Ser Gly Ala Ala Glu Pro Lys Ser Cys Asp Lys Thr35 40 45His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser50 55 60Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg65 70 75 80Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro85 90 95Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala100 105 110Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val115 120 125Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr130 135 140Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr145 150 155 160Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu165 170 175Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys180 185 190Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser195 200 205Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp210 215 220Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser225 230 235 240Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala245 250 255Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys260 265 270<210>31<211>287<212>PRT<213>人工序列<220><223>合成构建体<400>31His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu1 5 10 15Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser20 25 30Ser Gly Ala Pro Pro Pro Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly35 40 45Ser Gly Gly Gly Gly Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His50 55 60Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val65 70 75 80Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr85 90 95Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu100 105 110Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys115 120 125Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser130 135 140Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys145 150 155 160Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile165 170 175Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro180 185 190Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu195 200 205Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn210 215 220Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser225 230 235 240Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg245 250 255Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu260 265 270His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys275 280 285<210>32<211>232<212>PRT<213>人(Homo sapiens)<400>32Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro1 5 10 15Ala Pro Glu Lys Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro20 25 30Lys Asp Thr Lys Met Tle Ser Arg Thr Pro Glu Val Thr Cys Val Val35 40 45Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val50 55 60Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln65 70 75 80Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln85 90 95Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala100 105 110Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro115 120 125Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr130 135 140Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser145 150 155 160Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr165 170 175Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr180 185 190Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe195 200 205Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys210 215 220Ser Leu Ser Leu Ser Pro Gly Lys225 230<210>33<211>703<212>DNA<213>人(Homo sariens)<400>33gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 60gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg120acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc180aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag240tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat300ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc360atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg420gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc480gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct540cccgtgctgg actccgacgg ctccttcttc ctctatagca agctcaccgt ggacaagagc600aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac660tacacgcaga agagcctctc cctgtctccg ggtaaatgat agt 703<210>34<211>585<212>PRT<213>人(Homo sapiens)<400>34Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu1 5 10 15Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln20 25 30Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu35 40 45Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys50 55 60Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu65 70 75 80Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro85 90 95Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu100 105 110Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His115 120 125Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg130 135 140Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg145 150 155 160Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala165 170 175Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser180 185 190Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu195 200 205Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro210 215 220Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys225 230 235 240Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp245 250 255Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser260 265 270Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His275 280 285Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser290 295 300Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala305 310 315 320Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg325 330 335Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr340 345 350Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu355 360 365Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro370 375 380Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Asn Leu Gly Glu385 390 395 400Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro405 410 415Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys420 425 430Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys435 440 445Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His450 455 460Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser465 470 475 480Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr485 490 495Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp500 505 510Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala515 520 525Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu530 535 540Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys545550 555 560Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val565 570 575Ala Ala Ser Gln Ala Ala Leu Gly Leu580 585<210>35<211>1762<212>DNA<213>人(Homo sapiens)<400>35gatgcgcaca agagtgaggt tgctcatcgg tttaaagatt tgggagaaga aaatttcaaa 60gccttggtgt tgattgcctt tgctcagtat cttcagcagt gtccatttga agatcatgta120aaattagtga atgaagtaac tgaatttgca aaaacatgtg ttgctgatga gtcagctgaa180aattgtgaca aatcacttca tacccttttt ggagacaaat tatgcacagt tgcaactctt240cgtgaaacct atggtgaaat ggctgactgc tgtgcaaaac aagaacctga gagaaatgaa300tgcttcttgc aacacaaaga tgacaaccca aacctccccc gattggtgag accagaggtt360gatgtgatgt gcactgcttt tcatgacaat gaagagacat ttttgaaaaa atacttatat420gaaattgcca gaagacatcc ttacttttat gccccggaac tccttttctt tgctaaaagg480tataaagctg cttttacaga atgttgccaa gctgctgata aagctgcctg cctgttgcca540aagctcgatg aacttcggga tgaagggaag gcttcgtctg ccaaacagag actcaagtgt600gccagtctcc aaaaatttgg agaaagagct ttcaaagcat gggcagtagc tcgcctgagc 660cagagatttc ccaaagctga gtttgcagaa gtttccaagt tagtgacaga tcttaccaaa 720gtccacacgg aatgctgcca tggagatctg cttgaatgtg ctgatgacag ggcggacctt 780gccaagtata tctgtgaaaa tcaagattcg atctccagta aactgaagga atgctgtgaa 840aaacctctgt tggaaaaatc ccactgcatt gccgaagtgg aaaatgatga gatgcctgct 900gacttgcctt cattagctgc tgattttgtt gaaagtaagg atgtttgcaa aaactatgct 960gaggcaaagg atgtcttcct gggcatgttt ttgtatgaat atgcaagaag gcatcctgat1020tactctgtcg tgctgctgct gagacttgcc aagacatatg aaaccactct agagaagtgc1080tgtgccgctg cagatcctca tgaatgctat gccaaagtgt tcgatgaatt taaacctctt1140gtggaagagc ctcagaattt aatcaaacaa aattgtgagc tttttgagca gcttggagag1200tacaaattcc agaatgcgct attagttcgt tacaccaaga aagtacccca agtgtcaact1260ccaactcttg tagaggtctc aagaaaccta ggaaaagtgg gcagcaaatg ttgtaaacat1320cctgaagcaa aaagaatgcc ctgtgcagaa gactatctat ccgtggtcct gaaccagtta1380tgtgtgttgc atgagaaaac gccagtaagt gacagagtca ccaaatgctg cacagaatcc1440ttggtgaaca ggcgaccatg cttttcagct ctggaagtcg atgaaacata cgttcccaaa1500gagtttaatg ctgaaacatt caccttccat gcagatatat gcacactttc tgagaaggag1560agacaaatca agaaacaaac tgcacttgtt gagctcgtga aacacaagcc caaggcaaca1620aaagagcaac tgaaagctgt tatggatgat ttcgcagctt ttgtagagaa gtgctgcaag1680gctgacgata aggagacctg ctttgccgag gagggtaaaa aacttgttgc tgcaagtcaa1740gctgccttag gcttataatg ac 176权利要求
1.一种异源融合蛋白，包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)人白蛋白；b)人白蛋白类似物；和c)人白蛋白的片段，并且其中第一个多肽的C末端与第二个多肽的N末端融合。
2.一种异源融合蛋白，包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)人白蛋白；b)人白蛋白类似物；和c)人白蛋白的片段，并且其中第一个多肽的C末端通过肽接头与第二个多肽的N末端融合。
3.权利要求2的异源融合蛋白，其中肽接头选自a)富含甘氨酸的肽；b)具有序列[Gly-Gly-Gly-Gly-Ser]n的肽，其中n是1，2，3，4，5或6；和c)具有序列[Gly-Gly-Gly-Gly-Ser]3的肽。
4.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式I[SEQ ID NO2]的序列7 8 9 10 11 12 13 14 15 16 17His-Xaa-Xaa-Gly-Xaa-Phe-Thr-Xaa-Asp-Xaa-Xaa-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37 38 39Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-40 41 42 43 44 45Xaa-Xaa-Xaa-Xaa-Xaa-Xaa式I(SEQ ID NO2)其中第8位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第9位的Xaa是Glu，Asp，或Lys；第11位的Xaa是Thr，Ala，Gly，Ser，Leu，Ile，Val，Glu，Asp，或Lys；第14位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第16位的Xaa是Val，Ala，Gly，Ser，Thr，Leu，Ile，Tyr，Glu，Asp，Trp，或Lys；第17位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第18位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，Trp，Tyr，或Lys；第19位的Xaa是Tyr，Phe，Trp，Glu，Asp，Gln，或Lys；第20位的Xaa是Leu，Ala，Gly，Ser，Thr，Ile，Val，Glu，Asp，Met，Trp，Tyr，或Lys；第21位的Xaa是Glu，Asp，或Lys；第22位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第23位的Xaa是Gln，Asn，Arg，Glu，Asp，或Lys；第24位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Arg，Glu，Asp，或Lys；第25位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第26位的Xaa是Lys，Arg，Gln，Glu，Asp，或His；第27位的Xaa是Leu，Glu，Asp，或Lys；第30位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第31位的Xaa是Trp，Phe，Tyr，Glu，Asp，或Lys；第32位的Xaa是Leu，Gly，Ala，Ser，Thr，Ile，Val，Glu，Asp，或Lys；第33位的Xaa是Val，Gly，Ala，Ser，Thr，Leu，Ile，Glu，Asp，或Lys；第34位的Xaa是Asn，Lys，Arg，Glu，Asp，或His；第35位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第36位的Xaa是Gly，Arg，Lys，Glu，Asp，或His；第37位的Xaa是Pro，Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys，或被去除；第38位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第39位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第40位的Xaa是Gly，Asp，Glu，或Lys，或被去除；第41位的Xaa是Ala，Phe，Trp，Tyr，Glu，Asp，或Lys，或被去除；第42位的Xaa是Ser，Pro，Lys，Glu，或Asp，或被去除；第43位的Xaa是Ser，Pro，Glu，Asp，或Lys，或被去除；第44位的Xaa是Gly，Pro，Glu，Asp，或Lys，或被去除；并且第45位的Xaa是Ala，Ser，Val，Glu，Asp，或Lys，或被去除；前提是当第37，38，39，40，41，42，43或44位的氨基酸被去除时，该氨基酸下游的每个氨基酸也被去除。
5.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式II[SEQ ID NO3]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Xaa-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Ala-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-Xaa式 II(SEQ ID NO3)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第9位的Xaa是Thr，Ser，Arg，Lys，Trp，Phe，Tyr，Glu，或His；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Tyr，Glu，或Ala；第18位的Xaa是His，Pro，Asp，Glu，Arg，Ser，Ala，或Lys；第19位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，Gln，或Arg；第24位的Xaa是Glu，Ar g，Ala，或Lys；第26位的Xaa是Trp，Tyr，Phe，Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第31位的Xaa是Asp，Glu，Ser，Thr，Arg，Trp，或Lys；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Thr，Ser，Asp，Trp，Tyr，Phe，Arg，Glu，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
6.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式III[SEQ ID NO4]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Ala-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Ala-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-Xaa式 III(SEQ ID NO4)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Glu，His，Ala，或Lys；第25位的Xaa是Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Arg，Glu，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
7.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式IV[SEQ ID NO5]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Ala-Ala-Xaa-Glu-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Xaa-Arg-Xaa式 IV(SEQ ID NO5)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第26位的Xaa是Asp，Lys，Glu，或His；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，-NH2，Gly，Gly-Pro，或Gly-Pro-NH2，或被去除。
8.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式V[SEQ ID NO6]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Ala-Ala-Lys-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Gly-Arg-Xaa式 V(SEQ ID NO6)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
9.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式VIII[SEQ ID NO11]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Glu-Xaa-Xaa-Ala-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Xaa-Xaa-Gly-Xaa-Xaa式 VIII(SEQ ID NO11)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，或Val；第16位的Xaa是Leu或Val；第18位的Xaa是Lys或Ser；第19位的Xaa是Gln或Tyr；第20位的Xaa是Met或Leu；第22位的Xaa是Glu或Gln；第23位的Xaa是Glu，或Gln；第25位的Xaa是Val或Ala；第26位的Xaa是Arg或Lys；第27位的Xaa是Leu或Glu；第30位的Xaa是Glu或Ala；第33位的Xaa是Val或Lys；第34位的Xaa是Asn或Lys；第36位的Xaa是Gly或Arg；并且第37位的Xaa是Gly，Pro，Pro-Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser，或不存在。
10.权利要求1-9的任意一项的异源融合蛋白，其中GLP-1化合物具有不超过6个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
11.权利要求10的异源融合蛋白，其中GLP-1化合物具有不超过5个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
12.权利要求11的异源融合蛋白，其中GLP-1化合物具有不超过4个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
13.权利要求12的异源融合蛋白，其中GLP-1化合物具有不超过3个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
14.权利要求13的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
15.权利要求1-14的任意一项的异源融合蛋白，其中第8位的Xaa是甘氨酸或缬氨酸。
16.权利要求8的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸或缬氨酸，并且第30位的Xaa是丙氨酸，谷氨酸，天冬氨酸，丝氨酸，或组氨酸。
17.权利要求16的异源融合蛋白，其中第30位的Xaa是谷氨酸。
18.权利要求8的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸或缬氨酸，并且第37位的Xaa是组氨酸，苯丙氨酸，酪氨酸，色氨酸，天冬氨酸，谷氨酸，丝氨酸，苏氨酸，精氨酸，或赖氨酸。
19.权利要求18的异源融合蛋白，其中第37位的Xaa是组氨酸。
20.权利要求8的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸，并且第22位的Xaa是天冬氨酸，谷氨酸，赖氨酸，精氨酸，天冬酰胺，谷氨酰胺或组氨酸。
21.权利要求20的异源融合蛋白，其中第22位的Xaa是赖氨酸或谷氨酸。
22.权利要求8的异源融合蛋白，其中GLP-1化合物是Val8-GLP-1(7-37)。
23.权利要求8的异源融合蛋白，其中GLP-1化合物是Gly8-GLP-1(7-37)。
24.权利要求1-23的任意一项的异源融合蛋白，其中第二个多肽是人白蛋白。
25.权利要求24的异源融合蛋白，其中第二个多肽具有SEQ ID NO34的序列。
26.权利要求1-23的任意一项的异源融合蛋白，其中第二个多肽是白蛋白的N末端片段。
27.一种异源融合蛋白，包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)免疫球蛋白的Fc部分；b)免疫球蛋白的Fc部分的类似物；和c)免疫球蛋白的Fc部分的片段，并且其中第一个多肽的C末端与第二个多肽的N末端融合。
28.一种异源融合蛋白，包含第一个多肽，该多肽具有N末端和与具有N末端和C末端的第二个多肽融合的C末端，其中第一个多肽是GLP-1化合物，并且第二个多肽选自a)免疫球蛋白的Fc部分；b)免疫球蛋白的Fc部分的类似物；和c)免疫球蛋白的Fc部分的片段，并且其中第一个多肽的C末端通过肽接头与第二个多肽的N末端融合。
29.权利要求28的异源融合蛋白，其中肽接头选自a)富含甘氨酸的肽；b)具有序列[Gly-Gly-Gly-Gly-Ser]n的肽，其中n是1，2，3，4，5或6；和c)具有序列[Gly-Gly-Gly-Gly-Ser]3的肽。
30.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式I[SEQ ID NO2]的序列7 8 9 10 11 12 13 14 15 16 17His-Xaa-Xaa-Gly-Xaa-Phe-Thr-Xaa-Asp-Xaa-Xaa-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37 38 39Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-40 41 42 43 44 45Xaa-Xaa-Xaa-Xaa-Xaa-Xaa式 I(SEQ ID NO2)其中第8位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第9位的Xaa是Glu，Asp，或Lys；第11位的Xaa是Thr，Ala，Gly，Ser，Leu，Ile，Val，Glu，Asp，或Lys；第14位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第16位的Xaa是Val，Ala，Gly，Ser，Thr，Leu，Ile，Tyr，Glu，Asp，Trp，或Lys；第17位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第18位的Xaa是Ser，Ala，Gly，Thr，Leu，Ile，Val，Glu，Asp，Trp，Tyr，或Lys；第19位的Xaa是Tyr，Phe，Trp，Glu，Asp，Gln，或Lys；第20位的Xaa是Leu，Ala，Gly，Ser，Thr，Ile，Val，Glu，Asp，Met，Trp，Tyr，或Lys；第21位的Xaa是Glu，Asp，或Lys；第22位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第23位的Xaa是Gln，Asn，Arg，Glu，Asp，或Lys；第24位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Arg，Glu，Asp，或Lys；第25位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第26位的Xaa是Lys，Arg，Gln，Glu，Asp，或His；第27位的Xaa是Leu，Glu，Asp，或Lys；第30位的Xaa是Ala，Gly，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第31位的Xaa是Trp，Phe，Tyr，Glu，Asp，或Lys；第32位的Xaa是Leu，Gly，Ala，Ser，Thr，Ile，Val，Glu，Asp，或Lys；第33位的Xaa是Val，Gly，Ala，Ser，Thr，Leu，Ile，Glu，Asp，或Lys；第34位的Xaa是Asn，Lys，Arg，Glu，Asp，或His；第35位的Xaa是Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys；第36位的Xaa是Gly，Arg，Lys，Glu，Asp，或His；第37位的Xaa是Pro，Gly，Ala，Ser，Thr，Leu，Ile，Val，Glu，Asp，或Lys，或被去除；第38位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第39位的Xaa是Ser，Arg，Lys，Glu，Asp，或His，或被去除；第40位的Xaa是Gly，Asp，Glu，或Lys，或被去除；第41位的Xaa是Ala，Phe，Trp，Tyr，Glu，Asp，或Lys，或被去除；第42位的Xaa是Ser，Pro，Lys，Glu，或Asp，或被去除；第43位的Xaa是Ser，Pro，Glu，Asp，或Lys，或被去除；第44位的Xaa是Gly，Pro，Glu，Asp，或Lys，或被去除；并且第45位的Xaa是Ala，Ser，Val，Glu，Asp，或Lys，或被去除；前提是当第37，38，39，40，41，42，43或44位的氨基酸被去除时，该氨基酸下游的每个氨基酸也被去除。
31.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式II[SEQ ID NO3]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Xaa-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Ala-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-Xaa式 II(SEQ ID NO3)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第9位的Xaa是Thr，Ser，Arg，Lys，Trp，Phe，Tyr，Glu，或His；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Tyr，Glu，或Ala；第18位的Xaa是His，Pro，Asp，Glu，Arg，Ser，Ala，或Lys；第19位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，Gln，或Arg；第24位的Xaa是Glu，Arg，Ala，或Lys；第26位的Xaa是Trp，Tyr，Phe，Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第31位的Xaa是Asp，Glu，Ser，Thr，Arg，Trp，或Lys；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Thr，Ser，Asp，Trp，Tyr，Phe，Arg，Glu，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
32.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式III[SEQ ID NO4]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Xaa-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Xaa-Ala-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Ala-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-R式 III(SEQ ID NO4)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第11位的Xaa是Asp，Glu，Arg，Thr，Ala，Lys，或His；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Glu，His，Ala，或Lys；第25位的Xaa是Asp，Lys，Glu，或His；第27位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第33位的Xaa是Asp，Arg，Val，Lys，Ala，Gly，或Glu；第34位的Xaa是Glu，Lys，或Asp；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第36位的Xaa是Arg，Glu，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
33.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式IV[SEQ ID NO5]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Xaa-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Ala-Ala-Xaa-Glu-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Xaa-Arg-Xaa式 IV(SEQ ID NO5)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第12位的Xaa是His，Trp，Phe，或Tyr；第16位的Xaa是Leu，Ser，Thr，Trp，His，Phe，Asp，Val，Glu，或Ala；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第26位的Xaa是Asp，Lys，Glu，或His；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第35位的Xaa是Thr，Ser，Lys，Arg，Trp，Tyr，Phe，Asp，Gly，Pro，His，或Glu；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，-NH2，Gly，Gly-Pro，或Gly-Pro-NH2，或被去除。
34.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式V[SEQ ID NO6]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-18 19 20 21 22 23 24 25 26 27 28Ser-Tyr-Leu-Glu-Xaa-Xaa-Ala-Ala-Lys-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Val-Lys-Gly-Arg-Xaa式 V(SEQ ID NO6)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，Val，Leu，Ile，Ser，或Thr；第22位的Xaa是Gly，Asp，Glu，Gln，Asn，Lys，Arg，或Cys；第23位的Xaa是His，Asp，Lys，Glu，或Gln；第24位的Xaa是Ala，Glu，His，Phe，Tyr，Trp，Arg，或Lys；第30位的Xaa是Ala，Glu，Asp，Ser，或His；第37位的Xaa是Lys，Arg，Thr，Ser，Glu，Asp，Trp，Tyr，Phe，His，Gly，Gly-Pro，或被去除。
35.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式VIII[SEQ ID NO11]的序列7 8 9 10 11 12 13 14 15 16 17Xaa-Xaa-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Xaa-Ser-18 19 20 21 22 23 24 25 26 27 28Xaa-Xaa-Xaa-Glu-Xaa-Xaa-Ala-Xaa-Xaa-Xaa-Phe-29 30 31 32 33 34 35 36 37Ile-Xaa-Trp-Leu-Xaa-Xaa-Gly-Xaa-R式 VIII(SEQ ID NO11)其中第7位的Xaa是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸或α-甲基-组氨酸；第8位的Xaa是Gly，Ala，或Val；第16位的Xaa是Leu或Val；第18位的Xaa是Lys或Ser；第19位的Xaa是Gln或Tyr；第20位的Xaa是Met或Leu；第22位的Xaa是Glu或Gln；第23位的Xaa是Glu，或Gln；第25位的Xaa是Val或Ala；第26位的Xaa是Arg或Lys；第27位的Xaa是Leu或Glu；第30位的Xaa是Glu或Ala；第33位的Xaa是Val或Lys；第34位的Xaa是Asn或Lys；第36位的Xaa是Gly或Arg；并且第37位的Xaa是Gly，Pro，Pro-Ser-Ser-Gly-Ala-Pro-Pro-Pro-Ser，或不存在。
36.权利要求27-35的任意一项的异源融合蛋白，其中GLP-1化合物具有不超过6个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
37.权利要求36的异源融合蛋白，其中GLP-1化合物具有不超过5个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
38.权利要求37的异源融合蛋白，其中GLP-1化合物具有不超过4个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
39.权利要求38的异源融合蛋白，其中GLP-1化合物具有不超过3个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
40.权利要求39的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH，GLP-1(7-36)OH或Exendin-4中的相应氨基酸的氨基酸。
41.权利要求27-40的任意一项的异源融合蛋白，其中第8位的Xaa是甘氨酸或缬氨酸。
42.权利要求34的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸或缬氨酸，并且第30位的Xaa是丙氨酸，谷氨酸，天冬氨酸，丝氨酸，或组氨酸。
43.权利要求42的异源融合蛋白，其中第30位的Xaa是谷氨酸。
44.权利要求34的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸或缬氨酸，并且第37位的Xaa是组氨酸，苯丙氨酸，酪氨酸，色氨酸，天冬氨酸，谷氨酸，丝氨酸，苏氨酸，精氨酸，或赖氨酸。
45.权利要求44的异源融合蛋白，其中第37位的Xaa是组氨酸。
46.权利要求34的异源融合蛋白，其中GLP-1化合物具有不超过2个不同于GLP-1(7-37)OH或GLP-1(7-36)OH中的相应氨基酸的氨基酸，并且第8位的Xaa是甘氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，苏氨酸，或甲硫氨酸，并且第22位的Xaa是天冬氨酸，谷氨酸，赖氨酸，精氨酸，天冬酰胺，谷氨酰胺或组氨酸。
47.权利要求46的异源融合蛋白，其中第22位的Xaa是赖氨酸或谷氨酸。
48.权利要求34的异源融合蛋白，其中GLP-1化合物是Val8-GLP-1(7-37)。
49.权利要求34的异源融合蛋白，其中GLP-1化合物是Gly8-GLP-1(7-37)。
50.权利要求27-49的任意一项的异源融合蛋白，其中第二个多肽是选自IgG1，IgG2，IgG3，IgG4，IgE，IgA，IgD，或IgM的Ig的Fc部分。
51.权利要求27-50的任意一项的异源融合蛋白，其中第二个多肽是选自IgG1，IgG2，IgG3和IgG4的Ig的Fc部分。
52.权利要求51的异源融合蛋白，其中第二个多肽是IgG1免疫球蛋白的Fc部分。
53.权利要求51的异源融合蛋白，其中第二个多肽是IgG4免疫球蛋白的Fc部分。
54.权利要求50-53的任意一项的异源融合蛋白，其中IgG是人IgG。
55.权利要求27-54的任意一项的异源融合蛋白，其中Fc部分包括铰链区，CH2，和CH3结构域。
56.权利要求52的异源融合蛋白，其中第二个多肽具有SEQ ID NO32的序列。
57.编码权利要求1-56的任意一项的异源融合蛋白的多核苷酸。
58.包含权利要求57的多核苷酸的载体。
59.包含权利要求58的载体的宿主细胞。
60.表达至少一种权利要求1-56的任意一项的异源融合蛋白的宿主细胞。
61.权利要求60的宿主细胞，其中所述宿主细胞是CHO细胞。
62.一种产生异源融合蛋白的方法，包括在以可检测量表达异源融合蛋白的条件下转录和翻译权利要求57的多核苷酸的步骤。
63.一种使有需要的哺乳动物中的血糖水平正常化的方法，包括给予治疗有效量的权利要求1-56的任意一项的异源融合蛋白。
64.一种治疗非胰岛素依赖型糖尿病患者的方法，包括给予治疗有效量的权利要求1-56的任意一项的异源融合蛋白。
65.一种治疗肥胖的方法，包括给予治疗有效量的权利要求1-56的任意一项的异源融合蛋白。
66.权利要求1-56的任意一项的异源融合蛋白在制备用于治疗非胰岛素依赖型糖尿病患者的药物中的用途。
67.权利要求1-56的任意一项的异源融合蛋白在制备用于治疗肥胖患者的药物中的用途。
68.一种适用于治疗非胰岛素依赖型糖尿病患者的药物制剂，包含权利要求1-56的任意一项的异源融合蛋白。
69.权利要求1、2或3的异源融合蛋白，其中GLP-1化合物包含式IX[SEQ ID NO12]的序列Xaa7-Xaa8-Glu-Gly-Thr-Xaa12-Thr-Ser-Asp-Xaa16-Ser-Xaa18-Xaa19-Xaa20-Glu-Xaa22-Gln-Ala-Xaa25-Lys-Xaa27-Phe-Ile-Xaa30-Trp-Leu-Xaa33-Lys-Gly-Arg-Xaa37式 IX(SEQ ID NO12)其中Xaa7是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸，或α-甲基-组氨酸；Xaa8是Ala，Gly，Val，Leu，Ile，Ser，或Thr；Xaa12是Phe，Trp，或Tyr；Xaa16是Val，Trp，Ile，Leu，Phe，或Tyr；Xaa18是Ser，Trp，Tyr，Phe，Lys，Ile，Leu，Val；Xaa19是Tyr，Trp，或Phe；Xaa20是Leu，Phe，Tyr，或Trp；Xaa22是Gly，Glu，Asp，或Lys；Xaa25是Ala，Val，Ile，或Leu；Xaa27是Glu，Ile，或Ala；Xaa30是Ala或Glu；Xaa33是Val，或Ile；并且Xaa37是Gly，His，NH2，或不存在。
70.权利要求69的异源融合蛋白，其中其中第二个多肽是人白蛋白。
71.权利要求70的异源融合蛋白，其中第二个多肽具有SEQ ID NO34的序列。
72.权利要求69的异源融合蛋白，其中第二个多肽是白蛋白的N末端片段。
73.权利要求27、28或29的异源融合蛋白，其中GLP-1化合物包含式IX[SEQ ID NO12]的序列Xaa7-Xaa8-Glu-Gly-Thr-Xaa12-Thr-Ser-Asp-Xaa16-Ser-Xaa18-Xaa19-Xaa20-Glu-Xaa22-Gln-Ala-Xaa25-Lys-Xaa27-Phe-Ile-Xaa30-Trp-Leu-Xaa33-Lys-Gly-Arg-Xaa37式 IX(SEQ ID NO12)其中Xaa7是L-组氨酸，D-组氨酸，脱氨基-组氨酸，2-氨基-组氨酸，β-羟基-组氨酸，高组氨酸，α-氟甲基-组氨酸，或α-甲基-组氨酸；Xaa8是Ala，Gly，Val，Leu，Ile，Ser，或Thr；Xaa12是Phe，Trp，或Tyr；Xaa16是Val，Trp，Ile，Leu，Phe，或Tyr；Xaa18是Ser，Trp，Tyr，Phe，Lys，Ile，Leu，Val；Xaa19是Tyr，Trp，或Phe；Xaa20是Leu，Phe，Tyr，或Trp；Xaa22是Gly，Glu，Asp，或Lys；Xaa25是Ala，Val，Ile，或Leu；Xaa27是Glu，Ile，或Ala；Xaa30是Ala或Glu；Xaa33是Val，或Ile；并且Xaa37是Gly，His，NH2，或不存在。
74.权利要求73的异源融合蛋白，其中第二个多肽是选自IgG1，IgG2，IgG3，IgG4，IgE，IgA，IgD，或IgM的Ig的Fc部分。
75.权利要求73或74的异源融合蛋白，其中第二个多肽是选自IgG1，IgG2，IgG3和IgG4的Ig的Fc部分。
76.权利要求75的异源融合蛋白，其中第二个多肽是IgG1免疫球蛋白的Fc部分。
77.权利要求75的异源融合蛋白，其中第二个多肽是IgG4免疫球蛋白的Fc部分。
78.权利要求73的异源融合蛋白，其中IgG是人IgG。
79.权利要求75的异源融合蛋白，其中第二个多肽具有SEQ ID NO32的序列。
80.权利要求69-79的任意一项的异源融合蛋白，其中GLP-1化合物选自Gly8-GLP-1(7-37)，Val8-Tyr12-GLP-1(7-37)，Val8-Tyr12-GLP-1(7-36)，Val8-Trp12-GLP-1(7-37)，Val8-Leu16-GLP-1(7-37)，Val8-Val16-GLP-1(7-37)，Val8-Tyr16-GLP-1(7-37)，Gly8-Glu22-GLP-1(7-37)，Val8-Glu22-GLP-1(7-37)，Val8-Leu25-GLP-1(7-37)，Val8-Tyr12-Tyr16-GLP-l(7-37)，Val8-Trp12-Glu22-GLP-1(7-37)，Val8-Tyr12-Glu22-GLP-1(7-37)，Val8-Tyr16-Phe19-GLP-1(7-37)，Val8-Tyr16-Glu22-GLP-1(7-37)，Val8-Trp16-Glu22-GLP-1(7-37)，Val8-Leu16-Glu22-GLP-1(7-37)，Val8-Ile16-Glu22-GLP-1(7-37)，Val8-Phe16-Glu22-GLP-1(7-37)，Val8-Trp18-Glu22-GLP-1(7-37)，Val8-Tyr18-Glu22-GLP-1(7-37)，Val8-Phe18-Glu22-GLP-1(7-37)，Val8-Ile18-Glu22-GLP-1(7-37)，Val8-Lys18-Glu22-GLP-1(7-37)，Val8-Trp19-Glu22-GLP-1(7-37)，Val8-Phe19-Glu22-GLP-1(7-37)，Val8-Phe20-Glu22-GLP-1(7-37)，Val8-Glu22-Leu25-GLP-1(7-37)，Val8-Glu22-Ile25-GLP-1(7-37)，Val8-Glu22-Val25-GLP-1(7-37)，Val8-Glu22-Ile27-GLP-1(7-37)，Val8-Glu22-Ala27-GLP-1(7-37)，Val8-Glu22-Ile33-GLP-1(7-37)，Val8-Asp9-Ile11-Tyr16-Glu22-GLP-1(7-37)，Val8-Tyr16-Trp19-Glu22-GLP-1(7-37)，Val8-Trp16-Glu22-Val25-Ile33-GLP-1(7-37)，Val8-Trpp16-Glu22-Ile33-GLP-1(7-37)，Val8-Glu22-Val25-Ile33-GLP-1(7-37)，Val8-Trp16-Glu22-Val25-GLP-1(7-37)，和Val8-Cys16-Lys26-GLP-1(7-37)。
全文摘要
本发明涉及与一些蛋白融合的胰高血糖素样－1化合物，所述蛋白具有延长胰高血糖素样－1化合物的体内半衰期的作用。这些融合蛋白可以用于治疗非胰岛素依赖型糖尿病和各种状况。
文档编号C12N15/62GK1483041SQ01820232
公开日2004年3月17日申请日期2001年11月29日优先权日2000年12月7日
发明者W·格莱斯纳, R·米卡诺维克, 张盛虹, W 格莱斯纳, ㄅ滴申请人:伊莱利利公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：W.格莱斯纳;R.米卡诺维克;张盛虹
技术所有人：伊莱利利公司
我是此专利的发明人

上一篇：蔗糖合成酶的基因表达在植物组织中的修饰及其用途的制作方法
上一篇：巧克力的涂层方法和涂层装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。