大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用的制作方法

文档序号：3563039阅读：465来源：国知局

专利名称：大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用的制作方法
技术领域：
本发明属于重组蛋白质表达领域。特别是，本发明涉及分泌融合配偶体和筛选合适的分泌融合配偶体(SFP)的技术。本发明公开了用于实现高水平分泌目标多肽的最佳 SFP。本发明的SFP可诱导超量分泌制备重组蛋白质。
背景技术：
目标蛋白质的重组表达是广泛用来生产大量用于研究目的或治疗和其它商业用途的蛋白质的方法。本领域已知有多种重组表达系统，包括细菌、酵母和哺乳动物宿主细胞系统，并且许多不同蛋白质已在这些系统中成功生产。然而，使用现有表达系统还有许多蛋白质很难生产，导致很少或没有蛋白质表达和分泌。提高重组表达蛋白质分泌的方法，例如过量表达分子伴侣和折叠酶(Hackel等人，Pharm Res 23 :790(2006) ；Poewer和Robinson， Biotechnol Prog 23 :364(2007) ；Shusta 等人，Nat Biotechnol 16 :773 (1998))、过量表达与分泌途径相关的基因((Carla Fama 等人，Biochim Biophys Acta 1773 :232(2007)； Wentz 和 Shusta 等人，Appl Environ Microbiol 73 1189 (1998))、对前导序列进行操作(Clements 等人，Gene 106 :267(1991) ；Kjaerulff 禾口 Jensen，Biochem Biophys Res Commun 336 :974(2005) ；Sagiya 等人，Microbiol. Biotechnol 42:358(1994) ；Li 等人， Bitechnol Prog 18 =831(2002))已在特定的目标蛋白上取得一定成功。提高蛋白质生产能力的另一种方法是将目标蛋白连接到融合配偶体上。作为融合配偶体使用的分泌蛋白包括人血清白蛋白(Kang等人，Protein Expr Purif 53: 331 (2007) ；Huang 等人，J. Pept. Sci 14 :588 (2008))、α -乳白蛋白(W01995027782A1)、红素氧还蛋白(W02000039310A1)、人胰高血糖素(W02000053777A1)、八目鳗抗菌肽相关肽(W02005019242A2)、磷酸核酮糖激酶(US6500647B1)、蛋白质二硫键异构酶(Kajino等入，Appl Environ Microbiol 66 638 (2000) > ^ ^ it ^ A ^ S (Moreno ^A, Protein Expr Purif 18 :242 QOOO)、Hspl50 蛋白(Sievi 等人，Biotechnol. Prog. 19:1368(2003)、纤维素结合域(Ahn 等人，Appl Microbiol Biotechnol. 64 :833 (2004))和金结合肽 (US20050106625A1)已在特定的目标蛋白上取得一定成功。为了鉴定分泌蛋白和新信号序列，已开发了数个信号序列捕获系统。美国专利 No. 6，228，590描述了一种筛选哺乳动物信号序列的技术，其使用含有哺乳动物编码序列且与报告蛋白融合的核酸转化报告蛋白缺乏的酵母，并检测分泌报告蛋白的细胞。一种使用缺乏转化酶的酵母和转化酶报告蛋白的类似系统公开于欧洲专利EP0907727中。基于酵母的信号序列捕获已用于鉴定来自人DNA (Klein等人，Proc. Natl. Acad. Sci. USA 93: 7108(1996) Jacobs 等人，Gene 198 :289 (1997))、鼠 DNA (Gallicioti 等人，J. Membrane Biol. 183 :175(2001)),斑马鱼 DNA (Crosier 等人，Dev. Dynamics 222 :637(2001)),拟南芥 DNA(Goo 等人，Plant Mol. Biol. 41 :415 (1999))、马铃薯 DNA(Surpili 等人，Anais de Academia Brasileira de Ciencias 74 :599 Q002))和白色念珠菌 DNA (Monteoliva等人，Eukaryotic Cell 1 :514Q002))的分泌蛋白。已开发了使用哺乳动物宿主细胞 (Gallicioti 等人，J. Membrane Biol. 183 :175(2001))和细菌宿主细胞(Ferguson 等人， Cancer Res. 65 :8209 Q000)的类似捕获系统。已用于信号序列捕获的报告蛋白包括转化酶(Klein 等人，Proc. Natl. AcacUci. USA 93:7108(1996))、α-淀粉酶(U. S. Patent No. 6，2 , 590)、酸性磷酸酯酶(PH05) (Surpili 等人，Anais de Academia Brasileira de Ciencias 74 :599 (2002))和 β -内酰胺酶(Ferguson 等人，Cancer Res. 65 :8209 (2000))。鉴定对目标蛋白分泌有用的翻译融合配偶体(TFPs)的方法公开于WO 2005/068658中。该方法包含(i)制备多个宿主细胞，所述的宿主细胞用包含核酸片段的文库和与编码报告蛋白的核苷酸序列融合的编码目标蛋白的核苷酸序列的多种载体进行转化；其中所述的宿主细胞缺乏报告蛋白；和(ii)从宿主细胞中鉴定出TFP文库，其中该 TFP文库包含单独诱导目标蛋白分泌的核酸片段。在酵母中分泌制备极少分泌型蛋白的翻译融合配偶体(TFP)技术描述于WO 2007/015178。在从酵母基因组中筛选TFP的过程中，发现了 YGR106C (Voalp)基因。目前鉴定出 Voalp 蛋白在 ER膜上的细胞定位(Ryan 等人，Mol. Biol. Cell，Epub ahead of print, Sep 17, 2008) 0 Voalp被认为是5个用于液泡ATP酶的VO装配因子中的一个。因此本领域仍亟需能提高蛋白表达的其它序列，以及鉴定这些序列的方法。

发明内容
技术问题本发明涉及使用分泌融合配偶体(SFP)超量分泌制备和有效纯化各种重组蛋白质，所述的分泌融合配偶体可通过分泌蛋白质组分析获得。重组蛋白质以含有分泌融合配偶体的融合体形式在胞外制备，并且可通过体外蛋白酶处理从SFP上分离出来。本发明所述SFP极大地提高了目标蛋白的分泌水平并改良了对生物制药和生物产业有价值的多肽。还描述了选择/筛选SFP的方法。尽管可以确定甚至可以预测是否分泌出特定的蛋白质，但不可能预测出分泌的蛋白质是否具有SFP的功能。本发明的选择/筛选方法使得可能选择出具有SFP功能的蛋白质和该蛋白质的片段或衍生物。用本发明的选择/筛选方法选择出的SFP提高了可用于生物制药和生物产业的蛋白质的重组制备。本发明还包括鉴定出的 SFP及其片段和衍生物。技术方案因此，本发明的一个目的在于提供鉴定分泌融合配偶体(SFP)的方法，所述的方法包括(i)用可操作地连接有异源启动子的编码分泌多肽的多核苷酸转化第一宿主细胞；(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述的第一宿主细胞是否过量分泌所述的分泌多肽；(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞，其中，所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；(iv)在培养条件下培养所述的第二宿主细胞，其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽；和(ν)确定所述的融合多肽是否分泌到培养基中；从而鉴定所述的过量分泌多肽是否为SFP。本发明的另一个目的在于提供一种分离的融合多肽，其包括(i)上述的SFP或其片段或衍生物；和(ii)目标多肽。本发明另一个目的还在于提供一种分离的融合多肽，其包括⑴包括含有SEQ ID NO 1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物，其中所述SFP没有跨膜结构域(TM)；和(ii)目标多肽。本发明另一个目的还在于提供一种构建体，其包括⑴启动子；(ii)编码SEQ ID NO :1的176-213位的氨基酸或其片段或衍生物的第一多核苷酸，其中所述SFP无跨膜结构域(TM)；和(iii)编码目标多肽或其衍生物的第二多核苷酸。本发明的另一个目的还在于提供一种包含上述构建体的宿主细胞。本发明的另一个目的还在于提供一种重组制备目标多肽的方法，其包括(i)用编码SFP的多核苷酸和编码目标多肽的多核苷酸转化宿主细胞；(ii)在培养条件下培养所述的宿主细胞，其中从所述的宿主细胞中制备并分泌出包含融合到所述目标多肽的所述 SFP的融合多肽；和(iii)分离所述的融合多肽。本发明的另一个目的还在于提供一种用上述方法重组制备的目标多肽。

从下述的详细说明并结合所附的附图，将更加清楚地理解本发明上述及其它目的、特征和优点。图1所示为(A)预测的氨基酸序列和SFPl蛋白的结构域；(B)表达连续缺失的 SFPl基因的载体示意图；(C) SDS-PAGE分析SFPl蛋白的相对表达水平。10% Tris-Tricine SDS-PAGE分析用0. 4mL丙酮浓缩的0. 6mL的肉汤培养物。泳道1 用YGaT91载体转化的观05株的培养物；2 用YGaT92载体转化的观05株的培养物；3 用YGaT93载体转化的观05 株的肉汤培养物；4 用YGaT94载体转化的观05株的肉汤培养物；5 用YGaT95载体转化的观05株的肉汤培养物；6 用YGaT96载体转化的观05株的肉汤培养物；7 用YGaT97载体转化的观05株的肉汤培养物；泳道M 预染色的蛋白质大小标记(Invitrogen)。图2所示为㈧表达SFP1-IL2融合蛋白的载体示意图；(B) SDS-PAGE分析 SFP1-IL2融合蛋白表达水平。IO^Tris-iTricine SDS-PAGE分析用0. 4mL丙酮浓缩的 0. 6mL的肉汤培养物。泳道1 用YGaT92-IL2载体转化的观05株的肉汤培养物；泳道2 用 YGaT93-IL2载体转化的观05株的肉汤培养物；泳道3 用YGaT94_IL2载体转化的观05株的肉汤培养物；泳道M 预染色的蛋白质大小标记(Invitrogen)图3为含有YGaT92_E)(D4的重组酵母株分批补料发酵的曲线图和根据发酵时间 SDS-PAGE分析分泌到培养基中的蛋白质的结果。图4所示为SDS-PAGE分析用不同浓度的肠激酶(Invitrogen，USA)消化纯化后的SFPl-EaM融合蛋白的结果。泳道1 纯化后的SFPl-EaM融合蛋白；泳道2 用0. 1 μ 1 肠激酶37°C消化1小时后纯化的SFPl-EHM融合蛋白；泳道3 用0. 2 μ 1肠激酶37°C消化1小时后纯化的SFPl-EaM融合蛋白；泳道4 用0. 3 μ 1肠激酶37°C消1小时后化纯化的 SFPl-EHM融合蛋白；泳道M 预染色的蛋白质大小标记(Invitrogen)。图5所示为(A) HPLC分析肠激酶消化的SFP1_E)(D4融合蛋白；(B) SDS-PAGE分析 HPLC片段。凝胶上的数字表述HPLC片段的编号。图6所示为MALDI-T0F分析纯化的EXD4蛋白。图7所示为㈧表达SFPl突变体-E)(D4融合蛋白的载体示意图；(B)SDS-PAGE分析SFPl突变体-EXD4融合蛋白表达水平。IO^iTris-Tricine SDS-PAGE分析用0. 4mL丙酮浓缩的0. 6mL的肉汤培养物。泳道1 用YGaT92-E)(D4载体转化的观05株的肉汤培养物；泳道2 用YGaT921-E)(D4载体转化的洲05株的肉汤培养物；泳道3 用YGaT922_E)(D4载体转化的观05株的肉汤培养物；泳道4 用YGaT923-E)(D4载体转化的观05株的肉汤培养物；泳道M 预染色的蛋白质大小标记(Invitrogen)。图8所示为含有YGaMKH-EHM的重组酵母株在指定发酵时间的分批补料发酵的 SDS-PAGE 分析。图9为含有YGaST6-E)(D4-HL的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。图10所示为含有YGaMKH-EGF的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。图11所示为(A)HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析和⑶用肠激酶消化后的HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析。图12为含有YGaMKH-PTH的重组酵母株分批补料发酵的曲线图和根据发酵时间 SDS-PAGE分析分泌到培养基中的蛋白质的结果。图13所示为SDS-PAGE分析用分泌形式的重组子Kex2p (JH Sohn, KRIBB)和肠激酶anvitrogen，USA)消化后纯化的HL-PTH融合蛋白。泳道1 纯化后的HL-PTH融合蛋白；泳道2 用Kex2p于37°C消化1小时后纯化的HL-PTH融合蛋白；泳道3 用肠激酶37°C消化1小时后纯化的HL-PTH融合蛋白；泳道M 预染色的蛋白质大小标记(Invitrogen)。图14所示为(A)2805株的生长曲线，箭头所指是取样点；(B)样品细胞经荧光染料hochest染色后的共焦激光扫描显微镜结果。图15所示为样品M2的双向凝胶电泳结果。图16所示为Ι-DE/MudPIT的SDS-PAGE分析1-DE/MudPIT (多维蛋白质鉴定技术， Multidimensional Protein Identification Technology)。图17所示为(A)表达19个选自分泌蛋白质组分析的基因的Y2805转化株培养物上清液的SDS-PAGE分析。10% Tris-Tricine SDS-PAGE分析用0. 4mL丙酮浓缩的0. 6mL的肉汤培养物。泳道1 过量表达BGL2基因的观05株的肉汤培养物；泳道2 过量表达CIS3 基因的观05株的肉汤培养物；泳道3 过量表达CRHl基因的观05株的肉汤培养物；泳道4 过量表达CWPl基因的观05株的肉汤培养物；泳道5 过量表达DSE4基因的观05株的肉汤培养物；泳道7 过量表达EGT2基因的观05株的肉汤培养物；泳道8 过量表达EXGl基因的观05株的肉汤培养物；泳道9 过量表达GASl基因的观05株的肉汤培养物；泳道10 过量表达GAS3基因的观05株的肉汤培养物；泳道11 过量表达GAS5基因的观05株的肉汤培养物；泳道12 过量表达PSTl基因的观05株的肉汤培养物；泳道13 过量表达SCW4基因的观05株的肉汤培养物；泳道15 过量表达SIMl基因的观05株的肉汤培养物；泳道16 过量表达TOSl基因的观05株的肉汤培养物；泳道17 过量表达UTHl基因的观05株的肉汤培养物；泳道18 过量表达YGPl基因的观05株的肉汤培养物；泳道19 过量表达YPSl 基因的观05株的肉汤培养物；泳道20 过量表达ZPSl基因的观05株的肉汤培养物；泳道 M 预染色的蛋白质大小标记(Invitrogen)。SDS-PAGE分析用Endo-H处理后的培养物上清液⑶。图18所示为SDS-PAGE分析表达出分别与E)(D4融合的11个基因的Y2805转化株培养物上清液。10% Tris-Tricine SDS-PAGE分析用0. 4mL丙酮浓缩的0. 6mL的肉汤培养物。泳道1 过量表达BGL2-E)(D4基因的观05株的肉汤培养物；泳道2 过量表达GAS3_E)(D4 基因的观05株的肉汤培养物；泳道3 过量表达GAS5-E)(D4基因的观05株的肉汤培养物；泳道4 过量表达PSTl-EHM基因的观05株的肉汤培养物；泳道5 过量表达SCW4_E)(D4基因的观05株的肉汤培养物；泳道6 过量表达SCWlO-EaM基因的观05株的肉汤培养物；泳道7 过量表达SIMl-EHM基因的观05株的肉汤培养物；泳道8 过量表达UTHl-EaM基因的观05株的肉汤培养物；泳道9 过量表达YGPl-EHM基因的观05株的肉汤培养物；泳道 10 过量表达YPSl-EaM基因的观05株的肉汤培养物；泳道11 过量表达ZPSl-EaM基因的观05株的肉汤培养物；泳道M 预染色的蛋白质大小标记(Invitrogen)。图19所示为(A)Kyte-Doolittle亲水性分析和SCW4和E)(D4融合体的缺失片段的示意图；(B) SDS-PAGE分析含有逐渐缺失的SCW4-E)(D4融合片段的各个转化体培养物上清液。图20所示为分析分别含有Y(ia-SCW4-l-E)(D4和Y(ia-SCW4-3-E)(D4的重组酵母株 2805在分批补料发酵过程中分泌到培养液中的蛋白质的SDS-PAGE结果。图21所示为分析用肠激酶处理前后分泌的融合蛋白、SCW4-1_E)(D4和 SCW4-3-EXD4 的 SDS-PAGE 结果。图22所示为(A)分泌到培养基中的SCW4-hGH的SDS-PAGE结果，肉汤培养IOyL 含有各自载体的细胞；(B)用肠激酶处理前后的样品。图23所示为根据发酵时间，分析含有YGa-SCW4-2_hGH的重组酵母株分批补料发酵过程中分泌到培养基中的蛋白质的SDS-PAGE结果。图M为IL-2表达载体pYGaT92_IL2的载体图。图25为毒蜥外泌肽-4表达载体pYGaT923-E)(D4的载体图。图沈为毒蜥外泌肽-4表达载体pYGaMKH-E)(D4的载体图。
图27为毒蜥外泌肽-4表达载体pYGaST6-E)(D-HL的载体图。图28为EGF表达载体pYGaMKH-EGF的载体图。图29为PTH表达载体pYGaMKH-PTH的载体图。图30为毒蜥外泌肽-4表达载体pYGaSCW4-l_E)(D4的载体图。图31为毒蜥外泌肽-4表达载体pYGaSCW4-3-E)(D4的载体图。图32为hGH表达载体pYGaSCW4-2_hGH的载体图。
具体实施方式
本发明满足了高水平地分泌目标多肽和快速、有效地筛选可用于获得高水平分泌的目标多肽的SFP鉴定技术。本发明有助于优化任何蛋白的重组表达，尤其有助于因在已知表达系统中表达水平低而不能大规模和/或低成本制备的蛋白质制备。优化后的SFP可获得高水平的目标多肽的分泌。定义应当注意，术语“一”或“一个”个体是指一个或多个体；如“一个载体”应当理解为一个或多个载体。同样，术语“一”(或“一个”)、“一个或多个”和“至少一个”在本申请
中可以互换使用。本发明中，术语“多肽”包括单个的“多肽”以及多个“多肽”，是指通过酰胺键(也称肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或多个氨基酸的任何链，不是指产物具体的长度。因此，肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或其它用于指代两个或多个氨基酸的链的任何术语都包括在“多肽”的定义内，而且术语“多肽”用这些中的任何一个替代或可互换使用。术语“多肽”还指多肽表达后修饰的产物，包括但不限于糖基化、酰基化、磷酸化、酰胺化、用已知的保护/保卫基团衍生物、蛋白水解裂解或用非天然的氨基酸修饰。多肽可来源于天然的生物或通过重组技术制备，但不一定翻译自特定的核酸序列。其可以用任何方法生成，包括化学合成。“分离的多肽”或其片段、变体或衍生物是指不在其天然环境下的多肽。不需要特别的纯化程度。例如，分离的多肽可移取自其原生的和天然的环境。为本发明目的，在宿主细胞中重组制备的多肽和蛋白被看做进行了分离，其被认为是已经被任何合适的技术分开、分离、部分或基本纯化的原生或重组的多肽。本发明的多肽还包括前述多肽的片段、衍生物、类似物或变体和其任意组合。当术语“片段”、“变体”、“衍生物”和“类似物”是指本发明的多肽时，包括至少保留一些相应原始多肽的生物学、抗原或免疫的特性。本发明的多肽片段包括蛋白水解片段以及缺失片段，此外还包括其它本申请其它地方描述的特定片段。本发明多肽的变体包括如上所述的片段，还包括由于氨基酸取代、缺失或插入导致氨基酸序列改变的多肽。变体可自然发生或非自然发生。非自然发生的变体可通过使用本领域公知的诱变技术进行制备。多肽变体可包括保守的或非保守的氨基酸取代、缺失或增加。本发明多肽的衍生物包括为具有原始多肽所不具有的额外特性而已经发生改变的多肽。多肽变体在本申请中还指“多肽类似物”。本申请中，多肽的“衍生物”指具有通过功能侧基反应后化学衍生出的一个或多个残基的主体多肽(subject polypeptide) 0 “衍生物”还包括含有20个基本氨基酸的一个或多个天然氨基酸衍生物的肽。例如，4-羟基脯氨酸可用来取代脯氨酸；5-羟基赖氨酸可用来取代赖氨酸；3-甲基组氨酸可用来取代组氨酸；高丝氨酸可用来取代丝氨酸以及鸟氨酸可用来取代赖氨酸。“参考氨基酸序列”是指没有任何引入任何氨基酸取代的特异序列。作为本领域技术人员应当理解，如果没有发生取代，本发明“分离的多肽”包括与参考氨基酸序列相同的氨基酸序列。本发明所述的多肽可具有多种改变，如取代、缺失或插入。可在多肽中取代的典型的氨基酸包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。还包括与本申请所述的多肽和参考多肽具有至少70%、75%、80%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%—致性的相应
多肽片段。序列一致性的计算是通过比较两个在比较区域进行最佳排列的序列，确定相同氨基酸残基或核苷酸在两个序列中所处位置的数目以获得匹配位置的数目，用比较区域(例如窗口大小)的位置总数目除以匹配位置的数目并将其结果乘以100来获得序列一致性的百分数。一方面；当长度为100个氨基酸或核苷酸的四个空位可被引入以使比对最大化时，一致性百分比的计算是指两个序列中的较小序列氨基酸残基或核苷酸的百分数，其中所述的两个序列与被比序列中的相同氨基酸残基或核苷酸比对(Dayhoff，in Atlas of ProteinSequence and Structure (蛋白质序列禾口结构地图集)，Vol. 5，p. 124，National Biochemical Research Foundation( ^ ^^ ^^ ), Washington, D. C. (1972) 为引文并入本申请)。一致性的确定通常通过本领域已知的计算机同源性程序进行。典型禾呈序为 Gap 禾呈序(Wisconsin Sequenc Analysis Package (Wisconsin 序列分析软件包)， Version 8 for UNIX, Genetics Computer Group, University Research Park, Madison, WI)，使用默认设置，应用 Smith 和 Waterman 的算法(Adv. App 1. Math.，1981，2 :482_489，其以引文形式整体并入本申请)。优选的，任何取代为保守氨基酸的取代。“保守氨基酸取代”是指氨基酸残基用具有相似侧链的氨基酸残基替代。具有相似侧链的氨基酸残基家族在本领域内已有定义。这些家族包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。在一个实施方案中，本发明涉及一种鉴定分泌融合配偶体(SFP)的方法，所述的方法包括(i)用可操作地与编码分泌多肽的多核苷酸连接的异源启动子转化第一宿主细胞；(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述第一宿主细胞是否过量分泌所述的分泌多肽；(iii) 用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞，其中，所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；(iv)在培养条件下培养所述的第二宿主细胞，其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽；和(ν)确定所述的融合多肽是否分泌到培养基中；从而鉴定所述的过量分泌多肽是否为SFP。在本发明的方法中，可从“分泌蛋白质组”或“总分泌多肽”中鉴定SFP。分泌蛋白质组包括分泌到胞外培养基并从胞外培养基中收集的多肽。任何真核或原核生物的DNA可编码分泌蛋白质组，包括细菌、真菌(如酵母)、植物和动物(如哺乳动物)。适合的细菌包括但不限于埃希氏杆菌属和芽孢杆菌属。适合的酵母包括但不限于念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体的物种实例包括产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeniniVorans0其它可作为DNA来源的真菌包括但不限于曲霉属、青霉属、根霉属和木霉属。可作为DNA来源的植物包括但不限于拟南芥、玉米、烟草和马铃薯。适合的动物细胞包括但不限于人、鼠、白鼠、兔子、狗、猫和猴子。在一个实施方案中，分泌蛋白质组可源自酵母、细菌、植物或动物。可使用本领域可获得的技术分析分泌蛋白质组用于筛选大量分泌的多肽。例如，从浓缩的培养物上清液中分离出的总分泌多肽可通过双向凝胶电泳和/或多维蛋白质鉴定技术(Ι-DE/MudPIT)进行分析。可通过任何一种蛋白质纯化柱从分泌蛋白质组分析多肽，如离子交换柱、疏水交互作用柱、凝胶过滤柱、亲和层析柱和反相柱。在一个实施方案中，分析正常的酵母细胞生长过程中制备的总分泌多肽(酵母分泌蛋白质组)。正常的细胞生长是指细胞培养于基本培养基(如0.67%无氨基酸的酵母含氮碱基、0.5%酪蛋白水解物、2%葡萄糖和0. 002%尿嘧啶)。可使用改变的条件，所述条件可包括用不同的碳源替代葡萄糖，如半乳糖、木糖、果糖、甘露糖、蔗糖、棉子糖和纤维二糖。改变的条件还可包括限制培养基中任何组分的水平，如氮或磷。术语“大量分泌”是指分泌多肽的水平达到至少40 %、45 %、50 %、55 %、60 %、65 % 或70%的分泌蛋白质组。大量分泌多肽可通过PAI (蛋白丰富指数，protein abundance index)确定(RappsiIber 等人，Genome Res. 12 1231-45 Q002))，其可与分泌蛋白质的量成正比。大量分泌的蛋白的实例列于表1中。术语“过量分泌”被定义为宿主细胞的多肽分泌水平至少超过用天然启动子表达的多肽分泌水平的5X、6X、7X、8X、9X或10X。还可通过与野生型蛋白分泌水平和大量分泌的多肽分泌水平相比，确定过量分泌。例如，野生型酵母在正常细胞生产过程中，分泌的蛋白不超过20mg/L的分泌水平，然而连接到一个强异源启动子后，一些这样的蛋白就过量分泌，分泌水平超过了 20mg/L。在一个实施方案中，本发明的方法还包括确定用于分泌融合多肽的SFP的最佳大小。SFP的最佳大小可通过缺失分析所述SFP进行确定，其中，比较各自含有不同SFP的缺失构建体的融合多肽的分泌水平。一些SFP可能具有最佳的大小，从而使其融合多肽的表达水平可能甚至高于最初鉴定的SFP的表达水平。与目标多肽融合到次优的SFP上时目标多肽的分泌水平相比，最佳大小的SFP可增加目标多肽的分泌水平。SFP的最佳大小可随目标多肽而变，但只要SFP被首次鉴定后，就可使用本申请的方法或本领域公知的方法进行确定。在一个实施方案中，选择以亲水序列结束的SFP缺失片段。蛋白的亲水结构域通常定位于蛋白表面的附近。因此，SFP和目标多肽的结合点连接可轻易地暴露于两个多肽之间，使得蛋白酶更易在体外切割连接点而释放目标多肽。术语“其片段”，如SFP所使用的，是指含有任意部分的SFP的氨基酸序列的多肽，其中该片段基本保留了诱导与其融合的目标多肽分泌的能力。本申请中所用的术语“基本上保留诱导与其融合的目标多肽分泌的能力”是指保留原始SFP的诱导与其融合的目标多肽分泌的能力至少50%的片段或其衍生物。在一些实施方案。至少保留60、65、70、75、80、85、90或95 %诱导与其融合的目标蛋白分泌的能力。诱导目标多肽分泌的能力可通过本领域公知和前述的常规技术来确定。术语“其衍生物”，如SFP所使用的，是指由与SFP的氨基酸序列至少70%相同的氨基酸序列组成的多肽，其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中，该衍生物包含与SFP的氨基酸序列至少75%、80%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% —致性的氨基酸序列。该衍生物还可包含对SFP氨基酸序列的增加、删除、取代或其组合。衍生物可包括用1、2、3、4、 5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。SFP的衍生物的实例包括但不限于缺失突变(如单向突变缺失)、增加功能序列 (如糖基化位点、限制性酶切位点)和缺失或增加(如交换)SFP中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术，如文所引的参考文献中所述，制备SFP的衍生物或编码SFP的核酸的衍生物，并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。在一个实施方案中，用本发明的方法鉴定SFP或其衍生物或片段。在另一个实施方案中，编码SFP的核苷酸序列选自下述BGL2 (SEQ ID NO :62)、GAS3 (SEQ ID NO :63)、 GAS5(SEQ ID NO 64)、PSTl(SEQ ID NO :65)、SCW4(SEQ ID NO :66)、SCWlO(SEQ ID NO :67)、 SIMI(SEQ ID NO :68),UTHl(SEQ ID NO :69),YGPl (SEQ ID NO :70),YPSl(SEQ ID NO :71)和 ZPSl (SEQ ID NO :72)。在另一个实施方案中，SFP选自下述BGL2 (SEQ ID NO :80)、GAS3 (SEQ ID NO :81)、GAS5(SEQ ID NO :82)、PSTl(SEQ ID NO :83)、SCW4(SEQ ID NO :84)、SCWlO(SEQ ID NO :85)、SIMI(SEQ ID NO :86)、UTHl(SEQ ID NO :87)、YGPl(SEQ ID NO :88)、YPS 1(SEQ ID NO 89)和 ZPSl(SEQ ID NO :90)。本发明的方法可使用术语“目标多肽”或其衍生物，它们为被期望有高水平重组表达的多肽。术语“其衍生物”如所用于“目标多肽”，是指由与多肽的氨基酸序列至少70% 相同的氨基酸序列组成的多肽，其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中，该衍生物包含与目标多肽的氨基酸序列至少75^^80^^85%, 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相同的氨基酸序列。该衍生物还可包含对目标多肽的氨基酸序列的增加、缺失、取代或其组合。衍生物可包括用l、2、3、4、5、6、7、8、9、10、ll-15、16-20、21-25J6-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。目标蛋白或目标多肽的衍生物的实例包括但不限于缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)目标多肽中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术，如本文所引的参考文献中所述，制备目标多肽的衍生物或编码目标多肽的核酸的衍生物，并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。如目标多肽融合到SFP，目标多肽和SFP就不是同样的天然存在蛋白的多肽。目标多肽可为正以研究目的而研究的多肽或正以商业为目的如制药和产业用途而生产的多肽。目标多肽可来自于任何植物、动物或微生物，只要它可以被核酸编码，可以是天然发生的或经过修饰的。在一个实施方案中，目标多肽为人类蛋白。在另一个实施方案中，目标多肽为细胞因子、血清蛋白、集落刺激因子、生长因子、激素或酶。例如，目标多肽可选自下述白细胞介素、凝结因子、干扰素-α、_β或-Y、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、组织生长因子、上皮生长因子、TGFa、 TGFiK表皮生长因子、血小板衍生生长因子、成纤维细胞生长因子、促卵泡激素、促甲状腺激素、抗利尿激素、色素性激素、甲状旁腺激素、促黄体生成激素释放激素、碳水化合物特异性酶、蛋白水解酶、脂肪酶、氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、免疫球蛋白、细胞因子受体、乳铁蛋白、磷脂酶Α2激活蛋白、胰岛素、胖瘤坏死因子、降钙素、降钙素基因相关肽、脑啡肽、生长调节素、促红细胞生成素、下丘脑释放因子、催乳素、绒毛膜促性腺激素、组织纤溶酶原激活物、生长激素释放肽、胸腺体液因子、抗癌肽或抗菌肽。具体实例包括但不限于人白细胞介素-2 (hIL-2)、毒蜥外泌肽_3、毒蜥外泌肽-4 (EHM)、胰高血糖素样肽-1 (GLP-I)、甲状腺激素(PTH)、人白细胞介素-1 β、人白细胞介素_6、人白细胞介素-32 a、-32 β或32 γ、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β 或-Y、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β -1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YMl & 2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白 24、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。在一个实施方案中，目标多肽为很难用常规的重组制备方法制备的多肽，也即不能制备或仅以很低的水平进行制备。在另一个实施方案中，目标多肽为易于用已知的表达系统进行制备的多肽，但期望其获得更高水平的表达。在一个实施方案中，本发明的融合多肽是指包含分泌多肽以任何顺序融合到目标多肽而形成的多肽。在另一个实施方案中，本发明涉及包含融合到目标多肽的本发明SFP 的分离融合多肽。术语“融合的”在本申请中是指重组制备的融合多肽。在一个实施方案中，融合多肽包含融合到目标多肽的分泌多肽，其中分泌多肽和目标多肽以任何顺序进行融合。在另一个实施方案中，SFP在目标多肽的N-末端或C-末端进行融合。SFP和目标多肽可使用或不使用插入的氨基酸如由连接DNA编码的氨基酸进行融合。在一些实施方案中，SFP和目标多肽的距离可为0 10 ;0 20 ;0 30 ；0 40个或更多氨基酸。在一些实施方案中，融合多肽包含蛋白酶识别序列和或亲和标签。在一个实施方案中，分离的融合多肽包括含有SEQ ID NO=I的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物和目标多肽。在一个实施方案中，修饰的HL 结构域由SEQ ID NO 45编码。
本发明还涉及使用本发明的SFP重组制备目标蛋白的方法。在一个实施方案中，该方法包括制备构建体，所述构建体包含编码目标蛋白的核苷酸序列，该核苷酸序列可操作性地连接至编码SFP或其衍生物或片段的核苷酸序列；用所述构建体转化宿主细胞；在宿主细胞生成和分泌目标蛋白的条件下培养宿主细胞；再从所述的目标多肽中分离出 SFP。目标蛋白可使用任何本领域已知表达系统重组制备。优选地，目标蛋白在例如细菌、酵母或哺乳动物细胞培养物中重组表达。重组表达包括制备包含编码目标蛋白的多核苷酸的载体，运送载体至宿主细胞，在目标蛋白表达条件下培养宿主细胞，以及分离目标蛋白。制备重组载体和使用同样的载体转化宿主细胞、在宿主细胞中复制载体和表达生物活性外源多肽和蛋白质的方法和材料在前面讨论且描述于Sambrook等人，Molecular Cloning (《分子克隆》)，第三版，Cold Spring Harbor Laboratory (冷泉港实验室)，2001 和 Ausubel 等人，Current Protocols in Molecular Biology (《现代分子生物学教程》)， John Wiley & Sons, New York第三版(2000)，均以参阅的方式纳入本申请。目标蛋白可从宿主细胞生长的培养基中分离出来，通过本领域已知的纯化方法例如常规色谱方法包括免疫亲和层析法、受体亲和层析法、流水作用色谱法、凝集素亲和层析法、尺寸排阻过滤法、阳离子或阴离子交换色谱法、高效液相色谱法(HPLC)、反相HPLC等。其它纯化方法还包括那些预期多肽作为融合多肽被表达和纯化的方法，其中所述的融合多肽具有特定的亲和肽、标签、标记或被特定结合配偶体或试剂识别的螫合部分。经纯化的蛋白质可断裂以获得预期蛋白，或可作为完整的融合蛋白被保存。作为断裂过程的结果，亲和标签组分的断裂可生成具有其它氨基酸残基的预期蛋白质形式。在一个实施方案中，亲和标签为GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签或其组
口 O本发明的目标多肽与分泌融合配偶体以融合形式在胞外制备，并可通过体外蛋白酶处理从SFP中分离出来。如果被分离的目标蛋白在采用分离操作后没有生物活性，可使用多种方法使多肽发生“重折叠”或转化成其三级结构并生成二硫键使之恢复生物活性。本领域普通技术人员已知的方法包括在特定浓度的离液剂存在下将溶解的多肽的PH调节至通常大于7。离液剂的选择类似于包涵体增溶作用的选择，但是通常浓度较低且不必要和增溶作用使用同种离液剂。可能需要使用还原剂或特定比例的还原剂和其氧化形式，以得到特定的氧化还原电位使蛋白质的半脱氨酸桥形成中可发生二硫键的转移。一些常用的氧化还原对包括半脱氨酸/胱胺、谷胱苷肽(GSH)/二硫代谷胱甘肽、氯化铜、二硫苏糖醇(DTT)/ 二噻烷DTT、2-巯基乙醇(bME)/二硫代-b(ME)。为了增加重折叠效率，可能有必要使用助溶剂，例如甘油、多种分子量的聚乙二醇和精氨酸。术语“多核苷酸”包括单个核酸以及多个核酸，是指分离的核酸分子或构建体，如信使RNA (mRNA)、病毒来源的RNA或质粒DNA (pDNA)。多核苷酸可包括常规的磷酸二酯键或非常规的键(如酰胺键，例如发现于肽核酸中(PNA))。术语“核酸”是存在于多核苷酸的指任何一种或多种核酸片段，如DNA或RNA片段。“分离的”核酸或多核苷酸是指从它的原始环境中移取的核酸分子，DNA或RNA。例如，载体中所含的编码治疗用多肽的重组多核苷酸被认为是为本发明目的的分离的重组多核苷酸。分离的多核苷酸的进一步的实例包括异源宿主细胞中维持的重组多核苷酸或溶液中的(部分地或大体上地)纯化的多核苷酸。分离的RNA分子包括本发明体内或体外的RNA转录本以及本申请公开的瘟病毒载体的正链和负链形式和双链形式。本发明分离的多核苷酸或核酸包括该合成制备的分子。此外，多核苷酸或核酸可为或可包括调控元件，如启动子、核糖体结合位点或转录终止子。本申请使用的“编码区域”为含有翻译成氨基酸的密码子的核酸的一部分。尽管 “终止子” (TAG、TGA或TAA)不翻译成氨基酸，但它被认为是编码区域的一部分，但如果存在任何侧翼序列，如启动子、核糖体结合位点、转录终止子、内含子、5'和3'非编码区等则不是编码区的一部分。本发明的两个或多个编码区可存在于单个的多核苷酸构建体如在单个载体中，或分别存在于多核苷酸构建体如分别(不同)的载体中。此外，任何载体可含有单个编码区或可包含两个或多个编码区，如本发明的载体可编码一个或多个多肽，其通过蛋白酶裂解翻译后或共翻译分离出最终的多肽。此外，本发明的载体、多核苷酸、或核酸可编码异源编码区，可以融合或不融合到本发明的第一或第二编码区或其变体或衍生物。异源编码区包括不受限的特殊的元件或基序，如分泌的信号肽或异源功能域。在某些实施方案中，多核苷酸或核酸为DNA。对于DNA，多核苷酸包括核酸，其通常编码包括启动子和/或其它转录或翻译控制元件可操作地与一个或多个编码区相连的多肽。当基因产物，如多肽的编码区可操作地与一个或多个调节序列连接时，这样在调控序列的影响或控制下进行基因产物的表达。如果启动子功能的诱导导致了编码所期望的基因产物的mRNA的诱导，如果两个DNA片段之间的自然的连接没有干扰表达调节序列直接表达基因产物的能力，或没有干扰的表达或转录DNA模板的能力，那么两个DNA片段(如多肽编码区和与之相连的启动子)是“可操作性地连接”的，因此，如果启动子可影响核酸的转录，那么启动子区是可操作性地与编码多肽的核酸相连。启动子可以为细胞特异性启动子，其基本上只在预定的细胞内的指导DNA的大量转录。除启动子外的其它的转录控制元件，如增强子、操作子、抑制子和转录终止信号可与多核苷酸可操作性地相连，以指导细胞特异性转录。本申请公开了合适的启动子和其它转录控制区域。各种转录转录控制区域是本领域技术人员公知的。它们包括但不限于在脊椎动物中发挥功能的转录控制区域，例如不限于巨细胞病毒的启动子和增强元件(如与内含子A相连的即刻早期启动子)、猴病毒40(如早期启动子)和逆转录病毒(如劳氏肉瘤病毒)。其它转录控制区域包括来自于脊椎动物基因，如肌动蛋白、热激蛋白、牛生长激素和兔 β-球蛋白的启动子以及其它可在真核生物细胞中控制基因表达的序列。此外合适的转录控制区域包括组织特异性启动子和增强子以及淋巴因子可诱导启动子(如可被干扰素或白细胞介素诱导的启动子)。同样的，各种翻译控制元件是本领域技术人员公知的。它们包括但不限于核糖体结合位点、翻译起始和终止密码子和源自病毒系统的元件(特别为内部核糖体进入位点，或IRES,也被称为CITE序列)。本发明的多核苷酸可包括RNA，如信使RNA(mRNA)形式的。本发明的RNA可以是单链或双链的。本发明的多核苷酸和核酸编码区域可与其它的编码分泌或信号多肽的编码区域相关，其指导本发明多核苷酸编码的多肽分泌。根据信号假说，哺乳动物细胞分泌的蛋白具有信号肽或分泌前导序列，其在穿越粗面内质网的生长中蛋白链开始输出时裂解自成熟蛋白。本领域技术人员应当了解，通过脊椎动物的细胞分泌的多肽通常具有融合到多肽N-末端的信号肽，其裂解自全部或“全长”多肽中而产生分泌的或“成熟”形式的多肽。在某些实施方案中，使用了天然的信号肽如免疫球蛋白的重链或轻链信号肽，或使用与多肽可操作性相连、保留指导多肽分泌能力的序列的功能性衍生物。或者，可使用异源哺乳动物信号肽或其功能性衍生物。例如，野生型前导序列可被人组织型纤维蛋白溶酶原激活剂(TPA)或鼠β-葡糖酸醛酶的前导序列取代。术语“构建体”是指非天然存在的核酸分子。构建体是编码融合多肽的多核苷酸。在一个实施方案中，构建体编码含有SFP或候选的SFP和目标多肽的融合多肽。构建体可进一步包括环状或线性载体，并可与其它多核苷酸组合，如进行同源重组。如本申请所使用的，术语“载体”是指能够转运与其相连的另一个核酸的核酸分子。一种载体是“质粒”，它是指能连接其它DNA片段的环状双链DNA环。另一种载体是病毒载体，其中其它DNA片段可连接到该病毒基因组中。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌的复制起始区的细菌载体和附加型哺乳动物载体)。其它载体 (例如非附加型哺乳动物载体)一旦引入至宿主细胞后就整合至宿主细胞的基因组中从而随着宿主基因组复制。本发明的载体能够指导编码与它们可操作性连接的目标蛋白基因的表达。这些载体在本文中称为“表达载体”。一般而言，在重组DNA技术中有用的表达载体通常是质粒的形式。在本说明书中，“质粒”和“载体”可互换使用，因为质粒是载体的最常用形式。但是，本发明也包括具有相同功能的其它形式的表达载体，例如病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺伴随病毒)。载体DNA可通过常规的转化或转染技术导入到原核或真核细胞内。如本申请所使用的，术语“转化”和“转染”是指各种本领域公知的将外源核酸(如DNA)引入到宿主 DNA的技术，包括磷酸钙或氯化钙共沉淀法、DEAE-dextran介导的转染法、脂质体转染法或电转法。适合转化或转染宿主细胞的方法可见Sambrook等人的(MOLE⑶LAR CLONING A LABORATORY MANUAL. 2nd ed.，Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y.，1989)和其它实验室手册。已知的是，哺乳动物细胞的稳定转染取决于表达载体和所用的转染技术，仅有一小部分的细胞可将外源DNA整合到其基因组中。为鉴定和选择这些整合体，通常将编码选择标记(如抗抗生素)的基因随目标基因一起导入到宿主细胞内。各种选择标记包括那些抗药标记，如G418、潮霉素和甲胺嘌呤。可将编码选择标记的基因和编码目标多肽的基因在同一个载体或在各自的载体上导入宿主细胞。用导入的核酸稳定地转染过的细胞可通过药物选择、营养缺陷型的选择、基质组合物、碳源选择或其它本领域公知的方法(如含有选择标记基因的成活，而其它细胞死亡)鉴别。在一个实施方案中，编码本发明的方法中所使用的多肽或其片段或衍生物的核苷酸序列还可在5'端和3'端包含用于与本发明的线性载体进行体内同源重组的DNA。当 5'端和3'端DNA共转化到宿主细胞内时，它们能提供足够的序列以允许编码多肽或其片段或衍生物的核苷酸序列和线性载体之间进行体内重组。在一个实施方案中，5'端和3' 端DNA各自包含至少20个与线性载体序列重叠的碱基对，如至少30个或40个碱基对。可使用常规的重组技术添加5'和3' DNA，如PCR和/或限制性内切酶消化和连接。本发明的多核苷酸还可编码亲和标签，如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP, CBD、或S-标签。亲和标签可由连接DNA编码或由本发明其它部分的多核苷酸编码，如融合蛋白编码区域的5'或3'部分。本发明的多核苷酸还可包括连接DNA。在一个实施方案中，连接DNA编码连接肽。本发明的连接DNA可足够长，并与线性载体的核苷酸序列部分具有足够的一致性，从而在它们共转化到宿主细胞内后，允许编码多肽的核苷酸序列和线性载体之间发生体内重组。在一个实施方案中，连接DNA的长度至少为20个碱基对，或至少长度为30个或 40个碱基对。在进一步的实施方案中，连接DNA至少与相应的线性载体的序列具有80%的一致性，例如至少85 %、90 %、95 %或99 %的一致性。在一个实施方案中，连接DNA编码蛋白酶识别序列，从而允许在SFP和目标多肽的连接点发生裂解。例如，连接DNA可编码酵母kex2p-或Kex2样蛋白酶识别序列(如含有 Lys-Arg、Arg-Arg 或 Leu-Asp-Lys-Arg (SEQ ID NO 74)的氨基酸)、哺乳动物弗林蛋白酶识别序列(如含有Arg-X-X-Arg的氨基酸序列)、因子Xa-识别序列(如含有Ile-Glu-Gly-Arg (SEQ ID NO 75)的氨基酸序列)、肠激酶_识别序列(如含有Asp-Asp-Lys的氨基酸序列)、枯草杆菌蛋白酶-识别序列(如含有 Ala-Ala-His-Tyr (SEQ ID NO 76)的氨基酸序列)、烟草蚀刻病毒蛋白酶_识别序列(如含有Glu-Asn-Leu-Tyr-Phe-Gln-Gly (SEQ ID NO 77)的氨基酸)，泛素水解酶-识别序列 (如含有Arg-Gly-Gly的氨基酸)或凝血酶-识别序列(如含有Arg-Gly-Pro-Arg (SEQ ID NO 78)的氨基酸)。在连接子的蛋白酶位点内或在分泌多肽或目标多肽内，优选通过内源宿主蛋白酶避免融合多肽的不想要的裂解。同样，在目标多肽或分泌多肽或SFP或其片段或衍生物内，优选通过用于从目标多肽中裂解分泌多肽的蛋白酶避免裂解。因此，如果作为编码融合多肽的多核苷酸一部分，编码蛋白酶识别序列的连接DNA被转化入宿主细胞时，则所述宿主细胞优选不表达识别连接子内蛋白酶序列的蛋白酶。宿主细胞既可以天然地不表达蛋白酶，或宿主细胞也可以经过修饰而不表达蛋白酶(如kex2突变体宿主细胞、Kex2样蛋白酶突变体宿主细胞和弗林蛋白酶突变体宿主细胞)。如果融合多肽包含分泌多肽和目标多肽，则分泌多肽或SFP或其片段或衍生物和/或目标多肽可天然不包含宿主蛋白酶识别序列，或分泌多肽或SFP或其片段和衍生物和/或目标多肽可以经过修饰而不含有被宿主蛋白酶识别的序列。如果融合多肽包含分泌多肽或SFP或其片段或衍生物、目标多肽和含有蛋白酶识别序列的肽连接子，则分泌序列或SFP或其片段或衍生物和/或目标多肽可天然地不含有蛋白酶识别序列，或分泌多肽或SFP或其片段或衍生物和/或目标多肽可以经过修饰而不含有被肽连接子的蛋白酶识别的序列识别的序列。在另一个实施方案中，连接DNA编码亲和标签，如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD 或 S-tag.在进一步的实施方案中，连接DNA编码限制性内切酶识别位点和蛋白酶识别序列 (如kex2p样蛋白酶或kex-2p-识别序列)。原核生物中多肽表达的实施，可使用含有指导目标蛋白-报告蛋白融合的表达的组成型或诱导型启动子的载体。适合的大肠杆菌表达载体的实例包括PTrc (Amrarm等， Gene 69 :301-315 (1988))和 pET (Studier 等，GENE EXPRES SION TECHNOLOGY :METH0DS IN ENZYM0L0GY 185，Academic Press, San Diego, Calif. (1990)60-89)。
为了在酵母细胞中表达，合适的酵母表达载体包括，但不限于pY^^ecl (Baldari 等，EMBO J. 6 :229-234(1987))，pMFa (Kurjan 等，细胞 30 :933-943 (1982))、 ρJRY88(Schultz 等，Gene 54 113-123(1987)), pYES2(Invitrogen Corporation, San Diego, Calif.)禾口 picZ(Invitrogen Corp,San Diego, Cal.)。为了在昆虫细胞中表达，可使用杆状病毒表达载体。可用于在培养的昆虫细胞 (例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等，Mol. Cell. Biol. 3 2156-2165(1983))和 pVL 系列(Lucklow 等，Virology 170:31-39(1989))。在另一个实施方案中，宿主细胞是哺乳动物细胞而载体是哺乳动物表达载体。哺乳动物表达载体的实例包括 PCDM8 (Seed，Nature 329 :840(1987))和 pMT2PC (Kaufman 等， EMBO J. 6 :187-195(1987))。当用于哺乳动物细胞时，表达载体的调控功能常常由病毒调控元件提供。例如，通常使用的启动子来源于多瘤腺病毒2、巨细胞病毒和猿猴病毒40。其它适合的用于原核和真核细胞两者的表达系统参见例如Sambrook等人，MOLE⑶LAR CLONING A LABORATORY MANUAL. 2nd ed.，Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y.,1989。优选的载体包括但不限于质粒、噬菌体、粘粒、游离基因、病毒颗粒或病毒和整合的DNA片段(例如通过同源重组可整合至宿主基因组的片段)。优选的病毒颗粒包括但不限于腺病毒、杆状病毒、细小病毒、疱疹病毒、痘病毒、腺相关病毒、塞姆利基森林病毒、痘苗病毒和逆转录病毒。优选的表达载体包括但不限于pcDNA3anvitrogen)和ρSVL (Pharmacia Biotech)。其它表达载体包括但不限于pSP0RTTM载体、pGEMTM载体(Promega)、pPROEX 载体 TM (LTI、Besda, MD)、BluescriptTM 载体(Strata 基因)、pQETM 载体 ^jiagen)、 PSE420TM(Invitrogen)和 pYES2TM(Invitrogen)。在一个实施方案中，表达载体是复制型DNA构建体，其中编码目标多肽的DNA序列可操作性地连接或结合至能够影响目标多肽在合适宿主中表达的合适调控序列中。当它们的功能彼此相关时，DNA区域可操作性地连接或结合。例如，如果启动子能调控该编码序列的转录，则将该启动子可操作性地连接或结合于编码序列。扩增载体不需要表达调控域，而相反，仅需要由复制起始区赋予的在宿主中进行复制的能力和帮助识别转化体的选择基因。表达载体对调控序列的需要取决于选择的宿主和选择的转化方法。一般来说，调控序列包括但不限于转录启动子、增强子、控制转录的可选操纵子序列、多腺苷酸化信号、编码适合的结合核糖体的mRNA的序列和调控转录和翻译终止的序列。这些调控序列描述于例如， Goeddel, GENR EXPRESSION TECHNOLOGY :METH0DS IN ENZYM0L0GY 185，Academic Press, San Diego,Calif. (1990)。调控序列包括那些在多种类型的宿主细胞中指导核苷酸序列的组成型表达和那些仅在特定宿主细胞中指导核苷酸序列表达(如组织特异性调控序列)的调控序列。本领域技术人员应当理解表达载体的设计取决于所选择的要转化的宿主细胞、预期的蛋白质表达的水平等等这些因素。本发明的表达载体可导入宿主细胞从而制备蛋白质或肽，包括本文描述的由核酸编码的融合蛋白或肽。优选载体含有可被宿主生物体识别的启动子。在一个实施方案中，本发明的启动子是强异源启动子，其用于重组制备外源多肽。异源启动子可以是诱导型或组成型启动子。优选异源启动子为那些用于常规制备蛋白质的启动子，如上文所述的那些。本发明的异源启动子可分为天然或野生型SFP启动子。
本发明的启动子序列可以是原核、真核或病毒的序列。合适的原核序列实例包括 λ 噬菌体的PR禾口PL启动子(The bacteriophage Lambda，Hershey，A. D. ,Ed. ,Cold Spring Harbor Press, Cold Spring Harbor，NY(1973)其以参阅的方式全文并入本申请；λ II， Hendr ix, R. W. , Ed. , Cold Spring Harbor Press, Cold Spring Harbor, NY (1980),其以参阅的方式全文并入本申请)；大肠杆菌的trp、recA、热休克和IacZ启动子以及SV40早期启动子(Benoist等，Nature，290 :304-310 (1981)，其以参阅的方式全文并入本申请)。对于酵母，合适的启动子的实例包括但不限于GAPDH、PGK、ADH、PH0S、GALI和GAL10。其它启动子包括但不限于小鼠乳腺瘤病毒、人免疫缺陷症病毒长末端复制、maloney病毒、巨细胞病毒立即早期启动子、EB病毒(Epstein Bar virus)、劳氏肉瘤病毒、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌酸和人金属硫蛋白。其它调控序列也可包括在优选的载体中。合适的调控序列的实例以噬菌体MS-2 的复制酶基因和λ噬菌体的cll基因的夏因-达尔加诺序列为代表。此外，合适的表达载体可包括允许筛选转化的宿主细胞的适当标记。所选宿主的转化使用本领域技术人员公知和先前Sambrook等人描述的各种技术中的任意一种来进行。复制起始区还可通过构建载体以包括外源的起始区来提供或通过宿主细胞染色体复制机制提供，如果将载体整合入宿主细胞染色体，后者就足够了。或者，相比使用含有病毒复制起始区的载体，本领域技术人员可使用用选择性标记和目标蛋白DNA共转化的方法来转化哺乳动物细胞。合适标记的一个实例是二氢叶酸还原酶(DHFR)或胸苷激酶(参见美国专利4，399，216)。编码目标蛋白的核苷酸序列可用载体DNA利用常规技术重组，包括平末端或粘末端(staggered)连接、限制性酶消化来提供适当的末端、适当补平粘性末端、碱性磷酸酶处理以避免非预期的连接以及用适当的连接酶连接。这些操作的技术先前由Sambrook等人公开且在本领域内公知。构建哺乳动物表达载体的方法公开于例如Okayama等人，Mol. Cell. Biol. 3 :280 (1983)，Cosman 等，Mol. Immunol. 23 :935 (1986)，Cosman 等，Nature 312 768 (1984)、EP-A-0367566和WO 91/18982，它们各自均以参阅的方式全文并入本申请。本发明所用的宿主细胞可以是本领域技术人员公知的任何宿主细胞。合适的宿主细胞包括细菌、真菌、(例如酵母)、植物或动物(例如哺乳动物或昆虫)细胞。合适的酵母细胞包括念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体实例包括产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans.其它合适的真菌包括曲霉属、青霉属、根霉属和木霉属。可用作宿主细胞的细菌包括埃希氏杆菌属、假单胞菌属和杆菌属。合适的植物宿主细胞包括拟南芥、玉米、烟草和马铃薯。动物细胞包括人、小鼠、大鼠、兔、狗、猫、猴和昆虫。实例包括CHO、COSU COS 7、BSCU BSC40、BMT 10和 Sf9细胞。在一个具体的实施方案中，宿主细胞为酵母细胞。本发明的多核苷酸可导入宿主细胞作为环状质粒的部分或作为包含分离蛋白质编码区域的线性DNA或病毒载体。本领域公知且常规进行的将DNA导入宿主细胞的方法包括转化、转染、电穿孔法、核注射或与载体如脂质体、胶束、血影细胞和原生质体融合。
任何可快速有效检测的报告蛋白可用于本发明。在一个实施方案中，为了使筛选过程自动化，报告蛋白具有可被积极选择的活性。在另一个实施方案中，报告蛋白是分泌至细胞外间隙的蛋白质，例如转化酶、蔗糖酶、纤维素酶、木聚糖酶、麦芽糖酶、淀粉酶、葡萄糖淀粉酶、半乳糖苷酶(例如α-半乳糖苷酶、β-半乳糖苷酶、蜜二糖酶)、磷酸酶(例如 ΡΗ05)、β -内酰胺酶、脂肪酶或蛋白酶。在一个具体的实施方案中，分泌蛋白允许细胞在特定底物上生长。作为哺乳动物细胞中报告基因系统的实例，CD2/新霉素-磷酸转移酶(Ceo) 基因可用作含有抗生素G418的培养基中的分泌报告基因以捕获在小鼠胚胎干细胞中的分泌通路基因(De-hit 等，Nucleic Acid Res. 34 :e25 (2006)) 在一个实施方案中，宿主细胞是酵母，报告蛋白是转化酶，转化的酵母细胞根据它们在蔗糖或蜜三糖上生长的能力来选择。在另一个实施方案中，宿主细胞是酵母，报告蛋白是蜜二糖酶；转化的酵母细胞根据它们在蜜二糖上生长的能力来选择。在另一个实施方案中，宿主细胞是酵母，报告蛋白是淀粉酶(例如内淀粉酶、外淀粉酶、淀粉酶或葡萄糖淀粉酶)，酵母细胞是非淀粉分解的，转化的细胞根据它们降解淀粉的能力来筛选。在另一个实施方案中，鉴定具有报告蛋白活性的细胞的步骤通过使用具有生长抑制因子抗性的报告蛋白来进行，例如抗生素。在另一个实施方案中，报告蛋白是能够目测的蛋白质，例如绿色荧光蛋白或荧光素酶。在一个实施方案中，鉴定显示报告蛋白活性的细胞的步骤通过使用两个或多个报告蛋白例如脂肪酶和转化酶来进行。本发明的宿主细胞不显示报告蛋白活性。在一个实施方案中，宿主细胞不天然表达报告蛋白。在其它实施方案中，编码报告蛋白的基因已被全部或部分缺失或已突变以使得报告蛋白不表达或以无活性形式表达。使一个细胞缺乏一种特定蛋白质的方法在本领域内公知；并且任何此种方法可用来制备本发明的宿主细胞(前述Sambrook等人)。对于酵母来说，报告蛋白缺乏可使用公知的基因置换技术来引入(RothsteimMeth. Enzymol. 194 沘1(1991))。可使用本领域技术公知的技术从任何来源获得编码目标多肽的核酸，包括从基因组或cDNA中分离、通过PCR扩增或化学合成。可从任何形式的DNA，包括基因组DNA、cDNA、合成的DNA和重组DNA获得核酸或其片段的文库。除DNA外，还可使用核酸，包括RNA和非天然存在的核酸。可通过多样化预先鉴定核酸片段，如单一缺失、突变、功能性序列的增加(如糖基化位点)或核酸片段之间的前和后信号序列的交换获得预先选定的核酸片段文库。在一个实施方案中，核酸片段大小小于1000碱基对，如小于700、500或300个碱基对。核酸片段的文库可通过DNA酶切割、 DNA合成或重组DNA技术(如单一缺失、突变)构建。核酸片段可源自生物的整个基因组，如整个基因组或cDNA文库。片段还可源自整个基因组的子集，如扣除文库或一定大小的文库(sized library)。下列实施例用于说明而非限制本发明的方法和组合物。其它对在临床治疗中经常遇到的各种条件和参数的合适的修饰和调节对本领域技术人员显而易见的，也在本发明的精神和范围内。实施例实施例1确定胞外分泌用YGR106C基因的最佳大小本实施例阐释了胞外分泌所需的YGR106的最佳区域。如图IA所示，YGR106C(下
28称分泌融合配偶体1，SFP1)蛋白(SEQ ID NO=D由包含信号肽的256个氨基酸残基、三个糖基化位点、一个亲水性结构域(HL)和一个跨膜结构域组成。在GALlO启动子的调控下过量表达完整的YGR106C基因在培养基中没有产生 YGR106C蛋白。然而，在酵母GALlO启动子的调控下，使用C-末端截短形式的YGR106C，在培养基中高水平地分泌出截短的SFPl (SEQ ID NO 1的氨基酸1-213)。确定用于分泌的SFPl基因最佳区域进一步鉴定。通过Kyte-Doolittle亲水性分析(图1A)确定几种SFPl蛋白的功能结构域，如分泌信号(SEQ ID NO=I的氨基酸1_19)、亲水结构域(HL) (SEQ ID NO 1的氨基酸176-213)和跨膜结构域(TM) (SEQ ID NO=I的氨基酸 220-247)。构建含有具有连续缺失的SFPl基因的不同载体的重组酿酒酵母(Saccharomyces cerevisiae08O5 菌株(Mat a ura3 INV2 pep4: :HIS3 canl)并比较各个载体分泌的 SFPl 相关蛋白(图1B)。起初，为表达完整的SFPl蛋白，用PCR引物、含有BamHI位点的正向引物T9F(SEQ ID NO 2)和含有Mil位点的反向引物H159 (SEQ ID NO :3)，从酿酒酵母观05 基因组DNA扩增出SFPl的开放阅读框(ORF)。用Pfu聚合酶(Mratagene，USA)或Ex-Taq DNA聚合酶(TaKaRa Korea Biomedical he.，韩国首尔)进行PCR扩增。PCR条件包括 94°C变性 5min，94°C进行 25 个扩增循环 30sec，55°C 30sec 和 72°C lmin，最后 72°C 延伸 7min。扩增出的 SFP10RF 用 BamHI-SalI 酶切，再亚克隆到 YEGa -!HR525 的 BamHI-SalI 位点(Sohn 等，Process Biochem. 30 :653 (1995))，生成的质粒命名为 YGaT91。为表达C末端缺失TM结构域的截短SFPl蛋白，用正向引物T9F(SEQ ID NO 2) 和反向引物H160(SEQ ID NO :4)，从YGaT91载体中扩增出SFPl的基因片段。按照构建 YGaTQl的相同的方法将扩增出的SFPl的基因片段克隆到YEG α-MR525，生成的质粒命名为 YGaT92。为表达C末端缺失一半HL结构域的截短的SFPl蛋白，用正向引物T9F(SEQ ID NO 2)和反向引物H161(SEQ ID NO :5)，从YGaT91载体中扩增出SFPl的基因片段。按照构建 YGaTQl的相同的方法将扩增出的SFPl的基因片段克隆到YEG α-MR525，生成的质粒命名为 YGaT93。为表达C末端缺失HL结构域的截短的SFPl蛋白，用正向引物T9F(SEQ ID NO: 2)和反向引物H162(SEQ ID NO :6)，从YGaT91载体中扩增出SFPl的基因片段。按照构建 YGaTQl的相同的方法将扩增出的SFPl的基因片段克隆到YEGa -MR525，生成的质粒命名为 YGaT94。为表达C末端缺失第三个糖基化位点的截短的SFPl蛋白，用正向引物T9F(SEQ ID NO 2)和反向引物H205(SEQ ID NO :7)，从YGaT91载体中扩增出SFPl的基因片段。按照构建YGaT91的相同的方法将扩增出的SFPl的基因片段克隆到YEG α-MR525，生成的质粒命名为 YGaT95。为表达C末端缺失第二个糖基化位点的截短的SFPl蛋白，用正向引物T9F(SEQ ID NO 2)和反向引物H204(SEQ ID NO :8)，从YGaT91载体中扩增出SFPl的基因片段。按照构建YGaT91的相同的方法将扩增出的SFPl的基因片段克隆到YEG α-MR525，生成的质粒命名为 YGaT96。为表达C末端缺失第一个糖基化位点的截短的SFPl蛋白，用正向引物T9F(SEQ ID
29NO 2)和反向引物H203(SEQ ID NO :9)，从YGaT91载体中扩增出SFPl的基因片段。按照构建YGaT91的相同的方法将扩增出的SFPl的基因片段克隆到YEG α-MR525，生成的质粒命名为 YGaT97。用构建的载体(YGaT91、YGaT92、YGaT93、YGaT94、YGaT95、YGaT96和 YGaT97)转化酿酒酵母观05菌株。从UD平板(0. 67%无氨基酸酵母氮源、0. 77g/l氨基酸混合物、2% 葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、丄^葡萄糖^^半乳糖)中30°C培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用 0. 4mL丙酮浓缩，并通过SDS-PAGE分离。如图IC所示，只在携带YGaT92、YGaT93和YGaT94 的细胞中检测到SFPl相关蛋白(分别为泳道2、3和4)。在所有的三个阳性菌株中均检测到两条带，一条为糖基化形式，另一条为非糖基化形式。但其它细胞，YGaT91、YGaT95、YGaT96 和YGaT97没有这些条带(分别为泳道1、5、6和7)。该结果表明去除TM结构域并保留所含的所有三个糖基化位点使SFPl可进行胞外分泌。实施例2确定作为融合配偶体用于分泌目标蛋白的SFPl基因的最佳大小本实施例阐释了 SFPl衍生物作为融合配偶体的应用。为测试SFPl衍生物作为融合配偶体用于示例性目标蛋白人白介素-2 (hIL-2)的分泌，分别用YGaT92、YGaT93 和 YGaT94 的三个 SFPl 衍生物(SFP1_92(SEQ ID NO :39)、SFP1_93(SEQ ID NO :40)和 SFP1-94(SEQ ID NO :41))，构建了三个载体以表达融合蛋白hIL_2 (图2A)。还生成了 hIL_2 和SFP1-91(SEQ ID NO :38)的融合蛋白，数据未示出。为了用YGaT92的SFP1-92融合hIL2 基因，用识别GALlO启动子的正向引物GAL100(SEQ ID NO 10)和反向引物H121 (SEQ ID NO=Il)从YGaT92载体扩增出SFPl基因片段。为方便与hIL2基因融合从而诱导酵母二肽蛋白酶 Kex2p 体内裂解 hIL2 融合蛋白(Mizuno K 等，Biochem. Biophys. Res. Commun. 156 246(1988))，设计了 H121引物(SEQ ID NO 11)以含有Kex2p裂解序列和N-末端hIL2序列。用含有与H121引物(SEQ ID NO 11)互补的部分SFPl序列的正向引物IL2F(SEQ ID NO: 12)和反向引物IL2R(SEQ ID NO :13)扩增人IL-2基因。IL2R引物含有部分GAL7终止子序列。使用GALlOO和GT50R(SEQ ID NO :14)引物，使扩增得到的含有SFP1-92和hIL-2 基因的PCR片段通过重叠-衍生PCR进行融合。GT50R引物为识别GAL7终止子的反向引物。生成的PCR产物含有IOObp的GALlO启动子和50bp的GAL7终止子侧翼序列。酿酒酵母作为表达宿主的一个优点在于可以使用有效和正确的同源重组策略。本领域公知的是线性化载体和在片段末端每一侧共有DNA序列重叠的的DNA片段可进行重组，恢复质粒的环状拓扑(Kunes等，Genetics. 115 :73 (1987))。酿酒酵母的这一特性被用来构建表达宿主系统。为使用YGaT92载体作为体内重组的骨架，将YGaT92载体用BamHI/MlI酶切。用凝胶回收试剂盒(Bioneer，韩国)从琼脂糖凝胶中回收线性化载体。用GAL100/GT50R引物扩增获得的PCR产物与线性化载体有50个共有的核苷酸。体内重组最小的要求为约30 个核苷酸的重叠(Oldenberg等，Nucleic Acids Res. 25 :451 (1997)。50个核苷酸的重叠足以在酿酒酵母中进行质粒的重新构建。通过共转化上述的PCR产物和载体片段直接构建酿酒酵母观05的重组子。通过重组构建的质粒命名为YGaT92-IL2(图24)。为构建转化YGaT93-IL2载体的酿酒酵母观05菌株，除了使用(SEQ ID N0 15)代替H121引物(SEQ ID NO :11)，我们使用与YGaT92-IL2质粒构建中相同的方法。H120引物为识别YGaT93载体的SFPl基因的3’末端并含有Kex2p裂解序列和hIL2的N-末端序列的反向引物。为用 YGaT94-IL2载体转化酿酒酵母2805株，除了使用H119引物(SEQ ID NO 16)代替H121引物(SEQ ID N0:11)，使用如YGaT92-IL2质粒构建中相同的方法。H119引物为识别YGaT9 载体的SFPl基因的3’末端并含有hIL2的N-末端序列的反向引物。从UD平板(0. 67%无氨基酸酵母氮源、0. 77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、葡萄糖、半乳糖)中30°C培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩，并通过 SDS-PAGE 分离。如图 2B 所示，携带有 YGaT92_IL2 (SEQ ID NO :58)和 YGaT93_IL2 的细胞分泌出SFPl衍生蛋白和hIL2(分别为泳道1和2)，但携带YGaT94-IL2的细胞没有分泌(泳道3)。结果表明以融合形式表达时，HL结构域对于SFPl衍生蛋白的分泌是非常重要的。实施例3融合有SFPl衍生物的目标蛋白的表达实施例2中从YGaT92构建的SFP1_92(SEQ ID NO :39)用于分泌制备 Exendin-4 (EHM)，一种胰高糖素样肽I(GLPl)的39个氨基酸的肽类似物。为简单和有效地纯化完整的E)(D4蛋白，将6-组氨酸标签和肠激酶裂解位点(DDDDK(SEQ ID NO :79)，D 天冬氨酸，K:赖氨酸)加入到SFPl的C-末端。因而，N-末端至C-末端的融合蛋白包括 SFPl片段、6-组氨酸标签、肠激酶裂解位点和E)(D4序列。为构建表达SFP1-92E)(D4融合蛋白的 YGaT92-EXD4载体，用 GAL100 引物(SEQ ID NO 10)和反向引物HDK-R(SEQ ID NO 17) 从YGaT92载体扩增出SFP1-92基因，所述的反向引物HDK-R识别HL序列并含有6个组氨酸密码子。用含有18个与HDK-R引物和DDDDK密码子互补的正向引物HDK-F(SEQ ID NO 18)和含有18个GT50R(SEQ ID NO :14)引物序列的反向引物EXD-R(SEQ ID NO :19)扩增出E)(D4基因。扩增出的SFP1-92和E)(D4基因用GAL100/GT50R引物对通过重叠-延伸PCR 进行融合。如实施例2所述，通过共转化融合的片段和BamHI/MlI酶切的YGaT92载体片段在体内重组直接构建携带YGaT92-E)(D4载体的酿酒酵母观05菌株的重组子。将用YGaT92_E)(D4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐，评价其诱导分泌制备SFPl-92-E)(D4融合蛋白的能力。使用种子培养基(6. 7%不含氨基酸的酵母氮源、0. 5%酪蛋白水解物和2%葡萄糖)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基酵母提取物、蛋白胨、2%葡萄糖)作为初始发酵培养物0D600达到约15时，根据细胞生长速率提供不同用量的补料培养基(15%酵母提取物、 30%葡萄糖、30%半乳糖)。培养48小时后，培养物0D600达到约160。在指定的时间点收集10 μ 1的培养液并通过SDS-PAGE评价分泌蛋白(图3Α-Β)。与标准蛋白条带相比，分泌的SFPl-EHM估算约为500mg/L。离心去除酵母细胞，收集上清液，浓缩并超滤脱盐 (Quickstand, Amersham)。融合蛋白，SFPl-92-E)(D4用Ni-NTA亲和层析柱^IAGEN，USA)纯化(图4，泳道1)。为了从SFP1-92融合蛋白中回收MD-4，纯化的融合蛋白用不同浓度的肠激酶 (Invitrogen, USA)进行消化。将样品溶于肠激酶缓冲液[20mM Tris-HCl (pH8. 0)、50mM NaCl、2mM CaC12]中。将等量的蛋白样品用0. 1,0. 2禾Π 0. 3 μ 1的肠激酶于37°C消化1小时。生成的蛋白用SDS-PAGE进行分析(图4，分别为泳道2、3和4)。产生了数条小的蛋白条带，而不是两个条带。那些小的片段有可能是肠激酶非特异性消化SFPl的结果。SFPl蛋白含有DDK(第137个氨基酸)和EDK(第168个氨基酸) 残基，其有可能是肠激酶的底物。为进一步分析从SFP1-92_E)(D4分离的E )-4，通过HPLC分离肠激酶处理后的样品(图4，泳道3)(图5A)。HPLC谱图中检测到的蛋白峰用SDS-PAGE进行分析(图5B)。 HPLC流分号41显示出预期为EXD-4的单个条带。通过MALDI-TOF(Korea Basic Science hstituthDaejeon，韩国)(图6)进一步分析该蛋白用于确定其分子量(MW)。从SFP1-92 融合蛋白中制备的E)(D-4的MW为4187. 8Da，这与通过其氨基酸序列计算得到的MW相符。为构建抗肠激酶的强SFP1-92融合配偶体，将DDK和EDK残基分别变为DGK和 EGK残基(图7A)。为将DDK残基变成DGK残基，用GAL100引物(SEQ ID NO 8)和含有甘氨酸密码子而不是DDK残基的天冬氨酸密码子的反向突变引物H307 (SEQ ID N0:20)，从 YGaT92-EXD4 中扩增 5，SFPl-92 片段。用与 H307(SEQ ID NO :20)互补的正向引物H306 (SEQ ID NO 21)和 GT50R 引物(SEQ ID NO 14)，从 YGaT92_EXD4 载体中扩增 3，SFP1-92-EXD4 片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/MlI消化后，将这些融合片段克隆到YGaT92-E)(D4载体的BamHI/MlI位点处。确认所生成质粒的核苷酸序列，并命名为含有 SFP1-921 的 YGaT921-EXD4(SEQ ID NO :42)。为将EDK残基变成EGK残基，用GAL100引物(SEQ ID NO 10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309 (SEQ ID NO :22)，从YGaT92_E)(D4中扩增5，SFPl片段。用与H309(SEQ ID NO :22)互补的正向引物H308 (SEQ ID NO :23)禾口 GT50R 引物(SEQ ID NO 14)，从 YGaT92_EXD4 中扩增 3，SFP1-92-EXD4 片段。用 GAL100/ GT50R引物对进行重叠延伸PCR融合这些片段。用BamHI/MlI消化后，将这些融合片段克隆到YGaT92-E)(D4载体的BamHI/MlI位点处。确认所生成质粒的核苷酸序列，并命名为含有 SFP 1-922 的 YGaT922-EXD4(SEQ ID NO :43)。为了分别将DDK和EDK残基都变成DGK和EGK，用GAL100引物(SEQ ID NO 10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309 (SEQ ID N0:22)，从 YGaT91-EXD4中扩增5，SFPl片段。用与H309(SEQ ID NO :22)互补的正向引物H308 (SEQ ID NO 23)和 GT50R 引物(SEQ ID NO :14)，从 YGaT92_E)(D4 中扩增 3，SFP1_E)(D4 片段。用 GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHIAalI消化后，将这些融合片段克隆到YGaT92-E)(D4载体的BamHI/MlI位点处。确认所生成质粒的核苷酸序列，并命名为含有 SFP1-923 的 YGaT922-EXD4 (图 25) (SEQ ID NO 44)。用载体YGaT92-EXD4、YGaT921-EXD4, YGaT922_EXD4 和 YGaT923_EXD4 转化酿酒酵母观05菌株。从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和 2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、葡萄糖、半乳糖)中30°C培养40小时。用0.4mL的丙酮沉淀含有蛋白的0.6mL培养物上清液，并溶于肠激酶缓冲液[20mM Tris-HCl (pH8.0)、50mM NaCl、2mM CaC12]中。将等量的蛋白样品用0. 1 μ 1的肠激酶37°C消化1小时，并用SDS-PAGE进行分离。如图7B所示，由YGaT92_E)(D4转化子制备的SFPl被消化成大约15kDa的片段(图 7B,泳道1)，但由YGaT921-EXD4和YGaT922_EXD4转化子制备的SFPl (图7B，分别为泳道2 和3)比来自于YGaT92-E)(D4的SFPl更抗内源肠激酶的消化。最终，由YGaT923_E)(D4 (SEQ ID NO 59)转化子制备的绝大多数的SFPl片段是完整的(图7B，泳道4)。因此，结果表明，YGaT923-EXD4的SFPl变体可成功应用于表达和纯化目标蛋白。实施例4与SFPl的HL结构域融合的目标蛋白的分泌如实施例2所示，HL结构域在目标蛋白的分泌中发挥着重要作用。HL在目标蛋白分泌中的功能可能是由于HL结构域内带电荷的酸性氨基酸，因为蛋白的可溶性与蛋白的净电荷紧密相关。为研究HL结构域作为融合配偶体的功能，我们使用HL结构域用于E)(D4 的分泌。HL结构域融合到目标蛋白的N-末端。用H221 (SEQ ID NO 24) /GT50R(SEQ ID NO: 14)引物对从 YGaT923-EXD4 载体中扩增 HL-E)(D4 基因，并用 GAL100/LNK-R(SEQ ID NO :25) 引物对扩增交配因子α (MFa)的pre-pro前导肽。由于H221和LNK-R引物(SEQ ID NO: 25)含有互补的连接序列，这两个片段用GAL100 (SEQ ID NO 8)/GT50R(SEQ ID NO :14)引物对通过重叠延伸PCR方法进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/ SalI消化的YGaT92载体片段直接构建YGaMKH-EaM (图26)转化子。YGaMKH-EHM质粒在 MF α的pre-pro前导肽和HL肽之间含有连接肽(AASASAGLALDKR)，用于体内被Kex2p加工。用YGaMKH-EHM转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备SFPl-92-E)(D4融合蛋白的能力。使用种子培养基(6. 7%不含氨基酸的酵母氮源、0. 5%酪蛋白水解物和2%葡萄糖e)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基酵母提取物、蛋白胨、2%葡萄糖)作为初始发酵培养物0D600达到约15时，根据细胞生长速率使用不同用量的补料培养基(15%酵母提取物、30%葡萄糖、 30%半乳糖)。培养48小时后，培养物0D600达到约150。在指定的时间点收集10 μ 1的培养液并通过SDS-PAGE评价分泌蛋白(图8)。与标准蛋白条带相比，分泌的HL-EHM经估算约为200mg/L。为测试HL肽的C-末端融合到目标蛋白的效果，构建质粒YGaST6-E)(D-HL (图27)。用正向引物H412(SEQ ID NO :26)和反向引物H413 (SEQ ID NO :27)从YGaMKH-EaM中扩增出 MD4 基因，并用 HL-F (SEQ ID NO :28)和 HL_GT50R(SEQ ID NO :29)从 YGaMKH_EXD4 中扩增出HL肽。由于H413引物(SEQ ID NO :27)含有与HL-F引物互补的序列，因此这两个片段用H412(SEQ ID NO :26)/GT50R引物对通过段重叠延伸PCR的方法进行融合。H412引物(SEQ ID NO 26)含有连接序列，并可以通过 GAL100 (SEQ ID NO 10)/LNK-R (SEQ ID NO: 25)引物对融合到MF α的pre-pro前导肽中。每个扩增的片段以MFa的pre-pro前导序列、E)(D4和HL结构域基因的顺序用GAL100/GT50R引物通过重叠延伸PCR进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/MlI消化的YGaT92载体片段直接构建 YGaST6-E)(D-HL转化子。用YGaST6_E)(D4-HL转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备EHM-HL融合蛋白的能力。培养48小时后，培养物0D600达到约160。在指定的时间点收集10 μ 1的培养液并通过SDS-PAGE评价分泌蛋白(图9Α和B)。与标准蛋白条带相比，分泌的MD4-HL估算约为500mg/L。在HL融合到EXD4这种情况下，C-末端融合表现出比N-末端融合更高的E)(D4分泌水平。因此，结果表明HL结构域无论是在目标蛋白的N-末端还是C-末端均有助于融合蛋白的分泌。然而， C-末端表现出更高的目标蛋白的分泌。为进一步测试作为融合配偶体的HL结构域，将HL结构域用于表达人表皮生长因子(hEGF)。构建YGaMKH-EGF质粒(图28)。在YGaMKH-EGF中，HL结构域融合到hEGF的N-末端，用 GAL100 (SEQ ID NO 10)/DDK-R(SEQ ID NO :30)引物对从 YGaMKH-EaM 载体中扩增MF α pre-pro肽-HL融合肽基因，并用含有与DDK-R弓丨物互补的序列的正向引物 H410(SEQ ID NO :31)和含有与GT50R(SEQ ID NO :14)相同的序列的反向引物H411 (SEQ ID NO 32)扩增hEGF基因。每个扩增片段用GAL100/GT50R引物对通过重叠延伸PCR进行融合。用所述的融合片段和实施例2所述的BamHIAalI消化的YGaT92载体片段共转化 YGaMKH-EGF 转化子。用YGaMKH-EGF转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备HL-EGF融合蛋白的能力。培养48小时后，培养物0D600达到约155。在指定的时间点收集10 μ 1的培养液并通过SDS-PAGE评价分泌蛋白(图IOA和B)。与标准蛋白条带相比，分泌的HL-EGF估算约为400mg/L。通过Ni-NTA亲和层析对HL-hEGF融合蛋白直接进行纯化(图11A)。为分离hEGF 和HL肽，纯化后的融合蛋白用肠激酶进行消化，产生的片段再次用Ni-NTA亲和层析进行分离。如图IlB所示，完整的纯hEGF(6kD)被有效地纯化出来。HL结构域还用于分泌制备人甲状旁腺素(hPTH)。通过将HL结构域融合到hPTH 的N-末端构建YGaMKH-PTH载体(图四)。用含有与DDK-R引物(SEQ ID NO 30)互补的序列的正向引物H310(SEQ ID NO :33)和含有与GT50R(SEQ ID NO :14)相同的序列的反向引物 H311(SEQ ID NO :34)扩增 hPTH 基因。M GAL100 (SEQ ID NO 10)/GT50R(SEQ ID NO: 14)引物对通过重叠延伸PCR将这个片段和MF α pre-pro肽-HL融合肽基因进行融合。通过共转化所述的融合片段和实施例2所述的BamHIAalI消化的YGaT92载体片段直接构建YGaMKH-PTH转化子。用YGaMKH-PTH转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备HL-PTH融合蛋白的能力。培养48小时后，培养物 0D600达到约120。在指定的时间点收集10 μ 1的培养液并通过SDS-PAGE评价分泌蛋白(图 12Α和B)。与标准蛋白条带相比，分泌的HL-PTH估算约为400mg/L。检测到与HL-PTH相关的两条主要的条带。大部分的hPTH是以60kD的MF α pro-HL-PTH融合形式被检测到，这是由于其在体内被Kex2p不完全裂解。也同样检测到了显示Kex2p裂解的HL-PTH条带。与 PTH相关的所有分泌蛋白估计大于500mg/L。发酵液上清液中的His标记蛋白通过Ni-NTA 亲和层析直接进行纯化。纯化的蛋白在SDS-PAGE中分离出预期的两种条带(图13，泳道 1)。比较大的条带(Pro-HL-PTH)通过体外Kex2p加工后消失了(图13，泳道2、。通过肠激酶的消化，融合蛋白(HL-PTH)被正确分离成HL肽和hPTH肽(泳道3)。实施例1-4表明鉴定和修饰YGR106C基因的最佳区域导致了衍生自SFPl的有效多功能融合配偶体的构建，用于重组蛋白分泌制备和分离。实施例5从酵母分泌蛋白质组中筛选分泌融合配偶体本实施例阐明了用于鉴定作为融合配偶体的大量分泌蛋白的技术。首先，分析正常酵母生长过程中，制备的总酵母分泌蛋白(酵母分泌蛋白质组)。为分离酵母分泌蛋白质组，将酿酒酵母观05菌株培养于基本培养基中(0. 67%不含氨基酸的酵母氮源、0.5%酪蛋白水解物、2%葡萄糖和0.002%尿嘧啶)20小时(Ml)和40小时 (M2)。500mL的培养物上清液通过膜过滤进行浓缩，获得总分泌蛋白。用荧光染料hochest 将酵母细胞染色后，用共焦激光扫描显微镜证实酵母细胞的完整性(图14A和B)。M2分泌蛋白质组样品通过双向凝胶电泳进行分析(图15)。除了用于去除总蛋白样品中的核糖核酸污染而加入的RNaseA，分泌蛋白质组的大多数蛋白在酸性区进行鉴定。如图15所示，双向凝胶电泳不足以鉴定所有M2样品中存在的分泌蛋白。因此，还使用I-DE/ MudPIT(多维蛋白质鉴定技术)方法来更加完整地鉴定酵母的分泌蛋白质组(图16)。结果表明，分别从Ml和M2中鉴定出57个和83个蛋白。综合起来，鉴定出98个特异的蛋白。这中间，有42个蛋白是Ml和M2样品中普遍检测到的。为证实该蛋白最有可能是分泌蛋白，使用两个程序WoLF PSORT和pTARGET进行蛋白的定位预测和信号预测。在42个蛋白中，预测有35个蛋白(80%)为分泌蛋白(表1)。表1通过酵母分泌蛋白质组分析鉴定出的35个基因以及通过MASS分析确定的其蛋白丰富指数(PAI)。
Gi编号标准命名系统命名PAI16320260PSTlYDR055W15. 426323331EXGlYLR300W9. 936321718SCW4YGR279C9. 146324169YGPlYNL160W7. 256321721BGL2YGR282C\5. 866324419ZPSlY0L154W5. 176319552ECM33YBR078W4. 286323964SCWlOYMR305C3. 496323871GAS 3YMR215W3. 4106323967GASlYMR307W2. 8116322895UTHlYKR042W2. 5126323150YPS 3YLR121C2. 2136319638TOSlYBR162C2. 2146321628CRHlYGR189C2. 2156322754CWPlYKL096W1. 5166324002EGT2YNL327W1. 5176324395DSE4YNR067C1. 5
3权利要求
1.一种鉴定分泌融合配偶体(SFP)的方法，所述方法包括(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞； ( )与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述第一宿主细胞是否过量分泌所述的分泌多肽；(iii)用包含编码目标多肽的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞，其中，所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；(iv)在培养条件下培养所述第二宿主细胞，其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽；和(ν)确定所述的融合多肽是否分泌到培养基中；从而鉴定所述的过量分泌多肽是否为SFP。
2.如权利要求1所述的方法，其中所述的分泌多肽因在分泌蛋白质组中大量地表达而被筛选。
3.如权利要求2所述的方法，其中所述的分泌蛋白质组分离自酵母、细菌、植物或动物。
4.如权利要求3所述的方法，其中所述的分泌蛋白质组分离自酵母。
5.如权利要求1所述的方法，其还包括确定用于分泌所述融合多肽或第二融合多肽的所述SFP的最佳大小。
6.如权利要求5所述的方法，其中所述的最佳大小通过所述SFP的缺失分析而确定。
7.如权利要求1所述的方法，其中所述的异源启动子为原核、真核或病毒的启动子。
8.如权利要求7所述的方法，其中所述的异源启动子选自下组λ噬菌体ra启动子、 λ噬菌体PL启动子、λ II、大肠杆菌trp启动子、大肠杆菌recA启动子、大肠杆菌热休克启动子、大肠杆菌IacZ启动子、SV40早期启动子、酵母GAPDH启动子、PGK启动子、ADH启动子、PH05启动子、TEF启动子、GALl启动子、GALlO启动子、鼠乳腺瘤病毒启动子、人免疫缺陷病毒长末端重复启动子、maloney病毒启动子、巨细胞病毒即刻早期启动子、Epstein Barr 病毒启动子、劳斯氏肉瘤病毒启动子、人肌动蛋白启动子、人肌球蛋白启动子、人血红蛋白启动子、人肌酸启动子和人金属硫蛋白启动子。
9.如权利要求8所述的方法，其中所述的异源启动子为GAL10。
10.如权利要求1所述的方法，其中所述的分泌多肽是糖基化的分泌多肽。
11.如权利要求1所述的方法，其中所述第一宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
12.如权利要求11所述的方法，其中所述的第一宿主细胞为酵母细胞。
13.如权利要求12所述的方法，其中所述的第一宿主细胞选自下组念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
14.如权利要求13所述的方法，其中所述第一宿主细胞选自下组产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans.
15.如权利要求1所述的方法，其中所述第二宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
16.如权利要求15所述的方法，其中所述第二宿主细胞为酵母细胞。
17.如权利要求16所述的方法，其中所述第二宿主细胞选自下组念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
18.如权利要求17所述的方法，其中所述的第二宿主细胞选自下组产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans.
19.一种分离的融合多肽，其包括(i)权利要求1所述的SFP或其片段或衍生物；和( )目标多肽。
20.如权利要求19所述的分离的融合多肽，其中所述的SFP包含SEQID N0:84的1_84 位氨基酸或其片段或衍生物。
21.如权利要求20所述的分离的融合多肽，其中所述的SFP包含SEQID NO :84的 1-101位氨基酸或其片段或衍生物。
22.如权利要求21所述的分离的融合多肽，其中所述的SFP包含SEQID NO :84的 1-135位氨基酸或其片段或衍生物。
23.如权利要求22所述的分离的融合多肽，其中所述的SFP包含SEQID NO 84的 1-169位氨基酸或其片段或衍生物。
24.如权利要求23所述的分离的融合多肽，其中所述的SFP包含SEQID NO :84的 1-195位氨基酸或其片段或衍生物。
25.如权利要求M所述的分离的融合多肽，其中所述的SFP包含SEQID NO :84的 1-227位氨基酸或其片段或衍生物。
26.如权利要求25所述的分离的融合多肽，其中所述的SFP包含SEQID NO 84的 1-271位氨基酸或其片段或衍生物。
27.如权利要求沈所述的分离的融合多肽，其中所述的SFP包含SEQID NO :84的 1-364位氨基酸或其片段或衍生物。
28.如权利要求19所述的分离的融合多肽，其中所述SFP选自下组BGL2(SEQ ID NO 80)、GAS3(SEQ ID NO :81)、GAS5 (SEQ ID NO :82)、PSTl (SEQ ID NO :83)、SCW4 (SEQ ID NO: 84),SCfflO(SEQ ID NO :85)、SIMI(SEQ ID NO :86)、UTH1 (SEQ ID NO :87)、YGPl(SEQ ID NO: 88)、YPSl(SEQ ID NO :89)和 ZPSl (SEQ ID NO :90)。
29.如权利要求19所述的分离的融合多肽，其中SFP由选自下组的多核苷酸编码 BGL2(SEQ ID NO :62)、GAS3(SEQ ID NO :63)、GAS5 (SEQ ID NO :64)、PSTl (SEQ ID NO :65)、 SCW4(SEQ ID NO 66),SCfflO(SEQ ID NO :67)、SIMI(SEQ ID NO :68)、UTH1(SEQ ID NO :69)、 YGPl (SEQ ID NO :70)、YPSl (SEQ ID NO :71)禾口 ZPSl (SEQ ID NO :72)。
30.如权利要求19所述的分离的融合多肽，其中所述目标多肽选自下组人白细胞介素-2 (hIL-2)、毒蜥外泌肽_3、毒蜥外泌肽-4 (EXD4)、胰高血糖素样肽_1 (GLP-I)、甲状腺激素(PTH)、人白细胞介素-1 β、人白细胞介素-6、人白细胞介素-32 α、-32 β或32 γ、VII 因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-Y、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、入神经生长因子、人转化生长因子β -1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、 β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YIQ&2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白M、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
31.如权利要求30所述的分离的融合多肽，其中所述的目标多肽为E)(D4。
32.如权利要求30所述的分离的融合多肽，其中所述的目标多肽为hGH。
33.如权利要求31所述的分离的融合多肽，其中所述的融合多肽由SCW4-3-E)(D4(SEQ ID NO 61)编码。
34.如权利要求32所述的分离的融合多肽，其中所述的融合多肽由SCW4-4-hGH(SEQ ID NO 73)编码。
35.如权利要求19所述的分离的融合多肽，其中SFP融合到目标多肽的N-末端。
36.如权利要求19所述的分离的融合多肽，其中SFP融合到目标多肽的C-末端。
37.一种分离的融合多肽，其包括(i)包括含有SEQ ID NO 1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物，其中所述的SFP没有跨膜结构域(TM)；和( )目标多肽。
38.如权利要求37所述的分离的融合多肽，其中SFP融合到目标多肽的N-末端。
39.如权利要求37所述的分离的融合多肽，其中所述SFP融合到目标多肽的C-末端。
40.如权利要求37所述的分离的融合多肽，其中所述SFP由包括SEQID NO 39的多核苷酸或其片段或衍生物编码。
41.如权利要求37所述的分离的融合多肽，其中所述SFP由包括SEQID NO :42的多核苷酸或其片段或衍生物编码。
42.如权利要求37所述的分离的融合多肽，其中所述SFP由包括SEQID NO :43的多核苷酸或其片段或衍生物编码。
43.如权利要求37所述的分离的融合多肽，其中所述SFP由包括SEQID NO :44的多核苷酸或其片段或衍生物编码。
44.如权利要求37所述的分离的融合多肽，其中所述的HL结构域由包括SEQID NO 45的多核苷酸或其片段或衍生物编码。
45.如权利要求37所述的分离的融合多肽，其中所述的目标多肽选自下组人白细胞介素-2 (hIL-2)、毒蜥外泌肽_3、毒蜥外泌肽-4 (EXD4)、胰高血糖素样肽_1 (GLP-I)、甲状腺激素(PTH)、人白细胞介素-1 β、人白细胞介素_6、人白细胞介素-32 α、-32 β或32 γ、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-Y、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β -1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、 β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YIQ&2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白M、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
46.如权利要求45所述的分离的融合多肽、其中所述的目标多肽为IL2。
47.如权利要求45所述的分离的融合多肽，其中所述的目标多肽为E)(D4。
48.如权利要求45所述的分离的融合多肽，其中所述的目标多肽为EGF。
49.如权利要求45所述的分离的融合多肽，其中所述的目标多肽为PTH。
50.如权利要求19 49任一项所述的分离的融合多肽，其还包括亲和标签。
51.如权利要求50所述的分离的融合多肽，其中所述的亲和标签选自下组GST、MBP、 NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP, CBD, S-标签和其任意组合。
52.如权利要求51所述的分离的融合多肽，其中所述的亲和标签为6HIS。
53.如权利要求19 52任一项所述的分离的融合多肽，其还包括连接肽，其中所述的连接是插入在所述SFP和所述目标多肽之间。
54.如权利要求53所述的分离的融合多肽，其中所述的连接肽包含蛋白酶识别序列，从而允许SFP和目标多肽之间发生裂解。
55.如权利要求M所述的分离的融合多肽，其中所述的蛋白酶识别序列选自下组酵母kex2p-识别序列、kex2p样蛋白酶-识别序列、哺乳动物弗林蛋白酶-识别序列、肠激酶-识别序列、枯草杆菌蛋白酶-识别序列、烟草蚀纹病毒蛋白酶-识别序列、凝血酶-识别序列、泛素水解酶-识别序列和其任意组合。
56.如权利要求55所述的分离的融合多肽，其中所述的蛋白酶识别序列为肠激酶-识别序列。
57.如权利要求56所述的分离的融合多肽，其中所述的蛋白酶识别序列包含氨基酸序列 Asp-Asp-Lys0
58.如权利要求55所述的分离的融合多肽，其中所述的蛋白酶识别序列为kex2p样蛋白酶-或kex2p-识别序列。
59.如权利要求53所述的分离的融合多肽，其中所述的连接肽包含亲和标签。
60.如权利要求59所述的分离的融合多肽，其中所述的亲和标签选自下组GST、MBP、 NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP, CBD, S-标签和其任意组合。
61.如权利要求60所述的分离的融合多肽，其中所述的亲和标签为6HIS。
62.如权利要求53所述的分离的融合多肽，其中所述的连接肽由包含限制性内切酶的识别位点的多核苷酸编码。
63.一种构建体，其包括⑴启动子；( )编码权利要求1所述SFP或其片段或衍生物的第一多核苷酸；和(iii)编码目标多肽的第二多核苷酸。
64.一种构建体，其包括⑴启动子；(ii)编码包含SEQID NO 1的176-213位氨基酸或其片段或衍生物的SFP的第一多核苷酸，其中所述SFP无跨膜结构域(TM)；和(iii)编码目标多肽或其衍生物的第二多核苷酸。
65.如权利要求63所述的构建体，其中所述的第一多核苷酸编码选自下组的SFP: BGL2(SEQ ID NO :80)、GAS3(SEQ ID NO :81)、GAS5 (SEQ ID NO :82)、PSTl (SEQ ID NO :83)、 SCW4(SEQ ID NO 84),SCfflO(SEQ ID NO :85)、SIMI(SEQ ID NO :86)、UTH1(SEQ ID NO :87)、 YGPl (SEQ ID NO :88)、YPSl (SEQ ID NO :89)和 ZPSl (SEQ ID NO :90)。
66.如权利要求63所述的构建体，其中所述的第一多核苷酸选自下组BGL2(SEQ ID NO 62)、GAS3 (SEQ ID NO :63)、GAS5 (SEQ ID NO :64)、PSTl (SEQ ID NO :65)、SCW4 (SEQ ID NO :66)、SCWlO(SEQ ID NO :67)、SIMI (SEQ ID NO :68)、UTHl (SEQ ID NO :69)、YGPl(SEQ ID NO 70)、YPSl(SEQ ID NO :71)和 ZPSl (SEQ ID NO :72)。
67.如权利要求63所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-252核酸或其片段或衍生物。
68.如权利要求67所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-303核酸或其片段或衍生物。
69.如权利要求68所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-405核酸或其片段或衍生物。
70.如权利要求69所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-507核酸或其片段或衍生物。
71.如权利要求70所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-585核酸或其片段或衍生物。
72.如权利要求71所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-681核酸或其片段或衍生物。
73.如权利要求72所述的构建体，其中所述的第一多核苷酸包含SEQID NO 66的 1-813核酸或其片段或衍生物。
74.如权利要求73所述的构建体，其中所述的第一多核苷酸包含SEQID NO :66的 1-1092核酸或其片段或衍生物。
75.如权利要求63所述的构建体，其中第一多核苷酸和第二多核苷酸编码在目标多肽的N-末端融合的SFP。
76.如权利要求63所述的构建体，其中第一多核苷酸和第二多核苷酸编码在目标多肽的C-末端融合的SFP。
77.如权利要求64所述的构建体，其中所述的第一多核苷酸为SEQID NO :39或其片段或衍生物。
78.如权利要求64所述的构建体，其中所述的第一多核苷酸为SEQID NO :42或其片段或衍生物。
79.如权利要求64所述的构建体，其中所述的第一多核苷酸为SEQID NO :43或其片段或衍生物。
80.如权利要求64所述的构建体，其中所述的第一多核苷酸为SEQID NO 44或其片段或衍生物。
81.如权利要求64所述的构建体，其中所述的第一多核苷酸为SEQID NO :45或其片段或衍生物。
82.如权利要求64所述的构建体，其中第一多核苷酸和第二多核苷酸编码在目标多肽的N-末端融合的SFP。
83.如权利要求64所述的构建体，其中第一多核苷酸和第二多核苷酸编码在目标多肽的C-末端融合的SFP。
84.如权利要求63 83任一项所述的构建体，其中所述的构建体为载体。
85.如权利要求63 84任一项所述的构建体，其中所述的启动子为原核、真核或病毒的启动子。
86.如权利要求85所述的构建体，其中所述的启动子选自下组λ噬菌体冊启动子、 λ噬菌体PL启动子、λ II、大肠杆菌trp启动子、大肠杆菌recA启动子、大肠杆菌热休克启动子、大肠杆菌IacZ启动子、SV40早期启动子、酵母GAPDH启动子、PGK启动子、ADH启动子、PH05启动子、TEF启动子、GALl启动子、GALlO启动子、鼠乳腺瘤病毒启动子、人免疫缺陷病毒长末端重复启动子、maloney病毒启动子、巨细胞病毒即刻早期启动子、Epstein Barr 病毒启动子、劳斯氏肉瘤病毒启动子、人肌动蛋白启动子、人肌球蛋白启动子、人血红蛋白启动子、人肌酸启动子和人金属硫蛋白启动子。
87.如权利要求86所述的构建体，其中所述的启动子为GAL10。
88.如权利要求63 87任一项所述的构建体，其中所述的第二多核苷酸编码选自下组的目标多肽人白细胞介素_2(hIL-2)、毒蜥外泌肽_3、毒蜥外泌肽-4(EHM)、胰高血糖素样肽-1 (GLP-I)、甲状腺激素(PTH)、人白细胞介素-1 β、人白细胞介素_6、人白细胞介素-32α、-32β或32y、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β 或-Y、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β -1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YIQ&2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白 24、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
89.如权利要求63 88任一项所述的构建体，还包括亲和标签。
90.如权利要求89所述的融合多肽的构建体，其中所述的亲和标签选自下组GST、 MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP, CBD, S-标签和其任意组合。
91.如权利要求90所述的融合多肽的构建体，其中所述的亲和标签为6HIS。
92.如权利要求63 91任一项所述的构建体，其还包括连接DNA，其中所述的连接DNA 插入到所述的第一多肽和第二多肽之间。
93.如权利要求92所述的构建体，其中所述的连接DNA编码蛋白酶识别序列，从而允许 SFP和目标多肽之间发生裂解。
94.如权利要求93所述的构建体，其中所述的蛋白酶识别序列选自下组酵母 kex2p-识别序列、kex2p样蛋白酶-识别序列、哺乳动物弗林蛋白酶-识别序列、肠激酶_识别序列、枯草杆菌蛋白酶-识别序列、烟草蚀纹病毒蛋白酶-识别序列、凝血酶-识别序列、泛素水解酶-识别序列和其任意组合。
95.如权利要求94所述的构建体，其中所述的蛋白酶识别序列为肠激酶-识别序列。
96.如权利要求95所述的构建体，其中所述的肠激酶-识别序列为氨基酸序列 Asp-Asp-Lys0
97.如权利要求94所述的构建体，其中所述的蛋白酶识别序列为kex2p样蛋白酶-或 kex2p-识别序列。
98.如权利要求92所述的构建体，其中所述的连接DNA编码亲和标签。
99.如权利要求98所述的构建体，其中所述的亲和标签选自下组GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签和其任意组合。
100.如权利要求99所述的构建体，其中所述的亲和标签为6HIS。
101.如权利要求92所述的构建体，其中所述的连接DNA包含限制性内切酶的识别位点ο
102.含有权利要求63 101任一项所述的构建体的宿主细胞。
103.如权利要求102所述的宿主细胞，其中所述的宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
104.如权利要求103所述的宿主细胞，其中所述的宿主细胞为酵母细胞。
105.如权利要求104所述的宿主细胞，其中所述的酵母细胞选自下组念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
106.如权利要求105所述的宿主细胞，其中所述的酵母细胞选自下组朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans.
107.如权利要求102所述的宿主细胞，其中所述的宿主细胞为kex2突变体。
108.一种重组制备目标多肽的方法，其包括(i)用编码SFP的多核苷酸和编码目标多肽的多核苷酸转化宿主细胞；( )在培养条件下培养所述的宿主细胞，其中从所述的宿主细胞中制备并分泌出包含融合到所述目标多肽的所述SFP的融合多肽；和(iii)分离所述的融合多肽。
109.如权利要求108所述的方法，其中所述的编码SFP的多核苷酸和编码目标多肽的多核苷酸为单个构建体的一部分。
110.如权利要求108所述的方法，其中所述的编码SFP的多核苷酸和编码目标多肽的多核苷酸为多个构建体的一部分。
111.如权利要求110所述的方法，其中所述的多个构建体是线性的。
112.如权利要求111所述的方法，其中所述的多个构建体通过同源重组的方法进行重组。
113.如权利要求108所述的方法，其中所述的SPF和所述的目标多肽通过内切蛋白酶切割进行分离。
114.如权利要求108所述的方法，其中所述的融合多肽还包括亲和标签。
115.如权利要求114所述的方法，其中所述的亲和标签选自下组GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签和其任意组合。
116.如权利要求115所述的方法，其中所述的亲和标签为6HIS。
117.如权利要求108所述的方法，其中所述的融合多肽还包括连接肽，其中所述的连接肽插入在所述SFP和所述的目标多肽之间。
118.如权利要求117所述的方法，其中所述的连接肽包含蛋白酶识别序列，从而允许 SFP和目标多肽之间发生裂解。
119.如权利要求118所述的方法，其中所述的蛋白酶识别序列选自下组酵母 kex2p-识别序列、kex2p样蛋白酶-识别序列、哺乳动物弗林蛋白酶-识别序列、肠激酶_识别序列、枯草杆菌蛋白酶-识别序列、烟草蚀纹病毒蛋白酶-识别序列、凝血酶-识别序列、泛素水解酶-识别序列和其任意组合。
120.如权利要求119所述的方法，其中所述的蛋白酶识别序列为肠激酶-识别序列。
121.如权利要求120所述的方法，其中所述的肠激酶-识别序列为氨基酸 Asp-Asp-Lys0
122.如权利要求119所述的方法，其中所述的蛋白酶识别序列为kex2p样蛋白酶-或 kex2p-识别序列。
123.如权利要求117所述的方法，其中所述的连接肽包含亲和标签。
124.如权利要求123所述的方法，其中所述的亲和标签选自下组GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD 和 S-标签。
125.如权利要求IM所述的方法，其中所述的亲和标签为6HIS。
126.如权利要求108所述的方法，其中所述的宿主细胞通过补料发酵进行培养。
127.如权利要求108 1 任一项所述的方法，其中所述SFP或其片段或衍生物通过权利要求1所述的方法进行鉴定。
128.如权利要求127所述的方法，其中所述SFP包含SEQID NO 84的1_84位氨基酸或其片段或衍生物。
129.如权利要求1 所述的方法，其中所述SFP包含SEQID NO :84的1-101位氨基酸或其片段或衍生物。
130.如权利要求1 所述的方法，其中所述SFP包含SEQID NO 84的1-135位氨基酸或其片段或衍生物。
131.如权利要求130所述的方法，其中所述SFP包含SEQID NO 84的1-169位氨基酸或其片段或衍生物。
132.如权利要求所述的方法，其中所述SFP包含SEQID NO 84的1-195位氨基酸或其片段或衍生物。
133.如权利要求132所述的方法，其中所述SFP包含SEQID NO 84的1-227位氨基酸或其片段或衍生物。
134.如权利要求133所述的方法，其中所述SFP包含SEQID NO 84的1-271位氨基酸或其片段或衍生物。
135.如权利要求134所述的方法，其中所述SFP包含SEQID NO 84的1-364位氨基酸或其片段或衍生物。
136.如权利要求108 1 任一项所述的方法，其中SFP选自下组BGL2(SEQID NO 80)、GAS3(SEQ ID NO :81)、GAS5 (SEQ ID NO :82)、PSTl (SEQ ID NO :83)、SCW4 (SEQ ID NO: 84),SCfflO(SEQ ID NO :85)、SIMI(SEQ ID NO :86)、UTHl(SEQ ID NO :87)、YGPl(SEQ ID NO: 88)、YPSl(SEQ ID NO :89)和 ZPSl (SEQ ID NO :90)。
137.如权利要求108 1 任一项所述的方法，其中编码SFP的多核苷酸选自下组 BGL2(SEQ ID NO :62)、GAS3(SEQ ID NO :63)、GAS5 (SEQ ID NO :64)、PSTl (SEQ ID NO :65)、 SCW4(SEQ ID NO 66),SCfflO(SEQ ID NO :67)、SIMI(SEQ ID NO :68)、UTH1(SEQ ID NO :69)、 YGPl(SEQ ID NO :70)、YPSl(SEQ ID NO :71)禾口 ZPSl (SEQ ID NO :72)。
138.如权利要求108 1 任一项所述的方法，其中所述SFP包括含有SEQID NO 1 的176-213位氨基酸的亲水(HL)结构域或其片段或衍生物；其中所述SFP没有跨膜结构域 (TM)。
139.如权利要求138所述的方法，其中所述SFP由SEQID NO 39或其片段或衍生物编码。
140.如权利要求138所述的方法，其中所述SFP由SEQID NO 42或其片段或衍生物编码。
141.如权利要求138所述的方法，其中所述SFP由SEQID NO 43或其片段或衍生物编码。
142.如权利要求138所述的方法，其中所述SFP由SEQID NO :44或其片段或衍生物编码。
143.如权利要求138所述的方法，其中所述SFP由SEQID NO 45或其片段或衍生物编码。
144.权利要求108 143任一项所述的方法，其中所述的目标多肽选自下组人白细胞介素-2(hIL-2)、毒蜥外泌肽-3、毒蜥外泌肽-4 (E)(D4)、胰高血糖素样肽_1 (GLP-I)、甲状腺激素(PTH)、人白细胞介素-1 β、人白细胞介素-6、人白细胞介素-32 α、-32 β或32 γ、 VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-Y、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β -1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YIQ&2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白M、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
145.用权利要求108 144任一项所述的方法重组制备的目标多肽。
全文摘要
本发明涉及鉴定用于超量分泌制备重组蛋白质的合适的分泌融合配偶体(SFP)的方法。SFP可通过分泌蛋白质组分析获得。重组蛋白可与分泌融合配偶体(SFP)一起以融合蛋白形式制备得到，并通过体外蛋白酶处理与SFP相分离。本发明的SFP极大地提高了目标蛋白和肽的分泌水平，所述目标蛋白和肽对于生物制药和生物产业很有价值。
文档编号C07K19/00GK102239183SQ200880132268
公开日2011年11月9日申请日期2008年12月5日优先权日2008年12月4日
发明者孙廷薰, 林光默, 裴贞勋, 金承一, 金炫辰申请人:韩国生命工学研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙廷薰
技术所有人：韩国生命工学研究院
我是此专利的发明人

上一篇：修饰的变体bowman birk蛋白酶抑制剂的制作方法
上一篇：制备单硝基苯的绝热工艺的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。