用于靶向重组多肽的表达和控制其翻译后修饰的一组序列的制作方法

文档序号:439390阅读:1426来源:国知局
专利名称:用于靶向重组多肽的表达和控制其翻译后修饰的一组序列的制作方法
技术领域
本发明涉及重组蛋白生产的领域,更具体地涉及生产下述重组多肽的方法,所述重组多肽在内质网(ER)和/或高尔基体(GA)中发生翻译后修饰。本发明提供了可用于控制重组多肽的翻译后修饰的工具,并且更普遍地提供了用于植物遗传修饰的DNA操作工具。本发明还提供了涉及这些工具的重组多肽生产方法。
本发明的工具包括靶向信号,其允许重组多肽在其宿主细胞中合成期间分选至特定的亚细胞区室,并且还允许在所述亚细胞区室中对所述重组多肽进行特定的设计。有利地,本发明允许例如提高重组多肽生产的产率,限制或防止重组多肽的免疫原性和获得有治疗活性的重组多肽,所述重组多肽是其天然对应物的精确拷贝。
本发明尤其涉及植物制成药物(plants made pharmaceutical,PMP)的再定向(reorientation)领域。
本发明还涉及通过利用与融合有靶向信号的单链可变片段(ScFv)的蛋白质相互作用而对植物制成药物进行免疫靶向的领域。
本发明还涉及对参与植物制成药物的翻译后修饰的植物酶进行再定向的领域。
本发明还涉及对参与植物制成药物的翻译后修饰的异源酶进行再定向的领域。
现有技术 重组DNA技术使得能够在宿主系统中生产异源重组蛋白。大部分早期工作指向在原核生物宿主中(主要在大肠杆菌(Escherichia coli)中)表达重组的治疗性蛋白质。原核生物作为生产系统的优点是易于对其进行遗传操作、其快速生长以及重组蛋白的高水平表达和大规模发酵的可能性。
然而,一些翻译后修饰(post-translational modification,PTM)在原核生物中可能不能进行,所述翻译后修饰包括信号肽切割、原肽(propeptide)加工、蛋白质折叠、二硫键形成和糖基化。因此,在原核生物中生产的复杂的治疗性蛋白质并不总是被正确折叠或加工从而提供期望的生物活性水平。因此,微生物表达系统一般用于表达相对简单的治疗性蛋白质如胰岛素、干扰素或人生长激素,它们不需要折叠或大量的翻译后加工就具有生物活性。
由于原核生物用于生产治疗性蛋白质的局限性,生物技术工业已经致力于真核生物宿主,如哺乳动物细胞培养物、酵母、真菌、昆虫细胞和转基因动物。然而,这些生产系统可具有不同的缺点如昂贵的发酵、低产率、分泌问题、高运行成本、难于按比例扩大至大体积以及可能被病毒或朊病毒污染(Gomord等2004(参考文献23))。
植物细胞和植物悬浮培养细胞可代表一种优良的替代方案成本优势、无针对人的病原体污染(Gomord等2004(参考文献23))。
但是,所有真核细胞的一个主要问题是不正确的转录后修饰(PTM)。
事实上,绝大部分治疗性蛋白质发生多种PTM,这是来自基因的遗传信息指导功能性基因产物形成的最终步骤。
在本说明书中,术语“PTM”涵盖了产生个体氨基酸残基衍生物的共价修饰,例如糖基化(glycosylation)、磷酸化、甲基化、ADP-核糖基化、氧化和糖化(glycation);通过涉及多肽主链的反应进行的蛋白质水解加工;以及非酶促修饰,如脱酰胺化、外消旋化和蛋白质构象的自发改变。
大部分PTM依赖于真核细胞中内膜系统的存在。分泌途径由内质网(ER)、高尔基体(GA)、液泡形成体、溶酶体区室、质膜和细胞外介质组成,如附

图1中所示。最近的研究显示,早期区室(ER和GA)可能由膜连续体(membrane continuum)组成(见图1)。然而,对蛋白质在ER中、ER和GA之间和高尔基体中的转运进行的详细研究显示,蛋白质被亚区室化到植物细胞中在酶方面不同的四个区域中(见图1蓝色、黄色、绿色和橙色区域)。
大部分治疗性蛋白质通过共翻译插入ER腔中,然后通过GA转运至溶酶体区室、细胞外基质或血流中,所述治疗性蛋白质包括血液蛋白质、细胞因子、免疫球蛋白、结构蛋白、(生长)激素、疫苗、酶和溶酶体蛋白质。治疗性蛋白质的多数修饰发生在分泌途径中,特别是在其早期区室中(ER和GA,见Gomord和Faye,2004(参考文献21))。
例如,凝血因子IX是维生素K依赖性糖蛋白,其作为461个氨基酸的前体分子在ER中合成。为了获得有生物活性的因子IX,该前体在ER和GA中发生大量的翻译后修饰,包括信号肽和原肽的切割,二硫键形成,前12个谷氨酸残基的γ-羧基化,天冬氨酸64的部分β-羟基化,天冬酰胺(Asn)157和Asn 167处的N-联糖基化,丝氨酸(Ser)63、Ser 61、苏氨酸(Thr)159、Thr 169、Thr 172和Thr 179处的O-联糖基化,酪氨酸(Tyr)155的硫酸化,以及Ser 158的磷酸化。这是所观察到的最复杂的治疗性蛋白质成熟之一。
更一般地,大部分治疗性蛋白质至少需要蛋白水解切割(proteolyticcleavage)和糖基化来实现其生物活性、药物代谢动力学、稳定性和溶解度。
真核细胞能够实现这些修饰中的大部分。然而,这些成熟更一般地是宿主系统特异性的。另外,翻译后修饰在哺乳动物细胞和植物细胞中是不同的。在植物中,像在其它真核细胞中一样,N-糖基化在ER中开始,将寡糖前体(Glc3Man9GlcNAc2)通过共翻译添加至组成潜在N-糖基化序列Asn-X-Ser/Thr的特定天冬酰胺残基上。一旦转移到初生蛋白(nascentprotein)上并且该分泌型糖蛋白沿着分泌途径被转运,则寡糖前体发生多种成熟,包括在ER和GA中去除或添加糖残基,如附图2中所示。植物和哺乳动物的N-聚糖成熟仅在晚期GA中存在差异,这导致PMP的N-聚糖中缺少α-(1,6)-连接的岩藻糖、β-(1,4)-连接的半乳糖和唾液酸,以及存在平分型β-(1,2)-木糖和核心α-(1,3)-岩藻糖(见附图2)。
在本文上下文中,非常重要的是能够控制异源表达系统中的共翻译成熟和翻译后成熟。
对植物ER驻留蛋白(ER-resident protein)的结构分析显示,它们主要含有高甘露糖型的N-聚糖(Navazio等,1997(参考文献41),1998(参考文献42);Pagny等,2000(参考文献49))。这些寡糖结构是植物和哺乳动物共有的,并因此不具有免疫原性。该观察提出了一种防止免疫原性残基如β-(1,2)-木糖或α-(1,3)-岩藻糖与植物制成药物(PMP)N-聚糖结合的策略。该策略在于在ER(即高尔基体囊膜上游)中储存重组蛋白,在那里免疫原性糖-表位被添加至复杂的植物N-聚糖。首先显示的是,在重组的可溶蛋白质C端添加H/KDEL序列足以使其停留在植物ER中(Gomord等,1997(参考文献24)、1999(参考文献22)、Saint-Jore-Dupas等,2004(参考文献57))。
使用相同的策略,我们将H/KDEL-ER停留序列与两种不同抗体的抗体重链和轻链二者融合。这些抗体仅存在非免疫原性的高甘露糖型N-聚糖(Sriraman等,2004(参考文献59);Petrucelli等,2006(参考文献51)),表明基于聚糖成熟的非常有效的再循环受到位于ER和高尔基体顺面(cis-Golgi)的酶限制,所述酶例如为α-甘露糖苷酶I(Nebenfuhr等,1999(参考文献43))。因此,有可能通过与ER停留信号融合来防止免疫原性N-聚糖与PMP的结合。
相反,对于负责维持植物ER中与膜结合的蛋白质的分子信号所知甚少。
事实上,仅很少的研究提供了C端双赖氨酸基序(Barrieu和Chrispeels,1999(参考文献3);Benghezal等2000(参考文献4);McCartney等,2004(参考文献35);Reyes等2006(参考文献53))、跨膜结构域(TMD)长度(Brandizzi等,2002a(参考文献9)或富含芳香族氨基酸的ER回收信号(McCartney等,2004(参考文献35))的作用。α-葡萄糖苷酶I是参与N-联寡糖前体成熟的第一种酶,该酶在寡糖前体“整体(en block)”转移至新生糖蛋白上后立即从寡糖前体上特异性去除远端的α-(1,2)-连接的葡萄糖残基(见图2)。这种II型膜蛋白的功能(以及因此其在ER中的定位)是关键性的。事实上在哺乳动物细胞中,其在新生儿中的缺乏诱发严重的全身性张力过低和畸形特征,在74日龄时达到致死的结果(De Praeter等,2000(参考文献14))。
除糖基化外,向分泌途径下游前进的蛋白质通常发生特定的蛋白水解加工,如靶向信号和调节肽的切割。如对N-糖基化而言,文献中的近期论据提出,分泌途径中的蛋白水解成熟在植物和哺乳动物细胞中是相似的。这些成熟对内源及重组蛋白的加工均是必要的,但是它们也使得以高产率生产稳定的、完整的多肽成为具有挑战性的工作。这些蛋白水解成熟也取决于蛋白质累积的亚细胞区室(Faye等,2005(参考文献17))。
通过分泌途径转运的许多植物蛋白质首先作为前原蛋白(pre-proprotein)(在以下的说明书中也称作“未经翻译后修饰的”)合成,其包含N端可切割的信号肽(或前区,pre-region,将初生多肽链引导至内质网),和调节性原(多)肽(或原区,pro-region,涉及在成熟蛋白质转运到最终细胞目的地并加工之前的稳定化、靶向、抑制和/或折叠)。通过信号肽酶去除其信号肽后,蛋白质被释放进ER腔,从而被正确地装配和折叠,然后转运至GA,并最终进一步向下游转运到分泌系统的不同区室。
许多植物蛋白作为原蛋白离开ER,原区在其分泌途径路径的下游被蛋白水解切割。许多带有C端或N端可切割分选信号的液泡蛋白都是这种情况,所述分选信号在蛋白质转运至液泡期间或之后被特定的蛋白酶去除。具体地,存在于空泡和细胞壁中的Asn特异性半胱氨酸蛋白酶会参与多种分泌型蛋白质的加工,所述分泌型蛋白质包括种子储藏蛋白如2S白蛋白和11S球蛋白,以及具有抗微生物或抗饲育剂/抗消化剂活性的蛋白质如发病机制相关蛋白质、甲壳酶、葡聚糖酶、凝集素和创伤诱导型蛋白酶抑制因子。在哺乳动物细胞中,多种分泌蛋白首先作为无活性的原蛋白前体合成,接着在通过分泌途径移动时被可溶的或与膜结合的蛋白酶对其进行翻译后加工。
在许多情况下,通过枯草杆菌蛋白酶样原蛋白转化酶完成限制性蛋白水解对蛋白质前体的活化,所述枯草杆菌蛋白酶样原蛋白转化酶是在结构上与细菌枯草杆菌蛋白酶和酵母kexin相似的酶家族。哺乳动物原蛋白转化酶(包括值得注意的弗林蛋白酶和二元特异性kexin样蛋白酶(dibasic-specific kexin-like protease))通常在共有序列(Arg/Lys)-Xn-(Arg/Lys)处切割蛋白质前体,其中X是除Cys以外的任何氨基酸,且n=0、2、4或6。在体内,通常存在于反面高尔基网中的这些酶将多种蛋白质前体转化为成熟蛋白,从而直接或间接有助于对重要过程的精细控制,所述重要过程例如酶原活化、基因表达、细胞周期、程序性细胞死亡、细胞内蛋白质靶向以及内分泌/神经功能。
在实践中,已提供了若干例子来显示在植物中将动物原蛋白正确加工成其生物活性形式。针对人原胶原蛋白提供了一个有趣的例子,显示其在烟草细胞中在切割其C端和N端原肽之后转化为成熟蛋白(Lienard等,2006(参考文献32))。
如最近对茄科(Solanaceae)蛋白质加工酶的研究所示,哺乳动物加工转化酶的功能性同源物与蛋白质沿着植物细胞分泌途径成熟相关。显示在能够正确加工病毒抗真菌剂(KP6杀伤原毒素(killer protoxin))的转基因烟草株系中存在kex2p样蛋白酶活性。随后显示,这种在高尔基体驻留的kex2p样转化酶显示酵母kex2p特征性的底物特异性,这与显示不同特异性的来自番茄的细胞外原蛋白转移酶LeSBT1相反,而与属于同一加工酶亚家族的哺乳动物转化酶SKI-1相似(Jansik等2000(参考文献31);Rautengarden等,2005(参考文献52))。
近期,在拟南芥(Arabidopsis)中发现了对发生脂质修饰的蛋白质的C端四肽CAAX基序进行加工的酵母和哺乳动物CAAX蛋白酶的功能同源物,再次证实了沿着真核细胞分泌途径发生了高度保守的蛋白水解过程(Bracha等,2002(参考文献7))。
从实践的角度来看,在细胞水平上的这些保守过程与N-糖基化的总体保守特性一起有力地指出,植物系统有可能用于表达和正确加工需要复杂的翻译后修饰的多种生物或治疗相关性蛋白质。
在植物中,α-葡萄糖苷酶I在拟南芥(Arabidopsis thaliana)胚胎发育期间的储藏蛋白累积、蛋白质体形成、细胞分化和细胞壁破坏中是基础性的(primordial)。没有α-葡萄糖苷酶I活性时,拟南芥种子发育被阻断在心期(Boisson等,2001(参考文献6)),并且细胞壁生物合成受到强烈影响(Gillmor等,2002(参考文献19))。
本领域仍然存在对下述手段的需要,所述手段用于通过遗传重组生产蛋白质,尤其是在真核宿主中(特别是在植物细胞中)生产,从而生产经设计或改造的经转录后修饰的重组蛋白,以例如在宿主中表达下述异源蛋白质,所述异源蛋白质与其天然对应物基本相同并具有尽可能小的免疫原性,从而可用作治疗性物质,尤其是用于人。
本发明人鉴定了赋予拟南芥葡萄糖苷酶I以ER驻留属性的两类独立的信号。使用与GFP融合的这种葡萄糖苷酶的多种缺失或突变体,他们显示全长的拟南芥α-葡萄糖苷酶I(在下文称作GCSI)严格地在ER中累积,并含有足以将报告子靶向至ER的位于胞质尾区中的基于Arg的基序。然而,将全长GCSI定位于该区室中不需要这些功能性的基于Arg的信号,并在与膜结合的该ER酶的茎中鉴定了第二种信号。
本发明人鉴定了赋予拟南芥糖基转移酶以GA驻留的三类独立的信号。
发明描述 精确地讲,本发明的目的是提供响应该需要的有效工具。本发明的工具是下述形式靶向或停留信号和涉及这些靶向信号的方法。本发明一般涉及通过使用这些靶向或停留信号以不同方式对重组多肽的翻译后成熟进行修饰。
根据本发明人对植物或人的酶(例如糖苷酶和糖基转移酶)转运和定位的大量研究,本发明人已鉴定了特异性参与ER和GA之间膜蛋白分布(尤其是在植物细胞中)的不同肽信号。
因此,本发明的第一方面是提供特定的肽信号,其允许(尤其是在植物细胞中)重组多肽停留在特定的细胞亚区室中。这些肽信号的序列和结构在下文描述。本发明的肽信号还列于附带的序列表中,参照SEQ IDn°1到SEQ IDn°31。下文中,这些肽信号可被称作“停留信号序列”或“信号序列”或“靶向信号”或“肽信号”。本发明范围内优选的序列是表I中公开的序列。
本发明的停留信号序列将重组多肽特异性地靶向(尤其是在植物细胞中)至ER和/或GA区室膜。这些序列允许重组多肽停留在ER中和/或不同的GA亚区室中,或者以膜结合的形式停留在ER中和/或不同的GA亚区室中。“靶向”表示与本发明肽信号融合的多肽会因为该肽信号而定位(即限制)于ER和/或GA中。
重组多肽的成熟和稳定性直接取决于累积所述多肽的区室。例如,本发明人已显示,重组多肽在ER中的停留提高了它们的稳定性并防止其N-聚糖成熟。他们还显示,以膜多肽形式表达可溶性重组多肽也提高其稳定性。最后,他们显示,重组多肽在分泌途径早期区室中的停留提高所述重组多肽的产率,并可防止由聚糖成熟引起的免疫原性。
本发明人将本发明的适当信号与不同的重组多肽融合,用于下文实现并公开的不同目标。因此,本发明的另一方面是提供包含本发明肽信号和多肽的重组多肽,所述肽信号与所述多肽融合。本发明肽信号可在多肽的C端或N端末端融合。也就是说,所述肽信号可以与多肽或蛋白质的C端或N端末端相连。
根据本发明,重组多肽可以是在制药或农业-食品工业(agri-foodindustry)中有意义的任何重组多肽。“重组多肽”在本说明书中也可以称作“重组蛋白”或“肽X”或“靶蛋白”。然而,在公开本发明的方法时,优选使用“重组多肽”来命名待生产的例如用于药物用途的重组多肽;并使用“重组蛋白”来命名参与重组多肽成熟过程(即翻译后修饰)的蛋白质(见下文方法描述中的解释)。
根据本发明,多肽(在本文中也称作“靶多肽”)可以是所有膜治疗性多肽,可作为或不作为膜蛋白表达的所有可溶性治疗性多肽,所有抗体及其片段。
例如,重组多肽可选自包含以下的组酶、抗体或其部分、报告蛋白、核苷酸转运蛋白和治疗活性多肽。优选地,重组的多肽是可溶的多肽或蛋白质。
可通过本发明生产的治疗活性蛋白质的例子为疫苗、变应原、酶、血液蛋白质、激素、抗体、抗体衍生的片段。优选地,治疗活性多肽是可溶的。“治疗性多肽”或“治疗活性多肽”在本说明书和权利要求书中具有相同的含义(或是膜结合蛋白质的可溶部分)。
根据本发明,当重组多肽是酶时,所述酶可以是植物或动物酶。根据本发明,所述酶可例如选自包含以下的组糖苷酶、糖基转移酶、蛋白酶、激酶、脱羧酶、差向异构酶、核苷酸-糖转运蛋白(例如UDP-糖转运蛋白、GDP-糖转运蛋白或CMP-糖转运蛋白)、酰胺化酶,更普遍地为宿主细胞(例如植物细胞)的ER和/或GA中存在或不存在的任何成熟酶。糖苷酶可以是例如参与N-糖基化或O-糖基化的糖苷酶。糖基转移酶可以是例如参与N-糖基化或O-糖基化的糖基转移酶。酶的例子列于下表中 酶的列表 “成熟酶”表示参与宿主细胞中重组蛋白成熟的任何酶。
根据本发明,无论蛋白质是什么,其均可与储藏蛋白或储藏在蛋白质体中的蛋白质融合,例如与

融合的蛋白质。这对于在生产后从宿主细胞中回收重组多肽是有意义的。这一点在下文对本发明方法的描述中进行了讨论。
本发明的另一方面是提供编码本发明肽信号的核酸序列。编码SEQ IDNO1-31的核酸序列的例子在附带的序列表中给出,命名为SEQ ID NO102-132。根据遗传密码的简并性,技术人员会容易地推导出也编码SEQ IDNO1-31的其它合适的核酸序列。
本发明的又一方面是提供编码本发明重组多肽的核酸序列。
本发明的又一方面是提供包含本发明核酸序列的核酸载体。本发明的核酸载体包含编码本发明肽信号的核酸序列,其中所述核酸与编码多肽或蛋白质的核酸序列在框内引入载体中,以产生在所述多肽一个(或两个)末端含有“停留信号序列”的重组多肽或蛋白质。
可使用任何已知和合适的方法构建这些核酸和核酸载体。例如,可有利地使用(Gomord等,1997(参考文献24)和1998(参考文献25),Pagny等2000(参考文献49)和2003(参考文献50),Saint-Jore-Dupas等2006(参考文献58))中公开的方法。
本发明的又一方面是提供植物细胞,其包含至少一种本发明的肽信号和/或至少一种本发明的重组多肽(即包含本发明的肽信号)和/或至少一种编码本发明重组多肽的核酸序列和/或至少一种本发明的核酸载体。根据本发明,所述重组多肽可以是同源或异源的多肽。重组多肽如上文所定义。
可使用任何已知和合适的方法获得所述植物细胞。例如,可有利地使用Gomord等,1997(参考文献24),1998(参考文献25),Pagny等2000(参考文献49)和2003(参考文献50),Saint-Jore-Dupas等2006(参考文献58),Saint-Jore等,2002(参考文献56)中公开的方法。
本发明的又一方面是提供植物,所述植物包含至少一种本发明的肽信号和/或至少一种本发明的重组蛋白(即包含本发明的肽信号)和/或至少一种编码本发明重组蛋白的核酸序列和/或至少一种本发明的核酸载体。根据本发明,所述重组蛋白可以是同源或异源的蛋白质。重组蛋白如上文所定义。
可使用任何已知和合适的方法获得所述植物。例如,可有利地使用Saint-JoreDupas等2006(参考文献58),Saint-Jore等2002(参考文献56)中公开的方法。
根据本发明,植物可以是允许生产重组蛋白的任何合适植物。例如,植物可选自包含以下的组苜蓿(Alfalfa)、拟南芥、烟草(Nicotianatabacum)、大豆(Glycine max)、番茄(Lycopersicon esculentum)、马铃薯(Solanum tuberosum)、水稻(oriza sativa)、玉米(zea maize)、苔藓(小立碗藓(physcomitrella patens))、浮萍(Lemna minor)、藻类(ostreococcus tauri、褐指藻(phaelodactylum))、莱茵衣藻(chlamydomonas reinhardtii)。
根据本发明,植物细胞可来自或来源于任何这些植物。
本发明人还提供了在宿主细胞中生产经翻译后修饰的异源多肽的第一种方法,所述宿主细胞转化有设计成靶向表达所述重组多肽的载体。该第一种方法在附图3(A)行中图示。
生产经翻译后修饰的重组多肽的第一种方法包括以下步骤 -用至少一种本发明的核酸载体转染或转化细胞,所述载体编码重组蛋白,所述重组蛋白是未经翻译后修饰的该多肽; -培养经转染的细胞;和 -收获经翻译后修饰的多肽。
根据本发明,该方法在培养转染或转化细胞的步骤前还可包括筛选细胞的步骤。可使用技术人员已知的任何筛选方法。例如,通过用显微镜直接选择,通过电泳SDS-page,通过免疫检测,通过膜转移等等。可用于进行筛选的方法的一个例子公开于例如文献Gomord等1997(参考文献24)中。该筛选步骤允许选择已根据本发明转染或转化的细胞。该步骤导致经修饰多肽的更高产率。
如上所述,对本发明方法的本公开内容而言,优选使用“重组多肽”来命名待生产的例如用于药物用途的重组多肽;而使用“重组蛋白”来命名参与重组多肽成熟过程(即翻译后修饰)的蛋白质(见第二种方法描述中的解释)。
通过该方法,使用编码与重组多肽融合的本发明肽信号的核酸载体允许将重组多肽游离地或以膜结合形式停留在ER中和/或不同的GA亚区室内。对现有技术方法的重组多肽所观察到的部分异质性(heterogeneity)是在通过高尔基体转运和成熟期间发生的。通过使用本发明肽信号使重组多肽停留在ER中或ER衍生的蛋白质体或早期高尔基体区室中,可降低这种异质性。
一个主要的困难是生产作为其天然对应物的精确拷贝的重组蛋白。多肽翻译后成熟不仅在表达系统之间不同,而且在相同表达系统中的器官之间也不同,并且在组成相同器官的亚细胞区室之间也不同。
根据本发明的第一种方法添加肽信号从而将PMP靶向至特定区室,可以解决这一困难,但是重组蛋白的该结构修饰当然导致了非天然的蛋白质。有利的是,本发明的肽信号是允许进一步控制重组多肽成熟的实用工具,所述控制通过改造或设计宿主细胞的ER和GA介质来实现。该控制允许生产这样的重组多肽,所述重组多肽在宿主细胞中更稳定,具有更低的免疫原性,并通常是其天然对应物的精确拷贝。这对于生产(尤其是由植物生产)可在人治疗中使用的治疗活性蛋白质而言是非常重要的。
本发明提供了设计ER和GA环境的若干方案。这些方案可单独或一起(组合)使用。这些方案的例子在附图3的(B)和(C)行中图示。在所有这些方案中,用以下载体转染或转化宿主细胞 -至少一种编码与重组蛋白融合的本发明肽信号的载体,所述重组蛋白与待生产的重组多肽不同,和 -至少一种编码所述重组多肽的核酸载体。
因此,本发明的又一方面是提供用于生产经翻译后修饰的重组多肽的第二种方法,包括以下步骤 -用至少一种本发明的核酸载体转染或转化细胞,所述载体编码与所述多肽不同的重组蛋白; -用至少一种编码所述多肽的核酸载体转染或转化所述细胞; -培养经转染的细胞;和 -收获经翻译后修饰的多肽。
根据本发明,该方法在培养转染或转化细胞的步骤前还可包括筛选细胞的步骤。可使用技术人员已知的任何筛选方法。筛选方法可以是上文公开的方法。该筛选步骤允许选择已根据本发明转染或转化的细胞。该步骤导致经修饰多肽的更高产率。
在该第二种方法中,在宿主细胞中翻译的重组蛋白包含本发明的肽信号,并且该重组的蛋白质与待生产的多肽不同。
在该第二种方法中,重组蛋白在待生产重组多肽的翻译后修饰调控中起作用,即,其参与该重组多肽的成熟过程(即翻译后修饰)。
该作用取决于所选择的重组蛋白的性质。通过阅读本说明书和实施例,技术人员会容易地知晓如何选择重组蛋白,从而通过使用本发明达到所期望达到的结果。
根据本发明,该重组蛋白可例如是酶和/或抗体或其部分。
根据本发明的第二种方法,当重组蛋白是抗体或其部分时,其可以例如特异性识别和结合待生产的多肽,和/或是特异性识别和结合参与所述多肽翻译后修饰的酶的抗体或其部分。
通过该方法,与本发明肽信号融合的抗体或其部分会定位于宿主细胞的ER和/或GA中。此处重组蛋白的作用是将重组多肽捕获至ER和/或GA。因此,本发明提供了通过在宿主细胞中表达抗体或抗体片段来生产经翻译后修饰的异源多肽的方法,所述宿主细胞已转化有表达载体,所述载体包含编码以下的核酸序列 -ER/GA靶向的抗体或抗体片段,和 -待生产的多肽。
对于特异性识别和结合所述待生产多肽的抗体或其片段的情况,本发明允许有利地将所述天然(未通过由本发明肽信号组成的标签添加进行修饰)重组蛋白保留在宿主细胞的ER和/或GA中,这借助于其与保留在这些区室之一中的特异性抗体或其片段的结合,这通过将所述抗体或其片段与本发明肽信号融合来实现。为此,已将本发明的ER和/或GA停留肽信号与对重组多肽具有特异性亲和力的抗体融合,最终目标是控制或调控重组蛋白的成熟。
对于特异性识别和结合参与多肽翻译后修饰的酶的抗体或其片段的情况,抗体或其片段优选地调控所述酶。此处,本发明的应用是对ER和/或GA特异性地使用失活抗体,从而使位于这些区室中的特定酶失活。为此,已将本发明的ER和/或GA停留肽信号与对ER或GA酶的催化结构域具有特异性亲和力的抗体融合,最终目标是使内源酶失活,以控制或调控重组蛋白的成熟。此处重组蛋白的作用是捕获参与重组多肽成熟的酶。因此,本发明允许“免疫调节”宿主细胞中的内源酶。
根据本发明,还可使用第二种方法从而 1)通过使用至少一种本发明载体对宿主细胞补充异源酶,所述载体编码与本发明肽信号融合的异源酶, 和/或 2)通过使用至少一种本发明载体对内源酶进行再定位,以优化宿主细胞的生产能力,所述载体编码与本发明的肽信号融合的所述内源酶。
异源或同源酶修饰重组蛋白成熟的能力将取决于其在细胞中的定位。因而,为了修饰宿主细胞的酶设备,优选将适当的酶靶向“好”区室中。因此,本发明提供了通过在转化有表达载体的宿主细胞中表达成熟酶来生产经翻译后修饰的异源多肽的方法,所述表达载体含有编码以下的核酸序列 1)重组蛋白,其为靶向的成熟酶,即与本发明的肽信号融合的成熟酶,和 2)待生产的重组多肽。
因此,所述重组蛋白可以是参与所述多肽翻译后修饰的同源或异源酶。在该例子中,本发明允许根据两种独立但是可并行的策略来修饰宿主细胞(尤其是植物细胞)中ER和/或GA的酶设备(a)将内源酶再定向至ER和/或GA,和(b)将可定位于不同亚细胞区室的异源酶靶向ER/GA。这种对宿主细胞中ER和/或GA酶设备的修饰是允许修饰(即设计)重组多肽翻译后成熟的工具。例如,该修饰可允许提高所产生重组多肽的稳定性和/或控制其免疫原性。重组蛋白在此处的作用是捕获参与ER和/或GA中重组多肽的成熟的同源或异源酶。
因此,本发明允许有利地获得作为非免疫原性糖蛋白的重组多肽,也允许有利地获得作为同源糖蛋白的重组多肽。
根据本发明,多肽可以是需要通过遗传重组生产(尤其是在植物细胞或整株植物中生产)的任何多肽。可通过本发明生产的多肽是例如上文本发明重组多肽的公开内容中所述的多肽。
根据本发明,可同时使用第一和第二方法。在这种情况下,在第二方法中,编码所述多肽的载体核酸载体也是本发明的核酸载体,即编码与本发明肽信号融合的多肽。通过本发明的这一实施方案,可以将用于成熟的重组多肽靶向至位于ER和/或GA中,同时将ER和/或GA设计成用于成熟,即重组多肽的翻译后修饰。多肽可以是如上文所定义的。例如,其可以是治疗活性蛋白质。
如本文所公开的,根据本发明,多肽的翻译后修饰有利地在ER和/或GA区室膜中进行。
本发明人首次提供了用于在宿主细胞中(尤其是植物细胞中)生产所设计的重组多肽的这一有力工具。
无论使用本发明的何种方法(第一和/或第二方法),都可以将多肽与储藏蛋白共表达。这种储藏蛋白可以例如是与

融合的蛋白质或任何其他合适蛋白质。附图3的(D)行图示了将

-重组蛋白融合物靶向至高尔基体。例如,可通过宿主细胞中

-重组蛋白的表达而从ER膜产生蛋白质体(见附图5A)。在ER中累积的重组糖蛋白(见下文实施例)仅带有高甘露糖型N-聚糖。本发明提供了肽信号,其允许有利地组合ER同质性和聚糖修饰,例如对于药物糖蛋白而言,其允许在与ER停留信号融合后储藏在ER中。
可用于获得本发明方法中所使用载体的有用方法在上文中公开。
用于转染或转化细胞(尤其是植物细胞)的可用方法在上文中公开。
根据本发明,细胞优选地是植物细胞,例如上文定义的植物细胞,例如植物细胞是来自植物的细胞,所述植物选自包含以下的组紫苜蓿(Medicago sativa)、拟南芥、烟草、大豆、番茄、马铃薯、水稻、玉米、小立碗藓、浮萍、Ostreococcus tauri、褐指藻。
用于培养转染细胞或其所得的植物以及用于收获经翻译后修饰的多肽的方法是本领域技术人员已知的。例如,可有利地使用lienard等,2006(参考文献32)中公开的方法。
本领域技术人员通过附图中展示的以下非限制性例子可以明白其他的优点。
附图简述 图1是植物细胞分泌途径的图示。ER和高尔基体连续区的结构域如下表示

ER

ER/顺面高尔基体

中间高尔基体

晚期高尔基体 图2显示了植物和哺乳动物细胞的内质网和高尔基体中蛋白质上N-联聚糖的转移和加工。在脂质运载体上装配的前体寡糖被转移至组成新生多肽的特定Asn残基上。然后通过去除葡萄糖基和大部分甘露糖基残基来修剪N-聚糖。植物和哺乳动物的复杂N-聚糖加工中的差异是晚期高尔基体成熟事件。如图1中所述,用粗箭头指出ER和高尔基体结构域。
图3显示不同信号(黑暗处)在靶向重组蛋白(A行)、抗体或其部分(ScFv)(B行)、酶(C行)或

-融合物(D行)中的可能应用。
图4是所分析的融合蛋白的图示 -GCSI-GFP与GFP融合的全长拟南芥GCSI, -GCS90-GFP与GFP融合的GCSI的前90个N端氨基酸, -Δ13GCS90-GFPGCS90-GFP减去前13个N端氨基酸, -ManI-GFP与GFP融合的全长大豆ManI, -Δ19CTMan-GFPManI-GFP减去前19个N端氨基酸, -Man99-GFP和Man49-GFP与GFP融合的分别为ManI的前99个和49个氨基酸, -Δ19CTMan49-GFPMan49-GFP减去前19个N端氨基酸, -ΔCTMan49-GFP从Man49-GFP中缺失整个CT, -MAAAMan49-GFP用含有3个Ala残基的人工CT代替Man49-GFP的CT, -ManTMD23-GFP和Man99TMD23-GFP分别为ManI-GFP和Man99-GFP,其中TMD从16个氨基酸延长至23个氨基酸, -GNTI-GFP与GFP融合的全长烟草GNTI, -GNT38-GFP与GFP融合的GNTI的前38个N端氨基酸, -XylT-GFP与GFP融合的全长拟南芥XylT, -XylT35-GFP与GFP融合的XylT的前35个氨基酸, -ST52-mRFP与mRFP融合的大鼠α-2,6-唾液酸转移酶的前52个氨基酸, -GFP-HDEL含有sporamine信号肽和C端HDEL ER停留序列的GFP形式。
图5显示使用共聚焦激光扫描显微镜观察时,在烟草BY-2细胞中稳定表达(3-4天)后,与N-聚糖加工机器的四个不同成员(α-葡萄糖苷酶I、甘露糖苷酶、N-乙酰葡糖氨基转移酶I、β-1,2-木糖基转移酶,图4)和与C端HDEL ER停留序列融合的一系列GFP融合物定位到高尔基体和/或ER中 (A,B)ManI-GFP, (C)ManI-GFP(用蛋白质合成抑制剂环己酰亚胺处理2小时后), (D,E)GFP-HDEL, (F)ManI-GFP(用BFA(50mg.mL-1)处理2小时后), (G)GCSI-GFP, (H)GNTI-GFP, (I)XylT-GFP, 所有标尺线段=8μm。
图6显示使用共聚焦激光扫描显微镜观察时,在烟草BY-2细胞中稳定表达(3-4天)或通过叶浸润在烟草叶表皮细胞中瞬时表达(5天)后,与N-聚糖加工机器的截短成员(Man99、Man49、GNT38、XylT35,图4)融合的一系列GFP融合物定位到高尔基体和/或ER中 (A,B)BY-2悬浮培养细胞的Man99-GFP表达, (C)BY-2悬浮培养细胞的Man99-GFP表达(在用蛋白质合成抑制剂环己酰亚胺处理2小时后), (D)BY-2悬浮培养细胞的Man49-GFP表达, (E-F)分别为烟草叶表皮细胞的Man99-GFP和Man49-GFP表达, (G)BY-2悬浮培养细胞的GNT38-GFP表达, (H)烟草叶表皮细胞的GNT38-GFP表达,和 (I)烟草叶表皮细胞的XylT35-GFP表达。
所有标尺线段=8μm。
图7显示使用共聚焦激光扫描显微镜观察时,将这些GFP融合物之一或其它与ST52-mRFP在烟草BY-2细胞中稳定共同表达(3-4天)后,与ManI、Man99、Man49或GNT38(图4)和反面高尔基体标记物ST52-mRFP融合的一系列GFP融合物定位到高尔基体堆中 (A-C)ManI-GFP(A)和ST52-mRFP(B)在BY-2悬浮培养烟草细胞中的共表达, (D-F)Man99-GFP(D)和ST52-mRFP(E)在BY-2悬浮培养烟草细胞中的共表达, (G-I)Man49-GFP(G)和ST52-mRFP(H)在BY-2悬浮培养烟草细胞中的共表达, (J-L)GNT38-GFP(J)和ST52-mRFP(K)在BY-2悬浮培养烟草细胞中的共表达,和 (C,F,I和L)GFP融合物+ST52-mRFP相应地重叠后的表达。
插入物选定的高尔基体堆的放大率(×2,2)。
注意,堆通常显示为“三色的”(F和I中的箭头),GFP融合物在一侧(绿色),ST52-RFP在另一侧(红色),其间为重叠区(黄色)。
A-I标尺线段=8μm;J-L标尺线段=16μm。
图8显示植物N-糖基化酶的胞质尾区和TMD长度的比较。
(A)植物细胞内质网(ER)和高尔基体中N-联聚糖的加工。
(B)从不同植物物种克隆的N-聚糖加工酶的胞质尾区和跨膜结构域的长度。登录号在每个图示的右侧指出。
对每个膜蛋白而言,跨膜结构域的位置和大小由TmHMM v2软件(http://www.cbs.dtu.dk/services/TMHMM/)来估计。
对一些蛋白质而言,确定TMD位置的概率低于50%(II)。
用粗体标注的框对应于目前已通过共聚焦和/或电子显微镜研究其胞内定位的N-聚糖加工酶。
GCSI葡萄糖苷酶I;α-1,2ManIα1,2-甘露糖苷酶I;β1,2GNTIβ1,2-N-乙酰葡糖氨基转移酶I,α1,3 ManIIα1,3-甘露糖苷酶II,β1,2GNTIIβ1,2-乙酰葡糖氨基转移酶II;β1,2XylosylTβ1,2-木糖基转移酶;α1,3FucTα1,3-岩藻糖基转移酶;α1,4FucTα1,4-岩藻糖基转移酶;α2,6sialylTα2,6-唾液酸转移酶。
图9显示使用共聚焦激光扫描显微镜观察时,在烟草BY-2细胞中稳定表达(3-4天)或通过叶浸润在烟草叶表皮细胞中瞬时表达(5天)后,与截短形式ManI(Δ19Man、Δ19Man49,图3)和MAAAMan49融合的一系列GFP融合物定位到高尔基体和ER中 (A)BY-2悬浮培养细胞的Δ19Man-GFP表达, (B,C)BY-2悬浮培养细胞的Δ19Man49-GFP表达, (D)叶表皮细胞的Δ19Man49-GFP表达, (E)叶表皮细胞的MAAAMan49-GFP表达。
A-C标尺线段=16μm;D,E标尺线段=8μm 图10显示使用共聚焦激光扫描显微镜观察时,这些GFP融合物之一或其它与ST52-mRFP在烟草BY-2细胞中稳定共表达(3-4天)后,与ManTMD23、Man99TMD23或XylT35(图3)和反面高尔基体标记物ST52-mRFP融合的一系列GFP融合物定位到高尔基体区室中 (A-C)ManTMD23-GFP(A)和ST52-mRFP(B)在BY-2悬浮培养烟草细胞中的共表达, (D-F),(G-I)Man99TMD23-GFP(D、G)和ST52-mRFP(E、H)在BY-2悬浮培养烟草细胞中的共表达, (J-L)XylT35-GFP(J)和ST52-mRFP(K)在BY-2悬浮培养烟草细胞中的共表达, (C、F、I和L)GFP融合物+ST52-mRFP的相应重叠表达。
插入物放大率(×2,2) 所有标尺线段=8μm。
图11显示与Man99和Man99TMD23融合的GFP融合物在高尔基体中的定位,使用与免疫金标记联用的电子显微镜,所述免疫金标记使用来自悬浮培养的BY2烟草细胞的多克隆抗GFP抗体 (A)野生型BY2烟草细胞, (B)表达Man99-GFP的BY2细胞, (C)表达Man99TMD23-GFP的BY2细胞, (D)将高尔基体中融合蛋白的分布表达为针对在不同细胞中分析的15个个体堆所观察到的标签的百分比,将高尔基体分为两个区域后对顺面和反面上的金颗粒进行计数。
SV=分泌小泡。
图12显示了使用共聚焦激光扫描显微镜观察时,通过叶浸润在叶表皮细胞中瞬时表达(5天)后,与N-聚糖加工机器成员(ManI、XylT)、其截短形式(Man99TMD23、Man99,图4)融合的一系列GFP融合物定位到高尔基体和ER中 (A)Man99-GFP的大豆叶表皮细胞表达, (B)Man99TMD23-GFP的大豆叶表皮细胞表达, (C)Man99-GFP的栽培番茄(Lycopersicum esculentum)叶表皮细胞表达, (D)Man99TMD23-GFP的栽培番茄叶表皮细胞表达。
所有标尺线段=16μm。
图13显示使用共聚焦激光扫描显微镜观察时,BFA处理2小时对BY-2细胞中ER和/或高尔基体蛋白质的影响,所述BY-2细胞表达可溶的ER标记物(GFP-HDEL,A-B)、膜ER标记物(Glu90-GFP,C-D)、ER和早期高尔基体标记物(Δ19Man49-GFP,E-F)、中间高尔基体标记物(XylT35-GFP,G-H)或晚期高尔基体标记物(Man99TMD23-GFP,ST52-mRFP,I-L)。
注意在所有情况下,ER网经常转变为有孔的荧光片层。
所有标尺线段=8μm。
图14显示使用共聚焦激光扫描显微镜观察时,BFA(50mg.mL-1)处理2小时对早期和晚期高尔基体标记物二者同时再分派到ER和高尔基体簇中的影响 (A-F)分别在不存在或存在BFA时,HDEL-GFP(A、B)和ST52-mRFP(B、E)在BY-2悬浮培养烟草细胞中的共表达, (G-L)分别在不存在或存在BFA时,Δ19Man49-GFP(G、J)和ST52-mRFP(H、K)在BY-2悬浮培养烟草细胞中的共表达, (M-R)分别在不存在或存在BFA时,Man99TMD23-GFP(M、P)和ST52-mRFP(N、Q)在BY-2悬浮培养烟草细胞中的共表达, (C、F、I、L、O、R)在不存在或存在BFA时,GFP融合物+ST-mRFP的相应重叠表达。
图15是我们在本研究中所用的构建体的图示GCSI与GFP融合的全长拟南芥α-葡萄糖苷酶I/GCS150与GFP融合的GCSI前150个氨基酸/GCS90与GFP融合的GCSI前90个氨基酸/Δ13GCS150从GCS150中删除前13个N端氨基酸(MTGASRRSARGRI-SEQ ID N°1)/Δ13GCS90从GCS90中删除前13个N端氨基酸/Hs10-Δ13GCS90将人(Homo sapiens)GCSI的前10个N端氨基酸(MARGERRRRA-SEQ IDN°2)与Δ13GCS90的N端融合/XYLT35与GFP融合的拟南芥β-1,2-木糖基转移酶的前35个氨基酸/XYLT35-GCS(91-150)将XYLT的前35个氨基酸与GCSI腔内结构域(luminal domain)的前60个氨基酸(氨基酸91到150)融合并与GFP融合/XYLT35-GCS(70-150)将XYLT的前35个氨基酸与GCSI腔内结构域的前80个氨基酸(氨基酸70到150)融合并与GFP融合/GCS13-XYLT35将GCSI的前13个N端氨基酸与XYLT35融合/CNX11-XYLT35将拟南芥钙联结蛋白(calnexin,CNX)的最后11个氨基酸(NDRRPQRKRPA-SEQ ID N°3)与XYLT35的N端融合/ST52-GFP/mRFP将大鼠α-2,6-唾液酸转移酶(ST)的前52个氨基酸与GFP或mRFP融合/GFP/mRFP-HDEL:GFP或mRFP处于sporamine信号肽和HDEL ER停留序列的控制下,CT胞质尾区;TMD跨膜结构域;CD催化结构域。
图16显示GCSI严格地在ER中累积在传代培养(sub-culturing)后将转基因BY-2烟草细胞系观察3-4天。皮层(A、C)和中部光学切片(B、D)显示,GCSI位于ER(A、B)中,且染色模式与GFP-HDEL(C、D)相似。
标尺线段=8μm 图17显示N端结构域足以将GCSI定位于ER中像全长构建体GCSI一样,GCS150和GCS90在BY-2细胞中的ER中累积(分别为A、B和D、E)。它们的靶向在烟草叶表皮细胞中是一样的(分别为C和F)。标尺线段=8μm 图18显示13个氨基酸的N端序列含有ER定位信息。尽管GCS90在BY-2细胞中的ER中累积(A、B),但是Δ13GCS90定位于高尔基体中(C、D)。尽管XYLT35是高尔基体蛋白质(E、F),但是GCS13-XYLT35存在于ER和高尔基体中(G、H)。
标尺线段=8μm 图19显示富含Arg的ER靶向序列在单独表达或者与mRFP-HDEL(B,E,H,K,N)或ST52-mRFP(C,F,I,L,O)一起表达Δ13GCS90、XYLT35、GCS13-XYLT35、Hs10-GCS90或CNX11-XYT35(A,D,G,J,M)的烟草叶表皮细胞的界(kingdom)之间是保守的。像在BY-2细胞中一样(图4),Δ13GCS90(A-C)仅位于高尔基体中,而GCS90位于ER中,且Δ13GCS90与ST-mRFP完美地共定位(C、F)。将Δ13GCS90(A-C)与XYLT35(D-F)比较时,显微照片是相同的。GCS13-XYLT35(G)在与mRFP-HDEL共表达时,ER显示为黄色而高尔基体保持绿色(H),但是在与ST52-mRFP共表达时,高尔基体是黄色而ER是绿色(I),显示GCS13-XYLT35具有在ER和高尔基体中的双重定位。有趣的是,可用人GCSI的前10个氨基酸替换GCS90的前13个氨基酸(J-L)Hs10-GCS90嵌合蛋白质仅在ER中(J),并与mRFP-HDEL共定位(K),但是不与ST52-mRFP共定位(L)。这表示信号在界之间是保守的。同样,CNX11-XYL35(M)在与mRFP-HDEL共表达时,ER显示黄色而高尔基体保持绿色(N),但是与ST52-mRFP共表达时,高尔基体是黄色而ER为绿色(O),显示GCS13-XYLT35也在ER和高尔基体内具有双重定位。
标尺线段=8μm 图20显示N端精氨酸含有烟草叶表皮细胞的ER定位信息,所述烟草叶表皮细胞单独表达GFP融合物(左图),或者与mRFP-HDEL(中图)或ST52-mRFP(右图)共表达。GCS90(A)与mRFP-HDEL完美地共定位(B,ER为黄色),但是不与ST52-mRFP共定位(C,ER为绿色,高尔基体为红色)。用Ala(D-F)或Leu(G-I)取代6、7、10和12位的四个Arg时,如在显微照片F和I上观察到的黄点所示,R/LGCS90或R/AGCS90仅位于高尔基体中。成对突变Arg时,R/L6-7GCS90(J-L)或R/L10-12GCS90(M-O)或R/L6-L12(P-R)定位于ER和不含有ER可溶蛋白质mRFP-HDEL的小点(K,N,Q),并且与高尔基体堆密切关联(L,O,R)但是保持独立。这些数据显示,其N端的RR、RXR或RXXR基序赋予GSC90以ER靶向。
标尺线段=8μm 图21显示R/L6-7与高尔基体密切关联。将R/L6-7GCS90与mRFP-HDEL和ST52-mRFP共表达时,荧光结构显示为黄色,表示它们与高尔基体非常密切的关联。
标尺线段=8μm 图22显示表达与Sar1p-mRFP(图B、E和K)或Sar1p-GTP-mRFP(图H和N)融合的GFP融合物的烟草叶表皮细胞。成对突变Arg时,将R/L6-7GCS90(A-C)或GCS90(D-I)与突变或未突变的Sar1p共表达,对GFP融合物而言未观察到标记修饰。相反,R/LGCS90与Sar1p-GTP的共表达(M-O)阻断了ER中R/LGCS90的转运,而与Sar1p的共表达未修饰R/LGCS90的模式。
标尺线段=8μm 图23显示N端精氨酸基序不是AtGCSI的ER停留的关键决定簇。在瞬时GCS150-GFP(A)、GCS90-GFP(B)和Δ13GCS150-GFP(C)转化的烟草叶表皮细胞中使ER显影,皮层切片。通过与mRFP-HDEL(E)和ST52-mRFP(G)共表达来验证Δ13GCS150-GFP的ER定位,皮层切片。尽管具有二精氨酸基序,但是该II型膜蛋白的前13个氨基酸似乎不参与GCS150-GFP的ER靶向。(D)(F)(H)在瞬时Δ13GCS90-GFP转化的烟草叶表皮细胞(D)和共表达mRFP-HDEL(F)或ST52-mRFP(H)的烟草叶表皮细胞中使高尔基体显影,皮层切片。与GCS150-GFP相反,对GCS90-GFP而言前13个氨基酸在ER靶向中是关键性的。腔内结构域侧翼的氨基酸可含有ER靶向信息。标尺线段8μm 图24显示腔内靶向决定簇足以将XYLT35保留在ER中 (A)在瞬时XYLT35-GFP转化的烟草叶表皮细胞中使高尔基体显影,皮层切片。
(B)(C)在将XYLT35-GCS60(B)、XYLT35-GCS80(C)与ST52-mRFP共表达的烟草叶表皮细胞中瞬时显影ER和高尔基体,皮层切片。AtGCSI的腔内结构域将大部分XYLT35再定位于ER中。标尺线段=8μm 图25显示通过共聚焦显微镜对BY-2细胞中的GFP融合物进行定位分析;皮层(A)或横截面(B)视图。已将我们小组中最近鉴定的信号与GFP融合,并且在BY-2烟草细胞中稳定表达后分析了重组蛋白的定位。像GFP-HDEL融合物一样,GFP与信号1、2、3或4的融合物使ER高亮(图A-F)。GFP与信号5、6、7、8或9的融合物使ER高亮,但是也使同化(assimilate)进高尔基体簇中的聚集物高亮,像对照ManI-GFP那样(图G-L)。GFP与信号11-12的融合物仅使同化进高尔基体簇中的聚集物高亮,像对照XylT35-GFP和D13Glu90-GFP那样(图M-O)。最后,GFP与信号的融合物使同化进高尔基体簇中的聚集物高亮,但是也使溶酶体区室高亮(图R)。
图26显示带有二精氨酸基序的重组蛋白的定位。带有一个或两个二精氨酸基序的重组蛋白与mRFP-HDEL ER标记物共定位(A-C;G-R),而精氨酸的突变导致重组蛋白与ST52-mRFP高尔基体标记物共定位(D-F)。
图27显示I型或II型膜蛋白上靶向信号的定位。
图28展示了抗体或抗体片段能将膜蛋白靶向至分泌途径中的不同区室,所述抗体或抗体片段对膜蛋白具有特异性,并与本文所述靶向序列之一融合。此处使用定位在高尔基体中的GFP进行展示。图A和B中展示了用于scFv靶向表达的质粒的结构和一些质粒实例。此处(图C),单独表达时位于高尔基体中的膜蛋白(GFP-高尔基体)在相同的植物细胞中与和SEQ ID NO33融合的GFP特异性scFv共同表达时,再定位至ER/高尔基体区室。
图29展示了异源酶(此处为人β1,4-半乳糖基转移酶)在与本文所述的靶向信号之一融合后,可被靶向在植物分泌途径的不同区室中。作为实例,图B展示了用于在植物细胞中表达人β1,4-半乳糖基转移酶与SEQID NO8、33、36或38融合物的质粒。
图30展示了与人β1,4-半乳糖基转移酶通过其自身的人靶向序列被靶向至植物分泌途径中时获得的糖基化模式(图A)相比,在该糖基转移酶催化结构域与SEQ ID NO36融合后人β-1,4-半乳糖基转移酶的定向表达显著提高了该异源糖基转移酶的效率(图B)。
图31展示了所制备的质粒之一,所述质粒用于在

肽生产的蛋白质体中累积聚糖成熟酶。本文详述的质粒允许在植物细胞中表达与

融合的甘露糖苷酶。
实施例 实施例A将蛋白质定位至ER和/或GA(附图3A) 实施例1鉴定靶向信号 1.早期高尔基体II型膜蛋白的定位 为了更好地理解允许N-聚糖加工酶在早期高尔基体区室中选择性停留的机制,在烟草BY-2细胞中稳定表达后研究与N-聚糖加工机器四个不同成员(α-糖苷酶I、甘露糖苷酶I、N-乙酰葡糖氨基转移酶I和b-1,2-木糖基转移酶,附图4)融合的一系列GFP融合物的定位。
如Saint-Jore-Dupas等,2006(参考文献58)中所公开制备用于表达GFP融合蛋白的构建体。所有甘露糖苷酶I融合构建体均衍生自由Nebenführ等(1999)(参考文献43)最初描述的全长GFP融合物(本文中称作ManI-GFP)。
首先,在ManI和GFP编码区之间引入含AatII限制性位点的连接子。与预测的茎区末端附近的天然AatII位点组合,这允许简单地去除催化结构域,得到Man99-GFP。
接着,为了便于去除N端区域的特定区段,通过PCR诱变引入三个新的限制性位点紧接起始密码子后的一个NheI位点、密码子21和22处的一个SpeI位点,以及密码子50和51处的另一个AatII位点。通过测序验证所修饰构建体的完整性。在该新的构建体中,可用NheI和SpeI去除胞质尾区得到Δ19CTManI-GFP,而AatII消化会去除ManI的整个腔内(lumenal)部分得到Man49-GFP。这两种方法组合得到Δ19CTMan49-GFP。最后,合成了编码带有起始密码子的TMD结构域18个氨基酸的正向(5′-GATCCTTGGGAATGCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3’(SEQ ID N°40))和反向(5′-CTAGTTTGACGGTCCCAGAAAAGGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGCATTCCCAAG-3’(SEQID N°41))寡核苷酸,将其融合并亚克隆进含有无任何起始密码子的GFP的pBLTI121二元载体(Kiefer-Meyer等,未公开的数据)中,得到DCTMan49-GFP。使用相同的策略,用正向引物(5′-GATCCTTGGGAATGGCTGCTGCTCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3’(SEQ ID N°42))和反向引物(5′-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGAGCAGCAGCCATTCCCAAG-3’SEQ ID N°43)产生MAAMan49-GFP。
第三,在对上述经修饰ManI进行的两步式PCR诱变中,引入更长的TMD区域。在第一步中,用BspEI位点代替TMD后方的AatII位点。在第二步中,使用长PCR引物复制所预测TMD的最后七个氨基酸,得到ManTMD23-GFP。最后,用AatII去除该构建体的催化结构域,得到Man99TMD23-GFP。
上述所有克隆步骤在pBluescript中进行。然后将完成的表达盒(包括双35S启动子和Nos终止子)移至pBIN20。
为了获得编码ST-mRFP的植物二元载体,用pVKH18En6 ST-GFP(Saint-Jore等,2002(参考文献56))中的单体RFP(由Roger Tsien提供)代替GFP。ST-mRFP的表达处于6×串联重复的CaMV 35S启动子的控制下。
使用编码N-乙酰葡糖氨基转移酶的烟草cDNA作为模板,通过PCR扩增GNTI-GFP、GNT38-GFP(Strasser等,1999(参考文献60))。使用反向引物5′GGTCACTAGTATCTTCATTTCCGAGTTG-3’(SEQ ID N°44)和5′-GGTCACTAGTGCGATCTGCATATTCTGACTG-3’(SEQ ID N°45)以及正向引物5-AACGTCTAGAATGAGAGGGTACAAGTTTTGC-3’(SEQ ID N°46)进行PCR,以扩增GNTI和GNTI的N端38个氨基酸末端,分别获得GNTI-GFP和GNT38-GFP。为了表达GCSI-GFP,使用Boisson等,2001中克隆的拟南芥cDNA通过PCR扩增总cDNA,与GFP的N端融合并亚克隆在pBLTI121中(Pagny等,2003(参考文献50))。然后通过PCR用正向引物(5’-CGGGGTACCCCATGACCGGAGCTAGCCGT-3’(SEQ IDN°48))和反向引物(5’-GACTAGAAAAGGAG下GATAACCCT-3’(SEQ IDN°49))扩增前90个氨基酸,并亚克隆进pBLTI121二元载体中所包含GFP5′端的Spe I限制性位点中,得到GCS90-GFP。以相同的方式,使用正向引物(5′-CGGGGTACCCCATGAAATCATCATCATTATCTCCC-3′(SEQ ID N°49))和与上文相同的反向引物,通过PCR来扩增缺失前13个氨基酸的90个氨基酸,得到D13GCS90-GFP。
如先前在另一独立细胞系中针对该构建体所述的(Nebenfuhr等,1999(参考文献43)),通过共聚焦激光扫描显微镜检测通过细胞质移动的小体中全长ManI-GFP融合物的荧光(附图5A和5B)。
另外,在遍布细胞质的网状网络(reticulate network)中观察到显著的荧光信号,所述网络与通过GFP-HDEL构建体染色的ER网络是可以区分的(附图5D和5E)。为了检验ER标记是否是由于重组蛋白的过表达所致,用蛋白质合成抑制剂环己酰亚胺孵育表达ManI-GFP的BY-2细胞。处理2小时后,靶向模式保持不变,这显示ManI-GFP的稳态定位是高尔基体和ER(比较附图5C和5B)。
为了证实荧光点是高尔基体堆,将细胞用50mg.mL-1布雷菲德菌素A(BFA)处理2小时。该BFA处理引起绿色点消失,而皮质和经血管的ER荧光变得更亮(将附图5F与附图5B和5E比较),如先前针对在烟草叶表皮和BY-2悬浮培养细胞中表达的若干定位于高尔基体的GFP融合蛋白所述(Saint-Jore等,2002(参考文献56);Ritzenthaler等,2002(参考文献54))。
为了将ManI与分泌途径中其它植物N-糖基化酶之一的定位进行比较,分析了相同条件下在ManI之前、之后立刻或之后很久发挥作用的N-聚糖成熟酶的亚细胞定位。研究的第一种酶是来自拟南芥的α-葡萄糖苷酶I(GCSI)。该II型膜蛋白与新生糖蛋白结合后立即修剪来自ER中前体寡糖的第一个糖残基(见附图2B中植物N-聚糖成熟的图示)。将全长蛋白质(Boisson等,2001(参考文献6))与GFP融合,并且与COS细胞中人GCSI所显示一致地(Hardt等,2003(参考文献28)),在BY-2细胞中融合蛋白仅位于ER中(附图5G)。
研究的第二个候选者来自烟草(GNTI)(Strasser等,1999(参考文献60))。该糖基转移酶在ManI去除a-1,2-甘露糖后不久在N-聚糖上添加第一个N-乙酰葡糖胺残基(附图2B)。将全长蛋白质与GFP融合,并在烟草BY-2悬浮培养细胞中表达GNTI-GFP。有趣的是,该融合物的稳态定位是高尔基体和ER(附图5H),与ManI-GFP的模式非常相似(比较附图5H和5B)。这些数据有力地指出,在烟草BY-2悬浮培养细胞中,被认为很早在高尔基体中发挥作用的N-聚糖加工酶(如ManI和GNTI)被靶向至高尔基体,也靶向至ER。
最后,来自拟南芥的第三个候选者b-1,2-木糖基转移酶(XylT)仅位于高尔基体中(附图5),证实了Pagny等(2003)(参考文献50)的结果,他们证明了该酶的N端末端将GFP靶向至高尔基体堆的中间囊膜亚组。
为了确定蛋白质表达水平是否会改变我们的融合蛋白的定位,在表达融合蛋白的不同稳定独立细胞系中验证了这些结果。总在传代培养的第三或第四天进行细胞成像,所述时间在我们的培养条件下对应于最佳生长期。然而为了进一步确认ER标记不是由于融合物的过表达,通过证实其在环己酰亚胺处理2小时后不改变来控制每种融合物的标记模式。
用抗GFP抗体显示的Western印迹和ECL染色显示了高于背景的极低的重组蛋白信号,这表明该研究中所有融合蛋白的低表达水平(数据未显示)。融合蛋白表达水平与功能性不饱和分泌途径相容的另一个证据得自共表达实验,其中在相同的细胞中ManI-GFP位于ER和高尔基体二者中,而高尔基体标记物(ST52-mRFP)仅位于高尔基体中(附图7A-C)。
总而言之,在这些小心控制的条件下获得的结果清楚地显示,N-糖基化酶被特异性地仅靶向ER(GCSI)或高尔基体(XylT),但是一些酶具有在两种细胞器中的双重稳态,ManI和GNTI以及其它膜蛋白如脯氨酰4-羟化酶就是这种情况(Yuasa等,2005(参考文献65))和ERD2(Boevink等,1998(参考文献5);Saint-Jore等,2002(参考文献56))。
在下一步中,研究了负责靶向显示在高尔基体/ER中的双重稳态分布之糖基化酶群体的信号。
2.显示腔内结构域不是ManI和GNTI靶向高尔基体和ER所必需的实验 关于该实验,三种植物糖基化酶GNTI、XylT和拟南芥ManI(附图2)的特异性高尔基体停留表明,其特异性靶向由其N端部分中含有的信号介导,包括胞质尾区、TMD以及GNTI的茎(Essl等,1999(参考文献16)、Dirnberger等,2002(参考文献15);Pagny等,2003(参考文献50);Strasser等,2006(参考文献61))。本实施例研究了腔内结构域在ManI和GNTI靶向中的作用。
为了确定位于高尔基体腔中的ManI部分在该糖苷酶向高尔基体和ER膜的靶向中是否起作用,将ManI的前99个氨基酸(CT+TMD+S)或前49个氨基酸(CT+TMD)与GFP融合,并将相应的嵌合蛋白质分别命名为Man99-GFP和Man49-GFP(附图4)。将Man99-GFP和Man49-GFP在BY-2悬浮培养细胞中稳定表达,或通过叶浸润在烟草叶表皮细胞中瞬时表达。在两种表达体系中的高尔基体和ER中均观察到Man99-GFP和Man49-GFP嵌合蛋白质(分别见附图6A、6B、6E和6D、6F),正如先前针对全长构建体所观察到的(附图5A和5B)。
重要的是应该注意,在烟草叶中瞬时表达这些截短的融合物时,在转化后5天仍然观察到ER标记,此时总体表达水平已经大幅下降(附图6F),而XylT35-GFP仅位于高尔基体中(Pagny等,2003(参考文献50);附图6I)。这进一步证实了ManI融合物在ER中的局部定位不是由于嵌合蛋白质的过表达。另外,用蛋白质合成抑制剂环己酰亚胺将表达Man99-GFP的BY-2细胞处理2小时后,ER标记未消失(附图6C),如针对全长融合物所观察的(与附图5C比较)。
为了更好地了解融合蛋白位于高尔基体堆中的何处,通过用单体红色荧光蛋白(mRFP,Campbell等,2002(参考文献11))代替GFP,将ManI-GFP与衍生自ST52-GFP的反面高尔基体标记物ST52-mRFP共表达(Saint-Jore等,2002(参考文献56);Runions等,2006(参考文献55))。在BY-2细胞中同时表达两种嵌合蛋白时,与ManI-GFP相反,在ER中未检测到ST52-mRFP,并且在高尔基体中观察到两种荧光信号,但并未完美地共定位(附图7A-C)。这些结果与证明以下结果的先前研究是一致的 1)ManI-GFP融合物位于BY-2细胞中高尔基体顺面的一半中(Nebenführ等,1999(参考文献43))和 2)大鼠a-2,6-唾液酸转移酶的52个氨基端氨基酸足以将报告蛋白主要靶向至高尔基体堆反面的一半(Boevink等,1998(参考文献5))。
因此,共聚焦显微镜足以显示,ManI-GFP和ST52-mRFP在高尔基体中不同囊膜亚组中累积。最后,与反面高尔基体标记物ST52-mRFP共表达Man99-GFP或Man49-GFP时,两种荧光团仅部分重叠(分别见附图7D-F和7G-I),提示截短融合蛋白的高尔基体内定位与全长融合物ManI-GFP相同。
烟草GNTI的前77个N端氨基酸(包括CT、TMD和茎)先前被描述为含有维持该糖基转移酶高尔基体停留所需的信息(Essl等1999(参考文献16))。与GFP融合的该多肽结构域已显示偏好定位于高尔基体中,但是在ER中也检测到该嵌合蛋白,如针对全长构建体所观察到的(附图5H)。为了确定保留在高尔基体腔中的序列是否参与GNTI的高尔基体和ER靶向,去除该糖基转移酶的腔内部分(39个氨基酸)并将剩余的前38个N端氨基酸(CT+TMD)与GFP融合(附图4)。该融合蛋白被称作GNT38-GFP,并在BY-2悬浮培养细胞中稳定表达,或在烟草叶表皮细胞中瞬时表达。
在两种表达体系中,GNT38-GFP均定位于高尔基体和ER中(附图6G和6H),如先前针对全长构建体所观察的(GNTI-GFP。附图5H)。另外,当GNT38-GFP与ST52-mRFP在BY-2细胞中稳定共表达时,如先前用Man99-GFP和Man49-GFP所观察到的,两种荧光点重叠,但是一些红色荧光可以与黄色区分,提示GNT38-GFP不是如先前针对ManI所观察的那样位于反面高尔基体中(附图7J-L)。
从这些结果可明显看出,ManI和GNTI的胞质尾区和TMD均足以将这些糖基化酶靶向至它们的稳态定位ER和早期高尔基体区室。相反,在BY-2细胞(Pagny等,2003(参考文献50))和烟草叶表皮细胞(附图6I)中,同样的结构域(CT+TMD)均将XylT35-GFP仅靶向至高尔基体中。
3.显示胞质尾区不是ManI在分泌途径早期区室中停留所必需的实验 存在于哺乳动物和酵母ER和/或高尔基体中的许多膜结合蛋白的N端胞质区含有下述信号,所述信号便于其从高尔基体中回收至ER(Teasdale和Jackson,1996(参考文献62);Zerangue等,1999(参考文献66))或其从ER输出至高尔基体(Giraudo和Maccioni,2003(参考文献20))。在植物中,胞质尾区的长度在不同糖苷酶和糖基转移酶之间可广泛变化(附图8)。例如,GCSI和ManI含有长胞质尾区(分别为51/29个氨基酸)。相比之下,GNTI和XylT的CT仅由11个氨基酸组成。
为了更精确地定义ManI的靶向信号以及研究该糖苷酶相对长的胞质区(29个氨基酸)在该靶向中的作用,产生两种融合蛋白D19Man-GFP和D19Man49-GFP。在后两种蛋白质中,去除19个氨基酸,使得CT被缩短至10个氨基酸,像XylT和GNTI的CT一样。该截短去除了可能在ER到高尔基体的转运中发挥作用的可能的二元基序(KxR)(Giraudo和Maccioni,2003(参考文献20)),但保留了另一可能的ER输出信号。尝试了完全去除CT(DCTMan49-GFP,附图4),但是无法在烟草细胞中表达该融合蛋白。为了在CT的剩余10个氨基酸中寻找靶向决定簇,用人工序列MAAA代替CT序列(MAAAMan49-GFP,附图4)。该人工序列不含有任何已知的靶向序列,并且不影响疏水跨膜结构域的长度。
已在烟草细胞中表达了三种构建体MAAAMan49-GFP、D19Man-GFP和D19Man49-GFP。后两者标记ER和高尔基体(附图9A-D),正像其来源的构建体一样(分别为附图5A、5B和6D、6F)。另外,含有人工MAAA CT的融合蛋白位于相同区室中(附图9E),这表明N端胞质区不是ManI靶向所必需的,因此其稳态定位于ER和高尔基体所需的所有信息均包含在MAAAMan49-GFP构建体的20个氨基酸内,即TMD和C端侧翼氨基酸中。
4.显示跨膜结构域(TDM)长度在ManI的高尔基体靶向和亚区室化(subcompartimentation)中起关键作用的实验 对哺乳动物细胞而言,已提出了若干模型来解释II型膜蛋白是如何以不同水平停留在高尔基体内的。
根据第一种模型——“亲缘识别(kin recognition)”模型(Nilsson等,1993b(参考文献45)),同源/异源寡聚化引起的N-聚糖成熟酶聚集会防止得到的大复合物递送至分泌小泡以及继续在分泌途径中向下游转运。
这类结合首先被报道的实例之一涉及a-甘露糖苷酶II和GNTI,它们是位于中间高尔基体的两种糖基化酶,并依次在哺乳动物N-聚糖成熟中发挥作用(Nilsson等,1994(参考文献46))。应当注意,该模型最先推测存在稳定的高尔基体囊膜以及分泌负荷通过囊泡穿梭机制顺行流动(Nilsson等,1993b(参考文献45))。为了适合囊膜进展/成熟概念,“亲缘识别”模型必须被修饰,以允许寡聚复合物被优先包装在逆行的囊泡中(Füllekrug和Nilsson,1998(参考文献18))。
第二种模型——脂双层模型(Bretscher和Munro,1993(参考文献10))提出,聚糖成熟酶TMD长度和每种细胞器膜脂双层的厚度之间的匹配决定了定位,因为每种细胞器具有其特定的膜脂组成,并因而具有其自身的厚度(Hartmann和Benveniste,1987(参考文献29);Lynch,1993(参考文献33);Moreau等,1998(参考文献36);Morré和Mollenhauer,1974(参考文献37))。
根据膜厚度模型,分泌途径中N-聚糖成熟酶的分布以其TMD的长度为基础(Bretscher和Munro,1993(参考文献10))。分泌途径细胞器的膜在厚度上从ER到质膜逐渐提高。ER和顺面高尔基体膜仅为4-5nm厚,而反面高尔基体、分泌小泡的膜和质膜为8-9.5nm厚(Grove等,1968(参考文献26);Morré和Mollenhauer,1974(参考文献37))。另外,先前在动物系统中(Munro 1991,1995a,1995b(参考文献38))以及对I型蛋白质而言也在植物细胞中(Brandizzi等,2002a(参考文献9)),通过研究报告蛋白在改变其TMD长度后的定位而显示了与TMD长度相关的靶向。这意味着,特定区室的膜仅能够接受长度匹配的疏水TMD。
比较揭示,高尔基体蛋白质TMD的长度比质膜蛋白质的TMD长度平均短5个氨基酸(Masibay等,1993(参考文献41);Munro,1995a(参考文献48))。一些实例支持了这一模型。大鼠a-2,6-唾液酸转移酶和牛b-1,4-半乳糖基转移酶TMD长度的增加降低了这些糖基转移酶的高尔基体停留。另外,由17个亮氨酸组成的合成的I型TMD导致淋巴细胞表面抗原CD8胞外结构域的高尔基体停留,而在细胞表面发现数量增加的23个亮氨酸的TMD(Masibay等,1993(参考文献41);Munro,1991(参考文献47),1995b(参考文献49))。另外,通过插入1-9个疏水氨基酸逐渐增加18个氨基酸的a-2,6-唾液酸转移酶TMD长度也导致相似的a-2,6-唾液酸转移酶-溶菌酶嵌合体的细胞表面表达提高,而质膜蛋白TMD长度的降低导致其在高尔基体中停留增加(Munro,1995b(参考文献49))。
在植物细胞中,通过改变两种与GFP融合的I型膜蛋白中TMD的长度,获得了支持膜蛋白沿内膜系统亚区室化与TMD长度相关的初步数据(Brandizzi等,2002a(参考文献9))。
首先,将含23个氨基酸的TMD的人溶酶体膜蛋白LAMP1与GFP融合并在烟草叶中表达。融合物定位于质膜中。相反,将TMD缩短至20和17个氨基酸时,GFP嵌合体分别定位于高尔基体和ER膜。其次,液泡分选受体BP80的19个氨基酸长的TMD将GFP靶向至高尔基体,而22个氨基酸的延长TMD将GFP靶向至质膜。
研究了II型膜蛋白ManI的TMD长度,以了解其能够怎样影响其在高尔基体中的亚区室化。具体地,通过重复该结构域的最后七个氨基酸,将TMD长度从16提高至23。与其定位于ER和高尔基体顺面一半的含16氨基酸TMD的同源物相反,带有23氨基酸TMD的嵌合体蛋白质仅定位于高尔基体,更精确而言是定位于高尔基体堆的反面一半中。
在本实施例中,ManI靶向所需的信息包含在含有16氨基酸TMD的20氨基酸(aa)序列中。为了研究TMD的长度是否能够在该II型膜蛋白在早期植物分泌途径中的靶向中起关键作用,设计了两种融合蛋白ManTMD23-GFP和Man99TMD23-GFP,其中通过重复其最后七个氨基酸将ManI的TMD从16个氨基酸延长至23个氨基酸(附图4)。在BY-2悬浮培养细胞和烟草叶表皮细胞中表达ManTMD23-GFP和Man99TMD23-GFP。在两种植物表达体系中,ManTMD23-GFP和Man99TMD23-GFP均仅定位于亮点(附图10A、10B、10D)中,对真菌毒素布雷菲德菌素A敏感(50μg.mL-1,2h,附图11C)。ManTMD23-GFP和Man99TMD23-GFP的表达模式与在BY-2悬浮培养细胞和烟草叶表皮细胞中均仅定位于高尔基体中的XylT-GFP融合物(附图10)或ST52-mRFP融合物(附图10)相似,如先前通过电子显微镜所证实的(Boevink等,1998(参考文献7);Pagny等,2003(参考文献63))。
为了进一步研究ManTMD23-GFP和Man99TMD23-GFP的亚区室化,建立了共表达这些GFP融合物之一与ST52-mRFP的稳定的BY-2悬浮培养细胞。在重叠的图中,绿点与红点无法分开,表明含23氨基酸TMD的GFP融合物已在高尔基体内朝向反面移动,使得它们在共聚焦水平上与ST52-mRFP共定位(与附图10比较)。有趣的是,皮层图像(cortical image)(附图8D-F)与横切片(附图10G-I)相比点模式是类似的,支持了具有更长TMD的Man-GFP融合物与反面高尔基体标记物ST52-mRFP完美共定位的推测。相反,中间高尔基体标记物(XylT35-GFP)和反面高尔基体标记物(ST52-mRFP)产生在重叠图像中未完美重叠的荧光点(附图10J-L)。
与使用多克隆抗GFP抗体的免疫金标记联用的电子显微术使得我们可以更精确地确定这些融合蛋白的高尔基体内定位。如附图11中所示的,Man99-GFP融合物主要在高尔基体的顺面累积(附图11B),而Man99TMD23-GFP融合物则主要定位于高尔基体的反面(附图11C)。
用ManI-GFP和ManTMD23-GFP获得相似的结果(数据未显示)。使用免疫前血清或野生型烟草BY-2悬浮培养细胞的对照实验显示没有或几乎没有非特异性高尔基体标记(附图11A)。
该结果证明,TMD足以赋予与全长蛋白ManI相同的定位,该数据提示,TMD长度是该II型膜蛋白在高尔基体堆和ER内精确定位的决定性因素。因此,预计蛋白质-脂质相互作用在分泌途径内ManI的靶向中起关键作用。
有趣的是,这些结果还清楚地指出了植物分泌体系中I型和II型膜蛋白的靶向对TMD长度需求的差异。事实上,XylT的23氨基酸TMD(Dirnberger等,2002(参考文献15);Pagny等,2003(参考文献50))或ManII的22氨基酸TMD(Strasser等,2006(参考文献60))将GFP仅靶向至高尔基体。此外,在本实验中,具有延长的TMD(23个氨基酸)的ManI也仅在高尔基体中检测到。相反,I型膜蛋白的23氨基酸TMD和BP80中延长的22氨基酸TMD将GFP靶向至质膜(Brandizzi等,2002a(参考文献8))。
使膜蛋白停留在具有给定厚度膜内的TMD长度需求可取决于蛋白质的拓扑学结构(I型或II型)。
尽管这些实验清楚地证明了TMD长度在ManI蛋白质靶向中的作用,但是其它实验显示,另一些酶的正确定位需要其它信号。例如,与高尔基体较晚期部分中TMD更长的趋势相反,具有18氨基酸TMD的ST52-GFP融合物被发现与具有23氨基酸TMD的XylT35-GFP融合物(Pagny等,2003(参考文献50))相比处于反面高尔基体中更下游处(Boevink等,1998(参考文献5);Wee等,1999(参考文献63))。
在用于瞬时表达的其它植物系统中获得了相似的结果。事实上,在大豆(附图12A)或番茄(附图12C)中,Man99-GFP定位于高尔基体和ER中,而Man99TMD23-GFP在这两种表达体系中几乎都仅存在于高尔基体中(附图12B和12D)。
即便是在本文以GCSI显示的情况下,实验也显示CT中含有的额外信息是正确靶向所需要的,所述GCSI的TMD是迄今为止针对植物糖基化酶所鉴定的最短的TMD之一并且允许在ER中定位。因此,对GCSI进行的计算机模拟分析和诱变研究与TMD长度作为糖基化酶在植物分泌体系中区室化的唯一信号是不一致的。
换言之,尽管TMD长度对于ER和/或顺面高尔基体中的ManI靶向具有关键作用,但是用GCSI获得的结果显示,一些膜蛋白在ER或高尔基体膜中的特异定位也可以同时取决于蛋白质-脂质相互关系(通过TMD)和蛋白质-蛋白质相互关系(通过特异的分选基序)。胞质配偶体如高尔基体基质蛋白或胞质调节因子的鉴定使得能够解释该第二模型中涉及的用于将N-聚糖成熟酶沿植物分泌途径分配的机制。
以不同水平定位于高尔基体中的酶的大集合允许测试下述问题是否高尔基体堆中所有囊膜响应于真菌毒素布雷菲德菌素A(BFA)处理而与ER融合。事实上,在使用BFA的2小时实验期间,含16或23氨基酸TMD的Man-GFP融合物以及ST52-mRFP均返回ER或高尔基体簇中。这些结论与先前公开的结果一致(附图12)(Nebenführ等,2002(参考文献43);Ritzenthaler等,2002(参考文献54))。
总而言之,这些结果一起指出,TMD长度在ManI到ER和/或顺面高尔基体区室的靶向中起关键作用,并且TMD长度从16提高到23个氨基酸将该II型膜蛋白重新定位于朝向高尔基体反面更下游处(附图11D)。
5.显示在布雷菲德菌素A(BFA)存在下晚期和早期高尔基体蛋白在ER中重新分布的实验。
利用在该研究期间产生的多种高尔基体标记物,研究了定位于不同高尔基体亚区室中的高尔基体蛋白质在BFA处理后可具有不同表现的可能性。
用BFA(50mg.mL-1)处理表达以下的细胞二小时ER可溶标记物或膜标记物(GFP-HDEL或Glu90-GFP,附图13A-D)、ER/早期高尔基体标记物(D19Man49-GFP,附图13E-F)、中间高尔基体标记物(XylT35-GFP,附图13G-H)、或晚期高尔基体标记物(Man99TMD23-GFP或ST52-mRFP,附图13I-L)。在BFA处理结束时,除了未在聚集体中发现的ER标记物(附图13A-D)以外,所有融合蛋白在明亮的聚集体中和ER中累积(附图13E-L)。所有标记物均在BFA存在下在ER中重新定位。
在共表达ER/早期高尔基体或晚期高尔基体蛋白质与ST52-mRFP的细胞中,除了在聚集体中未发现的GFP-HDEL(附图14A-F)和Glu90-GFP(附图14D)以外,BFA诱导这两种标记物重新分布进入ER和进入高尔基体聚集体(附图14)。在一些情况下,时间上稍有差别,但是这些差别对检测而言不是微不足道的,并且也不提供关于高尔基体内定位的信息。另外,在BFA处理后对表达可溶标记物(GFP-HDEL)或膜蛋白标记物(Glu90-GFP)的细胞进行观察时,未观察到荧光模式的显著差异(附图14A-D)。
6.显示TMD长度模型不适用于所有II型膜蛋白的实验 为了确定TMD长度是否可以是允许所有糖苷酶和糖基转移酶沿植物分泌系统亚区室化的唯一高尔基体分选决定因素,比较已表征的糖基化酶的N端序列(附图14)。
从单个物种克隆并进行功能表征的不同酶的序列很少,用于在单个植物系统中将TMD长度与膜厚度相关联的电子显微镜数据更少,这阻碍了该分析。对迄今为止克隆的所有植物糖基化酶N端序列(CT+TMD)的计算机模拟分析清楚地显示了在高尔基体堆中具有最下游定位的蛋白质中具有更长TMD的趋势(附图14)。例如,有趣的是,注意到被推定位于晚期高尔基体的酶如a-1,3-岩藻糖基转移酶和a-1,4-岩藻糖基转移酶均不具有短于20个氨基酸的TMD。通过用于TMD长度预测的MENSAT_V1,8、PHOBIUS或PRED_TMR程序(http://bioinf.cs.ucl.ac.uk/psipred/psiform.html和http://biophysics.biol.uoa.gr/PRED-TMR/input.html)证实了这些结果。然而,在比较来自不同物种的相似糖基化酶时可注意到对该普遍趋势的例外,例如ManI TMD为16个氨基酸(大豆)到20个氨基酸(拟南芥)不等。
GluI中18个氨基酸的短TMD能够完美地适合脂质双层模型,从而解释其在ER膜中的定位,根据这一点选择GluI用于检验该模型的普遍适用性。为了确定GluI的TMD对其在ER中的靶向和停留而言是否足够,缺失该糖苷酶的大部分腔内部分(含有催化结构域)并将其前90个N端氨基酸(CT+TMD+S)与GFP融合,得到融合蛋白Glu90-GFP(附图4)。在烟草细胞中表达该融合物时ER被高亮(附图15A和15B),其模式与用全长构建体Glul-GFP和GFP-HDEL构建体获得的模式相似(将显微照片14A和14B与4G和4D、4E和12C比较)。
该结果清楚地显示,GluI靶向至ER依赖于位于该截短蛋白质中所剩的CT、TMD和/或21个腔内氨基酸内的信号。
在确定GluI在ER中定位所需的最小蛋白质序列的另一尝试中,缺失来自Glu90-GFP构建体的前13个N端氨基酸,获得D13Glu90-GFP(附图4)。在烟草悬浮培养细胞或叶表皮细胞中表达该融合物时,嵌合蛋白质仅位于高尔基体样斑点中(附图15D和15E),就像针对XylT-GFP(附图6I和9E)和ST52-GFP(附图15F)所观察的一样。
总而言之,GluI中18个氨基酸长的TMD不足以将该糖苷酶靶向在ER膜中,CT的前13个氨基酸中所含有的额外信息是该糖基化酶在分泌途径中正常定位所需的。
该结果对除TMD长度以外的其他因素影响糖基化酶在早期分泌途径中的定位提供了实验证据。
7.拟南芥GCSI II型膜蛋白的定位 GCSI严格地在烟草内质网中累积。
拟南芥GCSI是一种II型膜蛋白,其由51个氨基酸的胞质尾区、约18个残基的跨膜结构域和指向腔的大催化结构域组成(Boisson等,2001(参考文献6))。为了研究该糖苷酶的定位,在烟草BY-2细胞中稳定表达(附图16A和18B;附图17A和17B)后研究全长GCSI的GFP融合物的定位(附图15)。通过共聚焦激光扫描显微镜仅在遍布细胞质的网状网络中检测到全长GCSI-GFP融合构建体的荧光,其与GFP-HDEL构建体染色的ER网络无法区分(附图16C和16D)。
这些结果与来自前体寡糖的第一个糖残基在ER中与新生糖蛋白结合后立即被修剪是一致的,并与COS细胞中对人GluI所示的情况一致(Hardt等,2003(参考文献28))。另外,在表达可溶标记物(GFP-HDEL)或膜蛋白标记物(GCSI-GFP)的细胞的荧光模式中未观察到显著差异(附图16A到D)。
8.显示GCSI的前90个氨基酸足以将GFP保留在ER中的实验。
为了了解使得GCSI在ER中选择性停留的机制,首先研究了腔内结构域在GCSI靶向中的作用。为了确定位于ER腔内的GCSI部分是否在该糖苷酶向ER的靶向中起作用,将GCSI的前150个氨基酸(aa)(CT+TMD+茎的81个氨基酸)或前90个氨基酸(CT+TMD+茎的21个氨基酸)与GFP融合,并将相应的嵌合体蛋白质分别称作GCS150和GCS90(附图15)。将GCS150和GCS90在BY-2悬浮培养细胞中稳定表达或通过农杆菌浸润在烟草叶表皮细胞中瞬时表达,两者均在两种表达体系的ER中观察到(分别为附图17A、C、E和17B、D、F),正如先前针对全长构建体所观察到的(附图16A、B)。重要的是,注意到在烟草叶表皮细胞中瞬时表达这些截短的融合物时,在转化后五天(此时总体表达水平已经大幅降低)仍观察到ER标记,然而在相同条件下分析的高尔基体融合物仅位于高尔基体中(Saint-Jore-Dupas等,2006;数据未显示)。该数据显示,葡萄糖苷酶I的催化性腔内结构域不是酶的ER定位必需的,并且GCSI的前90个氨基酸足以将GFP保留在ER中。
9.显示胞质尾区含有ER停留序列的实验 驻留在哺乳动物和酵母ER中的许多膜蛋白的N端胞质区含有下述信号,所述信号促进严格停留(Nilsson等,1994(参考文献46);Opat等,2000(参考文献48);Hardt等,2003(参考文献28);Ciczora等,2005(参考文献12))或从高尔基体回到ER中(Teasdale和Jackson,1996(参考文献62);Zerangue等,1999(参考文献66)),而一些其它信号促进从ER输出到高尔基体(Giraudo和Maccioni,2003(参考文献20))。在植物中,仅有少数研究证明膜蛋白CT中存在ER输出序列(Contreras等,2004(参考文献4613);Yuasa等,2005(参考文献65);Hanton等,2005b(参考文献27))并涉及负责膜蛋白ER停留的胞质基序的表征(Benghezal等,2000(参考文献4);McCartney等,2004(参考文献35))。
为了更精确地定义GCSI N端中含有ER靶向信息的序列,首先缺失位于GCS90N端末端的前13个氨基酸,并将得到的嵌合体蛋白质命名为D13GCS90(附图15)。该截短去除了可能在ER停留中发挥作用的两个可能的二元基序RR或RXR,而将其它可能的ER停留信号(RR或KXK)保留在该融合蛋白的CT中。同时,将GCSI的前13个N端氨基酸肽与先前定位于中间高尔基体(Pagny等,2003(参考文献50))的高尔基体报告蛋白(XYLT35,附图15)融合。在本研究中使用的实验条件下,XYLT35被证实仅在BY-2烟草细胞的高尔基体中累积,如图18G到H中所示。
还在BY-2细胞中稳定表达了两种构建体(D13GCS90和13GCS-XYT35)。胞质尾区前13个氨基酸的缺失将GCS90重新定位进亮点中(图18C-D,图19A),与用高尔基体标记物XYLT35观察到的相似(图18E-F)。另外,D13GCS90在烟草叶表皮细胞中瞬时表达后不与ER标记物mRFP-HDEL共定位(图19B),但是完美地与ST-mRFP高尔基体标记物共定位(图19C)。有趣的是,GCSI的13个N端氨基酸与XYLT35高尔基体标记物的融合物将报告蛋白阻断在ER中(图18G-H;图19G)。GCS13-XYLT35融合蛋白像GCS90构建体一样标记ER(图18A-D),并与mRFP-HDEL ER标记物共定位(图19H)。除了强ER标记外,在烟草叶表皮细胞中表达GCS13-XYLT35时也观察到少量亮点。这些点移动并与ST-mRFP高尔基体标记物共定位(图19I)。
总而言之,GCSI的前13个氨基酸是将GCS90融合蛋白保留在ER中所必需的,并且足以将高尔基体标记物重新定位于ER中。
10.显示胞质富含精氨酸的序列是植物中ER停留信号的实验 为了进一步研究AtGCSI的13个N端氨基酸中的精氨酸残基是否是ER停留所必需的,改变位于AtGCSI人同源物N末端的富含精氨酸结构域或位于I型植物ER驻留膜蛋白(拟南芥钙联结蛋白)胞质C末端的富含精氨酸结构域的肽。
为了研究位于人GCSI N末端的富含精氨酸肽在植物细胞中被识别的能力,用人GCSI的前10个N末端氨基酸取代GCS90的前13个N末端氨基酸(Hs10-GCS90,图15)。在烟草叶表皮细胞中瞬时表达时,Hs10-GCS90位于ER中,表明N端胞质区被植物分泌体系完美地识别(图17JL)。
接着,为了研究由I型膜蛋白带有的相似的富含精氨酸基序是否能够介导II型蛋白质靶向ER中,将位于拟南芥钙联结蛋白C末端的最后11个氨基酸与高尔基体标记物XYLT35的N末端融合(CNX11-XYLT35,图15,表1)。在烟草叶表皮细胞中瞬时表达CNX11-XYLT35。如图19M到O中所示,I型膜蛋白的富含精氨酸C端肽足以将II型XYLT35高尔基标记物保留在ER中(图19M到N)。注意到像GCS13-XYLT35融合物(图19I)一样检测到了高尔基体标记(图19O)。
11.显示GCSI胞质尾区中的精氨酸残基含有ER定位信息的实验。
为了更精确地确定GCSI的前13个氨基酸中四个精氨酸残基的作用,使用PCR定点诱变(构建体细节见表1)用亮氨酸或丙氨酸残基替换这些残基,并在烟草细胞中表达得到的融合蛋白。

尽管GCS90仅定位于ER中并且与ER标记物mRFP-HDEL完美地共定位(图20A、B)而不与高尔基体标记物ST-52-mRFP共定位(图20C),但是用丙氨酸残基替换Arg-6、Arg-7、Arg-10和Arg-12时,R/LGCS90仅使亮点高亮(图20D)。如此处通过与高尔基体标记物ST-mRFP的共定位所显示的,这些点对应于高尔基体(图20F)。未检测到ER标记(图20E)。用四个亮氨酸残基取代这四个精氨酸残基后,观察到对亚细胞定位的相同影响(图20G-I)。这些观察结果指出,位于N端第6-7-10和12位的四个精氨酸可能编码负责GCS90的ER停留的结构信息。
在第二步中,为了确定(RR)和(PXR)是否作为两个独立的信号发挥作用,用亮氨酸残基取代Arg-6和Arg-7或Arg-10和Arg-12。RR基序(构建体R/L10-12GCS90中的Arg-6和Arg-7)或RXR基序(构建体R/L6-7GCS90中Arg-10和Arg-12)以及RXXR基序(构建体R/L6-12GSC90中的Arg-7和Arg-10)的存在足以实现融合蛋白的ER停留(图20J到L和M到O)。然而在这三种情况下,除了ER标记外,也观察到与高尔基体堆不同的荧光点(图20L和20O)。
12.显示带有RR、RXR或RXXR基序的融合蛋白在ER中累积并在与高尔基体相关的荧光点中累积的实验 下一步是鉴定被R/L6-7GCS90、R/L10-12GCS9O和R/L6-12GSC90嵌合融合蛋白标记为荧光点的结构。如用R/L6/7GCS90蛋白质所显示的,GFP荧光在ER中和比高尔基体堆更小的荧光结构中累积(图20J到L和图21A到B)。为了更精确地定义这些结构在细胞中的定位,同时表达mRFP-HDEL ER标记物、ST52-mRFP高尔基体标记物以及R/L6-7GC S90、R/L10-12GC S90或R/L6-12GSC90融合蛋白。
结果示于图21A-B,并显示小荧光点与高尔基体堆密切相关,但是不同。由一个分散高尔基体和一个点结合形成的单位沿ER一起移动,并且从不解离。
考虑到这些结果,R/L6-7GCS90、R/L10-12GCS90和R/L6-12GSC90融合蛋白在ER中在位于ER和高尔基体之间的小中间体区域中累积,驻留在ER的可溶蛋白质除外(图20K和20N)。这些区域与高尔基体强力结合,并使高尔基体堆沿着ER皮层网络移动,因此这些区域可能是ER出口位点(ER-exit-site,ERES),如Yang等,2005中所述。为了证实这一点,将R/L6-7GCS90、R/L10-12GCS90和R/L6-12GSC90融合蛋白在烟草叶表皮细胞中与Sar1p-mRFP共表达。
遗憾的是,荧光点处未显示Sar1p-mRFP的募集(图22A到C)。然而,已显示Sar1p参与突变形式GCS90的转运。事实上,如图22J到L所示,当R/LGCS90与Sar1p/GTP-mRFP共表达时,Sar1p在ER处和荧光点处累积(图22K)。
相反,GCS90不募集Sar1p-mRFP,因为单独表达的Sar1p-mRFP位于ER中(数据未显示),而GCS90与Sar1p-RFP的共表达未改变GCS90标记(图22D到I)。另外,突变形式Sar1p/GTP-mRFP的表达导致高尔基体R/LGCS90停留在ER中。
总而言之,R/LGCS90的转运由胞质蛋白Sar1p调节。然而,用带有一个RR、RXR或RXXR基序的融合蛋白进行标记的小区域不与Sar1p-mRFP结合,尽管它们位于ER和高尔基体区室之间。
13.显示AtGCSI的ER停留不仅依赖于N端精氨酸基序的实验 在本实施例中,与高尔基体报告蛋白融合的GCSI精氨酸基序将其定位于ER。然而,没有证据表明这些信号是参与全长GCSI的ER定位的主要停留信号。
用亮氨酸或丙氨酸替换Arg-6、Arg-7、Arg-10和Arg-12导致GCS90构建体中ER导向信息的破坏,根据这一观察,在GCSI全长序列中缺失N端13个氨基酸以评价基序(RXR和RR)在野生型酶(D13GCSI,图15)ER靶向中的重要性。另外,合成N端缺少氨基酸1-13位残基的GCS150截短形式(D13GCS150,图15)。然后在叶表皮细胞中瞬时表达融合蛋白。与在高尔基体中累积的D13GCS90相反,D13GCSI和D13GCS150均仅定位于ER中(图23D-E)。另外,在烟草细胞中与ER标记物(mRFP-HDEL)同时表达嵌合蛋白质时,与GCS90相反,D13GCSI和D13GCS150均未在高尔基体中检测到,而两种荧光信号均在ER中观察到并与mRFP-HDEL完美地共定位(图23G-L)。这些结果与Hardt等,(2003)(参考文献28)的先前研究一致,所述研究证明人GCSI含有基于精氨酸的功能性信号,所述信号不是定位全长酶所必需的。在GCS90(图23F、23I和23L)、GCSI(图23D、23G和23J)和GCS150(图23E、23H和23K)之间观察到的标记差异表明,确定ER定位的关键信息必定包含在GCSI的腔内多肽链中,更可能包含于茎结构域的70-150位氨基酸残基之间。
为了验证该这种假说,将70-150位的81个氨基酸残基或90-150位的61个氨基酸与中间高尔基体标记物XYLT35的腔内结构域融合(图24A),并在烟草叶表皮细胞中瞬时表达这些新的蛋白质(XYLT35-GCS81和XYLT35-GCS60,图24B、C)。大部分GFP标记可见于ER中,“其余部分(remnant)”在高尔基体中。
在哺乳动物细胞中已显示,可以通过直接停留实现ER驻留,所述直接停留涉及蛋白质亚基通过其跨膜和/或腔内结构域结合得到大寡聚复合物,如先前针对定位于高尔基体的膜蛋白的亲缘识别模型中所述。(Nilsson等,1994(参考文献46);Opat等,2000(参考文献48)。推测这些大蛋白质寡聚物避免包装进转运囊泡中,从而防止它们被运出细胞器。这类机制可能在杂合寡聚物寡糖基转移酶复合物中亚基组分的ER停留中有功能,但是尚未在植物中描述。
总而言之,AtGCSI的胞质尾区和腔内结构域均含有ER靶向决定簇。与其特异性一致并且与其它真核体系中进行的观察完全相符的是,结果证明AtGCSI定位于植物ER中并仅定位于该区室中。在植物N-聚糖成熟中较早发挥作用的其它糖基化酶(如N-乙酰葡糖氨基转移酶(GNT1)和a1,2甘露糖苷酶(ManI))已显示既定位于ER中也定位于顺面高尔基体中。GNTI和ManI、ER和顺面高尔基体已显示含有位于胞质尾区中的靶向信息,而GCSI胞质尾区的前13个N端氨基酸含有ER靶向信号。本实施例显示了胞质尾区中哪些是参与ER靶向的关键氨基酸,而且也证明了富含精氨酸的胞质尾区不是整个蛋白质序列中唯一的ER靶向决定簇。
事实上,从GCS150中缺失富含精氨酸的序列并不能够使得从ER中输出至更晚期的区室如高尔基体,D13GCS90仍仅定位于ER中。
这些结果一起表明,GCSI序列中共存至少两个足以对高尔基体II型膜蛋白赋予ER停留的结构域。GCSI腔内结构域中的缺失表明,ER停留的信息包含在位于GCSI序列中90和150位氨基酸之间60个氨基酸的肽中。
关于腔内ER靶向信号的存在,对人葡萄糖苷酶I获得了相当的结果,但是迄今为止尚未表征所涉及的腔内序列(Hardt等,2003(参考文献28))。如上所述,与高尔基体报告蛋白XYLT35结合时,植物的腔内肽足以将XYLT35重新定位至ER。GCSI的腔内结构域能够促进AtGCSI与可溶和/或膜结合的ER驻留蛋白形成复合物。然而,与亲缘识别模型矛盾的是,显示一些大蛋白质复合物位于质膜中,并且必须完全装配才能被转运出ER。
事实上,解释停留时似乎不需要考虑这些复合物的大小。事实上,由于ER腔中极高的蛋白质浓度,对能形成蛋白质-蛋白质复合物的蛋白质而言,离开ER可能比留在内部更困难。如前文针对涉及BiP的另一ER分子陪伴体系所述,我们目前研究的是新生糖蛋白折叠机制是否能够在植物ER中形成由GCSI、葡萄糖苷酶II、钙联结蛋白、钙网织蛋白和ERp57形成的大的多蛋白质复合物。
14.GCSI的胞质尾区含有三个足以独立实现ER停留的二精氨酸信号 已经显示,富含精氨酸的序列(MTAGASRRSARGRI(SEQ ID N°1))足以将高尔基体标记物XYL35靶向在ER中。根据先前对哺乳动物细胞分泌途径中膜蛋白靶向的研究,进行本实施例来鉴定四个精氨酸残基是否含有ER停留信息。将四个精氨酸突变成丙氨酸或亮氨酸残基完全废除了该序列的ER停留能力,因为L/GGCS90存在于高尔基体中,从而证实了精氨酸残基在ER停留中的关键作用。
基于该富含精氨酸序列中的定向突变的进一步分析显示,事实上两个精氨酸残基(RR、RXR或RXXR SEQ ID N°70)足以赋予GCS90以ER停留,因此13个氨基酸的肽含有足够进行ER停留的三个不同的二精氨酸基序,所述基序共存于GCSI的胞质尾区中。有趣的是,当这三个二精氨酸基序中只有一个存在于GCS90的胞质尾区中时,不仅在ER中而且在小点中检测到荧光,所述小点与高尔基体堆结合并与其一起沿着ER轨道移动。
另外,可溶性ER标记蛋白GFP-HDEL被排除在这些小点之外。推测是检测到R/L6-7GCS90、R/L6-12GCS90和R/L10-12GCS90的这些小点对应于分泌单位(ERES),所述分泌单位位于ER表面并介导ER和高尔基体之间的物质交换(Runion等,2006(参考文献55))。验证该假说的进一步研究会支持基于单个分泌单位的ER/高尔基体转运模型,所述单个分泌单位与分散高尔基体结合并与其一起在ER表面上移动。然而,小点不与Sar1p共定位。已在哺乳动物膜蛋白中广泛地研究了二精氨酸基序,但是在本研究之前从未在其植物同源物中表征二精氨酸基序。有趣的是,先前在人GCSI中鉴定的二精氨酸基序显示在植物细胞中介导ER停留(Hardt等,2003(参考文献28))。
然而,在AtGCSI中鉴定的二精氨酸基序比其人同源物看起来更具灵活性。事实上,人a葡萄糖苷酶I的二精氨酸基序由+7和+8位的两个精氨酸残基和+9位的碱性氨基酸组成。在AtGCSI中,两个精氨酸残基之间的距离看起来更灵活,但是对良好的效率而言不能超过两个氨基酸。另外,该基序应当十分接近蛋白质的N末端。事实上,在GCSI中,+23和+24位的二精氨酸基序RR仍然存在于融合蛋白D13GCSS90-GFP中,但不足以赋予ER停留。
最后,可获得的GCSI序列的比较显示,这些ER驻留蛋白末端的二精氨酸基序是高度保守的(表2,Boisson等,2001(参考文献6);Hong等,2004(参考文献30))。

实施例2序列鉴定的描述 如先前的实施例中所示,表3中所列的每个信号都足以将报告蛋白质如绿色荧光蛋白靶向至ER和/或GA(见附图25A和25B)。

如先前所公开的,SEQ ID N°1到3代表用于将膜蛋白靶向至ER的一组锚定序列。这些序列位于膜蛋白的胞质尾区中,所述胞质尾区位于C-末端或N末端。
SEQ ID n°1MTAGASRRSARGRI SEQ ID n°2MARGERRRRA SEQ ID n°3MNDRRPQRKRPA 已经显示,这些胞质尾区(SED ID N°1到3)中存在的以下二精氨酸基序序列足以将报告膜蛋白保留在ER中 基序序列
如图25中所示,这些二精氨酸基序可分别位于II型和I型膜蛋白的N端或C端部分。
相应地测试了其他的以下序列 SED ID N°4到7负责重组膜多肽在ER中的严格保留。这些序列位于ER腔中。
SEQ ID n°4 FQGEHKESLYWGTYRPHVYFGVRARTPLSLVAGLMWLGVKDEMYVMRHFC SEQ ID n°5 FQGDHKESLYWGTYRPNVYLGIRARTPLSLIAGIMWIGAKNGQYFLRHVC SEQ ID n°6 ESDASLLWGTYRPQIYFGLRPRLPGSLLTGLAWFGLQDYSDFQHIRHQC SEQ ID n°7 ERSNRLFWGTYRPGIYFGMKHRSPISLLFGVMWTVQDAENFAFRHSC 估计与本发明的SEQ IDn°4具有至少70%同源性的每条序列均具有与本发明的靶向序列相同的作用。
在图26中,位于茎(S3)中的SEQ IDn°4到7负责膜蛋白在ER中的严格保留。S3是位于跨膜结构域附近的序列。
重组多肽在ER中的严格保留(见图26)通过将含有二精氨酸基序的SEQ ID N°1到3之一与SEQ ID N°4到7之一相结合来实现(如SEQ IDN°8中所示),并负责膜蛋白在ER中的严格保留和重组蛋白的稳定。
16到23位氨基酸的跨膜结构域(GS2)已显示足以将蛋白质定位至高尔基体。使用该结构域足以将重组蛋白或酶锚定在高尔基体膜中。本发明的肽信号中包含的已测试膜结构域(GS2)的例子如下 高尔基体酶的胞质尾区(GS1)、跨膜结构域(GS2)和茎(GS3)之间的排列负责顺面、中间或反面高尔基体中的膜蛋白保留(见附图26,底部图)。该排列允许酶或重组蛋白在高尔基体中亚区室化。本发明的这类肽信号序列的例子如下 GS1 SEQ ID n°17MARGSRSVGSSSSKWRYCNPSYYLKRPKR SEQ ID n°18MGVFSNLRGPRAGATHDEFPATNGSPSSSSSPSSSIKRK SEQ ID n°19MRGYKFCCDFR SEQ ID n°20 MGVFSNLRGPKIGLTHEELPVVANGSTSSSSSPSSFKRK SEQ ID n°21MLVMPQPPKPFN SEQ ID n°22MARGSRSVGSSSSKWRYCNPSYYLKRPKR SEQ ID n°23MANLWKKQRLRDTGLCR 来自GS3结构域的肽信号的例子如下 这些信号已用于在瞬时或稳定转化后在烟草、大豆、番茄或萝卜中对若干膜蛋白的表达进行靶向。这些信号可被添加至所述膜蛋白具有相同的靶向效率和特异性的膜蛋白的N端(II型膜蛋白)或C端(I型膜蛋白)(似乎信号也可以添加至III或IV型膜蛋白)。
GS1/GS2/GS3之间排列的例子 实施例3通过使用靶向序列在早期分泌途径区室内储存重组蛋白,从而防止在N-葡聚糖上添加免疫原性残基。
植物ER驻留蛋白的结构分析显示,它们仅带有高甘露糖型N-聚糖(Navazio等,1997(参考文献41),1998(参考文献42);Pagny等,2000(参考文献49))。这些寡糖结构是植物和哺乳动物共有,因此不是免疫原性的。该观察结果提出了一种防止免疫原性残基(如β1,2木糖或α1,3岩藻糖)与植物制成药物(PMP)N-聚糖结合的策略。该策略是在ER(即高尔基体囊膜上游)中储藏重组蛋白,在所述ER中添加免疫原性糖表位从而使植物N-聚糖成熟。首先显示在重组可溶蛋白质C末端添加H/KDEL氨基酸序列足以使其停留在植物ER中(Gomord等,1997(参考文献24),1999(参考文献22))。
在本实施例中,使用相同的策略将KDEL-ER信号序列与两种不同抗体的抗体重链和轻链二者融合。
使用SEQ ID N°1到8的序列将抗体的重链和轻链靶向至ER。
使用SEQ ID N°32到36的序列将抗体的重链和轻链靶向至ER和GA。
这些抗体仅代表了非免疫原性的高甘露糖型N-聚糖(Sriraman等,2004(参考文献59);Petrucelli等,2006(参考文献51)),指示了基于聚糖成熟的非常有效的再循环,所述聚糖成熟受限于位于ER和顺面高尔基体中的酶,如α-甘露糖苷酶I(Nebenfuhr等,1999(参考文献43))。因此,可能通过与ER停留信号融合来防止免疫原性N-聚糖与PMP结合。
实施例B在ER和/或GA中表达抗体或抗体片段(附图15,图B) 在ER和/或GA中表达抗体或抗体片段提供了用于改进重组蛋白生产的不同策略。例如,其可导致将未修饰(突变)的治疗性蛋白质靶向至ER和/或GA。
从最初证实在植物中的功能性表达抗体,已经确立了两个主要的研究方向。第一个是使用植物作为大规模生产治疗性抗体或抗体片段的生物反应器。在第二个策略中,在宿主细胞中表达抗体或抗体片段,以通过称作免疫调节的机制影响生理过程。近来已阐述了可能的免疫调控除草剂特异性抗体的表达显示在植物中(in planta)赋予抗性(Almquist KC等2004,(参考文献1)并见附图27)。
实施例C在植物细胞的ER和/或GA中表达同源或异源酶以及在所述细胞中表达重组蛋白 实施例1通过将哺乳动物糖基转移酶定位至植物细胞的ER/GA中而使植物细胞中的N-糖基化人源化(附图15,图C)。
在植物中,像在其他真核细胞中一样,N-糖基化在ER中开始,通过共翻译向新生多肽上的特定天冬酰胺残基添加寡糖前体(Glc3Man9GlcNAc2)。一旦转移至蛋白质上并且分泌型糖蛋白沿分泌途径被转运,则寡糖发生多次成熟,得到复杂的N-聚糖。许多药物的体内活性和稳定性需要糖基化,所述药物包括用于效应器功能(如引发免疫应答)的抗体(Wright和Morrison,1994(参考文献64))。这就为什么在使用能够产生重组抗体的可能的植物时,为了获得“人源化的”非免疫原性N-聚糖,必须抑制这些植物特异性成熟。
使植物N-聚糖人源化的一种吸引人的策略是在植物中表达哺乳动物糖基转移酶,这可完成植物高尔基体中N-聚糖成熟的内源机制(或与之竞争)。以这些回补(complementation)策略为基础,在植物细胞高尔基体中表达人β(1,4)-半乳糖基转移酶导致植物N-聚糖的部分人源化,并可能与β(1,2)-木糖和α-(1,3)-岩藻糖竞争。
苜蓿或烟草植物中人β(1,4)-半乳糖基转移酶的表达将半乳糖残基转移至植物N-聚糖的末端N-乙酰葡糖胺残基上。然而,在表达该人半乳糖基转移酶的烟草或苜蓿植物中生产的糖蛋白所带有的N-聚糖中,仅30%到40%带有哺乳动物样的末端N-乙酰乳糖胺序列(Bakker等,2001(参考文献2)。
人β(1,4)-半乳糖基转移酶与高尔基体靶向信号融合。
用于hGalT和GNTIhGalT表达的质粒从pBLTI121装配而来(Pagny等,2003,参考文献50)。用HindIII-XbaI位点的苜蓿质体蓝素(plastocyanin)启动子代替CaMV 35S启动子。通过EcoRI消化从pUC19-hGalT分离人β(1,4)-半乳糖基转移酶(hGalT)基因(UDP半乳糖β-N-乙酰氨基葡糖苷β(1,4)-半乳糖基转移酶;EC 2.4.1.22)。klenow处理后,在SmaI位点处将1.2kb hGalT片段克隆进pBLTI221中。然后使用FGalT正向引物(5′-GACTCTAGAGCGGGAAGATGAGGCTTCGGGAGCCGCTC-3’SEQ ID N°92)和反向RGalTFlagStu引物(5′-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3′SEQ ID N°93),通过PCR将flag标签融合至编码区的C端。然后通过将该XbaI-StuI片段克隆进Plasto启动子和Nos终止子的控制下的二元载体pBLTI121中来产生R622。
使用正向FGNT(5′-ATCGAAATCGCACGATGAGAGGGTACAAGTTTTGC-3’SEQ ID N°94)和反向RGNTspe(5′-CCCATGATGCGATCTGCATATTCTGACTGTGTCGC-3’SEQ ID N°95)引物,通过PCR扩增对应于跨膜结构域的来自烟草(N.tabacum)N-乙酰葡糖氨基转移酶I(GNTI)的N端前38个氨基酸,随后克隆进pGEM-T载体中,并通过Apal/BamHI克隆进pBLTI221。为了GNTI和hGalT之间的融合,从pUC19-hGalT进行PCR扩增,以消除其自身的TMD并产生SpeI和StuI位点。使用正向引物FGalTspe(5′-GGACTAGTGCACTGTCGCTGCCCGCCTGC-3’SEQ ID N°96)和反向引物RgalTFlagStu(5′-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3’SEQ ID N°97)扩增SpeI/StuI hGalT片段。
然后将该片段克隆进pBLTI221-GNTI中。最后,通过周围的位点XbaI/StuI进行的消化允许分离1030bp的片段,随后通过将该1030片段克隆进二元载体pBLTI121-Plasto中而产生R 622。
如下进行苜蓿植物的转化。
如下使用根癌农杆菌(Agrobacterium tumefaciens)AGL 1转化苜蓿(Medicago sativa L)生态型R2336并进行以下修改将叶柄、茎和叶外植体与农杆菌共培养5到7天。用0.8到1OD的未稀释农杆菌培养物和3%蔗糖(代替1.5%蔗糖)在SH2K培养基中进行共培养步骤。将相应外植体胚胎发育得到的充分建立的植物转移进温室中的土壤中,并对叶进行分析。
如下对分离自野生型和经GalT或GNTI/GalT转化的苜蓿植物的N-联聚糖进行分析。
在4℃下,在5ml提取缓冲液(0.7M蔗糖、0.5M Tris、30mM HCl、0.1M KCl、2%β-巯基乙醇)中从500mg新鲜苜蓿叶中提取蛋白质30分钟。通过在4℃下5,000g离心10分钟去除不溶的材料。在4℃下,在30分钟中通过添加1倍体积以水饱和的苯酚来处理所得的上清液。然后在-20℃下以5倍体积的PB(0.1M溶于甲醇中的乙酸铵)将苯酚级分中含有的蛋白质和糖蛋白沉淀过夜。用5ml PB洗涤沉淀物后,如先前Bakker等,2001中所述通过用胃蛋白酶和PNGase A先后处理来消化蛋白质和糖蛋白。然后用2-氨基苯甲酰胺(2-AB)对N-聚糖进行荧光标记。
在装有337-nm氮激光器的Voyager DE-Pro MALDI-TOF设备(Applied Biosystems,USA)上,获得这些所产生N-聚糖的MALDI-TOF质谱。使用2,5-二羟基苯甲酸(Sigma-Aldrich)作为基质,在反射器中延迟提取模式下运行质谱。
将以5mg.mL-1新溶于70∶30%乙腈/0.1%TFA中的基质与溶解的寡糖以1∶1(V/V)的比例混合。使用20,000V的加速电压和100ns的延迟时间,在正模式下记录这些光谱。对其进行一次平滑处理(smooth),并使用可购得的肽和蛋白质的混合物(Applied Biosystems)进行外部校准。在该研究中,使用des-Arg1-缓激肽(904.4681Da)、血管紧张素I(1296.6853)、Glu1-血纤肽B(1570.6774Da)、ACTH clip 18-39(2465.1989)和牛胰岛素(5730.6087)校准光谱。对每个光谱累积激光射点(Laser shot),从而获得可接受的信噪比。
如先前所公开的,本发明提供了大批信号,所述信号用于将糖基转移酶活性仅靶向至亚细胞区室和亚区域中。这提供了多种方式来通过共表达表5中所列酶而提高宿主表达系统中N-和O-糖基化的效率,并优化异源蛋白质的转录后修饰。
表5与本发明序列融合的酶。
如先前实施例中所公开的,本发明提供了生产蛋白质的方法、在植物细胞亚区室中修饰/表达蛋白的方法、在植物细胞RE和/或GA中表达异源蛋白质的方法。本发明还提供了经转录后修饰的蛋白质。
实施例D表达与信号序列融合的

蛋白 在本实施例中,产生包含

和序列信号(SEQ ID N°8)和甘露糖苷酶I的融合蛋白,从而将糖苷酶作为膜蛋白在蛋白质体中累积。使用靶向序列(SEQ IDn°8)使酶在ER膜中累积,并允许通过ZERA肽形成聚集体来生产蛋白质体。
目标是在蛋白质体中累积带有N-聚糖(Man5GlcNAc2)的糖蛋白。
质粒构建体通过PCR扩增编码与人甘露糖苷酶I(登录号Q9UKM7)融合的ZERA的ADNc,并在SPeI和SacI位点处将其亚克隆进含靶向信号(SED IDn°8)的pBLTI121中。
农杆菌介导的烟草BY-2细胞转化 通过热激将pVKH18En6-mRFP、PBLTI121-GFP和pBIN20-GFP融合物转移进根癌农杆菌(菌株GV3101pMP90中,Koncz和Schell,1986)。在含卡那霉素(100mg.mL-1)和庆大霉素(100mg.mL-1)的YEB培养基(每升中含牛肉提取物5g,酵母提取物1g,蔗糖5g,MgSO4-7H2O 0.5g)上选择转基因农杆菌,并用于转化烟草(变种Bright Yellow-2)BY-2细胞,如Gomord等,1998中所述。在卡那霉素(100mg.mL-1)和头孢噻肟(250mg.mL-1)存在下针对PBLTI121-GFP和pBIN20-GFP融合物选择经转化的烟草细胞,或在潮霉素(40mg.mL-1)和头孢噻肟(250mg.mL-1)存在下针对pVKH18En6-mRFP选择转化的烟草细胞。对共表达GFP和mRFP融合物的双重转化体而言,首先在卡那霉素平板上选择微愈伤组织(microcalli),然后转移至潮霉素平板上。筛选后,使用表达GFP和/或mRFP融合物的愈伤组织来起始转基因细胞的悬浮培养。使用3-4日龄的BY-2悬浮培养细胞进行实验。
在本实施例中产生的融合蛋白在转化细胞中表达,使酶在ER膜中累积,并允许通过ZERA肽形成聚集体来生产蛋白质体。
如先前的实施例中所公开的,本发明允许将蛋白质靶向至细胞的特定区域,提高重组多肽生产的产率,防止重组多肽的免疫原性,以及获得作为其天然对应物的精确拷贝的治疗活性重组多肽。本发明还允许生产经转录后修饰的蛋白质。
参考文献
参考文献1Almquist,Kurt C.Yongqing Niu,Michael D.McLean,Frank L.Mena,Kerrm Y.F.Yau,Kirk Brown,Jim E.Brandle,J.ChristopherHall(2004)Immunomodulation confers herbicide resistance inplants Plant Biotechnology Journal 2(3),189-197.
参考文献2 Bakker Hans
Muriel Bardor,Jos W.Molthoff,VéroniqueGomord,lngrid Elbers,Lucas H.Stevens,Wilco Jordi,ArjenLommen,
Faye,Patrice Lerouge,and Dirk Bosch(2001)Galactose-extended glycans of antibodies produced by transgenicplants PNAS February 27,2001 vol.98 no.52899-2904
参考文献3 Barrieu
and Maarten J.Chrispeels(1999)Delivery of aSecreted Soluble Protein to the Vacuole via a Membrane Anchor.Plant Physiol.(1999)120961-968
参考文献4 Benghezal,M.,Wasteneys,G.O.,and Jones,D.A,2000.TheCterminal dilysine motif confers endoplasmic reticulum localisationto type I membrane proteins in plants.Plant Cell 121179-1201.
参考文献5 Boevink,P.,Oparka,K.,Santa Cruz,S.,Martin,B.,Betteridge,A.and Hawes,C.(1998).Stacks on tracksthe plant Golgiapparatus traffics on an actin/ER network.Plant J.15,441-447.
参考文献6 Boisson,M.,Gomord,V.,Audran,C.,Berger,N.,Dubreucq,B.,Granier,F.,Lerouge,P.,Faye,L.,Caboche,M.and Lepiniec,L.(2001).Arabidopsis glucosidase I mutants reveal a critical role ofN-glycan trimming in seed development.EMBO J.20,1010-1019.
参考文献7 Bracha K,Lavy M,Yalovsky S.The Arabidopsis AtSTE24is aCAAX protease with broad substrata specificity.J Biol Chem.2002Aug 16;277(33)29856-64.
参考文献8 Brandizzi,F.,Frangne,N.,Marc-Martin,S.,Hawes,C.,Neuhaus,J-M.and Paris,N.(2002a).The destination for single-passmembrane proteins is influenced markedly by the length of thehydrophobic domain.Plant Cell,14,1077-1092.
参考文献9 Brandizzi,F.,Snapp,E.,Roberts,A.,Lippincott-Schwartz,J.andHawes,C.(2002b).Membrane protein transport between the ERand Golgi in tobacco leaves is energy dependent but cytoskeletonindependentevidence from selective photobleaching.Plant Cell14,1293-1309.
参考文献10 Bretscher,M.S.and Munro,S.(1993).Cholesterol and the Golgiapparatus.Science 261,1280-1281.
参考文献11 Campbell,R.E.,Tour,O.,Palmer,A.E.,Steinbach,P.A.,Baird,G.S.,Zacharias,D.A.and Tsien,R.Y.(2002).A monomeric redfluorescent protein.Proc.Natl.Acad.Sci.USA 99,7877-7882.
参考文献12 Ciczora Yann 1,Nathalie Callens1,Claire Montpellier1,BirkeBartosch2,
Cosset2,Anne Op De
and JeanDubuisson1 Contribution of the charged residues of hepatitis Cvirus glycoprotein E2 transmembrane domain to the functions ofthe E1E2 heterodimer.J Gen Virol 86(2005),2793-2798;
参考文献13 Contreras,Elena Ortiz-Zapater,Fernando Aniento (2004)Sortingsignals in the cytosolic tail of membrane proteins involved in theinteraction with plant ARF1 and coatomer The Plant Journal 38(4),685-698
参考文献14 De Praeter,C.M.,Gerwig,G.J.,Bause,E.,Nuytinck,L.K.,Vliegenthart,J.F.,Breuer,W.,Kamerling,J.P.,Espeel,M.F.,Martin,J.J.,De Paepe,A.M.,et al.(2000).A novel disordercaused by defective biosynthesis of N-linked oligosaccharides dueto glucosidase I deficiency.Am J Hum Genet 66,1744-1756.
参考文献15 Dirnberger,D,Bencur,P,Mach,L.and Steinkellner,H.(2002).The Golgi localization of Arabidopsis thaliana beta1,2-xylosyltransferase in plant cells is dependent on its cytoplasmicand transnembrane sequences.Plant Mol.Biol.50,273-281.
参考文献16 Essl,D.,Dirnberger,D.,Gomord,V.,Strasser,R.,Faye,L.,
J.and Steinkellner,H.(1999).The N-terminal 77 amino acids fromtobacco N-acetylglucosaminyltransferase I are sufficient to retain areporter protein in the Golgi apparatus of Nicotiana benthamianacells.FEBS Lett.453,169-173.
参考文献17 Faye
Aurelia Boulaflous,Meriem Benchabane,VéroniqueGomorda and Dominique Michaud Protein modifications in theplant secretory pathwaycurrent status and practical implications inmolecular pharming Volume 23,Issue 15,7March 2005,Pages1770-1778
参考文献18 Füllekrug,J.and Nilsson,T.(1998).Protein sorting in the Golgicomplex.Biochim.Biophys.Acta 1404,77-84.
参考文献19 Gillmor,C.S.,Poindexter,P.,Lorieau,J.,Palcic,M.M.,andSomerville,C.(2002).Alpha-glucosidase I is required for cellulosebiosynthesis and morphogenesis in Arabidopsis.J Cell Biol 156,1003-1013.
参考文献20 Giraudo,C.D.and Maccioni,H.J.F.(2003).Endoplasmic reticulumexport of glycosyltransferases depends on interaction of acytoplasmic dibasic motif with Sar1.Mol.Biol.Cell 14,3753-3766.
参考文献21 Gomord,V.,and Faye,L.(2004).Posttranslational modificationof therapeutic proteins in plants,Curr Opin Plant Biol 7,171-181.
参考文献22 Gomord V,Wee E.and Faye L.(1999).Protein retention andlocalization in the endoplasmic reticulum and the Golgi apparatus.Biochimie,81,607-618
参考文献23 Gomord V,Sourrouille C.,Fichette A.C.,Barbor M.Pagny S.,Lerouge P.,and Faye L.(2004)Production and glycosylation ofplant made pharmaceuticalsthe antibodies as a challenge.PlantBiotechnol.,2,83-100.
参考文献24 Gomord V.,Denmat L.A.,Fitchette-Laine A.C.,Satiat-jeunemaitre,Hawes C.and Faye L.(1997).The C-terminal HDEL sequence issufficient for retention of secretory proteins but promotes vacuolartargeting of proteins that escape the endoplasmic reticulum.PlantJ.,11,313-326
参考文献25 Gomord,V.,Fitchette,A.C.,Denmat,L.A.,Michaud,D.and Faye,L.(1998).Production of foreign proteins in tobacco cellsuspension culture.In Methods in Molecular Biotechnology,Vol 3(Cunningham C.and Porter A.J.R.Eds.)TotowaHumana PressInc.,pp.155-164.
参考文献26 Grove,S.N.,Brecker,C.E.and Morré,D.J.(1968).Cytomembranedifferentiation in the endoplasmic reticulum-Golgi apparatus-yesiclecomplex.Science 161,171-173,
参考文献27 Hanton SL,Renna L,Bortolotti LE,Chatre L,Stefano G,BrandizziF.(2005).Diacidic motifs influence the export of transmembraneproteins from the endoplasmic reticulum in plant cells.Plant Cell.2005 17,3081-3093.
参考文献28 Hardt,B.,Kalz-Füller,B.,Aparicio,R.,
C.and Bause,E.(2003).(Arg)3within the N-terminal domain of glucosidase Icontains ER targeting information but is not required absolutely forER localisation.Glycobiology,13,159-168.
参考文献29 Hartmann,M.A.and Benveniste,P.(1987).Plant membranesterolsisolation,identification and biosynthesis.MethodsEnzymol.148632-650.
参考文献30 Hong,Y.,Sundaram,S.,Shin,D.-J.,and Stanley,P.(2004).TheLec23 Chinese Hamster Ovary Mutant Is a Sensitive Host forDetecting Mutations in {alpha}-Glucosidase I That Give Rise toCongenital Disorder of Glycosylation IIb (CDGIIb)10.1074/jbc.M410121200.J Biol Chem 279,49894-49901.
参考文献31 Janzik I,Macheroux P,Amrhein N,Schaller A LeSBT1,a subtilasefrom tomato plants.Overexpression in insect cells,purification,andcharacterization.J Biol Chem.2000Feb 18;275(7)5193-9
参考文献32 Lienard D.,Tran Dinh O.,E.van Oort,L.Van Overtvelt,C.Bonneau,E.Wambre,M.Bardor,P.Cosette,A.Didier-Laurent,F.Dorlhac de Borne,R.Delon,R.van Ree,P.Moingeon,L.Faye andV.Gomord(2007)Suspension-cultured BY-2 tobacco cellsproduce and mature immunologically active house dust miteallergens...*DL and OTD have equal contributions to this work,Plant biotechnol.J.5,93-108
参考文献33 Lynch,D.V.(1993).Sphingolipids.In Lipid Metabolism in Plants(Moore T.S.Ed.)Boca Raton,FLCRC Press,pp.285-308.
参考文献34 Masibay,A.S.,Balaji,P.V.,Boeggeman,E.E.and Qasba,P.K.(1993).Mutational analysis.of the Golgi retention signal of bovineb-1,4-galactosyltransferase.J.Biol.Chem.268,9908-9916.
参考文献35 McCartney,A.W.,Dyer,J.M.,Dhanoa,P.K.,Kim,P.K.,Andrews,D.W.,McNew,J.A.,and Mullen,R.T.(2004).Membrane-bound fatty acid desaturases are inserted co-translationally into the ER and contain different ER retrieval motifsat their carboxy termini.Plant J 37,156-t73.
参考文献36 Moreau,P.,Hartmann,M.A.,Perret,A.M.,Sturbois-Balcerzak,B.and Cassagne,C.(1998).Transport of sterols to the plasmamembrane of leek seedlings.Plant Physiol.117,931-937.
参考文献37 Morré,D.J.and Mollenhauer,H.H.(1974).The endomembraneconcepta functional integration of endoplasmic reticulum andGolgi apparatus.In Dynamic Aspects of Plant Ultrastructure.(Robards A.W.Ed.)LondonMcGraw-Hill Book Cy,pp.84-137.
参考文献38 Munro,S.(1991).Sequences within and adjacent to thetransmembrane segment of b-2,6-sialyltransferase specify Golgiretention.EMBO J.10,3577-3588.Munro,S.(1995a).Acomparison of the transmembrane domains of Golgi and plasmamembrane proteins.Biochem.Soc.Trans.23,527-530.
参考文献39 Munro,S.(1995b).An investigation of the role of thetransmembrane domain in Golgi protein retention.EMBO J.14,4695-4704.
参考文献40 Munro,S.(1998).Localization of proteins to the Golgi apparatus.Trends Cell Biol.8,11-15.
参考文献41 Navazio L.,Sponga L.,Damese P.,Fitchette-Laine A-C.,Faye L.,Baldan B.and mariani P.(1997).The calcium binding proteincalreticulin in pollen of Liriodendron tulipifera L.Plant Sci.,131,35-42
参考文献42 Navazio L.,Nardi C.,Pancaldu C.,Danese P.,Baldan B.,Fitchette-Laine A.C.,Faye L.,Meggip F.,Martin W.and Mariani P.(1998).Functional conservation of calreticulin in euglena gracilis.J.Euk.Microbiol.,45,307-313.
参考文献43 Nebenführ,A.,Gallagher,L.A.,Dunahay,T.G.,Frohlick,J.A.,Mazurkiewicz,A.M.,Meehl,J.B.and Staehelin,L.A.(1999).Stop-and-go movements of plant Golgi stacks are mediated by the acto-myosin system.Plant Physiol.121,1127-1142.
参考文献44 Nilsson,T.,Pypaert,M.,Hoe,M.H.,Slusarewicz,P.,Berger,E.G.and Warren,G.(1993a).Overlapping distribution of twoglycosyltransferases in the Golgi apparatus of HeLa cells.J.CellBiol.120,5-13.
参考文献45 Nilsson,T.,Slusarewicz,P.,Hoe,M.H.and Warren,G.(1993b).Kin recognitionA model for the retention of Golgi enzymes.FEBS Lett.330,1-4.
参考文献46 Nilsson,T.,Hoe,M.H.,Slusarewicz,P.,Rabouille,C.,Watson,R.,Hunte,F.,Watzele,G.,Berger,E.G.and Warren,G.(1994).Kinrecognition between medial Golgi enzymes in HeLa cells.EMBOJ.13,562-574.
参考文献47 Nilsson,T.,Rabouille,C.,Hui,N.,Watson,R.and Warren,G.(1996).The role of the membrane spanning domain and stalkregion of N-acetylglucosaminyltransferase I in retention,kinrecognition and structural maintenance of the Golgi apparatus inHeLa cells.J.Cell Sci.109,1975-1989.
参考文献48 Opat,A.S.,Houghton,F.and Gleeson,P.A.(2000).Medial Golgibut not late Golgi glycosyltransferases exist as high molecularweight complexes.J.Biol.Chem.275,11836-11845.
参考文献49 Pagny S.,Cabanes-Macheteau M.,Gillikin J.W.;Leborgne-CastelN.,Lerouge P.,Boston R.Faye L.and Gomord V.(2000).Proteinrecycling from the Golgi apparatus to the endoplasmic reticulum inplants and its minor contribution to calreticulin retention.Plant Cell,12,739-755
参考文献50 Pagny,S.,Bouissonié,F.,Sarkar,M.,Follet-Gueye,M.L.,Driouich,A.,Schachter,H.,Faye,L.and Gomord,V.(2003).Structuralrequirements for Arabidopsis b-1,2-xylosyltransferase activity andtargeting to the Golgi.Plant J.33,189-203.
参考文献51 Petruccelli S.,Otegui MS.,Lareu F.,Trandinhthanhlien O.,Fitchette AC.,Circosta A.,Rumbo M.,Bardor M.,Carcamo R.,Gomord V.and Beachy RN.A KDEL tagged monoclonal antibodyis.efficiently retained in.the reticulum endoplasmic in leaves but isboth partially secreted and sorted to protein storage vacuoles inseeds.Plant Biotechnol.J.,4,511-527)
参考文献52 Rautengarten C,Steinhauser D,Bussis D,Stintzi A,Schaller A,Kopka J,Altmann T Inferring hypotheses on functionalrelationships of genesAnalysis of the Arabidopsis thalianasubtilase gene family.PLoS Comput Biol.2005 Sep;1(4)e40.Epub 2005 Sep 2
参考文献53 Reyes,F.,Marchant,L.,Norambuena,L.,Nilo,R.,Silva,H.,andOrellana,A.(2006).AtUTr1,a UDP-glucose/UDP-galactosetransporter from Arabidopsis thaliana,is located in theendoplasmic reticulum and up-regulated by the unfolded proteinresponse.J Biol Chem 281,9145-9151.
参考文献54 Ritzenthaler,C.,Nebenfuhr,A.,Movafeghi,A.,Stussi-Garaud,C.,Behnia,L.,Pimpl,P.,Staehelin,L.A.and Robinson,D.G.(2002).Reevaluation of the effects of brefeldin A on plant cells usingtobacco Bright Yellow 2 cells expressing Golgi-targeted greenfluorescent protein and COPI antisera.Plant Cell.14,237-261.
参考文献55 Runions J.,Brach T.,Külner S and Hawes C.(2006).Photoactivation of GFP reveals protein dynamics within theendoplasmic reticulum membrane.J.Exp.Bot.57,43-50.
参考文献56 Saint-Jore,C.M.,Evins,J.,Batoko,H.,Brandizzi,F.,Moore,I.andHawes,C.(2002).Redistribution of membrane proteins betweenthe Golgi apparatus and endoplasmic reticulum in plants isreversible and not dependent on cytoskeletal networks.Plant J.,29,661-678.
参考文献57 Saint-Jore-Dupas C.,Gomord V.and Paris N.(2004).Proteinlocalization in the Golgi apparatus and the trans-Golgi network.Cell Mol.Life Sci.,61,159-171.
参考文献58 Saint-Jore-Dupas C.,Nebenführ A.,Follet-Gueye ML.,BoulaflousA.,Hawes C.,Driouich A.,Faye L.and Gomord V.,(2006)Partitioning of N-glycan maturation enzymes along the secretorypathway and a key role of transmembrane domain length in early-Golgi targeting.Plant Cell 18,3182-3200
参考文献59 Sriraman R.,Bardor M.,Sack M.,Vaquero C.,Faye L.,Fischer R.,Finnern R,Lerouge P.(2004)Recombinant anti-hCG antibodiesretained in the endoplasmic reticulum of transformed plants lackcore-xylose and core-alpha(1,3)-fucose residues.PlantBiotechnol;,2,279-287
参考文献60 Strasser,R.,Mucha,J.,Schwihla,H.,Altmann,F.,
J.andSteinkellner,H.(1999).Molecular cloning and characterisation ofcDNA coding for b-1,2-N-acetylglucosaminyltransferase I(GlcNAc-TI)from Nicotiana tabacum.Glycobiology 9,779-785.
参考文献61 Strasser,R.,Schoberer J.,Jin C.,Mucha,J.,
J.,Mach L.and Steinkellner,H.(2006).Molecular cloning andcharacterisation of Arabidopsis thaliana Golgi a-mannosidase II,akey enzyme in the formation of complexN-glycans in plants.PlantJ.45,789-803
参考文献62 Teasdale,R.D.and Jackson,M.R.(1996).Signal-mediated sortingof membrane proteins between the endoplasmic reticulum and theGolgi apparatus.Ann.Rev.Cell Develop.Biol.12,27-54.
参考文献63 Wee,E.G.T.,Sherrier,J.,Prime,T.and Dupree,P.(1998).Targeting of active sialyltransferase to the plant Golgi apparatus.Plant Cell 10,1759-1768.
参考文献64 Wright A,Morrison SL.Effect of altered CH2-associatedcarbohydrate structure on the functional properties and in vivo fateof chimeric mouse-human immunoglobulin G1.J Exp Med,1994Sep 1;180(3)1087-96
参考文献65 Yuasa,K.,Toyooka,K.,Fukuda,H.and Matsuoka,K.(2005).Membrane-anchored prolyl hydroxylase with an export signal fromthe endoplasmic reticulum.Plant J.41,81-94.
参考文献66 Zerangue,N.,Schwappach,B.,Jan,Y.N.and Jan,L.Y.(19g9).Anew ER trafficking signal regulates the subunit stoichiometry ofplasma membrane K(ATP)channels.Neuron 22,537-548.
序列表
<110>CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE(CNRS)
GOMORD,Véronique
SAINT-JORE-DUPAS,Claude
BOULAFLOUS,Aurélia
KIEFER-MEYER,Marie-Christine
FAYE,
<120>用于靶向重组多肽的表达和控制其翻译后修饰的一组序列
<130>51706/PCT
<150>US 60/857,524
<151>2006-11-08
<160>132
<170>PatentIn version 3.3
<210>1
<211>14
<212>PRT
<213>人工的
<220>
<223>肽信号(S1)
<400>1
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210>2
<211>10
<212>PRT
<213>人工的
<220>
<223>肽信号(S1)
<400>2
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala
1 5 10
<210>3
<211>12
<212>PRT
<213>人工的
<220>
<223>肽信号(S1)
<400>3
Met Asn Asp Arg Arg Pro Gln Arg Lys Arg Pro Ala
1 5 10
<210>4
<211>50
<212>PRT
<213>人工的
<220>
<223>茎序列S3
<400>4
Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu Ser Leu Val Ala
20 25 30
Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr Val Met Arg His
35 40 45
Phe Cys
50
<210>5
<211>50
<212>PRT
<213>人工的
<220>
<223>茎序列S3
<400>5
Phe Gln Gly Asp His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
Asn Val Tyr Leu Gly Ile Arg Ala Arg Thr Pro Leu Ser Leu Ile Ala
20 25 30
Gly Ile Met Trp Ile Gly Ala Lys Asn Gly Gln Tyr Phe Leu Arg His
35 40 45
Val Cys
50
<210>6
<211>49
<212>PRT
<213>人工的
<220>
<223>茎序列S3
<400>6
Glu Ser Asp Ala Ser Leu Leu Trp Gly Thr Tyr Arg Pro Gln Ile Tyr
1 5 10 15
Phe Gly Leu Arg Pro Arg Leu Pro Gly Ser Leu Leu Thr Gly Leu Ala
20 25 30
Trp Phe Gly Leu Gln Asp Tyr Ser Asp Phe Gln His Ile Arg His Gln
35 40 45
Cys
<210>7
<211>47
<212>PRT
<213>人工的
<220>
<223>茎序列S3
<400>7
Glu Arg Ser Asn Arg Leu Phe Trp Gly Thr Tyr Arg Pro Gly Ile Tyr
1 5 10 15
Phe Gly Met Lys His Arg Ser Pro Ile Ser Leu Leu Phe Gly Val Met
20 25 30
Trp Thr Val Gln Asp Ala Glu Asn Phe Ala Phe Arg His Ser Cys
35 40 45
<210>8
<211>150
<212>PRT
<213>人工的
<220>
<223>接合S1和S3
<400>8
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys Ile Leu Val Gly Leu Ile Ile Leu Gly Ile Ile Val Ile
50 55 60
Tyr Phe Val Ile Asn Arg Leu Val Arg His Gly Leu Leu Phe Asp Glu
65 70 75 80
Ser Gln Lys Pro Arg Val Ile Thr Pro Phe Pro Ala Pro Lys Val Met
85 90 95
Asp Leu Ser Met Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly
100 105 110
Thr Tyr Arg Pro His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu
115 120 125
Ser Leu Val Ala Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr
130 135 140
Val Met Arg His Phe Cys
145 150
<210>9
<211>21
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>9
Xaa XaaXaa Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser Phe
15 10 15
Val Phe Trp Asp Arg
20
<210>10
<211>25
<212>pRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>10
Xaa Xaa Arg Tyr Leu Leu Ile Leu Ala Ala Val Ala Phe Ile Tyr Ile
1 5 10 15
Gln Met Arg Leu Phe Ala Thr Gln Ser
20 25
<210>11
<211>24
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(22)..(24)
<223>Xaa可以是任何天然氨基酸
<400>11
Xaa Xaa Xaa Leu Gly Ile Leu Phe Ala Val Thr Leu Ser Ile Val Leu
1 5 10 15
Met Leu Val Ser Val Xaa Xaa Xaa
20
<210>12
<211>23
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>12
Xaa Xaa Lys Ile Phe Leu Tyr Met Leu Leu Leu Asn Ser Leu Phe Leu
1 5 10 15
Ile Ile Tyr Phe Val Phe His
20
<210>13
<211>26
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>13
Xaa Xaa Xaa Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val Ala Leu
1 5 10 15
Val Val Ile Ala Glu Ile Gly Phe Leu Gly
20 25
<210>14
<211>26
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>14
Xaa Xaa Xaa Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val Ala Leu
1 5 10 15
Val Val Ile Ile Glu Ile Gly Phe Leu Cys
20 25
<210>15
<211>29
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(28)..(29)
<223>Xaa可以是任何天然氨基酸
<400>15
Xaa Xaa Phe Asn Thr Ile Thr Ile Thr Ile Met Ile Ala Phe Thr Phe
1 5 10 15
Phe Leu Leu Phe Leu Thr Gly Phe Leu Gln Phe Xaa Xaa
20 25
<210>16
<211>29
<212>PRT
<213>人工的
<220>
<223>跨膜结构域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>16
Xaa Xaa Lys Arg Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Cys Val Ser Phe Val Phe Trp Asp Arg
20 25
<210>17
<211>29
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>17
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210>18
<211>39
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>18
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys
35
<210>19
<211>11
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>19
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg
1 5 10
<210>20
<211>39
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>20
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys
35
<210>21
<211>12
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>21
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn
1 5 10
<210>22
<211>29
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>22
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210>23
<211>17
<212>PRT
<213>人工的
<220>
<223>胞质尾GS1
<400>23
Met Ala Asn Leu Trp Lys Lys Gln Arg Leu Arg Asp Thr Gly Leu Cys
1 5 10 15
Arg
<210>24
<211>166
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>24
Arg Ile Asn Leu Ala Arg Glu His Glu Val Glu Val Phe Lys Leu Asn
1 5 10 15
Glu Glu Val Ser Arg Leu Glu Gln Met Leu Glu Glu Leu Asn Gly Gly
20 25 30
Val Gly Asn Lys Pro Leu Lys Thr Leu Lys Asp Ala Pro Glu Asp Pro
35 40 45
Val Asp Lys Gln Arg Arg Gln Lys Val Lys Glu Ala Met Ile His Ala
50 55 60
Trp Ser Ser Tyr Glu Lys Tyr Ala Trp Gly Lys Asp Glu Leu Gln Pro
65 70 75 80
Arg Thr Lys Asp Gly Thr Asp Ser Phe Gly Gly Leu Gly Ala Thr Met
85 90 95
Val Asp Ser Leu Asp Thr Leu Tyr Ile Met Gly Leu Asp Glu Gln Phe
100 105 110
Gln Lys Ala Arg Glu Trp Val Ala Ser Ser Leu Asp Phe Asp Lys Asp
115 120 125
Tyr Asp Ala Ser Met Phe Glu Thr Thr Ile Arg Val Val Gly Gly Leu
130 135 140
Leu Ser Ala Tyr Asp Leu Ser Gly Asp Lys Met Phe Leu Glu Lys Ala
145 150 155 160
Lys Asp Ile Ala Asp Arg
165
<210>25
<211>280
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>25
Thr Leu Phe His Phe Gly Val Pro Gly Pro Ile Ser Ser Arg Phe Leu
1 5 10 15
Thr Ser Arg Ser Asn Arg Ile Val Lys Pro Arg Lys Asn Ile Asn Arg
20 25 30
Arg Pro Leu Asn Asp Ser Asn Ser Gly Ala Val Val Asp Ile Thr Thr
35 40 45
Lys Asp Leu Tyr Asp Arg Ile Glu Phe Leu Asp Thr Asp Gly Gly Pro
50 55 60
Trp Lys Gln Gly Trp Arg Val Thr Tyr Lys Asp Asp Glu Trp Glu Lys
65 70 75 80
Glu Lys Leu Lys Ile Phe Val Val Pro His Ser His Asn Asp Pro Gly
85 90 95
Trp Lys Leu Thr Val Glu Glu Tyr Tyr Gln Arg Gln Ser Arg His Ile
100 105 110
Leu Asp Thr Ile Val Glu Thr Leu Ser Lys Asp Ser Arg Arg Lys Phe
115 120 125
Ile Trp Glu Glu Met Ser Tyr Leu Glu Arg Trp Trp Arg Asp Ala Ser
130 135 140
Pro Asn Lys Gln Glu Ala Leu Thr Lys Leu Val Lys Asp Gly Gln Leu
145 150 155 160
Glu Ile Val Gly Gly Gly Trp Val Met Asn Asp Glu Ala Asn Ser His
165 170 175
Tyr Phe Ala Ile Ile Glu Gln Ile Ala Glu Gly Asn Met Trp Leu Asn
180 185 190
Asp Thr Ile Gly Val Ile Pro Lys Asn Ser Trp Ala Ile Asp Pro Phe
195 200 205
Gly Tyr Ser Ser Thr Met Ala Tyr Leu Leu Arg Arg Met Gly Phe Glu
210 215 220
Asn Met Leu Ile Gln Arg Thr His Tyr Glu Leu Lys Lys Asp Leu Ala
225 230 235 240
Gln His Lys Asn Leu Glu Tyr Ile Trp Arg Gln Ser Trp Asp Ala Met
245 250 255
Glu Thr Thr Asp Ile Phe Val His Met Met Pro Phe Tyr Ser Tyr Asp
260 265 270
Ile Pro His Thr Cys Gly Pro Glu
275 280
<210>26
<211>183
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>26
Gln Thr Gln Ser Gln Tyr Ala Asp Arg Leu Ser Ser Ala Ile Glu Ser
1 5 10 15
Glu Asn His Cys Thr Ser Gln Met Arg Gly Leu Ile Asp Glu Val Ser
20 25 30
Ile Lys Gln Ser Arg Ile Val Ala Leu Glu Asp Met Lys Asn Arg Gln
35 40 45
Asp Glu Glu Leu Val Gln Leu Lys Asp Leu Ile Gln Thr Phe Glu Ser
50 55 60
Ala Leu Leu Ser Pro Met Pro Val Ala Ala Val Val Val Met Ala Cys
65 70 75 80
Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys Ser Val Leu Thr Tyr
85 90 95
Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe Ile Ser Gln Asp Gly
100 105 110
Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser Tyr Asn Gln Leu Thr
115 120 125
Tyr Met Gln Ile Asn Glu Asp Glu Gly Ser Phe Ser Pro Phe Gln His
130 135 140
Leu Asp Phe Glu Pro Val Val Thr Glu Arg Pro Gly Glu Leu Thr Ala
145 150 155 160
Tyr Tyr Lys Ile Ala Arg Lys Asp Trp Phe Leu Phe Ser Leu Arg Pro
165 170 175
Ser Ser Ser Ile Thr Glu Thr
180
<210>27
<211>174
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>27
Arg Thr Ala Leu Asn Gly Ser Ser Ile Asp Asp Asp Leu Asp Gly Leu
1 5 10 15
Asp Lys Asp Leu Glu Ala Lys Leu Asn Ala Ser Leu Leu Ser Val Ala
20 25 30
Arg Gly Asn Arg Met Ser Leu Arg Leu His Arg Arg Asn His Phe Ser
35 40 45
Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp Arg Val Val
50 55 60
Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg Val Thr Val
65 70 75 80
Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu Leu Ile Val
85 90 95
Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val Glu Ser Ile
100 105 110
Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser Pro His Ile
115 120 125
Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys Lys Asn Lys
130 135 140
Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp Gln Tyr Gly
145 150 155 160
Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His Trp
165 170
<210>28
<211>181
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>28
His Ser Ser Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr
1 5 10 15
His Val Ser Val Asn Asn Gln Ser Ala Ile Gln Lys Pro Trp Pro Ile
20 25 30
Leu Pro Ser Tyr Leu Pro Trp Thr Pro Pro Gln Arg Asn Leu Pro Thr
35 40 45
Gly Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Lys Arg Val Asp
50 55 60
Phe Leu Lys Pro Arg Ile Gly Gly Gly Gly Glu Gly Ser Trp Phe Arg
65 70 75 80
Cys Phe Tyr Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Arg Asn
85 90 95
Leu Arg Met Val Pro Asp Arg Ile Val Met Ser Arg Gly Gly Glu Lys
100 105 110
Leu Glu Glu Val Met Gly Arg Lys Glu Glu Glu Glu Leu Pro Ala Phe
115 120 125
Arg Gln Gly Ala Phe Glu Val Ala Glu Glu Val Ser Ser Arg Leu Gly
130 135 140
Phe Lys Arg His Arg Arg Phe Gly Gly Gly Glu Gly Gly Ser Ala Val
145 150 155 160
Ser Arg Arg Leu Val Asn Asp Glu Met Leu Asn Glu Tyr Met Gln Glu
165 170 175
Gly Gly Ile Asp Arg
180
<210>29
<211>150
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>29
Arg Leu Asp Asn Ala Ser Leu Val Asp Thr Leu Thr His Phe Phe Thr
1 5 10 15
Lys Ser Ser Ser Asp Leu Lys Val Gly Ser Gly Ile Glu Lys Cys Gln
20 25 30
Glu Trp Leu Glu Arg Val Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr
35 40 45
Lys Asp Pro Ile Phe Ile Ser Gly Ser Asn Lys Asp Phe Lys Ser Cys
50 55 60
Ser Val Asp Cys Val Met Gly Phe Thr Ser Asp Lys Lys Pro Asp Ala
65 70 75 80
Ala Phe Gly Leu Ser His Gln Pro Gly Thr Leu Ser Ile Ile Arg Ser
85 90 95
Met Glu Ser Ala Gln Tyr Tyr Gln Glu Asn Asn Leu Ala Gln Ala Arg
100 105 110
Arg Lys Gly Tyr Asp Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val
115 120 125
Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro Val
130 135 140
Gln Pro Lys Thr Glu Lys
145 150
<210>30
<211>205
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>30
Leu Glu Phe Pro Ser Ala Ser Thr Ser Met Glu His Ser Ile Asp Pro
1 5 10 15
Glu Pro Lys Leu Ser Asp Ser Thr Ser Asp Pro Phe Ser Asp Val Leu
20 25 30
Val Ala Tyr Lys Lys Trp Asp Phe Glu Val Gly Cys Ala Arg Phe Arg
35 40 45
Glu Asn His Lys Asp Ala Ile Leu Gly Asn Val Ser Ser Gly Ser Leu
50 55 60
Gln Glu Phe Gly Cys Gly Lys Leu Lys Met Lys His Val Lys Val Leu
65 70 75 80
Val Lys Gly Trp Thr Trp Ile Pro Asp Asn Leu Glu Asn Leu Tyr Ser
85 90 95
Cys Arg Cys Gly Met Thr Cys Leu Trp Thr Lys Ser Ser Val Leu Ala
100 105 110
Asp Ser Pro Asp Ala Leu Leu Phe Glu Thr Thr Thr Pro Pro Leu Gln
115 120 125
Arg Arg Val Gly Asp Pro Leu Arg Val Tyr Met Glu Leu Glu Ala Gly
130 135 140
Arg Lys Arg Ser Gly Arg Glu Asp Ile Phe Ile Ser Tyr His Ala Lys
145 150 155 160
Asp Asp Val Gln Thr Thr Tyr Ala Gly Ser Leu Phe His Asn Asn Arg
165 170 175
Asn Tyr His Ile Ser Pro His Lys Asn Asn Asp Val Leu Val Tyr Trp
180 185 190
Ser Ser Ser Arg Cys Leu Pro His Arg Asp Arg Leu Ala
195 200 205
<210>31
<211>150
<212>PRT
<213>人工的
<220>
<223>茎序列GS3
<400>31
Arg Leu Asp Lys Val Ala Leu Val Asp Thr Leu Thr Asp Phe Phe Thr
1 5 10 15
Gln Ser Pro Ser Leu Ser Gln Ser Pro Pro Ala Arg Ser Asp Arg Lys
20 25 30
Lys Ile Gly Leu Phe Thr Asp Arg Ser Cys Glu Glu Trp Leu Met Arg
35 40 45
Glu Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr Lys Asp Pro Ile Phe
50 55 60
Ile Ser Gly Gly Glu Lys Asp Phe Gln Trp Cys Ser Val Asp Cys Thr
65 70 75 80
Phe Gly Asp Ser Ser Gly Lys Thr Pro Asp Ala Ala Phe Gly Leu Gly
85 90 95
Gln Lys Pro Gly Thr Leu Ser Ile Ile Arg Ser Met Glu Ser Ala Gln
100 05 110
Tyr Tyr Pro Glu Asn Asp Leu Ala Gln Ala Arg Arg Arg Gly Tyr Asp
115 120 125
Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val Pro Val Gly Tyr Phe
130 135 140
Ser Trp Ala Glu Tyr Asp
145 150
<210>32
<211>49
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>32
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr
<210>33
<211>99
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>33
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr Leu Val Arg Glu His Gln Val Glu Ile Ser Glu Leu Gln Lys Glu
50 55 60
Val Thr Asp Leu Lys Asn Leu Val Asp Asp Leu Asn Asn Lys Gln Gly
65 70 75 80
Gly Thr Ser Gly Lys Thr Asp Leu Gly Arg Lys Ala Thr Lys Ser Ser
85 90 95
Lys Asp Val
<210>34
<211>22
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>34
Met Ala Ala Ala Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Asp Arg
20
<210>35
<211>68
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>35
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val
35 40 45
Ala Leu Val Val Ile Ala Glu Ile Gly Phe Leu Gly Arg Leu Asp Lys
50 55 60
Val Ala Thr Ser
65
<210>36
<211>38
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>36
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg Tyr Leu Leu Ile Leu
1 5 10 15
Ala Ala Val Ala Phe Ile Tyr Ile Gln Met Arg Leu Phe Ala Thr Gln
20 25 30
Ser Glu Tyr Ala Asp Arg
35
<210>37
<211>68
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>37
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val
35 40 45
Ala Leu Val Val Ile Ile Glu Ile Gly Phe Leu Cys Arg Leu Asp Asn
50 55 60
Ala Ser Thr Ser
65
<210>38
<211>41
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>38
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn Thr Ile Thr Ile
1 5 10 15
Thr Ile Met Ile Ala Phe Thr Phe Phe Leu Leu Phe Leu Thr Gly Phe
20 25 30
Leu Gln Phe Pro Ser Ile Ser Pro Ser
35 40
<210>39
<211>106
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>39
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Cys Val Ser
35 40 45
Phe Val Phe Trp Asp Arg Gln Thr Leu Val Arg Glu His Gln Val Glu
50 55 60
Ile Ser Glu Leu Gln Lys Glu Val Thr Asp Leu Lys Asn Leu Val Asp
65 70 75 80
Asp Leu Asn Asn Lys Gln Gly Gly Thr Ser Gly Lys Thr Asp Leu Gly
85 90 95
Arg Lys Ala Thr Lys Ser Ser Lys Asp Val
100 105
<210>40
<211>72
<212>DNA
<213>人工的
<220>
<223>引物
<400>40
gatccttggg aatgcttgct ctgctcttca tcgttttcgt ttgtgtctct ttcgttttct60
gggaccgtca aa72
<210>41
<211>72
<212>DNA
<213>人工的
<220>
<223>引物
<400>41
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca60
agcattccca ag72
<210>42
<211>81
<212>DNA
<213>人工的
<220>
<223>引物
<400>42
gatccttggg aatggctgct gctcttgctc tgctcttcat cgttttcgtt tgtgtctctt60
tcgttttctg ggaccgtcaa a 81
<210>43
<211>81
<212>DNA
<213>人工的
<220>
<223>引物
<400>43
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca60
agagcagcag ccattcccaa g 81
<210>44
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<400>44
ggtcactagt atcttcattt ccgagttg 28
<210>45
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>45
ggtcactagt gcgatctgca tattctgact g 31
<210>46
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>46
aacgtctaga atgagagggt acaagttttg c 31
<210>47
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>47
cggggtaccc catgaccgga gctagccgt 29
<210>48
<211>24
<212>DNA
<213>人工的
<220>
<223>引物
<400>48
gactagaaaa ggagtgataa ccct24
<210>49
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>49
cggggtaccc catgaaatca tcatcattat ctccc35
<210>50
<211>51
<212>PRT
<213>人工的
<220>
<223>胞质尾序列(GCSI ER信号)
<400>50
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys
50
<210>51
<211>41
<212>PRT
<213>人工的
<220>
<223>胞质尾序列(靶向人GCSI ER)
<400>51
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Val Pro Ala Glu Gly Val
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Gly Arg Arg Asp Gly
20 25 30
Arg Gly Gly Gly Pro Arg Ser Thr Ala
35 40
<210>52
<211>39
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>52
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ala Ala Ala Glu Gly Ala
1 5 10 15
Arg Pro Leu Glu Arg Ala Arg Ala Ala Gly Arg Arg Asp Gly Arg Ala
20 25 30
Gly Gly Ala Arg Gly Ser Ala
35
<210>53
<211>36
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>53
Met Ala Arg Gly Glu Arg Arg Arg Arg Gly Ala Pro Val Asp Gly Ala
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Ala Arg Arg Gly Gly
20 25 30
Glu Ala Arg Gly
35
<210>54
<211>42
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>54
Met Ala Ala Arg Thr Arg Ile Ala Asp Ser Gly Gly Gly Ala Arg Ser
1 5 10 15
Arg Glu Thr Lys Thr Lys Pro Lys Ser Gly Asn Gly Ala Gln Ser Arg
20 25 30
Asn Asn Glu Thr Gln Ser Ser Ser Lys Asn
35 40
<210>55
<211>39
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>55
Met Gly Arg Arg Arg Lys Arg Val Ala Thr Gly Asp Gly Val Pro Ser
1 5 10 15
Pro Arg Lys Glu Glu Lys Ala Pro Ala Pro Pro Arg Lys Glu Lys Lys
20 25 30
Lys Lys Thr Asp Ile Gly Lys
35
<210>56
<211>37
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>56
Met Ala Arg Gln Arg Arg Thr Gln Gly Ala Ala Asp Pro Asn Lys Gly
1 5 10 15
Thr Asn Ser Ser Ser Ser Asn Gly Ser Asn Ser Thr Asn Asn Arg Ser
20 25 30
Ser Lys Ser Thr Ser
35
<210>57
<211>51
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>57
Met Ala Lys Lys Lys Val Pro Arg Glu Lys Asn His Ser Gly Gly Thr
1 5 10 15
Thr Arg Arg Thr Ser Glu Ser Ser Ser Asn Asn His Ala Asp Ser Lys
20 25 30
Arg Gln Ile Arg Ile Lys Leu Asn Glu Lys Arg Lys Arg Gln Glu Pro
35 40 45
Gly Ser Lys
50
<210>58
<211>46
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>58
Met His Arg Glu His Glu Glu Met His Gln Pro Ser Arg Arg Arg Arg
1 5 10 15
Pro Pro Arg Glu Val Glu Arg Pro Ser Ala Thr Ile Arg Tyr Glu Pro
20 25 30
Val Ala Glu Pro Glu Pro Trp Cys Ser Phe Cys Ser Trp Asp
35 40 45
<210>59
<211>62
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>59
Met Ser Gly Gly Gly Gly Ser Ser Ser Val Arg Arg Pro Val Ala Ala
1 5 10 15
Ala Arg Ser Arg Ser Gly Pro Glu Pro Asp Ala Arg Arg Ala Ala Ala
20 25 30
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Arg Arg Gly Arg Gly
35 40 45
Asp His Gly Pro Leu Arg Leu Met Glu Val Ser Pro Arg Asn
50 55 60
<210>60
<211>11
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>60
Met Ala Pro Pro Pro Pro Arg Gln Pro Arg Gln
1 5 10
<210>61
<211>42
<212>PRT
<213>人工的
<220>
<223>胞质尾序列
<400>61
Met Ser Ile Leu Asn Ile Ser Ile Thr Val Leu Cys Ile Ala Ile Ala
1 5 10 15
Thr Trp Phe Ser Tyr Lys Gly Tyr Leu Glu Thr Arg Val Asn Thr Pro
20 25 30
Tyr Asp Ile Lys Lys Leu Val Thr Ile Ser
35 40
<210>62
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>62
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>63
<211>7
<212>PRT
<213>人工的
<220>
<223>胞质结构域-SEQ ID NO64-SEQ ID NO2
<400>63
Met Ile Lys Ser Ser Ser Leu
1 5
<210>64
<211>16
<212>PRT
<213>人工的
<220>
<223>延伸的胞质结构域-SEQ ID NO2
<400>64
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ile Lys Ser Ser Ser Leu
1 5 10 15
<210>65
<211>14
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>65
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210>66
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>66
Met Thr Gly Ala Ser Ala Ala Ser Ala Ala Gly Ala Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>67
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>67
Met Thr Gly Ala Ser Leu Leu Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>68
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>68
Met Thr Gly Ala Ser Leu Leu Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>69
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>69
Met Thr Gly Ala Ser Arg Arg Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>70
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>70
Arg Xaa Xaa Arg
1
<210>71
<400>71
000
<210>72
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>72
Arg Xaa Xaa Lys
1
<210>73
<211>5
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(4)
<223>Xaa可以是任何天然氨基酸
<400>73
Arg Xaa Xaa Xaa Lys
1 5
<210>74
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>74
Lys Xaa Xaa Arg
1
<210>75
<211>5
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(4)
<223>Xaa可以是任何天然氨基酸
<400>75
Lys Xaa Xaa Xaa Arg
1 5
<210>76
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>76
Arg Arg Xaa Xaa Arg Xaa Arg
1 5
<210>77
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>77
Arg Lys Xaa Xaa Arg Xaa Arg
1 5
<210>78
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>78
Arg Arg Xaa Xaa Arg Xaa Lys
1 5
<210>79
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>79
Arg Arg Xaa Xaa Lys Xaa Arg
1 5
<210>80
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>80
Lys Arg Xaa Xaa Arg Xaa Arg
1 5
<210>81
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>81
Lys Lys Xaa Xaa Arg Xaa Arg
1 5
<210>82
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>82
Arg Arg Xaa Xaa Lys Xaa Lys
1 5
<210>83
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>83
Arg Lys Xaa Xaa Lys Xaa Arg
1 5
<210>84
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>84
Arg Lys Xaa Xaa Arg Xaa Lys
1 5
<210>85
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>85
Arg Arg Arg Arg
1
<210>86
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>86
Arg Lys Arg Arg
1
<210>87
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>87
Arg Arg Lys Arg
1
<210>88
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>88
Arg Arg Arg Lys
1
<210>89
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>89
Arg Arg Lys Lys
1
<210>90
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>90
Arg Lys Lys Arg
1
<210>91
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>91
Lys Lys Arg Arg
1
<210>92
<211>38
<212>DNA
<213>人工的
<220>
<223>引物
<400>92
gactctagag cgggaagatg aggcttcggg agccgctc 38
<210>93
<211>58
<212>DNA
<213>人工的
<220>
<223>引物
<400>93
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58
<210>94
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>94
atcgaaatcg cacgatgaga gggtacaagt tttgc35
<210>95
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>95
cccatgatgc gatctgcata ttctgactgt gtcgc35
<210>96
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>96
ggactagtgc actgtcgctg cccgcctgc 29
<210>97
<211>58
<212>DNA
<213>人工的
<220>
<223>引物
<400>97
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac58
<210>98
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>98
Met Thr Gly Ala Ser Leu Arg Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>99
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>99
Met Thr Gly Ala Ser Leu Arg Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>100
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>100
Met Thr Gly Ala Ser Arg Leu Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>101
<211>18
<212>PRT
<213>人工的
<220>
<223>胞质结构域
<400>101
Met Thr Gly Ala Ser Arg Leu Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>102
<211>39
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 1的核酸序列
<400>102
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatc 39
<210>103
<211>30
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 2的核酸序列
<400>103
atggctcggg gcgagcggcg gcgccgcgca30
<210>104
<211>36
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 3的核酸序列
<400>104
atgaatgatc gtagaccgca aaggaaacgc ccagca 36
<210>105
<211>147
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 4的核酸序列
<400>105
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 60
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa120
gatgagatgt atgttatgcg gcatttc147
<210>106
<211>150
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 5的核酸序列
<400>106
ttccaaggag atcacaagga aagcttgtat tggggtacct acaggccgaa tgtatatctt 60
ggaattcgtg caagaacccc gttgtctcta attgctggga taatgtggat tggtgcaaag120
aatgggcaat actttcttcg tcatgtttgc 150
<210>107
<211>148
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 6的核酸序列
<400>107
tgaatctgac gcatcgctgc tctggggaac ataccgtcca caaatttact ttggccttcg 60
tcctcgtctt cccggatccc tcttaaccgg cctcgcttgg tttggcctac aagattacag120
cgactttcag catattcgac atcagtgc 148
<210>108
<211>142
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 7的核酸序列
<400>108
agaacgatct aatcgtctct tctggggtac ttatcgtcct ggaatttatt tcggtatgaa 60
acacagaagt cccatatctc ttttgtttgg agttatgtgg acagttcaag acgcagaaaa120
ctttgccttc cgtcactcat gt 142
<210>109
<211>480
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 8的核酸序列
<400>109
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatca aatcatcatc attatctccc 60
ggctccgatg aaggaagcgc ttatcctccg agtatccgcc gcggcaaagg caaggaactt120
gtatcgatcg gtgctttcaa gacgaatctc aagatattgg ttgggttaat catattaggg180
attatagtaa tctacttcgt aatcaatcgg ctagttcgtc acgggttgtt gtttgatgag240
tcccagaagc ctagggttat cactcctttt cctgctccga aagtcatgga tttgtcaatg300
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt360
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa420
gatgagatgt atgttatgcg gcatttctgt gaaaactctg atgatttaag tacatttggc480
<210>110
<211>54
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 9的核酸序列
<400>110
cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgt 54
<210>111
<211>69
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 10的核酸序列
<400>111
cggtacctcc tcatcttggc tgctgtcgcc ttcatctaca tacagatgcg gctttttgcg60
acacagtca69
<210>112
<211>54
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 11的核酸序列
<400>112
ttagggattc tatttgctgt tactttgtct atagttctga tgttggtgtc tgta 54
<210>113
<211>60
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 12的核酸序列
<400>113
atttttctgt atatgttact tctcaactct ctctttctca tcatctactt cgtttttcac60
<210>114
<211>69
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 13的核酸序列
<400>114
cgaaaattat cgaatttgtt accactctgc gttgctctgg tagttatcgc tgagatcggg60
tttctgggt69
<210>115
<211>69
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 14的核酸序列
<400>115
cgtaaagtct cgaccttttt gccaatctgc gtggctcttg tcgtcattat cgagatcggg60
ttcctctgt69
<210>116
<211>75
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 15的核酸序列
<400>116
ttcaacacaa tcaccatcac aatcatgata gctttcacct tcttcctcct cttcctcacc60
ggtttcctcc aattc 75
<210>117
<211>60
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 16的核酸序列
<400>117
aagcgtcttg ctctgctctt catcgttttc gtttgtgtct ctttcgtttt ctgggaccgt60
<210>118
<211>87
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 17的核酸序列
<400>118
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct60
tcctattact tgaagcgccc aaagcgt87
<210>119
<211>117
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 18的核酸序列
<400>119
atgggtgttt tctcgaatct tcgaggaccc agagccggag ctacccacga tgaatttccg60
gcgaccaatg gctctccttc gtcttcttct tctccatctt catcaatcaa gcgaaaa 117
<210>120
<211>32
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 19的核酸序列
<400>120
atgagagggt acaagttttg ctgtgatttc cg 32
<210>121
<211>117
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 20的核酸序列
<400>121
atgggtgttt tctccaatct tcgaggtcct aaaattggat tgacccatga agaattgcct 60
gtagtagcca atggctctac ttcttcttct tcgtctcctt cctctttcaa gcgtaaa 117
<210>122
<211>35
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 21的核酸序列
<400>122
atgcttgtaa tgccacagcc acccaaaccc ttcaa35
<210>123
<211>87
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 22的核酸序列
<400>123
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60
tcctattact tgaagcgccc aaagcgt 87
<210>124
<211>50
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 23的核酸序列
<400>124
atggcaaatc tttggaagaa gcagagattg agagatacag gtttatgtcg50
<210>125
<211>499
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 24的核酸序列
<400>125
tcgtattaat cttgcccgag aacatgaggt tgaagttttt aagctaaatg aagaagtttc 60
acggttggag cagatgttag aagagcttaa tggtggtgtt ggcaataagc ctttgaagac120
tctgaaggat gccccagaag atccagttga taaacagcga aggcagaaag taaaagaggc180
aatgatccat gcttggagct cttatgaaaa gtatgcatgg gggaaagatg agcttcagcc240
tcggacaaaa gatggcactg atagctttgg tggccttgga gcaactatgg tagattcttt300
agatacactc tatataatgg gtctagatga gcagtttcaa aaagccagag agtgggttgc360
aagctcattg gatttcgaca aggattatga cgccagtatg tttgagacaa ccataagagt420
tgtaggcgga cttcttagtg cgtatgatct ttctggggac aaaatgttcc ttgaaaaggc480
taaggatatt gcagacaga 499
<210>126
<211>837
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 25的核酸序列
<400>126
actctcttcc acttcggcgt accaggaccg atctcctcac gattccttac ctccagatcc 60
aatcggatcg tcaagccacg gaagaatatt aatcgccgac ccttaaacga ttccaattca120
ggcgccgtcg ttgatatcac aactaaagat ctatacgata ggattgagtt tcttgataca180
gatggtggtc catggaaaca aggttggaga gttacgtata aagacgatga gtgggagaaa240
gagaagctca aaatcttcgt tgttcctcat tctcataacg atcctggttg gaaattgact300
gtagaggagt attatcagag acaatccaga catattcttg acaccattgt tgagacttta360
tctaaggatt caagaagaaa gtttatatgg gaggagatgt catatctgga gagatggtgg420
agagacgctt cacctaataa acaagaagct ttgactaaat tggttaagga tgggcagcta480
gagattgttg gaggtggctg ggttatgaat gatgaggcta attcacatta ttttgccata540
attgaacaga tagcagaggg taatatgtgg ctgaatgaca caattggggt tattcctaag600
aattcttggg ctatagatcc ctttggctat tcatcaacca tggcttatct tctccggcgt660
atgggttttg aaaacatgct tattcaaagg actcattacg agctcaagaa agaccttgcc720
cagcataaga atcttgaata tatttggcgt cagagctggg atgctatgga aaccacagat780
atctttgttc atatgatgcc gttttattca tacgatatcc cacacacttg tggacca 837
<210>127
<211>550
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 26的核酸序列
<400>127
ccagacgcaa tcacagtatg cagatcgcct cagttccgct atcgaatctg agaaccattg 60
cactagtcaa atgcgaggcc tcatagatga agttagcatc aaacagtcgc ggattgttgc120
cctcgaagat atgaagaacc gccaggacga agaacttgtg cagcttaagg atctaatcca180
gacgtttgaa agtgccttac tatcacctat gcctgtggct gctgtagtgg ttatggcctg240
cagtcgtgca gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt300
tgcttcaaaa tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa360
gtcattgagc tataatcaat taacatatat gcagataaat gaggatgaag gctcgttttc420
cccttttcag cacttggatt ttgaaccagt ggtcactgaa aggcctggcg aactgactgc480
gtactacaag attgcacgta aggactggtt tctcttttct ctgcgtccct ccagctccat540
tactgaaaca 550
<210>128
<211>523
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 27的核酸序列
<400>128
tagaactgct ttgaatggtt cttctattga cgatgatttg gatggtttag ataaagattt 60
ggaagctaag cttaatgctt cattgctaag tgtagctaga ggtaatagaa tgtctctaag120
gttgcataga aggaaccatt tttcgcctag aaatacggat ctgttcccgg atttggcaaa180
agatcgtgtg gttatcgtct tgtatgtgca taatcgggct cagtattttc gagtcacagt240
ggaaagtttg tcgaaggtta aaggtataag tgagacattg ttgattgtta gtcatgatgg300
ttactttgaa gagatgaata ggattgtgga gagtattaag ttttgtcaag tgaaacagat360
tttctcgcct tattcgcctc atatatatcg tactagcttc ccgggtgtga ccctgaatga420
ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa ggtaatcctg atcagtatgg480
gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac tgg 523
<210>129
<211>544
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 28的核酸序列
<400>129
tcactcatcg tcgttttcac cggagcagtc acagcctcct catatatacc acgtttcagt 60
gaataaccaa tcggcgattc agaaaccgtg gccgatctta ccttcttacc tcccatggac120
gccgccgcag aggaatctac caactggctc ctgcgaaggt tacttcggga atggatttac180
aaagagagtt gacttcctta agccgaggat tggaggagga ggagaaggaa gctggttccg240
atgtttttac agtgagacat tacagagttc gatttgtgaa ggaaggaatc tgagaatggt300
tccggatcgg attgttatgt cgagaggagg tgagaagtta gaggaagtta tggggaggaa360
agaggaggag gagcttcctg cgtttcgaca aggtgcgttt gaggtagcgg aagaggtttc420
ttcacggtta ggttttaaga gacaccgtcg ttttggtgga ggagaaggag gtagtgcggt480
ttctcggcgg ctggtgaatg atgagatgtt gaatgaatat atgcaagaag gtggaattga540
taga 544
<210>130
<211>450
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 29的核酸序列
<400>130
cggctcgata acgcttcttt ggtcgatacg ttaacccatt ttttcaccaa gtcgtcgtcc 60
gatttgaaag ttgggtcagg aatagagaaa tgccaggagt ggttagagag agtggattca120
gttacttatt ctagagattt cactaaagat ccgattttta tctctggtag taacaaggac180
ttcaaatcgt gctctgttga ttgtgtaatg ggattcactt cagataagaa acctgatgcg240
gcttttggat taagtcatca acctggaaca ctcagtataa tccgttccat ggaatcagca300
cagtattacc aagagaataa tcttgctcaa gcacgacgga aaggttatga tattgtgatg360
acaactagtc tgtcatcaga tgttcctgtt gggtattttt catgggcgga atatgatatt420
atggctccag tgcaaccaaa aacagagaaa 450
<210>131
<211>616
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 30的核酸序列
<400>131
tttagaattc ccatctgctt caacttcgat ggagcattca atagacccgg aaccgaaatt 60
gtctgattca acatcggatc cattcagtga tgttcttgta gcttataaaa aatgggactt120
tgaagtgggt tgtgctcggt ttagggagaa tcataaagat gcgattttgg gtaatgttag180
ttcgggttct ttacaagaat ttggttgtgg taagcttaag atgaagcatg ttaaggtatt240
ggttaaaggg tggacttgga ttccggataa tttggaaaat ttgtattctt gtcgttgtgg300
gatgacttgt ttgtggacta aatcatcggt tttggctgat tcacctgatg ctttgttgtt360
cgagacaaca actcctccac tacagagacg tgttggagat ccgctccgtg tgtacatgga420
gctagaggcc ggaagaaaac gctcaggccg tgaagatata ttcatcagct accatgcgaa480
agacgatgtc caaacaactt acgccggttc gctctttcat aataacagaa actatcacat540
ctctccacat aaaaacaatg atgttctggt gtattggtct tcctcaagat gcctccctca600
cagagatcgt ctagca616
<210>132
<211>450
<212>DNA
<213>人工的
<220>
<223>编码SEQ ID NO 31的核酸序列
<400>132
cggctcgata aagtcgcttt ggttgatacg ttgactgatt tcttcaccca gtctccgtca 60
ctctcgcagt ctccaccggc gagatccgat cggaagaaga tcggattatt tactgatagg120
agctgcgagg agtggttgat gagagaagat tcagttactt actctagaga ttttactaaa180
gatccaattt ttatctctgg tggtgaaaag gactttcaat ggtgttctgt ggattgtaca240
tttggagata gttcagggaa aacaccagat gctgcgtttg gattaggtca gaaacctgga300
actcttagta taatacgttc catggaatca gcacagtatt atccagaaaa tgatcttgca360
caggcacgac ggagaggtta tgatatagtg atgaccacta gtctatcatc agatgttcct420
gttggatatt tttcgtgggc ggagtatgat 450
权利要求
1.选自SEQ ID No1到SEQ ID No31的氨基酸序列。
2.包含根据权利要求1的氨基酸序列和蛋白质的重组蛋白,所述氨基酸序列与所述蛋白质的C端或N端末端融合。
3.根据权利要求2的重组蛋白,其中所述蛋白质选自酶、抗体或其部分、报告蛋白、重组蛋白、有治疗活性的蛋白质。
4.根据权利要求2的重组蛋白,其中所述蛋白质是酶,所述酶选自糖苷酶、糖基转移酶、蛋白酶、激酶、脱羧酶、差向异构酶、核苷酸-糖转运蛋白。
5.核酸序列,其编码根据权利要求1的氨基酸序列或者根据权利要求3或4的重组蛋白。
6.核酸载体,其包含根据权利要求5的核酸序列。
7.植物细胞,其包含至少一种根据权利要求1的氨基酸序列和/或至少一种根据权利要求3或4的重组蛋白和/或至少一种根据权利要求6的核酸载体。
8.根据权利要求7的植物细胞,其中所述植物细胞包含至少一种根据权利要求3或4的蛋白质,所述蛋白质是异源蛋白质。
9.植物,其包含至少一种根据权利要求1的氨基酸序列和/或至少一种根据权利要求3或4的重组蛋白和/或至少一种根据权利要求6的核酸载体。
10.根据权利要求9的植物,其中所述植物包含至少一种根据权利要求3或4的蛋白质,所述蛋白质是异源蛋白质。
11.根据权利要求9或10的植物,所述植物选自苜蓿、拟南芥(Arabidospsis thaliana)、烟草(Nicotiana tabacum)、大豆(Glycinemax)、番茄(Lycopersicon esculentum)、西红柿(Solanumlycopersicum)。
12.生产经翻译后修饰的多肽的方法,其包括以下步骤
-用至少一种根据权利要求6的核酸载体转染或转化细胞,所述载体编码重组蛋白,所述重组蛋白是翻译后修饰之前的所述多肽,或者是与所述多肽不同的重组蛋白;
-培养经转染的细胞;和
-收获经翻译后修饰的多肽;
其中,当所述重组蛋白与所述多肽不同时,所述方法还包括用至少一种编码所述多肽的核酸载体转染所述细胞的步骤。
13.权利要求12的方法,其中所述重组蛋白是翻译后修饰之前的该多肽。
14.权利要求12的方法,其中所述重组蛋白与所述多肽不同,且其中所述重组蛋白是识别并特异结合所述多肽的抗体或其部分。
15.权利要求12的方法,其中所述重组蛋白与所述多肽不同,且其中所述重组蛋白是参与所述多肽翻译后修饰的内源或异源酶。
16.权利要求12的方法,其中所述重组蛋白与所述多肽不同,且其中所述重组蛋白是调控参与所述多肽翻译后修饰之酶的抗体或其部分。
17.权利要求12到16中任一项的方法,其中多肽与储藏蛋白共表达。
18.根据权利要求12到17中任一项的方法,其中所述肽的翻译后修饰在内质网(ER)和/或高尔基体(GA)区室膜中进行。
19.根据权利要求12到18中任一项的方法,其中所述经翻译后修饰的多肽是有治疗活性的蛋白质。
20.根据权利要求12到19中任一项的方法,其中所述细胞是植物细胞。
21.根据权利要求12到20中任一项的方法,其中所述植物细胞属于选自以下的植物紫苜蓿、拟南芥、烟草、大豆、番茄、西红柿。
全文摘要
本发明提供了可用于控制重组多肽的翻译后修饰的新工具。这些工具是特定的信号肽,其允许将重组多肽在其宿主细胞中合成期间靶向特定的亚细胞区室,并且允许在所述亚细胞区室中对所述重组多肽进行特定的设计。这些信号肽是本文公开的SEQ ID n°1到SEQ ID n°31。有利地,本发明允许例如提高重组多肽生产的产率、防止重组多肽的免疫原性和获得有治疗活性的重组多肽,所述重组多肽是其天然对应物的精确拷贝。本发明尤其涉及植物制成药物(plant made pharmaceutical,PMP)再定向的领域。
文档编号C12N15/82GK101622354SQ200780049458
公开日2010年1月6日 申请日期2007年11月8日 优先权日2006年11月8日
发明者韦罗妮克·格默尔德, 克洛德·桑-若尔-迪帕, 奥雷利娅·布拉夫卢斯, 马里-克里斯蒂娜·基弗-梅耶尔, 卢瓦克·费伊 申请人:国家科学研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1