甲基营养型酵母中蛋白质糖基化修饰的制作方法

文档序号:426824阅读:362来源:国知局
专利名称:甲基营养型酵母中蛋白质糖基化修饰的制作方法
技术领域
本发明涉及用于生产具有哺乳动物样糖基化的糖蛋白的方法和基因工程化甲基营养型酵母菌株。本发明还涉及用于产生能生产具有哺乳动物样糖基化的糖蛋白的甲基营养型酵母菌株的载体。本发明还提供由所述基因工程化甲基营养型酵母菌株生产的糖蛋白。
背景技术
包括巴斯德毕赤酵母在内的甲基营养型酵母已被广泛用于生产商业上或医疗上重要的重组蛋白质。然而,这些酵母和靶生物例如哺乳动物或人类对象之间在与蛋白质连接的碳水化合物的生物合成方面的差异可以阻碍一些治疗性糖蛋白的生产和医疗上的应用。
蛋白质N-糖基化起始于内质网(ER),在此将组装在多萜醇(脂质载体中间体)上的N-连接寡糖(Glc3Man9GlcNAc2)转移到新生蛋白质的适当Asn上。这是所有真核N-连接糖蛋白共有的事件。通过内质网中特异性葡萄糖苷酶和α-1,2-甘露糖苷酶去除三个葡萄糖残基和一个特异性α-1,2-连接的甘露糖残基,产生核心寡糖结构Man8GlcNAc2。将具有这种核心糖结构的蛋白质运输到对糖结构进行各种修饰的高尔基体内。在酵母和高等真核生物之间高尔基体内糖链修饰存在显著差异。
哺乳动物细胞内,根据所添加到的蛋白质结构通过3种不同途径进行糖链修饰。也就是说,(1)核心糖链不改变;(2)通过将来自UDP-N-乙酰葡糖胺(UDP-GlcNAc)的N-乙酰葡糖胺-1-磷酸基团(GlcNAc-1-P)加到核心糖链中甘露糖的6-位,随后去除GlcNAc基团以在糖蛋白中形成酸性糖链,从而改变核心糖链或(3)通过甘露糖苷酶l去除3个甘露糖残基从而首先将核心糖链转变成Man5GlcNAc2;通过添加GlcNAc并再去除两个甘露糖残基进一步修饰Man5GlcNAc2,随后顺序添加GlcNAc、半乳糖(Gal)和N-乙酰神经胺酸(也称为唾液酸(NeuNAc))以形成各种杂合或复合的糖链(R.Kornfeld and S.Kornfeld,Ann.Rev.Biochem.54631-664,1985;Chibaet al J.Biol.Chem.27326298-26304,1998)。
酵母中,Man8GlcNAc2多糖不被修整。高尔基体中糖链的修饰包括一系列通过不同的甘露糖基转移酶添加甘露糖残基(“外链”糖基化)。外链糖基化的结构是生物特异性的,典型地在酿酒酵母中具有超过50个甘露糖残基,在巴斯德毕赤酵母中更通常具有小于Man14GlcNAc2的结构。这种酵母特异性高甘露糖型外链糖基化也表示为超糖基化或超甘露糖基化。
糖基化对蛋白质的正确折叠、稳定性和生物活性至关重要。在人体内,糖基化是蛋白质的药物动力学特性的部分原因,例如组织分布和从血流中清除。另外,多糖结构可以参与抗原应答。例如,糖蛋白上存在α-半乳糖是抗来自猪的异种移植物的免疫反应的主要原因(Chen et al.,Curr Opin Chem Biol,3(6)650-658,1999),而抗酵母糖蛋白的免疫反应主要由于下列物质的存在α-1,3-甘露糖、β-连接甘露糖和/或磷酸单酯或磷酸二酯键中的磷酸残基(Ballou,C.E.,Methods Enzymol,185440-470,1990;Yip et al.,Proc Natl Acad Sci USA,91(7)2723-2727,1994)。
超糖基化通常是不期望的,因为它导致重组蛋白质产物在碳水化合物组成和分子量上的不均匀性,这使蛋白质纯化复杂化。碳水化合物部分的增加导致超糖基化的酶的比活性(单位/重量)降低。另外,外链糖基化通常具有强免疫原性,这在治疗性应用中是不期望的。而且,大的外链糖可以掩盖治疗性蛋白质的免疫决定簇。例如,在巴斯德毕赤酵母中表达的流感神经氨酸酶(NA)被含高达30-40个甘露糖残基的N-多糖糖基化。由于位于NA分子顶部的可变且免疫优势的表面环被N-多糖掩盖,超糖基化的NA在小鼠中的免疫原性降低(Martinet et al.Eur J.Biochem.247332-338,1997)。
所以,期望得到生产这种重组糖蛋白的基因工程化甲基营养型酵母株,所述重组糖蛋白具有类似哺乳动物(例如人类)的碳水化合物结构的碳水化合物结构。

发明内容
本发明涉及用于生产具有哺乳动物样N-多糖的糖蛋白的基因工程化甲基营养型酵母菌株和方法。本发明还涉及用于产生能生产具有哺乳动物样N-多糖的糖蛋白的甲基营养型酵母菌株的载体和试剂盒。
在此使用的术语“甲基营养型酵母”包括但不限于能够在甲醇上生长的酵母株,例如念珠菌属、汉逊酵母属、球拟酵母属或毕赤酵母属的酵母。
在一个实施方案中,本发明提供生产具有哺乳动物样N-多糖结构的糖蛋白的甲基营养型酵母菌株,其特征在于具有五个或更少甘露糖残基和至少一个N-乙酰葡糖胺残基(GlcNAc),所述N-乙酰葡糖胺残基与含甘露糖的核心结构和末端半乳糖残基连接。
在一个优选的实施方案中,本发明提供生产具有哺乳动物样N-多糖结构GalGlcNAcMan5GlcNAc2的糖蛋白的基因工程化甲基营养型酵母株。
根据本发明,将生产具有GalGlcNAcMan5GlcNAc2的糖蛋白的甲基营养型酵母菌株基因工程化以表达α-1,2-甘露糖苷酶或其功能部分;N-乙酰葡糖胺基转移酶I(或GnTI)或其功能部分;和β-1,4-半乳糖基转移酶(GalT)或其功能部分。优选地,所述甲基营养型酵母菌株还被基因工程化使得基因组OCH1基因灭活。
用于在基因工程化甲基营养型酵母菌株中表达的α-1,2-甘露糖苷酶或其功能部分可以来源于任何物种,包括哺乳动物物种如小鼠、兔或人,和真菌物种例如曲霉或瑞氏木霉(Trichoderma reesei)。用于本发明的优选的α-1,2-甘露糖苷酶是瑞氏木霉α-1,2-甘露糖苷酶。优选地,α-1,2-甘露糖苷酶或其功能部分靶向分泌途径中可获得其底物Man8GlcNAc2的位点。更优选地,将α-1,2-甘露糖苷酶或其功能部分基因工程化以包含ER驻留信号并靶向ER。优选的ER驻留信号是肽HDEL(SEQ ID NO1)。
用于在基因工程化甲基营养型酵母菌株中表达的GnTI或其功能部分可以来源于任何物种,包括兔、大鼠、人、植物、昆虫、线虫和原生动物如利什曼原虫(Leishmaniatarentolae)。优选的用于本发明的GnTI是如SEQ ID NO13列出的人GnTI。优选地,GnTI或其功能部分靶向分泌途径中可获得其底物Man5GlcNAc2的位点。更优选地,将GnTI或其功能部分基因工程化以包含高尔基体驻留信号并靶向高尔基体。优选的高尔基体驻留信号是如SEQ ID NO11列出的肽,由酿酒酵母Kre2蛋白的前100个氨基酸组成。
用于在基因工程化甲基营养型酵母菌株中表达的GalT或其功能部分可以来源于任何物种,包括人、植物(例如拟南芥)、昆虫(例如黑腹果蝇)。优选的用于本发明的GalT是如SEQ ID NO21列出的人GalT。优选地,将GalT或其功能部分基因工程化以包含高尔基体驻留信号并靶向高尔基体。优选的高尔基体驻留信号是如SEQ ID NO11列出的肽,由酿酒酵母Kre2蛋白的前100个氨基酸组成。
通过将编码这些酶的核苷酸序列例如由转化方式导入菌株,可以将甲基营养型酵母菌株基因工程化以表达上述期望的酶。优选地,在载体中提供编码序列,每个序列与在所述酵母菌株中有功能的启动子序列和3′终止序列可操作的连接。随后将所述载体或其线性片段导入菌株。
根据本发明的一个优选实施方案,还将甲基营养型酵母菌株基因工程化使得基因组OCH1基因被破坏。基因破坏可以通过基因组OCH1序列和敲出载体中的OCH1序列之间的同源重组实现。
进一步的方面中,本发明提供用于产生生产具有哺乳动物样N-多糖结构的糖蛋白的甲基营养型酵母菌株的载体。
在一个实施方案中,本发明提供包含编码待表达酶的核苷酸序列的“敲入”载体,所述待表达酶即是α-1,2-甘露糖苷酶、GnTI、GalT或这些蛋白质的任一个的功能部分。编码序列可以与在表达所编码蛋白质的宿主甲基营养型酵母中有功能的启动子和3′终止序列可操作的连接。可以将两个或更多编码序列置于同一载体中以同时转化入甲基营养型酵母菌株内。优选地,所述载体还包含便于转化子选择的选择标志基因。敲入载体可以是整合性载体或复制性载体。
另一个实施方案中,本发明提供灭活载体(或“敲出”载体),其在导入甲基营养型酵母菌株时,灭活或破坏基因组OCH1基因。
OCH1敲出载体可以包含选择标志基因,在其5′和3′端与足以介导与基因组OCH1基因发生双同源重组的长度的OCH1序列可操作的连接。作为替代方案,OCH1灭活载体可以包含选择标志基因和待破坏的OCH1基因的一部分,该部分不编码OCH1蛋白质或编码OCH1蛋白质的无活性片段。OCH1部分不与任何已知启动子序列可操作的连接,并可在转化载体的线性片段时通过单同源重组整合入基因组OCH1基因座。优选地,还往载体的OCH1序列中引入一个或多个灭活突变,例如终止密码子或移码突变,以阻止产生任何潜在活性的OCH1多肽。
另一个方面中,本发明提供生产具有哺乳动物样N-多糖结构的糖蛋白的方法。可以将编码感兴趣的糖蛋白的核苷酸序列导入已被工程化生产哺乳动物样N-多糖的甲基营养型酵母菌株。作为替代方案,可以修饰表达感兴趣的糖蛋白的甲基营养型酵母菌株以表达期望的酶(即α-1,2-甘露糖苷酶、GnTI和GalT)并灭活基因组OCH1基因,从而生产具有哺乳动物样N-多糖的糖蛋白。
另一个方面中,本发明提供通过使用本发明的方法生产的糖蛋白,即具有哺乳动物样N-多糖的糖蛋白,尤其是具有GalGlcNAcMan5GlcNAc2N-多糖的糖蛋白。
在进一步的方面中,本发明提供含有一个或多个本发明载体、或一个或多个本发明的基因工程化菌株的试剂盒。


图1描述M8GlcNAc2、M5GlcNAc2、GlcNAcM5GlcNAc2和GalGlcNAcM5GlcNAc2的结构。
图2用图描述酵母和人类N-连接糖基化和使巴斯德毕赤酵母糖基化人源化的策略。糖-工程化步骤包括灭活α-1,6-甘露糖基转移酶OCH1、过表达HDEL标记的α-1,2-甘露糖苷酶和定位高尔基体的GnTI和GalT。最后部分获得的杂合结构被框起来。
图3A用图描述通过单同源重组灭活基因组OCH1基因的策略。
图3B用图描述用于糖工程化巴斯德毕赤酵母的质粒pGlycoSwitchM5。经使用Bst BI线性化pGlycoSwitchM5,接着转化并正确整合到巴斯德毕赤酵母的基因组中,从而灭活OCH1基因。
图3C用图描述pPIC6AKrecoGnTI。
图3D用图描述pBlKanMX4KrehGalT。
图4用图描述来自不同的糖工程化巴斯德毕赤酵母菌株的N-多糖的DSA-FACE分析。板块1寡麦芽糖参照。板块2-9表示来自下列菌株的N-多糖——2野生型菌株GS115,具有Man9GlcNAc2代表的主峰;3ochl灭活菌株,具有Man8GlcNAc2代表的主峰;4ochl灭活的ManHDEL表达菌株,具有Man5GlcNAc2代表的主峰;5ochl灭活的ManHDEL、KreGnTI表达菌株,具有GlcNAcMan5GlcNAc2代表的主峰;6与5相同,除了多糖用β-N-乙酰基己糖胺酶处理并且GlcNAcMan5GlcNAc2移至Man5GlcNAc2的位置,指示末端GlcNAc存在;7ochl灭活的ManHDEL、KreGnTI、KreGalT表达菌株,具有代表GalGlcNAcMan5GlcNAc2的另外峰,其在用β-半乳糖苷酶处理时消失;9来自牛RnaseB的参照多糖(Man5-9GlcNAc2)。
图5A-5B表明灭活巴斯德毕赤酵母OCH1之后的糖基化。5A分泌瑞氏木霉甘露糖苷酶的巴斯德毕赤酵母菌株上清液的SDS-PAGE凝胶用CBB染色。未工程化菌株(WT)中可见清楚的弥散条带而在och1灭活菌株(ochl(M8))中没有这个弥散条带。5BN-多糖的FACE分析,所述N-多糖来源于未工程化菌株(WT)和ochl菌株分泌的甘露糖苷酶。具有较高电泳迁移率的条带标为Man8和Man9,表示“核心”N-多糖结构。
具体实施例方式
本发明涉及制造具有哺乳动物样或人样的糖基化的重组糖蛋白的方法、载体和基因工程甲基营养型酵母菌株。
“哺乳动物”意思包括哺乳动物的任何物种,例如人、小鼠、猫、狗、兔、牛、绵羊、马等。
典型复合型哺乳动物多糖,例如人产生的多糖,含二至六个具有与Man3GlcNAc2的内核心结构连接的唾液酰-N-乙酰-乳糖胺序列的外分支。哺乳动物N-多糖起源于在ER中形成的核心寡糖结构Man8GlcNAc2。含该核心糖结构的蛋白质被转运到高尔基体,作为由高尔基甘露糖苷酶I(高尔基α-1,2-甘露糖苷酶)去除3个甘露糖残基的结果,Man8GlcNAc2被转化成Man5GlcNAc2。当蛋白质通过高尔基体时,Man5GlcNAc2通过添加GlcNAc和去除另两个甘露糖残基并且随后添加GlcNAc、半乳糖(Gal)和唾液酸(SA)残基而被进一步修饰。
在此使用的术语“哺乳动物样糖基化”意思是,基因工程甲基营养型酵母菌株产生的糖蛋白的N-多糖包括五个或更少甘露糖残基,并且具有哺乳动物细胞例如人类细胞中产生的蛋白质的N-多糖生物合成中N-多糖或碳水化合物中间结构的特征。
在一个优选实施方案中,本发明的基因工程化甲基营养型酵母菌株生产的糖蛋白包含五个或更少甘露糖残基和至少一个N-乙酰葡糖胺残基(GlcNAc),所述N-乙酰葡糖胺残基与含甘露糖残基的核心结构和末端半乳糖残基连接。例如基因工程化甲基营养型酵母菌株生产的糖蛋白含如图1用图描述的GalGlcNAcMan5GlcNAc2。该碳水化合物(GalGlcNAcMan5GlcNAc2)的IUPAC命名是Gal(β-1,4)GlcNAc(β-1,2)Man(α-1,3){Man(α-1,3)[Man(α-1,6)]Man(α-1,6)}Man(β-1,4)GlcNAc(β-1,4)GlcNAc。它的扩展命名是β-D-Galp-(1→4)-β-D-GlcpNAc-(1→2)-α-D-Manp-(1→3)-{α-D-Manp-(1→3)-[α-D-Manp-(1→6)]-α-D-Manp-(1→6)}-β-D-Manp-(1→4)-β-D-GlcpNAc-(1→4)-D-GlcpNAc。
已经确定的是,离开甲基营养型酵母内质网(ER)的糖蛋白上的大部分N-多糖具有Man8GlcNAc2寡糖结构,所述甲基营养型酵母包括毕赤酵母,尤其是巴斯德毕赤酵母。糖蛋白从ER转运到高尔基体之后,通过不同的甘露糖基转移酶将额外的甘露糖残基添加到这种核心糖结构上,得到具有由高级甘露糖核心或延伸的支化甘露聚糖外链组成的寡糖结构的糖蛋白。
根据本发明,为了生产具有哺乳动物样糖基化的重组糖蛋白,修饰甲基营养型酵母以表达经过一系列步骤将碳水化合物结构Man8GlcNAc2转化成哺乳动物样N-多糖的酶。优选地,也修饰甲基营养型酵母以灭活参与生成高度甘露糖结构的一个或多个酶的表达,例如由OCH1基因编码的α-1,6-甘露糖基转移酶。
在此使用的术语“甲基营养型酵母”包括但不限于能够在甲醇中生长的酵母菌株,例如念珠菌属、汉逊酵母属、球拟酵母属或毕赤酵母属的酵母。本发明的优选的甲基营养型酵母是毕赤酵母属菌株。尤其优选的是巴斯德毕赤酵母菌株GS115(NRRLY-15851)、GS190(NRRL Y-18014)、PPF1(NRRL Y-18017)、PPY120H、YGC4和由此衍生的菌株。
在一个实施方案中,本发明提供生产具有哺乳动物样N-多糖结构的糖蛋白的基因工程化甲基营养型酵母,所述N-多糖的特征在于具有五个或更少甘露糖残基和至少一个N-乙酰葡糖胺残基(GlcNAc),所述N-乙酰葡糖胺残基与含甘露糖残基的核心结构和末端半乳糖残基连接。
在一个优选实施方案中,本发明提供生产具有哺乳动物样N-多糖结构GalGlcNAcMan5GlcNAc2的糖蛋白的基因工程化甲基营养型酵母。
根据本发明,将生产具有GalGlcNAcMan5GlcNAc2的糖蛋白的甲基营养型酵母基因工程化以表达α-1,2-甘露糖苷酶或其功能部分、N-乙酰葡糖胺基转移酶I(或GnTI)或其功能部分和β-1,4-半乳糖基转移酶(GalT)或其功能部分。优选地,甲基营养型酵母还被基因工程化以便灭活基因组OCH1基因。
α-1,2-甘露糖苷酶在Man8GlcNAc2的非还原端切割α-1,2-连接的甘露糖残基,并将糖蛋白上的该核心寡糖转化为Man5GlcNAc2,其是哺乳动物样N-乙酰葡糖胺基转移酶I的接受底物。
根据本发明,可以将甲基营养型酵母菌株工程化以表达α-1,2-甘露糖苷酶或其功能部分,这是通过将编码α-1,2-甘露糖苷酶或其功能部分的核苷酸序列例如通过转化导入菌株实现的。编码α-1,2-甘露糖苷酶或其功能部分的核苷酸序列可以来源于任何物种。许多α-1,2-甘露糖苷酶已经被克隆并可以被本领域的技术人员所用,包括编码例如小鼠α-1,2-甘露糖苷酶(Herscovics et al.J.Biol.Chem.2699864-9871,1994)、兔α-1,2-甘露糖苷酶(Lal et al.J.Biol.Chem.2699872-9881,1994)或α-1,2-甘露糖苷酶(Tremblay et al.Glycobiology 8585-595,1998)的哺乳动物基因,还有编码例如曲霉α-1,2-甘露糖苷酶(msdS基因)或瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.J.Biotechnol.77255-263,2000)的真菌基因。蛋白质序列分析已经显示至今鉴定的真核生物的α-1,2-甘露糖苷酶高度保守。
优选地,用于本发明载体的核苷酸序列编码真菌α-1,2-甘露糖苷酶,更优选地,编码瑞氏木霉α-1,2-甘露糖苷酶,更具体地,编码Maras et al.J.Biotechnol.77255-63(2000)所述的瑞氏木霉α-1,2-甘露糖苷酶。
“功能部分”意思是指基本上保留全长蛋白质酶活性的α-1,2-甘露糖苷酶的多肽片段。“基本上”意思是指保留全长α-1,2-甘露糖苷酶的至少约40%、或优选地至少50%或更多酶活性。文献描述了许多α-1,2-甘露糖苷酶的各种结构域的特征,包括催化结构域的特征。例如见,“Isolation of a mouse Golgi mannosidase cDNA,a memberof a gene family conserved from yeast to mammals”,Herscovics et al.,J Biol Chem26913 9864-71(1994);“Isolation and expression of murine and rabbit cDNAsencoding an alpha 1,2-mannosidase involved in the processing of asparagine-linkedoligosaccharides”,Lal et al.,J Biol Chem 269139872-81(1994);“Molecular cloningand enzymatic characterization of a Trichoderma reesei 1,2-alpha-D-mannosidase”,Maras M et al.,J Biotechnol 77255-63(2000)和美国专利申请20020188109,通过引用并入本文。组合使用本领域已知技术,那些本领域的技术人员可以轻易地鉴定和制造α-1,2-甘露糖苷酶的功能部分。感兴趣的α-1,2-甘露糖苷酶的一部分的活性,可以使用美国专利申请20020188109中描述的体外或体内测试法验证,通过引用并入本文。
依照本发明,将甲基营养型酵母中表达的α-1,2-甘露糖苷酶或其功能部分优选地靶向分泌途径的位点,分泌途径中Man8GlcNAc2(α-1,2-甘露糖苷酶的底物)已经在糖蛋白上形成,但是还没有到达用另外的甘露糖残基延长糖链的高尔基糖基转移酶。本发明的优选的实施方案中,将α-1,2-甘露糖苷酶或其功能部分工程化以包含ER驻留信号,使得在甲基营养型酵母菌株中表达的α-1,2-甘露糖苷酶或其功能部分靶向ER。
“ER驻留信号”表示指导包含这种肽序列的蛋白质转运并保留在ER内的肽序列。这种ER驻留序列经常在ER中存在并发挥功能的蛋白质中发现。ER驻留信号的多重选择对那些本领域的技术人员是可用的,例如酿酒酵母ER蛋白质MNS1的前21个氨基酸残基(Martinet et al.Biotechnology Letters 201171-1177,1998),和肽HDEL(SEQ ID NO1)。
本发明使用的优选的ER驻留信号是肽HDEL(SEQ ID NO1)。在许多酵母蛋白质的C-末端发现的HDEL肽序列作为ER的驻留/返回信号起作用(PelhamEMBO J.7913-918,1988)。具有HDEL序列的蛋白质被膜结合受体(Erd2p)结合并随后进入由高尔基体返回ER的逆向转运途径。
可以将本发明使用的α-1,2-甘露糖苷酶进一步工程化,例如使它包含具有可用抗体的表位标签,例如本领域公知的Myc、HA、FLAG和His6标签。带表位标签的α-1,2-甘露糖苷酶可以方便的纯化或监测其表达和细胞内定位。
根据本发明,通过基因工程,ER驻留信号可以放置在α-1,2-甘露糖苷酶的蛋白质序列内任何地方,但是优选地在α-1,2-甘露糖苷酶的C-末端。
使用本领域已知的任何分子生物技术,通过将编码这种信号或标签的核苷酸序列插入编码α-1,2-甘露糖苷酶或其功能部分的核苷酸序列,可以将ER驻留信号和表位标签容易地引入α-1,2-甘露糖苷酶或其功能部分。
工程化甲基营养型酵母菌株中α-1,2-甘露糖苷酶的表达可以例如通过Northern印迹分析在mRNA水平和例如通过Western印迹分析在蛋白质水平进行验证。可以通过使用多种技术,包括亚细胞分级分离和免疫荧光实验,分析蛋白质的细胞内定位。α-1,2-甘露糖苷酶在ER中的定位可以由该酶和已知ER停留蛋白质(例如蛋白质二硫化物异构酶)的共沉降来确定。ER中的定位也可以由ER驻留蛋白质的免疫荧光染色模式特征来确定,典型地是核周染色模式。
为了证实甲基营养型酵母菌株中表达的α-1,2-甘露糖苷酶或其功能部分具有预期的甘露糖修饰活性,可以使用体外和体内测试法。典型地,体外测试法包括使用从甲基营养型酵母菌株表达和纯化的酶消化体外合成的底物,例如Man8GlcNAc2,并估计这种酶将Man8GlcNAc2修饰为例如Man5GlcNAc2的能力。在体内测试法中,将α-1,2-甘露糖苷酶或其功能部分在甲基营养型酵母中与糖蛋白共表达,已知所述糖蛋白在该酵母中被携带末端α-1,2-连接甘露糖残基的N-多糖糖基化。α-1,2-甘露糖苷酶或其功能部分的酶活性可以基于所述糖蛋白的N-多糖结构中的α-1,2-连接的甘露糖残基数的减少来测量。在体外和体内测试法中,碳水化合物基团的组成可以使用本领域公知的技术确定并在下面的实施例中举例说明。
进一步根据本发明,通过将编码GlcNAc-转移酶I或其功能部分的核苷酸序列例如通过转化导入菌株,可以将甲基营养型酵母菌株工程化以表达GlcNAc-转移酶I或其功能部分。GlcNAc-转移酶I负责向Man5GlcNAc2添加β-1,2-GlcNAc,并将糖蛋白上的这种核心寡糖转化成GlcNAcMan5GlcNAc2。GlcNAcMan5GlcNAc2的甘露糖残基可以被哺乳动物高尔基体甘露糖苷酶II进一步修饰,并且可以添加另外的糖单元,例如半乳糖,形成哺乳动物糖蛋白的杂合或复合型糖分支特征。
用于导入甲基营养型酵母菌株的编码GlcNAc-转移酶I(GnTI)的核苷酸序列可以来源于任何物种,例如兔、大鼠、人、植物、昆虫、线虫和原生动物例如利什曼原虫。优选地,本发明使用的核苷酸序列编码人GnTI,更优选地编码SEQ ID NO13中列出的人GnTI。
GnTI的“功能部分”是指基本上保留全长GnTI的酶活性的GnTI的多肽片段。“基本上”是指保留全长GnTI的至少约40%、或优选至少50%或更多酶活性。GnTI或其一部分的酶活性可以通过Reeves et al.(Proc.Natl.Acad.Sci.USA.99(21)13419-24,2002),Maras et al.(Eur J Biochem.249(3)701-7,1997)或下面的实施例中描述的测试法确定。组合使用本领域已知的技术,那些本领域的技术人员可以轻易地鉴定和制造GnTI的功能部分。例如,如本发明中举例说明的,人GnTI的催化结构域(包含后327个残基)构成人GnTI的“功能部分”。
依据本发明,甲基营养型酵母菌株中表达的GnTI或其功能部分优选地靶向分泌途径的位点,分泌途径中Man5GlcNAc2(GnTI的底物)已经在糖蛋白上形成。优选地,GnTI或其功能部分靶向高尔基体。
因此,本发明的优选的实施方案中,将GnTI或其功能部分工程化以包含高尔基体定位信号。
在此使用的“高尔基体定位信号”指的是肽序列,其将具有该序列的蛋白质导向甲基营养型酵母菌株的高尔基体并将蛋白质保留在其中。这样的高尔基体定位序列经常在高尔基体内存在和起作用的蛋白质内发现。
高尔基体定位信号的选择对那些本领域的技术人员是可以实现的。本发明使用的优选的高尔基体定位信号是来源于酿酒酵母Kre2蛋白(SeKre2)的N-末端的肽;更优选的是SEQ ID NO10中列出的ScKre2蛋白。尤其优选的高尔基体定位信号是由SEQ ID NO10列出的ScKre2蛋白中1-100位氨基酸组成的肽(SEQ ID NO11)。
根据本发明,可以将高尔基体定位信号置于GnTI中的任何地方,但是优选地在GnTI末端,更优选地在GnTI的N-末端。
可以将本发明中使用的GnTI进一步工程化,例如包含具有可用抗体的表位标签,例如本领域公知的Myc、HA、FLAG和His6标签。带表位标签的GnTI可以方便的纯化或监测其表达和细胞内定位。
使用本领域已知的任何分子生物技术,通过将编码这种信号或标签的核苷酸序列插入编码GnTI的核苷酸序列,可以将ER驻留信号和表位标签容易地引入GnTI。
进一步根据本发明,典型地可以通过转化将编码β-1,4-半乳糖基转移酶(GalT)或其功能部分的核苷酸序列导入菌株,将甲基营养型酵母菌株工程化以表达β-1,4-半乳糖基转移酶(GalT)或其功能部分。GalT将β-1,4-半乳糖残基添加到多糖结构左臂(GlcNAcMan5GlcNAc2)的GlcNAc上,如图1所示。
用于导入甲基营养型酵母菌株的编码GalT或其功能部分的核苷酸序列可以来源于任何物种,例如哺乳动物(例如人、小鼠)、植物(例如拟南芥)、昆虫(例如黑腹果蝇)或线虫(例如秀丽隐杆线虫)。优选地,本发明中使用的核苷酸序列编码人GalT,更优选编码SEQ ID NO21中列出的人GalT。
GalT的“功能部分”是指基本上保留全长GalT的酶活性的GalT的多肽片段。“基本上”是指保留全长GalT的至少约40%或优选至少50%或更多酶活性。GalT或其一部分的酶活性可以通过Maras et al.(Eur J Biochem.249(3)701-7,1997)或下面的实施例中描述的测试法确定。组合使用本领域已知的技术,那些本领域的技术人员可以轻易地鉴定和制造GalT的功能部分。例如,如本发明中举例说明的,人GalT的催化结构域构成人GalT的“功能部分”。
依据本发明,甲基营养型酵母菌株中表达的GalT或其功能部分优选地靶向分泌途径的位点,分泌途径中GlcNAcMan5GlcNAc2(GalT的底物)已经在糖蛋白上形成。优选地,GalT或其功能部分靶向高尔基体。
因此,本发明的优选的实施方案中,将GalT或其功能部分工程化以包含上面描述的高尔基体定位信号。将GalT靶向高尔基体的优选高尔基体定位信号是由SEQ IDNO10列出的ScKre2蛋白中1-100位氨基酸组成的肽(SEQ ID NO11)。
根据本发明,可以将高尔基体定位信号置于GalT中的任何地方,但是优选地在GalT末端,更优选地在GalT的N-末端。
可以将本发明中使用的GalT进一步工程化,例如包含具有可用抗体的表位标签,例如本领域公知的Myc、HA、FLAG和His6标签。带表位标签的GalT可以方便的纯化或监测其表达和细胞内定位。
使用本领域已知的任何分子生物技术,通过将编码这种信号或标签的核苷酸序列插入编码GalT的核苷酸序列,可以将ER驻留信号和表位标签容易地引入GalT。
为了实现所希望的蛋白质(即,α-1,2-甘露糖苷酶、GnTI、GalT或任何这些酶的功能部分)在甲基营养型酵母菌株中的表达,可以将编码蛋白质的核苷酸序列置于载体,并与在甲基营养型酵母菌株中有功能的启动子和3′终止序列可操作的连接。随后将载体导入甲基营养型酵母菌株中,例如通过转化导入。
适合于在甲基营养型酵母菌株中表达蛋白质的启动子包括组成型启动子和诱导型启动子。组成型启动子例如包括巴斯德毕赤酵母甘油醛-3-磷酸脱氢酶启动子(“GAP启动子”)。诱导型启动子的实例例如包括巴斯德毕赤酵母醇氧化酶I启动子(“AOXI启动子”)(美国专利No.4,855,231)或巴斯德毕赤酵母甲醛脱氢酶启动子(“FLD启动子”)(Shen et al.Gene 21693-102,1998)。
3′终止序列是结构基因终止密码子3′的序列,起到使与序列可操作连接的基因的mRNA转录产物稳定的作用,例如引起聚腺苷酸化的序列。3′终止序列可以从毕赤酵母或其它甲基营养型酵母获得。用于实施本发明的巴斯德毕赤酵母3′终止序列的实例包括AOXI基因和HIS4基因的终止序列。
载体或其线性片段的转化可以使用任何已知的方法实现,例如Cregg et al.(Mol.Cell.Biol.(12)3376-85,1985)描述的原生质球技术,或Ito et al.(Agric.Biol.Chem.48(2)341,(1984))描述的整个细胞氯化锂酵母转化系统,如EP 312,934所述修改用于毕赤酵母。其它可用于转化的方法包括下列描述的方法美国专利No.4,929,555;Hinnen et al.(Proc.Nat.Acad.Sci.USA 751929(1978));Ito et al.(J.Bacteriol.153163(1983));美国专利No.4,879,231;和Sreekrishna et al.(Gene 59115(1987))。也可以使用电穿孔和PEG1000完整细胞转化程序。见Cregg and Russel,Methods inMolecular BiologyPichia Protocols,Chapter 3,Humana Press,Totowa,N.J.,pp.27-39(1998)。
可以使用适当的技术选择转化的酵母细胞,适当的技术包括但不限于在转化之后在缺少所需生化产物的条件下培养营养缺陷型细胞(由于细胞的营养缺陷型)、选择和检测新的表型或在抗生素存在条件下培养,所述抗生素在缺少转化子中含有的抗性基因时对酵母有毒。也可以将表达盒整合入基因组来选择和/或验证转化子,这可以通过例如Southern印迹或PCR分析来评价。
如上所述,除了表达α-1,2-甘露糖苷酶和N-乙酰葡糖胺基转移酶I(或GnTI)、β-1,4-半乳糖基转移酶(GalT)或其功能部分之外,优选地甲基营养型酵母菌株还被工程化以灭活基因组OCH1基因,从而有效地生产具有GalGlcNAcMan5GlcNAc2多糖的糖蛋白。
OCH1基因编码膜结合型α-1,6-甘露糖基转移酶,该酶定位于早期高尔基复合体并启动将α-1,6-聚甘露糖外链添加至N-连接核心寡糖(Man5GlcNAc2和Man8GlcNAc2)。酿酒酵母OCH1基因和毕赤酵母OCH1基因已经被克隆(分别在Nakayama et al.EMBO J.112511-2519,1992和日本专利申请No.07145005中描述)。那些本领域的技术人员可以用本领域公知技术从其它甲基营养型酵母中分离OCH1基因。
根据本发明,破坏甲基营养型酵母菌株的OCH1基因可以导致产生无活性蛋白质产物或无产物。这种破坏可以采用插入异源DNA序列到编码区和/或删除一些或全部编码区的形式。基因破坏可以通过同源重组产生,基本上如Rothstein(Methods inEnzymology,Wu et al.,eds.,vol 101202-211,1983)所述。
为了通过双同源重组破坏基因组OCH1基因,可以构建OCH1“敲出”载体,其中包括选择标志基因,在它的5′和3′端都与OCH1的足以介导同源重组的长度的部分可操作的连接。选择标志可以是任意数目的补充宿主细胞营养缺陷型或提供抗生素抗性的基因之一,包括URA3、ARG4、HIS4、ADE1、LEU2 HIS3、Sh ble(印度斯坦链异壁菌博莱霉素基因)和BSD(土曲霉的杀稻瘟素S脱氨酶)基因。其它合适的选择标志包括酿酒酵母的转化酶,其允许甲基营养型酵母在蔗糖上生长;或lacZ基因,其由于活性β-半乳糖苷酶的表达而产生蓝色菌落。然后将OCH1灭活载体的线性DNA片段用本领域公知的任何转化方法导入宿主甲基营养型酵母细胞,其中所述OCH1灭活载体在它的5′和3′端都具有OCH1序列的选择标志基因。线性片段整合入基因组OCH1基因座,OCH1基因的破坏可以基于选择标志确定,并可以例如通过Southern印迹分析验证。
作为替代方案,可以构建OCH1敲出载体,其包含OCH1基因的一部分,其中该部分无任何OCH1启动子序列并且不编码OCH1蛋白质或编码OCH1蛋白质的无活性片段。“无活性片段”是指全长OCH1蛋白质的片段,所述片段优选地含全长OCH1蛋白质活性的少于约10%,更优选地约0%。将OCH1基因的这部分插入载体,并且不与在甲基营养型酵母中有功能的任何启动子序列可操作的连接。随后可以将该载体在OCH1序列内的位点上线性化,并使用本领域已知的任何转化方法转化入甲基营养型酵母菌株。通过单同源重组的方式,将该线性化载体整合入OCH1基因座,在染色体中产生两个och1序列,没有一个能够产生活性Och1p蛋白质,如图3A所示。
优选地,将灭活突变也导入载体的och1序列中线性化位点的5’位置(上游)和OCH1翻译起始密码子的3’位置(下游)处。“灭活突变”是指引入终止密码子的突变,移码突变或引起读码框破坏的任何其它突变。可以使用本领域已知的任何定点突变方法将这种突变引入载体的och1序列中。这种灭活突变确保了在同源重组后没有功能性Och1p蛋白质形成,即使在敲出载体中och1序列的5′存在一些启动子序列也是如此。
如果期望可以将如上所述的基因工程化甲基营养型酵母菌株进一步修饰。例如,可以破坏编码任何其它毕赤酵母甘露糖基转移酶的其他基因。如果期望,可以导入编码在哺乳动物糖基化途径中起作用的除α-1,2-甘露糖苷酶、GnTI或GalT之外的酶的基因,以增加哺乳动物样N-多糖的比例和/或进一步修饰哺乳动物样N-多糖。例如,可以将上述基因工程甲基营养型酵母菌株进一步修饰以表达酿酒酵母GAL10编码的酶,该酶将UDP-葡萄糖转化成UDP-半乳糖,反之亦然。这可以提高胞浆UDP-半乳糖的水平,从而刺激GalT的活性并增加GalGlcNAcM5GlcNAc2多糖的比例。另外,可以将上述基因工程化甲基营养型酵母菌株进一步修饰以在高尔基体中表达甘露糖苷酶II,该酶从GalGlcNAcM5GlcNAc2中除去额外的甘露糖残基,从而允许添加其它糖残基。
遗传修饰的顺序对本发明不是关键的。导入编码α-1,2-甘露糖苷酶、GnTI和GalT的核苷酸序列和破坏基因组OCH1基因可以以任何顺序依次进行,或通过共转化两个或更多不同载体或编码序列或通过转化包括两个或更多不同编码序列的一个载体而同时进行。
进一步方面中,本发明提供用于产生具有哺乳动物样N-多糖结构的糖蛋白的甲基营养型酵母菌株的载体,所述N-多糖的特征为具有五个或更少甘露糖残基和至少一个与包含甘露糖的核心结构和末端半乳糖残基连接的N-乙酰葡糖胺残基(GlcNAc),例如GalGlcNAcMan5GlcNAc2。
在一个实施方案中,本发明提供包含编码待表达酶的核苷酸序列的载体,所述酶即,α-1,2-甘露糖苷酶、GnTI、GalT或任何这些蛋白质的功能部分。这种载体也称为“敲入”载体。可以将编码序列与在表达所编码蛋白质的宿主甲基营养型酵母中有功能的启动子和3′终止序列可操作的连接。可以将两个或更多编码序列置于同一载体中以同时转化入甲基营养型酵母菌株内。优选地,所述载体还包含上述便于转化子选择的任一种选择标志基因。
根据本发明,敲入载体可以是整合型载体或复制型载体(例如复制型环状质粒),其中含有编码准备在甲基营养型酵母菌株表达的期望蛋白质的序列。整合型载体例如已公开在美国专利No.4,882,279中,其通过引用并入本文。整合型载体通常包含至少第一个可插入DNA片段、选择标志基因和第二个可插入DNA片段的依次排列的序列。第一和第二个可插入DNA片段每个可以是约200个核苷酸长,并包含与待转化物种的部分基因组DNA同源的核苷酸序列。将包含用于表达的感兴趣结构基因的核苷酸序列在第一和第二个可插入DNA片段之间在标志基因之前或之后插入上述载体。可以将整合型载体在酵母转化之前线性化,以促进感兴趣的核苷酸序列整合入宿主细胞基因组。
另一个实施方案中,本发明提供灭活载体(或“敲出”载体),其在导入甲基营养型酵母菌株时灭活或破坏基因组OCH1基因。
如上所述,灭活基因组OCH1基因的载体可以包含选择标志基因,在其5′和3′端与足以介导同源重组的长度的OCH1基因的一部分可操作的连接。用OCH1灭活载体的线性DNA片段转化甲基营养型酵母细胞导致线性片段整合入基因组OCH1基因座并破坏基因组OCH1基因,所述OCH1灭活载体包含选择标志基因,在选择标志基因的5′和3′端具有OCH1序列。
作为替代方案,OCH1灭活载体可以包含待破坏的OCH1基因的一部分和上述任何一个选择标志基因,OCH1基因的所述部分不编码OCH1蛋白质或编码OCH1蛋白质的无活性片段。OCH1的这个部分没有任何OCH1启动子序列并且不与任何已知启动子序列可操作的连接。可以将这样的载体在Och1序列内的位点处被线性化并随后转化入甲基营养型酵母菌株,通过单同源重组介导的整合导致基因组OCH1基因被灭活。优选地,在线性化位点的5’位置(上游)和OCH1翻译起始密码子的3’位置(下游)处的载体Och1序列中还引入灭活突变,例如终止密码子或移码突变。
如果期望,编码待表达于甲基营养型酵母菌株中的酶的核苷酸序列可以与能够灭活基因组OCH1基因的核苷酸序列组合在同一载体中,从而产生“敲入并敲出”载体。
本发明的载体,包括敲入载体和敲出载体,也可以包含在细菌中起作用的选择标志基因,以及负责在细菌中复制和染色体外维持的序列。细菌选择标志基因的实例包括氨苄青霉素抗性(Ampr)、四环素抗性(Tetr)、潮霉素抗性、杀稻瘟菌素抗性和zeocin抗性(ZeoR)基因。
此外,任何以上描述的载体可以进一步包括编码感兴趣的糖蛋白的核苷酸序列,用于在甲基营养型酵母菌株中表达这种糖蛋白。
另一个方面中,本发明提供生产具有哺乳动物样N-多糖结构的糖蛋白的方法。
在此使用的“糖蛋白”表示在甲基营养型酵母中在一个或多个天冬酰胺残基上或一个或多个丝氨酸或苏氨酸残基上、或同时在天冬酰胺和丝氨酸或苏氨酸残基上被糖基化的蛋白质。优选地,所述糖蛋白对宿主甲基营养型酵母菌株是异源的。
依据本发明,生产具有降低糖基化的感兴趣糖蛋白可以以许多方式实现。例如,可以将编码感兴趣糖蛋白的核苷酸序列导入事先已被工程化生产哺乳动物样N-多糖的甲基营养型酵母菌株。
可以使编码糖蛋白的核苷酸序列与在宿主菌株中起作用的启动子序列和3′终止序列可操作连接。当期望蛋白质产物分泌时,所述核苷酸序列可以包含额外的序列,例如编码转运肽的信号序列。这种信号序列是广为人知的,容易得到并包括酿酒酵母α交配因子prepro(αmf)、巴斯德毕赤酵母酸性磷酸酶(PHO1)信号序列等。
作为替代方案,可以将已经导入感兴趣糖蛋白质的编码序列的甲基营养型酵母菌株修饰以表达期望的酶(即α-1,2-甘露糖苷酶、GnTI和GalT),并灭活基因组OCH1基因,如上所述,从而生产具有哺乳动物样N-多糖的糖蛋白。
甲基营养型酵母中生产的糖蛋白可以通过常规的方法纯化。纯化方案可以根据待纯化的特定蛋白质的性质来确定。这种确定在本领域的技术人员的正常水平内。例如,将细胞培养基与细胞分离并可以通过常规分离技术例如沉淀、免疫吸附、分级分离或各种色谱方法从培养基中分离细胞分泌的蛋白质。
可以通过本发明的方法生产的糖蛋白包括细菌、真菌或病毒蛋白质或抗原,例如解淀粉芽孢杆菌α-淀粉酶、酿酒酵母转化酶、克氏锥虫反-唾液酸酶、HIV包膜蛋白、流感病毒A血细胞凝集素、流感神经氨酸酶、1型牛疱疹病毒糖蛋白D;蛋白质,哺乳动物来源的蛋白质,例如人蛋白质、生长因子或受体,例如人血管抑素、人B7-1、B7-2和B-7受体CTLA-4、人组织因子、生长因子(例如血小板来源生长因子)、组织纤溶酶原激活化因子、纤溶酶原激活活化因子抑制剂-I、尿激酶、人溶酶体蛋白质例如α-半乳糖苷酶、纤溶酶原、凝血酶、因子XIII;和免疫球蛋白或免疫球蛋白的片段(例如Fab、Fab′、F(ab′)2)。对可以在本发明的基因工程化毕赤酵母菌株中表达的其它有用的糖蛋白,见Bretthauer and Castellino,Biotechnol. Appl.Biochem.30193-200(1999),和Kukuruzinska et al.,Ann Rev.Biochem.56915-944(1987)。
通过使用本发明的方法生产的糖蛋白,即具有哺乳动物样N-多糖的糖蛋白,尤其具有GalGlcNAcMan5GlcNAc2N-多糖的糖蛋白也是本发明的一部分。
另一个方面中,本发明提供包含上面描述的本发明的一个或多个敲入载体、敲出载体或敲入-敲出载体的试剂盒。
更具体地,本发明的试剂盒包含具有编码α-甘露糖苷酶I或其功能部分的核苷酸序列的载体,优选地包含ER驻留信号;具有编码GnTI或其功能部分的核苷酸序列的载体,优选地包含高尔基体驻留信号;具有编码GalT或其功能部分的核苷酸序列的载体,优选地包含高尔基体驻留信号;或能够破坏甲基营养型酵母中基因组OCH1基因的载体,或其任何组合。
所述试剂盒还可以包含具有编码感兴趣的异源糖蛋白的序列的核酸分子。这种核酸分子可以在含有上述敲入或敲出序列的不同载体上或同一载体上提供。作为替代方案,试剂盒中的敲入或敲出载体包含方便插入编码感兴趣的异源蛋白质的核苷酸序列的克隆位点。
试剂盒也可以包含甲基营养型酵母菌株,其可以使用任何上面描述的敲入、敲出或敲入-敲出载体转化。作为替代方案,试剂盒可以包含已经被工程化以生产哺乳动物样N-多糖的甲基营养型酵母菌株。
本发明通过下列实施例进一步举例说明。
实施例1材料和方法载体构建和转化巴斯德毕赤酵母序列的GenBank登记号为E12456(SEQ ID NO2),描述于日本专利申请No.07145005中,该文献通过引用并入本文。该序列显示α-1,6-甘露糖基转移酶的所有典型特征并与酿酒酵母OCH1最同源,因此在此称为巴斯德毕赤酵母OCH1基因。
通过PCR分离巴斯德毕赤酵母OCH1基因的全部ORF,其中使用由菌株GS115分离的基因组DNA作为模板和下列寡核苷酸5′GGAATTCAGCATGGAGTATGGATCATGGAGTCCGTTGGAAAGG(SEQ IDNO4)和5′GCCGCTCGAGCTAGCTTTCTTTAGTCC(SEQ ID NO5)。将分离的OCH1基因克隆到pUC18中以获得pUC18pOCH1,通过测序确认OCH1基因的身份。
质粒pGlycoSwitchM8(2875bp,SEQ ID NO6,在图3A中描述)包含巴斯德毕赤酵母OCH1 ORF的编码Ala25-Alal55的片段,所述片段插入pPICZB(Invitrogen,Carlsbad,CA)的BglII和HindIII位点之间。两个框内的终止密码子位于紧接在Ala25密码子之前的位置,以防止合成截短蛋白质的可能。通过消化后的补平和再连接预先除去pPICZB的多接头的BstB I位点。位于克隆的OCH1片段内的唯一BstB I位点可用于质粒的线性化(见图3A概述了灭活策略)。
pGlycoSwitchM5(5485bp,SEQ ID NO9,在图3B描述)如下构建。将包含巴斯德毕赤酵母HIS4转录终止序列的pPIC9(Invitrogen,Carlsbad,CA)的XbaI/Cla I片段插入pGlycoSwitchM8的HindIII和EcoR I位点之间。随后,将包含GAP启动子和preMF甘露糖苷酶HDEL盒的pGAPZMFManHDEL的2.3kb BglII/Not I片段(Callewaert et al.,FEBS Lett,503(2-3)173-178,2001)插入HindIII和Not I位点之间。将所有用于此构建的限制性位点(除了Not I位点)用Klenow DNA聚合酶补平。通过补平和消化后再连接预先除去pGAPZMFmanHDEL中的唯一BstB I位点。
为了使人GlcNAc-转移酶I(GnTI)靶向高尔基体,将GnTI N-末端部分用负责定位至酵母高尔基体中的酿酒酵母Kre2 N-末端部分替换(Lussier et al.,J Cell Biol,131(4)913-927,1995)。通过将Kre2基因的Sac I/Pvu II片段插入到已用Sal I(用Klenow平端化)和Sac I消化的YEp352载体中产生质粒YEp352Kre2(由Dr.HowardBussey,McGill University,Montreal,Canada提供)。将YEp352Kre2用Sac I/Pvu I消化并通过T4-聚合酶平端化。分离Kre2基因的5′端并克隆入Klenow平端化的SgrAI/Xba I切开的pUChGnTI(Maras et al.,Eur J Biochem 249(3)701-707,1997)。使用标准程序对两个DNA片段之间的融合位置测序。得到的Kre2-GnTI开放读码框包含Kre2基因的N-末端部分(编码Kre2蛋白的前100个氨基酸,如SEQ ID NO11中列出)和GnTI的催化结构域(如SEQ ID NO13中列出的GnTI的最后327个氨基酸),所述开放读码框通过EcoR V/Hind III双重消化分离并在两个片段用Klenow聚合酶平端化后连接入Sal I/EcoR I切开的pPIC6A载体(Invitrogen)中。得到的质粒命名为pPIC6AKrecoGnTI(SEQ ID NO14,在图3C中描述)。它包含位于甲醇诱导型AOX1启动子控制下的Kre2GnTI开放读码框和来自土曲霉的对杀稻瘟菌素有抗性的BSD基因。
通过以靶向GnTI的同样方式将GalT的催化域与Kre2p的N-末端部分融合来实现GalT的定位。从hepg2 cDNA文库扩增β-1,4-半乳糖基转移酶,其中使用寡核苷酸5′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTC(SEQ ID NO15)和5′GAATTCGAAGGGAAGATGAGGCTTCGGGAGCC(SEQ ID NO16)作为起始序列。将扩增的片段经Hind III/EcoR I克隆入pUC18。为了删除GalT蛋白质的N-末端77氨基酸,使用下列寡核苷酸作为引物进行PCR5′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTC(SEQ ID NO15)和5′CGTTCGCGACCGGAGGGGCCCGGCCGCC(SEQ ID NO17)。扩增的片段用Nru I/Hind III切割并连接入Hind III/SgrA I Klenow平端化的pUCKreGnTI载体。得到的Kre2-GalT融合构建体再用下列引物通过PCR扩增5′TCGATATCAAGCTTAGCTCGGTGTCCCGATGTC(SEQ ID NO18)和5′GAATTCGAACTTAAGATGGCCCTCTTTCTCAGTAAG(SEQ ID NO19)。将扩增的片段经EcoR V/BstB I克隆入pBLURA IX(Cereghino et al.,Gene,263159-169,2001)(由James Cregg,Oregon Graduate Institute of Science and Technology,Beaverton,USA提供)。最后通过将来自载体pFA6a-KanMX4的Spe I/Sma I片段连接入Spe I/Ssp I切开的质粒,用卡那霉素抗性盒替换URA3基因。最终的质粒命名为pBlKanMX4KrehGalT(SEQ ID NO7,在图3D描述),包含编码Kre2-GalT融合蛋白质的序列,所述序列与AOX1启动子可操作的连接。所述融合蛋白质由Kre2的前100个氨基酸和GalT的最后320个氨基酸组成。
按事先描述将这些质粒转化至表达各种蛋白质的GS115毕赤酵母菌株中(Cregget al.,Methods in MolecularBiology,10327-39,1998)。通过对基因组DNA进行PCR证实PpOCH1基因座处的正确基因组整合。
蛋白质制备如所述,使用HIC、阴离子交换和凝胶过滤色谱的组合来纯化分泌的瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.,J Biotechnol,77(2-3)255-263,2000;Van Petegem etal.,J Mol Biol 312(1)157-165,2001)。所有的SDS-PAGE实验在标准运行条件下在10%PAA上进行。酵母细胞壁甘露糖蛋白质如Ballou所述释放(Methods Enzymol,185440-470,1990),其中包括用0.9%NaCl水溶液彻底洗涤酵母细胞、酵母细胞在20mM柠檬酸钠缓冲液中长时间高压灭菌(90分钟),随后用甲醇沉淀(4体积)。
N-多糖分析N-多糖分析通过激光诱导DNA-测序仪辅助的荧光物辅助的碳水化合物电泳(DSA-FACE)在ABI 377 DNA-测序仪上进行,如所述(Callewaert et al.,Glycobiology,11(4)275-281,2001)。简言之,将糖蛋白固定在MultiscreenImmobilon-P板上并通过PNGase处理而去糖基化。回收N-多糖并用APTS衍生化。过量的标记通过在Sephadex G10树脂上按大小分级分离来去除。APTS-标记的寡糖蒸发之后,加入ROX-标记的GENESCAN 500标准混合物(Applied Biosystems)实现内部标准化。将该混合物在ABI 377A DNA测序仪(Applied Biosystems)上用使12%聚丙烯酰胺凝胶在89mM Tris、89mM硼酸盐、2.2mM EDTA缓冲液中跑胶。每块凝胶上,跑牛核糖核酸酶B的N-多糖和麦芽糊精ladder作为参照。使用GENESCAN3.1软件(Applied Biosystems)进行数据分析。用β-N-乙酰氨基己糖苷酶(Glyko)和β-半乳糖苷酶(Prozyme)对标记多糖在37℃在20mM醋酸钠pH5.5中进行外切糖苷酶处理过夜。传统的FACE(N-多糖的ANTS标记和在30%PAA微型凝胶上电泳)如Jackson描述的进行(Biochem J,270(3)705-713,1990)。DSA-FACE方法具有非常高的分辨率和灵敏度,而传统的FACE很好的适用于检测较高分子量N-多糖的复杂混合物(′超糖基化′),这种糖不能分辨并因此在传统FACE中在凝胶上形成特征性′弥散条带′。因此,DSA-FACE和传统FACE分析的结合得到酵母产生的糖蛋白的特征的更完整图像。
生长曲线确定新鲜过夜的酵母培养物用新鲜的YPD培养基稀释到OD600为0.02并在250rpm、30℃过夜生长(12小时,OD600<3.0)。为了开始实验,将过夜的酵母培养物接种到50mL聚丙烯管中的10mL新鲜YPD以使开始OD600值为0.5。每2小时取等分试样并测量OD600值。所有酵母菌株在同一时间平行进行。
实施例2OCH1的灭活基因组巴斯德毕赤酵母OCH1基因的破坏通过如下的单同源重组实现。如实施例1所述产生质粒pGlycoSwitchM8(图3A),其包含巴斯德毕赤酵母OCH1基因的第73-467碱基对,之前是两个框内无义密码子以避免从载体中潜在的更早的翻译起始位点通读。该片段包含位于中心位置的BstB I位点,用于在转化之前将载体线性化,并将该片段的3′端与AOX1转录终止序列连接。当经单同源重组整合入毕赤酵母的基因组OCH1基因座时,该载体将复制存在于载体中的OCH1序列。结果,毕赤酵母染色体中的OCH1基因被两个Och1序列替换。第一个OCH1序列编码最大长度161个氨基酸的蛋白质产物(其中6个氨基酸由载体中的序列产生),其不包含由全长OCH1基因编码的II型跨膜蛋白质的催化结构域。第二个OCH1序列缺少全长蛋白质的前25个氨基酸的编码序列,并包含两个框内终止密码子以防止从潜在的上游翻译起始位点的任何通读。
用质粒pGlycoSwitchM8转化GS115菌株。转化子表示为GlycoSwitchM8,或简称为M8菌株或och1菌株。用图3A中给出的引物组合对基因组DNA进行PCR,由三次独立实验指出,显示在约50%Zeocin抗性转化子中,这种构建体正确整合在预期基因组座位中。
细胞壁甘露糖蛋白质N-多糖的分析揭示了可从图4推导出的糖基化模式的改变。对于野生型GS115菌株的细胞壁甘露糖蛋白质,优势峰是Man9GlcNAc2;而对于GlycoSwitchM8菌株,主峰是Man8GlcNAc2(比较图4中板块2和3)。N-多糖中的这种改变在用全长OCH1 ORF转化M8菌株以后可以逆转。
为了评价M8菌株的分泌糖蛋白的异质性是否降低,使用och1 M8菌株,分析野生型GS115菌株中通常超糖基化的分泌蛋白质,即瑞氏木霉α-1,2-甘露糖苷酶(Maras et al.,J Biotechnol,77(2-3)255-263,2000)。经SDS-PAGE分离M8菌株细胞的培养上清液,所述菌株已经用编码瑞氏木霉α-1,2-甘露糖苷酶的核苷酸序列转化(图5A)。凝胶显示在GlycoSwitchM8菌株中生产的蛋白质中不存在超糖基化蛋白质的特征性弥散条带。平行地,通过PNGase F处理将分泌的糖蛋白去糖基化,通过微型凝胶上的FACE分析法来分析多糖。通常在FACE分析中,不能分辨大的超糖基结构并表现为一个弥散条带(图5B)。och1菌株的糖蛋白缺少弥散条带,这证实了och1菌株的N-多糖的异质性降低。
实施例3表达ER保留的甘露糖苷酶-HDEL为了进一步人源化巴斯德毕赤酵母的N-多糖,在och1菌株中表达ER保留的木霉α-1,2-甘露糖苷酶-HDEL。为了容易转变巴斯德毕赤酵母表达菌株,将编码瑞氏木霉α-1,2-甘露糖苷酶-HDEL的核苷酸序列插入och1灭活载体。得到的组合载体称为pGlycoSwitchM5,其构建在实施例1中描述。
用线性化的pGlycoSwitchM5转化GS115菌株。通过PCR分析证实载体的正确整合。通过DSA-FACE方法分析来自转化子的甘露糖蛋白质的N-多糖。多糖谱分析显示了均一的Man5GlcNAc2峰(图4,板块4)。在5到最高25葡萄糖单元的大小范围内对Man5GlcNAc2峰和该方法检测限之上的所有小峰(S/N>3)进行积分,发现这种高等真核生物类型的高甘露糖多糖组成这种混合物中存在的总N-多糖池的至少90%。
在替代方法中,在甲醇诱导型AOX1启动子调控下表达甘露糖苷酶-HDEL。在两种甘露糖苷酶-表达菌株(即组成型和诱导型)之间没有发现N-多糖谱的明显差别。
为了证实异源蛋白质的N-多糖修饰,将pGlycoSwitchM5质粒转化入表达克氏锥虫反-唾液酸酶的毕赤酵母菌株,如Laroy等人所述(Protein Expr Purif,20(3)389-393,2000)。在纯化的蛋白质上也检测到Man5GlcNAc2,占纯化的蛋白质上总N-多糖的超过95%。
摇瓶培养物中pGlycoSwitchM5转化菌株的生长曲线分析表明它的倍增时间与野生型菌株非常相似。然而,工程化菌株在比野生型菌株低约20%的光密度时达到稳定期,说明它可能对高细胞密度的胁迫条件多少更敏感一些。不过,它的胁迫敏感性表型比酿酒酵母och1菌株所表现的小得多。
实施例4表达定位高尔基体的N-乙酰葡糖胺基转移酶I(Kre2GnTI)为了将GnTI靶向高尔基体,用编码酿酒酵母Kre2信号序列的核苷酸序列替换编码GnTI的N-末端部分的核苷酸序列,所述GnTI的N-末端部分包括胞浆部分、跨膜区和腔内茎区(luminal stem region)的一部分。由此得到编码具有Kre2p的前100个氨基酸和GnTI的最后327个氨基酸的嵌合蛋白的核苷酸序列。
为了在巴斯德毕赤酵母中表达,将Kre2-GnTI嵌合序列置于具有杀稻瘟菌素抗性标志物的质粒中强甲醇诱导型AOX1启动子的调控下。用Nsi I消化使得AOX1基因座被线性化之后,将得到的构建体pPIC6KrecoGnTI(如实施例1所述)转化入GS115 M5菌株。转化子中构建体的存在通过使用AOX1 3′和5′引物对基因组DNA进行PCR来证实。
通过DSA-FACE方法分析了几个转化子的甘露糖蛋白的N-多糖。优势峰比Man5GlcNAc2峰大了大约一个葡萄糖单元(图4,板块5)。为了确定该峰是否含末端GlcNAc,用水解β-GlcNAc键的酶即β-N-乙酰氨基己糖苷酶进行外切糖苷酶消化。经过用这种酶消化,峰移回到Man5GlcNAc2(图4,板块6)。这说明原来的峰代表GlcNAcMan5GlcNAc2,因此证实了嵌合GnTI酶的正确的体内活性。
Kre2GnTI嵌合体的过表达导致Man5GlcNAc2几乎完全转化为GlcNAcMan5GlcNAc2。这提示在高尔基体中存在足够的UDP-GlcNAc供体底物以便N-乙酰葡糖氨基化几乎所有N-多糖。
实施例5表达高尔基体保留的β-1,4-半乳糖基转移酶用编码酿酒酵母Kre2信号序列的核苷酸序列替换编码人β-1,4-半乳糖基转移酶1的N-末端部分(前77个氨基酸)的核苷酸序列,所述N-末端部分包括酶的跨膜结构域和胞浆部分。将该嵌合融合序列置于AOX1启动子和作为终止子的AOX13′端的调控下。在转化入M5-GnTI菌株之前用Pme I将最终质粒pBlKanMX4KrehGalT(实施例1中所述)线性化。
用来自几个转化子的甘露糖蛋白进行N-多糖分析。在转化子中检测到比GlcNAcMan5GlcNAc2峰大了约一个葡萄糖单元的峰,而在非转化菌株中不存在该峰(图3,板块7)。用β-半乳糖苷酶消化N-多糖以便确定这个峰是否代表包含末端β-半乳糖的多糖。消化多糖谱之后,该峰移回GlcNAcMan5GlcNAc2的位置(图4,板块8,与板块7比较)。通过对β-半乳糖苷酶消化之前和之后的GlcNAcMan5GlcNAc2峰进行积分来确定GalGlcNAcMan5GlcNAc2的量。这两个峰相减显示约10%的GlcNAcMan5GlcNAc2被转化为GalGlcNAcMan5GlcNAc2。向培养基中添加0.2%半乳糖不增加含Gal的寡糖的量。
序列表SEQ ID NO1HDEL(肽)SEQ ID NO2巴斯德毕赤酵母OCH1基因1AGATCTGCCT GACAGCCTTA AAGAGCCCGC TAAAAGACCC GGAAAACCGA GAGAACTCTG61GATTAGCAGT CTGAAAAAGA ATCTTCACTC TGTCTAGTGG AGCAATTAAT GTCTTAGCGG121CACTTCCTGC TACTCCGCCA GCTACTCCTG AATAGATCAC ATACTGCAAA GACTGCTTGT181CGATGACCTT GGGGTTATTT AGCTTCAAGG GCAATTTTTG GGACATTTTG GACACAGGAG241ACTCAGAAAC AGACACAGAG CGTTCTGAGT CCTGGTGCTC CTGACGTAGG CCTAGAACAG301GAATTATTGG CTTTATTTGT TTGTCCATTT CATAGGCTTG GGGTAATAGA TAGATGACAG361AGAAATAGAG AAGACCTAAT ATTTTTTGTT CATGGCAAAT CGCGGGTTCG CGGTCGGGTC421ACACACGGAG AAGTAATGAG AAGAGCTGGT AATCTGGGGT AAAAGGGTTC AAAAGAAGGT481CGCCTGGTAG GGATGCAATA CAAGGTTGTC TTGGAGTTTA CATTGACCAG ATGATTTGGC541TTTTTCTCTG TTCAATTCAC ATTTTTCAGC GAGAATCGGA TTGACGGAGA AATGGCGGGG601TGTGGGGTGG ATAGATGGCA GAAATGCTCG CAATCACCGC GAAAGAAAGA CTTTATGGAA661TAGAACTACT GGGTGGTGTA AGGATTACAT AGCTAGTCCA ATGGAGTCCG TTGGAAAGGT721AAGAAGAAGC TAAAACCGGC TAAGTAACTA GGGAAGAATG ATCAGACTTT GATTTGATGA781GGTCTGAAAA TACTCTGCTG CTTTTTCAGT TGCTTTTTCC CTGCAACCTA TCATTTTCCT841TTTCATAAGC CTGCCTTTTC TGTTTTCACT TATATGAGTT CCGCCGAGAC TTCCCCAAAT901TCTCTCCTGG AACATTCTCT ATCGCTCTCC TTCCAAGTTG CGCCCCCTGG CACTGCCTAG961TAATATTACC ACGCGACTTA TATTCAGTTC CACAATTTCC AGTGTTCGTA GCAAATATCA1021TCAGCCATGG CGAAGGCAGA TGGCAGTTTG CTCTACTATA ATCCTCACAA TCCACCCAGA1081AGGTATTACT TCTACATGGC TATATTCGCC GTTTCTGTCA TTTGCGTTTT GTACGGACCC1141TCACAACAAT TATCATCTCC AAAAATAGAC TATGATCCAT TGACGCTCCG ATCACTTGAT1201TTGAAGACTT TGGAAGCTCC TTCACAGTTG AGTCCAGGCA CCGTAGAAGA TAATCTTCGA1261AGACAATTGG AGTTTCATTT TCCTTACCGC AGTTACGAAC CTTTTCCCCA ACATATTTGG1321CAAACGTGGA AAGTTTCTCC CTCTGATAGT TCCTTTCCGA AAAACTTCAA AGACTTAGGT1381GAAAGTTGGC TGCAAAGGTC CCCAAATTAT GATCATTTTG TGATACCCGA TGATGCAGCA1441TGGGAACTTA TTCACCATGA ATACGAACGT GTACCAGAAG TCTTGGAAGC TTTCCACCTG1501CTACCAGAGC CCATTCTAAA GGCCGATTTT TTCAGGTATT TGATTCTTTT TGCCCGTGGA1561GGACTGTATG CTGACATGGA CACTATGTTA TTAAAACCAA TAGAATCGTG GCTGACTTTC1621AATGAAACTA TTGGTGGAGT AAAAAACAAT GCTGGGTTGG TCATTGGTAT TGAGGCTGAT1681CCTGATAGAC CTGATTGGCA CGACTGGTAT GCTAGAAGGA TACAATTTTG CCAATGGGCA1741ATTCAGTCCA AACGAGGACA CCCAGCACTG CGTGAACTGA TTGTAAGAGT TGTCAGCACG1801ACTTTACGGA AAGAGAAAAG CGGTTACTTG AACATGGTGG AAGGAAAGGA TCGTGGAAGT1861GATGTGATGG ACTGGACGGG TCCAGGAATA TTTACAGACA CTCTATTTGA TTATATGACT1921AATGTCAATA CAACAGGCCA CTCAGGCCAA GGAATTGGAG CTGGCTCAGC GTATTACAAT1981GCCTTATCGT TGGAAGAACG TGATGCCCTC TCTGCCCGCC CGAACGGAGA GATGTTAAAA2041GAGAAAGTCC CAGGTAAATA TGCACAGCAG GTTGTTTTAT GGGAACAATT TACCAACCTG2101CGCTCCCCCA AATTAATCGA CGATATTCTT ATTCTTCCGA TCACCAGCTT CAGTCCAGGG2161ATTGGCCACA GTGGAGCTGG AGATTTGAAC CATCACCTTG CATATATTAG GCATACATTT2221GAAGGAAGTT GGAAGGACTA AAGAAAGCTA GAGTAAAATA GATATAGCGA GATTAGAGAA2281TGAATACCTT CTTCTAAGCG ATCGTCCGTC ATCATAGAAT ATCATGGACT GTATAGTTTT2341TTTTTTGTAC ATATAATGAT TAAACGGTCA TCCAACATCT CGTTGACAGA TCTCTCAGTA2401CGCGAAATCC CTGACTATCA AAGCAAGAAC CGATGAAGAA AAAAACAACA GTAACCCAAA2461CACCACAACA AACACTTTAT CTTCTCCCCC CCAACACCAA TCATCAAAGA GATGTCGGAA2521CACAAACACC AAGAAGCAAA AACTAACCCC ATATAAAAAC ATCCTGGTAG ATAATGCTGG2581TAACCCGCTC TCCTTCCATA TTCTGGGCTA CTTCACGAAG TCTGACCGGT CTCAGTTGAT2641CAACATGATC CTCGAAATGG GTGGCAAGCA TCGTTCCAGA CCTGCCTCCT CTGGTAGATG2701GAGTGTTGTT TTTGACAGGG GATTACAAGT CTATTGATGA AGATACCCTA AAGCAACTGG2761GGGACGTTCC AATATACAGA GACTCCTTCA TCTACCAGTG TTTTGTGCAC AAGACATCTC2821TTCCCATTGA CACTTTCCGA ATTGACAAGA ACGTCGACSEQ ID NO3由OCH1基因编码的巴斯德毕赤酵母α-1,6-甘露糖基转移酶(nt 1027-2241)
MAKADGSLLYYNPHNPPRRYYFYMAIFAVSVICVLYGPSQQLSSPKIDYDPLTLRSLDLKTLEAPSQLSPGTVEDNLRRQLEFHFPYRSYEPFPOHIWQTWKVSPSDSSFPKNFKDLGESWLQRSPNYDHFVIPDDAAWELIHHEYERVPEVLEAFHLLPEPILKADFFRYLILFARGGLYADMDTMLLKPIESWLTFNETIGGVKNNAGLVIGIEADPDRPDWHDWYARRIQFCQWAIQSKRGHPALRELIVRVVSTTLRKEKSGYLNMVEGKDRGSDVMDWTGPGIFTDTLFDYMTNVNTTGHSGQGIGAGSAYYNALSLEERDALSARPNGEMLKEKVPGKYAQQVVLWEQFTNLRSPKLIDDILILPITSFSPGIGHSGAGDLNHHLAYIRHTFEGSWKDSEQ ID NO45′GGAATTCAGCATGGAGTATGGATCATGGAGTCCGTTGGAAAGGSEQ ID NO55′GCCGCTCGAGCTAGCTTTCTTTAGTCCSEQ ID NO6质粒pGlycoSwitchM8(2875bp)AGATCTAACATCCATAATCGATCTAAGCTATATTCGCCGTTTCTGTCATTTGCGTTTTGTACGGACCCTCACAACAATTATCATCTCCAAAAATAGACTATGATCCATTGACGCTCCGATCACTTGATTTGAAGACTTTGGAAGCTCCTTCACAGTTGAGTCCAGGCACCGTAGAAGATAATCTTCGAAGACAATTGGAGTTTCATTTTCCTTACCGCAGTTACGAACCTTTTCCCCAACATATTTGGCAAACGTGGAAAGTTTCTCCCTCTGATAGTTCCTTTCCGAAAAACTTCAAAGACTTAGGTGAAAGTTGGCTGCAAAGGTCCCCAAATTATGATCATTTTGTGATACCCGATGATGCAGCATGGGAACTTATTCACCATGAATACGAACGTGTACCAGAAGTCTTGGAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGCGAAACGAGGAATTCACGTGGCCCAGCCGGCCGTCTCGGATCGGTACCTCGAGCCGCGGCGGCCGCCAGCTTTCTAGAGAACAAAAACTCATCTCAGAAGAGGATCTGAATAGCGCCGTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGA
TTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCSEQ ID NO7pBlKanMX4KrehGalTCTAGTGCACAAACGAACGTCTCACTTAATCTTCTGTACTCTGAAGAGGAGTGGGAAATACCAAGAAAAACATCAAACTCGAATGATTTTCCCAAACCCCTACCACAAGATATTCATCAGCTGCGAGATAGGCTGATCAGGAGCAAGCTCGTACGAGAAGAAACAAAATGACAAAAAAAATCCTATACTATATAGGTTACAAATAAAAAAGTATCAAAAATGAAGCCTGCATCTCTCAGGCAAATGGCATTCTGACATCCTCTTGATTAGAATCTAGCAAGACCGGTCTTCTCGTAAGTGCCCAACTTGAACTGAGGAACAGTCATGTCTAAGGCGAATTATCAAGCTTAGCTCGGTGTCCCGATGTCCACTGTGATTTGGGTATACAATGGGTATCTCTGTACATCCAGCACCTGGTAGGTGAGTGAGTTCAAACCATCAGAGAGCATTGTCTCCTTTGTGTGTGCAATTCGGTCAAACCTCTGAGGATTGGGTTCATTTTTTTTGTCTCTTGAGTGGCGGATCATGCGACACCTCCCGACCACAGCATTTGGGCGAGATATAGACATGCCTCTAAAAACTAATCTGTTAAAAATGTCATCATCTTCTCCTCCCCAGCCCCAATAATTATTAGGAAATCCATTGATGGTTAGAAACTGTTGTTTACTTAGAGCAGAGACACCTCCAAAATACTGAACATAAGGTAGGCTGAATCCAAACTTATCCATTGCAACGGAAATGTGCCGTGGCTGTGAAAAACACCTGTACGCATTATGGTCATTCATTGGAATGAGGTCCACGTCACTAAACACAAAGCAGGTGTAGTCATAGTCCTTCAAGGCTTCTTGAAAGCCAACATTGAGGAGCTTAGCACGATTGAATATAGTGTCTCCCGCCTGGTTGATAACATAGATGCCATAGTCCAGCTGCTGGCGCTGCAGGACTGGGTGCAAATAATATAGCCAGTACTTGAGGTGCTCCTGCCGGTTGCGGAATGGAATGATGATGGCCACCTTGTGAGGAGAGACGCAGTCCCTGGGGGCATAGCGGCCGCCCATCTTCACATTTGGGTTCTGCTTTGCCACGAGCTCCAGGTCCACAGGCATGTTAAACTCAATCAGCATGGGGCCCACAAGCAGCGGGGACTCCTCAGGGCAGGCGGGCAGCGACAGTGCGGTGGTGTGGGGCACTGGGACCGAGGTCAAGTTGCTAGCGGGGCCAGGGCCAGAATCCACGACTGGGCTGGAGTCGCCACCCGGGCGCGGCTGGGAGGAGGCGCCTAGAGGAGGCGGCGGCCGGGCCCCTCCGGTCGCCGGCGGGGCATCTGCCTTTTCAGCGGCAGCTTTCAGAGCCTTGGATTCTTCATCCATGGCTTCGGAGTCTTCGCTTGCCTCTGAATTCAGAGCACTTTGCTCTAATTTTTTAGCATCATTTTCCTCAGAGATGACTTGTTGTTCAGGGGATATAGATCCTGAGGTAAAATCAAATGCAGCGGAGATGGAACTCGGAATATATTGCTGAGTTCTACTGTTGGAATTCAATGTTAGGAGGAGAACAATAACCGCACCTGCAATGACGGTAAATCTCAACAGTCTCTTACTGAGAAAGAGGGCCATCTTAAGTTCGAATAATTAGTTGTTTTTTGATCTTCTCAAGTTGTCGTTAAAAGTCGTTAAAATCAAAAGCTTGTCAATTGGAACCAGTCGCAATTATGAAAGTAAGCTAATAATGATGATAAAAAAAAAGGTTTAAGACAGGGCAGCTTCCTTCTGTTTATATATTGCTGTCAAGTAGGGGTTAGAACAGTTAAATTTTGATCATGAACGTTAGGCTATCAGCAGTATTCCCACCAGAATCTTGGAAGCATACAATGTGGAGACAATGCATAATCATCCAAAAAGCGGGTGTTTCCCCATTTGCGTTTCGGCACAGGTGCACCGGGGTTCAGAAGCGATAGAGAGACTGCGCTAAGCATTAATGAGATTATTTTTGAGCATTCGTCAATCAATACCAAACAAGACAAACGGTATGCCGACTTTTGGAAGTTTCTTTTTGACCAACTGGCCGTTAGCATTTCAACGAACCAAACTTAGTTCATCTTGGATGAGATCACGCTTTTGTCATATTAGGTTCCAAGACAGCGTTTAAACTGTCAGTTTTGGGCCATTTGGGGAACATGAAACTATTTGACCCCACACTCAGAAAGCCCTCATCTGGAGTGATGTTCGGGTGTAATGCGGAGCTTGTTGCATTCGGAAATAAACAAACATGAACCTCGCCAGGGGGGCCAGGATAGACAGGCTAATAAAGTCATGGTGTTAGTAGCCTAATAGAAGGAATTGGAATGAGCGAGCTCCAATCAAGCCCAATAACTGGGCTGGTTTTTCGATGGCAAAAGTGGGTGTTGAGGAGAAGAGGAGTGGAGGTCCTGCGTTTGCAACGGTCTGCTGCTAGTGTATCCCCTCCTGTTGCGTTTGGCACTTATGTGTGAGAATGGACCTGTGGATGTCGGATGGCAAAAAGGTTTCATTCAACCTTTCGTCTTTGGATGTTAGCTAGCCGGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGAT
CTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATGCTTCTAGTGGTAGGAATTAATTCTGTACCGGTTTACAGAAGGACGACTCTTGATGCGCCAACCACAGTGACAATAGACATAGAGGAAATGACAAAAGGATTATGCGAGGATGCTGCTGGAGACGATTCAAAGTTTAGTTTAGAAAGGTCCTCCATTTATGCTGATAGAATACTAGATACCCGTGAACTTTGTCTCAGGAGATCCGCATCAGACGAAGGATGTTCCGACCTGCAAATAATCGAAGAAGAGACCCCTAGGCAGTTGGTGAGCTTACATGAGAAGTCTAAACTATCTTGGACCCGCTGGTTTTATAAAGGGTTCGTTAGGAATGCGTTAACTACCATTCCAGCAACATCCGTGGGGCTTCTGGTGTTTGAAATACTGCGTCAAAAATTGAGCGATGAAATTGAAGATCGATTCAGTTGAATCGCCCGAAACAATTGATCCCCTGTACATACTTGTAATTTACCTCAGAATGGGTTAATTAAGGCGCGCCAGATCTGTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAAAACGAGCTCGAATTCATCGATGATATCAGATCCASEQ ID NO8pGAPZMFManHDEL中的MFManHDEL融合体的ORF序列ATGAGATTTCCTTCAATTTTTACTGCTGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAGGCTGAAGCTGAATTCGCCACAAAACGTGGATCTCCCAACCCTACGAGGGCGGCAGCAGTCAAGGCCGCATTCCAGACGTCGTGGAACGCTTACCACCATTTTGCCTTTCCCCATGACGACCTCCACCCGGTCAGCAACAGCTTTGATGATGAGAGAAACGGCTGGGGCTCGTCGGCAATCGATGGCTTGGACACGGCTATCCTCATGGGGGATGCCGACATTGTGAACACGATCCTTCAGTATGTACCGCAGATCAACTTCACCACGACTGCGGTTGCCAACCAAGGATCCTCCGTGTTCGAGACCAACA
TTCGGTACCTCGGTGGCCTGCTTTCTGCCTATGACCTGTTGCGAGGTCCTTTCAGCTCCTTGGCGACAAACCAGACCCTGGTAAACAGCCTTCTGAGGCAGGCTCAAACACTGGCCAACGGCCTCAAGGTTGCGTTCACCACTCCCAGCGGTGTCCCGGACCCTACCGTCTTCTTCAACCCTACTGTCCGGAGAAGTGGTGCATCTAGCAACAACGTCGCTGAAATTGGAAGCCTGGTGCTCGAGTGGACACGGTTGAGCGACCTGACGGGAAACCCGCAGTATGCCCAGCTTGCGCAGAAGGGCGAGTCGTATCTCCTGAATCCAAAGGGAAGCCCGGAGGCATGGCCTGGCCTGATTGGAACGTTTGTCAGCACGAGCAACGGTACCTTTCAGGATAGCAGCGGCAGCTGGTCCGGCCTCATGGACAGCTTCTACGAGTACCTGATCAAGATGTACCTGTACGACCCGGTTGCGTTTGCACACTACAAGGATCGCTGGGTCCTTGGTGCCGACTCGACCATTGGGCATCTCGGCTCTCACCCGTCGACGCGCAAGGACTTGACCTTTTTGTCTTCGTACAACGGACAGTCTACGTCGCCAAACTCAGGACATTTGGCCAGTTTTGGCGGTGGCAACTTCATCTTGGGAGGCATTCTCCTGAACGAGCAAAAGTACATTGACTTTGGAATCAAGCTTGCCAGCTCGTACTTTGGCACGTACACCCAGACGGCTTCTGGAATCGGCCCCGAAGGCTTCGCGTGGGTGGACAGCGTGACGGGCGCCGGCGGCTCGCCGCCCTCGTCCCAGTCCGGGTTCTACTCGTCGGCAGGATTCTGGGTGACGGCACCGTATTACATCCTGCGGCCGGAGACGCTGGAGAGCTTGTACTACGCATACCGCGTCACGGGCGACTCCAAGTGGCAGGACCTGGCGTGGGAAGCGTTGAGTGCCATTGAGGACGCATGCCGCGCCGGCAGCGCGTACTCGTCCATCAACGACGTGACGCAGGCCAACGGCGGGGGTGCCTCTGACGATATGGAGAGCTTCTGGTTTGCCGAGGCGCTCAAGTATGCGTACCTGATCTTTGCGGAGGAGTCGGATGTGCAGGTGCAGGCCACCGGCGGGAACAAATTTGTCTTTAACACGGAGGCGCACCCCTTTAGCATCCGTTCATCATCACGACGGGGCGGCCACCTTGCTCACGACGAGTTGTAASEQ ID NO9pGlycoSwitch M5(5485bp)AGATCTAACATCCATAATCGATCTAAGCTATATTCGCCGTTTCTGTCATTTGCGTTTTGTACGGACCCTCACAACAATTATCATCTCCAAAAATAGACTATGATCCATTGACGCTCCGATCACTTGATTTGAAGACTTTGGAAGCTCCTTCACAGTTGAGTCCAGGCACCGTAGAAGATAATCTTCGAAGACAATTGGAGTTTCATTTTCCTTACCGCAGTTACGAACCTTTTCCCCAACATATTTGGCAAACGTGGAAAGTTTCTCCCTCTGATAGTTCCTTTCCGAAAAACTTCAAAGACTTAGGTGAAAGTTGGCTGCAAAGGTCCCCAAATTATGATCATTTTGTGATACCCGATGATGCAGCATGGGAACTTATTCACCATGAATACGAACGTGTACCAGAAGTCTTGGAAGCTCTAGATGCTCACCGCAATGCTGTTAAGGTTCGTATGGAGAAACTGGGACTTATTTAATTATTTAGAGATTTTAACTTACATTTAGATTCGATAGATCCACAGGACGGGTGTGGTCGCCATGATCGCGTAGTCGATAGTGGCTCCAAGTAGCGAAGCGAGCAGGACTGGGCGGCGGCCAAAGCGGTCGGACAGTGCTCCGAGAACGGGTGCGCATAGAAATTGCATCAACGCATATAGCGCTAGCAGCACGCCATAGTGACTGGCGATGCTGTCGGAATGGACGATATCCCGCAAGAGGCCCGGCAGTACCGGCATAACCAAGCCTATGCCTACAGCATCCAGGGTGACGGTGCCGAGGATGACGATGAGCGCATTGTTAGATTTCATACACGGTGCCTGACTGCGTTAGCAATTTAACTGTGATAAACTACCGCATTAAAGCTGATCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATCAATTGAACAACTATTTCGCGAAACGATGAGATTTCCTTCAATTTTTACTGCTGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAGGCTGAAGCTGAATTCGCCACAAAACGTGGATCTCCCAACCCTACGAGGGCGGCAGCAGTCAAGGCCGCATTCCAGACGTCGTGGAACGCTTACCACCATTTTGCCTTTCCCCATGACGACCTCCACCCGGTCAGCAACAGCTTTGATGATGAGAGAAACGGCTGGGGCTCGTCGGCAATCGATGGCTTGGACACGGCTATCCTCATGGGGGATGCCGACATTGTGAACACGATCCTTCAGTATGTACCGCAGATCAACTTCACCACGACTGCGGTTGCCAACCAAGGATCCTCCGTGTTCGAGACCAACATTCGGTACCTCGGTGGCCTGCTTTCTGCCTATGACCTGTTGCGAGGTCCTTTCAGCTCCTTGGCGACAAACCAGACCCTGGTAAACAGCCTTCTGAGGCAGGCTCAAACACTGGCCAACGGCCTCAAGGTTGCGTTCACCACTCCCAGCGGTGTCCCGGACCCTACCGTCTTCTTCAACCCTACTGTCCGGAGAAGTGGTGCATCTAGCAACAACGTCGCTGAAATTGGAAGCCTGGTGCTCGAGTGGACACGGTTGAGCGACCTGACGGGAAACCCGCAGTATGCCCAGCTTGCGCAGAAGGGCGAGTCGTATCTCCTGAATCCAAAGGGAAGCCCGGAGGCATGGCCTGGCCTGATTGGAACGTTTGTCAGCACGAGCAACGGTACCTTTCAGGATAGCAGCGGCAGCTGGTCCGGCC
TCATGGACAGCTTCTACGAGTACCTGATCAAGATGTACCTGTACGACCCGGTTGCGTTTGCACACTACAAGGATCGCTGGGTCCTTGGTGCCGACTCGACCATTGGGCATCTCGGCTCTCACCCGTCGACGCGCAAGGACTTGACCTTTTTGTCTTCGTACAACGGACAGTCTACGTCGCCAAACTCAGGACATTTGGCCAGTTTTGGCGGTGGCAACTTCATCTTGGGAGGCATTCTCCTGAACGAGCAAAAGTACATTGACTTTGGAATCAAGCTTGCCAGCTCGTACTTTGGCACGTACACCCAGACGGCTTCTGGAATCGGCCCCGAAGGCTTCGCGTGGGTGGACAGCGTGACGGGCGCCGGCGGCTCGCCGCCCTCGTCCCAGTCCGGGTTCTACTCGTCGGCAGGATTCTGGGTGACGGCACCGTATTACATCCTGCGGCCGGAGACGCTGGAGAGCTTGTACTACGCATACCGCGTCACGGGCGACTCCAAGTGGCAGGACCTGGCGTGGGAAGCGTTGAGTGCCATTGAGGACGCATGCCGCGCCGGCAGCGCGTACTCGTCCATCAACGACGTGACGCAGGCCAACGGCGGGGGTGCCTCTGACGATATGGAGAGCTTCTGGTTTGCCGAGGCGCTCAAGTATGCGTACCTGATCTTTGCGGAGGAGTCGGATGTGCAGGTGCAGGCCACCGGCGGGAACAAATTTGTCTTTAACACGGAGGCGCACCCCTTTAGCATCCGTTCATCATCACGACGGGGCGGCCACCTTGCTCACGACGAGTTGTAATCTAGGGCGGCCGCCAGCTTTCTAGAGAACAAAAACTCATCTCAGAAGAGGATCTGAATAGCGCCGTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAA GAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCSEQ ID NO10酿酒酵母Kre2蛋白质MALFLSKRLLRFTVIAGAVIVLLLTLNSNSRTQQYIPSSIAAFDFTSGSISPEQQVISEENDAKKLEQSALNSEASEDSEAMDEESKALKAAAEKADAPIDTKTTMDYITPSFANKAGKPKACYVTLVRNKELKGLLSSIKYVENKINKKFPYPWVFLNDEPFTEEFKEAVTKAVSSEVKFGILPKEHWSYPEWINQTKAAEIRADAATKYIYGGSESYRHMCRYQSGFFWRHELLEEYDWYWRVEPDIKLYCDINYDVFKWMQENEKVYGFTVSIHEYEVTIPTLWQTSMDFIKKNPEYLDENNLMSFLSNDNGKTYNLCHFWSNFEIANLNLWRSPAYREYFDTLDHQGGFFY
ERWGDAPVHSIAAALFLPKDKIHYFSDIGYHHPPYDNCPLDKEVYNSNNCECDQGNDFTFQGYSCGKEYYDAQGLVKPKNWKKFRESEQ ID NO11酿洒酵母Kre2高尔基体定位信号(前100个氨基酸)MALFLSKRLLRFTVIAGAVIVLLLTLNSNSRTQQYIPSSISAAFDFTSGSISPEQQVISEENDAKKLEQSALNSEASEDSEAMDEESKALKAAAEKADAPSEQ ID NO12人类GnTI cDNAATGCTGAAGAAGCAGTCTGCAGGGCTTGTGCTGTGGGGCGCTATCCTCTTTGTGGCCTGGAATGCCCTGCTGCTCCTCTTCTTCTGGACGCGCCCAGCACCTGGCAGGCCACCCTCAGTCAGCGCTCTCGATGGCGACCCCGCCAGCCTCACCCGGGAAGTGATTCGCCTGGCCCAAGACGCCGAGGTGGAGCTGGAGCGGCAGCGTGGGCTGCTGCAGCAGATCGGGGATGCCCTGTCGAGCCAGCGGGGGAGGGTGCCCACCGCGGCCCCTCCCGCCCAGCCGCGTGTGCCTGTGACCCCCGCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGGCACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATATGCTGAAGAAGCAGTCTGCAGGGCTTGTGCTGTGGGGCGCTATCCTCTTTGTGGCCTGGAATGCCCTGCTGCTCCTCTTCTTCTGGACGCGCCCAGCACCTGGCAGGCCACCCTCAGTCAGCGCTCTCGATGGCGACCCCGCCAGCCTCACCCGGGAAGTGATTCGCCTGGCCCAAGACGCCGAGGTGGAGCTGGAGCGGCAGCGTGGGCTGCTGCAGCAGATCGGGGATGCCCTGTCGAGCCAGCGGGGGAGGGTGCCCACCGCGGCCCCTCCCGCCCAGCCGCGTGTGCCTGTGACCCCCGCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGGCACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATSEQ ID NO13人类GnTI蛋白质1MLKKQSAGLV LWGAILFVAW NALLLLFFWT RPAPGRPPSV SALDGDPASL TREVIRLAQD61AEVELERQRG LLQQIGDALS SQRGRVPTAA PPAQPRVPVT PAPAVIPILV IACDRSTVRR121CLDKLLHYRP SAELFPIIVS QDCGHEETAQ AIASYGSAVT HIRQPDLSSI AVPPDHRKFQ
181GYYKIARHYR WALGQVFRQF RFPAAVVVED DLEVAPDFFE YFRATYPLLK ADPSLWCVSA241WNDNGKEQMV DASRPELLYR TDFFPGLGWL LLAELWAELE PKWPKAFWDD WMRRPEQRQG301RACIRPEISR TMTFGRKGVS HGQFFDQHLK FIRLNQQFVH FTQLDLSYLQ REAYDRDFLA361RVYGAPQLQV EKVRTNDRKE LGEVRVQYTG RDSFKAFAKA LGVMDDLKSG VPRAGYRGIV421TFQFRGRRVH LAPPPTWEGY DPSWNSEQ ID NO14pPIC6AKrecoGnTIGAAATTTTTTTTTTTAGTTTTTTTCTCTTTCAGTGACCTCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGTTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGGGGCGGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCATGGCCAAGCCTTTGTCTCAAGAAGAATCCACCCTCATTGAAAGAGCAACGGCTACAATCAACAGCATCCCCATCTCTGAAGACTACAGCGTCGCCAGCGCAGCTCTCTCTAGCGACGGCCGCATCTTCACTGGTGTCAATGTATATCATTTTACTGGGGGACCTTGTGCAGAACTCGTGGTGCTGGGCACTGCTGCTGCTGCGGCAGCTGGCAACCTGACTTGTATCGTCGCGATCGGAAATGAGAACAGGGGCATCTTGAGCCCCTGCGGACGGTGCCGACAGGTGCTTCTCGATCTGCATCCTGGGATCAAAGCCATAGTGAAGGACAGTGATGGACAGCCGACGGCAGTTGGGATTCGTGAATTGCTGCCCTCTGGTTATGTGTGGGAGGGCTAAGCACTTCGTGGCCGAGGAGCAGGACTGACACGTCCGACGGCGGCCCACGGGTCCCAGGCCTCGGAGATCCGTCCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAGACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTGGAGACCAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATCAGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACATAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGGTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAAATAGTTTCATGTTCCCCAAATGGCCCAAAACTGACAGTTTAAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGATCTCATCCAAGATGAACTAAGTTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTCGGCATACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTTAGCGCAGTCTCTCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGGAAACACCCGCTTTTTGGATGATTATGCATTGTCTCCACATTGTATGCTTCCAAGATTCTGGTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTTAACTGTTCTAACCCCTACTTGACAGCAATATATAAACAGAAGGAAGCTGCCCTGTCTTAAACCTTTTTTTTTATCATCATTATTAGCTTACTTTCATAATTGCGACTGGTTCCAATTGACAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGAAACGAGGAATTATCCATATTCGCAAGCAGTTCCACTCGAAAGCATGGCCCTCTTTCTCAGTAAGAGACTGTTGAGATTTACCGTCATTGCAGGTGCGGTTATTGTTCTCCTCCTAACATTGAATTCCAACAGTAGAACTCAGCAATATATTCCGAGTTCCATCTCCGCTGCATTTGATTTTACCTCAGGATCTATATCCCCTGAACAACAAGTCATCTCTGAGGAAAATGATGCTAAAAAATTAGAGCAAAGTGCTCTGAATTCAGAGGCAAGCGAAGACTCCGAAGCCATGGATGAAGAATCCAAGGCTCTGAAAGCTGCCGCTGAAAAGGCAGATGCCCCGCCGGCGGTGATTCCCATCCTGGTCATCGCCTGTGACCGCAGCACTGTTCGGCGCTGCCTGGACAAGCTGCTGCATTATCGGCCCTCGGCTGAGCTCTTCCCCATCATCGTTAGCCAGGACTGCGGG
CACGAGGAGACGGCCCAGGCCATCGCCTCCTACGGCAGCGCGGTCACGCACATCCGGCAGCCCGACCTGAGCAGCATTGCGGTGCCGCCGGACCACCGCAAGTTCCAGGGCTACTACAAGATCGCGCGCCACTACCGCTGGGCGCTGGGCCAGGTCTTCCGGCAGTTTCGCTTCCCCGCGGCCGTGGTGGTGGAGGATGACCTGGAGGTGGCCCCGGACTTCTTCGAGTACTTTCGGGCCACCTATCCGCTGCTGAAGGCCGACCCCTCCCTGTGGTGCGTCTCGGCCTGGAATGACAACGGCAAGGAGCAGATGGTGGACGCCAGCAGGCCTGAGCTGCTCTACCGCACCGACTTTTTCCCTGGCCTGGGCTGGCTGCTGTTGGCCGAGCTCTGGGCTGAGCTGGAGCCCAAGTGGCCAAAGGCCTTCTGGGACGACTGGATGCGGCGGCCGGAGCAGCGGCAGGGGCGGGCCTGCATACGCCCTGAGATCTCAAGAACGATGACCTTTGGCCGCAAGGGTGTGAGCCACGGGCAGTTCTTTGACCAGCACCTCAAGTTTATCAAGCTGAACCAGCAGTTTGTGCACTTCACCCAGCTGGACCTGTCTTACCTGCAGCGGGAGGCCTATGACCGAGATTTCCTCGCCCGCGTCTACGGTGCTCCCCAGCTGCAGGTGGAGAAAGTGAGGACCAATGACCGGAAGGAGCTGGGGGAGGTGCGGGTGCAGTATACGGGCAGGGACAGCTTCAAGGCTTTCGCCAAGGCTCTGGGTGTCATGGATGACCTTAAGTCGGGGGTTCCGAGAGCTGGCTACCGGGGTATTGTCACCTTCCAGTTCCGGGGCCGCCGTGTCCACCTGGCGCCCCCACCGACGTGGGAGGGCTATGATCCTAGCTGGAATTAGCACCTGTCGACTGGAGACCTGCAGGCATGCAAGCTTCGACCATCATCATCATCATCATTGAGTTTGTAGCCTTAGACATGACTGTTCCTCAGTTCAAGTTGGGCACTTACGAGAAGACCGGTCTTGCTAGATTCTAATCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACCTTCGTTTGTGCGGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTTCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTSEQ ID NO155′TTCGAAGCTTCGCTAGCTCGGTGTCCCGATGTCSEQ ID NO165′GAATTCGAAGGGAAGATGAGGCTTCGGGAGCCSEQ ID NO175′CGTTCGCGACCGGAGGGGCCCGGCCGCCSEQ ID NO185′TCGATATCAAGCTTAGCTCGGTGTCCCGATGTCSEQ ID NO195′GAATTCGAACTTAAGATGGCCCTCTTTCTCAGTAAGSEQ ID NO20人类GalT1 cDNAATGAGGCTTCGGGAGCCGCTCCTGAGCGGCGCCGCGATGCCAGGCGCGTCCCTACAGCGGGCCTGCCGCCTGCTCGTGGCCGTCTGCGTCTGGCACCTTGGCGTCACCCTCGTTTACTACCTGGCTGGCCGCGACCTGAGCCGCCTGCCCCAACTGGTCGGAGTCTCCACACCGCTGCAGGGCGGCTCGAACAGTGCCGCCGCCATCGGGCAGTCCTCCGGGGAGCTCCGGACCGGAGGGGCCCGGCCGCCGCCTCCTCTAGGCGCCTCCTCCCAGCCGCGCCCGGGTGGCGACTCCAGCCCAGTCGTGGATTCTGGCCCTGGCCCCGCTAGCAACTTGACCTCGGTCCCAGTGCCCCACACCACCGCACTGTCGCTGCCCGCCTGCCCTGAGGAGTCCCCGCTGCTTGTGGGCCCCATGCTGATTGAGTTTAACATGCCTGTGGACCTGGAGCTCGTGGCAAAGCAGAACCCAAATGTGAAGATGGGCGGCCGCTATGCCCCCAGGGACTGCGTCTCTCCTCACAAGGTGGCCATCATCATTCCATTCCGCAACCGGCAGGAGCACCTCAAGTACTGGCTATATTATTTGCACCCAGTCCTGCAGCGCCAGCAGCTGGACTATGGCATCTATGTTATCAACCAGGCGGGAGACACTATATTCAATCGTGCTAAGCTCCTCAATGTTGGCTTTCAAGAAGCCTTGAAGGACTATGACTACACCTGCTTTGTGTTTAGTGACGTGGACCTCATTCCAATGAATGACCATAATGCGTACAGGTGTTTTTCACAGCCACGGCACATTTCCGTTGCAATGGATAAGTTTGGATTCAGCCTACCTTATGTTCAGTATTTTGGAGGTGTCTCTGCTCTAAGTAAACAACAGTTTCTAACCATCAATGGATTTCCTAATAATTATTGGGG
CTGGGGAGGAGAAGATGATGACATTTTTAACAGATTAGTTTTTAGAGGCATGTCTATATCTCGCCCAAATGCTGTGGTCGGGAGGTGTCGCATGATCCGCCACTCAAGAGACAAAAAAAATGAACCCAATCCTCAGAGGTTTGACCGAATTGCACACACAAAGGAGACAATGCTCTCTGATGGTTTGAACTCACTCACCTACCAGGTGCTGGATGTACAGAGATACCCATTGTATACCCAAATCACAGTGGACATCGGGACACCGAGCSEQ ID NO21人类GalT1蛋白质MRLREPLLSGAAMPGASLQRACRLLVAVCVWHLGVTLVYYLAGRDLSRLPQLVGVSTPLQGGSNSAAAIGQSSGELRTGGARPPPPLGASSQPRPGGDSSPVVDSGPGPASNLTSVPVPHTTALSLPACPEESPLLVGPMLIEFNMPVDLELVAKQNPNVKMGGRYAPRDCVSPHKVAIIIPFRNRQEHLKYWLYYLHPVLQRQQLDYGIYVINQAGDTIFNRAKLLNVGFQEALKDYDYTCFVFSDVDLIPMNDHNAYRCFSQPRHISVAMDKFGFSLPYVQYFGGVSALSKQQFLTINGFPNNYWGWGGEDDDIFNRLVFRGMSISRPNAVVGRCRMIRHSRDKKNEPNPQRFDRIAHTKETMLSDGLNSLTYQVLDVQRYPLYTQITVDIGTPS
序列表<110>罗兰德·孔特雷拉斯尼科·L·M·卡勒瓦特沃特·韦尔夫肯弗拉迪米尔·凯戈罗多夫<120>甲基营养型酵母中蛋白质糖基化修饰<130>17106<140>10/713,970<141>2003-11-14<160>21<170>PatentIn version 3.2<210>1<211>4<212>PRT<213>人工的序列<220>
<223>ER-定位信号<400>1His Asp Glu Leu1<210>2<211>2858<212>DNA<213>巴斯德毕赤酵母<400>2agatctgcct gacagcctta aagagcccgc taaaagaccc ggaaaaccga gagaactctg 60gattagcagt ctgaaaaaga atcttcactc tgtctagtgg agcaattaat gtcttagcgg120cacttcctgc tactccgcca gctactcctg aatagatcac atactgcaaa gactgcttgt180cgatgacctt ggggttattt agcttcaagg gcaatttttg ggacattttg gacacaggag240actcagaaac agacacagag cgttctgagt cctggtgctc ctgacgtagg cctagaacag300gaattattgg ctttatttgt ttgtccattt cataggcttg gggtaataga tagatgacag360agaaatagag aagacctaat attttttgtt catggcaaat cgcgggttcg cggtcgggtc420acacacggag aagtaatgag aagagctggt aatctggggt aaaagggttc aaaagaaggt480cgcctggtag ggatgcaata caaggttgtc ttggagttta cattgaccag atgatttggc540tttttctctg ttcaattcac atttttcagc gagaatcgga ttgacggaga aatggcgggg600tgtggggtgg atagatggca gaaatgctcg caatcaccgc gaaagaaaga ctttatggaa660tagaactact gggtggtgta aggattacat agctagtcca atggagtccg ttggaaaggt720aagaagaagc taaaaccggc taagtaacta gggaagaatg atcagacttt gatttgatga780
ggtctgaaaa tactctgctg ctttttcagt tgctttttcc ctgcaaccta tcattttcct 840tttcataagc ctgccttttc tgttttcact tatatgagtt ccgccgagac ttccccaaat 900tctctcctgg aacattctct atcgctctcc ttccaagttg cgccccctgg cactgcctag 960taatattacc acgcgactta tattcagttc cacaatttcc agtgttcgta gcaaatatca1020tcagccatgg cgaaggcaga tggcagtttg ctctactata atcctcacaa tccacccaga1080aggtattact tctacatggc tatattcgcc gtttctgtca tttgcgtttt gtacggaccc1140tcacaacaat tatcatctcc aaaaatagac tatgatccat tgacgctccg atcacttgat1200ttgaagactt tggaagctcc ttcacagttg agtccaggca ccgtagaaga taatcttcga1260agacaattgg agtttcattt tccttaccgc agttacgaac cttttcccca acatatttgg1320caaacgtgga aagtttctcc ctctgatagt tcctttccga aaaacttcaa agacttaggt1380gaaagttggc tgcaaaggtc cccaaattat gatcattttg tgatacccga tgatgcagca1440tgggaactta ttcaccatga atacgaacgt gtaccagaag tcttggaagc tttccacctg1500ctaccagagc ccattctaaa ggccgatttt ttcaggtatt tgattctttt tgcccgtgga1560ggactgtatg ctgacatgga cactatgtta ttaaaaccaa tagaatcgtg gctgactttc1620aatgaaacta ttggtggagt aaaaaacaat gctgggttgg tcattggtat tgaggctgat1680cctgatagac ctgattggca cgactggtat gctagaagga tacaattttg ccaatgggca1740attcagtcca aacgaggaca cccagcactg cgtgaactga ttgtaagagt tgtcagcacg1800actttacgga aagagaaaag cggttacttg aacatggtgg aaggaaagga tcgtggaagt1860gatgtgatgg actggacggg tccaggaata tttacagaca ctctatttga ttatatgact1920aatgtcaata caacaggcca ctcaggccaa ggaattggag ctggctcagc gtattacaat1980gccttatcgt tggaagaacg tgatgccctc tctgcccgcc cgaacggaga gatgttaaaa2040gagaaagtcc caggtaaata tgcacagcag gttgttttat gggaacaatt taccaacctg2100cgctccccca aattaatcga cgatattctt attcttccga tcaccagctt cagtccaggg2160attggccaca gtggagctgg agatttgaac catcaccttg catatattag gcatacattt2220gaaggaagtt ggaaggacta aagaaagcta gagtaaaata gatatagcga gattagagaa2280tgaatacctt cttctaagcg atcgtccgtc atcatagaat atcatggact gtatagtttt2340ttttttgtac atataatgat taaacggtca tccaacatct cgttgacaga tctctcagta2400cgcgaaatcc ctgactatca aagcaagaac cgatgaagaa aaaaacaaca gtaacccaaa2460caccacaaca aacactttat cttctccccc ccaacaccaa tcatcaaaga gatgtcggaa2520cacaaacacc aagaagcaaa aactaacccc atataaaaac atcctggtag ataatgctgg2580taacccgctc tccttccata ttctgggcta cttcacgaag tctgaccggt ctcagttgat2640caacatgatc ctcgaaatgg gtggcaagca tcgttccaga cctgcctcct ctggtagatg2700
gagtgttgtt tttgacaggg gattacaagt ctattgatga agatacccta aagcaactgg2760gggacgttcc aatatacaga gactccttca tctaccagtg ttttgtgcac aagacatctc2820ttcccattga cactttccga attgacaaga acgtcgac2858<210>3<211>404<212>PRT<213>巴斯德毕赤酵母<400>3Met Ala Lys Ala Asp Gly Ser Leu Leu Tyr Tyr Asn Pro His Asn Pro1 5 10 15Pro Arg Arg Tyr Tyr Phe Tyr Met Ala Ile Phe Ala Val Ser Val Ile20 25 30Cys Val Leu Tyr Gly Pro Ser Gln Gln Leu Ser Ser Pro Lys Ile Asp35 40 45Tyr Asp Pro Leu Thr Leu Arg Ser Leu Asp Leu Lys Thr Leu Glu Ala50 55 60Pro Ser Gln Leu Ser Pro Gly Thr Val Glu Asp Asn Leu Arg Arg Gln65 70 75 80Leu Glu Phe His Phe Pro Tyr Arg Ser Tyr Glu Pro Phe Pro Gln His85 90 95Ile Trp Gln Thr Trp Lys Val Ser Pro Ser Asp Ser Ser Phe Pro Lys100 105 110Asn Phe Lys Asp Leu Gly Glu Ser Trp Leu Gln Arg Ser Pro Asn Tyr115 120 125Asp His Phe Val Ile Pro Asp Asp Ala Ala Trp Glu Leu Ile His His130 135 140Glu Tyr Glu Arg Val Pro Glu Val Leu Glu Ala Phe His Leu Leu Pro145 150 155 160Glu Pro Ile Leu Lys Ala Asp Phe Phe Arg Tyr Leu Ile Leu Phe Ala165 170 175Arg Gly Gly Leu Tyr Ala Asp Met Asp Thr Met Leu Leu Lys Pro Ile180 185 190Glu Ser Trp Leu Thr Phe Asn Glu Thr Ile Gly Gly Val Lys Asn Asn195 200 205
Ala Gly Leu Val Ile Gly Ile Glu Ala Asp Pro Asp Arg Pro Asp Trp210 215 220His Asp Trp Tyr Ala Arg Arg Ile Gln Phe Cys Gln Trp Ala Ile Gln225 230 235 240Ser Lys Arg Gly His Pro Ala Leu Arg Glu Leu Ile Val Arg Val Val245 250 255Ser Thr Thr Leu Arg Lys Glu Lys Ser Gly Tyr Leu Asn Met Val Glu260 265 270Gly Lys Asp Arg Gly Ser Asp Val Met Asp Trp Thr Gly Pro Gly Ile275 280 285Phe Thr Asp Thr Leu Phe Asp Tyr Met Thr Asn Val Asn Thr Thr Gly290 295 300His Ser Gly Gln GlyIle Gly Ala Gly Ser Ala Tyr Tyr Asn Ala Leu305 310 315 320Ser Leu Glu Glu Arg Asp Ala Leu Ser Ala Arg Pro Asn Gly Glu Met325 330 335Leu Lys Glu Lys Val Pro Gly Lys Tyr Ala Gln Gln Val Val Leu Trp340 345 350Glu Gln Phe Thr Asn Leu Arg Ser Pro Lys Leu Ile Asp Asp Ile Leu355 360 365Ile Leu Pro Ile Thr Ser Phe Ser Pro Gly Ile Gly His Ser Gly Ala370 375 380Gly Asp Leu Asn His His Leu Ala Tyr Ile Arg His Thr Phe Glu Gly385 390 395 400Ser Trp Lys Asp<210>4<211>43<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>4ggaattcagc atggagtatg gatcatggag tccgttggaa agg 43
<210>5<211>27<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>5gccgctcgag ctagctttct ttagtcc 27<210>6<211>2875<212>DNA<213>人工的序列<220>
<223>质粒pGlycoSwitchM8的核苷酸序列<400>6agatctaaca tccataatcg atctaagcta tattcgccgt ttctgtcatt tgcgttttgt 60acggaccctc acaacaatta tcatctccaa aaatagacta tgatccattg acgctccgat 120cacttgattt gaagactttg gaagctcctt cacagttgag tccaggcacc gtagaagata 180atcttcgaag acaattggag tttcattttc cttaccgcag ttacgaacct tttccccaac 240atatttggca aacgtggaaa gtttctccct ctgatagttc ctttccgaaa aacttcaaag 300acttaggtga aagttggctg caaaggtccc caaattatga tcattttgtg atacccgatg 360atgcagcatg ggaacttatt caccatgaat acgaacgtgt accagaagtc ttggaagctt 420ttgattttaa cgacttttaa cgacaacttg agaagatcaa aaaacaacta attattcgcg 480aaacgaggaa ttcacgtggc ccagccggcc gtctcggatc ggtacctcga gccgcggcgg 540ccgccagctt tctagagaac aaaaactcat ctcagaagag gatctgaata gcgccgtcga 600ccatcatcat catcatcatt gagtttgtag ccttagacat gactgttcct cagttcaagt 660tgggcactta cgagaagacc ggtcttgcta gattctaatc aagaggatgt cagaatgcca 720tttgcctgag agatgcaggc ttcatttttg atactttttt atttgtaacc tatatagtat 780aggatttttt ttgtcatttt gtttcttctc gtacgagctt gctcctgatc agcctatctc 840gcagctgatg aatatcttgt ggtaggggtt tgggaaaatc attcgagttt gatgtttttc 900ttggtatttc ccactcctct tcagagtaca gaagattaag tgagaccttc gtttgtgcgg 960atcccccaca caccatagct tcaaaatgtt tctactcctt ttttactctt ccagattttc1020tcggactccg cgcatcgccg taccacttca aaacacccaa gcacagcata ctaaattttc1080cctctttctt cctctagggt gtcgttaatt acccgtacta aaggtttgga aaagaaaaaa1140gagaccgcct cgtttctttt tcttcgtcga aaaaggcaat aaaaattttt atcacgtttc1200tttttcttga aatttttttt tttagttttt ttctctttca gtgacctcca ttgatattta1260
agttaataaa cggtcttcaa tttctcaagt ttcagtttca tttttcttgt tctattacaa1320ctttttttac ttcttgttca ttagaaagaa agcatagcaa tctaatctaa ggggcggtgt1380tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg tgaggaacta1440aaccatggcc aagttgacca gtgccgttcc ggtgctcacc gcgcgcgacg tcgccggagc1500ggtcgagttc tggaccgacc ggctcgggtt ctcccgggac ttcgtggagg acgacttcgc1560cggtgtggtc cgggacgacg tgaccctgtt catcagcgcg gtccaggacc aggtggtgcc1620ggacaacacc ctggcctggg tgtgggtgcg cggcctggac gagctgtacg ccgagtggtc1680ggaggtcgtg tccacgaact tccgggacgc ctccgggccg gccatgaccg agatcggcga1740gcagccgtgg gggcgggagt tcgccctgcg cgacccggcc ggcaactgcg tgcacttcgt1800ggccgaggag caggactgac acgtccgacg gcggcccacg ggtcccaggc ctcggagatc1860cgtccccctt ttcctttgtc gatatcatgt aattagttat gtcacgctta cattcacgcc1920ctccccccac atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc1980ctatttattt ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc2040ttttttttct gtacagacgc gtgtacgcat gtaacattat actgaaaacc ttgcttgaga2100aggttttggg acgctcgaag gctttaattt gcaagctgga gaccaacatg tgagcaaaag2160gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc2220gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag2280gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga2340ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc2400aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg2460tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt2520ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca2580gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca2640ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag2700ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca2760agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg2820ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agatc 2875<210>7<211>6406<212>DNA<213>人工的序列<220>
<223>质粒pBlKanMX4KrehGalT的核苷酸序列
<400>7ctagtgcaca aacgaacgtc tcacttaatc ttctgtactc tgaagaggag tgggaaatac 60caagaaaaac atcaaactcg aatgattttc ccaaacccct accacaagat attcatcagc 120tgcgagatag gctgatcagg agcaagctcg tacgagaaga aacaaaatga caaaaaaaat 180cctatactat ataggttaca aataaaaaag tatcaaaaat gaagcctgca tctctcaggc 240aaatggcatt ctgacatcct cttgattaga atctagcaag accggtcttc tcgtaagtgc 300ccaacttgaa ctgaggaaca gtcatgtcta aggcgaatta tcaagcttag ctcggtgtcc 360cgatgtccac tgtgatttgg gtatacaatg ggtatctctg tacatccagc acctggtagg 420tgagtgagtt caaaccatca gagagcattg tctcctttgt gtgtgcaatt cggtcaaacc 480tctgaggatt gggttcattt tttttgtctc ttgagtggcg gatcatgcga cacctcccga 540ccacagcatt tgggcgagat atagacatgc ctctaaaaac taatctgtta aaaatgtcat 600catcttctcc tccccagccc caataattat taggaaatcc attgatggtt agaaactgtt 660gtttacttag agcagagaca cctccaaaat actgaacata aggtaggctg aatccaaact 720tatccattgc aacggaaatg tgccgtggct gtgaaaaaca cctgtacgca ttatggtcat 780tcattggaat gaggtccacg tcactaaaca caaagcaggt gtagtcatag tccttcaagg 840cttcttgaaa gccaacattg aggagcttag cacgattgaa tatagtgtct cccgcctggt 900tgataacata gatgccatag tccagctgct ggcgctgcag gactgggtgc aaataatata 960gccagtactt gaggtgctcc tgccggttgc ggaatggaat gatgatggcc accttgtgag1020gagagacgca gtccctgggg gcatagcggc cgcccatctt cacatttggg ttctgctttg1080ccacgagctc caggtccaca ggcatgttaa actcaatcag catggggccc acaagcagcg1140gggactcctc agggcaggcg ggcagcgaca gtgcggtggt gtggggcact gggaccgagg1200tcaagttgct agcggggcca gggccagaat ccacgactgg gctggagtcg ccacccgggc1260gcggctggga ggaggcgcct agaggaggcg gcggccgggc ccctccggtc gccggcgggg1320catctgcctt ttcagcggca gctttcagag ccttggattc ttcatccatg gcttcggagt1380cttcgcttgc ctctgaattc agagcacttt gctctaattt tttagcatca ttttcctcag1440agatgacttg ttgttcaggg gatatagatc ctgaggtaaa atcaaatgca gcggagatgg1500aactcggaat atattgctga gttctactgt tggaattcaa tgttaggagg agaacaataa1560ccgcacctgc aatgacggta aatctcaaca gtctcttact gagaaagagg gccatcttaa1620gttcgaataa ttagttgttt tttgatcttc tcaagttgtc gttaaaagtc gttaaaatca1680aaagcttgtc aattggaacc agtcgcaatt atgaaagtaa gctaataatg atgataaaaa1740aaaaggttta agacagggca gcttccttct gtttatatat tgctgtcaag taggggttag1800aacagttaaa ttttgatcat gaacgttagg ctatcagcag tattcccacc agaatcttgg1860aagcatacaa tgtggagaca atgcataatc atccaaaaag cgggtgtttc cccatttgcg1920
tttcggcaca ggtgcaccgg ggttcagaag cgatagagag actgcgctaa gcattaatga1980gattattttt gagcattcgt caatcaatac caaacaagac aaacggtatg ccgacttttg2040gaagtttctt tttgaccaac tggccgttag catttcaacg aaccaaactt agttcatctt2100ggatgagatc acgcttttgt catattaggt tccaagacag cgtttaaact gtcagttttg2160ggccatttgg ggaacatgaa actatttgac cccacactca gaaagccctc atctggagtg2220atgttcgggt gtaatgcgga gcttgttgca ttcggaaata aacaaacatg aacctcgcca2280ggggggccag gatagacagg ctaataaagt catggtgtta gtagcctaat agaaggaatt2340ggaatgagcg agctccaatc aagcccaata actgggctgg tttttcgatg gcaaaagtgg2400gtgttgagga gaagaggagt ggaggtcctg cgtttgcaac ggtctgctgc tagtgtatcc2460cctcctgttg cgtttggcac ttatgtgtga gaatggacct gtggatgtcg gatggcaaaa2520aggtttcatt caacctttcg tctttggatg ttagctagcc ggctgcatta atgaatcggc2580caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac2640tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata2700cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa2760aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct2820gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa2880agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg2940cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca3000cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa3060ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg3120gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg3180tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg3240acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc3300tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag3360attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac3420gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc3480ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag3540taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt3600ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag3660ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca3720gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact3780ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca3840
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg3900tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc3960atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg4020gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca4080tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt4140atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc4200agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc4260ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca4320tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa4380aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatgcttc4440tagtggtagg aattaattct gtaccggttt acagaaggac gactcttgat gcgccaacca4500cagtgacaat agacatagag gaaatgacaa aaggattatg cgaggatgct gctggagacg4560attcaaagtt tagtttagaa aggtcctcca tttatgctga tagaatacta gatacccgtg4620aactttgtct caggagatcc gcatcagacg aaggatgttc cgacctgcaa ataatcgaag4680aagagacccc taggcagttg gtgagcttac atgagaagtc taaactatct tggacccgct4740ggttttataa agggttcgtt aggaatgcgt taactaccat tccagcaaca tccgtggggc4800ttctggtgtt tgaaatactg cgtcaaaaat tgagcgatga aattgaagat cgattcagtt4860gaatcgcccg aaacaattga tcccctgtac atacttgtaa tttacctcag aatgggttaa4920ttaaggcgcg ccagatctgt ttagcttgcc tcgtccccgc cgggtcaccc ggccagcgac4980atggaggccc agaataccct ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt5040gactgtcgcc cgtacattta gcccatacat ccccatgtat aatcatttgc atccatacat5100tttgatggcc gcacggcgcg aagcaaaaat tacggctcct cgctgcagac ctgcgagcag5160ggaaacgctc ccctcacaga cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat5220ataaaaggtt aggatttgcc actgaggttc ttctttcata tacttccttt taaaatcttg5280ctaggataca gttctcacat cacatccgaa cataaacaac catgggtaag gaaaagactc5340acgtttcgag gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg5400ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg5460cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga5520tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc5580gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca gcattccagg5640tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc5700gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc5760
tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg5820agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct5880caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg5940ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc6000ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc6060aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg6120agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt6180atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt6240ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg6300cgtcaatcgt atgtgaatgc tggtcgctct actgctgtcg attcgatact aacgccgcca6360tccagtgtcg aaaacgagct cgaattcatc gatgatatca gatcca 6406<210>8<211>1785<212>DNA<213>人工的序列<220>
<223>pGAPZMFManHDEL中的MFManHDEL融合体的ORF序列<400>8atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt120tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat180aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta240tctctcgaga aaagagaggc tgaagctgaa ttcgccacaa aacgtggatc tcccaaccct300acgagggcgg cagcagtcaa ggccgcattc cagacgtcgt ggaacgctta ccaccatttt360gcctttcccc atgacgacct ccacccggtc agcaacagct ttgatgatga gagaaacggc420tggggctcgt cggcaatcga tggcttggac acggctatcc tcatggggga tgccgacatt480gtgaacacga tccttcagta tgtaccgcag atcaacttca ccacgactgc ggttgccaac540caaggatcct ccgtgttcga gaccaacatt cggtacctcg gtggcctgct ttctgcctat600gacctgttgc gaggtccttt cagctccttg gcgacaaacc agaccctggt aaacagcctt660ctgaggcagg ctcaaacact ggccaacggc ctcaaggttg cgttcaccac tcccagcggt720gtcccggacc ctaccgtctt cttcaaccct actgtccgga gaagtggtgc atctagcaac780aacgtcgctg aaattggaag cctggtgctc gagtggacac ggttgagcga cctgacggga840aacccgcagt atgcccagct tgcgcagaag ggcgagtcgt atctcctgaa tccaaaggga900agcccggagg catggcctgg cctgattgga acgtttgtca gcacgagcaa cggtaccttt960
caggatagca gcggcagctg gtccggcctc atggacagct tctacgagta cctgatcaag1020atgtacctgt acgacccggt tgcgtttgca cactacaagg atcgctgggt ccttggtgcc1080gactcgacca ttgggcatct cggctctcac ccgtcgacgc gcaaggactt gacctttttg1140tcttcgtaca acggacagtc tacgtcgcca aactcaggac atttggccag ttttggcggt1200ggcaacttca tcttgggagg cattctcctg aacgagcaaa agtacattga ctttggaatc1260aagcttgcca gctcgtactt tggcacgtac acccagacgg cttctggaat cggccccgaa1320ggcttcgcgt gggtggacag cgtgacgggc gccggcggct cgccgccctc gtcccagtcc1380gggttctact cgtcggcagg attctgggtg acggcaccgt attacatcct gcggccggag1440acgctggaga gcttgtacta cgcataccgc gtcacgggcg actccaagtg gcaggacctg1500gcgtgggaag cgttgagtgc cattgaggac gcatgccgcg ccggcagcgc gtactcgtcc1560atcaacgacg tgacgcaggc caacggcggg ggtgcctctg acgatatgga gagcttctgg1620tttgccgagg cgctcaagta tgcgtacctg atctttgcgg aggagtcgga tgtgcaggtg1680caggccaccg gcgggaacaa atttgtcttt aacacggagg cgcacccctt tagcatccgt1740tcatcatcac gacggggcgg ccaccttgct cacgacgagt tgtaa1785<210>9<211>5485<212>DNA<213>人工的序列<220>
<223>质粒pGlycoSwitch M5的核苷酸序列<400>9agatctaaca tccataatcg atctaagcta tattcgccgt ttctgtcatt tgcgttttgt 60acggaccctc acaacaatta tcatctccaa aaatagacta tgatccattg acgctccgat120cacttgattt gaagactttg gaagctcctt cacagttgag tccaggcacc gtagaagata180atcttcgaag acaattggag tttcattttc cttaccgcag ttacgaacct tttccccaac240atatttggca aacgtggaaa gtttctccct ctgatagttc ctttccgaaa aacttcaaag300acttaggtga aagttggctg caaaggtccc caaattatga tcattttgtg atacccgatg360atgcagcatg ggaacttatt caccatgaat acgaacgtgt accagaagtc ttggaagctc420tagatgctca ccgcaatgct gttaaggttc gtatggagaa actgggactt atttaattat480ttagagattt taacttacat ttagattcga tagatccaca ggacgggtgt ggtcgccatg540atcgcgtagt cgatagtggc tccaagtagc gaagcgagca ggactgggcg gcggccaaag600cggtcggaca gtgctccgag aacgggtgcg catagaaatt gcatcaacgc atatagcgct660agcagcacgc catagtgact ggcgatgctg tcggaatgga cgatatcccg caagaggccc720ggcagtaccg gcataaccaa gcctatgcct acagcatcca gggtgacggt gccgaggatg780
acgatgagcg cattgttaga tttcatacac ggtgcctgac tgcgttagca atttaactgt 840gataaactac cgcattaaag ctgatctttt ttgtagaaat gtcttggtgt cctcgtccaa 900tcaggtagcc atctctgaaa tatctggctc cgttgcaact ccgaacgacc tgctggcaac 960gtaaaattct ccggggtaaa acttaaatgt ggagtaatgg aaccagaaac gtctcttccc1020ttctctctcc ttccaccgcc cgttaccgtc cctaggaaat tttactctgc tggagagctt1080cttctacggc ccccttgcag caatgctctt cccagcatta cgttgcgggt aaaacggagg1140tcgtgtaccc gacctagcag cccagggatg gaaaagtccc ggccgtcgct ggcaataata1200gcgggcggac gcatgtcatg agattattgg aaaccaccag aatcgaatat aaaaggcgaa1260cacctttccc aattttggtt tctcctgacc caaagacttt aaatttaatt tatttgtccc1320tatttcaatc aattgaacaa ctatttcgcg aaacgatgag atttccttca atttttactg1380ctgttttatt cgcagcatcc tccgcattag ctgctccagt caacactaca acagaagatg1440aaacggcaca aattccggct gaagctgtca tcggttactc agatttagaa ggggatttcg1500atgttgctgt tttgccattt tccaacagca caaataacgg gttattgttt ataaatacta1560ctattgccag cattgctgct aaagaagaag gggtatctct cgagaaaaga gaggctgaag1620ctgaattcgc cacaaaacgt ggatctccca accctacgag ggcggcagca gtcaaggccg1680cattccagac gtcgtggaac gcttaccacc attttgcctt tccccatgac gacctccacc1740cggtcagcaa cagctttgat gatgagagaa acggctgggg ctcgtcggca atcgatggct1800tggacacggc tatcctcatg ggggatgccg acattgtgaa cacgatcctt cagtatgtac1860cgcagatcaa cttcaccacg actgcggttg ccaaccaagg atcctccgtg ttcgagacca1920acattcggta cctcggtggc ctgctttctg cctatgacct gttgcgaggt cctttcagct1980ccttggcgac aaaccagacc ctggtaaaca gccttctgag gcaggctcaa acactggcca2040acggcctcaa ggttgcgttc accactccca gcggtgtccc ggaccctacc gtcttcttca2100accctactgt ccggagaagt ggtgcatcta gcaacaacgt cgctgaaatt ggaagcctgg2160tgctcgagtg gacacggttg agcgacctga cgggaaaccc gcagtatgcc cagcttgcgc2220agaagggcga gtcgtatctc ctgaatccaa agggaagccc ggaggcatgg cctggcctga2280ttggaacgtt tgtcagcacg agcaacggta cctttcagga tagcagcggc agctggtccg2340gcctcatgga cagcttctac gagtacctga tcaagatgta cctgtacgac ccggttgcgt2400ttgcacacta caaggatcgc tgggtccttg gtgccgactc gaccattggg catctcggct2460ctcacccgtc gacgcgcaag gacttgacct ttttgtcttc gtacaacgga cagtctacgt2520cgccaaactc aggacatttg gccagttttg gcggtggcaa cttcatcttg ggaggcattc2580tcctgaacga gcaaaagtac attgactttg gaatcaagct tgccagctcg tactttggca2640cgtacaccca gacggcttct ggaatcggcc ccgaaggctt cgcgtgggtg gacagcgtga2700
cgggcgccgg cggctcgccg ccctcgtccc agtccgggtt ctactcgtcg gcaggattct2760gggtgacggc accgtattac atcctgcggc cggagacgct ggagagcttg tactacgcat2820accgcgtcac gggcgactcc aagtggcagg acctggcgtg ggaagcgttg agtgccattg2880aggacgcatg ccgcgccggc agcgcgtact cgtccatcaa cgacgtgacg caggccaacg2940gcgggggtgc ctctgacgat atggagagct tctggtttgc cgaggcgctc aagtatgcgt3000acctgatctt tgcggaggag tcggatgtgc aggtgcaggc caccggcggg aacaaatttg3060tctttaacac ggaggcgcac ccctttagca tccgttcatc atcacgacgg ggcggccacc3120ttgctcacga cgagttgtaa tctagggcgg ccgccagctt tctagagaac aaaaactcat3180ctcagaagag gatctgaata gcgccgtcga ccatcatcat catcatcatt gagtttgtag3240ccttagacat gactgttcct cagttcaagt tgggcactta cgagaagacc ggtcttgcta3300gattctaatc aagaggatgt cagaatgcca tttgcctgag agatgcaggc ttcatttttg3360atactttttt atttgtaacc tatatagtat aggatttttt ttgtcatttt gtttcttctc3420gtacgagctt gctcctgatc agcctatctc gcagctgatg aatatcttgt ggtaggggtt3480tgggaaaatc attcgagttt gatgtttttc ttggtatttc ccactcctct tcagagtaca3540gaagattaag tgagaccttc gtttgtgcgg atcccccaca caccatagct tcaaaatgtt3600tctactcctt ttttactctt ccagattttc tcggactccg cgcatcgccg taccacttca3660aaacacccaa gcacagcata ctaaattttc cctctttctt cctctagggt gtcgttaatt3720acccgtacta aaggtttgga aaagaaaaaa gagaccgcct cgtttctttt tcttcgtcga3780aaaaggcaat aaaaattttt atcacgtttc tttttcttga aatttttttt tttagttttt3840ttctctttca gtgacctcca ttgatattta agttaataaa cggtcttcaa tttctcaagt3900ttcagtttca tttttcttgt tctattacaa ctttttttac ttcttgttca ttagaaagaa3960agcatagcaa tctaatctaa ggggcggtgt tgacaattaa tcatcggcat agtatatcgg4020catagtataa tacgacaagg tgaggaacta aaccatggcc aagttgacca gtgccgttcc4080ggtgctcacc gcgcgcgacg tcgccggagc ggtcgagttc tggaccgacc ggctcgggtt4140ctcccgggac ttcgtggagg acgacttcgc cggtgtggtc cgggacgacg tgaccctgtt4200catcagcgcg gtccaggacc aggtggtgcc ggacaacacc ctggcctggg tgtgggtgcg4260cggcctggac gagctgtacg ccgagtggtc ggaggtcgtg tccacgaact tccgggacgc4320ctccgggccg gccatgaccg agatcggcga gcagccgtgg gggcgggagt tcgccctgcg4380cgacccggcc ggcaactgcg tgcacttcgt ggccgaggag caggactgac acgtccgacg4440gcggcccacg ggtcccaggc ctcggagatc cgtccccctt ttcctttgtc gatatcatgt4500aattagttat gtcacgctta cattcacgcc ctccccccac atccgctcta accgaaaagg4560aaggagttag acaacctgaa gtctaggtcc ctatttattt ttttatagtt atgttagtat4620
taagaacgtt atttatattt caaatttttc ttttttttct gtacagacgc gtgtacgcat4680gtaacattat actgaaaacc ttgcttgaga aggttttggg acgctcgaag gctttaattt4740gcaagctgga gaccaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg4800ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac4860gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg4920gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct4980ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg5040tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct5100gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac5160tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt5220tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc5280tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca5340ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat5400ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac5460gttaagggat tttggtcatg agatc 5485<210>10<211>441<212>PRT<213>酿酒酵母<400>10Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala1 5 10 15Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr20 25 30Gln Gln Tyr Ile Pro Ser Ser Ile Ala Ala Phe Asp Phe Thr Ser Gly35 40 45Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala Lys50 55 60Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser Glu65 70 75 80Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys Ala85 90 95Asp Ala Pro Ile Asp Thr Lys Thr Thr Met Asp Tyr Ile Thr Pro Ser
100 105 110Phe Ala Asn Lys Ala Gly Lys Pro Lys Ala Cys Tyr Val Thr Leu Val115 120 125Arg Asn Lys Glu Leu Lys Gly Leu Leu Ser Ser Ile Lys Tyr Val Glu130 135 140Asn Lys Ile Asn Lys Lys Phe Pro Tyr Pro Trp Val Phe Leu Asn Asp145 150 155 160Glu Pro Phe Thr Glu Glu Phe Lys Glu Ala Val Thr Lys Ala Val Ser165 170 175Ser Glu Val Lys Phe Gly Ile Leu Pro Lys Glu His Trp Ser Tyr Pro180 185 190Glu Trp Ile Asn Gln Thr Lys Ala Ala Glu Ile Arg Ala Asp Ala Ala195 200 205Thr Lys Tyr Ile Tyr Gly Gly Ser Glu Ser Tyr Arg His Met Cys Arg210 215 220Tyr Gln Ser Gly Phe Phe Trp Arg His Glu Leu Leu Glu Glu Tyr Asp225 230 235 240Trp Tyr Trp Arg Val Glu Pro Asp Ile Lys Leu Tyr Cys Asp Ile Asn245 250 255Tyr Asp Val Phe Lys Trp Met Gln Glu Asn Glu Lys Val Tyr Gly Phe260 265 270Thr Val Ser Ile His Glu Tyr Glu Val Thr Ile Pro Thr Leu Trp Gln275 280 285Thr Ser Met Asp Phe Ile Lys Lys Asn Pro Glu Tyr Leu Asp Glu Asn290 295 300Asn Leu Met Ser Phe Leu Ser Asn Asp Asn Gly Lys Thr Tyr Asn Leu305 310 315 320Cys His Phe Trp Ser Asn Phe Glu Ile Ala Asn Leu Asn Leu Trp Arg325 330 335Ser Pro Ala Tyr Arg Glu Tyr Phe Asp Thr Leu Asp His Gln Gly Gly340 345 350Phe Phe Tyr Glu Arg Trp Gly Asp Ala Pro Val His Ser Ile Ala Ala
355 360 365Ala Leu Phe Leu Pro Lys Asp Lys Ile His Tyr Phe Ser Asp Ile Gly370 375 380Tyr His His Pro Pro Tyr Asp Asn Cys Pro Leu Asp Lys Glu Val Tyr385 390 395 400Asn Ser Asn Asn Cys Glu Cys Asp Gln Gly Asn Asp Phe Thr Phe Gln405 410 415Gly Tyr Ser Cys Gly Lys Glu Tyr Tyr Asp Ala Gln Gly Leu Val Lys420 425 430Pro Lys Asn Trp Lys Lys Phe Arg Glu435 440<210>11<211>100<212>PRT<213>酿酒酵母<400>11Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala1 5 10 15Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr20 25 30Gln Gln Tyr Ile Pro Ser Ser Ile Ser Ala Ala Phe Asp Phe Thr Ser35 40 45Gly Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala50 55 60Lys Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser65 70 75 80Glu Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys85 90 95Ala Asp Ala Pro100<210>12<211>2670<212>DNA<213>人<400>12
atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg 60aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc 120agcgctctcg atggcgaccc cgccagcctc acccgggaag tgattcgcct ggcccaagac 180gccgaggtgg agctggagcg gcagcgtggg ctgctgcagc agatcgggga tgccctgtcg 240agccagcggg ggagggtgcc caccgcggcc cctcccgccc agccgcgtgt gcctgtgacc 300cccgcgccgg cggtgattcc catcctggtc atcgcctgtg accgcagcac tgttcggcgc 360tgcctggaca agctgctgca ttatcggccc tcggctgagc tcttccccat catcgttagc 420caggactgcg ggcacgagga gacggcccag gccatcgcct cctacggcag cgcggtcacg 480cacatccggc agcccgacct gagcagcatt gcggtgccgc cggaccaccg caagttccag 540ggctactaca agatcgcgcg ccactaccgc tgggcgctgg gccaggtctt ccggcagttt 600cgcttccccg cggccgtggt ggtggaggat gacctggagg tggccccgga cttcttcgag 660tactttcggg ccacctatcc gctgctgaag gccgacccct ccctgtggtg cgtctcggcc 720tggaatgaca acggcaagga gcagatggtg gacgccagca ggcctgagct gctctaccgc 780accgactttt tccctggcct gggctggctg ctgttggccg agctctgggc tgagctggag 840cccaagtggc caaaggcctt ctgggacgac tggatgcggc ggccggagca gcggcagggg 900cgggcctgca tacgccctga gatctcaaga acgatgacct ttggccgcaa gggtgtgagc 960cacgggcagt tctttgacca gcacctcaag tttatcaagc tgaaccagca gtttgtgcac1020ttcacccagc tggacctgtc ttacctgcag cgggaggcct atgaccgaga tttcctcgcc1080cgcgtctacg gtgctcccca gctgcaggtg gagaaagtga ggaccaatga ccggaaggag1140ctgggggagg tgcgggtgca gtatacgggc agggacagct tcaaggcttt cgccaaggct1200ctgggtgtca tggatgacct taagtcgggg gttccgagag ctggctaccg gggtattgtc1260accttccagt tccggggccg ccgtgtccac ctggcgcccc caccgacgtg ggagggctat1320gatcctagct ggaatatgct gaagaagcag tctgcagggc ttgtgctgtg gggcgctatc1380ctctttgtgg cctggaatgc cctgctgctc ctcttcttct ggacgcgccc agcacctggc1440aggccaccct cagtcagcgc tctcgatggc gaccccgcca gcctcacccg ggaagtgatt1500cgcctggccc aagacgccga ggtggagctg gagcggcagc gtgggctgct gcagcagatc1560ggggatgccc tgtcgagcca gcgggggagg gtgcccaccg cggcccctcc cgcccagccg1620cgtgtgcctg tgacccccgc gccggcggtg attcccatcc tggtcatcgc ctgtgaccgc1680agcactgttc ggcgctgcct ggacaagctg ctgcattatc ggccctcggc tgagctcttc1740cccatcatcg ttagccagga ctgcgggcac gaggagacgg cccaggccat cgcctcctac1800ggcagcgcgg tcacgcacat ccggcagccc gacctgagca gcattgcggt gccgccggac1860caccgcaagt tccagggcta ctacaagatc gcgcgccact accgctgggc gctgggccag1920
gtcttccggc agtttcgctt ccccgcggcc gtggtggtgg aggatgacct ggaggtggcc1980ccggacttct tcgagtactt tcgggccacc tatccgctgc tgaaggccga cccctccctg2040tggtgcgtct cggcctggaa tgacaacggc aaggagcaga tggtggacgc cagcaggcct2100gagctgctct accgcaccga ctttttccct ggcctgggct ggctgctgtt ggccgagctc2160tgggctgagc tggagcccaa gtggccaaag gccttctggg acgactggat gcggcggccg2220gagcagcggc aggggcgggc ctgcatacgc cctgagatct caagaacgat gacctttggc2280cgcaagggtg tgagccacgg gcagttcttt gaccagcacc tcaagtttat caagctgaac2340cagcagtttg tgcacttcac ccagctggac ctgtcttacc tgcagcggga ggcctatgac2400cgagatttcc tcgcccgcgt ctacggtgct ccccagctgc aggtggagaa agtgaggacc2460aatgaccgga aggagctggg ggaggtgcgg gtgcagtata cgggcaggga cagcttcaag2520gctttcgcca aggctctggg tgtcatggat gaccttaagt cgggggttcc gagagctggc2580taccggggta ttgtcacctt ccagttccgg ggccgccgtg tccacctggc gcccccaccg2640acgtgggagg gctatgatcc tagctggaat 2670<210>13<211>445<212>PRT<213>人<400>13Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu1 5 10 15Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro20 25 30Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala35 40 45Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu50 55 60Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser65 70 75 80Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg85 90 95Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala100 105 110Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr115 120 125
Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly130 135 140His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr145 150 155 160His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His165 170 175Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala180 185 190Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val195 200 205Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala210 215 220Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala225 230 235 240Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu245 250 255Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu260 265 270Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp275 280 285Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile290 295 300Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser305 310 315 320His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln325 330 335Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu340 345 350Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu355 360 365Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val370 375 380
Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala385 390 395 400Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr405 410 415Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala420 425 430Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn435 440 445<210>14<211>4677<212>DNA<213>人工的序列<220>
<223>质粒pPIC6AkrecoGnTI的核苷酸序列<400>14gaaatttttt tttttagttt ttttctcttt cagtgacctc cattgatatt taagttaata 60aacggtcttc aatttctcaa gtttcagttt catttttctt gttctattac aacttttttt 120acttcttgtt cattagaaag aaagcatagc aatctaatct aaggggcggt gttgacaatt 180aatcatcggc atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg 240ccaagccttt gtctcaagaa gaatccaccc tcattgaaag agcaacggct acaatcaaca 300gcatccccat ctctgaagac tacagcgtcg ccagcgcagc tctctctagc gacggccgca 360tcttcactgg tgtcaatgta tatcatttta ctgggggacc ttgtgcagaa ctcgtggtgc 420tgggcactgc tgctgctgcg gcagctggca acctgacttg tatcgtcgcg atcggaaatg 480agaacagggg catcttgagc ccctgcggac ggtgccgaca ggtgcttctc gatctgcatc 540ctgggatcaa agccatagtg aaggacagtg atggacagcc gacggcagtt gggattcgtg 600aattgctgcc ctctggttat gtgtgggagg gctaagcact tcgtggccga ggagcaggac 660tgacacgtcc gacggcggcc cacgggtccc aggcctcgga gatccgtccc ccttttcctt 720tgtcgatatc atgtaattag ttatgtcacg cttacattca cgccctcccc ccacatccgc 780tctaaccgaa aaggaaggag ttagacaacc tgaagtctag gtccctattt atttttttat 840agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt ttctgtacag 900acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt gagaaggttt tgggacgctc 960gaaggcttta atttgcaagc tggagaccaa catgtgagca aaaggccagc aaaaggccag1020gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca1080tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca1140
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg1200atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag1260gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt1320tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca1380cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg1440cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt1500tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc1560cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg1620cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg1680gaacgaaaac tcacgttaag ggattttggt catgagatca gatctaacat ccaaagacga1740aaggttgaat gaaacctttt tgccatccga catccacagg tccattctca cacataagtg1800ccaaacgcaa caggagggga tacactagca gcagaccgtt gcaaacgcag gacctccact1860cctcttctcc tcaacaccca cttttgccat cgaaaaacca gcccagttat tgggcttgat1920tggagctcgc tcattccaat tccttctatt aggctactaa caccatgact ttattagcct1980gtctatcctg gcccccctgg cgaggttcat gtttgtttat ttccgaatgc aacaagctcc2040gcattacacc cgaacatcac tccagatgag ggctttctga gtgtggggtc aaatagtttc2100atgttcccca aatggcccaa aactgacagt ttaaacgctg tcttggaacc taatatgaca2160aaagcgtgat ctcatccaag atgaactaag tttggttcgt tgaaatgcta acggccagtt2220ggtcaaaaag aaacttccaa aagtcggcat accgtttgtc ttgtttggta ttgattgacg2280aatgctcaaa aataatctca ttaatgctta gcgcagtctc tctatcgctt ctgaaccccg2340gtgcacctgt gccgaaacgc aaatggggaa acacccgctt tttggatgat tatgcattgt2400ctccacattg tatgcttcca agattctggt gggaatactg ctgatagcct aacgttcatg2460atcaaaattt aactgttcta acccctactt gacagcaata tataaacaga aggaagctgc2520cctgtcttaa accttttttt ttatcatcat tattagctta ctttcataat tgcgactggt2580tccaattgac aagcttttga ttttaacgac ttttaacgac aacttgagaa gatcaaaaaa2640caactaatta ttcgaaacga ggaattatcc atattcgcaa gcagttccac tcgaaagcat2700ggccctcttt ctcagtaaga gactgttgag atttaccgtc attgcaggtg cggttattgt2760tctcctccta acattgaatt ccaacagtag aactcagcaa tatattccga gttccatctc2820cgctgcattt gattttacct caggatctat atcccctgaa caacaagtca tctctgagga2880aaatgatgct aaaaaattag agcaaagtgc tctgaattca gaggcaagcg aagactccga2940agccatggat gaagaatcca aggctctgaa agctgccgct gaaaaggcag atgccccgcc3000ggcggtgatt cccatcctgg tcatcgcctg tgaccgcagc actgttcggc gctgcctgga3060
caagctgctg cattatcggc cctcggctga gctcttcccc atcatcgtta gccaggactg3120cgggcacgag gagacggccc aggccatcgc ctcctacggc agcgcggtca cgcacatccg3180gcagcccgac ctgagcagca ttgcggtgcc gccggaccac cgcaagttcc agggctacta3240caagatcgcg cgccactacc gctgggcgct gggccaggtc ttccggcagt ttcgcttccc3300cgcggccgtg gtggtggagg atgacctgga ggtggccccg gacttcttcg agtactttcg3360ggccacctat ccgctgctga aggccgaccc ctccctgtgg tgcgtctcgg cctggaatga3420caacggcaag gagcagatgg tggacgccag caggcctgag ctgctctacc gcaccgactt3480tttccctggc ctgggctggc tgctgttggc cgagctctgg gctgagctgg agcccaagtg3540gccaaaggcc ttctgggacg actggatgcg gcggccggag cagcggcagg ggcgggcctg3600catacgccct gagatctcaa gaacgatgac ctttggccgc aagggtgtga gccacgggca3660gttctttgac cagcacctca agtttatcaa gctgaaccag cagtttgtgc acttcaccca3720gctggacctg tcttacctgc agcgggaggc ctatgaccga gatttcctcg cccgcgtcta3780cggtgctccc cagctgcagg tggagaaagt gaggaccaat gaccggaagg agctggggga3840ggtgcgggtg cagtatacgg gcagggacag cttcaaggct ttcgccaagg ctctgggtgt3900catggatgac cttaagtcgg gggttccgag agctggctac cggggtattg tcaccttcca3960gttccggggc cgccgtgtcc acctggcgcc cccaccgacg tgggagggct atgatcctag4020ctggaattag cacctgtcga ctggagacct gcaggcatgc aagcttcgac catcatcatc4080atcatcattg agtttgtagc cttagacatg actgttcctc agttcaagtt gggcacttac4140gagaagaccg gtcttgctag attctaatca agaggatgtc agaatgccat ttgcctgaga4200gatgcaggct tcatttttga tactttttta tttgtaacct atatagtata ggattttttt4260tgtcattttg tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagctgatga4320atatcttgtg gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc4380cactcctctt cagagtacag aagattaagt gagaccttcg tttgtgcgga tcccccacac4440accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc4500gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc4560ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc4620gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttctt 4677<210>15<211>33<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物
<400>15ttcgaagctt cgctagctcg gtgtcccgat gtc 33<210>16<211>32<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>16gaattcgaag ggaagatgag gcttcgggag cc32<210>17<211>28<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>17cgttcgcgac cggaggggcc cggccgcc 28<210>18<211>33<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>18tcgatatcaa gcttagctcg gtgtcccgat gtc 33<210>19<211>36<212>DNA<213>人工的序列<220>
<223>寡核苷酸引物<400>19gaattcgaac ttaagatggc cctctttctc agtaag36<210>20<211>1191<212>DNA<213>人<400>20atgaggcttc gggagccgct cctgagcggc gccgcgatgc caggcgcgtc cctacagcgg 60gcctgccgcc tgctcgtggc cgtctgcgtc tggcaccttg gcgtcaccct cgtttactac 120ctggctggcc gcgacctgag ccgcctgccc caactggtcg gagtctccac accgctgcag 180
ggcggctcga acagtgccgc cgccatcggg cagtcctccg gggagctccg gaccggaggg 240gcccggccgc cgcctcctct aggcgcctcc tcccagccgc gcccgggtgg cgactccagc 300ccagtcgtgg attctggccc tggccccgct agcaacttga cctcggtccc agtgccccac 360accaccgcac tgtcgctgcc cgcctgccct gaggagtccc cgctgcttgt gggccccatg 420ctgattgagt ttaacatgcc tgtggacctg gagctcgtgg caaagcagaa cccaaatgtg 480aagatgggcg gccgctatgc ccccagggac tgcgtctctc ctcacaaggt ggccatcatc 540attccattcc gcaaccggca ggagcacctc aagtactggc tatattattt gcacccagtc 600ctgcagcgcc agcagctgga ctatggcatc tatgttatca accaggcggg agacactata 660ttcaatcgtg ctaagctcct caatgttggc tttcaagaag ccttgaagga ctatgactac 720acctgctttg tgtttagtga cgtggacctc attccaatga atgaccataa tgcgtacagg 780tgtttttcac agccacggca catttccgtt gcaatggata agtttggatt cagcctacct 840tatgttcagt attttggagg tgtctctgct ctaagtaaac aacagtttct aaccatcaat 900ggatttccta ataattattg gggctgggga ggagaagatg atgacatttt taacagatta 960gtttttagag gcatgtctat atctcgccca aatgctgtgg tcgggaggtg tcgcatgatc1020cgccactcaa gagacaaaaa aaatgaaccc aatcctcaga ggtttgaccg aattgcacac1080acaaaggaga caatgctctc tgatggtttg aactcactca cctaccaggt gctggatgta1140cagagatacc cattgtatac ccaaatcaca gtggacatcg ggacaccgag c 1191<210>21<211>397<212>PRT<213>人<400>21Met Arg Leu Arg Glu Pro Lau Leu Ser Gly Ala Ala Met Pro Gly Ala1 5 10 15Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Val Trp His20 25 30Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg35 40 45Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn50 55 60Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly65 70 75 80Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly85 90 95
G1y Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn100 105 110Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala115 120 125Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe130 135 140Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val145 150 155 160Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys165 170 175Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr180 185 190Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr195 200 205Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg Ala210 215 220Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp Tyr225 230 235 240Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp His245 250 255Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala Met260 265 270Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly Val275 280 285Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro Asn290 295 300Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg Leu305 310 315 320Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly Arg325 330 335Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn PrG340 345 350
Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser Asp355 360 365Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr Pro370 375 380Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser385 390 39权利要求
1.一种基因工程化甲基营养型酵母菌株,其产生包含哺乳动物样N-多糖结构的糖蛋白,其中所述哺乳动物样N-多糖含有五个或更少甘露糖残基和至少一个N-乙酰葡糖胺残基(GlcNAc),所述N-乙酰葡糖胺残基与甘露糖残基和末端半乳糖残基连接。
2.权利要求1的菌株,其中所述哺乳动物样N-多糖包含GalGlcNAcMan5GlcNAc2。
3.权利要求1的菌株,其中所述菌株是念珠菌属、汉逊酵母属、球拟酵母属或毕赤酵母属的菌株。
4.权利要求3的菌株,其中所述菌株是巴斯德毕赤酵母菌株。
5.权利要求2的菌株,其中所述菌株表达(1)α-1,2-甘露糖苷酶或其功能部分;(2)N-乙酰葡糖胺基转移酶I(或GnTI)或其功能部分;和(3)β-1,4-半乳糖基转移酶(GalT)或其功能部分。
6.权利要求2的菌株,其中灭活基因组OCH1基因。
7.权利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分来源于哺乳动物物种或真菌物种。
8.权利要求7的菌株,其中所述哺乳动物物种选自小鼠、兔或人。
9.权利要求7的菌株,其中所述真菌物种选自曲霉或瑞氏木霉。
10.权利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分靶向所述菌株的ER或高尔基体。
11.权利要求10的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分被工程化为包含ER驻留信号。
12.权利要求11的菌株,其中所述ER驻留信号包含HDEL(SEQ ID NO1)。
13.权利要求5的菌株,其中所述GnTI或所述其功能部分来源于选自兔、大鼠、人、植物、昆虫、线虫和原生动物的物种。
14.权利要求13的菌株,其中所述GnTI或所述其功能部分来源于人。
15.权利要求5的菌株,其中所述GnTI或所述其功能部分靶向所述菌株的高尔基体。
16.根据权利要求15的菌株,其中所述GnTI或所述其功能部分被工程化为包含高尔基体驻留信号。
17.权利要求16的菌株,其中所述高尔基体驻留信号包含SEQ ID NO11。
18.权利要求5的菌株,其中所述GalT或所述其功能部分来源于选自兔、大鼠、人、植物、昆虫和线虫的物种。
19.权利要求18的菌株,其中所述GalT或所述其功能部分来源于人。
20.权利要求5的菌株,其中所述GalT或所述其功能部分靶向所述菌株的高尔基体。
21.权利要求20的菌株,其中所述GalT或所述其功能部分被工程化为包含高尔基体驻留信号。
22.权利要求21的菌株,其中所述高尔基体驻留信号包含SEQ ID NO11。
23.权利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分从选自下组的启动子表达巴斯德毕赤酵母的AOXI启动子、AOXII启动子、GAP启动子和FLD启动子。
24.权利要求5的菌株,其中所述GnTI或所述其功能部分从选自下组的启动子表达巴斯德毕赤酵母的AOXI启动子、AOXII启动子、GAP启动子和FLD启动子。
25.权利要求5的菌株,其中所述GalT或所述其功能部分从选自下组的启动子表达巴斯德毕赤酵母的AOXI启动子、AOXII启动子、GAP启动子和FLD启动子。
26.权利要求5的菌株,其中所述α-1,2-甘露糖苷酶或所述其功能部分从巴斯德毕赤酵母的AOXI启动子表达,所述GnTI或所述其功能部分从巴斯德毕赤酵母的GAP启动子表达。
27.权利要求1的菌株,其中所述哺乳动物样多糖是类似人的多糖。
28.一种重组生产具有哺乳动物样N-多糖结构的糖蛋白的方法,包括用编码所述糖蛋白的核苷酸序列转化根据权利要求1-2或5-6中任一项的菌株,并使所述糖蛋白在所述菌株中表达。
29.权利要求28的方法,其中所述糖蛋白是来源于细菌、真菌、病毒或哺乳动物的蛋白质。
30.权利要求28的方法,其中所述糖蛋白是免疫球蛋白或其片段。
31.由权利要求28的方法生产的糖蛋白。
32.权利要求31的糖蛋白,其中所述糖蛋白是免疫球蛋白或其片段。
33.一种在甲基营养型酵母菌株中重组生产具有哺乳动物样N-多糖结构的糖蛋白的方法,包括用编码所述糖蛋白的核苷酸序列转化所述菌株;修饰所述菌株使得修饰的菌株表达(1)α-1,2-甘露糖苷酶或其功能部分、(2)N-乙酰葡糖胺基转移酶I(或GnTI)或其功能部分和(3)β-1,4-半乳糖基转移酶(GalT)或其功能部分,并且其中修饰的菌株中基因组OCH1基因被灭活;在修饰的菌株中生产所述糖蛋白。
34.权利要求33的方法,其中所述糖蛋白选自来源于细菌、真菌、病毒或哺乳动物的蛋白质。
35.权利要求33的方法,其中所述糖蛋白是免疫球蛋白或其片段。
36.由权利要求33的方法生产的糖蛋白。
37.权利要求36的糖蛋白,其中所述糖蛋白是免疫球蛋白或其片段。
38.包含编码GalT的核苷酸序列的载体,所述核苷酸序列与启动子序列和3′终止序列可操作的连接,其中所述启动子序列和所述3′终止序列在甲基营养型酵母菌株中是有功能的,以实现所述GalT在所述菌株中的表达。
39.一种试剂盒,包含(1)包含编码α-1,2-甘露糖苷酶或其功能部分的核苷酸序列的载体;(2)包含编码GnTI或其功能部分的核苷酸序列的载体;和(3)包含编码GalT或其功能部分的核苷酸序列的载体,其中每种载体能够指导所编码蛋白质在甲基营养型酵母菌株中的表达。
40.权利要求39的试剂盒,还包含能够破坏所述甲基营养型酵母菌株的基因组OCH1基因的载体。
41.权利要求39的试剂盒,还包含编码糖蛋白的载体,所述糖蛋白对所述甲基营养型酵母菌株是异源的。
42.权利要求39的试剂盒,还包含所述甲基营养型酵母菌株。
全文摘要
本发明涉及用于生产具有哺乳动物样糖基化的糖蛋白的方法和基因工程化甲基营养型酵母菌株。本发明还涉及用于产生能生产具有哺乳动物样糖基化的糖蛋白的甲基营养型酵母菌株的载体。本发明还提供由所述基因工程化甲基营养型酵母菌株生产的糖蛋白。
文档编号C12N15/81GK1894398SQ200480037294
公开日2007年1月10日 申请日期2004年11月12日 优先权日2003年11月14日
发明者罗兰德·孔特雷拉斯, 尼科·L·M·卡勒瓦特, 沃特·韦尔夫肯, 弗拉迪米尔·凯戈罗多夫 申请人:研究技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1