专利名称:构建表达预定糖链修饰糖蛋白工程菌株的方法
技术领域:
本发明涉及蛋白质糖基化工程领域,本发明涉及借助基因工程手段构建表达预定糖链 修饰的工程菌株的方法,本发明还涉及对糖蛋白N-糖基化修饰糖链的设计与改造,根据需要, 所述糖蛋白可以含有结构为Man5GlcNAc2 、 GalGlcNAcMan5GlcNAc2禾B /或 SAGalGlcNAcMan5GlcNAc2的修饰糖链。
背景技术:
蛋白质药物一直是全球开发的热点。目前已有多种重组蛋白在临床治疗中发挥着重要的 作用,如胰岛素、生长激素等。这类重组蛋白大多属于糖蛋白,即在多肽骨架的一个或多个 位点上共价结合有寡糖的糖基化修饰蛋白。糖蛋白中糖链的主要功能有两大类a)参与分子
内作用,如蛋白质的正确折叠、细胞内定位、生物活性、溶解度、抗原性、生物半寿期、蛋
白酶敏感性等;b)参与分子间作用,如趋靶于溶酶体、趋靶于组织、细胞-细胞黏附和结合病 原体等。归根结底,糖链影响着蛋白质的整体构象,从而影响由构象决定的所有功能。
糖蛋白上的糖链从连接方式上可分为两类 一类是与天冬氨酰(Asn)残基连接,即N陽
连接糖蛋白,另一类与丝氨酸或苏氨酸连接,称为o-连接糖蛋白。
N-糖链通常都有一个五糖核心[Manal—6(Manal—3)Man卩l—4GlcNAc卩1—4GlcNAc]-((Man) 3 (GlcNAc) 2),根据它们的外层链结构的不同,可分为高甘露糖型(Highmannose type),杂合型(Hybridtype)与复合型(Complextype)。如图1所示,三者之间的区别在于高甘 露糖型只含有多个(x连接的甘露糖残基,而复杂型具有岩藻糖(Fuc)、半乳糖(Gal)和唾液 酸(SA)为组分的糖链天线,杂合型则兼具二者特点。许多研究表明三种类型的糖链具有 共同的生物合成起源,即高甘露糖聚合物前体。该前体并非直接在蛋白质上合成出来的,而 是在脂质载体多砲醇(Dol)上合成寡糖链后转运到蛋白质受体上。
前体物(Glc) 3 (Man) 9 (GlcNAc) 2从脂供体在穿过内质网粗面(RER)膜时转到新生 肽的Asn上,加工过程是以一个特异a1—2葡萄糖苷酶去除葡萄糖末端开始的。然后内部的 两个葡萄糖残基被a1—3葡萄糖苷酶II切除,这些葡萄糖苷酶和al,2-甘露糖苷酶都位于RER 上。有人推测,葡萄糖修饰的目的是为了更有效地将蛋白从RER运到高尔基(Golgi)体。
糖蛋白到达Golgi体后,那些最终成为复合性结构的寡糖,通过N-己酰氨基葡萄糖转移 酶I添加N-已酰葡萄糖胺残基,由Golgi体内的a-甘露糖酶II切除两个甘露糖残基,随后由GlcNAc转移酶加入天线上的GlcNAc残基。同时,Fuc转运酶可能转运一个Fuc到糖链的 GlcNAc上。复合型寡糖的合成最后步骤发生在Golgi体的反面囊腔中。此时Gal或SA转移 酶催化添加Gal和SA。最后新合成的糖蛋白离开Golgi体,运送到最终目的地。
最终的寡糖结构在很大程度上取决于糖蛋白在处理过程中与糖基化酶和糖基转移酶的作 用顺序,以及它们特异性作用,许多不同的酶催化不同的反应,最后形成最终的寡糖结构。
酵母是目前应用最广泛的外源蛋白表达系统之一((J.M. Cregg, 2000 FEMS Microbiology Reviews 24(1) 45-66)。该系统兼有原核表达系统和真核表达系统的优点易于操作培养、快 速生长、表达量高,同时又能对外源真核基因进行正确翻译和翻译后加工与修饰,并能对许 多蛋白质产物进行分泌表达,使产物易于提纯。己用该系统成功表达了数百种来自病毒、细菌、 真菌、动植物和人的蛋白,如胰岛素、白介素、人血清白蛋白、肿瘤坏死因子、乙肝表面抗 原、水蛭素等等。
虽然酵母和哺乳动物具有相同的糖基化起始步骤及内质网中的修饰过程,但由于酵母高 尔基体中常产生高甘露糖型糖链并且缺少部分合成复杂型糖链的所需的系列酶,所以酵母工 程菌株所表达糖蛋白的N-糖基化修饰主要为高甘露糖型。众所周知,高甘露糖型糖链糖蛋白 具有很强的免疫原性,且在人体中半衰期短,易被清除。同时,不同类型的糖基化修饰对治 疗性蛋白质的性质与疗效有很大影响。因此利用基因工程手段对酵母工程菌株进行遗传改造, 使其产生具有不同类型糖基化修饰的糖蛋白,对于研究其性质、功能与疗效尤为有用。
Hamilton等人利用组合文库筛选的方法对毕赤酵母表达系统N-糖基化进行了人源化改 造(S.R. Hamilton, Science 313,1441-1443),但该方法是对野生型酵母菌株进行改造,由于文 库筛选方法本身成本较高,操作复杂,不适合对已构建好的工程菌株进行改造,本发明从这 一要求出发,利用不同定位信号引导,同时借助各种筛选标志,以相对简便的方法对不同的 糖蛋白表达工程菌株进行改造,使其产生的糖蛋白能够满足不同的目的要求。
发明内容
本发明涉及蛋白质糖基化工程领域,本发明涉及对工程菌株进行遗传改造的方法,以使 其表达的异源糖蛋白N-糖基化修饰具有期望的糖链类型,所述糖链的末端糖基为选自甘露 糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
本申请中的术语"工程菌株"包括但不限于酵母工程菌株,例如,稳定表达异源蛋白的 酿酒酵母、毕赤酵母或汉逊酵母。
本发明目的在于提供构建表达预定糖链修饰糖蛋白工程菌株的方法。
一方面,本发明提供了一种构建表达预定糖链修饰糖蛋白工程菌株的方法,该方法包括下 列步骤a)以编码糖苷酶cx-1,2-甘露糖苷酶或其功能结构域的编码序列替换a-1,3-甘露 糖基转移酶或a-1,6-甘露糖基转移酶基因的内部编码序列,构建同源重组突变基因序列; b)将步骤a)获得的重组突变基因序列插入具有筛选标志序列的载体中,得到重组质粒;c) 将N-乙酰氨基葡萄糖转移酶I和P-l,4-半乳糖基转移酶的编码序列的编码序列分别与各自定 位信号编码序列相连接,得到两种融合基因序列;d)将步骤c)获得的两种融合基因序列插入 具有筛选标志序列的载体中,得到重组质粒e)将a-2,6-唾液酸转移酶编码序列和唾液酸 转运蛋白编码序列连接,得到融合基因序列;f)向载体中插入唾液酸合成酶编码序列使与载 体内的筛选标志编码序列相连接,然后再向载体中插入步骤e)获得的融合基因序列,得到重 组质粒;g)将(i)步骤a)得到的重组质粒,(ii)步骤a)和步骤b)得到的重组质粒,或者(iii) 步骤a)、 b)和c)得到的重组质粒,导入工程菌株,借助筛选标志筛选发生表型改变的工程菌 株;h)在培养基中对所述工程菌株进行培养和诱导表达,收集上清中的糖蛋白并对其N-糖基 化修饰糖链进行分析,确认工程菌株表达的糖蛋白N-糖基化修饰为预定糖链。
一个实施方案中,其中所述的a-l,2-甘露糖苷酶编码序列为SEQIDNO: l。
一个实施方案中,其中所述的N-乙酰氨基葡萄糖转移酶I及定位信号的编码序列为SEQ ID NO: 2。
一个实施方案中,其中所述的P-1,4-半乳糖基转移酶I及定位信号的编码序列为SEQ ID NO:3。
一个实施方案中,其中所述的a-2,6-唾液酸酶和唾液酸转运蛋白的编码序列为SEQIDNO:4。
一个实施方案中,其中所述的唾液酸合成酶的编码序列为SEQIDNO: 5。 本发明中,所述的预定糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种 或多种。
本发明中,其中所述的预定糖链的结构为选自下列其中的一种或多种Man5GlcNAc2、 GalGlcNAcMan5GlcNAc2和SAGalGlcNAcMan5GlcNAc2。
一方面,本发明提供了一种构建表达低甘露糖型糖链糖蛋白的工程菌株的方法,该方法 包括通过基因工程手段对工程菌株进行改造,使其表达的异源糖蛋白的糖链由原来的高甘露 糖型糖链变为免疫原性较低的短甘露糖型糖链,其特征在于所述短甘露糖型糖链的结构为 Man5GlcNAc2。
在本发明的一个实施方案中,构建异源糖蛋白表达工程菌株,使其基因组a-l,6-甘露糖基 转移酶失活,同时工程菌株获得a-l,2-甘露糖苷酶活性。
具体而言,以a-l,2-甘露糖苷酶与筛选标志的编码序列替换a-l,6-甘露糖基转移酶和/或 a-l,3甘露糖基转移酶基因的编码序列,构建两侧与基因组ct-l,6-糖基转移酶和/或a-l,3糖基 转移酶基因同源,而内部编码序列被a-l,2-甘露糖苷酶编码序列取代的同源重组突变序列, 将突变序列导入工程菌株,通过筛选标志筛选发生同源重组的工程菌株。发生同源重组指的 是工程菌株基因组上a-l,6-甘露糖基转移酶基因序列被外源插入序列所取代,从而使所述工 程菌株失去a-l,6-甘露糖基转移酶活的同时获得了 a-l,2-甘露糖苷酶活性。
另一方面,本发明提供了一种构建表达杂合型糖链糖蛋白的工程菌株的方法,该方法包 括在前述构建的短甘露糖型修饰糖蛋白表达工程菌株的基础上,通过基因工程手段进一歩对 其进行改造,使其表达的异源糖蛋白的糖链由原来的高甘露糖型糖链或短甘露糖型糖链变为 杂合型糖链,其特征在于所述杂合型糖链的结构为GalGlcNAcMan5GlcNAc2。
在本发明的一个实施方案中,其中所述的基因工程手段为引入N-乙酰氨基葡萄糖转移酶 I和β-l,4-半乳糖基转移酶活性。
具体而言为,将N-乙酰氨基葡萄糖转移酶I与其定位信号的编码序列相连接,插入含有 筛选标志基因序列的载体;将β-l,4-半乳糖基转移酶与其定位信号的编码序列相连接,插入 相应载体后切下含有启动子和编码序列部分,插入前述构建的含有N-乙酰氨基葡萄糖转移酶 I的载体,构建重组质粒,导入前述短甘露糖型工程菌株,筛选具有筛选标志表型的重组菌株, 使其获得N-乙酰氨基葡萄糖转移酶I和β-l,4-半乳糖基转移酶活性。
另一方面,本发明提供了一种构建表达复合型糖链糖蛋白的工程菌株的方法,该方法包 括在前述构建的杂合型糖链糖蛋白的工程菌株的基础上,通过基因工程手段进一步对其进行 改造,使其表达的异源糖蛋白的糖链由原来的高甘露糖型糖链或短甘露糖型糖链或杂合型糖 链变为复合糖链,其特征在于所述复合型糖链的结构为SAGalGlcNAcMan5GlcNAc2。
在本发明的一个实施方案中,其中所述的基因工程手段为引入a-2,6-唾液酸转移酶和唾液 酸合成酶活性,使其产生的糖蛋白糖基化修饰具有糖链末端为唾液酸的复合型结构。
具体而言为,将a-2,6-唾液酸转移酶与唾液酸转运蛋白的编码序列相连接,插入含有筛选 标志序列的载体;将唾液酸合成酶编码序列与载体中筛选标志的编码序列相连接,构建重组 质粒,导入前述杂合型工程菌株,筛选具有筛选标志表型的重组菌株,使其获得a-2,6-唾液 酸转移酶和唾液酸合成酶活性。
另一方面,本发明提供了用上述方法生产的能够表达预定糖链修饰糖蛋白的工程菌株。 其中所述的预定糖链类型为短甘露糖型糖链、杂合型糖链或复合型糖链,所述糖链的末端糖 基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
图1描述用于同源重组引入a-l,2-甘露糖苷酶基因,同时失活基因组a-l,6-糖基转移酶基 因的重组质粒构建策略。
图2描述根据本发明所述方法改造后,p-IFN/GS115表达工程菌株所产生的P-IFN糖链 的质谱分析图,1904位置的峰对应于SAGalGlcNAcMan5GlcNAc2。
除非本文另有定义,本发明相关使用的科学和技术术语具有本领域技术人员通常理解的 含义。本发明的方法和技术通常根据本领域众所周知的常规方法进行。通常,与本文所述相 关使用的命名,以及本文所述的生物化学、酶学、分子和细胞生物学、微生物学、遗传学以 及蛋白质和核酸化学杂交技术及电泳分析技术是本领域众所周知的而且普遍使用的。除非另 有说明,本发明的方法和技术通常按照本技术领域众所周知以及更为具体的参考文献中所记 载的常规方法进行。参见例如Sambrook等,Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989); Introduction to Glycobiology, Maureen E. Taylor, Kurt Drickamer, Oxford Univ. Press(2003);
除非另有说明,下列术语应被理解为如下含义
N-糖基化修饰指包含N-乙酰葡萄糖胺残基的糖链与多肽链中天冬酰胺(Asn)残基的酰 胺氮相连接,糖链的主要组分包括葡萄糖、甘露糖、半乳糖、岩藻糖、N-乙酰葡萄糖胺、N-乙酰半乳糖胺和唾液酸。糖基化修饰主要在内质网(ER)腔与翻译同时进行,并在高尔基体 中继续反应成N-糖基化蛋白。
N-糖基化修饰类型指糖蛋白中与多肽链中Asn相连的外部糖链类型。外部糖链类型主要 有高甘露糖型(High mannose type),杂合型(Hybrid type)与复合型(Complex type)三种。
本文使用的术语,"基因序列"是指具有预定功能的DNA序列,可以是基因组中含有基 因外元与内元的DNA序列,可以是编码或不编码氨基酸的DNA序列,可以是构成载体元件 的人工DNA序列。
本文使用的术语,"编码序列"是指能按照密码子规则翻译成预定氨基酸序列的DNA序列。
本发明的术语,"定位信号"是指能使蛋白质锚定在内质网、高尔基体或高尔基体外侧网 络中预定位置的多肽序列。所述多肽序列可分为如下三类a)N-末端序列,该序列编码胞质 尾(ct)、跨膜功能结构域(tmd)以及部分或全部的茎区(sr),其共同或独立地将蛋白质锚 定在高尔其体内;b)回收信号,其通常位于C-端,例如HDEL或KDEL四肽;和c)源自 各种蛋白质跨膜区的序列,例如定位于高尔基体的核糖体转运蛋白。
本文使用的术语,"载体"是指能够转运已经与其连接的另一基因序列的DNA分子。载 体的一种类型是"质粒",其是环状双链的DNA环,其可连接其它DNA片段成双链环状DNA。 某些载体可以在其导入的宿主细胞中自主复制,其它载体可在导入宿主细胞后整合到宿主细
胞的基因组中,并随宿主基因组一起复制。此外,载体还含有预定的控制序列。己有多种载 体商品化并可应用细菌、病毒、真菌、植物和动物宿主细胞,例如Invitrogen公司的系列载 体。
本发明的术语,"筛选标志"是指赋予宿主细胞抗药性或补足宿主细胞代谢缺陷的基因序 列。筛选标志的存在用于后续的转化子筛选。例如在酵母中,可有的筛选标志包括HIS4,GENETICN,ZEO,BLA,URA3,URA5,bLASTICIDIN基因。多种筛选标志是已知的并已应用 于细菌、病毒、真菌、植物和动物宿主细胞。
本发明的术语"工程菌株",包括但不限于,能产生某种预定蛋白质的工程化菌株,其稳 定表达所述蛋白质,所述蛋白质具有某种预定的应用价值。所述工程菌株可以通过诱变筛选, 也可以通过基因工程手段建立。多种工程菌株可由商业上获得或可釆用标准技术制备。
改造工程菌株蛋白糖基化修饰类型
本发明的一个目的是提供构建工程菌株的方法,将其表达的异源糖蛋白的高甘露糖型糖 链改造成免疫原性较低的短甘露糖型糖链的方法,其特征在于糖蛋白的修饰糖链的结构为 Maii5GlcNAc2结构。
根据本发明,以基因重组方式对异源糖蛋白表达工程菌株进行改造,向基因组中原01-1,6-糖基转移酶或a-l,3甘露糖基转移酶编码序列位置处插入a-l,2-甘露糖苷酶编码序列,破坏工 程菌株a-l,6-糖基转移酶或a-l,3甘露糖基转移酶活性的同时,获得了 a-l,2-甘露糖苷酶活性。
本发明的一个实施方案中,以a-l,2-甘露糖苷酶与筛选标志的编码序列替换a-l,6-甘露糖 基转移酶基因内部的编码序列。
通过PCR方法从工程菌株中获得a-l,6-甘露糖基转移酶编码序列的两侧基因片段,其中上游片段的3'端保留a-l,6-甘露糖基转移酶的跨膜区部分;在去掉自身跨膜区的α-l,2-甘露糖 苷酶编码序列的C端引入筛选标志,然后在此序列的两侧分别与a-l,6-甘露糖基转移酶上、 下游的侧翼片段相连,设计上确保α-l,2-甘露糖苷酶与原α-l,6-甘露糖基转移酶的跨膜区融合, 构建重组质粒并转化工程菌株。利用筛选标志和PCR方法筛选发生同源重组的工程菌株,最 后借助分析手段对异源表达糖蛋白的糖链结构鉴定进行确认。
用于遗传改造的a-l,2-甘露糖苷酶基因选自哺乳动物如人、小鼠,植物如大豆或真菌如黑 曲霉或里氏木霉,优选里氏木霉α-l,2-甘露糖苷酶基因,优选根据密码子偏嗜性优化的序列 如SEO IDNO.l;
所述a-l,6-甘露糖基转移酶侧翼片段,通过PCR方法从工程菌株的基因组获得。跨膜序 列前保留核苷酸长度100bp以上,优选500bp以上,更优选900bp以上,插入序列后保留核 苷酸长度100bp以上,优选400bp以上。
所述的筛选标志选自///W、 G£A^77C/W、 Z£0、 S丄丄WMJ、 W A5、 S丄AS77C/D/A^, 优选G£7V£77C/iV。
所述载体为整合型质粒载体,例如美国Promega公司(Promega, USA)的系列载体。
工程菌株包括但不限于,酵母工程菌株例如酿酒酵母和毕赤酵母表达工程菌株,优选 GS115表达工程菌株。
导入工程菌株的方法,可以使用任何方便的DNA转化方法,例如电穿孔、PEG-氯化锂或 原生质球法。
筛选除利用筛选标志获得相应表型外,还要对工程菌株通过PCR鉴定和异源糖蛋白糖链 结构分析进行确认。筛选方法可通过一系列表型富集和/或排除步骤来进行。例如,可通过特 异性结合N-寡糖的凝集素,对具有正确糖基化表型的菌株加以富集;随后,可采用多种分析 方法对糖蛋白的糖链结构进行分析,例如荧光测定法。可选地,采用本领域已知技术分离并 纯化糖蛋白,使用诸如内切-e-N-乙酰葡萄糖胺糖苷酶(New England Biolabs)从糖蛋白上切 下糖链,然后通过毛细管电泳或质谱或其它适宜的方法对其加以分析。
本发明进一步提供将异源表达糖蛋白的高甘露糖型糖链改造成杂合型糖链的方法,其特 征在于具有GalGlcNAcMan5GlcNAc2结构。
根据本发明,在构建前述短甘露糖型修饰糖蛋白表达工程菌株的基础上,进一步引入N-乙酰氨基葡萄糖转移酶I和P-l,4-半乳糖基转移酶活性。
本发明的一个实施方案中,合成N-乙酰氨基葡萄糖转移酶I与其定位信号的融合编码序 列,其中定位信号位于酶编码序列的N-端。将合成序列插入含有筛选标志基因序列的载体; 合成卩-l,4-半乳糖基转移酶与其定位信号的融合编码序列定位信号位于酶编码序列的C-端, 插入相应载体后切下含有启动子和融合序列部分,插入前述构建的含有N-乙酰氨基葡萄糖转 移酶I融合序列的载体,构建重组质粒,导入前述短甘露糖型工程菌株,筛选具有筛选标志 表型的重组菌株,使其获得N-乙酰氨基葡萄糖转移酶I和P-l,4-半乳糖基转移酶活性。
所述N-乙酰氨基葡萄糖转移酶I基因选自哺乳动物、人、昆虫和植物。优选地,将N-乙 酰氨基葡萄糖转移酶I基因与早期高尔基体定位信号编码序列相连接,优选的定位信号为 MNN9,优选人工合成根据密码子偏嗜性的融合序列如SEOIDN0.2。
所述P-l,4-半乳糖基转移酶基因选自哺乳动物、人、昆虫和植物。优选地,将P-l,4-半乳 糖基将转移酶基因与中期高尔基体定位信号编码序列相连接,优选的定位信号为HDEL,优 选人工合成根据密码子偏嗜性的融合序列如SEO IDN0.3。
所述筛选标志选自<sequence>see original document page 11</sequence>
所述载体为整合型质粒载体,例如美国Invitrogen公司的系列载体,优选酵母表达载体, 更优选毕赤酵母表达载体,更优选pGAPZA(Invitrogen, USA)。
本发明进一步提供将异源表达糖蛋白的具有复合型糖链修饰的方法,其特征在于具有 SAGalGlcNAcMan5GlcNAc2结构。
根据本发明,在构建前述杂合型工程菌株的基础上,进一步获得a-2,6-唾液酸转移酶和唾 液酸合成酶活性,使其产生的糖蛋白糖基化修饰具有糖链末端为唾液酸的复合型结构。
本发明的一个实施方案中,合成a-2,6-唾液酸转移酶与唾液酸转运蛋白的融合编码序列, 插入含有筛选标志序列的载体;将唾液酸合成酶编码序列与载体中筛选标志的编码序列相连 接,构建重组质粒,导入前述杂合型工程菌株,筛选具有筛选标志表型的重组菌株,使其获 得a-2,6-唾液酸转移酶和唾液酸合成酶活性。
所述唾液酸转运蛋白和a-2,6-唾液酸转移酶基因选自哺乳动物、人、昆虫、植物和光合细 菌。优选a-2,6-唾液酸转移酶自身C端含有定位于晚期高尔基体序列的大鼠a-2,6-唾液酸转移 酶,优选地,人工合成根据密码子偏嗜性的a-2,6-唾液酸转移酶和唾液酸转运蛋白的融合序 列如SEO IDN0.4。
所述唾液酸合成酶基因选自哺乳动物、人、昆虫、植物和真菌。优选小鼠唾液酸合成酶。 优选地,人工合成根据密码子偏嗜性的唾液酸合成酶编码序列如SEOIDN0.5。
所述筛选标志选自HIS4,GENETICIN,ZEO,BLA,URA3,URA5,BLASTICIDIN,优选BLASTICIDIN.
所述载体为整合型质粒载体,例如美国Invitrogen公司的系列载体,优选酵母表达载体, 更优选毕赤酵母表达载体,更优选pPIC6(Invitrogen, USA)。
本发明的另一个目的是提供构建预定修饰糖链工程菌株的方法,其特征在于可设计产生 的糖蛋白,其糖基化修饰糖链具有满足预定需要的结构。
根据本发明,可选择性地,分别或同时破坏工程菌株的a-l,6-甘露糖基转移酶和/或(x-l,3 甘露糖基转移酶活性,分别或同时向工程菌株中引入a-l,2-甘露糖苷酶、N-乙酰氨基葡萄糖 转移酶I和P-l,4-半乳糖基转移酶、a-2,6-唾液酸转移酶和唾液酸合成本科活性,使其产生的 糖蛋白糖基化修饰糖链根据需要,所述糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾 液酸中的一种或多种。
预定结构的糖基化修饰糖链在治疗性糖蛋白的靶向中尤为有用。不同的糖链修饰在体内 的组织分布有很大差异。例如甘露糖可靶向溶酶体,而半乳糖可靶向肝脏。此外,糖基化的 末端糖链还影响到糖蛋白的免疫原性和体内半衰期等。
本发明通过下列实施例进一步举例说明。
实施例
实施例1 a-l,6-甘露糖基转移酶的失活与a-l,2-甘露糖苷酶的引入
本实施例通过在a-l,6-甘露糖基转移酶基因中插入a-l,2-甘露糖苷酶和GENETICIN编码 序列,然后转化毕赤酵母工程菌株IFN/GS115,通过筛选抗GENETICIN表型的工程菌株, 得到a-l,6-甘露糖基转移酶失活而同时拥有a-l,2-甘露糖苷酶活性的工程菌株,其表达的糖蛋 白具有结构为Man5GlcNAc2的修饰糖链。
材料与方法
毕赤酵母工程菌株GS115购自Invitrogen公司,表达糖基化IFN的GS115工程菌株可从
菌种保藏中心购买,也可采用Invi加gen公司的Original尸fc/^fl Expression Kit,按照其相关
专利美国专利号4,879,231、 4,882,279、 4,885,242、 4,895,800、 4,929,555自行构建,本发明
在此一并引入作为参考。本实施例中,使用EasySelect Pichia Expression Kit试剂盒(购自Invitrogen公司),按照专利CN1325651C中酵母表达部分的操作方法(在此引入作为参考), 以所述试剂盒中的pPICZaA载体自行构建了能够表达带有His标签的P-干扰素的工程菌株。
载体pPIC9K、 pPIC9和pPIC6均购自Invitrogen公司。
1)重组质粒的构建
本发明人根据酵母密码子偏嗜性设计并合成了 a-l,2-甘露糖苷酶的编码基因,其核苷酸序 列如SeqIDNO.l所示,将合成序列克隆于pUC19载体中,得到质粒pUC19-M。
根据GenBank中报道的毕赤酵母a-l,6-甘露糖基转移酶(ocW )基因序列(E12456)、 Hypocrea jecorina a-l,2-甘露糖苷酶编码序列(AF212153)和质粒pPIC9K中的kanamycin编 码序列(赋予大肠杆菌卡那抗性,而使酵母具有Geneticin抗性的基因,位于载体的4928-5743 位,815bp),设计4对寡核苷酸引物P1和P2 、 P3和P4, P5和P6、 P7和P8。
Pl: 5'-TCAGAAACAGACACAGAGCGTTCTG-3', (OCH1基因F1的正向引物),
P2: 5'-AGCGTTCCAAGAAGTTTGGAATATTTTTGGAGATGATATAATTGTTGTG-3'(OCH1基因F1的反向引物);
P35'-CACAACAATTATCATCTCCAAAAATATTCCAAACTTCTTGAACGCT-3'(甘露糖苷酶编码序列M的正向引物),
P45'-CGTTTCCCGTTGAATATGGCTCATTAGGCTAAGTGACCACCTCTACG-3'( 甘露糖苷酶编码序列M的反向引物);
霉素的正向引物)
P45'-CGTAGAGTGTCACTTAGCCTAAATGAGCCATATTCAACGGGAAACG-3' (卡那霉素的正向引物)
P6: 5'-ATCTATTTTACTCTAGCTTTCTTTAGAAAAACTCATCGAGCATC-3'(卡那霉素的反 向引物);
P7: 5'-GATGCTCGATGAGTTTTTCTAAAGAAAGCTAGAGTAAAATAGAT-3, (OCH1基因 F2的正向引物),
P8: 5'-GTCGACGTTCTTGTCAATTCGGAAAG-3'(OCHl基因F2的反向向引物)。
采用基因组提取试剂盒(购自Invitrogen公司)提取GS115工程菌株基因组DNA。在5(Hil 的PCR反应体系中加入2Xmaster mix(Qiagen公司)25pl、基因组DNA模板2u1引物Pl和P2 (各0.5pl) 1u1、 Pfo (高保真DNA聚合酶,Qiagen公司)1^1,补水至体积为;于94 。C变性5min,然后94。C,30s、 60°C, 45s、 72°C, 60s共循环30次,最后72。C延伸10min, 所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收950bp的目的条带备用[oWl编码 序列上游片段Fl,243-1167,950bp,其中Fl的3,端保留有a-l,6-甘露糖基转移酶跨膜区(29aa)的基因编码序列(1080-1167, 87bp)]。以同样反应体系,改以P7和P8 (各0.5ul)为扩增引物, 94℃变性5min,然后94℃,30s、 54°C, 45s、 72°C, 45s循环30次,最后72。C延伸7min,所 得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收650bp的目的条带(odzl编码序列下 游片段F2, 2241-2858, 650bp)备用。
里氏木霉a-l,2-甘露糖苷酶除去跨膜区(29aa)的编码序列M (1446bp)由上海生物工程 有限公司合成,克隆于pUC19中,所得质粒命名为pUC19-M。在50pl的PCR反应体系中加 入2Xmaster mix(Qiagen公司)25ul、质粒pUC19-M模板0.1u1,引物P3和P4 (各0.5ul) 1u1、 Pfu (高保真DNA聚合酶,Qiagen公司)1u1,补水至体积为50u1 ;于94℃变性5min,然后 94℃,30s、 55。C, 45s、 72°C, 90s共循环30次,最后72℃延伸10min,所得PCR产物在1% 的琼脂糖凝胶上进行电泳分析,回收1480bp的目的条带(a-l,2-甘露糖苷酶编码序列M, 1480bp)备用。
在50ul的PCR反应体系中加入2Xmaster mix(Qiagen公司)25ul、质粒pPIC9K模板O.lul, 引物P5和P6 (各0.5u1) 1u1、 Pfu (高保真DNA聚合酶,Qiagen公司)lul,补水至体积为 ;于94。C变性5min,然后94℃,30s、 58°C, 45s、 72°C, 90s共循环30次,最后72℃延 伸7min,所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收850bp左右的目的条带 (Kanamycin编码序列K, 850bp)备用。
在50pl的PCR反应体系中加入2Xmastermix(Qiagen公司)25ul、前述PCR产物F1、 F2、 M、 K各2nl, PfU (高保真DNA聚合酶,Qiagen公司)2pl,补水至体积为;于94℃ 变性5min,然后94℃,30s、 50℃, 120s, 68℃, 120s循环5次,最后72℃延伸7min。然后 加入引物Pl和P8各0.5nl,继续循环30次,最后72℃延伸10min。所得PCR产物在0.8% 的琼脂糖凝胶上进行电泳分析,回收3800bp左右的目的条带(F1-MK-F2片段),连接到 pEGM-Teasy载体(Promega公司,USA)中,经序列分析结果得到验证。重组质粒的构建策 略如图l所示。
2)工程菌株的转化与筛选
构建好的质粒以EcoRI酶切,回收F1-MK-F2片段。采用前述电穿孔方法转化工程菌株, 涂布于含有Geneticin的YPD平板上进行筛选。挑选能够在Geneticin抗性平板上生长的菌株, 提取基因组DNA,分别以P3和P6为引物进行PCR鉴定,PCR产物在0.8%的琼脂糖凝胶电 泳上进行分析,能扩增出2300bp特异性产物的菌株为阳性基因重组工程菌株,命名为 IFN/GSm。
3)工程菌株表达糖蛋白的纯化与鉴定
将工程菌株IFN/GSm接种于lOOmL BMGY培养基中,培养至O.D6(X)=6.0左右,离心去 除培养上清,以BMMY重悬,使其O.D60()=1.0,继续培养,每24小时补充诱导剂甲醇至终 浓度为1%。诱导结束后离心收集培养上清,首先采用Ni-亲和层析柱从上清中纯化P-IFN, 纯化后的重组P-IFN用内切-f5-N-乙酰葡萄糖胺糖苷酶(New England Biolabs)从糖蛋白上 切下糖链,再采用ConA亲和层析柱(Qiagen, German)纯化回收切下的糖链,通过MALDI-TOF 分析其糖链结构,通过与标准样品质谱进行比较,确认工程菌株IFN/GSm表达的IFN-e的N 糖基化修饰糖链具有Man5GlcNAc2结构(图未给出)。
实施例2 n-乙酰氨基葡萄糖转移酶I和P-l,4-半乳糖基转移酶甘露糖苷酶活性的引入
本实施例是向实施例1构建的工程菌株IFN/GSm基因组中整合含有定位序列的N-乙酰氨 基葡萄糖转移酶I和)3-l,4-半乳糖基转移酶的编码序列,使改造后的工程菌株表达的e-IFN 具有结构为GalGlcNAcMan5GlcNAc2的修饰糖链。
材料与方法
1)重组质粒的构建
IFN/GSm工程菌株按照实施例1制备,根据酵母密码子偏嗜性设计并合成了 N-乙酰氨基 葡萄糖转移酶I及定位信号MNN9融合蛋白的编码序列mGn,其中MNN9定位信号(38aa)的 编码序列位于N-乙酰氨基葡萄糖转移酶I的5'-端,并在序列的5'端和3'端分别引入EcoRI 和Notl酶切位点,序列如Seq ID N0.2所示,将合成序列克隆于pUC载体中;根据酵母密码 子偏嗜性设计并合成卩-l,4-半乳糖基转移酶及定位信号HDEL的编码序列Gah,其中HDEL 定位信号位于(3-l,4-半乳糖基转移酶的C-端,并在序列的5'端和3'端分别引入EcoRI和Notl 酶切位点,序列如S叫ID N0.3所示,合成序列克隆于pUC载体中,所得质粒命名为pUC-Gah。
以pPIC9载体为模板,采用引物对P9和P10扩增HIS编码序列(1980-4584,宿主细胞 的组氨酸缺陷代偿基因)
P9: 5,-GGATCCATGACATTTCCCTTGCTACCTGCATAC-3' P10: 5' -GATATCTTAAATAAGTCCCAGTTTCTCCATAC匿3'
上游引物引入BamHI位点,下游引物引入五coRV位点,在PCR反应体系中加入2 Xmaster mix(Qiagen公司)25(xl、质粒pPIC9模板O.lnl,引物P9和P10 (各0.5jj1) 1(_U、 Pfu
(髙保真DNA聚合酶,Qiagen公司)1u1,补水至体积为50ul :于94℃变性5min,然后94 ℃,30s、 55℃, 45s、 72℃, 90s共循环30次,最后72℃延伸10min,所得PCR产物在0.8% 的琼脂糖凝胶上进行电泳分析,回收2600bp左右的目的条带(His序列H, 2610bp)。回收产 物经5amHI和五coRV双酶切后再进行胶回收,与同样酶切的pGAPZA载体以T4 DNA连接 酶16。C连接过夜,转化DH5a感受态,筛选Zeocin (Invitrogen公司)抗性菌,提取质粒进 行酶切鉴定,切下插入片段条带的质粒为重组质粒,命名为pPH。
分别以EcoRI和M)tl双酶切mGn序列和Gah序歹U, 1%琼脂糖凝胶回收相应片段(1350bp 和950bp)。分别将mGn序列和GaH序列与同样酶切的pPH载体,以T4 DNA连接酶16°C 连接过夜,转化DH5a感受态,筛选Zeocin (Invitrogen公司)抗性菌,提取质粒进行酶切鉴 定,能切下插入片段条带的质粒为重组质粒,分别命名为pPHmGn和pPGah。以SglII和5amHI 酶切pPGah质粒,得到与5'AOXl启动子连接的Gah序列PGaH;以5amHI酶切pPHmGn 质粒,利用BglII与BamHI同尾酶的特性将PGah插入pPHmGn,筛选能切下插入片段的重 组质粒,命名为pPH-GnGa。
2) 工程菌株的转化与筛选
按照pPIC9K Mannual (Invitrogen公司)操作手册所述电穿孔方法,将质粒pPH-GnGa 转化工程菌株IFN/GSm,筛选能在MD (His缺陷型培养基)平板上生长的菌株。所得菌株 再分别以mGn和GaH的特异性引物对Pll和P12、 P13和P14进行PCR鉴定。
<sequence>see original document page 16</sequence>PCR产物在1%琼脂糖凝胶电泳上分析,能同时扩增680bp和418bp片段的菌株为阳性基 因重组工程菌株,命名为IFN/GSmGna。
3) 工程菌株表达糖蛋白的纯化与鉴定
按照实施例1中步骤3操作,纯化工程菌株IFN/GSmGna表达的IFN,并对其糖链结构 进行质谱分析鉴定,确认工程菌株表达糖蛋白的糖基化修饰糖链结构为 GalGlcNacMan5GlcNAc2 (图未给出)。
实施例3引入唾液酸转运蛋白和a-2,6-唾液酸转移酶活性
本实施例是向实施例2构建的工程菌株IFN/GSmGna基因组中整合含有定位序列的唾液 酸转运蛋白和a-2,6-唾液酸转移酶编码序列,使工程菌株表达的β-IFN的具有结构为 SAGalGlcNAcMan5GlcNAc2修饰糖链。
材料与方法
1) 重组质粒的构建
IFN/GSmGna工程菌株按照实施例2制备,根据酵母密码子偏嗜性设计a-2,6-唾液酸转移 酶及唾液酸转运蛋白融合蛋白的编码序列STC,其上下游分别引入五coRI和M)tl酶切位点, 序列如SeqlDN0.4所示,由上海生工生物工程有限公司合成,克隆于pUC载体中,命名为 pUC-STC;质粒pUC-STC经EcoRI和iVotl双酶切后,胶回收STC片段,与同样酶切的pPIC6 载体以T4 DNA连接酶16。C连接过夜,转化DH5 a感受态,筛选Blasticidin (Invitrogen公司) 抗性菌,提取质粒进行酶切鉴定,能切下插入片段条带的质粒为重组质粒,命名pPIC6-STC。
根据酵母密码子偏嗜性设计并合成唾液酸合成酶的编码序列SS,其下游引入iVcoI酶切位 点,序列如SEQIDN0.5所示,由上海生工生物工程有限公司合成,克隆于pUC载体中,命 名为pUC-SS。以EcoRI酶切pUC-SS, Klenow酶(NEB公司)补平后再用WcoI酶切,胶回 收切下的片段,与他ol酶切并去磷酸化的pPIC6-STC质粒以T4 DNA连接酶16'C连接过夜, 转化DH5a感受态,筛选Zeocin (Invitrogen公司)抗性菌,提取质粒进行酶切鉴定,能切下 插入片段条带的质粒为重组质粒,命名pPIC6-STCS。
2) 工程菌株的转化与筛选
按照pPIC9K MannuaKInvitrogen公司)操作手册所述电穿孔方法,将质粒pPIC6H-GnGa 转化工程菌株IFN/GSmGna,筛选能在blasticidin抗性平板上生长的菌株。所得菌株再分别以 STC和SS的特异性引物对PI5和P16、 P17和P18进行PCR鉴定。
P15: GGAATTGGCTAAGTTGTCCGTCCC
PI2: CAACAAGGCACCCAAAGCGAAAGAC
PI3: GGTATGGATGAAATGGCCGTTGAA
P14: TAAAGAAGCGGAGTGATCGGAACCC
同时扩增出660bp和430bp片段的菌株为阳性基因重组工程菌株命名为IFN/GSmGnaS。
3)工程菌株表达糖蛋白的纯化与鉴定
按照实施例i中步骤3操作,不同之处在于,分别采用内切-e-N-乙酰葡萄糖胺糖苷酶 (New England Biolabs)从工程菌株IFN/GSmGnaS表达的IFN糖蛋白上切下糖链,并且采用 Qproteome Sialic Glycoprotein Kit (Qiagen, German)纯化,采用毛细管电泳法对其糖链结构 进行质谱分析鉴定,如附图2所示,确认IFN- e的N-糖基化修饰具有 SAGalGlcNAcMan5GlcNAcGlc2的糖链结构。
序列表
<110> 高新
< 120〉构建表达预定糖链修饰糖蛋白工程菌株的方法
<130> xxx
〈160〉 5
<170> Patentln version 3.4
〈210〉 1<211> 1446〈212〉 DNA<213>人工序列
<220〉<221〉 CDS<222〉 (1). . (1446)
<400> 1
ttc caa act tct tgg aac get tac cac cac ttc gcc ttc cca cat gat 48
Phe Gin Thr Ser Trp Asn Ala Tyr His His Phe Ala Phe Pro His Asp 15 10 15
gat tta cac cca gtt tct aac tct ttt gac gac gag aga sac ggt tgg 96
Asp Leu His Pro Val Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp 20 25 30
ggt age tec get att gat ggc ttg gat acc get att ttg atg ggt gac 144
Gly Ser Ser Ala lie Asp Gly Leu Asp Thr Ala lie Leu Met Gly Asp 35 40 45
get gac att gtt aac act ate ttg caa tac gtt cca caa att aac ttc 192
Ala Asp lie Val Asn Thr lie Leu Gin Tyr Val Pro Gin lie Asn Phe 50 55 60acc act acc get gtt gcc aac c犯ggt tec tec gtc ttc gaa acc aac 240 Thr Thr Thr Ala Val Ala Asn Gin Gly Ser Ser Val Phe Glu Thr Asn 65 70 75 80
ate aga tac ttg ggt ggt ttg ttg tct get tac gac ttg ttg aga ggt 288 lie Arg Tyr Leu Gly Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly 85 90 95
cct ttc tct tct eta get act aac caa acc ttg gtt aac tct ttg ttg 336 Pro Phe Ser Ser Leu Ala 丁hr Asn Gin Thr Leu Val Asn Ser Leu Leu 100 105 110
aga caa get caa acc ttg get aac ggt ttg aag gtc get ttc act acc 384 Arg Gin Ala Gin Thr Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr 115 120 125
cca tct ggt gtt cca gac cct act gtc ttc ttc aac cca act gtt aga 432 Pro Ser Gly Val Pro Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg 130 135 140
aga tec ggt gcc tct tct aac aac gtc get gaa ate ggt tec ttg gtc 480 Arg Ser Gly Ala Ser Ser Asn Asn Val Ala Glu lie Gly Ser Leu Val 145 150 155 160
ttg gaa tgg acc aga ttg tct gac ttg act ggt aac cca caa tac get 528 Leu Glu Trp Thr Arg Leu Ser Asp Leu Thr Gly Asn Pro Gin Tyr Ala 165 170 175
caa ttg get caa aag ggt gaa tct tac ttg eta aac cca aag ggt tct 576 Gin Leu Ala Gin Lys Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser 180 185 190
cca gaa get tgg cca ggt ttg ate ggt act ttc gtt tct act tec aac 624 Pro Glu Ala Trp Pro Gly Leu lie Gly Thr Phe Val Ser Thr Ser Asn 195 200 205
ggt act ttc caa gac tct tct ggt tct tgg tct ggt ttg atg gac tct 672 Gly Thr Phe Gin Asp Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser 210 215 220ttc tac gaa tac ttg ate aag atg tac ttg tat gat cca gtc get ttc 720 Phe Tyr Glu Tyr Leu lie Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe 225 230 235 240
get cac tac犯a gac aga tgg gtt ttg ggt get gac tct act ate ggt 768 Ala His Tyr Lys Asp Arg Trp Val Leu Gly Ala Asp Ser Thr lie Gly 245 250 255
cac ttg ggt tct cac cct tec acc aga aag gac ttg acc ttc eta tct 816 His Leu Gly Ser His Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser 260 265 270
tct tac aac ggt caa tct act tec cca aac tct ggt cat ttg gcc tec 864 Ser Tyr Asn Gly Gin Ser 丁hr Ser Pro Asn Ser Gly His Leu Ala Ser 275 280 285
ttc ggt ggt ggt aac ttt ate tta ggt ggt att ttg ttg aac gaa caa 912 Phe Gly Gly Gly Asn Phe lie Leu Gly Gly lie Leu Leu Asn Glu Gin 290 295 300
aag tac att gac ttc ggt att aag ttg get tec tct tac ttc ggt act 960 Lys Tyr lie Asp Phe Gly lie Lys Leu Ala Ser Ser Tyr Phe Gly Thr 305 310 315 320
tac acc caa act gcc tct ggt ate ggt cca gaa ggt ttc gcc tgg gtt 1008 Tyr Thr Gin Thr Ala Ser Gly lie Gly Pro Glu Gly Phe Ala Trp Val 325 330 335
gac tct gtt acc ggt get ggt ggt tec cca cca tct age caa tec ggt 1056 Asp Ser Val Thr Gly Ala Gly Gly Ser Pro Pro Ser Ser Gin Ser Gly 340 345 350
ttc tac tec tct gcc ggt ttc tgg gtc acc get cca tac tac att ttg 1104 Phe Tyr Ser Ser Ala Gly Phe Trp Val Thr Ala Pro 丁yr Tyr lie Leu 355 360 365
cgt cca gaa act ttg gaa tct ttg tac tac get tac aga gtc acc ggt 1152 Arg Pro Glu Thr Leu Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly370 375 380
gac tcc朋g tgg caa gac ttg get tgg gaa get ttg tec gcc ate gaa 1200 Asp Ser Lys Trp Gin Asp Leu Ala Trp Glu Ala Leu Ser Ala lie Glu 385 390 395 400
gac get tgt aga get ggt tcc gcc tac tcc tct att aac gac gtt acc 1248 Asp Ala Cys Arg Ala Gly Ser Ala Tyr Ser Ser lie Asn Asp Val Thr 405 410 415
caa get aac ggt ggt ggt get tct gac gat atg gaa tcc ttt tgg ttc 1296 Gin Ala Asn Gly Gly Gly Ala Ser Asp Asp Met Glu Ser Phe Tirp Phe 420 425 430
get gaa get ttg aag tac get tac tta ate ttc gcc gaa gaa tcc gat 1344 Ala Glu Ala Leu Lys Tyr Ala Tyr Leu lie Phe Ala Glu Glu Ser Asp 435 440 445
gtc caa gtt caa get acc ggt ggt aac aag ttc gtt ttc aac act gaa 1392 Val Gin Val Gin Ala Thr Gly Gly Asn Lys Phe Val Phe Asn Thr Glu 450 455 460
get cac cca ttc tct ate aga tcc tct tct cgt aga ggt ggt cac tta 1440 Ala His Pro Phe Ser lie Arg Ser Ser Ser Arg Arg Gly Gly His Leu 465 470 475 480
gcc taa 1446 Ala
<210〉 2
<211〉 1355
<212> DNA <213>人丁序列
<220>
<221> 融合基因 <222> (1).. (1355)
〈400〉 2
<formula>see original document page 23</formula>aaggaattag gtgaagttag agttcaatac accggtagag actccttcaa ggctttcgcc 1200
aagccttgg gtgttatgg3 cgscttgaag tctggtgtcc caagagctgg ttacagaggt 1260
attgttacct tccaattcag aggtcgtaga gttcacttgg ctccaccacc aacttgggaa 1320
ggttacgacc catcttggaa ccattaggcg gccgc 1355
<210〉 3
〈211〉 956
〈212〉 DNA 〈213〉人工序列
〈220〉
〈221〉融合基因 <222〉 (1).. (956)
〈400〉 3
gaattcgctt cctctcaacc aagaccaggt ggtgactctt ctccagtcgt cgactctggt 60
ccaggtccag cctccaactt gacctctgtt ccagtcccac acactactgc tttgtccttg 120
ccagcttgtc cagaagaatc tccattgttg gtcggtccaa tgttgattga atttaacatg 180
ccagttgatt tggaattggt tgctaaacaa aacccaaacg tcaagatggg tggtagatac 240
gccccaagag attgtgtctc cccacacaag gtcgctatca tcatcccatt tagaaaccgt 300
caagaacact tgaagtactg gttgtactac ttgcacccag tcttgcaacg tcaacaattg 360
gactacggta tctacgttat caaccaagct ggtgacacta tcttcaacag agctaagttg 420
ttgaacgttg gcttccaaga agctctaaag gactacgatt acacctgttt tgtcttctcc 480
gacgtcgact tgatcccaat gaacgatcac aacgcttata gatgtttctc tcaaccaaga 540<sequence>see original document page 25</sequence>
〈210〉 4
〈211〉 2087
〈212〉 DNA <213〉人工序列
〈220〉
〈221〉融合基因 〈222〉 (1).. (2087)
<400〉 4
<sequence>see original document page 25</sequence>tgtcacttga gagaccacgt taacgtctct atgatcgaag ccaccgactt ccctttcaac 480
accactgaat gggaaggtta cttgccaaag gaaaacttcc gtaccaaggt cggtccatgg 540
caaagatgtg ctgtcgtttc ctccgccggt agtttgaaga actcccaact aggtagagaa 600
attgacaacc acgatgctgt cttaagattt aacggtgctc caactgacaa ctttcaacaa 660
gacgttggtt ctaagactac tatcagattg atgaactctc aattggtcac cactgaaaag 720
agattcttga aggattcctt gtacactgaa ggtatcttga tcgtttggga tccatccgtc 780
taccacgctg acatcccaaa gtggtaccaa aagccagatt acaacttctt cgaaacttac 840
aagtcttacc gtagattgaa cccatctcaa ccattctaca tcttgaagcc acaaatgcca 900
tgggaattgt gggatatcat tcaagaaatc tctgctg3tt tgatccaacc aaacccacca 960
tcctccggta tgttgggtat cattatcatg atgactttgt gtgatcaagt cgacatctac 1020
gaattcttgc catccaagcg taagaccgac gtctgttact accaccaaaa gttcttcgac 1080
tccgcttgta ctatgggtgc ttacgatcca ttgttgttcg aaaagaacat ggtcaagcac 1140
ctaaacgaag gtaccgatga sgacatctst ttgttcggta aggctacctt gtctggtttc 1200
agaaacattc gttgtatgac tttggtcgct gctgcttaca ccgtcgcttt aagatacacc 1260
agaaccaccg ctgaagaatt gtacttttct actaccgctg tctgtatcac cgaagtcatt 1320
aagttgttga tttccgtcgg tttgttggct aaggaaaccg gttccttggg tagattcaag 1380
gcttccttgt ccgaaaacgt tttgggttct ccaaaggaat tggctaagtt gtccgtccca 1440
tctttggttt scgctgtgca aaacaatatg gctttcttgg ctttgagtaa cttggacgcc 1500
gctgtttacc aagttaccta ccaattgaag atxccatgta ccgccttgtg taccgtcttg 1560<formula>see original document page 27</formula>
〈210> 5
〈211〉 729
<212〉 DNA
<213>人工序列
<220〉
<221〉 CDS
<222> (1). . (729)
〈400〉 5
<formula>see original document page 27</formula>Tyr Thr Ser Lys His Ser Trp Gly Lys Thr Tyr Gly Glu His Lys Arg 35 40 45
cac ttg gaa ttc tec cac gac caa tac aag gaa ttg caa tct tac gcc 192 His Leu Glu Phe Ser His Asp Gin Tyr Lys Glu Leu Gin Ser Tyr Ala 50 55 60
caa gaa ate ggt att ttc ttc act get tct ggt atg gat gaa atg gcc 240 Gin Glu lie Gly lie Phe Phe Thr Ala Ser Gly Met Asp Glu Met Ala 65 70 75 80
gtt gaa ttc ttg cac gaa ttg aac gtt cca ttc ttc aag gtc ggt tec 288 Val Glu Phe Leu His Glu Leu Asn Val Pro Phe Phe Lys Val Gly Ser 85 90 95
ggc gat act aac aat ttc cca tac ttg gaa aag acc get aag aag ggt 336 Gly Asp Thr Asn Asn Phe Pro Tyr Leu Glu Lys Thr Ala Lys Lys Gly 100 105 110
aga cca atg gtt ate tec tct ggt atg caa tec atg gat acc atg aag 384 Arg Pro Met Val lie Ser Ser Gly Met Gin Ser Met Asp Thr Met Lys 115 120 125
caa gtc tac caa att gtc aag cca ttg aat cca aac ttt tgt ttc ttg 432 Gin Val Tyr Gin lie Val Lys Pro Uu Asn Pro Asn Phe Cys Phe Leu 130 135 140
caa tgt acc tec get tac cca ttg caa cca gaa gat get aac ttg aga 480 Gin Cys Thr Ser Ala Tyr Pro Gin Pro Glu Asp Ala Asn Leu Arg 145 150 155 160
gtc ate tct gaa tac caa aag ttg ttc cca gac ate cca ate ggt tac 528 Val lie Ser Glu Tyr Gin Lys Leu Phe Pro Asp lie Pro lie Gly Tyr 165 170 175
tec ggt cac gaa act ggt att get att tec gtg gcc get gtt get ttg 576 Ser Gly His Glu Thr Gly lie Ala lie Ser Val Ala Ala Val Ala Leu 180 185 190ggt get aag gtc ttg gaa aga cac ate act ttg gac aag act tgg犯g 624 Gly Ala Lys Val Leu Glu Arg His lie Thr Leu Asp Lys Thr Trp Lys 195 200 205
ggt tec gat cac tec get tct tta gaa cca ggt gaa tta get gaa ttg 672 Gly Ser Asp His Ser Ala Ser Leu Glu Pro Gly Glu Leu Ala Glu Leu 210 215 220
gtt aga tec gtt cgt ttg gtc gaa aga get ttg ggt tct cca acc aag 720 Val Arg Ser Val Arg Leu Val Glu Arg Ala Leu Gly Ser Pro Thr Lys 225 230 235 240
tec atg gcc 729 Ser Met Ala
权利要求
1.一种构建表达预定糖链修饰糖蛋白工程菌株的方法,该方法包括下列步骤a)以编码糖苷酶α-1,2-甘露糖苷酶或其功能结构域的编码序列替换α-1,3-甘露糖基转移酶或α-1,6-甘露糖基转移酶基因的内部编码序列,构建同源重组突变基因序列;b)将步骤a)获得的重组突变基因序列插入具有筛选标志序列的载体中,得到重组质粒;c)将N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶的编码序列的编码序列分别与各自定位信号编码序列相连接,得到两种融合基因序列;d)将步骤c)获得的两种融合基因序列插入具有筛选标志序列的载体中,得到重组质粒;e)将α-2,6-唾液酸转移酶编码序列和唾液酸转运蛋白编码序列连接,得到融合基因序列f)向载体中插入唾液酸合成酶编码序列使与载体内的筛选标志编码序列相连接,然后再向载体中插入步骤e)获得的融合基因序列,得到重组质粒;g)将(i)步骤a)得到的重组质粒,(ii)步骤a)和步骤b)得到的重组质粒,或者(iii)步骤a)、b)和c)得到的重组质粒,导入工程菌株,借助筛选标志筛选发生表型改变的工程菌株;h)在培养基中对所述工程菌株进行培养和诱导表达,收集上清中的糖蛋白并对其N-糖基化修饰糖链进行分析,确认工程菌株表达的糖蛋白N-糖基化修饰为预定糖链。
2. 权利要求l所述的方法,其中所述的a-l,2-甘露糖苷酶编码序列为SEQIDNO:l。
3. 权利要求1所述的方法,其中所述的N-乙酰氨基葡萄糖转移酶I及定位信号的编码序列为 SEQ ID NO: 2。
4. 权利要求1所述的方法,其中所述的|3-1,4-半乳糖基转移酶1及定位信号的编码序列为SEQ ID NO: 3。
5. 权利要求1所述的方法,其中所述的a-2,6-唾液酸酶和唾液酸转运蛋白的编码序列为SEQ ID NO: 4。
6. 权利要求l所述的方法,其中所述的唾液酸合成酶的编码序列为SEQIDNO:5。
7. 权利要求l所述的方法,其中所述的cx-l,2-甘露糖苷酶编码序列、N-乙酰氨基葡萄糖转移 酶I及定位信号的编码序列、P-1,4-半乳糖基转移酶I及定位信号的编码序列、a-2,6-唾液酸酶 和唾液酸转运蛋白的编码序列以及唾液酸合成酶的编码序列可从任何物种,诸如哺乳动物、 植物、真菌和细菌中PCR扩增获得,也可依据Genebank序列通过人工合成,优选根据酵母 密码子偏嗜性人工合成。
8. 权利要求l所述的方法,其中所述的预定糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖 和唾液酸中的一种或多种。
9. 权利要求1或8所述的方法,其中所述的预定糖链的结构为选自下列其中的一种或多种 Man5GlcNAc2、 GalGlcNAcMan5GlcNAc2和SAGalGlcNAcMan5GlcNAc2。
全文摘要
本发明涉及蛋白质糖基化工程领域,本发明涉及借助基因工程手段构建表达预定糖链修饰的工程菌株的方法,本发明还涉及对糖蛋白N-糖基化修饰糖链的设计与改造,使糖蛋白可以根据需要含有结构选自Man<sub>5</sub>GlcNAc<sub>2</sub>、GalGlcNAcMan<sub>5</sub>GlcNAc<sub>2</sub>或SAGalGlcNAcMan<sub>5</sub>GlcNAc<sub>2</sub>的修饰糖链。
文档编号C12N15/62GK101343635SQ200810007439
公开日2009年1月14日 申请日期2008年3月10日 优先权日2008年3月10日
发明者宋海峰, 新 高 申请人:新 高