岩藻糖基化寡糖LNFP-V的合成的制作方法

文档序号:26003811发布日期:2021-07-23 21:21阅读:166来源:国知局
岩藻糖基化寡糖LNFP-V的合成的制作方法

本发明涉及生物技术领域,特别是涉及使用遗传修饰的微生物,特别是大肠杆菌(e.coli)的重组岩藻糖基化寡糖lnfp-v的微生物生产,以及所述遗传修饰的细胞的构建。



背景技术:

近年来,由于哺乳动物乳中包含的包括寡糖在内的复合碳水化合物在活生物体中发生的许多生物过程中的作用,其合成的商业化努力显著增加。人乳寡糖(hmo)正成为营养和治疗行业的重要商业目标。现在已报道了200多种hmo,并且已阐明了130多种hmo结构(urashima等人:“乳寡糖(milkoligosaccharides)”.《novabiomedicalbooks》,纽约(2011);chenadv.carbohydr.chem.biochem.72,113(2015))。尽管最近具有更简单结构的hmo(例如工业规模的三糖2'-岩藻糖基乳糖)的合成和纯化已由多家制造商使用包含利用遗传修饰的微生物的生物技术方法完成,但对于更复杂结构的hmo而言,同样的任务仍然具有挑战性。

乳酰-n-岩藻五糖v(lnfp-v)是一种中性五糖,于1976年首次从人乳中分离出来。其结构被确定为四糖乳-n-四糖(lnt),在葡萄糖残基上用α1,3-偶联物(galβ1-3glcnacβ1-3galβ1-4(fucα1-3)glc,方案1;ginsburg等人,arch.biochem.biophys.175,565(1976))进行岩藻糖基化。

方案1.lnfp-v的结构

人乳中lnfp-v的平均浓度为0.18g/l(erney等人,j.pediatricgastroenterol.nutr.30,181(2000))。由于其浓度低,从人乳中分隔和分离lnfp-v似乎不经济。迄今为止,还没有关于lnfp-v的酶促或化学全合成的报道。关于生物技术方法,使用重组大肠杆菌在实验室规模的发酵过程中从乳糖生产lnfp-v,所述重组大肠杆菌包含分别编码和表达β1,3-n-乙酰氨基葡萄糖转移酶、β1,3-半乳糖基转移酶和α1,3/4-岩藻糖基转移酶的质粒携带的异源基因igta、galtk和fuctiii(m.randriantsoa:synthesemicrobiologiquedesantigenesglucidiquesdesgroupessanguins,thesesoutenueai’universitejosephfourier,grenoble,2008)。

bioorg.med.chem.23,6799(2015)和wo2016/008602的作者公开了一种不含质粒的重组大肠杆菌,其包含分别编码和表达β1,3-n-乙酰氨基葡萄糖转移酶、β1,3-半乳糖基转移酶和α1,3/4-岩藻糖基转移酶的基因igta、wbgo和fuctiii,其在培养后能够产生六糖lndfh-ii,但没有形成lnfp-v的报道。

最近,据报道,lnfp-v对艰难梭菌的毒素a的碳水化合物结合结构域显示出结合亲和力(nguyen等人,j.microbiol.biotechnol.26,659(2016))。已知艰难梭菌是医院腹泻的主要原因(kyne等人,clin.infect.dis.34,346(2002))。

因此,需要一种允许以安全且成本效益好的方式生产足够量的分离的lnfp-v的方法。



技术实现要素:

本发明提供了通过使用重组细菌细胞的生物技术生产lnfp-v的方法。

因此,在第一方面,本发明涉及遗传修饰的微生物或细胞,优选细菌细胞,更优选大肠杆菌细胞,其包含选自由β1,3-n-乙酰氨基葡萄糖转移酶、β1,3-半乳糖基转移酶和α1,3/4-岩藻糖基转移酶组成的三种功能活性异源糖基转移酶,其中α1,3/4-岩藻糖基转移酶由选自幽门螺杆菌(h.pylori)的fuct基因、幽门螺杆菌的futa基因及其功能变体/突变体的核酸序列编码,并且其中编码所述异源糖基转移酶的核酸序列整合到微生物或细胞的基因组中。优选地,由于天然β-半乳糖苷酶基因,优选lacz的缺失或失活,重组微生物或细胞缺乏细胞内β-半乳糖苷酶活性。

本发明的第二方面涉及用于生产lnfp-v的方法,该方法包括:

-提供如本发明的第一方面所公开的遗传修饰的微生物或细胞,

-在乳糖存在下培养所述微生物或细胞,和

-从所述微生物或细胞、从培养基或从两者分离lnfp-v。

本发明的第三方面涉及一种蛋白质(多肽),其包含由seqidno.7表征的氨基酸序列或由其组成。包含由seqidno.7表征的氨基酸序列或由其组成的蛋白质(多肽)具有α1,3/4-岩藻糖基转移酶活性。

本发明的第四方面涉及具有α1,3/4-岩藻糖基转移酶活性的多肽在生产lnfp-v中的用途,该多肽选自:

-多肽,其包含与seqidno.1的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成,和

-多肽,其包含与seqidno.3的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成。

附图说明

下文中将参考附图进一步详细描述本发明,其中显示了us6974687(genbankid:bd182026)中描述的幽门螺杆菌β1,3-半乳糖基转移酶序列与本发明的实施例中使用的galtk编码的galtkβ1,3-半乳糖基转移酶序列的比对。

具体实施方式

在岩藻糖基化的乳-n-四糖(lnt)的酶促合成中,注意力主要集中在将岩藻糖连接到n-乙酰氨基葡萄糖上,从而构建携带lewisa人抗原的结构。bioorg.med.chem.23,6799(2015)和wo2016/008602的作者构建了能够合成lnt的遗传修饰的大肠杆菌,并且在细胞中引入了异源α1,3/4-岩藻糖基转移酶(由质粒或基因组整合的来自幽门螺杆菌菌株dsm6709的α1,3/4-岩藻糖基转移酶fuctiii基因表达(rabbani等人,《糖生物学(glycobiology)》15,1076(2005))。培养后,检测和表征的主要产物是双岩藻糖基化的lnt(乳-n-二岩藻六糖ii,lndfh-ii),其在n-乙酰氨基葡萄糖上带有第一个岩藻糖残基,在葡萄糖上带有第二岩藻糖基团。在检测到的产物中未鉴定出单岩藻糖基化的lnt。

其他作者(m.randriantsoa:synthesemicrobiologiquedesantigenesglucidiquesdesgroupessanguins,thesesoutenueai’universitejosephfourier,grenoble,2008)证明了表达异源β1,3-n-乙酰氨基葡萄糖转移酶、异源β1,3-半乳糖基转移酶和来自质粒的上述相同异源α1,3/4-岩藻糖基转移酶的遗传修饰的大肠杆菌菌株能够产生单岩藻糖基化的乳-n-四糖lnfp-v,并且伴有lnt和lndfh-ii。

出人意料的是,本发明人通过引入选择的编码α1,3/4-岩藻糖基转移酶的异源基因,成功地构建了产生大量lnfp-v作为主要代谢产物的基因组修饰菌株。

因此,本发明涉及能够从乳糖产生lnfp-v的遗传修饰的微生物或细胞,有利地为细菌细胞,优选为大肠杆菌,并且包含:

-基因组整合的异源核酸序列,其编码具有β1,3-n-乙酰氨基葡萄糖转移酶活性的多肽,

-基因组整合的异源核酸序列,其编码具有β1,3-半乳糖基转移酶活性的多肽,和

-基因组整合的异源核酸序列,其编码具有α1,3/4-岩藻糖基转移酶活性的多肽,

其中具有α1,3/4-岩藻糖基转移酶活性的多肽选自:

-多肽,其包含与seqidno.1的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成,和

-多肽,其包含与seqidno.3的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成。

因此,本文公开的能够从乳糖产生lnfp-v的遗传修饰的微生物或细胞含有并表达三种编码蛋白质的异源糖基转移酶(称为β1,3-n-乙酰氨基葡萄糖转移酶、β1,3-半乳糖基转移酶和α1,3/4-岩藻糖基转移酶)基因,所述蛋白质对于从乳糖合成lnfp-v是合适和必需的,并且所述异源糖基转移酶基因整合到微生物或细胞的基因组中。表达的异源α1,3/4-岩藻糖基转移酶是一种多肽,其包含与seqidno.1或seqidno.3的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成。

在某些实施方式中,表达的异源α1,3/4-岩藻糖基转移酶包含与seqidno.1或seqidno.3(视情况而定)具有至少92%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的多肽或由其组成。

seqidno.1的多肽是幽门螺杆菌nctc11639(genbankid:aab81031.1,ge等人,j.biol.chem.272,21357(1997),参见下文seqidno.2)的天然α1,3/4-岩藻糖基转移酶的截短形式,在本文中称为“截短的fuct”。截短的fuct缺少构成由seqidno.2表征的整个原始蛋白质的c-末端的37个氨基酸(ma等人,j.biol.chem.281,6385(2006))。截短的fuct由幽门螺杆菌nctc11639的相应截短的fuct基因编码(有关整个fuct,参见genbankid:af008596.1)。

在一个实施方式中,包含seqidno.1的氨基酸序列的多肽是幽门螺杆菌nctc11639(genbankid:aab81031.1,ge等人,j.biol.chem.272,21357(1997))的α1,3/4-岩藻糖基转移酶的全长,其特征在于seqidno.2,在本文中称为fuct。fuct由幽门螺杆菌nctc11639(genbankid:af008596.1)的fuct基因编码。

seqidno.3的多肽是幽门螺杆菌atcc26695(genbankid:np_207177.1)的α1,3/4-岩藻糖基转移酶,在本文中称为futa。futa由幽门螺杆菌nctc26695的futa基因编码。

在一个实施方式中,表达的异源α1,3/4-岩藻糖基转移酶包含与seqidno.4相同的多肽或优选由其组成。根据seqidno.4的蛋白质是futa的功能变体,其中128位的ala(a)被asn(n)置换,且129位的his(h)被glu(e)置换(choi等人.biotechnol.bioengirt.113,1666(2016))。根据seqidno.4的蛋白质在本文中称为futa_mut,并且在本文中将编码futa_mut的核酸序列称为futa_mut。

在一个实施方式中,表达的异源α1,3/4-岩藻糖基转移酶包含与seqidno.7相同的多肽或优选由其组成。根据seqidno.7的蛋白质是futa的功能变体,其中128位的ala(a)被asn(n)置换,129位的his(h)被glu(e)置换,148位的asp(d)被gly(g)置换,且221位的tyr(y)被cys(c)置换。根据seqidno.7的蛋白质在本文中称为futa_mut2,并且在本文中将编码futa_mut2的核酸序列称为futa_mut2。

在优选的实施方式中,表达的异源α1,3/4-岩藻糖基转移酶包含与seqidno.1、seqidno.2、seqidno.3、seqidno.4或seqidno.7相同的多肽或优选由其组成。

上述遗传修饰的微生物或细胞优选包含功能性gdp-岩藻糖代谢途径和/或乳糖导入系统,该乳糖导入系统包括由乳糖通透酶介导的主动转运机制,优选由lacy基因编码的通透酶。

在本文中,术语“微生物”或“细胞”意指生物细胞,例如细菌或酵母细胞,其可被遗传改造以在不同表达水平表达其天然或外源基因,它们是染色体(染色体的)基因或质粒整合(质粒携带)基因。

术语“宿主细胞”、“重组微生物或细胞”或“遗传修饰的微生物或细胞”可互换使用,以表示细胞,优选细菌细胞,与其天然存在的(野生型)变体相比,在其基因组中至少含有一种人工改变。通过这种改变,要么通过整合到基因组中或经由质粒添加的方式将核酸构建体添加到细胞中,要么从细胞的基因组中删除或改变核酸序列。无论如何,如此转化的细胞具有与改变之前不同的基因型,因此,修饰的细胞显示出修饰的特征(一种或多种)。优选地,当培养或发酵时,由于引入异源核酸序列或编码在野生型细胞中不表达的酶的天然核酸序列的修饰,遗传修饰的细胞可进行至少一种附加的或改变的生化反应,或者由于编码在野生型细胞中发现的酶的核酸序列的缺失、添加或修饰,遗传修饰的细胞不能进行生化反应。遗传修饰的细胞可通过众所周知的常规基因工程技术来构建(例如green和sambrook:《分子克隆:实验室手册》,第4版,冷泉港实验室出版社(molecularcloning:alaboratorymanual,4thed.,coldspringharborlaboratorypress)(2012);分子生物学的最新规程(currentprotocolsinmolecularbiology)(ausubel等人编辑),johnwileyandsons(2010)。

在两种或更多种核酸或氨基酸序列的上下文中,术语“[某个]%的序列同一性”意指当在比较窗口或指定的核酸或氨基酸序列上进行比较和比对以获得最大对应性时,两种或更多种序列具有给定百分比的核苷酸或氨基酸残基(即序列具有至少90%(%)的同一性)。核酸或氨基酸序列的同一性百分比可使用具有默认参数的blast2.0序列比较算法或通过手动比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/blast/)。该定义也适用于测试序列的互补序列以及具有缺失和/或添加以及具有取代的序列。适用于确定同一性百分比、序列相似性和比对的算法的一个示例是blast2.2.20+算法,该算法在altschul等人nucl.acidsres.25,3389(1997)中有所描述。blast2.2.20+用于确定本发明的核酸和蛋白质的序列同一性百分比。进行blast分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。序列比对算法的示例是clustalomega(http://www.ebi.ac.uk/tools/msa/clustalo/)、embossneedle(http://www.ebi.ac.uk/tools/psa/emboss_needle/)、mafft(http://mafft.cbrc.jp/alignment/server/)或muscle(http://www.ebi.ac.uk/tools/msa/muscle/)。

在一个优选的实施方式中,本发明的遗传修饰的细胞已被转化成含有核酸构建体,该核酸构建体包含具有糖基转移酶活性的蛋白质、酶或多肽的编码序列,优选一种或更多种构建体,所述构建体包含一种或更多种异源转移酶的一种或更多种编码核酸序列,优选至少一种编码β1,3-n-乙酰氨基葡萄糖转移酶的序列,至少一种编码β1,3-半乳糖基转移酶的序列和至少一种编码α1,3/4-岩藻糖基转移酶的序列,并且能够表达构建体中包含的编码核酸序列。

本发明的遗传修饰的微生物或细胞可选自细菌和酵母,优选细菌。细菌优选选自:大肠杆菌(escherichiacoli)、芽孢杆菌属(bacillusspp.)(例如枯草芽孢杆菌(bacillussubtilis))、幽门弯曲杆菌(campylobacterpylori)、幽门螺杆菌(helicobacterpylori)、根癌农杆菌(agrobacteriumtumefaciens)、金黄色葡萄球菌(staphylococcusaureus)、水生嗜热菌(thermophilusaquaticus)、茎瘤固氮根瘤菌(azorhizobiumcaulinodans)、豆科根瘤菌(rhizobiumleguminosarum)、淋病奈瑟氏球菌(neisseriagonorrhoeae)、脑膜炎奈瑟氏球菌(neisseriameningitis)、乳酸杆菌属(lactobacillusspp.)、乳球菌属(lactococcusspp.)、肠球菌属(enterococcusspp.)、双岐杆菌属(bifidobacteriumspp.)、芽孢乳杆菌属(sporolactobacillusspp.)、小单孢子菌属(micromomosporaspp.)、微球菌属(micrococcusspp.)、红球菌属(rhodococcusspp.)、假单胞菌属(pseudomonas),其中大肠杆菌是优选的。

术语“能够从乳糖生产lnfp-v的遗传修饰的微生物或细胞”意指所述细胞具有经由连续的糖基化步骤由乳糖(一种二糖)合成lnfp-v(一种五糖)所必需的酶活性,其中乳糖在第一步糖基化中被糖基化为三糖,然后在第二步糖基化中三糖被糖基化为四糖,最后在第三步糖基化中四糖被糖基化为lnfp-v。糖基化步骤由各自的糖基转移酶介导。在糖基转移酶介导的糖基化中,所论述的糖基转移酶将合适的供体分子的单糖(该供体分子是活化的单糖核苷酸)转移到受体分子。根据本发明的必需的糖基转移酶是:β1,3-n-乙酰氨基葡萄糖转移酶、β1,3-半乳糖基转移酶和α1,3/4-岩藻糖基转移酶;并且相应的供体分别是:udp-glcnac、udp-gal和gdp-fuc。

细胞产生udp-glcnac和udp-gal是在酶的作用下发生的,这些酶参与它们的天然从头生物合成途径,以分步反应顺序从简单的碳源如甘油、果糖、蔗糖或葡萄糖开始(关于单糖代谢的综述,参见例如fi.fi.freeze和a.d.elbein:第四章:糖基化前体(glycosylationprecursors),收录于:糖生物学基础(essentialsofglycobiology),第二版(编辑a.varki等人,冷泉港实验室出版社(2009)。具体而言,udp-glcnac是由果糖-6-磷酸通过三个步骤从头产生的,这三个步骤由三个基因编码的酶催化,这三个基因是glms、glmm和glmu,它们在其天然启动子下表达。类似地,udp-gal由葡萄糖-6-磷酸酶通过三个步骤从头产生,这三个步骤由基因pgm、galu和gale编码的酶催化,这些基因也在其天然启动子下表达。gdp-fuc代谢途径见下文。根据生产lnfp-v的某个合成顺序,乳糖被n-乙酰氨基葡萄糖基化为乳-n-三糖ii(glcnacβ1-3galβ1-4glc),然后半乳糖基化为lnt(galβ1-3glcnacβ1-3galβ1-4glc),最后被岩藻糖基化为lnfp-v。然而,岩藻糖基化有可能在n-乙酰氨基葡萄糖基化步骤之前或之后。

术语“核酸序列[...]整合到微生物或细胞的基因组中”意指所述核酸序列整体地、单独地或包含在核酸构建体中,优选可操作地连接到一个或更多个被宿主细胞识别的控制序列,被插入到所述微生物或细胞的基因组(遗传基因座)的某个位点。

术语“编码具有β1,3-n-乙酰氨基葡萄糖转移酶活性的多肽的核酸序列”或“编码具有β1,3-半乳糖基转移酶活性的多肽的核酸序列”意指分别表达具有β1,3-n-乙酰氨基葡萄糖转移酶活性或β1,3-半乳糖基转移酶活性的多肽的基因、其功能片段或其密码子优化版本。

在本文中,术语“基因”涉及编码核酸序列。“功能片段”或“基因的功能变体”优选地意指编码序列或修饰的编码序列的片段,修饰的编码序列例如包含一个或更多个不同于原始编码序列相同位置的核苷酸的序列,其表达具有与从原始编码序列表达的多肽相同或相似的功能特征(一种或多种)的多肽。

术语“核酸构建体”意指人工构建的核酸片段,特别是旨在移植到靶细胞(例如细菌细胞)中的dna序列。在本发明的上下文中,核酸构建体含有重组dna序列,该重组dna序列包含本发明的编码dna序列。在一个优选的实施方式中,核酸构建体基本上包含四个可操作地连接在一起的分离的dna序列:编码dna序列、连接到编码dna序列上从而能够启动所述编码dna序列转录的启动子dna序列、位于基因上游的5'非翻译区(5'-utr)的dna片段,即直接位于起始密码子上游和启动子序列下游的基因前导dna序列。可将本发明的dna构建体插入质粒dna/载体中,移植到靶/宿主细胞中,并且以质粒或染色体携带的形式表达。dna构建体可为线性或环状的。整合到宿主细菌基因组或表达质粒中的线性或环状dna构建体在本文中可互换地称为“表达组件(“expressioncassette)”、“表达盒(expressioncartridge)”或“盒(cartridge)”。优选地,该盒是线性dna构建体,其基本上包含启动子、启动子下游的5'-utrdna(包括核糖体结合位点)的序列,并且可操作地连接到编码目的生物学分子的编码dna序列。该构建体还可包含其他序列,诸如转录终止子序列,以及两个末端侧翼区域,其与基因组区域同源且能够进行同源重组。另外,盒可含有如下所述的其他顺序。该盒可通过本领域公知的方法来制造,例如使用《生物化学和分子生物学的原理和技术》(wilson和walker编辑),剑桥大学出版社(2010)中描述的标准方法。线性表达盒的使用可提供以下优点:基因组的整合位点可通过盒的侧翼同源区域的相应设计自由选择。因此,线性表达盒的整合允许在基因组区域方面有更大的可变性。由于线性盒也更容易构建,因此此类盒是本发明的构建体的优选的实施方式。

术语“启动子”意指参与rna聚合酶结合以启动可操作地连接的基因转录的核酸序列,其中该基因包括编码dna序列和其他(非编码)序列,例如位于编码序列上游的5'非翻译区(5'-utr),其包含核糖体结合位点。本发明中的启动子是分离的dna序列,即不是基因组dna的整合dna片段。本发明的启动子的核苷酸序列对应于被视为基因的启动子区(例如大肠杆菌的glp操纵子或lac操纵子的启动子区)的细菌基因组dna片段的核苷酸序列,或者与其具有至少80%的同一性,优选90-99.9%的同一性。“操纵子”意指基因组dna的功能单元,其含有在单个启动子控制下的基因簇。“glp操纵子”意指参与细菌甘油的呼吸代谢的基因簇。“lac操纵子”意指参与乳糖的转运和代谢的基因簇。在优选的实施方式中,本发明涉及大肠杆菌的四个glp操纵子,特别是glpfkx、glpabc、glptq和glpd。在其他优选的实施方式中,本发明涉及包含基因z、y和a的大肠杆菌的lac操纵子。优选地,包含在本发明的dna构建体中的glp操纵子启动子序列对应于被视为大肠杆菌的相应glp操纵子的启动子区的基因组dna片段的核苷酸序列,或者与其具有至少80%的同一性,优选90-99.9%的同一性;特别地,本发明的glp操纵子的启动子的分离序列对应于基因组序列上游具有genbankid:eg10396(glpfkx)、eg10391(glpabc)、eg10394(glpd)、eg10401(glptq)的序列的片段,或者与该片段具有所述的同一性百分比;并且操纵子laczya的启动子的分离序列对应于基因组序列上游具有genbankid:eg10527(lacz)的序列的片段,或者与该片段具有所述的同一性百分比。大肠杆菌基因组在本文中指大肠杆菌k-12mg1655的完整基因组dna序列(genbankid:u00096.3)。

本发明中的启动子序列可包含几个结构特征/元件,诸如能够结合细胞中的rna聚合酶并启动下游(3'-方向)编码序列的转录的调控区、转录起始位点及其特异性转录调节蛋白的结合位点。调控区包括负责rna聚合酶结合的蛋白质结合域(共有序列),诸如-35框和-10框(pribnow框)。

本发明中的启动子序列优选地包含至少90个核苷酸,更优选地100至150个核苷酸,例如110-120、120-130、130-140、140-150,或甚至更优选超过150个核苷酸,诸如155-165、165-175、175-185、185-195、195-205、205-215、215-225、225-235、235-245、245-255、255-265。在一些实施方式中,启动子序列可甚至更长,诸如长达500-1000个核苷酸。在一些优选的实施方式中,启动子的分离的序列是glp操纵子的序列。

本发明还涉及包括在本发明的构建体中的启动子dna序列的变体。本内容中的“变体”意指与所关注的启动子dna序列的核苷酸序列具有70-99.9%的相似性的人工核酸序列。比较的核酸序列的相似性百分比指示具有相同结构即相同核苷酸组成的序列部分。为了本发明的目的,序列相似性的百分比可通过使用本领域公知的任何方法(例如blast)来确定。术语“变体”的范围包括与本文所述dna序列互补的核苷酸序列、mrna序列和合成核苷酸序列(例如pcr引物)以及与本发明构建体的核酸序列相关的其他寡核苷酸。

在一个优选的实施方式中,如上所述的glp操纵子的启动子或其变体与异源β1,3-n-乙酰氨基葡萄糖转移酶、异源β1,3-半乳糖基转移酶和/或异源α1,3/4-岩藻糖基转移酶可操作地连接。更优选地,glp操纵子的启动子是glpf启动子或其变体。

同样,优选地,对于合成lnfp-v所必需的异源β1,3-n-乙酰氨基葡萄糖转移酶、异源β1,3-半乳糖基转移酶和异源α1,3/4-岩藻糖基转移酶在glpf启动子变体下表达。在这方面,构建表达盒,每个表达盒分别包含可操作地连接到glpf启动子变体并插入宿主细胞的基因组中的异源β1,3-n-乙酰氨基葡萄糖转移酶、异源β1,3-半乳糖基转移酶或异源α1,3/4-岩藻糖基转移酶。优选地,glpf启动子变体是由seqidno.5表征的核酸构建体。

术语“微生物或细胞包含功能性gdp-岩藻糖代谢途径”意指所述细胞或微生物能够原位生产gdp-岩藻糖,其在岩藻糖基化步骤中用作岩藻糖供体,以在微生物或细胞内制备lnfp-v。gdp-岩藻糖代谢途径是从头合成或根据补救途径而发生。在从头合成途径中,gdp-l-岩藻糖由果糖-6-磷酸和gtp通过以下五种酶的连续作用生物合成:甘露糖6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、gdp-甘露糖-4,6-脱水酶和gdp-岩藻糖合酶。在大肠杆菌中,这五种酶分别由mana、manb、manc、gmd和wcag编码,它们是可拉酸基因簇的一部分。其他细菌或酵母菌株可能缺少一种或更多种上述酶;从头的gdp-岩藻糖合成途径中固有缺失的任何酶均可作为基因或重组dna构建体提供,既可在质粒表达载体中提供,也可作为整合到宿主细胞染色体中的外源基因提供。另外,编码udp-葡萄糖脂质载体转移酶的可拉酸簇的wcaj基因应被删除或失活,以抑制可拉酸的产生,从而gdp-岩藻糖生物合成通量将从它转移到lnfp-v的合成。优选地,以上公开的同源可拉酸簇在lac启动子(plac)的控制下。另外,为了进一步增加gdp-岩藻糖库,编码可拉酸操纵子的正调控子的基因rsca可能被过表达(参见例如dumon等人,glycoconj.j.18,465(2001))。在另一个实施方式中,遗传修饰的细胞可利用补救的岩藻糖来生产gdp-岩藻糖。在补救途径中,在岩藻糖通透酶的帮助下在细胞内内在化的外源添加的岩藻糖被岩藻糖激酶磷酸化,并且通过岩藻糖-1-磷酸鸟苷酰基转移酶转化为gdp-岩藻糖。参与该过程的酶可为异源的或同源的。在一个实施方式中,岩藻糖激酶和岩藻糖-1-磷酸鸟苷酰基转移酶可组合成双功能酶(参见例如wo2010/070104)。

术语“包含由乳糖通透酶介导的主动转运机制的乳糖导入系统”意指在包含对乳糖具有特异性的转运蛋白(称为乳糖通透酶)的主动转运的帮助下,将制造lnfp-v所必需的和外源添加到培养物中的乳糖内在化,从而遗传修饰的细胞或微生物在其细胞质中允许并浓缩外源乳糖。内在化不能影响细胞的基本和重要功能,也不能破坏细胞的完整性。一种公认的广泛用于将乳糖导入细胞的通透酶是lacy(参见例如wo01/04341),但是也可考虑对乳糖具有特异性的其他通透酶。

在一个优选的实施方式中,本文公开的能够从乳糖生产lnfp-v的遗传修饰的微生物或细胞包含编码具有α1,3/4-岩藻糖基转移酶活性的多肽的异源核酸序列,所述多肽选自:seqidno.1的蛋白质(ma等人,j.biol.chem.281,6385(2006))、seqidno.2的蛋白质(genbankid:aab81031.1,ge等人,j.biol.chem.272,21357(1997))、seqidno.3的蛋白质(genbankid:np_207177.1)、seqidno.4的蛋白质(choi等人,biotechnol.bioeng.113,1666(2016))或seqidno.7的蛋白质。

优选地,编码包含与seqidno.1或seqidno.3的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成的多肽的异源核酸序列,有利地,编码seqidno.1的蛋白质(称为“截短的”fuct)、seqidno.2的蛋白质(称为fuct)、seqidno.3的蛋白质(称为futa)、seqidno.4的蛋白质(称为futa_mut)或seqidno.7的蛋白质(称为futa_mut2)的异源核酸序列对于本发明的表达系统是密码子优化的。

优选地,以上公开的遗传修饰的微生物或细胞不能够水解或降解lnfp-v或其在从乳糖开始的生物合成途径中的中间体(例如乳-n-三糖ii或lnt)。同样,在一个实施方式中,细胞缺乏会降解受体(乳糖)的任何酶活性,诸如lacz(β-半乳糖苷酶)活性。这可通过缺失或灭活编码β-半乳糖苷酶的lacz来实现。在其他实施方式中,以上公开的遗传修饰的微生物或细胞,尽管其天然lacz被缺失或失活,但仍可能具有低水平的β-半乳糖苷酶活性,例如由于掺入了编码β-半乳糖苷酶的异源基因。就这一点而言,发酵后可将外源添加的过量乳糖完全水解,从而有利于所产生的目的寡糖的分离和纯化。例如在wo2012/112777中公开了这种解决方案。在其他实施方式中,可附加地改变以上公开的遗传修饰的微生物或细胞,以包含可操作地连接到诱导型启动子例如温度诱导型启动子的β-半乳糖苷酶基因。在这方面,β-半乳糖苷酶在较低的温度下,例如在培养微生物以生产lnfp-v的温度下不表达,而在发酵结束时升高温度时诱导其表达,因此过量的乳糖可被水解。此类解决方案公开在例如wo2015/036138中。

同样,优选地,编码具有β1,3-n-乙酰氨基葡萄糖转移酶活性的多肽的整合到遗传修饰的微生物或细胞的基因组中的核酸序列是脑膜炎奈瑟氏球菌053442(genbankid:cp000381)的igta基因或其密码子优化版本。优选地,将igta基因或其密码子优化版本的编码序列可操作地连接到由seqidno.5表征的glpf启动子变体,从而在该变体下表达。

同样,优选地,编码具有β1,3-半乳糖基转移酶活性的多肽的整合到遗传修饰的微生物或细胞的基因组中的核酸序列是称为galtk的基因、其功能片段或密码子优化版本。galtk与幽门螺杆菌43504的编码β1,3-半乳糖基转移酶的基因(genbankid:bd182026、us6974687)同源,并且编码由seqidno.6表征的蛋白质,称为galtk。us6974687公开的β1,3-半乳糖基转移酶与本申请中使用的galtkβ1,3-半乳糖基转移酶(由galtk编码)的结构比较如图1所示。

根据本发明,本文所述的遗传修饰的微生物或细胞,包括优选的和更优选的实施方式,提供足够量的gdp-岩藻糖,用于通过从头或补救途径,优选通过从头途径(参见上文)生物合成lnfp-v。然而,为了通过提供必要和足够的gdp-岩藻糖水平来进一步优化lnfp-v生物合成,可将可拉酸基因簇的额外拷贝引入细胞中,优选地并入细胞的基因组中。

本文公开的遗传修饰的微生物或细胞,包括优选的和更优选的实施方式,包含整合到细胞基因组中的异源β1,3-n-乙酰氨基葡萄糖转移酶、异源β1,3-半乳糖基转移酶和异源α1,3/4-岩藻糖基转移酶。后一种异源基因可整合到宿主细胞的任何遗传基因座中,从而不会干扰细胞代谢,并且细胞能够产生所需的寡糖。在本发明中使用的或合适的表达系统允许广泛的可变性。原则上,可选择具有已知序列的任何基因座,条件是该序列的功能是可有可无的,或者如果必要的话可被补充(例如在营养缺陷型的情况下)。现有技术中描述了许多适合于本发明目的的整合基因座(参见例如francia等人,j.bacteriol.178,894(1996);juhas等人(2014)plosone9,e111451(2014);juhas等人(2015)microbialbiothechnol.8,617(2015);sabi等人microbial.cellfactories12:60(2013))。

优选地,在一个实施方式中,整合的基因组位点是糖代谢基因(诸如半乳糖、木糖、核糖、麦芽糖或岩藻糖的那些)的操纵子中的基因座。

根据本发明,在一个实施方式中,包括以上公开的任何优选的实施方式的遗传修饰的微生物或细胞,仅包含β1,3-半乳糖基转移酶基因的一个(单个)拷贝,优选galtk或其密码子优化版本,更优选在glp启动子(pglp)或其变体,例如pglpf,特别是根据seqidno.5的pglpf变体的控制下。

根据本发明,在一个实施方式中,包括以上公开的任何优选的实施方式的遗传修饰的微生物或细胞,仅包含β1,3-n-乙酰氨基葡萄糖转移酶基因的一个(单个)拷贝,优选igta基因或其密码子优化版本的编码序列,更优选在glp启动子(pglp)或其变体,例如pglpf,特别是根据seqidno.5的pglpf变体的控制下。

在一个实施方式中,包括以上公开的任何优选的实施方式的遗传修饰的微生物或细胞,仅包含β1,3-半乳糖基转移酶基因(优选galtk或其密码子优化版本)、β1,3-n-乙酰氨基葡萄糖转移酶基因(优选igta基因或其密码子优化版本的编码序列)以及编码与seqidno.1或seqidno.3具有至少90%的氨基酸序列同一性的多肽的α1,3/4-岩藻糖基转移酶基因(优选“截短的”fuct、fuct、futa、futa_mut或futa_mut2)中的每一个的一个(单个)拷贝。更优选地,每个此类糖基转移酶均在根据seqidno.5的glpf启动子变体的控制下。不同糖基转移酶基因的每个拷贝均整合到不同的基因组位点中,优选整合到与替代碳源利用相关的基因座中。

在一个实施方式中,包括以上公开的优选的实施方式中的任一个的遗传修饰的微生物或细胞,包含β1,3-半乳糖基转移酶基因(优选galtk或其密码子优化版本)的两个拷贝,其中的每一个均整合到两个不同的基因组位点中,以及编码与seqidno.1或seqidno.3具有至少90%的氨基酸序列同一性的多肽的α1,3/4-岩藻糖基转移酶基因(优选“截短的”fuct、fuct、futa、futa_mut或futa_mut2)的两个拷贝,其中的每一个均整合到两个不同的基因组位点中,更优选地,每个此类糖基转移酶编码序列均在pglpf或其他glp启动子或其变体(例如pglpa或pglpt)的控制下表达,优选在根据seqidno.5的glpf启动子变体的控制下表达。

生产lnfp-v必需的上述三种不同种类的异源糖基转移酶基因作为表达盒的一部分并入宿主细胞的基因组中,表达盒是以dna构建体的形式存在的,所述dna构建体包含可操作地连接到启动子序列的糖基转移酶编码序列。该启动子可为能够在一定水平上起始并维持可操作地连接的基因的转录并被宿主细胞识别的任何合适的启动子。优选地,启动子是碳源诱导型启动子。优选地,启动子是天然调控大肠杆菌的四个glp操纵子(glpfkx、glpabc、glptq和glpd)中的一个基因转录的启动子或其变体。

在一个实施方式中,包括上面公开的优选和更优选的实施方式的遗传修饰的微生物或细胞,仅包含选自fuct、futa、futa_mut和futa_mut2的α1,3/4-岩藻糖基转移酶的一个(单个)拷贝,优选在glp启动子的控制下,更优选在glpf启动子或其变体的控制下,甚至更优选在根据seqidno.5的glpf启动子变体的控制下。

如上所述,在一个实施方式中,根据本发明的适于从乳糖制备lnfp-v的遗传修饰的微生物或细胞可包含gdp-岩藻糖从头生物合成途径,以在细胞内提供gdp-岩藻糖。gdp-岩藻糖的从头途径利用宿主细胞(优选大肠杆菌)的天然可拉酸基因簇,其包含mana、manb、manc、gmd和wcag,其中wcaj被删除或失活。天然可拉酸基因簇优选在plac启动子的控制下。在另一个实施方式中,本发明的遗传修饰的微生物或细胞,除了天然可拉酸基因簇以外,还可包含额外的可拉酸基因拷贝,以增强gdp-岩藻糖的生物合成,从而提供更高水平的gdp-岩藻糖。可拉酸基因簇的此类第二拷贝优选整合到基因组中,并且优选在glp启动子的控制下表达,更优选在glpf启动子或其变体下表达,甚至更优选在根据seqidno.5的glpf启动子变体的控制下表达。至于其中掺入了可拉酸基因簇的第二拷贝的基因组位点,它可优选地是如上所述的细胞糖代谢基因的基因座。在另一个实施方式中,当细胞包含可拉酸基因簇的额外拷贝时,仅存在α1,3/4-岩藻糖基转移酶基因的一个(单个)基因组拷贝,优选为futa_mut或futa_mut2,更优选为futa_mut2。

本发明的第二方面涉及一种生产lnfp-v的方法,该方法包括:

a)提供本发明的第一方面中公开的遗传修饰的微生物或细胞,

b)在乳糖存在下培养所述微生物或细胞,和

c)从所述微生物或细胞、从培养基或从两者分离lnfp-v。

五糖lnfp-v可容易地通过以下方法获得,该方法涉及在含有乳糖和一种或更多种碳基底物的水性培养基或发酵培养基中培养或发酵根据本发明第一方面的遗传修饰的细胞或微生物,随后将它们从培养基中分离。术语“培养基”意指在遗传修饰的细胞外的发酵罐中发酵过程的水环境。

在进行该过程中,遗传修饰的细胞在碳基底物诸如甘油、葡萄糖、蔗糖、糖原、果糖、麦芽糖、淀粉、纤维素、果胶、壳多糖等的存在下培养。优选地,细胞用甘油、葡萄糖、蔗糖和/或果糖培养。

该过程还涉及最初将外源乳糖从培养基转运到遗传修饰的细胞中。乳糖以常规方式外源地添加到培养基中,然后从培养基中转运到细胞中。乳糖在主动转运机制的帮助下被内在化,通过该机制乳糖在细胞的转运蛋白或乳糖通透酶(lacy)的影响下扩散穿过细胞的质膜,该转运蛋白或乳糖通透酶在lac启动子的控制下表达。

在一些实施方式中,用于该过程的遗传修饰的细胞缺乏酶活性,该酶活性会显著降解细胞内乳糖、lnfp-v和lnfp-v生物合成途径中的代谢中间体,例如乳-n-三糖ii或lnt。在这方面,培养细胞的天然β-半乳糖苷酶(由大肠杆菌中的lacz基因编码,其将乳糖水解为半乳糖和葡萄糖)优选被缺失或失活(lacz-基因型)。在本发明第二方面的一个实施方式中,在步骤b)中加入的过量乳糖在发酵后不被除去或降解,并且乳糖和lnfp-v的混合物,任选地伴有一种或更多种寡糖副产物,例如乳-n-三糖ii、lnt、3-fl和/或lndfh-ii,从培养基中分隔和分离。在另一个实施方式中,乳糖和lnfp-v的混合物,任选地伴有一种或更多种寡糖副产物,例如乳-n-三糖ii、lnt、3-fl和/或lndfh-ii,通过如上所述的发酵生产,并且lnfp-v,任选地伴有一种或更多种寡糖副产物,例如乳-n-三糖ii、lnt、3-fl和/或lndfh-ii,从培养环境和任选过量的乳糖中分隔和分离。在另一个实施方式中,乳糖和lnfp-v的混合物,任选地伴有一种或更多种寡糖副产物,例如乳-n-三糖ii、lnt、3-fl和/或lndfh-ii,通过如上所述的发酵生产,随后

i)添加乳糖降解酶,例如半乳糖苷酶,其外源性地将乳糖水解为单糖,或

ii)让发酵继续进行,直到发酵步骤中添加的所有乳糖均被消耗掉,

提供基本上不含乳糖的肉汤。就这一点而言,在选项ii)中,以上公开的lacz-基因型的遗传修饰细胞还可包含功能性重组β-半乳糖苷酶。这种功能性半乳糖苷酶可由为热诱导的外源lacz基因编码(参见例如wo2015/036138)。在发酵温度下,这种功能性β-半乳糖苷酶不被细胞表达,因此当生产hmo时,细胞中的内在化乳糖不会降解。当肉汤中达到所需的lnfp-v浓度或量时,在升高的温度下继续培养,从而表达功能性β-半乳糖苷酶并降解过量的乳糖。另选地,上述公开的lacz-基因型的遗传修饰的细胞可包含低但可检测活性水平的重组β-半乳糖苷酶(参见例如wo2012/112777),以便在发酵结束时除去任选的残留乳糖。

通常,该方法涉及在培养基中提供碳基底物和每升培养基初始体积中至少30至多约100克的乳糖。优选地,该方法还在28℃至35℃的温度下进行,优选连续搅拌和连续通气2至5天。优选培养基的最终体积不超过向培养基中提供乳糖和碳基底物之前培养基初始体积的三倍。

根据实施本发明方法的一个实施方式,以下列方式培养遗传修饰的lacz-y+大肠杆菌菌株:

(1)指数细胞生长的第一阶段,该阶段由培养基中提供的碳基底物(诸如葡萄糖或蔗糖)确保,并且优选持续到葡萄糖全部消耗掉,该阶段优选至少12小时,诸如约18小时或20-25小时;和

(2)细胞生长的第二阶段,该阶段受在第一阶段之后,优选连续地在培养基中提供的碳基底物(诸如葡萄糖、蔗糖或甘油和乳糖)的限制,并且该第二阶段持续到碳基底物和优选大部分(例如至少60%)乳糖被消耗完,该第二阶段优选至少35小时,诸如至少45小时、50至70小时或至多约130小时。

在遗传修饰的细胞的培养过程中,lnfp-v和任选的一种或更多种寡糖副产物,例如乳-n-三糖ii、lnt、3-fl和/或lndfh-ii均在细胞的细胞内和细胞外基质中积累。产生的寡糖可通过使用标准技术从肉汤中分离和/或彼此分隔。

本发明的第三方面涉及一种蛋白质(多肽),其包含由seqidno.7表征的氨基酸序列或由其组成。包含由seqidno.7表征的氨基酸序列或由其组成的蛋白质(多肽)具有α1,3/4-岩藻糖基转移酶活性,并且可有利地用于lnfp-v的发酵生产中,如实施例中所公开的。

本发明的第四方面涉及具有α1,3/4-岩藻糖基转移酶活性的多肽在lnfp-v的生产中的用途,该多肽选自:

-多肽,其包含与seqidno.1的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成,和

-多肽,其包含与seqidno.3的氨基酸序列具有至少90%的序列同一性的氨基酸序列或由其组成。

在某些实施方式中,α1,3/4-岩藻糖基转移酶包含与seqidno.1或seqidno.3(视情况而定)具有至少92%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的多肽,优选由其组成。

在一个实施方式中,α1,3/4-岩藻糖基转移酶包含seqidno.1或seqidno.2的氨基酸序列,优选由其组成。

在一个实施方式中,α1,3/4-岩藻糖基转移酶包含seqidno.3、seqidno.4或seqidno.7的氨基酸序列,优选由其组成。

在一个优选的实施方式中,α1,3/4-岩藻糖基转移酶包含与seqidno.7相同的多肽,或优选由其组成。

在一个实施方式中,编码具有α1,3/4-岩藻糖基转移酶活性的多肽的核酸序列包含在能够从乳糖生产lnfp-v的微生物或细胞中。可通过使用适当的表达质粒或通过基因组(染色体)整合将核酸序列引入微生物或细胞中。

实施例

在实施例中,所有利用的菌株均来源于大肠杆菌平台菌株,该菌株是通过破坏(缺失)基因lacz、nanketa、laca、mela、wcaj、mdoh并在gmd基因上游插入plac启动子而从大肠杆菌k12dh1(基因型:f-、λ-、gyra96、reca1、rela1、enda1、thi-1、hsdr17、supe44,得自deutschesammlungvonmikroorganismenundzellkulturen(dsmz),www.dsmz.de,参考dsm4235)构建的。

染色体dna中的基因靶向是使用标准的dna操作技术完成的,例如,如warming等人,nucleicacidsres,33,e36(2005)中所公开的。通过如herring等人,gene,311,153(2003)所描述的基因gorging完成遗传盒在染色体dna中的插入。

使用4天方案在24个深孔板中筛选实施例中公开的菌株。在最初的24小时内,细胞生长至高密度,而在接下来的72小时内,将细胞转移到允许诱导基因表达和产物形成的培养基中。具体而言,在第1天期间,使用补充有硫酸镁、硫胺素和葡萄糖的基础基本培养基制备新鲜接种物。将制备好的培养物在34℃下以700rpm振摇孵育24小时后,将细胞转移到补充有硫酸镁和硫胺素的新基础基本培养基(2ml)中,向该培养基中注入20%葡萄糖溶液(1μl)和10%的乳糖溶液(0.1ml),然后将50%的蔗糖溶液作为碳源提供给细胞,同时加入蔗糖水解酶(转化酶,4μl的0.1g/l溶液),从而通过转化酶对蔗糖的切割以缓慢的速度提供葡萄糖用于生长。接种新培养基后,将细胞在28℃下以700rpm的速度振摇72小时。变性并随后离心后,通过hplc分析上清液。

实施例1

如下进一步修饰大肠杆菌平台菌株(见上文):将用于lgta的密码子优化的igta编码序列的单个拷贝整合到大肠杆菌平台菌株的基因组(染色体)中与糖代谢相关的基因座中并在glpf启动子的控制下表达;将密码子优化的galtk的单个拷贝整合到大肠杆菌平台菌株基因组中的另一个参与糖代谢的基因座中并在glpf启动子的控制下表达;将可拉酸簇的额外拷贝整合到第三个基因座中,该基因座与替代碳源的利用有关并在glpf启动子的控制下表达;并且将lacl从lac操纵子中删除(δlacl)。基于上述菌株,菌株1-5通过将编码α1,3/4-岩藻糖基转移酶的基因的单个拷贝整合到能够进行糖代谢的大肠杆菌平台菌株的基因座中的一个中并在glpf启动子的控制下而构建:

-菌株1:密码子优化的futa序列,其编码seqidno.3的蛋白质

-菌株2:密码子优化的futa_mut2序列,其编码seqidno.7的蛋白质

-菌株3:密码子优化的截短的fuct序列,其编码seqidno.1的蛋白质

-菌株4:密码子优化的fuctiii,其来自幽门螺杆菌dsm6709,genbankid:ay450598.1(rabbani等人,glycobiolog,15,1076(2005))

-菌株5:密码子优化的fucta,其来自幽门螺杆菌ua948,genbankid:af194963.2。

培养后,测量以下lnfp-v浓度(细胞内和细胞外浓度合计):

如上表所示,分别表达futa、futa_mut2和截短的fuctα1,3/4-岩藻糖基转移酶的菌株1-3,比在此类构建体中表达从现有技术已知的fuctiii酶的参考菌株4产生高得多的lnfp-v滴度(分别高300%、150%和210%)。表达fuctaα1,3/4-岩藻糖基转移酶的参考菌株5未产生lnfp-v。

实施例2

基于实施例1中公开的菌株1,产生了菌株6,使得它包含整合在糖利用基因座中并在glpf启动子控制下表达的密码子优化的futa基因的额外(第二)拷贝。

类似地,基于实施例1中公开的菌株3,产生了菌株7,使得它包含整合在另一个糖利用基因座中并在glpf启动子控制下表达的密码子优化的截短fuct基因的额外(第二)拷贝。

如下进一步修饰大肠杆菌平台菌株(参见上文)以制备菌株8:将密码子优化的igta编码序列的单个基因组拷贝整合到参与糖消耗的基因座中,并且在glpf启动子的控制下表达;将密码子优化的galtk的单个基因组拷贝整合到另一个糖代谢基因座中,并且在glpf启动子的控制下表达;将密码子优化的futa_mut2的单个基因组拷贝整合到一个基因座中,从而能够利用另一种替代碳源,并且在glpf启动子的控制下表达;将可拉酸簇的额外拷贝整合到第四个糖代谢基因座中,并且在glpf启动子的控制下表达;并且将lacl从lac操纵子中删除(δlacl)。基于菌株8,产生菌株9,使其含有整合在参与糖消耗的基因座中的密码子优化的futa_mut2基因的额外(第二)拷贝,并且在glpf启动子的控制下表达。

培养后,测量以下lnfp-v的相对浓度(细胞内和细胞外浓度合计):

如上表所示,并入编码α1,3/4-岩藻糖基转移酶的futa或截短的fuct的第二拷贝不能显著提高lnfp-v滴度,而futa_mut2的第二拷贝则对lnfp-v滴度具有负面影响。总之,带有单个基因组拷贝的α1,3/4-岩藻糖基转移酶基因的菌株是优选的。

实施例3

如下进一步修饰大肠杆菌平台菌株(参见上文)以制备菌株10:将密码子优化的igta编码序列的单个基因组拷贝整合到糖代谢基因座中,并且在glpf启动子的控制下表达;将密码子优化的galtk的单基因组拷贝整合到另一个参与替代碳源利用的基因座中,并且在glpf启动子的控制下表达;将密码子优化的futa_mut2的单个基因组拷贝整合到与糖消耗相关的第三个基因座中,并且在glpf启动子的控制下表达;并且lacl由galk替换而删除(lacl::galk)。

基于菌株10,菌株11-13的构建如下:

-菌株11:将可拉酸簇的额外拷贝整合到糖利用基因座中,并且在glpf启动子的控制下表达;

-菌株12:将密码子优化的futa_mut2基因的额外(第二)拷贝整合到另一个糖代谢基因座中,并且在glpf启动子的控制下表达;

-菌株13:将可拉酸簇的额外拷贝整合到参与利用替代碳源的基因座中,并且在glpf启动子的控制下表达,并且将密码子优化的futa_mut2基因的额外(第二)拷贝整合到也能够消耗特定糖的基因座中,并且在glpf启动子的控制下表达。

培养后,测量以下lnfp-v的相对浓度(细胞内和细胞外浓度合计):

表达ca基因簇的额外拷贝和来自单个拷贝的α1,3/4-岩藻糖基转移酶的细胞(菌株11)比没有这种额外pglpf-驱动的ca基因拷贝的类似细胞(菌株10)产生更高的lnfp-v浓度(约17%)。值得注意的是,添加futa_mut2基因的第二基因组拷贝并不能提高所观察到的lnfp-v滴度,而与ca基因拷贝数无关。

实施例4

基于实施例2中公开的菌株8,产生了菌株14,使得它包含整合到参与给定碳源的代谢的基因座中并在glpf启动子的控制下表达的密码子优化的galtk基因的额外(第二)拷贝。

类似地,基于实施例2中公开的菌株9,产生了菌株15,使得它包含整合到大肠杆菌平台菌株的基因座中并在glpf启动子的控制下表达的密码子优化的galtk基因的额外(第二)拷贝。

培养后,测量以下lnfp-v的相对浓度(细胞内和细胞外浓度合计):

向具有α1,3/4-岩藻糖基转移酶基因的单个拷贝的菌株8中添加第二β1,3-半乳糖基转移酶基因拷贝对最终的lnfp-v没有影响。然而,当向包含α1,3/4-岩藻糖基转移酶基因的2个拷贝的菌株9中添加第二β1,3-半乳糖基转移酶基因拷贝时,lnfp-v滴度显著增加。

序列表

<110>格礼卡姆股份公司

<120>岩藻糖基化寡糖lnfp-v的合成

<130>134wo00

<160>7

<150>dk201800952

<151>2018-12-04

<170>bissap1.3.6

<210>1

<211>441

<212>prt

<213>人工序列

<220>

<223>ma等人.j.biol.chem.281,6385(2006)

<400>1

metpheglnproleuleuaspalatyrvalgluseralaserileglu

151015

lysmetalaserlysserproproproleulysilealavalalaasn

202530

trptrpglyaspglugluilelysgluphelysasnservalleutyr

354045

pheileleuserglnargtyrthrilethrleuhisglnasnproasn

505560

glupheseraspleuvalpheglyasnproleuglyseralaarglys

65707580

ileleusertyrglnasnalalysargvalphetyrthrglygluasn

859095

gluserproasnpheasnleupheasptyralaileglypheaspglu

100105110

leuasppheasnaspargtyrleuargmetproleutyrtyrasparg

115120125

leuhishislysalagluservalasnaspthrthralaprotyrlys

130135140

leulysaspasnserleutyralaleulyslysproserhiscysphe

145150155160

lysglulyshisproasnleucysalavalvalasnaspgluserasp

165170175

proleulysargglyphealaserphevalalaserasnproasnala

180185190

proileargasnalaphetyraspalaleuasnserilegluproval

195200205

thrglyglyglyservalargasnthrleuglytyrasnvallysasn

210215220

lysasnglupheleuserglntyrlyspheasnleucysphegluasn

225230235240

thrglnglytyrglytyrvalthrglulysileileaspalatyrphe

245250255

serhisthrileproiletyrtrpglyserproservalalalysasp

260265270

pheasnprolysserphevalasnvalhisaspphelysasnpheasp

275280285

glualaileasptyrilelystyrleuhisthrhislysasnalatyr

290295300

leuaspmetleutyrgluasnproleuasnthrleuaspglylysala

305310315320

tyrphetyrglnasnleuserphelyslysileleualaphephelys

325330335

thrileleugluasnaspthriletyrhisaspasnpropheilephe

340345350

cysargaspleuasngluproleuvalthrileaspaspleuargval

355360365

asntyraspaspleuargvalasntyraspaspleuargileasntyr

370375380

aspaspleuargvalasntyraspaspleuargileasntyraspasp

385390395400

leuargvalasntyraspaspleuargvalasntyraspaspleuarg

405410415

ileasntyraspaspleuargvalasntyraspaspleuargvalasn

420425430

tyrgluargleuleuserlysalathr

<210>2

<211>478

<212>prt

<213>α1,3-岩藻糖基转移酶[幽门螺杆菌nctc11639]

<220>

<223>genbankid:aab81031.1

<400>2

metpheglnproleuleuaspalatyrvalgluseralaserileglu

151015

lysmetalaserlysserproproproleulysilealavalalaasn

202530

trptrpglyaspglugluilelysgluphelysasnservalleutyr

354045

pheileleuserglnargtyrthrilethrleuhisglnasnproasn

505560

glupheseraspleuvalpheglyasnproleuglyseralaarglys

65707580

ileleusertyrglnasnalalysargvalphetyrthrglygluasn

859095

gluserproasnpheasnleupheasptyralaileglypheaspglu

100105110

leuasppheasnaspargtyrleuargmetproleutyrtyrasparg

115120125

leuhishislysalagluservalasnaspthrthralaprotyrlys

130135140

leulysaspasnserleutyralaleulyslysproserhiscysphe

145150155160

lysglulyshisproasnleucysalavalvalasnaspgluserasp

165170175

proleulysargglyphealaserphevalalaserasnproasnala

180185190

proileargasnalaphetyraspalaleuasnserilegluproval

195200205

thrglyglyglyservalargasnthrleuglytyrasnvallysasn

210215220

lysasnglupheleuserglntyrlyspheasnleucysphegluasn

225230235240

thrglnglytyrglytyrvalthrglulysileileaspalatyrphe

245250255

serhisthrileproiletyrtrpglyserproservalalalysasp

260265270

pheasnprolysserphevalasnvalhisaspphelysasnpheasp

275280285

glualaileasptyrilelystyrleuhisthrhislysasnalatyr

290295300

leuaspmetleutyrgluasnproleuasnthrleuaspglylysala

305310315320

tyrphetyrglnasnleuserphelyslysileleualaphephelys

325330335

thrileleugluasnaspthriletyrhisaspasnpropheilephe

340345350

cysargaspleuasngluproleuvalthrileaspaspleuargval

355360365

asntyraspaspleuargvalasntyraspaspleuargileasntyr

370375380

aspaspleuargvalasntyraspaspleuargileasntyraspasp

385390395400

leuargvalasntyraspaspleuargvalasntyraspaspleuarg

405410415

ileasntyraspaspleuargvalasntyraspaspleuargvalasn

420425430

tyrgluargleuleuserlysalathrproleuleugluleusergln

435440445

asnthrthrserlysiletyrarglysalatyrglnlysserleupro

450455460

leuleuargalaileargargtrpvallyslysleuglyleu

465470475

<210>3

<211>425

<212>prt

<213>岩藻糖基转移酶[幽门螺杆菌26695]

<220>

<223>genbankid:np_207177.1

<400>3

metpheglnproleuleuaspalapheilegluseralaserileglu

151015

lysmetalaserlysserproproproproleulysilealavalala

202530

asntrptrpglyaspglugluilelysgluphelyslysservalleu

354045

tyrpheileleuserglnargtyralailethrleuhisglnasnpro

505560

asnglupheseraspleuvalpheserasnproleuglyalaalaarg

65707580

lysileleusertyrglnasnthrlysargvalphetyrthrglyglu

859095

asngluserproasnpheasnleupheasptyralaileglypheasp

100105110

gluleuasppheasnaspargtyrleuargmetproleutyrtyrala

115120125

hisleuhistyrlysalagluleuvalasnaspthrthralaprotyr

130135140

lysleulysaspasnserleutyralaleulyslysproserhishis

145150155160

phelysgluasnhisproasnleucysalavalvalasnaspgluser

165170175

aspleuleulysargglyphealaserphevalalaserasnalaasn

180185190

alaprometargasnalaphetyraspalaleuasnserileglupro

195200205

valthrglyglyglyservalargasnthrleuglytyrlysvalgly

210215220

asnlysserglupheleuserglntyrlyspheasnleucyspheglu

225230235240

asnserglnglytyrglytyrvalthrglulysileleuaspalatyr

245250255

pheserhisthrileproiletyrtrpglyserproservalalalys

260265270

asppheasnprolysserphevalasnvalhisasppheasnasnphe

275280285

aspglualaileasptyrilelystyrleuhisthrhisproasnala

290295300

tyrleuaspmetleutyrgluasnproleuasnthrleuaspglylys

305310315320

alatyrphetyrglnaspleuserphelyslysileleuaspphephe

325330335

lysthrileleugluasnaspthriletyrhislyspheserthrser

340345350

phemettrpglutyraspleuhislysproleuvalserileaspasp

355360365

leuargvalasntyraspaspleuargvalasntyraspargleuleu

370375380

glnasnalaserproleuleugluleuserglnasnthrthrphelys

385390395400

iletyrarglysalatyrglnlysserleuproleuleuargalaval

405410415

arglysleuvallyslysleuglyleu

420425

<210>4

<211>425

<212>prt

<213>人工序列

<220>

<223>choietal.biotechnol.bioengin.113,1666(2016)

<400>4

metpheglnproleuleuaspalapheilegluseralaserileglu

151015

lysmetalaserlysserproproproproleulysilealavalala

202530

asntrptrpglyaspglugluilelysgluphelyslysservalleu

354045

tyrpheileleuserglnargtyralailethrleuhisglnasnpro

505560

asnglupheseraspleuvalpheserasnproleuglyalaalaarg

65707580

lysileleusertyrglnasnthrlysargvalphetyrthrglyglu

859095

asngluserproasnpheasnleupheasptyralaileglypheasp

100105110

gluleuasppheasnaspargtyrleuargmetproleutyrtyrasn

115120125

gluleuhistyrlysalagluleuvalasnaspthrthralaprotyr

130135140

lysleulysaspasnserleutyralaleulyslysproserhishis

145150155160

phelysgluasnhisproasnleucysalavalvalasnaspgluser

165170175

aspleuleulysargglyphealaserphevalalaserasnalaasn

180185190

alaprometargasnalaphetyraspalaleuasnserileglupro

195200205

valthrglyglyglyservalargasnthrleuglytyrlysvalgly

210215220

asnlysserglupheleuserglntyrlyspheasnleucyspheglu

225230235240

asnserglnglytyrglytyrvalthrglulysileleuaspalatyr

245250255

pheserhisthrileproiletyrtrpglyserproservalalalys

260265270

asppheasnprolysserphevalasnvalhisasppheasnasnphe

275280285

aspglualaileasptyrilelystyrleuhisthrhisproasnala

290295300

tyrleuaspmetleutyrgluasnproleuasnthrleuaspglylys

305310315320

alatyrphetyrglnaspleuserphelyslysileleuaspphephe

325330335

lysthrileleugluasnaspthriletyrhislyspheserthrser

340345350

phemettrpglutyraspleuhislysproleuvalserileaspasp

355360365

leuargvalasntyraspaspleuargvalasntyraspargleuleu

370375380

glnasnalaserproleuleugluleuserglnasnthrthrphelys

385390395400

iletyrarglysalatyrglnlysserleuproleuleuargalaval

405410415

arglysleuvallyslysleuglyleu

420425

<210>5

<211>300

<212>dna

<213>人工序列

<220>

<223>pglpf变体

<400>5

gcggcacgccttgcagattacggtttgccacacttttcatccttctcctggtgacataat60

ccacatcaatcgaaaatgttaataaatttgttgcgcgaatgatctaacaaacatgcatca120

tgtacaatcagatggaataaatggcgcgataacgctcattttatgacgaggcacacacat180

tttaagttcgatatttctcgtttttgctcgttaacgataagtttacagcatgcctacaag240

catcgtggaggtccgtgactttcacgcatacaacaaacattaaccaaggaggaaacagct300

<210>6

<211>439

<212>prt

<213>人工序列

<220>

<223>galtk

<400>6

metileservaltyrileileserleulysgluserglnargargleu

151015

aspthrglulysleuvalleugluserasnglulysphelysglyarg

202530

cysvalpheglnilepheaspalaileserprolyshisgluaspphe

354045

glulysphevalglngluleutyraspserserserleuleulysser

505560

asptrpphehisserasptyrcystyrglngluleuleuproglnglu

65707580

pheglycystyrleuserhistyrleuleutrplysglucysvallys

859095

leuasnglnprovalvalileleugluaspaspvalalaleugluser

100105110

asnphemetglnalaleugluaspcysleulysserpropheaspphe

115120125

valargleutyrglyhistyrtrpglyglyhislysthrasnleucys

130135140

alaleuprovaltyrthrgluthrgluglualaglualaserileglu

145150155160

lysthrproilegluasntyrgluvalthrserproproproproasn

165170175

prothrargaspthrglnglnasppheilethrgluthrglnglnasp

180185190

prolysgluleusergluprocyslysilealaproglnlysileser

195200205

pheasnglnvalvalphelyslysilelysarglysleuasnargphe

210215220

ileglyserileleualaargthrgluvaltyrlysasnilevalala

225230235240

lystyraspaspleuthrthrlystyraspaspleuthrthrlystyr

245250255

aspaspleuthrthrlystyraspaspleuthrthrlystyraspasp

260265270

leuasnlysasnilealaglulystyraspgluleumetglylystyr

275280285

gluserleuleualalysgluvalasnilelysgluthrphetrpglu

290295300

serargalaaspserglulysglualaleupheleuasphisphetyr

305310315320

leuthrservaltyrvalalathrthralaglytyrtyrleuthrpro

325330335

lysglyalalysthrpheileglualathrgluargphelysileile

340345350

gluprovalaspmetpheileasnasnprothrtyrhisaspileala

355360365

asnphethrtyrvalprocysprovalserleuasnlyshisalaphe

370375380

asnserthrileglnasnalalyslysproaspileserleulyspro

385390395400

prolyslyssertyrpheaspasnleuphetyrhislyspheasnala

405410415

arglyscysleulysalapheasnlystyrserlysglntyralapro

420425430

leulysthrprolysgluval

435

<210>7

<211>425

<212>prt

<213>人工序列

<220>

<223>

<400>7

metpheglnproleuleuaspalapheilegluseralaserileglu

151015

lysmetalaserlysserproproproproleulysilealavalala

202530

asntrptrpglyaspglugluilelysgluphelyslysservalleu

354045

tyrpheileleuserglnargtyralailethrleuhisglnasnpro

505560

asnglupheseraspleuvalpheserasnproleuglyalaalaarg

65707580

lysileleusertyrglnasnthrlysargvalphetyrthrglyglu

859095

asngluserproasnpheasnleupheasptyralaileglypheasp

100105110

gluleuasppheasnaspargtyrleuargmetproleutyrtyrasn

115120125

gluleuhistyrlysalagluleuvalasnaspthrthralaprotyr

130135140

lysleulysglyasnserleutyralaleulyslysproserhishis

145150155160

phelysgluasnhisproasnleucysalavalvalasnaspgluser

165170175

aspleuleulysargglyphealaserphevalalaserasnalaasn

180185190

alaprometargasnalaphetyraspalaleuasnserileglupro

195200205

valthrglyglyglyservalargasnthrleuglycyslysvalgly

210215220

asnlysserglupheleuserglntyrlyspheasnleucyspheglu

225230235240

asnserglnglytyrglytyrvalthrglulysileleuaspalatyr

245250255

pheserhisthrileproiletyrtrpglyserproservalalalys

260265270

asppheasnprolysserphevalasnvalhisasppheasnasnphe

275280285

aspglualaileasptyrilelystyrleuhisthrhisproasnala

290295300

tyrleuaspmetleutyrgluasnproleuasnthrleuaspglylys

305310315320

alatyrphetyrglnaspleuserphelyslysileleuaspphephe

325330335

lysthrileleugluasnaspthriletyrhislyspheserthrser

340345350

phemettrpglutyraspleuhislysproleuvalserileaspasp

355360365

leuargvalasntyraspaspleuargvalasntyraspargleuleu

370375380

glnasnalaserproleuleugluleuserglnasnthrthrphelys

385390395400

iletyrarglysalatyrglnlysserleuproleuleuargalaval

405410415

arglysleuvallyslysleuglyleu

420425

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1