背景技术:
1、寡糖通常以糖偶联形式存在于蛋白质与脂质中,参与许多重要现象,例如与受精、胚胎发生(embryogenesis)、发炎、转移与宿主病原体贴附的发展与进程相关的分化、发育与生物识别过程。寡糖也可以作为未结合的聚糖存在于体液和母乳中,其中它们也调节重要的发育与免疫过程(bode,early hum.dev.1-4(2015);reily et al.,nat.rev.nephrol.15,346-366(2019);varki,glycobiology 27,3-49(2017))。岩藻糖-α1,2-半乳糖-r(fuc-a1,2-gal-r)已在多种类型的寡糖与蛋白质和脂质的糖偶联形式中被鉴定。其包含与其他聚糖、糖蛋白或糖脂相连的双糖岩藻糖-α1,2-半乳糖抗原表位。所述岩藻糖-α1,2-半乳糖抗原表位经常被报导参与神经元形态学(neuronal morphology)、神经元发育(neuronal development)、学习与记忆(kalovidouris et al.,j.am.chem.soc.127(5),1340-1341(2005);tosh et al.,sci.rep.9,18806(2019))。fuc-a1,2-gal也是母乳中最丰富的寡糖2'-岩藻糖基乳糖(2'fl,fuc-a1,2-gal-b1,4-glc)的一部分。人乳寡糖(human milk oligosaccharides,hmo),特别是2'fl具有多种功能,包括益生元、免疫、肠道和认知益处(reverri et al.,nutrients 10(10),1346(2018))。fuc-a1,2-gal也形成h抗原,其为a与b血型抗原的亚结构(substructure)。α-1,3糖基化形式的岩藻糖-α1,2-半乳糖抗原表位是组织血型abh碳水化合物抗原表位(也称为组织血型抗原(histo-blood groupantigens),hbga)的一部分。hbga是一种复合的碳水化合物,于许多细胞类型的表面被发现,包括上皮肠细胞且作为游离寡糖于生物体液,如唾液与乳汁中(marionneau et al.,biochimie 83,565-573(2001))。fuc-a1,2-gal基团也存在于乳-n-岩藻糖五糖i(lnfp-i、fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)中,此为一种存在于人乳中的高度丰富的寡糖。lnfp-i代表一种重要的免疫调节剂,可藉由抑制病原菌如大肠杆菌(epec、upec)与病毒等的贴附来避免养育婴儿严重感染性腹泻。lnfp-i也与病原体毒素的结合、b组链球菌(streptococci)的生长抑制与双歧杆菌群落(bifidobacterial communities)的选择性刺激有关(derya et al.,j.biotechnol.318,31-38(2020);gotoh et al.,sci.rep.8,13958(2018);lin et al.j.biol.chem.292,11243-11249(2017);sotgiu et al.,int.j.biomed.sci.2(2),114-120(2006))。lnfp-i可以进一步以末端半乳糖或n-乙酰半乳糖胺基团修饰,分别产生携带b抗原(gal-a1,3-(fuc-a1,2)-gal-beta)或a抗原(galnac-a1,3-(fuc-a1,2)-gal-beta)的寡糖结构。这些寡糖结构具有巨大的科学与商业利益,但其可用性有限,由于产生依赖于化学或化学酶合成,或从天然来源,例如动物乳汁纯化。化学合成方法费时费力,并且由于涉及大量步骤,因此难以扩大规模。酶方法比化学合成具有优势,但必需酶的立体特异性与区域选择性仍然是一项艰巨的挑战。
2、本发明的一个目的是提供工具与方法,藉由这些工具与方法的方式可以高效、时间与成本有效的方式,并且若需要,连续方法来产生α-1,3糖基化形式的fuc-a1,2-gal-r。
3、根据本发明,藉由提供用于产生α-1,3糖基化形式的fuc-a1,2-gal-r的细胞、方法与新型态的糖基转移酶(glycosyltransferase)来实现此目的与其他目的,其中细胞经过基因修饰以产生所述的α-1,3糖基化形式的fuc-a1,2-gal-r。
4、发明概述
5、令人惊讶的是,现已发现可以藉由单一细胞产生α-1,3糖基化形式的fuc-a1,2-gal-r。本发明提供了一种用于产生α-1,3糖基化形式的fuc-a1,2-gal-r的细胞与方法。该方法包括提供具有合成fuc-a1,2-gal-r的能力、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferas)与具有合成为α-1,3-糖基转移酶的供体的核苷酸-糖的细胞的步骤,且于允许产生α-1,3糖基化形式的fuc-a1,2-gal-r的条件下培养该细胞。本发明也提供分离该α-1,3糖基化形式的fuc-a1,2-gal-r的方法。又,本发明提供代谢工程化细胞以产生α-1,3糖基化形式的fuc-a1,2-gal-r。
6、定义
7、本说明书中描述本发明及其各种实施例的术语不可仅理解为其通常所定义的含意,且应通过本说明书中的特殊定义而包括通常所定义的含意范围以外的结构、材料或动作。因此,若一个要素在本说明书的背景下可被理解为包括一种以上的含意,则在权利要求书中使用此要素需理解为说明书与该术语本身所支持的所有可能含意是通用的。
8、于此揭示的发明的各种实施例与方面不仅在本说明书具体描述的顺序与背景下进行解读,且应包括任何顺序及其任何组合。每当内容有需要,所有以单数形式的术语应视为包含复数,反之亦然。除非另有定义,于此使用的所有技术与科学术语一般具有本发明所属技术领域中具有通常知识者一般理解的相同含意。一般而言,于此使用的命名法及细胞培养、分子遗传学、有机化学与核酸化学的实验程序及于此所述的杂交(hybridization)步骤为本领域所周知且时常采用的。标准技术用于核酸与肽合成。一般而言,根据制造商说明书来进行纯化步骤。
9、本说明书中揭示了本发明的实施例,且虽然使用了特定术语,但术语仅是以描述性质而使用,并非用以作为限定,本发明的范围如下文权利要求书所述。应能理解的是,所述实施例仅是出于例示的目的而描述,不应将其视为限定本发明。对于本发明所属技术领域中具有通常知识者显而易见的是,其他实施例、改良、细节和用途与本发明的文字及精神为一致的且在本发明的范围以内,仅以权利要求书来限定本发明的范围,且以包括等同原则的专利法来进行解读。仅是为了便于描述起见,在下文权利要求书中,提供了用以表明权利要求书步骤的参考符号,而并非意图隐含进行这些步骤的特定顺序。
10、在此文件及其权利要求书中,动词「包括(comprise)」及其词型变化是以非限定的方式而使用,以意指在此术语之后所包含的项目,但不排除未特别提及的项目。在整个申请中,可利用「由…所组成」或「实质上由…所组成」取代动词「包括」,反之亦然。此外,可利用「实质上由…所组成」取代动词「由…所组成」,「实质上由…所组成」指的是于此所定义的组合物可包括所特别指明之外的额外成分,所述额外成分不会改变本发明的独特的特征。此外,以不定冠词「一(a或an)」提及成分不排除存在一个成分以上的可能性,除非内容明确指出仅有一个成分或其中一个成分。因此,不定冠词「一(a或an)」一般指的是「至少一个」。
11、在整个申请中,除非另有明确说明,「合成(synthesize)」、「合成(synthesized)」与「合成(synthesis)」的特征分别与特征「产生(produce)」、「产生(produced)」与「产生(production)」的互换使用。
12、除非另有说明,于此所识别的每个实施例可以组合在一起。本说明书中提及的所有出版物、专利与专利申请案通过引用的方式并入于此,就如同明确且单独指明各个单独的出版物、专利或专利申请案通过引用的方式并入于此。优先权申请案,包括ep20190208、ep20190198及ep20190199,其全文亦通过引用的方式并入于此,就如同明确且单独指明所述优先权申请案通过引用的方式并入于此。
13、根据本发明,「多核苷酸」一词通常指的是任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的rna或dna或者修饰的rna或dna。「多核苷酸」包括但不限于单链和双链dna,作为单链和双链区域或单链、双链和三链区域的混合物的dna、单链和双链rna,以及作为单链和双链区域的混合物的rna,包含dna和rna,其可以是单链,或更典型的双链或三链区域,或单链和双链区域的混合物的杂交分子。此外,于此所使用的「多核苷酸」指的是包含rna或dna或者rna和dna两者的三链区域。这些区域中的链可以来自相同分子或来自不同的分子。这些区域可以包括所有的一个或多个分子,但更典型地只涉及一些分子的区域。三螺旋区域的分子之一通常是寡核苷酸。如于此所使用,「多核苷酸」一词还包括如上所述含有一个或多个修饰碱基的dna或rna。因此,具有出于稳定性或其他原因而修饰的主链的dna或rna是根据本发明的「多核苷酸」。再者,包含不寻常碱基,例如肌苷(inosine))或修饰的碱基(例如三酰化(tritylated)碱基的dna或rna应理解为涵盖在「多核苷酸」一词中。应当理解,已经对dna和rna进行了多种修饰,其用于本领域技术人员已知的许多有用目的。于此中使用的「多核苷酸」一词包括这种经化学、酶或代谢修饰的多核苷酸形式,以及病毒和细胞,包括如简单和复杂细胞所特有的dna和rna的化学形式。「多核苷酸」一词也包括通常称为寡核苷酸的短多核苷酸。
14、「多肽」是指包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。「多肽」指的是短链,通常称为肽、寡肽和寡聚物,也指的是长链,通常称为蛋白质。多肽可以含有20种基因编码氨基酸以外的氨基酸。「多肽」包括通过自然过程修饰的多肽,例如经过处理和其他翻译后修饰,也包括通过化学修饰技术修饰的多肽。这样的修饰在基础教科书和更详细的专著中以及多卷研究文献中充分描述,并且其对于本领域技术人员是周知的。相同类型的修饰可以以相同的程度或不同的程度存在于给定多肽中的数个位点上。此外,给定的多肽可以包含许多类型的修饰。修饰可以在多肽的任意位置发生,包括肽主链、氨基酸侧链和氨基末端或羧基末端。修饰包括,例如,乙酰化(acetylation)、酰化(acylation)、adp-核糖基化、酰胺化、黄素(flavin)的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酸肌醇(phosphatidylinositol)的共价连接、交联、环化(cyclization)、二硫键(disulphidebond)形成、去甲基化作用、共价交联的形成、焦谷氨酸(pyroglutamate)的形成、甲酰化作用、γ-羧基化、糖基化、gpi锚定形成、羟基化、碘化、甲基化、荳蔻酰化(myristolyation)、氧化、蛋白水解处理、磷酸化、异戊二烯化(prenylation)、外消旋化(racemization)、脂质连接、硫化、谷氨酸残基的γ-羧化、羟基化和adp-核糖基化、硒化(selenoylation)、向蛋白质添加转移rna介导的氨基酸,诸如精氨化和泛素化。多肽可以是分支的或有或无分支的环状。环状、分支的和分支环状的多肽可以由翻译后天然过程形成,并且也可以通过全合成法(entirely synthetic methods)制得。
15、如于此所使用的,术语「编码多肽的多核苷酸」包括包含编码本发明多肽的序列的多核苷酸。此术语还包括多核苷酸,所述多核苷酸包括编码多肽的单一连续区域或不连续区域(例如,被整合的噬菌体或插入序列或通过编辑所间隔)以及也可包含编码及/或非编码序列的额外区域。
16、「分离的(isolated)」指的是「通过人工的方式」由其天然状态改变,亦即,如果存在于自然界,则其已经改变或从其原始环境中移出,或者二者。例如,天然存在于生物体中的多核苷酸或多肽不是「分离的」,但是与其天然状态的共存物质分开的相同的多核苷酸或多肽是「分离的」,如此术语在于此中所用的。同样地,如于此所使用的术语「合成的」序列是指合成产生而不是从天然来源直接分离的任何序列。如于此所使用的术语「合成的」是指任何合成生成的序列,并且不是直接从天然来源分离出来的。
17、如于此提及细胞或宿主细胞而使用的「重组的(recombinant)」或「转基因的(transgenic)」或「代谢工程化(metabolically engineered)」或「经基因改造的(genetically modified)」一词可交替使用,且指的是细胞复制异源核酸或表达异源核酸(亦即,对所述细胞而言是外来的序列,或对所述细胞中的所述位置或环境而言是外来的序列)编码的肽或蛋白质。这类细胞被描述为用至少一种异源或外源基因进行转化,或描述为通过导入至少一种异源或外源基因而进行转化。代谢改造或重组或转基因细胞可包含在细胞的天然(非重组)形式中不存在的基因。重组细胞也可包含在细胞的天然形式中存在的基因,其中这些基因是经过修饰且利用人工方式重新导入至细胞。这些术语也包含含有对细胞而言为内源的核酸的细胞,所述核酸已经过修饰,或其表达或活性已在未从细胞移除核酸的情况下进行修饰,这些修饰包括通过基因取代而取得的修饰、启动子(promoter)的取代、定点突变(site-specific mutation)及相关的技术。因此,「重组多肽」是由重组细胞所生产。如于此所使用的,「异源序列」或「异源核酸」是源自对特定细胞而言是外来的来源(例如,从不同的物种),或者,若是源自相同来源,则是从其原始形式或基因体中的位置进行修饰。因此,与启动子可操作连接的异源核酸来自与衍生启动子的来源不同的来源,或者,若是自相同来源,则从其原始形式或基因体中的位置进行修饰。可稳定地导入异源序列,例如,通过转染、转化、接合或转导(transduction),到宿主微生物细胞的基因体中,其中可以应用取决于细胞和将导入序列的技术。各种技术对于本发明所属技术领域具有通常知识者而言是习知的,且揭露于如sambrook et al.,molecular cloning:a laboratory manual,2nd ed.,cold spring harbor laboratory press,cold spring harbor,n.y.(1989)中。本
技术实现要素:
中所使用的「突变」细胞或微生物指的是经基因改造的细胞或微生物。
18、在本发明内容中的「内源的」一词是指任何多核苷酸、多肽或蛋白质序列,其是细胞的天然部分并且存在于其在细胞染色体中的自然位置。「外源的」一词是指任何多核苷酸、多肽或蛋白质序列,其源自于所研究的细胞外部,并且不是细胞的天然部分,或不存在于细胞染色体或质粒中的其自然位置。
19、「异源的」一词当用于提及多核苷酸、基因、核酸、多肽或酶时,是指来自或衍生自宿主物种以外的来源的多核苷酸、基因、核酸、多肽或酶。相反地,于此使用的「同源」多核苷酸、基因、核酸、多肽或酶来表示衍生自宿主生物体物种的多核苷酸、基因、核酸、多肽或酶。当提及用于维持或操纵基因序列的基因调控序列或辅助核酸序列时(例如,启动子、5'未翻译区、3'未翻译区、poly a附加序列、内含子(intron)序列、剪接位点(splice site)、核糖体结合位点、内部核糖体进入序列、基因体同源区、重组位点等),「异源的」是指调控序列或辅助序列与在构建体、基因体、染色体或附加体(episome)中与调控或辅助核酸序列并列的基因未有天然关联。因此,可操作地连接至在其天然状态下(亦即,在非基因改造生物体的基因体中)非可操作地连接至的基因的启动子在于此中被称为「异源启动子」,即使该启动子可衍生自与其所连接的基因相同的物种(或在某些情况下,相同的生物体)。
20、蛋白质或酶「经修饰的活性」一词是关于与所述蛋白质或酶的野生型活性(即,天然活性)相比蛋白质或酶活性的变化。所述经修饰的活性与蛋白质或酶的野生型活性相比可以是所述蛋白质或酶经破坏、削弱、减少或延迟的活性,但与蛋白质或酶的野生型活性相比也可以是所述蛋白质或酶加速或增强的活性。通过修饰所述蛋白质或酶的表达或通过表达修饰型(即,突变型)蛋白质或酶而达到蛋白质或酶经修饰的活性。酶经修饰的活性更关于酶的表观(apparent)michaelis常数km及/或表观最大速率(vmax)中的修饰。
21、基因「经修饰的表达」一词是关于在编码蛋白质生产过程的任何阶段中,所述基因的表达量与野生型相比的变化。所述经修饰的表达与野生型相比为较低或较高的表达量,其中「较高的表达量」一词也定义为以内源基因而言所述基因的「过表达(overexpression)」,或以未存在于野生型品系的异源基因而言的表达。藉由技术人员通常习知技术来达到较低的表达量或减弱的表达量,例如使用sirna、crispr、crispri、核糖开关(riboswitch)、重组介导的基因工程(recombination-mediated genetic engineering,recombineering)、同源重组、ssdna诱发突变(mutagenesis)、rnai、mirna、asrna、突变基因、剔除基因、转位子(transposon)诱发突变等,这些技术以不太可能(亦即,与功能性野生型基因相比统计上显著「不太可能」)或完全无法(例如,剔除基因)生产功能性最终产物的方式而改变基因。如于此所使用的,「核糖开关(riboswitch)」一词是定义为信使rna(messenger rna)的一部分,其折叠为错综复杂的结构而通过干扰翻译阻挡表达。与效应分子结合造成构型改变,进而得以调控转录后的表达。
22、以降低表达量的方式改变感兴趣的基因是通过如上述所述而获得,也可通过改变转录单元(transcription unit)、启动子、未翻译区、核糖体结合位点、shine dalgarno序列或转录终止序列(terminator)来获得较低的表达量。例如,可通过突变启动子序列中一或多个碱基对或将启动子序列完全改变为比野生型具有更低表达强度的组成型启动子(constitutive promoter)或调控表达量的可诱导型启动子或调控表达量的可抑制型启动子。
23、藉由技术人员通常习知技术来达到过表达或表达,例如使用人造转录因子、从头合成设计启动子序列、改造rna开关、在常染色质(euchromatin)导入或再导入表达模块或使用高复制数量的质粒,其中所述基因是「表达盒(expression cassette)」的一部份,其是关于其中存在有启动子序列、未翻译区序列、编码序列以及视需要而定的转录终止序列的任何序列,并造成功能活性蛋白质的表达。所述表达是组成型(constitutive)的或受调控的。
24、「组成型表达(constitutive expression)」一词定义为在特定成长条件下,不受rna聚合酶的次单位(例如,细菌sigma因子)以外的转录因子调控的表达。这些转录因子的非限制性范例为大肠杆菌中的crp、laci、arca、cra与iclr。这些转利因子结合至特定序列且在特定成长条件下可阻挡或增强表达。rna聚合酶结合至特定序列以起始转录,例如通过原核宿主的sigma因子。
25、「调控的表达」一词定义为在特定成长条件下,受到rna聚合酶的次单位(例如,细菌sigma因子)以外的转录因子调控的表达。这些转录因子的范例如前文所述。通过诱导子(inducer)或抑制子(repressor)来达到通常表达调控,例如但不限于,iptg、阿拉伯糖(arabinose)、鼠李糖(rhamnose)、岩藻糖(fucose)、异乳糖(allolactose)或调整ph、或调整温度或碳耗竭,或通过受质、产物或化学抑制法。
26、术语「通过天然诱导子的表达」定义为仅在宿主的自然条件下(例如,分娩中的生物,或在泌乳期时)表达的基因的兼性或调控表达,对于环境变化(例如,包括荷尔蒙、热、冷、ph改变、光线、氧化压力或渗透压力/信号)有所反应,或取决于发育阶段的位置或所述宿主细胞的细胞周期,但不限于细胞凋亡(apoptosis)或细胞自噬(autophagy)。
27、术语「化学处理后可诱导的表达」定义为仅在用化学诱导子或抑制子处理后表达的基因的兼性或调控表达,其中所述诱导子与抑制子包括但不限于醇类(例如,乙醇、甲醇)、碳水化合物(例如,葡萄糖、半乳糖、甘油、乳糖、阿拉伯糖、鼠李糖、岩藻糖、异乳糖(allo-lactose))、金属离子(例如,铝、铜、锌)、氮气、磷酸盐、异丙基-β-d-硫代半乳糖苷(isopropylβ-d-1-thiogalactopyranoside,iptg)、醋酸盐、甲酸盐或二甲苯。
28、「控制序列(control sequences)」一词是指由宿主细胞转录和翻译系统识别的序列,能够使多核苷酸序列转录及翻译成多肽。因此,这种dna序列对于在特定宿主细胞或生物体中表达可操作连接的编码序列是必需的。这种控制序列可以是但不限于启动子序列、核糖体结合序列、shinedalgarno序列、kozak序列、转录终止子序列。例如,适用于原核生物的控制序列包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多聚腺苷酸化信号和增强子。如果前序列或可分泌前导物(secretory leader)的dna作为参与多肽分泌的前蛋白表达,则将前序列或可分泌前导物的dna可操作地连接到多肽的dna;如果启动子或增强子影响序列的转录,则将启动子或增强子可操作地连接到编码序列;或者如果核糖体结合位点影响序列的转录,则将核糖体结合位点可操作地连接到编码序列;或者如果核糖体结合位点的定位便于翻译,则将核糖体结合位点可操作地连接到编码序列。所述控制序列还可利用外部化学物质(例如,但不限于iptg、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖)经由可诱导启动子或经由诱导或抑制所述多核苷酸转录或翻译为多肽的遗传回路而得到另外控制。
29、一般而言,「可操作连接」是指被连接的dna序列是连续的,且在可分泌前导物的情况下,是连续的并处于阅读框架中。然而,增强子不必是连续的。
30、「野生型」一词指的是通常习知发生于自然界的遗传型或表达型情况。
31、如于此所使用,术语「蛋白质经修饰的表达」是指相较于野生型(即,天然)蛋白质:i)内源性蛋白质较高的表达或过表达,ii)异源性蛋白质的表达,或iii)具有较高活性的变体蛋白质的表达及/或过表达。
32、如于此所使用,「乳腺细胞」一词一般是指乳腺上皮细胞、乳腺上皮腔细胞或哺乳动物上皮乳泡细胞(alveolar cell)或前述的任何组合。如于此所使用,「类乳腺细胞」一词一般是指具有与自然乳腺细胞相似(或实质上相似)但源自于非乳腺细胞来源的表达型/基因型的细胞。这样的类乳腺细胞可经过改造以移除至少一种不需要的遗传成分,及/或包括至少一种典型的乳腺细胞的预定基因建构体(construct)。类乳腺细胞的非限制性范例可包括类乳腺上皮细胞、类乳腺上皮腔细胞、展现出乳腺细胞品系细胞的一或多种特征的非乳腺细胞或前述的任何组合。类乳腺细胞更多的非限制性范例可包括具有与自然乳腺细胞相似(或实质上相似)的表达型的细胞。具有表达型或展现出与自然乳腺细胞或乳腺上皮细胞相似(或实质上相似)的至少一种特征的细胞可包括展现出可自然表达至少一种乳汁成分或经改造为可表达至少一种乳汁成分的细胞(例如,源自乳腺细胞品系或非乳腺细胞品系)。
33、如于此所使用,「非乳腺细胞」一般可包括非乳腺细胞品系的任何细胞。在本发明的背景下,非乳腺细胞可以是可经改造而表达至少一种乳汁成分的任何哺乳类细胞。这样的非乳腺细胞的非限制性范例包括肝细胞、血细胞、肾细胞、脐带血细胞、上皮细胞、表皮细胞、肌细胞、纤维母细胞、间质细胞或前述的任何组合。在一些范例中,分子生物学和基因体编辑技术可被设计为同时消除、沉默或减弱各式各样的基因。
34、在本技术中,除非有明确说明,否则「可(capable of)…<动词>」与「可(capableto)…<动词>」的表示方式较佳为利用动词的主动语态取代,且反之亦然。例如,「可表达」的表示方式较佳为利用「表达」取代,且反之亦然,亦即,「表达」较佳为利用「可表达」取代。
35、如于此所使用,「变体(variant)」是分别不同于参考多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸或多肽典型的变体与另一参考多核苷酸的核苷酸序列不同。变体的核苷酸序列中的改变可能会或可能不会改变参考多核苷酸所编码的多肽氨基酸序列。如下文所讨论,核苷酸改变可能会造成参考序列所编码的多肽中氨基酸取代(substitution)、添加(addition)、缺失(deletion)、融合(fusion)与截断(truncation)。多肽典型的变体与另一参考多肽的氨基酸序列不同。一般而言,差异有限导致参考多肽与变体的序列整体而言非常相似,且在许多区域中相同。变体与参考多肽的差异可在于一或多个取代、添加、缺失的任何组合。取代或插入的氨基酸残基可能会或可能不会是遗传密码所编码的氨基酸残基。多核苷酸或多肽的变体可以是自然发生的,例如等位基因变体,或者可以是已知非自然发生的变体。多核苷酸或多肽非自然发生的变体可以利用突变技术、直接合成法及本发明所属技术领域中具有通常知识者已知的其他重组方法而产生。
36、如于此所使用,多肽的「衍生物」一词为在多肽的氨基酸序列中可能含有氨基酸残基的缺失、添加或置换,但会导致沉默变化,从而产生功能性等效多肽的多肽。可以基于极性、电荷、溶解性、疏水性、亲水性及/或所涉及残基的双性性质的相似性进行氨基酸取代。例如,非极性(疏水)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸;平面中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天门冬酰胺和谷氨酰胺;带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸与组氨酸;带负电荷的(酸性)氨基酸包括天门冬氨酸和谷氨酸。在本发明的前后文中,如于此所使用的衍生多肽是指能够表达出与原始多肽实质上相似的体外(in vitro)及/或体内(in vivo)活性的多肽,如通过许多标准中的任一个而进行判断,包括但不限于酶活性,且可以在翻译期间或之后进行不同的修饰。再者,可以将非经典氨基酸或化学氨基酸类似物置换于或添加至原始多肽序列中。
37、在一些实施例中,本发明设想到通过修饰如本发明中使用的酶结构来产生功能性变体。可通过氨基酸置换、缺失、添加或前述的组合来制造变体。例如,可合理预期用异亮氨酸或缬氨酸单独替换亮氨酸、用谷氨酸单独替换天门冬氨酸、用丝氨酸单独替换苏氨酸、或用结构上相关的氨基酸对氨基酸的相似取代(例如,保守型突变)不会对所得分子的生物活性产生重大影响。保守取代是发生在与其侧链相关的氨基酸家族内进行的取代。藉由评估变体多肽以类似于野生型多肽的方式在细胞中产生应答的能力,可以轻易地确定本发明的多肽的氨基酸序列中的改变是否会造成功能同系物。
38、于此所使用的「功能同系物」一词描述的是具有序列相似性(换言的,同源性)并且还共享如生化活性的至少一个功能特征的那些分子(altenhoff et al.,ploscomput.biol.8(2012)e1002514)。功能同系物通常对于相同的特征产生相似的,但不一定相同的程度。功能上同源的多肽具有相同的特征,其中一个同系物产生的定量测量值为另一个的至少10%;更典型为至少为20%,在约30%与约40%之间;例如,在约50%与约60%之间;在约70%与约80%之间;或者在约90%与约95%之间;在约98%与约100%之间,或者超过原始分子所产生的定量测量值的100%。因此,当分子具有酶活性时,功能同系物将具有与原始酶相比的上述酶活性百分比。如果分子是dna结合分子(例如,多肽),则同系物将具有上述结合亲与力百分比,藉由结合分子的重量与原始分子相比进行测量。
39、功能同系物与参考多肽可能是天然存在的多肽,并且序列相似性可能是由趋同或趋异演化事件所造成的。功能同系物有时被称为直系同源物(orthologs),其中「直系同源物」是指在另一物种中与参考基因或蛋白质功能等同的同源基因或蛋白质。
40、直系同源蛋白质为不同物种中的同源基因,其起源于最后一个共同祖先的单一基因的垂直遗传传递(vertical descent),其中此基因及其主要功能是保守的。同源基因为遗传自共同祖先的两种物种的基因。
41、当「直系同源」一词用于来自给定物种的氨基酸或核苷酸/核酸序列时,指的是来自不同物种的氨基酸或核苷酸/核酸序列。应能理解的是,当两个序列源自于通过线性遗传传递(linear descent)的共同祖先及/或在序列与生物功能方面密切相关时,这两个序列彼此互为直系同源物。直系同源物通常具有高度的序列相似度,但可能不会(且一般不会)共有100%的序列相似度。
42、旁系同源基因(paralogous gene)是源自基因复制现象的同源基因。旁系同源基因通常属于相同物种,但这并非必需条件。旁系同源基因可分为内旁系同源基因(in-paralog,物种形成事件之后出现的同种同源对)与外旁系同源基因(out-paralog,物种形成事件之前出现的同种同源对)。物种之间的外旁系同源基因为物种形成之前因复制而存在于两种生物之间成对的同种同系物。在物种之中,物种之中的外旁系同源基因为存在于相同生物成对的旁系同源基因,但复制事件是发生于物种形成之后。旁系同源基因同系物一般具有相同或相似的功能。
43、功能同系物可以藉由核苷酸和多肽序列比对分析来鉴定。例如,对核苷酸或多肽序列的数据库执行查询可以鉴定的同系物,感兴趣的多肽如生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白。序列分析可以涉及分别使用生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白的氨基酸序列作为参照序列的非冗余数据库的blast、交互blast(reciprocal blast)或psi-blast分析。在某些情况下,氨基酸序列是从核苷酸序列推导出来的。通常,数据库中序列相似度大于40%的多肽是进一步评估分别作为生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白适合的候选物。氨基酸序列相似性允许保守的氨基酸取代,例如一个疏水性残基取代另一个疏水性残基,或一个极性残基取代另一个极性残基,或一个酸性残基取代另一个酸性残基,或一个碱性残基取代另一个碱性残基等。较佳的是,保守性取代是指诸如甘氨酸被丙氨酸取代的组合,反之亦然;缬氨酸、异亮氨酸、亮氨酸被甲硫氨酸取代的组合,反之亦然;天门冬氨酸被谷氨酸取代的组合,反之亦然;天门冬酰胺被谷氨酰胺取代的组合,反之亦然;丝氨酸被苏氨酸取代的组合,反之亦然;赖氨酸被精氨酸取代的组合,反之亦然;半胱氨酸被甲硫氨酸取代的组合,反之亦然;苯丙氨酸与酪氨酸被色氨酸取代的组合,反之亦然。如有需要,可以对这类候选物进行手动检查,以缩小待进一步评估的候选物的数量。可以通过选择那些似乎具有在生产率调控多肽中存在的结构域,例如,保守的功能结构域的候选物来执行手动检查。
44、以多核苷酸而言,「片段」是指克隆(clone)或多核苷酸分子的任何部分,特别是多核苷酸保留全长多核苷酸分子可用的功能特征的部分。有用的片段包括寡核苷酸和多核苷酸,它们可用于杂交或扩增技术或者复制、转录或翻译的调控。「多核苷酸片段」是指多核苷酸seq id no(或genbank no.)的任何子序列,通常包括或由所述于此提供多核苷酸seq idno(或genbank no.)的至少约9、10、11、12个连续核苷酸,例如任何多核苷酸序列的至少约30个核苷酸或至少约50个核苷酸所组成。例示性片段可额外或备选地包括包含编码多肽的保守家族结构域的区域、实质上由其组成或由其组成的片段。示例性片段可额外或备选地包括包含多肽的保守结构域的片段。因此,多核苷酸seq id no(或genbank no.)的片段较佳指的是包括或由所述seq id no(或genbank no.)所组成的核苷酸序列,其中不多于200、150、100、50或25个连续核苷酸缺失(missing),较佳不多于50个连续核苷酸缺失,且上述核苷酸序列保留全长多核苷酸分子可用的功能特征(例如,活性),可利用通常知识者日常实验方法来评估可用的功能特征。或者,多核苷酸seq id no(或genbank no.)的片段较佳指的是包括或由来自所述seq id no(或genbank no.)的一些连续核苷酸所组成的核苷酸序列,其中所述的一些连续核苷酸为所述seq id no(或genbank no.)的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100.0%,较佳为至少80.0%,更佳为至少87%,更佳为至少90.0%,更佳为至少95.0%,更佳为至少97.0%,且保留全长多核苷酸分子可用的功能特征(例如,活性)。因此,多核苷酸seq id no(或genbank no.)的片段较佳指的是包括或由所述seq id no(或genbank no.)所组成的核苷酸序列,其中一些连续的核苷酸缺失,且其中缺失的含量不多于所述seq id no(或genbank no.)全长的50.0%、40.0%、30.0%,较佳为不多于所述seq id no(或genbank no.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更佳为不多于所述seq id no(或genbank no.)全长的15.0%,更佳为不多于所述seq id no(或genbank no.)全长的10.0%,更佳为不多于所述seq id no(或genbank no.)全长的5.0%,最佳为不多于所述seq id no(或genbank no.)全长的2.5%,且其中所述片段留全长多核苷酸分子可用的功能特征(例如,活性),可用的功能特征可由通常知识者例行评估。
45、片段可额外或备选地包括多肽和蛋白质分子的子序列,或多肽的子序列。在某些情况下,片段或结构域是多肽的子序列,其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能。如于此所定义,「多肽的子序列」指的是源自多肽的连续氨基酸残基的序列。例如,多肽片段可包含可识别的结构基序(motif)或功能结构域,例如dna结合位点或结构域,其与dna启动子区、活化结构域或用于蛋白质-蛋白质相互作用的结构域结合,并且可启动转录。片段的大小可以从少至3个氨基酸残基到完整多肽的全长,例如长度至少约20个氨基酸残基,例如长度至少约30个氨基酸残基。因此,多肽seqid no(或uniprot id或genbank no.)较佳指的是包括或由所述多肽seq id no(或uniprotid或genbank no.)所组成的多肽序列,其中不多于80、60、50、40、30、20或15个连续氨基酸残基缺失,较佳为不多于40个氨基酸残基缺失,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,可利用通常知识者日常实验方法来评估生物功能。或者,多肽seq id no(或uniprot id或genbank no.)的片段指的是包括或由来自所述多肽seq id no(或uniprot id或genbank no.)的一些连续的氨基酸残基所组成的多肽序列,且其中所述的一些连续的氨基酸残基为所述多肽seq id no(或uniprot id或genbank no.)全长的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100.0%,较佳为至少80.0%,更佳为至少87.0%,更佳为至少90.0%,更佳为至少95.0%,更佳为至少97.0%,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,可利用通常知识者日常实验方法来评估生物功能。因此,多肽seq idno(或uniprot id或genbank no.)的片段较佳指的是包括或由所述多肽seq id no(或uniprot id或genbank no.)所组成的多肽序列,其中一些连续的氨基酸残基缺失,且其中缺失的含量不多于所述多肽seq id no全长的50.0%、40.0%、30.0%,较佳为不多于所述seq id no(或uniprot id或genbank no.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更佳为不多于所述多肽seq id no(或uniprot id或genbank no.)全长的15%,更佳为不多于所述多肽seq id no(或uniprot id或genbank no.)全长的10%,更佳为不多于所述多肽seqid no(或uniprot id或genbank no.)全长的5%,最佳为不多于所述多肽seq id no(或uniprot id或genbank no.)全长的2.5%,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,生物功能可由通常知识者来例行评估。
46、在本技术中,可利用seq id no或者是uniprot id或genbank no.来表示多肽的序列。因此,除非另有明确说明,否则用语「多肽seq id no」与「多肽uniprot id」与「多肽genbank no.」可交替使用。
47、较佳的是,多肽的片段是以类似程度具有衍生片段的多肽的至少一种特性或活性的功能性片段,例如,功能性片段可以包括多肽的功能结构域或保守结构域。应能理解的是,多肽或其片段可具有保守型氨基酸取代,对于多肽的活性没有实质上的影响。保守性取代可以是一个疏水性氨基酸取代另一个疏水性氨基酸,或一个极性氨基酸取代另一个极性氨基酸,或一个酸性氨基酸取代另一个酸性氨基酸,或一个碱性氨基酸取代另一个碱性氨基酸等。较佳的是,保守性取代是指诸如甘氨酸被丙氨酸取代的组合,反之亦然;缬氨酸、异亮氨酸、亮氨酸被甲硫氨酸取代的组合,反之亦然;天门冬氨酸被谷氨酸取代的组合,反之亦然;天门冬酰胺被谷氨酰胺取代的组合,反之亦然;丝氨酸被苏氨酸取代的组合,反之亦然;赖氨酸被精氨酸取代的组合,反之亦然;半胱氨酸被甲硫氨酸取代的组合,反之亦然;苯丙氨酸与酪氨酸被色氨酸取代的组合,反之亦然。
48、例如,可以藉由pfam(el-gebali et al.,nucleic acids res.47(2019)d427-d432)、ipr(interpro domain)(mitchell et al.,nucleic acids res.47(2019)d351-d360),蛋白质指纹结构域(protein fingerprint domain)(prints)(attwood et al.,nucleic acids res.31(2003)400-402)、subfam结构域(gough et al.,j.mol.biol.313(2001)903-919)、tigrfam结构域(selengut et al.,nucleic acids res.35(2007)d260-d264)、保守结构域数据库(conserved domain database)(cdd)命名(designation)(https://www.ncbi.nlm.nih.gov/cdd)(lu et al.,nucleic acids res.48(2020)d265-d268)、pthr结构域(http://www.pantherdb.org)(mi et al.,nucleic acids.res.41(2013)d377-d386;thomas et al.,genome research 13(2003)2129-2141)或patric识别符(identifier)或patric db全球家族结构域(global family domain)(https://www.patricbrc.org/)(davis et al.,nucleic acids res.48(d1)(2020)d606-d612)。该技术领域应理解的是,对于于此所使用的数据库而言,包括pfam 32.0(released sept2018)、cdd v3.17(released 3rd april 2019),eggnogdb4.5.1(released sept 2016)、interpro 75.0(released 4th july 2019),tcdb(released17th june 2019)与patric3.6.9(released march 2020)指定来表征结构域,各个数据库的内容在各个释出版本为固定的而不会改变。当特定数据库的内容改变时,此特定数据库接收到具有新释出日期的新释出版本。各个数据库的所有释出版本与其对应的释出日期以及所注释的特定内容对于本发明所属技术领域中具有通常知识者而言是可得且习知的。
49、蛋白质序列和注释资料的综合资源可以提供蛋白质或多肽序列信息和功能信息,例如通用蛋白质资源(universal protein resource,uniprot)(www.uniprot.org)(nucleic acids res.2021,49(d1),d480-d489)。uniprot包括专业且丰富的蛋白质数据库,称为uniprot知识库(uniprot knowledgebase,uniprotkb)以及uniprot参考群集(uniref)与uniprot档案(uniparc)。uniprot标识符(uniprot id)是数据库中的每个蛋白质独有的。于此所使用的uniprot id为2021年5月5日uniprot数据库版本中的uniprot id。没有uniprot id的蛋白质于于此系利用2021年5月5日版本的nih基因序列数据库(https://www.ncbi.nlm.nih.gov/genbank/)(nucleic acids res.2013,41(d1),d36-d42)中所呈现的个别genbank登录号码(genbank no.)来称呼。
50、术语「相同」或「相似度百分比」或「%相似度」在两个或两个以上的核酸或多肽序列的情形中,是指两个或两个以上的序列或子序列,当用序列比较算法或目测法测量就最大对应性进行比较和比对时,其是相同的或具有特定百分比的相同的氨基酸残基或核苷酸。对于序列比较,一个序列作为参照序列,将测试序列与的进行比较。当使用序列比较算法时,将测试序列和参照序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数,计算测试序列相对于参照序列的序列百分比相似度。可以在参考序列的全长序列上整体计算百分比相似度,从而得到整体百分比相似度分数。或者,可以在参考序列的部分序列上计算百分比相似度,从而得到局部百分比相似度分数。在局部序列比对中使用参考序列的全长可产生测试和参考序列之间的整体百分比相似度分数。
51、可利用不同算法决定百分比相似度,例如blast与psi-blast(altschul et al.,1990,j mol biol 215:3,403-410;altschul et al.,1997,nucleic acids res25:17,3389-402)、clustal omega方法(sievers et al.,2011,mol.syst.biol.7:539),matgat方法(campanella et al.,2003,bmc bioinformatics,4:29)或emboss needle。
52、比对的blast(局部比对检索基本工具)方法是由美国国家生物技术信息中心所提供的算法,利用默认参数来比较序列。程序将核苷酸或蛋白质序列与序列数据库进行比较并计算统计上的显著性。psi-blast(位置特定迭代局部比对检索基本工具)从使用蛋白质-蛋白质blast(blastp)检测到的高于给定分数阈值的序列的多序列比对中得出位置特定计分矩阵(position-specific scoring matrix,pssm)或概述。blast方法可用于成对或多序列比对。成对序列比对用以识别可能表明两个生物序列(蛋白质或核酸)之间的功能、结构及/或进化关系的相似区域。blast的网页界面位于:https://blast.ncbi.nlm.nih.gov/blast.cgi。
53、clustal omega(clustal w)是一个多序列比对程序,其使用种子引导树(seededguided tree)和hmm profile-profile技术来产生三个或三个以上的序列之间的比对结果。它产生不同序列的具有生物学意义的多序列比对。clustal w的网页界面位于:https://www.ebi.ac.uk/tools/msa/clustalo/。使用clustal w方法进行多序列比对与蛋白质序列的百分比相似度的预设参数为:启用输入序列的去比对:false;启用类mbed群集引导树(mbed-like clustering guide-tree):true;启用类mbed群集迭代(mbed-likeclustering iteration):true;(结合引导树/hmm)迭代数量:预设(0);最大引导树迭代:预设[-1];最大hmm迭代[-1];顺序(order):对齐的(aligned)。
54、matgat(matrix global alignment tool)是一种计算机应用程序,可生成dna或蛋白质序列的相似性(similarity)/相似度(identity)矩阵,而无需对数据进行预比对。程序使用myers与miller整体比对算法执行一系列成对比对,计算相似性和相似度,然后将结果放入距离矩阵中。使用者可以指定哪种类型的比对矩阵(例如,blosum50、blosum62与pam250)用于检视蛋白质序列。
55、emboss needle(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)使用needleman-wunsch整体比对算法在考虑两个序列的全长时找到它们的最佳比对(包括间隙)。动态程序法藉由探索所有可能的比对结果并选择最佳比对结果来确保最佳比对结果。needleman-wunsch算法是可以按mn步骤的顺序(其中m与n为两序列的长度)计算最佳分数和比对结果的一类算法的成员之一。间隙开放惩罚(gap open penalty)(预设10.0)为产生间隙时的分数。预设数值假设你对蛋白质序列使用eblosum62矩阵。间隙延伸(预设0.5)惩罚被添加至间隙中每个碱基或残基的标准间隙惩罚。这便是长间隙如何被惩罚的。
56、如于此所使用的,具有相对于参考多肽序列的全长序列具有至少80%序列相似度的氨基酸序列的多肽可被理解为此序列对于参考多肽序列的氨基酸序列的全长具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%、100%的序列相似度。在本技术中,除非另有明确指明,否则多肽包括/由/具有相对于参考多肽序列的全长氨基酸序列,通常以seq id no或uniprot id或genbank no.所指明,具有至少80.0%序列相似度的氨基酸序列所组成,较佳为相对于全长参考序列具有至少85.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、96.0%、97.0%、98.0%或99.0%的序列相似度,更佳具有至少85.0%的序列相似度,更佳具有至少90.0%的序列相似度,最佳具有至少95.0%的序列相似度。另外,除非另有明确指明,否则多核苷酸序列包括/具有/由相对于参考多核苷酸序列的全长核苷酸序列,通常以seq id no或genbank no.所指明,具有至少80.0%序列相似度的氨基酸序列所组成,较佳为相对于全长参考序列具有至少85.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、96.0%、97.0%、98.0%或99.0%的序列相似度,更佳具有至少85.0%的序列相似度,更佳具有至少90.0%的序列相似度,最佳具有至少95.0%的序列相似度。
57、为了达到本发明的目的,使用matgat2.01(campanella et al.,2003,bmcbioinformatics 4:29)来决定百分比相似度。采用以下蛋白质的预设参数:(1)间隙成本存在:12以及延长:2;(2)使用的矩阵为blosum65。在较佳实施例中,根据给定seq id no(即,参考序列)的全长序列或其部分来计算序列相似度。其部分较佳是指完整参考序列的至少50%、60%、70%、80%、90%或95%。
58、如于此所使所用,术语「糖基转移酶」是指能够催化糖部分从活化的供体(donor)分子转移至特定受体(acceptor)分子,形成糖苷键(glycosidic bonds)的酶。
59、术语「α-1,3-糖基转移酶」、「a1,3-糖基转移酶」、「α1,3糖基转移酶」、「a1,3-糖基转移酶」是指一种能够催化糖基从活化的供体分子转移到特定的受体分子中的α-1,3糖苷键(alpha-1,3glycosidic linkage)的酶。于此所使用的术语「α-1,3-糖基转移酶」是指α-1,3-半乳糖基转移酶与α-1,3-n-乙酰半乳糖胺基转移酶。
60、「α-1,3-半乳糖基转移酶」,也被称为「a-1,3-半乳糖基转移酶」、「a1,3-半乳糖基转移酶」,是催化半乳糖残基从udp-半乳糖(udp-gal)转移到α-1,3键结(alpha-1,3linkage)的特定受体分子的糖基转移酶。
61、α-1,3-n-乙酰半乳糖胺转移酶,也被称为「a-1,3-n-乙酰半乳糖胺转移酶」、「a1,3n-乙酰半乳糖胺转移酶」、「a1,3-n-乙酰半乳糖胺转移酶」为催化n-乙酰半乳糖胺(galnac)从udp-galnac转移到α-1,3键结的特定受体分子上的糖基转移酶。
62、在本发明中,多肽序列段被用来意指本发明中使用的α-1,3-糖基转移酶的片段,其为那些α-1,3-糖基转移酶共同的。此种多肽段是以单字母代码的氨基酸的序列的形式书写的。若在此种多肽段的特定位置上的一个氨基酸可以是数种氨基酸,该特定位置将有氨基酸代码x。除非于此另有提及,字母「x」是指任何可能的氨基酸。序列中的术语[fhmqt]是指f、h、m、q或t作为该特定位置的可能氨基酸。序列中的术语[acg]系指a、c或g作为可能的氨基酸在该特定位置。序列中的术语[acil]系指a、c、i或l作为可能的氨基酸在该特定位置。序列中的术语[ag]系指a或g作为可能的氨基酸在该特定位置。
63、如于此所使用的,「核苷酸糖」或「活化糖」一词指的是单糖的活化形式。活化单糖的范例包括udp-半乳糖(udp-gal)、udp-n-乙酰葡萄糖胺(udp-glcnac)、udp-n-乙酰半乳糖胺(udp-galnac)、udp-n-乙酰甘露糖胺(udp-mannac)、gdp-岩藻糖(gdp-fuc)、gdp-甘露糖(gdp-man)、udp-葡萄糖(udp-glc)、udp-2-乙酰胺基-2,6-双脱氧-l-阿拉伯-4-己酮糖(udp-2-acetamido-2,6-dideoxy-l-arabino-4-hexulose)、udp-2-乙酰胺基-2,6-双脱氧-l-来苏-4-己酮糖(udp-2-acetamido-2,6-dideoxy-l-lyxo-4-hexulose)、udp-n-乙酰-l-鼠李糖胺(udp-l-rhanac或udp-2-乙酰胺基-2,6-双脱氧-l-甘露糖)、dtdp-n-乙酰岩藻糖胺、udp-n-乙酰岩藻糖胺(udp-l-fucnac或udp-2-乙酰胺基-2,6-双脱氧-l-半乳糖)、udp-n-乙酰-l-6-脱氧塔罗糖胺(udp-l-pnenac或udp-2-乙酰胺基-2,6-双脱氧-l-塔罗糖)、udp-n-乙酰胞壁酸(udp-n-acetylmuramic acid)、udp-n-乙酰-l-异鼠李糖(udp-l-quinac或udp-2-乙酰胺基-2,6-双脱氧-l-葡萄糖)、gdp-l异鼠李糖(gdp-l-quinovose)、cmp-n-乙酰神经氨酸(n-acetylneuraminic acid,cmp-neu5ac)、cmp-n-乙醇酰神经氨酸(n-glycolylneuraminic acid,cmp-neu5gc)、cmp-neu4ac、cmp-neu5ac9n3、cmp-neu4,5ac2、cmp-neu5,7ac2、cmp-neu5,9ac2、cmp-neu5,7(8,9)ac2、udp-半乳糖醛酸盐(udp-galacturonate)、udp-葡萄糖醛酸盐(udp-glucuronate)、gdp-鼠李糖(gdp-rhamnose)、或gdp-木糖(udp-xylose)。核苷酸糖在糖基化反应中作为糖基供体。这些反应被糖基转移酶所催化。
64、于此所使用且在现有技术中一般所能理解的「寡糖」一词指的是含有少量,通常为三至二十个单糖(simple sugar),即单糖(monosaccharide)的糖聚合物。于此使用的单糖是还原糖。寡糖可以是还原糖或非还原糖,并具有还原和非还原端。还原糖是能够还原另一种化合物并且自身被氧化的任何糖,亦即,糖的羰基碳被氧化成羧基。本发明中使用的寡糖可为线性结构或可包括分支。两个糖单元之间的键结(linkage)(例如,糖苷键结、半乳糖苷键结、糖苷键结等)可以表示为例如于此可互换使用的1,4、1->4或(1-4)。例如,术语「gal-b1,4-glc」、「b-gal-(1->4)-glc」、「galbeta1-4-glc」与「gal-b(1-4)-glc」具有相同的意义,即一个β-糖苷键将半乳糖(gal)的碳-1与葡萄糖(glc)的碳-4连接起来。每个单糖都可以是环状形式(例如,吡喃糖(pyranose)的呋喃糖(furanose)形式)。个别的单糖单元之间的连接可以包括α1->2、α1->3、α1->4、α1->6、α2->1、α2->3、α2->4、α2->6、β1->2、β1->3、β1->4、β1->6、β2->1、β2->3、β2->4与β2->6。寡糖可以同时含有α-与β-糖苷键,也可以只含有β-糖苷键。
65、于此所使用的「单糖」一词指的是无法通过水解而分解成较简单糖类的糖,其被归类为醛糖(aldose)或酮糖(ketose),且每个分子包含一或多个羟基。单糖为仅包含一个简单糖的糖类。单糖的范例包括己糖、d-葡萄吡喃糖(d-glucopyranose)、d-半乳呋喃糖(d-galactofuranose)、d-半乳吡喃糖、l-半乳吡喃糖、d-甘露吡喃糖、d-异吡喃糖(d-allopyranose)、l-阿卓吡喃糖(l-altropyranose)、d-古洛吡喃糖(d-gulopyranose)、l-艾杜吡喃糖(l-idopyranose)、d-塔罗吡喃糖(d-talopyranose)、d-核呋喃糖、d-核吡喃糖、d-阿拉伯呋喃糖、d-阿拉伯吡喃糖、l-阿拉伯呋喃糖、l-阿拉伯吡喃糖、d-木吡喃糖(d-xylopyranose)、d-来苏吡喃糖(d-lyxopyranose)、d-赤藻呋喃糖(d-erythrofuranose)、d-苏呋喃糖(d-threofuranose)、庚糖、l-甘油-d-甘露吡喃庚糖(ldmanhep),d-甘油-d-甘露吡喃庚糖(ddmanhep)、6-脱氧-l-阿卓吡喃糖、6-脱氧-d-古洛吡喃糖、6-脱氧-d-塔罗吡喃糖、6-脱氧-d-半乳吡喃糖、6-脱氧-l-半乳吡喃糖、6-脱氧-d-甘露吡喃糖、6-脱氧-l-甘露吡喃糖、6-脱氧-d-古洛吡喃糖、2-脱氧-d-阿拉伯己糖、2-脱氧-d-赤藻戊糖、2,6-双脱氧-d-阿拉伯吡喃己糖、3,6-双脱氧-d-阿拉伯吡喃己糖、3,6-双脱氧-l-阿拉伯吡喃己糖、3,6-双脱氧-d-木吡喃己糖(3,6-dideoxy-d-xylopyranose)、3,6-双脱氧-d-核吡喃己糖、2,6-双脱氧-d-核吡喃己糖、3,6-双脱氧-l-木吡喃己糖、2-胺基-2-脱氧-d-葡萄吡喃糖、2-胺基-2-脱氧-d-半乳吡喃糖、2-胺基-2-脱氧-d-甘露吡喃糖、2-胺基-2-脱氧-d-异吡喃糖、2-胺基-2-脱氧-l-阿卓吡喃糖、2-胺基-2-脱氧-d-古洛吡喃糖、2-胺基-2-脱氧-l-艾杜吡喃糖、2-胺基-2-脱氧-d-塔罗吡喃糖、2-乙酰胺基-2-脱氧-d-葡萄吡喃糖、2-乙酰胺基-2-脱氧-d-半乳吡喃糖、2-乙酰胺基-2-脱氧-d-甘露吡喃糖、2-乙酰胺基-2-脱氧-d-异吡喃糖、2-乙酰胺基-2-脱氧-l-阿卓吡喃糖、2-乙酰胺基-2-脱氧-d-古洛吡喃糖、2-乙酰胺基-2-脱氧-l-艾杜吡喃糖、2-乙酰胺基-2-脱氧-d-塔罗吡喃糖、2-乙酰胺基-2,6-双脱氧-d-半乳吡喃糖、2-乙酰胺基-2,6-双脱氧-l-半乳吡喃糖、2-乙酰胺基-2,6-双脱氧-l-甘露吡喃糖、2-乙酰胺基-2,6-双脱氧-d-葡萄吡喃糖、2-乙酰胺基-2,6-双脱氧-l-阿卓吡喃糖、2-乙酰胺基-2,6-双脱氧-d-塔罗吡喃糖、d-葡萄吡喃糖醛酸(d-glucopyanuronic acid)、d-半乳呋喃糖醛酸、d-甘露吡喃糖醛酸、d-异吡喃糖醛酸、l-阿卓吡喃糖醛酸、d-古洛吡喃糖醛酸、l-古洛吡喃糖醛酸、l-艾杜吡喃糖醛酸、d-塔罗吡喃糖醛酸、唾液酸(sialic acid)、5-胺基-3,5-双脱氧-d-甘油-d-半乳-非-2-酮糖酸(5-amino-3,5-dideoxy-d-glycero-d-galacto-non-2-ulosonic acid)、5-乙酰胺基-3,5-双脱氧-d-甘油-d-半乳-非-2-酮糖酸、5-乙醇酰胺基-3,5-双脱氧-d-甘油-d-半乳-非-2-酮糖酸(5-glycolylamido-3,5-dideoxy-d-glycero-d-galacto-non-2-ulosonic acid)、赤藻糖醇(erythritol)、阿拉伯糖醇、木糖醇、核糖醇、葡萄糖醇、半乳糖醇、甘露糖醇、d-核-己-2-吡喃酮糖(d-ribo-hex-2-ulopyranose)、d-阿拉伯-己-2-呋喃酮糖(d-果呋喃糖)、d-阿拉伯-己-2-吡喃酮糖、d-木-己-2-吡喃酮糖、l-来苏-己-2-吡喃酮糖、d-来苏-己-2-吡喃酮糖、d-苏-戊-2-吡喃酮糖(d-threo-pent-2-ulopyranose)、d-阿卓-庚-2吡喃酮糖、3-c-(羟甲基)-d-赤藻呋喃糖、2,4,6-三脱氧-2,4-二胺基-d-葡萄吡喃糖、6-脱氧-3-o-甲基-d-葡萄糖、3-o-甲基-d-鼠李糖(3-o-mehtyl-rhamnose)、2,6-双脱氧-3甲基-d-核己糖、2-胺基-3-o-[(r)-1-羧乙基]-2-脱氧-d-葡萄吡喃糖(2-amino-3-o-[(r)-1-carboxyethyl]-2-deoxy-d-glucopyranose)、2-乙酰胺基-3-o-[(r)-羧乙基]-2-脱氧-d-葡萄吡喃糖、2-乙醇酰胺基-3-o-[(r)-1-羧乙基]-2-脱氧-d-葡萄吡喃糖(2-glycolylamido-3-o-[(r)-1-carboxyethyl]-2-deoxy-d-glucopyranose)、3-脱氧-d-来苏-庚-2-吡喃酮糖酸(3-deoxy-d-lyxo-hept-2-ulopyranosaric acid)、3-脱氧-d-甘露-辛-2-吡喃酮糖酸、3-脱氧-d-甘油-d-半乳-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-l-甘油-l-甘露-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-l-甘油-l-阿卓-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-d-甘油-d-半乳-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-d-甘油-d-塔罗-非-2-吡喃酮糖酸、葡萄糖、半乳糖、n-乙酰胺基葡萄糖、胺基葡萄糖、甘露糖、木糖、n-乙酰甘露糖胺、n-乙酰神经氨酸、n-乙醇酰神经氨酸(n-glycolylneuraminic acid)、唾液酸、n-乙酰半乳糖胺、半乳糖胺、岩藻糖、鼠李糖、葡萄糖醛酸(glucuronic acid)、葡萄糖酸(gluconicacid)、果糖与多元醇(polyols)。
66、术语多元醇是指含有多个羟基的醇。例如,甘油、山梨糖醇或甘露糖醇。
67、如此所使用,术语「双糖(disaccharide)」是指由两个单糖单元组成的糖。双糖的例子包括乳糖(gal-b1,4-glc)、乳-n-二糖(gal-b1,3-glcnac)、n-乙酰乳糖胺(gal-b1,4-glcnac)、lacdinac(galnac-b1,4-glcnac)、n-乙酰半乳糖胺基葡萄糖(galnac-b1,4-glc)。
68、较佳为,于此所述的寡糖含有选自上方所用列表的单糖。寡糖的例子包括但不限于刘易斯型(lewis-type)抗原寡糖、哺乳动物乳汁寡糖与人乳汁寡糖。
69、于此所使用的「哺乳类乳寡糖」(mammalian milk oligosaccharide;mmo)是指寡糖,例如但不限,于3-岩藻糖基乳糖、2'-岩藻糖基乳糖、6-岩藻糖基乳糖、2',3-双岩藻糖基乳糖、2',2-双岩藻糖基乳糖、3,4-双岩藻糖基乳糖、6'-唾液酸乳糖、3'-唾液酸乳糖、3,6-二唾液酸乳糖、6,6'-二唾液酸乳糖、8,3-二唾液酸乳糖、3,6-二唾液酸乳糖基-n-四糖、乳糖基双岩藻四糖、乳糖基-n-四糖、乳糖基-n-新四糖、乳糖基-n-岩藻戊糖ii、乳糖基-n-岩藻戊糖i,乳糖基-n-岩藻戊糖iii、乳糖基-n-岩藻戊糖v、乳糖基-n-岩藻戊糖vi、唾液酸乳糖基-n-四糖c,唾液酸乳糖基-n-四糖b、唾液酸乳糖基-n-四糖a、乳糖基-n-双岩藻糖己糖i、乳糖基-n-双岩藻糖己糖ii、乳糖基-n-己糖、乳糖基-n-新己糖、对-乳糖基-n-己糖、单岩藻糖基单唾液酸乳糖-n-四糖c(monofucosylmonosialyllacto-n-neotetraose c)、单岩藻糖基对乳糖-n-己糖(monofucosyl para-lacto-n-hexaose)、单岩藻糖基乳糖-n-己糖iii(monofucosyllacto-n-hexaose iii)、异构岩藻糖基化乳糖-n-己糖iii(isomericfucosylated lacto-n-hexaose iii)、异构岩藻糖基化乳糖-n-己糖i(isomericfucosylated lacto-n-hexaose i)、唾液酸乳糖基-n-己糖、唾液酸乳糖基-n-新己糖ii、双岩藻糖基-对-乳糖-n-己糖(difucosyl-para-lacto-n-hexaose)、双岩藻糖基乳糖-n-己糖(difucosyllacto-n-hexaose)、双岩藻糖基乳糖-n-己糖a(difucosyllacto-n-hexaosea)、双岩藻糖基乳糖-n-己糖c(difucosyllacto-n-hexaose c)、半乳糖基化几丁聚糖、岩藻糖基化寡糖、中性寡糖及/或唾液酸化寡糖。
70、哺乳动物乳汁寡糖(mammalian milk oligosaccharides)或mmos包括哺乳期任何阶段的乳汁中存在的寡糖,包括人类的初乳(即,人乳寡糖或hmos)与哺乳动物的初乳,哺乳动物包括但不限于牛(bos taurus)、羊(ovis aries)、山羊(capra aegagrus hircus)、双峰驼(camelus bactrianus)、马(equest ferus caballus)、猪(sus scropha)、狗(canislupus familiaris)、埃佐棕熊(ursus arctos yesoensis)、北极熊(ursus maritimus)、日本黑熊(ursus thibetanus japonicus)、条纹臭鼬(mephitis mephitis)、海豹(cystophora cristata)、亚洲象(elephas maximus)、非洲象(loxodonta africana)、巨型食蚁兽(myrmecophaga tridactyla)、普通瓶鼻海豚(tursiops truncates)、北方小鲸(balaenoptera acutorostrata)、塔马小袋鼠(macropus eugenii)、红袋鼠(macropusrufus)。普通刷尾负鼠(trichosurus vulpecula)、无尾熊(phascolarctos cinereus)、东袋鼬(dasyurus viverrinus)、鸭嘴兽(ornithorhynchus anatinus)。人乳寡糖(hmos)也被称为相同人乳寡糖,其化学成分与人乳中的人乳寡糖相同,但是是通过生物技术生产的(例如,使用无细胞系统或包括细菌、真菌、酵母、植物、动物或原生动物细胞与生物体,较佳为基因改造细胞与生物体)。相同人乳寡糖在市场上的名称为himo。
71、于此所使用的「路易斯型抗原」一词包括下列寡糖:h1抗原,其是fucα1-2galβ1-3glcnac,或简称为2'flnb;lewisa,即三糖galβ1-3[fucα1-4]glcnac,或简称4-flnb;lewisb,即丁糖fucα1-2galβ1-3[fucα1-4]glcnac,或简称dif-lnb;sialyl lewisa即5-乙酰神经氨酰-(2-3)-半乳糖基-(1-3)-(吡喃岩藻糖基-(1-4))-n-乙酰葡糖胺(5-acetylneuraminyl-(2-3)-galactosyl-(1-3)-(fucopyranosyl-(1-4))-n-acetylglucosamine),或简写为neu5acα2-3galβ1-3[fucα1-4]glcnac;h2抗原,即fucα1-2galβ1-4glcnac,或2’岩藻糖基-n-乙酰-乳糖胺,简称2'flacnac;lewisx,即三糖galβ1-4[fucα1-3]glcnac,或称为3-岩藻糖基-n-乙酰-乳糖胺(3-fucosyl-n-acetyl-lactosamine),简称3-flacnac;lewisy,即丁糖fucα1-2galβ1-4[fucα1-3]glcnac,和唾液酸lewisx即5-乙酰神经氨酰-(2-3)-半乳糖基-(1-4)-(吡喃岩藻糖基-(1-3))-n-乙酰葡糖胺(5-acetylneuraminyl-(2-3)-galactosyl-(1-4)-(fucopyranosyl-(1-3))-n-acetylglucosa mine),或简写为neu5acα2-3galβ1-4[fucα1-3]glcnac。
72、于此所使用的术语「fuc-a1,2-gal-r」是指与r基相连的末端双糖fuc-alpha-1,2-gal。于此所使用的术语「fuc-a1,2-gal-b1,3-r」是指以β-1,3糖苷连接方式与r基相连的末端双糖fuc-alpha-1,2-gal。于此所使用的术语「fuc-a1,2-gal-b1,3-glcnac-r」是指与r基团相连的末端三糖fuc-alpha-1,2-gal-b1,3-glcnac。在整个申请中使用的所述"r-基团"或"r"是指单糖、双糖、寡糖、脂质、肽或蛋白质,或与肽、糖肽、蛋白质、糖蛋白、脂质或糖脂(glycolipid)结合的单、双或寡糖。
73、术语「乳-n-三碳糖(lacto-n-triose)」、「ln3」与「lnt ii」是指三糖glcnac-b1,3-gal-b1,4-glc。术语「乳-n-四糖」与「lnt」是指寡糖gal-b1,3-glcnac-b1,3-gal-b1,4-glc。
74、术语「乳-n-岩藻五糖i」、「乳-n-岩藻五糖-i」、「lnfp-i」、「lnfp i」、「lnf i oh i型决定簇(determinant)」、「lnf i」、「lnf1」、「lnf1」与「血型h抗原戊糖1型(blood group hantigen pentaose type 1)」是指藉由α-1,2-岩藻糖基转移酶将岩藻糖残基从gdp-l-岩藻糖以α-1,2-键结转移到lnt的末端半乳糖残基的催化作用所获得的寡糖fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc,如miyazaki et al.(2010,methods enzym.480,511-524)、et al.(2015,bioorg.med.chem.23,6799-6806)、zhao et al.(2016,chem.commun.52,3899-3902)、sugiyama et al.(2016,glycobiology 26,1235-1247)与专利文献(例如,wo19008133,wo2014018596a2)所述。
75、术语「galnac-lnfp-i」和「a血型抗原己糖i型」可互换使用,且意指galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。
76、术语「lnfp-ii」与「乳糖基-n-岩藻糖戊糖ii」可互换使用,且意指gal-b1,3-(fuc-a1,4)-glcnac-b1,3-gal-b1,4-glc。
77、术语「lnfp-iii」与「乳糖基-n-岩藻糖戊糖iii」可互换使用,且意指gal-b1,4-(fuc-a1,3)-glcnac-b1,3-gal-b1,4-glc。
78、术语「lnfp-v」与「乳糖基-n-岩藻糖戊糖v」可互换使用,且意指gal-b1,3-glcnac-b1,3-gal-b1,4-(fuc-a1,3)-glc。
79、术语「lnfp-vi」、「lnnfp v」与「乳糖基-n-新岩藻戊糖v」可互换使用,且意指gal-b1,4-glcnac-b1,3-gal-b1,4-(fuc-a1,3)-glc。
80、术语「lnnfp i」和「乳糖基-n-新岩藻糖戊糖i」可互换使用,且意指fuc-a1,2-gal-b1,4-glcnac-b1,3-gal-b1,4-glc。
81、术语「lndfh i」、「乳糖基-n-双岩藻己糖i」、与「ldfh i」可互换使用,且意指fuc-a1,4-(fuc-a1,2-gal-b1,3)-glcnac-b1,3-gal-b1,4-glc,其包括lewisb抗原fuc-a1,4-(fuc-a1,2-gal-b1,3)-glcnac。
82、术语「lndfh ii」、「乳糖基-n-双岩藻己糖ii」、「lewis a-lewis x」与「ldfh ii」可互换使用,且意指fuc-a1,4-(gal-b1,3)-glcnac-b1,3-gal-b1,4-(fuc-a1,3)-glc。
83、术语「lnndfh」、「乳糖基-n-新双岩藻己糖」和「lewis x己糖」可互换使用,且意指gal-b1,4-(fuc-a1,3)-glcnac-b1,3-gal-b1,4-(fuc-a1,3)-glc。
84、术语「alpha-丁糖」与「a-丁糖」可互换使用,且意指galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc。
85、于此所使用且如本领域中通常理解的,「岩藻糖基化寡糖」是携带岩藻糖残基的寡糖。例子包括2'-岩藻糖基乳糖(2'-fucosyllactose,2'fl)、3-岩藻糖基乳糖(3fl)、4-岩藻糖基乳糖(4fl)、6-岩藻糖基乳糖(6fl)、双岩藻基乳糖(difl)、乳双岩藻丁糖(lactodifucotetraose,ldft)、乳糖基-n-岩藻糖戊糖i(lnfp i)、乳糖基-n-岩藻戊糖ii(lnfp ii)、乳糖基-n-岩藻戊糖iii(lnfp iii)、乳糖基-n-岩藻戊糖v(lnfp v)、乳糖基-n-岩藻戊糖vi(lnfp vi)、乳糖基-n-新岩藻糖戊糖i、乳糖基-n-双岩藻己糖i(ldfh i)、乳糖基-n-双岩藻己糖ii(ldfh ii)、单岩藻糖基乳糖-n-己糖iii(monofucosyllacto-n-hexaose iii,mflnh iii)、双岩藻基乳糖基-n-己糖(dflnha)、双岩藻基-乳糖基-n-新己糖。
86、本发明中使用的术语「alpha-1,2-岩藻糖基转移酶」、「alpha 1,2岩藻糖基转移酶」、「2-岩藻糖基转移酶」、「α-1,2-岩藻糖基转移酶」、「α1,2岩藻糖基转移酶」、「2岩藻糖基转移酶」、「2-ft」或「2ft」可互换使用,意指催化岩藻糖从供体gdp-l-岩藻糖以α-1,2-键结转移到受体分子中的糖基转移酶。本发明中使用的术语「2'岩藻糖基乳糖」、「2'-岩藻糖基乳糖」、「alpha-1,2-岩藻糖基乳糖」、「alpha 1,2岩藻糖基乳糖」、「α-1,2-岩藻糖基乳糖」、「α1,2岩藻糖基乳糖」、「galβ-4(fucα1-2)glc」、「2fl」或「2'fl」可互换使用,是指通过alpha-1,2-岩藻糖基转移酶的催化,从gdp-l-岩藻糖中将岩藻糖残基以α-1,2-键结转移至乳糖获得的产物。本发明中使用的术语「双岩藻基乳糖」、「二-岩藻糖基乳糖」、「乳双岩藻丁糖」、「2',3-双岩藻基乳糖」、「2',3双岩藻基乳糖」、「α-2',3-岩藻糖基乳糖」、「α2',3岩藻糖基乳糖」、「fucα1-2galβ1-4(fucα1-3)glc」、「dflac」、「2',3difl」、「dfl」、「difl」或「difl」可互换使用。
87、如于此所使用,「岩藻糖基化途径(fucosylation pathway)」是由酶及其各自的基因、甘露糖-6-磷酸糖异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷转移酶、gdp甘露糖4,6-脱水酶、gdp-l-岩藻糖合成途径及/或再利用路径l-岩藻糖激酶/gdp-l-岩藻糖焦磷酸化酶(gdp-l-fucose synthase and/or the salvage pathway l-fucokinase/gdp-fucosepyrophosphorylase),结合导致α1,2、α1,3、α1,4或α1,6岩藻糖基化寡糖的岩藻糖基转移酶。
88、如于此所使用,「半乳糖基化途径(galactosylation pathway)」是由酶及其各自的基因体成的生化途径,半乳糖-1-差向异构酶、半乳糖激酶、葡萄糖激酶、半乳糖-1-磷酸尿苷酰转移酶、udp-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰转移酶及/或磷酸葡萄糖变位酶(phosphoglucomutase),与导致寡糖的2、3、4、6羟基上形成α或β结合的半乳糖的半乳糖基转移酶结合。
89、如于此所使用,「n-乙酰葡萄糖胺碳水化合物途径(n-acetylglucosaminecarbohydrate pathway)」是由酶及其各自的基因体成的生化途径,l-谷氨酰胺-d-果糖-6-磷酸胺基转移酶、葡萄糖胺-6-磷酸脱胺酶、磷酸葡萄糖胺变位酶、n-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺6-磷酸n-乙酰转移酶、n-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶、葡萄糖胺-1-磷酸乙酰转移酶及/或葡萄糖胺-1-磷酸乙酰转移酶,与导致寡糖的3、4、6羟基上形成α或β结合的n-乙酰葡萄糖胺的糖基转移酶结合。
90、于此所使用的术语「糖肽」是指含有一个或多个糖基的肽,这些糖基是单糖、双糖、寡糖、多糖及/或聚糖(glycans),是共价连接到肽的氨基酸残基的侧链上。糖肽包括天然的糖肽抗生素,例如由各种土壤放线菌产生的糖基化非核糖体肽,它们通过与细胞质膜外表面的生长肽聚糖(peptidoglycan)的酰基-d-丙氨酰-d-丙氨酸(acyl-d-alanyl-d-alanine,d-ala-d-ala)末端结合而针对革兰氏阳性细菌,以及合成的糖肽抗生素。天然糖肽的共同核心是由7个氨基酸组成的环肽构成,环肽上结合有2个糖。糖肽的例子包括万古霉素(vancomycin)、替考拉宁(teicoplanin)、奥利万星(oritavancin)、氯瑞霉素(chloroeremomycin)、特拉万星(telavancin)与达巴万星(dalbavancin)。
91、术语「糖蛋白」与「糖多肽」可互换使用,是指含有共价连接到一多肽的氨基酸残基的侧链的为单糖、双糖、寡糖、多糖及/或聚糖的一个或多个糖基团的多肽。
92、如于此所使用的,术语「糖脂(glycolipid)」是指本领域普遍已知的任何一种糖脂。糖脂(gls)可以被细分为简单(simple)糖脂(sgls)与复合(complex)(cgls)糖脂。简单的gls,有时被称为糖脂(saccharolipids),是双组分(糖基与脂质)的gls,其中糖基与脂质分子直接彼此连接在一起。sgl的例子包括糖基化脂肪酸、脂肪醇(fatty alcohol)、类胡萝卜素(carotenoid)、类藿烷(hopanoid)、固醇(sterol)或仲康酸(paraconic acid)。细菌产生的sgl可分为鼠李糖脂、糖脂(glucolipid)、海藻脂(trehalolipid)、其他糖基化(不含海藻糖)霉菌酸盐(mycolate)、含海藻糖的寡糖脂质、糖基化脂肪醇、糖基化大环内酯(macro-lactone)与大环内酰胺(macro-lactam)、糖基大环内二酯(glycomacrodiolides)(糖基化大环内二酯(glycosylated macrocyclic dilactones))、糖基类胡萝卜素与糖基萜类(glyco-terpenoid),以及糖基化类藿烷/固醇。然而,复合糖脂(cgl)在结构上更具异质性,由于除了糖基(glycosyl)与脂质部分外,它们还包含其他残基,例如甘油(糖基甘油脂(glycoglycerolipids))、肽(糖肽脂)、酰化鞘氨醇(acylated-sphingosine)(糖鞘脂(glycosphingolipids))或其他残基(脂多糖(lipopolysaccharides)、酚糖脂(phenolicglycolipid)、核苷脂(nucleoside lipids))。
93、于此所使用的「膜转运蛋白」是指作为细胞膜的一部分或与的相互作用并控制分子和信息在细胞内外流动的蛋白质。因此,膜蛋白参与运输作用,无论是输入至细胞中或输出至细胞外。
94、此种膜转运蛋白可以是运输蛋白(porter)、p-p键结水解驱动运输蛋白、β桶孔蛋白(β-barrel porin)、辅助运输蛋白(auxiliary transport protein)、推定运输蛋白(putative transport protein)及磷酸转移驱动基团转位蛋白(phosphotransfer-drivengroup translocator)由saier实验室生物信息学组操作和策划位于www.tcdb.org的运输蛋白分类数据库而定义,运输蛋白分类数据库提供膜转运蛋白的功能和系统发育分类。运输蛋白分类数据库详细介绍了iubmb批准的膜转运蛋白的综合分类系统,称为膜转运蛋白分类(transporter classification,tc)系统。如于此所述的tcdb分类检索是根据tcdb.org于2019年6月17日释出的版本而定义。
95、运输蛋白(porter)是单向运输蛋白(uniporter)、同向运输蛋白(symporter)、反向运输蛋白(antiporter)的共同名称,其利用载体所介导的过程(saier et al.,nucleicacids res.44(2016)d372-d379)。它们属于电化学电位驱动的运输蛋白,也被称为二级载体型促进子(facilitator)。当膜转运蛋白利用载体介导的过程来催化二级载体的单向运输或单一物质通过促进扩散或在膜电位依赖性的过程中(如果溶质是带电的)进行运输时;当两个或更多种的物质在一个紧密耦合的过程中二级载体向相反的方向运输时,不与化学能以外的直接能量形式相耦合;及/或当两个或更多的物种在一个紧密耦合的过程中二级载体一起向同一方向运输时,不与化能以外的直接能量形式相耦合,由(forrest et al.,biochim.biophys.acta 1807(2011)167-188),则包括在这一分类的中。这些系统通常具有立体特异性。溶质:溶质反运输是二级载体的一个特点。运输蛋白与酶的动态缔合产生了功能性膜运输代谢物(metabolon),将通常从细胞外获得的通道受质直接输送到其细胞代谢中(moraes andreithmeier,biochim.biophys.acta 1818(2012),2687-2706)。藉由此运输蛋白系统运输的溶质包括但不限于阳离子、有机阴离子、无机阴离子、核苷、氨基酸、多元醇、磷酸化的糖解中间产物(phosphorylated glycolytic intermediates)、渗透物、嗜铁素(siderophores)。
96、若膜转运蛋白水解无机焦磷酸盐、atp或另一种三磷酸核苷的二磷酸键以驱动溶质的主动摄入(uptake)及/或排出(extrusion),膜转运蛋白则包含于p-p键结水解驱动运输蛋白类别(saier et al.,nucleic acids res.44(2016)d372-d379)。膜运输蛋白可能会或可能不会暂时被磷酸化,但受质不会被磷酸化。通过p-p键结水解驱动运输蛋白类别所运输的基质包括但不限于阳离子、重金属、β-葡聚糖、udp-葡萄糖、脂多糖、磷壁酸(teichoicacid)。
97、β桶孔蛋白膜转运蛋白(β-barrel porins membrane transporter proteins)形成穿膜孔洞,通常使溶质得以不需能量便横跨穿越膜。这些蛋白的穿膜部分完全由形成β桶状的β链(β-strand)所组成(saier et al.,nucleic acids res.44(2016)d372-d379)。这些孔蛋白型蛋白质存在于革兰氏阴性菌、粒线体、色素体(plastid)的外膜中,且可能存在于抗酸性的(acid-fast)革兰氏阳性菌的外膜中。藉由这些β桶孔蛋白所运输的溶质包括但不限于核苷、棉子糖(raffinose)、葡萄糖、β-葡萄糖苷、寡糖。
98、辅助运输蛋白(auxiliary transport protein)定义为促进横跨一或更多个的生物膜的运输的蛋白质,但其本身不会直接参与运输的过程。这些膜转运蛋白总是与一或多个已建立的运输系统一起作用,例如但不限于外膜因子(outer membrane factors,omfs)、多糖运输蛋白(polysaccharide porters,pst porters)、atp-结合盒型(atp-bindingcassette,abc)运输蛋白。它们可提供与能量耦合运输相关的功能、在复合物形成的过程中扮演结构性的角色、发挥生物或稳定性功能或调节功能(saier et al.,nucleic acidsres.44(2016)d372-d379)。辅助运输蛋白的范例包括但不限于参与多糖运输的多糖共聚酶家族,参与细菌素(bacteriocin)和化学毒素运输的膜融合蛋白家族。
99、推定运输蛋白(putative transport protein)包含的家族在成员的运输功能建立时归类到别处,或者是在提议的运输功能被否定时从运输蛋白分类系统中删除。这些家族包括一个或多个成员,已建议其具有运输功能,但这种功能的证据尚不完整(saier etal.,nucleic acids res.44(2016)d372-d379)。如2019年6月17日所释出,在tcdb系统的下分类为此群组的推定运输蛋白范例包括但不限于铜运输蛋白。
100、磷酸转移驱动基团转位蛋白(phosphotransfer-driven group translocator)也称为细菌磷酸烯醇丙酮酸盐:糖磷酸转移酶系统(pts)的pep依赖性磷酰基转移驱动转位蛋白。衍生自胞外糖的反应产物为细胞质糖磷酸(cytoplasmic sugar-phosphate)。催化糖磷酸化的酶成分在紧密耦合的过程中迭加在运输过程中。pts系统涉及许多不同的方面,包括调节和趋化性、生物膜形成和发病机制(lengeler,j.mol.microbiol.biotechnol.25(2015)79-93;saier,j.mol.microbiol.biotechnol.25(2015)73-78)。如2019年6月17日所释出,在tcdb系统的下分类在磷酸转移驱动基团转位蛋白的中的膜转运蛋白家族包括与葡萄糖-葡萄糖苷、果糖-甘露糖醇、乳糖-n,n'-二乙酰几丁二糖-β-葡萄糖苷(lactose-n,n’-diacetylchitobiose-beta-glucoside)、葡萄糖醇、半乳糖醇、甘露糖-果糖-山梨糖和抗坏血酸的转运相关的pts系统。
101、主要促进子超家族(main facilitator superfamily,mfs)是一个膜转运蛋白超家族,催化单向运输、溶质:阳离子(h+,但少数是na+)同向运输及/或溶质:h+或溶质:溶质反向运输。根据saier实验室生物信息学组(www.tcdb.org)运作的运输蛋白体分类数据库的定义,大多数运输蛋白的长度为400-600个氨基酸残基,具有12、14或偶尔24个穿膜α螺旋形扳手(transmembraneα-helical spanners,tms)。
102、于此所使用的「糖流出运输蛋白(sugar efflux transporter,set)」指的是set家族的膜蛋白,set家族的膜蛋白为具有interpro结构域ipr004750的蛋白质及/或属于eggnogv4.5家族enog410xte9的蛋白质。可使用https://www.ebi.ac.uk/interpro/的在线工具或以预设数值使用interproscan(https://www.ebi.ac.uk/interpro/download.html)的独立版本来识别interpro结构域。可使用eggnog-mapperv1(http://eggnogdb.embl.de/#/app/home)的独立版本来识别eggnogv4.5中的直系同源家族。
103、于此所使用的「嗜铁素(siderophore)」指的是各种微生物主要为铁离子特异性螯合剂的次级代谢物。这些分子被分类为儿茶酚酸盐(catecholater)、异羟肟酸盐(hydroxamate)、羧酸盐和混合类型。嗜铁素通常由非核糖体肽合成酶(nonribosomalpeptide synthetase,nrps)依赖性途径或nrps非依赖性途径(nrps independentpathway,nis)合成。nrps依赖性嗜铁素生物合成途径中最重要的前体为分支酸(chorismate)。可由分支酸利用异分支酸合成酶、异分支酸酶与2,3-二羟基苯甲酸-2,3-脱氢酶催化的三步反应形成2,3-dhba。当使用鸟氨酸(ornithine)作为嗜铁素的前体时,生物合成取决于l-鸟氨酸n5-单氧酶(l-ornithine n5-monooxygenase)催化的鸟氨酸羟基化。在nis途径中,嗜铁素生物合成的重要步骤为n(6)-羟基赖氨酸合成酶(n(6)-hydroxylysine synthase)。
104、将嗜铁素输出至细胞外所需的运输蛋白。至今为止,在过程中鉴定出了四个膜蛋白超家族:主要促进子超家族(mfs)、多药/寡糖脂/多糖翻转酶超家族(multidrug/oligosaccharidyl-lipid/polysaccharide flippase superfamily,mop)、抗性、结瘤与细胞分裂超家族(the resistance,nodulation and cell division superfamily,rnd)与abc超家族。一般而言,参与嗜铁素输出的基因会与嗜铁素基因群集在一起。于此所使用的「嗜铁素输出蛋白」一词指的是将嗜铁素输出至细胞外所需的运输蛋白。
105、atp结合盒(atp-binding cassette,abc)超家族包含摄入与流出运输系统,且这两群组的成员一般会松散地群集在一起。没有蛋白质磷酸化的atp水解为运输提供能量。abc超家族中有几十个家族,家族通常与受质特异性相关。成员根据由saier实验室生物信息学组运作的运输蛋白分类数据库定义的3.a.1类进行分类,其位于www.tcdb.org,并提供膜转运蛋白的功能和系统亲源分类。
106、「允许流出(enabled efflux)」一词指的是导入溶质在细胞膜及/或细胞壁的运输活性。所述的运输可以通过导入及/或增加本发明中所述的运输蛋白的表达量而实现。「增强的流出」一词指的是改善溶质在细胞膜及/或细胞壁的运输活性。可通过导入及/或增加本发明中所述的膜转运蛋白的表达量来增强溶质在细胞膜及/或细胞壁的运输。膜转运蛋白的「表达」定义为编码所述膜转运蛋白的基因在所述基因是内源基因的情况下的「过表达」,或在编码所述膜转运蛋白的基因是异源基因的情况下的「表达」,而异源基因不存在于野生型菌株或细胞中。
107、「纯化的」一词指的是实质上不含干扰生物分子活性的成分的材料。对于细胞、糖类、核酸、多肽、肽、糖蛋白、糖肽、脂质与糖脂而言,术语「纯化的」指的是基本上或实质上不含在其天然状态下通常伴随该材料的组分的材料。一般而言,本发明纯化的糖类、寡糖、肽、糖肽、蛋白质、糖蛋白、脂质、糖脂或核酸的纯度至少约为50%、55%、60%、65%、70%、75%、80%或85%,通常至少约为90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,利用银染凝胶上的条带强度或其他决定纯度的方法进行测量。可利用本领域习知的许多方法来表明纯度或均质度,例如,蛋白质或核酸样品的聚丙烯酰胺凝胶电泳,并接着进行染色而显像。出于某些目的,需要高分辨率并使用hplc或类似的纯化方法。对于寡糖而言,可利用以下方法,但不限于薄层色层分析、气相色层分析、nmr、hplc、毛细管电泳或质谱法来决定纯度。
108、术语「培养物」是指其中培养或发酵细胞的培养基、细胞本身和本发明的细胞在全肉汤中产生的α-1,3-糖基化寡糖,即细胞内部(细胞内(intracellularly))与细胞外(细胞外(extracellularly))。术语「培养物」是指其中培养或发酵细胞的培养基、细胞本身和本发明的细胞在全肉汤中产生的α-1,3-糖基化寡糖,即细胞内部(细胞内(intracellularly))与细胞外(细胞外(extracellularly))。
109、如于此所使用的,「前体」一词是指被细胞吸收及/或合成用于生产特定寡糖的物质。就此意义而言,前体可以是如于此所定义的受体(acceptor),但也可以是另一物质-代谢物,在细胞内作为寡糖的生化合成路径的一部分而先进行修饰。这类前体的范例包括于此所定义的受体,及/或葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、二羟基丙酮、胺基葡萄糖、n-乙酰葡萄糖胺、甘露糖胺、n-乙酰甘露糖胺、半乳糖胺、n-乙酰半乳糖胺、磷酸化糖例如但不限于葡萄糖-1-磷酸、半乳糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、甘露糖-6-磷酸、甘露糖-1-磷酸、甘油-3-磷酸、甘油醛-3-磷酸、二羟基丙酮-磷酸、葡糖胺-6-磷酸、n-乙酰-葡糖胺-6-磷酸、n-乙酰甘露糖胺-6-磷酸、n-乙酰葡萄糖胺-1-磷酸、n-乙酰-神经氨酸-9-磷酸及/或如于此所定义的核苷酸活化糖,例如udp-葡萄糖、udp-半乳糖、udp-n-乙酰葡萄糖胺、cmp-唾液酸、gdp-甘露糖、gdp-4-脱氢-6-脱氧-α-d-甘露糖、gdp-岩藻糖。
110、如于此所使用,术语「受体」是指可以被糖基转移酶修饰的单糖、二糖或寡糖、蛋白质、糖蛋白、肽、糖肽、脂质或糖脂。此类受体的例子包括葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳糖-n-二糖(lnb)、乳-n-丙糖、乳糖-n-四糖(lnt)、乳-n-新四糖(lnnt)、n-乙酰基-乳糖胺(lacnac)、乳-n-戊糖(lnp)、乳-n-新戊糖、对乳-n-戊糖、对乳-n-新戊糖、乳-n-新戊糖i、乳-n-六糖(lnh)、乳-n-新六糖(lnnh)、对乳-n-新六糖(plnnh)、对乳-n-六糖(plnh)、乳-n-庚糖、乳-n-新庚糖、对乳-n-新庚糖、对乳-n-庚糖、乳-n-八糖(lno)、乳-n-新八糖、异乳-n-八糖、对乳-n-八糖、异乳-n-新八糖、新乳-n-新八糖、对乳-n-新八糖、异乳-n-九糖、新乳-n-九糖、乳-n-九糖、乳-n-十糖、异乳-n-十糖、新乳-n-十糖、乳-n-新十糖、半乳糖基乳糖、以1、2、3、4、5或多个n-乙酰乳糖胺单元及/或1、2、3、4、5或多个乳-n-二糖单元扩展的乳糖,与含有1个或多个n-乙酰乳糖胺单元和或1个或多个乳-n-二糖单元的寡糖,或成为寡糖脂中间物(intermediate into oligosaccharide)、其岩藻糖基化和唾液酸化形式、肽、多肽、脂质、鞘脂、脑苷脂、神经酰胺脂质、磷脂酰肌醇脂质和糖基化形式的肽、多肽、脂质、鞘脂、脑苷脂、神经酰胺脂质、磷脂酰肌醇。
111、发明详述
112、根据第一方面,本发明提供了一种产生α-1,3糖基化形式的fuc-a1,2-gal-r的方法,其中所述α-1,3糖基化发生在岩藻糖-α-1,2-半乳糖r(fuc-a1,2-gal-r)的末端「岩藻糖-α1,2-半乳糖」-基团。该方法包括下列步骤:
113、i)提供具有合成fuc-a1,2-gal-r、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferase)的能力,并具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖(nucleotide-sugar)的能力的细胞,与
114、ii)在允许合成该fuc-a1,2-gal-r、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的fuc-a1,2-gal-r的条件下培养该细胞,
115、iii)较佳为自该培养物分离该α-1,3糖基化形式的fuc-a1,2-gal-r。
116、在一实施例中,本发明提供了一种产生α-1,3糖基化形式的fuc-a1,2-gal-r的混合物的方法。该方法包括下列步骤:
117、提供具有合成至少两种不同的fuc-a1,2-gal-r的能力、表达α-1,3-糖基转移酶并且具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖的能力的细胞,较佳为单一细胞,与
118、在允许合成该至少两种不同的fuc-a1,2-gal-r、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的各fuc-a1,2-gal-r的条件下培养该细胞,
119、较佳为自该培养物分离该α-1,3糖基化形式的各fuc-a1,2-gal-r。
120、根据本发明,所述混合物包含或由至少两种不同的「α-1,3糖基化形式的fuc-a1,2-gal-r」组成,优选至少三种不同的“α-1,3糖基化形式的fuc”-a1,2-gal-r',更优选至少四种不同的「α-1,3糖基化形式的fuc-a1,2-gal-r」。较佳为,所述至少两种、更佳为至少三种、甚至更佳为至少四种不同的fuc-a1,2-gal-r由所述细胞合成。在进一步及/或替代实施方案中,α-1,3糖基化形式的fuc-a1,2-gal-r的混合物可以通过如于此揭露的方法获得,其中所述细胞表达多种α-1,3-糖基转移酶(优选α-1,3-半乳糖基转移酶与α-1,3-n-乙酰半乳糖胺基转移酶)。在进一步及/或替代实施方案中,可以通过如于此揭露的方法获得α-1,3糖基化形式的fuc-a1,2-gal-r的混合物,其中提供如于此揭露的多种不同受体。
121、在第二方面中,本发明提供了代谢工程化细胞,用于产生如于此所述的α-1,3糖基化形式的fuc-a1,2-gal-r。在本发明的上下文中,本文所述的α-1,3糖基化形式的fuc-a1,2-gal-r较佳为不发生于所述细胞的野生型先驱细胞(progenitor)中。
122、提供代谢工程化细胞,较佳为单一细胞,其具有合成fuc-a1,2-gal-r的能力,其表达α-1,3-糖基转移酶并且其具有具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖的能力。
123、根据本发明,所述用于产生α-1,3糖基化形式的fuc-a1,2-gal-r的方法可利用非代谢工程化细胞或可利用如于此揭露的代谢工程化细胞。
124、在本发明的上下文中,应当理解,所述fuc-a1,2-gal-r、核苷酸-糖与α-1,3糖基化形式的fuc-a1,2-gal-r形式较佳为在细胞内合成。技术人员将进一步理解,合成的α-1,3糖基化形式的fuc-a1,2-gal-r的一部分或基本上全部保留在细胞内及/或被动地或通过主动运输(active transport)排出到细胞外。
125、在整个申请中,除非另有明确说明,根据本发明,「经基因修饰的细胞」或「经代谢工程化的细胞」较佳为意指分别经基因修饰或代谢工程化以产生α-1,3-糖基化形式的fuc-a1,2-gal-r的细胞。
126、在本发明的上下文中,术语「α-1,3糖基化形式」的fuc-a1,2-gal-r(或其衍生结构,如于此所述)较佳表示糖部分(例如单糖)通过α-1,3-糖苷键与岩藻糖-α-1,2-半乳糖-r(fuc-a1,2-gal-r)的所述“fuc-a1,2-gal”-基团的半乳糖残基结合,即,糖部分不直接连接到包含在fuc-a1,2-gal-r中的另一个残基,例如a1,2-连接的岩藻糖或包含在r部分中的任何残基。
127、在一较佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r是(i)gal-a1,3-(fuc-a1,2)-gal-r,较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-r,更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc;或(ii)galnac-a1,3-(fuc-a1,2)-gal-r,较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-r,更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。
128、换句话说,在一较佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r是α-1,3半乳糖或α-1,3galnac修饰形式的fuc-a1,2-gal-r,其中所述半乳糖或glcnac以α-1,3-糖苷键结合至岩藻糖-α-1,2-半乳糖-r(fuc-a1,2-gal-r)的「fuc-a1,2-gal」基团的半乳糖残基。
129、在一更佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-r,较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-r,更较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。换言之,在一更佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r是α-1,3半乳糖修饰的fuc-a1,2-gal-r。
130、在另一更佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r是galnac-a1,3-(fuc-a1,2)-gal-r,较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-r,更较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。换言的,在更佳的实施方案中,所述α-1,3糖基化形式的fuc-a1,2-gal-r是1,3galnac修饰的fuc-a1,2-gal-r。
131、在整个申请中,除非另有明确说明,所述fuc-a1,2-gal-r较佳为为fuc-a1,2-gal-b1,3-r,更较佳为所述fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-r,甚至更较佳为,所述fuc-a1,2-gal-r为乳-n-岩藻糖五糖i(lnfp-i,fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)。
132、在一实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为组织血型抗原(histoblood group antigen,hbga)系统的结构。在一较佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r。在一更佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。在一替代较佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r。在一更佳实施例中,所述α-1,3糖基化形式的fuc-a1,2-gal-r为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。
133、在另一实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,其中葡萄糖可以视需要而定地被岩藻糖基化(较佳为a1,3-岩藻糖基化)。较佳为,α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,4-glc。
134、在另一实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc。
135、在另一实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为α-四糖galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcthe(alpha-tetrasaccharide galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc)。
136、在另一实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为一α-1,3galnac或一α-1,3半乳糖修饰的fuc-a1,2-gal-glcnac,其中fuc-a1,2-gal-glcna中的半乳糖经由β-1,3或β-1,4键与glcnac结合。在一较佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为galnac-a1,3-(fuc-a1,2)-gal-glcnac,其中半乳糖经由β-1,3或β-1,4键与glcnac结合。在一更佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac。在另一更佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac。在一较佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为一gal-a1,3-(fuc-a1,2)-gal-glcnac,其中半乳糖经由β-1,3或β-1,4键与glcnac结合。在一更佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac。在另一更佳实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac。
137、在本发明的范围内,措辞「许可条件」应理解为与物理或化学参数相关的条件,包括但不限于温度、ph、压力、渗透压和产物/前体/受体浓度。
138、在特定实施例中,此类条件可包括30+/-20摄氏度的温度范围、7+/-3的ph范围。
139、根据本发明的一较佳实施利,以一个或更多的表达模块来修饰细胞。所述表达模块也已知为转录单元且包括重组基因表达的多核苷酸,重组基因包括编码基因序列以及与编码基因有效连接的适当转录及/或翻译控制信号。所述控制信号包括启动子序列、未翻译区、核糖体结合位点与终止子序列。所述表达模块可包括一个单一重组基因的表达单元,但也可包括更多重组基因的表达单元,或可以组织为操纵子(operon)结构以整合表达两个或两个以上的重组基因。可利用使用本领域习知的技术的重组dna技术来产生所述多核苷酸。建构表达模块方法对于本发明所属技术领域具有通常知识者而言是习知的,其包括如体外(in vitro)重组dna技术、合成技术与体内(in vivo)基因重组。参照如sambrook et al.(2001)molecular cloning:a laboratory manual,3rd edition,cold spring harborlaboratory press,csh,new york or to current protocols in molecular biology,john wiley and sons,n.y.(1989及每年更新版本)中所述的技术。
140、各所述表达模块(expression module)的表达可以是组成型的或由天然或化学诱导物产生。如于此所使用,组成型表达应理解为在生物体中被连续转录的基因的表达。由天然诱导物产生的表达应被理解为一种基因的趋向性或调节性表达,该基因仅在宿主的某种自然条件下(如生物体正在分娩(labour),或在哺乳(lactation)期)表达,作为对环境变化(如包括但不限于荷尔蒙、热、冷、ph值变化、光、氧化或渗透压力/信号)的反应,或依赖于所述细胞的发育阶段或细胞周期的位置,包括但不限于凋亡与自噬(autophagy)。由化学诱导剂产生的表达应理解为基因的兼性或调节性表达,该基因仅在通过诱导型启动子或通过诱导或抑制所述多核苷酸转录或翻译成多肽的遗传回路感知外部化学物质(例如iptg、阿拉伯糖、乳糖、同种乳糖(allo-lactose)、鼠李糖或岩藻糖)时表达。
141、表达模块可整合至所述细胞的基因体中,或可以载体(vector)的形式呈现给所述细胞。所述载体可以质粒、黏粒(cosmid)、噬菌体、脂质体或病毒的形式存在,被稳定地转化/转染至所述代谢改造细胞中。这类载体其中包括染色体的(chromosomal)、附加体(episomal)与衍生自病毒的载体,例如衍生自细菌质粒、噬菌体、酵母菌附加体(episome)、插入单元、酵母菌染色体单元的载体及衍生自前述组合的载体,例如衍生自质粒与噬菌体基因单元的载体,例如黏粒与噬菌粒(phagemid)。这些载体可包含选择标记(selectionmarker),例如但不限于抗生素标记、营养缺陷(auxotrophic)标记、毒素-抗毒素标记或rna正股/反股标记。表达系统构建体(construct)可包括调控与引起表达的控制区域。一般而言,任何适合于在宿主中维持、增殖或表达多核苷酸及/或表达多肽的系统或载体均可用于在这方面的表达。可以通过多种众所周知的常规技术中的任何一种将合适的dna序列插入到表达系统中,例如sambrook等人中所述的技术。对于重组生产而言,可基因改造细胞以并入表达系统或其部分或本发明的多核苷酸。可利用许多标准实验室操作手册中所述的方法来将多核苷酸导入至细胞中,例如如前文所述的davis et al.,basic methods inmolecular biology,(1986),and sambrook et al.,1989。
142、如于此所使用,表达模块包括用于至少一个重组基因的表达的多核苷酸。所述重组基因参与在α-1,3糖基化形式的lnfp-i或lnfp-i的合成中起作用的多肽的表达;或所述重组基因与所述细胞中不参与α-1,3糖基化形式的lnfp-1或lnfp-1的合成的其他途径相关联。所述重组基因编码具有修饰的表达或活性的内源蛋白质,较佳为,所述内源蛋白质是被过表达的;或所述重组基因编码异源蛋白质,所述异源蛋白质在所述修饰细胞中异源地被引入与表达,较佳为被过表达。内源蛋白质可以在细胞中具有一经修饰的表达,该细胞也表达异源蛋白质。
143、在根据本发明的方法及/或细胞的一个实施例中,细胞具有合成乳-n-岩藻糖五糖i(lnfp-i)的能力。lnfp-i是一种岩藻糖基化五糖,源自乳-n-四糖(lnt),其中所述lnt被岩藻糖基团a1,2-连接到其末端半乳糖残基来修饰。在一较佳实例中,该细胞具合成lnt的能力并表达α-1,2-岩藻糖基转移酶,该酶将岩藻糖残基从gdp岩藻糖供体转移到受体lnt以产生lnfp-i。在一更佳实施例中,细胞具有合成lnt的能力、表达使用lnt作为α-1,2-岩藻糖基化接受体的α-1,2-岩藻糖基转移酶且具有合成为所述α-1,2-岩藻糖基转移酶的供体的gdp-岩藻糖的能力。
144、lnt可在细胞中产生,藉由半乳糖苷β-1,3-n-乙酰氨基葡萄糖转移酶基因和n-乙酰氨基葡萄糖β-1,3-半乳糖基转移酶基因的过表达,它们分别将glcnac残基从udp-glcnac转移到乳糖形成ln3与将gal残基从udp-gal转移到ln3形成lnt。较佳为,细胞不具有活化的半乳糖苷酶,例如lacz,其将乳糖降解为葡萄糖与半乳糖。所述半乳糖苷β-1,3-n-乙酰氨基葡糖基转移酶所需的乳糖可以供培养或通过细胞的代谢合成。所述酶所需的udp-glcnac与udp-gal可由细胞中表达的酶或细胞的代谢来提供。
145、在糖基化反应中使用乳糖作为受体的细胞较佳为具有用于从培养物中摄取乳糖的转运蛋白。更佳为,该细胞针对乳糖摄取进行了优化。所述优化可以是乳糖转运蛋白如来自大肠杆菌或乳酸克鲁维酵母的乳糖通透酶的过表达。
146、在本发明的方法/或细胞的较佳实施例中,当在乳糖与一种或多种其他碳源结合的环境中生长时,细胞会抵抗乳糖杀伤(lactose killing)的现象。「乳糖杀伤」一词指的是细胞在含有乳糖和另一种碳源的培养基中生长受阻。在较佳实施例中,如wo 2016/075243中所述,细胞系经过基因修饰,即使在高乳糖浓度下,也能保留至少50%的乳糖流入而不会经历乳糖杀伤。所述基因修饰包括通过没有造成乳糖杀伤表达型的异源性启动子的外源性及/或内源性乳糖运输基因的表达及/或过表达,及/或修饰乳糖运输蛋白的密码子使用偏好以产生没有造成乳糖杀伤表达型的所述乳糖运输蛋白改变的表达。wo2016/075243的内容在这方面通过引用的方式并入于此。在本发明的背景下,乳糖较佳为由于此揭露的细胞所摄入,其中所述乳糖进一步由于此揭露的糖基转移酶而糖基化以合成mmo,较佳为hmo。
147、或者,藉由表达β-1,4-半乳糖基转移酶与udp-葡萄糖4-表异构酶(udp-glucose4-eprimerase),可以获得产生乳糖的细胞。更佳为,细胞经过改良以提高乳糖产量。所述修饰可以是选自包括β-1,4-半乳糖基转移酶的过表达、udp-葡萄糖4-表异构酶的过表达的群组中的任何一个或更多。
148、产生udp-glcnac的细胞可以表达酶,其将例如要添加到细胞的glcnac转化为udp-glcnac。这些酶可以是来自包括智人、大肠杆菌的几种物种的n-乙酰基-d-葡糖胺激酶、n-乙酰基葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶与n-乙酰基葡糖胺-1-磷酸尿苷酰转移酶/葡糖胺-1-磷酸乙酰转移酶。较佳为,细胞被修饰以产生udp-glcnac。更佳为,细胞经修饰以增强udp-glcnac的产生。所述修饰可以是选自包括n-乙酰氨基葡萄糖-6-磷酸脱乙酰酶的敲除、l-谷氨酰胺-d-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达,以及n-乙酰葡糖胺-1-磷酸尿苷酰转移酶/葡糖胺-1-磷酸乙酰转移酶的过表达的群组的任一个或更多。
149、产生udp-gal的细胞可以表达酶,其将例如udp-葡萄糖转化为udp-gal。这种酶可以是,例如,udp-葡萄糖4-差向异构酶gale,如从包括智人、大肠杆菌和褐家鼠的几种物种中已知的。较佳为,细胞被修改以产生udp-gal。更佳为,细胞被修改以增强udp-gal产生。所述修饰可以是选自包括双功能5'-核苷酸酶/udp-糖水解酶编码基因的敲除、半乳糖-1-磷酸尿苷转移酶编码基因的敲除与udp-葡萄糖4-差向异构酶编码基因的过表达的群组的任一个或更多。
150、gdp-岩藻糖可藉由细胞中表达的酶或藉由细胞的代谢所提供。这种产生gdp-岩藻糖的细胞可表达酶,其将例如要添加到细胞的岩藻糖转化为gdp-岩藻糖。这种酶可以是,例如,双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰转移酶,如来自脆弱类杆菌(bacteroidesfragilis)的fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟嘌呤转移酶(fucose-1-phosphate guanylyltransferase)的组合,如它们从包括智人、猪(susscrofa)与褐家鼠的几个物种中为已知。
151、较佳为,细胞被修饰以产生gdp岩藻糖。更佳为,细胞经过修饰以提高gdp岩藻糖产量。所述修饰可以是选自包括udp-葡萄糖:十一烯丙基-磷酸葡萄糖-1-磷酸转移酶的编码基因的敲除,表达gdp-l-岩藻糖合成酶的编码基因的过表达、gdp-甘露糖4,6-脱水酶的编码基因的过表达、甘露糖-1-磷酸瓜酰转移酶的编码基因的过表达、磷酸甘露酶的编码基因的过表达与甘露糖-6-磷酸异构酶的编码基因的过表达的群组的任一个或多个。
152、将岩藻糖残基从gdp-岩藻糖转移到细胞内合成的lnt的α-1,2-岩藻糖基转移酶是α-1,2-岩藻糖基转移酶,其接受lnt的末端半乳糖残基作为岩藻糖基化的受体。所述α-1,2-岩藻糖基转移酶除了lnt的外,还可以使用其他接受体进行岩藻糖基化。所述额外的受体可以包括但不限于单糖、双糖和寡糖,例如半乳糖、葡萄糖、n-乙酰葡萄糖胺(glcnac)、乳糖、乳酮糖、乳-n-生物糖(lnb)、n-乙酰半乳糖胺(lacnac)、3’-岩藻糖(3'fl)、乳-n-三糖(ln3)与乳-n-新四糖(lnnt)。所述α-1,2-岩藻糖基转移酶可以是例如于此举例的幽门螺杆菌的α-1,2-岩藻糖基转移酶。
153、在本发明的方法及/或细胞的一个较佳实施例中,所述α-1,2-岩藻糖基转移酶选自包含来自毛样短螺旋体(brachyspira pilosicoli)的多肽(uniprot id a0a2n5rq26)、来自dysgonomonas mossii的多肽(uniprot id f8x274)、来自dechlorosoma suillum的多肽(uniprot id g8qlf4)、来自desulfovibrio alaskensis的多肽(uniprot id q316b5)与来自polaribacter vadi的多肽(uniprot id a0a1b8tnt0)。
154、在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶是对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体的多肽(uniprot id a0a2n5rq26)、来自dysgonomonas mossii的多肽(uniprot id f8x274)、来自dechlorosoma suillum的多肽(uniprot id g8qlf4)、来自desulfovibrio alaskensis的多肽(uniprot id q316b5)与来自p.vadi的多肽(uniprot id a0a1b8tnt0)的任一个的功能片段。
155、在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶是来自毛样短螺旋体的多肽(uniprot id a0a2n5rq26)、来自dysgonomonas mossii的多肽(uniprot id f8x274)、来自dechlorosoma suillum的多肽(uniprot id g8qlf4)、来自desulfovibrio alaskensis的多肽(uniprot id q316b5)与来自p.vadi的多肽(uniprot id a0a1b8tnt0)的任一个的功能同系物、变体或衍生物,且对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
156、在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶为多肽包括一氨基酸序列,或是由氨基酸序列所组成,该氨基酸序列具有与来自毛样短螺旋体(uniprot ida0a2n5rq26)的多肽、来自d.mossii(uniprot id f8x274)的多肽、来自d.suillum(uniprotid g8qlf4)的多肽、来自d.alaskensis(uniprot id q316b5)的多肽与来自p.vadi(uniprot id a0a1b8tnt0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
157、在本发明的方法及/或细胞的另一较佳实施例中,细胞表达α-1,2-岩藻糖基转移酶,该酶较佳为使用lnt作为α-1,2-岩藻糖基化的受体而不是其他受体,例如半乳糖、葡萄糖、n-乙酰氨基葡萄糖(glcnac)、乳糖、乳果糖、乳糖-n-二糖(lnb)、n-乙酰乳糖胺(lacnac)、3'-岩藻糖基乳糖(3'fl)、乳糖-n-丙糖(ln3)与乳-n-新四糖(lnnt)。在更佳实施例中,通过在细胞中表达的α-1,2-岩藻糖基转移酶在混合物中获得的至少50%的岩藻糖基化化合物源自lnt的α-1,2-岩藻糖基化。换言之,通过细胞中表达的α-1,2-岩藻糖基转移酶在混合物中获得的岩藻糖基化化合物的至少50%是岩藻糖基化的lnt。至少50%的岩藻糖基化化合物在混合物中,应被理解为至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95,50%、96.00%、96,50%、97.00%、97,50%、98.00%、98,50%、99.00%、99,50%、99,60%、99,70%、99,80%、99,90%、100%的岩藻糖基化化合物在混合物中为岩藻糖基化lnt。较佳为,至少60%、更佳为至少70%、甚至更佳为至少75%、甚至更佳为至少80%、甚至更佳为至少85%、甚至更佳为至少90%、最佳为至少95%通过在细胞中表达的在混合物中获得的岩藻糖基化化合物是岩藻糖基化的lnt。
158、在更佳实施例中,所述α-1,2-岩藻糖基转移酶仅使用lnt作为α-1,2-岩藻糖基化的受体。术语「仅(solely)」表示仅。换句话说,所述α-1,2-岩藻糖基转移酶仅接受lnt作为所述lnt末端半乳糖残基的α-1,2-键中岩藻糖基化的受体,而无其他受体。
159、根据本发明的方法及/或细胞的一个实施例,具有产生α-1,3-糖基化形式的fuc-a1,2-gal-r的能力的α-1,3-糖基转移酶是一种α-1,3-半乳糖基转移酶,其为一种糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-r的末端「岩藻糖-a1,2-半乳糖」基团的能力,其中所述r包括单糖、双糖、寡糖、肽、糖肽、蛋白质、糖蛋白、脂质或糖脂,如于此前面所定义。
160、在本发明的方法及/或细胞的一个实施例中,α-1,3-半乳糖基转移酶具有pfampf03414结构域(domain),且包括具有seq id no:01的基序(motif)yx[fhmqt]xaxx[acg][acg],其中x可为任何氨基酸残基。
161、在一替代实施例中,α-1,3-半乳糖基转移酶具有pfam pf03414结构域,且包括具有seq id no:02的基序yxqxcxx[acg][acg],其中x可为任何氨基酸残基。
162、在一替代实施例中,α-1,3-半乳糖基转移酶具有pfam pf03414结构域,且包括根据seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列。
163、在一替代实施例中,α-1,3-半乳糖基转移酶具有pfam pf03414结构域,且为seqid no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物(functionalhomolog)、变体(variant)或衍生物(derivative),具有与具有seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fucose-a1,2-galactose-r,fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
164、在一替代实施例中,α-1,3-半乳糖基转移酶具有pfam pf03414结构域,且为seqid no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的功能性片段,对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
165、在一较佳替代实施例中,α-1,3-半乳糖基转移酶具有一pfam pf03414结构域且包括来自seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
166、在一替代实施例中,α-1,3-半乳糖基转移酶具有一pfam pf03414结构域且包括或系由多肽所组成,此多肽包括或系由氨基酸序列所组成,此氨基酸序列与seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的全长氨基酸序列具有至少80%序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
167、根据本发明的方法及/或细胞的另一个实施例,具有产生α-1,3-糖基化形式的fuc-a1,2-gal-r的α-1,3-糖基转移酶是一种α-1,3-n-乙酰半乳糖胺基转移酶,它是一种糖基转移酶,具有将n-乙酰半乳糖胺残基从udp-galnac转移到fuc-a1,2-gal-r的末端“岩藻糖-a1,2-半乳糖”基团的能力,其中所述r包括单糖、双糖、寡糖、肽、糖肽、蛋白质、糖蛋白或脂质或糖脂,如于此前面所定义。
168、在本发明的方法及/或细胞的一个实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且包括具有seq id no:38的基序yx[acil]xgxx[acg][acg],其中x可为任何氨基酸残基。
169、在一替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且包括具有seq id no:39的基序yx[ag]xaxx[acg][acg],其中x可为任何氨基酸残基。
170、在一替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且包括如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列。
171、在一替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且为seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-n-乙酰半乳糖基转移酶(a-1,3-n-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
172、在一替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且为seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的功能性片段,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
173、在一较佳替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且包括来自seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的一寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
174、在一替代实施例中,该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且包括或系由多肽所组成,此多肽包括或系由一氨基酸序列所组成,此氨基酸序列与seqid no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的全长氨基酸序列具有至少80%序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
175、如于此所使用,所述pfam pf03414结构域是指存在于2018年9月发布的pfam 32.0数据库中并且存在于糖基转移酶6(gt6)家族中的pf03414结构域。所述α-1,3-半乳糖基转移酶和α-1,3-n-乙酰半乳糖基转移酶均属于gt6家族。
176、总体序列同一性使用全球比对算法确定,例如程序gap(gcg wisconsin package,accelrys)中的needleman wunsch算法,较佳为使用默认参数并叫佳为使用成熟蛋白质的序列(即不考虑分泌信号或转运肽(transit peptide))。与整体序列相似度相比,当仅考虑保守结构域或基序时,序列相似度通常会更高。
177、来自具有seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基并且对fuc-a1,2-gal-r的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-半乳糖基转移酶活性的寡肽序列应理解为于此所提供的来自具有seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个至多连续氨基酸残基总数的寡肽序列的任一者,较佳为其中若存在的话,所述寡肽不与pfam结构域完全重叠,更佳为其中若存在的话,所述寡肽不与pfam结构域重叠,并且对fuc-a1,2-gal-r的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-半乳糖基转移酶活性。
178、来自具有seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基并且对fuc-a1,2-gal-r的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性的寡肽序列应理解为于此所提供的来自具有seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个至多连续氨基酸残基总数的寡肽序列的任一者,较佳为其中若存在的话,所述寡肽不与pfam结构域完全重叠,更佳为其中若存在的话,所述寡肽不与pfam结构域重叠,并且对fuc-a1,2-gal-r的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
179、在本发明的方法及/或细胞的一个优选实施方案中,细胞表达α-1,3-糖基转移酶,该酶具有修饰细胞内合成的fuc-a1,2-gal-r的能力,从而形成α-1,3糖基化形式的fuc-a1,2-gal-r,如于此前方所揭露。较佳为,所述细胞能够合成作为所述α-1,3-糖基转移酶供体的核苷酸-糖。
180、在本发明的方法及/或细胞的一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-r的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖为udp-gal,产生如于此所述的α-1,3半乳糖修饰的fuc-a1,2-gal-r。
181、在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-n-乙酰半乳糖胺基转移酶,具有将galnac残基从udp-galnac转移到fuc-a1的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-galnac,产生如于此所述的α-1,3galnac修饰的fuc-a1,2-gal-r。
182、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-b1,3-r的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-gal,产生如于此所述的α-1,3半乳糖修饰的fuc-a1,2-gal-b1,3-r。
183、在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-n-乙酰半乳糖胺基转移酶,具有将galnac残基从udp-galnac转移到fuc-a1,2-gal-b1,3-r的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-galnac,产生如于此所述的α-1,3galnac修饰的fuc-a1,2-gal-b1,3-r。
184、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-b1,3-glcnac-r的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-gal,产生如于此所述的α-1,3半乳糖修饰的fuc-a1,2-gal-b1,3-glcnac-r。
185、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-b1,3-glcnac-r的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-gal,产生如于此所述的α-1,3半乳糖修饰的fuc-a1,2-gal-b1,3-glcnac-r。
186、在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-n-乙酰半乳糖胺基转移酶,具有将galnac残基从udp-galnac转移到fuc-a1,2-gal-b1,3-glcnac-r的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-galnac,产生如于此所述的α-1,3galnac修饰的fuc-a1,2-gal-b1,3-glcnac-r。
187、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到fuc-a1,2-gal-b1,3-glcnac-b1,3-r的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-gal,产生如于此所述的α-1,3半乳糖修饰的fuc-a1,2-gal-b1,3-glcnac-b1,3-r。
188、在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-n-乙酰半乳糖胺基转移酶,具有将galnac残基从udp-galnac转移到fuc-a1,2-gal-b1,3-glcnac-b1,3-r的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是udp-galnac,产生如于此所述的α-1,3galnac修饰的fuc-a1,2-gal-b1,3-glcnac-b1,3-r。
189、在本发明的方法及/或细胞的一更佳实施例中,细胞表达α-1,3-糖基转移酶,该酶能够将细胞内合成的lnfp-i修饰为α-1,3糖基化形式的lnfp-i。在本发明的方法及/或细胞的另一额外实施例中,该细胞能够合成为所述α-1,3-糖基转移酶的供体的核苷酸-糖。
190、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从udp-gal转移到lnfp-1的末端“岩藻糖-α1,2-半乳糖”基团的能力,所述核苷酸-糖是udp-gal并且所述α-1,3糖基化形式5乳-n-岩藻糖五糖i(lnfp-i)是gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc(gal-a1,3-lnfp-i)。
191、在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-n-乙酰半乳糖胺基转移酶,具有将galnac残基从udp-galnac转移到lnfp-i的末端“岩藻糖-α1,2-半乳糖”基团的能力,所述核苷酸-糖是udp-galnac并且所述α-1,3糖基化形式的乳-n-岩藻糖五糖i(lnfp-i)是galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc(galnac-a1,3-lnfp-i)。
192、在本发明的方法及/或细胞的一更进一步实施例中,细胞在至少一种糖基转移酶的表达或活性方面被修饰,所述糖基转移酶包括半乳糖基转移酶(例如β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶、α-1,4-半乳糖基转移酶)、n-乙酰半乳糖基转移酶、岩藻糖基转移酶(例如2-岩藻糖基转移酶、α-1,3/1,4-岩藻糖基转移酶、α-1,6-岩藻糖基转移酶)、n-乙酰葡糖胺基转移酶、甘露糖基转移酶、n-乙酰甘露糖胺基转移酶、葡萄糖基转移酶。在一较佳实施利中,所述糖基转移酶包含对末端“岩藻糖-α1,2-半乳糖-r”基团具有α-1,3-半乳糖基转移酶活性的α-1,3-半乳糖基转移酶与对末端“岩藻糖-α1,2-半乳糖-r”基团具有α-1,3-n-乙酰半乳糖基转移酶活性的α-1,3-n-乙酰半乳糖基转移酶,如于此所述。
193、在一实施例中,所述糖基转移酶是具有修饰的表达或活性的细胞的内源性蛋白质,较佳为所述内源性糖基转移酶过表达;或者,所述糖基转移酶是异源蛋白质,其异源地引入并在所述细胞中表达,较佳为过表达。所述内源性糖基转移酶可以在细胞中具有经修饰的表达,该细胞也表达异源糖基转移酶。
194、在本发明的方法的一实施例中,培养物被供给用于合成岩藻糖-a1,2-半乳糖-r及/或α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r的前体。可被供给用于合成岩藻糖-a1,2-半乳糖-r及/或α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r的培养的前体包括乳糖、乳糖-n-丙糖(ln3、lnt ii)、岩藻糖、葡萄糖、半乳糖、glcnac、gdp-岩藻糖、udp-半乳糖与udp-glcnac或于此定义的任何其他前体。
195、在本发明方法的一实施例中,培养物被供给用于合成lnfp-1及/或α-1,3糖基化形式的lnfp-1的前体。可被供给用于培养以合成lnfp-i及/或α-1,3糖基化形式的lnfp-i的前体包括乳糖、乳糖-n-丙糖(ln3、lnt ii)、岩藻糖、葡萄糖与半乳糖。
196、在根据本发明的方法/或细胞的一实施例中,细胞表达膜转运蛋白或具有运输活性的多肽,借此将化合物运输穿越细胞壁的外膜。在本发明的方法/或细胞的一较佳实施例中,细胞表达一种以上的膜转运蛋白或具有运输活性的多肽,借此将化合物运输穿越细胞壁的外膜。在本发明的方法/或细胞的更佳实施例中,细胞系经修饰所述膜转运蛋白或具有运输活性的多肽的表达或活性。所述膜转运蛋白或具有运输活性的多肽为细胞具有修饰的表达或活性的内源性蛋白质,较佳的是所述内源性膜转运蛋白或具有运输活性的多肽是过表达的;或者,所述内源性膜转运蛋白或具有运输活性的多肽为异源导入至所述细胞并于细胞中表达的异源性蛋白质,较佳的是其为过表达的。所述内源性膜转运蛋白或具有运输活性的多肽在细胞中可具有修饰的表达,所述细胞也表达异源性膜转运蛋白或具有运输活性的多肽。
197、在本发明的方法/或细胞的另一实施例中,膜转运蛋白或具有运输活性的多肽是选自于包含以下所列的名单:运输蛋白(porter)、p-p键结水解驱动运输蛋白、b桶孔蛋白(b-barrel porin)、辅助运输蛋白、推定运输蛋白(putative transport protein)及磷酸转移驱动基团转位蛋白(phosphotransfer-driven group translocator)。在本发明的方法/或细胞的一更佳实施例中,运输蛋白(porter)包括mfs运输蛋白、糖流出运输蛋白及螯铁体输出蛋白(siderophore exporter)。在本发明的方法/或细胞的另一更佳实施例中,p-p键结水解驱动运输蛋白包括abc运输蛋白与螯铁体输出蛋白。
198、在本发明的方法及/或细胞的另一较佳实施例中,具有转运活性的膜转运蛋白或多肽控制如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r在细胞壁的外膜上的流动。在本发明的方法及/或细胞的替代及/或额外较佳实施例中,具有转运活性的膜转运蛋白或多肽控制一种或更多的前体在细胞壁的外膜上的流动,所述前体用于α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r的所述产生。在本发明的方法及/或细胞的替代及/或额外较佳实施例中,具有转运活性的膜转运蛋白或多肽控制一种或更多的受体在细胞壁的外膜上的流动,所述受体用于α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r的所述产生。
199、在本发明的方法/或细胞的另一较佳实施例中,细胞表达属于mfs运输蛋白家族的膜转运蛋白,例如来自以下物种的多药运输蛋白mdfa家族的mdfa多肽,包括大肠杆菌(uniprot id p0aey8)、穆汀斯克罗诺杆菌(cronobacter muytjensii)(uniprot ida0a2t7anq9)、杨氏柠檬酸杆菌(citrobacter youngae)(uniprot id d4bc23)与雷金斯堡预研菌(yokenella regensburgei)(uniprot id g9z5f4)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于糖流出运输蛋白家族的膜转运蛋白,例如来自以下物种的seta家族的seta多肽,包括大肠杆菌(uniprot id p31675)、克氏柠檬酸杆菌(citrobacterkoseri)(uniprot id a0a078lm16)、克雷伯氏肺炎杆菌(klebsiella pneumoniae)(uniprot id a0a0c4mgs7)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于嗜铁素输出蛋白(siderophore exporter)家族的膜转运蛋白,例如大肠杆菌的ents(uniprot id p24077)与大肠杆菌的icet(uniprot id a0a024l207)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于abc运输蛋白家族的膜转运蛋白,例如来自大肠杆菌的oppf(uniprot id p77737)、来自乳酸乳球菌亚种双乙酸乳酸变种(lactococcuslactis subsp.lactis bv.diacetylactis)的imra(uniprot id a0a1v0nel4)与婴儿长双歧杆菌亚种(bifidobacterium longum subsp.infantis)的blon_2475(uniprot idb7gpd4)。在本发明的方法/或细胞的更佳实施例中,细胞表达的选自包含以下所列的名单的膜转运蛋白:lacy或lac12通透酶、岩藻糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化糖的转运蛋白,例如udp-glcnac、udp-gal及/或gdp-fuc的转运蛋白,来自大肠杆菌的mdfa蛋白(uniprot id p0aey8)、来自克罗诺杆菌的mdfa蛋白(uniprot ida0a2t7anq9)、来自杨氏柠檬酸杆菌的mdfa蛋白(uniprot id d4bc23)、来自约克氏菌的mdfa蛋白(来自setz5f id g9的z5f蛋白)、来自大肠杆菌的seta蛋白(uniprot idp31675)、来自克氏柠檬酸杆菌的seta蛋白(uniprot id a0a078lm16)、来自肺炎克雷伯菌的seta蛋白(uniprot id a0a0c4mgs7)、来自大肠杆菌的ents蛋白(uniprot id p24077)、来自大肠杆菌的icet蛋白质(uniprot id a0a024l207)、来自大肠杆菌的oppf蛋白(uniprot id p77737)、来自乳酸乳球菌亚种双乙酸乳酸变种的lmra蛋白(uniprot ida0a1v0nel4)与来自婴儿长双歧杆菌亚种的blon_2475(uniprot id b7gpd4)。优选地,细胞被转化为包括至少一种编码蛋白质的核酸序列,该蛋白质选自包括乳糖转运蛋白,例如lacy或lac12通透酶、岩藻糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化糖的转运蛋白,例如udp-glcnac、udp-galnac及/或gdp-fuc的转运蛋白。因此,所述转运蛋白内化(internalizes)于经添加用于本发明α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r的合成的前体及/或受体。
200、在根据本发明的方法及/或细胞的额外及/或替代实施例中,所述细胞被基因修饰以通过膜输出本发明的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r。例如,此种转运蛋白是一种膜转运蛋白,属于嗜铁素输出体家族(siderophore exporter family)、主要促进者超家族(major facilitator superfamily,mfs)、atp结合盒(atp-binding cassette,abc)转运蛋白家族或糖外流转运蛋白家族。
201、在本发明的方法及/或细胞的进一步实施例中,细胞较佳包含编码一种蛋白质的相同编码dna序列的多个复制。在本发明的上下文中,所述蛋白质可以是糖基转移酶、膜转运蛋白或于此揭露的任何其他蛋白质。在整个申请中,特征“多个”是指至少2个,较佳为至少3个,更佳为至少4个,甚至更佳为至少5个。
202、在本发明的方法及/或细胞的另一实施例中,该细胞包括用于减少醋酸盐产生的修改。所述修饰可以是选自一组中的任何一个或多个,包括乙酰辅酶a合成酶的过量表达,完全或部分敲除或功能较差的丙酮酸脱氢酶与完全或部分敲除或功能较差的乳酸脱氢酶。
203、在本发明的方法及/或细胞的又一实施例中,细胞系经修饰至少一乙酰辅酶a合成酶(acetyl-coenzyme asynthetase,acs)的表达或活性,例如来自大肠杆菌、酿酒酵母菌、人类或小鼠(m.musculus)的acs。在较佳实施例中,所述乙酰辅酶a合成酶为具有修饰的表达或活性的细胞的内源性蛋白质,较佳的是所述内源性乙酰辅酶a合成酶为过表达的;或者,所述乙酰辅酶a合成酶为异源导入所述细胞并于所述细胞中表达的异源性蛋白质,较佳为过表达的。所述内源性乙酰辅酶a合成酶在细胞中可具有修饰的表达,而所述细胞也表达异源性乙酰辅酶a合成酶。在更佳实施例中,细胞系经修饰来自大肠杆菌的乙酰辅酶a合成酶acs(uniprot id p27550)的表达或活性。在另一及/或额外较佳实施例中,细胞系经修饰来自大肠杆菌的乙酰辅酶a合成酶acs(uniprot id p27550)的功能性同系物、变体或衍生物,其相对于来自大肠杆菌的所述多肽(uniprot id p27550)具有至少80%的全体序列相似度,且具有乙酰辅酶a合成酶的活性。
204、在本发明的方法及/或细胞的更一替代及/或额外实施例中,细胞系经修饰至少一种丙酮酸脱氢酶的表达或活性,例如来自大肠杆菌、酵母菌、褐家鼠(r.norvegicus)的丙酮酸脱氢酶。在较佳实施例中,通过本发明所属技术领域中具有通常知识者一般所知的方法导致至少一种蛋白质具有较少的功能或失去丙酮酸脱氢酶活性,细胞系经过修饰以具有至少一部分或完全剔除的或突变的编码丙酮酸脱氢酶的基因。在更佳实施例中,细胞编码poxb的基因被完全剔除,导致细胞缺少丙酮酸脱氢酶活性。
205、在本发明的方法及/或细胞的又一替代及/或额外实施例中,细胞系经修饰至少一种乳酸脱氢酶的表达或活性,例如来自大肠杆菌、酵母菌、褐家鼠(r.norvegicus)的乳酸脱氢酶。在较佳实施例中,通过本发明所属技术领域中具有通常知识者一般所知的方法导致至少一种蛋白质具有较少的功能或失去乳酸脱氢酶活性,细胞系经过修饰以具有至少一部分或完全剔除的或突变的编码乳酸脱氢酶的基因。在更佳实施例中,细胞编码ldha的基因被完全剔除,导致细胞缺少乳酸脱氢酶活性。
206、根据本发明的方法及/或细胞的另一较佳实施例,细胞与未经修饰的前驱细胞相比包括以下任一或多种蛋白质降低或减少的表达及/或经破坏、削弱、减少或延迟的活性,所述一或多种蛋白质包括:β-半乳糖苷酶、半乳糖苷o-乙酰转移酶、n-乙酰葡萄糖胺-6-磷酸脱乙酰酶、葡萄糖胺-6-磷酸脱胺酶、n-乙酰葡萄糖胺抑制蛋白(n-acetylglucosaminerepressor)、核糖核苷酸单磷酸酶、eiicba-nag、udp-葡萄糖:十一异戊烯基-磷酸葡萄糖1-磷酸转移酶(udp-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、l-岩藻糖激酶、l-岩藻糖异构酶(l-fucose isomerase)、n-乙酰神经氨酸裂解酶、n-乙酰甘露糖胺激酶、n-乙酰甘露糖胺-6-磷酸2-表异构酶、eiiab-man、eiic-man、eiid-man、usha、半乳糖-1-磷酸尿苷转移酶、葡萄糖-1-磷酸腺苷转移酶、葡萄糖-1-磷酸酶、atp依赖性6-磷酸果糖激酶同功酶1(atp-dependent 6-phosphofructokinase isozyme1)、atp依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸异构酶、有氧呼吸控制蛋白、转录抑制蛋白iclr、lon蛋白酶、葡萄糖特异性转位磷酸转移酶(glucose-specifictranslocating phosphotransferase)酶iibc组成ptsg、葡萄糖特异性转位磷酸转移酶(phosphotransferase,pts)酶iibc组成malx、酶iiaglc、β-葡萄糖苷特异性pts酶ii、果糖特异性pts多磷酰基转移蛋白frua与frub、乙醇脱氢酶、醛脱氢酶、丙酮酸甲酸裂解酶(pyruvate-formate lyase)、乙酸激酶、磷酸酰基转移酶、磷酸乙酰转移酶及丙酮酸脱羧酶。
207、根据本发明的方法及/或细胞的另一较佳实施例,细胞具有产生磷酸烯醇丙酮酸(phosphoenolpyruvate,pep)的能力。在本发明的方法及/或细胞的另一较佳实施例中,细胞被修饰以增强磷酸烯醇丙酮酸(pep)的产生及/或供应。
208、在较佳实施例中且作为增强pep的产生与供应的方法,一种或多种pep依赖性糖运输磷酸转移酶系统被破坏,例如但不限于:1)n-乙酰-d-葡萄糖胺npi-磷酸转移酶(ec2.7.1.193),由如大肠杆菌或杆菌物种的nage基因(或丛集nagabcd)所编码,2)manxyz,其编码输入外源性六碳糖(甘露糖、葡萄糖、葡萄糖胺、果糖、2-脱氧葡萄糖、甘露糖胺、n-乙酰葡萄糖胺等)且释出磷酸酯至细胞质的酶ii man复合体(甘露糖pts通透酶、蛋白质-npi-磷酸组氨酸-d-甘露糖磷酸转移酶(protein-npi-phosphohistidine-d-mannosephosphotransferase),3)葡萄糖特异性pts运输蛋白(例如由ptsg/crr所编码),其摄入葡萄糖并于细胞质中形成葡萄糖-6-磷酸,4)蔗糖特异性运输蛋白,其摄入蔗糖并于细胞质中形成蔗糖-6-磷酸,5)果糖特异性运输蛋白(例如由基因frua与frub及基因fruk所编码),其摄入果糖并在第一步骤形成果糖-1-磷酸,且在第二步骤形成果糖1,6-二磷酸,6)乳糖pts运输蛋白(例如由干酪乳杆菌(lactococcus casei)中的lace所编码),其摄入乳糖并形成乳糖-6-磷酸,7)半乳糖醇特异性pts酶,其摄入半乳糖醇及/或山梨醇并分别形成半乳糖醇-1-磷酸或山梨醇-6-磷酸,8)甘露醇特异性pts酶,其摄入甘露醇及/或山梨醇并分别形成甘露醇-1-磷酸或山梨醇-6-磷酸,及9)海藻糖特异性pts酶,其摄入海藻糖并形成海藻糖-6-磷酸。
209、在另一及/或额外较佳实施例中且作为增强pep的产生与供应的方法,通过破坏ptsih/crr基因簇来破坏完整的pts系统。ptsi(酶i)为细胞质蛋白质,其作为大肠杆菌k-12的磷酸烯醇丙酮酸盐:糖磷酸转移酶系统(ptssugar)的途径(gateway)。ptsi是ptssugar两个糖非特异性蛋白组成(ptsi与ptsh)的其中之一,其与糖特异性内膜通透酶造成磷酸转移反应(cascade),而磷酸转移反应导致耦合磷酸化以及一系列糖受质的运输。hpr(含组氨酸蛋白质)为是ptssugar两个糖特异性蛋白组成的其中之一。hpr丛磷酸化酶i(ptsi-p)接受磷酸基团,并接着转移至ptssugar的许多糖特异性酶的任一者的eiia结构域。crr或eiiaglc是被需要ptsh与ptsi的反应中的pep所磷酸化。
210、在另一及/或额外较佳实施例中,通过导入及/或过表达对应的通透酶,细胞经进一步的修饰以补偿碳源的pts系统的缺失。这些是如通透酶或abc运输蛋白,其包括但不限于特异性输入乳糖的运输蛋白,例如由来自大肠杆菌的lacy基因所编码的运输蛋白,特异性输入蔗糖的运输蛋白,例如由来自大肠杆菌的cscb基因所编码的运输蛋白,特异性输入葡萄糖的运输蛋白,例如由来自大肠杆菌的galp基因所编码的运输蛋白,特异性输入果糖的运输蛋白,例如由来自变种链球菌(streptococcus mutans)的frui基因所编码的运输蛋白,或者是山梨醇/甘露醇abc运输蛋白,例如类球红细菌(rhodobacter sphaeroides)簇smoefgk所编码的运输蛋白,海藻糖/蔗糖/麦芽糖运输蛋白,例如苜蓿中华根瘤菌(sinorhizobium meliloti)的丛集thuefgk所编码的运输蛋白,以及n-乙酰葡萄糖胺/半乳糖/葡萄糖运输蛋白,例如奥奈达希瓦氏菌(shewanella oneidensis)的nagp所编码的运输蛋白。pts缺失与替代运输蛋白过表达的组合范例为:1)缺失葡萄糖pts系统,例如ptsg基因,结合导入及/或过表达葡萄糖通透酶(例如galp或glcp),2)缺失果糖pts系统,例如frub、frua、fruk基因的一或多种,结合导入及/或过表达果糖通透酶,例如frui,3)缺失乳糖pts系统,结合导入及/或过表达乳糖通透酶,例如lacy,及/或4)缺失蔗糖pts系统,结合导入及/或过表达蔗糖通透酶,例如cscb。
211、在更佳实施例中,通过导入及/或过表达糖激酶,细胞经修饰以补偿碳源的pts系统的缺失,糖激酶如葡萄糖激酶(ec 2.7.1.1、ec 2.7.1.2、ec 2.7.1.63)、半乳糖激酶(ec2.7.1.6)及/或果糖激酶(ec 2.7.1.3、ec 2.7.1.4)。pts缺失与替代运输蛋白与激酶过表达的组合范例为:1)缺失葡萄糖pts系统,例如ptsg基因,结合导入及/或过表达葡萄糖通透酶(例如galp或glcp),结合导入及/或过表达葡萄糖激酶(例如,glk),及/或2)缺失果糖pts系统,例如frub、frua、fruk基因的一或多种,结合导入及/或过表达果糖通透酶,例如frui,结合导入及/或过表达果糖激酶(例如frk或mak)。
212、在另一及/或额外较佳实施例中且作为增强pep的产生与供应的方法,通过导入或修饰以下所列的一或多种来修饰细胞:磷酸烯醇丙酮酸盐合成酶活性(ec:2.7.9.2,例如由大肠杆菌中的ppsa所编码)、磷酸烯醇丙酮酸盐羧化激酶活性(ec 4.1.1.32或ec4.1.1.49,例如分别由谷氨酸棒状杆菌(corynebacterium glutamicum)中的pck或由大肠杆菌中的pcka所编码)、磷酸烯醇丙酮酸盐羧酶活性(ec 4.1.1.31,例如由大肠杆菌中的ppc所编码)、草酰醋酸盐去羧酶(oxaloacetate decarboxylase)活性(ec 4.1.1.112,例如由大肠杆菌的eda所编码)、丙酮酸激酶活性(ec 2.7.1.40,例如由大肠杆菌中的pyka与pykf所编码)、丙酮酸羧酶活性(ec 6.4.1.1,例如由枯草杆菌中的pyc所编码)、以及苹果酸脱氢酶活性(ec 1.1.1.38或ec 1.1.1.40,例如分别由大肠杆菌中的maea或maeb所编码)。
213、在更佳实施例中,细胞系经修饰以过表达包含以下任一或多种的多肽:大肠杆菌的ppsa(uniprot id p23538)、谷氨酸棒状杆菌(c.glutamicum)的pck(uniprot idq6f5a5)、大肠杆菌的pcka(uniprot id p22259)、大肠杆菌的eda(uniprot id p0a955)、大肠杆菌的maea(uniprot id p26616)以及大肠杆菌的maeb(uniprot id p76558)。
214、在另一及/或额外的较佳实施例中,细胞系经修饰以表达任一或多种多肽,所述多肽具有磷酸烯醇丙酮酸盐合成酶活性、磷酸烯醇丙酮酸盐羧化激酶活性、草酰醋酸盐去羧酶活性或苹果酸脱氢酶活性。
215、在另一及/或额外的较佳实施例中且作为增强pep的产生与供应的方法,通过减少磷酸烯醇丙酮酸盐羧酶活性及/或丙酮酸激酶活性来修饰细胞,较佳为缺失编码磷酸烯醇丙酮酸盐羧酶、丙酮酸羧酶及/或丙酮酸激酶的基因。
216、在一例示性实施例中,细胞通过不同的适应(adaptation)来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合缺失丙酮酸羧酶基因;过表达草酰醋酸盐去羧酶结合缺失丙酮酸激酶基因;过表达草酰醋酸盐去羧酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达苹果酸脱氢酶结合缺失磷酸烯醇丙酮酸盐羧酶基因、及/或苹果酸脱氢酶结合缺失丙酮酸羧酶基因。
217、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶、过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶以及过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶以及过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶;及/或过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶。
218、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶、及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因。
219、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达磷酸烯醇丙酮酸盐并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因。
220、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因。
221、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因。
222、在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因。
223、根据本发明的方法及/或细胞的另一个较佳实施例,细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,所述单糖、双糖或寡糖参与/或为产生如于此所述的岩藻糖-α1,2-半乳糖-r的α-1,3糖基化形式所必需。
224、根据本发明的方法及/或细胞的另一个较佳实施例,全肉汤(whole broth)及/或上清液中产生90g/l或更多的该α-1,3糖基化形式的fuc-a1,2-gal-r,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的fuc-a1,2-gal-r依据该α-1,3糖基化形式的fuc-a1,2-gal-与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
225、根据本发明的方法及/或细胞的另一实施例,允许产生所述α-1,3糖基化形式的fuc-a1,2-gal-r的条件包括使用包含至少一种前体及/或受体的培养基用于产生所述α-1,3糖基化形式的fuc-a1,2-gal-r。较佳为,培养基包含选自包括乳糖、半乳糖、岩藻糖、唾液酸、glcnac、galnac、乳-n-二糖(lnb)、n-乙酰基乳糖胺(lacnac)的群组的至少一种前体。
226、根据本发明方法的替代及/或附加实施例,允许产生所述α-1,3糖基化形式的fuc-a1,2-gal-r的条件包括对培养基添加至少一种前体及/或受体补料以用于产生所述α-1,3糖基化形式的fuc-a1,2-gal-r。
227、根据本发明方法的一个替代实施例,允许产生所述α-1,3糖基化形式的fuc-a1,2-gal-r的条件包括使用培养基以培养本发明的细胞以产生α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述培养基缺乏以用于产生所述α-1,3糖基化形式的fuc-a1,2-gal-r的任何前体及/或受体,并且与进一步添加至所述培养基的至少一种前体及/或受体进料组合以用于产生所述α-1,3糖基化形式的fuc-a1,2-gal-r。
228、在一较佳实施例中,用于产生如于此所述的α-1,3糖基化形式的fuc-a1,2-gal-r的方法包括以下步骤中的至少一个:
229、i)用包括至少一种前体及/或受体的培养基;
230、ii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积;
231、iii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积,且其中较佳为该前体及/或受体进料的ph被设定为介于3与7之间,且其中较佳为该前体及/或受体进料的温度被维持在介于20℃与80℃之间;
232、iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基;
233、v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基,且其中较佳为该进料溶液的ph被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
234、该方法导致在该最终培养物中具有至少50g/l,较佳为至少75g/l,更佳为至少90g/l,更佳为至少100g/l,更佳为至少125g/l,更佳为至少150g/l,更佳为至少175g/l,更佳为至少200g/l的浓度的α-1,3糖基化形式的fuc-a1,2-gal-r。
235、在另一及/或额外较佳实施例中,用于产生如于此所述的α-1,3糖基化形式的fuc-a1,2-gal-r的方法包括以下步骤中的至少一个:
236、i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内;
237、ii)对该培养基添加至少一种前体及/或受体进料以一次脉冲或不连续(脉冲)的方式,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料脉冲之前的该培养基的体积;
238、iii)对于生物反应器中的该培养基添加至少一种前体及/或受体进料以一次脉冲或不连续(脉冲)的方式,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料脉冲之前的该培养基的体积,且其中较佳为该前体及/或受体进料脉冲的ph被设定为介于3与7之间,且其中较佳为该前体及/或受体进料脉冲的温度被维持在介于20℃与80℃之间;
239、iv)在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中,通过进料溶液的方式以不连续(脉冲)的方式对培养基添加至少一种前体及/或受体进料;
240、v)在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中,通过进料溶液的方式以一不连续(脉冲)的方式对培养基添加至少一种前体及/或受体进料,其中较佳为所述进料溶液的ph被设定为介于3与7之间,且其中较佳为所述进料溶液的温度被维持在介于20℃与80℃之间;
241、该方法导致在该最终培养物中具有至少50g/l,较佳为至少75g/l,更佳为至少90g/l,更佳为至少100g/l,更佳为至少125g/l,更佳为至少150g/l,更佳为至少175g/l,更佳为至少200g/l的浓度的α-1,3糖基化形式的fuc-a1,2-gal-r。
242、在一进一步更佳实施例中,用于产生如于此所述的α-1,3糖基化形式的fuc-a1,2-gal-r的方法包括以下步骤中的至少一个:
243、i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内;
244、ii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积;
245、iii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积,且其中较佳为该乳糖进料的ph被设定为介于3与7之间,又其中较佳为该乳糖进料的温度被维持在介于20℃与80℃之间;
246、iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基;
247、v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基,且其中该乳糖进料溶液的浓度为50g/l,较佳为75g/l,更佳为100g/l,更佳为125g/l,更佳为150g/l,更佳为175g/l,更佳为200g/l,更佳为225g/l,更佳为250g/l,更佳为275g/l,更佳为300g/l,更佳为325g/l,更佳为350g/l,更佳为375g/l,更佳为400g/l,更佳为450g/l,更佳为500g/l,还更佳为,550g/l,最佳为600g/l;且其中较佳为该进料溶液的ph被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
248、该方法导致在该培养物的最终体积中具有至少50g/l,较佳为至少75g/l,更佳为至少90g/l,更佳为至少100g/l,更佳为至少125g/l,更佳为至少150g/l,更佳为至少175g/l,更佳为至少200g/l的浓度的α-1,3糖基化形式的fuc-a1,2-gal-r。
249、较佳为,藉由从培养开始以至少5mm的浓度,较佳为以30、40、50、60、70、80、90、100、150mm的浓度,更佳为以>300mm的浓度添加乳糖,来实现乳糖进料。
250、在另一实施例中,藉由对培养基中添加一定浓度的乳糖来实现乳糖进料,使得在培养的整个生产阶段获得至少5mm,较佳为10mm或30mm的乳糖浓度。
251、在于此所述方法的进一步实施例中,细胞培养至少约60、80、100或约120小时或以连续方式培养。
252、在一个较佳实施例中,在培养基中提供碳源,较佳为蔗糖,3天或更多天,较佳为上至7天;及/或在培养基中以连续方式提供每升初始培养体积至少100、有利地至少105、更有利地至少110、甚至更有利地至少120克的蔗糖,使得培养基的最终体积的体积不超过培养前的培养基体积的三倍,有利地不超过两倍,更有利地小两倍。
253、较佳为,当进行如于此所述的方法时,通过在第二阶段(second phase)中将乳糖添加到培养基之前对培养基添加碳源,较佳为葡萄糖或蔗糖,提供指数细胞生长的第一阶段(first phase)。
254、在本发明方法的另一较佳实施例中,通过对包含前体,较佳为乳糖的培养基中添加碳基基质,较佳为葡萄糖或蔗糖,提供指数细胞生长的第一阶段,然后是第二阶段,其中仅将碳基基质,较佳为葡萄糖或蔗糖添加到培养基中。
255、在本发明方法的另一个较佳实施例中,藉由将碳基基质,较佳为葡萄糖或蔗糖添加到包含前体,较佳为乳糖的培养基中,提供指数细胞生长的第一阶段,然后是第二阶段,其中将碳基基质,较佳为葡萄糖或蔗糖和前体,较佳为乳糖添加到培养基中。
256、在一个替代的较佳实施例中,在如于此所述的方法中,已经在指数生长的第一阶段将乳糖与碳基基质一起添加。
257、在一实施例中,如于此所述的方法较佳为包括分离如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r的步骤。
258、在一较佳实施例中,于此所述的方法较佳为包括分离所述α-1,3糖基化形式的lnfp-i的步骤。
259、术语“从所述培养物分离”是指从细胞或其生长的培养基收获、收集或回收于此所述的所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或所述α-1,3糖基化形式的lnfp-1。
260、如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i可以以一般方式从于其中细胞生长的水性培养基分离。如果所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1仍然存在于产生α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的细胞中,可使用一般方式游离或萃取α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1出细胞,例如使用高ph值、热震(heat shock)、超声处理(sonication)、法式压碎机(french press)、均质化(homogenization)、酶水解、化学水解、溶剂水解、清洁剂、水解、...的细胞破坏。培养基及/或细胞萃取物一起和单独可的后进一步用于分离α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1。此较佳为包括澄清含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物,以去除悬浮颗粒与污染物,特别是通过培养基因修饰细胞产生的细胞、细胞成分、不溶性代谢物与碎片。在该步骤中,可以以一般方式澄清含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物。优选地,含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物藉由离心、絮凝、倾析及/或过滤来澄清。
261、将所述α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i从含所述α-1,3糖基化形式的lnfp-i混合物中分离出来的另一个步骤较佳为包括从含有所述岩藻糖-a-1,2-半乳糖-r的α-1,3糖基化形式或lnfp-i的α-1,3糖基化形式的混合物,较佳为在澄清之后,基本上去除所有的蛋白质,以及肽、氨基酸、rna和dna和任何可能干扰后续分离步骤的内毒素和糖脂。在该步骤中,可以以一般方式从含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物去除蛋白质和相关杂质。较佳为,从含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物中去除蛋白质、盐、副产物、颜色、内毒素和其他相关杂质,藉由超滤、纳米过滤、两相分配、反渗透、微过滤、活性炭或碳处理、用非离子界面活性剂处理、酶消化、切向流高性能过滤、切向流超过滤、电泳(例如使用板状聚丙烯酰胺或钠十二烷基硫酸盐-聚丙烯酰胺凝胶电泳(page))、亲和层析(使用亲和配体,包括例如deae-sepharose、聚-l-赖氨酸和多粘菌素-b、内毒素选择性吸附剂基质)、离子交换层析(例如但不限于阳离子交换、阴离子交换、混合床离子交换、内外配体连接)、疏水相互作用层析及/或凝胶过滤(即粒径排阻层析法(size exclusion chromatography)),特别是藉由层析,更特别是藉由离子交换层析或疏水相互作用层析或配体交换层析。除了粒径排阻层析,蛋白质和相关杂质被层析介质或选定的膜保留,所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的保留在含有α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的混合物中。
262、在进一步较佳实施例中,于此所述的方法还提供了从混合物中进一步纯化α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1。所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的进一步纯化可以例如藉由使用(活化)木炭或碳、纳米过滤、超过滤或离子交换来达成,以去除任何残留的dna、蛋白质、lps、内毒素或其他杂质。也可以使用醇,例如乙醇,和含水醇混合物。另一个纯化步骤是通过产物的结晶、蒸发或沉淀来完成的。其他纯化步骤为干燥,例如喷雾干燥(spraydrying)、冷冻干燥(lyophilization)、喷雾冷冻干燥(spray freeze drying)、冷冻喷雾干燥(freeze spray drying)、条式干燥(band drying)、带式干燥(belt drying)、真空条式干燥(vacuum band drying)、真空带式干燥(vacuum belt drying)、滚筒式干燥(drumdrying)、滚筒干燥(roller drying)、真空滚筒式干燥(vacuum drum drying)或真空滚筒干燥(vacuum roller drying)所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i。
263、在示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:
264、a)将培养物或其澄清形式与具600-3500da的截留分子量(mwco)的纳米滤膜接触,确保保留产生的α-1,3糖基化形式的lnfp-1并允许至少一部分蛋白质、盐类、副产品、颜色和其他相关杂质通过,
265、b)对来自步骤a)的渗余物进行渗滤过程,使用所述膜,用无机电解质的水溶液,然后视需要而定以纯水渗滤以除去过量的电解质,
266、c)且分别以来自所述电解质的阳离子的盐的形式收集富含α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的滞留物。
267、在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:使用不同的膜对培养物或其澄清版本进行两个膜过滤步骤,其中-一膜具有约300至约500道尔顿之间的截留分子量,并且-另一膜具有约600至约800道尔顿之间的截留分子量。
268、在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的分离和纯化是在包括以下任意顺序的步骤的方法中进行的,包括用h+-形式的强阳离子交换树脂和游离碱形式的弱阴离子交换树脂处理培养物或其澄清形式的步骤。
269、在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1的分离和纯化按以下方式进行。
270、包含所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1、生物质、培养基成分和污染物的培养物适用于以下纯化步骤:
271、i)从培养物分离生物质,
272、ii)用于去除带正电材料的阳离子交换剂处理,
273、iii)用于去除带负电材料的阴离子交换剂处理,
274、iv)纳米过滤步骤及/或电渗析步骤,
275、其中提供了一种纯化的溶液,该溶液包含所产生的α-1,3糖基化形式的lnfp-1的,纯度大于或等于80%。视需要而定,将经纯化的溶液干燥,藉由选自包括喷雾干燥、冷冻干燥、喷雾冷冻干燥、冷冻喷雾干燥、条式干燥、带式干燥(belt drying)、真空条式干燥、真空带式干燥、滚筒式干燥、滚筒干燥、真空滚筒式干燥或真空滚筒干燥的列表的一或更多种的干燥步骤。
276、在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:培养物的酶处理;从培养物中去除生物质;超过滤;纳米过滤;与柱层析步骤。优选地,此种柱层析是单柱式或多柱式。更佳为,柱层析步骤是模拟移动床层析(simulated moving bedchromatography)。此种模拟移动床层析较佳为包括i)至少4个柱,其中至少一个柱包含弱或强阳离子交换树脂;及/或ii)具有不同流速的四个区域i、ii、iii和iv;及/或iii)包含水的洗脱液;及/或iv)15至60摄氏度的操作温度。较佳为,所述方法还包括喷雾干燥步骤。
277、在一实施例中,本发明提供所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r或α-1,3糖基化形式的lnfp-i,其被干燥为粉末,藉由选自包括喷雾干燥、冷冻干燥、喷雾冷冻干燥、冷冻喷雾干燥、条式干燥、带式干燥、真空条式干燥、真空带式干燥、滚筒式干燥、滚筒干燥、真空滚筒式干燥或真空滚筒干燥的列表的一或更多的干燥步骤,其中干燥的粉末含有<15%-wt.的水,较佳为<10%-wt.的水,更佳为<7%-wt.的水,最佳为<5%-wt.的水。
278、本发明的另一实施例提供一种方法与一种细胞,其中于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r,较佳为α-1,3糖基化形式的lnfp-1是于此所述的真菌、酵母菌、细菌、昆虫、植物、动物或原生细胞中产生及/或由其所产生。细胞是选自包含以下所列的名单:细菌、酵母菌、或真菌,或指的是植物、动物或原生动物细胞。后者的细菌较佳属于变形菌门(proteobacteria)或后壁菌门(firmicutes)或蓝绿菌门(cyanobacteria)或异常球菌-栖热菌门(deinococcus-thermus)。属于变形菌门的后者细菌较佳属于肠杆菌科(enterobacteriaceae),较佳属于大肠杆菌种。后者的细菌较佳属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌b(escherichia coli b)、大肠杆菌c(escherichia coli c)、大肠杆菌w(escherichia coli w)、大肠杆菌k12(escherichia coli k12)、大肠杆菌nissle(escherichia coli nissle)。更具体而言,后者一词是关于培养的大肠杆菌菌株,其指定为大肠杆菌k12菌株,对于实验室环境适应良好,且与野生行菌株不同的是失去在肠道生存的能力。大肠杆菌k12菌株众所周知的范例为k12野生型、w3110、mg1655、m182、mc1000、mc1060、mc1061、mc4100、jm101、nzn111与aa200。因此,本发明特别是关于如前文所述的突变及/或转化的大肠杆菌细胞或菌株,其中所述大肠杆菌菌株为k12菌株。更佳的是,大肠杆菌k12菌株为大肠杆菌mg1655。属于后壁菌门(firmicutes)的后者细菌较佳属于杆菌(bacilli),较佳为乳酸杆菌(lactobacilliales),其成员有乳酸乳酸杆菌(lactobacilluslactis)、肠膜明串珠菌(leuconostoc mesenteroides),或较佳为核衣细菌目(bacillales),其成员如来自杆菌属(bacillus),例如枯草杆菌(bacillus subtilis)或芽孢枯草杆菌(b.amyloliquefaciens)。属于放线菌门(actinobacteria)的后者细菌较佳属于棒状杆菌科(corynebacteriaceae),其成员有谷氨酸棒状杆菌(corynebacteriumglutamicum)或非发酵棒杆菌(c.afermentans),或较佳属于链丝菌科(streptomycetaceae),其成员有灰色链霉菌(streptomyces griseus)或弗氏链霉菌(s.fradiae)。后者的酵母菌较佳属于子囊菌门(ascomycota)或担子菌门(basidiomycota)或半知菌门(deuteromycota)或接合菌门(zygomycetes)。后者的酵母菌较佳属于酵母菌属(saccharomyces)(其成员如酿酒酵母菌(saccharomyces cerevisiae)、贝酵母菌(s.bayanus)、布拉迪酵母(s.boulardii))、接合酵母菌属(zygosaccharomyces)、毕赤酵母菌属(pichia)(甲醇酵母(pichia pastoris)、异常毕赤酵母(p.anomala)、克鲁维毕赤酵母(p.kluyveri))、克马格特勒酵母菌属(komagataella)、汉逊氏酵母菌属(hansenula)、克鲁维酵母菌属(kluyveromyces)(其成员如乳酸克鲁维酵母(kluyveromyces lactis)、马克斯克鲁维酵母(k.marxianus)、耐热克鲁维酵母(k.thermotolerans))、德巴利酵母菌属(debaromyces)、子囊菌酵母属(yarrowia)(例如,解脂耶氏酵母(yarrowia lipolytica))、或拟球酵母菌属(starmerella)(例如,拟球酵母菌(starmerella bombicola))。后者的酵母菌较佳选自甲醇酵母(pichia pastoris)、解脂耶氏酵母(yarrowia lipolytica)、酿酒酵母菌(saccharomyces cerevisiae)与乳酸克鲁维酵母(kluyveromyces lactis)。后者的真菌较佳属于酒曲菌属(rhizopus)、网柄菌属(dictyostelium)、青霉菌属(penicillium)、白霉菌属(mucor)或曲菌属(aspergillus)。植物细胞包括开花植物与非开花植物的细胞,以及藻类细胞,例如单胞藻属(chlamydomonas)、绿球藻属(chlorella)等。较佳的是,所述植物为烟草、苜蓿、水稻、西红柿、棉花、油菜籽、大豆、玉米或玉米植物。后者的动物细胞较佳为衍生自非人类哺乳类(例如,牛、水牛、猪、羊、小鼠、大鼠)、鸟类(例如,鸡、鸭、鸵鸟、火鸡、野鸡(pheasant))、鱼类(例如,剑鱼、鲑鱼、金枪鱼、鲈鱼、鳟鱼、鲶鱼)、无脊椎动物(例如,龙虾、螃蟹、虾、蛤蜊、牡蛎、贻贝、海胆)、爬虫类(例如,蛇、短吻鳄、乌龟)、两栖类(例如,青蛙)或昆虫类(例如,果蝇、线虫),或是衍生自胚胎干细胞的外的人类细胞的基因修饰细胞株。人类与非人类哺乳类细胞较佳皆可选自包含以下所列的名单:上皮细胞如乳腺上皮细胞、胚胎肾细胞(例如,hek293或hek 293t细胞)、纤维母细胞、cos细胞、中华仓鼠卵巢细胞(chinese hamster ovary cell,cho cell)、鼠类骨髓瘤细胞(例如,n20、sp2/0或yb2/0cell)、nih-3t3细胞、非哺乳类成人干细胞或其衍生细胞,例如如wo21067641中所述。后者的昆虫细胞较佳是衍生自草地贪夜蛾(spodoptera frugiperda)(例如,sf9或sf21细胞)、家蚕(bombyx mori)、甘蓝夜蛾(mamestra brassicae)、粉纹夜蛾(trichoplusia ni)(例如,bti-tn-5b1-4细胞)或黑腹果蝇(drosophila melanogaster)(例如,果蝇s2细胞)。后者的原生动物细胞较佳为蜥蜴利什曼原虫(leishmania tarentolae)细胞。
279、根据本发明的方法及/或细胞的较佳实施例,α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r产生在细胞中及/或由细胞产生,此细胞为活革兰氏阴性菌,所述活革兰氏阴性菌包括聚n-乙酰葡萄糖胺(poly-n-acetyl-glucosamine,pnag)、肠细菌共同抗原(enterobacterial common antigen,eca)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulated perplasmic glucan,opg)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖减弱或经破坏的合成。
280、在本发明的方法及/或细胞的更佳实施例中,通过对参与合成任一或多种的聚n-乙酰葡萄糖胺(poly-n-acetyl-glucosamine,pnag)、肠细菌共同抗原(enterobacterialcommon antigen,eca)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulated perplasmic glucan,opg)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖的一或多种糖基转移酶进行突变,以提供聚n-乙酰葡萄糖胺(poly-n-acetyl-glucosamine,pnag)、肠细菌共同抗原(enterobacterial common antigen,eca)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulatedperplasmic glucan,opg)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖减弱或经破坏的合成,其中所述突变提供任一所述的糖基转移酶的缺失或较低的表达。所述糖基转移酶包括编码下述的糖基转移酶基因:聚-n-乙酰-d-葡萄糖胺合成酶次单元、udp-n-乙酰葡萄糖胺-十一异戊烯基-磷酸n-乙酰葡萄糖胺磷酸转移酶(udp-n-acetylglucosamine—undecaprenyl-phosphate n-acetylglucosaminephosphotransferase)、fuc4nac(4-乙酰胺基-4,6-二脱氧-d-半乳糖)转移酶、udp-n-乙酰-d-甘露糖胺醛酸转移酶(udp-n-acetyl-d-mannosaminuronic acid transferase)、编码下述的糖基转移酶基因:纤维素合成酶催化次单元、纤维素生合成蛋白、可拉酸生合成醛酸基转移酶(colanic acid biosynthesis glucuronosyltransferase)、可拉酸生合成半乳糖基转移酶、可拉酸生合成岩藻糖基转移酶、udp-葡萄糖:十一异戊烯基-磷酸葡萄糖1-磷酸转移酶(udp-glucose:undecaprenyl-phosphate glucose-1-phosphate transferase)、推定(putative)可拉酸生合成糖基转移酶、udp-葡萄糖醛酸盐:lps(hepiii)糖基转移酶、adp-庚糖-lpd庚糖基转移酶2(adp-heptose—lps heptosyltransferase 2)、adp-庚糖:lps庚糖基转移酶1(adp-heptose:lps heptosyltransferase 1)、推定adp-庚糖:lps庚糖基转移酶4、脂多糖核心生合成蛋白、udp-葡萄糖:(葡萄糖基)lpsα-1,2-葡萄糖基转移酶(udp-glucose:(glucosyl)lpsα-1,2-glucosyltransferase)、udp-葡萄糖:(葡萄糖基)lpsα-1,3-葡萄糖基转移酶、udp-d-半乳糖:(葡萄糖基)脂多糖-1,6-d-半乳糖基转移酶、脂多糖葡萄糖基转移酶i、脂多糖核心庚糖基转移酶3、β-1,6-半乳呋喃糖基转移酶(β-1,6-galactofuranosyltransferase)、十一异戊烯基-磷酸4-脱氧-6-甲酰胺基-l-阿拉伯糖转移酶(undecaprenyl-phosphate 4-deoxy-4-formamido-l-arabinose transferase)、脂质iva4-胺基-4-脱氧-l-阿拉伯糖基转移酶(lipid iva4-amino-4-deoxy-l-arabinosyltransferase)、细菌聚异平醇糖基转移酶(bactoprenol glucosyltransferase)、推定家族2糖基转移酶、渗透调节间质葡聚糖(osmoregulated perplasmicglucan,opg)生合成蛋白质g、渗透调节间质葡聚糖生合成蛋白质h、葡萄糖甘油酸磷酸化酶(glucosylglycerate phosphorylase)、肝糖合成酶、1,4-α-葡聚糖分支酶(1,4-α-glucanbranching enzyme)、4-α-葡聚糖转移酶(4-α-glucanotransferase)及海藻糖-6-磷酸合成酶。在一例示性实施例中,细胞系经突变包含下列的一或多种糖基转移酶:pgac、pgad、rfe、rfft、rffm、bcsa、bcsb、bcsc、wcaa、wcac、wcae、wcai、wcaj、wcal、waah、waaf、waac、waau、waaz、waaj、waao、waab、waas、waag、waaq、wbbl、arnc、arnt、yfdh、wbbk、opgg、opgh、ycjm、glga、glgb、malq、otsa与yaip,其中所述突变提供任一所述糖基转移酶的缺失或较低的表达。
281、在方法及/或细胞替代及/或额外的较佳实施例中,通过过表达编码碳储存调控蛋白的基因、缺失编码na+/h+反向运输蛋白的基因及/或缺失编码感测组氨酸激酶的基因而提供所述聚n-乙酰葡萄糖胺(poly-n-acetyl-glucosamine,pnag)减弱或经破坏的合成。
282、如于此所使用的微生物或细胞能够在单糖、双糖、寡糖、多糖、多元醇、甘油、包括糖蜜、玉米浆、蛋白胨、胰蛋白胨、酵母菌萃取物或它们的混合物如例如混合原料的复合培养基,较佳为混合单糖原料,例如水解蔗糖为主要碳源上生长。术语“主要”是指感兴趣的生物产品、生物质形成、二氧化碳及/或副产品形成(例如酸及/或醇,例如醋酸盐、乳酸盐及/或乙醇)的最重要的碳源,即所有所需碳的20、30、40、50、60、70、75、80、85、90、95、98、99%来自上述碳源。在本发明的一实施例中,所述碳源是所述生物体的唯一碳源,即所有所需碳的100%来自上述碳源。常见的主要碳源包括但不限于葡萄糖、甘油、果糖、麦芽糖、乳糖、阿拉伯糖、麦芽低聚糖、麦芽三糖、山梨糖醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖浆、醋酸盐、柠檬酸盐、乳酸盐与丙酮酸盐。术语复合培养基是指其确切构成未确定的培养基。例子是糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母菌萃取物。如于此所使用,如于此所定义的前体不能用作产生α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-r的碳源。
283、在进一步较佳实施例中,于此描述的微生物或细胞使用具有生产途径和生物质途径的分裂代谢,如wo2012/007481中所述,其通过引用并入于此。例如,所述生物体可以通过改变选自磷酸葡萄糖异构酶基因、磷酸果糖激酶基因、果糖-6-磷酸醛酸酶基因、果糖异构酶基因及/或果糖:pep磷酸转移酶基因的基因进行基因修饰以积累果糖-6-磷酸。
284、在第三方面中,本发明提供本发明提供了一种如于此所述代谢工程化细胞用于产生α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r,较佳为α-1,3糖基化形式的lnfp-i的用途。在第三方面的一较佳实施例中,于此所述代谢工程化细胞用于产生(i)gal-a1,3-(fuc-a1,2)-gal-r,较佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-r,更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最佳为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc;或(ii)galnac-a1,3-(fuc-a1,2)-gal-r,较佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-r,更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-r,甚至更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-r,甚至更佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-r,最佳为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc。在第三方面的一更佳实施例中,于此所述代谢工程化细胞用于产生于此所揭露的血型抗原(histo blood group antigen,hbga)系统的结构。在第三方面的一更佳实施例中,于此所述代谢工程化细胞用于产生α-1,3糖基化形式的fuc-a1,2-gal-r为gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,其中葡萄糖可以视需要而定地被岩藻糖基化(较佳为a1,3-岩藻糖基化),如于此所揭露。在第三方面的另一更佳实施例中,于此所述代谢工程化细胞用于产生α-1,3galnac修饰或一α-1,3半乳糖修饰的fuc-a1,2-gal-glcnac,其中fuc-a1,2-gal-glcnac中的半乳糖通过β-1,3或β-1,4键与glcnac结合,如于此所揭露。
285、为了鉴定于此所述的α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r或α-1,3糖基化形式的lnfp-1,可利用本领域习知的标准方法来鉴定单体构件(building block)(例如,单糖或聚糖单元组成)、侧链的变旋异构构型(anomeric configuration)、取代基团的存在与位置、聚合程度/分子量及链接模式,例如,甲基分析、还原式切割(reductive cleavage)、水解、气相速层分析-质谱法(gc-ms)、基质辅助激光解吸/离子化-质谱法(maldi-ms)、电喷雾离子化-质谱法(esi-ms)、以紫外光或折射率侦测的高效能液相层析(hplc)、以脉冲电流侦测的高效能阴离子交换层析(hpaec-pad)、毛细管电泳(capillary electrophoresis,ce)、远红外光/拉曼光谱及核磁共振(nmr)谱量技术。可利用固态nmr、傅立叶-远红外光光谱法(ft-ir)及广角x光散射法来解析晶体结构。聚合程度(degree of polymerization,dp)、dp分布与多分散性(polydispersity)可利用如黏度计与高效能液相层析来决定。为了鉴定糖类的单体组成,可利用如酸催化水解、高效能液相层析或气相-液相层析法(转化为糖醇乙酸酯后)。为了决定糖苷键,糖类以在dmso中的碘甲烷和强碱进行甲基化、进行水解、还原为部分甲基化的糖醇,乙酰化为甲基化的糖醇乙酸酯,并藉由与质谱耦合的气相液相层析(glc/ms)来进行分析。为了决定寡糖的序列,利用酸或酶进行部分去聚合以决定结构。为了鉴定出变旋异构构型,对寡糖进行酶分析,即,使其接触对特定型态的链接有特异性的酶,例如,β-半乳糖苷酶或α-葡萄糖苷酶,且可使用nmr分析包括所产生的α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-r,较佳为α-1,3糖基化形式的lnfpi的产物。
286、在一些实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,其如于此所述产生,被掺入食物(例如人类食物或饲料)、膳食补充剂、药物成分、化妆品成分或药物中。在一些实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r为单糖、二糖或寡糖,与一种或多种适用于食品、饲料、膳食补充剂、药物成分、化妆品成分或药物的成分混合。
287、在一些实施例中,膳食补充剂包括至少一种益生菌(probiotic)成分及/或至少一种益生元(prebiotic)成分。
288、「益生元(prebiotic)」是一种促进对宿主有益的微生物生长的物质,特别是胃肠道微生物。在一些实施例中,膳食补充剂提供多种益生元,包括α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,且其通过本说明书中公开的方法产生及/或纯化,以促进一种或多种有益微生物的生长。用于膳食补充剂的益生元成分的例子包括其他益生元分子(如hmo)和植物多糖(如菊糖(inulin)、果胶、β-葡聚糖和低聚木糖)。「益生菌(probiotic)」产品通常含有活的微生物,它们取代或添加到胃肠道微生物群中而为受体提供帮助。这类微生物的范例包括乳酸杆菌种(lactobacillus)(例如,噬酸乳酸杆菌(l.acidophilus)和保加利亚乳酸杆菌(l.bulgaricus))、双歧杆菌种(bifidobacterium)(例如,动物双歧杆菌(b.animalis)、长双歧杆菌(b.longum)和婴儿双歧杆菌(b.infantis)(例如bi-26))和布拉氏酵母菌(saccharomyces boulardii)。在一些实施例中,通过本说明书的方法产生及/或纯化的寡糖与此类微生物结合口服施用。
289、膳食补充剂的其他成分的例子包括双糖(例如乳糖)、单糖(例如葡萄糖和半乳糖)、增稠剂(例如阿拉伯树胶)、酸度调节剂(例如柠檬酸三钠)、水、脱脂牛奶和调味剂。
290、在一些实施例中,如于此所述产生的α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,添加至人类婴儿食物(例如,婴幼儿配方奶粉)。婴幼儿配方奶粉一般是作为完全或部分取代人类母乳来喂养婴儿所制造的食物。在一些实施例中,婴幼儿配方奶粉以粉末的形式贩卖,且在瓶中与水混合或以杯子与水混合后喂养婴儿。婴儿配方奶粉的成分通常被设计为大致模仿人类母乳。在一些实施例中,通过本说明书中的方法产生的α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,包含于婴幼儿配方奶分中以提供类似于人类母乳中寡糖所提供的营养益处。在一些实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,与婴幼儿配方奶粉的一或多种成分混合。婴幼儿配方奶粉成分的范例包括脱脂奶、碳水化合物来源(例如乳糖)、蛋白质来源(例如浓缩乳清蛋白和酪蛋白)、脂肪来源(例如植物油如棕榈油、高油酸红花油、菜籽油、椰子油及/或葵花籽油;和鱼油)、维生素(例如维生素a、bb、bi2、c和d)、矿物质(例如柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠和磷酸钙)以及可能包括人乳寡糖(hmo)。例如,这类hmo可包括difl、乳糖-n-丙糖ii、lnt、lnnt、乳糖-n-岩藻戊糖i、乳糖-n-新岩藻戊糖、乳糖-n-岩藻戊糖ii、乳糖-n-岩藻戊糖iii、乳糖-n-岩藻戊糖v、乳糖-n-新岩藻糖戊糖v、乳糖-n-二岩藻糖己糖i、乳糖-n-二岩藻糖己糖ii、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳糖-n-己糖以及乳糖-n-新己糖。
291、在一些实施例中,一种或多种婴儿配方成分包括脱脂奶、碳水化合物源、蛋白质源、脂肪源及/或维生素和矿物质。
292、在一些实施例中,一或多种婴幼儿配方奶分可包括乳糖、乳清蛋白浓缩物及/或高油酸红花油。
293、在一些实施例中,婴幼儿配方奶粉中的α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖的浓度大约与人类母乳中一般存在的寡糖浓度相同。在一些实施例中婴幼儿配方奶粉中的半乳糖基化寡糖的浓度大约与人类母乳中一般存在的寡糖浓度相同。
294、在一些实施例中,α-1,3糖基化形式的fuc-a1,2-gal-r,其中所述r是单糖、双糖或寡糖,并入至饲料制品中,其中所述饲料选自包括下列的名单:宠物食品、动物代乳品、兽医产品、断奶后饲料或教槽饲料(creep feed)。
295、除非另有明确说明,在本发明的一方面的上下文中揭露的每个实施例,也在本发明的所有其他方面的上下文中公开。
296、在整个申请中,除非另有明确说明,否则冠词「一(a或an)」较佳可利用「至少二」取代,更佳可利用「至少三」取代,更佳可利用「至少四」取代,更佳可利用「至少五」取代,更佳可利用「至少六」取代,最佳可利用「至少二」取代。
297、除非另有定义,于此使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。一般而言,于此所使用的命名法和细胞培养、分子遗传学、有机化学和核酸化学以及前后文所述的杂交中的实验室流程是本领域习知和常用的命名法与流程。标准技术用于核酸和肽合成。一般而言,纯化步骤是根据制造商的说明书而进行的。
298、进一步的优点来自于具体的实施例与实例。不言而喻,在不脱离本发明的范围的情况下,上述特征和下文解释的特征不仅可以以各自指明的组合使用,而且可以以其他组合或单独使用。
299、本发明关于以下特定实施例:
300、1.一种藉由细胞,较佳为单一细胞产生α-1,3糖基化形式的岩藻糖-α-1,2-半乳糖-r(fucose-alpha-1,2-galactose-r,fuc-a1,2-gal-r)的方法,其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团,其中该方法包括下列步骤:
301、i.提供具有合成fuc-a1,2-gal-r的能力、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferase),并具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖(nucleotide-sugar)的能力的细胞,与
302、ii.在允许合成该fuc-a1,2-gal-r、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的fuc-a1,2-gal-r的条件下培养该细胞,
303、iii.较佳为自该培养物分离该α-1,3糖基化形式的fuc-a1,2-gal-r。
304、2.如实施例1的方法,其中于该fuc-a1,2-gal-r中的半乳糖(galactose,gal)残基经由β-1,3或β-1,4糖苷键(glycosidic linkage)与r结合。
305、3.如实施例1或2的方法,其中该r包括单糖(monosaccharide)、双糖(disaccharide)、寡糖(oligosaccharide)、肽、蛋白质、糖肽(glycopeptide)、糖蛋白(glycoprotein)、脂质或糖脂(glycolipid)
306、4.如实施例1至3的任一项的方法,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-r,较佳为其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-r。
307、5.如实施例4的方法,其中于该fuc-a1,2-gal-b1,3-glcnac-r中的n-乙酰葡萄糖胺(n-acetylglucosamine,glcnac)残基经由β-1,3或β-1,4糖苷键与r结合。
308、6.如实施例4或5的方法,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-b1,3-r,较佳为,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-r,更佳为,其中该fuc-a1,2-gal-r为乳-n-岩藻五糖i(lacto-n-fucopentaose i,lnfp-i,fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)。
309、7.如实施例1至3的任一项的方法,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-r,较佳为,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-glc,视需要而定,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc。
310、8.如实施例1至7的任一项的方法,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为组织血型抗原(histo blood group antigen,hbga)系统的结构。
311、9.如实施例1至8的任一项的方法,其中该α-1,3-糖基转移酶为一α-1,3-半乳糖基转移酶(alpha-1,3-galactosyltransferase),其为具有将一半乳糖(galactose,gal)残基自udp-半乳糖(udp-galactose,udp-gal)转移至岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
312、10.如实施例1至6、8或9的任一项的方法,其中该α-1,3-糖基转移酶α-1,3-半乳糖基转移酶,其为具有将半乳糖(gal)残基自udp-gal转移至lnfp-i的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
313、11.如实施例1至3、7、9或10的任一项的方法,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(gal)残基自udp-gal转移至fuc-a1,2-gal-b1,4-glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该fuc-a1,2-gal-b1,4-glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
314、12.如实施例1至6或8至10的任一项的方法,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的乳-n-岩藻五糖i(lnfp-i),其为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc(gal-a1,3-lnfp-i),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为udp-半乳糖(udp-galactose,udp-gal)。
315、13.如实施例1至3、7或9至11的任一项的方法,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的fuc-a1,2-gal-b1,4-glc,其为gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,视需要而定,α-1,3糖基化形式的fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc,其为
316、gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc,该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为udp-半乳糖(udp-gal)。
317、14.如实施例9至13的任一项的方法,其中该α-1,3-半乳糖基转移酶具有pfampf03414结构域(domain),且
318、a.包括具有seq id no:01的基序(motif)yx[fhmqt]xaxx[acg][acg]其中x可为任何氨基酸残基,或
319、b.包括具有seq id no:02的基序yxqxcxx[acg][acg]其中x可为任何氨基酸残基,或
320、c.包括如seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
321、d.系为seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物(functional homolog)、变体(variant)或衍生物(derivative),其具有与具有seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fucose-a1,2-galactose-r,fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
322、e.系为功能性片段,包括来自seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
323、15.如实施例1至8的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶(alpha-1,3-n-acetylgalactosaminyltransferase),其为具有将n-乙酰半乳糖胺(n-acetylgalactosamine,galnac)残基自udp-n-乙酰半乳糖胺(udp-n-acetylgalactosamine,udp-galnac)转移至岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
324、16.如实施例1至6、8或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,其为具有将n-乙酰半乳糖胺(galnac)残基自udp-n-乙酰半乳糖胺(udp-galnac)转移至lnfp-i的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
325、17.如实施例1至3、7或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,其为具有将n-乙酰半乳糖胺(galnac)残基自udp-galnac转移至fuc-a1,2-gal-b1,4-glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该
326、fuc-a1,2-gal-b1,4-glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
327、18.如实施例1至6、8、15或16的任一项的方法,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的乳-n-岩藻五糖i(lnfp-i),其为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc
328、(galnac-a1,3-lnfp-i),该α-1,3-糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,且该核苷酸-糖为udp-n-乙酰半乳糖胺(udp-galnac)。
329、19.如实施例1至3、7、15或17的任一项的方法,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的fuc-a1,2-gal-b1,4-glc,其为galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc(α-四糖(alpha-tetrasaccharide)或a-四糖(a-tetrasaccharide)),视需要而定α-1,3糖基化形式的fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc,其为
330、galnac-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc,该α-1,3-糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,且该核苷酸-糖为udp-n-乙酰半乳糖胺(udp-galnac)。
331、20.如实施例15至19的任一项的方法,其中该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且
332、a.包括具有seq id no:38的基序yx[acil]xgxx[acg][acg]其中x可为任何氨基酸残基,或
333、b.包括具有seq id no:39的基序yx[ag]xaxx[acg][acg]其中x可为任何氨基酸残基,或
334、c.包括如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
335、d.系为seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-n-乙酰半乳糖基转移酶(a-1,3-n-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性,或
336、e.系为功能性片段,包括来自seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
337、21.如实施例6、10、12、14、16、18或20的任一项的方法,其中藉由糖基转移酶的作用,经由将岩藻糖自gdp-岩藻糖转移到乳-n-四糖(lacto-n-tetraose,lnt,gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的末端半乳糖残基,于该细胞中合成该lnfp-i,该糖基转移酶为:
338、a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有uniprot id a0a2n5rq26的毛样短螺旋体(brachyspira pilosicoli)、具有uniprot idf8x274的dysgonomonas mossii、具有uniprot id g8qlf4的dechlorosoma suillum、具有uniprot id q316b5的desulfovibrio alaskensis与具有uniprot id a0a1b8tnt0的polaribacter vadi的多肽的列表,或
339、b.对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(uniprot id a0a2n5rq26)的多肽、来自d.mossii(uniprot id f8x274)的多肽、来自d.suillum(uniprot id g8qlf4)的多肽、来自d.alaskensis(uniprot id q316b5)的多肽与来自p.vadi(uniprot id a0a1b8tnt0)的多肽的任一者的功能性片段,或
340、c.来自具有uniprot id a0a2n5rq26的毛样短螺旋体、具有uniprot id f8x274的d.mossii、具有uniprot id g8qlf4的d.suillum、具有uniprot id q316b5的d.alaskensis与具有uniprot id a0a1b8tnt0的p.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自uniprot id a0a2n5rq26的毛样短螺旋体、具有uniprot id f8x274的d.mossii、具有uniprot id g8qlf4的d.suillum、具有uniprot id q316b5的d.alaskensis与具有uniprot id a0a1b8tnt0的p.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-n-四糖(lnt)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
341、d.多肽包括氨基酸序列,或由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(uniprot id a0a2n5rq26)的多肽、来自d.mossii(uniprot id f8x274)的多肽、来自d.suillum(uniprot id g8qlf4)的多肽、来自d.alaskensis(uniprot id q316b5)的多肽与来自p.vadi(uniprot id a0a1b8tnt0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
342、22.如实施例1至21的任一项的方法,其中该细胞在糖基转移酶的表达或活性方面被修饰。
343、23.如前方实施例的任一项的方法,其中该细胞表达膜转运蛋白(membranetransporter protein)或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜(outer membrane)。
344、24.如实施例23的方法,其中该膜转运蛋白(membrane transporter protein)或该具有转运活性的多肽系选自列表,其包括运输蛋白(porter)、p-p-键-水解驱动转运蛋白(p-p-bond-hydrolysis-driven transporter)、b-桶孔蛋白
345、(b-barrel porins)、辅助转运蛋白(auxiliary transport protein)、推定转运蛋白(putative transport protein)与磷酸转移驱动的基团转位蛋白(phosphotransfer-driven group translocator),
346、较佳为,该运输蛋白包括mfs转运蛋白、糖外流转运蛋白(sugar effluxtransporter)与嗜铁素输出蛋白(siderophore exporters),
347、较佳为,该p-p-键-水解驱动转运蛋白包括abc转运蛋白与嗜铁素输出蛋白。
348、25.如实施例23或24的任一项方法,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的fuc-a1,2-gal-r及/或用于该α-1,3糖基化形式的fuc-a1,2-gal-r的产生的一或更多种的前体及/或受体的于细胞壁的外膜上的流动。
349、26.如实施例23至25的任一项的方法,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的fuc-a1,2-gal-r的经改善的产生及/或经启动及/或经增强的流出。
350、27.如前方实施例的任一项的方法,其中该细胞为代谢工程化(metabolicallyengineered)细胞。
351、28.如实施例27的方法,其中该细胞系以基因表达模块(module)修饰,其特征在于来自任何该表达模块的表达为组成型的(constitutive),或是由天然诱导物(naturalinducer)创造的。
352、29.如实施例27或28的任一项的方法,其中该细胞包括编码一种蛋白质的相同编码dna序列的多个复制(copies)。
353、30.如实施例27至29的任一项的培养基,其中该细胞包括用于醋酸的经降低的产量的修饰。
354、31.如实施例27至29的任一项的方法,其中该细胞包括任一或更多种的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多的蛋白质包括β-半乳糖苷酶(beta-galactosidase)、半乳糖苷o-乙酰转移酶(galactoside o-acetyltransferase)、n-乙酰葡萄糖胺-6-磷酸去乙酰酶(n-acetylglucosamine-6-phosphate deacetylase)、葡萄糖胺-6-磷酸去胺酶(glucosamine-6-phosphatedeaminase)、n-乙酰葡萄糖胺抑制蛋白(n-acetylglucosamine repressor)、核糖核苷酸单磷酸酶(ribonucleotide monophosphatase)、eiicba-nag、udp-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶(udp-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、l-墨角藻糖激酶(l-fuculokinase)、l-岩藻糖异构酶(l-fucoseisomerase)、n-乙酰神经氨酸解离酶(n-acetylneuraminate lyase)、n-乙酰甘露糖胺激酶(n-acetylmannosamine kinase)、n-乙酰甘露糖胺-6-磷酸2-表异构酶(n-acetylmannosamine-6-phosphate 2-epimerase)、eiiab-man、eiic-man、eiid-man、usha、半乳糖-1-磷酸尿苷酸转移酶(galactose-1-phosphate uridylyltransferase)、葡萄糖-1-磷酸腺苷酸转移酶(glucose-1-phosphate adenylyltransferase)、葡萄糖-1-磷酸酶(glucose-1-phosphatase)、atp-依赖性6-磷酸果糖激活酶同功酶1(atp-dependent 6-phosphofructokinase isozyme 1)、atp-依赖性6-磷酸果糖激活酶同功酶2(atp-dependent 6-phosphofructokinase isozyme 2)、葡萄糖-6-磷酸异构酶(glucose-6-phosphate isomerase)、有氧呼吸控制蛋白(aerobic respiration control protein)、转录抑制蛋白iclr
355、(transcriptional repressor iclr)、lon蛋白酶(lon protease)、葡萄糖特异性易位磷酸转移酶iibc成分ptsg(glucose-specific translocating phosphotransferaseenzyme iibc component ptsg)、葡萄糖特异性易位磷酸转移酶(pts)酶iibc成分malx(glucose-specific translocating phosphotransferase(pts)enzyme iibc componentmalx)、酶iiaglc、β-葡糖苷特异性pts酶ii(beta-glucoside specific pts enzyme ii)、果糖特异性pts多磷酸基转移蛋白frua与frub(fructose-specific pts multiphosphoryltransfer protein frua and frub)、乙醇脱氢酶(ethanol dehydrogenase)醛脱氢酶(aldehyde dehydrogenase)、丙酮酸甲酸裂解酶(pyruvate-formate lyase)、醋酸激酶(acetate kinase)、磷酸酰基转移酶(phosphoacyltransferase)、磷酸乙酰转移酶(phosphate acetyltransferase)、丙酮酸去羧酶(pyruvate decarboxylase)。
356、32.如前方实施例的任一项的方法,其中该细胞具有产生磷酸烯醇丙酮酸盐(phosphoenolpyruvate,pep)的能力。
357、33.如前方实施例的任一项的方法,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(pep)的产生及/或供应。
358、34.如前方实施例的任一项的方法,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的fuc-a1,2-gal-r的该产生所需。
359、35.如前方实施例的任一项的方法,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤(lactose killing)现象。
360、36.如前方实施例的任一项的方法,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/l或更多的该α-1,3糖基化形式的fuc-a1,2-gal-r,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的fuc-a1,2-gal-r依据该α-1,3糖基化形式的fuc-a1,2-gal-r与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
361、37.如前方实施例的任一项的方法,其中该细胞被稳定地培养于培养基中。
362、38.如前方实施例的任一项的方法,其中该条件包括:
363、(i)使用包含用于该α-1,3糖基化形式的fuc-a1,2-gal-r的产生的至少一种前体及/或受体(acceptor)的培养基,及/或
364、(ii)对该培养基添加用于该α-1,3糖基化形式的fuc-a1,2-gal-r的产生的至少一种前体及/或受体进料(feed).
365、39.如前方实施例的任一项的方法,该方法包括下列步骤的至少一者:
366、i)使用包括至少一种前体及/或受体的培养基;
367、ii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积;
368、iii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积,且其中较佳为该前体及/或受体进料的ph被设定为介于3与7之间,且其中较佳为该前体及/或受体进料的温度被维持在介于20℃与80℃之间;
369、iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基;
370、v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基,且其中较佳为该进料溶液的ph被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
371、该方法导致在该最终培养物中具有至少50g/l,较佳为至少75g/l,更佳为至少90g/l,更佳为至少100g/l,更佳为至少125g/l,更佳为至少150g/l,更佳为至少175g/l,更佳为至少200g/l的浓度的α-1,3糖基化形式的fuc-a1,2-gal-r。
372、40.如实施例1至38的任一项的方法,该方法包括下列步骤的至少一者:
373、i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内;
374、ii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积;
375、iii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250ml(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积,且其中较佳为该乳糖进料的ph被设定为介于3与7之间,又其中较佳为该乳糖进料的温度被维持在介于20℃与80℃之间;
376、iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加乳糖进料至该培养基;
377、v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基,且其中该乳糖进料溶液的浓度为50g/l,较佳为75g/l,更佳为100g/l,更佳为125g/l,更佳为150g/l,更佳为175g/l,更佳为200g/l,更佳为225g/l,更佳为250g/l,更佳为275g/l,更佳为300g/l,更佳为325g/l,更佳为350g/l,更佳为375g/l,更佳为400g/l,更佳为450g/l,更佳为500g/l,还更佳为,550g/l,最佳为600g/l;且其中较佳为该进料溶液的ph被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
378、该方法导致在该培养物的最终体积中具有至少50g/l,较佳为至少75g/l,更佳为至少90g/l,更佳为至少100g/l,更佳为至少125g/l,更佳为至少150g/l,更佳为至少175g/l,更佳为至少200g/l的浓度的α-1,3糖基化形式的fuc-a1,2-gal-r。
379、41.如实施例39的方法,其中该乳糖进料是藉由从培养开始以至少为5mm的浓度,较佳为以30、40、50、60、70、80、90、100、150mm的浓度,更佳为以>300mm的浓度添加乳糖来完成的。
380、42.如实施例39或40的任一项的方法,其中该乳糖进料是藉由将乳糖以浓度添加到培养物中来实现的,使得在整个培养物的产生阶段获得至少5mm,较佳为10mm或30mm的乳糖浓度。
381、43.如前方实施例的任一项的方法,其中细胞培养至少约60、80、100或约120小时或以连续方式培养。
382、44.如前方实施例的任一项的方法,其中该细胞在包括包含单糖、双糖、寡糖、多糖、多元醇、甘油的碳源的培养基,包括糖蜜(molasses)、玉米浆(corn steep liquor)、蛋白胨(peptone)、胰蛋白胨(tryptone)或酵母萃取物(yeast extract)的复合培养基中培养;较佳为,其中该碳源选自包括葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖(arabinose)、麦芽寡糖
383、(malto-oligosaccharides)、麦芽三糖(maltotriose)、山梨糖醇(sorbitol)、木糖
384、(xylose)、鼠李糖(rhamnose)、半乳糖、甘露糖、甲醇、乙醇、海藻糖(trehalose)、淀粉,纤维素、半纤维素(hemi-cellulose)、糖蜜、玉米浆、高果糖糖浆(high-fructosesyrup)、醋酸盐、柠檬酸盐、乳酸盐与丙酮酸盐的列表。
385、45.如前方实施例的任一项的方法,其中该培养基包含至少一种前体,其系选自包括乳糖、半乳糖、岩藻糖、唾液酸、glcnac、galnac、乳-n-二糖(lacto-n-biose,lnb)、n-乙酰乳糖胺(n-acetyllactosamine,lacnac)的群组。
386、46.如前方实施例的任一项的方法,其中藉由添加碳基质(carbon-basedsubstrate),较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中,只有碳基基质,较佳为葡萄糖或蔗糖,被添加至培养基。
387、47.如实施例1至45的任一项的方法,其中藉由添加碳基质,较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中碳基质,较佳为葡萄糖或蔗糖,与前体,较佳为乳糖被添加至该培养基。
388、48.如前方实施例的任一项的方法,其中该细胞产生带电、较佳为唾液酸化(sialylated)及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的fuc-a1,2-gal-r。
389、49.如前方实施例的任一项的方法,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的fuc-a1,2-gal-r。
390、50.一种代谢工程化细胞,用以产生α-1,3糖基化形式的岩澡糖-α-1,2-半乳糖-r(fucose-alpha-1,2-galactose-r,fuc-a1,2-gal-r),其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团,且其中该细胞
391、-合成fuc-a1,2-gal-r,与
392、-表达α-1,3-糖基转移酶,且
393、-具有产生核苷酸-糖的能力,其中该核苷酸-糖为该α-1,3-糖基转移酶的供体。
394、51.如实施例50的细胞,其中于该fuc-a1,2-gal-r中的半乳糖(galactose,gal)残基经由β-1,3或β-1,4糖苷键(glycosidic linkage)与r结合。
395、52.如实施例50或51的任一项的细胞,其中该r包括单糖、双糖、寡糖、肽、蛋白质、糖肽、糖蛋白、脂质或糖脂(glycolipid)。
396、53.如实施例50至52的任一项的细胞,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-r,较佳为该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-r。
397、54.如实施例53的细胞,其中于该fuc-a1,2-gal-b1,3-glcnac-r中的n-乙酰葡萄糖胺(glcnac)残基经由β-1,3或β-1,4糖苷键与r结合。
398、55.如实施例53或54的任一项的细胞,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-b1,3-r,较佳为,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-r,更佳为,其中fuc-a1,2-gal-r为乳-n-岩藻五糖i(lnfp-i,fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)。
399、56.如实施例50至52的任一项的细胞,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-r,较佳为,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-glc,视需要而定,其中该fuc-a1,2-gal-r为fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc。
400、57.如实施例50至56的任一项的细胞,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为组织血型抗原(hbga)系统的结构。
401、58.如实施例50至57的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(gal)残基自udp-半乳糖(udp-gal)转移至岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
402、59.如实施例50至55、57或58的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(gal)残基自udp-gal转移至lnfp-i的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
403、60.如实施例50至52、56、58或59的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(gal)残基自udp-gal转移至fuc-a1,2-gal-b1,4-glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该fuc-a1,2-gal-b1,4-glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
404、61.如实施例50至55或57至59的任一项的细胞,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的乳-n-岩藻五糖i(lnfp-i),其为gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc(gal-a1,3-lnfp-i),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为udp-半乳糖(udp-gal)。
405、62.如实施例50至52、56或58至60的任一项的细胞,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的fuc-a1,2-gal-b1,4-glc,其为gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,视需要而定,α-1,3糖基化形式的fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc,其为
406、gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc,该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为udp-半乳糖(udp-gal)。
407、63.如实施例58至62的任一项的细胞,其中该α-1,3-半乳糖基转移酶具有pfampf03414结构域,且
408、a.包括具有seq id no:01的基序(motif)yx[fhmqt]xaxx[acg][acg],其中x可为任何氨基酸残基,或
409、b.包括具有seq id no:02的基序yxqxcxx[acg][acg],其中x可为任何氨基酸残基,或
410、c.包括如seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
411、d.系为seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物、变体或衍生物,具有与具有seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
412、e.系为一功能性片段,包括来自seq id no:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
413、64.如实施例50至57的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,其为具有将n-乙酰半乳糖胺(galnac)残基自udp-n-乙酰半乳糖胺(udp-galnac)转移至岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
414、65.如实施例50至55、57或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,其为具有将n-乙酰半乳糖胺(galnac)残基自udp-n-乙酰半乳糖胺(udp-galnac)转移至lnfp-i的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
415、66.如实施例50至52、56或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,其为具有将n-乙酰半乳糖胺(galnac)残基自udp-galnac转移至fuc-a1,2-gal-b1,4-glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该fuc-a1,2-gal-b1,4-glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
416、67.如实施例50至55、57、64或65的任一项的细胞,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的乳-n-岩藻五糖i(lnfp-i),其为galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc(galnac-a1,3-lnfp-i),该α-1,3-糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,且该核苷酸-糖为udp-n-乙酰半乳糖胺(udp-galnac)。
417、68.如实施例50至52、56、64或66的任一项的细胞,其中该α-1,3糖基化形式的fuc-a1,2-gal-r为α-1,3糖基化形式的fuc-a1,2-gal-b1,4-glc,其为galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc(α-四糖或a-四糖),视需要而定α-1,3糖基化形式的fuc-a1,2-gal-b1,4-(fuc-a1,3)-glc,其为galnac-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc,该α-1,3-糖基转移酶为α-1,3-n-乙酰半乳糖胺转移酶,且该核苷酸-糖为udp-n-乙酰半乳糖胺(udp-galnac)。
418、69.如实施例64至68的任一项的细胞,其中该α-1,3-n-乙酰半乳糖胺转移酶具有pfam pf03414结构域,且
419、a.包括具有seq id no:38的基序yx[acil]xgxx[acg][acg],其中x可为任何氨基酸残基,或
420、b.包括具有seq id no:39的基序yx[ag]xaxx[acg][acg],其中x可为任何氨基酸残基,或
421、c.包括如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
422、d.系为seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-n-乙酰半乳糖基转移酶(a-1,3-n-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性,或
423、e.系为一功能性片段,包括来自seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-r(fuc-a1,2-gal-r)的末端末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-n-乙酰半乳糖基转移酶活性。
424、70.如实施例55、59、61、63、65、67或69的任一项的细胞,其中藉由糖基转移酶的作用,经由将岩藻糖自gdp-岩藻糖转移到乳-n-四糖(lnt,gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的末端半乳糖残基,于该细胞中合成该lnfp-i,该糖基转移酶为
425、a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有uniprot id a0a2n5rq26的毛样短螺旋体、具有uniprot id f8x274的dysgonomonasmossii、具有uniprot id g8qlf4的dechlorosoma suillum、具有uniprot id q316b5的desulfovibrio alaskensis与具有uniprot id a0a1b8tnt0的polaribacter vadi的多肽的列表,或
426、b.对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(uniprot id a0a2n5rq26)的多肽、来自d.mossii(uniprot id f8x274)的多肽、来自d.suillum(uniprot id g8qlf4)的多肽、来自d.alaskensis(uniprot id q316b5)的多肽与来自p.vadi(uniprot id a0a1b8tnt0)的多肽的任一者的功能性片段,或
427、c.来自具有uniprot id a0a2n5rq26的毛样短螺旋体、具有uniprot id f8x274的d.mossii、具有uniprot id g8qlf4的d.suillum、具有uniprot id q316b5的d.alaskensis与具有uniprot id a0a1b8tnt0的p.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自uniprot id a0a2n5rq26的毛样短螺旋体、具有uniprot id f8x274的d.mossii、具有uniprot id g8qlf4的d.suillum、具有uniprot id q316b5的d.alaskensis与具有uniprot id a0a1b8tnt0的p.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-n-四糖(lnt)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
428、d.多肽包括氨基酸序列,或是由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(uniprot id a0a2n5rq26)的多肽、来自d.mossii(uniprot id f8x274)的多肽、来自d.suillum(uniprot id g8qlf4)的多肽、来自d.alaskensis(uniprot id q316b5)的多肽与来自p.vadi(uniprot id a0a1b8tnt0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对lnt的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
429、71.如实施例50至70的任一项的细胞,其中该细胞在糖基转移酶的表达或活性方面被修饰。
430、72.如实施例50至71的任一项的细胞,其中该细胞表达膜转运蛋白或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜。
431、73.如实施例72的细胞,其中该膜转运蛋白或该具有转运活性的多肽系选自列表,其包括运输蛋白、p-p-键-水解驱动转运蛋白、b-桶孔蛋白、辅助转运蛋白、推定的转运蛋白与磷酸转移驱动的基团转位蛋白,
432、较佳为,该运输蛋白包括mfs转运蛋白、糖外流转运蛋白(sugar effluxtransporter)与嗜铁素输出蛋白(siderophore exporters),或
433、较佳为,该p-p-键-水解驱动转运蛋白包括abc转运蛋白与嗜铁素输出蛋白。
434、74.如实施例72或73的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的fuc-a1,2-gal-r及/或用于该α-1,3糖基化形式的fuc-a1,2-gal-r的产生的一或更多种的前体及/或受体的于细胞壁的外膜上的流动。
435、75.如实施例72至74的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的fuc-a1,2-gal-r的经改善的产生及/或经启动及/或经增强的流出。
436、76.如实施例50至75的任一项的细胞,其中该细胞系以基因表达模块修饰,其特征在于来自任何该表达模块的表达为组成型的,或是由天然诱导物创造的。
437、77.如实施例50至76的任一项的细胞,其中该细胞包括编码一种蛋白质的相同编码dna序列的多个复制。
438、78.如实施例50至77的任一项的细胞,其中该细胞包括用于降低醋酸的产量的修饰。
439、79.如实施例50至78的任一项的细胞,其中该细胞包括任一或更多的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多的蛋白质包括β-半乳糖苷酶、半乳糖苷o-乙酰转移酶、n-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺-6-磷酸去胺酶、n-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、eiicba-nag、udp-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶、l-墨角藻糖激酶、l-岩藻糖异构酶、n-乙酰神经氨酸解离酶、n-乙酰甘露糖胺激酶、n-乙酰甘露糖胺-6-磷酸2-表异构酶、eiiab-man、eiic-man、eiid-man、usha、半乳糖-1-磷酸尿苷酸转移酶、葡萄糖-1-磷酸腺苷酸转移酶、葡萄糖-1-磷酸酶、atp-依赖性6-磷酸果糖激活酶同功酶1、atp-依赖性6-磷酸果糖激活酶同功酶2、葡萄糖-6-磷酸异构酶、有氧呼吸控制蛋白、转录抑制蛋白iclr、lon蛋白酶、葡萄糖特异性易位磷酸转移酶iibc成分ptsg、葡萄糖特异性易位磷酸转移酶(pts)酶iibc成分malx、酶iiaglc、β-葡糖苷特异性pts酶ii、果糖特异性pts多磷酸基转移蛋白frua与frub、乙醇脱氢酶醛脱氢酶、丙酮酸甲酸裂解酶、醋酸激酶、磷酸酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
440、80.如实施例50至79的任一项的细胞,其中该细胞具有产生磷酸烯醇丙酮酸盐(pep)的能力。
441、81.如实施例50至80的任一项的细胞,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(pep)的产生及/或供应。
442、82.如实施例50至81的任一项的细胞,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的fuc-a1,2-gal-r的该产生所需。
443、83.如实施例50至82的任一项的细胞,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤现象。
444、84.如实施例50至83的任一项的细胞,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/l或更多的该α-1,3糖基化形式的fuc-a1,2-gal-r,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的fuc-a1,2-gal-r依据该α-1,3糖基化形式的fuc-a1,2-gal-与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
445、85.如实施例50至84的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的fuc-a1,2-gal-r。
446、86.如实施例50至85的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的fuc-a1,2-gal-r。
447、87.如实施例1至49的任一项的方法或如实施例50至86的任一项的细胞,其中该细胞为细菌、真菌、酵母菌、植物细胞、动物细胞或原生动物细胞(protozoan cell),
448、-较佳为,该细菌为一大肠杆菌(escherichia coli)株(strain),更佳为大肠杆菌株,其为k-12株,还更佳为,该大肠杆菌k-12株为大肠杆菌mg1655,
449、-较佳为,该真菌属于选自包括黑霉菌属(rhizopus)、网柄菌属(dictyostelium)、青霉菌属(penicillium)、白霉菌属(mucor)或曲菌属(aspergillus)的群组的属,
450、-较佳为,该酵母菌属于选自包括酵母菌属(saccharomyces)、接合酵母菌属(zygosaccharomyces)、毕赤酵母菌属(pichia)、克马格特勒酵母(komagataella)、汉逊氏酵母菌属(hansenula)、子囊菌酵母属(yarrowia)、拟球酵母菌属(starmerella)、克鲁维酵母菌属(kluyveromyces)或德巴利酵母菌属(debaromyces)的群组的属,
451、-较佳为,该植物细胞为藻类细胞(algal cell)或系源自烟草(tobacco)、苜蓿(alfalfa)、水稻(rice)、西红柿、棉花、油菜籽(rapeseed)、大豆、玉蜀黍(maize)或玉米(corn)植物,
452、-较佳为,该动物细胞源自非人类哺乳动物(non-human mammals)、鸟、鱼、无脊椎动物(invertebrates)、爬虫类(reptiles)、两栖类(amphibians)或昆虫(insects),或源自排除胚胎干细胞的人类细胞的基因修饰细胞系(cell line),更佳为该人类和非人类哺乳动物细胞为上皮细胞(epithelial cell)、胚胎肾细胞(embryonic kidney cell)、纤维母细胞(fibroblast cell)、cos细胞、中国仓鼠卵巢(chinese hamster ovary,cho)细胞、鼠骨髓瘤细胞(murine myeloma cell)、nih-3t3细胞、非哺乳动物成人干细胞(non-mammaryadult stem cell)或其衍生物,更佳为该昆虫细胞系源自草地贪夜蛾(spodopterafrugiperda)、蚕(bombyx mori)、甘蓝夜蛾(mamestra brassicae)、粉纹夜蛾(trichoplusia ni)或黑腹果蝇(drosophila melanogaster),
453、较佳为,该原生动物细胞为蜥蜴利什曼原虫(leishmania tarentolae)细胞。
454、88.如实施例1至49与87的任一项的方法,或如实施例50至87的任一项的细胞,其中该细胞为细菌,较佳为大肠杆菌株,更佳为一k-12株的大肠杆菌株的细胞,还更佳为,该大肠杆菌k-12株为大肠杆菌mg1655。
455、89.如实施例88的方法,或如实施例88的细胞,其中该细胞为活革兰氏阴性细菌(gram-negative bacterium),其包括经降低或消除的聚-n-乙酰-葡萄糖胺(poly-n-acetyl-glucosamine,pnag)、肠杆菌共同抗原(enterobacterial common antigen,eca)、纤维素、可拉酸(colanic acid)、核心寡糖(core oligosaccharides)、渗透调节周质葡聚糖(osmoregulated periplasmic glucans,opg)、葡萄糖基甘油(glucosylglycerol)、聚糖(glycan)、及/或海藻糖(trehalose)的合成。
456、90.如实施例1至49与87的任一项的方法,或如实施例50至87的任一项的细胞,其中该细胞为酵母菌细胞。
457、91.如实施例1至49与87至90的任一项的方法,其中该分离包括下列步骤的至少一者:澄清(clarification)、超过滤(ultrafiltration)、纳米过滤(nanofiltration)、两相分配(two-phase partitioning)、逆渗透(reverse osmosis)、微过滤(microfiltration)、活性炭或碳处理(activated charcoal or carbon treatment)、以非离子界面活性剂处理(treatment with non-ionic surfactants)、酶消化(enzymatic digestion)、切向流高效过滤(tangential flow high-performance filtration)、切向流超过滤(tangentialflow ultrafiltration)、亲和层析(affinity chromatography)、离子交换层析(ionexchange chromatography)、疏水相互作用层析(hydrophobic interactionchromatography)及/或凝胶过滤(gel filtration),配体交换层析(ligand exchangechromatography)。
458、92.如实施例1至49与87至91的任一项的方法,还包括来自该细胞的任一该α-1,3糖基化形式的fuc-a1,2-gal-r,较佳为来自该细胞的α-1,3糖基化形式的lnfp-i的纯化。
459、93.如实施例1至49与87至92的任一项的方法,其中该纯化包括下列步骤的至少一者:活性炭或碳的使用、炭(charcoal)、纳米过滤、超过滤、电泳(electrophoresis)、酶处理或离子交换的使用、醇的使用,含水醇混合物(aqueous alcohol mixtures)的使用、结晶、蒸发、沉淀、干燥、喷雾干燥(spray drying)、冷冻干燥(lyophilization)、喷雾冷冻干燥(spray freeze drying)、冷冻喷雾干燥(freeze spray drying)、条式干燥(banddrying)、带式干燥(belt drying)、真空条式干燥(vacuum band drying)、真空带式干燥(vacuum belt drying)、滚筒式干燥(drum drying)、滚筒干燥(roller drying)、真空滚筒式干燥(vacuum drum drying)或真空滚筒干燥(vacuum roller drying)。
460、94.一种如实施例50至90的任一项的细胞,或如实施例1至49或87至93的任一项的方法的用途,其用于α-1,3糖基化形式的fuc-a1,2-gal-r,较佳为α-1,3糖基化形式的lnfp-i的产生。
461、将在实施例中更详细地描述本发明。以下实施例将作为对本发明的进一步说明和澄清,而不是限制性的。
462、实施例
463、实施例1材料与方法大肠杆菌(escherichia coli)
464、培养基
465、luria肉汤(luria broth,lb)培养基由1%胰蛋白胨(difco,erembodegem,belgium)、0.5%酵母萃取物(difco)与0.5%氯化钠(vwr.leuven,belgium)所组成。培养实验中96孔板或摇瓶中所使用的基本培养基(minimal medium)含有2.00g/l nh4cl、5.00g/l(nh4)2so4、2.993g/l kh2po4、7.315g/l k2hpo4、8.372g/l mops、0.5g/l nacl、0.5g/lmgso4.7h2o、30g/l蔗糖或30g/l甘油、1ml/l维生素溶液、100μl/l钼酸盐(molybdate)溶液与1ml/l硒(selenium)溶液。如各个实施例中所具体说明,将0.30g/l唾液酸(sialic acid)、20g/l乳糖、20g/l lacnac及/或20g/l lnb作为前体额外加入培养基中。将基本培养基以1mkoh设为ph为7。维生素溶液由3.6g/l fecl2.4h2o、5g/l cacl2.2h2o、1.3g/l mncl2.2h2o、0.38g/l cucl2.2h2o、0.5g/l cocl2.6h2o、0.94g/l zncl2 0.0311g/l h3bo4、0.4g/lna2edta.2h2o与1.01g/l硫胺素(thiamine).hcl组成。钼酸盐溶液含有0.967g/lnamoo4.2h2o。硒溶液含有42g/l seo2。
466、用于发酵的基本培养基,具有上方所述相同组成,含有6.75g/l nh4cl、1.25g/l(nh4)2so4、2.93g/l kh2po4与7.31g/l kh2po4、0.5g/l nacl、0.5g/l mgso4.7h2o、30g/l蔗糖或30g/l甘油、1ml/l维生素溶液、100μl/l钼酸盐溶液与1ml/l硒溶液。如各个实施例中所具体说明,将0.30g/l唾液酸、20g/l乳糖、20g/l lacnac及/或20g/l lnb作为前体额外加入培养基中。
467、复合培养基(complex medium)藉由高压灭菌(autoclaving)(121℃,21分钟)进行灭菌,而基本培养基藉由过滤(0.22μm sartorius)进行灭菌。必要时,藉由添加抗生素使培养基具有选择性:如氯霉素(chloramphenicol)(20mg/l)、卡本西林(carbenicillin)(100mg/l)、奇霉素(spectinomycin)(40mg/l)及/或卡那霉素(kanamycin)(50mg/l)。
468、质粒(plasmid)
469、pkd46(red辅助质粒,氨苄青霉素(ampicillin)抗性)、pkd3(包含frt侧面(frt-flanked)氯霉素抗性(cat)基因)、pkd4(包含frt侧面卡那霉素抗性(kan)基因)与pcp20(表达flp重组酶活性)质粒为获自r.cunin教授(比利时布鲁塞尔自由大学(vrijeuniversiteit brussel),2007年)。质粒维持于购自invitrogen的宿主e.coli dh5alpha(f-,phi80dlaczδm15,δ(laczya-argf)u169,deor,reca1,enda1,hsdr17(rk-,mk+),phoa,supe44,lambda-,thi-1,gyra96,rela1)。
470、菌株(strains)与突变(mutations)
471、大肠杆菌k12 mg1655[λ-,f-,rph-1]于2007年3月从大肠杆菌遗传储备中心(coligenetic stock center)(us),cgsc strain#:7740获得。使用datsenko与wanner(pnas 97(2000),6640-6645)发表的技术进行基因破坏(gene disruption)、基因导入(geneintroduction)与基因置换(gene replacement)。此种技术是基于藉由λred重组酶(lambdared recombinase)进行同源重组(homologous recombination)后的抗生素选择(antibiotic selection)。随后的内翻转酶(flippase)重组酶的催化作用确保了在最终产生菌株(final production strain)中的抗生素选择卡盒(antibiotic selectioncassette)的去除。携带red辅助质粒pkd46的转化体(transformant)在10ml具有氨苄青霉素(100mg/l)与l-阿拉伯糖(10mm)的lb培养基中于30℃下生长至od600 nm为0.6。藉由第一次以50ml冰冷水(ice-cold water)洗涤细胞与第二次以1ml冰冷水洗涤细胞,而使细胞为电转感受态(electrocompetent)。使用gene pulsertm(biorad)(600ω,25μfd与250volts)对50μl细胞与10-100ng线性双股dna产物进行电穿孔。之后,将细胞重新悬浮于50μl冰冷的水中。电穿孔(electroporation)后,将细胞加入到1ml lb培养基中,在37℃下培养1小时,最后涂于含有25mg/l的氯霉素或50mg/l卡那霉素的lb-琼脂上,以选择抗生素耐药的转化体。选择的突变株以修饰区上游与下游的引物经由pcr来验证,并在42℃于lb琼脂中生长以消除辅助质粒。测试突变株的氨苄青霉素(ampicillin)敏感性。使用pkd3、pkd4与其衍生物作为模板,藉由pcr获得线性ds-dna扩增子(amplicon)。所使用的引物具有的一部分序列与模板互补,与另一部分与染色体dna上需发生重组的一侧互补。对于基因体(genomic)敲除(knock-out),同源(homology)的区域被设计在目标基因的起始密码子(codon)与终止密码子的上游50-nt与下游50-nt。对于基因体敲入(knock-in),必须尊重转录起点(transcriptional starting point)(+1)。将pcr产物pcr-纯化、以dpni消化、从琼脂糖凝胶中重新纯化,并悬浮在洗脱缓冲液(5mm tris,ph 8.0)中。选择的突变株以pcp20质粒转化,其为一种氨苄青霉素与氯霉素抗性质粒,显示出flp合成的温度敏感复制(replication)与热诱导。在30℃选择氨苄青霉素抗性转化体,于其后在42℃在lb中纯化一些菌落,然后测试所有抗生素抗性与flp辅助质粒的丧失。使用对照引物(controlprimers)检查基因敲除与敲入。
472、在gdp-岩藻糖产生的一个例子中,突变株源自大肠杆菌(e.coli)k12mg1655,其包括大肠杆菌wcaj与thya基因的敲除以及含有蔗糖转运蛋白,例如来自大肠杆菌w的cscb(uniprot id e0ixr1)、果糖激酶(fructose kinase),例如源自运动发酵单胞菌(zymomonas mobilis)的frk(uniprot id q03417)与一蔗糖磷酸化酶(sucrosephosphorylase),例如源自青春双歧杆菌(bifidobacterium adolescentis)的basp(uniprot id a0zzh6)的组成型转录单元的基因体敲入。藉由基因体敲除包含glgc、agp、pfka、pfkb、pgi、arca、iclr、pgi与lon的任何一种或更多的大肠杆菌基因,可以进一步优化突变大肠杆菌菌株中的gdp-岩藻糖产生,如wo2016075243与wo2012007481中所述。gdp-岩藻糖产生可以另外优化,包括基因体敲入甘露糖-6-磷酸异构酶(mannose-6-phosphateisomerase),例如来自大肠杆菌的mana(uniprot id p00946)、磷酸甘露糖变位酶(phosphomannomutase),例如来自大肠杆菌的manb(uniprot id p24175)、甘露糖-1-磷酸鸟苷酸转移酶(mannose-1-phosphate guanylyltransferase),例如来自大肠杆菌的manc(uniprot id p24174)、gdp-甘露糖4,6-脱水酶(gdp-mannose 4,6-dehydratase),例如来自大肠杆菌的gmd(uniprot id p0ac88)与gdp-l-岩藻糖合成酶(gdp-l-fucosesynthase),例如来自大肠杆菌的fcl(uniprot id p32055)的组成型转录单元。gdp-岩藻糖产生也可以藉由敲除大肠杆菌fuck与fuci基因与基因体敲入包含岩藻糖通透酶(fucosepermease),例如来自大肠杆菌的fucp(uniprot id p11551)与双功能岩藻糖激酶(fucosekinase)/岩藻糖-1-磷酸鸟苷酸转移酶(fucose-1-phosphate guanylyltransferase),例如来自脆弱类杆菌(bacteroides fragilis)的fkp(uniprot id suv40286.1)的组成型转录单元来获得。所有突变菌株皆可以大肠杆菌lacz、lacy与laca基因的基因体敲除以及乳糖通透酶(lactose permease),例如大肠杆菌lacy(uniprot id p02920)的组成型转录单元的基因体敲入进行额外修饰。在产生如本发明中所用的岩藻糖基化结构的下一步中,突变的gdp-岩藻糖产生株被以包含α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),例如来自幽门螺杆菌(h.pylori)的hpfutc(genbank:aad29863.1)、具uniprot id a0a2n5rq26的来自brachyspira pilosicoli的多肽、具uniprot id f8x274的来自dysgonomonas mossii的多肽、具uniprot id g8qlf4的来自dechlorosoma suillum的多肽、具uniprot id q316b5的来自desulfovibrio alaskensis的多肽或具uniprot ida0a1b8tnt0的来自polaribacter vadi的多肽的组成型转录单元的表达质粒以及选择标记(selection marker),例如大肠杆菌thya(uniprot id p0a884)的组成型转录单元额外修饰。α-1,2-岩藻糖基转移酶的组成型转录单元也可以经由基因体敲入呈现给突变的大肠杆菌菌株。
473、或者,及/或另外,gdp-岩藻糖及/或岩藻糖基化结构的产生,可在突变的大肠杆菌菌株中进一步优化,藉由包含膜运输蛋白(membrane transporter protein),例如来自莫金斯克罗诺杆菌的mdfa(uniprot id a0a2t7anq9)、来自杨氏柠檬酸杆菌的mdfa(uniprotid d4bc23)、来自大肠杆菌的mdfa(uniprot id p0aey8)、来自雷克斯堡约克氏菌的mdfa(uniprot id g9z5f4)、来自大肠杆菌的icet(uniprot id a0a024l207)或来自杨氏柠檬酸杆菌的icet(uniprot id d4b8a6)的组成型转录单元的基因体敲入。
474、在产生乳-n-三碳糖(lacto-n-triose)(lnt-ii,ln3,glcnac-b1,3-gal-b1,4-glc)的一个例子中,突变株源自大肠杆菌k12 mg1655,并以大肠杆菌lacz、lacy、laca与nagb基因的敲除,以及乳糖通透酶,例如来自大肠杆菌的lacy(uniprot id p02920),与半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶(galactoside beta-1,3-n-acetylglucosaminyltransferase),例如来自脑膜炎双球菌(n.meningitidis)的lgta(genbank:aam33849.1)的组成型转录单元的基因体敲入来修饰。为了产生乳-n-四糖(lacto-n-tetraose)(lnt,gal-b1,3-glcnac-b1,3-gal-b1,4-glc),以可以藉由基因体敲入或从表达质粒传递给菌株的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(n-acetylglucosamine beta-1,3-galactosyltransferase),例如来自大肠杆菌o55:h7(uniprot id d3qy14)的wbgo的组成型转录单元来进一步修饰ln3产生菌株。为了产生乳-n-新四糖(lacto-n-neotetraose,lnnt,gal-b1,4-glcnac-b1,3-gal-b1,4-glc)进一步以n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(n-acetylglucosamine beta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的lgtb(uniprot id q51116)的组成型转录单元来修饰ln3产生菌株。视需要而定,可以添加乳糖通透酶、半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶、n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶及/或n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶基因的多复制到突变的大肠杆菌菌株。突变株还可以视需要而定藉由基因体敲入l-谷氨酰胺-d-果糖-6-磷酸转胺酶(l-glutamine-d-fructose-6-phosphateaminotransferase),例如来自大肠杆菌的突变株glms*54(不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169,藉由a39t、r250c与g472s突变,如deng et al.所述(biochimie 2006,88:419-429)的组成型转录单元来修饰,以增强udp-glcnac产生。
475、此外,ln3、lnt及/或lnnt的产生可以包括galt、usha、ldha与agp的任一个或更多的大肠杆菌基因的基因体敲除来于突变的大肠杆菌中进一步优化。突变的大肠杆菌菌株也可以视需要而定以udp-葡萄糖-4-差向异构酶(udp-glucose-4-epimerase),例如来自大肠杆菌的gale(uniprot id p09147),磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmm(uniprot id p31120)与n-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶(n-acetylglucosamine-1-phosphate uridylyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphate acetyltransferase),例如来自大肠杆菌的glmu(uniprotid p0acc7)的组成型转录单元的基因体敲入以适应。突变的大肠杆菌菌株也可藉由旁边是磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmm(uniprotid p31120),与n-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶,例如来自大肠杆菌的glmu(uniprot id p0acc7)的视需要而定的敲入的4-差向异构酶(4-epimerase),例如来自绿脓杆菌(pseudomonas aeruginosa)的wbpp(uniprot id q8kn66)的组成型转录单元的基因体敲入,来适应udp-galnac的产生。此外,突变菌株可以α-1,3-半乳糖基转移酶,例如seq id no:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-n-乙酰半乳糖胺转移酶(alpha-1,3-n-acetylgalactosaminyl transferase),例如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元进行修饰。
476、或者,及/或另外,ln3、lnt、lnnt及其衍生的寡糖的产生可以包括膜转运蛋白如膜转运蛋白,例如来自莫金斯克罗诺杆菌的mdfa(uniprot id a0a2t7anq9)、来自杨氏柠檬酸杆菌(uniprot id d4bc23)的mdfa、来自大肠杆菌的mdfa(uniprot id p0aey8)、来自雷克斯堡约克氏菌的mdfa(uniprot id g90t4l)或来自杨氏柠檬酸杆菌(uniprot id d4b8a6)的icet的组成型转录单元的基因体敲入来进一步于突变的大肠杆菌中进一步优化。
477、在唾液酸产生的一个实例中,突变株源自大肠杆菌k12 mg1655,其包含组成型转录单元的基因体敲入,此转录单元含有一个或更多的复制的葡糖胺6-磷酸n-乙酰转移酶(glucosamine 6-phosphate n-acetyltransferase),例如来自酿酒酵母的gna1(uniprotid p43577)、n-乙酰葡糖胺2-差向异构酶(n-acetylglucosamine 2-epimerase),例如来自卵形拟杆菌(bacteroides ovatus)的age(uniprot id a7lvg6)与n-乙酰神经氨酸合成酶(n-acetylneuraminate synthas),例如来自脑膜炎双球菌(neisseria meningitidis)(uniprot id e0ncd4)或曲状杆菌(campylobacter jejuni)(uniprot id q93mp9)。
478、或者,及/或另外,唾液酸的产生可以藉由含有udp-n-乙酰葡糖胺2-差向异构酶(udp-n-acetylglucosamine 2-epimerase),例如来自曲状杆菌的neuc(uniprot idq93mp8)与n-乙酰神经氨酸合成酶,例如来自脑膜炎双球菌(uniprot id e0ncd4)或曲状杆菌(uniprot id q93mp9)的组成型转录单元的基因体敲入获得。
479、或者,及/或另外,唾液酸的产生可藉由含有磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmm(uniprot id p31120)、n-乙酰葡萄糖胺-1-磷酸尿苷基转移酶(n-acetylglucosamine-1-phosphateuridyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphateacetyltransferase),例如来自大肠杆菌的glmu(uniprot id p0acc7),一udp-n-乙酰葡萄糖胺2-差向异构酶(udp-n-acetylglucosamine 2-epimerase),例如来自曲状杆菌的neuc(uniprot id q93mp8)与n-乙酰神经氨酸合成酶,例如来自脑膜炎双球菌(uniprot ide0ncd4)或曲状杆菌(uniprot id q93mp9)的组成型转录单元的基因体敲入获得。
480、或者,及/或另外,唾液酸的产生可藉由含有一双功能udp-glcnac 2-差向异构酶(udp-glcnac 2-epimerase)/n-乙酰甘露糖胺激酶(n-acetylmannosamine kinase),例如来自m.musculus(菌株c57bl/6j)(uniprot id q91wg8)、n-酰基神经氨酸-9-磷酸合成酶(n-acylneuraminate-9-phosphate synthetase),例如来自假单胞菌(pseudomonas sp.)uw4(uniprot id k9nph9)与n-酰基神经氨酸-9-磷酸酶(n-acylneuraminate-9-phosphatase),例如来自candidatus magnetomorum sp.hk-1(uniprot id kpa15328.1)或来自多形拟杆菌(bacteroides thetaiotaomicron)(uniprot id q8a712)的组成型转录单元的基因体敲入获得。
481、或者,及/或另外,唾液酸的产生可藉由含有磷酸葡糖胺变位酶例如,来自大肠杆菌的glmm(uniprot id p31120)、n-乙酰葡萄糖胺-1-磷酸尿苷基转移酶(n-acetylglucosamine-1-phosphate uridyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphate acetyltransferase),例如来自大肠杆菌的glmu(uniprot idp0acc7)、双功能udp-glcnac 2-差向异构酶(udp-glcnac2-epimerase)/n-乙酰甘露糖胺激酶(n-acetylmannosamine kinase),例如来自m.musculus(菌株c57bl/6j)(uniprot idq91wg8)、n-酰基神经氨酸-9-磷酸合成酶(n-acylneuraminate-9-phosphatesynthetase),例如来自假单胞菌uw4(uniprot id k9nph9)与n-酰基神经氨酸-9-磷酸酶,例如来自candidatus magnetomorum sp.hk-1(uniprot id kpa15328.1)或来自多形拟杆菌(uniprot id q8a712)的组成型转录单元的基因体敲入获得。
482、突变大肠杆菌菌株中的唾液酸产生可以进一步以包含naga、nagb、nagc、nagd、nage、nana、nane、nank、manx、many、manz的任何一个或更多的大肠杆菌基因的基因体敲除如wo18122225中所述,及/或以包含nant、poxb、ldha、adhe、aldb、pfla、pflc、ybiy、acka及/或pta任何一个或更多的大肠杆菌基因的基因体敲除,及以包括l-谷氨酰胺-d-果糖-6-磷酸转胺酶(l-glutamine-d-fructose-6-phosphate aminotransferase),例如突变的glms*54(不同于野生型大肠杆菌glms,具有uniprot id p17169,藉由a39t、r250c与g472s突变,如deng et al.所述(biochimie 2006,88:419-429)),较佳为磷酸酶(phosphatase),例如包括apha、cof、hisb、otsb、sure、yaed、ycju、yedp、yfbt、yida、yigb、yihx、ynic、yqab、yrbl、appa、gph、serb、ybha、ybiv、ybjl、yfb、yieh、yjgl、yjjg、yrfg与ybiu的大肠杆菌基因或来自恋臭假单胞菌(pseudomonas putida)的psmupp、来自酿酒酵母菌的scdog1或来自枯草杆菌(bacillus subtilis)的bsaral,如wo1812222所述,与乙酰辅酶a合成酶(acetyl-coasynthetase),例如来自大肠杆菌的acs(uniprot id p27550)的一或更多个的复制的组成型转录单元的基因体敲入来优化。s
483、对于唾液酸化寡糖产生,所述唾液酸产生菌株被进一步修饰以表达n-酰基神经氨酸胞苷酸转移酶(n-acylneuraminate cytidylyltransferase),例如来自曲状杆菌的neua酶(uniprot id q93mp7)、来自流感嗜血杆菌(haemophilus influenzae)的neua酶(genbank no.agv11798.1)或来自败血性巴斯德拉菌(pasteurella multocida)的neua酶(genbank no.amk07891.1),并表达β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactosidealpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的pmultst3(uniprot idq9clp3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的uniprot id q9clp3的氨基酸残基1至268所组成的pmultst3样多肽(pmultst3-like polypeptide)、来自脑膜炎双球菌的nmenist3(genbank no.arc07984.1)或来自败血性巴斯德拉菌subsp.multocida str.pm70的pmultst2(genbank no.aak02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactoside alpha-2,6-sialyltransferase),例如来自发光杆菌(photobacteriumdamselae)的pdst6(uniprot id o66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot id o66375的氨基酸残基108至497所组成的pdst6样多肽(pdst6-likepolypeptide)或来自发光杆菌属的菌(photobacterium sp.)jt-ish-224的p-jt-ish-224-st6(uniprot id a8qyl1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot ida8qyl1的氨基酸残基18至514组成的p-jt-ish-224-st6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自m.musculus(uniprot id q64689)的一个或多个复制。n-酰基神经氨酸胞苷酰转移酶(n-acylneuraminate cytidylyltransferase)与唾液酸转移酶(sialyltransferases)的组成型转录单元可以经由基因体敲入或经由表达质粒传递给突变株。若产生唾液酸与cmp-唾液酸的突变菌株旨在制造唾液酸化乳糖结构,则以大肠杆菌lacz、lacy与laca基因的基因体敲除,并以乳糖通透酶,例如大肠杆菌lacy(uniprot id p02920)的组成型转录单元的基因体敲入额外修饰此菌株。
484、或者,及/或另外,唾液酸及/或唾液酸化寡糖的产生可以在突变大肠杆菌菌株中进一步优化,藉由包含膜转运蛋白,例如唾液酸转运蛋白,如来自大肠杆菌k-12mg1655(uniprot id p41036)的nant、来自大肠杆菌o6:h1(uniprot id q8fd59)的nant、来自大肠杆菌o157:h7(uniprot id q8x9g8)的nant或来自e.albertii的nant(uniprot idp24077),或一运输蛋白(porter),例如来自大肠杆菌的ents(uniprot id p24077)、来自抗坏血酸克吕沃尔菌(kluyvera ascorbate)的ents(uniprot id a0a378gq13)或来自肠道沙门氏菌(salmonella enterica)subsp.arizonae的ents(uniprot id a0a6y2k4e8)、来自克罗诺杆菌的mdfa(uniprot id a0a2t7anq9)、来自杨氏柠檬酸杆菌的mdfa(uniprot idd4bc23)、来自大肠杆菌的mdfa (uniprot id p0aey8)、来自yokenella regensburgei的mdfa、来自大肠杆菌的mdfa(uniprot id a0a024l207)、来自杨氏柠檬酸杆菌的icet(uniprot id d4b8a6)、来自大肠杆菌的seta(uniprot id p31675)、来自大肠杆菌的setb(uniprot id p33026)或来自大肠杆菌的setc(uniprot id p33026)或abc转运蛋白(transporter),例如来自大肠杆菌的oppf(uniprot id p77737),来自乳酸链球菌(lactococcus lactis)subsp.lactis bv.diacetylactis的lmra(uniprot ida0a1v0nel4)或来自婴儿长双歧杆菌亚种(bifidobacterium longum subsp.infantis)的blon_2475(uniprot id b7gpd4)的组成型转录单元的基因体敲入。
485、所有突变菌株也可以视需要而定,经由含有蔗糖转运蛋白,例如来自大肠杆菌w(uniprot id e0ixr1)的cscb,果糖激酶,例如源自运动发酵单胞菌(z.mobilis)的frk(uniprot id q03417)与蔗糖磷酸化酶(sucrose phosphorylase),例如来自b.teenis的basp(uniprot id a0zzh6)的组成型转录单元的基因体敲入来适应在蔗糖上生长。
486、较佳为但非必须地,糖基转移酶、参与核苷酸活化糖合成的蛋白质及/或膜转运蛋白的任一个或更多在n-及/或c-末端融合至溶解度增强子标签(solubility enhancertag),例如sumo卷标、mbp卷标、his、flag、strep-ii、halo-tag、nusa、硫氧还蛋白(thioredoxin)、gst及/或fh8标签以提高其溶解度(costa et al.,front.microbiol.2014,https://doi.org/10.3389/fmicb.2014.00063;fox et al.,protein sci.2001,10(3),622-630;jia and jeaon,open biol.2016,6:160196)。
487、视需要而定,以编码伴护蛋白(chaperone),例如dnak、dnaj、grpe或groel/es陪伴蛋白(chaperonin)系统(baneyx f.,palumbo j.l.(2003)improving heterologousprotein folding via molecular chaperone and foldase co-expression.in:vaillancourt p.e.(eds)e.coligene expression protocols.methods in molecularbiologytm,vol 205.humana press)的组成型转录单元的基因体敲入来修饰突变的大肠杆菌菌株。
488、视需要而定,修饰突变大肠杆菌菌株以产生糖最少化(glycominimized)大肠杆菌菌株,其包括,包括pgac、pgad、rfe、rfft、rffm、bcsa、bcsb、bcsc、wcaa、wcac、wcae、wcai、wcaj、wcal、waah、waaf、waac、waau、waaz、waaj、waao、waab、waas、waag、waaq、wbbl、arnc、arnt、wbbkgh、opjhg、glga、glgb、malq、otsa与yaip的非必需糖基转移酶基因的任一个或更多的基因体敲除。
489、所有组成型启动子(constitutive promoters)、utr与终止子(terminator)序列均源自mutalik et al.(nat.methods 2013,no.10,354-360)与cambray et al.(nucleicacids res.2013,41(9),5139-5148)描述的库(libraries)。所有基因均在twistbioscience(twistbioscience.com)或idt(eu.idtdna.com)上合成订购,并使用供货商的工具调整密码子使用。本发明中描述的seq id no总结于表1中。
490、所有菌株皆于-80℃储存在冷冻管中(隔夜lb培养物以1:1的比例与70%甘油混合)。
491、表1.于本发明中描述的seq id no的概述
492、
493、
494、
495、
496、
497、
498、
499、
500、
501、
502、
503、培养条件
504、96孔微量滴定盘实验的预培养起始于冷冻管,于150μl lb中,并在37℃下在800rpm的定轨振荡器(orbital shaker)上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μl基本培养基。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。为了在培养实验结束时测量糖浓度,从每个孔中取出全部肉汤样品,藉由在旋下细胞之前,将培养液在60℃煮15分钟(=细胞内与细胞外糖浓度的平均值)。
505、生物反应器的预培养起始于特定菌株的整个1ml冷冻管,接种在1l或2.5l摇瓶中的250ml或500ml基本培养基中,并于37℃在定轨振荡器上以200rpm培养24小时。然后接种5l生物反应器(250ml接种物于2l批次培养基中);此过程由mfcs控制软件(sartoriusstedim biotech,melsungen,germany)控制。培养条件设为37℃与最大搅拌;压力气体流速取决于菌株与生物反应器。使用0.5m h2so4与20% nh4oh将ph控制在6.8。将排出气体冷却。当发酵过程中起泡时加入聚硅氧消泡剂(silicone antifoaming agent)的10%溶液。
506、光学密度(optical density)
507、培养物的细胞密度常经由测量于600nm的光学密度来监测(implennanophotometer np80,westburg,belgium或以spark 10m microplate reader,tecan,switzerland)。
508、解析分析(analytical analysis)
509、标准品,如,但不限于,蔗糖、乳糖、乳-n-三碳糖ii(ln3)、乳-n-四糖(lnt)、lnfp-i购自carbosynth(uk)、elicityl(france)与isosep(sweden)。其他化合物使用内部制定的标准进行分析。
510、在具有蒸发光散射检测器(evaporative light scattering detector,elsd)或折光率(refractive index,ri)侦测的waters acquity h-class uplc上分析寡糖。将0.7μl体积的样品注入waters acquity uplc beh amide柱(2.1x 100mm;1.7μm)与acquity uplc beh amide vanguard柱,2.1x 5mm。柱温为50℃。流动相由1/4水与3/4乙腈溶液组成,其中添加了0.2%三乙胺(triethylamine)。此方法是等度的(isocratic),伴随流速为0.130ml/分钟。els检测器的漂移管(drift tube)温度为50℃,n2气压为50psi,增益(gain)为200,数据速率为10pps。ri检测器的温度设置为35℃。
511、糖也在具有折光率(ri)检测的waters acquity h-class uplc上分析。将0.5μl体积的样品注入waters acquity beh amide柱(2.1x 100mm;1.7μm)。柱温为50℃。流动相由72%乙腈与28%醋酸铵缓冲液(100mm)的混合物组成,其中加入了0.1%三乙胺。此方法是等度的,流速为0.260ml/分钟。ri检测器的温度设置为35℃。
512、为了在质谱仪上进行分析,使用具有电子喷雾电离(electron sprayionisation,esi)的waters xevo tq-ms,伴随450℃的去溶剂化(desolvation)温度,650l/小时的氮去溶剂化气流与20v的锥孔电压(cone voltage)。对所有寡糖,ms在选择离子监测(selected ion monitoring,sim)中以负模式(negative mode)进行操作。在具有thermohypercarb柱(2.1x 100mm;3μm)的waters acquity uplc上于35℃执行分离。使用梯度,其中洗脱液a是具有0.1%甲酸的超纯水(ultrapure water),其中洗脱液b是具有0.1%甲酸的乙腈。使用以下梯度在55分钟内分离寡糖:在21分钟内从2%的洗脱液b初始增加至12%,在11分钟内从12%第二次增加到40%的洗脱液b,在5分钟内从40%第三次增加到100%洗脱液b。作为洗涤步骤,使用100%的洗脱液b,5分钟。对于柱平衡,2%的洗脱液b的初始条件在1分钟内恢复并保持12分钟。
513、为了分析低浓度(低于50mg/l)的糖,使用了具有脉冲安培检测(pulsedamperometric detection,pad)的dionex hpaec系统。将5μl体积的样品注入dionexcarbopac pa200柱4x 250mm与dionex carbopac pa200保护柱4x50mm。柱温设置为30℃。使用梯度,其中洗脱液a为去离子水,其中洗脱液b是200mm氢氧化钠,并且其中洗脱液c是500mm醋酸钠。寡糖在60分钟内分离,同时使用以下梯度保持25%的洗脱液b的恒定比例:初始等度步骤保持75%的洗脱液a,10分钟,在8分钟内从0初始增加至4%的洗脱液c,第二个等度步骤保持71%的洗脱液a与4%的洗脱液c,6分钟,在2.6分钟内从4%第二次增加至12%的洗脱液c,第三个等度步骤保持63%的洗脱液a与12%的洗脱液c,3.4分钟,在5分钟内从12%第三次增加至48%的洗脱液。作为洗涤步骤,使用48%的洗脱液c,3分钟。对于柱平衡,75%的洗脱液a与0%的洗脱液c的初始条件在1分钟内恢复并保持11分钟。施加的流速为0.5ml/分钟。
514、实施例2.材料与方法酿酒酵母菌
515、培养基
516、菌株在具有完全补充混合物(complete supplement mixture)(sd csm)或含有6.7g/l无氨基酸酵母菌氮基(yeast nitrogen base without amino acids)(ynb w/o aa,difco)、20g/l琼脂(difco)(固体培养物)、22g/l一水合葡萄糖(glucose monohydrate)或20g/l乳糖与0.79g/l csm或0.77g/l csm-ura或0.77g/l csm-his(mp biomedicals)的csmdrop-out(sd csm-ura或sd csm-his)的合成界定酵母菌培养基(synthetic definedyeast medium)上生长。
517、菌株
518、酿酒酵母菌(s.cerevisiae)by4742由brachmann et al.(yeast(1998)14:115-32)所创建,可在euroscarf培养物收集中获得。使用gietz的方法(yeast11:355-360,1995)经由同源重组或质粒转化产生所有突变菌株。
519、质粒
520、在产生gdp-岩藻糖的例子中,酵母菌表达质粒如p2a_2μ_fuc(chan 2013,plasmid70,2-17)用于在酿酒酵母中表达外来基因。该质粒包含氨苄青霉素抗性基因与细菌复制起点(origin)以允许在大肠杆菌中的选择与维持,以及2μ酵母菌ori与ura3选择标记用于在酵母菌中的选择与维持。此质粒还包含乳糖通透酶,例如来自乳酸克鲁维酵母的lac12(uniprot id p07921)、gdp-甘露糖4,6-脱水酶,例如来自大肠杆菌的gmd(uniprot idp0ac88)与gdp-l-岩藻糖合成酶,例如来自大肠杆菌的fcl(uniprot id p32055)的组成型转录单元。酵母菌表达质粒p2a_2μ_fuc2用作p2a_2μ_fuc质粒的替代表达质粒,此质粒于氨苄青霉素抗性基因旁包含细菌ori、2μ酵母ori与ura3选择标记乳糖通透酶,例如来自乳酸乳球菌(uniprot id p07921)的lac12、岩藻糖通透酶(fucose permease),例如来自大肠杆菌的fucp(uniprot id p11551)与双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酸转移酶,例如来自脆弱类杆菌的fkp(uniprot id suv40286.1)的组成型转录单元。为了进一步产生岩藻糖基化寡糖,p2a_2μ_fuc及其变体p2a_2μ_fuc2还包含α-1,2-岩藻糖基转移酶,例如来自幽门螺杆菌的hpfutc(genbank:aad29863.1)的组成型转录单元。
521、在产生udp-半乳糖的实例中,酵母菌表达质粒源自prs420-质粒系列(christianson et al.,1992,gene 110:119-122),其包含his3选择标记与葡萄糖-4-差向异构酶,例如来自大肠杆菌的gale(uniprot id p09147)的组成型转录单元。为了产生ln3与lnt,此质粒进一步以乳糖通透酶,例如来自乳酸乳球菌(uniprot id p07921)的lac12、半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶,例如来自脑膜炎双球菌的lgta(genbank:aam33849.1)与n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌o55:h7的wbgo(uniprot id d3qy14)的组成型转录单元来修饰。为了产生udp-galnac,此质粒以4-差向异构酶,例如来自绿脓杆菌的wbpp(uniprot id q8kn66)的组成型转录单元进行了额外修饰于磷酸葡萄糖胺变位酶,例如来自大肠杆菌的glmm(uniprot id p31120)与n-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶,例如来自大肠杆菌的glmu(uniprot id p0acc7)的视需要而定的敲入的旁边。此外,突变菌株可以α-1,3-半乳糖基转移酶,例如seq id no:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-n-乙酰半乳糖胺转移酶,例如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元进行修饰。
522、在产生唾液酸与cmp-唾液酸的一个例子中,酵母菌表达质粒可以源自prs420-质粒系列(christianson et al.,1992,gene 110:119-122),其含有trp1选择标记与l-谷氨酰胺-d-果糖-6-磷酸转胺酶,例如突变的glms*54(不同于野生型大肠杆菌glms,具有uniprot id p17169,藉由a39t、r250c与g472s突变,如deng et al.所述(biochimie 2006,88:419-429))、磷酸酶(phosphatase),例如包括apha、cof、hisb、otsb、sure、yaed、ycju、yedp、yfbt、yida、yigb、yihx、ynic、yqab、yrbl、appa、gph、serb、ybha、ybiv、ybjl、yfb、yieh、yjgl、yjjg、yrfg与ybiu的大肠杆菌基因或来自恋臭假单胞菌的psmupp、来自酿酒酵母菌的scdog1或来自枯草杆菌的bsaral,如wo18122225所述、n-乙酰葡萄糖胺2-差向异构酶,例如来自卵形拟杆菌的age(uniprot id a7lvg6)、n-乙酰神经氨酸合酶,例如来自如来自脑膜炎双球菌(uniprot id e0ncd4)或曲状杆菌(uniprot id q93mp9)与n-酰基神经氨酸胞苷酸转移酶,例如来自曲状杆菌的neua(uniprot id q93mp7)、来自流感嗜血杆菌的neua(genbank no.agv11798.1)或来自败血性巴斯德拉菌的neua(genbankno.amk07891.1)的一个或更多的复制的组成型转录单元。视需要而定,也可加入包括葡萄糖胺6-磷酸n-乙酰转移酶,例如来自酿酒酵母的gna1(uniprot id p43577)的一个或更多的复制的组成型转录单元。为了产生唾液酸化寡糖,质粒进一步包含乳糖通透酶,例如来自克鲁维乳酸酵母菌的lac12(uniprot id p07921)的组成型转录单元,与β-半乳糖苷α-2,3-唾液酸转移酶,例如来自败血性巴斯德拉菌的pmultst3(uniprot id q9clp3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的uniprot id q9clp3的氨基酸残基1至268所组成的pmultst3样多肽(pmultst3-like polypeptide)、来自脑膜炎双球菌的nmenist3(genbankno.arc07984.1)或来自败血性巴斯德拉菌subsp.multocida str.pm70的pmultst2(genbank no.aak02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶,例如来自发光杆菌的pdst6(uniprot id o66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot ido66375的氨基酸残基108至497所组成的pdst6样多肽(pdst6-like polypeptide)或来自发光杆菌属的菌(photobacterium sp.)jt-ish-224的p-jt-ish-224-st6(uniprot ida8qyl1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot id a8qyl1的氨基酸残基18至514组成的p-jt-ish-224-st6样多肽,及/或α-2,8-唾液酸转移酶,例如来自m.musculus(uniprot id q64689)的一个或更多的复制。
523、较佳为但非必须地,糖基转移酶、参与核苷酸活化糖合成的蛋白质及/或膜转运蛋白的任一个或更多在n-及/或c-末端融合至sumostar标签(例如,获自pysumostar,lifesensors,malvern,pa)以提高其溶解度。
524、视需要而定,将突变酵母菌株以编码伴侣蛋白,例如hsp31、hsp32、hsp33、sno4、kar2、ssb1、sse1、sse2、ssa1、ssa2、ssa3、ssa4、ssb2、ecm10、ssc1、ssq1、ssz1、lhs1、hsp82、hsc82、hsp78、hsp104、tcp1、cct4、cct8、cct2、cct3、cct5、cct6或cct7的组成型转录单元的基因体敲入来修饰(gong et al.、2009、mol.syst.biol.5:275)。
525、质粒保存在宿主大肠杆菌dh5alpha(f-,phi80dlaczdeltam15,delta(laczya-argf)u169,deor,reca1,enda1,hsdr17(rk-,mk+),phoa,supe44,lambda-,thi-1,gyra96,rela1)购自invitrogen。
526、异源(heterologous)与同源(homologous)表达
527、需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司的人工合成:dna2.0、gen9、idt或twist bioscience。藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
528、培养条件
529、一般而言,酵母菌菌株最初在sd csm平板上生长以获得单一菌落。这些平板于30℃生长2-3天。从一个单一菌落开始,预培养物在5ml中于30℃隔夜生长,以200rpm振荡。随后的125ml摇瓶实验以2%的此预培养物于25ml培养基中接种。这些摇瓶在30℃以200rpm的轨道振荡(orbital shaking)进行培养。
530、基因表达启动子
531、使用合成的组成型启动子表达基因,如blazeck(biotechnology andbioengineering,vol.109,no.11,2012)所述。
532、实施例3.以经修饰的大肠杆菌宿主的包括2’fl,difl,ln3,lnt,lnfp-i与gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
533、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。为了产生lnfp-i,以含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元的表达质粒进一步修饰新颖菌株。在产生gal-lnfp-i的最后步骤中,将突变菌株以第二兼容的表达质粒进行修饰,此质粒含有来自大肠杆菌的α-1,3-半乳糖基转移酶wbni的组成型转录单元,具seq id no:03。新颖菌株在生长实验中评估2’fl、difl、ln3、lnt、lnfp-i(fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)与gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
534、实施例4.以经修饰的大肠杆菌宿主的在补料批次发酵(fed-batchfermentation)中gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
535、在补料批次发酵方法中进一步评估如实施例3中所述的突变大肠杆菌菌株。如实施例1中所述进行生物反应器规模的补料批次发酵。在这些实施例中,蔗糖用作碳源并且将乳糖作为前体添加到批次培养基中。取一般的肉汤样品,并如实施例1中所述使用uplc测量寡糖的产生。
536、实施例5.以经修饰的大肠杆菌宿主的包括2’fl、difl、ln3、lnt、lnfp-i与galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
537、将如实施例3所述经修饰以用于gdp-岩藻糖产生与lnfp-1产生及在蔗糖上生长的大肠杆菌菌株进一步以含有具有seq id no:40的来自h.mustelae的α-1,3-n-乙酰半乳糖胺转移酶bgta与来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元的第二兼容表达质粒转化,以用于udp-galnac产生。新颖菌株在生长实验中评估2’fl、difl、ln3、lnt、lnfp-i(fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)与galnac-a1,3-lnfp-i
538、(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
539、实施例6.以经修饰的大肠杆菌宿主的在补料批次发酵中galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
540、在补料批次发酵方法中进一步评估如实施例5中所述的突变大肠杆菌菌株。如实施例1中所述进行生物反应器规模的补料批次发酵。在这些实施例中,蔗糖用作碳源并且将乳糖作为前体添加到批次培养基中。取一般的肉汤样品,并如实施例1中所述使用uplc测量寡糖的产生。
541、实施例7.以经修饰的酿酒酵母菌宿主的包括2’fl、difl、ln3、lnt、lnfp-i与gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
542、酿酒酵母菌菌株如实施例2中所述,适用于gdp-岩藻糖与lnt的产生以及表达α-1,2-岩藻糖基转移酶与α-1,3-半乳糖基转移酶,藉由第一酵母菌表达质粒,其包含来自克鲁维乳酸酵母菌的乳糖通透酶lac12(uniprot id p07921)、来自大肠杆菌的gdp-甘露糖4,6-脱水酶gmd(uniprot id p0ac88)、来自大肠杆菌的gdp-l-岩藻糖合酶fcl(uniprot idp32055)与来自幽门螺杆菌的a1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)组成型转录单元,以及藉由第二酵母菌表达质粒,其包含来自大肠杆菌的udp-葡萄糖4-差向构酶gale(uniprot id p09147)、来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶lgta(genbank:aam33849.1)、来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)与具有seq id no:03的来自大肠杆菌的α-1,3-半乳糖基转移酶wbni的组成型转录转录单元。新颖菌株在生长实验中评估2’fl、difl、ln3、lnt、lnfp-i(fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)与gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例2中所提供的培养条件,于其中sd csm-ura-his drop-ou培养基包括乳糖为前体。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
543、实施例8.以经修饰的酿酒酵母菌宿主的包括2’fl、difl、ln3、lnt、lnfp-i与galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
544、酿酒酵母菌菌株如实施例2中所述,适用于gdp-岩藻糖与lnt的产生以及表达α-1,2-岩藻糖基转移酶与α-1,3-n-乙酰半乳糖转胺酶,藉由第一酵母菌表达质粒,其包括来自克鲁维乳酸酵母菌的乳糖通透酶lac12(uniprot id p07921)、来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66),用于udp-galnac的产生、来自大肠杆菌的gdp-甘露糖4,6-脱水酶gmd(uniprot id p0ac88)、来自大肠杆菌的gdp-l-岩藻糖合酶fcl(uniprot idp32055)与来自幽门螺杆菌的a1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)组成型转录转录单元,以及藉由第二酵母菌表达质粒,其包括来自大肠杆菌的udp-葡萄糖4-差向构酶gale(uniprot id p09147)、来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶lgta(genbank:aam33849.1)、来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)与具有seq id no:40的来自h.mustelae的α-1,3-n-乙酰半乳糖胺转移酶bgta的组成型、转录单元。新颖菌株在生长实验中评估2’fl、difl、ln3、lnt、lnfp-i(fuc-a1,2-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)与galnac-a1,3-lnfp-i
545、(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例2中所提供的培养条件,于其中sd csm-ura-his drop-out培养基包括乳糖为前体。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
546、实施例9.以表达来自毛样短螺旋体的α-1,2-岩藻糖基转移酶的经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
547、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元的基因体敲入,适用于udp-galnac产生。为了产生galnac-lnfp-i,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自毛样短螺旋体的具有uniprot id a0a2n5rq26的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-n-乙酰半乳糖胺转移酶,其选自包括来自helicobacter mustelae的具有seq id no:40的bgta、来自卵形拟杆菌的具有seq id no:49的多肽、来自lachnospiraceae bacterium的具有seq id no:74的多肽、来自食葡糖罗斯氏菌(roseburia inulinivorans)的具有seq id no:91的多肽与来自卵形拟杆菌的具有seq id no:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。实验证明所有菌株均产生galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)于全肉汤样品中,如表2所总结。
548、表2.在表达来自多毛短螺旋体的具有uniprot id a0a2n5rq26的α-1,2-岩藻糖基转移酶与α-1,3-n-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中galnac-a1,3-lnfp-i的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
549、
550、实施例10.以表达来自dysgonomonasmossii的α-1,2-岩藻糖基转移酶的经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
551、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元的基因体敲入,适用于udp-galnac产生。为了产生galnac-lnfp-i,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自dysgonomonas mossii的具有uniprot id f8x274的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-n-乙酰半乳糖胺转移酶,其系选自包括来自helicobacter mustelae的具有seq id no:40的bgta、来自卵形拟杆菌的具有seq id no:49的多肽与来自卵形拟杆菌的具有seq id no:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。实验证明所有菌株均产生galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)于全肉汤样品中,如表3所总结。
552、表3.在表达来自d.mossii的具有uniprot id f8x274的α-1,2-岩藻糖基转移酶与α-1,3-n-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中galnac-a1,3-lnfp-i的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
553、
554、实施例11.以表达来自dechlorosomasuillum的α-1,2-岩藻糖基转移酶的经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
555、如实施例1中所述经修饰以用于gdp-岩藻糖产生与蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元的基因体敲入,适用于udp-galnac产生。为了产生galnac-lnfp-i,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自dechlorosoma suillum的具有uniprot id g8qlf4的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-n-乙酰半乳糖胺转移酶,其系选自包括来自helicobacter mustelae的具有seq id no:40的bgta与来自卵形拟杆菌的具有seq id no:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。实验证明所有菌株均产生galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)于全肉汤样品中,如表4所总结。
556、表4.在表达来自d.suillum的具有uniprot id g8qlf4的α-1,2-岩藻糖基转移酶与α-1,3-n-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中galnac-a1,3-lnfp-i的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
557、
558、实施例12.以表达来自desulfovibrioalaskensis的α-1,2-岩藻糖基转移酶的经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
559、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元的基因体敲入,适用于udp-galnac产生。为了产生galnac-lnfp-i,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自desulfovibrio alaskensis的具有uniprot id q316b5的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-n-乙酰半乳糖胺转移酶,其系选自包括来自helicobacter mustelae的具有seq id no:40的bgta与来自卵形拟杆菌的具有seq id no:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。实验证明所有菌株均产生galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)于全肉汤样品中,如表5所总结。
560、表5.在表达来自d.alaskensis的具有uniprot id q316b5的α-1,2-岩藻糖基转移酶与α-1,3-n-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中galnac-a1,3-lnfp-i的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
561、
562、实施例13.以一经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
563、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶lgta(genbank:aam33849.1)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,进一步适用于ln3与lnt产生。为了产生lnfp-i,新颖菌株被进一步修饰,藉由表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元。在产生gal-lnfp-i的最后步骤中,将突变菌株以第二兼容的表达质粒进行修饰,此质粒含有选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
564、实施例14.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
565、如实施例3中所述经修饰以用于gdp-岩藻糖与lnfp-i产生以及在蔗糖上生长的大肠杆菌菌株,以来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰,用于udp-galnac产生,并以第二兼容的表达质粒进行转化,此质粒含有选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98;99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估2’fl、difl、ln3、lnt、lnfp-i、gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc与galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
566、实施例15.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,4-glc与gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc的产生
567、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株进一步被转化,藉由第一表达质粒,其包含来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,与第二相容的表达质粒,其含有选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,4-glc与gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
568、实施例16.以经修饰的大肠杆菌宿主的包含gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc与3’-sl的寡糖混合物的产生
569、如实施例15中所述经修饰的大肠杆菌菌株,以naga与nagb基因的基因体敲除与包括编码来自大肠杆菌的l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(藉由a39t、r250c与g472s突变不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169)、来自大肠杆菌的磷酸葡萄糖胺变位酶(glmm)(uniprot id p31120)、来自大肠杆菌的n-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶(glmu)(uniprot id p0acc7)、来自曲状杆菌的udp-n-乙酰葡糖胺2-差向异构酶(neuc)(uniprot id q93mp8)、来自脑膜炎双球菌的n-乙酰神经氨酸合成酶(neub)(uniprot id e0ncd4)、来自大肠杆菌的唾液酸转运蛋白(nant)((uniprot id p41036)、来自曲状杆菌的n-酰基神经氨酸胞苷酸转移酶(uniprotid q93mp7)与来自败血性巴斯德拉菌的β-半乳糖苷α-2,3-唾液酸转移酶pmultst3(uniprot id q9clp3)的基因的组成型转录单元的基因体敲入来进一步修饰。新颖菌株在生长实验中评估包含gal-a1,3-(fuc-a1,2)-gal-b1,4-glc,gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc与3’-唾液酸乳糖(3’-sialyllactose,3’-sl)的寡糖混合物的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
570、实施例17.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc的产生
571、如实施例1中所述经修饰以用于gdp-岩藻糖产生以及在糖上生长的大肠杆菌菌株,以来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰,用于udp-galnac产生,并且进行转化,藉由第一表达质粒,其含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1),以及第二兼容的表达质粒,其含有选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估α-四糖(galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc)(alpha-tetrasaccharide
572、(galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc))的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
573、实施例18.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生
574、如实施例1中所述经修饰以用于gdp-岩藻糖产生以及在蔗糖上生长的大肠杆菌菌株,进行转化,藉由第一表达质粒,其含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,以及第二兼容的表达质粒,其含有选自包括seqid no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳-n-二糖(lacto-n-biose,lnb,gal-b1,3-glcnac)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
575、实施例19.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac
576、如实施例1中所述经修饰的大肠杆菌菌株,被进一步转化,以naga与nagb基因的基因体敲除与来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(藉由a39t、r250c与g472s突变不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸n-乙酰转移酶gna1(uniprot id p43577)、来自枯草杆菌的磷酸酶bsaral(uniprot id p94526)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,用于产生乳-n-二糖(lnb,gal-b1,3-glcnac)。在最后步骤中,将新颖菌株以表达质粒进行转化,此质粒含有选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
577、实施例20.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac、唾液酸化lnb与6’-sl的寡糖混合物的产生
578、如实施例19中所述经修饰的大肠杆菌菌株,以来自卵形拟杆菌的n-乙酰葡糖胺2-差向异构酶(age)(uniprot id a7lvg6)与自脑膜炎双球菌的n-乙酰神经氨酸合成酶(neub)(uniprot id e0ncd4)的基因体敲入进一步修饰,并以表达质粒进行转化,此质粒包括组成型表达单元,其包括来自曲状杆菌的n-酰基神经氨酸胞苷酸转移酶(uniprot idq93mp7)与来自发光杆菌的pdst6(uniprot id o66375)。新颖菌株在生长实验中评估lnb、gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac、唾液酸化lnb与6’-唾液酸乳糖(6’-sl)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
579、实施例21.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生
580、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰以用于udp-galnac产生,并被转化,藉由第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,以及第二兼容的表达质粒,其含有选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳-n-二糖(lnb,gal-b1,3-glcnac)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
581、实施例22.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生
582、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰以用于udp-galnac产生,且被进一步转化,以naga与nagb基因的基因体敲除与来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(藉由a39t、r250c与g472s突变不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169)、来自枯草杆菌的磷酸酶bsaral(uniprot id p94526)与来自大肠杆菌o55:h7的n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,用于产生乳-n-二糖(lnb,gal-b1,3-glcnac)。在最后步骤中,将新颖菌株进一步以表达质粒进行转化,此质粒含有选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
583、实施例23.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
584、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,藉由第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,以及一第二兼容的表达质粒,其包括选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l n-乙酰乳糖胺(n-acetyllactosamine,lacnac,gal-b1,4-glcnac)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
585、实施例24.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
586、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,以naga与nagb基因的基因体敲除与来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(藉由a39t、r250c与g472s突变不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸n-乙酰转移酶gna1(uniprot id p43577)、来自枯草杆菌的磷酸酶bsaral(uniprot id p94526)与来自脑膜炎双球菌的n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶lgtb(uniprot id q51116)的组成型转录单元的基因体敲入,用于产生n-乙酰乳糖胺(n-acetyllactosamine,lacnac,gal-b1,4-glcnac)。在最后步骤中,将新颖菌株以一表达质粒进行转化,此质粒含有选自包括seq idno:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
587、实施例25.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
588、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰以用于udp-galnac产生,并被转化,藉由第一表达质粒,其包含来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,以及第二兼容的表达质粒,其包含选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l n-乙酰乳糖胺(lacnac,gal-b1,4-glcnac)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
589、实施例26.以经修饰的大肠杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
590、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66)的组成型转录单元来进一步修饰以用于udp-galnac产生,且被转化,以naga与nagb基因的基因体敲除与来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(藉由a39t、r250c与g472s突变不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸n-乙酰转移酶gna1(uniprot id p43577)、来自枯草杆菌的磷酸酶bsaral(uniprot idp94526)与来自脑膜炎双球菌的n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶lgtb(uniprot idq51116)的组成型转录单元的基因体敲入,用于产生n-乙酰乳糖胺(lacnac,gal-b1,4-glcnac)。在最后步骤中,将新颖菌株进一步以表达质粒进行转化,此质粒含有选自包括seqid no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
591、实施例27.以经修饰的大肠杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc的产生
592、如实施例1中所述经修饰以用于gdp-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,藉由来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元的基因体敲入,连同第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元,以及第二兼容的表达质粒,其包括选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,4-(fuc-a1,3)-glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以uplc分析糖。
593、实施例28.材料与方法枯草杆菌
594、培养基
595、使用两种不同的培养基,即丰富的luria肉汤(luria broth,lb)与用于摇瓶的基本培养基(minimal medium for shake flask,mmsf)。基本培养基使用微量元素混合物。
596、微量元素混合物由0.735g/l cacl2.2h2o、0.1g/l mncl2.2h2o、0.033g/lcucl2.2h2o、0.06g/l cocl2.6h2o、0.17g/l zncl2、0.0311g/l h3bo4、0.4g/l na2edta.2h2o与0.06g/l na2moo4所组成。柠檬酸铁(fe-citrate)溶液含有0.135g/l fecl3.6h2o、1g/l柠檬酸钠(na-citrate)(hoch 1973pmc1212887)。
597、luria肉汤(lb)培养基由1%胰蛋白胨(difco,erembodegem,belgium)、0.5%酵母提取物(difco)与0.5%氯化钠(vwr.leuven,belgium)组成。luria肉汤琼脂(luria brothagar,lba)平板由lb培养基组成,伴随添加12g/l琼脂(difco,erembodegem,belgium)。
598、用于摇瓶的基本培养基(mmsf)实验含有2.00g/l(nh4)2so4、7.5g/l kh2po4、17.5g/l k2hpo4、1.25g/l柠檬酸钠、0.25g/l mgso4.7h2o、0.05g/l色氨酸、10上至30g/l葡萄糖或其他碳源,当在实施例中指定时,包括但不限于果糖、麦芽糖、蔗糖、甘油与麦芽三糖(maltotriose)、10ml/l微量元素混合物与10ml/l柠檬酸铁溶液。以1m koh将培养基设置ph值为7。根据实验乳糖,可添加lnb或lacnac作为前体。
599、复合培养基,例如lb,藉由高压灭菌(121℃,21'),而基本培养基藉由过滤(0.22μmsartorius)进行灭菌。必要时,藉由添加抗生素(例如,吉欧霉素(zeocin)(20mg/l))使培养基具有选择性。.
600、菌株、质粒与突变
601、枯草杆菌168,可在芽孢杆菌遗传储备中心(bacillus genetic stock center)(ohio,usa)获得。
602、如yan et al.所述,构建用于经由cre/lox的基因缺失(gene deletion)的质粒(appl.&environm.microbial.,sept 2008,p5556-5562)。如xue et al.所述,基因破坏(gene disruption)是经由以线性dna的同源重组与经由电穿孔进行转化来完成(j.microb.meth.34(1999)183-191)。liu et al.描述了基因敲除的方法(metab.engine.24(2014)61-69)。此方法使用目标基因上游与下游的1000bp同源性。
603、popp et al.描述的整合载体(integrative vectors)(sci.rep.,2017,7,15158)使用为表达载体,必要时可进一步用于基因体整合。用于表达的合适启动子可来自从部件库(part repository,igem):序列id:bba_k143012,bba_k823000,bba_k823002或bba_k823003。可以使用gibson组装(assembly)、golden gate组装、cliva组装、lcr或限制性连接进行选殖(cloning)。
604、在产生基于乳糖的寡糖的一个例子中,枯草杆菌突变菌株被创建以包含一个编码乳糖输入子(importer)的基因(例如,具有uniprot id p02920的大肠杆菌lacy)。对于2’fl、3fl与difl的产生,α-1,2-及/或α-1,3-岩藻糖基转移酶表达构建体额外添加到菌株中。
605、在一个产生乳-n-三碳糖(lnt-ii、ln3、glcnac-b1,3-gal-b1,4-glc)的例子中,枯草杆菌菌株被包含乳糖输入体子(例如,具有uniprot id p02920的大肠杆菌lacy)与半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶,例如来自脑膜炎双球菌的lgta(genbank:aam33849.1)的组成型转录单元的基因体敲修饰。对于lnt产生,ln3产生菌株被以n-乙酰葡糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌o55:h7的wbgo(uniprot id d3qy14)的组成型转录单元进一步修饰。为了产生乳-n-新四糖(lacto-n-neotetraose,lnnt,gal-b1,4-glcnac-b1,3-gal-b1,4-glc)进一步以n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(n-acetylglucosaminebeta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的lgtb(uniprot id q51116)的组成型转录单元来修饰ln3产生菌株。n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶与n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶皆可以藉由基因体敲入或从表达质粒传递给菌株。为了产生lnfp-1与其他lnt及/或lnnt的岩藻糖基化衍生物,lnt与lnnt产生菌株可以进一步以α-1,2-岩藻糖基转移酶及/或α-1,3-岩藻糖基转移酶表达构建体进行修饰。
606、又,突变菌株可以α-1,3-半乳糖基转移酶,例如seq id no:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-n-乙酰半乳糖胺基转移酶,例如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元修饰。
607、对于唾液酸产生,藉由过表达天然果糖-6-p-转胺酶(fructose-6-p-aminotransferase)(uniprot id p0ci73)产生突变枯草杆菌菌株,来增强细胞内葡萄糖胺-6-磷酸池(pool)。此外,naga、nagb与gama基因的酶活性经由基因敲除被破坏与来自酿酒酵母菌的葡萄糖胺-6-p-转胺酶(glucosamine-6-p-aminotransferase)(uniprot idp43577)、来自卵形拟杆菌的n-乙酰葡糖胺2-差向异构酶(uniprot id a7lvg6)与来自曲状杆菌的n-乙酰神经氨酸合成酶(uniprot id q93mp9)在基因体上过表达。为了使唾液酸化寡糖产生,唾液酸产生菌株被进一步以表达构建体修饰,此表达构建体包括来自曲状杆菌的n-酰基神经氨酸胞苷酸转移酶neua(uniprot id q93mp7),与β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactoside alpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的pmultst3(uniprot id q9clp3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的uniprot id q9clp3的氨基酸残基1至268所组成的pmultst3样多肽(pmultst3-likepolypeptide)、来自脑膜炎双球菌的nmenist3(genbank no.arc07984.1)或来自败血性巴斯德拉菌subsp.multocida str.pm70的pmultst2(genbank no.aak02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactoside alpha-2,6-sialyltransferase),例如来自发光杆菌(photobacterium damselae)的pdst6(uniprot id o66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot id o66375的氨基酸残基108至497所组成的pdst6样多肽(pdst6-like polypeptide)或来自发光杆菌属的菌(photobacterium sp.)jt-ish-224的p-jt-ish-224-st6(uniprot id a8qyl1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot id a8qyl1的氨基酸残基18至514组成的p-jt-ish-224-st6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自m.musculus(uniprot idq64689)的一个或更多的复制。
608、异源与同源表达
609、需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:dna2.0、gen9、twist biosciences或idt。
610、根据表达宿主的密码子使用优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
611、培养条件
612、96孔微量滴定盘实验的预培养起始于冷冻管或来自lb盘的单一菌落,于150μl lb中,并在37℃下在800rpm的定轨振荡器(orbital shaker)上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μl mmsf培养基。每个菌株在96孔板的多个孔中生长作为生物学重复。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞外糖浓度,在5分钟后使细胞旋下),或藉由将培养液在90℃下煮沸15分钟或在60℃下煮沸60分钟,然后旋下细胞(=全肉汤浓度、细胞内与细胞外糖浓度,如于此所定义)。
613、又,进行培养物稀释以测量于600nm的光学密度。细胞性能指数(cellperformance index)或cpi是经由将寡糖浓度除以生物量(biomass)来确定的,以相较于参考菌株的相对百分比。生物量根据经验确定为在600nm测量的光学密度的大约1/3。
614、实施例29.以经修饰的枯草杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
615、首先,枯草杆菌菌株被修饰以用于ln3产生与在蔗糖上生长,藉由nagb、glms与gama基因的基因体敲除与包括编码来自大肠杆菌的乳糖通透酶(lacy)(uniprot idp02920)、天然果糖-6-p-转胺酶(uniprot id p0ci73)、来自脑膜炎双球菌菌的半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶lgta(genbank:aam33849.1)、来自大肠杆菌w的蔗糖转运蛋白(cscb)(uniprot id e0ixr1)、来自运动发酵单胞菌的果糖激酶(frk)(uniprot idq03417)与来自青春双歧杆菌的蔗糖磷酸化酶basp(uniprot id a0zzh6)的基因的组成型转录单元的基因体敲入。在下一步骤中,进一步修饰突变菌株,藉由包括来自大肠杆菌o55:h7的n-乙酰葡糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,以产生lnt。在一随后步骤中,lnt产生菌株以表达质粒来转化,此表达质粒包括选自包括来自幽门螺旋杆菌的hpfutc(genbank:aad29863.1)、来自毛样短螺旋体(brachyspira pilosicoli)的多肽(uniprot id a0a2n5rq26)、来自dysgonomonas mossii的多肽(uniprot id f8x274)、来自dechlorosoma suillum的多肽(uniprot id g8qlf4)、来自desulfovibrio alaskensis的多肽(uniprot id q316b5)与来自polaribacter vadi的多肽(uniprot id a0a1b8tnt0)的列表α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),与选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为一前体的mmsf培养基的生长实验中评估包括ln3、lnfp-i与gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的寡糖混合物的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
616、实施例30.以一经修饰的枯草杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生
617、在本实施例中,如实施例29所述,对枯草杆菌菌株进行修饰以用于lnt产生与在蔗糖上生长。下一步骤中,突变lnt产生菌株被以来自绿脓杆菌的4-差向异构酶wbpp(uniprotid q8kn66)的组成型转录单元进一步修饰,用于udp-galnac的产生,并以表达质粒转化,此表达质粒包括选自包括来自幽门螺旋杆菌的hpfutc(genbank:aad29863.1)、来自毛样短螺旋体的多肽(uniprot id a0a2n5rq26)、来自dysgonomonas mossii的多肽(uniprot idf8x274)、来自dechlorosoma suillum的多肽(uniprot id g8qlf4)、来自desulfovibrioalaskensis的多肽(uniprot id q316b5)与来自polaribacter vadi的多肽(uniprot ida0a1b8tnt0)的列表α-1,2-岩藻糖基转移酶,与选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在以包括乳糖为一前体的mmsf培养基的生长实验中评估galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
618、实施例31.以经修饰的枯草杆菌宿主的包括lnt、唾液酸化ln3、lsta与galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
619、如实施例30所述的产生galnac-a1,3-lnfp-i的突变枯草杆菌菌株被进一步修饰,藉由naga基因的基因体敲除与第二相容的表达质粒,此表达质粒包括含trp1选择标记与来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶(glms*54)(不同于野生型大肠杆菌glms,具有uniprot id p17169,藉由a39t、r250c与g472s突变,如deng et al.所述(biochimie 2006,88:419-429))、一磷酸酶,例如选自包括apha、cof、hisb、otsb、sure、yaed、ycju、yedp、yfbt、yida、yigb、yihx、ynic、yqab、yrbl、appa、gph、serb、ybha、ybiv、ybjl、yfb、yieh、yjgl、yjjg、yrfg与ybiu的大肠杆菌基因或来自恋臭假单胞菌(pseudomonas putida)的psmupp、来自酿酒酵母菌的scdog1或来自枯草杆菌(bacillussubtilis)的bsaral,如wo1812222所述的磷酸酶、来自卵形拟杆菌的n-乙酰葡糖胺2-差向异构酶(age)(uniprot id a7lvg6)、来自脑膜炎双球菌的n-乙酰神经氨酸合成酶(neub)(uniprot id e0ncd4)、来自流感嗜血杆菌的n-酰基神经氨酸胞苷酸转移酶neua(genbankno.agv11798.1)的两个复制与来自败血性巴斯德拉菌的pmultst3多肽(uniprot idq9clp3)的三个复制的组成型转录单元。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估包括ln3、唾液酸化ln3、lnt、lnfp-i、2’-fl、galnac-a1,3-lnfp-i(galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)、3’-sl与lsta(neu5ac-a2,3-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的寡糖混合物的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
620、实施例32.以经修饰的枯草杆菌宿主的gal-a1,3-(fuc-a1,2)-gal-b1,4-glc的产生
621、枯草杆菌菌株被修饰用于2’-fl产生,如实施例28所述,藉由来自大肠杆菌的乳糖通透酶(lacy)(uniprot id p02920)与来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)的组成型转录单元的基因体敲入。在下一步骤中,突变菌株被以表达质粒转化,此表达质粒含有选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,4-glc的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
622、实施例33.以经修饰的枯草杆菌宿主的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
623、枯草杆菌菌株,如实施例28所述被转化,藉由表达质粒,此表达质粒包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)、用于udp-galnac的产生的来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66),与选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
624、实施例34.材料与方法谷氨酸棒状杆菌
625、培养基
626、使用两种不同的培养基,即丰富的胰蛋白胨-酵母菌萃取物(tryptone-yeastextract,ty)与用于摇瓶的基本培养基。基本培养基使用1000x储备微量元素混合物。
627、微量元素混合物由10g/l cacl2、10g/l feso4.7h2o、10g/l mnso4.h2o、1g/lznso4.7h2o、0.2g/l cuso4、0.02g/l nicl2.6h2o、0.2g/l生物素(ph 7.0)与0.03g/l原儿茶酸(protocatechuic acid)组成。
628、用于摇瓶的基本培养基(mmsf)实验含有20g/l(nh4)2so4,5g/l urea,1g/lkh2po4,1g/l k2hpo4,0.25g/l mgso4.7h2o,42g/l mops、10上至30g/l葡萄糖或其他碳源,当在实施例中指定时,包括但不限于果糖、麦芽糖、蔗糖、甘油与麦芽三糖(maltotriose)与1ml/l微量元素混合物。根据实验,可添加乳糖、lnb或lacnac作为前体。
629、ty培养基由1.6%胰蛋白胨(difco,erembodegem,belgium)、1%酵母菌萃取物(difco)与0.5%氯化钠(vwr.leuven,belgium)组成。ty琼脂(tya)平板由ty培养基组成,伴随添加12g/l琼脂(difco,erembodegem,belgium)。
630、复合培养基,例如ty,藉由高压灭菌(121℃,21'),而基本培养基藉由过滤(0.22μmsartorius)进行灭菌。必要时,藉由添加抗生素(例如,卡那霉素、氨苄青霉素)使培养基具有选择性。
631、菌株与突变
632、谷氨酸棒状杆菌atcc 13032,可自美国典型培养物保藏中心(american typeculture collection)获得。
633、基于suzuki et al.描述的cre/loxp技术的整合质粒载体(appl.microbiol.biotechnol.,2005apr,67(2):225-33)与okibe et al.描述的温度敏感穿梭载体(temperature-sensitive shuttle vectors)(journal of microbiologicalmethods 85,2011,155-163)被构建以用于基因缺失、突变与插入。用于(异源)基因表达的合适启动子可以来自yim et al.(biotechnol.bioeng.,2013nov,110(11):2959-69)。可以使用gibson组装、golden gate组装、cliva组装、lcr或限制性连接进行选殖。
634、在产生基于乳糖的寡糖的一个例子中,谷氨酸棒状杆菌突变菌株被创建以包含一个编码乳糖输入子(importer)的基因(例如,具有uniprot id p02920的大肠杆菌lacy)。对于2’fl、3fl与difl的产生,α-1,2-及/或α-1,3-岩藻糖基转移酶表达构建体额外添加到菌株中。
635、在一个产生乳-n-三碳糖(lnt-ii、ln3、glcnac-b1,3-gal-b1,4-glc)的例子中,谷氨酸棒状杆菌菌株被包含乳糖输入体子(例如,具有uniprot id p02920的大肠杆菌lacy)与半乳糖苷β-1,3-n-乙酰葡萄糖转胺酶,例如来自脑膜炎双球菌的lgta(genbank:aam33849.1)的组成型转录单元的基因体敲入修饰。对于lnt产生,ln3产生菌株被以一n-乙酰葡糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌o55:h7的wbgo(uniprot id d3qy14)的组成型转录单元修饰。为了产生乳-n-新四糖(lacto-n-neotetraose,lnnt,gal-b1,4-glcnac-b1,3-gal-b1,4-glc)进一步以一n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(n-acetylglucosamine beta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的lgtb(uniprot id q51116)的组成型转录单元来修饰ln3产生菌株。n-乙酰葡萄糖胺β-1,3-半乳糖基转移酶与n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶皆可以藉由基因体敲入或从表达质粒传递给菌株。为了产生lnfp-1,lnt产生菌株可以进一步以α-1,2-岩藻糖基转移酶表达构建体进行修饰。
636、又,突变菌株可以α-1,3-半乳糖基转移酶,例如seq id no:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-n-乙酰半乳糖胺基转移酶,例如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元修饰。
637、对于唾液酸产生,藉由过表达天然果糖-6-p-转胺酶(fructose-6-p-aminotransferase)(uniprot id q8nnd3)产生突变谷氨酸棒状杆菌菌株,来增强细胞内葡萄糖胺-6-磷酸池(pool)。此外,naga、nagb与gama基因的酶活性经由基因敲除被破坏与来自酿酒酵母菌的葡萄糖胺-6-p-转胺酶(glucosamine-6-p-aminotransferase)(uniprotid p43577)、来自卵形拟杆菌的n-乙酰葡糖胺2-差向异构酶(uniprot id a7lvg6)与来自曲状杆菌的n-乙酰神经氨酸合成酶(uniprot id q93mp9)在基因体上过表达。为了使唾液酸化寡糖产生,唾液酸产生菌株被进一步以表达构建体修饰,此表达构建体包括来自曲状杆菌的n-酰基神经氨酸胞苷酸转移酶neua酶(uniprot id q93mp7)、来自流感嗜血杆菌的neua酶(genbank no.agv11798.1)或来自败血性巴斯德拉菌的neua酶(genbankno.amk07891.1),与β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactoside alpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的pmultst3(uniprot id q9clp3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的uniprot id q9clp3的氨基酸残基1至268所组成的pmultst3样多肽(pmultst3-like polypeptide)、来自脑膜炎双球菌的nmenist3(genbank no.arc07984.1)或来自败血性巴斯德拉菌subsp.multocida str.pm70的pmultst2(genbank no.aak02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactosidealpha-2,6-sialyltransferase),例如来自发光杆菌(photobacterium damselae)的pdst6(uniprot id o66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot ido66375的氨基酸残基108至497所组成的pdst6样多肽(pdst6-like polypeptide)或来自发光杆菌属的菌(photobacterium sp.)jt-ish-224的p-jt-ish-224-st6(uniprot ida8qyl1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的uniprot id a8qyl1的氨基酸残基18至514组成的p-jt-ish-224-st6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自m.musculus(uniprot id q64689)的一个或更多的复制。
638、异种与同源表达
639、需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:dna2.0、gen9、twist biosciences或idt。
640、藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
641、培养条件
642、96孔微量滴定盘实验的预培养起始于一冷冻管或来自ty盘的单一菌落,于150μlty中,并在37℃下在800rpm的定轨振荡器上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μl mmsf培养基。每个菌株在96孔板的多个孔中生长作为生物学重复。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞外糖浓度,在5分钟后使细胞旋下),或藉由将培养液在90℃下煮沸15分钟或在60℃下煮沸60分钟,然后旋下细胞(=全肉汤浓度、细胞内与细胞外糖浓度,如于此所定义)。
643、又,进行培养物稀释以测量于600nm的光学密度。细胞性能指数或cpi是经由将于整体肉汤中测量的寡糖浓度,例如唾液乳糖浓度除以生物量来确定的,以相较于参考菌株的相对百分比。生物量根据经验确定为在600nm测量的光学密度的大约1/3。
644、实施例35.以经修饰的谷氨酸棒状杆菌的包括ln3、lnt、lnfp-i、2’-fl与gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
645、首先,谷氨酸棒状杆菌菌株被修饰以用于ln3产生与在蔗糖上生长,藉由ldh、cgl2645与nagb基因的基因体敲除与包括编码来自大肠杆菌的乳糖通透酶(lacy)(uniprotid p02920)、天然果糖-6-p-转胺酶(uniprot id q8nnd3)、来自脑膜炎双球菌菌的半乳糖苷β-1,3-n-乙酰葡萄糖胺转移酶lgta(genbank:aam33849.1)、来自大肠杆菌w的蔗糖转运蛋白(cscb)(uniprot id e0ixr1)、来自运动发酵单胞菌的果糖激酶(frk)(uniprot idq03417)与来自青春双歧杆菌的蔗糖磷酸化酶basp(uniprot id a0zzh6)的基因的组成型转录单元的基因体敲入。在下一步骤中,进一步修饰突变菌株,藉由包括来自大肠杆菌o55:h7的n-乙酰葡糖胺β-1,3-半乳糖基转移酶wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,以产生lnt。在随后步骤中,lnt产生菌株以表达质粒来转化,此表达质粒包括择自包括来自幽门螺旋杆菌的hpfutc(genbank:aad29863.1)与选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估包括ln3、lnt、lnfp-i、2’-fl与gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的寡糖混合物的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
646、实施例36.以经修饰的谷氨酸棒状杆菌的包括ln3、唾液酸化ln3、lnt、3’-sl、lsta、2’-fl与gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的寡糖混合物的产生
647、如实施例34所述的经修饰的谷氨酸棒状杆菌被进一步修饰,藉由gama与naga基因的基因体敲除连同包括天然果糖-6-p-转胺酶(uniprot id q8nnd3)、来自酿酒酵母菌的葡萄糖胺-6-p-转胺酶(uniprot id p43577)、来自卵形拟杆菌的n-乙酰葡糖胺2-差向异构酶(uniprot id a7lvg6)与来自曲状杆菌的n-乙酰神经氨酸合成酶(uniprot id q93mp9)的组成型转录单元的基因体敲入。在下一步骤中,突变菌株被转化,以相容的表达质粒,此表达质粒包括编码来自曲状杆菌的neua酶(uniprot id q93mp7)的基因与编码来自败血性巴斯德拉菌的β-半乳糖苷α-2,3-唾液酸转移酶pmultst3(uniprot id q9clp3)的基因的组成型转录单元。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估包括ln3、唾液酸化ln3、lnt、lsta、lnfp-i、2’-fl、3’-sl与gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的寡糖混合物的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
648、实施例37.以经修饰的谷氨酸棒状杆菌的gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生
649、首先,野生型谷氨酸棒状杆菌菌株被修饰,藉由谷氨酸棒状杆菌基因ldh、cgl2645、nagb与glms的基因体敲除,连同包括编码来自大肠杆菌w的蔗糖转运蛋白(cscb)(uniprot id e0ixr1)、来自运动发酵单胞菌的果糖激酶(frk)(uniprot id q03417)与来自青春双歧杆菌的蔗糖磷酸化酶basp(uniprot id a0zzh6)、天然果糖-6-p-转胺酶(uniprot id q8nnd3)、来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶glms*54(不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169,藉由a39t、r250c与g472s突变)、来自酿酒酵母菌的葡萄糖胺6-磷酸n-乙酰转移酶gna1(uniprot id p43577)、来自枯草杆菌的磷酸酶bsaral(uniprot id p94526)与来自大肠杆菌o55:h7的wbgo(uniprot idd3qy14)的组成型转录单元的基因体敲入,以产生lnb。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)与选自包括seq id no:seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的基因的组成型转录单元的基因体敲入。新颖菌株在以包括乳糖为一前体的mmsf培养基的生长实验中评估gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
650、实施例38.以经修饰的谷氨酸棒状杆菌的galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生
651、首先,野生型谷氨酸棒状杆菌菌株被修饰,藉由谷氨酸棒状杆菌基因ldh、cgl2645、nagb与glms的基因体敲除,连同包括编码来自大肠杆菌w的蔗糖转运蛋白(cscb)(uniprot id e0ixr1)、来自运动发酵单胞菌的果糖激酶(frk)(uniprot id q03417)与来自青春双歧杆菌的蔗糖磷酸化酶basp(uniprot id a0zzh6)、来自绿脓杆菌的wbpp(uniprot id q8kn66)、天然果糖-6-p-转胺酶(uniprot id q8nnd3)、来自大肠杆菌的突变l-谷氨酰胺-d-果糖-6-磷酸转胺酶glms*54(不同于野生型大肠杆菌glms蛋白,具有uniprot id p17169,藉由a39t、r250c与g472s突变)、来自酿酒酵母菌的葡萄糖胺6-磷酸n-乙酰转移酶gna1(uniprot id p43577)、来自枯草杆菌的磷酸酶bsaral(uniprot idp94526)与来自大肠杆菌o55:h7的wbgo(uniprot id d3qy14)的组成型转录单元的基因体敲入,以产生lnb。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)与选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的基因的组成型转录单元的基因体敲入。新颖菌株在以包括乳糖为前体的mmsf培养基的生长实验中评估galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以uplc分析糖。
652、实施例39.材料与方法莱茵衣藻(chlamydomonas reinhardtii)
653、培养基
654、莱茵衣藻细胞在tris-醋酸-磷酸盐(tris-acetate-phosphate,tap)培养基(ph7.0)中培养。tap培养基使用1000x储备hutner’s微量元素混合物。hutner’s微量元素混合物包括50g/l na2edta.h2o(titriplex iii)、22g/l znso4.7h2o、11.4g/l h3bo3、5g/lmncl2.4h2o、5g/l feso4.7h2o、1.6g/l cocl2.6h2o、1.6g/l cuso4.5h2o与1.1g/l(nh4)6moo3。
655、tap培养基含有2.42g/l tris(三羟甲基胺基甲烷(tris(tris(hydroxymethyl)aminomethane)))、25mg/l盐储备溶液、0.108g/l k2hpo4、0.054g/l kh2po4与1.0ml/l冰醋酸(glacial acetic acid)。盐储备溶液由15g/l nh4cl、4g/l mgso4.7h2o与2g/lcacl2.2h2o组成。作为糖类合成的前体,可以添加前体如半乳糖、葡萄糖、果糖、岩藻糖、glcnac、lnb及/或lacnac。培养基藉由高压灭菌(121℃,21’)灭菌。对于在琼脂斜面上的原种培养(stock cultures),使用含有1%琼脂(纯化高强度,1000g/cm2)的tap培养基。
656、菌株、质粒与突变
657、莱茵衣藻野生型菌株21gr(cc-1690,野生型,mt+)、6145c(cc-1691,野生型,mt-)、cc-125(137c,野生型,mt+)、cc-124(137c,野生型,mt-),可从美国明尼苏达大学(university of minnesota,u.s.a)衣藻资源中心(chlamydomonas resource center)(https://www.chlamycollection.org)获得。
658、表达质粒来源于psi103,可从衣藻资源中心获得。可以使用gibson组装、goldengate组装、cliva组装、lcr或限制性连接进行选殖。用于(异源)基因表达的合适启动子可以源自例如scranton et al.(algal res.2016,15:135-142)。可以使用crispr-cas技术进行目标基因修饰(如基因敲除或基因置换),例如jiang et al.(eukaryotic cell 2014,13(11):1465-1469)所述。
659、藉由电穿孔进行转化,如wang et al.(biosci.rep.2019,39:bsr2018210)所述。细胞在液体tap培养基中在恒定通气与具8000lx的光强度的连续光照下生长,直到细胞密度达到1.0-2.0×107个细胞/ml。然后,将细胞以1.0×106个细胞/ml的浓度接种到新鲜的液体tap培养基中,并在连续光照下生长18-20小时,直至细胞密度达到4.0×106个细胞/ml。接着,经由在室温于1250g离心5分钟收集细胞,以含有60mm山梨糖醇(sigma,u.s.a.)的预冷(pre-chilled)液体tap培养基洗涤并重新悬浮,并冰冻10分钟。然后,将250μl细胞悬浮液(对应于5.0×107个细胞)放入具有100ng质粒dna(400ng/ml)的预冷的0.4cm电穿孔比色管(cuvette)中。使用btx ecm830电穿孔装置(1575ω,50μfd)以6个500v的脉冲进行电穿孔,每个脉冲具有4ms的脉冲长度与100ms的脉冲间隔时间。电穿孔后,立即将比色管置于冰上10分钟。最后,将细胞悬浮液转移到含有具有60mm山梨糖醇的10ml新鲜液体tap培养基的50ml锥形离心管中,以在昏暗的光线下藉由缓慢摇动隔夜恢复。隔夜恢复后,重新收集细胞并以淀粉包埋法(starch embedding method)制成平板至含有氨苄青霉素(100mg/l)或氯霉素(100mg/l)的选择性1.5%(w/v)琼脂-tap平板上。然后将平板在23+-0.5℃在具8000lx的光强度的连续照明下培养。5-7天后分析细胞。
660、在一个产生udp-半乳糖的例子中,莱茵衣藻细胞被修饰,藉由包括编码来自阿拉伯芥(arabidopsis thaliana)的半乳糖激酶(galactokinase)(kin,uniprot id q9see5)与来自阿拉伯芥的udp-糖焦磷酸化酶(udp-sugar pyrophosphorylase,usp)(uniprot idq9c5i1)的基因的转录单元。
661、在产生udp-n-乙酰半乳糖胺的一个例子中,莱茵衣藻细胞被以包括来自绿脓杆菌血清型(serotype)o6的udp-n-乙酰葡萄糖胺4-差向异构酶wbpp(uniprot id q8kn66)的转录单元修饰。
662、在产生lnb的一个例子中,为产生udp-半乳糖而被修饰的莱茵衣藻细胞进一步以包括来自大肠杆菌o55:h7的n-乙酰葡糖胺β-1,3-半乳糖基转移酶wbgo(uniprot idd3qy14)的转录单元的一表达质粒来修饰。在产生lacnac的一个例子中,为产生udp-半乳糖而被修饰的莱茵衣藻细胞进一步以包括来自脑膜炎双球菌的n-乙酰葡萄糖胺β-1,4-半乳糖基转移酶lgtb(uniprot id q51116)的转录单元的表达质粒来修饰。
663、此外,突变的莱茵衣藻细胞可被表达载体修饰,此表达质粒包括α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶及/或α-1,3-n-乙酰半乳糖胺转移酶,例如seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的转录单元。
664、在cmp-唾液酸合成的一个例子中,莱茵衣藻细胞被修饰,藉由udp-n-乙酰葡萄糖胺-2-差向异构酶(udp-n-acetylglucosamine-2-epimerase)/n-乙酰甘露糖胺激酶(n-acetylmannosamine kinase),例如来自智人(homo sapiens)的gne(uniprot id q9y223)或包括r263l突变的人类gne多肽的突变形式、n-酰基神经氨酸-9-磷酸合成酶(n-acylneuraminate-9-phosphate synthetase),例如来自智人的nans(uniprot id q9nr45)与n-酰基神经氨酸胞苷酰转移酶(n-acylneuraminate cytidylyltransferase),例如来自智人的cmas(uniprot id q8nfw8)的组成型转录单元。在产生唾液酸化寡糖的一个例子中,莱茵衣藻细胞被修饰,藉由cmp-唾液酸转运蛋白,例如来自小鼠(mus musculus)的cst(uniprot id q61420),以及选自物种,例如智人、家鼠、褐家鼠(rattus norvegicus)的高基定位的唾液基转移酶(golgi-localised sialyltransferase)。
665、异源与同源表达
666、需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:dna2.0、gen9、twist biosciences或idt。
667、藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
668、培养条件
669、莱茵衣藻的细胞在选择性tap-琼脂平板上,于23+/-0.5℃,在具8000lx的光照强度的14/10h光/黑循环下培养。培养5至7天后分析细胞。
670、对于高密度培养,细胞可以在封闭系统中培养,例如垂直或水平管光生物反应器(vertical or horizontal tube photobioreactors)、搅拌罐光生物反应器(stirredtank photobioreactors)或平板光生物反应器(flat panel photobioreactors),如chenet al.(bioresour.technol.2011,102:71-81)与johnson et al.(biotechnol.prog.2018,34:811-827)所述。
671、实施例40.在一突变的莱茵衣藻细胞的gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
672、如实施例39所述设计莱茵衣藻细胞以产生udp-gal,藉由包括编码半乳糖激酶(kin,uniprot id q9see5)与udp-糖焦磷酸化酶(usp)(uniprot id q9c5i1)的阿拉伯芥基因的组成型转录单元的基因体敲入。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括自脑膜炎双球菌的n-乙酰葡糖胺β-1,4-半乳糖基转移酶lgtb(uniprot idq51116)、来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)与选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖藻株在以包括乳糖与glcnac为前体的tap-琼脂平板的培养实验中评估,依据实施例39中所提供的培养条件。培养5天后,收集细胞,并以uplc分析gal-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生。
673、实施例41.在突变的莱茵衣藻细胞的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生
674、如实施例39所述设计莱茵衣藻细胞以产生udp-gal,藉由包括编码半乳糖激酶(kin,uniprot id q9see5)与udp-糖焦磷酸化酶(usp)(uniprot id q9c5i1)的阿拉伯芥基因的组成型转录单元的基因体敲入。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括自脑膜炎双球菌的n-乙酰葡糖胺β-1,4-半乳糖基转移酶lgtb(uniprot idq51116)、来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶hpfutc(genbank:aad29863.1)、来自绿脓杆菌的4-差向异构酶wbpp(uniprot id q8kn66),用于udp-galnac产生,与选自包括seq id no:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶的转录单元。新颖藻株在以包括乳糖与glcnac为前体的tap-琼脂平板的培养实验中评估,依据实施例39中所提供的培养条件。培养5天后,收集细胞,并以uplc分析galnac-a1,3-(fuc-a1,2)-gal-b1,4-glcnac的产生。
675、实施例42.材料与方法动物细胞
676、来自不同哺乳动物的脂肪组织(adipose tissue)的间叶系干细胞(mesenchymal stem cells)的分离
677、新鲜脂肪组织获自屠宰场(如牛、猪、绵羊、鸡、鸭、鲶鱼、蛇、青蛙)或抽脂(如,若为人类,则为知情同意后)并保存在补充有抗生素的磷酸盐缓冲盐水中。执行脂肪组织的酶消化,然后离心以分离间叶系干细胞。将分离的间叶系干细胞转移到细胞培养瓶中并在标准生长条件,例如37℃、5%co2下生长。初始培养基包括dmem-f12、rpmi与alpha-mem培养基(补充15%胎牛血清)与1%抗生素。在第一次继代(passage)后,随后将培养基替换为10%fbs(胎牛血清)补充的培养基。例如,ahmad与shakoori(2013,stem cell regen med.9(2):29-36),其出于所有目的通过引用整体并入于此,描述了于此所述方法的某些变体于此例子中。
678、来自牛奶的间叶系干细胞的分离
679、此实施例说明了在无菌条件下从人类或任何其他哺乳动物,如于此所述,所收集的乳汁的间叶系干细胞的分离。将等体积的磷酸盐缓冲盐水加入稀释的牛奶中,然后离心20分钟。将细胞团块(pellet)以磷酸盐缓冲盐水洗涤三次,然后在标准培养条件下将细胞接种于细胞培养瓶中于补充有10%胎牛血清与1%抗生素的dmem-f12、rpmi与alpha-mem培养基中。例如,hassiotou et al.(2012,stem cells.30(10):2164-2174),出于所有目的将其通过引用整体并入于此,描述了于此所述方法的某些变体于此例子中。
680、使用2d与3d培养系统的干细胞的分化
681、分离的间叶细胞可在2d与3d培养系统中分化为乳腺样上皮细胞与管腔细胞(mammary-like epithelial and luminal cells)。例如,参见huynh et al.1991.expcell res.197(2):191 -199;gibson et al.1991,in vitro cell dev biol anim.27(7):585-594;blatchfordetal.1999;animal cell technology’:basic&applied aspects,springer,dordrecht.141-145;williams et al.2009,breast cancer res11(3):26-43;与arevalo et al.2015,am j physiol cell physiol.310(5):c348-c356;出于所有目的,其中的各个均通过引用整体并入于此。
682、对于2d培养,分离的细胞最初接种在培养盘中,于补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基中。在满盘(confluence)时,以补充有2%胎牛血清、1%青霉素-链霉素(penicillin-streptomycin)(100u/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢皮质酮(hydrocortisone)、0.65ng/ml三碘甲腺氨酸(triiodothyronine)、100nm地塞米松(dexamethasone)与1pg/ml泌乳素(prolactin)的完全生长培养基喂养细胞。于24小时后,从完全诱导培养基中除去血清。
683、对于3d培养,分离的细胞被胰蛋白酶消化,在基质胶(matrigel)、透明质酸或超低附着表面培养盘(ultra-low attachment surface culture plates)中培养6天,并藉由添加补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基诱导分化与乳酸盐。在满盘时,以补充有2%胎牛血清、1%青霉素-链霉素(penicillin-streptomycin)(100u/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢皮质酮、0.65ng/ml三碘甲腺氨酸、100nm地塞米松与1pg/ml泌乳素的完全生长培养基喂养细胞。于24小时后,从完全诱导培养基中除去血清。
684、制作乳腺样细胞的方法
685、藉由以编码oct4、sox2、klf4与c-myc的病毒载体重新编程(reprogramming),使哺乳动物细胞被带入诱导的多能性(induced pluripotency)。然后,将所产生的经重新编程细胞培养于mammocult培养基(可自stem cell technologies获得)或乳腺细胞丰富培养基(mammary cell enrichment media)(dmem、3%fbs、雌激素(estrogen)、孕酮(progesterone)、肝素(heparin)、氢皮质酮、胰岛素、egf)中,使其为乳腺样(mammary-like),从其可以诱导选择乳成分的表达。或者,表观遗传(epigenetic)重塑(remodelling)为使用重塑系统,如crispr/cas9来进行,以激活感兴趣的选择基因,如酪蛋白、a-乳白蛋白(a-lactalbumin)组成型(constitutively on),以允许其各自的蛋白质表达,及/或向下调控及/或敲除选择的内源基因,如于wo21067641中所述,出于所有目的,经由引用将其整体并入于此。
686、培养
687、完全生长培养基(completed growth media)包括高葡萄糖dmem/f12、10%fbs、1% neaa、1%pen/strep、1% its-x、1% f-glu、10ng/ml egf与5pg/ml氢皮质酮。完全泌乳培养基(completed lactation media)包括高糖dmem/f12、1%neaa、1%pen/strep、1%its-x、1%f-glu、10ng/ml egf、5pg/ml氢皮质酮与1pg/ml泌乳素(5ug/ml于hyunh 1991)。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基。曝露于泌乳培养基后,细胞开始分化并停止生长。在大约一周内,细胞开始将泌乳产物,如乳脂(milklipids)、乳糖、酪蛋白与乳清(whey)分泌至培养基中。可以藉由超过滤浓缩或稀释来达成泌乳培养基的所需浓度。泌乳培养基的所需盐平衡可以藉由透析来达成,例如,从培养基中去除不需要的代谢产物。使用的荷尔蒙与其他生长因子可以藉由树脂纯化被选择性地萃取,例如使用镍树脂(nickel resins)去除带组氨酸标签的生长因子,以进一步降低乳酸产品(lactated product)中的污染物程度。
688、实施例43.于非乳腺成体干细胞(non-mammary adult stem cell)中的gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的制作
689、如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由crispr-cas修饰,以过表达来自智人的gdp-岩藻糖合酶gfus(uniprot id q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶fut1(uniprot id p19526)与密码子优化的选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行uplc以分析gal-a1,3-lnfp-i(gal-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc)的产生。
690、实施例44.于非乳腺成体干细胞中的galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc的制作
691、如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由crispr-cas修饰,以过表达来自智人的gdp-岩藻糖合酶gfus(uniprot id q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶fut1(uniprot id p19526)与密码子优化的选自包括seq id no:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-n-乙酰半乳糖胺转移酶。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行uplc以分析galnac-a1,3-(fuc-a1,2)-gal-b1,4-glc。
692、实施例45.于非乳腺成体干细胞中的包括gal-a1,3-(fuc-a1,2)-gal-b1,4-glc、2’-fl与3’-sl的寡糖混合物的制作
693、如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由crispr-cas修饰,以过表达来自智人的gdp-岩藻糖合酶gfus(uniprot id q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶fut1(uniprot id p19526)、密码子优化的选自包括seq id no:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶、来自小鼠的n-酰基神经氨酸胞苷酰转移酶(n-acylneuraminate cytidylyltransferase)(uniprot id q99kk2)与来自智人的cmp-n-乙酰神经氨酸-β-1,4-半乳糖苷α-2,3-唾液酸转移酶(cmp-n-acetylneuraminate-beta-1,4-galactoside alpha-2,3-sialyltransferase)st3gal3(uniprot id q11203)。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行uplc以分析2’-fl、3’-sl与gal-a1,3-(fuc-a1,2)-gal-b1,4-glc的产生。i
694、实施例46.在经修饰的大肠杆菌宿主中基于galnac-a1,3-(fuc-a1,2)-gal-b1,3-glcnac-b1,3-gal-b1,4-glc的产生的膜转运蛋白的表达的评估
695、实施例9、10、11与12中描述的经修饰的大肠杆菌宿主被进一步修饰,藉由异源膜转运蛋白的组成型转录单元的基因体敲入,此异源膜转运蛋白,选自包括来自莫金斯克罗诺杆菌的mdfa(uniprot id a0a2t7anq9)、来自杨氏柠檬酸杆菌的mdfa(uniprot idd4bc23)、来自大肠杆菌的mdfa(uniprot id p0aey8)、来自雷克斯堡约克氏菌的mdfa(uniprot id g9z5f4)、来自大肠杆菌的icet(uni0bactrot4l a20t)与来自杨氏柠檬酸杆菌的icet(uniprot id d4b8a6)的列表。新颖菌株,各表达所述异源性膜转运蛋白之一,在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤(即,细胞外与细胞内部分)连同分别细胞外与细胞内部分,并以uplc分析糖。
696、实施例47.在经修饰的大肠杆菌宿主中膜转运蛋白的表达的评估
697、实施例16与20中描述的经修饰的大肠杆菌宿主被进一步修饰,藉由一膜转运蛋白的组成型转录单元的基因体敲入,此膜转运蛋白,选自包括来自莫金斯克罗诺杆菌的mdfa(uniprot id a0a2t7anq9)、来自杨氏柠檬酸杆菌的mdfa(uniprot id d4bc23)、来自大肠杆菌的mdfa(uniprot id p0aey8)、来自雷克斯堡约克氏菌的mdfa(uniprot id g9z5f4)、来自大肠杆菌的icet(uniprot id a0a024l207)、来自杨氏柠檬酸杆菌的icet(uniprot idd4b8a6)、来自大肠杆菌o6:h1的nant(uniprot id q8fd59)、来自大肠杆菌o157:h7的nant(uniprot id q8x9g8)、来自e.albertii的nant(uniprot id b1efh1)、来自大肠杆菌的ents(uniprot id p24077)、来自抗坏血酸克吕沃尔菌的ents(uniprot id a0a378gq13)、来自肠道沙门氏菌(salmonella enterica)subsp.arizonae的ents(uniprot ida0a6y2k4e8)、来自大肠杆菌的seta(uniprot id p31675)、来自大肠杆菌的setb(uniprotid p33026)、来自大肠杆菌的setc(uniprot id p31436)、来自大肠杆菌的oppf(uniprotid p77737),来自乳酸链球菌(lactococcus lactis)subsp.lactis bv.diacetylactis的lmra(uniprot id a0a1v0nel4)与来自婴儿长双歧杆菌亚种(bifidobacterium longumsubsp.infantis)的blon_2475(uniprot id b7gpd4)的列表。新颖菌株,各表达所述异源性膜转运蛋白,在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/l蔗糖与20g/l乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤(即,细胞外与细胞内部分)连同分别细胞外与细胞内部分,并以uplc分析糖。
698、序列表
699、<110> 因比奥斯公司(inbiose n.v.)
700、<120> α-1,3糖基化形式的fuc-a1,2-gal-r的产生
701、<130> p22h77839a
702、<160> 102
703、<170> patentin version 3.5
704、<210> 1
705、<211> 9
706、<212> prt
707、<213> 人工序列
708、<220>
709、<223> motif 1
710、<220>
711、<221> unsure
712、<222> (2)..(2)
713、<223> xaa可为任何自然发生氨基酸
714、<220>
715、<221> variant
716、<222> (3)..(3)
717、<223> xaa可为phe, his, met, gln or thr
718、<220>
719、<221> unsure
720、<222> (4)..(4)
721、<223> xaa可为任何自然发生氨基酸
722、<220>
723、<221> unsure
724、<222> (6)..(7)
725、<223> xaa可为任何自然发生氨基酸
726、<220>
727、<221> variant
728、<222> (8)..(9)
729、<223> xaa可为ala, cys or gly
730、<400> 1
731、tyr xaa xaa xaa ala xaa xaa xaa xaa
732、1 5
733、<210> 2
734、<211> 9
735、<212> prt
736、<213> 人工序列
737、<220>
738、<223> motif 2
739、<220>
740、<221> unsure
741、<222> (2)..(2)
742、<223> xaa可为任何自然发生氨基酸
743、<220>
744、<221> unsure
745、<222> (4)..(4)
746、<223> xaa可为任何自然发生氨基酸
747、<220>
748、<221> unsure
749、<222> (6)..(7)
750、<223> xaa可为任何自然发生氨基酸
751、<220>
752、<221> variant
753、<222> (8)..(9)
754、<223> xaa可为ala, cys或gly
755、<400> 2
756、tyr xaa gln xaa cys xaa xaa xaa xaa
757、1 5
758、<210> 3
759、<211> 234
760、<212> prt
761、<213> 大肠杆菌k-12 mg1655
762、<400> 3
763、met val ile asn ile phe tyr ile cys thr gly glu tyr lys arg phe
764、1 5 10 15
765、phe asp lys phe tyr leu ser cys glu asp lys phe ile pro glu phe
766、 20 25 30
767、gly lys lys tyr tyr val phe thr asp ser asp arg ile tyr phe ser
768、 35 40 45
769、lys tyr leu asn val glu val ile asn val glu lys asn cys trp pro
770、 50 55 60
771、leu asn thr leu leu arg phe ser tyr phe leu lys val ile asp lys
772、65 70 75 80
773、leu gln thr asn ser tyr thr phe phe phe asn ala asn ala val ile
774、 85 90 95
775、val lys glu ile pro phe ser thr phe met glu ser asp leu ile gly
776、 100 105 110
777、val ile his pro gly tyr lys asn arg ile ser ile leu tyr pro trp
778、 115 120 125
779、glu arg arg lys asn ala thr cys tyr leu gly tyr leu lys lys gly
780、 130 135 140
781、ile tyr tyr gln gly cys phe asn gly gly lys thr ala ser phe lys
782、145 150 155 160
783、arg leu ile gln ile cys asn met met thr met ala asp leu lys lys
784、 165 170 175
785、asn leu ile ala lys val his asp glu ser tyr leu asn tyr tyr tyr
786、 180 185 190
787、tyr tyr asn lys pro leu leu leu ser glu leu tyr ser trp pro glu
788、 195 200 205
789、lys tyr gly glu asn lys asp ala lys ile ile met arg asp lys glu
790、 210 215 220
791、arg glu ser trp tyr gly asn ile lys lys
792、225 230
793、<210> 4
794、<211> 277
795、<212> prt
796、<213> pasteurella mairii
797、<400> 4
798、met ala lys val ala ile leu tyr ile ala thr gly arg tyr ile val
799、1 5 10 15
800、phe trp glu his phe tyr arg ser ala glu lys phe leu leu pro lys
801、 20 25 30
802、ser asp lys his tyr phe val phe thr asp ser pro his ile leu gly
803、 35 40 45
804、glu asp his ser asn val thr arg ile glu gln lys lys leu gly trp
805、 50 55 60
806、pro tyr asp thr leu met arg phe asp ile phe leu ser ile arg glu
807、65 70 75 80
808、thr leu glu asn phe asp tyr ile tyr phe phe asn gly asn ser glu
809、 85 90 95
810、ile leu val glu val asn glu ser glu phe leu pro leu glu asp asn
811、 100 105 110
812、tyr asn leu val phe thr his gln pro his met phe his leu ser lys
813、 115 120 125
814、arg arg phe thr tyr asp arg asn pro glu ser cys ala tyr ile pro
815、 130 135 140
816、gln gly gly gly lys tyr tyr phe thr gly ala leu asn gly gly lys
817、145 150 155 160
818、ala lys tyr tyr leu glu met cys glu lys leu ser gln asn thr his
819、 165 170 175
820、thr asp leu glu lys asn ile ile ala arg trp his asp glu ser his
821、 180 185 190
822、leu asn arg tyr ala ile gly arg met asp ile lys ile leu pro pro
823、 195 200 205
824、tyr phe thr arg ser glu ser glu lys trp lys thr ser ala lys ile
825、 210 215 220
826、met phe ser asp lys thr his tyr arg phe gly gly his ala tyr leu
827、225 230 235 240
828、arg gly glu ser glu asn lys ile thr pro thr glu trp glu glu lys
829、 245 250 255
830、tyr lys asn lys lys arg arg phe ser phe arg ile lys gln tyr ile
831、 260 265 270
832、lys ser trp phe leu
833、 275
834、<210> 5
835、<211> 286
836、<212> prt
837、<213> acinetobacter bereziniae
838、<400> 5
839、met arg asp glu val lys leu pro lys tyr ser val ala ile leu tyr
840、1 5 10 15
841、ile ala thr gly arg tyr asn ile phe trp glu tyr phe tyr lys ser
842、 20 25 30
843、ala glu gln phe leu leu lys asp cys glu lys his phe phe ile phe
844、 35 40 45
845、thr asp ser val glu pro met val gly glu gly gln lys asn val thr
846、 50 55 60
847、arg ile glu gln lys lys leu gly trp pro phe asp thr leu leu arg
848、65 70 75 80
849、phe glu ile phe leu ser ile glu asp lys leu gln asp phe asp tyr
850、 85 90 95
851、val phe phe phe asn gly asn thr glu ile leu ser glu ile lys ala
852、 100 105 110
853、ala asp leu leu pro leu ser ile his gln lys leu val phe ala his
854、 115 120 125
855、gln pro his leu phe his asn lys ile asn lys phe thr tyr asp arg
856、 130 135 140
857、asn pro glu ser ser ala tyr ile ala tyr asn tyr gly his ala tyr
858、145 150 155 160
859、phe thr gly ala leu asn gly gly glu val phe ser tyr leu glu met
860、 165 170 175
861、cys lys val leu ala lys asn ile gln arg asp leu ser lys asp ile
862、 180 185 190
863、ile ala leu trp his asp glu ser his leu asn his tyr ala leu asn
864、 195 200 205
865、arg asn asp ile lys ile leu pro pro tyr phe thr arg gly glu thr
866、 210 215 220
867、glu tyr trp lys thr asp ser lys val met phe ser asp lys thr his
868、225 230 235 240
869、phe arg phe gly gly his ala tyr leu arg gly glu thr asp glu lys
870、 245 250 255
871、ile ser gln asn glu trp glu asn lys tyr gly lys ser arg ser arg
872、 260 265 270
873、phe lys phe arg phe lys gln phe ile lys ser ile phe leu
874、 275 280 285
875、<210> 6
876、<211> 287
877、<212> prt
878、<213> acinetobacter boissieri
879、<400> 6
880、met cys thr asn lys pro lys tyr arg val ala ile leu tyr ile ala
881、1 5 10 15
882、thr gly arg tyr thr val phe trp asp gly phe phe lys ser ala glu
883、 20 25 30
884、lys tyr leu leu leu glu ser gln lys glu tyr phe ile phe thr asp
885、 35 40 45
886、thr pro his val leu gln glu asn glu arg val his gln his phe gln
887、 50 55 60
888、ser lys leu gly trp pro phe asp thr leu lys arg phe glu ile phe
889、65 70 75 80
890、leu ser ile lys asp gln leu lys gly phe asp phe ile tyr phe phe
891、 85 90 95
892、asn gly asn thr glu phe val thr glu ile thr glu gln glu phe leu
893、 100 105 110
894、pro leu asp lys gln gln asn leu thr leu leu his gln pro his leu
895、 115 120 125
896、phe his arg arg pro arg his phe pro tyr asp arg asn lys glu ser
897、 130 135 140
898、leu ala cys ile pro tyr asn glu gly met tyr tyr phe thr gly ala
899、145 150 155 160
900、leu asn gly gly lys ala ser ala tyr leu glu met cys glu gln leu
901、 165 170 175
902、asn lys asn thr asn ile asp leu lys asn asn val ile ala leu phe
903、 180 185 190
904、his asp glu ser his leu asn arg tyr val leu gly arg asp asp val
905、 195 200 205
906、lys ile leu asp pro tyr phe ala lys gly glu thr glu tyr trp lys
907、 210 215 220
908、his ala ser lys val met phe ser asp lys thr his tyr arg phe gly
909、225 230 235 240
910、gly his asp tyr leu arg gly glu ser asp his lys ile thr gln asp
911、 245 250 255
912、glu trp glu asn gly lys lys arg asn lys lys arg tyr lys phe arg
913、 260 265 270
914、leu arg gln ala ile his ala phe phe ile gln arg ser leu lys
915、 275 280 285
916、<210> 7
917、<211> 281
918、<212> prt
919、<213> acinetobacter calcoaceticus
920、<400> 7
921、met asn leu ser pro lys lys val ala ile leu tyr ile ala thr gly
922、1 5 10 15
923、arg tyr thr val phe trp asp tyr phe tyr gln ser ala glu ser asn
924、 20 25 30
925、leu leu arg glu cys lys lys his tyr phe val phe thr asp asn glu
926、 35 40 45
927、glu leu leu lys lys lys thr asp gln asn val ser tyr ile ser gln
928、 50 55 60
929、asp lys leu gly trp pro tyr asp thr leu met arg phe asp ile phe
930、65 70 75 80
931、leu ser ile glu asp arg leu asn thr phe asp tyr ile tyr phe phe
932、 85 90 95
933、asn ala asn thr glu ile leu lys pro ile asp ala gln asp ile leu
934、 100 105 110
935、pro ile asp gln gln asn leu ala phe ala ile gln pro his ala phe
936、 115 120 125
937、his arg asn lys lys lys tyr thr tyr asp arg asn pro asn ser thr
938、 130 135 140
939、ala tyr ile ala met asp glu gly lys tyr tyr phe thr gly ala leu
940、145 150 155 160
941、asn gly gly arg ala gln ala tyr leu glu met cys arg gln leu ser
942、 165 170 175
943、ser asn thr his val asp leu ser asn glu gln ile ala leu trp his
944、 180 185 190
945、asp glu ser his leu asn lys tyr ala leu asn arg lys asp ile lys
946、 195 200 205
947、val leu pro pro phe phe thr arg gly glu asn glu ile trp lys lys
948、 210 215 220
949、lys ala lys val met phe ser asp lys ser his phe arg phe gly gly
950、225 230 235 240
951、his ala tyr leu arg gly glu thr asp glu lys ile ser glu lys gln
952、 245 250 255
953、trp glu val ser lys asn ala lys his lys gly trp gly phe arg ile
954、 260 265 270
955、lys gln arg ile ser ser trp phe leu
956、 275 280
957、<210> 8
958、<211> 281
959、<212> prt
960、<213> acinetobacter johnsonii
961、<400> 8
962、met tyr ser lys thr lys val ala ile leu tyr ile ala thr gly arg
963、1 5 10 15
964、tyr ile thr phe trp asp phe phe tyr lys ser ala glu gln asn leu
965、 20 25 30
966、leu leu asn ser ser lys his tyr phe val phe thr asp cys lys glu
967、 35 40 45
968、leu leu glu ser asp ile glu lys asn ile thr tyr ile lys gln gln
969、 50 55 60
970、lys leu gly trp pro tyr asp thr leu met arg phe asn ile phe leu
971、65 70 75 80
972、thr gln lys asp gln leu lys lys phe asp tyr ile phe phe phe asn
973、 85 90 95
974、ala asn thr glu ile ile lys asn ile lys glu glu asp leu leu pro
975、 100 105 110
976、leu his ser asp glu asn leu val leu thr his gln pro his val phe
977、 115 120 125
978、his lys asn lys lys gln phe thr tyr asp arg asn pro leu ser asn
979、 130 135 140
980、ala tyr ile pro leu ser gln gly arg tyr tyr phe thr gly ala leu
981、145 150 155 160
982、asn gly gly lys ser val asn phe leu glu met cys glu his leu asn
983、 165 170 175
984、arg asn thr lys glu asp leu asp gln asn ile ile ala leu trp his
985、 180 185 190
986、asp glu ser his leu asn lys tyr val leu asp arg thr asp val lys
987、 195 200 205
988、ile leu pro pro tyr phe thr arg gly glu lys glu tyr trp lys lys
989、 210 215 220
990、glu ala lys val met phe ser asp lys ser his tyr arg phe gly gly
991、225 230 235 240
992、his ala phe leu arg gly glu thr asp gln tyr ile asp gln ile glu
993、 245 250 255
994、trp lys ala leu asn gly lys pro lys lys arg ile ser phe arg leu
995、 260 265 270
996、lys gln tyr ile lys ser phe phe ile
997、 275 280
998、<210> 9
999、<211> 285
1000、<212> prt
1001、<213> brachyspira sp. cag:484
1002、<400> 9
1003、met gly asn lys val ala val leu tyr ile val thr gly arg tyr val
1004、1 5 10 15
1005、cys phe trp asp glu phe tyr pro ser cys glu lys tyr phe leu pro
1006、 20 25 30
1007、asp ala gln lys lys tyr phe val phe thr asp ala glu his leu asn
1008、 35 40 45
1009、phe glu glu asn asp asn val leu lys ile his gln glu lys leu gly
1010、 50 55 60
1011、trp pro tyr asp thr met leu arg phe asp ile phe leu lys gln lys
1012、65 70 75 80
1013、glu ala leu lys glu tyr asp tyr ile phe phe phe asn ala asn thr
1014、 85 90 95
1015、lys phe leu asn tyr val arg glu glu ile leu pro asn glu glu asn
1016、 100 105 110
1017、asp trp leu ile thr gly ser his pro ala phe tyr asn lys his pro
1018、 115 120 125
1019、asp glu phe thr tyr asp arg asn pro glu ser gln ala tyr ile pro
1020、 130 135 140
1021、tyr gly ala gly lys his tyr ala thr gly ala leu asn gly gly ser
1022、145 150 155 160
1023、gly ala ser phe leu glu met cys glu glu leu ser arg leu thr his
1024、 165 170 175
1025、ile asp met asp asn gly val val pro leu trp his asp glu ser met
1026、 180 185 190
1027、leu asn lys tyr met leu asn lys asn pro leu ile met pro val asn
1028、 195 200 205
1029、tyr leu tyr pro glu glu arg trp met pro arg lys trp tyr arg asn
1030、 210 215 220
1031、asn pro phe lys lys asp ile lys ile leu ser thr asp lys thr his
1032、225 230 235 240
1033、pro arg tyr gly gly lys glu tyr leu arg gly ile ser asp lys lys
1034、 245 250 255
1035、ala lys met pro asn pro ile phe ser val ser tyr glu asp ala lys
1036、 260 265 270
1037、lys val leu arg ile leu gly phe lys ile arg ile val
1038、 275 280 285
1039、<210> 10
1040、<211> 274
1041、<212> prt
1042、<213> candidatus melainabacteria
1043、<400> 10
1044、met leu lys phe thr tyr asn lys lys lys glu ser leu met lys ile
1045、1 5 10 15
1046、ala ile ile tyr ile gly ile gly arg tyr thr val phe trp asp glu
1047、 20 25 30
1048、phe tyr lys ser cys glu lys asn phe ile arg asn ala gln lys his
1049、 35 40 45
1050、tyr phe tyr phe thr asp ser lys glu tyr lys ser asp asp lys ile
1051、 50 55 60
1052、thr ile ile pro gln glu asn leu gly trp pro leu val thr cys leu
1053、65 70 75 80
1054、arg tyr lys phe ile asn thr ile lys asp ser leu lys asn tyr asp
1055、 85 90 95
1056、tyr ile phe phe phe asn gly asn tyr glu val tyr ser lys val thr
1057、 100 105 110
1058、ala glu glu phe leu pro thr asp glu asp gly gly leu ile ala leu
1059、 115 120 125
1060、lys his asn tyr asn lys tyr lys lys pro asp asp phe pro trp glu
1061、 130 135 140
1062、arg asn pro lys ser thr ser tyr ile pro tyr gly thr asp ser phe
1063、145 150 155 160
1064、tyr tyr gln ala cys leu trp gly gly lys thr ser gln met leu lys
1065、 165 170 175
1066、leu val glu asp cys glu lys met met asp glu asp leu ala asn asp
1067、 180 185 190
1068、ile val pro ile phe his asp glu ser leu phe asn lys tyr met leu
1069、 195 200 205
1070、asp lys lys his lys thr leu gly tyr glu tyr gly phe val pro glu
1071、 210 215 220
1072、gly lys pro phe trp lys tyr phe gly val lys met thr gln arg pro
1073、225 230 235 240
1074、lys ser trp lys tyr gly gly val asp trp leu arg gly leu thr asp
1075、 245 250 255
1076、lys lys gln thr leu phe ser tyr ile leu glu lys leu his leu thr
1077、 260 265 270
1078、lys lys
1079、<210> 11
1080、<211> 253
1081、<212> prt
1082、<213> candidatus pacearchaeota
1083、<400> 11
1084、met pro pro lys val ala ile ile phe ile gly thr ser lys tyr ala
1085、1 5 10 15
1086、asp phe phe pro glu trp lys arg cys val asp lys his phe leu lys
1087、 20 25 30
1088、glu cys asp lys thr ile ile ala ile thr asp arg val asp glu glu
1089、 35 40 45
1090、tyr phe his leu glu asp val tyr cys gly lys val ala his met glu
1091、 50 55 60
1092、trp pro phe ile thr val leu arg phe arg phe ile asn glu ile pro
1093、65 70 75 80
1094、gly leu lys gln phe asp tyr val phe phe leu asp ala asp leu phe
1095、 85 90 95
1096、pro ser asn asp ile leu leu ser glu ile ile ser pro asp lys lys
1097、 100 105 110
1098、leu val gly val gln his pro gly asn phe leu asp ser thr trp asn
1099、 115 120 125
1100、thr leu asp arg thr pro gly ser thr ala cys val ser gly asp ile
1101、 130 135 140
1102、thr ser tyr gly thr thr phe tyr his gln gly cys leu trp gly gly
1103、145 150 155 160
1104、thr gly lys ala val ser glu met val leu lys leu ala lys asn val
1105、 165 170 175
1106、asp ala asp leu lys asn asn ile met ala ile trp his asp glu ser
1107、 180 185 190
1108、his met asn lys tyr phe leu glu asn ile ala asp val his thr leu
1109、 195 200 205
1110、his ser gly phe ala tyr pro glu his gly asn trp ala val ile glu
1111、 210 215 220
1112、asp asn leu glu ile lys met val his lys glu lys ser his glu asp
1113、225 230 235 240
1114、phe pro arg phe arg gly asn asn pro his asp lys gly
1115、 245 250
1116、<210> 12
1117、<211> 289
1118、<212> prt
1119、<213> candidatus pacearchaeota
1120、<400> 12
1121、met ala ser lys ser leu arg glu lys leu met arg val lys trp ile
1122、1 5 10 15
1123、lys lys leu leu arg ala leu pro thr leu leu arg leu his ile lys
1124、 20 25 30
1125、tyr phe glu asn arg lys tyr thr ile arg ile leu lys lys glu glu
1126、 35 40 45
1127、arg lys glu lys lys gln met gln phe pro lys ser ile ala ile leu
1128、 50 55 60
1129、phe val gly thr gly ile tyr phe asn tyr phe gly glu phe tyr glu
1130、65 70 75 80
1131、asn ile lys arg asn phe leu pro glu ile pro lys lys phe phe val
1132、 85 90 95
1133、phe thr asp lys asp phe lys glu asn glu asp val glu arg val lys
1134、 100 105 110
1135、ile pro asp glu lys ile tyr ala ile leu arg tyr leu gly asp ile
1136、 115 120 125
1137、pro lys ile lys asn leu lys asn phe glu tyr val ile lys met asp
1138、 130 135 140
1139、ala asp leu val val pro glu pro ile ser ser ala glu phe phe tyr
1140、145 150 155 160
1141、his asn lys pro leu phe gly val arg his pro tyr phe leu cys arg
1142、 165 170 175
1143、gln gly ser phe glu ile ser pro lys ser lys ala ala val ser pro
1144、 180 185 190
1145、arg glu asp leu ser glu tyr ile gln cys cys phe trp gly gly lys
1146、 195 200 205
1147、thr asn tyr val val lys met val lys glu met tyr lys asn ile lys
1148、 210 215 220
1149、ile asp leu asn asn gly ile ile ala arg ile phe asp glu ser tyr
1150、225 230 235 240
1151、leu asn lys tyr phe ile ser asn lys pro leu phe tyr val tyr pro
1152、 245 250 255
1153、pro asn tyr ala tyr pro asp val pro ile pro glu lys leu lys lys
1154、 260 265 270
1155、lys ile leu his val thr asn lys arg phe lys val asn tyr gln lys
1156、 275 280 285
1157、lys
1158、<210> 13
1159、<211> 261
1160、<212> prt
1161、<213> chitinophaga niabensis
1162、<400> 13
1163、met lys ile ala leu leu phe ile cys thr gly lys tyr ser ile phe
1164、1 5 10 15
1165、trp lys asp phe tyr thr ser ala glu gln tyr phe val pro gly ala
1166、 20 25 30
1167、glu lys ala tyr phe val phe thr asp asp ala asp leu pro phe lys
1168、 35 40 45
1169、asp ala gln asn val his val his his gln gln lys leu gly trp pro
1170、 50 55 60
1171、tyr asp thr leu met arg phe ser ile phe ser arg val glu lys glu
1172、65 70 75 80
1173、leu ala ala phe asp tyr ile phe phe phe asn ala asn thr glu phe
1174、 85 90 95
1175、ile lys pro ile thr ala ala glu ile leu pro thr asp ala glu asp
1176、 100 105 110
1177、gly leu thr val val leu his pro gly tyr tyr asn lys pro leu lys
1178、 115 120 125
1179、ala phe pro tyr glu lys thr gln lys lys ser thr ala tyr met pro
1180、 130 135 140
1181、ser asn glu arg his gln tyr phe gln gly cys leu asn gly gly thr
1182、145 150 155 160
1183、gly lys ala tyr leu gln leu ile arg gln leu thr glu asn thr gln
1184、 165 170 175
1185、lys asp leu asp asn gly ile ile ala ile trp his asp glu ser gln
1186、 180 185 190
1187、leu asn lys tyr val ala asn lys his pro lys val leu thr pro gly
1188、 195 200 205
1189、tyr ala tyr pro glu gly trp asp leu pro phe glu lys ala ile leu
1190、 210 215 220
1191、met arg asp lys gly arg phe gly gly ser asp phe met arg gln thr
1192、225 230 235 240
1193、thr pro glu ala pro leu asn thr phe gln leu ile ile arg lys ile
1194、 245 250 255
1195、lys arg leu phe ser
1196、 260
1197、<210> 14
1198、<211> 234
1199、<212> prt
1200、<213> 大肠杆菌
1201、<400> 14
1202、met val ile asn ile phe tyr ile cys thr gly glu tyr lys arg phe
1203、1 5 10 15
1204、phe asp lys phe tyr leu ser cys glu asp lys phe ile pro glu phe
1205、 20 25 30
1206、glu lys lys tyr tyr val phe thr asp ser asp arg ile tyr phe ser
1207、 35 40 45
1208、lys tyr leu asn val glu val ile asn val glu lys asn cys trp pro
1209、 50 55 60
1210、leu asn thr leu leu arg phe ser tyr phe leu lys val ile asp lys
1211、65 70 75 80
1212、leu gln thr asn ser tyr thr phe phe phe asn ala asn ala val ile
1213、 85 90 95
1214、val lys glu ile pro phe ser thr phe met glu ser asp leu ile gly
1215、 100 105 110
1216、val ile his pro gly tyr lys asn arg ile ser ile leu tyr pro trp
1217、 115 120 125
1218、glu arg arg lys asn ala thr cys tyr leu gly tyr leu lys lys gly
1219、 130 135 140
1220、ile tyr tyr gln gly cys phe asn gly gly lys thr ala ser phe lys
1221、145 150 155 160
1222、arg leu ile gln ile cys asn met met thr met ala asp leu lys lys
1223、 165 170 175
1224、asn leu ile ala lys val his asp glu ser tyr leu asn tyr tyr tyr
1225、 180 185 190
1226、tyr tyr asn lys pro leu leu leu ser glu leu tyr ser trp pro glu
1227、 195 200 205
1228、lys tyr gly glu asn lys asp ala lys ile ile met arg asp lys glu
1229、 210 215 220
1230、arg glu ser trp tyr gly asn ile lys lys
1231、225 230
1232、<210> 15
1233、<211> 185
1234、<212> prt
1235、<213> 大肠杆菌
1236、<400> 15
1237、tyr leu asn val glu val ile asn val glu lys asn cys trp pro leu
1238、1 5 10 15
1239、asn thr leu leu arg phe ser tyr phe leu lys val ile asp lys leu
1240、 20 25 30
1241、gln thr asn ser tyr thr phe phe phe asn ala asn ala val ile val
1242、 35 40 45
1243、lys glu ile pro phe ser thr phe met glu ser asp leu ile gly val
1244、 50 55 60
1245、ile his pro gly tyr lys asn arg ile ser ile leu tyr pro trp glu
1246、65 70 75 80
1247、arg arg lys asn ala thr cys tyr leu gly tyr leu lys lys gly ile
1248、 85 90 95
1249、tyr tyr gln gly cys phe asn gly gly lys thr ala ser phe lys arg
1250、 100 105 110
1251、leu ile gln ile cys asn met met thr met ala asp leu lys lys asn
1252、 115 120 125
1253、leu ile ala lys val his asp glu ser tyr leu asn tyr tyr tyr tyr
1254、 130 135 140
1255、tyr asn lys pro leu leu leu ser glu leu tyr ser trp pro glu lys
1256、145 150 155 160
1257、tyr gly glu asn lys asp ala lys ile ile met arg asp lys glu arg
1258、 165 170 175
1259、glu ser trp tyr gly asn ile lys lys
1260、 180 185
1261、<210> 16
1262、<211> 542
1263、<212> prt
1264、<213> haemophilus pittmaniae
1265、<400> 16
1266、met ile lys glu thr ile ala val leu tyr ile val gln gly asn asp
1267、1 5 10 15
1268、phe ala ala trp asp asn phe tyr arg ser ser glu glu phe leu leu
1269、 20 25 30
1270、pro arg gln his lys gln tyr phe val phe ser asp asp glu ser ile
1271、 35 40 45
1272、thr arg asn ser asn ile ser ile val arg thr asn gly leu lys asp
1273、 50 55 60
1274、ser lys ser arg phe trp leu phe ser ala ile glu asn gln leu ala
1275、65 70 75 80
1276、glu phe thr tyr val tyr ala phe ser ser his val arg phe val ser
1277、 85 90 95
1278、pro ile val ala glu asp ile thr pro thr pro asn ser pro phe val
1279、 100 105 110
1280、val tyr arg gln tyr pro asp leu asp his val leu ala asn glu phe
1281、 115 120 125
1282、pro tyr glu arg val val asn ala asn ser tyr val pro tyr gly val
1283、 130 135 140
1284、gly glu gln tyr leu thr cys ala leu phe gly gly met arg asp ser
1285、145 150 155 160
1286、phe ile ser ala cys arg cys ile asp ala ala ile glu asp asp arg
1287、 165 170 175
1288、tyr arg his ile ala ser leu asn ala glu asp lys gln leu asn gln
1289、 180 185 190
1290、tyr phe leu tyr lys asn asn met asn val leu ser ala asn trp ile
1291、 195 200 205
1292、arg lys ala asn glu pro trp lys arg tyr ala lys met leu asp val
1293、 210 215 220
1294、ile gln glu asp ser phe asp ile pro val asp val leu glu ser val
1295、225 230 235 240
1296、lys asn ile his glu ile phe arg tyr ala pro his ser phe phe leu
1297、 245 250 255
1298、asp leu gln glu asn val ala lys ser trp arg ala leu leu lys ala
1299、 260 265 270
1300、tyr leu tyr gly gln leu thr thr phe asp phe pro ala lys lys pro
1301、 275 280 285
1302、glu leu val gly lys asn ile ile trp gln tyr trp gly gln gly ile
1303、 290 295 300
1304、asp asp arg leu pro glu leu thr lys val cys phe ala ser val asp
1305、305 310 315 320
1306、arg asn lys gly asp tyr thr val ile arg val asp asp ala ser leu
1307、 325 330 335
1308、ala glu tyr ile asp leu pro asp phe met trp gln lys arg gly gly
1309、 340 345 350
1310、ala phe ser thr ala leu phe ser asp val val arg leu ile leu leu
1311、 355 360 365
1312、tyr val tyr gly gly ile trp val asp ala thr ile ile phe ser ser
1313、 370 375 380
1314、pro leu pro lys gly leu leu glu gln asp phe phe leu phe his arg
1315、385 390 395 400
1316、asp ile gly asn ser asn lys ala tyr trp glu arg ile asn lys asp
1317、 405 410 415
1318、tyr phe cys trp asp lys glu his lys val asn ser leu asn ser phe
1319、 420 425 430
1320、ile ile ala lys pro arg his val val thr glu thr leu leu gln leu
1321、 435 440 445
1322、leu leu asn tyr trp lys thr gln asp his val pro cys tyr tyr ile
1323、 450 455 460
1324、phe gln ile leu phe asp gln val met lys tyr asp leu asp asn gln
1325、465 470 475 480
1326、arg leu leu val arg asp asp thr phe pro his glu leu ser met lys
1327、 485 490 495
1328、leu trp ser asp tyr asn ala glu glu ile asn asp leu phe ser arg
1329、 500 505 510
1330、cys ser val his lys leu thr gly his ala asn leu ala asp cys gly
1331、 515 520 525
1332、glu asn ser val trp gln his leu lys arg glu tyr leu gly
1333、 530 535 540
1334、<210> 17
1335、<211> 542
1336、<212> prt
1337、<213> haemophilus pittmaniae hk 85
1338、<400> 17
1339、met ile lys glu thr ile ala val leu tyr ile val gln gly asn asp
1340、1 5 10 15
1341、phe ala ala trp asp asn phe tyr arg ser ser glu glu phe leu leu
1342、 20 25 30
1343、pro gly gln his lys gln tyr phe val phe ser asp asp glu ser ile
1344、 35 40 45
1345、thr arg asn ser asn val ser ile val arg thr asn gly leu lys asp
1346、 50 55 60
1347、ser lys ser arg phe trp leu phe ser ala ile glu asn gln leu ala
1348、65 70 75 80
1349、glu phe thr tyr val tyr ala phe ser ser his ile arg phe val ser
1350、 85 90 95
1351、pro val val ser glu asp ile thr pro thr pro asn ser pro phe val
1352、 100 105 110
1353、val tyr arg gln tyr pro asn leu asp his val leu ala asn glu phe
1354、 115 120 125
1355、pro tyr glu arg ala val asn ala asn ser tyr val pro tyr gly ala
1356、 130 135 140
1357、gly glu gln tyr leu thr cys ala leu phe gly gly met arg asp ser
1358、145 150 155 160
1359、phe ile ser ala cys arg cys ile asp ala ala ile glu asp asp arg
1360、 165 170 175
1361、tyr arg his ile ala ser leu asn ala glu asp lys gln leu asn gln
1362、 180 185 190
1363、tyr phe leu tyr lys asn asn met asn val leu ser ala asn trp ile
1364、 195 200 205
1365、arg lys ala asn glu pro trp lys arg tyr ala lys met leu asp val
1366、 210 215 220
1367、ile gln glu gly ser phe asp ile pro val asp val leu glu ser val
1368、225 230 235 240
1369、lys asn ile his glu ile phe arg tyr ala pro his ser ser phe leu
1370、 245 250 255
1371、asp leu gln glu asn val ala lys ser trp arg ala leu leu lys ala
1372、 260 265 270
1373、tyr leu tyr gly gln leu thr thr phe asp phe pro ala lys lys pro
1374、 275 280 285
1375、asp leu val gly lys asn ile ile trp gln tyr trp gly gln gly ile
1376、 290 295 300
1377、asp asp gly leu pro glu leu thr lys val cys phe ala ser val asp
1378、305 310 315 320
1379、arg asn lys gly asp tyr thr val ile arg val asp asp ala ser leu
1380、 325 330 335
1381、ala glu tyr ile asp leu pro asp phe met trp gln lys arg gly gly
1382、 340 345 350
1383、ala phe ser ala ala leu phe ser asp val val arg leu val leu leu
1384、 355 360 365
1385、tyr val tyr gly gly ile trp val asp ala thr ile ile phe ser ser
1386、 370 375 380
1387、pro leu pro lys glu leu leu glu gln asp phe phe leu phe his arg
1388、385 390 395 400
1389、asp ile gly asn ser asn lys ala tyr trp glu arg ile asn lys asp
1390、 405 410 415
1391、tyr phe cys trp asn lys glu his lys val asn ser leu asn ser phe
1392、 420 425 430
1393、ile ile ala lys pro trp his val val thr glu thr leu leu gln leu
1394、 435 440 445
1395、leu leu asn tyr trp lys thr gln asp his val pro cys tyr tyr ile
1396、 450 455 460
1397、phe gln ile leu phe asp gln val met lys tyr asp leu asp asn gln
1398、465 470 475 480
1399、arg leu leu ile arg asp asp thr phe pro his glu leu ser met lys
1400、 485 490 495
1401、leu trp ser asp tyr asn ala glu glu ile asn asp leu phe ser arg
1402、 500 505 510
1403、cys ser val his lys leu thr gly his ala asn leu ala asp cys gly
1404、 515 520 525
1405、glu asn ser val trp gln his leu lys arg glu tyr leu gly
1406、 530 535 540
1407、<210> 18
1408、<211> 641
1409、<212> prt
1410、<213> helicobacter sp. 11s02629-2
1411、<400> 18
1412、met lys leu asp leu asp lys ser tyr asn phe leu ile val arg leu
1413、1 5 10 15
1414、asp his ile gly asp val val leu thr leu gly cys ala glu ala ile
1415、 20 25 30
1416、lys thr arg phe lys asn ala lys val phe tyr leu val asn ser tyr
1417、 35 40 45
1418、thr ala pro leu phe glu his his ala phe val asp gly phe ile asp
1419、 50 55 60
1420、leu asn thr asn gly val phe asp gln lys ala leu ile ser arg ile
1421、65 70 75 80
1422、lys ala ala lys ile asp ile ser ile ser phe ala pro asp lys phe
1423、 85 90 95
1424、ala leu pro ala ile phe lys ala arg val lys ile arg leu gly asn
1425、 100 105 110
1426、phe ile lys leu tyr ser leu leu leu thr lys arg val ile gln asn
1427、 115 120 125
1428、arg ser ala cys asn arg ser glu ala leu tyr asp leu glu leu leu
1429、 130 135 140
1430、lys pro leu gly cys ser thr asn phe tyr pro lys leu phe val ser
1431、145 150 155 160
1432、glu ala glu lys glu glu ala leu lys tyr ile glu ser ser phe ala
1433、 165 170 175
1434、asn lys arg pro leu val ile val his pro gly ser leu lys ser thr
1435、 180 185 190
1436、val glu trp gly arg glu lys phe leu glu val ala ser leu leu ser
1437、 195 200 205
1438、glu asn tyr asn val leu val thr gly ser asp ser glu met lys glu
1439、 210 215 220
1440、leu leu thr phe lys arg gly asn leu lys glu ser asn phe leu lys
1441、225 230 235 240
1442、pro gly ser leu arg trp ile ile ser ile ile ser leu ala asp leu
1443、 245 250 255
1444、ile val val asn ala thr gly thr leu his ile ala ala ala leu gly
1445、 260 265 270
1446、val arg ile val gly ile tyr pro asp arg leu gln ile asn pro thr
1447、 275 280 285
1448、arg trp ala ala phe thr lys glu asp asp asp val tyr ile thr pro
1449、 290 295 300
1450、ser gly ile phe tyr gly ala lys ser tyr lys pro pro ser phe asp
1451、305 310 315 320
1452、asn asn asp pro arg met val asn met asp ala ile lys val asp glu
1453、 325 330 335
1454、val tyr lys ile ala asp leu glu leu lys lys leu asp pro arg tyr
1455、 340 345 350
1456、lys lys ile ala ile leu tyr ile ala leu gly arg tyr asp ile phe
1457、 355 360 365
1458、phe asn asp phe tyr glu ser met glu lys his phe val thr ser ala
1459、 370 375 380
1460、lys lys thr tyr phe val phe thr asp ser ala asn ile ser thr his
1461、385 390 395 400
1462、asp asn val val lys ile lys gln glu lys leu gly trp pro phe asp
1463、 405 410 415
1464、thr leu lys arg phe ala met phe glu ser ile lys asp arg leu ala
1465、 420 425 430
1466、asn phe asp tyr ile phe phe phe asn ala asn ala leu val leu glu
1467、 435 440 445
1468、asp ile gln ala lys glu val leu pro ser glu lys glu gly leu val
1469、 450 455 460
1470、phe ala arg his pro ser phe ser tyr ile lys glu asp leu thr trp
1471、465 470 475 480
1472、asp ser arg asp ser phe arg asp ser tyr his lys asp leu asn ser
1473、 485 490 495
1474、leu ala cys ile lys glu asp glu gly phe ala tyr val met gly ala
1475、 500 505 510
1476、leu asn gly gly arg ala lys glu tyr leu glu leu ile ser thr leu
1477、 515 520 525
1478、his ala asn val glu ser asp leu gln lys asp val ile ala val trp
1479、 530 535 540
1480、his asp glu ser his leu asn arg tyr leu ile asp phe cys lys ala
1481、545 550 555 560
1482、gly his ala pro lys ile leu gly ala asn phe leu val pro glu glu
1483、 565 570 575
1484、cys leu glu lys leu gly phe gly phe tyr lys asp thr pro phe leu
1485、 580 585 590
1486、lys leu ser ser leu lys ala lys ile thr leu leu asp lys ser his
1487、 595 600 605
1488、pro arg phe gly gly his glu tyr leu arg gly ala val val gln asp
1489、 610 615 620
1490、phe lys pro lys val gly leu thr cys ile lys asp thr gly gly gly
1491、625 630 635 640
1492、gly
1493、<210> 19
1494、<211> 331
1495、<212> prt
1496、<213> helicobacter sp. 13s00401-1
1497、<400> 19
1498、met leu asn pro phe lys thr asn thr ile ala ile leu tyr ile ala
1499、1 5 10 15
1500、leu gly arg tyr asp ile phe phe asn asp phe tyr glu asn met glu
1501、 20 25 30
1502、lys asn phe val pro asn thr lys lys thr tyr phe val phe thr asp
1503、 35 40 45
1504、ser lys asn ile thr ser his glu asn ile val arg ile glu gln ala
1505、 50 55 60
1506、lys leu gly trp pro tyr asp thr leu lys arg phe ala met phe glu
1507、65 70 75 80
1508、gly ile lys glu glu leu ala ser phe asp tyr ile phe phe phe asn
1509、 85 90 95
1510、ala asn ala leu val leu glu lys ile thr ala pro met ile leu pro
1511、 100 105 110
1512、ser lys asp glu gly leu val phe ala arg his pro ala phe ser cys
1513、 115 120 125
1514、ile leu pro asp met asn trp glu ser arg glu ser phe arg gln ser
1515、 130 135 140
1516、tyr cys lys asp pro asn ser leu ala cys ile lys asp asp glu gly
1517、145 150 155 160
1518、phe cys tyr val met gly ala leu asn gly gly arg ala lys glu tyr
1519、 165 170 175
1520、leu glu leu ile glu thr leu ala ala arg val glu ala asp leu gln
1521、 180 185 190
1522、lys asp val val ala val trp his asp glu ser his leu asn arg tyr
1523、 195 200 205
1524、leu ile asp val val lys asn gly lys lys pro lys ile ile gly ala
1525、 210 215 220
1526、asn phe leu val pro glu glu his leu glu ala leu gly phe his phe
1527、225 230 235 240
1528、tyr lys asp val pro phe leu lys leu ala lys leu arg ala asn ile
1529、 245 250 255
1530、thr leu leu asn lys ser his pro arg phe gly gly his glu tyr leu
1531、 260 265 270
1532、arg gly leu ser asp val lys val glu leu gln lys gly asp glu val
1533、 275 280 285
1534、asn leu tyr lys arg tyr gly gly gly gly glu leu gly ala phe ser
1535、 290 295 300
1536、pro lys leu phe leu lys cys phe tyr leu asn leu lys his asn leu
1537、305 310 315 320
1538、ser ala lys lys gly leu lys asp lys asn ala
1539、 325 330
1540、<210> 20
1541、<211> 226
1542、<212> prt
1543、<213> hyphomonas sp.
1544、<220>
1545、<221> misc_feature
1546、<222> (54)..(54)
1547、<223> xaa可为任何自然发生氨基酸
1548、<220>
1549、<221> misc_feature
1550、<222> (74)..(74)
1551、<223> xaa可为任何自然发生氨基酸
1552、<220>
1553、<221> misc_feature
1554、<222> (114)..(114)
1555、<223> xaa可为任何自然发生氨基酸
1556、<400> 20
1557、met ile gly trp leu val ile gly thr asn lys tyr leu glu leu gly
1558、1 5 10 15
1559、val glu cys leu glu ser ile lys glu lys tyr thr gly ser gln ser
1560、 20 25 30
1561、gln lys phe phe leu phe thr asp arg val asp glu val lys gln asp
1562、 35 40 45
1563、trp ile thr thr phe xaa ile glu his glu val phe pro tyr ile ser
1564、 50 55 60
1565、met ser arg tyr arg his phe val asp xaa lys glu val leu ala glu
1566、65 70 75 80
1567、met asp tyr leu tyr tyr val asp ala asp ser leu phe leu asn val
1568、 85 90 95
1569、gly asp glu ile leu gly glu arg val thr thr arg his pro gly trp
1570、 100 105 110
1571、phe xaa arg glu ser ile asp cys pro phe asp arg asn pro asn ser
1572、 115 120 125
1573、asn ala phe val ser tyr asp tyr lys gly pro tyr phe gln asn cys
1574、 130 135 140
1575、phe gln gly gly tyr ser lys glu phe leu lys met ser glu ile leu
1576、145 150 155 160
1577、ala glu arg thr lys met asp leu gly asn asp val met pro leu trp
1578、 165 170 175
1579、his asp glu ser his met asn lys tyr met ser glu asn pro pro thr
1580、 180 185 190
1581、arg ile leu asp pro gly tyr ala tyr pro glu asn trp arg ile pro
1582、 195 200 205
1583、phe glu gln lys ile ile gly val ser lys asn his asp glu ile arg
1584、 210 215 220
1585、ser asp
1586、225
1587、<210> 21
1588、<211> 610
1589、<212> prt
1590、<213> neisseria shayeganii 871
1591、<400> 21
1592、met his thr pro thr ile ala val leu tyr ile ala thr gly arg tyr
1593、1 5 10 15
1594、thr val phe trp glu pro phe tyr gln ser ala glu arg phe leu leu
1595、 20 25 30
1596、thr asp cys arg lys his tyr phe leu phe thr asp ser pro glu pro
1597、 35 40 45
1598、leu ala gly glu ala glu gly lys val thr arg ile his gln asn lys
1599、 50 55 60
1600、leu gly trp pro tyr asp thr leu met arg phe glu met phe leu gly
1601、65 70 75 80
1602、ile lys ala gln leu ala ala tyr asp phe ile tyr phe phe asn gly
1603、 85 90 95
1604、asn thr glu leu leu ser pro val ser arg glu asp leu leu pro leu
1605、 100 105 110
1606、gln ala his glu asn leu val ala ala arg gln pro his ile thr his
1607、 115 120 125
1608、leu ser ala asp glu phe pro tyr glu arg asn pro lys ser thr ala
1609、 130 135 140
1610、cys ile pro arg gly gln gly arg tyr tyr phe thr gly ala leu asn
1611、145 150 155 160
1612、gly gly arg ala ala ala tyr leu ala met cys glu thr leu asn arg
1613、 165 170 175
1614、his ile gln gln asp leu asp lys asn val ile ala leu trp his asp
1615、 180 185 190
1616、glu ser gln leu asn arg tyr leu leu asp arg asn asp val lys ile
1617、 195 200 205
1618、leu pro arg tyr phe thr arg gly glu thr glu pro trp lys gln asn
1619、 210 215 220
1620、ala lys val met phe ser asp lys thr his tyr arg phe gly gly his
1621、225 230 235 240
1622、ala tyr leu arg gly glu ser glu gln lys ile ser arg glu glu trp
1623、 245 250 255
1624、glu ala glu tyr arg val pro ala asp val ala ala thr ala arg gln
1625、 260 265 270
1626、pro his thr val phe ala thr asp ala lys trp lys arg arg val asp
1627、 275 280 285
1628、ala cys asn arg arg pro trp lys ile leu tyr lys gly leu val pro
1629、 290 295 300
1630、lys pro val arg asn arg leu asn lys lys ala gln leu ala gln gln
1631、305 310 315 320
1632、arg his val ala ala cys trp glu arg phe leu lys ala tyr phe tyr
1633、 325 330 335
1634、gly ile leu glu ser phe ser leu gln pro lys gln asp leu arg gly
1635、 340 345 350
1636、arg lys ile ile trp gln tyr trp gly gln gly ala asp ala ala asp
1637、 355 360 365
1638、leu pro asp ile val arg leu cys phe his ser val glu gln his lys
1639、 370 375 380
1640、gly asp tyr asp ile ile arg leu asp asp gly asn val arg asp tyr
1641、385 390 395 400
1642、val asp phe pro asp phe val trp glu lys arg his asn pro glu phe
1643、 405 410 415
1644、lys his ala phe phe ala asp leu leu arg leu ala leu leu asp leu
1645、 420 425 430
1646、tyr gly gly ala trp leu asp ala thr ile leu leu thr ala pro leu
1647、 435 440 445
1648、pro glu gly tyr leu lys asp ala gly phe phe met phe gln arg asp
1649、 450 455 460
1650、pro ala ala ala asp gln ala ala trp glu lys leu asn ala asp tyr
1651、465 470 475 480
1652、phe gly trp gln pro asn his lys val ser val leu asn ser phe ile
1653、 485 490 495
1654、met ala his pro gly asn thr val ile his thr cys leu asp leu leu
1655、 500 505 510
1656、leu asn phe trp lys thr gln asn arg ile pro his tyr phe phe phe
1657、 515 520 525
1658、gln ile met phe his glu leu met arg leu tyr phe ala asp arg gln
1659、 530 535 540
1660、cys pro leu ala asp asp thr leu pro his leu leu tyr arg gln ile
1661、545 550 555 560
1662、gln gln pro phe asp ala gly arg phe ala asp ile thr arg arg cys
1663、 565 570 575
1664、gly val his lys leu ser tyr leu lys his cys pro pro gly ser phe
1665、 580 585 590
1666、tyr his his leu arg thr glu ala gly leu pro pro ala asn ala asn
1667、 595 600 605
1668、gly his
1669、 610
1670、<210> 22
1671、<211> 277
1672、<212> prt
1673、<213> pasteurella aerogenes
1674、<400> 22
1675、met ala lys val ala ile leu tyr ile ala thr gly arg tyr ile val
1676、1 5 10 15
1677、phe trp glu his phe tyr arg ser ala glu lys phe leu leu pro lys
1678、 20 25 30
1679、ser asp lys asn tyr phe val phe thr asp ser pro his ile leu gly
1680、 35 40 45
1681、glu glu his ser asn val thr arg ile glu gln lys lys leu gly trp
1682、 50 55 60
1683、pro tyr asp thr leu met arg phe asp ile phe leu ser ile arg glu
1684、65 70 75 80
1685、thr leu glu lys phe asp tyr ile tyr phe phe asn gly asn ser glu
1686、 85 90 95
1687、leu leu ser glu val asn glu thr glu phe leu pro cys glu asp asn
1688、 100 105 110
1689、tyr asn leu val phe thr his gln pro his met phe his leu pro lys
1690、 115 120 125
1691、arg arg phe thr tyr asp arg asn pro glu ser cys ala tyr ile pro
1692、 130 135 140
1693、gln gly asp gly lys tyr tyr phe thr gly ala leu asn gly gly lys
1694、145 150 155 160
1695、ala lys tyr tyr leu glu met cys glu lys leu ser gln asn thr his
1696、 165 170 175
1697、thr asp leu glu lys asn ile ile ala arg trp his asp glu ser his
1698、 180 185 190
1699、leu asn arg tyr ala ile gly arg thr asp ile lys ile leu pro pro
1700、 195 200 205
1701、tyr phe thr arg ser glu thr glu lys trp lys thr ser ala lys ile
1702、 210 215 220
1703、met phe ser asp lys thr his tyr arg phe gly gly his ala tyr leu
1704、225 230 235 240
1705、arg gly glu ser glu asn lys ile thr pro thr glu trp glu glu lys
1706、 245 250 255
1707、tyr lys asn lys lys arg arg phe ser phe arg ile lys gln tyr ile
1708、 260 265 270
1709、lys ser trp phe leu
1710、 275
1711、<210> 23
1712、<211> 301
1713、<212> prt
1714、<213> psychrobacter sp. (strain prwf-1)
1715、<400> 23
1716、met lys ile thr glu leu asn met ser leu ser thr ser ala leu ser
1717、1 5 10 15
1718、asn asn ser lys pro ser val ala ile leu tyr ile ala thr gly arg
1719、 20 25 30
1720、tyr thr val phe trp asp tyr phe tyr lys ser ala glu lys tyr leu
1721、 35 40 45
1722、leu pro asp cys asn lys his tyr ile leu phe thr asp ser asp ala
1723、 50 55 60
1724、leu ile asp ser phe arg thr lys ser asp gln val thr ala leu lys
1725、65 70 75 80
1726、lys glu ala met glu trp pro phe cys thr leu met arg phe arg phe
1727、 85 90 95
1728、phe leu asp ala glu asn ile ile lys gln his asp phe val phe phe
1729、 100 105 110
1730、phe asn ala asn thr glu phe leu ser thr ile thr gln tyr asp leu
1731、 115 120 125
1732、leu pro leu gly ser his glu asn leu thr leu cys leu gln pro his
1733、 130 135 140
1734、met phe his arg asn arg glu lys tyr thr tyr asp arg asn pro lys
1735、145 150 155 160
1736、ser thr ala tyr ile ala tyr gly glu gly lys tyr tyr phe thr gly
1737、 165 170 175
1738、ala leu asn gly gly lys ser ala ala phe leu asp leu cys his thr
1739、 180 185 190
1740、leu tyr asn asn thr gln ser asp leu lys gln asp ile ile ala leu
1741、 195 200 205
1742、trp his asp glu ser his leu asn lys phe ala leu gly arg glu asp
1743、 210 215 220
1744、ile lys ile leu pro pro tyr phe thr arg gly glu arg glu tyr trp
1745、225 230 235 240
1746、lys lys thr ser lys leu met phe ser asp lys ser his tyr arg phe
1747、 245 250 255
1748、gly gly his ala tyr leu arg ser glu thr asp glu lys ile thr gln
1749、 260 265 270
1750、ala glu trp asn lys lys asn ala lys arg arg arg lys leu lys phe
1751、 275 280 285
1752、arg ala lys gln tyr ile ser ser leu leu phe arg gln
1753、 290 295 300
1754、<210> 24
1755、<211> 284
1756、<212> prt
1757、<213> psychrobacter sp. p11f6
1758、<400> 24
1759、met thr glu asp asn lys pro ser val ala ile leu tyr ile ala thr
1760、1 5 10 15
1761、gly arg tyr thr val phe trp asp tyr phe tyr cys ser ala glu lys
1762、 20 25 30
1763、his leu leu pro asn ser asn lys his tyr val leu phe thr asp asp
1764、 35 40 45
1765、leu ala leu ile ser arg gln thr asp tyr pro asn val thr met ile
1766、 50 55 60
1767、lys gln glu ala leu gly trp pro tyr ser thr leu met arg phe lys
1768、65 70 75 80
1769、phe phe leu gly ala lys ser ile ile glu lys tyr asp phe ile phe
1770、 85 90 95
1771、tyr phe asn ala asn thr glu phe leu ser asp ile thr glu asp glu
1772、 100 105 110
1773、leu leu pro leu asp his his glu glu leu ser leu gly val gln pro
1774、 115 120 125
1775、his met phe his leu asn lys arg ala tyr thr tyr asp arg asn pro
1776、 130 135 140
1777、gln ser gln ala tyr ile pro tyr his lys gly arg tyr tyr phe thr
1778、145 150 155 160
1779、gly ala leu asn gly gly lys ser his ala tyr leu gln met cys glu
1780、 165 170 175
1781、thr leu asn gln asn thr glu leu asp leu lys asn asn val ile ala
1782、 180 185 190
1783、leu trp his asp glu ser gln leu asn lys phe ala leu asp arg thr
1784、 195 200 205
1785、asp ile lys val leu pro pro tyr phe thr arg gly glu his glu tyr
1786、 210 215 220
1787、trp lys lys ser ser lys ile met phe ser asp lys thr his tyr arg
1788、225 230 235 240
1789、phe gly gly his ala tyr leu arg ala glu thr asn asp lys ile thr
1790、 245 250 255
1791、lys ser asp trp glu gln lys asn gly lys arg arg arg lys leu asn
1792、 260 265 270
1793、thr arg phe lys gln tyr ile ala ser leu phe phe
1794、 275 280
1795、<210> 25
1796、<211> 234
1797、<212> prt
1798、<213> 肠道沙门氏菌
1799、<400> 25
1800、met thr ile asn ile leu tyr ile cys thr gly glu tyr arg asn phe
1801、1 5 10 15
1802、phe asp lys phe tyr ser ser cys glu gly tyr phe ile pro glu tyr
1803、 20 25 30
1804、lys lys lys tyr tyr val phe thr asp ser his ser asp lys phe ser
1805、 35 40 45
1806、lys tyr ser asn val thr val val pro val glu asn asn cys trp pro
1807、 50 55 60
1808、leu asn thr leu leu arg phe ser tyr phe ser lys ile val ser asp
1809、65 70 75 80
1810、leu gln pro asn thr tyr thr phe phe phe asn ala asn ala leu ile
1811、 85 90 95
1812、val lys thr ile pro phe asp ile phe lys asn ala asn leu val gly
1813、 100 105 110
1814、val val his pro gly tyr lys asn lys met ser ile phe tyr pro trp
1815、 115 120 125
1816、glu arg lys lys ser ala val cys tyr leu ser tyr phe lys lys gly
1817、 130 135 140
1818、ile tyr phe gln gly cys phe asn gly gly arg thr glu tyr phe cys
1819、145 150 155 160
1820、asp leu ile lys thr cys asn asp met thr ile lys asp leu lys arg
1821、 165 170 175
1822、asn ile ile ala lys val his asp glu ser tyr leu asn tyr tyr phe
1823、 180 185 190
1824、tyr phe lys glu pro leu cys leu ser glu leu tyr ser trp pro glu
1825、 195 200 205
1826、lys tyr gly glu asn thr glu ala lys ile ile met arg asp lys glu
1827、 210 215 220
1828、arg glu asp trp tyr ala asn ile lys ser
1829、225 230
1830、<210> 26
1831、<211> 234
1832、<212> prt
1833、<213> 肠道沙门氏菌
1834、<400> 26
1835、met thr ile asn ile leu tyr ile cys thr gly glu tyr arg asn phe
1836、1 5 10 15
1837、phe asp lys phe tyr thr ser cys glu gly tyr phe ile pro glu cys
1838、 20 25 30
1839、lys lys lys tyr tyr val phe thr asp ser his ser asp lys phe ser
1840、 35 40 45
1841、lys tyr asn asn val thr val val pro val glu asn asn cys trp pro
1842、 50 55 60
1843、leu asn thr leu leu arg phe ser tyr phe ser lys ile val pro asp
1844、65 70 75 80
1845、leu gln pro asn thr tyr thr phe phe phe asn ala asn ala leu ile
1846、 85 90 95
1847、val lys thr ile pro phe asp thr phe lys asn ala asn leu val gly
1848、 100 105 110
1849、val val his pro gly tyr lys asn lys met ser ile phe tyr pro trp
1850、 115 120 125
1851、glu arg lys lys ser ala ala cys tyr leu ser tyr phe lys asn gly
1852、 130 135 140
1853、ile tyr phe gln gly cys phe asn gly gly arg thr glu tyr phe cys
1854、145 150 155 160
1855、asp leu ile lys thr cys asn asp met thr ile lys asp leu lys arg
1856、 165 170 175
1857、asn ile ile ala lys val his asp glu ser tyr leu asn tyr tyr phe
1858、 180 185 190
1859、tyr phe lys glu pro leu cys leu ser glu leu tyr ser trp pro glu
1860、 195 200 205
1861、lys tyr gly glu asn thr glu ala arg ile ile met arg asp lys glu
1862、 210 215 220
1863、arg glu tyr trp tyr ala asn ile lys asn
1864、225 230
1865、<210> 27
1866、<211> 189
1867、<212> prt
1868、<213> 肠道沙门氏菌 i
1869、<400> 27
1870、lys phe ser lys tyr ser asn val thr val val pro val glu asn asn
1871、1 5 10 15
1872、cys trp pro leu asn thr leu leu arg phe ser tyr phe ser lys ile
1873、 20 25 30
1874、val ser asp leu gln pro asn thr tyr thr phe phe phe asn ala asn
1875、 35 40 45
1876、ala leu ile val lys thr ile pro phe asp ile phe lys asn ala asn
1877、 50 55 60
1878、leu val gly val val his pro gly tyr lys asn lys met ser ile phe
1879、65 70 75 80
1880、tyr pro trp glu arg lys lys ser ala val cys tyr leu ser tyr phe
1881、 85 90 95
1882、lys lys gly ile tyr phe gln gly cys phe asn gly gly arg thr glu
1883、 100 105 110
1884、tyr phe cys asp leu ile lys thr cys asn asp met thr ile lys asp
1885、 115 120 125
1886、leu lys arg asn ile ile ala lys val his asp glu ser tyr leu asn
1887、 130 135 140
1888、tyr tyr phe tyr phe lys glu pro leu cys leu ser glu leu tyr ser
1889、145 150 155 160
1890、trp pro glu lys tyr gly glu asn thr glu ala lys ile ile met arg
1891、 165 170 175
1892、asp lys glu arg glu asp trp tyr ala asn ile lys ser
1893、 180 185
1894、<210> 28
1895、<211> 234
1896、<212> prt
1897、<213> 肠道沙门氏菌 subsp. enterica serovar ahuza
1898、<400> 28
1899、met thr ile asn ile leu tyr ile cys thr gly glu tyr arg asn phe
1900、1 5 10 15
1901、phe asp lys phe tyr pro ser cys glu gly tyr phe ile pro glu tyr
1902、 20 25 30
1903、lys lys lys tyr tyr val phe thr asp ser his ser asp lys phe ser
1904、 35 40 45
1905、lys tyr ser asn val thr val val pro val glu asn asn cys trp pro
1906、 50 55 60
1907、leu asn thr leu leu arg phe ser tyr phe ser lys ile val ser asp
1908、65 70 75 80
1909、leu gln pro asn thr tyr thr phe phe phe asn ala asn ala leu ile
1910、 85 90 95
1911、val lys thr ile pro phe asp ile phe lys asn ala asn leu val gly
1912、 100 105 110
1913、val val his pro gly tyr lys asn lys met ser ile phe tyr pro trp
1914、 115 120 125
1915、glu arg lys lys ser ala val cys tyr leu ser tyr phe lys lys gly
1916、 130 135 140
1917、ile tyr phe gln gly cys phe asn gly gly arg thr glu tyr phe cys
1918、145 150 155 160
1919、asp leu ile lys thr cys asn asp met thr ile lys asp leu lys arg
1920、 165 170 175
1921、asn ile ile ala lys val his asp glu ser tyr leu asn tyr tyr phe
1922、 180 185 190
1923、tyr phe lys glu pro leu cys leu ser glu leu tyr ser trp pro glu
1924、 195 200 205
1925、lys tyr gly glu asn thr glu ala lys ile ile met arg asp lys glu
1926、 210 215 220
1927、arg glu asp trp tyr ala asn ile lys ser
1928、225 230
1929、<210> 29
1930、<211> 165
1931、<212> prt
1932、<213> 肠道沙门氏菌 subsp. enterica serovar kingabwa
1933、<400> 29
1934、met thr ile asn ile leu tyr ile cys thr gly glu tyr arg asn phe
1935、1 5 10 15
1936、phe asp lys phe tyr ser ser cys glu gly tyr phe ile pro glu tyr
1937、 20 25 30
1938、lys lys lys tyr tyr val phe thr asp ser his ser asp lys phe ser
1939、 35 40 45
1940、lys tyr ser asn val thr val val pro val glu asn asn cys trp pro
1941、 50 55 60
1942、leu asn thr leu leu arg phe ser tyr phe ser lys ile val ser asp
1943、65 70 75 80
1944、leu gln pro asn thr tyr thr phe phe phe asn ala asn ala leu ile
1945、 85 90 95
1946、val lys thr ile pro phe asp ile phe lys asn ala asn leu val gly
1947、 100 105 110
1948、val val his pro gly tyr lys asn lys met ser ile phe tyr pro trp
1949、 115 120 125
1950、glu arg lys lys ser ala val cys tyr leu ser tyr phe lys lys gly
1951、 130 135 140
1952、ile tyr phe gln gly cys phe asn gly gly arg thr glu tyr phe cys
1953、145 150 155 160
1954、asp leu ile lys thr
1955、 165
1956、<210> 30
1957、<211> 258
1958、<212> prt
1959、<213> selenomonas ruminantium
1960、<400> 30
1961、met lys ile ala ile leu tyr ile ala leu gly lys tyr asp val phe
1962、1 5 10 15
1963、trp lys asp phe tyr leu ser ala glu met his phe ile lys ser ile
1964、 20 25 30
1965、lys lys asp tyr tyr ile phe thr asp ala gln his ile tyr lys glu
1966、 35 40 45
1967、asp ala asp asn val lys lys ile pro gln glu asn leu gly trp pro
1968、 50 55 60
1969、gly asn thr leu phe arg phe asn ile phe leu asn met glu ser glu
1970、65 70 75 80
1971、leu glu lys tyr asp tyr ile phe phe phe asn ala asn tyr ile phe
1972、 85 90 95
1973、val lys asp ile asp val asp phe leu pro ile asn lys leu leu val
1974、 100 105 110
1975、val gln his pro gly tyr tyr asn lys arg val asn lys tyr pro tyr
1976、 115 120 125
1977、glu lys asn pro asn ser leu ala tyr val ser asn lys glu lys lys
1978、 130 135 140
1979、thr tyr val gln gly cys leu glu gly gly ser lys lys glu phe ile
1980、145 150 155 160
1981、asn leu ile arg asp leu ala gly asn ile lys asn asp tyr ser asn
1982、 165 170 175
1983、gly ile ile ala lys trp his asp glu ser his leu asn lys tyr ile
1984、 180 185 190
1985、cys ser his glu tyr lys leu met his pro gly tyr ala tyr pro glu
1986、 195 200 205
1987、gly trp glu ile pro tyr pro met glu ile met thr arg asp lys arg
1988、 210 215 220
1989、lys ile ala ser tyr asp val leu arg gly thr asn ser lys gly gly
1990、225 230 235 240
1991、lys ala ile leu lys lys ile lys ile arg leu ile asp ile met glu
1992、 245 250 255
1993、his phe
1994、<210> 31
1995、<211> 262
1996、<212> prt
1997、<213> smithella sp. sdb
1998、<400> 31
1999、met gln ile gly val leu tyr ile cys ile gly lys tyr ser ile phe
2000、1 5 10 15
2001、trp lys ser phe tyr glu ser ser glu lys his phe leu val his his
2002、 20 25 30
2003、gln lys lys tyr phe val phe thr asp ala gln ile ile asp tyr gln
2004、 35 40 45
2005、asp asn ala asn val val ile val phe gln lys asn leu gly trp pro
2006、 50 55 60
2007、asn asn thr leu met arg phe his ile phe leu arg his lys thr leu
2008、65 70 75 80
2009、leu gln glu met asp phe leu phe phe cys asn ala asn leu leu phe
2010、 85 90 95
2011、val asp asn val gly asp glu ile leu pro leu glu glu gly phe ala
2012、 100 105 110
2013、ala leu gln his pro gly tyr trp asn lys pro arg lys leu phe pro
2014、 115 120 125
2015、tyr glu thr asn pro met ser leu ala asn val pro ala his gln gly
2016、 130 135 140
2017、lys tyr tyr val met gly ala phe asn gly gly gln ala lys ile phe
2018、145 150 155 160
2019、leu lys met ser glu glu leu ser lys asn ile asp glu asp phe lys
2020、 165 170 175
2021、lys asn ile val ala val trp his asp glu ser his leu asn lys tyr
2022、 180 185 190
2023、val val asp lys lys val lys ile leu asn pro ser tyr gly tyr pro
2024、 195 200 205
2025、glu asp arg asp leu pro phe lys pro lys ile met ile arg asp lys
2026、 210 215 220
2027、ala lys tyr gly gly his asn leu leu arg gly ile pro glu asn ser
2028、225 230 235 240
2029、ser phe ile arg lys tyr phe arg glu ile lys ser phe ile ala lys
2030、 245 250 255
2031、tyr leu arg asn asn arg
2032、 260
2033、<210> 32
2034、<211> 243
2035、<212> prt
2036、<213> synechococcus phage acg-2014f
2037、<400> 32
2038、met lys lys val ala ile ile phe ile gly thr gly arg tyr leu glu
2039、1 5 10 15
2040、phe leu pro lys tyr tyr glu gln ala glu ala asn leu phe pro asp
2041、 20 25 30
2042、arg pro lys his tyr tyr val phe thr asp gly asp leu gly asn glu
2043、 35 40 45
2044、leu pro asp asn val thr val tyr glu gln glu his leu gln trp pro
2045、 50 55 60
2046、tyr ile thr leu tyr arg phe gly ile ile gln lys his leu glu glu
2047、65 70 75 80
2048、ile glu lys glu cys gly phe leu leu phe met asp ala asp thr gln
2049、 85 90 95
2050、val val ser pro val ser phe asp glu val phe lys lys gly lys pro
2051、 100 105 110
2052、tyr thr gly val his his pro cys his ala leu asn met pro pro his
2053、 115 120 125
2054、asn glu phe pro gly ser leu glu thr asn thr ala ser lys ala ala
2055、 130 135 140
2056、cys lys pro gly asp asp phe ser val tyr trp gln gly cys val trp
2057、145 150 155 160
2058、gly gly asn ile lys gly ala arg lys ile ile asp thr leu his his
2059、 165 170 175
2060、arg thr lys gln asp glu glu asn gly ile val ala leu trp his asp
2061、 180 185 190
2062、glu ser his ile asn arg tyr phe leu asp asn lys asp lys val asn
2063、 195 200 205
2064、thr leu ser pro ser phe ala tyr pro glu ser phe thr glu tyr met
2065、 210 215 220
2066、glu asp tyr glu pro lys ile val his leu ala lys glu asn ser lys
2067、225 230 235 240
2068、tyr gln val
2069、<210> 33
2070、<211> 243
2071、<212> prt
2072、<213> synechococcus phage acg-2014f
2073、<400> 33
2074、met lys lys val ala ile ile phe ile gly thr gly arg tyr leu glu
2075、1 5 10 15
2076、phe leu pro lys tyr tyr glu gln ala glu ala asn leu phe pro asp
2077、 20 25 30
2078、arg pro lys his tyr tyr val phe thr asp gly asp leu gly asn glu
2079、 35 40 45
2080、leu pro asp asn val thr val tyr glu gln glu his leu gln trp pro
2081、 50 55 60
2082、tyr ile thr leu tyr arg phe gly ile ile gln lys his leu glu glu
2083、65 70 75 80
2084、ile glu lys glu cys gly phe leu leu phe met asp ala asp thr gln
2085、 85 90 95
2086、val val ser pro val ser phe asp glu val phe lys lys gly lys pro
2087、 100 105 110
2088、tyr thr gly val his his pro cys his ala leu asn met pro pro his
2089、 115 120 125
2090、asn glu phe pro gly ser leu glu thr asn thr ala ser lys ala ala
2091、 130 135 140
2092、cys lys pro gly asp asp phe ser val tyr trp gln gly cys val trp
2093、145 150 155 160
2094、gly gly asn ile lys gly ala arg lys ile ile asp thr leu his his
2095、 165 170 175
2096、arg thr lys gln asp glu glu asn gly ile ile ala lys trp his asp
2097、 180 185 190
2098、glu ser his ile asn arg tyr phe leu asp asn lys asp lys val asn
2099、 195 200 205
2100、thr leu ser pro ser phe ala tyr pro glu ser phe thr glu tyr met
2101、 210 215 220
2102、glu asp tyr glu pro lys ile val his leu ala lys glu asn ser lys
2103、225 230 235 240
2104、tyr gln val
2105、<210> 34
2106、<211> 243
2107、<212> prt
2108、<213> synechococcus phage acg-2014f
2109、<400> 34
2110、met lys lys val ala ile ile phe ile gly thr asp arg tyr leu glu
2111、1 5 10 15
2112、phe leu pro lys tyr tyr glu gln ala glu ala asn leu phe pro asp
2113、 20 25 30
2114、arg pro lys his tyr tyr val phe thr asp gly asp leu gly asn glu
2115、 35 40 45
2116、leu pro asp asn val thr val tyr glu gln glu his leu gln trp pro
2117、 50 55 60
2118、tyr ile thr leu tyr arg phe gly ile ile gln lys his leu glu glu
2119、65 70 75 80
2120、ile glu lys glu cys gly phe leu leu phe met asp ala asp thr gln
2121、 85 90 95
2122、val val ser pro val ser phe asp glu val phe lys lys gly lys pro
2123、 100 105 110
2124、tyr thr gly val his his pro cys his ala leu asn met pro pro his
2125、 115 120 125
2126、asn glu phe pro gly ser leu glu thr asn thr ala ser lys ala ala
2127、 130 135 140
2128、cys lys pro gly asp asp phe ser val tyr trp gln gly cys val trp
2129、145 150 155 160
2130、gly gly asn ile lys gly ala arg lys ile ile asp thr leu his his
2131、 165 170 175
2132、arg thr lys gln asp glu glu asn gly ile ile ala lys trp his asp
2133、 180 185 190
2134、glu ser his ile asn arg tyr phe leu asp asn lys asp lys val asn
2135、 195 200 205
2136、thr leu ser pro ser phe ala tyr pro glu ser phe thr glu tyr met
2137、 210 215 220
2138、glu asp tyr glu pro lys ile val his leu ala lys glu asn ser lys
2139、225 230 235 240
2140、tyr gln val
2141、<210> 35
2142、<211> 238
2143、<212> prt
2144、<213> synechococcus phage bellamy
2145、<400> 35
2146、met lys leu ala val val phe ile gly thr gly asp tyr ile asn phe
2147、1 5 10 15
2148、leu pro ser tyr tyr glu ala cys glu glu phe leu val pro asn thr
2149、 20 25 30
2150、glu lys thr tyr phe val phe thr asp gly asp ile gly asp pro pro
2151、 35 40 45
2152、glu asn val lys leu tyr glu gln glu his leu pro trp pro tyr ile
2153、 50 55 60
2154、thr leu glu arg phe lys tyr ile leu lys ala glu ser asp leu ala
2155、65 70 75 80
2156、glu phe asp tyr val leu phe leu asp ala asp thr arg val val glu
2157、 85 90 95
2158、thr val thr glu glu glu leu phe thr asp lys lys tyr ile gly val
2159、 100 105 110
2160、his his pro cys his phe leu gly met pro pro his asp asn pro pro
2161、 115 120 125
2162、gly ala phe glu thr arg phe glu ser ala ala gly ile ser gly asp
2163、 130 135 140
2164、asp asp thr ser ile tyr phe gln gly cys leu trp gly gly lys met
2165、145 150 155 160
2166、pro tyr val leu asp met ile arg glu leu ala gln arg thr gln phe
2167、 165 170 175
2168、asp leu asn arg asp val ile ala gln trp his asp glu ser gln met
2169、 180 185 190
2170、asn lys phe phe cys glu arg arg glu asp val his val met gly pro
2171、 195 200 205
2172、glu tyr ala tyr pro glu cys phe gly ala tyr cys thr phe glu pro
2173、 210 215 220
2174、lys ile val his leu ala lys asp asn ser lys tyr gln gln
2175、225 230 235
2176、<210> 36
2177、<211> 238
2178、<212> prt
2179、<213> synechococcus phage s-cam9
2180、<400> 36
2181、met lys val ala val val phe ile gly thr glu lys tyr leu asp phe
2182、1 5 10 15
2183、leu pro ser trp tyr glu arg cys glu glu asn phe leu pro gly val
2184、 20 25 30
2185、glu lys lys tyr leu val phe thr asp gly asp val pro glu ser pro
2186、 35 40 45
2187、asp asn ala val val tyr lys gln glu his leu asp trp pro tyr ile
2188、 50 55 60
2189、thr leu tyr arg phe lys ile ile gln lys ala leu asp glu ile val
2190、65 70 75 80
2191、gly cys asp trp leu val phe leu asp ala asp met ala val val asp
2192、 85 90 95
2193、thr val thr ala pro glu ile phe thr asp lys pro tyr ile gly val
2194、 100 105 110
2195、his his pro cys his phe leu lys phe pro pro his asn gln pro pro
2196、 115 120 125
2197、gly ser phe glu thr asn pro leu ser thr ala lys val pro asp asp
2198、 130 135 140
2199、tyr asp phe ser ile tyr trp gln gly cys leu trp gly gly lys thr
2200、145 150 155 160
2201、ser glu val ile ser met met glu glu leu asn ala arg ile ser leu
2202、 165 170 175
2203、asp glu glu asn asn val ile ala gln trp his asp glu ser his leu
2204、 180 185 190
2205、asn ala phe tyr ala gln asn lys asn leu val his thr leu gly pro
2206、 195 200 205
2207、glu phe ala phe pro glu val phe ala glu ala cys glu phe gln ala
2208、 210 215 220
2209、lys ile val his leu ala lys asp asn ser lys tyr his val
2210、225 230 235
2211、<210> 37
2212、<211> 236
2213、<212> prt
2214、<213> yersinia kristensenii
2215、<400> 37
2216、met thr val asn ile leu tyr val cys thr gly asn tyr phe ser phe
2217、1 5 10 15
2218、phe lys asp phe tyr val ser cys glu lys leu phe leu pro asp cys
2219、 20 25 30
2220、lys lys lys tyr phe val phe thr asp ile asp thr ser ser phe asp
2221、 35 40 45
2222、ile asn asp asp ile glu tyr ile lys ile glu lys asn cys trp pro
2223、 50 55 60
2224、leu asn thr leu leu arg phe ser tyr phe asn ile val arg asn lys
2225、65 70 75 80
2226、ile leu lys ser asp tyr val phe phe phe asn ala asn ala leu ile
2227、 85 90 95
2228、val lys glu phe ser ser asp leu leu pro thr glu asp glu asn tyr
2229、 100 105 110
2230、leu val gly val val his pro gly tyr glu asn lys pro ser phe leu
2231、 115 120 125
2232、tyr pro trp glu arg arg ile lys ser gln cys arg ile gly tyr leu
2233、 130 135 140
2234、cys lys gly thr tyr tyr gln gly cys phe ser gly gly arg thr asn
2235、145 150 155 160
2236、glu tyr val asp leu ile asp thr cys arg leu asn thr glu lys asp
2237、 165 170 175
2238、leu lys lys asn ile ile ala lys val his asp glu ser tyr leu asn
2239、 180 185 190
2240、his tyr phe lys asn lys lys pro lys ser leu ser ser leu tyr ser
2241、 195 200 205
2242、trp pro glu lys tyr gly asp asn glu asn ala ile ile ile met arg
2243、 210 215 220
2244、asp lys glu lys tyr glu trp tyr ser leu ile lys
2245、225 230 235
2246、<210> 38
2247、<211> 9
2248、<212> prt
2249、<213> 人工序列
2250、<220>
2251、<223> motif 1
2252、<220>
2253、<221> unsure
2254、<222> (2)..(2)
2255、<223> xaa可为任何自然发生氨基酸
2256、<220>
2257、<221> variant
2258、<222> (3)..(3)
2259、<223> xaa可为ala, cys, ile或leu
2260、<220>
2261、<221> unsure
2262、<222> (4)..(4)
2263、<223> xaa可为任何自然发生氨基酸
2264、<220>
2265、<221> unsure
2266、<222> (6)..(7)
2267、<223> xaa可为任何自然发生氨基酸
2268、<220>
2269、<221> variant
2270、<222> (8)..(9)
2271、<223> xaa可为ala, cys或gly
2272、<400> 38
2273、tyr xaa xaa xaa gly xaa xaa xaa xaa
2274、1 5
2275、<210> 39
2276、<211> 9
2277、<212> prt
2278、<213> 人工序列
2279、<220>
2280、<223> motif 2
2281、<220>
2282、<221> unsure
2283、<222> (2)..(2)
2284、<223> xaa可为任何自然发生氨基酸
2285、<220>
2286、<221> variant
2287、<222> (3)..(3)
2288、<223> xaa可为ala或gly
2289、<220>
2290、<221> unsure
2291、<222> (4)..(4)
2292、<223> xaa可为任何自然发生氨基酸
2293、<220>
2294、<221> unsure
2295、<222> (6)..(7)
2296、<223> xaa可为任何自然发生氨基酸
2297、<220>
2298、<221> variant
2299、<222> (8)..(9)
2300、<223> xaa可为ala, cys或gly
2301、<400> 39
2302、tyr xaa xaa xaa ala xaa xaa xaa xaa
2303、1 5
2304、<210> 40
2305、<211> 306
2306、<212> prt
2307、<213> helicobacter mustelae
2308、<400> 40
2309、met gln ser thr ala gln asn thr gln gln asn thr his phe ala gly
2310、1 5 10 15
2311、ser ser gln thr thr pro gln ala ala gln ser val gln gln ala ser
2312、 20 25 30
2313、leu ala leu pro lys ser ser pro thr cys tyr lys ile ala ile leu
2314、 35 40 45
2315、tyr ile cys thr gly ala tyr ser ile phe trp gln asp phe tyr asp
2316、 50 55 60
2317、ser ala lys val his leu leu pro ala his arg leu thr tyr phe val
2318、65 70 75 80
2319、phe thr asp ala asp ser leu tyr ala glu glu ala ser asp val arg
2320、 85 90 95
2321、lys ile tyr gln glu asn leu gly trp pro phe asn thr leu lys arg
2322、 100 105 110
2323、phe glu met phe leu gly gln glu glu ala leu arg glu phe asp phe
2324、 115 120 125
2325、val phe phe phe asn ala asn cys leu phe phe gln his ile gly asp
2326、 130 135 140
2327、glu phe leu pro ile glu glu asp ile leu val thr gln his tyr gly
2328、145 150 155 160
2329、phe arg asp ala ser pro glu cys phe thr tyr glu arg asn pro lys
2330、 165 170 175
2331、ser leu ala tyr val pro phe gly lys gly lys ala tyr val tyr gly
2332、 180 185 190
2333、ser thr asn gly gly lys ala gly ala phe leu ala leu ala arg thr
2334、 195 200 205
2335、leu gln glu arg ile gln glu asp leu ser arg gly ile ile ala ile
2336、 210 215 220
2337、trp his asp glu ser his leu asn ala tyr ile ile asp his pro asn
2338、225 230 235 240
2339、tyr lys met leu asp tyr gly tyr gly phe pro glu gly tyr gly arg
2340、 245 250 255
2341、val pro gly gly gly val tyr ile phe leu arg asp lys ser arg val
2342、 260 265 270
2343、ile asp val asn ala ile lys gly met gly ser pro ala asn arg arg
2344、 275 280 285
2345、leu lys asn ala leu arg lys leu lys his phe ser lys arg leu leu
2346、 290 295 300
2347、gly arg
2348、305
2349、<210> 41
2350、<211> 268
2351、<212> prt
2352、<213> clostridium bolteae 90a9
2353、<400> 41
2354、met thr lys ile ala ile leu tyr ile cys ile gly lys tyr asp thr
2355、1 5 10 15
2356、phe trp lys asp phe tyr ile ser phe glu glu arg phe met thr glu
2357、 20 25 30
2358、cys glu lys glu tyr phe val phe thr asp ser lys phe ile tyr gly
2359、 35 40 45
2360、glu asn val thr glu arg ile his arg ile his gln glu asn leu gly
2361、 50 55 60
2362、trp pro gly asn thr leu phe arg phe lys met phe leu gln ile ile
2363、65 70 75 80
2364、pro glu leu lys lys phe asp tyr thr phe phe met asn ala asn val
2365、 85 90 95
2366、ile cys lys glu arg val thr glu glu met met leu pro lys asp glu
2367、 100 105 110
2368、lys leu val val val gln his pro gly tyr tyr lys gln lys pro tyr
2369、 115 120 125
2370、glu phe glu tyr asp arg asn arg lys ser lys ala tyr ile pro tyr
2371、 130 135 140
2372、tyr lys gly glu val tyr ile cys gly gly ile asn gly gly arg thr
2373、145 150 155 160
2374、glu ala tyr ile glu leu ile lys thr leu asn lys asn ile asn ser
2375、 165 170 175
2376、asp ile glu asn gly ile ile ala arg trp his asp glu ser his ile
2377、 180 185 190
2378、asn arg tyr ile leu asp asn thr cys tyr lys leu leu ser pro ala
2379、 195 200 205
2380、tyr cys tyr pro glu asn trp asp ile pro phe thr pro ile leu val
2381、 210 215 220
2382、val leu asp lys lys asp arg ile cys leu asp ser ala lys thr ala
2383、225 230 235 240
2384、glu gln cys ala asp ile phe phe leu glu lys ile lys lys gln phe
2385、 245 250 255
2386、ile gln phe phe trp lys leu ile tyr ile leu lys
2387、 260 265
2388、<210> 42
2389、<211> 786
2390、<212> prt
2391、<213> akkermansia muciniphila
2392、<400> 42
2393、met lys cys val leu ile val ser pro gly glu lys ser glu gly ala
2394、1 5 10 15
2395、ser glu leu his arg met gly tyr glu leu glu leu tyr pro ser thr
2396、 20 25 30
2397、ala asp leu ser pro leu arg asp ala arg glu glu glu ser ala ser
2398、 35 40 45
2399、tyr leu gly arg ser pro ala ser ala glu arg ser his val arg ser
2400、 50 55 60
2401、leu arg ala ser phe ile arg leu leu glu asp arg asn tyr ala gly
2402、65 70 75 80
2403、ser asp leu ile ile phe gly glu ser asp ala val pro met val ala
2404、 85 90 95
2405、ser ser arg leu glu thr ala leu arg lys glu met lys glu his pro
2406、 100 105 110
2407、glu thr asp ile phe arg leu phe his his ala val trp ser pro gln
2408、 115 120 125
2409、gly ala pro gly glu ser asp glu ile leu phe glu asp phe lys thr
2410、 130 135 140
2411、gly lys thr asp ala asn thr ser tyr val trp gly thr his ala leu
2412、145 150 155 160
2413、val ile pro ala ala arg arg pro arg val ala arg val phe ala asp
2414、 165 170 175
2415、tyr arg leu pro thr asp ile ala leu glu ala ala asn ser his gly
2416、 180 185 190
2417、asp leu lys ile arg val ala arg his asn leu phe tyr gln his glu
2418、 195 200 205
2419、arg thr lys gln arg pro asp cys lys ile ala val cys leu ser ser
2420、 210 215 220
2421、tyr lys arg leu thr asp leu gln arg gln ile trp cys met met asp
2422、225 230 235 240
2423、gln ser tyr pro asn leu his val phe ala ala val lys gly ile pro
2424、 245 250 255
2425、glu gly thr tyr arg arg thr val leu pro leu phe glu his phe ile
2426、 260 265 270
2427、his glu gly arg leu thr met arg leu phe pro asn lys asn gln leu
2428、 275 280 285
2429、ser asn phe leu asp thr ile arg asp leu asn val ser asp tyr asp
2430、 290 295 300
2431、leu phe ala lys ile asp asp asp asp leu tyr gly arg asp tyr phe
2432、305 310 315 320
2433、lys ser val asn lys phe his leu his leu pro pro glu phe ser ser
2434、 325 330 335
2435、phe tyr cys gly pro gly glu tyr leu ser val arg gly gly tyr pro
2436、 340 345 350
2437、phe ser gly asn gly phe phe gly cys phe gly pro thr leu val leu
2438、 355 360 365
2439、ser arg asp val leu glu lys leu ile ile cys glu thr asn pro his
2440、 370 375 380
2441、met ile ser gln ile ser pro arg leu arg his ala gly tyr gly phe
2442、385 390 395 400
2443、thr glu asp asn phe met his met met met leu asp thr gly ser ser
2444、 405 410 415
2445、asn arg thr arg tyr val gln glu met ala leu pro met his leu ala
2446、 420 425 430
2447、ile gln thr gly asn ala ser val met arg gly gly leu val pro gly
2448、 435 440 445
2449、asp phe arg gly arg asn trp asn ile ser thr asn gln val asn glu
2450、 450 455 460
2451、glu arg leu met glu val tyr his pro gln trp his asp ile val arg
2452、465 470 475 480
2453、val phe gly asn arg ala arg arg phe glu arg asp asp glu ala asp
2454、 485 490 495
2455、val leu ser val thr asp glu lys ile thr leu lys trp asp cys trp
2456、 500 505 510
2457、gly val glu ala phe lys lys met glu asp gly thr phe tyr leu ser
2458、 515 520 525
2459、ser gly gly arg gln glu glu pro phe ser pro arg lys lys val ala
2460、 530 535 540
2461、val leu phe ile ala thr gly arg tyr met thr phe trp glu glu phe
2462、545 550 555 560
2463、tyr ala ala ser lys gln tyr phe leu thr gly his asp val his tyr
2464、 565 570 575
2465、phe leu phe thr asp his pro glu val glu thr gly asp asp val thr
2466、 580 585 590
2467、leu val arg lys pro phe tyr pro trp pro met glu thr leu arg arg
2468、 595 600 605
2469、phe glu thr phe leu thr val arg glu glu leu gln gln tyr asp tyr
2470、 610 615 620
2471、ile tyr phe met asn gly thr leu leu pro val gly pro val gly gln
2472、625 630 635 640
2473、glu ile phe pro met asn arg gln gly leu met val thr leu his pro
2474、 645 650 655
2475、gly tyr tyr gln arg pro arg ser thr tyr pro tyr glu lys asn gly
2476、 660 665 670
2477、met ser arg ala arg val leu his ser glu gly glu tyr tyr val ala
2478、 675 680 685
2479、gly gly phe asn gly gly arg ala glu asp tyr leu arg met cys arg
2480、 690 695 700
2481、glu leu ala asp ala val arg arg asp leu glu asp gly val ile ala
2482、705 710 715 720
2483、val trp his asp glu ser his leu asn lys tyr val ile gly arg his
2484、 725 730 735
2485、pro leu val leu ser pro glu tyr leu phe pro glu thr leu asp phe
2486、 740 745 750
2487、asn gln lys asn leu met ala ile lys pro lys val lys met ile val
2488、 755 760 765
2489、lys asp lys ser leu gln lys his gly gly his ala trp leu arg gln
2490、 770 775 780
2491、gln ile
2492、785
2493、<210> 43
2494、<211> 786
2495、<212> prt
2496、<213> akkermansia muciniphila
2497、<400> 43
2498、met lys cys val leu ile val ser pro gly glu lys ser glu gly ala
2499、1 5 10 15
2500、ser glu leu his arg met gly tyr glu leu glu leu tyr pro ser thr
2501、 20 25 30
2502、ala asp leu ser pro leu arg asp ala arg glu glu glu ser ala ser
2503、 35 40 45
2504、tyr leu gly arg ser pro ala ser ala glu arg ser his val arg ser
2505、 50 55 60
2506、leu arg ala ser phe ile arg leu leu glu asp arg asn tyr ala gly
2507、65 70 75 80
2508、ser asp leu ile ile phe gly glu ser asp ala val pro met val ala
2509、 85 90 95
2510、ser ser arg leu glu thr ala leu arg lys glu met lys glu his pro
2511、 100 105 110
2512、glu thr asp ile phe arg leu phe his his ala val trp ser pro gln
2513、 115 120 125
2514、gly ala pro gly glu ser asp glu ile leu phe glu asp phe lys thr
2515、 130 135 140
2516、gly lys thr asp ala asn thr ser tyr val trp gly thr his ala leu
2517、145 150 155 160
2518、val ile pro ala ala arg arg pro arg val ala arg val phe ala asp
2519、 165 170 175
2520、tyr arg leu pro thr asp ile ala leu glu ala ala asn ser his gly
2521、 180 185 190
2522、asp leu lys ile arg val ala arg his asn leu phe tyr gln his glu
2523、 195 200 205
2524、arg thr lys gln arg pro asp cys lys ile ala val cys leu ser ser
2525、 210 215 220
2526、tyr lys arg leu thr asp leu gln arg gln ile trp cys met met asp
2527、225 230 235 240
2528、gln ser tyr pro asn leu his val phe ala ala val lys gly ile pro
2529、 245 250 255
2530、glu gly thr tyr arg arg thr val leu pro leu phe glu his phe ile
2531、 260 265 270
2532、his glu gly arg leu thr met arg leu phe pro asn lys asn gln leu
2533、 275 280 285
2534、ser asn phe leu asp thr ile arg asp leu asn val ser asp tyr asp
2535、 290 295 300
2536、leu phe ala lys ile asp asp asp asp leu tyr gly arg asp tyr phe
2537、305 310 315 320
2538、lys ser val asn lys phe his leu his leu pro pro glu phe ser ser
2539、 325 330 335
2540、phe tyr cys gly pro gly glu tyr leu ser val arg gly gly tyr pro
2541、 340 345 350
2542、phe ser gly asn gly phe phe gly cys phe gly pro thr leu val leu
2543、 355 360 365
2544、ser trp asp val leu glu lys leu ile ile cys glu thr asn pro his
2545、 370 375 380
2546、met ile ser gln ile ser pro arg leu arg his ala gly tyr gly phe
2547、385 390 395 400
2548、thr glu asp asn phe met his met met met leu asp thr gly ser ser
2549、 405 410 415
2550、asn arg thr arg tyr val gln glu met ala leu pro met his leu ala
2551、 420 425 430
2552、ile gln thr gly asn ala ser val met arg gly gly leu val pro gly
2553、 435 440 445
2554、asp phe arg gly arg asn trp asn ile ser thr asn gln val asn glu
2555、 450 455 460
2556、glu arg leu met glu val his his pro gln trp his asp ile val arg
2557、465 470 475 480
2558、val phe gly asn arg ala arg arg phe glu arg asp asp glu ala asp
2559、 485 490 495
2560、val leu ser val thr asp glu lys ile thr leu lys trp asp cys trp
2561、 500 505 510
2562、gly val glu ala phe lys lys met glu asp gly thr phe tyr leu ser
2563、 515 520 525
2564、ser gly gly arg gln glu glu pro phe ser pro arg lys lys val ala
2565、 530 535 540
2566、val leu phe ile ala thr gly arg tyr met thr phe trp glu glu phe
2567、545 550 555 560
2568、tyr ala ala ser lys gln tyr phe leu thr gly his asp val his tyr
2569、 565 570 575
2570、phe leu phe thr asp his pro glu val glu thr gly asp asp val thr
2571、 580 585 590
2572、leu val arg lys pro phe tyr pro trp pro met glu thr leu arg arg
2573、 595 600 605
2574、phe glu thr phe leu thr val arg glu glu leu gln gln tyr asp tyr
2575、 610 615 620
2576、ile tyr phe met asn gly thr leu leu pro val gly pro val gly gln
2577、625 630 635 640
2578、glu ile phe pro met asp arg gln gly leu met val thr leu his pro
2579、 645 650 655
2580、gly tyr tyr gln arg pro arg ser thr tyr pro tyr glu lys asn gly
2581、 660 665 670
2582、met ser arg ala arg val leu his ser glu gly glu tyr tyr val ala
2583、 675 680 685
2584、gly gly phe asn gly gly arg ala glu asp tyr leu arg met cys arg
2585、 690 695 700
2586、glu leu ala asp ala val arg arg asp leu glu asp gly val ile ala
2587、705 710 715 720
2588、val trp his asp glu ser his leu asn lys tyr val ile gly arg his
2589、 725 730 735
2590、pro leu val leu ser pro glu tyr leu phe pro glu thr leu asp phe
2591、 740 745 750
2592、asn gln lys asn leu met ala ile lys pro lys val lys met ile val
2593、 755 760 765
2594、lys asp lys ser leu gln lys his gly gly his ala trp leu arg gln
2595、 770 775 780
2596、gln ile
2597、785
2598、<210> 44
2599、<211> 787
2600、<212> prt
2601、<213> akkermansia sp. bioml-a61
2602、<400> 44
2603、met lys cys val leu ile ile ser ser gly glu met ala glu gly ala
2604、1 5 10 15
2605、ser glu leu his arg met gly tyr glu leu glu leu tyr pro ser thr
2606、 20 25 30
2607、arg asp leu ser ser leu lys asp thr arg glu lys glu ser ala ala
2608、 35 40 45
2609、phe ile gly arg asp pro cys ser ala glu arg ser his val arg ser
2610、 50 55 60
2611、leu arg ala ser phe ile arg met leu glu asp arg arg tyr ala gly
2612、65 70 75 80
2613、asn asp leu ile ile phe gly glu ser asp ala val pro met val ala
2614、 85 90 95
2615、ser ser arg leu glu ala ala leu arg lys glu met lys glu his pro
2616、 100 105 110
2617、glu thr asp ile phe arg leu phe his his ala val trp ser pro gln
2618、 115 120 125
2619、gly asn pro phe glu ser asp glu leu leu phe glu asp phe lys thr
2620、 130 135 140
2621、gly lys thr asp phe asn thr pro tyr val trp gly thr his ala met
2622、145 150 155 160
2623、val ile pro ser cys lys arg glu lys val ile gln val phe ala asp
2624、 165 170 175
2625、tyr arg leu pro thr asp ile ala leu glu ala ala asn ser asn gly
2626、 180 185 190
2627、glu leu his ile arg val ala arg his asn leu phe tyr gln his glu
2628、 195 200 205
2629、arg thr lys lys arg pro ala cys arg ile ala ala cys leu ser ser
2630、 210 215 220
2631、tyr arg arg leu thr asp leu gln arg gln ile trp cys met met asp
2632、225 230 235 240
2633、gln ser tyr glu asn phe his val phe ala ala val lys gly ile pro
2634、 245 250 255
2635、glu ala thr tyr arg lys thr val leu pro leu phe glu his phe ile
2636、 260 265 270
2637、gln glu gly arg leu thr met arg leu phe pro asn lys asn gln leu
2638、 275 280 285
2639、ser asn phe leu asp ala ile arg asp leu asp ile ser asp tyr asp
2640、 290 295 300
2641、leu phe ala lys ile asp asp asp asp leu tyr gly arg asp tyr phe
2642、305 310 315 320
2643、lys ser ile asn asp phe his gln his leu pro arg glu phe ser ser
2644、 325 330 335
2645、tyr tyr cys gly phe gly gln tyr leu asn ala arg gly gly tyr pro
2646、 340 345 350
2647、leu cys gly asn gly phe phe ser cys phe gly pro thr met val phe
2648、 355 360 365
2649、ser arg asp val leu glu lys leu ile thr cys glu gln asp pro gly
2650、 370 375 380
2651、arg ile ser glu ile ser pro arg leu gly his ser gly tyr gly phe
2652、385 390 395 400
2653、thr glu asp asn leu met his lys leu met ile asp thr gly ser cys
2654、 405 410 415
2655、asn arg ile arg tyr val gln glu met ser leu pro met his leu val
2656、 420 425 430
2657、ile gln thr asn asn ala ser val met arg gly gly leu val pro gly
2658、 435 440 445
2659、asp phe arg gly arg asn trp gln ile ser his ser arg phe asn ala
2660、 450 455 460
2661、glu ser phe met glu ile gly his pro gln trp tyr asp ile val arg
2662、465 470 475 480
2663、ile phe gly gly arg ala cys arg phe gln arg asn asp trp ala asp
2664、 485 490 495
2665、val leu ser leu thr asp glu glu val thr leu lys trp asp gln trp
2666、 500 505 510
2667、gly thr glu thr phe arg arg arg asp asp gly ser phe phe leu ser
2668、 515 520 525
2669、gly asn gly glu gln gln asn ser pro ser ser gln arg lys lys val
2670、 530 535 540
2671、ala val leu tyr ile ala thr gly arg tyr met ala phe trp lys asp
2672、545 550 555 560
2673、phe tyr ala ala ala lys gln tyr phe leu pro gly his asp val arg
2674、 565 570 575
2675、tyr phe leu phe thr asp his asn glu val lys thr pro asp asp val
2676、 580 585 590
2677、thr leu val ile lys pro phe tyr pro trp pro met glu thr leu arg
2678、 595 600 605
2679、arg phe glu thr phe leu ser val gln lys glu leu gln glu tyr asp
2680、 610 615 620
2681、tyr ile tyr phe met asn gly thr leu leu pro val ser pro ile gly
2682、625 630 635 640
2683、glu glu ile phe pro asn asp arg gln gly ile ala val thr leu his
2684、 645 650 655
2685、pro gly tyr tyr gly asn thr arg ser cys tyr pro tyr glu lys asn
2686、 660 665 670
2687、gly met ser glu ala arg ile leu pro glu gln gly glu tyr tyr val
2688、 675 680 685
2689、ala gly gly phe asn gly gly arg thr lys asp phe leu ser met cys
2690、 690 695 700
2691、arg glu leu ala gly ala val lys arg asp leu asp asn gly ile ile
2692、705 710 715 720
2693、ala val trp his asp glu ser his leu asn lys tyr val val gly arg
2694、 725 730 735
2695、his pro leu val leu gly pro glu tyr leu phe pro glu thr leu val
2696、 740 745 750
2697、phe asn arg tyr tyr leu met gly leu lys his arg val lys ile leu
2698、 755 760 765
2699、val lys asp lys ser leu ser lys tyr gly gly his ala trp leu arg
2700、 770 775 780
2701、lys leu val
2702、785
2703、<210> 45
2704、<211> 786
2705、<212> prt
2706、<213> akkermansia sp. cag:344
2707、<400> 45
2708、met lys cys val leu ile val ser ser gly glu lys ser glu gly ala
2709、1 5 10 15
2710、ser glu leu his arg met gly tyr glu leu glu leu tyr pro ser thr
2711、 20 25 30
2712、ala asp leu ser pro leu arg asp ala arg glu glu glu ser ala ser
2713、 35 40 45
2714、tyr leu gly arg ser pro ala ser ala glu arg ser his val arg ser
2715、 50 55 60
2716、leu arg ala ser phe ile arg leu leu glu asp arg asn tyr ala gly
2717、65 70 75 80
2718、ser asp leu ile ile phe gly glu ser asp ala val pro met val ala
2719、 85 90 95
2720、ser ser arg leu glu thr ala leu arg lys glu met lys glu his pro
2721、 100 105 110
2722、glu thr asp ile phe arg leu phe his his ala val trp ser pro gln
2723、 115 120 125
2724、gly ala pro gly glu ser asp glu ile leu phe glu asp phe lys thr
2725、 130 135 140
2726、gly lys thr asp ala asn thr ser tyr val trp gly thr his ala leu
2727、145 150 155 160
2728、val ile pro ala ala arg arg pro arg val ala arg val phe ala asp
2729、 165 170 175
2730、tyr arg leu pro thr asp ile ala leu glu ala ala asn ser his gly
2731、 180 185 190
2732、asp leu lys ile arg val ala arg his asn leu phe tyr gln his glu
2733、 195 200 205
2734、arg thr lys gln arg pro asp cys lys ile ala val cys leu ser ser
2735、 210 215 220
2736、tyr lys arg leu thr asp leu gln arg gln ile trp cys met met asp
2737、225 230 235 240
2738、gln ser tyr pro asn leu his val phe ala ala val lys gly ile pro
2739、 245 250 255
2740、glu gly thr tyr arg arg thr val leu pro leu phe glu his phe ile
2741、 260 265 270
2742、his glu gly arg leu thr met arg leu phe pro asn lys asn gln leu
2743、 275 280 285
2744、ser asn phe leu asp thr ile arg asp leu asn val ser asp tyr asp
2745、 290 295 300
2746、leu phe ala lys ile asp asp asp asp leu tyr gly arg asp tyr phe
2747、305 310 315 320
2748、lys ser val asn lys phe his leu his leu pro pro glu phe ser ser
2749、 325 330 335
2750、phe tyr cys gly pro gly glu tyr leu ser val arg gly gly tyr pro
2751、 340 345 350
2752、phe ser gly asn gly phe phe gly cys phe gly pro thr leu val leu
2753、 355 360 365
2754、ser arg asp val leu glu lys leu ile ile cys glu thr asn pro his
2755、 370 375 380
2756、met ile ser gln ile ser pro arg leu arg his ala gly tyr gly phe
2757、385 390 395 400
2758、thr glu asp asn phe met his met met met leu asp thr gly ser ser
2759、 405 410 415
2760、asn arg thr arg tyr val gln glu met ala leu pro met his leu ala
2761、 420 425 430
2762、ile gln thr gly asn ala ser val met arg gly gly leu val pro gly
2763、 435 440 445
2764、asp phe arg gly arg asn trp asn ile ser thr asn gln val asn glu
2765、 450 455 460
2766、glu arg leu met glu val his his pro gln trp his asp ile val arg
2767、465 470 475 480
2768、val phe gly asn arg ala arg arg phe glu arg asp asp glu ala asp
2769、 485 490 495
2770、val leu ser val thr asp glu lys ile thr leu lys trp asp cys trp
2771、 500 505 510
2772、gly val glu ala phe lys lys met glu asp gly thr phe tyr leu ser
2773、 515 520 525
2774、ser gly gly arg gln glu glu pro phe ser pro arg lys lys val ala
2775、 530 535 540
2776、val leu phe ile ala thr gly arg tyr met thr phe trp glu glu phe
2777、545 550 555 560
2778、tyr ala ala ser lys gln tyr phe leu thr gly his asp val his tyr
2779、 565 570 575
2780、phe leu phe thr asp his pro glu val glu thr gly asp asp val thr
2781、 580 585 590
2782、leu val arg lys pro phe tyr pro trp pro met glu thr leu arg arg
2783、 595 600 605
2784、phe glu thr phe leu thr val arg glu glu leu gln gln tyr asp tyr
2785、 610 615 620
2786、ile tyr phe met asn gly thr leu leu pro val gly pro val gly gln
2787、625 630 635 640
2788、glu ile phe pro met asn arg gln gly leu met val thr leu his pro
2789、 645 650 655
2790、gly tyr tyr gln arg pro arg ser thr tyr pro tyr glu lys asn gly
2791、 660 665 670
2792、met ser arg ala arg val leu his ser glu gly glu tyr tyr val ala
2793、 675 680 685
2794、gly gly phe asn gly gly arg ala glu asp tyr leu arg met cys arg
2795、 690 695 700
2796、glu leu ala asp ala val arg arg asp leu glu asp gly val ile ala
2797、705 710 715 720
2798、val trp his asp glu ser his leu asn lys tyr val ile gly arg his
2799、 725 730 735
2800、pro leu val leu ser pro glu tyr leu phe pro glu thr leu asp phe
2801、 740 745 750
2802、asn gln lys asn leu met ala ile lys pro lys val lys met ile val
2803、 755 760 765
2804、lys asp lys ser leu gln lys his gly gly his ala trp leu arg gln
2805、 770 775 780
2806、gln ile
2807、785
2808、<210> 46
2809、<211> 787
2810、<212> prt
2811、<213> akkermansia sp. kle1798
2812、<400> 46
2813、met lys cys val leu ile val ser ser gly glu met ala glu gly ala
2814、1 5 10 15
2815、ser glu leu his arg met gly tyr glu leu glu leu tyr pro ser thr
2816、 20 25 30
2817、arg asp leu ser ser leu lys asp thr arg glu lys glu ser ala ala
2818、 35 40 45
2819、phe ile gly arg asp pro cys ser ala glu arg ser his val arg ser
2820、 50 55 60
2821、leu arg ala ser phe ile gln val leu glu asp arg arg tyr ala gly
2822、65 70 75 80
2823、asn asp leu ile ile phe gly glu ser asp ala val pro met val ala
2824、 85 90 95
2825、ser ser arg leu glu thr ala leu arg lys glu met glu glu his pro
2826、 100 105 110
2827、glu thr asp ile phe arg leu phe his his ala val trp ser pro gln
2828、 115 120 125
2829、gly asn pro phe glu ser asp glu leu leu phe glu asp phe lys thr
2830、 130 135 140
2831、gly gly thr asp ser asn thr ala tyr val trp gly thr his ala met
2832、145 150 155 160
2833、val ile pro ser cys lys arg lys lys val ile gln val phe ala asp
2834、 165 170 175
2835、tyr arg leu pro thr asp val ala leu glu ala ala asn ser ser gly
2836、 180 185 190
2837、glu leu asn ile arg val ala arg his asn leu phe tyr gln his glu
2838、 195 200 205
2839、arg thr lys lys arg pro ala cys arg ile ala ala cys leu ala ser
2840、 210 215 220
2841、tyr arg arg leu ala asp leu gln arg gln ile trp cys met met asp
2842、225 230 235 240
2843、gln ser tyr glu asn phe his val phe ala ala val lys gly ile pro
2844、 245 250 255
2845、glu thr thr tyr arg lys thr val leu pro leu phe glu his phe ile
2846、 260 265 270
2847、gln glu gly arg leu thr met arg leu phe pro asn lys asn gln leu
2848、 275 280 285
2849、ser asn phe leu asp thr val arg gly leu asp ile ser asn tyr asp
2850、 290 295 300
2851、leu phe ala lys ile asp asp asp asp leu tyr gly arg asp tyr phe
2852、305 310 315 320
2853、lys ser val asn asp phe his gln his leu pro pro glu phe ser ser
2854、 325 330 335
2855、tyr tyr cys gly phe gly gln tyr leu asn asn arg gly gly tyr pro
2856、 340 345 350
2857、leu cys gly asn gly phe phe ser cys phe gly pro thr met val phe
2858、 355 360 365
2859、ser lys asp val leu glu lys leu ile thr cys glu gln glu pro gly
2860、 370 375 380
2861、arg ile ser glu ile phe pro arg leu gly his ser gly tyr gly phe
2862、385 390 395 400
2863、thr glu asp asn leu met his lys leu met ile asp thr gly ser cys
2864、 405 410 415
2865、asn arg ile arg tyr val gln glu met ser leu pro met his leu val
2866、 420 425 430
2867、ile gln thr asn asn ala ser val ile arg gly gly leu val pro gly
2868、 435 440 445
2869、asp phe arg gly arg asn trp his ile ser thr ser arg ala asn ala
2870、 450 455 460
2871、glu ser leu ile glu ile ser his pro gln trp tyr asp ile val arg
2872、465 470 475 480
2873、ile phe gly gly arg ala cys arg phe gln arg asn asp trp ala asp
2874、 485 490 495
2875、val leu ser leu thr asp glu glu val thr leu lys trp asp gln trp
2876、 500 505 510
2877、gly thr glu thr phe arg arg lys glu asp gly ser phe phe leu ser
2878、 515 520 525
2879、glu asn gly asn gln gln his ser pro ser ser arg lys arg lys val
2880、 530 535 540
2881、ala val leu tyr ile ser thr gly arg tyr ile thr phe trp lys asp
2882、545 550 555 560
2883、phe tyr ala ala ser lys gln tyr phe leu pro gly his asp val arg
2884、 565 570 575
2885、tyr phe leu phe thr asp his asp glu val lys thr ala asp asp val
2886、 580 585 590
2887、thr leu val ser lys pro phe tyr pro trp pro met glu thr leu arg
2888、 595 600 605
2889、arg phe glu thr phe leu ser ile glu lys glu leu gln glu tyr asp
2890、 610 615 620
2891、tyr ile tyr phe met asn gly thr leu leu pro val ser pro ile gly
2892、625 630 635 640
2893、glu glu ile phe pro asn asp arg gln gly leu ala val thr leu his
2894、 645 650 655
2895、pro gly phe tyr glu leu pro leu ser cys tyr pro tyr glu lys asn
2896、 660 665 670
2897、gly met ser glu ala arg ile ser pro gly gln gly glu tyr tyr val
2898、 675 680 685
2899、ala gly gly phe asn gly gly lys ala lys asp phe leu ser met cys
2900、 690 695 700
2901、gln glu leu ala gly ala val lys arg asp leu asp asn gly ile ile
2902、705 710 715 720
2903、ala val trp his asp glu ser his ile asn lys tyr val ile gly arg
2904、 725 730 735
2905、his pro leu val leu gly pro glu tyr leu phe pro glu thr leu val
2906、 740 745 750
2907、phe asn arg tyr his leu met gly leu lys his arg val lys ile leu
2908、 755 760 765
2909、val lys asp lys ser leu ser lys tyr gly gly his ala trp leu arg
2910、 770 775 780
2911、lys gln ser
2912、785
2913、<210> 47
2914、<211> 232
2915、<212> prt
2916、<213> algoriphagus sp.
2917、<400> 47
2918、met lys ile cys ile leu thr ile ala thr asn gln tyr leu gln phe
2919、1 5 10 15
2920、ile glu lys leu tyr ser asp ile ala glu lys phe ile pro glu ser
2921、 20 25 30
2922、glu ile asn cys leu leu phe thr asp his glu ile glu glu thr ser
2923、 35 40 45
2924、asp asn val lys val his tyr ile asp his glu pro trp pro met pro
2925、 50 55 60
2926、thr leu lys arg tyr asn tyr phe val lys glu lys asp phe ile leu
2927、65 70 75 80
2928、gln his asp tyr cys phe tyr met asp ala asp met arg ile asp ala
2929、 85 90 95
2930、pro val gly gln glu ile leu gly asp leu val ala thr arg his gly
2931、 100 105 110
2932、tyr gln ser tyr his asp pro lys asn gln ser phe asp arg asn pro
2933、 115 120 125
2934、lys ser leu ala tyr val asp pro ser glu lys thr val thr tyr tyr
2935、 130 135 140
2936、ala gly gly phe asn gly gly lys thr gln asn phe met lys met ser
2937、145 150 155 160
2938、glu val ile ala asp arg val asn lys asp leu glu asn asn val val
2939、 165 170 175
2940、ala leu trp his asp glu ser his met asn arg tyr leu ile asp asn
2941、 180 185 190
2942、pro pro thr leu asp leu ser pro glu tyr cys tyr ala glu glu phe
2943、 195 200 205
2944、ile gly ser asn tyr pro leu gln asn pro lys ile ile ala leu lys
2945、 210 215 220
2946、lys asn his ala glu leu arg ser
2947、225 230
2948、<210> 48
2949、<211> 263
2950、<212> prt
2951、<213> 卵形拟杆菌
2952、<400> 48
2953、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
2954、1 5 10 15
2955、trp lys asp phe tyr leu ser ala glu arg tyr phe met gln asp gln
2956、 20 25 30
2957、ser phe ile ile glu tyr tyr val phe thr asp ser pro lys leu tyr
2958、 35 40 45
2959、asp glu glu asn asn lys his ile his arg ile lys gln lys asn leu
2960、 50 55 60
2961、gly trp pro asp asn thr leu lys arg phe his ile phe leu arg ile
2962、65 70 75 80
2963、lys glu gln leu glu arg glu thr asp tyr leu phe phe phe asn ala
2964、 85 90 95
2965、asn leu leu phe thr ser pro ile gly lys glu ile leu pro pro ser
2966、 100 105 110
2967、asp ser asn gly leu leu gly thr met his pro gly phe tyr asn lys
2968、 115 120 125
2969、pro asn ser glu phe thr tyr glu arg arg asp ala ser thr ala tyr
2970、 130 135 140
2971、ile pro glu gly glu gly arg tyr tyr tyr ala gly gly leu ser gly
2972、145 150 155 160
2973、gly cys thr lys ala tyr leu lys leu cys thr thr ile cys ser trp
2974、 165 170 175
2975、val asp arg asp ala thr asn his ile ile pro ile trp his asp glu
2976、 180 185 190
2977、ser leu ile asn lys tyr phe leu asp asn pro pro ala ile thr leu
2978、 195 200 205
2979、ser pro ala tyr leu tyr pro glu gly trp leu leu pro phe glu pro
2980、 210 215 220
2981、ile ile leu ile arg asp lys asn asn pro gln tyr gly gly his glu
2982、225 230 235 240
2983、leu leu arg arg lys asn ser leu trp glu arg ile lys leu ile cys
2984、 245 250 255
2985、gln lys phe lys ser ala asp
2986、 260
2987、<210> 49
2988、<211> 263
2989、<212> prt
2990、<213> 卵形拟杆菌
2991、<400> 49
2992、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
2993、1 5 10 15
2994、trp lys asp phe tyr leu ser ala glu arg tyr phe met gln asp gln
2995、 20 25 30
2996、ser phe ile ile glu tyr tyr val phe thr asp ser pro lys leu tyr
2997、 35 40 45
2998、asp glu glu asn asn lys his ile his arg ile lys gln lys asn leu
2999、 50 55 60
3000、gly trp pro asp asn thr leu lys arg phe his ile phe leu arg ile
3001、65 70 75 80
3002、lys glu gln leu glu arg glu thr asp tyr leu phe phe phe asn ala
3003、 85 90 95
3004、asn leu leu phe thr ser pro ile gly lys glu ile leu pro pro ser
3005、 100 105 110
3006、asp ser asn gly leu leu gly thr met his pro gly phe tyr asn lys
3007、 115 120 125
3008、pro asn ser glu phe thr tyr glu arg arg asp ala ser thr ala tyr
3009、 130 135 140
3010、ile pro glu gly glu gly arg tyr tyr tyr ala gly gly leu ser gly
3011、145 150 155 160
3012、gly cys thr lys ala tyr leu lys leu cys thr thr ile cys ser trp
3013、 165 170 175
3014、val asp arg asp ala thr asn his ile ile pro ile trp his asp glu
3015、 180 185 190
3016、ser leu ile asn lys tyr phe leu asp asn pro pro ala ile thr leu
3017、 195 200 205
3018、ser pro ala tyr leu tyr pro glu gly trp leu leu pro phe glu pro
3019、 210 215 220
3020、ile ile leu ile arg asp lys asn lys pro gln tyr gly gly his glu
3021、225 230 235 240
3022、leu leu arg arg lys asn ser leu trp glu arg ile lys leu ile cys
3023、 245 250 255
3024、gln lys phe lys ser ala asp
3025、 260
3026、<210> 50
3027、<211> 263
3028、<212> prt
3029、<213> 卵形拟杆菌
3030、<400> 50
3031、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
3032、1 5 10 15
3033、trp lys asn phe tyr leu ser ala glu arg tyr phe leu gln asp gln
3034、 20 25 30
3035、ser phe ile leu glu tyr tyr val phe thr asp ser pro lys leu tyr
3036、 35 40 45
3037、asp glu asp asn asn lys his ile his arg ile lys gln lys asn leu
3038、 50 55 60
3039、gly trp pro asp asn thr leu lys arg phe his ile phe leu arg ile
3040、65 70 75 80
3041、lys gln gln leu leu gln glu thr asp phe leu phe phe cys asn ala
3042、 85 90 95
3043、asn leu leu phe lys gln asn ile gly pro glu ile ile pro leu lys
3044、 100 105 110
3045、thr glu asn gln leu val gly thr ile his pro gly phe tyr asn ser
3046、 115 120 125
3047、pro asn ser glu phe thr tyr glu arg arg tyr asn ser lys ala tyr
3048、 130 135 140
3049、ile pro glu gly glu gly ile his tyr tyr ala gly gly phe ser gly
3050、145 150 155 160
3051、gly tyr thr glu arg tyr leu gln leu cys glu thr ile lys ser trp
3052、 165 170 175
3053、val asp ile asp asn ser lys lys ile val ala ile trp his asp glu
3054、 180 185 190
3055、ser his ile asn lys tyr phe leu glu asn pro pro phe thr leu ser
3056、 195 200 205
3057、pro ala tyr leu tyr pro glu gly trp ser ile pro phe lys glu ile
3058、 210 215 220
3059、ile met ile arg asp lys ser lys glu glu tyr gly gly his thr leu
3060、225 230 235 240
3061、leu arg lys lys glu pro trp ser ser lys leu leu tyr ala leu lys
3062、 245 250 255
3063、arg phe phe arg leu ser glu
3064、 260
3065、<210> 51
3066、<211> 263
3067、<212> prt
3068、<213> 卵形拟杆菌
3069、<400> 51
3070、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
3071、1 5 10 15
3072、trp lys asp phe tyr leu ser ala glu arg tyr phe met gln asp gln
3073、 20 25 30
3074、ser phe ile ile glu tyr tyr val phe thr asp ser pro gln leu tyr
3075、 35 40 45
3076、asp glu glu asn asn glu his ile his arg ile lys gln lys asn leu
3077、 50 55 60
3078、gly trp pro asp asn thr leu lys arg phe his thr phe leu arg ile
3079、65 70 75 80
3080、lys glu gln leu glu arg glu thr asp tyr leu phe phe phe asn ala
3081、 85 90 95
3082、asn leu leu phe thr cys pro ile gly lys glu met leu pro ser ser
3083、 100 105 110
3084、asn ser asn gly leu leu gly thr ile his pro gly phe tyr asn lys
3085、 115 120 125
3086、pro asn ser glu phe thr tyr glu arg arg val ala ser thr ala tyr
3087、 130 135 140
3088、ile pro glu gly lys gly leu tyr tyr tyr ala gly gly leu ser gly
3089、145 150 155 160
3090、gly cys thr glu ser tyr leu gln leu cys thr thr ile cys ser trp
3091、 165 170 175
3092、val asp lys asp ala ala asn his ile ile pro ile trp his asp glu
3093、 180 185 190
3094、ser leu ile asn lys tyr phe leu asp asn pro pro ala ile thr leu
3095、 195 200 205
3096、pro pro ala tyr leu tyr pro glu gly trp ser leu pro phe lys pro
3097、 210 215 220
3098、ile ile leu ile arg asp lys asn lys pro glu tyr gly gly his glu
3099、225 230 235 240
3100、phe leu arg arg lys asn ser leu trp val lys ile lys leu ile cys
3101、 245 250 255
3102、gln lys ile lys leu ala asp
3103、 260
3104、<210> 52
3105、<211> 257
3106、<212> prt
3107、<213> 卵形拟杆菌 sd cmc 3f
3108、<400> 52
3109、tyr ile cys thr gly lys tyr asp ile phe trp lys asp phe tyr leu
3110、1 5 10 15
3111、ser ala glu arg tyr phe met gln asp gln ser phe ile ile glu tyr
3112、 20 25 30
3113、tyr val phe thr asp ser pro lys leu tyr asp glu glu asn asn lys
3114、 35 40 45
3115、his ile his arg ile lys gln lys asn leu gly trp pro asp asn thr
3116、 50 55 60
3117、leu lys arg phe his ile phe leu arg ile lys glu gln leu glu arg
3118、65 70 75 80
3119、glu thr asp tyr leu phe phe phe asn ala asn leu leu phe thr ser
3120、 85 90 95
3121、pro ile gly lys glu ile leu pro pro ser asp ser asn gly leu leu
3122、 100 105 110
3123、gly thr met his pro gly phe tyr asn lys pro asn ser glu phe thr
3124、 115 120 125
3125、tyr glu arg arg asp ala ser thr ala tyr ile pro glu gly glu gly
3126、 130 135 140
3127、arg tyr tyr tyr ala gly gly leu ser gly gly cys thr lys ala tyr
3128、145 150 155 160
3129、leu lys leu cys thr thr ile cys ser trp val asp arg asp ala thr
3130、 165 170 175
3131、asn his ile ile pro ile trp his asp glu ser leu ile asn lys tyr
3132、 180 185 190
3133、phe leu asp asn pro pro ala ile thr leu ser pro ala tyr leu tyr
3134、 195 200 205
3135、pro glu gly trp leu leu pro phe glu pro ile ile leu ile arg asp
3136、 210 215 220
3137、lys asn asn pro gln tyr gly gly his glu leu leu arg arg lys asn
3138、225 230 235 240
3139、ser leu trp glu arg ile lys leu ile cys gln lys phe lys ser ala
3140、 245 250 255
3141、asp
3142、<210> 53
3143、<211> 263
3144、<212> prt
3145、<213> bacteroides reticulotermitis jcm 10512
3146、<400> 53
3147、met arg ile gly ile leu tyr ile cys thr gly lys tyr ser ile phe
3148、1 5 10 15
3149、trp lys asp phe tyr leu ser ala glu arg tyr leu met gln ser pro
3150、 20 25 30
3151、ala tyr thr arg glu tyr tyr val phe thr asp ser leu lys leu tyr
3152、 35 40 45
3153、asp glu glu asn asn lys his ile his arg ile lys gln lys asn leu
3154、 50 55 60
3155、gly trp pro asp asn thr leu lys arg phe his met phe leu gln ile
3156、65 70 75 80
3157、lys gln gln leu leu gln glu thr asp phe leu ile phe cys asn ala
3158、 85 90 95
3159、asn leu leu phe lys gln asn val gly his glu ile ile pro gln lys
3160、 100 105 110
3161、gly lys asn gln phe val gly thr ile his pro gly phe tyr asn ser
3162、 115 120 125
3163、his asn tyr asp phe thr tyr glu arg arg his asn ser lys ala tyr
3164、 130 135 140
3165、ile pro glu gly glu gly val his tyr tyr ala gly gly phe ser gly
3166、145 150 155 160
3167、gly tyr thr lys ala tyr leu gln leu cys glu thr ile lys ser trp
3168、 165 170 175
3169、val asp ile asp lys ser asn lys ile val ala ile trp his asp glu
3170、 180 185 190
3171、ser his ile asn arg tyr phe leu lys asn pro pro leu thr leu ser
3172、 195 200 205
3173、pro gly tyr leu tyr pro glu gly trp ser ile pro phe glu glu ile
3174、 210 215 220
3175、ile thr ile arg asp lys asn lys glu glu tyr gly gly his ile leu
3176、225 230 235 240
3177、leu arg lys lys glu ser trp arg asn lys ile leu lys ile ile lys
3178、 245 250 255
3179、lys thr leu phe pro leu pro
3180、 260
3181、<210> 54
3182、<211> 256
3183、<212> prt
3184、<213> bacteroides sp. om08-11
3185、<400> 54
3186、met lys ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
3187、1 5 10 15
3188、trp lys asp phe tyr leu ser ser glu ser his phe phe ser asp asp
3189、 20 25 30
3190、pro asn cys ile arg glu tyr tyr val phe thr asp ser lys leu leu
3191、 35 40 45
3192、phe gly glu lys glu asn gln his ile his arg ile tyr gln lys asn
3193、 50 55 60
3194、leu gly trp pro asn asn thr leu lys arg phe his ile phe leu glu
3195、65 70 75 80
3196、ile lys glu arg leu leu lys glu thr asp tyr leu phe phe cys asn
3197、 85 90 95
3198、ala asn leu leu phe lys gln thr val gly leu glu ile leu pro pro
3199、 100 105 110
3200、ala ile gly asn gly leu val gly thr leu his pro gly phe phe asn
3201、 115 120 125
3202、lys asn asn asn glu phe thr tyr glu arg ser pro his ser thr ala
3203、 130 135 140
3204、tyr ile ala glu gly glu gly ile tyr tyr tyr ala gly gly phe ser
3205、145 150 155 160
3206、gly gly lys thr lys glu tyr ile lys leu cys glu thr ile lys arg
3207、 165 170 175
3208、arg ile asp gln asp leu gln gln arg phe ile ala val trp his asp
3209、 180 185 190
3210、glu ser his ile asn arg tyr phe leu glu asn pro pro thr thr leu
3211、 195 200 205
3212、ser pro ser tyr leu tyr pro glu gly ser ile leu pro phe glu glu
3213、 210 215 220
3214、lys ile met ile arg asp lys ser lys lys glu tyr gly gly his lys
3215、225 230 235 240
3216、phe leu arg lys lys asp ser trp leu his arg leu ile lys lys leu
3217、 245 250 255
3218、<210> 55
3219、<211> 263
3220、<212> prt
3221、<213> bacteroides xylanisolvens
3222、<400> 55
3223、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
3224、1 5 10 15
3225、trp lys asp phe tyr leu ser ala glu arg tyr phe met gln asp gln
3226、 20 25 30
3227、ser phe thr ile glu tyr tyr val phe thr asp thr ser lys leu tyr
3228、 35 40 45
3229、asp glu glu asn asn lys his ile his arg ile lys gln lys asn leu
3230、 50 55 60
3231、gly trp pro asp asn thr leu lys arg phe his ile phe leu arg ile
3232、65 70 75 80
3233、lys glu gln leu glu arg glu thr asp tyr leu phe phe phe asn ala
3234、 85 90 95
3235、asn leu leu phe thr ser ser ile gly lys glu ile leu pro pro ser
3236、 100 105 110
3237、asp ser asn gly leu leu gly thr met his pro gly phe tyr asn lys
3238、 115 120 125
3239、pro asn ser glu phe thr tyr glu arg arg asp ala ser thr ala tyr
3240、 130 135 140
3241、ile pro glu gly glu gly leu tyr tyr tyr ala gly gly leu ser gly
3242、145 150 155 160
3243、gly cys thr lys ala tyr leu lys leu cys thr thr ile cys ser trp
3244、 165 170 175
3245、val asp arg asp ala thr asn his ile ile pro ile trp his asp glu
3246、 180 185 190
3247、ser leu ile asn lys tyr phe leu asp asn pro pro ala ile thr leu
3248、 195 200 205
3249、pro pro ala tyr leu tyr pro glu gly trp leu leu pro phe glu pro
3250、 210 215 220
3251、ile ile leu ile arg asp lys asn lys pro lys tyr gly gly his glu
3252、225 230 235 240
3253、leu leu arg arg lys asn ser leu trp glu arg ile lys leu ile cys
3254、 245 250 255
3255、gln lys phe lys ser ala asp
3256、 260
3257、<210> 56
3258、<211> 309
3259、<212> prt
3260、<213> bisgaard taxon 44 str. 111
3261、<400> 56
3262、met gln gln pro lys val ala phe leu ser ile asn thr gly ser tyr
3263、1 5 10 15
3264、asp thr phe phe lys ala val phe ala his asn gln gln asn phe leu
3265、 20 25 30
3266、pro asp cys gln val gln tyr phe val phe thr asp ser glu asp leu
3267、 35 40 45
3268、ala thr thr tyr ala asn thr glu asn val thr leu ile pro gln glu
3269、 50 55 60
3270、his leu ala trp pro gly ala thr leu his arg phe lys met phe asn
3271、65 70 75 80
3272、arg pro glu val arg glu leu leu ser glu tyr asp tyr val phe phe
3273、 85 90 95
3274、ala asn ala asn trp tyr ala lys asn pro ile leu gly lys asn phe
3275、 100 105 110
3276、leu gln pro ala thr gly asp ala ser lys asp leu tyr leu val tyr
3277、 115 120 125
3278、his tyr gly gln asn ala val pro glu ala ala lys ser tyr glu arg
3279、 130 135 140
3280、asn pro gln ser leu ala tyr ile pro glu asn ala thr thr thr tyr
3281、145 150 155 160
3282、val ala gly gly phe phe gly gly thr ser ala ala phe met his met
3283、 165 170 175
3284、ile ala thr leu glu arg asn ile asp phe asp leu ala lys gly ile
3285、 180 185 190
3286、ile ala leu trp his asp glu ser his leu asn his tyr leu tyr thr
3287、 195 200 205
3288、thr gly tyr gln ala his ile met pro pro ile phe met val pro gln
3289、 210 215 220
3290、glu tyr his pro ile ser ser tyr ile gly glu arg pro glu trp leu
3291、225 230 235 240
3292、gly val cys leu asn lys asn leu leu val gln asp leu asn ala leu
3293、 245 250 255
3294、arg asn lys gln val gly phe ser leu glu gln ile gln gln leu leu
3295、 260 265 270
3296、glu his glu lys asp leu asp ala ile trp arg glu gln arg ala glu
3297、 275 280 285
3298、phe glu pro tyr trp gln gln asn leu gly phe val gly leu ile tyr
3299、 290 295 300
3300、asn gln val glu gln
3301、305
3302、<210> 57
3303、<211> 301
3304、<212> prt
3305、<213> bisgaard taxon 44 str. b96_3
3306、<400> 57
3307、met gln lys pro lys val ala leu val ser ile asn thr gly ala tyr
3308、1 5 10 15
3309、asp thr tyr phe lys val leu phe pro tyr phe tyr thr asn phe leu
3310、 20 25 30
3311、pro asp cys glu leu thr phe val val phe thr asp ser ser glu leu
3312、 35 40 45
3313、glu glu leu tyr arg tyr asn pro ile val lys ile ile lys thr pro
3314、 50 55 60
3315、tyr glu ala trp pro gly ala thr leu lys arg phe his tyr phe ser
3316、65 70 75 80
3317、gln ala ser ser his leu glu gln phe asp tyr ile phe phe ala asn
3318、 85 90 95
3319、ala asn tyr tyr cys lys asn lys ile leu ala ser glu leu leu leu
3320、 100 105 110
3321、pro glu gly glu lys gly leu ile phe val glu his phe gly gln asn
3322、 115 120 125
3323、his leu pro glu arg leu arg ser tyr glu arg asn pro ala ser leu
3324、 130 135 140
3325、ala tyr ile pro glu glu gln ala thr thr tyr val ala gly ala phe
3326、145 150 155 160
3327、tyr gly gly thr ala gln glu phe leu thr met ala lys thr leu ala
3328、 165 170 175
3329、gln arg val asp gln asp leu ala asn gly ile ile ala ile trp his
3330、 180 185 190
3331、asp glu ser his leu asn cys tyr ala leu gln ile gly tyr gln ala
3332、 195 200 205
3333、lys val leu pro pro arg tyr leu val pro gln glu tyr tyr phe ala
3334、 210 215 220
3335、ser ser tyr ile gly glu arg gln asp trp pro cys val leu leu asn
3336、225 230 235 240
3337、lys asn ala leu pro ile ala ala gln asp val arg asp ser lys ala
3338、 245 250 255
3339、lys leu asp ala arg leu val glu arg leu leu ile lys glu arg glu
3340、 260 265 270
3341、leu glu gln leu trp leu asp lys arg glu val tyr leu glu gln ala
3342、 275 280 285
3343、lys ser asn pro gly phe ile val phe asn trp gln val
3344、 290 295 300
3345、<210> 58
3346、<211> 303
3347、<212> prt
3348、<213> bisgaard taxon 44 str. b96_4
3349、<400> 58
3350、met lys val ala phe leu ser val asn thr gly ala tyr asp thr phe
3351、1 5 10 15
3352、phe lys val leu phe pro tyr asn tyr gln asn phe leu pro asp cys
3353、 20 25 30
3354、gln val thr phe phe val phe thr asp ser lys asp leu glu gln ser
3355、 35 40 45
3356、phe ala leu asn pro arg val lys val ile tyr gln glu tyr glu pro
3357、 50 55 60
3358、trp pro ala pro thr leu asp arg phe ala tyr phe leu ser gln ala
3359、65 70 75 80
3360、glu gln leu gln glu phe asp tyr ile phe phe ala asn ala asn tyr
3361、 85 90 95
3362、tyr cys lys asn pro ile lys ala glu gln ile leu phe ala pro thr
3363、 100 105 110
3364、gly asp leu gly lys asp leu ile met val glu his phe gly gln asn
3365、 115 120 125
3366、phe ile ala glu his leu arg ser tyr glu arg asn pro ser ser gln
3367、 130 135 140
3368、ala tyr ile ala pro gln pro glu arg pro thr thr tyr val ala gly
3369、145 150 155 160
3370、gly phe tyr gly gly thr ala gln ala phe leu ala leu ala arg thr
3371、 165 170 175
3372、leu ala gln arg ile gln ala asp lys glu gln gly ile val ala his
3373、 180 185 190
3374、trp his asp glu ser his leu asn arg tyr leu tyr asp leu asn tyr
3375、 195 200 205
3376、ala cys his phe leu pro pro cys tyr cys val pro gln glu tyr asp
3377、 210 215 220
3378、phe glu ser arg tyr ile gly glu arg gln asp trp pro cys val leu
3379、225 230 235 240
3380、leu asn lys asn ala leu pro ser pro ala gln asp ile arg ser asn
3381、 245 250 255
3382、gln ala ser tyr asp pro arg trp ile glu ile leu ile met gln glu
3383、 260 265 270
3384、arg glu leu glu ser trp trp leu arg asp arg his ile phe tyr pro
3385、 275 280 285
3386、asn ala ile lys asn gln cys phe asn thr leu leu trp glu ile
3387、 290 295 300
3388、<210> 59
3389、<211> 308
3390、<212> prt
3391、<213> bisgaard taxon 44 str. eeab3t1
3392、<400> 59
3393、met ser arg thr lys val ala val leu ser val asn thr gly ala tyr
3394、1 5 10 15
3395、ala ser phe phe lys val leu phe pro tyr asn tyr gln asn phe leu
3396、 20 25 30
3397、pro asp cys glu val thr phe phe val phe thr asp ser lys glu leu
3398、 35 40 45
3399、ala gln leu tyr ala tyr asn pro gln val lys ile ile pro leu asp
3400、 50 55 60
3401、tyr gln pro trp pro leu pro thr leu phe arg phe lys tyr phe leu
3402、65 70 75 80
3403、glu leu glu ser thr leu ala glu phe ala tyr val phe phe met asn
3404、 85 90 95
3405、ala asn phe tyr cys lys arg pro leu tyr ala gln asp leu leu phe
3406、 100 105 110
3407、ala pro thr gly asn trp ala gln asp leu ile val val glu his phe
3408、 115 120 125
3409、gly gln asn cys leu pro glu glu leu arg ser tyr glu arg asn pro
3410、 130 135 140
3411、gln ser gln ala tyr ile ser pro thr pro glu lys ala thr thr tyr
3412、145 150 155 160
3413、ile ala gly ala phe asn gly gly thr ser gln ala phe leu thr met
3414、 165 170 175
3415、ser arg glu leu ala gln arg thr leu thr asp tyr gln asn asn leu
3416、 180 185 190
3417、ile ala val trp his asp glu ser his leu asn arg leu leu tyr asp
3418、 195 200 205
3419、leu asp tyr gln ala his ile leu pro pro his tyr val met pro gln
3420、 210 215 220
3421、glu tyr asp phe glu ser arg tyr val gly glu arg gln asp trp phe
3422、225 230 235 240
3423、ala val leu leu asn lys asn ala leu pro phe asp pro gln leu ala
3424、 245 250 255
3425、arg asp asn gln gln glu phe asp pro arg his leu glu leu leu val
3426、 260 265 270
3427、leu gln glu arg gln leu glu asn ile trp leu thr tyr arg asp thr
3428、 275 280 285
3429、phe tyr pro asn ala ile lys asn asn ser phe asn cys phe ile trp
3430、 290 295 300
3431、lys ile glu pro
3432、305
3433、<210> 60
3434、<211> 527
3435、<212> prt
3436、<213> candidatus magasanikbacteria
3437、<400> 60
3438、met lys ile gly ile leu tyr ile cys thr gly lys tyr lys ile phe
3439、1 5 10 15
3440、trp lys asp phe tyr leu ser cys glu lys his phe ile ser glu val
3441、 20 25 30
3442、glu lys his tyr phe val phe thr asp ser glu ser ile glu phe glu
3443、 35 40 45
3444、asn glu asn ser arg ile his arg val tyr gln gln asn leu gly trp
3445、 50 55 60
3446、pro gly asn thr leu arg arg tyr glu met phe leu lys lys lys glu
3447、65 70 75 80
3448、glu leu lys lys phe asp phe leu phe phe phe asn ala asn leu gln
3449、 85 90 95
3450、phe leu glu lys ile thr ser asp glu phe val pro val gly gln glu
3451、 100 105 110
3452、lys leu val ala cys leu his pro gly tyr tyr asp lys lys lys glu
3453、 115 120 125
3454、ser phe thr tyr glu arg asn ser lys ser thr ala phe ile pro lys
3455、 130 135 140
3456、gly gln gly val tyr tyr phe ala gly gly ile asn gly gly leu ser
3457、145 150 155 160
3458、lys asp phe ile glu ala met glu val met asp glu asn ile lys lys
3459、 165 170 175
3460、asp phe his asn asn ile ile ala val trp his asp glu ser his trp
3461、 180 185 190
3462、asn tyr phe leu asn asn asn ile glu asp ile lys ile leu asp pro
3463、 195 200 205
3464、ser tyr leu tyr pro glu gly gly leu leu pro phe val pro lys ile
3465、 210 215 220
3466、leu val arg asp lys lys ile leu gly gly his thr lys leu arg asp
3467、225 230 235 240
3468、asn phe asn phe ile leu tyr ile asn glu ile lys ser tyr met lys
3469、 245 250 255
3470、lys leu ile cys lys leu lys phe glu tyr ile ile lys leu lys gly
3471、 260 265 270
3472、gly leu gly asn gln met phe gln tyr ala his gly arg ser leu glu
3473、 275 280 285
3474、phe ser gly lys lys val ile phe asp ile ser phe phe glu asn asn
3475、 290 295 300
3476、lys ala lys arg asp ile ala arg asp phe lys leu asp asn phe asn
3477、305 310 315 320
3478、ile asp thr arg val lys phe val asn lys lys asn ile tyr leu asp
3479、 325 330 335
3480、phe val asn lys ile lys arg lys ile gly phe ser leu glu glu ser
3481、 340 345 350
3482、phe gln gly glu lys tyr phe glu asn ile glu asp ile ile arg lys
3483、 355 360 365
3484、glu leu thr leu lys lys glu leu tyr glu lys val asp lys asn leu
3485、 370 375 380
3486、leu asn lys ile leu leu ser asn ser val ser ile his ile arg arg
3487、385 390 395 400
3488、thr asp tyr val thr ser lys ile ala asn lys val leu gly val cys
3489、 405 410 415
3490、ser leu asp tyr tyr lys ile ser ile ser lys ile ala ser leu leu
3491、 420 425 430
3492、asp asn pro his phe tyr ile phe ser asp asp ile glu trp val arg
3493、 435 440 445
3494、ser asn leu phe met glu tyr pro phe thr tyr val ser asn gly val
3495、 450 455 460
3496、tyr lys asp tyr glu glu leu val leu met ser ser cys lys his asn
3497、465 470 475 480
3498、ile ile ala asn ser thr phe ser trp trp ala ala trp leu asn lys
3499、 485 490 495
3500、asn gln asn lys ile val val ala pro ser lys trp phe asn asp lys
3501、 500 505 510
3502、thr tyr ser glu asn asn leu val pro lys lys trp ile arg ile
3503、 515 520 525
3504、<210> 61
3505、<211> 526
3506、<212> prt
3507、<213> candidatus nomurabacteria
3508、<400> 61
3509、met arg ile gly ile leu tyr ile cys thr gly lys tyr ser ile phe
3510、1 5 10 15
3511、trp lys asp phe tyr leu ser met glu glu arg phe ile thr asp ser
3512、 20 25 30
3513、glu lys tyr tyr phe val phe thr asp ser ala glu leu asp phe glu
3514、 35 40 45
3515、lys glu asn pro arg val his arg ile tyr gln glu asn leu gly trp
3516、 50 55 60
3517、pro glu asn thr leu met arg phe his val phe leu asn lys glu lys
3518、65 70 75 80
3519、glu leu glu asp met asn tyr leu phe phe phe asn ala asn leu ile
3520、 85 90 95
3521、val leu glu lys ile thr ala asp asn phe leu pro asn glu asn glu
3522、 100 105 110
3523、asn leu val ala thr leu his pro gly phe tyr asn lys asn arg lys
3524、 115 120 125
3525、lys phe thr tyr glu asn asn lys lys ser thr ala phe ile ser lys
3526、 130 135 140
3527、asp gln gly gln tyr tyr phe ala gly gly leu asn gly gly lys thr
3528、145 150 155 160
3529、thr asn phe ile glu ala met lys val met arg asp asn val asp ile
3530、 165 170 175
3531、asp lys lys asn asn ile ile ala lys trp his asp glu ser his trp
3532、 180 185 190
3533、asn arg tyr val leu asn arg thr asp val lys ile leu pro pro ser
3534、 195 200 205
3535、tyr leu tyr pro glu gly trp pro leu pro phe asn pro ile ile leu
3536、 210 215 220
3537、ile arg asp lys asn lys tyr gly gly his ala ile leu arg ser ile
3538、225 230 235 240
3539、lys val asn lys phe lys val his phe leu lys met lys lys ile phe
3540、 245 250 255
3541、his lys phe tyr asn lys tyr leu glu phe lys met val leu phe glu
3542、 260 265 270
3543、phe lys lys pro thr tyr ser asn leu asn lys phe asn leu lys asn
3544、 275 280 285
3545、thr lys phe ile leu ile thr ile ala phe asn asn val glu ile ile
3546、 290 295 300
3547、lys phe gln asn glu lys val met glu asn leu lys asp asp phe ser
3548、305 310 315 320
3549、his ile ile val asp asn ser ser thr lys asn val ser gly glu ile
3550、 325 330 335
3551、phe lys tyr cys lys ile asn asn ile pro tyr val lys leu pro asn
3552、 340 345 350
3553、asn thr phe glu lys ser pro ser lys ser his gly lys ala leu asn
3554、 355 360 365
3555、trp ala tyr arg asn ile ile asn lys tyr glu pro ala tyr phe gly
3556、 370 375 380
3557、phe ile asp his asp ile ile pro phe lys glu thr ser ile thr asn
3558、385 390 395 400
3559、tyr ile lys asn gly ala trp gly leu ile gln glu arg glu glu lys
3560、 405 410 415
3561、trp tyr leu trp pro gly phe cys phe phe lys phe ala glu val arg
3562、 420 425 430
3563、lys tyr lys met asn phe met pro tyr arg gly leu asp thr gly gly
3564、 435 440 445
3565、ser asn tyr his ser leu tyr lys asn ile asn lys asn asn ile leu
3566、 450 455 460
3567、lys ile arg gln thr tyr phe asp leu asp lys asn glu lys val thr
3568、465 470 475 480
3569、lys phe asp thr ser glu asn ile val glu val leu asp asp trp val
3570、 485 490 495
3571、his ile met arg thr ser asn trp asn asn gln val ser ser lys asn
3572、 500 505 510
3573、ser lys phe asn glu ile ile tyr ile ile lys glu lys phe
3574、 515 520 525
3575、<210> 62
3576、<211> 231
3577、<212> prt
3578、<213> chlamydiae bacterium
3579、<400> 62
3580、met trp cys phe ala his glu pro thr ile gly phe cys ile val ala
3581、1 5 10 15
3582、thr gly lys tyr ile asp phe thr pro pro leu ile glu ser ala glu
3583、 20 25 30
3584、lys tyr phe cys arg gly thr pro lys arg tyr phe val phe ser asp
3585、 35 40 45
3586、arg thr ser glu leu pro lys asn ala glu ile ile glu val arg his
3587、 50 55 60
3588、phe ser trp pro phe ser thr ala met arg asn thr phe tyr val leu
3589、65 70 75 80
3590、his lys glu arg leu lys glu cys asp tyr leu phe ala ile asp ala
3591、 85 90 95
3592、asp met arg phe val ser pro ile ala lys glu glu val leu gly thr
3593、 100 105 110
3594、leu val ala thr gln his pro gly phe tyr arg met arg gly ser tyr
3595、 115 120 125
3596、glu ser asn ser ile ser lys ala phe val ala pro asn glu gly glu
3597、 130 135 140
3598、tyr tyr phe cys gly gly phe phe gly gly lys arg glu glu phe ile
3599、145 150 155 160
3600、lys leu cys gln lys thr ser asp asn phe phe glu asp leu lys lys
3601、 165 170 175
3602、gly phe ile ala glu trp his asp glu ser his his asn arg tyr leu
3603、 180 185 190
3604、ile asp tyr pro pro thr lys ile leu ser pro ala tyr cys tyr pro
3605、 195 200 205
3606、glu ser trp lys leu pro phe glu lys lys leu leu ala leu asp lys
3607、 210 215 220
3608、asn his ala glu phe gln lys
3609、225 230
3610、<210> 63
3611、<211> 234
3612、<212> prt
3613、<213> chlamydiae bacterium
3614、<400> 63
3615、met gln glu gly phe ala arg asp ser thr pro lys gln ile gly leu
3616、1 5 10 15
3617、phe ile val ala thr gly lys tyr ile gln phe val asn pro leu ile
3618、 20 25 30
3619、thr ser ala arg his trp phe cys thr asp his his val val phe phe
3620、 35 40 45
3621、val phe thr asp gln glu met gln glu glu phe asp val ile arg ile
3622、 50 55 60
3623、pro val arg his leu gly trp pro tyr ala thr leu met arg phe his
3624、65 70 75 80
3625、met tyr ala glu tyr gln glu gln phe asp cys leu asp tyr ile phe
3626、 85 90 95
3627、ala ile asp ala asp ala leu phe val ala pro val gly glu glu ile
3628、 100 105 110
3629、phe ser asp arg val phe thr leu his pro gly phe val asn arg ala
3630、 115 120 125
3631、gly thr tyr glu arg asn pro leu ser ala ala cys val ala ser his
3632、 130 135 140
3633、glu gly thr phe tyr phe ala gly gly phe tyr gly gly ser pro lys
3634、145 150 155 160
3635、glu phe phe arg phe val asn thr ala lys glu lys val asp gln asp
3636、 165 170 175
3637、leu ala lys gly cys ile ala leu trp his asp glu ser his leu asn
3638、 180 185 190
3639、arg tyr ala ile asp tyr pro pro thr leu ile leu thr pro ser tyr
3640、 195 200 205
3641、cys tyr pro glu ser trp arg leu pro tyr val lys lys ile leu val
3642、 210 215 220
3643、leu asp lys asp his cys ala met arg asn
3644、225 230
3645、<210> 64
3646、<211> 282
3647、<212> prt
3648、<213> clostridium hathewayi cag:224
3649、<400> 64
3650、met val tyr cys asp met ile arg asn lys ile gly ile leu tyr val
3651、1 5 10 15
3652、cys thr gly glu tyr asn ile phe trp glu asp phe tyr lys ser phe
3653、 20 25 30
3654、glu glu lys phe cys thr asn ser asp lys ile tyr met val phe thr
3655、 35 40 45
3656、asp ala asn ser ile ala tyr glu glu met thr asn val ile lys ile
3657、 50 55 60
3658、tyr gln asp cys leu gly trp pro tyr asp thr leu met arg tyr ser
3659、65 70 75 80
3660、met phe glu lys ile lys asp ile ile gly lys cys glu tyr val phe
3661、 85 90 95
3662、phe phe asn ala asn met ile cys asn leu ala val tyr glu glu asp
3663、 100 105 110
3664、ile leu pro arg arg ser lys gly glu ser leu ser val val leu his
3665、 115 120 125
3666、pro gly tyr gly gly lys lys ala arg phe cys pro leu glu arg asn
3667、 130 135 140
3668、lys lys ser leu ala tyr ile pro tyr asn cys asn ala lys tyr val
3669、145 150 155 160
3670、cys gly gly val asn gly gly glu ser gln ala tyr ile glu leu ile
3671、 165 170 175
3672、glu glu leu asn arg arg ile asn ile asp leu asp asn ala ile val
3673、 180 185 190
3674、ala arg val his asp glu ser his leu asn lys tyr ile tyr gly arg
3675、 195 200 205
3676、gln gly val arg tyr leu gly pro glu phe cys asn pro asp asp leu
3677、 210 215 220
3678、thr leu met val glu lys lys ile arg leu leu asp lys asn lys tyr
3679、225 230 235 240
3680、leu asn ile asn lys leu lys asn ile lys asn glu asn phe phe gln
3681、 245 250 255
3682、lys trp arg arg arg phe ala lys tyr ser val cys glu ile gly tyr
3683、 260 265 270
3684、leu lys asp val phe met arg lys arg leu
3685、 275 280
3686、<210> 65
3687、<211> 177
3688、<212> prt
3689、<213> coxiella sp.
3690、<400> 65
3691、met asp lys asn ile gly lys tyr lys ile val met val ser ile cys
3692、1 5 10 15
3693、leu asn gln pro tyr trp gln tyr ile ser pro met ile glu ser ala
3694、 20 25 30
3695、arg lys phe leu leu lys gly his asp val asp phe phe val trp thr
3696、 35 40 45
3697、asp met pro glu glu thr asn leu gly gln gly val lys ile phe pro
3698、 50 55 60
3699、thr ala pro cys asp trp pro leu pro thr leu phe arg tyr his leu
3700、65 70 75 80
3701、phe leu gln gln glu glu leu leu lys gln tyr asp tyr ile phe tyr
3702、 85 90 95
3703、cys asp ala asp met leu phe val ser arg val gly asn glu ile leu
3704、 100 105 110
3705、gly glu gly leu thr ala ala ala his pro met tyr ala leu arg pro
3706、 115 120 125
3707、glu tyr ile his pro tyr glu pro asn ser gln ser thr ala tyr ile
3708、 130 135 140
3709、pro ser leu gly arg val leu glu asn pro lys arg phe glu pro phe
3710、145 150 155 160
3711、tyr ala ala gly gly phe gln gly gly arg thr glu asn phe ile gln
3712、 165 170 175
3713、ala
3714、<210> 66
3715、<211> 557
3716、<212> prt
3717、<213> desulfocurvibacter africanus pcs
3718、<400> 66
3719、met arg ile gly ile leu tyr ile cys thr gly lys tyr thr val phe
3720、1 5 10 15
3721、trp asn his phe phe thr ser cys glu gln his phe leu arg glu his
3722、 20 25 30
3723、glu lys his tyr tyr ile phe thr asp gly glu ile ala his leu asn
3724、 35 40 45
3725、cys asn arg val his arg ile glu gln gln his leu gly trp pro asp
3726、 50 55 60
3727、ser thr leu lys arg phe his met phe glu arg ile ala asp thr leu
3728、65 70 75 80
3729、arg gln asn ser asp phe ile val phe phe asn ala asn met val phe
3730、 85 90 95
3731、leu arg asp val gly lys glu phe leu pro thr arg glu gln ala leu
3732、 100 105 110
3733、val phe his arg his pro gly leu phe arg arg pro ala trp leu leu
3734、 115 120 125
3735、pro tyr glu arg arg pro glu ser thr ala tyr ile pro tyr gly ser
3736、 130 135 140
3737、gly ser ile tyr val cys gly gly val asn gly gly tyr thr gln pro
3738、145 150 155 160
3739、tyr leu asp phe val ala met leu arg arg asn ile asp ile asp val
3740、 165 170 175
3741、glu arg gly ile ile ala arg trp his asp glu ser his ile asn arg
3742、 180 185 190
3743、phe val ile gly arg his tyr lys ile gly his pro gly tyr val tyr
3744、 195 200 205
3745、pro asp arg arg asn leu pro phe pro arg ile ile arg val ile asp
3746、 210 215 220
3747、lys ala ser val gly gly his thr phe leu arg gly gln thr pro glu
3748、225 230 235 240
3749、pro ala pro glu glu gln ser lys thr val ala lys lys leu arg ser
3750、 245 250 255
3751、gln leu lys arg pro cys met pro arg ala ala gln asp glu pro ile
3752、 260 265 270
3753、ile leu ala arg met met gly gly leu gly asn gln met phe ile tyr
3754、 275 280 285
3755、ala ala ala arg val leu ala glu arg gln gly ala gln leu his leu
3756、 290 295 300
3757、asp thr gly lys leu ser gly asp ser ile arg gln tyr asp leu pro
3758、305 310 315 320
3759、ala phe ser ile asp ala pro leu trp his ile pro cys gly cys asp
3760、 325 330 335
3761、arg ile val gln ala trp phe ala leu arg his val ala ala gly cys
3762、 340 345 350
3763、gly met pro lys pro thr met gln val leu arg ser gly phe his leu
3764、 355 360 365
3765、asp gln arg phe phe ser ile arg his ser ala tyr leu ile gly tyr
3766、 370 375 380
3767、trp gln ser pro his tyr trp arg gly his glu asp arg val arg ser
3768、385 390 395 400
3769、ser phe asp leu thr arg phe glu arg pro his leu arg glu ala leu
3770、 405 410 415
3771、ala ala val ser gln pro asn thr ile ser val his leu arg arg gly
3772、 420 425 430
3773、asp phe arg ala pro lys asn ser asp lys his leu leu ile asp gly
3774、 435 440 445
3775、ser tyr tyr glu arg ala arg lys leu leu leu glu met thr pro gln
3776、 450 455 460
3777、ser his phe tyr ile phe ser asp glu pro glu glu ala gln arg leu
3778、465 470 475 480
3779、phe ala his trp glu asn thr ser phe gln pro arg arg ser gln glu
3780、 485 490 495
3781、glu asp leu leu leu met ser arg cys ser ala ser ile ile ala asn
3782、 500 505 510
3783、ser ser phe ser trp trp gly ala trp leu gly arg pro lys gln his
3784、 515 520 525
3785、val ile ala pro arg met trp phe thr arg asp val leu met his thr
3786、 530 535 540
3787、tyr thr leu asp leu phe pro glu lys trp ile leu leu
3788、545 550 555
3789、<210> 67
3790、<211> 239
3791、<212> prt
3792、<213> desulfocurvibacter africanus pcs
3793、<400> 67
3794、met arg val ala val leu tyr ile cys thr gly lys tyr thr val phe
3795、1 5 10 15
3796、trp asp gly phe phe arg ser ser glu leu phe phe met arg ser his
3797、 20 25 30
3798、glu lys his tyr phe val phe thr asp gly his ile asp his thr asn
3799、 35 40 45
3800、asp ser arg val his arg ile gln gln lys lys leu gly trp pro tyr
3801、 50 55 60
3802、asp thr leu his arg phe his met phe ser cys ile glu ser glu leu
3803、65 70 75 80
3804、gln ser phe asp phe ile leu tyr ile asn ala asn ser tyr phe val
3805、 85 90 95
3806、thr glu cys gly asp asp val leu pro lys his lys asp his leu leu
3807、 100 105 110
3808、leu thr leu his pro gly tyr trp his ser lys tyr arg leu leu arg
3809、 115 120 125
3810、trp lys leu pro tyr glu arg asp val arg ser thr ala tyr ile pro
3811、 130 135 140
3812、tyr trp lys gly gly arg tyr val cys gly gly leu asn gly gly trp
3813、145 150 155 160
3814、arg asp ser tyr leu arg leu ile arg glu leu lys glu ala ile asp
3815、 165 170 175
3816、val asp gly ile asn gly ile val ala arg trp his asp glu ser his
3817、 180 185 190
3818、leu asn arg tyr ala leu glu his pro ala lys leu leu his pro gly
3819、 195 200 205
3820、tyr met his pro ala gly glu lys leu pro phe pro lys ile val his
3821、 210 215 220
3822、leu phe his lys lys asp phe gly gly his asp phe leu arg ser
3823、225 230 235
3824、<210> 68
3825、<211> 282
3826、<212> prt
3827、<213> gemmiger formicilis
3828、<400> 68
3829、met lys thr leu ala ile leu tyr ile cys thr gly pro tyr ala val
3830、1 5 10 15
3831、phe trp his asp phe tyr pro asn phe lys ala asn phe leu pro asp
3832、 20 25 30
3833、cys asp arg ile phe tyr val phe thr asp ala ala his ile asp tyr
3834、 35 40 45
3835、glu asp ala pro asp val arg arg ile tyr gln lys ala leu pro trp
3836、 50 55 60
3837、pro gln ser thr met leu arg phe asp ala phe leu gly gln ala asp
3838、65 70 75 80
3839、ala leu gln gly tyr asp tyr leu phe phe ala asn ala asn leu his
3840、 85 90 95
3841、cys thr arg val ile arg ala asp glu leu leu pro asp pro ala ala
3842、 100 105 110
3843、gly gln ser leu thr ala val cys his leu pro tyr tyr gly lys asn
3844、 115 120 125
3845、pro ile phe his pro tyr asp arg ser gly lys ser arg ala ser ile
3846、 130 135 140
3847、pro tyr ser cys gly gln tyr tyr val ala gly gly leu asn gly gly
3848、145 150 155 160
3849、thr ala ala ala tyr leu ala leu cys arg glu leu lys lys arg thr
3850、 165 170 175
3851、asp glu asp leu gln asn asn val ile ala arg phe his asp glu ser
3852、 180 185 190
3853、gln leu asn arg leu val ala glu thr pro gly lys phe arg ile leu
3854、 195 200 205
3855、pro pro asp tyr cys thr pro glu glu thr pro thr gly his glu ala
3856、 210 215 220
3857、ile leu val leu gln lys ser arg cys ile asn val glu ser val lys
3858、225 230 235 240
3859、gly ala ala lys pro gln asn phe val gln arg lys trp glu ala phe
3860、 245 250 255
3861、arg leu asn trp leu pro tyr leu trp leu ala arg asp thr leu leu
3862、 260 265 270
3863、arg arg arg ile asp phe lys asn asp leu
3864、 275 280
3865、<210> 69
3866、<211> 276
3867、<212> prt
3868、<213> gemmiger formicilis
3869、<400> 69
3870、met thr lys val ala ala leu tyr ile ala thr gly arg tyr thr val
3871、1 5 10 15
3872、phe trp pro glu phe tyr glu ser ala glu lys tyr leu leu lys asp
3873、 20 25 30
3874、cys glu val his tyr phe val phe thr asp thr ala thr leu pro gly
3875、 35 40 45
3876、asp asp asn pro arg val his ile cys ala gln glu ala tyr ser trp
3877、 50 55 60
3878、pro phe ala thr leu arg arg phe glu ile phe leu lys gln glu gln
3879、65 70 75 80
3880、ala leu lys ala phe asp tyr ile phe phe phe asn ala asn ala glu
3881、 85 90 95
3882、phe met gln pro val thr arg glu met leu leu pro arg ala glu lys
3883、 100 105 110
3884、gly glu his leu leu val val gln his pro ser phe tyr ala lys pro
3885、 115 120 125
3886、asn tyr glu phe thr tyr asp arg asn pro arg ser thr ala cys ile
3887、 130 135 140
3888、pro tyr gly leu gly lys tyr tyr val cys gly gly val asn gly gly
3889、145 150 155 160
3890、glu ala ala ala phe leu gln leu cys his thr leu asp ala arg ile
3891、 165 170 175
3892、arg arg asp leu gln arg asn val ile ala leu trp his asp glu ser
3893、 180 185 190
3894、gln ile asn arg tyr ile leu phe arg lys asp phe arg val leu thr
3895、 195 200 205
3896、pro ala phe cys tyr pro glu gly trp asp his leu pro phe pro cys
3897、 210 215 220
3898、ile ile arg ile arg ser lys ala arg tyr ile asp ile pro ala leu
3899、225 230 235 240
3900、arg lys asp ala pro glu thr lys leu ser pro ala val ala arg trp
3901、 245 250 255
3902、asn his phe ala met arg ala ala arg trp thr gln asn his ile phe
3903、 260 265 270
3904、lys lys gly ser
3905、 275
3906、<210> 70
3907、<211> 437
3908、<212> prt
3909、<213> guillardia theta
3910、<400> 70
3911、met arg arg leu ile phe phe leu leu leu leu leu gln ala arg gly
3912、1 5 10 15
3913、ala glu asp arg thr asp ser gln asp val ala val thr ile thr arg
3914、 20 25 30
3915、pro glu asp gly glu arg val arg gly asp val val pro leu glu val
3916、 35 40 45
3917、ser ala met ser ser arg arg gly ser arg val ile leu tyr met asp
3918、 50 55 60
3919、gly arg glu val tyr arg thr glu glu arg ala val ser leu gln met
3920、65 70 75 80
3921、ser gln leu gln val gly tyr his val met glu val gln leu thr glu
3922、 85 90 95
3923、glu asp glu ala val ala tyr asp ser val gly arg thr ala gln glu
3924、 100 105 110
3925、phe phe tyr val gly asp gly met leu ala pro asp leu asp asp thr
3926、 115 120 125
3927、glu his val asn ile leu ser asn val thr thr ile asp asp met glu
3928、 130 135 140
3929、arg val ala ile gln his tyr glu arg gly gln leu asp leu ser gly
3930、145 150 155 160
3931、arg glu met ser glu gln ser tyr val arg leu ile ser ala met ser
3932、 165 170 175
3933、asn ala pro gly ala thr met pro arg leu leu ala ser leu gly arg
3934、 180 185 190
3935、val leu met ala lys lys asp tyr ile gly ala leu gln ala tyr arg
3936、 195 200 205
3937、gly asp glu val arg leu phe glu met his asp lys thr ser lys arg
3938、 210 215 220
3939、leu glu ala arg ala ala cys pro val lys ala ile gly thr pro his
3940、225 230 235 240
3941、ala pro gln leu leu lys val gly ile leu thr val ala ser gly arg
3942、 245 250 255
3943、tyr ala ser phe val arg ser thr val ser ser ala glu ser tyr leu
3944、 260 265 270
3945、leu arg ile tyr gly leu leu ser asp leu cys met gly arg glu gly
3946、 275 280 285
3947、lys gly leu met leu lys gly pro trp glu asp gly arg val his ala
3948、 290 295 300
3949、val tyr arg lys his asp gly trp pro ser ala ser met lys arg ala
3950、305 310 315 320
3951、his ser tyr leu glu his ala glu leu trp gly ala met asp tyr val
3952、 325 330 335
3953、phe ala val asp val gly glu thr val gly thr leu his ala asp asn
3954、 340 345 350
3955、ala phe tyr asp gly ser glu val val gly arg phe gln lys ala trp
3956、 355 360 365
3957、ser val asn ala glu pro gly thr met trp arg gln his his gly asn
3958、 370 375 380
3959、ala ala leu val thr arg ala val tyr glu lys arg glu glu ser thr
3960、385 390 395 400
3961、ala gly met arg ala gly glu gly arg his tyr phe ala gly gly phe
3962、 405 410 415
3963、tyr gly gly arg ser gln lys val leu glu met leu lys glu leu val
3964、 420 425 430
3965、lys arg thr asn gln
3966、 435
3967、<210> 71
3968、<211> 927
3969、<212> prt
3970、<213> guillardia theta
3971、<400> 71
3972、met ala met trp arg leu ala met ala met leu val val val ser thr
3973、1 5 10 15
3974、met gly gly gly gly asp ala arg gly arg arg glu asp asp glu ile
3975、 20 25 30
3976、pro ile arg val his ala thr ser pro met arg gly trp val leu val
3977、 35 40 45
3978、arg gly lys leu pro val ser phe phe leu ser tyr gly asn ser ser
3979、 50 55 60
3980、arg ser gly ala cys arg ala gly ser gln arg leu ser met arg ile
3981、65 70 75 80
3982、ile val asp glu glu thr tyr glu glu val asp ile ser asn gly ala
3983、 85 90 95
3984、ala tyr ser lys val phe pro ala asp leu ser pro gly val his thr
3985、 100 105 110
3986、ile arg ile glu gly ala glu ser thr arg pro phe leu gln gln glu
3987、 115 120 125
3988、glu ile ser phe ser val val asp ser glu asp asp phe his asp val
3989、 130 135 140
3990、arg his tyr asp glu ile met gly ser ala pro thr ile asp asp ser
3991、145 150 155 160
3992、arg gly phe thr ser gly lys pro leu lys gly val ala ile leu tyr
3993、 165 170 175
3994、his lys gln ala arg leu lys tyr glu asp arg trp ile glu lys cys
3995、 180 185 190
3996、ile glu ser ile leu asn gln asn tyr pro phe phe asp ile val glu
3997、 195 200 205
3998、leu asn tyr gly gly glu tyr his ser phe met gln gln tyr leu his
3999、 210 215 220
4000、arg leu glu gly lys arg tyr thr phe phe ser arg glu phe gln ser
4001、225 230 235 240
4002、his ala val ala met asn phe leu leu asp trp val phe ser glu asp
4003、 245 250 255
4004、tyr asp val ala phe asn val asn leu asp asp tyr tyr ser pro asp
4005、 260 265 270
4006、arg phe lys leu gln ala glu ala val met glu gly ala asp leu val
4007、 275 280 285
4008、ser ser tyr phe val arg val val glu ala gly glu gly val asp val
4009、 290 295 300
4010、ile asn thr lys met asn pro val tyr leu thr ala gln glu leu leu
4011、305 310 315 320
4012、gly arg asp his val ser glu glu asp ile phe ser gln leu arg glu
4013、 325 330 335
4014、asp his asn val ile cys his pro gly val ala tyr ser arg ser phe
4015、 340 345 350
4016、trp lys thr leu ser ser leu asn cys lys gln gly leu ala glu ser
4017、 355 360 365
4018、ser gln asp ala gln trp his ala arg ser asn thr leu his gln his
4019、 370 375 380
4020、ala arg val cys ser asp ser ala asp leu glu asn leu phe arg pro
4021、385 390 395 400
4022、leu arg tyr arg pro glu leu pro ala glu asp leu arg leu trp gln
4023、 405 410 415
4024、arg ala val leu met ser ser val lys thr val ile val pro arg val
4025、 420 425 430
4026、leu val phe tyr arg ile his glu ser gln leu ser pro ser asp glu
4027、 435 440 445
4028、ala val asn val lys tyr arg ala asp leu thr val ser gly ala met
4029、 450 455 460
4030、leu asn lys met arg val gly ile leu thr ile cys thr gly arg gln
4031、465 470 475 480
4032、glu thr tyr ser gly arg leu arg tyr cys ala tyr leu pro glu his
4033、 485 490 495
4034、ile arg thr val arg glu arg phe val ser glu his his leu cys phe
4035、 500 505 510
4036、phe thr phe thr asp asp pro arg gly ala glu glu ile phe ser arg
4037、 515 520 525
4038、met pro ser pro ser glu val ile pro ile arg gly arg gly phe pro
4039、 530 535 540
4040、ala asp thr leu tyr arg tyr his tyr phe leu ser gln ser ser lys
4041、545 550 555 560
4042、leu lys thr glu thr asp val val phe tyr leu asp val asp val ile
4043、 565 570 575
4044、val glu lys gly ile ala ala ala pro cys cys his pro thr tyr asp
4045、 580 585 590
4046、ser arg arg his gly asn thr arg asp lys asn ser phe glu ser ile
4047、 595 600 605
4048、tyr arg ser trp ser ser ala val leu leu val leu val leu val leu
4049、 610 615 620
4050、val leu val leu val leu val leu val leu val leu val leu leu pro
4051、625 630 635 640
4052、leu cys ile val ser phe leu ser his arg asp cys ser phe ala asn
4053、 645 650 655
4054、ser tyr his arg his ile leu asp his pro ile ser glu his leu arg
4055、 660 665 670
4056、pro cys tyr phe ala gly gly phe ile gly gly arg thr asp glu phe
4057、 675 680 685
4058、leu gln met ser ala ala ile ser glu ala ile asp arg asp asp glu
4059、 690 695 700
4060、asn asp val ile asn glu ser leu gln pro arg leu lys leu ala met
4061、705 710 715 720
4062、gln val val ala leu trp his asp glu ser his leu asn arg tyr leu
4063、 725 730 735
4064、ser his his pro gln leu val arg ile leu ser pro ser tyr leu tyr
4065、 740 745 750
4066、pro asp gly trp asp ile pro phe pro arg arg ile ala val gln lys
4067、 755 760 765
4068、ile pro his glu ala thr arg phe ser arg glu arg phe val ser val
4069、 770 775 780
4070、cys ile gln his ala asn gly val cys asn met gly glu ser leu gly
4071、785 790 795 800
4072、arg met met thr ala val ala ser gly val ala leu ala ala ala leu
4073、 805 810 815
4074、asn asp asp gln asp glu asp ala gly arg leu gln val leu leu pro
4075、 820 825 830
4076、leu asn trp cys tyr gly asp ser lys val ile cys gly gly asn arg
4077、 835 840 845
4078、ser lys glu arg leu ser tyr arg his ser trp leu ser asn phe arg
4079、 850 855 860
4080、arg ser asp ser ile his glu ile pro phe his leu leu his thr ser
4081、865 870 875 880
4082、ser ile gly ala val gly gln glu gly ser phe ala ile pro glu pro
4083、 885 890 895
4084、ser met arg ala val ser ser gly ile pro gly gly val phe leu met
4085、 900 905 910
4086、glu val pro leu gln leu ser his leu arg ser ser his arg val
4087、 915 920 925
4088、<210> 72
4089、<211> 382
4090、<212> prt
4091、<213> helicobacter sp. 11s02629-2
4092、<400> 72
4093、met gln asp ile glu leu glu ser lys lys asp thr phe glu ser pro
4094、1 5 10 15
4095、pro pro pro ile asn asn leu ser gln lys asp ile asp lys met lys
4096、 20 25 30
4097、ile ala ile leu tyr ile ala thr gly arg tyr asp val phe phe glu
4098、 35 40 45
4099、asp phe tyr lys ser met glu lys phe phe ile lys asp ala ser lys
4100、 50 55 60
4101、his tyr phe val trp thr asp ser lys lys ile glu thr asn gly asn
4102、65 70 75 80
4103、ile thr lys ile tyr gln glu lys leu gly trp pro tyr asp thr leu
4104、 85 90 95
4105、leu arg tyr asp met phe trp lys ile lys asp glu leu ser asn phe
4106、 100 105 110
4107、asp tyr ile phe phe phe asn ala asn met val val lys gln glu ile
4108、 115 120 125
4109、phe lys asp glu phe leu pro asp thr lys ser gly leu val gly cys
4110、 130 135 140
4111、leu his pro gly phe ile lys ile gly leu asp leu lys ile tyr pro
4112、145 150 155 160
4113、ser arg asn ala lys lys phe thr tyr asp lys asn pro lys ser leu
4114、 165 170 175
4115、ala phe ile glu glu gly arg gly ser ala tyr tyr ala gly gly leu
4116、 180 185 190
4117、asn gly gly ser lys asp ala tyr leu lys leu ile lys thr leu lys
4118、 195 200 205
4119、asp asn ile gln thr asp met asp asn gly val thr ala leu trp his
4120、 210 215 220
4121、asp glu ser his ile asn lys tyr phe leu asp lys glu ile lys ala
4122、225 230 235 240
4123、leu ser ser met phe leu lys pro glu gly trp tyr phe asn ile asp
4124、 245 250 255
4125、lys ala phe val met asp glu glu cys met gln asp gly leu lys arg
4126、 260 265 270
4127、lys glu phe thr glu asn leu cys ser lys ala thr leu ile pro arg
4128、 275 280 285
4129、asp leu leu ile lys leu leu glu lys gln tyr gly phe lys asn tyr
4130、 290 295 300
4131、glu ser arg tyr his phe met lys asp ala ile asn asp tyr phe asp
4132、305 310 315 320
4133、leu glu lys his thr lys ile leu leu leu asp lys ala asn pro lys
4134、 325 330 335
4135、tyr gly gly his ala tyr leu arg gly glu lys arg phe lys ser ile
4136、 340 345 350
4137、ser ile glu tyr arg phe lys ser ile lys thr leu lys lys ile ala
4138、 355 360 365
4139、ser ser ile lys ala lys leu lys arg phe lys ser leu arg
4140、 370 375 380
4141、<210> 73
4142、<211> 389
4143、<212> prt
4144、<213> helicobacter sp. 13s00401-1
4145、<400> 73
4146、met ile his ala ser lys lys tyr lys ser tyr thr lys leu his ser
4147、1 5 10 15
4148、tyr pro pro pro pro ser asn ile gln thr leu pro ser glu asp lys
4149、 20 25 30
4150、ser lys met lys ile ala ile leu tyr ile ser thr gly arg tyr asp
4151、 35 40 45
4152、ile phe phe lys lys phe his lys thr met gln lys phe phe ile lys
4153、 50 55 60
4154、gly ala gln lys his tyr phe val trp thr asp ser lys lys ile lys
4155、65 70 75 80
4156、asn thr lys asp ile thr lys ile tyr gln glu lys leu gly trp pro
4157、 85 90 95
4158、tyr asp thr leu met arg tyr his met phe tyr glu ile arg asp arg
4159、 100 105 110
4160、leu lys glu phe asp tyr ile tyr phe phe asn ala asn ile val ile
4161、 115 120 125
4162、lys gln glu ile thr lys asp glu phe leu pro asn thr lys ser gly
4163、 130 135 140
4164、leu val gly cys leu his pro gly phe ile asp leu asp leu glu phe
4165、145 150 155 160
4166、asn ile val pro lys lys asp ala ala lys phe thr tyr asp arg asn
4167、 165 170 175
4168、glu lys ser leu ala tyr ile lys glu gly asp gly leu ala tyr tyr
4169、 180 185 190
4170、ala gly gly leu asn gly gly ala lys asp ala tyr leu lys leu ile
4171、 195 200 205
4172、lys asp leu arg asp asn ile gln gln asp leu asp lys gly ile val
4173、 210 215 220
4174、ala leu trp his asp glu ser his ile asn lys tyr phe leu asp lys
4175、225 230 235 240
4176、glu ile lys ala leu pro ser thr phe leu val pro glu gly trp glu
4177、 245 250 255
4178、phe ser ile ser asp lys phe ile met asp glu glu cys met lys asp
4179、 260 265 270
4180、glu leu lys lys lys glu phe thr lys asn leu leu ser arg leu asn
4181、 275 280 285
4182、leu ile pro ser leu glu leu glu lys leu leu ala lys gln ser glu
4183、 290 295 300
4184、leu lys ser tyr glu asp arg arg cys phe met gln thr ala ile asn
4185、305 310 315 320
4186、gly tyr phe asp leu lys lys his thr lys ile leu leu leu glu lys
4187、 325 330 335
4188、ser asn pro lys tyr gly gly his asp tyr leu arg gly glu lys gln
4189、 340 345 350
4190、his lys asn val ser leu arg tyr tyr ile ser arg val asn val ala
4191、 355 360 365
4192、arg lys leu ala ser leu ile lys arg arg leu lys lys tyr ile lys
4193、 370 375 380
4194、arg asn asp lys ile
4195、385
4196、<210> 74
4197、<211> 275
4198、<212> prt
4199、<213> lachnospiraceae bacterium
4200、<400> 74
4201、met val ser arg met asp ser asn leu lys ile ala ile leu tyr ile
4202、1 5 10 15
4203、cys thr gly glu tyr asn val phe trp lys asp phe tyr ile ser phe
4204、 20 25 30
4205、glu lys phe phe leu thr ser tyr glu lys his tyr phe val phe thr
4206、 35 40 45
4207、asp ala lys lys ile tyr asn glu asp cys tyr lys arg ile his lys
4208、 50 55 60
4209、ile tyr gln lys asn leu gly trp pro glu asn thr leu phe arg tyr
4210、65 70 75 80
4211、glu met phe phe ser ile arg glu tyr leu lys glu phe asp tyr thr
4212、 85 90 95
4213、phe phe phe asn ala asn val ile cys lys asp val ile val gly glu
4214、 100 105 110
4215、glu phe leu pro leu lys glu gly leu leu val val gln his pro gly
4216、 115 120 125
4217、phe phe asp val pro asn tyr arg phe pro tyr asp arg asn lys lys
4218、 130 135 140
4219、ser ser ala tyr ile pro tyr gly lys gly gln val tyr val cys gly
4220、145 150 155 160
4221、gly ile asn gly gly lys thr asn val phe leu asp leu ile lys glu
4222、 165 170 175
4223、leu lys asn arg ile glu leu asp tyr lys lys gly ile ile ala leu
4224、 180 185 190
4225、trp his asp glu ser gln ile asn lys tyr ile leu glu his ser ala
4226、 195 200 205
4227、tyr lys leu leu ser pro ser tyr cys tyr pro glu gly trp asn ile
4228、 210 215 220
4229、pro phe ile pro lys leu val val leu asp lys asn lys phe ile asp
4230、225 230 235 240
4231、val ser asn ile lys lys thr asn glu arg asn glu phe ile ile lys
4232、 245 250 255
4233、ile lys arg tyr leu ile cys lys phe tyr asp leu tyr tyr trp phe
4234、 260 265 270
4235、arg arg gly
4236、 275
4237、<210> 75
4238、<211> 258
4239、<212> prt
4240、<213> marinomonas polaris
4241、<400> 75
4242、met ser lys ile gly val leu tyr ile cys thr gly lys tyr ala ala
4243、1 5 10 15
4244、phe trp asp gly phe tyr ala ser ala lys glu asn leu cys ile asp
4245、 20 25 30
4246、ser gln leu ile phe tyr val phe thr asp cys glu ala leu leu asn
4247、 35 40 45
4248、leu gln leu asp asp val arg phe ile tyr lys lys ser glu ser trp
4249、 50 55 60
4250、pro met pro thr leu met arg phe ser thr phe leu ser gln glu lys
4251、65 70 75 80
4252、lys tyr leu glu val asp tyr leu leu phe cys asn ala asn leu ile
4253、 85 90 95
4254、ile glu gln pro ile ala thr ala glu ile phe phe asp lys pro tyr
4255、 100 105 110
4256、phe ala thr ile his pro gly his val gly lys asp pro gln lys phe
4257、 115 120 125
4258、pro tyr glu lys asn ser asn ser leu ala tyr ile asn asn ala ala
4259、 130 135 140
4260、pro tyr tyr val cys gly gly phe asn gly gly arg arg glu asp phe
4261、145 150 155 160
4262、val lys met cys glu leu leu ser arg asn ile asp lys asp leu glu
4263、 165 170 175
4264、asn asn ile ile ala val trp his asp glu thr his phe asn lys phe
4265、 180 185 190
4266、tyr ser glu arg leu asn leu phe asn val leu pro ala lys tyr cys
4267、 195 200 205
4268、gln pro gln gly trp pro ala lys asp asp pro ile ile thr val leu
4269、 210 215 220
4270、asn lys glu phe val ile gly val ser asn lys gly ala phe tyr ser
4271、225 230 235 240
4272、ile arg tyr tyr leu ser lys leu tyr arg arg ile arg ser ile leu
4273、 245 250 255
4274、ile ser
4275、<210> 76
4276、<211> 266
4277、<212> prt
4278、<213> marmoricola scoriae
4279、<400> 76
4280、met ser ala ala thr thr ala gly pro arg val ser leu ile val ile
4281、1 5 10 15
4282、ala thr gly arg tyr leu ser phe leu glu pro leu leu val ser ala
4283、 20 25 30
4284、arg arg his val val gly leu asp arg val phe val leu ser asp leu
4285、 35 40 45
4286、arg pro pro asp asp pro thr val gln trp leu pro trp gly his leu
4287、 50 55 60
4288、pro trp pro tyr pro thr leu leu arg tyr arg ala ile ser ala tyr
4289、65 70 75 80
4290、arg arg val leu glu gln thr asp val leu leu tyr val asp val asp
4291、 85 90 95
4292、met leu phe val gly thr phe asp val ser ala thr ala gly leu val
4293、 100 105 110
4294、ala val arg his pro gly phe ala glu ser ser arg ala gln leu pro
4295、 115 120 125
4296、tyr glu thr asp val arg ser arg ala phe val pro pro glu leu gly
4297、 130 135 140
4298、thr val tyr val ala gly gly val gln gly gly arg ala gly asp tyr
4299、145 150 155 160
4300、leu asp ala cys glu leu met ala glu glu val gln leu asp leu asp
4301、 165 170 175
4302、gly gly ile val pro thr trp his asp glu ser val trp asn ala phe
4303、 180 185 190
4304、cys ala arg arg pro pro asp thr leu leu ser val his his cys thr
4305、 195 200 205
4306、pro glu lys glu val gly pro glu thr leu leu val ala leu asp lys
4307、 210 215 220
4308、asp his asp his phe arg glu val pro his leu glu arg ala arg arg
4309、225 230 235 240
4310、arg leu leu gln gln leu gln arg val arg ala ala val val arg ala
4311、 245 250 255
4312、val arg pro ala val arg val val arg arg
4313、 260 265
4314、<210> 77
4315、<211> 250
4316、<212> prt
4317、<213> muribaculaceae bacterium
4318、<400> 77
4319、met lys ile gly met leu tyr ile gly ile gly arg tyr ala ala phe
4320、1 5 10 15
4321、trp pro glu phe tyr arg ser ala arg glu tyr phe leu pro asp ala
4322、 20 25 30
4323、thr lys his phe phe val phe ala asp ala pro leu glu asp ala gly
4324、 35 40 45
4325、asp asp val ser val phe his asn asp asp met gly trp pro leu asn
4326、 50 55 60
4327、ser leu trp arg tyr his met phe leu arg ile ala asp arg leu lys
4328、65 70 75 80
4329、glu tyr asp tyr leu phe phe phe asn ala asn cys lys phe val arg
4330、 85 90 95
4331、arg val glu pro ser asp ile leu pro gln gly asp val glu tyr cys
4332、 100 105 110
4333、ala met cys thr gln thr asp pro ala lys met ser leu glu ser arg
4334、 115 120 125
4335、pro glu cys ala ser tyr val ala pro gly ser val ser arg tyr trp
4336、 130 135 140
4337、ala gly gly ile asn gly gly arg ala glu ala phe leu arg leu ala
4338、145 150 155 160
4339、arg glu cys ala ala ile ala glu arg asp leu ala asn gly phe met
4340、 165 170 175
4341、pro val trp his asp glu ser val val asn his phe phe ala asp lys
4342、 180 185 190
4343、lys val arg ala leu asp arg arg met gly cys pro ser gln trp lys
4344、 195 200 205
4345、ser pro ala asp pro phe val ile leu arg arg lys asp asp val leu
4346、 210 215 220
4347、gly arg ser trp leu arg thr tyr lys gly arg lys his ser ser phe
4348、225 230 235 240
4349、trp lys lys leu phe arg lys leu arg lys
4350、 245 250
4351、<210> 78
4352、<211> 258
4353、<212> prt
4354、<213> neisseriaceae bacterium
4355、<400> 78
4356、met lys ile ala ile leu tyr ile cys thr gly lys tyr asp ile phe
4357、1 5 10 15
4358、trp ser asp phe tyr ser thr ser gln lys tyr phe cys thr thr glu
4359、 20 25 30
4360、asp lys his tyr phe val phe thr asp ser glu gln ile lys ala asp
4361、 35 40 45
4362、his asn val ser val ile tyr gln asp ser leu gly trp pro phe asn
4363、 50 55 60
4364、thr leu tyr arg tyr arg met phe leu arg val gln his lys leu ser
4365、65 70 75 80
4366、lys phe asp lys val ile phe phe asn gly asn cys thr phe val asp
4367、 85 90 95
4368、gln ile asp tyr glu asn phe phe gly arg ser ser thr leu val ala
4369、 100 105 110
4370、cys leu his pro gly phe leu asn lys asn cys glu glu phe thr tyr
4371、 115 120 125
4372、glu lys arg lys asn ser leu ala phe val gly ser pro trp lys tyr
4373、 130 135 140
4374、phe ala gly gly ile asn gly gly asn ala asn glu ile leu lys ile
4375、145 150 155 160
4376、phe gln ile leu ser his asn ile glu asp asp leu lys asn gly ile
4377、 165 170 175
4378、val ala ile trp his asp glu ser his trp asn ala tyr leu asn asn
4379、 180 185 190
4380、asn tyr glu val leu lys asp lys leu his ile leu ser pro glu tyr
4381、 195 200 205
4382、leu tyr pro glu gly trp asp leu pro phe glu lys lys ile ile leu
4383、 210 215 220
4384、arg asp lys asn gln tyr gly gly his asn leu leu arg gly ala ala
4385、225 230 235 240
4386、gln his asn phe pro asn thr ile lys lys ile leu lys lys ile ile
4387、 245 250 255
4388、cys arg
4389、<210> 79
4390、<211> 265
4391、<212> prt
4392、<213> nocardioides sp. pd653
4393、<400> 79
4394、met ser ser glu thr thr arg val gly leu ile val ile ala thr gly
4395、1 5 10 15
4396、arg tyr val glu phe val asp gln leu leu ala ser ala his glu his
4397、 20 25 30
4398、val ala gly leu his arg leu tyr val leu ser asp arg arg pro pro
4399、 35 40 45
4400、asp asp pro arg ile val trp leu pro trp gly his ile gly trp pro
4401、 50 55 60
4402、tyr pro thr leu leu arg tyr arg ala ile ala ala his gln asp ile
4403、65 70 75 80
4404、leu arg glu cys asp ile leu val tyr ser asp val asp met arg phe
4405、 85 90 95
4406、val ala ser phe asp met thr gln ile arg gly ile phe ala val ser
4407、 100 105 110
4408、his pro gly tyr val gly ala thr pro asp ser leu pro tyr glu arg
4409、 115 120 125
4410、asn pro ala ser gln ala tyr val pro val gly ser gly leu glu tyr
4411、 130 135 140
4412、phe ala gly gly val gln gly gly arg ala glu ile tyr leu asp ala
4413、145 150 155 160
4414、cys glu gln met ala ala arg val gln glu asp leu asn ala gly ile
4415、 165 170 175
4416、val pro val trp his asp glu ser ile trp asn gly trp leu ile asp
4417、 180 185 190
4418、his pro pro asp leu val leu gly ser glu tyr cys thr pro glu thr
4419、 195 200 205
4420、ala ala gly pro gln ser val leu leu ala leu asp lys asp his ala
4421、 210 215 220
4422、arg leu arg gly thr pro trp gln val arg ser val glu arg leu val
4423、225 230 235 240
4424、arg ala arg arg ala leu arg arg arg ser arg ala ala ala arg val
4425、 245 250 255
4426、ala ala arg ala trp gly arg arg arg
4427、 260 265
4428、<210> 80
4429、<211> 274
4430、<212> prt
4431、<213> parabacteroides goldsteinii
4432、<400> 80
4433、met arg ile gly ile leu tyr ile cys thr gly arg tyr ser ile phe
4434、1 5 10 15
4435、trp lys lys phe tyr gln ser thr glu lys ser phe met gln gly leu
4436、 20 25 30
4437、pro cys ile arg glu tyr tyr val phe thr asp asn pro cys leu tyr
4438、 35 40 45
4439、gly glu lys lys asn lys arg ile his arg ile tyr gln glu asn leu
4440、 50 55 60
4441、gly trp pro asp asn thr leu met arg phe ser met phe leu lys ile
4442、65 70 75 80
4443、lys glu arg leu glu lys glu thr asp tyr leu tyr phe phe asn ala
4444、 85 90 95
4445、asn met val ile arg glu lys ile gly lys glu phe leu pro glu glu
4446、 100 105 110
4447、ser ser asn gly leu val gly leu ile his pro gly gly tyr asp arg
4448、 115 120 125
4449、glu val asn glu phe thr tyr asp arg asn glu lys ser thr ala tyr
4450、 130 135 140
4451、ile pro tyr gly glu gly arg tyr tyr tyr ala gly gly leu asn gly
4452、145 150 155 160
4453、gly arg thr pro ala phe leu lys met ser glu thr leu arg asp asn
4454、 165 170 175
4455、thr glu glu asp lys arg asn gly val met ala leu trp his asp glu
4456、 180 185 190
4457、ser his ile asn arg tyr phe leu asp his pro pro tyr ser leu thr
4458、 195 200 205
4459、pro ala tyr cys tyr pro glu gly trp asn met pro phe pro gln ile
4460、 210 215 220
4461、ile leu leu leu asp lys ser phe ile cys gly gly his lys tyr leu
4462、225 230 235 240
4463、arg gly gly lys arg asn phe his asp tyr thr ser tyr leu lys arg
4464、 245 250 255
4465、ser leu val arg phe ala arg lys val ile gly val leu arg gly phe
4466、 260 265 270
4467、gly leu
4468、<210> 81
4469、<211> 274
4470、<212> prt
4471、<213> parabacteroides goldsteinii
4472、<400> 81
4473、met arg ile gly ile leu tyr ile cys thr gly arg tyr ser ile phe
4474、1 5 10 15
4475、trp lys lys phe tyr gln ser thr glu lys ser phe met gln gly ser
4476、 20 25 30
4477、pro cys ile arg glu tyr tyr val phe thr asp asn pro cys leu tyr
4478、 35 40 45
4479、gly glu lys lys asn lys arg ile his arg ile tyr gln glu asn leu
4480、 50 55 60
4481、gly trp pro asp asn thr leu met arg phe ser met phe leu lys ile
4482、65 70 75 80
4483、lys glu arg leu glu lys glu thr asp tyr leu tyr phe phe asn ala
4484、 85 90 95
4485、asn met val ile arg glu lys ile gly lys glu phe leu pro glu glu
4486、 100 105 110
4487、ser ser asn gly leu val gly leu ile his ser gly gly tyr asp arg
4488、 115 120 125
4489、glu val asn glu phe thr tyr asp arg asn glu lys ser thr ala tyr
4490、 130 135 140
4491、ile pro tyr gly glu gly arg tyr tyr tyr ala gly gly leu asn gly
4492、145 150 155 160
4493、gly arg thr pro ala phe leu lys met ala glu thr leu arg asp asn
4494、 165 170 175
4495、thr glu glu asp lys arg asn gly val met ala leu trp his asp glu
4496、 180 185 190
4497、ser his ile asn arg tyr phe leu asp his pro pro tyr ser leu thr
4498、 195 200 205
4499、pro ala tyr cys tyr pro glu gly trp asn met pro phe pro gln ile
4500、 210 215 220
4501、ile leu leu leu asp lys ser phe ile cys gly gly his lys tyr leu
4502、225 230 235 240
4503、arg gly gly lys arg asn phe his asp tyr thr ser tyr leu lys arg
4504、 245 250 255
4505、ser leu val arg phe ala arg lys val ile gly val leu arg gly phe
4506、 260 265 270
4507、gly leu
4508、<210> 82
4509、<211> 274
4510、<212> prt
4511、<213> parabacteroides goldsteinii
4512、<400> 82
4513、met arg ile gly ile leu tyr ile cys thr gly arg tyr ser ile phe
4514、1 5 10 15
4515、trp lys lys phe tyr gln ser thr glu lys ser phe met gln gly leu
4516、 20 25 30
4517、pro cys ile arg glu tyr tyr val phe thr asp asn pro cys leu tyr
4518、 35 40 45
4519、gly glu lys lys asn lys arg ile his arg ile tyr gln glu asn leu
4520、 50 55 60
4521、gly trp pro asp asn thr leu met arg phe ser met phe leu lys ile
4522、65 70 75 80
4523、lys glu arg leu glu lys glu thr asp tyr leu tyr phe phe asn ala
4524、 85 90 95
4525、asn met val ile arg glu lys ile gly lys glu phe leu pro glu glu
4526、 100 105 110
4527、ser ser asn gly leu val gly leu ile his ser gly gly tyr asp arg
4528、 115 120 125
4529、glu val asn glu phe thr tyr asp arg asn glu lys ser thr ala tyr
4530、 130 135 140
4531、ile pro tyr gly glu gly arg tyr tyr tyr ala gly gly leu asn gly
4532、145 150 155 160
4533、gly arg thr pro ala phe leu lys met ala glu thr leu arg asp asn
4534、 165 170 175
4535、thr glu glu asp lys arg asn gly val met ala leu trp his asp glu
4536、 180 185 190
4537、ser his ile asn arg tyr phe leu asp his pro pro tyr ser leu thr
4538、 195 200 205
4539、pro ala tyr cys tyr pro glu gly trp asn met pro phe pro gln ile
4540、 210 215 220
4541、ile leu leu leu asp lys ser phe ile cys gly gly his lys tyr leu
4542、225 230 235 240
4543、arg gly gly lys arg asn phe his asp tyr thr ser tyr leu lys arg
4544、 245 250 255
4545、ser leu val arg phe ala arg lys val ile gly val leu arg gly phe
4546、 260 265 270
4547、gly leu
4548、<210> 83
4549、<211> 272
4550、<212> prt
4551、<213> parabacteroides gordonii ms-1
4552、<400> 83
4553、met arg ile gly ile leu tyr ile cys thr gly lys tyr ser ile phe
4554、1 5 10 15
4555、trp lys lys phe tyr lys ser ala glu arg tyr leu met gln gly tyr
4556、 20 25 30
4557、pro cys ile arg glu tyr tyr val phe thr asp ala pro ser val tyr
4558、 35 40 45
4559、gly glu lys glu asn gly his ile his arg ile tyr gln glu asn leu
4560、 50 55 60
4561、gly trp pro arg asn thr leu met arg phe his met phe leu arg ile
4562、65 70 75 80
4563、lys lys gln leu glu arg glu thr asp tyr leu tyr phe phe asn ala
4564、 85 90 95
4565、asn met gln phe arg val pro val gly lys glu phe leu pro asp asp
4566、 100 105 110
4567、phe ser asn gly leu val gly cys met phe pro trp ser tyr asn glu
4568、 115 120 125
4569、thr asn leu glu phe gly tyr asp arg asn pro met ser thr ala tyr
4570、 130 135 140
4571、ile pro glu gly glu gly asp phe tyr tyr ala gly ala leu ile gly
4572、145 150 155 160
4573、gly lys thr glu ala phe leu lys met ser glu thr ile leu asn asn
4574、 165 170 175
4575、ile gln glu asp glu lys lys gly val ile ala leu trp his asp glu
4576、 180 185 190
4577、ser his leu asn arg tyr phe met asp asn pro pro lys cys leu thr
4578、 195 200 205
4579、pro ala tyr cys tyr pro glu arg trp lys ser pro phe pro glu ile
4580、 210 215 220
4581、ile arg leu phe asp lys asn gly ser trp gly gly tyr ala tyr leu
4582、225 230 235 240
4583、arg gly glu lys ala gly val lys asp tyr leu arg ser tyr lys val
4584、 245 250 255
4585、lys ile lys tyr met ile met pro phe tyr arg phe val cys arg lys
4586、 260 265 270
4587、<210> 84
4588、<211> 256
4589、<212> prt
4590、<213> parachlamydia acanthamoebae
4591、<400> 84
4592、met val thr arg gly phe cys met leu thr arg ser leu lys ile leu
4593、1 5 10 15
4594、ile gly leu cys leu leu phe ser his ala leu tyr ala ala asn val
4595、 20 25 30
4596、gly leu leu val met ala thr gly lys tyr val ser phe val pro pro
4597、 35 40 45
4598、leu val lys ser ala asp his phe phe cys lys asn his lys val thr
4599、 50 55 60
4600、tyr phe val phe thr asp gly tyr leu glu pro met pro asn val val
4601、65 70 75 80
4602、pro ile phe his ala lys met gly trp pro tyr asp thr met met arg
4603、 85 90 95
4604、tyr his val tyr asp met his arg asp ala phe ala gly gln asp tyr
4605、 100 105 110
4606、leu tyr ala cys asp ala asp met leu phe val gly glu val gly asp
4607、 115 120 125
4608、glu ile leu gly asn arg val ala thr arg his pro gly phe ile asn
4609、 130 135 140
4610、arg pro lys ser ser tyr thr tyr glu arg asn pro leu ser thr ala
4611、145 150 155 160
4612、tyr ile pro gln gly glu gly asn asp tyr phe ala gly gly phe tyr
4613、 165 170 175
4614、gly gly thr lys asp glu phe leu asn ile val his thr asn ala val
4615、 180 185 190
4616、asn ile asp gln asp met gln asn gly ile ile ala val trp his asp
4617、 195 200 205
4618、glu ser his trp asn arg phe cys ile asn asn pro pro thr val ile
4619、 210 215 220
4620、leu ser pro ser tyr cys tyr pro gln gly leu arg ile pro phe leu
4621、225 230 235 240
4622、pro lys leu ile ala leu asp lys asn his glu glu met arg lys gly
4623、 245 250 255
4624、<210> 85
4625、<211> 249
4626、<212> prt
4627、<213> parachlamydia acanthamoebae
4628、<400> 85
4629、met leu thr arg ser leu lys ile leu ile gly leu cys leu leu phe
4630、1 5 10 15
4631、ser his ala leu tyr ala ala asn val gly leu leu val met ala thr
4632、 20 25 30
4633、gly lys tyr val ser phe val pro pro leu val lys ser ala asp his
4634、 35 40 45
4635、phe phe cys lys asn his lys val thr tyr phe val phe thr asp gly
4636、 50 55 60
4637、tyr leu glu pro met pro asn val val pro ile phe his ala lys met
4638、65 70 75 80
4639、gly trp pro tyr asp thr met met arg tyr his val tyr asp met his
4640、 85 90 95
4641、arg asp ala phe ala gly gln asp tyr leu tyr ala cys asp ala asp
4642、 100 105 110
4643、met leu phe val gly glu val gly asp glu ile leu gly asn arg val
4644、 115 120 125
4645、ala thr arg his pro gly phe ile asn arg pro lys ser ser tyr thr
4646、 130 135 140
4647、tyr glu arg asn pro leu ser thr ala tyr ile pro gln gly glu gly
4648、145 150 155 160
4649、asn asp tyr phe ala gly gly phe tyr gly gly thr lys asp glu phe
4650、 165 170 175
4651、leu asn ile val his thr asn ala val asn ile asp gln asp met gln
4652、 180 185 190
4653、asn gly ile ile ala val trp his asp glu ser his trp asn arg phe
4654、 195 200 205
4655、cys ile asn asn pro pro thr val ile leu ser pro ser tyr cys tyr
4656、 210 215 220
4657、pro gln gly leu arg ile pro phe leu pro lys leu ile ala leu asp
4658、225 230 235 240
4659、lys asn his glu glu met arg lys gly
4660、 245
4661、<210> 86
4662、<211> 251
4663、<212> prt
4664、<213> parachlamydia sp.
4665、<400> 86
4666、met asn ser lys cys val arg ile leu ile thr leu leu leu leu ser
4667、1 5 10 15
4668、ser pro ser leu tyr ala ala lys val gly leu leu val met ala thr
4669、 20 25 30
4670、gly lys tyr ile thr phe val pro pro leu val ala ser ala asp lys
4671、 35 40 45
4672、tyr phe cys lys asn his asp val thr tyr phe val phe thr asp gly
4673、 50 55 60
4674、gln phe asp val val pro asn lys val val pro ile phe his pro arg
4675、65 70 75 80
4676、met gly trp pro phe asp thr met met arg asn his val tyr glu met
4677、 85 90 95
4678、asn ser asp ala phe ala asp gln asp tyr leu tyr ala cys asp ala
4679、 100 105 110
4680、asp met leu phe val gly asn val gly asp glu ile leu gly lys arg
4681、 115 120 125
4682、met ala thr glu his pro gly phe tyr gly lys asn arg lys val phe
4683、 130 135 140
4684、ser phe glu thr asn pro leu ser lys ala tyr ile ala pro asn glu
4685、145 150 155 160
4686、gly thr lys tyr phe cys gly gly phe phe gly gly glu arg glu ala
4687、 165 170 175
4688、phe leu asp ile val arg thr thr ser glu arg val asp glu asp leu
4689、 180 185 190
4690、ala asn asp ile val ala val trp his asp glu ser his trp asn arg
4691、 195 200 205
4692、tyr cys ile asp tyr pro pro thr val ile leu thr pro ser tyr cys
4693、 210 215 220
4694、phe pro gln gly ser lys leu pro phe val pro lys leu ile ala leu
4695、225 230 235 240
4696、asn lys asn his gln asp met arg phe asn asp
4697、 245 250
4698、<210> 87
4699、<211> 272
4700、<212> prt
4701、<213> piromyces sp.
4702、<400> 87
4703、met lys lys asp tyr phe val phe thr asp ser glu thr ile tyr gly
4704、1 5 10 15
4705、asp glu asn pro asn val his ile ile pro gln glu asn leu gly trp
4706、 20 25 30
4707、pro gly asn thr leu tyr arg phe his met phe leu ser gln lys glu
4708、 35 40 45
4709、glu leu glu lys phe lys tyr ile phe phe leu asn ala asn val glu
4710、 50 55 60
4711、cys tyr glu glu ile lys glu asn asp phe leu pro lys lys glu gly
4712、65 70 75 80
4713、leu leu phe val lys his phe asn phe his asp lys gln asn thr leu
4714、 85 90 95
4715、phe ser tyr glu arg asn ser asn ser thr ala tyr ile pro met gly
4716、 100 105 110
4717、glu gly lys tyr tyr val cys gly gly ala asn gly gly lys ala lys
4718、 115 120 125
4719、asn tyr leu asp met cys glu glu leu arg arg arg ile asp ile asp
4720、 130 135 140
4721、asp glu asn gly val thr ala ile trp his asp glu ser gln ile asn
4722、145 150 155 160
4723、arg tyr leu tyr asp leu asp lys glu asn lys pro tyr lys ile leu
4724、 165 170 175
4725、asp pro gly tyr cys phe pro glu met phe leu glu asn lys leu lys
4726、 180 185 190
4727、asn pro asp ser phe pro tyr asp pro ile leu leu tyr arg arg lys
4728、 195 200 205
4729、gln asp tyr ile asn val asn lys ile lys gly asp tyr asn glu met
4730、 210 215 220
4731、gln gly asn asn lys asn asn asn lys lys ile his tyr tyr asn ser
4732、225 230 235 240
4733、lys thr asn lys ile asn lys gly asn ser thr lys glu glu ile ser
4734、 245 250 255
4735、lys glu glu asn lys glu ser gln lys lys val ile lys asn asn tyr
4736、 260 265 270
4737、<210> 88
4738、<211> 284
4739、<212> prt
4740、<213> piromyces sp.
4741、<400> 88
4742、lys ser val asp ser ala asp ser ile glu ile ser glu leu asn lys
4743、1 5 10 15
4744、asn thr his glu lys asp ile ala ile leu tyr ile cys thr gly lys
4745、 20 25 30
4746、tyr asp val phe trp lys glu phe tyr glu ser val glu glu lys phe
4747、 35 40 45
4748、ile pro his met lys lys asp tyr phe val phe thr asp ser lys asp
4749、 50 55 60
4750、ile tyr lys lys glu asn asp asn val his ile ile lys gln lys asn
4751、65 70 75 80
4752、leu gly trp pro gly asn thr leu tyr arg phe his met phe leu ser
4753、 85 90 95
4754、gln lys glu lys leu gln asn tyr lys tyr ile phe phe met asn ala
4755、 100 105 110
4756、asn ile ile cys asn phe gly val gly glu glu phe leu pro lys asp
4757、 115 120 125
4758、glu gly leu leu phe val gln his his ala tyr tyr lys ala pro asn
4759、 130 135 140
4760、thr lys phe ser tyr glu arg asn ser asn ser thr ala tyr ile pro
4761、145 150 155 160
4762、met gly gln gly lys tyr tyr val cys gly gly val asn gly gly arg
4763、 165 170 175
4764、ala lys glu tyr leu his met cys glu val leu lys ser arg ile asp
4765、 180 185 190
4766、glu asp asp lys asn asp val val ala val trp his asp glu ser his
4767、 195 200 205
4768、ile asn lys tyr leu leu glu leu glu lys ser gln tyr lys leu leu
4769、 210 215 220
4770、asn val ser tyr cys phe pro glu tyr lys met asn arg lys ser phe
4771、225 230 235 240
4772、pro phe asp pro ile leu phe phe arg asn lys lys lys tyr ile asn
4773、 245 250 255
4774、leu lys glu ile lys gly asp ser his glu met met gly asn asn lys
4775、 260 265 270
4776、asn lys asn lys ala lys asn lys ala ile ile asn
4777、 275 280
4778、<210> 89
4779、<211> 250
4780、<212> prt
4781、<213> porphyromonadaceae bacterium
4782、<400> 89
4783、met lys ile gly met leu tyr ile gly ile gly arg tyr ala ala phe
4784、1 5 10 15
4785、trp pro glu phe tyr arg ser ala arg glu tyr phe leu pro asp ala
4786、 20 25 30
4787、thr lys his phe phe val phe ala asp ala pro leu glu asp ala gly
4788、 35 40 45
4789、asp asp val ser val phe his asn asp asp met gly trp pro leu asn
4790、 50 55 60
4791、ser leu trp arg tyr his met phe leu arg ile ala asp leu leu lys
4792、65 70 75 80
4793、glu tyr asp tyr leu phe phe phe asn ala asn cys lys phe val arg
4794、 85 90 95
4795、arg val glu pro ser asp ile leu pro gln gly asp val glu tyr cys
4796、 100 105 110
4797、ala met cys thr gln thr asp pro ala lys met ser leu glu ser arg
4798、 115 120 125
4799、pro glu cys ala ser tyr val ala pro gly ser val ser arg tyr trp
4800、 130 135 140
4801、ala gly gly ile asn gly gly arg ala glu ala phe leu arg leu ala
4802、145 150 155 160
4803、arg glu cys ala ala ile ala glu arg asp leu ala asn gly phe met
4804、 165 170 175
4805、pro val trp his asp glu ser val val asn his phe phe ala asp lys
4806、 180 185 190
4807、lys val arg ala leu asp arg arg met gly cys pro ser gln trp lys
4808、 195 200 205
4809、ser pro ala asp pro phe val ile leu arg arg lys asp asp val leu
4810、 210 215 220
4811、gly arg ser trp leu arg thr tyr lys gly arg lys his ser ser phe
4812、225 230 235 240
4813、trp lys lys leu phe arg lys leu arg lys
4814、 245 250
4815、<210> 90
4816、<211> 231
4817、<212> prt
4818、<213> prochlorococcus phage p-ssm2
4819、<400> 90
4820、met lys ile cys ile leu thr ile ala thr asn lys tyr ile gln phe
4821、1 5 10 15
4822、val glu lys leu tyr asp asn ile asp asp his phe leu asn gly his
4823、 20 25 30
4824、glu ile glu gly ile ile phe thr asp gln glu val glu ser ser asp
4825、 35 40 45
4826、asn ile lys ile ser gln ile glu his glu pro trp pro val pro thr
4827、 50 55 60
4828、leu lys arg tyr asn tyr phe met lys glu ala glu his ile ser lys
4829、65 70 75 80
4830、tyr asp tyr cys phe tyr phe asp val asp met gly ile val asp lys
4831、 85 90 95
4832、val gly asp glu val leu gly asp leu val ala thr met his pro tyr
4833、 100 105 110
4834、gln ser phe ala pro lys ile gln arg ser tyr asp arg asn pro lys
4835、 115 120 125
4836、ser leu ala tyr val pro leu tyr asp glu gly glu his tyr tyr ala
4837、 130 135 140
4838、gly gly phe asn gly gly ser thr lys arg phe leu glu met ala glu
4839、145 150 155 160
4840、val ile ala asp arg val asn lys asp leu glu asn asp val ile ala
4841、 165 170 175
4842、leu trp his asp glu ser his leu asn arg tyr leu ile asp asn pro
4843、 180 185 190
4844、pro thr ile ser leu thr pro ser tyr cys phe ala glu glu gln met
4845、 195 200 205
4846、ser asn leu glu tyr pro tyr lys pro lys ile ile ala leu lys lys
4847、 210 215 220
4848、asp his asn glu leu arg ser
4849、225 230
4850、<210> 91
4851、<211> 269
4852、<212> prt
4853、<213> 食葡糖罗斯氏菌
4854、<400> 91
4855、met asp lys asn pro arg asn phe met lys glu ser asp met asn lys
4856、1 5 10 15
4857、val ala val leu tyr ile cys thr gly lys tyr asp val phe trp lys
4858、 20 25 30
4859、asp phe tyr ile ser tyr glu lys tyr phe leu pro asp cys glu lys
4860、 35 40 45
4861、his tyr tyr val phe thr asp ala ala glu ile tyr met glu lys glu
4862、 50 55 60
4863、asn leu arg ile his lys phe tyr gln glu ser leu gly trp pro asp
4864、65 70 75 80
4865、asn thr leu met arg phe his met phe leu arg gln lys ala glu leu
4866、 85 90 95
4867、glu lys tyr asp tyr ile phe phe met asn ala asn cys gln ala leu
4868、 100 105 110
4869、asp thr ile thr glu glu glu phe leu pro lys lys lys asp ile ile
4870、 115 120 125
4871、val val gln his pro gly tyr tyr asn lys thr asn lys gln phe ala
4872、 130 135 140
4873、tyr asp arg asn pro lys ser thr ala tyr ile pro lys gly gln gly
4874、145 150 155 160
4875、lys tyr tyr val cys gly gly val asn gly gly arg ala gln ala phe
4876、 165 170 175
4877、ile gln leu met glu glu leu lys his asn ile asp val asp lys lys
4878、 180 185 190
4879、asn gly glu leu ala leu trp his asp glu ser his ile asn his tyr
4880、 195 200 205
4881、val trp thr his asp asn tyr glu val leu pro pro ser tyr cys trp
4882、 210 215 220
4883、pro glu asp trp asn leu pro met pro gly lys ile leu ile arg glu
4884、225 230 235 240
4885、lys ser lys trp ile phe val asp met val lys ser gln ser leu ser
4886、 245 250 255
4887、gly lys ile lys ala val ile lys lys ile ile arg arg
4888、 260 265
4889、<210> 92
4890、<211> 1759
4891、<212> prt
4892、<213> salpingoeca rosetta
4893、<400> 92
4894、met val val gly leu arg cys ser cys arg arg met val pro arg leu
4895、1 5 10 15
4896、arg arg leu gln leu leu trp gln arg arg trp arg thr ile val val
4897、 20 25 30
4898、ile val leu cys ile thr leu leu ala ala leu arg arg asn arg ser
4899、 35 40 45
4900、ala arg tyr asn ala ser asp val pro asp leu thr lys cys arg ala
4901、 50 55 60
4902、pro ser leu glu val ala pro leu ile thr ala ser leu ile his asp
4903、65 70 75 80
4904、thr ala asp ala ala ala phe leu asp leu his arg val ala glu ala
4905、 85 90 95
4906、pro phe asn asp leu ile leu ser ala ser ser ala arg ser gly asp
4907、 100 105 110
4908、ala asn arg asn his ala arg ala asp val asp arg asn ala leu arg
4909、 115 120 125
4910、pro val thr his arg gln thr leu ala his cys ile ala gln his tyr
4911、 130 135 140
4912、leu gly ala ile gln gln pro thr trp ser his pro ser val trp phe
4913、145 150 155 160
4914、ala ala ile gln ala ala gln his glu gly ala ala ala gln gln gln
4915、 165 170 175
4916、arg ala ala arg ser ala his ala lys asp ala asn asp asn ala asp
4917、 180 185 190
4918、ser ile ser ser ser ser ser ser ser glu gly gly thr ala ala thr
4919、 195 200 205
4920、met asp gln val arg arg lys trp trp ala his met val gln leu ala
4921、 210 215 220
4922、arg leu his ile his gln gln ala asp gly asp pro ala ser glu gln
4923、225 230 235 240
4924、gly lys val leu glu val pro ser gly leu pro ile his asp glu tyr
4925、 245 250 255
4926、ile ser ser leu val ser ala leu leu met pro met asp ser asp ala
4927、 260 265 270
4928、leu ala tyr ser ala his val pro lys his ile asn val his thr thr
4929、 275 280 285
4930、ile cys gly ala ser pro ala thr ala arg arg cys arg ser gly arg
4931、 290 295 300
4932、pro met leu ser pro ser ala ser leu gln ala ala thr ala val phe
4933、305 310 315 320
4934、ala ser arg ser leu ala leu thr asn val ala asp thr trp leu leu
4935、 325 330 335
4936、gln leu ala gln his val arg ala gly gly val val ala phe his asp
4937、 340 345 350
4938、val tyr phe ala gly asp asp pro ser pro cys val leu ala asn ala
4939、 355 360 365
4940、leu his ser pro ala gly asp thr ser val val tyr ala thr glu ala
4941、 370 375 380
4942、thr ile ala phe phe leu ala his phe asp val glu trp tyr arg asp
4943、385 390 395 400
4944、val arg val ser phe his pro ser leu ala cys glu lys arg glu val
4945、 405 410 415
4946、phe ala leu leu arg arg arg thr thr leu arg pro gly ile ala thr
4947、 420 425 430
4948、pro arg arg val asp leu thr ile thr ser leu arg ala ile lys thr
4949、 435 440 445
4950、ala leu ala ala ala pro ser ser arg his pro ser gln trp leu gln
4951、 450 455 460
4952、arg leu leu asp ala ala leu his his ser pro asn ala trp pro asn
4953、465 470 475 480
4954、leu ala his arg pro his thr thr asn thr asn thr asn thr asn thr
4955、 485 490 495
4956、asn thr asn thr asn thr asn ala asn asn asp gly gly ala val ser
4957、 500 505 510
4958、leu phe his glu ala ser arg pro arg arg trp ala thr asn gly leu
4959、 515 520 525
4960、leu his asp thr met ser gln leu glu ala phe asp ala val glu arg
4961、 530 535 540
4962、leu leu glu gly gly val pro asp gly cys asn pro thr ser asp ile
4963、545 550 555 560
4964、cys asn ile phe phe val trp thr ser his arg asp thr trp ser phe
4965、 565 570 575
4966、leu asn arg leu ala val glu ser ala leu arg ile phe pro arg ala
4967、 580 585 590
4968、arg val ile ile val ser asn thr leu pro val thr phe phe asn ser
4969、 595 600 605
4970、leu gln ala ser his arg val tyr val trp arg ile val pro thr arg
4971、 610 615 620
4972、leu val arg ala gly val ala gly gly arg trp leu arg ala ala leu
4973、625 630 635 640
4974、arg glu gln gly pro his leu pro thr his gln ser asp phe leu arg
4975、 645 650 655
4976、tyr val val leu tyr lys tyr gly gly leu phe ser asp thr asp leu
4977、 660 665 670
4978、val trp leu asp ala ser pro leu ala his ala ile gly arg asn phe
4979、 675 680 685
4980、leu gly lys ile asp ser arg pro ile leu ala arg cys pro trp cys
4981、 690 695 700
4982、val asp ser thr trp tyr leu ala asn gly val leu arg phe gln ala
4983、705 710 715 720
4984、arg his lys met leu ala ser ile leu gly his ile asp thr leu arg
4985、 725 730 735
4986、tyr asp pro ser asp arg leu ala ile gly pro his leu val thr lys
4987、 740 745 750
4988、thr phe asn ala leu gln asp pro ser val ile leu val asp glu his
4989、 755 760 765
4990、val leu phe pro met ser gly pro asp val leu gln tyr met asp pro
4991、 770 775 780
4992、arg pro pro his thr arg leu ala asp leu leu thr ser ala ala val
4993、785 790 795 800
4994、his val phe glu ala thr tyr lys ala ala pro tyr ala pro thr ser
4995、 805 810 815
4996、ala met gln gln leu leu ala leu thr pro trp val gln ile asp pro
4997、 820 825 830
4998、val cys glu cys val trp gln gln asp asp thr asp thr asp thr asn
4999、 835 840 845
5000、glu asp lys gly asp asp asp ser asn ser asn ser asn ser asn ser
5001、 850 855 860
5002、asn ser gly gly ala ala val gly gly asp ser thr lys arg lys lys
5003、865 870 875 880
5004、thr asn leu cys leu pro tyr ser ala thr ala arg tyr arg gln gly
5005、 885 890 895
5006、ser arg asp his leu val arg met cys val lys ile arg gly ile his
5007、 900 905 910
5008、ser asp ala asp gln ser ser thr pro asn ser asp arg asn glu arg
5009、 915 920 925
5010、ala ala gly asp gly asp asn asp glu gly ala gly gly glu glu lys
5011、 930 935 940
5012、ser arg asp gly thr ser val val gly leu pro glu asp gly val leu
5013、945 950 955 960
5014、val leu glu ala arg leu gly arg val gln thr ala tyr gln ala ala
5015、 965 970 975
5016、asp lys arg ile val val pro leu his arg asp met thr his thr glu
5017、 980 985 990
5018、leu leu glu leu ala gln leu trp tyr val his gly glu glu tyr cys
5019、 995 1000 1005
5020、asn asp his val thr val gln val val leu ala ser gly val val
5021、 1010 1015 1020
5022、tyr ala glu gly gly val asp val met thr pro cys phe gly val
5023、 1025 1030 1035
5024、ala glu ala gln gln arg tyr ile gly pro pro leu ala lys gly
5025、 1040 1045 1050
5026、thr tyr thr trp thr asn ala glu his met leu gln cys thr arg
5027、 1055 1060 1065
5028、phe ser glu glu tyr ala gly pro asp pro leu met phe trp pro
5029、 1070 1075 1080
5030、arg lys tyr arg lys leu val gly asp met val ser pro ala thr
5031、 1085 1090 1095
5032、ala lys tyr ala phe gly tyr thr pro ala leu thr ala ala asn
5033、 1100 1105 1110
5034、gly ala gly glu gln gln gln arg gln gln pro arg tyr lys val
5035、 1115 1120 1125
5036、gly leu val val val ala thr gly trp tyr tyr ala phe leu asp
5037、 1130 1135 1140
5038、asp phe val ala ser ala glu glu phe phe met pro gly his glu
5039、 1145 1150 1155
5040、val his tyr phe val phe thr asp asn arg pro phe ala ala gly
5041、 1160 1165 1170
5042、pro ala asp arg met his ile leu arg gln pro val tyr gly trp
5043、 1175 1180 1185
5044、pro phe asp ser met phe arg tyr glu ser ile leu arg gln arg
5045、 1190 1195 1200
5046、his his phe arg asn met asp tyr ile phe met leu asp ser asp
5047、 1205 1210 1215
5048、ile val phe ser asn phe val arg glu glu ile leu gly glu met
5049、 1220 1225 1230
5050、val gly val thr gln ala phe ala phe gly leu ala arg ser glu
5051、 1235 1240 1245
5052、tyr pro leu glu ser asn pro ala ser val ala tyr val pro gln
5053、 1250 1255 1260
5054、arg ser thr pro cys tyr tyr ala gly gly ile phe gly gly thr
5055、 1265 1270 1275
5056、val glu gly ala val arg phe leu gln his thr ala trp leu met
5057、 1280 1285 1290
5058、glu trp asp ile met gln gln val ser ala gly his asp asp glu
5059、 1295 1300 1305
5060、ser tyr leu asn arg ile phe ala trp asn pro pro asp val val
5061、 1310 1315 1320
5062、leu pro ala ser tyr ile tyr pro glu pro pro cys asp arg ala
5063、 1325 1330 1335
5064、trp gln ala gly gly arg arg tyr asp gly thr tyr pro pro arg
5065、 1340 1345 1350
5066、ile leu asn val gly cys arg lys val leu gly leu gln pro gly
5067、 1355 1360 1365
5068、met gly arg lys thr arg thr glu asp ala gly thr pro lys asp
5069、 1370 1375 1380
5070、phe met leu arg glu ala arg ala his ala ala asp met thr pro
5071、 1385 1390 1395
5072、gly thr ala asn glu gln gln gln gln glu gln gln gln lys gln
5073、 1400 1405 1410
5074、gln his gly gly glu gly ala glu asp ala leu leu ser thr pro
5075、 1415 1420 1425
5076、leu trp met val ser cys ile asp ser leu pro asp asp leu asp
5077、 1430 1435 1440
5078、asp gly ala his asp asp met trp ala asp ser ile ala ala ala
5079、 1445 1450 1455
5080、pro arg arg leu ala asn his thr arg his ala gly val val tyr
5081、 1460 1465 1470
5082、gly met ser asn ala leu leu gln arg phe trp ala ala arg ala
5083、 1475 1480 1485
5084、ser gln leu his pro pro thr leu his val val ala val ser arg
5085、 1490 1495 1500
5086、cys asp ala gln ala val ala ala leu leu gln leu val gln ala
5087、 1505 1510 1515
5088、asp val val leu val thr asp pro gly leu thr pro gly trp gln
5089、 1520 1525 1530
5090、val asn phe gly val trp arg arg met leu gln asp asn ser arg
5091、 1535 1540 1545
5092、leu trp lys ala ala gly gln ser ala gly gly asp gly ala gly
5093、 1550 1555 1560
5094、asp asp val thr ala pro leu arg ile ala ala ala cys pro phe
5095、 1565 1570 1575
5096、pro ser ser lys tyr arg gln met asn leu gly thr arg ala val
5097、 1580 1585 1590
5098、gly asn leu leu cys gly trp asp thr gln ala ala ser his pro
5099、 1595 1600 1605
5100、ser asp gly gln arg glu arg val leu ala thr asp phe arg thr
5101、 1610 1615 1620
5102、tyr val cys arg ala lys pro leu his asp val glu asp his gln
5103、 1625 1630 1635
5104、ala phe met ala leu lys ala pro leu leu ser ala met asn lys
5105、 1640 1645 1650
5106、ile gly ala pro val val met glu ala asp ala arg ser asn leu
5107、 1655 1660 1665
5108、gly leu pro thr arg ser gly ile asp thr gln pro arg ser arg
5109、 1670 1675 1680
5110、gly gly gly ala ala gly arg gly gly asp val thr gly ser phe
5111、 1685 1690 1695
5112、ala arg arg thr met ala ala leu arg ser leu met gln ser glu
5113、 1700 1705 1710
5114、gly gly ala ala val glu val ala ser cys phe thr asp met gln
5115、 1715 1720 1725
5116、pro phe ile ala ala pro val val ala arg thr ser ala lys met
5117、 1730 1735 1740
5118、cys cys arg thr arg phe leu gly met cys leu ser tyr arg glu
5119、 1745 1750 1755
5120、cys
5121、<210> 93
5122、<211> 282
5123、<212> prt
5124、<213> subdoligranulum sp.
5125、<400> 93
5126、met lys thr leu ala ile leu tyr ile cys thr gly pro tyr ala val
5127、1 5 10 15
5128、phe trp his asp phe tyr pro asn phe lys ala asp phe leu pro asp
5129、 20 25 30
5130、cys asp arg thr phe tyr val phe thr asp ala ala his ile asp tyr
5131、 35 40 45
5132、glu asp ala pro asp val arg arg ile tyr gln lys ala leu pro trp
5133、 50 55 60
5134、pro gln ser thr met leu arg phe asp ala phe leu gly gln ala asp
5135、65 70 75 80
5136、ala leu gln gly tyr asp tyr leu phe phe ala asn ala asn leu his
5137、 85 90 95
5138、cys thr arg val ile arg ala asp glu leu leu pro asp pro ala ala
5139、 100 105 110
5140、gly gln ser leu thr ala val cys his leu pro tyr tyr gly lys asn
5141、 115 120 125
5142、pro ile phe his pro tyr asp arg ser gly lys ser arg ala ser ile
5143、 130 135 140
5144、pro tyr ser cys gly gln tyr tyr val ala gly gly leu asn gly gly
5145、145 150 155 160
5146、thr ala ala ala tyr leu ala leu cys arg glu leu lys lys arg thr
5147、 165 170 175
5148、asp glu asp leu gln asn asn val ile ala arg phe his asp glu ser
5149、 180 185 190
5150、gln leu asn arg leu val ala glu thr pro gly lys phe arg ile leu
5151、 195 200 205
5152、pro pro asp tyr cys thr pro glu glu thr pro thr gly his glu ala
5153、 210 215 220
5154、ile leu val leu gln lys ser arg cys ile asn val glu ser val lys
5155、225 230 235 240
5156、gly thr ala lys pro gln asn phe phe gln arg lys trp glu ala phe
5157、 245 250 255
5158、arg leu asn trp leu pro tyr leu trp leu ala arg asp thr leu leu
5159、 260 265 270
5160、arg arg arg ile asp phe lys asn asp leu
5161、 275 280
5162、<210> 94
5163、<211> 276
5164、<212> prt
5165、<213> subdoligranulum sp.
5166、<400> 94
5167、met thr lys val ala ala leu tyr ile ala thr gly arg tyr thr val
5168、1 5 10 15
5169、phe trp pro glu phe tyr glu ser ala glu lys tyr leu leu lys asp
5170、 20 25 30
5171、cys glu val his tyr phe val phe thr asp ala ala thr leu pro gly
5172、 35 40 45
5173、gly asp asn pro arg val his ile cys ala gln asp ala tyr ser trp
5174、 50 55 60
5175、pro phe ala thr leu arg arg phe glu ile phe leu lys gln glu gln
5176、65 70 75 80
5177、ala leu lys ala phe asp tyr ile phe phe phe asn ala asn ala glu
5178、 85 90 95
5179、phe met gln pro val thr arg glu met leu leu pro arg ala glu lys
5180、 100 105 110
5181、gly glu his leu leu val val gln his pro ser phe tyr ala lys pro
5182、 115 120 125
5183、asn tyr glu phe thr tyr asp arg asn pro arg ser thr ala cys ile
5184、 130 135 140
5185、pro tyr gly leu gly lys tyr tyr val cys gly gly val asn gly gly
5186、145 150 155 160
5187、glu ala ala ala phe leu gln leu cys his thr leu asp ala arg ile
5188、 165 170 175
5189、arg arg asp leu gln arg asn val ile ala leu trp his asp glu ser
5190、 180 185 190
5191、gln ile asn arg tyr ile leu phe arg lys asp phe arg val leu thr
5192、 195 200 205
5193、pro ala phe cys tyr pro glu gly trp asp his leu pro phe pro cys
5194、 210 215 220
5195、ile ile arg ile arg ser lys ala arg tyr ile asp ile pro ala leu
5196、225 230 235 240
5197、arg lys asp ala pro glu thr lys leu ser pro ala val ala arg trp
5198、 245 250 255
5199、asn his phe ala met arg ala ala arg trp thr gln asn his ile phe
5200、 260 265 270
5201、lys lys gly ser
5202、 275
5203、<210> 95
5204、<211> 280
5205、<212> prt
5206、<213> subdoligranulum sp.
5207、<400> 95
5208、met lys lys val ala val leu tyr ile ala thr gly lys tyr val arg
5209、1 5 10 15
5210、leu trp pro gly phe leu glu ser ala glu lys tyr leu leu lys ser
5211、 20 25 30
5212、cys glu val glu tyr phe val phe thr asp val asp his leu ala glu
5213、 35 40 45
5214、glu glu asp asn pro arg ile his arg ile phe gln glu pro met pro
5215、 50 55 60
5216、trp pro tyr thr thr leu leu arg phe glu ile phe leu lys ala glu
5217、65 70 75 80
5218、glu gln leu lys ala phe asp tyr ile tyr phe phe asn ala asn cys
5219、 85 90 95
5220、glu phe lys gln pro ile thr glu glu met leu leu pro arg pro lys
5221、 100 105 110
5222、lys his glu his met val phe val leu his pro ala phe tyr trp arg
5223、 115 120 125
5224、tyr asn tyr glu phe thr tyr asp his asn pro arg cys lys ala tyr
5225、 130 135 140
5226、ile pro met gly leu gly arg asp tyr val cys gly gly ile asn gly
5227、145 150 155 160
5228、gly asp arg asp ala tyr leu lys phe cys his thr leu gln lys arg
5229、 165 170 175
5230、ile arg gln asp lys asp arg gly ile ile ala leu trp his asp glu
5231、 180 185 190
5232、ser his ile asn trp tyr ala phe thr his pro his tyr arg leu leu
5233、 195 200 205
5234、asp ala ser phe cys phe phe pro gly trp asp thr val lys pro cys
5235、 210 215 220
5236、tyr ile tyr ile arg pro lys glu glu tyr phe asp val asp ala phe
5237、225 230 235 240
5238、lys arg asp pro pro lys thr gln leu ser pro lys val glu lys tyr
5239、 245 250 255
5240、asn glu phe met leu lys ala ala arg lys ile gln arg his met pro
5241、 260 265 270
5242、trp leu pro arg arg lys arg glu
5243、 275 280
5244、<210> 96
5245、<211> 282
5246、<212> prt
5247、<213> subdoligranulum sp.
5248、<400> 96
5249、met lys thr leu ala ile leu tyr ile cys thr gly pro tyr ala val
5250、1 5 10 15
5251、phe trp his asp phe tyr pro asn phe lys ala asn phe leu pro asp
5252、 20 25 30
5253、cys asp arg thr phe tyr val phe thr asp ala ala his ile asp tyr
5254、 35 40 45
5255、glu asp ala pro asp val arg arg ile tyr gln lys ala leu pro trp
5256、 50 55 60
5257、pro gln ser thr met leu arg phe asp ala phe leu gly gln ala asp
5258、65 70 75 80
5259、ala leu gln gly tyr asp tyr leu phe phe ala asn ala asn leu his
5260、 85 90 95
5261、cys thr arg ile ile arg ala asp glu leu leu pro asp pro ala ala
5262、 100 105 110
5263、gly gln ser leu thr ala val cys his leu pro tyr tyr gly lys asn
5264、 115 120 125
5265、pro ile phe his pro tyr asp arg ser gly lys ser arg ala ser ile
5266、 130 135 140
5267、pro tyr asn cys gly gln tyr tyr val ala gly gly leu asn gly gly
5268、145 150 155 160
5269、thr ala ala ala tyr leu ala leu cys arg glu leu lys lys arg thr
5270、 165 170 175
5271、asp glu asp leu gln asn asn val ile ala arg phe his asp glu ser
5272、 180 185 190
5273、gln leu asn arg leu val ala glu thr pro gly lys phe arg ile leu
5274、 195 200 205
5275、pro pro asp tyr cys thr pro glu glu thr pro thr gly his glu ala
5276、 210 215 220
5277、ile leu val leu gln lys ser arg cys ile asn val glu ser val lys
5278、225 230 235 240
5279、gly ala ala lys pro gln asn phe phe gln arg lys trp glu ala phe
5280、 245 250 255
5281、arg leu asn trp leu pro tyr leu trp leu val arg asp thr leu leu
5282、 260 265 270
5283、his arg arg ile asp phe lys asn asp leu
5284、 275 280
5285、<210> 97
5286、<211> 280
5287、<212> prt
5288、<213> subdoligranulum variabile
5289、<400> 97
5290、met lys arg val ala ala leu tyr ile cys thr gly glu tyr leu arg
5291、1 5 10 15
5292、leu trp pro glu phe ile ala ser ala glu lys tyr leu leu lys gln
5293、 20 25 30
5294、cys glu ile his tyr phe val phe thr asp ala asp his ile glu gly
5295、 35 40 45
5296、glu glu asn asn pro arg ile his arg ile tyr gln lys pro gln pro
5297、 50 55 60
5298、trp pro tyr thr thr leu lys arg phe glu ile phe leu arg cys glu
5299、65 70 75 80
5300、glu gln leu lys ala phe asp tyr ile tyr phe phe asn ala asn cys
5301、 85 90 95
5302、glu phe thr gln pro ile thr glu glu met phe leu pro arg pro glu
5303、 100 105 110
5304、lys his glu his met val phe val leu his pro ala phe tyr trp arg
5305、 115 120 125
5306、pro asn tyr glu phe thr tyr asp arg asn pro arg ser lys ala phe
5307、 130 135 140
5308、ile pro met gly leu gly lys asp tyr val cys gly gly ile asn gly
5309、145 150 155 160
5310、gly glu ala arg ala tyr leu lys phe cys his leu leu asp lys arg
5311、 165 170 175
5312、ile asn gln asp leu asp arg gly ile ile ala trp trp his asp glu
5313、 180 185 190
5314、ser his ile asn trp tyr ala phe thr his arg lys tyr arg leu leu
5315、 195 200 205
5316、asp ala ser phe cys phe phe glu gly trp his thr lys lys pro cys
5317、 210 215 220
5318、tyr ile leu ile arg ala lys glu arg tyr phe asp val asp thr phe
5319、225 230 235 240
5320、lys lys asn ser pro ala thr gln leu ser pro arg val glu lys tyr
5321、 245 250 255
5322、asn his phe met met arg val ser arg tyr leu gln arg arg met pro
5323、 260 265 270
5324、trp leu pro arg arg pro arg glu
5325、 275 280
5326、<210> 98
5327、<211> 287
5328、<212> prt
5329、<213> subdoligranulum variabile
5330、<400> 98
5331、met ser ala asn arg pro arg val ala val leu tyr leu cys thr gly
5332、1 5 10 15
5333、ala tyr gln val phe trp lys asp phe tyr pro asn phe arg ala his
5334、 20 25 30
5335、phe leu pro asp cys glu arg thr phe phe val phe thr asp ala pro
5336、 35 40 45
5337、ala ile asp tyr glu asp ala pro asp val arg arg ile pro gln glu
5338、 50 55 60
5339、ala leu pro trp pro tyr ser thr met gln arg phe asp ala phe leu
5340、65 70 75 80
5341、gly gln ala thr ala leu ala gly tyr asp tyr leu phe phe ala asn
5342、 85 90 95
5343、ala asn leu arg cys leu arg asp val thr ala ala glu leu leu pro
5344、 100 105 110
5345、asp ala ala ala gly gln ala leu thr val val cys his leu pro tyr
5346、 115 120 125
5347、tyr gly lys asp pro leu phe his pro tyr glu arg arg arg lys ser
5348、 130 135 140
5349、arg ala cys ile pro tyr asn cys gly thr trp tyr val ala gly gly
5350、145 150 155 160
5351、leu asn gly gly gln ser ala ala tyr leu glu leu cys arg glu leu
5352、 165 170 175
5353、lys ala arg thr asp glu asp leu arg arg gly val ile ala arg phe
5354、 180 185 190
5355、his asp glu ser gln leu asn arg leu val ala glu gln pro gly arg
5356、 195 200 205
5357、phe arg val leu gly pro asp tyr cys thr pro glu glu thr pro thr
5358、 210 215 220
5359、gly his glu ala ile arg val leu gln lys ala his tyr ile asp val
5360、225 230 235 240
5361、gln ala val arg gly ala ala lys pro gln asn trp val gln cys lys
5362、 245 250 255
5363、trp glu ala phe cys leu asn trp leu pro tyr leu trp arg ala arg
5364、 260 265 270
5365、asp ala leu leu arg arg arg val glu pro pro gln lys met pro
5366、 275 280 285
5367、<210> 99
5368、<211> 281
5369、<212> prt
5370、<213> subdoligranulum variabile
5371、<400> 99
5372、met thr lys val ala ala leu tyr ile cys thr gly lys tyr ile ala
5373、1 5 10 15
5374、phe trp pro glu phe tyr asp ser ala glu gln asn leu leu pro gly
5375、 20 25 30
5376、cys glu val his tyr phe val phe thr asp ala pro val leu tyr gly
5377、 35 40 45
5378、glu glu ala asn pro arg ile his arg cys pro gln glu ala tyr ser
5379、 50 55 60
5380、trp pro phe ala thr leu arg arg phe glu ile phe leu ser arg glu
5381、65 70 75 80
5382、glu glu leu lys ala phe asp tyr ile phe phe phe asn ala asn ala
5383、 85 90 95
5384、gln ile met thr thr ile thr pro glu met phe leu pro arg ala asp
5385、 100 105 110
5386、arg gly glu his leu leu val val gln his pro ser phe tyr thr lys
5387、 115 120 125
5388、pro asn tyr glu phe thr tyr asp arg asn pro arg cys arg ala phe
5389、 130 135 140
5390、ile pro met gly leu gly arg tyr tyr val cys gly gly ile asn gly
5391、145 150 155 160
5392、gly glu ala ala ala phe leu lys leu cys his thr leu asp lys arg
5393、 165 170 175
5394、ile arg lys asp leu ala his asn val ile ala gln trp his asp glu
5395、 180 185 190
5396、ser his ile asn arg tyr ile leu trp arg arg asp val arg val leu
5397、 195 200 205
5398、ser pro ser tyr cys trp pro glu gly trp asn leu pro leu pro cys
5399、 210 215 220
5400、arg ile leu ile arg ser lys ala arg tyr phe asp val gln gln leu
5401、225 230 235 240
5402、arg lys asp ala pro ala thr glu leu pro arg tyr val val arg cys
5403、 245 250 255
5404、asn asp phe met lys arg ala ala arg trp leu gln arg arg leu pro
5405、 260 265 270
5406、pro lys lys glu asp ile asn asp glu
5407、 275 280
5408、<210> 100
5409、<211> 286
5410、<212> prt
5411、<213> subdoligranulum variabile
5412、<400> 100
5413、met ser glu ser arg ile arg val ala val leu tyr leu cys thr gly
5414、1 5 10 15
5415、ala tyr gln val phe trp his asp phe tyr pro asn phe arg gln his
5416、 20 25 30
5417、phe leu pro asp cys asp arg thr phe phe val phe thr asp ala ala
5418、 35 40 45
5419、ser ile asp tyr glu asp gln pro asp val arg arg phe gln gln glu
5420、 50 55 60
5421、ala leu pro trp pro tyr ser thr met gln arg phe asp ala phe leu
5422、65 70 75 80
5423、ser gln ala glu ala leu ala asp tyr asp tyr leu phe phe ala asn
5424、 85 90 95
5425、ala asn leu his cys leu arg asp val thr ala gly glu leu leu pro
5426、 100 105 110
5427、asp ala ala lys gly gln glu leu thr val val cys his leu pro tyr
5428、 115 120 125
5429、tyr gly arg asn pro ile phe his pro tyr glu arg arg arg lys cys
5430、 130 135 140
5431、arg ala gly ile pro tyr asn cys gly thr tyr tyr val ala gly gly
5432、145 150 155 160
5433、ile asn gly gly ala ser gly ala phe leu glu met cys arg glu leu
5434、 165 170 175
5435、lys ala arg thr asp glu asp leu gln arg gly ile ile ala arg cys
5436、 180 185 190
5437、his asp glu ser gln leu asn arg leu val ala glu cys pro glu arg
5438、 195 200 205
5439、phe arg ile leu pro pro glu tyr cys thr pro glu glu thr pro thr
5440、 210 215 220
5441、gly lys glu ala ile arg val leu gln lys ser his tyr ile asp met
5442、225 230 235 240
5443、ser ala val arg gln gln gly arg arg gln asn tyr leu gln arg lys
5444、 245 250 255
5445、trp glu ala phe cys leu asn trp leu pro tyr leu trp trp ala arg
5446、 260 265 270
5447、asp thr leu leu arg arg arg val asp pro pro arg thr arg
5448、 275 280 285
5449、<210> 101
5450、<211> 258
5451、<212> prt
5452、<213> sulfurospirillum deleyianum
5453、<400> 101
5454、met asn lys ile gly ile leu tyr ile cys thr gly asp tyr trp lys
5455、1 5 10 15
5456、phe trp glu asn phe tyr lys ser ser glu glu leu phe leu thr asn
5457、 20 25 30
5458、glu glu lys his tyr phe leu phe thr asp asn arg glu leu leu asn
5459、 35 40 45
5460、ile asn asn glu arg ile his ser phe phe gln glu lys met asp trp
5461、 50 55 60
5462、pro tyr pro thr leu tyr arg tyr lys thr phe ile lys tyr lys thr
5463、65 70 75 80
5464、val phe gln asp met asp tyr leu ile phe cys asn ala asn leu leu
5465、 85 90 95
5466、phe asn glu lys ile ser arg asn asp leu phe ala asn lys glu leu
5467、 100 105 110
5468、phe ala thr leu his pro gly phe phe asp lys lys pro gln lys phe
5469、 115 120 125
5470、thr tyr glu thr asn ile lys ser leu ala tyr thr glu lys lys val
5471、 130 135 140
5472、asp ser ile tyr val cys gly gly phe asn gly gly ile lys asn asp
5473、145 150 155 160
5474、phe leu lys met ala glu ile leu asp asp asn ile asp lys asp phe
5475、 165 170 175
5476、ser glu ser ile ile ala ile trp his asp glu ser his ile asn asn
5477、 180 185 190
5478、tyr val gln asn asn lys glu lys phe asn ile leu ser pro ser phe
5479、 195 200 205
5480、cys tyr pro gln his tyr ser ile asp ile asn lys lys ile ile val
5481、 210 215 220
5482、gln asp lys glu lys ile ile ser ile lys his lys gly val phe tyr
5483、225 230 235 240
5484、asn ile arg phe leu ile ile lys met leu lys lys met phe arg his
5485、 245 250 255
5486、arg arg
5487、<210> 102
5488、<211> 246
5489、<212> prt
5490、<213> 卵形拟杆菌
5491、<400> 102
5492、met arg ile gly ile leu tyr ile cys thr gly lys tyr asp ile phe
5493、1 5 10 15
5494、trp lys asp phe tyr leu ser ala glu arg tyr phe met gln asp gln
5495、 20 25 30
5496、ser phe ile ile glu tyr tyr val phe thr asp ser pro lys leu tyr
5497、 35 40 45
5498、asp glu glu asn asn lys his ile his arg ile lys gln lys asn leu
5499、 50 55 60
5500、gly trp pro asp asn thr leu lys arg phe his ile phe leu arg ile
5501、65 70 75 80
5502、lys glu gln leu glu arg glu thr asp tyr leu phe phe phe asn ala
5503、 85 90 95
5504、asn leu leu phe thr ser pro ile gly lys glu ile leu pro pro ser
5505、 100 105 110
5506、asp ser asn gly leu leu gly thr met his pro gly phe tyr asn lys
5507、 115 120 125
5508、pro asn ser glu phe thr tyr glu arg arg asp ala ser thr ala tyr
5509、 130 135 140
5510、ile pro glu gly glu gly arg tyr tyr tyr ala gly gly leu ser gly
5511、145 150 155 160
5512、gly cys thr lys ala tyr leu lys leu cys thr thr ile cys ser trp
5513、 165 170 175
5514、val asp arg asp ala thr asn his ile ile pro ile trp his asp glu
5515、 180 185 190
5516、ser leu ile asn lys tyr phe leu asp asn pro pro ala ile thr leu
5517、 195 200 205
5518、ser pro ala tyr leu tyr pro glu gly trp leu leu pro phe glu pro
5519、 210 215 220
5520、ile ile leu ile arg asp lys asn lys pro gln tyr gly gly his glu
5521、225 230 235 240
5522、leu leu arg arg lys asn
5523、 245
技术实现思路