生产3-岩藻糖基乳糖和转化乳糖的α-1,3-岩藻糖基转移酶的制作方法

文档序号:26100033发布日期:2021-07-30 18:10阅读:140来源:国知局
生产3-岩藻糖基乳糖和转化乳糖的α-1,3-岩藻糖基转移酶的制作方法

本发明涉及生产3-岩藻糖基乳糖(3-fl)的方法以及新鉴定的岩藻糖基转移酶,更具体地新鉴定的乳糖结合α-1,3-岩藻糖基转移酶多肽,以及它们的应用。此外,本发明提供了使用新鉴定的乳糖结合α-1,3-岩藻糖基转移酶生产3-岩藻糖基乳糖(3-fl)的方法。

技术背景

现在已经有80多种属于人乳寡糖(hmo)家族的化合物得到结构表征。这些hmo代表一类作为益生元起作用的复杂寡糖。此外,hmo与上皮表位的结构同源性说明了针对对细菌病原体的保护作用。在婴儿胃肠道内,hmo选择性地滋养选定细菌菌株的生长,并因此,在母乳喂养的婴儿中引发独特肠道微生物群的发展。

这些人乳寡糖中的一些需要存在特定的岩藻糖基化的结构,这些结构很可能表现出特定的生物活性。生产这些岩藻糖基化的寡糖需要岩藻糖基转移酶的作用。这些岩藻糖基转移酶属于糖基转移酶家族,广泛表达于脊椎动物、无脊椎动物、植物、真菌、酵母和细菌中。它们催化岩藻糖残基从供体(通常是鸟苷二磷酸岩藻糖(gdp-岩藻糖))转移至受体(acceptor),包括寡糖、糖(蛋白)和糖(脂)。因此,岩藻糖基化的受体底物参与了多种生物和病理过程。

已经鉴定出几种岩藻糖基转移酶,例如在细菌幽门螺杆菌(helicobacterpylori)、大肠杆菌(escherichiacoli)、肠道沙门氏菌(salmonellaenterica)、哺乳动物、秀丽隐杆线虫(caenorhabditiselegans)和曼氏血吸虫(schistosomamansoni)以及植物中鉴定到岩藻糖基转移酶。

岩藻糖基转移酶基于岩藻糖添加的位点分类为例如α-1,2、α-1,3、α-1,4和o-岩藻糖基转移酶。

本领域已经描述了几种α-1,3-岩藻糖基转移酶。wo1998/055630描述了幽门螺杆菌的细菌α-1,3-岩藻糖基转移酶基因,其可用于生产寡糖,例如lewisx、lewisy和唾液酸lewisx。wo2016/040531描述了几种用于生产岩藻糖基化的寡糖的α-1,3-岩藻糖基转移酶。在这里,α-1,3-岩藻糖基转移酶被描述为与诺德拟杆菌(bacteroidesnordii)cafc酶具有25%至100%的序列同一性。然而,在该文件的表1中,作者清楚地表明,他们测试的酶(其中许多与cafc具有>25%的序列同一性)中超过一半(7/12)不能使用乳糖作为受体底物产生3-岩藻糖基乳糖。这说明明显地并非所有假定的岩藻糖基转移酶都具有乳糖结合岩藻糖基转移酶活性。wo2012/049083描述了一些新的α-1,3-岩藻糖基转移酶及其在生产岩藻糖基化的产物中的用途。huang等人2017对各种外源性α-1,3-岩藻糖基转移酶候选物以及一系列大肠杆菌宿主菌株进行了比较,并证明使用大肠杆菌bl21(de3)为宿主菌株的幽门螺杆菌futa产生最高滴度的3-岩藻糖基乳糖(人乳寡糖之一)。

通常,已知α-1,3-岩藻糖基转移酶(也称为3-岩藻糖基转移酶)对乳糖的亲和力低。生产hmo3-岩藻糖基乳糖需要3-岩藻糖基转移酶。低亲和力对3-岩藻糖基乳糖的生产率有负面影响。为了提高转化率和生产率,需要具有足够乳糖亲和力、优选地更高乳糖亲和力的转移酶。

因此,本发明的一个目的是提供工具和方法,通过这些工具和方法,可以以高效的、有时间和成本效益的方式生产或合成3-岩藻糖基乳糖,并且与现有技术方法相比产生类似或更高数量的所需产物。



技术实现要素:

令人惊讶的是,现在已经发现,本发明的新鉴定的乳糖结合α-1,3-岩藻糖基转移酶提供与目前已知的乳糖结合α-1,3-岩藻糖基转移酶相比具有相似或更高的乳糖结合和/或转移酶性质的转移酶。

因此,本发明提供使用新鉴定的乳糖结合α-1,3-岩藻糖基转移酶生产3-岩藻糖基乳糖(3fl)的方法。3fl可通过在α-1,3-岩藻糖基转移酶存在下使乳糖反应而获得,α-1,3-岩藻糖基转移酶能够催化从乳糖和gdp-岩藻糖形成3-岩藻糖基乳糖寡糖。备选地,也可以从产生根据本发明的α-1,3-岩藻糖基转移酶的微生物中获得。

定义

本说明书中用于描述本发明及其各种实施方式的词语不仅应理解为其常规定义的含义,而且应通过在本说明书中的特殊定义包括超出常规定义含义范围的结构、材料或行为。因此,如果在本说明书的上下文中可以将一个元素理解为包括一个以上的含义,那么其在权利要求中的使用必须理解为对说明书和该词本身支持的所有可能含义的通用。

本文公开的本发明的各种实施方案和实施方案的方面不仅应按照本说明书中具体描述的顺序和上下文来理解,而且还应包括其任何顺序及任何组合。当上下文需要时,所有以单数使用的词语应视为包含复数,反之亦然。除非另有定义,否则本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同含义。一般而言,本文所使用的术语以及本文所描述的细胞培养、分子遗传学、有机化学和核酸化学及杂交中的实验室程序是本领域公知且常用的。核酸和肽的合成使用标准技术。通常,酶促反应和纯化步骤根据制造商的说明书进行。

在附图和说明书中,已经公开了本发明的实施方案,并且尽管使用了特定术语,但是这些术语仅在描述性意义上使用,而不是为了限制的目的,本发明的范围在后附权利要求书中阐述。必须理解,所示出的实施方案仅为示例的目的而阐述,并且不应将其视为限制本发明。对于本领域的技术人员显而易见的是,可以与本公开内容的文字和精神一致以及在本公开内容的范围内进行修改、其他实施方案、改进、细节和使用,根据专利法解释本公开内容仅受权利要求书的限制,包括等同原则。在随后的权利要求书中,提供用于指定权利要求步骤的参考字符只是为了便于描述,并不意在暗示执行步骤的任何特定顺序。

根据本发明,术语“多核苷酸”通常指任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的rna或dna或者修饰的rna或dna。“多核苷酸”包括但不限于单链和双链dna,作为单链和双链区域或单链、双链和三链区域的混合物的dna,单链和双链rna,以及作为单链和双链区域的混合物的rna,包含dna和rna(其可以是单链,或更典型的双链或三链区域,或单链和双链区域的混合物)的杂交分子。此外,本文所使用的“多核苷酸”指包含rna或dna或者rna和dna两者的三链区域。这些区域中的链可以来自同一个分子或来自不同的分子。这些区域可以包括所有的一个或多个分子,但更典型地只涉及一些分子的区域。三螺旋区域的分子之一通常是寡核苷酸。如本文所用,术语“多核苷酸”还包括如上所述的含有一个或多个修饰碱基的dna或rna。因此,具有出于稳定性或其他原因而修饰的主链的dna或rna是根据本发明的“多核苷酸”。此外,包含不寻常碱基(例如肌苷)或修饰的碱基(例如三酰化碱基)的dna或rna应理解为涵盖在术语“多核苷酸”中。应当理解,已经对dna和rna进行了多种修饰,其用于本领域技术人员已知的许多有用目的。本文中使用的术语“多核苷酸”包括这种经化学、酶或代谢修饰的多核苷酸形式,以及病毒和细胞(包括例如简单和复杂细胞)所特有的dna和rna的化学形式。术语“多核苷酸”也包括通常称为寡核苷酸的短多核苷酸。

“多肽”是指包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。“多肽”既指短链(通常称为肽、寡肽和寡聚物),也指长链(通常称为蛋白质)。多肽可以含有20种基因编码氨基酸以外的氨基酸。“多肽”包括通过自然过程(例如加工和其他翻译后修饰)修饰的多肽,也包括通过化学修饰技术修饰的多肽。这样的修饰在基础教科书和更详细的专著中以及多卷研究文献中充分描述,并且其对于本领域技术人员是公知的。相同类型的修饰可以以相同的程度或不同的程度存在于给定多肽中的数个位点上。此外,给定的多肽可以包含许多类型的修饰。修饰可以在多肽的任意位置发生,包括肽主链、氨基酸侧链和氨基末端或羧基末端。修饰包括,例如,乙酰化、酰化、adp-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、去甲基化作用、共价交联的形成、焦谷氨酸的形成、甲酰化作用、γ-羧基化、糖基化、gpi锚定形成、羟基化、碘化、甲基化、豆蔻酰化作用、氧化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、脂质连接、硫化、谷氨酸残基的γ-羧化、羟基化和adp-核糖基化、硒化(selenoylation)、转移rna介导的向蛋白添加氨基酸(诸如精氨酸化)和泛蛋白化。多肽可以是分支的或有或无分支的环状。环状、分支的和分支环状的多肽可以由翻译后天然过程形成,并且也可以通过完全合成法制得。

“分离的”意指“通过人工”由其天然状态改变,即,如果其天然存在,则其已经改变或从其原始环境中移出,或者二者。例如,天然存在于活的生物体中的多核苷酸或多肽不是“分离的”,但是与其天然状态的共存物质分开的相同的多核苷酸或多肽是“分离的”,如该术语在本文中所用的。类似地,如本文所使用的术语“合成的”序列是指合成产生而不是从天然来源直接分离的任意序列。如本文所使用的术语“合成的”是指任何合成生成的序列,并且不是直接从天然来源分离出来的。

“重组”意指通过将来自一个物种的基因移植或剪接到不同物种的宿主生物体的细胞中而制备的基因工程化的dna。这种dna成为宿主基因组成的一部分并被复制。在本发明的上下文中使用的“突变”细胞或微生物是指经基因工程化或具有改变的基因组成的细胞或微生物。

在本发明的上下文中,术语“经基因修饰用于生产3-岩藻糖基乳糖的细胞”是指微生物的细胞,其经基因操作以包含以下中的至少一种:i)编码合成所述3-岩藻糖基乳糖所必需的α1,3岩藻糖基转移酶的重组基因,ii)产生适于通过所述岩藻糖基转移酶转移至乳糖的gdp岩藻糖的生物合成途径,和/或iii)产生乳糖的生物合成途径或乳糖从培养基内化到细胞中的机制,在细胞中乳糖被岩藻糖基化以产生3-岩藻糖基乳糖。

术语“编码用于3-岩藻糖基乳糖合成的酶的核酸序列”涉及编码用于3-岩藻糖基乳糖合成途径中必需的酶的核酸序列,例如能够将gdp-岩藻糖供体底物的岩藻糖部分转移到乳糖的半乳糖部分的3羟基上从而产生3-岩藻糖基乳糖的酶。

在本公开内容的上下文中,术语“内源性”是指任何多核苷酸、多肽或蛋白质序列,其是细胞的天然部分并且存在于其在细胞染色体中的天然位置。术语“外源性”是指任何多核苷酸、多肽或蛋白质序列,其来源于所研究的细胞外部,并且不是细胞的天然部分,或不存在于细胞染色体或质粒中的其天然位置。

术语“异源的”当用于提及多核苷酸、基因、核酸、多肽或酶时,是指来自或衍生自宿主物种以外的来源的多核苷酸、基因、核酸、多肽或酶。相反,本文使用“同源”多核苷酸、基因、核酸、多肽或酶来表示衍生自宿主生物体物种的多核苷酸、基因、核酸、多肽或酶。当涉及用于维持或操纵基因序列的基因调控序列或辅助核酸序列时(例如,启动子、5'非翻译区、3'非翻译区、polya附加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等),“异源”是指调控序列或辅助序列与在构建体、基因组、染色体或附加体中与调控或辅助核酸序列并列的基因不天然相关联。因此,可操作地连接至在其天然状态下(即在非基因工程生物体的基因组中)不是可操作地连接至的基因的启动子在本文中被称为“异源启动子”,即使该启动子可衍生自与其所连接的基因相同的物种(或在某些情况下,同一个生物体)。

如本文所使用的术语“编码多肽的多核苷酸”包括包含编码本发明多肽的序列的多核苷酸,所述多肽尤其是具有所附序列表中seqidno2、4、6、8、10、12、14、16、20、22、28、30或32所示氨基酸序列的α-1,3-岩藻糖基转移酶。为清楚起见,编码seqidno18、24和26的多肽的多核苷酸也是该定义所涵盖的多核苷酸,但是seqidno18的多核苷酸是用作参考的现有技术α-1,3-岩藻糖基转移酶,并且seqidno24和26的多核苷酸是对乳糖作为受体不起作用的α-1,3-岩藻糖基转移酶。该术语还包括多核苷酸,所述多核苷酸包括编码所述多肽的单个连续区域或不连续区域(例如,被整合的噬菌体或插入序列或编辑所间隔)以及也可包含编码和/或非编码序列的附加区域。

在本文中使用的术语“变体”是分别与参照多核苷酸或多肽不同但是保留基本特性的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另一种参照多核苷酸不同。变体的核苷酸序列中的变化可以改变或可以不改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸变化可以导致由参照序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短,如下文所讨论那样。多肽的典型变体在氨基酸序列上与另一种参照多肽不同。通常,限制差异以使参照多肽和变体的序列在整体上紧密相似,并且在许多区域中是相同的。变体和参照多肽可以在氨基酸序列中有以任意组合的一个或多个取代、添加、缺失的不同。取代或插入的氨基酸残基可以是或可以不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,诸如等位基因变体,或者其可以是不已知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术、通过直接合成和通过本领域技术人员已知的其他重组方法制得。在一些实施方案中,本发明设想通过修饰本发明中使用的膜蛋白的结构来制备功能性变体。可以通过氨基酸取代、缺失、添加或其组合来产生变体。例如,有理由期望用异亮氨酸或缬氨酸单独替换亮氨酸、用谷氨酸单独替换天冬氨酸、用丝氨酸单独替换苏氨酸、或用结构上相关的氨基酸对氨基酸的相似替换(例如,保守突变)不会对所得分子的生物活性产生重大影响。保守替换是发生在与其侧链相关的氨基酸家族内的替换。通过评估变体多肽以类似于野生型多肽的方式在细胞中产生应答的能力,在本发明的情况下,比没有变体的细胞提供更好的产率、生产率和/或生长速度,可以容易地确定本公开内容的多肽的氨基酸序列中的改变是否导致功能同源物。

本文所使用的术语“功能同源物”描述具有序列相似性并且还共享诸如生化活性的至少一个功能特征的那些分子。功能同源物通常对于相同的特征产生相似的,但不一定相同的程度。功能上同源的蛋白质具有相同的特征,其中一个同源物产生的定量测量值为另一个的至少10%;更典型,至少为20%,在约30%和约40%之间;例如,在约50%和约60%之间;在约70%和约80%之间;或者在约90%和约95%之间;在约98%和约100%之间,或者超过原始分子所产生的定量测量值的100%。因此,当分子具有酶活性时,功能同源物将具有与原始酶相比的上述酶活性百分比。如果分子是dna结合分子(例如,多肽),则同源物将具有上述结合亲和力百分比,通过结合分子的重量与原始分子相比进行测量。

功能同源物和参考多肽可能是天然存在的多肽,并且序列相似性可能是由于趋同或发散的进化事件造成的。功能同源物有时被称为直系同源物,其中“直系同源物”是指在另一物种中与参考基因或蛋白质功能等同的同源基因或蛋白质。

功能同源物可以通过核苷酸和多肽序列比对分析来鉴定。例如,对核苷酸或多肽序列的数据库执行查询可以鉴定生物量调节多肽的同源物。序列分析可以涉及使用生物量调节多肽的氨基酸序列作为参照序列的非冗余数据库的blast、反向blast或psi-blast分析。在某些情况下,氨基酸序列是从核苷酸序列推导出来的。通常,数据库中那些序列同一性大于40%的多肽是进一步评估作为生物量调节多肽的适宜性的候选物。氨基酸序列相似性允许保守的氨基酸替换,例如一个疏水性残基替换另一个疏水性残基或者一个极性残基替换另一个极性残基。如果需要,可以对这类候选物进行人工检查,以缩小待进一步评估的候选物的数量。人工检查可以通过选择那些似乎具有在生产率调控多肽中存在的结构域(例如,保守的功能结构域)的候选物来执行。

“片段”,就多核苷酸而言,是指克隆或多核苷酸分子的任何部分,特别是保留可用的功能特征的多核苷酸的部分。有用的片段包括寡核苷酸和多核苷酸,它们可用于杂交或扩增技术或者复制、转录或翻译的调控。“多核苷酸片段”是指多核苷酸的任何子序列,通常具有本文提供的任何序列的至少约9个连续核苷酸,例如至少约30个核苷酸或至少约50个核苷酸。示例性片段可另外或备选地包括包含编码多肽的保守家族结构域的区域、基本上由其组成或由其组成的片段。示例性片段可另外或备选地包括包含多肽的保守结构域的片段。

片段可另外或备选地包括多肽和蛋白质分子的子序列,或多肽的子序列。在某些情况下,片段或结构域是多肽的子序列,其以与完整多肽基本相同的方式或类似程度执行完整多肽的至少一种生物功能。例如,多肽片段可包含可识别的结构基序或功能结构域,例如dna结合位点或结构域,其与dna启动子区、激活结构域或用于蛋白质-蛋白质相互作用的结构域结合,并且可启动转录。片段的大小可以从少至3个氨基酸残基到完整多肽的全长不等,例如长度至少约20个氨基酸残基,例如长度至少约30个氨基酸残基。优选地,片段是具有衍生片段的多肽的至少一种性质或活性的功能片段,例如,片段可以包括多肽的功能结构域或保守结构域。例如,可以通过pfam或保守结构域数据库(cdd)指定来表征结构域。

本发明中使用的术语“alpha-1,3-岩藻糖基转移酶”、“alpha1,3-岩藻糖基转移酶”、“3-岩藻糖基转移酶”、“α-1,3-岩藻糖基转移酶”、“α1,3岩藻糖基转移酶”、“3岩藻糖基转移酶”、“3-ft”或“3ft”可交换使用,并指催化岩藻糖从供体底物gdp-l-岩藻糖转移至受体分子乳糖在α-1,3-键中的糖基转移酶。编码“α-1,3-岩藻糖基转移酶”或上述任一术语的多核苷酸是指编码这种糖基转移酶的多核苷酸,其催化岩藻糖从供体底物gdp-l-岩藻糖转移至受体分子乳糖在α-1,3-键中。

本发明中使用的术语“3-岩藻糖基乳糖”、“alpha-1,3-岩藻糖基乳糖”、“alpha1,3岩藻糖基乳糖”、“α-1,3-岩藻糖基乳糖”、“α1,3岩藻糖基乳糖”、“galβ-4(fucα1-3)glc”、“3fl”或“3-fl”可互换使用,并指通过α-1,3-岩藻糖基转移酶催化岩藻糖残基从gdp-l-岩藻糖转移至乳糖在α-1,3-键中而获得的产物。

“寡糖”作为本文中使用的术语并且如在现有技术中通常理解的,是指含有少量(通常为3到10个)简单糖(即单糖)的糖聚合物。

术语“纯化的”是指实质上或基本上不含干扰生物分子的活性的组分的材料。对于细胞、糖类、核酸和多肽,术语“纯化的”是指实质上或基本上不含通常在材料以其天然状态存在时伴随材料的组分的材料。典型地,本发明的纯化的糖类、寡糖、蛋白质或核酸是通过银染凝胶上的条带强度或其他测定纯度的方法测量的至少约50%、55%、60%、65%、70%、75%、80%或85%纯度,通常至少约为90%、91%、92%、93%、94%、95%、96%、97%、98%或99%纯度。纯度或均一性可通过本领域公知的许多方法来指示,例如蛋白质或核酸样品的聚丙烯酰胺凝胶电泳,随后在染色时可视化。出于某些目的,需要高分辨率,并使用hplc或类似的纯化方法。对于寡糖,例如3-岩藻糖基乳糖,可使用诸如但不限于薄层色谱、气相色谱、nmr、hplc、毛细管电泳或质谱的方法来测定纯度。

术语“相同”或百分比“同一性”或%“同一性”在两个或更多个核酸或多肽序列的情形中,是指两个或更多个序列或子序列,当用序列比较算法或目测法测量就最大对应性进行比较和比对时,其是相同的或具有特定百分比的相同的氨基酸残基或核苷酸。对于序列比较,一个序列作为参照序列,将测试序列与之进行比较。当使用序列比较算法时,将测试序列和参照序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数,计算测试序列相对于参照序列的序列同一性百分比。可使用blast和psi-blast确定同一性百分比(altschul等人,1990,jmolbiol215:3,403-410;altschul等人,1997,nucleicacidsres25:17,3389-402)。为了本发明的目的,使用matgat2.01确定同一性百分比(campanella等人,2003,bmcbioinformatics4:29)。matgat使用myers和miller全局比对算法进行配对比对。使用蛋白质的如下默认参数:(1)缺口罚分存在:12和延伸:2;(2)采用的矩阵为blosum50。

术语“控制序列”是指由宿主细胞转录和翻译系统识别的序列,允许将多核苷酸序列转录和翻译成多肽。因此,这种dna序列对于在特定宿主细胞或生物体中表达可操作连接的编码序列是必需的。这种控制序列可以是但不限于启动子序列、核糖体结合序列、shinedalgarno序列、kozak序列、转录终止子序列。例如,适于原核生物的控制序列包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多聚腺苷酸化信号和增强子。如果前序列或可分泌前导物的dna作为参与多肽分泌的前蛋白表达,则将前序列或可分泌前导物的dna可操作地连接到多肽的dna;如果启动子或增强子影响序列的转录,则将启动子或增强子可操作地连接到编码序列;或者如果核糖体结合位点影响序列的转录,则将核糖体结合位点可操作地连接到编码序列;或者如果核糖体结合位点的定位便于翻译,则将核糖体结合位点可操作地连接到编码序列。所述控制序列还可利用外部化学品(例如但不限于iptg、阿拉伯糖、乳糖、别乳糖、鼠李糖或岩藻糖)经由可诱导启动子或经由诱导或抑制所述多核苷酸转录或翻译为多肽的遗传回路而得到另外控制。

本发明中使用的术语“发酵结束”是指收获发酵物以进行产品纯化的时机。

一般来说,“可操作连接”是指被连接的dna序列是连续的,并且,在可分泌前导物的情况下,是连续的并且处于阅读框中。但是,增强子不必是连续的。

发明详述

根据第一实施方案,本发明提供一种生产α-1,3-岩藻糖基乳糖的方法。该方法包括以下步骤:

a)提供一种具有α-1,3-岩藻糖基转移酶活性且具有使用乳糖作为受体底物的能力的多肽,其中所述多肽包含

i)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

ii)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,以及

iii)其中如果ii)的结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;并且

其中,所述多肽的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸;

b)在其中所述多肽催化岩藻糖残基从供体底物转移至受体底物的条件下,将步骤a)中具有α-1,3-岩藻糖基转移酶活性的所述多肽与包含gdp岩藻糖作为供体底物和乳糖作为受体底物的混合物接触,由此产生α-1,3-岩藻糖基乳糖。

相对于目前已知的α-1,3-岩藻糖基转移酶,包含上述结构域中的两个(或seqidno33至36的全部,视情况而定)的这些新鉴定的多肽提供了一种具有使用乳糖作为受体底物的能力的替代型α-1,3-岩藻糖基转移酶。包含上述结构域中的两个(或seqidno33至36的全部,视情况而定)的多肽提供了与目前已知的α-1,3-岩藻糖基转移酶相比具有相似或更高乳糖结合和/或相似或更高转移酶性质的转移酶。

在本发明的第一优选实施方案中,用于本发明的多肽包含具有seqidno33到34或36的结构域中的两个(或seqidno33至36的全部,视情况而定)并且其中所述seqidno33是具有氨基酸序列yxtek(seqidno:37)的保守结构域,其中x可以是任何不同的氨基酸。

在本发明的第二优选实施方案中,用于本发明的多肽包含具有seqidno33至34或36的结构域中的两个(或seqidno33至36的全部,视情况而定)并且其中所述seqidno34是具有氨基酸序列[k/d]lx[i/l/m]g[f/y](seqidno:38)、[k/d][l/k]xl[s/g][f/y](seqidno:39)或[k/d]lxlg[f/y](seqidno:40)的保守的结构域,其中x可以是任何不同的氨基酸。

使用一些新鉴定具有使用乳糖作为受体底物的能力和具有α-1,3-岩藻糖基转移酶活性并且具有新鉴定的结构域的多肽的另一个优点在于在反应或发酵结束时,以比使用具有seqidno18的参照现有技术多肽获得的纯度更高的纯度产生3-岩藻糖基乳糖,这是由于新鉴定的3-岩藻糖基转移酶具有更好的转化能力,可以将乳糖用于3fl生产。更具体地说,乳糖浓度与3-岩藻糖基乳糖浓度比率小于1:5、优选地小于1:10、更优选地小于1/20、优选地小于1:40。在另一优选实施方案中,3-岩藻糖基乳糖纯度在发酵结束时为80%或更高。

根据本发明,生产α-1,3-岩藻糖基乳糖的方法可在无细胞系统或含有细胞的系统中进行。使底物gdp岩藻糖和乳糖与α-1,3-岩藻糖基转移酶多肽反应足够的时间并在足够的条件下反应,以形成酶产物。这些条件将取决于底物和酶的数量和纯度,以及系统是无细胞系统还是基于细胞的系统而变化。本领域技术人员将容易地调整这些变量。

在无细胞系统中,根据本发明的多肽、受体底物、供体底物和视情况而定的其他反应混合物成分(包括其他糖基转移酶和辅助酶)通过混合在水性反应介质中组合以执行酶促反应。酶可以在溶液中自由利用,或者可以结合或固定化在支持物(例如聚合物)上,并且底物可以添加到支持物上。例如,支持物可以包装在柱中。

本文所述的用于合成3-岩藻糖乳糖的含细胞系统或基于细胞的系统可包括经基因修饰的宿主细胞。根据本发明的一个方面,具有α-1,3-岩藻糖基转移酶活性的多肽由产生该多肽的细胞(例如,如本文所述的宿主细胞)产生。根据本发明的另一方面,gdp-岩藻糖和/或乳糖由生产所述gdp-岩藻糖和/或乳糖的细胞提供。细胞可以是宿主细胞,其也产生α-1,3-岩藻糖基转移酶。备选地,细胞可以是产生α-1,3-岩藻糖基转移酶的宿主细胞之外的另一细胞,在这种情况下,技术人员将讨论细胞偶联。这种生产gdp-岩藻糖的细胞可以表达将例如要添加到宿主细胞的岩藻糖转化为gdp-岩藻糖的酶。这种酶可以是,例如,双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰转移酶,如脆弱拟杆菌(bacteroidesfragilis)的fkp,或一个单独的岩藻糖激酶与一个单独的岩藻糖-1-磷酸鸟苷酰转移酶的组合,如已知的,它们来自于几个物种,包括智人(homosapiens、猪(susscrofa)和褐家鼠(rattusnorvegicus)。

在另一实施方案中,本发明涉及一种生产α-1,3-岩藻糖基乳糖的方法,包括以下步骤:

i)提供一种经基因修饰用于生产α-1,3-岩藻糖基乳糖的细胞,所述细胞包含至少一个编码用于α-1,3-岩藻糖基乳糖合成的酶的核酸序列,所述细胞包含具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽的表达,其中所述多肽包含:

a)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

b)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,以及

c)其中如果b)的结构域等于dm[a/s]vsf(seqidno36),则在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;并且

其中所述多肽的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸,以及

ii)在允许生产α-1,3-岩藻糖基乳糖的条件下,在培养基中培养细胞,从而产生3-fl。

在另一个实施方案中,本发明涉及一种生产α-1,3-岩藻糖基乳糖的方法,该方法包括以下步骤:

a)提供表达本文所定义的具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的所述多肽的宿主细胞;

b)在允许产生α-1,3-岩藻糖基乳糖并允许表达具有α-1,3-岩藻糖基转移酶活性的多肽的合适营养条件下使所述宿主细胞生长;

c)在步骤b)的同时或之后提供供体底物gdp-岩藻糖和受体底物乳糖,以使α-1,3-岩藻糖基转移酶多肽催化岩藻糖残基从gdp-岩藻糖转移至乳糖,从而生产α-1,3-岩藻糖基乳糖。

然后任选地从宿主细胞和/或其生长的培养基分离产生的3fl。

根据又一个实施方案,本文所述方法中所述3-岩藻糖基乳糖的生产是通过细胞对编码α-1,3-岩藻糖基转移酶的多核苷酸的异源或同源(过)表达来进行的。

在本文所述的本发明方法中,宿主细胞可以经转化或转染以表达本文所述的并具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的外源多肽。因此,本发明涉及一种使用宿主细胞生产α-1,3-岩藻糖基乳糖的方法,包括以下步骤:

a)使经转化或转染以表达具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的外源多肽的宿主细胞生长,其中所述多肽如本文所述;和

b)在步骤a)的同时或之后,提供供体底物gdp-岩藻糖和受体底物乳糖,其中α-1,3-岩藻糖基转移酶多肽催化岩藻糖残基从供体底物转移至受体底物,从而产生α-1,3-岩藻糖基乳糖。

优选地,如本文所使用的具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的外源多肽产生3fl,其在发酵结束时乳糖浓度与3fl浓度的比率小于1:5。

乳糖浓度与3fl浓度的比率可以小于1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:45、1:50、1:55、1:60、1:65、1:70、1:75、1:80、1:85、1:90、1:95、1:100、1:110、1:120、1:130、1:140、1:150、1:160、1:170、1:180、1:190、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000。

在优选实施方案中,在生产过程中获得乳糖浓度与3fl浓度的比率小于1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:45、1:50、1:55、1:60、1:65、1:70、1:75、1:80、1:85、1:90、1:95、1:100、1:110、1:120、1:130、1:140、1:150、1:160、1:170、1:180;1:190、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000,导致最终乳糖浓度低于25g/l、20g/l、15g/l、10g/l、9g/l、8g/l、7g/l、6g/l、5g/l、4g/l、3g/l、2g/l、1g/l、0.5g/lg/l、0.25g/l、0.1g/l或0g/l。

在另一个实施方案中,在生产过程中获得乳糖浓度与3fl浓度的比率小于1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:45、1:50、1:55、1:60、1:65、1:70、1:75、1:80、1:85、1:90、1:95、1:100、1:110、1:120、1:130、1:140、1:150、1:160、1:170、1:180、1:190、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000,其中乳糖浓度在底物限制条件下进料,其中底物限制定义为决定底物的转化率的在生物反应器中的浓度。

在另一个实施方案中,在生产过程中获得乳糖浓度和3fl浓度的比率小于1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:45、1:50、1:55、1:60、1:65、1:70、1:75、1:80、1:85、1:90、1:95、1:100、1:110、1:120、1:130、1:140、1:150、1:160、1:170、1:180、1:190、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000,其中乳糖在限速条件下在细胞中形成。

在另一个实施方案中,基于肉汤中(乳糖和3fl)总和的3-岩藻糖基乳糖在肉汤中的纯度高于约80%,例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、95,5%、96%、96,5%、97%、97,5%、98%、98,5%、99%、99,5%、99,6%、99,7%、99,8%、99,9%。如本文所用,3-岩藻糖基乳糖纯度定义为3fl浓度与3fl浓度和乳糖浓度之和的比率([3fl]/([3fl]+[乳糖])。

根据本发明,可在发酵培养基或水性培养基中将gdp-岩藻糖和/或乳糖进料给宿主细胞。备选地,gdp-岩藻糖和/或乳糖可由在宿主细胞中同时表达的酶或由宿主细胞的代谢来提供。因此,宿主细胞也将在gdp-岩藻糖和/或乳糖后产生α-1,3-岩藻糖基转移酶。在另一实施方案中,gdp-岩藻糖和/或乳糖可由作为产生α-1,3-岩藻糖基转移酶的宿主细胞之外的另一细胞的细胞产生,在这种情况下,本领域技术人员将谈论细胞偶联。这种产生gdp-岩藻糖的细胞可以表达将例如要添加到宿主细胞的岩藻糖转化为gdp-岩藻糖的酶。这种酶例如可以是双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰转移酶,如脆弱拟杆菌的fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟苷酰转移酶的组合,如已知它们来自几种物种,包括智人、猪和褐家鼠。

根据又一实施方案,所述α-1,3-岩藻糖基乳糖的产生通过如本文所述的宿主细胞进行,所述宿主细胞包含编码α-1,3-岩藻糖基转移酶的多核苷酸的异源或同源(过度)表达。

在另一方面中,本发明提供如本文所述的用于生产α-1,3-岩藻糖基乳糖的方法,其中该方法进一步包括从宿主细胞或其生长的培养基分离α-1,3-岩藻糖基乳糖的步骤。

如本文所用,术语“分离”意指从反应混合物和/或从产生α-1,3-岩藻糖基转移酶的细胞中收获、收集或回收根据本发明的由α-1,3-岩藻糖基转移酶产生的α-1,3-岩藻糖基乳糖。

如果通过细胞或发酵制备α-1,3-岩藻糖基乳糖,则3-fl可通过常规方式从制备混合物的水性培养基中分离。如果α-1,3-岩藻糖基乳糖仍存在于产生α-1,3-岩藻糖基乳糖的细胞中,则可使用从细胞中释放或提取α-1,3-岩藻糖基乳糖的常规方法,例如使用高ph、热激、超声波、法式滤压、均化、酶促水解、化学水解、溶剂水解、洗涤剂、水解……来破坏细胞。培养基、反应混合物和/或细胞提取物一起并单独称为含3-fl的混合物,然后可进一步用于分离3-fl。这优选地涉及澄清含3-fl的混合物以去除悬浮的颗粒和污染物,特别是细胞、细胞组分,通过培养经基因修饰的细胞和/或进行酶促反应产生的不溶性代谢物和碎片。在此步骤中,可采用常规方式澄清含有3-fl的混合物。优选地,通过离心、絮凝、倾析和/或过滤来澄清含有3-fl的混合物。从含有3-fl的混合物中分离3-fl的第二步骤优选地涉及从含有3-fl的混合物(优选地在其已被澄清之后)中去除基本上所有蛋白质以及肽、氨基酸、rna和dna以及可能干扰随后分离步骤的任何内毒素和糖脂。在该步骤中,蛋白质和相关杂质可按常规方式从含有3-fl的混合物中去除。优选地,通过超滤、纳米过滤、反渗透、微滤、活性木炭或碳处理、切向流高效过滤、切向流超滤、亲和色谱、离子交换色谱(例如但不限于阳离子交换、阴离子交换、混合床离子交换)、疏水相互作用色谱和/或凝胶过滤(即尺寸排阻色谱),特别是通过色谱,更特别是通过离子交换色谱或疏水相互作用色谱或配体交换色谱从含有3-fl的混合物中去除蛋白质、盐、副产物、颜色和其他相关杂质。除了尺寸排阻色谱以外,蛋白质和相关杂质被色谱介质或选定的膜保留,而3-fl保留在含有3-fl的混合物中。

通过蒸发、冻干、结晶、沉淀和/或干燥、喷雾干燥的进一步纯化步骤或无需进一步纯化步骤从反应混合物和/或培养基和/或细胞进一步分离3-fl。

在更进一步方面,本发明还提供α-1,3-岩藻糖基乳糖的进一步纯化。所述α-1,3-岩藻糖基乳糖的进一步纯化可例如通过使用(活性)木炭或碳、纳米过滤、超滤或离子交换来完成,以去除任何剩余的dna、蛋白质、lps、内毒素或其他杂质。也可以使用乙醇等醇和含水醇混合物。另一种纯化步骤是通过结晶、蒸发或沉淀产物来完成的。另一种纯化步骤是干燥、喷雾干燥或冷冻干燥α-1,3-岩藻糖基乳糖。

分离的且优选地也是纯化的3-fl可用作婴儿配方食品中的补充剂并且用于治疗新生婴儿中的各种疾病。

本发明的另一方面提供了一种方法,其中多肽和也是优选的3-fl是在和/或由本文所述的真菌、酵母、细菌、昆虫、动物和植物表达系统或细胞中产生的。表达系统或细胞选自包括细菌、酵母或真菌的列表,或指植物或动物细胞。后者细菌优选地属于变形菌(proteobacteria)门或厚壁菌(firmicutes)门或蓝细菌(cyanobactria)门或者异常球菌-栖热菌(deinococcus-thermus)门。属于变形菌门的后者细菌优选地属于肠杆菌科(enterobacteriaceae),优选地属于大肠杆菌种。后者细菌优选地涉及属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌b、大肠杆菌c、大肠杆菌w、大肠杆菌k12、大肠杆菌nissle。更具体地,后者术语涉及培养的大肠杆菌菌株——称为大肠杆菌k12菌株——其非常适合于实验室环境,并且与野生型菌株不同,其已丧失了在肠中繁殖的能力。大肠杆菌k12菌株的公知实例是k12野生型、w3110、mg1655、m182、mc1000、mc1060、mc1061、mc4100、jm101、nzn111和aa200。因此,本发明特别涉及如上所述突变和/或转化的大肠杆菌宿主细胞或菌株,其中所述大肠杆菌菌株是k12菌株。更具体地,大肠杆菌k12菌株是大肠杆菌mg1655。属于厚壁菌门的后者细菌优选地属于芽孢杆菌纲(bacilli),优选地属于乳杆菌目(lactobacilliales),其成员诸如乳酸乳杆菌(lactobacilluslactis)、肠系膜明串珠菌(leuconostocmesenteroides),或芽孢杆菌目(bacillales),其成员诸如来自芽孢杆菌属,诸如枯草芽孢杆菌(bacillussubtilis)或解淀粉芽孢杆菌(b.amyloliquefaciens)。属于放线菌门的后者细菌优选地属于棒杆菌科(corynebacteriaceae),其成员为谷氨酸棒杆菌(corynebacteriumglutamicum)或非发酵棒杆菌(c.afermentans),或属于链霉菌科(streptomycetaceae),其成员为灰链霉菌(streptomycesgriseus)或弗雷迪链霉菌(s.fradiae)。后者酵母优选地属于子囊菌门(ascomycota)或担子菌门(basidiomycota)或半知菌门(deuteromycota)或接合菌门(zygomycete)。后者酵母优选地属于酵母属(saccharomyces)、毕赤酵母属(pichia)、komagataella、汉逊酵母属(hansunella)、克鲁维酵母属(kluyveromyces)、耶氏酵母属(yarrowia)或斯塔摩酵母属(starmerella)。后者真菌优选地属于根霉属(rhizopus)、盘基网柄菌属(dictyostelium)、青霉属(penicillium)、毛霉属(mucor)或曲霉属(aspergillus)。

根据本发明的另一方面,编码具有α-1,3-岩藻糖基转移酶活性的多肽的多核苷酸适于相应细胞或表达系统的密码子使用。

在另一优选实施方案中,本发明的方法使用用于包含本发明的α-1,3-岩藻糖基转移酶的宿主细胞或微生物生长的培养基,其中培养基中的乳糖浓度在50至150g/l的范围内。培养基中的所述乳糖浓度可为50g/l、55g/l、60g/l、65g/l、70g/l、75g/l、80g/l、85g/l、90g/l、95g/l、100g/l、105g/l、110g/l、115g/l、120g/l、125g/l、130g/l、135g/l、140g/l、145g/l或150g/l。

在另一优选实施方案中,本发明方法产生3-岩藻糖基乳糖的最终浓度范围为70g/l至200g/l。这样的3-fl浓度为70g/l、75g/l、80g/l、85g/l、90g/l、95g/l、100g/l、105g/l、110g/l、115g/l、120g/l、125g/l、130g/l、135g/l、140g/l、145g/l、145g/l、150g/l、155g/l,160g/l、165g/l、170g/l、175g/l、180g/l、185g/l、190g/l、195g/l或200g/l。培养基中较高的乳糖浓度可提供在生产方法中获得的甚至更高的3-fl最终浓度。

在另一优选实施方案中,本发明的方法产生3fl的最终浓度范围为70g/l至200g/l,如上所述,并且其中所述肉汤中的3fl纯度为80%或更高。根据本发明的3fl纯度为至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、95,5%、96%、96,5%、97%、97,5%、98%、98,5%、99%、99,5%、99,6%、99,7%、99,8%、99,9%。

在如本文所述的本发明方法中,具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽包含:

a)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

b)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,和

c)其中如果b)的结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;并且

其中所述多肽的c-末端具有从所述gdp-岩藻糖结合结构域的第一个氨基酸开始的少于或等于100个氨基酸。

在本发明的范围内,所述多肽被证明具有乳糖结合α-1,3-岩藻糖基转移酶活性,并且与目前已知的α-1,3-岩藻糖基转移酶相比优选地具有更好的乳糖转化效率。

在本发明的优选实施方案中,所述具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽包含选自由以下项目组成的组的氨基酸序列:

i)所附序列表中seqidno6、2、4、8、10、12、14、16、20、22、28、30或32的任何一个;

ii)与seqidno2、20或22的全长氨基酸序列具有87%或更高序列同一性的氨基酸序列;

iii)与seqidno6、8、10、12、14、16、28、30或32的任何一个的全长氨基酸序列具有80%或更高序列同一性的氨基酸序列;

iv)seqidno2、20或22中所示的氨基酸序列的片段,其中所述片段包含其至少45个连续氨基酸;

v)seqidno6、8、10、12、14、16、28、30或32的任何一个所示的氨基酸序列的片段,其中所述片段包含其至少10个连续氨基酸并且具有乳糖结合α-1,3-岩藻糖基转移酶活性。

任选地,所述多肽通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

本文所用多肽的氨基酸序列可以是选自所附序列表中seqidno6、2、4、8、10、12、14、16、20、22、28、30或32的序列。氨基酸序列也可以是与seqidno2、20或22中任何一个的全长氨基酸序列具有大于约87%序列同一性、87%、88%、89%、90%、91%、92%、93%、94%、95%、95,5%、96%、96,5%、97%、97,5%、98%、98,5%、99%、99,5%、99,6%、99,7%、99,8%、99,9%序列同一性的氨基酸序列。氨基酸序列也可以是与seqidno6、8、10、12、14、16、28、30或32的任何一个的全长氨基酸序列具有大于约80%序列同一性,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、95,5%、96%、96,5%、97%、97,5%、98%、98,5%、99%、99,5%、99,6%、99,7%、99,8%、99,9%序列同一性的氨基酸序列。

此外,在本发明的范围内,氨基酸序列可以是seqidno2、20或22中任何一个所示的氨基酸序列的片段,其中所述片段包含其至少45个连续氨基酸;替代地,氨基酸序列可以是seqidno6、8、10、12、14、16、28、30或32中任何一个所示的氨基酸序列的片段,其中所述片段包含其至少10个连续氨基酸并且具有乳糖结合α-1,3-岩藻糖基转移酶活性。

进一步包括在本发明范围内的是如本文所述的α-1,3-岩藻糖基转移酶多肽,其任选地通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。这种氨基酸延伸片段应理解为在多肽的n-末端和/或c-末端添加多肽序列。例如,多肽序列可与α-1,3-岩藻糖基转移酶多肽融合以实现另外的酶活性。这种氨基酸延伸片段可以是特定的标签和/或hq-标签;多至20个氨基酸的延伸,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸;这种延伸也可以是25、30、35、40、45、50、55、60、65、70或更多个氨基酸的长度。可选的n-末端和/或c-末端氨基酸延伸片段还可以是用于纯化的标签、用于增加多肽溶解性的标签、用于代谢物形成的标签或氨基酸延伸片段、用于蛋白质代谢组学的标签、用于底物结合的标签、在基因融合中具有相同或不同功能的另一种多肽,例如但不限于编码gdp-岩藻糖合酶、半乳糖基转移酶、岩藻糖基转移酶、双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰转移酶或岩藻糖-1-磷酸鸟苷酰转移酶的多肽,其中所述另一多肽任选地经由肽接头融合至α-1,3-岩藻糖基转移酶多肽。例如,如本文所述的α-1,3-岩藻糖基转移酶多肽任选地包括一个或多个外源亲和力标签,例如纯化或底物结合标签,例如6his标签序列、gst标签、hq标签、ha标签序列、多个6his标签序列、多个gst标签、多个ha标签序列、snap标签、sumostar标签。其他实例包括蛋白水解裂解位点、保留位点、裂解位点、多组氨酸标签、生物素、抗生物素蛋白、bitag序列、s标签、肠激酶位点、凝血酶位点、抗体或抗体结构域、抗体片段、抗原、受体(receptor)、受体结构域、受体片段、配体、染料、接受体、猝灭剂或其组合。

此外,α-1,3-岩藻糖基转移酶多肽可包括代表功能等效多肽的蛋白质或多肽。这种等效的α-1,3-岩藻糖基转移酶多肽可包含由本文所述的α-1,3-岩藻糖基转移酶多核苷酸编码的氨基酸序列内的氨基酸残基的缺失、添加或替换,但其导致沉默改变,从而产生功能等效的α-1,3-岩藻糖基转移酶。氨基酸取代可基于所涉及残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性性质的相似性来进行。例如,非极性(疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸;平面中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电荷(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸;以及带负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。在本发明的上下文中,如本文所使用的“功能等效物”是指通过包括但不限于酶活性的许多标准中的任一判断的,能够表现出与本发明的乳糖结合α-1,3-岩藻糖基转移酶多肽基本相似的体内活性的多肽。

包括在本发明范围内的是α-1,3-岩藻糖基转移酶蛋白质、多肽和衍生物(包括片段),其在翻译期间或之后被差异修饰。此外,可将非经典氨基酸或化学氨基酸类似物作为取代或添加而引入α-1,3-岩藻糖基转移酶多肽序列中。

α-1,3-岩藻糖基转移酶多肽可通过使用本领域公知技术通过经由重组dna技术产生的多核苷酸的表达而产生。本领域技术人员熟知的方法可用于构建包含α-1,3-岩藻糖基转移酶编码序列和适当的转录和/或翻译控制信号的表达载体。这些方法包括,例如,体外重组dna技术、合成技术和体内基因重组。例如,见sambrook等人(2001)molecularcloning:alaboratorymanual,第3版,coldspringharborlaboratorypress,csh,newyork或currentprotocolsinmolecularbiology,johnwileyandsons,n.y.(1989年和每年更新)中描述的技术。备选地,α-1,3-岩藻糖基转移酶多肽可通过直接合成、通过提取在自然界或者在无细胞和/或体外系统内产生该多肽的细胞来产生。

新鉴定的具有结合乳糖能力的α-1,3-岩藻糖基转移酶用于生产3-岩藻糖基乳糖并优选地生产纯度为80%或更高的这种3fl的适宜性是非常令人惊讶的,并且因此,它们的用途代表了一种容易地、高效地和成本有效地生产3-岩藻糖基乳糖的优秀工具。

编码α-1,3-岩藻糖基转移酶多肽的多核苷酸可使用本领域公知的技术经由重组dna技术产生。本领域技术人员熟知的方法可用于构建包含α-1,3-岩藻糖基转移酶编码序列和适当的转录和/或翻译控制信号的表达载体。这些方法包括,例如,体外重组dna技术、合成技术和体内基因重组。例如,见sambrook等人(2001)molecularcloning:alaboratorymanual,第3版,coldspringharborlaboratorypress,csh,newyork或currentprotocolsinmolecularbiology,johnwileyandsons,n.y.(1989年和每年更新)中描述的技术。

根据本发明的另一方面,提供一种载体,其包含如本文所述的编码具有α-1,3-岩藻糖基转移酶活性的多肽的多核苷酸,其中多核苷酸可操作地连接至被用载体转化的宿主细胞所识别的控制序列。在特别优选的实施方案中,载体是表达载体,并且根据本发明的另一方面,载体可以以质粒、粘粒、噬菌体、脂质体或病毒的形式存在。

因此,根据本发明的多核苷酸可例如包含在将稳定转化/转染到宿主细胞中的载体中。在载体中,本发明的多核苷酸受启动子控制。启动子可以是例如诱导型启动子,使得基因/多核苷酸的表达可以被特异性地靶向,并且,如果需要,基因可以以此方式过度表达。启动子也可以是组成型启动子。

多种表达系统可用于生产本发明的多肽。这些载体尤其包括染色体、附加体和病毒衍生的载体,例如,衍生自细菌质粒、噬菌体、转座子、酵母附加体、插入元件、酵母染色体元件、病毒的载体,以及衍生自其组合的载体,例如衍生自质粒和细菌噬菌体遗传元件的那些,如粘粒和噬菌粒。这些载体可包含选择标志物,例如但不限于抗生素标志物、营养缺陷型标志物、毒素-抗毒素标志物、rna正义/反义标志物。表达系统构建体可能包含调控和产生表达的控制区域。一般而言,适合在宿主中维持、繁殖或表达多核苷酸和/或表达多肽的任何系统或载体可用于在这方面的表达。适当的dna序列可以通过各种已知的和常规的技术中的任何一种插入到表达系统中,例如,sambrook等人中阐述的那些,参见上文。

对于重组生产,宿主细胞可以经基因工程化以掺入表达系统或其部分或本发明的多核苷酸。将多核苷酸引入宿主细胞可以通过许多标准实验室手册中描述的方法来实现,例如davis等人,basicmethodsinmolecularbiology,(1986)和sambrook等人,1989,上文。

根据本发明的另一方面,提供了一种宿主细胞,其包含如上所述的载体。

根据另一方面,本发明提供了一种用于生产α-1,3-岩藻糖基乳糖的经基因修饰宿主细胞,其中宿主细胞包含至少一种编码用于3-岩藻糖基乳糖合成的酶的核酸序列并且其中所述细胞包含具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽的表达。所述多肽如本文所述。

如本文所使用的,术语“宿主细胞”现在定义为已被转化或转染或者能够通过外源性多核苷酸序列转化或转染的细胞,因此包含至少一种不天然存在于所述宿主细胞中的序列。

可以利用多种宿主表达载体系统来表达本发明的α-1,3-岩藻糖基转移酶多核苷酸。这种宿主表达系统表示可产生和随后纯化目标编码序列的媒介物,但也表示在用适当的核苷酸编码序列进行转化或转染时,在原位显示本发明的α-1,3-岩藻糖基转移酶基因产物的细胞。

根据本发明的另一方面,提供了一种用于生产3-岩藻糖乳糖的宿主细胞,其中宿主细胞包含由多核苷酸组成的序列,所述多核苷酸编码具有乳糖结合α-1,3-岩藻糖基转移酶活性的多肽,如本文所述,其中序列是对于宿主细胞外源的序列并且其中序列整合在宿主细胞的基因组中。多核苷酸可操作地与宿主细胞所识别的控制序列相连接。

根据本发明的备选方面,提供了一种用于生产3-岩藻糖基乳糖的宿主细胞,其中宿主细胞包含载体,所述载体包含本文描述的多核苷酸,其中多核苷酸可操作地连接到由用所述载体转化的宿主细胞识别的控制序列。

在另一方面,本发明还提供了一种α-1,3-岩藻糖基乳糖的生产方法,包括以下步骤:a)提供本文所述的细胞,和b)在允许产生α-1,3-岩藻糖基转移酶的条件下在培养基中培养细胞。

优选地,所述α-1,3-岩藻糖基转移酶从本文所述的培养中分离。优选地,也可以按照本文所述进行纯化。

在另一个方面,本发明提供了本发明所述的细胞用于生产3-岩藻糖基乳糖的用途。

根据本发明的另一方面,提供了一种微生物,其表达本文所述的并且优选地由本文所述的多核苷酸编码的α-1,3-岩藻糖基转移酶。

本文所使用的术语微生物或生物体或细胞或宿主细胞是指从包括细菌、酵母或真菌的列表中选择的微生物,或指植物或动物细胞。后者细菌优选地属于变形菌(proteobacteria)门或厚壁菌(firmicutes)门或蓝细菌(cyanobactria)门或者异常球菌-栖热菌(deinococcus-thermus)门。属于变形菌门的后者细菌优选地属于肠杆菌科(enterobacteriaceae),优选地属于大肠杆菌种。后者细菌优选地涉及属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌b、大肠杆菌c、大肠杆菌w、大肠杆菌k12、大肠杆菌nissle。更具体地,后者术语涉及培养的大肠杆菌菌株——称为大肠杆菌k12菌株——其非常适合于实验室环境,并且与野生型菌株不同,其已丧失了在肠中繁殖的能力。大肠杆菌k12菌株的公知实例是k12野生型、w3110、mg1655、m182、mc1000、mc1060、mc1061、mc4100、jm101、nzn111和aa200。因此,本发明特别涉及如上所述突变和/或转化的大肠杆菌宿主细胞或菌株,其中所述大肠杆菌菌株是k12菌株。更优选地,大肠杆菌k12菌株是大肠杆菌mg1655。属于厚壁菌门的后者细菌优选地属于芽孢杆菌纲(bacilli),优选地属于乳杆菌目(lactobacilliales),其成员诸如乳酸乳杆菌(lactobacilluslactis)、肠系膜明串珠菌(leuconostocmesenteroides),或芽孢杆菌目(bacillales),其成员诸如来自芽孢杆菌属,诸如枯草芽孢杆菌(bacillussubtilis)或解淀粉芽孢杆菌(b.amyloliquefaciens)。后者细菌属于放线菌门,优选地属于棒杆菌科(corynebacteriaceae),其成员为谷氨酸棒杆菌(corynebacteriumglutamicum)或非发酵棒杆菌(c.afermentans),或属于链霉菌科(streptomycetaceae),其成员为灰链霉菌(streptomycesgriseus)或弗雷迪链霉菌(s.fradiae)。后者酵母优选地属于子囊菌门(ascomycota)或担子菌门(basidiomycota)或半知菌门(deuteromycota)或接合菌门(zygomycete)。后者酵母优选地属于酵母属(saccharomyces)、毕赤酵母属(pichia)、komagataella、汉逊酵母属(hansunella)、克鲁维酵母属(kluyveromyces)、耶氏酵母属(yarrowia)或斯塔摩酵母属(starmerella)。后者真菌优选地属于根霉属(rhizopus)、盘基网柄菌属(dictyostelium)、青霉属(penicillium)、毛霉属(mucor)或曲霉属(aspergillus)。

根据本发明的另一方面,编码具有乳糖结合α-1,3-岩藻糖基转移酶活性的多肽的多核苷酸适宜于相应宿主细胞的密码子使用。

本发明的另一方面提供了本文所述的多肽用于生产α-1,3-岩藻糖乳糖的用途。本发明的另一方面提供了如本文所述的多核苷酸或本文所述的载体用于生产α-1,3-岩藻糖乳糖的用途。

根据另一实施方案,提供迄今未知的乳糖结合α-1,3-岩藻糖基转移酶。本发明提供一种具有乳糖结合α-1,3-岩藻糖基转移酶活性的分离和/或合成多肽,其中所述多肽包括:

-编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)和保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,其中如果该结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35),其中x可以是任何不同的氨基酸,并且所述氨基酸序列的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸。

优选地,所述多肽选自由以下项目组成的组:

i)所附序列表中的seqidno2、4、6、8、10、12、14、16、20、22、28、30或32;

ii)与seqidno2、20或22的全长具有87%或更高序列同一性的氨基酸序列;

iii)包含与seqidnoidno6、8、10、12、14、16、28、30或32中任何一个的全长氨基酸序列具有至少80%序列同一性的氨基酸序列;

iv)seqidnoidno2、20或22中任何一个所示的序列的片段,其中所述片段包括其至少45个连续氨基酸;

v)seqidno6、8、10、12、14、16、28、30或32中任何一个所示的氨基酸序列的片段,其中所述片段包括其至少10个连续氨基酸。

任选地,所述多肽通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

在本发明的范围内,分离和/或合成的多肽具有乳糖结合α-1,3-岩藻糖基转移酶活性。这样的多肽包含编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)和保守[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,其中如果该结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35),其中x可以是任何不同的氨基酸,且所述氨基酸序列的c-末端具有从以上定义的保守的gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸,例如100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40个氨基酸。

还包括在本发明的范围内是如本文所述的α1,3-岩藻糖基转移酶多肽,其任选地通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

令人惊讶地发现,新鉴定的乳糖结合α-1,3-岩藻糖基转移酶可用于进行非天然发生的反应。此外,已经发现上述鉴定的α-1,3-岩藻糖基转移酶能够使用乳糖作为底物,具有与目前已知的α-1,3-岩藻糖基转移酶相似或更高的乳糖结合特性,并且能够产生3-岩藻糖基乳糖。

直到今天,如表1所示,还没有描述新鉴定的本发明岩藻糖基转移酶具有乳糖结合α-1,3-岩藻糖基转移酶活性。

表1:

如表2所示,还发现新鉴定的具有结合乳糖的能力、被用于生产3-岩藻糖基乳糖的α-1,3-岩藻糖基转移酶,所有这些都具有相同的特殊特征,即具有包含保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列,其中x可以是任何不同的氨基酸并且其中所述氨基酸序列的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸。这与已知的乳糖结合3-岩藻糖基转移酶相反,已知的乳糖结合3-岩藻糖基转移酶例如在wo2012/049083所述具有从上述定义的gdp-岩藻糖结合结构域的第一个氨基酸开始的长于100个氨基酸的c-末端。

表2:

此外,还发现seqidno6、seqidno10、seqidno12、seqidno14和seqidno16的多肽序列共享结构域penxxxxxxxtek(seqidno37),其中x可以是任何不同的氨基酸,如图1所示,其中将该结构域放在方框中。所有比对均采用mafftv7.307,可视化采用jalview2.10。

此外,还发现,除了保守的gdp-岩藻糖结合域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)之外,新鉴定的多肽都共享共同的保守的基序[k/d][l/k/m]xxx[f/y](seqidno34),其中x可以是任何不同的氨基酸,以及对乳糖结合重要的保守的氨基酸区[fw]w,如图11所示,其中将该结构域放在方框中。

此外,我们注意到,当这个共同特征是dm[a/s]vsf(seqidno36)时,另外地在蛋白质的n-末端结构域中需要保守的[n/h]xdpaxld(seqidno35)基序,其中x可以是任何不同的氨基酸,以使酶对作为受体底物的乳糖具有α-1,3-岩藻糖基转移酶活性,如图12的比对中所示,其中将该结构域放在方框中。如实施例14中所例示,具有seqidno2、seqidno4、seqidno20和seqidno22的多肽包含两种共有基序并且似乎对作为受体底物的乳糖具有α-1,3-岩藻糖基转移酶活性,而具有seqidno24和seqidno26的多肽不包含n-末端[nh]xdpaxld基序(其中x可以是任何不同的氨基酸(seqidno35))并且确实显示出这种活性。

此外,还发现seqidno6、seqidno12、seqidno14、seqidno16、seqidno28、seqidno30和seqidno32的多肽序列共享结构域k[iv]f[fl]xgen(seqidno41)和rfplw(seqidno42),其中x可以是任何不同的氨基酸,如图13的比对所示,其中将该结构域放在方框中。

在第二实施方案中,本发明还涉及一种分离和/或合成的多核苷酸,其编码如上所述具有乳糖结合α-1,3-岩藻糖基转移酶活性的多肽。

在本发明的范围内,多核苷酸可以是编码seqidno2、6、8、10、12、14、16、20、22、28、30、32所示氨基酸序列中任何一个的多核苷酸的等位变体。

因此,本发明还涉及一种分离和/或合成的多核苷酸,其编码具有α-1,3-岩藻糖基转移酶活性的多肽并且其包含选自由以下项目组成的组的序列:a)所附序列表中的seqidno1、5、7、9、11、13、15、19、21、27、29、31;b)与seqidno1、5、7、9、11、13、15、19、21、27、29、31互补的核酸序列;c)与seqidno1、5、7、9、11、13、15、19、21、27、29、31具有80%或更高序列同一性的核酸序列。

因此,本发明还涉及通过根据本发明的方法获得的3-岩藻糖基乳糖,以及如上所述的多核苷酸、载体、宿主细胞、微生物或多肽用于生产3-岩藻糖基乳糖的用途。α-1,3-岩藻糖基乳糖可用作食品添加剂,益生元,共生体(symbiotic),用于婴儿食品、成人食品或饲料的补充,或用作治疗或医药活性化合物。通过这些新方法,可以容易而有效地提供α-1,3-岩藻糖基乳糖,而不需要复杂、耗时和耗费成本的合成过程。

除非另有定义,否则本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同含义。一般而言,本文中使用的术语以及上下文描述的细胞培养、分子遗传学、有机化学和核酸化学中的实验室程序是本领域中公知和常用的。核酸和肽的合成使用标准技术。通常,酶促反应和纯化步骤根据制造商的说明书进行。

其他优点来自具体实施方案、实施例和附图。

不言而喻,在不脱离本发明的范围的情况下,上述特征和下面仍要说明的特征不仅可以在各自指定的组合中使用,还可以在其他组合中使用或单独使用。

本发明涉及以下具体实施方案:

1.一种生产α-1,3-岩藻糖基乳糖的方法,该方法包括以下步骤:

a)提供具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽,其中所述多肽包含

i)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

ii)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,和

iii)其中如果ii)的结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;和

其中所述多肽的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸;

b)在其中所述多肽催化岩藻糖残基从供体底物转移至受体底物的条件下,使步骤a)的具有α-1,3-岩藻糖基转移酶活性的所述多肽与包含gdp-岩藻糖作为供体底物和乳糖作为受体底物的混合物接触,

从而产生α-1,3-岩藻糖基乳糖,

c)任选地分离所述α-1,3-岩藻糖基乳糖。

2.根据实施方案1的方法,其中所述多肽在无细胞系统中提供。

3.根据实施方案1的方法,其中所述多肽由包含编码所述多肽的多核苷酸的细胞产生。

4.根据实施方案1或3中任一项的方法,其中所述gdp-岩藻糖和/或乳糖由产生所述gdp-岩藻糖和/或乳糖的细胞提供。

5.根据实施方案1、3或4中的任一项的方法,该方法包括以下步骤:

i)提供经基因修饰以产生α-1,3-岩藻糖基乳糖的细胞,所述细胞包含至少一种编码用于α-1,3-岩藻糖基乳糖合成的酶的核酸序列,

所述细胞包含具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的所述多肽的表达,

ii)在允许产生α-1,3-岩藻糖基乳糖的条件下在培养基中培养细胞,

iii)优选地从培养中分离α-1,3-岩藻糖基乳糖。

6.根据实施方案3的方法,该方法包括以下步骤:

a)提供表达具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的所述多肽的宿主细胞;

b)在允许产生α-1,3-岩藻糖基乳糖并允许表达具有α-1,3-岩藻糖基转移酶活性的所述多肽的合适的营养条件下使所述宿主细胞生长;

c)在步骤b)的同时或之后提供供体底物gdp-岩藻糖和受体底物乳糖,以便α-1,3-岩藻糖基转移酶多肽催化岩藻糖残基从gdp-岩藻糖向乳糖的转移,从而产生α-1,3-岩藻糖基乳糖;

d)任选地从宿主细胞或其生长的培养基中分离所述α-1,3-岩藻糖基乳糖。

7.根据实施方案5或6中任一项的方法,其中宿主细胞经转化或转染以表达具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的外源多肽。

8.根据实施方案3至7中任一项的方法,其特征在于通过在宿主细胞中同时表达的酶或通过宿主细胞的代谢来提供gdp-岩藻糖和/或乳糖。

9.根据实施方案1至8中任一项的方法,其进一步包括α-1,3-岩藻糖基乳糖的纯化。

10.根据前述实施方案中任一项的方法,其中所述多肽选自由以下项目组成的组:

i)所附序列表中seqidno6、2、4、8、10、12、14、16、20、22、28、30或32的任何一个;

ii)与seqidno2、20或22的全长氨基酸序列具有87%或更高序列同一性的氨基酸序列;

iii)与seqidno6、8、10、12、14、16、28、30或32的任何一个的全长氨基酸序列具有80%或更高序列同一性的氨基酸序列;

iv)seqidno2、20或22所示的氨基酸序列的片段,其中所述片段包含其至少45个连续氨基酸;

v)seqidno6、8、10、12、14、16、28、30或32的任何一个所示的氨基酸序列的片段,其中所述片段包含其至少10个连续氨基酸并具有乳糖结合α-1,3-岩藻糖基转移酶活性;

任选地,所述多肽通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

11.根据前述实施方案中任一项的生产3-岩藻糖基乳糖的方法,该方法进一步包括以下步骤中的至少一个:

i)向培养基中添加乳糖进料,所述乳糖进料每初始反应器体积包含至少50克、更优选地至少75克、更优选地至少100克、更优选地至少120克、更优选地至少150克乳糖,优选地以连续方式添加,并且优选地使得培养基的最终体积是添加所述乳糖进料之前的培养基体积的不大于3倍,优选地不大于2倍,更优选地小于2倍;

ii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续方式向培养基中添加乳糖进料;

iii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续方式向培养基中添加乳糖进料,并且其中所述乳糖进料溶液的浓度是50g/l,优选地75g/l,更优选地100g/l,更优选地125g/l,更优选地150g/l,更优选地175g/l,更优选地200g/l,更优选地225g/l,更优选地250g/l,更优选地275g/l,更优选地300g/l,更优选地325g/l,更优选地350g/l,更优选地375g/l,更优选地400g/l,更优选地为450g/l,更优选地500g/l,甚至更优选地550g/l,最优选地600g/l;并且其中优选地将所述溶液的ph设置在3至7并且其中优选地将所述进料溶液的温度保持在20℃至80℃;

iv)所述方法导致在所述培养基的最终体积中3-岩藻糖基乳糖浓度为至少50g/l,优选地至少75g/l,更优选地至少90g/l,更优选地至少100g/l,更优选地至少125g/l,更优选地至少150g/l,更优选地至少150g/l,更优选地至少175g/l,更优选地至少200g/l。

12.经基因修饰以产生α-1,3-岩藻糖基乳糖的宿主细胞,其中宿主细胞包含至少一种编码参与α-1,3-岩藻糖基糖合成的酶的核酸序列;所述细胞包含表达具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽,其中所述多肽包含:

i)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

ii)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,和

iii)其中如果ii)的结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;和

其中所述多肽的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸。

13.根据实施方案12的细胞,所述宿主细胞包含:i)包含编码具有乳糖结合α-1,3-岩藻糖基转移酶活性的所述多肽的多核苷酸的序列,其中所述序列对于所述宿主细胞是外源的序列,并且其中所述序列整合在所述宿主细胞的基因组中,或ii)含有包含编码所述多肽的多核苷酸的载体,其中所述多核苷酸可操作地连接至由用载体转染的宿主细胞识别的控制序列。

14.根据实施方案12或13中任一项的细胞,其中所述多肽包含选自由以下项目组成的组的氨基酸序列:

i)所附序列表中seqidno6、2、4、8、10、12、14、16、20、22、28、30或32的任何一个;

ii)与seqidno2、20或22的全长氨基酸序列具有87%或更高序列同一性的氨基酸序列;

iii)与seqidno6、8、10、12、14、16、28、30或32的任何一个的全长氨基酸序列具有80%或更高序列同一性的氨基酸序列;

iv)seqidno2、20或22所示的氨基酸序列的片段,其中所述片段包含其至少45个连续氨基酸;

v)seqidno6、8、10、12、14、16、28、30或32的任何一个所示的氨基酸序列的片段,其中所述片段包含其至少10个连续氨基酸并具有乳糖结合α-1,3-岩藻糖基转移酶活性;

任选地,所述多肽通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

15.根据实施方案3至11中任一项的方法或根据实施方案12、13或14中任一项的细胞,其中所述细胞选自由微生物、植物或动物细胞组成的组,优选地所述微生物是细菌、真菌或酵母,优选地所述植物是水稻、棉花、油菜籽、大豆、玉米或谷类植物,优选地所述动物是昆虫、鱼类、鸟类或非人类哺乳动物;优选地细胞是大肠杆菌细胞。

16.根据实施方案12至15中任一项的宿主细胞,其特征在于宿主细胞是细菌、优选地是大肠杆菌菌株、更优选地是k12菌株的大肠杆菌菌株的细胞,甚至更优选地大肠杆菌k12菌株是大肠杆菌mg1655。

17.根据实施方案12至15中任一项的宿主细胞,其特征在于宿主细胞是酵母细胞。

18.根据实施方案12至17中任一项的宿主细胞,其特征在于编码具有乳糖结合α-1,2-岩藻糖基转移酶活性的多肽的多核苷酸适合于相应宿主细胞的密码子使用。

19.一种生产α-1,3-岩藻糖基乳糖的方法,包括以下步骤:

a)提供根据实施方案12至18中任一项的细胞,

b)在允许产生α-1,3-岩藻糖基转移酶的条件下在培养基中培养细胞,

c)优选地,从培养中分离所述α-1,3-岩藻糖基转移酶。

20.根据实施方案12至18中任一项的宿主细胞用于生产α-1,3-岩藻糖基乳糖的用途。

21.如实施方案1或11中任一项的方法中所述的多肽用于生产α-1,3-岩藻糖基乳糖的用途。

22.异源表达乳糖结合α-1,3-岩藻糖基转移酶多肽的微生物,其中所述多肽包含:

i)编码保守的gdp-岩藻糖结合结构域[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r](seqidno33)的氨基酸序列;

ii)编码保守的[k/d][l/k/m]xxx[f/y]结构域(seqidno34)的氨基酸序列,和

iii)其中如果ii)的结构域等于dm[a/s]vsf(seqidno36),则另外地在n-末端区域存在保守的基序[n/h]xdpaxld(seqidno35);

其中x可以是任何不同的氨基酸;和

其中所述多肽的c-末端具有从gdp-岩藻糖结合结构域的第一个氨基酸开始的小于或等于100个氨基酸。

23.根据实施方案22的微生物,其中所述多肽包含选自由以下项目组成的组的氨基酸序列:

i)所附序列表中seqidno6、2、4、8、10、12、14、16、20、22、28、30或32的任何一个;

ii)与seqidno2、20或22的全长氨基酸序列具有87%或更高序列同一性的氨基酸序列;

iii)与seqidno6、8、10、12、14、16、28、30或32的任何一个的全长氨基酸序列具有80%或更高序列同一性的氨基酸序列;

iv)seqidno2、20或22所示的氨基酸序列的片段,其中所述片段包含其至少45个连续氨基酸;

v)seqidno6、8、10、12、14、16、28、30或32的任何一个所示的氨基酸序列的片段,其中所述片段包含其至少10个连续氨基酸并具有乳糖结合α-1,3-岩藻糖基转移酶活性;

任选地,所述多肽通过n-末端和/或c-末端氨基酸延伸片段进一步修饰。

24.根据实施方案22或23的微生物用于生产α-1,3-岩藻糖基乳糖的用途。

25.根据实施方案1至11、15或19中任一项的方法,还包括从宿主细胞或其生长的培养基中分离所述α-1,3-岩藻糖基乳糖的步骤。

26.根据实施方案1至11、15、19或25中任一项的方法,其中所述分离包括以下步骤中的至少一个:澄清、超滤、纳米过滤、反渗透、微滤、活性木炭或碳处理、切向流高效过滤、切向流超滤、亲和色谱、离子交换色谱、疏水相互作用色谱和/或凝胶过滤、配体交换色谱。

27.实施方案1至11、15、19、25或26中任一项的方法,进一步包括α-1,3-岩藻糖基乳糖的纯化。

28.实施方案27的方法,其中所述α-1,3-岩藻糖基乳糖的所述纯化包括以下步骤中的至少一个:使用活性木炭或碳,使用木炭,纳米过滤,超滤或离子交换,使用醇,使用含水醇混合物,结晶,蒸发,沉淀,干燥,喷雾干燥或冻干。

29.实施方案1至11、15、19、25至28中任一项的方法,其中多肽在真菌、酵母、细菌、昆虫、动物和植物表达系统中产生。

30.实施方案29的方法,其中宿主细胞是细菌、优选地是大肠杆菌菌株、更优选地是k12菌株的大肠杆菌菌株的细胞,甚至更优选地大肠杆菌k12菌株是大肠杆菌mg1655。

31.实施方案29的方法,其中宿主细胞是酵母细胞。

32.实施方案1至11、15、19、25至31中任一项的方法,其中培养基中的乳糖浓度在50至150g/l的范围内。

33.实施方案1至11、15、19、25至32中任一项的方法,其中3-岩藻糖基乳糖的最终浓度在70g/l至200g/l的范围内。

34.实施方案1至11、15、19、25至33中任一项的方法,其中所述生产导致在发酵结束时乳糖浓度与3-岩藻糖基乳糖的浓度比率小于1:5。

35.实施方案1至11、15、19、25至34中任一项的方法,其中所述产生导致在发酵结束时3-岩藻糖基乳糖纯度为80%或更高。

36.一种生产α-1,3-岩藻糖基乳糖的方法,该方法包括以下步骤:

a)提供具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽,

b)在其中所述多肽催化岩藻糖残基从供体底物转移至受体底物的条件下,使步骤a)的具有α-1,3-岩藻糖基转移酶活性的所述多肽与包含gdp-岩藻糖作为供体底物和乳糖作为受体底物的混合物接触,

从而产生α-1,3-岩藻糖基乳糖,

c)其中所述催化导致在发酵结束时乳糖浓度与3-岩藻糖基乳糖的浓度比率小于1:5,

d)任选地分离所述α-1,3-岩藻糖基乳糖。

37.一种生产α-1,3-岩藻糖基乳糖的方法,该方法包括以下步骤:

a)提供具有α-1,3-岩藻糖基转移酶活性和具有使用乳糖作为受体底物的能力的多肽,

b)在其中所述多肽催化岩藻糖残基从供体底物转移至受体底物的条件下,使步骤a)的具有α-1,3-岩藻糖基转移酶活性的所述多肽与包含gdp-岩藻糖作为供体底物和乳糖作为受体底物的混合物接触,

从而产生α-1,3-岩藻糖基乳糖,

c)其中所述催化导致在发酵结束时3-岩藻糖基乳糖纯度为80%或更高,

d)任选地分离所述α-1,3-岩藻糖基乳糖。

38.生产3-岩藻糖基乳糖的方法,包括以下步骤中的至少一个:

i)向培养基中添加乳糖进料,所述乳糖进料每初始反应器体积包含至少50克、更优选地至少75克、更优选地至少100克、更优选地至少120克,更优选地至少150克乳糖,优选地以连续的方式添加,并且优选地使得培养基的最终体积是添加所述乳糖进料之前的培养基体积的不大于3倍,优选地不大于2倍,更优选地小于2倍;

ii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续的方式向培养基中添加乳糖进料;

iii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续的方式向培养基中添加乳糖进料,并且其中所述乳糖进料溶液的浓度是50g/l,优选地75g/l,更优选地100g/l,更优选地125g/l,更优选地150g/l,更优选地175g/l,更优选地200g/l,更优选地225g/l,更优选地250g/l,更优选地275g/l,更优选地300g/l,更优选地325g/l,更优选地350g/l,更优选地375g/l,更优选地400g/l,更优选地450g/l,更优选地500g/l,甚至更优选地550g/l,最优选地600g/l;并且其中优选地将所述溶液的ph设置在3至7并且其中优选地将所述进料溶液的温度保持在20℃至80℃;

所述方法导致在所述培养基的最终体积中3-岩藻糖基乳糖浓度是至少50g/l,优选地至少75g/l,更优选地至少90g/l,更优选地至少100g/l,更优选地至少125g/l,更优选地至少150g/l,更优选地至少175g/l,更优选地至少200g/l,并且优选地在所述培养物的最终体积中乳糖浓度与3fl浓度比率低于1:5,更优选地1:10,甚至更优选地1:20,最优选地1:40。

39.生产3-岩藻糖基乳糖的方法,其包括以下步骤中的至少一个:

i)向培养基中添加乳糖进料,所述乳糖进料每初始反应器体积包含至少50克、更优选地至少75克、更优选地至少100克、更优选地至少120克,更优选地至少150克乳糖,优选地以连续的方式添加,并且优选地使得培养基的最终体积是添加所述乳糖进料之前的培养基体积的不大于3倍,优选地不大于2倍,更优选地小于2倍;

ii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续的方式向培养基中添加乳糖进料;

iii)在1天、2天、3天、4天、5天的过程中,通过进料溶液以连续的方式向培养基中添加乳糖进料,并且其中所述乳糖进料溶液的浓度是50g/l,优选地75g/l,更优选地100g/l,更优选地125g/l,更优选地150g/l,更优选地175g/l,更优选地200g/l,更优选地225g/l,更优选地250g/l,更优选地275g/l,更优选地300g/l,更优选地325g/l,更优选地350g/l,更优选地375g/l,更优选地400g/l,更优选地450g/l,更优选地500g/l,甚至更优选地550g/l,最优选地600g/l;并且其中优选地将所述溶液的ph设置在3至7并且其中优选地将所述进料溶液的温度保持在20℃至80℃;

所述方法导致在所述培养基的最终体积中3-岩藻糖基乳糖浓度是至少50g/l,优选地至少75g/l,更优选地至少90g/l,更优选地至少100g/l,更优选地至少125g/l,更优选地至少150g/l,更优选地至少175g/l,更优选地至少200g/l,并且优选地在所述培养物的最终体积中3fl纯度是80%或更高。

以下附图和实施例将用作本发明的进一步说明和澄清,并且不旨在限制本发明。

附图说明

图1显示了seqidno6、seqid10、seqid12、seqid14和seqidno16的多肽序列的比对。

图2显示了生长实验中3-岩藻糖基乳糖的标准化的产量。

图3显示以在培养基中从低到高乳糖量的生长实验中3-岩藻糖基乳糖的标准化的产量。

图4显示在培养基中低乳糖量的生长实验中3-岩藻糖基乳糖的标准化的产量。

图5显示所鉴定的乳糖结合α-1,3-岩藻糖基转移酶之一的转化为3-fl的乳糖百分比。

图6显示由不同启动子驱动的不同已鉴定的乳糖结合α-1,3-岩藻糖基转移酶的转化为3-fl的乳糖百分比。

图7显示了进一步实验中3-岩藻糖基乳糖的标准化的产量。

图8显示由不同启动子驱动的已鉴定的乳糖结合α-1,3-岩藻糖基转移酶的子集的3-岩藻糖基乳糖的标准化的产量。

图9显示了从2个不同启动子表达幽门螺杆菌fuct(seqid18)的菌株的3-岩藻糖基乳糖的标准化的产量。

图10显示了表达具有dm[as]vsf共有基序的多肽的菌株的3-岩藻糖基乳糖的标准化的产量

图11显示了seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12、seqidno14、seqidno16、seqidno20、seqidno22、seqidno28、seqidno30和seqidno32的多肽序列的比对。用方框标记共有基序[y/w/l/h/f/m]x[t/s/c][e/q/d/a][k/r]、[k/d][l/k/m]xxx[f/y]和[fw]w,其中x可以是任何不同的氨基酸。

图12显示了seqidno2、seqidno4、seqidno20、seqidno22、seqidno24和seqidno26的多肽序列的比对。用方框标记共有基序dm[a/s]vsf和[n/h]xdpaxld,其中x可以是任何不同的氨基酸(和不相关基序)。

图13显示了seqidno6、seqid12、seqid14、seqidno16、seqidno28、seqidno30和seqidno32的多肽序列的比对。用方框标记共有基序k[i/v]f[f/l]xgen(seqidno41)和rfplw(seqidno42),其中x可以是任何不同的氨基酸。

实施例

实施例1:材料和方法大肠杆菌

培养基

luria肉汤(lb)培养基由1%胰蛋白胨(difco,erembodegem,比利时)、0.5%酵母提取物(difco)和0.5%氯化钠(vwr.leuven,比利时)组成。用于摇瓶实验的培养基包含2.00g/lnh4cl、5.00g/l(nh4)2so4、2.993g/lkh2po4、7.315g/lk2hpo4、8.372g/lmops、0.5g/lnacl、0.5g/lmgso4.7h2o、14.26g/l蔗糖或实施例中指定的其他碳源、1ml/l维生素溶液、100μl/l钼酸盐溶液和1ml/l硒溶液。用1mkoh将培养基的ph值设置为7。维生素溶液由3.6g/lfecl2.4h2o、5g/lcacl2.2h2o、1.3g/lmncl2.2h2o、0.38g/lcucl2.2h2o、0.5g/lcocl2.6h2o、0.94g/lzncl2、0.0311g/lh3bo4、0.4g/lna2edta.2h2o和1.01g/l盐酸硫胺组成。钼酸盐溶液含有0.967g/lnamoo4.2h2o。硒溶液含42g/lseo2。

用于发酵的基本培养基含有6.75g/lnh4cl、1.25g/l(nh4)2so4、2.93g/lkh2po4和7.31g/lkh2po4、0.5g/lnacl、0.5g/lmgso4.7h2o、14.26g/l蔗糖、1ml/l维生素溶液、100μl/l钼酸盐溶液和1ml/l硒溶液,组成与上述相同。

通过高压灭菌(121℃,21’)对复合培养基进行灭菌,并通过过滤(0.22μmsartorius)对基本培养基进行灭菌。必要时,通过添加抗生素(例如氯霉素(20mg/l)、羧苄青霉素(100mg/l)、壮观霉素(40mg/l)和/或卡那霉素(50mg/l))使培养基具有选择性。

质粒

pkd46(red辅助质粒,氨苄青霉素抗性)、pkd3(包含frt侧接的氯霉素抗性(cat)基因)、pkd4(包含frt侧接的卡那霉素抗性(kan)基因)和pcp20(表达flp重组酶活性)质粒从r.cunin教授(比利时布鲁塞尔大学,2007年)获得。

利用goldengate组装法在pmb1ori载体中构建α-1,3-岩藻糖基转移酶表达质粒。使用启动子apfab305(“prom0012”)、apfab146(“prom0032”)(两者均如mutalik等人(nat.methods2013,no.10,354-360)所述)以及p14(“prom0016”与“utr0019”组合)(如demey等人(bmcbiotechnology2007)所述)和utrsgene10-leuab-bcd2(“utr0002”)(如mutalik等人(nat.methods2013,no.10,354-360)所述)表达基因。

质粒维持在从invitrogen购买的宿主大肠杆菌dh5α(f-,phi80dlaczdeltam15,delta(laczya-argf)u169,deor,reca1,enda1,hsdr17(rk-,mk+),phoa,supe44,lambda-,thi-1,gyra96,rela1)中。

菌株和突变

大肠杆菌k12-mg1655[lambda-,f-,rph-1]于2007年3月从coligeneticstockcenter(us),cgsc菌株#:7740获得。使用datsenko和wanner(pnas97(2000),6640-6645)发表的技术进行基因破坏和基因导入。这项技术是基于通过lambdared重组酶进行的同源重组后的抗生素选择。翻转酶重组酶的后续催化确保在最终生产菌株中去除抗生素选择盒。

将携带red辅助质粒pkd46的转化子在含有氨苄青霉素(100mg/l)和l-阿拉伯糖(10mm)的10mllb培养基中于30℃培养至od600nm为0.6。通过第一次用50ml冰冷水洗涤,第二次用1ml冰冷水洗涤,使细胞成为电转感受态的。然后,将细胞重悬在50μl的冰冷水中。使用genepulsertm(biorad)(600ω、25μfd和250伏)用50μl细胞和10-100ng线性双链dna产物进行电穿孔。

电穿孔后,将细胞加入1mllb培养基中于37℃孵育1h,并最后涂布于含有25mg/l氯霉素或50mg/l卡那霉素的lb琼脂上,以选择抗生素抗性转化子。所选择的突变体通过pcr用修饰区上游和下游的引物进行验证,并于42℃在lb琼脂中生长以失去辅助质粒。对突变体测试氨苄青霉素敏感性。

使用pkd3、pkd4及其衍生物作为模板,通过pcr获得线性ds-dna扩增子。所用的引物有一部分序列与模板互补,另一部分与染色体dna上必须发生重组的那一侧互补。对于基因组敲除,同源区域被设计为目标基因的起始密码子和终止密码子的上游50-nt和下游50-nt。对于基因组敲入,必须考虑转录起点(+1)。pcr产物经pcr纯化,dpnl消化,从琼脂糖凝胶再纯化,并悬浮于洗脱缓冲液(5mmtris,ph8.0)中。

将选择的突变体(氯霉素或卡那霉素抗性)用pcp20质粒转化,pcp20质粒为氨苄青霉素和氯霉素抗性质粒,其显示温度敏感复制和热诱导的flp合成。于30℃选择氨苄青霉素抗性转化子,然后于42℃在lb中纯化少数菌落,并且然后测试所有抗生素抗性和flp辅助质粒的丢失。用对照引物(fw/rv-gene-out)检查基因敲除和敲入。

通过敲除基因lacz、lacylaca、glgc、agp、pfka、pfkb、pgi、arca、iclr、wcaj、pgi、lon和thya,制造衍生自大肠杆菌k12-mg1655的突变菌株。此外,大肠杆菌lacy基因、来自运动发酵单胞菌(zymomonasmobilis)的果糖激酶基因(frk)和来自青春双歧杆菌(bifidobacteriumadolescentis)的蔗糖磷酸化酶(sp)被敲入基因组并组成性表达。组成型启动子来源于demey等人(bmcbiotechnology,2007)描述的启动子文库。wo2016075243和wo2012007481中也描述了这些基因修饰。

所有构建的带有假定的α-1,3-岩藻糖基转移酶基因的质粒都在这株衍生自大肠杆菌k12mg1655的突变菌株中进行了评估。所有菌株都储存在-80℃的冷冻小瓶中(过夜lb培养物与70%甘油按1:1比率混合)。表3中提供了所有成功的乳糖结合α-1,3-岩藻糖基转移酶(seqidno1至16、19至22和27至32)以及现有技术α-1,3-岩藻糖基转移酶(seqidno17-18)和两种非功能性α-1,3-岩藻糖基转移酶(seqidno23至26)。

表3:

异源和同源表达

所有需要表达的潜在α-1,3-岩藻糖基转移酶基因,无论是用于质粒还是用于基因组插入,都是在twistbiosciences(旧金山,美国)合成的。通过根据表达宿主的密码子使用优化密码子使用,可以进一步促进表达。利用供应商的工具对基因进行了优化。

培养条件

96孔微量滴定板实验的预培养从冷冻小瓶开始,在150μllb中并于37℃在800rpm的轨道摇床上孵育过夜。将该培养物用作96孔方形微量滴定板的接种物,用400μlmmsf培养基稀释400倍。然后将这些最终的96孔培养板于37℃在800rpm的轨道摇床上孵育72h或更短或更长时间。在培养实验结束时,从每个孔中采集样品,以测量肉汤上清液中的糖浓度(细胞外糖浓度,在将细胞离心之后),或在将细胞离心之前将培养液于90℃煮沸15min(=整个肉汤测量值,细胞内和细胞外糖浓度的平均值)。

生物反应器的预培养从特定菌株的整个1ml冷冻小瓶开始,接种在1l或2.5l摇瓶中的250ml或500mlmmsf培养基中,并于37℃在200rpm的轨道摇床上孵育24h。然后接种5l生物反应器(在2l分批培养基中接种250ml);该过程由mfcs控制软件(sartoriusstedimbiotech,melsungen,德国)控制。培养条件设置为37℃,最大搅拌;压力气体流速取决于菌株和生物反应器。使用0.5mh2so4和20%nh4oh将ph控制在6.8。冷却废气。发酵过程中发泡时加入10%的有机硅消泡剂溶液。

光密度

通过测量600nm处的光密度(implennanophotometernp80,westburg,比利时或spark10m微孔板阅读器,tecan,瑞士)经常监测培养物的细胞密度。

液相色谱法

自制3-岩藻糖基乳糖标准品。其他标准品,如但不限于乳糖、蔗糖、葡萄糖、果糖购自sigma。

经由hplc-ri(waters,美国)方法分析碳水化合物,其中ri(折射率)检测含有样品时流动相折射率的变化。使用x桥柱(watersx桥hplc柱,美国)和含有75ml乙腈、25ml超纯水和0.15ml三乙胺的流动相在恒流中分离糖。柱尺寸为4.6x150mm,粒径为3.5μm。柱温设为35℃,泵流速为1ml/min。

实施例2:对掺入大肠杆菌中的不同乳糖结合α-1,3-岩藻糖基转移酶的评估

建立了一个实验来评估一些编码潜在α-1,3-岩藻糖基转移酶的基因,这些酶能够从gdp-岩藻糖和乳糖产生3-岩藻糖基乳糖(3-fl)。根据实施例1中提供的培养条件进行生长试验。

图2显示使用生产培养基中20g/l乳糖,在使用两种不同的启动子(prom0012和prom0016)的成功表达各种乳糖结合α-1,3-岩藻糖基转移酶的菌株的生长实验中获得的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验鉴定了与具有先前证实的乳糖结合α-1,3-岩藻糖基转移酶活性的含有seqid18的菌株相比,以下具有乳糖结合3-岩藻糖基转移酶活性的多肽:seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12和seqidno14具有相似的或更好的乳糖结合α-1,3-岩藻糖基转移酶活性。seqidno4的多肽与seqidno2具有90,8%的全序列同一性,由此表明与seqidno2具有87%或更高序列同一性的序列也具有乳糖结合α-1,3-岩藻糖基转移酶活性。

实施例3:对掺入大肠杆菌中的乳糖结合α-1,3-岩藻糖基转移酶在基本培养基中以低到高乳糖浓度产生3-fl的能力的评估

对编码seqidno6的基因(与prom0016组合)在含有不同浓度乳糖的基本培养基中产生3-fl的能力进行评估。根据实施例1中提供的培养条件进行生长试验。如上所述,具有seqidno6和seqidno18(由prom0016驱动)的菌株在96孔板的多个孔中生长。seqidno18先前已证实对乳糖的α-1,3-岩藻糖基转移酶活性。

图3显示了3-岩藻糖基乳糖的标准化的产量,其中6种不同浓度的乳糖作为3-fl的前体(90g/l及其1:2的稀释系列,直到2.8g/l,如图所示)。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验鉴定了与表达seqidno18的菌株相比,seqidno6的多肽在所有乳糖浓度下具有更好的乳糖结合α-1,3-岩藻糖基转移酶活性,seqidno18是具有先前证实的乳糖结合α-1.3-岩藻糖基转移酶活性的多肽。

实施例4:对掺入大肠杆菌中的各种乳糖结合α-1,3-岩藻糖基转移酶在基本培养基中以低浓度乳糖产生3-fl的能力的评估

在低浓度乳糖的生长实验中,对上述几种鉴定的具有编码seqidno2、seqidno4、seqidno6、seqidno12和seqidno14的基因的菌株评估从gdp-岩藻糖和乳糖产生3-岩藻糖基乳糖的能力。根据实施例1中提供的培养条件进行生长试验。

图4显示了表达各种α-1,3-岩藻糖基转移酶(使用两种不同的启动子prom0012和prom0016)并在含有少量乳糖(2.8g/l乳糖)的培养基中生长的菌株的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验鉴定了与含有具有先前证实的乳糖结合α-1,3-岩藻糖基转移酶活性的seqid18的菌株相比,当提供有低浓度的乳糖时,下述具有seqidno2、seqidno4、seqidno6、seqidno12和seqidno14的多肽具有相似的或更好的乳糖结合α-1,3-岩藻糖基转移酶活性。

实施例5:对掺入大肠杆菌中的seqidno6的多肽对两种低浓度乳糖的酶活性的评估

在提供2.8g/l或5.62g/l的乳糖和30g/l的蔗糖的生长试验中,对编码seqidno6的基因(并与prom0016组合)评估在产生gdp-岩藻糖的菌株中将乳糖转化为3-岩藻糖基乳糖的能力。根据实施例1中提供的培养条件进行生长试验。

图5显示了转化为3-fl的乳糖%,通过将测量的3-fl量除以基于乳糖输入浓度理论上可获得的量来计算。理论上,如果所有乳糖都被转化,则得到100%的值。每个数据点对应于一个孔的数据。

将表达如seqidno6所示的多肽的菌株与表达如seqidno18所示的多肽的菌株(由prom0016驱动)进行比较,所述seqidno18先前被证实具有对乳糖的α-1,3-岩藻糖基转移酶活性。在两种乳糖浓度下,对于给定量的碳源(30g/l蔗糖),与表达seqidno18所示多肽的菌株相比,表达seqidno6所示多肽的菌株能够将多得多的乳糖转化为3-fl。

实施例6:在限制浓度的乳糖和蔗糖下,对掺入大肠杆菌中的各种乳糖结合α-1,3-岩藻糖基转移酶的酶活性的评估

在低浓度乳糖(2g/l)和蔗糖(7.5g/l)的生长实验中,对编码上述鉴定的多肽seqidno2、seqidno6、seqidno12和seqidno14的基因评估在产生gdp-岩藻糖的菌株中将乳糖转化为3-岩藻糖基乳糖的能力。根据实施例1中提供的培养条件进行生长试验。

图6显示了转化为3-fl的乳糖%,通过将测量的3-fl量除以基于乳糖输入浓度理论上可获得的量来计算。每个数据点对应于一个孔的数据。

对于给定量的碳源(7.5g/l蔗糖),表达具有seqidno2、seqidno6、seqidno12或seqidno14的多肽的菌株能够比表达具有seqidno18的多肽的菌株将更多乳糖转化为3-fl。

实施例7:在分批发酵中对表达各种乳糖结合α-1,3-岩藻糖基转移酶的大肠杆菌菌株的评估

进行生物反应器规模的分批发酵以评估如实施例1所述的衍生自突变体大肠杆菌k12mg1655菌株背景的菌株,其表达具有seqidno2、seqidno6、seqidno12和seqidno14的各种α-1,3-岩藻糖基转移酶。如实施例1所述进行生物反应器运行。在这些实例中,蔗糖被用作碳源。在分批培养基中以90g/l添加乳糖作为3-fl形成的前体。

图7显示了在分批发酵中使用成功表达各种乳糖结合α-1,3-岩藻糖基转移酶的菌株与在生产培养基中乳糖作为前体获得的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一次发酵运行的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验表明,与表达具有seqidno18的多肽的菌株相比,表达具有seqidno2、seqidno6、seqidno12或seqidno14的乳糖结合α-1,3-岩藻糖基转移酶基因的突变体大肠杆菌菌株产生更多量的3-fl。

实施例8:对掺入大肠杆菌中的不同乳糖结合α-1,3-岩藻糖基转移酶的评估

用表达具有seqidno2、seqidno6、seqidno12、seqidno14和seqidno16的酶的菌株进行进一步的实验,并评估在产生gdp-岩藻糖的菌株中这些酶是否能够从乳糖产生3-岩藻糖基乳糖。根据实施例1中提供的培养条件进行生长试验。

图8显示了使用成功表达各种乳糖结合α-1,3-岩藻糖基转移酶(使用三种不同的启动子prom0012、prom0016和prom0026)的菌株在生产培养基中使用20g/l乳糖的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验证实了来自实施例2的表达具有seqidno12、seqidno6、seqidno12和seqidno14的多肽的菌株的结果,并且鉴定了与具有先前证实的乳糖结合α-1,3-岩藻糖基转移酶活性的含有seqid18的菌株相比,具有seqidno16的多肽也具有更好的乳糖结合α-1,3-岩藻糖基转移酶活性。

实施例9:材料和方法酿酒酵母

培养基

菌株生长在合成的成分确定的酵母培养基上,所述培养基具有完全补充混合物(sdcsm)或csmdrop-out(sdcsm-ura),含有6.7g/l不含氨基酸的酵母氮基(ynbw/oaa,difco)、20g/l琼脂(difco)(固体培养物)、22g/l葡萄糖一水合物或20g/l乳糖和0.79g/lcsm或0.77g/lcsmura(mpbiomedicals)。

菌株

由bachmann等人(yeast(1998)14:115-32)创建的酿酒酵母(saccharomycescerevisiae)by4742从euroscarf培养物中心获得。所有突变体菌株均采用gietz的方法(yeast11:355-360,1995)通过同源重组或质粒转化产生。马克思乳酸克鲁维酵母(kluyveromycesmarxianuslactis)可在lmg培养物中心获得(ghent,比利时)。

质粒

酵母表达质粒p2a_2μ_sia_gfa1(chan2013(质粒70(2013)2-17))用于在酿酒酵母中表达外源基因。该质粒包含氨苄青霉素抗性基因和细菌复制起点,以允许在大肠杆菌中进行选择和维持。质粒中还含有质粒中还含有2μ酵母ori和ura3选择标志物用于在酵母中的选择和维持。下一步,该质粒可以经修饰成p2a_2μ_fl以含有乳糖透性酶(例如来自乳酸克鲁维酵母的lac12)、gdp甘露糖4,6-脱水酶(例如来自大肠杆菌的gmd)和gdp-l-岩藻糖合酶(例如来自大肠杆菌的fcl)。

酵母表达质粒p2a_2μ_fl_3ft基于p2a_2μ_ft,但以也表达seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12、seqidno14、seqidno16或seqidno18的方式进行修饰。优选地但不是必要的,岩藻糖基转移酶蛋白质在n-末端融合到sumostar标签(例如,从pysumostar,lifesensors,malvern,pa获得)以增强岩藻糖基转移酶的溶解性。

质粒维持在从invitrogen购买的宿主大肠杆菌dh5α(f-,phi80dlaczdeltam15,delta(laczya-argf)u169,deor,reca1,enda1,hsdr17(rk-,mk+),phoa,supe44,lambda-,thi-1,gyra96,rela1)。

基因表达启动子

使用合成的组成型启动子来表达基因,如blazeck(biotechnologyandbioengineering,vol.109,no.11,2012)所述。

异源和同源表达

需要表达的基因,无论是来自质粒还是来自基因组,都是由以下公司之一合成的:dna2.0、gen9或idt。

通过针对表达宿主的密码子使用优化密码子使用,可以进一步促进表达。利用供应商的工具对基因进行了优化。

培养条件

一般来说,酵母菌株最初生长在sd-csm平板上以获得单一菌落。这些平板于30℃生长2-3天。

从单个菌落开始,预培养物于30℃,以200rpm摇动在5ml中过夜生长。随后的125ml摇瓶实验在25ml培养基中接种2%的这种预培养物。这些摇瓶于30℃使用200rpm的轨道振荡进行孵育。不需要使用诱导剂,因为所有基因都是组成性表达的。

实施例10:使用各种乳糖结合α-1,3-岩藻糖基转移酶在酿酒酵母中生产3-岩藻糖基乳糖

另一实例提供以酿酒酵母形式的真核生物体用于本发明的用途。使用如实施例9所述的菌株、质粒和方法,创建表达seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12、seqidno14、seqidno16或seqidno18的菌株。

除此之外,为了生产3-岩藻糖基乳糖,还进行了进一步的修饰。这些修饰包括添加乳糖透性酶、gdp-甘露糖4,6-脱水酶和gdp-l-岩藻糖合酶。优选的乳糖透性酶是来自乳酸克鲁维酵母的kilac12基因(wo2016/075243)。优选的gdp-甘露糖4,6-脱水酶和gdp-l-岩藻糖合酶分别是来自大肠杆菌的gmd和fcl。

这些菌株能够以葡萄糖或甘油为碳源生长,将碳源转化为gdp-l-岩藻糖,吸收乳糖,并使用gdp-l-岩藻糖和乳糖作为酶的底物生产3-岩藻糖基乳糖,所述酶由seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12、seqidno14、seqidno16或seqidno18表示,以seqidno18为参照。

所述菌株的预培养在5ml合成的成分确定的培养基sd-csm(含有22g/l葡萄糖)中进行,并于30℃生长,如实施例9所述。将这些预培养物接种在25ml培养基中,置于摇瓶中,以10g/l蔗糖作为唯一碳源,并于30℃生长。按照实施例1所述,采集常规样品并测量3-岩藻糖基乳糖的产生。

实施例11:3-岩藻糖基乳糖的酶促生产

另一实例提供了本发明的具有seqidno2、seqidno4、seqidno6、seqidno8、seqidno10、seqidno12、seqidno14或seqidno16的酶的用途。这些酶在无细胞表达系统(例如但不限于purexpress系统(neb)),或在宿主生物体(例如但不限于大肠杆菌或酿酒酵母)中产生,之后可分离并任选地进一步纯化上述酶。

将上述酶提取物或纯化的酶中的每一个与gdp-岩藻糖、乳糖和缓冲组分(例如tris-hcl或hepes)一起添加到反应混合物中。然后将所述反应混合物于特定温度(例如37℃)孵育一定量的时间(例如24小时),在此期间,乳糖将由使用gdp-岩藻糖的酶转化为3-岩藻糖基乳糖。然后通过本领域已知的方法从反应混合物中分离3-岩藻糖基乳糖。如果优选,可进一步纯化3-fl。在反应结束时或者分离和/或纯化后,如实施例1所述测量3-岩藻糖基乳糖的生产。

实施例12:不同乳糖浓度的3-岩藻糖基乳糖生产

如实施例1和实施例7所述的发酵过程,其中培养基中的乳糖浓度在50至150g/l的范围内。在该过程中,所述乳糖转化为3-岩藻糖基乳糖,直到剩余很少量的乳糖。乳糖与3-岩藻糖基乳糖的最终比率可在该过程中通过稍早停止该过程(较高的乳糖与3-岩藻糖基乳糖比率)或稍晚停止该过程(较低的乳糖与3-岩藻糖基乳糖比率)来操纵。可通过向生物反应器进料高浓度的乳糖溶液(含或不含另一碳源)来增加容器中的乳糖浓度。所述乳糖进料含有100至700g/l的乳糖浓度并保持在一定温度,使得乳糖在低于或等于6的ph保持可溶,以避免在该过程中形成乳果糖,这是乳制品工业中使用的标准方法。在这种生产过程中达到的3-岩藻糖基乳糖的最终浓度的范围在70g/l(在如上所述的过程中使用较低乳糖浓度时)至200g/l或更高(在如上所述的过程中使用较高乳糖浓度时)。

实施例13:对从各种启动子表达的幽门螺杆菌α-1,3-岩藻糖基转移酶fuct(seqid18)的评估

将编码幽门螺杆菌α-1,3-岩藻糖基转移酶fuct的基因(seqidno18)克隆在表达载体中在启动子prom0012或prom0016的控制下,并将所得质粒转化到大肠杆菌突变菌株中,如实施例1所述。然后在生长试验中对这些菌株评估其产生3-fl的能力。这两个菌株在96孔板的多个孔中生长。

图9显示了菌株产生的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验表明,使用启动子prom0012表达幽门螺杆菌fuct的菌株中的3-fl产量下降到从启动子prom0016表达岩藻糖基转移酶的类似菌株中观察到的水平的±30%。

通过外推实施例2、4和8中提供的数据,我们可以得出结论,当岩藻糖基转移酶从同一启动子(prom0012或prom0016)表达时,与具有a1,3-岩藻糖基转移酶fuct(seqidno18)的对照菌株相比,含有seqidno2–16中任一个的所有菌株显示出显著更高的产量,例外的是,具有seqidno10的菌株显示与对照菌株相似的产量。

实施例14:对表达具有dm[as]vsf共有基序的多肽的菌株评估3-岩藻糖基乳糖的生产

在如实施例1所述的生长实验中,对含有用于seqidno4、seqidno20、seqidno22、seqidno24和seqidno26任一的表达构建体的突变大肠杆菌菌株评估其3-fl产生。如图12所示,所有多肽序列均包含共有结构域dm[as]vsf(seqidno36),但只有seqidno2、seqidno4、seqidno20和seqidno22另外地在蛋白质的n-末端区域包含共有基序[nh]xdpaxld(seqidno35)。将含有幽门螺杆菌α-1,3-岩藻糖基转移酶fuct(seqidno18)的菌株作为阳性对照。所有菌株在96孔板的多个孔中生长,并在含30g/l蔗糖和20g/l乳糖的标准培养基中进行测试。

图10显示了菌株产生的3-岩藻糖基乳糖的标准化的产量。每个数据点对应于一个孔的数据。水平虚线表示对所有数据点进行标准化的设定点。

实验表明,只有含有具有共有基序[nh]xdpaxld和dm[as]vsf两者的多肽(即seqidno2、seqidno4、seqidno20或seqidno22)的菌株才能产生3-fl,而含有具有dm[as]vsf但缺乏[nh]xdpaxld的多肽(即seqidno24和seqidno26)的菌株不产生任何3-fl。基于此数据,我们可以得出结论,在具有dm[as]vsf(seqidno36)结构域的多肽的n-末端区域存在[nh]xdpaxld(seqidno35)共有基序对于酶具有乳糖结合α-1,3-岩藻糖基转移酶活性至关重要。

此外,seqidno22的多肽与seqidno2具有92%的全局序列同一性性,由此表明与seqidno2具有87%或更高序列同一性的序列也具有乳糖结合α-1,3-岩藻糖基转移酶活性。

实施例15:对表达seqidno28、seqidno30或seqidno32的多肽的菌株的评估

在如实施例1所述的生长实验中,可对含有用于seqidno28、seqidno30或seqidno32的表达构建体的突变大肠杆菌菌株评估其3-fl生产。在生长试验结束时,可以在培养肉汤中观察到3-岩藻糖基乳糖的生产。

实施例16:对分批进料发酵结束时3fl纯度的评估

进行生物反应器规模的分批进料发酵以评估衍生自突变体大肠杆菌k12mg1655菌株背景的菌株,所述菌株如实施例1所述,其表达具有seqidno2、seqidno6和seqidno18的各种α-1,3-岩藻糖基转移酶。如实施例1所述进行生物反应器运行。在这些示例中,蔗糖被用作碳源。在分批培养基中以90g/l添加乳糖作为用于3-fl形成的前体,并在分批进料期间添加浓缩蔗糖溶液。对于每个菌株,进行三次独立的发酵。

在发酵结束时,对肉汤分析存在乳糖和3-fl的情况,并使用公式3fl(g/l)/(3fl(g/l)+乳糖(g/l))来计算3-fl纯度。对于含seqidno18的菌株,获得85%的平均纯度,而对于含有seqidno2或6的菌株,获得分别超过98%和99%的平均纯度。

实验表明,在生物反应器规模的分批进料发酵中,表达具有seqidno2或seqidno6的乳糖结合α-1,3-岩藻糖基转移酶基因的突变大肠杆菌菌株比含有seqidno18的类似菌株产生具有更高3-fl纯度的肉汤。

序列表

<110>因比奥斯公司

<120>生产3-岩藻糖基乳糖和转化乳糖的α-1,3-岩藻糖基转移酶

<130>005-pct

<160>42

<170>patentinversion3.5

<210>1

<211>978

<212>dna

<213>稻固氮螺菌(azospirillumoryzae)

<400>1

atgattgatcagcgtaccagcgactttctaagcgagttcctggcgtcaagccaccgtgat60

ccggcgcgtttagatagcttcctgcttcacgggccaggccgcggcgctcgcgcggcgaaa120

ccgcgtctgaaaattgcgttttttgacttttggccggaatttgacccggctgcgaacttt180

tttgtggacattctgagcgcgcgctttgatgtaagcgttgtggataacgatagcgactta240

gcgattgtgagcgtgtttggcacccgccatcgcgaagcgcgtaccgcgcgtagcatgttt300

tttaccggcgaaaatgtgcgtccgccgttagatggcgtggatatgagcgtgagctttgat360

cgcattgatgacccacgccactatcgcctgccgttatatgtgatgcacgcgtgggatcat420

aggcgtgaaggggcgacgccgcacttttgccagagcgtgctgccgccggtgccgccgacg480

cgtgaagaagcggcgaaacgtaagttttgcgcgtttttatataaaaatccaaactgcgcg540

aggcgcaacgactttttccagatgttatgcgcgaggcgccacgtggaaagcgtgggctgg600

ctgctgaataataccggcagcgtggtgaaaatgggctggctgccgaaaattcgtgtgttc660

agccgctaccgctttgcgtttgcgtttgaaaatgcgagccacccaggctacctgacggag720

aaaattttagatgcgtttcaagcgggcgcggtgccgttatattggggcgacccaggagtg780

ctgcgcgacgttgcggccggcagctttattgatgtgagccgctacgcgagcgatgaagaa840

gcgtgcgacgcgattctggccgcggatgatgattacgatacctaccgccgctaccgcagc900

acgccgccgtttctgggcgcggaagatttttactttgatgcgtttcggctggccgagtgg960

attgagagccgtctataa978

<210>2

<211>325

<212>prt

<213>稻固氮螺菌

<400>2

metileaspglnargthrserasppheleuserglupheleualaser

151015

serhisargaspproalaargleuaspserpheleuleuhisglypro

202530

glyargglyalaargalaalalysproargleulysilealaphephe

354045

aspphetrpproglupheaspproalaalaasnphephevalaspile

505560

leuseralaargpheaspvalservalvalaspasnaspseraspleu

65707580

alailevalservalpheglythrarghisargglualaargthrala

859095

argsermetphephethrglygluasnvalargproproleuaspgly

100105110

valaspmetservalserpheaspargileaspaspproarghistyr

115120125

argleuproleutyrvalmethisalatrpasphisargargglugly

130135140

alathrprohisphecysglnservalleuproprovalproprothr

145150155160

arggluglualaalalysarglysphecysalapheleutyrlysasn

165170175

proasncysalaargargasnaspphepheglnmetleucysalaarg

180185190

arghisvalgluservalglytrpleuleuasnasnthrglyserval

195200205

vallysmetglytrpleuprolysileargvalpheserargtyrarg

210215220

phealaphealaphegluasnalaserhisproglytyrleuthrglu

225230235240

lysileleuaspalapheglnalaglyalavalproleutyrtrpgly

245250255

aspproglyvalleuargaspvalalaalaglyserpheileaspval

260265270

serargtyralaseraspgluglualacysaspalaileleualaala

275280285

aspaspasptyraspthrtyrargargtyrargserthrproprophe

290295300

leuglyalagluaspphetyrpheaspalapheargleualaglutrp

305310315320

ilegluserargleu

325

<210>3

<211>978

<212>dna

<213>生脂固氮螺菌(azospirillumlipoferum)

<400>3

atgattgatcagcgtacgagcgattttctgagcgagtttctagcgtcaccaaaccgtgat60

ccagcggtgttagatcggtttctgcttcatgggccggagcgcgggggccgtgcggccaga120

ccgcgcctgaaaattgcgttttttgacttttggccggaatttgacccgagcgcgaatttt180

tttgtagaaattctgagcagccgctttgatgtgagcgtggttgataatgatagcgattta240

gcgattctgagcgtgtttggcgaacgccaccgcgaagcgcgtaccgcgcgcgcgctgttt300

tttaccggcgaaaatgtgcgcccgccgttagatggcgtggatatgagcgtgagctttgat360

cgcattgatcatccacgtcattatcgcctgccgttatacgtgatgcatgcgtgggatcac420

cgtcgcgaaggggcgaccccgcatttttgccatccggtgctgccgccggtgccgccgacg480

cgtgaagaagcggcgaaacgtaagttttgcgcgtttttatataaaaatcctcactgcgcg540

cgccgcaacgatttttttcagatgctgtgcgcgcggcgccatgtggaaagcgtgggctgg600

ctgctgaataataccggcagcgtggtgaaaatgggctggctgccgaaaattcgcgtgttt660

gcgcgctatcgctttgcgtttgcgtttgaaaacgcggcgcatccaggctatctgaccgag720

aaaattctggatgcgtttcaggccgggacggtaccgttatactggggcgacagcggcgtg780

ctgcgcgacgttgcggccggcagctttattgatgtgagccgctatgcgagcgatgaagaa840

gcgattgaagcgattctggcgattgatgatgactatgatagctatcgccggtaccgcggc900

acggcgccatttttaggcaccgaggacttttactttgacgcgtaccggctggccgagtgg960

attgagagccgcctgtag978

<210>4

<211>325

<212>prt

<213>生脂固氮螺菌

<400>4

metileaspglnargthrserasppheleuserglupheleualaser

151015

proasnargaspproalavalleuaspargpheleuleuhisglypro

202530

gluargglyglyargalaalaargproargleulysilealaphephe

354045

aspphetrpproglupheaspproseralaasnphephevalgluile

505560

leuserserargpheaspvalservalvalaspasnaspseraspleu

65707580

alaileleuservalpheglygluarghisargglualaargthrala

859095

argalaleuphephethrglygluasnvalargproproleuaspgly

100105110

valaspmetservalserpheaspargileasphisproarghistyr

115120125

argleuproleutyrvalmethisalatrpasphisargargglugly

130135140

alathrprohisphecyshisprovalleuproprovalproprothr

145150155160

arggluglualaalalysarglysphecysalapheleutyrlysasn

165170175

prohiscysalaargargasnaspphepheglnmetleucysalaarg

180185190

arghisvalgluservalglytrpleuleuasnasnthrglyserval

195200205

vallysmetglytrpleuprolysileargvalphealaargtyrarg

210215220

phealaphealaphegluasnalaalahisproglytyrleuthrglu

225230235240

lysileleuaspalapheglnalaglythrvalproleutyrtrpgly

245250255

aspserglyvalleuargaspvalalaalaglyserpheileaspval

260265270

serargtyralaseraspgluglualaileglualaileleualaile

275280285

aspaspasptyraspsertyrargargtyrargglythralaprophe

290295300

leuglythrgluaspphetyrpheaspalatyrargleualaglutrp

305310315320

ilegluserargleu

325

<210>5

<211>990

<212>dna

<213>basileapsittacipulmonis

<400>5

atgtcagtgctgaaaaaactggtaagaacgctgaaaaagaaaaaagatattcccagcgaa60

aatcaggaagatattaagccgcaggaatttggacatatcaaacattatcatttctggcct120

ctgtcgaacgaaacgttttttaaccaatttgcgcaggaaaaaaaccttgatctgagccag180

acggccctaattagctgctttggggaactatcagcgattcctaaaatccctgaacggtat240

aaagtgttttttacgggggaaaatatctatcatccggatcgcatctcatattcggatccg300

gagctctatcgcatggtggatctgtatttaggctttgaataccggacggaaccgaagtat360

ctacgctttccgctgtgggtttggtatttatgcggcctgacgaaaaaaccgcatttttca420

catgaatcaattgcggaatttattcggaaaatgaaccaacctgagtttcgcctgcagtca480

tcaaggaatcgcttttgcagccatattagcagccatgatacgaacggcattcggaaacgg540

atgattgatttaattttaccgattgcgtcagtggattgcgccggcaagtttatgaacaac600

acggatgagttaaaagcgaagtttaatgatgacaagatcgactatctaaaacagtatcgg660

tttaatctctgtcctgaaaactcagaatcagtcgggtatatcacggaaaagatttttgaa720

tcaattatggccgggtgcattccaatttattggggaggagtcaagcagctttttgtcgaa780

ccggatattttaaatccggaagcatttatttactacgaaaaagggaaagaagagcaatta840

gcgaaacaggttgaagaactttggatatcacctaaacggtatgaagagtttgcagcaatt900

gccccgtttaaagaggacgcagccgaagtgatttatacgtggattgaagaactggaaaaa960

cggctacgggcatttgaaccaaaagcctaa990

<210>6

<211>329

<212>prt

<213>basileapsittacipulmonis

<400>6

metservalleulyslysleuvalargthrleulyslyslyslysasp

151015

ileprosergluasnglngluaspilelysproglnglupheglyhis

202530

ilelyshistyrhisphetrpproleuserasngluthrphepheasn

354045

glnphealaglnglulysasnleuaspleuserglnthralaleuile

505560

sercyspheglygluleuseralaileprolysileprogluargtyr

65707580

lysvalphephethrglygluasniletyrhisproaspargileser

859095

tyrseraspprogluleutyrargmetvalaspleutyrleuglyphe

100105110

glutyrargthrgluprolystyrleuargpheproleutrpvaltrp

115120125

tyrleucysglyleuthrlyslysprohispheserhisgluserile

130135140

alaglupheilearglysmetasnglnproglupheargleuglnser

145150155160

serargasnargphecysserhisileserserhisaspthrasngly

165170175

ilearglysargmetileaspleuileleuproilealaservalasp

180185190

cysalaglylysphemetasnasnthraspgluleulysalalysphe

195200205

asnaspasplysileasptyrleulysglntyrargpheasnleucys

210215220

progluasnsergluservalglytyrilethrglulysilepheglu

225230235240

serilemetalaglycysileproiletyrtrpglyglyvallysgln

245250255

leuphevalgluproaspileleuasnproglualapheiletyrtyr

260265270

glulysglylysglugluglnleualalysglnvalglugluleutrp

275280285

ileserprolysargtyrglugluphealaalailealaprophelys

290295300

gluaspalaalagluvaliletyrthrtrpileglugluleuglulys

305310315320

argleuargalaphegluprolysala

325

<210>7

<211>930

<212>dna

<213>planctopiruslimnophila

<400>7

atgcaaaaaactttttctctacgtccagtcccagtggatgcaattcgatggaactttgca60

aacttttggtcgggtttcgatgcattagcattcgagcggcacctgttaggtgtctctggg120

aaacataagttccggattagtgaacaaaaccctcagattgtgttcgaatcggtctttggg180

actccagggaaggggcgcgagcgatggccaaaggcacgacaggtgtggtatacgggagaa240

aacgtcgcaccaccactggatcagtttgataaatgtttatcgttccatcgggatattaag300

gatccacggcatttgcgttggccatactatctactgcacttagcaagcttaccaatgtct360

ttcaatgatttggtgaagtgccagagctcagtgtcgacttgggcagaacgtccagggttc420

tgtgcatttattgcatttaacgagggatgccagacgcggaaccggtttgtggaaaagcta480

agtcgataccgtcgagtggattgtccaggtcgggtcttaaataatatgacgagtgagaca540

ctgggtcagcgagggaacttgcatgggaaaattaacttcctgaagcaatataaatacgca600

gtgtgcttcgagaatactagcacgcgaggatcagaagggtatgtgacggaaaagctggtt660

gacgcgatgctggcaggctgcataccattatactggggcgaccaccgggttggggaagat720

tttaacgagaactcgttcattaacttaggagtatacgggaacgatgtgaatgcaatggtc780

cagcatgtgattgaactggattctgacgaacggttgcaaaataacctgtttcaagagcca840

tggttgccagaaattaagtcgtcagagcacttctctttcgaaacgagcaaggatgcaatt900

ctgaagttagtggcaaacgtaaataaatga930

<210>8

<211>309

<212>prt

<213>planctopiruslimnophila

<400>8

metglnlysthrpheserleuargprovalprovalaspalailearg

151015

trpasnphealaasnphetrpserglypheaspalaleualapheglu

202530

arghisleuleuglyvalserglylyshislyspheargileserglu

354045

glnasnproglnilevalphegluservalpheglythrproglylys

505560

glyarggluargtrpprolysalaargglnvaltrptyrthrglyglu

65707580

asnvalalaproproleuaspglnpheasplyscysleuserphehis

859095

argaspilelysaspproarghisleuargtrpprotyrtyrleuleu

100105110

hisleualaserleuprometserpheasnaspleuvallyscysgln

115120125

serservalserthrtrpalagluargproglyphecysalapheile

130135140

alapheasngluglycysglnthrargasnargphevalglulysleu

145150155160

serargtyrargargvalaspcysproglyargvalleuasnasnmet

165170175

thrsergluthrleuglyglnargglyasnleuhisglylysileasn

180185190

pheleulysglntyrlystyralavalcysphegluasnthrserthr

195200205

argglysergluglytyrvalthrglulysleuvalaspalametleu

210215220

alaglycysileproleutyrtrpglyasphisargvalglygluasp

225230235240

pheasngluasnserpheileasnleuglyvaltyrglyasnaspval

245250255

asnalametvalglnhisvalilegluleuaspseraspgluargleu

260265270

glnasnasnleupheglngluprotrpleuprogluilelysserser

275280285

gluhispheserphegluthrserlysaspalaileleulysleuval

290295300

alaasnvalasnlys

305

<210>9

<211>951

<212>dna

<213>pedobacterglucosidilyticus

<400>9

atgaagtattttctgctgctggctaaacgccacaagaaatacctgaaagagaagaaaatc60

ttccgcaactcgactatctctttttacaacttctgggaaatcgaggattacaacaacttt120

tggctgcagaaattcatcgtagaccgtaacctgaacccaaaaaacaaatccatcaacttc180

ttttctgtgttcggcccgcgctatgtccttaaaaagcaaaaagcagcgatcaatattttc240

ttctcgggcgaaaccatgagccgtttcaaaaaataccacgactattgtctgcctgaagtt300

gatctggcgctgggtttcgacgatctgcaacacgagaagtacttccgtctgccgctgtgg360

atcctggactttttcgaaccgactgttgaccttgaaaaagctaaagaaaaactgaaacag420

ctgaactactacaaaaacaataaaccgatcgtgcgtgaaaagttctgctctctgatcgcc480

cgtcacgacgaaaacggcatccgtaaaaagattgtgaacacgctgaacccaatcgaaacg540

gttgactgtgcaggcaaactgttcaacaatactgctcgcttacagaccgaattcgcgaac600

aacaaagtaaaatttctggagaactacaagtttaacatctgcccggaaaacaccaaccag660

gaatcctacaccaccgaaaaacttttcgaaagcttcgctgcaggctgtatcccgatctac720

tggggttctgctcagaaaccggaaccgaacatcttcaaaccgtctagcatcatctttttc780

gatgagttcaaaaacaccctgtctgaggatgttgaacgtctacataaagatccgaaactg840

tacctggactttattagccagaacccgtttcaggacacagctgctgaatacatcatccag900

actatctccaacctggaactcaaactgaaagagatcattaaccaggcataa951

<210>10

<211>316

<212>prt

<213>pedobacterglucosidilyticus

<400>10

metlystyrpheleuleuleualalysarghislyslystyrleulys

151015

glulyslysilepheargasnserthrileserphetyrasnphetrp

202530

gluilegluasptyrasnasnphetrpleuglnlyspheilevalasp

354045

argasnleuasnprolysasnlysserileasnphepheservalphe

505560

glyproargtyrvalleulyslysglnlysalaalaileasnilephe

65707580

pheserglygluthrmetserargphelyslystyrhisasptyrcys

859095

leuprogluvalaspleualaleuglypheaspaspleuglnhisglu

100105110

lystyrpheargleuproleutrpileleuaspphephegluprothr

115120125

valaspleuglulysalalysglulysleulysglnleuasntyrtyr

130135140

lysasnasnlysproilevalargglulysphecysserleuileala

145150155160

arghisaspgluasnglyilearglyslysilevalasnthrleuasn

165170175

proilegluthrvalaspcysalaglylysleupheasnasnthrala

180185190

argleuglnthrgluphealaasnasnlysvallyspheleugluasn

195200205

tyrlyspheasnilecysprogluasnthrasnglnglusertyrthr

210215220

thrglulysleuphegluserphealaalaglycysileproiletyr

225230235240

trpglyseralaglnlysprogluproasnilephelysproserser

245250255

ileilephepheaspgluphelysasnthrleusergluaspvalglu

260265270

argleuhislysaspprolysleutyrleuasppheileserglnasn

275280285

propheglnaspthralaalaglutyrileileglnthrileserasn

290295300

leugluleulysleulysgluileileasnglnala

305310315

<210>11

<211>1029

<212>dna

<213>卡托氏卟啉单胞菌(porphyromonascatoniae)

<400>11

atgccgatatatgatataaaagccatgaataccccgtcgaagcaaccattacgagaacga60

ctgcatatgatgcgtcgacgtaatcgtgtgcggaagcgttcggttatagccctgattaag120

tcgcatttagatagctcacgttatcaggattataactggtgggattctcatgcgtctacc180

ttctggttaccacggtttatagatttgcatctggaaccgaagaagaaaattaatttattt240

tcgtgctttcaaaatccgttaatgctgattcgttattataaaggtgttaaaattttttta300

tcaggtgaaaacctgaccaataacgaacatttcggttttcacccgcgtatgctggatcac360

cgaataaatgaagttgatctagcgttaggtttcgaatttcgtaaagacccgaaatattac420

cgttttccgttatggatttaccagaatgaatttattagcccgtctgccagcttagaggac480

atatgtgttctggtaggccagataaacgacccgtcgacccgtcgtagcgccaagcgttct540

cgttttattggtcagatttcgagccatgataagggtggcatgcggggacggctgatagat600

ctgttatctccgattgggcaaattgattgcgccggtaaatttcgtcataataccgacgaa660

ctgttagaagtgtatggtgacgataaattcaaatatttagccaactatcgttttaactta720

tgcccagaaaattcattaggtgagggctatattaccgaaaaagtgtttgatagcatacgt780

gccggttgtattccgatttactggggcgcctatttagaaccaggtattttaaacccgaaa840

gcgattttacgttttgaagagggcaaagagcaagaattttataaccgggttaaagaatta900

tgggaaaacgaggaagcgtatgaacagttcattctggaaccaccgtttgtcgaaggggcc960

gccgaacgtatttgggaaattttgcagggtttacgtgaacgtttagcgccattagttgaa1020

gaagggtaa1029

<210>12

<211>342

<212>prt

<213>卡托氏卟啉单胞菌

<400>12

metproiletyraspilelysalametasnthrproserlysglnpro

151015

leuarggluargleuhismetmetargargargasnargvalarglys

202530

argservalilealaleuilelysserhisleuaspserserargtyr

354045

glnasptyrasntrptrpaspserhisalaserthrphetrpleupro

505560

argpheileaspleuhisleugluprolyslyslysileasnleuphe

65707580

sercyspheglnasnproleumetleuileargtyrtyrlysglyval

859095

lysilepheleuserglygluasnleuthrasnasngluhisphegly

100105110

phehisproargmetleuasphisargileasngluvalaspleuala

115120125

leuglyphegluphearglysaspprolystyrtyrargpheproleu

130135140

trpiletyrglnasnglupheileserproseralaserleugluasp

145150155160

ilecysvalleuvalglyglnileasnaspproserthrargargser

165170175

alalysargserargpheileglyglnileserserhisasplysgly

180185190

glymetargglyargleuileaspleuleuserproileglyglnile

195200205

aspcysalaglylysphearghisasnthraspgluleuleugluval

210215220

tyrglyaspasplysphelystyrleualaasntyrargpheasnleu

225230235240

cysprogluasnserleuglygluglytyrilethrglulysvalphe

245250255

aspserileargalaglycysileproiletyrtrpglyalatyrleu

260265270

gluproglyileleuasnprolysalaileleuargphegluglugly

275280285

lysgluglngluphetyrasnargvallysgluleutrpgluasnglu

290295300

glualatyrgluglnpheileleugluproprophevalgluglyala

305310315320

alagluargiletrpgluileleuglnglyleuarggluargleuala

325330335

proleuvalgluglugly

340

<210>13

<211>972

<212>dna

<213>卟啉单胞菌属物种(porphyromonassp.)

<400>13

atgaacgcggtcgagcgagtacggaatatacttaattattgtattaacgaagtccaaatg60

taccggcagtgtcccaattcaaaatactataatttctggccctgtgattataataataat120

tggtttaaccatttcgtagaacaccgaggcttagctaaagaacggcaccggcttaacttt180

ttctcggtctttggtaaccctctactgccgcggattataccggggaagaaagtgttcttc240

actggggagaatcttgcagataactcaatacactcaatagggcgagctttcaaaaagacc300

tttccggtatatgatctggtacttgggttcgactatgaagtagaggatagccgggtgaat360

tatatgcggtttccattatggatagccttcctgatagatccgaccgccgattatcagaaa420

ataaaggaaacgattgaacggattaacgacccgtcaacgcggcttaacgcgagccgggat480

cgtttcgcctgccttgttgccagccacgataaaactggtatacggcagaaattatatgat540

gtccttatgccgatagcgtcagtaacttgcccaggacggttccagaataatacgaacgag600

cttcacgatttatatgcaaacgacaagcgggaatatttaaaactgtttaaatttaacgta660

tgtccagaaaattcatcgactccgggttatataactgaaaagttattcgattcgttcgca720

tcaggttgtattcccatatacttcggtgggggaactgaggaaatagagcccgatattgta780

aaccaaggagcgttcatacggtactgggatgatgggcgaatggactggatggacacggta840

cgggaactttgggaatcgccgtcagcataccgggccgttgccgagataccaccgttcaaa900

gaacaagcagcagatgtaatttatgcctatatggaaaaccttcacgacaaacttgcggca960

atagtgcggtga972

<210>14

<211>323

<212>prt

<213>卟啉单胞菌属物种

<400>14

metasnalavalgluargvalargasnileleuasntyrcysileasn

151015

gluvalglnmettyrargglncysproasnserlystyrtyrasnphe

202530

trpprocysasptyrasnasnasntrppheasnhisphevalgluhis

354045

argglyleualalysgluarghisargleuasnphepheservalphe

505560

glyasnproleuleuproargileileproglylyslysvalphephe

65707580

thrglygluasnleualaaspasnserilehisserileglyargala

859095

phelyslysthrpheprovaltyraspleuvalleuglypheasptyr

100105110

gluvalgluaspserargvalasntyrmetargpheproleutrpile

115120125

alapheleuileaspprothralaasptyrglnlysilelysgluthr

130135140

ilegluargileasnaspproserthrargleuasnalaserargasp

145150155160

argphealacysleuvalalaserhisasplysthrglyilearggln

165170175

lysleutyraspvalleumetproilealaservalthrcysprogly

180185190

argpheglnasnasnthrasngluleuhisaspleutyralaasnasp

195200205

lysargglutyrleulysleuphelyspheasnvalcysprogluasn

210215220

serserthrproglytyrilethrglulysleupheaspserpheala

225230235240

serglycysileproiletyrpheglyglyglythrglugluileglu

245250255

proaspilevalasnglnglyalapheileargtyrtrpaspaspgly

260265270

argmetasptrpmetaspthrvalarggluleutrpgluserproser

275280285

alatyrargalavalalagluileproprophelysgluglnalaala

290295300

aspvaliletyralatyrmetgluasnleuhisasplysleualaala

305310315320

ilevalarg

<210>15

<211>951

<212>dna

<213>损伤新月形单胞菌(selenomonasinfelix)

<400>15

atgttaatgcgtgcactcagaaaaatgaagcgatggggacgtgtggcgtttgattacacg60

aatactacgaaggatggagctgtttgctatcataattggtggccgtgtaattatgaggaa120

gagtggtttcatcgttttgttgtacaaaatattggaacagaacgttgctatcatttcttt180

tctgtatttggtccacgtattgcgttgacgctgccaacaccgaataaagtttttttctgt240

ggtgaaaatgtgcataacgcagagtggccctataaaagctatcaagatcatgcacttgga300

gatgtcaagctggctctcggatatgatgatatacaggatgaacgatatattcgatttcct360

ctgtggttgctctatatgttcgatcctgttgttgaccgatatgccatccgtgagcgaatt420

gaagaaatcaatcatgcagagaatacaagaaaatatgaatgtgtattgatttccagacac480

gataagtggaatatgcgtggtccaatttatgatgcattgaaagatcatttggctatttcc540

tgtgctgggaaatggaagcaaaacactgatgaactgtggacggtttacaatgatgataaa600

ccacgctatctaaaagagtttaagtttaatatctgcccggagaattttgacacgccgtat660

tatgttacagagaagctgtttgaagcctttcggagtggaacaattcctatttatgcaggc720

ggaggcgatcatccggagccggaaattgtgaatcgaagcgcactactcctttgggagcga780

ggacaaagtgatcatagtgccttggtacaggaagttatacggctcgcacgcgatgagata840

tactatgataaatttgtacatcaggttcgtttgcttccgtatacggaagagtttgtttat900

gaacagttttcatcgctgaaagagcggttgttgcagataagacgagggtga951

<210>16

<211>316

<212>prt

<213>损伤新月形单胞菌

<400>16

metleumetargalaleuarglysmetlysargtrpglyargvalala

151015

pheasptyrthrasnthrthrlysaspglyalavalcystyrhisasn

202530

trptrpprocysasntyrglugluglutrpphehisargphevalval

354045

glnasnileglythrgluargcystyrhisphepheservalphegly

505560

proargilealaleuthrleuprothrproasnlysvalphephecys

65707580

glygluasnvalhisasnalaglutrpprotyrlyssertyrglnasp

859095

hisalaleuglyaspvallysleualaleuglytyraspaspilegln

100105110

aspgluargtyrileargpheproleutrpleuleutyrmetpheasp

115120125

provalvalaspargtyralailearggluargileglugluileasn

130135140

hisalagluasnthrarglystyrglucysvalleuileserarghis

145150155160

asplystrpasnmetargglyproiletyraspalaleulysasphis

165170175

leualailesercysalaglylystrplysglnasnthraspgluleu

180185190

trpthrvaltyrasnaspasplysproargtyrleulysgluphelys

195200205

pheasnilecysprogluasnpheaspthrprotyrtyrvalthrglu

210215220

lysleupheglualapheargserglythrileproiletyralagly

225230235240

glyglyasphisprogluprogluilevalasnargseralaleuleu

245250255

leutrpgluargglyglnserasphisseralaleuvalglngluval

260265270

ileargleualaargaspgluiletyrtyrasplysphevalhisgln

275280285

valargleuleuprotyrthrglugluphevaltyrgluglnpheser

290295300

serleulysgluargleuleuglnileargarggly

305310315

<210>17

<211>1437

<212>dna

<213>幽门螺杆菌(helicobacterpylori)

<400>17

atgtttcagccgctgctggatgcatatgttgaaagcgcaagcattgaaaaaatggcaagc60

aaaagtccgcctccgctgaaaattgcagttgcaaattggtggggtgatgaagaaatcaaa120

gagtttaaaaacagcgtcctgtactttattctgagccagcgttataccattaccctgcat180

cagaatccgaatgaattttccgatctggtttttggtaatccgctgggtagcgcacgtaaa240

attctgagctatcagaatgcaaaacgcgtgttttataccggtgaaaatgaaagcccgaac300

ttcaacctgtttgattatgccattggtttcgatgagctggattttaatgatcgttatctg360

cgtatgccgctgtattatgatcgtctgcatcataaagcagaaagcgttaatgataccacc420

gcaccgtataaactgaaagataatagcctgtacgcactgaaaaaaccgagccattgcttt480

aaagaaaaacatccgaatctgtgtgccgtggttaatgatgaaagcgatcctctgaaacgt540

ggttttgcaagctttgttgcaagcaatccgaacgcaccgattcgtaatgcattctatgat600

gcactgaatagcattgaaccggttaccggtggtggtagcgttcgtaataccctgggttat660

aatgtgaaaaacaaaaacgaattcctgagccagtataaattcaatctgtgctttgaaaac720

acccagggttatggttatgtgaccgaaaaaatcatcgatgcctatttcagccataccatt780

ccgatttattggggtagcccgagcgttgcaaaagatttcaatccgaaaagctttgtgaac840

gtgcacgacttcaaaaactttgatgaagccatcgattatatcaaatacctgcacacccat900

aaaaacgcctatctggatatgctgtatgaaaatccgctgaatacactggatggtaaagcc960

tatttttaccagaacctgagcttcaaaaaaatcctggcctttttcaaaaccatcctggaa1020

aacgataccatctatcacgataacccgtttatcttttgccgtgatctgaatgaaccgctg1080

gttaccattgatgatctgcgtgttaattatgatgacctgcgcgtgaactacgacgatctg1140

cgcatcaattatgatgatctgcgggtaaactatgatgatctgcgtatcaactacgacgac1200

ctgcgtgtgaactacgatgacctgcgggttaattatgatgatctgcggattaattatgat1260

gatctgcgtgtgaactatgacgatctgcgtgtgaattacgagcgtctgctgagcaaagca1320

acccctctgctggaactgagccagaataccaccagtaaaatctatcgtaaagcgtaccag1380

aaaagcctgcctctgctgcgtgcaattcgtcgttgggttaaaaaactgggtctgtaa1437

<210>18

<211>478

<212>prt

<213>幽门螺杆菌

<400>18

metpheglnproleuleuaspalatyrvalgluseralaserileglu

151015

lysmetalaserlysserproproproleulysilealavalalaasn

202530

trptrpglyaspglugluilelysgluphelysasnservalleutyr

354045

pheileleuserglnargtyrthrilethrleuhisglnasnproasn

505560

glupheseraspleuvalpheglyasnproleuglyseralaarglys

65707580

ileleusertyrglnasnalalysargvalphetyrthrglygluasn

859095

gluserproasnpheasnleupheasptyralaileglypheaspglu

100105110

leuasppheasnaspargtyrleuargmetproleutyrtyrasparg

115120125

leuhishislysalagluservalasnaspthrthralaprotyrlys

130135140

leulysaspasnserleutyralaleulyslysproserhiscysphe

145150155160

lysglulyshisproasnleucysalavalvalasnaspgluserasp

165170175

proleulysargglyphealaserphevalalaserasnproasnala

180185190

proileargasnalaphetyraspalaleuasnserilegluproval

195200205

thrglyglyglyservalargasnthrleuglytyrasnvallysasn

210215220

lysasnglupheleuserglntyrlyspheasnleucysphegluasn

225230235240

thrglnglytyrglytyrvalthrglulysileileaspalatyrphe

245250255

serhisthrileproiletyrtrpglyserproservalalalysasp

260265270

pheasnprolysserphevalasnvalhisaspphelysasnpheasp

275280285

glualaileasptyrilelystyrleuhisthrhislysasnalatyr

290295300

leuaspmetleutyrgluasnproleuasnthrleuaspglylysala

305310315320

tyrphetyrglnasnleuserphelyslysileleualaphephelys

325330335

thrileleugluasnaspthriletyrhisaspasnpropheilephe

340345350

cysargaspleuasngluproleuvalthrileaspaspleuargval

355360365

asntyraspaspleuargvalasntyraspaspleuargileasntyr

370375380

aspaspleuargvalasntyraspaspleuargileasntyraspasp

385390395400

leuargvalasntyraspaspleuargvalasntyraspaspleuarg

405410415

ileasntyraspaspleuargvalasntyraspaspleuargvalasn

420425430

tyrgluargleuleuserlysalathrproleuleugluleusergln

435440445

asnthrthrserlysiletyrarglysalatyrglnlysserleupro

450455460

leuleuargalaileargargtrpvallyslysleuglyleu

465470475

<210>19

<211>978

<212>dna

<213>固氮螺菌属物种(azospirillumsp.)

<400>19

atgattgatcagcggaccggcgtgtttctgagcgaatttcttgatacccgcaacagggac60

ccggcagtactggatcgctttctactgcagggaccggatggcggaaggcggggagcgaaa120

ccgaacctgaaagtggcgttttttgacttttggccagaatttgaccccagcgcaaacttt180

tttgtggagattctgagcgcgcgctttcaggtgagcgtggtggaaaacgatagcgatctt240

gcgattgtgagcgtgtttggcaccggaccacgggaaatacggactgcgcggagcatgttt300

tttaccggagaaaatgtgcggccgccgcttgatggcattgatatgagcgtgagctttgat360

cgcattgatgacccacggcattttcgcctgccgctatatgtggtgcatgcgtatgatcat420

ctgcgcgagggagcagcaccgtatttttgccagccagtgctgccgccagtgccgccgact480

cgggaagatgcggcagaacggaagttttgcgcgtttctttataaaaacccaaactgcgcg540

cgccgcaacgatttttttcatatgcttggcgcgcggcgccatgtggatagcgtgggctgg600

ctgctgaacaacaccggcagcgtggtgaaaatgggatggctaccgaaaattcgggtgttt660

agccgctatcgctttgcgtttgcgtttgaaaacgctagccatccaggctatctgaccgaa720

aaaattctggatgcttttcaggcgggagcagtgccgctttattggggcgacccaggcgtg780

ctgcgcgacgtggcagcgggcagctttattgatgtgagcaggtatagcagcgatgaagaa840

gcgattgaagcgattctggcgattgatgatgactatggcgcgtatcgccgctatcgcagc900

actccgccctttcttggcactgaagactttcattttgacgcgtatcgactggcggagtgg960

attgagagccgactataa978

<210>20

<211>325

<212>prt

<213>固氮螺菌属物种

<400>20

metileaspglnargthrglyvalpheleuserglupheleuaspthr

151015

argasnargaspproalavalleuaspargpheleuleuglnglypro

202530

aspglyglyargargglyalalysproasnleulysvalalaphephe

354045

aspphetrpproglupheaspproseralaasnphephevalgluile

505560

leuseralaargpheglnvalservalvalgluasnaspseraspleu

65707580

alailevalservalpheglythrglyproarggluileargthrala

859095

argsermetphephethrglygluasnvalargproproleuaspgly

100105110

ileaspmetservalserpheaspargileaspaspproarghisphe

115120125

argleuproleutyrvalvalhisalatyrasphisleuargglugly

130135140

alaalaprotyrphecysglnprovalleuproprovalproprothr

145150155160

arggluaspalaalagluarglysphecysalapheleutyrlysasn

165170175

proasncysalaargargasnaspphephehismetleuglyalaarg

180185190

arghisvalaspservalglytrpleuleuasnasnthrglyserval

195200205

vallysmetglytrpleuprolysileargvalpheserargtyrarg

210215220

phealaphealaphegluasnalaserhisproglytyrleuthrglu

225230235240

lysileleuaspalapheglnalaglyalavalproleutyrtrpgly

245250255

aspproglyvalleuargaspvalalaalaglyserpheileaspval

260265270

serargtyrserseraspgluglualaileglualaileleualaile

275280285

aspaspasptyrglyalatyrargargtyrargserthrproprophe

290295300

leuglythrgluaspphehispheaspalatyrargleualaglutrp

305310315320

ilegluserargleu

325

<210>21

<211>978

<212>dna

<213>固氮螺菌属物种

<400>21

atgattgacaggcggacaagcgattttctggcggagttcctagcaagcgctaacaaagat60

ccggcagtacttgatcgattcctactacatggaccggaccggggaggccgcagcgcgaaa120

ccgcggctgaaaattgcgttttttgacttttggccggagtttgacccggcagcaaatttt180

tttgtggaaattctgagcgcgcgctttgatctgagcgtggtggataatgatagcgatcta240

gcgattgtgagcgtgtttggaattcgccatcgggaagctcggactgcgcgaagcctgttt300

tttaccggcgaaaatgtgcggcccccgcttgatggcgtggatatgagcgtgagctttgat360

cgcattgatgacccacggcattatcggctgccgctttatgtgatgcatgcgtgggatcat420

cggcgcgagggagcaactcggcatttttgccatagcgtgctgccgccggtgcccccgact480

cgggaagaagcagataggcggaagttttgcgcgtttctttataaaaatccaaactgcgag540

cgccgcaacgactttttccggatgctttgcgcgcgccgccatgtggaaagcgtgggatgg600

ctgctgaacaacaccggcagcgtggtgaaaatgggctggctgccgaaaattcgggtgttt660

agccgctatcgctttgcgtttgcgtttgaaaatgcgagccatccaggctatctgaccgaa720

aaaattcttgatgcgtttcaggcgggcgctgtgccgctttattggggggacccaggcgtg780

ctgcgggacgtagcggcgggcagctttattgacgtgagccgctatagcagcgatgaagaa840

gcgattgatgcgattctggcaattgatgacgactatgatacctatcgccgccatcgcagc900

actgctccatttcttggcactgaagacttttattttgacgcgtttcgactggcggagtgg960

attgagagccgactataa978

<210>22

<211>325

<212>prt

<213>固氮螺菌属物种

<400>22

metileaspargargthrserasppheleualaglupheleualaser

151015

alaasnlysaspproalavalleuaspargpheleuleuhisglypro

202530

aspargglyglyargseralalysproargleulysilealaphephe

354045

aspphetrpproglupheaspproalaalaasnphephevalgluile

505560

leuseralaargpheaspleuservalvalaspasnaspseraspleu

65707580

alailevalservalpheglyilearghisargglualaargthrala

859095

argserleuphephethrglygluasnvalargproproleuaspgly

100105110

valaspmetservalserpheaspargileaspaspproarghistyr

115120125

argleuproleutyrvalmethisalatrpasphisargargglugly

130135140

alathrarghisphecyshisservalleuproprovalproprothr

145150155160

arggluglualaaspargarglysphecysalapheleutyrlysasn

165170175

proasncysgluargargasnaspphepheargmetleucysalaarg

180185190

arghisvalgluservalglytrpleuleuasnasnthrglyserval

195200205

vallysmetglytrpleuprolysileargvalpheserargtyrarg

210215220

phealaphealaphegluasnalaserhisproglytyrleuthrglu

225230235240

lysileleuaspalapheglnalaglyalavalproleutyrtrpgly

245250255

aspproglyvalleuargaspvalalaalaglyserpheileaspval

260265270

serargtyrserseraspgluglualaileaspalaileleualaile

275280285

aspaspasptyraspthrtyrargarghisargserthralaprophe

290295300

leuglythrgluaspphetyrpheaspalapheargleualaglutrp

305310315320

ilegluserargleu

325

<210>23

<211>978

<212>dna

<213>azospirillumbrasilense

<400>23

atgcttgaccagcggacaagcgcattcctagaagagtttctggcaaaaccaggcggcgat60

ccggaacggcttgatcgctttctgctgcatggcccatatcgcggacggcgcggcggcagg120

ccacggctgaaactggcgttttatgatttttggccggaatttgatactggcaggaacttt180

tttattgaaattctgagcagccgcttcgacctgagcgtggtggaagatgatagcgacctt240

gcgattgtgagcgtgtttggcggacggcatcgcgcagcacgcagccggcgcaccctgttt300

tttaccggagaaaatgtgcgccccccgctggatggctttgatatggcagtgagctttgat360

cgcgtgggcgatccgcgccattatcgcctgccgctttatgtgatgcatgcgtatgaacat420

atgcgggaaggagcagtgccgcatttttgcagcccagtgctgccgccggtgccgccaagc480

cgggcagcgtttgcagaacgcaacttttgcgcgtttctttataaaaacccgaacggagaa540

cgccgcaaccgcttttttccggcacttgatgcacggcggcgcgtggacagcgtgggctgg600

catcttaacaacaccggcagcgtggtgaaaatgggctggctggcaaaaattcgcgtgttt660

gagcgctatcgctttgcgtttgcgtttgaaaacgcgagccatccaggctatctgactgag720

aaaattcttgatgtgtttcaggcgggagcagtgccgctttattggggggacccagacgtg780

gaacgggaagtggcagcaggcagctttattgatgtgagccgctttgcgactgatgaagaa840

gcagcagaacatattctggcactggatggagactatgatgcgtattgcgcgtatcgcgcg900

gtggcaccatttctgggaactgaagaatttcattttgatgcgtatcgccttgcggattgg960

attgaaagccggctgtag978

<210>24

<211>325

<212>prt

<213>azospirillumbrasilense

<400>24

metleuaspglnargthrseralapheleugluglupheleualalys

151015

proglyglyaspprogluargleuaspargpheleuleuhisglypro

202530

tyrargglyargargglyglyargproargleulysleualaphetyr

354045

aspphetrpproglupheaspthrglyargasnphepheilegluile

505560

leuserserargpheaspleuservalvalgluaspaspseraspleu

65707580

alailevalservalpheglyglyarghisargalaalaargserarg

859095

argthrleuphephethrglygluasnvalargproproleuaspgly

100105110

pheaspmetalavalserpheaspargvalglyaspproarghistyr

115120125

argleuproleutyrvalmethisalatyrgluhismetargglugly

130135140

alavalprohisphecysserprovalleuproprovalproproser

145150155160

argalaalaphealagluargasnphecysalapheleutyrlysasn

165170175

proasnglygluargargasnargphepheproalaleuaspalaarg

180185190

argargvalaspservalglytrphisleuasnasnthrglyserval

195200205

vallysmetglytrpleualalysileargvalphegluargtyrarg

210215220

phealaphealaphegluasnalaserhisproglytyrleuthrglu

225230235240

lysileleuaspvalpheglnalaglyalavalproleutyrtrpgly

245250255

aspproaspvalgluarggluvalalaalaglyserpheileaspval

260265270

serargphealathraspgluglualaalagluhisileleualaleu

275280285

aspglyasptyraspalatyrcysalatyrargalavalalaprophe

290295300

leuglythrglugluphehispheaspalatyrargleualaasptrp

305310315320

ilegluserargleu

325

<210>25

<211>912

<212>dna

<213>固氮螺菌属物种

<400>25

atgttagatcggtttctgcttcatgggccggagcgcgggggccgtgcggccagaccgcgc60

ctgaaaattgcgttttttgacttttggccggaatttgacccgagcgcgaatttttttgta120

gaaattctgagcagccgctttgatgtgagcgtggttgataatgatagcgatttagcgatt180

ctgagcgtgtttggcgaacgccaccgcgaagcgcgtaccgcgcgcgcgctgttttttacc240

ggcgaaaatgtgcgcccgccgttagatggcgtggatatgagcgtgagctttgatcgcatt300

gatcatccacgtcattatcgcctgccgttatacgtgatgcatgcgtgggatcaccgtcgc360

gaaggggcgaccccgcatttttgccatccggtgctgccgccggtgccgccgacgcgtgaa420

gaagcggcgaaacgtaagttttgcgcgtttttatataaaaatcctcactgcgcgcgccgc480

aacgatttttttcagatgctgtgcgcgcggcgccatgtggaaagcgtgggctggctgctg540

aataataccggcagcgtggtgaaaatgggctggctgccgaaaattcgcgtgtttgcgcgc600

tatcgctttgcgtttgcgtttgaaaacgcggcgcatccaggctatctgaccgagaaaatt660

ctggatgcgtttcaggccgggacggtaccgttatactggggcgacagcggcgtgctgcgc720

gacgttgcggccggcagctttattgatgtgagccgctatgcgagcgatgaagaagcgatt780

gaagcgattctggcgattgatgatgactatgatagctatcgccggtaccgcggcacggcg840

ccatttttaggcaccgaggacttttactttgacgcgtaccggctggccgagtggattgag900

agccgcctgtag912

<210>26

<211>303

<212>prt

<213>固氮螺菌属物种

<400>26

metleuaspargpheleuleuhisglyprogluargglyglyargala

151015

alaargproargleulysilealaphepheaspphetrpprogluphe

202530

aspproseralaasnphephevalgluileleuserserargpheasp

354045

valservalvalaspasnaspseraspleualaileleuservalphe

505560

glygluarghisargglualaargthralaargalaleuphephethr

65707580

glygluasnvalargproproleuaspglyvalaspmetservalser

859095

pheaspargileasphisproarghistyrargleuproleutyrval

100105110

methisalatrpasphisargarggluglyalathrprohisphecys

115120125

hisprovalleuproprovalproprothrarggluglualaalalys

130135140

arglysphecysalapheleutyrlysasnprohiscysalaargarg

145150155160

asnaspphepheglnmetleucysalaargarghisvalgluserval

165170175

glytrpleuleuasnasnthrglyservalvallysmetglytrpleu

180185190

prolysileargvalphealaargtyrargphealaphealapheglu

195200205

asnalaalahisproglytyrleuthrglulysileleuaspalaphe

210215220

glnalaglythrvalproleutyrtrpglyaspserglyvalleuarg

225230235240

aspvalalaalaglyserpheileaspvalserargtyralaserasp

245250255

gluglualaileglualaileleualaileaspaspasptyraspser

260265270

tyrargargtyrargglythralapropheleuglythrgluaspphe

275280285

tyrpheaspalatyrargleualaglutrpilegluserargleu

290295300

<210>27

<211>1032

<212>dna

<213>丁酸弧菌属物种(butyrivibriosp.)

<400>27

atgaatataattcacttttatgcaagatatttaagagaatcacataactggaacagagaa60

cgtgaagttactcgtaacggtgttatgacttttgctaattggtggagagaagacccgcac120

aagaactggtttgcaagatttattgacgctggaagcaaagaccctgaacgcaggattagg180

ttctatagtatttttggaccatatagtaaattaaaagaagattttgatggagctaagata240

ttcttttccggagagaatcttgagcagccggtctatcacagaatattaaagacagatcct300

atagaagatagaatatgggctgacagaaggaagctgtatggtaattatggagcaggagat360

gtggatcttgctataggatttggcaatagggaagaggattcacttatgggatttgaagga420

agcaggaagactaaatatatccgctttcctttatggcttacatatgtttttgatcctgat480

tgtactcatgatgatattaagagaaccattgatgagataaatgcagttcgttccacaggc540

aggaaggatactctgcttcttgcatcgcatgatttctgggggacaaggtcagatatctta600

aagagtctagaaggtgtatgcgatgttagtattgccggtaaatggcgcaacaacaccaaa660

gaactctgggaagattataacaatgacaagaataaatatctgtcagaatttaaatttaat720

atatgccctgaaaatgttgatgcaccgggatatgtgacagagaagatatttgatgctttt780

aaatgcggagctattcctatatatcagggctgtcttggtaagcctgagccggatgtgata840

aatacagatgcagttcttttatgggacttcgatggagataattcagatactatatccttg900

attaaaaaactaaattcggataatgtatactatgataactttgtatctcagcccaaattc960

aaaccggatgcggcagagtatgtggttgcatgtatggatgagctgaggcgaagctttgat1020

cagctcatctga1032

<210>28

<211>343

<212>prt

<213>丁酸弧菌属物种

<400>28

metasnileilehisphetyralaargtyrleuarggluserhisasn

151015

trpasnarggluarggluvalthrargasnglyvalmetthrpheala

202530

asntrptrparggluaspprohislysasntrpphealaargpheile

354045

aspalaglyserlysaspprogluargargileargphetyrserile

505560

pheglyprotyrserlysleulysgluasppheaspglyalalysile

65707580

phepheserglygluasnleugluglnprovaltyrhisargileleu

859095

lysthraspproilegluaspargiletrpalaaspargarglysleu

100105110

tyrglyasntyrglyalaglyaspvalaspleualaileglyphegly

115120125

asnargglugluaspserleumetglyphegluglyserarglysthr

130135140

lystyrileargpheproleutrpleuthrtyrvalpheaspproasp

145150155160

cysthrhisaspaspilelysargthrileaspgluileasnalaval

165170175

argserthrglyarglysaspthrleuleuleualaserhisaspphe

180185190

trpglythrargseraspileleulysserleugluglyvalcysasp

195200205

valserilealaglylystrpargasnasnthrlysgluleutrpglu

210215220

asptyrasnasnasplysasnlystyrleusergluphelyspheasn

225230235240

ilecysprogluasnvalaspalaproglytyrvalthrglulysile

245250255

pheaspalaphelyscysglyalaileproiletyrglnglycysleu

260265270

glylysprogluproaspvalileasnthraspalavalleuleutrp

275280285

asppheaspglyaspasnseraspthrileserleuilelyslysleu

290295300

asnseraspasnvaltyrtyraspasnphevalserglnprolysphe

305310315320

lysproaspalaalaglutyrvalvalalacysmetaspgluleuarg

325330335

argserpheaspglnleuile

340

<210>29

<211>1059

<212>dna

<213>卡托氏卟啉单胞菌

<400>29

atgctagccccatacaaaagccctatctttgtgcccatatacgacactaaggcaatgaat60

ccccccaccaaacaaccacttagagagaggctccacatgatgcgtaggcgcaatcgtatc120

cgaaaacgctctgtgatagctctcatcaaatctcaccttgacagctcacgctaccaggac180

tacaactggtgggacagtcacgcctcgaccttttggctgccacggttcattgacctacac240

ctcgagcccaagaagaggatcaatctcttctcttgcttccaaaatcccctaatgctcatc300

cgctactacaaaggggtgaagatcttcctatcaggtgagaaccttgccaataacgagcac360

tttggcttccatccccgcatgctcgatcataggatcaacgaggtggacttagccctaggc420

tttgagttccgcaaggatcccaagtactatcgcttccccctttggatctatcagaatgag480

ttcatcagccccagtgctagcctagaggatatacgtgcgctccttgagcagatcaacgat540

ccctccacccgtcgtagcacgggacgcagtcgcttcatcgggcagatctccagccacgac600

aaaggcggaatgcgaggacggctcattgacctcctgaatcccatcggacaaatcgactgc660

gcagggaagttccgtcacaacaccgatgagctcctcgaggtctacggggatgacaagttt720

aagtacctagctaactaccgcttcaacctctgcccagagaattcactaggcgaaggctac780

atcaccgagaaggtcttcgacagcatacgcgcaggctgtatccccatctattggggtgct840

tacctagagcctggcatccttaaccccaaggctatcctacgcttcgaggaagggaaggaa900

caagagttctataaccgagtgaaggagctgtgggagaacgaagcggcctacgagcagttt960

atcctcgagccccccttcgtagagggagcagcagagcgcatctgggaaatcctccagggg1020

cttcgtgagcgccttgcccctcttgtggaggaaggataa1059

<210>30

<211>352

<212>prt

<213>卡托氏卟啉单胞菌

<400>30

metleualaprotyrlysserproilephevalproiletyraspthr

151015

lysalametasnproprothrlysglnproleuarggluargleuhis

202530

metmetargargargasnargilearglysargservalilealaleu

354045

ilelysserhisleuaspserserargtyrglnasptyrasntrptrp

505560

aspserhisalaserthrphetrpleuproargpheileaspleuhis

65707580

leugluprolyslysargileasnleuphesercyspheglnasnpro

859095

leumetleuileargtyrtyrlysglyvallysilepheleusergly

100105110

gluasnleualaasnasngluhispheglyphehisproargmetleu

115120125

asphisargileasngluvalaspleualaleuglyphegluphearg

130135140

lysaspprolystyrtyrargpheproleutrpiletyrglnasnglu

145150155160

pheileserproseralaserleugluaspileargalaleuleuglu

165170175

glnileasnaspproserthrargargserthrglyargserargphe

180185190

ileglyglnileserserhisasplysglyglymetargglyargleu

195200205

ileaspleuleuasnproileglyglnileaspcysalaglylysphe

210215220

arghisasnthraspgluleuleugluvaltyrglyaspasplysphe

225230235240

lystyrleualaasntyrargpheasnleucysprogluasnserleu

245250255

glygluglytyrilethrglulysvalpheaspserileargalagly

260265270

cysileproiletyrtrpglyalatyrleugluproglyileleuasn

275280285

prolysalaileleuargpheglugluglylysgluglngluphetyr

290295300

asnargvallysgluleutrpgluasnglualaalatyrgluglnphe

305310315320

ileleugluproprophevalgluglyalaalagluargiletrpglu

325330335

ileleuglnglyleuarggluargleualaproleuvalgluglugly

340345350

<210>31

<211>1032

<212>dna

<213>溶纤维丁酸弧菌(butyrivibriofibrisolvens)

<400>31

atgaacataattcacttttatgcaagatatttaagagaatcacataattggaacagagaa60

cgtgaagttactcgtaatggtgttatgacttttgctaactggtggagagaagatccgcat120

aagaactggtttgcaagatttattgatgctgggaataaagaccctgagcgcaggatcaga180

ttctatagtatttttggaccttatagtaaattgaaggaagattttgatggagccaagata240

ttcttttccggagaaaatcttgaacagccggttttacacagaatactaaagacagatcct300

atagaagacaggatatgggctgacagaagaaagctgtatggtaattatggagctggagaa360

gtggatcttgctataggttttggtaatagagaagaggattcacttctgggatttgaaggg420

agcaggaagacaaaatatatccgctttcctttatggcttacatatgtctttgatcctgac480

tgtactcatgatgatattaagagaaccatagatgagataaatgcagttcgttctacaggc540

aggaaggataccctccttcttgcatcgcatgatttctgggggacaaggtcagatatctta600

aagagtcttgaaggtgtatgtgatattagtattgccggtaaatggcgcaataacaccaaa660

gagctctgggaagattatgacaatgacaagaataaatatctgtcagaatttaaatttaac720

atatgccctgaaaatgttgatgcaccgggatatgtaacagagaagatatttgatgctttt780

aaatgcggagctattcctatatatcagggctgcctaggtaagcctgagccgaatgtgata840

aatacagatgcagtacttctatgggacttcgatggagataattcagatactatagccttg900

attaaaaaactaaattcggataatgtatactatgataactttgtatctcagcctaaattc960

aaaccggatgcggcagagtatgtagttgcatgtatggatgagctaaggcgtagctttgac1020

aggctgatctga1032

<210>32

<211>343

<212>prt

<213>溶纤维丁酸弧菌

<400>32

metasnileilehisphetyralaargtyrleuarggluserhisasn

151015

trpasnarggluarggluvalthrargasnglyvalmetthrpheala

202530

asntrptrparggluaspprohislysasntrpphealaargpheile

354045

aspalaglyasnlysaspprogluargargileargphetyrserile

505560

pheglyprotyrserlysleulysgluasppheaspglyalalysile

65707580

phepheserglygluasnleugluglnprovalleuhisargileleu

859095

lysthraspproilegluaspargiletrpalaaspargarglysleu

100105110

tyrglyasntyrglyalaglygluvalaspleualaileglyphegly

115120125

asnargglugluaspserleuleuglyphegluglyserarglysthr

130135140

lystyrileargpheproleutrpleuthrtyrvalpheaspproasp

145150155160

cysthrhisaspaspilelysargthrileaspgluileasnalaval

165170175

argserthrglyarglysaspthrleuleuleualaserhisaspphe

180185190

trpglythrargseraspileleulysserleugluglyvalcysasp

195200205

ileserilealaglylystrpargasnasnthrlysgluleutrpglu

210215220

asptyraspasnasplysasnlystyrleusergluphelyspheasn

225230235240

ilecysprogluasnvalaspalaproglytyrvalthrglulysile

245250255

pheaspalaphelyscysglyalaileproiletyrglnglycysleu

260265270

glylysprogluproasnvalileasnthraspalavalleuleutrp

275280285

asppheaspglyaspasnseraspthrilealaleuilelyslysleu

290295300

asnseraspasnvaltyrtyraspasnphevalserglnprolysphe

305310315320

lysproaspalaalaglutyrvalvalalacysmetaspgluleuarg

325330335

argserpheaspargleuile

340

<210>33

<211>5

<212>prt

<213>人工序列

<220>

<223>保守的gdp-岩藻糖结合结构域

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是tyr,trp,leu,his,phe或met

<220>

<221>不确定

<222>(2)..(2)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>变体

<222>(3)..(3)

<223>xaa可以是thr,ser或cys

<220>

<221>变体

<222>(4)..(4)

<223>xaa可以是glu,gln,asp或asn

<220>

<221>变体

<222>(5)..(5)

<223>xaa可以是lys或arg

<400>33

xaaxaaxaaxaaxaa

15

<210>34

<211>6

<212>prt

<213>人工序列

<220>

<223>保守结构域

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是lys或asp

<220>

<221>变体

<222>(2)..(2)

<223>xaa可以是leu,lys或met

<220>

<221>不确定

<222>(3)..(5)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>变体

<222>(6)..(6)

<223>xaa可以是phe或tyr

<400>34

xaaxaaxaaxaaxaaxaa

15

<210>35

<211>8

<212>prt

<213>人工序列

<220>

<223>保守的基序

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是asn或his

<220>

<221>不确定

<222>(2)..(2)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>不确定

<222>(6)..(6)

<223>xaa可以是任意天然存在的氨基酸

<400>35

xaaxaaaspproalaxaaleuasp

15

<210>36

<211>6

<212>prt

<213>人工序列

<220>

<223>保守的基序

<220>

<221>变体

<222>(3)..(3)

<223>xaa可以是ala或ser

<400>36

aspmetxaavalserphe

15

<210>37

<211>5

<212>prt

<213>人工序列

<220>

<223>保守的gdp-岩藻糖结合结构域

<220>

<221>不确定

<222>(2)..(2)

<223>xaa可以是任意天然存在的氨基酸

<400>37

tyrxaathrglulys

15

<210>38

<211>6

<212>prt

<213>人工序列

<220>

<223>保守结构域

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是lys或asp

<220>

<221>不确定

<222>(3)..(3)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>变体

<222>(4)..(4)

<223>xaa可以是ile,leu或met

<220>

<221>变体

<222>(6)..(6)

<223>xaa可以是phe或tyr

<400>38

xaaleuxaaxaaglyxaa

15

<210>39

<211>6

<212>prt

<213>人工序列

<220>

<223>保守结构域

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是lys或asp

<220>

<221>变体

<222>(2)..(2)

<223>xaa可以是leu或lys

<220>

<221>不确定

<222>(3)..(3)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>变体

<222>(5)..(5)

<223>xaa可以是ser或gly

<220>

<221>变体

<222>(6)..(6)

<223>xaa可以是phe或tyr

<400>39

xaaxaaxaaleuxaaxaa

15

<210>40

<211>6

<212>prt

<213>人工序列

<220>

<223>保守结构域

<220>

<221>变体

<222>(1)..(1)

<223>xaa可以是lys或asp

<220>

<221>不确定

<222>(3)..(3)

<223>xaa可以是任意天然存在的氨基酸

<220>

<221>不确定

<222>(6)..(6)

<223>xaa可以是phe或tyr

<400>40

xaaleuxaaleuglyxaa

15

<210>41

<211>8

<212>prt

<213>人工序列

<220>

<223>保守结构域

<220>

<221>变体

<222>(2)..(2)

<223>xaa可以是ile或val

<220>

<221>变体

<222>(4)..(4)

<223>xaa可以是phe或leu

<220>

<221>usnure

<222>(5)..(5)

<223>xaa可以是任意天然存在的氨基酸

<400>41

lysxaaphexaaxaaglygluasn

15

<210>42

<211>5

<212>prt

<213>人工序列

<220>

<223>保守结构域

<400>42

argpheproleutrp

15

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1