丙氨酸2,3氨基变位酶的制作方法

文档序号:426965阅读:749来源:国知局
专利名称:丙氨酸2,3氨基变位酶的制作方法
技术领域
本公开涉及丙氨酸2,3-氨基变位酶的核酸和氨基酸序列,具有丙氨酸2,3-氨基变位酶活性的细胞,所述丙氨酸2,3-氨基变位酶能将α-丙氨酸转化为β-丙氨酸,以及使用这些细胞制备β-丙氨酸,泛酸,3-羟丙酸和其他有机化合物的方法。
背景技术
可使用诸如有机酸、酯和聚醇的有机化学试剂来合成塑料材料和其他制品。为了满足日益增长的对有机化学试剂的需要,现正在开发利用基于碳水化合物类而非烃类原材料的更有效和更划算的制备方法。例如,某些细菌已被用来大量乳生产用于聚乳酸生产中的酸。3-羟丙酸(3-HP)是一种有机酸。已记载有数种化学合成途径来制备3-HP,且其生物催化途径也已公开(Suthers等人的WO 01/16346)。3-HP具有特异性合成的用途,且可通过化工领域中的公知技术转化为具有重要商业价值的中间体,例如,通过脱水转化为丙烯酸,通过氧化转化为丙二酸,通过与醇的酯化反应转化为酯,以及通过还原转化为1,3-丙二醇。

发明内容
可从PEP或丙酮酸盐,通过关键的β-丙氨酸中间体(图1)生物催化产生化合物3-羟丙酸(3-HP)。在细胞中可通过5,6-二氢尿嘧啶和N-氨基甲酰-β-丙氨酸,N-乙酰-β-丙氨酸,鹅肌肽或天冬氨酸从肌肽,β-丙氨酰精氨酸,β-丙氨酰赖氨酸,尿嘧啶合成β-丙氨酸(图1和图2)。然而,这些途径相对而言效率较低,因为它们都需要价值高于3-HP的较为难得的前体或起始化合物。因此,如果α-丙氨酸可以被直接转化为β-丙氨酸的话(图1),那么采用生物催化途径产生3-HP的效率会更高。
本说明书中公开了具有丙氨酸2,3氨基变位酶生物学活性的新型突变的赖氨酸2,3氨基变位酶核酸和蛋白质序列。在一个实施例中,突变的赖氨酸2,3氨基变位酶包括一个或多个以下取代P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T;或K/Q/T398E,其中数字之前的字母代表在赖氨酸2,3氨基变位酶中所发现的氨基酸的单字母氨基酸编码,数字代表氨基酸位置(基于牙龈卟啉单胞菌赖氨酸2,3氨基变位酶(SEQ ID NO52的编码),参见图7),而数字之后的字母代表在丙氨酸2,3氨基变位酶中所发现的氨基酸的单字母氨基酸编码。本领域所属技术人员应该理解,根据需要突变的赖氨酸2,3氨基变位酶序列,实际上的第一个氨基酸和氨基酸数字会发生改变,而且,可以通过序列比对确定同源序列中的所述位置。例如,如图7所示,牙龈卟啉单胞菌赖氨酸2,3氨基变位酶的位置11对应于具核梭杆菌赖氨酸2,3氨基变位酶(SEQ ID NO10)的位置12,斯氏梭菌赖氨酸2,3氨基变位酶(SEQ ID NO33)的位置9,和枯草芽孢杆菌赖氨酸2,3氨基变位酶(SEQ ID NO59)的位置8。可根据图7所提供的信息和其他公众可获得的赖氨酸2,3氨基变位酶序列(示例包括,但不限于,炭疽杆菌(Bacillus anthracis)str.Sterne的GenBank Accession Nos.YP_028406;创伤弧菌(Vibrio vulnificus)YJ016的BAC95867;Moorella thermoacetica的ZP_00330962;流感嗜血杆菌(Haemophilus influenzae)的ZP_00322274;Methanosarcina barkeri str.Fusaro的ZP_00298043;Microbulbifer degradans的ZP_00314982和破伤风梭菌(Clostridium tetani)E88的NP_781545),使用本领域中的公知方法对每个剩余的位点进行类似的分析。
使用标准的分子生物学方法可对任意的赖氨酸2,3氨基变位酶进行突变产生丙氨酸2,3-氨基变位酶。例如,可对来自于诸如芽孢杆菌,梭菌,埃希氏菌,梭形杆菌,嗜血杆菌,甲烷八叠球菌,Microbulbifr,Moorella,卟啉单胞菌,嗜热厌氧菌或弧菌的原核生物的赖氨酸2,3氨基变位酶进行突变,从而包含有一种或多种以下取代,P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T或K/Q/T398E,例如至少2种,至少3种,至少4种,至少5种,至少6种,至少8种,至少9种,至少10种,至少11种,至少12种,至少13种,至少14种,至少15种,至少16种,至少17种,至少18种,至少19种,至少20种,至少21种,至少22种,至少23种,至少24种或不多于3种,不多于4种,不多于5种,不多于6种,不多于8种,不多于9种,不多于10种,不多于11种,不多于12种,不多于13种,不多于14种,不多于15种,不多于16种,不多于17种,不多于18种,不多于19种,不多于20种,不多于21种,不多于22种或不多于23种这样的突变。这些取代的特定组合包括,但不限于(1)N19Y,L/T53P/H,H/I/S85Q,D331G/H,和M/Q342T;(2)N19Y,E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H,和M/Q342T;(3)N19Y,L/K/R/T26I;E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H,和M/Q342T;(4)E/R30K,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,L228M,D331G/H,和K/Q/T398E;(5)E/R30K,K36E,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,D179N,L228M,D331G/H,和K/Q/T398E;(6)E/R30K,Q/L95M,M128V,和D331G/H;(7)P/S11T,E/R30K,Q/L95M,M128V,Q/S 141R,K/Q187R,和D331G/H;(8)E/R30K,L/V32A,L/T53P/H,E/N/D71G,Q/L95M;K/M/Q125L,M128V,和D331G/H;(9)E/R30K,C52R,Q/L95M;M128V,和D331G/H;(10)Q/L95M,M128V,和D331G/H;(11)Q/L95M,M128V;Y132H,和D331G/H;和(12)Q/L95M,M128V,和D331G/H。
丙氨酸2,3-氨基变位酶分子的特别示例包括如SEQ ID NOS18,20,42,44,46,48和50所示的核酸序列,SEQ ID NOS19,21,43,45,47,49和51所示的与其对应的氨基酸序列,以及保留了能将α-丙氨酸转变为β-丙氨酸的这些序列的变体、片段、融合体和多态形。所公开的丙氨酸2,3-氨基变位酶序列可用于转化细胞,从而使得所转化的细胞具有丙氨酸2,3-氨基变位酶活性,能使所述细胞从α-丙氨酸生成β-丙氨酸。本公开内容还包括了能够特异性结合于丙氨酸2,3-氨基变位酶的结合剂。
本发明还公开了具有丙氨酸2,3-氨基变位酶活性的细胞,所述丙氨酸2,3-氨基变位酶能将α-丙氨酸转化为β-丙氨酸。这样的细胞可以是真核或原核细胞,例如酵母细胞,植物细胞,乳杆菌属,乳球菌属,芽胞杆菌属,或埃希氏细胞。在一个实施例中,可使用能够向转化细胞传递丙氨酸2,3-氨基变位酶活性的突变赖氨酸2,3-氨基变位酶来转化细胞。在另一个实施例中,可使用SEQ ID NO18,20,42,44,46,48或50(或保留了丙氨酸2,3-氨基变位酶活性的所述序列片段,融合体或变体)来转化细胞。所公开的细胞可用来产生核酸分子,肽和有机化合物。所述肽可用来催化有机化合物的形成,或可用作抗原来构建特异性的结合剂。
本发明还公开了制备细胞,其含有至少一种外源核酸,例如编码丙氨酸2,3-氨基变位酶的核酸。在一个实施例中,所述核酸序列包括SEQ ID NO8,20,42,44,46,48或50(或保留了丙氨酸2,3-氨基变位酶活性的片段,变体或融合体)。在另一个实施例中,所述核酸序列编码了如SEQ ID NO19,21,43,45,47,49或51(或保留了丙氨酸2,3-氨基变位酶活性的片段,变体或融合蛋白质)所示的氨基酸序列。制备细胞可用来表达多肽,所述多肽具有诸如丙酮酸盐/2-酮戊二酸盐氨基转移酶、β-丙氨酸/2-酮戊二酸盐氨基转移酶和3-羟丙酸盐脱氢酶的酶活性,其能够从3-氧丙酸盐制备3-羟丙酸盐。本发明还公开了制备由上述核酸序列所编码的多肽的方法。
本发明还公开了鉴定具有丙氨酸2,3-氨基变位酶活性的细胞的方法。在一个实施例中,所述方法包括在既不含有β-丙氨酸也不含有泛酸盐的培养基中培养功能性缺失panD的细胞。例如,所述细胞可以从碳源、氧源、氢源和氮源培养基中制备α-丙氨酸,而不含有β-丙氨酸。可对能够在所述培养基中生长的细胞进行鉴定,其中细胞生长说明了该细胞能够从α-丙氨酸制备β-丙氨酸,这说明了所述细胞具有丙氨酸2,3-氨基变位酶活性。相反,未观察到细胞生长说明该细胞不能从α-丙氨酸制备β-丙氨酸,这说明了所述细胞不具有丙氨酸2,3-氨基变位酶活性。在一个实施例中,在对培养细胞进行选择之前,可以使用一种或多种突变的赖氨酸2,3-氨基变位酶转化细胞。
本发明还公开了制备具有丙氨酸2,3-氨基变位酶活性的肽的方法。在一个实施例中,该方法包括培养具有至少一种外源核酸分子的细胞,所述核酸分子编码能够从α-丙氨酸制备β-丙氨酸的丙氨酸2,3-氨基变位酶(例如SEQ ID NO8,20,42,44,46,48或50,或保留了丙氨酸2,3-氨基变位酶活性的片段,变体和融合体)。
在此还公开了使用具有丙氨酸2,3-氨基变位酶活性的公开细胞从β-丙氨酸制备3-HP的方法。在一个实施例中,可使用一种或多种从β-丙氨酸转化为3-HP必须的酶来转染所述细胞。在另一个实施例中,所述方法包括从所述细胞中纯化β-丙氨酸,然后将所述β-丙氨酸与将β-丙氨酸转化为3-HP所必须的多肽相接触。
在此所公开的所述细胞,丙氨酸2,3-氨基变位酶核酸和氨基酸序列(例如SEQ ID NO8,20,42,44,46,48或50或保留了丙氨酸2,3-氨基变位酶活性的片段,变体和融合体),及方法都可用于制备泛酸盐,3-HP及其衍生物,例如辅酶A(CoA),以及其他有机物,例如,1,3-丙二醇,丙烯酸,聚丙烯酸酯,丙烯酸酯的酯,聚合3-HP,3-HP的共聚物和其他化合物,例如丁酸酯,戊酸酯和其他化合物,3-HP的酯,及丙二酸及其酯。3-HP在生物学和商业上都是很重要的。例如,营养产业可将3-HP用于食品,饲料添加剂或防腐剂,而以上提到的所述衍生物也可从3-HP进行制备。
编码丙氨酸2,3-氨基变位酶(例如SEQ ID NO8,20,42,44,46,48或50或保留了丙氨酸2,3-氨基变位酶活性的片段,变体或融合体)的核酸分子可用于对细胞进行操作,从而使其具有制备3-HP的能力,以及制备其他有机化合物,例如上述所列的化合物的能力。丙氨酸2,3-氨基变位酶多肽(例如SEQ ID NOS19,21,43,45,47,49和51,以及保留了具有将α-丙氨酸互变为β-丙氨酸能力的这些序列的变体,片段或融合体)可用于无细胞的系统来生产3-HP和其他有机化合物,如上述所列。在此所公开的细胞可用于培养系统从而制备大量3-HP,以及其他如上所述的有机化合物。
本发明的一方面提供了这样的细胞,除了具有丙氨酸2,3-氨基变位酶活性,所述细胞还包括其他的酶活性,例如丙酮酸盐/2-酮戊二酸盐氨基转移酶活性、β-丙氨酸/2-酮戊二酸盐氨基转移酶活性和3-羟丙酸盐脱氢酶的酶活性。此外,这些细胞还可包括聚羟酸合成酶活性或脂酶或酯酶活性。
在另一个实施例中,含有丙氨酸2,3-氨基变位酶活性、丙酮酸盐/2-酮戊二酸盐氨基转移酶活性、β-丙氨酸/2-酮戊二酸盐氨基转移酶活性和3-羟丙酸盐脱氢酶活性的细胞可以制备这样的产物,例如,3-HP或3-HP的酯,例如3-羟丙酸甲基酯,3-羟丙酸乙基酯,3-羟丙酸丙基酯或3-羟丙酸丁基酯。因此,本公开还提供了一种或多种这些产物的制备方法。在一些实施例中,本方法包括在允许产生所述产物的条件下培养包括丙氨酸2,3-氨基变位酶活性、丙酮酸盐/2-酮戊二酸盐氨基转移酶活性、β-丙氨酸/2-酮戊二酸盐氨基转移酶活性和3-羟丙酸盐脱氢酶活性的细胞。这些细胞还可包括脂酶或酯酶活性。
本发明的另一方面提供了细胞,除了具有丙氨酸2,3-氨基变位酶活性之外,其具有丙酮酸盐/2-酮戊二酸盐氨基转移酶活性、β-丙氨酸/2-酮戊二酸盐氨基转移酶活性,3-羟丙酸盐脱氢酶活性,以及聚羟酸合成酶活性。这样的细胞可用来,例如,产生诸如聚合3-HP和3-HP共聚物的产物,以及其他的化合物,例如丁酸酯,戊酸酯和其他化合物。
本发明还公开了产生1,3-丙二醇的细胞及其使用方法。可使用具有酶活性的多肽从3-HP制备1,3-丙二醇。当从3-HP制备1,3-丙二醇时,可以使用具有乙醛脱氢酶活性(例如来自1.2.1.-类的酶)的多肽和具有乙醇脱氢酶活性(例如来自1.1.1.-类的酶)的多肽的组合,例如醛脱氢酶(NAD(P)+)(EC 1.2.1.-)和醇脱氢酶(EC 1.1.1.1)。
在一些实施例中,可在体外(细胞外)生成产物。在其他实施例中,可使用体外和体内(细胞内)方法的组合制备产物。在又一种实施例中,可在体内制备产物。对于涉及体内步骤的方法,所述细胞可从培养细胞或整个生物体,例如转基因植物,非人类的哺乳动物,或单细胞生物体,例如酵母和细菌(例如乳杆菌属,乳球菌属,芽孢杆菌属和埃希氏肠杆菌细胞)中分离得到。在下文中,这些细胞这称为制备细胞。由这些制备细胞制备的产物可以是有机物,例如β-丙氨酸,3-HP,泛酸盐,及其衍生物,例如有机酸,聚醇(例如1,3-丙二醇),辅酶A(CoA),以及在此所述的丙氨酸2,3-氨基变位酶。
泛酸盐是对许多动物的生长和健康具有重要作用的维生素,参与脂肪酸的合成和分解。维生素的缺乏会导致常见的临床不适。因此,可以治疗有效量对具有泛酸缺乏的患者给药使用本公开方法制备的泛酸盐。本发明公开了生成泛酸盐的细胞和使用所公开的细胞从β-丙氨酸制备泛酸盐的方法。用于制备泛酸盐和/或CoA的制备细胞可用来表达α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1),从而制备泛酸盐或另外的泛酸盐激酶(E.C.2.7.1.33),4′-磷酸羟泛酰基-1-半胱氨酸合成酶(E.C.6.3.2.5),4′-磷酸泛酰半胱氨酸脱羧酶(E.C.4.1.1.36),ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶(E.C.2.7.7.3),和脱磷酸-CoA激酶(E.C.2.7.1.24),从而制备辅酶A。


图1所示为通过β-丙氨酸中间体生成3-HP及其衍生物的途径示意图,以及从α-丙氨酸制备β-丙氨酸的途径示意图。
图2所示为公知的代谢途径,通过该途径β-丙氨酸得以产生和消耗。
图3所示为通过天冬氨酸盐脱羧酶(panD)或通过丙氨酸2,3-氨基变位酶生成辅酶A和泛酸盐的替换途径。
图4所示为对获得了丙氨酸2,3氨基变位酶活性蛋白质,来自具核梭杆菌(Fnkam;SEQ ID NO10)和两种变体序列(Fnaam,SEQ ID NO19;和Fnaam2,SEQ ID NO21)的赖氨酸2,3-氨基变位酶蛋白质序列进行的比对。在赖氨酸2,3氨基变位酶蛋白质序列中的取代用粗体标示。
图5所示为对获得了具有丙氨酸2,3氨基变位酶活性的蛋白质,来自斯氏梭菌(Cskam;SEQ ID NO33)的赖氨酸2,3-氨基变位酶蛋白质序列,来自具有E28K,L93M,M126V和D329H取代的赖氨酸2,3-氨基变位酶蛋白质序列(Cscodm;SEQ ID NO41),和三种变体序列(Cscodm mut8,SEQ ID NO43;Cscodm mut12,SEQ ID NO45;和Cscodm mut15,SEQ ID NO47)进行的比对。在赖氨酸2,3-氨基变位酶蛋白质序列中的取代用粗体标示。
图6所示为对获得了具有丙氨酸2,3氨基变位酶活性的蛋白质,来自牙龈卟啉单胞菌的赖氨酸2,3-氨基变位酶蛋白质序列(Pgkam;SEQID NO52),和三种变体序列(Pgaam SEQ ID NO6;Pgaam2,SEQ ID NO49;和Pgaam2 L26I,SEQ ID NO51)的蛋白质序列进行的比对。在赖氨酸2,3氨基变位酶蛋白质序列中的取代用粗体标示。
图7A-D所示为对来自赖氨酸2,3-氨基变位酶(来自牙龈卟啉单胞菌(Pgkam,SEQ ID NO52);具核梭杆菌(Fnkam;SEQ ID NO10);斯氏梭菌(Cskam;SEQ ID NO33)和枯草芽孢杆菌(Bskam;SEQ ID NO59))以及丙氨酸2,3-氨基变位酶(来自牙龈卟啉单胞菌(Pgaam SEQ IDNO6;Pgaam2,SEQ ID NO49;和Pgaam2 L26I,SEQ ID NO51);具核梭杆菌(Fnaam,SEQ ID NO19;和Fnaam2,SEQ ID NO21);斯氏梭菌(Cscodm mut8,SEQ ID NO43;Cscodm mut12,SEQ ID NO45;和Cscodm mut15,SEQ ID NO47)和枯草芽孢杆菌(Bsaam,SEQ ID NO2and Bsaam2co,SEQ ID NO4))以及来自具核梭杆菌(Fncodm,SEQ IDNO14)和斯氏梭菌(Cscodm,SEQ ID NO41)的中间体序列进行的比对。以粗体所示的残基是指具有丙氨酸2,3-氨基变位酶活性的赖氨酸2,3-氨基变位酶变体中的突变。
序列表后附序列表中所列示的核酸和氨基酸序列使用的都是针对核苷酸碱基的标准单字母缩写,和针对氨基酸的三字母编码。每种核酸序列都仅表示出一条链,但可根据所示出链的任意参考得出所述互补链。
SEQ ID NO1是来自枯草芽孢杆菌的丙氨酸2,3氨基变位酶核酸序列。
SEQ ID NO2是由SEQ ID NO1编码的蛋白质序列。
SEQ ID NO3是来自枯草芽孢杆菌的丙氨酸2,3氨基变位酶核酸序列。
SEQ ID NO4是由SEQ ID NO3编码的蛋白质序列。
SEQ ID NO5是来自牙龈卟啉单胞菌的丙氨酸2,3氨基变位酶核酸序列。
SEQ ID NO6是由SEQ ID NO5编码的蛋白质序列。
SEQ ID NOS7和8是用于克隆具核梭杆菌赖氨酸2,3-氨基变位酶的核酸PCR引物。
SEQ ID NO9是来自具核梭杆菌的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO10是由SEQ ID NO9编码的蛋白质序列。
SEQ ID NO11是来自具核梭杆菌的部分密码子优化的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO12是由SEQ ID NO11编码的蛋白质序列。
SEQ ID NO13是来自具核梭杆菌的突变的部分密码子优化的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO14是由SEQ ID NO13编码的蛋白质序列。
SEQ ID NOS15-17是用于对来自具核梭杆菌的赖氨酸2,3-氨基变位酶核酸序列进行突变的核酸引物。
SEQ ID NO18是来自具核梭杆菌的丙氨酸2,3氨基变位酶核酸序列。
SEQ ID NO19是由SEQ ID NO18编码的蛋白质序列。
SEQ ID NO20是来自具核梭杆菌的丙氨酸2,3氨基变位酶核酸序列。
SEQ ID NO21是由SEQ ID NO20编码的蛋白质序列。
SEQ ID NOS22-27是用于克隆来自斯氏梭菌的赖氨酸2,3-氨基变位酶核酸序列的核酸PCR引物。
SEQ ID NOS28-31是用于基因组步移从斯氏梭菌克隆赖氨酸2,3-氨基变位酶核酸序列的核酸引物。
SEQ ID NO32是来自斯氏梭菌的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO33是由SEQ ID NO32编码的蛋白质序列。
SEQ ID NO34是来自斯氏梭菌的部分密码子优化的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO35是由SEQ ID NO34编码的蛋白质序列。
SEQ ID NOS36-39是用来对来自斯氏梭菌的的部分密码子优化的赖氨酸2,3-氨基变位酶核酸序列进行突变的核酸引物。
SEQ ID NO40是来自斯氏梭菌的突变的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO41是由SEQ ID NO40编码的蛋白质序列。
SEQ ID NO42是来自斯氏梭菌的丙氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO43是由SEQ ID NO42编码的蛋白质序列。
SEQ ID NO44是来自斯氏梭菌的丙氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO45是由SEQ ID NO44编码的蛋白质序列。
SEQ ID NO46是来自斯氏梭菌的丙氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO47是由SEQ ID NO46编码的蛋白质序列。
SEQ ID NO48是来自牙龈卟啉单胞菌的丙氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO49是由SEQ ID NO48编码的蛋白质序列。
SEQ ID NO50是来自牙龈卟啉单胞菌的丙氨酸2,3-氨基变位酶核酸序列。
SEQ ID NO51是由SEQ ID NO50编码的蛋白质序列。
SEQ ID NO52是来自牙龈卟啉单胞菌的赖氨酸2,3-氨基变位酶核酸序列。
SEQ ID NOS53和54是用于扩增pKD3的CAT基因的PCR引物。
SEQ ID NOS55和56是用于确认所述CAT基因正确插入panD座的PCR引物。
SEQ ID NOS57和58是用于扩增pKD3的CAT基因的引物的核酸序列。
SEQ ID NO59是来自枯草芽孢杆菌的赖氨酸2,3-氨基变位酶蛋白质序列。
若干实施方案的详细描述以下对术语和方法的解释旨在对本公开进行更详细地描述,同时指导那些本领域所属技术人员实施本发明。除非文中特别指出,否则单数形式“a”,“an”和“the”是指一个或多于一个的情况。例如,术语“含有核酸分子”包括了单种或多种核酸分子,并相当于短语“包括至少一种核酸分子”。除非文中特别指出,否则术语“或”是指规定可选元素中的单种元素或两种或更多种元素的组合。在本文中,“包含”是指“包括”。因此,“包含A或B”是指“包括A,B或A和B”,且未将其他元素排除在外。
除非另有解释,否则在此使用的所有技术和科学术语都与本发明归属领域技术人员通常理解的意思相同。尽管可采用与在此描述相类似的方法和材料来实施或检测本发明,但下文描述了适合的方法和材料。所述材料,方法和实施例仅仅是说明性而非限制性的。根据以下的详细描述和权利要求,本发明的其他特征和优点是显而易见的。
丙氨酸2,3-氨基变位酶例如在细胞中,能够将α-丙氨酸转化为β-丙氨酸,或反之的酶。其包括了来自诸如原核生物的任意生物体的任意丙氨酸2,3-氨基变位酶基因,cDNA,RNA或蛋白质。在一个实施例中,丙氨酸2,3-氨基变位酶是具有丙氨酸2,3-氨基变位酶活性的突变的赖氨酸2,3-氨基变位酶。可从任意生物体,例如原核生物,例如枯草芽孢杆菌(Bacillus subtilis),牙龈卟啉单胞菌(Porphyromonas gingivalis),具核梭杆菌(Fusobacterium nucleatum),斯氏梭菌(Clostridium sticklandii)或大肠杆菌(Escherichia coli)使用本领域公知的任意方法获得赖氨酸2,3-氨基变位酶(或在遗传数据库中被标注为赖氨酸2,3氨基变位酶的基因)并对其进行突变。
在特定的实施例中,丙氨酸2,3-氨基变位酶核酸序列包括如SEQID NO1,3,5,18,20,42,44,46,48或50所示的序列,以及保留了编码具有丙氨酸2,3-氨基变位酶活性的肽或蛋白质的能力的片段,变体或融合体所示的序列。在其他实施例中,丙氨酸2,3-氨基变位酶蛋白质包括SEQ ID NO2,4,6,19,21,43,45,47,49或51所示的氨基酸序列,以及保留了丙氨酸2,3-氨基变位酶活性的序列片段,变体或融合体所示的氨基酸序列。
在其他实施例中,丙氨酸2,3-氨基变位酶序列包括全长的野生型序列,例如SEQ ID NO2,4,6,19,21,43,45,47,49或51,以及保留了将α-丙氨酸转化为β-丙氨酸能力的短序列,例如至少9个连续的氨基酸(例如,SEQ ID NO2,4,6,19,21,43,45,47,49或51的至少10个,至少11个,至少12个,至少13个,至少14个,至少15个,至少20个,至少25个,至少30个,至少35个,至少40个,至少45个,至少50个,至少55个,至少60个,至少70个,至少80个,至少90个,至少100个,至少150个,至少200个,至少250个,至少300个,至少350个,至少400个,至少410个或至少450个连续的氨基酸。丙氨酸2,3-氨基变位酶序列的特定片段包括,但不限于SEQ ID NO2或4的氨基酸50-390,SEQ ID NO2或4的氨基酸101-339,SEQ ID NO2或4的氨基酸15-390,和SEQ ID NO2或4的氨基酸15-340(SEQ ID NOS6,19,21,43,45,47,49和51(例如SEQ ID NO6,49或51的氨基酸42-342)中的对应片段也包括在本发明的范围之内,并可使用图7来进行确定)。只要所得多肽具有丙氨酸2,3-氨基变位酶活性,这些片段(或全长多肽)就可融合于其他多肽序列。本说明书包括了丙氨酸2,3-氨基变位酶等位基因变体,以及保留了将α-丙氨酸转化为β-丙氨酸能力的任意变体,片段或融合序列。
丙氨酸2,3-氨基变位酶活性丙氨酸2,3-氨基变位酶的将α-丙氨酸转化为β-丙氨酸或反之的能力。在一个实施例中,这样的活性存在于细胞中。在另一个实施例中,这样的活性存在于体外。可以使用任意公职的分析方法,例如以下实施例中所述的筛选分析和酶分析方法来测定这样的活性。此外,可通过将所述酶与α-丙氨酸或β-丙氨酸孵育来鉴定丙氨酸2,3-氨基变位酶的活性,并且通过高效液相色谱(例如,Abe等人J.Chromatography B,71243-9,1998所述的方法)来确定所述反应产物。在一个实施例中,在功能性缺失了panD基因的大肠杆菌突变体中是将α-丙氨酸转化为β-丙氨酸的能力。
在一个实施例中,突变赖氨酸2,3氨基变位酶具有如SEQ ID NO51所示肽序列的丙氨酸2,3氨基变位酶活性的至少10%,至少20%,至少50%,至少60%,至少70%,至少80%,至少90%或甚至至少100%。
抗体包括能够特异性结合于抗原(与抗原进行免疫反应)的抗原结合位点的分子。其示例包括多克隆抗体,单克隆抗体,人源化单克隆抗体,或其免疫有效部分。
本发明还包括了免疫球蛋白质分子及其免疫活性部分。天然发生的抗体(例如IgG)包括四条多肽链,由二硫键交联的两条重链(H)和两条轻链(L)。然而,也可通过自然发生抗体的部分来实施抗体的抗原结合功能。单克隆抗体的免疫有效部分包括,但不限于Fab,Fab′,F(ab′)2,Fabc和Fv部分(其综述可参见Better和Horowitz,Methods.Enzymol.1989,178476-96)。抗原结合片段的其他示例包括,但不限于(i)由VL,VH,CL和CH1结构域组成的Fab片段;(ii)由VH和CH1结构域组成的Fd片段;(iii)由抗体单臂的VL和VH结构域组成的Fv片段;(iv)由VH结构域组成的dAb片段;(v)分离的互补决定区(CDR);和(vi)F(ab′)2片段,含有在铰链区由二硫键桥接的两个Fab片段的二价片段。此外,尽管所述Fv片段的两个结构域是由不同的基因编码的,但可通过重组方法使用合成连接物将其制备成单条蛋白质链(也称为单链Fv(scFv))。本发明也包括了这样的单链抗体。
“特异性结合”是指特异性制剂(“特异结合剂”)与特定被分析物特异性反应,例如,与抗体特异性免疫反应,或与特定的肽序列特异性结合的能力。所述结合是非随机的结合反应,例如在抗体分子和抗原决定簇之间的反应。抗体的结合特异性通常是根据该抗体区别结合特异性抗原和不相关抗原能力的参考点确定的,并因此能够在两种不同的抗原之间进行区别,特别是当这两种抗原具有独特的表位时。特异性结合于特定表位的抗体称为“特异性抗体”。
本发明还包括了可制备成丙氨酸2,3-氨基变位酶多肽(例如SEQID NO19,21,43,45,47,49或51),丙氨酸2,3-氨基变位酶多肽片段(可由图7确定的片段,例如SEQ ID NO2或4的氨基酸50-390,例如SEQ ID NO2或4的氨基酸101-339或SEQ ID NO2或4的氨基酸15-390,例如SEQ ID NO2或4的氨基酸15-331;或SEQ ID NOS6,19,21,43,45,47,49,和51(例如SEQ ID NO6,49或51的氨基酸42-342)的对应片段)或所述序列的变体或融合体的单克隆或多克隆抗体。任意的,对多肽抗原上的一个或多个表位产生反应的抗体可以特异性检测所述多肽。换言之,针对一个特定多肽的抗体可以识别并结合于所述特定的多肽,并几乎不会识别或结合于其他多肽。可以通过任意的标准免疫分析方法确定特异性结合于特定多肽的抗体;例如,Western印迹(例如,参见Sambrook等人(ed.),Molecular CloningA Laboratory Manual,2nd ed.,vol.1-3,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1989)。
为了通过Western印迹能确定抗体制剂(例如,在小鼠中产生的针对丙氨酸2,3-氨基变位酶多肽的制剂,例如SEQ ID NO19,21,43,45,47,49或51)特异性地检测到适当的多肽(例如丙氨酸2,3-氨基变位酶),可从细胞中提取总细胞蛋白质并通过SDS-聚丙烯酰胺凝胶电泳进行分离。可将所分离的总细胞蛋白质随后转移至膜上(例如硝酸纤维素),然后将所述抗体制剂与所述膜共同孵育。在对膜进行洗涤去除非特异性结合的抗体之后,可使用轭合于诸如碱性磷酸酶的酶的适当第二抗体(例如,抗小鼠抗体)来测定特异性结合的抗体的存在,因为5-溴-4-氯-3-吲哚磷酸/硝基蓝四唑的应用可导致由免疫固定碱性磷酸酶产生的深蓝色化合物。
可以从转染细胞,转化细胞或野生型细胞中获得适于用作免疫原的基本上纯的多肽。可对最终制剂中的多肽浓度进行调节,例如,通过Amicon过滤装置对浓度进行调节,达到每微升几微克的水平。此外,从全长多肽直至少至9个氨基酸残基多肽的多肽都可用作免疫原。这样的多肽可从细胞培养物中制备,也可以使用标准方法化学合成,或可通过将大的多肽剪切成可纯化的较小多肽来进行制备。在存在有主要组织相容性复合物(MHC)分子,例如MHC I类或MHC II类分子的条件下,当长度低至9个氨基酸残基的多肽向免疫系统进行呈递时,所述多肽是具有免疫原性的。因此,具有至少9,10,11,12,13,14,15,20,25,30,35,40,45,50,55,60,70,80,90,100,150,200,250,300,350,400,410,450,500或更多个丙氨酸2,3-氨基变位酶多肽的连续氨基酸残基的肽可用作制备抗体的免疫原。
根据Kohler & Milstein(Nature 256495,1975)的经典方法或其衍生方法,可从鼠杂交瘤中制备出针对于任意在此所公开多肽的单克隆抗体。
可通过用所述多肽(或其片段,融合物或变体)免疫适当的动物制备出在此公开的含有针对于任意多肽的异源表位的抗体的多克隆抗血清,可以对其不进行修饰或进行修饰以提高免疫原性。适用于兔子的有效免疫方案可参见Vaitukaitis等人(J.Clin.Endocrinol.Metab.33988-91,1971).
抗体片段可用来替代整个抗体,并可在原核宿主细胞中较容易地表达。制备和使用单克隆抗体免疫有效部分,也称为“抗体片段”的方法是本领域公知的,并可见于Better & Horowitz(Methods Enzymol.178476-96,1989),Glockshuber等人(Biochemistry 291362-7,1990),美国专利第5,648,237号(″Expression of Functional AntibodyFragments″),美国专利第4,946,778号(″Single Polypeptide Chain BindingMolecules″),美国专利第5,455,030号(″Immunotherapy Using SingleChain多肽Binding Molecules″),在此将其引为参考。
抗原能够在动物体内刺激抗体产生或T-细胞应答的化合物,组合物或物质,包括向动物给药,例如,注射或吸收的组合物。抗原与特异性的体液或细胞免疫性产物,包括通过异源免疫原诱导的产物发生反应。术语“抗原”包括所有相关的抗原表位。
cDNA(互补DNA)缺乏内部、非编码片段(内含子)和决定转录的调节序列的DNA片段。可通过逆转录从细胞中提取的信使RNA在实验室中合成cDNA。
保守性取代对具有类似生化性质的氨基酸残基进行一个或多个氨基酸的取代(例如,1,2,5或10个残基)。通常,保守性取代对所得多肽的活性只有很小的影响甚至没有影响。例如,保守性取代可以是在丙氨酸2,3-氨基变位酶多肽中,基本上并未影响将α-丙氨酸转化为β-丙氨酸能力的氨基酸取代。
在特定的实施例中,保守性取代可以是在丙氨酸2,3-氨基变位酶多肽中的氨基酸取代,例如,并未明显改变所述蛋白质将α-丙氨酸转化为β-丙氨酸能力的、在SEQ ID NO19,21,43,45,47,49或51中的保守性取代。在以下实施例中公开了可用于测定丙氨酸2,3-氨基变位酶活性的方法。丙氨酸扫描可用来鉴定在丙氨酸2,3-氨基变位酶中的哪一个氨基酸残基能够耐受氨基酸取代。在一个实施例中,当丙氨酸,保守或氨基酸(例如那些以下所示),或非保守性氨基酸,被一种或多种天然氨基酸取代时,丙氨酸2,3-氨基变位酶活性的降低未超过25%,例如未超过20%,例如未超过10%。
在一个实施例中,所述肽中包括一个保守性取代,例如在SEQ IDNOS2,4,6,19,21,43,45,47,49或51中的任一保守性取代。在另一个实施例中,所述多肽中可包括10个或更少的保守性取代,例如5个或更少。可使用,例如,诸如位点定向的突变或PCR的标准方法,通过对编码所述多肽的核苷酸序列进行操作,制备出含有一个或多个保守性取代的多肽。或者,可使用标准的多肽合成方法制备出含有一个或多个保守性取代的多肽。
取代变体是那些在其氨基酸序列中至少有一个氨基酸残基被去除或在其位置上插入了不同残基的序列。可用于在蛋白质的原始氨基酸中进行取代的氨基酸例子以及被认为是保守性取代的实例包括Ser取代Ala;Lys取代Arg;Gln或His取代Asn;Glu取代Asp;Ser取代Cys;Asn取代Gln;Asp取代Glu;Pro取代Gly;Asn或Gln取代His;Leu或Val取代Ilee;Ile或Val取代Leu;Arg或Gln取代Lys;Leu或Ile取代Met;Met,Leu或Tyr取代Phe;Thr取代Ser;Ser取代Thr;Tyr取代Trp;Trp或Phe取代Tyr;以及Ile或Leu取代Val。
关于保守性取代的进一步信息可以在其他地方找到,如Ben-Bassat等人,(J.Bacteriol.169751-7,1987),O′Regan等人,(Gene 77237-51,1989),Sahin-Toth等人,(Protein Sci 3240-7,1994),Hochuli等人,(Bio/Technology 61321-5,1988),WO 00/67796(Curd等人)以及遗传学和分子生物学的标准教材中。
缺失核酸序列,例如DNA,在每侧相连时所述区域的去除。
可检测的能够确证存在或出现。例如,如果从β-丙氨酸产生的信号强至足够被检测时,从α-丙氨酸制备β-丙氨酸就是可检测的。
DNA脱氧核糖核酸。DNA是长链聚合物,其包含了大多数活生物体(一些病毒具有含有核糖核酸RNA的基因)的遗传物质。在DNA聚合物中的重复单位是四种不同的核苷酸,每一种核苷酸都含有结合于脱氧核糖的四种碱基之一,即腺嘌呤,鸟嘌呤,胞嘧啶和胸腺嘧啶,其上还连接有磷酸基团。在DNA分子中的核苷酸三联体,称为密码子,编码多肽中的氨基酸。术语密码子也可用于从DNA序列转录为mRNA序列中的对应(互补)的三个核苷酸序列。
外源的参照核酸分子和特定的细胞,本说明书中的术语“外源的”是指未从特定所述天然发现细胞产生的任意核酸分子。因此,一旦被引入到细胞内,就认为非自然发生的核酸分子对于所述细胞外源性的。天然发生的核酸分子也可能对特定的细胞是外源性的。例如,对个体Y的细胞而言,一旦将从个体X的细胞分离到的全部染色体导入Y的细胞,那么个体X的染色体就是外源的。
功能性缺失对基因序列进行的突变、部分或完全缺失,插入,或其他变异,其能够减少或抑制所述基因产物的产生,或使得所述基因产物不具有功能。例如,在大肠杆菌中的功能性panD缺失阻止了通过由panD基因编码的天冬氨酸脱羧酶从天冬氨酸盐制备β-丙氨酸。大肠杆菌中的panD功能性缺失灭活了天冬氨酸盐脱羧酶,其导致了在生长培养基中缺乏β-丙氨酸或泛酸时,大肠杆菌的生长受到抑制。
功能性等价物具有相同的功能。在涉及丙氨酸2,3-氨基变位酶的内容中,功能性等价分子包括保留了丙氨酸2,3-氨基变位酶功能的不同分子。例如,可通过丙氨酸2,3-氨基变位酶的序列改变提供功能性等价物,其中具有一处或多处序列改变的所述多肽保留了未改变多肽的功能,从而保留了将α-丙氨酸转化为β-丙氨酸的能力。
序列改变的例子包括,但不限于,取代(保守性和非保守性),缺失,突变,移码,和插入。在一个实施例中,给定一个多肽结合于抗体,则结合于相同抗体的多肽就是功能性等价物。因此,功能性等价物包括与多肽具有相同结合特异性的肽,且其可用作替换所述多肽的制剂(例如在泛酸和3-HP制备中)。在一个实施例中,功能性等价物包括这样的多肽,其中所述结合序列是不连续的,其中所述抗体结合于线性表位。因此,如果所述肽序列为MNTVNTRKKF(SEQ ID NO19的氨基酸1-10),则包括不连续表位的功能性等价物可表示如下(**=任意数量的插入氨基酸)NH2-**-M**N**T**V**N**T**R**K**K**F-COOH。在这个实施例中,如果所述多肽的三维结构是能够结合于SEQ ID NO19的氨基酸1-10的单克隆抗体的三维结构,那么所述多肽就是SEQ ID NO19的氨基酸1-10的功能性等价物。
杂交互补的单链DNA或RNA能够形成双链分子的能力。在一些实施例中,杂交可用来确定两个或更多核酸序列之间的互补。核酸杂交技术可用来在本发明的范围之内获得分离的核酸。简言之,任意与丙氨酸2,3-氨基变位酶(例如与SEQ ID NO1,3,5,18,20,42,44,46,48或50或其变体或片段)具有同源性的核酸分子可用作探针,在适当至较高严谨的条件下,通过杂交来鉴定类似的核酸分子。一旦完成鉴定,可随后将所述核酸纯化,测序,并进行分析从而确定其是否是具有丙氨酸2,3-氨基变位酶活性的丙氨酸2,3-氨基变位酶。
可分别通过Southern或Northern分析进行杂交来鉴定杂交于探针的DNA或RNA序列。所述探针可以用例如,生物素,荧光团,地高辛,酶,或诸如32P的放射性同位素标记的。可将待分析的DNA或RNA在琼脂糖或丙烯酰胺凝胶电泳上分离,转移至硝酸纤维素、尼龙或其他适当的膜上,并使用标准技术与探针进行杂交,所述标准技术在本领域是公知的,例如在Sambrook等人,(1989)Molecular Cloning,secondedition,Cold Spring Harbor Laboratory,Plainview,NY中的7.39-7.52部分所述。通常,探针的长度为至少约20个核苷酸。例如,包括丙氨酸2,3-氨基变位酶(例如SEQ ID NO1,3,5,18,20,42,44,46,48或50的20个连读核苷酸)的20个连续核苷酸的探针可用来鉴定同一或类似的核酸。此外,还可以使用大于或小于20个核苷酸长的探针。
本说明书还提供了长度为至少约12个核苷酸(例如长度为至少约13,14,15,16,17,18,19,20,25,30,40,50,60,100,250,500,750,1000,1400,2000,3000,4000或5000个核苷酸),并且能够在杂交条件下,与丙氨酸2,3-氨基变位酶核酸序列(例如SEQ IDNO1,3,5,18,20,42,44,46,48或50)的有义链或反义链杂交的分离的核酸序列。所述杂交条件可以使温和或较高的严谨杂交条件。
温和的严谨杂交条件是在约42℃,在含有25mM KPO4(pH 7.4),5X SSC,5X Denhart′s溶液,50μg/mL变性超声波降解的鲑精DNA,50%甲酰胺,10%硫酸葡聚糖,和1-15ng/mL探针(约5×107cpm/μg)的杂交液中进行杂交,而使用含有0.2X SSC和0.1%十二烷基磺酸钠的洗涤液在约50℃进行洗涤。
较高的严谨杂交条件是在约42℃,在含有25mM KPO4(pH 7.4),5X SSC,5X Denhart′s溶液,50μg/mL变性超声波降解的鲑精DNA,50%甲酰胺,10%硫酸葡聚糖,和1-15ng/mL探针(约5×107cpm/μg)的杂交液中进行杂交,而使用含有0.2X SSC和0.1%十二烷基磺酸钠的洗涤液在约65℃进行洗涤。
分离的可将“分离的”生物成分(例如核酸分子或蛋白质)与该成分自然存在的生物体细胞的其他生物成分(例如其他染色体和染色体外DNA或RNA,和蛋白质)基本上分离和纯化出来。“分离”的核酸分子和蛋白质包括通过标准纯化方法纯化得到的核酸分子和蛋白质。该术语还包括了通过在宿主细胞中重组表达制备的核酸分子和蛋白质,以及化学合成的核酸,蛋白质和多肽。
在一个实施例中,分离的序列是指未与两条序列直接毗邻的自然发生的核酸分子,其是从所来源的生物体自然发生的基因组中直接毗邻(一个在5’端且一个在3’端)的序列。例如,分离的核酸分子可以是,但不限于,任意长度的重组DNA分子,条件是天然发生基因组中直接侧翼于所述重组DNA分子的正常存在的核酸序列之一被去除或缺失。因此,分离的核酸分子包括,但不限于,以独立于其他序列存在的单独的分子(例如,由PCR或限制性内切酶处理产生的cDNA或基因组DNA片段),以及整合入载体、自我复制质粒,病毒(例如逆转录病毒,腺病毒或疱疹病毒),或整合入原核或真核生物基因组DNA的重组DNA。此外,分离的核酸还可包括作为部分杂交或融合核酸序列的重组DNA分子。
在一个实施例中,参照核酸分子,术语“分离的”还包括任意的非天然存在的核酸序列,因为非天然存在的核酸序列在自然界中未找到,且其在天然发生的基因组中不含有直接连续的序列。例如,非天然发生的核酸分子,例如工程化的核酸分子被认为是分离的核酸。可以使用常见的分子克隆或化学核酸合成技术制备工程化的核酸分子。分离的非天然发生的核酸分子可以独立于其他序列,或整合入载体,自我复制的质粒,病毒(例如逆转录病毒,腺病毒或疱疹病毒),或原核或真核生物的基因组DNA。此外,非天然发生的核酸分子还可包括作为部分杂交或融合核酸序列的核酸分子。
赖氨酸2,3-氨基变位酶能够将α-丙氨酸转化为β-丙氨酸的酶。其包括来自任意生物体物的任意赖氨酸2,3-氨基变位酶基因,cDNA,RNA或蛋白质,例如,来自枯草芽孢杆菌(Bacillus subtilis),近端梭菌(Clostridium subterminale),牙龈卟啉单胞菌(Porphyromonas gingivalis),具核梭杆菌(Fusobacterium nucleatum),斯氏梭菌(Clostridium sticklandii)或大肠杆菌(Escherichia coli)。本说明书包括赖氨酸2,3-氨基变位酶等位变体,以及保留了将α-丙氨酸转化为β-丙氨酸活性的任意变体,片段或融合序列。在一个实施例中,其包括由公共序列数据库,如GenBank和EMBL中如赖氨酸2,3-氨基变位酶注释的基因所编码的肽。赖氨酸2,3-氨基变位酶蛋白质的特定示例(及对应的核酸序列)包括以下可公开获得的序列炭疽杆菌(Bacillus anthracis)str.Sterne的GenBankAccession Nos.YP_028406;创伤弧菌(Vibrio vulnificus)YJ016的BAC95867;Moorella thermoacetica的ZP_00330962;流感嗜血杆菌(Haemophilus influenzae)的ZP_00322274;Methanosarcina barkeri str.Fusaro的ZP_00298043;Microbulbifer degradans的ZP_00314982和破伤风梭菌(Clostridium tetani)E88的NP_781545。
突变的赖氨酸2,3-氨基变位酶含有一个或多个导致多肽具有赖氨酸2,3-氨基变位酶活性的氨基酸取代的赖氨酸2,3-氨基变位酶分子。这些突变的示例包括,但不限于,以下的一种或多种P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T;或K/Q/T398E,例如至少2种,至少3种,至少4种,至少5种,至少6种,至少8种,至少9种,至少10种,至少11种,至少12种,至少13种,至少14种,至少15种,至少16种,至少17种,至少18种,至少19种,至少20种,至少21种,至少22种,至少23种,至少24或不超过3种,不超过4种,不超过5种,不超过6种,不超过8种,不超过9种,不超过10种,不超过11种,不超过12种,不超过13种,不超过14种,不超过15种,不超过16种,不超过17种,不超过18种,不超过19种,不超过20种,不超过21种,不超过22种或不超过23种这样的取代。这些取代的特定组合包括,但不限于;((1)N19Y,L/T53P/H,H/I/S85Q,D331G/H和M/Q342T;(2)N19Y,E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H和M/Q342T;(3)N19Y,L/K/R/T26I;E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H和M/Q342T;(4)E/R30K,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,L228M,D331G/H和K/Q/T398E;(5)E/R30K,K36E,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,D179N,L228M,D331G/H和K/Q/T398E;(6)E/R30K,Q/L95M,M128V和D331G/H;(7)P/S11T,E/R30K,Q/L95M,M128V,Q/S141R,K/Q187R和D331G/H;(8)E/R30K,L/V32A,L/T53P/H,E/N/D71G,Q/L95M;K/M/Q125L,M128V和D331G/H;(9)E/R30K,C52R,Q/L95M;M128V和D331G/H;(10)Q/L95M,M128V和D331G/H;(11)Q/L95M,M128V;Y132H和D331G/H;和(12)Q/L95M,M128V和D331G/H。
核酸涵盖了RNA和DNA,其包括,但不限于,cDNA,基因组DNA,和合成(例如化学合成的)DNA。核酸可以是双链或单链的。为单链时,该核酸可以是有义链或反义链。此外,核酸可以是环状或线性的。
寡核苷酸至少9个核苷酸的线性多核苷酸(例如DNA或RNA)序列,例如至少12个,至少15个,至少18个,至少20个,至少24个,至少25个,至少27个,至少30个,至少50个,至少100个或至少200个核苷酸长。在特定的实施例中,寡核苷酸包括SEQ ID NO1,3,5,18,20,42,44,46,48或50(或其互补链)的至少9个连续核苷酸,例如SEQ ID NO1,3,5,18,20,42,44,46,48或50(或其互补链)的至少12个,至少15个,至少18个,至少20个,至少24个,至少25个,至少27个,至少30个,至少50个,至少100个或至少200个核苷酸长。
可操作性连接的当第一核酸序列与第二核酸序列放置成具有功能关系时,第一核酸序列可以可操作性连接于第二核酸序列。例如,如果启动子会影响编码序列的转录或表达,那么可将该启动子可操作性地连接于该编码序列。一般而言,可操作连接的DNA序列是连续的,并且在有必要连接两个蛋白质编码区域时,需要具有相同的读框。
ORF(开放阅读框)没有终止密码子的一系列编码氨基酸的核苷酸三联体(密码子)。这些序列通常可被翻译成肽。
泛酸盐或泛酸应用于化妆品、医药和食品中的重要商业维生素。在本说明书中,术语泛酸和泛酸盐可以交替使用,不仅可指游离酸,还可指D-泛酸的盐,例如钙盐,钠盐,铵盐或钾盐。可通过化学合成或生物技术使用本发明的细胞和方法从β-丙氨酸制备泛酸盐。
测定泛酸盐量的方法是公知的(例如,参见Rieping等人的美国专利第6,184,006号,和Eggeling等人的美国专利第6,177,264号)。例如,可使用植物乳杆菌(Lactobacillus plantarum)泛酸盐分析(检测菌株Lactobacillus plantarum ATCC 8014,Cat.No.3211-30-3;培养基Bacto泛酸分析培养基(DIFCO Laboratories,Michigan,USA),cat.No.0604-15-3)对D-泛酸盐进行定量测定。这一指示菌株仅可在指示培养基中存在泛酸盐的条件下生长,并在所述培养基中显示出可光度测量的线性生长趋势对泛酸浓度的影响。泛酸的半钙盐(Sigma Catalog Number P2250)用作校准。在580nm波长测定光密度。
多肽修饰本公开包括丙氨酸2,3-氨基变位酶多肽,以及合成的实施方案。此外,可使用本发明所述方法利用具有丙氨酸2,3-氨基变位酶活性的类似物(非肽有机分子),衍生物(从公开的肽序列开始获得的化学官能化的肽分子)和变体(同源体)。在此公开的肽包括能够自然发生或其他方式产生的,或者是L-或者是D-氨基酸的氨基酸序列。
可通过多种化学方法对多肽进行修饰,从而制备与未修饰多肽具有本质相同活性的衍生物,并可任选具有其他需要的性质。例如,所述蛋白质的羧基基团,无论在羧基端或侧链上,都可以药物可接受阳离子盐的形式提供,或酯化形成C1-C16的酯,或转化成通式为NR1R2的酰胺,其中R1和R2独立地为H或C1-C16烷基,或组合形成杂环,例如5-或6-元环。所述肽的氨基,无论在氨基端或侧链上,都可以是诸如HCl,HBr,乙酸,苯甲酸,甲苯磺酸,马来酸,酒石酸和其他有机酸的药物可接受加成盐形式,或可被修饰成C1-C16烷基或二烷基氨基或进一步转变为酰胺。
使用公知的技术,可将肽侧链的羟基基团转化为C1-C16烷氧基或C1-C16酯。可使用一种或多种卤素原子,例如,F,Cl,Br或I,或C1-C16烷基,C1-C16烷氧基,羧酸及其酯,或这些羧酸的酰胺来取代肽侧链中的苯基或酚环。肽侧链中的亚甲基可延伸成同源的C2-C4亚烃基。可使用任意一种公知的保护基团,例如乙酰胺基团保护巯基。本领域所属技术人员应该意识到,向本公开的多肽中引入环结构的方法可以对得到增强稳定性的结构进行选择并提供该结构的构象限制。例如,可将所述多肽加上C-或N-末端的半胱氨酸,从而当所述氧化肽含有二硫键,生成环肽。其他的环肽方法包括形成硫酯和羧基-和氨基-末端酰胺和酯。
肽模拟和有机模拟实施方案也属于本公开的范围之内,当这些肽模拟和有机模拟化学成分的三维排列模拟了所述肽主链和组成氨基酸侧链的三维排列时,可得到具有可检测丙氨酸2,3-氨基变位酶活性的本发明蛋白质的多肽和有机模拟物。对计算机建模应用而言,药效团是理想的,具有其生物学活性必须结构的三维界定。可对多肽-和有机模拟物进行设计从而将每个药效团都适合当前的计算机建模软件(使用计算机辅助药物设计或CADD)。参见Walters,″Computer-AssistedModeling of Drugs″,in Klegerman & Groves,eds.,1993,PharmaceuticalBiotechnology,Interpharm PressBuffalo Grove,IL,pp.165-174和Principles of Pharmacology Munson(ed.)1995,Ch.102中关于CADD中技术使用的描述。本公开的范围同样包括了使用这些技术制备的模拟物。在一个实施例中,通过丙氨酸2,3-氨基变位酶或其变体,片段或融合物产生了能够模拟丙氨酸2,3-氨基变位酶活性的模拟物。
多核苷酸任意长度的线性核酸序列。因此,多核苷酸包括至少15个,至少25个,至少50个,至少75个,至少100个,至少200个,至少300个,至少400个,至少500个,至少600个,至少700个,至少800个,至少900个,至少1000个,至少1100个或甚至至少1200个核苷酸长度的分子。在特定的实施例中,多核苷酸包括SEQ ID NO1,3,5,18,20,42,44,46,48或50(或其互补链)的至少15个连续核苷酸,例如SEQ ID NO1,3,5,18,20,42,44,46,48或50(或其互补链)的至少25个,至少50个,至少75个,至少100个,至少200个,至少300个,至少400个,至少500个,至少600个,至少700个,至少800个,至少900个,至少1000个,至少1100个或甚至至少1200个连续核苷酸。
探针和引物“探针”包括含有可检测标记或报告分子的分离核酸分子。示例性的标记包括放射性同位素,配体,化学发光剂,荧光团,和酶。对进行标记的方法和对各种目的的标记进行选择的指导已有讨论,例如,参见Sambrook等人(ed.),Molecular CloningALaboratory Manual 2nd ed.,vol.1-3,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1989,和Ausubel等人(ed.)CurrentProtocols in Molecular Biology,Greene Publishing andWiley-Interscience,New York(with periodic updates),1987。
“引物”通常是具有10个或更多核苷酸(例如具有从约10个核苷酸至约100个核苷酸的核酸分子)的核酸分子。可通过核酸杂交将引物退火成互补的靶核酸链,从而在引物和靶核酸链之间形成杂交,然后通过,例如,DNA聚合酶沿靶核酸链进行延伸。引物对可用来对核酸序列进行扩增,例如,通过聚合酶链反应(PCR)或其他核酸扩增方法。
制备和使用探针和引物的方法已有描述,例如,参见Sambrook等人(ed.),Molecular CloningA Laboratory Manual,2nd ed.,vol.1-3,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989;Ausubel等人(ed.),Current Protocols in Molecular Biology,GreenePublishing and Wiley-Interscience,New York(with periodic updates),1987;和Innis等人,PCR ProtocolsA Guide to Methods andApplications,Academic PressSan Diego,1990。可从已知序列衍生出PCR引物对,例如,通过使用针对此目的的计算机程序,例如Primer(Version 0.5, 1991,Whitehead Institute for Biomedical Research,Cambridge,Mass.)。本领域所属技术人员应该理解,特定探针或引物的特异性会随着长度的增加而增加,但探针或引物的长度却可从全长序列直至短至5个连续核苷酸的序列。因此,例如,与具有15个连续核苷酸的相对应引物相比,具有20个连续核苷酸的引物对靶的退火具有更高的特异性。因此,为了获得更大的特异性,可以选择包括,例如,25个,30个,35个,40个,50个,60个,70个,80个,90个,100个,150个,200个,250个,300个,350个,400个,450个,500个,550个,600个,650个,700个,750个,800个,850个,900个,950个,1000个,1050个,1100个,1150个,1200个,1250个,1300个,1350个,1400个,1450个,1500个或更多个连续核苷酸的探针或引物。
启动子能够指导核酸转录的核酸控制序列排列。启动子包括邻近转录起始位点的必须核酸序列,例如,在聚合酶II型启动子情况下的TATA元件。启动子还可任选地包括远端增强子或抑制物元件,其可位于离转录起始位点数千碱基对的位置上。
纯化的术语纯化的并不需要绝对纯净;相反,其是个相对的术语。因此,例如,纯化的肽制剂是这样的一种制剂,其中所述肽或蛋白质比细胞环境内的该肽和蛋白质更富集,因此述多肽是基本上从伴随其存在的细胞成分(核酸,脂类,碳水化合物,和其他肽)中分离出来的。在另一个实施例中,纯化的肽制剂是这样的一种制剂,其中所述多肽基本上没有污染物,就像那些在肽的化学合成之后所表现出的那样。
在一个实施例中,当至少50%的样本由丙氨酸2,3-氨基变位酶肽组成时,例如,当至少60%,70%,80%,85%,90%,92%,95%,98%或99%或更高部分的样本由丙氨酸2,3-氨基变位酶肽组成时,该丙氨酸2,3-氨基变位酶肽是纯化的。可用于纯化多肽的方法示例包括,但不限于,在Sambrook等人(Molecular Cloning A Laboratory Manual,Cold Spring Harbor,New York,1989,Ch 17)中所公开的方法。可通过,例如,蛋白质样本的聚丙烯酰胺凝胶电泳,然后对所述聚丙烯酰胺凝胶染色后的单个多肽条带进行观察;高压液相色谱;测序;或其他常规方法测定蛋白质的纯度。
重组体重组核酸分子是这样的分子,其具有非自然发生的序列或由两种独立序列片段人工组合而成的序列。可使用本领域中公知的方法,例如化学合成和对核酸分子的分离片段进行人工操作,例如通过遗传工程技术来获得这种人工组合。重组体还可用来描述经过人工操作,但却含有与从中分离到所述核酸的生物体中找到的相同调节序列和编码区的核酸分子。
序列同一性/相似性两个或多个核酸序列之间,或两个或多个氨基酸序列之间的同一性/相似性,是以序列之间的同一性或相似性的术语来表达的。可以通过同一性的百分比来测定序列同一性;百分比越高,所述序列同一性越高。可以通过相似性的百分比(其考虑的是保守氨基酸取代)来测定序列相似性;百分比越高,序列的相似性越高。当使用标准方法进行比对时,核酸或氨基酸序列的同源物或直系同源物(ortholog)具有相对较高的序列同一性/相似性。与相对更远相关的物种(例如人和秀丽线虫序列)相比,当直系同源(orthologous)蛋白质或cDNA是从更加紧密相关的物种中(例如人类和小鼠序列)衍生而来的时候,其同源性更加显著。
对序列比对进行比较的方法是本领域所公知的。已有多种程序和比对算法,参见Smith & Waterman,Adv Appl Math 2482,1981;Needleman & Wunsch,J Mol Biol 48.443,1970;Pearson & Lipman,Proc Natl Acad Sci USA 852444,1988;Higgins & Sharp,Gene,73237-44,1988;Higgins & Sharp,CABIOS 5151-3,1989;Corpet etal,Nuc Acids Res.1610881-90,1988,Huang等人Computer Appls inthe Biosciences 8,155-65,1992,和Pearson等人,Meth Mol Biol24307-31,1994。Altschul等人,J MoI Biol 215403-10,1990,对序列比对方法和同源性计算进行了详细的描述。
可从若干渠道获得NCBI Basic Local Alignment Search Tool(BLAST)(Altschul等人,J MoI Biol 215403-10,1990),包括NationalCenter for Biological Information(NCBI,National Library of Medicine,Building 38A,Room 8N805,Bethesda,MD 20894)和通过互联网,其可与序列分析程序blastp,blastn,blastx,tblastn和tblastx相关联使用。还可以在NCBI网站找到其他的信息。
BLASTN可用于比较核酸序列,而BLASTP则用于比较氨基酸序列。为了比较两个核酸序列,可对选项进行如下设置-i设置成含有需要比较的第一核酸序列的文件(例如C\seq1.txt);-j设置成含有需要比较的第二核酸序列的文件(例如C\seq2.txt);-p设置成blastn;-o设置成任意需要的文件名(例如C\output.txt);-q设置成-1;-r设置成2;其他全部选项保留其默认设置。例如,以下命令可用来生成含有两个核酸序列比较的输出文件C\B12seq-i c\seq1.txt -j c\seq2.txt-p blastn-oc\output.txt-q-1-r2。
为了比较两个氨基酸序列,可对B12seq的选项进行如下设置-i设置成含有需要比较的第一氨基酸序列的文件(例如C\seq1.txt);-j设置成含有需要比较的第二氨基酸序列的文件(例如C\seq2.txt);-p设置成blastn;-o设置成任意需要的文件名(例如C\output.txt);其他全部选项保留其默认设置。例如,以下命令可用来生成含有两个氨基酸序列比较的输出文件C\B12seq-i c\seq1.txt-j c\seq2.txt-p blastn-oc\output.txt。如果两个比较的序列具有同源性,那么所设计的输出文件就会将那些同源性区域表示为比对序列。如果两个比较的序列没有同源性,那么所设计的输出文件就不会表现出比对序列。
一旦完成比对,可以通过计数两个序列中存在的同一的核苷酸或氨基酸残基位置数量确定匹配的数量。可通过用匹配的数量除以在鉴定序列中设定的序列长度,或除以联接的长度(例如来自鉴定序列中设定序列的100个连续核苷酸或氨基酸残基),然后将所得数值乘以100就可确定序列同一性的百分数。例如,当与具有1554个核苷酸的检测序列进行比对具有1166个匹配的核酸序列与所述检测序列的同一性为75%(1166/1554*100=75.0)。将序列同一性的百分数四舍五入至0.1。例如,75.11,75.12,75.13和75.14都被四舍五入为75.1,而75.15,75.16,75.17,75.18和75.19则被四舍五入成75.2。长度值永远都是整数。在另一个实施例中,含有20个核苷酸区域的靶序列与含有来自鉴定序列的具有20个连续核苷酸的序列比对如下,其还有与鉴定序列75%序列同一性的区域(即15/20*100=75)。
1 20靶序列CTGTCAGTCA| || ||| ||||| ||| |鉴定序列 CTGCCAGTGA为了对氨基酸数量大于30的氨基酸序列进行比较,可将默认的BLOSUM62矩阵设置成默认参数(缺口存在值为11,而每个残基缺口值为1)来使用Blast2序列函数。同源序列的特征在于其拥有在氨基酸序列全长比对基础上,采用诸如nr或swissprot的数据库进行的NCBIBasic Blast 2.0,gapped blastp进行的序列同一性计数至少为70%。采用blastn程序进行的查询搜索可通过DUST(Hancock and Armstrong,1994,Comput.Appl.Biosci.1067-70)进行过滤。其他的程序使用SEG。此外,还可以进行手工比对。当采用这样的方法进行评估时,具有较高相似性的蛋白质会表现出增加的同一性百分数,例如,至少75%,80%,85%,90%,95%或99%序列同一性。
当比对短肽(低于约30个氨基酸)时,可将PAM30矩阵设置成默认参数(开放缺口9,延伸缺口1罚分),来使用Blast2序列函数进行比对。当使用本发明进行分析时,与参考序列具有较高相似性的蛋白质会表现出增加的同一性百分数,例如,至少60%,70%,75%,80%,85%,90%,95%,98%,99%序列同一性。当对小于全序列的序列进行序列同一性比较时,在10-20个氨基酸的短窗口内,同源序列通常拥有至少75%的序列同一性,并根据其与参考序列的同一性,其拥有的序列同一性可至少为85%,90%,95%或98%。在这些短窗口上测定序列同一性的方法在NCBI的网站上已有描述。
两个核酸分子紧密关联的一个标志是这两个分子可在严谨条件下相互杂交。严谨条件是序列依赖的,并在不同的环境参数下各不相同。能够在严谨条件下与丙氨酸2,3-氨基变位酶基因序列杂交的核酸分子通常都可以上述条件下分别杂交于基于丙氨酸2,3-氨基变位酶全基因或该基因选定部分的探针。
由于遗传密码的简并性,未表现出较高同一性的核酸序列也可以编码同一或相似(保守的)的氨基酸序列。可以使用这一简并性在核酸序列中进行改变,从而制备出全部都编码基本相同蛋白质的多种核酸分子。这样的同源核酸序列可以,例如,拥有通过本发明的方法确定的至少60%,70%,80%,90%,95%,98%或99%的序列同一性。
本领域所属技术人员应该理解,在此提供的序列同一性范围仅具有参考作用;也有可能获得了非常显著的同源序列却落在所提供的范围之外。
两个核酸序列基本上同一的另一个(不是必须具有叠加作用的)标志是第一核酸编码的多肽可与由第二核酸编码的多肽具有免疫交叉反应性。
特异性结合剂基本上仅结合于限定靶,例如肽靶的制剂。例如,丙氨酸2,3-氨基变位酶结合剂包括抗-丙氨酸2,3-氨基变位酶抗体和基本上仅结合于丙氨酸2,3-氨基变位酶的其他制剂(例如肽或药)。丙氨酸2,3-氨基变位酶蛋白(或其片段)的抗体可用来对这样的蛋白质进行纯化或鉴定。
转化的转化的细胞是向其中引入了核酸分子的细胞,例如通过分子生物学技术。转化包括可向这样的细胞中引入核酸分子的全部技术,包括,但不限于用病毒载体进行转染,结合,用质粒载体进行转化,和通过电穿孔、脂质体转染和颗粒枪加速将裸DNA导入。
变体,片段或融合体公开的丙氨酸2,3-氨基变位酶序列包括保留了丙氨酸2,3-氨基变位酶活性的变体,片段或融合体。编码丙氨酸2,3-氨基变位酶蛋白质(例如SEQ ID NO1,3,5,18,20,42,44,46,48或50),融合丙氨酸2,3-氨基变位酶蛋白质,或丙氨酸2,3-氨基变位酶蛋白质片段或变体的DNA序列可被工程化从而允许在真核细胞,细菌,昆虫或植物中表达蛋白质。为了得到表达,可对DNA序列进行改变并可操作地连接于其他调控序列。含有调节序列和所述蛋白质的终产物可称为载体。这样的载体可被导入真核细胞,细菌,昆虫或植物细胞。一旦进入细胞,所述载体可允许蛋白质产生。
融合蛋白质包括丙氨酸2,3-氨基变位酶(或其变体或片段),例如SEQ ID NO19,21,43,45,47,49或51,连接到不显著抑制丙氨酸2,3氨基变位酶活性,例如将α-丙氨酸转化为β-丙氨酸的能力的其它氨基酸序列上的蛋白质。在一个实施例中,其他氨基酸序列不大于约10,12,15,20,25,30或50个氨基酸的长度。此外,可将间隔序列放置于丙氨酸2,3-氨基变位酶序列和其他氨基酸序列之间。这样的间隔序列可以是至少4个,至少6个或至少10个氨基酸长。
本领域的普通技术人员可意识到DNA序列可在多个方面被改变,只要不影响该编码的蛋白质的生物活性。例如,可使用PCR在编码丙氨酸2,3-氨基变位酶的DNA序列中产生变化。这种变体可以是为用于表达该蛋白质的宿主细胞所偏好的密码子,或促进表达其它序列变化而优化的变体。
载体被导入细胞从而产生转化细胞的核酸分子。载体可包括允许其在细胞中,例如复制原点进行复制的核酸序列。载体还可包括一或多种可选择的标记基因和其它本领域已知的遗传元件。
丙氨酸2,3-氨基变位酶的核酸和多肽在此公开了具有丙氨酸2,3-氨基变位酶活性的多肽。在一个实施例中,该多肽是突变的赖氨酸2,3-氨基变位酶序列。在一个实施例中,突变的赖氨酸2,3-氨基变位酶包括一种或多种以下取代P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T;或K/Q/T398E,其中数字之前的字母代表在赖氨酸2,3氨基变位酶中所发现的氨基酸的单字母氨基酸编码,所述数字代表氨基酸位置(根据牙龈卟啉单胞菌赖氨酸2,3氨基变位酶(SEQ ID NO52)编号,参见图7),而数字之后的字母代表在丙氨酸2,3氨基变位酶中所发现氨基酸的单字母氨基酸编码。根据需要突变的赖氨酸2,3氨基变位酶序列,实际上的第一个氨基酸和氨基酸数字都会发生改变。然而,本领域所属技术人员应该可以通过序列比对确定同源序列中的所述位置。例如,如图7所示,牙龈卟啉单胞菌赖氨酸2,3氨基变位酶的位置128对应于具核梭杆菌赖氨酸2,3氨基变位酶(SEQ ID NO10)的位置129,斯氏梭菌(Clostridium sticklandii)赖氨酸2,3氨基变位酶(SEQID NO33)的位置126,和枯草芽孢杆菌(Bacillus subtilis)赖氨酸2,3氨基变位酶(SEQ ID NO59)的位置136。可根据图7所提供的信息和其他公众可获得的赖氨酸2,3氨基变位酶序列,使用本领域中的公知方法对剩余24个位点的每一个都进行类似的分析。
使用标准的分子生物学方法都可对任意的赖氨酸2,3氨基变位酶进行突变,产生丙氨酸2,3-氨基变位酶。例如,可对来自于诸如芽孢杆菌,梭菌,埃希氏,梭形杆菌,嗜血杆菌,甲烷八叠球菌,Microbulbifer,Moorella,卟啉单胞菌,嗜热厌氧菌或弧菌的原核生物的赖氨酸2,3氨基变位酶进行突变,从而包含有一种或多种以下取代,P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T或K/Q/T398E,例如至少2种,至少3种,至少4种,至少5种,至少6种,至少8种,至少9种,至少10种,至少11种,至少12种,至少13种,至少14种,至少15种,至少16种,至少17种,至少18种,至少19种,至少20种,至少21种,至少22种,至少23种,至少24种或不多于3种,不多于4种,不多于5种,不多于6种,不多于8种,不多于9种,不多于10种,不多于11种,不多于12种,不多于13种,不多于14种,不多于15种,不多于16种,不多于17种,不多于18种,不多于19种,不多于20种,不多于21种,不多于22种或不多于23种这样的突变。这些取代的特定组合包括,但不限于(1)N19Y,L/T53P/H,H/I/S85Q,D331G/H,和M/Q342T;(2)N19Y,E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H,和M/Q342T;(3)N19Y,L/K/R/T26I;E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H,和M/Q342T;(4)E/R30K,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,L228M,D331G/H,和K/Q/T398E;(5)E/R30K,K36E,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,D179N,L228M,D331G/H,和K/Q/T398E;(6)E/R30K,Q/L95M,M128V,和D331G/H;(7)P/S11T,E/R30K,Q/L95M,M128V,Q/S141R,K/Q187R,和D331G/H;(8)E/R30K,L/V32A,L/T53P/H,E/N/D71G,Q/L95M;K/M/Q125L,M128V,和D331G/H;(9)E/R30K,C52R,Q/L95M;M128V,和D331G/H;(10)Q/L95M,M128V,和D331G/H;(11)Q/L95M,M128V;Y132H,和D331G/H;和(12)Q/L95M,M128V,和D331G/H。
具有丙氨酸2,3-氨基变位酶活性肽的特别示例如SEQ ID NOS19,21,43,45,47,49和51所示。然而,本公开还包括了保留了丙氨酸2,3-氨基变位酶活性的SEQ ID NOS19,21,43,45,47,49和51的变体,融合体和片段。在特定的实施例中,SEQ ID NOS19,21,43,45,47,49和51的变体,融合体和片段具有SEQ ID NOS41的至少50%的丙氨酸2,3-氨基变位酶活性,例如SEQ ID NOS41的至少60%,至少70%,至少80%,至少90%,至少95%,至少98%或甚至至少100%的丙氨酸2,3-氨基变位酶活性。在其他实施例中,SEQ IDNOS19,21,43,45,47,49和51的变体,融合体和片段具有SEQ IDNOS51的至少50%的丙氨酸2,3-氨基变位酶活性,例如SEQ ID NOS51的至少60%,至少70%,至少80%,至少90%,至少95%,至少98%或甚至至少100%的丙氨酸2,3-氨基变位酶活性。
片段的示例可包括,但不限于SEQ ID NO2或4(SEQ ID NOS6,19,21,43,45,47,49和51(例如SEQ ID NO6,49或51的氨基酸42-342)的对应片段也包括在本发明中,并可使用图7进行测定)的氨基酸1-390,15-390,50-390,50-350,60-350,15-340,75-340,19-331或100-339。本发明还提供了丙氨酸2,3-氨基变位酶肽,其含有SEQ IDNO19,21,43,45,47,49或51的至少15个连续氨基酸,并保留了丙氨酸2,3-氨基变位酶活性。丙氨酸2,3-氨基变位酶肽还可包括SEQID NO19,21,43,45,47,49或5的至少16个,至少17个,至少18个,至少19个,至少20个,至少21个,至少22个,至少23个,至少24个,至少25个,至少26个,至少27个,至少28个,至少29个,至少30个,至少50个,至少75个,至少100个,至少150个,至少200个,至少250个,至少300个或更多个连续的氨基酸残基。
变体包括一个或多个氨基酸取代,例如一个或多个保守氨基酸取代,一个或多个非保守氨基酸取代或其组合。变体还包括一个或多个氨基酸缺失或插入(或其组合,例如单个缺失与多个插入),例如,不超过50个氨基酸,不超过20个氨基酸,不超过10个氨基酸,不超过5个氨基酸,或不超过2个氨基酸的加入或缺失,例如1-5个氨基酸,1-10个氨基酸或2-20个氨基酸的加入或缺失。在一个实施例中,变体丙氨酸2,3氨基变位酶具有不超过5个,不超过10个,不超过20个,不超过30个,不超过40个或不超过50个的保守性取代。非保守性取代那些取代,其中所述氨基酸具有更本质的区别,例如其作用可表现在维持(a)在取代区域所述多肽主链的结构,例如,作为片状或螺旋构象;(b)在靶位点所述多肽的电荷或疏水性;或(c)侧链的体积。通常预期可在多肽功能中产生最大改变的取代是那些取代,其中(a)亲水残基,例如丝氨酸或苏氨酸,被疏水残基,例如亮氨酸,异亮氨酸,苯丙氨酸,缬氨酸或丙氨酸所取代;(b)半胱氨酸或脯氨酸被任意其他残基取代;(c)具有正电性的侧链,例如赖氨酸,精氨酸或组氨酸的残基,被负电性残基,例如谷氨酸或天冬氨酸取代;或(d)具有大体积侧链的残基,例如苯丙氨酸,被没有侧链的残基,例如甘氨酸所取代。可使用本发明公开的分析方法对肽催化转化α-丙氨酸为β-丙氨酸的能力进行分析,从而评估这些氨基酸取代(或其他缺失或加入)对具有丙氨酸2,3氨基变位酶活性的肽所产生的影响。
可使用标准方法,例如位点定向的突变或PCR对编码丙氨酸2,3-氨基变位酶多肽的核苷酸序列进行操作从而产生变体丙氨酸2,3-氨基变位酶多肽的序列。
在依然保留了丙氨酸2,3-氨基变位酶活性的条件下,可进行取代的示例包括,但不限于SEQ ID NO21(在其他公开序列中的对应取代,例如SEQ ID NO6,49或51中的Y289W;SEQ ID NO19中的Y290W,SEQ ID NO41,43,45或47中的Y287W;和SEQ ID NO2或4中的Y297W,也包括在本发明的范围内,并可通过使用图7进行测定)中的V108L,T240S,D295E,Y290F或其组合,以及其组合。只要该氨基酸序列编码的多肽保留了丙氨酸2,3-氨基变位酶活性,变体丙氨酸2,3-氨基变位酶多肽就可与SEQ ID NOS2,4,6,19,21,43,45,47,49或51中的任意序列具有至少60,至少65,至少70,至少75,至少80,至少85,至少90,至少95,至少97,至少98或至少99%的序列同一性。
可使用公开的丙氨酸2,3-氨基变位酶序列产生融合蛋白(及对应的核酸序列)。融合蛋白可包括全长丙氨酸2,3-氨基变位酶蛋白序列(例如SEQ ID NO2,4,6,19,21,43,45,47,49或51),或连接于第二氨基酸序列、具有丙氨酸2,3-氨基变位酶活性的序列变体或片段。在一些实施例中,所述第二氨基酸序列包括至少5个氨基酸,例如至少10个氨基酸,至少20个氨基酸,至少30个氨基酸,至少50个氨基酸,至少75个氨基酸,至少100个氨基酸,至少150个氨基酸或甚至至少200个氨基酸。在特定的实施例中,所述丙氨酸2,3-氨基变位酶序列和第二氨基酸序列通过间隔序列相连接。间隔序列的特定实施例包括一个或多个丙氨酸或甘氨酸残基,或其他非极性氨基酸或中性极性氨基酸。在一些实施例中,间隔物不超过50个氨基酸,例如不超过20个氨基酸,不超过10个氨基酸,不超过5个氨基酸,例如5-50氨基酸。
本发明还公开了编码具有丙氨酸2,3-氨基变位酶活性的分离核酸分子,例如包括SEQ ID NO18,20,42,44,46,48或50的序列。然而,本发明还包括了保留了编码具有丙氨酸2,3-氨基变位酶活性的SEQ ID NOS18,20,42,44,46,48和50序列的变体,融合体和片段。在一个实施例中,可将编码具有丙氨酸2,3-氨基变位酶活性的肽的分离核酸分子可操作地连接于启动子序列,并可以是载体的一部分。所述核酸可以是可用于转化细胞和制备转化细胞或转基因非人类哺乳动物(例如小鼠,大鼠和兔子)的重组核酸。
本发明还公开了具有至少一种编码具有丙氨酸2,3-氨基变位酶活性多肽的外源核酸分子(例如SEQ ID NO18,20,42,44,46,48或50或其保留了丙氨酸2,3-氨基变位酶活性的序列片段,融合体或变体)的转化细胞。在一个实施例中,这样的转化细胞可从α-丙氨酸制备β-丙氨酸。在其他实施例中,所述细胞可制备3-HP,泛酸盐,CoA,或有机化合物,例如1,3-丙二醇。转化细胞可以是真核或原核细胞,例如细菌细胞,植物细胞或酵母细胞。
编码丙氨酸2,3-氨基变位酶的核酸序列可含有编码该酶的完整核酸序列,以及保留了所希望酶活性的部分序列。例如,丙氨酸2,3-氨基变位酶核酸分子可包含丙氨酸2,3-氨基变位酶核酸序列(例如SEQ IDNO18,20,42,44,46,48或50)的至少15个连续核苷酸。应该理解,本发明还提供了包含至少16个,至少17个,至少18个,至少19个,至少20个,至少21个,至少22个,至少23个,至少24个,至少25个,至少26个,至少27个,至少28个,至少29个,至少30个,至少40个,至少50个,至少75个,至少100个,至少200个,至少500个,至少1000个,至少1200个或更多个核苷酸的分离核酸分子,例如SEQ ID NO18,20,42,44,46,48或50中的至少那么多连续核苷酸。在一些实施例中,SEQ ID NO18,20,42,44,46,48或50(或其互补链)的片段并不编码具有丙氨酸2,3-氨基变位酶的蛋白,但却是可用作探针或引物的较短片段。
本发明公开了变体丙氨酸2,3-氨基变位酶的核酸序列。只要所编码的多肽保留丙氨酸2,3-氨基变位酶活性(或可作为探针或引物行使功能),变体就可含有单插入,单缺失,单取代,多插入,多缺失,多取代,或其任意组合(例如单缺失和多插入)。只要所述核酸编码的肽保留了所希望的酶活性,例如丙氨酸2,3-氨基变位酶活性,这样的分离核酸分子就可与丙氨酸2,3-氨基变位酶序列(例如SEQ ID NO18,20,42,44,46,48或50)具有至少60%,至少70,至少75,至少80,至少85,至少90,至少95,至少97,至少98或至少99%的序列同一性。
例如,可将以下变体制备成丙氨酸2,3-氨基变位酶核酸序列对SEQ ID NO13,18或20而言,将96或384位点上的″t″用″c″″a″或″g″取代;将438或480位点上的″a″用″c″″t″或″g″取代;将1056位点上的″t″用″g″″a″或″c″取代;对SEQ ID NO42,44或46而言,144位点上的″a″可用″g″取代;672位点上的″a″可用″c″″t″或″g″取代;而1107位点上的″t″;可用″c″取代;对SEQ ID NO48和50而言,576位点上的″a″可用″g″″t″或″c取代;864位点上的″c″可用″t″取代;而1200位点上的″t″;可用″g″″a″或″c″取代。使用序列表,还可对本发明公开的其他丙氨酸2,3-氨基变位酶氨基酸序列进行类似的取代。
可利用遗传编码的简并性来改变丙氨酸2,3-氨基变位酶序列的编码区对编码序列进行改变,即,虽然对所述核酸序列进行了显著的改变,但其却编码了与天然氨基酸序列一致或基本上相似的氨基酸序列多肽。例如,可使用针对特定物种的密码子偏好性和密码子使用表,对分离核酸分子进行工程化,所述工程化利用了该特定物种密码子使用的偏好性。由于遗传密码的简并性,丙氨酸可由四种核苷酸密码子三联体编码GCT,GCA,GCC和GCG。因此,可在不影响所述编码多肽的氨基酸序列或所述多肽性质的条件下,在丙氨酸位点上对任意的这些密码子的开放阅读框的核酸序列进行改变。基于遗传密码的简并性,可使用本发明所述的标准DNA突变技术,或核酸序列的合成从核酸序列中衍生出核酸变体。因此,本发明还包括了编码相同多肽,但由于密码子简并性在核酸序列上有差异的核酸分子。因此,可对本发明公开的丙氨酸2,3-氨基变位酶进行设计,从而使其具有特殊感兴趣生物体所优选使用的密码子(例如,如以下实施例所述)。
本发明还包括了编码丙氨酸2,3-氨基变位酶的变体,融合体和片段的核酸(例如那些以上所公开的内容)。本发明还提供了编码丙氨酸2,3-氨基变位酶的分离的核酸序列,其中所述序列的长度为至少12个核苷酸(例如长度为至少13个,至少14个,至少15个,至少16个,至少17个,至少18个,至少19个,至少20个,至少25个,至少30个,至少40个,至少50个,至少60个,至少100个,至少250个,至少500个,至少750个,至少1000个,至少1200个或至少1500个核苷酸),并可在杂交条件下,杂交于编码所述酶的核酸分子的有义链或反义链。杂交条件可以是温和或较高的严谨杂交条件。
可通过标准DNA突变技术,例如,M13引物突变,制备丙氨酸2,3-氨基变位酶多肽和编码这些肽的核酸分子。这些技术的详细内容可参见Sambrook等人(ed.),Molecular CloningA Laboratory Manual 2nded.,vol.1-3,Cold Spring Harbor Laboratory Press,Cold Spring,Harbor,N.Y.,1989,Ch.15。核酸分子可含有编码区的改变从而适合该分子所导入的特定生物体的密码子使用偏好。
具有丙氨酸2,3-氨基变位酶活性的细胞本发明公开了具有丙氨酸2,3-氨基变位酶活性的细胞。这些细胞可从α-丙氨酸制备β-丙氨酸。在一个实施例中,由于自然发生的突变或在该细胞染色体中诱导的突变,例如将所述细胞暴露于化学或UV诱变条件,这些细胞会具有丙氨酸2,3-氨基变位酶活性。包括丙氨酸2,3-氨基变位酶活性的细胞可以是真核或原核细胞。这些细胞的示例包括,但不限于,乳杆菌(Lactobacillus),乳球菌(Lactococcus),芽孢杆菌,Escherichia,Geobacillus,Corynebacterium,梭菌,真菌,植物和酵母细胞。在一个实施例中,植物细胞是植物,例如转基因植物的一部分。
在一个实施例中,具有丙氨酸2,3-氨基变位酶活性的细胞是转化细胞。这些细胞可包括编码丙氨酸2,3-氨基变位酶的至少一种外源核酸分子,例如保留了编码具有丙氨酸2,3-氨基变位酶活性蛋白能力的SEQID NO18,20,42,44,46,48或50,或其变体,片段或融合体的序列。在一个实施例中,所述外源核酸分子是突变的赖氨酸2,3-氨基变位酶,例如突变的原核赖氨酸2,3-氨基变位酶。在特定的实施例中,突变的原核赖氨酸2,3-氨基变位酶是突变的枯草芽孢杆菌(Bacillus subtilis),牙龈卟啉单胞菌(Porphyromonas gingivalis),具核梭杆菌(Fusobacteriumnucleatum)或斯氏梭菌(Clostridium sticklandii)赖氨酸2,3-氨基变位酶。可使用本领域公知的方法,例如,通过在BLAST上检索类似序列或通过杂交方法来鉴定其他赖氨酸2,3-氨基变位酶。在特定的实施例中,突变的赖氨酸2,3-氨基变位酶是突变的枯草芽孢杆菌,具核梭杆菌,牙龈卟啉单胞菌或斯氏梭菌的赖氨酸2,3-氨基变位酶。在特定的实施例中,突变的赖氨酸2,3-氨基变位酶是在E30K;K36E;Y63F;Q86R;L95M;M128V;D144G;D179N;L228M;D331H或K398E位点上具有取代的突变具核梭杆菌赖氨酸2,3-氨基变位酶。在又一个实施例中,突变的赖氨酸2,3-氨基变位酶是在P/S11T;E30K;V32A;C52R;L53P/H;E71G;Q95M;Q125L;M128V;Q141R;K87R或D331G/H位点上具有取代的突变斯氏梭菌赖氨酸2,3-氨基变位酶。在又一个实施例中,突变的赖氨酸2,3-氨基变位酶是在N19Y;L26I;E30K;L53P/H;H85Q;I192V;D331G/H或M342T位点上具有取代的突变牙龈卟啉单胞菌的赖氨酸2,3-氨基变位酶。在所有这些实施例中,在特定赖氨酸2,3-氨基变位酶中的取代可以表现为单独的,或其任意组合。
本发明还公开了包括丙氨酸2,3-氨基变位酶活性以及其他酶活性的细胞。这些细胞可用于制备β-丙氨酸,3-HP,泛酸盐,CoA,和有机酸,聚醇,例如1,3-丙二醇,聚合的3-HP,3-HP的共聚物和其他化合物,例如丁酸酯,戊酸酯,和其他化合物,以及3-HP的酯。
例如,本发明公开了能够从3-氧丙酸盐产生3-羟丙酸盐、具有丙氨酸2,3氨基变位酶活性以及丙酮酸盐/2-酮戊二酸盐氨基转移酶活性,β-丙氨酸/2-酮戊二酸盐氨基转移酶活性,和3-羟丙酸盐脱氢酶活性的细胞。在这些实施例中,所述细胞可制备3-HP。在其他实施例中,这些细胞还包括脂酶或酯酶活性。这些细胞可用于制备3-HP的酯,例如,3-羟丙酸甲酯,3-羟丙酸乙酯,3-羟丙酸丙酯,3-羟丙酸丁酯或3-羟丙酸-2-乙基己基酯。
在其他实施例中,具有丙氨酸2,3氨基变位酶活性的细胞还包括丙酮酸盐/2-酮戊二酸盐氨基转移酶活性,β-丙氨酸/2-酮戊二酸盐氨基转移酶活性,和3-羟丙酸盐脱氢酶活性;以及聚羟酸合成酶活性,这些细胞可用于制备聚合3-HP。
或者,具有丙氨酸2,3氨基变位酶活性的细胞还包括丙酮酸盐/2-酮戊二酸盐氨基转移酶活性,β-丙氨酸/2-酮戊二酸盐氨基转移酶活性,3-羟丙酸盐脱氢酶活性和乙醇脱氢酶活性。这些细胞可用于制备聚1,3-丙二醇。
在一个实施例中,具有丙氨酸2,3氨基变位酶活性的细胞还具有α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1)活性。这样的细胞可用于制备泛酸盐。或者,细胞也具有泛酸盐激酶(E.C.2.7.1.33),4′-磷酸羟泛酰基-1-半胱氨酸合成酶(E.C.6.3.2.5),4′-磷酸泛酰半胱氨酸脱羧酶(E.C.4.1.1.36),ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶(E.C.2.7.7.3),和脱磷酸-CoA激酶(E.C.2.7.1.24)。这些细胞可用于制备辅酶A(CoA)。
可通过表达编码具有所希望活性的酶的核酸分子,或通过直接供应所述酶来提供酶活性。
鉴定细胞具有丙氨酸2,3-氨基变位酶活性的方法本发明公开了鉴定细胞具有丙氨酸2,3-氨基变位酶活性的方法。所述方法包括在含有α-丙氨酸,但不含有β-丙氨酸或泛酸盐的培养基中,培养功能性缺失panD的原核细胞,或在不含有β-丙氨酸或泛酸盐,细胞却能从碳源、氧源、氢源和氮源制备α-丙氨酸的培养基中培养功能性缺失panD的原核细胞,并且鉴定能够生长于β-丙氨酸或泛酸盐缺陷培养基中的细胞。在特定的实施例中,还对该细胞进行了panF的功能性缺失,从而使得所述细胞不能从补充有泛酸盐的培养基中基中地摄取泛酸盐。所述细胞的生长说明该细胞可从α-丙氨酸制备β-丙氨酸,这说明了所述细胞具有丙氨酸2,3-氨基变位酶活性。相反,如果细胞不能在β-丙氨酸或泛酸缺陷培养基中生长或存活,说明该细胞不能从α-丙氨酸制备β-丙氨酸,这说明了所述细胞不具有丙氨酸2,3-氨基变位酶活性。
在一个实施例中,可使用一种或多种突变的氨基变位酶,例如包括突变赖氨酸2,3-氨基变位酶的文库对功能性缺失panD的细胞进行转化。在特定的实施例中,在培养和筛选细胞之前,可用突变的赖氨酸2,3-氨基变位酶的文库转化细胞。已对来自Clostridium subterminaleSB4(Chirpich等人,J.Biol.Chem.2451778-89,1970)和枯草芽孢杆菌(Bacillus subtilis)(Chen等人,Biochem.J.348539-49,2000)的赖氨酸2,3-氨基变位酶进行了描述,并证明其可催化赖氨酸与β-赖氨酸的相互转化。氨基变位酶突变体,例如赖氨酸2,3-氨基变位酶突变体,可根据其具有的丙氨酸2,3-氨基变位酶活性进行筛选。此外,虽然之前未对具有丙氨酸2,3-氨基变位酶活性的多肽进行描述,这样的酶也有可能存在于自然界中。因此,可使用包括编码丙氨酸2,3-氨基变位酶基因,以及通过能使细胞在含有α-丙氨酸,或碳源,氧源,氢源和氮源,但不含有β-丙氨酸或泛酸盐培养基中的这种细胞传递生长能力的分离的基因的文库来转化功能性缺失panD的细胞,可使得所述细胞产生α-丙氨酸。
在其他实施例中,本方法还包括在鉴定细胞生长于所述培养基之后鉴定突变氨基变位酶中的突变,其中所述突变的氨基变位酶可使细胞具有丙氨酸2,3-氨基变位酶活性。为了鉴定突变,可对所述氨基变位酶核酸或氨基酸进行测序,并与未突变的氨基变位酶序列进行比较,从而鉴定出使细胞具有丙氨酸2,3-氨基变位酶活性的突变。这些突变随后被转移给其他的赖氨酸2,3-氨基变位酶,如图7所示,从而产生具有丙氨酸2,3-氨基变位酶活性的氨基变位酶变体。
制备含有丙氨酸2,3-氨基变位酶活性肽的方法本发明公开了制备具有丙氨酸2,3-氨基变位酶活性肽的方法。本发明包括在允许该细胞产生丙氨酸2,3-氨基变位酶肽的条件下培养具有丙氨酸2,3-氨基变位酶活性的已公开的细胞。在一个实施例中,该方法包括培养具有一个或多个编码丙氨酸2,3-氨基变位酶(例如包括保留了丙氨酸2,3-氨基变位酶活性的SEQ ID NO18,20,42,44,46,48或50,或其变体,融合体或片段)外源核酸分子的细胞,从而制备丙氨酸2,3-氨基变位酶。
本发明公开了从α-丙氨酸制备β-丙氨酸的方法。在一个实施例中,该方法包括在允许该细胞从α-丙氨酸制备β-丙氨酸的条件下培养具有丙氨酸2,3-氨基变位酶活性的已公开的细胞。在一个实施例中,该方法包括培养具有一个或多个编码丙氨酸2,3-氨基变位酶的外源核酸分子的细胞,从而制备出可从α-丙氨酸制成β-丙氨酸的丙氨酸2,3-氨基变位酶。在一个实施例中,所述外源核酸是这样的序列,其包括保留了丙氨酸2,3-氨基变位酶活性的SEQ ID NO18,20,42,44,46,48或50,或其变体,融合体或片段。
在特定的实施例中,该细胞功能性缺失了panD,或panD和panF。
制备3-HP,泛酸盐及其衍生物的途径本发明公开了通过丙氨酸2,3-氨基变位酶,例如使用公开的丙氨酸2,3-氨基变位酶序列以及公开的具有丙氨酸2,3-氨基变位酶活性的细胞从α-丙氨酸制备β-丙氨酸的相关方法和材料。此外,本发明还公开了从β-丙氨酸制备泛酸盐和3-HP,以及CoA和有机物,例如1,3-丙二醇,聚合的3-HP,3-HP的共聚物和其他化合物,例如丁酸酯,戊酸酯或其他化合物,以及3-HP的酯的方法和相关材料。具体地,本发明提供了丙氨酸2,3-氨基变位酶核酸分子(例如SEQ ID NO18,20,42,44,46,48或50),肽(例如SEQ ID NO2,4,6,19,21,43,45,47,49或51),宿主细胞以及从α-丙氨酸制备β-丙氨酸的方法及材料,其可用来更有效地制备β-丙氨酸,泛酸盐和3-HP,及其衍生物,例如CoA和有机物,例如1,3-丙二醇,聚合的3-HP,和3-HP的酯。
还可使用若干代谢途径从由α-丙氨酸制备得到的β-丙氨酸来制备有机化合物(图1和图3)。
3-HP及其衍生物的途径如图1所示,可使用具有β-丙氨酸/2-酮戊二酸盐氨基转移酶活性的多肽来从β-丙氨酸制备3-HP,该多肽能从β-丙氨酸生成3-氧丙酸盐。可使用具有3-HP脱氢酶(EC 1.1.1.59或.31)活性的多肽将3-氧丙酸盐转化为3-HP。
从β-丙氨酸制备3-HP的衍生物可参见图1所示。可通过使用具有聚羟酸合成酶活性(EC 2.3.1.-)的多肽将所得的3-HP转化成聚合的3-HP。或者,可使用具有氧化还原酶活性或还原酶活性的多肽将3-HP转化成1,3-丙二醇。
可使用具有脂酶或酯酶活性(EC 3.1.1.-)的多肽将所得的3-HP转化成3-HP的酯。或者,可使用具有醛脱氢酶活性的多肽和具有醇脱氢酶活性的多肽组合,从3-HP制备1,3-丙二醇。
泛酸盐及其衍生物的途径如图3所示,可使用具有α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1)活性、能将β-丙氨酸转化为泛酸盐的肽从β-丙氨酸制备泛酸盐。
可根据如下所述从β-丙氨酸制备泛酸盐的衍生物。可使用具有泛酸盐激酶(E.C.2.7.1.33),4′-磷酸羟泛酰基-1-半胱氨酸合成酶(E.C.6.3.2.5),4′-磷酸泛酰半胱氨酸脱羧酶(E.C.4.1.1.36),ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶(E.C.2.7.7.3),和脱磷酸-CoA激酶(E.C.2.7.1.24)活性的多肽将所得的泛酸盐转化成CoA。
酶可从多种物种得到具有赖氨酸2,3-氨基变位酶活性的多肽以及编码这种多肽的核酸,这些物种包括,但不限于C.subterminale,大肠杆菌,枯草芽孢杆菌,牙龈卟啉单胞菌,具核梭杆菌,和斯氏梭菌。例如,对牙龈卟啉单胞菌而言,具有赖氨酸2,3-氨基变位酶活性的氨基酸序列可见于SEQ ID NO52,对斯氏梭菌而言,可见于SEQ ID NO33;对枯草芽孢杆菌而言,可见于SEQ ID NO59;而对具核梭杆菌而言,则可见于SEQ ID NO10。
本发明公开了编码具有丙氨酸2,3-氨基变位酶活性肽的核酸分子。其示例包括,但不限于,牙龈卟啉单胞菌的SEQ ID NOS48和50(对应的氨基酸序列可参见SEQ ID NOS49和51),具核梭杆菌的SEQ IDNOS18和20(对应的氨基酸序列可参见SEQ ID NOS19和21),和斯氏梭菌的SEQ ID NOS42,44和46(对应的氨基酸序列可参见SEQ IDNOS43,45和47)。此外,也可使用本发明所述的方法获得其他具有丙氨酸2,3-氨基变位酶活性的肽,以及编码这些多肽的核酸。例如,丙氨酸2,3-氨基变位酶变体可编码具有上述丙氨酸2,3-氨基变位酶活性的肽。
可从多个物种中获得具有β-丙氨酸/2-酮戊二酸盐氨基转移酶活性,3-羟丙酸盐脱氢酶活性的多肽,以及编码这些多肽的核酸。
可从多个物种中获得具有聚羟酸合成酶活性的多肽以及编码这些多肽的核酸,这些物种包括,但不限于,Rhodobacter sphaeroides,Comamonas acidororans,Ralstonia eutropha和Pseudomonas oleovorans。例如,可从R.sphaeroides获得编码具有聚羟酸合酶活性多肽的核酸,且其具有如GenBank accession number X97200所列出的序列。关于聚羟酸合酶的其他信息可参见Song等人(Biomacromolecules 1433-9,2000)。
如上所述,可通过两种不同的多肽来实施醛NAD(+)氧化还原酶活性和醇NAD(+)氧化还原酶活性,或通过单种多肽来实施,例如来自于大肠杆菌的多功能醛-醇脱氢酶(EC 1.2.1.10)(Goodlove等人Gene85209-14,1989;GenBank Accession No.M33504)。
可从多个物种,包括,但不限于,啤酒酵母中获得具有醛脱氢酶(NAD(P)+)(EC 1.2.1.-)活性的多肽以及编码这些多肽的核酸。例如,可从啤酒酵母中获得编码具有乙醛脱氢酶活性d多肽的核酸,且其具有如GenBank Accession No.Z75282所列出的序列(Tessier等人FEMSMicrobiol.Lett.16429-34,1998)。
可从多个物种,包括,但不限于,运动发酵单胞菌(Z.mobilis)中获得具有醇脱氢酶(EC 1.1.1.1)活性的多肽以及编码这些多肽的核酸。例如,可从运动发酵单胞菌(Z.mobilis)中获得编码具有醇脱氢酶活性多肽的核酸,且其具有如GenBank accession No.M32100所列出的序列。
可从多个物种,包括,但不限于,铁红假丝酵母(Candida rugosa),热带假丝酵母(Candida tropicalis),和白假丝酵母(Candida albicans)中获得具有脂酶活性的多肽以及编码这些多肽的核酸。例如,可从铁红假丝酵母获得编码具有脂酶活性多肽的核酸,且其具有如GenBankaccession No.A81171所列出的序列。
可从多个物种,包括,但不限于大肠杆菌中获得具有α-酮泛解酸盐羟甲基转移酶和泛酸合酶活性的多肽以及编码这些多肽的核酸。例如,可从大肠杆菌中获得编码具有α-酮泛解酸盐羟甲基转移酶和泛酸盐合酶活性肽的核酸,且其具有如GenBank accession No.L17086所列出的序列。
可从多个物种,包括,但不限于,大肠杆菌中获得具有α-酮泛解酸盐还原酶,泛酸盐激酶,4′-磷酸羟泛酰基-1-半胱氨酸合成酶,4′-磷酸泛酰半胱氨酸脱羧酶,ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶,和脱磷酸-CoA激酶活性的多肽以及编码这些多肽的核酸。例如,可从大肠杆菌中获得编码具有α-酮泛解酸盐还原酶,泛酸盐激酶,4′-磷酸羟泛酰基-1-半胱氨酸合成酶,4′-磷酸泛酰半胱氨酸脱羧酶,ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶,和脱磷酸-CoA激酶活性多肽的核酸,且其具有如GenBank accession No.NC000913所列出的序列。
术语“具有酶活性的多肽”是指在反应完成后自身不受到破坏或改变的条件下,能够催化其他物质进行化学反应的任意多肽。一般地,具有酶活性的多肽催化从一种或多种底物形成一种或多种产物。这些多肽可具有任意类型的酶活性,包括,但不限于,与诸如丙氨酸2,3-氨基变位酶,聚羟酸合酶,β-丙氨酸/2-酮戊二酸盐氨基转移酶,3-羟丙酸盐脱氢酶,脂酶,酯酶,乙酰醛NAD(+)氧化还原酶,醇NAD(+)氧化还原酶,醛脱氢酶,醇脱氢酶,合酶,合成酶,脱羧酶,α-酮泛解酸盐羟甲基转移酶,α-酮泛解酸盐还原酶,泛酸盐合酶,泛酸盐激酶,4′-磷酸羟泛酰基-1-半胱氨酸合成酶,4′-磷酸泛酰半胱氨酸脱羧酶,ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶,和脱磷酸-CoA激酶,乙酰醛NAD(+)氧化还原酶,醇NAD(+)氧化还原酶,醛脱氢酶(NAD(P)+)和醇脱氢酶的酶活性或与之关联的酶活性。
制备3-HP,泛酸盐及其衍生物的方法可在细胞内(体内)或细胞外(体外,例如在容器或柱子中)实施如图1和3所示途径中的每一步。此外,可通过体内合成与体外合成的组合生产有机产物。而且,通过化学反应或酶反应实施体外合成的步骤。
例如,本说明书中提供的细胞或微生物可用于实现图1和3所描述的步骤,或者可将含有指定酶活性多肽的提取物用于实施图1和3所描述的步骤。此外,可使用化学处理来实施图1和3所提供的转化。例如,可通过化学氢化将3-氧基丙酸酯转化为3-HP。其他的化学处理包括,但不限于,将3-HP转化为3-HP酯的酯交换反应。
多肽的表达可在宿主细胞或宿主细胞组合中单独地制备本发明中所述的多肽,例如图1中所列示的酶。而且,具有特殊酶活性的肽可以是天然发生的多肽或非天然发生的肽。天然发生的肽是具有如自然界中发现氨基酸序列的任意肽,包括野生型和聚合多肽。可从任意物种,包括,但不限于,动物(例如哺乳动物),植物,真菌,和细菌物种中获得天然发生的肽。非天然发生的多肽是不具有如自然界中发现氨基酸序列的任意多肽。因此,非天然发生的多肽可以是天然发生多肽的突变版本,或是工程化的多肽。例如,具有丙氨酸2,3-氨基变位酶活性的非天然发生多肽可以是具有至少一些丙氨酸2,3-氨基变位酶活性(例如SEQ IDNO19,21,43,45,47,49或51)的赖氨酸2,3-氨基变位酶活性的天然发生多肽的突变版本。可使用本领域的公知方法,通过,例如,序列添加,缺失,取代或其组合对多肽进行突变。
可将遗传修饰的细胞用于实施本发明所述途径中的一个或多个步骤,或可将遗传修饰的细胞用于制备在体外进行后续使用的公开多肽。例如,单个微生物可含有各个编码实施图1和3所述步骤必须多肽的外源核酸。这些细胞可含有任意数量的外源核酸分子。例如,一个特定的细胞可含有一个,两个,三个或四个不同的外源核酸分子,其中的每一个都编码如图1所示的将丙酮酸转化为3-HP所必需的多肽,或者某个特定的细胞可内源性地产生将丙酮酸盐转化为α-丙氨酸所必需的多肽,同时还含有编码将α-丙氨酸转化为3-HP所必需多肽的外源核酸。
此外,单个的外源核酸分子可编码一个或多于一个的多肽。例如,单个的外源核酸分子可含有编码两个,三个,或甚至四个不同多肽的序列。而且,本说明书中的细胞可含有单拷贝,或多拷贝(例如约5,10,20,35,50,75,100或150个拷贝)的特定外源核酸分子,例如特定的酶。本发明所述的细胞可含有不止一种特定的外源核酸。例如,特定的细胞可含有约50拷贝的外源核酸分子X以及约75拷贝的外源核酸分子Y。
在另一个实施例中,细胞可含有编码具有丙氨酸2,3-氨基变位酶活性多肽,例如SEQ ID NO18,20,42,44,46,48或50的外源核酸分子。这些细胞可具有任意可检测水平的丙氨酸2,3-氨基变位酶活性,包括可通过产生β-丙氨酸的代谢产物,例如泛酸盐检测的活性。例如,含有编码具有丙氨酸2,3-氨基变位酶活性的多肽的外源核酸分子的细胞可具有比活性为每小时每克干细胞重形成的β-丙氨酸大于1μg(例如每小时每克干细胞重形成的β-丙氨酸大于约10,20,30,40,50,60,70,80,90,100,125,150,200,250,300,350,400,500或更多μg)的丙氨酸2,3-氨基变位酶活性。或者,细胞可具有的丙氨酸2,3-氨基变位酶活性使细胞提取物可具有每分钟每毫克总蛋白形成的β-丙氨酸大于约1ng的比活性(例如每分钟每毫克总蛋白形成的β-丙氨酸大于约10,20,30,40,50,60,70,80,90,100,125,150,200,250,300,350,400,500或更多ng)。
可使用本发明中的任意方法鉴定和获得编码具有酶活性的多肽的核酸分子。例如,可使用常规的分子克隆或化学核酸合成方法和技术,包括PCR来鉴定和获得编码具有酶活性多肽的核酸分子。此外,也可使用标准核酸测序技术和基于遗传密码将核酸序列翻译成氨基酸序列的软件程序来确定,特定的核酸是否具有与公知的具有酶活性的多肽任意的同源性。可使用诸如MEGALIGN(DNASTAR,Madison,WI,1997)的序列比对软件对不同的序列进行比对。
此外,可使用常规的分子克隆技术(例如位点定向突变)对编码已知具有酶活性多肽的核酸分子进行突变。可能的突变包括,但不限于,缺失,插入,和取代,以及缺失,插入和核苷酸取代的组合。而且,可使用核酸和氨基酸数据库(例如,GenBank或EMBL)来鉴定编码具有酶活性多肽的核酸序列。简言之,与具有酶活性的多肽具有一些同源性的任意氨基酸序列,或与编码具有酶活性的多肽的序列具有一些同源性的任意核酸序列都可用作检索项在GenBank中进行检索。随后可对鉴定的多肽进行分析从而确定其是否表现出了酶活性。
此外,可使用核酸杂交技术来鉴定和获得编码具有酶活性的多肽的核酸分子。简言之,任意编码已知酶活性多肽的核酸分子,或其片段,都可用作探针从而在温和至严谨条件下通过杂交鉴定类似的核酸分子。然后可将这些类似的核酸分子分离,测序,并进行分析从而确定所编码的多肽是否具有酶活性。
还可使用表达克隆技术来鉴定和获得编码具有酶活性的多肽的核酸分子。例如,可使用公知与特定酶活性多肽相互作用的底物来筛选含有该酶活性多肽的噬菌体显示文库。噬菌体显示文库的制备可参见(Burritt等人,Anal.Biochem.2381-13,1990),或可通过从诸如Novagen(Madison,WI)的供应商处获得。
此外,也可使用多肽测序技术来鉴定和获得编码具有酶活性多肽的核酸分子。例如,可通过凝胶电泳对纯化的多肽进行分离,并通过例如,氨基酸微测序技术测定其氨基酸序列。一旦完成测定,可使用所述氨基酸序列设计简并寡核苷酸引物。可使用简并寡核苷酸引物,通过PCR获得编码所述多肽的核酸。一旦得到,可对所述核酸进行测序,克隆入适当的表达载体,并导入微生物中。
可使用任意方法将外源核酸分子导入细胞。例如,热击,脂质体转染,电穿孔,结合,原生质体融合以及基因枪递送是向细菌和酵母细胞中导入核酸的常见方法(例如,参见Ito等人,J.Bacterol.153163-8,1983;Durrens等人,Curr.Genet.187-12,1990;Sambrook等人,Molecular cloningA laboratory manual,Cold Spring Harbour LaboratoryPress,New York,USA,second edition,1989;和Becker and Guarente,Methods in Enzymology 194182-7,1991)。其他表达来自外源核酸分子的氨基酸序列的方法包括,但不限于,构建核酸,从而使得调节元件能够启动编码该多肽的核酸序列的表达。通常,调节元件是在转录水平调节其他DNA序列表达的DNA序列。因此,调节元件包括,但不限于,启动子,增强子等。可使用任意类型的启动子来表达来自外源核酸分子的氨基酸序列。启动子的示例包括,但不限于,组成型启动子,组织特异型启动子,和响应或不响应于特殊刺激(例如,光,氧气,化学浓度)的启动子。向哺乳动物细胞转移核酸的方法也是公知的,例如使用病毒载体。
包含于本发明特定细胞内的外源核酸分子可以任意形式维持于该细胞中。例如,外源核酸分子可整合入该细胞的基因组或以游离体状态维持。换言之,细胞可以是稳定的或瞬时的转化子。微生物可含有单个或多个拷贝(例如约5,10,20,35,50,75,100或150拷贝)的特定外源核酸分子,例如编码酶的核酸。
由宿主细胞制备有机酸和相关产物可使用本发明提供的核酸和氨基酸序列以及细胞来制备β-丙氨酸,泛酸盐和3-HP,及其衍生物,例如CoA,和有机物,例如1,3-丙二醇,3-HP的酯,和聚合的3-HP。这些细胞可来自于任意物种,例如那些在NIH分类网页上所列出的物种。这些细胞可以是真核或原核的。例如,遗传修饰的细胞可以是哺乳动物细胞(例如人,鼠和牛细胞)植物细胞(例如玉米,小麦,水稻和大豆细胞),真菌细胞(例如曲霉和根霉细胞),酵母细胞,或细菌细胞(例如,乳杆菌(Lactobacillus),乳球菌(Lactococcus),芽孢杆菌,埃希氏肠杆菌,和梭菌细胞)。在一个实施例中,细胞是微生物。术语“微生物”是指任意的显微生物体,包括,但不限于,细菌,藻类,真菌和原生动物。因此,大肠杆菌,枯草芽孢杆菌,地衣芽孢杆菌(B.licheniformis),啤酒酵母(S.cerevisiae),乳酸克鲁维酵母(Kluveromyces lactis),Candida blankii,铁红假丝酵母(Candida rugosa)和巴斯德毕赤酵母(Pichia pastoris)是示例性的微生物,并可进行如本发明所述的使用。在另一个实施例中,所述细胞是诸如植物,例如转基因植物的较大生物体的一部分。可从β-丙氨酸制备3-HP,泛酸盐,或其他有机物的植物示例包括,但不限于,遗传工程化的植物作物,例如玉米,水稻,小麦和大豆。
在一个实施例中,可对细胞进行遗传修饰从而获得特定的有机物。在一个实施方案中,细胞可从β-丙氨酸如图1和3所示途径制备3-HP或泛酸盐。在又一个实施例中,所述细胞可制备3-HP或泛酸盐的衍生物,例如CoA,和其他有机物,例如1,3-丙二醇,3-HP的酯,和聚合的3-HP。
可进行遗传修饰来合成特定有机物的细胞可包括一个或多个编码具有特定酶活性的多肽的核酸分子。例如,微生物可含有编码具有3-β-丙氨酸/2-酮戊二酸盐氨基转移酶活性的外源核酸。在这种情况下,β-丙氨酸可被转化成2-氧基丙酸盐,其可导致3-HP的产生。细胞可被给予编码具有酶活性多肽的外源核酸分子,所述酶活性可催化产生通常该细胞不能生成的化合物。或者,细胞可被给予编码具有酶活性多肽的外源核酸分子,所述酶活性可催化产生通常该细胞可以生成的化合物。在这种情况下,与没有进行遗传修饰的类似细胞相比,所述遗传修饰的细胞可生成更多的所述化合物,或可更有效地生成所述化合物。
在另一个实施例中,公开了含有编码具有酶活性多肽的外源核酸分子,其可形成3-HP,泛酸盐,或其衍生物。所产生的产物可从细胞中分泌出来,从而免除了破坏细胞膜来回收所述有机物。在一个实施例中,所述细胞可产生3-HP,泛酸盐,或其衍生物,其产物的浓度为至少约100mg/L(例如,至少约1g/L,5g/L,10g/L,25g/L,50g/L,75g/L,80g/L,90g/L,100g/L或120g/L)。当对特定细胞所产生的诸如3-HP,泛酸盐,和/或其衍生物的化合物产量进行确定时,可以使用任意的方法(例如,参见Applied Environmental Microbiology59(12)4261-5,1993)。本发明范围内的细胞可利用多种碳源。
细胞可含有一个或多个编码具有酶活性多肽的外源核酸分子,其可形成3-HP,泛酸盐,及其衍生物,例如CoA,1,3-丙二醇,3-HP酯,和含有3-HP的聚合物和共聚物。鉴定细胞含有外源核酸分子的方法是公知的。这些方法包括,但不限于,PCR和核酸杂交技术,例如Northern和Southern分析(参见本发明书中的杂交)。还可以使用免疫组织化学和生物化学技术,通过检测由特定核酸分子编码多肽的表达,来确定细胞是否含有特定的核酸分子。例如,可使用对多肽具有特异性的抗体来测定特定的细胞是否含有编码所述多肽的核酸。此外,可以使用生物化学技术,通过检测所产生的有机物是具有酶活性多肽表达的结果,来测定细胞是否含有编码具有酶活性多肽的特定核酸分子。例如,向通常不表达所述多肽的细胞中导入编码具有3-羟丙酸盐脱氢酶活性多肽的外源核酸之后,所测定的3-HP说明了,所述细胞不仅含有了导入的外源核酸分子,而且还表达了由所导入外源核酸分子编码的多肽。测定特异性酶活性或特异性有机物存在的方法是公知的,例如,对诸如3-HP的有机物存在的测定可参见Sullivan and Clarke (J.Assoc.Offic.Agr.Chemists,38514-8,1955)。
具有降低多肽活性的细胞本发明公开了具有降低多肽活性的遗传修饰的细胞。关于细胞和特定多肽活性,在此使用的的术语“降低”或“下降”是指与相同种属可比较细胞相比,所测定的活性水平降低。例如,如果可比较的微生物具有至少一些酶活性X,那么缺乏酶活性X的特定微生物就具有降低的酶活性X。
细胞可具有任意类型降低的多肽活性,包括,但不限于,酶,转录因子,转运因子(transporter),受体,信号分子等。例如,细胞可含有这样的外源核酸分子,该分子可破坏具有panD活性多肽的调节和编码序列。破坏panD可阻止细胞生成β-丙氨酸。
降低的多肽活性还可以是降低的多肽浓度,降低的多肽特异活性或其组合的结果。可使用许多不同的方法使得细胞具有降低的多肽活性。例如,可使用常规的突变或敲除技术对细胞进行工程化,从而使其具有破坏的调节序列或多肽编码序列。(Methods in Yeast Genetics(1997 edition),Adams,Gottschling,Kaiser,and Sterns,Cold SpringHarbor Press,1998;Datsenko and Wanner,Proc.Natl.Acad.Sci.USA 976640-5,2000)。或者,可使用反义技术来降低特定多肽的活性。例如,可对细胞进行工程化,从而使其含有编码能够抑制多肽翻译的反义分子。术语“反义分子”包括任意的核酸分子或核酸类似物(例如多肽核酸),其含有对应于内源多肽编码链的序列。反义分子还可具有侧翼序列(例如调节序列)。因此,反义分子可以是核酶或反义寡核苷酸。核酶可具有任意的常规结构,包括,但不限于,发卡,锤头,或斧头结构,从而提供剪切RNA的分子。此外,还可使用基因沉默来降低特定多肽的活性。
可使用任意方法鉴定具有降低多肽活性的细胞。例如,可使用本发明所述的那些酶活性分析方法来鉴定具有降低的酶活性的细胞。
通过体外技术制备有机酸和相关产物可单独使用具有酶活性的纯化多肽或与细胞组合使用来制备泛酸盐,3-HP,或其衍生物,例如CoA,和有机物,例如1,3-丙二醇,3-HP的酯,和聚合的3-HP。例如,可使用包括具有3-羟丙酸盐脱氢酶活性的基本上纯的多肽制剂来催化3-HP的形成。
此外,可单独使用含有酶活性多肽的无细胞提取物或与纯化多肽或细胞组合,来制备3-HP,或其衍生物。例如,可使用包括具有丙氨酸2,3-氨基变位酶活性多肽的无细胞提取物来从α-丙氨酸形成β-丙氨酸,而使用具有催化从β-丙氨酸形成3-HP反应所必须酶活性多肽的微生物来从β-丙氨酸制备3-HP。在其他实施例中,可使用含有α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1)的无细胞提取物来从β-丙氨酸形成泛酸盐。可使用任意的方法制备无细胞提取物。例如,可使用渗透打击,超声波,或过滤后反复冻融和/或离心来从完整的细胞制备无细胞提取物。
可使用细胞,纯化的多肽,或无细胞提取物来制备3-HP,其随后,被化学处理以制备其他化合物。例如,可使用微生物来制备3-HP,而使用化学方法将3-HP修饰成衍生物,例如聚合的3-HP或3-HP的酯。类似的,可使用化学方法来制备特定的化合物,随后,使用本发明的细胞,基本上纯的多肽或无细胞提取物将其转化为3-HP或其他有机物(例如1,3-丙二醇,丙烯酸,聚丙烯酸酯,丙烯酸酯,3-HP的酯,和聚合3-HP)。例如,可使用化学方法来制备丙烯酰-CoA,而可使用微生物将丙烯酰-CoA转化为3-HP。
类似的,可使用细胞,纯化的多肽,或无细胞提取物来制备泛酸盐,其随后,被化学处理生成其他化合物。例如,可使用微生物制备泛酸盐,而使用化学方法将泛酸盐修饰成诸如CoA的衍生物。类似的,可使用化学方法来制备特定的化合物,随后,使用本发明的细胞,基本上纯的多肽,或无细胞提取物将其转化为泛酸盐或其他化合物(例如CoA)。例如,可使用化学方法制备泛酸盐,而使用微生物将泛酸转化为CoA。
产生有机酸的细胞的发酵本发明公开了通过在培养基中培养制备细胞,例如微生物,产生泛酸盐,3-HP,或其衍生物来制备泛酸盐,3-HP,或其衍生物的方法。通常,培养基和培养条件是使所述微生物生长至足够密度并有效产生所述产物的培养基和培养条件。对大规模制备方法而言,可使用在别处描述的任意方法(Manual of Industrial Microbiology andBiotechnology,2nd Edition,EditorsDemain and Davies,ASM Press;and Principles of Fermentation Technology,Stanbury and Whitaker,Pergamon)。
简言之,向含有适当培养基,例如,葡萄糖碳源的大罐(例如100加仑,200加仑,500加仑或更大的罐)中接种特定的微生物。接种后,对微生物进行孵育从而允许生产生物质。一旦达到所需要的生物质,可将含有所述微生物的肉汤转移至第二个罐中。第二个罐可具有任意尺寸。例如,第二个罐可以大于,小于,或与第一个罐具有相同的尺寸。通常,第二个罐比第一个要大,从而可向来自第一个罐的肉汤中加入额外的培养基。此外,在第二个罐内的培养基可以与用于第一个罐中的培养基相同或不同。例如,第一个罐可包含具有木糖的培养基,而第二个罐则可包含具有葡萄糖的培养基。
一旦转移完成,可对微生物进行孵育从而允许产生泛酸盐,3-HP或其衍生物。一旦产生完成,可使用任意方法分离所形成的产物。例如,可使用常见的分离技术从肉汤中除去所述生物质,并可使用常见的分离方法(例如,提取,蒸馏,和离子交换方法)从无微生物的肉汤中获得泛酸盐,3-HP,或其衍生物。或者,可以在其产生时就对产物进行分离,或可在产物生成阶段完成之后再从肉汤中分离产物。
从公开的生物合成途径制备的产物可将从图1和图3所提供的任意步骤制备的化合物化学转变为其他有机化合物。例如,可将3-HP脱氢形成1,3-丙二醇,其是一种有价值的聚酯单体。可使用任意方法对诸如3-HP的有机酸进行氢化,就像那些用于对琥珀酸或乳酸进行氢化的方法。例如,可使用金属催化剂对3-HP进行氢化。在其他实施例中,3-HP可被氢化形成丙烯酸。可使用任意的方法实施氢化反应。例如,可在存在催化剂(例如金属或无机酸催化剂)的条件下加热3-HP形成丙烯酸。还可在体外或体内使用具有氧化还原酶活性(例如EC 1.1.1.-类的酶)的多肽生成1,3-丙二醇。
在其他实施例中,可使用泛酸盐形成辅酶A。可使用具有泛酸盐激酶(E.C.2.7.1.33),4′-磷酸羟泛酰基-1-半胱氨酸合成酶(E.C.6.3.2.5),4′-磷酸泛酰半胱氨酸脱羧酶(E.C.4.1.1.36),ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶(E.C.2.7.7.3),和脱磷-CoA激酶(E.C.2.7.1.24)活性的多肽制备辅酶A。
1,3-丙二醇的制备本发明公开了制备1,3-丙二醇的方法和用于此种制备的细胞。可从3-HP-CoA或3-HP制备1,3-丙二醇。可对制备3-HP-CoA或3-HP的细胞或微生物进行工程化,通过克隆编码具有氧化还原酶/脱氢酶类活性酶的基因来制备1,3-丙二醇。
例如,可在存在具有乙酰醛NAD(+)氧化还原酶和醇NAD(+)氧化还原酶活性酶的条件下将3-HP-CoA转化成1,3-丙二醇。这些转化可在体内,体外或其组合条件下进行。可通过单种多肽或两种不同的多肽来实现这些活性。单种酶包括来自于大肠杆菌的多功能醛-醇脱氢酶(EC 1.2.1.10)(Goodlove等人基因85209-14,1989;GenBank AccessionNo.M33504)。还描述了具有单种乙酰醛NAD(+)氧化还原酶(EC1.2.1.10)或醇NAD(+)氧化还原酶活性酶(EC 1.1.1.1)活性的酶。已经分离和测序了编码来自大肠杆菌的乙酰醛脱氢酶(GenBank AccessionNo.Y09555)和来自运动发酵单胞菌(Z.mobilis)的醇脱氢酶(GenBankAccession No.M32100)的基因。可通过公知的分子生物学技术,将编码这些酶的基因克隆入产生3-HP-CoA的有机体或细胞中。这些酶在产生3-HP-CoA的生物体或细胞中的表达可以发挥将3-HP-CoA转化为1,3-丙二醇的能力。可使用公知的技术,例如倾向错误的PCR或突变大肠杆菌菌株来改变或改善这些酶对于3-HP-CoA的底物特异性。
可通过将3-HP与具有醛脱氢酶(NAD(P)+)(EC 1.2.1.-)和醇脱氢酶(EC 1.1.1.1)活性的酶接触来实现3-HP向1,3-丙二醇的转化。这样的转化可以在体内,体外,或其组合的条件下完成。例如,这些基因在产生3-HP微生物或细胞中的克隆和表达可以发挥所述细胞或微生物将3-HP转化为1,3-丙二醇的活性。可使用如上所述的公知技术来改变或改善这些酶对于3-HP的底物特异性。
可使用高效液相色谱(HPLC)对发酵过程或体外化验中的1,3-丙二醇形成进行分析。可使用Bio-Rad 87H离子交换柱完成色谱分离。以0.6ml/分钟的流速通过0.01N硫酸的流动相,并将柱子的温度保持在45-65℃。可使用折射率探测器测定样本中1,3-丙二醇的存在(Skraly等人,Appl.Environ.Microbiol.6498-105,1998)。
实施例1对具核梭杆菌(Fusobacterium nucleatum)赖氨酸2,3-氨基变位酶(kam基因)的克隆和密码子改进本实施例描述了用于从具核梭杆菌中克隆赖氨酸2,3-氨基变位酶(E.C.5.4.3.2),并随后对在大肠杆菌中表达基因的密码子使用进行优化的方法。本领域所属人数人员应该理解,类似的方法可用于从任意希望的生物体中克隆赖氨酸2,3-氨基变位酶。
具核梭杆菌赖氨酸2,3-氨基变位酶对赖氨酸具有较高的专一活性(Barker等人J.Bacteriol.152(1)201-7,1982)。具核梭杆菌可将赖氨酸作为唯一碳源和氮源加以利用,因而需要赖氨酸降解途径中的酶具有较高的活性。为了克隆编码赖氨酸2,3-氨基变位酶的具核梭杆菌kam基因,可使用以下方法。在ATCC培养基1053中(加强的梭菌培养基)扩增具核梭杆菌具核亚种(American Type Culture Collection,Manassas,VA,catalog number ATCC 25586)。通过在Coy厌氧舱中向所述培养基中通入厌氧气体来制备培养基(85%N2,5%CO2,10%H2)。在密闭的厌氧管中在37℃进行培养。收集10ml培养物,并使用Mekalanos的方法分离基因组DNA(Cell 35(1)-253-63,1983)。
用于通过PCR扩增kam基因的引物是基于完整的具核梭杆菌基因组序列(GenBank Accession NoNC 003454),还加上了限制性位点从而允许将所述PCR产物克隆入质粒中。使用PCR引物CCGGCCCATATGAATACAGTTAATACTAG(SEQ ID NO7)和CGCCGCGGATCCTTATTTAAACAATCTCTCCCTGTCG(SEQ ID NO8)来克隆入载体pET11A(Novagen)的NdeI和BamHI位点。克隆的具核梭杆菌kam基因如SEQ ID NO9所示(其对应的氨基酸序列如SEQID NO10所示)。
为了在大肠杆菌中具有改善的表达,对具核梭杆菌kam基因进行了部分密码子优化。通过使用含有对精氨酸更优选密码子的引物,在扩增反应中通过整合替换了稀有的精氨酸密码子。两轮引物整合得到了变化密码子被替换的克隆。对两条DNA链所设计的引物长度为22-23个核苷酸,且在该引物中部具有一个或两个密码子替换。精氨酸的密码子AGG,AGA和CGA变为CGT或CGC。为使得密码子优化最大化,可使用来自三个不同克隆的模板,和最小化扩增错误的校对DNA聚合酶来扩增kam基因的重叠片段。将所述片段凝胶纯化,并作为模板与该基因头尾同源的引物一起用于第二轮扩增。
在第二轮装配中,对最优化克隆的三个重叠片段进行扩增,从而确保用作扩增引物的引物实现了引物的整合。将所述片段凝胶纯化,并作为模板与该基因头尾同源的引物一起用于第二轮扩增。使用针对这些引物所设计的限制性位点,将所述产物克隆入pET11载体(Novagen)和pPRO-Nde。质粒pPRO-Nde是pPROLar.A122((Clontech Laboratones,Inc.,Palo Alto,CA)的衍生物,其中使用Stratagene的QuikChangeSite-Directed Mutagenesis试剂盒通过寡核苷酸定向的突变在起始ATG密码子上构建了NdeI位点。在装配克隆中,稀有精氨酸的密码子从28个降低至8个。部分优化的具核梭杆菌kam基因如SEQ ID NO11所示(其对应的氨基酸序列如SEQ ID NO12所示)。
本领域所属技术人员应该理解也可以使用其他的密码子优化方法,例如使用重叠引物或多位点定向突变(Stratagene)的基因装配。
实施例2具核梭杆菌kam基因的体外突变本实施例描述了用于对实施例1中所述部分优化具核梭杆菌kam基因(SEQ ID NO11)进行突变,从而鉴定具有丙氨酸2,3-氨基变位酶活性的突变体赖氨酸2,3-氨基变位酶序列的方法。
通过定向的突变,将之前在枯草芽孢杆菌(Bacillus subtilis)氨基变位酶(参见WO 03/062173和SEQ ID NOS1-4)中获得的3个突变转移给了在具核梭杆菌密码子优化kam基因的同源位点。这些突变包括在SEQ ID NO12(其导致了如SEQ ID NO14所示序列)中的L96M,M129V和D332H取代,其中第一个氨基酸是野生型序列,该数字是氨基酸的位点,而第二个氨基酸则是在丙氨酸2,3-氨基变位酶中观察到的残基。可使用Stratagene QuikChangeMulti Site-Directed Mutagenesis试剂盒(Stratagene)产生这些突变。用于产生这些突变的引物是FnL96M5′Phos/CATCAATCTGATGCTGATATGTTGGATCCTCTACATGAAG(SEQ ID NO15);FnM129V5′Phos/AACAGACATGTGTTCTGTATACTGTCGCCACTGCACTC(SEQ ID NO16);和FnD332H5′Phos/GTACCAACATTTGTTGTGCATGCACCTGGTGGTG(SEQ IDNO17)。具有三个定向突变(Fncodm)的部分密码子优化具核梭杆菌kam基因序列如SEQ ID NO.13所示(而所得的蛋白质序列如SEQ IDNO14所示)。
在液体生长检测中对所得的Fncodm克隆进行检测。将重悬的克隆用于接种2ml玻璃管中的含有和不含有泛酸盐(25μM)的1.4ml M9基本培养基。向培养基中添加0.4%葡萄糖,2mg/ml L-丙氨酸,100μMIPTG,50μM Fe(NH4)2(SO4)2,痕量元素,和25μg/mL卡那霉素。当泛酸盐对照达到OD600为约0.7时,读取培养物的OD。通过比较无泛酸盐的生长情况和有泛酸盐的生长情况来测定表现,发现Fncodm几乎没有或没有丙氨酸2,3-氨基变位酶活性。
为了鉴定提高丙氨酸2,3氨基变位酶活性的突变,使用倾向错误的PCR方法在体外向Fncodm基因(SEQ ID NO13)中引入随机突变。可使用类似的方法向编码赖氨酸2,3氨基变位酶的任意kam基因,例如来自耐辐射奇球菌(Deinococcus radiodurans)(GenBank Accession NoRDR02336),近端梭菌(Clostridium subterminale)(GenBank AccessionNoAF159146)或牙龈卟啉单胞菌(Porphyromonas gingivalis)(不完全基因组,The Institute for Genomic Research)的kam基因中引入突变。
诱变PCR是根据Cadwell和Joyce(PCR Methods Appl.228-33,1992)的方法进行的。该方法使用了多种诱变缓冲液的稀释液,所述缓冲液含有21.2mM MgCl2,2.0mM MnCl2,3.2mM dTTP和3.2mM dCTP。除了含有1.5mM MgCl2,0.25μM正向和反向载体引物,200μM的各种dNTP,5ng的pPRO-Fncodm模板DNA,和10单位TaqDNA聚合酶(Roche)的1X Taq PCR缓冲液,还向各个PCR反应中加入6.25和9.38μL诱变缓冲液。PCR程序包括94℃ 2分钟的起始变性;30个循环的94℃30秒,50℃1分钟,和72℃2.25分钟;和72℃7分钟的最终延伸。
PCR完成之后,用限制性酶NotI和NdeI消化所述PCR产物。将每个处理的等量DNA连接于载体pPRO-Nde,并转化大肠杆菌ElectromaxTMDH10BTM细胞。从单克隆提取质粒DNA并测序从而获得对突变率的估计(0.57%)。将多次转化涂布于含有25μg/ml卡那霉素(LKB25)的LB平板获得约53,000个克隆。从平板上刮下克隆,并使用Qiagen MiniSpin Plasmid方法制备质粒DNA。在对选定宿主进行转化之前,使用乙酸胺和乙醇沉淀质粒DNA从而增加其浓度。
实施例3具有丙氨酸2,3-氨基变位酶活性的克隆的鉴定本实施例描述了用于鉴定具有丙氨酸2,3-氨基变位酶活性的突变赖氨酸2,3-氨基变位酶克隆的方法。
之前已公开了鉴定具有丙氨酸2,3-氨基变位酶活性细胞的方法(参见WO 03/062173,在此将其全文引用作为参考)。简言之,该方法包括在不含有β-丙氨酸或泛酸盐的培养基中培养功能性缺失panD的细胞。PanD基因编码天冬氨酸盐脱羧酶,其催化天冬氨酸向β-丙氨酸的生产。大肠杆菌中panD的功能性缺失使得天冬氨酸盐脱羧酶失活,从而导致了在制备辅酶A中由于对β-丙氨酸的需求而导致的大肠杆菌生长抑制。能够在缺乏β-丙氨酸和泛酸盐培养基中生长的细胞说明,其可以从α-丙氨酸制备β-丙氨酸,其说明了该细胞具有丙氨酸2,3-氨基变位酶活性。
将在实施例2中产生的突变Fncodm文库转化大肠杆菌ΔpanDCAT菌株的电击感受态细胞(参见WO 03/062173和本说明书中的实施例10)。一小时之后在SOC培养基中回收转化子,然后加入100μM IPTG和25μg/ml卡那霉素,再生长3小时。然后将细胞离心,用0.85%NaCl洗涤,并重悬于添加了0.4%葡萄糖,100μM IPTG,50μMFe(NH4)2(SO4)2,2mg/mlα-L-丙氨酸,痕量元素,和25μg/mL卡那霉素(Sigma,St.Louis,MO)的500μL M9基本培养基中。用30μL重悬细胞接种2ml玻璃管中的1.33ml M9培养基。6天之后,将生长的培养物接种液体LBK25培养基。生长5.5小时后,提取质粒DNA,并用其转化ΔpanDCAT菌株的新鲜感受态细胞。生长细胞的再次转化减少了能够由于宿主基因组中产生的突变而生长的突变体数,并确保了所述生长是由于具有质粒的效果。
一小时之后在SOC培养基中回收转化子,用0.85%NaCl洗涤,并重悬于1ml NaCl中。对LBK25培养平板进行菌落计数,并将剩余的重悬液(保存于4℃)涂布于LBK25平板从而获得每平板约250个克隆。将单个的克隆接种于LBK25和M9基本培养基。使用2ml管中的1.4ml M9基本培养基(如上所述),在液体生长检测中对在M9培养基中生长旺盛的克隆进行检测。使用重悬的克隆来接种含有和不含有泛酸盐(25μM)的培养基。当泛酸盐对照达到OD600为约0.7时,读取培养物的OD。根据在没有泛酸盐中的生长比率高于在含有泛酸盐中的生长比率来鉴定克隆。使用标准分子生物学方法对生长旺盛克隆的质粒DNA进行测序。观察到所有的克隆都具有相同的序列(SEQ ID NO18,而对应的氨基酸序列如SEQ ID NO19所示)。
编码丙氨酸2,3-氨基变位酶(Fnnam)的突变具核梭杆菌kam基因序列如SEQ ID NO.18所示,而相应的氨基酸序列如SEQ ID NO14所示。除了在实施例2种产生的3个定向突变,与具核梭杆菌kam基因序列(图4)相比,在突变的序列中还观察到了6个氨基酸改变。这些额外的取代是E31K,Y64F,Q87R,D145G,L229M和K401E。然而,所有这些突变都不是丙氨酸2,3-氨基变位酶活性所必须的。
将Fnaanm突变体的质粒DNA作为模板,可根据以上描述构建第二轮诱变文库。因为起始克隆现已具有丙氨酸2,3-氨基变位酶活性,所以选择就更加依赖于液体富集技术而不是在固体培养板上涂布。采用液体富集,可以使用ΔpanD/ΔpanF选择宿主。panF基因编码泛酸通透酶,其能够允许泛酸的浓缩性摄取。PanF缺失突变体的使用防止了失活克隆与具有活性丙氨酸2,3-氨基变位酶所产生泛酸盐之间的可能交叉给料。将由约48,000克隆的DNA组成诱变文库用于转化ΔpanD/ΔpanF大肠杆菌BW25113菌株。使用一半的回收物来接种30mlM9基本培养基,其中添加了0.4%葡萄糖,100μM IPTG,20μM柠檬酸铁,2mg/ml α-L-丙氨酸,痕量元素,和25μg/mL卡那霉素。将培养基放置于50ml管中,并不时地混合。8天后可见良好的生长,并在M9基本培养基上划线。
如上所述在液体生长检测中检测菌落,其表现比ΔpanD/ΔpanF菌株中的Fnaam突变体约好4倍。对新突变体的质粒DNA进行测序,并将其用来重新转化ΔpanD菌株。对重新转化子的液体生长检测确认了所述生长优势是由所述质粒所赋予的。在这种具核梭杆菌丙氨酸2,3-氨基变位酶(Fnaam2,SEQ ID NO21)中还有两处额外的氨基酸取代(K37E和D180N)。所述DNA序列如SEQ ID NO20所示。改进的突变体以0.5mg/ml的α-L-丙氨酸在液体生长检测中比Fnaam突变体的表现好约3倍。
实施例4斯氏梭菌(Clostridium sticklandii)赖氨酸2,3-氨基变位酶的克隆和密码子改进本实施例描述了用于克隆斯氏梭菌(Clostridium sticklandii)赖氨酸2,3-氨基变位酶的方法,以及对在大肠杆菌中表达的密码子进行优化的方法。虽然对涉及斯氏梭菌赖氨酸2,3和赖氨酸5,6-氨基变位酶的赖氨酸降解途径已有描述,但该基因序列依然未知。
在ATCC培养基1053中对斯氏梭菌(ATCC 12662)进行扩增,并根据对具核梭杆菌的描述提取基因组DNA。根据公知赖氨酸2,3-氨基变位酶基因的保守蛋白区设计了三条简并正向PCR引物(F15′-YTWAGAATGGCWATWACWCC-3′(SEQ ID NO22);F25′-AGAAARCARGCWATWCCWAC-3′(SEQ ID NO23);和F35′-GGWYTWACWCAYAGATAYCC-3′(SEQ ID NO24));和三条简并反向PCR引物(R15′-TAWGTWGTWATWACWCCYTC-3′(SEQ IDNO25);R25′-TCWACWACRAAWGTWGGWAC-3′(SEQ ID NO26);和R35′-CCWCCWCCWGGWGCRTCWAC-3′(SEQ ID NO27))。使用了斯氏梭菌密码子偏好表从蛋白序列设计引物。
所述引物被用于全部逻辑组合的PCR中,这些PCR使用了Taq聚合酶和1ng斯氏梭菌基因组DNA/μL反应混合物。使用降落(touchdown)PCR程序进行PCR,该程序包括4个循环56℃退火,4个循环54℃,4个循环52℃,和20个循环50℃。每个循环都使用在94℃的起始45秒变性步骤和在72℃的两分钟延伸,以及在72℃ 5分钟的最终延伸。由于在所述引物3’末端的简并性,在反应中使用的PCR引物的量比常规的PCR引物量增加了3倍。此外,可以使用含有每一种引物的单独PCR反应来鉴定从单种简并引物中得到的PCR产物。
将25μL的各种PCR产物进行1.5%琼脂糖凝胶分离。引物组合F1-R1(950bp),F1-R3(900bp)和F3-R3(730bp)产生了较强的条带,其具有根据其他物种基因所得的大约预期大小。引物组合F3-R1(800bp),F1-R2(900bp)和F3-R2(750bp)产生了较弱的条带。未观察到F2-R1,F2-R2,F2-R3引物组合或其他单独引物对照获得的条带。使用QiagenGel Extraction方法(Qiagen Inc.,Valencia,CA)提取和纯化了F1-R1和F1-R3片段。将4μl纯化条带连接入TOPO 4.0载体,并使用TOPO克隆方法(Invitrogen,Carlsbad,CA)通过热击法转化入TOP10大肠杆菌细胞。将转化物涂布于含有100μg/ml氨苄青霉素和50μg/ml X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)的LB平板上。将单独的、白色的菌落放置于小量缓冲液中,并将等分试样用于启动5ml用于提取质粒DNA的培养液。将剩余物在95℃加热10分钟,并使用2μL进行PCR反应从而确认所希望插入的存在。使用QiaPrep Spin Miniprep试剂盒,从具有所希望插入的多个克隆中获得质粒DNA。用M13R和M13F引物对F1-R1克隆的插入进行测序。序列分析说明这一片段与已知的赖氨酸2,3-氨基变位酶同源。
基因组步行来获得完整的编码序列使用从上述F1-R1片段获得的序列,避免了对应于简并引物的区域,设计出了上游和下游方向的用于基因组步行的引物。引物序列为用于GSP1F的5′-CCTTTCAGTTGAATTGAGCACTTTAGAAC-3′(SEQ ID NO28),用于GSP2F的5′-GATACTGCGTTCCTACATTTGTTGTGGATG-3′(SEQ ID NO29),用于GSP1R的5′-CGCTGCTCTATG TAGCTCTAAAGAAAGAG-S′(SEQ ID NO30),和用于GSP2R的5′-CAGCTTGCTTTCTTACAGGGTCATTTGG-3′(SEQ ID NO31),其中GSP1F和GSP2F是朝向下游的引物,GSP1R和GSP2R是朝向上游的引物,而GSP2F和GSP2R则分别是位于GSP1F和GSP1R内部的巢式引物。除了限制酶使用Hinc II,Ssp I,EcoR V,Pvu II和Dra I,可根据Clontech′s Universal Genome Walking试剂盒(ClonTech Laboratories,Inc.,Palo Alto,CA)的操作手册进行染色体步行。
在Perkin Elmer 9700热循环仪上进行第一轮PCR,条件为94℃起始变性15秒;7个循环的94℃5秒和70℃3分钟;32个循环的94℃5秒和65℃3分钟,以及65℃4分钟的最终延伸。第二轮PCR的条件为94℃起始变性15秒;5个循环的94℃5秒和70℃3分钟;26个循环的94℃5秒和65℃3分钟,以及65℃4分钟的最终延伸。
将20μL各轮次的PCR产物在1.5%琼脂糖凝胶上进行电泳分离。采用Ssp I,EcoR V,Pvu II和Dra I文库的正向引物和采用Ssp I,HincII,Pvu II和Dra I文库的反向引物获得了扩增产物。如上所述,对使用Dra I正向反应(1.2kb)和Hinc II反向反应(1.3kb)的第二轮产物进行凝胶纯化,克隆和插入大小的筛选。用M13R和M13F引物对具有所希望插入大小的多个克隆的质粒DNA进行测序。将该序列与原始基因片段的序列进行比对,从而确定所述斯氏梭菌赖氨酸2,3-氨基变位酶同源物的全序列。然后使用PCR扩增从基因组DNA中将全基因重新克隆入载体中。诸如斯氏梭菌kam基因(SEQ ID NO32,其对应的蛋白质序列如SEQ ID NO33所示)的新基因可用作突变的起始模板,从而获得丙氨酸2,3-氨基变位酶活性。
对如SEQ ID NO32所示的斯氏梭菌kam基因进行部分密码子优化以适于在大肠杆菌中的表达。如实施例2所述,通过使用含有对精氨酸更优选密码子的引物,在扩增反应中通过整合替换了稀有的精氨酸密码子。两轮引物整合之后,将所述PCR产物克隆入pPRO-Nde载体。测序说明,与含有22个稀有精氨酸密码子的野生型基因相比,最好的克隆含有8个稀有精氨酸密码子。部分优化的斯氏梭菌kam基因(Csco)如SEQ ID NO34所示(未改变的蛋白质序列如SEQ ID NO35所示)。
实施例5斯氏梭菌(Clostridium sticklandii)赖氨酸2,3-氨基变位酶(kam基因)的体外突变本实施例描述了用于对实施例4中生成的部分优化的斯氏梭菌kam基因(SEQ ID NO34)进行突变,从而鉴定具有丙氨酸2,3-氨基变位酶活性突变体的方法。
通过定向的突变,将之前在枯草芽孢杆菌,牙龈卟啉单胞菌或具核梭杆菌丙氨酸2,3-氨基变位酶(例如,参见SEQ ID NOS1-6和18-21和WO 03/062173)中获得的四种突变转移到斯氏梭菌Csco基因中(SEQID NO35)。这些突变包括E28K,L93M,M126V和D329H取代。可使用QuikChangeMulti Site-Directed Mutagenesis试剂盒(Stratagene)制备这些突变。用于制备这些突变的引物是CsE28K5′Phos/GAAATGGCAAGTAAGAAATCGTATAAAGACTGTTGAAGAACTTAA(SEQ IDNO36);CsL93M5′Phos/TCGCGCAGCGTCTGATATGGAAGACCCACTTCATG(SEQ ID NO37);CsM126V5′Phos/GACTGATCAATGTTCAGTATACTGCCGCCACTGTACTCGT(SEQ ID NO38);和CsD329H5′Phos/GTTCCTACATTTGTTGTGCATGCACCTGGTGGTG(SEQ IDNO39)。
对在Csco基因(SEQ ID NO41)中具有全部四种定向突变的四种克隆进行了如实施例2所述的液体生长检测,该检测证明了低水平的丙氨酸2,3-氨基变位酶活性。在对生长检测培养物进行亚培养之后,所述Cscodm菌株表现出比Csco母体菌株多约三倍的生长,说明了较低水平的丙氨酸2,3-氨基变位酶活性。
为了在体外向Cscodm基因(SEQ ID NO40)中引入额外的突变,如实施例2所述使用了倾向于错误的PCR方法,除了该PCR程序由94℃起始变性2分钟;30个循环的94℃30秒,55℃45秒,和72℃2.25分钟;以及72℃7分钟的最终延伸组成。
PCR完成之后,用NotI和NdeI消化PCR产物。将每个处理的等量DNA连接于载体pPRO-Nde,并转化大肠杆菌ElectromaxTMDH10BTM细胞。将多次转化涂布于LKB25平板获得约54,000个克隆。从平板上刮下克隆,并使用Qiagen MiniSpin Plasmid方法制备质粒DNA。在对选定宿主进行转化之前,使用乙酸胺和乙醇沉淀质粒DNA从而增加其浓度。
实施例6具有丙氨酸2,3-氨基变位酶活性克隆的鉴定本实施例描述了用于鉴定具有丙氨酸2,3-氨基变位酶活性的突变赖氨酸2,3-氨基变位酶克隆的方法。
将在实施例5中产生的突变Cscodm文库转化大肠杆菌BW25113的ΔpanD/ΔgabT/ΔyeiA菌株的电击感受态细胞。可制备gabT和yeiA突变,从而消除由细胞途径形成或处理β-丙氨酸。在SOC培养基中一小时之后回收转化子,离心,用0.85%NaCl洗涤,并重悬于1ml NaCl中。将一半回收物用于接种25ml M9基本培养基,其中添加了0.4%葡萄糖,100μM IPTG,20μM柠檬酸铁,2mg/ml α-L-丙氨酸,痕量元素,和25μg/mL卡那霉素(Sigma,St.Louis,MO)。
三天后,将生长的培养物在LBK培养基上划线。将单个克隆接种于LBK和M9基本培养基。使用2ml管中的1.6ml M9基本培养基(如上所述),在液体生长检测中对在M9培养基中厌氧生长旺盛的克隆进行检测。使用重悬的克隆来接种含有和不含有泛酸盐(25μM)的培养基。当泛酸盐对照达到OD600为约0.6时,读取培养物的OD。如表1所示,有三个克隆在没有泛酸盐中的生长比率高于在含有泛酸盐中的生长比率。对这三个克隆的质粒DNA进行测序,并将其用于再次转化ΔpanD菌株。对再次转化的菌株重复生长检测,从而确保所述生长优势是由所述质粒赋予的,而不是宿主效应。
表1存在斯氏梭菌丙氨酸2,3-氨基变位酶基因条件下的生长

编码丙氨酸2,3-氨基变位酶的三个突变体斯氏梭菌kam基因序列如SEQ ID NOS42,44和45所示,其对应的氨基酸序列如SEQ ID NOS43,45和47所示。除了四种定向的突变(参见SEQ ID NO41),与斯氏梭菌kam基因序列(FIG.5)相比,还在突变序列中观察到了1-4种氨基酸改变。这些突变包括S9T,V30A,C50R,L51H,E69G,Q123L,Q139R和K185R。然而,所有这些突变对获得丙氨酸2,3-氨基变位酶活性而言都不是必须的。
实施例7牙龈卟啉单胞菌(Porphyromonas gingivalis)丙氨酸2,3-氨基变位酶的体外突变可使用实施例2所述的方法,对已有描述的(WO 03/062173)牙龈卟啉单胞菌丙氨酸2,3-氨基变位酶(SEQ ID NO5,其对应蛋白质序列如SEQ ID NO6所示)进行突变PCR,除了该PCR程序由94℃起始变性2分钟;30个循环的94℃30秒,55℃1分钟,和72℃2.25分钟;以及72℃7分钟的最终延伸组成。
PCR完成之后,用NotI和NdeI消化PCR产物。将每个处理的等量DNA连接于载体pPRO-Nde,并转化大肠杆菌ElectromaxTMDH10BTM细胞。从单克隆提取质粒DNA并测序从而获得对突变率的估计。平均突变率为0.3%。将多次转化涂布于LKB25平板获得约80,000个克隆。从平板上刮下克隆,并使用Qiagen MiniSpin Plasmid方法制备质粒DNA。在对选定宿主进行转化之前,使用乙酸胺和乙醇沉淀质粒DNA从而增加其浓度。
实施例8对具有改进丙氨酸2,3氨基变位酶克隆的选择和鉴定将在实施例7中产生的突变Pgaam质粒文库转化大肠杆菌BW25113的ΔpanD菌株电击感受态细胞。一小时之后在SOC培养基中回收转化子,离心,用0.85%NaCl洗涤,并重悬于1ml NaCl中。用10μL接种1.8ml玻璃管中的1.33ml M9基本培养基,其中添加了0.4%葡萄糖,100μM IPTG,50μM Fe(NH4)2(SO4)2,2mg/ml α-L-丙氨酸,痕量元素,和25μg/mL卡那霉素(Sigma,St.Louis,MO)。三天之后,将100μL生长培养物用于接种新鲜管中的相同培养基。过夜培养之后,将培养物在M9基本培养基上划线,并放置于厌氧舱中。将生长出来的6个克隆接种于LBK,并使用2ml管中的1.4ml M9基本培养基(如上所述)进行液体生长检测。使用重悬的克隆来接种含有和不含有泛酸盐(25μM)的培养基。当泛酸盐对照达到OD600为约0.7时,读取培养物的OD。根据在没有泛酸盐中的生长比率高于在含有泛酸盐中的生长比率来鉴定克隆。
如表2所示,Pgaam2克隆在没有泛酸盐中的生长比率高于在含有泛酸盐中的生长比率。对这个克隆的质粒DNA进行测序,并将其用于再次转化ΔpanD大肠杆菌菌株。对再次转化的菌株重复生长检测,从而确保所述生长优势是由所述质粒赋予的,而不是宿主效应(表3,“再次转化的”)。
表2存在牙龈卟啉单胞菌野生型和突变丙氨酸2,3-氨基变位酶条件下的生长

在改进的牙龈卟啉单胞菌丙氨酸氨基变位酶(Pgaam2,SEQ ID NO49)中存在有E30K和I192V的氨基酸取代。其DNA序列如SEQ ID NO48所示。
为了增加Pgaam2的丙氨酸2,3-氨基变位酶活性(SEQ ID NO49),可对若干荷负电的氨基酸进行突变。因为荷负电的氨基酸可与荷正电的天然底物,赖氨酸相互作用,一些或全部负电荷的清除可以增强以丙氨酸作为底物的活性,因为其较小且不带电。可使用StratageneQuikChangeMulti Site-Directed Mutagenesis试剂盒进行定向突变,对其进行以下修饰使用50μL反应,并在Dpn I处理之后使用NH4OAc和乙醇沉淀。在用10μl水进行重悬之后,用2.5μl转化ΔpanD大肠杆菌菌株。将三分之一的转化回收物用来接种14ml管中的8ml M9基本培养基。该培养基中添加了0.4%葡萄糖,100μM IPTG,100mM MOPSpH 7.0,50μM柠檬酸铁,1mg/ml α-L-丙氨酸,痕量元素,和25μg/mL卡那霉素。生长5天后,在M9基本培养基上涂布以获得单菌落。将单菌落接种于LBK培养基,并使用2ml管中的1.4ml M9基本培养基(如上所述,1mg/ml α-L-丙氨酸)进行液体生长检测。使用重悬的克隆来接种含有和不含有泛酸盐(25μM)的培养基。当泛酸盐对照达到OD600为约0.7时,读取培养物的OD。将阳性菌落(Pgaam2L26I)的质粒DNA再次转化ΔpanD菌株,并在液体生长检测中重新检测再次转化的菌株(表3)。
表3存在牙龈卟啉单胞菌丙氨酸2,3-氨基变位酶基因条件下的生长

序列结果说明,所述突变位于突变引物之一3’末端的紧邻下游核苷酸上。因此,其可能是由于复制错误或引物合成错误导致的。改进的牙龈卟啉单胞菌丙氨酸2,3-氨基变位酶(Pgaam2 L26I)的DNA序列如SEQ ID NOS50所示,其对应的氨基酸序列如SEQ ID NOS51所示。
实施例9丙氨酸2,3-氨基变位酶活性的体外分析本实施例描述了用于确定SEQ ID NO49的丙氨酸2,3-氨基变位酶活性的方法。本领域所属技术人员应该意识到,类似的方法还可用来测定针对在此公开的任意丙氨酸2,3-氨基变位酶蛋白,例如SEQ IDNO19,21,43,45,47或51,以及保留了丙氨酸2,3-氨基变位酶活性的序列变体,片段,或融合体的丙氨酸2,3-氨基变位酶活性。
可使用制造商描述的方法,使用具有C-末端strep-tag的pASK-IBA3载体(IBA,St.Louis,MO),在大肠杆菌BL21(DE3)中表达了具有丙氨酸2,3-氨基变位酶活性的蛋白。将携带有strep-tag氨基变位酶克隆的细胞生长于Terrific Broth中,其中添加了100μg/ml氨苄青霉素和40μg/ml柠檬酸钠铁,并在OD600=1-2时用0.2μg/ml无水四环素诱导表达。将孵育温度降至25℃,并在过夜生长之后离心收集细胞。
以2ml缓冲液/g细胞沉淀的比率将细胞沉淀重悬于缓冲液(50mMHEPPS pH8,25μM磷酸吡哆醛,0.1mM α-L-丙氨酸),并将所述细胞悬液进行超声波处理(9-15W,2×1.5分钟)。将匀质的细胞悬液离心,并将可溶性的无细胞提取物(CFE)小心地倾倒出来并保存。
根据已知的Chen等人对于赖氨酸2,3-氨基变位酶进行的描述(Biochem.J.348539-549,2000),进行了丙氨酸2,3-氨基变位酶活性分析,除了该分析含有替代赖氨酸的α-L-丙氨酸。通过用0.4ml还原孵育缓冲液(4.6mL H2O,0.25mL 1M HEPPS pH8,0.05mL 100mMFe(NH4)2(SO4)2,0.05mL 50mM磷酸吡哆醛,0.05mL 100mM二硫苏糖醇;所有溶液都是在厌氧条件下制备的)处理对0.1ml CFE进行预还原,,预孵育可在37℃进行4小时。向预孵育的酶中,顺序加入厌氧制备的以下成分0.21mL H2O,0.05mL 1M HEPPS pH8,0.02mL5-10mM S-腺苷甲硫氨酸,0.02mL 100mM亚硫酸氢钠,0.2mL 500mMα-L-丙氨酸。通过与等体积的90%甲酸混合,在多个时间点上猝灭所述反应,使用互作色谱AA511柱的HPLC监测β-丙氨酸的形成,并使用O-邻苯二醛进行后续柱衍生。使用Pickering Laboratories缓冲液Na 328和Na 740来展开层析,以0.5ml/分钟流速,柱温度60℃,并将反应的色谱与那些标准量的β-丙氨酸的色谱进行比较来进行定量。
使用这样的分析,Pgaam2丙氨酸2,3-氨基变位酶(SEQ ID NO49)的比活性被测定为0.03±0.01单位/mg蛋白(1单位=每分钟产生1μmolβ-丙氨酸)。
实施例10大肠杆菌ΔpanDCAT菌株的构建为了对编码能实施丙氨酸2,3-氨基变位酶反应的多肽的基因进行鉴定,必须对所需要的活性进行有效的筛选和选择。因此,可通过识别使用β-丙氨酸合成依次以辅酶A(CoA)和酰基载体蛋白(ACP)为成分的泛酸的大肠杆菌而开发了筛选方法。CoA和ACP是活生物体中重要的酰基基团,都生长至关重要。在大肠杆菌中,形成β-丙氨酸的主要途径是通过由panD基因编码的天冬氨酸盐脱羧酶(E.C.4.1.1.11)催化反应中的天冬氨酸盐开始的(图3)。PanD的功能性缺失突变导致了β-丙氨酸的营养缺乏和生长抑制,其可通过外源性的加入泛酸盐或β-丙氨酸,或通过从其他来源产生β-丙氨酸得以缓解。
将两株β-丙氨酸合成缺陷的大肠杆菌用于筛选。菌株DV1((#6865,E.coli Genetic Stock Center,New Haven CT;Vallari和Rock,J.B acteriol.164136-42,1985)是通过化学突变制备的大肠杆菌突变株,其具有使得两个基因都丧失功能的panF和panD双重宿主(染色体)突变。PanF基因编码从培养基中摄取泛酸盐,因此panF和panD的组合对用于生长的β-丙氨酸提供了更为苛刻的需求。因此,虽然DV1菌株是已知的,但其用于对具有丙氨酸2,3-氨基变位酶活性的细胞进行筛选是之前所不知道的。
其他的选择菌株,BW25113ΔpanDCAT,含有panD座的缺失,从而阻止了能够在无外源β-丙氨酸条件下生长时panD突变的回复突变。这个菌株,具有由插入panD座的CAT基因所赋予的氯霉素抗性标记的插入,是使用E.Coli Genetic Stock Center的大肠杆菌菌株BW25113/pKD46和BW 25141/pKD3,使用Datsenko和Wanner的基因失活方法(Proc.Natl.Acad.Sci USA 976640-5,2000)构建的。
可使用引物TATCAATTCGTTACAGGCGATACATGGCACGCTTCGGCGCGTGTAGGCTGGAGCTGCTTC(SEQ ID NO53)和GATGTCGCGGCTGGTGAGTAACCAGCCGCAGGGATAACAACATATGAATATCCTCCTTAG(SEQ ID NO54)对pKD3的CAT基因进行扩增。PCR反应包括在300μl终体积中的30μl 10X浓缩PCR缓冲液(RocheMolecular Biochemicals),质粒pKD3,0.2mM各种dNTP,0.2μM各种引物和15单位Taq聚合酶(Roche Molecular Biochemicals)。PCR反应在95℃孵育30秒,之后是30个循环的95℃30秒,45℃30秒,72℃1分钟,然后72℃10分钟。用乙醇沉淀PCR产物,用DpnI消化,用QIAquick PCR Purification试剂盒(Qiagen)进行纯化,并转化入表达重组功能的BW25113/pKD46中。将转化自涂布于含有25μg/ml氯霉素和5μM β-丙氨酸的LB平板上。
在43℃,添加有5μM β-丙氨酸的非选择性LB培养基中单克隆纯化氯霉素抗性的转化物,并检测单克隆的氯霉素抗性保持,氨苄青霉素抗性的丧失(显示pKD46的熟化(curing)),以及在M9-葡萄糖基本培养基中生长β-丙氨酸的需求。CAT基因向panD座正确插入的确认是通过使用侧翼于插入座(TTACCGAGCAGCGTTCAGAG,SEQ ID NO55;和CACCTGGCGGTGACAACCAT,SEQ ID NO56)的引物,对所得的ΔpanDCAT菌株进行菌落PCR实现的。当野生型panD座预期产生713个碱基对的PCR产物时,ΔpanDCAT构建体产生了1215-碱基对的产物。如前所述(Datsenko和Wanner,Proc.Natl.Acad.Sci.USA 976640-5,2000),构建了ΔpanDCAT菌株的衍生物,其中通过质粒pCP20编码的FLP重组酶活性去除了插入的CAT基因。这样的菌株称为ΔpanD。
存在于大肠杆菌中生成β-丙氨酸的第二条途径是根据尿嘧啶代谢的还原途径(West,Can.J.Microbiol.441106-9,1998,图2)。在这条途径中,尿嘧啶被二氢嘧啶脱氢酶(E.C.1.3.1.2)转化成了二氢尿嘧啶。通过二氢嘧啶酶(E.C.3.5.2.2),二氢尿嘧啶随后被转化成N-氨基甲酰-β-丙氨酸,其依次被N-氨基甲酰-β-丙氨酸-酰胺水解酶(E.C.3.5.1.6)水解成β-丙氨酸,CO2,和NH3。为了阻止通过这一途径形成β-丙氨酸,通过上述Datsenko和Wanner的方法,可将编码二氢嘧啶脱氢酶的基因,yeiA(GenBank Accession No.AAC75208),插入性缺失。使用引物GCGGCGTGAAGTTTCCCAACCCGTTCTGCCTCTCTTCTTCGTGTAGGCTGGAGCTGCTTC(SEQ ID NO57)和TTACAACGTTACCGGGTGTTCTTTCTCGCCTTTCTTAAACCATATGAATATCCTCCTTAG(SEQID NO58)对pKD3的CAT基因进行扩增。
如上所述分离氯霉素抗性的插入突变体,并将所述抗性标记转到入ΔpanD菌株从而生成双突变体ΔpanD/ΔyeiACAT。如以上实施例所述,生成大肠杆菌BW25115ΔpanDCAT,ΔpanD或ΔpanD/ΔyeiACAT的电击感受态细胞,并将其用作转化突变体赖氨酸2,3-氨基变位酶DNA文库的宿主。
实施例11不使用突变的赖氨酸2,3-氨基变位酶来选择丙氨酸2,3-氨基变位酶活性鉴定具有丙氨酸2,3-氨基变位酶活性细胞的其他方法是不使用突变的赖氨酸2,3-氨基变位酶文库对其进行转化,而是在如上所述的培养基上涂布细胞,例如如实施例10所述的DV1或ΔpanDCAT细胞。如上所述对这些细胞进行选择,并如实施例3,5,6,8和9所述验证丙氨酸2,3-氨基变位酶活性的存在。
可在涂布之前对细胞进行突变,例如通过将细胞暴露于UV辐射或化学物质(例如EMS)。这可以允许分离出具有一个或多个其他基因突变的突变体,其导致了该细胞具有丙氨酸2,3-氨基变位酶活性。
或者,可在涂布之前不对细胞进行改变(例如,不转化,不突变)。这一方法允许分离出具有丙氨酸2,3-氨基变位酶活性天然存在的菌株。
实施例12从β-丙氨酸制备泛酸盐可使用具有α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1)活性的多肽从β-丙氨酸制备泛酸盐(图3)。
使用本发明所述的克隆方法,可对α-酮泛解酸盐羟甲基转移酶(E.C.2.1.2.11),α-酮泛解酸盐还原酶(E.C.1.1.1.169),和泛酸盐合酶(E.C.6.3.2.1)进行分离,测序,表达和检测。本领域所属技术人员应该理解,类似的方法可用于从任意生物体中获得任意这些多肽的序列。
实施例13重组表达根据公众可获得的酶cDNA和氨基酸序列,以及在此所公开的丙氨酸2,3-氨基变位酶,及其变体,片段和融合体,通过标准的实验室技术可对任意蛋白,例如丙氨酸2,3-氨基变位酶进行表达和纯化。本领域所属技术人员应该理解,酶及其片段可在任意感兴趣的细胞或生物体中重组地制备,并在使用之前,例如在制备3-HP,泛酸盐及其衍生物之前进行纯化。
制备重组蛋白的方法时本领域所公知的。因此,本发明的范围包括了任意蛋白或其片段,例如丙氨酸2,3-氨基变位酶的重组表达。例如,参见Johnson等人的美国专利第5,342,764号;Pausch等人的美国专利第5,846,819号;Fleer等人的美国专利第5,876,969号和Sambrook等人(Molecular CloningA Laboratory Manual,Cold Spring Harbor,NewYork,1989,Ch.17)。
简言之,可将编码蛋白的部分、全长、或变体cDNA序列连接入表达载体,例如细菌表达载体。可通过在所述cDNA序列的上游放置启动子来制备蛋白。启动子的示例包括,但不限于,lac,trp,tac,trc,主要操纵子和λ噬菌体的启动子区,fd衣壳蛋白的控制区,SV40的早期和晚期启动子,衍生自多瘤病毒,腺病毒,逆转录病毒,杆状病毒和猿猴病毒的启动子,3-磷酸甘油酸激酶的启动子,酵母酸性磷酸酶的启动子的启动子,酵母α-结合因子的启动子及其组合。
适于制备完整天然蛋白的载体包括pKC30(Shimatake andRosenberg,1981,Nature 292128),pKK177-3(Amann and Brosius,1985,Gene 40183)和pET-3(Studier and Moffatt,1986,J.MoI.Biol 189113)。DNA序列可转移至其他克隆载体,例如其他质粒,噬菌体,粘粒,动物病毒和酵母人工染色体(YAC)(Burke等人,1987,Science 236806-12)中。这些载体可被导入多种宿主,包括体细胞,和简单或复杂生物体,例如细菌,真菌(Timberlake and Marshall,1989,Science 2441313-7),无脊椎动物,植物(Gasser and Fraley,1989,Science 2441293),和哺乳动物(Pursel等人,1989,Science 2441281-8),其通过导入异源cDNA而成为转基因的。
对哺乳动物细胞中的表达而言,可将cDNA序列连接于异源启动子,例如猿猴病毒SV40,pSV2载体的启动子(Mulligan and Berg,1981,Proc.Natl.Acad.Sci.USA 782072-6),并导入细胞,例如猴COS-1细胞(Gluzman,1981,Cell 23175-82),从而获得瞬时或长期表达。可通过生化选择,例如新霉素(Southern and Berg,1982,J.MoI.Appl.Genet.1327-41)和mycophoenolic酸(Mulligan and Berg,1981,Proc.Natl.Acad.Sci.USA 782072-6),在哺乳动物细胞中获得嵌合基因构建体的稳定整合。
将DNA转移入真核细胞,例如人类或其他哺乳动物细胞是常规的技术。载体可作为纯DNA,通过,例如,磷酸钙沉淀(Graham and vaNderEb,1973,Virology 52466),磷酸锶(Brash等人,1987,Mol Cell Biol.72013),电穿孔(Neumann等人,1982,EMBO J.1841),脂质体转染(Feigner等人,1987,Proc.Natl.Acad.Sci USA 847413),DEAE葡聚糖(McCuthan等人,1968,7.Natl.Cancer Inst.41351),显微注射(Mueller等人,1978,Cell 15579),原生质体融合(Schafner,1980,Proc.Natl.Acad.Sci.USA 772163-7)或基因枪(pellet guns)(Klein等人,1987,Nature 32770)导入受体细胞中(转染)。或者,可通过使用病毒载体,例如逆转录病毒(Bernstein等人,1985,Gen.Engrg.7235),例如腺病毒(Ahmad等人,1986,J.Virol.57267)或疱疹病毒(Spaete等人,1982,Cell 30295)进行转染将cDNA导入。
实施例14多肽合成与纯化可通过本领域公知的任意数量的手人工或自动方法化学地合成在此公开的酶,例如丙氨酸2,3-氨基变位酶及其变体,融合体和片段。例如,可使用Applied Biosystems Model 431A多肽合成仪,使用9-芴甲氧羰基(Fmoc)氨基末端保护,与二环己基碳二亚胺/羟基苯并三唑或2-(1H-苯并-三唑-1-基)-1,1,3,3-六氟磷酸四甲基脲鎓/羟基苯并三唑(HBTU/HOBT)结合,并使用对-羟基甲基苯氧甲基聚苯乙烯(HMP)或适于羧基末端酸的Sasrin树脂或适于羧基末端酸的Rink酰胺树脂实施0.25毫摩尔(mmole)规模的固相多肽合成(SPPS)。
可通过三苯甲基化作用和溶于三氟乙酸中的三苯甲醇,然后通过Fmoc衍生,从适当的前体氨基酸制备Fmoc-衍生的氨基酸,如Atherton等人所述(Solid Phase Peptide Synthesis,IRL PressOxford,1989)。使用1%TFA的二氯甲烷溶液可对Sasrin树脂结合的肽进行剪切,从而生成被保护的肽。在适当的条件下,使用二苯基磷酰基叠氮化物,通过在新生肽中氨基末端游离胺与羧基末端游离酸的反应,可将被保护肽前体在氨基末端和羧基末端之间环化,其中所述氨基酸侧链是被保护的。
HMP或Rink酰胺树脂-结合的产物通常被剪切,且可以使用含有三氟乙酸(TFA)的溶液,也可任意含有水、苯硫基甲烷和乙二硫醇,以100∶5∶5∶2.5的比率于室温0.5-3小时,对含有受保护侧链的环化肽脱保护。
可使用制备性性的高压液相色谱(HPLC),例如使用WaterDelta-PAK C18柱和用乙腈缓和的含0.1%TFA的水梯度洗脱,来纯化粗制的多肽。柱洗提后,从洗脱级分中蒸发乙腈,然后冻干该洗脱级分。如此生产和纯化的各种产物的同一性可通过快速原子轰击质谱法(FABMS)或电喷射质谱法(ESMS)进行验证。
鉴于我们公开的原理可应用于许多可能的实施方案,应该理解举例说明的实施方案只是公开的特定实施例而不应该作为本发明范围的限制。相应的,所公开内容的范围与下列权利要求是一致的。因此我们要求保护所有在这些权利要求的范围和精神内的发明。
序列表<110>卡吉尔公司(Cargill Incorporated)<120>丙氨酸2,3氨基变位酶(Alanine 2,3 aminomutases)<130>SCT070223-66<160>59<170>PatentIn version 3.2<210>1<211>1416<212>DNA<213>Bacillus subtilis<220>
<221>CDS<222>(1)..(1416)<400>1atg aaa aac aaa tgg tat aaa ccg aaa cgg cat tgg aag gag atc gag48Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu1 5 10 15tta tgg aag gac gtt ccg gaa gag aaa tgg aac gat tgg ctt tgg cag96Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln20 25 30ctg aca cac act gta aga acg tta gat gat tta aag aaa gtc att aat144Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn35 40 45ctg acc gag gat gaa gag gaa ggc gtc aga att tct acc aaa acg atc192Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile50 55 60ccc tta aat att aca cct tac tat gct tct tta atg gac ccc gac aat240Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn65 70 75 80ccg aga tgc ccg gta cgc atg cag tct gtg ccg ctt tct gaa gaa atg288Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met85 90 95cac aaa aca aaa tac gat atg gaa gac ccg ctt cat gag gat gaa gat336His Lys Thr Lys Tyr Asp Met Glu Asp Pro Leu His Glu Asp Glu Asp100 105 110tca ccg gta ccc ggt ctg aca cac cgc tat ccc gac cgt gtg ctg ttt384Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe115 120 125ctt gtc acg aat caa tgt tcc gtg tac tgc cgc tac tgc aca aga agg432
Leu Val Thr Asn Gln Cys Ser Val Tyr Cys Arg Tyr Cys Thr Arg Arg130 135 140cgc ttt tcc gga caa atc gga atg ggc gtc ccc aaa aaa cag ctt gat480Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp145 150 155 160gct gca att gct tat atc cgg gaa aca ccc gaa atc cgc gat tgt tta528Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu165 170 175att tca ggc ggt gat ggg ctg ctc atc aac gac caa att tta gaa tat576Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr180 185 190att tta aaa gag ctg cgc agc att ccg cat ctg gaa gtc atc aga atc624Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile195 200 205gga aca aga gct ccc gtc gtc ttt ccg cag cgc att acc gat cat ctg672Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu210 215 220tgc gag ata ttg aaa aaa tat cat ccg gtc tgg ctg aac acc cat ttt720Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe225 230 235 240aac aca agc atc gaa atg aca gaa gaa tcc gtt gag gca tgt gaa aag768Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys245 250 255ctg gtg aac gcg gga gtg ccg gtc gga aat cag gct gtc gta tta gca816Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala260 265 270ggt att aat gat tcg gtt cca att atg aaa aag ctc atg cat gac ttg864Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu275 280 285gta aaa atc aga gtc cgt cct tat tat att tac caa tgt gat ctg tca912Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser290 295 300gaa gga ata ggg cat ttc aga gct cct gtt tcc aaa ggt ttg gag atc960Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile305 310 315 320att gaa ggg ctg aga ggt cat acc tca ggc tat gcg gtt cct acc ttt1008Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe325 330 335gtc gtt cac gca cca ggc gga gga ggt aaa atc gcc ctg cag ccg aac1056Val Val His Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn340 345 350tat gtc ctg tca caa agt cct gac aaa gtg atc tta aga aat ttt gaa1104Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu
355 360 365ggt gtg att acg tca tat ccg gaa cca gag aat tat atc ccc aat cag1152Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln370 375 380gca gac gcc tat ttt gag tcc gtt ttc cct gaa acc gct gac aaa aag1200Ala Asp Ala Tyr Phe Glu Ser Val Phe Pro Glu Thr Ala Asp Lys Lys385 390 395 400gag ccg atc ggg ctg agt gcc att ttt gct gac aaa gaa gtt tcg ttt1248Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe405 410 415aca cct gaa aat gta gac aga atc aaa agg aga gag gca tac atc gca1296Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala420 425 430aat ccg gag cat gaa aca tta aaa gat cgg cgt gag aaa aga gat cag1344Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln435 440 445ctc aaa gaa aag aaa ttt ttg gcg cag cag aaa aaa cag aaa gag act1392Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr450 455 460gaa tgc gga ggg gat tct tca tga1416Glu Cys Gly Gly Asp Ser Ser465 470<210>2<211>471<212>PRT<213>Bacillus subtilis<400>2Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu1 5 10 15Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln20 25 30Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn35 40 45Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile50 55 60Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn65 70 75 80
Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met85 90 95His Lys Thr Lys Tyr Asp Met Glu Asp Pro Leu His Glu Asp Glu Asp100 105 110Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe115 120 125Leu Val Thr Asn Gln Cys Ser Val Tyr Cys Arg Tyr Cys Thr Arg Arg130 135 140Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp145 150 155 160Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu165 170 175Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr180 185 190Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile195 200 205Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu210 215 220Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe225 230 235 240Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys245 250 255Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala260 265 270Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu275 280 285Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser290 295 300
Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile305 310 315 320Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe325 330 335Val Val His Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn340 345 350Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu355 360 365Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln370 375 380Ala Asp Ala Tyr Phe Glu Ser Val Phe Pro Glu Thr Ala Asp Lys Lys385 390 395 400Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe405 410 415Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala420 425 430Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln435 440 445Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr450 455 460Glu Cys Gly Gly Asp Ser Ser465 470<210>3<211>1416<212>DNA<213>Bacillus subtilis<220>
<221>CDS<222>(1)..(1416)<400>3atg aaa aac aaa tgg tat aaa ccg aaa cgg cat tgg aag gag atc gag48Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu
15 10 15tta tgg aag gac gtt ccg gaa gag aaa tgg aac gat tgg ctt tgg cag96Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln20 25 30ctg aca cac act gta aga acg tta gat gat tta aag aaa gtc att aat144Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn35 40 45ctg acc gag gat gaa gag gaa ggc gtc cgt att tct acc aaa acg atc192Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile50 55 60ccc tta aat att aca cct tac tat gct tct tta atg gac ccc gac aat240Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn65 70 75 80ccg aga tgc ccg gta cgc atg cag tct gtg ccg ctt tct gaa gaa atg288Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met85 90 95cac aaa aca aaa tac gat atg gaa gac ccg ctt cat gag gat gaa gat336His Lys Thr Lys Tyr Asp Met Glu Asp Pro Leu His Glu Asp Glu Asp100 105 110tca ccg gta ccc ggt ctg aca cac cgc tat ccc gac cgt gtg ctg ttt384Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe115 120 125ctt gtc acg aat caa tgt tcc gtg tac tgc cgc cac tgc aca cgc cgg432Leu Val Thr Asn Gln Cys Ser Val Tyr Cys Arg His Cys Thr Arg Arg130 135 140cgc ttt tcc gga caa atc gga atg ggc gtc ccc aaa aaa cag ctt gat480Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp145 150 155 160gct gca att gct tat atc cgg gaa aca ccc gaa atc cgc gat tgt tta528Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu165 170 175att tca ggc ggt gat ggg ctg ctc atc aac gac caa att tta gaa tat576Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr180 185 190att tta aaa gag ctg cgc agc att ccg cat ctg gaa gtc atc cgc atc624Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile195 200 205gga aca cgt gct ccc gtc gtc ttt ccg cag cgc att acc gat cat ctg672Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu210 215 220tgc gag ata ttg aaa aaa tat cat ccg gtc tgg ctg aac acc cat ttt720Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe225 230 235 240
aac aca agc atc gaa atg aca gaa gaa tcc gtt gag gca tgt gaa aag768Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys245 250 255ctg gtg aac gcg gga gtg ccg gtc gga aat cag gct gtc gta tta gca816Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala260 265 270ggt att aat gat tcg gtt cca att atg aaa aag ctc atg cat gac ttg864Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu275 280 285gta aaa atc aga gtc cgt cct tat tat att tac caa tgt gat ctg tca912Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser290 295 300gaa gga ata ggg cat ttc cgt gct cct gtt tcc aaa ggt ttg gag atc960Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile305 310 315 320att gaa ggg ctg aga ggt cat acc tca ggc tat gcg gtt cct acc ttt1008Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe325 330 335gtc gtt cac gca cca ggc gga gga ggt aaa atc gcc ctg cag ccg aac1056Val Val His Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn340 345 350tat gtc ctg tca caa agt cct gac aaa gtg atc tta aga aat ttt gaa1104Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu355 360 365ggt gtg att acg tca tat ccg gaa cca gag aat tat atc ccc aat cag1152Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln370 375 380gca gac gcc tat ttt gag tcc gtt ttc cct gaa acc gct gac aaa aag1200Ala Asp Ala Tyr Phe Glu ger Val Phe Pro Glu Thr Ala Asp Lys Lys385 390 395 400gag ccg atc ggg ctg agt gcc att ttt gct gac aaa gaa gtt tcg ttt1248Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe405 410 415aca cct gaa aat gta gac aga atc aaa cgg cgt gag gca tac atc gca1296Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala420 425 430aat ccg gag cat gaa aca tta aaa gat cgg cgt gag aaa aga gat cag1344Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln435 440 445ctc aaa gaa aag aaa ttt ttg gcg cag cag aaa aaa cag aaa gag act1392Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr450 455 460
gaa tgc gga ggg gat tct tca tga 1416Glu Cys Gly Gly Asp Ser Ser465 470<210>4<211>471<212>PRT<213>Bacillus subtilis<400>4Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu1 5 10 15Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln20 25 30Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn35 40 45Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile50 55 60Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn65 70 75 80Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met85 90 95His Lys Thr Lys Tyr Asp Met Glu Asp Pro Leu His Glu Asp Glu Asp100 105 110Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe115 120 125Leu Val Thr Asn Gln Cys Ser Val Tyr Cys Arg His Cys Thr Arg Arg130 135 140Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp145 150 155 160Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu165 170 175Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr
180 185 190Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile195 200 205Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu210 215 220Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe225 230 235 240Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys245 250 255Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala260 265 270Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu275 280 285Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser290 295 300Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile305 310 315 320Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe325 330 335Val Val His Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn340 345 350Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu355 360 365Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln370 375 380Ala Asp Ala Tyr Phe Glu Ser Val Phe Pro Glu Thr Ala Asp Lys Lys385 390 395 400Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe405 410 415
Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala420 425 430Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln435 440 445Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr450 455 60Glu Cys Gly Gly Asp Ser Ser465 470<210>5<211>1251<212>DNA<213>Porphyromonas gingivalis<220>
<221>CDS<222>(1)..(1251)<400>5atg gca gaa agt cgt aga aag tat tat ttc cct gat gtc acc gat gag48Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15caa tgg tac gac tgg cat tgg cag gtc ctc aat cga att gag acg ctc96Gln Trp Tyr Asp Trp His Trp Gln Val Leu Asn Arg Ile Glu Thr Leu20 25 30gac cag ctg aaa aag tac gtt aca ctc acc gct gaa gaa gaa gag gga144Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45gta aaa gaa tcg ccc aaa gta ctc cga atg gct atc aca cct tat tat192Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60ttg agt ttg ata gac ccc gag aat cct aat tgt ccg att cgt aaa caa240Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80gcc att cct act caa cag gaa ctg gta cgt gct cct gaa gat cag gta288Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95gac cca ctt agt gaa gat gaa gat tcg ccc gta ccc gga ctg act cat336Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110
cgt tat ccg gat cgt gta ttg ttc ctt atc acg gac aaa tgt tcg atg384Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125tac tgt cgt cat tgt act cgc cgt cgc ttc gca gga cag aaa gat gct432Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140tct tct cct tct gag cgc atc gat cga tgc att gac tat ata gcc aat480Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160aca ccg aca gtc cgc gat gtt ttg cta tcg gga ggc gat gcc ctc ctt528Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175gtc agc gac gaa cgc ttg gaa tac ata ttg aag cgt ctg cgc gaa ata576Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Ile180 185 190cct cat gtg gag att gtt cgt ata gga agc cgt acg ccg gta gtc ctc624Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205cct cag cgt ata acg cct caa ttg gtg gat atg ctc aaa aaa tat cat672Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220ccg gtg tgg ctg aac act cac ttc aac cac ccg aat gaa gtt acc gaa720Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240gaa gca gta gag gct tgt gaa aga atg gcc aat gcc ggt att ccg ttg768Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255ggt aac caa acg gtt tta ttg cgt gga atc aat gat tgt aca cat gtg816Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270atg aag aga ttg gta cat ttg ctg gta aag atg cgt gtg cgt cct tac864Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285tat ata tat gta tgc gat ctt tcg ctt gga ata ggt cat ttc cgc acg912Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300ccg gta tct aaa gga atc gaa att atc gaa aat ttg cgc gga cac acc960Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320tcg ggc tat gca gtt cct acc ttt gtg gta ggt gct ccg ggg ggt ggt1008Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335ggt aag ata cct gta acg ccg aac tat gtt gta tct cag tcc cca cga1056
Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350cat gtg gtt ctt cgc aat tat gaa ggt gtt atc aca acc tat acg gag1104His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365ccg gag aat tat cat gag gag tgc gat tgt gag gac tgt cga gcc ggt1152Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380aag cat aaa gag ggt gta gct gca ctt tcc gga ggt cag cag ttg gct1200Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400atc gag cct tcc gac tta gct cgc aaa aaa cgc aag ttt gat aag aac1248Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415tga1251<210>6<211>416<212>PRT<213>Porphyromonas gingivalis<400>6Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15Gln Trp Tyr Asp Trp His Trp Gln Val Leu Asn Arg Ile Glu Thr Leu20 25 30Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110
Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Ile180 185 190Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg
340 345 350His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415<210>7<211>29<212>DNA<213>Artificial<220>
<223>PCR primer<400>7ccggcccata tgaatacagt taatactag29<210>8<211>37<212>DNA<213>Artificial<220>
<223>PCR primer<400>8cgccgcggat ccttatttaa acaatctctc cctgtcg 37<210>9<211>1278<212>DNA<213>Fusobacterium nucleatum<220>
<221>CDS<222>(1)..(1278)<400>9atg aat aca gtt aat act aga aaa aaa ttt ttc cca aat gta act gat48Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15
gaa gaa tgg aat gat tgg aca tgg caa gta aaa aac aga ctt gaa agt96Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu G1u Ser20 25 30gtt gaa gat tta aaa aaa tat gtt gat tta agt gaa gaa gaa aca gaa144Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45ggg gtt gta aga act ctt gaa act tta aga atg gca atc act cca tat192Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60tac ttc tca ttg ata gat ttg aat agt gat aga tgc cca ata aga aag240Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80caa gct ata cct act ata caa gaa ata cat caa tct gat gct gat ttg288Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Leu85 90 95tta gat cct cta cat gaa gat gaa gac tct cca gta cca gga tta act336Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110cat aga tat cca gat aga gtt tta ctt cta ata aca gac atg tgt tct384His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125atg tat tgt aga cac tgc act cgt aga aga ttt gct ggg tca agt gat432Met Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140gat gct atg cct atg gat aga att gac aaa gca ata gaa tat att gca480Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160aaa act cca caa gta agg gat gta ttg tta tca gga gga gat gca ctt528Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175cta gtt tct gat aaa aaa tta gaa agc ata atc caa aaa cta aga gca576Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190ata cct cat gtt gaa ata ata aga ata gga agt aga aca cca gtt gtt624Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205tta cct caa aga att act cct gaa tta tgt aat atg tta aag aaa tat672Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220cat cca att tgg ttg aat act cat ttt aac cac cct caa gaa gta aca720His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240
cca gaa gct aaa aaa gct tgt gaa atg ttg gca gat gca gga gtt cca768Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255tta gga aat caa act gta cta tta aga gga ata aat gac agt gta cct816Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270gta atg aaa agg tta gta cat gat tta gta atg atg aga gta aga cct864Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285tat tat att tac caa tgt gac tta tct atg gga ctt gaa cac ttc aga912Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300aca cca gtt tct aaa ggt ata gaa att att gaa gga tta aga gga cat960Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320aca tct gga tat gca gta cca aca ttt gtt gtt gat gca cct ggt ggt1008Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly325 330 335gga gga aaa act cca gta atg cct caa tat gta att tct caa tct cct1056Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350cat aga gta gtt tta aga aac ttt gaa gga gtt ata aca act tat aca1104His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365gaa cca gaa aat tat aca cat gaa cct tgt tat gat gaa gaa aaa ttt1152Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380gaa aaa atg tat gaa ata agt gga gtt tat atg cta gat gaa gga tta1200Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400aaa atg tca cta gaa cct agc cac tta gca aga cat gaa aga aat aaa1248Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415aag aga gca gaa gct gaa ggg aaa aaa taa1278Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>10<211>425<212>PRT<213>Fusobacterium nucleatum<400>10Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp
1 5 10 15Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Glu Ser20 25 30Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Leu85 90 95Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125Met Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240
Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly325 330 335Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>11<211>1278<212>DNA<213>Fusobacterium nucleatum<220>
<221>CDS<222>(1)..(1278)<400>11atg aat aca gtt aat act cgt aaa aaa ttt ttc cca aat gta act gat48Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15gaa gaa tgg aat gat tgg aca tgg caa gta aaa aac cgc ctt gaa agt96Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Glu Ser20 25 30gtt gaa gat tta aaa aaa tat gtt gat tta agt gaa gaa gaa aca gaa144Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45ggg gtt gta cgc act ctt gaa act tta cgt atg gca atc act cca tat192Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60tac ttc tca ttg ata gat ttg aat agt gat cgc tgc cca ata cgt aag240Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80caa gct ata cct act ata caa gaa ata cat caa tct gat gct gat ttg288Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Leu85 90 95tta gat cct cta cat gaa gat gaa gac tct cca gta cca gga tta act336Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110cat cgc tat cca gat cgt gtt tta ctt cta ata aca gac atg tgt tct384His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125atg tat tgt cgc cac tgc act cgt cgc aga ttt gct ggg tca agt gat432Met Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140gat gct atg cct atg gat aga att gac aaa gca ata gaa tat att gca480Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160aaa act cca caa gta agg gat gta ttg tta tca gga gga gat gca ctt528Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175cta gtt tct gat aaa aaa tta gaa agc ata atc caa aaa cta cgc gca576Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190ata cct cat gtt gaa ata atc aga ata gga agt cgt aca cca gtt gtt624Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205tta cct caa aga att act cct gaa tta tgt aat atg tta aag aaa tat672
Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220cat cca att tgg ttg aat act cat ttt aac cac cct caa gaa gta acg720His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240cca gaa gct aaa aaa gct tgt gaa atg ttg gca gat gca gga gtt cca768Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255tta gga aat caa act gta cta tta aga gga ata aat gac agt gta cct816Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270gta atg aaa agg tta gta cat gat tta gta atg atg cgt gta cgc cct864Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285tat tat att tac caa tgt gac tta tct atg gga ctc gaa cac ttc cgc912Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300aca cca gtt tct aaa ggt ata gaa att att gaa gga tta cgt gga cat960Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320aca tct gga tat gca gta cca aca ttt gtt gtt gat gca cct ggt ggt1008Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly325 330 335gga gga aaa act cca gta atg cct caa tat gta att tct caa tct cct1056Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350cat cgt gta gtt tta cgc aac ttt gaa gga gtt ata aca act tat aca1104His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365gaa cca gaa aat tat aca cat gaa cct tgt tat gat gaa gaa aaa ttt1152Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380gaa aaa atg tat gaa ata agt gga gtt tat atg cta gat gaa gga tta1200Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400aaa atg tca cta gaa cct agc cac tta gca cgt cat gaa cgc aat aaa1248Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415aag aga gca gaa gct gaa ggg aaa aaa taa1278Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>12
<211>425<212>PRT<213>Fusobacterium nucleatum<400>12Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Glu Ser20 25 30Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Leu85 90 95Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125Met Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205
Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly325 330 335Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425
<210>13<211>1278<212>DNA<213>Fusobacterium nucleatum<220>
<221>CDS<222>(1)..(1278)<400>13atg aat aca gtt aat act cgt aaa aaa ttt ttc cca aat gta act gat48Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15gaa gaa tgg aat gat tgg aca tgg caa gta aaa aac cgc ctt gaa agt96Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Glu Ser20 25 30gtt gaa gat tta aaa aaa tat gtt gat tta agt gaa gaa gaa aca gaa144Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45ggg gtt gta cgc act ctt gaa act tta cgt atg gca atc act cca tat192Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60tac ttc tca ttg ata gat ttg aat agt gat cgc tgc cca ata cgt aag240Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80caa gct ata cct act ata caa gaa ata cat caa tct gat gct gat atg288Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Met85 90 95ttg gat cct cta cat gaa gat gaa gac tct cca gta cca gga tta act336Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110cat cgc tat cca gat cgt gtt tta ctt cta ata aca gac atg tgt tct384His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125gta tac tgt cgc cac tgc act cgt cgc aga ttt gct ggg tca agt gat432Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140gat gct atg cct atg gat aga att gac aaa gca ata gaa tat att gca480Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160aaa act cca caa gta agg gat gta ttg tta tca gga gga gat gca ctt528Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175cta gtt tct gat aaa aaa tta gaa agc ata atc caa aaa cta cgc gca576Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala
180 185 190ata cct cat gtt gaa ata atc aga ata gga agt cgt aca cca gtt gtt624Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205tta cct caa aga att act cct gaa tta tgt aat atg tta aag aaa tat672Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220cat cca att tgg ttg aat act cat ttt aac cac cct caa gaa gta acg720His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240cca gaa gct aaa aaa gct tgt gaa atg ttg gca gat gca gga gtt cca768Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255tta gga aat caa act gta cta tta aga gga ata aat gac agt gta cct816Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270gta atg aaa agg tta gta cat gat tta gta atg atg cgt gta cgc cct864Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285tat tat att tac caa tgt gac tta tct atg gga ctc gaa cac ttc cgc912Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300aca cca gtt tct aaa ggt ata gaa att att gaa gga tta cgt gga cat960Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320aca tct gga tat gca gta cca aca ttt gtt gtg cat gca cct ggt ggt1008Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335gga gga aaa act cca gta atg cct caa tat gta att tct caa tct cct1056Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350cat cgt gta gtt tta cgc aac ttt gaa gga gtt ata aca act tat aca1104His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365gaa cca gaa aat tat aca cat gaa cct tgt tat gat gaa gaa aaa ttt1152Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380gaa aaa atg tat gaa ata agt gga gtt tat atg cta gat gaa gga tta1200Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400aaa atg tca cta gaa cct agc cac tta gca cgt cat gaa cgc aat aaa1248Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415
aag aga gca gaa gct gaa ggg aaa aaa taa1278Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>14<211>425<212>PRT<213>Fusobacterium nucleatum<400>14Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Glu Ser20 25 30Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr50 55 60Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Met85 90 95Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175
Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys
405 410 415Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>15<211>40<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>15catcaatctg atgctgatat gttggatcct ctacatgaag40<210>16<211>38<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>16aacagacatg tgttctgtat actgtcgcca ctgcactc 38<210>17<211>34<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>17gtaccaacat ttgttgtgca tgcacctggt ggtg 34<210>18<211>1278<212>DNA<213>Fusobacterium nucleatum<220>
<221>CDS<222>(1)..(1278)<400>18atg aat aca gtt aat act cgt aaa aaa ttt ttc cca aat gta act gat48Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15
gaa gaa tgg aat gat tgg aca tgg caa gta aaa aac cgc ctt aaa agt96Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Lys Ser20 25 30gtt gaa gat tta aaa aaa tat gtt gat tta agt gaa gaa gaa aca gaa144Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45ggg gtt gta cgc act ctt gaa act tta cgt atg gca atc act cca ttt192Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Phe50 55 60tac ttc tca ttg ata gat ttg aat agt gat cgc tgc cca ata cgt aag240Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80caa gct ata cct act ata cga gaa ata cat caa tct gat gct gat atg288Gln Ala Ile Pro Thr Ile Arg Glu Ile His Gln Ser Asp Ala Asp Met85 90 95ttg gat cct cta cat gaa gat gaa gac tct cca gta cca gga tta act336Leu Asp Pro Leu His Glu Asp Glu Asp Ser pro Val Pro Gly Leu Thr100 105 110cat cgc tat cca gat cgt gtt tta ctt cta ata aca gac atg tgt tct384His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125gta tac tgt cgc cac tgc act cgt cgc aga ttt gct ggg tca agt gat432Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140ggt gct atg cct atg gat aga att gac aaa gca ata gaa tat att gca480Gly Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160aaa act cca caa gta agg gat gta ttg tta tca gga gga gat gca ctt528Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175cta gtt tct gat aaa aaa tta gaa agc ata atc caa aaa cta cgc gca576Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190ata cct cat gtt gaa ata atc aga ata gga agt cgt aca cca gtt gtt624Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205tta cct caa aga att act cct gaa tta tgt aat atg tta aag aaa tat672Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220cat cca att tgg atg aat act cat ttt aac cac cct caa gaa gta acg720His Pro Ile Trp Met Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240
cca gaa gct aaa aaa gct tgt gaa atg ttg gca gat gca gga gtt cca768Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255tta gga aat caa act gta cta tta aga gga ata aat gac agt gta cct816Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270gta atg aaa agg tta gta cat gat tta gta atg atg cgt gta cgc cct864Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285tat tat att tac caa tgt gac tta tct atg gga ctc gaa cac ttc cgc912Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300aca cca gtt tct aaa ggt ata gaa att att gaa gga tta cgt gga cat960Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320aca tct gga tat gca gta cca aca ttt gtt gtg cat gca cct ggt ggt1008Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335gga gga aaa act cca gta atg cct caa tat gta att tct caa tct cct1056Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350cat cgt gta gtt tta cgc aac ttt gaa gga gtt ata aca act tat aca1104His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365gaa cca gaa aat tat aca cat gaa cct tgt tat gat gaa gaa aaa ttt1152Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380gaa aaa atg tat gaa ata agt gga gtt tat atg cta gat gaa gga tta1200Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400gaa atg tca cta gaa cct agc cac tta gca cgt cat gaa cgc aat aaa1248Glu Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415aag aga gca gaa gct gaa ggg aaa aaa taa1278Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>19<211>425<212>PRT<213>Fusobacterium nucleatum<400>19Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp
1 5 10 15Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Lys Ser20 25 30Val Glu Asp Leu Lys Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Phe50 55 60Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80Gln Ala Ile Pro Thr Ile Arg Glu Ile His Gln Ser Asp Ala Asp Met85 90 95Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140Gly Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220His Pro Ile Trp Met Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240
Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400Glu Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>20<211>1278<212>DNA<213>Fusobacterium nucleatum<220>
<221>CDS<222>(1)..(1278)<400>20atg aat aca gtt aat act cgt aaa aaa ttt ttc cca aat gta act gat48Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15gaa gaa tgg aat gat tgg aca tgg caa gta aaa aac cgc ctt aaa agt96Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Lys Ser20 25 30gtt gaa gat tta gaa aaa tat gtt gat tta agt gaa gaa gaa aca gaa144Val Glu Asp Leu Glu Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45ggg gtt gta cgc act ctt gaa act tta cgt atg gca atc act cca ttt192Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Phe50 55 60tac ttc tca ttg ata gat ttg aat agt gat cgc tgc cca ata cgt aag240Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80caa gct ata cct act ata cga gaa ata cat caa tct gat gct gat atg288Gln Ala Ile Pro Thr Ile Arg Glu Ile His Gln Ser Asp Ala Asp Met85 90 95ttg gat cct cta cat gaa gat gaa gac tct cca gta cca gga tta act336Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110cat cgc tat cca gat cgt gtt tta ctt cta ata aca gac atg tgt tct384His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125gta tac tgt cgc cac tgc act cgt cgc aga ttt gct ggg tca agt gat432Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140ggt gct atg cct atg gat aga att gac aaa gca ata gaa tat att gca480Gly Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160aaa act cca caa gta agg gat gta ttg tta tca gga gga gat gca ctt528Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175cta gtt tct aat aaa aaa tta gaa agc ata atc caa aaa cta cgc gca576Leu Val Ser Asn Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190ata cct cat gtt gaa ata atc aga ata gga agt cgt aca cca gtt gtt624Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205tta cct caa aga att act cct gaa tta tgt aat atg tta aag aaa tat672
Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220cat cca att tgg atg aat act cat ttt aac cac cct caa gaa gta acg720His Pro Ile Trp Met Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240cca gaa gct aaa aaa gct tgt gaa atg ttg gca gat gca gga gtt cca768Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255tta gga aat caa act gta cta tta aga gga ata aat gac agt gta cct816Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270gta atg aaa agg tta gta cat gat tta gta atg atg cgt gta cgc cct864Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285tat tat att tac caa tgt gac tta tct atg gga ctc gaa cac ttc cgc912Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300aca cca gtt tct aaa ggt ata gaa att att gaa gga tta cgt gga cat960Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320aca tct gga tat gca gta cca aca ttt gtt gtg cat gca cct ggt ggt1008Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335gga gga aaa act cca gta atg cct caa tat gta att tct caa tct cct1056Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro340 345 350cat cgt gta gtt tta cgc aac ttt gaa gga gtt ata aca act tat aca1104His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365gaa cca gaa aat tat aca cat gaa cct tgt tat gat gaa gaa aaa ttt1152Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380gaa aaa atg tat gaa ata agt gga gtt tat atg cta gat gaa gga tta1200Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400gaa atg tca cta gaa cct agc cac tta gca cgt cat gaa cgc aat aaa1248Glu Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415aag aga gca gaa gct gaa ggg aaa aaa taa1278Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425<210>21
<211>425<212>PRT<213>Fusobacterium nucleatum<400>21Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp1 5 10 15Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Leu Lys Ser20 25 30Val Glu Asp Leu Glu Lys Tyr Val Asp Leu Ser Glu Glu Glu Thr Glu35 40 45Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Phe50 55 60Tyr Phe Ser Leu Ile Asp Leu Asn Ser Asp Arg Cys Pro Ile Arg Lys65 70 75 80Gln Ala Ile Pro Thr Ile Arg Glu Ile His Gln Ser Asp Ala Asp Met85 90 95Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr100 105 110His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser115 120 125Val Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp130 135 140Gly Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala145 150 155 160Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu165 170 175Leu Val Ser Asn Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala180 185 190Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val195 200 205
Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr210 215 220His Pro Ile Trp Met Asn Thr His Phe Asn His Pro Gln Glu Val Thr225 230 235 240Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro245 250 255Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro260 265 270Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro275 280 285Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg290 295 300Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His305 310 315 320Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val His Ala Pro Gly Gly325 330 335Gly Gly Lys Thr Pro Val Met Puo Gln Tyr Val Ile Ser Gln Ser Pro340 345 350His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr355 360 365Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe370 375 380Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu385 390 395 400Glu Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys405 410 415Lys Arg Ala Glu Ala Glu Gly Lys Lys420 425
<210>22<211>20<212>DNA<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>Y is t/u or c;w is a or t/u.
<400>22ytwagaatgg cwatwacwcc 20<210>23<211>20<212>DNA<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>R is gor a,w is a or t/u.
<400>23agaaarcarg cwatwccwac 20<210>24<211>20<212>DNA<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>Y is t/u or c ;w is a or t/u.
<400>24ggwytwacwc ayagataycc 20<210>25<211>20<212>DNA
<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>Y is t/u or c ;w is a or t/u.
<400>25tawgtwgtwa twacwccytc 20<210>26<211>20<212>DNA<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>r is g or a ;w is a or t/u.
<400>26tcwacwacra awgtwggwac 20<210>27<211>20<212>DNA<213>Artificial<220>
<223>primer<220>
<221>misc_feature<222>(1)..(20)<223>r is g or a;w is a or t/u.
<400>27ccwccwccwg gwgcrtcwac 20<210>28<211>30<212>DNA<213>Artificial<220>
<223>primer<400>28cctttcagtt ggaattgagc actttagaac 30<210>29<211>30<212>DNA<213>Artificial<220>
<223>primer<400>29gatactgcgt tcctacattt gttgtggatg 30<210>30<211>29<212>DNA<213>Artificial<220>
<223>primer<400>30cgctgctcta tgtagctcta aagaaagag29<210>31<211>28<212>DNA<213>Artificial<220>
<223>primer<400>31cagcttgctt tcttacaggg tcatttgg 28<210>32<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>32atg agt tta aag gat aag ttt ttt tca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15
aat gat tgg aaa tgg caa gta aga aat cgt ata gaa act gtt gaa gaa96Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Glu Thr Val Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45aga tgt ctt gat aca tta aga atg gct att act cca tac tat cta tcg192Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60cta att gat gta gaa aat cca aat gac cct gta aga aag caa gct gta240Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80cct ctt tct tta gag cta cat aga gca gcg tct gat caa gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Gln Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat aga tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat aga gtt ctt ctt tta atg act gat caa tgt tca atg tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Met Tyr Cys115 120 125aga cac tgt act aga aga aga ttc gct ggt caa aca gat tct gct gtt432Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gct cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aaa aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt ata gga tca aga gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205aga att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa aga gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768
Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255caa agt gtg ctt ctt gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gat tta gtt aaa ata aga gta aga cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285tat caa tgt gac ctt tca gtt gga att gag cac ttt aga act cca gtt912Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg gat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt ctt aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cca gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>33<211>414<212>PRT<213>Clostridium sticklandii<400>33Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Glu Thr Val Glu Glu20 25 30
Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Gln Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Met Tyr Cys115 120 125Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly I1e Pro Leu Gly Asn245 250 255
Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320Tyr Cys Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>34<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>34atg agt tta aag gat aag ttt ttt tca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15aat gat tgg aaa tgg caa gta aga aat cgt ata gaa act gtt gaa gaa96
Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Glu Thr Val Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45cgc tgt ctt gat aca tta cgt atg gct att act cca tac tat cta tcg192Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60cta att gat gta gaa aat cca aat gac cct gta aga aag caa gct gta240Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80cct ctt tct tta gag ctg cat cgc gca gcg tct gat caa gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Gln Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat cgc tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat cgt gtt ctt ctt tta atg act gat caa tgt tca atg tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Met Tyr Cys115 120 125cgc tac tgt act cgt aga cgc ttc gct ggt caa aca gat tct gct gtt432Arg Tyr Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gct cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aaa aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt att gga tca cgt gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205cgt att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa cgt gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn
245 250 255caa agt gtg ctt ctt gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gat tta gtt aaa ata cgc gta cgt cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285tat caa tgt gac ctt tca gtt gga att gag cac ttt cgc act cca gtt912Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg gat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt cta aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cca gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>35<211>414<212>PRT<213>Clostridium sticklandii<400>35Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Glu Thr Val Glu Glu20 25 30
Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Gln Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Met Tyr Cys115 120 125Arg Tyr Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255
Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320Tyr Cys Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>36<211>45<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>36gaaatggcaa gtaagaaatc gtataaagac tgttgaagaa cttaa 45<210>37<211>35<212>DNA<213>Artificial
<220>
<223>mutagenesis primer<400>37tcgcgcagcg tctgatatgg aagacccact tcatg 35<210>38<211>40<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>38gactgatcaa tgttcagtat actgccgcca ctgtactcgt40<210>39<211>34<212>DNA<213>Artificial<220>
<223>mutagenesis primer<400>39gttcctacat ttgttgtgca tgcacctggt ggtg 34<210>40<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>40atg agt tta aag gat aag ttt ttt tca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15aat gat tgg aaa tgg caa gta aga aat cgt ata aag act gtt gaa gaa96Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45cgc tgt ctt gat aca tta cgt atg gct att act cca tac tat cta tcg192Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60
cta att gat gta gaa aat cca aat gac cct gta aga aag caa gct gta240Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80cct ctt tct tta gag ctg cat cgc gca gcg tct gat atg gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat cgc tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat cgt gtt ctt ctt tta atg act gat caa tgt tca gta tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125cgc cac tgt act cgt aga cgc ttc gct ggt caa aca gat tct gct gtt432Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gct cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aaa aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt att gga tca cgt gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205cgt att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa cgt gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255caa agt gtg ctt ctt gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gat tta gtt aaa ata cgc gta cgt cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285
tat caa tgt gac ctt tca gtt gga att gag cac ttt cgc act cca gtt912Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg cat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt cta aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cca gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>41<211>414<212>PRT<213>Clostridium sticklandii<400>41Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val
65 70 75 80Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300
Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>42<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>42atg agt tta aag gat aag ttt ttt aca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Thr His Val Ser Gln Glu Asp Trp1 5 10 15aat gat tgg aaa tgg caa gta aga aat cgt ata aag act gtt gaa gaa96Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45cgc tgt ctt gat aca tta cgt atg gct att act cca tac tat cta tcg192Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60
cta att gat gta gaa aat cca aat gac cct gta aga aag caa gct gta240Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80cct ctt tct tta gag ctg cat cgc gca gcg tct gat atg gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat cgc tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat cgc gtt ctt ctt tta atg act gat caa tgt tca gta tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125cgc cac tgt act cgt aga cgc ttc gct ggt cga aca gat tct gct gtt432Arg His Cys Thr Arg Arg Arg Phe Ala Gly Arg Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gct cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aga aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Arg Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt att gga tca cgt gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205cgt att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa cgt gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255caa agt gtg ctt ctt gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gac tta gtt aaa ata cgc gta cgt cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285tat caa tgt gac ctt tca gtt gga att gag cac ttt cgc act cca gtt912
Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg cat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt cta aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cct gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>43<211>414<212>PRT<213>Clostridium sticklandii<400>43Met Ser Leu Lys Asp Lys Phe Phe Thr His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Cys Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80
Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125Arg His Cys Thr Arg Arg Arg Phe Ala Gly Arg Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Arg Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300
Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>44<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>44atg agt tta aag gat aag ttt ttt tca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15aat gat tgg aaa tgg caa gta aga aat cgt ata aag act gct gaa gaa96Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Ala Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45cgc tgt cat gat aca tta cgt atg gct att act cca tac tat cta tcg192Arg Cys His Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60cta att gat gta gga aat cca aat gac cct gta aga aag caa gct gta240
Leu Ile Asp Val Gly Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80cct ctt tct tta gag ctg cat cgc gca gcg tct gat atg gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat cgc tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat cgt gtt ctt ctt tta atg act gat cta tgt tca gta tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Leu Cys Ser Val Tyr Cys115 120 125cgc cac tgt act cgt aga cgc ttc gct ggt caa aca gat tct gct gtt432Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gca cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aaa aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt att gga tca cgt gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205cgt att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa cgt gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255caa agt gtg ctt cta gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gat tta gtt aaa ata cgc gta cgt cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285tat caa tgt gac ctt tca gtt gga att gag cac ttt cgc act cca gtt912Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val
290 295 300gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg cat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt cta aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cca gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>45<211>414<212>PRT<213>Clostridium sticklandii<400>45Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Ala Glu Glu20 25 30Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Cys His Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Gly Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80
Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Leu Cys Ser Val Tyr Cys115 120 125Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300
Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>46<211>1245<212>DNA<213>Clostridium sticklandii<220>
<221>CDS<222>(1)..(1245)<400>46atg agt tta aag gat aag ttt ttt tca cat gta agc caa gaa gat tgg48Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15aat gat tgg aaa tgg caa gta aga aat cgt ata aag act gtt gaa gaa96Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30ctt aaa aaa tat att cca ctt act cca gaa gaa gaa gaa ggg gta aaa144Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45cgc cgt ctt gat aca tta cgt atg gct att act cca tac tat cta tcg192Arg Arg Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60cta att gat gta gaa aat cca aat gac cct gta aga aag caa gct gta240Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val
65 70 75 80cct ctt tct tta gag ctg cat cgc gca gcg tct gat atg gaa gac cca288Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95ctt cat gaa gat gga gat tct cca gtt cca gga ctt aca cat cgc tat336Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110cct gat cgt gtt ctt ctt tta atg act gat caa tgt tca gta tac tgc384Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125cgc cac tgt act cgt aga cgc ttc gct ggt caa aca gat tct gct gtt432Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140gat acg aag caa ata gat gct gcg att gaa tat atc aaa aat act cca480Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160caa gta aga gac gtt cta ctt tca gga gga gat gct cta tta atc tca528Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175gat gaa aag ctt gag tac aca atc aaa aga ctt cgt gaa ata cca cac576Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190gtt gag gtt att cgt att gga tca cgt gta cca gtt gta atg cca caa624Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205cgt att aca cca gaa cta gtt tct atg ctt aaa aag tat cat cca gta672Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220tgg tta aat aca cac ttc aac cat cct aat gaa att act gaa gag tct720Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240aaa cgt gca tgt gag tta ctt gct gat gca ggt att cct ctt gga aat768Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255caa agt gtg ctt ctt gca ggt gta aat gat tgc atg cac gtt atg aaa816Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270aaa cta gta aat gat tta gtt aaa ata cgc gta cgt cct tac tat att864Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285tat caa tgt gac ctt tca gtt gga att gag cac ttt cgc act cca gtt912Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300
gca aag gga ata gaa ata att gaa ggc tta aga gga cat act tca gga960Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly305 310 315 320tac tgc gtt cct aca ttt gtt gtg cat gca cct ggt ggt gga gga aaa1008Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335act cca gtt atg cca aac tat gtt att tca caa aat cac aat aaa gtt1056Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350att tta cgt aac ttt gaa ggt gta att aca act tac gat gag cct gat1104Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365cat tat act ttc cac tgt gac tgt gat gta tgc act gga aaa aca aat1152His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380gtt cat aag gtt gga gta gct gga ctt cta aat gga gag aca gcg aca1200Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400ctt gaa cca gag ggt ttg gaa aga aaa caa aga gga cat cac taa1245Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>47<211>414<212>PRT<213>Clostridium sticklandii<400>47Met Ser Leu Lys Asp Lys Phe Phe Ser His Val Ser Gln Glu Asp Trp1 5 10 15Asn Asp Trp Lys Trp Gln Val Arg Asn Arg Ile Lys Thr Val Glu Glu20 25 30Leu Lys Lys Tyr Ile Pro Leu Thr Pro Glu Glu Glu Glu Gly Val Lys35 40 45Arg Arg Leu Asp Thr Leu Arg Met Ala Ile Thr Pro Tyr Tyr Leu Ser50 55 60Leu Ile Asp Val Glu Asn Pro Asn Asp Pro Val Arg Lys Gln Ala Val65 70 75 80
Pro Leu Ser Leu Glu Leu His Arg Ala Ala Ser Asp Met Glu Asp Pro85 90 95Leu His Glu Asp Gly Asp Ser Pro Val Pro Gly Leu Thr His Arg Tyr100 105 110Pro Asp Arg Val Leu Leu Leu Met Thr Asp Gln Cys Ser Val Tyr Cys115 120 125Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Thr Asp Ser Ala Val130 135 140Asp Thr Lys Gln Ile Asp Ala Ala Ile Glu Tyr Ile Lys Asn Thr Pro145 150 155 160Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu Ile Ser165 170 175Asp Glu Lys Leu Glu Tyr Thr Ile Lys Arg Leu Arg Glu Ile Pro His180 185 190Val Glu Val Ile Arg Ile Gly Ser Arg Val Pro Val Val Met Pro Gln195 200 205Arg Ile Thr Pro Glu Leu Val Ser Met Leu Lys Lys Tyr His Pro Val210 215 220Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Ile Thr Glu Glu Ser225 230 235 240Lys Arg Ala Cys Glu Leu Leu Ala Asp Ala Gly Ile Pro Leu Gly Asn245 250 255Gln Ser Val Leu Leu Ala Gly Val Asn Asp Cys Met His Val Met Lys260 265 270Lys Leu Val Asn Asp Leu Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile275 280 285Tyr Gln Cys Asp Leu Ser Val Gly Ile Glu His Phe Arg Thr Pro Val290 295 300Ala Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His Thr Ser Gly
305 310 315 320Tyr Cys Val Pro Thr Phe Val Val His Ala Pro Gly Gly Gly Gly Lys325 330 335Thr Pro Val Met Pro Asn Tyr Val Ile Ser Gln Asn His Asn Lys Val340 345 350Ile Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Asp Glu Pro Asp355 360 365His Tyr Thr Phe His Cys Asp Cys Asp Val Cys Thr Gly Lys Thr Asn370 375 380Val His Lys Val Gly Val Ala Gly Leu Leu Asn Gly Glu Thr Ala Thr385 390 395 400Leu Glu Pro Glu Gly Leu Glu Arg Lys Gln Arg Gly His His405 410<210>48<211>1251<212>DNA<213>Porphyromonas gingivalis<220>
<221>CDS<222>(1)..(1251)<400>48atg gca gaa agt cgt aga aag tat tat ttc cct gat gtc acc gat gag48Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15caa tgg tac gac tgg cat tgg cag gtc ctc aat cga att aag acg ctc96Gln Trp Tyr Asp Trp His Trp Gln Val Leu Asn Arg Ile Lys Thr Leu20 25 30gac cag ctg aaa aag tac gtt aca ctc acc gct gaa gaa gaa gag gga144Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45gta aaa gaa tcg ccc aaa gta ctc cga atg gct atc aca cct tat tat192Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60ttg agt ttg ata gac ccc gag aat cct aat tgt ccg att cgt aaa caa240Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80
gcc att cct act caa cag gaa ctg gta cgt gct cct gaa gat cag gta288Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95gac cca ctt agt gaa gat gaa gat tcg ccc gta ccc gga ctg act cat336Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110cgt tat ccg gat cgt gta ttg ttc ctt atc acg gac aaa tgt tcg atg384Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125tac tgt cgt cat tgt act cgc cgt cgc ttc gca gga cag aaa gat gct432Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140tct tct cct tct gag cgc atc gat cga tgc att gac tat ata gcc aat480Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160aca ccg aca gtc cgc gat gtt ttg cta tcg gga ggc gat gcc ctc ctt528Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175gtc agc gac gaa cgc ttg gaa tac ata ttg aag cgt ctg cgc gaa gta576Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Val180 185 190cct cat gtg gag att gtt cgt ata gga agc cgt acg ccg gta gtc ctc624Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205cct cag cgt ata acg cct caa ttg gtg gat atg ctc aaa aaa tat cat672Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220ccg gtg tgg ctg aac act cac ttc aac cac ccg aat gaa gtt acc gaa720Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240gaa gca gtg gag gct tgt gaa aga atg gcc aat gcc ggt att ccg ttg768Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255ggt aac caa acg gtt tta ttg cgt gga atc aat gat tgt aca cat gtg816Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270atg aag aga ttg gta cat ttg ctg gta aag atg cgt gtg cgt cct tac864Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285tat ata tat gta tgc gat ctt tcg ctt gga ata ggt cat ttc cgc acg912Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300
ccg gta tct aaa gga atc gaa att atc gaa aat ttg cgc gga cac acc960Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320tcg ggc tat gca gtt cct acc ttt gtg gta ggt gct ccg ggg ggt ggt1008Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335ggt aag ata cct gta acg ccg aac tat gtt gta tct cag tcc cca cga1056Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350cat gtg gtt ctt cgc aat tat gaa ggt gtt atc aca acc tat acg gag1104His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365ccg gag aat tat cat gag gag tgc gat tgt gag gac tgt cga gcc ggt1152Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380aag cat aaa gag ggt gta gct gca ctt tcc gga ggt cag cag ttg gct1200Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400atc gag cct tcc gac tta gct cgc aaa aaa cgc aag ttt gat aag aac1248Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415tga1251<210>49<211>416<212>PRT<213>Porphyromonas gingivalis<400>49Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15Gln Trp Tyr Asp Trp His Trp Gln Val Leu Asn Arg Ile Lys Thr Leu20 25 30Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80
Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Val180 185 190Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300
Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415<210>50<211>1251<212>DNA<213>Porphyromonas gingivalis<220>
<221>CDS<222>(1)..(1251)<400>50atg gca gaa agt cgt aga aag tat tat ttc cct gat gtc acc gat gag48Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15cae tgg tac gac tgg cat tgg cag gtc atc aat cga att aag acg ctc96Gln Trp Tyr Asp Trp His Trp Gln Val Ile Asn Arg Ile Lys Thr Leu20 25 30gac cag ctg aaa aag tac gtt aca ctc acc gct gaa gaa gaa gag gga144Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45gta aaa gaa tcg ccc aaa gta ctc cga atg gct atc aca cct tat tat192Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60ttg agt ttg ata gac ccc gag aat cct aat tgt ccg att cgt aaa caa240Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln
65 70 75 80gcc att cct act caa cag gaa ctg gta cgt gct cct gaa gat cag gta288Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95gac cca ctt agt gaa gat gaa gat tcg ccc gta ccc gga ctg act cat336Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110cgt tat ccg gat cgt gta ttg ttc ctt atc acg gac aaa tgt tcg atg384Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125tac tgt cgt cat tgt act cgc cgt cgc ttc gca gga cag aaa gat gct432Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140tct tct cct tct gag cgc atc gat cga tgc att gac tat ata gcc aat480Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160aca ccg aca gtc cgc gat gtt ttg cta tcg gga ggc gat gcc ctc ctt528Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175gtc agc gac gaa cgc ttg gaa tac ata ttg aag cgt ctg cgc gaa gta576Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Val180 185 190cct cat gtg gag att gtt cgt ata gga agc cgt acg ccg gta gtc ctc624Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205cct cag cgt ata acg cct caa ttg gtg gat atg ctc aaa aaa tat cat672Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220ccg gtg tgg ctg aac act cac ttc aac cac ccg aat gaa gtt acc gaa720Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240gaa gca gtg gag gct tgt gaa aga atg gcc aat gcc ggt att ccg ttg768Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255ggt aac caa acg gtt tta ttg cgt gga atc aat gat tgt aca cat gtg816Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270atg aag aga ttg gta cat ttg ctg gta aag atg cgt gtg cgt cct tac864Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285tat ata tat gta tgc gat ctt tcg ctt gga ata ggt cat ttc cgc acg912Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300
ccg gta tct aaa gga atc gaa att atc gaa aat ttg cgc gga cac acc960Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320tcg ggc tat gca gtt cct acc ttt gtg gta ggt gct ccg ggg ggt ggt1008Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335ggt aag ata cct gta acg ccg aac tat gtt gta tct cag tcc cca cga1056Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350cat gtg gtt ctt cgc aat tat gaa ggt gtt atc aca acc tat acg gag1104His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365ccg gag aat tat cat gag gag tgc gat tgt gag gac tgt cga gcc ggt1152Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380aag cat aaa gag ggt gta gct gca ctt tcc gga ggt cag cag ttg gct1200Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400atc gag cct tcc gac tta gct cgc aaa aaa cgc aag ttt gat aag aac1248Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415tga1251<210>51<211>416<212>PRT<213>Porphyromonas gingivalis<400>51Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pra Asp Val Thr Asp Glu1 5 10 15Gln Trp Tyr Asp Trp His Trp Gln Val Ile Asn Arg Ile Lys Thr Leu20 25 30Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45Val Lys Glu Ser Pro Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80
Ala Ile Pro Thr Gln Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val85 90 95Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Val180 185 190Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300
Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320Ser Gly Tyr Ala Val Pro Thr Phe Val Val Gly Ala Pro Gly Gly Gly325 330 335Gly Lys Ile Pro Val Thr Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415<210>52<211>416<212>PRT<213>Porphyromonas gingivalis<400>52Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu1 5 10 15Gln Trp Asn Asp Trp His Trp Gln Val Leu Asn Arg Ile Glu Thr Leu20 25 30Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly35 40 45Val Lys Glu Ser Leu Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr50 55 60Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln65 70 75 80Ala Ile Pro Thr His Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val
85 90 95Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His100 105 110Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met115 120 125Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala130 135 140Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn145 150 155 160Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu165 170 175Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Ile180 185 190Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu195 200 205Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His210 215 220Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu225 230 235 240Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu245 250 255Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val260 265 270Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr275 280 285Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr290 295 300Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr305 310 315 320
Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly325 330 335Gly Lys Ile Pro Val Met Pro Asn Tyr Val Val Ser Gln Ser Pro Arg340 345 350His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu355 360 365Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly370 375 380Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala385 390 395 400Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn405 410 415<210>53<211>60<212>DNA<213>Artificial<220>
<223>primer<400>53tatcaattcg ttacaggcga tacatggcac gcttcggcgc gtgtaggetg gagctgcttc 60<210>54<211>60<212>DNA<213>Artificial<220>
<223>primer<400>54gatgtcgcgg ctggtgagta accagccgca gggataacaa catatgaata tcctccttag 60<210>55<211>20<212>DNA<213>Artificial<220>
<223>primer
<400>55ttaccgagca gcgttcagag 20<210>56<211>20<212>DNA<213>Artificial<220>
<223>primer<400>56cacctggcgg tgacaaccat 20<210>57<211>60<212>DNA<213>Artificial<220>
<223>primer<400>57gcggcgtgaa gtttcccaac ccgttctgcc tctcttcttc gtgtaggctg gagctgcttc 60<210>58<211>60<212>DNA<213>Artificial<220>
<223>primer<400>58ttacaacgtt accgggtgtt ctttctcgcc tttcttaaac catatgaata tcctccttag 60<210>59<211>471<212>PRT<213>Bacillus subtilis<400>59Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu1 5 10 15Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln20 25 30Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn
35 40 45Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile50 55 60Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn65 70 75 80Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met85 90 95His Lys Thr Lys Tyr Asp Leu Glu Asp Pro Leu His Glu Asp Glu Asp100 105 110Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe115 120 125Leu Val Thr Asn Gln Cys Ser Met Tyr Cys Arg Tyr Cys Thr Arg Arg130 135 140Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp145 150 155 160Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu165 170 175Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr180 185 190Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile195 200 205Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu210 215 220Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe225 230 235 240Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys245 250 255Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala260 265 270
Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu275 280 285Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser290 295 300Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile305 310 315 320Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe325 330 335Val Val Asp Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn340 345 350Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu355 360 365Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln370 375 380Ala Asp Ala Tyr Phe Glu Ser Val Phe Pro Glu Thr Ala Asp Lys Lys385 390 395 400Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe405 410 415Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala420 425 430Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln435 440 445Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr450 455 460Glu Cys Gly Gly Asp Ser Ser465 470
权利要求
1.包含丙氨酸2,3-氨基变位酶活性的分离多肽,其中所述多肽含有突变的赖氨酸2,3-氨基变位酶的氨基酸序列,且其中突变的赖氨酸2,3-氨基变位酶氨基酸序列含有P/S11T;N19Y;L/K/R/T26I;E/R30K;L/V32A;K36E;S/T/C52R;L/T53P/H;Y63F;E/N/D71G;H/I/S85Q;Q/L/E86R;Q/L95M;K/M/Q125L;M128V;Y132H;Q/S141R;A/D/S/M144G;D179N;K/Q187R;I192V;L228M;D331G/H;M/Q342T或K/Q/T398E取代,或其组合,其中所述编号是基于牙龈卟啉单胞菌(Porphyromonas gingivalis)赖氨酸2,3氨基变位酶。
2.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列是突变的枯草芽孢杆菌(Bacillus subtilis),斯氏梭菌(Clostridium sticklandii),具核梭杆菌(Fusobacterium nucleatum)或牙龈卟啉单胞菌(Porphyromonas gingivalis)赖氨酸2,3-氨基变位酶。
3.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有N19Y,L/T53P/H,H/I/S85Q,D331G/H和M/Q342T取代。
4.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有N19Y,E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H和M/Q342T取代。
5.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有N19Y,L/K/R/T26I;E/R30K,L/T53P/H,H/I/S85Q,I192V,D331G/H和M/Q342T取代。
6.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有E/R30K,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,L228M,D331G/H和K/Q/T398E取代。
7.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有E/R30K,C52R,Q/L95M;M128V和D331G/H取代。
8.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有E/R30K,K36E,Y63F,Q/L/E86R,Q/L95M,M128V,A/D/S/M144G,D179N,L228M,D331G/H和K/Q/T398E取代。
9.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有E/R30K,Q/L95M,M128V和D331G/H取代。
10.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有P/S11T,E/R30K,Q/L95M,M128V,Q/S141R,K/Q187R和D331G/H取代。
11.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有E/R30K,L/V32A,L/T53P/H,E/N/D71G,Q/L95M;K/M/Q125L,M128V和D331G/H取代。
12.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有Q/L95M,M128V和D331G/H取代。
13.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有Q/L95M,M128V;Y132H和D331G/H取代。
14.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有至少3个取代。
15.权利要求1的分离多肽,其中所述突变的赖氨酸2,3-氨基变位酶氨基酸序列含有3-11个取代。
16.权利要求1的分离多肽,其中所述多肽含有与SEQ ID NO19,21,43,45,47,49或51具有至少90%同一性的序列。
17.权利要求1的分离多肽,其中所述多肽含有与SEQ ID NO19,21,43,45,47,49或51具有至少95%同一性的序列。
18.权利要求1的分离多肽,其中所述多肽含有SEQ ID NO19,21,43,45,47,49或51。
19.权利要求17的多肽,其中所述多肽含有1-10个保守氨基酸取代。
20.含有编码如权利要求1所述分离多肽的核酸序列的分离核酸。
21.可操作连接于启动子序列的如权利要求20所述的分离核酸。
22.权利要求20的分离核酸,其中所述核酸含有与SEQ ID NO18,20,42,44,46,48或50具有至少90%同一性的序列。
23.权利要求20的分离核酸,其中所述核酸含有与SEQ ID NO18,20,42,44,46,48或50具有至少95%同一性的序列。
24.权利要求20的分离核酸,其中所述核酸序列包括导致1-10保守氨基酸取代的一个或多个取代。
25.权利要求20的分离核酸,其中所述核酸包括SEQ ID NO18,20,42,44,46,48或50。
26.含有如权利要求20所述的分离核酸的载体。
27.含有如权利要求20所述的分离核酸的重组核酸。
28.用权利要求27所述的重组核酸转化的细胞。
29.权利要求28的细胞,其中所述细胞是原核细胞。
30.权利要求29的细胞,其中所述原核细胞是乳杆菌(Lactobacillus),乳球菌(Lactococcus),芽孢杆菌(Bacillus)或埃希氏肠杆菌细胞(Escherichia)。
31.权利要求28的细胞,其中所述细胞是植物细胞,细菌细胞,酵母细胞或真菌细胞。
32.含有如权利要求31所述的细胞的植物。
33.含有如权利要求27所述的重组核酸的转基因植物。
34.权利要求28的细胞,其中所述细胞含有丙氨酸2,3-氨基变位酶活性并可从α-丙氨酸制备β-丙氨酸。
35.权利要求28的细胞,其中所述分离的核酸序列含有与SEQ IDNO18,20,42,44,46,48或50具有至少90%同一性的序列。
36.权利要求28的细胞,其中所述分离核酸序列含有SEQ ID NO18,20,42,44,46,48或50。
37.权利要求28的细胞,其中所述细胞产生3-羟丙酸(3-HP)。
38.权利要求37的细胞,其中所述细胞还包括丙酮酸/2-酮戊二酸盐氨基转移酶活性;β-丙氨酸/2-酮戊二酸盐氨基转移酶活性;和
3-羟丙酸盐脱氢酶活性。
39.权利要求38的细胞,其中所述细胞还具有脂酶或酯酶活性。
40.权利要求39的细胞,其中所述细胞产生3-HP的酯。
41.权利要求40的细胞,其中所述3-HP的酯是3-羟丙酸甲酯,3-羟丙酸乙酯,3-羟丙酸丙酯,3-羟丙酸丁酯或3-羟丙酸2-乙基己基酯。
42.权利要求38的细胞,其中所述细胞还含有聚羟酸合成酶活性。
43.权利要求42的细胞,其中所述细胞产生聚合的3-HP。
44.权利要求38的细胞,其中所述细胞还包括编码具有醇脱氢酶活性的肽的核酸分子,编码具有醛脱氢酶活性的肽的核酸分子或二者皆有。
45.权利要求44的细胞,其中所述细胞产生1,3-丙二醇。
46.权利要求28的细胞,其中所述细胞还含有α-酮泛解酸盐羟甲基转移酶活性;α-酮泛解酸盐还原酶活性;和泛酸盐合酶活性。
47.权利要求46的细胞,其中所述细胞产生泛酸盐。
48.权利要求46的细胞,其中所述细胞还包括泛酸盐激酶活性;4′-磷酸泛酰基-1-半胱氨酸合成酶活性;4′-磷酸泛酰半胱氨酸脱羧酶活性;ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶活性;和脱磷酸-CoA激酶活性。
49.权利要求48的细胞,其中所述细胞产生辅酶A(CoA)。
50.含有至少一种外源核酸分子的转化细胞,其中至少有一种外源核酸分子含有编码权利要求1所述多肽的核酸序列。
51.权利要求50的转化的细胞,其中所述细胞从α-丙氨酸产生β-丙氨酸。
52.权利要求51的细胞,其中所述细胞产生3-HP,1,3-丙二醇,泛酸盐,CoA或其组合。
53.制备含有丙氨酸2,3-氨基变位酶活性的多肽的方法,其包括在允许细胞产生含有丙氨酸2,3-氨基变位酶活性的多肽的条件下培养权利要求28所述的细胞。
54.从α-丙氨酸制备β-丙氨酸的方法,该方法包括在允许细胞从α-丙氨酸制备β-丙氨酸的条件下培养权利要求28所述的细胞。
55.权利要求54的方法,其中所述细胞含有至少一种编码丙氨酸2,3-氨基变位酶的外源核酸分子,其中所述丙氨酸2,3-氨基变位酶能从α-丙氨酸产生β-丙氨酸。
56.权利要求54的方法,其中所述细胞是原核细胞。
57.权利要求56的方法,其中所述细胞含有功能性缺失panD。
58.制备3-HP的方法,该方法包括在所述细胞产生3-HP的条件下培养权利要求38所述的细胞。
59.权利要求58的方法,其中所述细胞含有至少一种编码丙氨酸2,3-氨基变位酶从而使得从β-丙氨酸产生3-HP的外源核酸,其中所述丙氨酸2,3-氨基变位酶能从α-丙氨酸产生β-丙氨酸。
60.制备3-HP的酯的方法,该方法包括在细胞产生3-HP的酯的条件下培养权利要求39所述的细胞。
61.制备聚合的3-HP的方法,该方法包括在细胞产生聚合的3-HP的条件下培养权利要求42所述的细胞。
62.制备1,3-丙二醇的方法,该方法包括在细胞产生1,3-丙二醇的条件下培养权利要求44所述的细胞。
63.制备泛酸盐的方法,该方法包括在细胞产生泛酸盐的条件下培养权利要求46所述的细胞。
64.制备CoA的方法,该方法包括在细胞产生CoA的条件下培养权利要求48所述的细胞。
65.制备3-HP的方法,该方法包括从权利要求28所述的细胞中纯化β-丙氨酸;将所述β-丙氨酸与含有β-丙氨酸/2-酮戊二酸盐氨基转移酶活性的多肽接触从而形成3-酮丙酸盐;且将3-酮丙酸盐与含有3-羟丙酸盐脱氢酶活性的多肽相接触从而制备3-HP。
66.制备3-HP的方法,该方法包括使用编码含有丙酮酸盐/2-酮戊二酸盐氨基转移酶活性多肽的核酸分子,使用编码含有β-丙氨酸/2-酮戊二酸盐氨基转移酶活性多肽的核酸分子,和使用编码含有3-羟丙酸盐脱氢酶活性多肽的核酸分子转染权利要求28所述的细胞;且培养所转染的细胞从而使该转染的细胞制备3-HP。
67.从3-HP制备1,3-丙二醇的方法,该方法包括使用权利要求65的方法制备3-HP;将所述3-HP与含有醇脱氢酶活性的多肽和含有醛脱氢酶活性的多肽接触从而制备1,3-丙二醇。
68.制备1,3-丙二醇的方法,该方法包括使用编码含有丙酮酸盐/2-酮戊二酸盐氨基转移酶活性的多肽的核酸分子,使用编码含有β-丙氨酸/2-酮戊二酸盐氨基转移酶活性的多肽的核酸分子,使用编码含有3-羟丙酸盐脱氢酶活性的多肽的核酸分子,使用编码含有醛脱氢酶活性的多肽的核酸,和使用编码含有醇脱氢酶活性的多肽的核酸转染权利要求28所述的细胞;且培养所转染的细胞从而允许该转染的细胞制备1,3-丙二醇。
69.制备泛酸盐的方法,该方法包括从权利要求28所述的细胞中纯化β-丙氨酸;以及将所述β-丙氨酸与α-酮泛解酸盐羟甲基转移酶,α-酮泛解酸盐还原酶和泛酸盐合酶相接触从而制备泛酸盐。
70.制备泛酸盐的方法,该方法包括使用编码含有α-酮泛解酸盐羟甲基转移酶活性的多肽的核酸分子,使用编码含有α-酮泛解酸盐还原酶活性的多肽的核酸分子,和使用编码含有泛酸盐合酶活性的多肽的核酸分子转染权利要求28所述的细胞;以及培养所转染的细胞从而允许该转染的细胞制备泛酸盐。
71.制备CoA的方法,该方法包括从权利要求28所述的细胞中纯化β-丙氨酸;以及将所述β-丙氨酸与α-酮泛解酸盐羟甲基转移酶,α-酮泛解酸盐还原酶和泛酸盐合酶相接触从而制备泛酸盐;以及将所述泛酸盐与泛酸盐激酶,4′-磷酸泛酰基-1-半胱氨酸合成酶,4′-磷酸泛酰半胱氨酸脱羧酶,ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶和脱磷酸-CoA激酶接触从而制备CoA。
72.制备CoA的方法,该方法包括使用编码含有α-酮泛解酸盐羟甲基转移酶活性的多肽的核酸分子,使用编码含有α-酮泛解酸盐还原酶活性的多肽的核酸分子,和使用编码含有泛酸盐合酶活性的多肽的核酸分子,使用编码含有泛酸盐激酶活性的多肽的核酸分子,使用编码含有4′-磷酸泛酰基-1-半胱氨酸合成酶活性的多肽的核酸分子,使用编码含有4′-磷酸泛酰半胱氨酸脱羧酶活性的多肽的核酸分子,使用编码含有ATP4′-磷酸泛酰巯基乙胺腺嘌呤基转移酶活性的多肽的核酸分子,和使用编码含有脱磷酸-CoA激酶活性的多肽的核酸分子转染权利要求28所述的细胞;且培养所转染的细胞从而允许该转染的细胞制备泛酸盐
73.特异性结合于权利要求1所述多肽的特异性结合剂。
全文摘要
本发明公开了丙氨酸2,3-氨基变位酶的序列,本发明还公开了具有丙氨酸2,3-氨基变位酶活性的细胞以及选择这些细胞的方法。本发明还公开了制备β-丙氨酸,泛酸盐,3-羟丙酸,以及其他有机化合物的方法。
文档编号C12N9/00GK1993377SQ200480043720
公开日2007年7月4日 申请日期2004年7月30日 优先权日2004年7月30日
发明者奥利·J·耶森, 拉维·R·戈卡恩, 史蒂文·J·戈特, 奥尔加·V·谢利丰诺娃, 汉斯·H·廖, 布赖恩·J·布拉佐 申请人:卡吉尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1