具有反馈抗性的甲羟戊酸激酶的制作方法

文档序号:426315阅读:1172来源:国知局
专利名称:具有反馈抗性的甲羟戊酸激酶的制作方法
技术领域
本发明提供了经过修饰的甲羟戊酸激酶(mevalonate kinase),其对于反馈抑制具有更小的敏感度。该经过修饰的酶和编码该酶的多核苷酸可被用于生产类异戊二烯(isoprenoid)化合物,用于治疗具有甲羟戊酸激酶活性降低的特征的疾病,以及用于诊断用途。
甲羟戊酸激酶(MK)是甲羟戊酸途径中必需的酶,所述途径导致了大量细胞内类异戊二烯的产生。类异戊二烯途径的产物异戊烯二磷酸(IPP),以及同质异构化合物,二甲基烯丙基二磷酸(DAMPP)是所有生物中类异戊二烯的基本构建物质。类异戊二烯包括超过23000种天然存在的初级和次级代谢物分子。该类天然产物的化学多样性反映了它们在生物系统中多种多样的生理作用。类异戊二烯包括,例如细菌中的植烷三萜、泛醌和甲基萘醌,植物中的类胡萝卜素、质体醌、单/一个半/双/三萜以及叶绿素的含异戊二烯基侧链,和哺乳动物中的血红素A、醌、多萜醇、固醇/类固醇和类维生素A。此外,类异戊二烯还涉及异戊烯tRNA、蛋白质异戊烯化以及胆固醇修饰,例如对刺猬类细胞信号蛋白质进行的。
人们已在多种生物中于生物化学及分子水平上对MK酶进行了分析(Houten et al.,Biochim.Biophys.Acta 1529,19-32,2000)。目前,很多甲羟戊酸激酶的DNA和氨基酸序列都是已知的(例如,Swiss-Prot编号/IDsP07277/kime_yeast;Q9R008/kime_mouse;P17256/kime_rat;Q03426/kime_human;P46086/kime_arath;Q09780/kime_schpo;Q9V187/kime_pyrab;059291/kime_pyrho;Q8UOF3/kime_pyrfu;Q50559/kime_metth;027995/kime_arcfu;Q58487/kime_metia;Q9Y946/kime_aerpe),并且,每个月还会有一些序列被增加到已知甲羟戊酸激酶序列的列表中。基于其与已知甲羟戊酸激酶序列的相似性,上述从基因组测序计划中获得的序列已被赋予了假定的甲羟戊酸激酶功能。但是,对本领域的技术人员而言,很容易证明这些序列事实上能编码具有甲羟戊酸激酶活性的蛋白质。
在调控的方面,人们普遍认为HMG-CoA还原酶是甲羟戊酸途径中的速度决定酶(例如,Goldstein and Brown,Nature 343,425-430,1990;Weinberger,Trends Endocrinol.Metab.7,1-6,1996;Hampton et al.,TrendsBiochem.Sci.21,140-145,1996;Houten et al.,J.Biol.Chem.278,5736-5743,2003)。与该观点一致的是,向培养基中添加甲羟戊酸已显示出能激活Phaffia rhodozyma(Calo et al.,Biotechnol.Lett.17,575-578,1995)和Haematococcus pluvialis(Kobayashi et al.,J.Ferment.Bioeng.71,335-339,1991)中的类胡萝卜素生产。但是,近年来更多的证据显示,甲羟戊酸激酶会受到反馈抑制,例如下游产物,牻牛基二磷酸(geranyldiphosphate)、法呢基二磷酸(farnesyldiphosphate)、双牻牛基二磷酸(geranylgeranyldiphosphate)所造成的。这种反馈抑制还可在对甲羟戊酸途径的调控和速度限制中发挥作用,因此,通常对类异戊二烯的生物合成的调控和速度限制发挥作用。
在人类中,甲羟戊酸激酶的缺乏被鉴定为下述人类遗传疾病的生物化学和分子诱因,从而显示出其重要性,所述疾病包括甲羟戊酸尿症、超免疫球蛋白D症以及周期性发热综合征(Houten et al.,2000;Nwokoro et al.,Mol.Genet.metab.74,105-119,2001)。上述疾病的病理尚属未知,但最终将发现其与甲羟戊酸激酶在体内的作用以及与急相反应和发热有关的类异戊二烯生物合成有关。甲羟戊酸激酶缺乏看上去还与(例如)Zellweger综合征和肢近端型点状软骨发育不良(rhizomelic chondrodysplasia punctata)有关,这是过氧化物酶生物合成紊乱的疾病,其中,一组过氧化物酶,包括甲羟戊酸激酶,不能被转运到过氧化物酶体中(Kelley and Herman,Annu.Rev.Genomics Hum.Genet.2,299-341,2001)。最后,甲羟戊酸激酶被认为在细胞内增殖、细胞周期调控和/或细胞内转化中发挥作用(见Graef et al.,virology 208,696-703,1995;Hinson et al.,J.Biol.Chem.272,26756-26760.1997)。
目前研究的所有甲羟戊酸激酶都会受所述途径下游产物的反馈抑制。目前还没有报道过对反馈抑制具有抗性的甲羟戊酸激酶,例如,法呢基二磷酸或双牻牛基二磷酸造成的反馈抑制。对反馈具有抗性的甲羟戊酸激酶可能具有工业潜力,例如(1)在用生物技术对所有类型的类异戊二烯化合物(例如,类胡萝卜素、辅酶Q10、维生素D、固醇等)进行的生产中,(2)作为具有诊断用处的酶,用于,例如,用酶测量生物流体中的甲羟戊酸浓度,或(3)作为治疗用酶,用于降低甲羟戊酸尿症病患的甲羟戊酸浓度。对反馈具有抗性的MK特别适于对类异戊二烯进行生物技术途径的生产,因为它们能使得甲羟戊酸途径具有更大的通量,因此使得类异戊二烯产量更高。
本文中使用的术语“甲羟戊酸激酶”将表示任何能够催化甲羟戊酸酯(甲羟戊酸)磷酸化反应的酶,所述反应包括甲羟戊酸酯(甲羟戊酸)向5-磷酸甲羟戊酸酯(5-磷酸甲羟戊酸)的转化,或甲羟戊酸类似物(例如,Wilde and Eggerer,Eur.J.Biochem.221,463-473,1994所述的)向其相应的磷酸化化合物的转化。为提供对甲羟戊酸(或甲羟戊酸类似物)的磷酸化,该酶额外需要合适的磷酸供体。不同的化合物都可作为用于甲羟戊酸激酶的磷酸供体。最优选的磷酸供体是ATP(5’-三磷酸腺苷)。其它优选的磷酸供体是TTP、ITP、GTP、UTP或CTP(见Gibson et al.,Enzyme41,47-55,1989)。“甲羟戊酸激酶”可以是与SEQ ID NO1至14所示的氨基酸序列中的一种或多种同源的。“同源的”指与SEQ ID NO1至14和30所示的氨基酸序列中的一种或多种至少约60%相同,优选至少70%相同,更优选至少约80%相同,进一步更优选至少约90%相同,最优选至少约95%相同。
本领域已知的术语“%相同”表示多肽或多核苷酸序列间的相关程度,这可以是通过对上述序列排列起来达成的匹配程度进行测定得到的。用已知的方法可对“相同性”很容易的进行测定,例如用程序GAP(GCGWisconsin Package,version 10.2,Accelrys Inc.,9685 Scranton Road,SanDiego,CA 92121-3752,USA)来进行,其中使用如下参数缺口产生罚分8,缺口延伸罚分2(缺省参数)。
“野生型酶”或“野生型甲羟戊酸激酶”将表示与SEQ ID NO1-14和30中的任何一种同源的、并且可作为起点来设计根据本发明的对反馈具有(更多)抗性的突变体的任何甲羟戊酸激酶。实际上,该定义暗示,此种“野生型酶”或“野生型甲羟戊酸激酶”对甲羟戊酸途径下游产物(例如FPP或GGPP)的生理上或工业上相关的浓度的抑制敏感。本发明上下文中,“野生型”不是将本发明的范围限制为仅可从自然界获得的甲羟戊酸激酶/甲羟戊酸激酶序列。在此明确声明,如果通过本发明的任何教导,合成的甲羟戊酸激酶的变异体(只要它们与SEQ ID NO1至14和30中的任何一种同源)也可被加工为具有(更多)反馈抗性的,所述合成的甲羟戊酸激酶的变异体也被称为“野生型”。术语“野生型甲羟戊酸激酶”和“未经修饰的甲羟戊酸激酶”在本文中可互换使用。
“突变体”、“突变体酶”或“突变体甲羟戊酸激酶”将表示下述变异体中的任何一种所述变异体是根据本发明的教导从给定的野生型酶/甲羟戊酸激酶(根据上述定义)中获得的,并且,较之分别相应的野生型酶,具有(更多)对反馈的抗性。就本发明的范围而言,怎样获得突变体是没有影响的;上述突变体可以通过下述方法获得,例如,通过定点诱变、饱和诱变、随机诱变/直接进化、对整个细胞或生物的化学或UV诱变等。这些突变体还可通过下述途径来制备,例如,通过设计合成基因,和/或体外(无细胞)翻译(见,例如,Jermutus et al.,Curr.Opin.Biotechnol.9,534-548,1998;Betton,Curr.Prot.Pept.Sci.4,73-80,2003;Martin et al.,Biotechniques 31,948-,2001)。为测定反馈抗性,用本领域技术人员已知的方法来制造突变体(例如,通过定点诱变惑通过设计合成基因)。
本专利申请文件上下文中的“类异戊二烯”将包括通过自然或非自然途径(即,自然界中不发生,但可以通过生物技术方法来进行),优选通过生物化学途径,可从甲羟戊酸获得的任何或全部代谢产物以及异戊烯基大分子。类异戊二烯包括但不限于细菌中的植烷三萜、泛醌和甲基萘醌,植物中的类胡萝卜素、质体醌、单/一个半/双/三萜以及叶绿素的异戊二烯基侧链,和血红素A、醌、辅酶Q10、多萜醇、固醇/类固醇、维生素D、类维生素A等。
一般而言,本发明的目的是提供已被修饰过的甲羟戊酸激酶,该修饰使得其催化性质较之未经修饰的甲羟戊酸激酶更为有用(即,对反馈抑制的敏感性更低)。
本发明涉及经过修饰的甲羟戊酸激酶,其展示出的对反馈抑制的敏感性较之相应的未经修饰的甲羟戊酸激酶要低,其中(i)与相应的未经修饰的甲羟戊酸激酶的氨基酸序列相比较,经过修饰的甲羟戊酸激酶的氨基酸序列含有至少一处突变,并且(ii)所述至少一处突变发生于选自由如下氨基酸位置所构成的组中的氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列上的17、47、93、94、132、167、169、204和266位。
本文中使用的“反馈抑制”表示,类异戊二烯生物合成中甲羟戊酸的下游代谢产物对甲羟戊酸激酶的酶活造成的抑制。类异戊二烯生物合成中甲羟戊酸的下游代谢产物包括但不限于5-磷酸甲羟戊酸、异戊烯二磷酸(IPP)、3,3-二甲基烯丙基二磷酸(DAMPP)、牻牛基二磷酸(GPP)、法呢基二磷酸(FPP)、双牻牛基二磷酸(GGPP)、法呢醇、磷酸多萜醇和植基焦磷酸(Dorsey and Proter,J.Biol.chem.243,4667-4670,1968;Flint,Biochem.J.120,145-150,1970;Gray and Kekwick,BioChim.Biophys.Acta279,290-296,1972;Hinson et al.,J.Lipid Res.38,2216-2223,1997)。人们相信对甲羟戊酸激酶的反馈抑制基于对甲羟戊酸激酶进行的变构调节,所述调节通过该酶与类异戊二烯生物合成中甲羟戊酸下游的代谢产物的结合来进行。
优选地,所述反馈抑制由法呢基二磷酸(FPP)或双牻牛基二磷酸(GGPP)造成。
根据本发明,经过修饰的甲羟戊酸激酶展示出较之相应的未经修饰的甲羟戊酸激酶要低的对反馈抑制的敏感性。优选地,本发明的经过修饰的甲羟戊酸激酶对反馈抑制的敏感性,较之相应的未经修饰的甲羟戊酸激酶要低至少5%(关于对反馈抗性的测量和定量见下文)。
反馈抗性将表示,对“反馈抑制”(如上文定义)的抗性的任何增加。可通过本领域技术人员已知的不同方法对反馈抗性进行分析。在此对一种合适的方法进行简短描述用与实施例2中所述的活性试验类似的方法,测量甲羟戊酸激酶活性,其中在甲羟戊酸(或甲羟戊酸类似物)和ATP(或另外的磷酸供体)的非饱和浓度下进行,即,甲羟戊酸(或甲羟戊酸类似物)和ATP(或另外的磷酸供体)的浓度大约是使得反应速率对上述底物浓度的改变敏感的浓度,例如,在对上述底物进行的研究中,浓度大约为酶的分别的Km值。在其它条件相同情况下,存在及不存在相应浓度的反馈抑制剂(即,反馈抑制剂的浓度能提供对野生型甲羟戊酸激酶的显著抑制)的情况下,对野生型甲羟戊酸激酶和该酶的变异体/突变体的活性进行测量。如果反馈抑制剂造成的抑制的程度(例如,%抑制)在突变体中较之野生型的酶有所降低,那么该突变体在本专利申请文件的上下文中就是“对反馈抑制具有抗性的”。鉴定出“对反馈抑制具有抗性的”的变异体/突变体之后,再用与上文所述相同的方法来鉴定进一步改善的突变体,即,就具有更多反馈抗性的突变体。按照如下方法来计算反馈抗性(%)如果a和b分别是不存在或存在反馈抑制剂(例如FPP)的情况下测得的野生型酶的甲羟戊酸激酶活性,如果c和d是分别是不存在或存在相同的反馈抑制剂的情况下测得的突变体酶的甲羟戊酸激酶活性,那么%反馈抗性就是%抗性=100((d/c)-(b/a))/(1-(b/a))优选地,反馈抗性进行于本申请中实施例2中所述的实验条件下。大约3-30mU/ml(相应于大约1-10μg/ml Paracoccus zeaxanthinifaciens甲羟戊酸激酶),优选为大约10-20mU/ml的甲羟戊酸激酶活性,以及可选地,46μM FPP存在于试验混合物中,反应在30℃下进行。
较之相应的未经修饰的甲羟戊酸激酶,本发明的经过修饰的甲羟戊酸激酶展示出的反馈抗性为至少5%,优选为至少大约10%,更优选为至少大约25%,进一步更优选为至少大约40%,进一步更优选为至少大约60%,最优选为至少大约70%。
较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,本发明的经过修饰的甲羟戊酸激酶的氨基酸序列含有至少一种突变。该突变可以是添加、缺失和/或取代。优选地,该突变是氨基酸取代,其中,本发明的经过修饰的氨基酸序列中,未经修饰的甲羟戊酸激酶的氨基酸序列中存在的给定氨基酸被另外的氨基酸所取代。较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列可以含有至少一处氨基酸取代。在其它实施方式中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶含有至少两处、至少三处、至少四处或至少五处氨基酸取代。在本发明的另外的实施方式中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶含有一至十处、一至七处、一至五处、一至四处、二至十处、二至七处、二至五处、二至四处、三至十处、三至七处、三至五处或三至四处氨基酸取代。
一种或多种突变可以发生于选自由如下氨基酸位置所构成的组的氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列上的17、47、93、94、132、167、169、204和266位。
优选地,所述至少一处突变发生于选自由如下氨基酸位置所构成的组氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列上的17、47、93、94、132、167和266位。在另一种优选的实施方式中,所述至少一处突变发生于选自由如下氨基酸位置所构成的组氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的Paracoccuszeaxanthinifaciens甲羟戊酸激酶的氨基酸序列上的17、47、93、94、132、167和169位。
如果经过修饰的甲羟戊酸激酶较之相应的未经修饰的甲羟戊酸激酶,仅含有单个氨基酸的取代,那么优选地,该单个氨基酸的取代发生于选自由相应于SEQ ID NO1的17、47、93、94、204和266位氨基酸的位置所构成的组中的位置。更优选地,该取代是I17T、G47D、K93E、V94I、R204H或C266S。
在一种特别优选的实施方式中,突变是对相应于SEQ ID NO1所示的氨基酸序列的第17位氨基酸的氨基酸位置产生影响的取代。存在于未经修饰的甲羟戊酸激酶中的氨基酸优选是异亮氨酸。未经修饰的甲羟戊酸激酶序列中的氨基酸可被转变为苏氨酸或丙氨酸。最优选地,对相应于SEQ ID NO1所示的序列的第17位的氨基酸位置进行的取代是苏氨酸对异亮氨酸的取代。
如果较之相应的未经修饰的甲羟戊酸激酶,经过修饰的甲羟戊酸激酶含有至少两处突变,那么其中一处突变可发生于相应于SEQ ID NO1的375位的氨基酸位置。如果较之相应的未经修饰的甲羟戊酸激酶,经过修饰的甲羟戊酸激酶含有两处突变,那么优选地,氨基酸取代发生于相应于SEQ ID NO1的132/375位、167/169位、17/47位或17/93位的组合。最优选的是P132A/P375R、R167W/K169Q、I17T/G47D或I17T/K93E的组合。
如果较之相应的未经修饰的甲羟戊酸激酶,经过修饰的甲羟戊酸激酶含有三处突变,优选地,氨基酸取代发生于相应于SEQ ID NO1的17/167/169位、17/132/375位、92/132/375位或17/47/93位组合的位置。最优选的是I17T/R167W/K169Q、I17T/P132A/P375R、K93E/P132A/P375R、I17T/R167W/K169H、I17T/R167T/K169M、I17T/R167T/K169Y、I17T/R167F/K169Q、I17T/R167I/K169N、I17T/R167H/K169Y、I17T/G47D/K93E或I17T/G47D/K93Q的组合。
如果较之相应的未经修饰的甲羟戊酸激酶,经过修饰的甲羟戊酸激酶含有四处突变,优选地,氨基酸取代发生于相应于SEQ ID NO1的17/47/93/132位组合的位置。最优选的是I17T/G47D/K93E/P132A或I17T/G47D/K93E/P132S的组合。
最优选的是表1、2、3或4(见下文)中公开的突变的组合。这些例子中指出的氨基酸位置可转至不同来源的甲羟戊酸激酶中。
本发明的经过修饰的甲羟戊酸激酶可通过将突变引入到相应的未经修饰的甲羟戊酸激酶中来获得。未经修饰的甲羟戊酸激酶可以是任何展示出对反馈抑制的敏感性的甲羟戊酸激酶。未经修饰的甲羟戊酸激酶包括但不限于可从自然界获得的甲羟戊酸激酶。未经修饰的甲羟戊酸激酶还包括与SEQ ID NO1至14和30中所示的氨基酸序列中的任何一种同源的甲羟戊酸激酶。
优选的未经修饰的甲羟戊酸激酶包括下述激酶,所述激酶具有选自由如SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ IDNO13、SEQ ID NO14和SEQ ID NO30所示的氨基酸序列所构成的组的序列。
未经修饰的甲羟戊酸激酶可以是真核的或原核来源的,优选是真菌或细菌来源的,更优选是Aspergillus或Saccharomyces或Paracoccus或Phaffia来源的,最优选是Aspergillus niger或Saccharomyces cerevisiae或Paracoccus zeaxanthinifaciens或Phaffia rhodozyma来源的。在一种实施方式中,未经修饰的甲羟戊酸激酶是原核来源的,优选是细菌来源的,更优选是Paracoccus来源的,最优选是Paracoccus zeaxanthinifaciens来源的。
优选地,按照实施例2中所述的试验进行测量时(0或46μMFPP),未经修饰的甲羟戊酸激酶受到的FPP造成的反馈抑制为至少10%,更优选为至少20%,进一步更优选为至少30%,进一步更优选为至少40%,最优选为至少50%。
本发明的经过修饰的甲羟戊酸激酶可以包含外源氨基酸,优选是在其N-或C-末端处。“外源氨基酸”指在天然(自然界中存在的)甲羟戊酸激酶中不存在的氨基酸,优选是天然甲羟戊酸激酶中不存在的至少大约3个、至少大约5个或至少大约7个相邻氨基酸的片断。优选的外源氨基酸的片断包括但不限于能促进重组产生的经过修饰的甲羟戊酸激酶的纯化的“标签”。此类标签的例子包括但不限于“His6”标签、FLAG标签、myc标签等。
在另一种实施方式中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶可以含有一处或多处,例如两处缺失。优选地,所述缺失影响相应的未经修饰的甲羟戊酸激酶的N-或C-末端的氨基酸,而不会显著减少其功能特性,例如酶的比活性。
本发明的经过修饰的甲羟戊酸激酶通常是自然界不存在的甲羟戊酸激酶。优选地,经过修饰的甲羟戊酸激酶的比活性为相应的未经修饰的甲羟戊酸激酶的比活性的至少10%,更优选为至少20%,进一步更优选为至少35%,进一步更优选为至少50%,最优选为至少75%。
本发明的经过修饰的甲羟戊酸激酶可以是经过分离的多肽。本文中使用的术语“经过分离的多肽”指充分去除了其它多肽的多肽。优选地,经过分离的多肽超过80%纯,优选超过90%纯,更优选超过95%纯,最优选超过99%纯。纯度可按照本领域已知的方法来测定,例如通过SDS-PAGE及随后的蛋白质染色来测定。然后可以通过密度测定对蛋白质条带进行定量。其它用于测定纯度的方法也在普通技术的水平范围内。
本发明还涉及包含下述核苷酸序列的多核苷酸,所述核苷酸序列编码根据本发明的经过修饰的甲羟戊酸激酶。本文中使用的“多核苷酸”指多核糖核苷酸或多脱氧核糖核苷酸,其可以是未经修饰的RNA或DNA或经过修饰的RNA或DNA。多核苷酸包括但不限于单链或双链DNA、作为单链或双链区域混合物的DNA、单链或双链RNA、作为单链或双链区域混合物的RNA、包含DNA和RNA的杂交分子(其可以是单链的,或者更为典型地,是双链的或单链或双链区域的混合物)。术语“多核苷酸”包括包含一种或多种不常用碱基(例如次黄嘌呤核甙)或一种或多种经过修饰的碱基(例如经过三苯甲基化的碱基)的DNA或RNA。
本发明的多核苷酸可以通过对编码未经修饰的甲羟戊酸激酶的多核苷酸序列进行修饰得到。此类编码未经修饰的甲羟戊酸激酶的多核苷酸序列的例子如SEQ ID NO16至29和31所示。将突变(例如添加、缺失和/或取代)引入到编码未经修饰的甲羟戊酸激酶的核苷酸序列中的方法包括但不限于定点诱变和基于PCR的方法。
聚合酶链式反应(PCR)方法的原理如(例如)White et al.,TrendsGenet.5,185-189,1989所述,改进方法在,例如Innis et al.[PCR ProtocolsA guide to Mehods and Applications,Academic Press,Inc.(1990)]中有所描述。
可从本领域已知的编码甲羟戊酸激酶的基因组序列或cDNA序列开始,用体外诱变方法(见,例如Sambrook et al.,Molecular Cloning,ColdSpring Harbor Laboratory Press,New York)来构建本发明的DNA序列序列信息见,例如,相关的序列数据库,例如Genbank(Intelligenetics,California,USA)、European Bioinformatics Institute(Hinston Hall,Cambridge,GB)、NBRF(Georgetown University,Medical Centre,Washington DC,USA)和Vecbase(University of Wisconsin,BiotechnologyCentre,Madison,Wisconsin,USA)或附图和序列表中公布的序列信息。广泛用于此类“定点诱变”的策略最初由Hutchison和Edgell(J.Virol.8,181-189,1971)所提出,其包括将带有目标核苷酸取代的合成寡核苷酸退火到其中将被引入突变的单链DNA序列的目标区域(参见Smith,Annu.Rev.Genet.19,423-462,1985中的综述;改进方法参见Stanssen et al.,Nucl.Acids Res.17,4441-4445,1989的第2-6篇参考文献)。本发明的应用中另外一种优选的对给定DNA进行突变的可能方法是用聚合酶链式反应(PCR)进行的诱变。可用本领域已知的方法从不同的菌株/生物中分离出作为起始物质的DNA,所述方法例如见Sambrook et al.(MolecularCloning)。但是,应当理解,将按照本发明来构建/突变的编码甲羟戊酸激酶的DNA也可以在已知DNA序列的基础上来制备,例如,通过用本领域已知的方法来构建合成基因(见例如EP 747 483和Lehmann et al.,Prot.Eng.13,49-57,2000所述)。
编码根据本发明的经过修饰的甲羟戊酸激酶的多核苷酸的非限制性的例子如SEQ ID NO32和33所示。
本发明的多核苷酸可以是经过分离的多核苷酸。术语“经过分离的多核苷酸”指与已充分除去了其它核酸的多核苷酸,其它核酸例如但不限于其它的染色体或染色体外DNA和RNA。本领域技术人员已知的传统核酸纯化方法可用于获得经过分离的多核苷酸。该术语还包括重组的多核苷酸和化学合成的多核苷酸。
在另一种实施方式中,本发明涉及包含根据本发明的多核苷酸的载体或质粒。优选地,该载体或质粒包含至少一种标记基因。该载体和质粒还包含与本发明的多核苷酸可操作地连接的调控元件。本文中使用的术语“可操作地连接”指核酸序列与单条核酸片段相连,使得其中一种的功能受另一种影响。例如,当启动子能影响到编码序列的表达的情况下,即编码序列受启动子的转录控制的情况下,该启动子就是与编码序列可操作地连接的。编码序列可与调控序列以正义或反义方向可操作地连接。术语“表达”指DNA序列向mRNA的转录和/或mRNA向氨基酸序列的翻译。术语“过量表达”指经过修饰的生物(例如,通过转化和转染修饰过的)中基因产物的产量高于相应的未经修饰的生物中的生产水平。
获得本发明的DNA全序列后,可通过本领域已知的方法(例如Sambrook et al.(s.a.)所述),将其整合到载体中,以在合适的宿主系统中(过量)表达被编码的多肽。但是,本领域技术人员知道,DNA序列自身也可被用于转化本发明的合适的宿主系统,以获得被编码的多肽的(过量)表达。合适的宿主系统例如是真菌,例如Aspergilli,例如Aspergillusniger或Aspergillus oryzae,或者例如Trichoderma,例如Trichodermareesei,或者酵母,例如Saccharomyces,例如Saccharomyces cerevisiae或Pichia,例如Pichia pastoris,或Hansenula polymorpha,例如H.polymorpha(DSM 5215)。本领域技术人员知道,上述微生物可从保藏机构获得,例如American Type Culture Collection(ATCC)、theCentraalbureau voor Schimmelcultures(CBS)或the Deutsche Sammlung FürMikroorganismen und Zellkulturen GmbH(DSMZ)或列于“IndustrialProperty”(vol.1,pages 29-40,1991)刊物或European Patent Office官方刊物(vol.4,pages 155/156,2003)中的任何其它保藏机构。可以使用的细菌例如是Paracoccus,例如Paracoccus zeaxanthinifaciens、E.coli,Bacilli,例如Bacillus subtilis,或Streptomyces,例如Streptomyces lividans(见,例如Annéand van Mellaert in FEMS Microbiol.Lett.114,121-128,1993)。可以使用的E.coli例如是,E.coli K12菌株,例如M15(如Villarejo et al.in J.Bacteriol.120,466-474,1974所述的DZ 291)、HB 101(ATCC No.33694)或E.coli SG13009(Gottesman et al.,J.Bacteriol.148,265-273.1981)。
可用于在真菌中进行表达的载体是本领域内已知的,对其描述例如见EP 420 358,或者Cullen et al.(Bio/Technology 5,369-376,1087),Ward(inMolecular Industrial Mycology,Systems and Applications for FilamentousFungi,Marcel Dekker,New York,1991),Upshall et al.(Bio/Technology 5,1301-1304,1987),Gwynne et al.(Bio/Technology 5,71-79,1987)或Punt et al.(J.Biotechnol.17,19-34,1991),对酵母而言,见Sreekrishna et al.(J.BasicMicrobiol.28,265-278,1988;Biochemistry 28,4117-4125,1989),Hitzemannet al.(Natuer 293,717-722,1981)或EP183070,EP183071,EP248227,EP263311。可用于在E.coli中表达的合适的载体由下述文献提到过,Sambrook et al.[s.a]或Fiers et al.in Proc.8th Int.Biotechnol.Symp.[Soc.Franc.de Microbio.,Paris(Durand et al.,eds.),pp.680-697,1988],Bujard et al.(in Meth.Enzymol.,eds.Wu and Grossmann,Academic Press,Inc.,vol.155,416-433,1987)或Stüber et al.(in Immunological Methods,eds.lefkovits andPernis,Academic Press,In.,Vol.IV,121.152,1990)。可用于在Bacilli中表达的载体是本领域内已知的,其被描述于,例如EP207459或EP405370,Yansura和Henner在Proc.Natl.Acad.Sci.USA 81,439-443(1984)或Henner,Le Grice和Nagarajan在Meth.Enzymol.185,199-228,1990中。可被用于在H polymorpha中表达的载体是本领域内已知的,其被描述于,例如Gellissen et al.,Biotechnology 9,291-295,1991中。
此类载体可以已经带有调控元件,例如启动子,或者,本发明的DNA序列可被改造为含有此类元件。可用的合适的启动子元件是本领域内已知的,例如是用于Trichoderma reesei的cbhl-(Haarki et al.,Biotechnology7,596-600,1989)或pkil-启动子(Schindler et al.,Gene 130,271-275,1993),用于Aspergillus oryzae的amy-启动子Christensen et al.,Abstr.19th Lunteren lectuers on Molecular Genetics F23(1987);Christensen et al.,Biotechnology 6,1419-1422,1988;Tada et al.,Mol.Gen.Genet.229,301-306,1991,用于Aspergillus niger的glaA-(Cullen et al.,Bio/Technology 5,369-376,1987;Gwynne et al.,Bio/Technology 5,713-719,1987;Ward在Molecular Industrial Mycology,Systems and Applications for FilamentousFungi,Marcel Dekker,New York,83-106,1991)、alcA-(Gwynne et al.,Bio/Technology 5,718-719,1987)、sucl-(Boddy et al.,Curr.Genet.24,60-66,1993)、aphA-(macRae et al.,Gene 71,339-348,1988;macRae et al.,Gene 132,193-198,1993)、tpiA-(McKnight et al.,Cell 46,143-147,1986;Upshall et al.,Bio/Technology 5,1301-1304,1987)、gpdA-(Punt et al.,Gene 69,49-57,1988;Punt et al.,J.Biotechnol.17,19-37,1991)和pkiA-启动子(de Graaff et al.,Curr.Genet.22,21-27,1992)。可用于在酵母中表达的合适的启动子元件是本领域内已知的,例如,用于在Saccharomycescerevisiae中表达的pho5-启动子(Vogel et al.,Mol.Cell.Biol.9,2050-2057,1989;Rudolf and Hinnen,Proc.Natl.Acad.Sci.USA 84,1340-1344,1987)或gap-启动子,以及,例如,用于Pichia pastoris的aoxl-启动子(Koutz etal.,Yeast 5,167-177,1989;Sreekrishna et al.,J.Basic Microbiol.28,265-278,1988),或用于H.polymorpha的FMD启动子(Hollenberg et al.,EPA No.0299108)或MOX启动子(Ledeboer et al.,Nucleic Acids Res.13,3063-3082,1985)。
用于细菌表达的合适的启动子和载体包括,例如Giacomini et al.所述的合成启动子(Gene 144,17-24,1994)。对于通过合适的质粒或通过将编码甲羟戊酸激酶的DNA序列整合到染色体DNA中,在细菌中表达所要求保护的(突变体)甲羟戊酸激酶的合适的教导在很多地方都能发现,例如,US patent No.6322995。
本发明还涉及包含本发明的载体或质粒的宿主细胞。合适的宿主细胞可以是真核或原核细胞。合适的宿主细胞的例子包括但不限于细菌细胞,例如链球菌、葡萄球菌、肠球菌、E.coli、Streptomyces、藻氰菌、Bacillus subtilis和Streptococcus pneumoniae的细胞;真菌细胞,例如酵母Kluyveromyces、Saccharomyces、担子菌、Candida albicans和Aspergillus的细胞;昆虫细胞,例如Drosophila S2和Spodoptera Sf9的细胞;动物细胞,例如CHO、COS、Hela、3T3、BHK、293、CV-1;以及植物细胞,例如裸子植物或被子植物的细胞。
因此,包含本发明的多核苷酸的载体,优选地,用于在细菌、真菌、酵母或植物宿主中表达所述多核苷酸的载体,以及此类经过转化的细菌或真菌、酵母或植物宿主也是本发明的目的。
本发明还涉及生产类异戊二烯化合物的方法,所述方法包括(a)在合适的培养基中,允许经过修饰的甲羟戊酸激酶在宿主细胞中表达的条件下,培养本发明的宿主细胞;以及(b)可选地,从培养基中分离出类异戊二烯化合物。
上述方法可被用于对任何类型的类异戊二烯化合物或类异戊二烯衍生化合物进行生物技术方式的生产,所述化合物例如类胡萝卜素,例如但不限于,八氢番茄红素、番茄红素、α-/β-/γ-胡萝卜素、叶黄素、玉米黄质、β-隐黄质、金盏花黄质、海胆酮、角黄素、虾青素及其衍生物(Misawa & Shimada,J.Biotechnol.59,169-181,1998;Miura et al.,Appl.environ.Microbiol.64,1226-1229,1998;Hirschberg,Curr.Opin.Biotechnol.10,186-191,1999;Margalith,Appl.Microbiol.Biotechnol.51,431-438,1999;Schmidt-Dannert,Curr.Opin.Biotechnol.11,255-261,2000;Sandmann,Arch.Biochem.Biophys.385,4-12,2001;Lee & Schmidt-Dannert,Appl.Microbiol.Biotechnol.60,1-11,2002);醌,例如但不限于,泛醌(=辅酶O)、甲基萘醌、质体醌和蒽醌,优选地,辅酶Q6、辅酶Q7、辅酶Q8、辅酶Q9、辅酶Q10或辅酶Q11,最优选地为辅酶Q10(Clarke,Protoplasma 213,134-147,2000;Han et al.,Plant Cell Tissue Organ Culture 67,201-220,2001;Kawamukai,J.Biosci.Bioeng.94,511-517,2002);橡胶和橡胶衍生物,优选地,天然橡胶(=顺式1,4-聚异戊二烯;Mooibroek & Cornish,Appl.Microbiol.Biotechnol.53,355-365,2000);固醇和固醇衍生物,例如但不限于,麦角固醇、胆固醇、氢化可的松(Ménard Szczebara et al.,NatureBiotechnol.21,143-149,2003)、维生素D、25-羟基-维生素D3、膳食植物固醇(Ling & Jones,Life Sci.57,195-206,1995)和天然表面活性剂(Holmberg,Curr.Opin.Colloid.Interface Sci.6,148-159,2001);以及大量的其它类异戊二烯,例如但不限于单萜、一个半萜、双萜和三萜,例如紫杉醇(Jennewein & Croteau,Appl.Microbiol.Biotechnol.57,13-19,2001)和赤霉素(Bruckner & Blechschmidt,Crit.Rev.Biotechnol.11,163-192,1991)。
合适的宿主细胞是所有类型的可用于遗传修饰的生物,其例如但不限于,细菌、酵母、真菌、藻类、植物或动物细胞。遗传工程和代谢工程的方法是本领域技术人员已知的(例如Verpoorte et al.,Biotechnol.Lett.21,467-479,1999;Verpoorte et al.,Transgenic Res.9,323-343,2000;Barkovich &Liao,Metab.Eng.3,27-39,2001)。类似地,针对类异戊二烯和类异戊二烯衍生化合物和/或分子的(可能)合适的纯化方法是精细化学生物合成和生产领域中已知的。
应当理解,用于对根据本发明的类异戊二烯和类异戊二烯衍生化合物和/或分子进行生物技术生产的方法不仅限于上述的全细胞发酵方法,还可以使用透性化(permeabilized)宿主细胞、粗制的细胞提取物、通过(例如)离心或过滤从细胞残余物中分离的细胞提取物,或者甚至是重构反应途径,其中存在经过分离的酶。上述方法的组合也在本发明的范围内。在无细胞生物合成的情况下(例如重构反应途径),无论经过分离的酶由宿主细胞制备或分离自宿主细胞,或体外转录/翻译或通过其它方法来制备分离,都没有影响。
本发明还涉及生产本发明的经过修饰的甲羟戊酸激酶的方法,所述方法包括(a)在允许本发明的经过修饰的甲羟戊酸激酶表达的条件下,培养本发明的宿主细胞,以及(b)从细胞或从培养基中回收经过修饰的甲羟戊酸激酶。
可从包含表达系统的经过遗传改造的宿主细胞来制备本发明的经过修饰的甲羟戊酸激酶。
为对本发明的多肽进行重组生产,可对宿主细胞进行遗传改造,以包含进本发明的多核苷酸或载体或质粒。可用很多种标准实验手册中所述的方法,来将多核苷酸或载体引入宿主细胞(例如Davis et al.,Basic Methodsin Molecular Biology(1986)和Sambrook et al.,Molecular CloningALaboratory Manual,2nd Ed.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(1989)),例如磷酸钙转染、DEAE-葡聚糖介导的转染、微注射、阳离子脂质介导转染、电穿孔、转导、弹道(ballistic)引入和感染。
多种不同的表达系统可被用于生产本发明的经过修饰的甲羟戊酸激酶。此类载体包括前文所述的等。通常,任何适合于在宿主中维持、遗传和表达多核苷酸和/或表达多肽的系统或载体可被用于本方面的表达。
在真核重组表达系统中,为将翻译出的蛋白质分泌到内质网内腔、胞质间间隙或细胞外环境,可将合适的分泌信号包括进被表达的多肽。上述信号可以是与多肽是内源的,或者它们可以是异源信号。
通过公知方法,可从重组细胞培养物中对本发明的多肽进行回收及纯化,所述方法包括硫酸铵或乙醇沉淀、酸抽提、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和色谱以及羟基磷灰石色谱。在一种实施方式中,用高效液相色谱来进行纯化。当多肽在分离和/或纯化期间被变性的情况下,用于蛋白质重新折叠的公知技术可被用于重新产生具有活性的构象。蛋白质纯化的方法被描述于,例如Deutscher,Protein Purification,Academic Press,New York,1990和Scopes,ProteinPurification,Springer Verlag,heidelberg,1994中。
按照例如Pen et al.in Bio/Technology 11,811-814,1994或EP449375所述的方法,还可将本发明的甲羟戊酸激酶表达于植物中,优选地,表达于种子中,如,例如EP449376所述。启动子和终止子的一些合适的例子包括来自胭脂氨酸合酶(nos)、章鱼碱合酶(ocs)和烟草花叶病毒(CaMV)基因的那些。一种可以使用的有效的植物启动子是高水平植物启动子。与本发明的遗传序列可操作地连接的此类启动子,应当能够提高本发明基因产物的表达。可用于本发明的高水平的植物启动子包括核酮糖-1,5-二磷酸羧化酶的小亚基(small subunit,ss),例如来自大豆的(Berry-Lowe et al.,J.Mol.Appl.Genet.1,483-498,1982),以及叶绿素a/b结合蛋白的启动子。已知上述两种启动子在植物细胞中是轻度诱导型的(见,例如Genetic Engineering of Plants,an Agricultural Perspective,A.Cashmore,Plenum Press,NY(1983),pages 29-38;Coruzzi et al.,J.Biol.Chem.258,1399-1402,1983;和Dunsmuir et al.,J.Mol.Appl.Genet.2,285-300,1983)。
当需要对本发明的蛋白质进行商业生产时,可以使用一系列的培养方法。例如,对从重组微生物宿主中过量表达的特定基因产物的大规模生产,可以通过分批或连续的培养方法来进行。分批和补料分批培养方法是本领域内常用并且公知的,在Thomas D.Brock in BiotechnologyATextbook of Industrial Microbiology,Second Edition(1989)Sinauer Associates,Inc.,Sunderland,Mass.,or Deshpande,Appl.Biochem.Biotechnol.36,227-234,1992中可以找到例子。对用于连续培养的方法的营养物和生长因素进行调节的方法,以及用于使得产物形成速率最大化的技术是工业微生物学领域中公知的,前文所述的Brock对一系列方法都进行了细节描述。
发酵培养基必须含有合适的含碳底物。合适的底物可以包括但不限于,单糖,例如葡萄糖和果糖,寡糖,例如乳糖或蔗糖,多糖,例如淀粉或纤维素,或者它们的混合物,以及来自可更新给料的未经纯化的混合物。用于本发明的碳源可以包含多种不同的含碳底物,其将仅受对微生物的选择的限制。
本发明还涉及制备对反馈抑制的敏感性降低的甲羟戊酸激酶的方法,所述方法包括如下步骤(a)提供一种多核苷酸,所述多核苷酸编码第一种甲羟戊酸激酶,该激酶展示出对反馈抑制的敏感性;(b)将一种或多种突变引入到所述多核苷酸序列中,使得经过突变的多核苷酸序列编码第二种甲羟戊酸激酶,较之第一种甲羟戊酸激酶,其含有至少一处氨基酸突变,其中,所述至少一处氨基酸突变发生于选自由如下氨基酸位置所构成的组中的氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的氨基酸序列上的17、47、93、94、132、167、169、204和266位;(c)可选地,将经过突变的多核苷酸插入到载体或质粒中;(d)将多核苷酸或载体或质粒引入到合适的宿主细胞中;以及(e)在允许经过修饰的甲羟戊酸激酶表达的条件下培养所述宿主细胞。
该方法的优选的实施方式与本文中描述的经过修饰的甲羟戊酸激酶、编码它们的多核苷酸、载体和质粒、宿主细胞以及方法的优选实施方式相对应。第一种和第二种甲羟戊酸激酶分别对应于未经修饰的和经过修饰的甲羟戊酸激酶(见上文)。
本发明的另一方面是本发明的经过修饰的甲羟戊酸激酶或本发明的多核苷酸在制备用于治疗与甲羟戊酸激酶活性降低相关的疾病的药物中的用途。此类疾病包括但不限于,甲羟戊酸尿症、超免疫球蛋白D症以及周期性发热综合征。将本发明的经过修饰的甲羟戊酸激酶作为治疗用酶施用是优选的。施用的模式包括口服、肠道外、腹膜内和/或皮下施用。本发明的经过修饰的甲羟戊酸激酶或其盐可被配制为药物组合物(例如,小粒、酶晶体、药片、药丸、胶囊、注射剂、溶液等),所述组合物包含单独存在的此类酶中的至少一种,或者其与药学上可接受的载体、赋形剂和/或稀释剂的混合物。药物组合物可按照传统方法来配制。对于任何特定病人的特定剂量水平取决于一系列的因素,包括所用的特定化合物的活性、年龄、体重、健康状况、性别、膳食、施用时间、施用途径、排泄速率、药物组合以及治疗所针对的特定疾病的严重程度。
本发明的多核苷酸可被用于基因治疗方案。
本发明的另一个方面是本发明的经过修饰的甲羟戊酸激酶或本发明的多核苷酸在测定生物流体中甲羟戊酸浓度中的用途。生物流体的非限制性的例子是血液、血清、血浆、脑脊液、尿液、泪液、汗液以及其它任何细胞内、细胞间和/或细胞外的流体。
本发明的一种目的是提供包含编码上文所述的经过修饰的甲羟戊酸激酶的核酸序列的多核苷酸、包含此类多核苷酸的载体(优选是表达载体)、经过此类多核苷酸或载体转化的宿主细胞、用于制备本发明甲羟戊酸激酶的方法(其中如前文所述的宿主细胞被培养于合适的培养条件下,通过本领域已知的方法将甲羟戊酸激酶从此类宿主细胞或培养基中分离出来)以及用于对类异戊二烯进行生物技术方式的生产的方法,所述方法基于宿主细胞来进行,所述宿主细胞已经过了此类多核苷酸或载体的转化和/或已将此类多核苷酸稳定整合进其染色体中。
本发明的另一个目的是提供(i)编码甲羟戊酸激酶的DNA序列,所述激酶带有本发明的特定突变中的至少一种,所述DNA序列能在标准条件下与本发明的经过特定修饰的甲羟戊酸激酶的DNA序列中的任何一种杂交,或(ii)编码甲羟戊酸激酶的DNA序列,所述激酶带有本发明的特定突变中的至少一种,但是由于遗传密码子的简并性,所述DNA序列在标准条件下不能与本发明的经过特定修饰的甲羟戊酸激酶的DNA序列中的任何一种杂交,但其编码的氨基酸序列与能与本发明的经过特定修饰的甲羟戊酸激酶的DNA序列中的任何一种杂交的DNA序列所编码的完全相同,或(iii)上述DNA序列的片段,所述片段保留有其来源多肽的活性特征。
用于杂交的“标准条件”在上下文中表示本领域的技术人员通常用来检测特异性杂交信号的条件,其被描述于,例如Sambrook et al.,“Molecular Cloning”,second edition,Cold Spring Harbor Laboratory Press1989,New York中;或者优选地,本领域技术人员所熟悉的所谓严谨杂交条件和非严谨清洗条件,或更优选地,严谨杂交条件和严谨清洗条件,其被描述于Sambrook et al.(s.a.)中。严谨杂交条件的一个特别的例子是在包含50%甲酰胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x Denhardt′s溶液、10%葡聚糖硫酸和20μg/ml变性剪切鲑鱼精DNA的溶液中于42℃培养过夜(例如15小时),接着是在0.1x SSC中于大约65℃对杂交支持物进行清洗。
本发明的另一个目的是提供可从所谓的聚合酶链式反应方法(PCR)获得的DNA序列,其中,PCR引物是基于本发明特别描述的DNA序列来设计的。应当理解,所获得的DNA序列编码的甲羟戊酸激酶与作为引物设计基础的、显示出可相比较的活性特征的激酶具有至少相同的突变。
本文中描述的本发明的多种实施方式可以交叉组合使用。


图1用程序ClustalW对来自小鼠、大鼠、人、酵母、Arabidopsisthaliana(ARATH)、Schizosaccharomyces pombe(SCHPO)、Pyrococcusabyssi(PYRAB)、Pyrococcus horikoshii(PYRHO)、Pyrococcus furiosus(PYRFU)、Methanobacterium thermoautotrophicum(METTH)、Archaeoglobus fulgidus(ARCFU)、Methanococcus jannaschii(METJA)、Aeropyrum pernix(AERPE)和Paracoccus zeaxanthinifaciens(PARACOCCUS)的甲羟戊酸激酶序列进行计算,得到的多条序列比对图。编号遵从Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列。
图2将K93E甲羟戊酸激酶突变引入到基于pBBR-K的质粒的甲羟戊酸操纵子中,细节见文字部分。
下述非限制性的实施例将对本发明进行进一步的阐述。
实施例1 多条序列的比对例如,使用程序“PILEUP”(GCG Wisconsin Package,version 10.2,Accelrys Inc.,9685 Scranton Road,San Diego,CA 92121-3752,USA),可对不同甲羟戊酸激酶的多条氨基酸序列进行计算比对(见图1),其中使用下述参数缺口产生罚分12,缺口延伸罚分4,以及blosum62.cmp矩阵(缺省参数);或者用程序ClustalW(Version 1.7,EMBL,Heidelberg,Germany)来进行,其中使用BLOSUM交换矩阵。此类序列比对是本领域技术人员的常规操作(例如,Cho et al.,J.Biol.Chem.276,12573-12578,2001)。
本发明的上下文中,同源甲羟戊酸激酶可展示出与图1所示的任何甲羟戊酸激酶之间的序列相似性。图1给出了对来自下述物种的甲羟戊酸激酶的氨基酸序列进行的多条序列比对的例子,所述物种是小鼠、大鼠、人、酵母、Arabidopsis thaliana(ARATH)、Schizosaccharomyces pombe(SCHPO)、酵母(YEAST)、Pyrococcus abyssi(PYRAB)、Pyrococcus horikoshii(PYRHO)、Pyrococcus furiosus(PYRFU)、Methanobacterium thermoautotrophicum(METTH)、Archaeoglobusfulgidus(ARCFU)、Methanococcus jannaschii(METJA)、Aeropyrumpernix(AERPE)和Paracoccus zeaxanthinifaciens(PARACOCCUS),后者的序列还被用作对其它序列(例如前面命名的那些)的位置进行氨基酸编号的参照物。此外,具有E6V突变的经过修饰的大鼠甲羟戊酸激酶表示了这样一种大鼠甲羟戊酸激酶,其中,在按照上文定义的编号方法得到的第6位(其实际上是大鼠甲羟戊酸激酶氨基酸序列的第4位)上,天然存在的Glu(“E”是其标准IUPAC单字母氨基酸编码)被Val(“V”)所取代。本发明的所有突变体/变异体都是按照这种方法来命名的。
实施例2 对甲羟戊酸激酶活性以及反馈抑制剂造成的抑制的测量用于测量甲羟戊酸激酶活性的酶试验被描述于,例如Popják(Meth.Enzymol.15,393-,1969),Gibson et al.(Enzyme 41,47-55,1989),Hinson et al.(J.Lipid Res.38,2216-2223,1997),Schulte et al.(Anal.Biochem.269,245-254,1999)或Cho et al.(J.Biol.Chem.276,12573-12578,2001)中。为制备作为底物的甲羟戊酸,将130mg DL-甲羟戊酸内酯(FLUKA Chemie AG,Buchs,Switzerland)溶于5.5ml的0.2M KOH中,并在50℃培养15分钟。然后在室温(RT)下通过加入0.1M HCl将溶液的pH调为7.0。除非另有指明(见实施例3),试验混合物由100mM K2HPO4/KH2PO4(pH7.0)、1mM ATP、2mM MgCl2、1mM甲羟戊酸、0.5mM磷酸烯醇式丙酮酸(PEP)、0.32mM NADH、20U/ml丙酮酸激酶和27U/ml乳酸脱氢酶(Sigma-Aldrich,St.Louis,MO,USA)构成。在试验混合物中用作抑制剂的FPP、GGPP、IPP、DMAPP和GPP(浓度为0-100μM之间)全部购自Sigma。加入纯化的(His6-标记过的)甲羟戊酸激酶后,酶反应由NADH的消耗所反映,然后在340nm处进行光度测量。一个单位(1U)的甲羟戊酸激酶活性每分钟能催化1μmol甲羟戊酸的磷酸化。
实施例3 对酶试验的质量进行检测最佳的试验应当满足很多要求,例如与酶浓度成线性并与时间成线性。此外,在本发明的上下文中,该试验应当能够对反馈抑制剂造成的对甲羟戊酸激酶的抑制进行定量。在本实施例的实验中,使用下述实验条件100mM KH2PO4(pH 7.0)、0.125-4mM ATP、1.125-5mM MgCl2(总是比ATP多1mM)、0.25-3mM甲羟戊酸、0或46μM FPP、0.16mM NADH、0.5mM PEP、20U/ml丙酮酸激酶、27U/ml乳酸脱氢酶,30℃。使用不同的量的Paracoccus zeaxanthinifaciens甲羟戊酸激酶,所述激酶是经过纯化和His6-标记的。
本实施例的实验显示,甲羟戊酸激酶活性试验实际上与时间和酶(甲羟戊酸激酶)浓度成线性,在用于Paracoccus zeaxanthinifaciens的给定条件下,MgATP和甲羟戊酸浓度每种都为1mM,可能对于对FPP造成的反馈抑制进行可信的测量来说是最佳的。
实施例4 对Paracoccus zeaxanthinifaciens甲羟戊酸激酶进行诱变以获得具有反馈抗性的突变体通过PCR扩增出来自Paracoccus zeaxanthinifaciens R114的甲羟戊酸激酶的cDNA,其中使用的一种引物编码伴随6xHis序列的EcoRI限制性位点以及甲羟戊酸激酶5’-末端序列的一小部分,不含ATG起始密码子,使用的另一种引物含有甲羟戊酸激酶的3’-末端序列,其中包括终止密码子和BamHI限制性位点。通过琼脂糖凝胶电泳纯化之后,用EcoRI和BamHI对PCR产物进行消化,将其接连到用同样的酶消化过的pQE-80L(Qiagen,Hilden,Germany)中。pQE-80L含有受lac操纵子元件调控的T5启动子,其会受到也由pQE-80L编码的lac遏制子的顺式抑制。然后按照厂商说明书,将该质粒转化进Invitrogen(Carlsbad,CA,USA)的E.coliDH5α中。在E.coli的指数生长期间,OD600nm为0.6时加入100μMIPTG,在250rpm振荡下,于30℃对His6标记过的甲羟戊酸激酶进行4小时的诱导。用QIAexpress系统/Qiagen的试剂,通过Ni-NTA色谱,对His6标记过的甲羟戊酸激酶和His6标记过的甲羟戊酸激酶突变体进行纯化。
通过所谓的“两步PCR”对His6标记过的甲羟戊酸激酶进行诱变,其中使用Stratagene(La Jolla,CA,USA)的Turbo-Pfu DNA聚合酶。第一次PCR用含有被突变的密码子的引物(引物M)和引物pQE-5’来进行,后者与pQE-80L的多克隆位点(MCS)5’-末端的一小段序列相对应。模板是pQE-80L-His-Mvk。通过琼脂糖凝胶电泳对PCR产物进行纯化,将其用作为第二次PCR反应的引物,第二次反应中还含有引物pQE-3’,其包含MCS 3’-末端的一小段序列,野生型pQE-80L-His-Mvk被用作为模板。通过琼脂糖凝胶电泳对PCR产物进行纯化,用EcoRI和BamHI进行消化,用其将His-Mvk亚克隆进pQE-80L。最后,通过琼脂糖凝胶电泳对经过消化的片段进行纯化,并将其连接到用同样的限制性酶线性化过的pQE-80L上。
实施例5 Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体的反馈抗性按照实施例2所述来制备甲羟戊酸。试验混合物由100mMK2HPO4/KH2PO4(pH 7.0)、1mM ATP、1mM甲羟戊酸、2mM MgCl2、0.5mM磷酸烯醇式丙酮酸(PEP)、0.32mM NADH、20U/ml丙酮酸激酶和27U/ml乳酸脱氢酶(Sigma-Aldrich,St.Louis,MO,USA)构成。在试验混合物中用作为抑制剂的FPP、GGPP、IPP、DMAPP和GPP全部购自Sigma。将92μM的FPP或17.6μM的GGPP用于对甲羟戊酸激酶突变体进行的抑制试验。为对FPP、GGPP、IPP、DMAPP和GPP造成的抑制进行比较,加入138μM的上述中间产物(实施例9)。加入经过纯化的(His6-标记过的)甲羟戊酸激酶后,酶反应由NADH的消耗所反映,然后在340nm处进行光度测量。
按照如下方法来计算反馈抗性(%)如果a和b分别是不存在或存在反馈抑制剂(本情况下,FPP)的情况下测得的野生型酶的甲羟戊酸激酶活性,如果c和d是分别是不存在或存在相同的反馈抑制剂的情况下测得的突变体酶的甲羟戊酸激酶活性,那么%反馈抗性就是%抗性=100((d/c)-(b/a))/(1-(b/a))表1.对Paracoccus zeaxanthinifaciens甲羟戊酸激酶的诱变对该酶的比活性以及反馈抗性的影响
WT表示具有SEQ ID No15(具有His6-标记)的甲羟戊酸激酶。
令人吃惊地,上述突变对甲羟戊酸激酶的反馈抑制具有影响。现有技术中,已有研究者提出,人甲羟戊酸激酶第133至156位残基的保守疏水片断是类异戊二烯结合的优良候选位点(Riou et al.,Gene 148,293-297,1994;Houten et al.,Biochim,Biophys.Acta 1529,19-32,2000)。但是,上述突变中的任何一种都不定位于Paracoccus zeaxanthinifaciens甲羟戊酸激酶的相应片断处(残基137-160)。
有相当数量的突变被认为会降低或者甚至破坏掉甲羟戊酸激酶的活性,因此导致人类疾病甲羟戊酸尿症、超免疫球蛋白D症以及周期性发热综合征(例如,K13X、H20P、H20N、L39P、W62X、S135L、A148T、Y149X、S150L、P165L、P167L、G202R、T209A、R215Q、T243I、L264F、L265P、I268T、S272F、R277C、N301T、G309S、V310M、G326R、A334T、V377I和R388X,全部都在人类甲羟戊酸激酶中,Houten et al.,Eur.J.Hum.Genet.9,253-259,2001;Cuisset et al.,Eur.J.Hum.Genet.9,260-266,2001)。其中,仅有两种(即P165L和R215Q)发生于氨基酸序列比对中相应于显示出反馈抗性有影响的Paracoccuszeaxanthinifaciens甲羟戊酸激酶残基(即,分别为残基169和204)位置的残基。但是,以前描述的人类甲羟戊酸激酶中的突变并未显示出对反馈抗性具有影响,但是暗示会对酶的(比)活性造成负面影响。
实施例6 在前文中被鉴定为对酶的反馈抑制抗性有影响的氨基酸残基/位置,对Paracoccus zeaxanthinifaciens甲羟戊酸激酶讲行饱和诱变按照上文所述用于诱变的方法来进行饱和诱变,不同之处在于合成的诱变引物中,要经历饱和诱变的密码子由随机化序列构成。
表2.对Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体I17T的第167和169位残基进行的饱和诱变,以及对酶的比活性和反馈抗性的影响。
WT表示具有SEQ ID No15(具有His6-标记)的甲羟戊酸激酶。
表3.对Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体I17T、G47D的第93位残基进行的饱和诱变
表4.对Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体I17T、G47D、K93E的第132位残基进行的饱和诱变
实施例7 用对反馈抑制具有抗性的甲羟戊酸激酶,增加对类异戊二烯化合物辅酶Q10的生产为检验突变对甲羟戊酸激酶反馈抑制进行影响的体内效果,将Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体K93E引入到功能性的甲羟戊酸操纵子中,所述操纵子已被克隆到能在Paracoccuszeaxanthinifaciens中进行复制的广宿主范围载体上。对P.zeaxanthinifaciens的两种重组菌株(区别仅在于有或没有K93E突变)生产类异戊二烯化合物辅酶Q10的情况直接进行比较。
质粒构建图2中以图的形式对质粒构建进行了阐述。克隆的细节如下所示。在LB培养基(Becton Dickinson,Sparks,MD,USA)中,于37℃对E.coli菌株进行培养。为在重组的E.coli菌株中维持质粒,向培养基中加入氨苄青霉素(100μg/ml)和/或卡纳霉素(25-50μg/ml,取决于实验)。对固体培养基而言,还要加入琼脂(1.5%的终浓度)。在200rpm的旋转式摇床上对液体培养物进行培养。
质粒pBBR-K-mev-op-wt(图2)含有甲羟戊酸操纵子,其中包括插入到质粒pBBRlMCS-2的SacI和NsiI位点之间的来自P.zeaxanthinifaciens菌株ATCC 21588的其启动子区域(Kovach et al.,Gene 166,175-176,1995)。被克隆的甲羟戊酸操纵子对应于GenBank/EMBL编号为AJ431696的序列的第2469至9001位核苷酸的序列。在SacI位点和甲羟戊酸操纵子序列之间有一段短的连接序列,其来自质粒pCR2.1-TOPO(Invitrogen,Carlsbad,CA,USA),对应于从SacI位点到PCR片段插入位点之间的序列。应当注意到,编号为AJ431696的序列是来自P.zeaxanthinifaciens菌株R114(ATCC PTA-3335)的,而非来自P.zeaxanthinifaciens菌株ATCC 21588。P zeaxanthinifaciens菌株ATCC21588和R114的甲羟戊酸操纵子序列的唯一区别在于来自菌株R114的mvk基因中的突变。该突变导致甲羟戊酸激酶的第265位氨基酸从丙氨酸变为缬氨酸(A265V)。因为pBBR-K-mev-op-wt中的甲羟戊酸操纵子来自ATCC 21588,其不含突变,因此mvk中的密码子265是GCC(而非编号为AJ431696的序列的GTC)。
还构建了一种与pBBR-K-mev-op-wt类似但具有来自菌株R114的mvk基因的质粒,其被命名为pBBR-K-mev-op-R114。将处于pBBR-K-mev-op-R114的Ecl136 II和SpeI位点之间的crtE启动子区域控制之下的、来自P.zeaxanthinifaciens菌株ATCC 21588的ddsA基因引入,得到pBBR-K-mev-op-R114-PcrtE-ddsAwt(图2)。
最后一步是制造与pBBR-K-mev-op-R114-PcrtE-ddsAwt相同但含有mvk基因上的K93E突变的质粒。通过将3166bp的XmaI-SpeI片段亚克隆到经过XmaI-SpeI切割的载体pBluescript II KS+(Stratagene,La Jolla,CA,USA)中,构建出质粒pBlu2SP-mvk-mvd(图2)。质粒pBlu2SP-mvk-mvd具有方便的单限制性内切酶位点XmaI和AscI,用于将经过突变的mvk基因引入到甲羟戊酸操纵子的3’-末端。用XmaI和AscI去切割质粒pQE-80L-mvk-K93E,并将带有mvk中的大部分(包括K93E突变)的l kb片段与XmaI-AscI切割过的pBlu2SP-mvk-mvd主链相连,得到pBlu2KSp-mvk-K93E-mvd。为重构在mvk上带有K93E突变的全长甲羟戊酸操纵子,用XmaI和SpeI对pBlu2KSp-mvk-K93E-mvd进行切割,并将3166bp的片段与来自pBBR-K-mev-op-R114-PcrtE-ddsAwt的8.18kb的XmaI-SpeI片段连接起来,得到pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt。该质粒中mvk基因的第265位密码子是GTC,因为pQE-80L-mvk-K93E的mvk基因来自P.zeaxanthinifaciens菌株R114(ATCC PTA-3335)。
概括起来,质粒pBBR-K-mev-op-R114-PcrtE-ddsAwt和pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt是相同的,只除了在后一个质粒中存在有K93E突变。
构建重组的P.zeaxanthinifaciens菌株P.zeaxanthinifaciens菌株被培养于28℃。用于P.zeaxanthinifaciens菌株的培养基组分如下所示。除非另有指明,生长于瓶中的P.zeaxanthinifaciens菌株的全部液体培养物都被震荡培养于200rpm的旋转式摇床上。对固体培养基加入琼脂(2%的终浓度)。通过高压灭菌对培养基进行灭菌,在灭菌之后加入葡萄糖(作为浓缩贮液),以获得理想的终浓度。F-培养基含有(每升蒸馏水)蛋白胨,10g;酵母提取物,10g;NaCl,30g;D-葡萄糖·H2O,10g;MgSO4·7H2O,5g。在通过过滤或高压灭菌进行灭菌之前,将pH调至7.0。培养基362F/2含有(每升蒸馏水)D-葡萄糖·H2O,33g;酵母提取物,10g;蛋白胨,10g;NaCl,5g;MgSO4·7H2O,2.5g。在通过过滤或高压灭菌进行灭菌之前,将pH调至7.4。灭菌之后,加入微量元素溶液、NKP溶液和CaFe溶液,每种均为2.5ml。通过过滤对后三种溶液进行灭菌。微量元素溶液含有(每升蒸馏水)(NH4)2Fe(SO4)2·6H2O,80g;ZnSO4·7H2O,6g;MnSO4·H2O,2g;NiSO4·6H2O,0.2g;EDTA,6g。NKP溶液含有(每升蒸馏水)K2HPO4,250g;(NH4)2PO4,300g。CaFe溶液含有(每升蒸馏水)CaCl2·2H2O,75g;FeCl3·6H2O,5g;浓缩的HCl,3.75ml。
按照如下方法来制备P.zeaxanthinifaciens菌株R114的电感受态细胞,并进行电穿孔用1.5ml P.zeaxanthinifaciens菌株R114的稳定状态培养物对100ml F培养基进行接种,在28℃,200rpm下培养,直到660nm下的光密度达到大约0.5。通过在4℃、7000xg下离心15分钟来收获细胞,在pH为7的100ml冰冷的HEPES缓冲液中洗两次。最终的沉淀被重新悬浮于0.1ml冰冷的HEPES缓冲液(pH 7)中,细胞被立即用于电穿孔或者加入终浓度为15%的甘油,以50μl为一份,将细胞贮藏于-80℃。向去除了盐的溶液中加入1至5/μl的质粒DNA,在冰冷的1mm小管中,18kV/cm和129Ohms下进行电传孔。典型地,脉冲长度在4至5毫秒之间。加入1ml的F培养基,在28℃对细胞进行1小时的培养。将稀释液涂布到含有25-50μg/ml卡纳霉素的F-琼脂平板上,在28℃进行培养。通过PCR分析,证实可能的转化子含有想要的质粒。
用于评价辅酶Q10牛产情况的培养条件在对P.zeaxanthinifaciens菌株R114/pBBR-K-mev-op-R114-PcrtE-ddsAwt和R114/pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt进行的补料分批培养中来检测辅酶Q10的生产情况。所有培养物最初都来自冷冻的细胞悬浮液(作为25%甘油贮液贮藏于-80℃)。在每瓶含有200ml 362F/2培养基的2升带挡板摇瓶中来制备用于补料分批发酵的预培养物,2瓶。对每只摇瓶,用2毫升解冻的细胞悬浮液作为接种体。预培养物的起始pH为7.2。在250rpm震荡下,于28℃对预培养物进行28小时的培养,这段时间后,660nm处的光密度(OD660)在14至22个吸收单位之间,具体取决于所用的菌株。主培养物被培养于Biostat ED生物反应器(B.BraunBiotech International,Melsungen,Germany)中,其中含有具有如下组分的培养基(每升蒸馏水)D-葡萄糖·H2O,25g;酵母提取物(Tastone900),17g;NaCl,4.0g;MgSO4·7H2O,6.25g;(NH4)2Fe(SO4)2·6H2O,0.5g;ZnSO4·7H2O,0.038g;MnSO4·H2O,0.013g;NiSO4·6H2O,0.001g;CaCl2·2H2O,0.47g;FeCl3·6H2O,0.062g;烟酸,0.01g;NH4Cl,0.5g;消泡剂,0.1ml;KP溶液,3.5ml。KP溶液的组分为(每升蒸馏水)K2HPO4,250g;NaH2PO4·2H2O,200g;(NH4)2HPO4,100g。向用于携带有质粒的菌株的培养基中加入卡纳霉素(终浓度为50mg/l)。用于所有方法中的补料溶液具有如下组分(每升蒸馏水)D-葡萄糖·H2O,550g;KP溶液,18.25ml。生物反应器中的初始体积(接种之后)为8.0L。按照需要,用灭菌水对预培养物进行稀释,使得向生物反应器中加入400ml能获得0.5的初始OD660值。发酵条件被自动控制为如下条件28℃,pH 7.2(通过加入28%的NH4OH来控制pH),溶解氧被控制为最小40%的相对值(与搅拌级联),搅拌的最小值为300rpm,通气速率为1v.vm(相对于终体积而言)。不添加补料溶液的情况下,在上述条件下进行20小时的培养(分批阶段)。此段时间后,搅拌速度降低,基础消耗终止,pH骤然升高,CO2的产生下降,这是最初的葡萄糖被耗尽的标志,开始进行补料。标准补料方式被定义为如下部分(丛补料起始点开始)17小时内,从50g/h斜线上升至80g/h,在80g/h保持7小时,然后在11小时内斜线下降至55g/h,在发酵的剩余时间内保持在55g/h(总发酵时间=70小时)。主培养物的终体积为大约10升。
分析方法试剂。乙腈、二甲基亚砜(DMSO)、四氢呋喃(THF)、四丁基甲醚(TBME)和丁基化羟基甲苯(BHT)是分析纯或HPLC级的,其都获得自Fluka(瑞士)。辅酶Q10购自Fluka。甲醇(Lichrosolv)购自Merck,Darmstadt,德国。类胡萝卜素标准物从Chemistry ResearchDepartment,Roche Vitamins Ltd.,Switzerland获得。
样品制备和抽提。将全培养液中的400微升转移到一次性的15ml聚丙烯离心管中。加入4毫升经稳定的抽提溶液(0.5g/l BHT,处于1∶1(v/v)DMSO/THF)中,在实验室摇床(IKA,德国)中,对样品进行20分钟的混合,以促进抽提。最后,对样品进行离心,将上清液转移到琥珀色玻璃管中,以进行高效液相色谱(HPLC)分析。
HPLC。开发了一种反向HPLC方法,用于对泛醌及其相应对苯二酚同时进行测定。该方法能将类胡萝卜素玉米黄质、八氢番茄红素、β-隐黄质、β-胡萝卜素和番茄红素与辅酶Q10清楚地分开。用装备有温控自动上样仪和二极管阵列检测器的Agilent 1100 HPLC系统来进行色谱分析。该方法的参数如下所示柱YMC类胡萝卜素C30柱3微米,钢,150mm长×3.0mm ID(YMC,Part No.CT99S031503QT)保护柱Security Guard CI8(ODS,十八烷)4mm长×3.0mm I.D.
(Phenomenex,Part No.AJO-4287)典型柱压 开始时60bar流速 0.5ml/min移动相乙腈(A)∶甲醇(B)∶TBME(C)的混合物
时间(post time) 4分钟注射体积10μl柱温15℃
检测按照表5将三种波长用于检测特定的化合物表5.HPLC保留时间和所用的波长
计算、选择性、线性、检测极限和可重现性。计算是基于峰的面积来进行的。通过向其中注射相关参照化合物的标准溶液对该方法的选择性进行了验证。目标化合物(辅酶Q10和泛醌10)完全分开,没有显示任何的干扰。对辅酶Q10在抽提溶液中的一系列稀释物(见上文)进行制备和分析。线性范围被发现为5mg/l至50mg/l。相关系数为0.9999。用该HPLC方法检测辅酶Q10的极限被测定为4mg/l。对该方法(包括抽提步骤)的可重现性进行了验证。对十份单独的样品制剂进行比较。相对标准差被测定为4%。
关于辅酶Q10生产情况的结果在上述补料分批培养条件下,P.zeaxanthinifaciens菌株R114/pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt生产的辅酶Q10的终浓度比针对菌株R114/pBBR-K-mev-opR114-PcrtE-ddsAwt观察到的要高34%。该差异并不能简单归结于两种菌株的生长差异,菌株R114/pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt较之菌株R114/pBBR-K-mev-opR114-PcrtE-ddsAwt,还显示出了要高12%的辅酶Q10比产量(单位辅酶Q10/克细胞干重/小时)。此外,菌株R114/pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt较之菌株R114/pBBR-K-mev-opR114-PcrtE-ddsAwt,其培养基中甲羟戊酸的积累还有31%的降低。该比较显示,质粒pBBR-K-mev-op-(mvk-K93E)-PcrtE-ddsAwt中的突变K93E对辅酶Q10的生产增加具有直接作用。
实施例8 I17T突变对Paracoccus zeaxanthinifaciens甲羟戊酶激酶溶解度的影响对人类甲羟戊酸激酶而言,对E.coli转化子进行IPTG诱导后,突变体E19A、E19Q和H20A都显示出了完全不溶的性质(Potter and Miziorko,J.Biol.Chem.272,25449-25454,1997)。加上His6标签的Paracoccuszeaxanthinifaciens R114甲羟戊酸激酶(SEQ ID NO15)还显示出了明显的聚集/沉淀趋势,尤其是在具有较高的离子强度的缓冲液(例如,50mMNaH2PO4,pH 8.0,300mM NaCl,250mM咪唑)中。令人惊奇地,加上His6标签的Paracoccus zeaxanthinifaciens R114甲羟戊酸激酶突变体I17T在同样条件下可完全溶解,并且稳定,因此该突变体酶更适于需要可溶甲羟戊酸激酶的应用。
实施例9 途径中不同下游产物对甲羟戊酸激酶的反馈抑制以前有过报道,多种甲羟戊酸激酶都对甲羟戊酸途径下游产物造成的反馈抑制敏感,所述下游产物包括IPP、DMAPP、GPP、FPP、GGPP、植基-PP、法呢醇、磷酸多萜醇。在138μM的GGPP、FPP、GPP、IPP或DMAPP下,加上His6标签的Paracoccus zeaxanthinifaciens甲羟戊酸激酶活性分别受到98%、80.1%、18.6%、16.3%和14.7%的抑制。Paracoccuszeaxanthinifaciens甲羟戊酸激酶I17T/G47D/K93E/P132S对FPP(92μM)或GGPP(17.6μM)造成的反馈抑制的抗性分别为83%和92%。
实施例10 对与Paracoccus zeaxanthinifaciens甲羟戊酸激酶同源的甲羟戊酸激酶的相应残基的鉴定用序列比对程序GAP(GCG Wisconsin Package,version 10.2,AccelrysInc.,9685 Scranton Road,San Diego,CA 92121-3752,USA;缺口产生罚分8,缺口延伸罚分2),鉴定出了下述相应于Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列(SEQ ID NO1)特定氨基酸位置的残基
氨基酸编号根据SEQ ID NO1-15和30来进行。
(-)表示没检测出同源残基。
未经修饰的甲羟戊酸激酶的氨基酸序列的例子包括但不限于下述氨基酸序列(SEQ ID NO1-15和30)。编码未经修饰的甲羟戊酸激酶(SEQID NO1-14和30)的核苷酸序列分别展示于SEQ ID NO16-29以及31中。
SEQ ID NO1Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列。
SEQ ID NO2人类甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q03426)。
SEQ ID NO3小鼠甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q9R008)。
SEQ ID NO4大鼠甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号P17256)。
SEQ ID NO5Arabidopsis thaliana甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号P46086)。
SEQ ID NO6酵母甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号P07277)。
SEQ ID NO7Schizosaccharomyces pombe甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q09780)。
SEQ ID NO8Pyrococcus abyssi甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q9V187)。
SEQ ID NO9Pyrococcus horikoshii甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q59291)。
SEQ ID NO10Pyrococcus furiosus甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q8UOF3)。
SEQ ID NO11Methanobacterium thermoautotrophicum甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q50559)。
SEQ ID NO12Archaeoglobus fulgidus甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号027995)。
SEQ ID NO13Methanococcus jannaschii甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q58487)。
SEQ ID NO13Methanococcus jannaschii甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q58487)。
SEQ ID NO14Aeropyrum pernix甲羟戊酸激酶的氨基酸序列(Swiss-Prot编号Q9Y946)。
SEQ ID NO15加上His6标签的Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列。
SEQ ID NO16Paracoccus zeaxanthinifaciens甲羟戊酸激酶的DNA序列。
SEQ ID NO17人类甲羟戊酸激酶的DNA序列(Genbank编号M88468)。
SEQ ID NO18小鼠甲羟戊酸激酶的DNA序列(Genbank编号AF137598)。
SEQ ID NO19大鼠甲羟戊酸激酶的DNA序列(Genbank编号M29472)。
SEQ ID NO20Arabidopsis thaliana甲羟戊酸激酶的DNA序列(Genbank编号X77793)。
SEQ ID NO21酵母甲羟戊酸激酶的DNA序列(Genbank编号X06114)。
SEQ ID NO22Schizosaccharomyces pombe甲羟戊酸激酶的DNA序列(Genbank编号AB000541)。
SEQ ID NO23Pyrococcus abyssi甲羟戊酸激酶的DNA序列(Genbank编号AJ248284)。
SEQ ID NO24Pyrococcus horikoshii甲羟戊酸激酶的DNA序列(Genbank编号AB009515;反向)。
SEQ ID NO25Pyrococcus furiosus甲羟戊酸激酶的DNA序列(Genbank编号AE010263;反向)。
SEQ ID NO26Methanobacterium thermoautotrophicum甲羟戊酸激酶的DNA序列(Genbank编号U47134)。
SEQ ID NO27Archaeoglobus fulgidus甲羟戊酸激酶的DNA序列(Genbank编号AE000946;反向)。
SEQ ID NO28Methanococcus jannaschii甲羟戊酸激酶的DNA序列(Genbank编号U67551)。
SEQ ID NO29Aeropyrum pernix甲羟戊酸激酶的DNA序列(Genbank编号AP000064)。
SEQ ID NO30Phaffia rhodozyma ATCC96594甲羟戊酸激酶的氨基酸序列。
SEQ ID NO31Phaffia rhodozyma ATCC96594甲羟戊酸激酶的基因(DNA)序列。该甲羟戊酸激酶由4个内含子和5个外显子构成。
外显子11021-1124内含子11125-1630外显子21630-1956内含子21957-2051外显子32052-2366内含子32367-2446外显子42447-2651内含子42652-2732外显子52733-3188PolyA位点3284SEQ ID NO32加上His6标签的Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体I17T的DNA序列。
SEQ ID NO33加上His6标签的Paracoccus zeaxanthinifaciens甲羟戊酸激酶突变体I17T/G47D/K93E/P132S的DNA序列。
序列表<110>帝斯曼知识产权资产管理有限公司<120>具有反馈抗性的甲羟戊酸激酶<130>case 21788<150>EP 03012294.9<151>2003-06-12<160>33<170>PatentIn version 3.2<210>1<211>378<212>PRt<213>Paracoccus zeaxanthinifaciens<400>1Met Ser Thr Gly Arg Pro Glu Ala Gly Ala His Ala Pro Gly Lys Leu1 5 10 15Ile Leu Ser Gly Glu His Ser Val Leu Tyr Gly Ala Pro Ala Leu Ala20 25 30Met Ala Ile Ala Arg Tyr Thr Glu Val Trp Phe Thr Pro Leu Gly Ile35 40 45Gly Glu Gly Ile Arg Thr Thr Phe Ala Aan Leu Ser Gly Gly Ala Thr50 55 60Tyr Ser Leu Lys Leu Leu Ser Gly Pbe Lys Ser Arg Leu Asp Arg Arg65 70 75 80Phe Glu Gln phe Leu Asn Gly Asp Leu Lys Val His Lys Val Leu Thr85 90 95His Pro Asp Asp Leu Ala Val Tyr Ala Leu Ala Ser Leu Leu His Asp100 105 110Lys Pro Pro Gly Thr Ala Ala Met Pro Gly Ile Gly Ala Met His His115 120 125Leu Pro Arg Pro Gly Glu Leu Gly Ser Arg Thr Glu Leu Pro Ile Gly130 135 140Ala Gly Met Gly Ser Ser Ala Ala Ile Val Ala Ala Thr Thr Val Leu
145 150 155 160Phe Glu Thr Leu Leu Asp Arg Pro Lys Thr Pro Glu Gln Arg Phe Asp165 170 175Arg Val Arg Phe Cys Glu Arg Leu Lys His Gly Lys Ala Gly Pro Ile180 185 190Asp Ala Ala Ser Val Val Arg Gly Gly Leu Val Arg Val Gly Gly Asn195 200 205Gly Pro Gly Ser Ile Ser Ser Phe Asp Leu Pro Glu Asp His Asp Leu210 215 220Val Ala Gly Arg Gly Trp Tyr Trp Val Leu His Gly Arg Pro Val Ser225 230 235 240Gly Thr Gly Glu Cys Val Ser Ala Val Ala Ala Ala His Gly Arg Asp245 250 255Ala Ala Leu Trp Asp Ala Phe Ala Val Cys Thr Arg Ala Leu Glu Ala260 265 270Ala Leu Leu Ser Gly Gly Ser Pro Asp Ala A la Ile Thr Glu Asn Gln275 280 285Arg Leu Leu Glu Arg Ile Gly Val Val Pro Ala Ala Thr Gln Ala Leu290 295 300Val Ala Gln Ile Glu Glu Ala Gly Gly Ala Ala Lys Ile Cys Gly Ala305 310 315 320Gly Ser Val Arg Gly Asp His Gly Gly Ala Val Leu Val Arg Ile Asp325 330 335Asp Ala Gln Ala Met Ala Ser Val Met Ala Arg His Pro Asp Leu Asp340 345 350Trp Ala Pro Leu Arg Met Ser Arg Thr Gly Ala Ala Pro Gly Pro Ala355 360 365Pro Arg Ala Gln Pro Leu Pro Gly Gln Gly370 375
<210>2<211>396<212>PRT<213>homo sapiens<400>2Met Leu Ser Glu Val Leu Leu Val Ser Ala Pro Gly Lys Val Ile Leu1 5 10 15His Gly Glu His Ala Val Val His Gly Lys Val Ala Leu Ala Val Ser20 25 30Leu Asn Leu Arg Thr Phe Leu Arg Leu Gln Pro His Sar Asn Gly Lys35 40 45Val Asp Leu Ser Leu Pro Asn Ile Gly Ile Lys Arg Ala Trp Asp Val50 55 60Ala Arg Leu Gln Ser Leu Asp Thr Ser Phe Leu Glu Gln Gly Asp Val65 70 75 80Thr Thr Pro Thr Ser Glu Gln Val Glu Lys Leu Lys Glu Val Ala Gly85 90 95Leu Pro Asp Asp Cys Ala Val Thr Glu Arg Leu Ala Val Leu Ala Phe100 105 110Leu Tyr Leu Tyr Leu Ser Ile Cys Arg Lys Gln Arg Ala Leu Pro Ser115 120 125Leu Asp Ile Val Val Trp Ser Glu Leu Pro Pro Gly Ala Gly Leu Gly130 135 140Ser Ser Ala Ala Tyr Ser Val Cys Leu Ala Ala Ala Leu Leu Thr Val145 150 155 160Cys Glu Glu Ile Pro Asn Pro Leu Lys Asp Gly Asp Cys Val Asn Arg165 170 175Trp Thr Lys Glu Asp Leu Glu Leu Ile Asn Lys Trp Ala Phe Gln Gly180 185 190Glu Arg Met Ile His Gly Asn Pro Ser Gly Val Asp Asn Ala Val Ser195 200 205
Thr Trp Gly Gly Ala Leu Arg Tyr His Gln Gly Lys Ile Ser Ser Leu210 215 220Lys Arg Ser Pro Ala Leu Gln Ile Leu Leu Thr Asn Thr Lys Val Pro225 230 235 240Arg Asn Thr Arg Ala Leu Val Ala Gly Val Arg Asn Arg Leu Leu Lys245 250 255Phe Pro Glu Ile Val Ala Pro Leu Leu Thr Ser Ile Asp Ala Ile Ger260 265 270Leu Glu Cys Glu Arg Val Leu Gly Glu Met Gly Glu Ala Pro Ala Pro275 280 285Glu Gln Tyr Leu Val Leu Glu Glu Leu Ile Asp Met Asn Gln His His290 295 300Leu Asn Ala Leu Gly Val Gly His Ala Ser Leu Asp Gln Leu Cys Gln305 310 315 320Val Thr Arg Ale Arg Gly Leu His Ser Lys Leu Thr Gly Ala Gly Gly325 330 335Gly Gly Cys Gly Ile Thr Leu Leu Lys Pro Gly Leu Glu Gln Pro Glu340 345 350Val Glu Ala Thr Lys Gln Ala Leu Thr Ser Cys Gly Phe Asp Cys Leu355 360 365Glu Thr Ser Ile Gly Ala Pro Gly Val Ser Ile His Ser Ala Thr Ser370 375 380Leu Asp Ser Arg Val Gln GIn Ala Leu Asp Gly Leu385 390 395<210>3<211>395<212>PRT<213>小鼠<400>3Met Leu Ser Glu Ala Leu Leu Val Ser Ala Pro Gly Lys Val Ile Leu1 5 10 15
His Gly Glu His Ala Val Val His Gly Lys Val Ala Leu Ala Ala Ala20 25 30Leu Asn Leu Arg Thr Phe Leu Leu Leu Arg Pro Gln Ser Asn Gly Lys35 40 45Val Ser Val Asn Leu Pro Asn Ile Gly Ile Lys Gln Val Trp Asp Val50 55 60Gly Met Leu Gln Arg Leu Asp Thr Ser Phe Leu Glu Gln Gly Asp Val65 70 75 80Ser Val Pro Thr Leu Glu Gln Leu Glu Lys Leu Lys Lys Met Gly Asp85 90 95Leu Pro Arg Asp Arg Ala Gly Asn Glu Gly Met Ala Leu Leu Ala Phe100 105 110Leu Tyr Leu Tyr Leu Ala Ile Cys Arg Lys Gln Arg Thr Leu Pro Ser115 120 125Leu Asp Met Val Val Trp Ser Glu Leu Pro Pro Gly Ala Gly Leu Gly130 135 140Ser Ser Ala Ala Tyr Ser Val Cys Leu Ala Ala Ala Leu Leu Thr Ala145 150 155 160Cys Glu Glu Val Ser Asn Pro Leu Lys Asp Gly Val Ser Val Ser Arg165 170 175Trp Pro Glu Glu Asp Leu Lys Ser Ile Asn Lys Trp Ala Phe Glu Gly180 185 190Glu Arg Val Ile His Gly Asn Pro Ser Gly Val Asp Asn Ala Val Ser195 200 205Thr Trp Gly Gly Ala Leu Arg Phe Gln Gln Gly Thr Met Ser Ser Leu210 215 220Lys Ser Leu Pro Ser Leu Gln Ile Leu Leu Thr Asn Thr Lys Val Pro225 230 235 240Arg Ser Thr Lys Ala Leu Val Ala Ala Val Arg Ser Arg Leu Thr Lys245 250 255
Phe Pro Glu Ile Val Ala Pro Leu Leu Thr Ser Ile Asp Ala Ile Ser260 265 270Leu Glu Cys Glu Arg Val Leu Gly Glu Met Val Ala Ala Pro Val Pro275 280 285Glu Gln Tyr Leu Val Leu Glu Glu Leu Ile Asp Met Asn Gln His His290 295 300Leu Asn Ala Leu Gly Val Gly His Asn Ser Leu Asp Gln Leu Cys Gln305 310 315 320Val Thr Ala Ala His Gly Leu His Ser Lys Leu Thr Gly Ala Gly Gly325 330 335Gly Gly Cys Gly Ile Thr Leu Leu Lys Pro Gly Leu Glu Gln Ala Thr340 345 350Val Glu Ala Ala Lys Gln Ala Leu Thr Ser Cys Gly Phe Asp Cys Trp355 360 365Glu Thr Ser Ile Gly Ala Pro Gly Val Ser Thr His Ser Ala Ala Ala370 375 380Val Gly Asp Pro Val Arg Gln Ala Leu Gly Leu385 390 395<210>4<211>395<212>PRT<213>大鼠<400>4Met Leu Ser Glu Val Leu Leu Val Ser Ala Pro Gly Lys Val Ile Leu1 5 10 15His Gly Glu His Ala Val Val His Gly Lys Val Ala Leu Ala Val Ala20 25 30Leu Asn Leu Arg Thr Phe Leu Val Leu Arg Pro Gln Ser Asn Gly Lys35 40 45Val Ser Leu Asn Leu Pro Asn Val Gly Ile Lys Gln Val Trp Asp Val50 55 60
Ala Thr Leu Gln Leu Leu Asp Thr Gly Phe Leu Glu Gln Gly Asp Val65 70 75 80Pro Ala Pro Thr Leu Glu Gln Leu Glu Lys Leu Lys Lys Val Ala Gly85 90 95Leu Pro Arg Asp Cys Val Gly Asn Glu Gly Leu Ser Leu Leu Ala Phe100 105 110Leu Tyr Leu Tyr Leu Ala Ile Cys Arg Lys Gln Arg Thr Leu Pro Ser115 120 125Leu Asp Ile Met Val Trp Ser Glu Leu Pro Pro Gly Ala Gly Leu Gly130 135 140Ser Ser Ala Ala Tyr Ser Val Cys Val Ala Ala Ala Leu Leu Thr Ala145 150 155 160Cys Glu Glu Val Thr Asn Pro Leu Lys Asp Arg Gly Ser Ile Gly Ser165 170 175Trp Pro Glu Glu Asp Leu Lys Ser Ile Asn Lys Trp Ala Tyr Glu Gly180 185 190Glu Arg Val Ile His Gly Asn Pro Ser Gly Val Asp Asn Ser Val Ser195 200 205Thr Trp Gly Gly Ala Leu Arg Tyr Gln Gln Gly Lys Met Ser Ser Leu210 215 220Lys Arg Leu Pro Ala Leu Gln Ile Leu Leu Thr Asn Thr Lys Val Pro225 230 235 240Arg Ser Thr Lys Ala Leu Val Ala Gly Val Arg Ser Arg Leu Ile Lys245 250 255Phe Pro Glu Ile Met Ala Pro Leu Leu Thr Ser Ile Asp Ala Ile Ser260 265 270Leu Glu Cys Glu Arg Val Leu Gly Glu Met Ala Ala Ala Pro Val Pro275 280 285Glu Gln Tyr Leu Val Leu Glu Glu Leu Met Asp Met Asn Gln His His290 295 300
Leu Asn Ala Leu Gly Val Gly His Ala Ser Leu Asp Gln Leu Cys Gln305 310 315 320Val Thr Ala Ala His Gly Leu His Ser Lys Leu Thr Gly Ala Gly Gly325 330 335Gly Gly Cys Gly Ile Thr Leu Leu Lys Pro Gly Leu Glu Arg Ala Lys340 345 350Val Glu Ala Ala Lys Gln Ala Leu Thr Gly Cys Gly Phe Asp Cys Trp355 360 365Glu Thr Ser Ile Gly Ala Pro Gly Val Ser Met His Ser Ala Thr Ser370 375 380Ile Glu Asp Pro Val Arg Gln Ala Leu Gly Leu385 390 395<210>5<211>378<212>PRT<213>Arabidopsis thaliana<400>5Met Glu Val Lys Ala Arg Ala Pro Gly Lys Ile Ile Leu Ala Gly Glu1 5 10 15His Ala Val Val His Gly Ser Thr Ala VaI Ala Ala Ala Ile Asp Leu20 25 30Tyr Thr Tyr Val Thr Leu Arg Phe Pro Leu Pro Ser Ala Glu Asn Asn35 40 45Asp Arg Leu Thr Leu Gln Leu Lys Asp Ile Ser Leu Glu Phe Ser Trp50 55 60Ser Leu Ala Arg Ile Lys Glu Ala Ile Pro Tyr Asp Ser Ser Thr Leu65 70 75 80Cys Arg Ser Thr Pro Ala Ser Cys Ser Glu Glu Thr Leu Lys Ser Ile85 90 95Ala Val Leu Val Glu Glu Gln Asn Leu Pro Lys Glu Lys Met Trp Leu100 105 110
Ser Ser Gly Ile Ser Thr Phe Leu Trp Leu Tyr Thr Arg Ile Ile Gly115 120 125Phe Asn Pro Ala Thr Val Val Ile Asn Ser Glu Leu Pro Tyr Gly Ser130 135 140Gly Leu Gly Ser Ser Ala Ala Leu Cys Val Ala Leu Thr Ala Ala Leu145 150 155 160Leu Ala Ser Ser Ile Ser Glu Lys Thr Arg Gly Asn Gly Trp Ser Ser165 170 175Leu Asp Glu Thr Asn Leu Glu Leu Leu Asn Lys Trp Ala Phe Glu Gly180 185 190Glu Lys Ile Ile His Gly Lys Pro Ser Gly Ile Asp Asn Thr Val Ser195 200 205Ala Tyr Gly Asn Met Ile Lys Phe Cys Ser Gly Glu Ile Thr Arg Leu210 215 220Gln Ser Asn Met Pro Leu Arg Met Leu Ile Thr Asn Thr Arg Val Gly225 230 235 240Arg Asn Thr Lys Ala Leu Val Ser Gly Val Ser Gln Arg Ala Val Arg245 250 255His Pro Asp Ala Met Lys Ser Val Phe Asn Ala Val Asp Ser Ile Ser260 265 270Lys Glu Leu Ala Ala Ile Ile Gln Ser Lys Asp Glu Thr Ser Val Thr275 280 285Glu Lys Glu Glu Arg Ile Lys Glu Leu Met Glu Met Asn Gln Gly Leu290 295 300Leu Leu Ser Met Gly Val Ser His Ser Ser Ile Glu Ala Val Ile Leu305 310 315 320Thr Thr Val Lys His Lys Leu Val Ser Lys Leu Thr Gly Ala Gly Gly325 330 335Gly Gly Cys Val Leu Thr Leu Leu Pro Thr Gly Thr Val Val Asp Lys
340 345 350Val Val Glu Glu Leu Glu Ser Ser Gly Phe Gln Cys Phe Thr Ala Leu355 360 365Ile Gly Gly Asn Gly Ala Gln Ile Cys Tyr370 375<210>6<211>443<212>PRT<213>Saccharomyces cerevisiae<400>6Met Ser Leu Pro Phe Leu Thr Ser Ala Pro Gly Lys Val Ile Ile Phe1 5 10 15Gly Glu His Ser Ala Val Tyr Asn Lys Pro Ala Val Ala Ala Ser Val20 25 30Sar Ala Leu Arg Thr Tyr Leu Leu Ile Ser Glu Ser Ser Ala Pro Asp35 40 45Thr Ile Glu Leu Asp Phe Pro Asp Ile Ser Phe Asn His Lys Trp Ser50 55 60Ile Asn Asp Phe Asn Ala Ile Thr Glu ASp Gln Val Asn Ser Gln Lys65 70 75 80Leu Ala Lys Ala Gln Gln Ala Thr Asp Gly Leu Ser Gln Glu Leu Val85 90 95Ser Leu Leu Asp Pro Leu Leu Ala Gln Leu Ser Glu Sar Phe His Tyr100 105 110His Ala Ala Phe Cys Phe Leu Tyr Met Phe Val Cys Leu Cys Pro His115 120 125Ala Lys Asn Ile Lys Phe Ser Leu Lys Ser Thr Leu Pro Ile Gly Ala130 135 140Gly Leu Gly Ser Ser Ala Ser Ile Ser Val Ser Leu Ala Leu Ala Met145 150 155 160Ala Tyr Leu Gly Gly Leu Ile Cly Ser Asn Asp Leu Glu Lys Leu Ser
165 170 175Glu Asn Asp Lys His Ile Val Asn Gln Trp Ala Phe Ile Gly Glu Lys180 185 190Cys Ile His Gly Thr Pro Ser Gly Ile Asp Asn Ala Val Ala Thr Tyr195 200 205Gly Asn Ala Leu Leu Phe Glu Lys Asp Ser His Asn Gly Thr Ile Asn210 215 220Thr Asn Asn Phe Lys Phe Leu Asp Asp Phe Pro Ala Ile Pro Met Ile225 230 235 240Leu Thr Tyr Thr Arg Ile Pro Arg Ser Thr Lys Asp Leu Val Ala Arg245 250 255Val Arg Val Leu Val Thr Glu Lys Phe Pro Glu Val Met Lys Pro Ile260 265 270Leu Asp Ala Met Gly Glu Cys Ala Leu Gln Gly Leu Glu Ile Met Thr275 280 285Lys Leu Ser Lys Cys Lys Gly Thr Asp Asp Glu Ala Val Glu Thr Asn290 295 300Asn Glu Leu Tyr Glu Gln Leu Leu Glu Leu Ile Arg Ile Asn His Gly305 310 315 320Leu Leu Val Ser Ile Gly Val Ser His Pro Gly Leu Glu Leu Ile Lys325 330 335Asn Leu Ser Asp Asp Leu Arg Ile Gly Ser Thr Lys Leu Thr Gly Ala340 345 350Gly Gly Gly Gly Cys Ser Leu Thr Leu Leu Arg Arg Asp Ile Thr Gln355 360 365Glu Gln Ile Asp Ser Phe Lys Lys Lys Leu Gln Asp Asp Phs Ser Tyr370 375 380Glu Thr Phe Glu Thr Asp Leu Gly Gly Thr Gly Cys Cys Leu Leu Ser385 390 395 400
Ala Lys Asn Leu Asn Lys Asp Leu Lys Ile Lys Ser Leu Val Phe Gln405 410 415Leu Phe Glu Asn Lys Thr Thr Thr Lys Gln Gln Ile Asp Asp Leu Leu420 425 430Leu Pro Gly Asn Thr Asn Leu Pro Trp Thr Ser435 440<210>7<211>404<212>PRT<213>Schizosaccharomyces pombe<400>7Met Ser Lys Ser Leu Ile Val Ser Ser Pro Gly Lys Thr Ile Leu Phe1 5 10 15Gly Glu His Ala Val Val Tyr Gly Ala Thr Ala Leu Ala Ala Ala Val20 25 30Ser Leu Arg Ser Tyr Cys Lyse Leu Gln Thr Thr Asn Asn Asn Glu Ile35 40 45Val Ile Val Met Ser Asp lle Gly Thr Glu Arg Arg Trp Asn Leu Gln50 55 60Ser Leu Pro Trp Gln His Val Thr Val Glu Asn Val GIn His Pro Ala65 70 75 80Ser Ser Pro Asn Leu Asp Leu Leu Gln Gly Leu Gly Glu Leu Leu Lys85 90 95Asn Glu Glu Asn Gly Leu Ile His Ser Ala Met teu Cys Thr Leu Tyr100 105 110Leu Phe Thr Ser Leu Ser Ser Pro Ser Gln Gly Cys Thr Leu Thr Ile115 120 125Ser Ser Gln Val Pro Leu Gly Ala Gly Leu Gly Ser Ser Ala Thr Ile130 135 140Ser Val Val Val Ala Thr Ser Leu Leu Leu Ala Phs Gly Asn Ile Glu145 150 155 160
Pro Pro Ser Ser Asn Ser Leu Gln Asn Asn Lys Ala Leu Ala Leu Ile165 170 175Glu Ala Trp Ser Phe Leu Gly Glu Cys Cys Ile His Gly Thr Pro Ser180 185 190Gly Ile Asp Asn Ala Val Ala Thr Asn Gly Gly Leu Ile Ala Phe Arg195 200 205Lys Ala Thr Ala His Gln Ser Ala Met Lys Glu Phe Leu Lys Pro Lys210 215 220Asp Thr Leu Ser Val Met Ile Thr Asp Thr Lys Gln Pro Lys Ser Thr225 230 235 240Lys Lys Leu Val Gln Gly Val Phe Glu Leu Lys Glu Arg Leu Pro Thr245 250 255Val Ile Asp Ser Ile Ile Asp Ala Ile Asp Gly Ile Ser Lys Ser Ala260 265 270Val Leu Ala Leu Thr Ser Glu Ser Asp Lys Asn Ser Ser Ala Lys Lys275 280 285Leu Gly Glu Phe Ile Val Leu Asn Gln Lys Leu Leu Glu Cys Leu Gly290 295 300Val Ser His Tyr Ser Ils Asp Arg Val Leu Gln Ala Thr Lys Ser Ile305 310 315 320Gly Trp Thr Lys Leu Thr Gly Ala Gly Gly Gly Gly Cys Thr Ile Thr325 330 335Leu Leu Thr Pro Glu Cys Lys Glu Glu Glu Phe Lys Leu Cys Lys Glu340 345 350Ser Leu Leu Ala His Lys Asn Sar Ile Tyr Asp Val Gln Leu Gly Gly355 360 365Pro Gly Val Ser Val Val Thr Asp Ser Asp Ser Phe Phe Pro Gln Tyr370 375 380Glu Ser Asp Phe Asp Phe Lys Lys Leu Ash Leu Leu Ser Lys Phe Asn385 390 395 400
Lys Tyr Tyr Ile<210>8<211>335<212>PRT<213>Pyrococcus abyssi<400>8Met Pro Arg Leu Val Leu Ala Ser Ala Pro Ala Lys Ile Ile Leu Phe1 5 10 15Gly Glu His Ser Val Val Tyr Gly Lys Pro Ala Ile Ala Ser Ala Ile20 25 30Asp Leu Arg Thr Tyr Val Arg Ala Glu Phe Asn Asp Ser Gly Asn Ile35 40 45Lya Ile Glu Ala His Asp Ils Lys Thr Pro Gly Leu Ile Val Ser Phe50 55 60Ser Glu Asp Lys Ile Tyr Phe Glu Thr Asp Tyr Gly Lys Ala Ala Glu65 70 75 80Val Leu Ser Tyr Val Arg Mis Ala Ile Glu Leu Val Leu Glu Glu Ala85 90 95Asp Lys Arg Thr Gly Val Ser Val Ser Ile Thr Ser Gln Ile Pro Val100 105 110Gly Ala Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Thr Ile Gly115 120 125Ala Val Ser Lys Leu Leu Asp Leu Glu Leu Ser Lys Glu Glu Ile Ala130 135 140Lys Met Gly Mis Lys Val Glu Leu Leu Val Gln Gly Ala Ser Ser Gly145 150 155 160Ile Asp Pro Thr Val Ser Ala Ile Gly Gly Phe Leu Tyr Tyr Lys Gln165 170 175Gly Glu Phe Glu Mis Leu Pro Phe Val Glu Leu Pro Ile Val Val Gly180 185 190
Tyr Thr Gly Ser Ser Gly Ser Thr Lys Glu Leu Val Ala Met Val Arg195 200 205Arg Arg Tyr Glu Glu Met Pro Glu Leu Ile Glu Pro Ile Leu Glu Ser210 215 220Met Gly Lys Leu Val Asp Lys Ala Lys Glu Val Ile Ile Ser Lys Leu225 230 235 240Asp Glu Glu Glu Lys Phe Leu Lys Leu Gly Glu Leu Met Asn Ile Asn245 250 255His Gly Leu Leu Asp Ala Leu Gly Val Ser Thr Lys Lys Leu Ser Glu260 265 270Leu Val Tyr Ala Ala Arg Thr Ala Gly Ala Ile Gly Ala Lys Leu Thr275 280 285Gly Ala Gly Gly Gly Gly Cys Met Tyr Ala Leu Ala Pro Gly Lys Gln290 295 300Arg Glu Val Ala Thr Ala Ile Lys Ile Ala Gly Gly Thr Pro Met Ile305 310 315 320Thr Arg Ile Ser Lys Glu Gly Leu Arg Ile Glu Glu Val Arg Glu325 330 335<210>9<211>335<212>PRT<213>Pyrococcus horikoshii<400>9Met Val Lys Tyr Val Leu Ala Ser Ala Pro Ala Lys Val Ile Leu Phe1 5 10 15Gly Glu His Ser Val Val Tyr Gly Lys Pro Ala Ile Ala Ser Ala Ile20 25 30Glu Leu Arg Thr Tyr Val Arg Ala Gln Phe Asn Asp Ser Gly Asn Ile35 40 45Lys Ile Glu Ala His Asp Ile Lys Thr Pro Gly Leu Ile Val Ser Phe50 55 60
Ser Glu Asp Lys Ile Tyr Phe Glu Thr Asp Tyr Gly Lys Ala Ala Glu65 70 75 80Val Leu Ser Tyr Val Arg Tyr Ala Ile Glu Leu Ala Leu Glu Glu Ser85 90 95Asp Lys Arg Val Gly Ile Asp Val Ser Ile Thr Ser Gln Ile Pro Val100 105 110Gly Ala Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Thr Ile Gly115 120 125Ala Val Ser Arg Leu Leu Gly Leu Glu Leu Ser Lys Glu Glu Ile Ala130 135 140Lys Leu Gly His Lys Val Glu Leu Leu Val Gln Gly Ala Ser Ser Gly145 150 155 160Ile Asp Pro Thr Val Ser Ala Val Gly Gly Phe Leu Tyr Tyr Lys Gln165 170 175Gly Lys Phe Glu Pro Leu Pro Phe Met Glu Leu Pro Ile Val Val Gly180 185 190Tyr Thr Gly Ser Thr Gly Ser Thr Lys Glu Leu Val Ala Met Val Arg195 200 205Lys Arg Tyr Glu Glu Met Pro Glu Leu Val Glu Pro Ile Leu Glu Ala210 215 220Met Gly Lys Leu Val Asp Lys Ala Lys Glu Ile Ile Leu Ser Lys Leu225 230 235 240Asp Glu Glu Glu Lys Leu Thr Lys Leu Gly Glu Leu Met Asn Ile Asn245 250 255His Gly Leu Leu Asp Ala Leu Gly Val Ser Thr Lys Lys Leu Gly Glu260 265 270Leu Val Tyr Ala Ala Arg Thr Ala Gly Ala Ile Gly Ala Lys Leu Thr275 280 285Gly Ala Gly Gly Gly Gly Cys Met Tyr Ala Leu Ala Pro Gly Arg Gln290 295 300
Arg Glu Val Ala Thr Ala Ile Lys Ile Ala Gly Gly Ile Pro Met Ile305 310 315 320Thr Arg Val Ser Arg Glu Gly Leu Arg Ile Glu Glu Val Ser Arg325 330 335<210>10<211>334<212>PRT<213>Pyrococcus furiosus<400>10Met Lys Val lle Ala Ser Ala Pro Ala Lys Val lle Leu Phe Gly Glu1 5 10 15His Ser Val Val Tyr Gly Lys Pro Ala Ile Ala Ala Ala Ile Asp Leu20 25 30Arg Thr Phe Val Glu Als Glu Leu Ile Arg Glu Lys Lys Ile Arg Ile35 40 45Glu Ala His Asp Ile Lys Val Pro Gly Leu Thr Val Ser Phe Ser Glu50 55 60Asn Glu Ile Tyr Phe Glu Thr Asp Tyr Gly Lys Ala Ala Glu Val Leu65 70 75 80Ser Tyr Val Arg Glu Ala Ile Asn Leu Val Leu Glu Glu Ala Asp Lys85 90 95Lys Asn Val Gly Ile Lys Val Ser Ile Thr Ser GIn Ile Pro Val Gly100 105 110Ala Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Thr Ile Gly Ala115 120 125Val Ser Lys Leu Leu Gly Leu Glu Leu Ser Lys Glu Glu Ile Ala Lys130 135 140Met Gly His Lys Thr Glu Leu Leu Val Gln Gly Ala Ser Ser Gly lle145 150 155 160Asp Pro Thr Val Ser Ala Ile Gly Gly Phe Ile Phe Tyr Glu Lys Gly165 170 175
Lys Phe Glu His Leu Pro Phe Met Glu Leu Pro Ile Val Val Gly Tyr180 185 190Thr Gly Ser Ser Gly Pro Thr Lys Glu Leu Val Ala Met Val Arg Lys195 200 205Arg Tyr Glu Glu Met Pro Glu Leu Ile Val Pro Ile Leu Glu Ala Met210 215 220Gly Lys Val Val Glu Lys Ala Lys Asp Val Ile Leu Ser Asn Val Asp225 230 235 240Lys Glu Glu Lys Phe Glu Arg Leu Gly Val Leu Met Asn Ile Asn His245 250 255Gly Leu Leu Asp Ala Leu Gly Val Ser Thr Lys Lys Leu Ser Glu Leu260 265 270Val Tyr Ala Ala Arg Val Ala Gly Ala Leu Gly Ala Lys Ile Thr Gly275 280 285Ala Gly Gly Gly Gly Cys Met Tyr Ala Leu Ala Pro Asn Lys Gln Arg290 295 300Glu Val Ala Thr Ala Ile Arg Ile Ala Gly Gly Thr Pro Met Ile Thr305 310 315 320Glu Ile Ser Arg Glu Gly Leu Lys Ile Glu Glu Val Ile Lye325 330<210>11<211>303<212>PRT<213>Methanobacterium thermoautotrophicum<400>11Met Lys Ser Ser Ala Ser Ala Pro Ala Lys Ala Ile Leu Phe Gly Glu1 5 10 15His Ala Val Val Tyr Ser Lys Pro Ala Ile Ala Ala Ala Ile Asp Arg20 25 30Arg Val Thr Val Thr Val Ser Glu Ser Ser Ser Thr His Val Thr Ile35 40 45
Pro Ser Leu Gly Ile Arg Mis Ser Ser Glu Arg Pro Ser Gly Gly Ile50 55 60Leu Asp Tyr Ile Gly Arg Cys Leu Glu Leu Tyr His Asp Ala Ser Pro65 70 75 80Leu Asp Ile Arg Val Glu Met Glu Ile Pro Ala Gly Ser Gly Leu Gly85 90 95Ser Ser Ala Ala Leu Thr Val Ala Leu Ile Gly Ala Leu Asp Arg Tyr100 105 110His Gly Arg Asp Mis Gly Pro Gly Glu Thr Ala Ala Arg Ala His Arg115 120 125Val Glu Val Asp Val Gln Gly Ala Ala Ser Pro Leu Asp Thr Ala Ile130 135 140Ser Thr Tyr Gly Gly Leu Val Tyr Leu Asp Ser Gln Arg Arg Val Arg145 150 155 160Gln Phe Glu Ala Asp Leu Gly Asp Leu Val Ile Ala His Leu Asp Tyr165 170 175Ser Gly Glu Thr Ala Arg Met Val Ala Gly Val Ala Glu Arg Phe Arg180 185 190Arg Phe Pro Asp Ile Met Gly Arg Lle Met Asp Thr Val Glu Ser Ile195 200 205Thr Asn Thr Ala Tyr Arg Glu Leu Leu Arg Asn Asn Thr Glu Pro Leu210 215 220Gly Glu Leu Met Asn Leu Asn Gln Gly Leu Leu Asp Ser Met Gly Val225 230 235 240Ser Thr Arg Glu Leu Ser Met Met Val Tyr Glu Ala Arg Asn Ala Gly245 250 255Ala Ala Gly Ser Lys Ile Thr Gly Ala Gly Gly Gly Gly Ser Ile Ile260 265 270Ala His Cys Pro Gly Cys Val Asp Asp Val Val Thr Ala Leu Asn Arg
275 280 285Asn Trp Lys Ala Met Arg Ala Glu Phe Ser Val Lys Gly Leu Ile290 295 300<210>12<211>284<212>PRT<213>Archaeoglobus fulgidus<400>12Met Ile Ala Ser Ala Pro Gly Lys Ile Ile Leu Phe Gly Glu His Ala1 5 10 15Val Val Tyr Gly Arg His Ala Val Val Ser Ala Ile Asn Leu Arg Cys20 25 30Arg Val Ser Val Arg Lys Ser Asp Arg Phe Leu Ile Arg Ser Ser Leu35 40 45Gly Glu Ser Gly Leu Asp Tyr Gln Arg His Pro Tyr Val Val Gln Ala50 55 60Val Lys Arg Phe Gly Glu Leu Arg Asn Ile Pro Gly Ala Glu Ile Glu65 70 75 80Ile Glu Ser Glu Ile Pro Ile Gly Ser Gly Leu Gly Ser Ser Ala Ala85 90 95Val Ile Val Ala Thr Ile Ala Ala Leu Asn Ala Glu Phe Asp Gly Asp100 105 110Met Asp Lys Glu Ala Ile Phe Gln Met Ala Lys Gln Val Glu Ile Asp115 120 125Val Gln Gly Arg Ala Ser Gly Ile Asp Pro Phe Ile Ser Thr Phe Gly130 135 140Gly Ser Trp Leu Phe Pro Glu Arg Arg Lys Val Glu Met Pro Phe Lys145 150 155 160Phe Phe Val Ile Asn Phe Gly Ser Arg Ser Thr Ala Glu Met Val Ala165 170 175Lys Val Ala Glu Leu Arg Glu Arg His Pro Glu Val Val Asp Lys Ile
180 185 190Phe Asp Ala Ile Asp Ala Ile Ser Leu Glu Ala Ser Asp Val Gly Ser195 200 205Ala Glu Arg Leu Glu Glu Leu Ile Ala Ile Asn Gln Ser Leu Leu Arg210 215 220Ala Ile Gly Val Ser Asn Pro Glu Ile Asp Arg Thr Ile Ala Glu Leu225 230 235 240Glu Arg Met Gly Leu Asn Ala Lys Ile Thr Gly Ala Gly Gly Gly Gly245 250 255Cys Ile Phe Gly Leu Phe Lys Gly Glu Lys Pro Lys Gly Ser Phe Ile260 265 270Val Glu Pro Glu Lys Glu Gly Val Arg Ile Glu Glu275 280<210>13<211>312<212>PRT<213>Methanococcus jannaschii<400>13Met Ile Ile Glu Thr Pro Ser Lys Val Ile Leu Phe Gly Glu His Alal 5 10 15Val Val Tyr Gly Tyr Arg Ala Ile Ser Met Ala Ile Asp Leu Thr Ser20 25 30Thr Ile Glu Ile Lys Glu Thr Gln Glu Asp Glu IIe Ile Leu Asn Leu35 40 45Asn Asp Leu Asn Lys Ser Leu Gly Leu Asn Leu Asn Glu Ile Lys Asn50 55 60Ile Asn Pro Asn Asn Phe Gly Asp Phe Lys Tyr Cys Leu Cys Ala Ile65 70 75 80Lys Asn Thr Leu Asp Tyr Leu Asn Ile Glu Pro Lys Thr Gly Phe Lys85 90 95Ile Asn Ile Ser Ser Lys Ile Pro Ile Ser Cys Gly Leu Gly Ser Ser
100 105 110Ala Ser Ile Thr Ile Gly Thr Ile Lys Ala Val Ser Gly Phe Tyr Asn115 120 125Lys Glu Leu Lys Asp Asp Glu Ile Ala Lys Leu Gly Tyr Met Val Glu130 135 140Lys Glu Ile Gln Gly Lys Ala Ser Ile Thr Asp Thr Ser Thr Ile Thr145 150 155 160Tyr Lys Gly Ile Leu Glu Ile Lys Asn Asn Lys Phe Arg Lys Ile Lys165 170 175Gly Glu Phe Glu Glu Phe Leu Lys Asn Cys Lys Phe Leu Ile Val Tyr180 185 190Ala Glu Lys Arg Lys Lys Lys Thr Ala Glu Leu Val Asn Glu Val Ala195 200 205Lys Ile Glu Asn Lys Asp Glu Ile Phe Lys Glu Ile Asp Lys Val Ile210 215 220Asp Glu Ala Leu Lys Ile Lys Asn Lys Glu Asp Phe Gly Lys Leu Met225 230 235 240Thr Lys Asn His Glu Leu Leu Lys Lys Leu Asn Ile Ser Thr Pro Lys245 250 255Leu Asp Arg Ile Val Asp Ile Gly Asn Arg Phe Gly Phe Gly Ala Lys260 265 270Leu Thr Gly Ala Gly Gly Gly Gly Cys Val Ile Ile Leu Val Asn Glu275 280 285Glu Lys Glu Lys Glu Leu Leu Lys Glu Leu Asn Lys Glu Asp Val Arg290 295 300Ile Phe Asn Cys Arg Met Met Asn305 310<210>14<211>324<212>PRT<213>Aeropyrum pernix
<400>14Met Arg Arg Ala Ala Arg Ala Ser Ala Pro Gly Lys Val Ile Ile Val1 5 10 15Gly Glu His Phe Val Val Arg Gly Ser Leu Ala Ile Val Ala Ala Ile20 25 30Gly Arg Arg Leu Arg Val Thr Val Arg Ser Gly Gly Lys Gly Ile Val35 40 45Leu Glu Ser Ser Met Leu Gly Arg His Ser Ala Pro Leu Pro Gly Gln50 55 60Gly Ala Ala Ala Lys Val Ser Pro Val Leu Glu Pro Tyr Ile Ala Val65 70 75 80Leu Arg Ser Leu Ala Ala Arg Gly Tyr Ser Val Val Pro His Thr Ile85 90 95Leu Val Glu Ser Gly Ile Pro Pro Arg Ala Gly Leu Gly Ser Ser Ala100 105 110Ala Ser Met Val Ala Tyr Ala Leu Ser Tyr Ser Ala Met His Gly Asp115 120 125Pro Leu Ser Ala Glu Asp Leu Tyr Ser Val Ale Met Glu Gly Glu Lys130 135 140Ile Ala His Gly Lys Pro Ser Gly Val Asp Val Thr Ile Ala Val Arg145 150 155 160Gly Gly Val Leu Ala Tyr Arg Arg Gly Glu Asn Pro Val Asp Ile Arg165 170 175Pro Gly Leu Thr Gly Val Thr Leu Leu Val Ala Asp Thr Gly Val Glu180 185 190Arg Arg Thr Arg Asp Val Val Glu His Val Leu Ser Ile Ala Asp Ala195 200 205Leu Gly Glu Ala Ser Thr Tyr Ile Tyr Arg Ala Ala Asp Leu Ile Ala210 215 220
Arg Glu Ala Leu His Ala Ile Glu Lys Gly Asp Ala Glu Arg Leu Gly225 230 235 240Leu Ile Met Asn Ala Ala Gln Gly Leu Leu Ser Ser Leu Gly Ala Ser245 250 255Ser Leu Glu Ile Glu Thr Leu Val Tyr Arg Met Arg Ser Ala Gly Ala260 265 270Leu Gly Ala Lys Leu Thr Gly Ala Gly Trp Gly Gly Cys Val Ile Gly275 280 285Leu Phe Lys Glu Gly Glu Val Glu Arg Gly Leu Glu Ser Val Val Glu290 295 300Ser Ser Ser Gln Ala Phe Thr Ala Ser Ile Ala Glu Glu Gly Ala Arg305 310 315 320Leu Glu Glu Phe<210>15<211>387<212>PRT<213>人工序列<220>
<223>His6-Paracoccus zeaxanthinifaciens<400>15Met Arg Gly Ser His His His His His His Ser Thr Gly Arg Pro Glu1 5 10 15Ala Gly Ala His Ala Pro Gly Lys Leu Ile Leu Ser Gly Glu His Ser20 25 30Val Leu Tyr Gly Ala Pro Ala Leu Ala Met Ala Ile Ala Arg Tyr Thr35 40 45Glu Val Trp Phe Thr Pro Leu Gly Ile Gly Glu Gly Ile Arg Thr Thr50 55 60Phe Ala Asn Leu Ser Gly Gly Ala Thr Tyr Ser Leu Lys Leu Leu Ser65 70 75 80Gly Phe Lys Ser Arg Leu Asp Arg Arg phe Glu Gln Phe Leu Asn Gly
85 90 95Asp Leu Lys Val His Lys Val Leu Thr His Pro Asp Asp Leu Ala Val100 105 110Tyr Ala Leu Ala Ser Leu Leu His Asp Lys Pro Pro Gly Thr Ala Ala115 120 125Met Pro Gly Ile Gly Ala Mer His His Leu Pro Arg Pro Gly Glu Leu130 135 140Gly Ser Arg Thr Glu Leu Pro Ile Gly Ala Gly Met Gly Ser Ser Ala145 150 155 160Ala Ile Val Ala Ala Thr Thr Val Leu Phe Glu Thr Leu Leu Asp Arg165 170 175Pro Lys Thr Pro Glu Gln Arg Phe Asp Arg Val Arg Phe Cys Glu Arg180 185 190Leu Lys His Gly Lys Ala Gly Pro Tle Asp Ala Ala Ser Val Val Arg195 200 205Gly Gly Leu Val Arg Val Gly Gly Asn Gly Pro Gly Ser Ile Ser Ser210 215 220Phe Asp Leu Pro Glu Asp His Asp Leu Val Ala Gly Arg Gly Trp Tyr225 230 235 240Trp Val Leu His Gly Arg Pro Val Ser Gly Thr Gly Glu Cys Val Ser245 250 255Ala Val Ala Ala Ala His Gly Arg Asp Ala Ala Leu Trp Asp Ala Phe260 265 270Ala Val Cys Thr Arg Ala Leu Glu Ala Ala Leu Leu Ser Gly Gly Ser275 280 285Pro Asp Ala Ala lle Thr Glu Asn Gln Arg Leu Leu Glu Arg Ile Gly290 295 300Val Val Pro Ala Ala Thr Gln Ala Leu Val Ala Gln Ile Glu Glu Ala305 310 315 320
Gly Gly Ala Ala Lys Ile Cys Gly Ala Gly Ser Val Arg Gly Asp His325 330 335Gly Gly Ala Val Leu Val Arg Ile Asp Asp Ala Gln Ala Met Ala Ser340 345 350Val Met Ala Arg His Pro Asp Leu Asp Trp Ala Pro Leu Arg Met Ser355 360 365Arg Thr Gly Ala Ala Pro Gly Pro Ala Pro Arg Ala Gln Pro Leu Pro370 375 380Gly Gln Gly385<210>16<211>1137<212>DNA<213>Paracoccus zeaxanthinifaciens<400>16atgtcgaccg gcaggcctga agcaggcgcc catgccccgg gcaagctgat cctgtccggggaacattccg tgctctatgg tgcgcccgcg cttgccatgg ccatcgcccg ctataccgaggtgtggttca cgccgcttgg cattggcgag gggatacgca cgacattcgc caatctctcgggcggggcga cctattcgct gaagctgctg tcggggttca agtcgcggct ggaccgccggttcgagcagt tcctgaacgg cgacctaaag gtgcacaagg tcctgaccca tcccgacgatctggcggtct atgcgctggc gtcgcttctg cacgacaagc cgccggggac cgccgcgatgccgggcatcg gcgcgatgca ccacctgccg cgaccgggtg agctgggcag ccggacggagctgcccatcg gcgcgggcat ggggtcgtct ccggccatcg tcgcggccac cacggtcctgttcgagacgc tgctggaccg gcccaagacg cccgaacagc gcttcgaccg cgtccgcttctgcgagcggt tgaagcacgg caaggccggt cccatcgacg cggccagcgt cgtgcgcggcgggcttgtcc gcgtgggcgg gaacgggccg ggttcgatca gcagcttcga tttgcccgaggatcacgacc ttgtcgcggg acgcggctgg tactgggtac tgcacgggcg ccccgtcagcgggaccggcg aatgcgtcag cgcggtcgcg gcggcgcatg gtcgcgatgc ggcgctgtgggacgccttcg cagtctgcac ccgcgcgttg gaggccgcgc tgctgtctgg gggcagccccgacgccgcca tcaccgagaa ccagcgcctg ctggaacgca tcggcgtcgt gccggcagcgacgcaggccc tcgtggccca gatcgaggag gcgggtggcg cggccaagat ctgcggcgcaggttccgtgc ggggcgatca cggcggggcg gtcctcgtgc ggattgacga cgcgcaggcg
atggcttcgg tcatggcgcg ccatcccgac ctcgactggg cgcccctgcg catgtcgcgc 1080acgggggcgg cacccggccc cgcgccgcgt gcgcaaccgc tgccggggca gggctga 1137<210>17<211>1191<212>DNA<213>homo sapiens<400>17atgttgtcag aagtcctact ggtgtctgct ccggggaaag tcatccttca tggagaacat60gccgtggtac atggcaaggt agcactggct gtatccttga acttgagaac attcctccggcttcaacccc acagcaatgg gaaagtggac ctcagcttac ccaacattgg tatcaagcgggcctgggatg tggccaggct tcagtcactg gacacaagct ttctggagca aggtgatgtcacaacaccca cctcagagca agtggagaag ctaaaggagg ttgcaggctt gcctgacgactgtgctgtca ccgagcgcct ggctgtgctg gcctttcttt acttatacct gtccatctgccggaagcaga gggccctgcc gagcctggat atcgtagtgt ggtcggagct gccccccggggcgggcttgg gctccagcgc cgcctactcg gtgtgtctgg cagcagccct cctgactgtgtgcgaggaga tcccaaaccc gctgaaggac ggggattgcg tcaacaggtg gaccaaggaggatttggagc taattaacaa gtgggccttc caaggggaga gaatgattca cgggaacccctccggagtgg acaatgctgt cagcacctgg ggaggagccc tccgatacca tcaagggaagatttcatcct taaagaggtc gccagctctc cagatcctgc tgaccaacac caaagtccctcgcaatacca gggcccttgt ggctggcgtc agaaacaggc tgctcaagtt cccagagatcgtggcccccc tcctgacctc aatagatgcc atctccctgg agtgtgagcg cgtgctgggagagatggggg aagccccagc cccggagcag tacctcgtgc tggaagagct cattgacatgaaccagcacc atctgaatgc cctcggcgtg ggccacgcct ctctggacca gctctgccaggtgaccaggg cccgcggact tcacagcaag ctgactggcg caggcggtgg tggctgtggcatcacactcc tcaagccagg gctggagcag ccagaagtgg aggccacgaa gcaggccctgaccagctgtg gctttgactg cttggaaacc agcatcggtg cccccggcgt ctccatccactcagccacct ccctggacag ccgagtccag caagccctgg atggcctctg a<210>18<211>1188<212>DNA<213>小鼠<400>18
atgttgtcag aagccctgct ggtgtccgcc ccggggaagg tcatcctcca tggagaacac 60gctgtggtcc atggcaaggt cgctctggca gcggccttga acttgagaac tttcctcctg120ctgcgaccgc agagcaatgg gaaagtgagc gtcaatttac ccaacatcgg tattaagcag180gtgtgggatg tgggcatgct tcagcgactg gacacgagct ttcttgagca aggtgatgtc240tcggtaccca ccttggagca actggagaag ctaaagaaga tgggggacct ccccagagac300cgtgcaggca atgaaggcat ggctctgctt gcctttctct acctgtacct ggcaatctgc360cggaagcaga ggacactccc gagcctggac atggtggtgt ggtcggaact tccccccggg420gcaggcttgg gctccagcgc cgcctactct gtgtgtctgg cagccgccct cctgactgcctgtgaggagg tctccaaccc gctcaaggac ggggtctccg tcagcaggtg gcccgaggaagatctgaagt caatcaacaa gtgggccttc gaaggggaga gagtgatcca tgggaacccttctggtgtgg acaatgccgt cagcacctgg ggcggagccc tgcgcttcca gcaagggacgatgtcttcct tgaagagcct cccgtctctg cagatcctgc tcaccaacac caaggtcccgcggagtacca aggcccttgt ggctgctgtc agaagcaggc tgaccaagtt ccctgagattgtggccccgc tgctgacctc cattgacgca atatccctgg agtgtgagcg cgtgctaggggagatggtgg cagctccagt tccggaacag tacctcgtac tagaagagct gatagacatgaaccagcacc atctgaatgc tctcggggtg ggccacaact ccctggacca gctctgccaagtaacggcag cacacggact gcacagcaag ctgacgggcg ctggcggtgg cggctgtggcatcaccctcc tgaagccagg tctagagcaa gccacagtgg aggcagccaa gcaggccctgaccagctgcg ggtttgactg ctgggagacc agcatcggcg cacccggagt ttccacacactcagctgcag ctgtagggga ccctgtccga caagccctgg gcctctga<210>19<211>1188<212>DNA<213>大鼠<400>19atgttgtcag aagtcctgct ggtgtctgct ccagggaaag tcattctcca tggagaacatgctgtggtcc atggcaaggt agctctggcg gtggccttga acttgagaac atttctcgtgctgcgaccgc agagcaatgg gaaagtgagc ctcaatttac caaacgtcgg tattaagcaggtctgggatg tggccacact tcagctgctg gacacaggct ttcttgagca aggcgatgtcccggcaccca ccttggagca actggagaag ctgaagaagg tggcgggcct cccccgagactgtgtaggca acgaaggcct gtctctgctt gcctttctgt acctgtacct ggctatctgc
cggaaacaga ggacactccc aagcctggac atcatggtgt ggtcggaact gccccctggg420gcgggcttgg gctccagtgc agcctactcg gtgtgtgtgg cagccgccct cctgactgcc480tgtgaggagg tcaccaaccc gctcaaggac aggggctcca ttggcagttg gcccgaggag540gacctgaagt caattaacaa gtgggcctac gagggggaga gagtgatcca tgggaacccc600tctggcgtgg acaattccgt cagcacctgg ggaggagccc tgcgctacca gcaagggaag660atgtcatcct tgaagaggct cccagctctg cagatcctgc tcaccaacac caaggtccca720cgaagcacca aggccctcgt ggctggcgtc agaagcaggc taatcaagtt ccctgagatc780atggccccgc tcctgacatc aattgacgca atctccctgg agtgtgagcg cgtgctgggagagatggcgg ccgcaccagt cccagaacag taccttgtcc tagaagagct aatggacatgaaccagcacc atcagaatgc ccttggtgtg ggccacgcct ccctggacca gctctgtcaggtaacagcag cacatggact gcacagcaag ctgactggcg caggcggcgg cggctgtggcatcaccctcc tgaagccagg tctagagcga gcaaaagtgg aggccgccaa gcaggccctgaccggctgcg ggtttgactg ctgggagacc agcattggag cgcctggggt ctccatgcactcagccacct ccatagagga ccctgtccga caagccctgg gcctctga<210>20<211>1137<212>DNA<213>Arabidopsis thaliana<400>20atggaagtga aagctagagc tcctgggaag atcatacttg caggggaaca cgctgttgttcatggatcca ccgctgtagc tgccgccatt gatctctaca cttacgttac tctccgctttcctcttccat cagctgagaa caatgatagg cttacacttc agctcaagga catttccttggagttttcat ggtccttagc cagaatcaaa gaagcgattc cttatgattc aagcactctctgccgttcta cgccggcttc atgttcagag gagaccctta aatcaattgc agttttggttgaagagcaaa atcttccaaa ggaaaagatg tggctctcct ctgggatctc cacgtttctctggttataca ccagaattat agggttcaat ccggctacag tagtcattaa ctctgagcttccatacgggt ctggcctcgg ttcatcagca gctttatgtg tagctctcac agctgctctccttgcttctt ctatttcaga gaaaacccgt ggtaacggtt ggtcatctct cgatgaaaccaatcttgagt tgctaaataa atgggctttc gaaggcgaaa agatcatcca tgggaaaccttctgggatag acaacaccgt cagtgcatac ggcaacatga tcaagttctg ctcaggcgagataactcggt tacaatccaa catgcctctg agaatgctaa ttaccaacac tagagttggg
cgaaacacaa aagctctggt ctctggtgtg tcacagagag cggtaagaca tcctgatgcg 780atgaagtcag tgttcaacgc cgtggattct ataagcaaag agctcgctgc gatcattcag 840tctaaagacg agacctcagt tacagaaaaa gaagagagaa taaaagaact catggagatg 900aaccaaggtc tgctcctgtc aatgggggtt agccacagct caatcgaggc tgtgattcta 960accacggtca agcacaagct tgtctccaaa cttacaggag ctggtggcgg cggctgcgtc1020ctcactctat taccaaccgg gacggtggtg gacaaagtgg tggaggagct cgagtccagc1080ggttttcagt gtttcacggc attgattggt ggtaacggag ctcagatttg ctattga 1137<210>21<211>1332<212>DNA<213>Saccharomyces cerevisiae<400>21atgtcattac cgttcttaac ttctgcaccg ggaaaggtta ttatttttgg tgaacactctgctgtgtaca acaagcctgc cgtcgctgct agtgtgtctg cgttgagaac ctacctgctaataagcgagt catctgcacc agatactatt gaattggact tcccggacat tagctttaatcataagtggt ccatcaatga tttcaatgcc atcaccgagg atcaagtaaa ctcccaaaaattggccaagg ctcaacaagc caccgatggc ttgtctcagg aactcgttag tcttttggatccgttgttag ctcaactatc cgaatccttc cactaccatg cagcgttttg tttcctgtatatgtttgttt gcctatgccc ccatgccaag aatattaagt tttctttaaa gtctactttacccatcggtg ctgggttggg ctcaagcgcc tctatttctg tatcactggc cttagctatggcctacttgg gggggttaat aggatctaat gacttggaaa agctgtcaga aaacgataagcatatagtga atcaatgggc cttcataggt gaaaagtgta ttcacggtac cccttcaggaatagataacg ctgtggccac ttatggtaat gccctgctat ttgaaaaaga ctcacataatggaacaataa acacaaacaa ttttaagttc ttagatgatt tcccagccat tccaatgatcctaacctata ctagaattcc aaggtctaca aaagatcttg ttgctcgcgt tcgtgtgttggtcaccgaga aatttcctga agttatgaag ccaattctag atgccatggg tgaatgtgccctacaaggct tagagatcat gactaagtta agtaaatgta aaggcaccga tgacgaggctgtagaaacta ataatgaact gtatgaacaa ctattggaat tgataagaat aaatcatggactgcttgtct caatcggtgt ttctcatcct ggattagaac ttattaaaaa tctgagcgatgatttgagaa ttggctccac aaaacttacc ggtgctggtg gcggcggttg ctctttgactttgttacgaa gagacattac tcaagagcaa attgacagct tcaaaaagaa attgcaagat
gattttagtt acgagacatt tgaaacagac ttgggtggga ctggctgctg tttgttaagc 1200gcaaaaaatt tgaataaaga tcttaaaatc aaatccctag tattccaatt atttgaaaat 1260aaaactacca caaagcaaca aattgacgat ctattattgc caggaaacac gaatttacca 1320tggacttcat aa 1332<210>22<211>1215<212>DNA<213>Schizosaccharomyces pombe<400>22atgtcaaaat cgcttattgt ttcgtcgcca ggaaaaacga ttttgtttgg ggaacatgccgttgtatatg gagctactgc gttagctgca gctgtatcgt tacggagtta ctgtaaattacagacgacta ataacaatga aatagtaatt gtgatgagtg atatagggac cgaacgccgatggaatcttc aatcgctacc ttggcagcat gtaacagtgg aaaacgttca gcacccggcatcatctccca atctggacct tttacaagga ttaggagagc tattaaaaaa tgaagaaaacggacttattc actcagcaat gctttgtacc ctttacttgt tcacgtcttt gtcttctccttctcagggtt gtactttaac tattagctcc caagtacctt tgggtgctgg attaggtagtagtgctacta tatcagttgt tgtcgctaca agtttactac tagcttttgg taatattgaacctcctagct caaattctct tcaaaacaac aaagcacttg cgttgataga ggcttggtcttttctaggtg aatgctgtat tcatggaaca ccaagtggta ttgataatgc agtagcaacaaatggaggac ttatcgcttt tcgtaaagct acagctcatc agagtgccat gaaagaattcttaaagccta aagatacctt atctgttatg atcactgata ccaaacaacc aaaaagtactaaaaaacttg tacaaggagt ttttgaactg aaggaaagac taccaactgt gattgactcaataatagatg caatcgatgg catatcaaag tctgccgtcc tcgcattgac ttcggagagcgataaaaact cctccgctaa aaagttagga gagtttattg ttcttaatca aaaactcttagaatgcttgg gtgtatccca ttattccatt gatcgcgttt tacaagccac taagtcaattggatggacga agcttacagg tgccggtggt ggaggttgta cgattacttt attaacacctgagtgcaaag aagaggaatt taagttatgt aaagaatcac tattagccca taaaaattctatttacgatg ttcaattagg tggacctggt gtttcagtgg taaccgactc agattcatttttccctcaat atgagtctga ctttgatttt aaaaaattga atttactcag caaatttaataaatattata tttaa<210>23
<211>1008<212>DNA<213>Pyrococcus abyssi<400>23atgccaaggt tagtgctggc gtcagctcca gcaaagataa tactcttcgg ggaacacagc 60gttgtgtatg gaaagcctgc catagcatct gctattgact tgagaactta cgttagggcg120gagtttaatg attcgggaaa tataaagata gaagcccatg acataaaaac ccctgggcta180atagtttctt tttcagaaga caaaatttac ttcgagactg actatggaaa ggcagctgaa240gtgctgagtt acgttagaca cgccatagag ctcgtccttg aagaggctga taagaggact300ggggtcagcg tttcaataac gtctcaaatt ccagtaggtg ctggcctagg ttcttcagctgccgtcgccg ttgctaccat cggtgccgtc tccaagttac ttgacctcga gcttagtaaagaggagatag ctaagatggg ccataaggtt gaactcctgg ttcagggagc ttcgagtggcatagatccga cggtctcggc aataggaggg ttcttgtact ataagcaagg tgaatttgagcacctaccat tcgtggagct tccaatagta gttggatata ccggctcaag tggctccacaaaggaattag ttgcgatggt taggagaagg tacgaggaga tgcccgagtt aattgaacccattctagagt caatgggtaa gctcgtggat aaagctaagg aggtaataat atctaagctcgatgaggagg aaaagttcct gaaattggga gagctcatga acataaatca tggccttctcgatgccctag gtgtttcaac caaaaagcta agcgaactcg tctatgccgc tagaactgctggagcaattg gagccaagct aacgggggct gggggaggtg gatgcatgta cgctttagctcctgggaagc agagggaggt tgctacggcc ataaagatag ctggcggaac tcccatgataacgaggataa gcaaggaggg gcttagaata gaggaggtaa gggaatga<210>24<211>1008<212>DNA<213>Pyrococcus horikoshii<400>24tcatcttgaa acctcctcta ttctcaatcc ttccctactt accctcgtta tcattggaattccaccagct atctttattg ccgtggcgac ttccctctgt ctcccagggg ccaaggcatacatacaccct ccaccaccag cacccgtaag ttttgcccca attgcaccag ccgttctagcagcgtaaact aactcaccaa gcttcttcgt agacaccccc aaagcatcta aaagcccatgatttatgttc attaactctc caagcttagt aagcttctcc tcttcatcga gctttgaaagtattatctcc ttggccttat ccactaattt tcccattgcc tccaatatag gctccacaagttcgggcatt tcctcgtacc ttttccttac cattgccact aattctttag ttgaaccagt
agagccggtg taaccaacga ctatgggaag ctccatgaat gggagaggct caaactttcc480ttgcttataa tagaggaagc ctcccactgc agaaactgta ggatcaatgc cacttgaagc540tccctgcact agaagttcaa ctttatgccc aagctttgct atttcctcct tactcaattc600aaggccaagt aacctagaga ccgcaccaat tgtagcaact gcaaccgctg ctgaggaacc660caatccggcc ccaactggaa tttgagaggt tattgaaacg tcaataccaa ccctcttatc720agactcctcc agggcaagtt ctatggcata cctcacatag ctcaaaactt cagcggcctt780tccatagtct gtttcaaagt atatcttatc ctcggaaaac gagactatca atccaggagt840ttttatatca tgagcttcta tttttatatt acccgaatca ttgaattgag ctctaacatatgttctaagt tctatagcag aagctatagc cggttttcca tagactacgc tatgttccccgaagagtatt acctttgcag gagctgaagc taaaacgtac ttaaccat<210>25<211>1005<212>DNA<213>pyrococcus furiosus<400>25tcatttaatt acctcctcaa tttttaaccc ttctctgctg atttcagtta tcataggagttccccctgca attcttatag ctgtagcaac ttctctctgc ttgttcggtg ccaaggcatacatacaacct cctcccccag ccccagttat cttagctcct agggctcccg caaccctagccgcgtacact agttcactca actttttagt tgaaacaccc aaagcatcca aaagaccgtgattaatgttc atcaaaaccc caagcctttc aaatttttcc tccttatcaa catttgaaagtattacatcc ttggctttct cgacaacttt tcccatagcc tctaatatgg gaacaatcaactcgggcatc tcctcatatc ttttcctaac cattgcaact aactccttag ttggacctgaggagcccgtg tatccaacaa ctattggaag ctccatgaag ggaaggtgtt caaatttacccttttcatag aatataaacc cccctattgc agagaccgtt gggtctatac cacttgacgcaccttgaaca agtaattcag tcttgtgacc catcttagct atttcctcct tacttagctcaagtcctagt aactttgata cagccccaat tgtggctact gccacggcag cagaagagcccaatccagca ccaactggaa tttgagaagt tatgctaacc ttaataccaa catttttcttatctgcctcc tctaaaacta aatttattgc ctctctaaca tagctcaaaa cttcagctgcttttccataa tctgtctcga aatatatctc attttcagaa aatgaaaccg taagtccaggaactttaatg tcatgagctt caattcttat ttttttctcc cgaattagct cagcctccacaaaagttcgt aaatcaatgg cagcagctat cgctggcttt ccgtaaacta cgctatgctc
tccaaaaaga ataacttttg cgggagctga ggctataact ttcat1005<210>26<211>912<212>DNA<213>Methanobacterium thermoautotrophicum<400>26ttgaagtcgt cggcatccgc acctgccaag gccattcttt ttggtgaaca cgcagtggtc 60tacagcaagc cggcaatagc agccgccata gaccgcaggg tgactgtaac cgtaagtgaa120tccagcagca cccatgtaac catcccctcc ctgggtatac gccacagttc agagagaccatccggtggca tcctggacta catcgggagg tgcctcgagc tttaccatga cgcatcaccccttgacatca gggtggagat ggagataccc gccggttcag gcctaggttc atcggctgcactcaccgttg cactgatagg tgccctcgac aggtaccatg gaagggatca tggacccggggagacagcag ccagggccca cagggtggag gttgatgtac agggagccgc cagcccccttgacacagcca tcagcaccta tgggggcctt gtataccttg acagccagag gagggtgaggcagtttgagg ccgacctggg ggaccttgta atagcacacc ttgactattc aggggaaacagccaggatgg ttgccggcgt agctgaaagg ttcaggagat tcccggatat catggggaggataatggaca cagttgagtc cataaccaat acagcataca gggaacttct aaggaacaacacagaacccc tgggggagct catgaacctc aaccaggggc tgctggactc catgggcgtttccacacgtg aactttcaat gatggtctat gaggcaagga acgccggggc agcaggttcaaagatcacag gagccggcgg cggcgggagc ataatagccc actgcccggg atgtgtggatgatgttgtca cggcccttaa caggaactgg aaagccatga gggcagagtt ttcggttaagggactcatct aa<210>27<211>855<212>DNA<213>Archaeoglobus fulgidus<400>27tcactcttca attctgacac cctcottttc gggctcgact atgaagctcc ctttcggcttctctcccttg aacaggccga atatacaccc cccaccaccc gctccagtta ttttcgcattcaaacccatc ctttcgagct ctgcaatggt tctgtcgatt tcgggattgc tcacccctatcgccctcaga agcgactggt ttatggctat gagctcctca agtctttcag cgctgccaacatcgctcgcc tcaagggaga ttgcgtcgat agcgtcaaat attttatcca caacctcagg
atgcctctct ctcagctcag caacttttgc gaccatctca gccgttgacc tgctgccaaa360gttgataacg aagaacttga acggcatctc gacctttcta cgctcaggga aaagccacga420acctccaaag gtggatatga acgggtctat tccgctcgcc cttccctgaa cgtcaatctc480aacctgcttc gccatctgga agatggcctc tttatccata tccccatcga actctgcatt540cagagcagct attgtggcaa caatcaccgc cgcagagctg cccagcccag agccaatcgg600tatttcgctc tcaatctcaa tttcagcacc cggaatattt ctaagctccc caaacctctt660aacagcctgc acgacgtagg gatgcctttg atagtccagc ccgctctctc ctaacgaaga720cctaatcaga aacctgtcag attttctcac cgacactctg catctaaggt taatcgctgacaccaccgca tgcctaccgt aaaccaccgc atgctcgccg aacagaatta tctttccgggtgctgatgca atcat<210>28<211>939<212>DNA<213>Methanococcus jannaschii<400>28atgataattg aaacaccatc aaaagttata ctattcggag agcatgcagt tgtttatggttatagagcta tatctatggc tattgattta acatcaacca tagaaataaa agaaacacaagaagatgaga taattttaaa cctaaatgac ttgaataaaa gcttaggttt gaacttaaatgagataaaaa atatcaatcc aaataacttt ggagatttta aatactgcct ctgtgcaattaaaaacactt tagattattt aaatatagag ccaaaaactg gttttaaaat taacattagctcaaaaattc caataagttg tggtttggga agctctgcct caataacaat tggaactataaaagctgtaa gtggatttta taataaagag cttaaagatg atgagattgc aaaacttggatatatggttg agaaagaaat ccaaggtaag gcaagcatta cagacacttc gacaataacgtataaaggta tottagaaat aaaaaacaac aagtttagaa aaattaaagg agagtttgaagaatttttaa aaaattgcaa gtttttaatt gtttatgctg aaaaaaggaa gaaaaaaactgctgagttag ttaatgaagt tgccaagatt gaaaataaag atgagatatt taaagagatagacaaagtta ttgatgaagc tttaaaaatc aaaaataaag aagattttgg gaaattgatgactaaaaacc acgagttgtt aaaaaagcta aatatctcaa caccaaaact tgatagaattgtagatattg ggaatagatt tggttttggg gcaaaattaa ctggagctgg agggggaggatgtgtaataa tcttagttaa tgaagaaaaa gagaaagagc ttttaaaaga actaaataaagaagatgtaa ggatttttaa ctgcagaatg atgaattaa
<210>29<211>975<212>DNA<213>Aeropyrum pernix<400>29atgaggaggg ctgctagggc gtctgccccg gggaaagtta taatcgttgg agaacacttc 60gtcgtcagag gctccctggc gatagtggcg gccataggca gaaggctccg cgtcaccgtg120agaagcgggg gcaaggggat tgtgcttgag agcagcatgc taggccgcca cagcgccccg180ctaccaggcc agggtgcagc ggctaaggta agccccgtcc tcgagccgta catagcagtg240ttgagaagtc tggctgcaag gggctatagc gtagtgcccc atacaatatt ggtggagagcggcatacccc ctagggcagg tctcggtagc agcgccgcca gcatggtagc ctatgctctatcatactcgg ccatgcatgg tgaccccctc tcggctgagg acctctacag tgttgctatggagggcgaga agatagcgca tggtaagccg agcggtgttg acgtaaccat agccgttagggggggagtcc tggcttacag gaggggcgag aacccggtgg atataaggcc ggggcttacaggtgtcactc tgcttgttgc cgacacgggt gtcgagaggc gtactaggga tgttgtcgagcatgttctct ccattgcgga cgccttggga gaggcatcga cctacatata tagggcggcagacttgatag cgagagaagc cctccatgcg atagaaaagg gagacgccga gaggctaggtcttataatga atgcagccca gggccttctc tcatctcttg gggcgtcgtc actagaaatagaaacactag tatatcggat gaggagtgcc ggggccctgg gtgcaaagct aacgggagctggatgggggg gctgtgtgat agggcttttc aaggagggtg aggtcgaacg ggggctagagtctgtggtag agagttcaag ccaggctttc accgcgtcaa tagcagagga gggtgctagactcgaggagt tctag<210>30<211>432<212>PRT<213>Phaffia rhodozynma ATCC 96594<400>30Lys Glu Glu Ile Leu Val Ser Ala Pro Gly Lys Val Ila Leu Phe Gly1 5 10 15Glu His Ala Val Gly His Gly Val Thr Gly Ile Ala Ala Ser Val Asp20 25 30Leu Arg Cya Tyr Ala Leu Leu Ser Pro Thr Ala Thr Thr Thr Thr Ser35 40 45
Ser Ser Leu Ser Ser Thr Asn Ile Thr Ile Ser Leu Thr Asp Leu Asn50 55 60Phe Thr Gln Ser Trp Pro Val Asp Ser Leu Pro Trp Ser Leu Ala Pro65 70 75 80Asp Trp Thr Glu Ala Ser Ile Pro Glu Ser Leu Cys Pro Thr Leu Leu85 90 95Ala Glu Ile Glu Arg Ile Ala Gly Gln Gly Gly Asn Gly Gly Glu Arg100 105 110Glu Lys Val Ala Thr Met Ala Phe Leu Tyr Leu Leu Val Leu Leu Ser115 120 125Lys Gly Lys Pro Ser Glu Pro Phe Glu Leu Thr Ala Arg Ser Ala Leu130 135 140Pro Met Gly Ala Gly Leu Gly Ser Ser Ala Ala Leu Ser Thr Ser Leu145 150 155 160Ala Leu ValPhe Leu Leu His Phe Ser His Leu Ser Pro Thr Thr Thr165 170 175Gly Arg Glu Ser Thr Ile Pro Thr Ala Asp Thr Glu Val Ile Asp Lys180 185 190Trp Ala Phe Leu Ala Glu Lys Val lle His Gly Asn Pro Ser Gly Ile195 200 205Asp Asn Ala Val Ger Thr Arg Gly Gly Ala Val Ala Phe Lys Arg Lys210 215 220Ile Glu Gly Lys Gln Glu Gly Gly Met Glu Ala Ile Lys Ser Phe Thr225 230 235 240Ser Ile Arg Phe Leu Ile Thr Asp Ser Arg Ile Gly Arg Asp Thr Arg245 250 255Ser Leu Val Ala Gly Val Asn Ala Arg Leu Ile Gln Glu Pro Glu Val260 265 270Ile Val Pro Leu Leu Glu Ala Ile Gln Gln Ile Ala Asp Glu Ala Ile
275 280 285Arg Cys Leu Lys Asp Ser Glu Met Glu Arg Ala Val Met Ile Asp Arg290 295 300Leu Gln Asn Leu Val Ser Glu Asn His Ala His Leu Ala Ala Leu Gly305 310 315 320Val Ser His Pro Ser Leu Glu Glu Ile Ile ArG Ile Gly Ala Asp Lys325 330 335Pro Phe Glu Leu Arg Thr Lys Leu Thr Gly Ala Gly Gly Gly Gly Cys340 345 350Ala Val Thr Leu Val Pro Asp Asp Phe Ser Thr Glu Thr Leu Gln Ala355 360 365Leu Met Glu Thr Leu Val Gln Ser Ser Phe Ala Pro Tyr Ile Ala Arg370 375 380Val Gly Gly Ser Gly Val Gly Phe Leu Ser Ser Thr Lys Ala Asp Pro385 390 395 400Glu Asp Gly Glu Asn Arg Leu Lys Asp Gly Leu Val Gly Thr Glu Ile405 410 415Asp Glu Leu Asp Arg Trp Ala Leu Lys Thr Gly Arg Trp Ser Phe Ala420 425 430<210>31<211>4135<212>DNA<213>Phaffia rhodozyma ATCC96594<400>31actgactcgg ctaccggaaa atatcttttc aggacgcctt gatcgttttg gacaacaccatgatgtcacc atatcttcag cggccgttgg agctaggagt agacattgta tacgactctggaacaaagta tttgagtgga caccacgatc tcatggctgg tgtgattact actcgtactgaggagattgg gaaggttcgt gcttgcttgc tttgaatgtc gtgcctaaag ccattgccataagacagagt ctgatctatg tcgtttgcct acaacagaga atggcctggt tcccaaatgctatgggaaat gcattgtctc cgttcgactc gttccttctt ctccgaggac tcaaaacacttcctctccga ctggacaagc agcaggcctc atctcacctg atcgcctcgt acttacacac
cctcggcttt cttgttcact accccggtct gccttctgac cctgggtacg aacttcataa480ctctcaggcg agtggtgcag gtgccgtcat gagctttgag accggagata tcgcgttgag540tgaggccatc gtgggcggaa cccgagtttg gggaatcagt gtcagtttcg gagccgtgaa600cagtttgatc agcatgcctt gtctaatgag gttagttctt atgccttctt ttcgcgcctt660ctaaaatttc tggctgacta attgggtcgg tctttccgtt cttgcatttc agtcacgcat720ctattcctgc tcaccttcga gccgagcgag gtctccccga acatctgatt cgactgtgtg780tcggtattga ggaccctcac gatttgcttg atgatttgga ggcctctctt gtgaacgctg840gcgcaatccg atcagtctct acctcagatt catcccgacc gctcactcct cctgcctctg---attctgcctc ggacattcac tccaactggg ccgtcgaccg agccagacag ttcgagcgtgttaggccttc taactcgaca gccggcgtcg aaggacagct tgccgaactc aatgtagacgatgcagccag acttgcgggc gatgagagcc aaaaagaaga aattcttgtc agtgcaccgggaaaggtcat tctgttcggc gaacatgctg taggccatgg tgttgtgagt gagaaatgaaagctttatgc tctcattgca tcttaacttt tcctcgcctt ttttgttctc ttcatcccgtcttgattgta gggatgcccc cctttgcccc tttccccttc ttgcatctgt ctatatttccttatacattt cgctcttaag agcgtctagt tgtaccttat aacaaccttt ggttttagcatcctttgatt attcatttct ctcatccttc ggtcagaggc tttcggccat ctttacgtctgattagattg taatagcaag aactatcttg ctaagccttt tctcttcctc ttcctcctatataaatcgaa ttcactttcg gacatgttta ttttggggaa atcatcaagg ggtggggggccaatcccgac actaattttc tgctcacgtc aaaactcagc gttcagaatc agtcactgaccctgatacgt gtctctatgt gtgtgggtgt acgtgcgaat tgtgactcga cgttctacgcttaaaaacag accgggatcg ctgcttccgt tgatcttcga tgctacgctc ttctctcacccactgctacg acaacaacat catcgtcgtt atcgtctaca aacattacca tctccctaacggacctgaac tttacgcagt cttggcctgt tgattctctt ccttggtcac ttgcgcctgactggactgag gcgtctattc cagaatctct ctgcccgaca ttgctcgccg aaatcgaaaggatcgctggt caaggtggaa acggaggaga aagggagaag gtggcaacca tggcattcttgtatttgttg gtgctattga gcaaagggaa gccaaggtag gttttttctg tctcttctttttgcctataa agactcttaa ctgacggaga aagtgttggg tttcttcctt cgggggttcaatcaattaaa gtgagccgtt cgagttgacg gctcgatctg cgcttccgat gggagctggtctgggttcat ccgccgctct atcgacctct cttgccctag tctttcttct ccacttttctcacctcagtc caacgacgac tggcagagaa tcaacaatcc cgacggccga cacagaagta
attgacaaat gggcgttctt agctgaaaaa gtcatccatg gaaatccgag tgggattgat2280aacgcggtca gtacgagagg aggcgctgtt gctttcaaaa gaaagattga gggaaaacag2340gaaggtggaa tggaagcgat caagaggtac gcagacacgg tgcttcatat gccatactcc2400agtctgattg acccatgatg aacgtctttc tacatttcga atatagcttc acatccattc2460gattcctcat cacagattct cgtatcggaa gggatacaag atctctcgtt gcaggagtga2520atgctcgact gattcaggag ccagaggtga tcgtcccttt gttggaagcg attcagcaga2580ttgccgatga ggctattcga tgcttgaaag attcagagat ggaacgtgct gtcatgatcg2640atcgacttca agttagttct tgttcctttc aagactcttt gtgacattgt gtcttatccatttcatcttc ttttttcttc cttcttctgc agaacttggt ctccgagaac cacgcacacctagcagcact tggcgtgtcc cacccatccc tcgaagagat tatccggatc ggtgctgataagcctttcga gcttcgaaca aagttgacag gcgccggtgg aggtggttgc gctgtaaccctggtgcccga tggtaaagtc tctccttttc tcttccgtcc aagcgacaca tctgaccgatgcgcatcctg tacttttggt caaccagact tctcgactga aacccttcaa gctcttatggagacgctcgt tcaatcatcg ttcgcccctt atattgcccg agtgggtggt tcaggcgtcggattcctttc atcaactaag gccgatccgg aagatgggga gaacagactt aaagatgggctggtgggaac ggagattgat gagctagaca gatgggcttt gaaaacgggt cgttggtcttttgcttgaac gaaagatagg aaacggtgat tagggtacag atcctttgct gtcatttttacaaaacactt tcttatgtct tcatgactca acgtatgccc tcatctctat ccatagacagcacggtacct ctcaggtttc aatacgtaag cgttcatcga caaaacatgc ggcacacgaaaacgagtgga tataagggag aagagagata ttagagcgaa aaagagaaga gtgagagaggaaaaaaataa ccgagaacaa cttattccgg tttgttagaa tcgaagatcg agaaatatgaagtacatagt ataaagtaaa gaagagaggt ttacctcaga ggtgtgtacg aaggtgaggacaggtaagag gaataattga ctatcgaaaa aagagaactc aacagaagca ctgggataaagcctagaatg taagtctcat cggtccgcga tgaaagagaa atttaaggaa gaaaaagcccccagtaaaca atccaaccaa cctcttggac gattgcgaaa cacacacacg cacgcggacatatttcgtac acaaggacgg gacattcttt ttttatatcc gggtggggag agagagggttatagaggatg aatagcaagg ttgatgtttt gtaaaaggtt gcagaaaaag gaaagtgagagtaggaacat gcattaaaaa cctgcccaaa gcgatttata tcgttcttct gttttcacttctttccgggc gctttcttag accgcggtgg tgaagggtta ctcctgccaa ctagaagaag
caacatgagt caaggattag atcatcacgt gtctcatttg acgggttgaa agatatattt 4020agatactaac tgcttcccac gccgactgaa aagatgaatt gaatcatgtc gagtggcaac 4080gaacgaaaga acaaatagta agaatgaatt actagaaaag acagaatgac tagaa4135<210>32<211>1164<212>DNA<213>人工序列<220>
<223>Paracoccus zeaxanthinifaciens I17T<400>32atgagaggat cgcatcacca tcaccatcac tcgaccggca ggcctgaagc aggcgcccatgccccgggca agctgaccct gtccggggaa cattccgtgc tctatggtgc gcccgcgcttgccatggcca tcgcccgcta taccgaggtg tggttcacgc cgcttggcat tggcgaggggatacgcacga cattcgccaa tctctcgggc ggggcgacct attcgctgaa gctgctgtcggggttcaagt cgcggctgga ccgccggttc gagcagttcc tgaacggcga cctaaaggtgcacaaggtcc tgacccatcc cgacgatctg gcggtctatg cgctggcgtc gcttctgcacgacaagccgc cggggaccgc cgcgatgccg ggcatcggcg cgatgcacca cctgccgcgaccgggtgagc tgggcagccg gacggagctg cccatcggcg cgggcatggg gtcgtctgcggccatcgtcg cggccaccac ggtcctgttc gagacgctgc tggaccggcc caagacgcccgaacagcgct tcgaccgcgt ccgcttctgc gagcggttga agcacggcaa ggccggtcccatcgacgcgg ccagcgtcgt gcgcggcggg cttgtccgcg tgggcgggaa cgggccgggttcgatcagca gcttcgattt gcccgaggat cacgaccttg tcgcgggacg cggctggtactgggtactgc acgggcgccc cgtcagcggg accggcgaat gcgtcagcgc ggtcgcggcggcgcatggtc gcgatgcggc gctgtgggca gccttcgcag tctgcacccg cgcgttggaggccgcgctgc tgtctggggg cagccccgac gccgccatca ccgagaacca gcgcctgctggaacgcatcg gcgtcgtgcc ggcagcgacg caggccctcg tggcccagat cgaggaggcgggtggcgcgg ccaagatctg cggcgcaggt tccgtgcggg gcgatcacgg cggggcggtcctcgtgcgga ttgacgacgc gcaggcgatg gcttcggtca tggcgcgcca tcccgacctcgactgggcgc ccctgcgcat gtcgcgcacg ggggcggcac ccggccccgc gccgcgtgcgcaaccgctgc cggggcaggg ctga<210>33<211>1164
<212>DMA<213>人工序列<220>
<223>Paracoccus zeaxanthtnifaciens I17T、G47D、K93E、P132S<400>33atgagaggat cgcatcacca tcaccatcac tcgaccggca ggcctgaagc aggcgcccat 60gccccgggca agctgaccct gtccggggaa cattccgtgc tctatggtgc gcccgcgctt120gccatggcca tcgcccgcta taccgaggtg tggttcacgc cgcttgacat tggcgagggg180atacgcacga cattcgccaa tctctcgggc ggggcgacct attcgctgaa gctgctgtcg240gggttcaagt cgcggctgga ccgccggttc gagcagttcc tgaacggcga cctaaaggtgcacgaggtcc tgacccatcc cgacgatctg gcggtctatg cgctggcgtc gcttctgcacgacaagccgc cggggaccgc cgcgatgccg ggcatcggcg cgatgcacca cctgccgcgatccggtgagc tgggcagccg gacggagctg cccatcggcg cgggcatggg gtcgtctgcggccatcgtcg cggccaccac ggtcctgttc gagacgctgc tggaccggcc caagacgcccgaacagcgct tcgaccgcgt ccgcttctgc gagcggttga agcacggcaa ggccggtcccatcgacgcgg ccagcgtcgt gcgcggcggg cttgtccgcg tgggcgggaa cgggccgggttcgatcagca gcttcgattt gcccgaggat cacgaccttg tcgcgggacg cggctggtactgggtactgc acgggcgccc cgtcagcggg accggcgaat gcgtcagcgc ggtcgcggcggcgcatggtc gcgatgcggc gctgtgggac gccttcgcag tctgcacccg cgcgttggaggccgcgctgc tgtctggggg cagccccgac gccgccatca ccgagaacca gcgcctgctggaacgcatcg gcgtcgtgcc ggcagcgacg caggccctcg tggcccagat cgaggaggcgggtggcgcgg ccaagatctg cggcgcaggt tccgtgcggg gcgatcacgg cggggcggtcctcgtgcgga ttgacgacgc gcaggcgatg gcttcggtca tggcgcgcca tcccgacctcgactgggcgc ccctgcgcat gtcgcgcacg ggggcggcac ccggccccgc gccgcgtgcgcaaccgctgc cggggcaggg ctga
权利要求
1.一种经过修饰的甲羟戊酸激酶,其展示出的对反馈抑制的敏感性较之相应的未经修饰的甲羟戊酸激酶要低,其中(i)较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列含有至少一处突变,并且(ii)所述至少一处突变发生于选自由如下氨基酸位置所构成的组中的氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的Paracoccus zeaxanthinifaciens甲羟戊酸激酶的氨基酸序列上的17、47、93、94、132、167、169、204和266位。
2.如权利要求1所述的经过修饰的甲羟戊酸激酶,其中所述反馈抑制是由法呢基二磷酸和双牻牛基二磷酸造成的反馈抑制。
3.如权利要求1或2所述的经过修饰的甲羟戊酸激酶,其中所述经过修饰的甲羟戊酸激酶,较之相应的未经修饰的甲羟戊酸激酶,展示出的反馈抗性为至少10%
4.如权利要求1至3中任意一项所述的经过修饰的甲羟戊酸激酶,其中所述的突变是氨基酸取代。
5.如权利要求1至4中任意一项所述的经过修饰的甲羟戊酸激酶,其中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列含有至少两处氨基酸取代。
6.如权利要求1至5中任意一项所述的经过修饰的甲羟戊酸激酶,其中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列含有至少3处氨基酸取代。
7.如权利要求1至6中任意一项所述的经过修饰的甲羟戊酸激酶,其中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列含有至少4处氨基酸取代。
8.如权利要求1至7中任意一项所述的经过修饰的甲羟戊酸激酶,其中,较之相应的未经修饰的甲羟戊酸激酶的氨基酸序列,经过修饰的甲羟戊酸激酶的氨基酸序列含有下述取代,其中,所述取代发生于如SEQ IDNO1所示的序列的第17位氨基酸处。
9.如权利要求8所述的经过修饰的甲羟戊酸激酶,其中,发生于如SEQ ID NO1所示的序列的第17位氨基酸处的取代由苏氨酸对异亮氨酸的替代组成。
10.如权利要求1至9中任意一项所述的经过修饰的甲羟戊酸激酶,其中,相应的未经修饰的甲羟戊酸激酶的氨基酸序列选自由如SEQ ID NO1、2、3、4、5、6、7、8、9、10、11、12、13、14、15和30所示的氨基酸序列所构成的组。
11.一种多核苷酸,其包含编码如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶的核苷酸序列。
12.如权利要求11所述的多核苷酸,其中所述编码如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶的核苷酸序列选自由SEQ IDNO32和33所构成的组。
13.一种载体或质粒,其中包含如权利要求11或12所述的多核苷酸。
14.如权利要求13所述的载体或质粒,还包含至少一种标记基因。
15.一种宿主细胞,其中包含如权利要求13或14所述的载体或质粒。
16.如权利要求15所述的宿主细胞,其是E.coli或Paracoccuszeaxanthinifaciens或Rhodobacter或Saccharomyces cerevisiae细胞。
17.一种生产类异戊二烯化合物的方法,所述方法包括(a)在合适的培养基中,培养如权利要求15或16所述的宿主细胞;以及(b)可选地,从培养基中分离出类异戊二烯化合物。
18.如权利要求17所述的方法,其中所述的类异戊二烯化合物是辅酶Q10。
19.一种用于生产如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶的方法,所述方法包括(a)在合适的培养基中,培养如权利要求15或16所述的宿主细胞的群落,以及(b)可选地,从所述细胞或从所述培养基中回收经过修饰的甲羟戊酸激酶。
20.一种用于制备对反馈抑制的敏感性降低的甲羟戊酸激酶的方法,所述方法包括如下步骤(a)提供一种多核苷酸,所述多核苷酸编码第一种甲羟戊酸激酶,该激酶展示出对反馈抑制的敏感性;(b)将一种或多种突变引入到所述多核苷酸序列中,使得经过突变的多核苷酸序列编码第二种甲羟戊酸激酶,较之第一种甲羟戊酸激酶,其含有至少一处氨基酸突变,其中,所述至少一处氨基酸突变发生于选自由如下氨基酸位置所构成的组中的氨基酸位置中的一处或多处,所述氨基酸位置相应于如SEQ ID NO1所示的氨基酸序列上的17、47、93、94、132、167、169、204和266位;(c)可选地,将经过突变的多核苷酸插入到载体或质粒中;(d)将多核苷酸或载体或质粒引入到合适的宿主细胞中;以及(e)在允许经过修饰的甲羟戊酸激酶表达的条件下培养所述宿主细胞。
21.如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶或如权利要求11或12所述的多核苷酸在制备用于治疗与甲羟戊酸激酶活性降低相关的疾病的药物中的用途。
22.如权利要求21所述的用途,其中所述与甲羟戊酸激酶活性降低相关的疾病选自由甲羟戊酸尿症、超免疫球蛋白D症以及周期性发热综合征所构成的组。
23.如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶或如权利要求11或12所述的多核苷酸用于检测生物流体中甲羟戊酸浓度的用途。
24.如权利要求1至10中任意一项所述的经过修饰的甲羟戊酸激酶或如权利要求11或12所述的多核苷酸用于提高类异戊二烯化合物生产的用途。
全文摘要
本发明涉及经过修饰的甲羟戊酸激酶,其对于反馈抑制具有更小的敏感度,还涉及能编码它们的多核苷酸。本发明还涉及包含这些多核苷酸的载体以及包含这些载体的宿主细胞。本发明提供了一种用于生产经修饰的酶的方法以及用于生产类异戊二烯化合物的方法。
文档编号C12P7/02GK1806042SQ200480016384
公开日2006年7月19日 申请日期2004年6月10日 优先权日2003年6月12日
发明者白仁羽楠, 马卡斯·哈波林, 马丁·莱玛恩, 如尔·罗帕斯-乌里巴瑞, 马卡斯·维斯 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1