在遗传修饰的非人生物中制备酮类胡萝卜素的方法

文档序号:381809阅读:708来源:国知局
专利名称:在遗传修饰的非人生物中制备酮类胡萝卜素的方法
技术领域
本发明涉及培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性;还涉及经过遗传修饰的生物和它们作为用以生产酮类胡萝卜素提取物的食品和饲料的用途。
背景技术
类胡萝卜素是在细菌、藻类、真菌及植物中从头合成的。酮类胡萝卜素,即含有至少一个酮基的类胡萝卜素,例如虾青素(Astaxanthin)、角黄素(Canthaxanthin)、海胆酮(echinenone)、3-羟基海胆酮(3-Hydroxyechinenon)、3’-羟基海胆酮(3’-Hydroxyechinenone)、金盏花玉红质(adonirubin)和金盏花黄质(adonixanthin)等天然抗氧化剂和色素,是某些藻类和微生物产生的次级代谢产物。
鉴于其着色特性,酮类胡萝卜素(尤其是虾青素)被用作动物饲料的色素添加剂,特别是用于鳟鱼、鲑鱼和虾的养殖中。
目前虾青素的制备主要是通过化学合成的方法进行的。现在,通过培养藻类(如雨生红球藻(Haematococcus pluvialis))或发酵基因工程最优化的微生物并加以分离的生物技术方法,可以获取少量天然酮类胡萝卜素(例如天然虾青素)。
因此,经济的用于制备天然酮类胡萝卜素的生物技术方法至关重要。
业已从多种生物中分离出编码酮酶的核酸以及相应蛋白质序列,并注释为如编码橙黄农杆菌(Agrobacterium aurantiacum)来源酮酶的核酸(EP735 137,登陆号D58420),来源于产碱菌属种PC-1(Alcaligenes sp.PC-1)(EP 735137,登陆号D58422),雨生红球藻Flotow em.Wille和雨生红球藻,NIES-144(EP 725137,WO 98/18910;Lotan等,FEBS Letters 1995,364,125-128,登陆号X86782及D45881),Paracoccus marcusii(登陆号Y15112),聚球藻属(Synechocystis sp.)PC6803株(登陆号NP_442491),慢生根瘤菌属(Bradyrhizobium sp.)(登陆号AF218415)以及念珠藻属(Nostocsp.)PCC 7120(Kaneko等,DNA Res.2001,8(5),205-213;登陆号AP003592,BAB74888)的核酸。
EP735 137描述了将橙黄农杆菌或产碱菌属PC-1来源的酮酶基因(crtW)插入微生物,从而在微生物(如 E.coli)中制备叶黄素(xanthophylls)的方法。
从EP 725137、WO 98/18910、Kajiwara等(Plant Mol.Biol.1995,29,343-352)及Hirschberg等(FEBS Letters 1995,364,125-128)可知将雨生红球藻来源的酮酶基因(crtW,crtO或bkt)插入E.coli,以制备虾青素的方法。
Hirschberg等(FEBS Letters 1997,404,129-134)描述了将雨生红球藻来源的酮酶基因(crtO)插入聚球藻(Synechococcus)中制备虾青素。Sandmann等(Photochemistry and Photobiology 2001,73(5),551-55)描述了类似的方法,但其导致了角黄素的产生,且仅能产出微量的虾青素。
WO 98/18910及Hirschberg等(Nature Biotechnology 2000,18(8),888-892)描述了将雨生红球藻来源的酮酶基因(crtO)插入烟草中,在烟草花的蜜腺中合成酮类胡萝卜素。
WO 01/20011描述了在油料种子植物(如油菜籽、向日葵、大豆以及大麻)的种子中,使用种子特异性的启动子以及雨生红球藻来源的酮酶,通过DNA构建体生产酮类胡萝卜素,尤其是虾青素。
现有技术中描述的制备酮类胡萝卜素的所有方法,尤其是所述的用于制备虾青素的方法具有以下不足之处。一方面,产率仍然不如人意;另一方面,转基因生物产生了大量的羟基化副产物(例如玉米黄质和金盏花黄质)。

发明内容
因此,本发明的目标在于提供通过培养遗传修饰的非人生物制备酮类胡萝卜素的方法;或进一步提供经过遗传修饰的能产生酮类胡萝卜素的非人生物,其减轻或不再具有上述现有技术的不足,或者能以更高产率生产所需的酮类胡萝卜素。
据此,已经发现了通过培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性,而其修饰的β环化酶活性是由于该β环化酶含有SEQ ID NO2氨基酸序列,或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
“与野生型相比修饰的酮酶活性”,在起始生物或野生型不具酮酶活性的情况下,应优选理解为“与野生型相比造成的酮酶活性”。
“与野生型相比修饰的酮酶活性”,在起始生物或野生型具有酮酶活性的情况下,应优选理解为“与野生型相比增加的酮酶活性”。
“与野生型相比修饰的β环化酶活性”,在起始生物或野生型不具β环化酶活性的情况下,应优选理解为“与野生型相比造成的β环化酶活性”。
“与野生型相比修饰的β环化酶活性”,在起始生物或野生型具有β环化酶活性的情况下,应优选理解为“与野生型相比增加的β环化酶活性”。
本发明的非人生物(如微生物或植物)优选起始生物时能够天然产生类胡萝卜素(如β-胡萝卜素或玉米黄质),或能够通过遗传修饰(例如代谢途径的再调节或互补)生产类胡萝卜素(如β-胡萝卜素或玉米黄质)。
作为起始或野生型生物,一些生物已经能够产生酮类胡萝卜素,例如虾青素或角黄素。这些生物,如雨生红球藻、Paracoccus marcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacillus circulans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、pheasant′s-eye、Neochloris wimmeri、原管藻(Protosiphon botryoides)、Scotiellopsis oocystiformis、Scenedesmusvacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)和Bacillus atrophaeus,作为起始或野生型生物,已经具有酮酶活性和β环化酶活性。
术语“野生型”,根据本发明应理解为相应的起始生物。
根据上下文,术语“生物”可以理解为非人起始生物(野生型),或本发明中经过遗传修饰的非人生物,或二者兼之。
优选地,特别是在不能明确指定植物或野生型的情况下,“野生型”在每种情况下是指用于判定下列活性变化的参照生物即酮酶活性的增加或造成、下文描述的羟化酶活性的增加或造成、下文描述的β环化酶活性的增加或造成、下文描述的HMG-CoA还原酶活性的增加、下文描述的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性的增加、下文描述的1-脱氧-D-木糖-5-磷酸合酶活性的增加、下文描述的1-脱氧-D-木糖-5-磷酸还原异构酶活性的增加、下文描述的异戊烯二磷酸酯Δ-异构酶活性的增加、下文描述的牻牛儿基二磷酸酯合酶活性的增加、下文描述的法呢基二磷酸酯合酶活性的增加、下文描述的牻牛儿基牻牛儿基二磷酸酯合酶活性的增加、下文描述的八氢番茄红素合酶活性的增加、下文描述的八氢番茄红素去饱和酶活性的增加、下文描述的ζ-胡萝卜素去饱和酶活性的增加、下文描述的crtISO活性的增加、下文描述的FtsZ活性的增加、下文描述的MinD活性的增加、下文描述的ε-环化酶活性的增加和下文描述的内源β-羟化酶活性的降低,以及酮类胡萝卜素含量的增加。
对于野生型已具有酮酶活性的微生物而言,该参照生物优选雨生红球藻。
对于野生型不具有酮酶活性的微生物而言,该参照生物优选布拉霉(Blakeslea)。
对于野生型即已具有酮酶活性的植物而言,该参照生物优选夏侧金盏花(Adonis aestivalis)、火焰金盏花(Adonis flammeus)或Adonis annuus,特别优选夏侧金盏花。
对于野生型其花瓣中不具有酮酶活性的植物而言,该参照生物优选万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、香叶万寿菊(Tagetes lucida)、普林万寿菊(Tagetes Pringlei)、Tagetes palmeri、小万寿菊(Tagetes minuta)或钟形万寿菊(Tagetes campanulata),特别优选万寿菊。
酮酶活性应理解为酮酶的酶活性。
酮酶是指一种蛋白质,其具有在任选取代的类胡萝卜素β-芷香酮环上引入酮基的酶活性。
特别地,酮酶指具有将β-胡萝卜素转变成角黄素的酶活性的蛋白质。
据此,酮酶活性是指一定时间内由酮酶蛋白质反应的β-胡萝卜素的量或生成的角黄素的量。
本发明方法的实施方案之一使用的起始生物为作为野生型或起始生物已经具有一定酮酶活性的非人生物(如如雨生红球藻、Paracoccusmarcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacilluscirculans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、pheasant′s-eye、Neochloris wimmeri、原管藻(Protosiphon botryoides)、Scotiellopsisoocystiformis、Scenedesmus vacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)或Bacillusatrophaeus。在该实施方案中,遗传修饰导致了与野生型或起始生物相比酮酶活性的增加。
当相比于野生型酮酶活性增加时,与野生型相比,在一定时间内由酮酶蛋白质酮酶反应的β-胡萝卜素的量或生成的角黄素的量也因之增加。
优选地,该酮酶活性的增加至少为野生型酮酶活性的5%,进一步优选为至少20%,进一步优选为至少50%、进一步优选为至少100%,更优选为至少300%,更为优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的酮酶活性对植物或微生物材料中酮酶活性的测定,是基于Frazer等(J.Biol.Chem.272(10)6128-6135,1997)的方法。通过使用β-胡萝卜素和角黄素底物,在脂质(大豆卵磷脂)和去污剂(胆酸钠)存在的情况下测定植物或微生物提取物的酮酶活性。酮酶分析的底物/产物比例通过HPLC手段检测。
有多种可以增加酮酶活性的途径,如通过在翻译和蛋白质水平关闭抑制性调节机制,或通过提高编码酮酶核酸相对于野生型的基因表达(例如通过活化剂诱导酮酶基因或通过向生物插入编码酮酶核酸)。
根据本发明,该实施方案中“提高编码酮酶核酸的基因表达”也指对该生物自身的内源酮酶表达的调控。这一点可以通过如修饰酮酶编码基因的启动子DNA序列来实现。这一修饰可以通过DNA序列的缺失或插入来实现,从而改变或优选增加至少一个内源酮酶基因的表达率。
如上所述,可以通过应用外源刺激来改变至少一种内源酮酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用野生型生物中不具有的或经修饰的调节蛋白质,与酮酶基因的启动子相互作用,以增加至少一个内源酮酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由DNA结合结构域和转录激活结构域所组成的嵌合蛋白质。
在优选实施方案中,通过提高编码酮酶核酸的基因表达,较野生型增加酮酶活性。
在另一优选实施方案中,通过向生物插入编码酮酶核酸来增加编码酮酶核酸的基因表达。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一另一个酮酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码酮酶的外源(即异源)核酸,或具有至少两个编码酮酶的内源核酸。
根据本发明,在本方法的另一优选实施方案中,使用的起始生物为野生型并不具有酮酶活性的非人生物(如布拉霉、Marigold、万寿菊、香叶万寿菊、小万寿菊、普林万寿菊、Tagetes palmeri及钟形万寿菊)。
在该优选实施方案中,遗传修饰造成了这些生物中的酮酶活性。该优选实施方案中,与未经遗传修饰的野生型相比,本发明的遗传修饰的生物具有酮酶活性,因而优选能够转基因表达酮酶。
在该优选实施方案中,与前述增加编码酮酶核酸的基因表达类似,优选通过向起始生物插入编码酮酶核酸,造成编码酮酶核酸的基因表达。
为此,在两个实施方案中,原则上可以使用各种酮酶基因,即编码酮酶的各种核酸。
本说明书中提到的所有核酸可以为如RNA、DNA或cDNA序列。
对于真核生物来源的含有内含子的基因组酮酶序列,在宿主生物不能或不能通过改造来表达相应酮酶时,优选使用已经加工的核酸序列,如相应的cDNA。
可以用于本发明方法中的编码酮酶的核酸及相应酮酶的实例为如以下来源的序列雨生红球藻,特别是雨生红球藻Flotow em.Wille(登陆号X86782;核酸SEQ ID NO3,蛋白质SEQ ID NO4),雨生红球藻,NIES-144(登陆号D45881;核酸SEQ ID NO35,蛋白质SEQ ID NO36),橙黄农杆菌(登陆号D58420;核酸SEQ ID NO37,蛋白质SEQ IDNO38),产碱菌属种(登陆号D58422;核酸SEQ ID NO39,蛋白质SEQ IDNO40),Paracoccus marcusii(登陆号Y15112;核酸SEQ ID NO41,蛋白质SEQ ID NO42)。
聚球藻属PC6803株(登陆号NP442491;核酸SEQ ID NO43,蛋白质SEQ ID NO44)。
慢生根瘤菌属(登陆号AF218415;核酸SEQ ID NO45,蛋白质SEQ ID NO46)。
念珠藻PCC7120株(登陆号AP003592,BAB74888;核酸SEQ IDNO47,蛋白质SEQ ID NO48)。
雨生红球藻(登陆号AF534876,AAN03484;核酸SEQ ID NO49,蛋白质SEQID NO50)
副球藻菌MBIC1143(登陆号D58420,P54972;核酸SEQ ID NO51,蛋白质SEQ IDNO52)橙黄短波单胞菌(Brevundimonas aurantiaca)(登陆号AY166610,AAN86030;核酸SEQ ID NO53,蛋白质SEQID NO54)泡沫节球藻(Nodularia spumigena)NSOR10(登陆号AY210783,AAO64399;核酸SEQ ID NO55,蛋白质SEQ ID NO56)点形念珠藻(Nostoc punctiforme)ATCC 29133(登陆号NZ_AABC01000195,ZP_00111258;核酸SEQ ID NO57,蛋白质SEQ ID NO58)点形念珠藻(Nostoc punctiforme)ATCC 29133(登陆号NZ_AABC01000196;核酸SEQ ID NO59,蛋白质SEQID NO60)耐辐射奇异球菌(Deinococcus radiodurans)RI(登陆号E75561,AE001872;核酸SEQ ID NO61,蛋白质SEQ IDNO62),聚球藻属种WH 8102,核酸Acc.No.NZ_AABD01000001,碱基对1,354,725-1,355,528(SEQID NO75),蛋白质Acc.No.ZP_00115639(SEQ ID NO76)(注释为推定的蛋白质),或自上述序列衍生的序列,例如通过对如序列SEQ ID NO58或SEQ ID NO57的变异/突变产生序列为SEQ ID NO64或66的酮酶以及相应的编码核酸序列SEQ ID NO63或SEQ ID NO65,通过对如序列SEQ ID NO60或SEQ ID NO59的变异/突变产生序列为SEQ ID NO68或70的酮酶以及相应的编码核酸序列SEQ ID NO67或SEQ ID NO69,或通过对如序列SEQ ID NO76或SEQ ID NO75的变异/突变产生序列为SEQ ID NO72或74的酮酶以及相应的编码核酸序列SEQ ID NO71或SEQ ID NO73。
容易发现可用于本发明方法的其它酮酶和酮酶基因的天然实例,例如通过比较数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性(所述数据库含有前述序列,特别是具有SEQ ID NO4和/或48和/或58和/60的序列),可以从多种已知基因组序列的生物中发现其它酮酶和酮酶基因。
通过众所周知的杂交技术,从前述核酸序列起始,特别是从多种基因组序列未知生物的SEQ ID NO3和/或47和/或57和/59的序列起始,可以容易地发现其它酮酶和酮酶基因的天然实例。
该杂交可以在温和(低严紧性)或优选在严紧(高严紧性)的条件下进行。
该类杂交条件可以应用于该说明书中的所有核酸,在如Sambrook,J.,Fritsch,E.F,Maniatis,T.,《Molecular Cloning(A Laboratory Manual)》,第二版,Cold Spring Harbor Laboratory Press,1989,9.31-9.57或CurrentProtocols in Molecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6中有所描述。
例如,洗涤步骤的条件可以从低严紧性(在50℃使用2X SSC)和高严紧性(在50℃,优选在65℃使用0.2X SSC)所限定的条件范围中选择(20X SSC0.3M柠檬酸钠,3M氯化钠,pH7.0)。
此外,还可以将洗涤步骤中的温度从温和条件的室温(22℃)升至严紧条件的65℃。
可以同时改变盐浓度和温度两参数,也可以保持其中之一恒定,只改变另一个。在杂交过程中也可以使用变性剂(如甲酰胺或SDS)。若为50%甲酰胺,优选在42℃下进行杂交。
以下给出了一些杂交条件和洗涤步骤的代表性条件
(1)杂交条件,例如(i)65℃、4X SSC,或(ii)45℃、6X SSC,或(iii)68℃、6X SSC、100mg/ml变性鱼精DNA,或(iv)68℃、6X SSC、0.5%SDS、100mg/ml变性且片段化的鲑精DNA,或(v)42℃、6X SSC、0.5%SDS、100mg/ml变性且片段化的鲑精DNA、50%甲酰胺,或(vi)42℃、50%甲酰胺、4X SSC,或(vii)42℃、50%(vol/vol)甲酰胺、0.1%牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮、50mM磷酸钠缓冲液(pH 6.5)、750mM NaCl、75mM柠檬酸钠,或(viii)50℃、2X或4X SSC(温和条件),或(ix)42℃、30至40%甲酰胺、2X或4X SSC(温和条件)。
(2)在以下条件进行10分钟的洗涤步骤,例如,(i)50℃、0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,或(ii)65℃、0.1X SSC,或(iii)68℃、0.1X SSC、0.5%SDS,或(iv)42℃、0.1X SSC、0.5%SDS、50%甲酰胺,或(v)42℃、0.2X SSC、0.1%SDS,或(vi)65℃、2X SSC(温和条件)。
在本发明方法的一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO4氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO4序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO4序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
本发明方法的另一个优选实施方案应用编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO48氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO48序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO48序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
在本发明方法的另一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO58氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO58序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO58序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
在本发明方法的另一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO60氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO60序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO60序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
对于本说明书中的所有蛋白质,术语“替换”是指一个或多个氨基酸被一个或多个氨基酸所替换。优选进行“保守性取代”,其中替换的氨基酸与原始氨基酸具有相似的性质,如Glu被Asp、Gln被Asn、Val被Ile、Leu被Ile、Ser被Thr所替换。
“缺失”是指一个氨基酸直接被键所取代。优选的缺失位置为多肽的末端,以及单独蛋白质结构域间的连接处。
“插入”是指将氨基酸插入多肽链中,其中原直接连接被一个或多个氨基酸所取代。
“两种蛋白质间的同一性”是指各蛋白质全长中的氨基酸同一性,尤其是使用Informax(USA)提供的vector NTI 7.1版软件和clustal方法(Higgins DG,Sharp PM.Fast and sensitive multiple sequence alignmentson a microcomputer.Comput Appl.Biosci.1989Apr;5(2)151-1),设定下述参数,通过比较计算出的同一性多重比对参数空位开放罚分(gap opening penalty)10空位扩展罚分(gap extension penalty) 10空位分离罚分范围 8空位分离罚分(gap separation penalty) 关闭校正延迟的同一性% 40(%identity for alignment delay)残基特异性空位(Residae specific gap) 关闭亲水残基空位(Hydrophilic rdsidae gap)关闭转换权重(transition weighing)0成对比对参数FAST运算法则 使用K-tuple尺寸 1空位罚分 3
窗口尺寸 5最佳对角线数目(Number of best diagonals) 5因此,在氨基酸水平上与序列SEQ ID NO4或48或58或60具有至少70%同一性的蛋白质,是指其序列与SEQ ID NO4或48或58或60的序列相比较(特别是根据上述程序对数)具有至少70%上述设置参数的同一性。
可以通过如根据遗传密码反向翻译多肽序列的方法,获取合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO3序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO48序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO58序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO60序列的核酸插入植物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有酮酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley PressNew York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloningA laboratory manual》,ColdSpring Harbor Laboratory Press所述。
如上所述,本发明的方法中使用的非人生物与野生型相比具有修饰的酮酶活性以及修饰的β环化酶活性,该修饰的β环化酶活性源于该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
根据本发明,该方法的实施方案之一使用的起始生物为作为野生型或起始生物已经具有一定β环化酶活性的非人生物。在该实施方案中,遗传修饰引入了高于野生型或起始生物的β环化酶活性。该增加的β环化酶活性源于该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
β环化酶活性是指β环化酶的酶活性。
β环化酶是指一种蛋白质,其具有将末端的番茄红素线性残基转化为β-芷香酮环的酶活性。
具体而言,β环化酶指具有将γ-胡萝卜素转化成β-胡萝卜素的酶活性的蛋白质。
因此,β环化酶活性是指在一定时间内由β环化酶蛋白质转化的γ-胡萝卜素的量,或生成的β-胡萝卜素的量。
当β环化酶活性相对于野生型增加时,与野生型相比,在一定时间内由β环化酶蛋白质转化的番茄红素或γ-胡萝卜素的量或由番茄红素生成的γ-胡萝卜素的量或由γ-胡萝卜素生成的β-胡萝卜素的量也因之增加。
优选增加的β环化酶活性至少为野生型β环化酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的β环化酶活性根据Fraser和Sandmann的方法(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)在体外测定β环化酶活性。将作为缓冲液的磷酸钾(pH 7.6)、作为底物的番茄红素、及红辣椒(paprika)基质蛋白质、NADP+、NADPH和ATP加入特定量的生物提取物中。
特别优选在Bouvier、d′Harlingue和Camara(Molecular Analysis ofcarotenoid cyclase inhibition;Arch.Biochem.Biophys.346(1)(1997)53-64)的下述条件测定β环化酶活性在250μl的体积中进行体外测定。反应物含有50mM磷酸钾(pH 7.6)、不同量的生物提取物、20nM番茄红素、250μg红辣椒有色体基质蛋白质、0.2mM NADP+、0.2mM NADPH和1mM ATP。将NADP/NADPH和ATP溶解于含有1mg Tween 80的10ml乙醇后加入孵育介质。30℃下反应60分钟后,加入氯仿/甲醇(2∶1)终止反应。反应产物经氯仿抽提后通过HPLC分析。
Fraser和Sandmann描述了另一种使用放射性底物的测定(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)。
可以通过多种途径增加β环化酶的活性,如通过关闭在表达及蛋白质水平的抑制性调节机制或增加编码β环化酶的核酸相对于野生型的基因表达,所述β环化酶中含有SEQ ID NO2氨基酸序列、或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
同样,有多种途径可以相对于野生型增加编码β环化酶核酸的基因表达,例如通过活化剂诱导β环化酶基因,或向生物插入一个或多个β环化酶基因拷贝,即向生物插入至少一个编码β环化酶的核酸,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
根据本发明,增加编码β环化酶核酸的基因表达也指对该生物自身的内源β环化酶表达的调控,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
可以通过如修饰β环化酶编码基因的启动子DNA序列来实现这一调控。所述修饰可以通过如DNA序列的缺失或插入来完成,从而提高基因的表达率。
如上所述,可以通过应用外源刺激来改变内源β环化酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用未转化生物中不具有的调节蛋白质,与该基因的启动子相互作用,以修饰或增加内源β环化酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由DNA结合结构域和转录激活结构域所组成的嵌合蛋白质。
在优选实施方案中,通过向生物插入至少一个编码β环化酶的核酸来增加编码β环化酶核酸的基因表达,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在另一个β环化酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码β环化酶的外源(即异源)核酸,或具有至少两个编码β环化酶的内源核酸。
在本发明方法的另一优选实施方案中,使用的起始生物为野生型并不具有β环化酶活性的非人生物。在该次优选的实施方案中,遗传修饰造成了生物中的β环化酶活性。该实施方案中,与未遗传修饰的野生型相比,本发明的遗传修饰的生物具有β环化酶活性,因而优选能够转基因表达β环化酶。
在该优选实施方案中,与前述增加编码β环化酶核酸的基因表达类似,优选通过向起始生物插入编码β环化酶的核酸造成编码β环化酶核酸的基因表达。
为此,在两个实施方案中,原则上可以使用各种β环化酶基因,即编码β环化酶的各种核酸,所述β环化酶中含有SEQ ID NO2氨基酸序列,或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
对于真核生物来源的含有内含子的基因组β环化酶序列,在宿主生物不能或不能通过改造来表达相应β环化酶时,优选使用已经加工的核酸序列,如相应的cDNA。
特别优选的β环化酶为番茄来源的色素细胞特异性β环化酶(AAG21133)(核酸SEQ ID NO1;蛋白质SEQ ID NO2)。
根据本发明,可以使用的β环化酶基因是编码如下蛋白质的核酸,所述蛋白质中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者与SEQ ID NO2序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%,且所述蛋白质具有β环化酶的酶促性质。
容易发现可用于本发明方法的β环化酶和β环化酶基因的其他实例,例如如上所述比较数据库中的氨基酸序列或其相应的反向翻译核酸序列与SEQ ID NO2的同一性,可以从多种已知基因组序列的生物中发现其它β环化酶和β环化酶基因。
利用杂交和PCR技术,从多种基因组序列未知生物的SEQ ID NO1序列起始,通过已知的方法可以容易地发现其它β环化酶和β环化酶基因的实例。
在另一个特别优选的实施方案中,为增加β环化酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有SEQ ID NO2序列的β环化酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO1序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有β环化酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,WileyPress New York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloningA laboratory manual》,ColdSpring Harbor Laboratory Press所述。
在优选实施方案中培养非人生物,所述生物与其野生型相比,除了具有修饰的酮酶活性和修饰的β环化酶活性,还具有改良的羟化酶活性。
“与野生型相比改良的羟化酶活性”,在起始生物或野生型不具羟化酶活性的情况下,应优选理解为“与野生型相比造成的羟化酶活性”。
“与野生型相比改良的羟化酶活性”,在起始生物或野生型具有羟化酶活性的情况下,应优选理解为“与野生型相比增加的羟化酶活性”。
因此,在优选实施方案中培养非人生物,所述生物与其野生型相比,除了具有修饰的酮酶活性和修饰的β环化酶活性,还具有造成的或增加的羟化酶活性。
羟化酶活性是指羟化酶的酶活性。
羟化酶是指一种蛋白质,其具有在任选取代的类胡萝卜素β-芷香酮环上引入羟基的酶活性。
具体而言,羟化酶指具有将β-胡萝卜素转化成玉米黄质或将角黄素转化成虾青素的酶活性的蛋白质。
据此,羟化酶活性是指在一定时间内由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量,或生成的玉米黄质或虾青素的量。
当羟化酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质羟化酶转化的β-胡萝卜素或角黄素的量或生成的玉米黄质或虾青素的量也因之增加。
优选地,该羟化酶活性的增加至少为野生型羟化酶活性的5%,进一步优选为至少20%,进一步优选为至少50%、进一步优选为至少100%,更优选为至少300%,甚至更优选至少为500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的羟化酶活性根据Bouvier等的方法(Biochim.Biophys.Acta 1391(1998),320-328)在体外测定羟化酶活性。将铁氧化还原蛋白、铁氧化还原蛋白-NADP氧化还原酶、过氧化氢酶、NADPH和β-胡萝卜素及单-和双半乳糖苷甘油加入特定量的生物提取物中。
特别优选在Bouvier、Keller、d′Harlingue和Camara(Xanthophyllbiosynthesismolecular and functional characterization of carotenoidhydroxylases from pepper fruits(Capsicum annuum L.);Biochim.Biophys.Acta 1391(1998),320-328)的下述条件测定羟化酶活性在0.250ml的体积中进行体外测定。反应物含有50mM磷酸钾(pH7.6)、0.025mg菠菜铁氧化还原蛋白、0.5单位铁氧化还原蛋白-NADP+氧化还原酶、0.25mM NADPH、0.010mg β-胡萝卜素(在0.1mg Tween 80中乳化)、0.05mM的单/双半乳糖苷甘油混合物(1∶1)、1单位过氧化氢酶、0.2mg胎牛血清白蛋白和不同体积的生物提取物。将反应混合物在30℃孵育2小时。反应产物经有机溶剂(如丙酮或氯仿/甲醇(2∶1))抽提后通过HPLC测定。
可以通过多种途径实现羟化酶活性的增加或造成,如通过关闭在表达及蛋白质水平的抑制性调节机制或相对于野生型增加或造成羟化酶编码核酸的基因表达。
同样,有多种途径可以实现羟化酶编码核酸的基因表达相对于野生型的增加或造成,例如通过活化剂诱导羟化酶基因,或向生物插入一个或多个羟化酶基因拷贝,即向生物插入至少一个编码羟化酶的核酸。
根据本发明,增加羟化酶编码核酸的基因表达也指对该生物自身的内源羟化酶表达的调控。
可以通过如修饰羟化酶编码基因的启动子DNA序列来实现这一调控。所述修饰可以通过如DNA序列的缺失或插入来完成,从而提高基因的表达率。
如上所述,可以通过应用外源刺激来改变内源β环化酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用未转化生物中不具有的调节蛋白质,与该基因的启动子相互作用,以造成或增加内源羟化酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由一个DNA结合结构域和一个转录激活结构域所组成的嵌合蛋白质。
在优选的实施方案中,通过向生物插入至少一个羟化酶编码核酸来增加或造成羟化酶编码核酸的基因表达。
为此,原则上可以使用各种羟化酶基因,即编码羟化酶的各种核酸。
对于真核生物来源的含有内含子的基因组羟化酶序列,在宿主生物不能或不能通过改造来表达相应羟化酶时,优选使用已经加工的核酸序列,如相应的cDNA。
羟化酶基因的实例如雨生红球藻来源的羟化酶编码核酸(登陆号AX038729,WO 0061764);(核酸SEQ ID NO77,蛋白质SEQ ID NO78)。
以及以下登陆号的羟化酶|emb|CAB55626.1、CAA70427.1、CAA70888.1、CAB55625.1、AF499108_1、AF315289_1、AF296158_1、AAC49443.1、NP_94300.1、NP_200070.1、AAG10430.1、CAC06712.1、AAM88619.1、CAC95130.1、AAL80006.1、AF162276_1、AAO53295.1、AAN85601.1、CRTZ_ERWHE、CRTZ_PANAN、BAB79605.1、CRTZ_ALCSP、CRTZ_AGRAU、CAB56060.1、ZP_00094836.1、AAC44852.1、BAC77670.1、NP_745389.1、NP_344225.1、NP_849490.1、ZP_00087019.1、NP_503072.1、NP_852012.1、NP_115929.1、ZP_00013255.1。
此外,特别优选的羟化酶为番茄来源的羟化酶(登陆Y14810)(核酸SEQ ID NO5;蛋白质SEQ ID NO6)。
该优选实施方案中,与野生型相比,本发明的优选转基因生物中至少还存在另一个羟化酶基因。
该优选实施方案中,遗传修饰的生物具有如至少一个编码羟化酶的外源(即异源)核酸,或具有至少两个编码羟化酶的内源核酸。
优选地,上述优选实施方案中可以使用的羟化酶基因是编码如下蛋白质的核酸,所述蛋白质中含有SEQ ID NO6氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者与SEQ ID NO6序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%,且所述蛋白质具有羟化酶的酶促性质。
容易发现羟化酶和羟化酶基因的其他实例,例如如上所述比较数据库中的氨基酸序列或其相应的反向翻译核酸序列与SEQ ID NO6的同一性,可以从多种已知基因组序列的生物中发现其它羟化酶和羟化酶基因。
利用杂交和PCR技术,从多种基因组序列未知生物的SEQ ID NO5序列起始,通过已知的方法可以容易地发现其它羟化酶和羟化化酶基因的实例。
在另一个特别优选的实施方案中,为增加羟化酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO6的羟化酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO5序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有羟化酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley PressNew York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloningA laboratory manual)》,ColdSpring Harbor Laboratory Press所述。
特别优选地,本发明的方法使用起始生物时具有β环化酶活性而无酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性有所增加,且具有造成的酮酶活性,其中β环化酶活性增加是由于β环化酶所致,该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时缺乏β环化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物具有造成的β环化酶活性及酮酶活性,其中β环化酶活性的造成是由于β环化酶所致,该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性及酮酶活性均有所增加,其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性但不具有酮酶活性及羟化酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性有所增加,具有造成的酮酶活性及羟化酶活性,其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ IDNO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶及羟化酶活性但不具有酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性及羟化酶活性有所增加,具有造成酮酶活性。其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时缺乏β环化酶活性、羟化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物具有造成的β环化酶活性、羟化酶活性及酮酶活性。其中β环化酶活性的造成是由于β环化酶所致,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性、羟化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性、羟化酶活性及酮酶活性均有所增加。其中β环化酶活性的增加是由于β环化酶所致所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
在另一个优选实施方案中,培养遗传修饰的非人生物,所述生物与野生型相比还具有至少一种选自以下的活性增加HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性以及MinD活性。
HMG-CoA还原酶活性是指HMG-CoA还原酶(3-羟基-3-甲基戊二酰辅酶A还原酶)的酶活性。
HMG-CoA还原酶是指一种蛋白质,其具有可将3-羟基-3-甲基戊二酰辅酶A转化为甲羟戊酸的酶活性。
据此,HMG-CoA还原酶活性是指一定时间内由HMG-CoA还原酶蛋白质反应的3-羟基-3-甲基戊二酰辅酶A的量或生成的甲羟戊酸的量。
当HMG-CoA还原酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质HMG-CoA还原酶转化的3-羟基-3-甲基戊二酰辅酶A的量或生成的甲羟戊酸的量也因之增加。
优选增加的HMG-CoA还原酶活性至少为野生型HMG-CoA还原酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的HMG-CoA还原酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据已发表的描述(如Schaller,Grausem,Benveniste,Chye,Tan,Song和Chua,Plant Physiol.109(1995),761-770;Chappell,Wolf,Proulx,Cuellar和Saunders,Plant Physiol.109(1995)1337-1343),能够测定HMG-CoA还原酶活性。可以在冷缓冲液(100mM磷酸钾(pH 7.0)、4mMMgCl2、5mM DTT)中对生物组织进行匀浆和抽提。将匀浆液在4℃、10 000g离心15分钟。随后将上清液以100 000g离心45-60分钟。测定上清液和微粒体级分的沉淀(重悬于100mM磷酸钾(pH 7.0)和50mMDTT之后)中HMG-CoA还原酶活性。将溶液和悬浮液(悬浮液中蛋白质含量相当于约1-10μg)的等分试样于30℃在100mM磷酸钾缓冲液(pH 7.0,含3mM NADPH和20μM(14C)HMG-CoA(58μCi/μM),理想体积为26μl)中孵育15-60分钟。加入5μl甲羟戊酸内酯(1mg/ml)和6NHCl终止反应。随后将混合物在室温下孵育15分钟。加入125μl饱和磷酸钾溶液(pH 6.0)及300μl乙酸乙酯,以定量反应中形成的(14C)甲羟戊酸。将混合物充分混合并离心。通过闪烁测量测定放射性。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶(也称作lytB或IspH)活性,是指(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的酶活性。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶是指一种蛋白质,其具有可将(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯转化为异戊烯基二磷酸酯和二甲基烯丙基二磷酸酯的酶活性。
据此,(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯活性是指一定时间内由(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶蛋白质反应的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯的量或生成的异戊烯基二磷酸酯和/或二甲基烯丙基二磷酸酯的量。
当(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶转化的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯的量或生成的异戊烯基二磷酸酯和/或二甲基烯丙基二磷酸酯的量也因之增加。
优选增加的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性至少为野生型(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
通过免疫检测方法可以测定(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的活性。Rohdich及其同事(Rohdich,Hecht,G_rtner,Adam,Krieger,Amslinger,Arigoni,Bacher和EisenreichStudies on the nonmevalonateterpene biosynthetic pathwaymetabolic role of IspH(LytB)protein,Natl.Acad.Natl.Sci.USA 99(2002),1158-1163)已经描述了特异性抗体的制备。关于催化活性的测定,Altincicek及其同事(Altincicek,Duin,Reichenberg,Hedderich,Kollas,Hintz,Wagne,Wiesner,Beck和JomaaLytB proteincatalyzes the terminal step of the 2-C-methyl-D-erythritol-4-phosphatepathway of isoprenoid biosynthesis;FEBS Letters 532(2002)437-440)描述了一种监测(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原为异戊烯基二磷酸酯和二甲基烯丙基二磷酸酯的体外系统。
1-脱氧-D-木糖-5-磷酸合酶活性是指1-脱氧-D-木糖-5-磷酸合酶的酶活性。
1-脱氧-D-木糖-5-磷酸合酶是指一种蛋白质,其具有将羟乙基ThPP和3-磷酸甘油醛转化为1-脱氧-D-木糖-5-磷酸的酶活性。
据此,1-脱氧-D-木糖-5-磷酸合酶活性是指在一定时间内由1-脱氧-D-木糖-5-磷酸合酶蛋白质转化的羟乙基ThPP和/或3-磷酸甘油醛的量或形成的1-脱氧-D-木糖-5-磷酸的量。
当1-脱氧-D-木糖-5-磷酸合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸合酶转化的羟乙基ThPP和/或3-磷酸甘油醛的量,或形成的1-脱氧-D-木糖-5-磷酸的量也因之增加。
优选增加的1-脱氧-D-木糖-5-磷酸合酶活性至少为野生型1-脱氧-D-木糖-5-磷酸合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的1-脱氧-D-木糖-5-磷酸合酶活性
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
用于测定D-1-脱氧木酮糖-5-磷酸合酶活性(DXS)的反应混合物(50-200μl)中含有100mM Tris-HCl(pH 8.0)、3mM MgCl2、3mM MnCl2、3mM ATP、1mM硫胺素二磷酸酯、0.1%Tween-60、1mM氟化钾、30μM(2-14C)丙酮酸(0.5μCi)、0.6mM DL-3-磷酸甘油醛。37℃下将生物提取物在反应溶液中孵育1-2小时。随后加热至80℃持续3分钟以终止反应。在13 000转/分钟下离心5分钟后,蒸发上清液,将残留物重悬于50μl甲醇,铺于TLC板进行薄层层析(硅胶60,Merck,Darmstadt),并在正丙醇/乙酸乙酯/水(6∶1∶3;v/v/v)中进行分离。在此过程中,放射性标记的D-1-脱氧木酮糖-5-磷酸(或D-1-脱氧木酮糖)与(2-14C)-丙酮酸得以分离。利用闪烁计数器进行定量。该法描述于Harker和Bramley(FEBS Letters 448(1999)115-119)。另外,测定DXS合酶活性的荧光测定法已由Querol及其同事描述(Analytical Biochemistry 296(2001)101-105)。
1-脱氧-D-木糖-5-磷酸还原异构酶(也称为1-脱氧-D-木酮糖-5-磷酸还原异构酶)活性是指1-脱氧-D-木糖-5-磷酸还原异构酶的酶活性。
1-脱氧-D-木糖-5-磷酸还原异构酶是指一种蛋白质,其具有将1-脱氧-D-木糖-5-磷酸转化为2-C-甲基-D-赤藻糖醇4-磷酸的酶活性。
据此,1-脱氧-D-木糖-5-磷酸还原异构酶活性是指在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸还原异构酶转化的1-脱氧-D-木糖-5-磷酸的量,或形成的2-C-甲基-D-赤藻糖醇4-磷酸的量。
当1-脱氧-D-木糖-5-磷酸还原异构酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸还原异构酶转化的1-脱氧-D-木糖-5-磷酸的量或形成的2-C-甲基-D-赤藻糖醇4-磷酸的量也因之增加。
优选增加的1-脱氧-D-木糖-5-磷酸还原异构酶活性至少为野生型1-脱氧-D-木糖-5-磷酸还原异构酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的1-脱氧-D-木糖-5-磷酸还原异构酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
在下述缓冲液中测定D-1-脱氧木酮糖-5-磷酸还原异构酶(DXR)的活性,所述缓冲液含有100mM Tris-HCl(pH 7.5)、1mM MnCl2、0.3mMNADPH和0.3mM 1-脱氧-D-木酮糖-4-磷酸,其中1-脱氧-D-木酮糖-4-磷酸能够经酶合成(如Kuzuyama,Takahashi,Watanabe和SetoTetrahedonletters 39(1998)4509-4512)。加入生物提取物开始反应。反应体积一般可为0.2至0.5ml;37℃孵育30-60分钟。此间,用分光光度计在340nm处监控NADPH的氧化。
异戊烯基二磷酸酯Δ-异构酶活性是指异戊烯基二磷酸酯Δ-异构酶的酶活性。
异戊烯基二磷酸酯Δ-异构酶是指一种蛋白质,其具有将异戊烯基二磷酸酯转化为二甲基烯丙基磷酸酯的酶活性。
据此,异戊烯基二磷酸酯Δ-异构酶活性是指在一定时间内由异戊烯基二磷酸酯Δ-异构酶转化的异戊烯基二磷酸酯的量或形成的二甲基烯丙基磷酸酯的量。
当异戊烯基二磷酸酯Δ-异构酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质异戊烯基二磷酸酯Δ-异构酶转化的异戊烯基二磷酸酯的量或形成的二甲基烯丙基磷酸酯的量也因之增加。
优选增加的异戊烯基二磷酸酯Δ-异构酶活性至少为野生型异戊烯基二磷酸酯Δ-异构酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的异戊烯基二磷酸酯Δ-异构酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Fraser及其同事公开的方法(Fraser,R_mer,Shipton,Mills,Kiano,Misawa,Drake,Schuch和BramleyEvaluation of transgenictomato plants expressing an additional phytoene synthase in a fruit-specificmanner;Proc.Natl.Acad.Sci.USA 99(2002),1092-1097,基于Fraser,Pinto,Holloway和Bramley,Plant Journal 24(2000),551-558),可以测定异戊烯基二磷酸酯异构酶(IPP异构酶)的活性。为进行酶测定,在含有1mM DTT、4mM MgCl2、6mM MnCl2、3mM ATP、0.1%Tween-60、1mM氟化钾的0.4M Tris-HCl(pH 8.0)中(体积为大约150-500μl),以0.5μCi(1-14C)IPP(异戊烯基焦磷酸酯)(56mCi/mmol,Amersham plc)为底物进行孵育。将提取物与缓冲液混合(例如以1∶1的比例)并在28℃孵育至少5小时。随后加入约200μl甲醇,并通过加入浓盐酸(终浓度为25%)在37℃进行约1小时酸水解。然后使用石油醚(与10%二乙醚混合)进行两次抽提(每次500μl)。利用闪烁计数器测定上层等分试样中的放射性。通过5分钟的短期孵育能够测定特异酶活性,因为短的反应时间抑制反应副产物生成(见Lützow和BeyerThe isopentenyl phosphate Δ-isomeraseand its relation to the phytoene synthase complex in daffodil chromoplasts;Biochim.Biophys.Acta 959(1988),118-126)。
牻牛儿基二磷酸酯合酶活性是指牻牛儿基二磷酸酯合酶的酶活性。
牻牛儿基二磷酸酯合酶是指一种蛋白质,其具有将异戊烯基二磷酸酯和二甲基烯丙基磷酸酯转化为牻牛儿基二磷酸酯的酶活性。
据此,牻牛儿基二磷酸酯合酶活性是指在一定时间内由牻牛儿基二磷酸酯合酶蛋白质转化的异戊烯基二磷酸酯和/或二甲基烯丙基磷酸酯的量或形成的牻牛儿基二磷酸酯的量。
当牻牛儿基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质牻牛儿基二磷酸酯合酶转化的异戊烯基二磷酸酯和/或二甲基烯丙基磷酸酯的量,或形成的牻牛儿基二磷酸酯的量也因之增加。
优选增加的牻牛儿基二磷酸酯合酶活性至少为野生型牻牛儿基二磷酸酯合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的牻牛儿基二磷酸酯合酶的活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
向50mM Tris-HCl(pH 7.6)、10mM MgCl2、5mM MnCl2、2mMDTT、1mMATP、0.2%Tween-20、5μM(14C)IPP和50μM DMAPP(二甲基烯丙基焦磷酸酯)中加入生物提取物,能够测定牻牛儿基二磷酸酯合酶(GPP合酶)的活性(根据Bouvier,Suire,d’Harlingue,Backhaus和CamaraMolecular cloning of geranyl diphosphate synthase and compartmentationof monoterpene synthesis in plant cells,Plant Journal 24(2000)241-252)。在如37℃下孵育2小时后,将反应产物去磷酸化(根据Koyama、Fuji和OguraEnzymatic hydrolysis of polyprenyl pyrophosphates,MethodsEnzymol.110(1985),153-155),利用薄层层析法和放射性掺入测定法进行分析(Dogbo,Bardat,Quennemet和CamaraMetabolism of plastidterpenoidsIn vitro inhibition of phytoene synthesis by phenethylpyrophosphate derivates,FEBS Letters 219(1987)211-215)。
法呢基二磷酸酯合酶活性是指法呢基二磷酸酯合酶的酶活性。
法呢基二磷酸酯合酶是指一种蛋白质,其具有依次将2分子异戊烯基二磷酸酯与二甲基烯丙基二磷酸酯反应,所生成的牻牛儿基二磷酸酯再转化为法呢基二磷酸酯的酶活性。
据此,法呢基二磷酸酯合酶活性是指在一定时间内由蛋白质法呢基二磷酸酯合酶转化的二甲基烯丙基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的法呢基二磷酸酯的量。
当法呢基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质法呢基二磷酸酯合酶转化的二甲基烯丙基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的法呢基二磷酸酯的量也因之增加。
优选增加的法呢基二磷酸酯合酶活性至少为野生型法呢基二磷酸酯合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的法呢基二磷酸酯合酶的活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Joly和Edwards的方法能够测定法尼基焦磷酸酯合酶(FPP合酶)的活性(Journal of Biological Chemistry 268(1993),26983-26989)。即,在含有10mM HEPES(pH 7.2)、1mM MgCl2、1mM二硫苏糖醇、20μM牻牛儿基焦磷酸酯和40μM(1-14C)异戊烯基焦磷酸酯(4Ci/mmol)的缓冲液中测定酶活性。将反应混合物在37℃孵育;加入2.5N HCl(在含有19μg/ml法呢醇的70%乙醇中)终止反应。随后通过酸水解在37℃水解反应产物30分钟。加入10%NaOH中和混合物,并通过与己烷振荡进行抽提。利用闪烁计数器测量己烷相的等分试样以确定掺入的放射性。
或者,将生物提取物与放射性标记的IPP孵育之后,在苯/甲醇(9∶1)中通过薄层层析(Silica-Gel SE60,Merck)分离反应产物。洗脱放射性标记的产物并测定其放射活性(根据Gaffe,Bru,Causse,Vidal,Stamitti-Bert,Carde和GallusciLEFPS1,a tomato farnesyl pyrophosphate gene highlyexpressed during early fruit development;Plant Physiology 123(2000)1351-1362)。
牻牛儿基牻牛儿基二磷酸酯合酶活性是指牻牛儿基牻牛儿基二磷酸酯合酶的酶活性。
牻牛儿基牻牛儿基二磷酸酯合酶是指一种蛋白质,其具有将法呢基二磷酸酯和异戊烯基二磷酸酯转化为牻牛儿基牻牛儿基二磷酸酯的酶活性。
据此,牻牛儿基牻牛儿基二磷酸酯合酶活性是指在一定时间内由蛋白质牻牛儿基牻牛儿基二磷酸酯合酶转化的法呢基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的牻牛儿基牻牛儿基二磷酸酯的量。
当牻牛儿基牻牛儿基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质牻牛儿基牻牛儿基二磷酸酯合酶转化的法呢基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的牻牛儿基牻牛儿基二磷酸酯的量也因之增加。
优选增加的牻牛儿基牻牛儿基二磷酸酯合酶活性至少为野生型活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的牻牛儿基牻牛儿基二磷酸酯合酶的活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
可以根据Dogbo和Camara所述的方法测定牻牛儿基牻牛儿基焦磷酸酯合酶(GGPP合酶)的活性(Biochim.Biophys.Acta 920(1987),140-148Purification of isopentenyl pyrophosphate isomerase and geranylgeranylpyrophosphate synthase from Capsicum chromoplasts by affinitychromatography)。为此,将总体积约为200μl的生物提取物加入缓冲液(50mM Tris-HCl(pH 7.6)、2mM MgCl2、1mM MnCl2、2mM二硫苏糖醇、(1-14C)IPP(0.1μCi、10μM)、15μM DMAPP、GPP或FPP)中。在30℃孵育1-2小时(或更长)。加入0.5ml乙醇和0.1ml 6N HCl终止反应。37℃孵育10分钟之后,用6N NaOH中和反应混合物,与1ml水混合并用4ml乙醚振荡进行抽提。利用闪烁计数测定乙醚相等分试样(如0.2ml)中的放射活性。或者在酸水解之后,可通过在乙醚中振荡抽提放射性标记的异戊二烯醇,并利用HPLC(25cm Spherisorb ODS-1柱,5μm;用甲醇/水(90∶10;v/v)以1ml/分钟的流速洗脱)分离,并通过放射活性监测进行定量(Wiedemann,Misawa和SandmannPurification and enzymaticcharacterization of the geranylgeranyl pyrophosphate synthase fromErwinia uredovora after expression in Escherichia coli;ArchivesBiochemistry and Biophysics 306(1993),152-157)。
八氢番茄红素合酶活性是指八氢番茄红素合酶的酶活性。
具体而言,八氢番茄红素合酶是指一种具有将牻牛儿基牻牛儿基二磷酸酯转化为八氢番茄红素的酶活性的蛋白质。
据此,八氢番茄红素合酶活性是指在一定时间内由蛋白质八氢番茄红素合酶转化的牻牛儿基牻牛儿基二磷酸酯的量,或形成的八氢番茄红素的量。
当八氢番茄红素合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质八氢番茄红素合酶转化的牻牛儿基牻牛儿基二磷酸酯的量,或形成的八氢番茄红素的量也因之增加。
优选增加的八氢番茄红素合酶活性至少为野生型八氢番茄红素合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的八氢番茄红素合酶的活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7-4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Fraser及其同事所发表的方法能够测定八氢番茄红素合酶(PSY)活性(Fraser,Romer,Shipton,Mills,Kiano,Misawa,Drake,Schuch和BramleyEvaluation of transgenic tomato plants expressing an additionalphytoene synthase in a fruit-specific manner,Proc.Natl.Acad.Sci.USA 99(2002),1092-1097,基于Fraser,Pinto,Holloway和Bramley,Plant Journal24(2000)551-558)。为测定酶,在含有1mM DTT、4mM MgCl2、6mMMnCl2、3mM ATP、0.1%Tween-60、1mM氟化钾的0.4M Tris-HCl(pH 8.0)中,以(3H)牻牛儿基牻牛儿基焦磷酸酯(15mCi/mM,AmericanRadiolabeled Chemicals,St.Louis)为底物进行孵育。将生物提取物与缓冲液混合,例如将295μl缓冲液与提取物混合使总体积为500μl。该混合物在28℃孵育至少5小时。随后用氯仿两次(每次500μl)振荡抽提八氢番茄红素。通过薄层层析法,在甲醇/水(95∶5;v/v)的二氧化硅板上分离反应中形成的放射性标记的八氢番茄红素。富碘环境下(通过加热几块碘晶体)可以在二氧化硅板上鉴定八氢番茄红素。以八氢番茄红素标准品作为参照。通过闪烁计数器测定法检测放射性标记产物的量。或者,也可以利用装有放射性探测器的HPLC定量八氢番茄红素(Fraser、Albrecht和SandmannDevelopment of high performance liquid chromatographic systems for theseparation of radiolabeled carotenes and precursors formed in specificenzymatic reactions;J.Chromatogr.645(1993)265-272)。
八氢番茄红素去饱和酶活性是指八氢番茄红素去饱和酶的酶活性。
八氢番茄红素去饱和酶是指一种蛋白质,其具有将八氢番茄红素转化为六氢番茄红素和/或将六氢番茄红素转化为ζ-胡萝卜素(zeta-胡萝卜素)的酶活性。
据此,八氢番茄红素去饱和酶活性是指在一定时间内由蛋白质八氢番茄红素去饱和酶转化的八氢番茄红素或六氢番茄红素的量,或形成的六氢番茄红素或ζ-胡萝卜素的量。
当八氢番茄红素去饱和酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质八氢番茄红素去饱和酶转化的八氢番茄红素或六氢番茄红素的量,或形成的六氢番茄红素或ζ-胡萝卜素的量也因之增加。
优选增加的八氢番茄红素去饱和酶活性至少为野生型八氢番茄红素去饱和酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的八氢番茄红素去饱和酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
将放射性标记的(14C)-八氢番茄红素插入不饱和胡萝卜素中能够测定八氢番茄红素去饱和酶(PDS)的活性(根据R_mer,Fraser,Kiano,Shipton,Misawa,Schuch和Bramley Elevation of the provitamin A content oftransgenic tomato plants;Nature Biotechnology 18(2000)666-669)。可如Fraser所述合成放射性标记的八氢番茄红素(Fraser,De la Rivas,Mackenzie,BramleyPhycomyces blakesleanus CarB mutantstheir use inassays of phytoene desaturase;Phytochemistry 30(1991),3971-3976)。可在含有10mM MgCl2和1mM二硫苏糖醇的100mM MES缓冲液(pH 6.0)(总体积为1ml)中孵育靶组织的质体膜。加入溶于丙酮中的(14C)八氢番茄红素(每例中每次孵育约100000裂变/分钟),其中丙酮浓度不超过5%(v/v)。将混合物在28℃下暗处振荡孵育约6-7小时。随后,用约5ml石油醚(与10%乙醚混合)抽提色素三次并通过HPLC法分离并定量。
或者,可根据Fraser等(Fraser,Misawa,Linden,Yamano,Kobayashi和SandmannExpression in Escherichia coli,purification,and reactivationof the recombinant Erwinia uredovora phytoene desaturase,Journal ofBiological Chemistry 267(1992),19891-19895)的方法,测定八氢番茄红素去饱和酶的活性。
ζ-胡萝卜素去饱和酶活性是指ζ-胡萝卜素去饱和酶的酶活性。
ζ-胡萝卜素去饱和酶是指一种蛋白质,其具有将ζ-胡萝卜素转化为四氢番茄红素和/或将四氢番茄红素转化为番茄红素的酶活性。
据此,ζ-胡萝卜素去饱和酶活性是指在一定时间内由蛋白质ζ-胡萝卜素去饱和酶转化的ζ-胡萝卜素或四氢番茄红素的量或形成的四氢番茄红素或番茄红素的量。
当ζ-胡萝卜素去饱和酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质ζ-胡萝卜素去饱和酶转化的ζ-胡萝卜素或四氢番茄红素的量,或形成的四氢番茄红素或番茄红素的量也因之增加。
优选增加的ζ-胡萝卜素去饱和酶活性至少为野生型ζ-胡萝卜素去饱和酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的ζ-胡萝卜素去饱和酶活性在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
可在0.2M磷酸钾(pH 7.8,缓冲液体积大约1ml)中进行测定ζ-胡萝卜素去饱和酶(ZDS去饱和酶)的分析。其分析方法已由Breitenbach及其同事发表(Breitenbach,Kuntz,Takaichi和SandmannCatalytic propertiesof an expressed and purified higher plant type ζ-carotene desaturase fromCapsicum annuum;European Journal of Biochemistry.265(1)376-383,1999)。每种分析混合物含有3mg悬浮于0.4M磷酸钾缓冲液(pH 7.8)中的磷脂酰胆碱、5μgζ-胡萝卜素或四氢番茄红素、0.02%丁基羟基甲苯、10μl癸基质体醌(1mM甲醇贮存液)及生物提取物。生物提取物的体积需根据存在的ZDS去饱和酶活性进行调节,以便能在线性测量范围内进行定量。孵育一般在暗处、约28℃下,剧烈振荡(200转/分钟)进行约17小时。加入4ml丙酮在50℃时振荡10分钟抽提类胡萝卜素。将类胡萝卜素从该混合物转移至石油醚相(含有10%乙醚)。在氮气中蒸发乙醚/石油醚相,将类胡萝卜素重新溶为20μl并通过HPLC法进行分离和定量。
crtISO活性是指crtISO蛋白的酶活性。
crtISO蛋白是指一种蛋白质,其具有将7,9,7’,9’-四顺式番茄红素转化为全反式番茄红素的酶活性。
据此,crtISO活性是指在一定时间内由蛋白质crtISO转化的7,9,7’,9’-四顺式番茄红素的量或形成的全反式番茄红素的量。
当crtISO活性相对于野生型增加时,与野生型相比,在一定时间内由crtISO蛋白转化的7,9,7’,9’-四顺式番茄红素的量或形成的全反式番茄红素的量也因之增加。
优选增加的crtISO活性至少为野生型crtISO活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
FtsZ活性是指FtsZ蛋白的生理学活性。
FtsZ蛋白是指一种蛋白质,其具有促进细胞分裂和质体分裂的活性,且与微管蛋白质同源。
MinD活性是指MinD蛋白的生理学活性。
MinD蛋白是指一种在细胞分裂中具有多功能作用的蛋白质。它是一种膜相关ATP酶并且在细胞内可表现为从一极到另一极的振动运动。
另外,非甲羟戊酸途径的酶活性的增加能够导致目的酮类胡萝卜素终产物的进一步增加。其实例包括,4-二磷酸胞苷(diphosphocytidyl)-2-C-甲基-D-赤藓醇合酶、4-二磷酸胞苷-2-C-甲基-D-赤藓醇激酶和2-C-甲基-D-赤藓醇-2,4-环二磷酸酯合酶。通过修饰相应基因的基因表达,可以提高所述酶的活性。以标准方式通过抗体和相应印迹技术能够检测相应蛋白质的浓度改变。
可以通过多种途径,增加HMG-CoA还原酶活性和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性和/或1-脱氧-D-木糖-5-磷酸合酶活性和/或1-脱氧-D-木糖-5-磷酸还原异构酶活性和/或异戊烯基二磷酸酯Δ-异构酶活性和/或牻牛儿基二磷酸酯合酶活性和/或法呢基二磷酸酯合酶活性和/或牻牛儿基牻牛儿基二磷酸酯合酶活性和/或八氢番茄红素合酶活性和/或八氢番茄红素去饱和酶活性和/或ζ-胡萝卜素去饱和酶活性和/或crtISO活性和/或FtsZ活性和/或MinD活性,例如通过在表达和蛋白质水平关闭抑制性调节机制,或通过提高编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸相对于野生型的基因表达。
也可通过多种途径提高编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸相对于野生型的基因表达,例如通过活化剂诱导HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或Fts基因和/或MinD基因,或者通过插入一个或多个拷贝的HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或Fts基因和/或MinD基因,即向植物中插入至少一个编码HMG-CoA还原酶的核酸和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或至少一个编码牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码法呢基二磷酸酯合酶的核酸和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码八氢番茄红素合酶的核酸和/或至少一个编码八氢番茄红素去饱和酶的核酸和/或至少一个编码ζ-胡萝卜素去饱和酶的核酸和/或至少一个编码crtISO蛋白的核酸和/或至少一个编码FtsZ蛋白的核酸和/或至少一个编码MinD蛋白的核酸。
根据本发明,编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸的基因表达的增加,也指对该生物自身的内源HMG-CoA还原酶和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和/或1-脱氧-D-木糖-5-磷酸合酶和/或1-脱氧-D-木糖-5-磷酸还原异构酶和/或异戊烯基二磷酸酯Δ-异构酶和/或牻牛儿基二磷酸酯合酶和/或法呢基二磷酸酯合酶和/或牻牛儿基牻牛儿基二磷酸酯合酶和/或八氢番茄红素合酶和/或八氢番茄红素去饱和酶和/或ζ-胡萝卜素去饱和酶和/或crtISO蛋白和/或FtsZ蛋白和/或MinD蛋白表达的调控。
这一点可以通过如修饰相应启动子DNA序列来实现。这一修饰可以通过DNA序列的缺失或插入来实现,从而增加该基因的表达率。
在优选实施方案中,编码HMG-CoA还原酶核酸的基因表达的增加和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶核酸的基因表达的增加和/或编码1-脱氧-D-木糖-5-磷酸合酶核酸的基因表达的增加和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶核酸的基因表达的增加和/或编码异戊烯基二磷酸酯Δ-异构酶核酸的基因表达的增加和/或编码牻牛儿基二磷酸酯合酶核酸的基因表达的增加和/或编码法呢基二磷酸酯合酶核酸的基因表达的增加和/或编码牻牛儿基牻牛儿基二磷酸酯合酶核酸的基因表达的增加和/或编码八氢番茄红素合酶核酸的基因表达的增加和/或编码八氢番茄红素去饱和酶核酸的基因表达的增加和/或编码ζ-胡萝卜素去饱和酶核酸的基因表达的增加和/或编码crtISO蛋白核酸的基因表达的增加和/或编码FtsZ蛋白核酸的基因表达的增加和/或编码MinD蛋白核酸的基因表达的增加是通过向植物中插入至少一个编码HMG-CoA还原酶的核酸和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或至少一个编码牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码法呢基二磷酸酯合酶的核酸和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码八氢番茄红素合酶的核酸和/或至少一个编码八氢番茄红素去饱和酶的核酸和/或至少一个编码ζ-胡萝卜素去饱和酶的核酸和/或至少一个编码crtISO蛋白的核酸和/或至少一个编码FtsZ蛋白的核酸和/或至少一个编码MinD蛋白的核酸而实现。
为此,原则上可以使用任何HMG-CoA还原酶基因或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因或1-脱氧-D-木糖-5-磷酸合酶基因或1-脱氧-D-木糖-5-磷酸还原异构酶基因或异戊烯基二磷酸酯Δ-异构酶基因或牻牛儿基二磷酸酯合酶基因或法呢基二磷酸酯合酶基因或牻牛儿基牻牛儿基二磷酸酯合酶基因或八氢番茄红素合酶基因或八氢番茄红素去饱和酶基因或ζ-胡萝卜素去饱和酶基因或crtISO基因或FtsZ基因或MinD基因。
对于真核生物来源的含有内含子的基因组HMG-CoA还原酶序列或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶序列或1-脱氧-D-木糖-5-磷酸合酶序列或1-脱氧-D-木糖-5-磷酸还原异构酶序列或异戊烯基二磷酸酯Δ-异构酶序列或牻牛儿基二磷酸酯合酶序列或法呢基二磷酸酯合酶序列或牻牛儿基牻牛儿基二磷酸酯合酶序列或八氢番茄红素合酶序列或八氢番茄红素去饱和酶序列或ζ-胡萝卜素去饱和酶序列或crtISO序列或FtsZ序列或MinD序列,在宿主生物不能或不能通过改造来表达相应酮酶时,优选使用已经加工的核酸序列,如相应的cDNA。
该优选的实施方案中,与野生型相比,本发明优选的转基因生物中至少还存在另一个HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或FtsZ基因和/或MinD基因。
在该优选实施方案中,遗传修饰的植物具有,例如至少一个编码HMG-CoA还原酶的外源核酸或至少两个编码HMG-CoA还原酶的内源核酸,和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的外源核酸或至少两个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的内源核酸,和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的外源核酸或至少两个编码1-脱氧-D-木糖-5-磷酸合酶的内源核酸,和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的外源核酸或至少两个编码1-脱氧-D-木糖-5-磷酸还原异构酶的内源核酸,和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的外源核酸或至少一个编码异戊烯基二磷酸酯Δ-异构酶的内源核酸,和/或至少一个编码牻牛儿基二磷酸酯合酶的外源核酸或至少两个编码牻牛儿基二磷酸酯合酶的内源核酸,和/或至少一个编码法呢基二磷酸酯合酶的外源核酸或至少两个编码法呢基二磷酸酯合酶的内源核酸,和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的外源核酸或至少两个编码牻牛儿基牻牛儿基二磷酸酯合酶的内源核酸,和/或至少一个编码八氢番茄红素合酶的外源核酸或至少一个编码八氢番茄红素合酶的内源核酸,和/或至少一个编码八氢番茄红素去饱和酶的外源核酸或至少两个编码八氢番茄红素去饱和酶的内源核酸,和/或至少一个编码ζ-胡萝卜素去饱和酶的外源核酸或至少两个编码ζ-胡萝卜素去饱和酶的内源核酸,和/或至少一个编码crtISO蛋白的外源核酸或至少两个编码crtISO蛋白的内源核酸,和/或至少一个编码FtsZ蛋白的外源核酸或至少两个编码FtsZ蛋白的内源核酸,和/或至少一个编码MinD蛋白的外源核酸或至少两个编码MinD蛋白的内源核酸。
HMG-CoA还原酶基因的实例为拟南芥(Arabidopsis thaliana)来源的编码HMG-CoA还原酶的核酸,登录号NM_106299(核酸SEQ ID NO7,蛋白质SEQ ID NO8),还包括其他生物来源的登录号如下的其他HMG-CoA还原酶基因P54961、P54870、P54868、P54869、O02734、P22791、P54873、P54871、P23228、P13704、P54872、Q01581、P17425、P54874、P54839、P14891、P34135、O64966、P29057、P48019、P48020、P12683、P43256、Q9XEL8、P34136、O64967、P29058、P48022、Q41437、P12684、Q00583、Q9XHL5、Q41438、Q9YAS4、O76819、O28538、Q9Y7D2、P54960、O51628、P48021、Q03163、P00347、P14773、Q12577、Q59468、P04035、O24594、P09610、Q58116、O26662、Q01237、Q01559、Q12649、O74164、O59469、P51639、Q10283、O08424、P20715、P13703、P13702、Q96UG4、Q8SQZ9、O15888、Q9TUM4、P93514、Q39628、P93081、P93080、Q944T9、Q40148、Q84MM0、Q84LS3、Q9Z9N4、Q9KLM0。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的实例为拟南芥来源的编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸(lytB/ISPH),登录号AY168881,(核酸SEQ ID NO9,蛋白质SEQ ID NO102),还包括其他生物来源的登录号如下的其他(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因T04781、AF270978_1、NP_485028.1、NP_442089.1、NP_681832.1、ZP_00110421.1、ZP_00071594.1、ZP_00114706.1、ISPH_SYNY3、ZP_00114087.1、ZP_00104269.1、AF398145_1、AF398146_1、AAD55762.1、AF514843_1、NP_622970.1、NP_348471.1、NP_562001.1、NP_223698.1、NP_781941.1、ZP_00080042.1、NP_859669.1、NP_214191.1、ZP_00086191.1、ISPH_VIBCH、NP_230334.1、NP_742768.1、NP_302306.1、ISPH_MYCLE、NP_602581.1、ZP_00026966.1、NP_520563.1、NP_253247.1、NP_282047.1、ZP_00038210.1、ZP_00064913.1、CAA61555.1、ZP_00125365.1、ISPH_ACICA、EAA24703.1、ZP_00013067.1、ZP_00029164.1、NP_790656.1、NP_217899.1、NP_641592.1、NP_636532.1、NP_719076.1、NP_660497.1、NP_422155.1、NP_715446.1、ZP_00090692.1、NP_759496.1、ISPH_BURPS、ZP_00129657.1、NP_215626.1、NP_335584.1、ZP_00135016.1、NP_789585.1、NP_787770.1、NP_769647.1、ZP_00043336.1、NP_242248.1、ZP_00008555.1、NP_246603.1、ZP_00030951.1、NP_670994.1、NP_404120.1、NP_540376.1、NP_733653.1、NP_697503.1、NP_840730.1、NP_274828.1、NP_796916.1、ZP_00123390.1、NP_824386.1、NP_737689.1、ZP_00021222.1、NP_757521.1、NP_390395.1、ZP_00133322.1、CAD76178.1、NP_600249.1、NP_454660.1、NP_712601.1、NP_385018.1、NP_751989.1。
1-脱氧-D-木糖-5-磷酸合酶基因的实例为食用番茄(Lycopersicon esculentum)来源的编码1-脱氧-D-木糖-5-磷酸合酶的核酸,登录号#AF143812(核酸SEQ ID NO103,蛋白质SEQ IDNO12),还包括其他生物体来源的登录号如下的其他1-脱氧-D-木糖-5-磷酸合酶基因AF143812_1、DXS_CAPAN、CAD22530.1、AF182286_1、NP_193291.1、T52289、AAC49368.1、AAP14353.1、D71420、DXS_ORYSA、AF443590_1、BAB02345.1、CAA09804.2、NP_850620.1、CAD22155.2、AAM65798.1、NP_566686.1、CAD22531.1、AAC33513.1、CAC08458.1、AAG10432.1、T08140、AAP14354.1、AF428463_1、ZP_00010537.1、NP_769291.1、AAK59424.1、NP_107784.1、NP_697464.1、NP_540415.1、NP_196699.1、NP_384986.1、ZP_00096461.1、ZP_00013656.1、NP_353769.1、BAA83576.1、ZP_00005919.1、ZP_00006273.1、NP_420871.1、AAM48660.1、DXS_RHOCA、ZP_00045608.1、ZP_00031686.1、NP_841218.1、ZP_00022174.1、ZP_00086851.1、NP_742690.1、NP_520342.1、ZP_00082120.1、NP_790545.1、ZP_00125266.1、CAC17468.1、NP_252733.1、ZP_00092466.1、NP_439591.1、NP_414954.1、NP_752465.1、NP_622918.1、NP_286162.1、NP_836085.1、NP_706308.1、ZP_00081148.1、NP_797065.1、NP_213598.1、NP_245469.1、ZP_00075029.1、NP_455016.1、NP_230536.1、NP_459417.1、NP_274863.1、NP_283402.1、NP_759318.1、NP_406652.1、DXS_SYNLE、DXS_SYNP7、NP_440409.1、ZP_00067331.1、ZP_00122853.1、NP_717142.1、ZP_00104889.1、NP_243645.1、NP_681412.1、DXS_SYNEL、NP_637787.1、DXS_CHLTE、ZP_00129863.1、NP_661241.1、DXS_XANCP、NP_470738.1、NP_484643.1、ZP_00108360.1、NP_833890.1、NP_846629.1、NP_658213.1、NP_642879.1、ZP_00039479.1、ZP_00060584.1、ZP_00041364.1、ZP_00117779.1、NP_299528.1。
1-脱氧-D-木糖-5-磷酸还原异构酶基因的实例为拟南芥来源的编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸,登录号#AF148852,(核酸SEQ ID NO13,蛋白质SEQ ID NO14),还包括其他生物体来源的登录号如下的其他1-脱氧-D-木糖-5-磷酸还原异构酶基因AF148852、AY084775、AY054682、AY050802、AY045634、AY081453、AY091405、AY098952、AJ242588、AB009053、AY202991、NP_201085.1、T52570、AF331705_1、BAB16915.1、AF367205_1、AF250235_1、CAC03581.1、CAD22156.1、AF182287_1、DXR_MENPI、ZP_00071219.1、NP_488391.1、ZP_00111307.1、DXR_SYNLE、AAP56260.1、NP_681831.1、NP_442113.1、ZP_00115071.1、ZP_00105106.1、ZP_00113484.1、NP_833540.1、NP_657789.1、NP_661031.1、DXR_BACHD、NP_833080.1、NP_845693.1、NP_562610.1、NP_623020.1、NP_810915.1、NP_243287.1、ZP_00118743.1、NP_464842.1、NP_470690.1、ZP_00082201.1、NP_781898.1、ZP_00123667.1、NP_348420.1、NP_604221.1、ZP_00053349.1、ZP_00064941.1、NP_246927.1、NP_389537.1、ZP_00102576.1、NP_519531.1、AF124757_19、DXR_ZYMMO、NP_713472.1、NP_459225.1、NP_454827.1、ZP_00045738.1、NP_743754.1、DXR_PSEPK、ZP_00130352.1、NP_702530.1、NP_841744.1、NP_438967.1、AF514841_1、NP_706118.1、ZP_00125845.1、NP_404661.1、NP_285867.1、NP_240064.1、NP_414715.1、ZP_00094058.1、NP_791365.1、ZP_00012448.1、ZP_00015132.1、ZP_00091545.1、NP_629822.1、NPP_798691.1、NP_231885.1、NP_252340.1、ZP_00022353.1、NP_355549.1、NP_420724.1、ZP_00085169.1、EAA17616.1、NP_273242.1、NP_219574.1、NP_387094.1、NP_296721.1、ZP_00004209.1、NP_823739.1、NP_282934.1、BAA77848.1、NP_660577.1、NP_760741.1、NP_641750.1、NP_636741.1、NP_829309.1、NP_298338.1、NP_444964.1、NP_717246.1、NP_224545.1、ZP_00038451.1、DXR_KITGR、NP_778563.1。
异戊烯基二磷酸酯Δ-异构酶基因的实例为巴勒斯提纳侧金盏花(Adonis palaestina)克隆ApIPI28来源的编码异戊烯基二磷酸酯Δ-异构酶的核酸(ipiAa1),登录号#AF188060,由Cunningham、F.X.Jr.和Gantt,E.发表Identification of multi-gene familiesencoding isopentenyl diphosphate isomerase in plants by heterologouscomplementation in Escherichia coli,Plant Cell Physiol.41(1)、119-123(2000)(核酸SEQ ID NO15,蛋白质SEQ ID NO16),还包括其他生物体来源的登录号如下的其他异戊烯基二磷酸酯Δ-异构酶基因Q38929、O48964、Q39472、Q13907、O35586、P58044、O42641、O35760、Q10132、P15496、Q9YB30、Q8YNH4、Q42553、O27997、P50740、O51627、O48965、Q8KFR5、Q39471、Q39664、Q9RVE2、Q01335、Q9HHE4、Q9BXS1、Q9KWF6、Q9CIF5、Q88WB6、Q92BX2、Q8Y7A5、Q8TT35 Q9KK75、Q8NN99、Q8XD58、Q8FE75、Q46822、Q9HP40、P72002、P26173、Q9Z5D3、Q8Z3X9、Q8ZM82、Q9X7Q6、O13504、Q9HFW8、Q8NJL9、Q9UUQ1、Q9NH02、Q9M6K9、Q9M6K5、Q9FXR6、O81691、Q9S7C4、Q8S3L8、Q9M592、Q9M6K3、Q9M6K7、Q9FV48、Q9LLB6、Q9AVJ1、Q9AVG8、Q9M6K6、Q9AVJ5、Q9M6K2、Q9AYS5、Q9M6K8、Q9AVG7、Q8S3L7、Q8W250、Q94IE 1、Q9AVI8、Q9AYS6、Q9SAY0、Q9M6K4、Q8GVZ0、Q84RZ8、Q8KZ12、Q8KZ66、Q8FND7、Q88QC9、Q8BFZ6、BAC26382、CAD94476。
牻牛儿基二磷酸酯合酶基因的实例为拟南芥来源的编码牻牛儿基二磷酸酯合酶的核酸,登录号#Y17376,Bouvier,F.、Suire,C.、d’Harlingue,A.、Backhaus,R.A.和Camara,B.Molecular cloning of geranyl phosphate synthase and compartmentation ofmonoterpene synthesis in plant cells,Plant J.24(2),241-252(2000)(核酸SEQ ID NO17,蛋白质SEQ ID NO18),还包括其他生物体来源的登录号如下的其他牻牛儿基二磷酸酯合酶基因Q9FT89、Q8LKJ2、Q9FSW8、Q8LKJ3、Q9SBR3、Q9SBR4、Q9FET8、Q8LKJ1、Q84LG1、Q9JK86。
法呢基二磷酸酯合酶基因的实例为拟南芥来源的编码法呢基二磷酸酯合酶的核酸(FPS1),登录号#U80605,发表于Cunillera,N.、Arro,M.、Delourme,D.、Karst,E、Boronat,A.和Ferrer,A.Arabidopsis thaliana contains two differentially expressedfarnesyl phosphate synthase genes,J.Biol Chem.271(13),7774-7780(1996)(核酸SEQ ID NO19,蛋白质SEQ ID NO112),还包括其他生物体来源的登录号如下的其他法呢基二磷酸酯合酶基因P53799、P37268、Q02769、Q09152、P49351、O24241、Q43315、P49352、O24242、P49350、P08836、P14324、P49349、P08524、O66952、Q08291、P54383、Q45220、P57537、Q8K9A0、P22939、P45204、O66126、P55539、Q9SWH9、Q9AVI7、Q9FRX2、Q9AYS7、Q94IE8、Q9FXR9、Q9ZWF6、Q9FXR8、Q9AR37、O50009,Q94IE9,Q8RVK7、Q8RVQ7、O04882、Q93RA8、Q93RB0、Q93RB4、Q93RB5,Q93RB3、Q93RB1、Q93RB2、Q920E5。
牻牛儿基牻牛儿基二磷酸酯合酶基因的实例为白芥(Sinapis alba)来源的编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸,登录号#X98795,发表于Bonk,M.、Hoffmann,B.、Von Lintig,J.、Schledz,M.、Al-Babili,S.、Hobeika,E.、Kleinig,H.和Beyer,P.Chloroplastimport of four carotenoid biosynthetic enzymes in vitro reveals differentialfates prior to membrane binding and oligomeric assembly,Eur.J.Biochem.247(3),942-950(1997)(核酸SEQ ID NO21,蛋白质SEQ ID NO114),还包括其他生物体来源的登录号如下的其他牻牛儿基牻牛儿基二磷酸酯合酶基因P22873、P34802,P56966、P80042、Q42698、Q92236、O95749、Q9WTN0、Q50727、P24322、P39464、Q9FXR3、Q9AYN2、Q9FXR2、Q9AVG6、Q9FRW4、Q9SXZ5、Q9AVJ7、Q9AYN1、Q9AVJ4、Q9FXR7、Q8LSC5、Q9AVJ6、Q8LSC4、Q9AVJ3、Q9SSU0、Q9SXZ6、Q9SST9、Q9AVJ0、Q9AVI9、Q9FRW3、Q9FXR5、Q94IF0、Q9FRX1、Q9K567、Q93RA9、Q93QX8、CAD95619、EAA31459。
八氢番茄红素合酶基因的实例为噬夏孢欧文菌(Erwinia uredovora)来源的编码八氢番茄红素合酶的核酸,登录号#D90087,发表于Misawa,N.、Nakagawa,M.、Kobayashi,K.、Yamano,S.、Izawa,Y.、Nakamura,K.和Harashima,K.Elucidation of theErwinia uredovora carotenoid biosynthetic pathway by functional analysisof gene products expressed in Escherichia coli;J.Bacteriol.172(12),6704-6712(1990)(核酸SEQ ID NO23,蛋白质SEQ ID NO24),还包括其他生物体来源的登录号如下的其他八氢番茄红素合酶基因CAB39693、BAC69364、AAF10440、CAA45350、BAA20384、AAM72615、BAC09112、CAA48922、P_001091、CAB84588、AAF41518、CAA48155、AAD38051、AAF33237、AAG10427、AAA34187、BAB73532、CAC19567、AAM62787、CAA55391、AAB65697、AAM45379、CAC27383、AAA32836、AAK07735、BAA84763、P_000205、AAB60314、P_001163、P_000718、AAB71428、AAA34153、AAK07734、CAA42969、CAD76176、CAA68575、P_000130、P_001142、CAA47625、CAA85775、BAC14416、CAA79957、BAC76563、P_000242、P_000551、AAL02001、AAK15621、CAB94795、AAA91951、P_000448。
八氢番茄红素去饱和酶基因的实例为
噬夏孢欧文菌来源的编码八氢番茄红素去饱和酶的核酸,登录号#D90087;发表于Misawa,N.、Nakagawa,M.、Kobayashi,K.、Yamano,S.、Izawa,Y.、Nakamura,K.和Harashima,K.Elucidation of the Erwiniauredovora carotenoid biosynthetic pathway by functional analysis of geneproducts expressed in Escherichia coli;J.Bacteriol. 172(12),6704-6712(1990)(核酸SEQ ID NO25,蛋白质SEQ ID NO26),还包括其他生物体来源的登录号如下的其他八氢番茄红素去饱和酶基因AAL15300、A39597、CAA42573、AAK51545、BAB08179、CAA48195、BAB82461、AAK92625、CAA55392、AAG10426、AAD02489、AAO24235、AAC12846、AAA99519、AAL38046、CAA60479、CAA75094、ZP_001041、ZP_001163、CAA39004、CAA44452、ZP_001142、ZP_000718、BAB82462、AAM45380、CAB56040、ZP_001091、BAC09113、AAP79175、AAL80005、AAM72642、AAM72043、ZP_000745、ZP_001141、BAC07889、CAD55814、ZP_001041、CAD27442、CAE00192、ZP_001163、ZP_000197、BAA18400、AAG10425、ZP_001119、AAF13698、2121278A、AAB35386、AAD02462、BAB68552、CAC85667、AAK51557、CAA12062、AAG51402、AAM63349、AAF85796、BAB74081、AAA91161、CAB56041、AAC48983、AAG14399、CAB65434、BAB73487、ZP_001117、ZP_000448、CAB39695、CAD76175、BAC69363、BAA17934、ZP_000171、AAF65586、ZP_000748、BAC07074、ZP_001133、CAA64853、BAB74484、ZP_001156、AAF23289、AAG28703、AAP09348、AAM71569、BAB69140、ZP_000130、AAF41516、AAG18866、CAD95940、NP_656310、AAG10645、ZP_000276、ZP_000192、ZP_000186、AAM94364、EAA31371、ZP_000612、BAC75676、AAF65582。
ζ-胡萝卜素去饱和酶基因的实例为黄水仙(Narcissus pseudonarcissus)来源的编码ζ-胡萝卜素去饱和酶的核酸,登录号#AJ224683,发表于Al-Babili,S.、Oelschlegel,J.和Beyer,P.A cDNA encoding for beta carotene desaturase(Aceession No.AJ224683)from Narcissus pseudonarcissus L..(PGR98-103),Plant Physiol.117,719-719(1998)(核酸SEQ ID NO119,蛋白质SEQ ID NO28),还包括其他生物体来源的登录号如下的其他ζ-胡萝卜素去饱和酶基因Q9R6X4、Q38893、Q9SMJ3、Q9SE20、Q9ZTP4、O49901、P74306、Q9FV46、Q9RCT2、ZDS_NARPS、BAB68552.1、CAC85667.1、AF372617_1、ZDS_TARER、CAD55814.1、CAD27442.1、2121278A、ZDS_CAPAN、ZDS_LYCES、NP_187138.1、AAM63349.1、ZDS_ARATH、AAA91161.1、ZDS_MAIZE、AAG14399.1、NP_441720.1、NP_486422.1、ZP_00111920.1、CAB56041.1、ZP_00074512.1、ZP_00116357.1、NP_681127.1、ZP_00114185.1、ZP_00104126.1、CAB65434.1、NP_662300.1。
crtISO基因的实例为食用番茄来源的编码crtISO的核酸;登录号#AF416727,发表于Isaacson,T.、Ronen,G.、Zamir,D.和Hirschberg,J.Cloning of tangerinefrom tomato reveals a carotenoid isomerase essential for the production ofbeta-carotene and xanthophylls in plants;Plant Cell 14(2),333-342(2002)(核酸SEQ ID NO29,蛋白质SEQ ID NO122),还包括其他生物体来源的登录号如下的其他crtISO基因AAM53952FtsZ基因的实例为万寿菊来源的编码FtsZ的核酸,登录号#AF251346,发表于Moehs,C.P.、Tian,L.、Osteryoung,K.W.和Dellapenna,D.Analysis of carotenoidbiosynthetic gene expression during marigold petal development;PlantMol.Biol.45(3),281-293(2001)(核酸SEQ ID NO31,蛋白质SEQ IDNO32),还包括其他生物体来源的登录号如下的其他FtsZ基因CAB89286.1、AF205858_1、NP_200339.1、CAB89287.1、CAB41987.1、AAA82068.1、T06774,AF383876_1、BAC57986.1、CAD22047.1、BAB91150.1、ZP_00072546.1、NP_440816.1、T51092、NP_683172.1、BAA85116.1、NP_487898.1、JC4289、BAA82871.1、NP_781763.1、BAC57987.1、ZP_00111461.1、T51088、NP_190843.1、ZP_00060035.1、NP_846285.1、AAL07180.1、NP_243424.1、NP_833626.1、AAN04561.1、AAN04557.1、CAD22048.1、T51089、NP_692394.1、NP_623237.1、NP_565839.1、T51090、CAA07676.1、NP_113397.1、T51087、CAC44257.1、E84778、ZP_00105267.1、BAA82091.1、ZP_00112790.1、BAA96782.1、NP_348319.1、NP_471472.1、ZP_00115870.1、NP_465556.1、NP_389412.1、BAA82090.1、NP_562681.1、AAM22891.1、NP_371710.1、NP_764416.1、CAB95028.1、FTSZ_STRGR、AF120117_1、NP_827300.1、JE0282、NP_626341.1、AAC45639.1、NP_785689.1、NP_336679.1、NP_738660.1、ZP_00057764.1、AAC32265.1、NP_814733.1、FTSZ_MYCKA、NP_216666.1、CAA75616.1、NP_301700.1、NP_601357.1、ZP_00046269.1、CAA70158.1、ZP_00037834.1、NP_268026.1、FTSZ_ENTHR、NP_787643.1、NP_346105.1、AAC32264.1、JC5548、AAC95440.1、NP_710793.1、NP_687509.1、NP_269594.1、AAC32266.1、NP_720988.1、NP_657875.1、ZP_00094865.1、ZP_00080499.1、ZP_00043589.1、JC7087、NP_660559.1、AAC46069.1、AF179611_14、AAC44223.1、NP_404201.1。
MinD基因的实例为万寿菊来源的编码MinD的核酸,登录号#AF251019,发表于Moehs,C.P.、Tian,L.、Osteryoung,K.W.和Dellapenna,D.Analysis of carotenoidbiosynthetic gene expression during marigold petal development;PlantMol.Biol.45(3),281-293(2001)(核酸SEQ ID NO33,蛋白质SEQ IDNO34),还包括其他生物体来源的登录号如下的其他MinD基因NP_197790.1、BAA90628.1、NP_038435.1、NP_045875.1、AAN33031.1、NP_050910.1、CAB53105.1、NP_050687.1、NP_682807.1、NP_487496.1、ZP_00111708.1、ZP_00071109.1、NP_442592.1、NP_603083.1、NP_782631.1、ZP_00097367.1、ZP_00104319.1、NP_294476.1、NP_622555.1、NP_563054.1、NP_347881.1、ZP_00113908.1、NP_834154.1、NP_658480.1、ZP_00059858.1、NP_470915.1、NP_243893.1、NP_465069.1、ZP_00116155.1、NP_390677.1、NP_692970.1、NP_298610.1、NP_207129.1、ZP_00038874.1、NP_778791.1、NP_223033.1、NP_641561.1、NP_636499.1、ZP_00088714.1、NP_213595.1、NP_743889.1、NP_231594.1、ZP_00085067.1、NP_797252.1、ZP_00136593.1、NP_251934.1、NP_405629.1、NP_759144.1、ZP_00102939.1、NP_793645.1、NP_699517.1、NP_460771.1、NP_860754.1、NP_456322.1、NP_718163.1、NP_229666.1、NP_357356.1、NP_541904.1、NP_287414.1、NP_660660.1、ZP_00128273.1、NP_103411.1、NP_785789.1、NP_715361.1、AF149810_1、NP_841854.1、NP_437893.1、ZP_00022726.1、EAA24844.1、ZP_00029547.1、NP_521484.1、NP_240148.1、NP_770852.1、AF345908_2、NP_777923.1、ZP_00048879.1、NP_579340.1、NP_143455.1、NP_126254.1、NP_142573.1、NP_613505.1、NP_127112.1、NP_712786.1、NP_578214.1、NP_069530.1、NP_247526.1、AAA85593.1、NP_212403.1、NP_782258.1、ZP_00058694.1、NP_247137.1、NP_219149.1、NP_276946.1、NP_614522.1、ZP_00019288.1、CAD78330.1。
上述优选的实施方案中优选使用的HMG-CoA还原酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO8氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO8序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有HMG-CoA还原酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现HMG-CoA还原酶和HMG-CoA还原酶基因的其他实例,例如如上所述比较含有SEQ ID NO8的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO7序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它HMG-CoA还原酶和HMG-CoA还原酶基因的实例。
在另一个特别优选的实施方案中,为增加HMG-CoA还原酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO8的HMG-CoA还原酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO7序列的核酸插入生物中。
上述优选实施方案中优选使用的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO10氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO10序列在氨基酸水平上的同一性为至少30%、优选至少50%,更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的其他实例,例如如上所述比较含有SEQ ID NO10的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO9序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的实例。
在另一个特别优选的实施方案中,为增加(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO10的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO9序列的核酸插入生物中。
上述优选实施方案中优选使用的1-脱氧-D-木糖-5-磷酸合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO12氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ IDNO12序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有1-脱氧-D-木糖-5-磷酸合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现1-脱氧-D-木糖-5-磷酸合酶和1-脱氧-D-木糖-5-磷酸合酶基因的其他实例,例如如上所述比较含有SEQ ID NO12的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO11序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它1-脱氧-D-木糖-5-磷酸合酶和1-脱氧-D-木糖-5-磷酸合酶基因的实例。
在另一个特别优选的实施方案中,为增加1-脱氧-D-木糖-5-磷酸合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ IDNO12的1-脱氧-D-木糖-5-磷酸合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO11序列的核酸插入生物中。
上述优选实施方案中优选使用的1-脱氧-D-木糖-5-磷酸还原异构酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO14氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO14序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有1-脱氧-D-木糖-5-磷酸还原异构酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现1-脱氧-D-木糖-5-磷酸还原异构酶和1-脱氧-D-木糖-5-磷酸还原异构酶基因的其他实例,例如如上所述比较含有SEQ ID NO14的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO13序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它1-脱氧-D-木糖-5-磷酸还原异构酶和1-脱氧-D-木糖-5-磷酸还原异构酶基因的实例。
在另一个特别优选的实施方案中,为增加1-脱氧-D-木糖-5-磷酸还原异构酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO14的1-脱氧-D-木糖-5-磷酸还原异构酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO13序列的核酸插入生物中。
上述优选实施方案中优选使用的异戊烯基-D-异构酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO16氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO16序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有异戊烯基-D-异构酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现异戊烯基-D-异构酶和异戊烯基-D-异构酶基因的其他实例,例如如上所述比较含有SEQ IDNO16的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO15序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它异戊烯基-D-异构酶和异戊烯基-D-异构酶基因的实例。
在另一个特别优选的实施方案中,为增加异戊烯基-D-异构酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO16的异戊烯基-D-异构酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO15序列的核酸插入生物中。
上述优选实施方案中优选使用的牻牛儿基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO18氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO18序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%;且所述蛋白质具有牻牛儿基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现牻牛儿基二磷酸酯合酶和牻牛儿基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQID NO18的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO17序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它牻牛儿基二磷酸酯合酶和牻牛儿基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加牻牛儿基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO18的牻牛儿基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO17序列的核酸插入生物中。
上述优选实施方案中优选使用的法呢基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO20氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO20序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有法呢基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现法呢基二磷酸酯合酶和法呢基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQ IDNO20的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO19序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它法呢基二磷酸酯合酶和法呢基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加法呢基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO20的法呢基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO19序列的核酸插入生物中。
上述优选实施方案中优选使用的牻牛儿基牻牛儿基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO22氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQID NO22序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有牻牛儿基牻牛儿基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现牻牛儿基牻牛儿基二磷酸酯合酶和牻牛儿基牻牛儿基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQ ID NO22的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO21序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它牻牛儿基牻牛儿基二磷酸酯合酶和牻牛儿基牻牛儿基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加牻牛儿基牻牛儿基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQID NO22的牻牛儿基牻牛儿基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO21序列的核酸插入生物中。
上述优选实施方案中优选使用的八氢番茄红素合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO24氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO24序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有八氢番茄红素合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现八氢番茄红素合酶和八氢番茄红素合酶基因的其他实例,例如如上所述比较含有SEQ ID NO24的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO23序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它八氢番茄红素合酶和八氢番茄红素合酶基因的实例。
在另一个特别优选的实施方案中,为增加八氢番茄红素合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO24的八氢番茄红素合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO23序列的核酸插入生物中。
上述优选实施方案中优选使用的八氢番茄红素去饱和酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO26氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO26序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有八氢番茄红素去饱和酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现八氢番茄红素去饱和酶和八氢番茄红素去饱和酶基因的其他实例,例如如上所述比较含有SEQID NO26的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO25序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它八氢番茄红素去饱和酶和八氢番茄红素去饱和酶基因的实例。
在另一个特别优选的实施方案中,为增加八氢番茄红素去饱和酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO26的八氢番茄红素去饱和酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO25序列的核酸插入生物中。
上述优选实施方案中优选使用的ζ-胡萝卜素去饱和酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO28氨基酸序列,或含有对该序列进行氢基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO28序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有ζ-胡萝卜素去饱和酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现ζ-胡萝卜素去饱和酶和ζ-胡萝卜素去饱和酶基因的其他实例,例如如上所述比较含有SEQ IDNO28的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO119序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它ζ-胡萝卜素去饱和酶和ζ-胡萝卜素去饱和酶基因的实例。
在另一个特别优选的实施方案中,为增加ζ-胡萝卜素去饱和酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO28的ζ-胡萝卜素去饱和酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO119序列的核酸插入生物中。
上述优选实施方案中优选使用的CrtISO基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO30氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO30序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有CrtIso的酶促性质。
可以从多种已知基因组序列的生物中容易地发现CrtISO和CrtISO基因的其他实例,例如如上所述比较含有SEQ ID NO30的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO29序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它CrtISO和CrtISO基因的实例。
在另一个特别优选的实施方案中,为增加CrtISO的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO30的CrtISO氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO29序列的核酸插入生物中。
上述优选实施方案中优选使用的FtsZ基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO32氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO32序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有FtsZ的酶促性质。
可以从多种已知基因组序列的生物中容易地发现FtsZn和FtsZ基因的其他实例,例如如上所述比较含有SEQ ID NO32的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO31序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它FtsZn和FtsZ基因的实例。
在另一个特别优选的实施方案中,为增加FtsZ的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO32的FtsZ氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获取合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO31序列的核酸插入生物中。
上述优选实施方案中优选使用的MinD基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO34氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO34序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有MinD的酶促性质。
可以从多种已知基因组序列的生物中容易地发现MinDn和MinD基因的其他实例,例如如上所述比较含有SEQ IDNO34的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO33序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它MinDn和MinD基因的实例。
在另一个特别优选的实施方案中,为增加MinD的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO34的MinD氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO33序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有HMG-CoA还原酶基因、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因、1-脱氧-D-木糖-5-磷酸合酶基因、1-脱氧-D-木糖-5-磷酸还原异构酶基因、异戊烯基二磷酸酯Δ-异构酶基因、牻牛儿基二磷酸酯合酶基因、法呢基二磷酸酯合酶基因、牻牛儿基牻牛儿基二磷酸酯合酶基因、八氢番茄红素合酶基因、八氢番茄红素去饱和酶基因、ζ-胡萝卜素去饱和酶基因、crtISO基因、FtsZ基因或MinD基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley Press New York,896-897页),可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloningA laboratorymanual》,Cold Spring Harbor Laboratory Press所述。
编码酮酶的核酸、编码β-羟化酶的核酸、编码β环化酶的核酸(含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性),以及编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸在以下也称为“作用基因”。
可以通过下述途径产生遗传修饰的非人生物,如插入含有一个作用基因的单个核酸构建体(表达盒)、或插入包含上至2个或3个作用基因或多于3个作用基因的多重构建体。
本发明的生物优选指野生型或起始生物时可天然产生或能够通过遗传互补和/或代谢途径的再调节生产类胡萝卜素(特别是β-胡萝卜素和/或玉米黄质和/或新叶黄素和/或紫黄质(violaxanthin)和/或叶黄素)的生物。
其他优选的生物在野生型或起始生物时已经具有羟化酶的活性,因此其野生型或起始生物即能产生玉米黄质。
优选生物为植物或微生物,例如,细菌、酵母、藻类或真菌。
使用的细菌可以是由于插入产类胡萝卜素生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(例如含有例如欧文氏菌(Erwinia)来源的crt基因的埃希氏杆菌属(Escherichia)细菌),以及自身即能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium)、产碱菌属、副球菌属、念珠藻属的细菌或集胞藻属的蓝细菌(Cyanobacteria))。
优选的细菌为大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwiniaherbicola)、噬夏孢欧文氏菌、橙黄农杆菌、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。
优选的酵母为假丝酵母(Candida)、酵母(Saccharomyces)、汉逊酵母(Hansenula)、毕赤酵母(Pichia)或法夫酵母(Phaffia)。特别优选的酵母为Xanthophyllomyces dendrorhous或Phaffia rhodozyma。
优选的真菌为曲霉(Aspergillus)、木霉(Trichoderma)、阿舒嚢霉(Ashbya)、脉孢菌(Neurospora)、布拉霉(特别是Blakeslea trispora)、须霉(Phycomyces)、镰孢霉(Fusarium)或如Indian Chem.Engr.B部分卷37,No.1,2(1995)15页,表6中描述的其它真菌。
优选的藻类有绿藻,如红球藻属(Haematococcus)、三角褐指藻(Phaedactylum tricornatum)、团藻属(Volvox)或杜氏藻属(Dunaliella)的藻类。特别优选的藻类有雨生红球藻或杜氏藻属巴德成藻(Dunaliellabardawil)。
其它可用于实施本发明方法的微生物及其生产,公开于如此处引用作为参考的DE-A-199 16 140。
特别优选的植物选自苋科(Amaranthaceae)、石蒜科(Amaryllidaceae)、夹竹桃科(Apocynaceae)、紫菀科(Asteraceae)、凤仙花科(Balsaminaceae)、秋海棠科(Begoniaceae)、小檗科(Berberidaceae)、十字花科(Brassicaceae)、大麻科(Cannabaceae)、忍冬科(Caprifoliaceae)、石竹科(Caryophyllaceae)、藜科(Chenopodiaceae)、菊科(Compositae)、葫芦科(Cucurbitaceae)、十字花科(Cruciferae)、大戟属(Euphorbiaceae)、豆科(Fabaceae)、龙胆科(Gentianaceae)、牻牛儿苗科(Geraniaceae)、禾本科(Graminae)、Illiaceae、唇形科(Labiatae)、薄荷科(Lamiaceae)、豆科(Leguminosae)、百合科(Liliaceae)、亚麻科(Linaceae)、山梗菜属(Lobeliaceae)、锦葵科(Malvaceae)、木犀科(Oleaceae)、兰科(Orchidaceae)、罂粟科(Papaveraceae)、白花丹科(Plumbaginaceae)、禾本科(Poaceae)、花荵科(Polemoniaceae)、报春花科(Primulaceae)、毛茛科(Ranunculaceae)、蔷薇科(Rosaceae)、茜草科(Rubiaceae)、玄参科(Scrophulariaceae)、茄科(Solanaceae)、旱金莲科(Tropaeolaceae)、伞状花科(Umbelliferae)、毛蕊花科(Verbanaceae)、葡萄科(Vitaceae)及紫罗兰科(Violaceae)。
极其优选的植物选自万寿菊属(Marigold、万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、金合欢属(Acacia)、乌头属(Aconitum)、侧金盏花属(Adonis)、阿尼菊属(Arnica)、耧斗菜属(Aquilegia)、紫菀属(Aster)、黄芪属(Astragalus)、紫葳属(Bignonia)、金盏花属(Calendula)、驴蹄草属(Caltha)、风铃草属(Campanula)、美人蕉属(Canna)、矢车菊属(Centaurea)、桂竹香属(Cheiranthus)、茼蒿属(Chrysanthemum)、柑桔属(Citrus)、还阳参属(Crepis)、番红花属(Crocus)、南瓜属(Curcurbita)、金雀儿属(Cytisus)、Delonia属、翠雀属(Delphinium)、石竹属(Dianthus)、康乃馨属(Dimorphotheca)、多榔菊属(Doronicum)、花菱草属(Eschscholtzia)、连翘属(Forsythia)、Fremontia属、勋章菊属(Gazania)、钩吻属(Gelsemium)、染料木属(Genista)、龙胆属(Gentiana)、老鹳草属(Geranium)、非洲菊属(Gerbera)、路边青属(Geum)、银桦属(Grevillea)、堆心菊属(Helenium)、向日葵属(Helianthus)、细辛属(Hepatica)、独活属(Heracleum)、木槿属(Hisbiscus)、赛菊芋属(Heliopsis)、金丝桃属(Hypericum)、黄金菊属(Hypochoeris)、凤仙花属(Impatiens)、鸢尾属(Iris)、蓝花楹属(Jacaranda)、棣堂属(Kerria)、毒豆属(Laburnum)、山黧豆属(Lathyrus)、猫耳草属(Leontodon)、百合属(Lilium)、亚麻属(Linum)、百脉根属(Lotus)、番茄属(Lycopersicon)、珍珠菜属(Lysimachia)、Maratia属、苜蓿属(Medicago)、沟酸浆属(Mimulus)、水仙属(Narcissus)、月见草属(Oenothera)、木犀属(Osmanthus)、碧冬茄属(Petunia)、石楠属(Photina)、酸浆属(Physalis)、牧根草属(Phyteuma)、委陵草属(Potentilla)、火棘属(Pyracantha)、毛茛属(Raunculus)、杜鹃花属(Rhododendron)、蔷薇属(Rosa)、金光菊属(Rudbeckia)、千里光属(Senecio)、蝇子草属(Silene)、松香草属(Silphium)、Sinapsis属、花楸属(Sorbus)、鹰爪豆属(Spartium)、黄钟花属(Tecoma)、蝴蝶草属(Torenia)、婆罗们参属(Tragopogon)、金莲花属(Trollius)、旱金莲属(Tropaeolum)、郁金香属(Tulipa)、款冬属(Tussilago)、荆豆属(Ulex)、堇菜属(Viola)或百日草属(Zinnia)植物,特别优选万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetespatula)、番茄属(Lycopersicon)、蔷薇属(Rosa)、金盏花属(Calendula)、酸浆属(Physalis)、苜蓿属(Medicago)、向日葵属(Helianthus)、茼蒿属(Chrysanthemum)、紫菀属(Aster)、郁金香属(Tulipa)、水仙属(Narcissus)、碧冬茄属(Petunia)、老鹳草属(Geranium)、旱金莲属(Tropaeolum)或侧金盏花属(Adonis)植物之一。
在本发明制备酮类式胡萝卜素的方法中,优选在培养遗传修饰的生物之后收获生物、并进一步优选从生物中分离酮类胡萝卜素。
可以通过众所周知的适合特定生物的方式收获生物。在液体营养培养基中发酵培养的微生物(如细菌、酵母、藻类或真菌)或植物细胞,可以通过例如离心、滗析或过滤分离。通过已知的方式将植物生长于营养培养基中并适当时收获。
优选在有氧、至少约20℃的培养温度(例如20℃到40℃)、pH约6-9的条件下培养遗传修饰的微生物。对于遗传修饰的微生物,优选先在有氧、合成培养基(如TB或LB培养基)中、约20℃或更高温度的培养温度、pH约6至9的条件下培养,直到达到足够的细胞密度。为了能更好地控制氧化反应,优选使用可诱导的启动子。诱导酮酶表达后继续在有氧条件下培养如12小时到3天。
可以通过已知的方式从收获的生物质中分离酮类胡萝卜素,如通过抽提,并适当时经进一步的化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。
可如下所述在本发明遗传修饰的植物中特异地产生酮类胡萝卜素,优选在多种植物组织中产生,如种子、叶、果实、花,特别是花瓣。
可以通过已知的方式从收集的花瓣中分离酮类胡萝卜素,例如通过干燥并随后抽提,以及适当时进一步利用化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。例如,优选使用有机溶剂(如丙酮、己烷、乙醚或叔-甲基丁基醚)从花瓣中分离酮类胡萝卜素。
其他分离酮类胡萝卜素(特别是从花瓣中分离)的方法描述于如Egger和Kleinig(Phytochemistry(1967)6,437-440)以及Egger(Phytochemistry(1965)4,609-618)中。
优选的酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、金盏花玉红质和金盏花黄质。
特别优选的酮类胡萝卜素为虾青素。
取决于使用生物的不同,获取的酮类胡萝卜素为游离的或脂肪酸酯或二葡萄糖苷形式。
利用本发明方法从植物花瓣中获得的酮类胡萝卜素为其与脂肪酸形成的单酯或二酯的形式。一些检测到的脂肪酸的实例为肉豆蔻酸、棕榈酸、硬脂酸、油酸、亚麻酸和月桂酸(Kamata和Simpson(1987)Comp.Biochem.Physio.卷86B(3),587-591)。
酮类胡萝卜素的生产可以在整个植物中进行,或在优选实施方案中,特定在含有有色体的植物组织中进行。优选的植物组织例如根、种子、叶、果实、花,特别是蜜腺和花瓣。
在本发明方法的一个特别优选的实施方案中,使用了在花中酮酶表达速率最高的遗传修饰植物。
优选使用花特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与花特异性启动子功能性连接的核酸构建体中插入前述核酸。
在本发明方法的另一特别优选的实施方案中,使用了在果实中酮酶表达速率最高的遗传修饰植物。
优选使用果实特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与果实特异性启动子功能性连接的核酸构建体中插入前述核酸。
在本发明方法的另一特别优选的实施方案中,使用了在种子中酮酶表达速率最高的遗传修饰植物。
优选使用种子特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与种子特异性启动子功能性连接的核酸构建体中插入前述核酸。
通过功能性连接的质体转运肽可以实现对有色体的靶向定位。
以下通过实施例描述遗传修饰植物的产生,所述遗传修饰的植物具有增加的或造成的酮酶活性,以及增加的或造成的β环化酶活性(其修饰的β环化酶活性是由于该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ IDNO2序列至少有70%的同一性)。
其他活性,如羟化酶活性、HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性和/或MinD活性,可以通过使用相应的作用基因,得到类似的增加。
在组合的遗传修饰中,转化可以逐个进行,或通过多重构建体完成。
优选使用含有上述的编码酮酶及编码β环化酶核酸的核酸构建体转化起始植物来产生转基因植物,所述核酸与一个或多个确保在植物中转录和翻译的调节信号功能性连接;所述核酸编码的β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
另外,也优选使用两个核酸构建体转化起始植物来产生转基因植物。一个核酸构建体含有至少一个上述编码酮酶的核酸,其与一个或多个确保在植物中转录和翻译的调节信号功能性连接。另一个核酸构建体含有至少一个上述编码β环化酶的核酸,其与一个或多个确保在植物中转录和翻译的调节信号功能性连接,所述核酸编码的β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
以下也将这些作用基因与一个或多个确保在植物中转录和翻译的调节信号功能性连接的核酸构建体称为表达盒。
优选调节信号含有一个或多个确保在植物中转录和翻译的启动子。
表达盒含有调节信号,即控制作用基因在宿主细胞中表达的调节性核酸序列。根据优选实施方案之一,表达盒包含上游启动子(即位于编码序列5’端)和下游多腺苷酸化信号(即位于编码序列3’端),并在适当时还含有与至少一个上述基因有效连接的其它调节元件,其中作用基因的编码序列存在于所述调节元件中。“有效连接”是指启动子、编码序列、终止子和适当时的其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
以下举例描述了优选的用于植物的核酸构建体、表达盒和载体,以及产生转基因植物的方法及转基因植物自身。
用于有效连接的优选序列(但并不仅限于此)为确保在质外体、液泡、质体、线粒体、内质网(ER)、细胞核、油质体或其它区室中亚细胞定位的靶向序列,以及翻译增强子(如烟草花叶病毒来源的5’前导序列)(Gallie等,Nucl.Acids Res.15(1987),8693-8711)。
原则上能够控制外源基因在植物中表达的任何启动子都适合用作表达盒启动子。
“组成型”启动子是指在植物发育过程中的相对长时期(优选植物发育的全部时期),确保在许多组织(优选所有组织)中表达的启动子。
具体而言,优选使用植物启动子或植物病毒来源的启动子。特别优选花椰菜嵌合病毒35S转录物的CaMV启动子(Franck等(1980)Cell 21285-294;Odell等(1985)Nature 313810-812;Shewmaker等(1985)Virology 140281-288;Gardner等(1986)Plant Mol Biol 6221-228)、19SCaMV启动子(US 5,352,605;WO 84/02913;Benfey等(1989)EMBO J 82195-2202)、拟南芥(Arabidopsis thaliana)来源的丙糖磷酸转运蛋白(TPT)启动子(Acc.No.AB006698,碱基对53242至55281,起始于bp 55282的基因被注释为“磷酸/丙糖磷酸转运蛋白”),或玄参(figwort)嵌合病毒来源的34S启动子(Acc.No.X16673,碱基对1到554)。
其他合适的组成型启动子为pds启动子(Pecker等(1992)Proc.Natl.Acad.Sci USA 894962-4966)或核酮糖二磷酸羧化酶/加氧酶小亚基(SSU)启动子(US 4,962,028)、豆球蛋白B启动子(GenBank Acc.No.X03677)、农杆菌胭脂碱合成酶启动子、TR双重启动子、农杆菌OCS(章鱼碱合成酶)启动子、泛素启动子(Holtorf S等(1995)Plant Mol Biol 29637-639)、泛素1启动子(Christensen等(1992)Plant Mol Biol 18675-689;Bruce等(1989)Proc Natl Acad Sci USA 869692-9696)、Smas启动子、桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基的启动子或小麦来源富含脯氨酸的蛋白质的启动子(WO 91/13991)、Pnit启动子(Y07648.L,Hillebrand等(1998),Plant.Mol.Biol.36,89-99,Hillebrand等(1996),Gene,170,197-200),以及本领域技术人员已知的在植物中组成型表达的其它基因的启动子。
表达盒也可以含有化学诱导型启动子(综述文章Gatz等(1997)AnnuRev Plant Physiol Plant Mol Biol 4889-108),通过这种启动子可以在某一特定时间点控制作用基因在植物中的表达。该类启动子,例如PRP1启动子(Ward等(1993)Plant Mol Biol 22361-366)、水杨酸诱导的启动子(WO95/19443)、苯磺酰胺诱导的启动子(EP 0 388 186)、四环素诱导的启动子(Gatz等(1992)Plant J 2397-404)、脱落酸诱导的启动子(EP 0 335 528)或乙醇或环己酮诱导的启动子(WO 93/21334)也同样可使用。
优选的启动子还有为生物或非生物应激所诱导的启动子,例如病原体诱导的PRP1基因启动子(Ward等(1993)Plant Mol Biol 22361-366),热诱导的番茄hsp70或hsp80启动子(US 5,187,267)、冷诱导的马铃薯α-淀粉酶启动子(WO 96/12814)、光诱导的PPDK启动子或损伤诱导的pinII启动子(EP375091)。
病原体诱导的启动子包括受病原体攻击诱导产生的基因的启动子,如PR蛋白质、SAR蛋白质、β-1,3-葡聚糖酶、壳多糖酶等的基因的启动子(例如Redolfi等(1983)Neth J Plant Pathol 89245-254;Uknes等(1992)ThePlant Cell 4645-656;Van Loon(1985)Plant Mol Viral 4111-116;Marineau等(1987)Plant Mol Biol 9335-342;Matton等(1987)MolecularPlant-Microbe Interactions 2325-342;Somssich等(1986)Proc Natl AcadSci USA 832427-2430;Somssich等(1988)Mol Gen Genetics 293-98;Chen等(1996)Plant J 10955-966;Zhang和Sing(1994)Proc Natl AcadSci USA 912507-2511;Warner等(1993)Plant J 3191-201;Siebertz等(1989)Plant Cell 1961-968(1989))。
也包括损伤诱导的启动子,如pinII基因启动子(Ryan(1990)Ann RevPhytopath 28425-449;Duan等(1996)Nat Biotech 14494-498)、wun1和wun2基因启动子(US 5,428,148)、win1和win2基因启动子(Stanford等(1989)Mol Gen Genet 215200-208)、系统素(systemin)基因启动子(McGurl等(1992)Science 2251570-1573)、WIP1基因启动子(Rohmeier等(1993)Plant Mol Biol 22783-792;Ekelkamp等(1993)FEBS Letters 32373-76)、MPI基因启动子(Corderok等(1994)The Plant J 6(2)141-150)等。
其它合适的启动子有如果实成熟特异性启动子,例如番茄果实成熟特异性启动子(WO 94/21794、EP 409 625)。发育依赖的启动子部分地包括组织特异性启动子,因为个体组织的天然形成依赖于发育。
此外,特别优选那些确保在组织或植物部位中表达(例如生物合成酮类胡萝卜素或其前体)的启动子。优选启动子有花药、子房、花瓣、萼片、花、叶、茎、种子和根以及其组合特异性的启动子。
球茎、块茎、贮藏根或根特异性启动子,例如I类patatin启动子(B33)或马铃薯组织蛋白酶D抑制物启动子。
叶特异性启动子例如马铃薯胞质FBP酶启动子(WO 97/05900)、核酮糖二磷酸羧化酶/加氧酶(核酮糖-1,5-二磷酸羧化酶)SSU启动子(小亚基)或马铃薯ST-LSI启动子(Stockhaus等(1989)EMBO J 82445-2451)。
花特异性启动子例如八氢番茄红素合成酶启动子(WO 92/16635)或P-rr基因启动子(WO 98/22593)、拟南芥AP3启动子、CHRC启动子(黄瓜(Cucumis sativus)来源的有色体特异的类胡萝卜素相关蛋白质(CHRC)基因启动子,Acc.No.AF099501,碱基对1至1532)、EPSP合成酶启动子(碧冬茄(Petunia hybrida)来源的5-烯醇丙酮酸莽草酸-3-磷酸合成酶基因启动子Acc.No.M37029,碱基对1至1788)、PDS启动子(番茄(SolanumLycopersicum)来源的八氢番茄红素去饱和酶基因启动子Acc.No.U46919,碱基对1至2078)、DFR-A启动子(碧冬茄来源的二氢黄酮醇4-还原酶基因A启动子,Acc.No.X79723,碱基对32至1902),或FBP1启动子(碧冬茄来源的花结合蛋白1基因启动子,Acc.No.L10115,碱基对52至1069)。
花药特异性启动子例如5126启动子(US 5,689,049、US 5,689,051)、glob-I启动子或g-玉米醇溶蛋白启动子。
种子特异性启动子,例如ACP05启动子(酰基载体蛋白基因,WO9218634)、拟南芥属AtS1和AtS3启动子(WO 9920775)、蚕豆(Vicia faba)LeB4启动子(WO 9729200和US 06403371)、欧洲油菜(Brassica napus)启动子(US 5608152;EP 255378;US 5420034)、蚕豆SBP启动子(DE 9903432)或玉米End1和End2启动子(WO 0011177)。
其它适合在植物中表达的启动子如Rogers等(1987)Meth in Enzymol153253-277;Schardl等(1987)Gene 611-11和Berger等(1989)Proc NatlAcad Sci USA 868402-8406中所述。
本发明方法中特别优选种子特异性、果实特异性、花特异性、特别是花瓣特异性的组成型启动子。
优选通过如T.Maniatis、E.F.Fritsch和J.Sambrook,《MolecularCloningA Laboratory Manual》,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1989)及T.J.Silhavy、M.L.Berman和L.W.Enquist,Experiments with Gene Fusiohs,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1984)和Ausubel,F.M.等,《Current Protocols inMolecular Biology》,G reene Publishing Assoc.and Wiley-Interscience(1987)描述的常规重组和克隆技术,将合适的启动子与至少一个上述作用基因融合并优选在启动子与核酸序列之间插入的编码质体特异性转运肽的核酸及多腺苷酸化信号,来生成表达盒。
优选插入的编码质体转运肽的核酸能确保在质体(特别是有色体)中的定位。
也可以使用其核酸序列编码作用基因产物融合蛋白的表达盒,其中融合蛋白质的一部分为控制多肽易位的转运肽。优选有色体特异的转运肽,其在作用基因转移进有色体之后,可被酶解从作用基因产物部分中除去。
特别优选的转运肽来自烟草(Nicotiana tabacum)质体转酮酶或其它转运肽(如核酮糖二磷酸羧化酶-加氧酶小亚基(rbcS)的转运肽或铁氧还蛋白-NADP氧化还原酶的转运肽,以及异戊烯-焦磷酸异构酶2的转运肽)或其功能等价物。
特别优选三种烟草质体转酮酶质体转运肽盒的核酸序列,其以KpnI/BamHI片段的形式处于三个读码框中,其中ATG密码子位于NcoI切割位点pTP09KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGG-GATCC_BamHI
pTP10KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGCTG-GATCC_BamHIpTP11KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGGG-GATCC_BamHI其它质体转运肽的实例有拟南芥质体异戊烯-焦磷酸异构酶2(IPP-2)的转运肽,以及豌豆来源的核酮糖二磷酸羧化酶小亚基(rbcS)的转运肽(Guerineau,F,Woolston,S,Brooks,L,Mullineaux,P(1988)An expressioncassette for targeting foreign proteins into the chloroplasts.Nucl.Acids Res.1611380)。
本发明核酸可以合成制备或从天然获得,或者可以包含合成及天然核酸组分的混合物,并可以由多种生物来源的多个异源基因部分组成。
如上所述,优选具有植物优选密码子的合成核苷酸序列。这些植物优选的密码子,可以从大多数目的植物物种表达蛋白质时出现频率最高的密码子中确定。
在制备表达盒时,可以利用多种DNA片段以便获得便于从正确方向阅读并带有正确阅读框的核苷酸序列。可以在片段上附加连接子或接头,将DNA片段彼此相连。
方便起见,以转录的方向提供具有接头或多聚接头的启动子和终止子区域,所述接头含有用于插入该核酸序列的一个或多个限制位点。一般地,接头含有1至10,通常1至8,优选2至6个限制位点。接头在调节区内的大小一般小于100bp,常常小于60bp,但至少长5bp。对于宿主植物而言,启动子可以是天然的(或同源的)或外源的(或异源的)。表达盒优选以5’-3’转录方向含有启动子、编码核酸序列或核酸构建体,以及转录终止区。不同的终止区可以按需要互换。
终止子的实例有35S终止子(Guerineau等(1988)Nucl Acids Res.1611380)、nos终止子(Depicker A,Stachel S,Dhaese P,Zambryski P,Goodman HM.Nopaline synthasetranscript mapping and DNA sequence.J Mol Appl Genet.1982;1(6)561-73)或ocs终止子(Gielen,J,deBeuckeleer,M,Seurinck,J,Debroek,H,de Greve,H,Lemmers,M,vanMontagu,M,Schell,J(1984)The complete sequence of the TL-DNA of theAgrobacterium tumefaciens plasmid pTiAch5.EMBO J.3835-846)。
此外还可以进行操作,以提供适当的限制性切割位点,或删除冗余DNA或限制性切割位点。可能进行插入、缺失或替换(如转换和颠换)时,可以使用如体外诱变、引物修补、限制性酶切或连接的方法。
通过适当的操作(如限制性酶切、回嚼(chewing back)或将突出端填补成平端),可提供进行连接的片段互补末端。
优选的多腺苷酸化信号是植物多腺苷酸化信号,优选那些基本上与根癌农杆菌(Agrobacterium tumefaciens)来源的T-DNA多腺苷酸化信号对应的信号,特别是Ti质粒pTiACH5(Gielen等,EMBO J.3(1984),835 ff)的T-DNA(章鱼碱合成酶)基因3的多腺苷酸化信号或其功能等价物。
将外源基因转移进植物基因组称为转化。
为此,可以使用已知的转化和从植物组织或植物细胞再生植物的方法,以进行瞬时或稳定转化。
适于转化植物的方法有通过聚乙二醇诱导DNA摄取的原生质体转化、使用基因枪的生物轰击法——“粒子轰击”法、电穿孔、在含有DNA的溶液中孵育干胚、显微注射及上文所述农杆菌介导的基因转移。所述方法描述于例如B.Jenes等,Techniques for Gene Transfer,《Transgenic Plants》,卷1,Engineering and Utilization,S.D.Kung和R.Wu编辑,AcademicPress(1993),128-143和Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991),205-225。
优选将要表达的构建体克隆入适于转化根癌农杆菌的载体,如pBin19(Bevan等,Nucl.Acids Res.12(1984),8711),或特别优选pSUN2、pSUN3、pSUN4或pSUN5(WO 02/00900)。
用表达质粒转化的农杆菌可以通过已知的方式用于转化植物,例如在农杆菌溶液中浸浴损伤的叶子或叶子的碎片,并随后培养在适当的培养基中。
为了优选制备遗传修饰的植物(下文也称为转基因植物),将融合表达盒克隆入适于在根癌农杆菌中转化的载体,如pBin19,或特别是pSUN5和pSUN3。此后将通过已知方式将这种载体转化的农杆菌用于转化植物(特别是农作物),例如,通过在农杆菌溶液中浸浴损伤的叶子或叶子的碎片,并随后在适当的培养基中培养。
利用农杆菌进行植物转化特别公开于F.F.White,Vectors for GeneTransfer in Higher Plants;《Transgenic Plants》,卷1中“Engineering andUtilization”,S.D.Kung和R.Wu编辑,Academic Press,1993,15-38页。可以通过已知的方式从损伤的叶子或叶片段的转化细胞进行转基因植物再生,所述转基因植物含有整合入表达盒的一个或多个基因。
为了用一个或多个本发明的作用基因转化宿主植物,将表达盒插入其DNA中含有额外功能调节信号(如用于复制或整合的序列)的重组载体。合适的载体特别描述于《Methods in Plant Molecular Biology andBiotechnology》(CRC Press),6/7章,71-119页(1993)。
使用上文引用的重组和克隆技术,可以将表达盒克隆进能够在如大肠杆菌中复制的适当载体中。合适的克隆载体有例如pJIT117(Guerineau等(1988)Nucl.Acids Res.1611380)、pBR332、pUC系列、M13mp系列和pACYC184。特别合适的是能够在大肠杆菌和农杆菌中复制的二元载体。
以下将通过实施例更为详细地描述本发明中遗传修饰微生物的产生,所述遗传修饰的微生物具有增加的或造成的酮酶活性,以及增加的或造成的β环化酶活性(其修饰的β环化酶活性是由于该β环化酶含有SEQ IDNO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性)。
其他活性,如羟化酶活性、HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性和/或MinD活性,可以通过使用相应的作用基因得到类似的增加。
优选将上述编码酮酶、β-羟化酶或β环化酶的核酸,以及编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸插入表达构建体及载体中,其中所述构建体含有处在调节性核酸序列遗传控制下的编码本发明中酶的核酸序列,所述载体至少含有一个这类表达构建体。
优选本发明的这类构建体含有,位于特定编码序列5’上游端的启动子和3’端下游的终止子序列,并在适当时还含有每种情况下与作用基因有效连接的其它常规调节元件。“有效连接”指的是启动子、编码序列、终止子及适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
有效连接的序列的实例有靶向序列和翻译增强子、增强子、多腺苷酸化信号等等。其它的调节元件包括选择性标记、扩增信号、复制起点等等。
除了人工调节序列之外,在实际的作用基因前仍可以存在天然的调节序列。通过遗传修饰可在需要时关闭这一天然调节作用,并增加或降低基因的表达。然而基因构建体也可以具有更简单的结构,即在结构基因的前面没有插入额外的调节信号,也没有除去天然启动子及其调节作用。反之则可以突变天然的调节序列使其不再产生调节作用,从而增加或降低基因表达。基因构建体中可以具有一个或多个拷贝的此类核酸序列。
可以使用的微生物启动子有例如在革兰氏阴性细菌中优先使用的cos-、tac-、trp-、tet-、trp-tet-、lpp-、lac-、lpp-lac-、laclq-、T7-、T5-、T3-、gal-、trc、ara-、SP6-、λ-PR-或λ-PL-启动子,及革兰氏阳性启动子amy和SPO2或酵母启动子ADC1、MFα、AC、P-60、CYC1、GAPDH。特别优选使用可诱导的启动子,如光、特别是温度诱导的启动子(如PrPl启动子)。
原则上可以使用所有天然的启动子及其调节序列。此外,也可以有利地使用合成的启动子。
所述调节序列可使核酸序列的选择性表达及蛋白质的表达成为可能。这可能意味着(例如取决于宿主生物的不同)基因只在诱导后表达或过表达,或是立即表达和/或过表达。
既然如此,可优选调节序列或因子使其正面影响表达,从而增加或降低之。因此,通过使用如启动子和/或增强子之类的强转录信号,可以在转录水平上有利的实现调节元件的增强作用。然而,也可以例如通过提高mRNA的稳定性,增强翻译。
通过将适当的启动子与以上描述的编码酮酶、β-羟化酶、β环化酶、HMG-CoA还原酶、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶、1-脱氧-D-木糖-5-磷酸合酶、1-脱氧-D-木糖-5-磷酸还原异构酶、异戊烯二磷酸酯Δ-异构酶、牻牛儿基二磷酸酯合酶、法呢基二磷酸酯合酶、牻牛儿基牻牛儿基二磷酸酯合酶、八氢番茄红素合酶、八氢番茄红素去饱和酶、ζ-胡萝卜素去饱和酶、crtISO蛋白质、FtsZ蛋白质和/或MinD蛋白质的核酸序列,以及终止子或多腺苷酸化信号融合以产生表达盒。为此可使用如描述于T.Maniatis,E.F.Fritsch和J.Sambrook,《Molecular CloningA LaboratoryManual》,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)及T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with GeneFusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984)以及Ausubel,F.M.等,《Current Protocols in Molecular Biology》,GreenePublishing Assoc.and Wiley-Interscience(1987)的常规重组和克隆技术。
为了在合适的宿主生物中表达,将重组核酸构建体或基因构建体有利的插入能使基因在宿主中最佳表达的宿主特异性载体。载体是本领域技术人员所熟知的,并可见于如《Cloning Vectors》(Pouwels P.H.等,编辑,Elsevier,Amsterdam-New York-Oxford,1985)。载体不仅指质粒,也指本领域技术人员已知的所有其它载体,如噬菌体、病毒(如SV40、CMV、杆状病毒和腺病毒)、转座子、IS元件、质粒、粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或随染色体复制。
可以提及的合适的表达载体的实例为常规融合表达载体,如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 6731-40)、pMAL(New England Biolabs,Beverly,MA)和pRIT 5(Pharmacia,Piscataway,NJ),其中重组目的蛋白质分别与谷胱甘肽S-转移酶(GST)、麦芽糖E-结合蛋白和A蛋白融合。
非融合蛋白表达载体,如pTrc(Amann等,(1988)Gene 69301-315)和pET 11d(Studier等Gene Expression TechnologyMethods inEnzymology 185,Academic Press,San Diego,California(1990)60-89),或pBluescript及pUC载体。
用于在酿酒酵母中表达的酵母表达载体,如pYepSecl(Baldari等,(1987)Embo J.6229-234)、pMFα(Kurjan和Herskowitz(1982)Cell 30933-943)、pJRY88(Schultz等(1987)Gene 54113-123)和pYES2(Invitrogen Corporation,San Diego,CA)。
适合用于其它真菌(如丝状真菌)的载体以及构建载体的方法包括,van den Hondel,C.A.M.J.J.& Punt,P.J.(1991)″Gene transfer systemsand vector development for filamentous fungi″,《Applied MolecularGenetics of Fungi》,J.F.Peberdy等编辑,1-28页,Cambridge UniversityPressCambridge中详细描述的载体和方法。
可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体,包括pAc系列(Smith等,(1983)Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers(1989)Virology 17031-39)。
其它合适的原核和真核细胞表达系统描述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.,《Molecular cloningA Laboratory Manual》,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N Y,1989的第16和17章。
借助于本发明的表达构建体或载体,可以利用如至少一种本发明的载体进行转化,制备遗传修饰的生物。
将上述的本发明重组构建体有利的引入合适的宿主系统,并加以表达。这一步中,优选使用本领域技术人员熟悉的克隆和转染方法(如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等),以在特定表达系统中表达所述核酸。合适的系统如《Current Protocols in Molecular Biology》,F.Ausub等编辑,Wiley Interscience,New York 1997中所述。
可以通过同样存在于载体或表达盒中的标记基因来挑选成功转化的生物。这类标记基因的实例如抗生素耐药基因及催化成色反应(使转化细胞染色)的酶基因。然后可以通过自动细胞分选进行选择。
可以通过含有适当抗生素的培养基或营养培养基来选择被载体成功转化的微生物,所述载体具有适当抗生素耐药基因(如G418或潮霉素)。存在于细胞表面的标记蛋白质可用于亲和层析法进行选择。
宿主生物与适用于该生物的载体(如质粒、病毒或噬菌体,如具有RNA聚合酶/启动子系统的质粒、噬菌体8或其它温和噬菌体或转座子)和/或其它有利的调节序列的组合形成了表达系统。
本发明还涉及遗传修饰的非人生物,其中该遗传修饰A对于已经具有酮酶活性的野生型生物,与野生型相比增加其酮酶活性,且
B对于不具有酮酶活性的野生型生物,与野生型相比造成酮酶活性,且其中该遗传修饰C对于已经具有β环化酶活性的野生型生物,与野生型相比增加其β环化酶活性,且D对于不具有β环化酶活性的野生型生物,与野生型相比造成β环化酶活性,而C中增加的β环化酶活性或D中造成的β环化酶活性源于以下β环化酶,该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
如上所述,优选通过提高编码酮酶的核酸的基因表达,以相对于野生型增加(A中)或造成(B中)酮酶活性。
在另一个优选实施方案中,通过将编码酮酶的核酸引入生物,提高编码酮酶的核酸的基因表达。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一个酮酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码酮酶的外源(=异源)核酸,或具有至少两个编码酮酶的内源核酸。
为此,原则上可以使用任何酮酶基因,即编码酮酶的任何核酸。
优选的编码酮酶的核酸如上面本发明方法所述。
如上所述,优选通过相对于野生型提高编码β环化酶的核酸的基因表达,以增加或造成β环化酶活性,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
在优选实施方案中,通过向生物中插入至少一个编码β环化酶的核酸,提高编码β环化酶的核酸的基因表达,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一个β环化酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码β环化酶的外源(=异源)核酸,或具有至少两个编码β环化酶的内源核酸。
为此,原则上可以使用任何β环化酶基因,即编码β环化酶的任何核酸,所述β环化酶中含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
优选的β环化酶如上所述。
如上所述,特别优选的遗传修饰生物还具有相对于野生型生物增加或造成的羟化酶活性。其他优选实施方案如上面本发明方法所述。
此外,如上所述,特别优选的遗传修饰的非人生物相对于野生型还具有选自HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性及MinD活性中至少一种增加的活性。其他优选实施方案如上面本发明方法所述。
本发明的生物优选指野生型或起始生物可天然产生或能够通过遗传互补和/或代谢途径的再调节生产类胡萝卜素,特别是β-胡萝卜素和/或玉米黄质和/或新叶黄素和/或紫黄质和/或叶黄素的生物。
其他优选的生物,野生型或起始生物已经具有羟化酶的活性,因此其野生型或起始生物即能产生玉米黄质。
优选生物为植物或微生物,例如,细菌、酵母、藻类或真菌。
使用的细菌可以是由于插入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(例如含有例如欧文氏菌来源的crt基因的埃希氏杆菌属细菌),以及自身即能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属的细菌或集胞藻属的蓝细菌)。
优选的细菌为大肠杆菌、草生欧文氏菌、噬夏孢欧文氏菌、橙黄农杆菌、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。
优选的酵母为假丝酵母、酵母、汉逊酵母、毕赤酵母)或法夫酵母。特别优选的酵母为Xanthopyvllomyces dendrorhous或Phaffia rhodozyma。
优选的真菌为曲霉、木霉、阿舒囊霉、脉孢菌、布拉霉(特别是Blakesleatrispora)、须霉、镰孢霉或如Indian Chem.Engr.B部分卷37,No.1,2(1995)15页表6中描述的其它真菌。
优选的藻类有绿藻,如红球藻属、三角褐指藻、团藻属或杜氏藻属的藻类。特别优选的藻类有雨生红球藻或杜氏藻属巴德成藻。
其它可用于实施本发明方法的微生物及其生产,公开于如,此处引用作为参考的DE-A-19916140。
特别优选的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科及紫罗兰科。
极其优选的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、苘蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maraia属、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis属、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物,特别优选万寿菊属、万寿菊、孔雀草、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、苘蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属、旱金莲属或侧金盏花属植物之一。
极其特别优选的遗传修饰的植物选自万寿菊属、万寿菊、孔雀草、侧金盏花属、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属或旱金莲属,遗传修饰的植物含有至少一个编码酮酶的转基因核酸。
本发明还涉及转基因植物、其繁殖物质以及其植物细胞、组织或部分,特别是其果实、种子、花及花瓣。
如上所述,遗传修饰的植物可用于产生酮类胡萝卜素,特别是虾青素。
可以被人或动物食用的的本发明遗传修饰生物,特别是植物或植物的部分(例如特别是酮类胡萝卜素(特别是虾青素)含量增加的花瓣),也可以直接或经过已知的方式加工后用作食品和饲料或食品和饲料的添加剂。
此外,遗传修饰生物也可以用于制备含有酮类胡萝卜素的生物提取物和/或制备食品和饲料添加剂。
与野生型相比,遗传修饰生物的酮类胡萝卜素含量增加。
酮类胡萝卜素含量的增加通常指酮类胡萝卜素总含量的增加。
然而,酮类胡萝卜素含量的增加也特别指优选的酮类胡萝卜素含量的改变,而总的类胡萝卜素含量不一定增加。
在特别优选的实施方案中,相对于野生型,本发明遗传修饰的植物的虾青素含量增加。
在这种情况下,增加的含量也指造成的酮类胡萝卜素(如虾青素)的含量。
通过以下的实施例(但并不仅限于此)对本发明进行说明。
一般实验条件重组DNA序列分析根据Sanger的方法(Sanger等,Proc.Natl.Acad.Sci.USA 74(1977),5463-5467),利用Licor激光荧光DNA测序仪(MWG Biotech,Ebersbach所售)对重组DNA分子测序。
实施例1扩增念珠藻属PCC 7120来源的编码NOST酮酶的完整一级序列DNA通过PCR从念珠藻属PCC 7120(″Pasteur Culture Collection ofCyanobacterium″菌株)中扩增编码念珠藻属PCC 7120的NOST酮酶DNA。
为了从念珠藻属PCC 7120悬浮培养物制备基因组DNA,将细胞离心收集,冷冻于液氮,并在研钵中碾磨成粉。所述悬浮培养物在25℃、连续光照且恒定振荡(150rpm)条件下于BG 11培养基(1.5g/l NaNO3、0.04g/lK2PO4×3H2O、0.075g/l MgSO4×H2O、0.036g/l CaCl2×2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/l MnCl2×4H2O、0.222g/lZnSO4×7H2O、0.39g/l NaMoO4×2H2O、0.079g/l CuSO4×5H2O、0.0494g/lCo(NO3)2×6H2O))中生长1周。
从念珠藻PCC 7120中分离DNA的方法在8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中粉碎并碾磨细胞。将细胞材料重悬浮于1ml 10mM TrisHCl(pH 7.5),并转移至Eppendorf反应试管(容积2ml)内。加入100μl蛋白酶K(浓度20mg/ml)后,将细胞悬浮液在37℃孵育3小时。随后用500μl苯酚抽提悬浮液。在13000rpm离心5分钟后,将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热至65℃溶解。
通过聚合酶链式反应(PCR),使用正义特异引物(NOSTF,SEQ ID NO79)和反义特异引物(NOSTG SEQ ID NO80)从念珠藻属PCC 7120中扩增编码念珠藻属PCC 7120酮酶的核酸。
使用的PCR条件如下在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有-1μl念珠藻属PCC 7120 DNA(如上述制备)-0.25mM dNTP-0.2mM NOSTF(SEQ ID NO.79)-0.2mM NOSTG(SEQ ID NO80)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-25.8μl蒸馏水在以下循环条件下进行PCR1X94℃ 2分钟35X 94℃ 1分钟55℃ 1分钟72℃ 3分钟1X72℃ 10分钟利用SEQ ID NO.79和SEQ ID NO80进行PCR扩增产生了805bp的片段,所述片段编码由完整一级序列组成的蛋白质(SEQ ID NO81)。使用标准方法,将扩增子克隆进PCR克隆载体pGEM-T(Promega),获得pNOSTF-G克隆。
使用M 13F和M 13R引物对pNOSTF-G克隆的测序确证了与数据库条目AP003592的88,886-89,662之DNA序列一致的序列。此核苷酸序列在独立的扩增实验中可以重复,因此代表使用的念珠藻属PCC 7120中的核苷酸序列。
因此,该pNOSTF-G克隆被用于克隆进表达载体pJIT117(Guerineau等1988,Nucl.Acids Res.1611380)。通过从pNOSTF-G分离799bp SphI片段并连接进SphI切割的pJIT117载体,完成这一克隆。以正确方向含有念珠藻属PCC 7120酮酶的克隆被称为pJNOST,其中酮酶的N-末端与rbcS转运肽翻译融合。
实施例2构建质粒pMCL-CrtYIBZ/idi/gps,用于在大肠杆菌中合成玉米黄质。
经中间体pMCL-CrtYIBZ和pMCL-CrtYIBZ/idi,通过3个步骤构建pMCL-CrtYIBZ/idi/gps。使用的载体是与高拷贝数载体相容的pMCL200质粒(Nakano,Y.,Yoshida,Y.,Yamashita,Y.和Koga,T.;Construction of a series of pACYC-derived plasmid vectors;Gene 162(1995),157-158)。
实施例2.1构建pMCL-CrtYIBZ生物合成基因crtY、crtB、crtI和crtZ来自噬夏孢欧文氏菌,并通过PCR方法扩增。噬夏孢欧文氏菌(DSM 30080)的基因组DNA由GermanCollection of Microorganisms and Cell Culture(DSMZ,Brunswick,Germany)作为提供的服务而制备。根据制造商提供的详细信息进行PCR(Roche,Long Template PCRProcedure for amplification of 5-20kbtargets with the expand long template PCR system)。扩增噬夏孢欧文氏菌生物合成簇的PCR条件如下Master Mix 1-1.75μl dNTP(终浓度350μM)-0.3μM引物Crt1(SEQ ID NO82)-0.3μM引物Crt2(SEQ ID NO83)-250-500ng DSM 30080基因组DNA
加蒸馏水至总体积50μlMaster Mix 2-5μl 10x PCR缓冲液1(终浓度1x,含1.75mM Mg2+)-10x PCR缓冲液2(终浓度1x,含2.25mM Mg2+)-10x PCR缓冲液3(终浓度1x,含2.25mM Mg2+)-0.75μl Expand Long Template Enzyme Mix(终浓度2.6单位)加蒸馏水至总体积50μl用移液器将两种混合物“Master Mix 1”和“Master Mix 2”混合。在50μl总体积中以如下循环条件进行PCR1X 94℃ 两分钟30X 94℃ 30秒58℃ 1分钟68℃ 4分钟1X 72℃ 10分钟使用SEQ ID NO82和SEQ ID NO83进行PCR扩增产生了编码基因CrtY(蛋白质SEQ ID NO85)、CrtI(蛋白质SET NID NO.86)、crtB(蛋白质SEQ ID NO87)和CrtZ(iDNA)的片段(SEQ ID NO84)。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),获得pCR2.1-CrtYIBZ克隆。
用SalI和HindIII切割pCR2.1-CrtYIBZ质粒,分离所产生的SalI/HindIII片段,并通过连接将其转移进SalI/HindIII切割的pMCL200载体。克隆入pMCL 200的pCR2.1-CrtYIBZ SalI/HindIII片段长度为4624bp,编码CrtY、CrtI、crtB和CrtZ基因,对应D90087中2295位点到6918位点的序列(SEQ ID NO84)。通过CrtZ基因内源性启动子,逆CrtY、CrtI和CrtB基因的阅读框方向转录该基因。产生的克隆被称为pMCL-CrtYIBZ。
实施例2.2构建pMCL-CrtYIBZ/idi
通过PCR方法从大肠杆菌中扩增idi(异戊烯二磷酸异构酶;IPP异构酶)基因。使用正义特异引物(5′-idi SEQ ID NO88)和反义特异引物(3′-idi SEQ ID NO89),通过聚合酶链式反应(PCR),从大肠杆菌中扩增包含idi启动子和核糖体结合位点的编码完整idi基因的核酸。
PCR条件如下扩增DNA的PCR在50μl反应混合物中进行,其中含有-1μl大肠杆菌TOP10悬浮液-0.25mM dNTP-0.2mM 5′-idi(SEQ ID NO88)-0.2mM 3′-idi(SEQ ID NO89)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-28.8μl蒸馏水以下循环条件中进行PCR1X94℃ 2分钟20X 94℃ 1分钟62℃ 1分钟72℃ 1分钟1X72℃ 10分钟利用SEQ ID NO88和SEQ ID NO89进行PCR扩增产生679bp的片段,该片段编码由完整一级序列(SEQ ID NO90)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),获得pCR2.1-idi克隆。
对pCR2.1-idi克隆的测序确证了与发表的AE000372序列8774到9440位置无异的序列。这一区域包括启动子区域、可能的核糖体结合位点和完整的IPP异构酶开放阅读框。由于在idi基因的5,端插入了XhoI切割位点、3’端插入了SalI切割位点,克隆进pCR2.1-idi的片段总长为679bp。
因此,使用该克隆将idi基因克隆进pMCL-CrtYIBZ载体。通过从pCR2.1-idi分离XhoI/SalI片段并连接进XhoI/SalI切割的pMCL-CrtYIBZ载体完成这一克隆。产生的克隆被称为pMCL-CrtYIBZ/idi。
实施例2.3.构建pMCL-CrtYIBZ/idi/gps通过PCR方法从嗜超高温硫酸根还原古细菌(Archaeglobus fulgidus)中扩增gps(牻牛儿基牻牛儿基焦磷酸合酶;GGPP合酶)基因。使用正义特异引物(5′-gps SEQ ID NO92)和反义特异引物(5′-gps SEQ ID NO93),通过聚合酶链式反应(PCR)扩增嗜超高温硫酸根还原古细菌gps基因。
嗜超高温硫酸根还原古细菌DNA由German Collection ofMicroorganisms and Cell Culture(DSMZ,Brunswick,Germany)作为提供的服务而制备。PCR条件如下在50μl反应混合物中用PCR扩增编码由完整一级序列组成的GGPP合酶蛋白质的DNA,所述混合物含有-1μl嗜超高温硫酸根还原古细菌DNA-0.25mM dNTP-0.2mM 5′-gps(SEQ ID NO92)-0.2mM 3′-gps(SEQ ID NO93)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-28.8μl蒸馏水在以下循环条件进行PCR1X 94℃ 2分钟20X94℃ 1分钟56℃ 1分钟72℃ 1分钟1X 72℃ 10分钟用已知方法从琼脂糖凝胶中洗脱利用PCR和SEQ ID NO92及SEQID NO93引物扩增的DNA片段,并用限制酶NcoI和HindIII切割之。由此产生编码由完整一级序列(SEQ ID NO94)组成蛋白质的962bp片段。使用标准方法,将NcoI/HindIII切割的扩增子克隆进pCB97-30载体,获得pCB-gps克隆。
对pCB-gps克隆的测序确证了与发表的AF120272序列有一个核苷酸差异的A.fulgidus GGPP合酶序列。在gps基因中引入一个NcoI切割位点,改变GGPP合酶的第二个密码子。在发表的AF120272序列中,CTG(4-6位点)编码亮氨酸。使用SEQ ID NO92和SEQ ID NO93两种引物的扩增将此第二密码子改变为编码缬氨酸的GTG。
因此,使用pCB-gps克隆将gps基因克隆进pMCL-CrtYIBZ/idi载体。通过从pCB-gps中分离KpnI/XhoI片段并连接进用KpnI和XhoI切割的pMCL-CrtYIBZ/idi载体完成这一克隆。克隆的KpnI/XhoI片段(SEQ IDNO94)带有Prrn 16启动子和rbcL的最小5’UTR序列、延伸GGPP合酶N末端的前6个rbcL密码子和gps基因3’端的psbA序列。因此该GGPP合酶的N末端具有改变的氨基酸序列Met-Thr-Pro-Gln-Thr-Ala-Met-Val-Lys-Glu,而不是天然氨基酸序列Met-Leu-Lys-Glu(AF120272的1到4位氨基酸)。这使得重组GGPP合酶从位点3(在AF120272中)的Lys开始在氨基酸序列上具有同一性,并且没有更多改变。参考Eibl等(Plant J.19.(1999),1-13)使用rbcL和psbA序列。产生的克隆被称为pMCL-CrtYIBZ/idi/gps。
实施例3在重组大肠杆菌菌株中生物转化玉米黄质为进行玉米黄质的生物转化,通过异源互补制备能产生玉米黄质的重组大肠杆菌菌株。大肠杆菌TOP10菌株作为宿主细胞,用于用质粒pNOSTF-G和pMCL-CrtYIBZ/idi/gps的互补实验。
为了制备可合成高浓度玉米黄质的大肠杆菌菌株,构建pMCL-CrtYIBZ/idi/gps质粒。该质粒带有噬夏孢欧文氏菌的生物合成基因crtY、crtB、crtI和crtY、嗜超高温硫酸根还原古细菌的gps(牻牛儿基牻牛儿基焦磷酸合成酶)基因和大肠杆菌idi(异戊烯二磷酸异构酶)基因。该构建体解除了类胡萝卜素以及其生物合成前体大量聚积的限速步骤。这一点已由Wang等之前使用若干质粒以相似的方式描述(Wang,C.-W.,Oh,M.-K.和Liao,J.C.;Engineered isoprenoid pathway enhances astaxanthinproduction in Escherichia coli,Biotechnology and Bioengineering 62(1999),235-241)。
使用pNOSTF-G和pMCL-CrtYIBZ/idi/gps两种质粒,以已知的方式转化大肠杆菌TOP 10培养物,并在30℃或37℃的LB培养基培养过夜。同样通过已知的方式加入氨苄青霉素(50μg/ml)、氯霉素(50μg/ml)和异丙基-β-硫代半乳糖苷(1mmol)培养过夜。
为从重组菌株中分离类胡萝卜素,用丙酮抽提细胞,将有机溶剂蒸干,并通过HPLC方法在C30柱上分离类胡萝卜素。条件设置如下。
分离柱Prontosil C30柱、250×4.6mm(Bischoff,Leonberg)流速1.0ml/min洗脱液洗脱液A-100%甲醇洗脱液B-80%甲醇、0.2%醋酸胺洗脱液C-100%叔丁基甲基醚梯度曲线

检测300-500nm使用光(电)二极管矩阵检测器直接从洗脱峰检测光谱。
通过与标准样品比较吸收光谱和保留时间,鉴定分离的物质。
实施例4与先前的实施例类似,制备表达雨生红球藻Flotow em.Wille来源的酮酶大肠杆菌菌株。为此,扩增编码雨生红球藻Flotow em.Wille酮酶完整一级序列的cDNA,并将此cDNA克隆进与实施例1相同的表达载体中。
通过对雨生红球藻(″Collection of algal cultures of the University ofG_ttingen″的192.80菌株)悬浮培养物进行PCR,扩增编码雨生红球藻酮酶的cDNA。为了从雨生红球藻(192.80菌株)悬浮培养物中制备总RNA,收集细胞,在液氮中冷冻,并在研钵中碾磨成粉,所述悬浮培养物在室温间接日光条件下于红球藻培养基(1.2g/l醋酸钠、2g/l酵母提取物、0.2g/lMgCl2×6H2O、0.02CaCl2×2H2O;pH 6.8;高压灭菌后加入400mg/l L-天冬酰胺、10mg/1FeSO4×H2O)中生长两周。随后将100mg冷冻的藻类细胞研磨粉末转移到反应试管内,并加入0.8ml Trizol缓冲液(LifeTechnologies)。用0.2ml氯仿抽提悬浮液。12000g离心15分钟后,将水相上清液转移到新的反应试管内,并用一体积的乙醇抽提。用一体积异丙醇沉淀RNA,用75%的乙醇洗涤并将沉淀溶解于DEPC水(用1/1000体积焦碳酸二乙酯水在室温孵育过夜,然后高压灭菌)。通过分光光度法测定RNA浓度。
为合成cDNA,将2.5μg总RNA在60℃变性10分钟,冰上冷却2分钟,并按照制造商说明,使用反义特异引物PR1(gcaagctcga cagctacaaa cc),通过cDNA试剂盒(Ready-to-go-you-prime-beads,Pharmacia Biotech)转录成cDNA。
利用正义特异引物PR2(gaagcatgca gctagcagcgacag)和反义特异引物PR1,对雨生红球藻进行聚合酶链式反应(PCR),扩增编码雨生红球藻(192.80菌株)酮酶的核酸。
PCR条件如下在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有-4ml雨生红球藻cDNA(如上述制备)-0.25mM dNTP-0.2mM PR1-0.2mM PR2-5ml 10X PCR缓冲液(TAKARA)-0.25ml R Taq聚合酶(TAKARA)-25.8ml蒸馏水在以下循环条件进行PCR1X 94℃ 2分钟35X94℃ 1分钟53℃ 2分钟72℃ 3分钟1X 72℃ 10分钟利用PR1和PR2进行PCR扩增产生编码由完整一级序列组成蛋白质的1155bp片段gaagcatgca gctagcagcg acagtaatgt tggagcagct taccggaagc gctgaggcac 60tcaaggagaa ggagaaggag gttgcaggca gctctgacgt gttgcgtaca tgggcgaccc120agtactcgct tccgtcagag gagtcagacg cggcccgccc gggactgaag aatgcctaca180agccaccacc ttccgacaca aagggcatca caatggcgct agctgtcatc ggctcctggg240ccgcagtgtt cctccacgcc atttttcaaa tcaagcttcc gacctccttg gaccagctgc300actggctgcc cgtgtcagat gccacagctc agctggttag cggcagcagc agcctgctgc360acatcgtcgt agtattcttt gtcctggagt tcctgtacac aggccttttt atcaccacgc420atgatgctat ccatggcacc atcgccatga gaaacaggca gcttaatgac ttcttgggca480gagtatgcat ctccttgtac gcctggtttg attacaacat gctgcaccgc aagcattggg540agcaccacaa ccacactggc gaggtgggca aggaccctga cttccacagg ggaaaccctg600gcattgtgcc ctggtttgcc agcttcatgt ccagctacat gtcgatgtgg cagtttgcgc660gcctcgcatg gtggacggtg gtcatgcagc tgctgggtgc gccaatggcg aacctgctgg720tgttcatggc ggccgcgccc atcctgtccg ccttccgctt gttctacttt ggcacgtaca780tgccccacaa gcctgagcct ggcgccgcgt caggctcttc accagccgtc atgaactggt840ggaagtcgcg cactagccag gcgtccgacc tggtcagctt tctgacctgc taccacttcg900acctgcactg ggagcaccac cgctggccct ttgccccctg gtgggagctg cccaactgcc960gccgcctgtc tggccgaggt ctggttcctg cctagctgga cacactgcag tgggccctgc 1020tgccagctgg gcatgcaggt tgtggcagga ctgggtgagg tgaaaagctg caggcgctgc 1080tgccggacac gctgcatggg ctaccctgtg tagctgccgc cactagggga gggggtttgt 1140agctgtcgag cttgc使用标准方法,将扩增子克隆进PCR克隆载体pGEM-Teasy(Promega),获得pGKETO2克隆。
表10

表10中的数据表明,当3种整合酶中的每种整合酶与IHF和切除酶递送时,它都介导植物染色质中的分子内L/R重组。
VI.烟草中的定向整合A.利用农杆菌介导的转化递送的供体序列和Int1.阳性对照双元载体的构建实施例72用整合酶体外处理质粒CMPSVLucB/P以形成CMPSVLucIntronAttL,一种含有具有attL位点的内含子的阳性对照萤光素酶构建体利用来源于Gateway克隆试剂盒(Invitrogen)的酶和缓冲液,将约300ng质粒VCMLucB/P(2μl)与10μl水,4μl BP缓冲液和4μl BP克隆酶混合,并且在25℃温育1.5小时。用一半反应混合物转化大肠杆菌(E.coli)DH5α。通过用Asp718I和BglII消化小量制备物鉴定分子内反应产物CMPSVLucIntronAttL。
2.靶序列的构建在这里所述的示例性构建体中,用于将靶序列插入到烟草中的质粒<p>从点形念珠藻ATCC 29133中分离DNA的方法在8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中粉碎并碾磨细菌细胞。将细胞材料重悬浮于1ml 10mMTris HCI(pH7.5),并转移至Eppendorf反应试管(容积2ml)。加入100μl蛋白酶K(浓度20mg/ml)后,将细胞悬浮液在37℃孵育3小时。随后用500μl苯酚抽提悬浮液。在13000rpm离心5分钟后,将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热至65℃溶解。
通过聚合酶链式反应(PCR),使用正义特异引物(NP196-1,SEQ ID NO100)和反义特异引物(NP196-2SEQ ID NO101)从点形念珠藻ATCC29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有-1μl点形念珠藻ATCC29133DNA(如上述制备)-0.25mM dNTP-0.2mM NP196-1(SEQ ID NO100)-0.2mM NP196-2(SEQ ID NO101)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-25.8μl蒸馏水在以下循环条件下进行PCR1X 94℃ 2分钟35X 94℃ 1分钟55℃ 1分钟72℃ 3分钟1X 72℃ 10分钟利用SEQ ID NO100和SEQ ID NO101进行PCR扩增产生792bp的片段,所述片段编码由完整一级序列(NP196,SEQ ID NO102)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pNP196克隆。
使用引物M13F和M13R对pNP196克隆的测序确证了与数据库NZ AABC01000196条目140,571-139,810的DNA序列一致的序列(与发表的数据库条目方向相反),只是其中140,571位点的G被A取代以产生标准的起始密码子ATG。该核苷酸序列在独立扩增实验中可以重复,因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,该pNP196克隆被用于克隆进表达载体pJIT117(Guerineau等1988,Nucl.Acids Res.1611380)。
用根癌农杆菌Ti质粒pTi15955的OCS终止子(章鱼碱合酶)(数据库条目X00493,12,541-12,350位点,Gielen等(1984)EMBO J.3835-846)替换35S终止子,对pJIT117进行修饰。
使用质粒pHELLSGATE(数据库条目AJ311874,Wesley等(2001)Plant J.27581-590,用标准方法从大肠杆菌中分离)以及引物OCS-1(SEQ ID NO133)和OCS-2(SEQ ID NO134),通过PCR方法制备含有OCT终止子区域的DNA片段。
PCR条件如下在50μl反应混合物中进行扩增含有章鱼碱合酶(OCS)终止子区域DNA(SEQ ID NO106)的PCR,所述混合物中含有-100ng pHELLSGATE质粒DNA-0.25mM dNTP-0.2mM OCS-1(SEQ ID NO104)-0.2mM OCS-2(SEQ ID NO105)-5μl 10X PCR缓冲液(Stratagene)-0.25μl Pfu聚合酶(Stratagene)-28.8μl蒸馏水在以下循环条件下进行PCR1X 94℃ 2分钟35X94℃ 1分钟50℃ 1分钟72℃ 1分钟1X 72℃ 10分钟使用标准方法,将210bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pOCS质粒。
对pOCS克隆测序确证了与根癌农杆菌Ti质粒pTi15955(数据库条目X00493)上12,541-12,350位点对应的序列部分。
从pOCS分离210bp的SalI-XhoI片段并将其连入SalI-XhoI切割的pJIT117载体,完成这一克隆。
该克隆被称为pJO,并用于克隆进表达载体pJONP196。
从pNP196分离782bp的SphI片段,并将其连入SphI切割的pJO载体,从而完成克隆。以正确方向含有点形念珠藻NP196酮酶的克隆被称为pJONP196,其中酮酶的N-末端与rbcS转运肽翻译融合。
实施例6制备用于在食用番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体食用番茄和万寿菊中点形念珠藻NP196酮酶的表达,是在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位;WO 03/006660)控制下进行的。FNR基因起始于69492碱基对,并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等1986,Biochem J.240709-715)进行表达。
使用基因组DNA(通过标准方法从拟南芥中分离)及引物FNR-1(SEQID NO107)和FNR-2(SEQ ID NO108),通过PCR方法制备含有拟南芥FNR启动子区域的DNA片段。
PCR条件如下在50μl反应混合物中进行扩增含有FNR启动子片段FNR的DNA(SEQ ID NO109)的PCR,所述混合物含有-100ng拟南芥基因组DNA-0.25mM dNTP-0.2mM FNR-1(SEQ ID NO107)-0.2mM FNR-2(SEQ ID NO108)-5μl 10X PCR缓冲液(Stratagene)-0.25μl Pfu聚合酶(Stratagene)-28.8μl蒸馏水在以下循环条件下进行PCR1X 94℃ 2分钟35X 94℃ 1分钟50℃ 1分钟72℃ 1分钟IX 72℃ 10分钟使用标准方法将652bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pFNR质粒。
对pFNR克隆的测序确证了与拟南芥5号染色体上70127到69493位点(数据库条目AB011474)对应的序列片段。
该克隆被称为pFNR,并因此被用于克隆进表达载体pJONP196(如实施例5所述)。
从pFNR分离644bp的SmaI-HindIII片段,并将其连入Ecl136II-HindIII切割的pJONP196载体来完成克隆。含有FNR启动子而非原始d35S启动子且以正确方向含有NP196片段的克隆被称为pJOFNRNP196,所述NP196片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化念珠藻NP196酮酶的表达盒。
为制备表达载体MSP105,将来自pJOFNRNP196的1839bpEcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体相连。表达载体MSP105含有FNR启动子片段--FNR启动子(635bp)、rbcS TP FRA GMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化含有点形念珠藻NP196酮酶的表达载体的表达盒。
为制备万寿菊表达载体MSP106,将来自pJOFNR:NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体相连。MSP106含有FNR启动子片段--FNR启动子(635bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例7制备用于在食用番茄和万寿菊中花特异性表达点形念珠藻ATCC29133来源的NP196酮酶的表达载体使用豌豆rbcS转运肽(Anderson等1986,Biochem J.240709-715),在食用番茄和万寿菊中表达点形念珠藻NP196酮酶。该表达在碧冬茄来源的花特异性启动子EPSPS(数据库条目M37029;核苷酸区域7-1787;Benfey等(1990)Plant Cell 2849-856)的控制下进行。
使用基因组DNA(通过标准方法从碧冬茄中分离)及引物EPSPS-1(SEQ ID NO110)和EPSPS-2(SEQ ID NO111),通过PCR方法制备含有碧冬茄EPSPS启动子区域的DNA片段(SEQ ID NO112)。
PCR条件如下在50μl反应混合物中进行扩增含有EPSPS启动子片段(数据库条目M37029核苷酸区域7-1787)DNA的PCR,所述混合物含有-100ng拟南芥基因组DNA
-0.25mM dNTP-0.2mM EPSPS-1(SEQ ID NO110)-0.2mM EPSPS-2(SEQ ID NO111)-5μl 10X PCR缓冲液(Stratagene)-0.25μl Pfu聚合酶(Stratagene)-28.8μl蒸馏水在以下循环条件下进行PCR1X 94℃ 2分钟35X 94℃ 1分钟50℃ 1分钟72℃ 2分钟1X 72℃ 10分钟使用标准方法将1773bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pEPSPS质粒。
对pEPSPS克隆的测序确证了与发表的EPSPS序列(数据库条目M37029核苷酸区域7-1787)仅相差两个缺失(M37029序列46-58位点的ctaagtttcagga碱基;M37029序列1422-1429位点的aaaaatat碱基)及碱基置换(T替换M37029序列1447位点的G;A替换M37029序列1525位点的C;A替换M37029序列1627位点的G)的序列。这两个缺失和M37029序列1447及1627位点的两个碱基置换在独立扩增实验中可以重复,因此代表实际所用的碧冬茄植物的核苷酸序列。
因此,pEPSPS克隆被用于克隆进pJONP196表达载体(如实施例5所述)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的JONP196载体来完成克隆。含有EPSPS启动子而非原始d35S启动子的克隆被称为pJOESP:NP196。该表达盒以正确方向含有NP196片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP196酮酶的表达载体。
为制备表达载体MSP107,将来自pJOESP:NP196的2961KBbpSachI-XhoI片段与SacI-XhoI切割的pSUN3载体相连。表达载体MSP107含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化EPSPS控制的点形念珠藻NP196酮酶的表达载体。
为制备表达载体MSP108,将来自pJOESP:NP196的2961 KBbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体相连。表达载体MSP108含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例8扩增编码点形念珠藻ATCC 29133 NP195酮酶完整一级序列的DNA通过PCR方法,从点形念珠藻ATCC 29133(美国典型培养物保藏中心菌株)扩增编码点形念珠藻ATCC 29133 NP195酮酶的DNA。从点形念珠藻ATCC 29133的悬浮培养物中制备基因组DNA已在实施例5中描述。
使用正义特异引物(NP195-1,SEQ ID NO113)和反义特异引物(NP195-2SEQ ID NO114),通过聚合酶链式反应(PCR)从点形念珠藻ATCC 29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有-1μl点形念珠藻ATCC 29133 DNA(如上述制备)
-0.25mM dNTP-0.2mM NP195-1(SEQ ID NO113)-0.2mM NP195-2(SEQ ID NO114)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-25.8μl蒸馏水在以下循环条件下进行PCR1X 94℃ 2分钟35X 94℃ 1分钟55℃ 1分钟72℃ 3分钟1X 72℃ 10分钟利用SEQ ID NO113和SEQ ID NO114进行PCR扩增产生819bp的片段,所述片段编码由完整一级序列(NP195,SEQ ID NO115)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pNP195克隆。
使用M13F和M13R引物对pNP195克隆的测序确证了与数据库NZ AABC010001965条目55,604-56,392的DNA序列一致的序列,只是其中55,604位点的T被A替换以产生标准的起始密码子ATG。该核苷酸序列在独立扩增实验中可以重复,因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,该pNP195克隆被用于克隆进表达载体pJO(如实施例5所述)。通过从pNP195分离809bp的SphI片段,并将其连入SphI切割的pJO载体来完成克隆。以正确方向含有点形念珠藻NP195酮酶的克隆被称为pJONP195,其中所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例9制备用于在食用番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体食用番茄和万寿菊中点形念珠藻NP195酮酶的表达是在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位;WO 03/006660)的控制进行的。FNR基因起始于69492碱基对,并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等1986,Biochem J.240709-715)进行表达。
因此,将pFNR克隆(如实施例6所述)用于克隆进表达载体pJONP195(如实施例8所述)。
通过从pFNR分离644bp的Sma-HindIII片段,并将其连入Ecl136II-HindIII切割的pJONP195载体来完成克隆。含有FNR启动子而非原始d35S启动子并以正确方向含有NP195片段的克隆被称为pJOFNR:NP195,所述NP195片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化点形念珠藻NP195酮酶的表达盒。
为制备表达载体MSP109,将来自pJOFNR:NP195的1866bpEcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体相连。表达载体MSP109含有FNR启动子片段--FNR启动子(635bp)、rbcS TPFRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于通过农杆菌介导下向万寿菊转化含有点形念珠藻NP195酮酶的表达载体的表达盒。
为制备MSP110万寿菊表达载体,将来自pJOFNR:NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体相连。表达载体MSP110含有FNR启动子片段--FNR启动子(635bp)、rbcS TPFRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例10制备用于在食用番茄和万寿菊中花特异性表达点形念珠藻ATCC29133来源的NP195酮酶的表达载体使用豌豆rbcS转运肽(Anderson等1986,Biochem J.240709-715)在食用番茄和万寿菊中表达点形念珠藻NP195酮酶。该表达在碧冬茄来源的花特异性启动子EPSPS(数据库条目M37029;核苷酸区域7-1787;Benfey等(1990)Plant Cell 2849-856)的控制下进行。
因此,将pEPSPS克隆(如实施例7所述)用于克隆进表达载体pJONP195(如实施例8所述)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连入SacI-HindIII切割的pJONP195载体来完成克隆。含有EPSPS启动子而非原始d35S启动子的克隆被称为pJOESP:NP195。该表达盒以正确方向含有NP195片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于通过农杆菌介导下向食用番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP195酮酶的表达载体。
为制备MSP111表达载体,将来自pJOESP:NP195的2988KB bp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体相连。表达载体MSP111含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TPFRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化EPSPS控制的点形念珠藻NP195酮酶的表达载体。
为制备MSP112表达载体,将来自pJOESP:NP195的2988KBbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体相连。表达载体MSP112含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例11制备用于花特异性过量表达食用番茄色素体特异的β-羟化酶的表达盒在矮牵牛的花特异性启动子EPSPS(实施例7)的控制下,进行万寿菊中食用番茄色素体特异的β-羟化酶的表达。使用蚕豆(Vicia faba)来源的LB3为终止子元件。通过分离RNA、反转录和PCR制备色素体特异的β-羟化酶的序列。
为了制备蚕豆LB3终止子序列,按照标准方法从蚕豆组织中分离基因组DNA,并利用引物PR206和PR207对其进行基因组PCR。在50μl反应混合物中进行PCR扩增该LB3DNA片段,所述混合物含有-1μl cDNA(如上述制备)-0.25mM dNTP-0.2μM PR206(SEQ ID NO116)-0.2μM PR207(SEQ ID NO117)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-28.8μl蒸馏水利用PR206和PR207进行PCR扩增得到含有LB终止子的0.3kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13测序确证了与序列SEQ ID NO118一致的序列。该克隆被命名为pTA-LB3,并因此用于克隆到载体pJIT117中(见下文)。
从番茄制备总RNA,以制备β-羟化酶序列。为此,将100mg冰冻粉碎的花转移到反应试管中,并加入0.8ml Trizol缓冲液(Life Technologies)。用0.2ml氯仿抽提悬浮液。以12000g离心15分钟后,将水相上清液取出并转移到新反应试管中并用1体积乙醇抽提。用1体积异丙醇沉淀RNA,以75%乙醇洗涤之,并将沉淀溶于DEPC水(水与1/1000体积焦碳酸二乙酯在室温下过夜孵育,然后高压灭菌)中。通过光度法测定RNA浓度。为合成cDNA,将2.5μg总RNA在60℃变性10分钟,冰上冷却2分钟并根据生产商详细说明使用cDNA试剂盒(Ready-to-go-you-prime-beads,Pharmacia Biotech)、利用反义特异引物(PR215 SEQ ID NO119)转录成cDNA。
随后的PCR条件如下在50μl反应混合物中进行PCR扩增编码β-羟化酶的VPR203-PR215DNA片段,所述混合物含有-1μl cDNA(如上述制备)-0.25mM dNTP-0.2μM VPR203(SEQ ID NO120)-0.2μM PR215(SEQ ID NO119)-5μl 10X PCR缓冲液(TAKARA)-0.25μl R Taq聚合酶(TAKARA)-28.8μl蒸馏水利用VPR203和PR215进行PCR扩增得到编码β-羟化酶的0.9kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13的测序确证了与序列SEQ ID NO121一致的序列。该克隆被命名为pTA-CrtR-b2,并因此用于克隆到载体pCSP02中(见下文)。
使用质粒MSP107(见实施例7)以及引物VPR001和VPR002,通过PCR扩增制备来自矮牵牛的EPSPS启动子序列。在50μl反应混合物中进行PCR扩增该EPSPS DNA片段,所述混合物含有-1μl cDNA(如上述制备)-0.25mM dNTP-0.2μM VPR001(SEQ ID NO122)-0.2μM VPR002(SEQ ID NO123)-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)-28.8μl蒸馏水利用 VPR001和PR002进行PCR扩增得到编码EPSPS启动子的1.8kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13的测序确证了与序列SEQ ID NO124一致的序列。该克隆被命名为pTA-EPSPS,并因此用于克隆到载体pCSP03中(见下文)。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-LB3中分离0.3kbPR206-PR207EcoRI-XhoI片段,并与EcoRI-XhoI切割的载体pJIT117连接,进行克隆第一步。该含有0.3kb终止子LB3的克隆被命名为pCSP02。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-CrtR-b2分离0.9kb VPR003-PR215EcoRI-HindIII片段,并与EcoRI-HindIII切割的载体pCSP02连接进行克隆第二步。该含有0.9kbβ-羟化酶片段CrtR-b2的克隆被命名为pCSP03。通过连接,在终止子LB3和β-羟化酶片段CrtR-b2间形成了转录融合。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-EPSPS上分离1.8kb VPR001-VPR002 NcoI-SacI片段,并与NcoI-SacI切割的载体pCSP03连接完成克隆第三步。该含有1.8kb EPSPS启动子片段的克隆被命名为pCSP04。通过连接,在EPSPS启动子和β-羟化酶片段CrtR-b2之间形成了转录融合。pCSP04含有片段EPSPS(1792bp)--EPSPS启动子、片段crtRb2(929bp)--β-羟化酶CrtRb2、LB3片段(301bp)--LB3终止子。
为将该β-羟化酶过量表达盒克隆到用于农杆菌介导下转化万寿菊的表达载体中,以3103bp Ecl136II-XhoI片段分离β-羟化酶盒。通过标准方法(Klenow填补)补平3’末端(30℃,30分钟)。
该表达载体被命名为pCSEbhyd。
实施例12制备用于在启动子P76控制下花特异性表达食用番茄色素体特异的番茄红素β环化酶以及在EPSPS启动子控制下花特异性表达点形念珠藻ATCC 29133酮酶NP196的表达载体通过PCR,以拟南芥基因组DNA为模板分离启动子P76(SEQ ID NO125)。
为此使用寡核苷酸引物P76for(SEQ ID NO126)和P76rev(SEQ IDNO127)。在合成过程中,提供具有5’-磷酸残基的寡核苷酸。
P76for 5’-CCCGGGTGCCAAAGTAACTCTTTAT-3’P76rev 5’-GTCGACAGGTGCATGACCAAGTAAC-3’如已描述的(Galbiati M等,Funct.Integr.Genomics 2000,20125-34)从拟南芥分离基因组DNA。
如下进行PCR扩增80ng基因组DNA1x Expand Long Template PCR缓冲液2.5mM MgCl2dATP、dCTP、dGTP、dTTp各350μM300nM各引物2.5单位Expand Long Template聚合酶终体积为25μl使用下面的温度程序94℃120秒1个循环94℃ 10秒,48℃ 30秒,68℃ 3分钟35个循环68℃ 10分钟1个循环。
通过琼脂糖凝胶电泳分离PCR产物,并通过凝胶洗脱分离1032bp片段。
用限制性内切酶EcoRV消化载体pSUN5,也同样用琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的PCR产物克隆到如此处理的载体中。
将该构建体命名为p76。对代表拟南芥启动子P76的长为1032bp的片断(SEQ ID NO131)进行测序。
使用限制性内切酶Kpn1和SmaI消化,从pJIT117得到35ST终止子。用琼脂糖凝胶电泳纯化该法所得的969bp片段,并以凝胶洗脱分离。
同样用限制性内切酶Kpn1和SmaI消化载体p76。用琼脂糖凝胶电泳纯化所得的7276bp片段,并以凝胶洗脱分离。
将所得35ST片段克隆到如此处理的p76中。
所得载体被命名为p7635ST。
以食用番茄的基因组DNA为模板,通过PCR方法分离Bgene(SEQ IDNO128)。
为此使用寡核苷酸引物BgeneFor(SEQ ID NO129)和BgeneRev(SEQ ID NO130)。在合成过程中,提供了具有5’-磷酸残基的寡核苷酸。
SEQ ID NO 129Bgenefor5’-CTATTGCTAGATTGCCAATCAG-3’SEQ ID NO 130Bgeneves5’-ATGGAAGCTCTTCTCAAG-3’如已描述的(Galbiati M等,Funct.Integr.Genomics 2000,20125-34)从食用番茄分离基因组DNA。
如下进行PCR扩增80ng基因组DNA1x Expand Long Template PCR缓冲液2.5mM MgCl2dATP、dCTP、dGTP、dTTp各350μM300nM各引物2.5单位Expand Long Template聚合酶终体积为25μl使用下面的温度程序94℃120秒1个循环94℃ 10秒,48℃ 30秒,68℃ 3分钟35个循环68℃ 10分钟1个循环。
利用琼脂糖凝胶电泳纯化PCR产物,并通过凝胶洗脱分离1665bp片段。
用限制性内切酶SmaI消化载体p7635ST,并同样通过琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的PCR产物克隆到如此处理的载体中。
该构建体被命名为pB。对代表番茄Bgene的长为1486bp的片断进行测序,其核苷酸序列与数据库条目AF254793(SEQ ID NO1)一致。
使用限制性内切酶PmeI和SspI消化pB,并通过琼脂糖凝胶电泳纯化和凝胶洗脱回收含有启动子P76、Bgene和35ST的3906bp片段。
用限制性内切酶Ecl126II消化MSP108(实施例7),通过琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的来自pB的含有启动子P76、Bgene和35ST的3906bp片段克隆到如此处理的载体MSP108中。
该构建体被命名为pMKP1。
实施例13转基因食用番茄植物的制备和分析根据Ling等发表的方法(Plant Cell Reports(1998),17843-847)转化并再生番茄植物。对于品种Microtom,使用更高浓度的卡那霉素(100mg/l)进行选择。
使用Microtom系的7到10天龄幼苗的子叶和下胚轴作为转化用的起始外植体。萌发使用Murashige和Skoog所述含2%蔗糖、pH 6.1的培养基(1962Murashige and Skoog,1962,Physiol.Plant 15,473-)。在21℃、低光照(20-100μE)的条件下进行萌发。7到10天后,横向分割子叶并将下胚轴切成约5-10mm长的节段,并置于一天前预先涂布悬浮培养番茄细胞的MSBN培养基(MS,pH 6.1,3%蔗糖+1mg/1BAP、0.1mg/l NAA)上。所述番茄细胞用无菌滤纸无气泡覆盖。在上述培养基上将外植体预培养3到5天。分别用质粒独立转化根癌农杆菌LBA4404株细胞。每一次,将用二元载体转化的各农杆菌菌株在28℃含卡那霉素(20mg/l)的YEB培养基中过夜培养,并离心细胞。将细菌沉淀重悬浮于液体MS培养基(3%蔗糖、pH 6.1),并调节到光密度为0.3(600nm处)。将预培养的外植体转移到悬浮液中,并在室温温和振荡的条件下孵育30分钟。随后,用无菌滤纸干燥外植体,并重置于其预培养基进行3天共培养(21℃)。
共培养后,将外植体转移到MSZ2培养基(MS pH 6.1+3%蔗糖、2mg/l玉米素、100mg/l卡那霉素、160mg/l替曼汀(timentin))并储存,以在21℃、弱光条件(20-100μE、光节律16h/8h)下选择性再生。在芽形成以前每两到3周转移一次外植体。可以从外植体上分离小芽,并使其在MS(pH 6.1+3%蔗糖)、160mg/l替曼汀、30mg/l卡那霉素、0.1mg/l IAA上生根。将生根的植物转移到温室。
根据上述转化方法,用以下表达构建体获得了如下株系用MSP105获得MSP105-1、MSP105-2、MSP105-3用MSP107获得MSP107-1、MSP107-2、MSP107-3用MSP109获得MSP109-1、MSP109-2、MSP109-3用MSP111获得MSP111-1、MSP111-2、MSP111-3实施例14转基因万寿菊植物的制备将万寿菊种子灭菌并置于萌发培养基(MS培养基;Murashige和Skoog,Physio.Plant.15(1962),473-497)pH 5.8,2%蔗糖)上。萌发的温度/光照/时间间隔为18-28℃/20-200μE/3-16周,但是优选在21℃、20-70μE、持续4-8周。
到时收获体外发育的植物的所有叶子,并从中部横切。制备过程中将由此得到的10-60mm2大小的叶外植体储存于室温下的液体MS培养基中最多两小时。
过夜培养任何一种所需的根癌农杆菌菌株,并用于与叶子材料共培养,其中优选超毒力菌株,如具有适当二元质粒的EHA 105,所述二元质粒可以携带选择性标记基因(优选bar或pat)和一种或多种性状或报告基因。可以如下培养细菌菌株将适当菌株的单菌落接种于具有25mg/l卡那霉素的YEB(0.1%酵母提取物、0.5%牛肉膏、0.5%蛋白胨、0.5%蔗糖、0.5%硫酸镁x7H2O),并在28℃培养16到20小时。然后以6000g离心10分钟收获细菌悬浮液,并以产生约0.1到0.8的OD600的方式重悬浮于液体MS培养基。这一悬浮液用于与叶子材料共培养。
紧邻共培养之前,用细菌悬浮液替换储存叶子的MS培养基。室温及温和振荡下在农杆菌悬浮液中孵育叶子30分钟。然后将感染的外植体置于用琼脂(如0.8%的植物琼脂(Duchefa,NL))固化的具有生长调节剂(如3mg/l的苄氨基嘌呤(BAP)和1mg/l吲哚乙酸(IAA))的MS培养基上。叶子在培养基上的方向并不重要。外植体的培养进行1到8天,但优选6天,此过程中可使用以下条件光强度30-80μmol/m2x秒,温度22-24℃,16/8小时明/暗交替。然后,将共培养的外植体转移到新鲜MS培养基,优选具有相同生长调节剂,此第二培养基额外含有抑制细菌生长的抗生素。浓度为200到500mg/l的替曼汀特别适合这一目的。使用可用于选择成功转化的第二选择性组分。1到5mg/l浓度的膦丝菌素选择特别有效,但是也可以根据所用方法考虑其它选择性组分。
每次在1到3周后,将外植体转移到新鲜培养基直至形成胚芽和小芽,此后将其转移以植根于相同基础培养基,所述培养基含有替曼汀和PPT或替代组分,以及生长调节剂(即如0.5mg/l的吲哚丁酸(IBA)和0.5mg/l的赤霉酸GA3)。已生根的芽可以被转移到温室。
除所述方法外,可以进行以下有利的修改●在用细菌感染外植体以前,可以将其于上述共培养用的培养基上预孵育1到12天(优选3-4天)。然后如上述进行感染、共培养和选择性再生。
●再生的pH值(通常为5.8)可降为5.2。这样能改善对农杆菌生长的控制。
●向再生培养基加入AgNO3(3-10mg/l)能改善包括再生自身在内的培养条件。
●技术人员所知的减少苯酚形成的组分(如柠檬酸、抗坏血酸、PVP和许多其它组分)对于培养有利。
●整个过程可以使用液体培养基。也可以将培养物孵育在置于液体培养基上的可购支持物上。
根据上述转化方法,用以下表达构建体获得了下述株系用MSP106获得MSP106-1、MSP106-2、MSP106-3用MSP108获得MSP108-1、MSP108-2、MSP108-3用MSP110获得MSP110-1、MSP110-2、MSP110-3用MSP112获得MSP112-1、MSP112-2、MSP112-3用pCSEbhyd获得csebhyd-1、csebhyd1-2、csebhyd1-3用pMKP1获得mkp-1、mkp1-2、mkp1-3实施例15植物材料来源的类胡萝卜素酯的脂酶催化水解以及类胡萝卜素的鉴定一般方法a)用100%的丙酮抽提(3次500μl;每次振荡约15分钟)在研钵中碾磨的植物材料(湿重30-100mg)。将溶剂蒸发。然后将类胡萝卜素溶解于495μl丙酮,加入4.95ml磷酸钾缓冲液(100mM,pH 7.4)后充分混合溶液。然后加入约17mg胆汁盐(Sigma)以及149μl NaCl/CaCl2溶液(3MNaCl和75mM CaCl2)。将悬浮液在37℃孵育30分钟。为了酶促水解类胡萝卜素酯,加入595μl脂酶溶液(50mg/ml皱褶假丝酵母(Candidarugosa)来源的7型脂酶(Sigma))并在37℃振荡下孵育。约21小时后,再次加入595μl脂酶在37℃再孵育至少5小时。然后在溶液中溶解约700mgNa2SO4。加入1800μl石油醚后,通过剧烈振荡将类胡萝卜素抽提至有机相。重复这一振荡抽提直至有机相变为无色。合并石油醚级分并蒸发掉石油醚。用100-120μl丙酮吸收游离的类胡萝卜素。通过HPLC和C30反相柱方法,根据滞留时间和UV-VIS光谱鉴定游离的类胡萝卜素。
所用的胆汁盐或胆酸盐为胆酸盐与脱氧胆酸盐1∶1的混合物。
b)当植物材料中仅存在少量类胡萝卜素酯时采用的方法另外,也可以利用薄层层析法分离的皱褶假丝酵母来源的脂酶水解类胡萝卜素酯。为此,用约750μl丙酮抽提50-100mg植物材料3次。将溶剂抽提物在旋转蒸发器的真空中浓缩(可耐受升高温度至40-50℃)。随后加入300ul石油醚∶丙酮(比例5∶1)并充分混合。然后将悬浮物离心(1-2分钟)沉淀。将上层相转移到新的反应试管中。残留物再次用200ul石油醚∶丙酮(比例5∶1)抽提并离心去除悬浮物。将两次抽提物混合(体积500ul)并蒸发掉溶剂。残余物在30ul石油醚∶丙酮(比例5∶1)中重悬浮并铺在薄层板上(silica gel 60,Merck)。如果为制备/分析目的需要使用一次以上,每次应当按照薄层层析法分离所述的方法准备湿重为50-100mg的若干等分试样。
薄层板在石油醚∶丙酮(比例5∶1)中展开。可根据其颜色肉眼鉴别类胡萝卜素条带。刮下单个类胡萝卜素条带,并可为制备/分析目的而富集。用丙酮将类胡萝卜素从硅材料上洗脱;将溶剂在真空中蒸发。为水解类胡萝卜素酯,将残留物溶解于495μl丙酮中,并加入17mg胆汁盐(Sigma)、4.95ml 0.1M磷酸钾缓冲液(pH 7.4)以及149μl 3M NaCl+75mM CaCl2。充分混合后,将溶液在37℃平衡30分钟。随后加入595μl皱褶假丝酵母脂酶(Sigma,5mM CaCl2贮藏液中50mg/ml),并在37℃时振荡孵育过夜。约21小时后,再次加入等量的脂酶;将此混合物在37℃时再次振荡孵育至少5小时。然后加入约700mg Na2SO4(无水),加入1800μl石油醚振荡抽提该混合物约1分钟并在3500转/分钟下离心5分钟。将上层相转移到新的反应试管中,重复振荡抽提直至上层相变为无色。合并石油醚相在真空中浓缩(温度可以为40-50℃)。残余物溶解于120μl丙酮中,如需要可使用超声。利用C30柱通过HPLC方法分离溶解的类胡萝卜素,并借助参照物质定量。
实施例16游离类胡萝卜素的HPLC分析在以下条件下分析根据实施例15的工作步骤获取的样品设定了以下HPLC条件。
分离柱Prontosil C30柱,250×4.6mm,(Bischoff,Leonberg,Germany)流速1.0ml/min洗脱液洗脱液A-100%甲醇洗脱液B-80%甲醇、0.2%乙酸铵洗脱液C-100%叔丁基甲基醚检测300-530nm梯度曲线

某些根据本发明形成的类胡萝卜素特征性的迟滞时间为,例如,紫黄质11.7分钟,虾青素17.7分钟,金盏花黄质19分钟,金盏花玉红质19.9分钟,玉米黄质21分钟。
序列表序列表&lt;110&gt;太阳基因有限公司&lt;120&gt;在遗传修饰的非人类生物中制备酮式类胡萝卜素的方法&lt;130&gt;PF 55340&lt;160&gt;131&lt;170&gt;PatentIn版本3.1&lt;210&gt;1&lt;211&gt;1666&lt;212&gt;DNA&lt;213&gt;食用番茄&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1494)&lt;223&gt;
&lt;400&gt;1atg gaa gct ctt ctc aag cct ttt cca tct ctt tta ctt tcc tct cct 48Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser Pro1 5 10 15
aca ccc cat agg tct att ttc caa caa aat ccc tct ttt cta agt ccc 96Thr Pro His Arg Ser Ile Phe Gln Gln Asn Pro Ser Phe Leu Ser Pro20 25 30acc acc aaa aaa aaa tca aga aaa tgt ctt ctt aga aac aaa agt agt 144Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser35 40 45aaa ctt ttt tgt agc ttt ctt gat tta gca ccc aca tca aag cca gag 192Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu50 55 60tct tta gat gtt aac atc tca tgg gtt gat cct aat tcg aat cgg gct 240Ser Leu Asp Val Asn Ile Ser Trp Val Asp Pro Asn Ser Asn Arg Ala65 70 75 80caa ttc gac gtg atc att atc gga gct ggc cct gct ggg ctc agg cta 288Gln Phe Asp Val Ile Ile Ile Gly Ala Gly Pro Ala Gly Leu Arg Leu85 90 95gct gaa caa gtt tct aaa tat ggt att aag gta tgt tgt gtt gac cct 336Ala Glu Gln Val Ser Lys Tyr Gly Ile Lys Val Cys Cys Val Asp Pro100 105 110tca cca ctc tcc atg tgg cca aat aat tat ggt gtt tgg gtt gat gag 384Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu115 120 125ttt gag aat tta gga ctg gaa aat tgt tta gat cat aaa tgg cct atg 432Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met130 135 140act tgt gtg cat ata aat gat aac aaa act aag tat ttg gga aga cca 480Thr Cys Val His Ile Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro145 150 155 160tat ggt aga gtt agt aga aag aag ctg aag ttg aaa ttg ttg aat agt 528Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser165 170 175tgt gtt gag aac aga gtg aag ttt tat aaa gct aag gtt tgg aaa gtg 576Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val180 185 190gaa cat gaa gaa ttt gag tct tca att gtt tgt gat gat ggt aag aag 624Glu His Glu Glu Phe Glu Ser Ser Ile Val Cys Asp Asp Gly Lys Lys195 200 205
ata aga ggt agt ttg gtt gtg gat gca agt ggt ttt gct agt gat ttt 672Ile Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe210 215 220ata gag tat gac agg cca aga aac cat ggt tat caa att gct cat ggg 720Ile Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gln Ile Ala His Gly225 230 235 240gtt tta gta gaa gtt gat aat cat cca ttt gat ttg gat aaa atg gtg 768Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val245 250 255ctt atg gat tgg agg gat tct cat ttg ggt aat gag cca tat tta agg 816Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg260 265 270gtg aat aat gct aaa gaa cca aca ttc ttg tat gca atg cca ttt gat 864Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp275 280 285aga gat ttg gtt ttc ttg gaa gag act tct ttg gtg agt cgt cct gtt 912Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val290 295 300tta tcg tat atg gaa gta aaa aga agg atg gtg gca aga tta agg cat 960Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His305 310 315 320ttg ggg atc aaa gtg aaa agt gtt att gag gaa gag aaa tgt gtg atc1008Leu Gly Ile Lys Val Lys Ser Val Ile Glu Glu Glu Lys Cys Val Ile325 330 335cct atg gga gga cca ctt ccg cgg att cct caa aat gtt atg gct att1056Pro Met Gly Gly Pro Leu Pro Arg Ile Pro Gln Asn Val Met Ala Ile340 345 350ggt ggg aat tca ggg ata gtt cat cca tca aca ggg tac atg gtg gct1104Gly Gly Asn Ser Gly Ile Val His Pro Ser Thr Gly Tyr Met Val Ala355 360 365agg agc atg gct tta gca cca gta cta gct gaa gcc atc gtc gag ggg1152Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala Ile Val Glu Gly370 375 380ctt ggc tca aca aga atg ata aga ggg tct caa ctt tac cat aga gtt1200Leu Gly Ser Thr Arg Met Ile Arg Gly Ser Gln Leu Tyr His Arg Val385 390 395 400
tgg aat ggt ttg tgg cct ttg gat aga aga tgt gtt aga gaa tgt tat1248Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr405 410 415tca ttt ggg atg gag aca ttg ttg aag ctt gat ttg aaa ggg act agg1296Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg420 425 430aga ttg ttt gac gct ttc ttt gat ctt gat cct aaa tac tgg caa ggg1344Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gln Gly435 440 445ttc ctt tct tca aga ttg tct gtc aaa gaa ctt ggt tta ctc agc ttg1392Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu450 455 460tgt ctt ttc gga cat ggc tca aac atg act agg ttg gat att gtt aca1440Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp Ile Val Thr465 470 475 480aaa tgt cct ctt cct ttg gtt aga ctg att ggc aat cta gca ata gag1488Lys Cys Pro Leu Pro Leu Val Arg Leu Ile Gly Asn Leu Ala Ile Glu485 490 495agc ctt tgaatgtgaa aagtttgaat cattttcttc attttaattt ctttgattat 1544Ser Leutttcatattt tctcaattgc aaaagtgaga taagagctac atactgtcaa caaataaact 1604actattggaa agttaaaata tgtgtttgtt gtatgttatt ctaatggaat ggattttgta 1664aa 1666&lt;210&gt;2&lt;211&gt;498&lt;212&gt;PRT&lt;213&gt;食用番茄&lt;400&gt;2Met Glu Ala Leu Leu Lys pro Phe Pro Ser Leu Leu Leu Ser Ser Pro
1 5 10 15Thr Pro His Arg Ser Ile Phe Gln Gln Asn Pro Ser Phe Leu Ser Pro20 25 30Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser35 40 45Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu50 55 60Ser Leu Asp Val Asn Ile Ser Trp Val Asp Pro Asn Ser Asn Arg Ala65 70 75 80Gln Phe Asp Val Ile Ile Ile Gly Ala Gly Pro Ala Gly Leu Arg Leu85 90 95Ala Glu Gln Val Ser Lys Tyr Gly Ile Lys Val Cys Cys Val Asp Pro100 105 110Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu115 120 125Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met130 135 140Thr Cys Val His Ile Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro145 150 155 160Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser165 170 175Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val180 185 190Glu His Glu Glu Phe Glu Ser Ser Ile Val Cys Asp Asp Gly Lys Lys195 200 205
Ile Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe210 215 220Ile Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gln Ile Ala His Gly225 230 235 240Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val245 250 255Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg260 265 270Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp275 280 285Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val290 295 300Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His305 310 315 320Leu Gly Ile Lys Val Lys Ser Val Ile Glu Glu Glu Lys Cys Val Ile325 330 335Pro Met Gly Gly Pro Leu Pro Arg Ile Pro Gln Asn Val Met Ala Ile340 345 350Gly Gly Asn Ser Gly Ile Val His Pro Ser Thr Gly Tyr Met Val Ala355 360 365Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala Ile Val Glu Gly370 375 380Leu Gly Ser Thr Arg Met Ile Arg Gly Ser Gln Leu Tyr His Arg Val385 390 395 400Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr
405 410 415Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg420 425 430Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gln Gly435 440 445Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu450 455 460Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp Ile Val Thr465 470 475 480Lys Cys Pro Leu Pro Leu Val Arg Leu Ile Gly Asn Leu Ala Ile Glu485 490 495Ser Leu&lt;210&gt;3&lt;211&gt;1771&lt;212&gt;DNA&lt;213&gt;雨生红球藻&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(166)..(1155)&lt;223&gt;
&lt;400&gt;3ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60
aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag cta gca 177Met Gln Leu Ala1gcg aca gta atg ttg gag cag ctt acc gga agc gct gag gca ctc aag 225Ala Thr Val Met Leu Glu Gln Leu Thr Gly Ser Ala Glu Ala Leu Lys5 10 15 20gag aag gag aag gag gtt gca ggc agc tct gac gtg ttg cgt aca tgg 273Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp25 30 35gcg acc cag tac tcg ctt ccg tca gaa gag tca gac gcg gcc cgc ccg 321Ala Thr Gln Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro40 45 50gga ctg aag aat gcc tac aag cca cca cct tcc gac aca aag ggc atc 369Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly Ile55 60 65aca atg gcg cta cgt gtc atc ggc tcc tgg gcc gca gtg ttc ctc cac 417Thr Met Ala Leu Arg Val Ile Gly Ser Trp Ala Ala Val Phe Leu His70 75 80gcc att ttt caa atc aag ctt ccg acc tcc ttg gac cag ctg cac tgg 465Ala Ile Phe Gln Ile Lys Leu Pro Thr Ser Leu Asp Gln Leu His Trp85 90 95 100ctg ccc gtg tca gat gcc aca gct cag ctg gtt agc ggc acg agc agc 513Leu Pro Val Ser Asp Ala Thr Ala Gln Leu Val Ser Gly Thr Ser Ser105 110 115ctg ctc gac atc gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 561Leu Leu Asp Ile Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr120 125 130ggc ctt ttt atc acc acg cat gat gct atg cat ggc acc atc gcc atg 609Gly Leu Phe Ile Thr Thr His Asp Ala Met His Gly Thr Ile Ala Met135 140 145aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc atc tcc ttg 657Arg Asn Arg Gln Leu Asn Asp Phe Leu Gly Arg Val Cys Ile Ser Leu150 155 160tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 705Tyr Ala Trp phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His165 170 175 180
cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga753His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly185 190 195aac cct ggc att gtg ccc tgg ttt gcc agc ttc atg tcc agc tac atg801Asn Pro Gly Ile Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met200 205 210tcg atg tgg cag ttt gcg cgc ctc gca tgg tgg acg gtg gtc atg cag849Ser Met Trp Gln Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gln215 220 225ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg897Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala230 235 240ccc atc ctg tcc gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc945pro Ile Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro245 250 255 260cac aag cct gag cct ggc gcc gcg tca ggc tct tca cca gcc gtc atg993His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met265 270 275aac tgg tgg aag tcg cgc act agc cag gcg tcc gac ctg gtc agc ttt1041Asn Trp Trp Lys Ser Arg Thr Ser Gln Ala Ser Asp Leu Val Ser Phe280 285 290ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc1089Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro295 300 305ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga1137Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg310 315 320ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 1185Gly Leu Val Pro Ala325gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 1245gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 1305tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 1365acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 1425tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485
aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 1605agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 1665agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 1725ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 1771&lt;210&gt;4&lt;211&gt;329&lt;212&gt;PRT&lt;213&gt;雨生红球藻&lt;400&gt;4Met Gln Leu Ala Ala Thr Val Met Leu Glu Gln Leu Thr Gly Ser Ala1 5 10 15Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val20 25 30Leu Arg Thr Trp Ala Thr Gln Tyr Ser Leu Pro Ser Glu Glu Ser Asp35 40 45Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp50 55 60Thr Lys Gly Ile Thr Met Ala Leu Arg Val Ile Gly Ser Trp Ala Ala65 70 75 80Val Phe Leu His Ala Ile Phe Gln Ile Lys Leu Pro Thr Ser Leu Asp85 90 95Gln Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gln Leu Val Ser
100 105 110Gly Thr Ser Ser Leu Leu Asp Ile Val Val Val Phe Phe Val Leu Glu115 120 125Phe Leu Tyr Thr Gly Leu Phe Ile Thr Thr His Asp Ala Met His Gly130 135 140Thr Ile Ala Met Arg Asn Arg Gln Leu Asn Asp Phe Leu Gly Arg Val145 150 155 160Cys Ile Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys165 170 175His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp180 185 190Phe His Arg Gly Asn Pro Gly Ile Val Pro Trp Phe Ala Ser Phe Met195 200 205Ser Ser Tyr Met Ser Met Trp Gln Phe Ala Arg Leu Ala Trp Trp Thr210 215 220Val Val Met Gln Leu Leu Gly Ala pro Met Ala Asn Leu Leu Val Phe225 230 235 240Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly245 250 255Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser260 265 270Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gln Ala Ser Asp275 280 285Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His290 295 300
His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg305 310 315 320Leu Ser Gly Arg Gly Leu Val Pro Ala325&lt;210&gt;5&lt;211&gt;1163&lt;212&gt;DNA&lt;213&gt;食用番茄&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(942)&lt;223&gt;
&lt;400&gt;5att cgg cac gag att tca gcc tcc gct agt tcc cga acc att cgc ctc 48Ile Arg His Glu Ile Ser Ala Ser Ala Ser Ser Arg Thr Ile Arg Leu1 5 10 15cgt cat aac ccg ttt ctc agt cca aaa tcc gcc tca acc gcc ccg ccg 96Arg His Asn Pro Phe Leu Ser Pro Lys Ser Ala Ser Thr Ala Pro Pro20 25 30gtt ctg ttc ttc tct ccg tta act cgc aat ttt ggc gca att ttg ctg 144Val Leu Phe Phe Ser pro Leu Thr Arg Asn Phe Gly Ala Ile Leu Leu35 40 45tct aga aga aag ccg aga ttg gcg gtt tgt ttt gtg ctg gag aat gag 192Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe Val Leu Glu Asn Glu50 55 60aaa ttg aat agt act atc gaa agt gag agt gaa gta ata gag gat cgg 240Lys Leu Asn Ser Thr Ile Glu Ser Glu Ser Glu Val Ile Glu Asp Arg65 70 75 80
ata caa gta gag att aat gag gag aag agt tta gct gcc agt tgg ctg288Ile Gln Val Glu Ile Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu85 90 95gcg gag aaa ttg gcg agg aag aaa tcg gag agg ttt act tat ctt gtg336Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val100 105 110gca gct gtg atg tct agt ttg ggg att act tct atg gcg att ttg gcg384Ala Ala Val Met Ser Ser Leu Gly Ile Thr Ser Met Ala Ile Leu Ala115 120 125gtt tat tac aga ttt tca tgg caa atg gag ggt gga gaa gtg cct ttt432Val Tyr Tyr Arg Phe Ser Trp Gln Met Glu Gly Gly Glu Val Pro Phe130 135 140tct gaa atg tta gct aca ttc act ctc tcg ttt ggc gct gcc gta gga480Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala Ala Val Gly145 150 155 160atg gag tac tgg gcg aga tgg gct cat aga gca cta tgg cat gct tct528Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser165 170 175tta tgg cac atg cac gag tcg cac cat aga cca aga gaa gga cct ttt576Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe180 185 190gag atg aac gac gtt ttc gcc ata aca aat gct gtt cca gct ata ggt624Glu Met Asn Asp Val Phe Ala Ile Thr Asn Ala Val Pro Ala Ile Gly195 200 205ctt ctt tcc tac ggt ttc ttc cat aaa ggg atc gtc cct ggc ctc tgt672Leu Leu Ser Tyr Gly Phe Phe His Lys Gly Ile Val Pro Gly Leu Cys210 215 220ttc ggc gct gga ttg ggg atc aca gta ttt ggg atg gct tac atg ttc720Phe Gly Ala Gly Leu Gly Ile Thr Val Phe Gly Met Ala Tyr Met Phe225 230 235 240gtt cac gat gga ctg gtt cat aag aga ttt ccc gta ggg cct att gcc768Val His Asp Gly Leu Val His Lys Arg Phe pro Val Gly Pro Ile Ala245 250 255aac gtg cct tac ttt cgg agg gta gct gca gca cat cag ctt cat cac816Asn Val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gln Leu His His260 265 270
tcg gac aaa ttt gat ggt gtc cca tat ggc ttg ttt cta gga cct aag864Ser Asp Lys Phe Asp Gly Val Pro Tyr Gly Leu Phe Leu Gly Pro Lys275 280 285gaa ttg gaa gaa gta gga gga ctt gaa gag tta gaa aag gaa gtc aac912Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn290 295 300cga agg att aaa att tct aag gga tta tta tgatcaaaag atacgtctga 962Arg Arg Ile Lys Ile Ser Lys Gly Leu Leu305 310taataataaa atgcgattgt atttaggctg tagattatta ttgggaaaaa gatagaaaga 1022tatatatatg aatataatat aaaatgcaac aagctttcta tggagaagac cttttctttt 1082ttggtacctg tacgtaaaag gtgaacaatt tgatgtccta gtacttgttg acaaaccaga 1142agaacgataa ttcaaaacaa a 1163&lt;210&gt;6&lt;211&gt;314&lt;212&gt;PRT&lt;213&gt;食用番茄&lt;400&gt;6Ile Arg His Glu Ile Ser Ala Ser Ala Ser Ser Arg Thr Ile Arg Leu1 5 10 15Arg His Asn pro Phe Leu Ser Pro Lys Ser Ala Ser Thr Ala Pro Pro20 25 30Val Leu phe phe Ser Pro Leu Thr Arg Asn Phe Gly Ala Ile Leu Leu35 40 45Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe Val Leu Glu Asn Glu50 55 60
Lys Leu Asn Ser Thr Ile Glu Ser Glu Ser Glu Val Ile Glu Asp Arg65 70 75 80Ile Gln Val Glu Ile Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu85 90 95Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val100 105 110Ala Ala Val Met Ser Ser Leu Gly Ile Thr Ser Met Ala Ile Leu Ala115 120 125Val Tyr Tyr Arg Phe Ser Trp Gln Met Glu Gly Gly Glu Val Pro Phe130 135 140Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala Ala Val Gly145 150 155 160Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser165 170 175Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe180 185 190Glu Met Asn Asp Val Phe Ala Ile Thr Asn Ala Val Pro Ala Ile Gly195 200 205Leu Leu Ser Tyr Gly Phe Phe His Lys Gly Ile Val pro Gly Leu Cys210 215 220Phe Gly Ala Gly Leu Gly Ile Thr Val Phe Gly Met Ala Tyr Met phe225 230 235 240Val His Asp Gly Leu Val His Lys Arg Phe Pro Val Gly Pro Ile Ala245 250 255Asn Val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gln Leu His His
260 265 270Ser Asp Lys Phe Asp Gly Val Pro Tyr Gly Leu Phe Leu Gly Pro Lys275 280 285Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn290 295 300Arg Arg Ile Lys Ile Ser Lys Gly Leu Leu305 310&lt;210&gt;7&lt;211&gt;1779&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1779)&lt;223&gt;
&lt;400&gt;7atg gat ctc cgt cgg agg cct cct aaa cca ccg gtt acc aac aac aac48Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Pro Val Thr Asn Asn Asn1 5 10 15aac tcc aac gga tct ttc cgt tct tat cag cct cgc act tcc gat gac96Asn Ser Asn Gly Ser Phe Arg Ser Tyr Gln Pro Arg Thr Ser Asp Asp20 25 30gat cat cgt cgc cgg gct aca aca att gct cct cca ccg aaa gca tcc144Asp His Arg Arg Arg Ala Thr Thr Ile Ala Pro Pro Pro Lys Ala Ser35 40 45gac gcg ctt cct ctt ccg tta tat ctc aca aac gcc gtt ttc ttc acg192Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr
50 55 60ctc ttc ttc tcc gtc gcg tat tac ctc ctc cac cgg tgg cgt gac aag240Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys65 70 75 80atc cgt tac aat acg cct ctt cac gtc gtc act atc aca gaa ctc ggc288Ile Arg Tyr Asn Thr Pro Leu His Val Val Thr Ile Thr Glu Leu Gly85 90 95gcc att att gct ctc atc gct tcg ttt atc tat ctc cta ggg ttt ttt336Ala Ile Ile Ala Leu Ile Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe100 105 110ggt att gac ttt gtt cag tca ttt atc tca cgt gcc tct ggt gat gct384Gly Ile Asp Phe Val Gln Ser Phe Ile Ser Arg Ala Ser Gly Asp Ala115 120 125tgg gat ctc gcc gat acg atc gat gat gat gac cac cgc ctt gtc acg432Trp Asp Leu Ala Asp Thr Ile Asp Asp Asp Asp His Arg Leu Val Thr130 135 140tgc tct cca ccg act ccg atc gtt tcc gtt gct aaa tta cct aat ccg480Cys Ser Pro Pro Thr Pro Ile Val Ser Val Ala Lys Leu Pro Asn Pro145 150 155 160gaa cct att gtt acc gaa tcg ctt cct gag gaa gac gag gag att gtg528Glu Pro Ile Val Thr Glu Ser Leu Pro Glu Glu Asp Glu Glu Ile Val165 170 175aaa tcg gtt atc gac gga gtt att cca tcg tac tcg ctt gaa tct cgt576Lys Ser Val Ile Asp Gly Val Ile Pro Ser Tyr Ser Leu Glu Ser Arg180 185 190ctc ggt gat tgc aaa aga gcg gcg tcg att cgt cgt gag gcg ttg cag624Leu Gly Asp Cys Lys Arg Ala Ala Ser Ile Arg Arg Glu Ala Leu Gln195 200 205aga gtc acc ggg aga tcg att gaa ggg tta ccg ttg gat gga ttt gat672Arg Val Thr Gly Arg Ser Ile Glu Gly Leu Pro Leu Asp Gly Phe Asp210 215 220tat gaa tcg att ttg ggg caa tgc tgt gag atg cct gtt gga tac att720Tyr Glu Ser Ile Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr Ile225 230235240cag att cct gtt ggg act gct ggt cca ttg ttg ctt gat ggt tat gag768Gln Ile Pro Val Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu245 250 255
tac tct gtt cct atg gct aca acc gaa ggt tgt ttg gtt gct agc act816Tyr Ser Val Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr260 265 270aac aga ggc tgc aag gct atg ttt atc tct ggt ggc gcc acc agt acc864Asn Arg Gly Cys Lys Ala Met Phe Ile Ser Gly Gly Ala Thr Ser Thr275 280 285gtt ctt aag gac ggt atg acc cga gca cct gtt gtt cgg ttc gct tcg912Val Leu Lys Asp Gly Met Thr Arg Ala Pro Val Val Arg Phe Ala Ser290 295 300gcg aga cga gct tcg gag ctt aag ttt ttc ttg gag aat cca gag aac960Ala Arg Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Agn Pro Glu Asn305 310 315 320ttt gat act ttg gca gta gtc ttc aac agg tcg agt aga ttt gca aga1008Phe Asp Thr Leu Ala Val Val Phe Asn Arg Ser Ser Arg Phe Ala Arg325 330 335ctg caa agt gtt aaa tgc aca atc gcg ggg aag aat gct tat gta agg1056Leu Gln Ser Val Lys Cys Thr Ile Ala Gly Lys Asn Ala Tyr Val Arg340 345 350ttc tgt tgt agt act ggt gat gct atg ggg atg aat atg gtt tct aaa1104Phe Cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys355 360 365ggt gtg cag aat gtt ctt gag tat ctt acc gat gat ttc cct gac atg1152Gly Val Gln Asn Val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met370 375 380gat gtg att gga atc tct ggt aac ttc tgt tcg gac aag aaa cct gct1200Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys Lys Pro Ala385 390 395 400gct gtg aac tgg att gag gga cgt ggt aaa tca gtt gtt tgc gag gct1248Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala405 410 415gta atc aga gga gag atc gtg aac aag gtc ttg aaa acg agc gtg gct1296Val Ile Arg Gly Glu Ile Val Asn Lys Val Leu Lys Thr Ser Val Ala420 425 430gct tta gtc gag ctc aac atg ctc aag aac cta gct ggc tct gct gtt1344Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly Ser Ala Val435 440 445gca ggc tct cta ggt gga ttc aac gct cat gcc agt aac ata gtg tct1392
Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn Ile Val Ser450 455 460gct gta ttc ata gct act ggc caa gat cca gct caa aac gtg gag agt1440Ala Val Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser465 470 475 480tct caa tgc atc acc atg atg gaa gct att aat gac ggc aaa gat atc1488Ser Gln Cys Ile Thr Met Met Glu Ala Ile Asn Asp Gly Lys Asp Ile485 490 495cat atc tca gtc act atg cca tct atc gag gtg ggg aca gtg gga gga1536His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly500 505 510gga aca cag ctt gca tct caa tca gcg tgt tta aac ctg ctc gga gtt1584Gly Thr Gln Leu Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val515 520 525aaa gga gca agc aca gag tcg ccg gga atg aac gca agg agg cta gcg1632Lys Gly Ala Ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala530 535 540
acg atc gta gcc gga gca gtt tta gct gga gag tta tct tta atg tca1680Thr Ile Val Ala Gly Ala Val Leu Ala Gly Glu Leu Ser Leu Met Ser545 550 555 560gca att gca gct gga cag ctt gtg aga agt cac atg aaa tac aat aga1728Ala Ile Ala Ala Gly Gln Leu Val Arg Ser His Met Lys Tyr Asn Arg565 570 575tcc agc cga gac atc tct gga gca acg aca acg aca aca aca aca aca1776Ser Ser Arg Asp Ile Ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr580 585 590tga1779&lt;210&gt;8&lt;211&gt;592&lt;212&gt;PRT&lt;213&gt;拟南芥&lt;400&gt;8
Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Pro Val Thr Asn Asn Asn1 5 10 15Asn Ser Asn Gly Ser Phe Arg Ser Tyr Gln Pro Arg Thr Ser Asp Asp20 25 30Asp His Arg Arg Arg Ala Thr Thr Ile Ala Pro Pro Pro Lys Ala Ser35 40 45Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr50 55 60Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys65 70 75 80Ile Arg Tyr Asn Thr Pro Leu His Val Val Thr Ile Thr Glu Leu Gly85 90 95Ala Ile Ile Ala Leu Ile Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe100 105 110Gly Ile Asp Phe Val Gln Ser Phe Ile Ser Arg Ala Ser Gly Asp Ala115 120 125Trp Asp Leu Ala Asp Thr Ile Asp Asp Asp Asp His Arg Leu Val Thr130 135 140Cys Ser Pro Pro Thr Pro Ile Val Ser Val Ala Lys Leu Pro Asn Prol45 1S0 155 160Glu Pro Ile Val Thr Glu Ser Leu Pro Glu Glu Asp Glu Glu Ile Val165 170 175Lys Ser Val Ile Asp Gly Val Ile Pro Ser Tyr Ser Leu Glu Ser Arg180 185 190Leu Gly Asp Cys Lys Arg Ala Ala Ser Ile Arg Arg Glu Ala Leu Gln
195 200 205Arg Val Thr Gly Arg Ser Ile Glu Gly Leu Pro Leu Asp Gly Phe Asp210 215 220Tyr Glu Ser Ile Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr Ile225 230 235 240Gln Ile Pro Val Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu245 250 255Tyr Ser Val Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr260 265 270Asn Arg Gly Cys Lys Ala Met Phe Ile Ser Gly Gly Ala Thr Ser Thr275 280 285Val Leu Lys Asp Gly Met Thr Arg Ala Pro Val Val Arg Phe Ala Ser290 295 300Ala Arg Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Asn Pro Glu Asn305 310 315 320Phe Asp Thr Leu Ala Val Val Phe Asn Arg Ser Ser Arg Phe Ala Arg325 330 335Leu Gln Ser Val Lys Cys Thr Ile Ala Gly Lys Asn Ala Tyr Val Arg340 345 350Phe Cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys355 360 365Gly Val Gln Asn Val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met370 375 380Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys Lys Pro Ala385 390 395 400
Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala405 410 415Val Ile Arg Gly Glu Ile Val Asn Lys Val Leu Lys Thr Ser Val Ala420 425 430Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly Ser Ala Val435 440 445Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn Ile Val Ser450 455 460Ala Val Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser465 470 475 480Ser Gln Cys Ile Thr Met Met Glu Ala Ile Asn Asp Gly Lys Asp Ile485 490 495His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly500 505 510Gly Thr Gln Leu Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val515 520 525Lys Gly Ala Ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala530 535 540Thr Ile Val Ala Gly Ala Val Leu Ala Gly Glu Leu Ser Leu Met Ser545 550 555 560Ala Ile Ala Ala Gly Gln Leu Val Arg Ser His Met Lys Tyr Asn Arg565 570 575Ser Ser Arg Asp Ile Ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr580 585 590
&lt;210&gt;9&lt;21l&gt;1401&lt;212&gt;DNA&lt;213&gt;拟南芥ISPH&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1401)&lt;223&gt;
&lt;400&gt;9atg gct gtt gcg ctc caa ttc agc cga tta tgc gtt cga ccg gat act 48Met Ala Val Ala Leu Gln Phe Ser Arg Leu Cys Val Arg Pro Asp Thr1 5 10 15ttc gtg cgg gag aat cat ctc tct gga tcc gga tct ctc cgc cgc cgg 96Phe Val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg20 25 30aaa gct tta tca gtc cgg tgc tcg tct ggc gat gag aac gct cct tcg144Lys Ala Leu Ser Val Arg Cys Ser Ser Gly Asp Glu Asn Ala Pro Ser35 40 45cca tcg gtg gtg atg gac tcc gat ttc gac gcc aag gtg ttc cgt aag192Pro Ser Val Val Met Asp Ser Asp Phe Asp Ala Lys Val Phe Arg Lys50 55 60aac ttg acg aga agc gat aat tac aat cgt aaa ggg ttc ggt cat aag240Asn Leu Thr Arg Ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys65 70 75 80gag gag aca ctc aag ctc atg aat cga gag tac acc agt gat ata ttg288Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr Ser Asp Ile Leu85 90 95gag aca ctg aaa aca aat ggg tat act tat tct tgg gga gat gtt act336Glu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr Ser Trp Gly Asp Val Thr100 105 110
gtg aaa ctc gct aaa gca tat ggt ttt tgc tgg ggt gtt gag cgt gct384Val Lys Leu Ala Lys Ala Tyr Gly Phe Cys Trp Gly Val Glu Arg Ala115 120 125gtt cag att gca tat gaa gca cga aag cag ttt cca gag gag agg ctt432Val Gln Ile Ala Tyr Glu Ala Arg Lys Gln Phe Pro Glu Glu Arg Leu130 135 140tgg att act aac gaa atc att cat aac ccg acc gtc aat aag agg ttg480Trp Ile Thr Asn Glu Ile Ile His Asn Pro Thr Val Asn Lys Arg Leu145 150 155 160gaa gat atg gat gtt aaa att att ccg gtt gag gat tca aag aaa cag528Glu Asp Met Asp Val Lys Ile Ile Pro Val Glu Asp Ser Lys Lys Gln165 170 175ttt gat gta gta gag aaa gat gat gtg gtt atc ctt cct gcg ttt gga576Phe Asp Val Val Glu Lys Asp Asp Val Val Ile Leu Pro Ala Phe Gly180 185 190gct ggt gtt gac gag atg tat gtt ctt aat gat aaa aag gtg caa att624Ala Gly Val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys Val Gln Ile195 200 205gtt gac acg act tgt cct tgg gtg aca aag gtc tgg aac acg gtt gag672Val Asp Thr Thr Cys Pro Trp Val Thr Lys Val Trp Asn Thr Val Glu210 215 220aag cac aag aag ggg gaa tac aca tca gta atc cat ggt aaa tat aat720Lys His Lys Lys Gly Glu Tyr Thr Ser Val Ile His Gly Lys Tyr Asn225 230 235 240cat gaa gag acg att gca act gcg tct ttt gca gga aag tac atc att768His Glu Glu Thr Ile Ala Thr Ala Ser Phe Ala Gly Lys Tyr Ile Ile245 250 255gta aag aac atg aaa gag gca aat tac gtt tgt gat tac att ctc ggt816Val Lys Asn Met Lys Glu Ala Asn Tyr Val Cys Asp Tyr Ile Leu Gly260 265 270ggc caa tac gat gga tct agc tcc aca aaa gag gag ttc atg gag aaa864Gly Gln Tyr Asp Gly Ser Ser Ser Thr Lys Glu Glu Phe Met Glu Lys275 280 285ttc aaa tac gca att tcg aag ggt ttc gat ccc gac aat gac ctt gtc912Phe Lys Tyr Ala Ile Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu Val290 295 300
aaa gtt ggt att gca aac caa aca acg atg cta aag gga gaa aca gag 960Lys Val Gly Ile Ala Asn Gln Thr Thr Met Leu Lys Gly Glu Thr Glu305 310 315 320gag ata gga aga tta ctc gag aca aca atg atg cgc aag tat gga gtg1008Glu Ile Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Gly Val325 330 335gaa aat gta agc gga cat ttc atc agc ttc aac aca ata tgc gac gct1056Glu Asn Val Ser Gly His Phe Ile Ser Phe Asn Thr Ile Cys Asp Ala340 345 350act caa gag cga caa gac gca atc tat gag cta gtg gaa gag aag att1104Thr Gln Glu Arg Gln Asp Ala Ile Tyr Glu Leu Val Glu Glu Lys Ile355 360 365gac ctc atg cta gtg gtt ggc gga tgg aat tca agt aac acc tct cac1152Asp Leu Met Leu Val Val Gly Gly Trp Asn Ser Ser Asn Thr Ser His370 375 380ctt cag gaa atc tca gag gca cgg gga atc cca tct tac tgg atc gat1200Leu Gln Glu Ile Ser Glu Ala Arg Gly Ile Pro Ser Tyr Trp Ile Asp385 390 395 400agt gag aaa cgg ata gga cct ggg aat aaa ata gcc tat aag ctc cac1248Ser Glu Lys Arg Ile Gly Pro Gly Asn Lys Ile Ala Tyr Lys Leu His405 410 415tat gga gaa ctg gtc gag aag gaa aac ttt ctc cca aag gga cca ata1296Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro Ile420 425 430aca atc ggt gtg aca tca ggt gca tca acc ccg gat aag gtc gtg gaa1344Thr Ile Gly Val Thr Ser Gly Ala Ser Thr Pro Asp Lys Val Val Glu435 440 445gat gct ttg gtg aag gtg ttc gac att aaa cgt gaa gag tta ttg cag1392Asp Ala Leu Val Lys Val Phe Asp Ile Lys Arg Glu Glu Leu Leu Gln450 455 460ctg gct tga1401Leu Ala465&lt;210&gt;10
&lt;211&gt;466&lt;212&gt;PRT&lt;213&gt;拟南芥ISPH&lt;400&gt;10Met Ala Val Ala Leu Gln Phe Ser Arg Leu Cys Val Arg Pro Asp Thr1 5 10 15Phe Val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg20 25 30Lys Ala Leu Ser Val Arg Cys Ser Ser Gly Asp Glu Asn Ala Pro Ser35 40 45Pro Ser Val Val Met Asp Ser Asp Phe Asp Ala Lys Val Phe Arg Lys50 55 60Asn Leu Thr Arg Ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys65 70 75 80Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr Ser Asp Ile Leu85 90 95Glu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr Ser Trp Gly Asp Val Thr100 105 110Val Lys Leu Ala Lys Ala Tyr Gly Phe Cys Trp Gly Val Glu Arg Ala115 120 125Val Gln Ile Ala Tyr Glu Ala Arg Lys Gln Phe Pro Glu Glu Arg Leu130 135 140Trp Ile Thr Asn Glu Ile Ile His Asn Pro Thr Val Asn Lys Arg Leu145 150 155 160
Glu Asp Met Asp Val Lys Ile Ile Pro Val Glu Asp Ser Lys Lys Gln165 170 175Phe Asp Val Val Glu Lys Asp Asp Val Val Ile Leu Pro Ala Phe Gly180 185 190Ala Gly Val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys Val Gln Ile195 200 205Val Asp Thr Thr Cys Pro Trp Val Thr Lys Val Trp Asn Thr Val Glu210 215 220Lys His Lys Lys Gly Glu Tyr Thr Ser Val Ile His Gly Lys Tyr Asn225 230 235 240His Glu Glu Thr Ile Ala Thr Ala Ser Phe Ala Gly Lys Tyr Ile Ile245 250 255Val Lys Asn Met Lys Glu Ala Asn Tyr Val Cys Asp Tyr Ile Leu Gly260 265 270Gly Gln Tyr Asp Gly Ser Ser Ser Thr Lys Glu Glu Phe Met Glu Lys275 280 285Phe Lys Tyr Ala Ile Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu Val290 295 300Lys Val Gly Ile Ala Asn Gln Thr Thr Met Leu Lys Gly Glu Thr Glu305 310 315 320Glu Ile Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Gly Val325 330 335Glu Asn Val Ser Gly His Phe Ile Ser Phe Asn Thr Ile Cys Asp Ala340 345 350
Thr Gln Glu Arg Gln Asp Ala Ile Tyr Glu Leu Val Glu Glu Lys Ile355 360 365Asp Leu Met Leu Val Val Gly Gly Trp Asn Ser Ser Asn Thr Ser His370 375 380Leu Gln Glu Ile Ser Glu Ala Arg Gly Ile Pro Ser Tyr Trp Ile Asp385 390 395 400Ser Glu Lys Arg Ile Gly Pro Gly Asn Lys Ile Ala Tyr Lys Leu His405 410 415Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro Ile420 425 430Thr Ile Gly Val Thr Ser Gly Ala Ser Thr Pro Asp Lys Val Val Glu435 440 445Asp Ala Leu Val Lys Val Phe Asp Ile Lys Arg Glu Glu Leu Leu Gln450 455 460Leu Ala465&lt;210&gt;11&lt;211&gt;2160&lt;212&gt;DNA&lt;213&gt;食用番茄&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(2160)&lt;223&gt;
&lt;400&gt;11atg gct ttg tgt gct tat gca ttt cct ggg att ttg aac agg act ggt 48Met Ala Leu Cys Ala Tyr Ala Phe Pro Gly Ile Leu Asn Arg Thr Gly1 5 10 15gtg gtt tca gat tct tct aag gca acc cct ttg ttc tct gga tgg att 96Val Val Ser Asp Ser Ser Lys Ala Thr Pro Leu Phe Ser Gly Trp Ile20 25 30cat gga aca gat ctg cag ttt ttg ttc caa cac aag ctt act cat gag144His Gly Thr Asp Leu Gln Phe Leu Phe Gln His Lys Leu Thr His Glu35 40 45gtc aag aaa aggtca cgt gtg gtt cag gct tcc tta tca gaa tct gga 192Va1 Lys Lys Arg Ser Arg Val Val Gln Ala Ser Leu Ser Glu Ser Gly50 55 60gaa tac tac aca cag aga ccg cca acg cct att ttg gac act gtg aac240Glu Tyr Tyr Thr Gln Arg Pro pro Thr Pro Ile Leu Asp Thr Val Asn65 70 75 80tat ccc att cat atg aaa aat ctg tct ctg aag gaa ctt aaa caa cta288Tyr Pro Ile His Met Lys Asn Leu Ser Leu Lys Glu Leu Lys Gln Leu85 90 95gca gat gaa cta agg tca gat aca att ttc aat gta tca aag act ggg336Ala Asp Glu Leu Arg Ser Asp Thr Ile Phe Asn Val Ser Lys Thr Gly100 105 110ggt cac ctt ggc tca agt ctt ggt gtt gtt gag ctg act gtt gct ctt384Gly His Leu Gly Ser Ser Leu Gly Val Val Glu Leu Thr Val Ala Leu115 120 125cat tat gtc ttc aat gca ccg caa gat agg att ctc tgg gat gtt ggt432His Tyr Val Phe Asn Ala Pro Gln Asp Arg Ile Leu Trp Asp Val Gly130 135 140cat cag tct tat cct cac aaa atc ttg act ggt aga agg gac aag atg480His Gln Ser Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Met145 150 155 160tcg aca tta agg cag aca gat ggt ctt gca gga ttt act aag cga tcg528Ser Thr Leu Arg Gln Thr Asp Gly Leu Ala Gly phe Thr Lys Arg Ser165 170 175gag agt gaa tat gat tgc ttt ggc acc ggc cac agt tcc acc acc atc576Glu Ser Glu Tyr Asp Cys Phe Gly Thr Gly His Ser Ser Thr Thr Ile
180 185 190tca gca ggc cta ggg atg gct gtt ggt aga gat cta aaa gga aga aac 624Ser Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu Lys Gly Arg Asn195 200 205aac aat gtt att gcc gta ata ggt gat ggt gcc atg aca gca ggt caa 672Asn Asn Val Ile Ala Val Ile Gly Asp Gly Ala Met Thr Ala Gly Gln210 215 220gct tat gaa gcc atg aat aat gct ggt tac ctg gac tct gac atg att 720Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp Ser Asp Met Ile225 230 235 240gtt atc tta aac gac aat aga caa gtt tct tta cct act gct act ctg 768Val Ile Leu Asn Asp Asn Arg Gln Val Ser Leu Pro Thr Ala Thr Leu245 250 255gat ggg cca gtt gct cct gtt gga gct cta agt agt gct ttg agc agg 816Asp Gly Pro Val Ala Pro Val Gly Ala Leu Ser Ser Ala Leu Ser Arg260 265 270tta cag tct aat agg cct ctc aga gaa cta aga gaa gtc gca aag gga 864Leu Gln Ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly275 280 285gtt act aag cag att ggt ggt cct atg cat gag ctt gct gca aaa gtt 912Val Thr Lys Gln Ile Gly Gly Pro Met His Glu Leu Ala Ala Lys Val290 295 300gat gaa tat gct cgt ggc atg att agt ggt tct gga tca aca ttg ttt 960Asp Glu Tyr Ala Arg Gly Met Ile Ser Gly Ser Gly Ser Thr Leu Phe305 310 315 320gaa gaa ctt gga ctt tac tat att ggt cct gtg gat ggt cac aac att1008Glu Glu Leu Gly Leu Tyr Tyr Ile Gly Pro Val Asp Gly His Asn Ile325 330 335gat gat cta att gcg att ctc aaa gag gtt aga agt act aaa aca aca1056Asp Asp Leu Ile Ala Ile Leu Lys Glu Val Arg Ser Thr Lys Thr Thr340 345 350ggt cca gta ctg atc cat gtt gtc act gag aaa ggc aga ggt tat cca1104Gly Pro Val Leu Ile His Val Val Thr Glu Lys Gly Arg Gly Tyr Pro355 360 365tat gct gag aga gct gca gat aag tat cat gga gtt gcc aag ttt gat1152Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His Gly Val Ala Lys Phe Asp370 375 380
cca gca aca gga aag caa ttc aaa gcc agt gcc aag aca cag tcc tat1200Pro Ala Thr Gly Lys Gln Phe Lys Ala Ser Ala Lys Thr Gln Ser Tyr385 390 395 400aca aca tat ttt gcc gag gct tta att gca gaa gca gaa gca gat aaa1248Thr Thr Tyr phe Ala Glu Ala Leu Ile Ala Glu Ala Glu Ala Asp Lys405 410 415gac att gtt gca atc cat gct gcc atg ggg ggt ggg acc gga atg aac1296Asp Ile Val Ala Ile His Ala Ala Met Gly Gly Gly Thr Gly Met Asn420 425 430ctt ttc cat cgt cgc ttc cca aca agg tgt ttt gat gtt gga ata gca1344Leu Phe His Arg Arg Phe Pro Thr Arg Cys Phe Asp Val Gly Ile Ala435 440 445gaa caa cat gca gta acc ttt gct gct gga ttg gct tgt gaa ggc att1392Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Cys Glu Gly Ile450 455 460aaa cct ttc tgt gca atc tat tcg tct ttc atg cag agg gct tat gac1440Lys Pro Phe Cys Ala Ile Tyr Ser Ser Phe Met Gln Arg Ala Tyr Asp465 470 475 480cag gta gtg cat gac gtt gat ttg caa aag ctg ccc gtg agg ttt gca1488Gln Va1 Val His Asp Val Asp Leu Gln Lys Leu Pro Val Arg Phe Ala485 490 495atg gac aga gca ggt ctt gtt gga gca gat ggt cca aca cat tgt ggt1536Met Asp Arg Ala Gly Leu Val Gly Ala Asp Gly Pro Thr His Cys Gly500 505 510gca ttt gat gtt act tac atg gca tgt ctt cct aac atg gtt gta atg1584Ala Phe Asp Val Thr Tyr Met Ala Cys Leu Pro Asn Met Val Val Met515 520 525gct cct tct gat gaa gcg gag cta ttt cac atg gta gca act gct gcc1632Ala Pro Ser Asp Glu Ala Glu Leu Phe His Met Val Ala Thr Ala Ala530 535 540gcc att gat gac aga cca agt tgt ttt aga tac cca aga gga aat ggg1680Ala Ile Asp Asp Arg Pro Ser Cys Phe Arg Tyr Pro Arg Gly Asn Gly545 550 555 560atc ggt gta gag ctt ccg gct gga aac aaa gga att cct ctt gag gtt1728Ile Gly Val Glu Leu Pro Ala Gly Asn Lys Gly Ile Pro Leu Glu Val565 570 575
ggt aaa ggt agg ata ttg att gag ggg gag aga gtg gct cta ttg gga1776Gly Lys Gly Arg Ile Leu Ile Glu Gly Glu Arg Val Ala Leu Leu Gly580 585 590tat ggc tca gca gtg cag aac tgt ttg gat gct gct att gtg cta gaa1824Tyr Gly Ser Ala Val Gln Asn Cys Leu Asp Ala Ala Ile Val Leu Glu595 600 605tcc cgc ggc tta caa gta aca gtt gca gat gca cgt ttc tgc aaa cca1872Ser Arg Gly Leu Gln Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro610 615 620ctg gac cat gcc ctc ata agg agc ctt gca aaa tca cat gaa gtg cta1920Leu Asp His Ala Leu Ile Arg Ser Leu Ala Lys Ser His Glu Val Leu625 630 635 640atc act gtc gaa gaa gga tca att gga ggt ttt gga tct cat gtt gtt1968Ile Thr Val Glu Glu Gly Ser Ile Gly Gly Phe Gly Ser His Val Val645 650 655cag ttc atg gcc tta gat ggg ctt ctt gat ggc aag ttg aag tgg aga2016Gln Phe Met Ala Leu Asp Gly Leu Leu Asp Gly Lys Leu Lys Trp Arg660 665 670cca ata gtt ctt cct gat cga tac att gac cat gga tct cct gtt gat2064Pro Ile Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ser Pro Val Asp675 680 685cag ttg gcg gaa gct ggc cta aca cca tct cac att gca gca aca gta2112Gln Leu Ala Glu Ala Gly Leu Thr pro Ser His Ile Ala Ala Thr Val690 695 700ttt aac ata ctt gga caa acc aga gag gct cta gag gtc atg aca taa2160Phe Asn Ile Leu Gly Gln Thr Arg Glu Ala Leu Glu Val Met Thr705 710 715&lt;210&gt;12&lt;211&gt;719&lt;212&gt;pRT&lt;213&gt;食用番茄&lt;400&gt;12
Met Ala Leu Cys Ala Tyr Ala Phe Pro Gly Ile Leu Asn Arg Thr Gly1 5 10 15Val Val Ser Asp Ser Ser Lys Ala Thr Pro Leu phe Ser Gly Trp Ile20 25 30His Gly Thr Asp Leu Gln Phe Leu Phe Gln His Lys Leu Thr His Glu35 40 45Val Lys Lys Arg Ser Arg Val Val Gln Ala Ser Leu Ser Glu Ser Gly50 55 60Glu Tyr Tyr Thr Gln Arg Pro Pro Thr Pro Ile Leu Asp Thr Val Asn65 70 75 80Tyr Pro Ile His Met Lys Asn Leu Ser Leu Lys Glu Leu Lys Gln Leu85 90 95Ala Asp Glu Leu Arg Ser Asp Thr Ile Phe Asn Val Ser Lys Thr Gly100 105 110Gly His Leu Gly Ser Ser Leu Gly Val Val Glu Leu Thr Val Ala Leu115 120 125His Tyr Val Phe Asn Ala Pro Gln Asp Arg Ile Leu Trp Asp Val Gly130 135 140His Gln Ser Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Met145 150 155 160Ser Thr Leu Arg Gln Thr Asp Gly Leu Ala Gly Phe Thr Lys Arg Ser165 170 175Glu Ser Glu Tyr Asp Cys Phe Gly Thr Gly His Ser Ser Thr Thr Ile180 185 190Ser Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu Lys Gly Arg Asn
l95 200 205Asn Asn Val Ile Ala Val Ile Gly Asp Gly Ala Met Thr Ala Gly Gln210 215 220Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp Ser Asp Met Ile225 230 235 240Val Ile Leu Asn Asp Asn Arg Gln Val Ser Leu Pro Thr Ala Thr Leu245 250 255Asp Gly Pro Val Ala Pro Val Gly Ala Leu Ser Ser Ala Leu Ser Arg260 265 270Leu Gln Ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly275 280 285Val Thr Lys Gln Ile Gly Gly Pro Met His Glu Leu Ala Ala Lys Val290 295 300Asp Glu Tyr Ala Arg Gly Met Ile Ser Gly Ser Gly Ser Thr Leu Phe305 310 315 320Glu Glu Leu Gly Leu Tyr Tyr Ile Gly Pro Val Asp Gly His Asn Ile325 330 335Asp Asp Leu Ile Ala Ile Leu Lys Glu Val Arg Ser Thr Lys Thr Thr340 345 350Gly Pro Val Leu Ile His Val Val Thr Glu Lys Gly Arg Gly Tyr Pro355 360 365Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His Gly Val Ala Lys Phe Asp370 375 380Pro Ala Thr Gly Lys Gln Phe Lys Ala Ser Ala Lys Thr Gln Ser Tyr385 390 395 400
Thr Thr Tyr Phe Ala Glu Ala Leu Ile Ala Glu Ala Glu Ala Asp Lys405 410 4l5Asp Ile Val Ala Ile His Ala Ala Met Gly Gly Gly Thr Gly Met Asn420 425 430Leu Phe His Arg Arg Phe Pro Thr Arg Cys Phe Asp Val Gly Ile Ala435 440 445Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Cys Glu Gly Ile450 455 460Lys Pro Phe Cys Ala Ile Tyr Ser Ser Phe Met Gln Arg Ala Tyr Asp465 470 475 480Gln Val Val His Asp Val Asp Leu Gln Lys Leu Pro Val Arg Phe Ala485 490 495Met Asp Arg Ala Gly Leu Val Gly Ala Asp Gly Pro Thr His Cys Gly500 505 510Ala Phe Asp Val Thr Tyr Met Ala Cys Leu Pro Asn Met Val Val Met515 520 525Ala Pro Ser Asp Glu Ala Glu Leu Phe His Met Val Ala Thr Ala Ala530 535 540Ala Ile Asp Asp Arg Pro Ser Cys Phe Arg Tyr Pro Arg Gly Asn Gly545 550 555 560Ile Gly Val Glu Leu Pro Ala Gly Asn Lys Gly Ile Pro Leu Glu Val565 570 575Gly Lys Gly Arg Ile Leu Ile Glu Gly Glu Arg Val Ala Leu Leu Gly580 585 590Tyr Gly Ser Ala Val Gln Asn Cys Leu Asp Ala Ala Ile Val Leu Glu595 600 605
Ser Arg Gly Leu Gln Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro610 615 620Leu Asp His Ala Leu Ile Arg Ser Leu Ala Lys Ser His Glu Val Leu625 630 635 640Ile Thr Val Glu Glu Gly Ser Ile Gly Gly Phe Gly Ser His Val Val645 650 655Gln Phe Met Ala Leu Asp Gly Leu Leu Asp Gly Lys Leu Lys Trp Arg660 665 670Pro Ile Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ser Pro Val Asp675 680 685Gln Leu Ala Glu Ala Gly Leu Thr Pro Ser His Ile Ala Ala Thr Val690 695 700Phe Asn Ile Leu Gly Gln Thr Arg Glu Ala Leu Glu Val Met Thr705 710 715&lt;210&gt;13&lt;211&gt;l434&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1434)&lt;223&gt;
&lt;400&gt;13atg atg aca tta aac tca cta tct cca gct gaa tcc aaa gct att tct 48Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15ttc ttg gat acc tcc agg ttc aat cca atc cct aaa ctc tca ggt ggg 96Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30ttt agt ttg agg agg agg aat caa ggg aga ggt ttt gga aaa ggt gtt144Phe Ser Leu Arg Arg Arg Asn Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45aag tgt tca gtg aaa gtg cag cag caa caa caa cct cct cca gca tgg192Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60cct ggg aga gct gtc cct gag gcg cct cgt caa tct tgg gat gga cca240Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80aaa ccc atc tct atc gtt gga tct act ggt tct att ggc act cag aca288Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr85 90 95ttg gat att gtg gct gag aat cct gac aaa ttc aga gtt gtg gct cta336Leu Asp Ile Val Ala Glu Ash Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110gct gct ggt tcg aat gtt act cta ctt gct gat cag gta agg aga ttt384Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg phe115 120 125aag cct gca ttg gtt gct gtt aga aac gag tca ctg att aat gag ctt432Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140aaa gag gct tta gct gat ttg gac tat aaa ctc gag att att cca gga480Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu Ile Ile Pro Gly145 150 155 160gag caa gga gtg att gag gtt gcc cga cat cct gaa gct gta acc gtt528Glu Gln Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175gtt acc gga ata gta ggt tgt gcg gga cta aag cct acg gtt gct gca576Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala180 185 190
att gaa gca gga aag gac att gct ctt gca aac aaa gag aca tta atc 624Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile195 200 205gca ggt ggt cct ttc gtg ctt ccg ctt gcc aac aaa cat aat gta aag 672Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys210 215 220att ctt ccg gca gat tca gaa cat tct gcc ata ttt cag tgt att caa 720Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240ggt ttg cct gaa ggc gct ctg cgc aag ata atc ttg act gca tct ggt 768Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255gga gct ttt agg gat tgg cct gtc gaa aag cta aag gaa gtt aaa gta 816Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val260 265 270gcg gat gcg ttg aag cat cca aac tgg aac atg gga aag aaa atc act 864Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285gtg gac tct gct acg ctt ttc aac aag ggt ctt gag gtc att gaa gcg 912Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala290 295 300cat tat ttg ttt gga gct gag tat gac gat ata gag att gtc att cat 960His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320ccg caa agt atc ata cat tcc atg att gaa aca cag gat tca tct gtg1008Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335ctt gct caa ttg ggt tgg cct gat atg cgt tta ccg att ctc tac acc1056Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350atg tca tgg ccc gat aga gtt cct tgt tct gaa gta act tgg cca aga1104Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg355 360 365ctt gac ctt tgc aaa ctc ggt tca ttg act ttc aag aaa cca gac aat1152Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380
gtg aaa tac cca tcc atg gat ctt gct tat gct gct gga cga gct gga1200Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400ggc aca atg act gga gtt ctc agc gcc gcc aat gag aaa gct gtt gaa1248Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415atg ttc att gat gaa aag ata agc tat ttg gat atc ttc aag gtt gtg1296Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile phe Lys Val Val420 425 430gaa tta aca tgc gat aaa cat cga aac gag ttg gta aca tca ccg tct1344Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445ctt gaa gag att gtt cac tat gac ttg tgg gca cgt gaa tat gcc gcg1392Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala450 455 460aat gtg cag ctt tct tct ggt gct agg cca gtt cat gca tga1434Asn Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 475&lt;210&gt;14&lt;211&gt;477&lt;212&gt;PRT&lt;213&gt;拟南芥&lt;400&gt;14Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1 5 10 15Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly20 25 30Phe Ser Leu Arg Arg Arg Asn Gln Gly Arg Gly Phe Gly Lys Gly Val35 40 45
Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp50 55 60Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro65 70 75 80Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr85 90 95Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu100 105 110Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe115 120 125Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu130 135 140Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu Ile Ile Pro Gly145 150 155 160Glu Gln Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val165 170 175Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala180 185 190Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile195 200 205Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys210 215 220Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln225 230 235 240Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly245 250 255
Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val260 265 270Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr275 280 285Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala290 295 300His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His305 310 315 320Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val325 330 335Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr340 345 350Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg355 360 365Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn370 375 380Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly385 390 395 400Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu405 410 415Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val420 425 430Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser435 440 445
Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala450 455 460Asn Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465 470 475&lt;210&gt;15&lt;211&gt;884&lt;212&gt;DNA&lt;213&gt;巴勒斯提纳侧金盏花克隆ApIPI28&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(180)..(884)&lt;223&gt;
&lt;400&gt;15cgtcgatcag gattaatcct ttatatagta tcttctccac caccactaaa acattatcag 60cttcgtgttc ttctcccgct gttcatcttc agcagcgttg tcgtactctt tctatttctt 120cttccatcac taacagtcct cgccgagggt tgaatcggct gttcgcctca acgtcgact 179atg ggt gaa gtc gct gat gct ggt atg gat gcc gtc cag aag cgg ctt227Met Gly Glu Val Ala Asp Ala Gly Met Asp Ala Val Gln Lys Arg Leu1 5 10 15atg ttc gac gat gaa tgt att ttg gtg gat gag aat gac aag gtc gtc275Met Phe Asp Asp Glu Cys Ile Leu Val Asp Glu Asn Asp Lys Val Val20 25 30gga cat gat tcc aaa tac aac tgt cat ttg atg gaa aag ata gag gca323Gly His Asp Ser Lys Tyr Asn Cys His Leu Met Glu Lys Ile Glu Ala35 40 45
gaa aac ttg ctt cac aga gcc ttc agt gtt ttc tta ttc aac tca aaa37lGlu Asn Leu Leu His Arg Ala Phe Ser Val Phe Leu Phe Asn Ser Lys50 55 60tac gag ttg ctt ctt cag caa cga tct gca acg aag gta aca ttc ccg419Tyr Glu Leu Leu Leu Gln Gln Arg Ser Ala Thr Lys Val Thr Phe Pro65 70 75 80ctc gta tgg aca aac acc tgt tgc agc cat ccc ctc ttc cgt gat tcc467Leu Val Trp Thr Asn Thr Cys Cys Ser His Pro Leu Phe Arg Asp Ser85 90 95gaa ctc ata gaa gaa aat ttt ctc ggg gta cga aac gct gca caa agg515Glu Leu Ile Glu Glu Asn Phe Leu Gly Val Arg Asn Ala Ala Gln Arg100 105 1l0aag ctt tta gac gag cta ggc att cca gct gaa gac gta cca gtt gat563Lys Leu Leu Asp Glu Leu Gly Ile Pro Ala Glu Asp Val Pro Val Asp115 120 125gaa ttc act cct ctt ggt cgc att ctt tac aaa gct cca tct gac gga611Glu Phe Thr Pro Leu Gly Arg Ile Leu Tyr Lys Ala Pro Ser Asp Gly130 135 140aaa tgg gga gag cac gaa ctg gac tat ctt ctg ttt att gtc cga gat659Lys Trp Gly Glu His Glu Leu Asp Tyr Leu Leu Phe Ile Val Arg Asp145 150 155 160gtg aaa tac gat cca aac cca gat gaa gtt gct gac gct aag tac gtt707Val Lys Tyr Asp Pro Asn Pro Asp Glu Val Ala Asp Ala Lys Tyr Val165 170 175aat cgc gag gag ttg aaa gag ata ctg aga aaa gct gat gca ggt gaa755Asn Arg Glu Glu Leu Lys Glu Ile Leu Arg Lys Ala Asp Ala Gly Glu180 185 190gag gga ata aag ttg tct cct tgg ttt aga ttg gtt gtg gat aac ttt803Glu Gly Ile Lys Leu Ser Pro Trp Phe Arg Leu Val Val Asp Asn Phe195 200 205ttg ttc aag tgg tgg gat cat gta gag gag ggg aag att aag gac gtc851Leu Phe Lys Trp Trp Asp His Val Glu Glu Gly Lys Ile Lys Asp Val2l0 215 220gcc gac atg aaa act atc cac aag ttg act taa884Ala Asp Met Lys Thr Ile His Lys Leu Thr225 230
&lt;210&gt;16&lt;211&gt;234&lt;212&gt;PRT&lt;213&gt;巴勒斯提纳侧金盏花克隆ApIPI28&lt;400&gt;16Met Gly Glu Val Ala Asp Ala Gly Met Asp Ala Val Gln Lys Arg Leu1 5 10 15Met Phe Asp Asp Glu Cys Ile Leu Val Asp Glu Asn Asp Lys Val Val20 25 30Gly His Asp Ser Lys Tyr Asn Cys His Leu Met Glu Lys Ile Glu Ala35 40 45Glu Asn Leu Leu His Arg Ala Phe Ser Val Phe Leu Phe Asn Ser Lys50 55 60Tyr Glu Leu Leu Leu Gln Gln Arg Ser Ala Thr Lys Val Thr Phe Pro65 70 75 80Leu Val Trp Thr Asn Thr Cys Cys Ser His Pro Leu Phe Arg Asp Ser85 90 95Glu Leu Ile Glu Glu Asn Phe Leu Gly Val Arg Asn Ala Ala Gln Arg100 105 110Lys Leu Leu Asp Glu Leu Gly Ile Pro Ala Glu Asp Val Pro Val Asp115 120 125Glu Phe Thr Pro Leu Gly Arg Ile Leu Tyr Lys Ala Pro Ser Asp Gly130 135 140
Lys Trp Gly Glu His Glu Leu Asp Tyr Leu Leu Phe Ile Val Arg Asp145 150 155 160Val Lys Tyr Asp Pro Asn Pro Asp Glu Val Ala Asp Ala Lys Tyr Val165 170 175Asn Arg Glu Glu Leu Lys Glu Ile Leu Arg Lys Ala Asp Ala Gly Glu180 185 190Glu Gly Ile Lys Leu Ser Pro Trp Phe Arg Leu Val Val Asp Asn Phe195 200 205Leu Phe Lys Trp Trp Asp His Val Glu Glu Gly Lys Ile Lys Asp Val210 215 220Ala Asp Met Lys Thr Ile His Lys Leu Thr225 230&lt;210&gt;17&lt;211&gt;1402&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(52)..(1317)&lt;223&gt;
&lt;400&gt;17aagtctttgc ctctttggtt tactttcctc tgttttcgat ccatttagaa a atg tta 57Met Leu1
ttc acg agg agt gtt gct cgg att tct tct aag ttt ctg aga aac cgt105Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg Asn Arg5 10 15agc ttc tat ggc tcc tct caa tct ctc gcc tct cat cgg ttc gca atc153Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe Ala Ile20 25 30att ccc gat cag ggt cac tct tgt tct gac tct cca cac aag ggt tac201Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys Gly Tyr35 40 45 50gtt tgc aga aca act tat tca ttg aaa tct ccg gtt ttt ggt gga ttt249Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly Gly Phe55 60 65agt cat caa ctc tat cac cag agt agc tcc ttg gtt gag gag gag ctt297Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu Glu Leu70 75 80gac cca ttt tcg ctt gtt gcc gat gag ctg tca ctt ctt agt aat aag345Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser Asn Lys85 90 95ttg aga gag atg gta ctt gcc gag gtt cca aag ctt gcc tct gct gct393Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala100 105 110gag tac ttc ttc aaa agg ggt gtg caa gga aaa cag ttt cgt tca act441Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr115 120 125 130att ttg ctg ctg atg gcg aca gct ctg gat gta cga gtt cca gaa gca489Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro Glu Ala135 140 145ttg att ggg gaa tca aca gat ata gtc aca tca gaa tta cgc gta agg537Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg150 155 160caa cgg ggt att gct gaa atc act gaa atg ata cac gtc gca agt cta585Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu165 170 175ctg cac gat gat gtc ttg gat gat gcc gat aca agg cgt ggt gtt ggt633Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly180 185 190
tcc tta aat gtt gta atg ggt aac aag atg tcg gta tta gca gga gac 681Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala Gly Asp195 200 205 210ttc ttg ctc tcc cgg gct tgt ggg gct ctc gct gct tta aag aac aca 729Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr215 220 225gag gtt gta gca tta ctt gca act gct gta gaa cat ctt gtt acc ggt 777Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val Thr Gly230 235 240gaa acc atg gag ata act agt tca acc gag cag cgt tat agt atg gac 825Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser Met Asp245 250 255tac tac atg cag aag aca tat tat aag aca gca tcg cta atc tct aac 873Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn260 265 270agc tgc aaa gct gtt gcc gtt ctc act gga caa aca gca gaa gtt gcc 921Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu Val Ala275 280 285 290gtg tta gct ttt gag tat ggg agg aat ctg ggt tta gca ttc caa tta 969Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe Gln Leu295 300 305ata gac gac att ctt gat ttc acg ggc aca tct gcc tct ctc gga aag1017Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys310 315 320gga tcg ttg tca gat att cgc cat gga gtc ata aca gcc cca atc ctc1065Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro Ile Leu325 330 335ttt gcc atg gaa gag ttt cct caa cta cgc gaa gtt gtt gat caa gtt1113Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp Gln Val340 345 350gaa aaa gat cct agg aat gtt gac att gct tta gag tat ctt ggg aag1161Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys355 360 365 370agc aag gga ata cag agg gca aga gaa tta gcc atg gaa cat gcg aat1209Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn375 380 385
cta gca gca gct gca atc ggg tct cta cct gaa aca gac aat gaa gat1257Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn Glu Asp390 395 400gtc aaa aga tcg agg cgg gca ctt att gac ttg acc cat aga gtc atc1305Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg Val Ile405 410 415acc aga aac aag tgagattaag taatgtttct ctctatacac caaaacattc1357Thr Arg Asn Lys420ctcatttcat ttgtaggatt ttgttggtcc aattcgtttc acgaa 1402&lt;210&gt;18&lt;211&gt;422&lt;212&gt;PRT&lt;213&gt;拟南芥&lt;400&gt;18Met Leu Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg1 5 10 15Asn Arg Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe20 25 30Ala Ile Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys35 40 45Gly Tyr Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly50 55 60Gly Phe Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu65 70 75 80Glu Leu Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser85 90 95
Asn Lys Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser100 105 110Ala Ala Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg115 120 125Ser Thr Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro130 135 140Glu Ala Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg145 150 155 160Val Arg Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala165 170 175Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly180 185 190Val Gly Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala195 200 205Gly Asp Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys210 215 220Asn Thr Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val225 230 235 240Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser245 250 255Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile260 265 270Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu275 280 285
Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe290 295 300Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu305 310 315 320Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro325 330 335Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp340 345 350Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu355 360 365Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His370 375 380Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn385 390 395 400Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg405 410 415Val Ile Thr Arg Asn Lys420&lt;210&gt;19&lt;211&gt;1155&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1155)&lt;223&gt;
&lt;400&gt;19atg agt gtg agt tgt tgt tgt agg aat ctg ggc aag aca ata aaa aag48Met Ser Val Ser Cys Cys Cys Arg Asn Leu Gly Lys Thr Ile Lys Lys1 5 10 15gca ata cct tca cat cat ttg cat ctg aga agt ctt ggt ggg agt ctc 96Ala Ile Pro Ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu20 25 30tat cgt cgt cgt atc caa agc tct tca atg gag acc gat ctc aag tca144Tyr Arg Arg Arg Ile Gln Ser Ser Ser Met Glu Thr Asp Leu Lys Ser35 40 45acc ttt ctc aac gtt tat tct gtt ctc aag tct gac ctt ctt cat gac192Thr Phe Leu Asn Val Tyr Ser Val Leu Lys Ser Asp Leu Leu His Asp50 55 60cct tcc ttc gaa ttc acc aat gaa tct cgt ctc tgg gtt gat cgg atg240Pro Ser Phe Glu Phe Thr Asn Glu Ser Arg Leu Trp Val Asp Arg Met65 70 75 80ctg gac tac aat gta cgt gga ggg aaa ctc aat cgg ggt ctc tct gtt288Leu Asp Tyr Asn Val Arg Gly Gly Lys Leu Asn Arg Gly Leu Ser Val85 90 95gtt gac agt ttc aaa ctt ttg aag caa ggc aat gat ttg act gag caa336Val Asp Ser Phe Lys Leu Leu Lys Gln Gly Asn Asp Leu Thr Glu Gln100 105 110gag gtt ttc ctc tct tgt gct ctc ggt tgg tgc att gaa tgg ctc caa384Glu Val Phe Leu Ser Cys Ala Leu Gly Trp Cys Ile Glu Trp Leu Gln115 120 125gct tat ttc ctt gtg ctt gat gat att atg gat aac tct gtc act cgc432Ala Tyr Phe Leu Val Leu Asp Asp Ile Met Asp Asn Ser Val Thr Arg130 135 140cgt ggt caa cct tgc tgg ttc aga gtt cct cag gtt ggt atg gtt gcc480Arg Gly Gln Pro Cys Trp Phe Arg Val Pro Gln Val Gly Met Val Ala145 150 155 160
atc aat gat ggg att cta ctt cgc aat cac atc cac agg att ctc aaa528Ile Asn Asp Gly Ile Leu Leu Arg Asn His Ile His Arg Ile Leu Lys165 170 175aag cat ttc cgt gat aag cct tac tat gtt gac ctt gtt gat ttg ttt576Lys His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu Val Asp Leu Phe180 185 190aat gag gtt gag ttg caa aca gct tgt ggc cag atg ata gat ttg atc624Asn Glu Val Glu Leu Gln Thr Ala Cys Gly Gln Met Ile Asp Leu Ile195 200 205acc acc ttt gaa gga gaa aag gat ttg gcc aag tac tca ttg tca atc672Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu Ser Ile210 215 220cac cgt cgt att gtc cag tac aaa acg gct tat tac tca ttt tat ctc720His Arg Arg Ile Val Gln Tyr Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu225 230 235 240cct gtt gct tgt gcg ttg ctt atg gcg ggc gaa aat ttg gaa aac cat768Pro Val Ala Cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His245 250 255att gac gtg aaa aat gtt ctt gtt gac atg gga atc tac ttc caa gtg816Ile Asp Val Lys Asn Val Leu Val Asp Met Gly Ile Tyr Phe Gln Val260 265 270cag gat gat tat ctg gat tgt ttt gct gat ccc gag acg ctt ggc aag864Gln Asp Asp Tyr Leu Asp Cys Phe Ala Asp Pro Glu Thr Leu Gly Lys275 280 285ata gga aca gat ata gaa gat ttc aaa tgc tcg tgg ttg gtg gtt aag912Ile Gly Thr Asp Ile Glu Asp Phe Lys Cys Ser Trp Leu Val Val Lys290 295 300gca tta gag cgc tgc agc gaa gaa caa act aag ata tta tat gag aac960Ala Leu Glu Arg Cys Ser Glu Glu Gln Thr Lys Ile Leu Tyr Glu Asn305 310 315 320tat ggt aaa ccc gac cca tcg aac gtt gct aaa gtg aag gat ctc tac 1008Tyr Gly Lys Pro Asp Pro Ser Asn Val Ala Lys Val Lys Asp Leu Tyr325 330 335aaa gag ctg gat ctt gag gga gtt ttc atg gag tat gag agc aaa agc 1056Lys Glu Leu Asp Leu Glu Gly Val Phe Met Glu Tyr Glu Ser Lys Ser340 345 350
tac gag aag ctg act gga gcg att gag gga cac caa agt aaa gca atc1104Tyr Glu Lys Leu Thr Gly Ala Ile Glu Gly His Gln Ser Lys Ala Ile355 360 365caa gca gtg cta aaa tcc ttc ttg gct aag atc tac aag agg cag aag1152Gln Ala Val Leu Lys Ser Phe Leu Ala Lys Ile Tyr Lys Arg Gln Lys370 375 380tag1155&lt;210&gt;20&lt;211&gt;384&lt;212&gt;PRT&lt;213&gt;拟南芥&lt;400&gt;20Met Ser Val Ser Cys Cys Cys Arg Asn Leu Gly Lys Thr Ile Lys Lys1 5 10 15Ala Ile Pro Ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu20 25 30Tyr Arg Arg Arg Ile Gln Ser Ser Ser Met Glu Thr Asp Leu Lys Ser35 40 45Thr Phe Leu Asn Val Tyr Ser Val Leu Lys Ser Asp Leu Leu His Asp50 55 60Pro Ser Phe Glu Phe Thr Asn Glu Ser Arg Leu Trp Val Asp Arg Met65 70 75 80Leu Asp Tyr Asn Val Arg Gly Gly Lys Leu Asn Arg Gly Leu Ser Val85 90 95Val Asp Ser Phe Lys Leu Leu Lys Gln Gly Asn Asp Leu Thr Glu Gln100 105 110
Glu Val Phe Leu Ser Cys Ala Leu Gly Trp Cys Ile Glu Trp Leu Gln115 120 125Ala Tyr Phe Leu Val Leu Asp Asp Ile Met Asp Asn Ser Val Thr Arg130 135 140Arg Gly Gln Pro Cys Trp Phe Arg Val Pro Gln Val Gly Met Val Ala145 150 155 160Ile Asn Asp Gly Ile Leu Leu Arg Asn His Ile His Arg Ile Leu Lys165 170 175Lys His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu Val Asp Leu Phe180 185 190Asn Glu Val Glu Leu Gln Thr Ala Cys Gly Gln Met Ile Asp Leu Ile195 200 205Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu Ser Ile210 215 220His Arg Arg Ile Val Gln Tyr Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu225 230 235 240Pro Val Ala Cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His245 250 255Ile Asp Val Lys Asn Val Leu Val Asp Met Gly Ile Tyr Phe Gln Val260 265 270Gln Asp Asp Tyr Leu Asp Cys Phe Ala Asp Pro Glu Thr Leu Gly Lys275 280 285Ile Gly Thr Asp Ile Glu Asp Phe Lys Cys Ser Trp Leu Val Val Lys290 295 300
Ala Leu Glu Arg Cys Ser Glu Glu Gln Thr Lys Ile Leu Tyr Glu Asn305 310 315 320Tyr Gly Lys Pro Asp Pro Ser Asn Val Ala Lys Val Lys Asp Leu Tyr325 330 335Lys Glu Leu Asp Leu Glu Gly Val Phe Met Glu Tyr Glu Ser Lys Ser340 345 350Tyr Glu Lys Leu Thr Gly Ala Ile Glu Gly His Gln Ser Lys Ala Ile355 360 365Gln Ala Val Leu Lys Ser Phe Leu Ala Lys Ile Tyr Lys Arg Gln Lys370 375 380&lt;210&gt;21&lt;211&gt;1101&lt;212&gt;DNA&lt;213&gt;Sinabs alba&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1101)&lt;223&gt;
&lt;400&gt;21atg gct tct tca gtg act cct cta ggt tca tgg gtt ctt ctt cac cat48Met Ala Ser Ser Val Thr Pro Leu Gly Ser Trp Val Leu Leu His His1 5 10 15cat cct tca act atc tta acc caa tcc aga tcc aga tct cct cct tct96His Pro Ser Thr Ile Leu Thr Gln Ser Arg Ser Arg Ser Pro Pro Ser20 25 30
ctc atc acc ctt aaa ccc atc tcc ctc act cca aaa cgc acc gtt tcg144Leu Ile Thr Leu Lys Pro Ile Ser Leu Thr Pro Lys Arg Thr Val Ser35 40 45tct tct tcc tcc tct tcc ctc atc acc aaa gaa gac aac aac ctc aaa192Ser Ser Ser Ser Ser Ser Leu Ile Thr Lys Glu Asp Asn Asn Leu Lys50 55 60tcc tct tcc tct tcc ttc gat ttc atg tct tac atc atc cgc aaa gcc240Ser Ser Ser Ser Ser Phe Asp Phe Met Ser Tyr Ile Ile Arg Lys Ala65 70 75 80gac tcc gtc aac aaa gcc tta gac tcc gcc gtc cct ctc cgg gag cca288Asp Ser Val Asn Lys Ala Leu Asp Ser Ala Val Pro Leu Arg Glu Pro85 90 95ctc aag atc cac gaa gcg atg cgt tac tct ctc ctc gcc gga gga aaa336Leu Lys Ile His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys100 105 110cgc gtc aga cca gtt ctc tgc atc gcc gcg tgc gag cta gtc gga gga384Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly115 120 125gaa gag tct tta gct atg ccg gcg cgt tgc gcc gtg gaa atg atc cac432Glu Glu Ser Leu Ala Met Pro Ala Arg Cys Ala Val Glu Met Ile His130 135 140acc atg tcg ttg atc cac gac gac ttg cct tgt atg gat aac gac gat480Thr Met Ser Leu Ile His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp145 150 155 160ctc cgc cgc gga aag ccc acg aat cac aaa gtt tac ggc gaa gac gtg528Leu Arg Arg Gly Lys Pro Thr Asn His Lys Val Tyr Gly Glu Asp Val165 170 175gcg gtt tta gcc gga gac gcg ctt ctt tcg ttc gcc ttc gag cat tta576Ala Val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Leu180 185 190gcg tcg gct acg agc tcg gag gtt tct ccg gcg aga gtg gtt aga gct624Ala Ser Ala Thr Ser Ser Glu Val Ser Pro Ala Arg Val Val Arg Ala195 200 205gtg gga gag ttg gct aaa gcc atc ggc acc gaa ggg ctc gtg gcg gga672Val Gly Glu Leu Ala Lys Ala Ile Gly Thr Glu Gly Leu Val Ala Gly210 215 220
caa gtg gtg gat ata agc agt gaa ggg ttg gac tta aac aac gtc gga720Gln Val Val Asp Ile Ser Ser Glu Gly Leu Asp Leu Asn Asn Val Gly225 230 235 240ttg gag cat ttg aag ttt ata cat ttg cat aaa acg gcg gcg ttg ctt768Leu Glu His Leu Lys Phe Ile His Leu His Lys Thr Ala Ala Leu Leu245 250 255gaa gct tca gcg gtt ttg ggt ggg atc atc ggt gga ggg agt gat gaa816Glu Ala Ser Ala Val Leu Gly Gly Ile Ile Gly Gly Gly Ser Asp Glu260 265 270gag atc gag agg ctg agg aag ttc gcg agg tgt att ggg ttg ttg ttt864Glu Ile Glu Arg Leu Arg Lys Phe Ala Arg Cys Ile Gly Leu Leu Phe275 280 285cag gtg gtt gat gat atc ttg gac gtg acg aaa tcg tct caa gaa ctg912Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser Ser Gln Glu Leu290 295 300ggg aaa acc gct ggg aaa gat ttg att gct gat aag ttg act tat ccg960Gly Lys Thr Ala Gly Lys Asp Leu Ile Ala Asp Lys Leu Thr Tyr Pro305 310 315 320aag ctc atg ggt ttg gag aaa tcg aga gag ttc gct gag aag ttg aat 1008Lys Leu Met Gly Leu Glu Lys Ser Arg Glu Phe Ala Glu Lys Leu Asn325 330 335aca gag gca cgt gat cag ctt tta ggg ttt gat tcc gac aag gtt gct 1056Thr Glu Ala Arg Asp Gln Leu Leu Gly Phe Asp Ser Asp Lys Val Ala340 345 350cct ttg ttg gct ttg gct aat tac att gcc aat aga cag aac tga 1101Pro Leu Leu Ala Leu Ala Asn Tyr Ile Ala Asn Arg Gln Asn355 360 365&lt;210&gt;22&lt;211&gt;366&lt;212&gt;PRT&lt;213&gt;Sinabs alba&lt;400&gt;22
Met Ala Ser Ser Val Thr Pro Leu Gly Ser Trp Val Leu Leu His His1 5 10 15His Pro Ser Thr Ile Leu Thr Gln Ser Arg Ser Arg Ser Pro Pro Ser20 25 30Leu Ile Thr Leu Lys Pro Ile Ser Leu Thr Pro Lys Arg Thr Val Ser35 40 45Ser Ser Ser Ser Ser Ser Leu Ile Thr Lys Glu Asp Asn Asn Leu Lys50 55 60Ser Ser Ser Ser Ser Phe Asp Phe Met Ser Tyr Ile Ile Arg Lys Ala65 70 75 80Asp Ser Val Asn Lys Ala Leu Asp Ser Ala Val Pro Leu Arg Glu Pro85 90 95Leu Lys Ile His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys100 105 110Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly115 120 125Glu Glu Ser Leu Ala Met Pro Ala Arg Cys Ala Val Glu Met Ile His130 135 140Thr Met Ser Leu Ile His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp145 150 155 160Leu Arg Arg Gly Lys Pro Thr Asn His Lys Val Tyr Gly Glu Asp Val165 170 175Ala Val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Leu180 185 190Ala Ser Ala Thr Ser Ser Glu Val Ser Pro Ala Arg Val Val Arg Ala195 200 205
Val Gly Glu Leu Ala Lys Ala Ile Gly Thr Glu Gly Leu Val Ala Gly210 215 220Gln Val Val Asp Ile Ser Ser Glu Gly Leu Asp Leu Asn Asn Val Gly225 230 235 240Leu Glu His Leu Lys Phe Ile His Leu His Lys Thr Ala Ala Leu Leu245 250 255Glu Ala Ser Ala Val Leu Gly Gly Ile Ile Gly Gly Gly Ser Asp Glu260 265 270Glu Ile Glu Arg Leu Arg Lys Phe Ala Arg Cys Ile Gly Leu Leu Phe275 280 285Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser Ser Gln Glu Leu290 295 300Gly Lys Thr Ala Gly Lys Asp Leu Ile Ala Asp Lys Leu Thr Tyr Pro305 310 315 320Lys Leu Met Gly Leu Glu Lys Ser Arg Glu Phe Ala Glu Lys Leu Asn325 330 335Thr Glu Ala Arg Asp Gln Leu Leu Gly Phe Asp Ser Asp Lys Val Ala340 345 350Pro Leu Leu Ala Leu Ala Asn Tyr Ile Ala Asn Arg Gln Asn355 360 365&lt;210&gt;23&lt;211&gt;930&lt;212&gt;DNA
&lt;213&gt;噬夏孢欧文菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(930)&lt;223&gt;
&lt;400&gt;23atg aat aat ccg tcg tta ctc aat cat gcg gtc gaa acg atg gca gtt 48Met Asn Asn Pro Ser Leu Leu Asn His Ala Val Glu Thr Met Ala Val1 5 10 15ggc tcg aaa agt ttt gcg aca gcc tca aag tta ttt gat gca aaa acc 96Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr20 25 30cgg cgc agc gta ctg atg ctc tac gcc tgg tgc cgc cat tgt gac gat144Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp35 40 45gtt att gac gat cag acg ctg ggc ttt cag gcc cgg cag cct gcc tta192Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu50 55 60caa acg ccc gaa caa cgt ctg atg caa ctt gag atg aaa acg cgc cag240Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln65 70 75 80gcc tat gca gga tcg cag atg cac gaa ccg gcg ttt gcg gct ttt cag288Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln85 90 95gaa gtg gct atg gct cat gat atc gcc ccg gct tac gcg ttt gat cat336Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His100 105 110ctg gaa ggc ttc gcc atg gat gta cgc gaa gcg caa tac agc caa ctg384Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu115 120 125
gat gat acg ctg cgc tat tgc tat cac gtt gca ggc gtt gtc ggc ttg432Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu130 135 140atg atg gcg caa atc atg ggc gtg cgg gat aac gcc acg ctg gac cgc480Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg145 150 155 160gcc tgt gac ctt ggg ctg gca ttt cag ttg acc aat att gct cgc gat528Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp165 170 175att gtg gac gat gcg cat gcg ggc cgc tgt tat ctg ccg gca agc tgg576Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala Ser Trp180 185 190ctg gag cat gaa ggt ctg aac aaa gag aat tat gcg gca cct gaa aac624Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn195 200 205cgt cag gcg ctg agc cgt atc gcc cgt cgt ttg gtg cag gaa gca gaa672Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln Glu Ala Glu210 215 220cct tac tat ttg tct gcc aca gcc ggc ctg gca ggg ttg ccc ctg cgt720Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg225 230 235 240tcc gcc tgg gca atc gct acg gcg aag cag gtt tac cgg aaa ata ggt768Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg Lys Ile Gly245 250 255gtc aaa gtt gaa cag gcc ggt cag caa gcc tgg gat cag cgg cag tca816Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln Arg Gln Ser260 265 270acg acc acg ccc gaa aaa tta acg ctg ctg ctg gcc gcc tct ggt cag864Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gln275 280 285gcc ctt act tcc cgg atg cgg gct cat cct ccc cgc cct gcg cat ctc912Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro Ala His Leu290 295 300tgg cag cgc ccg ctc tag930Trp Gln Arg Pro Leu305
&lt;210&gt;24&lt;211&gt;309&lt;212&gt;PRT&lt;213&gt;噬夏孢欧文菌&lt;400&gt;24Met Asn Asn Pro Ser Leu Leu Asn His Ala Val Glu Thr Met Ala Val1 5 10 15Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr20 25 30Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp35 40 45Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu50 55 60Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln65 70 75 80Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln85 90 95Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His100 105 110Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu115 120 125Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu130 135 140
Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg145 150 155 160Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp165 170 175Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala Ser Trp180 185 190Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn195 200 205Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln Glu Ala Glu210 215 220Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg225 230 235 240Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg Lys Ile Gly245 250 255Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln Arg Gln Ser260 265 270Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gln275 280 285Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro Ala His Leu290 295 300Trp Gln Arg Pro Leu305&lt;210&gt;25&lt;2l1&gt;1479&lt;212&gt;DNA
&lt;213&gt;噬夏孢欧文菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1479)&lt;223&gt;
&lt;400&gt;25atg aaa cca act acg gta att ggt gca ggc ttc ggt ggc ctg gca ctg 48Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu1 5 10 15gca att cgt cta caa gct gcg ggg atc ccc gtc tta ctg ctt gaa caa 96Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln20 25 30cgt gat aaa ccc ggc ggt cgg gct tat gtc tac gag gat cag ggg ttt144Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe35 40 45acc ttt gat gca ggc ccg acg gtt atc acc gat ccc agt gcc att gaa192Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu50 55 60gaa ctg ttt gca ctg gca gga aaa cag tta aaa gag tat gtc gaa ctg240Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu65 70 75 80ctg ccg gtt acg ccg ttt tac cgc ctg tgt tgg gag tca ggg aag gtc288Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val85 90 95ttt aat tac gat aac gat caa acc cgg ctc gaa gcg cag att cag cag336Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln100 105 110ttt aat ccc cgc gat gtc gaa ggt tat cgt cag ttt ctg gac tat tca384Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser115 120 125
cgc gcg gtg ttt aaa gaa ggc tat cta aag ctc ggt act gtc cct ttt432Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe130 135 140tta tcg ttc aga gac atg ctt cgc gcc gca cct caa ctg gcg aaa ctg480Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu145 150 155 160cag gca tgg aga agc gtt tac agt aag gtt gcc agt tac atc gaa gat528Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp165 170 175gaa cat ctg cgc cag gcg ttt tct ttc cac tcg ctg ttg gtg ggc ggc576Glu His Leu Arg Gln Ala Phe Ser Phe His Ser Leu Leu Val Gly Gly180 185 190aat ccc ttc gcc acc tca tcc att tat acg ttg ata cac gcg ctg gag624Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu195 200 205cgt gag tgg ggc gtc tgg ttt ccg cgt ggc ggc acc ggc gca tta gtt672Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val210 215 220cag ggg atg ata aag ctg ttt cag gat ctg ggt ggc gaa gtc gtg tta720Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu225 230 235 240aac gcc aga gtc agc cat atg gaa acg aca gga aac aag att gaa gcc768Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala245 250 255gtg cat tta gag gac ggt cgc agg ttc ctg acg caa gcc gtc gcg tca816Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser260 265 270aat gca gat gtg gtt cat acc tat cgc gac ctg tta agc cag cac cct864Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro275 280 285gcc gcg gtt aag cag tcc aac aaa ctg cag act aag cgc atg agt aac912Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn290 295 300tct ctg ttt gtg ctc tat ttt ggt ttg aat cac cat cat gat cag ctc960Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu305 310 315 320
gcg cat cac acg gtt tgt ttc ggc ccg cgt tac cgc gag ctg att gac1008Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp325 330 335gaa att ttt aat cat gat ggc ctc gca gag gac ttc tca ctt tat ctg1056Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu340 345 350cac gcg ccc tgt gtc acg gat tcg tca ctg gcg cct gaa ggt tgc ggc1104His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly355 360 365agt tac tat gtg ttg gcg ccg gtg ccg cat tta ggc acc gcg aac ctc1152Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu370 375 380gac tgg acg gtt gag ggg cca aaa cta cgc gac cgt att ttt gcg tac1200Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr385 390 395 400ctt gag cag cat tac atg cct ggc tta cgg agt cag ctg gtc acg cac1248Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His405 410 415cgg atg ttt acg ccg ttt gat ttt cgc gac cag ctt aat gcc tat cat1296Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His420 425 430ggc tca gcc ttt tct gtg gag ccc gtt ctt acc cag agc gcc tgg ttt1344Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe435 440 445cgg ccg cat aac cgc gat aaa acc att act aat ctc tac ctg gtc ggc1392Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly450 455 460gca ggc acg cat ccc ggc gca ggc att cct ggc gtc atc ggc tcg gca1440Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala465 470 475 480aaa gcg aca gca ggt ttg atg ctg gag gat ctg ata tga1479Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile485 490&lt;210&gt;26&lt;211&gt;492
&lt;212&gt;PRT&lt;213&gt;噬夏孢欧文菌&lt;400&gt;26Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu1 5 10 15Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln20 25 30Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe35 40 45Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu50 55 60Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu65 70 75 80Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val85 90 95Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln100 105 110Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser115 120 125Arg Ala Val phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe130 135 140Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu145 150 155 160
Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp165 170 175Glu His Leu Arg Gln Ala Phe Ser phe His Ser Leu Leu Val Gly Gly180 185 190Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu195 200 205Arg Glu Trp Gly Val Trp Phe pro Arg Gly Gly Thr Gly Ala Leu Val210 215 220Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu225 230 235 240Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala245 250 255Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser260 265 270Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro275 280 285Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn290 295 300Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu305 310 315 320Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp325 330 335Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu340 345 350His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly355 360 365
Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu370 375 380Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr385 390 395 400Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His405 410 415Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His420 425 430Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe435 440 445Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly450 455 460Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala465 470 475 480Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile485 490&lt;210&gt;27&lt;211&gt;1725&lt;212&gt;DNA&lt;213&gt;黄水仙&lt;220&gt;
&lt;221&gt;CDS
&lt;222&gt;(1)..(1725)&lt;223&gt;
&lt;400&gt;27atg gct tct tcc act tgt tta att cat tct tcc tct ttt ggg gtt gga 48Met Ala Ser Ser Thr Cys Leu Ile His Ser Ser Ser Phe Gly Val Gly1 5 10 15gga aag aaa gtg aag atg aac acg atg att cga tcg aag ttg ttt tca 96Gly Lys Lys Val Lys Met Asn Thr Met Ile Arg Ser Lys Leu Phe Ser20 25 30att cgg tcg gct ttg gac act aag gtg tct gat atg agc gtc aat gct144Ile Arg Ser Ala Leu Asp Thr Lys Val Ser Asp Met Ser Val Asn Ala35 40 45cca aaa gga ttg ttt cca cca gag cct gag cac tac agg ggg cca aag192Pro Lys Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys50 55 60ctt aaa gtg gct atc att gga gct ggg ctc gct ggc atg tca act gca240Leu Lys Val Ala Ile Ile Gly Ala Gly Leu Ala Gly Met Ser Thr Ala65 70 75 80gtg gag ctt ttg gat caa ggg cat gag gtt gac ata tat gaa tcc aga288Val Glu Leu Leu Asp Gln Gly His Glu Val Asp Ile Tyr Glu Ser Arg85 90 95caa ttt att ggt ggt aaa gtc ggt tct ttt gta gat aag cgt gga aac336Gln Phe Ile Gly Gly Lys Val Gly Ser Phe Val Asp Lys Arg Gly Asn100 105 110cat att gaa atg gga ctc cat gtg ttt ttt ggt tgc tat aac aat ctt384His Ile Glu Met Gly Leu His Val Phe Phe Gly Cys Tyr Asn Asn Leu115 120 125ttc aga ctt atg aaa aag gta ggt gca gat gaa aat tta ctg gtg aag432Phe Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys130 135 140gat cat act cat acc ttt gta aac cga ggt gga gaa att ggt gaa ctt480Asp His Thr His Thr Phe Val Asn Arg Gly Gly Glu Ile Gly Glu Leu145 150 155 160gat ttc cga ctt ccg atg ggt gca cca tta cat ggt att cgt gca ttt528Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly Ile Arg Ala Phe165 170 175
cta aca act aat caa ctg aag cct tat gat aaa gca agg aat gct gtg576Leu Thr Thr Asn Gln Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Vall80 185 190gct ctt gcc ctt agc cca gtt gta cgt gct ctt att gat cca aat ggt624Ala Leu Ala Leu Ser Pro Val Val Arg Ala Leu Ile Asp Pro Asn Gly195 200 205gca atg cag gat ata agg aac tta gat aat att agc ttt tct gat tgg672Ala Met Gln Asp Ile Arg Asn Leu Asp Asn Ile Ser Phe Ser Asp Trp210 215 220ttc tta tcc aaa ggc ggt acc cgc atg agc atc caa agg atg tgg gat 720Phe Leu Ser Lys Gly Gly Thr Arg Met Ser Ile Gln Arg Met Trp Asp225 230 235 240cca gtt gct tat gcc ctc gga ttt att gac tgt gat aat atc agt gcc768Pro Val Ala Tyr Ala Leu Gly Phe Ile Asp Cys Asp Asn Ile Ser Ala245 250 255cgt tgt atg ctt act ata ttt tct cta ttt gct act aag aca gaa gct816Arg Cys Met Leu Thr Ile Phe Ser Leu Phe Ala Thr Lys Thr Glu Ala260 265 270tct ctg ttg cgt atg ttg aag ggt tcg cct gat gtt tac tta agc ggt864Ser Leu Leu Arg Met Leu Lys Gly Ser Pro Asp Val Tyr Leu Ser Gly275 280 285cct ata aga aag tat att aca gat aaa ggt gga agg ttt cac cta agg912Pro Ile Arg Lys Tyr Ile Thr Asp Lys Gly Gly Arg Phe His Leu Arg290 295 300tgg ggg tgt aga gag ata ctt tat gat gaa cta tca aat ggc gac aca960Trp Gly Cys Arg Glu Ile Leu Tyr Asp Glu Leu Ser Asn Gly Asp Thr305 310 315 320tat atc aca ggc att gca atg tcg aag gct acc aat aaa aaa ctt gtg 1008Tyr Ile Thr Gly Ile Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val325 330 335aaa gct gac gtg tat gtt gca gca tgt gat gtt cct gga ata aaa agg 1056Lys Ala Asp Val Tyr Val Ala Ala Cys Asp Val Pro Gly Ile Lys Arg340 345 350ttg atc cca tcg gag tgg aga gaa tgg gat cta ttt gac aat atc tat 1104Leu Ile Pro Ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn Ile Tyr355 360 365
aaa cta gtt gga gtt cca gtt gtc act gtt cag ctt agg tac aat ggt1152Lys Leu Val Gly Val Pro Val Val Thr Val Gln Leu Arg Tyr Asn Gly370 375 380tgg gtg aca gag atg caa gat ctg gaa aaa tca agg cag ttg aga gct1200Trp Val Thr Glu Met Gln Asp Leu Glu Lys Ser Arg Gln Leu Arg Ala385 390 395 400gca gta gga ttg gat aat ctt ctt tat act cca gat gca gac ttt tct1248Ala Val Gly Leu Asp Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Ser405 410 415tgt ttt tct gat ctt gca ctc tcg tcg cct gaa gat tat tat att gaa1296Cys Phe Ser Asp Leu Ala Leu Ser Ser Pro Glu Asp Tyr Tyr Ile Glu420 425 430gga caa ggg tcc cta ata cag gct gtt ctc acg cca ggg gat cca tac1344Gly Gln Gly Ser Leu Ile Gln Ala Val Leu Thr Pro Gly Asp Pro Tyr435 440 445atg ccc cta cct aat gat gca att ata gaa aga gtt cgg aaa cag gtt1392Met Pro Leu Pro Asn Asp Ala Ile Ile Glu Arg Val Arg Lys Gln Val450 455 460ttg gat tta ttc cca tcc tct caa ggc ctg gaa gtt cta tgg tct tcg1440Leu Asp Leu Phe Pro Ser Ser Gln Gly Leu Glu Val Leu Trp Ser Ser465 470 475 480gtg gtt aaa atc gga caa tcc cta tat cgg gag ggg cct gga aag gac1488Val Val Lys Ile Gly Gln Ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp485 490 495cca ttc aga cct gat cag aag aca cca gta aaa aat ttc ttc ctt gca1536Pro Phe Arg Pro Asp Gln Lys Thr Pro Val Lys Asn Phe Phe Leu Ala500 505 510ggt tca tac acc aaa cag gat tac att gac agt atg gaa gga gcg acc1584Gly Ser Tyr Thr Lys Gln Asp Tyr Ile Asp Ser Met Glu Gly Ala Thr515 520 525cta tcg ggg aga caa gca gct gca tat atc tgc agc gcc ggt gaa gat1632Leu Ser Gly Arg Gln Ala Ala Ala Tyr Ile Cys Ser Ala Gly Glu Asp530 535 540ctg gca gca ctt cgc aag aag atc gct gct gat cat cca gag caa ctg1680Leu Ala Ala Leu Arg Lys Lys Ile Ala Ala Asp His Pro Glu Gln Leu545 550 555 560
atc aac aaa gat tct aac gtg tcg gat gaa ctg agt ctc gta taa1725Ile Asn Lys Asp Ser Asn Val Ser Asp Glu Leu Ser Leu Val565 570&lt;210&gt;28&lt;211&gt;574&lt;212&gt;PRT&lt;213&gt;黄水仙&lt;400&gt;28Met Ala Ser Ser Thr Cys Leu Ile His Ser Ser Ser Phe Gly Val Gly1 5 10 15Gly Lys Lys Val Lys Met Asn Thr Met Ile Arg Ser Lys Leu Phe Ser20 25 30Ile Arg Ser Ala Leu Asp Thr Lys Val Ser Asp Met Ser Val Asn Ala35 40 45Pro Lys Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys50 55 60Leu Lys Val Ala Ile Ile Gly Ala Gly Leu Ala Gly Met Ser Thr Ala65 70 75 80Val Glu Leu Leu Asp Gln Gly His Glu Val Asp Ile Tyr Glu Ser Arg85 90 95Gln Phe Ile Gly Gly Lys Val Gly Ser Phe Val Asp Lys Arg Gly Asn100 105 110His Ile Glu Met Gly Leu His Val Phe Phe Gly Cys Tyr Asn Asn Leu115 120 125
Phe Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys130 135 140Asp His Thr His Thr Phe Val Asn Arg Gly Gly Glu Ile Gly Glu Leu145 150 155 160Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly Ile Arg Ala Phe165 170 175Leu Thr Thr Asn Gln Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Val180 185 190Ala Leu Ala Leu Ser Pro Val Val Arg Ala Leu Ile Asp Pro Asn Gly195 200 205Ala Met Gln Asp Ile Arg Asn Leu Asp Asn Ile Ser Phe Ser Asp Trp210 215 220Phe Leu Ser Lys Gly Gly Thr Arg Met Ser Ile Gln Arg Met Trp Asp225 230 235 240Pro Val Ala Tyr Ala Leu Gly Phe Ile Asp Cys Asp Asn Ile Ser Ala245 250 255Arg Cys Met Leu Thr Ile Phe Ser Leu Phe Ala Thr Lys Thr Glu Ala260 265 270Ser Leu Leu Arg Met Leu Lys Gly Ser Pro Asp Val Tyr Leu Ser Gly275 280 285Pro Ile Arg Lys Tyr Ile Thr Asp Lys Gly Gly Arg Phe His Leu Arg290 295 300Trp Gly Cys Arg Glu Ile Leu Tyr Asp Glu Leu Ser Asn Gly Asp Thr305 310 315 320Tyr Ile Thr Gly Ile Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val325 330 335
Lys Ala Asp Val Tyr Val Ala Ala Cys Asp Val Pro Gly Ile Lys Arg340 345 350Leu Ile Pro Ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn Ile Tyr355 360 365Lys Leu Val Gly Val Pro Val Val Thr Val Gln Leu Arg Tyr Asn Gly370 375 380Trp Val Thr Glu Met Gln Asp Leu Glu Lys Ser Arg Gln Leu Arg Ala385 390 395 400Ala Val Gly Leu Asp Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Ser405 410 415Cys Phe Ser Asp Leu Ala Leu Ser Ser Pro Glu Asp Tyr Tyr Ile Glu420 425 430Gly Gln Gly Ser Leu Ile Gln Ala Val Leu Thr Pro Gly Asp Pro Tyr435 440 445Met Pro Leu Pro Asn Asp Ala Ile Ile Glu Arg Val Arg Lys Gln Val450 455 460Leu Asp Leu Phe Pro Ser Ser Gln Gly Leu Glu Val Leu Trp Ser Ser465 470 475 480Val Val Lys Ile Gly Gln Ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp485 490 495Pro Phe Arg Pro Asp Gln Lys Thr Pro Val Lys Asn Phe Phe Leu Ala500 505 510Gly Ser Tyr Thr Lys Gln Asp Tyr Ile Asp Ser Met Glu Gly Ala Thr515 520 525
Leu Ser Gly Arg Gln Ala Ala Ala Tyr Ile Cys Ser Ala Gly Glu Asp530 535 540Leu Ala Ala Leu Arg Lys Lys Ile Ala Ala Asp His Pro Glu Gln Leu545 550 555 560Ile Asn Lys Asp Ser Asn Val Ser Asp Glu Leu Ser Leu Val565 570&lt;210&gt;29&lt;211&gt;1848&lt;212&gt;DNA&lt;213&gt;食用番茄&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1848)&lt;223&gt;
&lt;400&gt;29atg tgt acc ttg agt ttt atg tat cct aat tca ctt ctt gat ggt acc48Met Cys Thr Leu Ser Phe Met Tyr Pro Asn Ser Leu Leu Asp Gly Thr1 5 10 15tgc aag act gta gct ttg ggt gat agc aaa cca aga tac aat aaa cag96Cys Lys Thr Val Ala Leu Gly Asp Ser Lys Pro Arg Tyr Asn Lys Gln20 25 30aga agt tct tgt ttt gac cct ttg ata att gga aat tgt act gat cag144Arg Ser Ser Cys Phe Asp Pro Leu Ile Ile Gly Asn Cys Thr Asp Gln35 40 45cag cag ctt tgt ggc ttg agt tgg ggg gtg gac aag gct aag gga aga192Gln Gln Leu Cys Gly Leu Ser Trp Gly Val Asp Lys Ala Lys Gly Arg50 55 60
aga ggg ggt act gtt tcc aat ttg aaa gca gtt gta gat gta gac aaa240Arg Gly Gly Thr Val Ser Asn Leu Lys Ala Val Val Asp Val Asp Lys65 70 75 80aga gtg gag agc tat ggc agt agt gat gta gaa gga aat gag agt ggc288Arg Val Glu Ser Tyr Gly Ser Ser Asp Val Glu Gly Asn Glu Ser Gly85 90 95agc tat gat gcc att gtt ata ggt tca gga ata ggt gga ttg gtg gca336Ser Tyr Asp Ala Ile Val Ile Gly Ser Gly Ile Gly Gly Leu Val Ala100 105 110gcg acg cag ctg gcg gtt aag gga gct aag gtt tta gtt ctg gag aag384Ala Thr Gln Leu Ala Val Lys Gly Ala Lys Val Leu Val Leu Glu Lys115 120 125tat gtt att cct ggt gga agc tct ggc ttt tac gag agg gat ggt tat432Tyr Val Ile Pro Gly Gly Ser Ser Gly Phe Tyr Glu Arg Asp Gly Tyr130 135 140aag ttt gat gtt ggt tca tca gtg atg ttt gga ttc agt gat aag gga480Lys Phe Asp Val Gly Ser Ser Val Met Phe Gly Phe Ser Asp Lys Gly145 150 155 160aac ctc aat tta att act caa gca ttg gca gca gta gga cgt aaa tta528Asn Leu Asn Leu Ile Thr Gln Ala Leu Ala Ala Val Gly Arg Lys Leu165 170 175gaa gtt ata cct gac cca aca act gta cat ttc cac ctg cca aat gac576Glu Val Ile Pro Asp Pro Thr Thr Val His Phe His Leu Pro Asn Asp180 185 190ctt tct gtt cgt ata cac cga gag tat gat gac ttc att gaa gag ctt624Leu Ser Val Arg Ile His Arg Glu Tyr Asp Asp Phe Ile Glu Glu Leu195 200 205gtg agt aaa ttt cca cat gaa aag gaa ggg att atc aaa ttt tac agt672Val Ser Lys Phe Pro His Glu Lys Glu Gly Ile Ile Lys Phe Tyr Ser210 215 220gaa tgc tgg aag atc ttt aat tct ctg aat tca ttg gaa ctg aag tct720Glu Cys Trp Lys Ile Phe Asn Ser Leu Asn Ser Leu Glu Leu Lys Ser225 230 235 240ttg gag gaa ccc atc tac ctt ttt ggc cag ttc ttt aag aag ccc ctt768Leu Glu Glu Pro Ile Tyr Leu Phe Gly Gln Phe Phe Lys Lys Pro Leu245 250 255
gaa tgc ttg act ctt gcc tac tat ttg ccc cag aat gct ggt agc atc816Glu Cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gln Asn Ala Gly Ser Ile260 265 270gct cgg aag tat ata aga gat cct ggg ttg ctg tct ttt ata gat gca864Ala Arg Lys Tyr Ile Arg Asp Pro Gly Leu Leu Ser Phe Ile Asp Ala275 280 285gag tgc ttt atc gtg agt aca gtt aat gca tta caa aca cca atg atc912Glu Cys Phe Ile Val Ser Thr Val Asn Ala Leu Gln Thr Pro Met Ile290 295 300aat gca agc atg gtt cta tgt gac aga cat ttt ggc gga atc aac tac960Asn Ala Ser Met Val Leu Cys Asp Arg His Phe Gly Gly Ile Asn Tyr305 310 315 320ccc gtt ggt gga gtt ggc gag atc gcc aaa tcc tta gca aaa ggc ttg1008Pro Val Gly Gly Val Gly Glu Ile Ala Lys Ser Leu Ala Lys Gly Leu325 330 335gat gat cac gga agt cag ata ctt tat agg gca aat gtt aca agt atc1056Asp Asp His Gly Ser Gln Ile Leu Tyr Arg Ala Asn Val Thr Ser Ile340 345 350att ttg gac aat ggc aaa gct gtg gga gtg aag ctt tct gac ggg agg1104Ile Leu Asp Asn Gly Lys Ala Val Gly Val Lys Leu Ser Asp Gly Arg355 360 365aag ttt tat gct aaa acc ata gta tcg aat gct acc aga tgg gat act1152Lys Phe Tyr Ala Lys Thr Ile Val Ser Asn Ala Thr Arg Trp Asp Thr370 375 380ttt gga aag ctt tta aaa gct gag aat ctg cca aaa gaa gaa gaa aat1200Phe Gly Lys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn385 390 395 400ttc cag aaa gct tat gta aaa gca cct tct ttt ctt tct att cat atg1248Phe Gln Lys Ala Tyr Val Lys Ala Pro Ser Phe Leu Ser Ile His Met405 410 415gga gtt aaa gca gat gta ctc cca cca gac aca gat tgt cac cat ttt1296Gly Val Lys Ala Asp Val Leu Pro Pro Asp Thr Asp Cys His His Phe420 425 430gtc ctc gag gat gat tgg aca aat ttg gag aaa cca tat gga agt ata1344Val Leu Glu Asp Asp Trp Thr Asn Leu Glu Lys Pro Tyr Gly Ser Ile435 440 445
ttc ttg agt att cca aca gtt ctt gat tcc tca ttg gcc cca gaa gga1392Phe Leu Ser Ile Pro Thr Val Leu Asp Ser Ser Leu Ala Pro Glu Gly450 455 460cac cat att ctt cac att ttt aca aca tcg agc att gaa gat tgg gag1440His His Ile Leu His Ile Phe Thr Thr Ser Ser Ile Glu Asp Trp Glu465 470 475 480gga ctc tct ccg aaa gac tat gaa gcg aag aaa gag gtt gtt gct gaa1488Gly Leu Ser Pro Lys Asp Tyr Glu Ala Lys Lys Glu Val Val Ala Glu485 490 495agg att ata agc aga ctt gaa aaa aca ctc ttc cca ggg ctt aag tca1536Arg Ile Ile Ser Arg Leu Glu Lys Thr Leu Phe Pro Gly Leu Lys Ser500 505 510tct att ctc ttt aag gag gtg gga act cca aag acc cac aga cga tac1584Ser Ile Leu Phe Lys Glu Val Gly Thr Pro Lys Thr His Arg Arg Tyr515 520 525ctt gct cgt gat agt ggt acc tat gga cca atg cca cgc gga aca cct1632Leu Ala Arg Asp Ser Gly Thr Tyr Gly Pro Met Pro Arg Gly Thr Pro530 535 540aag gga ctc ctg gga atg cct ttc aat acc act gct ata gat ggt cta1680Lys Gly Leu Leu Gly Met Pro Phe Asn Thr Thr Ala Ile Asp Gly Leu545 550 555 560tat tgt gtt ggc gat agt tgc ttc cca gga caa ggt gtt ata gct gta1728Tyr Cys Val Gly Asp Ser Cys Phe Pro Gly Gln Gly Val Ile Ala Val565 570 575gcc ttt tca gga gta atg tgc gct cat cgt gtt gca gct gac tta ggg1776Ala Phe Ser Gly Val Met Cys Ala His Arg Val Ala Ala Asp Leu Gly580 585 590ttt gaa aaa aaa tca gat gtg ctg gac agt gct ctt ctt aga cta ctt1824Phe Glu Lys Lys Ser Asp Val Leu Asp Ser Ala Leu Leu Arg Leu Leu595 600 605ggt tgg tta agg aca cta gca tga1848Gly Trp Leu Arg Thr Leu Ala610 615&lt;210&gt;30&lt;211&gt;615
&lt;212&gt;PRT&lt;213&gt;食用番茄&lt;400&gt;30Met Cys Thr Leu Ser Phe Met Tyr Pro Asn Ser Leu Leu Asp Gly Thr1 5 10 15Cys Lys Thr Val Ala Leu Gly Asp Ser Lys Pro Arg Tyr Asn Lys Gln20 25 30Arg Ser Ser Cys Phe Asp Pro Leu Ile Ile Gly Asn Cys Thr Asp Gln35 40 45Gln Gln Leu Cys Gly Leu Ser Trp Gly Val Asp Lys Ala Lys Gly Arg50 55 60Arg Gly Gly Thr Val Ser Asn Leu Lys Ala Val Val Asp Val Asp Lys65 70 75 80Arg Val Glu Ser Tyr Gly Ser Ser Asp Val Glu Gly Asn Glu Ser Gly85 90 95Ser Tyr Asp Ala Ile Val Ile Gly Ser Gly Ile Gly Gly Leu Val Ala100 105 110Ala Thr Gln Leu Ala Val Lys Gly Ala Lys Val Leu Val Leu Glu Lys115 120 125Tyr Val Ile Pro Gly Gly Ser Ser Gly Phe Tyr Glu Arg Asp Gly Tyr130 135 140Lys Phe Asp Val Gly Ser Ser Val Met Phe Gly Phe Ser Asp Lys Gly145 150 155 160
Asn Leu Asn Leu Ile Thr Gln Ala Leu Ala Ala Val Gly Arg Lys Leu165 170 175Glu Val Ile Pro Asp Pro Thr Thr Val His Phe His Leu Pro Asn Asp180 185 190Leu Ser Val Arg Ile His Arg Glu Tyr Asp Asp Phe Ile Glu Glu Leu195 200 205Val Ser Lys Phe Pro His Glu Lys Glu Gly Ile Ile Lys Phe Tyr Ser210 215 220Glu Cys Trp Lys Ile Phe Asn Ser Leu Asn Ser Leu Glu Leu Lys Ser225 230 235 240Leu Glu Glu Pro Ile Tyr Leu Phe Gly Gln Phe Phe Lys Lys Pro Leu245 250 255Glu Cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gln Asn Ala Gly Ser Ile260 265 270Ala Arg Lys Tyr Ile Arg Asp Pro Gly Leu Leu Ser Phe Ile Asp Ala275 280 285Glu Cys Phe Ile Val Ser Thr Val Asn Ala Leu Gln Thr Pro Met Ile290 295 300Asn Ala Ser Met Val Leu Cys Asp Arg His Phe Gly Gly Ile Asn Tyr305 310 315 320Pro Val Gly Gly Val Gly Glu Ile Ala Lys Ser Leu Ala Lys Gly Leu325 330 335Asp Asp His Gly Ser Gln Ile Leu Tyr Arg Ala Asn Val Thr Ser Ile340 345 350Ile Leu Asp Asn Gly Lys Ala Val Gly Val Lys Leu Ser Asp Gly Arg355 360 365
Lys Phe Tyr Ala Lys Thr Ile Val Ser Asn Ala Thr Arg Trp Asp Thr370 375 380Phe Gly Lys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn385 390 395 400Phe Gln Lys Ala Tyr Val Lys Ala Pro Ser Phe Leu Ser Ile His Met405 410 415Gly Val Lys Ala Asp Val Leu Pro Pro Asp Thr Asp Cys His His Phe420 425 430Val Leu Glu Asp Asp Trp Thr Asn Leu Glu Lys Pro Tyr Gly Ser Ile435 440 445Phe Leu Ser Ile Pro Thr Val Leu Asp Ser Ser Leu Ala Pro Glu Gly450 455 460His His Ile Leu His Ile Phe Thr Thr Ser Ser Ile Glu Asp Trp Glu465 470 475 480Gly Leu Ser Pro Lys Asp Tyr Glu Ala Lys Lys Glu Val Val Ala Glu485 490 495Arg Ile Ile Ser Arg Leu Glu Lys Thr Leu Phe Pro Gly Leu Lys Ser500 505 510Ser Ile Leu Phe Lys Glu Val Gly Thr Pro Lys Thr His Arg Arg Tyr515 520 525Leu Ala Arg Asp Ser Gly Thr Tyr Gly Pro Met Pro Arg Gly Thr Pro530 535 540Lys Gly Leu Leu Gly Met Pro Phe Asn Thr Thr Ala Ile Asp Gly Leu545 550 555 560
Tyr Cys Val Gly Asp Ser Cys Phe Pro Gly Gln Gly Val Ile Ala Val565 570 575Ala Phe Ser Gly Val Met Cys Ala His Arg Val Ala Ala Asp Leu Gly580 585 590Phe Glu Lys Lys Ser Asp Val Leu Asp Ser Ala Leu Leu Arg Leu Leu595 600 605Gly Trp Leu Arg Thr Leu Ala610 615&lt;210&gt;31&lt;211&gt;1233&lt;212&gt;DNA&lt;213&gt;万寿菊&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1233)&lt;223&gt;
&lt;400&gt;31atg gcc aca cac aaa ctc ctt caa ttc acc acc aat ctc cca cca tct48Met Ala Thr His Lys Leu Leu Gln Phe Thr Thr Asn Leu Pro Pro Ser1 5 10 15tct tct tca atc tct act ggc tgt tca ctc tcc ccc ttc ttc ctc aaa96Ser Ser Ser Ile Ser Thr Gly Cys Ser Leu Ser Pro Phe Phe Leu Lys20 25 30tca tct tct cat tcc cct aac cct cgc cga cac cgc cgc tcc gcc gta144Ser Ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala Val35 40 45
tgc tgc tct ttc gcc tca ctc gac tct gca aaa atc aaa gtc gtt ggc192Cys Cys Ser Phe Ala Ser Leu Asp Ser Ala Lys Ile Lys Val Val Gly50 55 60gtc ggt ggt ggt ggc aac aat gcc gtt aac cgc atg att ggt agc ggc240Val Gly Gly Gly Gly Asn Asn Ala Val Asn Arg Met Ile Gly Ser Gly65 70 75 80tta cag ggt gtt gat ttt tac gcc att aac acg gac tca caa gcg ctt288Leu Gln Gly Val Asp Phe Tyr Ala Ile Asn Thr Asp Ser Gln Ala Leu85 90 95ctg caa tct gtt gca cat aac cct att caa att ggg gag ctt ttg act336Leu Gln Ser Val Ala His Asn Pro Ile Gln Ile Gly Glu Leu Leu Thr100 105 110cgt gga tta ggt act ggt ggg aac ccg ctt ttg gga gaa cag gct gcg384Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gln Ala Ala115 120 125gag gag tcg aag gaa gcg att ggg aat gcg ctt aaa ggg tcg gat ctt432Glu Glu Ser Lys Glu Ala Ile Gly Asn Ala Leu Lys Gly Ser Asp Leu130 135 140gtg ttt ata aca gca ggt atg ggt ggt ggg acg ggt tcg ggt gct gct480Val Phe Ile Thr Ala Gly Met Gly Gly Gly Thr Gly Ser Gly Ala Ala145 150 155 160cca gtt gta gcg cag ata gcg aaa gaa gca ggg tat tta act gtt ggt528Pro Val Val Ala Gln Ile Ala Lys Glu Ala Gly Tyr Leu Thr Val Gly165 170 175gtt gta acg tac cca ttc agc ttt gaa ggc cgt aaa aga tca gta cag576Val Val Thr Tyr Pro Phe Ser Phe Glu Gly Arg Lys Arg Ser Val Gln180 185 190gcg tta gag gct att gag aag ctg caa aag aac gtt gac aca ctt ata624Ala Leu Glu Ala Ile Glu Lys Leu Gln Lys Asn Val Asp Thr Leu Ile195 200 205gtg att cca aat gac cgt ttg ctg gat att gct gat gaa aac acg cct672Val Ile Pro Asn Asp Arg Leu Leu Asp Ile Ala Asp Glu Asn Thr Pro210 215 220ctt cag gat gct ttt ctt ctt gct gat gat gta ctc cgc caa gga gtt720Leu Gln Asp Ala Phe Leu Leu Ala Asp Asp Val Leu Arg Gln Gly Val225 230 235 240
caa gga atc tca gat ata att aca ata cct ggg ctg gta aat gtg gac768Gln Gly Ile Ser Asp Ile Ile Thr Ile Pro Gly Leu Val Asn Val Asp245 250 255ttt gca gac gtt aaa gca gtc atg aaa gat tct gga act gca atg ctt816Phe Ala Asp Val Lys Ala Val Met Lys Asp Ser Gly Thr Ala Met Leu260 265 270ggt gtc ggt gtt tcc tca agt aaa aac cga gct gaa gaa gca gct gaa864Gly Val Gly Val Ser Ser Ser Lys Asn Arg Ala Glu Glu Ala Ala Glu275 280 285caa gca act ctt gct cct ttg att gga tca tca att caa tct gct aca912Gln Ala Thr Leu Ala Pro Leu Ile Gly Ser Ser Ile Gln Ser Ala Thr290 295 300ggt gtt gtt tat aat att acc gga ggg aag gac ata act cta caa gaa960Gly Val Val Tyr Asn Ile Thr Gly Gly Lys Asp Ile Thr Leu Gln Glu305 310 315 320gtc aac agg gtt tct cag gtg gta aca agt ttg gca gat cca tca gca1008Val Asn Arg Val Ser Gln Val Val Thr Ser Leu Ala Asp Pro Ser Ala325 330 335aac att ata ttc ggg gca gtg gta gat gag aga tac aac ggg gag att1056Asn Ile Ile Phe Gly Ala Val Val Asp Glu Arg Tyr Asn Gly Glu Ile340 345 350cat gtg acc att gtt gct act ggc ttt gcc cag tcg ttt cag aaa tct1104His Val Thr Ile Val Ala Thr Gly Phe Ala Gln Ser Phe Gln Lys Ser355 360 365ctt ctt gct gac ccg aaa gga gca aaa ctt gtt gat aga aat caa gaa1152Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu Val Asp Arg Asn Gln Glu370 375 380cct aca caa cct ttg act tcc gcg aga tct ttg aca aca cct tct cct1200Pro Thr Gln Pro Leu Thr Ser Ala Arg Ser Leu Thr Thr Pro Ser Pro385 390 395 400gct ccg tct cgg tct agg aaa ctc ttc ttt taa1233Ala Pro Ser Arg Ser Arg Lys Leu Phe Phe405 410&lt;210&gt;32&lt;211&gt;410
&lt;212&gt;PRT&lt;213&gt;万寿菊&lt;400&gt;32Met Ala Thr His Lys Leu Leu Gln Phe Thr Thr Asn Leu Pro Pro Ser1 5 10 15Ser Ser Ser Ile Ser Thr Gly Cys Ser Leu Ser Pro Phe Phe Leu Lys20 25 30Ser Ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala Val35 40 45Cys Cys Ser Phe Ala Ser Leu Asp Ser Ala Lys Ile Lys Val Val Gly50 55 60Val Gly Gly Gly Gly Asn Asn Ala Val Asn Arg Met Ile Gly Ser Gly65 70 75 80Leu Gln Gly Val Asp Phe Tyr Ala Ile Asn Thr Asp Ser Gln Ala Leu85 90 95Leu Gln Ser Val Ala His Asn Pro Ile Gln Ile Gly Glu Leu Leu Thr100 105 110Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gln Ala Ala115 120 125Glu Glu Ser Lys Glu Ala Ile Gly Asn Ala Leu Lys Gly Ser Asp Leu130 135 140Val Phe Ile Thr Ala Gly Met Gly Gly Gly Thr Gly Ser Gly Ala Ala145 150 155 160
Pro Val Val Ala Gln Ile Ala Lys Glu Ala Gly Tyr Leu Thr Val Gly165 170 175Val Val Thr Tyr Pro Phe Ser Phe Glu Gly Arg Lys Arg Ser Val Gln180 185 190Ala Leu Glu Ala Ile Glu Lys Leu Gln Lys Asn Val Asp Thr Leu Ile195 200 205Val Ile Pro Asn Asp Arg Leu Leu Asp Ile Ala Asp Glu Asn Thr Pro210 215 220Leu Gln Asp Ala Phe Leu Leu Ala Asp Asp Val Leu Arg Gln Gly Val225 230 235 240Gln Gly Ile Ser Asp Ile Ile Thr Ile Pro Gly Leu Val Asn Val Asp245 250 255Phe Ala Asp Val Lys Ala Val Met Lys Asp Ser Gly Thr Ala Met Leu260 265 270Gly Val Gly Val Ser Ser Ser Lys Asn Arg Ala Glu Glu Ala Ala Glu275 280 285Gln Ala Thr Leu Ala Pro Leu Ile Gly Ser Ser Ile Gln Ser Ala Thr290 295 300Gly Val Val Tyr Asn Ile Thr Gly Gly Lys Asp Ile Thr Leu Gln Glu305 310 315 320Val Asn Arg Val Ser Gln Val Val Thr Ser Leu Ala Asp Pro Ser Ala325 330 335Asn Ile Ile Phe Gly Ala Val Val Asp Glu Arg Tyr Asn Gly Glu Ile340 345 350His Val Thr Ile Val Ala Thr Gly Phe Ala Gln Ser Phe Gln Lys Ser355 360 365
Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu Val Asp Arg Asn Gln Glu370 375 380Pro Thr Gln Pro Leu Thr Ser Ala Arg Ser Leu Thr Thr Pro Ser Pro385 390 395 400Ala Pro Ser Arg Ser Arg Lys Leu Phe Phe405 410&lt;210&gt;33&lt;211&gt;891&lt;212&gt;DNA&lt;213&gt;万寿菊&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(891)&lt;223&gt;
&lt;400&gt;33atg aca tcc ctg agg ttt cta aca gaa ccc tca ctt gta tgc tca tcc48Met Thr Ser Leu Arg Phe Leu Thr Glu Pro Ser Leu Val Cys Ser Ser1 5 10 15act ttc ccc aca ttc aat ccc cta cac aaa acc cta act aaa cca aca96Thr Phe Pro Thr Phe Asn Pro Leu His Lys Thr Leu Thr Lys Pro Thr20 25 30cca aaa ccc tac cca aag cca cca cca att cgc tcc gtc ctt caa tac144Pro Lys Pro Tyr Pro Lys Pro Pro Pro Ile Arg Ser Val Leu Gln Tyr35 40 45aat cgc aaa cca gag ctc gcc gga gac act cca cga gtc gtc gca atc192Asn Arg Lys Pro Glu Leu Ala Gly Asp Thr Pro Arg Val Val Ala Ile50 55 60
gac gcc gac gtt ggt cta cgt aac ctc gat ctt ctt ctc ggt ctc gaa240Asp Ala Asp Val Gly Leu Arg Asn Leu Asp Leu Leu Leu Gly Leu Glu65 70 75 80aac cgc gtc aat tac acc gtc gtt gaa gtt ctc aac ggc gat tgc aga288Asn Arg Val Asn Tyr Thr Val Val Glu Val Leu Asn Gly Asp Cys Arg85 90 95ctc gac caa gcc cta gtt cgt gat aaa cgc tgg tca aat ttc gaa ttg336Leu Asp Gln Ala Leu Val Arg Asp Lys Arg Trp Ser Asn Phe Glu Leu100 105 110ctt tgt att tca aaa cct agg tca aaa ttg cct tta gga ttt ggg gga384Leu Cys Ile Ser Lys Pro Arg Ser Lys Leu Pro Leu Gly Phe Gly Gly115 120 125aaa gct tta gtt tgg ctt gat gca tta aaa gat agg caa gaa ggt tgc432Lys Ala Leu Val Trp Leu Asp Ala Leu Lys Asp Arg Gln Glu Gly Cys130 135 140ccg gat ttt ata ctt ata gat tgt cct gca ggt att gat gcc ggg ttc480Pro Asp Phe Ile Leu Ile Asp Cys Pro Ala Gly Ile Asp Ala Gly Phe145 150 155 160ata acc gcc att aca ccg gct aac gaa gcc gta tta gtt aca aca cct528Ile Thr Ala Ile Thr Pro Ala Asn Glu Ala Val Leu Val Thr Thr Pro165 170 175gat att act gca ttg aga gat gca gat aga gtt aca ggc ttg ctt gaa576Asp Ile Thr Ala Leu Arg Asp Ala Asp Arg Val Thr Gly Leu Leu Glu180 185 190tgt gat gga att agg gat att aaa atg att gtg aac aga gtt aga act624Cys Asp Gly Ile Arg Asp Ile Lys Met Ile Val Asn Arg Val Arg Thr195 200 205gat ttg ata agg ggt gaa gat atg atg tca gtt ctt gat gtt caa gag672Asp Leu Ile Arg Gly Glu Asp Met Met Ser Val Leu Asp Val Gln Glu210 215 220atg ttg gga ttg tca ttg ttg agt gat acc cga gga ttc gaa gtg att720Met Leu Gly Leu Ser Leu Leu Ser Asp Thr Arg Gly Phe Glu Val Ile225 230 235 240cgg agt acg aat aga ggg ttt ccg ctt gtg ttg aac aag cct ccg act768Arg Ser Thr Asn Arg Gly Phe Pro Leu Val Leu Asn Lys Pro Pro Thr245 250 255
tta gca gga ttg gca ttt gag cag gct gct tgg aga ttg gtt gag caa816Leu Ala Gly Leu Ala Phe Glu Gln Ala Ala Trp Arg Leu Val Glu Gln260 265 270gat agc atg aag gct gtg atg gtg gag gaa gaa cct aaa aag agg gga864Asp Ser Met Lys Ala Val Met Val Glu Glu Glu Pro Lys Lys Arg Gly275 280 285ttt ttc tcg ttt ttt gga ggt tag tga891Phe Phe Ser Phe Phe Gly Gly290 295&lt;210&gt;34&lt;211&gt;295&lt;212&gt;PRT&lt;213&gt;万寿菊&lt;400&gt;34Met Thr Ser Leu Arg Phe Leu Thr Glu Pro Ser Leu Val Cys Ser Ser1 5 10 15Thr Phe Pro Thr Phe Asn Pro Leu His Lys Thr Leu Thr Lys Pro Thr20 25 30Pro Lys Pro Tyr Pro Lys Pro Pro Pro Ile Arg Ser Val Leu Gln Tyr35 40 45Asn Arg Lys Pro Glu Leu Ala Gly Asp Thr Pro Arg Val Val Ala Ile50 55 60Asp Ala Asp Val Gly Leu Arg Asn Leu Asp Leu Leu Leu Gly Leu Glu65 70 75 80Asn Arg Val Asn Tyr Thr Val Val Glu Val Leu Asn Gly Asp Cys Arg85 90 95
Leu Asp Gln Ala Leu Val Arg Asp Lys Arg Trp Ser Asn Phe Glu Leu100 105 110Leu Cys Ile Ser Lys Pro Arg Ser Lys Leu Pro Leu Gly Phe Gly Gly115 120 125Lys Ala Leu Val Trp Leu Asp Ala Leu Lys Asp Arg Gln Glu Gly Cys130 135 140Pro Asp Phe Ile Leu Ile Asp Cys Pro Ala Gly Ile Asp Ala Gly Phe145 150 155 160Ile Thr Ala Ile Thr Pro Ala Asn Glu Ala Val Leu Val Thr Thr Pro165 170 175Asp Ile Thr Ala Leu Arg Asp Ala Asp Arg Val Thr Gly Leu Leu Glu180 185 190Cys Asp Gly Ile Arg Asp Ile Lys Met Ile Val Asn Arg Val Arg Thr195 200 205Asp Leu Ile Arg Gly Glu Asp Met Met Ser Val Leu Asp Val Gln Glu210 215 220Met Leu Gly Leu Ser Leu Leu Ser Asp Thr Arg Gly Phe Glu Val Ile225 230 235 240Arg Ser Thr Asn Arg Gly Phe Pro Leu Val Leu Asn Lys Pro Pro Thr245 250 255Leu Ala Gly Leu Ala Phe Glu Gln Ala Ala Trp Arg Leu Val Glu Gln260 265 270Asp Ser Met Lys Ala Val Met Val Glu Glu Glu Pro Lys Lys Arg Gly275 280 285Phe Phe Ser Phe Phe Gly Gly290 295
&lt;210&gt;35&lt;211&gt;1662&lt;212&gt;DNA&lt;213&gt;雨生红球藻&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(168)..(1130)&lt;223&gt;
&lt;400&gt;35cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc176Met His Val1gca tcg gca cta atg gtc gag cag aaa ggc agt gag gca gct gct tcc224Ala Ser Ala Leu Met Val Glu Gln Lys Gly Ser Glu Ala Ala Ala Ser5 10 15agc cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tcc272Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gln Tyr His Met Pro Ser20 25 30 35gag tcg tca gac gca gct cgt cct gcg cta aag cac gcc tac aaa cct320Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro40 45 50cca gca tct gac gcc aag ggc atc acg atg gcg ctg acc atc att ggc368Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr Ile Ile Gly55 60 65acc tgg acc gca gtg ttt tta cac gca ata ttt caa atc agg cta ccg416Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile Arg Leu Pro70 75 80
aca tcc atg gac cag ctt cac tgg ttg cct gtg tcc gaa gcc aca gcc464Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala85 90 95cag ctt ttg ggc gga agc agc agc cta ctg cac atc gct gca gtc ttc512Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala Ala Val Phe100 105 110 115att gta ctt gag ttc ctg tac act ggt cta ttc atc acc aca cat gac560Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr Thr His Asp120 125 130gca atg cat ggc acc ata gct ttg agg cac agg cag ctc aat gat ctc608Ala Met His Gly Thr Ile Ala Leu Arg His Arg Gln Leu Asn Asp Leu135 140 145ctt ggc aac atc tgc ata tca ctg tac gcc tgg ttt gac tac agc atg656Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met150 155 160ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg704Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly165 170 175aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc752Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe180 185 190 195gcc agc ttc atg tcc agc tac atg tcc ctg tgg cag ttt gcc cgg ctg800Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu200 205 210gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat848Ala Trp Trp Ala Val Val Met Gln Met Leu Gly Ala Pro Met Ala Asn215 220 225ctc cta gtc ttc atg gct gca gcc cca atc ttg tca gca ttc cgc ctc896Leu Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu230 235 240ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca944Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala245 250 255gca ggc tct cag gtg atg gcc tgg ttc agg gcc aag aca agt gag gca992Ala Gly Ser Gln Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala260 265 270 275
tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg1040Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp280 285 290gag cac cac agg tgg ccc ttt gcc ccc tgg tgg cag ctg ccc cac tgc1088Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gln Leu Pro His Cys295 300 305cgc cgc ctg tcc ggg cgt ggc ctg gtg cct gcc ttg gca tga1130Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala310 315 320cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgctac agggtgctgc 1190ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430gccggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgcac 1490acagccaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tcgtgctatt 1550gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662&lt;210&gt;36&lt;211&gt;320&lt;212&gt;PRT&lt;213&gt;雨生红球藻&lt;400&gt;36Met His Val Ala Ser Ala Leu Met Val Glu Gln Lys Gly Ser Glu Ala1 5 10 15Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gln Tyr His20 25 30
Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala35 40 45Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr50 55 60Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile65 70 75 80Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu85 90 95Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala100 105 110Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr115 120 125Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg His Arg Gln Leu130 135 140Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp145 150 155 160Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly165 170 175Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val180 185 190Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe195 200 205Ala Arg Leu Ala Trp Trp Ala Val Val Met Gln Met Leu Gly Ala Pro210 215 220
Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala225 230 235 240Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro245 250 255Gly Pro Ala Ala Gly Ser Gln Val Met Ala Trp Phe Arg Ala Lys Thr260 265 270Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp275 280 285Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gln Leu290 295 300Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala305 310 315 320&lt;210&gt;37&lt;211&gt;729&lt;212&gt;DNA&lt;213&gt;橙黄农杆菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(729)&lt;223&gt;
&lt;400&gt;37atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agc ctg48Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15
atc gtc tcg ggc ggc atc atc gcc gct tgg ctg gcc ctg cat gtg cat96Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc atc ctg gcg atc gca144Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala35 40 45aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg192Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60cat gac gcg atg cac ggg tcg gtg gtg ccg ggg cgt ccg cgc gcc aat240His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg288Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc336Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc384Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc432Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140gtc atc gtg acg gtc tat gcg ctg atc ctt ggg gat cgc tgg atg tac480Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160gtg gtc ttc tgg ccg ctg ccg tcg atc ctg gcg tcg atc cag ctg ttc528Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg576Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg624Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205
ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac672Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac720Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240acc gca tga729Thr Ala&lt;210&gt;38&lt;211&gt;242&lt;212&gt;PRT&lt;213&gt;橙黄农杆菌&lt;400&gt;38Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala35 40 45Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240Thr Ala&lt;210&gt;39&lt;211&gt;1631&lt;212&gt;DNA&lt;213&gt;产碱菌属
&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(99)..(827)&lt;223&gt;
&lt;400&gt;39ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tcc gga cgg aag cct 116Met Ser Gly Arg Lys Pro1 5ggc aca act ggc gac acg atc gtc aat ctc ggt ctg acc gcc gcg atc164Gly Thr Thr Gly Asp Thr Ile Val Asn Leu Gly Leu Thr Ala Ala Ile10 15 20ctg ctg tgc tgg ctg gtc ctg cac gcc ttt acg cta tgg ttg cta gat212Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp25 30 35gcg gcc gcg cat ccg ctg ctt gcc gtg ctg tgc ctg gct ggg ctg acc260Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr40 45 50tgg ctg tcg gtc ggg ctg ttc atc atc gcg cat gac gca atg cac ggg308Trp Leu Ser Val Gly Leu Phe Ile Ile Ala His Asp Ala Met His Gly55 60 65 70tcc gtg gtg ccg ggg cgg ccg cgc gcc aat gcg gcg atc ggg caa ctg356Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala Ile Gly Gln Leu75 80 85gcg ctg tgg ctc tat gcg ggg ttc tcg tgg ccc aag ctg atc gcc aag404Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu Ile Ala Lys90 95 100cac atg acg cat cac cgg cac gcc ggc acc gac aac gat ccc gat ttc452His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe105 110 115ggt cac gga ggg ccc gtg cgc tgg tac ggc agc ttc gtc tcc acc tat500Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr120 125 130
ttc ggc tgg cga gag gga ctg ctg cta ccg gtg atc gtc acc acc tat548Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val Ile Val Thr Thr Tyr135 140 145 150gcg ctg atc ctg ggc gat cgc tgg atg tat gtc atc ttc tgg ccg gtc596Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr Val Ile Phe Trp Pro Val155 160 165ccg gcc gtt ctg gcg tcg atc cag att ttc gtc ttc gga act tgg ctg644Pro Ala Val Leu Ala Ser Ile Gln Ile Phe Val Phe Gly Thr Trp Leu170 175 180ccc cac cgc ccg gga cat gac gat ttt ccc gac cgg cac aac gcg agg692Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg185 190 195tcg acc ggc atc ggc gac ccg ttg tca cta ctg acc tgc ttc cat ttc740Ser Thr Gly Ile Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe200 205 210ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg788Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp215 220 225 230cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 837Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala235 240cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat 897tatgcacggc cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa 1257gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497
actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 1557tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617tgcgtgcggt gacc1631&lt;210&gt;40&lt;211&gt;242&lt;212&gt;PRT&lt;213&gt;产碱菌属&lt;400&gt;40Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr Ile Val Asn Leu1 5 10 15Gly Leu Thr Ala Ala Ile Leu Leu Cys Trp Leu Val Leu His Ala Phe20 25 30Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu35 40 45Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80Ala Ala Ile Gly Gln Leu Ala Leu Trp Leu Tyr Ala Gly Phe Set Trp85 90 95Pro Lys Leu Ile Ala Lys His Met Thr His His Arg His Ala Gly Thr100 105 110Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly115 120 125
Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140Val Ile Val Thr Thr Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160Val Ile Phe Trp Pro Val Pro Ala Val Leu Ala Ser Ile Gln Ile Phe165 170 175Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro180 185 190Asp Arg His Asn Ala Arg Ser Thr Gly Ile Gly Asp Pro Leu Ser Leu195 200 205Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly225 230 235 240Arg Ala&lt;210&gt;41&lt;211&gt;729&lt;212&gt;DNA&lt;213&gt;Paracoccus marcusii&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(729)
&lt;223&gt;
&lt;400&gt;41atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc aca agc ctg48Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15atc gtc tcg ggc ggc atc atc gcc gca tgg ctg gcc ctg cat gtg cat96Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30gcg ctg tgg ttt ctg gac gcg gcg gcc cat ccc atc ctg gcg gtc gcg144Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala35 40 45aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg192Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60cat gac gcg atg cac ggg tcg gtc gtg ccg ggg cgt ccg cgc gcc aat240His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg288Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc336Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc384Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc432Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140gtc atc gtg acg gtc tat gcg ctg atc ctg ggg gat cgc tgg atg tac480Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160gtg gtc ttc tgg ccg ttg ccg tcg atc ctg gcg tcg atc cag ctg ttc528Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175
gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg576Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190gac cgc cat aat gcg cgg tcg tcg cgg atc agc gac cct gtg tcg ctg624Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac672Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac720Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240acc gca tga729Thr Ala&lt;210&gt;42&lt;211&gt;242&lt;212&gt;PRT&lt;213&gt;Paracoccus marcusii&lt;400&gt;42Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala35 40 45Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240Thr Ala&lt;210&gt;43
&lt;211&gt;1629&lt;212&gt;DNA&lt;213&gt;Synechococystis&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1629)&lt;223&gt;
&lt;400&gt;43atg atc acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta48Met Ile Thr Thr Asp Val Val Ile Ile Gly Ala Gly His Asn Gly Leu1 5 10 15gtc tgt gca gcc tat ttg ctc caa cgg ggc ttg ggg gtg acg tta cta96Val Cys Ala Ala Tyr Leu Leu Gln Arg Gly Leu Gly Val Thr Leu Leu20 25 30gaa aag cgg gaa gta cca ggg ggg gcg gcc acc aca gaa gct ctc atg144Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met35 40 45ccg gag cta tcc ccc cag ttt cgc ttt aac cgc tgt gcc att gac cac192Pro Glu Leu Ser Pro Gln Phe Arg Phe Asn Arg Cys Ala Ile Asp His50 55 60gaa ttt atc ttt ctg ggg ccg gtg ttg cag gag cta aat tta gcc cag240Glu Phe Ile Phe Leu Gly Pro Val Leu Gln Glu Leu Asn Leu Ala Gln65 70 75 80tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg288Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly85 90 95ctg gat ggc caa gct ttt atg agc tac cgt tcc cta gaa aaa acc tgt336Leu Asp Gly Gln Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys100 105 110gcc cac att gcc acc tat agc ccc cga gat gcg gaa aaa tat cgg caa384Ala His Ile Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gln115 120 125
ttt gtc aat tat tgg acg gat ttg ctc aac gct gtc cag cct gct ttt432Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gln Pro Ala Phe130 135 140aat gct ccg ccc cag gct tta cta gat tta gcc ctg aac tat ggt tgg480Asn Ala Pro Pro Gln Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp145 150 155 160gaa aac tta aaa tcc gtg ctg gcg atc gcc ggg tcg aaa acc aag gcg528Glu Asn Leu Lys Ser Val Leu Ala Ile Ala Gly Ser Lys Thr Lys Ala165 170 175ttg gat ttt atc cgc act atg atc ggc tcc ccg gaa gat gtg ctc aat576Leu Asp Phe Ile Arg Thr Met Ile Gly Ser Pro Glu Asp Val Leu Asn180 185 190gaa tgg ttc gac agc gaa cgg gtt aaa gct cct tta gct aga cta tgt624Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys195 200 205tcg gaa att ggc gct ccc cca tcc caa aag ggt agt agc tcc ggc atg672Ser Glu Ile Gly Ala Pro Pro Ser Gln Lys Gly Ser Ser Ser Gly Met210 215 220atg atg gtg gcc atg cgg cat ttg gag gga att gcc aga cca aaa gga720Met Met Val Ala Met Arg His Leu Glu Gly Ile Ala Arg Pro Lys Gly225 230 235 240ggc act gga gcc ctc aca gaa gcc ttg gtg aag tta gtg caa gcc caa768Gly Thr Gly Ala Leu Thr Glu Ala Leu Val LVs Leu Val Gln Ala Gln245 250 255ggg gga aaa atc ctc act gac caa acc gtc aaa cgg gta ttg gtg gaa816Gly Gly Lys Ile Leu Thr Asp Gln Thr Val Lys Arg Val Leu Val Glu260 265 270aac aac cag gcg atc ggg gtg gag gta gct aac gga gaa cag tac cgg864Asn Asn Gln Ala Ile Gly Val Glu Val Ala Asn Gly Glu Gln Tyr Arg275 280 285gcc aaa aaa ggc gtg att tct aac atc gat gcc cgc cgt tta ttt ttg912Ala Lys Lys Gly Val Ile Ser Asn Ile Asp Ala Arg Arg Leu Phe Leu290 295 300caa ttg gtg gaa ccg ggg gcc cta gcc aag gtg aat caa aac cta ggg960Gln Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gln Asn Leu Gly305 310 315 320
gaa cga ctg gaa cgg cgc act gtg aac aat aac gaa gcc att tta aaa1008Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala Ile Leu Lys325 330 335atc gat tgt gcc ctc tcc ggt tta ccc cac ttc act gcc atg gcc ggg1056Ile Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly340 345 350ccg gag gat cta acg gga act att ttg att gcc gac tcg gta cgc cat1104Pro Glu Asp Leu Thr Gly Thr Ile Leu Ile Ala Asp Ser Val Arg His355 360 365gtc gag gaa gcc cac gcc ctc att gcc ttg ggg caa att ccc gat gct1152Val Glu Glu Ala His Ala Leu Ile Ala Leu Gly Gln Ile Pro Asp Ala370 375 380aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc acc atg1200Asn Pro Ser Leu Tyr Leu Asp Ile Pro Thr Val Leu Asp Pro Thr Met385 390 395 400gcc ccc cct ggg cag cac acc ctc tgg atc gaa ttt ttt gcc ccc tac1248Ala Pro Pro Gly Gln His Thr Leu Trp Ile Glu Phe Phe Ala Pro Tyr405 410 415cgc atc gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc1296Arg Ile Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr420 425 430gat gag tta aag gaa aaa gtg gcg gat cgg gtg att gat aaa tta acg1344Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val Ile Asp Lys Leu Thr435 440 445gac tat gcc cct aac cta aaa tct ctg atc att ggt cgc cga gtg gaa1392Asp Tyr Ala Pro Asn Leu Lys Ser Leu Ile Ile Gly Arg Arg Val Glu450 455 460agt ccc gcc gaa ctg gcc caa cgg ctg gga agt tac aac ggc aat gtc1440Ser Pro Ala Glu Leu Ala Gln Arg Leu Gly Ser Tyr Asn Gly Asn Val465 470 475 480tat cat ctg gat atg agt ttg gac caa atg atg ttc ctc cgg cct cta1488Tyr His Leu Asp Met Ser Leu Asp Gln Met Met Phe Leu Arg Pro Leu485 490 495ccg gaa att gcc aac tac caa acc ccc atc aaa aat ctt tac tta aca1536Pro Glu Ile Ala Asn Tyr Gln Thr Pro Ile Lys Asn Leu Tyr Leu Thr500 505 510
ggg gcg ggt acc cat ccc ggt ggc tcc ata tca ggt atg ccc ggt aga1584Gly Ala Gly Thr His Pro Gly Gly Ser Ile Ser Gly Met Pro Gly Arg515 520 525aat tgc gct cgg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa1629Asn Cys Ala Arg Val Phe Leu Lys Gln Gln Arg Arg Phe Trp530 535 540&lt;210&gt;44&lt;211&gt;542&lt;212&gt;PRT&lt;213&gt;Synechococystis&lt;400&gt;44Met Ile Thr Thr Asp Val Val Ile Ile Gly Ala Gly His Asn Gly Leu1 5 10 15Val Cys Ala Ala Tyr Leu Leu Gln Arg Gly Leu Gly Val Thr Leu Leu20 25 30Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met35 40 45Pro Glu Leu Ser Pro Gln Phe Arg Phe Asn Arg Cys Ala Ile Asp His50 55 60Glu Phe Ile Phe Leu Gly Pro Val Leu Gln Glu Leu Asn Leu Ala Gln65 70 75 80Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly85 90 95Leu Asp Gly Gln Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys100 105 110
Ala His Ile Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gln115 120 125Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gln Pro Ala Phe130 135 140Asn Ala Pro Pro Gln Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp145 150 155 160Glu Asn Leu Lys Ser Val Leu Ala Ile Ala Gly Ser Lys Thr Lys Ala165 170 175Lau Asp Phe Ile Arg Thr Met Ile Gly Ser Pro Glu Asp Val Leu Asn180 185 190Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys195 200 205Ser Glu Ile Gly Ala Pro Pro Ser Gln Lys Gly Ser Ser Ser Gly Met210 215 220Met Met Val Ala Met Arg His Leu Glu Gly Ile Ala Arg Pro Lys Gly225 230 235 240Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gln Ala Gln245 250 255Gly Gly Lys Ile Leu Thr Asp Gln Thr Val Lys Arg Val Leu Val Glu260 265 270Asn Asn Gln Ala Ile Gly Val Glu Val Ala Asn Gly Glu Gln Tyr Arg275 280 285Ala Lys Lys Gly Val Ile Ser Asn Ile Asp Ala Arg Arg Leu Phe Leu290 295 300Gln Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gln Asn Leu Gly305 310 315 320
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala Ile Leu Lys325 330 335Ile Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly340 345 350Pro Glu Asp Leu Thr Gly Thr Ile Leu Ile Ala Asp Ser Val Arg His355 360 365Val Glu Glu Ala His Ala Leu Ile Ala Leu Gly Gln Ile Pro Asp Ala370 375 380Asn Pro Ser Leu Tyr Leu Asp Ile Pro Thr Val Leu Asp Pro Thr Met385 390 395 400Ala Pro Pro Gly Gln His Thr Leu Trp Ile Glu Phe Phe Ala Pro Tyr405 410 415Arg Ile Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr420 425 430Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val Ile Asp Lys Leu Thr435 440 445Asp Tyr Ala Pro Asn Leu Lys Ser Leu Ile Ile Gly Arg Arg Val Glu450 455 460Ser Pro Ala Glu Leu Ala Gln Arg Leu Gly Ser Tyr Asn Gly Asn Val465 470 475 480Tyr His Leu Asp Met Ser Leu Asp Gln Met Met Phe Leu Arg Pro Leu485 490 495Pro Glu Ile Ala Asn Tyr Gln Thr Pro Ile Lys Asn Leu Tyr Leu Thr500 505 510
Gly Ala Gly Thr His Pro Gly Gly Ser Ile Ser Gly Met Pro Gly Arg515 520 525Asn Cys Ala Arg Val Phe Leu Lys Gln Gln Arg Arg Phe Trp530 535 540&lt;210&gt;45&lt;211&gt;776&lt;212&gt;DNA&lt;213&gt;慢生根瘤菌属&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(774)&lt;223&gt;
&lt;400&gt;45atg cat gca gca acc gcc aag gct act gag ttc ggg gcc tct cgg cgc48Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg1 5 10 15gac gat gcg agg cag cgc cgc gtc ggt ctc acg ctg gcc gcg gtc atc96Asp Asp Ala Arg Gln Arg Arg Val Gly Leu Thr Leu Ala Ala Val Ile20 25 30atc gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg144Ile Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro35 40 45ctg acc ctt cac agc ctg ctg ccg gct ttg cct ctg gtg gtg ctg cag192Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gln50 55 60acc tgg ctc tat gta ggc ctg ttc atc atc gcg cat gac tgc atg cac240Thr Trp Leu Tyr Val Gly Leu Phe Ile Ile Ala His Asp Cys Met His65 70 75 80
ggc tcg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt atc gga cag288Gly Ser Leu Val Pro Phe Lys Pro Gln Val Asn Arg Arg Ile Gly Gln85 90 95ctc tgc ctg ttc ctc tat gcc ggg ttc tcc ttc gac gct ctc aat gtc336Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val100 105 110gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat384Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp115 120 125ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc agc ttt432Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe130 135 140ttc ctg cac tat ttc ggc tgg aag cag gtc gcg atc atc gca gcc gtc480Phe Leu His Tyr Phe Gly Trp Lys Gln Val Ala Ile Ile Ala Ala Val145 150 155 160tcg ctg gtt tat cag ctc gtc ttc gcc gtt ccc ttg cag aac atc ctg528Ser Leu Val Tyr Gln Leu Val Phe Ala Val Pro Leu Gln Asn Ile Leu165 170 175ctg ttc tgg gcg ctg ccc ggg ctg ctg tcg gcg ctg cag ctg ttc acc576Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gln Leu Phe Thr180 185 190ttc ggc acc tat ctg ccg cac aag ccg gcc acg cag ccc ttc gcc gat624Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gln Pro Phe Ala Asp195 200 205cgc cac aac gcg cgg acg agc gaa ttt ccc gcg tgg ctg tcg ctg ctg672Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu210 215 220acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat720Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp225 230 235 240gcg ccg tgg tgg cgg ctg ccg gag atc aag cgg cgg gcc ctg gaa agg768Ala Pro Trp Trp Arg Leu Pro Glu Ile Lys Arg Arg Ala Leu Glu Arg245 250 255cgt gac ta 776Arg Asp
&lt;210&gt;46&lt;211&gt;258&lt;212&gt;PRT&lt;213&gt;慢生根瘤菌属&lt;400&gt;46Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg1 5 10 15Asp Asp Ala Arg Gln Arg Arg Val Gly Leu Thr Leu Ala Ala Val Ile20 25 30Ile Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro35 40 45Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gln50 55 60Thr Trp Leu Tyr Val Gly Leu Phe Ile Ile Ala His Asp Cys Met His65 70 75 80Gly Ser Leu Val Pro Phe Lys Pro Gln Val Asn Arg Arg Ile Gly Gln85 90 95Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val100 105 110Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp115 120 125Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe130 135 140
Phe Leu His Tyr Phe Gly Trp Lys Gln Val Ala Ile Ile Ala Ala Val145 150 155 160Ser Leu Val Tyr Gln Leu Val Phe Ala Val Pro Leu Gln Asn Ile Leu165 170 175Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gln Leu Phe Thr180 185 190Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gln Pro Phe Ala Asp195 200 205Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu210 215 220Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp225 230 235 240Ala Pro Trp Trp Arg Leu Pro Glu Ile Lys Arg Arg Ala Leu Glu Arg245 250 255Arg Asp&lt;210&gt;47&lt;211&gt;777&lt;212&gt;DNA&lt;213&gt;念珠藻属&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(777)&lt;223&gt;
&lt;400&gt;47atg gtt cag tgt caa cca tca tct ctg cat tca gaa aaa ctg gtg tta48Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu1 5 10 15ttg tca tcg aca atc aga gat gat aaa aat att aat aag ggt ata ttt96Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe20 25 30att gcc tgc ttt atc tta ttt tta tgg gca att agt tta atc tta tta144Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu35 40 45ctc tca ata gat aca tcc ata att cat aag agc tta tta ggt ata gcc192Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala50 55 60atg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act gct cat240Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His65 70 75 80gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat288Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn85 90 95ttt ata ggt aag ctc act cta atc ttg tat gga cta ctc cct tat aaa336Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys100 105 110gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat384Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp115 120 125tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg432Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp130 135 140tat cta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga480Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly145 150 155 160tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa528Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu165 170 175aat aat tta att ata ttt tgg atg ata cct tct att tta agt tca gta576Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val180 185 190
caa cta ttt tat ttt ggt aca ttt ttg cct cat aaa aag cta gaa ggt624Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly195 200 205ggt tat act aac ccc cat tgt gcg cgc agt atc cca tta cct ctt ttt672Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe210 215 220tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac720Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His225 230 235 240gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa gct cac aaa ata768Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile245 250 255tct tta taa777Ser Leu&lt;210&gt;48&lt;211&gt;258&lt;212&gt;PRT&lt;213&gt;念珠藻属&lt;400&gt;48Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu1 5 10 15Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe20 25 30Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu35 40 45Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala50 55 60
Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His65 70 75 80Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn85 90 95Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys100 105 110Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp115 120 125Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp130 135 140Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly145 150 155 160Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu165 170 175Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val180 185 190Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly195 200 205Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe210 215 220Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His225 230 235 240Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile245 250 255Ser Leu
&lt;210&gt;49&lt;211&gt;831&lt;212&gt;DNA&lt;213&gt;雨生红球藻&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(831)&lt;223&gt;
&lt;400&gt;49atg cca tcc gag tcg tca gac gca gct cgt cct gtg ttg aag cac gcc48Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala1 5 10 15tat aaa cct cca gca tct gac gcc aag ggc atc act atg gcg ctg acc96Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr20 25 30atc att ggc acc tgg acc gca gtg ttt tta cac gca ata ttc caa atc144Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile35 40 45agg cta ccg aca tcc atg gac cag ctt cac tgg ttg cct gtg tcc gaa192Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu50 55 60gcc aca gcc cag ctg ttg ggc gga agc agc agc cta ttg cac atc gcc240Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala65 70 75 80gca gtc ttc att gta ctt gag ttt ctg tac act ggt cta ttc atc acc288Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr85 90 95
acg cat gat gca atg cat ggc acc ata gct ttg agg aac agg cag ctc336Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg Asn Arg Gln Leu100 105 110aat gat ctc ctt ggc aac atc tgc ata tca ctg tac gcc tgg ttt gac384Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp115 120 125tac agc atg cac tgg gag cac cac aac cat act ggc gaa gtg ggg aaa432Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys130 135 140gac cct gac ttc cac aaa gga aat cct ggc ctt gtc ccc tgg ttc gcc480Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala145 150 155 160agc ttc atg tcc agc tac atg tcc ctg tgg cag ttt gcc cgg ctg gca528Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu Ala165 170 175tgg tgg gca gtg gtg atg caa acg ttg ggg gcc ccc atg gcg aat ctc576Trp Trp Ala Val Val Met Gln Thr Leu Gly Ala Pro Met Ala Asn Leu180 185 190cta gtc ttc atg gct gca gcc cca atc ttg tca gca ttc cgc ctc ttc624Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe195 200 205tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca gca672Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala210 215 220ggc tct cag gtc atg tct tgg ttc agg gcc aag aca agt gag gca tct720Gly Ser Gln Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser225 230 235 240gat gtg atg agc ttc ctg aca tgc tac cac ttt gac ctg ttt gcc ccc768Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro245 250 255tgg tgg cag ctg ccc cac tgc cgc cgc ctg tct ggg cgt ggc ctg gtg816Trp Trp Gln Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val260 265 270cct gcc ttg gca tga831Pro Ala Leu Ala275
&lt;210&gt;50&lt;211&gt;276&lt;212&gt;PRT&lt;213&gt;雨生红球藻&lt;400&gt;50Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala1 5 10 15Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr20 25 30Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile35 40 45Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu50 55 60Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala65 70 75 80Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr85 90 95Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg Asn Arg Gln Leu100 105 110Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp115 120 125Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys130 135 140
Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala145 150 155 160Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu Ala165 170 175Trp Trp Ala Val Val Met Gln Thr Leu Gly Ala Pro Met Ala Asn Leu180 185 190Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe195 200 205Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala210 215 220Gly Ser Gln Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser225 230 235 240Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro245 250 255Trp Trp Gln Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val260 265 270Pro Ala Leu Ala275&lt;210&gt;51&lt;211&gt;729&lt;212&gt;DNA&lt;213&gt;副球菌属MBIC1143&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(729)&lt;223&gt;
&lt;400&gt;51atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agc ctg48Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15atc gtc tcg ggc ggc atc atc gcc gct tgg ctg gcc ctg cat gtg cat96Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc atc ctg gcg atc gca144Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala35 40 45aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg192Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60cat gac gcg atg cac ggg tcg gtg gtg ccg ggg cgt ccg cgc gcc aat240His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg288Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc336Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc384Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc432Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140gtc atc gtg acg gtc tat gcg ctg atc ctt ggg gat cgc tgg atg tac480Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160
gtg gtc ttc tgg ccg ctg ccg tcg atc ctg gcg tcg atc cag ctg ttc528Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg576Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg624Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac672Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac720Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240acc gca tga729Thr Ala&lt;210&gt;52&lt;211&gt;242&lt;212&gt;PRT&lt;213&gt;副球菌属MBIC1143&lt;400&gt;52Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu1 5 10 15Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His20 25 30Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala35 40 45
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala50 55 60His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn65 70 75 80Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp85 90 95Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr100 105 110Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala115 120 125Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro130 135 140Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr145 150 155 160Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe165 170 175Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro180 185 190Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu195 200 205Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His210 215 220Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp225 230 235 240Thr Ala
&lt;210&gt;53&lt;211&gt;735&lt;212&gt;DNA&lt;213&gt;橙黄短波单胞菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(735)&lt;223&gt;
&lt;400&gt;53atg acc gcc gcc gtc gcc gag cca cgc acc gtc ccg cgc cag acc tgg48Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gln Thr Trp1 5 10 15atc ggt ctg acc ctg gcg gga atg atc gtg gcg gga tgg gcg gtt ctg96Ile Gly Leu Thr Leu Ala Gly Met Ile Val Ala Gly Trp Ala Val Leu20 25 30cat gtc tac ggc gtc tat ttt cac cga tgg ggg ccg ttg acc ctg gtg144His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val35 40 45atc gcc ccg gcg atc gtg gcg gtc cag acc tgg ttg tcg gtc ggc ctt192Ile Ala Pro Ala Ile Val Ala Val Gln Thr Trp Leu Ser Val Gly Leu50 55 60ttc atc gtc gcc cat gac gcc atg tac ggc tcc ctg gcg ccg gga cgg240Phe Ile Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg65 70 75 80ccg cgg ctg aac gcc gca gtc ggc cgg ctg acc ctg ggg ctc tat gcg288Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala85 90 95ggc ttc cgc ttc gat cgg ctg aag acg gcg cac cac gcc cac cac gcc336Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala100 105 110
gcg ccc ggc acg gcc gac gac ccg gat ttt cac gcc ccg gcg ccc cgc384Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg115 120 125gcc ttc ctt ccc tgg ttc ctg aac ttc ttt cgc acc tat ttc ggc tgg432Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp130 135 140cgc gag atg gcg gtc ctg acc gcc ctg gtc ctg atc gcc ctc ttc ggc480Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu Ile Ala Leu Phe Gly145 150 155 160ctg ggg gcg cgg ccg gcc aat ctc ctg acc ttc tgg gcc gcg ccg gcc528Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala165 170 175ctg ctt tca gcg ctt cag ctc ttc acc ttc ggc acc tgg ctg ccg cac576Leu Leu Ser Ala Leu Gln Leu Phe Thr Phe Gly Thr Trp Leu Pro His180 185 190cgc cac acc gac cag ccg ttc gcc gac gcg cac cac gcc cgc agc agc624Arg His Thr Asp Gln Pro Phe Ala Asp Ala His His Ala Arg Ser Ser195 200 205ggc tac ggc ccc gtg ctt tcc ctg ctc acc tgt ttc cac ttc ggc cgc672Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg210 215 220cac cac gaa cac cat ctg agc ccc tgg cgg ccc tgg tgg cgt ctg tgg720His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp225 230 235 240cgc ggc gag tct tga735Arg Gly Glu Ser&lt;210&gt;54&lt;211&gt;244&lt;212&gt;PRT&lt;213&gt;橙黄短波单胞菌&lt;400&gt;54
Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gln Thr Trp1 5 10 15Ile Gly Leu Thr Leu Ala Gly Met Ile Val Ala Gly Trp Ala Val Leu20 25 30His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val35 40 45Ile Ala Pro Ala Ile Val Ala Val Gln Thr Trp Leu Ser Val Gly Leu50 55 60Phe Ile Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg65 70 75 80Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala85 90 95Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala100 105 110Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg115 120 125Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp130 135 140Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu Ile Ala Leu Phe Gly145 150 155 160Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala165 170 175Leu Leu Ser Ala Leu Gln Leu Phe Thr Phe Gly Thr Trp Leu Pro His180 185 190Arg His Thr Asp Gln Pro Phe Ala Asp Ala His His Ala Arg Ser Ser195 200 205
Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg210 215 220His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp225 230 235 240Arg Gly Glu Ser&lt;210&gt;55&lt;211&gt;690&lt;212&gt;DNA&lt;213&gt;泡沫节球藻NSOR10&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(690)&lt;223&gt;
&lt;400&gt;55atg gcg atc gcc att att agt ata tgg gct atc agc cta ggt ttg tta48Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu1 5 10 15ctt tat att gat ata tcc caa ttc aag ttt tgg atg ttg tta ccg ctc96Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu20 25 30ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca gct cat144Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His35 40 45gat gcc atg cat ggg gta gtt ttt ccc aaa aat ccc aaa atc aac cat192Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His50 55 60
ttc att ggc tca ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa240Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln65 70 75 80aaa ctt tta aaa aag cat tgg cta cat cac cat aat cca gcc agt gaa288Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu85 90 95aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt gct tgg336Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp100 105 110tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att atc aca384Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr115 120 125tta atg att att tat aac tta cta aaa tat ata tgg cat ttt cca gag432Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu130 135 140gat aat atg act tat ttt tgg gta gtt ccc tca att tta agt tct tta480Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu145 150 155 160caa tta ttt tat ttt gga act ttt cta ccc cac agt gag cct gta gaa528Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu165 170 175ggt tat aaa gag cct cat cgt tcc caa act att agc cgt ccc att tgg576Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp180 185 190tgg tca ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat624Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His195 200 205gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg672Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met210 215 220tct aaa tca aat ttg tga690Ser Lys Ser Asn Leu225&lt;210&gt;56&lt;211&gt;229
&lt;212&gt;PRT&lt;213&gt;泡沫节球藻NSOR10&lt;400&gt;56Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu1 5 10 15Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu20 25 30Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His35 40 45Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His50 55 60Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln65 70 75 80Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu85 90 95Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp100 105 110Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr115 120 125Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu130 135 140Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu145 150 155 160
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu165 170 175Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp180 185 190Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His195 200 205Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met210 215 220Ser Lys Ser Asn Leu225&lt;210&gt;57&lt;211&gt;789&lt;212&gt;DNA&lt;213&gt;点形念珠藻ATCC29133&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(789)&lt;223&gt;
&lt;400&gt;57ttg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa48Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta96Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat144Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa192Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat240Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca288Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag336Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat384Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp115 120 125ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc432Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta480Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc528Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat576Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat624Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc672Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat720Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac768Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255aat tca gta acc aat tcg taa789Asn Ser Val Thr Asn Ser260&lt;210&gt;58&lt;211&gt;262&lt;212&gt;PRT&lt;213&gt;点形念珠藻ATCC29133&lt;400&gt;58Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp115 120 125Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255Asn Ser Val Thr Asn Ser260&lt;210&gt;59&lt;211&gt;762&lt;212&gt;DNA
&lt;213&gt;点形念珠藻ATCC29133&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(762)&lt;223&gt;
&lt;400&gt;59gtg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca48Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc96Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac144Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp35 40 45atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa192Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat240Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca288Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa336Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat384Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp115 120 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt432Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att480Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act528Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat576Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag624Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc672Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat720Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag762Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250&lt;210&gt;60&lt;211&gt;253&lt;212&gt;PRT&lt;213&gt;点形念珠藻ATCC29133&lt;400&gt;60Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp35 40 45Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp115 120 125Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250&lt;210&gt;61&lt;211&gt;1536&lt;212&gt;DNA&lt;213&gt;耐辐射奇异球菌R1&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(1536)&lt;223&gt;
&lt;400&gt;61atg ccg gat tac gac ctg atc gtc atg ggc gcg ggc cac aac gcg ctg48Met Pro Asp Tyr Asp Leu Ile Val Met Gly Ala Gly His Asn Ala Leu1 5 10 15gtg act gct gcc tac gcc gcc cgg gcg ggc ctg aaa gtc ggc gtg ttc96Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val Gly Val Phe20 25 30gag cgg cgg cac ctc gtc ggc ggg gcg gtc agc acc gag gag gtc gtg144Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val35 40 45ccc ggt tac cgc ttc gac tac ggc ggc agc gcc cac atc ctg att cgg192Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His Ile Leu Ile Arg50 55 60atg acg ccc atc gtg cgc gaa ctc gaa ctc acg cgg cac ggg ctg cat240Met Thr Pro Ile Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His65 70 75 80
tac ctc gaa gtg gac cct atg ttt cac gct tcc gac ggt gaa acg ccc288Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro85 90 95tgg ttc att cac cgc gac gcc ggg cgg acc atc cgc gaa ctg gac gaa336Trp Phe Ile His Arg Asp Ala Gly Arg Thr Ile Arg Glu Leu Asp Glu100 105 110aag ttt ccc ggg cag ggc gac gcc tac ggg cgc ttt ctc gac gat tgg384Lys Phe Pro Gly Gln Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp115 120 125aca ccc ttc gcg cgc gcc gtg gcc gac ctg ttc aac tcg gcg ccg ggg432Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly130 135 140ccg ctc gac ctg ggc aaa atg gtg atg cgc agc ggc cag ggc aag gac480Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gln Gly Lys Asp145 150 155 160tgg aac gag cag ctc ccg cgc atc ctg cgg ccc tac ggc gac gtg gcg528Trp Asn Glu Gln Leu Pro Arg Ile Leu Arg Pro Tyr Gly Asp Val Ala165 170 175cgc gag tac ttc agc gag gag cgc gtg cgg gct ccc ctg acc tgg atg576Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met180 185 190gcg gcc cag agc ggc ccc cca ccc tcg gac ccg ctg agc gcg ccc ttt624Ala Ala Gln Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe195 200 205ttg ctg tgg cac ccg ctc tac cac gaa ggc ggc gtg gcg cgg ccc aaa672Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys210 215 220ggc ggc agc ggc ggc ctg acc aaa gcc ctg cgc cgg gcc acc gag gcc720Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala225 230 235 240gaa ggc ggc gag gtc ttc acc gac gcg ccg gtc aag gaa att ctg gtc768Glu Gly Gly Glu Val Phe Thr Asp Ala Pro Val Lys Glu Ile Leu Val245 250 255aag gac ggc aag gcg cag ggc atc cgg ctg gaa agc ggc gag acg tac816Lys Asp Gly Lys Ala Gln Gly Ile Arg Leu Glu Ser Gly Glu Thr Tyr260 265 270
acc gcc cgc gcc gtc gtg tcg ggc gtc cac atc ctg acc act gcg aat864Thr Ala Arg Ala Val Val Ser Gly Val His Ile Leu Thr Thr Ala Asn275 280 285gcc ctg ccc gcc gaa tat gtc cct agc gcc gcc agg aat gtg cgc gtg912Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val290 295 300ggc aac ggc ttc ggc atg att ttg cgc ctc gcc ctc agt gaa aaa gtc960Gly Asn Gly Phe Gly Met Ile Leu Arg Leu Ala Leu Ser Glu Lys Val305 310 315 320aaa tac cgt cac cac acc gag ccc gac tca cgc atc ggc ctg gga ttg1008Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg Ile Gly Leu Gly Leu325 330 335ctg atc aaa aac gag cgg caa atc atg cag ggc tac ggc gaa tac ctc1056Leu Ile Lys Asn Glu Arg Gln Ile Met Gln Gly Tyr Gly Glu Tyr Leu340 345 350gcc ggg cag ccc acc acc gac ccg ccc ctc gtc gcc atg agc ttc agc1104Ala Gly Gln Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser355 360 365gcg gtg gac gac tcg ctc gcc cca ccg aac ggc gac gtg ttg tgg ctg1152Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu370 375 380tgg gcg cag tac tac ccc ttc gag ctc gcc acc ggg agc tgg gaa acg1200Trp Ala Gln Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr385 390 395 400cgc acc gcc gaa gcg cgg gag aac atc ctg cgg gcc ttt gag cac tac1248Arg Thr Ala Glu Ala Arg Glu Asn Ile Leu Arg Ala Phe Glu His Tyr405 410 415gcg ccg ggc acc cgc gac acg att gtg ggc gaa ctc gtg cag acg ccg1296Ala Pro Gly Thr Arg Asp Thr Ile Val Gly Glu Leu Val Gln Thr Pro420 425 430cag tgg ctg gaa acc aac ctc ggc ctg cac cgg ggc aac gtg atg cac1344Gln Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His435 440 445ctg gaa atg tcc ttc gac cag atg ttc tcc ttc cgc ccc tgg ctg aaa1392Leu Glu Met Ser Phe Asp Gln Met Phe Ser Phe Arg Pro Trp Leu Lys450 455 460
gcg agc cag tac cgc tgg ccg ggc gtg cag ggg ctg tac ctc acc ggc1440Ala Ser Gln Tyr Arg Trp Pro Gly Val Gln Gly Leu Tyr Leu Thr Gly465 470 475 480gcc agc acc cac ccc ggc gga ggc atc atg ggc gcc tcg gga cgc aac1488Ala Ser Thr His Pro Gly Gly Gly Ile Met Gly Ala Ser Gly Arg Asn485 490 495gcg gcg cgg gtc atc gtg aag gac ctg acg cgg agg cgc tgg aaa tga1536Ala Ala Arg Val Ile Val Lys Asp Leu Thr Arg Arg Arg Trp Lys500 505 510&lt;210&gt;62&lt;211&gt;511&lt;212&gt;PRT&lt;213&gt;耐辐射奇异球菌R1&lt;400&gt;62Met Pro Asp Tyr Asp Leu Ile Val Met Gly Ala Gly His Asn Ala Leu1 5 10 15Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val Gly Val Phe20 25 30Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val35 40 45Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His Ile Leu Ile Arg50 55 60Met Thr Pro Ile Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His65 70 75 80Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro85 90 95
Trp Phe Ile His Arg Asp Ala Gly Arg Thr Ile Arg Glu Leu Asp Glu100 105 110Lys Phe Pro Gly Gln Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp115 120 125Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly130 135 140Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gln Gly Lys Asp145 150 155 160Trp Asn Glu Gln Leu Pro Arg Ile Leu Arg Pro Tyr Gly Asp Val Ala165 170 175Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met180 185 190Ala Ala Gln Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe195 200 205Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys210 215 220Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala225 230 235 240Glu Gly Gly Glu Val Phe Thr Asp Ala Pro Val Lys Glu Ile Leu Val245 250 255Lys Asp Gly Lys Ala Gln Gly Ile Arg Leu Glu Ser Gly Glu Thr Tyr260 265 270Thr Ala Arg Ala Val Val Ser Gly Val His Ile Leu Thr Thr Ala Asn275 280 285Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val290 295 300
Gly Asn Gly Phe Gly Met Ile Leu Arg Leu Ala Leu Ser Glu Lys Val305 310 315 320Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg Ile Gly Leu Gly Leu325 330 335Leu Ile Lys Asn Glu Arg Gln Ile Met Gln Gly Tyr Gly Glu Tyr Leu340 345 350Ala Gly Gln Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser355 360 365Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu370 375 380Trp Ala Gln Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr385 390 395 400Arg Thr Ala Glu Ala Arg Glu Asn Ile Leu Arg Ala Phe Glu His Tyr405 410 415Ala Pro Gly Thr Arg Asp Thr Ile Val Gly Glu Leu Val Gln Thr Pro420 425 430Gln Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His435 440 445Leu Glu Met Ser Phe Asp Gln Met Phe Ser Phe Arg Pro Trp Leu Lys450 455 460Ala Ser Gln Tyr Arg Trp Pro Gly Val Gln Gly Leu Tyr Leu Thr Gly465 470 475 480Ala Ser Thr His Pro Gly Gly Gly Ile Met Gly Ala Ser Gly Arg Asn485 490 495
Ala Ala Arg Val Ile Val Lys Asp Leu Thr Arg Arg Arg Trp Lys500 505 510&lt;210&gt;63&lt;211&gt;789&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(789)&lt;223&gt;
&lt;400&gt;63atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa48Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta96Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat144Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45tat gcc aaa att cat aag tgg ttg ata cct att gca ata gtt tgg caa192Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat240Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca288Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag336Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat384Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp115 120 125ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc432Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta480Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc528Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat576Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat624Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc672Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat720Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac768Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255aat tca gta acc aat tcg taa789Asn Ser Val Thr Asn Ser260&lt;210&gt;64&lt;211&gt;262
&lt;212&gt;PRT&lt;213&gt;合成序列&lt;400&gt;64Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp115 120 125Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255Asn Ser Val Thr Asn Ser260&lt;210&gt;65&lt;211&gt;789&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(789)&lt;223&gt;
&lt;400&gt;65
atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa 48Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat144Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa192Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat240Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca288Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag336Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110aat cat tgc tta cat cat cgt cat cct gct agc gat tta gac cca gat384Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp115 120 125ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc432Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta480Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc528Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat576Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat624Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc672Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat720Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac768Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255aat tca gta acc aat tcg taa789Asn Ser Val Thr Asn Ser260&lt;210&gt;66&lt;211&gt;262&lt;212&gt;PRT&lt;213&gt;合成序列&lt;400&gt;66Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln1 5 10 15Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val20 25 30Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn35 40 45Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln50 55 60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His65 70 75 80Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser85 90 95Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys100 105 110Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp115 120 125Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe130 135 140Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu145 150 155 160Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile165 170 175Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr195 200 205Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile210 215 220Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn245 250 255Asn Ser Val Thr Asn Ser260
&lt;210&gt;67&lt;211&gt;762&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(762)&lt;223&gt;
&lt;400&gt;67atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca 48Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc 96Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac144Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp35 40 45atc tca aag att cat aag tgg atg tta ttg cct gtt ata cta tgg caa192Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat240Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca288Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa336Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110
aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat384Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp115 120 125ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt432Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att480Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act528Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat576Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag624Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc672Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat720Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag762Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250&lt;210&gt;68&lt;211&gt;253&lt;212&gt;PRT&lt;213&gt;合成序列&lt;400&gt;68
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp35 40 45Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp115 120 125Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250&lt;210&gt;69&lt;211&gt;762&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(762)&lt;223&gt;
&lt;400&gt;69atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca 48Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc 96Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac144Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Lau Leu Ser Leu Asp35 40 45atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa192Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat240Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca288Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa336Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110aaa cat tgg tta cac cac cac aat cca gca agc gat tta gac ccg gat384Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp115 120 125ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt432Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att480Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act528Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat576Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag624Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc672Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat720Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag762Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250
&lt;210&gt;70&lt;211&gt;253&lt;212&gt;PRT&lt;213&gt;合成序列&lt;400&gt;70Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro1 5 10 15Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val20 25 30Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp35 40 45Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln50 55 60Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His65 70 75 80Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr85 90 95Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys100 105 110Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp115 120 125Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe130 135 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile145 150 155 160Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr165 170 175Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr180 185 190Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln195 200 205Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile210 215 220Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His225 230 235 240Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys245 250&lt;210&gt;71&lt;211&gt;804&lt;212&gt;DNA&lt;213&gt;合成变体&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(804)&lt;223&gt;
&lt;400&gt;71
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac 48Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His1 5 10 15cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala20 25 30ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc144Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg192Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60ttg att ggc agc ttg att ctg tgg cag acc ttt ctg cac acc ggg ctg240Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu65 70 75 80ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat288Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca336Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg384Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arq Arg His His Leu115 120 125gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac432Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg480Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc528Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc576Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc624Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg672Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac720Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt768Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255cag ctg cca caa ctt cga aat gaa tca ttc act tga804Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265&lt;210&gt;72&lt;211&gt;267&lt;212&gt;PRT&lt;213&gt;合成变体&lt;400&gt;72Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His1 5 10 15Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala20 25 30Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60
Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu65 70 75 80Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu115 120 125Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265
&lt;210&gt;73&lt;211&gt;804&lt;212&gt;DNA&lt;213&gt;合成变体&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(804)&lt;223&gt;
&lt;400&gt;73atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac 48Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His1 5 10 15cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala20 25 30ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc144Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg192Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg240Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu65 70 75 80ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat288Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca336Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac gga384Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly115 120 125cat cct ggt act gat tta gat cct gac tac caa cgt tgc acc aat aac432His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg480Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc528Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc576Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc624Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg672Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac720Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt768Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255cag ctg cca caa ctt cga aat gaa tca ttc act tga804Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265&lt;210&gt;74&lt;211&gt;267&lt;212&gt;PRT
&lt;213&gt;合成变体&lt;400&gt;74Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Set Thr Cys Trp His His1 5 10 15Gln Pro Ser Cys Ser Set Trp Val Ala Ash Glu Phe Ser Pro Gln Ala20 25 30Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu65 70 75 80Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly115 120 125His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265&lt;210&gt;75&lt;211&gt;804&lt;212&gt;DNA&lt;213&gt;聚球藻WH8102&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(1)..(804)&lt;223&gt;
&lt;400&gt;75atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac48Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His1 5 10 15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala20 25 30ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc144Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg192Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg240Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu65 70 75 80ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat288Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca336Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg384Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu115 120 125gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac432Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg480Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc528Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc576Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc624Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg672Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac720Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt768Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255cag ctg cca caa ctt cga aat gaa tca ttc act tga804Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265&lt;210&gt;76&lt;211&gt;267&lt;212&gt;PRT&lt;213&gt;聚球藻WH8102&lt;400&gt;76Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His1 5 10 15Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala20 25 30Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu35 40 45Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu50 55 60Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu65 70 75 80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His85 90 95Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala100 105 110Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu115 120 125Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn130 135 140Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met145 150 155 160Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu165 170 175Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser180 185 190Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr195 200 205Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr210 215 220Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn225 230 235 240Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe245 250 255Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr260 265&lt;210&gt;77
&lt;211&gt;1608&lt;212&gt;DNA&lt;213&gt;雨生红球藻&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(3)..(971)&lt;223&gt;
&lt;400&gt;77ct aca ttt cac aag ccc gtg agc ggt gca agc gct ctg ccc cac atc 47Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile1 5 10 15ggc cca cct cct cat ctc cat cgg tca ttt gct gct acc acg atg ctg 95Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu20 25 30tcg aag ctg cag tca atc agc gtc aag gcc cgc cgc gtt gaa cta gcc143Ser Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala35 40 45cgc gac atc acg cgg ccc aaa gtc tgc ctg cat gct cag cgg tgc tcg191Arg Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser50 55 60tta gtt cgg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga239Leu Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly65 70 75acc gtg cag gct gcc ggc gcg ggc gat gag cac agc gcc gat gta gca287Thr Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala80 85 90 95ctc cag cag ctt gac cgg gct atc gca gag cgt cgt gcc cgg cgc aaa335Leu Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys100 105 110
cgg gag cag ctg tca tac cag gct gcc gcc att gca gca tca att ggc383Arg Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly115 120 125gtg tca ggc att gcc atc ttc gcc acc tac ctg aga ttt gcc atg cac431Val Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His130 135 140atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg gct ggc act ctc479Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu145 150 155ctc ttg gtg gtt ggt ggc gcg ctc ggc atg gag atg tat gcc cgc tat527Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr160 165 170 175gca cac aaa gcc atc tgg cat gag tcg cct ctg ggc tgg ctg ctg cac575Ala His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His180 185 190aag agc cac cac aca cct cgc act gga ccc ttt gaa gcc aac gac ttg623Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu195 200 205ttt gca atc atc aat gga ctg ccc gcc atg ctc ctg tgt acc ttt ggc671Phe Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly210 215 220ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg719Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu225 230 235ggc atc acg cta tac ggc atg gca tat atg ttt gta cac gat ggc ctg767Gly Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu240 245 250 255gtg cac agg cgc ttt ccc acc ggg ccc atc gct ggc ctg ccc tac atg815Val His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met260 265 270aag cgc ctg aca gtg gcc cac cag cta cac cac agc ggc aag tac ggt863Lys Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly275 280 285ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att911Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile290 295 300
cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp305 310 315tcc aag cgg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011Ser Lys Arg320tgataaggtg tggctagagc gatgcgtgtg agacgggtat gtcacggtcg actggtctga1071tggccaatgg catcggccat gtctggtcat cacgggctgg ttgcctgggt gaaggtgatg1131cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcaqttgtc1191caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc1251catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta1311gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg1371catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc1431agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga1491ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga1551tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608&lt;210&gt;78&lt;211&gt;322&lt;212&gt;PRT&lt;213&gt;雨生红球藻&lt;400&gt;78Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile Gly1 5 10 15Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser20 25 30
Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg35 40 45Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser Leu50 55 60Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly Thr65 70 75 80Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu85 90 95Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys Arg100 105 110Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly Val115 120 125Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met130 135 140Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu145 150 155 160Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala165 170 175His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys180 185 190Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe195 200 205Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe210 215 220Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly225 230 235 240
Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val245 250 255His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met Lys260 265 270Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly Gly275 280 285Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile Pro290 295 300Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser305 310 315 320Lys Arg&lt;210&gt;79&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(33)&lt;223&gt;
&lt;400&gt;79gcatgctcta gaccttataa agatattttg tga33
&lt;210&gt;80&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(33)&lt;223&gt;
&lt;400&gt;80gcatgcatct agaaatggtt cagtgtcaac cat 33&lt;210&gt;81&lt;211&gt;805&lt;212&gt;DNA&lt;213&gt;念珠藻属Pcc7120株&lt;220&gt;
&lt;221&gt;variation&lt;222&gt;(1)..(805)&lt;223&gt;
&lt;400&gt;81gcatgcatct agaaatggtt cagtgtcaac catcatctct gcattcagaa aaactggtgt 60tattgtcatc gacaatcaga gatgataaaa atattaataa gggtatattt attgcctgct120
ttatcttatt tttatgggca attagtttaa tcttattact ctcaatagat acatccataa180ttcataagag cttattaggt atagccatgc tttggcagac cttcttatat acaggtttat240ttattactgc tcatgatgcc atgcacggcg tagtttatcc caaaaatccc agaataaata300attttatagg taagctcact ctaatcttgt atggactact cccttataaa gatttattga360aaaaacattg gttacaccac ggacatcctg gtactgattt agaccctgat tattacaatg420gtcatcccca aaacttcttt ctttggtatc tacattttat gaagtcttat tggcgatgga480cgcaaatttt cggattagtg atgatttttc atggacttaa aaatctggtg catataccag540aaaataattt aattatattt tggatgatac cttctatttt aagttcagta caactatttt600attttggtac atttttgcct cataaaaagc tagaaggtgg ttatactaac ccccattgtg660cgcgcagtat cccattacct cttttttggt cttttgttac ttgttatcac ttcggctacc720acaaggaaca tcacgaatac cctcaacttc cttggtggaa attacctgaa gctcacaaaa780tatctttata aggtctagag catgc 805&lt;210&gt;82&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(24)&lt;223&gt;
&lt;400&gt;82aggtaccgca cggtctgcca atcc24
&lt;210&gt;83&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(26)&lt;223&gt;
&lt;400&gt;83aagcttgacc tgattatcag cacggt 26&lt;210&gt;84&lt;211&gt;4624&lt;212&gt;DNA&lt;213&gt;噬夏孢欧文菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(128)..(1267)&lt;223&gt;
&lt;220&gt;
&lt;221&gt;misc_feature
&lt;222&gt;(1288)..(2766)&lt;223&gt;
&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(2802)..(3689)&lt;223&gt;
&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(3631)..(4158)&lt;223&gt;
&lt;400&gt;84gtcgactttc agcagcgcat ggcgaaaatc cagacagccc ttcgtttggc agggggcacc 60atggccgctg ccgatatcat tgagcaggtt atgtgcaccg gtcagcctgt cttaagtggg 120agcggct atg caa ccg cat tat gat ctg att ctc gtg ggg gct gga ctc169Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu1 5 10gcg aat ggc ctt atc gcc ctg cgt ctt cag cag cag caa cct gat atg217Ala Asn Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met15 20 25 30cgt att ttg ctt atc gac gcc gca ccc cag gcg ggc ggg aat cat acg265Arg Ile Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr35 40 45tgg tca ttt cac cac gat gat ttg act gag agc caa cat cgt tgg ata313Trp Ser Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile50 55 60gct ccg ctg gtg gtt cat cac tgg ccc gac tat cag gta cgc ttt ccc361Ala Pro Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro65 70 75
aca cgc cgt cgt aag ctg aac agc ggc tac ttt tgt att act tct cag409Thr Arg Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln80 85 90cgt ttc gct gag gtt tta cag cga cag ttt ggc ccg cac ttg tgg atg457Arg Phe Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met95 100 105 110gat acc gcg gtc gca gag gtt aat gcg gaa tct gtt cgg ttg aaa aag505Asp Thr Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys115 120 125ggt cag gtt atc ggt gcc cgc gcg gtg att gac ggg cgg ggt tat gcg553Gly Gln Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala130 135 140gca aat tca gca ctg agc gtg ggc ttc cag gcg ttt att ggc cag gaa601Ala Asn Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu145 150 155tgg cga ttg agc cac ccg cat ggt tta tcg tct ccc att atc atg gat649Trp Arg Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp160 165 170gcc acg gtc gat cag caa aat ggt tat cgc ttc gtg tac agc ctg ccg697Ala Thr Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro175 180 185 190ctc tcg ccg acc aga ttg tta att gaa gac acg cac tat att gat aat745Leu Ser Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn195 200 205gcg aca tta gat cct gaa tgc gcg cgg caa aat att tgc gac tat gcc793Ala Thr Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala210 215 220gcg caa cag ggt tgg cag ctt cag aca ctg ctg cga gaa gaa cag ggc841Ala Gln Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly225 230 235gcc tta ccc att act ctg tcg ggc aat gcc gac gca ttc tgg cag cag889Ala Leu Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln240 245 250cgc ccc ctg gcc tgt agt gga tta cgt gcc ggt ctg ttc cat cct acc937Arg Pro Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr255 260 265 270
acc ggc tat tca ctg ccg ctg gcg gtt gcc gtg gcc gac cgc ctg agt 985Thr Gly Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser275 280 285gca ctt gat gtc ttt acg tcg gcc tca att cac cat gcc att acg cat 1033Ala Leu Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His290 295 300ttt gcc cgc gag cgc tgg cag cag cag ggc ttt ttc cgc atg ctg aat 1081Phe Ala Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn305 310 315cgc atg ctg ttt tta gcc gga ccc gcc gat tca cgc tgg cgg gtt atg 1129Arg Met Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met320 325 330cag cgt ttt tat ggt tta cct gaa gat tta att gcc cgt ttt tat gcg 1177Gln Arg Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala335 340 345 350gga aaa ctc acg ctg acc gat cgg cta cgt att ctg agc ggc aag ccg 1225Gly Lys Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro355 360 365cct gtt ccg gta tta gca gca ttg caa gcc att atg acg act 1267Pro Val Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr370 375 380catcgttaaa gagcgactac atgaaaccaa ctacggtaat tggtgcaggc ttcggtggcc1327tggcactggc aattcgtcta caagctgcgg ggatccccgt cttactgctt gaacaacgtg1387ataaacccgg cggtcgggct tatgtctacg aggatcaggg gtttaccttt gatgcaggcc1447cgacggttat caccgatccc agtgccattg aagaactgtt tgcactggca ggaaaacagt1507taaaagagta tgtcgaactg ctgccggtta cgccgtttta ccgcctgtgt tgggagtcag1567ggaaggtctt taattacgat aacgatcaaa cccggctcga agcgcagatt cagcagttta1627atccccgcga tgtcgaaggt tatcgtcagt ttctggacta ttcacgcgcg gtgtttaaag1687aaggctatct aaagctcggt actgtccctt ttttatcgtt cagagacatg cttcgcgccg1747cacctcaact ggcgaaactg caggcatgga gaagcgttta cagtaaggtt gccagttaca1807tcgaagatga acatctgcgc caggcgtttt ctttccactc gctgttggtg ggcggcaatc1867ccttcgccac ctcatccatt tatacgttga tacacgcgct ggagcgtgag tggggcgtct1927
ggtttccgcg tggcggcacc ggcgcattag ttcaggggat gataaagctg tttcaggatc1987tgggtggcga agtcgtgtta aacgccagag tcagccatat ggaaacgaca ggaaacaaga2047ttgaagccgt gcatttagag gacggtcgca ggttcctgac gcaagccgtc gcgtcaaatg2107cagatgtggt tcatacctat cgcgacctgt taagccagca ccctgccgcg gttaagcagt2167ccaacaaact gcagactaag cgcatgagta actctctgtt tgtgctctat tttggtttga2227atcaccatca tgatcagctc gcgcatcaca cggtttgttt cggcccgcgt taccgcgagc2287tgattgacga aatttttaat catgatggcc tcgcagagga cttctcactt tatctgcacg2347cgccctgtgt cacggattcg tcactggcgc ctgaaggttg cggcagttac tatgtgttgg2407cgccggtgcc gcatttaggc accgcgaacc tcgactggac ggttgagggg ccaaaactac2467gcgaccgtat ttttgcgtac cttgagcagc attacatgcc tggcttacgg agtcagctgg2527tcacgcaccg gatgtttacg ccgtttgatt ttcgcgacca gcttaatgcc tatcatggct2587cagccttttc tgtggagccc gttcttaccc agagcgcctg gtttcggccg cataaccgcg2647ataaaaccat tactaatctc tacctggtcg gcgcaggcac gcatcccggc gcaggcattc2707ctggcgtcat cggctcggca aaagcgacag caggtttgat gctggaggat ctgatttgaa2767taatccgtcg ttactcaatc atgcggtcga aacgatggca gttggctcga aaagttttgc2827gacagcctca aagttatttg atgcaaaaac ccggcgcagc gtactgatgc tctacgcctg2887gtgccgccat tgtgacgatg ttattgacga tcagacgctg ggctttcagg cccgqcagcc2947tgccttacaa acgcccgaac aacgtctgat gcaacttgag atgaaaacgc gccaggccta3007tgcaggatcg cagatgcacg aaccggcgtt tgcggctttt caggaagtgg ctatggctca3067tgatatcgcc ccggcttacg cgtttgatca tctggaaggc ttcgccatgg atgtacgcga3127agcgcaatac agccaactgg atgatacgct gcgctattgc tatcacgttg caggcgttgt3187cggcttgatg atggcgcaaa tcatgggcgt gcgggataac gccacgctgg accgcgcctg3247tgaccttggg ctggcatttc agttgaccaa tattgctcgc gatattgtgg acgatgcgca3307tgcgggccgc tgttatctgc cggcaagctg gctggagcat gaaggtctga acaaagagaa3367ttatgcggca cctgaaaacc gtcaggcgct gagccgtatc gcccgtcgtt tggtgcagga3427
agcagaacct tactatttgt ctgccacagc cggcctggca gggttgcccc tgcgttccgc3487ctgggcaatc gctacggcga agcaggttta ccggaaaata ggtgtcaaag ttgaacaggc3547cggtcagcaa gcctgggatc agcggcagtc aacgaccacg cccgaaaaat taacgctgct3607gctggccgcc tctggtcagg cccttacttc ccggatgcgg gctcatcctc cccgccctgc3667gcatctctgg cagcgcccgc tctagcgcca tgtctttccc ggagcgtcgc ctgaagtttt3727gacaggggcg gcgcatagag gaagccaaaa gaaacacaac cttctttgcc cctgacggcg3787tgatgcatac ggtgcgccat atacaaccgt ttgaggtagc ccttgcgtgg aatatagcgg3847aatggccaac gttgatgcac cagcccgtcg tgcaccataa aatagagtaa tccatacgcc3907gtcatacctg cgccaatcca ctggagcgqc cacattcctg tactgcccag ataaatcagc3967aggatcgata atgcagcaaa aaccacggca taaagatcgt taacttcaaa cgcaccttta4027cgcggttcat gatgtgaaag atgccatccc caaccccagc cgtgcatgat gtatttgtgt4087gccagtgcag caatcacttc catgccaatc acggtaacga aaacgatcag ggcattccaa4147atccacaaca taatttctcc ggtagagacg tctggcagca ggcttaagga ttcaatttta4207acagagatta gccgatctgg cggcgggaag ggaaaaaggc gcgccagaaa ggcgcgccag4267ggatcagaag tcggctttca gaaccacacg gtagttggct ttacctgcac gaacatggtc4327cagtgcatcg ttgattttcg acatcgggaa gtactccact gtcggcgcaa tatctgtacg4387gccagccagc ttcagcagtg aacgcagctg cgcaggtgaa ccggttgaag aacccgtcac4447ggcgcggtcg cctaaaatca ggctgaaagc cgggcacgtc aaacggcttc agtacggcac4507ccacggtatg gaacttaccg cgaggcgcca gggccgcaaa gtagggttgc cagtcgagat4567cgacggcgac cgtgctgata atcaggtcaa actggcccgc caggcttttt aaagctt 4624&lt;210&gt;85&lt;211&gt;380&lt;212&gt;PRT&lt;213&gt;噬夏孢欧文菌
&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(1288)..(2766)&lt;223&gt;
&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(2802)..(3689)&lt;223&gt;
&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(3631)..(4158)&lt;223&gt;
&lt;400&gt;85Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu Ala Asn1 5 10 15Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met Arg Ile20 25 30Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr Trp Ser35 40 45Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile Ala Pro50 55 60Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro Thr Arg65 70 75 80Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln Arg Phe85 90 95
Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met Asp Thr100 105 110Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys Gly Gln115 120 125Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala Ala Asn130 135 140Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu Trp Arg145 150 155 160Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp Ala Thr165 170 175Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro Leu Ser180 185 190Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn Ala Thr195 200 205Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala Ala Gln210 215 220Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly Ala Leu225 230 235 240Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln Arg Pro245 250 255Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr Thr Gly260 265 270Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser Ala Leu275 280 285
Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His Phe Ala290 295 300Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn Arg Met305 310 315 320Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met Gln Arg325 330 335Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala Gly Lys340 345 350Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro Pro Val355 360 365Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr370 375 380&lt;210&gt;86&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(32)&lt;223&gt;
&lt;400&gt;86tttttctcga gcgataaacg ctcacttggt ta32
&lt;210&gt;87&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(32)&lt;223&gt;
&lt;400&gt;87tttttgtcga cacgttatgc tcacaacccc gg 32&lt;210&gt;88&lt;211&gt;679&lt;212&gt;DNA&lt;213&gt;大肠杆菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(87)..(635)&lt;223&gt;
&lt;400&gt;88ctcgagcgat aaacgctcac ttggttaatc atttcactct tcaattatct ataatgatga60gtgatcagaa ttacatgtga gaaatt atg caa acg gaa cac gtc att tta ttg113Met Gln Thr Glu His Val Ile Leu Leu1 5
aat gca cag gga gtt ccc acg ggt acg ctg gaa aag tat gcc gca cac161Asn Ala Gln Gly Val Pro Thr Gly Thr Leu Glu Lys Tyr Ala Ala His10 15 20 25acg gca gac acc cgc tta cat ctc gcg ttc tcc agt tgg ctg ttt aat209Thr Ala Asp Thr Arg Leu His Leu Ala Phe Ser Ser Trp Leu Phe Asn30 35 40gcc aaa gga caa tta tta gtt acc cgc cgc gca ctg agc aaa aaa gca257Ala Lys Gly Gln Leu Leu Val Thr Arg Arg Ala Leu Ser Lys Lys Ala45 50 55tgg cct ggc gtg tgg act aac tcg gtt tgt ggg cac cca caa ctg gga305Trp Pro Gly Val Trp Thr Asn Ser Val Cys Gly His Pro Gln Leu Gly60 65 70gaa agc aac gaa gac gca gtg atc cgc cgt tgc cgt tat gag ctt ggc353Glu Ser Asn Glu Asp Ala Val Ile Arg Arg Cys Arg Tyr Glu Leu Gly75 80 85gtg gaa att acg cct cct gaa tct atc tat cct gac ttt cgc tac cgc401Val Glu Ile Thr Pro Pro Glu Ser Ile Tyr Pro Asp Phe Arg Tyr Arg90 95 100 105gcc acc gat ccg agt ggc att gtg gaa aat gaa gtg tgt ccg gta ttt449Ala Thr Asp Pro Ser GlyIle Val Glu Asn Glu Val Cys Pro Val Phe110 115 120gcc gca cgc acc act agt gcg tta cag atc aat gat gat gaa gtg atg497Ala Ala Arg Thr Thr Ser Ala Leu Gln Ile Asn Asp Asp Glu Val Met125 130 135gat tat caa tgg tgt gat tta gca gat gta tta cac ggt att gat gcc545Asp Tyr Gln Trp Cys Asp Leu Ala Asp Val Leu His Gly Ile Asp Ala140 145 150acg ccg tgg gcg ttc agt ccg tgg atg gtg atg cag gcg aca aat cgc593Thr Pro Trp Ala Phe Ser Pro Trp Met Val Met Gln Ala Thr Asn Arg155 160 165gaa gcc aga aaa cga tta tct gca ttt acc cag ctt aaa taa635Glu Ala Arg Lys Arg Leu Ser Ala Phe Thr Gln Leu Lys170 175 180aaaaaccccg acatttgccg gggttgtgag cataacgtgt cgac 679&lt;210&gt;89
&lt;211&gt;182&lt;212&gt;PRT&lt;213&gt;大肠杆菌&lt;400&gt;89Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr1 5 10 15Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His20 25 30Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val35 40 45Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn50 55 60Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val65 70 75 80Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu85 90 95Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile100 105 110Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala115 120 125Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu130 135 140Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser165 170 175Ala Phe Thr Gln Leu Lys180&lt;210&gt;90&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(31)&lt;223&gt;
&lt;400&gt;90tttttccatg gtgaaggagg aaatagcgaa a 31&lt;210&gt;91&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(32)
&lt;223&gt;
&lt;400&gt;91tttttaagct ttcacttttt tcttgtaacc aa 32&lt;210&gt;92&lt;211&gt;962&lt;212&gt;DNA&lt;213&gt;嗜超高温硫酸根还原古细菌(Archaeoglobus fulgidus)&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(3)..(956)&lt;223&gt;
&lt;400&gt;92cc atg gtg aag gag gaa ata gcg aaa agg gcc gaa ata atc aac aaa 47Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys1 5 10 15gcc att gaa gag ctt ctg ccc gaa agg gag ccg att gga ctc tac aaa 95Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys20 25 30gcc gca agg cat ctg atc aaa gca ggt ggc aag agg cta agg cct gta143Ala Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val35 40 45ata agc ctc tta gca gtc gaa gcc ctt ggg aaa gac tac aga aag att191Ile Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile50 55 60atc ccg gct gct gtc agc att gaa aca atc cac aac ttc acc ctc gtg239Ile Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val65 70 75
cat gac gac ata atg gac agg gac gag atg agg agg gga gtt ccg acg287His Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr80 85 90 95gta cac agg gtt tat ggg gaa gcg acq gcc att tta gca ggc gac aca335Val His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr100 105 110ctc ttt gct gaa gcc ttc aag ctg ctg aca aag tgc gat gtt gag agc383Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser115 120 125gag gga atc aga aaa gct aca gaa atg ctt tcg gac gtt tgc ata aaa431Glu Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys130 135 140ata tgc gag ggg cag tac tac gac atg agc ttt gag aaa aag gag agc479Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser145 150 155gtt tcc gag gag gag tat ctc agg atg gtc gag ctg aag acc gga gtg527Val Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val160 165 170 175ctg att gca gct tct gca gca tta cct gcg gtg ctt ttt ggg gag agc575Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser180 185 190gag gaa att gta aag gcg ctg tgg gac tac gga gtt ctt agc ggt att623Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile195 200 205ggc ttc cag atc cag gac gac ctg ctt gac ctg act gag gag acc gga671Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly210 215 220aag gac tgg gga agc gac ctg ctt aaa ggg aag aaa acc ctg att gtc719Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val225 230 235ata aag gcg ttc gaa aag gga gtg aag cta aag acg ttt gga aag gaa767Ile Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu240 245 250 255aag gcg gac gtc tct gag att aga gat gat atc gaa aag tta aga gag815Lys Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu260 265 270
tgt ggt gcg att gat tac gct gcc agc atg gca aga aag atg gct gaa863Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu275 280 285gag gcg aaa aga aag ctc gaa gtt ctg cct gaa agc aaa gcc aag gaa911Glu Ala Lys Arq Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu290 295 300aca ctg ctg gaa ctt acc gac ttc ttg gtt aca aga aaa aag tga956Thr Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys305 310 315aagctt 962&lt;210&gt;93&lt;211&gt;317&lt;212&gt;PRT&lt;213&gt;嗜超高温硫酸根还原古细菌&lt;400&gt;93Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala1 5 10 15Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala20 25 30Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile35 40 45Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile50 55 60Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His65 70 75 80Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val85 90 95
His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu100 105 110Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu115 120 125Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile130 135 140Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val145 150 155 160Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu165 170 175Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu180 185 190Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly195 200 205Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys210 215 220Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile225 230 235 240Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys245 250 255Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys260 265 270Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu275 280 285
Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr290 295 300Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys305 310 315&lt;210&gt;94&lt;211&gt;1293&lt;212&gt;DNA&lt;213&gt;嗜超高温硫酸根还原古细菌&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(206)..(1159)&lt;223&gt;
&lt;400&gt;94taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgggtaccgg 60gccccccctc gacgccgtcg ttcaatgaga atggataaga ggctcgtggg attgacgtga120gggggcaggg atggctatat ttctgggagc gaactccggg cgaggatcta gttgtaggga180gggattcatg acaccacaaa cagcc atg gtg aag gag gaa ata gcg aaa agg 232Met Val Lys Glu Glu Ile Ala Lys Arg1 5gcc gaa ata atc aac aaa gcc att gaa gag ctt ctg ccc gaa agg gag 280Ala Glu Ile Ile Asn Lys Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu10 15 20 25ccg att gga ctc tac aaa gcc gca agg cat ctg atc aaa gca ggt ggc 328Pro Ile Gly Leu Tyr Lys Ala Ala Arg His Leu Ile Lys Ala Gly Gly30 35 40
aag agg cta agg cct gta ata agc ctc tta gca gtc gaa gcc ctt ggg376Lys Arg Leu Arg Pro Val Ile Ser Leu Leu Ala Val Glu Ala Leu Gly45 50 55aaa gac tac aga aag att atc ccg gct gct gtc agc att gaa aca atc424Lys Asp Tyr Arg Lys Ile Ile Pro Ala Ala Val Ser Ile Glu Thr Ile60 65 70cac aac ttc acc ctc gtg cat gac gac ata atg gac agg gac gag atg472His Asn Phe Thr Leu Val His Asp Asp Ile Met Asp Arg Asp Glu Met75 80 85agg agg gga gtt ccg acg gta cac agg gtt tat ggg gaa gcg acg gcc520Arg Arg Gly Val Pro Thr Val His Arg Val Tyr Gly Glu Ala Thr Ala90 95 100 105att tta gca ggc gac aca ctc ttt gct gaa gcc ttc aag ctg ctg aca568Ile Leu Ala Gly Asp Thr Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr110 115 120aag tgc gat gtt gag agc gag gga atc aga aaa gct aca gaa atg ctt616Lys Cys Asp Val Glu Ser Glu Gly Ile Arg Lys Ala Thr Glu Met Leu125 130 135tcg gac gtt tgc ata aaa ata tgc gag ggg cag tac tac gac atg agc664Ser Asp Val Cys Ile Lys Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser140 145 150ttt gag aaa aag gag agc gtt tcc gag gag gag tat ctc agg atg gtc712Phe Glu Lys Lys Glu Ser Val Ser Glu Glu Glu Tyr Leu Arg Met Val155 160 165gag ctg aag acc gga gtg ctg att gca gct tct gca gca tta cct gcg760Glu Leu Lys Thr Gly Val Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala170 175 180 185gtg ctt ttt ggg gag agc gag gaa att gta aag gcg ctg tgg gac tac808Val Leu Phe Gly Glu Ser Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr190 195 200gga gtt ctt agc ggt att ggc ttc cag atc cag gac gac ctg ctt gac856Gly Val Leu Ser Gly Ile Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp205 210 215ctg act gag gag acc gga aag gac tgg gga agc gac ctg ctt aaa ggg904Leu Thr Glu Glu Thr Gly Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly220 225 230
aag aaa acc ctg att gtc ata aag gcg ttc gaa aag gga gtg aag cta 952Lys Lys Thr Leu Ile Val Ile Lys Ala Phe Glu Lys Gly Val Lys Leu235 240 245aag acg ttt gga aag gaa aag gcg gac gtc tct gag att aga gat gat 1000Lys Thr Phe Gly Lys Glu Lys Ala Asp Val Ser Glu Ile Arg Asp Asp250 255 260 265atc gaa aag tta aga gag tgt ggt gcg att gat tac gct gcc agc atg 1048Ile Glu Lys Leu Arg Glu Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met270 275 280gca aga aag atg gct gaa gag gcg aaa aga aag ctc gaa gtt ctg cct 1096Ala Arg Lys Met Ala Glu Glu Ala Lys Arg Lys Leu Glu Val Leu Pro285 290 295gaa agc aaa gcc aag gaa aca ctg ctg gaa ctt acc gac ttc ttg gtt 1144Glu Ser Lys Ala Lys Glu Thr Leu Leu Glu Leu Thr Asp Phe Leu Val300 305 310aca aga aaa aag tga aagcttcaat tgcatgctct agatgatcaa agaattcctg 1199Thr Arg Lys Lys315gcctagtcta taggaggttt tgaaaagaaa ggagcaataa tcattttctt gttctatcaa1259gagggtgcta ttgctccttt ctttttttct cgag1293&lt;210&gt;95&lt;211&gt;317&lt;212&gt;PRT&lt;213&gt;嗜超高温硫酸根还原古细菌&lt;400&gt;95Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala1 5 10 15Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala20 25 30
Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile35 40 45Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile50 55 60Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His65 70 75 80Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val85 90 95His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu100 105 110Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu115 120 125Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile130 135 140Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val145 150 155 160Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu165 170 175Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu180 185 190Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly195 200 205Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys210 215 220Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile225 230 235 240
Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys245 250 255Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys260 265 270Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu275 280 285Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr290 295 300Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys305 310 315&lt;210&gt;96&lt;211&gt;35&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(35)&lt;223&gt;
&lt;400&gt;96gagctcttca ttatttcgat tttgatttcg tgacc 35&lt;210&gt;97
&lt;211&gt;38&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;Primer&lt;222&gt;(1)..(38)&lt;223&gt;
&lt;400&gt;97aagcttggttgatcagaaga agaagaagaa gatgaact 38&lt;210&gt;98&lt;211&gt;647&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(647)&lt;223&gt;
&lt;400&gt;98gagctcttca ttatttcgat tttgatttcg tgaccagcga acgcagaata ccttgttgtg 60taatacttta cccgtgtaaa tcaaaaacaa aaaggctttt gagctttttg tagttgaatt120tctctggctg atcttttctg tacagattca tatatctgca gagacgatat cattgattat180
ttgagcttct tttgaactat ttcgtgtaat ttgggatgag agctctatgt atgtgtgtaa240actttgaaga caacaagaaa ggtaacaagt gagggaggga tgactccatg tcaaaataga300tgtcataaga ggcccatcaa taagtgcttg agcccattag ctagcccagt aactaccaga360ttgtgagatg gatgtgtgaa cagttttttt tttgatgtag gactgaaatg tgaacaacag420gcgcatgaaa ggctaaatta ggacaatgat aagcagaaat aacttatcct ctctaacact480tggcctcaca ttgcccttca cacaatccac acacatccaa tcacaacctc atcatatatc540tcccgctaat ctttttttct ttgatctttt tttttttgct tattattttt ttgactttga600tctcccatca gttcatcttc ttcttcttct tctgatcaac caagctt 647&lt;210&gt;99&lt;211&gt;28&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;primer_bind&lt;222&gt;(1)..(28)&lt;223&gt;
&lt;400&gt;99gagctcactc actgatttcc attgcttg 28&lt;210&gt;100&lt;211&gt;37&lt;212&gt;DNA&lt;213&gt;合成序列
&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(37)&lt;223&gt;
&lt;400&gt;100gcgcatgcat ctagaaatga tccagttaga acaacca 37&lt;210&gt;101&lt;211&gt;37&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(37)&lt;223&gt;
&lt;400&gt;101gcgcatgctc tagactattt tgctttgtaa atttctg 37&lt;210&gt;102&lt;211&gt;792&lt;212&gt;DNA&lt;213&gt;点形念珠藻ATCC 29133
&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(5)..(775)&lt;223&gt;
&lt;400&gt;102gcgc atg cat cta gaa atg atc cag tta gaa caa cca ctc agt cat caa49Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln1 5 10 15gca aaa ctg act cca gta ctg aga agt aaa tct cag ttt aag ggg ctt 97Ala Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu20 25 30ttc att gct att gtc att gtt agc gca tgg gtc att agc ctg agt tta145Phe Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu35 40 45tta ctt tcc ctt gac atc tca aag cta aaa ttt tgg atg tta ttg cct193Leu Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro50 55 60gtt ata cta tgg caa aca ttt tta tat acg gga tta ttt att aca tct241Val Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser65 70 75cat gat gcc atg cat ggc gta gta ttt ccc caa aac acc aag att aat289His Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn80 85 90 95cat ttg att gga aca ttg acc cta tcc ctt tat ggt ctt tta cca tat337His Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr100 105 110caa aaa cta ttg aaa aaa cat tgg tta cac cac cac aat cca gca agc385Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser115 120 125tca ata gac ccg gat ttt cac aat ggt aaa cac caa agt ttc ttt gct433Ser Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala130 135 140
tgg tat ttt cat ttt atg aaa ggt tac tgg agt tgg ggg caa ata att481Trp Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile145 150 155gcg ttg act att att tat aac ttt gct aaa tac ata ctc cat atc cca529Ala Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro160 165 170 175agt gat aat cta act tac ttt tgg gtg cta ccc tcg ctt tta agt tca577Ser Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser180 185 190tta caa tta ttc tat ttt ggt act ttt tta ccc cat agt gaa cca ata625Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile195 200 205ggg ggt tat gtt cag cct cat tgt gcc caa aca att agc cgt cct att673Gly Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile210 215 220tgg tgg tca ttt atc acg tgc tat cat ttt ggc tac cac gag gaa cat721Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His225 230 235cac gaa tat cct cat att tct tgg tgg cag tta cca gaa att tac aaa769His Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys240 245 250 255gca aaa tagtctagag catgcgc 792Ala Lys&lt;210&gt;103&lt;211&gt;257&lt;212&gt;PRT&lt;213&gt;点形念珠藻ATCC 29133&lt;400&gt;103Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala1 5 10 15
Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe20 25 30Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu35 40 45Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val50 55 60Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His65 70 75 80Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His85 90 95Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln100 105 110Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Ser115 120 125Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp130 135 140Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala145 150 155 160Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser165 170 175Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu180 185 190Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly195 200 205Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp210 215 220
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His225 230 235 240Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala245 250 255Lys&lt;210&gt;104&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(26)&lt;223&gt;
&lt;400&gt;104gtcgaccctg ctttaatgag atatgc 26&lt;210&gt;105&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;合成序列
&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(27)&lt;223&gt;
&lt;400&gt;105ctcgagcttg gacaatcagt aaattga27&lt;210&gt;106&lt;211&gt;210&lt;212&gt;DNA&lt;213&gt;根癌农杆菌&lt;220&gt;
&lt;221&gt;终止子&lt;222&gt;(1)..(210)&lt;223&gt;
&lt;400&gt;106gtcgaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa 60ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt120tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc180cgttcaattt actgattqtc caagctcgag 210&lt;210&gt;107&lt;211&gt;37
&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(37)&lt;223&gt;
&lt;400&gt;107cccgggaatt cttcattatt tcgattttga tttcgtg 37&lt;210&gt;108&lt;211&gt;38&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(38)&lt;223&gt;
&lt;400&gt;108aagcttggtt gatcagaaga agaagaagaa gatgaact 38&lt;210&gt;109&lt;211&gt;652
&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(652)&lt;223&gt;
&lt;400&gt;109cccgggaatt cttcattatt tcgattttga tttcgtgacc agcgaacgca gaataccttg 60ttgtgtaata ctttacccgt gtaaatcaaa aacaaaaagg cttttgagct ttttgtagtt120gaatttctct ggctgatctt ttctgtacag attcatatat ctgcagagac gatatcattg180attatttgag cttcttttga actatttcgt gtaatttggg atgagagctc tatgtatgtg240tgtaaacttt gaagacaaca agaaaggtaa caagtgaggg agggatgact ccatgtcaaa300atagatgtca taagaggccc atcaataagt gcttgagccc attagctagc ccagtaacta360ccagattgtg agatggatgt gtgaacagtt ttttttttga tgtaggactg aaatgtgaac420aacaggcgca tgaaaggcta aattaggaca atgataagca gaaataactt atcctctcta480acacttggcc tcacattgcc cttcacacaa tccacacaca tccaatcaca acctcatcat540atatctcccg ctaatctttt tttctttgat cttttttttt ttgcttatta tttttttgac600tttgatctcc catcagttca tcttcttctt cttcttctga tcaaccaagc tt652&lt;210&gt;110&lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;合成序列
&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(29)&lt;223&gt;
&lt;400&gt;110gagctctagc gcaatcttat gtggtacaa29&lt;210&gt;111&lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(29)&lt;223&gt;
&lt;400&gt;111aagcttttct tgaaagtaaa gattgagtc29&lt;210&gt;112&lt;211&gt;1773&lt;212&gt;DNA&lt;213&gt;碧冬茄
&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(1773)&lt;223&gt;
&lt;400&gt;112gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc 60cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag 120catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat 180gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgagqcct ttcttttcct 240tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc 300tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat 360tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg 420tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct 480actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag 540tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac 600taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa 660aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat 720ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact 780taattgtatt agatatttct tqcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc 840aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg 900tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gagqcaataa 960tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct1020ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac1080
ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat1140taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat1200tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc1260tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat1320tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc1380caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg1440tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag1500cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt1560aatatatcaa tctgcaacaa ccttttcacc ttgagaacgc agctgaaatt ttttacaaag1620gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac1680caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc1740caaagactca atctttactt tcaagaaaag ctt 1773&lt;210&gt;113&lt;211&gt;39&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(39)&lt;223&gt;
&lt;400&gt;113gcgcatgcat ctagaaatga atttttgtga taaaccagt 39
&lt;210&gt;114&lt;211&gt;37&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(37)&lt;223&gt;
&lt;400&gt;114gcgcatgctc tagattacga attggttact gaattgt 37&lt;210&gt;115&lt;211&gt;819&lt;212&gt;DNA&lt;213&gt;点形念珠藻ATCC 29133&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(5)..(802)&lt;223&gt;
&lt;400&gt;115gcgcatgcat ctagaaatga atttttgtga taaaccagtt agctattatg ttgcaataga 60gcaattaagt gctaaagaag atactgtttg ggggctggtg attgtcatag taattattag120
tctttgggta gctagtttgg cttttttact agctattaat tatgccaaag tcccaatttg180gttgatacct attgcaatag tttggcaaat gttcctttat acagggctat ttattactgc240acatgatgct atgcatgggt cagtttatcg taaaaatccc aaaattaata attttatcgg300ttcactagct gtagcgcttt acgctgtgtt tccatatcaa cagatgttaa agaatcattg360cttacatcat cgtcatcctg ctagcgaagt tgacccagat tttcatgatg gtaagagaac420aaacgctatt ttctggtatc tccatttcat gatagaatac tccagttggc aacagttaat480agtactaact atcctattta atttagctaa atacgttttg cacatccatc aaataaatct540catcttattt tggagtattc ctccaatttt aagttccatt caactgtttt atttcggaac600atttttgcct catcgagaac ccaagaaagg atatgtttat ccccattgca gccaaacaat660aaaattgcca acttttttgt catttatcgc ttgctaccac tttggttatc atgaagaaca720tcatgagtat ccccatgtac cttggtggca acttccatct gtatataagc agagagtatt780caacaattca gtaaccaatt cgtaatctag agcatgcgc 819&lt;210&gt;116&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(24)&lt;223&gt;
&lt;400&gt;116gaattcctgc aatagaatgt tgag 24
&lt;210&gt;117&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(25)&lt;223&gt;
&lt;400&gt;117ctcgagctta cgagcatttt ctaag 25&lt;210&gt;118&lt;211&gt;307&lt;212&gt;DNA&lt;213&gt;蚕豆&lt;220&gt;
&lt;221&gt;终止子&lt;222&gt;(1)..(307)&lt;223&gt;
&lt;400&gt;118gaattcctgc aatagaatgt tgaggtgacc actttctgta ataaaataat tataaaataa 60atttagaatt gctgtagtca agaacatcag ttctaaaata ttaataaagt tatggccttt120
tgacatatgt gtttcgataa aaaaatcaaa ataaattgag atttattcga aatacaatga180aagtttgcag atatgagata tgtttctaca aaataataac ttaaaactca actatatgct240aatgtttttc ttggtgtgtt tcatagaaaa ttgtatccgt ttcttagaaa atgctcgtaa300gctcgag 307&lt;210&gt;119&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(25)&lt;223&gt;
&lt;400&gt;119gaattcccaa taataatcta cagcc 25&lt;210&gt;120&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(25)
&lt;223&gt;
&lt;400&gt;120aagcttccat gqcggccgga atttc 25&lt;210&gt;121&lt;211&gt;1020&lt;212&gt;DNA&lt;213&gt;食用番茄&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(1)..(1020)&lt;223&gt;编码β-羟化酶的核酸&lt;400&gt;121aagcttccat ggcggccgga atttcagcct ccgctagttc ccgaaccatt cgcctccgtc 60ataacccgtt tctcagtcca aaatccgcct caaccgcccc gccggttctg ttcttctctc120cgttaactcg caattttggc gcaattttgc tgtctagaag aaagccgaga ttggcggttt180gttttgtgct ggagaatgag aaattgaata gtactatcga aagtgagagt gaagtaatag240aggatcggat acaagtagag attaatgagg agaagagttt agctgccagt tggctggcgg300agaaattggc gaggaagaaa tcggagaggt ttacttatct tgtggcagct gtgatgtcta360gtttggggat tacttctatg gcgattttgg cggtttatta cagattttca tggcaaatgg420agggtggaga agtgcctttt tctgaaatgt tagctacatt cactctctcg tttggcgctg480ccgtaggaat ggagtactgg gcgagatggg ctcatagagc actatggcat gcttctttat540ggcacatgca cgagtcgcac catagaccaa gagaaggacc ttttgagatg aacgacgttt600
tcgccataac aaatgctgtt ccagctatag gtcttctttc ctacggtttc ttccataaag 660ggatcgtccc tggcctctgt ttcggcgctg gattggggat cacagtattt gggatggctt 720acatgttcgt tcacgatgga ctggttcata agagatttcc cgtagggcct attgccaacg 780tgccttactt tcggagggta gctgcagcac atcagcttca tcactcggac aaatttgatg 840gtgtcccata tggcttgttt ctaggaccta aggaattgga agaagtagga ggacttgaag 900agttagaaaa ggaagtcaac cgaaggatta aaatttctaa gggattatta tgatcaaaag 960atacgtctga taataataaa atgcgattgt atttaggctg tagattatta ttgggaattc1020&lt;210&gt;122&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(24)&lt;223&gt;
&lt;400&gt;122gagctctagc gcaatcttat gtgg 24&lt;210&gt;123&lt;211&gt;22&lt;212&gt;DNA&lt;213&gt;合成序列
&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(22)&lt;223&gt;
&lt;400&gt;123ccatggttct cacttctgta tg 22&lt;210&gt;124&lt;211&gt;1802&lt;212&gt;DNA&lt;213&gt;碧冬茄&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(1802)&lt;223&gt;
&lt;400&gt;124gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc 60cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag120catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat180gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgaggcct ttcttttcct240tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc300tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat360tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg420
tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct 480actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag 540tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac 600taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa 660aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat 720ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact 780taattgtatt agatatttct tgcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc 840aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg 900tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gaggcaataa 960tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct1020ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac1080ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat1140taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat1200tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc1260tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat1320tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc1380caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg1440tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag1500cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt1560aatatatcaa tctgcaacaa ccttttcacc ttgagaacac agctgaaatt ttttacaaag1620gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac1680caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc1740caaagactca atctttactt tcaagaaaag ctttgcaatt catacagaag tgagaaccat1800gg 1802
&lt;210&gt;125&lt;211&gt;1033&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(1033)&lt;223&gt;P76&lt;400&gt;125aggtgcatga ccaagtaaca atttgattcc tttccagcat aacgtcatgt tggttgcaaa 60aagaaggcaa agtagagcaa gcaagcaagc aaagcatttt tcttatttta tattttgttg120cggattccac cacccacttg aaaaattgac atgtcacaat gatttcgtat cctagtcttt180tattatttaa cactctcaca atcccattac tctacacctc tttcattaag tcaacacacg240gttttcaaaa atccactacc ctcccaccac ctagaatctt ttgttaccta ccaacaccct300cctttgttct ctttatatat tggtccaact aaatcaataa gggaaagcat ccttttggtt360ggaggaattg ctttcattct cactctttgt gtgttgatca atggactagc taataacaag420ttcctcctct atatatttca aaagaatgga acagaaacat aaacgaaaga cagagtacct480gatgttgatg attcattgtc tgtctggagc tcccaaatgc cttttatgct tacatattca540taaccaacaa cggctattaa ttataaacca aaaacacgaa ataagtttgt agcaaagtga600aattaggaat cttggagatg gatccattag tagtaggata ataggatatg atggaatttg660gttggggaac agtgataact tacgcttgct tccggcgccg ggaaagttgg aaaacctaca720aagtacagaa atggatctgg gccttgaagt gggcttttta ttaaagaaaa aaatacatct780ccgttatcaa tcaccatctt cttctatcta caaattaaag aaggtaacaa cagaacgtgg840
tggatcatgt ggttaggcat taattatttg ctttgtttcg ccgttttggt aacacacaga 900cacagttccg gtaagagctt ttgcagccac tctttatagt tatttagaat tggcgatcga 960atcaatctca ctccctccct cccttaagtc ttgttgaatc tgctgaattg ttttataaag1020agttactttg gca 1033&lt;210&gt;126&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(19)&lt;223&gt;
&lt;400&gt;126tgccaaagta actctttat 19&lt;210&gt;127&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(19)
&lt;223&gt;
&lt;400&gt;127aggtgcatga ccaagtaac 19&lt;210&gt;128&lt;211&gt;996&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;misc_feature&lt;222&gt;(1)..(996)&lt;223&gt;
&lt;400&gt;128ggcacgagcc tctctctatt tttacacttc aatggcggca gcaattgctg tcccttgtag 60ctcaagacca tttggcttag gtcgaatgcg gttacttggt cataaaccca caaccataac120ttgtcacttc cccttttctt tttctatcaa atcatttacc ccaattgtta ggggcagaag180atgtactgtt tgttttgttg ccggtggcga cagtaatagt aacagtaata ataatagtga240cagtaatagt aataatccgg gtctggattt aaacccggcg gttatgaacc gtaaccgttt300ggttgaagaa aaaatggaga ggaaaaaatc ggaacgattt acttatcttg ttgcagctat360tatgtctact tttggaatta cttcaatggc ggttatggcg gtttattacc ggttttcatg420gcaaatggag ggtggagaaa ttccttatgt ggagatgttt ggtacatttg ctctctccgt480tggtgctgcg gtaggaatgg agtattgggc aagatgggct catgaggcac tatggcatgc540ttctttgtgg cacatgcatg agtcacacca taagccacga gaaggtccgt ttgagcttaa600
tgatgtgttt gctataacaa atgcggtccc ggccattgcg ttgcttagtt atgggttttt660ccacaaaggc ataattccgg gtctttgttt tggggcggga ctgggaatta cggtgtttgg720aatggcgtat atgttcgtcc acgacgggct agttcacaga agattccaag tgggtccgat780tgcgaatgtt ccctatcttc gaagggttgc agcggctcat cagctgcatc acacggaaaa840atttaatggt gttccttatg gcttgttctt gggacctaag gagctagaag aagtgggtgg900tacggaagaa ttggacaagg agattcaaag aagaattaaa ttgtataata atactaaata960aataaatttt gtataaaatt aatataattt aatgat 996&lt;210&gt;129&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;合成序列&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(18)&lt;223&gt;
&lt;400&gt;129atggaagctc ttctcaag 18&lt;210&gt;130&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;合成序列
&lt;220&gt;
&lt;221&gt;引物&lt;222&gt;(1)..(18)&lt;223&gt;
&lt;400&gt;130accttaccta aaacattt 18&lt;210&gt;131&lt;21I&gt;1045&lt;212&gt;DNA&lt;213&gt;拟南芥&lt;220&gt;
&lt;221&gt;启动子&lt;222&gt;(1)..(1045)&lt;223&gt;
&lt;400&gt;131gtcgacaggt gcatgaccaa gtaacaattt gattcctttc cagcataacg tcatgttggt 60tgcaaaaaga aggcaaagta gagcaagcaa gcaagcaaag catttttctt attttatatt120ttgttgcgga ttccaccacc cacttgaaaa attgacatgt cacaatgatt tcgtatccta180gtcttttatt atttaacact ctcacaatcc cattactcta cacctctttc attaagtcaa240cacacggttt tcaaaaatcc actaccctcc caccacctag aatcttttgt tacctaccaa300caccctcctt tgttctcttt atatattggt ccaactaaat caataaggga aagcatcctt360ttggttggag gaattgcttt cattctcact ctttgtgtgt tgatcaatgg actagctaat420
aacaagttcc tcctctatat atttcaaaag aatggaacag aaacataaac gaaagacaga 480gtacctgatg ttgatgattc attgtctgtc tggagctccc aaatgccttt tatgcttaca 540tattcataac caacaacggc tattaattat aaaccaaaaa cacgaaataa gtttgtagca 600aagtgaaatt aggaatcttg gagatggatc cattagtagt aggataatag gatatgatgg 660aatttggttg gggaacagtg ataacttacg cttgcttccg gcgccgggaa agttggaaaa 720cctacaaagt acagaaatgg atctgggcct tgaagtgggc tttttattaa agaaaaaaat 780acatctccgt tatcaatcac catcttcttc tatctacaaa ttaaagaagg taacaacaga 840acgtggtgga tcatgtggtt aggcattaat tatttgcttt gtttcgccgt tttggtaaca 900cacagacaca gttccggtaa gagcttttgc agccactctt tatagttatt tagaattggc 960gatcgaatca atctcactcc ctccctccct taagtcttgt tgaatctgct gaattgtttt1020ataaagagtt actttggcac ccggg 104权利要求
1.通过培养遗传修饰的非人生物制备酮类胡萝卜素的方法,所述遗传修饰的生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性,而其修饰的β环化酶活性是由于β环化酶造成,其含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
2.如权利要求1的方法,其中使用野生型具有酮酶活性而遗传修饰使其酮酶活性相对于野生型增加的非人生物。
3.如权利要求2的方法,其中通过提高编码酮酶的核酸相对于野生型的基因表达来增加酮酶活性。
4.如权利要求3的方法,其中通过向生物中插入编码酮酶的核酸来增加基因表达。
5.如权利要求4的方法,其中插入的编码酮酶的核酸所编码的酮酶含有SEQ ID NO4氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO4序列至少有70%的同一性。
6.如权利要求1的方法,其中使用野生型不具有酮酶活性而遗传修饰使其相对于野生型造成酮酶活性的非人生物。
7.如权利要求6的方法,其中使用转基因表达酮酶的遗传修饰生物。
8.如权利要求6或7的方法,其中通过向生物中插入编码酮酶的核酸来造成基因表达。
9.如权利要求8的方法,其中插入的核酸编码的酮酶含有SEQ ID NO4氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO4序列至少有70%的同一性。
10.如权利要求5或9的方法,其中插入含有序列SEQ ID NO3的核酸。
11.如权利要求1至10中任一项的方法,其中使用野生型已经具有β环化酶活性而遗传修饰使其β环化酶活性相对于野生型增加的生物。
12.如权利要求11的方法,其中通过提高编码β环化酶的核酸相对于野生型的基因表达来增加β环化酶活性,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
13.如权利要求12的方法,其中通过向生物中插入编码β环化酶的核酸来增加基因表达,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
14.如权利要求1至10中任一项的方法,其中使用野生型不具有β环化酶活性而遗传修饰使其相对于野生型造成β环化酶活性的生物。
15.如权利要求14的方法,其中使用转基因表达β环化酶的遗传修饰生物,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
16.如权利要求14或15的方法,其中通过向生物中插入编码β环化酶的核酸来造成基因表达,所述β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
17.如权利要求13或16的方法,其中插入含有序列SEQ ID NO1的核酸。
18.如权利要求1至17中任一项的方法,其中使用相对于野生型额外具有增加的或造成的羟化酶活性的非人生物。
19.如权利要求18的方法,其中通过增加或造成编码羟化酶的核酸相对于野生型的基因表达来额外增加或造成羟化酶活性。
20.如权利要求19的方法,其中通过向生物中插入编码羟化酶的核酸来增加或造成基因表达。
21.如权利要求20的方法,其中插入的编码羟化酶的核酸,其编码的羟化酶含有SEQ ID NO6氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO6序列至少有70%的同一性。
22.如权利要求21的方法,其中插入含有序列SEQ ID NO5的核酸。
23.如权利要求1至22中任一项的方法,其中使用相对于野生型额外具有增加的或造成的选自HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性以及MinD活性中至少一种的生物。
24.如权利要求23的方法,其中通过增加选自编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸、编码MinD蛋白的核酸中至少一种相对于野生型的基因表达来额外增加或造成至少一种活性。
25.如权利要求24的方法,其中通过向非人生物中插入选自编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸、编码MinD蛋白的核酸中至少一种来增加或造成至少一种核酸的基因表达。
26.如权利要求25的方法,其中插入编码HMG-CoA还原酶的核酸,其编码的HMG-CoA还原酶含有SEQ ID NO8氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO8序列至少有20%的同一性。
27.如权利要求26的方法,其中插入含有序列SEQ ID NO7的核酸。
28.如权利要求25的方法,其中插入编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸,其编码的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶含有SEQ ID NO10氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO10序列至少有20%的同一性。
29.如权利要求28的方法,其中插入含有序列SEQ ID NO9的核酸。
30.如权利要求25的方法,其中插入编码1-脱氧-D-木糖-5-磷酸合酶的核酸,其编码的1-脱氧-D-木糖-5-磷酸合酶含有SEQ ID NO12氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO12序列至少有20%的同一性。
31.如权利要求30的方法,其中插入含有序列SEQ ID NO11的核酸。
32.如权利要求25的方法,其中插入编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸,其编码的1-脱氧-D-木糖-5-磷酸还原异构酶含有SEQ IDNO14氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO14序列至少有20%的同一性。
33.如权利要求32的方法,其中插入含有序列SEQ ID NO13的核酸。
34.如权利要求25的方法,其中插入编码异戊烯基二磷酸酯Δ-异构酶的核酸,其编码的异戊烯基二磷酸酯Δ-异构酶含有SEQ ID NO16氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO16序列至少有20%的同一性。
35.如权利要求34的方法,其中插入含有序列SEQ ID NO15的核酸。
36.如权利要求25的方法,其中插入编码牻牛儿基二磷酸酯合酶的核酸,其编码的牻牛儿基二磷酸酯合酶含有SEQ ID NO18氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO18序列至少有20%的同一性。
37.如权利要求36的方法,其中插入含有序列SEQ ID NO17的核酸。
38.如权利要求25的方法,其中插入编码法呢基二磷酸酯合酶的核酸,其编码的法呢基二磷酸酯合酶含有SEQ ID NO20氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQID NO20序列至少有20%的同一性。
39.如权利要求38的方法,其中插入含有序列SEQ ID NO19的核酸。
40.如权利要求25的方法,其中插入编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸,其编码的牻牛儿基牻牛儿基二磷酸酯合酶含有SEQ ID NO22氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO22序列至少有20%的同一性。
41.如权利要求40的方法,其中插入含有序列SEQ ID NO21的核酸。
42.如权利要求25的方法,其中插入编码八氢番茄红素合酶的核酸,其编码的八氢番茄红素合酶含有SEQ ID NO24氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO24序列至少有20%的同一性。
43.如权利要求42的方法,其中插入含有序列SEQ ID NO23的核酸。
44.如权利要求25的方法,其中插入编码八氢番茄红素去饱和酶的核酸,其编码的八氢番茄红素去饱和酶含有SEQ ID NO26氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO26序列至少有20%的同一性。
45.如权利要求44的方法,其中插入含有序列SEQ ID NO25的核酸。
46.如权利要求25的方法,其中插入编码ζ-胡萝卜素去饱和酶的核酸,其编码的ζ-胡萝卜素去饱和酶含有SEQ ID NO28氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQID NO28序列至少有20%的同一性。
47.如权利要求46的方法,其中插入含有序列SEQ ID NO27的核酸。
48.如权利要求25的方法,其中插入编码crtISO蛋白的核酸,其编码的crtISO蛋白含有SEQ ID NO30氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO30序列至少有20%的同一性。
49.如权利要求48的方法,其中插入含有序列SEQ ID NO29的核酸。
50.如权利要求25的方法,其中插入编码FtsZ蛋白的核酸,其编码的FtsZ蛋白含有SEQ ID NO32氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO32序列至少有20%的同一性。
51.如权利要求50的方法,其中插入含有序列SEQ ID NO31的核酸。
52.如权利要求25的方法,其中插入编码MinD蛋白的核酸,其编码的MinD蛋白含有SEQ ID NO34氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO34序列至少有20%的同一性。
53.如权利要求52的方法,其中插入含有序列SEQ ID NO33的核酸。
54.如权利要求1至53中任一项的方法,其中在培养后收集遗传修饰的生物并随后从生物中分离酮类胡萝卜素。
55.如权利要求1至54中任一项的方法,其中使用起始生物可天然产生或能够通过遗传互补或代谢途径的再调节生产类胡萝卜素的生物。
56.如权利要求1至55中任一项的方法,其中使用的生物是微生物或植物。
57.如权利要求56的方法,其中使用的微生物为细菌、酵母、藻类或真菌。
58.如权利要求57的方法,其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、法夫酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属或杜氏藻属。
59.如权利要求56的方法,其中使用的生物为植物。
60.如权利要求59的方法,其中使用的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科或紫罗兰科。
61.如权利要求60的方法,其中使用的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物。
62.如权利要求1至61中任一项的方法,其中酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、金盏花玉红质和金盏花黄质。
63.遗传修饰的非人生物,其中该遗传修饰,A.对于已经具有酮酶活性的野生型生物,与野生型相比增加其酮酶活性,且B.对于不具有酮酶活性的野生型生物,与野生型相比造成酮酶活性,且其中该遗传修饰C.对于已经具有β环化酶活性的野生型生物,与野生型相比增加其β环化酶活性,且D.对于不具有β环化酶活性的野生型生物,与野生型相比造成β环化酶活性,而C中增加的β环化酶活性或D中造成的β环化酶活性源于以下β环化酶,该β环化酶含有SEQ ID NO2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO2序列至少有70%的同一性。
64.如权利要求63的遗传修饰的生物,所述生物的起始生物可天然产生或能够通过遗传互补产生类胡萝卜素。
65.如权利要求63或64的遗传修饰的生物,选自微生物或植物。
66.如权利要求65的遗传修饰的生物,其中微生物选自细菌、酵母、藻类或真菌。
67.如权利要求66的遗传修饰的生物,其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属或杜氏藻属。
68.如权利要求65的遗传修饰的生物,其中使用的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科及紫罗兰科。
69.如权利要求68的遗传修饰的生物,其中使用的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物。
70.如权利要求63至69中任一项的遗传修饰生物作为饲料或食品的用途。
71.如权利要求63至69中任一项的遗传修饰生物在生产含酮类胡萝卜素提取物或生产饲料添加剂或食品添加剂中的用途。
全文摘要
本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰的生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性。本发明也涉及经过遗传修饰的生物和它们作为食品和饲料的用途,以及它们在生产酮类胡萝卜素提取物中的用途。
文档编号A23K1/00GK1863922SQ200480029068
公开日2006年11月15日 申请日期2004年7月31日 优先权日2003年8月18日
发明者R·弗拉赫曼, C·R·朔普费尔, K·赫伯斯, I·孔策, M·绍尔, M·克勒布萨特尔, T·卢克, D·弗斯特, A-M·皮菲弗尔 申请人:太阳基因有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1