编码参与生育酚合成的蛋白质的核酸序列的制作方法

文档序号:563942阅读:474来源:国知局
专利名称:编码参与生育酚合成的蛋白质的核酸序列的制作方法
技术领域
本发明涉及核酸与氨基酸的序列和构建体,及其相关方法。
背景类异戊二烯类化合物广泛地存在于所有生物体中。植物合成多种系列的类异戊二烯类化合物,超过22,000种之多(Connolly和Hill(1992)Dictionary of Terpenoids,champman and Hall,New York,NY)。在植物中,类异戊二烯类化合物在特定的细胞功能诸如固醇的生成中起重要作用,促成真核细胞膜的构造以及存在于泛醌和质体醌、生长调节剂(如脱落酸、赤霉素、油菜素类固醇)或光合色素叶绿素和类胡萝卜素的开链聚异戊二烯化合物的侧链。尽管其它的植物性类异戊二烯类化合物的生理作用(比如,多种系列的次级代谢产物的生理作用)并不明显,但是已知有些类异戊二烯类化合物在介导对不同的环境挑战的适应性反应中起关键作用。尽管类异戊二烯类化合物的结构和功能具有显著的多样性,但是它们都源自单一种代谢前体,即异戊烯二磷酸(IPP)(Wright,(1961)Annu.Rev.Biochem.20525-548;以及Spurgeon和Porter,(1981)Biosynthesis ofIsoprenoid Compounds.,Porter和Spurgeon编辑(John Wiley,NewYork)第1卷,1-46页)。
在高等植物的叶绿体中,存在着源自类异戊二烯途径的若干独特和相互关联的生化途径,它们导致次级代谢产物(包括生育酚)的生成。生育酚不仅在植物中起着至关重要的作用,而且从哺乳动物的营养角度来看也是重要的。在质体中,生育酚占总醌库的量达到40%
生育酚和生育三烯酚(不饱和生育酚的衍生物)是众所周知的抗氧化剂,在保护细胞免受自由基损害以及预防多种疾病(包括心脏病、癌症、白内障、视网膜病、早老性痴呆和神经变性)中起重要的作用,而且已经表明它们对关节炎症状以及在抗衰老中具有有益的效应。维生素E被用于鸡饲料中,以提高鸡肉的货架寿命、外观、香味和氧化稳定性,以及将母育酚从饲料转移到鸡蛋中。已经表明,维生素E对家畜动物的正常生育是必需的,并改善家畜动物的总体表现和增强其免疫力。在动物饲料中补充维生素E还可赋予奶制品氧化稳定性。
天然生育酚作为补充物,在过去的三年里,对其需求一直在以10-20%的速度稳定地增长。目前,对天然生育酚的需求超过了供给,已知天然生育酚的生物活性,高于合成得到的生育酚的外消旋混合物。天然生育酚都是d-立体异构体,而合成α-生育酚是八种d,1-α-生育酚异构体的混合物,只有其中的一种(占12.5%)与天然d-α-生育酚完全相同。天然d-α-生育酚,与其它天然生育酚或生育三烯酚相比,具有最高的维生素E活性(1.49IU/mg)。合成α-生育酚的维生素E活性为1.1IU/mg。1995年,世界市场对生育酚精制原料的需求为10.2亿美元;其中合成物质占市场的85-88%,剩下的12-15%为天然物质。天然生育酚和生育三烯酚的最佳来源物为植物油和谷类产品。当前,大部分的天然维生素E是产自γ-生育酚,而γ-生育酚又出自豆油加工,随后通过化学修饰可将其转化为α-生育酚(α-生育酚表现出最高的生物活性)。
不通过化学修饰而提高植物中生育酚和生育三烯酚(特别是那些能够直接使用的更希望得到的化合物)水平的方法,将有助于本领域,这是由于这些分子表现出更好的功能性和生物可利用性。。
另外,希望得到这样的方法,其可增加宿主植物细胞中其它类异戊二烯衍生化合物的产量。而且,还需要在宿主植物细胞中产生特定的类异戊二烯化合物的方法。
发明概述本发明涉及异戊烯转移酶(PT),更具体地,涉及PT的多核苷酸和多肽。本发明的多核苷酸和多肽包括源自真核细胞来源物的那些多核苷酸和多肽。
因而,本发明的一个方面涉及编码异戊烯转移酶蛋白质的分离的多核苷酸序列。更具体地,本发明提供了编码来自细菌和植物源的PT蛋白质的分离的核酸序列。
本发明的另一方面涉及一些寡聚核苷酸,包括部分或全部PT编码序列。
本发明的又一个方面提供了可用于转录或者转录及翻译(表达)异戊烯转移酶的重组DNA构建体。更具体地,本发明提供了能够在宿主细胞中转录或者转录及翻译的构建体。
在本发明的另一个方面中,提供了在宿主细胞或其后代中产生异戊烯转移酶的方法。更具体地,用可以用于转录或者转录及翻译异戊烯转移酶的DNA构建体对宿主细胞进行了转化或转染。含有异戊烯转移酶的重组细胞也是本发明的一部分。
另一方面,本发明涉及使用多核苷酸和多肽序列改变宿主细胞(尤其是宿主植物细胞)中的生育酚含量的方法。在本文中还构思了含有如此改变的生育酚含量的植物细胞。
通过表达异戊烯转移酶而得到的被修饰的植物、种子和油也被认为是本发明的一部分。
附图的简要说明


图1.提供了排列于ATPT2、ATPT3、ATPT4、ATPT8和ATPT12之间的氨基酸序列,通过Clustal W分析得到。
图2提供了表达构建体pCGN10800的示意图。
图3提供了表达构建体pCGN10801的示意图。
图4提供了表达构建体pCGN10803的示意图。
图5提供了表达构建体pCGN10806的示意图。
图6提供了表达构建体pCGN10807的示意图。
图7提供了表达构建体pCGN10808的示意图。
图8提供了表达构建体pCGN10809的示意图。
图9提供了表达构建体pCGN108010的示意图。
图10提供了表达构建体pCGN10811的示意图。
图11提供了表达构建体pCGN10812的示意图。
图12提供了表达构建体pCGN10813的示意图。
图13提供了表达构建体pCGN10814的示意图。
图14提供了表达构建体pCGN10815的示意图。
图15提供了表达构建体pCGN10816的示意图。
图16提供了表达构建体pCGN10817的示意图。
图17提供了表达构建体pCGN10819的示意图。
图18提供了表达构建体pCGN10824的示意图。
图19提供了表达构建体pCGN10825的示意图。
图20提供了表达构建体pCGN10826的示意图。
图21给出了Clustal W分析得到的集胞蓝细菌属(Synchocystis)序列敲除间的氨基酸序列排列。
图22给出了拟南芥属中ATPT2、ATPT3、ATPT4、ATPT8和ATPT12蛋白序列的氨基酸序列,以及集胞蓝细菌属中slr1736、slr0926、sll1899、slr0056和slr1518氨基酸序列。
图23给出了野生型集胞蓝细菌属菌株6803和集胞蓝细菌属slr1736敲除的集胞蓝细菌属制备物的酶分析结果。
图24给出了包含pCGN10822的转基因拟南芥属种子提取物HPLC分析资料的条线图,pCGN10822提供了从napin启动子起始向有义方向的ATPT2序列的表达。给出了α-,γ-,及δ-生育酚的图谱,同时也给出了22种转化细胞、一种非转化(野生型)对照组的总生育酚图谱。
图25给出了用pCGN10803(35S-ATPT2,向反义方向)、pCGN10802(1625行,napin ATPT2向有义方向)、pCGN10809(1627行,35S-ATPT3向有义方向) 转化的植物拟南芥属种子提取物的HPLC分析条线图,同时也给出了非转化(野生型)对照组及经空载体转化对照组的图谱。
发明的详细描述本发明尤其提供了改变(如增加和减少)生育酚水平和/或调整其在宿主细胞内含量的组成和方法。本发明特别提供了多核苷酸、多肽和在宿主植物细胞中调整生育酚含量的方法。
本发明提供了参与直链和芳香基化合物异戊烯化的多聚核苷酸及多肽序列。本文所用的直链异戊烯基转移酶包括编码参与直链化合物异戊烯化的蛋白质序列,该直链化合物包括但不局限于牻牛儿牻牛儿焦磷酸和法尼基焦磷酸。本文所用的芳香基异戊烯基转移酶包括编码参与芳香基化合物异戊烯化的蛋白质序列,该芳香基化合物包括但不局限于甲基萘醌、泛醌、叶绿素及尿黑酸。本发明中的异戊烯基转移酶优选尿黑酸的异戊烯化的蛋白质序列。
高等植物中α-生育酚的生物合成涉及到尿黑酸和叶绿基焦磷酸缩合形成2-甲基-6叶绿基苯醌,其可以通过环化和随后的甲基化形成多种生育酚(Fiedler等,1982,Planta,155511-515,Soll等,1980,Arch,Biochem.Biophys.204544-550,Marshall等,1985,Phytochem.,241705-1711,这些文献的全部内容在此引入作为参考)。Nomiset等鉴定和描述了,拟南芥属dps2突变在生育酚和质体醌-9的积聚物中是不存在的。进一步的遗传学和生物化学分析显示PDS2编码的蛋白质是造成尿黑酸异戊烯化的原因,这在生育酚合成中可能是限速步骤,该基因现在仍未被分离。因此,本发明的一个方面是提供参与尿黑酸异戊烯化的多聚核苷酸和多肽。分离的多聚核苷酸和多肽本发明的第一个方面涉及分离的异戊烯基转移酶多核苷酸,该多核苷酸包括编码本发明多肽的多核苷酸,这些多肽具有选自序列表列出的推定氨基酸序列。本发明还涉及其它与这些多核苷酸序列及其变异体紧密相关的多核苷酸序列。
本发明提供了一种多核苷酸序列,其整个序列与在序列表中列出的每个编码序列完全相同。本发明还提供了成熟多肽或其片段的编码序列,以及与其它编码序列诸如那些编码导肽或分泌序列、前-、原-或前原-蛋白质序列处于同一读框中的成熟多肽或其片段的编码序列。该多核苷酸还可包含非编码序列,例如包括但不限于非编码的5’和3’序列,诸如转录但不翻译的序列、终止信号、核糖体结合位点、稳定mRNA的序列、内含子、多腺苷酸化信号和编码所添加氨基酸的添加编码序列。例如,可以将一个标记序列包括在内,以促进融合多肽的纯化。本发明的多核苷酸还包括含有结构基因和控制基因表达的天然结合序列的多核苷酸。
本发明还包括下式的多核苷酸X-(R1)n-(R2)-(R3)n-Y其中,位于5’末端的X是氢,位于3’末端的Y是氢或金属,R1和R3为任何核酸残基,n是一个介于1-3000之间的整数(优选介于1-1000之间),R2是本发明的核酸序列,尤其是选自序列表列出的核酸序列并优选SEQ ID NOs1、3、5、7、8、10、11、13-16、18、23、29、36和38中的那些核酸序列。在上式中,R2是有方向性的,其5’末端残基位于左边,结合于R1,而其3’末端残基位于右边,结合于R3。通过每组R(R大于1)表示的任何核酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。
本发明还涉及本文所述的多核苷酸的变异体,它们编码本发明的多肽的变异体。那些本发明的多核苷酸片段的变异体,可被用于合成本发明的全长多核苷酸。优选的实施方案为编码多肽变异体的多核苷酸,其中对本发明的多肽序列的5-10,1-5,1-3,2,1或无氨基酸残基被以任何组合替代、添加或缺失。特别优选沉默的替代、添加和缺失,因为它们不会改变该多核苷酸或多肽的性能或活性。
本发明的进一步优选的实施方案为在多核苷酸全长内与编码本发明多肽的多核苷酸有至少50%、60%或70%相同性的多核苷酸,以及与这种多核苷酸互补的多核苷酸。更优选含有其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少80%相同性的区域的多核苷酸。在这一点上,尤其优选其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少90%相同性,特别优选那些有至少95%相同性的多核苷酸序列。进一步地,非常优选那些有至少97%相同性的多核苷酸序列,而且尤其非常优选那些有至少98%和99%相同性的多核苷酸序列,其中最优选那些有至少99%相同性的多核苷酸序列。
优选的实施方案为这样的多核苷酸,它们所编码的多肽基本上保留了与成熟多肽(由序列表中列出的多核苷酸编码)相同的生物学功能或活性。
本发明进一步涉及可与上述序列杂交的多核苷酸。更具体地,本发明涉及在严格条件下可与上述多核苷酸杂交的多核苷酸。本文所用的术语“严格条件”和“严格杂交条件”是指在序列间具有至少95%(优选至少97%)相同性的情况下,一般会发生杂交反应。严格杂交条件的一个例子是,在含有50%甲酰胺、5×SSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt’s溶液、10%硫酸葡聚糖和20毫克/毫升变性剪切鲑精DNA的溶液中,在42℃温育过夜,随后在0.1×SSC中于大约65℃冲洗杂交载体。其它的杂交和冲洗条件是公知的,并且在Sambrook等人的分子克隆实验室手册(Molecular CloningA Laboratory Manual),Cold SpringHarbor,NY(1989)第二版,尤其是第11章中有例子。
本发明还提供一种基本上由一种多核苷酸序列组成的多核苷酸,这样的多核苷酸可如此获得在严格杂交条件下,用在多核苷酸序列表中列出的多核苷酸序列或其片段序列作为探针,筛选含有该种多核苷酸序列的完整基因的合适的文库;然后分离所述的核苷酸序列。用于获得这样一种多核苷酸的片段包括例如本文中所述的探针和引物。
正如本文所讨论的关于本发明的多核苷酸测定法,例如,本发明的多核苷酸可被用作RNA、cDNA或基因组DNA的杂交探针,以分离全长cDNA或编码多肽的基因组克隆,以及分离与序列表中列出的多核苷酸具有高度序列相似性的其它基因的cDNA或基因组克隆。这样的探针一般含有至少15个碱基。优选地,这样的探针具有至少30个碱基并可以具有至少50个碱基。尤其优选的探针将具有30-50个碱基,其中包括30和50个在内。
含有或含于序列表中列出的多核苷酸序列的每一种基因,其编码区可以利用序列表中提供的DNA序列筛选,以合成寡核苷酸探针。然后,使用与本发明的基因的序列具有序列互补性的标记寡核苷酸,对cDNA、基因组DNA或mRNA的文库进行筛选,以鉴定可与探针杂交的文库中的成员。例如,制备与异戊烯基转移酶EST序列相应的合成的寡核苷酸。以寡核苷酸为引物,以聚合酶链式反应(PCR)技术获得异戊烯基转移酶基因的5’端和3’端序列。或者,在可以根据特定的异戊烯基转移酶肽制备出低简并性寡核苷酸的情况下,也可以将这样的探针直接用于筛选基因文库,以获得异戊烯基转移酶基因序列。尤其是,筛选噬菌体载体中的cDNA文库有助于这种方法,因为杂交的背景较低。
一般地,使用核酸探针所获得的异戊烯基转移酶序列显示出,靶异戊烯基转移酶序列与用作探针的编码序列之间60-70%的序列相同。但是,也可以获得低至50-60%序列相同性的长序列。核酸探针可以是长的核酸序列片段,也可以是较短的寡核苷酸探针。当使用较长的核酸片段作为探针时(大于大约100bp),为了从靶样品中获得与探针序列具有20-50%偏差(即,50-80%的序列相同性)的序列,在进行筛选时可以将杂交的严格性降低。寡核苷酸探针可以比编码异戊烯基转移酶的完整核酸序列短许多,但至少也应该为大约10个,优选至少为大约15个,更优选至少为大约20个核苷酸。当使用较短的区域作探针时,与较长的区域相比,希望能达到更高的序列相同性程度。因此,希望鉴定出高度保守的氨基酸序列区,以设计寡核苷酸探针,用于探测和回收其它相关的异戊烯基转移酶基因。较短的探针对于聚合酶链式反应(PCR)常常特别有用,并且在可以鉴定出高度保守序列的情况下尤其如此(参见Gould等。,PNAS USA(1989)861934-1938)。
本发明的另一方面涉及异戊烯基转移酶多肽。这种多肽包括在序列表中列出的分离的多肽及其多肽和片段,尤其是那些显示异戊烯基转移酶活性并且与从序列表所列序列中选出的多肽序列具有至少50%、60%或70%,优选至少80%,更优选至少90%,最优选至少95%相同性的多肽,还包括这些多肽的组成部分,其中多肽的组成部分优选包含至少30个氨基酸,更优选包含至少50个氨基酸。
“相同性”,正如本领域所熟知的,是两种或更多种多肽序列间或者两种或更多种多核苷酸序列间的相互关系,其可通过比较这些序列而确定。在本领域中,“相同性”也指多肽或多核苷酸序列间的序列相关性程度,其可通过对这些序列一串串地进行比对而确定。“相同性”可以容易地通过已知的方法计算出,这些方法包括但不限于在Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988;BiocomputingInformatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993;Computer Analysis ofSequence Data,Part I,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;Sequence Analysis Primers,Gribscov,M.和Devereux,J.编辑,Stockton Press,纽约,(1991);以及Carillo,H.和Lipman,D.,SIAM J Applied Math.,481073(1988)中描述的那些方法。在设计确定相同性的方法时,目的就是给出待测试序列间的最大匹配。而且,确定相同性的方法被编写在可公开获得的程序中。可用于确定两种序列间相同性的电脑程序包括但不限于GCG(Devereux,J.等,Nucleic Acids Research,12(1)387(1984));一组五个BLAST的程序,其中的三个用于核酸序列查询(BLASTN、BLASTX和TBLASTX),两个用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson,Trends in Biotechnolgy,1276-80(1994);Birren等,Genome Analysis,1543-559(1997))。BLAST X程序可以从NCBI和其它途径公开获得(BLAST Manual,Altschul,S.等,NCBI NLM NIH,Bethesda,MD 20894;Altschul,S.等,J.Mol.Biol,215403-410(1990))。公知知的SmithWaterman算法也可用于确定相同性。
多肽序列比较参数一般包括算法Needleman和Wunsch,J.Mol.Biol.48443-453(1970)比较矩阵BLOSSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci USA 8910915-10919(1992)空位处罚分12空位长度处罚分4能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数,连同对末端空位没有处罚分,就是进行肽比较的缺省设置参数。
多核苷酸序列比较的参数包括算法Needleman和Wunsch,J.Mol.Biol.48443-453(1970)比较矩阵匹配=+10,错配=0空位处罚分50空位长度处罚分3能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数就是进行核酸比较的缺省设置参数。
本发明还包括下式的多肽X-(R1)n-(R2)-(R3)n-y其中,位于氨基末端的X是氢,位于羧基末端的Y是氢或金属,R1和R3为任何氨基酸残基,n是一个介于1-1000之间的整数,R2是本发明的氨基酸序列,尤其是选自序列表中列出的氨基酸序列,优选在SEQ ID NO2、4、6、9、12、17、19-22、24-28、30、32-37和39中提供的序列编码的那些氨基酸序列。在上式中,R2是有方向性的,其氨基末端残基位于左边,结合于R1,而其羧基末端残基位于右边,结合于R3。用一组R(R大于1)表示的任何氨基酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。
本发明的多肽包括由多核苷酸编码的分离的多肽,其中的多核苷酸含有选自本文序列表中列出的序列。
本发明的多肽可以是成熟的蛋白质或者可以是融合蛋白质的一部分。
这些多肽的片段和变异体也被认为是本发明的一部分。一个片段就是一个变异体多肽,它所具有的氨基酸序列与前面描述的多肽的氨基酸序列的一部分而不是全部完全相同。这些片段可以独立存在,也可以含于一个更大的多肽中,其中该片段形成一部分或一个区域,最优选是形成单一连续区域。优选的片段为具有生物学活性的片段,它们可以介导本发明多肽的活性,其中包括那些具有相似活性或提高活性或降低活性的片段。本发明还包括那些在动物尤其是人中具有抗原性或免疫原性的片段。
这些多肽的变异体还包括与序列表中列出的序列不同的多肽,这些不同是由保守氨基酸的取代产生的,即一个氨基酸残基被另一个具有相似性质的氨基酸残基取代。一般地,这中取代发生在Ala、Val、Leu和Ile之间,Ser和Thr之间,Asp和Glu之间,Asn和Gln之间,Lys和Arg之间,或Phe和Tyr之间。尤其优选其中5-10、1-5、1-3个或者1个氨基酸被以任何组合取代、缺失或添加的变异体。
那些是本发明多肽片段的变异体,通过肽合成可用于产生相应的全长多肽。因而,可将这些变异体用作生成本发明的全长多肽的中间体。
本发明的多核苷酸和多肽可用于,例如,转化宿主细胞诸如植物宿主细胞,正如本文所进一步讨论的。
本发明还提供了编码多肽的多核苷酸,其中的多肽为成熟蛋白质再加上添加的氨基或羧基末端氨基酸,或者成熟的多肽中的氨基酸(例如,当蛋白质的成熟形式具有多于一个多肽链时)。这种序列可以,例如,在蛋白质从前体到成熟形式的转变加工中起作用,帮助蛋白质转运,缩短或延长蛋白质半寿期,或者在蛋白质的测定或生产中简化操作。预期可使用胞内酶从成熟的蛋白质中除去任何添加的氨基酸。
具有融合到一种或多种前序列(prosequence)的成熟形式的多肽的前体蛋白质,可能是该多肽的无活性形式。一般地,当前序列被除去时,无活性前体被激活。在激活之前可以将一部分或者全部前序列除去。这种前体蛋白质一般称为前蛋白质。植物构建及应用方法我们尤其感兴趣的是将核苷酸序列用于重组DNA构建体,以指导本发明的异戊烯基转移酶序列在宿主细胞中的转录或转录及翻译(表达)。表达构建体一般含有宿主细胞中的功能性启动子,该启动子有效地连接到本发明的编码异戊烯基转移酶的核酸序列,还含有宿主细胞中的功能性转录终止区。
当序列的排列方式使得第一种核酸序列影响到第二种核酸序列的功能时,这两种核酸序列就是“有效地连接”或“有效地结合”。优选地,这两种序列是单一连续核酸分子的一部分,更优选地,这两种序列相邻。例如,如果一个启动子调节或介导一个基因在细胞中的转录,那么,所述启动子就与所述基因进行了有效地连接。
本领域的技术人员会认识到,在植物细胞中有许多功能性启动子,并且已在文献中对它们进行了描述。还展望了叶绿体和质体特异性启动子、叶绿体或质体中功能性启动子,以及在叶绿体或质体中有效的启动子。
一组植物功能性启动子为组成型启动子如CaMV35S或FMV35S启动子,它们在大多数植物器官中产生高水平的表达。已将CaMV35S和FMV35S启动子的增强或复制版本用于本发明的实践中(Odell等人,1985,Nature,313810-812;Rogers,美国专利第5,378,619号)。另外,可优选让异戊烯基转移酶基因在植物的特定组织(如叶、茎、根、块茎、种子、果实等)中表达,并且所选择的启动子应具有所需要的组织和发育特异性。
尤其感兴趣的是,使本发明的核酸序列从转录起始区开始表达,并优先在植物种子组织中表达。这种优先在种子中转录起始的序列例子包括那些源自编码植物储藏蛋白质基因序列或者油料种子中参与脂肪酸生物合成的基因的序列。这种启动子的例子包括来自诸如napin(Kirdl等,Seed Sci.Res.,1209-219(1991))、菜豆蛋白、玉米醇溶蛋白、大豆胰蛋白酶抑制剂、ACP、硬脂酰-ACP去饱和酶、大豆β-conglycin的α’亚单位(大豆7s,(Chen等Proc.Natl.Acad.Sci.,838560-8564(1986)))和油质蛋白的基因的5’调节区。
指导具有异戊烯基转移酶的蛋白质定位于特定的亚细胞区室例如线粒体、内质网、液泡、叶绿体或其它质体区室中,也许是有益的。例如,当将本发明的目的基因靶向质体诸如叶绿体以表达时,构建体也要使用指导基因至质体的序列。这种序列在本文中称为叶绿体转运肽(CTP)或质体转运肽(PTP)。这样,在没有将目的基因直接插入到质体中的情况下,表达构建体将另外含有编码转运肽的基因,从而指导目的基因至质体。叶绿体转运肽可以是源自目的基因,也可以是源自具有CTP的异种序列。这种转运肽在本领域中是公知的。参见例如,Von Heijne等(1991)Plant Mol.Boil.Rep.9104-126;Clark等(1989)J.Biol.Chem.26417544-17550;della-Cioppa等(1987)PlantPhysiol.84965-968;Romer等(1993)Biochem.Biophys.Res Commun.1961414-1421;和Shah等(1986)Science 233478-481。
根据目的用途,构建体可以含有编码整个异戊烯基转移酶蛋白质或其一个组成部分的核酸序列。例如,当需要反义抑制给定的异戊烯基转移酶蛋白质时,就不需要完整的异戊烯基转移酶序列。而且,当用于构建体中的异戊烯基转移酶序列是旨在用作探针时,则制备只含有异戊烯基转移酶编码序列的特定组成部分(例如,被发现是编码高度保守的异戊烯基转移酶区的序列)的构建体可能是有益的。
技术人员会认识到,用于抑制内源序列在宿主细胞中表达的方法有许多。这些方法包括但不限于反义抑制(Smith等(1988)Nature,334724-726)、共抑制(Napoli等(1989)Plant Cell,2279-289)、核酶(PCT公开说明书,WO97/10328)以及有义与反义的组合(Waterhouse等(1998),Proc.Natl.Acad.Sci.USA9513959-13964)。在宿主细胞中抑制内源序列的方法一般使用了转录或转录及翻译至少一部分待抑制序列。这种序列可以与内源序列的编码区同源,也可以与内源序列的非编码区同源。
本发明的植物表达构建体也可以提供调节转录本的终止区。转录本的终止区可以由编码异戊烯基转移酶的DNA序列提供,或者由不同基因来源的方便的转录终止区提供,例如,与转录本起始区天然结合的转录本终止区。技术人员会认识到,任何能够在植物细胞中终止转录的方便的转录本终止区,都可以在本发明的构建体中予以采用。
或者,也可以将构建体制备为可以指导异戊烯基转移酶序列直接从宿主植物细胞的质体表达。这种构建体和方法为本领域所公知,并一般描述于,例如Svab等(1990)Proc.Natl.Acsd.Sci.USA 878526-8530和Svab和Maliga(1993)Proc.Natl.Acsd.Sci.USA 90913-917以及美国专利第5,693,507号。
本发明中的异戊烯基转移酶构建体可以与另外的构建体一起在转化方法中使用,该另外的构建体提供编码参与生产生育酚或生育酚前体(如同源酸和/或叶绿基焦磷酸)蛋白质的核苷酸序列的表达。参与生产尿黑酸的蛋白质的核苷酸序列在本领域中是公知的,它包括但不局限于4-羟苯基丙酮酸双加氧酶(HPPD,ECl.13.11.27,如在Garcia等(1984)J.Mol.Biol.1801023-1051中所述)、单一或双官能tyrA(如Xia等(1992)J.Gen Microbiol.1381309-1316,以及Hudson.等(1984)J.Mol.Biol.1801023-1051中所述)加氧酶、4-羟苯基丙酮酸二(9Cl),4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、4-羟苯基乙酸,NAD(P)H氧化还原酶(1-羟基化)、4-羟苯基乙酸1-一加氧酶等。另外,编码参与生产叶绿基焦磷酸蛋白质的核酸序列的表达构建体也可以与本发明中的异戊烯基转移酶构建体一起使用。编码参与生产叶绿基焦磷酸蛋白质的核酸序列在本领域中是公知的,它包括但不局限于牻牛儿牻牛儿焦磷酸合酶(GGPPS),牻牛儿牻牛儿焦磷酸还原酶(GGH),1-脱氧木酮糖5-磷酸合酶,1-脱氧-D-木糖-5-磷酸盐还原异构酶、4-二磷酸胞苷-2-C-甲基赤藓糖醇合酶、异戊基焦磷酸异构酶。
本发明中的异戊烯基转移酶序列可以用于制备转化构建体,该构建体含有一个二级表达盒来表达参与生育酚生物合成的其它序列。本发明中令人感兴趣的另外的参与生育酚生物合成的序列包括但不局限于γ生育酚甲基化转移酶(Shintani等(1998)Science 282(5396)2098-2100)、生育酚环化酶和生育酚甲基化酶。
当将含有表达构建体的重组DNA构建体引入到植物的细胞、组织、器官中或植物中时,我们就认为植物的细胞、组织、器官或植物已被转化、转染或转基因。转基因或转化的细胞或植物也包括细胞或植物的子代,以及由育种项目而产生的子代,该育种项目在杂交试验中采用这样的转基因植物作为亲代,并且这些子代由于异戊烯基转移酶核酸序列的存在而表现出变化的表型。
具有异戊烯基转移酶并作为提高或减低其表达的目的DNA序列的植物表达或转录型构建体,可用于广泛多种植物生命体中,尤其是参与生成食用或工业用途的植物油的植物生命体。用于本发明方法的尤其优选的植物包括但不限于金合欢、苜蓿、茴香树、苹果树、杏树、洋蓟、芝麻菜、石刁柏、鳄梨树、芭蕉属植物、大麦、豆科植物、甜菜、黑莓、乌饭树、嫩茎花椰菜、球芽甘蓝、卷心菜、canola、罗马甜瓜、胡萝卜、木薯、花椰菜、芹菜、樱桃树、菊苣属植物、芫荽叶、柑橘属植物、克莱门氏小柑橘、咖啡树、玉米、棉花、黄瓜、Douglas冷杉、茄子、苣荬菜、escarole、桉树属植物、茴香、无花果属植物、大蒜、葫芦属植物、葡萄、葡萄柚、加甜味烟草、凉薯、kiwifruit、莴苣、韭葱、柠檬树、酸橙、火炬松、芒果、甜瓜、菌类植物、油桃、坚果、燕麦属植物、油棕榈、菜籽油油菜、秋葵荚、洋葱、柑桔、一种装饰性植物、番木瓜树、欧芹、豌豆、桃树、花生、梨树、胡椒属植物、柿树、松树、菠萝、车前草、李属植物、石榴树、杨属植物、马铃薯、南瓜、温柏树、放射状松树、菊苣、小萝卜、木莓、水稻、黑麦、高粱、美国长叶松、大豆、菠菜、南瓜、草莓、糖甜菜、甘蔗、向日葵、白薯、枫香属植物、红橘树、茶树、烟草、西红柿、黑小麦、草皮、芜菁、一种葡萄树、西瓜、小麦、薯蓣属植物和.夏季产南瓜。
最优选的是温带油料作物。感兴趣的温带油料作物包括但不限于油菜仔(Canula和高芥子酸变种)、向日葵、红花、棉花、大豆、花生、椰子和油棕以及玉米。依据引入重组构建体至宿主细胞内所使用的方法,也许需要其它DNA序列。重要的是,本发明适用于双子叶种类的植物和单子叶种类的植物,并可以容易地适用于新的和/或改进的转化和调节技术。
尤其感兴趣的是,在植物中使用了异戊烯基转移酶构建体,以产生这样的植物或植物体部分(其中包括但不限于叶、茎、根、生殖性部分和种子),在具有转化植物细胞的植物体部分中,生育酚的含量被改变。
为了进行免疫学筛选,用纯化的蛋白质或其组成部分注射兔或小鼠就可以制备针对该蛋白质的抗体,这种制备抗体的方法为本领域人员所公知。可以制备产生单克隆抗体或多克隆抗体,尽管在一般情况下多克隆抗体对于基因分离更有用。可以进行Westem分析,以确定在所希望的植物种类的粗提取物中有相关蛋白质的存在,例如采用针对被编码蛋白质的抗体通过交叉反应来确定。当观察到交叉反应时,通过筛选代表所希望植物种类的表达文库,将编码相关蛋白质的基因分离。表达文库可构建于多种可商购载体中,包括λgtl1,正如在Sambrook等在Molecular CloningA Laboratory Manual第二版(1989)Cold Spring Harbor Laboratory,Cold Spring Harbor,New York中所描述的。
为了证实被鉴定为异戊烯基转移酶的核酸序列所编码的蛋白质的活性和特异性,采用杆状病毒表达系统在昆虫细胞培养物中进行了体外测定。这种杆状病毒表达系统为本领域所公知,并且在Lee等人的美国专利5,348,886中有描述,本文引用其全部作为参考。
另外,可以制备其它表达构建体,以使用不同的表达系统测定蛋白质活性。将这种表达构建体转化到酵母或原核细胞宿主内并测定异戊烯基转移酶活性。这种表达系统为本领域所公知,并可容易地通过商业途径获得。
除了在本发明中所描述的序列外,用于本发明的DNA编码序列也可源自藻、真菌、细菌、哺乳动物来源物、植物等。可以使用与异戊烯基转移酶的保守核苷酸或氨基酸序列相应的特征序列,在已有的数据库中进行同源性搜索,从而从其它来源物诸如植物和微生物中分离相当、相关基因。也可以在EST数据库中进行搜索。而且,本发明还包含在功能上、酶本身方面与本文所公开的相当的DNA序列编码酶的用途,其中该DNA序列是本文中所公开的与遗传密码的简并性相一致的核酸序列的简并性相当物。使用任何这些方法所鉴定的编码序列,对其功能的证实,可以通过缺乏特异性生化反应或者已经发生突变的合适生物体(例如,集胞蓝细菌属(Synechocystis)、Schewanella、酵母、假单胞菌属(Pseudomonas)、红细菌科(Rhodobacteria)等)的突变体的互补来实现。DNA编码区的序列可以依据密码子的使用选择性,通过基因合成予以最优化,从而在特定的宿主中实现表达的最大化。
为了改变宿主细胞中生育酚的生成,依据本发明可以使用第二种表达构建体。例如,异戊烯转移酶表达构建体可以与第二种具有编码参与生育酚生物合成的蛋白的核苷酸序列的表达构建体一起引入宿主细胞。
在获得这种转基因植物中,转化方法对于本发明并不是非常重要,并且当前有多种植物转化方法可供使用。另外,如果有更新可用于转化作物的方法,此后可以直接应用这些新方法。例如,天然对农杆菌属(Agrobacterium)感染敏感的许多植物种类,可以通过农杆菌属介导转化的三分或二分载体方法予以成功地转化。在许多情况下,希望使构建体的一侧或两侧都与T-DNA相连,优选使左侧和右侧与T-DNA相连,更优选使右侧相连。这在构建体使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化方式时显得尤其有用,尽管T-DNA边缘区在其它转化方式中也有用途。另外,已经开发了显微注射、DNA颗粒轰击和电穿孔技术,这些技术可以转化多种单子叶和双子叶植物种类。
在正常情况下,在DNA构建体中将包含这种结构基因,它具有在宿主中表达所必需的调节区并提供对转化细胞的选择。该基因可以提供对一种细胞毒试剂例如抗生素、重金属、毒素等的抗性,通过互补对营养缺陷型宿主提供原养,提供病毒免疫力等等。根据不同宿主种类的数目,引入表达构建体或其组分,可以使用一种或多种标记,从而对不同的宿主种类使用不同的选择条件。
在使用农杆菌属转化植物细胞时,可以使用这样一种载体,其被引入农杆菌属宿主后,可与存在于农杆菌属宿主中的T-DNA或Ti-或Ri-质粒进行同源重组。含有T-DNA(用于重组)的Ti-或Ri-质粒可以被接臂(能引起瘿的形成)的,也可以被断臂(不能引起瘿的形成)的,在后一种情况下,只要vir基因存在于转化的农杆菌属宿主中即可。接臂的质粒能够产生正常植物细胞与瘿的混合物。
在将农杆菌属用作转化宿主植物细胞的媒介物的情况下,将通过T-DNA边缘区相连的表达或转录构建体插入到一种宽宿主范围的载体中,这种载体具有在大肠杆菌以及农杆菌属中复制的能力,在文献中有对多种宽宿主范围载体的描述。通常使用的是pRK2或其衍生物。参见例如,Ditta等(Proc.Nat.Acad.Sci.U.S.A.(1980)777347-7351)以及EPA 0120515,此处引入作为参考。或者,也可以将准备在植物细胞中表达的序列插入到含有独立的复制序列的载体中,其中的一个复制序列在大肠杆菌中稳定载体,另一个在农杆菌属稳定载体。见例如,MacBride等Plant Mol.Bol.(1990)14269-276,其中使用了pRiHRI复制起点(Jouanin等Mol.Gen.Genet.(1985)201370-374),并使植物表达载体在宿主农杆菌属细胞中的稳定性增加。
包括表达构建体和T-DNA的可以是一种或多种标记,它们允许对转化的农杆菌属以及转化的植物细胞进行选择。已经开发了若干种用于植物细胞的标记,诸如对氯霉素、卡那霉素、氨基糖苷G418、潮霉素等的抗性,本发明并不要求必须使用某种标记,而是根据特定的宿主以及构建的方式优选一种或另一种标记。
在使用农杆菌属转化植物细胞时,可以将外植体与转化的农杆菌属合并在一起并温育足够的时间以使转化发生,细菌被杀死,然后将植物细胞培养于合适的选择培性养基中。一旦愈伤组织形成,通过使用合适的植物激素(采用公知的方法)可以催促茎干形成,然后将茎干转移到生根培养基中以再生植物。接着可以让植物生长结种,然后将种子用于建立重复生产以及用于分离植物油。
有几个可能的方法,用来获得含有多个表达构建体的本发明的植物细胞。本发明包含了任何用于生成植物的方法,该植物具有一种构建体,其具有编码本发明的表达构建体的DNA序列,以及至少一种其它构建体,其具有另一种编码酶的DNA序列。例如,可以通过将两种表达构建体合在单一种转化载体中,或使用独立的载体将表达构建体与第二种构建体同时用于转化植物,其中的每一种载体均表达所希望的基因。还可以将第二种构建体引入到已经用异戊烯转移酶表达构建体转化的植物中,或者也可以将一个是表达异戊烯转移酶构建体、另一个是表达第二种构建体的被转化植物,互相进行杂交,从而使两种构建体合于同一植物中。
可以将本发明的核酸序列用于构建体中,以提供在多种宿主细胞(真核细胞和原核细胞)中该序列的表达。本发明的宿主细胞优选包括单子叶和双子叶植物细胞。
一般地,技术人员对那些描述大分子(例如,DNA分子、质粒等)的构建、操作和分离,产生重组生物体以及筛选和分离克隆(参见例如,Sambrook等Molecular CloningA Laboratory Manual,ColdSpring Harbor Press(1989);Maliga等Methods in Plant MolecularBiology,Cold Spring Harbor Press(1985),其全部内容在此处引入作为参考;Birren等Genome AnalysisAnalysing DNA,1,ColdSpring Harbor,New York,其全部内容在此处引入作为参考)的特定条件及方法的标准资料都很熟悉。
在昆虫宿主细胞中表达序列的方法在本领域中是公知的。杆状病毒表达载体是重组的昆虫病毒,其中已将所选择的外源基因的编码序列插入到杆状病毒启动子的后面,以取代病毒基因,例如,多角体蛋白基因(Smith和Summers,美国专利4,745,051,其全部内容在此处引入作为参考)。杆状病毒表达载体为本领域所公知,并在例如Doerfler的Curr.Top.Microbiol.Immunol.,13151-68(1968);Luckrow和Summers的Bio/Technology,647-55(1988a)Miller的Annual Review of Microbiology,42177-199(1988);Summers的Curr.Comm.Molecular Biology,Cold Spring Harbor Press,ColdSpring Harbor,N.Y.(1988);Summers和Smith的A Manual ofMethods for Baculovirus Vectors and Insect Cell Culture Procedures,Texas Ag.Exper.Station Bullentin No.1555(1988)中对其进行了描述,其全部内容在此处引入作为参考。
在真菌宿主细胞中表达目的核酸序列的方法为本领域所公知。真菌宿主细胞可以是例如,酵母细胞或丝状真菌细胞。在酵母细胞中表达目的DNA序列的方法一般描述于“Guide to Yeast Genetics andMolecular Biolgy”,Guthrie和Fink编辑,Methods in Enzymology,Academic Press,Inc.,第194卷(1991年);以及“Gene ExpressionTechnology”,Goeddel编辑,Methods in Enzymology,AcademicPress,Inc.,第185卷(1991年)。
可用作表达宿主的哺乳动物细胞是本领域所公知的,其中包括许多无限增殖化细胞系,可从美国典型培养物保藏中心(ATCC,Manassas,VA)得到它们,诸如Hela细胞、中国仓鼠卵巢(CHO)细胞、幼小仓鼠肾(BHK)细胞和若干其它细胞系。用于哺乳动物细胞的合适的启动子也是本领域所公知的,其中包括但不限于病毒性启动子诸如来自猴病毒40(SV40)(Fiers等Nature,273113(1978),此处引入其全部内容作为参考)、劳斯肉瘤病毒(RSV)、腺病毒(ADV)和牛乳头瘤病毒(BPV)的启动子。哺乳动物细胞也需要终止子序列和poly-A添加序列。也可以将提高表达的增强子序列包括在内,并且也希望含有可促进基因扩增的序列(例如,甲氨蝶呤抗性基因)。
适于在哺乳动物细胞中复制的载体是本领域所公知的,其中可包括病毒性复制子,或者能够确保将编码表位的适当序列整合到宿主基因组中的序列。已经对那些极大地促进重组病毒构建的质粒载体进行了描述(参见例如,Mackett等J.Virol,49857(1984);Chakrabarti等Mol.Cell.Biol.53403(1985);Moss,InGene Transfer VectorsFor Mammalian Cells,Miller和Calos编辑,Cold Spring HarborLaboratory,N.Y.第10页(1987);此处引入上述全部文献的全部内容作为参考)到目前为止,我们已对本发明进行了综述,通过参考下面的实施例,将更容易了解本发明,所给出的这些实施例,仅用于说明,而不是构成对本发明的限制。
实施例实施例1异戊二烯转移酶序列的鉴定PSI-BLAST(Altschul,et al.(1997)Nuc Acid Res 25;3389-3402)的序列文件(profiles)是针对直链和芳香类的异戊烯转移酶产生的。为了得到直链的序列文件,作为对NCBI中非冗余的蛋白质数据库的查询,使用来源于Porphyra purpurea(基因库,收录号1709766)的异戊烯转移酶。大肠杆菌的参与泛醌形成的酶ubiA(genbank收录号1790473)作为启始序列来产生芳香类异戊烯转移酶的序列文件。这些序列文件用来检索公共和专利的DNA和蛋白质数据库。在拟南芥属中,鉴定了7种直链异戊烯转移酶ATPT1(SEQ ID NO9)、ATPT7(SEQ ID NO10)、ATPT8(SEQ ID NO11)、ATPT9(SEQ ID NO13)、ATPT10(SEQ ID NO14)、ATPT11(SEQ ID NO15)和ATPT12(SEQ ID NO16);鉴定了5种芳香异戊烯转移酶ATPT2(SEQ ID NO1)、ATPT3(SEQ IDNO3)、ATPT4(SEQ ID NO5)、ATPT5(SEQ ID NO7)、ATPT6(SEQ ID NO8)。还鉴定了来源于其它植物与芳香类异戊烯转移酶相关的芳香类异戊烯转移酶序列,如大豆(SEQ IDNOs19-23,在SEQ ID NO24中给出了SEQ ID NO23的推定氨基酸序列)和玉米(SEQ ID NOs25-29和31)。由ZMPT的推定氨基酸序列(SEQ IQ NO29)在SEQ ID NO30中给出。
使用附加的Bioaccellerator硬件和由Compugen Ltd.提供的GenWeb软件在Silicon Graphics Unix计算机上进行检索。该软件和硬件在使用序列文件作为查询工具检索DNA和蛋白质数据库中需要使用Smith-Waterman算法。用来查询蛋白质数据库的程序是序列文件索引。在该检索中,不是查询单一序列,而是查询基于氨基酸或核苷酸序列的多种排列的序列文件。这个序列文件是用来查询序列数据组,即序列数据库。该序列文件含有序列上每一个位点打分的相关信息,它有效地替代了用于标准查询的“打分矩阵“。用于以蛋白质序列文件查询核酸数据库的程序是T序列文件索引。T序列文件索引使用氨基酸序列文件查询来检索核酸数据库。当检索进行时,数据库中的序列以6个读框为单位翻译成氨基酸序列。T序列文件索引的结果文件与序列文件索引的只在一个方面有区别,即T序列文件索引中有一附加行指出最佳排列的读框。
Smith-Waterman算法(Smith和Waterman(1981)supra)是用来查找一段序列与数据库中一组序列相似性的。E分值以及其它序列信息,如保守的多肽序列,用来鉴定相关序列。
为了得到对应拟南芥属的异戊烯转移酶的全部编码区,设计了合成寡核苷酸引物来扩增含有异戊烯转移酶序列的部分cDNA克隆的5’末端和3’末端。引物按照相关拟南芥属异戊烯转移酶序列设计并用于cDNA末端快速扩增反应(Rapid Amplification of cDNA Ends,RACE)(Frohman等(1988)Proc.Natl.Acad.Sci.USA 858998-9002),该反应使用Marthaon cDNA扩增试剂盒(Clontech Laboratories Inc,Palo Alto,CA)。
使用ATPT2序列进行其它BLAST检索,该序列是一种芳香异戊烯转移酶。其它序列在与ATPT2序列相似的大豆文库中鉴定。另外的大豆序列证实在氨基酸顺序上有80%相同性和91%相似性。
ATPT2(SEQ ID NO2)、ATPT3(SEQ ID NO4)、ATPT4(SEQ IDNO6)、ATPT8(SEQ ID NO12)和ATPT12(SEQ ID NO17)之间的氨基酸序列排列使用ClusfalW(
图1)进行,其相同和相似百分率在表1中给出。表1

实施例2表达构建体的制备对一个由pCGN3223(描述于USPN 5,639,790,其全部内容引入本文作为参考)衍生而来的含napin盒的质粒进行修饰,使其更有助于克隆含有多限制性位点的大DNA片断,并且使多napin融合基因克隆至植物双表达载体。在使用限制性内切酶BssH II对构建载体pCGN77645消化以后,将序列为CGCGATTTAAATGGCGCGCCCTGCAGGCGGCCGCCTGCAGGGCGCGCCATTTAAAT(SEQ ID NO40)的自身连接寡核苷酸组成的接头与克隆载体pBC Sk+(Stratagen)连接在一起。得到的载体pCGN7770含有pCGN3323的napin种子特异表达盒的pGCN7765主链。
克隆盒pCGN7787(除pCGN7770的napin调节区以外与pGGN7770基本相同的调节单元)被双链CAMV35S启动子和tml聚腺苷酸和转录终止区所代替。
植物转染双载体pCGN5139由pCGN1558构建(McBride和Summerfelt(1990)Plant Molecular Biology,14269-276)。pCGN1558的多连接子被一个非多连接子的Hind III/Asp718片段所代替,后者含有独特的限制性内切酶位点Asc I,Pac I,Xba I,Swa I,BamH I和NotI。Asp718和Hind III限制性内切酶位点存在于pCGN5139内。
构建一系列快速双载体以使得DNA序列快速克隆到含有转录启始位点(启始子)和转录终止区的双载体中。
通过连接寡核苷酸5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ ID NO41)和5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO42)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8618。含有napin启动子、多连接子(polylinker)和napin 3’区的片段通过用Asp718I消化而从pCGN8618切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向插入物的质粒进行序列测定,来确定插入的方向和克隆连接的完整性。得到的质粒称pCGN8622。
通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ ID NO43)和5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO44)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8619。将含有napin启动子、多连接子(polylinker)和napin3’区的片段通过用Asp718 I消化而从pCGN8619切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向插入物的质粒进行序列测定,来确定插入的方向和克隆连接的完整性。得到的质粒称pCGN8623。
通过连接寡核苷酸寡聚核苷5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGGAGCT-3’(SEQ IDNO45)和5’-CCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO46)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8620。将含有d35S启动子、多连接子(polylinker)和trm3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8620切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718 I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向插入物的质粒进行序列测定,来确定插入的方向和克隆连接的完整性。得到的质粒称pCGN8624。
通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCCAGCT-3’(SEQ IDNO47)和5’-GGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO48)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8621。将含有d35S启动子、多连接子(polylinker)和trm 3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8621切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向插入物的质粒进行序列测定,来确定插入的方向和克隆连接的完整性。得到的质粒称pCGN8625。
质粒构建体pCGN8640是上述pCGN8624的修饰。从编码细菌奇霉素和链霉素抗性(Fling等(1985),Nucleic Acids Research13(19)7095-7100)的转位子分离的938bp Pst I的片段,是选择大肠杆菌和毛根农杆菌的决定因素,而且由Pfu聚合酶补为平端。该平端片段连接到被Spe I消化且被Pfu聚合酶补平的质粒pCGN8624。对含有Pst I片段的区域测序以确定插入物的方向和克隆连接的完整性。
按如下的方法将奇霉素抗性标记引入pCGN8622和pCGN8623将从pCGN8640得到的7.7kbp的Avr II-SnaB I片段连接到从pCGN8622或pCGN8623得到的10.9kbp的Avr II-SnaB I片段。分别得到质粒pCGN8641和pCGN8643。
通过连接寡核苷酸5’-GATCACCTGCAGGAAGCTTGCGGCCGCGGATCCAATGCA-3’(SEQ ID NO49)和5’-TTGGATCCGCGGCCGCAAGCTTCCTGCAGGT-3’(SEQ ID NO50)到Bam H I-Pst I消化的pCGN8641构建质粒pCGN8644。
设计将合成寡核苷酸用于聚合酶链反应(PCR)来扩增用于制备表达构建体的ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列,见下面表2。表2


ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列均分别由上述表2中的PCR引物来扩增,并克隆到载体TopoTA(Invitrogen)中。含有相应异戊烯转移酶的构建体用Not I和Sse8387 I消化,并克隆到上述快速双载体中。
编码异戊烯转移酶ATPT2的序列按照有义方向克隆到pCGN8640,以生成植物转化构建体pCGN10800(图2)。ATPT2序列处于35S启动子的控制之下。
ATPT2序列也按照反义方向克隆到构建体pCGN8641以生成pCGN10801(图3)。该构建体提供了ATPT2序列从napin启动子的的反义表达。
ATPT2编码序列也按照反义方向克隆到构建体pCGN8643以生成植物转化构建体pCGN10802。
ATPT2编码序列也按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10803(图4)。
ATPT4编码序列克隆到载体pCGN864,以生成植物转化构建体pCGN10806(图5)。ATPT2序列克隆到载体pCGN864以生成植物转化构建体pCGN10807(图6)。ATPT3编码序列克隆到载体pCGN864以生成植物转化构建体pCGN10808(图7)。ATPT3编码序列按照有义方向克隆到载体pCGN8640以生成植物转化构建体pCGN10809(图8)。ATPT3编码序列按照反义方向克隆到载体pCGN8641以生成植物转化构建体pCGN10810(图9)。ATPT3编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10811(
图10)。ATPT3编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10812(
图11)。ATPT4编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10813(
图12)。ATPT4编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10814(
图13)。ATPT4编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10815(
图14)。ATPT4编码序列按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10816(
图15)。ATPT2编码序列克隆到载体pCGN???以生成植物转化构建体pCGN10817(
图16)。ATPT8编码序列按照有义方向克隆到载体pCGN8643以生成植物转化构建体pCGN10819(
图17)。ATPT12编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10824(
图18)。ATPT12编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10825(
图19)。ATPT8编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10826(图20)。实施例3植物转化转基因芸苔属植物是按照Radke等(Theor.Appl.Genet.(1988)75685-694;Plant Cell Reports(1992)11499-505)所述的方法通过毛根农杆菌介导的转化获得。转基因拟南芥植株可以按照Valverbens等(Proc.Nat.Acad.Sci.(1988)855536-5540)、Bent等((1994),Science 2651856-1860)或Bechtold等((1993),C.R.Acad.Sci,Life Science 3161194-1199)所述的方法通过毛根农杆菌介导的转化获得。其它种属的植物也可以利用相关技术进行类似的转化。
另外,还可使用微粒轰击法(如Klein等(Bio/Technology 10286-291)所述)获得细胞核转化的植株。实施例4异戊烯转移酶的鉴定利用大肠杆菌ubiA(Genebank accession 1790473)序列产生的PSI-Blast序列文件来分析集胞蓝细菌属基因组。该分析在集胞蓝细菌属基因组中分离了5个开放读框(ORFs),它们都可能是异戊烯转移酶slr0926(注释为ubiA(4-羟苯甲酸-八异戊烯转移酶),SEQ ID NO32)、sll1899(注释为ctaB(细胞色素c氧化酶折叠蛋白),SEQ IDNO33)、slr0056(注释为g4(叶绿素合酶33kd亚单位),SEQ IDNO34)、slr1518(注释为menA(甲基萘醌类生物合成蛋白),SEQ IDNO35)和SLR1736(注释为未知功能的推测蛋白,SEQ ID NO36)。
为了确定这些开放读框在生育酚生物合成中可能具有或其参与的作用,制备敲除构建体以阻断集胞蓝细菌属中破裂的ORF。
设计寡核苷酸以扩增slr1736ORF的5’末端区域和3’末端区域,其中5’末端为5’-TAATGTGTACATTGTCGGCCTC(1736-5’)(SEQ IDNO61)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCCACAATTCCCCGCACCGTC)(1736-kanpr1)(SEQ ID NO62),3’端为5’-AGGCTAATAAGCACAAATGGGA(1736-3’)(SEQ ID NO63)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGAATTGGTTTAGGTTATCCC(1736-kanpr2)(SEQ ID NO64)。1736-kanpr1和1736-kanpr 2寡核苷酸含有20bp与slr1736ORF相同,另有40bp序列与卡那霉素抗性盒序列相同。完成这些寡核苷酸各自的PCR步骤,产物经凝胶纯化并与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K(Pharmacia),其已被Hinc II消化,并从载体的主链中凝胶纯化出来。连接的片段在没有寡核苷酸时在下列条件下可以装配,该条件为在100μl反应体积中使用pfu聚合酶进行40个循环,每个循环为94℃1分钟、55℃1分钟、72℃1分钟零5秒(Zhao,H和Arnold(1997)Nucleic Acid Res.25(6)1307-1308)。然后,在此装配反应体系中取1μl或者5μl进行扩增,扩增使用嵌套于ORF片段末端的5’和3’的寡核苷酸进行,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21681,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTGCCCAAACCCCATC(SEQ ID NO65)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGGGTAAGCA ACAATGACCGGC(SEQ ID NO66)扩增ubiA5’序列。使用合成寡核苷酸引物5’-GAATTCTCAAAGCCAGCCCAGTAAC(SEQID NO67)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGTGCGAAAAGGGTTTTCCC(SEQ ID NO68)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CCAGTGGTTTAGGCTGTGTGGTC(SEQ ID NO69)和5’-CTGAGTTGGATGTATTGGATC(SEQ ID NO70))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21682,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTACTTCGACAAAAATCC(SEQ ID NO71)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGCTAGGCAACCGCTTAGTAC(SEQ ID NO72)扩增sll 18995’序列。使用合成寡核苷酸引物5’-GAATTCTTAACCCAACAGTAAAGTTCCC(SEQ ID NO73)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGCCGGCATTGTCTTTTACATG(SEQ ID NO74)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GGAACCCTTGCAGCCGCTTC(SEQ ID NO75)和5’-GTATGCCCAACTGGTGCAGAGG(SEQ ID NO76))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21679,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGTCTGACACACAAAATACCG(SEQ ID NO77)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCGCCAATACCAGCCACCAACAG(SEQ ID NO78)扩增slr 0056 5’序列。使用合成寡核苷酸引物5’-GAATTCTCAAATCCCCGCATGGCCTAG(SEQ ID NO79)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGCCTACGGCTTGGACGTGTGGG(SEQ ID NO80)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CACTTGGATTCCCCTGATCTG(SEQ ID NO81)和5’-GCAATACCCGCTTGGAAAACG(SEQ ID NO82))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21677,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成用于制备其它序列集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGACCGAATCTTCGCCCCTAGC(SEQ ID NO83)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCAATCC TAGGTAGCCGAGGCG(SEQ ID NO84)扩增slr1518 5’序列。使用合成寡核苷酸引物5’-GAATTCTTAGCCCAGGCCAGCCCAGCC(SEQ ID NO85)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGGAATTGATTTGTTTAATTACC(SEQ ID NO86)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GCGATCGCCATTATCGCTTGG(SEQ ID NO87)和5’-GCAGACTGGCAATTATCAGTAACG(SEQ ID NO88))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21680,并用于集胞蓝细菌属的转化。B.集胞蓝细菌属的转化将集胞蓝细菌属6803细胞培育至密度约为2×108细胞/ml时离心收集,将细胞微粒重悬浮在新鲜的BG-11培养基(ATCC培养基616)中,密度调整为1×109细胞/ml,马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上,尼龙滤膜放置在BG-11琼脂上,琼脂中加有pH8的TES,使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer,1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞,进行PCR分析以确定破裂的ORF的存在,同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。
对为slr1736和sll1899分离的集胞蓝细菌属中的PCR分析表明突变基因组中发生完全分离,表明在这些菌株中无法检测到任何野生型基因组的复制,这也表明天然基因的功能对细胞的功能并不重要。对这些分离株的HPLC分析表明,sll1899菌株生育酚水平没有可见的减少。但是,在承载slr1736敲除的菌株中没有可检测水平的生育酚。
利用Clustal W对集胞蓝细菌属敲除株的氨基酸序列进行了比较,结果见表3,表中列出了相同性百分比,类似性百分比和差异性百分比。序列的排列在图21中给出。表3


氨基酸序列的比较是在不同拟南芥异戊烯转移酶序列和集胞蓝细菌属序列间进行。比较结果见表4。表中列出了相同性百分比,类似性百分比以及差异性百分比。序列对比结果见图22。表4


4B.slr1737敲除株的制备集胞蓝细菌属种6803slr1737敲除株按下列方法构建利用GPSTM-1 Genome Priming System(New England Biolabs),通过Tn7Transposase系统,将卡那霉素抗性盒插入到slr1737中。集胞蓝细菌属基因组文库克隆的含标靶的orf的652碱基对的质粒被用作靶DNA(集胞蓝细菌属基因组碱基对1324051-1324703;推定orf碱基对为1323672-1324763,Cyanobase注)。按照制造商的草案进行反应。然后将反应混合物转化到大肠杆菌DH 10B electrocompetant细胞中并摊铺。然后筛选转化形成的菌落,以使转位子通过用M13正向和反向通用引物扩增插入靶序列,结果产生了对于全长为约2300碱基对的片段652碱基对+约1700碱基对的产物,即转位子卡那霉素盒的大小。测定结束后需要确定标靶的orf内插入物大约的位点,因为据估计在集胞蓝细菌属中有效的同源重组需要100个碱基对的orf序列。这可以通过扩增反应进行,利用转位子末端的引物Primer S(5’端)或Primer N(3’端),与M13的正向或反向引物结合使用。也就是说,将四种不同的引物结合用于描述可能的基因敲除株的图谱引物S-M13正向、引物S-M13反向、引物N-M13正向、引物N-M13反向。用于转化集胞蓝细菌属和敲除株slr1737的构建株被测定为由一个150个碱基对的slr1737序列(位于插入转位子的5’端)和约500bp的序列(位于插入转位子的3’端)组成,与orf和卡那霉素抗性盒的转录方向一致。slr1737的核酸序列在SEQ ID NO38中给出,推定的氨基酸序列在SEQ ID NO39中给出。
将集胞蓝细菌属6803细胞培育至密度约为2×108细胞/ml时离心收集,将细胞微粒重悬浮在新鲜的BG-11培养基中,密度调整为1×109细胞/ml并马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上,尼龙滤膜放置在BG-11琼脂上,琼脂中添加有pH8的TES,使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer,1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞,进行PCR分析以确定破裂的ORF的存在,同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。
利用slr1737orf末端的引物对集胞蓝细菌属的分离株进行PCR分析,结果显示突变基因组发生彻底分离,表明在这些菌株中检测不到野生型基因组复制。这表明野生型基因对细胞的功能不重要。对基因敲除株slr1737的HPLC分析表明检测不到生育酚产生。4C.植物异戊烯转移酶酶活性分析[3H]尿黑酸的0.1%H3PO4溶液(放射活性40Ci/mmol)。按Joo等(1973)Can.J.Biochem.511527所述方法合成叶绿基焦磷酸。按Soll等(1980)Phytochemistry 19215的方法合成2-甲基-6-叶绿基醌醇和2,3-二甲基-5-叶绿基醌醇。尿黑酸、α,β,δ和γ-生育酚以及母育酚均为商购。
使用起泡空气在30℃、50μE·m-2·s-1荧光和70%相对湿度下,在BG-11培养基上培育野生型集胞蓝细菌属种Pcc6803。在该生物体的slr1736敲除株(潜在的PPT)的生长培养基上补充25μg/ml卡那霉素。收集0.25升到1升培养液中的细胞,5000g离心10分钟,储存在-80℃下。
按照Zak’s的操作方法(Zak等(1999)Eur J.Biochem.261311),稍作改动,分离总膜。细胞在弗氏压碎器上破碎。在弗氏压碎处理前,细胞用溶菌酶在30℃下,在含7mM EDTA、5mM NaCl和10mM Hepes-NaOH的pH7.4的培养基中温育1小时。5000g离心10分钟,收集去壁细菌细胞,将其重悬浮在pH为7.8的0.1-0.5mg叶绿素·mL-1的20mM磷酸钾缓冲液中,在溶液中加入适量的蛋白酶抑制剂混合物和DNA酶I,DNA酶I由Boehinger Mannheim获得。弗氏压碎处理在100MPa下进行2-3次。破碎后,细胞悬浮液在5000g离心10分钟以使未破碎细胞沉淀,随后100,000g离心1小时收集总膜。将最终所得的沉淀重悬浮在含50mM Tris-HCl和4mM MgCl2的缓冲液中。
叶绿体微粒是从250g市售的菠菜叶中分离的。将指定的叶片部分剪下,放入研磨缓冲液中(2L/250g叶片),缓冲液含2mM EDTA、1mM MgCl2、1mM MnCl2,0.33M山梨醇、0.1%抗坏血酸和50mMHepes,pH为7.5。叶片在1L混合器中匀浆三次,每次3秒,然后用四层微孔布过滤。然后上清液在5000g离心6分钟。将叶绿体微粒重悬浮在少量研磨缓冲液中(Douce等Methods in Chloroplast MolecularBiology,239(1982))。
微粒中的叶绿体可以用三种途径破碎。首先按每管1mg叶绿素将叶绿体分装于试管中,在微量离心机中以6000rpm的速度离心2分钟,去除研磨缓冲液。每管中加入200μl Triton X-100缓冲液(0.1%Triton X-100,50mM Tris-HCl,pH7.6和4mM MgCl2)或者是溶胀缓冲液(10mM Tris pH7.6,4mM MgCl2),并在4℃下温育0.5小时,随后破碎的叶绿体微粒马上用于分析。另外,破碎的叶绿体微粒还可以通过在液N2中冷冻或者贮存在-80℃下0.5小时而获得,随后进行分析。
在某些情形下,叶绿体微粒可以进一步用40%/80%percoll梯度进行纯化,以获得完整的叶绿体。完整的叶绿体用溶胀缓冲液破裂,然后或者用于活性分析,或者用于进一步用20.5%/31.8%蔗糖密度梯度纯化被膜(Sol等,1980,supra)。膜部分在100,000g离心40分钟,随后重悬浮在50mM Tris-HCl pH7.6和4mM MgCl2中。
用适量的1Mtris-NaOH pH10混合不同数量的[3H]HGA和40-60μM未标记的HGA(放射活性在0.16-4Ci/mmol范围内),以将pH调至7.6。用痕量的固态NaBH4将HGA还原4分钟。除HGA外,标准的温育混合物(终体积1ml)含有50mM pH为7.6的Tris-HCl、3-5mM MgCl2和100μM叶绿基焦磷酸。反应由加入集胞蓝细菌属总膜、菠菜叶绿体团微粒、菠菜破碎叶绿体或者菠菜被膜开始,酶反应在23℃或30℃、黑暗或光照下进行2小时。反应通过加入液N2冷冻来终止,贮存在-80℃或者直接进行萃取。
向每一分析混合液中加入恒定数量的母育酚,用2ml氯仿/甲醇(1∶2,v/v)萃取反应产物,以得到单相的溶液。其中加入NaCl溶液(2ml;0.9%),剧烈振荡。重复萃取步骤3次。用20μm过滤器过滤含有异戊二烯基醌的有机层,在N2环境下蒸发,随后重悬浮在100μl乙醇中。
样本主要通过正常相HPLC方法(等度的90%己烷和10%甲基-叔丁基醚),使用Zorbax硅胶柱(4.6×250mm)进行分析。样品也可以用反相HPLC方法(等度的0.1%H3PO4的甲醇溶液),使用Vydac201HS54 C18柱(4.6×250mm)并同时使用All-tech C18防护柱进行分析。产物的量基于底物的放射活性进行计算,基于内标的量,按照回收百分比进行调整。
叶绿素的量按照Amon(1949)Plant Physiol.241描述的方法进行测定。蛋白质的含量用Bradford法,用γ球蛋白作为标准物进行测定(Bradford,(1976)Anal.Biochem.72248)。
分析结果证明,在制备集胞蓝细菌属slr1736敲除株中生成了2-甲基-6-叶绿基质体醌。slr1736敲除株的叶绿基异戊烯转移酶活性的分析结果在图23中给出。4D.ATPT2对slr1736基因敲除株的功能补偿为检测ATPT2能否补偿集胞蓝细菌属6803基因敲除株slr1736的功能,构建了表达ATPT2序列的质粒,其启动子为TAC。载体质粒psl1211来自于Washington大学Dr.Himadri Pakrasi实验室,此质粒是在质粒RSF1010基础上改进的,RSF1010具有宽范围的宿主(NgW.O.,Zentella R.,Wang.Y.,Taylor J-S.A.,Pakrasi,H.B.2000。PhrA,集胞蓝细菌属种PCC 6803植株中主要的光反应因子编码环丁烷-嘧啶二聚体特异性DNA光裂解酶(待发表))。通过PCR技术,利用下述引物可以将ATPT2基因从载体pCGN10817中分离出来ATPT2 nco.pr.5’-CCATGGATTCGAGTAAAGTTGTCGC(SEQ IDNO89);ATPT2 ri.pr 5’-GAATTCACTTCAAAAAAGGTAACAG(SEQ ID NO90)。这些引物除去了ATPT2序列5’端大约112bp,这段DNA被认为是叶绿体的转运肽。这些引物还在5’末端引入了NcoI位点,3,末端引入了EcoR I位点,以便能使其亚克隆至后一载体。将使用这些引物所得的PCR产物和pCGN10817连接到pGEM T easy中,得到载体pMON21689,用M13正向和反向引物进行测序,验证序列正确与否。然后将pMON21689的NcoI/EcoRI片段与psl1211的EagI/EcoRI和EagI/NcoI片段连接。通过接合作用将质粒pMON21690引入slr1736集胞蓝细菌属6803 KO植株。s1906细胞(一种辅助菌株)和含pMON21690的DH10B细胞培育至对数期(O.D.600=0.4),通过离心收集1ml细胞。用无菌BG-11溶液将细胞微粒冲洗2次,然后重悬浮在200μlBG-11中。在灭菌Eppendorf管中混合下列溶液50μl SL906、50μl含pMON21690的DH10B和100μL新鲜的slr1736集胞蓝细菌属6803KO菌株(O.D.730=0.2-0.4)培养物。马上将细胞混合物转移至置于BG-11上的硝酸纤维素膜,在30℃、2500LUX(50μe)光照下温育24小时。然后将滤液转移至添加10μg/ml庆大霉素的BG-11上,如上述方法温育约5天。当菌落出现时,挑取菌落,培养在BG-11+10μg/ml庆大霉素液体培养基中(Elhai,J.和Wolk,P.1988.Conjugal tranfer ofDNA to Cyanobacteria.Methods in Enzymology167747-54)。然后离心收集1ml液体培养物,用乙醇/邻苯三酚萃取,HPLC分离,分析生育酚含量。Slr1736集胞蓝细菌属6803 KO菌株不含有可检测的生育酚,而用pMON21690转化的Slr1736集胞蓝细菌属6803 KO菌株含有可检测的α-生育酚。用psl1211(载体对照)转化的集胞蓝细菌属6803株也同样产生α-生育酚。实施例5转基因植物分析用高压液相色谱(HPLC)分析经ATPT蛋白有义或反义表达构建体转化的拟南芥属植物,以检测总生育酚及特定的生育酚(α-、β-、γ-及δ-生育酚)水平的改变。
按照下述方法制备用于HPLC的叶子与种子提取物对于种子提取物,在一消毒微量离心管中加入10mg种子、1g微珠(Biospec)和500μl 1%邻苯三酚(Sigma Chem)的乙醇溶液。混合物于一小珠搅拌器(Bcadbeater,Biospec)内快速震荡3分钟。然后将提取物经0.2μm滤膜过滤至自动样品收集管中。过滤的提取物按下述方法用于HPLC分析。
叶子萃取物是这样制备的用在萃取前将30-50mg叶子组织与1g微珠混合后在液氮中冷冻。萃取时将500μl 1%邻苯三酚的乙醇溶液加入叶子/微珠混合物中,并在珠搅拌器(Biospec)上快速摇动1分钟。最终形成的混合物于14000rpm离心4分钟,并在HPLC分析之前按上述方法过滤。
HPLC的操作中使用的是4.6mm×250mm的HPLC Zorbax硅胶柱,其具有荧光检测器、带通滤波器和狭缝光栅,激发波长为290nm,发射波长为336nm。溶剂A是己烷,溶剂B是甲基叔丁基醚。进样体积为20μl,流速为1.5ml/min,采用梯度洗脱(表5),洗脱时间是12min(40℃)。表5

溶于1%邻苯三酚/乙醇溶液的生育酚标准品也同时进样作为对照(包括α-、γ-、β-、δ-生育酚及生育酚(母育酚))(均来自于Matreya)。
α-、β-、δ-、γ-生育酚的标准曲线采用Chemstation软件计算。组分X的绝对含量如下计算X的绝对量=响应值x×RFx×稀释因子,响应值x是组分X峰下面积,RFx是组分X的响应因子(含量x/响应值x),稀释因子是500μl。而ng/mg组织是指总ng组分/mg植物组织。
含有pMON10822质粒从napin启动子开始表达ATAT2序列的转基因拟南芥属种子提取物的HPLC分析结果见图24。
从napin启动子(pMON10822质粒)开始表达ATAT2序列的拟南芥属种子组织的HPLC分析结果说明种子中生育酚水平增加了。其总生育酚水平比未转化(野生型)拟南芥属植物的总生育酚水平增加了50-60%之多(图24)。
另外,特定生育酚的水平在从napin启动子开始表达ATAT2核酸序列的转基因拟南芥属植物中也是增高的。这些植株中的δ-生育酚水平比野生型拟南芥属植株种子中的δ-生育酚水平增加3倍还多。在表达ATAT2核酸序列的转基因拟南芥属植株中γ-生育酚水平比非转基因对照植株中的γ-生育酚水平增加了近60%之多。另外,α-生育酚水平比非转基因对照植株中的α-生育酚水平增加了3倍之多。
含有pMON10803质粒从增强的35S启动子开始表达ATAT2序列的转基因拟南芥属植株种子提取物的HPLC分析结果见图25。
本专利说明书中提到的所有出版物和专利申请都代表了与本发明有关的领域的技术人员的技术水平。所有出版物及专利申请在此以相同的程度被引用作为参考,每个出版物或专利申请都被具体地且独立地引用作为参考。
尽管为了能够更清晰地理解,已经通过图示说明和例证的方法对上述发明的细节加以描述,但显然在所附的权利要求范围内还可以做某些改变和修改。
序列表序列表<110>M·拉斯纳M·波斯特-比特恩米勒B·萨维季J·韦斯<120>编码参与生育酚合成的蛋白质的核酸序列<130>17133/00/WO<150>60/129,899<151>1999-04-15<150>60/146,461<151>1999-07-30<150>PCT/US00/10368<151>2000-04-14<160>94<170>FastSEQ for Windows Version 4.0<210>1<211>1182<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>1atggagtctc tgctctctag ttcttctctt gtttccgctg ctggtgggtt ttgttggaag 60aagcagaatc taaagctcca ctctttatca gaaatccgag ttctgcgttg tgattcgagt 120aaagttgtcg caaaaccgaa gtttaggaac aatcttgtta ggcctgatgg tcaaggatct 180tcattgttgt tgtatccaaa acataagtcg agatttcggg ttaatgccac tgcgggtcag 240cctgaggctt tcgactcgaa tagcaaacag aagtctttta gagactcgtt agatgcgttt 300tacaggtttt ctaggcctca tacagttatt ggcacagtgc ttagcatttt atctgtatct 360ttcttagcag tagagaaggt ttctgatata tctcctttac ttttcactgg catcttggag 420gctgttgttg cagctctcat gatgaacatt tacatagttg ggctaaatca gttgtctgat 480gttgaaatag ataaggttaa caagccctat cttccattgg catcaggaga atattctgtt 540aacaccggca ttgcaatagt agcttccttc tccatcatga gtttctggct tgggtggatt 600gttggttcat ggccattgtt ctgggctctt tttgtgagtt tcatgctcgg tactgcatac 660tctatcaatt tgccactttt acggtggaaa agatttgcat tggttgcagc aatgtgtatc 720ctcgctgtcc gagctattat tgttcaaatc gccttttatc tacatattca gacacatgtg 780tttggaagac caatcttgtt cactaggcct cttattttcg ccactgcgtt tatgagcttt 840ttctctgtcg ttattgcatt gtttaaggat atacctgata tcgaagggga taagatattc 900ggaatccgat cattctctgt aactctgggt cagaaacggg tgttttggac atgtgttaca 960ctacttcaaa tggcttacgc tgttgcaatt ctagttggag ccacatctcc attcatatgg1020agcaaagtca tctcggttgt gggtcatgtt atactcgcaa caactttgtg ggctcgagct1080aagtccgttg atctgagtag caaaaccgaa ataacttcat gttatatgtt catatggaag1140ctcttttatg cagagtactt gctgttacct tttttgaagt ga 1182<210>2<211>393<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>2Met Glu Ser Leu Leu Ser Ser Ser Ser Leu Val Ser Ala Ala Gly Gly1 5 10 15Phe Cys Trp Lys Lys Gln Asn Leu Lys Leu His Ser Leu Ser Glu Ile20 25 30Arg Val Leu Arg Cys Asp Ser Ser Lys Val Val Ala Lys Pro Lys Phe35 40 45Arg Asn Asn Leu Val Arg Pro Asp Gly Gln Gly Ser Ser Leu Leu Leu50 55 60Tyr Pro Lys His Lys Ser Arg Phe Arg Val Asn Ala Thr Ala Gly Gln65 70 75 80Pro Glu Ala Phe Asp Ser Asn Ser Lys Gln Lys Ser Phe Arg Asp Ser85 90 95Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile Gly Thr100 105 110Val Leu Ser Ile Leu Ser Val Ser Phe Leu Ala Val Glu Lys Val Ser115 120 125Asp Ile Ser Pro Leu Leu Phe Thr Gly Ile Leu Glu Ala Val Val Ala130 135 140Ala Leu Met Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp145 150 155 160Val Glu Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly165 170 175Glu Tyr Ser Val Asn Thr Gly Ile Ala Ile Val Ala Ser Phe Ser Ile180 185 190Met Ser Phe Trp Leu Gly Trp Ile Val Gly Ser Trp Pro Leu Phe Trp195 200 205Ala Leu Phe Val Ser Phe Met Leu Gly Thr Ala Tyr Ser Ile Asn Leu210 215 220Pro Leu Leu Arg Trp Lys Arg Phe Ala Leu Val Ala Ala Met Cys Ile225 230 235 240Leu Ala Val Arg Ala Ile Ile Val Gln Ile Ala Phe Tyr Leu His Ile245 250 255Gln Thr His Val Phe Gly Arg Pro Ile Leu Phe Thr Arg Pro Leu Ile260 265 270Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala Leu Phe275 280 285Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser290 295 300Phe Ser Val Thr Leu Gly Gln Lys Arg Val Phe Trp Thr Cys Val Thr305 310 315 320Leu Leu Gln Met Ala Tyr Ala Val Ala Ile Leu Val Gly Ala Thr Ser325 330 335Pro Phe Ile Trp Ser Lys Val Ile Ser Val Val Gly His Val Ile Leu340 345 350Ala Thr Thr Leu Trp Ala Arg Ala Lys Ser Val Asp Leu Ser Ser Lys355 360 365Thr Glu Ile Thr Ser Cys Tyr Met Phe Ile Trp Lys Leu Phe Tyr Ala370 375 380Glu Tyr Leu Leu Leu Pro Phe Leu Lys385 390<210>3<211>1224<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>3atggcgtttt ttgggctctc ccgtgtttca agacggttgt tgaaatcttc cgtctccgta 60actccatctt cttcctctgc tcttttgcaa tcacaacata aatccttgtc caatcctgtg 120actacccatt acacaaatcc tttcactaag tgttatcctt catggaatga taattaccaa 180gtatggagta aaggaagaga attgcatcag gagaagtttt ttggtgttgg ttggaattac 240agattaattt gtggaatgtc gtcgtcttct tcggttttgg agggaaagcc gaagaaagat 300gataaggaga agagtgatgg tgttgttgtt aagaaagctt cttggataga tttgtattta 360ccagaagaag ttagaggtta tgctaagctt gctcgattgg ataaacccat tggaacttgg 420ttgcttgcgt ggccttgtat gtggtcgatt gcgttggctg ctgatcctgg aagccttcca 480agttttaaat atatggcttt atttggttgc ggagcattac ttcttagagg tgctggttgt 540actataaatg atctgcttga tcaggacata gatacaaagg ttgatcgtac aaaactaaga 600cctatcgcca gtggtctttt gacaccattt caagggattg gatttctcgg gctgcagttg 660cttttaggct tagggattct tctccaactt aacaattaca gccgtgtttt aggggcttca 720tctttgttac ttgtcttttc ctacccactt atgaagaggt ttacattttg gcctcaagcc 780tttttaggtt tgaccataaa ctggggagca ttgttaggat ggactgcagt taaaggaagc 840atagcaccat ctattgtact ccctctctat ctctccggag tctgctggac ccttgtttat 900gatactattt atgcacatca ggacaaagaa gatgatgtaa aagttggtgt taagtcaaca 960gcccttagat tcggtgataa tacaaagctt tggttaactg gatttggcac agcatccata1020ggttttcttg cactttctgg attcagtgca gatctcgggt ggcaatatta cgcatcactg1080gccgctgcat caggacagtt aggatggcaa atagggacag ctgacttatc atctggtgct1140gactgcagta gaaaatttgt gtcgaacaag tggtttggtg ctattatatt tagtggagtt1200gtacttggaa gaagttttca ataa 1224<210>4<211>407<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>4Met Ala Phe Phe Gly Leu Ser Arg Val Ser Arg Arg Leu Leu Lys Ser1 5 10 15Ser Val Ser Val Thr Pro Ser Ser Ser Ser Ala Leu Leu Gln Ser Gln20 25 30His Lys Ser Leu Ser Asn Pro Val Thr Thr His Tyr Thr Asn Pro Phe35 40 45Thr Lys Cys Tyr Pro Ser Trp Asn Asp Asn Tyr Gln Val Trp Ser Lys50 55 60Gly Arg Glu Leu His Gln Glu Lys Phe Phe Gly Val Gly Trp Asn Tyr65 70 75 80Arg Leu Ile Cys Gly Met Ser Ser Ser Ser Ser Val Leu Glu Gly Lys85 90 95Pro Lys Lys Asp Asp Lys Glu Lys Ser Asp Gly Val Val Val Lys Lys100 105 110Ala Ser Trp Ile Asp Leu Tyr Leu Pro Glu Glu Val Arg Gly Tyr Ala115 120 125Lys Leu Ala Arg Leu Asp Lys Pro Ile Gly Thr Trp Leu Leu Ala Trp130 135 140Pro Cys Met Trp Ser Ile Ala Leu Ala Ala Asp Pro Gly Ser Leu Pro145 150 155 160Ser Phe Lys Tyr Met Ala Leu Phe Gly Cys Gly Ala Leu Leu Leu Arg165 170 175Gly Ala Gly Cys Thr Ile Asn Asp Leu Leu Asp Gln Asp Ile Asp Thr180 185 190Lys Val Asp Arg Thr Lys Leu Arg Pro Ile Ala Ser Gly Leu Leu Thr195 200 205Pro Phe Gln Gly Ile Gly Phe Leu Gly Leu Gln Leu Leu Leu Gly Leu210 215 220Gly Ile Leu Leu Gln Leu Asn Asn Tyr Ser Arg Val Leu Gly Ala Ser225 230 235 240Ser Leu Leu Leu Val Phe Ser Tyr Pro Leu Met Lys Arg Phe Thr Phe245 250 255Trp Pro Gln Ala Phe Leu Gly Leu Thr Ile Asn Trp Gly Ala Leu Leu260 265 270Gly Trp Thr Ala Val Lys Gly Ser Ile Ala Pro Ser Ile Val Leu Pro275 280 285Leu Tyr Leu Set Gly Val Cys Trp Thr Leu Val Tyr Asp Thr Ile Tyr290 295 300Ala His Gln Asp Lys Glu Asp Asp Val Lys Val Gly Val Lys Ser Thr305 310 315 320Ala Leu Arg Phe Gly Asp Asn Thr Lys Leu Trp Leu Thr Gly Phe Gly325 330 335Thr Ala Ser Ile Gly Phe Leu Ala Leu Ser Gly Phe Ser Ala Asp Leu340 345 350Gly Trp Gln Tyr Tyr Ala Ser Leu Ala Ala Ala Ser Gly Gln Leu Gly355 360 365Trp Gln Ile Gly Thr Ala Asp Leu Ser Ser Gly Ala Asp Cys Ser Arg370 375 380Lys Phe Val Ser Asn Lys Trp Phe Gly Ala Ile Ile Phe Ser Gly Val385 390 395 400Val Leu Gly Arg Ser Phe Gln405<210>5<211>1296<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>5atgtggcgaa gatctgttgt ttctcgttta tcttcaagaa tctctgtttc ttcttcgtta 60ccaaacccta gactgattcc ttggtcccgc gaattatgtg ccgttaatag cttctcccag 120cctccggtct cgacggaatc aactgctaag ttagggatca ctggtgttag atctgatgcc 180aatcgagttt ttgccactgc tactgccgcc gctacagcta cagctaccac cggtgagatt 240tcgtctagag ttgcggcttt ggctggatta gggcatcact acgctcgttg ttattgggag 300ctttctaaag ctaaacttag tatgcttgtg gttgcaactt ctggaactgg gtatattctg 360ggtacgggaa atgctgcaat tagcttcccg gggctttgtt acacatgtgc aggaaccatg 420atgattgctg catctgctaa ttccttgaat cagatttttg agataagcaa tgattctaag 480atgaaaagaa cgatgctaag gccattgcct tcaggacgta ttagtgttcc acacgctgtt 540gcatgggcta ctattgctgg tgcttctggt gcttgtttgt tggccagcaa gactaatatg 600ttggctgctg gacttgcatc tgccaatctt gtactttatg cgtttgttta tactccgttg 660aagcaacttc accctatcaa tacatgggtt ggcgctgttg ttggtgctat cccacccttg 720cttgggtggg cggcagcgtc tggtcagatt tcatacaatt cgatgattct tccagctgct 780ctttactttt ggcagatacc tcattttatg gcccttgcac atctctgccg caatgattat 840gcagctggag gttacaagat gttgtcactc tttgatccgt cagggaagag aatagcagca 900gtggctctaa ggaactgctt ttacatgatc cctctcggtt tcatcgccta tgactggggg 960ttaacctcaa gttggttttg cctcgaatca acacttctca cactagcaat cgctgcaaca1020gcattttcat tctaccgaga ccggaccatg cataaagcaa ggaaaatgtt ccatgccagt1080cttctcttcc ttcctgtttt catgtctggt cttcttctac accgtgtctc taatgataat1140cagcaacaac tcgtagaaga agccggatta acaaattctg tatctggtga agtcaaaact1200cagaggcgaa agaaacgtgt ggctcaacct ccggtggctt atgcctctgc tgcaccgttt1260cctttcctcc cagctccttc cttctactct ccatga 1296<210>6<211>431<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>6Met Trp Arg Arg Ser Val Val Tyr Arg Phe Ser Ser Arg Ile Ser Val1 5 l0 15Ser Ser Ser Leu Pro Asn Pro Arg Leu Ile Pro Trp Ser Arg Glu Leu20 25 30Cys Ala Val Asn Ser Phe Ser Gln Pro Pro Val Ser Thr Glu Ser Thr35 40 45Ala Lys Leu Gly Ile Thr Gly Val Arg Ser Asp Ala Asn Arg Val Phe50 55 60Ala Thr Ala Thr Ala Ala Ala Thr Ala Thr Ala Thr Thr Gly Glu Ile65 70 75 80Ser Ser Arg Val Ala Ala Leu Ala Gly Leu Gly His His Tyr Ala Arg85 90 95Cys Tyr Trp Glu Leu Ser Lys Ala Lys Leu Ser Met Leu Val Val Ala100 105 110Thr Ser Gly Thr Gly Tyr Ile Leu Gly Thr Gly Asn Ala Ala Ile Ser115 120 125Phe Pro Gly Leu Cys Tyr Thr Cys Ala Gly Thr Met Met Ile Ala Ala130 135 140Ser Ala Asn Ser Leu Asn Gln Ile Phe Glu Ile Ser Asn Asp Ser Lys145 150 155 160Met Lys Arg Thr Met Leu Arg Pro Leu Pro Ser Gly Arg Ile Ser Val165 170 175Pro His Ala Val Ala Trp Ala Thr Ile Ala Gly Ala Ser Gly Ala Cys180 185 190Leu Leu Ala Ser Lys Thr Asn Met Leu Ala Ala Gly Leu Ala Ser Ala195 200 205Asn Leu Val Leu Tyr Ala Phe Val Tyr Thr Pro Leu Lys Gln Leu His210 215 220Pro Ile Asn Thr Trp Val Gly Ala Val Val Gly Ala Ile Pro Pro Leu225 230 235 240Leu Gly Trp Ala Ala Ala Ser Gly Gln Ile Ser Tyr Asn Ser Met Ile245 250 255Leu Pro Ala Ala Leu Tyr Phe Trp Gln Ile Pro His Phe Met Ala Leu260 265 270Ala His Leu Cys Arg Asn Asp Tyr Ala Ala Gly Gly Tyr Lys Met Leu275 280 285Ser Leu Phe Asp Pro Ser Gly Lys Arg Ile Ala Ala Val Ala Leu Arg290 295 300Asn Cys Phe Tyr Met Ile Pro Leu Gly Phe Ile Ala Tyr Asp Trp Gly305 310 315 320Leu Thr Ser Ser Trp Phe Cys Leu Glu Ser Thr Leu Leu Thr Leu Ala325 330 335Ile Ala Ala Thr Ala Phe Ser Phe Tyr Arg Asp Arg Thr Met His Lys340 345 350Ala Arg Lys Met Phe His Ala Ser Leu Leu Phe Leu Pro Val Phe Met355 360 365Ser Gly Leu Leu Leu His Arg Val Ser Asn Asp Asn Gln Gln Gln Leu370 375 380Val Glu Glu Ala Gly Leu Thr Asn Ser Val Ser Gly Glu Val Lys Thr385 390 395 400Gln Arg Arg Lys Lys Arg Val Ala Gln Pro Pro Val Ala Tyr Ala Ser405 410 415Ala Ala Pro Phe Pro Phe Leu Pro Ala Pro Ser Phe Tyr Ser Pro420 425 430<210>7<211>479<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>7ggaaactccc ggagcacctg tttgcaggta ccgctaacct taatcgataa tttatttctc 60ttgtcaggaa ttatgtaagt ctggtggaag gctcgcatac catttttgca ttgcctttcg 120ctatgatcgg gtttactttg ggtgtgatga gaccaggcgt ggctttatgg tatggcgaaa 180acccattttt atccaatgct gcattccctc ccgatgattc gttctttcat tcctatacag 240gtatcatgct gataaaactg ttactggtac tggtttgtat ggtatcagca agaagcgcgg 300cgatggcgtt taaccggtat ctcgacaggc attttgacgc gaagaacccg cgtactgcca 360tccgtgaaat acctgcgggc gtcatatctg ccaacagtgc gctggtgttt acgataggct 420gctgcgtggt attctgggtg gcctgttatt tcattaacac gatctgtttt tacctggcg 479<210>8<211>551<212>DNA<213>拟南芥属种(Arabidopsis sp)<220><221>misc_feature<222>(1)...(551)<223>n=A,T,C or G<400>8ttgtggctta caccttaatg agcatacgcc agnccattac ggctcgttaa tcggcgccat 60ngccggngct gntgcaccgg tagtgggcta ctgcgccgtg accaatcagc ttgatctagc 120ggctcttatt ctgtttttaa ttttactgtt ctggcaaatg ccgcattttt acgcgatttc 180cattttcagg ctaaaagact tttcagcggc ctgtattccg gtgctgccca tcattaaaga 240cctgcgctat accaaaatca gcatgctggt ttacgtgggc ttatttacac tggctgctat 300catgccggcc ctcttagggt atgccggttg gatttatggg atagcggcct taattttagg 360cttgtattgg ctttatattg ccatacaagg attcaagacc gccgatgatc aaaaatggtc 420tcgtaagatg tttggatctt cgattttaat cattaccctc ttgtcggtaa tgatgcttgt 480ttaaacttac tgcctcctga agtttatata tcgataattt cagcttaagg aggcttagtg 540gttaattcaa t 551<210>9<211>297<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>9Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe1 5 10 15Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu20 25 30Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly35 40 45Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly50 55 60Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp65 70 75 80Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn85 90 95Val Val Met Gly Asn Lys Val Val Ala Leu Leu Ala Thr Ala Val Glu100 105 110His Leu Val Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln115 120 125Arg Tyr Ser Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala130 135 140Ser Leu Ile Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln145 150 155 160Thr Ala Glu Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly165 170 175Leu Ala Phe Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser180 185 190Ala Ser Leu Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile195 200 205Thr Ala Pro Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu210 215 220Val Val Asp Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu225 230 235 240Glu Tyr Leu Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala245 250 255Met Glu His Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu260 265 270Thr Asp Asn Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu275 280 285Thr His Arg Val Ile Thr Arg Asn Lys290 295<210>10<211>561<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>10aagcgcatcc gtcctcttct acgattgccg ccagccgcat gtatggctgc ataaccgacc 60gcccctatcc gctcgcggcc gcggtcgaat tcattcacac cgcgacgctg ctgcatgacg 120acgtcgtcga tgaaagcgat ttgcgccgcg gccgcgaaag cgcgcataag gttttcggca 180atcaggcgag cgtgctcgtc ggcgatttcc ttttctcccg cgccttccag ctgatggtgg 240aagacggctc gctcgacgcg ctgcgcattc tctcggatgc ctccgccgtg atcgcgcagg 300gcgaagtgat gcagctcggc accgcgcgca atcttgaaac caatatgagc cagtatctcg 360atgtgatcag cgcgaagacc gccgcgctct ttgccgccgc ctgcgaaatc ggcccggtga 420tggcgaacgc gaaggcggaa gatgctgccg cgatgtgcga atacggcatg aatctcggta 480tcgccttcca gatcatcgac gaccttctcg attacggcac cggcggccac gccgagcttg 540gcaagaacac gggcgacgat t 561<210>11<211>966<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>11atggtacttg ccgaggttcc aaagcttgcc tctgctgctg agtacttctt caaaaggggt 60gtgcaaggaa aacagtttcg ttcaactatt ttgctgctga tggcgacagc tctgaatgta 120cgcgttccag aagcattgat tggggaatca acagatatag tcacatcaga attacgcgta 180aggcaacggg gtattgctga aatcactgaa atgatacacg tcgcaagtct actgcacgat 240gatgtcttgg atgatgccga tacaaggcgt ggtgttggtt ccttaaatgt tgtaatgggt 300aacaagatgt cggtattagc aggagacttc ttgctctccc gggcttgtgg ggctctcgct 360gctttaaaga acacagaggt tgtagcatta cttgcaactg ctgtagaaca tcttgttacc 420ggtgaaacca tggaaataac tagttcaacc gagcagcgtt atagtatgga ctactacatg 480cagaagacat attataagac agcatcgcta atctctaaca gctgcaaagc tgttgccgtt 540ctcactggac aaacagcaga agttgccgtg ttagcttttg agtatgggag gaatctgggt 600ttagcattcc aattaataga cgacattctt gatttcacgg gcacatctgc ctctctcgga 660aagggatcgt tgtcagatat tcgccatgga gtcataacag ccccaatcct ctttgccatg 720gaagagtttc ctcaactacg cgaagttgtt gatcaagttg aaaaagatcc taggaatgtt 780gacattgctt tagagtatct tgggaagagc aagggaatac agagggcaag agaattagcc 840atggaacatg cgaatctagc agcagctgca atcgggtctc tacctgaaac agacaatgaa 900gatgtcaaaa gatcgaggcg ggcacttatt gacttgaccc atagagtcat caccagaaac 960aagtga966<210>12<211>321<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>12Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe1 5 10 15Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu20 25 30Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly35 40 45Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly50 55 60Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp65 70 75 80Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn85 90 95Val Val Met Gly Asn Lys Met Ser Val Leu Ala Gly Asp Phe Leu Leu100 105 110Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr Glu Val Val115 120 125Ala Leu Leu Ala Thr Ala Val Glu His Leu Val Thr Gly Glu Thr Met
130 135 140Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser Met Asp Tyr Tyr Met145 150 155 160Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys165 170 175Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu Val Ala Val Leu Ala180 185 190Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe Gln Leu Ile Asp Asp195 200 205Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu210 215 220Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro Ile Leu Phe Ala Met225 230 235 240Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp Gln Val Glu Lys Asp245 250 255Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys Ser Lys Gly260 265 270Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn Leu Ala Ala275 280 285Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn Glu Asp Val Lys Arg290 295 300Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg Val Ile Thr Arg Asn305 310 315 320Lys<210>13<211>621<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>13gctttctcct ttgctaattc ttgagctttc ttgatcccac cgcgatttct aactatttca 60atcgcttctt caagcgatcc aggctcacaa aactcagact caatgatctc tcttagcctt 120ggctcattct ctagcgcgaa gatcactggc gccgttatgt tacctttggc taagtcatta 180gctgcaggct tacctaactg ctctgtggac tgagtgaagt ccagaatgtc atcaactact 240tgaaaagata aaccgagatt cttcccgaac tgatacattt gctctgcgac cttgctttcg 300actttactga aaattgctgc tcctttggtg cttgcagcta ctaatgaagc tgtcttgtag 360taactcttta gcatgtagtc atcaagcttg acatcacaat cgaataaact cgatgcttgc 420tttatctcac cgcttgcaaa atctttgatc acctgcaaaa agataaatca agattcagac 480caaatgttct ttgtattgag tagcttcatc taatctcaga aaggaatatt acctgactta 540tgagcttaat gacttcaagg ttttcgagat ttgtaagtac catgatgctt gagcaacatg 600aaatccccag ctaatacagc t 621<210>14<211>741<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>14ggtgagtttt gttaatagtt atgagattca tctatttttg tcataaaatt gtttggtttg 60gtttaaactc tgtgtataat tgcaggaaag gaaacagttc atgagctttt cggcacaaga 120gtagcggtgc tagctggaga tttcatgttt gctcaagcgt catggtactt agcaaatctc 180gagaatcttg aagttattaa gctcatcagt caggtactta gttactctta cattgttttt 240ctatgaggtt gagctatgaa tctcatttcg ttgaataatg ctgtgcctca aacttttttt 300catgttttca ggtgatcaaa gactttgcaa gcggagagat aaagcaggcg tccagcttat 360ttgactgcga caccaagctc gacgagtact tactcaaaag tttctacaag acagcctctt 420tagtggctgc gagcaccaaa ggagctgcca ttttcagcag agttgagcct gatgtgacag 480aacaaatgta cgagtttggg aagaatctcg gtctctcttt ccagatagtt gatgatattt 540tggatttcac tcagtcgaca gagcagctcg ggaagccagc agggagtgat ttggctaaag 600gtaacttaac agcacctgtg attttcgctc tggagaggga gccaaggcta agagagatca 660ttgagtcaaa gttctgtgag gcgggttctc tggaagaagc gattgaagcg gtgacaaaag 720gtggggggat taagagagca c 741<210>15<211>1087<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>15cctcttcagc caatccagag gaagaagaga caacttttta tctttcgtca agagtctccg 60aaaacgcacg gttttatgct ctctcttctg ccctcacctc acaagacgca gggcacatga 120ttcaaccaga gggaaaaagc aacgataaca actctgcttt tgatttcaag ctgtatatga 180tccgcaaagc cgagtctgta aatgcggctc tcgacgtttc cgtaccgctt ctgaaacccc 240ttacgatcca agaagcggtc aggtactctt tgctagccgg cggaaaacgt gtgaggcctc 300tgctctgcat tgccgcttgt gagcttgtgg ggggcgacga ggctactgcc atgtcagccg 360cttgcgcggt cgagatgatc cacacaagct ctctcattca tgacgatctt ccgtgcatgg 420acaatgccga cctccgtaga ggcaagccca ccaatcacaa ggtatgttgt ttaattatat 480gaaggctcag agataatgct gaactagtgt tgaaccaatt tttgctcaaa caaggtatat 540ggagaagaca tggcggtttt ggcaggtgat gcactccttg cattggcgtt tgagcacatg 600acggttgtgt cgagtgggtt ggtcgctccc gagaagatga ttcgcgccgt ggttgagctg 660gccagggcca tagggactac agggctagtt gctggacaaa tgatagacct agccagcgaa 720agactgaatc cagacaaggt tggattggag catctagagt tcatccatct ccacaaaacg 780gcggcattgt tggaggcagc ggcagtttta ggggttataa tgggaggtgg aacagaggaa 840gaaatcgaaa agcttagaaa gtatgctagg tgtattggac tactgtttca ggttgttgat 900gacattctcg acgtaacaaa atctactgag gaattgggta agacagccgg aaaagacgta 960atggccggaa agctgacgta tccaaggctg ataggtttgg agggatccag ggaagttgca1020gagcacctga ggagagaagc agaggaaaag cttaaagggt ttgatccaag tcaggcggcg1080cctctgg 1087<210>16<211>1164<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>16atgacttcga ttctcaacac tgtctccacc atccactctt ccagagttac ctccgtcgat 60cgagtcggag tcctctctct tcggaattcg gattccgttg agttcactcg ccggcgttct 120ggtttctcga cgttgatcta cgaatcaccc gggcggagat ttgttgtgcg tgcggcggag 180actgatactg ataaagttaa atctcagaca cctgacaagg caccagccgg tggttcaagc 240attaaccagc ttctcggtat caaaggagca tctcaagaaa ctaataaatg gaagattcgt 300cttcagctta caaaaccagt cacttggcct ccactggttt ggggagtcgt ctgtggtgct 360gctgcttcag ggaactttca ttggacccca gaggatgttg ctaagtcgat tctttgcatg 420atgatgtctg gtccttgtct tactggctat acacagacaa tcaacgactg gtatgataga 480gatatcgacg caattaatga gccatatcgt ccaattccat ctggagcaat atcagagcca 540gaggttatta cacaagtctg ggtgctatta ttgggaggtc ttggtattgc tggaatatta 600gatgtgtggg cagggcatac cactcccact gtcttctatc ttgctttggg aggatcattg 660ctatcttata tatactctgc tccacctctt aagctaaaac aaaatggatg ggttggaaat 720tttgcacttg gagcaagcta tattagtttg ccatggtggg ctggccaagc attgtttggc 780actcttacgc cagatgttgt tgttctaaca ctcttgtaca gcatagctgg gttaggaata 840gccattgtta acgacttcaa aagtgttgaa ggagatagag cattaggact tcagtctctc 900ccagtagctt ttggcaccga aactgcaaaa tggatatgcg ttggtgctat agacattact 960cagctttctg ttgccggata tctattagca tctgggaaac cttattatgc gttggcgttg1020gttgctttga tcattcctca gattgtgttc cagtttaaat actttctcaa ggaccctgtc1080aaatacgacg tcaagtacca ggcaagcgcg cagccattct tggtgctcgg aatatttgta1140acggcattag catcgcaaca ctga 1164<210>17<211>387<212>PRT<213>拟南芥属种(Arabidopsis sp)<400>17Met Thr Ser Ile Leu Asn Thr Val Ser Thr Ile His Ser Ser Arg Val1 5 10 15Thr Ser Val Asp Arg Val Gly Val Leu Ser Leu Arg Asn Ser Asp Ser20 25 30Val Glu Phe Thr Arg Arg Arg Ser Gly Phe Ser Thr Leu Ile Tyr Glu35 40 45Ser Pro Gly Arg Arg Phe Val Val Arg Ala Ala Glu Thr Asp Thr Asp50 55 60Lys Val Lys Ser Gln Thr Pro Asp Lys Ala Pro Ala Gly Gly Ser Ser65 70 75 80Ile Asn Gln Leu Leu Gly Ile Lys Gly Ala Ser Gln Glu Thr Asn Lys85 90 95Trp Lys Ile Arg Leu Gln Leu Thr Lys Pro Val Thr Trp Pro Pro Leu100 105 110Val Trp Gly Val Val Cys Gly Ala Ala Ala Ser Gly Asn Phe His Trp115 120 125Thr Pro Glu Asp Val Ala Lys Ser Ile Leu Cys Met Met Met Ser Gly130 135 140Pro Cys Leu Thr Gly Tyr Thr Gln Thr Ile Asn Asp Trp Tyr Asp Arg145 150 155 160Asp Ile Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala165 170 175Ile Ser Glu Pro Glu Val Ile Thr Gln Val Trp Val Leu Leu Leu Gly180 185 190Gly Leu Gly Ile Ala Gly Ile Leu Asp Val Trp Ala Gly His Thr Thr195 200 205Pro Thr Val Phe Tyr Leu Ala Leu Gly Gly Ser Leu Leu Ser Tyr Ile210 215 220Tyr Ser Ala Pro Pro Leu Lys Leu Lys Gln Asn Gly Trp Val Gly Asn225 230 235 240Phe Ala Leu Gly Ala Ser Tyr Ile Ser Leu Pro Trp Trp Ala Gly Gln245 250 255Ala Leu Phe Gly Thr Leu Thr Pro Asp Val Val Val Leu Thr Leu Leu260 265 270Tyr Ser Ile Ala Gly Leu Gly Ile Ala Ile Val Asn Asp Phe Lys Ser275 280 285Val Glu Gly Asp Arg Ala Leu Gly Leu Gln Ser Leu Pro Val Ala Phe290 295 300Gly Thr Glu Thr Ala Lys Trp Ile Cys Val Gly Ala Ile Asp Ile Thr305 310 315 320Gln Leu Ser Val Ala Gly Tyr Leu Leu Ala Ser Gly Lys Pro Tyr Tyr325 330 335Ala Leu Ala Leu Val Ala Leu Ile Ile Pro Gln Ile Val Phe Gln Phe340 345 350Lys Tyr Phe Leu Lys Asp Pro Val Lys Tyr Asp Val Lys Tyr Gln Ala355 360 365Ser Ala Gln Pro Phe Leu Val Leu Gly Ile Phe Val Thr Ala Leu Ala370 375 380Ser Gln His385<210>18<211>981<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>18atgttgttta gtggttcagc gatcccatta agcagcttct gctctcttcc ggagaaaccc 60cacactcttc ctatgaaact ctctcccgct gcaatccgat cttcatcctc atctgccccg 120gggtcgttga acttcgatct gaggacgtat tggacgactc tgatcaccga gatcaaccag 180aagctggatg aggccatacc ggtcaagcac cctgcgggga tctacgaggc tatgagatac 240tctgtactcg cacaaggcgc caagcgtgcc cctcctgtga tgtgtgtggc ggcctgcgag 300ctcttcggtg gcgatcgcct cgccgctttc cccaccgcct gtgccctaga aatggtgcac 360gcggcttcgt tgatacacga cgacctcccc tgtatggacg acgatcctgt gcgcagagga 420aagccatcta accacactgt ctacggctct ggcatggcca ttctcgccgg tgacgccctc 480ttcccactcg ccttccagca cattgtctcc cacacgcctc ctgaccttgt tccccgagcc 540accatcctca gactcatcac tgagattgcc cgcactgtcg gctccactgg tatggctgca 600ggccagtacg tcgaccttga aggaggtccc tttcctcttt cctttgttca ggagaagaaa 660ttcggagcca tgggtgaatg ctctgccgtg tgcggtggcc tattgggcgg tgccactgag 720gatgagctcc agagtctccg aaggtacggg agagccgtcg ggatgctgta tcaggtggtc 780gatgacatca ccgaggacaa gaagaagagc tatgatggtg gagcagagaa gggaatgatg 840gaaatggcgg aagagctcaa ggagaaggcg aagaaggagc ttcaagtgtt tgacaacaag 900tatggaggag gagacacact tgttcctctc tacaccttcg ttgactacgc tgctcatcga 960cattttcttc ttcccctctg a 981<210>19<211>245<212>DNA<213>甘氨酸种(Glycine sp)<400>19gcaacatctg ggactgggtt tgtcttgggg agtggtagtg ctgttgatct ttcggcactt 60tcttgcactt gcttgggtac catgatggtt gctgcatctg ctaactcttt gaatcaggtg 120tttgagatca ataatgatgc taaaatgaag agaacaagtc gcaggccact accctcagga 180cgcatcacaa tacctcatgc agttggctgg gcatcctctg ttggattagc tggtacggct 240ctact 245<210>20<211>253<212>DNA<213>甘氨酸种(Glycine sp)<400>20attggctttc caagatcatt gggttttctt gttgcattca tgaccttcta ctccttgggt 60ttggcattgt ccaaggatat acctgacgtt gaaggagata aagagcacgg cattgattct 120tttgcagtac gtctaggtca gaaacgggca ttttggattt gcgtttcctt ttttgaaatg 180gctttcggag ttggtatcct ggccggagca tcatgctcac acttttggac taaaattttc 240acgggtatgg gaa253<210>21<211>275<212>DNA<213>甘氨酸种(Glycine sp)<400>21tgatcttcta ctctctgggt atggcattgt ccaaggatat atctgacgtt aaaggagata 60aagcatacgg catcgatact ttagcgatac gtttgggtca aaaatgggta ttttggattt 120gcattatcct ttttgaaatg gcttttggag ttgccctctt ggcaggagca acatcttctt 180acctttggat taaaattgtc acgggtctgg gacatgctat tcttgcttca attctcttgt 240accaagccaa atctatatac ttgagcaaca aagtt275<210>22<211>299<212>DNA<213>甘氨酸种(Glycine sp)<220><221>misc feature<222>(1)...(299)<223>n=A,T,C or G<400>22ccanaatang tncatcttng aaagacaatt ggcctcttca acacacaagt ctgcatgtga 60agaagaggcc aattgtcttt ccaagatcac ttatngtggc tattgtaatc atgaacttct 120tctttgtggg tatggcattg gcaaaggata tacctanctg ttgaaggaga taaaatatat 180ggcattgata cttttgcaat acgtataggt caaaaacaag tattttggat ttgtattttc 240ctttttgaaa ggctttcgga gtttccctag tggcaggagc aacatcttct agccttggt 299<210>23<211>767<212>DNA<213>甘氨酸种(Glycine sp)<400>23gtggaggctg tggttgctgc cctgtttatg aatatttata ttgttggttt gaatcaattg 60tetgatgttg aaatagacaa gataaacaag ccgtatcttc cattagcatc tggggaatat 120tcctttgaaa ctggtgtcac tattgttgca tctttttcaa ttctgagttt ttggcttggc 180tgggttgtag gttcatggcc attattttgg gccctttttg taagctttgt gctaggaact 240gcttattcaa tcaatgtgcc tctgttgaga tggaagaggt ttgcagtgct tgcagcgatg 300tgcattctag ctgttcgggc agtaatagtt caacttgcat ttttccttca catgcagact 360catgtgtaca agaggccacc tgtcttttca agaccattga tttttgctac tgcattcatg 420agcttcttct ctgtagttat agcactgttt aaggatatac ctgacattga aggagataaa 480gtatttggca tccaatcttt ttcagtgtgt ttaggtcaga agccggtgtt ctggacttgt 540gttacccttc ttgaaatagc ttatggagtc gccctcctgg tgggagctgc atctccttgt 600ctttggagca aaattttcac gggtctggga cacgctgtgc tggcttcaat tctctggttt 660catgccaaat ctgtagattt gaaaagcaaa gcttcgataa catccttcta tatgtttatt 720tggaagctat tttatgcaga atacttactc attccttttg ttagatg 767<210>24<211>255<212>PRT<213>甘氨酸种(Glycine sp)<400>24Val Glu Ala Val Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly1 5 10 15Leu Asn Gln Leu Ser Asp Val Glu Ile Asp Lys Ile Asn Lys Pro Tyr20 25 30Leu Pro Leu Ala Ser Gly Glu Tyr Ser Phe Glu Thr Gly Val Thr Ile35 40 45Val Ala Ser Phe Ser Ile Leu Ser Phe Trp Leu Gly Trp Val Val Gly50 55 60Ser Trp Pro Leu Phe Trp Ala Leu Phe Val Ser Phe Val Leu Gly Thr65 70 75 80Ala Tyr Ser Ile Asn Val Pro Leu Leu Arg Trp Lys Arg Phe Ala Val85 90 95Leu Ala Ala Met Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu100 105 110Ala Phe Phe Leu His Met Gln Thr His Val Tyr Lys Arg Pro Pro Val115 120 125Phe Ser Arg Pro Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser130 135 140Val Val Ile Ala Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys145 150 155 160Val Phe Gly Ile Gln Ser Phe Ser Val Cys Leu Gly Gln Lys Pro Val165 170 175Phe Trp Thr Cys Val Thr Leu Leu Glu Ile Ala Tyr Gly Val Ala Leu180 185 190Leu Val Gly Ala Ala Ser Pro Cys Leu Trp Ser Lys Ile Phe Thr Gly195 200 205Leu Gly His Ala Val Leu Ala Ser Ile Leu Trp Phe His Ala Lys Ser210 215 220Val Asp Leu Lys Ser Lys Ala Ser Ile Thr Ser Phe Tyr Met Phe Ile225 230 235 240Trp Lys Leu Phe Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg245 250 255<210>25<211>360<212>DNA<213>玉蜀黍属种(Zea sp)<220><221>misc feature<222>(1)...(360)<223>n=A,T,C or G<400>25ggcgtcttca cttgttctgg tcttctcgta tcccctgatg aagaggttca cattttggcc 60tcaggcttat cttggcctga cattcaactg gggagcttta ctagggtggg ctgctattaa 120ggaaagcata gaccctgcaa atcatccttc cattgtatac agctggtatt tgttggacgc 180tggtgtatga tactatatat gcgcatcagg tgtttcgcta tccctacttt catattaatc 240cttgatgaag tggccatttc atgttgtcgc ggtggtctta tacttgcata tctccatgca 300tctcaggaca aagangatga cctgaaagta ggagtccaag tccacagctt aagatttggg 360<210>26<211>299<212>DNA<213>玉蜀黍属种(Zea sp)<220><221>misc feature<222>(1)...(299)<223>n=A,T,C or G<400>26gatggttgca gcatctgcaa ataccctcaa ccaggtgttt gngataaaaa atgatgctaa 60aatgaaaagg acaatgcgtg ccccctgcca tctggtcgca ttagtcctgc acatgctgcg 120atgtgggcta caagtgttgg agttgcagga acagctttgt tggcctggaa ggctaatggc 180ttggcagctg ggcttgcagc ttctaatctt gttctgtatg catttgtgta tacgccgttg 240aagcaaatac accctgttaa tacatgggtt ggggcagtcg ttggtgccat cccaccact 299<210>27<211>255<212>DNA<213>玉蜀黍属种(Zea sp)<220><221>misc feature<222>(1)...(255)<223>n=A,T,C or G<400>27anacttgcat atctccatgc ntctcaggac aaagangatg acctgaaagt aggtgtcaag 60tccacagcat taagatttgg agatttgacc nnatactgna tcagtggctt tggcgcggca 120tgcttcggca gcttagcact cagtggttac aatgctgacc ttggttggtg tttagtgtga 180tgcttgagcg aagaatggta tngtttttac ttgatattga ctccagacct gaaatcatgt 240tggacagggt ggccc 255<210>28<211>257<212>DNA<213>玉蜀黍属种(Zea sp)<400>28attgaagggg ataggactct ggggcttcag tcacttcctg ttgcttttgg gatggaaact 60gcaaaatgga tttgtgttgg agcaattgat atcactcaat tatctgttgc aggttaccta 120ttgagcaccg gtaagctgta ttatgccctg gtgttgcttg ggctaacaat tcctcaggtg 180ttctttcagt tccagtactt cctgaaggac cctgtgaagt atgatgtcaa atatcaggca 240agcgcacaac cattctt257<210>29<211>368<212>DNA<213>玉蜀黍属种(Zea sp)<400>29atccagttgc aaataataat ggcgttcttc tctgttgtaa tagcactatt caaggatata 60cctgacatcg aaggggaccg catattcggg atccgatcct tcagcgtccg gttagggcaa 120aagaaggtct tttggatctg cgttggcttg cttgagatgg cctacagcgt tgcgatactg 180atgggagcta cctcttcctg tttgtggagc aaaacagcaa ccatcgctgg ccattccata 240cttgccgcga tcctatggag ctgcgcgcga tcggtggact tgacgagcaa agccgcaata 300acgtccttct acatgttcat ctggaagctg ttctacgcgg agtacctgct catccctctg 360gtgcggtg 368<210>30<211>122<212>PRT<213>玉蜀黍属种(Zea sp)<400>30Ile Gln Leu Gln Ile Ile Met Ala Phe Phe Ser Val Val Ile Ala Leu1 5 10 15Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg Ile Phe Gly Ile Arg20 25 30Ser Phe Ser Val Arg Leu Gly Gln Lys Lys Val Phe Trp Ile Cys Val35 40 45Gly Leu Leu Glu Met Ala Tyr Ser Val Ala Ile Leu Met Gly Ala Thr50 55 60Ser Ser Cys Leu Trp Ser Lys Thr Ala Thr Ile Ala Gly His Ser Ile65 70 75 80Leu Ala Ala Ile Leu Trp Ser Cys Ala Arg Ser Val Asp Leu Thr Ser85 90 95Lys Ala Ala Ile Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe Tyr100 105 110Ala Glu Tyr Leu Leu Ile Pro Leu Val Arg115 120<210>31<211>278<212>DNA<213>玉蜀黍属种(Zea sp)<400>31tattcagcac cacctctcaa gctcaagcag aatggatgga ttgggaactt cgctctgggt 60gcgagttaca tcagcttgcc ctggtgggct ggccaggcgt tatttggaac tcttacacca 120gatatcattg tcttgactac tttgtacagc atagctgggc tagggattgc tattgtaaat 180gatttcaaga gtattgaagg ggataggact ctggggcttc agtcacttcc tgttgctttt 240gggatggaaa ctgcaaaatg gatttgtgtt ggagcaat 278<210>32<211>292<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>32Met Val Ala Gln Thr Pro Ser Ser Pro Pro Leu Trp Leu Thr Ile Ile1 5 10 15Tyr Leu Leu Arg Trp His Lys Pro Ala Gly Arg Leu Ile Leu Met Ile
20 25 30Pro Ala Leu Trp Ala Val Cys Leu Ala Ala Gln Gly Leu Pro Pro Leu35 40 45Pro Leu Leu Gly Thr Ile Ala Leu Gly Thr Leu Ala Thr Ser Gly Leu50 55 60Gly Cys Val Val Asn Asp Leu Trp Asp Arg Asp Ile Asp Pro Gln Val65 70 75 80Glu Arg Thr Lys Gln Arg Pro Leu Ala Ala Arg Ala Leu Ser Val Gln85 90 95Val Gly Ile Gly Val Ala Leu Val Ala Leu Leu Cys Ala Ala Gly Leu100 105 110Ala Phe Tyr Leu Thr Pro Leu Ser Phe Trp Leu Cys Val Ala Ala Val115 120 125Pro Val Ile Val Ala Tyr Pro Gly Ala Lys Arg Val Phe Pro Val Pro130 135 140Gln Leu Val Leu Ser Ile Ala Trp Gly Phe Ala Val Leu Ile Ser Trp145 150 155 160Ser Ala Val Thr Gly Asp Leu Thr Asp Ala Thr Trp Val Leu Trp Gly165 170 175Ala Thr Val Phe Trp Thr Leu Gly Phe Asp Thr Val Tyr Ala Met Ala180 185 190Asp Arg Glu Asp Asp Arg Arg Ile 6ly Val Asn Ser Ser Ala Leu Phe195 200 205Phe Gly Gln Tyr Val Gly Glu Ala Val Gly Ile Phe Phe Ala Leu Thr210 215 220Ile Gly Cys Leu Phe Tyr Leu Gly Met Ile Leu Met Leu Asn Pro Leu225 230 235 240Tyr Trp Leu Ser Leu Ala Ile Ala Ile Val Gly Trp Val Ile Gln Tyr245 250 255Ile Gln Leu Ser Ala Pro Thr Pro Glu Pro Lys Leu Tyr Gly Gln Ile260 265 270Phe Gly Gln Asn Val Ile Ile Gly Phe Val Leu Leu Ala Gly Met Leu275 280 285Leu Gly Trp Leu290<210>33<211>316<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>33Met Val Thr Ser Thr Lys Ile His Arg Gln His Asp Ser Met Gly Ala1 5 10 15Val Cys Lys Ser Tyr Tyr Gln Leu Thr Lys Pro Arg Ile Ile Pro Leu20 25 30Leu Leu Ile Thr Thr Ala Ala Ser Met Trp Ile Ala Ser Glu Gly Arg35 40 45Val Asp Leu Pro Lys Leu Leu Ile Thr Leu Leu Gly Gly Thr Leu Ala50 55 60Ala Ala Ser Ala Gln Thr Leu Asn Cys Ile Tyr Asp Gln Asp Ile Asp65 70 75 80Tyr Glu Met Leu Arg Thr Arg Ala Arg Pro Ile Pro Ala Gly Lys Val85 90 95Gln Pro Arg His Ala Leu Ile Phe Ala Leu Ala Leu Gly Val Leu Ser100 105 110Phe Ala Leu Leu Ala Thr Phe Val Asn Val Leu Ser Gly Cys Leu Ala115 120 125Leu Ser Gly Ile Val Phe Tyr Met Leu Val Tyr Thr His Trp Leu Lys130 135 140Arg His Thr Ala Gln Asn Ile Val Ile Gly Gly Ala Ala Gly Ser Ile145 150 155 160Pro Pro Leu Val Gly Trp Ala Ala Val Thr Gly Asp Leu Ser Trp Thr165 170 175Pro Trp Val Leu Phe Ala Leu Ile Phe Leu Trp Thr Pro Pro His Phe180 185 190Trp Ala Leu Ala Leu Met Ile Lys Asp Asp Tyr Ala Gln Val Asn Val195 200 205Pro Met Leu Pro Val Ile Ala Gly Glu Glu Lys Thr Val Ser Gln Ile210 215 220Trp Tyr Tyr Ser Leu Leu Val Val Pro Phe Ser Leu Leu Leu Val Tyr225 230 235 240Pro Leu His Gln Leu Gly Ile Leu Tyr Leu Ala Ile Ala Ile Ile Leu245 250 255Gly Gly Gln Phe Leu Val Lys Ala Trp Gln Leu Lys Gln Ala Pro Gly260 265 270Asp Arg Asp Leu Ala Arg Gly Leu Phe Lys Phe Ser Ile Phe Tyr Leu275 280 285Met Leu Leu Cys Leu Ala Met Val Ile Asp Ser Leu Pro Val Thr His290 295 300Gln Leu Val Ala Gln Met Gly Thr Leu Leu Leu Gly305 310 315<210>34<211>324<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>34Met Ser Asp Thr Gln Asn Thr Gly Gln Asn Gln Ala Lys Ala Arg Gln15 10 15Leu Leu Gly Met Lys Gly Ala Ala Pro Gly Glu Ser Ser Ile Trp Lys20 25 30Ile Arg Leu Gln Leu Met Lys Pro Ile Thr Trp Ile Pro Leu Ile Trp35 40 45Gly Val Val Cys Gly Ala Ala Ser Ser Gly Gly Tyr Ile Trp Ser Val50 55 60Glu Asp Phe Leu Lys Ala Leu Thr Cys Met Leu Leu Ser Gly Pro Leu65 70 75 80Met Thr Gly Tyr Thr Gln Thr Leu Asn Asp Phe Tyr Asp Arg Asp Ile85 90 95Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala Ile Ser100 105 110Val Pro Gln Val Val Thr Gln Ile Leu Ile Leu Leu Val Ala Gly Ile115 120 125Gly Val Ala Tyr Gly Leu Asp Val Trp Ala Gln His Asp Phe Pro Ile130 135 140Met Met Val Leu Thr Leu Gly Gly Ala Phe Val Ala Tyr Ile Tyr Ser145 150 155 160Ala Pro Pro Leu Lys Leu Lys Gln Asn GIy Trp Leu Gly Asn Tyr Ala165 170 175Leu Gly Ala Ser Tyr Ile Ala Leu Pro Trp Trp Ala Gly His Ala Leu180 185 190Phe Gly Thr Leu Asn Pro Thr Ile Met Val Leu Thr Leu Ile Tyr Ser195 200 205Leu Ala Gly Leu Gly Ile Ala Val Val Asn Asp Phe Lys Ser Val Glu210 215 220Gly Asp Arg Gln Leu Gly Leu Lys Ser Leu Pro Val Met Phe Gly Ile225 230 235 240Gly Thr Ala Ala Trp Ile Cys Val Ile Met Ile Asp Val Phe Gln Ala245 250 255Gly Ile Ala Gly Tyr Leu Ile Tyr Val His Gln Gln Leu Tyr Ala Thr260 265 270Ile Val Leu Leu Leu Leu Ile Pro Gln Ile Thr Phe Gln Asp Met Tyr275 280 285Phe Leu Arg Asn Pro Leu Glu Asn Asp Val Lys Tyr Gln Ala Ser Ala290 295 300Gln Pro Phe Leu Val Phe Gly Met Leu Ala Thr Gly Leu Ala Leu Gly305 310 315 320His Ala Gly Ile<210>35<211>307<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>35Met Thr Glu Ser Ser Pro Leu Ala Pro Ser Thr Ala Pro Ala Thr Arg1 5 10 15Lys Leu Trp Leu Ala Ala Ile Lys Pro Pro Met Tyr Thr Val Ala Val20 25 30Val Pro Ile Thr Val Gly Ser Ala Val Ala Tyr Gly Leu Thr Gly Gln35 40 45Trp His Gly Asp Val Phe Thr Ile Phe Leu Leu Ser Ala Ile Ala Ile50 55 60Ile Ala Trp Ile Asn Leu Ser Asn Asp Val Phe Asp Ser Asp Thr Gly65 70 75 80Ile Asp Val Arg Lys Ala His Ser Val Val Asn Leu Thr Gly Asn Arg85 90 95Asn Leu Val Phe Leu Ile Ser Asn Phe Phe Leu Leu Ala Gly Val Leu100 105 110Gly Leu Met Ser Met Ser Trp Arg Ala Gln Asp Trp Thr Val Leu Glu115 120 125Leu Ile Gly Val Ala Ile Phe Leu Gly Tyr Thr Tyr Gln Gly Pro Pro130 135 140Phe Arg Leu Gly Tyr Leu Gly Leu Gly Glu Leu Ile Cys Leu Ile Thr145 150 155 160Phe Gly Pro Leu Ala Ile Ala Ala Ala Tyr Tyr Ser Gln Ser Gln Ser165 170 175Phe Ser Trp Asn Leu Leu Thr Pro Ser Val Phe Val Gly Ile Ser Thr180 185 190Ala Ile Ile Leu Phe Cys Ser His Phe His Gln Val Glu Asp Asp Leu195 200 205Ala Ala Gly Lys Lys Ser Pro Ile Val Arg Leu Gly Thr Lys Leu Gly210 215 220Ser Gln Val Leu Thr Leu Ser Val Val Ser Leu Tyr Leu Ile Thr Ala225 230 235 240Ile Gly Val Leu Cys His Gln Ala Pro Trp Gln Thr Leu Leu Ile Ile245 250 255Ala Ser Leu Pro Trp Ala Val Gln Leu Ile Arg His Val Gly Gln Tyr260 265 270His Asp Gln Pro Glu Gln Val Ser Asn Cys Lys Phe Ile Ala Val Asn275 280 285Leu His Phe Phe Ser Gly Met Leu Met Ala Ala Gly Tyr Gly Trp Ala290 295 300Gly Leu Gly305<210>36<211>927<212>DNA<213>集胞蓝细菌属种(Synechocystis sp)<400>36atggcaacta tccaagcttt ttggcgcttc tcccgccccc ataccatcat tggtacaact 60ctgagcgtct gggctgtgta tctgttaact attctcgggg atggaaactc agttaactcc 120cctgcttccc tggatttagt gttcggcgct tggctggcct gcctgttggg taatgtgtac 180attgtcggcc tcaaccaatt gtgggatgtg gacattgacc gcatcaataa gccgaatttg 240cccctagcta acggagattt ttctatcgcc cagggccgtt ggattgtggg actttgtggc 300gttgcttcct tggcgatcgc ctggggatta gggctatggc tggggctaac ggtgggcatt 360agtttgatta ttggcacggc ctattcggtg ccgccagtga ggttaaagcg cttttccctg 420ctggcggccc tgtgtattct gacggtgcgg ggaattgtgg ttaacttggg cttattttta 480ttttttagaa ttggtttagg ttatcccccc actttaataa cccccatctg ggttttgact 540ttatttatct tagttttcac cgtggcgatc gccattttta aagatgtgcc agatatggaa 600ggcgatcggc aatttaagat tcaaacttta actttgcaaa tcggcaaaca aaacgttttt 660cggggaacct taattttact cactggttgt tatttagcca tggcaatctg gggcttatgg 720gcggctatgc ctttaaatac tgctttcttg attgtttccc atttgtgctt attagcctta 780ctctggtggc ggagtcgaga tgtacactta gaaagcaaaa ccgaaattgc tagtttttat 840cagtttattt ggaagctatt tttcttagag tacttgctgt atcccttggc tctgtggtta 900cctaattttt ctaatactat tttttag 927<210>37<211>308<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>37Met Ala Thr Ile Gln Ala Phe Trp Arg Phe Ser Arg Pro His Thr Ile1 5 10 15Ile Gly Thr Thr Leu Ser Val Trp Ala Val Tyr Leu Leu Thr Ile Leu20 25 30Gly Asp Gly Asn Ser Val Asn Ser Pro Ala Ser Leu Asp Leu Val Phe35 40 45Gly Ala Trp Leu Ala Cys Leu Leu Gly Asn Val Tyr Ile Val Gly Leu50 55 60Asn Gln Leu Trp Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asn Leu65 70 75 80Pro Leu Ala Asn Gly Asp Phe Ser Ile Ala Gln Gly Arg Trp Ile Val85 90 95Gly Leu Cys Gly Val Ala Ser Leu Ala Ile Ala Trp Gly Leu Gly Leu100 105 110Trp Leu Gly Leu Thr Val Gly Ile Ser Leu Ile Ile Gly Thr Ala Tyr115 120 125Ser Val Pro Pro Val Arg Leu Lys Arg Phe Ser Leu Leu Ala Ala Leu130 135 140Cys Ile Leu Thr Val Arg Gly Ile Val Val Asn Leu Gly Leu Phe Leu145 150 155 160Phe Phe Arg Ile Gly Leu Gly Tyr Pro Pro Thr Leu Ile Thr Pro Ile165 170 175Trp Val Leu Thr Leu Phe Ile Leu Val Phe Thr Val Ala Ile Ala Ile180 185 190Phe Lys Asp Val Pro Asp Met Glu Gly Asp Arg Gln Phe Lys Ile Gln195 200 205Thr Leu Thr Leu Gln Ile Gly Lys Gln Asn Val Phe Arg Gly Thr Leu210 215 220Ile Leu Leu Thr Gly Cys Tyr Leu Ala Met Ala Ile Trp Gly Leu Trp225 230 235 240Ala Ala Met Pro Leu Asn Thr Ala Phe Leu Ile Val Ser His Leu Cys245 250 255Leu Leu Ala Leu Leu Trp Trp Arg Ser Arg Asp Val His Leu Glu Ser260 265 270Lys Thr Glu Ile Ala Ser Phe Tyr Gln Phe Ile Trp Lys Leu Phe Phe275 280 285Leu Glu Tyr Leu Leu Tyr Pro Leu Ala Leu Trp Leu Pro Asn Phe Ser290 295 300Asn Thr Ile Phe305<210>38<211>1092<212>DNA<213>集胞蓝细菌属种(Synechocystis sp)<400>38atgaaatttc cgccccacag tggttaccat tggcaaggtc aatcaccttt ctttgaaggt 60tggtacgtgc gcctgctttt gccccaatcc ggggaaagtt ttgcttttat gtactccatc 120gaaaatcctg ctagcgatca tcattacggc ggcggtgctg tgcaaatttt agggccggct 180acgaaaaaac aagaaaatca ggaagaccaa cttgtttggc ggacatttcc ctcggtaaaa 240aaattttggg ccagtcctcg ccagtttgcc ctagggcatt ggggaaaatg tagggataac 300aggcaggcga aacccctact ctccgaagaa ttttttgcca cggtcaagga aggttatcaa 360atccatcaaa atcagcacca aggacaaatc attcatggcg atcgccattg tcgttggcag 420ttcaccgtag aaccggaagt aacttggggg agtcctaacc gatttcctcg ggctacagcg 480ggttggcttt cctttttacc cttgtttgat cccggttggc aaattctttt agcccaaggt 540agagcgcacg gctggctgaa atggcagagg gaacagtatg aatttgacca cgccctagtt 600tatgccgaaa aaaattgggg tcactccttt ccctcccgct ggttttggct ccaagcaaat 660tattttcctg accatccagg actgagcgtc actgccgctg gcggggaacg gattgttctt 720ggtcgccccg aagaggtagc tttaattggc ttacatcacc aaggtaattt ttacgaattt 780ggcccgggcc atggcacagt cacttggcaa gtagctccct ggggccgttg gcaattaaaa 840gccagcaatg ataggtattg ggtcaagttg tccggaaaaa cagataaaaa aggcagttta 900gtccacactc ccaccgccca gggcttacaa ctcaactgcc gagataccac taggggctat 960ttgtatttgc aattgggatc tgtgggtcac ggcctgatag tgcaagggga aacggacacc1020gcggggctag aagttggagg tgattggggt ttaacagagg aaaatttgag caaaaaaaca1080gtgccattct ga1092<210>39<211>363<212>PRT<213>集胞蓝细菌属种(Synechocystis sp)<400>39Met Lys Phe Pro Pro His Ser Gly Tyr His Trp Gln Gly Gln Ser Pro1 5 10 15Phe Phe Glu Gly Trp Tyr Val Arg Leu Leu Leu Pro Gln Ser Gly Glu20 25 30Ser Phe Ala Phe Met Tyr Ser Ile Glu Asn Pro Ala Ser Asp His His35 40 45Tyr Gly Gly Gly Ala Val Gln Ile Leu Gly Pro Ala Thr Lys Lys Gln50 55 60Glu Asn Gln Glu Asp Gln Leu Val Trp Arg Thr Phe Pro Ser Val Lys65 70 75 80Lys Phe Trp Ala Ser Pro Arg Gln Phe Ala Leu Gly His Trp Gly Lys85 90 95Cys Arg Asp Asn Arg Gln Ala Lys Pro Leu Leu Ser Glu Glu Phe Phe100 105 110Ala Thr Val Lys Glu Gly Tyr Gln Ile His Gln Asn Gln His Gln Gly115 120 125Gln Ile Ile His Gly Asp Arg His Cys Arg Trp Gln Phe Thr Val Glu130 135 140Pro Glu Val Thr Trp Gly Ser Pro Asn Arg Phe Pro Arg Ala Thr Ala145 150 155 160Gly Trp Leu Ser Phe Leu Pro Leu Phe Asp Pro Gly Trp Gln Ile Leu165 170 175Leu Ala Gln Gly Arg Ala His Gly Trp Leu Lys Trp Gln Arg Glu Gln180 185 190Tyr Glu Phe Asp His Ala Leu Val Tyr Ala Glu Lys Asn Trp Gly His195 200 205Ser Phe Pro Ser Arg Trp Phe Trp Leu Gln Ala Asn Tyr Phe Pro Asp210 215 220His Pro Gly Leu Ser Val Thr Ala Ala Gly Gly Glu Arg Ile Val Leu225 230 235 240Gly Arg Pro Glu Glu Val Ala Leu Ile Gly Leu His His Gln Gly Asn245 250 255Phe Tyr Glu Phe Gly Pro Gly His Gly Thr Val Thr Trp Gln Val Ala260 265 270Pro Trp Gly Arg Trp Gln Leu Lys Ala Ser Asn Asp Arg Tyr Trp Val275 280 285Lys Leu Ser Gly Lys Thr Asp Lys Lys Gly Ser Leu Val His Thr Pro290 295 300Thr Ala Gln Gly Leu Gln Leu Asn Cys Arg Asp Thr Thr Arg Gly Tyr305 310 315 320Leu Tyr Leu Gln Leu Gly Ser Val Gly His Gly Leu Ile Val Gln Gly325 330 335Glu Thr Asp Thr Ala Gly Leu Glu Val Gly Gly Asp Trp Gly Leu Thr
340 345 350Glu Glu Asn Leu Ser Lys Lys Thr Val Pro Phe355 360<210>40<211>56<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>40cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat 56<210>41<211>32<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>41tcgaggatcc gcggccgcaa gcttcctgca gg32<210>42<211>32<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>42tcgacctgca ggaagcttgc ggccgcggat cc32<210>43<211>32<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>43tcgacctgca ggaagcttgc ggccgcggat cc32<210>44<211>32<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>44tcgaggatcc gcggccgcaa gcttcctgca gg32<210>45<211>36<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>45tcgagga tcc gcggccgcaa gcttcctgca ggagct 36<210>46<211>28<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>46cctgcaggaa gcttgcggcc gcggatcc 28<210>47<211>36<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>47tcgacctgca ggaagcttgc ggccgcggat ccagct36<210>48<211>28<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>48ggatccgcgg ccgcaagctt cctgcagg 28<210>49<211>39<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>49gatcacctgc aggaagcttg cggccgcgga tccaatgca 39<210>50<211>31<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>50ttggatccgc ggccgcaagc ttcctgcagg t 31<210>51<211>41<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>51ggatccgcgg ccgcacaatg gagtctctgc tctctagttc t 41<210>52<211>38<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>52ggatcctgca ggtcacttca aaaaaggtaa cagcaagt 38<210>53<211>45<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>53ggatccgcgg ccgcacaatg gcgttttttg ggctctcccg tgttt 45<210>54<211>40<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>54ggatcctgca ggttattgaa aacttcttcc aagtacaact40<210>55<211>38<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>55ggatccgcgg ccgcacaatg tggcgaagat ctgttgtt 38<210>56<211>37<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>56ggatcctgca ggtcatggag agtagaagga aggagct 37<210>57<211>50<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>57ggatccgcgg ccgcacaatg gtacttgccg aggttccaaa gcttgcctct 50<210>58<211>38<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>58ggatcctgca ggtcacttgt ttctggtgat gactctat 38<210>59<211>38<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>59ggatccgcgg ccgcacaatg acttcgattc tcaacact 38<210>60<211>36<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>60ggatcctgca ggtcagtgtt gcgatgctaa tgccgt36<210>61<211>22<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>61taatgtgtac attgtcggcc tc 22<210>62<211>60<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>62gcaatgtaac atcagagatt ttgagacaca acgtggcttt ccacaattcc ccgcaccgtc 60<210>63<211>22<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>63aggctaataa gcacaaatgg ga 22<210>64<211>63<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>64ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggaattgg tttaggttat 60ccc63<210>65<211>26<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>65ggatccatgg ttgcccaaac cccatc 26<210>66<211>61<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>66gcaatgtaac atcagagatt ttgagacaca acgtggcttt gggtaagcaa caatgaccgg 60c 61<210>67<211>25<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>67gaattctcaa agccagccca gtaac25<210>68<211>63<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>68ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgggtgcga aaagggtttt 60ccc63<210>69<211>23<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>69ccagtggttt aggctgtgtg gtc 23<210>70<211>21<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>70ctgagttgga tgtattggat c21<210>71<211>28<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>71ggatccatgg ttacttcgac aaaaatcc 28<210>72<211>60<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>72gcaatgtaac atcagagatt ttgagacaca acgtggcttt gctaggcaac cgcttagtac 60<210>73<211>28<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>73gaattcttaa cccaacagta aagttccc 28<210>74<211>63<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>74ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgccggcat tgtcttttac 60atg63<210>75<211>20<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>75ggaacccttg cagccgcttc 20<210>76<211>22<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>76gtatgcccaa ctggtgcaga gg 22<210>77<211>28<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>77ggatccatgt ctgacacaca aaataccg 28<210>78<211>62<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>78gcaatgtaac atcagagatt ttgagacaca acgtggcttt cgccaatacc agccaccaac 60ag 62<210>79<211>27<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>79gaattctcaa atccccgcat ggcctag 27<210>80<211>65<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>80ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggcctacg gcttggacgt 60gtggg 65<210>81<211>21<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>81cacttggatt cccctgatct g21<210>82<211>21<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>82gcaatacccg cttggaaaac g21<210>83<211>29<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>83ggatccatga ccgaatcttc gcccctagc29<210>84<211>61<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>84gcaatgtaac atcagagatt ttgagacaca acgtggcttt caatcctagg tagccgaggc 60g 61<210>85<211>27<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>85gaattcttag cccaggccag cccagcc 27<210>86<211>66<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>86ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggggaatt gatttgttta 60attacc 66<210>87<211>21<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>87gcgatcgcca ttatcgcttg g21<210>88<211>24<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>88gcagactggc aattatcagt aacg 24<210>89<211>25<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>89ccatggattc gagtaaagtt gtcgc25<210>90<211>25<212>DNA<213>人工序列<220><223>人工序列的说明寡核苷酸<400>90gaattcactt caaaaaaggt aacag25<210>91<211>4550<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>91attttacacc aatttgatca cttaactaaa ttaattaaat tagatgatta tcccaccata 60tttttgagca ttaaaccata aaaccatagt tataagtaac tgttttaatc gaatatgact 120cgattaagat taggaaaaat ttataaccgg taattaagaa aacattaacc gtagtaaccg 180taaatgccga ttcctccctt gtctaaaaga cagaaaacat atattttatt ttgccccata 240tgtttcactc tatttaattt caggcacaat acttttggtt ggtaacaaaa ctaaaaagga 300caacacgtga tacttttcct cgtccgtcag tcagattttt tttaaactag aaacaagtgg 360caaatctaca ccacattttt tgcttaatct attaacttgt aagttttaaa ttcctaaaaa 420agtctaacta attcttctaa tataagtaca ttccctaaat ttcccaaaaa gtcaaattaa 480taattttcaa aatctaatct aaatatctaa taattcaaaa tcattaaaaa gacacgcaac 540aatgacacca attaatcatc ctcgacccac acaattctac agttctcatg ctaaaccata 600ttttttgctc tctgttcctt caaaatcatt tctttctctt ctttgattcc caaagatcac 660ttctttgtct ttgatttttg attttttttc tctctggcgt gaaggaagaa gctttatttc 720atggagtctc tgctctctag ttcttctctt gtttccgctg gtaaatctcg tccttttctg 780gtttcaggtt ttatttgttg tttaggtttc gtttttgtga ttcagaacca tacaaaaagt 840ttgaactttt ctgaatataa aataaggaaa aagtttcgat ttttataatg aattgtttac 900tagatcgaag taggtgacaa aggttattgt gtggagaagc ataatttctg ggcttgactt 960tgaattttgt ttctcatgca tgcaacttat caatcagctg gtgggttttg ttggaagaag1020cagaatctaa agctccactc tttatcaggt tcgttagggt tttatgggtt tttgaaatta1080aatactcaat catcttagtc tcattattct attggttgaa tcacattttc taatttggaa1140tttatgagac aatgtatgtt ggacttagtt gaagttcttc tctttggtta tagttgaagt1200gttactgatg ttgtttagct ctttacacca atatatacac ccaattttgc agaaatccga1260gttctgcgtt gtgattcgag taaagttgtc gcaaaaccga agtttaggaa caatcttgtt1320aggcctgatg gtcaaggatc ttcattgttg ttgtatccaa aacataagtc gagatttcgg1380gttaatgcca ctgcgggtca gcctgaggct ttcgactcga atagcaaaca gaagtctttt1440agagactcgt tagatgcgtt ttacaggttt tctaggcctc atacagttat tggcacagtt1500aagtttctct ttaaaaatgt aactctttta aaacgcaatc tttcagggtt ttcaaggaga1560taacattagc tctgtgattg gatttgcagg tgcttagcat tttatctgta tctttcttag1620cagtagagaa ggtttctgat atatctcctt tacttttcac tggcatcttg gaggtaatga1680atatataaca cataatgacc gatgaagaag atacattttt ttcgtctctc tgtttaaaca1740attgggtttt gttttcaggc tgttgttgca gctctcatga tgaacattta catagttggg1800ctaaatcagt tgtctgatgt tgaaatagat aaggtaacat gcaaattttc ttcatatgag1860ttcgagagac tgatgagatt aatagcagct agtgcctaga tcatctctat gtgggttttt1920gcaggttaac aagccctatc ttccattggc atcaggagaa tattctgtta acaccggcat1980tgcaatagta gcttccttct ccatcatggt atggtgccat tttcacaaaa tttcaacttt2040tagaattcta taagttactg aaatagtttg ttataaatcg ttatagagtt tctggcttgg2100gtggattgtt ggttcatggc cattgttctg ggctcttttt gtgagtttca tgctcggtac2160tgcatactct atcaatgtaa gtaagtttct caatactaga atttggctca aatcaaaatc2220tgcagtttct agttttaggt taatgaggtt ttaataactt acttctacta caaacagttg2280ccacttttac ggtggaaaag atttgcattg gttgcagcaa tgtgtatcct cgctgtccga2340gctattattg ttcaaatcgc cttttatcta catattcagg tactaaacca ttttccttat2400gttttgtagt tgttttcatc aaaatcactt ttatattact aaagctgtga aactttgttg2460cagacacatg tgtttggaag accaatcttg ttcactaggc ctcttatttt cgccactgcg2520tttatgagct ttttctctgt cgttattgca ttgtttaagg taaacaaaga tggaaaaaga2580ttaaatctat gtatacttaa agtaaagcat tctactgtta ttgatgagaa gttttctttt2640ttggttggat gcaggatata cctgatatcg aaggggataa gatattcgga atccgatcat2700tctctgtaac tctgggtcag aaacgggtac gatatctaaa ctaaagaaat tgttttgact2760caagtgttgg attaagatta cagaagaaag aaaactgttt ttgtttcttg caaaattcag2820gtgttttgga catgtgttac actacttcaa atggcttacg ctgttgcaat tctagttgga2880gccacatctc cattcatatg gagcaaagtc atctcggtaa caatctttct ttacccatcg2940aaaactcgct aattcatcgt ttgagtggta ctggtttcat tttgttccgt tctgttgatt3000ttttttcagg ttgtgggtca tgttatactc gcaacaactt tgtgggctcg agctaagtcc3060gttgatctga gtagcaaaac cgaaataact tcatgttata tgttcatatg gaaggttaga3120ttcgtttata aatagagtct ttactgcctt tttatgcgct ccaatttgga attaaaatag3180cctttcagtt tcatcgaatc accattatac tgataaattc tcatttctgc atcagctctt3240ttatgcagag tacttgctgt tacctttttt gaagtgactg acattagaag agaagaagat3300ggagataaaa gaataagtca tcactatgct tctgttttta ttacaagttc atgaaattag3360gtagtgaact agtgaattag agttttattc tgaaacatgg cagactgcaa aaatatgtca3420aagatatgaa tttctgttgg gtaaagaagt ctctgcttgg gcaaaatctt aaggttcggt3480gtgttgatat aatgctaagc gaagaaatcg attctatgta gaaatttccg aaactatgtg3540taaacatgtc agaacatctc cattctatat cttcttctgc aagaaagctc tgtttttatc3600acctaaactc tttatctctg tgtagttaag atatgtatat gtacgtgact acattttttt3660gttgatgtaa tttgcagaac gtatggattt ttgttagaaa gcatgagttc gaaagtatat3720gtttatatat atggataatt cagacctaac gtcgaagctc acaagcataa attcactact3780atagtttgct ctgtaataga tagttccatt gatgtcttga aactgtacgt aactgcctgg3840gcgttttgtg gttgatactg actactgagt gttctttgtg agtgttgtaa gtatacaaga3900agaagaatat aggctcacgg gaacgactgt ggtggaagat gaaatggaga tcatcacgta3960gcggctttgc caaagaccga gtcacgatcg agtctatgaa gtctttacag ctgctgatta4020tgattgacca ttgcttagag acgcattgga atcttactag ggacttgcct gggagtttct4080tcaagtacgt gtcagatcat acgatgtagg agatttcacg gctttgatgt gtttgtttgg4140agtcacaatg cttaatgggc ttattggccc aataatagct agctcttttg ctttagccgt4200ttcgtttgtc ccctggtggt gagtattatt agggtatggt gtgaccaaag tcaccagacc4260tagagtgaat ctagtagagt cctagaccat ggtccatggc ttttatttgt aatttgaaaa4320atgaacaatt ctttttgtaa ggaaaacttt tatatagtag acgtttacta tatagaaact4380agttgaacta acttcgtgca attgcataat aatggtgtga aatagagggt gcaaaactca4440ataaacattt cgacgtacca agagttcgaa acaataagca aaatagattt ttttgcttca4500gactaatttg tacaatgaat ggttaataaa ccattgaagc ttttattaat 4550<210>92<211>4450<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>92tttaggttac aaaatcaatg atattgcgta tgtcaactat aaaagccaaa agtaaagcct 60cttgtttgac cagaaggtca tgatcattgt atacatacag ccaaactacc tcctggaaga 120aaagacatgg atcccaaaca acaacaatag cttcttttac aagaaccagt agtaactagt 180cactaatcta aaagagttaa gtttcagctt ttctggcaat ggctccttga tcatttcaat 240cctgaaggag acccactttg tagcaagacc atgtcctctg tttcacttac agtgtgtctc 300aaaagtctac ttcaattctt catatatagg ttcctcacac tacagcttca tcctcattcg 360ttgacagaga gagagtcttt attgaaaact tcttccaagt acaactccac taaatataat 420agcaccaaac cacttgttcg acacaaatct gtacagatat aaaaacacta ttaggttttc 480caaggcaaat cacataattg gattgtgaaa gagtacaaaa gataaaccca aattttcata 540ctttctactg cagtcagcac cagatgataa gtcagctgtc cctatttgcc atcctaactg 600tcctgatgca gcggccagtg atgcgtaata ttgccaccct taatcattag agcgagaaac 660aaaaagaatc aaaagacagt aaatggaatt aggaatcaca aatgagtcct tgtaaagttt 720attgagtacc gagatctgca ctgaatccag aaagtgcaag aaaacctatg gatgctgtgc 780caaatccagt taaccaaagc tttgtattat caccgaatct aagggctgtt gacttaacac 840caacttttac atcatcttct ttgtcctgga gacacaatat attagacatt agtccatgga 900aaaaaaatga tttaacctag aatatctcaa aattacttgc ataaaaactg aacttgagct 960gaaattttgg gttcgtagct tgtggcatat actatttcat tttcaatggg ccacaaaggt1020aactttcttt tctcacttct gttgcaaacg ggaagacttt tatggggcta actcttcact1080taaagtatag aaatcagatg gaaaaggtgg gagatcaggg taattttctt ctttatgatt1140gacaaaagtc gaacatcgaa atggatgcat ttgcatgaga catgaaacaa aagctgaaaa1200agaaatctgt ggtggtgaag ctagaaaaag aaaacaaagc aagcaatatg cacacattga1260gattaactac tttgctactg gtcataatca aatagatttt gaagctaaaa aataaaaagt1320gaatatacct gatgtgcata aatagtatca taaacaaggg tccagcagac tccggagaga1380tagagaggga gtacaataga tggtgctatg cttcctttaa ctgcagtcca tcctaacaat1440gctccccagt ttatggtcaa acctaaaaag gcttgaggct gcaattataa aaacgaatca1500atcataagaa aatcagaaaa tatataatgt ctaactttga gaagccagaa tagatttaaa1560ttacccaaaa tgtaaacctc ttcataagtg ggtaggaaaa gacaagtaac aaagatgaag1620cccctaaaac acggctgcag aatatacata ctgaaatgag ctcaagtaga aaagaatttg1680atcacaaaac taaagacaag acctgagaac atatcttcag aatttgggcc aactacataa1740gggtgaacca tatgtgtatg tgaattttta aacaaacact tgcaaatacg cgactttagg1800gcaagtaaaa aatccaaaca aacctgtaat tgttaagttg gagaagaatc cctaagccta1860aaagcaactg cagcccgaga aatccaatcc cttgaaatgg tgtcaaaaga ccactggcga1920taggtcttag ttttgtacga tcaacctgga tataaaagaa atttgtaaga caacataatc1980taaaacaaaa caaccataca aaatcttgag ctttacatac aagcaaccca tctttgttta2040tggaagaatg aatccagtta catgaatgct gtgtatctac cctaactact aaacacatat2100ttcaatcgaa aaacatattc caccttcacc atatctaaca cctgaagtct ttcacttttt2160gaacgaagtc atcagaacat gcagataagc tattacccaa aacagagata tgactggaaa2220tgttgtcgta aattgatcca acatagaaaa atcaagacca gttccagatg tcaaagcaat2280aacactttcc caccatggtt acagaaacca tagttacaca aaacatgttt cctaaaccaa2340catactaaag ggatatataa atttgacatc actttatcac cataccataa gatagcttaa2400aaacaaactg acctttgtat ctatgtcctg atcaagcaga tcatttatag tacaaccagc2460acctctaaga agtaatgctc cgcaaccaaa taaagccata tatttaaaac ttggaaggct2520tccaggatca gcagccaacg caatcgacct atacaacaat gatggagatt cagagtatcg2580atctatttac atagctctgg aactagatcc atgacgaaac atggaacatc gttataatat2640ctaaagactt ccaaacagat tcctgagtaa gaaacccagt ggaactatag tactgtaaca2700tatataaaat caaagaaaac tcaggtttat agcattatcc aatcctgatt tctgccaatc2760cttaaccact ctcccatgct atcaaaaacc tcagctcaag atcatactac ctaattgcct2820atgagctctt gggaagatca ttatggattt gataactgaa aaaagtaaca gagaaatagc2880agactgcaag aactactcca aacttctcca ctgatatgta tgtagtctaa caataataaa2940cagacataaa ttcttttatc aagcttcaag agcaagttag tcagaaaaca tcacagccaa3000accaaccagg aaaacacata actttatcac ataaaactaa atttaatgta atctgactta3060acataaacca tcctttggga cgaaaggaaa ctatataaac atgcagtctt tctttccctc3120agctattctt tcggatggat tataatgaat ctcaaaagtg aaatgtcttg attctcagct3180acattactca aaggcgaaga taaacttacc acatacaagg ccacgcaagc aaccaagttc3240caatgggttt atccaatcga gcaagcttag cataacctct aacttcttct ggtaaataca3300aatctatcca agaagcttcc ttaacaacaa caccatcact cttctcctta tcatctttct3360tcggctttcc ctccaaaacc gaagaagacg acgacattcc acaaattaat ctgtaattcc3420aaccaacacc aaaaaacttc tcctgatgca attctcttcc tttactccat acttggtaat3480tatcattcca tgaaggataa cacttagtga aaggatttgt gtaatgggta gtcacaggat3540tggacaagga tttatgttgt gattgcaaaa gagcagagga agaagatgga gttacggaga3600cggaagattt caacaaccgt cttgaaacac gggagagccc aaaaaacgcc atctttgaga3660gaaattgttg cctggaagaa acaaagactt gagatttcaa acgtaagtga attcttacga3720acgaaagcta acttctcaag agaatcagat tagtgattcc tcaaaaacaa acaaaactat3780ctaatttcag tttcgagtga tgaagcctta agaatctaga acctccatgg cgtttctaat3840ctctcagaga taatcgaatt ccttaaacaa tcaaagctta gaaagagaag aacaacaaca3900acaacaaaaa aaatcagatt aacaaccgac cagagagcaa cgacgacgcc ggcgagaaag3960agcacgtcgt ctcggagcaa gacttcttct ccagtaaccc ggatggatcg ttaatgggcc4020tgtagattat tatatttggg ccgaaacaat tgggtcagca aaaacttggg ggataatgaa4080gaaacacgta cagtatgcat ttaggctcca aattaattgg ccatataatt cgaatcagat4140aaactaatca acccctacct tacttatttc tcactgtttt tatttctacc ttagtagttg4200aagaaacact tttatttatc ttttcgggac ccaaatttga taggatcggg ccattactca4260tgagcgtcag acacatatta gccttatcag attagtgggg taaggttttt ttaattcggt4320aagaagcaac aatcaatgtc ggagaaatta aagaatctgc atgggcgtgg cgtgatgata4380tgtgcatatg gagtcagttg ccgatcatat ataactattt ataaactaca tataaagact4440actaatagat 4450<210>93<211>2850<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>93aattaaaatt tgagcggtct aaaccattag accgtttaga gatccctcca acccaaaata 60gtcgattttc acgtcttgaa catatattgg gccttaatct gtgtggttag taaagacttt 120tattggtcaa agaaaaacaa ccatggccca acatgttgat acttttattt aattatacaa 180gtacccctga attctctgaa atatatttga ttgacccaga tattaatttt aattatcatt 240tcctgtaaaa gtgaaggagt caccgtgact cgtcgtaatc tgaaaccaat ctgttcatat 300gatgaagaag tttctctcgt tctcctccaa cgcgtagaaa attctgacgg cttaacgatg 360tggcgaagat ctgttgttta tcgtttctct tcaagaatct ctgtttcttc ttcgttacca 420aaccctagac tgattccttg gtcccgcgaa ttatgtgccg ttaatagctt ctcccagcct 480ccggtctcga cggaatcaac tgctaagtta gggatcactg gtgttagatc tgatgccaat 540cgagtttttg ccactgctac tgccgccgct acagctacag ctaccaccgg tgagatttcg 600tctagagttg cggctttggc tggattaggg catcactacg ctcgttgtta ttgggagctt 660tctaaagcta aacttaggta tgtgtttact tttcttttct catgaaaaat ctgaaaattt 720ccaattgttg gattcttaaa ttctcatttg ttttatggtt gtagtatgct tgtggttgca 780acttctggaa ctgggtatat tctgggtacg ggaaatgctg caattagctt cccggggctt 840tgttacacat gtgcaggaac catgatgatt gctgcatctg ctaattcctt gaatcaggtc 900attgaaatgt tgagaagttc ataaatttcg aatccttgtt gtgtttatgt agttgatctt 960gcttgcttat gtttatgtag ttgaaaagtt taaaaatttc taatccttgg tagttgatct1020cgcttgtttg ttttttcatt ttctagattt ttgagataag caatgattct aagatgaaaa1080gaacgatgct aaggccattg ccttcaggac gtattagtgt tccacacgct gttgcatggg1140ctactattgc tggtgcttct ggtgcttgtt tgttggccag caaggtgaat gtttgttttt1200ttatatgtga tttctttgtt ttatgaatgg gtgattgaga gattatggat ctaaactttt1260gcttccacga caaggttatt gcagactaat atgttggctg ctggacttgc atctgccaat1320cttgtacttt atgcgtttgt ttatactccg ttgaagcaac ttcaccctat caatacatgg1380gttggcgctg ttgttggtgc tatcccaccc ttgcttgggt aaatttttgt tccttttctt1440ctttatttta gcagattctg ttttgttgga tactgctttt aattcaaaat gtagtcatgg1500ttcaccaatt ctatgcttat ctattttgtg tgttgtcagg tgggcggcag cgtctggtca1560gatttcatac aattcgatga ttcttccagc tgctctttac ttttggcaga tacctcattt1620tatggccctt gcacatctct gccgcaatga ttatgcagct ggagggtaag accatatggt1680gtcatatgag attagaatgt ctccttccat gtagtgttga tcttgaacta gttcaatttc1740gtggaatgat cagagtgtcc tagatagtgt cacagcagtc gacattttag tggctagata1800atgagttctt tccgttagag ataaacattc gcgaacattg tttccagctt ccgcgaccca1860acttctgatt ttgtttcttg gtaccttgtt ttcagttaca agatgttgtc actctttgat1920ccgtcaggga agagaatagc agcagtggct ctaaggaact gcttttacat gatccctctc1980ggtttcatcg cctatgactg tgagtcttgt agattcatct tttttttgta gtttattgac2040tgcattgctg tatctgattt ttgctgttcc ttccaatttt tgtgacaggg gggttaacct2100caagttggtt ttgcctcgaa tcaacacttc tcacactagc aatcgctgca acagcatttt2160cattctaccg agaccggacc atgcataaag caaggaaaat gttccatgcc agtcttctct2220tccttcctgt tttcatgtct ggtcttcttc tacaccgtgt ctctaatgat aatcagcaac2280aactcgtaga agaagccgga ttaacaaatt ctgtatctgg tgaagtcaaa actcagaggc2340gaaagaaacg tgtggctcaa cctccggtgg cttatgcctc tgctgcaccg tttcctttcc2400tcccagctcc ttccttctac tctccatgat aacctttaag caagctattg aatttttgga2460aacagaaatt aaaaaaaaaa tctgaaaagt tcttaagttt aatctttggt taataatgaa2520gtggagaacg catacaagtt tatgtatttt ttctcatctc cacataattg tattttttct2580ctaagtatgt ttcaaatgat acaaaataca tactttatca attatctgat caaattgatg2640aatttttgag ctttgacgtg ttaggtctat ctaataaacg tagtaacgaa tttggttttg2700gaaatgaaat ccgataaccg atgatggtgt agagttaaac gattaaaccg ggttggttaa2760aggtctcgag tctcgacggc tgcggaaatc ggaaaatcac gattgaggac tttgagctgc2820cacgaagatg gcgatgaggt tgaaatcaat 2850<210>94<211>3660<212>DNA<213>拟南芥属种(Arabidopsis sp)<400>94tatttgtatt tttattgtta aattttatga tttcacccgg tatatatcat cccatattaa 60tattagattt attttttggg ctttatttgg gttttcgatt taaactgggc ccattctgct 120tcaatgaaac cctaatgggt tttgtttggg ctttggattt aaaccgggcc cattctgctt 180caatgaaggt cctttgtcca acaaaactaa catccgacac aactagtatt gccaagagga 240tcgtgccaca tggcagttat tgaatcaaag gccgccaaaa ctgtaacgta gacattactt 300atctccggta acggacaacc actcgtttcc cgaaacagca actcacagac tcacaccact 360ccagtctccg gcttaactac caccagagac gattctctct tccgtcggtt ctatgacttc 420gattctcaac actgtctcca ccatccactc ttccagagtt acctccgtcg atcgagtcgg 480agtcctctct cttcggaatt cggattccgt tgagttcact cgccggcgtt ctggtttctc 540gacgttgatc tacgaatcac ccggtagtta gcattctgtt ggatagattg atgaatgttt 600tcttcgattt tttttttact gatcttgttg tggatctctc gtagggcgga gatttgttgt 660gcgtgcggcg gagactgata ctgataaagg tatgattttt tagttgtttt tattttctct 720ctcttcaaaa ttctcttttc aaacactgtg gcgtttgaat ttccgacggc agttaaatct 780cagacacctg acaaggcacc agccggtggt tcaagcatta accagcttct cggtatcaaa 840ggagcatctc aagaaactgt aattttgttc atctcctcag aatcttttaa attatcatat 900ttgtggataa tgatgtgtta gtttaggaat tttcctacta aaggtaatct cttttgagga 960caagtcttgt ttttagctta gaaatgatgt gaaaatgttg tttgttagct aaaaagagtt1020tgttgttata ttctgtattc agaataaatg gaagattcgt cttcagctta caaaaccagt1080cacttggcct ccactggttt ggggagtcgt ctgtggtgct gctgcttcag gtaatcatac1140gaacctcttt tggatcatgc aatactgtac agaaagtttt ttcattttcc ttccaattgt1200ttcttctggc agggaacttt cattggaccc cagaggatgt tgctaagtcg attctttgca1260tgatgatgtc tggtccttgt cttactggct atacacaggt ctggttttac acaacaaaaa1320gctgacttgt tcttattcta gtgcatttgc ttggtgctac aataacctag acttgtcgat1380ttccagacaa tcaacgactg gtatgataga gatatcgacg caattaatga gccatatcgt1440ccaattccat ctggagcaat atcagagcca gaggtaactg agacagaaca ttgtgagctt1500ttatctcttt tgtgattctg atttctcctt actccttaaa atgcaggtta ttacacaagt1560ctgggtgcta ttattgggag gtcttggtat tgctggaata ttagatgtgt gggtaagttg1620gcccttctga cattaactag tacagttaaa gggcacatca gatttgctaa aatcttccct1680tatcaggcag ggcataccac tcccactgtc ttctatcttg ctttgggagg atcattgcta1740tcttatatat actctgctcc acctcttaag gtaagtttta ttcctaactt ccactctcta1800gtgataagac actccatcca agttttggag ttttgaatat cgatatctga actgatctca1860ttgcagctaa aacaaaatgg atgggttgga aattttgcac ttggagcaag ctatattagt1920ttgccatggt aagatatctc gtgtatcaat aatatatggc gttgttctca tctcattgat1980ttgtttcttg ctcacttgac tgataggtgg gctggccaag cattgtttgg cactcttacg2040ccagatgttg ttgttctaac actcttgtac agcatagctg gggtactctt ttggcaaacc2100ttttatgttg cttttttcgt tatctgttgt aatatgctct tgcttcatgt tgtacctttg2160tgataatgca gttaggaata gccattgtta acgacttcaa aagtgttgaa ggagatagag2220cattaggact tcagtctctc ccagtagctt ttggcaccga aactgcaaaa tggatatgcg2280ttggtgctat agacattact cagctttctg ttgccggtat gtactatcca ctgtttttgt2340gcagctgtgg cttctatttc ttttccttga tcttatcaac tggatattca ccaatggtaa2400agcacaaatt aatgaagctg aatcaacaaa ggcaaaacat aaaagtacat tctaatgaaa2460tgagctaatg aagaggaggc atctactttt atgtttcatt agtgtgattg atggattttc2520atttcatgct tctaaaacaa gtattttcaa cagtgtcatg aaataacaga acttatatct2580tcatttgtac ttttactagt ggatgagtta cacaatcatt gttatagaac caaatcaaag2640gtagagatca tcattagtat atgtctattt tggttgcagg atatctatta gcatctggga2700aaccttatta tgcgttggcg ttggttgctt tgatcattcc tcagattgtg ttccaggtaa2760agacgttaac agtctcacat tataattaat caaattcttg tcactcgtct gattgctaca2820ctcgcttcta taaactgcag tttaaatact ttctcaagga ccctgtcaaa tacgacgtca2880agtaccaggt aagtcaactt agtacacatg tttgtgttct tttgaaatat ctttgagagg2940tctcttaatc agaagttgct tgaaacactc atcttgatta caggcaagcg cgcagccatt3000cttggtgctc ggaatatttg taacggcatt agcatcgcaa cactgaaaaa ggcgtatttt3060gatggggttt tgtcgaaagc agaggtgttg acacatcaaa tgtgggcaag tgatggcatc3120aactagttta aaagattttg taaaatgtat gtaccgttat tactagaaac aactcctgtt3180gtatcaattt agcaaaacgg ctgagaaatt gtaattgatg ttaccgtatt tgcgctccat3240ttttgcattt cctgctcata tcgaggattg gggtttatgt tagttctgtc acttctctgc3300tttcagaatg tttttgtttt ctgtagtgga ttttaactat tttcatcact ttttgtattg3360attctaaaca tgtatccaca taaaaacagt aatatacaaa aatgatactt cctcaaactt3420tttataatct aaatctaaca actagctagt aacccaacta acttcataca attaatttga3480gaaactacaa agactagact atacatatgt tatttaacaa cttgaaactg tgttattact3540acctgatttt tttctattct acagccattt gatatgctgc aatcttaaca tatcaagtct3600cacgttgttg gacacaacat actatcacaa gtaagacacg aagtaaaacc aaccggcaac3660
权利要求
1.一种编码异戊烯转移酶的分离的核酸序列。
2.如权利要求1中所述的分离的核酸序列,其中所述异戊烯转移酶选自直链异戊烯转移酶和芳香族异戊烯转移酶。
3.如权利要求1所述的所述的分离的DNA序列,其中所述核酸序列由真核细胞源分离得到。
4.如权利要求3所述的分离的DNA序列,其中所述真核细胞源选自哺乳动物、线虫、真菌及植物细胞。
5.如权利要求4中所述的DNA编码序列,其中所述异戊烯转移酶蛋白来自于拟南芥属。
6.如权利要求5所述的DNA编码序列,其中所述异戊烯转移酶蛋白由选自
图1的序列编码。
7.如权利要求4所述的DNA编码序列,其中所述异戊烯转移酶蛋白来自于谷类。
8.如权利要求7所述的DNA编码序列,其中所述异戊烯转移酶蛋白由包含图3所示序列的EST的序列编码。
9.如权利要求4所述的DNA编码序列,其中所述异戊烯转移酶蛋白来源于大豆。
10.如权利要求9所述的DNA编码序列,其中所述异戊烯转移酶蛋白由包含图2和图9所示序列的ESTs的序列编码。
11.如权利要求1所述的分离的DNA序列,其中所述核酸序列从原核细胞源分离得到。
12.如权利要求11所述的所述的分离的DNA序列,其中所述原核细胞源为集胞蓝细菌属。
13.一种核酸构建体,包含作为有效结合组分的宿主细胞中的功能性转录起始区、编码异戊烯转移酶的核酸序列和转录终止区。
14.如权利要求13所述的核酸构建体,其中所述编码异戊烯转移酶的核酸序列由真核生物和原核生物的生物体中获得。
15.如权利要求14所述的核酸构建体,其中所述编码异戊烯转移酶的核酸序列由植物源获得。
16.如权利要求15所述的核酸构建体,其中所述编码异戊烯转移酶的核酸序列由拟南芥属、大豆及谷物获得。
17.如权利要求13所述的核酸构建体,其中所述编码异戊烯转移酶的核酸序列由集胞蓝细菌属获得。
18.一种植物细胞,包含权利要求13所述的构建体。
19.一种改变宿主细胞中生育酚含量的方法,包括用一构建体转化该宿主细胞,该构建体包含作为有效结合组分的宿主细胞中的功能性转录起始区、编码异戊烯转移酶的核酸序列和转录终止区。
20.如权利要求19所述的方法,其中所述宿主细胞选自原核细胞和真核细胞。
21.如权利要求20所述的方法,其中所述原核细胞是集胞蓝细菌属
22.如权利要求20所述的方法,其中所述真核细胞是植物细胞。
23.如权利要求22所述的方法,其中所述植物细胞由拟南芥属、大豆及谷物获得。
24.一种在宿主细胞中生产目的生育酚化合物的方法,该方法包括获得转化的宿主细胞,该宿主细胞在其基因组中含有并表达含有编码异戊烯转移酶的DNA序列的构建体,该构建体有效地连接到宿主细胞中的转录起始区,其中所述异戊烯转移酶参与生育酚的合成。
25.如权利要求24所述的方法,其中所述宿主细胞选自原核细胞和真核细胞。
26.如权利要求25所述的方法,其中所述原核细胞是集胞蓝细菌属。
27.如权利要求24所述的方法,其中所述真核细胞是植物细胞。
28.如权利要求27所述的方法,其中所述植物细胞选自拟南芥属、大豆及谷物。
29.一种提高宿主细胞内生育酚产物的生物合成量的方法,该方法包括用一构建体转化该宿主细胞,该构建体包含作为有效结合组分的宿主细胞中的功能性转录起始区、编码异戊烯转移酶的核酸序列和转录终止区。
30.如权利要求29所述的方法,其中所述宿主细胞选自原核细胞和真核细胞。
31.如权利要求30所述的方法,其中所述原核细胞是集胞蓝细菌属。
32.如权利要求30所述的方法,其中所述真核细胞是植物细胞。
33.如权利要求32所述的方法,其中所述植物细胞由拟南芥属、大豆及谷物获得。
全文摘要
提供了生产改变了生育酚含量和组成的植物和种子的核酸序列和方法。这些方法对提高植物中生育酚水平及在宿主植物细胞中产生希望的生育酚成分具有特殊的用途。
文档编号C12P17/06GK1408024SQ00808784
公开日2003年4月2日 申请日期2000年4月14日 优先权日1999年4月15日
发明者B·萨维季, M·W·拉斯纳, J·D·韦斯, D·波斯特-比特恩米勒 申请人:卡尔根尼有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1