编码wrinkled1样多肽的核酸分子及在植物中的使用方法

文档序号：178622阅读：1054来源：国知局

专利名称：编码wrinkled1样多肽的核酸分子及在植物中的使用方法
技术领域：
本文所述为植物遗传工程领域的发明，包括编码改善农学、园艺和品质性状的多肽的分离的核酸分子。本发明一般涉及编码与植物中种子贮藏化合物的存在相关的蛋白质的核酸序列。更具体地，本发明涉及编码糖和脂类代谢调节蛋白的WRINKLED1样(WRI1样)核酸序列以及这些序列在转基因植物中的用途。尤其是本发明涉及操作糖相关化合物以在植物和种子中提高油水平和改变脂肪酸组成的方法。本发明还涉及使用这些新的植物多肽刺激植物生长和/或提高种子贮藏化合物的产量和/或组成的方法。

背景技术：
植物的研究和遗传操作有很长的历史，甚至早在Gregor Mendel的著名研究之前就已经开始了。在这门学科的完善过程中，科学家已经实现了对植物中特定性状的修饰，范围从具有提高的淀粉含量的马铃薯块茎到具有提高或改变的脂肪酸含量的油料种子作物(如芸苔和向日葵)。随着植物油消费和使用的增长，对种子油含量和种子油水平的修饰日益广泛(如

等，1995，Science 268681-686)。对转基因植物中生物合成途径的操作为分子生物学家和植物生物化学家提供了许多机会，产生具有较高价值的特定产品。已经在许多传统种子油植物(如大豆(美国专利号5,955,650)、芸苔(美国专利号5,955,650)、向日葵(美国专利号6,084,164)和油菜(

等，1995，Science 268681-686))和非常规种子油植物(如烟草(Cahoon等，1992，Proc.Natl.Acad.Sci.USA 8911184-11188))中改变了种子油产生或组成。
植物种子油包含中性和极性脂类(见表1)。中性脂类主要包括三酰甘油，它是种子油体中累积的主要贮藏脂类。极性脂类主要可见于种子细胞的多种膜中，如内质网、微粒体膜和细胞膜。中性和极性脂类含有若干常见脂肪酸(见表2)和一系列较不常见的脂肪酸。表2中用星号标出的脂类一般不存在于植物种子油中，但它们在转基因植物种子油中的产生在植物生物技术中是重要的。膜脂的脂肪酸组成是高度受控的，在膜脂中只可见到选定数目的脂肪酸。另一方面，在许多植物物种的种子中，多种非常见脂肪酸可以掺入中性贮藏脂类中(Van de Loo等，1993，Unusual Fatty Acidsin Lipid Metabolism in Plants 91-126页，TS Moore Jr编辑。CRC Press；Millar等，2000，Trends Plant Sci.595-101)。
表1 植物脂类类别表2 常见植物脂肪酸脂类合成自脂肪酸，其合成可以分成两个部分原核途径和真核途径(Browse等，1986，Biochemical J.23525-31；Ohlrogge & Browse，1995，Plant Cell 7957-970)。原核途径位于质体中，质体是脂肪酸生物合成的主要场所。脂肪酸合成开始于通过乙酰辅酶A羧化酶(ACCase)将乙酰辅酶A转化为丙二酸单酰辅酶A。通过丙二酸单酰辅酶A:ACP转酰基酶将丙二酸单酰辅酶A转化为丙二酰酰基载体蛋白(ACP)。β-酮-酰基-ACP合酶III(KAS III)催化缩合反应，其中来自乙酰辅酶A的酰基基团转移到丙二酰-ACP以形成3-酮丁酰-ACP。在其后的一系列缩合、还原和脱水反应中，通过丙二酰-ACP提供的二个碳原子的逐步加入(缩合)延长ACP辅因子上的新生脂肪酸链，直至形成16或18碳的饱和脂肪酸链。质体Δ-9酰基-ACP去饱和酶在脂肪酸中引入第一个不饱和双键。硫酯酶从ACP辅因子上切下脂肪酸，游离的脂肪酸运出至胞质，在胞质中它们作为脂肪酰基辅酶A酯参与真核途径。在此途径中，分别通过甘油-3-磷酸酰基转移酶和溶血磷脂酸酰基转移酶将脂肪酸酯化到甘油-3-磷酸的sn-1和sn-2位置，以得到磷脂酸(PA)。PA是其他极性和中性脂类的前体，中性脂类形成于肯尼迪途径(Voelker，1996，Genetic Engineering Setlow编辑18:111-113；Shanklin &Cahoon，1998，Annu.Rev.Plant Physiol.Plant MoI.Biol.49611-641；Frentzen，1998，Lipids 100161-166；Millar等，2000，Trends Plant Sci.595-101)。
种子中的贮藏脂类合成自碳水化合物衍生的前体。植物在胞质溶胶中具有完整的糖酵解途径(Plaxton，1996，Annu.Rev.Plant Physiol.PlantMoI.Biol.47185-214)，并且已经显示在油菜籽的质体中也存在完整的途径(Kang & Rawsthorne，1994，Plant J.6795-805)。蔗糖是碳和能量的主要来源，从叶转运到正发育种子。在种子的贮藏期中，在胞质溶胶中转化蔗糖以提供代谢前体葡萄糖-6-磷酸和丙酮酸。它们转运到质体中并转化成乙酰辅酶A，其作为脂肪酸合成的主要前体。质体中的乙酰辅酶A是脂类生物合成的中心前体。可以通过不同的反应在质体中形成乙酰辅酶A，但每个反应的确切贡献仍有争议(Ohlrogge & Browse，1995，Plant Cell7957-970)。然而，公认大部分的乙酰辅酶A来自于从胞质运入质体的葡萄糖-6-磷酸和丙酮酸。蔗糖在源器官(叶或发生光合作用的任何地方)中产生并转运至发育的种子(也称为库器官)。在发育的种子中，蔗糖是所有贮藏化合物(即淀粉、脂类和部分种子贮藏蛋白)的前体。因此，蔗糖发挥中心作用的碳水化合物代谢对于种子贮藏化合物的累积是很重要的。
贮藏化合物如三酰甘油(种子油)作为幼苗萌发和生长中所使用的碳和能量的储备。种子(植物)油也是人类饮食的必要成分和提供化工原料的有价值的商品。影响种子贮藏化合物代谢的拟南芥突变体为wrinkled1(wri1)(Focks和Benning，1998)。该突变体特征在于种子油含量降低80％。此外，看来也影响了糖代谢中相关基因的表达。
尽管可以通过植物育种的传统方法修饰种子油中脂类和脂肪酸的含量和/或组成，但重组DNA技术的到来使对植物种子油含量的操作更为简单，而且在一些情况下允许以单靠育种无法实现的方式改变种子油(参阅如

等，1995，Science 268681-686)。例如，在转基因烟草中引入Δ12-羟化酶核酸序列导致在烟草种子油中引入新的脂肪酸——蓖麻油酸(Van deLoo等，1995，Proc.Natl.Acad.Sci USA 926743-6747)。还改造了烟草植物以通过引入并表达来自芫荽的酰基-ACP去饱和酶来产生低水平的岩芹酸(Cahoon等，1992，Proc.Natl.Acad.Sci USA 8911184-11188)。
对植物中种子油含量的修饰具有重要的医学、营养学和经济分支。就医学分支而言，已经将可见于许多种子油的长链脂肪酸(C18及更长)和与冠心病相关的高胆固醇血症和其他临床病症的减少相联系(Brenner，1976，Adv.Exp.Med.Biol.8385-101)。因此，消费具有提高水平的这些类型脂肪酸的植物可以降低心脏病的风险。种子油含量的提高的水平还提高了种子油的大规模生产，从而降低这些油的费用。
为了提高或改变植物中化合物如种子油的水平，必须鉴定调节脂类和脂肪酸代谢的核酸序列和蛋白质。如上文所提到的，已经克隆了若干去饱和酶核酸如Δ6-去饱和酶核酸、Δ12-去饱和酶核酸和酰基-ACP去饱和酶核酸，并已证明其编码多种植物物种中脂肪酸合成所需的酶。还已经克隆了来自不同物种如芸苔、大豆、胡萝卜、松和拟南芥的油质蛋白核酸序列，并已确定其编码与这些植物中油体的磷脂单层膜结合的蛋白质。
还已经确定两种植物激素赤霉酸(GA)和脱落酸(ABA)与种子发育的总体调节过程相关(如Ritchie & Gilroy，1998，Plant Physiol.116765-776；Arenas-Huertero等，2000，Genes Dev.142085-2096)。GA和ABA途径都受蛋白质磷酸酶抑制剂冈田酸的影响(Kuo等，1996，Plant Cell.8259-269)。通过激酶和磷酸酶调节蛋白质磷酸化已被公认是细胞控制的普遍机制(Cohen，1992，Trends Biochem.Sci.17408-413)。同样，植物激素乙烯(参阅如Zhou等，1998，Proc.Natl.Acad.Sci.USA 9510294-10299；Beaudoin等，2000，Plant Cell 20001103-1115)和生长素(如Colon-Carmona等，2000，Plant Physiol.1241728-1738)也与植物发育的控制相关。
尽管已知普遍影响植物和种子发育的若干化合物，但仍明确需要具体鉴定对于贮藏化合物累积的发育调节更具特异性的因子和鉴定具有赋予其宿主植物及其他植物物种改变或提高的油产生能力的基因。本发明公开了来自拟南芥(Arabidopsis thaliana)、欧洲油菜(Brassica napus)、大豆(Glycine max)、稻(Oryza sativa)或普通小麦(Triticum aestivum)的核酸序列。这些核酸序列可用于改变或提高植物中种子贮藏化合物如蛋白质、糖和油的水平，所述植物包括转基因植物，如油菜、亚麻子、大豆、向日葵、玉米、燕麦、黑麦、大麦、小麦、稻、胡椒、万寿菊、棉花、油椰、椰树、亚麻、蓖麻和花生，它们是含有大量脂类化合物的油料种子植物。
发明概述本发明提供与植物中种子贮藏化合物的代谢相关，特别是与WRI1样序列相关的新的分离的核酸和氨基酸序列。
本发明还提供来自拟南芥、欧洲油菜、大豆、稻和普通小麦的编码脂类代谢蛋白(LMP)或其部分的分离的核酸。这些序列可用于修饰或增加微生物和植物中的脂类和脂肪酸、辅因子和酶。
已知拟南芥植物产生大量的脂肪酸如亚油酸和亚麻酸(见表2)，并且其在许多方面(基因同源性等)与油料作物植物芸苔属十分相似。因此，来源于植物如拟南芥、欧洲油菜、大豆、稻或普通小麦或相关生物的核酸分子特别适用于修饰宿主(特别是微生物和植物)中的脂类和脂肪酸代谢。另外，来自拟南芥、欧洲油菜、大豆、稻或普通小麦的核酸可用于鉴定其他物种中的DNA序列和酶，所述DNA序列和酶可用于修饰各自生物中脂肪酸前体的生物合成。
本发明还提供分离的核酸，所述核酸含有来自植物(拟南芥、欧洲油菜、大豆、稻或普通小麦)的编码脂类代谢蛋白(LMP)或其部分的核酸的至少15个核苷酸的片段。
本发明还提供该核酸编码的多肽、含有该核酸编码的多肽的异源多肽和这些多肽的抗体。
此外，本发明涉及并提供LMP核酸在产生具有修饰水平或组成的种子贮藏化合物的转基因植物中的用途。就改变的组成而言，本发明可用于例如提高油酸相对于其他植物油的百分比。产生具有修饰水平或组成的种子贮藏化合物的转基因植物的方法包括以下步骤用含有LMP核酸的表达载体转化植物细胞和从该植物细胞产生具有修饰水平或组成的种子贮藏化合物的植物。在一个实施方案中，植物为高产油物种，如Kinney等(1994，Current Opin.in Biotech.5144-151)、

等(1995，Science268681-686)和《Oil Crops of the World-Their Breeding and Utilization》(1989，

，Downey和Ashri编辑)中所述。在优选的实施方案中，植物为选自例如油菜、亚麻子、大豆、向日葵、玉米、燕麦、黑麦、大麦、小麦、稻、胡椒、万寿菊、棉花、油棕榈、椰树、亚麻、蓖麻和花生的高产油物种。
根据本发明，本文所述的组合物和方法可用于改变转基因植物中LMP的组成和用于提高或降低转基因植物中LMP的水平，包括提高或降低植物中LMP核酸的表达。可以通过LMP核酸的转基因过表达、共抑制、反义抑制或体内诱变来实现LMP核酸表达的提高或降低。本发明还可用于提高或降低种子油中脂类的水平、用于提高或降低种子油中脂肪酸的水平或用于提高或降低种子或植物中淀粉的水平。
在一个实施方案中，本发明包括并提供用于增加种子中总油含量的方法，所述方法包括用核酸构建体转化植物并培养植物，其中所述核酸构建体含有作为有效连接组分的启动子和能调节WRI1样mRNA或WRI1样蛋白质水平的核酸序列。另外，本发明包括并提供用于提高种子中油酸水平的方法，所述方法包括用核酸构建体转化植物并培养植物，其中所述核酸构建体含有作为有效连接组分的启动子和能提高油酸水平的结构核酸序列。
本发明提供具有修饰水平的种子贮藏化合物，特别是修饰水平的脂类、脂肪酸或糖的转基因植物。本文还包括由转化了LMP DNA序列的转基因植物产生的种子，其中种子含有LMP DNA序列，并且其中植物对于修饰水平的种子贮藏化合物是不分离的。本发明还包括上述种子产生的种子油。本发明还提供含有所述核酸的载体、含有所述载体的宿主细胞和通过用核酸和/或载体转化细胞并培养植物产生的植物的后代植物材料。
根据本发明，本文所述的化合物、组合物和方法可用于提高或降低脂类在种子油中的相对百分比、用于提高或降低脂类在种子油中的水平、用于提高或降低脂肪酸在种子油中的水平、用于提高或降低淀粉或其他碳水化合物在种子或植物中的水平或用于提高或降低蛋白质在种子或植物中的水平。本文所述的操作还可用于提高种子萌发和幼苗和植物的生长以及增强种子贮藏化合物的植物产量。
本发明还提供在表达来自拟南芥、欧洲油菜、大豆、稻或普通小麦的LMP核酸的转基因植物中产生高于或低于正常或典型水平的贮藏化合物的方法，其中所述转基因植物为拟南芥、欧洲油菜、大豆、稻、玉蜀黍(Zeamays)、普通小麦、向日葵(Helianthus anuus)或甜菜(Beta vulgaris)或不同于拟南芥、欧洲油菜、大豆、稻或普通小麦的物种。本文还包括修饰种子贮藏化合物的产生效率的组合物和方法。本文使用的语句拟南芥、欧洲油菜、大豆、稻、玉蜀黍、普通小麦、向日葵或甜菜还指拟南芥和/或欧洲油菜和/或大豆和/或稻和/或普通小麦和/或玉蜀黍和/或向日葵和/或甜菜。
因此，本发明提供来自拟南芥、欧洲油菜、大豆、稻或普通小麦的新的分离的LMP核酸和分离的LMP氨基酸序列及其活性片段、类似物和直向同源物。本领域技术人员会认识到，其他植物物种也含有这些核酸或相关核酸，因此这些活性片段、类似物和直向同源物也可以来自不同的植物物种。
本发明的多核苷酸和多肽(包括其激动剂和/或片段)可具有包括调节植物生长和潜在植物产量，优选提供不利条件(干旱、寒冷、光、UV)下增加植物生长的用途。此外，本发明的拮抗剂可具有包括调节植物生长和/或产量(优选通过提高植物生长和产量)的用途。在另一实施方案中，使用组成型启动子过表达本发明多肽可用于通过调节光利用效率而在胁迫条件(干旱、光、寒冷、UV)下提高植物产量。另外，本发明的多核苷酸和多肽可改善种子萌发和种子休眠，因而可改善植物生长和/或种子贮藏化合物的产量。
本发明的分离的核酸分子还可以含有有效连接的启动子或部分启动子区。在一个实施方案中，启动子可以是组成型启动子、诱导型启动子或组织特异性启动子。组成型启动子可以是例如超级启动子(Ni等，Plant J.7661-676，1995；美国专利号5,955,646)或PtxA启动子(PF 55368-2 US，Song等，2004，参阅实施例11)。组织特异性启动子可以在营养组织或生殖组织中具有活性。在生殖组织中具有活性的组织特异性启动子可以是种子特异性启动子。在营养组织中具有活性的组织特异性启动子可以是根特异性、枝条特异性、分生组织特异性或叶特异性启动子。本发明的分离的核酸分子还可以含有5’非翻译序列、3’非翻译序列、内含子或其组合。
本发明还提供通过在植物中表达编码脂类代谢蛋白(LMP)或其部分的分离核酸来提高一种或多种植物器官的数目和/或大小的方法，所述脂类代谢蛋白来自拟南芥、欧洲油菜、大豆、稻或普通小麦。更具体地，操作种子大小、种子数和/或种子重量。还可以增加根的长度，这可以减轻土壤缺水的影响、改善植物支撑/稳定性从而减少倒伏，覆盖更大体积的土壤，从而改善养分摄取。改变的根结构的所有这些优点都具有提高作物产量的潜力。此外，可以通过此申请提供的核酸序列提高叶的数目和大小，通过提高光合成的光捕获能力和光合效率来提高光合成的光利用效率。
在参考下文公开实施方案的详细描述和附带的权利要求书之后，本发明的这些和其他特征和优点将变得显而易见的。
附图简述

图1为用于将Bn WRI01和其他WRI样基因转化进拟南芥或作物植物的双元载体T-DNA的概图。缩写定义如下LB，左边界；pAHAS，拟南芥AHAS启动子；3’AHAS，AHAS终止信号；PtxA，PtxA启动子；Bn WRI01，Bn WRI01的cDNA；3’NOS，终止信号，RB，右边界。
图2为ptxA启动子::Zm Ubiquitin内含子::Bn WRI01嵌合构建体(PtxAZmUbi内含子-Bn WRI01)的图。质粒包含表达构建体，其含有与玉米泛蛋白内含子(Zm Ubi内含子)有效连接的ptxA启动子(ptxA)、欧洲油菜WRINKLED1(Bn WRI01)和来自胭脂碱合酶基因的3’非翻译区和终止(NOS)。SM盒代表选择标记盒。
图3为显示过表达WRI的拟南芥植物中T2和T3种子世代中油总量的图。每个圆代表用一株植物得到的值，显示了独立的转基因事件。通过t检验进行统计学分析。缩写定义如下C24，Columbia 24；Col-2，Columbia2。
图4为显示过表达WRI的拟南芥植物中T2和T3种子世代中油酸(C18:1)水平的图。Col2，野生型Columbia-2；GB007，Columbia 2遗传背景下的空载体对照；C24，Columbia 24；WriRT，PtxA::WRI1过表达子的独立转基因事件。每个条线显示各得自20株植物的平均值。
图5为显示过表达WRI的纯合拟南芥中T2和T3种子世代中亚油酸和亚麻酸水平的图。每个条线显示得自20株植物的平均值。过表达WRI的T3种子世代的纯合拟南芥植物中C18:2含量减少95％，C18:3含量减少80％。使用的缩写定义如下Col2，拟南芥Columbia-2生态型；WRI1-8、10、11，PtxA::WRI1的独立转基因事件。
图6为显示过表达WRI的纯合拟南芥中饱和脂肪酸水平的图。WRI1过表达子中纯合T3种子显示饱和脂肪酸减少30％。使用的缩写定义如下Col2，拟南芥Columbia-2生态型；WRI1-8、10、11，PtxA::WRI1的独立转基因事件。
图7为显示拟南芥wri1突变体和T2种子世代的PtxA::WRI1过表达子的独立转基因株系中种子重量的图。图中显示的值代表得自单个植物的种子的种子重量平均值。使用的缩写定义如下Col2，拟南芥Columbia-2生态型；GB007，空载体对照。
图8为显示与wri1突变体相比，拟南芥野生型Columbia-2在琼脂平板上生长14天后根长度的照片。使用的缩写定义如下WT，野生型Columbia 2；wri1，wrinkled1突变体。
发明详述通过参考下文本发明优选实施方案及其包括的实施例的详细描述可以更易于理解本发明。
在公开和描述本发明的化合物、组合物和方法之前，应该理解本发明不限于具体的核酸、具体的多肽、具体的细胞类型、具体的宿主细胞、具体条件或具体方法等，因为这些当然可以改变，并且其多种修饰和变化对本领域技术人员而言是显而易见的。还应该理解，本文使用的术语仅用于描述具体实施方案的目的，而不是限制性的。取决于所用的上下文，说明书和权利要求书中使用的“一个”指一个或多个。从而，例如，“一个细胞”可以指可以利用的至少一个细胞。
本发明部分基于编码WRI1样LMP的核酸分子的分离和表征，所述核酸分子来自拟南芥、欧洲油菜、大豆、稻和小麦及其相关作物物种如玉米、大麦、亚麻子、甜菜或向日葵。
根据本文具体化或描述的本发明的目的，本发明的一个方面提供来自植物(拟南芥、欧洲油菜、大豆、稻或普通小麦)的编码脂类代谢蛋白(LMP)或其部分的分离的核酸。
本发明的一个方面涉及编码LMP多肽或其生物活性部分的分离的核酸分子，以及足以作为杂交探针或引物用于鉴定或扩增LMP编码核酸(如LMP DNA)的核酸片段。本文使用的术语“核酸分子”旨在包括DNA分子(如cDNA或基因组DNA)和RNA分子(如mRNA)和使用核苷酸类似物产生的DNA或RNA类似物。此术语还包括位于基因编码区3’和5’末端的非翻译序列从编码区5’末端起上游序列的至少约1000个核苷酸和从基因编码区3’末端起下游序列的至少约200个核苷酸。核酸分子可以是单链或双链的，但优选双链DNA。“分离的”核酸分子是与该核酸天然来源中存在的其他核酸分子基本分开的核酸分子。优选的“分离的”核酸基本不含有该核酸来源生物的基因组DNA中天然存在于该核酸侧翼的序列(即序列位于该核酸5’和3’末端的序列)。例如，在多个实施方案中，分离的LMP核酸分子可以含有该核酸来源细胞(如拟南芥、欧洲油菜、大豆、稻或普通小麦细胞)的基因组DNA中天然存在于该核酸侧翼的少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列。另外，“分离的”核酸分子如cDNA分子可以基本不含有其他细胞材料或培养基(通过重组技术产生时)或化学前体或其他化学品(化学合成时)。
可以使用标准分子生物学技术和本文提供的序列信息分离本发明的核酸分子，如具有附录中所示核苷酸序列的核酸分子，或者其部分。例如，可以使用附录中所示序列之一的全部或部分作为杂交探针以及标准杂交技术(如Sambrook等，1989，《Molecular CloningA Laboratory Manual》.第二版，Cold Spring Harbor Laboratory，Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，NY所述)从拟南芥、欧洲油菜、大豆、稻或普通小麦文库中分离拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA。另外，含有附录中所示序列之一的全部或部分的核酸分子可以使用基于此序列设计的寡核苷酸引物通过聚合酶链式反应进行分离(如含有附录中所示序列之一的全部或部分的核酸分子可以使用基于附录中所示的此相同序列设计的寡核苷酸引物通过聚合酶链式反应进行分离)。例如，可以从植物细胞中分离mRNA(例如通过Chirgwin等，1979，Biochemistry185294-5299的硫氰酸胍提取方案)并使用逆转录酶(如可得自Gibco/BRL，Bethesda，MD的Moloney MLV逆转录酶或可得自Seikagaku America，Inc.，St.Petersburg，FL的AMV逆转录酶)制备cDNA。可以基于附录中所示核苷酸序列之一设计用于聚合酶链式反应扩增的合成寡核苷酸引物。可以使用作为模板的cDNA或备选的基因组DNA和适当的寡核苷酸引物按照标准PCR扩增技术扩增本发明的核酸。这样扩增的核酸可以克隆进适当的载体并通过DNA序列分析进行表征。此外，可以通过标准合成技术(如使用自动化DNA合成仪)制备对应于LMP核苷酸序列的寡核苷酸。
在优选的实施方案中，本发明的分离的核酸含有附录中所示核苷酸序列之一。附录中显示的序列对应于本发明的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA。这些cDNA含有编码LMP的序列(即“编码区”)以及5’非翻译序列和3’非翻译序列。或者，核酸分子可以仅含有附录中任一序列的编码区或者可以含有分离自基因组DNA的完整基因组片段。
就本申请而言，应该理解，附录中公开的每个序列都已指定了标识登录号(如BnWRI01)。这些序列的每一个可以一般含有三个部分5’上游区、编码区和下游区。这些序列的编码区标明为“ORF位置”(表3)。
在另一优选的实施方案中，本发明的分离核酸分子含有与附录中所示核苷酸序列之一互补的核酸分子或其部分。与附录中所示核苷酸序列之一互补的核酸分子是与附录中所示核苷酸序列之一足够互补，使得它可以与附录中所示核苷酸序列之一杂交从而形成稳定双链体的核酸分子。
在另一优选的实施方案中，本发明的分离的核酸分子含有与附录中所示核苷酸序列具有至少约50-60％、优选至少约60-70％、更优选至少约70-80％、80-90％或90-95％、甚至更优选至少约95％、96％、97％、98％、99％或者更高同源性的核苷酸序列。在其他优选的实施方案中，本发明的分离的核酸分子含有与附录中所示核苷酸序列之一或其部分杂交(如在严格条件下杂交)的核苷酸序列。这些杂交条件包括在约60℃用盐浓度约0.02摩尔/升的pH7的溶液进行洗涤。
此外，本发明的核酸分子可以仅含有附录中所示序列之一的编码区的部分，例如可用作探针或引物的片段或编码LMP生物活性部分的片段。从来自拟南芥、欧洲油菜、大豆、稻或普通小麦LMP基因的克隆确定的核苷酸序列使得可以产生探针和引物，所述探针和引物设计用于鉴定和/或克隆其他细胞类型和生物中的LMP同源物和来自其他植物或相关物种的LMP同源物。因此本发明还提供含有本文公开的核酸或其片段的化合物。这些化合物包括附着到部分上的核酸。这些部分包括但不仅限于检测部分、杂交部分、纯化部分、递送部分、反应部分、结合部分等。探针/引物一般含有基本纯化的寡核苷酸。寡核苷酸一般含有在严格条件下与附录中公开的核苷酸序列之一的有义链、附录中公开的核苷酸序列之一的反义链或其天然存在的突变体的至少约12个、优选约25个、更优选约40、50或75个连续核苷酸杂交的核苷酸序列区。可以在PCR反应中使用基于附录中所示核苷酸序列的引物克隆LMP同源物。基于LMP核苷酸序列的探针可用于检测编码相同或同源的蛋白质的转录物或基因组序列。在优选的实施方案中，探针还含有附着于其上的标记基团，如标记基团可以是放射性同位素、荧光化合物、酶或酶辅因子。这些探针可用作基因组标记物测试试剂盒的部分，所述试剂盒用于鉴定表达LMP的细胞(例如通过测量细胞样品中LMP编码核酸的水平，如检测LMP mRNA水平)或确定基因组LMP基因是否突变或缺失。
在一个实施方案中，本发明的核酸分子编码蛋白质或其部分，所述蛋白质或其部分包含与附录中所示序列编码的氨基酸足够同源的氨基酸序列，从而所述蛋白质或其部分保持与野生型蛋白质相同或相似的功能。本文使用的用语“足够同源”指这样的蛋白质或其片段其氨基酸序列具有最少数目的与氨基酸序列相同或等价的氨基酸残基(例如与附录中所示序列的ORF之一的氨基酸残基具有相似侧链的氨基酸残基)，从而该蛋白质或其部分能参与植物中种子贮藏化合物的产生所必需的化合物的代谢、微生物或植物细胞膜的构建或分子穿过这些膜的转运。调节蛋白质(如DNA结合蛋白、转录因子、激酶、磷酸酶或代谢途径如脂类、淀粉和蛋白质生物合成途径的蛋白质成员或膜转运系统的蛋白质成员)可能在种子贮藏化合物的生物合成中发挥作用。这些活性的实例在本文中描述(见表3的推定注释)。附录中公开了LMP编码核酸序列的实例。
由于改变或提高的糖和/或脂肪酸产生是希望遗传到多种植物的一般性状，因此这些作物植物也是本发明另一实施方案的遗传改造的优选靶植物，所述植物如玉米、普通小麦、黑麦、燕麦、黑普通小麦、稻、大麦、大豆、花生、棉花、油菜、木薯、胡椒、向日葵、甜菜和万寿菊、茄科植物如马铃薯、烟草、茄子和番茄、叶豌豆物种、豌豆、苜蓿、灌木植物(咖啡、可可、茶)、柳属物种、树木(油椰、椰子)和多年生草本和饲料作物。
由本发明的LMP核酸分子编码的蛋白质部分优选是LMP之一的生物活性部分。本文使用的术语“LMP的生物活性部分”旨在包括参与种子贮藏脂类生物合成所必需的化合物的代谢或微生物或植物细胞膜的构建或分子跨越这些膜的转运或具有表3公开的活性的LMP的部分，如结构域/基序。为测定LMP或其生物活性部分是否能参与种子贮藏化合物和细胞膜的产生所必需的化合物的代谢，可以进行酶活性测定。这些测定方法是本领域技术人员所熟知的，并描述于实施例14。
LMP的生物活性部分包括含有来自LMP的氨基酸序列的氨基酸序列(如由附录中所示核酸编码的氨基酸序列或与LMP同源的蛋白质的氨基酸序列，其包含比全长LMP或与LMP同源的全长蛋白质更少的氨基酸)的肽，并表现LMP的至少一种活性。生物活性部分(肽，如长度为5、10、15、20、30、35、36、37、38、39、40、50、100或更多氨基酸的肽)一般含有具有LMP的至少一种活性的结构域或基序。此外，可以通过重组技术制备缺失了蛋白质的其他区域的其他生物活性部分，并对其评估本文所述的一种或多种活性。优选地，LMP的生物活性部分包含具有生物活性的一个或多个选定的结构域/基序或其部分。
可以通过分离序列之一的部分、表达所编码的LMP部分或肽(如通过体外重组表达)并评估所编码的LMP部分或肽的活性来制备编码LMP生物活性部分的其他核酸片段。
本发明还包括由于遗传密码的简并性而区别于附录中所示核苷酸序列之一(及其部分)，并且与附录中所示核苷酸序列编码相同的LMP的核酸分子。在其他实施方案中，本发明的核酸分子编码与附录中所示可读框所编码的多肽的氨基酸序列基本同源的全长蛋白质。在一个实施方案中，全长核酸或蛋白质或核酸或蛋白质的片段来自拟南芥、欧洲油菜、大豆、稻或普通小麦。
除了附录中所示的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP核苷酸序列以外，本领域技术人员还应该理解，种群(如拟南芥、欧洲油菜、大豆、稻或普通小麦种群)内可能存在引起LMP氨基酸序列变化的DNA序列多态性。由于天然变异，这些LMP基因中的遗传多态性可存在于种群的个体中。本文使用的术语“基因”和“重组基因”指含有编码LMP(优选拟南芥、欧洲油菜、大豆、稻或普通小麦LMP)的可读框的核酸分子。这些天然变异一般可引起LMP基因的核苷酸序列1-40％的变异。作为天然变异的结果并且不改变LMP功能活性的任一或全部这些核苷酸改变和所导致的LMP中氨基酸多态性都意在包括在本发明的范围内。
可以基于与本文公开的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP核酸的同源性，使用拟南芥、欧洲油菜、大豆、稻或普通小麦cDNA或其部分作为杂交探针，在严格杂交条件下按照标准杂交技术分离对应于本发明拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA的天然变体和非拟南芥、非欧洲油菜、非大豆、非稻或非普通小麦直向同源物的核酸分子。本文使用的术语“直向同源物”指来自不同物种，但由共同的祖先基因由物种形成进化而来的两种核酸。直向同源物一般编码具有相同或相似功能的蛋白质。因此，在另一实施方案中，本发明的分离的核酸分子长度至少为15个核苷酸，并在严格条件下与含有附录中所示核苷酸序列的核酸分子杂交。在其他实施方案中，核酸长度至少为30、50、100、250或更多个核苷酸。本文使用的术语“在严格条件下杂交”旨在描述用于杂交和洗涤的条件，在所述条件下彼此至少60％同源的核苷酸序列保持彼此杂交。优选地，所述条件使彼此至少约65％、更优选至少约70％、甚至更优选至少约75％或更高同源性的序列保持彼此杂交。这些严格条件是本领域技术人员所已知的，并可见于《Current Protocols in Molecular Biology》，John Wiley &Sons，N.Y.，19896.3.1-6.3.6。严格杂交条件的优选的非限制性实例为在约45℃在6×氯化钠/柠檬酸钠(SSC)中杂交，其后在50-65℃在0.2×SSC、0.1％SDS中洗涤一次或多次。严格杂交条件的另一优选实例为在65℃在6×SSC中杂交。优选地，在严格杂交条件下与附录中所示序列杂交的本发明的分离的核酸分子对应于天然存在的核酸分子。本文使用的“天然存在的”核酸分子指具有在自然界中存在(如编码天然蛋白质)的核苷酸序列的RNA或DNA分子。在一个实施方案中，核酸编码天然的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP。
除了种群中可能存在的LMP序列的天然存在的变体以外，本领域技术人员还会理解，可以通过在附录中所示核苷酸序列的突变引入变化，从而引起所编码LMP的氨基酸序列的变化而不改变LMP的功能能力。例如，可以在附录中所示序列内产生引起“非必需”氨基酸残基处的氨基酸替换的核苷酸替换。“非必需”氨基酸残基是可以从LMP之一的野生型序列(附录)改变而不改变所述LMP活性的残基，而“必需”氨基酸残基是LMP活性所需要的。然而，其他氨基酸残基(如在具有LMP活性的结构域中不保守或仅半保守的残基)可能对于活性不是必需的，因此可能适于进行改变而不改变LMP活性。
因此，本发明的另一方面涉及编码LMP的核酸分子，所述LMP含有LMP活性非必需的氨基酸残基的改变。这些LMP在氨基酸序列上与序列不同，但仍保持至少一种本文所述的LMP活性。在一个实施方案中，分离的核酸分子含有编码蛋白质的核苷酸序列，其中所述蛋白质含有与附录中所示核酸编码的氨基酸序列至少50％同源的氨基酸序列，并能够参与拟南芥、欧洲油菜、大豆、稻或普通小麦中种子贮藏化合物的产生所必需的化合物或细胞膜的代谢，或者具有一种或多种表3公开的活性。优选地，核酸分子编码的蛋白质与附录中所示核酸编码的序列之一至少约50-60％同源，更优选与附录中所示核酸编码的序列之一至少约60-70％同源，甚至更优选与附录中所示核酸编码的序列之一至少约70-80％、80-90％、90-95％同源，并且最优选与附录中所示核酸编码的序列之一至少约96％、97％、98％或99％同源。
为确定两个氨基酸序列(如附录中所示核酸编码的序列之一及其突变体形式)或两个核酸之间的同源性百分比，以最佳比较的目的将序列进行比对(例如为了与一个蛋白质或核酸的最佳的比对，可以在另一个蛋白质或核酸的序列中引入缺口)。接着比较相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当一个序列(例如附录中所示核酸编码的序列之一)中的位置被与另一序列(例如选自附录中所示核酸编码的多肽的序列的突变体形式)相应位置上相同的氨基酸残基或核苷酸占据时，则两分子在该位置上是同源的(即，本文使用的氨基酸或核酸“同源性”等价于氨基酸或核酸“同一性”)。两序列的同源性百分比是序列间共享的相同位置的数目的函数(即同源性百分比＝相同位置的数目/位置总数×100)。
可以通过向附录中所示核苷酸序列中引入一个或多个核苷酸的替换、添加或缺失，并因而向编码的蛋白质中引入一个或多个氨基酸替换、添加或缺失而产生编码与附录中所示核酸编码的蛋白质序列同源的LMP的分离的核酸分子。可以通过标准技术(如位点定向诱变和PCR介导的诱变)向附录中所示序列中引入突变。优选地，在一个或多个预测的非必需氨基酸残基处进行保守性氨基酸替换。“保守性氨基酸替换”是将氨基酸残基用具有相似侧链的氨基酸残基替代的替换。本领域已经定义了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此，LMP中预测的非必需氨基酸残基优选被来自同一侧链家族的另一氨基酸替代。另外，在另一实施方案中，可以如通过饱和诱变在全部或部分的LMP编码序列中随机引入突变，可以筛选所得突变体的本文所述的LMP活性以鉴定保留LMP活性的突变体。对附录中所示序列之一进行诱变后，可以重组表达编码的蛋白质并可以使用如本文所述的测定(参阅实施例14-15和17-18)来测定蛋白质的活性。
优选通过重组DNA技术产生LMP。例如，将编码蛋白质的核酸分子克隆进表达载体(如上文所述)，将表达载体引入宿主细胞(如上文所述)并在宿主细胞中表达LMP。接着可以使用标准蛋白质纯化技术通过适当的纯化方案分离LMP。除了重组表达以外，可以使用标准肽合成技术化学合成LMP或其肽。此外，可以使用如抗LMP抗体从细胞中分离天然LMP，所述抗体可以利用本发明的LMP或其片段通过标准技术产生。
本发明还提供LMP嵌合或融合蛋白。本文使用的LMP“嵌合蛋白”或“融合蛋白”含有与非LMP多肽有效连接的LMP多肽。“LMP多肽”指具有与LMP相对应的氨基酸序列的多肽，而“非LMP多肽”指具有与LMP基本不同源的蛋白质相对应的氨基酸序列的多肽，例如与LMP不同并来自相同或不同生物的蛋白质。就融合蛋白而言，术语“有效连接”旨在表示LMP多肽和非LMP多肽彼此相互融合，使得两个序列都发挥对所使用序列期望的功能。可将非LMP多肽融合在LMP多肽的N端或C端。例如，在一个实施方案中，融合蛋白为GST-LMP(谷胱甘肽S-转移酶)融合蛋白，其中LMP序列与GST序列的C端融合。这样的融合蛋白可方便重组LMP的纯化。在另一实施方案中，融合蛋白是在其N端含有异源信号序列的LMP。在某些宿主细胞(如哺乳动物宿主细胞中)，可以通过使用异源信号序列提高LMP的表达和/或分泌。
优选通过标准重组DNA技术产生本发明的LMP嵌合或融合蛋白。例如，根据常规技术将编码不同多肽序列的DNA片段符合读框地连接在一起，例如通过使用平末端或粘末端用于连接、限制酶消化以产生合适的末端、适当补平粘性末端、碱性磷酸酶处理以避免不希望的连接，和酶促连接。在另一实施方案中，可通过常规技术包括自动化DNA合成仪合成融合基因。或者，可使用锚定引物进行基因片段的PCR扩增，这产生两个连续基因片段之间的互补突出端，其可随后退火并再扩增以产生嵌合基因序列(参阅如《Current Protocols in Molecular Biology》，Ausubel等编辑，John Wiley & Sons1992)。此外，许多已经编码融合部分(例如GST多肽)的表达载体是市售的。可将LMP编码核酸克隆进这样的表达载体从而将融合部分与LMP框内连接。
除了上述编码LMP的核酸分子以外，本发明的另一方面涉及与其反义的分离的核酸分子。“反义”核酸含有与编码蛋白质的“有义”核酸互补的核苷酸序列，如与双链cDNA分子的编码链互补或与mRNA序列互补的核苷酸序列。因此，反义核酸可以通过氢键与有义核酸结合。反义核酸可与完整的LMP编码链互补，或者只与其部分互补。在一个实施方案中，反义核酸分子与编码LMP的核苷酸序列的编码链的“编码区”反义。术语“编码区”指含有翻译成氨基酸残基的密码子的核苷酸序列区(如BnWRI01的完整编码区包括核苷酸1至1245)。在另一实施方案中，反义核酸分子与编码LMP的核苷酸序列的编码链的“非编码区”反义。术语“非编码区”指编码区侧翼的不翻译成氨基酸的5’和3’序列(即也称为5’和3’非翻译区)。
已知编码本文公开的LMP的编码链序列(如附录中公开的序列)，可根据Watson和Crick碱基配对原则设计本发明的反义核酸。反义核酸分子可以与LMP mRNA的完整编码区互补，但更优选为只与LMP mRNA编码区或非编码区的一部分反义的寡核苷酸。例如，反义寡核苷酸可以与LMP mRNA翻译起始位点周围的区域互补。反义寡核苷酸的长度可以为例如约5、10、15、20、25、30、35、40、45或50个核苷酸。可以使用本领域已知的方法，利用化学合成和酶连接反应构建本发明的反义或有义核酸。例如，可以使用天然存在的核苷酸或各种修饰的核苷酸化学合成反义核酸(例如反义寡核苷酸)，所述修饰的核苷酸设计用于提高分子的生物稳定性或提高反义和有义核酸间形成的双链体的物理稳定性，例如可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用于产生反义核酸的修饰的核苷酸的实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟基甲基)尿嘧啶、5-羧基甲基氨基-甲基-2-硫尿苷、5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基queosine、次黄苷、N-6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基次黄苷、2，2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N-6-腺嘌呤、7-甲基鸟嘌呤、5-甲基-氨基甲基尿嘧啶、5-甲氧基氨基-甲基-2-硫尿嘧啶、β-D-甘露糖基queosine、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N-6-异戊烯腺嘌呤、尿嘧啶-5-羟基乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-硫代胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟基乙酸甲酯、尿嘧啶-5-羟基乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w及2，6-二氨基嘌呤。另外，可以使用表达载体来生物产生反义核酸，在表达载体中已经亚克隆了反义方向的核酸(即从插入的核酸转录产生的RNA将为目的靶核酸的反义方向，下文另有描述)。
在反义技术的另一种变通方案中，可以使用双链干扰RNA构建体引起转基因植物中LMP mRNA水平和LMP活性的下调。这需要用嵌合构建体转化植物，所述嵌合构建体含有有义方向的LMP序列部分与LMP序列相同部分的反义序列的融合。可以使用不同长度的DNA接头区分开构建体中LMP序列的有义和反义片段。
一般对细胞施用或原位产生本发明的反义核酸分子，以使它们与编码LMP的细胞mRNA和/或基因组DNA杂交或结合，从而(如通过抑制转录和/或翻译)抑制蛋白质的表达。可以通过常规核苷酸互补性形成稳定双链体进行杂交，或者在与DNA双链体结合的反义核酸分子的情况下，通过双螺旋大沟中的特异性相互作用进行杂交。可以修饰反义分子以使其与表达于选定的细胞表面的受体或抗原结合，例如通过将反义核酸分子和与细胞表面受体或抗原结合的肽或抗体连接。还可以使用本文所述的载体将反义核酸分子递送到细胞。为得到反义分子足够的胞内浓度，优选将反义核酸分子置于强原核、病毒或真核(包括植物)启动子控制下的载体构建体。
在另一实施方案中，本发明的反义核酸分子为α-端基异构核酸分子。α-端基异构核酸分子与互补RNA形成特异双链杂合体，其中与常见的单位相反，两条链为互相平行(Gautier等，1987，Nucleic Acids Res 156625-6641)。反义核酸分子也可以包含2’-O-甲基-核糖核苷酸(Inoue等，1987，Nucleic Acids Res 156131-6148)或嵌合RNA-DNA类似物(Inoue等，1987，FEBS Lett 215327-330)。
在另一实施方案中，本发明反义核酸为核酶。“核酶”是指具有核糖核酸酶活性的催化性RNA分子，它能够切割具有其互补区的单链核酸(如mRNA)。因此，核酶(如Haselhoff和Gerlach，1988，Nature 334585-591中描述的锤头状核酶)可用于催化性切割LMP mRNA转录物以抑制LMPmRNA的翻译。可以基于本文公开的LMP cDNA的核苷酸序列(例如，附录中的Bn01)或基于在根据本发明教导的方法分离的异源序列来设计对LMP编码核酸具有特异性的核酶。例如，可以构建四膜虫(Tetrahymena)L-19IVS RNA的衍生物，其中活性位点的核苷酸序列与LMP编码mRNA中待切割的核苷酸序列互补(参阅如Cech等，美国专利号4,987,071和5,116,742)。或者，LMP mRNA可以用于从RNA分子库中选出具有特异的核酸酶活性的催化性RNA(参阅如Bartel，和Szostak，J.W.，1993，Science2611411-1418)。
或者，可以通过靶向与LMP核苷酸序列的调节区(如LMP启动子和/或增强子)互补的核苷酸序列以形成阻止靶细胞中LMP基因转录的三螺旋结构来抑制LMP基因表达(参阅如Helene，1991，Anticancer Drug Des.6569-84；Helene等，1992，Ann.N.Y.Acad.Sci.66027-36；和Maher，1992，Bioassays 14807-15)。
本发明的另一方面涉及含有编码LMP(或其部分)的核酸的载体，优选表达载体。本文使用的术语“载体”是指能够转运其所连接的另一核酸的核酸分子。一种类型的载体是“质粒”，是指可以连接额外DNA区段的环状双链DNA环。另一种类型的载体是病毒载体，其中额外的DNA片段可以被连接进病毒基因组。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌复制起始点的细菌载体和附加型哺乳动物载体)。其他载体(如非附加型哺乳动物载体)在引入宿主细胞后整合在宿主细胞基因组中，从而随着宿主基因组一起复制。此外，某些载体可以指导与其有效连接的基因的表达。这些载体在本文中称为“表达载体”。通常用于DNA重组技术的表达载体常为质粒形式。由于质粒是最常用的载体形式，本说明书中“质粒”和“载体”可互换使用。然而，本发明意在包括发挥等同功能的其他形式的表达载体，例如病毒载体(如复制缺陷型逆转录病毒、腺病毒和腺伴随病毒)。
本发明的重组表达载体含有适于核酸在宿主细胞中表达的形式的本发明核酸，即重组表达载体含有一个或多个基于用于表达的宿主细胞而选择并与待表达的核酸序列有效连接的调节序列。就重组表达载体而言，“有效连接”指目的核苷酸序列以允许该核苷酸序列表达的方式与调节序列连接，并且两个序列彼此融合以使每个序列都(例如在体外转录/翻译体系中或当载体引入宿主细胞时在宿主细胞中)完成其预计功能。术语“调节序列”旨在包括启动子、增强子以及其他表达控制元件(如多腺苷酸化信号)。这些调节序列描述于例如Goeddel，《Gene Expression TechnologyMethods inEnzymology 185》，Academic Press，San Diego，CA(1990)及Gruber和Crosby，《Methods in Plant Molecular Biology and Biotechnology》，Glick和Thompson编辑，第7章，89-108，CRC PressBoca Raton，Florida(包括其中的参考文献)。调节序列包括指导核苷酸序列在多种类型宿主细胞中组成型表达的序列以及只在某些宿主细胞中或某些条件下指导核苷酸序列表达的序列。本领域技术人员会理解，表达载体的设计取决于以下因素，如待转化宿主细胞的选择、需要的蛋白质的表达水平等。可以将本发明的表达载体引入宿主细胞从而产生本文所述的核酸编码的蛋白质或肽，包括融合蛋白或肽(如LMP、LMP的突变体形式、融合蛋白等)。
可以设计本发明的重组表达载体，以在原核或真核细胞中表达LMP。例如，LMP基因可以在细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母和其他真菌细胞(参阅Romanos等，1992，Foreign gene expression inyeasta review，Yeast 8423-488；van den Hondel，(1991)，《More GeneManipulations in Fungi》，van den Hondel，C.A.M.J.J.等1991，AppliedMolecular Genetics of Fungi，Peberdy，《More Gene Manipulations inFungi》，Bennet & Lasure编辑，396-428页Academic Pressan Diego和van den Hondel & Punt 1991，Gene transfer systems and vectordevelopment for filamentous fungi，《Applied Molecular Genetics ofFungi》，Peberdy等编辑，1-28页，Cambridge University PressCambridge)、藻类(Falciatore等，1999，Marine Biotechnology 1239-251)、全毛亚纲、缘毛亚纲、旋毛亚纲、吸管亚纲、四膜虫属、草履虫、豆形虫属、瞬目虫(Glaucoma)、匙口虫(Platyophrya)、Potomacus、Pseudocohnilembus、游仆虫(Euplotes)、Engelmaniella和棘尾虫(Stylonychia)类别的纤毛虫，特别是Stylonychia lemnae属使用WO98/01572中所述转化方法和载体表达，在多细胞植物细胞(参阅Schmidt，和Willmitzer，1988，Plant Cell Rep.583-586；《Plant Molecular Biology andBiotechnology》，C Press，Boca Raton，Florida，6/7章，71-119页(1993)；White等，Techniques for Gene Transfer，《Transgenic Plants》，第1卷，“Engineering and Utilization”，Kung和R.Wu编辑，Academic Press 1993，128-43；Potrykus，Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)，205-225(及其中引用的参考文献))或哺乳动物细胞中表达。合适的宿主细胞在Goeddel，《Gene Expression TechnologyMethods in Enzymology》185，Academic PressSan Diego，CA(1990)中进一步讨论。或者，可以体外转录和翻译重组表达载体，例如使用T7启动子调节序列和T7聚合酶。
最经常使用含有指导融合或非融合蛋白表达的组成型或诱导型启动子的载体进行原核生物中的蛋白质表达。融合载体在其编码的蛋白质中加入大量氨基酸，所述氨基酸通常加入到重组蛋白的氨基端，但也可以加入到C端或融合进蛋白质的适当区域内。这些融合载体一般用于一种或多种以下目的1)提高重组蛋白质的表达；2)提高重组蛋白质的溶解度；和3)通过在亲和纯化中发挥配体作用来辅助重组蛋白质的纯化。在融合表达载体中，经常在融合部分和重组蛋白质的结合处引入蛋白水解切割位点，以使在纯化融合蛋白之后可以将重组蛋白质与融合部分分开。这些酶及其同族识别序列包括因子Xa、凝血酶和肠激酶。
典型融合表达载体包括pGEX(Pharmacia Biotech Inc；Smith和Johnson，1988，Gene 6731-40)、pMAL(New England Biolabs，Beverly，MA)和pRIT5(Pharmacia，Piscataway，NJ)，其分别将谷胱甘肽S-转移酶(GST)、麦芽糖-E-结合蛋白和蛋白A融合到靶重组蛋白。在一个实施方案中，将LMP的编码序列克隆进pGEX表达载体以产生编码融合蛋白的载体，所述融合蛋白从N端至C端含有GST-凝血酶切割位点-X蛋白。可以使用谷胱甘肽-琼脂糖树脂通过亲和层析纯化融合蛋白。可以通过用凝血酶切割融合蛋白回收与融合GST的重组LMP。
合适的诱导型非融合蛋白大肠杆菌表达载体的实例包括pTrc(Amann等，1988，Gene 69301-315)和pET11d(Studier等，《Gene ExpressionTechnologyMethods in Enzymology》185，Academic Press，San Diego，California 60-89)。pTrc载体的靶基因表达依赖于从杂合trp-lac融合启动子的宿主RNA聚合酶转录。pET11d载体表达靶基因依赖于由共表达的病毒RNA聚合酶(T7 gn1)介导的从T7-gn10-lac融合启动子转录。该病毒聚合酶由宿主菌株BL21(DE3)或HMS174(DE3)从定居原噬菌体提供，所述原噬菌体携带lacUV5启动子转录控制下的T7 gn1基因。
使重组蛋白表达最大化的一种策略是在蛋白酶剪切重组蛋白的能力有缺陷的宿主细菌中表达蛋白质(Gottesman，1990，《Gene ExpressionTechnologyMethods in Enzymology》185119-128，Academic Press，SanDiego，California)。另一策略是改变待插入表达载体的核酸的核酸序列，以使每个氨基酸的个体密码子都是在选择用于表达的细菌中优先使用的(Wada等，1992，Nucleic Acids Res.202111-2118)。可以通过标准DNA合成技术实施本发明核酸序列的这些改变。
在另一实施方案中，LMP表达载体为酵母表达载体。用于酿酒酵母中表达的载体实例包括pYepSec1(Baldari等，1987，Embo J.6229-234)、pMFa(Kurjan & Herskowitz，1982，Cell 30933-943)、pJRY88(Schultz等，1987，Gene 54113-123)和pYES2(Invitrogen Corporation，San Diego，CA)。用于构建适用于其他真菌(如丝状真菌)的载体和方法包括van den Hondel& Punt，1991，《Applied Molecular Genetics of Fungi》，Peberdy等编辑，1-28页，Cambridge University PressCambridge中详细描述的那些。
或者，可以使用杆状病毒表达载体在昆虫细胞中表达本发明的LMP。可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等，1983，Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers，1989，Virology 17031-39)。
在另一实施方案中，使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的实例包括pCDM8(Seed，1987，Nature329840)和pMT2PC(Kaufman等，1987，EMBO J.6187-195)。在哺乳动物细胞中使用时，经常由病毒调节元件提供表达载体的控制功能。例如，通常使用的启动子来自多瘤、腺病毒2、巨细胞病毒和猿猴病毒40。用于原核和真核细胞的其他合适的表达载体参阅Sambrook，Fritsh和Maniatis，《Molecular CloningA Laboratory Manual》第二版，Cold SpringHarbor Laboratory，Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY，1989的16和17章。
在另一实施方案中，可以在单细胞植物细胞(如藻类，参阅Falciatore等，1999，Marine Biotechnology 1239-251及其中的参考文献)和来自高等植物(如种子植物，如作物植物)的植物细胞中表达本发明的LMP。植物表达载体的实例包括在Becker等，1992，Plant MoI.Biol.201195-1197；Bevan，1984，Nucleic Acids Res.128711-8721和Vectors for Gene Transferin Higher Plants；《Transgenic Plants》，第1卷，Engineering andUtilization，Kung和R.Wu编辑，Academic Press，1993，S.15-38中详细描述的那些表达载体。
植物表达盒优选含有能够在植物细胞中驱动基因表达的调节序列，这些调节序列有效连接以使每个序列可以实现其功能，如转录终止，包括多腺苷酸化信号。优选的多腺苷酸化信号为源于根癌农杆菌T-DNA的序列，例如已知为Ti-质粒pTiACH5的章鱼碱合酶的基因3(Gielen等，1984，EMBO J.3835)或其功能等同物，但是所有其他在植物中有功能活性的终止子也是合适的。
由于植物基因表达常常不仅限于转录水平，因此植物表达盒优选含有其他有效连接的序列，如翻译增强子，例如含有烟草花叶病毒5’-非翻译前导序列的超驱动序列，其提高蛋白质/RNA比率(Gallie等，1987，Nucleic.Acids Res.158693-8711)。
植物基因表达必须与当启动子有效连接，所述启动子赋予基因以适时的、细胞或组织特异性的方式表达。优选驱动组成型表达的启动子(Benfey等，1989EMBO J.82195-2202)，例如来源于植物病毒，如35SCAMV(Franck等，1980，Cell 21 285-294)、19SCaMV(参阅US 5352605和WO 84/02913)的启动子、植物启动子，如U.S 4,962,028中所述的核酮糖二磷酸羧化酶-加氧酶小亚基的启动子。甚至更优选驱动LMP蛋白在种子发育的全部阶段或选定阶段表达的种子特异性启动子。种子特异性植物启动子是本领域普通技术人员所已知的，并使用种子特异性mRNA文库和表达概况分析技术鉴定和表征。种子特异性启动子包括油菜籽的油菜籽蛋白基因启动子(美国专利号5,608,152)、蚕豆的USP启动子(Baeumlein等，1991，Mol Gen Genet，1991，225459-67)、拟南芥的油质蛋白启动子(WO98/45461)、菜豆的菜豆蛋白启动子(美国专利号5,504,200)、芸苔的Bce4启动子(WO 91/13980)或豆球蛋白B4启动子(LeB4；Baeumlein等，1992，Plant Journal，2233-9)以及在单子叶植物(如玉米、大麦、普通小麦、黑麦、稻等)中赋予种子特异性表达的启动子。应该提到的合适的启动子为来自大麦的lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230)和WO99/16890中所述的启动子(大麦的大麦醇溶蛋白基因、稻谷蛋白基因、稻水稻素基因、稻谷醇溶蛋白基因、普通小麦醇溶蛋白基因、小麦谷蛋白基因、玉米醇溶蛋白基因、燕麦谷蛋白基因、高梁kasirin基因和黑麦醇溶蛋白基因的启动子)。
还可以通过诱导型启动子促进植物基因表达(综述参阅Gatz 1997，Annu.Rev.Plant Physiol.Plant Mol.Biol.4889-108)。当需要以时间特异性的方式表达基因时，化学诱导型启动子尤其合适。这些启动子的实例为水杨酸诱导型启动子(WO 95/19443)、四环素诱导型启动子(Gatz等(1992)Plant J.2，397-404)和乙醇诱导型启动子(WO 93/21334)。
应答于生物或非生物胁迫条件的启动子也是合适的启动子，例如病原体可诱导的PRP1基因启动子(Ward等，1993，Plant.Mol.Biol.22361-366)、来自番茄的热可诱导的hsp80启动子(US 5,187,267)、来自马铃薯的冷可诱导的α淀粉酶启动子(WO 96/12814)或创伤可诱导的pinII启动子(EP 375091)。
用于植物基因表达盒的其他优选序列为将基因产物靶向合适的细胞区室所需的靶向序列(综述参阅Kermode，Crit.Rev.Plant Sci.15，4(1996)285-423及其引用的参考文献)，所述区室为例如液泡、细胞核、所有类型的质体(如造粉体、叶绿体、色质体)、胞外空间、线粒体、内质网、油粒、过氧化物酶体和植物细胞的其他区室。由于质体是脂类生物合成前体和一些终产物在其中合成的区室，因此特别合适的还有赋予质体特异性基因表达的启动子。合适的启动子为描述于WO 95/16783和WO 97/06250的病毒RNA聚合酶启动子和描述于WO 99/46394的来自拟南芥的clpP启动子。
本发明还提供含有以反义方向克隆进表达载体的本发明DNA分子的重组表达载体。即DNA分子以允许(通过DNA分子的转录)表达与LMPmRNA反义的RNA分子的方式有效连接调节序列。可以选择与反义方向克隆的核酸有效连接的调节序列，其指导反义RNA分子在多种细胞类型中持续表达，如病毒启动子和/或增强子，或者可以选择指导反义RNA的组成型、组织特异性或细胞类型特异性表达的调节序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒的形式，其中产生的反义核酸处于高效调节区的控制下，可以通过载体所引入的细胞类型来测定所述高效调节区的活性。关于使用反义基因进行基因表达调节的讨论参阅Weintraub等(1986，Antisense RNA as a molecular tool for genetic analysis，Reviews-Trends in Genetics，第1卷)和Mol等(1990，FEBS Lett.268427-430)。
本发明的另一方面涉及引入了本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在本文中可互换使用。应该理解，这些术语不仅指特定的受试细胞，而且指这些细胞的后代或潜在后代。由于突变或环境影响，在连续世代中可能出现某些修饰，因此事实上这些后代不一定与亲本细胞完全相同，但仍包含在本文使用的该术语的范围内。宿主细胞可以是任何原核或真核细胞。例如，可以在细菌细胞、昆虫细胞、真菌细胞、哺乳动物细胞(如中国仓鼠卵巢细胞(CHO)或COS细胞)、藻类、纤毛虫或植物细胞中表达LMP。其他合适的宿主细胞是本领域技术人员所已知的。
可通过常规转化或转染技术将载体DNA引入原核或真核细胞。本文使用的术语“转化”、“转染”、“缀合”和“转导”旨在表示多种用于向宿主细胞中引入外源核酸(例如DNA)的现有技术，包括磷酸钙共沉淀或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染法、天然感受态、化学方法介导的转移或电穿孔法。用于转化或转染宿主细胞(包括植物细胞)的适当方法可见于Sambrook等(1989，《Molecular CloningA LaboratoryManual.》，第2版，Cold Spring Harbor Laboratory，Cold Spring HarborLaboratory Press，Cold Spring Harbor，NY)以及其他实验室手册如《Methods in Molecular Biology》，1995，第44卷，Agrobacteriumprotocols，Gartland和Davey编辑，Humana Press，Totowa，New Jersey。
就哺乳动物和植物细胞的稳定转染而言，已知取决于使用的表达载体和转染技术，只有少部分细胞可将外源DNA整合进其基因组。为鉴定和选择这些整合体，一般将编码选择性标记(如对抗生素的抗性)的基因与目的基因一起引入宿主细胞。优选的选择性标记包括赋予对药物(如G418、潮霉素、卡那霉素和氨甲喋呤)的抗性或者在植物中赋予对除草剂(如草甘膦或草铵膦(glufosinate))的抗性的选择性标记。编码选择性标记的核酸可以在编码LMP的同一载体上引入宿主细胞，或者可以在分开的载体上引入。可以通过如药物选择(如整合选择性标记基因的细胞存活而其他细胞死亡)来鉴定稳定转染所引入核酸的细胞。
为产生同源重组的微生物，制备含有至少部分LMP基因的载体，其中引入了缺失、添加或替换以改变(如功能性破坏)LMP基因。LMP基因优选为拟南芥、欧洲油菜、大豆、稻或普通小麦LMP基因，但也可以是来自相关植物或甚至来自哺乳动物、酵母或昆虫来源的同源物。在优选的实施方案中，设计载体以通过同源重组功能性破坏内源LMP基因(即不再编码功能性蛋白质，也称为敲除载体)。或者，可以设计载体使得同源重组时突变或以其他方式改变内源LMP基因，但仍编码功能性蛋白质(如可以改变上游调节区，从而改变内源LMP的表达)。为通过同源重组产生点突变，可以在称为嵌合修复术(chimeraplasty)的技术中使用DNA-RNA杂交分子(Cole-Strauss等，1999，Nucleic Acids Res.271323-1330和Kmiec，1999，American Scientist 87240-247)。拟南芥或其他作物中的同源重组方法也是本领域技术人员所熟知的，并考虑在本文中使用。
在同源重组载体中，LMP基因改变的部分的5’和3’末端两侧是LMP的其他核酸，它们允许在载体携带的外源LMP基因和微生物或植物中的内源LMP基因之间发生同源重组。其他侧翼LMP核酸的长度足以与内源基因成功地进行同源重组。一般地，载体内包含数百碱基对至数千碱基对的侧翼DNA(5’和3’末端)(同源重组载体的描述参阅如Thomas & Capecchi，1987，Cell 51503)。(例如通过聚乙二醇介导的DNA)将载体引入微生物或植物细胞。使用本领域已知的技术选择其中引入的LMP基因与内源LMP基因已同源重组的细胞。
在另一实施方案中，可以产生含有所选择系统的重组微生物，所述所选择的系统允许所引入基因的受控表达。例如，包含将LMP基因置于载体上lac操纵子控制下允许LMP基因只在IPTG存在下表达。这些调节系统是本领域所熟知的。
可以使用本发明的宿主细胞(如培养物中的原核或真核细胞)产生(如表达)LMP。因此，本发明还提供了使用本发明宿主细胞产生LMP的方法。在一个实施方案中，方法包括在合适的培养基中培养(引入了编码LMP的重组表达载体或基因组中含有野生型或改变的LMP基因的)本发明的宿主细胞直至产生LMP。在另一实施方案中，方法还包括从培养基或宿主细胞中分离LMP。
本发明的另一方面涉及分离的LMP及其生物活性部分。“分离的”或“纯化的”蛋白质或其生物活性部分在通过重组DNA技术产生时基本不含细胞物质，或在化学合成时基本不含化学前体或其他化学物质。“基本不含细胞物质”一语包括LMP制备物，其中蛋白质从其天然或重组产生的细胞的细胞组分中分离。在一个实施方案中，“基本不含细胞物质”一语包括含有低于约30％(按干重计)非LMP(也称为“污染蛋白质”)，更优选低于约20％的非LMP、更优选低于约10％的非LMP，最优选低于约5％的非LMP的LMP制备物。重组产生LMP或其生物活性部分时，还优选基本不含有培养基，即培养基小于蛋白质制备物总体积的约20％、更优选小于约10％并最优选小于约5％。术语“基本不含有化学前体或其他化学物质”包括LMP制剂，其中蛋白质从蛋白质合成中相关的化学前体或其他化学物质中分离。在一个实施方案中，术语“基本不含有化学前体或其他化学物质”包括含有低于约30％(按干重计)的化学前体或非LMP化学物质，优选低于约20％的化学前体或非LMP化学物质、更优选低于约10％的化学前体或LMP化学物质，最优选低于约5％的化学前体或非LMP化学物质的制备物。在优选的实施方案中，分离的蛋白质或其生物活性部分中没有来源于产生LMP的同一生物的污染蛋白质。一般通过在除拟南芥、欧洲油菜、大豆、稻或普通小麦的其他植物或微生物、藻类或真菌中重组表达例如拟南芥、欧洲油菜、大豆、稻或普通小麦LMP来产生这些蛋白质。
本发明的分离的LMP或其部分能参与在拟南芥、欧洲油菜、大豆、稻或普通小麦中产生种子贮藏化合物所必需的化合物的代谢或细胞膜的代谢，或者具有表3公开的一种或多种活性。在优选的实施方案中，蛋白质或其部分含有与附录中所示核酸编码的氨基酸序列足够同源的氨基酸序列，以使蛋白质或其部分保持参与拟南芥、欧洲油菜、大豆、稻或普通小麦中细胞膜构建所必需化合物的代谢的能力或参与分子跨这些膜转运的能力。蛋白质的部分优选为本文所述的生物活性部分。在优选的实施方案中，本发明的LMP具有附录中所示核酸所编码的氨基酸序列。在另一优选的实施方案中，LMP具有与附录中所示核苷酸序列杂交(如在严格条件下杂交)的核苷酸序列所编码的氨基酸序列。在另一优选的实施方案中，LMP具有与附录中所示核酸编码的氨基酸序列至少约50-60％、优选至少约60-70％、更优选至少约70-80％、80-90％、90-95％并甚至更优选至少约96％、97％、98％、99％或更高同源性的氨基酸序列。本发明的优选LMP还优选具有至少一种本文所述的LMP活性。例如，本发明的优选LMP包含与附录中所示核苷酸序列杂交(如在严格条件下杂交)的核苷酸序列所编码的氨基酸序列并且其参与拟南芥、欧洲油菜、大豆、稻或普通小麦中细胞膜构建所必需化合物的代谢或参与分子跨越这些膜的转运或具有表3公开的一种或多种活性。
在其他实施方案中，LMP与附录中所示核酸编码的氨基酸序列基本同源并保留附录中所示核酸编码的序列之一的蛋白质的功能活性，但由于上文详细描述的天然变异或诱变而在氨基酸序列上存在差异。因此，在另一实施方案中，LMP是含有与完整氨基酸序列至少约50-60％、优选至少约60-70％、更优选至少约70-80％、80-90％、90-95％并甚至更优选至少约96％、97％、98％、99％同源的氨基酸序列，并具有本文所述的至少一种LMP活性的蛋白质。在另一实施方案中，本发明涉及与附录中所示核酸编码的完整氨基酸序列基本同源的完全的拟南芥、欧洲油菜、大豆、稻或普通小麦蛋白质。
可以使用显性失活突变或反式显性抑制降低转基因种子中LMP的活性，以改变种子贮藏化合物的水平。为实现该目的，产生使LMP失去活性的突变，并在转基因植物中过表达失活的无功能LMP基因。失活的反式显性LMP蛋白与活性内源LMP蛋白竞争底物或与其他蛋白质的相互作用并稀释活性LMP的活性。以这种方式可以不实际修饰内源LMP基因的表达而降低LMP的生物活性。Pontier等使用这一策略调节植物转录因子的活性(Pontier等，Plant J 2001 27(6)529-38)。
可以通过诱变(如离散点突变)或截短LMP来产生LMP的同源物。本文使用的术语“同源物”指发挥LMP活性的激动剂或拮抗剂作用的LMP变体形式。LMP的激动剂可以保留与LMP基本相同的生物活性或部分活性。LMP的拮抗剂可以抑制天然存在形式的LMP的一种或多种活性，例如通过竞争性结合细胞膜组分代谢级联的下游或上游成员(包括LMP)，或者通过结合介导化合物穿过这些膜转运的LMP实现所述抑制，从而防止转运发生。
在备选实施方案中，可以通过筛选LMP突变体(如截短突变体)组合文库的LMP激动剂或拮抗剂活性来鉴定LMP同源物。在一个实施方案中，LMP变体的多变文库(variegated library)通过核酸水平的组合诱变产生，并由多变基因文库编码。LMP变体的多变文库的产生可以通过例如将合成的寡核苷酸混合物酶促连接进基因序列从而使潜在LMP序列的简并集可作为单个多肽表达，或另外作为含有LMP序列集的较大的融合蛋白表达(例如噬菌体展示)。可以使用多种方法从简并寡核苷酸序列产生潜在LMP同源物的文库。可以在自动DNA合成仪中进行简并基因序列的化学合成，然后将合成的基因连接进合适的表达载体。使用基因的简并集允许在一个混合物中提供编码需要的潜在LMP序列集的全部序列。合成简并寡核苷酸的方法为本领域技术人员所已知(参阅如Narang，1983，Tetrahedron 393；Itakura等，1984，Annu.Rev.Biochem.53323；Itakura等，1984，Science1981056；Ike等，1983，Nucleic Acid Res.11477)。
此外，LMP编码序列片段的文库可用于产生LMP片段的多变群体，用于LMP同源物的筛选及其后的选择。在一个实施方案中，可以如下产生编码序列片段的文库在每个分子只出现约一个切口的条件下用核酸酶处理LMP编码序列的双链PCR片段，变性双链DNA，复性DNA形成可包括来自不同切口产物的有义/反义对的双链DNA，通过用S1核酸酶处理从再形成的双链体中去除单链部分，并将得到的片段文库连接进表达载体。通过这种方法，可以产生编码LMP的N端、C端和多种大小的内部片段的表达文库。
用于筛选点突变或截短产生的组合文库的基因产物以及从DNA文库筛选具有所选特性的基因产物的几种技术为本领域所已知。这些技术适于快速筛选通过LMP同源物的组合诱变产生的基因文库。用于筛选大基因文库的适于高通量分析的最广泛使用的技术一般包括将基因文库克隆进可复制的表达载体，用得到的载体文库转化合适的细胞，并在一定条件下表达组合基因，在所述条件下所需活性的检测便于分离编码所检测产物的基因的载体。一种用于提高文库中功能突变体频率的技术——循环总体诱变(Recursive ensemble mutagenesis，REM)可以与筛选测定法组合使用以鉴定LMP同源物(Arkin & Yourvan，1992，Proc.Natl.Acad.Sci.USA897811-7815；Delgrave et al.，1993，Protein Engineering 6327-331)。在另一实施方案中，可以使用本领域公知的方法开发基于细胞的测定法以分析多变LMP文库。
可以在一种或多种以下方法中使用本文公开的核酸分子、蛋白质、蛋白质同源物、融合蛋白、引物、载体和宿主细胞拟南芥、欧洲油菜、大豆、稻或普通小麦以及相关生物的鉴定；拟南芥、欧洲油菜、大豆、稻或普通小麦相关生物的基因组作图；拟南芥、欧洲油菜、大豆、稻或普通小麦目的序列的鉴定和定位；进化研究；功能所需LMP区域的确定；LMP活性的调节；一种或多种细胞功能代谢的调节；一种或多种化合物跨膜转运的调节；种子贮藏化合物累积的调节；植物器官数目和/大小的调节；种子大小、数目或重量的调节；根长度的调节和叶大小的调节。
拟南芥植物代表高等(或种子)植物的一个成员。它与需要光来驱动光合作用和生长的其他植物如欧洲油菜、大豆、稻和普通小麦相关。如拟南芥、欧洲油菜、大豆、稻或普通小麦等植物在DNA序列和多肽水平共享高度同源性，这允许使用来自其他植物或生物的探针异源筛选DNA分子，从而使得可以衍生适于异源筛选或在第三个物种中功能注释和预测基因功能的共有序列。因此鉴定这些功能的能力可具有显著的关联性，如预测酶的底物特异性。另外，这些核酸分子可作为拟南芥基因组或相关生物基因组作图的参考点。
本发明的LMP核酸分子具有多种用途。首先，本发明的核酸和蛋白质分子可作为基因组特定区域的标记物。这不仅可用于基因组作图，还可用于拟南芥、欧洲油菜、大豆、稻或普通小麦蛋白质的功能研究。例如，为鉴定特定拟南芥、欧洲油菜、大豆、稻或普通小麦DNA结合蛋白结合的基因组区域，可以消化拟南芥、欧洲油菜、大豆、稻或普通小麦基因组并将片段与DNA结合蛋白温育。可以用本发明的核酸分子(优选用容易检测的标记)另外检测与蛋白质结合的片段，这种核酸分子与基因组片段的结合使得可以将片段定位到拟南芥、欧洲油菜、大豆、稻或普通小麦的基因组图上，并且在用不同的酶进行多次时，便于快速确定蛋白质结合的核酸序列。另外，本发明的核酸分子可以与相关物种的序列足够同源，以使这些核酸分子可以作为标记用于构建相关植物的基因组图。
本发明的LMP核酸分子还可用于进化和蛋白质结构研究。本发明分子参与的代谢和转运过程被多种原核和真核细胞利用；通过将本发明核酸分子的序列与编码来自其他生物的类似酶的序列进行比较，可以评估生物的进化亲缘关系。同样，这种比较可以评估序列中哪些区域是保守的而哪些则不是，这可以辅助确定酶功能所必需的蛋白质区域。这种确定在蛋白质工程研究中是有价值的，并可以指示就诱变而言蛋白质可以耐受什么而不丧失功能。
对本发明的LMP核酸分子的操作可以导致产生与野生型LMP具有功能性差异的LMP。这些蛋白质可能提高了效率或活性、可能以多于通常情况的数目存在于细胞中或者可以降低了效率或活性。
存在多种机制，通过所述机制，改变本发明的LMP可以直接影响种子贮藏化合物的累积和/或组成。对于表达LMP的植物的情况，转运的提高可以引起植物组织和器官内改变的化合物累积和/或溶质分配，最终可用于影响种子发育中一种或多种种子贮藏化合物的累积。Mitsukawa等(1997，Proc.Natl.Acad.Sci.USA 947098-7102)提供了实例，其中在烟草培养细胞中过表达拟南芥高亲和力磷酸盐转运蛋白基因增强了磷酸盐受限情况下的细胞生长。磷酸盐可用性还显著影响糖和代谢中间体的产生(Hurry等，2000，Plant J.24383-396)以及叶和根中的脂类组成(

等，2000，Proc.Natl.Acad.Sci.USA 9710649-10654)。同样，已经证明植物ACCase活性受磷酸化的调节(Savage & Ohlrogge，1999，Plant J.18521-527)，并且作用于ACCase的激酶和磷酸酶(LMP)活性的改变可引起种子脂类累积水平的提高或降低。此外，叶绿体被膜中存在脂类激酶活性提示被膜中存在信号转导途径和/或膜蛋白调节(参阅如Müiller等，2000，J.Biol.Chem.27519475-19481及其引用的文献)。ABI1和ABI2基因编码两种蛋白质丝氨酸/苏氨酸磷酸酶2C，它们是脱落酸信号途径中的调节子，因而是早期和晚期种子发育中的调节子(如Merlot等，2001，Plant J.25295-303)。
本发明还提供与本文公开的核酸所编码或本文所述的LMP多肽或其片段特异性结合的抗体。可以通过多种熟知的方法(参阅如Harlow和Lane，＂Antibodies；A Laboratory Manual＂Cold Spring Harbor Laboratory，Cold Spring Harbor，New York，1988)制备抗体。简言之，可以用足以引发免疫应答的量和时间间隔将纯化的抗原注射进动物中。可以直接纯化抗体，或者可以从动物获得脾细胞。接着将细胞与永生化细胞系融合并筛选抗体分泌。抗体可用于筛选核酸克隆文库中分泌抗原的细胞。接着可以对阳性克隆测序(参阅如Kelly等1992，Bio/Technology 10163-167；Bebbington等，1992，·Bio/Technology 10169-175)。
与多肽“选择性结合”一语指结合反应，其确定由蛋白质和其他生物产品的异源群体中所述蛋白质的存在。因此，在指定的免疫测定条件下，与特定蛋白质结合的指定抗体不以显著的量与样品中存在的其他蛋白质结合。在这种条件下与抗体的选择性结合可以需要选择具有对特定蛋白质的特异性的抗体。可以使用多种形式的免疫测定来选择与特定蛋白质选择性结合的抗体。例如，通常使用固相ELISA免疫测定来选择与蛋白质选择性免疫相互作用的抗体。关于可用于测定选择性结合的免疫测定形式和条件的描述，参阅Harlow和Lane.＂Antibodies，A Laboratory Manual＂ColdSpring Harbor Publications，New York(1988)。在一些条件下，需要制备来自多种宿主的单克隆抗体。用于制备这些单克隆抗体的技术的描述可见于Stites等编辑，＂Basic and Clinical Immunology，＂(Lange MedicalPublications，Los Altos，Calif，第四版)及其引用的参考文献和Harlow和Lane(＂Antibodies，A Laboratory Manual＂Cold Spring HarborPublications，New York，1988)。
在此申请中引用了多种出版物。所有这些出版物的公开内容以及这些出版物中引用的参考文献都以其整体引入本申请作为参考，以更完全的描述本发明所述技术领域的现状。
对本领域技术人员显而易见的是，可以在不背离本发明的范围或精神的情况下，在本发明中做出多种修饰和改变。考虑本文公开的本发明的说明书和实践之后，本发明的其他实施方案对本领域技术人员而言是显而易见的。说明书和实施例旨在仅用于示例，本发明的真正范围和精神由本文包含的权利要求指出。
实施例实施例1 一般方法 a)一般克隆方法如Sambrook等(1989，Cold Spring Harbor Laboratory PressISBN0-87969-309-6)或Kaiser，Michaelis和Mitchell(1994，＂Methods in YeastGenetics，＂Cold Spring Harbor Laboratory PressISBN 0-87969-451-3中所述实施克隆方法，如限制性切割、琼脂糖电泳、DNA片段纯化、转移核酸至硝酸纤维素和尼龙膜、连接DNA片段、转化大肠杆菌和酵母细胞、培养细菌和重组DNA的序列分析。
b)化学品除非文中另有说明，p.a.质量的化学品来自Fluka(Neu-Ulm)、Merck(Darmstadt)、Roth(Karlsruhe)、Serva(Heidelberg)和Sigma(Deisenhofen)公司。使用来自Milli-Q水系统净水装置(Millipore，Eschborn)的纯化的、无致热原水(在下文中称为H2O)制备溶液。限制性内切核酸酶、DNA修饰酶和分子生物学试剂盒得自AGS(Heidelberg)、Amersham(Braunschweig)、Biometra(

)、Boehringer(Mannheim)、Genomed(Bad Oeynnhausen)、New England Biolabs(Schwalbach/Taunus)、Novagen(Madison，Wisconsin，USA)、Perkin-Elmer(Weiterstadt)、Pharmacia(Freiburg)、Qiagen(Hilden)和Stratagene(Amsterdam，Netherlands)公司。除非另有说明，否则均按照生产商的说明使用。
c)植物材料和培养拟南芥植物为进行此研究，使用拟南芥的野生型和突变型植物的根材料、叶、长角果和种子。如所述从Columbia生态型的甲磺酸乙酯诱变的种群中分离wri1突变体(Benning等1998，Plant Physiol.11891-101)。在4℃将野生型和wri1拟南芥种子在黑暗中预温育3天，之后将其置于60-80μmol m-2s-1光子通量密度和16小时(22℃)光照期和8小时(18℃)黑暗期的培养箱(AR-75，Percival Scientific，Boone，IA)中。在半浓度MS培养基(Murashige& Skoog，1962，Physiol.Plant.15，473-497)，pH6.2，2％蔗糖和1.2％琼脂上起始所有植物。在20％漂白剂、0.5％ triton X-100中灭菌20分钟并用过量的无菌水洗涤6次。如上述培养植物或如Focks & Benning(1998，PlantPhysiol.11891-101)中所述在标准条件下在土壤中培养植物。
欧洲油菜此研究中使用欧洲油菜AC Excel和Cresor品种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶和根组织。然而，此研究着眼于将种子和种荚用于cDNA文库。标记植物以在以下两个时间点收获种植后60-75天收集的种子开花后1-15天和15-25天。在71℉、14小时光周期下在Metromix(Scotts，Marysville，OH)中培养植物。在此研究中收集6个目的种子及种荚以产生以下cDNA文库未成熟种子、成熟种子、未成熟种荚、成熟种荚、夜间收获的种荚和Cresor品种(高芥子酸)种子。在指定的时间点收集每种发育组织的组织样品，合并一个时帧内的多个样品用于最终提取总RNA。在开花后1-25天(daa)取得未成熟种子样品。在25-50daa之间取得成熟种子样品、在1-15daa取得未成熟种荚样品，在15-50daa之间取得成熟种荚样品，在1-50daa之间取得夜间收获的种荚样品，在5-25daa之间取得Cresor种子。
大豆此研究中使用大豆cv.Resnick产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶、茎和根组织。在一些情况下植物还被线虫感染。然而，此研究主要着眼于将种子和种荚组织用于cDNA文库。标记植物以在开花后设定的天数5-15、15-25、25-35和33-50天收获种子。
稻此研究中使用稻Japonica cv.Nippon-barre亚种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶、茎和根组织。此研究着眼于将种子胚组织用于cDNA文库。由于胚乳组织可以干扰RNA提取，因此分别收集胚和胚乳。在温室中在14小时光周期下以85℉在Wisconsin土(含高有机物质)上培养植物。从发育种子中切下稻胚。
普通小麦此研究中使用稻cv.Galeon亚种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、花、果实、叶、茎和根组织。以光照期72℉、黑暗期65℉的12小时光周期在温室中的metromix上培养植物。
实施例2 从植物中分离总DNA 分离总DNA的细节涉及1克鲜重植物材料的详细研究。
CTAB缓冲液2％(重量/体积)溴化N-十六烷基-N，N，N-三甲基铵(CTAB)、100mM Tris HCl pH8.0、1.4M NaCl、20mM EDTA。N-十二烷基肌氨酸缓冲液10％(重量/体积)N-十二烷基肌氨酸、100mM Tris HClpH8.0、20mM EDTA。
在研钵中的液氮中研磨植物材料以得到细粉并转移到2ml Eppendorf容器中。用一层1ml的分解缓冲液(1ml CTAB缓冲液、100μl N-十二烷基肌氨酸缓冲液、20μl β-巯基乙醇和10μl蛋白酶K溶液，10mg/ml)覆盖冰冻植物材料并在60℃持续摇动下温育1小时。将得到的匀浆分配到两个Eppendorf容器(2ml)中并用同样体积的氯仿/异戊醇(24:1)摇动萃取两次。为使相分开，每次在室温下以8000g离心15分钟。接着使用冰预冷的异丙醇在-70℃沉淀DNA 30分钟。4℃下以10000g使沉淀的DNA沉积30分钟并重悬于180μl TE缓冲液中(Sambrook等，1989，Cold Spring HarborLaboratory PressISBN 0-87969-309-6)。为进一步纯化，用NaCl(1.2M终浓度)处理DNA并使用两倍体积的无水乙醇在-70℃再次沉淀30分钟。在使用70％乙醇的洗涤步骤之后，干燥DNA并用50μl H2O+RN Ase(50mg/ml终浓度)吸收。4℃过夜使DNA溶解并接着在37℃进行RNAse消化1小时。DNA储存于4℃。
实施例3 从植物中分离总RNA和聚腺苷酸+RNA。
拟南芥为研究转录物，分离了总RNA和聚腺苷酸+RNA。按照以下步骤从拟南芥植物的长角果中分离RNA 从拟南芥种子制备RNA——“热”提取 1.缓冲液、酶和溶液 -2M KCI -蛋白酶K -苯酚(用于RNA) -氯仿:异戊醇(氯仿:异戊醇1:1，调整pH用于RNA) -4M LiCl，经DEPC处理 -经DEPC处理的水 -3M NaOAc、pH5，经DEPC处理的 -异丙醇 -70％乙醇(用经DEPC处理的水配制) -重悬缓冲液0.5％ SDS、10mM Tris pH7.5、1mM EDTA，用经DEPC处理的水配制(因为此溶液不能用DEPC处理) -提取缓冲液 0.2M硼酸钠 30mM EDTA 30mM EGTA 1％ SDS(250μl 10％ SDS溶液用于配制2.5ml缓冲液) 1％脱氧胆酸(25mg用于2.5ml缓冲液) 2％ PVPP(不溶，50mg用于2.5ml缓冲液) 2％ PVP 40K(50mg用于2.5ml缓冲液) 10mM DTT 100mM β-巯基乙醇(现配制，在通风橱中操作，35μl 14.3M溶液用于5ml缓冲液) 2.提取将提取缓冲液加热至80℃。在用液氮冷却的研钵中磨碎组织，将组织粉末转移到1.5ml管。由于组织在加入缓冲液前都应保持冰冻，因此用预冷的刮勺转移样品，并将管总是保持在液氮中。接着在管中加入350μl预热的提取缓冲液(用于100mg组织，对于较大的样品，缓冲液体积可多至500μl)、涡旋、加热至80℃约1分钟并接着置于冰上。涡旋样品，接着用电子研钵再研磨。
3.消化加入蛋白酶K(0.15mg/100mg组织)。接着涡旋样品并置于37℃1小时。
第一次纯化首先加入27μl 2M KCl，接着在冰上使样品冷却10分钟。接着室温下以12000转/分钟(rpm)离心样品10分钟，将上清液转移到新的无RNA酶的管中。进行一次酚萃取，其后是氯仿异戊醇萃取。在上清液中加入1倍体积的异丙醇，将混合物在冰上冷却10分钟。离心(室温，7000rpm10分钟)沉淀RNA。涡旋10至15分钟使RNA沉淀溶解于1ml 4M LiCl中，接着离心5分钟沉淀RNA。
第二次纯化将沉淀重悬于500μl重悬缓冲液。接着加入500μl苯酚，涡旋样品。接着加入250μl氯仿:异戊醇，涡旋样品并离心5分钟。将上清液转移到新管，重复进行氯仿:异戊醇萃取直至界面清晰。将上清液转移到新管，加入1/10体积的3M NaOAc，pH5和600μl异丙醇。将样品置于-20℃ 20分钟或更长。离心10分钟沉淀RNA。用70％乙醇洗涤沉淀一次。去除所有剩余的乙醇，再将沉淀溶于10至20μl经DEPC处理的水。通过测量1:200稀释液在260nm和280nm的吸光度确定数量和质量。40μg RNA/ml＝1OD260。
如所述从拟南芥的野生型和wri1突变体分离RNA(Hosein，2001，PlantMol.Biol.Rep.，1965a-65e；Ruuska等，2002，Plant Cell，141191-1206)。使用利用寡脱氧胸苷酸-纤维素柱的Amersham Pharmacia Biotech mRNA纯化试剂盒从总RNA制备mRNA。
按照生产商的说明使用Dyna

(Dynal，Oslo，Norway)分离聚腺苷酸+RNA。测定RNA或聚腺苷酸+RNA的浓度之后，加入1/10体积的3M乙酸钠pH4.6和2倍体积的乙醇来沉淀RNA并将其保存于-70℃。
欧洲油菜、大豆、稻和普通小麦从荚中分离欧洲油菜和大豆种子，以产生用于种子和种荚cDNA文库的同质材料。使用研钵和研杵在液氮中将组织研磨成细粉并转移到50ml管。将组织样品保存于-80℃至进行提取。
对于稻的情况，通过解剖分离5K-10K胚和胚乳。解剖过程中将组织置于冰上的小管或培养皿中。将容器置于干冰上，接着保存于-80℃。
对于普通小麦的情况，在20＂x 12＂平板中的metromix中以2＂深度种植Galeon普通小麦种子的种子萌发样品。用水浸透土壤，其后每天浇水两次。接着3-4天后，当胚芽鞘(coleopiles)约为1cm时，用水洗涤苗并吸干。为产生花cDNA文库，每隔一天从叶鞘收集头状花序出现率为30％、60％和100％的相等数目的头状花序。花药尚未显现。为产生种子组织cDNA文库，籽粒为水熟期或乳熟期(取决于籽粒在头状花序中的位置)，对于较晚的种子发育阶段，仅收获种子头状花序。对于根文库，仅收获根。植物具有一个主茎和三个强分蘖。在盆中培养植物，洗去培养基并保存此样品的根。植物未经处理。
按照生产商的方案使用RNeasy Maxi试剂盒(Qiagen)从组织中提取总RNA，使用Oligotex mRNA Purification System试剂盒(Qiagen)(也按照生产商的说明)从总RNA处理mRNA。接着将mRNA送至HyseqPharmaceuticals Incorporated(Sunnyville，CA)以将每种组织类型的mRNA进一步加工成cDNA文库并用于其专有方法，其中基于杂交模式将质粒中类似的插入片段聚类。
实施例4 cDNA文库构建就cDNA文库构建而言，使用鼠白血病病毒逆转录酶(Roche，Mannheim，Germany)和寡脱氧腺苷酸引物实现第一链的合成，通过与在12℃与DNA聚合酶I温育(2小时)、16℃与Klonow酶温育(1小时)和22℃用RNA酶H消化(1小时)实现第二链的合成。通过在65℃温育(10分钟)终止反应，接着转移到冰上。在37℃通过T4-DNA-聚合酶(Roche，Mannheim)切平双链DNA分子(30分钟)。通过酚/氯仿萃取和SephadexG50自旋柱除去核苷酸。通过T4-DNA-连接酶(Roche，12℃，过夜)将EcoRI接头(Pharmacia，Freiburg，Germany)与cDNA末端连接，通过与多核苷酸激酶温育(Roche，37℃，30分钟)磷酸化。将此混合物在低熔点琼脂糖凝胶上分离。从凝胶上洗脱大于300碱基对的DNA分子，酚萃取、在Elutip-D-柱(Schleicher and Schuell，Dassel，Germany)上浓缩，与载体臂连接并按照生产商的说明使用生产商提供的材料用Gigapack Gold试剂盒(Stratagene，Amsterdam，Netherlands)包装进入λ ZAP II噬菌体或λ ZAP-Express噬菌体。
在Hyseq Pharmaceuticals Incorporated(Sunnyville，CA)产生欧洲油菜、大豆、稻和普通小麦cDNA文库。文库产生中未使用扩增步骤，以保留表达信息。Hyseq的基因组方法涉及将基因聚类，并对每个类的代表性成员测序。从寡脱氧腺苷酸柱纯化的mRNA产生cDNA文库。随机挑取cDNA文库转化进大肠杆菌得到的菌落，通过PCR扩增cDNA插入片段并印迹到尼龙膜上。用一组33P放射性标记的寡核苷酸与克隆杂交，得到的杂交模式决定具体的克隆属于哪个类。获得cDNA克隆及其DNA序列以用于在转基因植物中过表达以及本文所述的其他分子生物学方法。
实施例5 鉴定WRI1样的目的LMP基因拟南芥wri1突变体 wri1拟南芥突变体用于鉴定LMP编码基因。wri1突变体特征在于种子贮藏脂类减少80％(Focks & Benning，1998，Plant Physiol.11891-101)。已经克隆并描述了WRI1基因(Benning & Cernac，2002，WO 02/072775A2)。
欧洲油菜、大豆、稻和普通小麦此实施例展示如何鉴定和分离编码欧洲油菜、大豆、稻和普通小麦WRI1样多肽的cDNA克隆。
为鉴定WRI1样基因，使用BLAST软件(Basic Local Alignment SearchTool，Altschul等，1990，J.MoI.Biol.215403-410)进行相似性分析。使用TBLASTN算法，用拟南芥WRI1多肽的氨基酸序列作为查询序列来搜索并比对来自欧洲油菜、大豆、稻和普通小麦的翻译全部6个阅读框的DNA数据库。这种专有数据库的相似性分析可引起鉴定多种EST和cDNA重叠群。
使用得自Hyseq聚类方法的RNA表达概况数据确定器官特异性。选择与其他组织文库相比在种子文库中显示较高表达的克隆作为LMP候选基因。基于表达概况选择欧洲油菜、大豆、稻和普通小麦克隆用于在拟南芥中过表达。
实施例6 全长cDNA的克隆和已鉴定的LMP基因的直向同源物。
已经在专有数据库中鉴定了与来自拟南芥、欧洲油菜、大豆、稻和普通小麦的全长序列和部分cDNA对应的克隆。使用ABI 377板凝胶测序仪和BigDye Terminator Ready Reaction试剂盒(PE Biosystems，Foster City，CA)测序克隆。进行序列比对以确定克隆是全长还是部分克隆。对于克隆鉴定为部分cDNA的情况，使用以下方法分离全长序列。使用来自Clontech的SMART RACE cDNA扩增试剂盒通过RACE PCR分离全长cDNA，所述试剂盒允许cDNA末端的5’和3’快速扩增(RACE)。基于克隆序列设计RACE PCR引物。全长cDNA的分离和使用的RACE PCR方案基于生产商的条件。按照生产商的说明用QIAquick Gel Extraction试剂盒(Qiagen)从琼脂糖凝胶中提取RACE产物片段并连接进TOPO pCR 2.1载体(Invitrogen)。使用标准条件(Sambrook等，1989)将重组载体转化进TOP10细胞(Invitrogen)。在含有50μg/ml卡那霉素的LB琼脂上37℃下过夜培养转化的细胞，并涂布40μl 40mg/ml二甲基甲酰胺中的X-gal储备溶液进行蓝白斑选择。选择单个白色菌落并用于接种3ml含有50μg/ml卡那霉素的液体LB，37℃培养过夜。按照生产商的说明使用QIAprep Spin Miniprep试剂盒(Qiagen)提取质粒DNA。接着按照标准分子生物学技术(Sambrook等，1989)进行克隆的随后分析和限制性作图。
使用以下方法分离全长cDNA并克隆进双元载体使用得自克隆或其后RACE扩增产物的全长序列设计基因特异性引物。利用克隆或cDNA文库作为DNA模板，使用递降PCR扩增全长序列和基因。在一些情况下，设计引物以在紧靠基因起始密码子上游加入“AACA”Kozak样序列，并在一些情况下将下游两个碱基变成GC以便于提高基因表达水平(Chandrashekhar等，1997，Plant Molecular Biology 35993-1001)。PCR反应循环为94℃ 5分钟；94℃ 1分钟、65℃ 1分钟、72℃ 4分钟的9个循环，其中每个循环的退火温度降低1℃；94℃ 1分钟、55℃ 1分钟、72℃ 4分钟的20个循环；PCR循环以72℃ 10分钟结束。使用GenElute-EtBr自旋柱(Sigma)从1％琼脂糖凝胶中凝胶纯化扩增的PCR产物，并在标准酶消化后连接进植物双元载体pBPS-GB1用于拟南芥转化。通过在LB和适当的抗生素中过夜培养大肠杆菌DH5来扩增双元载体，使用QiagenMiniPrep DNA制备试剂盒制备质粒用于下游步骤。在多个克隆步骤全程中均通过限制性消化测定其大小来验证插入片段，测序插入片段以保证在拟南芥转化中使用预期的基因。
基因序列可用于从cDNA或基因组文库中鉴定同源或异源基因(直向同源物，来自另一植物的同一LMP基因)。这可以通过设计针对保守序列的PCR引物实现，通过多重序列比对鉴定所述保守序列。经常通过设计针对目的基因全长或部分序列的简并引物来鉴定直向同源物。
基因序列可用于从cDNA或基因组文库中鉴定同源物或直向同源物。可以使用如cDNA文库通过核酸杂交分离同源基因(如全长cDNA克隆)取决于目的基因的丰度，平板接种100,000至多达1,000,000个重组噬菌体并转移至尼龙膜。用碱变性后，通过如UV交联将DNA固定在膜上。在高严格条件下进行杂交。在1M NaCl离子强度和68℃的温度下进行水溶液杂交和洗涤。通过如放射性(32P)切口转录标记(High Prime，Roche，Mannheim，Germany)产生杂交探针。通过放射自显影检测信号。
可以在与上述方法类似的方法中，使用低严格杂交条件和洗涤条件鉴定相关但不相同的部分同源或异源基因。就水溶液杂交而言，离子强度一般保持为1M NaCl，而温度从68℃逐渐降到42℃。
可以通过使用合成的放射性标记的寡核苷酸探针分离仅在(如10-20个氨基酸)特殊结构域中具有同源性(或序列同一性/相似性)的基因序列。优选通过用T4多核苷酸激酶磷酸化两个互补寡核苷酸的5’末端来制备放射性标记的寡核苷酸。互补寡核苷酸退火并连接以形成多联体。接着通过如切口转录来放射性标记双链多联体。一般使用高寡核苷酸浓度在低严格条件下进行杂交。
寡核苷酸杂交溶液 6×SSC 0.01M磷酸钠 1mM EDTA(pH8) 0.5％ SDS 100μg/ml变性鲑精DNA 0.1％脱脂奶粉在杂交中，温度逐步降低至预计的寡核苷酸Tm以下5-10℃或降至室温，然后进行洗涤步骤和放射自显影。以低严格度进行洗涤，如用4×SSC洗涤3次。其他细节描述于Sambrook等(1989，＂Molecular CloningALaboratory Manual＂，Cold Spring Harbor Laboratory Press)或Ausubel等(1994，＂Current Protocols in Molecular Biology＂，John Wiley & Sons)。
表3 WRI1样LMP的推定功能 (全长核酸序列可见附录，使用表3的序列码) 实施例7 通过用抗体筛选表达文库来鉴定目的基因 cDNA克隆可用于例如在大肠杆菌(如Qiagen QIAexpress pQE系统)中产生重组蛋白。其后一般通过Ni-NTA亲和层析(Qiagen)正常纯化重组蛋白。重组蛋白可用于例如通过使用兔免疫的标准技术产生特异性抗体。如Gu等(1994，BioTechniques 17257-262)所述，使用用重组抗原饱和的Ni-NTA柱亲和纯化抗体。接着可通过免疫筛选(Sambrook等1989，Molecular CloningA Laboratory Manual＂，Cold Spring HarborLaboratory Press or Ausubel等1994，＂Current Protocols in MolecularBiology＂，John Wiley & Sons)使用抗体筛选表达cDNA文库，以鉴定同源或异源基因。
实施例8 Northern杂交就RNA杂交而言，如Amasino(1986，Anal.Biochem.152304)所述使用甲醛通过在1.25％琼脂糖凝胶中凝胶电泳分离20μg总RNA或1μg聚腺苷酸+RNA，使用10×SSC通过毛细管吸引将其转移至带正电的尼龙膜(Hybond N+，Amersham，Braunschweig)，通过紫外线固定并使用杂交缓冲液(10％硫酸葡聚糖(重量/体积)、1M NaCl、1％ SDS、100μg/ml鲱精DNA)在68℃预杂交3小时。在预杂交期间使用Highprime DNA标记试剂盒(Roche，Mannheim，Germany)用α-32P dCTP(Amersham，Braunschweig，Germany)标记DNA探针。在加入标记的DNA探针后在相同的缓冲液中在68℃杂交过夜。在68℃使用2×SSC洗涤两次，每次15分钟，用1×SCC、1％ SDS洗涤两次，每次30分钟。在-70℃将密封的滤色片曝光1天至14天。
实施例9 DNA测序和计算机功能分析可以按照标准方法将cDNA文库用于DNA测序，特别是通过使用ABIPRISM Big Dye Terminator Cycle Sequencing Ready Reaction试剂盒(Perkin-Elmer，Weiterstadt，Germany)的链终止法。在通过体内大量切除、再转化并将DH10B接种在琼脂平板上(材料和方案细节来自Stratagene，Amsterdam，Netherlands)从cDNA文库回收制备的质粒之后可以进行随机测序。可以从含有氨苄青霉素的Luria-Broth培养基中过夜培养的大肠杆菌培养物制备质粒DNA(参阅Sambrook等(1989，Cold Spring HarborLaboratory PressISBN 0-87969-309-6)，按照生产商的方案在QiageneDNA制备机器人(Qiagen，Hilden)上进行。使用Bio-Max(Munich，Germany)销售的软件包EST-MAX处理和注释序列。该程序整合了对蛋白质序列的功能和结构表征重要的生物信息学方法。参考文献参阅http://pedant.mips.biochem.mpg.de。
Genomax和Pedant Pro中整合的最重要的算法为FASTA预期统计学显著的非常灵敏的蛋白质序列数据库检索(Pearson W.R.，1990，Rapidand sensitive seq uence comparison with FASTP and FASTA.MethodsEnzymol.18363-98)；BLAST预期统计学显著的非常灵敏的蛋白质序列数据库检索(Altschul S.F.等，Basic local alignment search tool.J.MoI.Biol.215403-410)；PREDATOR从单个和多个序列高精确度地预测二级结构(Frishman & Argos 1997，75％ accuracy in protein secondary structureprediction.Proteins 27329-335)；CLUSTALW多序列比对(Thompson，J.D.等，1994，CLUSTAL Wimproving the sensitivity of progressivemultiple sequence alignment through sequence weighting，positions-specific gap penalties and weight matrix choice，Nucleic AcidsRes.224673-4680)；TMAP由多重比对序列预测跨膜区(Persson B.&Argos P.1994，Prediction of transmembrane segments in proteins utilizingmultiple sequence alignments，J.MoI.Biol.237182-192)；ALOM2由单个序列预测跨膜区(Klein P.，Kanehisa M.，and DeLisi C.1984，Prediction ofprotein function from sequence propertiesA discriminant analysis of adatabase.Biochim.Biophys.Acta 787221-226.Version 2 by Dr.K.Nakai)；PROSEARCH检测PROSITE蛋白质序列模式(Kolakowski L.F.Jr.等，1992，ProSearchfast searching of protein sequences with regularexpression patterns related to protein structure and function.Biotechniques 13919-921)；BLIMPS对无缺口区段数据库进行相似性检索(Wallace & Henikoff 1992，PATMATA searching and extractionprogram for sequence，pattern and block queries and databases，CABIOS8249-254.Written by Bill Alford)；PFAM和BLOCKS检索蛋白质基序和结构域。
实施例10 用于植物转化的质粒就植物转化而言，可以使用双元载体如pBinAR(

& Willmitzer，1990，Plant Sci.66221-230)。可以通过将cDNA以有义或反义方向连接进T-DNA来进行双元载体的构建。植物启动子在cDNA 5’激活cDNA的转录。聚腺苷酸化序列位于cDNA的3’。可以使用组织特异性启动子实现组织特异性表达。例如，可以通过在cDNA 5’克隆油菜籽蛋白或LeB4或USP启动子实现种子特异性表达。还可以使用任何其他种子特异性启动子元件。就整株植物内的组成型表达而言，可以使用CaMV 35S启动子。可以使用信号肽将表达的蛋白质靶向细胞区室，如质体、线粒体或内质网(Kermode，1996，Crit.Rev.Plant Sci.15285-423)。将信号肽符合读框地克隆到cDNA的5’以实现融合蛋白的亚细胞定位。
植物双元载体的其他实例为克隆了LMP基因候选者的pBPS-GB1、pSUN2-GW或pBPS-GB047载体。这些双元载体含有AtAct2-1启动子控制下驱动的抗生素抗性基因和候选基因前的USP种子特异性启动子或PtxA启动子(序列见附录)以及NOSpA终止子或OCS终止子。在USP种子特异性启动子或PtxA启动子后面将部分或全长LMP cDNA以有义或反义方向克隆进植物双元载体的多个克隆位点。使用标准条件将含有目的基因的重组载体转化进Top 10细胞(Invitrogen)。在含有50μg/ml卡那霉素的LB琼脂上37℃培养过夜来筛选转化的细胞。按照生产商的说明使用QIAprep Spin Miniprep试剂盒(Qiagen)提取质粒DNA。按照标准分子生物学技术进行其后的克隆分析和限制性作图(Sambrook等，1989，Molecular Cloning，A Laboratory Manual.第二版.Cold Spring HarborLaboratory Press.Cold Spring Harbor，NY)。
实施例11 农杆菌介导的植物转化可以使用标准转化和再生技术使用本文所述LMP核酸进行农杆菌介导的植物转化(Gelvin & Schilperoort，《Plant Molecular Biology Manual》，第二版Kluwer Academic Publ.，Dordrecht 1995 in Sect.，RingbucZentrale SignatuurBT11-P；Glick，Bernard R.和Thompson，John E.《Methods in Plant Molecular Biology and Biotechnology》，S.360，CRCPress，Boca Raton 1993)。例如，可以使用GV3(pMP90)(Koncz & Schell，1986，Mol.Gen.Genet.204383-396)或LBA4404(Clontech)根癌农杆菌菌株进行农杆菌介导的转化。
可以按照标准条件培养和转化拟南芥(Bechtold，1993，Acad.Sci.Paris.3161194-1199；Bent等，1994，Science 2651856-1860)。此外，可以通过子叶或下胚轴转化用本发明的LMP核酸转化油菜(Moloney等，1989，PlantCell Report 8238-242；De Block等1989，Plant Physiol.91694-701)。用于农杆菌和植物选择的抗生素取决于转化使用的双元载体和农杆菌菌株。通常使用选择性植物标记进行油菜选择。此外，可以使用如Mlynarova等(1994，Plant Cell Report 13282-285)所述的技术实施农杆菌介导的基因向亚麻的转移。
将拟南芥WRI1或WRI1样基因克隆进双元载体并在PtxA启动子(豌豆PtsA基因启动子，见附录)下表达，PtxA启动子几乎在所有植物组织中都具有活性。然而，在种子和花中，通过GUS染色检测不到表达活性，用更灵敏的RP-PCR方法检测到低表达活性(Song等，2004，PF 55368-2 US)。仅在含有转基因ptxA启动子/GUS表达构建体的多个拷贝的植物株系中可在部分花和长角果中检测到一定的表达(更多细节参阅Song等，2004，PF55368-2US)。或者，使用超级启动子，其为组成型启动子(Stanton B.Gelvin，美国专利号5,428,147和5,217,903))或种子特异性启动子，如来自蚕豆的USP(未知种子蛋白质)(Baeumlein等，1991，Mol.Gen.Genetics 225459-67)或豆球蛋白B4启动子(LeB4；Baeumlein等，1992，Plant J.2233-239)或者赋予单子叶植物(如玉米、大麦、普通小麦、黑麦和稻等)中种子特异性表达的启动子。使用拟南芥AHAS(AtAHAS)作为这些构建体中的选择性标记。
图1显示了含有来自欧洲油菜的拟南芥WRI1样序列的双元载体构建体的方案。
可以使用如EP 0424 047、美国专利号5,322,783(Pioneer Hi-BredInternational)或EP 0397 687、美国专利号5,376,543或美国专利号5,169,770(University Toledo)中所述技术或本领域已知的多种其他转化方法的任一种进行大豆的转化。室温下用70％乙醇持续摇动4分钟，其后用补充了0.05％(体积/体积)TWEEN的20％(体积/体积)CLOROX持续摇动20分钟对大豆种子表面消毒。接着用蒸馏水洗涤种子4次，在室温下置于培养皿中润湿的无菌滤纸上6至39小时。剥去种皮，从胚轴分离子叶。检查胚轴以确认未损伤分生组织区。将剪下的胚轴收集到半开的无菌培养皿并风干至含湿量小于20％(鲜重)，置于封口的培养皿中待用。
植物转化方法还可应用于欧洲油菜和其他作物。具体而言，室温下用70％乙醇持续摇动4分钟，其后用补充了0.05％(体积/体积)TWEEN的20％(体积/体积)CLOROX持续摇动20分钟将油菜种子表面消毒。接着用蒸馏水洗涤种子4次，在室温下置于培养皿中润湿的无菌滤纸上18小时。除去种皮，将种子在半开的无菌培养皿中风干过夜。这期间种子失去约85％的含水量。然后将种子室温保存于在封口的培养皿中待用。
从LM固体培养基加适当抗生素(如100mg/l链霉素、50mg/l卡那霉素)的单菌落制备根癌农杆菌培养物，接着在液体LB培养基中培养单菌落至600nm的光密度为0.8。接着，室温下7000rpm沉淀细菌培养物7分钟并重悬于补充了100mM乙酰丁香酮的MS(Murashige & Skoog，1962，Physiol.Plant.15473-497)培养基。使用前在此预诱导培养基中室温温育细菌培养物2小时。室温下用预诱导的农杆菌悬浮培养物吸涨含湿量约44％的大豆合子种子胚轴2小时。(用农杆菌培养物吸涨干燥胚也适用于玉米胚轴)。从吸涨培养物除去胚并转移至含有补充了2％蔗糖的固体MS培养基的培养皿中，在黑暗中室温温育2天。或者，将胚置于培养皿中润湿(液体MS培养基)的无菌滤纸上并在与上述相同的条件下温育。这一期间过后，将胚转移到补充了500mg/l羧苄青霉素或300mg/l头孢噻肟的固体或液体MS培养基以杀死农杆菌。使用液体培养基润湿无菌滤纸。在440μmolm-2s-1和12小时光周期下25℃温育胚4周。当苗产生根时，将其转移至无菌metromix土壤中。将植物转移到土壤前，洗除体外植物的培养基。将植物置于塑料盖下1周，以帮助顺应过程。接着将植物转移至生长室中，在440μmolm-2s-1光密度和12小时光周期下25℃温育约80天。
通过PCR分析原代转基因植物(T0)的样品以确认T-DNA的存在。通过Southern杂交确认这些结果，其中将DNA在1％琼脂糖凝胶上电泳并转移至带正电的尼龙膜(Roche Diagnostics)。如生产商的推荐使用PCRDIG Probe Synthesis试剂盒(Roche Diagnostics)通过PCR制备洋地黄毒苷标记的探针。
作为单子叶植物转化的实例，描述了构建ptxA启动子与玉米泛蛋白内含子和WRI1或WRI1样核酸分子的组合。用PacI和XmaI消化pUC中的PtxA-WRI1直向同源物基因构建体。用PacI和XmaI消化pBPSMM348以分离玉米泛蛋白内含子(ZmUbi内含子)，接着电泳并使用QIAEX II Gel Extraction试剂盒(目录号20021)。将ZmUbi内含子连接进pUC中的PtxA-WRI1或WRI1样核酸分子，以产生基于pUC的PtxA-ZmUbi内含子-WRI1或WRI1样核酸分子构建体，接着用AfeI和PmeI限制酶消化。电泳后从Seaplaque低熔解温度琼脂糖凝胶(

琼脂糖目录号50110)切下PtxA-ZmUbi内含子WRI1或WRI1样基因盒。用PmeI消化含有选择性标记盒的单子叶植物的基础载体(单子叶植物基础载体)。将含有ptxA启动子-ZmUbi内含子的WRI1或WRI1样核酸分子表达盒连接进单子叶植物基础载体以产生PtxA-ZmUbi内含子-BnWRI01构建体(图2)。其后，按照本领域的通用方案使用电穿孔将PtxA-ZmUbi内含子-WRI1或WRI1样核酸分子构建体转化进含有pSB1(超级vir质粒)的重组LBA4404菌株中。按照美国专利号5,591,616中所述方案使用未成熟胚进行玉米中农杆菌介导的转化。应用咪唑啉酮除草剂选择以获得转基因玉米株系。在玉米中使用ptxA启动子::ZmUbi内含子的GUS表达实验中，描述了在胚胎发生愈伤组织和根中的强表达(Song等，2004，PF 55368-2US)。
一般而言，可以将植物启动子如PtxA下的稻(或其他单子叶植物)WRI1基因或WRI1样基因转化进玉米或其他作物植物，以产生单子叶植物WRI1基因在其他单子叶植物中的效应，或双子叶植物WRI1基因在其他双子叶植物中的效应，或单子叶植物基因在双子叶植物中的效应，反之亦然。应以与本文所述其他质粒的构建相似的方式构建含有这些WRI1或WRI1样编码序列、5’启动子和3’终止子的质粒实施例12 体内诱变可以通过将质粒(或其他载体)DNA掺入到维持自身遗传信息的能力受损的大肠杆菌或其他微生物(如芽孢杆菌属或酵母如酿酒酵母)中并传代来实现微生物的体内诱变。通常，增变株在DNA修复系统的基因中含有突变(如mutHLS、mutD、mutT等；参考文献见Rupp，1996，DNA repairmchanisms，《Escherichia coli and Salmonella》，2277-2294页，ASMWashington)。这些菌株为本领域技术人员所熟知。这些菌株的使用在例如Greener和Callahan，M.，1994，Strategies 732-34中有所说明。优选在微生物中进行选择和测试后将突变的DNA分子转移进植物。按照此文献示例内的多个实例产生转基因植物。
实施例13 转化的生物中mRNA表达和重组基因产物活性的评估可以在转录和/或翻译水平测量转化的宿主生物中重组基因产物的活性。确定基因转录水平(可供翻译成基因产物使用的mRNA量的指示)的有用方法是进行Northern印迹(参考文献见如Ausubel等，1988，CurrentProtocols in Molecular Biology，WileyNew York)，其中用可检测标签(通常为放射性或化学发光)标记设计与目的基因结合的引物，从而在提取微生物培养物的总RNA、在凝胶上电泳、转移至稳定基质并与此探针温育时，探针的结合和结合的量指示此基因mRNA的存在和量。此信息至少部分证明了转化基因的转录程度。可以通过本领域熟知的若干方法，如Bormann等(1992，MoI.Microbiol.6317-326)中所述的方法从植物细胞、组织或器官制备总细胞RNA。
为评估从此mRNA翻译的蛋白质的存在或相对量，可以使用标准技术如Western印迹(参阅如Ausubel等，1988，《Current Protocols inMolecular Biology》，WileyNew York)。在此方法中，提取细胞总蛋白、通过凝胶电泳分离、转移至基质如硝酸纤维素并与探针(如与目的蛋白质特异性结合的抗体)温育。用便于检测的探针，其通常用化学发光或比色法标记来标记。观察到的标记的存在和量指示细胞中目的突变蛋白质的存在和量。
可以通过若干成熟的方法测量与DNA结合的LMP的活性，如DNA条带移位分析(也称为凝胶阻滞测定)。可以使用报道基因测定(如Kolmar H.等，1995，EMBO J.143895-3904 and references cited therein及其引用的参考文献中所述)测量此类LMP对其他分子表达的影响。使用如β-半乳糖苷酶等酶、绿色荧光蛋白等的报道基因测试系统是熟知的，并已确立用于原核和真核细胞。
可以按照如Gennis R.B.(1989 Pores，Channels and Transporters，inBiomembranes，Molecular Structure and Function，SpringerHeidelberg，85-137、199-234和270-322页)中所述的技术进行脂类代谢膜转运蛋白的活性测定。
实施例14 拟南芥、欧洲油菜、大豆、稻或普通小麦WRI1和WRI1样基因在转基因植物中功能的体外分析酶活性和动力学参数的测定是本领域中成熟的。必须使用于测定任一给定的改变的酶活性的实验适用于野生型的比活性，这在本领域技术人员的能力之内。关于酶总体的以及结构、动力学、原理、方法、应用和实例的具体细节的概述可见于例如以下参考文献Dixon & Webb，1979，《Enzymes》.LongmansLondon；Fersht，(1985)《Enzyme Structure andMechanism》.FreemanNew York；Walsh(1979)《Enzymatic ReactionMechanisms》.FreemanSan Francisco；Price，N.C.，Stevens，L.(1982)《Fundamentals of Enzymology》.Oxford Univ.PressOxford；Boyer，P.D.编辑(1983)《The Enzymes》，第三版.Academic PressNew York；Bisswanger，H.，(1994)《Enzymkinetik》，第二版.VCHWeinheim(ISBN3527300325)；Bergmeyer，H.U.，Bergmeyer，J.，GraBl，M.编辑(1983-1986)《Methods of Enzymatic Analysis》，第三版，第I-XII卷，Verlag ChemieWeinheim和《Ullmann′s Encyclopedia of Industrial Chemistry》(1987)A9卷，Enzymes.VCHWeinheim，352-363页。
实施例15 分析重组蛋白对目的种子贮藏化合物的产生的影响通过气相层析(GC)分析来自转化的拟南芥植物的种子的总油含量和脂肪酸谱。GC分析显示，与Columbia-2相比，在分离T2和纯合T3种子世代中转化了pBPS-GB047的拟南芥植物显示出总种子油含量提高10-15％(图3)，所述pBPS-GB047含有驱动拟南芥WRI1基因的Ptxa启动子和作为选择性标记的AHAS基因。总种子蛋白质水平与对照植物相比几乎相同(数据未显示)。拟南芥PtxA::WRI1过表达子(AtWRI01)显示总种子油含量百分比从Columbia野生型和PtxA空载体对照中的约35％提高至转基因株系T2和T3种子中的约40％。图4显示PtxA::WRI1对种子中油酸(18:1)含量的影响。与Columbia-2(遗传背景)、GB007(空载体对照)和Columbia-24(实验中使用的高油对照)相比，在一些转基因株系中存在显著的提高。油酸的相对量从对照中的约18％提高到一些转基因WRI1过表达子中的63-65％。油酸提高的效应看来在T2和T3种子世代中非常稳定。我们从图3和图4所示T2和T3种子世代中总种子油含量的提高和油酸百分比的提高之间的相关性得出结论该性状是可遗传的。
种子中油酸百分比的提高伴随着亚油酸和亚麻酸相对量的显著降低(图5)。转基因种子中亚油酸低于野生型含量的5％，亚麻酸是野生型含量的20％或更低。与此同时，与野生型相比，转基因种子中饱和脂肪酸(16:0、18:0、20:0的总和)的相对量至少降低20％(图6). 测试了其他启动子/WRI1基因组合的效应。表达处于种子特异性启动子LeB4控制下的WRI1的转基因植物在种子脂肪酸组成上未显示任何可检测的效应。结果提示用如PtxA的启动子过表达WRI1允许操作总种子油含量和脂肪酸组成，特别是油酸、亚油酸和亚麻酸。
可以通过在合适的条件下培养修饰的植物并分析种子或任何其他植物器官中目的产物(即脂类或脂肪酸)提高的产量来评估植物中遗传修饰对目的种子贮藏化合物(如糖、脂类或脂肪酸)的影响。这些分析技术为本领域技术人员所熟知，包括分光术、薄层层析法、多种类型的染色方法、酶学和微生物方法以及分析型层析如高效液相层析(参阅如Ullman，1985，《Encyclopedia of Industrial Chemistry》，A2卷，89-90和443-613页，VCHWeinheim；Fallon等，1987，Applications of HPLCin Biochemistry《Laboratory Techniq ues in Biochemistry and Molecular Biology》，第17卷；Rehm等，1993，Product recovery and purification，《Biotechnology》，第3卷，第III章，469-714页，VCHWeinheim；Belter，P.A.等，1988《Bioseparationsdownstream processing for biotechnology》，John Wiley& Sons；Kennedy & Cabral，1992，《Recovery processes for biologicalmaterials》，John Wiley and Sons；Shaeiwitz & Henry，1988，Biochemicalseparations《Ulmann′s Encyclopedia of Industrial Chemistry，Separationand purification techniques in biotechnology》，B3卷，第11章，1-27页，VCHWeinheim和Dechow FJ.1989)。
除了上述方法以外，如Cahoon等(1999，Proc.Natl.Acad.Sci.USA 96，2212935-12940)和Browse等(1986，Anal.Biochemistry 442141-145)所述从植物材料提取植物脂类。定性和定量的脂类或脂肪酸分析描述于Christie，William W.，《Advances in Lipid Methodology》.Ayr/ScotlandOily Press.-(Oily Press Lipid Library；Christie，William W.，Gas Chromatographyand Lipids.A Practical Guide-Ayr，ScotlandOily Press，1989 Repr.1992.-IX，307 S.-(Oily Press Lipid Library和＂Progress in Lipid Research，OxfordPergamon Press，1(1952)-16(1977)Progress in the Chemistry ofFats and Other Lipids CODEN。
可以按照如Christie及其中的参考文献(1997《Advances on LipidMethodology》第四版Christie，Oily Press，Dundee，119-169页；1998)中所述的标准分析方法GC、GC-MS或TLC来分析转基因植物以获得脂肪酸产物存在的明确证据。用于叶的详细方法描述于Lemieux等(1990，Theor.Appl.Genet.80234-240)，用于种子的详细方法描述于Focks&Benning(1998，Plant Physiol.11891-101)。
通过脂肪酶消化确定甘油骨架的sn-1、sn-2或sn-3位置上脂肪酸组成的位置分析(参阅如Siebertz & Heinz，1977，Z.Naturforsch.32c193-205和Christie 1987，《Lipid Analysis》第二版，Pergamon Press，Exeter，ISBN0-08-023791-6)。
可以通过适当的方法测定总种子油水平。通常用常规方法定量种子油含量，如近红外分析(NIR)或核磁共振成像(NMR)。只要目的样品适用于此技术，NIR光谱法已经成为筛选种子样品的标准方法。研究的样品包括油菜、大豆、玉米、普通小麦、稻等。可以使用单个种子的NIR分析(参阅如Velasco等，′Estimation of seed weight，oil content and fatty acidcomposition in intact single seeds of rapeseed(Brassica napus L.)bynear-infrared reflectance spectroscopy，′Euphytica，Vol.106，1999，pp.79-85)。NMR也已用于分析种子的含油量(参阅如Robertson & Morrison，Journal of the American Oil Chemists Society，1979，第56卷，1979，961-964页，将其完整引入本文作为参考)。
收集关于提高或降低的蛋白质活性对脂类和糖生物合成途径的影响的信息的典型方法为例如通过使用14C-乙酸或14C-丙酮酸标记叶或种子的标记研究来分析碳通量(参阅如Focks & Benning，1998，Plant Physiol.11891-101；Eccleston & Ohlrogge，1998，Plant Cell 10613-621)。可以通过各自分离(例如在TLC平板上)后包括标准品如14C-蔗糖和14C-苹果酸的液体闪烁计数来测定14C向脂类和水溶性组分中的分布(Eccleston &Ohlrogge，1998，Plant Cell 10613-621)。
可以通过超声处理、玻璃研磨、液氮和研磨或通过其他适用的方法崩解待分析的材料。崩解后必须离心材料。将沉淀物重悬于蒸馏水，100℃加热10分钟，在冰上冷却并再次离心，其后在90℃用含有2％二甲氧基丙烷的甲醇中的0.5M硫酸萃取1小时，引起油和脂类化合物水解，得到转甲基脂类。用石油醚(petrolether)萃取这些脂肪酸甲酯，最后进行GC分析，所述分析使用毛细管柱(Chrompack，WCOT Fused Silica，CP-Wax-52 CB，25m，0.32mm)，温度梯度在170℃和240℃之间20分钟，其后240℃ 5分钟。通过使用商业来源(即Sigma)的标准品来定义得到的脂肪酸甲酯的身份。对于脂肪酸没有可用的标准品的情况，通过衍生和其后的GC-MS分析证明分子身份。例如，在通过4，4-二甲氧基-噁唑啉-Derivaten衍生之后通过GC-MS显示三键脂肪酸的位置(Christie，Oily Press，Dundee，1998)。
用于分析糖(特别是淀粉)的通用标准方法公开于Stitt等(1989，Methods Enzymol.174518-552)。关于其他方法，还参阅H

rtel等(1998，Plant Physiol.Biochem.36407-417)和Focks & Benning(1998，PlantPhysiol.11891-101)。
为提取可溶性糖和淀粉，将50粒种子在1.5ml聚丙烯试管中500μl80％(体积/体积)乙醇中匀浆并在70℃温育90分钟。以16000g离心5分钟后，将上清液转移至新试管中。用500μl 80％乙醇提取沉淀两次。室温下将合并的上清液的溶剂真空蒸发。将残渣溶于50μl水中，代表可溶性碳水化合物级分。在200μl 0.2N KOH中将乙醇提取后剩下的沉淀(含有不溶性碳水化合物，包括淀粉)匀浆，将上清液在95℃温育1小时以溶解淀粉。加入35μl1N乙酸并以16000g离心5分钟后，将上清液用于淀粉定量。
为定量不溶性糖，将10μl糖提取物加入990μl含有100mM咪唑，pH6.9、5mM MgCl2、2mM NADP、1mM ATP和2单位2ml-1葡萄糖-6-磷酸-脱氢酶的反应缓冲液中。对于葡萄糖、果糖和蔗糖的酶测定，连续加入4.5单位己糖激酶、1单位葡糖磷酸异构酶和2μl饱和果糖苷酶溶液。在波长340nm处用光度计监测NADPH的产生。同样，用来自BoehringerMannheim的试剂盒测定30μl不溶性碳水化合物级分中的淀粉。
分析叶和种子中蛋白质含量的实例可见于Bradford(1976，Anal.Biochem.72248-254)。对于总种子蛋白质的定量，在1.5ml聚丙烯试管中的250μl丙酮中将15-20粒种子匀浆。以16000g离心后，弃去上清液，将真空干燥的沉淀重悬于250μl含有50mM Tris-HCl，pH8.0、250mMNaCl、1mM EDTA和1％(重量/体积)SDS的提取缓冲液中。在25℃温育2小时后，将匀浆以16000g离心5分钟，将200ml上清液用于蛋白质测定。测定中，用γ-球蛋白校准。对于蛋白质测定，使用Lowry DC蛋白质测定(Bio-Rad)或Bradford测定(Bio-Rad)。
根据Renz等(1993，Planta 190156-165)用分光光度法进行己糖激酶和果糖激酶的酶测定，根据Burrell等(1994，Planta 19495-101)进行葡糖磷酸异构酶、依赖ATP的6-果糖磷酸激酶、依赖焦磷酸的6-磷酸果糖激酶、果糖-1，6-二磷酸醛缩酶、磷酸丙糖异构酶、甘油-3-磷酸脱氢酶、磷酸甘油酸激酶、磷酸甘油酸变位酶、烯醇化酶、和丙酮酸激酶的酶测定，根据Zrenner等(1995，Plant J.797-107)进行UDP-葡萄糖-焦磷酸化酶的酶测定。
如

等(1998，Plant Physiol.Biochem.36407-417)所述测定碳水化合物代谢中间体，如葡萄糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、磷酸烯醇丙酮酸、丙酮酸和ATP，如Jelitto等(1992，Planta 188238-244)所述测定代谢物。
除了测定最终种子贮藏化合物(即脂类、淀粉或贮藏蛋白质)之外，还可以分析目的种子贮藏化合物的产生所利用的代谢途径的其他组分(如中间体和副产物)，以测定化合物产生的总效率(Fiehn等，2000，NatureBiotech.181447-1161)。例如，可以构建含有本文公开的核酸或其片段的酵母表达载体并使用标准方案转化进酿酒酵母。接着可以测定得到的转基因细胞中糖、油、脂类或脂肪酸含量的改变。同样，可以构建含有本文所述核酸或其片段的植物表达载体并使用标准方案转化进合适的植物细胞，如拟南芥、大豆、油菜、稻、玉米、普通小麦、Medicago truncatula等。接着可以测定得到的转基因细胞和/或由其产生的植物中糖、油、脂类或脂肪酸含量的改变。
此外，本文公开的序列或其片段可用于在多种生物(如细菌、哺乳动物细胞、酵母细胞和植物细胞)的基因组中产生敲除突变(Girke等，1998，PlantJ.1539-48)。接着可以对得到的敲除细胞评估其种子贮藏化合物的组成和含量以及突变对表型和/或基因型的影响。基因失活的其他方法包括美国专利号6,004,804和Puttaraju等(1999，Nature Biotech.17246-252)中所述的方法。
实施例16 从转化的生物中纯化目的产物可以通过多种本领域熟知的方法从植物材料中回收LMP。植物器官可以与其他组织或器官机械分离，接着从该植物器官分离种子贮藏化合物。组织匀浆之后，通过离心除去细胞碎片，保留含有可溶性蛋白质的上清液级分用于进一步纯化目的化合物。如果产物由培养基中生长的细胞分泌，则通过低速离心从培养物中除去细胞，保留上清液级分用于进一步纯化。
用合适的树脂层析来自任一纯化方法的上清液级分，其中目的分子留在层析树脂上而样品中的许多杂质则不能，或者杂质留在树脂上，而样品则不然。必要时可以使用相同或不同的层析树脂重复这些层析步骤。本领域技术人员能熟练的为待纯化的具体分子选择合适的层析树脂及其最有效的应用。可以通过过滤或超滤浓缩纯化产物，并在产物的稳定性最大的温度下保存。
本领域已知多种纯化方法，前面的纯化方法并不是限制性的。这些纯化技术描述于例如Bailey & Ollis，1986，Biochemical EngineeringFundamentals，McGraw-HillNew York。
可以通过本领域的标准技术评估分离化合物的身份和纯度。这些技术包括高效液相层析(HPLC)、光谱方法、染色方法、薄层层析、分析型层析如高效液相层析、NIRS、酶测定或微生物方法。这些分析方法综述于Patek等(1994，Appl.Environ.Microbiol.60133-140)、Malakhova等(1996，Biotekhnologiya 1127-32)、Schmidt等(1998，Bioprocess Engineer1967-70)、《Ulmann′s Encyclopedia of Industrial Chemistry》(1996，A27卷，VCHWeinheim，89-90页、521-540页、540-547页、559-566页、575-581页和581-587页)和Michal G.(1999，Biochemical PathwaysAn Atlas ofBiochemistry and Molecular Biology，John Wiley and Sons；Fallon，A.等1987，Applications of HPLC in Biochemistry inLaboratory Techniques inBiochemistry and Molecular Biology，17卷)。
实施例17 筛选增加的种子大小与植物野生型品种相比，条件表达WRI1或作物WRI1样基因引起转基因植物增加的种子大小。如实施例11所述产生表达PtxA启动子控制下的WRI1的转基因拟南芥植物，发现其产生比野生型植物的种子更大的种子。一般使用显微镜观察这种大小的增加。此外，发现在PtxA::WRI1过表达株中种子重量提高。例如，与野生型相比，wri1突变体种子在种子重量上显示20％的降低(图7)。在独立转基因株系pWriRT-7和pWriRT-5的分离T2种子世代中，100粒种子的重量分别提高30％和40％(图7)。与空载体对照相比，在纯合T3种子中，种子重量提高多达60％(数据未显示)。WRI1或WRI1样基因过表达株种子大小的增加反映了提高的种子重量。在许多经济上重要的作物植物中，提高的种子大小引起更高的产量。因此，增加的种子大小是使用本申请所述WRI1或WRI1样核酸分子进行遗传改造和选择的一个目标。
实施例18 增加的根长度的筛选体外根分析在体外根分析中，使用尺寸为12cm×12cm的方形平板。每个平板使用52ml无选择的MS培养基(0.5×MS盐、0.5％蔗糖、0.5g/L MES缓冲液、1％ Phytagar)。使平板在无菌通风厨中干燥1小时以减少将来的凝聚。
用乙醇在玻璃瓶中使种子等分试样消毒5分钟，除去乙醇，使种子在无菌通风厨中干燥1小时。使用Vacuseed Device(Lehle)将种子点样在平板上。将种子点样在平板上之后，用Ventwrap包住平板并竖直置于黑暗中4℃的架子上使种子分层。将平板转移至C5 Percival培养箱(GrowthChamber)并竖直放置。培养箱条件为白天23℃/夜晚21℃和16小时白天/8小时夜晚。
为收集数据，使用高分辨率平板扫描仪。使用WinRhizo软件包进行根的分析。对得自拟南芥野生型和wri1突变体的根长度的比较表明wri1突变体中根长度减少50％。发现这种根长度的减少和与野生型相比延迟的萌发和确定的发育时间点的叶片数减少有关(图8)。在野生型背景下过表达WRI1或WRI1样基因可以提高种子萌发、增加根长度并提高叶发育速度和叶片数。后者可以提高植物的光合性能，引起生物量产量提高和种子数量和/或大小增加，伴随着种子贮藏化合物(如油、蛋白质和糖)量的提高。
土壤根分析对于土壤根分析，可以使种子在水中4℃吸涨2天并无选择地直接播种。使用底部为饱和泥炭团粒(Jiffy 727)并装满水饱和Metromix的Deepot(Hummert D40)。播种后，用塑料套覆盖盆以防止干燥。可以仅使用培养基制备物中存在的水培养植物，因为这些大盆中土壤内的水足以培养3周，并促进根的快速生长。在12天后从盆上除去塑料套，记录形态学数据。在第17天，收获植物的气生部分、干燥(65℃2天)并测量干重。为检查根，将泥炭团粒挤到盆顶以将土壤和根作为整体移出。接着在盘中将土壤和根分开并测量最大根长度。取所有转基因株系的所有植物的根长度的平均值并与野生型植物的平均值进行比较。
仅使用常规实验，本领域技术人员会认识到或能够确定本文所述本发明的具体实施方案的许多等同方案。这些等同方案旨在包含于本文公开并要求保护的本发明权利要求书中。
附录 SEQ ID NO1-AtWRI01的核酸序列 AAACCACTCTGCTTCCTCTTCCTCTGAGAAATCAAATCACTCACACTCCAAAAAAAAATCTAAACTT TCTCAGAGTTTACGCCCTTGGTACCAAATCTAAACTTTCTCAGAGTTTAATGAAGAAGCGCTTAACC ACTTCCACTTGTTCTTCTTCTCCATCTTCCTCTGTTTCTTCTTCTACTACTACTTCCTCTCCTATTCAGT CGGAGGCTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCTTCTCCTTCTGGTGATAAATCTCA TAACCCGACAAGCCCTGCTTCTACCCGACGCAGCTCTATCTACAGAGGAGTCACTAGACATAGATGG ACTGGGAGATTCGAGGCTCATCTTTGGGACAAAAGCTCTTGGAATTCGATTCAGAACAAGAAAGGC AAACAAGTTTATCTGGGAGCATATGACAGTGAAGAAGCAGCAGCACATACGTACGATCTGGCTGCT CTCAAGTACTGGGGACCCGACACCATCTTGAATTTTCCGGCAGAGACGTACACAAAGGAATTGGAA GAAATGCAGAGAGTGACAAAGGAAGAATATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTCCA GAGGCGTCTCTAAATATCGCGGCGTCGCTAGGCATCACCACAACGGAAGATGGGAGGCTCGGATCG GAAGAGTGTTTGGGAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAGGAAGCTGCTGCAG CATATGACATGGCTGCGATTGAGTATCGAGGCGCAAACGCGGTTACTAATTTCGACATTAGTAATTA CATTGACCGGTTAAAGAAGAAAGGTGTTTTCCCGTTCCCTGTGAACCAAGCTAACCATCAAGAGGGT ATTCTTGTTGAAGCCAAACAAGAAGTTGAAACGAGAGAAGCGAAGGAAGAGCCTAGAGAAGAAGT GAAACAACAGTACGTGGAAGAACCACCGCAAGAAGAAGAAGAGAAGGAAGAAGAGAAAGCAGAG CAACAAGAAGCAGAGATTGTAGGATATTCAGAAGAAGCAGCAGTGGTCAATTGCTGCATAGACTCT TCAACCATAATGGAAATGGATCGTTGTGGGGACAACAATGAGCTGGCTTGGAACTTCTGTATGATGG ATACAGGGTTTTCTCCGTTTTTGACTGATCAGAATCTCGCGAATGAGAATCCCATAGAGTATCCGGA GCTATTCAATGAGTTAGCATTTGAGGACAACATCGACTTCATGTTCGATGATGGGAAGCACGAGTGC TTGAACTTGGAAAATCTGGATTGTTGCGTGGTGGGAAGAGAGAGCCCACCCTCTTCTTCTTCACCAT TGTCTTGCTTATCTACTGACTCTGCTTCATCAACAACAACAACAACAACCTCGGTTTCTTGTAACTAT TTGGTCTGAGAGAGAGAGCTTTGCCTTCTAGTTTGAATTTCTATTTCTTCCGCTTCTTCTTCTTTTTTTT CTTTTGTTGGGTTCTGCTTAGGGTTTGTATTTCAGTTTCAGGGCTTGTTCGTTGGTTCTGAATAATCAA TGTCTTTGCCCCTTTTCTAATGGGTACCTGAAGGGCGA SEQ ID NO2-AtWRI01的可读框的核酸序列 ATGAAGAAGCGCTTAACCACTTCCACTTGTTCTTCTTCTCCATCTTCCTCTGTTTCTTCTTCTACT ACTACTTCCTCTCCTATTCAGTCGGAGGCTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAAT CTTCTCCTTCTGGTGATAAATCTCATAACCCGACAAGCCCTGCTTCTACCCGACGCAGCTCTATC TACAGAGGAGTCACTAGACATAGATGGACTGGGAGATTCGAGGCTCATCTTTGGGACAAAAGC TCTTGGAATTCGATTCAGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGTGAA GAAGCAGCAGCACATACGTACGATCTGGCTGCTCTCAAGTACTGGGGACCCGACACCATCTTG AATTTTCCGGCAGAGACGTACACAAAGGAATTGGAAGAAATGCAGAGAGTGACAAAGGAAGA ATATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGC GTCGCTAGGCATCACCACAACGGAAGATGGGAGGCTCGGATCGGAAGAGTGTTTGGGAACAAG TACTTGTACCTCGGCACCTATAATACGCAGGAGGAAGCTGCTGCAGCATATGACATGGCTGCGA TTGAGTATCGAGGCGCAAACGCGGTTACTAATTTCGACATTAGTAATTACATTGACCGGTTAAA GAAGAAAGGTGTTTTCCCGTTCCCTGTGAACCAAGCTAACCATCAAGAGGGTATTCTTGTTGAA GCCAAACAAGAAGTTGAAACGAGAGAAGCGAAGGAAGAGCCTAGAGAAGAAGTGAAACAAC AGTACGTGGAAGAACCACCGCAAGAAGAAGAAGAGAAGGAAGAAGAGAAAGCAGAGCAACA AGAAGCAGAGATTGTAGGATATTCAGAAGAAGCAGCAGTGGTCAATTGCTGCATAGACTCTTC AACCATAATGGAAATGGATCGTTGTGGGGACAACAATGAGCTGGCTTGGAACTTCTGTATGAT GGATACAGGGTTTTCTCCGTTTTTGACTGATCAGAATCTCGCGAATGAGAATCCCATAGAGTAT CCGGAGCTATTCAATGAGTTAGCATTTGAGGACAACATCGACTTCATGTTCGATGATGGGAAGC ACGAGTGCTTGAACTTGGAAAATCTGGATTGTTGCGTGGTGGGAAGAGAGAGCCCACCCTCTTC TTCTTCACCATTGTCTTGCTTATCTACTGACTCTGCTTCATCAACAACAACAACAACAACCTCGG TTTCTTGTAACTATTTGGTCTGA SEQ ID NO3-AtWRI01的可读框的氨基酸序列 MKKRLTTSTCSSSPSSSVSSSTTTSSPIQSEAPRPKRAKRAKKSSPSGDKSHNPTSPASTRRSSIYRGVTRHR WTGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPAETYTKELEE MQRVTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAY DMAAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVNQANHQEGILVEAKQEVETREAKEEPREEVKQQY VEEPPQEEEEKEEEKAEQQEAEIVGYSEEAAVVNCCIDSSTIMEMDRCGDNNELAWNFCMMDTGFSPFL TDQNLANENPIEYPELFNELAFEDNIDFMFDDGKHECLNLENLDCCVVGRESPPSSSSPLSCLSTDSASSTT TTTTSVSCNYLV SEQ ID NO4-Bn22743-1的核酸序列 CTTGCACACAGTGCGTCTTTGGTTTTCTCTTTCCTAGGGTTTGTGTTTTGGTTCTGATCATGGCGTCGA TGTCGTCGCCGGATCAGGGGCCTAAGACAGAGGCGGGAGGAGGAGGAGAGAGCTCGGAGAATGTG TCGGCGAGTGATCAGATGTTGCTGTATAGAAGTTTTAAGAAGGCGAAGAAGGAGAGAGGATGCACA GCTAAGGAGCGTATCAGTAAAATGCCGCCCTGCACAGCTGGCAAAAGGAGTTCTATTTACCGTGGA GTCACCAGACATAGATGGACAGGTCGGTACGAAGCTCACCTTTGGGACAAGAGTACTTGGAACCAA AACCAGAACAAGAAGGGCAAACAAGTTTATCTAGGAGCATATGATGATGAAGAGGCTGCTGCTAGA GCCTACGACCTTGCTGCCTTGAAATACTGGGGACCTGGAACACTTATCAATTTTCCGGTGACTGATT ACTCTAGGGATTTAGAAGAAATGCAAAGTCTCTCAAGGGAAGAATACCTTGCAACTCTACGTAGAA AAAGCAGCGGTTTCTCAAGGGGAATAGCCAAATATCGTGGCCTTCAAAGCCGATGGGAAGCATCAG CCAGTCGGATGCCTGGACCTGAATACTTCGGTAGCCTTCATTACGGTGATGAACGAGGAGCAGAAG GTGACTTTCTTGGCAGCTTTTGTCTGGAAAGAAAGATTGATCTAACGGGATACATAAAGTGGTGGGG AGTCAACAAACCCGGTCAACCAGAATCTTCATCAAAGGCATCAGAGGATGCAAAGGTAGAAGATGC AGGTACTGAGCTTAAGACACTGGAACACGCTTCCCAGGCAACAGAGCCATACAAAGCACCAAACTT TGGCGTTCATCATGGCACTCAGAGGAAAGGAAAACAAATAACATCGCCGTCCTCCACCTCTTCTGCT TTAAGCATTTTGTCTGCGTCACCTGCTTACAAGAGTCTGGAGGAGAAAGTGATGAAGATCCAAGAAA GTAGCAGCACTAGAGAAAACGATGAGAATGCAAACCGTAACATCAATAGTATTGAGAAGAGTCACG GTAAGGAAATAGAGAAACCACCGGTCGTGAGTCATGGAGTTTCTCTAGGCAGTGGTGGTGGTGTTG CTCCTGCTGCTGCTGCTTTGTCTCTTCAGAAAAGCATGTACCCACTTGCCTCTCTCTTAACTGCTCCAC TGCTCAGCAATTACAATACATTGGATCCCCTTGGAGAGCCTATTCTCTGGACACCGTTCCTTCACCCA GGATCTTCTCATACTTTAGAGGTGACAAAGACAGAGACAAGTTGTTCCACATACAGTTACCTCCCAC AAGAGAAGTGAGCCGTTCCCCTTTAGACTGTTTGTGAAAATGATCTGAAGCAGGAATGTACAGGTTT TTGTCAGTGTTTTATGTGTATTTTCAGTGTGGAATATATATAGAATCATTATACTTAAATGTAAAACA GGCAAAATTTATGATTATACAGTAGTATAAAGGTTTGCTCTT SEQ ID NO5-BnWRI22743-1可读框的核酸序列 ATGGCGTCGATGTCGTCGCCGGATCAGGGGCCTAAGACAGAGGCGGGAGGAGGAGGAGAGAG CTCGGAGAATGTGTCGGCGAGTGATCAGATGTTGCTGTATAGAAGTTTTAAGAAGGCGAAGAA GGAGAGAGGATGCACAGCTAAGGAGCGTATCAGTAAAATGCCGCCCTGCACAGCTGGCAAAA GGAGTTCTATTTACCGTGGAGTCACCAGACATAGATGGACAGGTCGGTACGAAGCTCACCTTTG GGACAAGAGTACTTGGAACCAAAACCAGAACAAGAAGGGCAAACAAGTTTATCTAGGAGCAT ATGATGATGAAGAGGCTGCTGCTAGAGCCTACGACCTTGCTGCCTTGAAATACTGGGGACCTGG AACACTTATCAATTTTCCGGTGACTGATTACTCTAGGGATTTAGAAGAAATGCAAAGTCTCTCA AGGGAAGAATACCTTGCAACTCTACGTAGAAAAAGCAGCGGTTTCTCAAGGGGAATAGCCAAA TATCGTGGCCTTCAAAGCCGATGGGAAGCATCAGCCAGTCGGATGCCTGGACCTGAATACTTCG GTAGCCTTCATTACGGTGATGAACGAGGAGCAGAAGGTGACTTTCTTGGCAGCTTTTGTCTGGA AAGAAAGATTGATCTAACGGGATACATAAAGTGGTGGGGAGTCAACAAACCCGGTCAACCAGA ATCTTCATCAAAGGCATCAGAGGATGCAAAGGTAGAAGATGCAGGTACTGAGCTTAAGACACT GGAACACGCTTCCCAGGCAACAGAGCCATACAAAGCACCAAACTTTGGCGTTCATCATGGCAC TCAGAGGAAAGGAAAACAAATAACATCGCCGTCCTCCACCTCTTCTGCTTTAAGCATTTTGTCT GCGTCACCTGCTTACAAGAGTCTGGAGGAGAAAGTGATGAAGATCCAAGAAAGTAGCAGCACT AGAGAAAACGATGAGAATGCAAACCGTAACATCAATAGTATTGAGAAGAGTCACGGTAAGGA AATAGAGAAACCACCGGTCGTGAGTCATGGAGTTTCTCTAGGCAGTGGTGGTGGTGTTGCTCCT GCTGCTGCTGCTTTGTCTCTTCAGAAAAGCATGTACCCACTTGCCTCTCTCTTAACTGCTCCACT GCTCAGCAATTACAATACATTGGATCCCCTTGGAGAGCCTATTCTCTGGACACCGTTCCTTCACC CAGGATCTTCTCATACTTTAGAGGTGACAAAGACAGAGACAAGTTGTTCCACATACAGTTACCT CCCACAAGAGAAGTGA SEQ ID NO6-Bn22743-1可读框的氨基酸序列 MASMSSPDQGPKTEAGGGGESSENVSASDQMLLYRSFKKAKKERGCTAKERISKMPPCTAGKRSSIYRG VTRHRWTGRYEAHLWDKSTWNQNQNKKGKQVYLGAYDDEEAAARAYDLAALKYWGPGTLINFPVTD YSRDLEEMQSLSREEYLATLRRKSSGFSRGIAKYRGLQSRWEASASRMPGPEYFGSLHYGDERGAEGDF LGSFCLERKIDLTGYIKWWGVNKPGQPESSSKASEDAKVEDAGTELKTLEHASQATEPYKAPNFGVHHG TQRKGKQITSPSSTSSALSILSASPAYKSLEEKVMKIQESSSTRENDENANRNINSIEKSHGKEIEKPPVVSH GVSLGSGGGVAPAAAALSLQKSMYPLASLLTAPLLSNYNTLDPLGEPILWTPFLHPGSSHTLEVTKTETSC STYSYLPQEK SEQ ID NO7-pcw4-1的核酸序列 TAATGAAGAGACCCTTAACCACTTCTCCTTCTTCCTCCTCTTCTACTTCTTCTTCGGCCTGTATACTTC CGACTCAATCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTCTGCGTTCTG ATGTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCAC TAGACATAGATGGACAGGGAGATACGAAGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCA GAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCACATACGT ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCAACACCATCTTGAACTTTCCGGTTGAGACGTACAC AAAGGAGCTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAG CAGTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG GAAGCTCGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAG GAAGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGTGCAAACGCAGTGACCAACTTC GACATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCGTTCCCCGTGAGCCAAGCTA ATCATCAAGAAGCTGTTCTTGCTGAAACCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAG AAGTGAAGCAGTGTGTCGAAAAAGAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAA GAAGTGGAGGAGGCGGTGATCACTTGCTGCATTGATTCTTCAGAGAGCAATGAGCTGGCTTGGGACT TCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACTGATTCAAATCTCTCGAGTGAGAATCCCATT GAGTATCCTGAGCTTTTCAATGAGATGGGTTTTGAGGATAACATTGACTTCATGTTCGAGGAAGGGA AGCAAGACTGCTTGAGCTTGGAGAATCTTGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAGAGAG CCCAACTTCATTGTCGTCTTCTCCGTTGTCCTGCTTGTCTACTGACTCTGCTTCATCAACAACAACAA CAGCAACAACAGTAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGGGGAGAGCTTTGCATTTCTAG GTTGAATTTTCTATTTCTTTTGCTTCTTTTTTTTTTGTTGAGTTCTGCTAGGGTTTGTATTCTGTTTCAG GGCTTACTCATTGGTTCTGACAGTCAATGTTTAGCTCTCTTTTCCGCTCGTCTA SEQ ID NO8-pcw4-1可读框的核酸序列 ATGAAGAGACCCTTAACCACTTCTCCTTCTTCCTCCTCTTCTACTTCTTCTTCGGCCTGTATACTTCCG ACTCAATCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTCTGCGTTCTGAT GTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTA GACATAGATGGACAGGGAGATACGAAGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGA ACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCACATACGTAC GATCTAGCTGCTCTCAAGTACTGGGGTCCCAACACCATCTTGAACTTTCCGGTTGAGACGTACACAA AGGAGCTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCA GTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGA AGCTCGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAGGA AGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGTGCAAACGCAGTGACCAACTTCGA CATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCGTTCCCCGTGAGCCAAGCTAAT CATCAAGAAGCTGTTCTTGCTGAAACCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAA GTGAAGCAGTGTGTCGAAAAAGAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAAGA AGTGGAGGAGGCGGTGATCACTTGCTGCATTGATTCTTCAGAGAGCAATGAGCTGGCTTGGGACTTC TGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACTGATTCAAATCTCTCGAGTGAGAATCCCATTGA GTATCCTGAGCTTTTCAATGAGATGGGTTTTGAGGATAACATTGACTTCATGTTCGAGGAAGGGAAG CAAGACTGCTTGAGCTTGGAGAATCTTGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAGAGAGCC CAACTTCATTGTCGTCTTCTCCGTTGTCCTGCTTGTCTACTGACTCTGCTTCATCAACAACAACAACA GCAACAACAGTAACCTCTGTTTCTTGTAACTATTCTGTCTGA SEQ ID NO9-pcw4-1可读框的氨基酸序列 MKRPLTTSPSSSSSTSSSACILPTQSETPRPKRAKRAKKSSLRSDVKPQNPTSPASTRRSSIYRGVTRHRWT GRYEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPNTILNFPVETYTKELEEM QRCTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAYD MAAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVSQANHQEAVLAETKQEVEAKEEPTEEVKQCVEKEE AKEEKTEKKQQQEVEEAVITCCIDSSESNELAWDFCMMDSGFAPFLTDSNLSSENPIEYPELFNEMGFED NIDFMFEEGKQDCLSLENLDCCDGVVVVGRESPTSLSSSPLSCLSTDSASSTTTTATTVTSVSCNYSV SEQ ID NQ10-pcw5a-1的核酸序列 TAATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCTTCTACTTCTTCATCTTGTATCC TTCGGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCGCCCCCTT GTGATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGT CACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATT CAGAACAAGAAAGGCAAACAAGTTTATTTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACG TACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACA AAAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGGTTCTCTCCGCCGCCAGA GCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATG GGAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGA GGAAGCTGCAGAAGCATATGACATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTT GACATTAGTAATTACATCGACCGGCTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGACCAAGCTA ACCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCTAAGAAAGAAGTGAAAGAGCACGTGG AAGAAGAACATCAAGAAGAGAAAACAGAGCAGCATCAAGAAGTGGAGGCGGTCACTTGCGGCATA GATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAACTTCTGTA TGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCATAGAGTA TCCTGAGCTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTTGAGGAAGCC AAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAGAGAAAGC CCAGCTTCTTTATCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAACAACAACA ACAAACTCTGTTTCTTGTAACTATTCTGTCTGAGGGAGAGAGCTTTGCATTATAGGGTTGAGTTTTCT ATTTCTTTTGCTTCTTGATCTTGTCCTTGTTGAGTTCCGCTAGGGTTTTTGTTTTTCGTTTCAGGGCTTA CTCGTTGGTTCTGAACAATCAATGTCTTCGCCTCA SEQ ID NO11-pcw5a-1可读框的核酸序列 ATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCTTCTACTTCTTCATCTTGTATCCTT CGGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCGCCCCCTTGT GATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGTC ACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATTC AGAACAAGAAAGGCAAACAAGTTTATTTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACGT ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACAA AAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGGTTCTCTCCGCCGCCAGAG CAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG GAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGAG GAAGCTGCAGAAGCATATGACATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTTG ACATTAGTAATTACATCGACCGGCTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGACCAAGCTAA CCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCTAAGAAAGAAGTGAAAGAGCACGTGGA AGAAGAACATCAAGAAGAGAAAACAGAGCAGCATCAAGAAGTGGAGGCGGTCACTTGCGGCATAG ATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAACTTCTGTAT GATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCATAGAGTAT CCTGAGCTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTTGAGGAAGCCA AGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAGAGAAAGCC CAGCTTCTTTATCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAACAACAACAA CAAACTCTGTTTCTTGTAACTATTCTGTCTGA SEQ ID NO12-pcw5a-1可读框的氨基酸序列 MKRPLTTCTSSSTSSSTSSSCILRNQPETPRPKRAKRAKKSSPPCDVKPQNPTSPASARRSSIYRGVTRHRW TGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPVETYKKELDE MQRGTKEEYLGSLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAEAY DMAAIEYRGANAVTNFDISNYIDRLKKKGVFPFRVDQANHQEAVLAEAKQEAKKEVKEHVEEEHQEEK TEQHQEVEAVTCGIDASGIMEMERSSDSNELAWNFCMMDSGFAPFLTDQNLSNENPIEYPELFNEMMGF EDNDIDFMFEEAKNECLSLENLDCCDVVVVGRESPASLSSSPLSCFSTDSASSTTTTTNSVSCNYSV SEQ ID NO13-pcw5b-1的核酸序列 TAATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCCTCTACTTCTTCATCTTGTATCC TTCCGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCTCCCCCTT GTGATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGT CACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATT CAGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATAC GTACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTAC ACAAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGCTTCTCTCCGCCGCCAG AGCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGAT GGGAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGG AGGAAGCTGCTGAAGCTTATGATATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTT CGACATTAGTAATTACATCGACCGTTTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGAGCAAGCC ACTCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCCAAGGAAGAAGTGAAAGAGCACGTG GAAGAAGAACATCAAGAAGCGAGGGAAGAGACAACAGAGCAGAAACAAGAAGTGGAGGCGGTCA CTTGCGGCGTAGATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTG GAACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAAT CCCATAGAGTATCCTGAACTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGT TCGAGGAAGCCAAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGG AAGAGAAAGCCCAACTTCTTTGTCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAAC AACAATAACAACAACAACAACAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGAGAGAGCTTTGC ATTATAGGGTTGAGTTTTCTATTTCTTTTGCTTCTTGATCTTGTCCTTGTTGAGTTCCGCTAGGGTTTTT GTTTTTCGTTTCAGGGCTTACTCGTTGGTTCTGAACAATCAATGTCTTCGCCTC SEQ ID NO14-pcw5b-1可读框的核酸序列 ATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCCTCTACTTCTTCATCTTGTATCCTT CCGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCTCCCCCTTGT GATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGTC ACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATTC AGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACGT ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACAC AAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAG CAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG GAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGAG GAAGCTGCTGAAGCTTATGATATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTCG ACATTAGTAATTACATCGACCGTTTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGAGCAAGCCAC TCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCCAAGGAAGAAGTGAAAGAGCACGTGGA AGAAGAACATCAAGAAGCGAGGGAAGAGACAACAGAGCAGAAACAAGAAGTGGAGGCGGTCACTT GCGGCGTAGATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAA CTTCTGTATGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCA TAGAGTATCCTGAACTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTCGA GGAAGCCAAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAG AGAAAGCCCAACTTCTTTGTCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAAC AATAACAACAACAACAACAACCTCTGTTTCTTGTAACTATTCTGTCTGA SEQ ID NO15-pcw5b-1可读框的氨基酸序列 MKRPLTTCTSSSTSSSTSSSCILPNQPETPRPKRAKRAKKSSPPCDVKPQNPTSPASARRSSIYRGVTRHRW TGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPVETYTKELDEM QRGTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAEAYD MAAIEYRGANAVTNFDISNYIDRLKKKGVFPFRVEQATHQEAVLAEAKQEAKEEVKEHVEEEHQEAREE TTEQKQEVEAVTCGVDASGIMEMERSSDSNELAWNFCMMDSGFAPFLTDQNLSNENPIEYPELFNEMM GFEDNDIDFMFEEAKNECLSLENLDCCDVVVVGRESPTSLSSSPLSCFSTDSASSTTITTTTTTSVSCNYSV SEQ ID NO16-BnWRI01的核酸序列 GATTTCGTATTCCCCCAAACACACAAAATCTCATTCTCTTTTTTTCTCATAGTTTTTTTTAATGAAGAG ACCCTTAACCACTTCTCCTTCTACCTCCTCTTCTACTTCTTCTTCGGCTTGTATACTTCCGACTCAACC AGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTATTCCTACTGATGTTAAACC ACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTAGACATAGA TGGACAGGGAGATACGAGGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGAACAAGAAA GGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCGCATACGTACGATCTAGCT GCTCTCAAGTACTGGGGTCCCGACACCATCTTGAACTTTCCGGCTGAGACGTACACAAAGGAGTTGG AGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTC TAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGAAGCTAGGAT TGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACTTATAATACGCAGGAGGAAGCTGCAGC TGCATATGACATGGCGGCTATAGAGTACAGAGGCGCAAACGCAGTGACCAACTTCGACATTAGTAA CTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCATTCCCTGTGAGCCAAGCCAATCATCAAGAA GCTGTTCTTGCTGAAGCCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAAGTGAAGCA GTGTGTCGAAAAAGAAGAACCGCAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAAC AAGAAGTGGAGGAGGCGGTGGTCACTTGCTGCATTGATTCTTCGGAGAGCAATGAGCTGGCTTGGG ACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACGGATTCAAATCTCTCGAGTGAGAATCCC ATTGAGTATCCTGAGCTTTTCAATGAGATGGGGTTTGAGGATAACATTGACTTCATGTTCGAGGAAG GGAAGCAAGACTGCTTGAGCTTGGAGAATCTGGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAG AGAGCCCAACTTCATTGTCGTCTTCACCGTTGTCTTGCTTGTCTACTGACTCTGCTTCATCAACAACA ACAACAACAATAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGGGGAGAGCTTTGCATTTCTAGGT TGAATTTTCTATTTCTTTTGCTTCTTTTTTTTTTGTTGAGTTCTGCTAGGGTTTGTATTCTGTTTCAGGG CTTACTCATTGGTTCTGACAGTCAATGTTTAGCTCTCTTTTCCGCTCGTCTA SEQ ID NO17-BnWRI01可读框的核酸序列 ATGAAGAGACCCTTAACCACTTCTCCTTCTACCTCCTCTTCTACTTCTTCTTCGGCTTGTATACTTCCG ACTCAACCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTATTCCTACTGAT GTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTA GACATAGATGGACAGGGAGATACGAGGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGA ACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCGCATACGTAC GATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAACTTTCCGGCTGAGACGTACACAA AGGAGTTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCA GTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGA AGCTAGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACTTATAATACGCAGGAGGA AGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGCGCAAACGCAGTGACCAACTTCGA CATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCATTCCCTGTGAGCCAAGCCAAT CATCAAGAAGCTGTTCTTGCTGAAGCCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAA GTGAAGCAGTGTGTCGAAAAAGAAGAACCGCAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACA ACAACAACAAGAAGTGGAGGAGGCGGTGGTCACTTGCTGCATTGATTCTTCGGAGAGCAATGAGCT GGCTTGGGACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACGGATTCAAATCTCTCGAGTG AGAATCCCATTGAGTATCCTGAGCTTTTCAATGAGATGGGGTTTGAGGATAACATTGACTTCATGTT CGAGGAAGGGAAGCAAGACTGCTTGAGCTTGGAGAATCTGGATTGTTGCGATGGTGTTGTTGTGGTG GGAAGAGAGAGCCCAACTTCATTGTCGTCTTCACCGTTGTCTTGCTTGTCTACTGACTCTGCTTCATC AACAACAACAACAACAATAACCTCTGTTTCTTGTAACTATTCTGTCTGA SEQ ID NO18-BnWRI01可读框的氨基酸序列 MKRPLTTSPSTSSSTSSSACILPTQPETPRPKRAKRAKKSSIPTDVKPQNPTSPASTRRSSIYRGVTRHRWTG RYEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPAETYTKELEEMQ RCTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAYDM AAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVSQANHQEAVLAEAKQEVEAKEEPTEEVKQCVEKEEP QEAKEEKTEKKQQQQEVEEAVVTCCIDSSESNELAWDFCMMDSGFAPFLTDSNLSSENPIEYPELFNEMG FEDNIDFMFEEGKQDCLSLENLDCCDGVVVVGRESPTSLSSSPLSCLSTDSASSTTTTTITSVSCNYSV SEQ ID NO19-BnWRI08的核酸序列 AGAGTATTTGGGACACGTGGTGGAATCTTCCGGTGGTCCGGAGCTTGGTTTTCACGGTGGAGCTAAC AACGGAGGAGCTTTGTCACTTGGTGTTAACGTTAACAACTCTAATCACAGGACTAGTGATGATCATA CTCAGATCACTGAGTATCATTACCGAGGAAATAACAATGGTGAAAGAACCAACAACGAGAAGACGG TTTCTGAGAAGGAGAAGCCTGTTGTGGCTGTGGAGACATCAGATTGTTCTAACAAGAAGATCGCTGA TACGTTTGGACAAAGGACTTCCATCTACAGAGGAGTTACAAGACATAGATGGACGGGAAGATATGA AGCTCATCTATGGGATAATAGCTGTAGGCGAGAAGGTCAAGCCAGGAAAGGACGTCAAGTATACTT GGGTGGATATGACAAAGAAGACAAGGCAGCTCGAGCTTATGATTATAGCAGCTCTTAAGTACTGGA ATGCTACTGCTACCACCAATTTCCCTATTACAAACTACTCAAAAGAACTAGAGGAAATGAAGCACAT GACCAAACAAGAGTTCATTGCTTCCCTTAGGAGGAAGAGTAGCGGATTCTCTAGAGGAGCCTCAAT ATACAGAGGTGTGACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATAGGCCGTGTAGCCGG GAACAAAGATCTTTACCTAGGAACATTTGCAACGGAAGAGGAAGCAGCCGAGGCATACGACATAGC AGCGATCAAATTCAGGGGAATAAACGCTGTAACAAACTTTGAGATGAACCGTTACGACGTTGAGGC CATCATGAAGAGTGCACTTCCCATTGGTGGTGCAGCAAAACGTCTTAAGCTCTCTTTAGAAGCTGCA GAGCAGAAACCAATCCTCGGTCATCAACATCAACTCCACCACTTCCAGCAACAACAGCAGCAACAG ATTCAGTCCTCTCCGAACCACAGTAGCATTAACTTCGCTCAATCTCAGATGATTCCTGTGGGATCCCT TTTGAAGCTGCTGCTCTCTACCATCATCAACAGCAACAACAGCAGCAGCAGCAACAGAACTTCTTCC AGCATTTTCCGGCGAATGTTCGAGCTACTGACTCGACCGGTTCTAATAATAACTCCAACGTTCAAGG TTCAATGGGACTTATGGTGCCGAATCAGGCTGAGTTCTTCCTCTGGCCTAACCAGTCTTACTAGAATC AATCATGTTATGTTTTTTGTTTTTTTTTTTTTGTTTTAGTTTTTAATGGTTTTTAAGGGATAACAACTTC TTTCTAATGTTCAACTTCTTGATTCTAGCTAACCCCATAAGCTGACTANAAGGATATGAAAATCTCAC TTGTNCCGNGTTACTCNGTTTCCATTTAATGAAATGNGTTTCTGTTTANGTA SEQ ID NO20-BnWRI08可读框的核酸序列 ATGATCATACTCAGATCACTGAGTATCATTACCGAGGAAATAACAATGGTGAAAGAACCAACAACG AGAAGACGGTTTCTGAGAAGGAGAAGCCTGTTGTGGCTGTGGAGACATCAGATTGTTCTAACAAGA AGATCGCTGATACGTTTGGACAAAGGACTTCCATCTACAGAGGAGTTACAAGACATAGATGGACGG GAAGATATGAAGCTCATCTATGGGATAATAGCTGTAGGCGAGAAGGTCAAGCCAGGAAAGGACGTC AAGTATACTTGGGTGGATATGACAAAGAAGACAAGGCAGCTCGAGCTTATGATTATAGCAGCTCTT AAGTACTGGAATGCTACTGCTACCACCAATTTCCCTATTACAAACTACTCAAAAGAACTAGAGGAAA TGAAGCACATGACCAAACAAGAGTTCATTGCTTCCCTTAGGAGGAAGAGTAGCGGATTCTCTAGAG GAGCCTCAATATACAGAGGTGTGACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATAGGCC GTGTAGCCGGGAACAAAGATCTTTACCTAGGAACATTTGCAACGGAAGAGGAAGCAGCCGAGGCAT ACGACATAGCAGCGATCAAATTCAGGGGAATAAACGCTGTAACAAACTTTGAGATGAACCGTTACG ACGTTGAGGCCATCATGAAGAGTGCACTTCCCATTGGTGGTGCAGCAAAACGTCTTAAGCTCTCTTT AGAAGCTGCAGAGCAGAAACCAATCCTCGGTCATCAACATCAACTCCACCACTTCCAGCAACAACA GCAGCAACAGATTCAGTCCTCTCCGAACCACAGTAGCATTAACTTCGCTCAATCTCAGATGATTCCT GTGGGATCCCTTTTGAAGCTGCTGCTCTCTACCATCATCAACAGCAACAACAGCAGCAGCAGCAACA GAACTTCTTCCAGCATTTTCCGGCGAATGTTCGAGCTACTGACTCGACCGGTTCTAATAATAACTCCA ACGTTCAAGGTTCAATGGGACTTATGGTGCCGAATCAGGCTGAGTTCTTCCTCTGGCCTAACCAGTC TTACTAGAATCAATCATGTTATGTTTTTTGTTTTTTTTTTTTTGTTTTAG SEQ ID NO21-BnWRI08可读框的氨基酸序列 MIILRSLSIITEEITMVKEPTTRRRFLRRRSLLWLWRHQIVLTRRSLIRLDKGLPSTEELQDIDGREDMKLIY GIIAVGEKVKPGKDVKYTWVDMTKKTRQLELMIIAALKYWNATATTNFPITNYSKELEEMKHMTKQEFI ASLRRKSSGFSRGASIYRGVTRHHQQGRWQARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGINAV TNFEMNRYDVEAIMKSALPIGGAAKRLKLSLEAAEQKPILGHQHQLHHFQQQQQQQIQSSPNHSSINFAQ SQMIPVGSLLKLLLSTIINSNNSSSSNRTSSSIFRRMFELLTRPVLIITPTFKVQWDLWCRIRLSSSSGLTSLTR INHVMFFVFFFLF SEQ ID NO22-psw2的核酸序列 AAGCAGTGGTAACAACGCAGAGTACGCGGGATTCAAGTACTTCTTCTTTGTAACCAAACTAAAACCT CTTGATTTATTGTTTCATTTAATCAAATAGTAGTAATAATATCACCACCGCACCGACATGGAGTAGA AGTAGCTCTTCATTCAAAGAGTAACGCCTCTCCAGAGACTAGTACTTCATTTTGCACCATTGATATCT CAAATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCC CGAACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACT TGTACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGA GTTTCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGA CTCCTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATC TACGACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACC ACCAGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGA TTCTGCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAAC GAGTTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCT CCGAGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCC AGCGGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTAT GGGACAATAGTTGCAGAAGGGAGGGTCAAGCTAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATG ATAAGGAAGAAAAGGCCGCTAGATCTTATGATTTGGCAGCTCTGAAGTACTGGGGTCCCACTGCTAC CACCAACTTCCCTGTTTCCAATTATTCAAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAGGA ATTTATCGCATCATTGCGAAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTT ACAAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATCTT TACTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATTAAGTTC AGAGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGT TCTCTTCCAGTGGGTGGGGCAGCAAAGCGCTTGAAGCTTTCCCTTGAATCAGAGCAGAAAGCTCTTC CTGTGAGCAGCAGCAGCAGCAGCAATCAACAGCAGAATCCACAGTGTGGAAACGTGAGTGCCAGCA TCAATTTCTCATCCATTCATCAGCCAATTGCTTCTATCCCTTGTGGAATTCCCTTTGATTCAACAACA GCATATTATCATCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGCACAGCAGCGTCTGCTGT TACTTCTGCCAATGCAAATGCACTAACTGCACTGCCACCAACAGCAGCAGCTGAGTTCTTTATTTGG CCTCATCAGTCTTATTGAAAAAAGAAAAAGAAAAAAAAGAGGAGGTTTTTGAGTTGGCTAGTCTTG GTTACAGTAGGAAGCTGGATATGTAACTAACTGCTTAAGAAATGAGAAATATTTCGTGCATCATAAT TTTGCACAAGAAAAAAAAAGA SEQ ID NO23-psw2可读框的核酸序列 ATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCCCGA ACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACTTGT ACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGAGTT TCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGACTC CTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATCTAC GACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACCACC AGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGATTCT GCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAACGAG TTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCTCCG AGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCCAGC GGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTATGGG ACAATAGTTGCAGAAGGGAGGGTCAAGCTAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATGATA AGGAAGAAAAGGCCGCTAGATCTTATGATTTGGCAGCTCTGAAGTACTGGGGTCCCACTGCTACCAC CAACTTCCCTGTTTCCAATTATTCAAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAGGAATTT ATCGCATCATTGCGAAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTTACAA GGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATCTTTACT TGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATTAAGTTCAGAG GTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGTTCTCT TCCAGTGGGTGGGGCAGCAAAGCGCTTGAAGCTTTCCCTTGAATCAGAGCAGAAAGCTCTTCCTGTG AGCAGCAGCAGCAGCAGCAATCAACAGCAGAATCCACAGTGTGGAAACGTGAGTGCCAGCATCAAT TTCTCATCCATTCATCAGCCAATTGCTTCTATCCCTTGTGGAATTCCCTTTGATTCAACAACAGCATA TTATCATCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGCACAGCAGCGTCTGCTGTTACTT CTGCCAATGCAAATGCACTAACTGCACTGCCACCAACAGCAGCAGCTGAGTTCTTTATTTGGCCTCA TCAGTCTTATTGA SEQ ID NO24-psw2可读框的氨基酸序列 MARASTNWLSFSLSPMEMLRTPEPQFVQYDAASDTSSHHYYLDNLYTNGWGNGSLKFEQNLNHSDVSF VESSSQSVSHAPPKLEDFLGDSSAVMRYSDSQTETQDSSLTHIYDHHHHHHHHHHHGSSAYFGGDHQDL KAITGFQAFSTNSGSEVDDSASIGKAQGSEFGTHSIESSVNEFAAFSGGTNTGGTLSLAVAQSSEKAVAAA AESDRSKKVVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVYLGGYDKEEKAARS YDLAALKYWGPTATTNFPVSNYSKEVEEMKHVTKQEFIASLRRKSSGFSRGASIYRGVTRHHQQGRWQ ARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGANAVTNFEMNRYDVEAIMKSSLPVGGAAKRLKL SLESEQKALPVSSSSSSNQQQNPQCGNVSASINFSSIHQPIASIPCGIPFDSTTAYYHHNLFQHFHPTNAGTA ASAVTSANANALTALPPTAAAEFFIWPHQSY SEQ ID NO25-psw6的核酸序列 GATAGATTGCAGTTTCCAAAGAACCCAACTCAACTTCAAAACCCCATAATAATCTCTCTTTGACATT CATAAAAAACACACACCATGGACTCTTGTTCATCACCGCCAAACAACAACTCCCTCGCTTTCTCTCTT TCCAATCACTTTCCCAACCCTTCCTCCTCTCCCCTCTCCCTTTTCCACTCCTTCACCTATCCATCTCTCT CTCTCACAGGAAGCCACACGGCGGATGCACCTCCTGAGCCCATCGCCGGCGGAGGAGCGACCAACC TCTCCATATTCACCGGCGCCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCTCCGCAACAGCCACCGC CACCACGTGTGCACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTGTACGATTCG GAGCTGAAGACAACAATAGCCGCGTGCTTCCCTCGCGCCTTTGCCGCCGAACCAACCACCGAACCTC AGAAACCCTCTCCAAAGAAAACCGTCGACACCTTCGGCCAACGCACCTCCATCTACCGCGGCGTCAC CCGACATAGATGGACGGGAAGATACGAAGCTCATCTATGGGACAATAGTTGTAGAAGAGAAGGCCA AAGCAGGAAAGGAAGACAAGTTTACCTGGGTGGTTATGACAAGGAAGATAAGGCAGCCAGGGCTT ACGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCACCACCAACTTTCCCATTTCCAACTATGA GAAGGAACTGGAGGAGATGAAGAACATGACCAGGCAAGAGTTTGTTGCTTCTCTACGAAGGAAGAG CAGTGGTTTCTCTAGGGGGGCCTCTATATACAGAGGAGTGACGAGACACCACCAGCATGGCCGATG GCAGGCGAGAATAGGCAGAGTTGCCGGAAACAAAGACCTCTACCTTGGAACTTTCAGCACCCAAGA AGAAGCTGCTGAGGCCTATGACATTGCTGCTATCAAATTCAGGGGATTAAATGCAGTCACAAACTTT GACATGAGTCGCTACGATGTAAAGAGCATTGCAAATAGCACTCTTCCAATTGGAGGTTTATCTGGCA AGAACAAGAACTCCACAGATTCTGCATCTGAGAGCAAGAGCCACGAGGCAAGCCGATCCGACGAAC GAGATCCATCAGCGGCTTCATCCGTGACCTTTGCATCACAGCAACAGCCTTCGAGCTCCACCTTAAG CTTTGCCATACCCATTAAGCAAGACCCTTCAGATTACTGGTCCATCCTGGGGTACCATAATTCTCCCC TTGACAACACTGGCATCAGGAACACTACTAGTGTTACTGCAACTTCTTTTCCATCCTCCAACAATGGC ACTACTAGTAGTTTGACACCCTTCCACATGGAATTCTCAAATGCCCCCACAAGTACCGGCAGTGATA ACGATGCCGCGTTTTTCAGTGGAGGAGGCATCTTTGTTCAGCAACAAAGTGGTCATGGTAATGGTCA TGGAAGTGGAAGCAGTGGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATCT TTTCTCTAAATAGCAATACTAGTTATGAGAACAGTGCTGGTTATGGAAACTGGATTGGACCTACCCT GCACACATTCCAATCCCATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGAGCT CATGCACGAGGTGGGATGAGAATCTGTGCATATAATGATGAAAGGGGAAGGGCAATAGTGGTGATG GTGTTTTAGCATGCAAAAGAAGCAAGGACGAACTAGTACCTTTAGCTGATGCAGTATTTGAATGAGT TGGACTGACAGTCATAATTTCATGAGAAGCGTAGCTATACCTAGCAGCAGCTGACACTGTACTAACT CAAAGTTCCTTTGTTATGTTTTGGATGAATTTTCTTTTTTTTCTTTTTCGCCCCCTTTTTAGCTTTTTGT CCCTGTTAATATACTGACATCATTTCAAATGAGTATAATGGGAAGAAAAAAGAAAATCCTTTTGTAA TCCCCTTTCATCTCATTTTTGTTAGTATTAAAAACTTGCTATATCTATGCGAAAGGCATTCAATGCCT ATATATAGA SEQ ID NO26-psw6可读框的核酸序列 ATGGACTCTTGTTCATCACCGCCAAACAACAACTCCCTCGCTTTCTCTCTTTCCAATCACTTTCCCAA CCCTTCCTCCTCTCCCCTCTCCCTTTTCCACTCCTTCACCTATCCATCTCTCTCTCTCACAGGAAGCCA CACGGCGGATGCACCTCCTGAGCCCATCGCCGGCGGAGGAGCGACCAACCTCTCCATATTCACCGGC GCCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCTCCGCAACAGCCACCGCCACCACGTGTGCACCGC CACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTGTACGATTCGGAGCTGAAGACAACAAT AGCCGCGTGCTTCCCTCGCGCCTTTGCCGCCGAACCAACCACCGAACCTCAGAAACCCTCTCCAAAG AAAACCGTCGACACCTTCGGCCAACGCACCTCCATCTACCGCGGCGTCACCCGACATAGATGGACG GGAAGATACGAAGCTCATCTATGGGACAATAGTTGTAGAAGAGAAGGCCAAAGCAGGAAAGGAAG ACAAGTTTACCTGGGTGGTTATGACAAGGAAGATAAGGCAGCCAGGGCTTACGATCTCGCAGCTCTC AAGTACTGGGGTCCAACTACCACCACCAACTTTCCCATTTCCAACTATGAGAAGGAACTGGAGGAG ATGAAGAACATGACCAGGCAAGAGTTTGTTGCTTCTCTACGAAGGAAGAGCAGTGGTTTCTCTAGGG GGGCCTCTATATACAGAGGAGTGACGAGACACCACCAGCATGGCCGATGGCAGGCGAGAATAGGCA GAGTTGCCGGAAACAAAGACCTCTACCTTGGAACTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCT ATGACATTGCTGCTATCAAATTCAGGGGATTAAATGCAGTCACAAACTTTGACATGAGTCGCTACGA TGTAAAGAGCATTGCAAATAGCACTCTTCCAATTGGAGGTTTATCTGGCAAGAACAAGAACTCCACA GATTCTGCATCTGAGAGCAAGAGCCACGAGGCAAGCCGATCCGACGAACGAGATCCATCAGCGGCT TCATCCGTGACCTTTGCATCACAGCAACAGCCTTCGAGCTCCACCTTAAGCTTTGCCATACCCATTAA GCAAGACCCTTCAGATTACTGGTCCATCCTGGGGTACCATAATTCTCCCCTTGACAACACTGGCATC AGGAACACTACTAGTGTTACTGCAACTTCTTTTCCATCCTCCAACAATGGCACTACTAGTAGTTTGAC ACCCTTCCACATGGAATTCTCAAATGCCCCCACAAGTACCGGCAGTGATAACGATGCCGCGTTTTTC AGTGGAGGAGGCATCTTTGTTCAGCAACAAAGTGGTCATGGTAATGGTCATGGAAGTGGAAGCAGT GGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATCTTTTCTCTAAATAGCAAT ACTAGTTATGAGAACAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGCACACATTCCAATCCC ATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGA SEQ ID NO27-psw6可读框的氨基酸序列 MDSCSSPPNNNSLAFSLSNHFPNPSSSPLSLFHSFTYPSLSLTGSHTADAPPEPIAGGGATNLSIFTGAPKFE DFLGGSSATATATTCAPPQLPQFSTDNNNHLYDSELKTTIAACFPRAFAAEPTTEPQKPSPKKTVDTFGQR TSIYRGVTRHRWTGRYEAHLWDNSCRREGQSRKGRQVYLGGYDKEDKAARAYDLAALKYWGPTTTTN FPISNYEKELEEMKNMTRQEFVASLRRKSSGFSRGASIYRGVTRHHQHGRWQARIGRVAGNKDLYLGTF STQEEAAEAYDIAAIKFRGLNAVTNFDMSRYDVKSIANSTLPIGGLSGKNKNSTDSASESKSHEASRSDER DPSAASSVTFASQQQPSSSTLSFAIPIKQDPSDYWSILGYHNSPLDNTGIRNTTSVTATSFPSSNNGTTSSLT PFHMEFSNAPTSTGSDNDAAFFSGGGIFVQQQSGHGNGHGSGSSGSSSSSLSCSIPFATPIFSLNSNTSYENS AGYGNWIGPTLHTFQSHAKPSLFQTPIFGME SEQ ID NO28-GmWRI02的核酸序列 CCTCTTGATTTATTGTTTCATTTAATCAAATAGTAGTAATAATATCACCACCGCGCCGACATGGAGTA GAAGTAGCTCTTCATTCAAAGAGTAACGCCTCTCCAGAGACTAGTACTTCATTTTGCACCATTGATAT CTCAAATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACC CCCGAACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAA CTTGTACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGT GAGTTTCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGC GACTCCTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACA TCTACGACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGA CCACCAGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGAT GATTCTGCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCA ACGAGTTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAG CTCCGAGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGC CAGCGGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTA TGGGACAATAGTTGCAGAAGGGAGGGTCAAGCCAGAAAAGGGCGTCAAGTTTATTTGGGTGGATAT GATAAGGAAGAAAAGGCCGCGAGAGCTTATGATTTGGCAGCTCTAAAGTACTGGGGTCCCACTGCT ACCACCAACTTCCCTGTTTCCAATTATTCGAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAA GAATTTATTGCATCATTGCGGAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTG TTACAAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATT TATACTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATAAAGT TCAGAGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGA GTTCTCTTCCAGTGGGTGGGGCAGCAAAACGCTTGAGGCTTTCCCTTGAATCAGAGCAGAAAGCTCC TCCTGTGAACAGCAGCAGTCAGCAGCAGAATCCACAGTGTGGTAACGTGAGTGGTAGCATCAATTTC TCAGCCATTCATCAGCCAATTGCTTCAATCCCTTGTGGAATTCCGTTTGATTCAACAACAGCATATTA TCCTCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGTGCAGCAGCGTCTGCTGTTACTTCTG CCAATGCAACCGCACTAACTGCACTGCCAGCATCAGCAGCAACTGAGTTCTTTATTTGGCCTCATCA GTCTTATTGA SEQ ID NO29-GmWRI02可读框的核酸序列 ATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCCCGA ACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACTTGT ACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGAGTT TCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGACTC CTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATCTAC GACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACCACC AGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGATTCT GCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAACGAG TTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCTCCG AGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCCAGC GGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTATGGG ACAATAGTTGCAGAAGGGAGGGTCAAGCCAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATGATA AGGAAGAAAAGGCCGCGAGAGCTTATGATTTGGCAGCTCTAAAGTACTGGGGTCCCACTGCTACCA CCAACTTCCCTGTTTCCAATTATTCGAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAAGAAT TTATTGCATCATTGCGGAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTTAC AAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATTTATA CTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATAAAGTTCAG AGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGTTC TCTTCCAGTGGGTGGGGCAGCAAAACGCTTGAGGCTTTCCCTTGAATCAGAGCAGAAAGCTCCTCCT GTGAACAGCAGCAGTCAGCAGCAGAATCCACAGTGTGGTAACGTGAGTGGTAGCATCAATTTCTCA GCCATTCATCAGCCAATTGCTTCAATCCCTTGTGGAATTCCGTTTGATTCAACAACAGCATATTATCC TCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGTGCAGCAGCGTCTGCTGTTACTTCTGCCA ATGCAACCGCACTAACTGCACTGCCAGCATCAGCAGCAACTGAGTTCTTTATTTGGCCTCATCAGTC TTATTGA SEQ ID NO30-GmWRI02可读框的氨基酸序列 MARASTNWLSFSLSPMEMLRTPEPQFVQYDAASDTSSHHYYLDNLYTNGWGNGSLKFEQNLNHSD VSFVESSSQSVSHAPPKLEDFLGDSSAVMRYSDSQTETQDSSLTHIYDHHHHHHHHHHHGSSAYFG GDHQDLKAITGFQAFSTNSGSEVDDSASIGKAQGSEFGTHSIESSVNEFAAFSGGTNTGGTLSLAVA QSSEKAVAAAAESDRSKKVVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVY LGGYDKEEKAARAYDLAALKYWGPTATTNFPVSNYSKEVEEMKHVTKQEFIASLRRKSSGFSRGA SIYRGVTRHHQQGRWQARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGANAVTNFEMNRYD VEAIMKSSLPVGGAAKRLRLSLESEQKAPPVNSSSQQQNPQCGNVSGSINFSAIHQPIASIPCGIPFDST TAYYPHNLFQHFHPTNAGAAASAVTSANATALTALPASAATEFFIWPHQSY SEQ ID NO31-GmWRI03的核酸序列 CCTTGCTGTAGCTAAACAACAAAAACCAAGTCTTCATTGGTAACAAGAAGATTATTATTTTTATATG ATTTGTTTATTTATCACCCAATGATTGACTTTGCCTAGCTGCAGCTGCTACGAGAGAAGATACTGCTG GTGGTGGTGCTAGCAATAGCAAGTTTAAAGTTCAAACCTTTTTCAAGTAATTTATAAGTTGAGAAAG AAAAGAAAAAACCAAGAAAAAAAGAAGCAAAGATGAAGTCCATGAATGATAGTAACACCGTTGAT GATGGGAACAATCATAATAACTGGTTGGGATTCTCTCTCTCACCCCACATGAAAATGGATGTTGTTA CTTCTTCTACTACCACTGGTCCTCATCATCCCCACCAACACCATCATCATCATCACTACTATCATCAC CCTCACGAGGCTTCTGCTGCAGCTTGCAACAACAACAACAACACTGTTCCCACTAACTTCTATATGT CACCCTCGCACCTCAACACCTCTGGAATATGTTATGGTGTTGGAGAAAACAGTGCCTTTCACACTCC TTTGGCCATGATGCCTCTCAAGTCAGATGGGTCACTTTGCATTATGGAGGCTCTAACAAGATCACAA ACCCAAATGATGGTGCCAACTTCATCTCCAAAACTTGAGGACTTCCTAGGTGGTGCAACTATGGGGG CTCAAGACTATGGAACCCATGAGAGAGAAGCAATGGCTCTAAGCCTAGACAGTATCTACTACAGCA ACCAGAATGCTGAACCTGAAACCAACAGGGACCATTCATCTTCTCTTGACCTTCTTTCTGACCATTTC AGGCACCAAACCCATCATCACCCATATTACTCAGGACTTGGGATTTACCAAGTGGAGGAAGAAGAA ACCAAGGAACAACCACACGTTGCAGTTTGCAGCTCCCAAATGCCTCAAGTGGTTGAAGGCAGCATT GCTTGCTTCAAAAACTGGGTGCCAACAAGGGAATACTCTTCTTCTTCCACTCAGCAGAATCTGGAGC AGCATCAAGTGAATAGTAGTAGCAGTGGTGGCCTTGGAGAGGATAATAATGTAGCTTATGGGAATG TTGGTGTTGGTAGTAGTGTTGGTTGTGGTGAGTTACAGTCTTTGAGTTTGTCTATGAGTCCTGGTTCT CAATCAAGCTGTGTCACTGTTCCAACTCAGATCTCATCTTCTGGAACTGACTCAGTTGCTGTGGATGC CAAAAAGAGAGGCTCTTCTAAGCTTGGACAGAAGCAACCTGTGCATAGGAAATCCATCGACACATT TGGTCAAAGAACTTCTCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGATATGAAGCACA TTTGTGGGATAACAGTTGCAAGAAGGAAGGGCAAACAAGGAAAGGACGACAAGTGTATTTGGGTGG TTATGATATGGAAGAGAAAGCTGCAAGGGCTTATGATCTTGCGGCTCTCAAGTATTGGGGACCTTCA ACACACATAAACTTCCCGCTAGAAAATTACCAAACTCAACTTGAAGAAATGAAGAATATGAGTAGG CAGGAATACGTGGCCCACTTGAGAAGAAAGAGTAGTGGGTTTTCAAGGGGTGCCTCAATGTACAGA GGAGTGACAAGGCACCACCAACATGGCAGGTGGCAAGCAAGGATAGGCAGAGTTGCAGGAAATAA GGACCTTTATCTTGGGACATTCAGCACTCAAGAGGAAGCAGCTGAAGCATATGATGTAGCTGCAATC AAATTTCGTGGGGTGAATGCTGTCACCAACTTTGACATATCAAGATACGACGTTGAGAGAATAATGG CCAGCAACACCCTTCTAGCTGGAGAGCTAGCTAGAAGAAACAAGAACAGTGAGCCAAGAACCGAG GCCATAGAGTACAATGTTGTGTCAAGCCAACAAGTCATAAGCAACAGGGAAGAAGTTCACGAGACT GTGAACAACAACAACAATAATAATAGTGAAAATGGTTCATCATCAGATTGGAAGATGAGTTTGTAT CATCATCAGCAACAGTCAAACAACTGTGACCAGAAAACCATCAAGTGTGAAAATTATAATAGAGGT GGTGCTGCTTTCTCTGTGTCCCTACAAGATCTCATTGGGATTGACTCAGTAGGATCTAGCCAAGGCAT GATGGATGAGTCTACTAAGATAGGGACTCATTTTTCAAACCCTTCCTCGCTGGTCACCAGTTTAAGC AGCTCAAGGGAAGGTAGCCCTGATAAAATGGGCCCCACTTTGCTCATTCCAAAGCCTCCAATGGGGT CAAAGATTGTTACTAGCCCTACTGTTGCCAATGGTGTCACTGTTGGCTCTTGGTTTCCCTCTCAAATG AGGCCAGTCTCAATGTCTCACTTGCCAGTTTTTGCTGCTTGGAGTGATGCCTAG SEQ ID NO32-GmWRI03可读框的核酸序列 ATGAAGTCCATGAATGATAGTAACACCGTTGATGATGGGAACAATCATAATAACTGGTTGGGATTCT CTCTCTCACCCCACATGAAAATGGATGTTGTTACTTCTTCTACTACCACTGGTCCTCATCATCCCCAC CAACACCATCATCATCATCACTACTATCATCACCCTCACGAGGCTTCTGCTGCAGCTTGCAACAACA ACAACAACACTGTTCCCACTAACTTCTATATGTCACCCTCGCACCTCAACACCTCTGGAATATGTTAT GGTGTTGGAGAAAACAGTGCCTTTCACACTCCTTTGGCCATGATGCCTCTCAAGTCAGATGGGTCAC TTTGCATTATGGAGGCTCTAACAAGATCACAAACCCAAATGATGGTGCCAACTTCATCTCCAAAACT TGAGGACTTCCTAGGTGGTGCAACTATGGGGGCTCAAGACTATGGAACCCATGAGAGAGAAGCAAT GGCTCTAAGCCTAGACAGTATCTACTACAGCAACCAGAATGCTGAACCTGAAACCAACAGGGACCA TTCATCTTCTCTTGACCTTCTTTCTGACCATTTCAGGCACCAAACCCATCATCACCCATATTACTCAG GACTTGGGATTTACCAAGTGGAGGAAGAAGAAACCAAGGAACAACCACACGTTGCAGTTTGCAGCT CCCAAATGCCTCAAGTGGTTGAAGGCAGCATTGCTTGCTTCAAAAACTGGGTGCCAACAAGGGAAT ACTCTTCTTCTTCCACTCAGCAGAATCTGGAGCAGCATCAAGTGAATAGTAGTAGCAGTGGTGGCCT TGGAGAGGATAATAATGTAGCTTATGGGAATGTTGGTGTTGGTAGTAGTGTTGGTTGTGGTGAGTTA CAGTCTTTGAGTTTGTCTATGAGTCCTGGTTCTCAATCAAGCTGTGTCACTGTTCCAACTCAGATCTC ATCTTCTGGAACTGACTCAGTTGCTGTGGATGCCAAAAAGAGAGGCTCTTCTAAGCTTGGACAGAAG CAACCTGTGCATAGGAAATCCATCGACACATTTGGTCAAAGAACTTCTCAGTATAGAGGTGTCACAA GGCATAGATGGACTGGTAGATATGAAGCACATTTGTGGGATAACAGTTGCAAGAAGGAAGGGCAAA CAAGGAAAGGACGACAAGTGTATTTGGGTGGTTATGATATGGAAGAGAAAGCTGCAAGGGCTTATG ATCTTGCGGCTCTCAAGTATTGGGGACCTTCAACACACATAAACTTCCCGCTAGAAAATTACCAAAC TCAACTTGAAGAAATGAAGAATATGAGTAGGCAGGAATACGTGGCCCACTTGAGAAGAAAGAGTAG TGGGTTTTCAAGGGGTGCCTCAATGTACAGAGGAGTGACAAGGCACCACCAACATGGCAGGTGGCA AGCAAGGATAGGCAGAGTTGCAGGAAATAAGGACCTTTATCTTGGGACATTCAGCACTCAAGAGGA AGCAGCTGAAGCATATGATGTAGCTGCAATCAAATTTCGTGGGGTGAATGCTGTCACCAACTTTGAC ATATCAAGATACGACGTTGAGAGAATAATGGCCAGCAACACCCTTCTAGCTGGAGAGCTAGCTAGA AGAAACAAGAACAGTGAGCCAAGAACCGAGGCCATAGAGTACAATGTTGTGTCAAGCCAACAAGTC ATAAGCAACAGGGAAGAAGTTCACGAGACTGTGAACAACAACAACAATAATAATAGTGAAAATGG TTCATCATCAGATTGGAAGATGAGTTTGTATCATCATCAGCAACAGTCAAACAACTGTGACCAGAAA ACCATCAAGTGTGAAAATTATAATAGAGGTGGTGCTGCTTTCTCTGTGTCCCTACAAGATCTCATTG GGATTGACTCAGTAGGATCTAGCCAAGGCATGATGGATGAGTCTACTAAGATAGGGACTCATTTTTC AAACCCTTCCTCGCTGGTCACCAGTTTAAGCAGCTCAAGGGAAGGTAGCCCTGATAAAATGGGCCCC ACTTTGCTCATTCCAAAGCCTCCAATGGGGTCAAAGATTGTTACTAGCCCTACTGTTGCCAATGGTGT CACTGTTGGCTCTTGGTTTCCCTCTCAAATGAGGCCAGTCTCAATGTCTCACTTGCCAGTTTTTGCTG CTTGGAGTGATGCCTAG SEQ ID NO33-GmWRI03可读框的氨基酸序列 MKSMNDSNTVDDGNNHNNWLGFSLSPHMKMDVVTSSTTTGPHHPHQHHHHHHYYHHPHEASAAACN NNNNTVPTNFYMSPSHLNTSGICYGVGENSAFHTPLAMMPLKSDGSLCIMEALTRSQTQMMVPTSSPKL EDFLGGATMGAQDYGTHEREAMALSLDSIYYSNQNAEPETNRDHSSSLDLLSDHFRHQTHHHPYYSGLG IYQVEEEETKEQPHVAVCSSQMPQVVEGSIACFKNWVPTREYSSSSTQQNLEQHQVNSSSSGGLGEDNN VAYGNVGVGSSVGCGELQSLSLSMSPGSQSSCVTVPTQISSSGTDSVAVDAKKRGSSKLGQKQPVHRKSI DTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAALKY WGPSTHINFPLENYQTQLEEMKNMSRQEYVAHLRRKSSGFSRGASMYRGVTRHHQHGRWQARIGRVA GNKDLYLGTFSTQEEAAEAYDVAAIKFRGVNAVTNFDISRYDVERIMASNTLLAGELARRNKNSEPRTE AIEYNVVSSQQVISNREEVHETVNNNNNNNSENGSSSDWKMSLYHHQQQSNNCDQKTIKCENYNRGGA AFSVSLQDLIGIDSVGSSQGMMDESTKIGTHFSNPSSLVTSLSSSREGSPDKMGPTLLIPKPPMGSKIVTSPT VANGVTVGSWFPSQMRPVSMSHLPVFAAWSDA SEQ ID NO34-GmWRI05的核酸序列 ATGAAGAGTATGGAAAATGATGACAATGCTGACCTTAATAATCAAAACAATTGGTTGGGTTTCTCAC TCTCTCCTCAAATGCATAATATAGGAGTTTCTTCACACTCACAACCTTCCTCTGCTGCTGAAGTGGTT CCTACAAGCTTTTACCACCACACTGCTCCACTTAGTAGCTATGGTTTCTACTATGGACTTGAAGCTGA AAATGTTGGATTGTATTCAGCTTTGCCAATCATGCCCCTCAAATCTGATGGCTCTCTCTATGGATTGG AAACTTTAAGCAGGTCACAAGCACAAGCAATGGCTACTACTTCAACACCAAAACTGGAGAACTTCTT AGGTGGGGAAGCCATGGGGACCCCTCATCACTACGAATGTAGTGCCACAGAAACAATGCCTCTGAG CTTAGACAGTGTTTTTTACATCCAACCCTCACGCCGTGACCCAAATAATAACCAAACCTACCAAAAC CATGTTCAACACATTAGCACCAACCAACAACAACAACAGCAAGAGCTTCAAGCATATTACTCTACCT TGAGAAACCATGATATGATATTAGAAGGGTCAAAGCAAAGCCAAACTTCTGACAACAACAATCTTC ATGTTCAAAACATGGGTGGTGATGATGCCGTTCCTGTTCCTGGCCTCAAGAGTTGGGAAGTGAGGAA CTTCCAAGCTAGCCATGCACATGAGTCAAAGATGATTGTTCCTCATGTGGAGGAAAATGCTGGTGAA TCAGGGTCCATTGGATCAATGGCTTATGGTGACTTGCAATCGTTGAGCTTGTCCATGAGTCCTAGCTC TCAGTCTAGCAGTGTCACAAGTTCTCACCGTGCTTCACCTGCTGTCGTTGATTCTGTTGCCATGGATA CTAAGAAAAGGGGGCCTGAAAAGGTTGACCAGAAGCAAATTGTTCATAGGAAGTCCATTGACACCT TTGGACAAAGAACCTCCCAGTATAGAGGAGTAACAAGGCATAGGTGGACTGGGAGATATGAAGCTC ATCTTTGGGACAACAGCTGCAAGAAAGAGGGGCAAAGCAGGAAAGGAAGACAAGTTTATCTAGGG GGTTATGATATGGAAGAAAAAGCTGCGAGAGCTTATGATCTAGCGGCACTCAAGTATTGGGGACCC TCCACTCACATAAACTTTCCTTTGGAAAATTATCAAAATGAACTTGAGGAAATGAAGAACATGACTA GACAAGAGTATGTTGCTCATTTGAGAAGAAAAAGCAGCGGATTCTCAAGAGGGGCTTCCATGTACA GAGGAGTAACAAGACACCACCAACATGGAAGGTGGCAAGCTCGAATTGGTAGAGTGGCTGGAAAC AAAGATCTATATCTTGGAACCTTTAGTACACAAGAGGAAGCAGCTGAAGCCTATGATATTGCTGCTA TAAAATTCCGAGGAGCGAATGCTGTAACCAACTTTGACATCACAAGATATGATGTGGAGAAAATCA TGGCAAGCAGCAACCTCCTTAGCAGTGAGCTAGCTAGGCGCAACCGAGAGACGGACAATGAAACTC AGTGCATTGATCAAAATCACAATAAGCCTTCTGCATATGAGGACACTCAAGAAGCTATTCTAATGCA CCAGAAGAGCTGTGAGAGCGAAAATGATCAGTGGAAGATGGTTCTCTACCAATCCTCTCAGCAACTT GAGCAGAATCCACCAACAATTGAGAGTGACAGAACTAACCAGTCCTTCGCAGTGGCTTTGGACAAC ATGTTTCATCAGGAAGTAGAGGAATCAAGTAAGGCGAGGACGCATGTGTCAAATCCTTCTTCATTGG CCACAAGTTTGAGCAGCTCAAGAGAAGGTAGCCCTGATAGGACAAGCTTGCCAATGCTCTCTGGAA TGCCTTCAACTGCATCAAAACTATTGGCTACTAATCCAAATAACGTGAATTCTTGGGACCCTTCACCC CATTTGAGGCCAGCACTTACTTTGCCTCAAATGCCAGTTTTTGCAGCTTGGACAGATGCATAGTTCAT AGCTCAATAGTCCTTTTAATTTTTTGTTCTCTCAAGTGAAATTTCAATCCTTTTTTATTGTCTTTTTTTG CATGCATGAACAACACAAGAGGAAGGGGTTGTAGCTAGTCAAATGGAGGGTCTAAATATTATATCA TCACATCACTGTCAGCAAGTTTAATTTAAACTTTCAAATCATCCGACACGCAGCGGCCGCTCTAGAG GATCCAAGCTTACGTACGCGTGCATGCGACGTCATAGCTCTTCTATAGGCACC SEQ ID NO35-GmWRI05可读框的核酸序列 ATGAAGAGTATGGAAAATGATGACAATGCTGACCTTAATAATCAAAACAATTGGTTGGGTTTCT CACTCTCTCCTCAAATGCATAATATAGGAGTTTCTTCACACTCACAACCTTCCTCTGCTGCTGAA GTGGTTCCTACAAGCTTTTACCACCACACTGCTCCACTTAGTAGCTATGGTTTCTACTATGGACT TGAAGCTGAAAATGTTGGATTGTATTCAGCTTTGCCAATCATGCCCCTCAAATCTGATGGCTCTC TCTATGGATTGGAAACTTTAAGCAGGTCACAAGCACAAGCAATGGCTACTACTTCAACACCAA AACTGGAGAACTTCTTAGGTGGGGAAGCCATGGGGACCCCTCATCACTACGAATGTAGTGCCA CAGAAACAATGCCTCTGAGCTTAGACAGTGTTTTTTACATCCAACCCTCACGCCGTGACCCAAA TAATAACCAAACCTACCAAAACCATGTTCAACACATTAGCACCAACCAACAACAACAACAGCA AGAGCTTCAAGCATATTACTCTACCTTGAGAAACCATGATATGATATTAGAAGGGTCAAAGCA AAGCCAAACTTCTGACAACAACAATCTTCATGTTCAAAACATGGGTGGTGATGATGCCGTTCCT GTTCCTGGCCTCAAGAGTTGGGAAGTGAGGAACTTCCAAGCTAGCCATGCACATGAGTCAAAG ATGATTGTTCCTCATGTGGAGGAAAATGCTGGTGAATCAGGGTCCATTGGATCAATGGCTTATG GTGACTTGCAATCGTTGAGCTTGTCCATGAGTCCTAGCTCTCAGTCTAGCAGTGTCACAAGTTCT CACCGTGCTTCACCTGCTGTCGTTGATTCTGTTGCCATGGATACTAAGAAAAGGGGGCCTGAAA AGGTTGACCAGAAGCAAATTGTTCATAGGAAGTCCATTGACACCTTTGGACAAAGAACCTCCC AGTATAGAGGAGTAACAAGGCATAGGTGGACTGGGAGATATGAAGCTCATCTTTGGGACAACA GCTGCAAGAAAGAGGGGCAAAGCAGGAAAGGAAGACAAGTTTATCTAGGGGGTTATGATATG GAAGAAAAAGCTGCGAGAGCTTATGATCTAGCGGCACTCAAGTATTGGGGACCCTCCACTCAC ATAAACTTTCCTTTGGAAAATTATCAAAATGAACTTGAGGAAATGAAGAACATGACTAGACAA GAGTATGTTGCTCATTTGAGAAGAAAAAGCAGCGGATTCTCAAGAGGGGCTTCCATGTACAGA GGAGTAACAAGACACCACCAACATGGAAGGTGGCAAGCTCGAATTGGTAGAGTGGCTGGAAA CAAAGATCTATATCTTGGAACCTTTAGTACACAAGAGGAAGCAGCTGAAGCCTATGATATTGCT GCTATAAAATTCCGAGGAGCGAATGCTGTAACCAACTTTGACATCACAAGATATGATGTGGAG AAAATCATGGCAAGCAGCAACCTCCTTAGCAGTGAGCTAGCTAGGCGCAACCGAGAGACGGAC AATGAAACTCAGTGCATTGATCAAAATCACAATAAGCCTTCTGCATATGAGGACACTCAAGAA GCTATTCTAATGCACCAGAAGAGCTGTGAGAGCGAAAATGATCAGTGGAAGATGGTTCTCTAC CAATCCTCTCAGCAACTTGAGCAGAATCCACCAACAATTGAGAGTGACAGAACTAACCAGTCC TTCGCAGTGGCTTTGGACAACATGTTTCATCAGGAAGTAGAGGAATCAAGTAAGGCGAGGACG CATGTGTCAAATCCTTCTTCATTGGCCACAAGTTTGAGCAGCTCAAGAGAAGGTAGCCCTGATA GGACAAGCTTGCCAATGCTCTCTGGAATGCCTTCAACTGCATCAAAACTATTGGCTACTAATCC AAATAACGTGAATTCTTGGGACCCTTCACCCCATTTGAGGCCAGCACTTACTTTGCCTCAAATG CCAGTTTTTGCAGCTTGGACAGATGCATAG SEQ ID NO36-GmWRI05可读框的氨基酸序列 MKSMENDDNADLNNQNNWLGFSLSPQMHNIGVSSHSQPSSAAEVVPTSFYHHTAPLSSYGFYYGL EAENVGLYSALPIMPLKSDGSLYGLETLSRSQAQAMATTSTPKLENFLGGEAMGTPHHYECSATET MPLSLDSVFYIQPSRRDPNNNQTYQNHVQHISTNQQQQQQELQAYYSTLRNHDMILEGSKQSQTSD NNNLHVQNMGGDDAVPVPGLKSWEVRNFQASHAHESKMIVPHVEENAGESGSIGSMAYGDLQSL SLSMSPSSQSSSVTSSHRASPAVVDSVAMDTKKRGPEKVDQKQIVHRKSIDTFGQRTSQYRGVTRHR WTGRYEAHLWDNSCKKEGQSRKGRQVYLGGYDMEEKAARAYDLAALKYWGPSTHINFPLENYQ NELEEMKNMTRQEYVAHLRRKSSGFSRGASMYRGVTRHHQHGRWQARIGRVAGNKDLYLGTFST QEEAAEAYDIAAIKFRGANAVTNFDITRYDVEKIMASSNLLSSELARRNRETDNETQCIDQNHNKPS AYEDTQEAILMHQKSCESENDQWKMVLYQSSQQLEQNPPTIESDRTNQSFAVALDNMFHQEVEESS KARTHVSNPSSLATSLSSSREGSPDRTSLPMLSGMPSTASKLLATNPNNVNSWDPSPHLRPALTLPQ MPVFAAWTDA SEQ ID NO37-GmWRI08的核酸序列 ATGAAGCGCATAAATGAGAGTAACAACACCGATGATGGAAACAATCATAACTGGTTGGGGTTCTCT CTCTCACCCCACATGAAAATGGAGGCTACTTCAGCAGCCACTGTTCCGACAACCTTCTACATGTCCC CTTCTCAATCTCACTTGTCCAACTTCGGAATGTGTTACGGTGTCGGAGAAAATGGTAACTTCCATTCT CCACTTACGGTTATGCCTCTCAAGTCTGATGGGTCACTTTGTATCTTGGAAGCTCTCAAAAGATCACA AACGCAAGTGATGGTGCCAACTTCGTCTCCGAAATTGGAGGACTTTCTAGGTGGTGCAACTATGGGA ACTCACGAATATGGAAGCCACGAGAGAGGTTTGAGCCTAGACAGCATCTATTATAACTCCCAAAAC GCAGAGGCTCAACCCAACAGAGACCTTCTTTCACAACCCTTCAGGCAACAAGGTCATATGAGTGTCC AAACACACCCTTATTACTCAGGCCTTGCTTGCCATGGTTTATATCAAGCACCGTTGGAGGAAGAAAC AACAAAGGAAACGCACGTGTCGGATTGCAGCTCCCTAATGCCTCAAATGACAGAAGGCTTGAAAAA CTGGGTGGCTCCAACAAGGGAGTTTTCAACTCACCAGCAGGTTTTGGAGCAGCAAATGAATTGTGGC ATGGGGAATGAGAGAAATGGTGTGTCTTTAGGATCTGTGGGGTGTGGAGAGTTACAGTCTCTAAGCT TATCTATGAGTCCTGGTTCTCAGTCTAGTTGTGTCACTGCTCCTTCTGGAACAGATTCTGTTGCTGTG GATGCAAAGAAGAGAGGGCATGCTAAACTTGGTCAGAAGCAGCCTGTGCATAGAAAATCTATCGAC ACATTTGGGCAAAGAACCTCGCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGGTATGAA GCGCATTTGTGGGATAATAGTTGCAAGAAGGAAGGGCAAACTAGGAAAGGACGACAAGTGTATTTG GGGGGTTATGATATGGAGGAGAAAGCTGCAAGAGCCTATGATCTCGCGGCCCTTAAGTACTGGGGA CCTTCAACGCATATAAACTTTTCGATAGAGAATTACCAAGTTCAACTTGAGGAAATGAAGAACATGA GCAGACAGGAATACGTTGCACACTTGAGAAGAAAAAGCAGCGGGTTTTCTAGAGGTGCTTCAATAT ACAGAGGGGTCACAAGGCATCACCAACATGGAAGATGGCAAGCGAGGATAGGCAGAGTTGCTGGG AACAAAGACCTTTACCTTGGGACGTTCAGCACCCAAGAGGAAGCAGCAGAAGCATACGATGTAGCG GCGATCAAATTTCGCGGCGCAAATGCAGTCACAAACTTTGACATTTCAAGATACGATGTGGAGAGA ATCATGGCCAGTAGCAATCTCCTCGCTGGGGAGCTTGCAAGGCGTAAGAAAGATAACGATCCTAGA AACAAGGACATAGACTACAACAAGAGTGTAGTAACAAGTGTGAACAATGAGGAAACGGTTCAAGTT CAAGCAGGAAACAACAATAATGAAAACGACTCAGAGTGGAAGATGGTTTTATTTAACCACCCTTCA CAGCAGCAACAGGCAAATGGCAATGGCAGTGACCAAAAAATAATGAACTGTGGAAATTACAGAAA CAGTGCATTTTCTATGGCCCTACAAGATCTTATTGGGATTGATTCGGTGGGTTCTGGGCAGCATAATA TGCTGGACGAGTCTAGCAAAATTGGGACTCATTTTTCAAACACGTCATCGCTGGTGACAAGTTTAAG CAGCTCAAGAGAGGCTAGTCCTGAGAAAAGGGGTCCCTCGCTTCTGTTCCCAATGCCTCCAATGGAA ACAAAGATTGTGAACCCCATTGGTACCAGTGTTACCTCTTGGCTACCCTCACCAACGGTTCAAATGA GGCCTTCTCCTGCTATCTCTTTGTCTCACTTGCCAGTTTTTGCTTCTTGGACTGATACTTAAATGGAGA TAGGCACGGTCCATTTTTCATGTTATGTTATGTAACTAAAATTTACTTTTTTCCTTCATCTTTTATTTCT AATTTGATTTCCTAAGTTTAAAAGCTTTAAATAAAAAAAAAAAAAAAACCGAACCA SEQ ID NO38-GmWRI08可读框的核酸序列 ATGAAGCGCATAAATGAGAGTAACAACACCGATGATGGAAACAATCATAACTGGTTGGGGTTCTCT CTCTCACCCCACATGAAAATGGAGGCTACTTCAGCAGCCACTGTTCCGACAACCTTCTACATGTCCC CTTCTCAATCTCACTTGTCCAACTTCGGAATGTGTTACGGTGTCGGAGAAAATGGTAACTTCCATTCT CCACTTACGGTTATGCCTCTCAAGTCTGATGGGTCACTTTGTATCTTGGAAGCTCTCAAAAGATCACA AACGCAAGTGATGGTGCCAACTTCGTCTCCGAAATTGGAGGACTTTCTAGGTGGTGCAACTATGGGA ACTCACGAATATGGAAGCCACGAGAGAGGTTTGAGCCTAGACAGCATCTATTATAACTCCCAAAAC GCAGAGGCTCAACCCAACAGAGACCTTCTTTCACAACCCTTCAGGCAACAAGGTCATATGAGTGTCC AAACACACCCTTATTACTCAGGCCTTGCTTGCCATGGTTTATATCAAGCACCGTTGGAGGAAGAAAC AACAAAGGAAACGCACGTGTCGGATTGCAGCTCCCTAATGCCTCAAATGACAGAAGGCTTGAAAAA CTGGGTGGCTCCAACAAGGGAGTTTTCAACTCACCAGCAGGTTTTGGAGCAGCAAATGAATTGTGGC ATGGGGAATGAGAGAAATGGTGTGTCTTTAGGATCTGTGGGGTGTGGAGAGTTACAGTCTCTAAGCT TATCTATGAGTCCTGGTTCTCAGTCTAGTTGTGTCACTGCTCCTTCTGGAACAGATTCTGTTGCTGTG GATGCAAAGAAGAGAGGGCATGCTAAACTTGGTCAGAAGCAGCCTGTGCATAGAAAATCTATCGAC ACATTTGGGCAAAGAACCTCGCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGGTATGAA GCGCATTTGTGGGATAATAGTTGCAAGAAGGAAGGGCAAACTAGGAAAGGACGACAAGTGTATTTG GGGGGTTATGATATGGAGGAGAAAGCTGCAAGAGCCTATGATCTCGCGGCCCTTAAGTACTGGGGA CCTTCAACGCATATAAACTTTTCGATAGAGAATTACCAAGTTCAACTTGAGGAAATGAAGAACATGA GCAGACAGGAATACGTTGCACACTTGAGAAGAAAAAGCAGCGGGTTTTCTAGAGGTGCTTCAATAT ACAGAGGGGTCACAAGGCATCACCAACATGGAAGATGGCAAGCGAGGATAGGCAGAGTTGCTGGG AACAAAGACCTTTACCTTGGGACGTTCAGCACCCAAGAGGAAGCAGCAGAAGCATACGATGTAGCG GCGATCAAATTTCGCGGCGCAAATGCAGTCACAAACTTTGACATTTCAAGATACGATGTGGAGAGA ATCATGGCCAGTAGCAATCTCCTCGCTGGGGAGCTTGCAAGGCGTAAGAAAGATAACGATCCTAGA AACAAGGACATAGACTACAACAAGAGTGTAGTAACAAGTGTGAACAATGAGGAAACGGTTCAAGTT CAAGCAGGAAACAACAATAATGAAAACGACTCAGAGTGGAAGATGGTTTTATTTAACCACCCTTCA CAGCAGCAACAGGCAAATGGCAATGGCAGTGACCAAAAAATAATGAACTGTGGAAATTACAGAAA CAGTGCATTTTCTATGGCCCTACAAGATCTTATTGGGATTGATTCGGTGGGTTCTGGGCAGCATAATA TGCTGGACGAGTCTAGCAAAATTGGGACTCATTTTTCAAACACGTCATCGCTGGTGACAAGTTTAAG CAGCTCAAGAGAGGCTAGTCCTGAGAAAAGGGGTCCCTCGCTTCTGTTCCCAATGCCTCCAATGGAA ACAAAGATTGTGAACCCCATTGGTACCAGTGTTACCTCTTGGCTACCCTCACCAACGGTTCAAATGA GGCCTTCTCCTGCTATCTCTTTGTCTCACTTGCCAGTTTTTGCTTCTTGGACTGATACTTAA SEQ ID NO39-GmWRI08可读框的氨基酸序列 MKRINESNNTDDGNNHNWLGFSLSPHMKMEATSAATVPTTFYMSPSQSHLSNFGMCYGVGENGNFHSP LTVMPLKSDGSLCILEALKRSQTQVMVPTSSPKLEDFLGGATMGTHEYGSHERGLSLDSIYYNSQNAEAQ PNRDLLSQPFRQQGHMSVQTHPYYSGLACHGLYQAPLEEETTKETHVSDCSSLMPQMTEGLKNWVAPT REFSTHQQVLEQQMNCGMGNERNGVSLGSVGCGELQSLSLSMSPGSQSSCVTAPSGTDSVAVDAKKRG HAKLGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDME EKAARAYDLAALKYWGPSTHINFSIENYQVQLEEMKNMSRQEYVAHLRRKSSGFSRGASIYRGVTRHH QHGRWQARIGRVAGNKDLYLGTFSTQEEAAEAYDVAAIKFRGANAVTNFDISRYDVERIMASSNLLAGE LARRKKDNDPRNKDIDYNKSVVTSVNNEETVQVQAGNNNNENDSEWKMVLFNHPSQQQQANGNGSD QKIMNCGNYRNSAFSMALQDLIGIDSVGSGQHNMLDESSKIGTHFSNTSSLVTSLSSSREASPEKRGPSLL FPMPPMETKIVNPIGTSVTSWLPSPTVQMRPSPAISLSHLPVFASWTDT SEQ ID NO40-OsWRI01的核酸序列 GGCCTCTCCTCCTCCTCCTCACCTGCACCTGCACCAACGCGAGAGATCATGGCGAAGAGATCGTCTC CTGATCCTGCATCATCTTCTCCATCTGCATCATCCTCGCCGTCGTCTCCTTCCTCCTCTTCCTCCGAGG ATTCCTCTTCGCCCATGTCGATGCCCTGCAAGAGGAGGGCGAGGCCGAGGACGGAGAAGAGCACCG GCAAGGCCAAGAGGCCCAAGAAGGAGAGCAAGGAGGTGGCTGATCCTTCTTCCAATGGCGGCGGCG GCGGCAAGAGGAGTTCTATCTACAGGGGAGTCACCAGGCATCGGTGGACTGGCAGATTTGAGGCCC ATCTGTGGGACAAGAATTGCTCCACTTCACTTCAGAACAAGAAGAAAGGGAGGCAAGTCTATTTGG GGGCTTATGATAGTGAGGAAGCAGCTGCTCGTGCATATGACCTTGCAGCTCTTAAGTACTGGGGTCC TGAGACAGTGCTCAATTTCCCACTGGAGGAATATGAGAAGGAGAGGTCGGAGATGGAGGGCGTGTC GAGGGAGGAGTACCTGGCCTCCCTCCGCCGCCGGAGCAGCGGTTTCTCCAGGGGTGTCTCCAAGTAC AGAGGCGTTGCCAGGCATCACCACAATGGGCGGTGGGAGGCACGGATAGGGCGGGTCCTGGGGAA CAAGTACCTCTACCTGGGTACTTTCGATACTCAAGAGGAGGCAGCCAAGGCCTATGATCTTGCTGCA ATTGAATACCGAGGTGCCAATGCGGTAACCAACTTCGACATCAGCTGCTACCTGGACCAGCCACAGT TACTGGCACAGCTGCAACAGGAACCACAGTTACTGGCACAACTGCAACAAGAGCTACAGGTGGTGC CAGCATTACATGAAGAGCCTCAAGATGATGACCGAAGTGAGAATGCAGTCCAAGAGCTCAGTTCCA GTGAAGCAAATACATCAAGTGACAACAATGAGCCACTTGCAGCCGATGACAGCGCTGAATGCATGA ATGAACCCCTTCCAATTGTTGATGGCATTGAAGAAAGCCTCTGGAGCCCTTGCTTGGATTATGAATT GGATACAATGCCTGGGGCTTACTTCAGCAACTCGATGAATTTCAGTGAATGGTTCAATGATGAGGCT TTCGAAGGCGGCATGGAGTACCTATTTGAAGGGTGCTCCAGTATAACTGAAGGCGGCAACAGCATG GATAACTCAGGTGTGACAGAATACAATTTGTTTGAGGAATGCAATATGTTGGAGAAGGACATTTCAG ATTTTTTAGACAAGGACATTTCAGATTTTTTAGATAAGGACATTTCAATTTCAGATAGGGAGCGAAT ATCTCCTCAAGCAAACAATATCTCCTGCCCTCAAAAAATGATCAGTGTGTGCAACTGAATTCTCTCT GTGTGCGTGTTTCTGGGTGTTGAAAATCTTGAGATATACAGGGAAGTTTTCAGGTTTTTA SEQ ID NO41-OsWRI01可读框的核酸序列 ATGGCGAAGAGATCGTCTCCTGATCCTGCATCATCTTCTCCATCTGCATCATCCTCGCCGTCGTCTCC TTCCTCCTCTTCCTCCGAGGATTCCTCTTCGCCCATGTCGATGCCCTGCAAGAGGAGGGCGAGGCCG AGGACGGAGAAGAGCACCGGCAAGGCCAAGAGGCCCAAGAAGGAGAGCAAGGAGGTGGCTGATCC TTCTTCCAATGGCGGCGGCGGCGGCAAGAGGAGTTCTATCTACAGGGGAGTCACCAGGCATCGGTG GACTGGCAGATTTGAGGCCCATCTGTGGGACAAGAATTGCTCCACTTCACTTCAGAACAAGAAGAA AGGGAGGCAAGTCTATTTGGGGGCTTATGATAGTGAGGAAGCAGCTGCTCGTGCATATGACCTTGCA GCTCTTAAGTACTGGGGTCCTGAGACAGTGCTCAATTTCCCACTGGAGGAATATGAGAAGGAGAGG TCGGAGATGGAGGGCGTGTCGAGGGAGGAGTACCTGGCCTCCCTCCGCCGCCGGAGCAGCGGTTTC TCCAGGGGTGTCTCCAAGTACAGAGGCGTTGCCAGGCATCACCACAATGGGCGGTGGGAGGCACGG ATAGGGCGGGTCCTGGGGAACAAGTACCTCTACCTGGGTACTTTCGATACTCAAGAGGAGGCAGCC AAGGCCTATGATCTTGCTGCAATTGAATACCGAGGTGCCAATGCGGTAACCAACTTCGACATCAGCT GCTACCTGGACCAGCCACAGTTACTGGCACAGCTGCAACAGGAACCACAGTTACTGGCACAACTGC AACAAGAGCTACAGGTGGTGCCAGCATTACATGAAGAGCCTCAAGATGATGACCGAAGTGAGAATG CAGTCCAAGAGCTCAGTTCCAGTGAAGCAAATACATCAAGTGACAACAATGAGCCACTTGCAGCCG ATGACAGCGCTGAATGCATGAATGAACCCCTTCCAATTGTTGATGGCATTGAAGAAAGCCTCTGGAG CCCTTGCTTGGATTATGAATTGGATACAATGCCTGGGGCTTACTTCAGCAACTCGATGAATTTCAGTG AATGGTTCAATGATGAGGCTTTCGAAGGCGGCATGGAGTACCTATTTGAAGGGTGCTCCAGTATAAC TGAAGGCGGCAACAGCATGGATAACTCAGGTGTGACAGAATACAATTTGTTTGAGGAATGCAATAT GTTGGAGAAGGACATTTCAGATTTTTTAGACAAGGACATTTCAGATTTTTTAGATAAGGACATTTCA ATTTCAGATAGGGAGCGAATATCTCCTCAAGCAAACAATATCTCCTGCCCTCAAAAAATGATCAGTG TGTGCAACTGA SEQ ID NO42-OsWRI01可读框的氨基酸序列 MAKRSSPDPASSSPSASSSPSSPSSSSSEDSSSPMSMPCKRRARPRTEKSTGKAKRPKKESKEVADPSSNGG GGGKRSSIYRGVTRHRWTGRFEAHLWDKNCSTSLQNKKKGRQVYLGAYDSEEAAARAYDLAALKYW GPETVLNFPLEEYEKERSEMEGVSREEYLASLRRRSSGFSRGVSKYRGVARHHHNGRWEARIGRVLGNK YLYLGTFDTQEEAAKAYDLAAIEYRGANAVTNFDISCYLDQPQLLAQLQQEPQLLAQLQQELQVVPALH EEPQDDDRSENAVQELSSSEANTSSDNNEPLAADDSAECMNEPLPIVDGIEESLWSPCLDYELDTMPGAY FSNSMNFSEWFNDEAFEGGMEYLFEGCSSITEGGNSMDNSGVTEYNLFEECNMLEKDISDFLDKDISDFL DKDISISDRERISPQANNISCPQKMISVCN SEQ ID NO43-OsWRI07的核酸序列 CGAGCTCGGATCCACTAGTAACGGCCGCCAGTGTGCTGGAATTCGCCCTTAAGCAGTGGTAACAACG CAGAGTACGCGGGGAGAAAATAATAATAAGAAGAACAGATTGTATAATCTGGGGTATTTTTCTCCC CAACTTTCCTCTCTCGGTTTCCCCGAGAAATTTCTTGTTGTTTCCCGCATCACTCCCCACTGAGCCGCC TCCTTGCTCGCCGCTCGCGTTCGTCGTCGTCTCGTCGTTTCCACAATCAATTTGACGTCGCCCCTATTT ATGTCCTGCCTCGGTAGTTGATTCCTCCCCATTTCTGTTGCCTCTCGCGGTTGTGGTAATCGACGCTG TAGGATTTTTTTCTTCTTCTTCTTTTGGGTCTTCGGAGGAGGCGTCCGGATCTTTCGTCCCCATCGATC CCTTCCGGCCACGGACATTTCGTGGGTAGAGCGATTGATTGGTGGCTTAGGGTTAATATTGGGCAGG AAATGGAGAGCTCTTTGAAAGAGGAGAAGGCTGCGGGCGAATCAGGGGATGATGAGAAGGCGGAG AGGAGCTCCCCTATCAATCTGAATTCGTTGCCAGCAACTGCGGCGTGTGCGGCGACCGCCCCGGATG AGGATGGCTTGCACTCTGCAGTGGAGTCAGGAGCTAAGGATTCGAACACCACGAAGGGAGTTGAGT CTCTTGGTACTGGTCACAAGAAGATCCCGAAACGTGAGGTAGTTGATGAAGTTGATGTTCAGACCTG TGCCGAAGGAAAGAACGATTCAGTGGTCCCTTCAAGCAGCAAGAACCCTATCAATGATAAGAATGC AAAGGCAAATGTGGCAGAGAATGGACAGTCTGCTGATGGTATCCCTGAGGATCAGAGAGTTACTAT TCTTAGTGTTGTCAAGAAGGATGAGCCTGCTGATGATGTTAGAGATTCAGTTAATCCTGTAACAGTC GTAGGTTATAGAGATGAGAAGGGTGGAACTAGTGGTACTGCTGGAACTACGGCTGTGCGACCTGCA GGCACCCGGTCATCTAGTTTCCATGGTGTGACCAGGCATAGATGGAGTGGAAAATATGAAGCTCATC TGTGGGACAGTTCGTGCAGAATGGAAGGGCGGAGAAGAAAGGGAAGGCAAGTTTATTTAGGAAGTT ATGATACCGAGGAAAAAGCTGCCAGGTCATATGATGTTGCAGCTCTTAAATACTGGGGCCAAAATA CAAAGCTGAATTTCTCGGTTTCAGAATACGAAAGGGAACTGGAGGACATAAGGGACATGTCTCGAG AGGAATGCGTAACATACCTAAGAAGAAGAAGTAGCTGCTTCTCAAGAGGGGCTTCTATTTATAGAG GAGTTACTAGAAGGCAGAAAGATGGGAGGTGGCAGGCACGCATAGGACTGGTTGCTGGAACAAGA GACATTTACCTGGGAACTTTCAAAACTGAGGAAGAAGCAGCGGAGGCTTACGACATTGCTGCTATTG AGATCCGTGGCAAAAATGCGGTGACCAACTTTGATCGAAGCAACTACATGGAGAAGGGTATGCACT GTATAGAAGGGGCAGGCTTGAAGCTGCTTGCGTCTAAGCCAGAATGAAAACTTGACTTGGTGGAGC CGCATCGCATATTAGGGTTGTTTCAGTCATATTTGGAGCTTANTGGTACATACAGATACAACTGGTT GCAGCTTGTTAATATCTCTGCGTTATAATCTACAAATTACAGCTCAATTTTCGATTGACTAGCAAATT CGTCTCAGCAAGAAAGATTTTGAGCATGTATTATAGGTTGAGTAGGGTAGATCTGTACAACACCTGA GCAACTCAATATTTATGTTCTGCTCAATATAACCTATCATTCC SEQ ID NO44-OsWRI07可读框的核酸序列 ATGGAGAGCTCTTTGAAAGAGGAGAAGGCTGCGGGCGAATCAGGGGATGATGAGAAGGCGGAGAG GAGCTCCCCTATCAATCTGAATTCGTTGCCAGCAACTGCGGCGTGTGCGGCGACCGCCCCGGATGAG GATGGCTTGCACTCTGCAGTGGAGTCAGGAGCTAAGGATTCGAACACCACGAAGGGAGTTGAGTCT CTTGGTACTGGTCACAAGAAGATCCCGAAACGTGAGGTAGTTGATGAAGTTGATGTTCAGACCTGTG CCGAAGGAAAGAACGATTCAGTGGTCCCTTCAAGCAGCAAGAACCCTATCAATGATAAGAATGCAA AGGCAAATGTGGCAGAGAATGGACAGTCTGCTGATGGTATCCCTGAGGATCAGAGAGTTACTATTCT TAGTGTTGTCAAGAAGGATGAGCCTGCTGATGATGTTAGAGATTCAGTTAATCCTGTAACAGTCGTA GGTTATAGAGATGAGAAGGGTGGAACTAGTGGTACTGCTGGAACTACGGCTGTGCGACCTGCAGGC ACCCGGTCATCTAGTTTCCATGGTGTGACCAGGCATAGATGGAGTGGAAAATATGAAGCTCATCTGT GGGACAGTTCGTGCAGAATGGAAGGGCGGAGAAGAAAGGGAAGGCAAGTTTATTTAGGAAGTTAT GATACCGAGGAAAAAGCTGCCAGGTCATATGATGTTGCAGCTCTTAAATACTGGGGCCAAAATACA AAGCTGAATTTCTCGGTTTCAGAATACGAAAGGGAACTGGAGGACATAAGGGACATGTCTCGAGAG GAATGCGTAACATACCTAAGAAGAAGAAGTAGCTGCTTCTCAAGAGGGGCTTCTATTTATAGAGGA GTTACTAGAAGGCAGAAAGATGGGAGGTGGCAGGCACGCATAGGACTGGTTGCTGGAACAAGAGA CATTTACCTGGGAACTTTCAAAACTGAGGAAGAAGCAGCGGAGGCTTACGACATTGCTGCTATTGAG ATCCGTGGCAAAAATGCGGTGACCAACTTTGATCGAAGCAACTACATGGAGAAGGGTATGCACTGT ATAGAAGGGGCAGGCTTGAAGCTGCTTGCGTCTAAGCCAGAATGA SEQ ID NO45-OsWRI07可读框的氨基酸序列 MESSLKEEKAAGESGDDEKAERSSPINLNSLPATAACAATAPDEDGLHSAVESGAKDSNTTKGVESLGT GHKKIPKREVVDEVDVQTCAEGKNDSVVPSSSKNPINDKNAKANVAENGQSADGIPEDQRVTILSVVKK DEPADDVRDSVNPVTVVGYRDEKGGTSGTAGTTAVRPAGTRSSSFHGVTRHRWSGKYEAHLWDSSCR MEGRRRKGRQVYLGSYDTEEKAARSYDVAALKYWGQNTKLNFSVSEYERELEDIRDMSREECVTYLRR RSSCFSRGASIYRGVTRRQKDGRWQARIGLVAGTRDIYLGTFKTEEEAAEAYDIAAIEIRGKNAVTNFDRS NYMEKGMHCIEGAGLKLLASKPE SEQ ID NO46-OsWRI03的核酸序列 GGAGAGAGCAACGCAAGAACGGCACGAGAGGCTGGCAGCGAGCGAGCGTGTGCATGGTTGGTGCG AGCAAATGGCCAGCGGCGGCGGCAGCAGCAACTGGTTAGGCTTCTCGCTCTCCCCGCACATGCCGG CCATGGAGGTGCCGTCCTCCTCTGAGCCATCGACTGCTGCTCATCATCATCATCATCATCATCCACCT GCTGCTGCTGCTGCTGCCGGAGCCATGTCGTCTCCTCCCGACAGCGCCACGACCTGCAACTTCCTCTT CTCCCCTCCTGCAGCACAGATGGTCGCTCCTTCACCTGGCTACTACTACGTCGGCGGCGCCTACGGA GACGGGACCAGCACCGCCGGCGTCTACTACTCGCACCTCCCTGTCATGCCTATCAAGTCCGATGGCT CCCTCTGCATCATGGAAGGCATGATGCCGTCGTCATCGCCAAAGCTCGAGGACTTCTTGGGGTGTGG CAATGGCAGTGGCCATGACCCGGCCACCTACTATAGCCAGGGCCAAGAAGCAGAGGATGCAAGCAG GGCGGCCTACCAGCACCACCAGCTAGTCCCCTACAACTACCAGCCATTGACGGAAGCAGAGATGCT GCAAGAGGCCGCAGCGGCGCCAATGGAGGACGCAATGGCGGCGGCCAAGAACTTCCTCGTCACCAG CTACGGCGCCTGCTACGGCAACCAGGAGATGCCGCAGCCGCTCAGCCTCTCCATGAGCCCAGGGTCC CAGTCCAGCAGCTGCGTCAGTGCAGCTCCCCAGCAGCATCAGCAGATGGCGGTGGTCGCTGCAGCT GCTGCTGCTGGTGATGGCCAGGGAAGCAACAGTAATGACGGTGGCGAGCAGCGTGTCGGGAAGAAG AGGGGCACCGGGAAAGGGGGCCAAAAGCAGCCTGTTCACCGGAAGTCCATTGACACGTTTGGGCAG AGGACATCGCAGTATAGGGGCGTCACCAGGCACAGGTGGACTGGAAGATATGAAGCCCACCTCTGG GATAACAGTTGCAAAAAGGATGGACAGACAAGGNAAGGGAAGGCAAGTATATCTAGGTGGTTAGA CACTGAAGATAAAGCTGCGAGGGCTTATGATCTGGCTGCGCTGAAATACTGGGGGCTATCTACGCAT ATAAATTTCCCGTTAGAAAACTACCGAGATGAGATCGAGGAGATGGAAAGGATGACAAGGCAAGA ATATGTTGCGCACTTGAGAAGGAGAAGCAGCGGGTTCTCTCGCGGTGCTTCCATCTACCGGGGAGTA ACAAGGCATCACCAGCATGGAAGATGGCAAGCTCGGATTGGCAGGGTTGCTGGCAACAAGGACTTG TATCTCGGCACTTTCAGCACTCAAGAAGAAGCAGCAGAGGCATACGACATTGCTGCCATCAAGTTCC GTGGCCTGAACGCGGTGACGAACTTTGACATCACAAGGTACGACGTGGACAAGATCATGGAGAGCA GCTCGCTGCTGCCTGGTGAGGCAGCGCGTAAGGTGAAGGCGATCGAGGCAGCGCCGGACCATGTGC CAATAGGCCGCGAGCTCGGTGCGACCGAGGAAGCGAGCGCTGCTACTGTCACGGGCACCGACTGGA GAATGGTGCTCCATGGATCACAGCAGCAGCAAGCTGCAGCGTGCACCGAAGCAACGGCAGATCTTC AGAAGGGCTTCATGGGTGACGCGCACTCGGCTCTCCACGGCATTGTCGGGTTCGACGTCGAGTCGGC GGCAGCTGACGAGATCGATGTCCCGGGAGGGAAGATCAGTGGCATCAACTTCTCGAACTCGTCTTCG CTGGTGACTAGCCTGAGCAACTCGAGGGAGGGGAGCCCTGAGAGGCTTGGCCTCGCCATGCTCTAC GCCAAGCATCATCCCACCGCCGTCAGCCTCGCCGCCATGAACCCCTGGATGCCGATGCCGGCGCCGG CCGCAGCTCACGTGATGAGGCCGCCGAGTGCCATTGCTCATCTCCCTGTTTTTGCAGCCTGGACAGA TGCTTAATTAGAGCCATGTTGCTGCTTGCTCGATCTTGCTTTTGATCGGCTCTTTTTGTAAACTAAAG CAAGATCAGCAGCAATCAGGTGCTTATGGTACTTAAATTAGCTGGAAGCCTGGAGTAGCATACTTGG TTATGATGGTAAGCACTAGGCTGGTGGTGTAAGTGTTTAACCAGTAAACCCATAGGTAGGACATTCA AGCA SEQ ID NO47-OsWRI03可读框的核酸序列 ATGGCCAGCGGCGGCGGCAGCAGCAACTGGTTAGGCTTCTCGCTCTCCCCGCACATGCCGGCCATGG AGGTGCCGTCCTCCTCTGAGCCATCGACTGCTGCTCATCATCATCATCATCATCATCCACCTGCTGCT GCTGCTGCTGCCGGAGCCATGTCGTCTCCTCCCGACAGCGCCACGACCTGCAACTTCCTCTTCTCCCC TCCTGCAGCACAGATGGTCGCTCCTTCACCTGGCTACTACTACGTCGGCGGCGCCTACGGAGACGGG ACCAGCACCGCCGGCGTCTACTACTCGCACCTCCCTGTCATGCCTATCAAGTCCGATGGCTCCCTCTG CATCATGGAAGGCATGATGCCGTCGTCATCGCCAAAGCTCGAGGACTTCTTGGGGTGTGGCAATGGC AGTGGCCATGACCCGGCCACCTACTATAGCCAGGGCCAAGAAGCAGAGGATGCAAGCAGGGCGGCC TACCAGCACCACCAGCTAGTCCCCTACAACTACCAGCCATTGACGGAAGCAGAGATGCTGCAAGAG GCCGCAGCGGCGCCAATGGAGGACGCAATGGCGGCGGCCAAGAACTTCCTCGTCACCAGCTACGGC GCCTGCTACGGCAACCAGGAGATGCCGCAGCCGCTCAGCCTCTCCATGAGCCCAGGGTCCCAGTCCA GCAGCTGCGTCAGTGCAGCTCCCCAGCAGCATCAGCAGATGGCGGTGGTCGCTGCAGCTGCTGCTGC TGGTGATGGCCAGGGAAGCAACAGTAATGACGGTGGCGAGCAGCGTGTCGGGAAGAAGAGGGGCA CCGGGAAAGGGGGCCAAAAGCAGCCTGTTCACCGGAAGTCCATTGACACGTTTGGGCAGAGGACAT CGCAGTATAGGGGCGTCACCAGGCACAGGTGGACTGGAAGATATGAAGCCCACCTCTGGGATAACA GTTGCAAAAAGGATGGACAGACAAGGNAAGGGAAGGCAAGTATATCTAGGTGGTTAGACACTGAA GATAAAGCTGCGAGGGCTTATGATCTGGCTGCGCTGAAATACTGGGGGCTATCTACGCATATAAATT TCCCGTTAGAAAACTACCGAGATGAGATCGAGGAGATGGAAAGGATGACAAGGCAAGAATATGTTG CGCACTTGAGAAGGAGAAGCAGCGGGTTCTCTCGCGGTGCTTCCATCTACCGGGGAGTAACAAGGC ATCACCAGCATGGAAGATGGCAAGCTCGGATTGGCAGGGTTGCTGGCAACAAGGACTTGTATCTCG GCACTTTCAGCACTCAAGAAGAAGCAGCAGAGGCATACGACATTGCTGCCATCAAGTTCCGTGGCCT GAACGCGGTGACGAACTTTGACATCACAAGGTACGACGTGGACAAGATCATGGAGAGCAGCTCGCT GCTGCCTGGTGAGGCAGCGCGTAAGGTGAAGGCGATCGAGGCAGCGCCGGACCATGTGCCAATAGG CCGCGAGCTCGGTGCGACCGAGGAAGCGAGCGCTGCTACTGTCACGGGCACCGACTGGAGAATGGT GCTCCATGGATCACAGCAGCAGCAAGCTGCAGCGTGCACCGAAGCAACGGCAGATCTTCAGAAGGG CTTCATGGGTGACGCGCACTCGGCTCTCCACGGCATTGTCGGGTTCGACGTCGAGTCGGCGGCAGCT GACGAGATCGATGTCCCGGGAGGGAAGATCAGTGGCATCAACTTCTCGAACTCGTCTTCGCTGGTGA CTAGCCTGAGCAACTCGAGGGAGGGGAGCCCTGAGAGGCTTGGCCTCGCCATGCTCTACGCCAAGC ATCATCCCACCGCCGTCAGCCTCGCCGCCATGAACCCCTGGATGCCGATGCCGGCGCCGGCCGCAGC TCACGTGATGAGGCCGCCGAGTGCCATTGCTCATCTCCCTGTTTTTGCAGCCTGGACAGATGCTTAA SEQ ID NO48-OsWRI03可读框的氨基酸序列 MASGGGSSNWLGFSLSPHMPAMEVPSSSEPSTAAHHHHHHHPPAAAAAAGAMSSPPDSATTCNFLFSPP AAQMVAPSPGYYYVGGAYGDGTSTAGVYYSHLPVMPIKSDGSLCIMEGMMPSSSPKLEDFLGCGNGSG HDPATYYSQGQEAEDASRAAYQHHQLVPYNYQPLTEAEMLQEAAAAPMEDAMAAAKNFLVTSYGAC YGNQEMPQPLSLSMSPGSQSSSCVSAAPQQHQQMAVVAAAAAAGDGQGSNSNDGGEQRVGKKRGTGK GGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKDGQTRXGKASISRWLDTEDKAA RAYDLAALKYWGLSTHINFPLENYRDEIEEMERMTRQEYVAHLRRRSSGFSRGASIYRGVTRHHQHGR WQARIGRVAGNKDLYLGTFSTQEEAAEAYDIAAIKFRGLNAVTNFDITRYDVDKIMESSSLLPGEAARKV KAIEAAPDHVPIGRELGATEEASAATVTGTDWRMVLHGSQQQQAAACTEATADLQKGFMGDAHSALH GIVGFDVESAAADEIDVPGGKISGINFSNSSSLVTSLSNSREGSPERLGLAMLYAKHHPTAVSLAAMNPW MPMPAPAAAHVMRPPSAIAHLPVFAAWTDA SEQ ID NO49-TaWRI01的核酸序列 ATTTCGTATTAATAAAACGAGCACTATTTTATTTTTCTACTGTATTTTACTCCTGGTGTAGTGCTGCCA GAAACCGCTGCAGGTGGTAGCAGTAAAAGATCCAGCAAATATCCGATGGTTTCAGAGCGCCAGTGC GGCGGCGCCCTGTCAAGCGCGAGATAAAATCCGCCGGACCCCCGCGATTTCCCCCACTCCGCGTTTC CTCTCTCGATTTGTCCAAATCTTTTGTTCTCCTTCTCCACCGGCGATTAGTTTGTTGTTTCCGGCATCA CTCCGCACTAGGCCGCCCCTCGCCCGCGCTGGCCTCGTCGTTTCCTTCCCCAATTCCGCCGCCCCACC CCGCCCGATATTTATTTCCTGCCTCGGTATCCATTTCCGTTGATAGATTTTTCCAGCTTTCGCTGCCTC GCCGTTGCTGCTAATATCCGCGCTGGGATATTTCTTCTTTTGCTTTCTTGGCCGCGCGGCTCGGCCCG TCCCCCTGGAGGCCTCCGGATCTTTCGATCGCGGCGAGCAGGCGGCTCAAGATAGTTCGTGAATAGG AAGGCTGATAGGTAGGTTAGGGTTTTGGGAGTTGTTTTTGTCTCTGCTCCAGTACATAGATGATGAA ATCCGGGGAGGAAGTTAGTCAGGGTCAGCAAATGAACGGTTTTGTGGAGGAGAAAGCTGCTGGGGA ATCTGGGGATGGTCGGAAGATCGAGAGGAGCCCTTCCATCAATCTGAATTCCTTGCCTGCAATTGCC CCTGCCACTACGGAGATTGGTGTCTTGCACTGTGCAGTGGAGTCAGAGGCCAACGATGCAAGCACTC AGAAGGGAGATGAGTCCAGTGGCACTGATCAGAAGAAGGTCCCGAAGAATGAGGAGGTTGATGAA GGTGAAGTTCAGGCCTGTGCAGATGTGAAGAGCCACTCGGTTGACCCTTTGAATAGCGAGAACCAT GCCGGGGAGAAGGATGCTTTGGTAACTGTGCCAGAAAATGAGGGTTGTGCGGATGGTGGCGATAAT TATAAGGGAGTTCAAGTTCTCAGCATTGTCAAAAAGGACGAGTCTGAGGAAATTGTTGATTCTATTA ATCCTGTGACGGTTGCGGAGTATAGAGAGGAGAAGGGCACCGCCGGTTCTACTTCTGCAATTACTGC GGTGCGAGCACCTGGCTCCCGCTCATCTTGTTTCCATGGTGTGACCAGGCATAGGTGGAGTGGGAAA TATGAAGCTCATTTGTGGGACAGTACTTGCAGAGTAGAAGGACGGAGAAGGAAAGGAAAGCAAGTT TATTTAGGAAGTTATGATACTGAGCAAAAAGCTGCCAGGGCATATGATGTTGCAGCTCTTAAATTCT TTGGACTAAATACAAAGCTGAACTTCTCAATTTCGGAATATGAGAAGGAACTGGCGGACATACAAG ACATGTCTCCAGAGGAATGTGTGACATACTGGGAAGGGGGGAGTAGTTGCTTCTCAAGAGGGGCGT CTATTTACAGAGGAGTTACAAGGAGGCAGAAAGATGGTCGATGGCAGGCACGCATAGGACTGATTG CTGGAACTAGAGACATTTACCTTGGAACTTTCAAAACTGAGGAAGAAGCCGCAGAAGCTTATGATA TTGCTGCCATCGAGATACGCGGCAAAAATGCGGTGACCAACTTTGACAGAAGCAACTACATGGACA GGGGCATGCATTGTATAGAAGGCGCAGGGTTGAAGCTGCTTGCAACCAAGCCAGAATAGTACCTGA TTTGGCATCGTATATTGAACAGATTTGGTTGGCCGTATTTTGGAGCCTAGTGGTACATACAGATAGA AGAACTGGTCGCAGCCTGTCATTATCCGCTGCTGTATGATTCTTCAGATTATATATAGTTCTTTCAGA TAGAATTTCAGTAATTTAGCATGCTTTGTGTCCAGACAAGATTTTGACCATGCATTACTGTTATAGTG TTTGTAGGCTAGAGTTGCAGTGGAAGATGTTGCTTCATTTCACATGTCTAAATCGGAGAATACGTTTT ACTTCTAAGTTTTGATGCTTGGTTTAATGAAATATTCAAGTGTATGTTCCAAAAAAAAAAAAAAAAA AGCGGCCGC SEQ ID NO50-TaWRI01可读框的核酸序列 ATGATGAAATCCGGGGAGGAAGTTAGTCAGGGTCAGCAAATGAACGGTTTTGTGGAGGAGAAAGCT GCTGGGGAATCTGGGGATGGTCGGAAGATCGAGAGGAGCCCTTCCATCAATCTGAATTCCTTGCCTG CAATTGCCCCTGCCACTACGGAGATTGGTGTCTTGCACTGTGCAGTGGAGTCAGAGGCCAACGATGC AAGCACTCAGAAGGGAGATGAGTCCAGTGGCACTGATCAGAAGAAGGTCCCGAAGAATGAGGAGG TTGATGAAGGTGAAGTTCAGGCCTGTGCAGATGTGAAGAGCCACTCGGTTGACCCTTTGAATAGCGA GAACCATGCCGGGGAGAAGGATGCTTTGGTAACTGTGCCAGAAAATGAGGGTTGTGCGGATGGTGG CGATAATTATAAGGGAGTTCAAGTTCTCAGCATTGTCAAAAAGGACGAGTCTGAGGAAATTGTTGAT TCTATTAATCCTGTGACGGTTGCGGAGTATAGAGAGGAGAAGGGCACCGCCGGTTCTACTTCTGCAA TTACTGCGGTGCGAGCACCTGGCTCCCGCTCATCTTGTTTCCATGGTGTGACCAGGCATAGGTGGAG TGGGAAATATGAAGCTCATTTGTGGGACAGTACTTGCAGAGTAGAAGGACGGAGAAGGAAAGGAA AGCAAGTTTATTTAGGAAGTTATGATACTGAGCAAAAAGCTGCCAGGGCATATGATGTTGCAGCTCT TAAATTCTTTGGACTAAATACAAAGCTGAACTTCTCAATTTCGGAATATGAGAAGGAACTGGCGGAC ATACAAGACATGTCTCCAGAGGAATGTGTGACATACTTGAGAAGGAGGAGTAGTTGCTTCTCAAGA GGGGCGTCTATTTACAGAGGAGTTACAAGGAGGCAGAAAGATGGTCGATGGCAGGCACGCATAGGA CTGATTGCTGGAACTAGAGACATTTACCTTGGAACTTTCAAAACTGAGGAAGAAGCCGCAGAAGCTT ATGATATTGCTGCCATCGAGATACGCGGCAAAAATGCGGTGACCAACTTTGACAGAAGCAACTACA TGGACAGGGGCATGCATTGTATAGAAGGCGCAGGGTTGAAGCTGCTTGCAACCAAGCCAGAATAG SEQ ID NO51-TaWRI01可读框的氨基酸序列 MMKSGEEVSQGQQMNGFVEEKAAGESGDGRKIERSPSINLNSLPAIAPATTEIGVLHCAVESEANDASTQ KGDESSGTDQKKVPKNEEVDEGEVQACADVKSHSVDPLNSENHAGEKDALVTVPENEGCADGGDNYK GVQVLSIVKKDESEEIVDSINPVTVAEYREEKGTAGSTSAITAVRAPGSRSSCFHGVTRHRWSGKYEAHL WDSTCRVEGRRRKGKQVYLGSYDTEQKAARAYDVAALKFFGLNTKLNFSISEYEKELADIQDMSPEECV TYLRRRSSCFSRGASIYRGVTRRQKDGRWQARIGLIAGTRDIYLGTFKTEEEAAEAYDIAAIEIRGKNAVT NFDRSNYMDRGMHCIEGAGLKLLATKPE SEQ ID NO52-GmWRI01-1的核酸序列 GCCCTTAAGCAGTGGTAACAACGCAGAGTACGCGGGGATTCATTTTCATTCAACCCTTCTCTCT CTCTCTCTCAGATAGATTCTATAAGATCGCAGTTTCCAAAGAAGCTAACTGAAGTTCAAACCCC CATAACCTCTCTTTCACGTTCCTCAACGACACATAAAACACACACCATGGACTCTTCTTCTTCAT CACCGCCAAACAGCACCAACAACAACTCCCTCGCTTTCTCTCTTTCCAATCACTTTCCCAACCCT TCTTCCTCTCCCCTTTCTCTCTTCCACTCCTTCACCTATCCATCTCTCTCTCTCACAGGCAGCAAC ACGGTGGACGCACCGCCTGAGCCCACCGCTGGAGCAGGACCGACCAACCTCTCCATATTCACC GGCGGCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCGCCGCAACAGCCACCACCGTCGCGTGTG CACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTATACGATTCGGAGCTGAA GTCAACAATAGCCGCGTGCTTCCCTCGCGCCTTGGCCGCCGAACAAAGCACCGAACCGCAAAA ACCATCCCCCAAGAAAACCGTCGACACCTTCGGGCAACGCACCTCCATCTACCGCGGCGTGACC CGACATAGATGGACTGGGAGATACGAAGCTCATCTATGGGACAATAGTTGCAGAAGGGAAGGT CAAAGCAGGAAAGGAAGGCAAGTTTACTTGGGTGGTTATGACAAGGAGGATAAGGCAGCCAG AGCTTATGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCACCACTAACTTTCCTATTTCCA ACTATGAGAAGGAACTGGAGGAGATGAAGAACATGACTAGGCAAGAGTTTGTTGCTTCTCTTC GTAGGAAGAGCAGTGGTTTCTCTAGAGGGGCCTCTATATACAGAGGAGTAACGAGACACCACC AGCATGGCCGATGGCAGGCGAGAATAGGCAGAGTTGCCGGAAACAAAGACCTCTACCTTGGCA CTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCTATGACATTGCTGCTATCAAATTCAGGGGATT AAATGCAGTAACAAACTTTGACATGAGTCGCTACGACGTGAAGAGCATTGCAAATAGTACTCTT CCTATTGGTGGTTTATCTGGCAAGAACAAGAACTCCACAGATTCTGCATCTGAGAGCAAAAGCC ATGAGCCAAGCCAATCCGATGGAGATCCATCATCGGCTTCATCGGTGACCTTTGCATCACAGCA ACAACCTTCAAGCTCCAACTTAAGCTTTGCCATACCCATTAAGCAAGACCCTTCAGATTACTGG TCCATCTTGGGGTACCATAATACTCCCCTTGACAACAGTGGCATCAGGAACACTACTAGTACTG TTACTACAACTACTTTTCCATCCTCCAACAATGGCACTGCTAGTAGTTTGACACCCTTCAACATG GAGTTCTCAAGTGCCCCCTCAAGTACCGGCAGCGATAACAATGCCGCGTTTTTCAGTGGAGGAG GCATCTTTGTTCAGCAACAAACTAGTCATGGTCATGGAAATGCAAGCAGTGGTTCCTCCTCTTC TTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATATTTTCTCTAAATAGCAATACTAGTTATG AGAGCAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGCACACATTCCAATCCCATGCAAA ACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGAGCTCATGCACGAGCTGGGATGAG AATCTGTGCATATAATGATGAAAGGGGAAGAAGGACAATAGTGGTGATGGTGTTTTAGCATGC AAAGAAGCAAAGGACGGACTAGTCCCTTTAGCTGATGCAGTATTTGAATGAGTTGGACTGACA GTCATAATTTCATGAGAATCGTAGCTATACCTAGCAGCTGACACTGTACTAACTCAAACTTCCT TTGTTATGTTTTGAATGAATTTTCCTTTTTCTTTTTCGCCCCTTTATTAGCTTTTTGGTCCTGTTAA TATACTGACATTATATCAAATGAGGATAATGGGAAGAAAAAAAAAATCCTTTTGTT SEQ ID NO53-GmWRI01-1可读框的核酸序列 ATGGACTCTTCTTCTTCATCACCGCCAAACAGCACCAACAACAACTCCCTCGCTTTCTCTCTTTC CAATCACTTTCCCAACCCTTCTTCCTCTCCCCTTTCTCTCTTCCACTCCTTCACCTATCCATCTCTC TCTCTCACAGGCAGCAACACGGTGGACGCACCGCCTGAGCCCACCGCTGGAGCAGGACCGACC AACCTCTCCATATTCACCGGCGGCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCGCCGCAACAG CCACCACCGTCGCGTGTGCACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCT ATACGATTCGGAGCTGAAGTCAACAATAGCCGCGTGCTTCCCTCGCGCCTTGGCCGCCGAACAA AGCACCGAACCGCAAAAACCATCCCCCAAGAAAACCGTCGACACCTTCGGGCAACGCACCTCC ATCTACCGCGGCGTGACCCGACATAGATGGACTGGGAGATACGAAGCTCATCTATGGGACAAT AGTTGCAGAAGGGAAGGTCAAAGCAGGAAAGGAAGGCAAGTTTACTTGGGTGGTTATGACAA GGAGGATAAGGCAGCCAGAGCTTATGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCAC CACTAACTTTCCTATTTCCAACTATGAGAAGGAACTGGAGGAGATGAAGAACATGACTAGGCA AGAGTTTGTTGCTTCTCTTCGTAGGAAGAGCAGTGGTTTCTCTAGAGGGGCCTCTATATACAGA GGAGTAACGAGACACCACCAGCATGGCCGATGGCAGGCGAGAATAGGCAGAGTTGCCGGAAA CAAAGACCTCTACCTTGGCACTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCTATGACATTGCT GCTATCAAATTCAGGGGATTAAATGCAGTAACAAACTTTGACATGAGTCGCTACGACGTGAAG AGCATTGCAAATAGTACTCTTCCTATTGGTGGTTTATCTGGCAAGAACAAGAACTCCACAGATT CTGCATCTGAGAGCAAAAGCCATGAGCCAAGCCAATCCGATGGAGATCCATCATCGGCTTCAT CGGTGACCTTTGCATCACAGCAACAACCTTCAAGCTCCAACTTAAGCTTTGCCATACCCATTAA GCAAGACCCTTCAGATTACTGGTCCATCTTGGGGTACCATAATACTCCCCTTGACAACAGTGGC ATCAGGAACACTACTAGTACTGTTACTACAACTACTTTTCCATCCTCCAACAATGGCACTGCTA GTAGTTTGACACCCTTCAACATGGAGTTCTCAAGTGCCCCCTCAAGTACCGGCAGCGATAACAA TGCCGCGTTTTTCAGTGGAGGAGGCATCTTTGTTCAGCAACAAACTAGTCATGGTCATGGAAAT GCAAGCAGTGGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATATTTTCT CTAAATAGCAATACTAGTTATGAGAGCAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGC ACACATTCCAATCCCATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGA SEQ ID NO54-GmWRI01-1可读框的氨基酸序列 MDSSSSSPPNSTNNNSLAFSLSNHFPNPSSSPLSLFHSFTYPSLSLTGSNTVDAPPEPTAGAGPTNLSIF TGGPKFEDFLGGSAATATTVACAPPQLPQFSTDNNNHLYDSELKSTIAACFPRALAAEQSTEPQKPSP KKTVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQSRKGRQVYLGGYDKEDKAARAYDL AALKYWGPTTTTNFPISNYEKELEEMKNMTRQEFVASLRRKSSGFSRGASIYRGVTRHHQHGRWQ ARIGRVAGNKDLYLGTFSTQEEAAEAYDIAAIKFRGLNAVTNFDMSRYDVKSIANSTLPIGGLSGKN KNSTDSASESKSHEPSQSDGDPSSASSVTFASQQQPSSSNLSFAIPIKQDPSDYWSILGYHNTPLDNSG IRNTTSTVTTTTFPSSNNGTASSLTPFNMEFSSAPSSTGSDNNAAFFSGGGIFVQQQTSHGHGNASSGS SSSSLSCSIPFATPIFSLNSNTSYESSAGYGNWIGPTLHTFQSHAKPSLFQTPIFGME SEQ ID NO55-GmWri11的核酸序列 GGGCTGTTTCCGTCGATGAGACCACAACTCGACTGTGTAACAGGGTAATCAAAATAGATAAAA TAAAAAATATACTTCCTTTGACCGGTGACCGTGCGAACCGGTTCGAAGTTGGAACCATGAGAG AGATAATGTTTATATATTCCATCATCTGTTCCGTTTGGATCCTCTCACCTCTCTCTCTCTCTCTCT CTCTGGTGCCATGGAATCCGGTAGTGCCCGATGTTTATATTCTCTCTGGTTCTGAAATCATCGCC GAGGAAATAACAAATGCAGCCTCCAAACCTCGCGAAGCTTCCTTCACACACTTCCTTCTATTCC TTGTTCGTCGAACAAGCTCTTTAACATTCCATCACCACAACTTCCTACCTACACCTTCCGATATT GCATCTTCAACTGTTTGGTTACATTTCACACGTAATAATTATTGTTTCTTTCGATTGGATCGGTC GGAACCATCGCTCGAAGAGAATCTCCGGAGACGTAGAAGCAATATCAGTTTACTGTATGTATTG GTTCGGATTAATAATAATAACGAAAAAATAGAAAGAAAATCAGAGTTGAAAATAGCCAGAAG AAGATTAAGCGCGATGTTGGATCTTAATCTGAATGCCGAGTCGACTCAGAACAACGAGTCGCT GGTGCTGTTGGACAAGTTTCCCGAAGCTTCGTTGGGAACTTCGAATTCCTCCGTCGTGAATGCG GAGGGATCGAGCAACGAGGACTCGTGCTCCACACGCGCCGGCGACGTGTTCGCCTTCAGTTTCG GAATCCTTAAGGTGGAAGGCGCGAACGAAGTCGTCGCCACGGCGACGAAGGAGCTGTTTCCGG TGAGCTCGGAGAATTGGCAGGGGCAGAGTTCGACGTCGTCGTCTCAGGCGAGGAAGAATTTAA TGGATCTCCCGCTGGATCATCAAAACGGTGAGGTGAAGGTGGTTCAGGTTCAGCCACAGCCTCA GGTGAAGAAGAGTAGGAGAGGTCCAAGGTCTCGGAGCTCTCAGTACAGAGGAGTCACTTTCTA CAGAAGGACCGGAAGATGGGAATCGCATATCTGGGATTGCGGGAAGCAAGTCTATTTGGGTGG ATTTGACACCGCTCATATTGCTGCTAGGGCCTATGATCGAACTGCTATTAAGTTCAGGGGACTT GATGCTGATATCAATTTTGATCTCGTTGATTATGAGGAGGATCTAAAACAGATGAAGAATCTTT CAAGCAGGAGTTCGTGCACATACTTCGCCGCCACAGTACCGGTTCTCANGGGCAGTTCGAAATA CCNGGGATACACTTCACAAGTGGCCTTGGGAACTCGATGGGNATTCCTGGCAGAAGCTATACA GGCACTTCAGTGCATAAANAAGNTGTCCTACTTNACCATTNTTGNACGNAGAACNGAGCTTCAT CCTGGANAGGTAGCAGGCGTTTCANGCAAGAGNAGGTNCCCTATTGAGCCAGAATNGGGAGGA GAGAACCGGAGTNTNAAGAAGNGGCNTCCGGCCTGGNCTCAATTGGGCNAGCAACCCNAGAC ATGTCCCAAAGAAAATAGGGNCNTTTTCAGTTCCAGTCCATCCNTTACAACATGCATCCGGGAA GAAGTTCAAGNATGGAGACTAATGTTAATTCGGTTATTGGTGATCCTTCTTNGAAAAGGCTGGT TGTACGAAGAGCGTCCTTCTGTATATTCCACTTTCTTTCCCAATCTGGAAAGAGCAGAGAGAAT GGGCATAGATCCTTCAAAAGGAGTTCCAAACTGGGCGTGGCAGACAAATGGCCAGGTTAATGC CACCCCAGTACCACCGTTCTCTACTGCAGCATCATCAGGATTCTCAATTTCAGCTACTTTTCCAT CAACTGCCATCTTTCCAACAAAATCCATGAACCCAATTCCCCAGAGCTTCTGTTTCACTTCACAC AGCACACCAGGTAGCAATGCACCTCAATTCTATTACGAGGTCAAGTCCTCGCAGGCACCATCCC AGCCTCTATCTTGTAATACAAGTATAAATGGTAGCCCACCACACAAGTTCTGAAGTTCAATTCT CAAAACGACAGTTAAAACTTTTTTTTTTTTTTTTCCTGTTTGCATGATTTAGGGATCGGTACAAT GTTGTTGCTCATGGTATGTTTGTATGTGATGAAAAGATTTTTTTCTTCAGAGAGAAAGTGAAAA GAAAAAATGCATGATGTGTTTTA SEQ ID NO56-GmWRI11可读框的核酸序列 ATGAGAGAGATAATGTTTATATATTCCATCATCTGTTCCGTTTGGATCCTCTCACCTCTCTCTCT CTCTCTCTCTCTGGTGCCATGGAATCCGGTAGTGCCCGATGTTTATATTCTCTCTGGTTCTGAAA TCATCGCCGAGGAAATAACAAATGCAGCCTCCAAACCTCGCGAAGCTTCCTTCACACACTTCCT TCTATTCCTTGTTCGTCGAACAAGCTCTTTAACATTCCATCACCACAACTTCCTACCTACACCTT CCGATATTGCATCTTCAACTGTTTGGTTACATTTCACACGTAATAATTATTGTTTCTTTCGATTGG ATCGGTCGGAACCATCGCTCGAAGAGAATCTCCGGAGACGTAGAAGCAATATCAGTTTACTGT ATGTATTGGTTCGGATTAATAATAATAACGAAAAAATAGAAAGAAAATCAGAGTTGAAAATAG CCAGAAGAAGATTAAGCGCGATGTTGGATCTTAATCTGAATGCCGAGTCGACTCAGAACAACG AGTCGCTGGTGCTGTTGGACAAGTTTCCCGAAGCTTCGTTGGGAACTTCGAATTCCTCCGTCGT GAATGCGGAGGGATCGAGCAACGAGGACTCGTGCTCCACACGCGCCGGCGACGTGTTCGCCTT CAGTTTCGGAATCCTTAAGGTGGAAGGCGCGAACGAAGTCGTCGCCACGGCGACGAAGGAGCT GTTTCCGGTGAGCTCGGAGAATTGGCAGGGGCAGAGTTCGACGTCGTCGTCTCAGGCGAGGAA GAATTTAATGGATCTCCCGCTGGATCATCAAAACGGTGAGGTGAAGGTGGTTCAGGTTCAGCCA CAGCCTCAGGTGAAGAAGAGTAGGAGAGGTCCAAGGTCTCGGAGCTCTCAGTACAGAGGAGTC ACTTTCTACAGAAGGACCGGAAGATGGGAATCGCATATCTGGGATTGCGGGAAGCAAGTCTAT TTGGGTGGATTTGACACCGCTCATATTGCTGCTAGGGCCTATGATCGAACTGCTATTAAGTTCA GGGGACTTGATGCTGATATCAATTTTGATCTCGTTGATTATGAGGAGGATCTAAAACAGATGAA GAATCTTTCAAGCAGGAGTTCGTGCACATACTTCGCCGCCACAGTACCGGTTCTCANGGGCAGT TCGAAATACCNGGGATACACTTCACAAGTGGCCTTGGGAACTCGATGGGNATTCCTGGCAGAA GCTATACAGGCACTTCAGTGCATAAANAAGNTGTCCTACTTNACCATTNTTGNACGNAGAACN GAGCTTCATCCTGGANAGGTAGCAGGCGTTTCANGCAAGAGNAGGTNCCCTATTGAGCCAGAA TNGGGAGGAGAGAACCGGAGTNTNAAGAAGNGGCNTCCGGCCTGGNCTCAATTGGGCNAGCA ACCCNAGACATGTCCCAAAGAAAATAGGGNCNTTTTCAGTTCCAGTCCATCCNTTACAACATGC ATCCGGGAAGAAGTTCAAGNATGGAGACTAATGTTAATTCGGTTATTGGTGATCCTTCTTNGAA AAGGCTGGTTGTACGAAGAGCGTCCTTCTGTATATTCCACTTTCTTTCCCAATCTGGAAAGAGC AGAGAGAATGGGCATAGATCCTTCAAAAGGAGTTCCAAACTGGGCGTGGCAGACAAATGGCCA GGTTAATGCCACCCCAGTACCACCGTTCTCTACTGCAGCATCATCAGGATTCTCAATTTCAGCTA CTTTTCCATCAACTGCCATCTTTCCAACAAAATCCATGAACCCAATTCCCCAGAGCTTCTGTTTC ACTTCACACAGCACACCAGGTAGCAATGCACCTCAATTCTATTACGAGGTCAAGTCCTCGCAGG CACCATCCCAGCCTCTATCTTGTAATACAAGTATAAATGGTAGCCCACCACACAAGTTCTGA SEQ ID NO57-GmWRI11可读框的氨基酸序列 MREIMFIYSIICSVWILSPLSLSLSLVPWNPVVPDVYILSGSEIIAEEITNAASKPREASFTHFLLFLVRR TSSLTFHHHNFLPTPSDIASSTVWLHFTRNNYCFFRLDRSEPSLEENLRRRRSNISLLYVLVRINNNNE KIERKSELKIARRRLSAMLDLNLNAESTQNNESLVLLDKFPEASLGTSNSSVVNAEGSSNEDSCSTRA GDVFAFSFGILKVEGANEVVATATKELFPVSSENWQGQSSTSSSQARKNLMDLPLDHQNGEVKVV QVQPQPQVKKSRRGPRSRSSQYRGVTFYRRTGRWESHIWDCGKQVYLGGFDTAHIAARAYDRTAI KFRGLDADINFDLVDYEEDLKQMKNLSSRSSCTYFAATVPVLXGSSKYXGYTSQVALGTRWXFLA EAIQALQCIXKXSYXTIXXRRTELHPGXVAGVSXKXRXPIEPEXGGENRSXKKXXPAWXQLGXQPX TCPKENRXXFSSSPSXTTCIREEVQXWRLMLIRLLVILLXKGWLYEERPSVYSTFFPNLERAERMGID PSKGVPNWAWQTNGQVNATPVPPFSTAASSGFSISATFPSTAIFPTKSMNPIPQSFCFTSHSTPGSNAP QFYYEVKSSQAPSQPLSCNTSINGSPPHKF SEQ ID NO58-PtxA启动子的核酸序列 CGCAATTTTTTGTGAAGCTGAGGGAGGATTGGATTTTACACCTATTCAAAAGTCATTCAAAGTTTGTCCCTCCATT CAAGGATGAATGTAGATTTTTCAAGCATCAAACACAAGAATCACTAGCATAACATGCTTTGAAACCCACACACTTAAA TTAATGTTAGGAATATCAAATCCAATATAAAATCATAGTTGTCAATTACATACTCAATCAAGTCCCTTTCTTTTACCCA ATAAACATCAACATATTGCTTCTTCCATTAAGCATATAAACATCAAAGTCTAAAACTAGCAAAATGTTGTTTTTAGGAT GACACATTTCATACATAGTTTAAAAGATACTTGATTCGATTACAAAAAGAAATTACCAATAGTTTAGCACAAAGTCTA AAGCATAATTAAAGCATCACATGTGCAGATTTATGAAAAAAAGATTAAGATTGCCCCTTTCATCACGGGTCGAATAAT AGCACTACTTGTCACTACATGTTAAAAAAATGTCCTCTAGTACATCAAACTTTTTCCATTGATTCCCCTTATCCATGAA AAAAATAAACAAATTCTTAAGACACAAAAAAATGGCCCCACATCCTTTTTTCTGGCCTAGTTTGTTTGAATTCATTCTA ACTCTTGAATATGTAACGAGGCCCACTAAAAATCAATCAATGATTTAACATAAAAAATGAATAGTTTAATTCCAATTT GCTGCAACATGGTCCGTGAATATGACTCACGAGAAAGATATATCAAAATATCAAAATTTCATAGTTTTTTTCACCATAT AAACCTCATCACTCATTCTATTTTTTTAAGTGCAAAGCTTCATAGTTA
序列表
<110>巴斯福植物科学有限公司
<120>编码WRINKLED1样多肽的核酸分子及在植物中的使用方法
<130>16313-0369
<140>PCT/US05/021500
<141>2004-06-16
<150>60/580,334
<151>2004-06-16
<150>60/600,466
<151>2004-11-08
<160>58
<170>PatentIn版本3.3
<210>1
<211>1577
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
<210>2
<211>1293
<212>DNA
<213>拟南芥
<400>2
<210>3
<211>430
<212>PRT
<213>拟南芥
<400>3
<210>4
<211>1509
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>4
<210>5
<211>1284
<212>DNA
<213>欧洲油菜
<400>5
<210>6
<211>427
<212>PRT
<213>欧洲油菜
<400>6
<210>7
<211>1392
<212>DNA
<213>欧洲油菜
<400>7
<210>8
<211>1242
<212>DNA
<213>欧洲油菜
<400>8
<210>9
<211>413
<212>PRT
<213>欧洲油菜
<400>9
<210>10
<211>1375
<212>DNA
<213>欧洲油菜
<400>10
<210>11
<211>1233
<212>DNA
<213>欧洲油菜
<400>11
<210>12
<211>410
<212>PRT
<213>欧洲油菜
<400>12
<210>13
<211>1392
<212>DNA
<213>欧洲油菜
<400>13
<210>14
<211>1251
<212>DNA
<213>欧洲油菜
<400>14
<210>15
<211>416
<212>PRT
<213>欧洲油菜
<400>15
<210>16
<211>1457
<212>DNA
<213>欧洲油菜
<400>16
<210>17
<211>1248
<212>DNA
<213>欧洲油菜
<400>17
<210>18
<211>415
<212>PRT
<213>欧洲油菜
<400>18
<210>19
<211>1389
<212>DNA
<213>欧洲油菜
<220>
<221>modified_base
<222>(1318)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1342)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1346)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1354)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1374)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1386)
<223>a，c，g，t，未知的或其他
<400>19
<210>20
<211>1113
<212>DNA
<213>欧洲油菜
<400>20
<210>21
<211>370
<212>PRT
<213>欧洲油菜
<400>21
<210>22
<211>1892
<212>DNA
<213>大豆(Glycine max)
<400>22
<210>23
<211>1551
<212>DNA
<213>大豆
<400>23
<210>24
<211>516
<212>PRT
<213>大豆
<400>24
<210>25
<211>2088
<212>DNA
<213>大豆
<400>25
<210>26
<211>1587
<212>DNA
<213>大豆
<400>26
<210>27
<211>528
<212>PRT
<213>大豆
<400>27
<210>28
<211>1683
<212>DNA
<213>大豆
<400>28
<210>29
<211>1542
<212>DNA
<213>大豆
<400>29
<210>30
<211>513
<212>PRT
<213>大豆
<400>30
<210>31
<211>2388
<212>DNA
<213>大豆
<400>31
<210>32
<211>2154
<212>DNA
<213>大豆
<400>32
<210>33
<211>717
<212>PRT
<213>大豆
<400>33
<210>34
<211>2259
<212>DNA
<213>大豆
<400>34
<210>35
<211>1998
<212>DNA
<213>大豆
<400>35
<210>36
<211>665
<212>PRT
<213>大豆
<400>36
<210>37
<211>2125
<212>DNA
<213>大豆
<400>37
<210>38
<211>1992
<212>DNA
<213>大豆
<400>38
<210>39
<211>663
<212>PRT
<213>大豆
<400>39
<210>40
<211>1458
<212>DNA
<213>稻(Oryza sativa)
<400>40
<210>41
<211>1341
<212>DNA
<213>稻
<400>41
<210>42
<211>446
<212>PRT
<213>稻
<400>42
<210>43
<211>1845
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(1643)
<223>a，c，g，t，未知的或其他
<400>43
<210>44
<211>1104
<212>DNA
<213>稻
<400>44
<210>45
<211>367
<212>PRT
<213>稻
<400>45
<210>46
<211>2198
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(1031)
<223>a，c，g，t，未知的或其他
<400>46
<210>47
<211>1929
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(961)
<223>a，c，g，t，未知的或其他
<400>47
<210>48
<211>642
<212>PRT
<213>稻
<220>
<221>MOD_RES
<222>(321)
<223>可变氨基酸
<400>48
<210>49
<211>2084
<212>DNA
<213>普通小麦(Triticum aestivum)
<400>49
<210>50
<211>1128
<212>DNA
<213>普通小麦
<400>50
<210>51
<211>375
<212>PRT
<213>普通小麦
<400>51
<210>52
<211>2103
<212>DNA
<213>大豆
<400>52
<210>53
<211>1593
<212>DNA
<213>大豆
<400>53
<210>54
<211>530
<212>PRT
<213>大豆
<400>54
<210>55
<211>2193
<212>DNA
<213>大豆
<220>
<221>modified_base
<222>(1261)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1279)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1318)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1358)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1362)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1373)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1380)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1384)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1388)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1394)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1410)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1428)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1436)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1441)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1459)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1479)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1481)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1488)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1492)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1503)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1515)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1524)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1549)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1551)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1572)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1603)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1644)
<223>a，c，g，t，未知的或其他
<400>55
<210>56
<211>1911
<212>DNA
<213>大豆
<220>
<221>modified_base
<222>(1142)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1160)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1199)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1239)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1243)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1254)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1261)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1265)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1269)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1275)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1291)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1309)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1317)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1322)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1340)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1360)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1362)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1369)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1373)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1384)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1396)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1405)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1430)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1432)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1453)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1484)
<223>a，c，g，t，未知的或其他
<220>
<221>modified_base
<222>(1525)
<223>a，c，g，t，未知的或其他
<400>56
<210>57
<211>636
<212>PRT
<213>大豆
<220>
<221>MOD_RES
<222>(381)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(385)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(400)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(413)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(415)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(418)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(421)..(422)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(431)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(437)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(439)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(441)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(447)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(454)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(457)..(458)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(462)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(466)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(469)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(477)..(478)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(485)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(495)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(509)
<223>可变氨基酸
<400>57
<210>58
<211>831
<212>DNA
<213>豌豆(Pisum sativum)
<400>58
权利要求
1.分离的脂类代谢蛋白(LMP)核酸，所述核酸含有选自以下的多核苷酸序列
a)SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQ IDNO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ ID NO26、SEQ ID NO28、SEQ IDNO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ ID NO40、SEQ ID NO41、SEQ IDNO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ ID NO53、SEQ ID NO55或SEQID NO56中定义的多核苷酸序列；
b)编码SEQ ID NO6、SEQ ID NO9、SEQ ID NO12、SEQ IDNO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ ID NO39、SEQ IDNO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57中定义的多肽的多核苷酸序列；
c)与上面的a)或b)的全长LMP核酸具有至少70％序列同一性的多核苷酸序列；
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列；和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
2.权利要求1的分离的LMP核酸，其中所述多核苷酸序列编码SEQID NO6、SEQ ID NO9、SEQ ID NO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ IDNO33、SEQ ID NO36、SEQ ID NO39、SEQ ID NO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57的多肽序列。
3.权利要求1的分离的LMP核酸，其中所述多核苷酸序列在SEQID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQ ID NO16、SEQ IDNO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ ID NO26、SEQ ID NO28、SEQ ID NO29、SEQ IDNO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ ID NO40、SEQ ID NO41、SEQ ID NO43、SEQ IDNO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ ID NO53、SEQ ID NO55、或SEQ ID NO56中定义。
4.权利要求1的分离的LMP核酸，其中所述多核苷酸序列与权利要求1的a)或b)的全长LMP核酸具有至少90％的序列同一性，且其中所述分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
5.权利要求1的分离的LMP核酸，其中所述多核苷酸序列与权利要求1的a)或b)的全长LMP核酸互补，且其中所述分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
6.权利要求1的分离的LMP核酸，其中所述多核苷酸序列在严格条件下与权利要求1的a)或b)的LMP核酸杂交，且其中该分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
7.权利要求1的分离的LMP核酸，其中该核酸位于表达载体中。
8.权利要求7的表达载体，其中所述LMP核酸与选自种子特异性启动子、根特异性启动子和非组织特异性启动子的异源启动子有效连接。
9.权利要求7的表达载体，其中LMP核酸与ptxA启动子有效连接。
10.产生具有修饰水平的种子贮藏化合物的转基因植物的方法，所述方法包括用包含脂类代谢蛋白(LMP)核酸的表达载体转化植物细胞并从植物细胞产生转基因植物，其中所述核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽，且其中所述核酸包含选自以下的多核苷酸序列
a)SEQ ID NO1、SEQ ID NO2、SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ IDNO13、SEQ ID NO14、SEQ ID NO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ IDNO26、SEQ ID NO28、SEQ ID NO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ IDNO40、SEQ ID NO41、SEQ ID NO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ IDNO53、SEQ ID NO55或SEQ ID NO56中定义的多核苷酸序列；
b)编码SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ IDNO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ IDNO39、SEQ ID NO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57中定义的多肽的多核苷酸序列；
c)与上面的a)或b)的全长LMP核酸具有至少70％序列同一性的多核苷酸序列；
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列；和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
11.权利要求10的方法，其中所述LMP核酸包含SEQ ID NO1、SEQ ID NO2、SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ IDNO8、SEQ ID NO10、SEQ ID NO11、SEQ ID NO13、SEQ ID NO14、SEQ ID NO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ IDNO22、SEQ ID NO23、SEQ ID NO25、SEQ ID NO26、SEQ ID NO28、SEQ ID NO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ IDNO35、SEQ ID NO37、SEQ ID NO38、SEQ ID NO40、SEQ ID NO41、SEQ ID NO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ IDNO49、SEQ ID NO50、SEQ ID NO52、SEQ ID NO53、SEQ ID NO55，或SEQ ID NO56的多核苷酸序列。
12.权利要求10的方法，其中所述LMP核酸包含编码SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ ID NO12、SEQ ID NO15、SEQ IDNO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ ID NO39、SEQ ID NO42、SEQ IDNO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54、或SEQ ID NO57的多肽的多核苷酸序列。
13.权利要求10的方法，其中所述LMP核酸包含与权利要求9的a)或b)的多核苷酸序列具有至少90％的序列同一性的多核苷酸序列。
14.权利要求10的方法，其中LMP核酸在严格条件下与权利要求10的a)或b)的LMP核酸杂交。
15.权利要求10的方法，其中所述LMP核酸包含与权利要求10的a)或b)的LMP核酸互补的多核苷酸序列。
16.权利要求10的方法，其中种子中的总油含量水平受到修饰。
17.权利要求10的方法，其中种子中的油酸水平受到修饰。
18.权利要求10的方法，其中与未转化的野生型植物品种相比，转基因植物中的种子贮藏化合物的水平提高。
19.权利要求10的方法，其中所述LMP核酸与选自种子特异性启动子、根特异性启动子和非组织特异性启动子的异源启动子有效连接。
20.权利要求10的方法，其中所述LMP核酸与ptxA启动子有效连接。
21.调节植物中种子贮藏化合物水平的方法，所述方法包括修饰植物中脂类代谢蛋白(LMP)核酸的表达，其中LMP核酸包含选自以下的多核苷酸序列
a)SEQ ID NO1、SEQ ID NO2、SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ IDNO13、SEQ ID NO14、SEQ ID NO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ IDNO26、SEQ ID NO28、SEQ ID NO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ IDNO40、SEQ ID NO41、SEQ ID NO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ IDNO53、SEQ ID NO55或SEQ ID NO56中定义的多核苷酸序列；
b)编码SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ IDNO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ IDNO39、SEQ ID NO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57中定义的多肽的多核苷酸序列；
c)与上面的a)或b)的全长LMP核酸具有至少70％序列同一性的多核苷酸序列；
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列；和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
22.权利要求21的方法，其中种子中的总油含量水平受到修饰。
23.权利要求21的方法，其中种子中的油酸水平受到修饰。
24.调节植物中一种或多种植物器官的数目和/或大小的方法，所述方法包括修饰植物中脂类代谢蛋白(LMP)核酸的表达，其中所述LMP核酸包含选自以下的多核苷酸序列
a)SEQ ID NO1、SEQ ID NO2、SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ IDNO13、SEQ ID NO14、SEQ ID NO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ IDNO26、SEQ ID NO28、SEQ ID NO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ IDNO40、SEQ ID NO41、SEQ ID NO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ IDNO53、SEQ ID NO55或SEQ ID NO56中定义的多核苷酸序列；
b)编码SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ IDNO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ IDNO39、SEQ ID NO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57中定义的多肽的多核苷酸序列；
c)与上面的a)或b)的全长LMP核酸具有至少70％序列同一性的多核苷酸序列；
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列；和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
25.权利要求24的方法，其中调节种子大小、种子数目和/或种子重量。
26.权利要求24的方法，其中植物根长度增加。
27.权利要求24的方法，其中叶子的数目/大小增加。
28.通过一种方法产生的转基因植物，所述方法包括用包含脂类代谢蛋白(LMP)核酸的表达载体转化植物细胞，并从植物细胞产生转基因植物，其中所述核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽，且其中所述核酸包含选自以下的多核苷酸序列
a)SEQ ID NO1、SEQ ID NO2、SEQ ID NO4、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQ ID NO10、SEQ ID NO11、SEQ IDNO13、SEQ ID NO14、SEQ ID NO16、SEQ ID NO17、SEQ ID NO19、SEQ ID NO20、SEQ ID NO22、SEQ ID NO23、SEQ ID NO25、SEQ IDNO26、SEQ ID NO28、SEQ ID NO29、SEQ ID NO31、SEQ ID NO32、SEQ ID NO34、SEQ ID NO35、SEQ ID NO37、SEQ ID NO38、SEQ IDNO40、SEQ ID NO41、SEQ ID NO43、SEQ ID NO44、SEQ ID NO46、SEQ ID NO47、SEQ ID NO49、SEQ ID NO50、SEQ ID NO52、SEQ IDNO53、SEQ ID NO55或SEQ ID NO56中定义的多核苷酸序列；
b)编码SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ IDNO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30、SEQ ID NO33、SEQ ID NO36、SEQ IDNO39、SEQ ID NO42、SEQ ID NO45、SEQ ID NO48、SEQ ID NO51、SEQ ID NO54或SEQ ID NO57中定义的多肽的多核苷酸序列；
c)与上面的a)或b)的全长LMP核酸具有至少70％序列同一性的多核苷酸序列；
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列；和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
29.权利要求28的转基因植物，其中种子中的总油含量水平受到修饰。
30.权利要求28的转基因植物，其中种子中的油酸水平受到修饰。
31.权利要求28的转基因植物，其中所述植物为双子叶植物。
32.权利要求28的转基因植物，其中所述植物为单子叶植物。
33.权利要求28的转基因植物，其中所述植物为高产油植物。
34.权利要求28的转基因植物，其中与未转化的野生型植物品种相比，转基因植物中种子贮藏化合物的水平提高。
全文摘要
提供了与脂类和糖代谢调节相关的分离的核酸和蛋白质。具体而言，提供了来源于拟南芥、欧洲油菜、大豆、稻和普通小麦的脂类代谢蛋白(LMP)和编码核酸。该核酸和蛋白质用于产生转基因植物和调节种子贮藏化合物水平的方法。种子贮藏化合物优选为脂类、脂肪酸、淀粉或种子贮藏蛋白质。该核酸和蛋白质还用于调节植物种子大小、种子数、种子重量、根长度和叶大小的方法。
文档编号A01H5/00GK101431888SQ200580026790
公开日2009年5月13日申请日期2005年6月16日优先权日2004年6月16日
发明者H·黑特尔, G·巴特, V·米腾多夫, K·尚克申请人:巴斯福植物科学有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：H.黑特尔;G.巴特;V.米腾多夫;K.尚克
技术所有人：巴斯福植物科学有限公司
我是此专利的发明人

上一篇：新的玉米种子切块外植体和玉米离体再生的方法
上一篇：用于钓竿的钓线引导装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1. 木质生物质转化利用 2. 绿色包装材料
2、刘老师：1. 木质生物质化学及材料 2. 纸基功能材料
3、温老师：1. 纤维素纳米纤维材料的制备、改性及应用 2. 造纸法再造烟叶、新型烟草开发 3.生物质资源基油田助剂（封堵、驱油和钻井） 4. 改性植物纤维开发
4、张老师：1.合成生物学 2. 微生物代谢工程
5、李老师：1.水平基因转移的分子机制及应用研究 2.植物细胞工厂构建
如您是高校老师，可以点此联系我们加入专家库。