植物中的糖及脂质代谢调节剂vi的制作方法

文档序号:184615阅读:412来源:国知局
专利名称:植物中的糖及脂质代谢调节剂vi的制作方法
技术领域
本发明一般性涉及植物种子贮存化合物相关蛋白质的编码核酸序列。更具体而言,本发明涉及糖、蛋白质及脂质代谢的酶和调节蛋白的编码核酸序列,及其在转基因植物中的用途。
本发明还涉及应用这些新植物多肽来鉴定和刺激植物生长和/或提高种子贮藏化合物产量的方法。
背景技术
对植物进行研究和遗传操作的历史已久,甚至始于Gregor Mendel的著名研究之前。从提高土豆块茎的淀粉含量到提高或改变油料植物(如油菜和向日葵)的脂肪酸含量,在该学科的完善中科学家们已经可以对植物的特定性状进行修饰。随着植物油的消费和使用不断增加,对于种子油含量和种子油水平的改良也日益广泛(如Tpfer等,1995,Science268681-686)。转基因植物中对生物合成路径的操纵为分子生物学家及植物生化学家们提供了影响植物代谢从产生特定的更高价值产品的许多机会。已改变了许多传统油料作物和非传统油料作物的种子油的产生或组成得以,传统油料作物如大豆(美国专利No.5,955,650)、芸苔(美国专利No.5,955,650)、向日葵(美国专利No.6,084,164)、油菜(Tpfer等,1995,Science 268681-686),非传统油料作物如烟草(Cahoon等,1992,Proc.Natl.Acad.Sci.USA 8911184-11188)。
植物种子油同时含有中性及极性脂质(见表1)。中性脂质主要包括甘油三酯,为种子油体中累积的主要贮存脂质。而极性脂质则主要见于种子细胞的多种膜内(如微粒体、质体和线粒体膜,以及细胞膜)。中性及极性脂质含有几种常见的脂肪酸(见表2)以及一系列较少见的脂肪酸。膜脂中脂肪酸的组成受到高度调节,其中仅存在有限几种脂肪酸。另一方面,许多植物种系种子的中性贮存脂质中含有大量的少见脂肪酸(Van de LooF.J.等,1993,《Unusual Fatty Acids in Lipid Metabolism in Plants》第91-126页,编辑TS Moore Jr.CRC Press;Millar等,2000,Trends Plant Sci.595-101)。
表1植物脂质类别

表2常见植物脂肪酸

表2中,标星号的脂肪酸一般不存在于植物种子油中,但其在转基因植物种子油中的产生对于植物生物技术很重要。
植物中脂肪酸生物合成的起始位点在质体。通过乙酰辅酶A羧化酶(ACCase)将乙酰辅酶A转化为丙二酰辅酶A,起始脂肪酸的生物合成。其丙二酰部分随后由丙二酰辅酶A:ACP酰基转移酶转移到酰基载体蛋白质(ACP)上。β-酮酰基ACP合成酶III(KAS III)催化脂肪酸生物合成中的初始缩合反应,其中通过羰基碳的亲核攻击将丙二酰ACP去羧基后产生的负碳离子转移至乙酰辅酶A,从而形成3-丁酰酮-ACP。还原、脱水以及再次还原反应完成反应循环,并产生丁酸。这一反应循环不断进行(KAS I或KAS II催化缩合反应),直至酰基基团链的长度达到通常16至18个碳原子。这些酰基-ACP可经硬脂酰-ACP去饱和酶去饱和,作为质体酰基转移酶的底物参与所谓原核路径的脂质形成,或在硫酯酶作用下脱离ACP后转运到胞浆中。它们进入胞浆酰基-ACP储池,并可用于在内质网中进行的所谓真核路径的脂质合成。
原核及真核路径的脂质合成均系在3-磷酸甘油酯酰基转移酶(GPAT)和溶血磷脂酸酰基转移酶(LPAAT)的催化下连续酰基化3-磷酸甘油酯而完成(Browse等,1986,Biochemical J.23525-31;Ohlrogge & Browse,1995,Plant Cell 7957-970)。生成的磷脂酸(PA)为其他质粒极性膜脂(如单半乳糖基甘油二酯(MGD)、双半乳糖基甘油二酯(DGD)、磷脂酰甘油(PG)及硫代奎诺糖甘油二酯(SQD))和内质网极性膜脂(如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰肌醇(PI)和磷脂酰丝氨酸(PS))的前体。极性脂质也是进一步修饰酰基链(如去饱和、乙酰化及羟基化等)的部位所在。PA也是内质网中生物合成甘油三酯(TAG)的中间产物,而甘油三酯为中性脂质的主要成分,因而也是种子油的主要成分。此外也存在生物合成TAG的其他途径(即通过磷脂酰胆碱甘油二酯酰基转移酶转移酰基)(Voelker,1996,《Genetic Engineering》Setlow编,18111-113;Shanklin & Cahoon,1998,Annu.Rev.Plant Physiol.Plant Mol.Biol.49611-641;Frentzen,1998,Lipids 100161-166;Millar等,2000,Trends Plant Sci.595-101)。将甘油三酯分解为甘油二酯和脂肪酸的逆向反应则由脂酶催化进行。该分解可见于种子发育终末期,而导致种子油有所下降(Buchanan等,2000)。
种子的贮存脂质由糖来源的前体合成。在植物胞质中具备完整的糖酵解途径(Plaxton,1996,Annu.Rev.Plant Physiol.Plant Mol.Biol.47185-214),已证实在油菜的质体中也存在完整的途径(Kang & Rawsthorne,1994,Plant J.6795-805)。从叶中转运至发育中的种子的蔗糖为碳原子和能量的主要来源。在种子的贮存阶段,蔗糖在胞浆内发生转化,提供代谢前体葡萄糖-6-磷酸和丙酮酸。这些前体被转运到质体中并转化为乙酰辅酶A,后者是脂肪酸生物合成的主要前体。质体中的乙酰辅酶A为脂质生物合成的核心前体。可以通过不同的反应在质体中形成乙酰辅酶A,而每一反应的确切作用仍在争论中(Ohlrogge & Browse,1995,Plant Cell7957-970)。然而,已经明确相当部分的乙酰辅酶A来源于由胞质转运到质体的葡萄糖-6-磷酸和丙酮酸。蔗糖产生于能源器官(叶或发生光合作用的任何场所),并被运输到发育中的种子(也称为贮存器官)。在发育的种子中,蔗糖为所有贮存化合物即淀粉、脂质及部分种子贮存蛋白质的前体。因此,蔗糖起核心作用的糖代谢对于种子贮存化合物的积累显然至关重要。
虽然可以通过植物育种的常规方法改变种子油的脂质和脂肪酸含量,重组DNA技术的出现使对植物种子油含量的操纵更为简易。在某些情况下,也使仅靠育种不能实现的种子油改变成为可能(见如Tpfer等,1995,Science 268681-686)。例如,向转基因烟草中引入Δ12-羟化酶核酸序列可在烟草种子油中形成一种新的脂肪酸——蓖麻油酸(Van de Loo等,1995,Proc.Natl.Acad.Sci USA 926743-6747)。也已通过引入并表达胡荽来源的酰基-ACP去饱和酶对烟草作物进行改造以产生低水平岩芹酸(Cahoon等,1992,Proc.Natl.Acad.Sci USA 8911184-11188)。
对植物种子油含量的改良具有重要的医学、营养及经济学分支。就医学方面而言,许多种子油含有的长链脂肪酸(C18及更长)与高胆固醇血症及其他冠心病相关的临床症状的减轻有关(Brenner,1976,Adv.Exp.Med.Biol.8385-101)。因此,摄入具有高含量此类脂肪酸的植物有可能会降低心脏病的风险。种子油含量的升高也增加了种子油的大规模生产,因而降低了其成本。
为了提高或改变如种子油等植物中化合物水平,必须鉴定调节脂质和脂肪酸代谢的核酸序列及蛋白质。如前文所述,已经克隆了几种去饱和酶核酸,如Δ6-去饱和酶核酸、Δ12-去饱和酶核酸以及酰基-ACP去饱和酶核酸,并证实它们编码多种植物种系中脂肪酸合成所需的酶类。也已克隆了不同种系(如芸苔属(Brassica)、大豆、胡萝卜、松树以及拟南芥(Arabidopsisthaliana))的油质蛋白核酸序列,并确定其编码与这些植物油体磷脂单层膜有关的蛋白质。
虽然已知几种化合物对植物和种子的发育起主要作用,很显然需要具体地鉴定更特异于贮存化合物积累的发育调节的因素,并鉴定能改变或提高其宿主植物或其他植物种系产油的基因。本发明公开了拟南芥、油菜(Brassica napus)和向日葵(Helianthus annuus)来源的核酸序列。这些核酸序列可用于改变或提高植物(包括转基因植物)中种子贮存化合物(如蛋白质、糖及油)的水平,所述植物为含大量脂质化合物的油料种子植物,如油菜、芸苔、亚麻子、大豆、向日葵、玉米、燕麦、裸麦、大麦、小麦、胡椒、万寿菊、棉花、油棕、椰树、亚麻、蓖麻和花生。
发明概述本发明提供了与植物种子贮存化合物代谢相关的新分离的核酸及氨基酸序列。
本发明也提供了来自拟南芥、油菜和向日葵的编码脂质代谢蛋白(LMP)的分离核酸或其部分。这些序列可以用于改变或提高微生物及植物中脂质和脂肪酸、辅因子、糖以及酶水平。
已知拟南芥植物可以产生如亚油酸和亚麻酸的大量脂肪酸(见如表2),且由于拟南芥在许多方面(基因同源性等)与芸苔属油料作物具有紧密相似性。因此,来源于如拟南芥的植物的核酸分子特别适于对宿主的脂质和脂肪酸代谢进行修饰,特别是在微生物和植物中。此外,拟南芥植物来源的核酸可用于鉴定其他种系中的DNA序列和酶,所述DNA序列和酶可用于在相应生物体中修饰脂肪酸前体分子的生物合成。
本发明也提供了分离的核酸,其中含有本文公开的拟南芥、油菜或向日葵LMP核酸的至少60个核苷酸的片断。本发明还提供了与本文公开的全长拟南芥、油菜或向日葵LMP核酸具有至少70%序列同一性的分离核酸。本发明还提供了与本文公开的全长拟南芥、油菜或向日葵LMP核酸具有至少90%序列同一性的分离核酸。本发明还提供了可在严紧条件下与本文公开的拟南芥、油菜或向日葵LMP核酸杂交的分离核酸。
本发明也提供了该核酸编码的多肽、含有该核酸编码多肽的异源多肽,以及这些多肽的抗体。本发明还提供了与本文公开的全长拟南芥、油菜或向日葵LMP多肽具有至少70%序列同一性的分离多肽。本发明还提供了与本文公开的全长拟南芥、油菜或向日葵LMP多肽具有至少90%序列同一性的分离多肽。因此,本发明提供了拟南芥、油菜或向日葵来源的新的分离的LMP核酸和分离的LMP多肽,及其活性片断、类似物和直向同源物。
此外,本发明涉及并提供LMP核酸在生产种子贮存化合物水平改变的转基因植物中的用途。生产种子贮存化合物水平改变的转基因植物的方法包括用含有LMP核酸的表达载体转化植物细胞并从该植物细胞产生种子贮存化合物水平改良的植物的步骤。例如,在优选实施方案中,该植物为选自油菜、芸苔、亚麻子、大豆、向日葵、玉米、燕麦、裸麦、大麦、小麦、胡椒、万寿菊、棉花、油棕、椰树、亚麻、蓖麻和花生之一的产油种类或油料种子种类。
根据本发明,本文描述的组合物和方法可用于提高或降低转基因植物中LMP水平,包括增加或减少该植物中LMP核酸的表达。可以通过LMP核酸的体内诱变来增加或减少LMP核酸的表达。本发明也可用于提高或降低种子油中的脂质水平、提高或降低种子油中的脂肪酸水平,或提高或降低种子或植物中的淀粉水平。
本发明也包括由LMP DNA序列转化的转基因植物所产生的种子,其中所述种子含有LMP DNA序列且该植物是用于改变种子贮存化合物水平的真实育种。本发明还包括上述种子产生的种子油。
本发明还提供了含有该核酸的载体、含有该载体的宿主细胞,以及用该核酸和/或载体转化植物细胞所产生的子代植物材料。
根据本发明,本文所述的化合物、组合物以及方法可用于提高或降低种子油中的脂质水平、提高或降低种子油中的脂肪酸水平,或提高或降低种子或植物中的淀粉或其他糖类水平。在转基因植物中产生高于或低于正常或一般水平贮存化合物的方法包括在转基因植物中表达拟南芥、油菜或向日葵来源的LMP核酸,其中该转基因植物为拟南芥、油菜或向日葵,或异于拟南芥、油菜或向日葵的物种。本发明还包括改变种子贮存化合物生产效率的组合物和方法。
本发明也提供了种子贮存化合物水平改变的转基因植物,尤其是改变其中蛋白质、脂质、脂肪酸或糖的水平。
本发明的多核苷酸和多肽,包括其类似物和/或片断,也可用于调节植物生长以及潜在调节植物产出,优选在不良条件下(干燥、寒冷、光照、紫外线)提高植物的生长。此外,本发明的拮抗剂可用于包括调节植物生长和/或产出,优选提高植物的生长及产出。在另一个实施方案中,利用组成型启动子(如35S或其他启动子)过表达本发明的多肽可能可以通过调节光利用的效率提高应激条件下(干燥、寒冷、光照、紫外线)的植物产出。
本发明也提供了生产前述转基因植物的方法。本发明还提供了这类前述转基因植物的种子和来自它们的种子油。
阅读以下详述后,可清楚了解本发明的这些及其他实施方案、特征和优势。
附图简述


图1为携带osw20抑制构建体的二元载体的示意图解。
发明详述参考以下对本发明优选实施方案的详细描述及所附的实施例,可更容易地理解本发明。
在公开并描述所述化合物、组合物及方法之前,应当理解本发明不仅限于特定核酸、特定多肽、特定细胞类型、特定宿主细胞、特定条件或特定方法等,因为这些理所当然可以有所变化,其多种修饰和变化对于本领域技术人员而言是显而易见的。还应当理解本文所用的术语仅出于描述具体实施方案的目的而不在于具有限制性。
根据本文所体现和详细描述的本发明目的,本发明一方面提供了植物(拟南芥、油菜和向日葵)来源的编码脂质代谢蛋白或其部分的分离核酸。本文所用的短语“拟南芥、油菜和向日葵”指拟南芥和/或油菜和/或向日葵。
本发明的一方面涉及编码LMP多肽或其生物学活性部分的分离核酸分子,也涉及可用于鉴定或扩增LMP编码核酸(如LMP DNA)的杂交探针或引物的核酸片断。本文所用的术语“核酸分子”和“多核苷酸序列”可互换,包括DNA分子(如cDNA或基因组DNA)和RNA分子(如mRNA),以及利用核苷酸类似物产生的DNA或RNA类似物。该术语也包括基因编码区3’和5’端的非翻译序列该基因编码区5’端上游序列至少约1000个核苷酸以及编码区3’端下游序列至少约200个核苷酸。核酸分子可以为单链或双链,但优选双链DNA。“分离”核酸分子为与该核酸天然来源中存在的其他核酸分子充分分离开的核酸分子。优选的“分离”核酸中基本不含在其来源生物基因组DNA中天然位于所述核酸两侧的序列(即位于所述核酸5’和3’端的序列)。例如在多个实施方案中,分离的LMP核酸分子可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,所述序列在该核酸来源的细胞(如拟南芥、油菜或向日葵)基因组DNA中天然位于LMP核酸两侧。此外,“分离”核酸分子(如cDNA分子)中基本不含有使用重组技术生产时的其他细胞材料或培养基,或采用化学合成时的化学前体或其他化学物品。
可以使用标准分子生物学技术及本文提供的序列信息分离本发明的核酸分子,如具有如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123所示的多核苷酸序列或其部分的核酸分子。例如,可以使用所公开的多核苷酸序之一的全部或部分为杂交探针,利用标准杂交技术(如Sambrook等,1989,《Molecular CloningA LaboratoryManual.》第二版,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY所述),从拟南芥、油菜或向日葵文库中分离拟南芥、油菜或向日葵的LMP cDNA。此外,可以使用根据核酸序列设计的寡核苷酸引物进行聚合酶链式反应分离所公开的多核苷酸序之一的全部或一部分的核酸分子,例如可以利用根据相应序列设计的寡核苷酸引物,通过聚合酶链式反应分离含SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ IDNO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ IDNO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123的全部或一部分的核酸分子。例如,mRNA可以从植物细胞中分离(如通过Chirgwin等,1979,Biochemistry 185294-5299所述的胍盐-硫氰酸盐萃取法),而cDNA则可以利用逆转录酶制备(如获自Gibco/BRL,Bethesda,MD的Moloney MLV逆转录酶;或获自Seikagaku America,Inc.,St.Petersburg,FL的AMV逆转录酶)。可以根据如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123所示的多核苷酸序列之一设计用于聚合酶链式反应扩增的合成寡核苷酸引物。可根据标准PCR扩增技术选择合适的寡核苷酸引物,以cDNA或基因组DNA为模板扩增本发明的核酸。将如此扩增的核酸克隆至合适的载体中,并通过DNA序列分析表征。此外,可以通过标准合成技术(如使用自动DNA合成仪)制备与LMP核苷酸序列相应的寡核苷酸。
在优选实施方案中,本发明的分离核酸含有SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ IDNO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ IDNO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ IDNO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123的多核苷酸序列之一。这些多核苷酸对应于本发明的拟南芥、油菜和向日葵LMPcDNA。这些cDNA中含有编码LMP的序列(即开放阅读框(ORF)的“编码区”)。或者这些核酸分子也可以含有本文所述的多核苷酸序列的5’端非翻译序列及3’端非翻译序列,或含有从基因组DNA中分离的整个基因组片断。SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ IDNO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQID NO123所示的特定多核苷酸序列已被赋予识别登录号(如Osw14)。这些序列代表编码区或开放阅读框,编码多肽的推定功能如表3所示。
表3推定的LMP功能



表4LMP的功能蛋白质结构域分组



在另一个优选实施方案中,本发明的分离核酸分子编码能够参与种子贮存化合物(如脂质、淀粉及种子贮存蛋白质)代谢的多肽,和/或含有DNA结合(或转录因子)结构域或RNA结合结构域的多肽。表4为编码含此类结构域的LMP的分离核酸实例。编码含RNA结合结构域的LMP的分离核酸实例为SEQ ID NO1和SEQ ID NO17。编码含信号传导结构域的LMP的分离核酸实例为SEQ ID NO3。编码含蛋白酶结构域的LMP的分离核酸实例包括如SEQ ID NO23、SEQ ID NO25、SEQ ID NO27和SEQ ID NO37所示的核酸。编码含脂质代谢结构域的LMP的分离核酸实例包括如SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ IDNO19、SEQ ID NO21、SEQ ID NO53、SEQ ID NO55和SEQ ID NO121所示核酸。编码含氧化还原酶结构域的LMP的分离核酸实例包括如SEQID NO31、SEQ ID NO41和SEQ ID NO43所示的核酸。编码含脂肪酸代谢结构域的LMP的分离核酸实例包括如SEQ ID NO29、SEQ ID NO57和SEQ ID NO59所示的核酸。编码含蛋白质合成结构域的LMP的分离核酸实例包括如SEQ ID NO35和SEQ ID NO45所示的核酸。编码含生物碱生物合成结构域的LMP的分离核酸实例包括如SEQ ID NO7和SEQID NO9所示的核酸。编码含生物合成前体供给结构域的LMP的分离核酸实例包括如SEQ ID NO33、SEQ ID NO39、SEQ ID NO47和SEQ IDNO49所示的核酸。编码含胞间转运结构域的LMP的分离核酸实例包括如SEQ ID NO5和SEQ ID NO51所示的核酸。
在另一优选实施方案中,本发明的分离核酸分子含有以下核酸分子,所述核酸分子为SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123之一的多核苷酸序列或其部分的互补序列。与公开的多核苷酸序列之一互补的核酸分子是这样的核酸分子,它们与所公开的多核苷酸序列充分互补,从而能够与公开的多核苷酸序列杂交形成稳定的二联体。
在另一优选实施方案中,本发明的分离核酸分子含有编码多肽的多核苷酸序列,所述多肽选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ IDNO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ IDNO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48、SEQ ID NO50、SEQ IDNO52、SEQ ID NO54、SEQ ID NO56、SEQ ID NO58、SEQ ID NO60和SEQ ID NO122。
在另一个优选实施方案中,本发明的分离核酸分子含有多核苷酸序列,所述多核苷酸序列与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123的全长多核苷酸序列或其部分之间的同源性至少为约50-60%,优选至少约60-70%,更优选至少约70-80%、80-90%或90-95%,甚至更为优选至少约95%、96%、97%、98%、99%或更高。在另一个优选实施方案中,本发明的分离的核酸分子含有多核苷酸序列,所述多核苷酸序列可在如严紧条件下与这些公开的多核苷酸序列之一或其部分杂交。所述严紧条件包括用盐浓度为约0.02M的溶液在pH 7和约60℃下洗涤。在另一个实施方案中,所述严紧条件包括在6X氯化钠/柠檬酸钠(6X SSC)溶液、45℃下杂交。在另一个实施方案中,所述严紧条件包括在6X氯化钠/柠檬酸钠(6X SSC)溶液、65℃下杂交。
此外,本发明的分离核酸分子可仅含有SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ IDNO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ IDNO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123的公开序列之一的编码区的一部分,例如可用作探针或引物的片断或编码LMP生物学活性部分的片断。通过克隆拟南芥、油菜和向日葵的LMP基因而确定的多核苷酸序列能够用于产生为在其他细胞类型及生物中鉴定和/或克隆LMP同系物以及来自其他植物或相关物种的LMP同系物所设计的探针和引物。因此本发明也提供含有本文公开的核酸或其片断的化合物。这些化合物包含附着于其他部分的核酸。其他部分包括但不仅限于检测部分、杂交部分、纯化部分、运输部分、反应部分、结合部分等。探针/引物一般含有基本纯化的寡核苷酸。所述寡核苷酸一般含有可在严紧条件下与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ IDNO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ IDNO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123所列序列之一的正义链、其反义序列或其天然突变体中至少约12个,优选约25个,更优选约40、50或75个连续核苷酸杂交的核苷酸序列区。这些多核苷酸序列之一的引物可用于PCR反应以克隆LMP同系物。LMP核苷酸序列的探针可用于检测转录物或编码相同或同源蛋白质的基因组序列。在优选的实施方案中,探针中还含有与之相连的标记基团,所述标记基团的实例可为放射性同位素、荧光化合物、酶或辅酶因子。此类探针可作为基因组标记物测试试剂盒的一部分,用于如通过测量细胞样品中LMP编码核酸的水平(如检测LMP mRNA水平)鉴定表达LMP的细胞,或确定基因组LMP基因是否发生了突变或缺失。
在一个优选实施方案中,本发明的核酸分子编码蛋白质或其部分,所述蛋白质或其部分含有与公开的SEQ ID NO1、SEQ ID NO3、SEQ IDNO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ IDNO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ IDNO59或SEQ ID NO121多核苷酸序列之一所编码的氨基酸序列充分同源的氨基酸序列,从而使蛋白质或其部分能保持与野生型蛋白质相同或相似的功能。本文所用的“充分同源”,是指该蛋白质或其部分具有的氨基酸序列中包括与某氨基酸序列一致或等价的氨基酸残基的最小数量,该最小数量使该蛋白质或其部分能够参与植物中种子贮存化合物的产生、微生物或植物中细胞膜的构建、或分子的跨膜转运所必需的化合物代谢。本文所用的“等价”氨基酸残基实例如,具有与公开的多核苷酸序列之一编码的特定氨基酸残基相似侧链的氨基酸残基。调节蛋白(如RNA结合蛋白)、蛋白质稳定和降解蛋白、信号传导蛋白、或代谢路径(如脂质、淀粉和蛋白质生物合成路径以及这些路径的前体供给路径)的蛋白质成员、或膜转运系统等可能在种子贮存化合物的生物合成中起作用。本文描述了此类活性的实例(见表3的推定注释)。LMP编码核酸序列的实例为SEQ IDNO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ IDNO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ IDNO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ IDNO123。
由于在多种植物(如玉米、小麦、裸麦、燕麦、黑小麦、水稻、大麦、大豆、花生、棉花、油菜、芸苔、木薯、胡椒、向日葵和万寿菊,茄属植物(如土豆、烟草、茄子及番茄),蚕豆属、豌豆、紫花苜蓿、灌木植物(咖啡、可可树、茶树)、柳树属、树(油棕、椰树)、多年生禾本科以及草料作物)中,改变或提高糖和/或脂肪酸的产生是希望得以遗传的主要性状,这些作物植物也是本发明另一个实施方案中遗传工程的优选靶植物。本文所用的术语“草料作物”包括但不仅限于冰草、金黄草、雀麦草、野麦草、蓝草、鸭茅、紫花苜蓿、Salfoin、鸡爪三叶草、杂三叶草、红色三叶草以及甜三叶草。在优选实施方案中,该植物实例为选自油菜、芸苔、亚麻子、大豆、向日葵、玉米、燕麦、裸麦、大麦、小麦、胡椒、万寿菊、棉花、油棕、椰树、亚麻、蓖麻和花生之一的产油物种或油料种子物种。见如Kinney等(1994,Current Opin.in Biotech.5144-151)、Tpfer等(1995,Science 268681-686),以及《Oil Crops of the World-Their Breeding andUtilization》(1989,Rbbelen,Downey和Ashri编)。
本发明的LMP核酸分子编码的蛋白质部分优选为LMP之一的生物学活性部分。本文所用的术语“LMP的生物学活性部分”旨在包括以下部分,如参与植物中种子贮存脂质的生物合成、微生物或植物中细胞膜的构建或分子的跨膜转运所必需的化合物代谢、或具有表3所列活性的LMP结构域/基序。为确定LMP或其生物学活性部分是否能够参与植物中种子贮存化合物及细胞膜的产生所需的化合物代谢,可进行酶活性的测定。此类测定方法为本领域技术人员所熟知,具体参考引于本文实施例15。
LMP的生物学活性部分包括含有氨基酸序列的肽,所述氨基酸序列来源于LMP氨基酸序列(如由核酸序列SEQ ID NO1、SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ IDNO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ IDNO59、SEQ ID NO121或SEQ ID NO123编码的氨基酸序列),或与LMP同源的蛋白质的氨基酸序列,其中包括少于全长LMP或与LMP同源的全长蛋白质的氨基酸,且表现出LMP的至少一种活性。通常,生物学活性部分(如长度为如5、10、15、20、30、35、36、37、38、39、40、50、100或更多个氨基酸的肽)含有具有至少一种LMP活性的结构域或基序。此外,可以通过重组技术制备蛋白质其余区域缺失的其他生物学活性部分,并评估本文所述的一种或多种活性。优选的LMP生物学活性部分包括一种或多种选择的结构域/基序或其具有生物学活性的部分。
可以通过分离这些序列之一的部分、表达LMP或肽的编码部分(如通过体外重组表达)并评估LMP或肽编码部分的活性,来制备编码LMP生物活性部分的其他核酸片断。
本发明还包括与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123及其部分不同的核酸分子,这些不同是由于遗传密码简并所致,因而也编码与公开多核苷酸序列编码的LMP相同的LMP。在另一个实施方案中,本发明的核酸分子编码全长多肽,其与SEQID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ IDNO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34、SEQ ID NO36、SEQ IDNO38、SEQ ID NO40、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48、SEQ ID NO50、SEQ ID NO52、SEQ ID NO54、SEQ IDNO56、SEQ ID NO58、SEQ ID NO60或SEQ ID NO122所示的氨基酸序列基本同源。在一个实施方案中,全长核酸或蛋白质或该核酸或蛋白质的片断来自拟南芥、油菜和向日葵。
除本文所述的拟南芥、油菜和向日葵LMP多核苷酸序列外,本领域技术人员会理解种群(如拟南芥、油菜和向日葵种群)中可能存在导致LMP氨基酸序列改变的DNA序列多态性。由于天然变异,种群个体间可能存在此类LMP基因的遗传多态性。本文所用的术语“基因”和“重组基因”是指含有编码LMP的开放阅读框的核酸分子,其中LMP优选为拟南芥、油菜和向日葵LMP。此类天然变异一般会造成LMP基因的核苷酸序列1-40%的变异。任何及所有此类天然变异导致的且不会改变LMP功能性活性的核苷酸变异及其所产生的LMP氨基酸多态性,均在本发明的范围内。
可以根据其与本文公开的拟南芥、油菜和向日葵LMP核酸的同源性,以拟南芥、油菜和向日葵cDNA或其部分为杂交探针,根据严紧条件下的标准杂交技术分离对应于天然变异体和本发明拟南芥、油菜和向日葵LMPcDNA的非拟南芥、非油菜或非向日葵直向同源物的核酸分子。本文所用的“直向同源物”是指不同种系的两种核酸,但其系自相同祖先基因通过物种形成进化而来。通常直向同源物编码具有相同或相似功能的蛋白质。因此,在另一个实施方案中,本发明分离的核酸分子长度至少为15个核苷酸,且可在严紧条件下与含有SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ IDNO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ IDNO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123的多核苷酸序列之一的核酸分子杂交。在其他实施方案中,核酸长度至少为30、50、60、100、250或更多个核苷酸。本文所用的术语“在严紧条件下杂交”用以描述杂交和洗涤条件,在所述条件下彼此间至少有60%同源性的核苷酸序列通常可保持相互杂交状态。优选的条件可使彼此具有至少约65%,更优选至少约70%,甚至更优选至少约75%或更大同源性的序列通常保持杂交状态。该严紧条件为本领域技术人员所公知,可见于《Current Protocols in Molecular Biology》,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6。优选的严紧杂交条件的非限制性实例为6X氯化钠/柠檬酸钠(SSC)、45℃下杂交,随后在0.2X SSC、0.1%SDS中50-65℃下洗涤一次或多次。在另一个实施方案中,所述严紧条件包括在6X氯化钠/柠檬酸钠(6X SSC)溶液、45℃下杂交。在另一个实施方案中,所述严紧条件包括在6X氯化钠/柠檬酸钠(6X SSC)溶液、65℃下杂交。优选的可在严紧条件下与公开多核苷酸序列杂交的本发明分离核酸分子对应于天然存在的核酸分子。本文所用的术语“天然存在的”核酸分子是指具有天然存在(如编码天然蛋白质)的多核苷酸序列的RNA或DNA分子。在一个实施方案中,该核酸编码天然的拟南芥、油菜或向日葵LMP。
除了种群中可能存在的LMP序列天然变异体之外,技术人员还理解可以通过突变向公开的多核苷酸序列之一引入变化,从而改变所编码LMP的氨基酸序列,却不改变LMP的功能性能。例如,可以对所公开的多核苷酸序列进行核苷酸替换,从而引起“非必需”氨基酸残基的氨基酸替换。“非必需”氨基酸残基是指公开的LMP(SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ IDNO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ IDNO32、SEQ ID NO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48、SEQ IDNO50、SEQ ID NO52、SEQ ID NO54、SEQ ID NO56、SEQ ID NO58、SEQ ID NO60或SEQ ID NO122)之一的野生型序列中可以改变而不改变该LMP活性的残基,而“必需”氨基酸残基则是LMP活性所必需的。然而,其他氨基酸残基(如那些LMP活性结构域中非保守或仅为半保守的残基)对于其活性可能是非必需的,因此这些残基可能适于被改变而不改变LMP活性。
因此,本发明的另一方面涉及编码LMP的核酸分子,所述LMP内含有LMP活性非必需的氨基酸残基改变。这些LMP在氨基酸序列上与还保留本文所述的至少一种LMP活性的序列有所不同。在一个实施方案中,分离的核酸分子中包含编码蛋白质的核苷酸序列,其中所述蛋白质含有与核酸SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ IDNO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQID NO123编码的氨基酸序列至少具约50%同源性的氨基酸序列,且能参与产生拟南芥、油菜及向日葵中种子贮存化合物或细胞膜所必需的化合物代谢,或具有表3列出的一种或多种活性。优选的核酸分子编码的蛋白质与公开的核酸之一编码的序列间具有至少约50-60%同源性,更优选与公开的核酸之一编码的序列间具有至少约60-70%同源性,甚至更优选与公开的核酸之一编码的序列间具有至少约70-80%、80-90%或90-95%同源性,而最优选与公开的核酸之一编码的序列间具有至少约96%、97%、98%或99%的同源性。
为确定两个氨基酸序列(如本文公开的核酸编码的序列与其突变体形式)之间或两个核酸之间的同源性百分比,将所述序列按最佳比较目的比对(例如,可在一个蛋白质或核酸序列中引入间隙以便与另一个蛋白质或核酸最佳比对)。然后比较相应氨基酸位点或核苷酸位点的氨基酸残基或核苷酸。如果其中一个序列(如由公开SEQ ID NO1、SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ IDNO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ IDNO59、SEQ ID NO121或SEQ ID NO123核酸编码的序列之一)中某一位置与另一序列(如由公开的核酸序列编码序列的突变体形式)相应位置上的氨基酸残基或核苷酸相同,则这两个分子在该位置上同源。本文所用的氨基酸或核酸“同源性”与氨基酸或核酸“同一性”的意义等同。两个序列之间的同源性百分比为这两个序列所共有的相同位置数目的函数(即,%同源性=相同位置数目/总位置数目×100)。
可以通过向公开多核苷酸序列中引入一个或多个核苷酸替换、添加或缺失,来产生编码与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ IDNO121或SEQ ID NO123核酸编码蛋白质序列同源的LMP的分离核酸分子,从而可向编码蛋白质中引入一个或多个氨基酸替换、添加或缺失。可以通过标准技术(例如定点诱变和PCR介导的诱变)向公开的多核苷酸序列之一引入突变。优选在一个或多个预测的非必需氨基酸残基上进行保守氨基酸替换。“保守氨基酸替换”是指一个氨基酸残基由另一个具有相似侧链的氨基酸残基代替。本领域中已经确定了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如天冬氨酸、谷氨酸)、不带电的极性侧链(如甘氨酸、天冬酰胺、谷胺酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)以及芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸残基。因此,优选用来自相同侧链家族的另一个氨基酸残基代替LMP中预测的非必需氨基酸残基。或者,在另一个实施方案中,可以通过如饱和诱变的方法向所有或部分LMP编码序列中随机引入突变,筛查所得突变体中本文所述的LMP活性,以鉴定保留LMP活性的突变体。诱变公开的多核苷酸序列之后,可以重组表达编码的蛋白质,并通过如本文描述的测定法(见如下文实施例15-16)测定蛋白质的活性。
优选通过重组DNA技术产生LMP。例如,将编码该蛋白质的核酸分子克隆到表达载体(如本文所述)中,将该表达载体引入宿主细胞(如本文所述),并在宿主细胞中表达LMP。随后可利用标准蛋白质纯化技术、通过合适的纯化步骤将LMP从细胞中分离出来。除重组表达之外,还可使用标准肽合成技术化学合成LMP或其肽。此外,可以使用抗LMP抗体从细胞中分离天然LMP,所述抗体可通过标准技术,利用本发明的LMP或其片断制备。
本发明也提供了LMP嵌合或融合蛋白。本文所用的LMP“嵌合蛋白质”或“融合蛋白”包括与非LMP多肽有效连接的LMP多肽。“LMP多肽”是指具有LMP相应氨基酸序列的多肽,而“非LMP多肽”是指具有与LMP非充分同源的蛋白质对应的氨基酸序列的多肽,例如与LMP不同且来源于相同或不同生物的蛋白质。本文所用涉及到融合蛋白的术语“有效连接”是指LMP多肽与非LMP多肽相互融合,使二者都能行使所用序列的预期功能。可以将非LMP多肽融合于LMP多肽的N-末端或C-末端。例如,在一个实施方案中,融合蛋白为GST-LMP(谷胱甘肽S-转移酶)融合蛋白,其中LMP序列融合于GST序列的C-末端。此类融合蛋白可促进重组LMP的纯化。在另一个实施方案中,融合蛋白为在其N-末端具有异源性信号序列的LMP。在某些宿主细胞(如哺乳动物宿主细胞)中,使用异源性信号序列能够提高LMP的表达和/或分泌。
优选通过标准重组DNA技术生产本发明的LMP嵌合或融合蛋白。例如,根据常规技术将编码不同多肽序列的DNA片断于阅读框内连接在一起,如使用平末端或粘性末端进行连接、限制性酶消化以提供合适的末端、必要时填充粘性末端、碱性磷酸酶处理以避免不需要的连接,以及酶连接。在另一个实施方案中,可以通过常规技术(包括自动DNA合成仪)合成融合基因。或者可以使用锚定引物进行基因片断的PCR扩增,所述锚定引物能够在两个连续基因片断之间产生互补突出端,使其可随后退火并再扩增产生嵌合基因序列(其例见如《Current Protocols in MolecularBiology》,Ausubel等编,John Wiley & Sons1992)。此外,许多已经编码融合部分的表达载体(如GST多肽)为商业可得。可以将LMP编码核酸克隆到这样的表达载体中,从而使融合部分与LMP同阅读框相连。
除了上述编码LMP的核酸分子之外,本发明另一方面涉及与其反义的分离核酸分子。“反义”核酸含有与编码蛋白质的“正义”核酸互补的核苷酸序列,例如与双链cDNA分子的编码链互补或与mRNA序列互补。因此,反义核酸可以与正义核酸形成氢键。反义核酸可以与整个LMP编码链互补,也可仅与其中一部分互补。在一个实施方案中,反义核酸分子与LMP编码核苷酸序列的编码链“编码区”反义。术语“编码区”是指核苷酸序列中含有能够翻译为氨基酸残基的密码子的区域。在另一实施方案中,反义核酸分子与LMP编码核苷酸序列的编码链“非编码区”反义。术语“非编码区”是指编码区两侧不被翻译成氨基酸的5’和3’端序列(即也称为5’和3’端非翻译区)。
根据本文公开的编码LMP的编码链序列(例如SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ IDNO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ IDNO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ IDNO57、SEQ ID NO59或SEQ ID NO121所示的全长多核苷酸序列),可以按照Watson和Crick碱基配对原则设计本发明的反义核酸。反义核酸分子可以与LMP mRNA的整个编码区互补,但更优选仅与LMP mRNA编码区或非编码区部分反义的寡核苷酸。例如,反义寡核苷酸可以与LMPmRNA翻译起始点周围区域互补。反义寡核苷酸长度可为如5、10、15、20、25、30、35、40、45或50个核苷酸。可以使用化学合成以及酶连接反应,通过本领域已知的方法构建本发明的反义或正义核酸。例如,可以使用天然核苷酸或各种修饰核苷酸化学合成反义核酸(如反义寡核苷酸),所述修饰是为了提高分子的生物学稳定性或提高反义和正义核酸所形成二联体的物理稳定性,如可使用硫代磷酸酯衍生物和吖啶替代的核苷酸。可用于产生反义核酸的修饰核苷酸实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶核苷、5-(羧基羟甲基)尿嘧啶、5-羧基甲胺基甲基-2-硫代尿苷、5-羧基甲胺基尿嘧啶、双氢尿嘧啶、β-D-半乳糖苷核苷、次黄嘌呤核甙、N-6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基次黄嘌呤、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N-6-腺嘌呤、7-甲基鸟嘌呤、5-甲基胺甲基尿嘧啶、5-甲氧胺基甲基-2-硫脲嘧啶、β-D-甘露糖Q核苷、5′-甲氧羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N-6-异戊烯基腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、核苷、2-硫胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。或者,可以使用表达载体生物产生反义核酸,所述表达载体中含有按反义方向亚克隆的核酸(即由插入核酸转录得到的RNA为目的靶核酸的反义方向,在以下部分将进一步说明)。
在反义技术的另一种变化形式中,可以使用双链干扰RNA构建体引起转基因植物中LMP mRNA水平以及LMP活性的下调。这需要用嵌合构建体转化植物,所述构建体中具有正义方向的LMP序列部分,其与相同部分的LMP序列的反义序列融合。可以利用长度不等的DNA接头区分隔该构建体中LMP序列的正义及反义片断。
本发明的反义核酸分子一般施用于细胞或原位产生,以使其能够与编码LMP的细胞mRNA和/或基因组DNA杂交或结合而抑制该蛋白质的表达(如通过抑制转录和/或翻译)。可以通过常规的核苷酸互补性进行杂交而形成稳定的二联体,或者,如在反义核酸分子结合于DNA双链的情况下,通过在双螺旋大沟内的特定反应形成稳定二联体。通过如将反义核酸分子与可结合于细胞表面受体或抗原的肽或抗体相连,可以对反义分子进行修饰而使其能够特异性地与选择细胞表面的受体或抗原结合。也可使用本文描述的载体将反义核酸分子释放到细胞中。为达到细胞间反义分子的足够浓度,优选反义核酸分子置于原核、病毒或真核(包括植物)的强启动子调控下的载体构建体。
在另一个实施方案中,本发明的反义核酸分子为端基异构核酸分子。端基异构核酸分子与互补RNA形成特殊双链杂合体,其链不同于通常组合而是相互平行的(Gaultier等,1987,Nucleic Acids Res.156625-6641)。反义核酸分子也可含有2’-O-甲基核糖核苷(Inoue等,1987,Nucleic AcidsRes.156131-6148)或嵌合型RNA-DNA类似物(Inoue等,1987,FEBS Lett.215327-330)。
在另一个实施方案中,本发明的反义核酸为核酶。核酶为具有核糖核酸酶活性的催化性RNA分子,能够裂解与其具有互补区域的单链核酸(如mRNA)。因此,可以使用核酶(如锤头核酶(描述于Haselhoff & Gerlach,1988,Nature 334585-591))催化裂解LMP mRNA转录物而抑制LMPmRNA的翻译。可以根据本文公开的LMP cDNA核苷酸序列或根据本发明教导方法分离的异源性序列,设计对LMP编码核酸具有特异性的核酶。例如,可以构建四膜虫(Tetrahymena)L-19IVS RNA的衍生物,其中活性位点的核苷酸序列与LMP编码mRNA中将被切开的核苷酸序列互补(见如Cech等美国专利No.4,987,071 and 5,116,742)。也可以使用LMPmRNA从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(见如Bartel,D.和Szostak J.W.1993,Science 2611411-1418)。
还可以靶向LMP核苷酸序列调节区(例如LMP启动子和/或增强子)互补的核苷酸序列,通过形成可阻断靶细胞中LMP基因转录的三螺旋结构,从而抑制LMP的基因表达(主要见Helene C.,1991,Anticancer DrugDes.6569-84;Helene C.等,1992,Ann.N.Y.Acad.Sci.66027-36;以及Maher,L.J.,1992,Bioassays 14807-15)。
本发明的另一方面涉及含有LMP(或其部分)编码核酸的载体,优选表达载体。本文所用的术语“载体”是指能够将另一种核酸转运至其连接处的核酸分子。一种类型的载体为“质粒”,是指可以连入额外DNA片断的圆形双链DNA环。另一种载体为病毒载体,其中额外DNA片断可以连入病毒基因组。某些载体能够在导入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体以及游离型哺乳动物载体)。另一些载体(如非游离型哺乳动物载体)则在进入宿主细胞后整合入宿主细胞的基因组,从而可随着宿主基因组一同复制。此外,某些载体能够调控与之有效连接的基因的表达。这类载体在本文被称为“表达载体”。一般而言,用于重组DNA技术的表达载体通常以质粒的形式存在。在本说明书中,“质粒”和“载体”可以互换使用,因为质粒是最常用的载体形式。然而,本发明意图包括这些具有等同功能的其他形式的表达载体,例如病毒载体(如复制缺陷病毒、腺病毒和腺病毒相关病毒)。
本发明的重组表达载体包括以适于在宿主细胞中表达的形式存在的本发明的核酸,即重组表达载体中包含一个或多个与需要表达的核酸序列有效连接的调节序列,所述调节序列的选择根据用于表达的宿主细胞而定。本文所用涉及重组表达载体的“有效连接”,是指目的核苷酸序列与调节序列以允许该核苷酸序列表达的形式连接,两个序列互相融合而各自行使其预期功能(如在体外转录/翻译系统或在导入载体的宿主细胞中)。术语“调节序列”包括启动子、增强子以及其他表达控制元件(例如聚腺苷化信号)。这些调节序列描述于如Goeddel;《Gene Expression TechnologyMethodsin Enzymology 185》,Academic Press,San Diego,CA(1990)以及Gruber和Crosby的《Methods in Plant Molecular Biology and Biotechnolgy》,CRCPress,Boca Raton,Florida编Glick & Thompson,第7章,89-108(包括其参考文献)。调节序列包括那些能够在许多类型宿主细胞中指导核苷酸序列组成型表达的序列,以及那些只在某些宿主细胞中或某些条件下指导核苷酸序列表达的序列。本领域技术人员意识到,表达载体的设计取决于所要转化的宿主细胞的选择、期望达到的蛋白质表达水平等因素。可以将本发明的表达载体引入宿主细胞中,从而产生本文所述的核酸(例如LMP、LMP的突变体形式、融合蛋白等)编码的蛋白质或肽,包括融合蛋白或肽。
可设计本发明的重组表达载体用于在原核或真核细胞中表达LMP。例如,可将LMP基因表达于细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母及其他真菌细胞(见Romanos M.A.等,1992,Foreign gene expressionin yeasta review,Yeast 8423-488;在《More Gene Manipulations inFungi》,Bennet & Lasure编,396-428页Academic Pressan Diego中的“Heterologous gene expression in filamentous fungi”,van den Hondel,C.A.M.J.J.等,1991;以及Applied Molecular Genetics of Fungi,Peberdy等编,1-28页,Cambridge University PressCambridge中“Gene transfersystems and vector development for filamentous fungi”,van den Hondel和Punt,1991);藻类(Falciatore等,1999,Marine Biotechnology 1239-251);全毛亚纲(Holotrichia)、缘毛亚纲(Peritrichia)、旋唇亚纲(Spirotrichia)、吸管虫类纲(Suctoria)、四膜虫(Tetrahymena)、草履虫(Paramecium)、豆形虫(Colpidium)、瞬目虫(Glaucoma)、匙口虫(Platyophrya)、Potomacus、Pseudocohnilembus、游仆虫(Euplotes)、Engelmaniella以及尾棘虫(Stylonychia)属的纤毛虫(尤其是遵循WO 98/01572所述转化方法的带有载体的lemnae尾棘虫);以及多细胞植物细胞(见Schmidt和Willmitzer,1988,High efficiency Agrobacterium tumefaciens-mediatedtransformation Of Arabidopsis thaliana leaf and cotyledon plants,Plant CellRep.583-586;《Plant Molecular Biology and Biotechnology》,C Press,Boca Raton,Florida,6/7章,S.71-119(1993);发表于Transgenic Plants,卷1,Engineering and Utilization,Kung和Wu编,Academic Press 1993,128-43的“Techniques for Gene Transfer”,White,Jenes等;Potrykus,1991,Annu.Rev.Plant Physiol.Plant Mol.Biol.42205-225(及其引用的参考文献))或哺乳动物细胞。在Goeddel,《Gene Expression TechnologyMethodsin Enzymology 185》,Academic Press,San Diego,CA 1990中有对合适宿主细胞的进一步讨论。还可以在体外转录并翻译重组表达载体,例如使用T7启动子调节序列和T7聚合酶。
通常使用含有能够调控融合或非融合蛋白表达的组成型或诱导型启动子的载体在原核细胞中表达蛋白质。融合载体向其所编码蛋白质中添加若干氨基酸,通常是添加在重组蛋白的氨基端,但也可以添加到C-末端或融合入蛋白质的恰当区域。该融合载体一般可以实现以下一种或多种目的1)提高重组蛋白的表达;2)提高重组蛋白的溶解性;以及3)作为亲和纯化中的配体协助重组蛋白的纯化。在融合表达载体中,通常引入的蛋白水解裂解位点位于融合部分与重组蛋白的连接处,以使重组蛋白能够在融合蛋白纯化后与融合部分分离。这些酶及其同源识别序列包括Xa因子、凝血酶和肠激酶。
常用的融合表达载体包括分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A与目标重组蛋白融合的pGEX(Pharmacia Biotech Inc;Smith和Johnson,1988,Gene 6731-40)、pMAL(New England Biolabs,Beverly,MA)以及pRIT5(Pharmacia,Piscataway,NJ)。在一个实施方案中,将LMP编码序列克隆到pGEX表达载体中以产生编码融合蛋白的载体,所述融合蛋白从N-末端到C-末端包括GST-凝血酶裂解位点-X蛋白质。可以使用谷胱甘肽-琼脂糖树脂,通过亲和层析法纯化融合蛋白。可以利用凝血酶裂解融合蛋白来回收未与GST融合的重组LMP。
合适的非融合大肠杆菌E.coli诱导型表达载体的实例包括pTrc(Amann等,1988,Gene 69301-315)和pET 11d(Studier等,1990,《GeneExpression TechnologyMethods in Enzymology 185》,Academic Press,San Diego,California 60-89)。pTrc载体中的靶基因表达取决于杂合trp-lac融合启动子启动的宿主RNA聚合酶转录。而pET 11d中的靶基因表达则取决于共表达病毒RNA聚合酶(T7 gn1)介导的T7 gn10-lac融合启动子启动的转录。这一病毒聚合酶由宿主株BL21(DE3)或HMS174(DE3)从具有处于lacUV 5启动子转录控制下的T7 gn1基因的定居噬菌体提供。
最大化重组蛋白表达的策略之一是在对重组蛋白蛋白水解裂解能力缺陷的宿主细菌中表达该蛋白质(Gottesman S.,1990,《Gene ExpressionTechnologyMethods in Enzymology 185》119-128,Academic Press,SanDiego,California)。另一策略则为改变要插入表达载体的核酸的核酸序列,使每一氨基酸的个体密码子为选用于表达的细菌中优选使用的密码子(Wada等,1992,Nucleic Acids Res.202111-2118)。可以通过标准DNA合成技术完成对本发明核酸序列的此类改动。
在另一实施方案中,LMP表达载体为酵母表达载体。可用于在出芽酵母(S.cerevisiae)中表达的载体实例包括pYepSec1(Baldari等,1987,EmboJ.6229-234)、pMFa(Kurjan和Herskowitz,1982,Cell 30933-943)、pJRY88(Schultz等,1987,Gene 54113-123)以及pYES2(InvitrogenCorporation,San Diego,CA)。载体以及构建适用于其他真菌(如丝状真菌)的载体的方法,包括详述于《Applied Molecular Genetics of Fungi》,Peberdy等编,1-28页,Cambridge University PressCambridge中van denHondel和Punt,1991,“Gene transfer systems and vector development forfilamentous fungi中的载体和方法。
还可使用杆状病毒表达载体于昆虫细胞中表达本发明的LMP。可在培养的昆虫细胞(如Sf 9细胞)中表达的杆状病毒载体包括pAc系列(Smith等,1983,Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers,1989,Virology 17031-39)。
在另一实施方案中,使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的实例包括pCDM8(Seed,1987,Nature329840)和pMT2PC(Kaufman等,1987,EMBO J.6187-195)。当用于哺乳动物细胞时,通常使用病毒调节元件来提供表达载体的控制功能。例如,常用启动子来源于多瘤病毒、腺病毒2、巨细胞病毒以及猿病毒40。其他可同时用于原核及真核细胞的合适表达系统,见Sambrook,Fritsh和Maniatis,《Molecular CloningA Laboratory Manual.》第二版,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989第16及17章。
在另一实施方案中,可在单细胞植物细胞(如藻类,见Falciatore等,1999,Marine Biotechnology 1239-251及其参考文献)和高等植物的植物细胞(例如种子植物,如农作物)中表达本发明的LMP。植物表达载体的实例包括Becker、Kemper、Schell和Masterson(1992,Plant Mol.Biol.201195-1197),以及Bevan(1984,″Binary Agrobacterium vectors for planttransformation,Nucleic Acids Res.128711-8721;Transgenic Plants,卷1,Engineering and Utilization,Kung和R.Wu编辑,Academic Press,1993,S.15-38中的Vectors for Gene Transfer in Higher Plants)中详述者。
植物表达盒中优选含有有效连接的能够驱动植物细胞中基因表达的调节序列(包括聚腺苷化信号),从而使各序列可行使其功能(如终止转录)。优选的聚腺苷化序列来源于根瘤农杆菌(Agrobacterium tumefaciens)的t-DNA,如Ti-质粒pTiACH5章鱼碱合成酶的基因3(Gielen等,1984,EMBO J.3835)及其功能等效物,但在植物中具有功能活性的所有其他终止子也适用。
由于植物基因表达常常并不仅限于转录水平,植物表达盒优选含有其他有效连接的序列(如翻译增强子),如含有烟草花叶病毒5’非翻译前导序列的超驱动序列,从而提高蛋白质/RNA比率(Gallie等,1987,NucleicAcids Res.158693-8711)。
植物基因表达必须与合适的启动子有效连接,所述启动子使基因以适时的、细胞或组织特异性方式表达。优选可驱动组成型表达的启动子(Benfey等,1989,EMBO J.82195-2202),如那些来源于植物病毒的启动子,如35S CAMV(Franck等,1980,Cell 21285-294)、19S CaMV(也见US 5,352,605及WO 84/02913),或如来源于Rubisco小亚基的植物启动子(US 4,962,028所述)。更优选的为能在种子发育的所有或选择的阶段驱动LMP蛋白质表达的种子特异性启动子。种子特异性植物启动子为本领域普通技术人员公知,并可用种子特异性mRNA文库及表达程序技术对其进行鉴定和表征。种子特异性启动子包括但不仅限于油菜籽的napin基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等.1991,Mol.Gen.Genetics 225459-67)、拟南芥oleosin启动子(WO 98/45461)、菜豆(Phaseolus vulgaris)的菜豆蛋白启动子(US 5,504,200)、芸苔Bce4-启动子(WO9113980)或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant J.2233-239),以及可使单子叶植物(如玉米、大麦、小麦、裸麦、水稻等)进行种子特异性表达的启动子。值得注意的合适启动子为大麦的lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230),或WO 99/16890中所述的启动子(大麦的大麦醇溶蛋白基因启动子、水稻谷蛋白基因启动子、水稻水稻素基因启动子、水稻醇溶谷蛋白基因启动子、小麦醇溶蛋白基因启动子、小麦谷蛋白基因启动子、玉米醇溶蛋白基因启动子、燕麦谷蛋白基因启动子、高粱kasirin基因启动子以及裸麦黑麦精基因启动子)。
也可以通过诱导型启动子促进植物基因表达(综述可见Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.4889-108)。化学诱导型启动子特别适用于需要以时间特异性方式进行基因表达的情形。此类启动子的实例为水杨酸诱导的启动子(WO 95/19443)、四环素诱导的启动子(Gatz等,1992,Plant J.2397-404),以及乙醇诱导的启动子(WO93/21334)。
应答生物或非生物应激条件的启动子也是适用的启动子,例如病原诱导的PRP-1基因启动子(Ward等,1993,Plant.Mol.Biol.22361-366)、番茄热诱导的hsp80启动子(US 5,187,267)、马铃薯的冷诱导性α-淀粉酶启动子(WO 96/12814),以及创伤诱导的pinII-启动子(EP 375091)。
其他可用于植物基因表达盒的优选序列为将基因产物定位于其适当的细胞区室所必需的靶向序列(综述见Kermode 1996,Crit.Rev.Plant Sci.15285-423及其引用的参考文献),所述细胞区室如液泡、细胞核、所有类型的质体(如造粉体、叶绿体、有色体)、胞外空间、线粒体、内质网、油体、过氧化物酶体以及其他植物细胞区室。特别合适的启动子为那些可以启动质体特异性基因表达的启动子,因为质体是脂质生物合成的前体及某些终产物合成的场所。合适的启动子如病毒RNA-聚合酶启动子描述于WO 95/16783和WO 97/06250,而拟南芥的clpP启动子描述于WO99/46394。
本发明还提供了重组表达载体,其中含有以反义方向克隆到表达载体中的本发明DNA分子。即DNA分子以允许与LMP mRNA反义的RNA分子表达(通过DNA分子转录)的方式与调节序列有效连接。可以选择可在一系列细胞类型中调控反义RNA分子持续表达的序列,作为与反义方向克隆的核酸有效连接的调节序列,如病毒启动子和/或增强子;也可以选择指导反义RNA的组成型、组织特异性或细胞类型特异性表达的调控序列。反义表达载体的形式可为重组质粒、噬菌粒或减毒病毒,其中反义核酸的产生受到高效调节区域的调控,后者的活性通过引入载体的细胞类型而确定。利用反义基因调节基因表达的讨论见Weintraub等(1986,Antisense RNA as a molecular tool for genetic analysis,Reviews-Trends inGenetics,卷1)以及Mol等(1990,FEBS Lett.268427-430)。
本发明的另一方面涉及引入本发明重组表达载体的宿主细胞。本文术语“宿主细胞”和“重组宿主细胞”可互换使用。应当理解这些术语不仅仅指具体的受试细胞,也指该细胞的后代或潜在的后代。在传代中由于突变或环境影响会产生某些修饰,这些后代实际上可能与其亲代细胞不相同,但仍包括在本文所用的术语范围内。宿主细胞可以为任何原核或真核细胞。例如,可以在细菌细胞、昆虫细胞、真菌细胞、哺乳动物细胞(如中国地鼠卵巢细胞(CHO)或COS细胞)、藻类、纤毛虫或植物细胞中表达LMP。其他合适的宿主细胞为本领域技术人员所公知。
可以通过常规转化或转染技术将载体DNA引入原核或真核细胞中。本文所用的术语“转化”与“转染”、“结合”与“转导”是指将外源核酸(如DNA)引入宿主细胞的一系列领域内公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导转染、脂质转染法、天然感受态、化学介导的转移或电穿孔法。用于转化或转染宿主细胞(包括植物细胞)的合适方法可见于Sambrook等(1989,《Molecular CloningA Laboratory Manual.》2nd,ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY)以及其他实验手册如《Methods inMolecular Biology》1995,卷44,“Agrobacterium protocols”,Gartland和Davey编,Humana Press,Totowa,New Jerse y。
对于稳定转染哺乳动物及植物细胞而言,已知取决于所用表达载体和转染技术的不同,仅有一小部分细胞可能将外源DNA整合进自身基因组中。为了鉴定并选出这些整合体,一般将编码选择标记(如抗生素抗性)的基因与目的基因一起引入宿主细胞。优选的选择标记包括那些能产生药物(如G418、潮霉素、卡那霉素和甲氨蝶呤)抗性的标记,或能在植物中产生除草剂(如草甘膦或草胺磷)抗性的标记。可以在编码LMP的同一载体上向宿主细胞中引入编码选择性标记的核酸,或也可使用单独的载体引入。可以通过如药物选择(如整合选择标记基因的细胞能够存活,而其他细胞死亡)的方法鉴定被引入的核酸稳定转染的细胞。
为产生同源重组微生物,制备含有至少一部分LMP基因的载体,所述LMP基因中引入了缺失、添加或替换,以改变(如功能性破坏)该LMP基因。优选的LMP基因为拟南芥、油菜和向日葵LMP基因,但也可为相关植物或甚至哺乳动物、酵母或昆虫来源的同源物。在优选实施方案中,设计载体使内源性LMP基因在同源重组时被功能性破坏(即不再编码有功能蛋白质;也被称为敲除载体)。也可以设计载体,使内源性LMP基因在同源重组时发生突变或其他改变但仍然编码有功能蛋白质(如可以改变上游调节区域而改变内源LMP的表达)。可在嵌合修复技术中使用DNA-RNA杂合体,通过同源重组产生点突变(Cole-Strauss等,1999,Nucleic Acids Res.271323-1330以及Kmiec 1999,American Scientist87240-247)。拟南芥中的同源重组方法也为本领域所公知,是本文考虑使用的。
在同源重组载体中,LMP基因的变化部分在其5’和3’末端被LMP基因的额外核酸包围,从而使同源重组可以发生在载体所携带的外源性LMP基因与微生物或植物的内源性LMP基因之间。两侧的额外LMP核酸的长度足够与内源性基因进行成功的同源重组。一般而言,载体中含有数百碱基对至数千碱基的侧翼DNA(同时在5’和3’末端)(见如Thomas和Capecchi,1987,Cell 51503,for a description of homologousrecombination vectors)。将载体引入微生物或植物细胞中(如通过聚乙二醇介导DNA)。使用本领域公知的技术将导入的LMP基因与内源性LMP基因发生同源重组的细胞选择出来。
在另一实施方案中,可以产生含有能够调节性表达引入基因的所选系统的重组微生物。例如,将载体中的LMP基因置于lac操纵子的调控下,可以使LMP基因仅在IPTG存在时表达。此类调节系统为本领域所熟知。
可以使用本发明的宿主细胞(如培养中的原核或真核宿主细胞)生产(即表达)LMP。因此,本发明还提供利用本发明的宿主细胞生产LMP的方法。在一个实施方案中,该方法包括在适当的培养基中培养本发明的宿主细胞(其中已经引入编码LMP的重组表达载体,或该细胞中基因组中含有野生型或变化的LMP基因),直至产生LMP。在另一实施方案中,该方法还包括从所述培养基或宿主细胞中分离LMP。
本发明的另一方面涉及分离的LMP及其生物学活性部分。“分离”或“纯化”的蛋白质或其生物学活性部分中基本不含有使用重组DNA技术生产时的细胞材料,或采用化学合成时的化学前体或其他化学物。“基本不含有细胞材料”一词包括LMP制品,其中该蛋白质与天然或重组产生该蛋白质的细胞的细胞成分分开。在一个实施方案中,“基本不含有细胞材料”一词包括非LMP(本文也称为“杂质蛋白质”)含量少于约30%(干重),更优选非LMP含量少于约20%,更优选非LMP含量少于约10%,而最优选非LMP含量少于约5%的LMP制品。当重组生产LMP或其生物活性部分时,也优选其基本不含有培养基,即培养基少于蛋白质制品总量的约20%,更优选少于约10%,而最优选少于约5%。“基本不含有化学前体或其他化学物”一词包括LMP制品,其中该蛋白质与该蛋白质合成中涉及的化学前体或其他化学物分开。在一个实施方案中,“基本不含有化学前体或其他化学物”一词包括LMP制品中含有少于约30%(干重)化学前体或非LMP化学物,更优选化学前体或非LMP化学物少于约20%,更优选化学前体或非LMP化学物少于约10%,而最优选化学前体或非LMP化学物少于约5%的LMP制品。在优选实施方案中,分离蛋白质或其生物活性部分中不含有LMP来源生物相同的生物的杂质蛋白质。一般而言,通过如在拟南芥、油菜或向日葵以外的植物,或微生物、藻类或真菌中重组表达拟南芥、油菜或向日葵LMP,来制备此类蛋白质。
本发明的分离LMP或其生物活性部分能够参与产生拟南芥、油菜及向日葵中种子贮存化合物或细胞膜所必需的化合物代谢,或具有表3列出的一种或多种活性。在优选实施方案中,蛋白质或其部分包含与SEQ IDNO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ IDNO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ IDNO55、SEQ ID NO57、SEQ ID NO59或SEQ ID NO121所示的公开的核酸之一编码的氨基酸序列充分同源的氨基酸序列,从而使该蛋白质或其部分保留了参与拟南芥、油菜或向日葵中细胞膜构建或跨膜分子转运所必需的化合物代谢。蛋白质部分优选如本文所述的生物活性部分。在另一优选的实施方案中,本发明的LMP具有由本文公开的核酸之一编码的氨基酸序列。在另一优选实施方案中,LMP具有由多核苷酸序列编码的氨基酸序列,所述多核苷酸序列可与本文公开的核酸的之一杂交(如在严紧条件下杂交)。在另一优选实施方案中,LMP具有由核苷酸序列编码的氨基酸序列,所述氨基酸序列与本文公开的核酸编码的氨基酸序列之间的同源性至少为约50-60%,优选至少约60-70%,更优选至少约70-80%、80-90%或90-95%,甚至更为优选至少约96%、97%、98%、99%或更高。本发明的优选LMP也优选具有本文所述的至少一种LMP活性。例如,本发明的优选LMP包括由可与本文公开的核酸之一杂交(如在严紧条件下杂交)的核苷酸序列编码的氨基酸序列,且能够参与拟南芥、油菜或向日葵中细胞膜构建或跨膜分子转运所必需的化合物代谢,或具有表3列出的一种或多种活性。
在其他实施方案中,LMP与SEQ ID NO1、SEQ ID NO3、SEQ IDNO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ IDNO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ IDNO59或SEQ ID NO121所示的核酸序列编码的氨基酸序列充分同源,正如前文所详述,虽然在氨基酸序列上由于天然变异或诱变有所不同,但还是保留了由该序列编码蛋白质的功能活性。因此,在另一实施方案中,LMP为含有氨基酸序列的蛋白质,所述氨基酸序列与完整氨基酸序列之间的同源性至少为约50-60%,优选至少约60-70%,更优选至少约70-80%、80-90%或90-95%,甚至更为优选至少约96%、97%、98%、99%或更高,并具有本文所述的至少一种LMP活性。在另一个实施方案中,本发明涉及全长拟南芥、油菜或向日葵蛋白质,其与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ IDNO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ IDNO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59或SEQ ID NO121所示的核酸序列编码的完整氨基酸序列充分同源。
可以使用显性失活突变或反式显性抑制来降低LMP在转基因种子中的活性,以改变种子贮存化合物的水平。为此,产生能够消除LMP活性的突变,并在转基因植物中过表达无活性的非功能性LMP基因。无活性的反式显性LMP蛋白质与活性内源性LMP蛋白质竞争底物或与其他蛋白质发生反应,而稀释活性LMP的活性。通过这一途径可以降低LMP的生物学活性而不必实际改变内源性LMP的基因表达。Pontier等使用这一策略以调节植物转录因子的活性(Pontier等,2001,Plant J.27(6)529-38)。
可以通过诱变(例如离散的点突变或截短LMP)产生LMP同系物。本文所用的术语“同系物”是指用作LMP活性激动剂或拮抗剂的LMP变异体形式。LMP激动剂能够保留与LMP基本相同的生物学活性或其活性的子集。LMP拮抗剂能够通过如竞争性结合包括LMP在内的细胞膜成分代谢级联反应中的上游或下游成员、或通过与介导化合物跨膜转运的LMP结合来抑制LMP天然形式的一种或多种活性,从而阻止转位的发生。
在另一个实施方案中,可以通过在LMP突变体(如截短突变体)组合库中筛查LMP激动剂或拮抗剂活性,确定LMP的同系物。在一个实施方案中,通过在核酸水平组合诱变构建LMP变异体杂合文库,该LMP变异体杂合文库由一个杂合的基因文库编码而成。可以通过如将合成寡核苷酸混合物以酶连接于基因序列的方法产生LMP变异体杂合文库,从而使一系列简并的潜在LMP序列可以单个多肽的形式表达,或者以一系列更大的含所述LMP序列的融合蛋白(如对于噬菌体展示文库而言)的形式表达。有很多种方法可以用于从简并的寡核苷酸序列中产生潜在的LMP同系物文库。可以在自动DNA合成仪中完成简并的基因序列的化学合成,然后将合成基因连入合适的表达载体中。使用基因的简并集可以在一个混合物中提供编码所需潜在LMP序列集的所有编码序列。合成简并寡核苷酸的方法为本领域所公知(见如Narang,1983,Tetrahedron 393;Itakura等,1984,Annu.Rev.Biochem.53323;Itakura等,1984,Science 1981056;Ike等,1983,Nucleic Acids Res.11477)。
此外,可以利用LMP编码序列的片断文库建立LMP片断的杂合种群,用于筛选及随后选择LMP的同系物。在一个实施方案中,可以用核酸酶在每分子仅发生约一次切口形成的条件下处理LMP编码序列的双链PCR片断,将该双链DNA变性,复性DNA以形成含有来自不同切口产物正义/反义对的双链DNA,用S1核酸酶处理去除再形成双链体中的单链部分,并将所产生的片断文库连入表达载体,从而建立编码序列的片断文库。通过这种方法,可以产生编码LMP N-末端、C-末端及大小不等的内部片断的表达文库。
已知本领域有若干技术可用于筛选通过点突变或截短产生的组合文库的基因产物,以及在cDNA文库中筛选具有所选性质的基因产物。这些技术适用于快速筛选由组合诱变LMP同系物产生的基因文库。可用于高通量分析筛查大型基因库的使用最广泛的技术一般包括将基因文库克隆到可复制的表达载体中,用所得的载体文库转化适当的细胞,并在一定条件下表达组合基因,所述条件性,目的活性的检测有助于分离编码其产物被检测的基因的载体。循环组合诱变(recursive ensemble mutagenesis,REM),一项能够增加文库中功能性突变体频率的新技术,也可与筛查测定法组合使用鉴定LMP同系物(Arkin和Yourvan,1992,Proc.Natl.Acad.Sci.USA897811-7815;Delgrave等,1993,Protein Engineering 6327-331)。
在另一实施方案中,可以使用本领域熟知的方法,利用基于细胞的测定法分析杂合LMP文库。
本文所述的核酸分子、蛋白质、蛋白质同系物、融合蛋白、引物、载体以及宿主细胞可以用于以下一种或多种方法鉴定拟南芥、油菜、向日葵及相关生物;绘制拟南芥、油菜或向日葵相关生物的基因组图谱;鉴定并定位拟南芥、油菜或向日葵中的目的序列;进化研究;确定LMP功能所需的区域;调控LMP活性;调控一种或多种细胞功能的代谢;调控一种或多种化合物的跨膜转运;以及调控种子贮存化合物的积累。
植物拟南芥代表了高等(或种子)植物的一员。它与如油菜、向日葵和大豆等其他植物相关,都需要光来驱动光合作用及生长。植物如拟南芥和油菜在DNA序列和多肽水平上具有高度同源性,从而能够利用其他植物或生物来源的探针对DNA分子进行异源筛选,进而能够推出适用于在第3种物质中异源筛选或解释功能并预测基因功能的共有序列。因此,鉴定这类功能的能力具有重要实用性,如预测酶的底物特异性。此外,这些核酸分子可以用作绘制拟南芥基因组或相关生物基因组图谱的参照点。
本发明的LMP核酸分子具有多种用途。首先,可以使用这些核酸分子鉴定一种生物是否为拟南芥、油菜或向日葵或与它们紧密相关。它们还可以用于在微生物的混合种群中鉴定拟南芥、油菜或向日葵或其相关生物的存在。本发明提供了若干拟南芥、油菜及向日葵基因的核酸序列;用探针在严紧条件下与单一或混合种群微生物的培养物的提取基因组DNA杂交,能够确定该生物是否存在,所述探针涵盖拟南芥、油菜或向日葵的生物独特的基因区域。
此外,本发明的核酸及蛋白质分子也可作为基因组特定区域的标志。这不仅可用于绘制基因组图谱,也可用于拟南芥、油菜和向日葵的蛋白质的功能研究。例如,为了鉴定某一特定的拟南芥、油菜或向日葵DNA结合蛋白的基因组结合区域,可以消化拟南芥、油菜或向日葵的基因组,并将其片断与DNA结合蛋白孵育。可进一步用本发明的核酸分子(优选具有易检测标记的核酸分子)作为探针与那些与蛋白质结合的片断杂交;此类核酸分子与基因组片断的结合能够在拟南芥、油菜或向日葵的基因组图谱上定位该片断,当用不同的酶进行多次重复时,还有助于快速确定蛋白质结合的核酸序列。此外,本发明的核酸分子可能与相关种系的序列有充分的同源性,使得这些核酸分子可以用作构建相关植物基因组图谱的标记物。与之类似,可以确定本发明拟南芥、油菜及向日葵的RNA结合蛋白与mRNA序列的结合。在功能性研究的另一实施例中,涉及蛋白水解和蛋白质稳定性的本发明的拟南芥、油菜及向日葵蛋白质可以用于在蛋白质-蛋白质相互作用测定中鉴定配偶体,例如在蓝色非变性凝胶或酵母双杂交筛选中。
本发明的LMP核酸分子也可用于进化和蛋白质结构研究。多种原核及真核细胞使用本发明分子所参与的代谢和转运过程;通过比较本发明的核酸分子序列与其他生物中那些编码相似酶的核酸分子序列,能够评价生物之间的进化相关性。与之类似,这样的比较能够评价序列中哪些为保守区域而哪些不是,可能有助于确定那些对于酶功能至关重要的蛋白质区域。这种确定对于蛋白质遗传工程研究具有一定价值,可能会提示该蛋白质在不丧失功能的前提下能够耐受怎样的诱变。
对于本发明LMP核酸分子的操作可能会导致产生与野生型LMP功能有所差异的LMP。这些蛋白质可能在效用或活性上有所改善、可能在细胞中以高于正常的数量存在,也可能效用或活性有所降低。
本发明LMP的改变可以通过几种机制直接影响种子贮存化合物的累积。在表达LMP的植物中,转运的增加会导致化合物累积的改变和/或植物组织及器官中的溶质分配(partitioning),最终在种子发育过程中影响一种或多种种子贮存化合物的累积。Mitsukawa等(1997,Proc.Natl.Acad.Sci.USA 947098-7102)提供了一个实例,其中在烟草培养细胞中过表达拟南芥高亲和力磷酸盐转运体基因,增强了磷酸盐限制条件下的细胞生长。磷酸盐的可利用性也显著影响糖和代谢中间物的产生(Hurry等,2000,Plant J.24383-396)以及叶和根中的脂质组成(Hrtel等,2000,Proc.Natl.Acad.Sci.USA 9710649-10654)。与之类似,已经证实植物乙酰辅酶A羧化酶(ACCase)的活性受到磷酸化调节(Savage和Ohlrogge,1999,Plant J.18521-527),且作用于ACCase的激酶和磷酸酶(LMP)的活性改变,会导致种子脂质累积水平的提高或降低。此外,叶绿体包膜上存在脂质激酶活性提示信号转导路径和/或膜蛋白质的调节发生在包膜上(见如Müller等,2000,J.Biol.Chem.27519475-19481及其所中所引文献)。ABI1和ABI2基因编码的两个蛋白质丝氨酸/苏氨酸磷酸酶2C为脱落酸代谢途径的调节物,因此见于种子发育的早期和晚期阶段(如Merlot等,2001,Plant J.25295-303)。更多实例也可见前文“背景技术”章节。
本发明也提供了可与本文公开或描述的核酸编码的LMP多肽或其部分特异性结合的抗体。
可以通过许多众所周知的方法制备抗体(见如Harlow和Lane,《Antibodies;A Laboratory Manual》Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1988)。简言之,可将纯化抗原以足以激发免疫反应的量和间隔注射到动物体内。可直接纯化抗体,也可从动物中获取脾脏细胞。然后将这些细胞与不死细胞系融合并筛查其抗体分泌。这些抗体可以用于筛选核酸克隆文库以寻找分泌该抗原的细胞。随后可对阳性克隆进行测序(见如Kelly等,1992,Bio/Technology 10163-167;Bebbington等,1992,Bio/Technology 10169-175)。
短语与多肽“选择性结合”是指对于蛋白质在异源性蛋白质或其他生物制品种群中是否存在具有确定性的结合反应。因此,在指定的免疫测定条件下,与特定蛋白质结合的具体抗体并不会与该样品中的其他蛋白质发生显著量的结合。在此类条件下与抗体的选择性结合可能需要选择一种对特定蛋白质有特异性的抗体。有很多免疫测定方法可用于选择能够与特定蛋白质选择性结合的抗体。例如,常规使用固相ELISA免疫测定法选择可与蛋白质发生选择性免疫反应的抗体。见Harlow和Lane《Antibodies,ALaboratory Manual》Cold Spring Harbor Publications,New York(1988)中关于可用于测定选择性结合的免疫测定方法和条件的描述。
某些情况下需要从多种宿主中制备单克隆抗体。制备此类单克隆抗体的技术描述可见于Stites等编《Basic and Clinical Immunology》(LangeMedical Publications,Los Altos,Calif.,第四版)及其所引参考文献,以及Harlow和Lane(《Antibodies,A Laboratory Manual》Cold Spring HarborPublications,New York,1988)。
本申请参考了多种出版物。所有这些出版物及其中所引用的参考文献的公开内容在此申请中全文引用作为参考,以便更详细地说明本发明所涉及领域的状况。
对本领域技术人员而言,显然可以对本发明进行多种修饰和改变而不背离本发明的范围或精神。参考本文公开的说明和本发明实践,本发明的其他实施方案对于本领域技术人员而言是显而易见的。应当理解说明和实施例均为例证性的,本发明的确切范围和精神参见本文的权利要求书。
实施例实施例1一般步骤a)一般克隆步骤根据Sambrook等(1989,Cold Spring Harbor Laboratory PressISBN0-87969-309-6)或Kaiser、Michaelis和Mitchell(1994,《Methods in YeastGenetics》,Cold Spring Harbor Laboratory PressISBN 0-87969-451-3)中所述实施克隆步骤,例如限制性切割、琼脂糖凝胶电泳、DNA片断纯化、转运核酸至硝化纤维和尼龙膜上、DNA片断连接、大肠杆菌和酵母细胞的转化、细菌生长以及重组DNA的序列分析。
b)化学物若非文中另有说明,所用化学物为来自Fluka(Neu-Ulm)、Merck(Darmstadt)、Roth(Karlsruhe)、Serva(Heidelberg)以及Sigma(Deisenhofen)公司的p.a.质量级产品。使用来自Milli-Q水系统水纯化工厂(Millipore,Eschborn)的纯化的无致热原的水(下文称为H2O)配制溶液。限制性内切酶、DNA修饰酶以及分子生物性试剂盒获自AGS(Heidelberg)、Amersham(Braunschweig)、Biometra(Gttingen)、Boehringer(Mannheim)、Genomed(Bad Oeynnhausen)、New EnglandBiolabs(Schwalbach/Taunus)、Novagen(Madison,Wisconsin,USA)、Perkin-Elmer(Weiterstadt)、Pharmacia(Freiburg)、Qiagen(Hilden)及Stratagene(Amsterdam,Netherlands)公司。除非另有说明,均根据生产商的说明使用它们。
c)植物材料拟南芥种子来自拟南芥贮藏中心。使用Columbia 0及Landsberg erecta生态型分析发育早期至中期(开花后1至8天)的种子和长角果至晚期种子和长角果(开花后8至15天)。
油菜Westar变种本研究使用cv.Westar油菜植物分离发育种子。于开花后3-5周收集发育种荚中的种子。
油菜AC Excel和Cresor变种本研究使用AC Excel和Cresor油菜构建cDNA文库。收集植物的种子、种荚、花、叶、茎以及根组织,在某些情况下进行暗、盐、热或干燥处理。然而,本研究集中于种子和种荚组织在cDNA文库中的用途。
向日葵Sigma变种本研究使用Sigma向日葵植物构建发育种子的cDNA文库。
d)植物生长拟南芥如Focks和Benning(1998,Plant Physiol.11891-101)所述,在标准条件下将植物生长于土壤中。
油菜Westar变种将植物生长于田间或补充光照的温室Metromix(Scotts,Marysville,OH)中。
油菜AC Excel和Cresor变种将植物(AC Excel,除非另有提及)于22℃、14/10光/暗周期下生长于Metromix(Scotts,Marysville,OH)中。收集本研究的6份目的种子和种荚组织以构建以下cDNA文库未成熟种子、成熟种子、未成熟种荚、成熟种荚、夜间收获种荚以及Cresor变种(高芥子酸)种子。在特定时间点内收集每一发育组织的组织样品,合并时间框内的多份样品进行最终总RNA提取。于开花后1-25天(daa)采集来自未成熟种子的样品,25-50daa采集成熟种子样品,1-15daa采集未成熟种荚样品,15-50daa成熟种荚样品,夜间收获的种荚样品采自1-50daa,而Cresor种子样品采自5-25daa。
向日葵将植物于25℃、辅助光照14/10光/暗周期下生长于温室的Metromix(Scotts,Marysville,OH)中。在向日葵花盘最外缘的第一批花开后6-8天、13-16天以及24-26天,用镊子将发育的种子从向日葵花上小心取下。
实施例2从植物中分离总DNA分离总DNA的细节涉及处理1g鲜重的植物材料。
CTAB缓冲液2%(w/v)N-cethyl-N,N,N-三甲基溴化铵(CTAB);100mM Tris HCl pH 8.0;1.4M NaCl;20mM EDTA.N-十二烷基肌氨酸缓冲液10%(w/v)N-十二烷基肌氨酸;100mM Tris HCl pH 8.0;20mMEDTA。
将植物材料于液氮中用研钵研磨为细粉,并将其转移至2mlEppendorf管中。随后用一层1ml的分解缓冲液(1ml CTAB缓冲液,100μlN-十二烷基肌氨酸缓冲液,20μlβ-巯基乙醇以及10mg/ml的蛋白酶K溶液10μl)冰冻植物材料,并在60℃下连续振荡孵育1小时。将所得匀浆分装到两个Eppendorf管(2ml)中,并用相同体积的氯仿/异戊基乙醇(24∶1)振荡提取两次。每次均在8000g、室温下离心15分钟,使两相分开。然后使用冰冷的异丙醇在-70℃下沉淀30分钟。将沉淀的DNA在4℃、10,000g下离心30分钟取沉淀,并重悬浮于180μl TE缓冲液中(Sambrook等,1989,Cold Spring Harbor Laboratory PressISBN 0-87969-309-6)。为进一步纯化,用NaCl(终浓度1.2M)处理DNA,并用两倍体积的纯乙醇在-70℃下再次沉淀30分钟。用70%乙醇洗涤后,干燥DNA并随即溶于50μl H2O+RNAse(终浓度50mg/ml)。DNA在4℃下溶解过夜,并于其后在37℃下RNAse消化1小时。4℃保存DNA。
实施例3从植物中分离总RNA及聚腺苷+RNA拟南芥分离总RNA及聚腺苷+RNA以便于研究转录物。根据以下步骤从拟南芥植物的长角果中分离RNA从拟南芥种子中制备RNA-“热”提取缓冲液、酶及溶液-2MKCl-蛋白酶K-苯酚(RNA用)-氯仿异戊基乙醇(苯酚∶氯仿1∶1;调节pH适于RNA)-4MLiCl,DEPC-处理后-DEPC-处理水-3MNaOAc,pH 5,DEPC-处理后-异丙醇-70%乙醇(DEPC-处理水配制)-重悬浮缓冲液0.5%SDS,10mM Tris pH 7.5,DEPC-处理水配制的1mM EDTA(该溶液无法用DEPC-处理)
-提取缓冲液0.2M硼酸钠30mM EDTA30mM EGTA1%SDS(每2.5ml缓冲液250μl 10%SDS-溶液)1%脱氧胆酸盐(2,5ml缓冲液中含25mg)2%PVPP(不可溶-每2.5ml缓冲液50mg)2%PVP 40K(每2.5ml缓冲液50mg)10mM DTT100mMβ-巯基乙醇(新鲜、烟熏罩下处理-每5ml缓冲液使用35μl14.3M的溶液)提取加热提取缓冲液至80℃。在液氮冷却的研钵中研磨组织,并将组织粉末转移到1.5ml的试管中。冷冻保存组织直至加入缓冲液;转移样品应当使用预冷的匙突;而试管应当时刻保留在液氮中。然后向试管中加入350μl预热的提取缓冲液(对于较大样品,每100mg组织加入缓冲液体积可大至500μl),振荡样品;将试管加热至80℃约1分钟后留存于冰上。振荡样品并用电研钵再次研磨。
消化加入蛋白酶K(0.15mg/100mg组织),振荡混合物后在37℃下保留1小时。
第一次纯化为纯化样品,向其中加入27μl 2M KCl。将样品在冰上冰冻10分钟,随后以12,000rpm室温下离心10分钟。将上清液转移到不含RNAase的新试管中,进行一次苯酚提取,然后用氯仿∶异戊基乙醇提取。向上清液中加入1体积异丙醇,在冰上冰冻混合物10分钟。通过离心(室温下7000rpm,10分钟)沉淀RNA。振荡混合物10至15分钟,将沉淀溶解于1ml4M LiCl溶液中。离心5分钟沉淀RNA。
第二次纯化将沉淀重悬浮于500μl重悬浮缓冲液中。加入500μl苯酚后振荡混合物。然后加入250μl氯仿∶异戊基乙醇;振荡混合物并离心5分钟。将上清液转移至新试管中。重复氯仿∶异戊基乙醇提取直至界面清晰。将上清液转移到新试管中并加入1/10体积pH为5的3M NaOAc以及600μl异丙醇。在-20℃下保存混合物20分钟或更久。离心10分钟沉淀RNA,并用70%乙醇将沉淀洗涤一次。移除所有剩余乙醇后将沉淀溶解在15至20μlDEPC-处理水中。在260nm和280nm处测量1∶200稀释液的吸光度对RNA定量定性(40μg RNA/ml=1OD260)。
利用Amersham Pharmacia Biotech mRNA纯化试剂盒(运用寡脱氧胸苷-纤维素柱)从总RNA中制备mRNA。
按照生产商说明使用Dyna Beads(Dynal,Oslo,Norway)分离聚腺苷+RNA。确定RNA或聚腺苷+RNA的浓度后,加入1/10体积pH4.6的3M醋酸钠及2倍体积乙醇沉淀RNA,并于-70℃保存。
油菜从豆荚中分离种子产生用于种子和种荚cDNA文库的均一材料。在液氮中用研钵将组织研磨成细粉,并转移至50ml试管中。-80℃保存组织样品直至进行提取。根据生产商说明使用RNeasy Maxi试剂盒(Qiagen)从组织中提取总RNA,也根据生产商说明、利用Oligotex mRNA纯化系统试剂盒(Qiagen)将mRNA从总RNA中分离出来。将mRNA送至HyseqPharmaceuticals Incorporated(Sunnyville,CA)以进一步将来自各组织类型的mRNA加工成cDNA文库,并使用他们特有的方法,其中相似的插入物在质粒中基于杂交模式串联。
向日葵在液氮中使用研钵将种子研磨成细粉,并转移至50ml试管中。-80℃保存组织样品直至进行提取。根据生产商说明使用RNeasy Maxi试剂盒(Qiagen)从组织中提取总RNA,也根据生产商说明、利用Oligotex mRNA纯化系统试剂盒(Qiagen)将mRNA从总RNA中分离出来。将mRNA送至Hyseq Pharmaceuticals Incorporated(Sunnyville,CA)以进一步将来自各种子发育阶段的mRNA加工成cDNA文库,并使用他们特有的方法,其中相似的插入物在质粒中基于杂交模式串联。
实施例4构建cDNA文库为构建cDNA文库,使用鼠白血病病毒(Murine Leukemia Virus)逆转录酶(Roche,Mannheim,Germany)以及寡脱氧胸苷引物合成第一条链,于12℃、16℃和22℃下与DNA聚合酶I、Klenow酶和RNA酶H消化产物分别孵育2小时、1小时及1小时,制备第二条链。在65℃下孵育10分钟终止反应后转移至冰上。利用T4 DNA聚合酶(Roche,Mannheim)在37℃下钝化双链DNA分子30分钟。通过苯酚/氯仿抽提以及Sephadex G50旋转柱移除核苷酸。用T4DNA连接酶(Roche,12℃过夜)将EcoRI连接物(Pharmacia,Freiburg,Germany)连接到cDNA末端上,并与多核苷酸激酶孵育(Roche,37℃,30分钟)进行磷酸化。用低熔点琼脂糖凝胶分离该混合物。从凝胶中洗脱大于300碱基对的DNA分子、苯酚抽提、在Elutip-D柱(Schleicher和Schuell,Dassel,Germany)上浓缩、与载体臂连接,并根据生产商的说明,利用Gigapack Gold试剂盒(Stratagene,Amsterdam,Netherlands)及材料将之装入λZAPII噬菌体或λZAP表达噬菌体。
油菜和向日葵的cDNA文库产生于Hyseq PharmaceuticalsIncorporated(Sunnyville,CA)。在产生文库时未使用扩增步骤,以保留表达信息。Hyseq′s基因组方法包括将基因分组成簇并对每簇中的代表成员测序。使用寡脱氧胸苷柱纯化的mRNA产生cDNA文库。随机挑取用cDNA文库转化的大肠杆菌菌落,PCR扩增插入的cDNA,并点在尼龙膜上。用33p放射性标记的寡核苷酸杂交克隆,产生的杂交模式则确定某一特定克隆属于哪一组群。获取cDNA克隆及其DNA序列以用于在转基因植物中过表达及本文所述的其他分子生物学方法中。
实施例5鉴定目的LMP基因拟南芥使用Lynx Therapeutics Inc.的MegasortTM和MPSS技术鉴定拟南芥中潜在的靶基因。MegaSort为一种“微珠”技术,可在相同数目的微珠上同时收集数以百万计的克隆(见Brenner等,1999,Proc.Natl.Acad.Sci.USA971665-1670)。根据基因在拟南芥种子和长角果不同发育阶段的分化表达对之进行鉴定。使用标准方法从野生型及突变体根中分离RNA和mRNA。MegaSor技术能够在对基因没有预先了解的情况下鉴定两种mRNA样品中的过表达和低表达克隆,因此可用于发现分化表达的LMP蛋白质编码基因。MPSS技术能够在mRNA样品中对mRNA转录物定量(见如Brenner等,Nat.Biotechnol.18630-4),可用于获取不同种子发育阶段的表达类型。
油菜通过Hyseq成簇方法获取RNA表达类型的数据。选择种子文库中相对于其他组织文库表现出75%或更高表达水平的克隆,作为LMP候选基因。根据其表达类型选择油菜克隆。使用BLAST和FASTA搜索鉴定拟南芥来源的同源性序列,并从拟南芥cDNA中分离出其相应的LMP(SEQ IDNO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57以及SEQ ID NO59)(见下文实施例7和10)。
向日葵通过Hyseq成簇方法获取RNA表达类型的数据。基于PFAM和BLOCKS分析序列得到的预测基序和结构域,选择用于在拟南芥中过表达的向日葵克隆。
实施例6鉴定拟南芥和改良油菜发育种子中油体和微粒体相关的蛋白质从发育的油类种子中分离油体和微粒体缓冲液和溶液1.抽提缓冲液150mM Tris,pH 7.510mMKCl1.5mM EDTA0.1mMMgCl215%w/v蔗糖2.离心缓冲液50mM Tris,pH7.510mMKCl1.5mM EDTA0.1mMMgCl210%w/v蔗糖3.梯度缓冲液(10、19、38或52)50mM Tris pH7.510mMKCl1.5mM EDTA0.1mMMgCl2加以下任一种10%w/v蔗糖,或
19%w/v蔗糖,或38%w/v蔗糖,或52%w/v蔗糖在冰上用刀片将拟南芥或油菜的全绿色长角果打开,小心取出所有亮绿色的发育种子并置于预冷的提取缓冲液中。只选用亮绿色不带有褐色或黄色斑点、实心一致(与幼种不同)的种子。使用标准家用匀浆器、刀片、砧板以及玻璃匀浆器将种子匀浆。这一过程在冰上冷环境中进行,需经常中止以避免匀浆变热。对于较小的拟南芥种子,立即使用玻璃匀浆器。
在预冷的设备中用2层Miracloth(Calbiochem,California,USA)过滤匀浆物。然后将过滤的匀浆转移到SW28转子的离心试管中,涂上焦油并在Beckman Ultrafuge(Beckman Coulter,Fullerton,California,USA)中、4℃、以8,000rpm离心45分钟。弃去沉淀;将顶层的所有液体和油体层再次匀浆,并转移到新的离心试管中,在相同的超高速离心机内、4℃、以25,000rpm离心1小时。
从顶部移去产生的脂质体层,重悬浮于离心缓冲液中,用玻璃匀浆器匀浆并在25,000rpm、4℃下再次离心1小时。重复这一步骤直至油体呈奶油白色。随后取出之并冷冻保存直至脂质提取。
保留第一次25,000rpm离心得到的沉淀,并重悬浮于含52%蔗糖的4ml梯度缓冲液中。将悬浮液转移至SW28转子离心试管的底部。将含38%蔗糖的10ml梯度缓冲液小心铺在悬浮液上,然后覆上一层含19%蔗糖的梯度缓冲液,再覆上一层含10%蔗糖的梯度缓冲液。在4℃、25,000rpm下超速离心过夜。以制动器停止离心防止扰乱界面和相层。在不同层的界面上,用注射器取出白色至奶油色的微粒体层和蛋白质层,离心缓冲液稀释并通过离心沉淀之。立即使用该沉淀或冰冻保存直至脂质提取。
从油体和微粒体中抽提脂质溶液·100mM Tris饱和的苯酚(Aquaphenol),pH 8.0
·100mM Tris缓冲液,pH 8.0·0.1M醋酸铵的甲醇溶液等体积混合pH为8的Tris缓冲液和苯酚(Tris饱和,pH 8)。在脂质提取前向Tris-苯酚混合物中加入5%(v/v)巯基乙醇。每100mg冰冻或新鲜样品(油体或微粒体)中加入1ml巯基乙醇-Tris-苯酚,4℃下充分混合样品1小时(搅拌子,旋转摇动)。加入等体积pH 8.0的Tris缓冲液,并于4℃下再次混合30分钟.随后在4℃、约1,000g下离心混合物15分钟。使用注射器或吸液管将底层(即苯酚层)转移到新的50ml试管中而不带任何界面物质。然后加入4体积的醋酸铵甲醇溶液,20℃冰冻过夜沉淀样品。沉淀后将样品离心(4℃、约1,000g,30分钟)并获取沉淀。将沉淀用20ml醋酸铵甲醇溶液洗涤两次(离心同前)。对于油体而言,用巯基乙醇-Tri-苯酚再次抽提得到的沉淀;对于微粒体而言,直接用10ml甲醇洗涤沉淀3次(离心同前)。所得的沉淀加入少量甲醇在4℃下保存直至蛋白质定量和2D凝胶电泳。
蛋白质定量使用蛋白质测定试剂盒(Sigma)测定蛋白质的量。根据生产商的说明,使用TCA沉淀蛋白质样品。
等电聚焦电泳——第一向使用新制的缓冲液,再水化的IEF胶条(例如固定干胶条,pH 4-7,24厘米,Amersham)再水化缓冲液-14,41g(8M)尿素-4,57g(2M)硫脲-92,52mg(20mM)二硫代苏糖醇(DTT)-300mg(1%)CHAPS去垢剂-156μl Ampholine(Amersham)pH3、5-10
-去离子水补至30ml一般400-1500μg蛋白质用于考马斯染色的制备型2D凝胶。用再水化缓冲液稀释所需量的蛋白质溶液直至总体积为600μl并充分旋转。沿Immobiline DryStrip Reswelling Trays(Amersham)的凹槽涂布溶液。移开IEF胶条的防护盖,并将胶条的凝胶面向下小心置于盘中,确保其与样品溶液接触良好且溶液与条带之间不存在气泡。当完全放好条带后,封闭电泳槽(以防挥发)并在环境温度下留置24小时。
24小时后从电泳槽中取出条带,用湿的Whatman 3号滤纸拍至稍干,并将其凝胶面向上置入Multiphor chamber(Pharmacia)的“固定干胶盘”中。然后加入90至100ml覆盖液(DryStrip Cover Fluid,Amersham)。用dH2O浸湿两电极条带,用纸制品除去多余的水。在条带的负极和正极侧,将电极条带之一与凝胶条带交叉放置。保持电极原位并关闭电泳槽,根据表5所示的方法聚焦电泳。
表5等电聚焦参数

在聚焦的最后阶段,中断电流,打开电泳槽,并在润湿的薄片上轻拍凝胶条带除去覆盖液。凝胶条带可即刻使用,或必要时将其在-80℃下保存直至再次使用。
SDS-聚丙烯酰胺凝胶电泳(PAGE)--第二向制备Ettan DALT-II电泳槽先用7.5l dH2O填充电泳槽。打开控制单位和泵,并加入75ml浓缩阳极缓冲液(Ettan DALT II Buffer Kit,Amersham)。将2D凝胶(预凝的Ettan DALT II型凝胶(12.5%),Amersham)和2毫升凝胶缓冲溶液放入胶框,用普通壁纸滚筒除去多余的凝胶溶液,并且闭合胶框。倾斜胶框倒掉多余的缓冲溶液。用85℃熔化的琼脂糖封闭胶框左侧及右侧。去离子水润湿胶框的末端并将胶框插入Ettan DALT电泳槽中。用1∶10稀释的阴极缓冲溶液(Ettan DALT II Buffer Kit,.Amersham)填充电泳槽至标记线。
平衡胶条平衡储存缓冲液-36g(6M)尿素-30g(30%)甘油-2g(2%)SDS-3.3mlTris-HCl缓冲溶液PH8.8(18.2g(1.5M)Tris/HCl,0.4g(0.4%)SDS,pH8.8,加入去离子水至100ml)-加入去离子水至100毫升DTT平衡缓冲液(每一胶条)-4ml平衡储存缓冲液-20μl溴酚蓝溶液(30mg溴酚蓝溶于pH 8.8的10mlTris/HCl缓冲液)-200μl DTT储存溶液(200mg DTT+1ml去离子水)Jodacetamide平衡缓冲溶液(每一胶条)-4ml平衡储存缓冲液-20μl溴酚蓝溶液-192mg(260mM)Jodacetamide将凝胶条胶面向上放入平衡盘中。先加入4ml DTT平衡缓冲液,于旋转振荡仪将振荡平衡盘15分钟。弃去缓冲液,加入Jodacetamide平衡缓冲液振荡15分钟。再次滗析除去缓冲液,在湿组织上轻轻拍打胶条除去多余的平衡缓冲液。
电泳使凝胶胶条支持面朝向凝胶的玻璃滑面,插入胶框的玻璃滑面和凝胶的支持面之间的凹槽内。下移胶条并与凝胶接触后,将胶条轻轻按在凝胶上。必要时除去气泡。闭合电泳槽,并根据表6的参数进行电泳。
表6Ettan-Dalt-电泳槽中SDS-PAGE的参数

当染料前沿到达电泳槽底端时,中断电流并打开电泳槽。将凝胶从胶框中取出存于固定液中(参见凝胶染色),匀速振荡不少于2小时,通常振荡过夜。
凝胶的考马斯染色每块胶需要500ml反应溶液。以40rpm在旋转振荡仪上振荡凝胶。表7概述了所含步骤染色溶液-20ml(2%,v/v)磷酸(85%)-100g(10%,w/v)硫酸铵-200ml(20%,v/v)甲醇-1g(0.1%)SERVA Blue G,(Serva,Germany)加去离子水至1000ml
表72D-PAGE后对蛋白质进行考马斯染色

鉴定2D凝胶电泳分离的蛋白质将蛋白质点从考马斯亮蓝染色的凝胶上切下,用甲醇/水和乙腈(CAN)洗涤,并用胰蛋白酶(Roche,Mannheim)37℃下消化过夜。利用反相色谱法(RP18-3,100,15cm,75μm i.d.,来自LC-Packings)分离肽段,进行nanoHPLC/MS/MS分析。采用LCQ离子阱质谱(ThermoFinnigan,SanJose)分析肽段。对于含量最高的肽离子,全扫描模式质谱后再进行两次MS/MS质谱分析。用MASCOT软件包(Matrix Science,Ltd,London,UK)分析肽段的串联质谱,且将肽段与公开可用的拟南芥蛋白质数据库进行匹配。分析用该法鉴定的蛋白质中可能参与代谢过程调控的结构域。对于某些蛋白质(SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10和SEQ ID NO12),如前所述克隆全长其cDNA(SEQ IDNO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9和SEQID NO11)。
实施例7克隆全长cDNA以及鉴定的LMP基因的直向同源物拟南芥利用在cDNA 5’和3’端均可进行快速扩增(RACE)的Clontech的SMART RACE cDNA扩增试剂盒,通过RACE PCR分离由MegaSort andMPSS EST测序鉴定的拟南芥部分cDNA(EST)的全长序列。根据生产商的条件进行cDNA的分离和RACE PCR方法的使用。利用QIAquick凝胶提取试剂盒(Qiagen)从琼脂糖凝胶中提取RACE产物片断,并按照生产商的说明连接于TOPO pCR 2.1载体(Invitrogen)。在标准条件(Sambrook等,1989)下将重组载体转化入TOP10细胞(Invitrogen)。转化细胞在37℃、含50μg/ml卡那霉素的LB琼脂中生长过夜,并分布于40μl 40mg/mlX-gal(5-溴-4-氯-3-吲哚-D-半乳糖苷)的二甲基甲酰胺贮存溶液中,进行白-蓝筛选。选择单个白色菌落并用其接种3ml含50μg/ml卡那霉素的液体LB,在37℃下生长过夜。根据生产商说明,使用QIAprep SpinMiniprep Kit(Qiagen)提取质粒DNA。根据标准分子生物学技术进行后续的克隆分析和限制性绘图(Sambrook等,1989)。
基因序列可用于鉴定cDNA或基因组文库中的同源性或异源性基因(直向同源物,来自另一种植物的相同LMP基因)。可以通过设计由多重序列排列确定的保守序列的PCR引物完成该鉴定。常通过设计目的基因的全长或部分序列的简并引物鉴定直向同源物。利用如cDNA文库等通过核酸杂交,可以分离同源基因(如全长cDNA克隆)。根据目的基因的丰度不同,铺设100,000至1,000,000个重组噬菌体并转移至尼龙膜。碱变性后,通过如紫外线交联将DNA固定在膜上。在高度严紧条件下进行杂交。在1M NaCl离子强度、68℃温度下进行水相杂交和洗涤。通过如放射性(32P)裂口转录标记制备杂交探针(High Prime,Roche,Mannheim,Germany)。自显影法检测信号。
可以通过类似上述的方法,在低严紧性杂交和洗涤条件下鉴定相关但不相同的部分同源或异源基因。对于水相杂交,离子强度一般保持在1MNaCl,而温度则逐渐从68℃降至42℃。
可以使用合成的放射性标记寡核苷酸探针,分离仅在一个明确结构域上具有同源性(或序列相同/相似)的基因序列。通过用T4多核苷酸激酶磷酸化两条互补的寡核苷酸的5-引物端,制备放射性标记的寡核苷酸。退火并连接互补的寡核苷酸以形成多联体。然后通过如裂口转录放射性标记双链多联体。通常使用高寡核苷酸浓度,在低度严紧条件下进行杂交。
寡核苷酸杂交溶液6x SSC0.01M磷酸钠1mM EDTA(pH 8)0.5%SDS100μg/ml变性鲑精DNA0.1%脱脂干乳在杂交过程中,逐步将温度降至估算的寡核苷酸Tm以下5-10℃或室温,然后进行洗涤和自显影。在低度严紧性下洗涤,例如使用4x SSC进行3步洗涤。更多细节述于Sambrook等(1989,《Molecular CloningALaboratory Manual》,Cold Spring Harbor Laboratory Press),或Ausubel等(1994,《Current Protocols in Molecular Biology》,John Wiley和Sons)。
向日葵使用ABI 377厚板凝胶测序仪和BigDye Terminator Ready Reaction试剂盒(PE Biosystems,Foster City,CA),对获自Hyseq的向日葵基因克隆测序。根据生产商的条件进行cDNA的分离和RACE PCR方法的使用。利用QIAquick凝胶提取试剂盒(Qiagen)从琼脂糖凝胶中提取RACE产物片断,并按照生产商的说明连接于TOPO pCR 2.1载体(Invitrogen)。在标准条件(Sambrook等,1989)下将重组载体转化入TOP10细胞(Invitrogen)。转化细胞在37℃、含50μg/ml卡那霉素的LB琼脂中生长过夜,并分布于40μl 40mg/ml X-gal(5-溴-4-氯-3-吲哚-D-半乳糖苷)的二甲基甲酰胺贮存溶液中,进行白-蓝筛选。选择单个白色菌落并用其接种3ml含50μg/ml卡那霉素的液体LB,在37℃下生长过夜。按照生产商说明,使用QIAprepSpin Miniprep Kit(Qiagen)提取质粒DNA。根据标准分子生物学技术进行后续的克隆分析和限制性绘图(Sambrook等,1989)。
拟南芥和向日葵LMP基因的RT-PCR和克隆通过RT-PCR从拟南芥或向日葵RNA中分离全长LMP cDNA。使用AMV逆转录酶(Roche,Mannheim,Germany)合成cDNA的第一条链。使用两种基因特异性引物,通过聚合酶链式反应(PCR)扩增所产生的单链cDNA。反应条件为Expand High Fidelity PCR系统(Roche)的标准条件。反应参数为94℃下5分钟,随后为5个循环---94℃/40秒,50℃/40秒,以及72℃/1.5分钟。然后为30个循环--94℃/40秒,65℃/40秒以及72℃/1.5分钟。通过琼脂糖凝胶电泳分析在这些RT-PCR条件下产生的片断,确保得到预期长度的PCR产物。
使用根据LMP基因特异性序列所设计的合成寡核苷酸引物(MWG-Biotech)分离全长LMP cDNA,所述DNA序列由EST测序和RACE PCR产物测序确定。5’PCR引物(“正向引物”,F)SEQ ID NO61、SEQ ID NO63、SEQ ID NO65、SEQ ID NO67、SEQ ID NO69、SEQ IDNO71、SEQ ID NO73、SEQ ID NO75、SEQ ID NO77、SEQ ID NO79、SEQ ID NO81、SEQ ID NO83、SEQ ID NO85、SEQ ID NO87、SEQ IDNO89、SEQ ID NO91、SEQ ID NO93、SEQ ID NO97、SEQ ID NO99、SEQ ID NO101、SEQ ID NO103、SEQ ID NO105、SEQ ID NO107、SEQ ID NO109、SEQ ID NO111、SEQ ID NO113、SEQ ID NO115、SEQ ID NO117和SEQ ID NO119(分别用于扩增SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ IDNO43、SEQ ID NO45、SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO13、SEQ ID NO15、SEQ IDNO17、SEQ ID NO19、SEQ ID NO21或SEQ ID NO121、SEQ IDNO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57和SEQ ID NO59)中在ATG起始密码子5’上游含有NotI限制性位点。用于扩增SEQ ID NO11的5’PCR引物(“正向引物”,F)SEQ ID NO95中在ATG起始密码子5’上游含有PstI和NotI限制性位点。3’PCR引物(“反向引物”,R)SEQ ID NO62和SEQ ID NO92(分别用于扩增SEQ ID NO23和SEQ ID NO7)中在终止密码子3’下游含有EcoRV限制性位点。用于扩增SEQ ID NO25的3’PCR引物(“反向引物”,R)SEQ ID NO64在终止密码子3’下游含有SmaI限制性位点。3’PCR引物(“反向引物”,R)SEQ ID NO66、SEQ ID NO86、SEQ ID NO88、SEQ ID NO90、SEQ ID NO94、SEQ ID NO96、SEQ ID NO98、SEQ IDNO100、SEQ ID NO102、SEQ ID NO104、SEQ ID NO106、SEQ IDNO108、SEQ ID NO110、SEQ ID NO112、SEQ ID NO114、SEQ IDNO116、SEQ ID NO118和SEQ ID NO120(分别用于扩增SEQ IDNO27、SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21或SEQ ID NO121、SEQ ID NO47、SEQ IDNO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57和SEQ ID NO59)在终止密码子3’下游含有StuI限制性位点。3’PCR引物(“反向引物”,R)SEQ ID NO68、SEQ ID NO70、SEQ ID NO72、SEQ ID NO74、SEQ ID NO76、SEQ ID NO78、SEQ ID NO80、SEQ IDNO82以及SEQ ID NO84(分别用于扩增SEQ ID NO29、SEQ IDNO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43和SEQ ID NO45)在终止密码子3’下游含有NotI限制性位点。
添加限制性位点,从而可将RT-PCR扩增产物克隆到位于二元载体的多重克隆位点上的限制性位点中。使用以下“正向”(F)和“反向”(R)引物,以拟南芥或向日葵RNA为初始模板,通过RT-PCR扩增全长拟南芥或向日葵cDNA。
用于扩增SEQ ID NO1Osw14F(5’-GCGGCCGCCATGGCAACGGGGGCTGAGAACC-3’)(SEQ ID NO85)Osw14R(5’-AGGCCTTTACCGGCGACCACCAGCAGG-3’)(SEQID NO86)用于扩增SEQ ID NO3Osw15F(5’-GCGGCCGCCATGGCAACCATGGCTAGGTCG-3’)(SEQ ID NO87)Osw15R(5’-AGGCCTTCAGTTGTCGTGCAATGCTTTG-3’)(SEQID NO88)用于扩增SEQ ID NO5Osw16F(5’-GCGGCCGCCATGGCGCAACCCCTCGTGAAG-3’)(SEQ ID NO89)Osw16R(5’-AGGCCTTTAGCCGCTGGCAACAATCTC-3’)(SEQ IDNO90)用于扩增SEQ ID NO7Osw17F(5’-GCGGCCGCCATGCCGATTAGCCGGAGAGTTC-3’)(SEQ ID NO91)Osw17R(5’-GATATCTCATATGGAATCATAAACCG-3’)(SEQ IDNO92)用于扩增SEQ ID NO9Osw18F(5’-GCGGCCGCCATGCCCATTAATCAGAAAATTC-3’)(SEQ ID NO93)Osw18R(5’-AGGCCTTCATTTGCGATCAAGAACC-3’)(SEQ IDNO94)
用于扩增SEQ ID NO11Osw20F(5’-CTGCAGGCGGCCGCCATGGAGTGTAGTTCAGTGAGTG-3’)(SEQ ID NO95)Osw20R(5’-AGGCCTCTAGTATTGGACTAACGATAAC-3’)(SEQID NO96)用于扩增SEQ ID NO13Osw21F(5’-GCGGCCGCATGGTTGAAACCTTGTTTGAAG-3’)(SEQ ID NO97)Osw21R(5’-AGGCCTCTAGGCCTTATCCACCTTCC-3’)(SEQ IDNO98)用于扩增SEQ ID NO15Osw22F(5’-GCGGCCGCATGGGCAAAAAAGACATGCCTA-3’)(SEQ ID NO99)Osw22R(5’-AGGCCTTCATATTGTCGTGTAACGAGGG-3’)(SEQID NO100)用于扩增SEQ ID NO17Osw23F(5’-GCGGCCGCATGATATTATCGTTTCGTGGAC-3’)(SEQ ID NO101)Osw23R(5’-AGGCCTCTATACAGATTTGCCATCGCTC-3’)(SEQID NO102)用于扩增SEQ ID NO19Osw24F(5’-GCGGCCGCATGAACCGGATGATCGAAGCG-3’)(SEQ ID NO103)Osw24R(5’-AGGCCTTCATATTTGGTGCACCTCGGC-3’)(SEQ IDNO104)用于扩增SEQ ID NO21或SEQ ID NO121Osw26F(5’-GCGGCCGCATGCAGACCGTTTCTCGGAG-3’)(SEQID NO105)Osw26R(5’-AGGCCTTCAAGGATAAGACTCTGGAG-3’)(SEQ IDNO106)用于扩增SEQ ID NO23JB69F(5’-GCGGCCGCCATGAAGATATACTCTAGAACG-3’)(SEQID NO61)JB69R(5’-GATATCTTAGGCTGCCTCTGCAAACCC-3’)(SEQ IDNO62)用于扩增SEQ ID NO25JB70F(5’-GCGGCCGCCATGGGAGTATACTCGAGAGCG-3’)(SEQ ID NO63)JB70R(5’-CCCGGGTCACACGGCTTCTGCGAAGCC-3’)(SEQ IDNO64)用于扩增SEQ ID NO27JB71F(5’-GCGGCCGCCATGGGAACTAGGTTCCAATCA-3’)(SEQ ID NO65)JB71R(5’-AGGCCTTTAAGCAGCTTTGGCGAATCC-3’)(SEQ IDNO66)用于扩增SEQ ID NO29JB80F(5’-GAGCGGCCGCCATGGAGAAAGGTTTGACGAT-3’)(SEQ ID NO67)JB80R(5’-GAGCGGCCGCCTTAAGGATGCAAGGGCTCCT-3’)(SEQ ID NO68)用于扩增SEQ ID NO31JB82F(5’-GAGCGGCCGCCATGCATTGGCATGGTGTAGAGCAG-3’)(SEQ IDNO69)JB82R(5’-GAGCGGCCGCCTTATTCATAGCAAGGCGGCA-3’)(SEQ ID NO70)用于扩增SEQ ID NO33JB84F(5’-GAGCGGCCGCCATGTCTGCTTCTGATTCCTCT-3’)(SEQ ID NO71)JB84R(5’-GAGCGGCCGCCTTAGTCGCGGAACTCGTCCA-3’)(SEQ ID NO72)用于扩增SEQ ID NO35JB85F(5’-GAGCGGCCGCCATGGCGTTCCCTAAGGTATACTT-3’)(SEQ IDNO73)JB85R(5’-GAGCGGCCGCCCTAAGAGAGCTGACCACAAT-3’)(SEQ ID NO74)用于扩增SEQ ID NO37JB88F(5’-GAGCGGCCGCCATGGGTAGTGCAAAATCAGC-3’)(SEQ ID NO75)JB88R(5’-GAGCGGCCGCCTTAGGCGATGGAGCTTTTAT-3’)(SEQ ID NO76)用于扩增SEQ ID NO39JB89F(5’-GAGCGGCCGCCATGACTAATCCCATGATCAT-3’)(SEQ ID NO77)JB89R(5’-GAGCGGCCGCCCTAGAGACGGTGGATCAACG-3’)(SEQ ID NO78)用于扩增SEQ ID NO41JB90F(5’-GAGCGGCCGCCATGGTTTCTTCTTCTTTAAC-3’)(SEQ ID NO79)JB90R(5’-GAGCGGCCGCCTTAATAATTGGTAGCTTTAT-3’)(SEQ ID NO80)用于扩增SEQ ID NO43
JB91F(5’-GAGCGGCCGCCATGGCCGGAGTTTTCAAAAC-3’)(SEQ ID NO81)JB91R(5’-GAGCGGCCGCCTCAAAAGAGAGCAACAACAG-3’)(SEQ ID NO82)用于扩增SEQ ID NO45JB93F(5’-GAGCGGCCGCCATGGCGTCAAAGCAACTGAG-3’)(SEQ ID NO83)JB93R(5’-GAGCGGCCGCCTCACTTGTTGGTGAACTTTG-3’)(SEQ ID NO84)用于扩增SEQ ID NO47ToZ01F(5’-GCGGCCGCATGGCTTCGGTIACTTTCTCT-3’)(SEQID NO107)ToZ01R(5’-AGGCCTTCACTTCCAGTTGTTGGCAA-3’)(SEQ IDNO108)用于扩增SEQ ID NO49ToZ02F(5’-GCGGCCGCATGGCAAAAGAAAATGGATT-3’)(SEQID NO109)ToZ02R(5’-AGGCCTTTAGATAGAGAGGTCAGCGA-3’)(SEQ IDNO110)用于扩增SEQ ID NO51ToZ03F(5’-GCGGCCGCATGGCGGCGAAAATTCCCGG-3’)(SEQID NO111)ToZ03R(5’-AGGCCTTCAAGACATGAACAGAGCCT-3’)(SEQ IDNO112)用于扩增SEQ ID NO53ToZ04F(5’-GCGGCCGCATGGGTTACATAGGAGCTCAT-3’)(SEQID NO113)ToZ04R(5’-AGGCCTTCAAGCTTCTTTACGCGTGA-3’)(SEQ IDNO114)用于扩增SEQ ID NO55ToZ05F(5’-GCGGCCGCATGTCTCCTTCTCACTCCATCA-3’)(SEQ ID NO115)ToZ05R(5’-AGGCCTTCATTTGGTGTTTGAAATAT-3’)(SEQ IDNO116)用于扩增SEQ ID NO57ToZ11F(5’-GCGGCCGCATGGCATCTGTTTACTCCACCCTA-3’)(SEQ ID NO117)ToZ11R(5’-AGGCCTTTAATCGTTTTTCTTGGAAA-3’)(SEQ IDNO118)用于扩增SEQ ID NO59ToZ12F(5’-GCGGCCGCATGGCATCAATTTACTCCTCTTT-3’)(SEQ ID NO119)ToZ12R(5’-AGGCCTCTAATCGCTTTTTTTGCCAT-3’)(SEQ IDNO120)实施例8用抗体筛选表达文库来鉴定目的基因cDNA克隆可用于在如E.coli(如Qiagen QIAexpress pQE系统)中产生重组蛋白。然后一般使用Ni-NTA亲和层析(Qiagen)对重组蛋白进行亲和纯化。通过使用如兔免疫标准技术,可将重组蛋白用于产生特异性抗体。使用以重组抗原饱和的Ni-NTA柱(如Gu等,1994,Bio Techniques17257-262所述),对抗体进行亲和纯化。此后可通过免疫筛选(Sambrook等,1989,《Molecular CloningA Laboratory Manual》”,Cold SpringHarbor Laboratory Press;或Ausubel等,1994,《Current Protocols inMolecular Biology》,John Wiley & Sons),将抗体用于筛选表达cDNA文库以鉴定同源或异源性基因。
实施例9Northern杂交为进行RNA杂交,如Amasino(1986,Anal.Biochem.152304)所述,使用甲醛在1.25%强度的琼脂糖凝胶中电泳分离20μg总RNA或1μg聚腺苷+RNA,使用10X SSC,通过毛细吸引将其转移到带正电的尼龙膜上(Hybond N+,Amersham,Braunschweig),用紫外线固定,并使用杂交缓冲液(10%硫酸右旋糖酐w/v,1M NaCl,1%SDS,100μg/ml鲱精DNA)在68℃下预杂交3小时。在预杂交中使用α-32P dCTP(Amersham,Braunschweig,Germany)、Highprime DNA标记试剂盒(Roche,Mannheim,Germany)标记DNA探针。在相同缓冲液中加入标记后的DNA探针,68℃下杂交过夜。68℃下使用2x SSC、15分钟洗涤两次,1x SSC、1%SDS、30分钟洗涤两次。密封滤器暴露于-70℃下1至14天。
实施例10计算机功能分析使用软件包Genomax和Vector NTI(均由nformax,Frederick,Maryland,USA商业提供)处理序列,并用由Bio-Max(Munich,Germany)商业提供的软件包Genomax和Pedant Pro注解序列。该程序实际上包含了所有对蛋白质序列功能及结构定性有重要意义的生物信息学方法。可参见http://www.informaxinc.com/和http://pedant.mips.biochem.mpg.de。
Genomax and Pedant Pro中最为重要的算法包括FASTA高度敏感的蛋白质序列数据库检索,附统计学显著性评价(Pearson W.R.,1990,Rapid and sensitive sequence comparison with FASTP and FASTA.Methods Enzymol.18363-98);BLAST高度敏感的蛋白质序列数据库检索,附统计学显著性评价(Altschul S.F.等,Basic local alignment searchtool.J.Mol.Biol.215403-410);PREDATOR高精度单一及多重序列二级结构预测(Frishman和Argos 1997,75%accuracy in protein secondarystructure prediction.Proteins 27329-335);CLUSTALW多重序列排列(Thompson,J.D.等,1994,CLUSTAL Wimproving the sensitivity ofprogressive multiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice,Nucleic AcidsRes.224673-4680);TMAP多重排列序列预测跨膜区域(Persson B.和Argos P.1994,Prediction of transmembrane segments in proteins utilizingmultiple sequence alignments,J.Mol.Biol.237182-192);ALOM2单一排列序列预测跨膜区域(Klein P.,Kanehisa M.和DeLisi C.1984,Prediction ofprotein function from sequence propertiesA discriminant analysis of adatabase.Biochim.Biophys.Acta 787221-226.Dr.K.Nakai第2版);PROSEARCHPROSITE蛋白质序列型检测(Kolakowski L.F.Jr.等,1992,ProSearchfast searching of protein sequences with regular expressionpatterns related to protein structure and function.Biotechniques13919-921);BLIMPS针对ungapped blocks数据库的相似性搜索(Wallace和Henikoff 1992,PATMATA searching and extraction programfor sequence,pattern and block queries and databases,CABIOS 8249-254.Bill Alford执笔);PFAM和BLOCKS蛋白质基序和结构域搜索。
实施例11植物转化用质粒使用如pSUN2和pSUN300等多种植物二元载体转化植物。将cDNA以正义或反义方向连入载体,构建植物二元载体。在此类载体中,植物启动子定位于cDNA 5’端并于该处激活cDNA的转录;聚腺苷化序列定位于cDNA 3’端。可使用多种植物启动子,如组成型启动子(超级启动子,superpromoter),种子特异性启动子以及根特异性启动子。使用组织特异性启动子可进行组织特异性表达。例如某些情况下,将napin或LeB4或USP启动子克隆入cDNA 5’端,可进行种子特异性表达。也可使用其他任何种子特异性启动子元件,此类启动子为本领域普通技术人员所熟知。对于在整个植物中的组成型表达而言,某些情况下可使用超级启动子或CaMV35启动子。也可以使用信号肽将表达蛋白质定位于细胞区室内,如质体、线粒体或内质网(Kermode,1996,Crit.Rev.Plant Sci.15285-423)。信号肽于阅读框内克隆入cDNA 5’端以完成融合蛋白的亚细胞定位。
植物二元载体中包括多种植物启动子之一(如AtAct2-I启动子和Nos-启动子)控制下的选择性标记基因;根特异性启动子、种子特异性启动子、非组织特异性启动子或组成型启动子控制下的LMP候选cDNA;以及终止子。在所需启动子后面,将部分或全长LMP cDNA以正义或反义方向克隆入植物二元载体。在标准条件下将含有目的基因的重组载体转化到Top 10细胞(Invitrogen)中。在含有选择性试剂的LB琼脂上选择转化细胞,并使细胞在37℃下生长过夜。按照生产商说明使用QIAprep SpinMiniprep Kit(Qiagen)提取质粒DNA。根据标准分子生物学技术进行后续克隆的分析以及绘制限制性图谱(Sambrook等,1989,《Molecular Cloning,A Laboratory Manual.》,第二版.Cold Spring Harbor Laboratory Press.Cold Spring Harbor,NY)。
实施例12农杆菌介导的植物转化可以使用标准转化和再生技术(Gelvin,Stanton B.和Schilperoort R.A,《Plant Molecular Biology Manual》,第二版.Kluwer Academic Publ.,Dordrecht 1995,见于Sect.,Ringbuc Zentrale SignaturBT11-P;Glick,Bernard R.和Thompson,John E.《Methods in Plant Molecular Biology andBiotechnology》,S.360,CRC Press,Boca Raton 1993),利用本文所述的LMP核酸进行农杆菌介导的植物转化。例如可以使用GV3(pMP90)(Koncz & Schell,1986,Mol.Gen.Genet.204383-396)或LBA4404(Clontech)根瘤农杆菌菌株进行农杆菌介导的植物转化。
在标准条件(Bechtold,1993,Acad.Sci.Paris.3161194-1199;Bent等,1994,Science 2651856-1860)下种植并转化拟南芥。此外,可以通过子叶或胚轴转化(Moloney等,1989,Plant Cell Report 8238-242;De Block等,1989,Plant Physiol.91694-701),利用本发明的LMP核酸转化油菜。选择农杆菌及植物的抗生素使用取决于转化所用的二元载体和农杆菌菌株。通常使用卡那霉素作为植物选择标记进行油菜选择。此外,可以使用如Mlynarova等所述(1994,Plant Cell Report 13282-285)的技术,进行农杆菌介导至亚麻的基因转移。
可使用如EP 0424 047、美国专利No.5,322,783(Pioneer Hi-BredInternational)或如EP 0397 687、美国专利N0.5,376,543或美国专利No.5,169,770(University Toledo)所述的技术转化大豆。用70%乙醇在室温下对大豆种子连续振荡表面消毒4分钟,然后加入含有0.05%(v/v)Tween的20%(v/v)Clorox连续振荡20分钟。用去离子水漂洗种子4次,并将其置于Petri盘中的润湿无菌滤纸上,室温留置6至39小时。剥去种皮,将子叶从胚轴上分离下来。检查胚轴确保没有损伤分生组织区。收集解离的胚轴于半开无菌Petri盘中,并在密封Petri盘中空气干燥至湿度小于20%(鲜重)以备后用。
这一植物转化方法也适用于油菜和其他作物。具体而言,用70%乙醇在室温下对芸苔的种子连续振荡表面消毒4分钟,然后加入含有0.05%(v/v)Tween的20%(v/v)Clorox连续振荡20分钟。用去离子水漂洗种子4次,并将其置于Petri盘中的润湿无菌滤纸上,室温留置18小时。剥去种皮,种子于半开无菌Petri盘中空气干燥过夜。在此期间,种子丧失了约85%水分。然后将种子保存于室温下密封Petri盘中以备后用。
取含适当抗生素(如100mg/l链霉素、50mg/l卡那霉素)的LB固态培养基中的单菌落,在液态LB培养基中长至600nm处光密度为0.8,制备根瘤农杆菌培养物。然后在室温下、7000rpm时沉淀细菌培养物7分钟,并重悬浮于添加100mM乙酰丁香酮的MS培养基(Murashige & Skoog,1962,Physiol.Plant.15473-497)中。使用前在此预诱导培养基中室温孵育细菌培养物2小时。大豆合子种子胚轴在约44%湿度、室温下用预诱导的农杆菌悬浮培养物吸胀2小时。(干胚在农杆菌培养物中吸胀对于玉米胚轴也适用)。
将胚从吸胀培养物中取出并转移到含有固态MS培养基(加入2%蔗糖)的Petri盘中,在室温暗处孵育2天。还可以将胚置于Petri盘中的润湿(液态MS培养基)无菌滤纸上,在前述相同条件下孵育。此后将胚转移到固态或液态含有500mg/l羧苄青霉素或300mg/l头孢噻肟的MS培养基中以杀死农杆菌。使用液态培养基润湿无菌滤纸。将胚在25℃、440μmolm-2s-1和12小时光周期中孵育4周。一旦幼苗生根,将其转移到无菌metromix土壤中。转移植物至土壤之前洗去体外植物培养基。保留植物在塑料罩下1周以促进累积过程。随后将植物转移到生长室内,在25℃、440μmol m-2s-1光强度和12小时光周期下孵育约80天。
通过PCR分析第一代转基因植物(T0)样品以确保T-DNA的存在。Southern杂交,包括在1%琼脂糖凝胶上进行DNA电泳并转移到带正电的尼龙膜(Roche Diagnostics)上,证实了这些结果。使用PCR DIG探针合成试剂盒(Roche Diagnostics)、按照生产商建议通过PCR制备地高辛标记的探针。
实施例13体内诱变可以通过用大肠杆菌或其他微生物(如芽孢杆菌属(Bacillus spp.)或酵母,如酿酒酵母)整合并传代质粒(或其他载体)DNA,实施微生物的体内诱变,其中所述微生物保持其遗传信息完整性的能力受损。一般突变体菌株中DNA修复系统的基因有突变(如mutHLS,mutD,mutT等;参考Rupp W.D.1996,DNA repair mechanisms,inEscherichia coli andSalmonella,第2277-2294页,ASMWashington.)。此类菌株为本领域技术人员所熟知,其用途在例如Greener和Callahan,1994,Strategies 732-34中有所阐释。优选在微生物中选择并检测之后再将突变DNA分子转移到植物中。根据本文件中的多个实施例产生转基因植物。
实施例14评估转化生物中的mRNA表达和重组基因产物的活性可以在转录水平或/和翻译水平上测量转化宿主生物中重组基因产物的活性。确定基因转录水平(可翻译为基因产物的mRNA量的指标)的有效方法之一是进行Northern印迹(参见如Ausubel等,1988,CurrentProtocols in Molecular Biology,WileyNew York),其中用可检测的标签(通常具有放射活性或可化学发光)标记为结合目的基因而设计的引物,从而使在生物培养物总RNA提取、胶上电泳、转移到稳定基质并与该探针孵育时,探针结合和结合量能够提示该基因mRNA的存在和数量。这一信息至少部分证实了转化基因的转录水平。可以通过本领域已知的若干方法(如Bormann等,1992,Mol.Microbiol.6317-326所述),从植物细胞、组织或器官中制备总细胞RNA。
可以使用如Western印迹的标准技术(见如Ausubel等,1988,《Current Protocols in Molecular Biology》,WileyNew York),评估从该mRNA翻译的蛋白质的存在或相对数量。这一方法中,提取总细胞蛋白质,通过凝胶电泳分离之,转移到如硝化纤维的基质上,并与可特异性结合于目的蛋白质的探针(如抗体)一同孵育。通常使用易于检测的化学发光物或比色标标签标记探针。观测到的标记存在与否及其数量提示了细胞中目标突变蛋白的存在与否及其数量。
可以通过若干成熟的方法,如DNA条带转移测定法(也称为凝胶迟滞测定法),测量结合于DNA的LMP活性。可以使用报告基因测定法(如Kolmar H.等,1995,EMBO J.143895-3904及其引用参考文献所述)测量此类LMP对其他分子表达的作用。报告基因检测系统众所周知,使用如β半乳糖苷酶、绿色荧光蛋白以及其他酶,可在原核和真核细胞中应用该系统。
根据如Gennis R.B.(1989 Pores,Channels and Transporters,inBiomembranes,Molecular Structure and Function,SpringerHeidelberg,85-137、199-234和270-322页)所述的技术,确定脂质代谢膜转移蛋白的活性。
实施例15转基因植物中拟南芥、油菜和向日葵基因功能的体外分析确定酶的活性和动力学参数是本领域的成熟技术。确定任何给定的改变蛋白质活性的实验必须根据野生型酶的特异性活性量体而做,这也完全在本领域技术人员的能力范围内。为确定多种酶的活性,酶的大致情况以及涉及其结构、动力学、原则、方法、应用和实例具体细节可见于以下参考文献,如Dixon,M.& Webb,E.C.,1979,Enzymes.LongmansLondon;Fersht,1985,《Enzyme Structure and Mechanism》,FreemanNew York;Walsh,1979,《Enzymatic Reaction Mechanisms》,FreemanSan Francisco;Price,N.C.,Stevens,L.,1982,《Fundamentals of Enzymology》Oxford Univ.PressOxford;Boyer,P.D.编,(1983)《The Enzymes》,第三版.AcademicPressNew York;Bisswanger,H.,1994,《Enzymkinetik》,第二版,VCHWeinheim(ISBN 3527300325);Bergmeyer,H.U.,Bergmeyer,J.,Graβl,M.编,(1983-1986)《Methods of Enzymatic Analysis》,第三版,I-XII卷,VerlagChemieWeinheim;以及Ullmann《Encyclopedia of Industrial Chemistry》(1987)卷A9,Enzymes.VCHWeinheim,352-363页。
实施例16分析重组LMP对目的种子贮存化合物的影响脂肪酸的产生在转化为甲酯后,通过常规气液相色谱(GLC)分析确定拟南芥种子的总脂肪酸含量(Schulte & Weber,1989,Fat Sci.Technol.91181)。为此,用甲基叔丁基醚(MTBE)提取总脂肪酸,并用三甲基氢氧化锍(TMSH)衍生为其相应脂肪酸甲酯(FAME)。在装有氢火焰离子化检测器(FID)的AgilentTechnology 6890N Network GC系统的毛细柱(DB Wax 10m×0.1mm×0.2μm)上,以氢气为载体气体分离FAME。加入已知的内部标准浓度,确定脂肪酸含量。测量转基因植物及含pBPS空相载体构建体(不含有目的LMP基因)的植物种子的总脂肪酸含量。使用一种植物的大量种子(通常种子重为5mg);所有提取均重复两至三次。下表中所示的对照与转基因系为比邻而种。对照总值的不同或是由于生长条件的不同(对于植物培养物中微小变化十分敏感),或是由于加入量化脂肪酸的标准量不同所致。由于种子数量大,所有从T2种子得到的数值以及部分T3种子数值,是同源性(目的基因)以及异源性事件的混合,暗示这些数据低估了LMP基因的作用。
表8.转基因系OSW14(含有SEQ ID NO1)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和6株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.253±0.009OSW14转基因种子0.270±0.006表9.转基因系OSW15(含有SEQ ID NO3)的T2种子总脂肪酸含量的确定。显示每系3株对照植物和18株植物的平均值(±标准差)。
基因型总脂肪酸(g)/种子重量(g)Col-0空载体对照 0.259±0.008OSW15转基因种子 0.300±0.010表10.转基因系OSW16(含有SEQ ID NO5)的T2种子总脂肪酸含量的确定。显示3株对照植物和10株植物的平均值(±标准差)。
基因型总脂肪酸(g)/种子重量(g)Col-0空载体对照 0.296±0.024OSW16转基因种子 0.318±0.002表11.转基因系OSW17(含有SEQ ID NO7)的T2种子总脂肪酸含量的确定。显示每系3株对照植物和5株植物的平均值(±标准差)。
基因型总脂肪酸(g)/种子重量(g)
Col-0空载体对照0.292±0.008OSW17转基因种子0.315±0.004表12.转基因系OSW18(含有SEQ ID NO9)的T2种子总脂肪酸含量的确定。显示每系3株对照植物和14株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.282±0.002OSW18转基因种子0.309±0.007表13.转基因系OSW21(含有SEQ ID NO13)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和22株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.242±0.025OSW21转基因种子0.283±0.016表14.转基因系Jb069(含有SEQ ID NO23)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和8株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.193±0.016JB069转基因种子0.211±0.005表15.转基因系Jb070(含有SEQ ID NO25)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和7株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.193±0.016JB070转基因种子0.218±0.003
表16.转基因系Jb071(含有SEQ ID NO27)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和13株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.246±0.009JB071转基因种子0.278±0.007表17.转基因系Jb080(含有SEQ ID NO29)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和19株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.240±0.017JB080转基因种子0.268±0.006表18.转基因系Jb082(含有SEQ ID NO31)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和8株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.240±0.014JB082转基因种子0.264±0.007表19.转基因系Jb084(含有SEQ ID NO33)的T2种子总脂肪酸含量的确定。显示每系3株对照植物和8株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.379±0.025JB084转基因种子0.426±0.004表20.转基因系Jb085(含有SEQ ID NO35)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和8株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.231±0.004
JB085转基因种子0.263±0.009表21.转基因系Jb088(含有SEQ ID NO37)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和7株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.353±0.024JB088转基因种子0.392±0.016表22.转基因系Jb089(含有SEQ ID NO39)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和4株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.314±0.007JB089转基因种子0.332±0.006表23.转基因系Jb090(含有SEQ ID NO41)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和4株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.321±0.011JB090转基因种子0.271±0.020表24.转基因系Jb091(含有SEQ ID NO43)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和4株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.279±0.015JB091转基因种子0.307±0.004表25.转基因系Jb093(含有SEQ ID NO45)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和12株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.353±0.024
JB093转基因种子0.258±0.024表26.转基因系OSW22(含有SEQ ID NO15)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和5株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.272±0.025OSW22转基因种子0.291±0.006表27.转基因系OSW23(含有SEQ ID NO17)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和3株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.285±0.022OSW23转基因种子0.317±0.008表28.转基因系OSW24(含有SEQ ID NO19)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和6株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.267±0.029OSW24转基因种子0.307±0.009表29.转基因系OSW26(含有SEQ ID NO21)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和5株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.259±0.012OSW26转基因种子0.287±0.014表30.转基因系ToZ01(含有SEQ ID NO47)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和7株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.280±0.011
ToZ01转基因种子0.298±0.003表31.转基因系ToZ02(含有SEQ ID NO49)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和7株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.247±0.011ToZ02转基因种子0.278±0.019表32.转基因系ToZ03(含有SEQ ID NO51)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和2株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.276±0.011ToZ03转基因种子0.312±0.027表33.转基因系OSW20(含有SEQ ID NOX)的T2种子总脂肪酸含量的确定。显示每系4株对照植物和14株植物的平均值(±标准差)。
基因型 总脂肪酸(g)/种子重量(g)Col-0空载体对照0.338±0.022Osw20抑制转基因种子0.379±0.012实施例17分析重组蛋白对目标种子贮存化合物产生的影响通过在合适的条件下种植经修饰的植物,并分析其种子或其他任何植物器官中目标产物(即脂质或脂肪酸)产量的增加,可以评价植物中遗传修饰对目标种子贮存化合物(如糖、脂质或脂肪酸)的影响。此类分析技术为本领域技术人员所熟知,包括质谱法、薄层色谱法、各种染色法、酶和微生物学方法以及分析色谱法,如高效液相色谱法(见如,Ullman,1985,《Encyclopedia of Industrial Chemistry》,卷A2,第89-90及443-613页,VCHWeinheim;Fallon,A.等,1987,《Applications of HPLC inBiochemistry inLaboratory Techniques in Biochemistry and MolecularBiology》,卷17;Rehm等,1993,“Product recovery and purification”,《Biotechnology》,卷3,第III章,469-714页,VCHWeinheim;Belter,P.A.等,1988,《Bioseparationsdownstream processing for biotechnology》,JohnWiley & Sons;Kennedy J.F.& Cabral J.M.S.,1992,《Recovery processesfor biological materials》,John Wiley and Sons;Shaeiwitz J.A.& HenryJ.D.,1988,“Biochemical separations”,见Ulmann《Encyclopedia ofIndustrial Chemistry》,“Separation and purification techniques inbiotechnology”,卷B3,第11章1-27页,VCHWeinheim;以及Dechow F.J.1989)。
除上述方法外,如Cahoon等(1999,Proc.Natl.Acad.Sci.USA 96,2212935-12940)和Browse等(1986,Anal.Biochemistry 442141-145)所述,从植物材料中提取植物脂质。脂质或脂肪酸的定性及定量分析描述于Christie、William W.《Advances in Lipid Methodology》,Ayr/ScotlandOilyPress.-(《Oily Press Lipid Library》;Christie,William W.,《GasChromatography and Lipids.A Practical Guide》-Ayr,ScotlandOily Press,1989 Repr.1992.-IX,307 S.-Oily Press Lipid Library;以及《Progress inLipid Research》,OxfordPergamon Press,1(1952)-16(1977)《Progressin the Chemistry of Fats and Other Lipids CODEN》)。
按照标准分析方法,可以通过分析转基因植物获取脂肪酸产物存在的明确证据,所述分析方法GC,GC-MS或TLC分别见于Christie的不同论述及其参考文献(1997,《Advances on Lipid Methodology》第4版Christie,Oily Press,Dundee,119-169页;1998)。以叶为例的详细方法见于Lemieux等(1990,Theor.Appl.Genet.80234-240),以种子为例的见于Focks & Benning(1998,Plant Physiol.11891-101)。
通过脂酶消化进行位于甘油主链的C-1、C-2或C-3位点对脂肪酸成分的定位分析(见如Siebertz & Heinz 1977,Z.Naturforsch.32c193-205,以及Christie,1987,《Lipid Analysis》第2版,Pergamon Press,Exeter,ISBN0-08-023791-6)。
收集蛋白质活性增加或减少对脂质和糖生物合成路径影响的相关信息的典型方法是例如用14C-醋酸盐或14C-丙酮酸盐的标记研究分析叶或种子的碳原子流量(见如Focks & Benning,1998,Plant Physiol.11891-101;Eccleston & Ohlrogge,1998,Plant Cell 10613-621)。包括如14C-蔗糖和14C-苹果酸盐标准物的各自分离(如在TLC平板上)后,通过脂质闪烁计数可以确定14C在脂质和水溶性间隔中的分布(Eccleston & Ohlrogge,1998,Plant Cell 10613-621)。
可以通过声波、玻璃研磨、液氮和研磨或其他适用的方法碎裂待分析的材料。碎裂后的材料须进行离心。将沉淀重悬浮于去离子水中,在100℃下加热10分钟,冰上冷却并再次离心后,90℃下用含0.5M硫酸、2%二甲氧基丙烷的甲醇提取1小时,产生可生成转甲基脂质的水解油和脂质化合物。在petrolether中抽提这些脂肪酸甲酯,并最终使用毛细柱(Chrompack,WCOT Fused Silica,CP-Wax-52CB,25m,0.32mm)在170℃和240℃的温度梯度下进行20分钟GC分析并于240℃下5分钟。通过使用商业来源可得的标准(如Sigma),鉴定产生的脂肪酸甲酯。
当无法得到脂肪酸的标准物时,通过衍生化以及此后的GC-MS分析完成分子鉴定。例如,在4,4-二甲氧基恶唑啉衍生物衍生反应后,通过GS-MS显示三键脂肪酸的定位(Christie,Oily Press,Dundee,1998)。
分析糖(特别是淀粉)的常用标准方法,由Stitt M.、Lilley R.Mc.C.、Gerhardt R.和Heldt M.W.发表(1989,“Determination of metabolite levelsin specific cells and subcellular compartments of plant leaves,”MethodsEnzymol.174518-552;其他方法也可见Hrtel等,1998,Plant Physiol.Biochem.36407-417及Focks & Benning,1998,Plant Physiol.11891-101)。
为抽提可溶性糖和淀粉,在1.5-ml聚丙烯试管中将50粒种子于500μl80%(v/v)乙醇中匀浆,在70℃下孵育90分钟。16,000g下离心5分钟后,将上清液转移至新的试管中。用500μl of 80%乙醇抽提沉淀两次。在真空室温下蒸发结合上清液溶剂。将残留物溶解于50μl水,即为可溶糖级分。乙醇抽提后留下的沉淀中含有包括淀粉在内的不可溶性糖,在200μl 0.2NKOH中匀浆,将悬浮物在95℃下孵育1小时以溶解淀粉。加入35μl 1N醋酸后,在16,000g下离心5分钟,使用上清液进行淀粉定量。
为量化可溶性糖,向含有100mM咪唑、pH 6.9、5mM MgCl2、2mMNADP、1mM ATP和2单位2ml-1葡萄糖-6-P-脱氢酶的990μl反应缓冲液中加入10μl糖提取物。依次向其中加入4.5单位己糖激酶、1单位葡萄糖磷酸异构酶以及2μl饱和果糖苷酶,以酶促确定葡萄糖、果糖和蔗糖。在波长为340nm处通过测光手段监测NADPH的产生。与之相似,使用Boehringer Mannheim的试剂盒分析30μl不可溶糖级分中的淀粉。
分析叶和种子中蛋白质含量的实例可见于Bradford M.M.(1976,“Arapid and sensitive method for the quantification of microgram quantitiesof protein using the principle of protein dye binding,”Anal.Biochem.72248-254)。为定量总种子蛋白质,在1.5-ml聚丙烯试管中将15-20粒种子于250μl丙酮中匀浆。16,000g下离心后弃去上清液,将真空干燥的沉淀重悬浮于250μl含有50mM Tris-HCl(pH8.0)、250mM NaCl、1mMEDTA和1%(w/v)SDS的提取缓冲液。25℃下孵育2小时后,将匀浆在16,000g下离心5分钟,其上清液中200ml用于蛋白质测量。在该测定中以γ-球蛋白为校准。使用Lowry DC蛋白质测定(Bio-Rad)或Bradford-测定(Bio-Rad)进行蛋白质测量。
根据Renz等(1993,Planta 190156-165),分光光度法酶法测定己糖激酶和果糖激酶;根据Burrell等(1994,Planta 19495-101),酶法测定葡萄糖磷酸异构酶、ATP-依赖性6-磷酸果糖激酶、焦磷酸盐依赖性6-磷酸果糖激酶、果糖-1,6-二磷酸醛缩酶、丙糖磷酸异构酶、甘油-3-磷酸脱氢酶、磷酸甘油激酶、磷酸甘油变位酶、烯醇酶和丙酮酸激酶;根据Zrenner等(1995,Plant J.797-107),酶法测定UDP-葡萄糖-焦磷酸化酶。
如Hrtel所述(1998,Plant Physiol.Biochem.36407-417),测量糖代谢的中间产物,如葡萄糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、磷酸烯醇丙酮酸盐、丙酮酸和ATP;根据Jelitto等(1992,Planta 188238-244),测量代谢产物。
除测量最终种子贮存化合物(即脂质、淀粉或贮存蛋白质)外,也可以分析产生目标种子贮存化合物所用的代谢路径的其他成分(如中间产物和副产物),确定化合物产生的总效率(Fiehn等,2000,Nature Biotech.181447-1161)。
例如,可使用标准程序构建含有本文公开的核酸或其片断的酵母表达载体,并将其转化至酿酒酵母中。可分析产生的转基因细胞在糖、油、脂质或脂肪酸含量上的变化。
与之相似,可使用标准程序构建含有本文公开的核酸或其片断的植物表达载体,并将其转化至合适的植物细胞中,如拟南芥、大豆、油菜、玉米、小麦、蒺藜状苜蓿(Medicago truncatula)等。可分析产生的转基因细胞和/或其衍生植物在糖、油、脂质或脂肪酸含量上的变化。
此外,本文公开的序列或其片断可用于在多种生物基因组中产生敲除突变,如细菌、哺乳动物细胞、酵母细胞和植物细胞(Girke等,1998,PlantJ.1539-48)。然后可评价产生的敲除细胞中种子贮存化合物的组成和含量,以及突变对表型和/或基因型的影响。其他基因失活的方法包括US6,004,804和Puttaraju等,1999,Nature Biotech.17246-252。
实施例18从转化生物中纯化目标产物可以通过本领域已知的多种方法从植物材料中回收LMP。从植物器官中分离种子贮存化合物前,先将植物器官与其他组织或器官机械性分离开。组织匀浆后,离心除去细胞残渣,保留含有可溶性蛋白质的上清液级分以进一步纯化目的化合物。若产物是由培养的细胞分泌的,则通过低速离心将细胞从培养物中取出,保留上清液做进一步纯化。
在适当的树脂上对来自任一种纯化方法的上清液级分进行色谱分析,其中目标分子而非样品中的杂质留存于色谱树脂上,或杂质而非样品留存于树脂上。必要时可使用相同或不同的色谱树脂重复该色谱法步骤。本领域技术人员擅长选择适当的色谱树脂并将其最有效地运用于纯化某一具体分子。可以通过过滤或超滤法浓缩纯化产物,并在可最大化产物稳定性的温度下保存。
本领域公知多种纯化方法,而前述纯化方法并非限制性的。此类纯化方法的描述见于如Bailey J.E.& Ollis D.F.,1986,Biochemical EngineeringFundamentals,McGraw-HillNew York。
可根据本领域标准技术鉴定分离化合物并评估其纯度。这些技术包括高效液相色谱法(HPLC)、分光光度法、染色法、薄层色谱法、分析色谱法如高效液相色谱法、NIRS、酶法测定或微生物测定。此类分析方法可见于Patek等(1994,Appl.Environ.Microbiol.60133-140)、Malakhova等(1996,Biotekhnologiya 1127-32)、Schmidt等(1998,Bioprocess Engineer 1967-70)、Ulmann《Encyclopedia of Industrial Chemistry》(1996,卷A27,VCHWeinheim,第89-90、521-540、540-547、559-566、575-581和581-587页),以及Michal G(1999,Biochemical PathwaysAn Atlas of Biochemistryand Molecular Biology,John Wiley and Sons;Fallon,A.等,1987,Applications of HPLC in Biochemistry inLaboratory Techniques inBiochemistry and Molecular Biology,卷17)。
实施例19筛选应激耐受和植物生长增加者筛查转基因植物提高的应激耐受性,选择其中转基因表达可产生应激耐受性的转基因植物。进一步筛查转基因植物的生长速率,选择其中转基因表达可提高生长速率和/或种子产率的转基因植物。
Blasting完成了BLOCKS数据库中的蛋白质的分类(S.Henikoff & J.G Henikoff,Genomics 1997-107(1994))。
使用常规实验方法,本领域技术人员会认识或能确定许多本发明本文所述的具体实施方案的等价实施方案。这些等价实施方案包括在本文公开且本文公开的本发明权利要求书。
实施例20构建用于抑制osw20翻译的二元构建体使用前述正向和反向引物(SEQ ID NOS95和96)克隆osw 20序列(SEQ ID NO11)。构建通过mRNA干扰抑制osw20的构建体如下。利用反向引物引入的限制性位点,以限制性酶StuI消化携有SEQ ID NO11(用SEQ ID NOS95和96扩增)的质粒pGEM-Te。乙醇沉淀后,利用正向引物引入的PstI位点,用限制性酶PstI消化质粒。使用标准方法在琼脂糖凝胶上纯化产生的游离核苷酸,并同时用限制性酶HindIII和NdeI消化之。HindIII将序列切为大小相同的两个片断,而NdeI将原核苷酸的后一半裂解为两个更小的片断。在琼脂糖凝胶上纯化osw20序列的前一半(约530bp,位于PstI和Hind III限制性位点之间),使用Klenow聚合酶的较大片断填充核苷酸突起以钝化末端。
用StuI消化携有osw20序列的质粒pGEM-Te,并将钝化的osw20片断连在osw20序列后面。筛查产生的克隆,寻找插入片断以反向定位于osw20开放阅读框后的克隆。该构建体被称为osw20抑制(SEQ IDNO123)。通过NotI消化将其从pGEM-Te载体中释放出来,以凝胶纯化之,并连入种子特异性USP启动子调控下的二元载体pSUN300中(见
图1)。
osw14的核酸序列(SEQ ID NO1)ATGGCAACGGGGGCTGAGAACCAATGGCTTAAAGGAAGAGTGAAGGCTGTTACCTCCGGAGACTGCTTAGTGATCACGGCTTTGAGCCACAACAGAGCTGGACCTCCACCGGAAAAGACCATTACTTTTTCTTCTCTTATGGCACCTAAGATGGCTCGCAGAGGAGGTATAGATGAGCCTTTTGCATGGGAAAGCAAAGAATTTTTGAGGAAACTTTGCATAGGAAAGGAGGTTGCATTCAAAGTGGATTACAAGGTGGAAGCTATTGCTGGAAGAGAATTTGGCTCTGTTTTCCTTGGCAACGAGAATCTTGCTAAGCTTGTTGTTAAAACTGGTTGGGCAAAGGTTAGGGAGCCAGGTCAGCAGAATCAGGACAAGGTTAGTCCTTACATTAAAGAGTTGCTACAGCTTGAAGAGCTGGCCAAGCAGGAAGGATATGGTCGTTGGAGCAAGGTTCCTGGTGCTGCTGAGGCATCTATCAGAAATCTTCCTCCTTCTGCCATTGGGGATTCTGCTGGCTTTGATGCCATGGGCCTTTTAGCTGCAAACAAGGGCAAGCCTATGGAAGGTATTGTAGAGCAAGTGCGTGATGGAAGTACTATTCGGGTTTATCTTCTTCCAGAGTTCCAGTTTGTGCAAGTATTTGTTGCGGGAGTCCAGGCTCCATCAATGGGAAGGCGAACCACAAATGGAAGTGTTGTTGAGACAGTTCCAGATGAGCCGAATGGAGATGTTTCTGCTGAGTCACGAGGTCCTCTAACGACAGCTCAGAGACTTGCTGCCTCTGCAGCATCGTCTGTCGAGGTTTCCTCTGATCCATTTGCAACTGAAGCCAAGTACTTTACCGAACACCGTGTTCTTAGTAGAGATGTTCGCATTGTTCTTGAAGGCGTTGACAAATTCAACAATCTGATTGGTTCAGTTCATTATTCTGATGGGGAAACAGTTAAAGACTTGGGGTTGGAGCTCGTT
GAAAATGGTCTTGCTAAATTTGTTGAATGGAGTGCCAACATGATGGAGGAGGAAGCTAAGAAAAAGTTGAAAGCTGCAGAACTTCAATGCAAGAAAGATAAGGTTAAAATGTGGGCAAACTACGTTCCTCCAGCTACAAACTCTAAGGCAATTCATGACCAGAACTTTACGGGAAAGGTAGTGGAAGTGGTGAGTGGGGATTGTCTAATAGTTGCCGATGATGCTGTTCCATTTGGGAGTCCAGCAGCAGAGAGACGGGTCTGTCTTTCGAGTATCAGATCTCCAAAAATGGGCAACCCACGTAGAGAAGAGAAACCAGCTCCTTATGCTCGGGAAGCAAGAGAATTTCTGAGACAACGACTTATTGGCAAACAGGTTATTGTTCAAATGGAATATTCAAGGAAAGTCACCCAAGGAGATGGTCCTACCACATCTGGAGCTGCTGATAGGTTCATGGATTTTGGCTCAGTGTTCCTTCCATCTGCTGCCAAAGCCGATTCTGATGAAGTGACTGCACCACCTGCTGCAGCAATTGCTGGCAGTCAGCCGGTTGGTGTGAATATTGCTGAGCTCGTTCTTGTCCGTGGTTTTGGAAATGTGGTTAGACATAGAGATTTTGAAGAGCGATCAAACCATTATGATGCTCTTCTGGCTGCTGAAGCTCGTGCTCTGGCTGGAAAGAAAGGAATCCATTCTGCAAAAGAATCTCCAGCCATGCACATCACAGACCTAACTGTGTCGGCAGCTAAGAAAGCTAAAGATTTCCTGCCATCCCTGCAAAGAATCAGGAGAATACCCGCTGTTGTGGAATATGTCCTCAGCGGACATCGGTTTAAGCTTTATATCCCAAAGATAACATGTAGCATAGCCTTTTCATTCTCTGGTGTCAGATGTCCTGGCCGTGGCGAACCTTATTCAGAAGAAGCTATCTCTGTAATGAGACGTAGGATCATGCAGAGAGATGTTGAGATTGAAGTTGAAACCGTGGATAGAACCGGTACTTTCTTGGGATCCATGTGGGAATCGAGGACAAACGTGGCTACAGTTCTGCTTGAAGCTGGCTTAGCAAAAATGCAGACTAGCTTTGGTGCAGACAGGATCGCCGAAGCACATCTTCTTGAACAGGCAGAGAGATCTGCTAAAAACCAGAAACTGAAGATTTGGGAAAACTATGTTGAAGGAGAAGAAGTCTCAAACGGAAATACTAACACCGTAGAAACCAGGCAAAAGGAGACCTTAAAGGTTGTTGTTACAGAAGTACTTGGAGGTGGTCGGTTCTATGTTCAATCTGCTGGAGATCAGAAAATAGCTTCGATTCAGAACCAGCTTGCATCATTGAGTATTAAAGACGCTCCCATTATCGGATCCTTTAATCCAAAGAGAGGTGACATCGTCCTTGCACAGTTTAGCCTTGATAACTCCTGGAACCGTGCAATGATTGTGACAGCACCCCGAGCAGCGGTTCAATCCCCAGATGAAAAATTCGAAGTGTTCTACATCGATTATGGAAACCAAGAGACAGTTCCATACAGCGCAATCAGACCAATAGACCCTTCGGTATCTGCAGCACCAGGGCTCGCTCAGCTCTGCAGACTTGCCTACATAAAGGTTCCAAGCTTGGAAGACGACTTTGGTCCTGAAGCGGGAGAGTATTTGCATACTGTAACTCTGGGTAGTGGTAAAGAGTTCAAAGCAGTGATAGAAGAAAGAGACACATCTGGAGGCAAAGTCAAAGGGCAAGGCACTGGAACTGAATTCGTTGTCACTCTCATTGCTGTTGATGATGAGATCTCTGTAAATGCTGCAATGCTTCAGGAAGGAATAGCGAGAATGGAGAAACGTCAGAAATGGGGGCACAAAGGCAAACAAGCTGCTCTTGATGCTTTAGAGAAGTTCCAAGAGGAAGCTCGCAAGTCGAGAATTGGAATCTGGCAGTACGGTGACATTGAGTCCGATGATGAGGACACTGGTCCGGCCAGAAAGCCTGCTGGTGGTCGCCGGTAA推导的osw14氨基酸序列(SEQ ID NO2)MATGAENQWLKGRVKAVTSGDCLVITALSHNRAGPPPEKTITFSSLMAPKMARRGGIDEPFAWESKEFLRKLCIGKEVAFKVDYKVEAIAGREFGSVFLGNENLAKLVVKTGWAKVREPGQQNQDKVSPYIKELLQLEELAKQEGYGRWSKVPGAAEASIRNLPPSAIGDSAGFDAMGLLAANKGKPMEGIVEQVRDGSTIRVYLLPEFQFVQVFVAGVQAPSMGRRTTNGSVVETVPDEPNGDVSAESRGPLTTAQRLAASAASSVEVSSDPFATEAKYFTEHRVLSRDVRIVLEGVDKFNNLIGSVHYSDGETVKDLGLELVENGLAKFVEWSANMMEEEAKKKLKAAELQCKKDKVKMWANYVPPATNSKAIHDQNFTGKVVEVVSGDCLIVADDAVPFGSPAAERRVCLSSIRSPK
MGNPRREEKPAPYAREAREFLRQRLIGKQVIVQMEYSRKVTQGDGPTTSGAADRFMDFGSVFLPSAAKADSDEVTAPPAAAIAGSQPVGVNIAELVLVRGFGNVVRHRDFEERSNHYDALLAAEARALAGKKGIHSAKESPAMHITDLTVSAAKKAKDFLPSLQRIRRIPAVVEYVLSGHRFKLYIPKITCSIAFSFSGVRCPGRGEPYSEEAISVMRRRIMQRDVEIEVETVDRTGTFLGSMWESRTNVATVLLEAGLAKMQTSFGADRIAEAHLLEQAERSAKNQKLKIWENYVEGEEVSNGNTNTVETRQKETLKVVVTEVLGGGRFYVQSAGDQKIASIQNQLASLSIKDAPIIGSFNPKRGDIVLAQFSLDNSWNRAMIVTAPRAAVQSPDEKFEVFYIDYGNQETVPYSAIRPIDPSVSAAPGLAQLCRLAYIKVPSLEDDFGPEAGEYLHTVTLGSGKEFKAVIEERDTSGGKVKGQGTGTEFVVTLIAVDDEISVNAAMLQEGIARMEKRQKWGHKGKQAALDALEKFQEEARKSRIGIWQYGDIESDDEDTGPARKPAGGRRosw15的核酸序列(SEQ ID NO3)ATGGCAACCATGGCTAGGTCGTTTCTGCAGGCGATATCGAAGGATGAGGCGGTGGCTCCTCCGCTTAGAGTTGTTCAGATCGAAGGACTGGCTGTACTAAAGATAATCAAACACTGCAAGGAGTTTTCACCGACCCTTGTCACTGGACAGCTTCTTGGACTTGATGTTGGTAGCGTCCTCGAAGTTACCAATTGTTTTCCTTTCCCGGTCAGGGATGATGATGAAGAAATTGAAGCTGATGGTGCTAATTATCAGCTTGAGATGATGAGATGTCTGAGGGAGGTTAATGTTGACAACAACACTGTTGGCTGGTATCAATCTACAGTTCTTGGTTCGTATCAGACTGTGGAACTGATTGAGACCTTCATGAATTACCAGGAGAATATCAAGAGGTGTGTGTGCATCATATATGATCCCTCTAAAGCTGATCTAGGCGTCTTAGCTTTGAAGGCTTTGAAGCTTTCAGATTCCTTTATGGAGTTGTACCGAGGTGGAAACTTTACTGGCGAGAAGTTGAGAGAGAAAAATTTCTCCTGGATGGATATTTTTGAGGAAATACCTATCAAGGTTTCAAATTCTGCCCTTGTCAGTGCCTTTATGACCGAACTGGAGACTGATACACCTGTCTCACAGGGCGATTATGATCGTCTACACTCATCAACCACTCCTTTCCTTGAGAACAATATGGAGTTTTTGATTAAATGCATGGATGATTTATCTATGGAACAGCAAAAGTTCCAGTATTACTACCGGAACCTGTCTCGTCAGCAAGCACAACAGCAAGCCTGGCTCCAGAAGAGAAGAACGGAGAACATGGCTCGTAAATCAGCTGGAGAGGAGCCTTTACCAGAAGAGGATCCTTCAAACCCAATCTTTAAGGCGATCCCTGAACCATCTAGGCTAGAGAGTTTCCTCATCACAAACCAAGTCTCAAACTTCTGTGGCCAAATCAATGGAGTGGCTGGCCAGAACTTCAGCAGGCTTTACCTGACCAAAGCATTGCACGACAACTGA推导的osw15氨基酸序列(SEQ ID NO4)MATMARSFLQAISKDEAVAPPLRVVQIEGLAVLKIIKHCKEFSPTLVTGQLLGLDVGSVLEVTNCFPFPVRDDDEEIEADGANYQLEMMRCLREVNVDNNTVGWYQSTVLGSYQTVELIETFMNYQENIKRCVCIIYDPSKADLGVLALKALKLSDSFMELYRGGNFTGEKLREKNFSWMDIFEEIPIKVSNSALVSAFMTELETDTPVSQGDYDRLHSSTTPFLENNMEFLIKCMDDLSMEQQKFQYYYRNLSRQQAQQQAWLQKRRTENMARKSAGEEPLPEEDPSNPIFKAIPEPSRLESFLITNQVSNFCGQINGVAGQNFSRLYLTKALHDNosw16的核酸序列(SEQ ID NO5)ATGGCGCAACCCCTCGTGAAGAAAGACGATGATCACGACGATGAGTTGGAGTATTCTCCATTCATGGGAATTGAGAAAGGAGCGGTTCTTCAAGAGGCTAGAGTCTTTAATGACCCTCAGGTTGATCCTAGACGATGCTCCCAGGTCATTACGAAGCTTCTTTATTTGCTTAACCAAGGGGAGTCATTCACCAAGGTTGAAGCAACGGAAGTTTTCTTTTCAGTTACAAAGCTTTTTCAATCAAAAGACACGGGTTTGAGGAGAATGGTCTACTTGATCATTAAGGAGTTATCTCCATCATCTGATGA
GGTTATCATCGTAACAAGCTCTCTGATGAAGGATATGAATAGTAAAATTGATATGTATCGAGCAAATGCTATCCGTGTCCTCTGCCGGATAATAGACGGAACCCTTCTCACTCAGATTGAGCGATACTTGAAACAAGCCATTGTGGATAAGAATCCCGTTGTTTCAAGTGCAGCTTTAGTCAGTGGGCTTCACTTGCTCAAGACAAACCCAGAAATTGTTAAAAGATGGAGCAATGAAGTTCAAGAAGGTATTCAATCCAGATCAGCCCTTGTTCAGTTCCATGCCCTAGCTTTGCTCCATCAGATACGCCAAAATGATCGCTTGGCTGTTAGCAAATTGGTTGGTAGCTTGACCAGGGGATCTGTCCGCTCTCCCTTGGCTCAGTGTCTTTTGATACAACGTCCGTTCTATGAATTTTTGGAGAGTTGCCTGCGCCATAAGGCAGAAATGGTGATCCTTGAGGCTGCCAGGGCAATTACTGAGCTTGATGGTGTGACAAGCCGAGAACTGACTCCAGCAATCACTGTTCTTCAGCTCTTTTTGAGTTCCCCCAGACCAGTGTTGAGATTTGCCGCTGTCCGGACTCTGAACAAGGTTGCAATGACTCATCCTATGGCTGTCACCAACTGCAACATTGATATGGAGAGTTTAATCTCTGATCAAAATAGAAGCATTGCTACACTCGCAATAACCACACTATTGAAAACAGGGAACGAATCAAGTGTAGAACGTTTGATGAAGCAGATAACTAATTTTATGTCAGATATTGCTGATGAGTTCAAAATTGTGGTCGTGGACGCAATAAGATCGTTGTGTGTGAAATTCCCACTGAAATACAGATCCTTGATGACCTTCTTAAGCAACATTCTTAGGGAAGAAGGTGGATTTGAGTATAAAAGAGCAATAGTAGATTCTATTGTGACCATTATCAGAGATATTCCGGATGCAAAGGAAAGTGGACTGCTTCATCTATGTGAATTCATTGAAGATTGTGAATTCACATATCTTTCAACACAGATCCTTCATTTTCTGGGAATTGAGGGGCCTAACACCTCAGATCCAAGCAAGTATATACGATATATATATAATCGTGTGCATCTAGAAAACGCCACTGTCCGGGCTGCTGCTGTTTCCACACTTGCAAAGTTTGGGTTTATGGTTGAATCCTTGAAGCCCCGGATTACTGTTCTATTGAAGCGTTGCATCTATGACAGTGATGATGAGGTCCGTGATAGGGCAACACTATATTTGAGTGAGCCCTCTGAAGAAGCTTTTGATATCAACTCCGTACCTAAGGAAGTTAAATCTCAGCCCCTTGCAGAGAAGAAAGCCCAGGGTAAAAAGCCCACTGGTCTTGGTGCACCACCAGCTGCACCTGCTTCTGGTTTTGATGGCTATGAAAGACTTCTCTCATCCATTCCAGAGTTTGCCGCCTTTGGAAAACTTTTCAAGTCTTCTTTACCTGTGGAGCTAACTGAAGCAGAAACAGAATACGCTGTCAATGTTGTTAAGCATATCTTTGACAGTCATGTGGTGTTTCAGTACAACTGCACTAACACAATACCAGAGCAGTTGTTGGAGAGGGTACTGAACATTGAAGCTGAGGAATTCAGTGAAGTAACTTCAAAGGCCCTAAACTCACTTCCTTACGATTCACCCGGTCAAGCCTTTGTGGTTTTTGAGAAGCCAGCTGGGGTCCCTGCTGTTGGAAAGTTCTCCAACACATTGACTTTCGTTGTTAAGGAGGTACATGTTGACCCAAGCACAGGTGAAGCAGAAGATGATGGAGTAGAAGATGAGTACCAGCTAGAGGATCTTGAGGTTGTAGCTGGAGATTACATGGTGAAAGTGGGTGTCTCCAATTTCAGGAATGCGTGGGAAAGCATGGATGAAGAAGATGAGCGTGTAGACGAATATGGCCTTGGCCAAAGAGAGAGTTTGGGAGAAGCTGTAAAGGCTGTCATGGATCTTCTTGGCATGCAGACTTGTGAGGGGACGGAGACAATTCCGCTCAATGCAAGGTCACACACGTGTCTATTGTCAGGTGTGTACATAGGCAACGTGAAAGTGTTAGTGAGGGCACAGTTTGGAATGGACAGCTCAAAGGACATTGCAATGAAGCTGACAGTTAGAGCTGAAGACGTTTCTGTCGCCGAGGCCATTCACGAGATTGTTGCCAGCGGCTAA推导的osw16氨基酸序列(SEQ ID NO6)MAQPLVKKDDDHDDELEYSPFMGIEKGAVLQEARVFNDPQVDPRRCSQVITKLLYLLNQGESFTKVEATEVFFSVTKLFQSKDTGLRRMVYLIIKELSPSSDEVIIVTSSLMKDMNSKIDMYRANAIRVLCRIIDGTLLTQIERYLKQAIVDKNPVVSSAALVSGLHLLKTNPEIVKRWSNEVQEGIQSRSALVQFHALALLHQIRQNDRLAVSKLVGSLTRGSVRSPLAQCLLIRYTSQVIRDMANHGQSGERPFYEFLESCLRHKAE
MVILEAARAITELDGVTSRELTPAITVLQLFLSSPRPVLRFAAVRTLNKVAMTHPMAVTNCNIDMESLISDQNRSIATLAITTLKTGNESSVERLMKQITNFMSDIADEFKIVVVDAIRSLCVKFPLKYRSLMTFLSNILREEGGFEYKRAIVDSIVTIIRDIPDAKESGLLHLCEFIEDCEFTYLSTQILHFLGIEGPNTSDPSKYIRYIYNRVHLENATVRAAAVSTLAKFGFMVESLKPRITVLLKRCIYDSDDEVRDRATLYLSVLGGDGTVDTDKESKDFLFGSLEVPLVNMETSLKNYEPSEEAFDINSVPKEVKSQPLAEKKAQGKKPTGLGAPPAAPASGFDGYERLLSSIPEFAAFGKLFKSSLPVELTEAETEYAVNVVKHIFDSHVVFQYNCTNTIPEQLLERVNVIVDASEAEEFSEVTSKALNSLPYDSPGQAFVVFEKPAGVPAVGKFSNTLTFVVKEVDPSTGEAEDDGVEDEYQLEDLEVVAGDYMVKVGVSNFRNAWESMDEEDERVDEYGLGQRESLGEAVKAVMDLLGMQTCEGTETIPLNARSHTCLLSGVYIGNVKVLVRAQFGMDSSKDIAMKLTVRAEDVSVAEAIHEIVASGosw17的核酸序列(SEQIDNO7)ATGCCGATTAGCCGGAGAGTTCTGACGCCGATCACCGCCGCTCCGGTTATCTTAGCCGTCCTTTGCTTCTTCTTTTGGTCATCAATCATCGGGCCGGACAATTTAAAGGGCACGAAACACGTCCTTCAAGATGCTAAGACCATTCCTCTTCCCGTCGATGGACCAGAGAGCCTAGAGTTCGATCCACAAGGTGAAGGCCCTTACGTTGGCGTCACCGACGGTCGCATTCTCAAATGGCGCGGTGAAGAACTCGGCTGGGTCGATTTCGCCTACACTTCTCCTCACAGAGATAACTGTTCGAGTCATGAGGTAGTACCAAGTTGTGGGAGACCATTGGGACTTAGCTTCGAGAGGAAAACAGGAGATTTGTACATATGTGATGGTTACTTTGGGGTCATGAAGGTCGGACCAGAGGGAGGCCTGGGCGAGTTAGTTGTTGATGAAGCCGAAGGTCGTAAAGTTATGTTTGCCAACCAAGGGGATATAGACGAAGAGGAAGATATTTTCTACTTCAATGATAGCAGCGATACATACCATTTCAGGGACGTATTTTACGTGTCTTTGTCCGGGACAAAGGTTGGAAGAGTAATTAGATACGATATGAAGAAGAAAGAGGCCAAAGTTATTATGGACAAACTTCGTTTACCAAATGGTCTAGCTCTAAGCAAAAACGGTTCGTTTGTAGTCACATGCGAGAGTAGTACGAACATTTGCCATAGAATATGGGTCAAAGGTCCCAAATCCGGAACCAACGAGGTTTTCGCAACGCTCCCTGGTTCCCCGGACAATATCCGGCGTACGCCAACAGGCGATTTCTGGGTCGCATTACATTGCAAAAAGAATTTGTTCACACGTGCAGTTTTGATTCACACTTGGGTCGGAAGGTTTTTCATGAACACGATGAAGATGGAGACTGTAATTCATTTCATGAACGGAGGAAAACCTCATGGAATTGTCGTGAAACTCTCTGGAGAGACAGGAGAGATTCTTGAGATACTTGAGGACAGTGAAGGGAAGACGGTGAAATATGTTAGTGAGGCTTATGAGACAAAAGATGGAAAGTTATGGATCGGATCTGTGTATTGGCCGGCCGTTTGGGTTCTTGATACATCGGTTTATGATTCCATATGA推导的osw17氨基酸序列(SEQ ID NO8)MPISRRVLTPITAAPVILAVLCFFFWSSIIGPDNLKGTKHVLQDAKTIPLPVDGPESLEFDPQGEGPYVGVTDGRILKWRGEELGWVDFAYTSPHRDNCSSHEVVPSCGRPLGLSFERKTGDLYICDGYFGVMKVGPEGGLAELVVDEAEGRKVMFANQGDIDEEEDIFYFNDSSDTYHFRDVFYVSLSGTKVGRVIRYDMKKKEAKVIMDKLRLPNGLALSKNGSFVVTCESSTNICHRIWVKGPKSGTNEVFATLPGSPDNIRRTPTGDFWVALHCKKNLFTRAVLIHTWVGRFFMNTMKMETVIHFMNGGKPHGIVVKLSGETGEILEILEDSEGKTVKYVSEAYETKDGKLWIGSVYWPAVwVLDTSVYDSI
osw18的核酸序列(SEQ ID NO9)ATGCCCATTAATCAGAAAATTCCGACTTGGTTTGCCGTTCCGGCTGTTTTTGCTGTCTTGTCCGTAATCTCGTATCAAACCTTAATTGTGCCGGAAAATTTAGAGGGCGCCAAAAATGTATTGACAATGGCTAAGACCATACCAATTCCTGTCGCTGGACCGGAGAGCATTGAGTTTGACCCAAAAGGAGAAGGTCCTTATGCTGCGGTCGTGGACGGCCGTATTCTCAAGTGGCGCGGCGATGATCTCGGCTGGGTTGATTTTGCCTACACATCTCCTCACAGAGGGAACTGTTCAAAAACTGAAGTAGTGCCTACTTGTGGAAGGCCATTAGGACTTACTTTCGAGAAGAAAACGGGAGATTTGTACATATGTGATGGTTACTTGGGGCTCATGAAAGTTGGACCAGAGGGAGGCTTGGCCGAGTTAATTGTTGATGAAGCCGAAGGTCGTAAAGTTATGTTTGCTAACCAAGGGGATATAGACGAAGAGGAAGATGTCTTTTACTTCAATGATAGTAGTGACAAGTATCATTTCAGGGACGTATTTTTCGTGGCTGTCAGTGGGGAGCGGTCGGGAAGAGTGATCAGATACGATAAGAAGACGAAAGAAGCCAAAGTTATCATGGACAATCTCGTTTGTAACAACGGTTTGGCTCTAAACAAAGACCGGTCTTTTCTAATTACATGCGAGTCCGGCACAAGTCTTGTCCACCGATACTGGATTAAAGGTCCCAAAGCCGGGACTCGTGATATCTTTGCGAAGGTCCCAGGTTACCCTGACAACATCCGGCTGACATCAACTGGAGACTTTTGGATTGGTTTACACTGCAAGAAAAATCTGATAGGGAGATTGATTGTGAAGTACAAATGGCTTGGGAAATTGGTAGAAAAGACAATGAAACTGGAGTACGTGATTGCTTTTATTAACGGATTTAAACCGCACGGAGTCGCCGTGAAAATCTCCGGCGAGACGGGAGAGGTACTTGAGTTACTTGAGGACAAAGAAGGAAAGACAATGAAGTATGTAAGCGAGGCTTATGAAAGAGATGATGGAAAGTTGTGGTTTGGGTCTGTTTACTGGCCAGCCGTTTGGGTTCTTGATCGCAAATGA推导的osw18氨基酸序列(SEQ ID NO10)MPINQKIPTWFAVPAVFAVLSVISYQTLIVPENLEGAKNVLTMAKTIPIPVAGPESIEFDPKGEGPYAAVVDGRILKWRGDDLGWVDFAYTSPHRGNCSKTEVVPTCGRPLGLTFEKKTGDLYICDGYLGLMKVGPEGGLAELIVDEAEGRKVMFANQGDIDEEEDVFYFNDSSDKYHFRDVFFVAVSGERSGRVIRYDKKTKEAKVIMDNLVCNNGLALNKDRSFLITCESGTSLVHRYWIKGPKAGTRDIFAKVPGYPDNIRLTSTGDFWIGLHCKKNLIGRLIVKYKWLGKLVEKTMKLEYVIAFINGFKPHGVAVKISGETGEVLELLEDKEGKTMKYVSEAYERDDGKLWFGSVYWPAVWVLDRKosw20的核酸序列(SEQ ID NO11)ATGGAGTGTAGTTCAGTGAGTGTACTAGGAATATTACTGGTATTTCCTCTCCTTCATAACCTTGTCACCATCTCCGGGCAGAATCTTCCGGCGGTGGGTTTGTTCACTTTCGGAGATTCCAACTTCGACGCTGGAAATAAAAAGTCCTCACAAGTGCTCCACTTCCTCAAAACTTTTGGCCTTACGGTAAATCTCGAGATGACCCTAAGGGCAAGTTTTCTGATGGCAAAATTGTCCCGGACTTTATTGCAAAATTCATGGGGATACCACACGATTTACCGCCGGCGCTAAAACCCGGCACCGATGTGTCACGAGGAGCCAGCTTCGCCGTCGGGTCCGCTTCCATTCTTGGATCTCCAAAAGATTCTTTGGCTCTGAATCAACAAGTGAGGAAATTCAATCAGATGATATCAAATTGGAAAGTGGATTACATTCAGAAATCAGTGTTTATGATTAGCATTGGTATGGAAGATTACTACAACTTTACCAAAAACAATCCTAATGCTGAAGTTTCTGCTCAACAAGCTTTCGTTACTTCTGTCACTAACCGGTTTAAGAGTGATATCAACTTGTTGTATTCATCTGGAGCTAGTAAATTCGTCGTACACTTGCTAGCGCCATTAGGTTGTTTACCGATCGCAAGACAAGAATTTAAAACCGGTAACAATTGTTACGAGAAACTCGATGATTTGGCCAAACAACACAACGCTAAAATTGGACCGATTTTGAACGAAATGGCGGAAACTAAACCGGATTTCCAATTCACCGTTTTCGATTTCTACAACGTTATTCTTCGCAGGACACAAAGAAACATGAACTAC
CGGTTTTCCGTGACGAATATATCGTGTTGCGGTGTTGGGACGCATTATGCATATGGTTGTGGTTTACCTAACGTGCACTCGAAGTTATGCGAATATCAAAGATCCTACCTTTACTTCGACGCACGTCATAACACAGAGAAAGCACAAGAAGCGTTTGCTCATCTTATCTTTGGAGCTGACCCAAATGTTATCCAACCTATGAATGTTCGTGAGCTCATGGTGTATCCTGTTAATGAGCCTATGCGTGAGTTTTGGGAGGATCCAATGGATGAGAAGTTATCGTTAGTCCAATACTAG推导的osw20氨基酸序列(SEQ ID NO12)MECSSVSVLGILLVFPLLHNLVTISGQNLPAVGLFTFGDSNFDAGNKKFLTSAPLPQNFWPYGKSRDDPKGKFSDGKIVPDFIAKFMGIPHDLPPALKPGTDVSRGASFAVGSASILGSPKDSLALNQQVRKFNQMISNWKVDYIQKSVFMISIGMEDYYNFTKNNPNAEVSAQQAFVTSVTNRFKSDINLLYSSGASKFVVHLLAPLGCLPIARQEFKTGNNCYEKLNDLAKQHNAKIGPILNEMAETKPDFQFTVFDFYNVILRRTQRNMNYRFSVTNISCCGVGTHYAYGCGLPNVHSKLCEYQRSYLYFDARHNTEKAQEAFAHLIFGADPNVIQPMNVRELMVYPVNEPMREFWEDPMDEKLSLVQYosw21的核酸序列(SEQ ID NO13)ATGGTTGAAACCTTGTTTGAAGACATATTTAGGGTTGATCAGCTTGATCCAGATGGCAAGAAGTTTGACAAAGTTAATCGCATTGAAGCAAGGAGCGATCAGTTAGATATGTACATGCAGCTGGATGTGAATACAGAGGTTTATCCTATGCATGTCGGTGATAAGTTTATGATGGTTTTAGCATCTACCTTAAATTTGGATGGAACTCCCGACAGTGGCTTTTTTACTCCGGGTGGCAGAAAGTCTCTCGCTGACAAATTTGAGTATGTGATGCACGGCAAATTGTACAGGATATCTGAGGAAGGGTCCGGAGCCAATGTTAAAGCGGACATTTATGTTTCATTCGGCGGTTTATTAATGTTGTTGAGGGGCGATCCCTCAATTGCAGCTAAATTTGAGCTTGATCAGAGGTTATTCATCCTTATGAGGAAGGTGGATAAGGCCTAG推导的osw21氨基酸序列(SEQ ID NO14)MVETLFEDIFRVDQLDPDGKKFDKVNRIEARSDQLDMYMQLDVNTEVYPMHVGDKFMMVLASTLNLDGTPDSGFFTPGGRKSLADKFEYVMHGKLYRISEEGSGANVKADIYVSFGGLLMLLRGDPSIAAKFELDQRLFILMRKVDKAosw22的核酸序列(SEQ ID NO15)ATGGTTGATGCTGAGAAACGGCTTTTGGCGAATGCACTGAAAGACCCCGACAATCAGCATTTTGTGTTACTTTCTGACAGCTGTGTACCGTTGCACAACTTTGACTATATTTACAACTATCTTATGTACACAAATGTCAGCTTCATTGACAGCTTTGAGGATCCTGGTCCACATGGAAGTGGTCGGTACTCGGATCATATGTTACCTGAAGTCGAAAAAAAATTCTTTAGGAAGGGTGCTCAGTGGTTCACGATGAAGCGTCAACATGCCATCATAGTTATGGCGGATAATCTCTACTATACAAAGTTCAGAGATTATTGTAGGCCGGGTATGGACGGGCGCAATTGCTATGCAGATGAACATTATTTGCCAACATTTTTCCATATGTTTGATCCTACTGGGATTGCAAACTGGTCGGTGACACACGTTGACTGGTCAGAACGAAAATGGCACCCGAAATCATACGATCTGAAGGACGTTTCTTACCAGCTCATCAAAAATCTCTCGTCTATCACTGAAAGTGTTCACGAAACGAGCGATAGAAAGAGGGTAACTACAGTTACGCCGTGTATGTGGAATGGTATGAACCGGCCGTGTTACTTATTTGCAAGAAAATTCCTGCCCGAGACGTTAGACACTTTGATTGACCTTTTCCCTCGTTACACGACAATATGA
推导的osw22氨基酸序列(SEQ ID NO16)MGKKDMPKRSHLKKPTWIIILVSLVCVFLVVGYVYPPRDSTACYIFSSSSCKKISRWLPPPERELSDKEIASRVVTKNLLNTPPIKTKNPKIAFMFLSPGSLAFERLWDKFFQGHEGRFSIHIASRVKPVHSSRYFQNREIRSDKVDWGKISMVDAEKRLLANALKDPDNQHFVLLSDSCVPLHNFDYIYNYLMYTNVSFIDSFEDPGPHGSGRYSDHMLPEVEKKFFRKGAQWFTMKRQHAIIVMADNLYYTKFRDYCRPGMDGRNCYADEHYLPTFFHMFDPTGIANWSVTHVDWSERKWHPKSYDLKDVSYQLIKNLSSITESVHETSDRKRVTTVTPCMWNGMNRPCYLFARKFLPETLDTLIDLFPRYTTIosw23的核酸序列(SEQ ID NO17)ATGATATTATCGTTTCGTGGACAAGTTGAATTATTGGCAAAACATCCTTACGGTTGCCGTGTCATACAGAGGGTATTAGAGCATTCAACGGACGAAGTACAAAGCCGATTCATAGTGGACGAGATCTTGGAGAATGTTTATGTTCTTGCACAAGATCAGTATGGCAATTATGTAACTCAGTATGTGTTGGAGGCGGAGAAACCAGAGGTGAGAAGCCAGATAGTAGACAAATTGTTGGGCCATATAGTGCGATTAAGCCAACACAAATATGCCTCAAATGTTGTCGAAAAATGTTTGGAATATGGTGATGAAGCTATAAGAAAAATCCTAATTGAAGAGATTATTGAATGTGCTGATGGCAATGATAACTTATTGGTGTTGGTGAAAGACCAATATGCAAATTATGTGGTCCAAAAGGTTCTTCAAATATGTAGCGACCACCAACGGAAAGTGTTGCTTAGTCGTATGAAAGGTCATCTGAATTTGTTGAAGACATATACTTATGGGAAACATATCGTTGCTCGCTTTGAACAATTGTATGGTGAAGAAATTGCGGCGTTGGGTTCAAACATGAGCGATGGCAAATCTGTATAG推导的osw23氨基酸序列(SEQ ID NO18)MILSFRGQVELLAKHPYGCRVIQRVLEHSTDEVQSRFIVDEILENVYVLAQDQYGNYVTQYVLEAEKPEVRSQIVDKLLGHIVRLSQHKYASNVVEKCLEYGDEAIRKILIEEIIECADGNDNLLVLVKDQYANYVVQKVLQICSDHQRKVLLSRMKGHLNLLKTYTYGKHIVARFEQLYGEEIALGSNMSDGKSVos24的核酸序列(SEQ ID NO19)ATGAACCGGATGATCGAAGCGTGGAATGCGATTCCGGATGTGCCGGAGTCACATTCTTCTAAAGGTGATATGGCAGAAGAATCTGATCATATACAAAATCCACCAAAAACACCTTATATAATGAGTAAGCGAACTACAACGAGAAGAAATTCGCTTGAGAATAGCAGCAGGAAAACTGTTCCAGCCATGTTCAGTAAGCTGGATCGCAAGAAACCCGTTAATCAGAAACTCGACACTGCTGAGGTTCATATGAAACACGAAACAAAACGGGCCGTTTTTAGTGAAATTTCTGATGAAAAGATGCAAGAATCTCGATATAATGAAGATAGATCGAGTTCCAAAGTTGTGGGGAGCAATGGCGGATTGAATACCAACTCTGTTGAACAAGAATCCGAGGACTTATCTTTGATCCGCAATCAACTTGCTCAAATCGAGACCCAACAATCCAATTTATATGATCTCCTCGAGAAATTTATCGGGAGCTCGCTGAACGGGATGCAATCTCTGGAGTCTCGTGTGCGCGGTGTAGAGTCAACACTCGACGAGATTTCATTTGACTTAGCAAAGTCAACTGGACAGGTGTCGAATCCGGAACCCACCTTGTGTTGTAAGTTACCAGGTGCAGATCTTATTAGCTCTAAACTCTGGAAGAAATCAGAAATCCAACAGTACCCATCTGTCAAGAACAAGGATCTTGAATCATTCAACTTTCAAACCACCGGATTCCATCTCCGTGCCGGGCTAATTAAGAACCCATTGGCCGAGGTGCACCAAATATGA
推导的osw24氨基酸序列(SEQ ID NO20)MNRMIEAWNAIPDVPESHSSKGDMAEESDHIQNPPKTPYIMSKRTTTRRNSLENSSRKTVPAMFSKLDRKKPVNQKLDTAEVHMKHETKRAVFSEISDEKMQESRYNEDRSSSKVVGSNGGLNTNSVEQESEDLSLIRNQLAQIETQQSNLYDLLEKFIGSSLNGMQSLESRVRGVESTLDEISFDLAKSTGQVSNPEPTLCCKLPGADLISSKLWKKSEIQQYPSVKNKDLESFNFQTTGFHLRAGLIKNPLAEVHQIosw26的核酸序列(SEQ ID NO21)ATGCAGACCGTTTCTCGGAGATTAGCTCGTGAAAATTTGAGCTCTCGCACATCGATTTACTCTCTCAAATCGCTTTATCCTGTTTCCGATCGCTGTTACGGTGAGTATGATCGGCGTTATGCCTCTACGCTTACCACCAAAGGTATTGGACATCTGGTCCGCAAGGGTACTGGTGGAAGATCGTCTGTTAGTGGGATAGTTGCTACAGTATTCGGAGCTACTGGTTTCCTTGGGCGTTACTTGGTGCAACAGCTTGCTAAAACGGGTTCACAAGTGCTAGTACCATTTAGAGGTTCCGAAGATTCGCCCCGTCATCTCAAACTGATGGGCGATTTGGGGCAGATTGTTCCCATGAAATATAATCCTAGAGATGAAAACTCAATTAAGGCAGTCATGGCCAAGGCAAATGTTGTGATTAATCTCATAGGAAGGGAATATGAAACCAGAAATTATAGTTTTGAGGAAGTGAACCATCATATGGCTGAACAACTTGCAAAGATTTCCAAAGAACATGGTGGAATCATGAGATTTATACAACTGTCGTGTTTAGGTGCATCTAAATCATCTCCATCTAGGATGCTTCAAGCCAAGGCTGCTGCAGAAGAATCCATCTTACGTGAATTGCCTGAGGCCACAATACTGCGACCTGCAGTGATGGTTGGTACAGAAGATCGGATCTTGAACCCATGGGCKCAGATCGCTAAAAAATATAACTTTCTTCCAATGATCGGGGSWGRYTCTACTAAGATTCAGCCATGGTATGTTGCTGATGTCGCCTCTGCAGTTGTTGCGGCACTAAGTGATGACGGGAGTAGCACGGAAAAAGAGTATGACACTATGGTGGGCCTGATAGTTTATACACTGCATCAACTGGCTGAACTTATGTATCAAACGATTCGAGAATGGACTCATTGA推导的osw26氨基酸序列(SEQ ID NO22)MQTVSRRLARENLSSRTSIYSLKSLYPVSDRCYGEYDRRYASTLTTKGIGHLVRKGTGGRSSVSGIVATVFGATGFLGRYLVQQLAKTGSQVLVPFRGSEDSPRHLKLMGDLGQIVPMKYNPRDENSIKAVMAKANVVINLIGREYETRNYSFEEVNHHMAEQLAKISKEHGGIMRFIQLSCLGASKSSPSRMLQAKAAAEESILRELPEATILRPAVMVGTEDRILNPWAQXAKKYNFLPMIGXXSTKIQPWYVADVASAVVAALSDDGSSTEKEYDTMVGLIVYTLHQLAELMYQTIREWTHJB69的核酸序列(SEQ ID NO23)ATGAAGATATACTCTAGAACGGTTGCTGTTTCACTCATTGTGTCATTCCTCCTGTGTTTCTCTGCCTTTGCTGAGCGCAATGACGGGACCTTCAGAGTTGGACTGAAAAAACTCAAGTTGGATTCGAAAAATCGGCTTGCAGCACGCGTCGAATCCAAGCAAGAAAAGCCCCTGAGAGCTTACAGACTTGGAGATTCTGGAGATGCTGATGTTGTTGTGCTTAAGAATTATCTAGATGCTCAGTACTATGGTGAGATCGCCATTGGTACTCCACCTCAGAAGTTCACTGTGGTTTTTGACACTGGGAGCTCTAACCTCTGGGTGCCATCATCAAAATGCTATTTCTCACTTGCATGTCTCTTGCATCCCAAATACAAGTCGTCTCGTTCAAGCACATATGAGAAGAATGGAAAAGCTGCCGCAATTCATTACGGCACTGGAGCAATTGCTGGTTTTTTTAGTAATGATGCTGTCACAGTTGGCGATTTAGTTGTCAAGGATCAGGAGTTTATCGAGGCAACCAAGGAGCCTGGTATAACATTTGTTGTAGCTAAATTTGATGGTATCCTTGGTCTTGGATTCCAAGAGATCTCTGTTGGAAAAGCTGCTCCTGTTTGGTACAACATGCTCAAGCAAGGCCTTATCAAGGAGCCGGTTTTTTCATTTTGGCTTAACCGTAATGCAGATGAAGAAGAAGGTGGTGAACTTGTATTTGGAGGTGT
TGATCCAAATCATTTCAAGGGCAAACATACATATGTTCCTGTGACACAAAAGGGCTACTGGCAGTTTGACATGGGTGATGTTCTTATTGGCGGTGCACCCACTGGGTTCTGTGAAAGTGGCTGTTCTGCGATAGCAGATTCTGGTACATCTTTGCTTGCCGGTCCAACGACTATAATCACCATGATAAACCATGCTATTGGAGCAGCTGGAGTTGTTAGCCAGCAGTGCAAGACTGTTGTGGATCAATACGGGCAGACCATTTTGGATTTACTTTTGTCTGAGACCCAACCGAAGAAAATCTGCTCGCAGATTGGTCTGTGTACTTTTGATGGTACCCGTGGTGTCAGTATGGGCATTGAGTCGGTGGTGGACAAGGAAAACGCCAAATTGTCTAATGGTGTTGGAGATGCTGCGTGTTCTGCATGTGAGATGGCTGTTGTGTGGATCCAGAGCCAGTTGAGGCAAAACATGACTCAAGAGCGCATATTGAACTACGTCAACGAGCTATGTGAACGCCTCCCCAGCCCAATGGGAGAGTCTGCAGTTGACTGTGCACAACTGTCAACAATGCCCACTGTTTCACTTACCATTGGAGGCAAAGTATTTGATCTTGCTCCAGAAGAGTATGTTCTGAAAGTTGGTGAGGGACCTGTGGCACAGTGCATCAGTGGTTTTATTGCTCTTGACGTTGCTCCACCTCGTGGACCTCTCTGGATCTTGGGAGATGTGTTCATGGGCAAATACCACACCGTATTTGACTTTGGTAACGAACAGGTCGGGTTTGCAGAGGCAGCCTAA推导的JB69氨基酸序列(SEQ ID NO24)MKIYSRTVAVSLIVSFLLCFSAFAERNDGTFRVGLKKLKLDSKNRLAARVESKQEKPLRAYRLGDSGDADVVVLKNYLDAQYYGEIAIGTPPQKFTVVFDTGSSNLWVPSSKCYFSLACLLHPKYKSSRSSTYEKNGKAAAIHYGTGAIAGFFSNDAVTVGDLVVKDQEFIEATKEPGITFVVAKFDGILGLGFQEISVGKAAPVWYNMLKQGLIKEPVFSFWLNRNADEEEGGELVFGGVDPNHFKGKHTYVPVTQKGYWQFDMGDVLIGGAPTGFCESGCSAIADSGTSLLAGPTTIITMINHAIGAAGVVSQQCKTVVDQYGQTILDLLLSETQPKKICSQIGLCTFDGTRGVSMGIESVVDKENAKLSNGVGDAACSACEMAVVWIQSQLRQNMTQERILNYVNELCERLPSPMGESAVDCAQLSTMPTVSLTIGGKVFDLAPEEYVLKVGEGPVAQCISGFIALDVAPPRGPLWILGDVFMGKYHTVFDFGNEQVGFAEAAJB70的核酸序列(SEQ ID NO25)ATGGGAGTATACTCGAGAGCGGTTTGCGTTTTCGGGCTTTGTGTCGTTTCTGCTGTTTTTCACTGCTTATTCTAAGAGAAATGATGGAACATTCAGAGTTGGCCTGAAAAAACTGAAGTTGGATCCTAACAACCGACTCGCAACACGCTTTGGTTCCAAGCAAGAAGAGGCCTTGAGATCTTCTTTGCGTTCGTACAACAACAATCTTGGTGGTGATTCTGGAGATGCTGATATTGTCCCGCTCAAGAATTACTTGGATGCTCAGTACTATGGTGAGATTGCTATTGGTACTCCACCGCAGAAGTTCACTGTCATTTTTGATACCGGAAGCTCTAACCTTTGGGTGCCATCAGGAAAATGTTTTTTCTCGCTGTCTTGTTACTTTCATGCTAAGTACAAGTCCTCGCGATCAAGCACATATAAGAAGAGTGGAAAACGTGCCGCAATCCATTACGGCTCAGGATCAATCTCTGGTTTCTTTAGTTATGATGCTGTCACGGTTGGTGATTTGGTTGTCAAAGATCAGGAGTTTATTGAGACAACCAGTGAGCCTGGTTTAACATTCCTGGTGGCTAAGTTTGATGGTCTTCTTGGTCTTGGGTTCCAAGAGATCGCTGTTGGAAACGCTACTCCTGTTTGGTACAATATGCTCAAGCAAGGCCTTATAAAGAGGCCGGTCTTTTCATTTTGGCTTAACCGTGATCCAAAGAGTGAAGAAGGCGGTGAAATCGTATTCGGAGGTGTTGATCCAAAGCATTTTAGAGGAGAACATACATTTGTTCCTGTGACACAAAGGGGTTACTGGCAGTTCGACATGGGTGAGGTTCTCATTGCCGGTGAATCTACTGGATATTGTGGAAGTGGTTGTTCTGCGATAGCAGATTCTGGAACATCGTTACTTGCGGGTCCAACGGCTGTGGTTGCCATGATAAATAAGGCTATTGGAGCATCTGGAGTTGTTAGCCAGCAGTGCAAGACTGTTGTTGACCAGTATGGACAAACCATTTTGGATTTACTTTTGGCTGAGACTC
AACCAAAGAAGATTTGCTCACAAATTGGTCTTTGCGCTTACGATGGCACCCATGGGGTCAGTATGGGGATTGAATCGGTGGTGGACAAGGAAAACACAAGATCATCTAGTGGTCTTCGAGACGCGGGTTGTCCTGCATGTGAAATGGCGGTTGTGTGGATACAGAGCCAATTGAGGCAGAACATGACTCAAGAGAGGATAGTGAACTACATTAATGAGATATGCGAGCGCATGCCTAGTCCAAATGGAGAGTCTGCTGTTGACTGCTCACAACTTTCTAAAATGCCTACTGTTTCATTCACCATTGGAGACAAAGTCTTTGATCTTGCTCCCGAAGAGTACGTACTGAAGATTGGGGAAGGACCAGTGGCACAATGTATTAGCGGCTTTACCGCACTTGATATCCCTCCACCTCGTGGACCTCTCTGGATACTTGGAGATGTGTTTATGGGAAAATACCACACTGTCTTTGACTTCGGAAACGAGCAGGTTGGCTTCGCAGAAGCCGTGTGA推导的JB70氨基酸序列(SEQ ID NO26)MGVYSRAVAFSGFVSFLLFFTAYSKRNDGTFRVGLKKLKLDPNNRLATRFGSKQEEALRSSLRSYNNNLGGDSGDADIVPLKNYLDAQYYGEIAIGTPPQKFTVIFDTGSSNLWVPSGKCFFSLSCYFHAKYKSSRSSTYKKSGKRAAIHYGSGSISGFFSYDAVTVGDLVVKDQEFIETTSEPGLTFLVAKFDGLLGLGFQEIAVGNATPVWYNMLKQGLIKRPVFSFWLNRDPKSEEGGEIVFGGVDPKHFRGEHTFVPVTQRGYWQFDMGEVLIAGESTGYCGSGCSAIADSGTSLLAGPTAVVAMINKAIGASGVVSQQCKTVVDQYGQTILDLLLAETQPKKICSQIGLCAYDGTHGVSMGIESVVDKENTRSSSGLRDAGCPACEMAVVWIQSQLRQNMTQERIVNYINEICERMPSPNGESAVDCSQLSKMPTVSFTIGDKVFDLAPEEYVLKIGEGPVAQCISGFTALDIPPPRGPLWILGDVFMGKYHTVFDFGNEQVGFAEAVJB71 的核酸序列(SEQ ID NO27)ATGGGAACTAGGTTCCAATCATTCTTGCTCGTGTTCTTGCTTTCATGTTTAATCCTCATATCAACTGCCTCGTGTGAGCGAAATGGTGATGGAACGATTAGAATTGGATTGAAGAAGAGGAAACTAGACCGGAGCAACAGGCTAGCTTCTCAGCTTTTTTTGAAAAACCGAGGGTCTCATTGGTCTCCCAAACACTATTTTCGCCTGAACGATGAAAATGCGGATATGGTTCCGCTGAAAAACTATTTGGATGCTCAATACTATGGTGACATTACCATTGGTACTCCTCCTCAGAAGTTCACTGTGATCTTTGATACTGGTAGCTCCAATCTCTGGATACCATCTACTAAATGTTACCTATCGGTTGCTTGTTATTTCCACTCCAAGTACAAGGCTAGCCAGTCATCGTCATATAGAAAGAACGGAAAACCCGCGTCTATCCGCTATGGGACGGGTGCTATTTCTGGTTACTTTAGCAATGATGATGTTAAAGTTGGTGATATTGTTGTGAAAGAGCAGGAATTCATAGAGGCTACTAGTGAGCCTGGTATAACATTCTTGCTAGCAAAGTTTGATGGTATCCTCGGTTTGGGTTTCAAAGAGATTTCTGTAGGAAACTCAACTCCGGTTTGGTATAACATGGTAGAAAAAGGTTTAGTTAAGGAACCGATTTTTTCGTTCTGGCTTAACCGTAACCCGAAAGATCCAGAAGGCGGTGAGATTGTTTTCGGTGGAGTCGACCCGAAGCACTTCAAAGGAGAGCATACTTTTGTTCCTGTGACACATAAAGGTTACTGGCAGTTTGACATGGGTGATCTCCAAATTGCTGGCAAACCAACCGGATATTGTGCTAAAGGTTGTTCTGCTATTGCTGATTCCGGAACTTCTCTGCTCACCGGTCCATCGACTGTCATCACGATGATCAATCACGCGATAGGAGCACAAGGAATTGTAAGCCGTGAATGCAAGGCCGTGGTGGATCAATACGGAAAAACCATGTTGAATTCTCTTCTAGCTCAGGAGGATCCGAAGAAAGTATGCTCACAAATTGGAGTCTGCGCTTATGATGGTACACAGAGTGTGAGTATGGGGATCCGGTCAGTTGTAGACGATGGAACATCGGGTCTTTTAAACCAAGCGATGTGCAGTGCTTGCGAAATGGCAGCCGTGTGGATGGAGAGCGAATTGACTCAGAATCAAACACAAGAACGCATACTCGCTTATGCTGCTGAGCTATGTGACCATATACCAACCCAAAACCAACAATCAGCAGTGGACTGTGGG
AGGGTTTCGTCGATGCCTATAGTCACATTCTCAATTGGTGGCAGAAGCTTTGATCTAACTCCTCAAGACCATATATTCAAGATCGGGGAAGGAGTTGAGTCTCAGTGCACCAGCGGTTTCACGGCAATGGATATTGCTCCGCCTCGTGGACCTCTCTGGATCTTGGGTGATATCTTCATGGGACCATACCACACAGTGTTCGATTATGGGAAAGGAAGAGTTGGATTCGCCAAAGCTGCTTAA推导的JB71氨基酸序列(SEQ ID NO28)MGTRFQSFLLVFLLSCLILISTASCERNGDGTIRIGLKKRKLDRSNRLASQLFLKNRGSHWSPKHYFRLNDENADMVPLKNYLDAQYYGDITIGTPPQKFTVIFDTGSSNLWIPSTKCYLSVACYFHSKYKASQSSSYRKNGKPASIRYGTGAISGYFSNDDVKVGDIVVKEQEFIEATSEPGITFLLAKFDGILGLGFKEISVGNSTPVWYNMVEKGLVKEPIFSFWLNRNPKDPEGGEIVFGGVDPKHFKGEHTFVPVTHKGYWQFDMGDLQIAGKPTGYCAKGCSAIADSGTSLLTGPSTVITMINHAIGAQGIVSRECKAVVDQYGKTMLNSLLAQEDPKKVCSQIGVCAYDGTQSVSMGIRSVVDDGTSGLLNQAMCSACEMAAVWMESELTQNQTQERILAYAAELCDHIPTQNQQSAVDCGRVSSMPIVTFSIGGRSFDLTPQDHIFKIGEGVESQCTSGFTAMDIAPPRGPLWILGDIFMGPYHTVFDYGKGRVGFAKAAJB80的核酸序列(SEQ ID NO29)ATGGAGAAAGGTTTGACGATGTCTTGTGTTTTGGTGGTGGTTGCATTCTTAGCCATGGTTCATGTCTCTGTTTCAGTTCCGTTCGTAGTGTTTCCTGAAATCGGAACACAATGTTCTGATGCTCCAAATGCTAACTTCACACAGCTTCTCAGTAACCTCTCTAGCTCACCTGGCTTTTGCATAGAAATTGGCGAGGGAAATCCAATAGGCGCTTCATGGTTAATACCACTTACACAACAAGCGGAAGTAGCGTGTGATAAGGTGACGCAGATGGAAGAGTTGAGTCAAGGATACAACATTGTTGGAAGAGCTCAGGGGAGCTTAGTGGCTCGAGGCTTAATCGAGTTCTGCGAAGGTGGGCCTCCTGTTCACAACTATATATCCTTGGCTGGTCCTCATGCTGGCACCGCCGATCTTCTTCGGTGTAATACTTCTGGCTTAATTTGTGACATAGCAAATGGGATAGGCAAGGAAAATCCCTACAGCGACTTTGTTCAAGATAATCTTGCTCCTAGTGGTTATTTCAAAAACCCTAAAAATGTGACAGGGTACCTGAAAGACTGTCAGTATCTACCTAAGCTTAACAATGAGAGACCATACGAAAGAAACACAACTTACAAAGACCGTTTCGCAAGTTTACAGAACCTGGTTTTTGTCCTGTTTGAGAACGATACGGTTATTGTTCCAAAAGAGTCATCTTGGTTCGGGTTTTATCCGGATGGTGACTTAACACATGTTCTCCCTGTTCAAGAGACAAAGCTCTATATAGAAGATTGGATAGGTCTGAAAGCATTGGTTGTTGCTGGAAAAGTGCAGTTTGTGAATGTAACCGGTGACCACTTAATAATGGCGGACGAAGATCTCGTCAAATACGTCGTACCTCTTCTCCAGGATCAACAGTCTGCCCCACCAAGACTCAACCGCAAGACCAAGGAGCCCTTGCATCCTTAA推导的JB80氨基酸序列(SEQ ID NO30)MEKGLTMSCVLVVVAFLAMVHVSVSVPFVVFPEIGTQCSDAPNANFTQLLSNLSSSPGFCIEIGEGNPIGASWLIPLTQQAEVACDKVTQMEELSQGYNIVGRAQGSLVARGLIEFCEGGPPVHNYISLAGPHAGTADLLRCNTSGLICDIANGIGKENPYSDFVQDNLAPSGYFKNPKNVTGYLKDCQYLPKLNNERPYERNTTYKDRFASLQNLVFVLFENDTVIVPKESSWFGFYPDGDLTHVLPVQETKLYIEDWIGLKALVVAGKVQFVNVTGDHLIMADEDLVKYVVPLLQDQQSAPPRLNRKTKEPLHPJB82的核酸序列(SEQ ID NO31)ATGCATTGGCATGGTGTAGAGCAGCCGAGAAATCCGTGGTCAGATGGTCCTGAATACATCACACAATGCCCGATTCGACCCGGGTCAGATTTTTTGTACAAA
GTCATATTTTCCATCGAAGACACGACTGTTTGGTGGCACGCGCATAGCTCTTGGACACGTGCAACTGTACACGGTCTTATTTTCGTATATCCTCGCCCCCCGCAAATCCTCCCTTTTCCAAAGGCAGACCATGAAGTCCCCATAATTTTGGGTGAGTGGTGGAAGAGGGATGTGAGAGAGGTCGTTGAGGAGTTCGTAAGGACAGGAGGGGCTCCTAATGTGTCCGATGCTTTGACCATCAATGGACATCCTGGTTTCTTGTATCCTTGCTCTAAATCAGATACATTTCATCTCACGGTAGAGAAGGGGAAAACCTACCGCATTCGGATGGTAAATGCCGCAATGAACCTACCTCTCTTTTTCGCAATCGCGAACCACAGCCTCACCGTAGTCTCGGCCGATGGACACTACATCAAACCTATAAAGGCTACTTATATCACTATATCCCCTGGCGAAACACTAGACATGTTATTACACGCTGACCAAGACCCCGAACGCACTTATTACATGGCTGCCAGAGCTTACCAAAGCGGAAATATCGATTTCAACAACTCCACTACCATAGGAATCTTAAGTTACACCTCTTCATGCAAAGCTAAAACATCATCGTTTTCAGGATATTACCCAACCCTTCCTTTTTACAATGACACCTCAGCAGCTTTTGGATTCTTTACCAAGATCAAATGCTTATTCTCCGGTCAAGTTCCTGTCCAAATCTCTCGTAGGATAATCACGACGGTTTCAATAAATCTTCGCATGTGTCCTCAAAACTCGTGCGAAGGTCCAAATGGGTCGAGATTAGCAGCGAGTATGAACAACATATCGTTTGTCACACCAAGTCACGTGGACATACTAAAAGCTTATTACTATCACATTAAAGGCGTTTATGGAACGCGGTTTCCGGAGTTTCCACCGTTGATTTTTAATTTCACCGCAGAAAATCAGCCATTGTTTTTGGAAACTCCGAGACTCGCAACCGAGGTAAAGGTGATTGAGTTCGGTCAAGTGGTTGAGCTTGTTATTCAAGGGACTAGTTTGGTTGGTGGTGGACTCGATCATCCTATGCATCTCCATGGTTTTAGCTTCTATGTGGTTGGAGTAGGGTTCGGGAACTATAACATAAGTGAAGAAGATCCGTCGTCGAGATATAATCTCTACGATCCACCGTATAAAAATACAATGACCGTGCCTAGGAATGGTTGGATCGCTATCAGATTCGTAGCTGATAATCCCGGGGTTTGGTTCATGCACTGTCACTTGGATAGACATCAAACGTGGGGTATGAATGTTGTGTTCATTGTTAAGAATGGTAGAGAGCCAAATCAGCAGATTCTGCCTCCACCAGATGATTTGCCGCCTTGCTATGAATAA推导的JB82氨基酸序列(SEQ ID NO32)MHWHGVEQPRNPWSDGPEYITQCPIRPGSDFLYKVIFSIEDTTVWWHAHSSWTRATVHGLIFVYPRPPQILPFPKADHEVPIILGEWWKRDVREVVEEFVRTGGAPNVSDALTINGHPGFLYPCSKSDTFHLTVEKGKTYRIRMVNAAMNLPLFFAIANHSLTVVSADGHYIKPIKATYITISPGETLDMLLHADQDPERTYYMAARAYQSGNIDFNNSTTIGILSYTSSCKAKTSSFSGYYPTLPFYNDTSAAFGFFTKIKCLFSGQVPVQISRRIITTVSINLRMCPQNSCEGPNGSRLAASMNNISFVTPSHVDILKAYYYHIKGVYGTRFPEFPPLIFNFTAENQPLFLETPRLATEVKVIEFGQVVELVIQGTSLVGGGLDHPMHLHGFSFYVVGVGFGNYNISEEDPSSRYNLYDPPYKNTMTVPRNGWIAIRFVADNPGVWFMHCHLDRHQTWGMNVVFIVKNGREPNQQILPPPDDLPPCYEJB84的核酸序列(SEQ ID NO33)ATGTCTGCTTCTGATTCCTCTTCCTCTCTTCCCGTTACTCTTGACACCATCAACCCCAAGGTTATCAAATGTGAGTATGCTGTCCGTGGAGAAATTGTCAACATTGCTCAGAAATTGCAAGAAGATTTGAAGACTAACAAGGACGCTTATCCCTTTGATGAGATTATCTACTGTAATATCGGGAATCCTCAATCTCTTGGTCAACAGCCTATAACATTCTTCAGAGAGGTTCTTGCTTTATGTTCCTACACAGCCCTGTTGGATGAGAGTGCAACACACGGTTTGTTCAGTTCTGATTCGATTGAGCGTGCTTGGAAGATTCTGGACCAAATTCCCGGGAGAGCGACTGGTGCTTACAGCCACAGCCAGGGTATCAAGGGGTTACGTGATGCAATTGCTGATGGAATCGAAGCCCGTGATGGTTTCCCTGCTGATCCTAATGATATATTCATGACAGATGGTGC
AAGTCCAGGGGTTCATATGATGATGCAACTTCTCATAACTTCAGAGAAAGATGGAATCCTTTGTCCTATTCCTCAGTATCCATTGTACTCAGCTTCAATTGCCCTTCACGGTGGAACTTTGGTTCCATACTACCTTGATGAAGCATCAGGATGGGGTCTTGAAATATCTGAGCTGAAGAAACAACTTGAAGATGCTAGGTCAAAGGGCATCACTGTGAGAGCTTTGGCTGTCATTAACCCTGGAAACCCGACAGGGCAGGTTCTTTCGGAAGAAAACCAGCGTGACGTTGTTAAGTTCTGCAAGCAAGAGGGTTTAGTTCTTTTAGCAGACGAGGTTTATCAAGAGAATGTCTATGTCCCTGACAAAAAGTTCCATTCCTTCAAGAAAGTAGCCCGCTCTATGGGCTACGGTGAGAAGGATCTTGCCTTAGTCTCTTTCCAATCTGTCTCCAAAGGGTACTATGGAGAGTGTGGGAAAAGAGGTGGTTACATGGAGGTTACTGGATTCACTTCTGATGTAAGAGAGCAGATATACAAAATGGCTTCTGTGAATCTTTGTTCCAACATCTCTGGTCAAATTCTTGCTAGCCTCATCATGAGCCCACCCAAGCCTGGTGACGACTCCTATGAATCATACATAGCAGAGAAGGATGGAATTCTCTCATCTTTGGCAAGACGTGCAAAGACTCTTGAAGAGGCTCTGAACAAGCTAGAGGGAGTTACATGCAATAGAGCAGAAGGAGCTATGTATCTATTCCCTTGCCTTCACCTTCCACAAAAGGCAATTGCAGCTGCTGAGGCGGAAAAGACAGCACCAGACAATTTCTACTGCAAACGCCTTCTAAAAGCTACTGGAATAGTCGTTGTCCCTGGTTCTGGCTTTAGACAGGTACCTGGAACATGGCATTTCAGGTGCACTATACTTCCCCAAGAGGATAAGATTCCAGCGATTGTTGATCGTCTAACTGCGTTCCACCAGAGCTTCATGGACGAGTTCCGCGACTAA推导的JB84氨基酸序列(SEQ ID NO34)MSASDSSSSLPVTLDTINPKVIKCEYAVRGEIVNIAQKLQEDLKTNKDAYPFDEIIYCNIGNPQSLGQQPITFFREVLALCSYTALLDESATHGLFSSDSIERAWKILDQIPGRATGAYSHSQGIKGLRDAIADGIEARDGFPADPNDIFMTDGASPGVHMMMQLLITSEKDGILCPIPQYPLYSASIALHGGTLVPYYLDEASGWGLEISELKKQLEDARSKGITVRALAVINPGNPTGQVLSEENQRDVVKFCKQEGLVLLADEVYQENVYVPDKKFHSFKKVARSMGYGEKDLALVSFQSVSKGYYGECGKRGGYMEVTGFTSDVREQIYKMASVNLCSNISGQILASLIMSPPKPGDDSYESVIAEKDGILSSLARRAKTLEEALNKLEGVTCNRAEGAMYLFPCLHLPQKAIAAAEAEKTAPDNFYCKRLLKATGIVVVPGSGFRQVPGTWHFRCTILPQEDKIPAIVDRLTAFHQSFMDEFRDJB85的核酸序列(SEQ ID NO35)ATGGCGTTCCCTAAGGTATACTTCGACATGACCATCGACGGCCAGCCCGCGGGAAGGATCGTGATGGAGCTGTACACCGATAAGACTCCCAGGACTGCCGAGAATTTCAGAGCTCTCTGCACCGGAGAGAAAGGTGTTGGCGGTACCGGAAAACCCCTTCACTTCAAGGGATCTAAGTTTCACCGTGTGATCCCTAACTTCATGTGCCAGGGAGGAGATTTCACCGCCGGGAACGGAACAGGCGGTGAGTCGATCTACGGGAGCAAGTTCGAGGACGAGAATTTCGAGAGGAAGCACACCGGACCGGGGATCCTGTCGATGGCGAACGCCGGTGCAAACACGAACGGATCTCAGTTCTTCATCTGCACCGTGAAGACCGATTGGCTTGATGGGAAGCACGTGGTGTTTGGGCAGGTCGTGGAAGGCTTAGACGTGGTAAAGGCCATCGAGAAGGTTGGATCATCATCTGGAAAGCCGACGAAGCCTGTGGTTGTTGCCGATTGTGGTCAGCTCTCTTAG推导的JB85氨基酸序列(SEQ ID NO36)MAFPKVYFDMTIDGQPAGRIVMELYTDKTPRTAENFRALCTGEKGVGGTGKPLHFKGSKFHRVIPNFMCQGGDFTAGNGTGGESIYGSKFEDENFERKHTGPGILS
MANAGANTNGSQFFICTVKTDWLDGKHVVFGQVVEGLDVVKAIEKVGSSSGKPTKPVVVADCGQLSJB88的核酸序列(SEQ ID NO37)ATGGGTAGTGCAAAATCAGCCATGCTGATCCTCTTAGTAGCAATGGTCATCGCATCATGTGCCACGGCCATTGATATGTCCGTGGTTTCCTACGACGATAACAACCGTCTCCATAGCGTTTTCGATGCTGAGGCCTCGTTAATCTTCGAGTCATGGATGGTCAAACATGGGAAAGTGTACGGGTCCGTTGCCGAGAAGGAACGGCGTTTGACGATTTTTGAGGACAACCTCCGTTTTATCAATAACCGGAACGCTGAGAATCTCAGTTATCGGCTTGGTTTGACCGGGTTTGCGGATTTATCTCTTCATGAGTATAAAGAAGTTTGCCACGGGGCTGATCCAAGACCTCCTAGGAACCACGTCTTTATGACTAGTAGCGACCGATACAAGACTAGTGCTGATGATGTGCTTCCTAAGTCAGTTGATTGGAGAAACGAAGGAGCAGTGACTGAAGTCAAAGATCAAGGCCATTGCAGGAGTTGTTGGGCTTTCTCGACTGTGGGAGCAGTGGAAGGCTTAAACAAGATCGTGACGGGAGAGTTAGTCACTTTGTCTGAGCAAGATTTTGATCAATTGTAACAAAGAAAACAATGGTTGCGGAGGAGGCAAACTCGAGACTGCCTATGAGTTCATCATGAAAAATGGTGGTCTTGGTACCGACAACGATTATCCTTACAAAGCTGTTAACGGAGTCTGTGATGGCCGCCTCAAGGAAAACAACAAGAATGTTATGATTGATGGGTATGAAAATTTGCCCGCAAACGACGAATCTGCTCTCATGAAAGCGGTTGCTCACCAGCCTGTGACTGCCGTTATCGATTCCAGTAGCCGAGAGTTTCAGCTTTATGAATCGGGAGTGTTTGATGGCTCGTGTGGAACAAACCTAAACCATGGAGTTGTTGTGGTCGGGTATGGAACTGAGAATGGTCGTGACTACTGGCTCGTGAAAAACTCTAGGGGCATTACATGGGGAGAAGCTGGCTACATGAAGATGGCTCGAAACATTGCCAATCCAAGAGGCTTATGTGGCATTGCAATGCGAGCTTCATACCCTCTAAAGAACTCCTTTTCTACCGATAAAAGCTCCATCGCCTAA推导的JB88氨基酸序列(SEQ ID NO38)MGSAKSAMLILLVAMVIASCATAIDMSVVSYDDNNRLHSVFDAEASLIFESWMVKHGKVYGSVAEKERRLTIFEDNLRFINNRNAENLSYRLGLTGFADLSLHEYKEVCHGADPRPPRNHVFMTSSDRYKTSADDVLPKSVDWRNEGAVTEVKDQGHCRSCWAFSTVGAVEGLNKIVTGELVTLSEQDLINCNKENNGCGGGKLETAYEFIMKNGGLGTDNDYPYKAVNGVCDGRLKENNKNVMIDGYENLPANDESALMKAVAHQPVTAVIDSSSREFQLYESGVFDGSCGTNLNHGVVVVGYGTENGRDYWLVKNSRGITWGEAGYMKMARNIAVPRGLCGIAMRASYPLKNSFSTDKSSIAJB89的核酸序列(SEQ ID NO39)ATGACTAATCCCATGATCATGGTTATGCTGTTGTTGTTTCTTGTGATGTCGACTAGAGCAGACGAAGAGCTGATTAAGACAGAGTGTAATCACACAGAATACCAAAACGTATGCCTCTTCTGTCTTGAAGCCGATCCAATCTCCTTCAATATCGACCGTGCTGGACTTGTCAACATCATTATACACTGTCTCGGATCTCAACTTGATGTTCTTATCAACACCGTCACGAGTCTAAAGTTGATGAAAGGAGAGGGTGAAGCAAATGAGAATGTTCTGAAAGATTGCGTCACAGGCTTTGCGATTGCACAATTACGACTTCAAGGAGCCAACATCGATTTGATAACCCTTAATTACGATAAAGCGTACGAATTGGTGAAAACTGCGTTAAACTATCCTCGGACTTGCGAAGAAAATCTCCAAAAACTCAAGTTCAAAGATTCATCTGATGTTTATGACGATATCTTGGCATATAGCCAACTCACCTCTGTTGCTAAGACGTTGATCCACCGTCTCTAG
推导的JB89氨基酸序列(SEQ ID NO40)MTNPMIMVMLLLFLVMSTRADEELIKTECNHTEYQNVCLFCLEADPISFNIDRAGLVNIIIHCLGSQLDVLINTVTSLKLMKGEGEANENVLKDCVTGFAIAQLRLQGANIDLITLNYDKAYELVKTALNYPRTCEENLQKLKFKDSSDVYDDILAYSQLTSVAKTLIHRLJB90的核酸序列(SEQ ID NO41)ATGGTTTCTTCTTCTTTAACCAAGCTTGTGTTCTTTGGTTGTCTCCTCCTGCTCACATTCACGGACAACCTTGTGGCTGGAAAATCTGGCAAAGTGAAGCTCAATCTTTACTACGAATCACTTTGTCCCGGTTGTCAGGAATTCATCGTCGATGACCTAGGTAAAATCTTTGACTACGATCTCTACACAATCACTGATCTCAAGCTGTTTCCATTTGGTAATGCCGAACTCTCCGATAATCTGACTGTCACTTGCCAGCATGGTGAAGAGGAATGCAAACTAAACGCCCTTGAAGCTTGCGCATTAAGAACTTGGCCCGATCAGAAATCACAATACTCGTTCATACGGTGCGTCGAAAGCGATACGAAAGGCTGGGAATCATGTGTTAAAAACTCTGGACGTGAGAAAGCAATCAATGATTGTTACAATGGTGATCTTTCTAGAAAGCTGATACTTGGGTACGCAACCAAAACCAAGAATTTGAAGCCGCCACATGAATACGTACCATGGGTCACACTCAACGGCAAGCCACTCGATGACAGCGTACAAAGTACGGATGATCTCGTAGCTCAAATCTGCAATGCATACAAAGGAAAGACTACTCTCCCAAAAGTTTGCAATTCATCCGCCTCAATGTCTAAGTCGCCTGAGAGGAAATGGAAGCTTCAAGTCTCTTATGCCAATAAAGCTACCAATTATTAA推导的JB90氨基酸序列(SEQ ID NO42)MVSSSLTKLVFFGCLLLLTFTDNLVAGKSGKVKLNLYYESLCPGCQEFIVDDLGKIFDYDLYTITDLKLFPFGNAELSDNLTVTCQHGEEECKLNALEACALRTWPDQKSQYSFIRCVESDTKGWESCVKNSGREKAINDCYNGDLSRKLILGYATKTKNLKPPHEYVPWVTLNGKPLDDSVQSTDDLVAQICNAYKGKTTLPKVCNSSASMSKSPERKWKLQVSYANKATNYJB91的核酸序列(SEQ ID NO43)ATGGCCGGAGTTTTCAAAACGGTTACGTTTCTTGTTTTGGTTTTTCGCTGCCGTTGTTGTCTTCGCGGAGGACTACGATGTTGGTGATGATACGGAATGGACGAGACCTATGGACCCCGAGTTCTATACTACTTGGGCTACCGGTAAAACTTTCCGTGTAGGCGACGAGCTCGAATTTGATTTCGCTGCTGGGAGGCATGATGTGGCAGTTGTATCAGAAGCTGCATTTGAAAACTGTGAGAAAGAGAAACCCATTAGCCACATGACCGTTCCTCCGGTCAAAATTATGCTAAACACCACTGGACCACAATACTTTATCTGCACCGTCGGTGACCATTGTCGTTTTGGTCAAAAACTTTCCATCACTGTAGTTGCTGCTGGTGCAACTGGAGGTGCTACTCCTGGTGCCGGTGCTACCCCAGCACCTGGATCAACCCCAAGTACTGGAGGAACCACTCCTCCCACTGCGGGTGGGACCACAACACCTTCAGGCTCTAGCGGAACCACTACTCCAGCTGGAAATGCCGCTTCCTCATTAGGTGGTGCTACTTTTCTGGTCGCTTTTGTTTCTGCTGTTGTTGCTCTCTTTTGA推导的JB91氨基酸序列(SEQ ID NO44)MAGVFKTVTFLVLVFAAVVVFAEDYDVGDDTEWTRPMDPEFYTTWATGKTFRVGDELEFDFAAGRHDVAVVSEAAFENCEKEKPISHMTVPPVKIMLNTGPQYFICTVGDHCRFGQKLSITVVAAGATGGATPGAGATPAPGSTPSTGGTTPPTAGGTTTPSGSSGTTTPAGNAASSLGGATFLVAFVSAVVALF
JB93的核酸序列(SEQ ID NO45)ATGGCGTCAAAGCAACTGAGCAGAGAAGAGCTTGATGAGAAGGCGAAGCAAGGAGAGACCGTCGTCCCAGGTGGCACCGGTGGCCACAGCCTCGAAGCTCAAGAGCATCTTGCTGAAGGAAGGAGCAAGGGAGGGCAGACGAGGAAGGAGCAGCTAGGACATGAAGGTTATCAGGAGATCGGTCACAAAGGTGGAGAGGCGAGGAAGGAGCAGTTAGGGCACGAGGGTTATCAGGAGATGGGTCACAAAGGTGGAGAGGCGAGGAAGGAGCAGCTAGGGCACGAGGGTTATCAGGAGATGGGACACAAAGGAGGAGAGGCGAGGAAGGAGCAGCTAGGGCACGAGGGTTATAAGGAGATGGGACGTAAAGGAGGACTCAGTACGATGGAAAAATCTGGTGGAGAGCGTGCGGAGGAAGAAGGGATTGAGATCGATGAGTCAAAGTTCACCAACAAGTGA推导的JB93氨基酸序列(SEQ ID NO46)MASKQLSREELDEKAKQGETVVPGGTGGHSLEAQEHLAEGRSKGGQTRKEQLGHEGYQEIGHKGGEARKEQLGHEGYQEMGHKGGEARKEQLGHEGYQEMGHKGGEARKEQLGHEGYKEMGRKGGLSTMEKSGGERAEEEGIEIDESKFTNKToZ001的核酸序列(SEQ ID NO47)ATGGCTTCGGTTACTTTCTCTGTCCCCAAGGGTTTCACTGAATTCTCAGGATTGCGAAGCTCCTCTGCTTCTCTTCCCTTCGGCAAGAAACTTTCTTCCGATGAGTTCGTTTCCATCGTCTCCTTCCAGACTTCTGCAATGGGAAGCAGTGGTGGATACAGGAAAGGTGTGACTGAGGCCAAGCTTAAGGTGGCCATTAATGGATTCGGTAGGATCGGGAGGAACTTCCTGAGATGTTGGCATGGTCGCAAGGACTCTCCTCTTGATATCATTGCCATTAATGACACTGGTGGCGTCAAGCAGGCTTCGCATTTACTTAAATACGACTCTACTCTCGGAATCTTTGATGCTGATGTCAAACCTTCTGGAGAGACTGCAATCTCTGTTGATGGAAAGATCATCCAAGTTGTCTCTAACCGAAACCCGTCTCTTCTCCCTTGGAAGGAGCTAGGAATTGACATTGTCATCGAAGGAACCGGAGTGTTTGTGGATAGAGAAGGTGCAGGGAAACACATTGAAGCTGGTGCCAAGAAGGTTATCATTACTGCTCCAGGCAAAGGAGATATTCCAACTTATGTCGTTGGTGTCAATGCAGATGCTTACAGTCATGATGAACCTATCATCAGCAATGCATCTTGCACTACCAACTGTCTTGCTCCCTTTGTCAAAGTTCTTGACCAGAAATTCGGTATCATAAAGGGTACAATGACGACTACTCACTCTTACACCGGTGACCAGAGGTTGCTAGACGCGAGTCACCGTGATCTAAGGAGAGCAAGAGCAGCTGCTTTGAACATTGTTCCTACTTCTACAGGAGCAGCTAAAGCTGTGGCTCTTGTGCTCCCTAACCTCAAAGGAAAACTCAACGGGATCGCTCTCCGTGTACCAACACCAAACGTATCAGTGGTTGATCTCGTTGTGCAGGTCTCAAAGAAGACATTTGCTGAGGAAGTCAACGCTGCTTTCAGAGATTCTGCAGAGAAAGAGCTTAAAGGTATACTCGATGTCTGCGATGAGCCACTAGTGTCCGTTGATTTCAGATGCTCAGATTTTTCAACGACCATTGATTCATCACTCACTATGGTTATGGGAGATGATATGGTTAAGGTGATTGCTTGGTATGATAATGAATGGGGTTACTCACAGAGAGTTGTTGACTTGGCTGACATTGTTGCCAACAACTGGAAGTGA推导的ToZ001氯基酸序列(SEQ ID NO48)MASVTFSVPKGFTEFSGLRSSSASLPFGKKLSSDEFVSIVSFQTSAMGSSGGYRKGVTEAKLKVAINGFGRIGRNFLRCWHGRKDSPLDIIAINDTGGVKQASHLLKYDSTLGIFDADVKPSGETAISVDGKIIQVVSNRNPSLLPWKELGIDIVIEGTGVFVDREGAGKHIEAGAKKVIITAPGKGDIPTYVVGVNADAYSHDEPIISNASCTTNCLAPFVKVLDQKFGIIKGTMTTTHSYTGDQRLLDASHRDLRRARAAALNIVPTSTGAAKAVALVLPNLKGKLNGIALRVPTPNVSVVDLVVQVSKKTFAEEVNAAFR
DSAEKELKGILDVCDEPLVSVDFRCSDFSTTIDSSLTMVMGDDMVKVIAWYDNEWGYSQRVVDLADIVANNWKToZ002的核酸序列(SEQ ID NO49)ATGGCAAAAGAAAATGGATTTATAGGATCAATCGATCAAGGAACCACCAGCACCAGATTCATCATTTACGACCACGATGCTCGTCCTGTTGCTTCTCATCAAGTCGAGTTCACTCAGTTCTATCCCGAAGCTGGATGGGTGGAACACGATCCAATGGAGATACTGGAAAGTGTGAAAGTGTGCATTGCAAAGGCTCTCGACAAAGCCACTGCCGATGGACACAACGTCGACGGTGGCTTGAAGGCCATTGGGCTTACAGATCAGAGAGAGACTACTGTTGTTTGGAGCAAATCCACTGGCCTTCCTCTCCACAAGGCTATTGTCTGGATGGATGCTCGTACCAGCTCCATCTGCAGGAGACTAGAGAAAGAACTCTCGGGAGGAAGATCCCATTTTGTGGAGTCTTGCGGCTTGCCAATAAGCACATACTTCTCTGCCATGAAGCTGCTTTGGCTCATGGAGAATGTGGATGATGTCAAAGACGCTATCAAGAAAGGGGATGCCATCTTTGGCACTATCGACACATGGTTGATCTGGAACATGACTGGCGGTATCAATGGCGGCCTTCATGTCACTGATGTCACCAATGCTTCACGGACAATGCTCATGAACCTCAAAACCTTGAGCTGGGACCAGGACACTTTGAAGACACTTGGCATACCGGCTGAAATCTTGCCCAAGATTGTCAGCAATTCAGAAGTGATTGGAGAGATCTGCAAAGGCTGGCCTATTCCCGGTATCAAGATTGCTGGATGTCTTGGTGATCAGCATGCTGCGATGTTGGGGCAAGCTTGCAGAAAAGGCGAGGCGAAGAGTACTTATGGCACAGGTGCTTTCATTCTTCTCAACACCGGAGAAGTGCCAATCAAATCAGGTCATGGTCTTCTGACCACGTTGGCCTACAAGCTCGGTCCTCAAGCACAGACAAACTATGCATTGGAGGGTTCGATTGCCATAGCAGGAGCTGCTGTTCAGTGGCTTAGAGACAGCCTTGGGATAATCAAAAGCGCCTCTGAGATCGAAGATTTGGCAGCAATGGTAGATTCTACAGGAGGAGTGTACTTTGTGCCAGCGTTCAACGGCTTGTTTGCTCCTTGGTGGAGAGAAGACGCACGTGGTGTGTGCATTGGAATCACGAGGTTCACCAACAAGTCTCACATTGCTCGGGCTGTGCTGGAGAGCATGTGTTTCCAGGTGAAAGACGTCCTTGACTCCATGAACAAAGATGCAGGTGAAAAGGGTTCCCTTAATAACGGGAAAGGGGAGTTCTTGCTCAGAGTTGATGGTGGTGCCACAGCTAACAACCTTCTGATGCAGATTCAGGCTGATCTGATGGGAAGTCCGGTGGTGAGGCCAGTGGACATAGAGACAACAGCATTAGGAGCAGCCTATGCAGCTGGATTAGCTGTGGGATTCTGGAAGGAAGCAGACATATTCGAGTCGGGAGAGAAGGCGAAGAACTCCAAAGTTTTCAGACCCGCTATGGAAGAAGGAATCAGGAAGAAGAAAGTGGCGTCTTGGTGCAAAGCGGTGGAAAGAACATTTGATCTCGCTGACCTCTCTATCTAA推导的ToZ002氨基酸序列(SEQ ID NO50)MAKENGFIGSIDQGTTSTRFIIYDHDARPVASHQVEFTQFYPEAGWVEHDPMEILESVKVCIAKALDKATADGHNVDGGLKAIGLTDQRETTVVWSKSTGLPLHKAIVWMDARTSSICRRLEKELSGGRSHFVESCGLPISTYFSAMKLLWLMENVDDVKDAIKKGDAIFGTIDTWLIWNMTGGINGGLHVTDVTNASRTMLMNLKTLSWDQDTLKTLGIPAEILPKIVSNSEVIGEICKGWPIPGIKIAGCLGDQHAAMLGQACRKGEAKSTYGTGAFILLNTGEVPIKSGHGLLTTLAYKLGPQAQTNYALEGSIAIAGAAVQWLRDSLGIIKSASEIEDLAAMVDSTGGVYFVPAFNGLFAPWWREDARGVCIGITRFTNKSHIARAVLESMCFQVKDVLDSMNKDAGEKGSLNNGKGEFLLRVDGGATANNLLMQIQADLMGSPVVRPVDIETTALGAAYAAGLAVGFWKEADIFESGEKAKNSKVFRPAMEEGIRKKKVASWCKAVERTFDLADLSIToZ003的核酸序列(SEQ ID NO51)ATGGCGGCGAAAATTCCCGGAGTGATCGCTTTGTTCGACGTCGACGGTACT
CTCACAGCTCCAAGGAAGGAAGCTACTCCAGAATTGCTCGATTTTATCCGAGAATTGCGAAAGGTCGTCACTATTGGAGTCGTCGGTGGATCTGATCTAAGTAAGATATCTGAGCAGCTTGGCAAAACAGTCACAAACGACTATGATTATTGTTTCTCTGAGAATGGTCTTGTCGCCCATAAAGATGGGAAATCCATTGGAATTCAGAGCCTGAAGCTGCACCTTGGAGACGATAAACTCAAGGAGTTGATAAATTTCACGCTGCACTACATTGCAGACCTGGATATTCCAATTAAGAGGGGAACATTTATTGAATTCCGAAATGGAATGCTCAATGTATCACCCATTGGTCGCAACTGCAGCCAAGAAGAAAGAGATGAATTTGAGAGATATGATAAGGTTCAAAACATCCGACCAAAGATGGTAGCTGAACTTCGTGAGCGGTTTGCACATCTTAACCTTACTTTCTCAATTGGGGGACAGATAAGCTTCGATGTCTTCCCTAAAGGTTGGGATAAGACTTACTGCTTGCAATACCTCGAGGACTTCAGTGAAATCCATTTCTTCGGTGACAAGACCTATGAGGGTGGAAATGACTATGAAATCTATGAATCACCAAAAACAATTGGCCATTCAGTTACGAGTCCAGATGACACAGTGGCAAAATGCAAGGCTCTGTTCATGTCTTGA推导的ToZ003氨基酸序列(SEQ ID NO52)MAAKIPGVIALFDVDGTLTAPRKEATPELLDFIRELRKVVTIGVVGGSDLSKISEQLGKTVTNDYDYCFSENGLVAHKDGKSIGIQSLKLHLGDDKLKELINFTLHYIADLDIPIKRGTFIEFRNGMLNVSPIGRNCSQEERDEFERYDKVQNIRPKMVAELRERFAHLNLTFSIGGQISFDVFPKGWDKTYCLQYLEDFSEIHFFGDKTYEGGNDYEIYESPKTIGHSVTSPDDTVAKCKALFMSToZ004的核酸序列(SEQ ID NO53)ATGGGTTACATAGGAGCTCATGGTGTAGCAGCTCTTCATAGGTACAAATACAGTGGAGTGGATCACTCTTATCTTGCCAAATACGTCCTCCAACCTTTTTGGACTCGATTTGTCAAAGTCTTCCCTCTATGGATGCCACCAAACATGATAACGCTTATGGGGTTTATGTTTCTAGTCACTTCCTCCCTGCTAGGCTATATATATTCACCTCAGTTGGATTCTCCTCCTCCACGATGGGTTCACTTCGCACATGGTTTACTTCTCTTCTTGTATCAGACATTTGATGCGGTTGATGGGAAGCAAGCAAGAAGGACAAATTCCTCTAGCCCCCTAGGAGAGCTCTTCGATCATGGTTGTGACGCGCTTGCTTGTGCGTTTGAAGCCATGGCATTTGGAAGCACTGCAATGTGTGGAAGAGATACTTTCTGGTTCTGGGTTATTTCAGCTATTCCATTTTATGGAGCTACATGGGAACACTATTTCACCAACACACTTATTCTTCCGGTTATCAATGGGCCTACAGAGGGGCTTGCACTTATATTTGTCAGCCACTTCTTCACAGCCATCGTCGGTGCTGAATGGTGGGCTCAGCAGTTAGGGCAGTCAATACCATTGTTTAGTTGGGTGCCATTTGTGAATGAGATTCAAACTTCTAGAGCAGTGCTATACATGATGATCGCTTTTGCTGTTATACCAACCGTTGCATTCAATGTAACAAATGTCTACAAAGTCGTTCGATCAAGAAACGGGAGCATGGTGTTAGCGTTAGCTATGCTGTATCCCTTCGTTGTCTTACTTGGAGGAGTTTTGATATGGGATTACTTGTCTCCAATCAATCTCATAGCAACATATCCTCACTTAGTTGTACTCGGAACTGGACTTGCATTTGGATTTTTAGTGGGAAGAATGATTCTTGCTCACTTGTGTGATGAGCCTAAAGGACTAAAAACAAACATGTGCATGTCACTACTCTATCTTCCCTTTGCACTTGCAAATGCGCTAACCGCAAGATTGAATGCTGGGGTTCCTCTAGTCGACGAATTATGGGTTCTTCTTGGCTACTGCATATTCACAGTGTCATTATACTTGCACTTTGCAACATCAGTCATCCATGAGATCACTGAGGCCCTTGGAATCTACTGCTTTAGGATCACGCGTAAAGAAGCTTGA推导的ToZ004氨基酸序列(SEQ ID NO54)MGYIGAHGVAALHRYKYSGVDHSYLAKYVLQPFWTRFVKVFPLWMPPNMITLMGFMFLVTSSLLGYIYSPQLDSPPPRWVHFAHGLLLFLYQTFDAVDGKQARR
TNSSSPLGELFDHGCDALACAFEAMAFGSTAMCGRDTFWFWVISAIPFYGATWEHYFTNTLILPVINGPTEGLALIFVSHFFTAIVGAEWWAQQLGQSIPLFSWVPFVNEIQTSRAVLYMMIAFAVIPTVAFNVTNVYKVVRSRNGSMVLALAMLYPFVVLLGGVLIWDYLSPINLIATYPHLVVLGTGLAFGFLVGRMILAHLCDEPKGLKTNMCMSLLYLPFALANALTARLNAGVPLVDELWVLLGYCIFTVSLYLHFATSVIHEITEALGIYCFRITRKEAToZ005的核酸序列(SEQ ID NO55)ATGTCTCCTTCTCACTCCATCAATTCCAACAGTGACGGCAACGCCTCCTGTTCAACCTGCAGCACCTGCTTCGATACTACAACCTCCACAACAGATGAAGAGTATGATGCTTTGATTAAGACTAAGACTTGGAGTTTAGTGCCTAAACCTGCAGGTACAAACATTATCAATTCGATTTGGCTTTATAAACACAAGTACAATGCTGATGGTTCTTTGTCAAGATACAAATCGAGACTCGTTGCTAATGGAAAATCACAAGAACACGGAGTAGATTTTTATGAGACGTTCAGTCCGGTTGTAAAGCCTGCAACAATCCGTGCGGTTCTAAACTTTGCGGTGGAACGCGACTCGTCGGTACATCAATTAGATGTTCAAAACGCGTTTCTTCATGGCAAGCTAGAAGAAACTGTTTACATGTATGAGCCACCTGGATTTGTCGATAACAAGAATCCAGGATATGTTTGCAAGCTGAATAAGGCGTTGTATGGTTTAAACAAGCACCACGTGCTTGGAATGCTCGATTTGCAAGCTATGTCAAAATGATGGGTTTCAAACAGAGTAAGTGTGATGCTTCACTTTTCGTATACAAGCAAGGGAATGACATGGCTTACTTGCTGCTCTACGTTGATGACATTATGCTAACTGCTTCTTCCCCAAGTCAAGAAAAATATGCGAAGAATATTATTAACATAGTTGAGATGCAAAACTGGAAGCCTAGTCTCACATCGGTTGATCTTGCGTGTAAGCTTGAAGAAAGTGTTGGTCCAAAAATACAAGACCTGACGTTATATCGAAGTTTTGGTTGGGGCACTTCAGTACTTAACAATAACGAGACCGAACATATCTTATGCAGTTCAACAAGGTCTCAGTATTACAAAGTCCCCATCAACCAAACTAGTTGCCGACTCGGACGCAGACTGGGTTGGGTGTCCGAATACTAGAAGATCGACTTCGGGGTATTGTGTTTTTCTTAGGGATACACTCATCTCATGGTCGTCTAAGCGACAAGGTTCAGTGTCACGTTCAAGCGCAGAGGCTGAGTACAAAGCCGTAGCAAATGCAGTGGTAGCAACATGCGAAGTTCGAGTCATTCATATCCCTGCTTCTCATCAATATGCTGACATTTTCACAAAGGGTCTTACTACTTCACTGTTCAATCGATTCAAGTCCAGTCTTGGCGTCATTCAACGACCGACGAAAAGACTGCGGGAAGGTGATTTGTTGTTCAACAGAAAAGATGAGATTCGTACGTTCGAGGTTGTCTCTCGTTATGGTCACGGTCCTAAGCTTCTTGGCCGGTTTTCTGGCGGTCGAATCGAGGAGTTTATTAATGCCCGGACGTTATCAGCAGCAAATCTACGTGACGCGGAAGTACCTACTCGTGTTGCGGCTAAGCTAAGAGAGTTTCATGGTATCAACATCCCTGGTGATAGAAATGTGCTCATTTGGGATAGGATGAGGAATTGGCTTAGACAAGCCAAAAGTCTGTGTACACCTGAAGATTTAGCAGAGTTTGGTCTAGACAAGATTGAAGATGAGATATACTTGCTGGAACATGAGCTGCAGGATAAGTGTAAGCAGCAGGAGATAGGGTTTTGTCACAATGATTTGCAATATGGTAACATTATGATTGATGAAGATACCAATGCCATTACTATCATTGACTACGAGTACGCTAGTTATAACCCAGTTGCATACGACATTGCAAATCACTTCTGCGAAATGGCAGCAAATTACAAAGTTGCAGGAGAAGAGGAACGAAGGAGGTTCATCCATAACTACCTCAGCTCTTCAGGCGAAGAACCAAAAGAAGATGACATAAAACAGCTCTTGAAGGATGCTGAGAAGTACACATTAGCAAGCCATCTGTTTTGGGGCTTATGGGGAATCATCTCTGGATATGTAAACAAGATCGACTTCGATTACGCCGAGTACTCAAGACAGAGATTCAAACAATACTGGCTTCGAAAACCCGAGCTCTTACTCTTCTCCCAAATGTATATTTCAAACACCAAATGA
推导的ToZ005氨基酸序列(SEQ ID NO56)MSPSHSINSNSDGNASCSTCSTCFDTTTSTTDEEYDALIKTKTWSLVPKPAGTMINSIWLYKHKYNADGSLSRYKSRLVANGKSQEHGVDFYETFSPVVKPATIRAVLNFAVERDSSVHQLDVQNAFLHGKLEETVYMYEPPGFVDNKNPGYVCKLNKALYGFKQAPRAWNARFASYVKMMGFKQSKCDASLFVYKQGNDMAYLLLYVDDIMLTASSPSQEKYAKNIINIVEMQNWKPSLTSVDLACKLEESVGPKIQDLTLYRSLVGALQYLTITRPNISYAVQQGLSITKSPSTKLVADSDADWVGCPNTRRSTSGYCVFLRDTLISWSSKRQGSVSRSSAEAEYKAVANAVVATCEVRVIHIPASHQYADIFTKGLTTSLFNRFKSSLGVIQRPTKRLREGDLLFNRKDEIRTFEVVSRYGHGPKLLGRFSGGRIEEFINARTLSAANLRDAEVPTRVAAKLREFHGINIPGDRNVLIWDRMRNWLRQAKSLCTPEDLAEFGLDKIEDEIYLLEHELQDKCKQQEIGFCHNDLQYGNIMIDEDTNAITIIDYEYASYNPVAYDIANHFCEMAANYKVAGEEERRRFIHNYLSSSGEEPKEDDIKQLLKDAEKYTLASHLFWGLWGIISGYVNKIDFDYAEYSRQRFKQYWLRKPELLLFSQMYISNTKToZ011的核酸序列(SEQ ID NO57)ATGGCATCTGTTTACTCCACCCTAACCTACTGGCTCGTCCACCACCCCTACATTGCCAACTTCACGTGGACCGAAGGTGAAACACTAGGCTCCACCGTTTTCTTTGTCTTTGTCGTCGTCTCCCTTTACCTCTCCGCCACATTCCTCCTCCGATACACCGTCGATTCACTCCCCACACTCGGTCCCCGCATTCTCAAACCAATCACAGCCGTTCACAGCCTCATTCTCTTCCTCCTCTCCTTAACCATGGCCGTTGGTTGCACTCTCTCCCTAATCTCTTCCTCGGACCCGAAGGCGCGTCTCTTCGACGCCGTTTGTTTCCCCCTCGACGTGAAACCTAAGGGACCGCTTTTCTTTTGGGCTCAAGTCTTTTACCTCTCGAAGATCCTTGAGTTCGTAGACACACTTCTCATCATACTCAACAAATCAATCCAACGGCTCTCGTTCCTCCACGTCTACCACCACGCAACGGTTGTGATTTTGTGCTACCTCTGGTTACGAACACGTCAATCGATGTTTCCTGTTGGGCTCGTGTTGAACTCGACGGTCCATGTGATTATGTACGGGTACTATTTCCTCTGCGCTATCGGATCGAGGCCCAAGTGGAAGAAGTTGGTGACGAATTTTCAAATGGTTCAGTTTGCTTTCGGCATGGGGTTAGGAGCCGCTTGGATGCTCCCAGAGCATTATTTCGGGTCGGGTTGCGCCGGGATTTGGACAGTTTATTTCAATGGTGTGTTTACTGCTTCTCTATTGGCTCTCTTCTACAACTTCCACTCCAAGAACTATGAGAAGACTACAACGTCGCCTTTGTATAAGATCGAATCCTTTATATTTATTCACGGAGAGAGGTGGGCAAATAAAGCGATTACATTATTTTCCAAGAAAAACGATTAA推导的ToZ011氨基酸序列(SEQ ID NO58)MASVYSTLTYWLVHHPYIANFTWTEGETLGSTVFFVFVVVSLYLSATFLLRYTVDSLPTLGPRILKPITAVHSLILFLLSLTMAVGCTLSLISSSDPKARLFDAVCFPLDVKPKGPLFFWAQVFYLSKILEFVDTLIILNKSIQRLSFLHVYHHATVVILCYLWLRTRQSMFPVGLVLNSTVHVIMYGYYFLCAIGSRPKWKKLVTNFQMVQFAFGMGLGAAWMLPEHYFGSGCAGIWTVYFNGVFTASLLALFYNFHSKNYEKTTTSPLYKIESFIFIHGERWANKAITLFSKKNDToZ012的核酸序列(SEQ ID NO59)ATGGCATCAATTTACTCCTCTTTAACCTACTGGCTCGTTAACCACCCCTACATCTCCAATTTTACTTGGATCGAAGGTGAAACCCTAGGCTCCACCGTCTTTTTCGTATCCGTCGTAGTCTCCGTTTACCTCTCCGCCACGTTCCTCCTCCGATCCGCCATCGATTCACTCCCATCACTCAGTCCACGTATCCTCAAACCGATCACAGCCGTCCACAGCCTAATCCTCTGTCTCCTCTCCTTAGTCATGGCCGTCGGTTG
CACTCTCTCAATAACCTCATCTCACGCGTCTTCAGATCCGATGGCGCGTTTCCTTCACGCGATTTGCTTTCCCGTCGACGTTAAACCTAACGGACCGCTTTTCTTCTGGGCTCAAGTCTTCTACCTCTCGAAGATCCTCGAGTTCGGAGACACGATCCTCATCATACTCGGCAAATCAATCCAACGGCTATCCTTCCTCCACGTGTACCACCACGCGACGGTTGTGGTCATGTGTTATCTCTGGCTCCGAACTCGCCAATCGATGTTTCCGATTGCGCTCGTGACGAATTCGACGGTACACGTCATCATGTACGGTTACTACTTCCTCTGCGCCGTTGGATCGAGGCCCAAGTGGAAGAGATTGGTGACGGATTGTCAGATTGTTCAGTTTGTTTTCAGTTTCGGGTTATCCGGTTGGATGCTCCGAGAGCACTTATTCGGGTCGGGTTGCACCGGGATTTGGGGATGGTGTTTCAACGCTGCATTTAATGCTTCTCTTTTGGCTCTCTTTTCCAACTTCCATTCAAAGAATTATGTCAAGAAGCCAACGAGAGAGGATGGCAAAAAAAGCGATTAG推导的ToZ012氨基酸序列(SEQ ID NO60)MASIYSSLTYWLVNHPYISNFTWIEGETLGSTVFFVSVVVSVYLSATFLLRSAIDSLPSLSPRILKPITAVHSLILCLLSLVWAVGCTLSITSSHASSDPMARFLHAICFPVDVKPNGPLFFWAQVFYLSKILEFGDTILIILGKSIQRLSFLHVYHHATVVVMCYLWLRTRQSMFPIALVTNSTVHVIMYGYYFLCAVGSRPKWKRLVTDCQIVQFVFSFGLSGWMLREHLFGSGCTGIWGWCFNAAFNASLLALFSNFHSKNYVKKPTREDGKKSDOsw26的核酸序列(SEQ ID NO121)ATGCAGACCGTTTCTCGGAGATTAGCTCGTGAAAATTTGAGCTCTCGCACATCGATTTACTCTCTCAAATCGCTTTATCCTGTTTCCGATCGCTGTTACGGTGAGTATGATCGGCGTTATGCCTCTACGCTTACCACCAAAGGTATTGGACATCTGGTCCGCAAGGGTACTGGTGGAAGATCGTCTGTTAGTGGGATAGTTGCTACAGTATTCGGAGCTACTGGTTTCCTTGGGCGTTACTTGGTGCAACAGCTTGCTAAAACGGGTTCACAAGTGCTAGTACCATTTAGAGGTTCCGAAGATTCGCCCCGTCATCTCAAACTGATGGGCGATTTGGGGCAGATTGTTCCCATGAAATATAATCCTAGAGATGAAAACTCAATTAAGGCAGTCATGGCCAAGGCAAATGTTGTGATTAATCTCATAGGAAGGGAATATGAAACCAGAAATTATAGTTTTGAGGAAGTGAACCATCATATGGCTGAACAACTTGCAAAGATTTCCAAAGAACATGGTGGAATCATGAGATTTATACAACTGTCGTGTTTAGGTGCATCTAAATCATCTCCATCTAGGATGCTTCAAGCCAAGGCTGCTGCAGAAGAATCCATCTTACGTGAATTGCCTGAGGCCACAATACTGCGACCTGCAGTGATGGTTGGTACAGAAGATCGGATCTTGAACCCATGGGCTCAGTTCGCTAAAAAATATAACTTTCTTCCAATGATCGGGGGTGGTTCTACTAAGATTCAGCCTGTGTATGTTGCTGATGTCGCCTCTGCAGTTGTTGCGGCATTAAGTGATGACGGTAGTAGCATGGGAAAAGTGTATGAACTTGGTGGGCCTGATGTTTATACACTGCATCAATTGGCTGAACTTATGTATGAAACGATTCGAGAATGGCCTCATTATGTTAACGTTCCTTTCCCTATTGCTAAGGCGATCTCAACACCTCGAGAAGTATTTCTTAATAAAGTTCCCTTCCCGTTACCCTCACCAATCATCTTCAATTTGGATGTGATTAATGCTCTTTCTTCAGATACTCTCGTCTCAAAAGATGCTCTGACATTCAATGATCTTGAGCTTGTGCCACATAAGGTGAAGGGATATCCTATTGAGTACCTTATCCAGTATCGCAAGGGTGGACCCAATTACGGCTCTACAGTCAGTGAAAGAGTGACTCCAGAGTCTTATCCTTGA推导的Ose26氨基酸序列(SEQ ID NO122)MQTVSRRLARENLSSRTSIYSLKSLYPVSDRCYGEYDRRYASTLTTKGIGHLVRKGTGGRSSVSGIVATVFGATGFLGRYLVQQLAKTGSQVLVPFRGSEDSPRHLK
LMGDLGQIVPMKYNPRDENSIKAVMAKANVVINLIGREYETRNYSFEEVNHHMAEQLAKISKEHGGIMRFIQLSCLGASKSSPSRMLQAKAAAEESILRELPEATILRPAVMVGTEDRILNPWAQFAKKYNFLPMIGGGSTKIQPVYVADVASAVVAALSDDGSSMGKVYELGGPDVYTLHQLAELMYETIREWPHYVNVPFPIAKAISTPREVFLNKVPFPLPSPIIFNLDVINALSSDTLVSKDALTFNDLELVPHKVKGYPIEYLIQYRKGGPNYGSTVSERVTPESYPNucleick Acid Sequence of Osw20 Suppression Construct(SEQ ID NO123)ATGGAGTGTAGTTCAGTGAGTGTACTAGGAATATTACTGGTATTTCCTCTCCTTCATAACCTTGTCACCATCTCCGGGCAGAATCTTCCGGCGGTGGGTTTGTTCACTTTCGGAGATTCCAACTTCGACGCTGGAAATAAAAAGTTCCTCACAAGTGCTCCACTTCCTCAAAACTTTTGGCCTTACGGTAAATCTCGAGATGACCCTAAGGGCAAGTTTTCTGATGGCAAAATTGTCCCGGACTTTATTGCAAAATTCATGGGGATACCACACGATTTACCGCCGGCGCTAAAACCCGGCACCGATGTGTCACGAGGAGCCAGCTTCGCCGTCGGGTCCGCTTCCATTCTTGGATCTCCAAAAGATTCTTTGGCTCTGAATCAACAAGTGAGGAAATTCAATCAGATGATATCAAATTGGAAAGTGGATTACATTCAGAAATCAGTGTTTATGATTAGCATTGGTATGGAAGATTACTACAACTTTACCAAAAACAATCCTAATGCTGAAGTTTCTGCTCAACAAGCTTTCGTTACTTCTGTCACTAACCGGTTTAAGAGTGATATCAACTTGTTGTATTCATCTGGAGCTAGTAAATTCGTCGTACACTTGCTAGCGCCATTAGGTTGTTTACCGATCGCAAGACAAGAATTTAAAACCGGTAACAATTGTTACGAGAAACTCGATGATTTGGCCAAACAACACAACGCTAAAATTGGACCGATTTTGAACGAAATGGCGGAAACTAAACCGGATTTCCAATTCACCGTTTTCGATTTCTACAACGTTATTCTTCGCAGGACACAAAGAAACATGAACTACCGGTTTTCCGTGACGAATATATCGTGTTGCGGTGTTGGGACGCATTATGCATATGGTTGTGGTTTACCTAACGTGCACTCGAAGTTATGCGAATATCAAAGATCCTACCTTTACTTCGACGCACGTCATAACACAGAGAAAGCACAAGAAGCGTTTGCTCATCTTATCTTTGGAGCTGACCCAAATGTTATCCAACCTATGAATGTTCGTGAGCTCATGGTGTATCCTGTTAATGAGCCTATGCGTGAGTTTTGGGAGGATCCAATGGATGAGAAGTTATCGTTAGTCCAATACTAGAGGAGCTTGTTGAGCAGAAACTTCAGCATTAGGATTGTTTTTGGTAAAGTTGTAGTAATCTTCCATACCAATGCTAATCATAAACACTGATTTCTGAATGTAATCCACTTTCCAATTTGATATCATCTGATTGAATTTCCTCACTTGTTGATTCAGAGCCAAAGAATCTTTTGGAGATCCAAGAATGGAAGCGGACCCGACGGCGAAGCTGGCTCCTCGTGACACATCGGTGCCGGGTTTTAGCGCCGGCGGTAAATCGTGTGGTATCCCCATGAATTTTGCAATAAAGTCCGGGACAATTTTGCCATCAGAAAACTTGCCCTTAGGGTCATCTCGAGATTTACCGTAAGGCCAAAAGTTTTGAGGAAGTGGAGCACTTGTGAGGAACTTTTTATTTCCAGCGTCGAAGTTGGAATCTCCGAAAGTGAACAAACCCACCGCCGGAAGATTCTGCCCGGAGATGGTGACAAGGTTATGAAGGAGAGGAAATACCAGTAATATTCCTAGTACACTCACTGAACTACACTCCATGGC
权利要求
1.含有选自以下多核苷酸序列的分离的LMP核酸a)如SEQ ID NO123、SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQID NO55、SEQ ID NO57、SEQ ID NO59和SEQ ID NO121所示的全长多核苷酸;b)编码如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48、SEQ ID NO50、SEQ ID NO52、SEQ ID NO54、SEQ ID NO56、SEQ ID NO58、SEQ ID NO60和SEQ ID NO122所示全长多肽的多核苷酸序列;c)与上述a)或b)中全长多核苷酸序列具有至少90%序列同一性的全长多核苷酸序列;d)可与上述a)或b)中全长多核苷酸序列在严紧条件下杂交的全长多核苷酸序列;以及e)与上述a)或b)中全长多核苷酸序列互补的多核苷酸序列。
2.权利要求1的分离LMP核酸,其中多核苷酸序列包含SEQ ID NO123所示的全长多核苷酸序列。
3.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO2所示的全长多肽序列。
4.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO4所示的全长多肽序列。
5.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO6所示的全长多肽序列。
6.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO8所示的全长多肽序列。
7.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO10所示的全长多肽序列。
8.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO12所示的全长多肽序列。
9.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO14所示的全长多肽序列。
10.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO16所示的全长多肽序列。
11.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO18所示的全长多肽序列。
12.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO20所示的全长多肽序列。
13.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO22或SEQ ID NO122所示的全长多肽序列。
14.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO24所示的全长多肽序列。
15.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO26所示的全长多肽序列。
16.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO28所示的全长多肽序列。
17.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO30所示的全长多肽序列。
18.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO32所示的全长多肽序列。
19.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO34所示的全长多肽序列。
20.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO36所示的全长多肽序列。
21.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO38所示的全长多肽序列。
22.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO40所示的全长多肽序列。
23.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO42所示的全长多肽序列。
24.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO44所示的全长多肽序列。
25.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO46所示的全长多肽序列。
26.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO48所示的全长多肽序列。
27.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO50所示的全长多肽序列。
28.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO52所示的全长多肽序列。
29.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO54所示的全长多肽序列。
30.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO56所示的全长多肽序列。
31.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO58所示的全长多肽序列。
32.权利要求1的分离LMP核酸,其中多核苷酸序列编码SEQ ID NO60所示的全长多肽序列。
33.表达载体,其含有权利要求1的LMP核酸。
34.权利要求33的表达载体,其中LMP核酸有效连接于选自种子特异性启动子、根特异性启动子和非组织特异性启动子之一的异源性启动子。
35.产生具有改变的种子贮存化合物水平的转基因植物的方法,其包括用含有脂质代谢蛋白核酸的表达载体转化植物细胞,从该植物细胞产生种子贮存化合物水平改变的转基因植物,其中所述核酸编码的多肽作为植物种子贮存化合物调节剂,且其中核酸包含选自以下的多核苷酸序列a)如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41、SEQ ID NO43、SEQ ID NO45、SEQ ID NO47、SEQ ID NO49、SEQ ID NO51、SEQ ID NO53、SEQ ID NO55、SEQ ID NO57、SEQ ID NO59、SEQ ID NO121或SEQ ID NO123所示的全长多核苷酸序列;以及b)编码如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48、SEQ ID NO50、SEQ ID NO52、SEQ ID NO54、SEQ ID NO56、SEQ ID NO58、SEQ ID NO60或SEQ ID NO122所示全长多肽的多核苷酸序列。
36.权利要求35的方法,其中种子贮存化合物水平的改变是由于LMP核酸过表达或下调所致。
37.权利要求35的方法,其中LMP核酸编码的多肽中包含选自RNA结合结构域、信号传导结构域、脂质代谢结构域、氧化还原酶结构域、脂肪酸代谢结构域、蛋白质合成结构域、生物碱生物合成结构域、生物合成前体供给结构域和细胞内转运结构域的结构域。
38.权利要求35的方法,其中转基因植物的种子贮存化合物水平相对于野生型植物有所提高。
39.调节植物中种子贮存化合物水平的方法,其包括在植物中修饰权利要求1的LMP核酸的表达。
全文摘要
提供了与脂质和糖代谢调节相关的分离的核酸和蛋白质。具体而言,提供了拟南芥、油菜和向日葵来源的脂质代谢蛋白及其编码核酸。所述核酸和蛋白质用于生产转基因植物和调节种子贮存化合物水平的方法。优选的种子贮存化合物为脂质、脂肪酸、淀粉或种子贮存蛋白质。
文档编号A01H5/00GK1898389SQ200480038651
公开日2007年1月17日 申请日期2004年12月22日 优先权日2003年12月23日
发明者O·奥斯瓦德, J·鲍尔, T·灿克 申请人:巴斯福植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1