棉子糖合酶基因及其用途的制作方法

文档序号:450812阅读:557来源:国知局

专利名称::棉子糖合酶基因及其用途的制作方法
技术领域
:本发明涉及棉子糖(raffinose)合酶基因及其用途。棉子糖族寡糖是蔗糖的衍生物,其由O-α-D吡喃型半乳糖(galactopyranosyl)-(1→6)n-o-α-D-吡喃型葡萄糖(glucopyraosyl(1→2)-β-D-flucto-呋喃糖苷(furanoside)作为通式所代表,并且当n=1时将它们命名为“棉子糖”,当n=2时命名为“木苏糖(stachyose)”,当n=3时命名为“毛蕊花糖(verbascose)”,且当n=4时命名为“筋骨草糖”(ajugose)。除了蔗糖以外,这种棉子糖族寡糖的最大含量发现于植物中,并且已知它们不仅含于高等植物包括裸子植物和松科的(pinaceous)植物(如,云杉)和被子植物如豆科(leguminous)植物(如,大豆、菜豆),芸苔科(brassicaceous)植物(如,饲料芸苔(rape))、藜科(chenopodiaceous)植物(如,甜菜)、锦葵科植物(如,棉花)以及杨柳科植物(如,杨树),而且含于绿藻、小球藻属(chlorella)。因此,它们与蔗糖一样广泛存在于植物界中。棉子糖族寡糖在许多植物的贮存器官或种子中作为储备糖或在有些植物组织间的糖运输现象中作为易位糖而发挥作用。此外,已知如果以适当的量存在于食物中,棉子糖族寡糖具有产生良好状态肠杆菌植物的作用。因此,棉子糖族寡糖已用作用于添加至有些种类食物中的有功能食物材料并用于特定健康食物的领域。通过在许多植物中以蔗糖起始的棉子糖族寡糖合成系统制备具有这种作用和用途的棉子糖族寡糖。该生物合成系统通常包括这样的反应,即经过α(1→6)键将来自galactotinol的半乳糖基团连续添加至附着于蔗糖分子中D-葡萄糖残基位置6的碳原子的羟基上。在该生物合成系统的第一步中,棉子糖合酶是关于通过以下方法棉子糖制备反应的酶,即将来自galactotinol的D-半乳糖基团径α(1→6)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合。已表明该酶构成了上面合成系统中的限速步骤,并且已显示该酶在控制棉子糖族寡糖生物合成中是相当重要的。控制棉子糖合酶在植物中的表达水平或活性使改变棉子糖族寡糖在这些植物中的含量是可能的。然而,虽然该酶本身的存在已通过用生化技术测其活性而证实,但棉子糖合酶仍然没有成功地作为均一蛋白而分离和纯化。此外,该酶的氨基酸序列仍然是未知的,并且没有试图开始分离编码该酶基因的报导。在这些情况下,本发明者进行了深入的研究最终成功地从蚕豆中分离出棉子糖合酶和编该酶的基因。由此完成了本发明。因此,本发明提供下面(的内容)1)从植物中分离的并具有编码能通过以下方法制备棉子糖的蛋白氨基酸序列的核苷酸序列的棉子糖合酶基因,即将D-半乳糖基团经α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子的羟基上。2)根据第1条的棉子糖合酶基因,其中的植物为双子叶植物。3)根据第2条的棉子糖合酶基因,其中的双子叶植物为豆科植物。4)根据第3条的棉子糖合酶基因,其中的豆科植物为蚕豆。5)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因(a)具有SEQIDNo1氨基酸序列的蛋白;(b)具有在SEQIDNo1的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合而制备棉子糖的蛋白。6)具有SEQIDNo2核苷酸序列的棉子糖合酶基因。7)根据第3条的棉子糖合酶基因,其中的豆科植物为大豆。8)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因(a)具有SEQIDNo3氨基酸序列的蛋白;(b)具有在SEQIDNo3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基的位置6碳原子的羟基结合而制备棉子糖的蛋白。9)具有SEQIDNo4核苷酸序列的棉子糖合酶基因。10)根据第2条的棉子糖合酶基因,其中的双子叶槽物为唇形科植物。11)根据第10条的棉子糖合酶基因,其中的唇形科植物为日本菜蓟(Japaneseartichoke)。12)具有编码SEQIDNo5氨基酸序列的核苷酸序列的棉子糖合酶基因。13)具有SEQIDNo6核苷酸序列的棉子糖合酶基因。14)根据第1条的棉子糖合酶基因,其中的植物为单子叶植物。15)根据第14条的棉子糖合酶基因,其中的单子叶植物为禾本科植物。16)根据第15条的棉子糖合酶基因,其中的禾本科植物为玉米(com)。17)具有编码SEQIDNo7氨基酸序列的核苷酸序列的棉子糖合酶基因。18)具有SEQIDNo8核苷酸序列的棉子糖合酶基因。19)具有下述的氨基酸序列(a)或(b)的棉子糖合酶蛋白。(a)SEQIDNo1或SEQIDNo3的氨基酸序列。(b)SEQIDNo1或SEQIDNo3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列;该蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。20)具有SEQIDNo1或SEQIDNo3氨基酸序列的棉子糖合酶蛋白。21)具有第1、2、3、4、7、10、11、14、15或16条棉子糖合酶基因部分核苷酸序列的基因片段。22)具有第5、6、8、9、12、13、17或18条棉子糖合酶基因部分核苷酸序列的基因片段。23)根据第21条或第22条的基因片段,其中的核苷酸数目在从15到50的范围内。24)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的第21、22或23条基因片段的探针与有机体得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。25)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的第21、22或23条基因片段的探针与植物得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。26)用于扩增棉子糖合酶基因或具有其部分核苷酸序列的基因片段的方法,包括将具有第21、22或23条基因片段核苷酸序列的引物与有机体得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。27)用于扩增棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将具有第21、22或23条基因片段核苷酸序列的引物与植物得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。28)用于获得棉子糖合酶基因的方法,包括以下步骤即通过第24、25、26或27条的方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段;和分离及纯化鉴定的DNA片段。29)通过第24、25、26或27条方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段而获得棉子糖合酶基因;和分离及纯化鉴定的DNA片段。30)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或29条棉子糖合酶基因,和连接到其上的启动子的嵌合体基因。31)通过将第30条的嵌合体基因导入宿主有机体而获得的转化子。32)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30棉子糖合酶基因的质粒。33)以第32条质粒转化的宿主有机体,或其细胞。34)以第32条质粒转化的微生物。35)以第32条质粒转化的植物或其细胞。36)用于代谢修饰的方法,包括将第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30条的棉子糖合酶基因导入宿主有机体或其细胞,从而使宿主有机体中棉子糖族寡糖的含量发生变化。37)用于制备棉子糖合酶蛋白的方法,包括从通过培养第34条的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。38)能够结合第19或20条棉子糖合酶蛋白的抗棉子糖合酶抗体。39)用于检测棉子糖合酶蛋白的方法,包括以第38条的抗棉子糖合酶抗体检测蛋白;和通过该抗体与棉子糖合酶蛋白之间的抗原-抗体反应检测棉子糖合酶蛋白。附图简述图1显示用于棉子糖合酶基因在大肠杆菌中表达的质粒的构建。pBluescriptKS-RS为含有克隆于其中的棉子糖合酶基因的质粒。RS代表棉子糖合酶基因,并且显示于该图上部的核苷酸序列为棉子糖合酶基因两个末端部分的核苷酸序列。由小写字母代表的部分序列为来自载体pBluescriptⅡKS-的核苷酸序列。两个加框的核苷酸序列分别为棉子糖合酶基因的起始密码子(ATG)和终止密码子(TGATAA)。几个限制性核酸内切酶的识别位点显示于核苷酸序列的上方。pGEX-RS和pTrc-RS为用于棉子糖合酶基因在大肠杆菌中表达的质粒。Ptac、Ptrc、GST、lacIq和rmB分别代表tac启动子。trc启动子,谷胱甘肽-S-转移酶基因,乳糖阻遇蛋白基因和核糖体RNA转录终止信号。图2显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescriptKS-RS中棉子糖合酶基因的限制性核酸内切酶图谱显示于该图的下方。pBI221RS和pBI221(-)RS表示用于大豆转化表达载体的限制性核酸内切酶图谱。35S和NOS分别代表来自花椰菜花叶病毒的35S启动子和胭脂氨酸合酶基因终止子。图3显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescriptKS-RS中的棉子糖合酶基因限制性核酸内切酶图谱显示于该图的上方。pBI121RS和pBI121(-)RS表示用于芥子转化二等分载体(binaryvectors)的限制性核酸内切酶图谱。对于二等分载体,仅显示右边缘与左边缘之间的部分。35SNOS和NPT分别代表来自花椰菜花叶病毒的35S启动子。胭脂氨酸合酸基因终止子和卡那霉素抗生基因。发明详述下述的基因工程可根据一般方法完成,例如,在“分子克隆实验指南第2版”(1989),冷泉港实验室出版社,ISBN0-87969-309-6;“当前分子生物学方法”(1987),JohnWiley&amp;Sons,Inc.ISBN0-471-50338-X;和“当前蛋白科学方法”(1995),JohnWiley&amp;Sons,Inc.ISBN0-471-11184-8中所述。用于这里的“棉子糖合酶基因”指具有编码以下蛋白氨基酸序列的核苷酸序列的基因(以下简称为本基因),这种蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖并且可以植物中制备这种基因。更为具体地,可以双子叶植物如豆科植物(如,蚕豆,大豆)和唇形科&lt;如,日本菜蓟&gt;或从单子叶植物和禾本利植物(如,玉米)中制备本基因。本基因的具体实例有“具有编码具有SEQIDNo1氨基酸序列蛋白的核苷酸序列的棉子糖合酶基因”,“具有编码具有通过在SEQIDNo1的氨基酸序列中缺失、替代、修饰或添加1个或几个氨基酸而获得的氨基酸序列,并且能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖子分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”;“具有编码具有SEDIDNo3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因;”“具有编码具有通过在SEQIDNo3氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而获得的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”;“具有编码SEQIDNo5氨基酸序列的核苷酸序列的棉子糖合酶基因”;以及“具有编码SEQIDNo7氨基酸序列物核苷酸序列的棉子糖合酶基因。”例如,本发明可通过下面的方法获得。在液氮中冷冻豆科植物如蚕豆(Viciafaba)或大豆(Grlycinemax)的组织并用臼或其它方法物理研磨成细粉状组织碎片。通过一般方法从组织碎片中提取RNA。在提取中可利用商业上可得到的RNA提取试剂盒。通过乙醇沉淀从RNA提取物中分离总RNA。通过一般方法从分离的总RNA中分离具poly-A尾部的RNA。在分离中可利用商业上可得到的oligo-dT柱。通过一般方法从获得的分离物(即,具poly-A尾部的RNA)中合成cDNA。在合成中可利用商业上可得到的cDNA合成试剂盒。例如,作为本基因“具有编码具有SEQIDNo1氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的cDNA片段可用上面获得的蚕豆cDNA作为模板和显示于下表1中的引物1到3通过PCR扩增获得。根据SEQIDNo2的核苷酸序列依据目的可设计和合成用于此的引物。例如,为了扩增“具有编码具有SEQIDNo1氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域”;可设计和合成显示于下表2的引物1到4。用相同的方式,可用从大豆获得的cDNA作为模板和,例如,显示于下表1中的引物4到6通过PCR扩增获得“具有编码具有SEQIDNo3氨基酸序列蛋白核苷酸序列棉子糖合酶基因”的cDNA片段。可根据SEQIDNo4的核苷酸序列,依据目的设计和合成用于基中的引物。例如,为了扩增“具有编码具有SEQIDNo3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域,可设计和合成显示于表2中的引物5到8。可根据一般方法,例如如在“分子克隆;实验指南第2版”(1989),冷泉港实验室出版社;和“当前分子生物学方法”(1987),Johnwiley&amp;SonsInc.ISBN0-471-50338-X中所述,亚克隆扩增的DNA片段。更为具体地,克隆可,例如,用TA克隆试剂盒(Invitrogen)和质粒载体如pBluescnptII(stratagene)完成。克隆DNA片段的核苷酸序列可通过双脱氧终止方法测定,例如,由F.Sanger,S,Nicklen,A.R.Coulson,在美国科学院院报(1977),74,pp.5463-5467中所述。例如,可优选使用从珀金-埃尔默商业上可得到的ABIPRISMDye终止子循环测序现成反应试剂盒。(序列表1)引物1AATTTTCAAGCATAGCCAAGTTAACCACCT30聚体引物2GCTCACAAGATAATGATGTTAGTC24聚体引物3ATACAAGTGAGGAACTTGACCA22聚体引物4CCAAACCATAGCAAACCTAAGCAC24聚体引物5ACAACAGAAAAATATGACTCTTATTACT28聚体引物6AAAAGAGAGTCAAACATCATAGTATC26聚体(序列表2)引物1ATGGCACCACCAAGCATAACCAAAACTGC29聚体引物2ATGGCACCACCAAGCATAACCAAACTGCAACCCTCCAAGACG43聚体引物3TCAAAATAAAAACTGGACCAAAGAC25聚体引物4TCAAAATAAAAACTGGACCAAAGACAATGT30聚体引物5ATGGCTCCAAGCATAAGCAAAACTG25聚体引物6ATGGCTCCAAGCATAAGCAAAACTGTGGAACT32聚体引物7TCAAAATAAAAACTCAACCATTGAC25聚体引物8TCAAAATAAAAACTCAACCATTGACAATTTTGAAGCACT39聚体用于这里的术语“基因片段”指具有本基因部分核苷酸序列的基因片段(以下简称为本基因片段)。例如,其可以是来自植物并具有下面基因部分核苷酸序列的基因片段,该基因具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖位置6碳原子上的羟基结合而制备棉子糖蛋白的苷酸序列。本基因片段的具有实例有具有拥有编码SEQIDNo1氨基酸序列核苷酸序列的部分核苷酸序列的基因片段和具有拥有SEQIDNo2核苷酸序列部分核苷酸序列的基因片段,更为具体地具有核苷酸序列或其部分苷酸序列,编码显示于下表3中任一氨基酸序列的基因片段。这些基因段可用作杂交方法中的探针或PCR方法中的引物。对于PCR方法中的引物,从确保退火特异性的观点出发,一般其核苷酸数目较大是优选的;然而,从以下观点出发,即引物本身易具有更高极结构从而导致退火效率可能的弱化并在合成后的纯化中需要复杂的程序,其核苷酸数目不太大也是优选的。在通常情况下,由单链DNA所组成的基因片段,其中的核苷酸数目在15到50范围内是优选的。(序列表3)#1GlyIleLysPheMetSerIlePheArgPheLysValTrpTrpThrThrHisTrpValGly#2IleIleAspLysPheGlyTrpCysThrTrpAspAlaPheTyr#3GlyGlyCysProProGlyPheValIleIleAspAspGlyTrpGln#4ThrSerAlaGlyGluGlnMetProCysArgLeuValLysTyrGluGluAsn#5ValTyrValTrpHisAlaLeuCysGlyTyrTrpGlyGlyValArgPro#6ThrMerGluAspLeuAlaValAspLysIleValGluAsnGlyValGlyLeuValProPro#7GlyLeuHisSerHisLeuGluSerAlaGlyIleAspGlyValLysValAspValIleHisLeuLeuGlu#8GlyGlyArgValGluLeuAlaArgAlaTyrTyrLysAlaLeu#9ValLysLysHisPheLysGlyAsnGlyValIleAla#10GluHisCysAsnAspPhePheLeuLeuGlyThrGluAlaIleSerLeuGlyArgValGlyAspAspPheTrpCysSerAspProSerGlyAspProAsnGlyThrTyrTrpLeuGlnGlyCysHisMetValHisCys#11AlaTyrAsnSerLeuTrpMetGlyAsnPheIleGlnProAspTrpAspMetPheGlnSerThrHisProCysAlaGluPheHisAlaAlaSerArgAlaIleSerGlyGlyProIleTyrValSerAsp#12LeuProAspGlySerIleLeuArgCys#13AlaLeuProThrArgAspCysLeuPheGluAspProLeuHisAsnGlyLysThrMetLeuLysIleTrpAsn#14GlyValLeuGlyLeuPheAsnCysGlnGlyGlyGlyTrp#15PheAlaProIleGlyLeuValAsnMet标记本基因片段,且然后用作杂交方法中的探针并与有机体获得的DNA杂交,从而可检测具有特异结合到其上探针的DNA片段。因此,从有机体获得的基因文库中,可检测具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖酶的氨基酸序列的核苷酸序列的棉子糖合酶基因;或具有其部分核苷酸序列的基因片段(以下简称为本检测方法)。作为从有机体获得的DNA,可以使用例如,所需植物的cDNA文库或基因组文库。基因文库也可以是商上可得到的基因文库或根据一般的文库制备方法制备的文库,例如,在“分子克隆实验指南第2版”(1989),冷泉港实验室出版社;“当前分子生物学方法”(1987),JohnWiley&amp;Sons,Inc.ISBN0-471-50338-X中所述的方法。作为杂交方法,根据用于文库制备中载体的种类,可使用噬菌斑杂交或菌落杂交。更为具体地,当待用的文库以噬菌体载体构建时,在无菌条件下将合适的宿主微生物与噬菌体混合,进一步与软琼脂培养基混合,并将混合物铺板于琼脂培养基上。之后,于37℃培养培养物直到合适大小的噬菌斑出现。当待用的文库以质粒载体构建时,将该已修改质粒转化入合适的宿主微生物以形成转化子。将获得的转化子稀释至合适的浓度,并将稀释液铺板于琼脂培养基上,然后于37℃培养培养物直到合适大小的菌落出现。在上面文库中任一种情况,培养以后将滤膜置于琼脂培养基的表面,从而使噬体或转化子转移至膜上。用碱将该膜变性,然后中和,并且例如,当使用民龙膜时,以紫外光照射该膜,从而将DNA固定于膜上。然后将该膜与作为探针的通过一般方法标记的本基因片段杂交。对于该方法,可参考,例如,D.M.Glover编,“DNA克隆,实践方法”IRL出版社(1985),ISBN0-947946-18-7。用于杂交中很多种试剂和温度条件;例如,通过加入6XSSC(0.9MNaCl,0.9M柠檬酸),0.1-1%SDS,100μg/ml变性鲑精DNA,并于65℃孵育1小时完成预杂交。然后加入作为探针的标记的本基因片段,并混合。杂交于42℃-68℃4到16小时完成。以2×SSC,0.1-1%SDS洗膜,进一步以0.2×SSC,0-0.1%SDS冲洗,且然后干燥。例如通过放射自显影或其它技术分析膜以检测膜上探针的位置并由此检测具有所用探针核苷酸序列同源的核苷酸序列DNA的位置。因此,可以检测本基因或本基因片段。在原始琼脂培养基上鉴定相应于膜上这样检测到的DNA位置的克隆,并且筛选阳性克隆,从而可分离具有该DNA的克隆。重复相同的检测步骤以纯化具有该DNA的克隆。也可使用其它的检测方法,例如,以GibcoBRL商业上可得到的基因诱捕DNA阳性筛选系统试剂盒。在该方法中,将单链DNA文库与生物素化的本基因片段(即,探针)杂交,接着加入结合链亲和素(streptoavidin)的磁珠并混合。用磁铁从混合物中收集结合链亲和素的磁珠,从而收集和检测具有同源于所用探针核苷酸序列的核苷酸序列,通过本基因片段,生物素和链亲和素结合到这些磁珠上的单链DNA。因此,可检测本基因或本基因片段。通过用合适的寡核苷酸作为引物以合适的DNA聚合酶处理可将该收集到的单链DNA转变成双链形式。本检测方法也可用于植物分析中。更为具体地,根据一般方法,例如在“克隆和测序(植物生物技术实验指南)”在ItaruWatanabe指导下编辑、MasihiroSugiura编,NosonBunka-sha,东京出版(1989)中所述制备植物基因组DNA。以几种合适的限制性核酸内切酶消化植物基因组DNA,接着电泳,并根据一般方法将电泳的DNA印迹至滤膜上。将该滤膜与通过一般方法从本基因片段中制备的探针杂交,并检测与探针杂交的DNA片段。比较不同<claim>1.含有水溶性聚合物的水溶性组合物,其特征在于该水溶性聚合物含有70-100%重量的至少一种水溶性单体A10-30%重量的至少一种两性单体B0-30%重量的至少一种疏水性单体C在一种酰胺化和成盐化的苯乙烯/马来酐共聚物存在下进行反应。</claim><claim>2.根据权利要求1的水溶性组合物,其特征在于单体A1选自于相应于下列通式的分子其中R1表示H或甲基,Q表示带正电荷的金属离子,例如Na+或K+,或铵离子NH+4,-相应于下列通式的分子其中R2表示H或甲基,R3和R4分别表示H或C1-6烷基或羟烷基或C5-12环烷基,-相应于下列通式的分子<p>此处,也可使用能与多种碱基形成配对的碱基,如次黄嘌呤核苷代替上面的几种碱基的混合物。更为具体地,例如,可使用具有显示于表4中核苷酸序列的引物。在该上下文中,与由双链DNA所组成的本基因的编码链具有相同核苷酸序列的寡核苷酸称为“有引物”,并且具有与编码链互补的核苷酸序列的寡核苷酸称为“反义引物”。与存在于棉子糖合酶基因或待扩增的具有其部分核苷酸序列基因片段编码链中5’上游一侧具有相同核苷酸序列的有义引物和具有互补于该编码链3’-下游一侧核苷酸序列的核苷酸序列的反义引物联合用于PCR反应从而,例如,从基因文库基因组文库或cDNA作为模板扩增DNA片段。此时,可通过以电泳的一般方法证实DNA片段的扩增。对于扩增的DNA片段,构速其限制性核酸内切酶图谱或通过一般方法测定其核苷酸序列,从而可鉴定本基因或本基因片段。对于用于此的基因文库,例如,可使用所需植物的cDNA文库或基因组cDNA文库。对于植物基因文库,可这样使用来源于植物的商业上可得到的文库;或根据一般的文库制备方法制备的文库,例如,在“分子克隆实验指南第2版”(1989),冷泉港实验室出版社,中所述或也可使用“当前分子生物学方法”(1987),Johnwiley&amp;Sons,Inc,ISBN0-471-50338-X。作为用于本扩增方法中的基因组DNA或cDNA,例如,可使用从所需植物中制备的cDNA或基因组cDNA。更为具体地,例如,根据SEQIDNo1氨基酸序列而设计的引物与作为模板的来自唇形科植物,日本菜蓟的cDNA用于本扩增方法中,从而可扩增具有SEQIDNo6核苷酸序列的棉子糖合酶基因片段。此外,例如,根据SEQIDNo1氨基酸序列设计的引物与作为模板的来自禾本科植物,玉米的cDNA用于本扩增方法中,从而可扩增具有SEDIQNo8核苷酸序列的棉子糖合酶基因片段。(序列表4)1-F32聚体TTIAAIGTITGGTGGACIACICAITGGGTIGG2-F41聚体ATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA2-RV41聚体TAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT3-F44聚体GGIGGITGICCICCIGGITTIGTIATIATIGAIGAIGGITGGCA3-RV44聚体TGCCAICCITCITCIATIATIACIAAICCIGGIGGICAICCICC4-F32聚体AAIAAICAITTIAAIGGIAAIGGIGTIATIGC4-RV32聚体GCIATIACICCITTICCITTIAAITGITTITT5-F38聚体TGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT5-RV38聚体AACATITCCCAITCIGGITGIATIAAITTICCCATCCA6-RV27聚体CATITTIACIA(AG)ICCIATIGGIGCIAA本扩增方法也可用于分析植物基因。更为具体地,例如,从不同种指定植物种类中制备的植物基因组DNA用作为扩增方法的模板以扩增DNA片段。扩增的DNA片段与甲醛溶液混合,通过于85℃加热5分钟而变性,接着于冰快速冷却。例如,将该样品在含有0%或10%甘油的6%聚丙烯酰胺凝胶中进行电泳。在该电泳中,可使用商业上可得到的用于SSCP(单链构型多态性)的电泳仪,并进行电泳,同时将凝胶保持恒温,如,5℃,25℃或37℃。例如,通过用商业上可得到试剂的银染方法的方法从电泳的凝胶中检测DNA片段。从在不同种间检测到DNA片段的电泳中的行为差异,检测棉子糖含基因的突变,并且分析由突变造成的伴随棉子糖族寡糖表达的表型特征的差异。该方法可根据SSCP方法完成,例如,在“植物PCR实验方法”,在Koshimamoto和TakujiSasaki指导下编辑,shujun-sha,东京(1995)出版,ISBN4-87962-144-7,pp.141-146中所述。上述的本检测方法或本扩增方法也可用于鉴定棉子糖合酶基因或具有其部分核苷酸序列的基因片段且然后分离和纯化鉴定的基因或其基因片段以获得本基因(以下简称为本基因获得方法)。例如,通过检测由本基因片段所组成并与通过上述本检测方法从有机体获得基因文库中DNA杂交的探针从鉴定出与所用探针具有同源核苷酸序列的DNA;纯化带有该DNA的克隆;并从克隆中分离如纯化质粒或噬菌体DNA可获得本基因或本基因片段。当这样获得的DNA为具有部分棉子糖合酶基因的核苷酸序列的基因片段时,用该DNA作为探针通过本基因检测方法进一步筛选基因文库得到全长的本基因。例如,通过用具有本基因片段核苷酸序列的引物进行聚合酶链式反应以从通过上述本扩增方法得到的有机体DNA中扩增DNA片段;且然后构建扩增DNA片段的限制性核酸内切酶图谱或测定其核苷酸序列可获得本基因或本基因片段。根据获得基因片段的核苷酸序列,合成用于5’-末端序列分析的反义引物,和合成用于3’-末端序列分析的有义引物。可通过用这些引物和商业上可得到的试剂盒,如,Clontech的Marakhon试剂盒的RACE访求测定全长本基因的核苷酸序列。全长的本基因可通过根据这样测定的核苷酸序列中两个末端序列合成新的引物并再次进行聚合酶链式反应而获得。上述本基因获得方法使从各种有机体中获得棉子糖合醇基因作为本基因成为可能。例如,这样的基因,其编码棉子糖合酶,该酶具有与SEQIDNo1氨基酸序列在相应于400个或更多个氨基酸长度的区域中约50%或更高的同源性的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。更为具体地,例如,具有SEQIDNo4核苷酸序列的棉子糖合酶基因可通过以下方法获得,包括通过本扩增方法用从SEQIDNo1氨基酸序列设计的引物和大豆cDNA作为模板扩增和鉴定含有具有部分棉子糖合酶基因核苷酸序列基因片段的DNA片段;分离和纯化鉴定出的DNA片段,接着通过上面步骤以获得含有该DNA片段的全长基因。可以构成包括本基因和连接到其上启动子的嵌合体基因(以下简称为本嵌合体基因)。只要其在待转化的宿主有机体中是有功能的,待用的启动子没有特别的限制。该启动子可包括,例如,合成的在大肠杆菌中有功能的启动子,如大肠杆菌乳糖纵子启动子,大肠杆菌色氨酸操纵子启动子和tac启动子;酶母乙醇脱氢酶基因(ADH)启动子;腺病毒主要晚期(Ad.ML)启动子,SV40早期启动子,及杆状病毒启动子。当宿主有机体为植物或其细胞时,启动子可包括,例如,从T-DNA得到的组成型启动子如胭脂氨酸合酶基因(NOS)启动子和章鱼氨酸合酶基因(OCS)启动子;从植物病毒得到的启动子如从花椰菜花叶病毒(CaMV)得到的19S和35S启动子;得到的启动子如苯丙氨酸氨-裂合酶(PAL)基因启动子,查耳酮合酶(CHS)基因启动子和发病机理相关蛋白(PR)基因启动子。此外,也可使用载体pSUM-GY1(见JP-A-06-189777-1994),其具有在特定植物组织中得到特导表达的启动子,例如,从大豆得到的种子贮藏蛋白大豆球蛋白基因的启动子。使用构建的嵌合体基因从而具有这种启动子使在特定的植物组织中增加或减少棉子糖族寡糖的含量成为可能。然后根据一般的基因工程方法将本嵌合体基因导入宿主有机体中以得到转化子。如果必要,根据用于将基因导入宿主有机体的转化方法,可使用质粒形式的本嵌合体基因。此外,本嵌合体基因可以含有终止子。在这种情况,一般优选构速嵌合体基因从而使终止子位于棉子糖合酶基因的下游。只要其在待转化的宿主有机体中有功能,待用的终止子没有特别的限制。例如,当宿主有机体为植物或其细胞时,终止子可包括,例如,从T-DNA得到的组成型终止子如胭脂氨酸合酶基因(NOS)终止子;和从植物得到的终止子如洋葱病毒GV1或GV2的终止子。如果必要,本基因可以质粒的形式使用。例如,当宿主有机体是微生物时,通过一般的方法,例如,在“分子克隆实验指南第2版”(1989),冷泉港实验室出版社或“当前分子生物学方法”(1987),JohnWiley&amp;Sons,Inc,ISBN0-471-50338-X中所述,将构建的质粒导入微生物中。以抗生素抗性或营养缺陷标记筛选这样转化的微生物。当宿主有机体是植物时,通过一般方法如以农杆菌感染(见JP-B2-58917/1990和JP-A60-70080/1985。电穿孔进入原生质体(见JP-A60-251887/1985和JP-B5-68575/1993)或粒子枪方法(见JP-A5-508316/1993和JP-A63-258525/1998)将构建的质粒导入植入细胞。以抗生素如卡那毒素或潮霉毒筛选通过导入质粒而转化的植物细胞。从这样转化的植物细胞中,可通过一般的植物细胞培养方法再生出转化的植物,例如,通过在“植物基因操作指南(怎样制备转基因植物)”由Uchimiya,1990写,Kodan-sha科学出版社(ISBN4-06-153513-7),pp.27-55中描述的方法。此外,收集转化植物的种子也使增殖转化的植物成为可能。此外,获得的转化植物与非转化植物之间的较使制备具有转化植物特征的子代植物成为可能。可以通过将本基因导入宿主有机体或其细胞并修饰宿主有机体或其细胞中的代谢而改变棉子糖族寡糖的含量。作为这种方法,例如,可以使用以下方法,即通过构建包括本基因或连接到其上启动子的本嵌合体基因,其中的本基因以适于转录、翻译和表达为蛋白的原始方向与启动子连接且然后将本嵌合体基因导入宿主有机体或其细胞而增加宿主有机体中棉子糖族寡糖含量的用于代谢修饰的方法;或通过构建包括本基因和连接到其上启动子的本嵌合体基因,其中的本基固以不适于翻译和表达为蛋白的相反方向与启动子连接,且然后将本嵌合体基因导入宿主有机体或其细胞而减少宿主有机体或其细胞中棉子糖族寡糖的含量的用于代谢修饰的方法。这里使用的术语“棉子糖合酶蛋白”指由本基因编码的蛋白(以下简称为本蛋白)。例如,其可包括这样的酶蛋白,它具有SEQIDNo1或SEQIDNo3氨基酸序列,或具有在SEQIDNo1或SEQIDNo3氨基酸序列中通过缺失、替代、修饰或添加1个或几个氨基酸而得到的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着与蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。本蛋白具体的实例为SEQIQNo1氨基酸序列(799个氨基酸;分子量,89kDa)的酶蛋白和具有SEQIDNo3氨基酸(781个氨基酸;分子量,87kDa)的酶蛋白。尽管本蛋白可,例如,从豆科植物如蚕豆(Viciafaba)中通过一般的生化方法如(NH4)2SO4沉淀、离子交换柱、疏水柱、羟碳灰石柱或凝胶滤膜柱制备,但其也可从以本质粒转化的宿主有机体或其细胞中制备。更为具体地,例如,用发玛西亚GST基因融合载体试剂盒,将本基因插入附于试剂盒中的表达载体质粒。根据一般的基因工程方法将得到的载体质粒导入微生物如大肠杆菌中。将获得转化子的培养物培养于具有IPTG(异丙基硫代-β-D-半乳糖苷)的培养基中,从而使本蛋白可作为融合蛋白在培养物中表达和产生。可通过一般的方法如细菌细胞裂解、柱操作或SDS-PAGE电泳分离和纯化诱导表达的融合蛋白。以蛋白酶如凝血酶或血液凝固因子Xa消化融合蛋白得到本蛋白。该过程优选,例如,根据在“当前蛋白科学方法”(1995),JohnWiley&amp;Sons,Inc,ISBN0-471-11184-8中所述的方法完成。例如,通过在L.Lehle和W.Janner,欧洲生化杂志,38-103-110(1973)中所述的方法可测定本蛋白的活性。用上面制备的本蛋白作为抗原通过一般的免疫学方法可制备能够结合棉子糖合酶蛋白的抗棉子糖合酶抗体(以下简称为本抗体)。更为具体地,可,例如,根据在EdHarlow与DavidEane,“抗体实验指南”(1988),冷泉港实验室出版化,ISBN0-87969-314-2中所述的方法制备本抗体。可通过以本抗体处理测试蛋白并且检测具有特异性结合到其上本抗体的蛋白来检测本蛋白。这种检测方法可根据如Western印迹方法和酶联免疫吸附分析(ELISA)的免疫学技术加以完成,例如,在EdHarlow和DavidLane,“抗体实验指南”(1988),冷泉港实验室出版社,中所述的方法。例如,Western印迹方法按如下完成例如,根据在酶学方法,182卷,“蛋白纯化指南”98174-193,ISBN9-12-182083-1中所述的方法从植物中提取蛋白。根据所用的植物组织可适当地改变提取缓冲液的组成。根据一般的SDS-PAGE方法将提取的蛋白电泳。通过以一般的电转方法的Western印迹将凝胶中电泳的蛋白的转移至膜上。更为具体地,例如,将凝胶浸于转移缓冲液(25mMTris,192mM甘氨酸,20%甲醇)中10分钟,且然后置于与凝胶切成相同大小的PVDF膜上。将凝胶与膜一起置于商业上可得到的半干型转膜仪中。以0.8到2mA/cm2的恒定电流45分钟到1小时完成印迹。可用一级抗体和以碱性磷酸酶或辣根过氧化物酶标记的二极抗体或蛋白A以用于Western印迹检测的试剂盒对转移至膜上的蛋白进行免疫学检测。此时,可通过用本抗体作为一级抗体检测膜上的本蛋白。在ELISA方法中,例如,根据对最终结合到ELISA平板表面上的抗原进行免疫学检测的原则利用结合到由树脂制成的96-孔ELISA平板表面上蛋白的特性。测试蛋白作为溶液加入并结合到ELISA平板上,接着,例如,通过加入含有如5%小牛血清蛋白的蛋白的PBS封闭。之后,以PBS洗孔,向其中加入含有本抗体的溶液以进行反应。洗孔之后,进一步向孔中加入含有从碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液,接着洗孔。最后,向孔中加入用于检测的底物溶液,并以ELISA读数器检测底物颜色的形成。在另一种方法中,加入本抗体并结合到ELISA平板上,接着通过,例如,加入含有如5%小牛血清蛋白的蛋白的PBS封闭。然后将测试蛋白作为溶液加入,并且测试蛋白中含有的抗原与已结合到平板上的本抗体结合,接着洗孔,且进一步向孔中加入本抗体。此时所用的本抗体优选为从不同于用于制备第一次使用的本抗体动物的动物种类中制备的抗体。然后向孔中加入含有以碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液,接着洗孔。此时所用的二次抗体必需具有结合后来加入的本抗体的特性。最后,加入用于检测的底物溶液,并以ELISA读数器检测颜色的形成。实施例本发明将通过下面的实施例进一步说明;然而,本发明无论怎么也不以任何方式限于这些实施例。实施例1(肌醇半乳糖苷的纯化)以甲醇将约250ml的甜菜黑叶舌(blakstrap)糖密稀释5倍。将稀释液以21,400×g于室温离心15分钟以去除不溶性物质。将获得的上清液转移至2-升的锥形瓶中,向其中加入一半体积的异丙醇并以搅拌混匀(portionwise)。将锥形瓶于室温放置一段时间直到得到的沉淀物附着到锥形瓶壁上。然后轻轻倾倒去除上清液。向沉淀物中加入500ml乙醇,并以旋转式振荡器通过搅拌洗混合物。进一步重复洗几次。从锥形瓶壁上刮下洗过的沉淀物,接着于滤纸上空气干燥。将空气干燥的沉淀物(干粉)溶于纯水至约40%(W/V)。向该溶液中加入伯乐的AG501-X8(D),接着搅拌。重复该操作直到溶液颜色变得几乎没有观察到。以微孔的Sep-PakQMA柱处理得到的溶液,并进一步以微孔的Sep-PakCM,Sep-PakC18和Sep-PakSilica柱预处理。将5ml体积得到的溶液上样于Wako-凝胶LP40C18柱(Wako纯化学工业,2.6cm×85cm)中,并以纯水洗脱。以便携式糖折光计测量洗脱液糖的含量,并且以微孔的Sugar-pakNa(7.8mm×300mm)柱m过高效相层析(HPLC)分析糖的组成。以410型水分化析光计进行糖的检测。将含有肌醇半乳糖苷的洗脱液冻干,并将得到的冻干粉溶于5ml纯水中。将该溶液装于TOYOPEARLHW40(S)柱(TOSO,2.6cm×90cm)中,并以纯水洗脱。以上述相同的方式分析洗脱液,从而获得纯化的肌醇半乳糖苷。将获得的肌醇半乳糖苷于25℃置于达到含有80mM磷酸盐缓冲液(pH6.5),2mg/ml肌醇半乳糖苷,和8.3Uα-半乳糖苷酶(室灵曼,超产大肠杆菌662038)的反应混合物中40分钟。以氯仿抽提反应混和物,并通过HPLC分析水层。证实得到的肌醇半乳糖苷被水解成半乳糖和肌醇。实施例2(棉子糖合酶活性的测量)根据L.Lehle和W.Tanner,欧洲生化杂志,38,103-110(1973))描述在以下条件中测量棉子糖合酶活性。首先,将待用于滑性测量的2μl样品加入18ul的反应混和物中,该混和物达到含有100mMTris-HCl(pH7.4),5mMDIT(二硫苏糖醇),0.01%BSA,200μM蔗糖5mM肌醇半乳糖,740KBq/ml(31.7μM)[14C]蔗糖,并且将反应混合物置于37℃3到20小时。反应后,向反应混和物中加入30μl乙醇,接着搅拌并以15,000rpm离心5分钟。将5ul体积的上清液点于用于薄层层析的HPTLC纤维素平板(Merck,10cm×20cm)上,并以n-丁醇∶吡啶∶水∶醋酸=60∶40∶30∶3展开。将展开的平板干燥且然后以用于测定制备的[14C]棉子糖的图像分析仪(富士照相胶卷,FUJIX生物图像分析仪BAS-2000II)加以定量分析。实施例3(棉子糖合酶的纯化)按如下从蚕豆中进行棉子糖合酶的纯化对于每种纯化蛋白的溶液,存在于蛋白溶液中的蛋白通过SDS-PAGE(DaiichiKagakuYakuhin)加以分析,并根据实验例2中描述的方法测量其酶活性。首先,将300g贮存于-80℃的蚕豆未成熟种子(NmtokuIssun)融化并然后去皮。将去皮的种子置于600ml溶液中,其中含有100mMTris-HCl(pH7.4),5mMDTT(二硫苏糖醇),1mMEDTA,1mmPMSF(苯甲基碘酰氟)和1mm的苯甲酰胺,并在冰上以上臼研磨。将研磨的材料于4℃21,400×g离心50分钟。向得到的上清液中加入1/20体积的10%聚乙烯亚胺(pH8.0)。将混合物于4℃搅拌15分钟,并于4℃以15,700xg离心20分钟。向得到的上清液中搅拌加入196g/l的(NH4)2SO4。将混合物在冰上搅拌30分钟,并于4℃以15,700xg离心20分钟。向得到的上清液中进一步搅拌加入142g/l(NH4)2SO4。在冰上搅拌30分钟以后,将混合物于4℃以15,700xg离心20分钟。将得到的沉淀物溶于50ml100mMTris-Hcl(pH7.4)和5mMDTT(二硫苏糖醇)中,并将溶液在20mMTris-Hcl(pH7.4),1mMDTT(二硫苏糖醇)和1mMED7A中4℃透析过夜。透析后,将悬液于4℃以70,000xg离心60分钟。向得到的上清液中加入1mM苯甲酰胺Hcl,5mMε-氨基-n-已酸,1μg/ml抗蛋白酶,1μg/ml亮抑酶肽和10mMEGTA,并进一步加入1/40体积的2MKcl。将混合物装入以0.05MKcl,20mMTris-Hcl(pH7.4),1mMDTT(二硫苏糖醇)和1mMEDTA平衡的DEAE-葡聚糖纤维素柱(发玛西亚,2.5cm×21.5cm)中,并以0.05至0.5MKcl的梯度洗脱吸附的蛋白。到此时期的纯化步骤重复三次,并合并具有棉子糖合酶活性的馏份且然后按如下纯化向具有棉子糖合酶活性的洗脱馏份中加入1/4体积的均一(portionwise)饱和的(NH4)2SO4。将溶液装入以20%饱和(NH4)2SO4,20mMTris-Hcl(pH7.4),1mMDTT(二硫苏糖醇)和1mMEDTA平衡的Phenyl-琼脂糖柱(发玛西亚,2.5cm×10.2cm)中,并以20%到0%梯度的(NH4)2SO4洗脱的吸附的蛋白。得到的活性馏份通过加入0.01M磷酸钾缓冲液(pH7.5)至2倍体积而稀释。将稀释的溶液装入预先以0.01M磷酸钾缓冲液(pH7.5)和2mMDTT(二硫苏糖醇)平衡的Econo-Pac10DG柱(伯乐,5ml)中,并以0.01至0.5M梯度的磷酸钾缓冲液(pH7.5)和2mM的DTT(二硫苏糖醇)洗脱吸附的蛋白。发现此时期获得的活性馏份已被纯化达6500一倍或更高的特异性活性。具有棉子糖合酶滑性的部分得到的纯化蛋的溶液装入以0.2MKcl、20mMTris-Hcl(pH7.4),1mMDTT(二硫苏糖醇)和1mMEDTA平衡的Superdex200柱(发玛西亚,1.6cm×60cm)中。将这样分离的纯化蛋白进行SDS-PAGE,并测量棉子糖合酶的活性。具有棉子糖合酶活性的蛋白带在SDS-PAGE中被鉴定为具有约90KDa的分子量。实施例4(棉子糖合酶部分氨基酸序列的分析)向约1ml在实施例3中以Econo-Pac10DG柱(伯乐,5ml)纯化的纯化蛋白溶液中加入1/9体积的100%TCA,并将混合物置于冰上30分钟。以10,000xg离心15分钟后,将得到的沉淀物悬于500μl的冷丙酮(-20℃)中,接着进一步离心。重复该丙酮清洗。并将收集的沉淀物干燥且然后溶于200μl的SDS-上样缓冲液中,接着进行SDS-PAGE。对电泳的凝胶进行CBB染色,从其中切出棉子糖合酶蛋白带。向这样获得的凝胶中加入1ml50%的乙腈和0.2M的碳酸铵(pH8.9),并继续于室温搅拌20分钟清洗。以相同的方式再次洗凝胶一次,并且在减压下干燥至达到体积减小程度。向该凝胶中加入1ml0.02%吐温-20和0.2M的碳酸铵(pH8.9),并将混合物于室温搅拌15分钟。去除溶液后,加入400μl8M的尿素和0.4M的NH4HCO3,进一步加入40μl45mm的DTT(二硫苏糖醇),并将混合物置于50℃20分钟。完全回到室温后,加入4μl1M的碘乙酸,并将混合物于黑暗中室温搅拌20分钟。去除溶液后,加入1ml纯水,并将混合物于室温搅拌5分钟,接着清洗。进一步洗二次后,加入1ml50%的乙腈和0.2M的碳酸铵(pH8.9),并将混合物于室温搅拌15分钟。再次重复相同的处理,之后去除溶液,将凝胶在减压下干燥到减小体积程度。向该凝胶中加入100μl体积的Achromobacter蛋白酶I(Takara,残基特异性蛋白酶试剂盒)溶液。进一步加入0.02%的吐温-20和0.2M的碳酸铵(pH8.9)至凝胶不暴露于溶液表面的程度,并将混合物置于37℃42小时。进一步加入500μl0.09%的TFA和70%的乙腈,并将混合物于室温搅拌30分钟。将含于样品管中的得到的混合物浮于超声浴中,接着超声处理(BRANSON,60W输出功率)5分钟。将这样处理的管和内容物离心,将得到的提取物收集于别的涂布硅氧烷的样品管中。另一方面,再次向沉淀物中加入500μl0.09%的TFA和70%的乙腈,接着以上述相同的方式重复提取。合并得到的提取物且然后在减压的条件下浓缩至得到200至300μl剩余溶液体积的程度。向浓缩液中加入25μl8M的尿素和0.4M的NH4HCO3,并将混合物浓缩至得到100μl或更小体积剩余溶液的程度。从纯水将浓缩液调至100μl,并将混合物经UltrafreeC3GV(微孔)滤膜过滤。然后将获得的过滤液经AquaporeBU-300C-4(2.1mm×30mm)柱通过0.1%的TFA/2.1%至68.6%梯度的乙腈洗脱。监测215nm处的吸收从收集其峰值处的馏份。将收集的样品在减压下蒸发至完全干燥,且然后以ABI蛋白测序议473A分析以检测棉子糖合酶的部分氨基酸序列。实施例5(cDNA的制备)将约2g的未成熟蚕豆(NintokuIssun)种子冻于液氮中且然后以臼研磨,向其中加入20ml等基因(Nippon基因),并将混合物进一步彻底研磨。将研磨的材料转入离心管中,向其中加入4ml的氯仿,并将混合物从旋涡混合器搅拌且然后于4℃以6,500xg离心10分钟。收集水层,向其中加入10ml异丙醇,并搅拌混合物且然后于4℃以6,500xg离心10分钟。将得到的沉淀物以10ml70%的乙醇洗且然后溶于1ml洗脱缓冲液(10mMTris-Hcl(pH7.5)),1mMEDTA,0.1%SDS)中。将溶液置于60℃10分钟且然后以10,000xg离心1分钟以去除不溶性物质。向得到的上清液中加入等体积的Oligotex-dT30(Takara),并且搅拌混合物且然后置于65℃5分钟。将混合物置于冰上且然后放置3分钟,向其中加入200μl5M的NaCl,并将混合物置于37℃10分钟。将混合物然后于4℃以10,000xg离心3分钟。收集沉淀物且然后悬于1mlTE缓冲液中,并将悬液置于65℃5分钟,置于冰上且然后放置3分钟,接着于4℃以10,000xg离心3分钟以去除沉淀物。向得到的上清液中加入100μl3M的醋酸钠和2ml的乙醇,RNA以乙醇沉淀并收集。将收集的RNA以70%的乙醇洗2次且然后溶于20μl灭菌水中,用于以后的cDNA合成。通过测量260nm处的吸收测定获得的RNA量。对于cDNA合成,使用用于RT-PCR的第一链合成试剂盒(Amercham)和cDNA合成试剂盒(Takara),并且所有的操作根据说明书完成。实施例6(从cDNA分析棉子糖合酶基因的核苷酸序列)根据实施例4中获得的氨基酸序列,合成具有显示于下表5中核苷酸序列的混合合成DNA引物。用Clontech的优势KlenTaqcDNA试剂盒以珀金-埃尔默GeneAmpPCR系统2400和DNA热循环仪480完成PCR方法。聚合酶链式反应用上面的引物于94℃1分钟,50℃3分钟和72℃3分钟进行,并将重复该反应40次。结果,具有下表5中显示的核苷酸序列的引物8.2与13.3RV、引物13.4与10.3RV以及引物7.4与10.3RV的结合分别得到1.2kb、0.5kb和1.2kb带的扩增。以TA克隆试剂盒(Invitrogen)克隆这些扩增的DNA片段,接着用珀金-埃尔默的ABIPRISMDye终止子循环测序现成反应试利盒进行测序反应并以ABI373SDNA测序仪进行核苷酸序列分析。结果,发现这些DNA片段分别具有SEQIDNO2核苷酸序列中第813个碱基至第1915个碱基、第1936个碱基至第2413个碱基以及第1226个碱甚至第2413个碱基的核苷酸序列。根据这些核苷酸序列,制备具有显示于下表6中核苷酸序列的合成DNA引物,并以Clontech的马拉松cDNA扩增试剂盒分析位于cDNA两末端区域的核苷酸序列。结果,最后测定SEQIDNO2的核苷酸序列。序列(序列表5)#8.226聚体AA(AG)AC(ATGC)GC(ATGC)CC(ATGC)AG(TC)AT(TCA)AT(TCA)GACAA#13.420聚体AA(AG)AT(TCA)TGGAA(TC)CT(ATGC)AACAA#7.424聚体AA(AG)GC(ATGC)AG(AG)GT(ATGC)GT(ATGC)GT(ATGC)CC(ATGC)AAG#13.3RV21聚体(TC)TT(AG)TT(ATGC)AG(AG)TTCCA(AGT)ATTTT#10.3RV21聚体(TC)TT(AG)TC(TC)TC(AG)TA(ATGC)AG(AG)AATTT(序列表6)RS-2RV30聚体GGCTGAGGTTCGGTTCATTCCTGAATCATCRS-730聚体CCAAATGGTACATATTGGCTCCAAGGTTGTRS-830聚体AAGAGTGTATCTGAATTTTCACGCGCGGTGRS-930聚体TGGTGCAATGGGAAAACTCCAATGAGCACCRS-1030聚体ATGAAGTGTTCTGATAGATTGAAAGTTTCGRS-1130聚体CAGTCTCTGGAGTTTGATGATAATGCAAGT实施例7(从蚕虫cDNA中克隆棉子糖合酶基因)合成从SEQIDNO1氨基酸序列设计的引物,即,具有显示于下表7核苷酸序列的引物。用这些引物和在实施例5中获得的cDNA作为模板,在实施例6中所述的条件下通过PCR扩增开放阅读框区域的DNA片段。从所用的引物中含有其识别序列的限制性核酸内切酶BamHI和XbaI消化扩增的DNA片段。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先从BamHI和XbaI消化的质粒pBluescriptIIKS-(Stratagene)中。克隆DNA片段的核苷酸序列从珀金-埃尔默的ABIPRISMDye终止子循环测序现成反应试剂盒加以确证。在这样获得的克隆中,发现SEQIDNO2的核苷酸序列中第1591位置的碱基从胞腺嘧啶(T)变成胞嘧啶(C)。然而,这是一个无义突变而没有改变氨基酸;因此,将该克隆命名为pBluescriptKS-RS,且用于以后的实验中。(序列表7)RS-N41聚体CGCGGATCCACCATGGCACCACCAAGCATAACCAAAACTGCRS-C37聚体TGCTCTAGATTATCAAAATAAAAACTGGACCAAAGAC实施例8(蚕豆棉子糖合酶基因在大肠杆菌中的表达)以BamHI和NatI消化实施例7中获得的具有蚕豆棉子糖合酶基因的质粒pBluescriptKS-RS,并克隆于以BamHI和NatI消化的质粒pGEX-473(发玛西亚)中以得到显示于图1中的质粒pGEX-RS。以NcoI和XbaI消化质粒pBluescriptKS-RS,并且克隆于从NcoI和XbaI消化的质粒pTrc99A(发玛西亚)中以得到显示于图1中的质粒pTrc-RS。将这些质粒导入大肠杆菌菌株HB101,并用得到的转化子确证棉子糖合酶的表达。将每1ml体积的过夜转化了培养物接种于100mlLB培养基并于37℃孵育约3小时,接着加入IPTG(异丙基硫代-β-D-半乳糖苷)至1mM的终浓度并进一步孵育5小时。将培养物以21,400xg离心10分钟,并收集细菌细胞。将收集的细菌细胞保存于-80℃。向冻存细菌细胞中加入10倍体积的100mMTris-Hcl(pH7.4),1mMEDTA,5mMDTT(二硫苏糖醇),1mMPMSF(苯甲基磺酰氟)及1mM苯甲酰胺,并融化和悬浮细菌细胞。以超声裂解仪(Branson)处理这些悬液从进行细菌细胞的裂解。将获得的裂解细胞混合物以16,000xg离心10分钟,并收集可溶性蛋白。用每4μl体积的这样获得的蛋白溶液根据上述的方法测量棉子糖活性。反应于37℃进行64小时。作为对照,使用从其中之一的载体,pGEX-4T3转化的大肠杆菌菌株HB101。结果显示于表1。检测HB101(pGEX-RS)和HB101(pTrc-RS)转化子样品中的棉子糖合成。表1</tables>实施例9(从大豆cDNA中克隆棉子糖合酶基因)从实施例5中所述的相同方式,从未成熟Williams82大豆(Glycinemax)的种子中获得cDNA。用该cIDNA作为模板且从SEQIDNO1氨基酸序列设计的引物,即,具有下面序列表8中显示核苷酸序列的引物,在实施6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆,接着用珀金-埃尔默的ABIPRISMDye终止子循环测序现成的试剂盒进行测序反应并以ABI373SDNA测序仪进行核苷酸序列分析。根据该序列,合成具有下面序列表9中显示核苷酸序列的引物。用与实施例5中所述的相同方式从Williams82大豆叶中获得的mRNA以马拉松Clontech试剂盒进行cDNA的合成。以连接酶将获得的cDNA连接于含于该试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA,以显示于下面序列表9中的引物进行聚合酶链式反应。根据附属于Clontech马拉松试剂盒中的方法分析该基因两末端的核苷酸序列。结果,SEQIDNO4的核苷酸序列得以测定。(序列表8)1-F引物35聚体CGATTIAAIGTITGGTGGACIACICAITGGGTIGG2-RV引物45聚体GGCCTAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT5-F引物41聚体CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT6-RV引物32聚体GGCCACATITTIACIA(AG)CCIATIGGIGCIAA(序列表9)SN-130聚体CACGAACTGGGGCACGAGACACAGATGATGSC-3RV30聚体AAGCAAGTCACGGAGTGTGAATAGTCAGAGSC-530聚体ACACGAGACTGTTTGTTTGAAGACCCCTTGSC-625聚体TGGAATCTCAACAAATATACAGGTGSN-3RV30聚体GGGTCATGGCCAACGTGGACGTATAAGCACSN-4RV30聚体GATGATCACTGGCGCGGTTTTCTCCTCGAG实施例10(从日本菜蓟cDNA中获得棉子糖合酶基因)以与实施例5中所述的相同的方式,从日本菜蓟(Stachyssieboldii)叶中获得cDNA。用该cDNA作为模板且从SEQIDNO1氨基酸序列设计的引物,即,具有显示于下面序列表10中核苷酸序列的引物,在实施例6中描述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆,接着用珀金-埃尔默的ABIPRISMDye终止子循环测序现成反应试剂盒进行序列反应并且以ABI373SDNA测序仪进行核苷酸序列分析。结果,SEQIDNO6的核苷酸序列得以测定。根据这样获得的核苷酸序列,制备合成的DNA引物,并且以Clontech马拉松试剂盒分析该基因两末端区域的核苷酸序列。(序列表10)1-F引物35聚体CGATTIAAIGTITGGTGGACIACICAITGGGTIGG4-RV引物37聚体GGCCAGCIATIACICCITTICCITTIAAITGITTITT2-F引物44聚体CGAATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA6-RV引物32聚体GGCCACATITTIACIA(AG)TCCTATTGGTGCIAA实施例11(从玉米cDNA中获得棉子糖合酶基因)以与实施例5中所述的相同的方式,从先锋3358玉米(ZeamaysL.)叶中获得cDNA。用该cDNA作为模板并且用从SEQIDNO1氨基酸序列设计的引物,即,具有下面序列表11中显示的核苷酸序列的引物,在实施例6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Inuitrogen)克隆,接着用珀金埃尔默的ABIPRISMDye终止子循环测序现成反应试剂盒进行序列反应并以ABI的373SDNA测序仪进行核苷酸序列分析。根据该序列,合成具有下面序列表12中显示核苷酸序列的引物。以与实施例5中所述的相同的方式,用连接酶将从先锋3358玉米(ZeamaysL.)叶中获得的mRNA连接到含于Clontech马拉松试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA,以显示于下面序列表12中的引物用与上述相同的方式进行聚合酶链式反应。结果,SEQIDNO8的核苷酸序列得以测定。根据这样获得的核苷酸序列,制备合成的DNA引物,并且以与实施例9中所述相同的方式,以Clontech的马拉松试剂盒分析该基因5’-末端区域的核苷酸序列。(序列表11)5-F引物41聚体CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT6-RV引物32聚体GGCCACATITTIACIA(AG)ICCIATIGGIGCIAA(序列表12)M-10引物25聚体GACGTCGAGTGGAAGAGCGGCAAGGM-11引物25聚体CACCTACGAGCTCTTCGTCGTTGCC实施例12(植物中35S-蚕豆棉子糖合酶基因嵌合体基因表达载体的构建)以限制性核酸内切酶BamHI和SacI消化实施例7中获得的具有棉子糖合酶基因的质粒pBluescriptKS-RS。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先以BamHI和SacI消化的二等分载体(binaryvector)pBI121(Clontech)。将这样获得的载体命名为pBI121-RS。为了反义实验,将预先以BamHI和SacI消化的质粒pBI121(Clontech)连接到显示于下面序列表13中的接头上(linker)以得到pBI121(-)。以与所述的用于制备上面的pBI121-RS相同的方式用该pBI121(-)制备pBI121(-)-RS。以pBI221制备类似的载体。以限制性核酸内切酶BamHI和SacI消化实施例7中获得的质粒pBluescriptKS-RS。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先以BamHI和SacI消化的载体pBI221(Clontech)中。将这样获得的载体命名为pBI221-RS。为了反义实验,将预先以BamHI和SacI消化的质粒pBI221(Clontech)连接到显示于下面序列13中的接头中以得到pBI221(-)。以与所述的用于上面pBI221-RS制备相同的方式用该pBI221(-)制备pBI221(-)-RS。将这些表达载体的构建显示于图2和3。(序列表13)BamSac-(+)接头25聚体GATCGAGCTCGTGTCGGATCCAGCTBamSac-(-)接头17聚体GGATCCGACACGAGCTC实施13(以蚕豆棉子糖合酶基因对芥子的转化)用实施例12中制备的载体pBI121-RS和pBI121(-)RS通过农杆菌感染方法转化芥子(Brassicajuncia)。将预先通过氯化钙处理将其变成感受态状态的根癌土壤杆菌(C58C1菌株,利福平抗性)独立地以实施例12中制备的两种质粒pBI121-RS和pBI121(-)-RS转化。利用导入质粒中卡那霉素抗性基因(新霉素磷酸转移酶,NPTII)赋予的卡那霉素抗性特征在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上完成转化子的筛选。将获得的转化子农杆菌(根癌土壤杆菌C58菌株,利福平抗性)于28℃在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上培养一昼夜,并将培养物用于通过下述方法对芥子的转化。将芥子种子无菌播种于1/2MS培养基,2%蔗糖,0.7%琼脂中。一周后,以手术刀切下发牙植物的子叶和叶柄,并转移至MS培养基,3%蔗糖,0.7琼脂,4.5μMBA,0.05μM2.4-D,3.3μMAgNO3,接着预培养1天。将预培养的子叶和叶柄转移主农杆菌培养物的1000-倍稀释液中以导致感染5分钟。将感染的子叶和叶柄再次转移到与用于预培养相同的培养基中,并培养3到4天。将培养的子叶和叶柄转移至MS培养基,3%蔗糖,4.5μMBA,0.05μM2.4-D,3.3μMAgNO3,500mg/l氨噻肟头孢霉素(cefotaxim),并且震摇灭菌1天。将灭菌的子叶和叶柄转移至MS培养基,3%蔗糖,0.7%琼脂,4.5μMBA,0.05μM2.4-D,3.3μMAgNO3,100mg/ml氨噻肟头孢霉素,20mg/l卡那霉素,并培养3到4周。将子叶和叶柄转移到MS培养基,3%蔗糖,0.7%琼脂,4.5μMBA,0.05μM2.4-D,100mg/l氨噻肟头孢霉素。20mg/l卡那霉素并培养。以3到4周的间隔在该培养基上传代培养。当嫩枝再生开始出现时,将这些嫩枝传代培养于MS培养基,3%蔗糖,0.7%琼脂,20mg/l卡那霉素,并培养3到4周。将生根的植物转移到蛭石∶泥炭藓(peatmoss)=1∶1,并于白天/黑夜=12小时∶12小时的循环将条件控制于21°到22℃。随着植株体生长的进行,将植株以培土适当培养。根据上述方法从再生植株的叶中提取基因组DNA,并且插入植物体基因组中的基因用显示于下面序列表14中的引物通过PCR加以确证。(序列表14)35S30聚体TTCCAGTATGGACGATTCAAGGCTTGCTTCNOS25聚体ATGTATAATTGCGGGACTCTAATCARS-F30聚体AAGAGTGTATCTGAATTTTCACGCGCGGTGRS-RV聚体33聚体ACCTTCCCATACACCTTTTGGATGAACCTTCAA实施例14(以蚕虫棉子糖合酶基因对大豆体细胞胚的转化)将大豆“Fayette”体细胞胚的培养细胞(400到500mgFW)以一层安排于6cm琼脂平板中心部分具有20mm直径的圆内。将具有在实施例12中从蚕豆棉子糖合酶基因和35S启动子制备的嵌合体基因的质粒pBI221-RS和pBI221(-)-RS根据公开的日本专利申请No.3-291501/1991导入大豆体细胞胚中。即,将这些质粒与在SoshikiBaiyo,20,323-327(1994)中所述的用于筛选的β-葡萄醛酸酶(GUS)/潮霉素-抗性基因(HPT)共表达载体pSUM-GHNoI混合。以粒子枪(800mg/包被金颗粒200μg/射;抛物体终止-样品距离(projectilestopper-sampledistance),100mm)将这些混合的质粒用于基因导入到大豆体细胞胚中。导入后,将旋转培养物在25℃照明16小时条件下培养于含有25到50μg/ml潮霉素的MS修饰液体培养基中(西格玛),并且筛选转化的体细胞胚。对于具有黄绿色和生长能力的被筛选约3个月的潮霉素抗性大豆体细胞胚,从上面序列表14中显示的引物进行聚合链式反应以检测蚕豆棉子糖合酶基因区域扩增与否。这证实了蚕豆棉子糖合酶基因插入到大豆基因组中。此外,将获得的体细胞胚用于植株再生以得到具有蚕豆棉子糖合酶基因的转化子大豆。培养基组成用于上面实施例中的LB和MS培养基具下面各自的组成。(LB培养基)细菌用-胰蛋白胨10g细菌用-酵母提取物5gNaCl10g/1升H2O(pH7.0)(MS培养基)KNO32022mg/lNH4NO31650mg/lNH4Cl2140mg/lMgSO4·7H2O370mg/lCaCl2·2H2O440mg/lMnSO4·4H2O22.3mg/lZnSO4·7H2O8.6mg/lCuSO4·5H2O0.025mg/lKI0.83mg/lCoCl2·6H2O0.025mg/lH3BO36.2mg/lNaMoO4·2H2O0.25mg/lFeSO4·7H2O27.8mg/lNa2EDTA37.3mg/l烟酸0.5mg/l硫氨素Hcl1mg/l吡哆醇Hcl0.5ml/l肌醇100mg/l甘氨酸2mg/l序列简述1.SEQIDNO1SEQIDNO1序列显示在从蚕豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。2.SEQIDNO2SEQIDNO2的序列显示从蚕豆获得的棉子糖合酶基因的cDNA核苷酸序列。3.SEQIDNO3SEQIDNO3序列显示在从大豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。4.SEQIDNO4SEQIDNO4的序列显示从大豆获得棉子糖合酶基因的cDNA核苷酸序列。5.SEQIDNO5SEQIDNO5的序列显示在从日本菜蓟获得的棉子糖合酶基因中编码的棉子糖合酶蛋白氨基酸序列。6.SEQIDNO6SEQIDNO6的序列显示从日本菜蓟获得棉子糖合酶基因的cDNA核苷酸序列。7.SEQIDNO7SEQIDNO7的序列显示在从玉米中获得棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。8.SEQIDNO8SEQIDNO8的序列显示从玉米获得棉子糖合酶基因的cDNA核苷酸序列。9.序列表1显示于序列表1中的核苷酸序列为用于棉子糖合酶合酶基因cDNA片段扩增的典型引物。所有这些序列根据该基因的非编码区的核苷酸序列。引物1是相应于从蚕豆获得棉子糖合酶基因cDNA片段的5’末端的有义引物。引物2和3是相应于从蚕豆获得棉子糖合酶基因cDNA片段的3’-末端的反义引物。引物4是相应于从大豆获得棉子糖合酶基因cDNA片段5’-末端的有义引物。引物5和6是相应于从大豆获得棉子糖合酶基因cDNA片段3’-末端的反义引物。根据目的,可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些核苷酸序列的5’-末端。10.序列表2显示于序列表2中的核苷酸序列为用于在棉子糖合酶基因cDNA序列中编码棉子糖合酶蛋白氨基酸序列开放阅读框扩增的典型引物。引物1和2为相应于从蚕豆获得棉子糖合酶蛋白N-末端的有义引物。引物3和4为相应于从蚕豆获得棉子糖合酶蛋白C-末端的反义引物。引物5和6为相应于从大豆获得棉子糖合酶蛋白N-末端的有义引物。引物7和8为相应于从大豆获得棉子糖合酶蛋白C-末端的反义引物。根据目的,可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些序列的5’末端。11.序列表311.序列表3显示于序列表3中的氨基酸序列为棉子糖合酶蛋白部分的氨基酸序列。#1相当于SEQIDNO1氨基酸序列中第110个氨基酸延伸至第129个氨基酸的部分氨基酸序列。#2为相当于在SEQIDNO1氨基酸序列中从第234个氨基酸延伸至第247个氨基酸的部分氨基酸序列。#3为相当于SEQIDNO1氨基酸序列中从第265个氨基酸延伸至第279个氨基酸的部分氨基酸序列。#4为相当于于SEQIDNO1氨基酸序列中第296个氨基酸延伸到第312个氨基酸的部分氨基酸序列。#5为相当于SEQIDNO1氨基酸序列中第346个氨基酸延伸到第361个氨基酸的部分氨基酸序列。#6为相当于SEQIDNO1氨基酸序列中第383个氨基酸延伸到第402个氨基酸的部分氨基酸序列。#7为相当于SEQIDNO1氨基酸序列中第411个氨基酸延伸到第433个氨基酸的部分氨基酸序列。#8为相当于SEQIDNO1氨基酸序列中第440个氨基酸延伸到第453个氨基酸的部分氨基酸序列。#9为相当于SEQIDNO1氨基酸序列中第457个氨基酸延伸到第468个氨基酸的部分氨基酸序列。#10为相当于SEQIDNO1氨基酸序列中从第471个氨基酸延伸到第516个氨基酸的部分氨基酸序列。#11为相当于SEQIDNO1氨基酸序列中从第517个氨基酸延伸到第559个氨基酸的部分氨基酸序列。#12为相当SEQIDNO1氨基酸序列中从第574个氨基酸延伸到第582个氨基酸的部分氨基酸序列。#13为相当于SEQIDNO1氨基酸序列中从第586个氨基酸延伸到第609个氨基酸的部分氨基酸序列。#14为相当于SEQIDNO1氨基酸序列中从第615个氨基酸延伸到第724个氨基酸的部分氨基酸序列。个氨基酸的部分氨基酸序列。12.序列表4显示于序列表4中的核苷酸序列为根据序列表3中显示的一些氨基酸序列合成的典型引物。引物号后使用的符号“F”意思是由该符号代表的引物具有有义序列。引物号后使用的符号“RV”意思是由该符号代表的引物具有反义序列。引物相应于SEQIDNO1氨基酸序列中第119个氨基酸延伸到第129个氨基酸的部分氨基酸序列。引物2相应于SEQIDNO1氨基酸序列中第234个氨基酸延伸到第247个氨基酸的部分氨基酸序列。引物3相应于SEQIDNO1氨基酸序列中第265个氨基酸延伸到第279个氨基酸的部分氨基酸序列。引物4相应于SEQIDNO1氨基酸序列中第458个氨基酸延伸到第468个氨基酸的部分氨基酸序列。引物5相应于SEQIDNO1氨基酸序列中第522个氨基酸延伸到第534个氨基酸的部分氨基酸序列。引物6相应于SEQIDNO1氨基酸序列中第716个氨基酸延伸到第724个氨基酸的部分氨基酸序列。13.序列表5显示于序列表5中的核苷酸序列为根据纯化的蚕豆棉子糖合酶蛋白部分氨基酸序列而合成的典型引物。显示于圆括号中的碱基意思为将那些碱基用于合成中。在引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。14.序列表6显示于序列表6中的核苷酸序列为用于通过RACE方法分析蚕豆棉子糖合酶基因cDNA核苷酸序列两个末端区域的典型引物。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。15.序列表7显示于序列表7中的核苷酸序列为用于克隆蚕豆棉子糖合酶基因中的典型引物。RS-N相应于该开放阅读框的N-末端并在5’-末端一侧含有限制性核酸内切酶BamHI和NcoI的识别位点。RS-C为相应于该开放阅读框C-末端的反义引物并且在5’-末端一侧含有限制性核酸内切酶XbaI的识别位点。16.序列表8显示于序列表8中的核苷酸序列为用于克隆大豆棉子糖合酶基因片段中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。17.序列表9显示于序列表9中的核苷酸序列为用于分析大豆棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。用SN-1和SC-3RV通过聚合酶链式反应进行核苷酸序列分析。SC-5和SC-6用于分析3’-末端区域的核苷酸序列,且SN-3RV和SN-4RV用于分析5’-末端区域的核苷酸序列。18.序列表10显示于序列表10中的核苷酸序列为用于分析日本菜蓟棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。19.序列表11显示于序列表11中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。20.序列表12显示于序列表12中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列分析中的典型引物。M-10和M-11用于3’-末端区域核苷酸序列的分析。21.序列表13显示于序列表13中的核苷酸序列为用于构建反义实验载体中的典型衔接子。当混合在一起时这些合成DNA征段采取双链形式因为它们为互补链。该双链DNA片段在两末端具有限制性核酸内切酶BamHI和SacI切割位点的粘性末端,并在双链区域含有限制性核酸内切酶BamHI和SacI的限制性位点。22。序列表14显示于序列表14中的核苷酸序列为用于确证基因导入重组植物体基因组PCR实验中的典型引物。35S为位于35S启动子位点下游区域的引物,并且NOS为位于NOS终止子位点上游区域的引物。RS-F为蚕豆棉子糖合酶基因的有义引物,且RS-RV为蚕豆棉子糖合酶基因的反义引物。序列表(1)一般信息(i)申请人Eijiro,WatanabeKenji,Oeda(ii)发明题目棉子糖合基因及其用途(iii)序列数8(iv)联系地址(A)联系人Birch,Stewart,Kolasch&amp;Birch,LLP(B)街道8110GatehouseRoad,Suite500East(C)城市FallsChurch(D)街道Virginia(E)国家USA(F)邮编22042(V)计算机可读形式(A)媒体类型Floppydisk(B)计算机IBMPC兼容机(C)操作系统PC-DOC/MS-DOS(D)软件PatentInRelease#1.0,Version#1.25(vi)目前申请数据(A)申请号(B)申请日(C)分类C12N9/100,C12N15/52(Vii)在先申请数据(A)申请号JP-338673/1996(B)申请日18-12-1996(Viii)律师/代理人信息(A)姓名(B)登记号(C)参考/摘要号(ix)电信信息(A)电话(703)205-8000(B)电传(703)205-8050(2)IDNO1的信息(i)序列特征(A)长度799个氨基酸(B)类型氨基酸(D)拓扑线型(ii)分子类型肽(vi)原始来源(A)生物broadbean(Viciafaba)(B)菌株NintokuIssun(F)组织类型种子(xi)SEQIDNO1的序列描述MetAlaProProSerIleThrLysThrAlaThrLeuGlnAspValIle151015SerThrIleAspIleGlyAsnGlyAsnSerProLeuPheSerIleThr202530LeuAspGlnSerArgAspPheLeuAlaAsnGlyHisProPheLeuThr354045GlnValProProAsnIleThrThrThrThrThrThrThrAlaSerSer505560PheLeuAsnLeuLysSerAsnLysAspThrIleProAsnAsnAsnAsn65707580ThrMetLeuLeuGlnGlnGlyCysPheValGlyPheAsnSerThrGlu859095ProLysSerHisHisValValProLeuGlyLysLeuLysGlyIleLys100105110PheMetSerIlePheArgPheLysValTrpTrpThrThrHisTrpVal115120125GlyThrAsnGlyGlnGluLeuGlnHisGluThrGlnMetLeuIleLeu130135140AspLysAsnAspSerLeuGlyArgProTyrValLeuLeuLeuProIle145150155160LeuGluAsnThrPheArgThrSerLeuGlnProGlyLeuAsnAspHis165170175IleGlyMetSerValGluSerGlySerThrHisValThrGlySerSer180185190PheLysAlaCysLeuTyrIleHisLeuSerAsnAspProTyrSerIle195200205LeuLysGluAlaValLysValIleGlnThrGlnLeuGlyThrPheLys210215220ThrLeuGluGluLysThrAlaProSerIleIleAspLysPheGlyTrp225230235240CysThrTrpAspAlaPheTyrLeuLysValHisProLysGlyValTrp245250255GluGlyValLysSerLeuThrAspGlyGlycysProProGlyPheVal260265270IleIleAspAspGlyTrpGlnSerIleCysHisAspAspAspAspGlu275280285AspAspSerGlyMetAsnArgThrSerAlaGlyGluGlnMetProCys290295300ArgLeuValLysTyrGluGluAsnSerLysPheArgGluTyrGluAsn305310315ProGluAsnGlyGlyLysLysGlyLeuGlyGlyPheValArgAspLeu320325330335LysGluGluPheGlySerValGluSerValTyrValTrpHisAlaLeu340345350CysGlyTyrTrpGlyGlyValArgProGlyValHisGlyMetProLys355360365AlaArgValValValProLysValSerGlnGlyLeuLysMetThrMet370375380GluAspLeuAlaValAspLysIleValGluAsnGlyValGlyLeuVal385390395400ProProAspPheAlaHisGluMetPheAspGlyLeuHisSerHisLeu405410415GluSerAlaGlyIleAspGlyValLysValAspValIleHisLeuLeu420425430GluLeuLeuSerGluGluTyrGlyGlyArgValGluLeuAlaArgAla435440445TyrTyrLysAlaLeuThrSerSerValLysLysHisPheLysGlyAsn450455460GlyValIleAlaSerMetGluHisCysAsnAspPhePheLeuLeuGly465470475480ThrGluAlaIleSerLeuGlyArgValGlyAspAspPheTrpCysSer485490495AspProSerGlyAspProAsnGlyThrTyrTrpLeuGlnGlyCysHis500505510MetValHisCysAlaTyrAsnSerLeuTrpMetGlyAsnPheIleGln515520525ProAspTrpAspMetPheGlnSerThrHisProCysAlaGluPheHis530535540AlaAlaSerArgAlaIleSerGlyGlyProIleTyrValSerAspCys545550555560ValGlyAsnHisAsnPheLysLeuLeuLysSerLeuValLeuProAsp565570575GlySerIleLeuArgCysGlnHisTyrAlaLeuProThrArgAspCys580585590LeuPheGluAspProLeuHisAsnGlyLysThrMetLeuLysIleTrp595600605AsnLeuAsnLysTyrThrGlyValLeuGlyLeuPheAsnCysGlnGly610615620GlyGlyTrpCysProGluAlaArgArgAsnLysSerValSerGluPhe625630635640SerArgAlaValThrCysTyrAlaSerProGluAspIleGluTrpCys645650655AsnGlyLysThrProMetSerThrLysGlyValAspPhePheAlaVal660665670TyrPhePheLysGluLysLysLeuArgLeuMetLysCysSerAspArg675680685LeuLysValSerLeuGluProPheSerPheGluLeuMetThrValSer690695700ProValLysValPheSerLysArgPheIleGlnPheAlaProIleGly705710715720LeuValAsnMetLeuAsnSerGlyGlyAlaIleGlnSerLeuGluPhe725730735AspAspAsnAlaSerLeuValLysIleGlyValArgGlyCysGlyGlu740745750MetSerValPheAlaSerGluLysProValCysCysLysIleAspGly755760765ValLysValLysPheLeuTyrGluAspLysMetAlaArgValGlnIle770775780LeuTrpProSerSerSerThrLeuSerLeuValGlnPheLeuPheStop785790795800(2)SEQIDNO2的信息(i)序列特征(A)长度2746个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(ii)分子类型cDNA到mRNA(ix)特征(A)名称/关键词肽(B)位置101到2500(C)鉴定方法实验(xi)SEQIDNO2的序列描述AATTTTCAAGCATAGCCAAGTTAACCACCTTAGAAACATTCCTACAAGCTACTTATCCCT60GTCAATAAGCTACTAAGCTACCAGAGTCTCATCAATCACCATGGCACCACCAAGC115MetAlaProProSer5ATAACCAAAACTGCAACCCTCCAAGACGTAATAAGCACCATCGATATT163IleThrLysThrAlaThrLeuGlnAspValIleSerThrIleAspIle101520GGTAATGGTAACTCACCCTTATTCTCCATAACCTTAGACCAATCACGT211GlyAsnGlyAsnSerProLeuPheSerIleThrLeuAspGlnSerArg253035GACTTCCTTGCAAATGGCCACCCTTTCCTCACCCAAGTCCCACCTAAC259AspPheLeuAlaAsnGlyHisProPheLeuThrGlnValProProAsn404550ATAACAACAACAACAACAACCACTGCTTCCTCTTTTCTCAATCTCAAA307IleThrThrThrThrThrThrThrAlaSerSerPheLeuAsnLeuLys556065TCCAACAAAGATACCATTCCCAACAACAACAACACCATGTTGTTGCAA355SerAsnLysAspThrIleProAsnAsnAsnAsnThrMetLeuLeuGln70758085CAAGGTTGTTTCGTTGGTTTCAACTCCACCGAACCCAAAAGCCACCAC403GlnGlyCysPheValGlyPheAsnSerThrGluProLysSerHisHis9095100GTAGTTCCACTCGGCAAACTAAAAGGAATCAAATTCATGAGCATATTC451ValValProLeuGlyLysLeuLysGlyIleLysPheMetSerIlePhe105110115CGGTTCAAAGTTTGGTGGACAACTCACTGGGTCGGAACAAATGGACAG499ArgPheLysValTrpTrpThrThrHisTrpValGlyThrAsnGlyGln120125130GAACTACAACACGAAACACAAATGTTAATCCTGGACAAAAACGACTCC547GluLeuGlnHisGluThrGlnMetLeuIleLeuAspLysAsnAspSer135140145CTCGGACGACCCTATGTCTTACTCCTCCCAATCCTAGAAAACACCTTC595LeuGlyArgProTyrValLeuLeuLeuProIleLeuGluAsnThrPhe150155160165CGAACCTCACTCCAACCCGGTCTCAACGATCACATAGGCATGTCCGTC643ArgThrSerLeuGlnProGlyLeuAsnAspHisIleGlyMetSerVal170175180GAAAGCGGTTCAACACATGTCACCGGGTCAAGCTTCAAAGCATGTCTT691GluSerGlySerThrHisValThrGlySerSerPheLysAlaCysLeu185190195TACATCCATCTCAGTAACGACCCATACAGTATACTAAAAGAAGCAGTT739TyrIleHisLeuSerAsnAspProTyrSerIleLeuLysGluAlaVal200205210AAAGTAATCCAAACTCAGTTAGGAACATTCAAGACTCTTGAAGAAAAA787LysValIleGlnThrGlnLeuGlyThrPheLysThrLeuGluGluLys215220225ACAGCACCTAGTATTATAGACAAATTCGGTTGGTGCACGTGGGATGCT835ThrAlaProSerIleIleAspLysPheGlyTrpCysThrTrpAspAla230235240245TTTTACTTGAAGGTTCATCCAAAAGGTGTATGGGAAGGTGTAAAGTCT883PheTyrLeuLysValHisProLysGlyValTrpGluGlyValLysSer250255260CTCACAGATGGTGGTTGTCCTCCCGGTTTCGTCATAATCGACGACGGT931LeuThrAspGlyGlyCysProProGlyPheValIleIleAspAspGly265270275TGGCAATCCATTTGTCATGACGATGACGATGAAGATGATTCAGGAATG979TrpGlnSerIleCysHisAspAspAspAspGluAspAspSerGlyMet280285290AACCGAACCTCAGCCGGGGAACAAATGCCATGCAGACTTGTAAAATAC1027AsnArgThrSerAlaGlyGluGlnMetProCysArgLeuValLysTyr295300305GAAGAGAATTCTAAGTTTAGAGAATATGAGAATCCTGAAAATGGAGGG1075GluGluAsnSerLysPheArgGluTyrGluAsnProGluAsnGlyGly310315320325AAGAAAGGTTTGGGTGGTTTTGTGAGGGATTTGAAGGAAGAGTTTGGG1123LysLysGlyLeuGlyGlyPheValArgAspLeuLysGluGluPheGly330335340AGTGTGGAGAGTGTTTATGTTTGGCATGCGCTTTGTGGGTATTGGGGC1171SerValGluSerValTyrValTrpHisAlaLeuCysGlyTyrTrpGly345350355GGGGTTAGGCCTGGAGTGCATGGGATGCCGAAAGCTAGGGTTGTTGTT1219GlyValArgProGlyValHisGlyMetProLysAlaArgValValVal360365370CCGAAGGTGTCTCAGGGGTTGAAGATGACGATGGAGGATTTGGCGGTG1267ProLysValSerGlnGlyLeuLysMetThrMetGluAspLeuAlaVal375380385GATAAGATTGTTGAGAACGGTGTGGGGCTAGTGCCGCCAGATTTTGCA1315AspLysIleValGluAsnGlyValGlyLeuValProProAspPheAla390395400405CATGAGATGTTTGATGGGCTTCACTCTCATTTGGAGTCGGCGGGAATT1363HisGluMetPheAspGlyLeuHisSerHisLeuGluSerAlaGlyIle410415420GACGGTGTTAAAGTTGATGTTATCCATCTGCTTGAGTTACTATCAGAG1411AspGlyValLysValAspValIleHisLeuLeuGluLeuLeuSerGlu425430435GAATATGGTGGACGAGTTGAGCTAGCAAGAGCTTATTACAAAGCACTA1459GluTyrGlyGlyArgValGluLeuAlaArgAlaTyrTyrLysAlaLeu440445450ACCTCATCAGTGAAGAAACATTTCAAAGGCAATGGTGTAATTGCTAGC1507ThrSerSerValLysLysHisPheLysGlyAsnGlyValIleAlaSer455460465ATGGAGCATTGCAACGACTTCTTTCTCCTCGGCACCGAAGCCATATCC1555MetGluHisCysAsnAspPhePheLeuLeuGlyThrGluAlaIleSer470475480485CTCGGCCGCGTCGGAGATGATTTTTGGTGCTCTGATCCATCTGGTGAT1603LeuGlyArgValGlyAspAspPheTrpCysSerAspProSerGlyAsp490495500CCAAATGGTACATATTGGCTCCAAGGTTGTCACATGGTACATTGTGCC1651ProAsnGlyThrTyrTrpLeuGlnGlyCysHisMetValHisCysAla505510515TACAACAGTTTATGGATGGGAAATTTCATTCAGCCAGATTGGGACATG1699TyrAsnSerLeuTrpMetGlyAsnPheIleGlnProAspTrpAspMet520525530TTTCAGTCCACTCATCCTTGTGCTGAATTTCATGCCGCCTCACGAGCC1747PheGlnSerThrHisProCysAlaGluPheHisAlaAlaSerArgAla535540545ATATCCGGCGGACCAATTTATGTTAGTGATTGTGTTGGTAATCACAAT1795IleSerGlyGlyProIleTyrValSerAspCysValGlyAsnHisAsn550555560565TTCAAGTTGCTCAAATCTCTTGTTTTGCCCGATGGTTCTATCTTGCGT1843PheLysLeuLeuLysSerLeuValLeuProAspGlySerIleLeuArg570575580TGTCAACATTACGCACTCCCTACAAGAGATTGCTTGTTTGAAGACCCT1891CysGlnHisTyrAlaLeuProThrArgAspCysLeuPheGluAspPro585590595TTGCATAATGGCAAAACAATGCTGAAAATTTGGAATCTCAACAAATAT1939LeuHisAsnGlyLysThrMetLeuLysIleTrpAsnLeuAsnLysTyr600605610ACAGGTGTTTTGGGTCTTTTCAACTGCCAAGGTGGTGGGTGGTGTCCT1987ThrGlyValLeuGlyLeuPheAsnCysGlnGlyGlyGlyTrpCysPro615620625GAGGCACGGCGAAACAAGAGTGTATCTGAATTTTCACGCGCGGTGACA2035GluAlaArgArgAsnLysSerValSerGluPheSerArgAlaValThr630635640645TGTTATGCAAGTCCCGAAGACATTGAATGGTGCAATGGGAAAACTCCA2083CysTyrAlaSerProGluAspIleGluTrpCysAsnGlyLysThrPro650655660ATGAGCACCAAAGGTGTGGATTTTTTTGCTGTGTATTTTTTCAAGGAG2131MetSerThrLysGlyValAspPhePheAlaValTyrPhePheLysGlu665670675AAGAAATTGAGGCTCATGAAGTGTTCTGATAGATTGAAAGTTTCGCTT2179LysLysLeuArgLeuMetLysCysSerAspArgLeuLysValSerLeu680685690GAGCCATTTAGTTTTGAGCTAATGACAGTGTCTCCAGTGAAAGTGTTT2227GluProPheSerPheGluLeuMetThrValSerProValLysValPhe695700705TCGAAAAGGTTTATACAGTTTGCACCGATTGGGTTAGTGAACATGCTG2275SerLysArgPheIleGlnPheAlaProIleGlyLeuValAsnMetLeu710715720725AACTCTGGTGGTGCGATTCAGTCTCTGGAGTTTGATGATAATGCAAGT2323AsnSerGlyGlyAlaIleGlnserLeuGluPheAspAspAsnAlaSer730735740TTGGTCAAGATTGGGGTGAGAGGTTGCGGGGAGATGAGCGTGTTTGCG2371LeuValLysIleGlyValArgGlyCysGlyGluMetSerValPheAla745750755TCTGAGAAACCGGTTTGCTGCAAAATTGATGGGGTTAAGGTGAAATTT2419SerGluLysProValCysCysLysIleAspGlyValLysValLysPhe760765770CTTTATGAGGACAAAATGGCAAGAGTTCAAATTCTGTGGCCTAGTTCT2467LeuTyrGluAspLysMetAlaArgValGlnIleLeuTrpProSerSer775780785TCAACATTGTCTTTGGTCCAGTTTTTATTTTGATCCCTAGGAATCCTATGCAC2520SerThrLeuSerLeuValGlnPheLeuPheStop790795800GTGTCTCTGTTTACAAGTACTTTATATAAGTATAATATGTATCTATTTCCATTTTTAACT2580GTCTTTATGCAATTAGGTGGTCAATTAGTTATTTGTTTGTGAAGTAACTAACTTGCTTGT2640GTTGTAAGCTTATAATATATGGTCAAGTTCCTCACTTGTATATACCTGTTGTATGTATAA2700ATTTTACTATATATGACTAACATCATTATCTTGTGAGCAAAAAAAA2746(2)SEQIDNO3的信息(i)序列特征(A)长度781个碱基酸(B)类型氨基酸(D)拓扑线型(ii)分子类型肽(vi)原始来源(A)生物大豆(glycinemax)(B)品种Williams82(F)组织类型种子和叶(xi)SEQIDNO3的序列描述MetAlaProSerIleSerLysThrValGluLeuAsnSerPheGlyLeu51015ValAsnGlyAsnLeuProLeuSerIleThrLeuGluGlySerAsnPhe202530LeuAlaAsnGlyHisProPheLeuThrGluValProGluAsnIleIle354045ValThrProSerProIleAspAlaLysSerSerLysAsnAsnGluAsp505560AspAspValValGlyCysPheValGlyPheHisAlaAspGluProArg65707580SerArgHisValAlaSerLeuGlyLysLeuArgGlyIleLysPheMet859095SerIlePheArgPheLysValTrpTrpThrThrHisTrpValGlySer100105110AsnGlyHisGluLeuGluHisGluThrGlnMetMetLeuLeuAspLys115120125AsnAspGlnLeuGlyArgProPhevalLeuIleLeuProIleLeuGln130135140AlaSerPheArgAlaSerLeuGlnProGlyLeuAspAspTyrValAsp145150155160ValCysMetGluSerGlySerThrArgValCysGlySerSerPheGly165170175SerCysLeuTyrValHisValGlyHisAspProTyrGlnLeuLeuArg180185190GluAlaThrLysValValArgMetHisLeuGlyThrPheLysLeuLeu195200205GluGluLysThrAlaProValIleIleAspLysPheGlyTrpCysThr210215220TrpAspAlaPheTyrLeuLysValHisProSerGlyValTrpGluGly225230235240ValLysGlyLeuValGluGlyGlyCysProProGlyMetValLeuIle245250255AspAspGlyTrpGlnAlaIleCysHisAspGluAspProIleThrAsp260265270GlnGluGlyMetLysArgThrSerAlaGlyGluGlnMetProCysArg275280285LeuValLysLeuGluGluAsnTyrLysPheArgGlnTyrCysSerGly290295300LysAspSerGluLysGlyMetGlyAlaPheValArgAspLeuLysGlu305310315320GlnPheArgSerValGluGlnValTyrValTrpHisAlaLeuCysGly325330335TyrTrpGlyGlyValArgProLysValProGlyMetProGlnAlaLys340345350ValValThrProLysLeuSerAsnGlyLeuLysLeuThrMetLysAsp355360365LeuAlaValAspLysIleValSerAsnGlyValGlyLeuValProPro370375380HisLeuAlaHisLeuLeuTyrGluGlyLeuHisSerArgLeuGluSer385390395400AlaGlyIleAspGlyValLysValAspValIleHisLeuLeuGluMet405410415LeuSerGluGluTyrGlyGlyArgValGluLeuAlaLysAlaTyrTyr420425430LysAlaLeuThrAlaSerValLysLysHisPheLysGlyAsnGlyVal435440445IleAlaSerMetGluHisCysAsnAspPhePheLeuLeuGlyThrGlu450455460AlaIleAlaLeuGlyArgValGlyAspAspPheTrpCysThrAspPro465470475480SerGlyAspProAsnGlyThrTyrTrpLeuGlnGlyCysHisMetVal485490495HisCysAlaTyrAsnSerLeuTrpMetGlyAsnPheIleGlnProAsp500505510TrpAspMetPheGlnSerThrHisProCysAlaGluPheHisAlaAla515520525SerArgAlaIleSerGlyGlyProValTyrValSerAspCysValGly530535540LysHisAsnPheLysLeuLeuLysSerLeuAlaLeuProAspGlyThr545550555560IleLeuArgCysGlnHisTyrAlaLeuProThrArgAspCysLeuPhe565570575GluAspProLeuHisAspGlyLysThrMetLeuLysIleTrpAsnLeu580585590AsnLysTyrThrGlyValLeuGlyLeuPheAsnCysGlnGlyGlyGly595600605TrpCysProValThrArgArgAsnLysSerAlaSerGluPheSerGln610615620ThrValThrCysLeuAlaSerProGlnAspIleGluTrpSerAsnGly625630635640LysSerProIleCysIleLysGlyMetAsnValPheAlaValTyrLeu645650655PheLysAspHisLysLeuLysLeuMetLysAlaSerGluLysLeuGlu660665670ValSerLeuGluProPheThrPheGluLeuLeuThrValSerProVal675680685IleValLeuSerLysLysLeuIleGlnPheAlaProIleGlyLeuVal690695700AsnMetLeuAsnThrGlyGlyAlaIleGlnSerMetGluPheAspAsn705710715720HisIleAspValValLysIleGlyValArgGlyCysGlyGluMetLys725730735ValPheAlaSerGluLysProValSerCysLysLeuAspGlyValVal740745750ValLysPheAspTyrGluAspLysMetLeuArgValGlnValProTrp755760765ProSerAlaSerLysLeuSerMetValGluPheLeuPheStop770775780(2)SEQIDNO4的信息(i)序列特征(A)长度2598个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(ii)分子类型cDNA到mRNA(ix)特征(A)名称/关键词肽(B)位置62到2407(C)鉴定方法实验(xi)SEQIDNO4的序列描述CCAAACCATAGCAAACCTAAGCACCAAACCTCTTTCTTTCAAGATCCTTGAATTCAGTCC60CATGGCTCCAAGCATAAGCAAAACTGTGGAACTAAATTCATTTGGT106MetAlaProSerIleSerLysThrValGluLeuAsnSerPheGly51015CTTGTCAACGGTAATTTGCCTTTGTCCATAACCCTAGAAGGATCAAAT154LeuValAsnGlyAsnLeuProLeuSerIleThrLeuGluGlySerAsn202530TTCCTCGCCAACGGCCACCCTTTTCTCACGGAAGTTCCCGAAAACATA202PheLeuAlaAsnGlyHisProPheLeuThrGluValProGluAsnIle354045ATAGTCACCCCTTCACCCATCGACGCCAAGAGTAGTAAGAACAACGAG250IleValThrProSerProIleAspAlaLysSerSerLysAsnAsnGlu505560GACGACGACGTCGTAGGTTGCTTCGTGGGCTTCCACGCGGACGAGCCC298AspAspAspValValGlyCysPheValGlyPheHisAlaAspGluPro657075AGAAGCCGACACGTGGCTTCCCTGGGGAAGCTCAGAGGAATAAAATTC346ArgSerArgHisValAlaSerLeuGlyLysLeuArgGlyIleLysPhe80859095ATGAGCATATTCCGGTTTAAGGTGTGGTGGACCACTCACTGGGTCGGT394MetSerIlePheArgPheLysValTrpTrpThrThrHisTrpValGly100105110AGCAACGGACACGAACTGGAGCACGAGACACAGATGATGCTTCTCGAC442SerAsnGlyHisGluLeuGluHisGluThrGlnMetMetLeuLeuAsp115120125AAAAACGACCAGCTCGGACGCCCCTTTGTGTTGATTCTCCCGATCCTC490LysAsnAspGlnLeuGlyArgProPheValLeuIleLeuProIleLeu130135140CAAGCCTCGTTCCGAGCCTCCCTGCAACCCGGTTTGGATGATTACGTG538GlnAlaSerPheArgAlaSerLeuGlnProGlyLeuAspAspTyrVal145150155GACGTTTGCATGGAGAGCGGGTCGACACGTGTCTGTGGCTCCAGCTTC586AspValCysMetGluSerGlySerThrArgValCysGlySerSerPhe160165170175GGGAGCTGCTTATACGTCCACGTTGGCCATGACCCGTATCAGTTGCTT634GlySerCysLeuTyrValHisValGlyHisAspProTyrGlnLeuLeu180185190AGAGAAGCAACTAAAGTCGTTAGGATGCATTTGGGGACGTTCAAGCTT682ArgGluAlaThrLysValValArgMetHisLeuGlyThrPheLysLeu195200205CTCGAGGAGAAAACCGCGCCAGTGATCATAGACAAGTTTGGTTGGTGT730LeuGluGluLysThrAlaProValIleIleAspLysPheGlyTrpCys210215220ACATGGGACGCGTTTTACTTGAAGGTGCATCCCTCAGGTGTGTGGGAA778ThrTrpAspAlaPheTyrLeuLysValHisProSerGlyValTrpGlu225230235GGGGTGAAAGGGTTGGTGGAGGGAGGGTGCCCTCCAGGGATGGTCCTA826GlyValLysGlyLeuValGluGlyGlyCysProProGlyMetValLeu240245250255ATCGACGACGGGTGGCAAGCCATTTGTCACGACGAGGACCCCATAACG874IleAspAspGlyTrpGlnAlaIleCysHisAspGluAspProIleThr260265270GACCAAGAGGGTATGAAGCGAACCTCCGCAGGGGAGCAAATGCCATGC922AspGlnGluGlyMetLysArgThrSerAlaGlyGluGlnMetProCys275280285AGGTTGGTGAAGTTGGAGGAAAATTACAAGTTCAGACAGTATTGTAGT970ArgLeuValLysLeuGluGluAsnTyrLysPheArgGlnTyrCysSer290295300GGAAAGGATTCTGAGAAGGGTATGGGTGCCTTTGTTAGGGACTTGAAG1018GlyLysAspSerGluLysGlyMetGlyAlaPheValArgAspLeuLys305310315GAACAGTTTAGGAGCGTGGAGCAGGTGTATGTGTGGCACGCGCTTTGT1066GluGlnPheArgSerValGluGlnValTyrValTrpHisAlaLeuCys320325330335GGGTATTGGGGTGGGGTCAGACCCAAGGTTCCGGGCATGCCCCAGGCT1114GlyTyrTrpGlyGlyValArgProLysValProGlyMetProGlnAla340345350AAGGTTGTCACTCCGAAGCTGTCCAATGGACTAAAATTGACAATGAAG1162LysValValThrProLysLeuSerAsnGlyLeuLysLeuThrMetLys355360365GATTTAGCGGTGGATAAGATCGTCAGTAACGGAGTTGGACTGGTGCCA1210AspLeuAlaValAspLysIleValSerAsnGlyValGlyLeuValPro370375380CCACACCTGGCTCACCTTTTGTACGAGGGGCTCCACTCCCGTTTGGAA1258ProHisLeuAlaHisLeuLeuTyrGluGlyLeuHisSerArgLeuGlu385390395TCTGCGGGTATTGACGGTGTTAAGGTTGACGTTATACACTTGCTCGAG1306SerAlaGlyIleAspGlyValLysValAspValIleHisLeuLeuGlu400405410415ATGCTATCCGAGGAATACGGTGGCCGTGTTGAGCTAGCCAAAGCTTAT1354MetLeuSerGluGluTyrGlyGlyArgValGluLeuAlaLysAlaTyr420425430TACAAAGCGCTCACTGCTTCGGTGAAGAAGCATTTCAAAGGCAATGGG1402TyrLysAlaLeuThrAlaSerValLysLysHisPheLysGlyAsnGly435440445GTCATTGCGAGCATGGAGCATTGTAATGACTTCTTTCTCCTTGGTACC1450ValIleAlaSerMetGluHisCysAsnAspPhePheLeuLeuGlyThr450455460GAAGCCATAGCCCTTGGGCGCGTAGGAGATGATTTTTGGTGCACTGAT1498GluAlaIleAlaLeuGlyArgValGlyAspAspPheTrpCysThrAsp465470475CCCTCTGGAGATCCAAATGGCACGTATTGGCTCCAAGGGTGTCACATG1546ProSerGlyAspProAsnGlyThrTyrTrpLeuGlnGlyCysHisMet480485490495GTGCACTGTGCCTACAACAGCTTGTGGATGGGGAATTTTATTCAGCCG1594ValHisCysAlaTyrAsnSerLeuTrpMetGlyAsnPheIleGlnPro500505510GATTGGGACATGTTCCAGTCCACTCACCCTTGTGCCGAATTCCATGC1642AspTrpAspMetPheGlnSerThrHisProCysAlaGluPheHisAla515520525GCCTCTAGGGCCATCTCTGGTGGACCAGTTTACGTTAGTGATTGTGTT1690AlaSerArgAlaIleSerGlyGlyProValTyrValSerAspCysVal530535540GGAAAGCACAACTTCAAGTTGCTCAAGAGCCTCGCTTTGCCTGATGGG1738GlyLysHisAsnPheLysLeuLeuLysSerLeuAlaLeuProAspGly545550555ACGATTTTGCGTTGTCAACACTATGCACTCCCCACACGAGACTGTTTG1786ThrIleLeuArgCysGlnHisTyrAlaLeuProThrArgAspCysLeu560565570575TTTGAAGACCCCTTGCATGATGGGAAGACAATGCTCAAAATTTGGAAT1834PheGluAspProLeuHisAspGlyLysThrMetLeuLysIleTrpAsn580585590CTCAACAAATATACAGGTGTTTTGGGTCTATTTAATTGCCAAGGAGGT1882LeuAsnLysTyrThrGlyValLeuGlyLeuPheAsnCysGlnGlyGly595600605GGGTGGTGTCCCGTAACTAGGAGAAACAAGAGTGCCTCTGAATTTTCA1930GlyTrpCysProValThrArgArgAsnLysSerAlaSerGluPheSer610615620CAAACTGTGACATGCTTAGCGAGTCCTCAAGACATTGAATGGAGCAAT1978GlnThrValThrCysLeuAlaSerProGlnAspIleGluTrpSerAsn625630635GGGAAAAGCCCAATATGCATAAAAGGGATGAATGTGTTTGCTGTATAT2026GlyLysSerProIleCysIleLysGlyMetAsnValPheAlaValTyr640645650655TTGTTCAAGGACCACAAACTAAAGCTCATGAAGGCATCAGAGAAATTG2074LeuPheLysAspHisLysLeuLysLeuMetLysAlaSerGluLysLeu660665670GAAGTTTCACTTGAGCCATTTACTTTTGAGCTATTGACAGTGTCTCCA2122GluValSerLeuGluProPheThrPheGluLeuLeuThrValSerPro675680685GTGATTGTGCTGTCAAAAAAGTTAATTCAATTTGCTCCAATTGGATTA2170ValIleValLeuSerLysLysLeuIleGlnPheAlaProIleGlyLeu690695700GTGAACATGCTTAACACTGGTGGTGCCATTCAGTCCATGGAGTTTGAC2218ValAsnMetLeuAsnThrGlyGlyAlaIleGlnSerMetGluPheAsp705710715AACCACATAGATGTGGTCAAAATTGGGGTTAGGGGTTGTGGGGAGATG2266AsnHisIleAspValValLysIleGlyValArgGlyCysGlyGluMet720725730735AAGGTGTTTGCATCAGAGAAACCAGTTAGTTGCAAACTAGATGGGGTA2314LysValPheAlaSerGluLysProValSerCysLysLeuAspGlyVal740745750GTTGTAAAATTTGATTATGAGGATAAAATGCTGAGAGTGCAAGTTCCC2362ValValLysPheAspTyrGluAspLysMetLeuArgValGlnValPro755760765TGGCCTAGTGCTTCAAAATTGTCAATGGTTGAGTTTTTATTTTGATCCCT2412TrpProSerAlaSerLysLeuSerMetValGluPheLeuPheStop770775780GAAGGTGAATTTGGGATACTATGATGTTTGACTCTCTTTTTAAGTAATAAGAGTCATATT2472TTTCTGTTGTAAAAAAAAAAAAAAAA2498(2)SEQIDNO5的信息(i)序列特征(A)长度587个氨基酸(B)类型氨基酸(D)拓扑线型(ii)分子类型肽(vi)原始来源(A)生物Japaneseariichoke(Stachyssieboldii)(F)组织类型叶(xi)SEQIDNO5的序列描述ThrAsnGlySerAspLeuGluArgGluThrGlnIleValValLeuAsp151015LysSerAspAspArgProTyrIleValLeuLeuProLeuIleGluGly202530GlnPheArgAlaSerLeuGlnProGlyValAspAspPheIleAspIle354045CysValGluSerGlySerThrLysValAsnGluSerSerPheArgAla505560SerLeuTyrMetHisAlaGlyAspAspProPheThrLeuValLysAsp65707580AlaValLysValAlaArgHisHisLeuGlyThrPheArgLeuLeuGlu859095GluLysThrProProGlyIleValAspLysPheGlyTrpCysThrTrp100105110AspAlaPheTyrLeuAsnValGlnProHisGlyValMetGluGlyVal115120125GlnGlyLeuValAspGlyGlyCysProProGlyLeuValLeuIleAsp130135140AspGlyTrpGlnSerIleCysHisAspAsnAspAlaLeuThrThrGlu145150155160GlyMetGlyArgThrSerAlaGlyGluGlnMetProCysArgLeuIle165170175LysPheGluGluAsnTyrLysPheArgGluTyrGluSerProAsnLys180185190ThrGlyProGlyProAsnThrGlyMetGlyAlaPheIleArgAspMet195200205LysAspAsnPheLysSerValAspTyrValTyrValTrpHisAlaLeu210215220CysGlyTyrTrpGlyGlyLeuArgProAsnValProGlyLeuProGlu225230235240AlaLysLeuIleGluProLysLeuThrProGlyLeuLysThrThrMet245250255GluAspLeuAlaValAspLysIleValAsnAsnGlyValGlyLeuVal260265270ProProGluPheValGluGlnMetTyrGluGlyLeuHisSerHisLeu275280285GluSerValGlyIleAspGlyValLysValAspValIleHisLeuLeu290295300GluMetLeuCysGluAspTyrGlyGlyArgValAspLeuAlaLysAla305310315320TyrTyrLysAlaLeuSerSerSerValAsnAsnHisPheAsnGlyAsn325330335GlyValIleAlaGlyLeuGluHisCysAsnAspPheMetPheLeuGly340345350ThrGluAlaIleThrLeuGlyArgValGlyAspAspPheTrpCysThr355360365AspProSerGlyAspProAsnGlyThrPheTrpLeuGlnGlyCysHis370375380MetValHisCysAlaTyrAsnSerIleTrpMetGlyAsnPheIleHis385390395400ProAspTrpAspMetPheGlnSerThrHisProCysAlaGluPheHis405410415AlaAlaSerArgAlaIleSerGlyGlyProIleTyrValSerAspSer420425430ValGlyLysHisAsnPheGluLeuLeuArgSerLeuValLeuProAsp435440445GlySerIleLeuArgCysAspTyrTyrAlaLeuProThrArgAspCys450455460LeuPheGluAspProLeuHisAsnGlyLysThrMetLeuLysIleTrp465470475480AsnTyrAsnLysPheThrGlyValValGlyThrPheAsnCysGlnGly485490495GlyGlyTrpSerArgGluValArgArgAsnGlnCysAlaAlaGluTyr500505510SerHisAlaValSerSerSerAlaGlyProSerAspIleGluTrpLys515520525GlnGlyThrSerProIleAspValAspGlyValLysThrPheAlaLeu530535540TyrLeuPheHisGluLysLysLeuValLeuSerLysProSerAspLys545550555560IleAspIleThrLeuGluProPheAspPheGluLeuIleThrValSer565570575ProValLysThrLeuAlaAsnCysThrValGln580585(2)SEQIDNO6的信息(i)序列特征(A)长度1762个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(ii)分子类型cDNA到mRNA(ix)特征(A)名称/关键词肽(B)位置2到1762(C)鉴定方法实验(xi)SEQIDNO6的序列描述GACAAACGGGTCGGATCTTGAGCGGGAAACTCAAATAGTCGTGCTC46ThrAsnGlySerAspLeuGluArgGluThrGlnIleValValLeu151015GACAAGTCCGACGACAGGCCCTACATCGTGCTGCTTCCGCTCATCGAG94AspLysSerAspAspArgProTyrIleValLeuLeuProLeuIleGlu202530GGGCAGTTTCGGGCTTCCCTTCAGCCCGGTGTGGATGATTTTATCGAT142GlyGlnPheArgAlaSerLeuGlnProGlyValAspAspPheIleAsp354045ATTTGTGTCGAAAGCGGGTCAACCAAGGTCAACGAGTCCTCGTTCCGT190IleCysValGluSerGlySerThrLysValAsnGluSerSerPheArg505560GCTTCGCTCTACATGCACGCCGGTGATGACCCTTTTACCCTGGTGAAG238AlaSerLeuTyrMetHisAlaGlyAspAspProPheThrLeuValLys657075GACGCCGTGAAGGTGGCGCGCCACCACCTCGGGACGTTCAGGCTGCTG286AspAlaValLysValAlaArgHisHisLeuGlyThrPheArgLeuLeu80859095GAGGAGAAAACTCCGCCGGGGATCGTCGACAAATTCGGGTGGTGCACG334GluGluLysThrProProGlyIleValAspLysPheGlyTrpCysThr100105110TGGGATGCGTTCTACCTCAACGTCCAGCCCCACGGCGTTATGGAGGGC382TrpAspAlaPheTyrLeuAsnValGlnProHisGlyValMetGluGly115120125GTGCAGGGGCTGGTTGACGGCGGATGTCCGCCGGGGCTGGTGTTGATC430ValGlnGlyLeuValAspGlyGlyCysProProGlyLeuValLeuIle130135140GACGACGGGTGGCAGTCCATTTGTCACGACAACGACGCGCTCACCACC478AspAspGlyTrpGlnSerIleCysHisAspAsnAspAlaLeuThrThr145150155GAGGGGATGGGGAGAACCTCCGCCGGAGAGCAAATGCCCTGCAGGTTG526GluGlyMetGlyArgThrSerAlaGlyGluGlnMetProCysArgLeu160165170175ATCAAGTTTGAGGAGAATTACAAGTTCAGGGAGTACGAGAGCCCGAAT574IleLysPheGluGluAsnTyrLysPheArgGluTyrGluSerProAsn180185190AAAACTGGGCCGGGCCCGAATACGGGGATGGGGGCCTTTATTCGTGAC622LysThrGlyProGlyProAsnThrGlyMetGlyAlaPheIleArgAsp195200205ATGAAGGACAATTTCAAGAGTGTGGACTACGTGTACGTGTGGCATGCG670MetLysAspAsnPheLysSerValAspTyrValTyrValTrpHisAla210215220TTGTGTGGTTATTGGGGCGGGCTCAGGCCCAATGTTCCGGGCCTGCCC718LeuCysGlyTyrTrpGlyGlyLeuArgProAsnValProGlyLeuPro225230235GAGGCTAAGCTCATTGAGCCCAAACTGACTCCTGGGCTTAAGACCACC766GluAlaLysLeuIleGluProLysLeuThrProGlyLeuLysThrThr240245250255ATGGAAGATTTGGCTGTTGATAAGATTGTCAACAATGGCGTGGGTCTG814MetGluAspLeuAlaValAspLysIleValAsnAsnGlyValGlyLeu260265270GTCCCACCGGAGTTTGTTGAACAAATGTATGAAGGATTACATTCACAT862ValProProGluPheValGluGlnMetTyrGluGlyLeuHisSerHis275280285CTCGAATCTGTGGGGATTGATGGAGTCAAAGTTGACGTCATCCATTTG910LeuGluSerValGlyIleAspGlyValLysValAspValIleHisLeu290295300TTGGAAATGTTGTGTGAAGACTATGGTGGGAGAGTGGACTTAGCCAAG958LeuGluMetLeuCysGluAspTyrGlyGlyArgValAspLeuAlaLys305310315GCTTATTACAAGGCCTTATCAAGCTCAGTTAACAACCACTTCAACGGC1006AlaTyrTyrLysAlaLeuSerSerSerValAsnAsnHisPheAsnGly320325330335AACGGCGTCATCGCTGGCCTGGAGCACTGCAATGACTTCATGTTTCTC1054AsnGlyValIleAlaGlyLeuGluHisCysAsnAspPheMetPheLeu340345350GGAACCGAGGCCATTACCTTGGGTCGTGTCGGGGATGATTTTTGGTGC1102GlyThrGluAlaIleThrLeuGlyArgValGlyAspAspPheTrpCys355360365ACTGATCCATCTGGAGATCCCAATGGCACGTTCTGGTTGCAAGGGTGT1150ThrAspProSerGlyAspProAsnGlyThrPheTrpLeuGlnGlyCys370375380CACATGGTGCACTGCGCCTACAACAGCATATGGATGGGTAATTTCATC1198HisMetValHisCysAlaTyrAsnSerIleTrpMetGlyAsnPheIle385390395CACCCTGATTGGGACATGTTTCAATCGACTCACCCTTGCGCTGAATTC1246HisProAspTrpAspMetPheGlnSerThrHisProCysAlaGluPhe400405410415CACGCTGCCTCACGAGCCATCTCCGGCGGGCCCATTTACGTCAGTGAC1294HisAlaAlaSerArgAlaIleSerGlyGlyProIleTyrValSerAsp420425430TCGGTCGGAAAGCACAACTTCGAGCTCCTTAGGAGCCTCGTTCTTCCC1342SerValGlyLysHisAsnPheGluLeuLeuArgSerLeuValLeuPro435440445GATGGCTCCATCCTCCGTTGTGATTACTACGCGCTTCCGACTCGCGAT1390AspGlySerIleLeuArgCysAspTyrTyrAlaLeuProThrArgAsp450455460TGCCTCTTTGAAGATCCACTTCACAATGGCAAGACTATGCTCAAAATT1438CysLeuPheGluAspProLeuHisAsnGlyLysThrMetLeuLysIle465470475TGGAATTATAACAAGTTCACCGGAGTTGTCGGAACTTTCAACTGCCAA1486TrpAsnTyrAsnLysPheThrGlyValValGlyThrPheAsnCysGln480485490495GGTGGCGGGTGGAGCCGGGAAGTGCGTCGCAACCAATGCGCTGCCGAG1534GlyGlyGlyTrpSerArgGluValArgArgAsnGlnCysAlaAlaGlu500505510TATTCCCACGCCGTCTCCTCTAGCGCTGGTCCGAGTGACATTGAGTGG1582TyrSerHisAlaValSerSerSerAlaGlyProSerAspIleGluTrp515520525AAGCAAGGAACGAGTCCGATCGACGTCGACGGCGTCAAAACATTCGCG1630LysGlnGlyThrSerProIleAspValAspGlyValLysThrPheAla530535540TTGTACCTATTCCACGAGAAGAAACTCGTCCTTTCTAAGCCATCAGAC1678LeuTyrLeuPheHisGluLysLysLeuValLeuSerLysProSerAsp545550555AAAATCGACATCACGCTTGAGCCCTTCGATTTTGAGCTGATAACCGTT1726LysIleAspIleThrLeuGluProPheAspPheGluLeuIleThrVal560565570575TCTCCAGTCAAAACTCTAGCCAATTGCACCGTCCAA1762SerProValLysThrLeuAlaAsnCysThrValGln580585(2)SEQIDNO7的信息(i)序列特征(A)长度271个氨基酸(B)类型氨基酸(D)拓扑线型(ii)分子类型肽(vi)原始来源(A)生物玉米(ZeamaysL.)(B)品种Pioneer3358(F)组织类型叶(xi)SEQIDNO7的序列描述GlnSerThrHisProCysAlaAlaPheHisAlaAlaSerArgAlaIle51015SerGlyGlyProIleTyrValSerAspSerValGlyGlnHisAspPhe202530AlaLeuLeuArgArgLeuAlaLeuProAspGlyThrValLeuArgCys354045GluGlyHisAlaLeuProThrArgAspCysLeuPheAlaAspProLeu505560HisAspGlyArgThrValLeuLysIleTrpAsnValAsnArgPheAla65707580GlyValValGlyAlaPheAsnCysGlnGlyGlyGlyTrpSerProGlu859095AlaArgArgAsnLysCysPheSerGluPheSerValProLeuAlaAla100105110ArgAlaSerProSerAspValGluTrpLysSerGlyLysAlaGlyPro115120125GlyValSerValLysAspValSerGlnPheAlaValTyrAlaValGlu130135140AlaArgThrLeuGlnLeuLeuArgProAspGluGlyValAspLeuThr145150155160LeuGlnProPheThrTyrGluLeuPheValValAlaProValArgVal165170175IleSerHisGluArgAlaIleLysPheAlaProIleGlyLeuAlaAsn180185190MetLeuAsnThrAlaGlyAlaValGlnAlaPheGluAlaLysLysAsp195200205AlaSerGlyValThrAlaGluValPheValLysGlyAlaGlyGluLeu210215220ValAlaTyrSerSerAlaThrProArgLeuCysLysValAsnGlyAsp225230235240GluAlaGluPheThrTyrLysAspGlyValValThrValAspValPro245250255TrpSerGlySerSerSerLysLeuCysCysValGlnTyrValTyrStop260265270(2)SEQIDNO8的信息(i)序列特征(A)长度996个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(ii)分子类型从cDNA到mRNA(ix)特征(A)名称/关键词肽(B)位置2到817(C)鉴定方法实验(xi)SEQIDNO8的序列描述CCAGTCCACGCACCCCTGCGCCGCCTTCCACGCCGCGTCCCGCGCC46GlnSerThrHisProCysAlaAlaPheHisAlaAlaSerArgAla51015ATCTCCGGCGGGCCCATCTACGTCAGCGACTCGGTGGGGCAGCACGAC94IleSerGlyGlyProIleTyrValSerAspSerValGlyGlnHisAsp202530TTCGCGCTGCTCCGCCGCCTGGCGCTCCCCGACGGCACCGTCCTCCGG142PheAlaLeuLeuArgArgLeuAlaLeuProAspGlyThrValLeuA354045TGCGAGGGCCACGCGCTGCCCACGCGCGACTGCCTCTTCGCCGACCCG190CysGluGlyHisAlaLeuProThrArgAspCysLeuPheAlaAspPro505560CTCCACGACGGCCGGACCGTGCTCAAGATCTGGAACGTGAACCGCTTC238LeuHisAspGlyArgThrValLeuLysIleTrpAsnValAsnArgPhe657075GCCGGCGTCGTCGGCGCCTTCAACTGCCAGGGCGGCGGGTGGAGCCCC286AlaGlyValValGlyAlaPheAsnCysGlnGlyGlyGlyTrpSerPro80859095GAGGCGCGGCGGAACAAGTGCTTCTCGGAGTTCTCCGTGCCCCTGGCC334GluAlaArgArgAsnLysCysPheSerGluPheSerValProLeuAla100105110GCGCGCGCCTCGCCGTCCGACGTCGAGTGGAAGAGCGGCAAGGCGGGG382AlaArgAlaSerProSerAspValGluTrpLysSerGlyLysAlaGly115120125CCAGGCGTCAGCGTCAAGGACGTCTCCCAGTTCGCCGTGTACGCGGTC430ProGlyValSerValLysAspValSerGlnPheAlaValTyrAlaVal130135140GAGGCCAGGACGCTGCAGCTGCTGCGCCCCGACGAGGGCGTCGACCTC478GluAlaArgThrLeuGlnLeuLeuArgProAspGluGlyValAspLeu145150155ACGCTGCAGCCCTTCACCTACGAGCTCTTCGTCGTTGCCCCCGTGCGC526ThrLeuGlnProPheThrTyrGluLeuPheValValAlaProValArg160165170175GTCATCTCGCATGAGCGGGCCATCAAGTTCGCGCCCATCGGACTCGCC574ValIleSerHisGluArgAlaIleLysPheAlaProIleGlyLeuAla180185190AACATGCTCAACACCGCCGGCGCCGTGCAGGCGTTCGAGGCCAAGAAA622AsnMetLeuAsnThrAlaGlyAlaValGlnAlaPheGluAlaLysLys195200205GATGCTAGCGGCGTCACGGCAGAGGTGTTCGTGAAGGGCGCAGGGGAG670AspAlaSerGlyValThrAlaGluValPheValLysGlyAlaGlyGlu210215220CTGGTGGCGTACTCGTCGGCGACGCCCAGGCTCTGCAAGGTGAACGGC718LeuValAlaTyrSerSerAlaThrProArgLeuCysLysValAsnGly225230235GACGAGGCCGAGTTCACGTACAAGGACGGCGTGGTCACCGTCGACGTG766AspGluAlaGluPheThrTyrLysAspGlyValValThrValAspVal240245250255CCGTGGTCGGGGTCGTCGTCGAAGCTGTGTTGCGTCCAGTACGTCTAC814ProTrpSerGlySerSerSerLysLeuCysCysValGlnTyrValTyr260265270TGAGCCGGACGGGCCGATGACTCTGCGTCTCTGCTCCCTGCTGGCCTGCTCAGGAC873StopATAATCTAATGTTTAGAGCTTACCAGGTTTTACAGCTCTATCAGTTTACTTTTGTTTTTC933TGCTCTTCGTTTTTTAAGAATTATTTCTATTGTGTGAATTAATGAGTGCTTTCCTTCTAA993AAA99权利要求1.从植物中分离的并具有编码能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖蛋白氨基酸序列的核苷酸序列的棉子糖合酶基因。2.根据权利要求1的棉子糖合酶基因,其中的植物为双子叶植物。3.根据权利要求2的棉子糖合酶基因,其中的双子叶植物为豆科植物。4.根据权利要求3的棉子糖合酶基因,其中的豆科植物为蚕豆。5.具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因(a)具有SEQIDNO1氨基酸序列的蛋白;(b)具有在SEQIDNO1的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白。6.具有SEQIDNO2核苷酸序列的棉子糖合酶基因。7.根据权利要求3的棉子糖合酶基因,其中的豆科植物为大豆。8.具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因(a)具有SEQIDNO3氨基酸序列的蛋白;(b)具有在SEQIDNO3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基的位置6碳原子上的羟基结合而制备棉子糖的蛋白。9.具有SEQIDNO4核苷酸序列的棉子糖合酶基因。10.根据权利要求2的棉子糖合酶基因,其中的双子叶植物为唇形科植物。11.根据权利要求10的棉子糖合酶基因,其中的唇形科植物为日本菜蓟(Japaneseartichoke)。12.具有编码SEQIDNO5氨基酸序列的核苷酸序列的棉子糖合酶基因。13.具有SEQIDNO6核苷酸序列的棉子糖合酶基因。14.根据权利要求1的棉子糖合酶基因,其中的植物为单子叶植物。15.根据权利要求14的棉子糖合酶基因,其中的单子叶植物为禾本科植物。16.根据权利要求15的棉子糖合酶基因,其中的禾本科植物为玉米(corn)。17.具有编码SEQIDNO7氨基酸序列的该苷酸序列的棉子糖合酶基因。18.具有SEQIDNO8核苷酸序列的棉子糖合酶基因。19.具有下述的氨基酸序列(a)或(b)的棉子糖合酶蛋白(a)SEQIDNO1或SEQIDNO3的氨基酸序列;(b)在SEQIDNO1或SEQIDNO3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列;能够通过将D-半乳糖基团经过α(1→6)链与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白。20.具有SEQIDNO1或SEQIDNO3氨基酸序列的棉子糖合酶蛋白。21.具有权利要求1、2、3、4、7、10、11、14、15或16棉子糖合酶基因部分核苷酸序列的基因片段。22.具有权利要求5、6、8、9、12、13、17或18棉子糖合酶基因部分核苷酸序列的基因片段。23.根据权利要求21或权利要求22的基因片段,其中的核苷酸数目在从15到50的范围内。24.用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的权利要求21、22或23的基因片段的探针与有机体得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。25.用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的权利要求21、22或23基因片段的探针与植物得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。26.用于扩增棉子糖合酶基因或具有其部分核苷酸序列的基因片段的方法,包括将具有权利要求21、22或23基因片段核苷酸序列的引物与有机体得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。27.用于扩增棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将具有权利要求21、22或23基因片段核苷酸序列的引物与植物得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。28.用于获得棉子糖合酶基因的方法,包括以下步骤即通过权利要求24、25、26或27的方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段;和分离及纯化鉴定的DNA片段。29.通过权利要求24、25、26或27的方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段而获得的棉子糖合酶基因;和分离及纯化鉴定的DNA片段。30.包括权利要求1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或29的棉子糖合酶基因,和连接到其上的启动子的嵌合体基因。31.通过将权利要求30的嵌合体基因导入宿主有机体而获得的转化子。32.包括权利要求1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30的棉子糖合酶基因的质粒。33.以权利要求32的质粒转化的宿主有机体,或其细胞。34.以权利要求32的质粒转化的微生物。35.以权利要求32的质粒转化的植物或其细胞。36.用于代谢修饰的方法,包括将权利要求1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30的棉子糖合酶基因导入宿主有机体或其细胞,从而使宿主有机体中棉子糖族寡糖的含量发生变化。37.用于制备棉子糖合酶蛋白的方法,包括从通过培养权利要求34的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。38.能够结合权利要求19或20的棉子糖合酶蛋白的抗棉子糖合酶抗体。39.用于检测棉子糖合酶蛋白的方法,包括以权利要求38的抗棉子糖合酶抗体检测蛋白;和通过该抗体与棉子糖合酶蛋白之间的抗原-抗体反应检测棉子糖合酶蛋白。全文摘要从不同的植物中分离编码能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白的棉子糖合酶基因。这些棉子糖合酶基因对改变植物中棉子糖族寡糖的含量是有用的。文档编号C12N9/10GK1190129SQ97107279公开日1998年8月12日申请日期1997年12月18日优先权日1996年12月18日发明者渡辺英二郎,大江田宪治申请人:住友化学工业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1