增强植物中直链淀粉产量的制作方法

文档序号:426168阅读:452来源:国知局
专利名称:增强植物中直链淀粉产量的制作方法
发明描述本发明涉及新的淀粉生物合成增强性蛋白质、编码淀粉生物合成增强性蛋白质的核酸、通过培养与野生型相比直链淀粉生物合成增强的经遗传修饰的植物来高效率产生直链淀粉的方法、或者涉及经遗传修饰的植物本身以及这些过表达至少一种淀粉生物合成增强性蛋白质的转基因植物用于直链淀粉生产的用途。
淀粉是植物主要的贮存糖类并且主要积累在种子和块茎中,其中所述种子和块茎是能够形成那些类型器官的植物的繁殖组织。淀粉还可以在昼夜的基础上积累,其中在绿色组织中由光合成产物积累淀粉并且随后在夜间进行代谢用于提供能量。贮存的淀粉排列成半晶体的颗粒。支链淀粉和直链淀粉是淀粉的两种组成分子。支链淀粉是通过α-1,6键连接的线性α-1,4葡聚糖链组成的有分枝的分子。直链淀粉基本上由线性α-1,4葡聚糖链组成。
在技术工业以及食品工业的很多应用中使用淀粉。淀粉加工者使用的主要农作物是玉米和马铃薯。对于马铃薯,培育高淀粉含量的特定品种用于淀粉的生产。这意味着淀粉含量和产量是淀粉加工业的重要经济驱动力。所生产干淀粉的大部分用于纸生产。对淀粉成分的规格和要求会随着不同应用而变化并且在许多情况下淀粉是经化学修饰的以提供应用的预期特性。实现不同质量淀粉的另一种方法是利用淀粉生物合成中的突变并且最近是通过对通向淀粉途径的遗传修饰而实现。第一个主要修饰将淀粉的两种成分支链淀粉和直链淀粉的生产分成不同的品种。蜡状或“无直链淀粉”品种只包含支链淀粉型淀粉而在玉米中也有高直链淀粉基因型例如“直链淀粉增量品种(amylase extender)”。
直链淀粉具有几种潜在的工业用途,作为成膜剂或者用于膨化产品。通过抑制淀粉分支酶在马铃薯和其它含淀粉植物中实现高直链淀粉。于是这导致伴随着支链淀粉分支的降低或消除并且由此增加直链淀粉分数。
在US 5,856,467中描述了抑制支链淀粉型淀粉形成的马铃薯的遗传工程修饰。该文献描述了用于在马铃薯中以不同程度抑制编码淀粉分支酶形成基因(SBE基因)表达的反义构建体,所述反义构建体包含块茎特异启动子、转录起点和以反义方向插入的SBE基因第一外显子。
在US 6,169,226中涉及另一种马铃薯淀粉分支酶(SBE II)的氨基酸序列及其片段以及涉及相应的分离DNA序列。该文献描述了转基因马铃薯的产生和这些转基因马铃薯在直链淀粉型淀粉生产中的用途。
在WO 97/20040和WO 98/20145中描述了通过向植物细胞引入核酸序列而改变植物细胞支链淀粉/直链淀粉含量的方法,其中所述核酸序列是以有义或反义方向有效连接到适当启动子的、与编码具有SBE I或SBE II活性多肽的基因同源的核酸序列。
在马铃薯中直链淀粉生产过剩的副作用是降低总的淀粉含量。当直链淀粉分数增加时这种总淀粉含量降低变得更加显著。
用于支链淀粉和直链淀粉生产的基本酶是形成线性α-1,4葡聚糖链的淀粉合酶和打断α-1,4葡聚糖链并通过α-1,6键使它们再次连接的分支酶。几种其它的酶可能影响淀粉的结构和组成,例如脱支酶,但是最初大部分焦点集中在影响淀粉合酶和淀粉分支酶的表达上。这导致广泛分析了何种酶对淀粉合成的何种特性是重要的。但是仍没有令人信服地指出直链淀粉或者支链淀粉在植物中的合成是如何起始的。
因为在不同于人工体外条件的条件下很难把引物独立功能归功于淀粉合酶,所以关于淀粉生物合成起始的建议成为几篇科学论文的主题。引物独立功能暗示用ADP-葡萄糖作为唯一起始点和构件形成新的α-1,4葡聚糖链。虽然对麦芽低聚糖的浓度是否足以提供淀粉合成基础以及这些麦芽低聚糖在质体中是如何形成的存在争论,但是一种经提出的途径是麦芽低聚糖的存在作为引物用于通过淀粉合酶添加另外的葡萄糖单位。
在植物中淀粉作为能量贮存分子而合成。虽然仍没有解决淀粉分子的起始,但是关于参与淀粉生物合成的酶已经知道很多。在哺乳动物和酵母中合成的是与淀粉十分相似的能量贮存分子糖原。合成各自分子的酶促步骤是相似的。在糖原的生物合成中分子的起始是已知的并且通过酶糖原蛋白(glycogenin)合成。糖原蛋白是能够自我聚合约8个葡萄糖分子线性链的自糖基化酶。约8个葡萄糖残基的引物对于酶催化葡萄糖继续掺入到糖原分子的功能是必需的。
Cheng等(1995,Mol.and Cell.Biol.6632-6640)比较了两种酵母蛋白质和兔肌肉糖原蛋白。
Roach等(1997,Progress in Nucleic Acid Research and MolecularBiology 57卷)描述了自糖基化起始蛋白质和它们在糖原生物合成中的功能。
Mu等(1997,Journal of Biological Chemistry 272(44),27589-27597)比较了哺乳动物与酵母和线虫(C.elegans)的糖原蛋白。
研究了对于淀粉量重要的因素并且特别是在马铃薯中采取了许多首创以通过过表达或者抑制增加底物供应、增加生物合成活性或者关闭底物转向途径方面多种酶活性来提高淀粉形成和含量,但是到目前为止只是没有商业应用的有限成功并且仅仅是一些科学发表。
Regierer,B.等,Starch content and yield increase as a result of alteringadenylate pools in transgenic plants.Nat Biotechnol.20(12)1256-60,(2002)。
Sweetlove,LJ等,Starch synthesis in transgenic potato tubers withincreased 3-phosphoglyceric acid content as a consequence of increased6-phosphofructokinase activity.Planta 213(3)478-82(2001)。
Veramendi,J等,Antisense repression of hexokinase 1 leads to anoveraccumulation of starch in leaves of transgenic potato plants but not tosignificant changes in tuber carbohydrate metabolism.Plant Physiol.121(1)123-34(1999)。
Geigenberger,P等,Overexpression of pyrophosphatase leads toincreased sucrose degradation and starch synthesis,increased activities ofenzymes for sucrose-starch interconversions,and increased levels ofnucleotides in growing potato tubers.Planta.205(3)428-37(1998)。
Sweetlove,LJ等,Starch metabolism in tubers of transgenic potato(Solanum tuberosum)with increased ADPglucose pyrophosphorylase.Biochem J.320(2)493-8(1996)。
在其它研究中,研究了动物中与起始糖原产生表面上相似的生物化学功能。从几种植物中分离到一组基因并且命名为amylogenin(WO 94/04693;Sing,D.等,β-Glucosylarginina new glucose-protein bond in aself-glucosylating protein from sweet corn,FEBS Letters 37661-64,1995)认为它是糖原蛋白植物等效物,其做为自糖基化酶并且提供植物中淀粉生物合成的引物。从结构观点看这些基因与编码糖原蛋白的基因没有相似之处并且后来确定这些基因不是在淀粉生物合成中起作用而可能对于细胞壁的形成是重要的。见Bocca,S.N等,Molecular cloning and characterizationof the enzyme UDP-glucoseprotein transglucosylase from potato.PlantPhysiology and Biochemistry 37(11)809-819(1999)。
在WO 98/50553中描述了编码植物糖原蛋白或者水胁迫蛋白(waterstress protein)的核酸片段。在WO 98/50553中还涉及以有义或反义方向的编码全部或部分植物糖原蛋白的嵌合基因的构建,其中嵌合基因的表达导致在转化的宿主细胞内产生了水平改变的植物糖原蛋白。
因而虽然已经研究了植物中的许多酶和途径,但是关于淀粉形成是如何起始的和什么决定淀粉含量的问题仍然没有解决。
直链淀粉是具有许多用途的商业上重要的淀粉产物,但不幸的是在转基因马铃薯植物中直链淀粉含量的提高与淀粉含量明显下降有关,见

图1。
对转基因高直链淀粉马铃薯品系的分析表明在这些品系中可溶性糖是过量的,见图2。这表明在这些转基因品系中淀粉生物合成不是足够有效地掺入可利用的糖。
与天然淀粉相比,直链淀粉具有十分少的还原末端。因此鉴定进一步增加直链淀粉生物合成和能够掺入过多的可利用葡萄糖残基和能够补偿产生大量直链淀粉植物中淀粉含量降低的基因在商业上是重要的。
本发明的目标是通过在转化植物中过表达增强淀粉生物合成的基因来增强直链淀粉生物合成的产量。
本发明描述了编码增强淀粉产生蛋白质的基因。
本发明描述了来自马铃薯的编码增强淀粉从头生物合成酶的核酸SEQ ID NO 1和3。
实施例1描述了核酸序列SEQ ID NO 1或3能够在包含自糖基化蛋白质Glg1p和Glg2p敲除突变的酵母细胞中补偿缺少的糖原蛋白功能。
构建了用于在马铃薯中两种基因SEQ ID NO 1或3的基因抑制和过表达的基因构建体。关于基因对淀粉含量的影响分析了具有过表达或者受抑制的酶活性的转基因品系。
将两种基因插入到植物启动子元件的有义和反义方向的下游,这导致产生转化双元载体pHS1、pHS2、pHS3和pHS4,见图3-7。
根据实施例2描述的转化方法将反义构建体转化进入马铃薯植物品种Prevalent和Producent并且将有义构建体转化进入马铃薯品种Desiree和转基因植物AM99-2003。如在实施例3中所描述产生了转基因植物AM99-2003。
Prevalent和Producent是具有约20%淀粉含量的淀粉品种。Desirée是具有约16%淀粉含量的马铃薯品种并且AM99-2003是转基因高直链淀粉品系,具有淀粉含量从而直链淀粉含量约为13%。
从马铃薯(Solanum tuberosum)(品种Prevalent)的块茎特异cDNA文库中分离了假想的基因。文库由lambdaZAP定向试剂盒(Stratagene)制备。
所分离的两种cDNA是各个基因的全长克隆并且命名为StGH1和StGH2,至于核酸序列见SEQ ID NO 1和SEQ ID NO 3。
pHS1将StGH1基因的1300bp PCR片段以反义方向构建成由gbss启动子驱动。将PCR片段用EcoRI(补平)和XbaI从它的克隆载体pCR4-TOPO(Invitrogen)上酶切下来。将片段连接到基于pGPTV-kan(Beeker,D.等,Plant Molecular Biology 201195-1197,1992)的双元载体pHo3.1中gbss启动子(WO 92/11376)和nos终止子之间的SalI(补平)和XbaI位点。双元载体还包括作为选择标记的由nos启动子驱动的nptII(Herrera,L.等,1983)。将构建体命名为pHS1,关于细节见图3a和4。
pHS2用XbaI和XhoI将StGH2的2300bp全长cDNA克隆从克隆载体pBluescript(Stratagene)上酶切下来。将基因以反义方向连接到双元载体pHo3.1中gbss启动子和nos终止子之间的XbaI和SalI位点。如在pHS1中所见,所述载体中具有作为选择系统的nptII。将该载体命名为pHS2,关于细节见图3b和5。
pHS3用EcoRI(补平)和BglII将全长StGH1 cDNA(1780bp)从宿主载体pBluescript上酶切下并且连接到pUCgbssprom(3886bp)的BamHI和SmaI位点,其中所述pUCgbssprom包含具有gbss启动子和nos终止子的pUC19。将质粒命名为pUCGH1。
将具有gbss启动子、StGH1基因和nos终止子的片段(2980bp)用EcoRI(补平)和HindIII从pUCGH1上切下来并连接到用PstI(补平)和HindIII切开的pSUN1(WO 02/00900)上。将质粒命名为pSUNGH1。
将包含拟南芥(Arabidopsis thaliana)AHAS抗性基因的3600bp的片段(Sathasivan,K.等,Plant Physiology 97(1991),1044-1050)与nos启动子(见Herrera-Estrella,L.等,Nature 303209-213(1983))和OCS终止子(Wesley,S.V.等,Plant J.27(6)581-590(2001))在SmaI位点连接到pSUNGH1(9000bp)上。将载体命名为pHS3,关于细节见图3c和6。
pHS4用EcoRI和HindIII将gbss启动子和nos终止子连接到pBR322上。将在所述启动子和终止子之间的EcoRI-HincII全长基因pStGH2克隆到XbaI位点。使用EcoRI(部分消化)和EcoRV将3366bp的启动子-基因-终止子复合体酶切下来并连接到pSUN1的EcoRI-EcoRV位点并且将质粒命名为pSUNGH2。将具有AHAS基因(拟南芥)、nos启动子和OCS终止子的XbaI片段连接到用XbaI切开(部分消化)的pSUNGH2上。AHAS基因用作选择标记。将构建体命名为pHS4,关于细节见图3d和7。
实施例2描述了用pHS1、pHS2、pHS3或者pHS4转化产生天然淀粉或者高直链淀粉型淀粉的不同马铃薯植物品种的一般方法。
如实施例4和6所述,通过用相对于植物调节元件的反义方向的基因转化后,在马铃薯植物品种Prevalent和Producent中StGH1和StGH2基因下调了。两种基因的下调导致在转基因品系中相对于它们的母本品种的基因表达下降了50-95%,见实施例7和表3。用pHS1和pHS2转化的经证实基因表达降低的转基因品系与它们的母本品种相比干物质降低了7-11%,见实施例8和表5。
如实施例5所述,在马铃薯中由块茎特异启动子gbss所驱动的StGH1和StGH2过表达了。突变的AHAS基因用作筛选标记,得到对咪草啶酸(Imazamox)除草剂的耐受性。两个马铃薯品种Desiree和AM99-2003用于转化,AM99-2003是一种与其亲本品系相比淀粉含量降低40%的转基因高直链淀粉品系。如实施例6所述选择了过表达StGH1和StGH2的转化品系。用实时PCR分析了基因表达水平,见实施例7和表3。基因StGH1和StGH2的过表达导致与它们的亲本品系相比基因表达增加2-10倍。此外,如实施例8和表5所描述,过表达StGH1和StGH2的品系干物质也增加高达36%。
在产生直链淀粉型淀粉的转基因马铃薯植物中StGH1和StGH2的过表达导致增加干物质含量,这意味着由于不产生支链淀粉,直链淀粉含量增加了,见实施例8-12。
RNA干扰(RNAi)通过向细胞引入双链RNA(dsRNA)而起作用,这导致同源RNA的降解。dsRNA通过称做切酶(Dicer)的核糖核酸酶剪切成21-25个核苷酸的小的干扰RNA(siRNA)。siRNA与蛋白质复合体连接并且形成了RNA诱导的沉默复合体RISC。通过ATP产生的siRNA的解旋激活RISC,RISC结合到同源转录物上并且剪切mRNA导致基因沉默,见Mc Manus MT和Sharp PA.,Gene silencing in mammals by smallinterfering RNAs.Nature Rev Genet 3737-747(2002);Dillin A.,Thespecifics of small interfering RNA specificity.Proc Natl Acad Sci USA100(11)6289-6291(2003);Tuschl T.,Expanding small RNA interference.Nature Biotechnol 20446-448(2002)。
当使用RNAi构建体pHAS3(图23)和pHAS8b(图20)时,高直链淀粉品系的产量比反义构建体pHAbe12A更有效。与所产生总转基因苗中高直链淀粉品系的频率为约1%相比,当使用例如pHAS8b和pHAS3时所产生总转基因苗中高直链淀粉品系的频率超过>25%,见实施例15-17。
用于高直链淀粉马铃薯生产的RNAi构建体pHAS8b(图20)和pHAS3(图23)(SEQ ID NO 24)包含以倒置串联克隆的be1和be2片段(SEQID NO 19)。构建体仅仅是位于倒置重复之间使用的间隔区不同,对于pHAS8b使用be2启动子片段(SEQ ID NO 18)而对于pHAS3使用从pBluescript克隆的残基(SEQ ID NO 23)。RNAi构建体导致有效地下调分支酶基因。
此外,各自的be1和be2基因片段可以更短或者更长并且靶向分支酶基因的其他部分。be1和be2的用于RNAi的更短的片段描述于SEQ ID NO21和22。
本发明的淀粉生物合成增强性蛋白质包含SEQ ID NO 2或4的氨基酸序列或者包含来源于SEQ ID NO 2或4的序列的蛋白质,所述来源于SEQID NO 2或4的序列的与序列SEQ ID NO 2或4在氨基酸水平上具有至少50%、优选地至少60%、更加优选地至少70%、更加优选地至少80%、仍然更加优选地至少90%、最优选地至少95%的同一性的并且所述包含来源于SEQ ID NO 2或4的序列的蛋白质有着淀粉生物合成增强性蛋白质的性质。该淀粉生物合成增强性蛋白质可以从SEQ ID NO 2或4开始通过人工变异,例如通过氨基酸的替代、插入或缺失来制备。
此种蛋白质可以用于在非转基因或者转基因植物中增加直链淀粉或支链淀粉的生产。
术语“替代”在本说明书中意思是指一个或多个氨基酸被一个或多个氨基酸替换。优选地是进行“保守”替换,其中替换的氨基酸具有与原始氨基酸相似的特性,例如用Asp替换Glu、Asn替换Gln、Ile替换Val、Ile替换Leu、Thr替换Ser。
“缺失”是用直接键替换一个氨基酸或多个氨基酸。缺失的优选地位置是多肽末端和各个蛋白质结构域的连接处。
“插入”是氨基酸插入到多肽链中,形式上是由一个或多个氨基酸代替直接键。
两个蛋白质之间的“同一性”意思是指在每一种情况中蛋白质全长中氨基酸的相同性,具体而言是通过借助Informax公司(USA)的Vector NTISuite 7.1软件使用Clustal W方法(Thompson,JD等,Nucleic AcidResearch,22(22)4673-4680,1994)比较计算的相同性,所述比较的参数如下设定多重比对参数缺口罚分 15缺口延伸罚分 6.66缺口分离罚分范围 8缺口分离罚分 开比对延迟同一性% 40残基特异缺口 开亲水残基缺口 关过渡加权 0成对比对参数FAST算法 关K-tuple大小 2
缺口罚分 5窗口大小 4最佳对角线数目 4相应地,与序列SEQ ID NO 2或4在氨基酸水平有着至少50%同一性的蛋白质意味着当与序列SEQ ID NO 2或4比较时,尤其根据上面的程序算法使用上述参数设置时,具有至少50%相同的蛋白质。
通过比较氨基酸序列或者从数据库回译(back-translate)核酸序列与序列SEQ ID NO 2或4的同一性,具体而言根据上面的程序算法使用上面参数设置,可以轻易地从例如基因组序列已知的多种生物中特别是植物中找到编码本发明淀粉生物合成增强性蛋白质的基因的其他天然的例子。
在拟南芥的已完成的基因组序列中,通过搜索外显子/内含子边界和与SEQ ID NO 2或4的回译序列比较可以推导出五个假想的编码序列。
下面的拟南芥核酸序列SEQ ID NO 5、SEQ ID NO 7、SEQ ID NO 9、SEQ ID NO 11和SEQ ID NO 13可以用于实施本发明并且编码淀粉生物合成增强性蛋白质SEQ ID NO 6、SEQ ID NO 8、SEQ ID NO 10、SEQ ID NO12和SEQ ID NO 14。
此外,为了鉴定和克隆来自植物生物体的编码淀粉生物合成增强性蛋白质的基因,可以用到下面的核酸序列或ESTGenBank中番茄ESTAW216407、BE450055、BF097262、BE450557、BF097173GenBank中小麦ESTBJ292476、BJ278875、BJ283925、BE442966、CA666180、BQ483228GenBank中玉米ESTBG319971GenBank中稻ESTAL606633、CA752890、BI813265此外,通过杂交技术以本身已知的方式,例如从核酸序列SEQ ID NO1或者SEQ ID NO 3或者SEQ ID NO 5、7、9、11或13中任何一个或者上述EST序列的任何一个开始,可以容易地在多种基因组序列未知的生物体特别是植物中找到淀粉生物合成增强性蛋白质和相应基因的天然例子。
杂交可以在中等(低严格)或者优选地在严格(高严格)条件下进行。
尤其是在Sambrook,J.,Fritsch,E.F.,Maniatis,T.,在MolecularCloning(A Laboratory Manual),第2版,Cold Spring Harbor LaboratoryPress,1989,9.31-9.57页或者Current Protocols in Molecular Biology,JohnWiley &S ons,N.Y.(1989),6.3.1-6.3.6中描述了这些杂交条件。
作为实例,洗涤步骤的条件可以选自通过低严格条件(2X SSC 50℃)和高严格条件(0.2X SSC 50℃,优选地65℃)(20X SSC0.3M柠檬酸钠,3M氯化钠,pH7.0)所限制的条件范围内。
此外,洗涤步骤地温度可以从室温22℃的中等条件升高到65℃的严格条件。
盐浓度和温度两个参数可以同时变化并且也可以两个参数之一保持恒定并且只是另一个发生变化。在杂交中还可以使用变性剂例如甲酰胺或SDS。在50%甲酰胺存在的条件下,杂交优选地在42℃进行。
在下面列出了用于杂交和洗涤步骤的一些代表性条件(1)杂交条件,例如(i)4X SSC 65℃,或者(ii)6X SSC 45℃,或者(iii)6X SSC 68℃,100mg/ml变性鱼精DNA,或者(iv)6X SSC,0.5%SDS,100mg/ml变性片段化鲑精DNA 68℃,或者(v)6X SSC,0.5%SDS,100mg/ml变性片段化鲑精DNA 50%甲酰胺42℃,或者(vi)50%甲酰胺,4X SSC 42℃,或者(vii)50%(v/v)甲酰胺,0.1%牛血清白蛋白,0.1%菲可,0.1%聚乙烯吡咯烷酮,50mM磷酸钠缓冲液pH6.5,750mM NaCl,75mM柠檬酸钠42℃,或者(viii)2X或4X SSC 50℃(中等条件),或者(ix)30-40%甲酰胺,2X或4X SSC 42℃(中等条件)。
(2)洗涤步骤,每次10分钟,例如(i)0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS 50℃,或者(ii)0.1X SSC 65℃,或者(iii)0.1X SSC,0.5%SDS 68℃,或者(iv)0.1X SSC,0.5%SDS,50%甲酰胺42℃,或者(v)0.2X SSC,0.1%SDS 42℃,或者(vi)2X SSC 65℃(中等条件)。
具有增强淀粉生物合成活性的优选的蛋白质是来源于植物、蓝细菌、藓类植物或藻类,特别优选地是来源于植物的蛋白质。特别优选的蛋白质包含SEQ ID NO 2或4的氨基酸序列。
例如,如果蛋白质欲在植物中表达,根据所述植物的密码子选择使用所述植物的密码子选择用于基因的回译和再合成常常是有利的。
本发明进一步涉及编码本发明淀粉生物合成增强性蛋白质的核酸。在说明书中提到的所有核酸可以是例如RNA序列、DNA序列或者cDNA序列。
例如,根据遗传密码通过回译多肽序列可以得到适当的核酸序列。为此,优选地是使用根据生物体特异密码子选择所经常使用的那些密码子。根据对所述生物体其它已知基因的计算机分析可以容易地确定密码子选择。
所有上面提到的编码淀粉生物合成增强性蛋白质的基因可以进一步以本身已知的方式通过化学合成从核苷酸结构单元制备,例如通过双螺旋的单个重叠互补核酸结构单元的片段缩合来制备。例如,寡核苷酸的化学合成可以以已知的方式根据亚磷酰胺方法(Voet,Voet,第2版,Wiley PressNew York,896-897页)完成。合成寡核苷酸的复性和借助DNA聚合酶的Klenow片段对缺口补平和连接反应和一般的克隆方法描述于Sambrook等,(1989),Molecular cloningA laboratory manual,Cold Spring HarborLaboratory Press。
可以将编码该功能的基因整合到植物的染色体上并且当表达时利用转运肽定位到淀粉/直链淀粉生物合成所发生的细胞器——质体中,或者将编码该功能的基因整合到质体基因组中并且由此不需要定位信号。基因可以组成型表达或者器官特异表达。对于器官特异表达,在马铃薯中优选地是块茎特异表达启动子而在如玉米或小麦的谷类中优选地是胚乳特异表达以实现在积累储存淀粉的器官中高程度的表达。当转化进入质体基因组中时,可以应用适于该细胞器的特异调节元件。
本发明的基因可以与位于同一基因构建体上或者通过共转化或超转化进行转移和结合的其它基因一起使用。感兴趣的与本发明基因联合的基因和性状是农学的或者输入性状如除草剂耐受性、疾病和害虫抗性或胁迫耐受性,但是也可以是输出性状如淀粉结构修饰或产量。与本发明描述基因联合使用的基因和性状是加入所修饰植物物种不存在的功能或者过表达已经存在的功能或者通过反义、RNAi或抗体抑制功能。
本发明可以用于在马铃薯块茎中增加淀粉或直链淀粉含量,但是根据上下文不限于马铃薯而是可以应用于其它产生和贮存淀粉的植物,例如玉米、木薯、小麦、大麦、燕麦和稻。
所描述的发明特别适用于在不同植物中消除与增加直链淀粉含量相关的较低的淀粉含量,其中在所述植物中由于降低或消除α-1,6分枝的形成使得α-1,4-葡聚糖链非还原末端的数量极大降低。对于多糖生产,支链淀粉是像糖原那样的极其有效的结构,因为它具有十分多的分枝并且因此包含如非还原末端一样多的淀粉合成可接近的端点。主要由直链淀粉组成的淀粉包含十分少的分支并且因此生物合成能力降低了。当没有支链淀粉产生时为了增强淀粉的生物合成,本发明描述的基因的表达可以例如形成代替支链淀粉的新的引物作为淀粉生物合成能力的来源并且由此降低或消除所损失的淀粉合成能力。为了进一步阐明该情况,在普通马铃薯淀粉中分枝程度约为3.1%而在高直链淀粉淀粉中分枝程度为0.3-1.0%,其取决于直链淀粉的含量。该种分枝和淀粉含量的降低还与葡萄糖和果糖含量的增加有关。
增加的直链淀粉含量和由此而增加的固体含量对于多种应用例如法式炸薯条、油炸土豆片和其它基于马铃薯的产品中加工特性也有好处。除了增加的固体含量,插入的本发明基因SEQ ID NO 1或3导致将过多的糖转化成α-1,4-葡聚糖链并且由此降低了油炸马铃薯产品的褐变,即其中氨基酸与游离糖发生的美拉反应。
此外(i)具有所述活性的植物起源的任意基因可用于增加直链淀粉含量和固体。
(ii)所述基因可以由植物中起作用的任意调节启动子元件控制。
(iii)任意品种的任意产淀粉农作物可用所述基因转化。
(iiii)可使用任意植物转化方法。
(iiiii)任意双元载体可用于插入所述基因。
(iiiiii)所述基因可以与任意其它希望的转基因插入特性相结合。
本发明进一步涉及通过培育植物产生直链淀粉的方法,与野生型或已经产生直链淀粉型淀粉的遗传修饰的植物相比,所述植物具有增加的直链淀粉生物合成活性,所述蛋白质包含氨基酸序列SEQ ID NO 2或4或者通过替代、插入或缺失氨基酸而从这些序列衍生的并且与序列SEQ ID NO 2或4在氨基酸水平有至少50%同一性的序列。
与野生型或转基因品系相比增加的直链淀粉生物合成活性意思是指与野生型或转基因品系相比形成的直链淀粉的量受到增加淀粉生物合成蛋白质的增加。
淀粉或直链淀粉生物合成活性的这种增加是野生型或转基因品系蛋白质活性的优选地至少5%,进一步优选地至少10%,进一步优选地至少20%,进一步优选地至少50%,更加优选的至少100%,仍然更加优选地至少200%,特别是至少500%。
“野生型”意思是指相应的没有进行遗传修饰的起始植物。该植物优选地是马铃薯。
取决于上下文,术语“植物”意思是指野生型起始植物或者经遗传修饰的起始植物。
“转基因植物”或“遗传修饰植物”意思是指该植物包含与适当启动子为有义和/或反义方向的如在SEQ ID NO 1或3中指定的多核苷酸或与其至少60%序列同一性的多核苷酸,所述多核苷酸植物物种是外来的或内源的额外插入基因片段、额外基因或者额外基因片段,对应于下面多肽并且表现出淀粉分支酶I、淀粉分支酶II酶和/或淀粉生物合成增强性蛋白质的活性。
“直链淀粉型淀粉”意思是指与野生型植物特别是野生型马铃薯植物产生的淀粉的直链淀粉含量相比淀粉的直链淀粉含量提高了。
淀粉或直链淀粉生物合成活性可以通过多种方法提高,例如通过在翻译和蛋白质水平消除抑制调节机制或者通过与野生型或转基因植物相比提高编码淀粉生物合成增强性蛋白质的核酸的基因表达,例如通过激活剂诱导编码淀粉生物合成增强性蛋白质的基因或者通过向植物引入编码淀粉生物合成增强性蛋白质的核酸。
根据本发明,提高编码淀粉生物合成增强性蛋白质的核酸的基因表达也指操作植物,特别是在马铃薯植物中内在的内源性淀粉生物合成增强性蛋白质的表达。这可以通过例如修饰编码淀粉生物合成增强性蛋白质基因的启动子的DNA序列来实现。能够导致修饰或者优选地增加至少一种编码淀粉生物合成增强性蛋白质内源基因表达速率的此种修饰可以通过缺失或者插入DNA序列来实现。
通过应用外源的刺激修饰一种或多种内源的淀粉生物合成增强性蛋白质的表达也是可能的。这可以通过特定的生理条件即通过应用外界物质实现。
此外,通过调节蛋白质的相互作用实现至少一种编码淀粉生物合成增强性蛋白质的内源基因修饰或提高表达是可能的,其中所述调节蛋白质是经修饰的或者在未转化的植物中是不存在的。
在优选的实施方案中,与野生型或者转基因植物相比通过增加编码淀粉生物合成增强性蛋白质的核酸基因表达,增加了淀粉生物合成增强性蛋白质的活性,所述淀粉生物合成增强性蛋白质包含氨基酸序列SEQ ID NO2或4或者通过氨基酸替代、插入或缺失从所述序列衍生而来并且与SEQID NO 2或4在氨基酸水平有着至少50%同一性的序列。
在编码淀粉生物合成增强性蛋白质的基因组核酸序列来源于真核来源的情况下,其中基因组核酸序列包含内含子,如果宿主生物体不能够表达不能使其表达相应的淀粉生物合成增强性蛋白质时,优选使用已经加工的核酸序列,例如相应的cDNA。
在该优选的实施方案中,与野生型或转基因植物相比,本发明的转基因植物包含至少一个编码淀粉生物合成增强性蛋白质的基因。在该优选的实施方案中,本发明的经遗传修饰的植物因此具有至少一个转基因内源或外源的编码淀粉生物合成增强性蛋白质的核酸。
适宜的和优选地核酸在上面叙述。在尤其优选的实施方案中,将包含序列SEQ ID NO 1或3的核酸引入植物中。
根据本发明,生物体优选地指能够产生淀粉或直链淀粉的真核生物体例如酵母、藻类、藓类植物、真菌或植物,它们是野生型或者通过遗传修饰的。优选的生物体是光合成活性的生物体,例如植物,它甚至作为野生型也能够产生淀粉或直链淀粉型淀粉。
特别优选的生物体是马铃薯植物。
本发明进一步涉及包含氨基酸序列SEQ ID NO 2或4或者通过氨基酸替代、插入或缺失从该序列衍生而来的并且与SEQ ID NO 2或4在氨基酸水平有着至少50%同一性的序列并且具有增强植物中淀粉生物合成活性的蛋白质的用途。
本发明进一步涉及核酸SEQ ID NO 1或3或者SEQ ID NO 5、7、9、11或13其中之一的用途,其中所述编码在植物中具有增强淀粉生物合成活性蛋白质。
转基因生物体,特别是植物,优选地是通过用核酸构建体转化起始生物体特别是植物而制备,所述核酸构建体包含上述核酸、编码淀粉生物合成增强性蛋白质,所述核酸构建体功能性的连接到确保在所述生物体中转录和翻译的一种或多种调节信号。
其中编码核酸序列功能性连接到保证在所述生物体特别是植物中转录和翻译的一个或多个调节信号的核酸构建体在下文中也称作表达盒。
相应地,本发明进一步涉及核酸构建体,特别是涉及作为表达盒起作用的核酸构建体,所述核酸构建体包含编码淀粉生物合成增强性蛋白质的核酸,其功能性连接到保证在生物体特别是植物中转录和翻译的一个或多个调节信号。
调节信号优选地包含保证在生物体特别是植物中转录和翻译的一个或多个启动子。
表达盒包括调节信号,即控制着编码序列在宿主细胞中表达的调节核酸序列。根据优选的实施方案,表达盒包含上游即位于编码序列5’末端的启动子和下游即3’末端的多聚腺苷酸化信号和适当的其他调节元件,所述调节元件有效地连接到位于启动子和多聚腺苷酸化信号之间的至少一个上述基因的编码序列。有效连接意思是指启动子、编码序列、终止子和适当的其他调节元件的顺序排列,该种排列导致每一个调节元件能够适当地执行其在编码序列表达中的功能。
当所使用的生物体是植物时,本发明的核酸构建体和表达盒优选地包含保证定位于质体的编码质体转运肽的核酸。
用于植物的优选的核酸构建体、表达盒和载体和用于制备转基因植物的方法还有转基因植物本身在下面的实施例2-6中描述。
优选地用于有效连接的序列,但不限于,用于保证亚细胞定位到质体例如造粉体或者叶绿体,但是也可以是质外体、液泡、线粒体、内质网(ER)、细胞核、油质体或其他区室的靶向序列以及翻译增强子,例如烟草花叶病毒5’前导序列(Gallie等,Nucl.Acids Res.15(1987),8693-8711)。
表达盒的适宜启动子原则上是能够控制外来基因在植物中表达的任何启动子。
“组成型”启动子意思是指那些保证在多数组织,优选地全部组织中,在相对较长植物发育阶段,优选整个植物发育过程中表达的启动子。
尤其优选使用来源于植物的启动子或起源于植物病毒的启动子。特别优选CaMV花椰菜花叶病毒35S转录物启动子(Franck等,(1980)Cell21285-294;Odell等,(1985)Nature 313810-812;Shewmaker等,(1985)Virology 140281-288;Gardner等,(1986)Plant Mol Biol 6221-228)或者19S CaMV启动子(US 5,352,605;WO 84/02913;Benfey等,(1989)EMBO J 82195-2202)。
另一种适当的组成型启动子是核酮糖二磷酸羧化酶-加氧酶(Rubisco)小亚基(SSU)启动子(US 4,962,028)、豆球蛋白B启动子(GenBank登录号X03677)、土壤杆菌属胭脂氨酸合成酶启动子、TR双启动子、土壤杆菌属OCS(章鱼碱合酶)启动子、泛蛋白启动子(Holtorf S等,(1995)Plant MolBiol 29637-649)、泛蛋白1启动子(Christensen等,(1992)Plant Mol Biol18675-689;Bruce等,(1989)Proc Natl Acad Sci USA 869692-9696)、Smas启动子、桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基启动子或者富含脯氨酸小麦蛋白质启动子(WO 91/13991)、Pnit启动子(Y07648.L,Hillebrand等,(1998),Plant.Mol.Biol.36,89-99,Hillebrand等(1996),Gene,170,197-200)和本领域技术人员已知的在植物中组成型表达的基因其他的启动子。
表达盒还可以包含化学诱导型启动子(综述Gatz等,(1997)Annu RevPlant Physiol Plant Mol Biol 4889-108),它可以用于控制植物中淀粉生物合成增强性蛋白质基因在特定时间表达。同样可以使用此类启动子,例如PRP1启动子(Ward等,(1993)Plant Mol Biol 22361-366)、水杨酸诱导型启动子(WO 95/19443)、苯磺酰胺诱导型启动子(EP 0 388 186)、四环素诱导型启动子(Gatz等,(1992)Plant J 2397-404)、脱落酸诱导型启动子(EP 0335528)和乙醇或环己酮诱导型启动子(WO 93/21334)。
适宜启动子的进一步的例子是果实成熟特异启动子,例如番茄的果实成熟特异启动子(WO 94/21794,EP 409625)。发育依赖的启动子部分地包括组织特异性启动子,因为各个组织以发育依赖的方式天然形成。
此外,优选地是那些保证在植物组织或部分表达的启动子,在所述植物组织或部分中发生例如淀粉或直链淀粉或其前体生物合成。优选例如叶、茎、根、种子和块茎特异的启动子。
种子特异的启动子为,例如菜豆碱启动子(US 5,504,200;Bustos MM等,(1989)Plant Cell 1(9)839-53)、2S清蛋白基因启动子(Joseffson LG等,(1987)J Biol Chem 26212196-12201)、豆球蛋白启动子(Shirsat A等,(1989)Mol Gen Genet 215(2)326-331)、USP(未知种子蛋白质)启动子(BumleinH等人,(1991)Mol Gen Genet 225(3)459-67)、油菜籽蛋白基因启动子(US5,608,152;Stalberg K等,(1996)L Planta 199515-519)、蔗糖结合蛋白质启动子(WO 00/26388)和豆球蛋白B4启动子(LeB4;Bumlein H等(1991)Mol Gen Genet 225121-128;Baeumlein等,(1992)Plant Journal 2(2)233-9;Fiedler U等,(1995)Biotechnology(NY)13(10)1090f)、拟南芥油质蛋白启动子(WO 98/45461)、芸苔Bce4启动子(WO 91/13980)和豌豆球蛋白启动子(Weschke等,1988,Biochem.Physiol.Pflanzen 183,233-242;BumleinH等,(1991)Mol Gen Genet 225(3)459-67)。
其他适宜的种子特异启动子是编码高分子量麦谷蛋白(HMWG)、麦醇溶蛋白、分支酶、ADP葡萄糖焦磷酸酶(AGP酶)和淀粉合酶的基因的那些启动子。还优选允许在单子叶植物如玉米、大麦、小麦、黑麦、稻等中种子特异表达的启动子。可以有利的使用lpt2或lpt1基因启动子(WO95/15389,WO 95/23230)或者WO 99/16890中描述的启动子(大麦醇溶蛋白基因、谷蛋白基因、水稻素基因、谷醇溶蛋白基因、麦醇溶蛋白基因、谷蛋白基因、玉米醇溶蛋白基因、kasirin基因和裸麦醇溶蛋白基因的启动子)。
块茎、储藏根或根特异启动子的实例为如EP-A 0 921 191中描述的patatin I类启动子(B33)、马铃薯组织蛋白酶D抑制剂启动子和马铃薯颗粒结合淀粉合酶(GBSS)启动子。
叶特异启动子的例子是来源于马铃薯的胞质FBP酶启动子(WO97/05900)、rubisco(核酮糖-1,5-二磷酸羧化)SSU(小亚基)启动子和马铃薯ST-LSI启动子(Stockhaus等,(1989)EMBO J 82445-2451)。
已描述了适于在植物中表达的其他启动子(Rogers等,(1987)Meth inEnzymol 153253-277;Schardl等,(1987)Gene 611-11;Berger等,(1989)Proc Natl Acad Sci USA 868402-8406)。
在马铃薯植物中淀粉和直链淀粉生物合成的位点是造粉体。因此,编码淀粉生物合成增强性蛋白质的本发明核酸SEQ ID NO 1或3的基因产物的造粉体特异靶向和活性是所期望的。
表达也可以以组织特异的方式在植物的所有部分进行。
因此进一步优选的实施方案涉及核酸SEQ ID NO 1或3的块茎特异表达。
此外,编码淀粉生物合成增强性蛋白质的基因的组成型表达是有利的。然而在另一方面该基因可诱导表达也是期望的。
优选地根据如例如T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular CloningA Laboratory Manual,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1989)和T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.等,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience(1987)中所描述熟知的重组和克隆技术,通过将适宜启动子与上述编码淀粉生物合成增强性蛋白质的核酸、并且优选地与已经插入到启动子和核酸序列之间并编码造粉体特异转运肽的核酸、以及与多聚腺苷酸信号融合来制备表达盒。
特别优选地是确保靶向造粉体的插入核酸序列。
还可以使用表达盒,该表达盒中核酸序列编码淀粉生物合成增强性蛋白质的融合蛋白,其中融合蛋白的一部分是控制多肽转运的转运肽。优选地是造粉体特异转运肽,当淀粉生物合成增强性蛋白质转运进入造粉体后,该转运肽通过酶作用从淀粉生物合成增强性蛋白质部分切除。
特别优选地是来源于烟草(Nicotiana tabacum)质体转酮醇酶或者来源于另一种转运肽(例如rubisco小亚基转运肽或者铁氧还蛋白NADP氧化还原酶转运肽和异戊烯焦磷酸异构酶-2转运肽)或来源于其功能等效物的转运肽。
质体转运肽的进一步的例子是来源于拟南芥的质体异戊烯焦磷酸异构酶-2(IPP-2)的转运肽和来源于豌豆的核酮糖二磷酸羧化酶小亚基(rbcS)的质体转运肽(Guerineau,F,Woolston,S,Brooks,L,Mullineaux,p(1988)Anexpression cassette for targeting foreign proteins into the chloroplasts.Nucl.Acids Res.1611380)。
编码淀粉生物合成增强性蛋白质的本发明的植物基因可以已经包含编码质体转运肽的核酸序列。在这种情况下,不需要其他质体转运肽。例如,本发明SEQ ID NO 1或3的淀粉生物合成增强性蛋白质的马铃薯序列已经包含转运肽序列。
本发明核酸可以通过合成制备或者通过天然得到,或者包含合成的和天然的核酸成分的混合物并且也可以包含多种生物体的多种异源基因片段。
如上所述,优选具有植物优选密码子的合成核苷酸序列。这些植物优选的密码子可以通过在蛋白质中具有最高频率并且在大多数目的植物物种表达的密码子来确定。
在制备表达盒时,可以操作多种DNA片段以致于得到以正确的方向方便阅读的并且提供正确阅读框的核酸序列。DNA片段可以通过所述片段附属的接头或连接体而彼此连接。
此外,可以使用提供适当的限制性酶切位点或者除去多余DNA或限制性酶切位点的操作。在插入、缺失或替代例如转换和颠换是适宜的情况下,可以使用体外诱变、引物修复、限制性酶切或者连接。
优选的多聚腺苷酸化信号是在植物中有功能的多聚腺苷酸化信号,作为例证的是基本上对应于根癌农杆菌(Agrobacterium tumefaciens)的T-DNA多聚腺苷酸化信号,特别是T-DNA基因3(章鱼碱合酶)或OCS终止子、Ti质粒pTiACH5的全部序列(Gielen等,EMBO J.3,835846(1984))的那些多聚腺苷酸化信号或功能等效物。
本发明进一步涉及核酸SEQ ID NO 1或3的用途,用于在植物,例如马铃薯中增加淀粉或直链淀粉含量,所述马铃薯作为野生型能够产生淀粉或直链淀粉,见实施例2-13。
本发明不限于核酸SEQ ID NO 1或SEQ ID NO 3在植物特别是马铃薯植物中的过表达。
核酸序列SEQ ID NO 1和3两者在植物中的过表达可以用于增强直链淀粉的生物合成,见实施例14-16。包含SEQ ID NO 1和SEQ ID NO 3的构建体还可以用来增加植物中淀粉含量或者支链淀粉含量。这些构建体可以构建到每个构建体被一个启动子所驱动的同一T-DNA上。这些构建体还可以串联构建到由同一个启动子驱动的同一个T-DNA上。还可以使用一种以上构建体或者同时(共转化)或者以不同的转化事件将这些构建体进行转化。
上述蛋白质和核酸可以用于在转基因植物中产生淀粉或直链淀粉。
将外来基因转移到生物体特别是植物的基因组中称为转化。
为了该目的,特别是在植物中为了瞬时或稳定转化,可以使用用于转化植物和从植物组织或植物细胞产生植物的本身已知的方法,例如如实施例2所述。
用于转化植物的适宜的方法是通过聚乙二醇诱导的DNA摄入的原生质体转化、使用基因枪的生物射弹法(也叫做粒子轰击、电穿孔、使干胚胎在含有DNA的溶液中孵育、微注射和上述通过土壤杆菌介导的基因转移。所述方法描述于例如B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,第1卷,Engineering and Utilization,S.D.Kung和R.Wu著,Academic Press(1993),128-143和Potrykus,Annu.Rev.PlantPhysiol.Plant Molec.Biol.42(1991),205-225)。
优选将所表达的构建体克隆到适宜转化根癌农杆菌的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984),8711)或优选的pSUN2(WO02/00900)。
相应地,本发明进一步涉及包含上述核酸、核酸构建体或表达盒的载体。
用表达盒转化的土壤杆菌可以以已知的方式用于转化植物,例如通过将损伤的叶或叶切片浸在土壤杆菌溶液中然后用适当的培养基培养它们。
除了植物外,表达盒还可以用于转化细菌,特别是蓝细菌、藓类植物、酵母、丝状真菌和藻类。
遗传修饰植物,下文也称作转基因植物,优选地通过将表达淀粉生物合成增强性蛋白质的融合表达盒克隆到适宜转化根癌农杆菌的载体例如pBin19而制备。
然后将用此种载体转化后的土壤杆菌以已知的方式转化植物,特别是农作物植物,例如通过将损伤的叶或叶切片浸泡在土壤杆菌溶液中并且然后在适当的培养基中培育它们。
用土壤杆菌进行植物转化尤其描述于F.F.White,Vectors for GeneTransfer in Higher Plants;在Transgenic Plants,第1卷,Engineering andUtilization,S.D.Kung和R.Wu著,Academic Press,1993,15-38页。包含编码淀粉生物合成增强性蛋白质的核酸表达的基因的转基因植物可以以已知的方式从损伤叶或叶切片的转化细胞再生,其中所述基因已经整合进入表达盒中。
通过将表达盒作为插入物整合进入重组载体中,用编码淀粉生物合成增强性蛋白质的核酸SEQ ID NO 1或3转化宿主植物,其中所述重组载体中的载体DNA包含额外的功能调节信号,例如用于复制或整合的序列。适宜的载体尤其描述于Methods in Plant Molecular Biology andBiotechnology(CRC Press),6/7章,71-119页(1993)。
作为实例,植物表达盒可以整合进入具有35s启动子的转化载体pBin-19的衍生物中(Bevan,M.,Nucleic Acids Research128711-8721(1984))。
使用上文引用的重组和克隆技术,可以将表达盒克隆进入适当的载体以便遗传物质例如在大肠杆菌(E.coli.)中的维持和繁殖。适当的载体尤其是pBR322、pUC系列、M13mp系列、pBluescript和pACYC184。特别合适的是能够在大肠杆菌和土壤杆菌中复制的双元载体。
因此本发明进一步涉及上述核酸或上述核酸构建体,特别是表达盒,在制备遗传修饰植物或者在转化植物、植物细胞、植物组织或植物部分中的用途。
用途优选地旨在增加植物、植物块茎或其他部分中淀粉或直链淀粉含量。
用途最优选地旨在增加野生型或转基因马铃薯植物并且特别是野生型或转基因马铃薯植物块茎中淀粉或直链淀粉含量。
相应地,本发明进一步涉及通过将上述核酸或上述核酸构建体引入起始生物体基因组中制备遗传修饰植物的方法。
本发明进一步涉及遗传修饰生物体,与野生型或转基因植物相比所述遗传修饰增加了淀粉生物合成增强性蛋白质活性,并且淀粉生物合成增强性蛋白质包含氨基酸序列SEQ ID NO 2或4或者包含通过氨基酸替代、插入或缺失从该序列衍生并且与序列SEQ ID NO 2或4在氨基酸水平至少50%同一性的序列。
如上面所阐明,优选地通过增加编码淀粉生物合成增强性蛋白质的核酸的基因表达实现与野生型或转基因植物相比淀粉生物合成增强性蛋白质活性的增加。
在进一步优选的实施方案中,如上面所阐明,通过将编码淀粉生物合成增强性蛋白质的核酸引入生物体并且然后通过编码淀粉生物合成增强性蛋白质的核酸的过表达使编码淀粉生物合成增强性蛋白质的核酸的基因表达增加。
此种转基因植物、它们的繁殖材料和它们的植物细胞、植物组织、植物部分或块茎是本发明的进一步主题。
本发明的淀粉或直链淀粉含量增加的并且可以用于人或动物消费的遗传修饰的植物还可以用作食品或饲料或者用作饲料和食品添加剂,例如直接使用或本身已知的加工之后使用。因此遗传修饰植物可以用于生产所述植物的包含淀粉或直链淀粉的提取物和/或用于生产饲料和食物添加剂。
本发明还涉及I.编码SEQ ID NO 1或3多肽的多核苷酸。
II.包含SEQ ID NO 1或3的至少30个连续碱基的多核苷酸。
III.与SEQ ID NO 1或3具有至少60%序列同一性的多核苷酸,其中同一性是基于全部编码序列。
IV.与SEQ ID NO 1或3至少60%序列同一性的多核苷酸,其中序列同一性的百分数是基于全部编码序列的。
V.在严格条件下并且在50℃下2×SSC中洗涤后,与来源于SEQ IDNO 1或3的多核苷酸序列或者基因组序列的杂交探针选择性杂交的多核苷酸。
VI.与V中的多核苷酸互补的多核苷酸。
VII.I的多核苷酸,其中淀粉或直链淀粉生物合成增强多核苷酸来源于马铃薯。
VIII.I的多核苷酸,其编码多肽,该多核苷酸当在植物细胞中过表达后增加淀粉或直链淀粉的含量。
IX.反义方向的I的多核苷酸,其在植物细胞中表达后降低淀粉或直链淀粉的含量。
X.包含至少一个I的多核苷酸的载体。
XI.包含有效连接到启动子的至少一个I的多核苷酸的表达盒,其中该多核苷酸是有义或反义方向。
XII.引入至少一个X的表达盒的宿主细胞。
XIII.XI的宿主细胞,其为植物细胞。
XIV.转基因植物,其包含至少一个XI的表达盒。
XV.XIII的转基因植物,其中植物是马铃薯。
XVI.来源于XIV中的转基因植物的块茎。
XVII.分离的蛋白质,其包含选自下面成员a)包含SEQ ID NO 2或4的至少10个连续氨基酸的多肽,b)多肽,其是植物淀粉生物合成增强性蛋白质,c)包含与SEQ ID NO 2或4至少55%序列同一性的多肽,其中序列同一性基于全部序列并且该多肽具有与淀粉生物合成增强性蛋白质一样的至少一个表位,d)由选自SEQ ID NO 1或3的多核苷酸编码的多肽,e)SEQ ID NO 2或4的多肽。
XVIII.XVII的蛋白质,其中多肽是催化活性的。
XIX.编码XVIII蛋白质的核糖核酸序列。
XX.调节植物中淀粉生物合成增强性蛋白质水平的方法,其包括a)用有效连接启动子的编码淀粉生物合成增强性蛋白质的多核苷酸稳定转化植物细胞,其中该多核苷酸为有义或反义方向,b)在植物生长条件下生长植物细胞以产生能够表达所述多核苷酸一段时间的再生植物,所述时间足够调节植物中淀粉生物合成增强性蛋白质水平。
XXI.XX的方法,其中编码淀粉生物合成增强性蛋白质的多核苷酸选自SEQ-ID NO 1或3。
XXII.XX的方法,其中植物是马铃薯。
XXIII.XX的方法,其中淀粉生物合成增强性蛋白质的活性增加。
XXIV.调节植物中淀粉或直链淀粉水平的方法,其包括a)用有效连接启动子的编码淀粉生物合成增强性蛋白质的多核苷酸稳定转化植物细胞,其中所述多核苷酸为有义或反义方向,b)在植物生长条件下生长植物细胞以产生能够表达多核苷酸一段时间的再生植物,所述时间足够调节植物中淀粉或直链淀粉水平。
XXV.调节植物中淀粉或直链淀粉水平的方法,其包括a)用有效连接启动子的编码淀粉生物合成增强性蛋白质的多核苷酸稳定转化植物细胞,其中所述多核苷酸为有义或反义方向,b)在植物生长条件下生长植物细胞以产生能够表达多核苷酸一段时间的再生植物,所述时间足够调节植物中淀粉或直链淀粉水平。
XXVI.XXIV的方法,其中编码淀粉生物合成增强性蛋白质的多核苷酸选自SEQ ID NO 1或3。
在说明书中进一步使用的一些术语在这里进行定义。
“酶活性/活性测定”术语酶活性描述酶将底物转化成产物的能力。在该上下文中,可以使用酶的天然底物和天然底物的合成的修饰类似物。酶活性可以通过所称作的活性测定通过产物的增加、起始物质的减少、特定辅因子的减少或增加或者至少两种上述参数组合作为所定义的时间段的函数来确定。
本上下文中的“功能等效物”描述为能够在标准条件下与编码淀粉生物合成增强性蛋白质的核酸序列或者编码淀粉生物合成增强性蛋白质的核酸序列的部分杂交并且在细胞或生物体中引起酶活性植物淀粉生物合成增强性蛋白质表达的核酸序列。
使用例如保守区域其他区域的长度为10-50bp,优选地为15-40bp的短寡核苷酸用于杂交是有利的,所述寡核苷酸可以通过技术人员已知的方式与其他相关基因比较确定。备选地,使用本发明核酸的更长的片段或全部序列用于杂交也是可能的。这些标准条件会根据所使用的核酸,即寡核苷酸、更长的片段或全部序列而变化或者根据用于杂交的核酸类型,即DNA或者RNA而变化。因此,例如,DNADNA杂交物的解链温度比相同长度的DNARNA杂交物的解链温度低约10℃。
此外功能等效物还可以理解成为,具体而言,植物淀粉生物合成增强性蛋白质的相关核酸序列的天然或人工突变或者来源于其他生物体的所述核酸序列的同系物,所述突变或所述同系物使得酶活性的植物淀粉生物合成增强性蛋白质可以在细胞或生物体中表达。
因此,本发明的范围还可以扩展到,例如,通过修饰淀粉生物合成增强性蛋白质的核酸序列得到的那些核酸序列。此种修饰的目的可以是,例如,插入其他限制性酶的切割位点、除去多余的DNA或者加入其他序列。通过所述核酸序列编码的蛋白质应该仍然保留着目的功能,尽管所述核酸序列发生改变。
术语功能等效物还指由所讨论核酸序列编码的蛋白质。在该种情况下,术语功能等效物描述这样的蛋白质,其氨基酸序列与淀粉生物合成增强性蛋白质的氨基酸序列具有高达特定百分数的同一性。
因此功能等效物包含文中所述序列的天然发生的品种,还可以是人工的,例如化学合成的适应密码子选择的核酸序列,或从其衍生的氨基酸序列。
通常,可以说独立于所讨论氨基酸序列的功能等效物(由相应核酸序列编码的)在每种情况下具有淀粉生物合成增强性蛋白质的酶活性。
“报告基因”编码容易定量的蛋白质。使用这些基因,可以通过生长、荧光、化学发光、生物发光或抗性测定或通过光度计测量(内在颜色)或酶活性对转化效率或表达位点或时间做出评定。在本上下文中特别优选的为报告蛋白质(Schenborn E,Groskreutz D.Mol.Biotechnol.1999;13(1)29-44),例如“绿色荧光蛋白”(GFP)(Gerdes HH和Kaether C,FEBS Lett.1996;389(1)44-47;Chui WL等,Curr.Biol.1996,6325-330;Leffel SM等,Biotechniques.23(5)912-8,1997)、氯霉素乙酰转移酶、萤光素酶(Giacomin,Plant Sci.1996,11659-72;Scikantha,J.Bact.1996,178121;Millar等,Plant Mol.Biol.Rep.199210324-414)和多种萤光素酶基因,通常β-半乳糖苷酶或β-葡糖醛酸糖苷酶(Jefferson等,EMBO J.1987,6,3901-3907)、Ura3基因、Ilv2基因、2-脱氧葡萄糖-6-磷酸磷酸酶基因、β-内酰胺酶基因、新霉素磷酸转移酶基因、潮霉素磷酸转移酶基因或者BASTA(=gluphosinate)抗性基因。
“显著增加”指酶活性时可以理解为指和不与候选化合物孵育的酶活性相比较与候选化合物孵育的酶活性增加了,该增加位于测量的误差之外。
“底物”底物是由酶以其原始功能识别的并且通过酶催化的反应转变成产物的化合物。
优选地,植物淀粉生物合成增强性蛋白质是由核酸序列编码,该核酸序列包含a)SEQ ID NO 1或3中显示的核酸序列;或者b)核酸序列,其由于遗传密码的简并性可以通过回译由SEQ ID NO2或4所示氨基酸序列推导;或者c)核酸序列,其由于遗传密码的简并性可以通过回译由SEQ ID NO 2或4所示的氨基酸序列功能等效物推导,所述功能等效物与SEQ ID NO 2或4具有至少50%同一性。
在c)中列出的SEQ ID NO 2或4的功能等效物与SEQ ID NO 2或4有着至少50%、51%、52%、53%、54%、55%、56%、57%,优选地至少58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%和70%,更加优选的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%,最优选地至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性。
用所描述的基因构建体转化用于淀粉生产以及具有高直链淀粉含量基因型的马铃薯品种并且在实施例17中用于淀粉生物合成增强性蛋白质的过表达。在马铃薯植物中StGH1或StGH2的过表达会导致与起始植物相比转基因植物的淀粉或直链淀粉含量增加。在转基因品系中淀粉含量的增加可以见表9。当该品系在温室中生长时也表现为增加的收获量(表6)从而导致增加的淀粉产量。
实施例1酵母中的互补研究酵母含有两种自糖基化蛋白质Glg1p和Glg2p,它们产生用于糖原合成起始的引物。对于在酵母中发生的糖原合成,需要任一种基因是有功能的。酵母株CC9包含两种基因的敲除突变,因此关于该特异生物合成功能是无效突变并且因此不能够产生糖原(Cheng,C.等,Molecular and CellularBiology(1995),6632-6640)。CC9用作分离马铃薯基因的互补试验的基础以便通过在CC9菌株中恢复糖原生物合成验证所述基因的功能。将马铃薯基因克隆至酵母质粒pRS414(Stratagene)上,并且在多种酵母控制元件如Gal1、Adh1和Glg2p启动子的控制下进行表达。使用LiCl和电穿孔(Multiporator,Eppendorf)将所得到的质粒转化CC9。通过沉浸在碘溶液中筛选出在恰当培养板上生长的转化酵母菌落。产生糖原的野生型酵母被碘染成棕红色而无效突变株CC9不被染色。当分离的基因补偿酵母糖原蛋白功能并且因此携带预期功能时,表达马铃薯基因StGH1和StGH2的CC9会染成棕红色。
实施例2转化方法将体外繁殖的马铃薯植物的完全伸展的叶子沿对角线切割成2-4片并且在MC-板上于23-24℃下预培养2-3天。
将包含pHS1、pHS2、pHS3、pHS4、pHASHS2,pHASHS4、pHASHS5、pHASHS6、pHASHS7或pHASHS8的根癌农杆菌株LBA4404在恒定摇动(200转/每分钟)条件下于含有100μg利福平和25μg/ml卡那霉素的YEB培养基中于28℃生长过夜。
通过用MS10培养基以1∶20进行稀释来制备用于感染的土壤杆菌培养物。将叶外植体在细菌溶液中感染8-10分钟并且然后在滤纸上放置5-20秒流干液体。将叶片段置于MS300板上在适度光线下于23-24℃下共培养2天。在共培养结束后,将叶片段移到包含400g/l头孢噻肟的M400板上以抑制细菌生长。在4-5天后将外植体移至添加400g/l头孢噻肟的选择培养基MS400上。对于用pHS1和pHS2转化的外植体,在培养基中包含50μM卡那霉素并且对于用pHS3、pHS4、pHASHS2、pHASHS4、pHASHS5、pHASHS6、pHASHS7和pHASHS8转化的外植体,在培养基中添加0.5M咪草啶酸。
将叶片段每两星期转移至新鲜的MS 400选择培养基中。收集再生的认为是转基因的苗并培养在含200g/l头孢噻肟的MS30板上,目的是使苗伸长。
当苗长3-5cm时,切下1-2cm并在黑暗条件下于25℃生长于微型薯(microtuber)培养基中。在2-5周后产生了微型薯。
实施例3转基因植物AM 99-2003例如通过使用针对两种淀粉分支酶淀粉分支酶1(SBE1)和淀粉分支酶2(SBE2)的反义、RNAi或者抗体技术可以产生高直链淀粉马铃薯品系。
高直链淀粉马铃薯品系AM99-2003是通过在亲本品系Dinamo中抑制淀粉分支酶活性产生的。用gbss启动子驱动的反义方向的SBE1和SBE2构建体进行转化。
用SpeI(平端)和XbaI将包含EcoRV和SpeI之间Sbe13’末端1620bp片段的pBluescript切开并与Sbe23’末端的1243bp SstI(平端)和XbaI连接起来。用EcoRV和XbaI切开Sbe2和Sbe1复合体并且连接到用SmaI和XbaI打开的双元载体pHo3.1,见图8。最终的载体命名为pHAbe12A,见图9和核酸序列SEQ ID NO 15。pHo3.1基于具有克隆在pGPTVKan的HindIII位点的987bp gbss启动子和通过SmaI和SstI删除uidA基因的pGPTVKan(Becker,D.等,Plant Molecular Biology 20(1992),1195-1197)。
如实施例2中所描述的用构建体pHAbe12A转化亲本品系Dinamo。
实施例4通过反义技术下调马铃薯中StGH1和StGH2基因通过用相对于植物调节元件反义方向的基因转化在马铃薯中下调StGH1和StGH2基因。将各自反义基因克隆在块茎特异gbss启动子驱动的双元载体中。NptII用作选择标记,其产生对抗生素卡那霉素抗性。对两个品种Prevalent和Producent进行了转化。用50μM卡那霉素对苗进行选择,所述浓度是在马铃薯转化中标准卡那霉素浓度(Ooms,G等,Theoretical and Applied Genetics 73744-750(1987)和Tavazza,R.等,PlantScience 59(1988),175-181)。
实施例5StGH1和StGH2基因在马铃薯中过表达通过块茎特异启动子gbss的驱动的StGH1和StGH2基因在马铃薯中过表达。突变的AHAS基因用作选择标记,其产生对咪草啶酸除草剂的耐受性。对两个马铃薯品种Desiree和AM99-2003进行了转化,其中AM99-2003是与其亲本品系相比淀粉含量降低40%的转基因高直链淀粉品系。
实施例6转基因品系的选择通过PCR筛选方法将非转基因的野生植物鉴定出来并丢弃。根据DNeasy 96植物方法(Qiagen)将DNA提取出来。在96孔微孔板中,向每个孔中加入10-15mg叶组织和一个5mm钢珠,因此每个孔代表一个单独的苗。在匀浆之前将板在N2(液态)中冷冻。在Mixermill300上在30Hz下匀浆1分钟。提取方法结束后用75μl H2O洗脱DNA。
对于成功转化品系的选择,使用nptII和AHAS特异的引物分别扩增出246bp片段和509bp片段。
Npt2_for 5’-AGCAAGGTGAGATGACAGGAGATC-3’Npt2_rev 5’-CAGACAATCGGCTGCTCTGATG-3’AHAS1_frw 5’-AACAACAACATCTTCTTCGATC-3’AHAS1_rev 5’-TAACGAGATTTGTAGCTCCG-3’。
使用提取的DNA的PCR反应物的制备和允许如下反应物10×PCR Mix 2.0μl引物frw(25μM) 0.4μl引物rev(25μM) 0.4μldNTPs(10mM) 0.4μlRedTAQ(Sigma)1.0μl模板(~20ng/μl) 4.0μl
H2O 11.8μlPCR程序94℃30秒59℃30秒×29个循环72℃30秒72℃7分钟8℃维持实施例7基因表达分析用实时PCR(ABI prism 7900HT,Applied Biosystems)分析了转基因马铃薯品系中StGH1和StGH2基因的基因表达水平。使用实时PCR,可以关于RNA表达水平分析基因表达变化。对于pHS1和pHS2转基因品系,测量了StGH1和StGH2的有义和反义RNA的表达,而在pHS3和pHS4转基因品系中分析了StGH1和StGH2mRNA表达的变化。
对于pHS1和pHS2的目标是分别降低StGH1和StGH2的转录水平,而对于pHS3和pHS4的目标是分别增加各自基因的转录水平。
使用Invisorb Spin植物-RNA mini试剂盒(Invitek)从转基因马铃薯品系和母本品种的微型薯分离RNA。使用TaqMan逆转录试剂(AppliedBiosystems)在25μl总反应体积中对250ng总RNA进行逆转录反应。为了将各自基因的内源表达与反义RNA表达区分开,设计了分别且特异的引物(见表1)并用于逆转录反应。
表15μl逆转录反应物与特异序列检测引物、TaqMan MGB探针(见表2)和UMM mastermix(Applied Biosystems)用于一式三份的分析并且根据供应商的说明书用实时PCR进行测定。
表2两种基因的下调导致基因在转基因品系中的表达与其亲本品种相比降低50-95%。
两种基因的过表达导致基因在转基因品系中的表达与其亲本品种相比增加2-10倍。
表3基于实时PCR的基因表达分析实施例8干物质分析对用pHS1、pHS2、pHS3和pHS4转化的转基因品系的微型薯的干物质进行了分析,表现出基因的下调或过表达。由于在马铃薯块茎中淀粉通常占约80%的干物质,所以淀粉含量的增加或降低也会影响干物质的含量。
当每个品系的2个微型薯达到成熟时将它们收获。在60℃下烘干72小时前后对成熟微型薯进行称重计算干物质。为了比较,使用了来自淀粉含量为13-28%(当在田间生长时)的品种Dinamo、Desiree、Prevalent、Producent和P737的微型薯。微型薯的淀粉含量不如田间生长的块茎的淀粉含量高。然而干物质可以容易地进行比较并且数值与所确定的田间生长的块茎的淀粉含量具有很好的相关性。在表4中显示了通过计算10个或以上微型薯得到的不同品种的平均干物质。
表4基于10个或以上微型薯的5个品种的干物质含量到目前为止,对证实基因表达降低的每种pHS1和pHS2的一个进行了干物质分析。与其母本品种相比那两种的干物质降低7和11%。
对于pHS3品系,证实过表达品系的8/9表现为干物质增加高达36%。见表5。
表5在已证实StGH1和StGH2基因下调或过表达的转基因品系中干物质含量实施例9淀粉含量分析为了分析淀粉含量根据供应商的使用说明使用Megazyme InterationalIreland Ltd.,Bray,Co.Wicklow,爱尔兰(AOAC方法996.1;AACC方法76.13;ICC标准方法No.168)的总淀粉测定方法。
对来源于用pHS1、pHS2、pHS3和pHS4转化的所有转基因品系的微型薯分析淀粉含量。当达到成熟时收获微型薯。将成熟微型薯研碎并且用乙醇将麦芽糖(maltosaccharide)和游离的葡萄糖残基洗掉。用DMSO处理微型薯淀粉以确保完全溶解具有高水平抗性淀粉的样品,如高直链淀粉克隆。
用标准的分光光度测定方法分析样品。将转基因品系与已知淀粉含量范围在8%-30%的马铃薯品种进行比较。结果表明与不同转基因品系的遗传修饰相关的淀粉含量的改变。
实施例10温室试验对生长在温室中的pHS3和pHS4转基因品系和其母本品种的收获物重量和干物质含量进行测量。测量了10个温室生长盆中的收获物重量,见表6。
表6过表达StGH1(pHS3)或StGH2(pHS4)的品系的温室收获物重量与母本品种相比转基因品系收获物重量增加达43%。结果表明StGH1和StGH2的过表达导致总收获物重量的增加。
分析了生长在温室中品系的干物质含量。将每个品系的三个块茎的切片用冷冻干燥仪干燥72小时,在干燥前后称重。干物质结果见表7并且表示为三次分析的平均值。
表7生长在田间试验中过表达StGH1(pHS3)或StGH2(pHS4)品系中干物质分析过表达StGH1或StGH2基因的转基因品系的分析表明分别与其亲本品系相比干物质含量增加了。如表7中所见在过表达StGH1基因的品系中干物质增加高达26%。当使用AM99-2003作为亲本品系时干物质的增加更加显著。这是由于作为高直链淀粉性状的结果AM99-2003包含显著量的可用糖这一事实(见图2)。在过表达StGH2的品系中干物质也增加了。当使用AM99-2003作为亲本品系时,在其情况下增加也是较高的。过表达StGH2的品系干物质增加高达10%。
实施例11转基因马铃薯品系的田间试验将在实施例5-10中描述的转基因品系在田间试验中进行测试以确定其相对于亲本品系和用于淀粉生产的其它品种的农学特性。通过几种不同的方法测定了淀粉含量,其是用于淀粉加工的农作物的重要的主要农学因素。
在一桶水中进行块茎的水下称重。根据标准方法测定淀粉含量。使用5kg马铃薯进行测量并且根据式淀粉含量%=(马铃薯密度-1.01506)/0.0046051计算淀粉含量。淀粉含量的增加与样品密度的增加相关。块茎淀粉的增加与干物质含量增加相关,干物质含量可以通过比较组织鲜重和在烤箱中于105℃下烘烤16小时全面排除水分后组织干重来测定。
淀粉含量还可以通过实施例9和12中淀粉含量分析中描述的酶学方法进行测定。
实施例12田间试验结果将过表达StGH1或StGH2的5个品系以插条生长在田间。生长期是六月(June)至九月(September)。收获各品系后分析干物质含量、淀粉含量和糖含量,见表8-10中结果。
通过在鼓风加热烤箱中在105℃干燥15g磨碎的马铃薯(在捣碎机中产生)16-18小时分析干物质含量。在测量前将样品在exicator中冷却至室温。
根据P.man等,Methods in Carbohydrate Chemistry第X卷,1994,111-115页描述的酶学方法使用热稳定α-淀粉酶分析田间生长块茎的淀粉含量。对用乙醇(80%)稀释并且由热稳定α-淀粉酶和淀粉葡糖苷酶消化的磨碎并干燥的块茎样品进行一式两份的分析。通过葡萄糖氧化酶反应测定淀粉的量。
根据Georg Fuchs等,Swedish J.Agric.Res.449-52,1974,Quantitative determination of low-molecular carbohydrates in foods bygas-liquid chromatography中描述的方法测定果糖、葡萄糖和蔗糖的浓度。
表8田间试验生长的过表达StGH1或StGH2品系中干物质含量分析。结果表示为两次分析的平均值。
如在表8中所见,过表达StGH1或StGH2的田间生长的转基因品系表现为干物质增加高达7%。如在表9中可见,各品系还表现为淀粉含量的增加。对于亲本品系为AM99-2003的各品系可见最大增加。这是由于在高直链淀粉亲本品系中可用糖的增加(图2)。
表9通过酶法和重量分析法确定的淀粉含量分析。过表达StGH1(pHS3)或StGH2(pHS4)的品系生长在田间试验中。
此外对使用AM99-2003作为亲本品系的各品系分析了糖浓度。由于高直链淀粉的性状AM99-2003包含高组分的可用糖。在过表达StGH1或StGH2基因的品系中葡萄糖的浓度降低至亲本品系中所分析量的1/3并且蔗糖降低至亲本品系中所分析量的3/4(见表10)。在过表达StGH1或StGH2基因的品系中较低的糖浓度表明更多的葡萄糖和蔗糖掺入到淀粉生物合成中,导致这些转基因品系中淀粉含量的增加。
表10在田间试验中生长的过表达StGH1(pHS3)或StGH2(pHS4)品系的果糖、蔗糖和葡萄糖含量分析。DM=干物质。
实施例13过表达StGH1或StGH2基因品系的微观研究通过用碘(鲁戈溶液(6.7g/l KI+3.3g/l I2)和甘油1∶1)对淀粉染色研究了使用AM99-2003作为亲本的田间生长的过表达StGH1或StGH2基因转基因品系块茎淀粉颗粒的形态。将一片块茎压碎并加入几滴碘溶液。在显微镜下分析淀粉颗粒结构。
如图10中可见,在高直链淀粉亲本品种AM99-2003中淀粉颗粒向颗粒内侧萎陷。与此相对照,过表达StGH1或StGH2基因的转基因品系的淀粉颗粒-见图11和12-更大并且形状为圆形。这是由于过表达StGH1或StGH2基因,在颗粒中增加了淀粉的掺入。
实施例14与淀粉起始相关的基因的组合表达StGH1和StGH2可以以不同的方式组合起来。可以将基因组合到同一个T-DNA上或者位于分开的T-DNA上。基因可以用来进行共转化或者通过转基因品系之间的杂交组合起来。
实施例15用于抑制SBE1和SBE2并且过表达StGH1或StGH2的组合构建体构建体用来产生包含高淀粉含量的高直链淀粉品系。构建体pHASHS2、pHASHS4、pHASHS5和pHASHS6用来过表达StGH1或StGH2。所有的pHASHS构建体还包含be1和be2片段用于使用反义技术或者RNA干扰技术(RNAi)下调各自的基因。SBE1和SBE2基因的下调抑制了支链淀粉的生物合成并且使淀粉生物合成指向增加直链淀粉产生。所有构建体基于双元载体pSUNAHASmodb。RNAi构建体基于载体pHAS8b并且反义构建体基于载体pHAS4b。
用pHASHS2、pHASHS4、pHASHS5或pHASHS6转移的植物产生出高直链淀粉品系。在产生的转基因品系中淀粉含量高于在不过表达StGH1或StGH2基因的高直链淀粉品系中的淀粉含量。淀粉含量与上面所述pHS3和pHS4品系中所见在相同的范围内。
实施例16SBE1和SBE2抑制并且StGH1和StGH2过表达的组合构建体构建体用来产生包含高淀粉含量的高直链淀粉品系。构建pHASHS7和pHASHS8用来在一个植物中一起过表达StGH1和StGH2。所有pHASHS构建体还包含SBE1和SBE2片段以使用反义技术或RNA干扰技术下调各自的基因。SBE1和SBE2基因的下调抑制了支链淀粉的生物合成并且使淀粉生物合成指向增加直链淀粉产生。所有构建体基于双元载体pSUNAHASmodb。RNAi构建体基于载体pHAS8b并且反义构建体基于载体pHAS4b。
用pHASHS7和pHASHS8转化的植物产生高直链淀粉品系。在产生的转基因品系中淀粉含量高于在不同时过表达StGH1和StGH2基因的高直链淀粉品系中的淀粉含量。
实施例17载体构建pSUNAHASmodb的构建构建了基于pSUN1并且使用突变的AHAS基因作为选择标记的双元载体。载体用来进一步克隆性状基因。
用Hind III和BglII将包含nos启动子的608bp片段从pGPTV-kan上切下来并且连接到用HindIII和BamHI切开的pUC19(Invitrogen)上。用SstI和EcoRI将nos终止子(275bp)从pGPTV-kan上切下来并连接到上面的SstI和EcoRI位点之间。通过使用QuikChange多位点定点诱变试剂盒(Stratagene)消除限制位点HindIII、EcoRV、BamHI、EcoRI和SstI来优化Sathasivan等(1991)描述的AHAS基因(S653N)。在所述基因的3’和5’末端加入了额外的限制性位点KpnI和SstI。将所述基因命名为AtAHASmod(图22,SEQ ID NO 16)。用KpnI和SstI切割AtAHASmod(约2019bp)并连接至nos启动子和nos终止子之间的KpnI-SstI位置。用HindIII(补平)和EcoRI从pUC19上切下上面的复合体(2900bp)并连接到pSUN1的EcoRI和SmaI位置。将载体命名为pSUNAHASmodb,见图19。
pHAS8b的构建用于下调分支酶基因的具有be1和be2片段(SEQ ID NO 20)的RNAi构建体pHAS8b构建在双元载体pSUNAHASmodb(图19)中,其中pSUNAHASmodb基于pSUN1并使用突变的AHAS基因(SEQ ID NO 16)作为选择标记。be2启动子片段用作间隔区(SEQ ID NO 18)。载体用来进一步克隆StGH1(SEQ ID NO 1)和StGH2(SEQ ID NO 3)基因。
用HindIII(补平)和SalI切开位于pBluescript上的命名为RNAi420be2be1(SEQ ID NO 19)的400bp的人工合成产生的be2(200bp)和be1(200bp)片段(3331bp)。用BglII(补平)和SalI消化作为间隔区的be2启动子的262bp片段(SEQ ID NO 18)并将其连接到载体上并命名为pMA17。
再次使用400bp的RNAi420be2be1片段并将其以反方向连接到用XhoI(补平)和KpnI切开的pMA17(3582bp)上。构建体命名为pMA18。用SpeI和KpnI消化pMA18(1120bp)并将片段连接到pUC19上gbss启动子和nos终止子之间的XbaI和KpnI(3924bp)位置。将构建体命名为pMA19b。用PvuII和HindIII消化pMA19b(2390bp)并且连接到双元载体pSUNAHASmodb(图19)的SphI(补平)和HindIII之间(8932bp)。将构建体命名为pHAS8b,见图20。
pHAS4b的构建用于下调SBE1和SBE2的具有反义片段的载体pHAS4b构建在双元载体pSUNAHASmodb(图19)中,其中pSUNAHASmodb基于pSUN1并使用突变的AHAS基因(SEQ ID NO 16)作为选择标记。载体用来进一步克隆StGH1和StGH2基因。
用BsrBI和HindIII将be1和be2反义片段与gbss启动子和nos终止子一起从pHAbe12A(图9,SEQ ID NO 15)上切下来(4299bp)并且连接到用SphI(补平)和HindIII消化的pSUNAHASmodb(图19)上(8932bp)。将构建体命名为pHAS4b,见图21。
pHASHS5的构建将StGH1基因、gbss启动子和nos终止子从pHS3(图6)上消化下来并克隆到包含be1和be2片段的RNAi构建体pHAS8b(图20)中。
用DraI和EcoRV将StGH1基因、gbss启动子和nos终止子从pHS3切除(3160bp)。将片段连接到用EcoRV切开的pHAS8b中(11403bp)。将构建体命名为pHASHS5,见图15。
pHASHS6的构建将StGH2基因、gbss启动子和nos终止子从pHS4(图7)上消化下来并克隆到包含be1和be2片段的RNAi构建体pHAS8b(图20)上。
用SpeI和EcoRI消化pHS4。将两种片段2486bp EcoRI-EcoRI片段和1169bp SpeI-EcoRI片段收集起来用于进一步克隆。用SpeI和EcoRI消化pBluescript。将消化的pBluescript与1169bp(SpeI-EcoRI)片段进行连接。将构建体命名为pMA15。
用EcoRI消化pMA15(4127bp)并连接到来源于pHS4的2486bpEcoRI-EcoRI片段。将构建体命名为pMA16。将从pMA16切下的3689bp片段用EcoRV消化并连接到用EvoRV切开的pHAS8b(11403bp)上。将构建体命名为pHASHS6,见图16。
pHASHS2的构建将StGH1基因、gbss启动子和nos终止子从pHS3(图6)上消化下来并克隆到包含be1和be2反义片段的pHAS4b(图21)中。
用DraI和EcoRV消化pHS3(3160bp)并且连接到用EcoRV切开的pHAS4b(13224bp)中。将构建体命名为pHASHS2,见图13。
pHASHS4的构建将StGH2基因、gbss启动子和nos终止子从pHS4(图7)上消化下来并克隆到包含be1和be2反义片段的pHAS4b(图21)中。
用EcoRV从pMA16(6613bp)上消化下3689bp的片段(至于pMA16见pHASHS3的构建策略)。用EvoRV消化pHAS4b(13224bp)并与上面的片段进行连接。将构建体命名为pHASHS4,见图14。
pHASHS7的构建将pHASHS7设计成包含抑制各个基因的be1和be2反义片段以及两种增强直链淀粉生物合成的基因StGH1和StGH2。
用EcoRV消化pMA16(至于pMA16见pHASHS3的构建策略)。将所得到的3649bp片段连接到用PstI(补平)切开的pHASHS2(图5)上。将构建体命名为pHASHS7,见图17。
pHASHS8的构建将pHASHS8设计成包含使用RNAi(SEQ ID NO 19到22)抑制各自基因并通过间隔区(SEQ ID NO 18或23)连接的be1和be2片段以及两种增强直链淀粉生物合成的基因StGH1和StGH2。
用Ec0RV消化pMA16(至于pMA16见pHASHS3的构建策略)并连接到用PstI切开并补平的pHASHS5上(图15)。将构建体命名为pHASHS8,见图18。
实施例18马铃薯的增加的固体和改善的加工质量另一方面,本发明可以用来增加用作加工马铃薯产品或作为食用马铃薯品种的马铃薯品种固体含量。用如上所述基因构建体转化马铃薯基因型以使编码淀粉生物合成增强性蛋白质的基因过表达。该种淀粉生物合成增强性蛋白质可以来源于上述基因或者包含相同功能结构域的其他植物基因。
在马铃薯植物中StGH1和/或StGH2基因的过表达导致如在表7和8中所见的固体增加。
序列表<110>巴斯福植物科学有限公司<120>增强植物中直链淀粉产量<130>AE884-02<140>PF0000054331<141>2003-03-07<160>24<170>PatentIn版本2.1<210>1<211>2084<212>DNA<213>马铃薯(Solanum tuberosum)<220>
<221>CDS<222>(302)..(1696)<400>1ttttcataaa cttcttcaac tttattccat actcttttat ttatcagctc ctagatcttc 60ttttttgttt gttgatattc tcttgaaaat tgttcagtga agagttgatc aaagctaaga 120cacaggggct gcggccattt tttcaccgga atcttcttct ttattttccg gtgaaagttt 180gaacgcacac cgttatttct agacagtaga caatgtcaag tgaaaaacat cacaagtttt 240tgaagatttg taattaatta gttgagattt ttaatttgga ggaaagagaa aaacagagaa 300g atg ata ggg cgg gtg ggc ttg ttg ttg gta ttg ttg ata gca acg acg 349Met Ile Gly Arg Val Gly Leu Leu Leu Val Leu Leu Ile Ala Thr Thr1 5 10 15gtg act att ggg gct gaa acg acg acg tta aaa ggg gta aac aga aat 397Val Thr Ile Gly Ala Glu Thr Thr Thr Leu Lys Gly Val Asn Arg Asn20 25 30gcg tat gcg act atg atg tat atg gga act ccg aga gac tac gag ttc 445Ala Tyr Ala Thr Met Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe35 40 45tac gtg gcg act cga gta atg ctc cga tca ctt acc cgg cta gga gtt 493Tyr Val Ala Thr Arg Val Met Leu Arg Ser Leu Thr Arg Leu Gly Val50 55 60gaa gcc gat ctc gtc gtt att gct tca ctt gac gtt cct ctt cgc tgg 541Glu Ala Asp Leu Val Val Ile Ala Ser Leu Asp Val Pro Leu Arg Trp65 70 75 80gtt caa act cta gaa cag gaa gat ggt gct aag gtg gtg aga gtt aaa 589Val Gln Thr Leu Glu Gln Glu Asp Gly Ala Lys Val Val Arg Val Lys85 90 95
aat ctg aac aat ccg tat tgt atc aac cct aat tgg aga ttc aag ctc 637Asn Leu Asn Asn Pro Tyr Cys Ile Asn Pro Asn Trp Arg Phe Lys Leu100 105 110aca ctg aac aaa ctt tat gcg tgg agc ctc gta aat tat gac agg gtt 685Thr Leu Asn Lys Leu Tyr Ala Trp Ser Leu Val Asn Tyr Asp Arg Val115 120 125gtc atg ctt gat gct gac aac ctt ttc ctc cag aaa act gat gaa ctg 733Val Met Leu Asp Ala Asp Asn Leu Phe Leu Gln Lys Thr Asp Glu Leu130 135 140ttc caa tgt ggc cag ttt tgt gct gtc ttc att aat ccc tgc atc ttc 781Phe Gln Cys Gly Gln Phe Cys Ala Val Phe Ile Asn Pro Cys Ile Phe145 150 155 160cac act ggt ctc ttt gta ttg cag cca tca aaa aag gtg ttc aat gac 829His Thr Gly Leu Phe Val Leu Gln Pro Ser Lys Lys Val Phe Asn Asp165 170 175atg atc cat gag ata gag att ggg agg gaa aat caa gac ggt gca gac 877Met Ile His Glu Ile Glu Ile Gly Arg Glu Asn Gln Asp Gly Ala Asp180 185 190caa ggt ttt att gga ggc cac ttc cca gat tta ctt gat cgg cca atg 925Gln Gly Phe Ile Gly Gly His Phe Pro Asp Leu Leu Asp Arg Pro Met195 200 205ttc cac cct cct ctt aat ggt acc cag ctc cag gga agt tac agg ctt 973Phe His Pro Pro Leu Asn Gly Thr Gln Leu Gln Gly Ser Tyr Arg Leu210 215 220cct cta gga tac caa atg gac gcc tct tat tat tat ctc aaa ctc cat 1021Pro Leu Gly Tyr Gln Met Asp Ala Ser Tyr Tyr Tyr Leu Lys Leu His225 230 235 240tgg tcg gta cct tgt gga cct aat agt gtc att aca ttt cct ggt gct 1069Trp Ser Val Pro Cys Gly Pro Asn Ser Val Ile Thr Phe Pro Gly Ala245 250 255cca tgg tta aaa cca tgg tat tgg tgg tca tgg cct gtc tta ccc ttg 1117Pro Trp Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro Leu260 265 270ggc atc cag tgg cat gaa cag cga cgt cta act gtt ggg tat ggt gct 1165Gly Ile Gln Trp His Glu Gln Arg Arg Leu Thr Val Gly Tyr Gly Ala275 280 285gag atg ata gca gtg ttg atc caa tct ata ttt tac cta gga ata att 1213Glu Met Ile Ala Val Leu Ile Gln Ser Ile Phe Tyr Leu Gly Ile Ile290 295 300gca gtg aca cgc cta gca cgc cca aat tta tca aag ttg tgc tat cgc 1261Ala Val Thr Arg Leu Ala Arg Pro Asn Leu Ser Lys Leu Cys Tyr Arg305 310 315 320cat gat gat agc aag agt gcc ttc tta cta cga act ggc ctt aaa ttg 1309His Asp Asp Ser Lys Ser Ala Phe Leu Leu Arg Thr Gly Leu Lys Leu325 330 335att gct ata tgg tcc att ctt gct gcc tac aca gtt cct tat ttc gtg 1357
Ile Ala Ile Trp Ser Ile Leu Ala Ala Tyr Thr Val Pro Tyr Phe Val340 345 350att cct tgt aca gtt cat cca cta gtt ggc tgg agt ctc tac tta ctc 1405Ile Pro Cys Thr Val His Pro Leu Val Gly Trp Ser Leu Tyr Leu Leu355 360 365ggc tct ttt tca cta tcc tgt ata aca gtg aat gca ttt ctt ttg ccg 1453Gly Ser Phe Ser Leu Ser Cys Ile Thr Val Asn Ala Phe Leu Leu Pro370 375 380atg cta cct gtt tta gtc cca tgg att ggg atc ctt ggg gcc ctt ttg 1501Met Leu Pro Val Leu Val Pro Trp Ile Gly Ile Leu Gly Ala Leu Leu385 390 395 400gtg atg gct tac cct tgg tac aac gac ggt gtt gta aga gca atg gct 1549Val Met Ala Tyr Pro Trp Tyr Asn Asp Gly Val Val Arg Ala Met Ala405 410 415gta ttt aca tac gcc ttc tgt gct tct cca gca tta tgg atg gca ttg 1597Val Phe Thr Tyr Ala Phe Cys Ala Ser Pro Ala Leu Trp Met Ala Leu420 425 430gtt aaa atc aag tgt tct ctt cat gtt tca ctt gag agg gaa gga ttc 1645Val Lys Ile Lys Cys Ser Leu His Val Ser Leu Glu Arg Glu Gly phe435 440 445ttg ccc aag ata agt gaa tct aca gca cct gct ggt tct aac aaa ctg 1693Leu Pro Lys Ile Ser Glu Ser Thr Ala Pro Ala Gly Ser Asn Lys Leu450 455 460tat tgaaagttga aaagttaaag gaatcaacag gagaactaat gcttcagaaa 1746Tyr465catctccaaa cgttttgctt aggagacttg gagtctgctt gtgctatcct agctagttgc1806ttcagtctgt gctcttaatt agaatggaat tctgtgagtg ggtttagaat tgggaggatg1866ttttgtgttg tacatggact atctctggtc tcttgaatgc tactccagga aaaagattgt1926ttctcactta attttttctg ttactaaatt gtatgtggaa taggttcttt aaaatttatt1986catggattta tgttatgtat gctaacagtg taaatattaa gtcctggtga aataagtaat2046tccttattca tacaaaaaaa aaaaaaaaaa aaaaaaaa2084<210>2<211>465<212>PRT<213>马铃薯<400>2Met Ile Gly Arg Val Gly Leu Leu Leu Val Leu Leu Ile Ala Thr Thr1 5 10 15Val Thr Ile Gly Ala Glu Thr Thr Thr Leu Lys Gly Val Asn Arg Asn20 25 30Ala Tyr Ala Thr Met Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe
35 40 45Tyr Val Ala Thr Arg Val Met Leu Arg Ser Leu Thr Arg Leu Gly Val50 55 60Glu Ala Asp Leu Val Val Ile Ala Ser Leu Asp Val Pro Leu Arg Trp65 70 75 80Val Gln Thr Leu Glu Gln Glu Asp Gly Ala Lys Val Val Arg Val Lys85 90 95Asn Leu Asn Asn Pro Tyr Cys Ile Asn Pro Asn Trp Arg Phe Lys Leu100 105 110Thr Leu Asn Lys Leu Tyr Ala Trp Ser Leu Val Asn Tyr Asp Arg Val115 120 125Val Met Leu Asp Ala Asp Asn Leu Phe Leu Gln Lys Thr Asp Glu Leu130 135 140Phe Gln Cys Gly Gln Phe Cys Ala Val Phe Ile Asn Pro Cys Ile Phe145 150 155 160His Thr Gly Leu Phe Val Leu Gln Pro Ser Lys Lys Val Phe Asn Asp165 170 175Met Ile His Glu Ile Glu Ile Gly Arg Glu Asn Gln Asp Gly Ala Asp180 185 190Gln Gly Phe Ile Gly Gly His Phe Pro Asp Leu Leu Asp Arg Pro Met195 200 205Phe His Pro Pro Leu Asn Gly Thr Gln Leu Gln Gly Ser Tyr Arg Leu210 215 220Pro Leu Gly Tyr Gln Met Asp Ala Ser Tyr Tyr Tyr Leu Lys Leu His225 230 235 240Trp Ser Val Pro Cys Gly Pro Asn Ser Val Ile Thr Phe Pro Gly Ala245 250 255Pro Trp Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro Leu260 265 270Gly Ile Gln Trp His Glu Gln Arg Arg Leu Thr Val Gly Tyr Gly Ala275 280 285Glu Met Ile Ala Val Leu Ile Gln Ser Ile Phe Tyr Leu Gly Ile Ile290 295 300Ala Val Thr Arg Leu Ala Arg Pro Asn Leu Ser Lys Leu Cys Tyr Arg305 310 315 320His Asp Asp Ser Lys Ser Ala Phe Leu Leu Arg Thr Gly Leu Lys Leu325 330 335Ile Ala Ile Trp Ser Ile Leu Ala Ala Tyr Thr Val Pro Tyr Phe Val340 345 350Ile Pro Cys Thr Val His Pro Leu Val Gly Trp Ser Leu Tyr Leu Leu355 360 365
Gly Ser Phe Ser Leu Ser Cys Ile Thr Val Asn Ala Phe Leu Leu Pro370 375 380Met Leu Pro Val Leu Val Pro Trp Ile Gly Ile Leu Gly Ala Leu Leu385 390 395 400Val Met Ala Tyr Pro Trp Tyr Asn Asp Gly Val Val Arg Ala Met Ala405 410 415Val Phe Thr Tyr Ala Phe Cys Ala Ser Pro Ala Leu Trp Met Ala Leu420 425 430Val Lys Ile Lys Cys Ser Leu His Val Ser Leu Glu Arg Glu Gly Phe435 440 445Leu Pro Lys Ile Ser Glu Ser Thr Ala Pro Ala Gly Ser Asn Lys Leu450 455 460Tyr465<210>3<211>2230<212>DNA<213>马铃薯<220>
<221>CDS<222>(143)..(2086)<400>3tatccccaga gaatcagctg aatcaagaac tgatttttag attatgtttt cttgattctt 60tgaaatggga acttgatttt cagtttttca actcagatgt tgtgttcctt tagctggaaa 120acttgaaaaa ggaaagccca ga atg aga gga agt tta gct ggt gga cca cct 172Met Arg Gly Ser Leu Ala Gly Gly Pro Pro1 5 10agt cct att gaa cct aga cag agg ctt tct gta ttc act gag gaa aca 220Ser Pro Ile Glu Pro Arg Gln Arg Leu Ser Val Phe Thr Glu Glu Thr15 20 25agc aaa aga agg ttc ttg aga agt aaa gtt ttc aga gat ggg gag aga 268Ser Lys Arg Arg Phe Leu Arg Ser Lys Val Phe Arg Asp Gly Glu Arg30 35 40gct ctt cat agt ccc acc aaa aac agg aat ttt acc tgc aag ttc cca 316Ala Leu His Ser Pro Thr Lys Asn Arg Asn Phe Thr Cys Lys Phe Pro45 50 55act gtg aag ctt ata ttg ggt gtt att gct ctg gtt gca att tgg tca 364Thr Val Lys Leu Ile Leu Gly Val Ile Ala Leu Val Ala Ile Trp Ser60 65 70ctc tgg cat tct cca gca att tat aac acg gaa tac ata tct agt tca 412Leu Trp His Ser Pro Ala Ile Tyr Asn Thr Glu Tyr Ile Ser Ser Ser75 80 85 90
ggc tct cgg gct gct ttg atg cac aga gag tta agt ggt cat tct tca 460Gly Ser Arg Ala Ala Leu Met His Arg Glu Leu Ser Gly His Ser Ser95 100 105gct gat caa cgt tat aca tca ctt tta gat att gac tgg gac caa att 508Ala Asp Gln Arg Tyr Thr Ser Leu Leu Asp Ile Asp Trp Asp Gln Ile110 115 120tcc caa gtt att gag aaa ctg gcc gat agg cat gag tat cag ggc gta 556Ser Gln Val Ile Glu Lys Leu Ala Asp Arg His Glu Tyr Gln Gly Val125 130 135ggg ata tta aac ttc aat gac agt gaa att gat cag ttg aag gag tta 604Gly Ile Leu Asn Phe Asn Asp Ser Glu Ile Asp Gln Leu Lys Glu Leu140 145 150cta ccg gac gct gag cat gta atc ttg aac ctg gat cac gtc ccg aat 652Leu Pro Asp Ala Glu His Val Ile Leu Asn Leu Asp His Val Pro Asn155 160 165 170aat ata aca tgg gaa aca ata tat cct gaa tgg ata gat gaa gaa gaa 700Asn Ile Thr Trp Glu Thr Ile Tyr Pro Glu Trp Ile Asp Glu Glu Glu175 180 185gaa ttt gag gtc ccc act tgt cct tct ctg ccc aaa att cag ttt ccg 748Glu Phe Glu Val Pro Thr Cys Pro Ser Leu Pro Lys Ile Gln Phe Pro190 195 200ggt aaa cca agg att gat ctc ata gtt gta aag ctt cca tgc aag aag 796Gly Lys Pro Arg Ile Asp Leu Ile Val Val Lys Leu Pro Cys Lys Lys205 210 215tct aag gac tgg tat aga gat gta gct cgt ttt cac ttg cag ctg gca 844Ser Lys Asp Trp Tyr Arg Asp Val Ala Arg Phe His Leu Gln Leu Ala220 225 230gca gca agg ctg gct gcc agt aat aaa ggg tat cat cca ata cat gtg 892Ala Ala Arg Leu Ala Ala Ser Asn Lys Gly Tyr His Pro Ile His Val235 240 245 250ctt ctg gtt act gag cat ttc cca acc ccc aat ctg ttc acc tgt aaa 940Leu Leu Val Thr Glu His Phe Pro Thr Pro Asn Leu Phe Thr Cys Lys255 260 265gag tta gtt gta cgt gaa ggc aat gca tgg cta tat gaa cct aat ctg 988Glu Leu Val Val Arg Glu Gly Asn Ala Trp Leu Tyr Glu Pro Asn Leu270 275 280aac act tta aga gag aag ctc cac ctc cct gtt ggg tca tgt gaa ctt 1036Asn Thr Leu Arg Glu Lys Leu His Leu Pro Val Gly Ser Cys Glu Leu285 290 295gca gtt cct ctc aag gct aaa gca aat tgg cac tct gga aat gta aga 1084Ala Val Pro Leu Lys Ala Lys Ala Asn Trp His Ser Gly Asn Val Arg300 30 5310cga gaa gcc tat gca act att ctc cac tca gca aat ttt tat gta tgt 1132Arg Glu Ala Tyr Ala Thr Ile Leu His Ser Ala Asn Phe Tyr Val Cys315 320 325 330
gga gcc ata gct gca gca cag agt att cgc ttg gca ggt tca acc cga 1180Gly Ala Ile Ala Ala Ala Gln Ser Ile Arg Leu Ala Gly Ser Thr Arg335 340 345gat ctt gtg ata ctt gtt gat gag act atc agt gac tac cac agg ggt 1228Asp Leu Val Ile Leu Val Asp Glu Thr Ile Ser Asp Tyr His Arg Gly350 355 360ggt tta gag gct gcc gga tgg aag atc cac acg ata aag aga ata agg 1276Gly Leu Glu Ala Ala Gly Trp Lys Ile His Thr Ile Lys Arg Ile Arg365 370 375aat cct aaa gct gaa cag gat gcc tac aat gag tgg aac tat agc aaa 1324Asn Pro Lys Ala Glu Gln Asp Ala Tyr Asn Glu Trp Asn Tyr Ser Lys380 385 390ttt cgt ctc tgg cag ctg aca gat tat gac aaa atc atc ttc att gat 1372Phe Arg Leu Trp Gln Leu Thr Asp Tyr Asp Lys Ile Ile Phe Ile Asp395 400 405 410gcg gat ttg ttg ata ctg aga aat att gat ttt ctc ttt gag atg cct 1420Ala Asp Leu Leu Ile Leu Arg Asn Ile Asp Phe Leu Phe Glu Met Pro415 420 425gaa ata act gca ata gga aat aat gca acc ctt ttt aat tca ggc gtg 1468Glu Ile Thr Ala Ile Gly Asn Asn Ala Thr Leu Phe Asn Ser Gly Val430 435 440atg gtc gtt gaa cca tca aat tgc aca ttt cag ctg ttg atg gat cat 1516Met Val Val Glu Pro Ser Asn Cys Thr Phe Gln Leu Leu Met Asp His445 450 455atc aat gag att gaa tca tac aat ggt ggg gat cag ggg tat ttg aac 1564Ile Asn Glu Ile Glu Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn460 465 470gaa ata ttc acc tgg tgg cat agg atc cca aaa cac atg aac ttt ttg 1612Glu Ile Phe Thr Trp Trp His Arg Ile Pro Lys His Met Asn Phe Leu475 480 485 490aaa cat tat tgg gaa ggt gat gag gag gag aag aag caa atg aaa aca 1660Lys His Tyr Trp Glu Gly Asp Glu Glu Glu Lys Lys Gln Met Lys Thr495 500 505cgt ctt ttt ggt gct gat cct cca gtt ctc tat gtt ctg cac tac tta 1708Arg Leu Phe Gly Ala Asp Pro Pro Val Leu Tyr Val Leu His Tyr Leu510 515 520ggc ctg aaa cct tgg tta tgc ttc agg gac tac gat tgc aac tgg aat 1756Gly Leu Lys Pro Trp Leu Cys Phe Arg Asp Tyr Asp Cys Asn Trp Asn525 530 535gtg ggt aag ttg cag gag ttt gca agt gat gtg gca cac agg acg tgg 1804Val Gly Lys Leu Gln Glu Phe Ala Ser Asp Val Ala His Arg Thr Trp540 545 550tgg aag gtc cat gat gcc atg cca gat aac tta cat aaa tat tgt ttg 1852Trp Lys Val His Asp Ala Met Pro Asp Asn Leu His Lys Tyr Cys Leu555 560 565 570ctt agg tct aaa cag aag gct gca cta gag tgg gat cga aga gaa gct 1900
Leu Arg Ser Lys Gln Lys Ala Ala Leu Glu Trp Asp Arg Arg Glu Ala575 580 585gag aaa gct aac ttt tca gat ggt cat tgg aag atc aaa ata aag gac 1948Glu Lys Ala Asn Phe Ser Asp Gly His Trp Lys Ile Lys Ile Lys Asp590 595 600cca cgt ttg gag act tgt tat gaa gaa ttt tgc ttc tgg gaa agc atg 1996Pro Arg Leu Glu Thr Cys Tyr Glu Glu Phe Cys Phe Trp Glu Ser Met605 610 615tta tgg cac tgg ggt gaa aca aac tgg aca gat aat gcc acc tct tca 2044Leu Trp His Trp Gly Glu Thr Asn Trp Thr Asp Asn Ala Thr Ser Ser620 625 630cca aca cct ccc atg gtc aat act gct tca ctt tct tct ttg 2086Pro Thr Pro Pro Met Val Asn Thr Ala Ser Leu Ser Ser Leu635 640 645taactaggag gttctgttac tatacctcgc tagtctgtaa gtaatacaga gtcacaactt2146gaatgtcaac cagtgccatt agtatacatg gtgtcaacac tttccccacc cttgaaaaaa2206aaaaaaaaaa aaaaaaaaaa aaaa 2230<210>4<211>648<212>PRT<213>马铃薯<400>4Met Arg Gly Ser Leu Ala Gly Gly Pro Pro Ser Pro Ile Glu Pro Arg1 5 10 15Gln Arg Leu Ser Val Phe Thr Glu Glu Thr Ser Lys Arg Arg Phe Leu20 25 30Arg Ser Lys Val Phe Arg Asp Gly Glu Arg Ala Leu His Ser Pro Thr35 40 45Lys Asn Arg Asn Phe Thr Cys Lys Phe Pro Thr Val Lys Leu Ile Leu50 55 60Gly Val Ile Ala Leu Val Ala Ile Trp Ser Leu Trp His Ser Pro Ala65 70 75 80Ile Tyr Asn Thr Glu Tyr Ile Ser Ser Ser Gly Ser Arg Ala Ala Leu85 90 95Met His Arg Glu Leu Ser Gly His Ser Ser Ala Asp Gln Arg Tyr Thr100 105 110Ser Leu Leu Asp Ile Asp Trp Asp Gln Ile Ser Gln Val Ile Glu Lys115 120 125Leu Ala Asp Arg His Glu Tyr Gln Gly Val Gly Ile Leu Asn Phe Asn130 135 140Asp Ser Glu Ile Asp Gln Leu Lys Glu Leu Leu Pro Asp Ala Glu His145 150 155 160
Val Ile Leu Asn Leu Asp His Val Pro Asn Asn Ile Thr Trp Glu Thr165 170 175Ile Tyr Pro Glu Trp Ile Asp Glu Glu Glu Glu Phe Glu Val Pro Thr180 185 190Cys Pro Ser Leu Pro Lys Ile Gln Phe Pro Gly Lys Pro Arg Ile Asp195 200 205Leu Ile Val Val Lys Leu Pro Cys Lys Lys Ser Lys Asp Trp Tyr Arg210 215 220Asp Val Ala Arg Phe His Leu Gln Leu Ala Ala Ala Arg Leu Ala Ala225 230 235 240Ser Asn Lys Gly Tyr His Pro Ile His Val Leu Leu Val Thr Glu His245 250 255Phe Pro Thr Pro Asn Leu Phe Thr Cys Lys Glu Leu Val Val Arg Glu260 265 270Gly Asn Ala Trp Leu Tyr Glu Pro Asn Leu Asn Thr Leu Arg Glu Lys275 280 285Leu His Leu Pro Val Gly Ser Cys Glu Leu Ala Val Pro Leu Lys Ala290 295 300Lys Ala Asn Trp His Ser Gly Asn Val Arg Arg Glu Ala Tyr Ala Thr305 310 315 320Ile Leu His Ser Ala Asn Phe Tyr Val Cys Gly Ala Ile Ala Ala Ala325 330 335Gln Ser Ile Arg Leu Ala Gly Ser Thr Arg Asp Leu Val Ile Leu Val340 345 350Asp Glu Thr Ile Ser Asp Tyr His Arg Gly Gly Leu Glu Ala Ala Gly355 360 365Trp Lys Ile His Thr Ile Lys Arg Ile Arg Asn Pro Lys Ala Glu Gln370 375 380Asp Ala Tyr Asn Glu Trp Asn Tyr Ser Lys Phe Arg Leu Trp Gln Leu385 390 395 400Thr Asp Tyr Asp Lys Ile Ile Phe Ile Asp Ala Asp Leu Leu Ile Leu405 410 415Arg Asn Ile Asp Phe Leu Phe Glu Met Pro Glu Ile Thr Ala Ile Gly420 425 430Asn Asn Ala Thr Leu Phe Asn Ser Gly Val Met Val Val Glu Pro Ser435 440 445Asn Cys Thr Phe Gln Leu Leu Met Asp His Ile Asn Glu Ile Glu Ser450 455 460Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn Glu Ile Phe Thr Trp Trp465 470 475 480
His Arg Ile Pro Lys His Met Asn Phe Leu Lys His Tyr Trp Glu Gly485 490 495Asp Glu Glu Glu Lys Lys Gln Met Lys Thr Arg Leu Phe Gly Ala Asp500 505 510Pro Pro Val Leu Tyr Val Leu His Tyr Leu Gly Leu Lys Pro Trp Leu515 520 525Cys Phe Arg Asp Tyr Asp Cys Asn Trp Asn Val Gly Lys Leu Gln Glu530 535 540Phe Ala Ser Asp Val Ala His Arg Thr Trp Trp Lys Val His Asp Ala545 550 555 560Met Pro Asp Asn Leu His Lys Tyr Cys Leu Leu Arg Ser Lys Gln Lys565 570 575Ala Ala Leu Glu Trp Asp Arg Arg Glu Ala Glu Lys Ala Asn Phe Ser580 585 590Asp Gly His Trp Lys Ile Lys Ile Lys Asp Pro Arg Leu Glu Thr Cys595 600 605Tyr Glu Glu Phe Cys Phe Trp Glu Ser Met Leu Trp His Trp Gly Glu610 615 620Thr Asn Trp Thr Asp Asn Ala Thr Ser Ser Pro Thr Pro Pro Met Val625 630 635 640Asn Thr Ala Ser Leu Ser Ser Leu645<210>5<211>1485<212>DNA<213>拟南芥(Arabidopsis thaliana)<220>
<221>CDS<222>(1)..(1485)<400>5atg gat tta caa aga act ttg atg ttc tct tgt tgg gtt ctg tct ctt48Met Asp Leu Gln Arg Thr Leu Met Phe Ser Cys Trp Val Leu Ser Leu1 5 10 15ttg atc atc aaa acg aca gcg tat aac gag aaa cag ctg ttc cag ccg96Leu Ile Ile Lys Thr Thr Ala Tyr Asn Glu Lys Gln Leu Phe Gln Pro20 25 30ctt gaa acg gaa aac gca aac gcg atg acc gcg gtt atg gag cga gga 144Leu Glu Thr Glu Asn Ala Asn Ala Met Thr Ala Val Met Glu Arg Gly35 40 45tta aag acg cag cgg cgg ccg gag cac aag aac gct tat gcg acg atg 192Leu Lys Thr Gln Arg Arg Pro Glu His Lys Asn Ala Tyr Ala Thr Met50 55 60
atg tac atg gga aca cca aga gac tac gag ttc tac gtt gcg aca cgt 240Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe Tyr Val Ala Thr Arg65 70 75 80gtc ttg atc aga tcg ctt aag agt ctc cac gtg gac gct gat atc gtc 288Val Leu Ile Arg Ser Leu Lys Ser Leu His Val Asp Ala Asp Ile Val85 90 95gtt ata gcc tcc ctc gac gtt cct atc aac tgg att cac gct ctg gaa 336Val Ile Ala Ser Leu Asp Val Pro Ile Asn Trp Ile His Ala Leu Glu100 105 110gaa gaa gat gga gct aaa gta gtg aga gta gag aat ctt gag aat cca 384Glu Glu Asp Gly Ala Lys Val Val Arg Val Glu Asn Leu Glu Asn Pro115 120 125tac aag aaa caa acc aac ttc gac aac aga ttc aag ctt agt cta aac 432Tyr Lys Lys Gln Thr Asn Phe Asp Asn Arg Phe Lys Leu Ser Leu Asn130 135 140aag ctc tac gct tgg tct ctc tct gat tat gac cgt gtt gta atg ctt 480Lys Leu Tyr Ala Trp Ser Leu Ser Asp Tyr Asp Arg Val Val Met Leu145 150 155 160gat gtc gac aat ctc ttt ctc aag aac acc gac gag ctc ttc cag tgt 528Asp Val Asp Asn Leu Phe Leu Lys Asn Thr Asp Glu Leu Phe Gln Cys165 170 175ggc caa ttt tgt gct gtc ttc atc aac cct tgc atc ttc cac act ggt 576Gly Gln Phe Cys Ala Val Phe Ile Asn Pro Cys Ile Phe His Thr Gly180 185 190ctc ttt gtg ttg cag cca tca atg gag gtc ttt aga gac atg ctt cat 624Leu Phe Val Leu Gln Pro Ser Met Glu Val Phe Arg Asp Met Leu His195 200 205gag ctt gaa gta aag aga gat aac cct gat gga gct gat caa ggc ttt 672Glu Leu Glu Val Lys Arg Asp Asn Pro Asp Gly Ala Asp Gln Gly Phe210 215 220ctt gtc agc tac ttc tct gat tta ctc aat cag cct ctc ttt cgt cct 720Leu Val Ser Tyr Phe Ser Asp Leu Leu Asn Gln Pro Leu Phe Arg Pro225 230 235 240cct ccc gat aac cgc acc gcg ctt aag gga cat ttt agg ctt cct ttg 768Pro Pro Asp Asn Arg Thr Ala Leu Lys Gly His Phe Arg Leu Pro Leu245 250 255gga tat caa atg gac gca tct tat tac tac ctt aag ctc aga tgg aac 816Gly Tyr Gln Met Asp Ala Ser Tyr Tyr Tyr Leu Lys Leu Arg Trp Asn260 265 270gta cca tgt gga cca aac agt gtg ata acg ttc cca gga gca gta tgg 864Val Pro Cys Gly Pro Asn Ser Val Ile Thr Phe Pro Gly Ala Val Trp275 280 285tta aag cca tgg tat tgg tgg tca tgg cct gtt ctt cct tta ggc ctt 912Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro Leu Gly Leu290 295 300tca tgg cac cac caa cgc cgc tac acg att agt tat tca gca gag atg 960
Ser Trp His His Gln Arg Arg Tyr Thr Ile Ser Tyr Ser Ala Glu Met305 310 315 320cct tgg gtc cta acc caa gca gtg ttc tac cta gga att ata cta gtc 1008Pro Trp Val Leu Thr Gln Ala Val Phe Tyr Leu Gly Ile Ile Leu Val325 330 335aca cgt cta gcg cgt ccc aac atg acc aag cta tgt tac cga cgt tct 1056Thr Arg Leu Ala Arg Pro Asn Met Thr Lys Leu Cys Tyr Arg Arg Ser340 345 350gat aag aat cta agc atg atc cag aca gct ttc aag ttt gtt gca ctc 1104Asp Lys Asn Leu Ser Met Ile Gln Thr Ala Phe Lys Phe Val Ala Leu355 360 365ctc ttt atc ctc tca gcc tac att ata cca ttc ttc atc atc cca cag 1152Leu Phe Ile Leu Ser Ala Tyr Ile Ile Pro Phe Phe Ile Ile Pro Gln370 375 380acg atc cac ccg ctc att ggt tgg tct ctc tac tta acc ggc tcc ttt 1200Thr Ile His Pro Leu Ile Gly Trp Ser Leu Tyr Leu Thr Gly Ser Phe385 390 395 400gct ctc tct acc ata ccc atc aac gcc ttc ttg ctt ccc att ctc cct 1248Ala Leu Ser Thr Ile Pro Ile Asn Ala Phe Leu Leu Pro Ile Leu Pro405 410 415gtc ata aca ccg tgg ctt ggc att ttc ggg aca ctc ctc gtg atg gct 1296Val Ile Thr Pro Trp Leu Gly Ile Phe Gly Thr Leu Leu Val Met Ala420 425 430ttt cct tct tat cct gat ggc gtt gtt aga gca ttg tcg gtt ttc ggg 1344Phe Pro Ser Tyr Pro Asp Gly Val Val Arg Ala Leu Ser Val Phe Gly435 440 445tat gca ttt tgt tgt gca ccg ttt cta tgg gtc tcc ttt gtg aag atc 1392Tyr Ala Phe Cys Cys Ala Pro Phe Leu Trp Val Ser Phe Val Lys Ile450 455 460aca tcg cat ctt cag att atg att gac aaa gag gtt ttg ttt ccg cgg 1440Thr Ser His Leu Gln Ile Met Ile Asp Lys Glu Val Leu Phe Pro Arg465 470 475 480ttg ggt gaa tcc gga gtc act tct ggt ctc agc aaa ttg tac tga 1485Leu Gly Glu Ser Gly Val Thr Ser Gly Leu Ser Lys Leu Tyr485 490 495<210>6<211>494<212>PRT<213>拟南芥<400>6Met Asp Leu Gln Arg Thr Leu Met Phe Ser Cys Trp Val Leu Ser Leu1 5 10 15Leu Ile Ile Lys Thr Thr Ala Tyr Asn Glu Lys Gln Leu Phe Gln Pro20 25 30Leu Glu Thr Glu Asn Ala Asn Ala Met Thr Ala Val Met Glu Arg Gly35 40 45Leu Lys Thr Gln Arg Arg Pro Glu His Lys Asn Ala Tyr Ala Thr Met
50 55 60Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe Tyr Val Ala Thr Arg65 70 75 80Val Leu Ile Arg Ser Leu Lys Ser Leu His Val Asp Ala Asp Ile Val85 90 95Val Ile Ala Ser Leu Asp Val Pro Ile Asn Trp Ile His Ala Leu Glu100 105 110Glu Glu Asp Gly Ala Lys Val Val Arg Val Glu Asn Leu Glu Asn Pro115 120 125Tyr Lys Lys Gln Thr Asn Phe Asp Asn Arg Phe Lys Leu Ser Leu Asn130 135 140Lys Leu Tyr Ala Trp Ser Leu Ser Asp Tyr Asp Arg Val Val Met Leu145 150 155 160Asp Val Asp Asn Leu Phe Leu Lys Asn Thr Asp Glu Leu Phe Gln Cys165 170 175Gly Gln Phe Cys Ala Val Phe Ile Asn Pro Cys Ile Phe His Thr Gly180 185 190Leu Phe Val Leu Gln Pro Ser Met Glu Val Phe Arg Asp Met Leu His195 200 205Glu Leu Glu Val Lys Arg Asp Asn Pro Asp Gly Ala Asp Gln Gly Phe210 215 220Leu Val Ser Tyr Phe Ser Asp Leu Leu Asn Gln Pro Leu Phe Arg Pro225 230 235 240Pro Pro Asp Asn Arg Thr Ala Leu Lys Gly His Phe Arg Leu Pro Leu245 250 255Gly Tyr Gln Met Asp Ala Ser Tyr Tyr Tyr Leu Lys Leu Arg Trp Asn260 265 270Val Pro Cys Gly Pro Asn Ser Val Ile Thr Phe Pro Gly Ala Val Trp275 280 285Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro Leu Gly Leu290 295 300Ser Trp His His Gln Arg Arg Tyr Thr Ile Ser Tyr Ser Ala Glu Met305 310 315 320Pro Trp Val Leu Thr Gln Ala Val Phe Tyr Leu Gly Ile Ile Leu Val325 330 335Thr Arg Leu Ala Arg Pro Asn Met Thr Lys Leu Cys Tyr Arg Arg Ser340 345 350Asp Lys Asn Leu Ser Met Ile Gln Thr Ala Phe Lys Phe Val Ala Leu355 360 365Leu Phe Ile Leu Ser Ala Tyr Ile Ile Pro Phe Phe Ile Ile Pro Gln370 375 380Thr Ile His Pro Leu Ile Gly Trp Ser Leu Tyr Leu Thr Gly Ser Phe385 390 395 400Ala Leu Ser Thr Ile Pro Ile Asn Ala Phe Leu Leu Pro Ile Leu Pro405 410 415Val Ile Thr Pro Trp Leu Gly Ile Phe Gly Thr Leu Leu Val Met Ala420 425 430Phe Pro Ser Tyr Pro Asp Gly Val Val Arg Ala Leu Ser Val Phe Gly435 440 445Tyr Ala Phe Cys Cys Ala Pro Phe Leu Trp Val Ser Phe Val Lys Ile450 455 460Thr Ser His Leu Gln Ile Met Ile Asp Lys Glu Val Leu Phe Pro Arg465 470 475 480Leu Gly Glu Ser Gly Val Thr Ser Gly Leu Ser Lys Leu Tyr485 490<210>7<211>1494<212>DNA
<213>拟南芥<220>
<221>CDS<222>(1)..(1494)<400>7atg gat ttg cag aga ggc ttt gtg ttc ttg tct ttg gtt cta tct ttt48Met Asp Leu Gln Arg Gly Phe Val Phe Leu Ser Leu Val Leu Ser Phe1 5 10 15atg ata atc gaa acg acg gcg tat cga gag aga cag ctg ctg ctg ctg96Met Ile Ile Glu Thr Thr Ala Tyr Arg Glu Arg Gln Leu Leu Leu Leu20 25 30caa cca ccg caa gaa acg gcg ata gat acc gca aac gcg gtg gtg acg 144Gln Pro Pro Gln Glu Thr Ala Ile Asp Thr Ala Asn Ala Val Val Thr35 40 45gtt caa gat cga ggt ttg aag acg cgg cga ccg gag cat aag aac gca 192Val Gln Asp Arg Gly Leu Lys Thr Arg Arg Pro Glu His Lys Asn Ala50 55 60tac gca acg atg atg tac atg ggg acg cca aga gac tac gag ttc tac 240Tyr Ala Thr Met Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe Tyr65 70 75 80gtt gcg aca cgt gtt ttg atc aga tcg ttg aga agt ctt cac gtg gaa 288Val Ala Thr Arg Val Leu Ile Arg Ser Leu Arg Ser Leu His Val Glu85 90 95gct gat ctc gtc gtc atc gct tct ctc gac gtt cct ctc cga tgg gtt 336Ala Asp Leu Val Val Ile Ala Ser Leu Asp Val Pro Leu Arg Trp Val100 105 110caa acc ttg gaa gag gaa gat gga gct aaa gtg gtg aga gtt gaa aat 384Gln Thr Leu Glu Glu Glu Asp Gly Ala Lys Val Val Arg Val Glu Asn115 120 125gtg gat aat cca tac agg aga cag acc aac ttc aac agt aga ttc aag 432Val Asp Asn Pro Tyr Arg Arg Gln Thr Asn Phe Asn Ser Arg Phe Lys130 135 140ctt act cta aac aag ctc tac gct tgg gct ttg tct gat tac gac cgt 480Leu Thr Leu Asn Lys Leu Tyr Ala Trp Ala Leu Ser Asp Tyr Asp Arg145 150 155 160gtg gtc atg cta gat gcc gat aac ctc ttt ctt aag aaa gcc gac gag 528Val Val Met Leu Asp Ala Asp Asn Leu Phe Leu Lys Lys Ala Asp Glu165 170 175ttg ttc cag tgt ggg cgc ttc tgt gcg gtc ttc att aac cct tgt atc 576Leu Phe Gln Cys Gly Arg Phe Cys Ala Val Phe Ile Asn Pro Cys Ile180 185 190ttc cac act ggt ctc ttc gtg ttg cag cca tca gtg gaa gtg ttc aag 624Phe His Thr Gly Leu Phe Val Leu Gln Pro Ser Val Glu Val Phe Lys195 200 205gac atg ctc cat gag cta caa gtt gga aga aag aat cct gat gga gct 672Asp Met Leu His Glu Leu Gln Val Gly Arg Lys Asn Pro Asp Gly Ala
210 215 220gat caa ggt ttt ctt gtc agt tac ttc tct gat ctt ctt gac caa cct 720Asp Gln Gly Phe Leu Val Ser Tyr Phe Ser Asp Leu Leu Asp Gln Pro225 230 235 240ctc ttt agt cct ccg agt aac gga tct gta ctt aat ggt cac ttg aga 768Leu Phe Ser Pro Pro Ser Asn Gly Ser Val Leu Asn Gly His Leu Arg245 250 255ctt ccc tta ggc tac caa atg gac gct tct tat ttc tat ctt aag cta 816Leu Pro Leu Gly Tyr Gln Met Asp Ala Ser Tyr Phe Tyr Leu Lys Leu260 265 270aga tgg aac ata ccc tgt gga cca aac agt gtg att aca ttc ccg gga 864Arg Trp Asn Ile Pro Cys Gly Pro Asn Ser Val Ile Thr Phe Pro Gly275 280 285gct gtt tgg tta aag cca tgg tac tgg tgg tca tgg cct gtt ctt cca 912Ala Val Trp Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro290 295 300cta ggt ttc tca tgg cac gag cag cgt cgc gcc act ata ggg tac tca 960Leu Gly Phe Ser Trp His Glu Gln Arg Arg Ala Thr Ile Gly Tyr Ser305 310 315 320gcc gaa atg cct ttg gtt ata atc caa gca atg ttt tac ctt gga atc 1008Ala Glu Met Pro Leu Val Ile Ile Gln Ala Met Phe Tyr Leu Gly Ile325 330 335ata gtg gtt aca cga cta gct cgt cct aac ata acc aag cta tgt tat 1056Ile Val Val Thr Arg Leu Ala Arg Pro Asn Ile Thr Lys Leu Cys Tyr340 345 350cgc cgc tct gac cgc aac tta aca acg atc caa gct ggt ttt aag ttg 1104Arg Arg Ser Asp Arg Asn Leu Thr Thr Ile Gln Ala Gly Phe Lys Leu355 360 365atc gcg ctt ctc tct gta gtt gca gcc tac atc ttc cca ttc ttc acc 1152Ile Ala Leu Leu Ser Val Val Ala Ala Tyr Ile Phe Pro Phe Phe Thr370 375 380atc cct cac act atc cac cca ctc atc ggc tgg tcg ctc tac ttg atg 1200Ile Pro His Thr Ile His Pro Leu Ile Gly Trp Ser Leu Tyr Leu Met385 390 395 400gct tct ttt gct ctc tct tcc att tca atc aac act ctc ctc ctc cca 1248Ala Ser Phe Ala Leu Ser Ser Ile Ser Ile Asn Thr Leu Leu Leu Pro405 410 415acg ctc cct gtt ctc act cca tgg cta gga att ctc ggc act ctc ctt 1296Thr Leu Pro Val Leu Thr Pro Trp Leu Gly Ile Leu Gly Thr Leu Leu420 425 430gtc atg gcc ttc cct tgg tac cct gat gga gtg gtc aga gcc ttg tca 1344Val Met Ala Phe Pro Trp Tyr Pro Asp Gly Val Val Arg Ala Leu Ser435 440 445gtt ttc gca tac gca ttt tgt tgc gca ccc ttt gtg tgg gtt tca ttc 1392Val Phe Ala Tyr Ala Phe Cys Cys Ala Pro Phe Val Trp Val Ser Phe450 455 460
cgc aaa atc aca tcg cac ctc cag gtt ttg att gag aaa gag gtg ttg 1440Arg Lys Ile Thr Ser His Leu Gln Val Leu Ile Glu Lys Glu Val Leu465 470 475 480ttc ccg cga ttg gga gac tca ggg gtc act tca ggc ttc agc aaa ttg 1488Phe Pro Arg Leu Gly Asp Ser Gly Val Thr Ser Gly Phe Ser Lys Leu485 490 495tat tag 1494Tyr<210>8<211>497<212>PRT<213>拟南芥<400>8Met Asp Leu Gln Arg Gly Phe Val Phe Leu Ser Leu Val Leu Ser Phe1 5 10 15Met Ile Ile Glu Thr Thr Ala Tyr Arg Glu Arg Gln Leu Leu Leu Leu20 25 30Gln Pro Pro Gln Glu Thr Ala Ile Asp Thr Ala Asn Ala Val Val Thr35 40 45Val Gln Asp Arg Gly Leu Lys Thr Arg Arg Pro Glu His Lys Asn Ala50 55 60Tyr Ala Thr Met Met Tyr Met Gly Thr Pro Arg Asp Tyr Glu Phe Tyr65 70 75 80Val Ala Thr Arg Val Leu Ile Arg Ser Leu Arg Ser Leu His Val Glu85 90 95Ala Asp Leu Val Val Ile Ala Ser Leu Asp Val Pro Leu Arg Trp Val100 105 110Gln Thr Leu Glu Glu Glu Asp Gly Ala Lys Val Val Arg Val Glu Asn115 120 125Val Asp Asn Pro Tyr Arg Arg Gln Thr Asn Phe Asn Ser Arg Phe Lys130 135 140Leu Thr Leu Asn Lys Leu Tyr Ala Trp Ala Leu Ser Asp Tyr Asp Arg145 150 155 160Val Val Met Leu Asp Ala Asp Asn Leu Phe Leu Lys Lys Ala Asp Glu165 170 175Leu Phe Gln Cys Gly Arg Phe Cys Ala Val Phe Ile Asn Pro Cys Ile180 185 190phe His Thr Gly Leu Phe Val Leu Gln Pro Ser Val Glu Val Phe Lys195 200 205Asp Met Leu His Glu Leu Gln Val Gly Arg Lys Asn Pro Asp Gly Ala210 215 220Asp Gln Gly Phe Leu Val Ser Tyr Phe Ser Asp Leu Leu Asp Gln Pro225 230 235 240Leu Phe Ser Pro Pro Ser Asn Gly Ser Val Leu Asn Gly His Leu Arg245 250 255Leu Pro Leu Gly Tyr Gln Met Asp Ala Ser Tyr Phe Tyr Leu Lys Leu260 265 270Arg Trp Asn Ile Pro Cys Gly Pro Asn Ser Val Ile Thr phe Pro Gly275 280 285Ala Val Trp Leu Lys Pro Trp Tyr Trp Trp Ser Trp Pro Val Leu Pro290 295 300Leu Gly Phe Ser Trp His Glu Gln Arg Arg Ala Thr Ile Gly Tyr Ser305 310 315 320Ala Glu Met Pro Leu Val Ile Ile Gln Ala Met Phe Tyr Leu Gly Ile325 330 335
Ile Val Val Thr Arg Leu Ala Arg Pro Asn Ile Thr Lys Leu Cys Tyr340 345 350Arg Arg Ser Asp Arg Asn Leu Thr Thr Ile Gln Ala Gly Phe Lys Leu355 360 365Ile Ala Leu Leu Ser Val Val Ala Ala Tyr Ile Phe Pro Phe Phe Thr370 375 380Ile Pro His Thr Ile His Pro Leu Ile Gly Trp Ser Leu Tyr Leu Met385 390 395 400Ala Ser Phe Ala Leu Ser Ser Ile Ser Ile Asn Thr Leu Leu Leu Pro405 410 415Thr Leu Pro Val Leu Thr Pro Trp Leu Gly Ile Leu Gly Thr Leu Leu420 425 430Val Met Ala Phe pro Trp Tyr Pro Asp Gly Val Val Arg Ala Leu Ser435 440 445Val Phe Ala Tyr Ala Phe Cys Cys Ala Pro Phe Val Trp Val Ser Phe450 455 460Arg Lys Ile Thr Ser His Leu Gln Val Leu Ile Glu Lys Glu Val Leu465 470 475 480Phe Pro Arg Leu Gly Asp Ser Gly Val Thr Ser Gly Phe Ser Lys Leu485 490 495Tyr<210>9<211>1944<212>DNA<213>拟南芥<220>
<221>CDS<222>(1)..(1944)<400>9atg cat cca gct tca tgt agt ctc tca ctc agg aaa gtc aaa ctt aat48Met His Pro Ala Ser Cys Ser Leu Ser Leu Arg Lys Val Lys Leu Asn1 5 10 15att ctt aca gtg aga atg aag ctc tct tct gaa agt ccc atg gcg ccg96Ile Leu Thr Val Arg Met Lys Leu Ser Ser Glu Ser Pro Met Ala pro20 25 30tca agt cag tca agt cat cga ctt tac att tcc agt gag aaa aca aaa 144Ser Ser Gln Ser Ser His Arg Leu Tyr Ile Ser Ser Glu Lys Thr Lys35 40 45acg aag aga ttc caa aga aac gga tac act ctc gat gtt gaa atg tgt 192Thr Lys Arg Phe Gln Arg Asn Gly Tyr Thr Leu Asp Val Glu Met Cys50 55 60gtc aac ttc tct agt ctg aaa ctt gtt ttg ttt ctt atg atg ctg gtt 240Val Asn Phe Ser Ser Leu Lys Leu Val Leu Phe Leu Met Met Leu Val65 70 75 80gct atg ttc aca ctc tac tgt tct cca ccg ttg caa att cct gaa gat 288Ala Met Phe Thr Leu Tyr Cys Ser Pro Pro Leu Gln Ile Pro Glu Asp85 90 95cca tca agt ttt gca aac aaa tgg ata cta gaa cct gct gta acc aca 336Pro Ser Ser Phe Ala Asn Lys Trp Ile Leu Glu Pro Ala Val Thr Thr100 105 110
gat cct cgc tat ata gct aca tct gag atc aac tgg aac agt atg tca 384Asp Pro Arg Tyr Ile Ala Thr Ser Glu Ile Asn Trp Asn Ser Met Ser115 120 125ctt gtt gtt gag cat tac tta tct ggc aga agc gag tat caa gga att 432Leu Val Val Glu His Tyr Leu Ser Gly Arg Ser Glu Tyr Gln Gly Ile130 135 140ggc ttt cta aat ctc aac gat aac gag att aat cga tgg cag gtg gtc 480Gly Phe Leu Asn Leu Asn Asp Asn Glu Ile Asn Arg Trp Gln Val Val145 150 155 160ata aaa tct cac tgt cag cat ata gct ttg cat cta gac cat gct gca 528Ile Lys Ser His Cys Gln His Ile Ala Leu His Leu Asp His Ala Ala165 170 175agt aac ata act tgg aaa tct tta tac ccg gaa tgg att gac gag gaa 576Ser Asn Ile Thr Trp Lys Ser Leu Tyr Pro Glu Trp Ile Asp Glu Glu180 185 190gaa aaa ttc aaa gtc ccc act tgt cct tct ctt cct tgg att caa gtt 624Glu Lys Phe Lys Val Pro Thr Cys Pro Ser Leu Pro Trp Ile Gln Val195 200 205cct gac aag tct cga atc gat ctt atc att gcc aag ctc cca tgt aac 672Pro Asp Lys Ser Arg Ile Asp Leu Ile Ile Ala Lys Leu Pro Cys Asn210 215 220aag tca gga aaa tgg tca aga gat gtg gct aga ttg cac tta caa ctt 720Lys Ser Gly Lys Trp Ser Arg Asp Val Ala Arg Leu His Leu Gln Leu225 230 235 240gca gca gct cga gtg gcg gca tct tct gaa ggg ctt cat gat gtt cat 768Ala Ala Ala Arg Val Ala Ala Ser Ser Glu Gly Leu His Asp Val His245 250 255gtg att ttg gta tca gat tgc ttt cca ata ccg aat ctt ttt acg ggt 816Val Ile Leu Val Ser Asp Cys Phe Pro Ile Pro Asn Leu Phe Thr Gly260 265 270caa gaa ctt gtt gcc cgt caa gga aac ata tgg ctg tat aag cct aaa 864Gln Glu Leu Val Ala Arg Gln Gly Asn Ile Trp Leu Tyr Lys Pro Lys275 280 285ctt cac cag tta aga caa aag tta caa ctt cct gtt ggt tcc tgt gaa 912Leu His Gln Leu Arg Gln Lys Leu Gln Leu Pro Val Gly Ser Cys Glu290 295 300ctt tct gtt cct ctt caa gct aaa gat aat ttc tac tcg gca aat gcc 960Leu Ser Val Pro Leu Gln Ala Lys Asp Asn Phe Tyr Ser Ala Asn Ala305 310 315 320aag aaa gaa gcg tac gcg acg atc ttg cac tca gat gat gct ttt gtc 1008Lys Lys Glu Ala Tyr Ala Thr Ile Leu His Ser Asp Asp Ala Phe Val325 330 335tgt gga gcc att gca gta gca cag agc att cga atg tca ggc tct act 1056Cys Gly Ala Ile Ala Val Ala Gln Ser Ile Arg Met Ser Gly Ser Thr340 345 350
cgc aat ttg gta ata cta gtc gat gat tcg atc agt gaa tac cat aga 1104Arg Asn Leu Val Ile Leu Val Asp Asp Ser Ile Ser Glu Tyr His Arg355 360 365agt ggc ttg gaa tca gct gga tgg aag att cac aca ttt caa aga atc 1152Ser Gly Leu Glu Ser Ala Gly Trp Lys Ile His Thr Phe Gln Arg Ile370 375 380aga aac ccg aaa gct gaa gca aat gca tat aac caa tgg aac tac agc 1200Arg Asn Pro Lys Ala Glu Ala Asn Ala Tyr Asn Gln Trp Asn Tyr Ser385 390 395 400aaa ttc cgt ctt tgg gaa ttg aca gaa tac aac aag atc atc ttc att 1248Lys Phe Arg Leu Trp Glu Leu Thr Glu Tyr Asn Lys Ile Ile Phe Ile405 410 415gat gca gac atg ctt atc ctc aga aac atg gat ttc ctc ttc gag tac 1296Asp Ala Asp Met Leu Ile Leu Arg Asn Met Asp Phe Leu Phe Glu Tyr420 425 430ccc gaa atc tcc aca act gga aac gac ggt acg ctc ttc aac tcc ggt 1344Pro Glu Ile Ser Thr Thr Gly Asn Asp Gly Thr Leu Phe Asn Ser Gly435 440 445cta atg gtg att gaa cca tca aat tca aca ttc cag tta cta atg gat 1392Leu Met Val Ile Glu Pro Ser Asn Ser Thr Phe Gln Leu Leu Met Asp450 455 460cac atc aac gat atc aat tcc tac aat gga gga gac caa ggt tac ctt 1440His Ile Asn Asp Ile Asn Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu465 470 475 480aac gag ata ttc aca tgg tgg cat cgg att cca aaa cac atg aat ttc 1488Asn Glu Ile Phe Thr Trp Trp His Arg Ile Pro Lys His Met Asn Phe485 490 495ttg aag cat ttc tgg gaa gga gac aca cct aag cac agg aaa tct aag 1536Leu Lys His Phe Trp Glu Gly Asp Thr Pro Lys His Arg Lys Ser Lys500 505 510acg aga cta ttt gga gct gat cct ccg ata ctc tac gtt ctt cat tac 1584Thr Arg Leu Phe Gly Ala Asp Pro Pro Ile Leu Tyr Val Leu His Tyr515 520 525cta ggt tac aac aaa cca tgg gta tgc ttc aga gac tac gat tgc aat 1632Leu Gly Tyr Asn Lys Pro Trp Val Cys Phe Arg Asp Tyr Asp Cys Asn530 535 540tgg aat gtc gtt gga tac cat caa ttc gcg agc gat gaa gca cac aaa 1680Trp Asn Val Val Gly Tyr His Gln Phe Ala Ser Asp Glu Ala His Lys545 550 555 560act tgg tgg aga gtg cac gac gcg atg cct aag aaa ttg cag agg ttt 1728Thr Trp Trp Arg Val His Asp Ala Met Pro Lys Lys Leu Gln Arg Phe565 570 575tgt cta ctg agt tcg aaa caa aag gcg caa ctt gag tgg gat cgg aga 1776Cys Leu Leu Ser Ser Lys Gln Lys Ala Gln Leu Glu Trp Asp Arg Arg580 585 590caa gct gag aaa gcg aat tac aga gac gga cat tgg agg att aag atc 1824
Gln Ala Glu Lys Ala Asn Tyr Arg Asp Gly His Trp Arg Ile Lys Ile595 600 605aaa gat aag aga ctt acg act tgt ttt gaa gat ttc tgt ttc tgg gag 1872Lys Asp Lys Arg Leu Thr Thr Cys Phe Glu Asp Phe Cys Phe Trp Glu610 615 620agt atg ctt tgg cat tgg ggt gag act cag acc aac tcc acc gtc gct 1920Ser Met Leu Trp His Trp Gly Glu Thr Gln Thr Asn Ser Thr Val Ala625 630 635 640gct gat tct tcc tcc acc gcg taa 1944Ala Asp Ser Ser Ser Thr Ala645<210>10<211>647<212>PRT<213>拟南芥<400>10Met His Pro Ala Ser Cys Ser Leu Ser Leu Arg Lys Val Lys Leu Asn1 5 10 15Ile Leu Thr Val Arg Met Lys Leu Ser Ser Glu Ser Pro Met Ala Pro20 25 30Ser Ser Gln Ser Ser His Arg Leu Tyr Ile Ser Ser Glu Lys Thr Lys35 40 45Thr Lys Arg Phe Gln Arg Asn Gly Tyr Thr Leu Asp Val Glu Met Cys50 55 60Val Asn Phe Ser Ser Leu LVs Leu Val Leu Phe Leu Met Met Leu Val65 70 75 80Ala Met Phe Thr Leu Tyr Cys Ser Pro Pro Leu Gln Ile Pro Glu Asp85 90 95Pro Ser Ser Phe Ala Asn Lys Trp Ile Leu Glu Pro Ala Val Thr Thr100 105 110Asp Pro Arg Tyr Ile Ala Thr Ser Glu Ile Asn Trp Asn Ser Met Ser115 120 125Leu Val Val Glu His Tyr Leu Ser Gly Arg Ser Glu Tyr Gln Gly Ile130 135 140Gly Phe Leu Asn Leu Asn Asp Asn Glu Ile Asn Arg Trp Gln Val Val145 150 155 160Ile Lys Ser His Cys Gln His Ile Ala Leu His Leu Asp His Ala Ala165 170 175Ser Asn Ile Thr Trp Lys Ser Leu Tyr pro Glu Trp Ile Asp Glu Glu180 185 190Glu Lys Phe Lys Val Pro Thr Cys Pro Ser Leu Pro Trp Ile Gln Val195 200 205Pro Asp Lys Ser Arg Ile Asp Leu Ile Ile Ala Lys Leu Pro Cys Asn210 215 220Lys Ser Gly Lys Trp Ser Arg Asp Val Ala Arg Leu His Leu Gln Leu225 230 235 240Ala Ala Ala Arg Val Ala Ala Ser Ser Glu Gly Leu His Asp Val His245 250 255Val Ile Leu Val Ser Asp Cys Phe Pro Ile Pro Asn Leu Phe Thr Gly260 265 270Gln Glu Leu Val Ala Arg Gln Gly Asn Ile Trp Leu Tyr Lys Pro Lys275 280 285Leu His Gln Leu Arg Gln Lys Leu Gln Leu Pro Val Gly Ser Cys Glu290 295 300Leu Ser Val Pro Leu Gln Ala Lys Asp Asn Phe Tyr Ser Ala Asn Ala
305 310 315 320Lys Lys Glu Ala Tyr Ala Thr Ile Leu His Ser Asp Asp Ala Phe Val325 330 335Cys Gly Ala Ile Ala Val Ala Gln Ser Ile Arg Met Ser Gly Ser Thr340 345 350Arg Asn Leu Val Ile Leu Val Asp Asp Ser Ile Ser Glu Tyr His Arg355 360 365Ser Gly Leu Glu Ser Ala Gly Trp Lys Ile His Thr Phe Gln Arg Ile370 375 380Arg Asn Pro Lys Ala Glu Ala Asn Ala Tyr Asn Gln Trp Asn Tyr Ser385 390 395 400Lys Phe Arg Leu Trp Glu Leu Thr Glu Tyr Asn Lys Ile Ile Phe Ile405 410 415Asp Ala Asp Met Leu Ile Leu Arg Asn Met Asp Phe Leu Phe Glu Tyr420 425 430Pro Glu Ile Ser Thr Thr Gly Asn Asp Gly Thr Leu Phe Asn Ser Gly435 440 445Leu Met Val Ile Glu Pro Ser Asn Ser Thr Phe Gln Leu Leu Met Asp450 455 460His Ile Asn Asp Ile Asn Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu465 470 475 480Asn Glu Ile Phe Thr Trp Trp His Arg Ile Pro Lys His Met Asn Phe485 490 495Leu Lys His Phe Trp Glu Gly Asp Thr Pro Lys His Arg Lys Ser Lys500 505 510Thr Arg Leu Phe Gly Ala Asp Pro Pro Ile Leu Tyr Val Leu His Tyr515 520 525Leu Gly Tyr Asn Lys Pro Trp Val Cys Phe Arg Asp Tyr Asp Cys Asn530 535 540Trp Asn Val Val Gly Tyr His Gln Phe Ala Ser Asp Glu Ala His Lys545 550 555 560Thr Trp Trp Arg Val His Asp Ala Met Pro Lys Lys Leu Gln Arg Phe565 570 575Cys Leu Leu Ser Ser Lys Gln Lys Ala Gln Leu Glu Trp Asp Arg Arg580 585 590G1n Ala Glu Lys Ala Asn Tyr Arg Asp Gly His Trp Arg Ile Lys Ile595 600 605Lys Asp Lys Arg Leu Thr Thr Cys Phe Glu Asp Phe Cys Phe Trp Glu610 615 620Ser Met Leu Trp His Trp Gly Glu Thr Gln Thr Asn Ser Thr Val Ala625 630 635 640Ala Asp Ser Ser Ser Thr Ala645<210>11<211>1857<212>DNA<213>拟南芥<220>
<221>CDS<222>(1)..(1857)<400>11atg ata cct tcc tca agt ccc atg gag tca aga cat cga ctc tcg ttc48Met Ile Pro Ser Ser Ser Pro Met Glu Ser Arg His Arg Leu Ser Phe1 5 10 15tca aaa gag aag aca agt agg agg aga ttt caa aga att gag aag ggt96
Ser Lys Glu Lys Thr Ser Arg Arg Arg Phe Gln Arg Ile Glu Lys Gly20 25 30gtc aag ttc aac act ctg aaa ctt gtg ttg att tgt ata atg ctt gga 144Val Lys Phe Asn Thr Leu Lys Leu Val Leu Ile Cys Ile Met Leu Gly35 40 45gct ttg ttc acg atc tac cgt ttt cgt tat cca ccg cta caa att cct 192Ala Leu Phe Thr Ile Tyr Arg Phe Arg Tyr Pro Pro Leu Gln Ile Pro50 55 60gaa att cca act agt ttt ggt ctt act act gat cct cgc tat gta gct 240Glu Ile Pro Thr Ser Phe Gly Leu Thr Thr Asp Pro Arg Tyr Val Ala65 70 75 80aca gct gag atc aac tgg aac cat atg tca aat ctt gtt gag aag cac 288Thr Ala Glu Ile Asn Trp Asn His Met Ser Asn Leu Val Glu Lys His85 90 95gta ttt ggt aga agc gag tat caa gga att ggt ctt ata aat ctt aac 336Val Phe Gly Arg Ser Glu Tyr Gln Gly Ile Gly Leu Ile Asn Leu Asn100 105 110gat aac gag att gat cga ttc aag gag gta acg aaa tct gac tgt gat 384Asp Asn Glu Ile Asp Arg Phe Lys Glu Val Thr Lys Ser Asp Cys Asp115 120 125cat gta gct ttg cat cta gat tat gct gca aag aac ata aca tgg gaa 432His Val Ala Leu His Leu Asp Tyr Ala Ala Lys Asn Ile Thr Trp Glu130 135 140tct tta tac ccg gaa tgg att gat gaa gtt gaa gaa ttc gaa gtc cct 480Ser Leu Tyr Pro Glu Trp Ile Asp Glu Val Glu Glu Phe Glu Val Pro145 150 155 160act tgt cct tct ctg cct ttg att caa att cct ggc aag cct cgg att 528Thr Cys Pro Ser Leu Pro Leu Ile Gln Ile Pro Gly Lys Pro Arg Ile165 170 175gat ctt gta att gcc aag ctt ccg tgt gat aaa tca gga aaa tgg tct 576Asp Leu Val Ile Ala Lys Leu Pro Cys Asp Lys Ser Gly Lys Trp Ser180 185 190aga gat gtg gct cgc ttg cat tta caa ctt gca gca gct cga gtg gcg 624Arg Asp Val Ala Arg Leu His Leu Gln Leu Ala Ala Ala Arg Val Ala195 200 205gct tct tct aaa gga ctt cat aat gtt cat gtg att ttg gta tct gat 672Ala Ser Ser Lys Gly Leu His Asn Val His Val Ile Leu Val Ser Asp210 215 220tgc ttt cca ata ccg aat ctt ttt acg ggt caa gaa ctt gtt gcc cgt 720Cys Phe Pro Ile Pro Asn Leu Phe Thr Gly Gln Glu Leu Val Ala Arg225 230 235 240caa gga aac ata tgg ctg tat aag cct aat ctt cac cag cta aga caa 768Gln Gly Asn Ile Trp Leu Tyr Lys Pro Asn Leu His Gln Leu Arg Gln245 250 255aag tta cag ctt cct gtt ggt tcc tgt gaa ctt tct gtt cct ctt caa 816Lys Leu Gln Leu Pro Val Gly Ser Cys Glu Leu Ser Val Pro Leu Gln
260 265 270gct aaa gat aat ttc tac tcc gca ggt gca aag aaa gaa gct tac gcg 864Ala Lys Asp Asn Phe Tyr Ser Ala Gly Ala Lys Lys Glu Ala Tyr Ala275 280 285act atc ttg cat tct gcc caa ttt tat gtc tgt gga gcc att gca gct 912Thr Ile Leu His Ser Ala Gln Phe Tyr Val Cys Gly Ala Ile Ala Ala290 295 300gca cag agc att cga atg tca ggc tct act cgt gat ctg gtc ata ctt 960Ala Gln Ser Ile Arg Met Ser Gly Ser Thr Arg Asp Leu Val Ile Leu305 310 315 320gtt gat gaa acg ata agc gaa tac cat aaa agt ggc ttg gta gct gct 1008Val Asp Glu Thr Ile Ser Glu Tyr His Lys Ser Gly Leu Val Ala Ala325 330 335gga tgg aag att caa atg ttt caa aga atc agg aac ccg aat gct gta 1056Gly Trp Lys Ile Gln Met Phe Gln Arg Ile Arg Ash Pro Asn Ala Val340 345 350cca aat gcc tac aac gaa tgg aac tac agc aag ttt cgt ctt tgg caa 1104Pro Asn Ala Tyr Asn Glu Trp Asn Tyr Ser Lys Phe Arg Leu Trp Gln355 360 365ctg act gaa tac agt aag atc atc ttc atc gat gca gac atg ctt atc 1152Leu Thr Glu Tyr Ser Lys Ile Ile Phe Ile Asp Ala Asp Met Leu Ile370 375 380ctg aga aac att gat ttc ctc ttc gag ttc cct gag ata tca gca act 1200Leu Arg Asn Ile Asp Phe Leu Phe Glu Phe Pro Glu Ile Ser Ala Thr385 390 395 400gga aac aat gct acg ctc ttc aac tct ggt cta atg gtg gtt gag cca 1248Gly Asn Asn Ala Thr Leu Phe Asn Ser Gly Leu Met Val Val Glu Pro405 410 415tct aat tca aca ttc cag tta cta atg gat aac att aat gaa gtt gtg 1296Ser Asn Ser Thr Phe Gln Leu Leu Met Asp Asn Ile Asn Glu Val Val420 425 430tct tac aac gga gga gac caa ggt tac ctt aac gag ata ttc aca tgg 1344Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn Glu Ile Phe Thr Trp435 440 445tgg cat cgg att cca aaa cac atg aat ttc ttg aag cat ttc tgg gaa 1392Trp His Arg Ile Pro Lys His Met Asn Phe Leu Lys His Phe Trp Glu450 455 460gga gac gaa cct gag att aaa aaa atg aag acg agt cta ttt gga gct 1440Gly Asp Glu Pro Glu Ile Lys Lys Met Lys Thr Ser Leu Phe Gly Ala465 470 475 480gat cct ccg atc cta tac gtt ctt cat tac cta ggt tat aac aaa ccc 1488Asp Pro Pro Ile Leu Tyr Val Leu His Tyr Leu Gly Tyr Asn Lys Pro485 490 495tgg tta tgc ttc aga gac tat gac tgc aat tgg aat gtc gat att ttc 1536Trp Leu Cys Phe Arg Asp Tyr Asp Cys Asn Trp Asn Val Asp Ile Phe500 505 510
cag gaa ttt gct agt gac gag gct cat aaa acc tgg tgg aga gtg cac 1584Gln Glu Phe Ala Ser Asp Glu Ala His Lys Thr Trp Trp Arg Val His515 520 525gac gca atg cct gaa aac ttg cat aag ttc tgt cta cta aga tcg aaa 1632Asp Ala Met Pro Glu Asn Leu His Lys Phe Cys Leu Leu Arg Ser Lys530 535 540cag aag gcg caa ctt gaa tgg gat agg aga caa gca gag aaa ggg aac 1680Gln Lys Ala Gln Leu Glu Trp Asp Arg Arg Gln Ala Glu Lys Gly Asn545 550 555 560tac aaa gat gga cat tgg aag ata aag atc aaa gac aag aga ctt aag 1728Tyr Lys Asp Gly His Trp Lys Ile Lys Ile Lys Asp Lys Arg Leu Lys565 570 575act tgt ttc gaa gat ttc tgc ttt tgg gag agt atg ctt tgg cat tgg 1776Thr Cys Phe Glu Asp Phe Cys Phe Trp Glu Ser Met Leu Trp His Trp580 585 590ggt gag acg aac tct acc aac aat tct tcc acc acc acc act tca tca 1824Gly Glu Thr Asn Ser Thr Asn Asn Ser Ser Thr Thr Thr Thr Ser Ser595 600 605ccg ccg cat aaa acc gct ctc cct tcc ctg tga 1857Pro Pro His Lys Thr Ala Leu Pro Ser Leu610 615<210>12<211>618<212>PRT<213>拟南芥<400>12Met Ile Pro Ser Ser Ser Pro Met Glu Ser Arg His Arg Leu Ser Phe1 5 10 15Ser Lys Glu Lys Thr Ser Arg Arg Arg Phe Gln Arg Ile Glu Lys Gly20 25 30Val Lys Phe Asn Thr Leu Lys Leu Val Leu Ile Cys Ile Met Leu Gly35 40 45Ala Leu Phe Thr Ile Tyr Arg Phe Arg Tyr Pro Pro Leu Gln Ile Pro50 55 60Glu Ile Pro Thr Ser Phe Gly Leu Thr Thr Asp Pro Arg Tyr Val Ala65 70 75 80Thr Ala Glu Ile Asn Trp Asn His Met Ser Asn Leu Val Glu Lys His85 90 95Val Phe Gly Arg Ser Glu Tyr Gln Gly Ile Gly Leu Ile Asn Leu Asn100 105 110Asp Asn Glu Ile Asp Arg Phe Lys Glu Val Thr Lys Ser Asp Cys Asp115 120 125His Val Ala Leu His Leu Asp Tyr Ala Ala Lys Asn Ile Thr Trp Glu130 135 140Ser Leu Tyr Pro Glu Trp Ile Asp Glu Val Glu Glu Phe Glu Val Pro145 150 155 160Thr Cys Pro Ser Leu Pro Leu Ile Gln Ile Pro Gly Lys Pro Arg Ile165 170 175Asp Leu Val Ile Ala Lys Leu Pro Cys Asp Lys Ser Gly Lys Trp Ser180 185 190Arg Asp Val Ala Arg Leu His Leu Gln Leu Ala Ala Ala Arg Val Ala
195 200 205Ala Ser Ser Lys Gly Leu His Asn Val His Val Ile Leu Val Ser Asp210 215 220Cys Phe Pro Ile Pro Asn Leu Phe Thr Gly Gln Glu Leu Val Ala Arg225 230 235 240Gln Gly Asn Ile Trp Leu Tyr Lys Pro Asn Leu His Gln Leu Arg Gln245 250 255Lys Leu Gln Leu Pro Val Gly Ser Cys Glu Leu Ser Val Pro Leu Gln260 265 270Ala Lys Asp Asn Phe Tyr Ser Ala Gly Ala Lys Lys Glu Ala Tyr Ala275 280 285Thr Ile Leu His Ser Ala Gln Phe Tyr Val Cys Gly Ala Ile Ala Ala290 295 300Ala Gln Ser Ile Arg Met Ser Gly Ser Thr Arg Asp Leu Val Ile Leu305 310 315 320Val Asp Glu Thr Ile Ser Glu Tyr His Lys Ser Gly Leu Val Ala Ala325 330 335Gly Trp Lys Ile Gln Met Phe Gln Arg Ile Arg Asn Pro Asn Ala Val340 345 350Pro Asn Ala Tyr Asn Glu Trp Asn Tyr Ser Lys Phe Arg Leu Trp Gln355 360 365Leu Thr Glu Tyr Ser Lys Ile Ile Phe Ile Asp Ala Asp Met Leu Ile370 375 380Leu Arg Asn Ile Asp Phe Leu Phe Glu Phe Pro Glu Ile Ser Ala Thr385 390 395 400Gly Asn Asn Ala Thr Leu Phe Asn Ser GlV Leu Met Val Val Glu Pro405 410 415Ser Asn Ser Thr Phe Gln Leu Leu Met Asp Asn Ile Asn Glu Val Val420 425 430Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn Glu Ile Phe Thr Trp435 440 445Trp His Arg Ile Pro Lys His Met Asn Phe Leu Lys His Phe Trp Glu450 455 460Gly Asp Glu Pro Glu Ile Lys Lys Met Lys Thr Ser Leu Phe Gly Ala465 470 475 480Asp Pro Pro Ile Leu Tyr Val Leu His Tyr Leu Gly Tyr Asn Lys Pro485 490 495Trp Leu Cys Phe Arg Asp Tyr Asp Cys Asn Trp Asn Val Asp Ile Phe500 505 510Gln Glu Phe Ala Ser Asp Glu Ala His Lys Thr Trp Trp Arg Val His515 520 525Asp Ala Met Pro Glu Asn Leu His Lys Phe Cys Leu Leu Arg Ser Lys530 535 540Gln Lys Ala Gln Leu Glu Trp Asp Arg Arg Gln Ala Glu Lys Gly Asn545 550 555 560Tyr Lys Asp Gly His Trp Lys Ile Lys Ile Lys Asp Lys Arg Leu Lys565 570 575Thr Cys Phe Glu Asp Phe Cys Phe Trp Glu Ser Met Leu Trp His Trp580 585 590Gly Glu Thr Asn Ser Thr Asn Asn Ser Ser Thr Thr Thr Thr Ser Ser595 600 605Pro Pro His Lys Thr Ala Leu Pro Ser Leu610 615<210>13<211>2130<212>DNA<213>拟南芥
<220>
<221>CDS<222>(1)..(1980)<400>13atg gca aac tct ccc gct gct cct gca ccc acc acc aca acc ggt ggt48Met Ala Asn Ser Pro Ala Ala Pro Ala Pro Thr Thr Thr Thr Gly Gly1 5 10 15gac tcc cgg cga cgc ctc tcc gcg tcc ata gaa gca ata tgc aag agg96Asp Ser Arg Arg Arg Leu Ser Ala Ser Ile Glu Ala Ile Cys Lys Arg20 25 30aga ttc cgg aga aat agc aaa gga ggt ggc aga tcg gat atg gtg aaa 144Arg Phe Arg Arg Asn Ser Lys Gly Gly Gly Arg Ser Asp Met Val Lys35 40 45ccg ttt aat atc ata aat ttt tcg aca caa gac aaa aac agt agt tgt 192Pro Phe Asn Ile Ile Asn Phe Ser Thr Gln Asp Lys Asn Ser Ser Cys50 55 60tgt tgt ttc acc aag ttt cag atc gtg aag ctt ctc ttg ttt atc ctt 240Cys Cys Phe Thr Lys Phe Gln Ile Val Lys Leu Leu Leu Phe Ile Leu65 70 75 80ctc tct gcc act ctc ttc acc att atc tat tct cct gaa gct tat cat 288Leu Ser Ala Thr Leu Phe Thr Ile Ile Tyr Ser Pro Glu Ala Tyr His85 90 95cat tct ctt tcc cac tca tct tct cga tgg ata tgg aga aga caa gat 336His Ser Leu Ser His Ser Ser Ser Arg Trp Ile Trp Arg Arg Gln Asp100 105 110cca cgt tac ttc tcg gat ctg gat ata aac tgg gac gat gtg act aaa 384Pro Arg Tyr Phe Ser Asp Leu Asp Ile Asn Trp Asp Asp Val Thr Lys115 120 125acc ctt gag aac atc gaa gaa ggc cgt acg atc ggt gtc ttg aat ttt 432Thr Leu Glu Asn Ile Glu Glu Gly Arg Thr Ile Gly Val Leu Asn Phe130 135 140gat tcg aac gag atc caa cga tgg aga gaa gta tcc aag agc aag gac 480Asp Ser Asn Glu Ile Gln Arg Trp Arg Glu Val Ser Lys Ser Lys Asp145 150 155 160aat ggg gat gaa gaa aaa gtt gtt gta ttg aat cta gat tac gca gac 528Asn Gly Asp Glu Glu Lys Val Val Val Leu Asn Leu Asp Tyr Ala Asp165 170 175aag aat gtg act tgg gac gca cta tat cca gag tgg atc gat gag gag 576Lys Asn Val Thr Trp Asp Ala Leu Tyr Pro Glu Trp Ile Asp Glu Glu180 185 190caa gaa aca gag gtc cct gtt tgt cct aat atc ccg aac att aag gta 624Gln Glu Thr Glu Val Pro Val Cys Pro Asn Ile Pro Asn Ile Lys Val195 200 205cct aca aga aga ctc gat ctg atc gtc gtg aaa ctt cct tgt cgg aaa 672Pro Thr Arg Arg Leu Asp Leu Ile Val Val Lys Leu Pro Cys Arg Lys210 215 220
gaa ggg aat tgg tcg aga gac gtc ggg aga ttg cat cta cag cta gcg 720Glu Gly Asn Trp Ser Arg Asp Val Gly Arg Leu His Leu Gln Leu Ala225 230 235 240gct gca act gtg gcg gct tcg gcc aaa ggg ttt ttc agg gga cat gtg 768Ala Ala Thr Val Ala Ala Ser Ala Lys Gly Phe Phe Arg Gly His Val245 250 255ttt ttt gta tct aga tgc ttt ccg att ccg aat ctt ttc cgg tgt aaa 816Phe Phe Val Ser Arg Cys Phe Pro Ile Pro Asn Leu Phe Arg Cys Lys260 265 270gat ctt gtg tct cgg aga ggc gat gtt tgg ttg tac aaa cct aat ctt 864Asp Leu Val Ser Arg Arg Gly Asp Val Trp Leu Tyr Lys Pro Asn Leu275 280 285gat acc ttg aga gac aag ctt cag ctg cct gta ggg tct tgt gag cta 912Asp Thr Leu Arg Asp Lys Leu Gln Leu Pro Val Gly Ser Cys Glu Leu290 295 300tct ctt cct ctt ggc atc caa gat agg cca agc tta gga aac cct aaa 960Ser Leu Pro Leu Gly Ile Gln Asp Arg Pro Ser Leu Gly Asn Pro Lys305 310 315 320aga gaa gct tac gca aca att ctt cac tca gct cac gtt tac gtc tgc 1008Arg Glu Ala Tyr Ala Thr Ile Leu His Ser Ala His Val Tyr Val Cys325 330 335ggt gca atc gcc gcg gct cag agc ata aga cag tct ggt tcg acg aga 1056Gly Ala Ile Ala Ala Ala Gin Ser Ile Arg Gln Ser Gly Ser Thr Arg340 345 350gac ctt gtt atc ctt gtt gat gac aac atc agc ggt tac cac cgg agt 1104Asp Leu Val Ile Leu Val Asp Asp Asn Ile Ser Gly Tyr His Arg Ser355 360 365gga cta gaa gcc gcg ggt tgg caa atc cgg acg ata cag agg att cga 1152Gly Leu Glu Ala Ala Gly Trp Gln Ile Arg Thr Ile Gln Arg Ile Arg370 375 380aac cct aag gca gag aaa gat gct tac aac gaa tgg aac tac agc aag 1200Asn Pro Lys Ala Glu Lys Asp Ala Tyr Asn Glu Trp Asn Tyr Ser Lys385 390 395 400ttc cgg cta tgg cag ctg act gat tac gac aaa atc att ttc atc gac 1248Phe Arg Leu Trp Gln Leu Thr Asp Tyr Asp Lys Ile Ile Phe Ile Asp405 410 415gcg gat ctc tta atc ttg aga aac atc gat ttc ttg ttc tcg atg cct 1296Ala Asp Leu Leu Ile Leu Arg Asn Ile Asp Phe Leu Phe Ser Met Pro420 425 430gag atc tca gct aca gga aac aat gga act ctg ttt aat tca gga gtt 1344Glu Ile Ser Ala Thr Gly Asn Asn Gly Thr Leu Phe Asn Ser Gly Val435 440 445atg gtg atc gag cct tgc aac tgt acg ttt cag ctt ctg atg gaa cat 1392Met Val Ile Glu Pro Cys Asn Cys Thr Phe Gln Leu Leu Met Glu His450 455 460ata aac gag att gag tct tat aac ggt gga gat caa ggt tac tta aac 1440
Ile Asn Glu Ile Glu Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn465 470 475 480gag gta ttc aca tgg tgg cac cgg att cca aaa cat atg aat ttc ttg 1488Glu Val Phe Thr Trp Trp His Arg Ile Pro Lys His Met Asn Phe Leu485 490 495aag cat ttt tgg att ggc gat gaa gat gac gcg aaa cgc aag aaa aca 1536Lys His Phe Trp Ile Gly Asp Glu Asp Asp Ala Lys Arg Lys Lys Thr500 505 510gag ctt ttt gga gca gag cct cct gtt ctt tat gtt ctt cat tac ctt 1584Glu Leu Phe Gly Ala Glu Pro Pro Val Leu Tyr Val Leu His Tyr Leu515 520 525ggg atg aag ccg tgg tta tgt tac cgt gac tac gac tgt aac ttc aac 1632Gly Met Lys Pro Trp Leu Cys Tyr Arg Asp Tyr Asp Cys Asn Phe Asn530 535 540tcc gac ata ttc gtt gag ttt gct acc gat atc gct cat cga aaa tgg 1680Ser Asp Ile Phe Val Glu Phe Ala Thr Asp Ile Ala His Arg Lys Trp545 550 555 560tgg atg gtc cac gac gcc atg cca cag gaa ctt cac caa ttc tgt tac 1728Trp Met Val His Asp Ala Met Pro Gln Glu Leu His Gln Phe Cys Tyr565 570 575ttg cga tcc aag caa aag gca cag ctg gaa tat gat cgc cgg caa gca 1776Leu Arg Ser Lys Gln Lys Ala Gln Leu Glu Tyr Asp Arg Arg Gln Ala580 585 590gag gcc gca aat tat gcc gac ggt cat tgg aaa ata aga gta aag gac 1824Glu Ala Ala Asn Tyr Ala Asp Gly His Trp Lys Ile Arg Val Lys Asp595 600 605ccg aga ttc aaa att tgc atc gac aaa tta tgt aat tgg aaa agt atg 1872Pro Arg Phe Lys Ile Cys Ile Asp Lys Leu Cys Asn Trp Lys Ser Met610 615 620ctg cgg cat tgg ggc gaa tca aat tgg act gac tac gag tct ttt gtt 1920Leu Arg His Trp Gly Glu Ser Asn Trp Thr Asp Tyr Glu Ser Phe Val625 630 635 640ccc acc cca cca gcc att acc gta gac cgg aga tca tca ctt ccc ggc 1968Pro Thr Pro Pro Ala Ile Thr Val Asp Arg Arg Ser Ser Leu Pro Gly645 650 655cat aac ttg tga cgcaataatt atacatactt attaatggat ttcatgagtt 2020His Asn Leu660ttttggtttg aattgttgct gcgagattag gtgaatatca gttgtgtaac tatatctttt2080tcctatagtt tgttcaaatt gaataaaaca tttttttgca gtttaaccac 2130<210>14<211>659<212>PRT<213>拟南芥
<400>14Met Ala Asn Ser Pro Ala Ala Pro Ala Pro Thr Thr Thr Thr Gly Gly1 5 10 15Asp Ser Arg Arg Arg Leu Ser Ala Ser Ile Glu Ala Ile Cys Lys Arg20 25 30Arg Phe Arg Arg Asn Ser Lys Gly Gly Gly Arg Ser Asp Met Val Lys35 40 45Pro Phe Asn Ile Ile Asn Phe Ser Thr Gln Asp Lys Asn Ser Ser Cys50 55 60Cys Cys Phe Thr Lys Phe Gln Ile Val Lys Leu Leu Leu Phe Ile Leu65 70 75 80Leu Ser Ala Thr Leu Phe Thr Ile Ile Tyr Ser Pro Glu Ala Tyr His85 90 95His Ser Leu Ser His Ser Ser Ser Arg Trp Ile Trp Arg Arg Gln Asp100 105 110Pro Arg Tyr Phe Ser Asp Leu Asp Ile Asn Trp Asp Asp Val Thr Lys115 120 125Thr Leu Glu Asn Ile Glu Glu Gly Arg Thr Ile Gly Val Leu Asn Phe130 135 140Asp Ser Asn Glu Ile Gln Arg Trp Arg Glu Val Ser Lys Ser Lys Asp145 150 155 160Asn Gly Asp Glu Glu Lys Val Val Val Leu Asn Leu Asp Tyr Ala Asp165 170 175Lys Asn Val Thr Trp Asp Ala Leu Tyr Pro Glu Trp Ile Asp Glu Glu180 185 190Gln Glu Thr Glu Val Pro Val Cys Pro Asn Ile Pro Asn Ile Lys Val195 200 205Pro Thr Arg Arg Leu Asp Leu Ile Val Val Lys Leu Pro Cys Arg Lys210 215 220Glu Gly Asn Trp Ser Arg Asp Val Gly Arg Leu His Leu Gln Leu Ala225 230 235 240Ala Ala Thr Val Ala Ala Ser Ala Lys Gly Phe Phe Arg Gly His Val245 250 255Phe Phe Val Ser Arg Cys Phe Pro Ile Pro Asn Leu Phe Arg Cys Lys260 265 270Asp Leu Val Ser Arg Arg Gly Asp Val Trp Leu Tyr Lys Pro Asn Leu275 280 285Asp Thr Leu Arg Asp Lys Leu Gln Leu Pro Val Gly Ser Cys Glu Leu290 295 300Ser Leu Pro Leu Gly Ile Gln Asp Arg Pro Ser Leu Gly Asn Pro Lys305 310 315 320Arg Glu Ala Tyr Ala Thr Ile Leu His Ser Ala His Val Tyr Val Cys325 330 335Gly Ala Ile Ala Ala Ala Gln Ser Ile Arg Gln Ser Gly Ser Thr Arg340 345 350Asp Leu Val Ile Leu Val Asp Asp Asn Ile Ser Gly Tyr His Arg Ser355 360 365Gly Leu Glu Ala Ala Gly Trp Gln Ile Arg Thr Ile Gln Arg Ile Arg370 375 380Asn Pro Lys Ala Glu Lys Asp Ala Tyr Asn Glu Trp Asn Tyr Ser Lys385 390 395 400Phe Arg Leu Trp Gln Leu Thr Asp Tyr Asp Lys Ile Ile Phe Ile Asp405 410 415Ala Asp Leu Leu Ile Leu Arg Asn Ile Asp Phe Leu Phe Ser Met Pro420 425 430Glu Ile Ser Ala Thr Gly Asn Asn Gly Thr Leu Phe Asn Ser Gly Val435 440 445Met Val Ile Glu Pro Cys Asn Cys Thr Phe Gln Leu Leu Met Glu His450 455 460Ile Asn Glu Ile Glu Ser Tyr Asn Gly Gly Asp Gln Gly Tyr Leu Asn465 470 475 480
Glu Val Phe Thr Trp Trp His Arg Ile Pro Lys His Met Asn Phe Leu485 490 495Lys His Phe Trp Ile Gly Asp Glu Asp Asp Ala Lys Arg Lys Lys Thr500 505 510Glu Leu Phe Gly Ala Glu Pro Pro Val Leu Tyr Val Leu His Tyr Leu515 520 525Gly Met Lys Pro Trp Leu Cys Tyr Arg Asp Tyr Asp Cys Asn Phe Asn530 535 540Ser Asp Ile Phe Val Glu Phe Ala Thr Asp Ile Ala His Arg Lys Trp545 550 555 560Trp Met Val His Asp Ala Met Pro Gln Glu Leu His Gln Phe Cys Tyr565 570 575Leu Arg Ser Lys Gln Lys Ala Gln Leu Glu Tyr Asp Arg Arg Gln Ala580 585 590Glu Ala Ala Asn Tyr Ala Asp Gly His Trp Lys Ile Arg Val Lys Asp595 600 605Pro Arg Phe Lys Ile Cys Ile Asp Lys Leu Cys Asn Trp Lys Ser Met610 615 620Leu Arg His Trp Gly Glu Ser Asn Trp Thr Asp Tyr Glu Ser Phe Val625 630 635 640Pro Thr Pro Pro Ala Ile Thr Val Asp Arg Arg Ser Ser Leu Pro Gly645 650 655His Asn Leu<210>15<211>15294<212>DNA<213>人工序列<220>
<220>
<223>人工序列描述载体<400>15ggccgggagg gttcgagaag ggggggcacc ccccttcggc gtgcgcggtc acgcgcacag 60ggcgcagccc tggttaaaaa caaggtttat aaatattggt ttaaaagcag gttaaaagac 120aggttagcgg tggccgaaaa acgggcggaa acccttgcaa atgctggatt ttctgcctgt 180ggacagcccc tcaaatgtca ataggtgcgc ccctcatctg tcagcactct gcccctcaag 240tgtcaaggat cgcgcccctc atctgtcagt agtcgcgccc ctcaagtgtc aataccgcag 300ggcacttatc cccaggcttg tccacatcat ctgtgggaaa ctcgcgtaaa atcaggcgtt 360ttcgccgatt tgcgaggctg gccagctcca cgtcgccggc cgaaatcgag cctgcccctc 420atctgtcaac gccgcgccgg gtgagtcggc ccctcaagtg tcaacgtccg cccctcatct 480gtcagtgagg gccaagtttt ccgcgaggta tccacaacgc cggcggccgc ggtgtctcgc 540acacggcttc gacggcgttt ctggcgcgtt tgcagggcca tagacggccg ccagcccagc 600ggcgagggca accagcccgg tgagcgtcgc aaaggcgctc ggtcttgcct tgctcgtcgg 660tgatgtactt caccagctcc gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct 720tggcaatcac gcgcaccccc cggccgtttt agcggctaaa aaagtcatgg ctctgccctc 780gggcggacca cgcccatcat gaccttgcca agctcgtcct gcttctcttc gatcttcgcc 840agcagggcga ggatcgtggc atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag 900agtttcagca ggccgcccag gcggcccagg tcgccattga tgcgggccag ctcgcggacg 960tgctcatagt ccacgacgcc cgtgattttg tagccctggc cgacggccag caggtaggcc1020gacaggctca tgccggccgc cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg1080cagtacacct tgataggtgg gctgcccttc ctggttggct tggtttcatc agccatccgc1140ttgccctcat ctgttacgcc ggcggtagcc ggccagcctc gcagagcagg attcccgttg1200agcaccgcca ggtgcgaata agggacagtg aagaaggaac acccgctcgc gggtgggcct1260acttcaccta tcctgcccgg ctgacgccgt tggatacacc aaggaaagtc tacacgaacc1320ctttggcaaa atcctgtata tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata1380atgaccccga agcagggtta tgcagcggaa aagcgccacg cttcccgaag ggagaaaggc1440
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg1500gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg1560atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt1620tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc1680tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg1740aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgccaga aggccgccag1800agaggccgag cgcggccgtg aggcttggac gctagggcag ggcatgaaaa agcccgtagc1860gggctgctac gggcgtctga cgcggtggaa agggggaggg gatgttgtct acatggctct1920gctgtagtga gtgggttgcg ctccggcagc ggtcctgatc aatcgtcacc ctttctcggt1980ccttcaacgt tcctgacaac gagcctcctt ttcgccaatc catcgacaat caccgcgagt2040ccctgctcga acgctgcgtc cggaccggct tcgtcgaagg cgtctatcgc ggcccgcaac2100agcggcgaga gcggagcctg ttcaacggtg ccgccgcgct cgccggcatc gctgtcgccg2160gcctgctcct caagcacggc cccaacagtg aagtagctga ttgtcatcag cgcattgacg2220gcgtccccgg ccgaaaaacc cgcctcgcag aggaagcgaa gctgcgcgtc ggccgtttcc2280atctgcggtg cgcccggtcg cgtgccggca tggatgcgcg cgccatcgcg gtaggcgagc2340agcgcctgcc tgaagctgcg ggcattcccg atcagaaatg agcgccagtc gtcgtcggct2400ctcggcaccg aatgcgtatg attctccgcc agcatggctt cggccagtgc gtcgagcagc2460gcccgcttgt tcctgaagtg ccagtaaagc gccggctgct gaacccccaa ccgttccgcc2520agtttgcgtg tcgtcagacc gtctacgccg acctcgttca acaggtccag ggcggcacgg2580atcactgtat tcggctgcaa ctttgtcatg cttgacactt tatcactgat aaacataata2640tgtccaccaa cttatcagtg ataaagaatc cgcgcgttca atcggaccag cggaggctgg2700tccggaggcc agacgtgaaa cccaacatac ccctgatcgt aattctgagc actgtcgcgc2760tcgacgctgt cggcatcggc ctgattatgc cggtgctgcc gggcctcctg cgcgatctgg2820ttcactcgaa cgacgtcacc gcccactatg gcattctgct ggcgctgtat gcgttggtgc2880aatttgcctg cgcacctgtg ctgggcgcgc tgtcggatcg tttcgggcgg cggccaatct2940tgctcgtctc gctggccggc gccaagatct ggggaaccct gtggttggca tgcacataca3000aatggacgaa cggataaacc ttttcacgcc cttttaaata tccgattatt ctaataaacg3060ctcttttctc ttaggtttac ccgccaatat atcctgtcaa acactgatag tttaaactga3120aggcgggaaa cgacaatctg atcatgagcg gagaattaag ggagtcacgt tatgaccccc3180gccgatgacg cgggacaagc cgttttacgt ttggaactga cagaaccgca acgttgaagg3240agccactcag ccgatctgaa ttcccgatct agtaacatag atgacaccgc gcgcgataat3300ttatcctagt ttgcgcgcta tattttgttt tctatcgcgt attaaatgta taattgcggg3360actctaatca taaaaaccca tctcataaat aacgtcatgc attacatgtt aattattaca3420tgcttaacgt aattcaacag aaattatatg ataatcatcg caagaccggc aacaggattc3480aatcttaaga aactttattg ccaaatgttt gaacgatcgg ggaaattcga gctcggtacc3540atcatgttac aaactttttt gctgtgagca gtagatatgg aaacccggag gacctaaagt3600atctgataga taaagcacat agcttgggtt tacaggttct ggtggatgta gttcacagtc3660atgcaagcaa taatgccact gatggcctca atggctttga tattggccaa ggttctcaag3720aatcctactt tcatgctgga gagcaagggt accataagtt gtgggatagc aggctgttca3780actatgccaa ttgggaggtt cttcgtttcc ttctttccaa cttgaggtgg tggctagaag3840agtataactt tgacggattt cgatttgatg gaataacttc tatgctgtat gttcatcatg3900gaatcaatat gggatttaca ggaaactata atgagtattt cagcgaggct acagatgttg3960atgctgtggt ctatttaatg ttggccaata atctgattca caagattttc ccagacgcaa4020ctgttattgc cgaagatgtt tctggtatgc cgggccttgg ccggcctgtt tctgagggag4080gaattggttt tgattaccgc ctggcaatgg caatcccaga taagtggata gattatttaa4140agaataaaaa tgatgaagat tggtccatga aggaagtaac atcgagtttg acaaatagga4200gatatacaga gaagtgtata gcatatgcgg agagccatga tcagtctatt gtcggtgaca4260agaccattgc atttctccta atggacaaag agatgtattc tggcatgtct tgcttgacag4320atgcttctcc tgttattgat cgaggaattg cgcttcacaa gatgatccat tttttcacaa4380tggccttggg aggagagggg tacctcaatt tcatgggtaa cgagtttggc catcctgagt4440ggattgactt ccctagagag ggcaataatt ggtgttatga caaatgtaga cgccagtgga4500accttgcgga tagcgaacac ttgagataca agtttatgaa tgcatttgat agagctatga4560attcgctcga tgaaaagttc tcattcctcg catcaggaaa acagatagta agcagcatgg4620atgatgagaa gaaggttgtt gtgtttgaac gtggtgacct ggtatttgta ttcaacttcc4680acccaaataa cacatacgaa gggtataaag ttggatgtga cttgccaggg aagtacagag4740ttgcactgga cagtgatgct tgggaatttg gtggccatgg aagagctggt catgatgttg4800accatttcac atcaccagaa ggaatacctg gagttccaga aacaaatttc aatggtcgtc4860caaattcctt caaagtgctg tctcctgcgc gaacatgtgt ggcttattac agagttgacg4920aacgcatgtc agaaactgaa gtttaccaga cagacatttc tagtgagcta ctaccaacag4980ccaatatcga ggagagtgac gagaaactta aagattcgtt atctacaaat atcagtaacg5040ttgacgaact catgtcagaa actgaagttt accagacaga catttctagt gagctactac5100
caacagccag tatcgaggag agtgacgaga aacttaaaga ttcattatct acaaatatca 5160gtacgtggtt atcattggat gtgggattcc cgcctcttta attatggaaa ctgggaggta 5220cttaggtatc ttctctcaaa tgcgagatgg tggttggatg agttcaaatt tgatggattt 5280agattcgatg gtgtgacatc aataatgtat actcaccacg gattatcggt gggattcact 5340gggaactaca aggaatactt tggactcgca actgatgtgg atgctgttgt gtatctgatg 5400ctggtcaacg atcttattca tgggcttttc cagatgcaat taccattggt gaagatgtta 5460gcggaatgcc gacattttgt attcccgttc aagatggggg tgttggcttt gactatcggc 5520tgcatatggc aattgctgat aaatggattg agttgctcaa gaaacgggat gaggattgga 5580gagtgggtga tattgttcat acactgacaa atagaagatg gtcggaaaag tgtgtttcat 5640acgctgaaag tcatgatcaa gctctagtcg gtgataaaac tatagcattc tggctgatgg 5700acaaggatat gtatgatttt atggctctgg atagaccatc aacatcatta atagatcgtg 5760ggatagcatt gcacaagatg attaggcttg taactatggg attaggagga gaagggtacc 5820taaatttcat gggaaatgaa ttcggccacc ctgagtggat tgatttccct agggctgaac 5880aacacctctc tgatggctca gtaattcccg gaaaccaatt cagttatgat aaatgcagac 5940ggagatttga cctgggagat gcagaatatt taagataccg tgggttgcaa gaatttgacc 6000gggctatgca gtatcttgaa gataaatatg agtttatgac ttcagaacac cagttcatat 6060cacgaaagga tgaaggagat aggatgattg tatttgaaaa aggaaaccta gtttttgtct 6120ttaattttca ctggacaaaa agctattcag actatcgcat aggctgcctg aagcctggaa 6180aatacaaggt tgccttggac tcagatgatc cactttttgg tggcttcggg agaattgatc 6240ataatgccga atatttcacc tttgaaggat ggtatgatga tcgtcctcgt tcaattatgg 6300tgtatgcacc tagtagaaca gcagtggtct atgcactagt agacaaagaa gaagaagaag 6360aagaagaagt agcagtagta gaagaagtag tagtagaaga agaatgaacg aacttgtgat 6420cgcgttgaaa gatttgaagg ctacatagct ctagagtcga cctgcatgaa atcagaaata 6480attggaggag atgagtaaaa gttaccactt gttgagctgt gtgagtgagt gagtgagaat 6540gaggaggtgc ctgccttatt tgtagcaggt ttcagtgaca cgtgtcaaga gaatagcggg 6600tggctatccc ttagcagaag gcaactgtgg acactgtatt atagggaaat gctcatcgac 6660agtattatgg gccctctctt tgttgattca cggctggact tcaacttggg ccttgcaatg 6720ggcccgtccg gttctgtctc ctagtatcta aaaaactaaa ccaactccct cctaccgcta 6780ccacttgaca ttcctatgtc tcgtgttaat taaattatta ttatagtaat taaaaataat 6840atctaggtac tggtactggt ccctccctcc actagaatat tagttacttc ccccttagct 6900ttgtattcca aattactgta aatatatttt ctaatttttt acgacaaaca agatctaatt 6960atgaatgcac aattctaaag gttgaataca ttactttact tggtttagcc tatattaagt 7020tgcattttag tattaagatt gagatgcatg gttctattac aaaattgata cactgctaaa 7080ggaaggatgg ttaaaaacaa cattcaatgt ttgttacatt tcttcctatt gtattttttt 7140tttaacgagc ttcccgtata catcataaca tgtctccgtt ccacttggca ggaaaaaaaa 7200atacccaaac aggaagatac tgtcaagtat atccatagat gaggacttaa tggataggct 7260tttcgaggat tcataaatca taatatctgg cggaggagtc aattaaatac ttgtggtttg 7320tatcctgatt actccgtcaa cagccaaata gaaaagtttg aaaagagaga aaggatttgg 7380tacaagatac tgttgcattt gttaagtaat gaacaaaacg gagtaacata attttctatc 7440tcgttaaagc ttcacgctgc cgcaagcact cagggcgcaa gggctgctaa ggaagcggaa 7500cacgtagaaa gccagtccgc agaaacggtg ctgaccccgg atgaatgtca gctactgggc 7560tatctggaca agggaaaacg caagcgcaaa gagaaagcag gtagcttgca gtgggcttac 7620atggcgatag ctagactggg cggttttatg gacagcaagc gaaccggaat tgccagctgg 7680ggcgccctct ggtaaggttg ggaagccctg caaagtaaac tggatggctt tcttgccgcc 7740aaggatctga tggcgcaggg gatcaagatc atgagcggag aattaaggga gtcacgttat 7800gacccccgcc gatgacgcgg gacaagccgt tttacgtttg gaactgacag aaccgcaacg 7860ttgaaggagc cactcagccg cgggtttctg gagtttaatg agctaagcac atacgtcaga 7920aaccattatt gcgcgttcaa aagtcgccta aggtcactat cagctagcaa atatttcttg 7980tcaaaaatgc tccactgacg ttccataaat tcccctcggt atccaattag agtctcatat 8040tcactctcaa tccagatctc gactctagtc gagggcccat gggagcttgg attgaacaag 8100atggattgca cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg 8160cacaacagac aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc 8220cggttctttt tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag 8280cgcggctatc gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca 8340ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat 8400ctcaccttgc tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata 8460cgcttgatcc ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac 8520gtactcggat ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc 8580tcgcgccagc cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg 8640tcgtgaccca tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg 8700gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta 8760
cccgtgatat tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg 8820gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct 8880gagcgggacc caagctagct tcgacggatc ccccgatgag ctaagctagc tatatcatca 8940atttatgtat tacacataat atcgcactca gtctttcatc tacggcaatg taccagctga 9000tataatcagt tattgaaata tttctgaatt taaacttgca tcaataaatt tatgtttttg 9060cttggactat aatacctgac ttgttatttt atcaataaat atttaaacta tatttctttc 9120aagatgggaa ttaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc 9180gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa 9240gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcgc ccgctccttt 9300cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 9360ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 9420tttgggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 9480gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 9540tatctcgggc tattcttttg atttataagg gattttgccg atttcggaac caccatcaaa 9600caggattttc gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc 9660caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccacccca 9720gtacattaaa aacgtccgca atgtgttatt aagttgtcta agcgtcaatt tgtttacacc 9780acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc 9840accactcgat acaggcagcc catcagtccg ggacggcgtc agcgggagag ccgttgtaag 9900gcggcagact ttgctcatgt taccgatgct attcggaaga acggcaacta agctgccggg 9960tttgaaacac ggatgatctc gcggagggta gcatgttgat tgtaacgatg acagagcgtt10020gctgcctgtg atcaaatatc atctccctcg cagagatccg aattatcagc cttcttattc10080atttctcgct taaccgtgac aggctgtcga tcttgagaac tatgccgaca taataggaaa10140tcgctggata aagccgctga ggaagctgag tggcgctatt tctttagaag tgaacgttga10200cgatatcaac tcccctatcc attgctcacc gaatggtaca ggtcggggac ccgaagttcc10260gactgtcggc ctgatgcatc cccggctgat cgaccccaga tctagatctg gggctgagaa10320agcccagtaa ggaaacaact gtaggttcga gtcgcgagat cccccggaac caaaggaagt10380aggttaaacc cgctccgatc aggccgagcc acgccaggcc gagaacattg gttcctgtag10440gcatcgggat tggcggatca aacactaaag ctactggaac gagcagaagt cctccggccg10500ccagttgcca ggcggtaaag gtgagcagag gcacgggagg ttgccacttg cgggtcagca10560cggttccgaa cgccatggaa accgcccccg ccaggcccgc tgcgacgccg acaggatcta10620gcgctgcgtt tggtgtcaac accaacagcg ccacgcccgc agttccgcaa atagccccca10680ggaccgccat caatcgtatc gggctaccta gcagagcggc agagatgaac acgaccatca10740gcggctgcac agcgcctacc gtcgccgcga ccccgcccgg caggcggtag accgaaataa10800acaacaagct ccagaatagc gaaatattaa gtgcgccgag gatgaagatg cgcatccacc10860agattcccgt tggaatctgt cggacgatca tcacgagcaa taaacccgcc ggcaacgccc10920gcagcagcat accggcgacc cctcggcctc gctgttcggg ctccacgaaa acgccggaca10980gatgcgcctt gtgagcgtcc ttggggccgt cctcctgttt gaagaccgac agcccaatga11040tctcgccgtc gatgtaggcg ccgaatgcca cggcatctcg caaccgttca gcgaacgcct11100ccatgggctt tttctcctcg tgctcgtaaa cggacccgaa catctctgga gctttcttca11160
gggccgacaa tcggatctcg cggaaatcct gcacgtcggc cgctccaagc cgtcgaatct11220gagccttaat cacaattgtc aattttaatc ctctgtttat cggcagttcg tagagcgcgc11280cgtgcgtccc gagcgatact gagcgaagca agtgcgtcga gcagtgcccg cttgttcctg11340aaatgccagt aaagcgctgg ctgctgaacc cccagccgga actgacccca caaggcccta11400gcgtttgcaa tgcaccaggt catcattgac ccaggcgtgt tccaccaggc cgctgcctcg11460caactcttcg caggcttcgc cgacctgctc gcgccacttc ttcacgcggg tggaatccga11520tccgcacatg aggcggaagg tttccagctt gagcgggtac ggctcccggt gcgagctgaa11580atagtcgaac atccgtcggg ccgtcggcga cagcttgcgg tacttctccc atatgaattt11640cgtgtagtgg tcgccagcaa acagcacgac gatttcctcg tcgatcagga cctggcaacg11700ggacgttttc ttgccacggt ccaggacgcg gaagcggtgc agcagcgaca ccgattccag11760gtgcccaacg cggtcggacg tgaagcccat cgccgtcgcc tgtaggcgcg acaggcattc11820ctcggccttc gtgtaatacc ggccattgat cgaccagccc aggtcctggc aaagctcgta11880gaacgtgaag gtgatcggct cgccgatagg ggtgcgcttc gcgtactcca acacctgctg11940ccacaccagt tcgtcatcgt cggcccgcag ctcgacgccg gtgtaggtga tcttcacgtc12000cttgttgacg tggaaaatga ccttgttttg cagcgcctcg cgcgggattt tcttgttgcg12060cgtggtgaac agggcagagc gggccgtgtc gtttggcatc gctcgcatcg tgtccggcca12120cggcgcaata tcgaacaagg aaagctgcat ttccttgatc tgctgcttcg tgtgtttcag12180caacgcggcc tgcttggcct cgctgacctg ttttgccagg tcctcgccgg cggtttttcg12240cttcttggtc gtcatagttc ctcgcgtgtc gatggtcatc gacttcgcca aacctgccgc12300ctcctgttcg agacgacgcg aacgctccac ggcggccgat ggcgcgggca gggcaggggg12360agccagttgc acgctgtcgc gctcgatctt ggccgtagct tgctggacca tcgagccgac12420ggactggaag gtttcgcggg gcgcacgcat gacggtgcgg cttgcgatgg tttcggcatc12480ctcggcggaa aaccccgcgt cgatcagttc ttgcctgtat gccttccggt caaacgtccg12540attcattcac cctccttgcg ggattgcccc gactcacgcc ggggcaatgt gcccttattc12600ctgatttgac ccgcctggtg ccttggtgtc cagataatcc accttatcgg caatgaagtc12660ggtcccgtag accgtctggc cgtccttctc gtacttggta ttccgaatct tgccctgcac12720gaataccagc gaccccttgc ccaaatactt gccgtgggcc tcggcctgag agccaaaaca12780cttgatgcgg aagaagtcgg tgcgctcctg cttgtcgccg gcatcgttgc gccacatcta12840ggtactaaaa caattcatcc agtaaaatat aatattttat tttctcccaa tcaggcttga12900tccccagtaa gtcaaaaaat agctcgacat actgttcttc cccgatatcc tccctgatcg12960
accggacgca gaaggcaatg tcataccact tgtccgccct gccgcttctc ccaagatcaa13020taaagccact tactttgcca tctttcacaa agatgttgct gtctcccagg tcgccgtggg13080aaaagacaag ttcctcttcg ggcttttccg tctttaaaaa atcatacagc tcgcgcggat13140ctttaaatgg agtgtcttct tcccagtttt cgcaatccac atcggccaga tcgttattca13200gtaagtaatc caattcggct aagcggctgt ctaagctatt cgtataggga caatccgata13260tgtcgatgga gtgaaagagc ctgatgcact ccgcatacag ctcgataatc ttttcagggc13320tttgttcatc ttcatactct tccgagcaaa ggacgccatc ggcctcactc atgagcagat13380tgctccagcc atcatgccgt tcaaagtgca ggacctttgg aacaggcagc tttccttcca13440gccatagcat catgtccttt tcccgttcca catcataggt ggtcccttta taccggctgt13500ccgtcatttt taaatatagg ttttcatttt ctcccaccag cttatatacc ttagcaggag13560acattccttc cgtatctttt acgcagcggt atttttcgat cagttttttc aattccggtg13620atattctcat tttagccatt tattatttcc ttcctctttt ctacagtatt taaagatacc13680ccaagaagct aattataaca agacgaactc caattcactg ttccttgcat tctaaaacct13740taaataccag aaaacagctt tttcaaagtt gttttcaaag ttggcgtata acatagtatc13800gacggagccg attttgaaac cacaattatg ggtgatgctg ccaacttact gatttagtgt13860atgatggtgt ttttgaggtg ctccagtggc ttctgtgtct atcagctgtc cctcctgttc13920agctactgac ggggtggtgc gtaacggcaa aagcaccgcc ggacatcagc gctatctctg13980ctctcactgc cgtaaaacat ggcaactgca gttcacttac accgcttctc aacccggtac14040gcaccagaaa atcattgata tggccatgaa tggcgttgga tgccgggcaa cagcccgcat14100tatgggcgtt ggcctcaaca cgattttacg tcacttaaaa aactcaggcc gcagtcggta14160acctcgcgca tacagccggg cagtgacgtc atcgtctgcg cggaaatgga cgaacagtgg14220ggctatgtcg gggctaaatc gcgccagcgc tggctgtttt acgcgtatga cagtctccgg14280aagacggttg ttgcgcacgt attcggtgaa cgcactatgg cgacgctggg gcgtcttatg14340agcctgctgt caccctttga cgtggtgata tggatgacgg atggctggcc gctgtatgaa14400tcccgcctga agggaaagct gcacgtaatc agcaagcgat atacgcagcg aattgagcgg14460cataacctga atctgaggca gcacctggca cggctgggac ggaagtcgct gtcgttctca14520aaatcggtgg agctgcatga caaagtcatc gggcattatc tgaacataaa acactatcaa14580taagttggag tcattaccca attatgatag aatttacaag ctataaggtt attgtcctgg14640gtttcaagca ttagtccatg caagttttta tgctttgccc attctataga tatattgata14700agcgcgctgc ctatgccttg ccccctgaaa tccttacata cggcgatatc ttctatataa14760
aagatatatt atcttatcag tattgtcaat atattcaagg caatctgcct cctcatcctc14820ttcatcctct tcgtcttggt agctttttaa atatggcgct tcatagagta attctgtaaa14880ggtccaattc tcgttttcat acctcggtat aatcttacct atcacctcaa atggttcgct14940gggtttatcg cacccccgaa cacgagcacg gcacccgcga ccactatgcc aagaatgccc15000aaggtaaaaa ttgccggccc cgccatgaag tccgtgaatg ccccgacggc cgaagtgaag15060ggcaggccgc cacccaggcc gccgccctca ctgcccggca cctggtcgct gaatgtcgat15120gccagcacct gcggcacgtc aatgcttccg ggcgtcgcgc tcgggctgat cgcccatccc15180gttactgccc cgatcccggc aatggcaagg actgccagcg ctgccatttt tggggtgagg15240ccgttcgcgg ccgaggggcg cagcccctgg ggggatggga ggcccgcgtt agcg15294<210>16<211>2019<212>DNA<213>拟南芥<220>
<221>CDS<222>(1)..(2010)<400>16atg gcg gcg gca aca aca aca aca aca aca tct tct tcg atc tcc ttc48Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe1 5 10 15tcc acc aaa cca tct cct tcc tcc tcc aaa tca cca tta cca atc tcc96Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser20 25 30aga ttc tcc ctc cca ttc tcc cta aac ccc aac aaa tca tcc tcc tcc 144Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser35 40 45tcc cgc cgc cgc ggt atc aaa tcc agc tct ccc tcc tcc atc tcc gcc 192Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser pro Ser Ser Ile Ser Ala50 55 60gtg ctc aac aca acc acc aat gtc aca acc act ccc tct cca acc aaa 240Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys65 70 75 80cct acc aaa ccc gaa aca ttc atc tcc cga ttc gct cca gat caa ccc 288Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro85 90 95cgc aaa ggc gct gat att ctc gtc gag gct tta gaa cgt caa ggc gta 336Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val100 105 110gaa acc gta ttc gct tac cct gga ggt gca tca atg gag att cac caa 384Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln115 120 125
gcc tta acc cgc tct tcc tca atc cgt aac gtc ctt cct cgt cac gaa 432Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu130 135 140caa gga ggt gta ttc gca gca gaa gga tac gct cga tcc tca ggt aaa 480Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys145 150 155 160cca ggt atc tgt ata gcc act tca ggt ccc gga gct aca aat ctc gtt 528Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val165 170 175agc gga tta gcc gat gcg ttg tta gat agt gtt cct ctt gta gca atc 576Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile180 185 190aca gga caa gtc cct cgt cgt atg att ggt aca gat gcg ttt caa gag 624Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu195 200 205act ccg att gtt gag gta acg cgt tcg att acg aag cat aac tat ctt 672Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu210 215 220gtg atg gat gtt gaa gat att cct agg att att gag gag gct ttc ttt 720Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe225 230 235 240tta gct act tct ggt aga cct gga cct gtt ttg gtt gat gtt cct aaa 768Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys245 250 255gat att caa caa cag ctt gcg att cct aat tgg gaa cag gct atg aga 816Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg260 265 270tta cct ggt tat atg tct agg atg cct aaa cct ccg gaa gat tct cat 864Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His275 280 285ttg gag cag att gtt agg ttg att tct gag tct aag aag cct gtg ttg 912Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu290 295 300tat gtt ggt ggt ggt tgt ttg aac tct agc gat gaa ttg ggt agg ttt 960Tyr Val Gly Gly Gly Cys Leu Asn Ser Ser Asp Glu Leu Gly Arg Phe305 310 315 320gtt gag ctt acg gga atc cct gtt gcg agt acg ttg atg ggg ctg gga 1008Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly325 330 335tct tat cct tgt gat gat gag ttg tcg tta cat atg ctt gga atg cat 1056Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His340 345 350ggg act gtg tat gca aat tac gct gtg gag cat agt gat ttg ttg ttg 1104Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu355 360 365
gcg ttt ggg gta agg ttt gat gat cgt gtc acg ggt aaa ctt gag gct 1152Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala370 375 380ttt gct agt agg gct aag att gtt cat att gat att gac tcg gct gag 1200Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu385 390 395 400att ggg aag aat aag act cct cat gtg tct gtg tgt ggt gat gtt aag 1248Ile Gly Lys Ash Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys405 410 415ctg gct ttg caa ggg atg aat aag gtt ctt gag aac cga gcg gag gag 1296Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu420 425 430ctt aaa ctt gat ttt gga gtt tgg agg aat gag ttg aac gta cag aaa 1344Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys435 440 445cag aag ttt ccg ttg agc ttt aag acg ttt ggg gaa gct att cct cca 1392Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro450 455 460cag tat gcg att aag gtc ctt gat gag ttg act gat gga aaa gcc ata 1440Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile465 470 475 480ata agt act ggt gtc ggg caa cat caa atg tgg gcg gcg cag ttc tac 1488Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr485 490 495aat tac aag aaa cca agg cag tgg cta tca tca gga ggc ctt gga gct 1536Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala500 505 510atg gga ttt gga ctt cct gct gcg att gga gcg tct gtt gct aac cct 1584Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro515 520 525gat gcg ata gtt gtg gat att gac gga gat gga agt ttt ata atg aat 1632Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn530 535 540gtg caa gag cta gcc act att cgt gta gag aat ctt cca gtg aag gta 1680Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val545 550 555 560ctt tta tta aac aac cag cat ctt ggc atg gtt atg caa tgg gaa gat 1728Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp565 570 575cgg ttc tac aaa gct aac cga gca cac aca ttt ctc gga gat ccg gct 1776Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Phe Leu Gly Asp Pro Ala580 585 590cag gag gac gag ata ttc ccg aac atg ttg ctg ttt gca gca gct tgc 1824Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys595 600 605ggg att cca gcg gcg agg gtg aca aag aaa gca gat ctc cga gaa gct 1872
Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala610 615 620att cag aca atg ctg gat aca cca gga cct tac ctg ttg gat gtg att 1920Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile625 630 635 640tgt ccg cac caa gaa cat gtg ttg ccg atg atc ccg aat ggt ggc act 1968Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Asn Gly Gly Thr645 650 655ttc aac gat gtc ata acg gaa gga gat ggc cgg att aaa tac tgagagctc2019Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr660 665 670<210>17<211>670<212>PRT<213>拟南芥<400>17Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe1 5 10 15Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser20 25 30Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser35 40 45Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser pro Ser Ser Ile Ser Ala50 55 60Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys65 70 75 80Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro85 90 95Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val100 105 110Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln115 120 125Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu130 135 140Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys145 150 155 160Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val165 170 175Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile180 185 190Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu195 200 205
Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu210 215 220Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe225 230 235 240Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys245 250 255Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg260 265 270Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His275 280 285Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu290 295 300Tyr Val Gly Gly Gly Cys Leu Ash Ser Ser Asp Glu Leu Gly Arg Phe305 310 315 320Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly325 330 335Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His340 345 350Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu355 360 365Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala370 375 380Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu385 390 395 400Ile Gly Lys Asn Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys405 410 415Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu420 425 430Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys435 440 445Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro450 455 460Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile465 470 475 480Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr485 490 495Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala500 505 510Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro515 520 525Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn
530 535 540Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val545 550 555 560Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp565 570 575Arg Phe Tyr Lys Ala Asn Arg Ala His Thr phe Leu Gly Asp Pro Ala580 585 590Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys595 600 605Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala610 615 620Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile625 630 635 640Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Asn Gly Gly Thr645 650 655Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr660 665 670<210>18<211>259<212>DNA<213>人工序列<220>
<221>启动子<222>(1)..(259)<220>
<223>人工序列描述be2启动子片段<400>18gatctctaaa taattcgaaa tatctttgtt attatttttt tctattcaaa ttgcaattag 60acataagtca ttttaactga agctgcattg atgaaaaatt atactatgtc tttatgtata 120tatattaatg ttttaaattc ctttatagtg ataaagatgg ttcgaaacat gctacaaatt 180attatacgaa gttacttttt ttaatctact ttaacaattt tctaatttca ctattgaaca 240tagataccag cccgggccg 259<210>19<211>400<212>DNA<213>人工序列<220>
<223>人工序列描述RNAi 420be2be1<220>
<400>19
gaattgttgt tctcatggac atcgttcaca gccatgcatc aaataatact ttagatggac 60tgaacatgtt tgacggcacc gatagttgtt actttcactc tggagctcgt ggttatcatt 120ggatgtggga ttcccgcctc tttaactatg gaaactggga ggtacttagg tatcttctct 180caaatgcgag atggtggttg ccatttcaca tcaccagaag gaatacctgg agttccagaa 240acaaatttca atggtcgtcc aaattccttc aaagtgctgt ctcctgcgcg aacatgtgtg 300gcttattaca gagttgacga acgcatgtca gaaactgaag tttaccagac agacatttct 360agtgagctac taccaacagc caatatcgag gagagtgacg 400<210>20<211>1105<212>DNA<213>人工序列<220>
<223>人工序列描述RNAi片段<220>
<400>20gaattgttgt tctcatggac atcgttcaca gccatgcatc aaataatact ttagatggac 60tgaacatgtt tgacggcacc gatagttgtt actttcactc tggagctcgt ggttatcatt 120ggatgtggga ttcccgcctc tttaactatg gaaactggga ggtacttagg tatcttctct 180caaatgcgag atggtggttg ccatttcaca tcaccagaag gaatacctgg agttccagaa 240acaaatttca atggtcgtcc aaattccttc aaagtgctgt ctcctgcgcg aacatgtgtg 300gcttattaca gagttgacga acgcatgtca gaaactgaag tttaccagac agacatttct 360agtgagctac taccaacagc caatatcgag gagagtgacg atcaagctga tctctaaata 420attcgaaata tctttgttat tatttttttc tattcaaatt gcaattagac ataagtcatt 480ttaactgaag ttgcattgat gaaaaattat actatgtttt atgtatatat attaattttt 540aaattccttt atagtgataa agatagttcg aaacatgcta taaattatta tacgaattta 600cgttactttt tttaatctac tttaacaatt ttctaatttc actattgaac atagatacca 660gcccgggccg tcgacctcga attcgccctt ggagagtgac gttcgcgtca ctctcctcga 720tattggctgt tggtagtagc tcactagaaa tgtctgtctg gtaaacttca gtttctgaca 780tgcgttcgtc aactctgtaa taagccacac atgttcgcgc aggagacagc actttgaagg 840aatttggacg accattgaaa tttgtttctg gaactccagg tattccttct ggtgatgtga 900aatggcaacc accatctcgc atttgagaga agatacctaa gtacctccca gtttccatag 960ttaaagaggc gggaatccca catccaatga taaccacgag ctccagagtg aaagtaacaa1020ctatcggtgc cgtcaaacat gttcagtcca tctaaagtat tatttgatgc atggctgtga1080acgatgtcca tgagaacaac aattc 1105<210>21<211>180<212>DNA<213>人工序列<220>
<223>人工序列描述SBE RNAi 1<220>
<400>21actagtggta cttaggtatc ttctctcaaa tgcgagatgg tggttgagtg agctactacc 60aacagccaat atcgaggaga gtgacgttcg cgtcactctc ctcgatattg gctgttggta 120gtagctcact caaccaccat ctcgcatttg agagaagata cctaagtacc ttttggtacc 180<210>22<211>420<212>DNA
<213>人工序列<220>
<223>人工序列描述SBE RNAi 2<400>22actagttgga gctcgtggtt atcattggat gtgggattcc cgcctcttta acaatggaaa 60ctgggaggta cttaggtatc ttctctcaaa tgcgagatgg tggttggctt attacagagt 120tgacgaacgc atgtcagaaa ctgaagttta ccagacagac atttctagtg agctactacc 180aacagccaat atcgaggaga gtgacgttcg cgtcactctc ctcgatattg gctgttggta 240gtagctcact agaaatgtct gtctggtaaa cttcagtttc tgacatgcgt tcgtcaactc 300tgtaataagc caaccaccat ctcgcatttg agagaagata cctaagtacc tcccagtttc 360catagttaaa gaggcgggaa tcccacatcc aatgataacc acgagctcca ttttggtacc 420<210>23<211>37<212>DNA<213>人工序列<220>
<223>人工序列描述间隔区<220>
<400>23atcaagctta tcgataccgt cgacctcgaa gcttgat 37<210>24<211>837<212>DNA<213>人工序列<220>
<223>人工序列描述用于RNAi的pHAS3中be2和be1的片段<220>
<400>24gaattgttgt tctcatggac atcgttcaca gccatgcatc aaataatact ttagatggac 60tgaacatgtt tgacggcacc gatagttgtt actttcactc tggagctcgt ggttatcatt 120ggatgtggga ttcccgcctc tttaactatg gaaactggga ggtacttagg tatcttctct 180caaatgcgag atggtggttg ccatttcaca tcaccagaag gaatacctgg agttccagaa 240acaaatttca atggtcgtcc aaattccttc aaagtgctgt ctcctgcgcg aacatgtgtg 300gcttattaca gagttgacga acgcatgtca gaaactgaag tttaccagac agacatttct 360agtgagctac taccaacagc caatatcgag gagagtgacg atcaagctta tcgataccgt 420cgacctcgaa gcttgatcgt cactctcctc gatattggct gttggtagta gctcactaga 480aatgtctgtc tggtaaactt cagtttctga catgcgttcg tcaactctgt aataagccac 540acatgttcgc gcaggagaca gcactttgaa ggaatttgga cgaccattga aatttgtttc 600tggaactcca ggtattcctt ctggtgatgt gaaatggcaa ccaccatctc gcatttgaga 660gaagatacct aagtacctcc cagtttccat agttaaagag gcgggaatcc cacatccaat 720gataaccacg agctccagag tgaaagtaac aactatcggt gccgtcaaac atgttcagtc 780catctaaagt attatttgat gcatggctgt gaacgatgtc catgagaaca acaattc83权利要求
1.增加植物中淀粉产量的方法,其包括培养具有至少一种淀粉生物合成增强性蛋白质增强的表达或活性的植物。
2.权利要求1的方法,其中所述淀粉具有高直链淀粉含量。
3.权利要求1或2的方法,其中直链淀粉的产量增加。
4.权利要求1-3任意一项所述方法,其中所述方法包括过表达淀粉生物合成增强性蛋白质。
5.权利要求4的方法,其中所述蛋白质包含SEQ ID NO2或4或者通过氨基酸替代、插入或缺失来源于所述序列并且与SEQ ID NO2或4在氨基酸水平具有至少50%同一性的蛋白质。
6.权利要求1-5任意一项所述方法,其中所述淀粉生物合成增强性蛋白质是通过选自下列的核酸序列编码的a)核酸序列,其包含与SEQ ID NO1或3核酸序列具有至少60%同一性的核苷酸序列;b)核酸序列,其包含含有核苷酸序列SEQ ID NO1或3的核酸序列的至少30个核苷酸的片段;c)核酸序列,其编码包含与SEQ ID NO2或4的氨基酸序列具有至少约60%同一性的氨基酸序列的多肽,和d)核酸序列,其编码包含氨基酸序列SEQ ID NO2或4的多肽片段或者其中所述片段包含氨基酸序列SEQ ID NO2或4的至少10个连续氨基酸残基。
7.权利要求1-6任意一项所述方法,其中所述淀粉生物合成增强性蛋白质由包含SEQ ID NO1或SEQ ID NO3列出的核苷酸序列的核酸序列编码。
8.权利要求1-7任意一项所述方法,其中活性的缺乏或降低是通过选自下列的方法实现的a)编码所述蛋白质基因的敲除;b)编码所述蛋白质基因的诱变,其中所述诱变可以在所述基因的编码区、非编码区或调节区诱导;c)反义RNA的表达,其中所述反义RNA与编码所述蛋白质的RNA的至少一部分互补。
9.产生直链淀粉型淀粉的方法,其中所述方法是在植物产生增加量的直链淀粉型淀粉的条件下培养过表达SEQ ID NO1或3的植物或者淀粉生物合成增强活性增加的植物。
10.前面权利要求任意一项的方法,其中所述植物属于茄属。
11.权利要求10的方法,其中所述植物是马铃薯。
12.核酸序列SEQ ID NO1,其编码淀粉生物合成增强性蛋白质。
13.核酸序列SEQ ID NO3,其编码淀粉生物合成增强性蛋白质。
14.氨基酸序列SEQ ID NO2,其具有淀粉生物合成增强活性。
15.氨基酸序列SEQ ID NO4,其具有淀粉生物合成增强活性。
16.转基因表达盒,其包含与调节序列联合的选自下面的核酸序列a)核酸序列,其包含与SEQ ID NO1或SEQ ID NO3的核酸序列具有至少60%同一性的核苷酸序列;b)核酸序列,其包含含有核苷酸序列SEQ ID NO1或SEQ ID NO3的核酸序列的至少30个核苷酸的片段;c)核酸序列,其编码包含与SEQ ID NO2或SEQ ID NO4的氨基酸序列具有至少约60%同一性的氨基酸序列的多肽,和d)核酸序列,其编码包含氨基酸序列SEQ ID NO2或SEQ ID NO4的多肽片段或者其中所述片段包含氨基酸序列SEQ ID NO2或SEQ IDNO4的至少10个连续氨基酸残基,其中所述调节序列能够介导所述核酸序列在植物中表达。
17.权利要求16的转基因表达盒,其中所述调节序列是与所述核酸序列异源的启动子序列。
18.权利要求16的转基因表达盒,其中所述调节序列是块茎特异启动子序列。
19.权利要求16、17或18任何一项的转基因表达盒,其中所述核酸序列相对于所述启动子序列以反义或有义方向排列。
20.权利要求16-19任意一项的转基因表达盒,其中所述核酸序列编码包含SEQ ID NO2或SEQ ID NO4列出的氨基酸序列的多肽。
21.权利要求16-20任意一项的转基因表达盒,其中所述核酸分子包含SEQ ID NO1或SEQ ID NO3列出的核苷酸序列。
22.权利要求16-21任意一项的转基因表达盒,其中所述核酸序列编码包含SEQ ID NO2或SEQ ID NO4列出的氨基酸序列的多肽的天然存在的变体。
23.转基因宿主细胞,其经权利要求16-22任意一项的表达盒转化。
24.权利要求23的转基因宿主细胞,其中所述宿主细胞属于茄属。
25.转基因植物,其包含权利要求16-22任意一项的表达盒。
26.转基因马铃薯植物,其包含权利要求16-22任意一项的表达盒。
27.转基因马铃薯植物、植物部分、种子或块茎,所述转基因马铃薯植物、植物部分、种子或块茎包含权利要求16-22任意一项的表达盒。
全文摘要
本发明涉及通过表达淀粉生物合成增强性蛋白质在植物中,优选在马铃薯植物中增加直链淀粉含量的方法。本发明还涉及在马铃薯植物,优选在块茎中表达所述多肽的表达盒,还涉及表达所述多肽的转基因植物以及所述转基因植物在精细化学品,特别是天然淀粉之外的精细化学品生产中的用途。
文档编号C12N15/29GK1777677SQ200480010593
公开日2006年5月24日 申请日期2004年3月3日 优先权日2003年3月7日
发明者P·霍万德, M·安德松 申请人:巴斯福植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1