蔗糖结合蛋白的制作方法

文档序号:168987阅读:787来源:国知局
专利名称:蔗糖结合蛋白的制作方法
技术领域
本发明涉及植物中的碳水化合物代谢,具体地讲,涉及蔗糖结合蛋白(SBP)。本发明内容包括从大豆中分离出来新的SBP基因,以及表现增强的蔗糖摄取活性的修饰的SBP。同时也提供了具有被改变的蔗糖摄取活性的核酸载体、转基因细胞和转基因植物。本发明还涉及用于调控转基因(包括SBP转基因)在植物中表达的启动子序列。发明背景在植物中蔗糖运输的调节是影响植物生长和生产力的主要因素。通过光和作用,植物将大气中的二氧化碳固定为磷酸丙糖,然后磷酸丙糖用于生产蔗糖和其它碳水化合物。然后这些碳水化合物被运输到植物各处作为能源蔗糖、生物合成的碳骨架以及未来生长需要的储备。蔗糖是被输送的碳水化合物的主要形式。植物细胞主动运输蔗糖穿过原生质膜的能力,以至于固定在韧皮部的蔗糖能够被吸收到细胞中使用,是蔗糖利用的关键步骤。
植物种子的形成涉及碳的累积和氮的储备,储备的形式既可以抵御干燥又可以用作在萌发过程中胚的发育能源。种子形成过程中碳的累积由特异的原生质膜蛋白质介导(Overvoorde等,1996;Riesmeier等,1992;Bush,1993)。用可光解蔗糖类似物对从大豆子叶组织分离出来的膜经光亲和力标记鉴定出一种独特的62 kD蔗糖结合蛋白,或称SBP(Ripp等,1988)。对编码SBP的cDNA及由其推断出来的氨基酸序列分析表明,SBP在其N-末端有一个疏水区,除此之外,SBP是一个缺乏普遍存在于运输蛋白质中的跨膜疏水片段的亲水蛋白质(Grimes等,1992)。SBP的拓扑学的生化分析证明它与原生质膜的外部小叶密切相关(Overvorrde和Grimes,1994)。免疫定位试验证实SBP是细胞原生质膜上涉及蔗糖主动吸收的唯一相关蛋白质,说明SBP可能在蔗糖的摄取过程中发挥作用(Grimes等,1992)。在酵母系统中由SBP介导的蔗糖摄取的动力学分析表明,该摄取虽为蔗糖特异性,但是质子非依赖性的,且为相对不饱和性的,因此界定了一种新的蔗糖摄取机制(Overvoorde等,1996)。
种子形成中对蔗糖的摄取影响成熟种子的两个典型农业特征所结籽粒的碳水化合物含量,以及籽粒种植后长出的幼苗的活力。当对增加种子中的碳水化合物含量有利时(例如,种子是收获的主要植物材料,例如大豆),在种子形成中增强蔗糖摄取活性应该是理想的。相反,当收获的是植物的无性材料时,降低种子中的蔗糖摄取活性就应当是理想的。因此,种子形成过程中,蔗糖摄取活性改变的植物将具有显著的农业重要性,本发明即是针对这些植物。发明概述本发明提供了编码植物蔗糖结合蛋白的分离的核酸分子,该蔗糖结合蛋白是种子形成过程中负责蔗糖摄取的关键蛋白质。在一个实施方案中,本发明提供了蔗糖结合蛋白的修饰型,其表现出增强的蔗糖摄取活性。
以前描述的来源于大豆的蔗糖结合蛋白(Overvoode等,1996)在本文中称为SBP1。本文提供了一种新的SBP,称为SBP2。SBP2多肽的长度为489个氨基酸残基,在种子形成过程中显示其表达水平增强。在异源酵母分析系统中SBP2多肽显示具有蔗糖摄取活性。
另外,本发明提供了SBP1和SBP2蛋白质的修饰形式,其具有增强的蔗糖摄取活性。在一个实施方案中,这种形式是去除上述蛋白质C-末端氨基酸残基的缺失突变体。举例说明,去除SBP1蛋白质C-末端的80个氨基酸残基,得到的蛋白质在酵母分析系统中表现出增强的蔗糖摄取活性。
本发明还提供了大豆SBP1和SBP2基因的5’调节区(包括启动子序列)。这些调节区允许种子形成中的特异性的或增强的表达,因此可以用于表达种子形成中的任何转基因。
因此,本发明一方面提供了一种经修饰的植物蔗糖结合蛋白,其中与相应的野生型蔗糖结合蛋白相比,经修饰的蔗糖结合蛋白具有被改变的氨基酸序列,并且与相应的野生型蔗糖结合蛋白相比,经修饰的蔗糖结合蛋白在酵母分析系统中的表达使蔗糖摄取增强。在具体实施方案中,本发明的经修饰的蔗糖结合蛋白与野生型蔗糖结合蛋白相比,在酵母分析系统中使蔗糖摄取增加至少10%,优选至少25%。在某些实施方案中,经修饰的植物蔗糖结合蛋白与野生型蔗糖结合蛋白相比,具有改变的氨基酸序列,包括C-末端截短。这种截短典型地在10-100个氨基酸之间,优选约80个氨基酸。虽然可以从任何已知的蔗糖结合蛋白中制备该经修饰的SBP,然而SBP1和SBP2的修饰形式则是本发明所举出的实例。SBP1和SBP2的修饰形式包括分别具有Seq.I.D.No.2和4所示氨基酸序列的那些形式。
另一方面,本发明提供了编码经修饰的植物蔗糖结合蛋白的核酸分子,以及包括这种核酸分子的载体。本发明还提供了表达经修饰的蔗糖结合蛋白的转基因植物。这种转基因植物可能具有被改变的蔗糖摄取活性,特别是在种子形成过程中。
再一方面,本发明提供了编码蔗糖结合蛋白SBP2或SBP2蛋白变异体的分离的核酸分子。上述蛋白质可以包括Seq.I.D.No.3和4所示的氨基酸序列,或者包含与这些序列至少70%、优选至少90%的序列相同的序列。本发明还提供包括上述核酸分子的重组表达盒序列,以及包含该重组表达盒序列的转基因植物。
本发明的又一方面是包括启动子序列的重组核酸分子,该启动子序列可操作地与核酸序列连接,其中启动子序列包括SBP1或SBP2启动子。该启动子优选包括Seq.I.D.No.6和7所示的5’调节序列的至少25个连续核苷酸。在具体实施例中,所述核酸序列包括植物蔗糖结合蛋白编码序列。包括该重组核酸分子的转基因植物也是本发明的一方面。
本发明的上述方面和其它方面,将在下面的描述中详细讨论。附图简述


图1显示SBP1和SBP2蛋白质序列的排列。
图2是在酵母分析系统中的蔗糖摄取活性图。序列表序列表中列出的核酸和氨基酸序列是通过核酸碱基的标准单字母缩写和氨基酸的三字母代码表示。每个核酸序列仅列出一条链,但是应当理解通过参考已被展示链的互补链也包括在内。
Seq.I.D.No.1表示SBP1蛋白质的氨基酸序列。
Seq.I.D.No.2表示C-末端80个氨基酸被去除的截短的SBP1蛋白质的氨基酸序列。
Seq.I.D.No.3表示SBP2蛋白质的氨基酸序列。
Seq.I.D.No.4表示C-末端80个氨基酸被去除的截短的SBP2蛋白质的氨基酸序列。
Seq.I.D.No.5表示SBP2 cDNA序列。
Seq.I.D.No.6表示SBP2基因的5’调节区。
Seq.I.D.No.7表示SBP1基因的5’调节区。
Seq.I.D.No.8-14表示可以用于扩增SBP2 cDNA的各区或5’调节区的寡核苷酸。发明详述I.方法本发明可以使用标准分子生物学方法操作。这些方法在一些出版物中已有描述,包括Sambrook等(1989),Ausubel等(1994),Innis等(1990),Weissbach和Weissbach(1989),Tijssen(1993)。
II.定义除非另有说明,使用的技术术语按照常规的用法应用。分子生物学一般术语的定义可以在以下出版物中找到Benjamin Lewin,基因V,Oxford University Press出版,1994(ISBN 0-19-854287-9);Kendrew等(编),分子生物学大全,Blackwell Science Ltd.出版,1994(ISBN0-632-02182-9);Robert A.Meyers(编),分子生物学和生物技术案头参考大全(Comprehensive Desk Rererence),VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8)。DNA碱基的命名如37 CFR§1.822的规定,本文使用氨基酸残基的标准三字母代码。
为了便于查阅本发明的各实施方案,提供下列术语的定义蔗糖结合蛋白(SBP)SBP涉及植物中蔗糖的摄取。可以通过最早由Overvoorde等(1996)描述的酵母蔗糖摄取分析方法方便地确定和检测该蔗糖摄取活性,下面还将详细描述该方法;在这种分析系统中,SBP赋予酵母细胞以蔗糖摄取能力,否则酵母细胞不能够摄取蔗糖。术语SBP的应用通常指任何蔗糖结合蛋白,包括以前由Grimes等(1992)描述的蔗糖结合蛋白。本发明提供了一种编码以前未曾报道的蔗糖结合蛋白的cDNA,该蛋白是来自大豆(Glycine max)的SBP2蛋白。然而本发明不限于这种特述的SBP其它编码SBP酶的核苷酸序列也是本发明的一部分,这些核苷酸序列包括已公开的甘氨酸基因序列的变异体和来自其它植物种的直向同源序列,现在已能够对它们进行克隆了。这些序列都具有基本的功能特征编码能够在所述酵母分析系统中介导蔗糖摄取的酶。编码SBP的核酸序列和这些核酸序列编码的蛋白质不仅均具有这种功能特征,而且均具有特异水平的序列相似性(或序列同一性),如下面将要说明的。序列同一性的概念也可以表示为严谨条件下两个序列相互杂交的能力。
本发明还提供了功能特征得到改变的经修饰的SBP,以及编码这种蛋白质的核酸序列。从一种未转化(野生型)植物中分离出来的SBP可以认为具有野生型氨基酸序列。经修饰的SBP的氨基酸序列与野生型氨基酸序列不同。这种不同可以采取氨基酸缺失、增加、取代或截短的形式。氨基酸序列缺失的蛋白质没有了野生型序列中存在的一个或多个氨基酸残基;上述残基可以从蛋白质的任何部分删除。相比较而言,截短的蛋白质是上述蛋白质的N和/或C末端的一个或多个氨基酸被删除的形式。因此,截短的蛋白质是氨基酸缺失蛋白质中的小类。
编码被改变的SBP的核酸序列可以容易地利用标准方法制备,例如位点定向诱变和聚合酶链反应扩增。
序列同一性两个核酸序列或两个氨基酸之间的相似性用术语序列间的相似性,或者称为序列同一性表示。序列同一性通常以等同百分比(或相似百分比或同源百分比)度量;百分数越高,两个序列越相似。
氨基酸序列的序列同一性百分数的计算可以考虑保守氨基酸取代。保守氨基酸取代涉及将一种氨基酸残基用另一种具有类似化学和生物学性质(例如,电荷或疏水性)的残基取代。这种取代通常不改变蛋白质的功能特征,因此可以考虑通过赋予一个在等同(即,在该氨基酸位置无改变)和非保守残基变化值之间的值计算序列同一性。因此,保守氨基酸改变认为是部分的而不是全部的错配,从而增加了百分序列同一性。例如,如果相同氨基酸打分为1,非保守取代打分为0,则保守取代应该打分为0.5。保守取代的打分按照,例如,Meyers和Miller(1988)的运算法则计算,例如,在PC/GENE程序中(Intelligenetics,Mountain View,California,USA)执行。
用于比较的序列排比方法是本领域公知的。以下出版物描述了各种程序和排序运算法则Smith和Waterman(1981);Needleman和Wunsch(1970);Pearson和Lipman(1988);Higgins和Sharp 1988);Higgins和Sharp(1989);Corpet等(1988);Huang等(1992);和Pearson等(1994)。Altschul等(1994)记载了序列排比方法和同源性计算的全面周到的考虑。
NCBI Basic Local Alignment Search Tool(BLAST)(Altschul等,1990)可由以下几个来源获得,包括国家生物信息中心(NCBI,Bethesda,MD)和Internet,并结合序列分析程序blastp,blastn,blastx,tblastn和tblastx一起使用。可以按照<http//www.ncbi.nlm.nih.gov/BLAST>网址登录。如何利用这些程序来确定序列同一性的描述可在<http//www.ncbi.nlm.nih.gov/BLAST/blast_help.html>上获得。
已公开的SBP2蛋白类似物的特征在于拥有覆盖大豆SBP2氨基酸序列的已公开的氨基酸序列全长序列至少80%的序列同一性,其中应用NCBI Blast 2.0,设置blastp为默认指标。这种同源多肽优选拥有至少85%、更优选至少90%,最优选至少95%的序列同一性,这些值均通过上述方法确定。如果比较序列同一性时使用不完整序列,以10-20个氨基酸序列的短窗(short windows)计,类似物应当拥有至少90%、优选至少95%,最优选至少98%的序列同一性。经这种短窗确定序列同一性的方法在<http//www.ncbi.nlm.nih.gov/BLAST/blast_FAQs.html>有描述。具有上述序列同一性的类似物也拥有在所述酵母分析系统中介导蔗糖摄取的能力。本发明不仅提供上述多肽类似物,还提供编码这种类似物的核酸分子。
大豆SBP2基因的类似物具有相似的特征,即拥有与已公开的甘氨SBP2基因序列全长序列有至少70%的序列同一性,该分析使用NCBI Blast 2.0,设置blastn为默认值。这种同源核酸优选拥有至少75%的的序列同一性,更优选至少80%的等同性,最优选至少90%或95%的序列同一性,这些值均通过上述方法确定。如果比较序列同一性时使用不完整序列,以30个核苷酸框计,类似物应当拥有至少85%,优选至少90%,最优选至少95%的序列同一性。具有上述序列同一性的类似物在某些实施方案中,在所述酵母分析系统中也编码具有介导蔗糖摄取能力的多肽。然而,如果上面定义的类似物不编码功能多肽,它们也用于改变转基因植物中的蔗糖摄取活性(例如,用于构建反义链)。
两个核酸分子基本上同源的另一种表示方法是,当一个分子用作杂交探针,另一个存在于生物样品中,例如细胞的基因组材料中时,这两个分子可以在严谨条件下彼此杂交。特异性杂交意味着两个分子基本上仅彼此杂交,而不与基因组材料中可能存在的其它分子杂交。严谨条件是序列依赖性的,其在不同环境因素下表现不同。严谨条件通常被选择为在一定离子强度和pH下,比特异序列热熔点(Tm)低5℃-20℃的温度。Tm是50%的目标序列与最佳匹配探针杂交的温度(在一定离子强度和pH下)。核酸杂交的条件和严谨度计算方法可以在Sambrook等(1989)和Tijssen(1993)中找到。杂交条件和严谨度将在下面进一步讨论。
然而由于遗传密码子的间并性,不表现高度等同性的核酸序列同样可以编码类似的氨基酸序列。应当理解利用这种间并性可以进行核酸序列的改变,从而制备基本上都编码同样蛋白质的多种核酸序列。
探针和引物基于本发明提供的核酸,可以很容易地制备核酸探针和引物。探针包括分离出的核酸,其与可检测标记物或报告分子相连。典型的标记物包括放射性同位素、配基、化学发光试剂、以及酶。标记方法和适合各种目的的标记物的选择指导在Sambrook等(1989)和Ausubel等(1987)中有探讨。
引物是短核酸,优选长度为15个核苷酸或更多一点的DNA寡核苷酸。通过核酸杂交形成引物和目标DNA链的杂合体,可以将引物退火形成互补的目标DNA链,然后通过DNA聚合酶延伸目标DNA链。引物对可以用于扩增核酸序列,例如,通过聚合酶链反应(PCR),或者本领域已知的其它核酸扩增方法。
制备和使用探针和引物的方法在,例如Sambrook等(1989),Ausubel等(1987)和Innis等(1990)中有述。PCR引物对可以来源于已知序列,例如,使用为该目的设计的计算机程序例如Primer(Version 0.5,1991,Whitehead Institute for Biomedical Research,Cambridge,MA)。本领域技术人员可以理解,特别探针或引物的特异性随其长度的增加而增加。因此,例如,含SBP1或SBP2基因5’调节区20个连续核苷酸的引物与目标序列(例如,来自Faba bean相应的SBP调节区)的退火比仅有15个核苷酸的相应引物具有更高的特异性。因此,为了获得较高的特异性,可以选择含本文公开的核酸序列的20、25、30、35、40、50或更多连续核苷酸的探针和引物。
转化转化细胞是通过分子生物学技术将核酸分子导入其中的细胞。就象本文中用到的,术语“转化”包括将核酸分子导入所述细胞的所有技术,包括农杆菌转化、质粒转化、病毒转染、以及裸DNA通过电穿孔、脂转染和加速粒子枪的导入。
载体是被导入宿主细胞的核酸分子,从而产生转化的宿主细胞。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制起点。载体还可以包括一种或多种可选择标识基因和其它本领域已知的遗传单元。
分离的一种“分离的”生物成分(例如核酸或蛋白质)是已经从有机体的细胞中与其它天然存在的生物成分(即其它染色体和染色体外的DNA和RNA,以及蛋白质)中基本上分离或纯化出来的成分。因此已经“分离的”核酸和蛋白质包括用标准纯化方法纯化的核酸和蛋白质。该术语还包括通过在宿主细胞中的重组表达制备的核酸和蛋白质以及化学合成的核酸。
纯化的术语“纯化的”不需要绝对地纯净;实际上,它倾向于表示一个相对概念。因此,例如,一种纯化的SBP制品是比蛋白质在细胞的自然环境中更富含SBP的制品。SBP制品优选被纯化到SBP占该制品总蛋白质含量的至少50%。
有效地连接当第一种核酸序列被置于与第二种核酸序列具有功能关系的位置时,称为第一种核酸序列与第二种核酸序列有效地连接。例如,如果一种启动子影响编码序列的转录或表达,则可将启动子有效地连接于编码序列。通常,有效连接的DNA序列非常靠近,其中必须将两个蛋白编码区连接在一个读码框中。
重组重组核酸具有非自然发生序列,或具有将两个分开的序列部分进行人工组合得到的序列。上述人工组合通常通过化学合成或更普遍地通过对分离的核酸片段进行人工操作,例如通过基因工程技术实现。
直向同源如果两个核苷酸或氨基酸序列具有共同的祖先序列,当带有祖先序列的种分成两个种时这两个序列分开,那么这两个核苷酸序列或氨基酸序列是直向同源序列。直向同源序列也是同源序列。
转基因植物就象本文用到的,该术语指植物中含有在该类型的植物中通常不会存在的重组遗传材料,而且该种遗传材料通过人类操作被导入所讨论的植物(或者导入该植物的亲本)。因此,从通过转化导入重组DNA的植物细胞生长成的植物是转基因植物,含有被导入DNA的植物的所有子代(无论有性生殖还是无性生殖)也都是转基因植物。可以从任何可转化植物种生产转基因植物,包括单子叶植物和双子叶植物,包括(但不限于)大豆、水稻、小麦、大麦和玉米。
III.SBP2 cDNA和其编码的SBP2多肽SBP2 cDNA的核酸序列如Seq.I.D.No.5所示,SBP2蛋白质的氨基酸序列如Seq.I.D.No.3所示。SBP1和SBP2氨基酸序列的比较如
图1所示。
i.SBP1和SBP2基因在大豆叶和子叶中的不同表达离体合成32P-标记的SBP1和SBP2 5’-侧翼区的有义和反义RNA,5.3×105cpm的SBP1有义RNA探针、SBP1反义RNA探针、SBP2有义RNA探针或SBP2反义RNA探针与5μg来自大豆叶和子叶的poly(A+)mRNA杂交。观察到SBP1和SBP2的转录物在大豆子叶中有相似水平的累积。相比较而言,4周龄的大豆叶中没有检测到SBP1和SBP2的转录物。
ii.大豆SBP1和SBP2基因的不同表达用RNase保护法检查大豆种子中SBP1和SBP2基因的表达模式。种子子叶的发育描述为5个状态(状态1=或<4mm,状态2=5-6mm,状态3=7mm,状态4=9mm,状态5=11-12mm)。子叶形成过程中,SBP1反义探针保护三个主要片段(119,111,和97个核苷酸),表明其中用到3个不同的转录起始位点。SBP1mRNA水平在第3状态达到峰值,这种表达水平一直持续到第5状态。相比较而言,当使用SBP2反义探针时检测到5种被保护的片段,SBP2mRNA的水平连续增长直到种子达到11-12mm。定量数据表明SBP1mRNA的水平比SBP2mRNA的水平高出3倍多。叶尖mRNA的水平非常低。然而,延长照射后,在3mm叶尖中观察到低水平的SBP1mRNA。这些数据表明种子形成过程中SBP1mRNA和SBP2mRNA的转录均很活跃,但转录状况不同。
IV.SBP1和SBP2的5’调节区假定SBP1和SBP2的表达为组织特异性表达,则承担这种表达的基因的调节区值得关注,它们可以用于在相似组织特异性模式中调节转基因的表达。
SBP1和SBP2的5’调节区分别如Seq.I.D.No.6和7所示。
V.具有增强的蔗糖摄取活性的经修饰的SBPOvervoorede等(1996)描述的酵母分析系统用于确定修饰SBP蛋白质的氨基酸序列的效能。该分析中使用酵母菌株susy7(Riesmeier等,1992)的衍生物,该衍生物具有稳定整合到其基因组中的菠菜蔗糖合成酶的cDNA,该酶介导细胞内蔗糖的水解。然而,这种酵母菌株缺乏运输蔗糖的能力,因此不能够在蔗糖作为唯一碳源的培养基中生长(Riesmeier等,1992)。为了产生能够选择被蔗糖结合蛋白基因转化的酵母的宿主菌株,通过让susy7菌株在含5’-氟-4-羧基尿嘧啶的培养基上生长,选择尿嘧啶营养缺陷型susy7菌株(Overvoorede等,1996)。得到的菌株,susy7/ura3不能够在缺乏尿嘧啶且只含蔗糖作为单一碳源的培养基上生长。
如Overvoorede等(1996)的描述在酵母载体pMK195中构建由酵母乙醇脱氢酶1(ADH1)启动子、SBP开放读码框和ADH1多聚腺苷化信号序列组成的嵌合基因,以制备命名为pYESBP的质粒。利用基本上如Gietz等(1992)描述的基于LiOAc的小规模方法,用上述构建体转化susy7/ura3酵母菌株。然后将转化的酵母在含2%葡萄糖(CM[GLU])或2%蔗糖(CM[SUC])的排除尿嘧啶的选择培养基上铺板(Ausubel等,1994)。
通过下述操作分析蔗糖的摄取让转化的酵母细胞生长到在YPD中OD600为0.5-1.3,离心收获细胞,用25mM Mes-KOH,pH5.5,0.5-2.5μCi14C蔗糖溶液漂洗细胞两次,并以终浓度未标记蔗糖漂洗两次。在特定时间点收集等分量的摄取溶液和细胞,然后转移到5ml冰水中以停止摄取。用玻璃纤维滤器过滤收集细胞,用5ml冰冷水冲洗5次。通过液体闪烁计数确定细胞吸收的放射性。所有摄取分析均在1mM蔗糖终浓度中进行。
构建编码修饰形式的SBP1蛋白质的核酸序列,并将其导入上述pYESBP构建体。图2显示由pMK195载体单独转化的酵母细胞得到的蔗糖摄取速率(实心圆),用表达全长SBP1蛋白质的构建体转化的酵母细胞得到的蔗糖摄取速率(实心方框),以及用表达失去C-末端80个氨基酸的截短SBP1蛋白质的构建体转化的酵母细胞得到的蔗糖摄取速率(实心三角)。这种截短的SBP1蛋白质的氨基酸序列如Seq.I.D.No.2所示。截短的蛋白质包括全长SBP1的第1-444残基。
这种出乎意料的结果表明增强植物中的蔗糖摄取能力可以通过将编码经修饰的SBP的转基因导入植物获得。经修饰的具有增强的蔗糖摄取活性的SBP包括C-末端删除的SBP1和SBP2形式。这种删除包括从C-末端除去约80个氨基酸,但也可以应用多于或少于80个氨基酸的删除。任何具有特别删除的蔗糖摄取活性可以容易地利用上述酵母蔗糖摄取分析系统确定。因此,以举例说明的方式,C-末端删除10-100个氨基酸的SBP蛋白质可以作为具有增强的蔗糖摄取活性蛋白质的侯选,并且可以利用该系统分析。实施例下列实施例作为本发明各种具体实施方式
的说明。实施例1制备SBP核酸的优选方法本发明提供SBP2 cDNA序列和SBP2蛋白质的氨基酸序列、经修饰的具有增强的蔗糖摄取活性的SBP蛋白质的氨基酸序列,以及SBP1和SBP2基因的5’调节区。目前在制备编码本发明所述的各种SBP蛋白质的核酸序列以及SBP基因5’调节区的优选方法中可以使用聚合酶链反应(PCR)。编码本发明SBP蛋白质的cDNA的PCR扩增可以通过对植物cDNA文库进行直接PCR实现,或者利用从植物细胞中提取出来的RNA作为模版进行逆转录PCR(RT-PCR)实现。SBP基因序列和5’调节区的扩增可以通过对植物基因组DNA或者对植物基因组文库进行直接PCR扩增实现。直接PCR和RTPCR的方法和条件是本领域已知的,Innis等(1990)对此有描述。
按照将被扩增的cDNA或基因部分选择PCR引物。可以选择引物来扩增cDNA、开放读码框、完整cDNA分子或完整基因序列中的小片段。为适应不同长度的引物,需要调整扩增条件;这种考虑是本领域的公知常识,并在Innis等(1990)、Sambrook等(1989)、和Ausubel等(1992)中有探讨。仅作为举例说明的方式,Seq.I.D.No.5所示的完整SBP2 cDNA分子可以利用下列组合引物扩增引物15’TGTAAAACGACGGCCAGTGAATT 3’(Seq.I.D.No.8)引物25’GATTACGCCAAGCTCGAAATTAA 3’(Seq.I.D.No.9)SBP2 cDNA的开放读码框部分可以用下列引物对扩增引物35’ATGGCGACCAGAGCCAAGCTTTCTTTA 3’(Seq.I.D.No.10)引物45’CGCAACAGCGCGACGACCACGCTCGCT 3’(Seq.I.D.No.11)编码截短的SBP2蛋白质(从C-末端除去80个氨基酸)的cDNA可以用下列引物对扩增引物35’ATGGCGACCAGAGCCAAGCTTTCTTTA 3’(Seq.I.D.No.10)引物55’GAAGGGATGACCAGGAGGGACAACAAA 3’(Seq.I.D.No.12)SBP2的5’调节序列可以用下列引物对扩增引物65’TTGTAAACGACGGCCAGTGAATT 3’(Seq.I.D.No.13)引物75’GGTGAGGTCAGTGAGGAACAACA 3’(Seq.I.D.No.14)这些引物仅作为说明;本领域技术人员应当理解从已经提供的核酸序列中可以得到很多不同的引物,从而扩增这些分子的特别区域。推荐对这些扩增程序得出的PCR产物进行重新测序;它将有利于确定扩增序列,并将提供不同生态型和植物种群中该序列天然变异的信息。
来源于SBP2 cDNA或SBP1和SBP2 5’调节区的寡核苷酸包括在本发明的范围内。这种寡核苷酸引物优选包括来自SBP2 cDNA或基因序列的至少15-20个连续核苷酸的序列。为了增强扩增特异性,可以使用含有这些序列的至少25、30、35、40、45或50个连续核苷酸的寡核苷酸引物。
另外,可以利用来源于已公开的cDNA序列的引物,通过PCR扩增获得SBP2基因序列,以便作为探针对基因组文库或基因组DNA进行筛选,或者通过利用来源于SBP2 cDNA序列的标记探针对基因组DNA文库进行筛选。这些研究中可以使用标准PCR扩增或杂交方法。实施例2从其它植物品种分离同源基因序列本文除提供大豆SBP2 cDNA、SBP5’调节区,以及对SBP蛋白质、尤其是C-末端截短的SBP蛋白质进行修饰导致蔗糖摄取活性增强这一发现外,本发明还能够从其他植物品种得到相应分子。因此,本发明可以从其他植物品种分离SBP2类似物,以及从其他植物品种生产效能增强的SBP蛋白质。可以使用常规杂交和PCR扩增方法从其他品种获得相应的cDNA,以及制备编码活性增强的SBP蛋白质的核酸。这两种技术的共同之处在于来源于SBP2 cDNA或基因序列的探针或引物与目标核苷酸的杂交,在常规杂交研究中,它们可以是cDNA或基因组文库;在PCR扩增情况下,它们可以是cDNA或基因组文库或者是mRNA制品。
可以对从需要的植物品种制备的cDNA或基因组文库进行直接PCR扩增,或者利用植物细胞的mRNA提取物采用标准方法进行RT-PCR。PCR引物包括SBP2 cDNA的至少15个连续核苷酸。本领域技术人员将能够理解大豆SBP2 cDNA和将被扩增的目标核酸之间的序列差异可能导致扩增效率降低。为了弥补这一缺陷,在扩增循环中将使用较长的PCR引物或较低的退火温度。应用较低的退火温度时,在后续扩增循环中需应用嵌套引物对来增强特异型。
对于常规杂交,杂交探针优选与可检测标记例如放射性标记结合,并且探针优选长度至少为20个核苷酸。如同本领域已知的,增加杂交探针的长度有助于增强特异性。来源于大豆SBP2 cDNA或基因序列的标记探针可以与植物cDNA或基因组文库进行杂交,应用本领域已知的方法检测杂交信号。然后纯化杂交克隆或噬菌斑(依赖于使用的文库的种类),从克隆或噬菌斑中分离和鉴别其中含有的克隆序列。
或者可以通过免疫筛选表达文库来获得大豆SBP2 cDNA的类似物。按照本文公开的SBP2核酸序列,可以在异源表达系统(例如,E.coli)中表达和纯化该酶,用于生产对SBP2蛋白质特异的抗体(单克隆抗体或多克隆抗体)。也可以生产抗来源于本文提供的SBP2氨基酸序列的合成多肽的抗体。生产抗体的方法是本领域已知的,Harlow和Lane(1988)曾有描述。然后可以用这种抗体利用上述方法筛选表达cDNA文库,该cDNA文库是由需要从其中克隆SBP2定向进化同源物的植物制备的。选择出来的cDNA可以通过测序和酶活性进行确定。
大豆SBP2基因或cDNA、以及其他植物来源的上述序列类似物,可以整合到转化载体中,并导入植物,用以改变这种植物中的SBP活性,如下述实施例3中所描述。另外,如本文的指教,编码经修饰的SBP蛋白质的核酸也可以用于生产蔗糖摄取活性改变的植物。可以预料,SBP基因自身启动子特别适用于本发明的实践,因它可以用于驱动SBP转基因例如反义构建物的表达。通过利用SBP基因自身启动子,并协同自身SBP基因(例如,在同样的时序或组织特异性表达模式中)可以调节这些转基因的表达。实施例3蔗糖摄取活性改变了的转基因植物一旦分离出编码涉及决定特定的植物特征的蛋白质的基因后,可以使用标准技术在转基因植物中表达cDNA,以便改变上述特定的植物特征。基本研究是将cDNA克隆到转化载体中,使它有效地与调控序列(例如,启动子)连接,从而使cDNA在植物细胞中表达。然后从多种方法中选择一种(例如,电穿孔),用于将转化载体导入植物细胞,然后筛选含有被导入cDNA的子代植物。优选所有或部分转化载体稳定整合到植物细胞的基因组中。整合到植物细胞并含有被导入的cDNA和控制表达的相关序列(导入的“转基因”)的转化载体部分,可以称作重组表达盒序列。
可以通过检测表现型的改变筛选含有被导入转基因的子代植物。这种表现型可以直接来源于克隆到转化载体中的cDNA,或者可以通过将可选择标识基因整合到转化载体中导致对某种化学试剂的抗性增强,从而验证转基因的导入。
调控序列(a)的选择和cDNA(或者筛选出的部分cDNA)在转化载体中相对于调控序列如何排列(b)的选择,将在一定程度上决定由导入cDNA影响的植物特征如何改变。例如,调控序列可以是组织特异性的,从而cDNA只能在植物的特殊组织(例如,花粉、种子)中表达,因此由导入cDNA影响的特征仅在这些组织中有所改变。可以使cDNA转录物得以正常表达的方式相对于调控序列安排cDNA序列,或者将cDNA序列安排在反义方向上。克隆cDNA对应的反义RNA的表达将导致目标基因产物的减少(目标基因产物是由提供被导入cDNA的植物基因编码的蛋白质)。被导入cDNA的过表达(是由载体中相对于调控序列正义方向上的cDNA产生的)可能导致基因产物水平的增加,或者导致该基因产物的共抑制(也称为“有义抑制”)。
由克隆cDNA序列转化导致植物特征改变的成功例子在技术和科学文献中非常多。选择用于说明本技术领域目前知识水平,通过参考引入本文的例子包括U.S.专利No.5451514,Boudet(利用反义RNA和共抑制改变木质素的合成);U.S.专利No.5443974,Hitz(利用反义RNA和共抑制改变饱和脂肪酸和不饱和脂肪酸的水平);U.S.专利No.5530192,Murase(利用反义RNA改变氨基酸和脂肪酸组成);U.S.专利No.5455167,Voelker(改变中链脂肪酸);U.S.专利No.5231020,Jorgensen(利用共抑制改变类黄酮);U.S.专利No.5583021,Dougherty(通过正义不可翻译RNA的表达改变病毒抗性);WO96/13582(利用过表达、共抑制和反义RNA并协同ArabidopsisFAE1基因改变种子VLCFA的组成);WO95/15387(利用西蒙得木腊合成基因的过表达改变种子VLCFA的组成)。
这些例子包括以下描述转化载体的选择、转化方法和设计用于过表达被导入cDNA或用于表达cDNA对应的反义RNA的构建体的构建。根据以前描述的和本文提供的SBP2基因和关于编码具有增强的蔗糖摄取活性的改变SBP蛋白的核酸的指示,因此以下是显而易见的,即本领域的技术人员能够将这些核酸或这些分子的同源物或衍生形式(例如,反义形式)导入植物,从而生产在种子或其他组织形成过程中蔗糖摄取活性改变的植物。该结果可以改变具有农业和经济重要性的植物。
a.植物种类按照本发明的核酸分子(例如,SBP2基因、编码经修饰的SBP蛋白质的核酸、这些序列的同源物和例如反义形式的衍生物)可以导入任何植物类型,从而改变该植物的蔗糖摄取活性。因此,本发明的序列可以用于改变任何高等植物中的蔗糖摄取活性,包括单子叶植物和双子叶植物,包括(但不限于)玉米、小麦、水稻、大麦、大豆、大多数豆类、芸苔/canola、苜蓿、亚麻、向日葵、红花、蔓菁、棉花、亚麻、花生、三叶草;蔬菜例如莴苣、番茄、葫芦、土豆、胡罗卜、小罗卜、豌豆、兵豆、卷心菜、花椰菜、brussel sprouts、辣椒;树木果实例如苹果、梨、桃、杏;花例如康乃馨和玫瑰。
b.载体的构建、启动子的选择很多适于稳定转染植物细胞或者适于建立转基因植物的重组载体已有描述,包括Pouwels等(1987);Weissbach和Weissbach(1989);和Gelvin等(1990)中描述的。典型地,植物转化载体包括,在5’和3’调节序列的转录调控下的一种或多种克隆植物基因(或cDNA)和显性可选择标识基因。这种植物转化载体典型地还含有启动子调节区(例如,调控诱导或组成型的表达、环境调节或发育调节型的表达、或者细胞特异性或组织特异性表达的调控区)、转录起始位点、核糖体结合位点、RNA加工信号、转录终止位点、和/或多聚腺苷化信号。
可以用于表达核酸的组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S启动子,其在大多数植物组织中能够启动组成型的、高水平表达(参见例如,Odel等1985;Dekeyser等1990;Terada和Shimamoto,1990;Benfey和Chua.1990);胭脂碱合成酶启动子(An等1988);以及章鱼碱合成酶启动子(Fromm等,1989)。
各种各样受调节的以对环境、激素、化学物质、和/或发育信号进行应答的植物基因启动子也可以用于在植物细胞中表达cDNA,包括受以下信号调节的启动子(a)热(Callis等,1988;Ainley,等1993;Gilmartin等1992);(b)光(例如,豌豆rbcS-3A启动子,Kuhlemeier等,1993;玉米rbcS启动子,Schaffner和Sheen,1991);(c)激素,例如脱落酸(Marcotte等,1989);(d)受伤(例如wunI,Siebertz等,1989);以及(e)化学物质例如甲基茉莉醇酯或水杨酸(也参见Gatz等,1997),它们也能够用于调控基因表达。
或者,可以将组织(例如根、叶、花和种子)特异性启动子(Carpenter等,1992;Denis等,1993;Opperman等,1993;Stockhause等,1997;Roshal等,1987;Schernthaner等,1988;和Bustos等,1989)融合到编码序列中,以便获得在各种器官中的特殊表达。另外,可以利用例如在衰老过程中(Gan和Amasino,1995)或种子形成后期(Odell等,1994)起作用的启动子来调控表达时间。
本文公开的SBP1和SBP2基因的启动子区赋予大豆在形成种子时的特异性表达。因此,这些启动子可以用于使导入的转基因在正在形成种子中获得特异性表达。
植物转化载体还可以包括RNA加工信号,例如,可以定位于转基因中ORF的上游或下游的内含子。另外,表达载体还包括来源于植物基因3’-非翻译区例如3’终止子区的附加调控序列,以便增加mRNA的稳定性,例如土豆mRNA的PI-II终止子区或章鱼碱或胭脂碱合成酶mRNA的3’终止子区。
最后,如上文的记载,植物转化载体还可以包括显性可选择标记基因,其使得转化体易于筛选。这类基因包括编码抗生素抗性的基因(例如,对潮霉素、卡那霉素、博莱霉素、G418、链霉素或壮观霉素抗性)以及除草剂抗性基因(例如,phosphinothricin乙酰基转移酶)。
c.SBP序列在载体中的分布将按照所希望的所述序列的表达类型来选择SBP序列在转化载体中的特定排布。
如果需要增强植物的蔗糖摄取活性,SBP ORF可以有效地连接到组成型高水平启动子例如CaMV 35S启动子上。也可以通过将含有SBP2基因变异形式的转化载体导入植物实现蔗糖摄取活性的改变,所述SBP2基因的变异形式可以是,例如从SBP2 ORF的准确核苷酸序列变化得到的形式,但其编码的蛋白质保留了SBP2蛋白质的功能特征,即赋予蔗糖摄取活性。以举例的方式说明,还可以利用编码上述经修饰的SBP的核酸序列得到增强的蔗糖摄取活性。这种经修饰的SBP包括C-末端删除的SBP,通常删除10-100个氨基酸残基,优选约80个氨基酸残基。
相反,可以通过将SBP基因序列的反义构建体导入植物实现转基因植物中蔗糖摄取活性的降低。对于反义抑制,在转化载体中SBP基因定位于相对于启动子序列的反方向上。这种被导入的序列不必为全长SBP基因,不必完全同源于即将被转化植物类型中存在的SBP基因。然而通常导入序列的长度越短,产生有效反义抑制越需要被导入序列与自身SBP序列同源性程度越高。载体中导入的反义序列长度优选至少为30个核苷酸,同时普遍观察到随着反义序列长度增加,反义抑制作用越强。载体中反义序列的长度优选超过100个核苷酸。所述反义构建体的转录导致RNA分子的产生,该RNA分子与植物细胞SBP基因转录得到的mRNA分子反向互补。虽然反义RNA分子干扰基因表达的准确机制还未曾阐述,然而可以相信反义RNA分子与mRNA分子结合,从而抑制内源mRNA的翻译。
还可以利用核酶实现SBP基因表达的抑制。核酶是合成的RNA分子,其具有高度特异性核糖核酸内切酶活性。核酶的制备和应用公开在授权给Cech的美国专利No.4987071和授权给Haselhoff的美国专利No.5543508中。核酶序列在反义RNA中的包含可以用于使反义RNA具有RNA裂解活性,使得与反义RNA结合的内源mRNA分子裂解,从而导致内源基因表达的反义抑制增强。
SBP核酸(或其变异体)过表达的构建体也可以用于实现内源SBP基因的共抑制,作用方式如授权给Jorgensen的美国专利No.5231021中所述。这种共抑制(也称为有义抑制)不需要将SBP基因导入植物细胞,也不需要被导入序列与内源性SBP基因完全等同。然而,与反义抑制同样,有义抑制效能将随着以下两个因素增强(1)导入序列加长;和(2)导入序列和内源SBP基因序列间的序列相似性增加。
表达SBP mRNA的不可翻译形式的构建体也可以用于抑制内源性SBP活性的表达。制备这种构建体的方法如授权给Dougherty等的美国专利No.5583021所述。优选将未成熟终止密码子导入SBP ORF来制备这种构建体。
最后,公开序列的显性阴性突变体形式可以用于阻断内源性SBP的活性。这种突变体需要制备与蔗糖结合但不催化蔗糖摄取的SBP蛋白质的突变形式。
d.转化和再生方法目前单子叶和双子叶植物细胞的转化和再生都是常规技术,选择最合适的转化方法将由操作者决定。方法的选择将随着将被转化的植物类型而改变;本领域技术人员将能够认识到用于给定植物类型的特定方法的合适程度。合适的方法可以包括,但不限于植物原生质体的电穿孔;脂质体介导的转化;聚乙二醇(PEG)介导的转化;利用病毒的转化;植物细胞的微注射;植物细胞的微发射轰击;真空渗透;以及根瘤农杆菌(AT)介导的转化。转化和再生植物的典型程序在这部分开始处列出的专利文献中有所描述。
c.转化植物的筛选用转化载体转化和再生植物后,优选利用整合到转化载体中的显性可选择标记筛选转化植物。通常,这种标记将使转化植物的幼苗产生抗生素抗性,通过将幼苗与适当浓度的抗生素接触实现转化体的筛选。
当筛选出转化植物并使之生长成熟后,可以用已知方法对它们进行分析,确定SBP活性是否由于导入了转基因而改变。另外,可以通过分析Northern印迹上mRNA的表达,检测内源性SBP基因的反义或有义抑制。实施例4序列变异体的制备如同上面的阐述,植物细胞中蔗糖摄取活性的改变可以通过用SBP2 cDNA或基因、SBP2 cDNA或基因序列的反义构建体、或编码经修饰的SBP蛋白质的核酸序列转化植物实现。对于本文提供的SBP2cDNA和基因序列以及SBP 5’调节区,利用标准诱变方法制备这些序列的变异体在目前是可能的。
变异DNA分子包括由标准DNA诱变技术生产的DNA分子,例如,M13引物诱变。这些技术的细节在Sambrook等(1989),第15章中有提供。使用这种技术,可以制备与公开序列有较少差异的变异体。由本文特别公开的那些序列衍生而来的,由于核苷酸缺失、添加或取代导致与已公开序列不同但仍然编码具有SBP蛋白功能特征(即,在酵母分析系统中介导蔗糖摄取)的蛋白质的DNA分子和核苷酸序列通过本发明可以得到理解。来源于已公开的SBP2 cDNA和基因序列的DNA分子和核苷酸序列包括,能够在严谨条件下与已公开DNA序列或其片段杂交的DNA序列。
导致特定程度的严谨度的杂交条件将依赖于所选择的杂交方法和使用的杂交DNA的组成和长度而改变。通常,杂交温度和杂交缓冲液中的离子强度(尤其是Na+浓度)将决定杂交严谨度。得到特定程度的严谨度需要的杂交条件的计算由Sambrook等(1989),在第9和11章中讨论,本文将其作为参考引入。仅仅作为举例说明的方式,可以通过下述方法进行杂交试验将DNA分子(例如,大豆SBP2 cDNA序列)和目标DNA分子(例如,番茄中相应的SBP2 cDNA序列)杂交,该目标DNA分子已经进行了琼脂糖凝胶电泳,并通过Southern印迹(Southern,1975)转移到硝基纤维素薄膜上,该技术是本领域已知技术,并在Sombrook等(1989)中有描述。如下述,利用[32P]dCTP标记目标探针的杂交通常在高离子强度例如6×SSC的溶液中进行,温度为熔点温度(Tm)以下20-25℃。对于这种在Southern印迹中目标DNA分子含10ng DNA或更多的Southern杂交试验,利用12ng/ml放射标记探针(其比活性等于或高于109CPM/μg)进行杂交,典型进行68小时。杂交后,清洗硝基纤维素滤膜,除去背景杂交。清洗条件应当尽可能严紧,以便除去背景杂交同时保留特异杂交信号。术语Tm代表这样一种温度,在该温度以上,在占优势的离子强度条件下,放射标记的探针分子将不与其目标DNA分子杂交。这种杂交分子Tm的可以从下列等式中推算(Bolton和McCatthy,1962)Tm=81.5C 16.6(log10[Na+])+0.41(%G+C)-0.63(%甲酰胺)(600/l)其中l=杂交的碱基对的长度。
该等式对于Na+浓度在0.01M到0.4M范围内有效,在更高[Na+]溶液中,计算Tm的准确性较低。该等式对于G+C含量在30%-75%范围内的DNA也基本上有效,它应用于长度超过100个核苷酸的杂交体(寡核苷酸探针的行为在Sambrook等,1989,第11章中有详细描述)。
因此,以举例的方式,对于来源于大豆SBP2 cDNA开放读码框的前150个碱基对的150个碱基对DNA探针(假设%GC=45%),可以如下计算需要给出特定严谨度的杂交条件例如,假设滤膜在0.3×SSC溶液中漂洗,随后杂交,由此[Na+]=0.045M;%GC=45%;甲酰胺浓度=0;l=150个碱基对;Tm=81.516(log10[Na+])+(0.41×45)(600/150),因此Tm=74.4 C。
对于双链DNA,随着同源性每降低1%,Tm则降低1-1.5℃(Bonner等,1973)。因此,对于这个假设的例子,杂交滤膜于59.4-64.4℃之间在0.3×SSC溶液中漂洗,将产生相当于90%的杂交严谨度。或者,杂交滤膜于65.4-68.4℃的温度之间,在0.3×SSC溶液中漂洗,将产生94%的杂交严谨度。上述例子是完全以理论说明的方式给出的。本领域技术人员将能够理解,其它杂交技术也可以使用,试验条件的改变将需要改变严谨度的计算。
来源于植物,编码具有SBP活性,并在严谨度至少为75%、优选至少80%、更优选至少85%、还更优选至少90%、最优选至少95%的杂交条件下与已公开的SBP2序列杂交的DNA序列包括在本发明范围内。
遗传密码的间并性进一步拓宽了本发明的范围,因为它允许在保留被编码蛋白的氨基酸序列的同时,使DNA分子的核苷酸序列中存在大量的变异。例如,大豆SBP2蛋白的第二个氨基酸残基是丙氨酸。它在大豆SBP2开放读码框内由核苷酸密码三联体GCG编码。由于遗传密码的间并性,其它三种核苷酸密码三联体-GCA、GCC和GCT也编码丙氨酸。因此,大豆SBP2 ORF的核苷酸序列在该位置可以为这些三联体密码子的任意一个,而不影响编码蛋白质的氨基酸组成或者蛋白质的特征。基于遗传密码的间并性,可以利用上述标准DNA诱变技术,或者通过合成DNA序列,从本文公开的cDNA和基因序列衍生出变异DNA分子。因此,本发明还包括编码SBP蛋白的核酸序列,但该核酸序列是依据遗传密码的间并性从已公开的核酸序列得到的。
本发明指出可以通过修饰植物SBP序列,例如删除C-末端80个氨基酸,实现蔗糖摄取活性的增加。本领域的技术人员将能够认识到DNA诱变技术不仅可以用于制备变异DNA分子,还将促进这种经修饰的SBP蛋白的产生。另外,也可以进行氨基酸序列的其它改变,包括缺失、添加和取代。
引入氨基酸序列变异的位点是预先确定的,而突变本身不需要预先确定。例如,为了优化对给定位点的突变,可以在目标密码子或区域实施随机诱变,然后筛选具有所需活性的优化组合的表达蛋白质变异体。如上述在已知序列的DNA的预定位点进行替代突变的技术是公知的。
氨基酸取代典型为单残基取代;插入通常为1到10个氨基酸残基;删除的范围约为1到多于100个残基。取代、删除、插入或它们的任意组合可以混合使用,产生最终的构建体。显然,在编码蛋白质的DNA中进行的突变必须不在读码框序列内,并且最好不产生能够生产二级mRNA结构的互补区。
取代变异体是氨基酸序列中至少一个残基被除去,同时一个不同的残基插入该位置的氨基酸序列。如果需要精确调节蛋白质的特征,通常按照下表1进行这种取代。表1显示蛋白质中的原始氨基酸被取代的氨基酸,认为它是保守取代。
表1原始残基 保守取代AlaSerArgLysAsngln;hisAspGluCysSerGlnAsnGluAspGlyProHisasn;glnIleleu;valLeuile;valLysarg;gln;gluMetleu;ilePhemet;leu;tyrSerthrThrserTrptyrTyrtrp;pheValile;leu通过选择低于表1所列保守性的取代实现酶功能或其它特征的基本改变,即选择在维持以下方面具有显著不同作用的残基(a)取代区的多肽骨架结构,例如,片层构型或螺旋构型;(b)分子在目标位点的电荷或疏水性;或(c)侧链的空间体积。通常预期产生最大蛋白质性质改变的取代将是以下几种情况的取代(a)亲水残基例如丝氨酰或苏氨酰被(或由)疏水残基例如亮氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰取代;(b)半胱氨酸或脯氨酸被(或由)任何其它残基取代;(c)具有正电荷的残基例如赖氨酰、精氨酰或组氨酰被(或由)负电荷残基例如谷氨酰或天冬氨酰取代;或(d)具有大空间体积侧链的残基例如苯丙氨酸被(或由)无侧链的残基例如甘氨酸取代。
可以通过分析衍生蛋白质在上述酵母分析系统中催化蔗糖摄取的能力,评价这些氨基酸取代或缺失或添加对SBP蛋白衍生物的作用。实施例5SBP 5’调节区调控转基因表达的应用甘氨酸SBP1和SBP2基因的启动子赋予种子形成中特异性表达。因此,Seq.I.D.Nos.7(SBP2)和8(SBP1)所示的启动子序列可以用于制备在正在形成的种子中特异性表达的转基因构建体。本领域技术人员将能够认识到,可以用比Seq.I.D.Nos.7和8所示的完全5’调节区更少的调节序列实现在正在形成的种子中调节转基因表达。因此,例如,种子形成中的特异性表达可以通过应用已公开启动子序列的50个碱基对或100个碱基对实现。利用已知方法将能够确定已公开序列的特定小片段是否能够在特定系统中(考虑构建体将被导入其中的植物品种,所需的表达水平等)操纵有效的种子特异性表达,例如将小片段启动子与标识基因(例如GUS)有效地连接起来,将这种构建体导入植物,然后确定在正在形成的种子和其它植物组织中标识基因的表达水平。
因此本发明有利于通过标准分子生物学方法制备含有有效地与核酸序列例如开放读码框连接的SBP1或SBP2启动子序列的核酸分子。合适的开放读码框包括编码任何期望在正在形成的种子中表达的蛋白质的开放读码框。在已公开的SBP启动子的调控下,适于以种子特异性方式表达的基因的例子包括,但不限于(1)增强种子的营养质量的基因,例如通过增加包括赖氨酸、蛋氨酸和半胱氨酸在内的限制性氨基酸的含量。这可以通过在种子中表达含高水平的这类氨基酸的蛋白质实现。这样的例子包括来自巴西坚果(Saalbach等,1996)和向日葵(Molvig等,1997)的高蛋氨酸储备蛋白。
(2)增加小麦中麦麸的基因,从而提高该种小麦粉制作的面包的质量(Shewry等1995)。
(3)增强种子中昆虫抗性(例如,象鼻虫抗性)的基因。适当的基因包括杀死象鼻虫卵的α-淀粉酶抑制剂基因(Schmidt,1994)。
参考文献Ainley等(1993)植物分子生物学2213-23Altschul和Gish.(1996)酶学方法266460-80Altschul等(1990)基本定位排列的检索工具,分子生物学杂志215403-410Altschul等(1994)自然遗传(Nature Genet.),6119-29An等(1988)植物生理88547Ausubel等(1987)当前分子生物学方法,Greene出版学会和Wiley-IntersciencesAusubel等编,当前分子生物学方法,John Wiley和Sons,New York,1994Benfey和Chua(1990)科学250959-966Birch等(1997)植物生理和植物分子生物学年度综述48297-326Bolton和McCarthy(1962)美国国家科学院进展481390Bonner等(1973)分子生物学杂志81123Bush(1993)植物生理和植物分子生物学年度综述44513-542Bustos等(1989)植物细胞1839Callis等(1988)植物生理88965Carpenter等(1992)植物细胞4557-571Corpet等(1988)核酸研究1610881-90Dekeyser等(1990)植物细胞2591Denis等(1993)植物生理1011295-1304Fromm等(1989)植物细胞1977Gan和Amansino(1995)科学2701986-1988Gatz等(1977)植物生理和植物分子生物学年度综述4889-108
Gelvin等(1990)植物分子生物学手册,Kluwer AcademicPublishers出版Gietz等(1992)核酸研究201425Gilmartin等(1992)植物细胞4839-949Grimes等(1992)植物细胞41561-1574Harlow和Lane(1988)抗体,试验室手册,冷泉港实验室,纽约Higgins和Sharp(1988)基因73237-244Higgins和Sharp(1989)CABIOS 5151-153Huang等(1992)计算机在生物科学中的应用8155-65Innis等(1990)PCR草案,方法和应用指南Innis等(编),AcademicPress,Inc.,San Diego,CaliforniaKawasaki等(1990)PCR草案,方法和应用指南,Innis等(编),2127,Academic Press,Inc.,San Diego,CaliforniaKuhlemeier等(1989)植物细胞1471Meyer和Horgan(1996)植物生理和植物分子生物学年度综述4723-48Meyers和Miller(1988)计算机在生物科学中的应用411-17Molvig等(1997)美国国家科学院进展948393-8398Needleman和Wunsch(1970)分子生物学杂志48443Odel等(1985)自然313810Odell等(1994)植物生理106447-458Opperman等(1993)科学263221-223Overvoorde和Grimes(1994)生物化学杂志26915154-15161Overvoorde等(1996)植物细胞8271-280Pearson和Lipman(1988)美国国家科学院进展852444Pearson等(1994)分子生物学方法24307-31Pouwels等(1987)克隆载体实验室手册1985,增刊Riesmeier等(1992)EMBO杂志114705-4713Ripp等(1988)植物生理881435-1445Roshal等(1987)EMBO杂志61155
Saalbach等(1996)植物生理112975-985Sambrook等(1989)分子克隆试验室手册,冷泉港实验室,纽约Schaffner和Sheen(1991)植物细胞3997Schernthaner等(1988)EMBO杂志71249Schmidt(1994)科学265739Shewry等(1995)植物细胞7945-956Siebertz等(1989)植物细胞1961Smith和Waterman(1981)应用数学进展2482Southern(1975)分子生物学杂志98Southern等(1982)分子应用遗传学杂志(J.Mol.Appl.Genet.)1327-341Stockhause等(1997)植物细胞9479-489Terada和Shimamoto(1990)分子和基因遗传学(Mol.Gen.Genet.)220389Tijssen(1993)生物化学和分子生物学实验室技术--与核酸探针的杂交,第1部分第2章“杂交原理概述和核酸探针的分析方法”,Elsevier,New York.
Weissbach和Weissbach(1989)植物分子生物学方法,AcademicPress
序列表(1)一般资料(i)申请人Grimes(ii)发明题目蔗糖结合蛋白(iii)序列数15(iv)通讯地址(A)收件人Klarquist Sparkman Campbell Leigh &Whinston,LLP(B)街道One World Trade Center121 S.W.Salmon StreetSuite 1600(C)城市Portland(D)州Oregon(E)国家美国(F)邮政编码97204-2988(v)计算机可读形式(A)介质类型软盘,3-1/2英寸(B)计算机IBM PC可兼容机(C)操作系统Windows NT(D)软件Word 97 & ASCII(vi)目前的申请资料(A)申请号(B)申请日(C)分类号(vii)在先申请资料(A)申请号60/047568(B)申请日1997.5.22(C)分类号(viii)代理人/代理资料(A)姓名David J.Earp
(B)登记号41401(C)资料/文档号4630-50206/KJE(ix)通讯资料(A)电话(503)226-7391(B)传真(503)228-9446(2)SEQ ID NO1的资料(i)序列特征(A)长度524(B)类型氨基酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO1Met Gly Met Arg Thr Lys Leu Ser Leu Ala Ile Phe Phe Phe Phe1 5 10 15Leu Leu Ala Leu Phe Ser Asn Leu Ala Phe Gly Lys Cys Lys Glu20 25 30Thr Glu Val Glu Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His35 40 45Gln Cys Gln Gln Gln Gln Gln Tyr Thr Glu Gly Asp Lys Arg Val50 55 60Cys Leu Gln Ser Cys Asp Arg Tyr His Arg Met Lys Gln Glu Arg65 70 75Glu Lys Gln Ile Gln Glu Glu Thr Arg Glu Lys Lys Glu Glu Glu80 85 90Ser Arg Glu Arg Glu Glu Glu Gln Gln Glu Gln His Glu Glu Gln95 100 105Asp Glu Asn Pro Tyr Ile Phe Glu Glu Asp Lys Asp Phe Glu Thr110 115 120Arg Val Glu Thr Glu Gly Gly Arg Ile Arg Val Leu Lys Lys Phe125 130 135Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu140 145 150Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val Ser Pro Arg His155 160 165Phe Asp Ser Glu Val Val Phe Phe Asn Ile Lys Gly Arg Ala Val170 175 180Leu Gly Leu Val Ser Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu185 190 195Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr Pro Leu Tyr Ile200 205 210Val Asn Arg Asp Glu Asn Asp Lys Leu Phe Leu Ala Met Leu His215 220 225Ile Pro Val Ser Val Ser Thr Pro Gly Lys Phe Glu Glu Phe Phe230 235 240Ala Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala Phe Ser245 250 255Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly Lys Leu260 265 270Glu Asn Val Phe Asp Gln Gln Asn Glu Gly Ser Ile Phe Arg Ile275 280 285Ser Arg Glu Gln Val Arg Ala Leu Ala Pro Thr Lys Lys Ser Ser290 295 300Trp Trp Pro Phe Gly Gly Glu Ser Lys Pro Gln Phe Asn Ile Phe305 310 315Ser Lys Arg Pro Thr Ile Ser Asn Gly Tyr Gly Arg Leu Thr Glu320 325 330Val Gly Pro Asp Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu Asn335 340 345Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser Thr350 355 360Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Ile Asp365 370 375Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser Arg380 385 390Ser Ser His Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg395 400 405Ile Ser Ser Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro410 415 420Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu425 430 435Met Ile Cys Phe Glu Val Asn Ala Arg Asp Asn Lys Lys Phe Thr440 445 450Phe Ala Gly Lys Asp Asn Ile Val Ser Ser Leu Asp Asn Val Ala455 460 465Lys Glu Leu Ala Phe Asn Tyr Pro Ser Glu Met Val Asn Gly Val470 475 480Phe Leu Leu Gln Arg Phe Leu Glu Arg Lys Leu Ile Gly Arg Leu485 490 495Tyr His Leu Pro His Lys Asp Arg Lys Glu Ser Phe Phe Phe Pro500 505 510Phe Glu Leu Pro Arg Glu Glu Arg Gly Arg Arg Ala Asp Ala515 520(2)SEQ ID NO2的资料(i)序列特征(A)长度444(B)类型氨基酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO2Met Gly Met Arg Thr Lys Leu Ser Leu Ala Ile Phe Phe Phe Phe5 10 15Leu Leu Ala Leu Phe Ser Asn Leu Ala Phe Gly Lys Cys Lys Glu20 25 30Thr Glu Val Glu Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His35 40 45Gln Cys Gln Gln Gln Gln Gln Tyr Thr Glu Gly Asp Lys Arg Val50 55 60Cys Leu Gln Ser Cys Asp Arg Tyr His Arg Met Lys Gln Glu Arg65 70 75Glu Lys Gln Ile Gln Glu Glu Thr Arg Glu Lys Lys Glu Glu Glu80 85 90Ser Arg Glu Arg Glu Glu Glu Gln Gln Glu Gln His Glu Glu Gln95 100 105Asp Glu Asn Pro Tyr Ile Phe Glu Glu Asp Lys Asp Phe Glu Thr110 115 120Arg Val Glu Thr Glu Gly Gly Arg Ile Arg Val Leu Lys Lys Phe125 130 135Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu140 145 150Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val Ser Pro Arg His155 160 165Phe Asp Ser Glu Val Val Phe Phe Asn Ile Lys Gly Arg Ala Val170 175 180Leu Gly Leu Val Ser Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu185 190 195Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr Pro Leu Tyr Ile200 205 210Val Asn Arg Asp Glu Asn Asp Lys Leu Phe Leu Ala Met Leu His215 220 225Ile Pro Val Ser Val Ser Thr Pro Gly Lys Phe Glu Glu Phe Phe230 235 240Ala Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala Phe Ser245 250 255Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly Lys Leu260 265 270Glu Asn Val Phe Asp Gln Gln Asn Glu Gly Ser Ile Phe Arg Ile275 280 285Ser Arg Glu Gln Val Arg Ala Leu Ala Pro Thr Lys Lys Ser Ser290 295 300Trp Trp Pro Phe Gly Gly Glu Ser Lys Pro Gln Phe Asn Ile Phe305 310 315Ser Lys Arg Pro Thr Ile Ser Asn Gly Tyr Gly Arg Leu Thr Glu320 325 330Val Gly Pro Asp Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu Asn335 340 345Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser Thr350 355 360Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Ile Asp365 370 375Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser Arg380 385 390Ser Ser His Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg395 400 405Ile Ser Ser Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro410 415 420Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu425 430 435Met Ile Cys Phe Glu Val Asn Ala Arg440(2)SEQ ID NO3的资料(i)序列特征(A)长度489(B)类型氨基酸(C)链型单链(D)拓扑结构线性(xi)序列描述SEQ ID NO3Met Ala Thr Arg Ala Lys Leu Ser Leu Ala Ile Phe Leu Phe Phe5 10 15Leu Leu Ala Leu Ile Ser Asn Leu Ala Leu Gly Lys Leu Lys Glu20 25 30Thr Glu Val Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His Gln35 40 45Cys Gln Gln Gln Arg Gln Tyr Thr Glu Ser Asp Lys Arg Thr Cys50 55 60Leu Gln Gln Cys Asp Ser Met Lys Gln Glu Arg Glu Lys Gln Val65 70 75Glu Glu Glu Thr Arg Glu Lys Glu Glu Glu His Gln Glu Gln His80 85 90Glu Glu Glu Glu Asp Glu Asn Pro Tyr Val Phe Glu Glu Asp Lys95 100 105Asp Phe Ser Thr Arg Val Glu Thr Glu Gly Gly Ser Ile Arg Val110 115 120Leu Lys Lys Phe Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu125 130 135Asn Phe Arg Leu Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val140 145 150Ser Pro Arg His Phe Asp Ser Glu Val Val Leu Phe Asn Ile Lys155 160 165Gly Arg Ala Val Leu Gly Leu Val Arg Glu Ser Glu Thr Glu Lys170 175 180Ile Thr Leu Glu Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr185 190 195Pro Leu Tyr Ile Val Asn Arg Asp Glu Asn Glu Lys Leu Leu Leu200 205 210Ala Met Leu His Ile Pro Val Ser Thr Pro Gly Lys Phe Glu Glu215 220 225Phe Phe Gly Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala230 235 240Phe Ser Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly245 250 255Lys Leu Glu Arg Leu Phe Asn Gln Gln Asn Glu Gly Ser Ile Phe260 265 270Lys Ile Ser Arg Glu Arg Val Arg Ala Leu Ala Pro Thr Lys Lys275 280 285Ser Ser Trp Trp Pro Phe Gly Gly Glu Ser Lys Ala Gln Phe Asn290 295 300Ile Phe Ser Lys Arg Pro Thr Phe Ser Asn Gly Tyr Gly Arg Leu305 310 315Thr Glu Val Gly Pro Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu320 325 330Asn Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser335 340 345Thr Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Met350 355 360Asp Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser365 370 375Arg Ser Asp Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg380 385 390Ile Ser Ala Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro395 400 405Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu410 415 420Ile Ile Cys Phe Glu Val Asn Val Arg Asp Asn Lys Lys Phe Thr425 430 435Phe Ala Gly Lys Asp Asn Ile Val Ser Ser Leu Asp Asn Val Ala440 445 450Lys Glu Leu Ala Phe Asn Tyr Pro Ser Glu Met Val Asn Gly Val455 460 465Ser Glu Arg Lys Glu Ser Leu Phe Phe Pro Phe Glu Leu Pro Ser470 475 480Glu Glu Arg Gly Arg Arg Ala Val Ala485(2)SEQ ID NO4的资料(i)序列特征(A)长度409(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Ala Thr Arg Ala Lys Leu Ser Leu Ala Ile Phe Leu Phe Phe5 10 15Leu Leu Ala Leu Ile Ser Asn Leu Ala Leu Gly Lys Leu Lys Glu20 25 30Thr Glu Val Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His Gln35 40 45Cys Gln Gln Gln Arg Gln Tyr Thr Glu Ser Asp Lys Arg Thr Cys50 55 60Leu Gln Gln Cys Asp Ser Met Lys Gln Glu Arg Glu Lys Gln Val65 70 75Glu Glu Glu Thr Arg Glu Lys Glu Glu Glu His Gln Glu Gln His80 85 90Glu Glu Glu Glu Asp Glu Asn Pro Tyr Val Phe Glu Glu Asp Lys95 100 105Asp Phe Ser Thr Arg Val Glu Thr Glu Gly Gly Ser Ile Arg Val110 115 120Leu Lys Lys Phe Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu125 130 135Asn Phe Arg Leu Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val140 145 150Ser Pro Arg His Phe Asp Ser Glu Val Val Leu Phe Asn Ile Lys155 160 165Gly Arg Ala Val Leu Gly Leu Val Arg Glu Ser Glu Thr Glu Lys170 175 180Ile Thr Leu Glu Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr185 190 195Pro Leu Tyr Ile Val Asn Arg Asp Glu Asn Glu Lys Leu Leu Leu200 205 210Ala Met Leu His Ile Pro Val Ser Thr Pro Gly Lys Phe Glu Glu215 220 225Phe Phe Gly Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala230 235 240Phe Ser Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly245 250 255Lys Leu Glu Arg Leu Phe Asn Gln Gln Asn Glu Gly Ser Ile Phe260 265 270Lys Ile Ser Arg Glu Arg Val Arg Ala Leu Ala Pro Thr Lys Lys275 280 285Ser Ser Trp Trp Pro Phe Gly Gly Glu Ser Lys Ala Gln Phe Asn290 295 300Ile Phe Ser Lys Arg Pro Thr Phe Ser Asn Gly Tyr Gly Arg Leu305 310 315Thr Glu Val Gly Pro Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu
320 325 330Asn Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser335 340 345Thr Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Met350 355 360Asp Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser365 370 375Arg Ser Asp Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg380 385 390Ile Ser Ala Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro395 400 405Gly His Pro Phe(2)SEQ ID NO5的资料(i)序列特征(A)长度1924(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO5TGTAAAACGA CGGCCAGTGA ATTGTAATAC GACTCACTAT AGGGCGAATT50GGGTACCGGG CCCCCCCTCG AGGTCGACGG TATCGATAAG CTTGATTTTG 100TTCCTCACTG ACCTCACC ATG GCG ACC AGA GCC AAG CTT TCT TTA 145Met Ala Thr Arg Ala Lys Leu Ser Leu5GCT ATC TTC CTT TTC TTT CTT TTA GCC TTG ATT TCA AAC CTA GCC 190Ala Ile Phe Leu Phe Phe Leu Leu Ala Leu Ile Ser Asn Leu Ala10 15 20TTG GGC AAA CTT AAA GAA ACC GAG GTC GAA GAA GAT CCC GAG CTC 235Leu Gly Lys Leu Lys Glu Thr Glu Val Glu Glu Asp Pro Glu Leu25 30 35GTA ACA TGC AAA CAC CAG TGC CAA CAG CAA CGG CAA TAC ACT GAG 280Val Thr Cys Lys His Gln Cys Gln Gln Gln Arg Gln Tyr Thr Glu40 45 50AGT GAC AAG CGA ACA TGC TTG CAA CAA TGT GAC AGT ATG AAG CAA 325Ser Asp Lys Arg Thr Cys Leu Gln Gln Cys Asp Ser Met Lys Gln55 60 65GAG CGA GAG AAA CAA GTC GAA GAG GAA ACT CGC GAG AAG GAA GAA 370Glu Arg Glu Lys Gln Val Glu Glu Glu Thr Arg Glu Lys Glu Glu70 75 80GAA CAT CAA GAG CAG CAT GAG GAG GAG GAA GAC GAA AAT CCC TAC 415Glu His Gln Glu Gln His Glu Glu Glu Glu Asp Glu Asn Pro Tyr85 90 95GTT TTT GAA GAA GAT AAG GAT TTT TCG ACC AGA GTC GAA ACA GAA 460Val Phe Glu Glu Asp Lys Asp Phe Ser Thr Arg Val Glu Thr Glu100 105 110GGT GGC AGC ATT CGG GTT CTC AAG AAG TTC ACT GAG AAA TCC AAG 505Gly Gly Ser Ile Arg Val Leu Lys Lys Phe Thr Glu Lys Ser Lys115 120 125CTT CTT CAA GGC ATT GAG AAT TTC CGT TTG GCC ATC TTA GAA GCT 550Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu Ala Ile Leu Glu Ala130 135 140AGA GCA CAC ACG TTC GTG TCC CCA CGC CAC TTT GAT TCC GAG GTT595Arg Ala His Thr Phe Val Ser Pro Arg His Phe Asp Ser Glu Val145 150 155GTC TTG TTC AAC ATT AAG GGG AGA GCC GTA CTT GGG TTG GTG AGG640Val Leu Phe Asn Ile Lys Gly Arg Ala Val Leu Gly Leu Val Arg160 165 170GAA AGT GAA ACA GAA AAA ATC ACC CTA GAA CCT GGA GAC ATG ATA685Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu Pro Gly Asp Met Ile175 180 185CAC ATA CCA GCA GGC ACA CCA CTG TAC ATC GTT AAC AGA GAT GAG730His Ile Pro Ala Gly Thr Pro Leu Tyr Ile Val Asn Arg Asp Glu190 195 200AAT GAG AAG CTC CTC CTT GCC ATG CTC CAT ATA CCT GTC TCT ACT775Asn Glu Lys Leu Leu Leu Ala Met Leu His Ile Pro Val Ser Thr205 210 215CCT GGA AAA TTT GAG GAA TTT TTC GGG CCT GGA GGA CGA GAC CCA820Pro Gly Lys Phe Glu Glu Phe Phe Gly Pro Gly Gly Arg Asp Pro220 225 230GAA TCG GTC CTC TCA GCA TTC AGC TGG AAT GTG CTG CAA GCT GCG865Glu Ser Val Leu Ser Ala Phe Ser Trp Asn Val Leu Gln Ala Ala235 240 245CTC CAA ACC CCA AAA GGA AAG TTA GAA AGG CTT TTT AAT CAA CAG910Leu Gln Thr Pro Lys Gly Lys Leu Glu Arg Leu Phe Asn Gln Gln250 255 260AAC GAG GGA AGT ATT TTC AAA ATA AGC AGA GAA CGG GTG CGT GCG955Asn Glu Gly Ser Ile Phe Lys Ile Ser Arg Glu Arg Val Arg Ala265 270 275TTG GCC CCC ACC AAG AAA AGC TCT TGG TGG CCA TTC GGC GGC GAA 1000Leu Ala Pro Thr Lys Lys Ser Ser Trp Trp Pro Phe Gly Gly Glu280 285 290TCC AAG GCT CAA TTC AAT ATT TTC AGC AAG CGT CCC ACT TTC TCC 1045Ser Lys Ala Gln Phe Asn Ile Phe Ser Lys Arg Pro Thr Phe Ser295 300 305AAC GGA TAT GGC CGT TTA ACT GAA GTT GGT CCT GAT GAT GAA AAG 1090Asn Gly Tyr Gly Arg Leu Thr Glu Val Gly Pro Asp Asp Glu Lys310 315 320AGT TGG CTT CAA AGA CTC AAC CTC ATG CTT ACC TTT ACC AAC ATC 1165Ser Trp Leu Gln Arg Leu Asn Leu Met Leu Thr Phe Thr Asn Ile325 330 335ACC CAG AGA TCT ATG AGT ACT ATT CAC TAC AAC TCA CAT GCA ACG 1180Thr Gln Arg Ser Met Ser Thr Ile His Tyr Asn Ser His Ala Thr340 345 350AAG ATA GCA CTG GTG ATG GAT GGT AGA GGG CAT CTT CAA ATA TCA 1225Lys Ile Ala Leu Val Met Asp Gly Arg Gly His Leu Gln Ile Ser355 360 365TGT CCA CAC ATG TCA TCA AGG TCA GAC TCA AAG CAT GAT AAG AGT 1270Cys Pro His Met Ser Ser Arg Ser Asp Ser Lys His Asp Lys Ser370 375 380AGC CCC TCA TAC CAT AGA ATC AGT GCG GAC TTG AAG CCT GGA ATG1315Ser Pro Ser Tyr His Arg Ile Ser Ala Asp Leu Lys Pro Gly Met385 390 395GTG TTT GTT GTC CCT CCT GGT CAT CCC TTC GTC ACT ATA GCT TCC1360Val Phe Val Val Pro Pro Gly His Pro Phe Val Thr Ile Ala Ser400 405 410AAT AAA GAG AAT CTC CTC ATA ATT TGC TTC GAG GTT AAC GTT CGA1405Asn Lys Glu Asn Leu Leu Ile Ile Cys Phe Glu Val Asn Val Arg415 420 425GAC AAC AAG AAG TTT ACG TTT GCA GGG AAG GAC AAC ATT GTG AGC1450Asp Asn Lys Lys Phe Thr Phe Ala Gly Lys Asp Asn Ile Val Ser430 435 440TCT CTG GAC AAC GTA GCT AAG GAG CTG GCC TTT AAC TAT CCT TCT1495Ser Leu Asp Asn Val Ala Lys Glu Leu Ala Phe Asn Tyr Pro Ser445 450 455GAG ATG GTG AAC GGA GTC TCC GAA AGA AAG GAG AGT CTC TTT TTC1540Glu Met Val Asn Gly Val Ser Glu Arg Lys Glu Ser Leu Phe Phe460 465 470CCC TTC GAG TTG CCG AGC GAG GAG CGT GGT CGT CGC GCT GTT GCG 1585Pro Phe Glu Leu Pro Ser Glu Glu Arg Gly Arg Arg Ala Val Ala475 480 485TGA GAAGCAGTGT GGAGGTGGCT GATAACGGGG AATGTATTTA GCTTTGAGAG 1638TCTTTAAATT TTCTGTATTT GTTGTAATGT TAGTAGTTCC TTAAATTGGC 1688CAGATGGAGT TTATGTGTTT GTAAATGCAG GGATGCTAAC GGAATAAAAT 1738GGCCACTTGT ATTGCTAAAG AAAAAAACCA GCCCGGGCCG TCGACCACGC 1788GTGCCCTATA GTGAGTCGTA TTACAATCGA ATTCCTGCAG CCCGGGGGAT 1838CCACTAGTTC TAGAGCGGCC GCCACCGCGG TGGAGCTCCA GCTTTTGTTC 1888CCTTTAGTGA GGGTTAATTT CGAGCTTGGC GTAATC 1924(2)SEQ ID NO6的资料(i)序列特征(A)长度3718(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO6TTGTAAACGA CGGCCAGTGA ATTGTAATAC GACTCACTAT AGGGCGAATT 50GGGTACCGGG CCCCCCCTCG AGGTCGACGG TATCGATAAG CTTGATTGTA 100ATACGACTCA CTATAGGGCA CGCGTGGTCG ACGGCCCGGG CTGGTCTGAG 150AAACTCATTA GGCACTGGAA AATTCTCAAA GGAAATAATG TGAGTCAGCC 200AATTCAAACC CACCATATCT TTATTAATTT CACTTTTTTC TTTATTTTAT 250AATTTTTAGT CTCACAGTCA CACATTTTAA CAGGYYATGA TAACAAGGGG 300CAAAGATAAG GGTGAGACCG GGATTATAAA GCGTGTCATT CGCTCTCAAA 350ATCGTGTCAT TGTAGAGAGT AAAAACCTGG TGAGAGATAT TATCATCACA 400ATTTGGTCCT TCTGTTTTTC TAATGCCCTA TCTTCCTTAG ATTATGTTTT 450CAATTCCACT GTCAATGTGT CTTGCATCAG AATATTAATC AATTGTGACA 500TTGAGCATGT GATTGTGTAA ATTTTCCTGA TAGGTTTCTC ACTCCAATGC 550CTTTTGTCAT CCTCTTTATA GGTAAAGAAG CATATAAAGC AAGGGCAAGG 600TCATGAAGGG GGCATCTTTA CAGTGGAAGC CCCACTGCAT GCCTCCAATG 650TGCAAGTTCT TGACCCAGTG ACAGGGTATG TCATTGTTCA GATATTGAAC 700TGGTGATTGC ATCTCCAAAC GGGATAACAT CATTAACATG TATGAAAGTA 750AGAGTTACCA ACTTTTACTT GTGCAGCAAG CCTTGCAAGG TTGGAGTTAA 800ATATCTTGAA GATGGTACTA AAGTCAGAGT GTCCAGAGGA ATAGGAACCT 850CAGGGTCCAT AGTCCCTCGT CCTGAGATTT TAAAGATAAG AACTACCCCA 900AGACCTGCAG TCCGTAAGTA TCTAACAAGC TTAATTATGC TTTTTCATGT .950ATGAGTTGTT GACAAAACAT GGCCAGAGCC AATAGAGAAT CGAGAAAAAG 1000TGAGACGGAA AATGAACTTG AATTATGAGA AAGGTGTGTG AAACAAACAA 1050GCCAATAATG TGGCTTATAT AATATATAAT ATATAGATAT AGACCAGAGT 1100GAGTAACGAA TCACTAACTA ATTACATGTG TATATCTACC TAATTAGATG 1150ACTCATCAAA CAAAGCGAAC TATTGTGATA GAGACTTTAT TTTTCGCAAT 1200TAATTCAAAG ATGTACTGCT TATCTTCTTT GCTACATGTC TGTTGACATG 1250CATTGTTATC CATAACCTTG TTATTATACT TGGTGTTGAG AAAGGAGAGT 1300CTCCTTGCAC TTTAGAGACA TTCTTTAAAC TGACTTGACC TTATTGAAAA 1350TTCGAGATAG CAACTTAGCA CCACACCTTA AAAAGAAAGA TTTTTTAGAG 1400GGTAGATTAA TTGTTGAATA ATGTTAATCA TCAAAGGTTT AAGATTTATT 1450AAGTGCTTTC CATTGTCTTA AAAATCTTGC TTCTAGGACT AGGATGTGTA 1500TTGTTACATG ATTTCCCCCC CTTGGTATCA ACTAAAGCAT GTTGGACTTG 1550CGCTCCATAT GCAGAAACTC AAATTAAAAA CATCATTTGT AATGTATAGT 1600AAGTGTATAT ATAACATTGT AAGTTGTCGA TCAAAGTTAT TTGGATTAAT 1650GGATTTAAGT CTTCTATAAT ATTCCATTGA GAGCCAGAAG CCAGGTCCAA 1700AGGAATAAGT AACTCGCATG AATTCATTCT CTTGCTTCTA TACAGCTATT 1750TTTCCATCTT AGTGTTGCGG GAAACTACTT CAGTTCTCGC AGATGTGCAA 1800AACTTGTAGG GATCCATGTA GTTCAGTGAA ACCCATGCTT TCTTAATTGA 1850CAGAGATACA TTAAAACTTT TTACAGAATT GAGAAACCCA AGCCTTGTTA 1900ATTCTCAAAG ATACATTTAA ACTTTTTTCA GAAACGTGCT GAGTATTTTA 1950TCCTGTTTGT TATTCATTTT TGGCAGTTGG TCCTAAAAAT ACTCCTATGA 2000ATCTTGTGCT AGAGAAGACT TGCAATGCTA AAACAGGACG GGGCATGCCT 2050GAACTTTAAG GAGACGTTGC CTTGTTCCGA TTAGGTAATT GCTATCGTGA 2100TGAACAAAAA TTTGGTGTGA ATTTATCCCC TTGCCCTTTG CCATGATTCA 2150ATTAAAGACG TGTTTGGAAC CACATTCTAA CACCACTTTA TGATGGGTTA 2200GACGCAAAAT CTAGATTGGG TAGTGTTTAC ACACAGTTAC AAACACATTC 2250CTTGTTTAAT GTTATCATGC CTAGGAGTTG AATAACTTGT AACTTTACCA 2300ATTAGACATT ACTACTAGCA TTCTTTTTCC TATTCAAGTT GATGTTATCT 2350CCAGTTAGTG ATGGTCATTT CATTCCATAA ACTTCAATTG TTAAAATGAG 2400TGAAAAGGGA AAAAGGAACC CGTTTGATTG TTATGGTTCT AGTGATTTTT 2450ATTAATTGGG TTTGTCCATT AGTGTCGATT TGAGCTAAAT AGTTTCCCCC 2500CCCCAAAAGA TCAGTCTTCT CACATGTCAT ATTCATGCGC TGGTACCCTT 2550TTCATCCAGT TCCAACAAAC TTGCTGTACG AAGTCAGGTT GCATGAAAAT 2600AGTCAAATTT TCTTTAAGGG GGATATTATA CGTAAATAAA TAACGTAACC 2650CAAAAGTCTT ACTTGTTGGG TAACGTGGGT TTTGGTGTTT GATGGACCTA 2700GAACACTGTT TGTTGCTCTT ATATGCTTAC AAAGTAAAAA TGGTTATCAC 2750ATTTGGGGAA AAAATGTAGG CCCACTTATG ATATTTCGAC CTAAATGCAA 2800AATGGTTTAT CAATTTTTTT ATACTTAGTA TGATAAAACT CCTTTTTTTT 2850TTCCACTGGC ATACTATTTC TCTAAGACTT TTTAATAGTT CCGATAATTC 2900TTAGCTTAAA GAAATACGAC AAGGTTAGGA ATATTTTTTT ATTATGTGAC 2950ATTATTTTTT AAATATTTTG CTTCATATGA ATTTATACAA TCATTATAAT 3000TTGACCTTTT AAATGACTTT TAAAAATGAT CAGACCTAAA ATTTGAGTCT 3050TCTGATTGAG ATGCAAACTT ATTTCTTTTT ATATTTTATA TTTTATACTC 3100ATTTGTTTCT CTTTCTATTA TATTTCTTTT TTTTCTTCTC TTTATGCAAA 3150AACGTATGAC GTTGATTGGT GTCTTTGGCA ATCTTTTTAT GACGCTCAAA 3200AGTGAAAATA AATATTGTTC ACTTTCACCT CACGCTGGCC TTCCGCTGAT 3250GGTGGTTGTA CGCACTTATT TGATTTTTTT TTCTTCCACA TTTAATGAGG 3300TGAATCAGTT AGAGAAATAT TAAAAAAAAT AAATAAATAA AGGAAGACGA 3350CTAATACAAT AAAGAATACG AAACTCACAA TGAATAGACC CAATTAGAAC 3400CATTTATTTT CCTTACAAAT TAAAGAAAAC GTTTTTTTAA CAATATATCA 3450CATTATCATC TATTATATTT TTATTTATAT TTTTTATAAC TTTCTCTATC 3500TAGGTGTAGA TTGACATGAG TATACGCACG CACACCCAGC TCTACTTAGC 3550AGCAATTACC CGTTTTACTT GCTACTTAAG AGACACGTAC ATTAACACTT 3600GTCCTTGTGC ATGCAATTGC CACCACATTC CTCACTCCAC CCTTTTCTTT 3650ATATATAAAC AAACACAATG GATCATCTCA AACCAAGAGT GAGTTTGTTG 3700TTCCTCACTG ACCTCACC3718(2)SEQ ID NO7的资料(i)序列特征(A)长度4476(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO7TTGTAAAACG ACGGCCAGTG AATTGTAATA CGACTCACTA TAGGGCGAAT 50TGGGTACCGG GCCCCCCCTC GAGGTCGACG GTATCGATAA GCTTGATTAC 100TATAGGGCAC GCGTGGTCGA CGGCCCGGGC TGGTACTTTT GACTCCCTAA 150TTGACAACTA CTGCATTGTA TCGATATTAA TATGGAATTT GGAATCATGG 200TCCATGCTTC ATGTATTGTG TACCTCATAT TCAACAGCTA GTGAACACAA 250AATCTTACAT ACTTTTGTAT TTCTATCAGT TTATACCTTC CCAAATAAAT 300GGCTTATATT GCATTGAGTT ACATATTATT GTTTAGTTGG ATTGTAATTT 350ACGAGTAGTT TGTCACGACT GAAGAAATTA ATAAGGTATA AGACACGTCC 400TGCTCCCGCG AAATTCATTT TCTGTTTATT CTCTGTCTCT GTCTCTATTC 450AATTCAACCT TCCATTTGTT TTCGCCAGCA TCCAGATTTG TGCTTTCTCT 500ATCATTTCAT TTAATTAATG TGATGTATGT ATGGCTGAAT AAAAGATGGA 550TTCCTCTTTT TTGTGGGGTG GAAGCTTAAT CTATGGGGCT AGATAAAAAA 600ATTCATCTGT TTGTTGCACA GAATAAAATA TAAATTAATA ATTAATTAAA 650CTTCAAACAT GGACAGGGCA CCTCCAAGTT ATTTTAAAAC CGACCATGGC 700CATTTTTGCT TTCTGTTGGT GTTCTTGGCT CAGCTTTTGT AATTTTAGAC 750TGCAGAAACA TCCTGTATGG GTTGGAAAGC AGCTGAGAAA CTCATTAGGC 800GCTGGAAAAT TCTAAGAGGG GATAATGTAT GTGAGTCAAT TCAAACCCAC 850CATATGTTTG TCTCTGTGCT CTTTATTAAT TTCACTTTTT TATTTTATAA 900TTTTAGTCTC ACAGTCACAG AGTCACTTAT GTATTCATCT AACAGGTTAT 950GATAACAAGG GGCAAAGATA AGGGTGAGAC CGGGATTATA AAGCGTGTCA 1000TTTGCTCTCA AAATCGTGTC ATTGTAGAGG GTAAAAATCT GGTGAGATAT 1050TATAATCACT ATTTGGTCCT TCTGTTTTTC TAATGCCCTA TCTTCTGTAG 1100CTTTTGTTTT CAATTCCACT GTCAGTGTGT CTTGCATCAG AATATTAATC 1150GGTTGTCAGT GACATTGAGC ATTTAATTGT GTAAATTTTC CTGTTAGATT 1200TCTCACTCCA ATGCCTTTTG CCGTCCTCTT TATAGGTAAA GAAGCATATC 1250AAGCAAGGGC AAGGTCATAA AGGGGGAATC TTTACAGTGG AAGCCCCACT 1300GCATGCCTCC AATGTGCAAG TTCTTGACCC AGTGACAGGG TATGTACATG 1350TTAGATATTG AACTGGTGAT TGCTTCTCCA AATGGGATAA CATGTATGTA 1400AGTAAGAGTA ACCTACTTTT ACTTGTGCAG CAAGCCTTGC AAGGTTAGAG 1450TTAAAATATC TTGAAGATGG TACTAAAGTC AGAGTGTCCA GAGGAATAGG 1500AGCATCAGGG TTCATAGTCC CTCGTCCCAA GATCTTAAAG ATAAGAACTA 1550CCCCAAGACC TACAGTCCGT AAGTATCTAA CAAGCTTATG TTTTTTCCTT 1600GTATGAGTTG TTGATAAAAC ATGGCCAGAG CCAATAGAGA ATTGAGAAAA 1650GGTGAGAAAC AGAAAATGAA CTTGAATTAT GAGAAAGGTG TGGGAAACAA 1700ACAAGCCAAT AATGTGGCTT ATATAATATA TAGATATAGA CTAGAGTGAG 1750TAACGAATCA CTAACTAATT ACATGTGCAT ATCTACCTAA TTAGATGATT 1800CGTCAAACGA AGCAAAGTAT TGTGATAGAT AGTTGATTTT TCTCAAATAA 1850TTCTAAGATG TAATACTTAT ATTCTTTGCT ACATGTCTGT TGACATACAT 1900TGTTATCCAT AACCTTGTTA TTATACTTGG TGTTAAAAAA GGAGAGTCTC 1950CTTGCACTTT AGAGACATTC TTTAAACTGA CTTGACCTTA TTGAAATACA 2000TAATTCTAGT TACCAACTTA GCACCACACC ATAAAAGGAA AGATTTTTAA 2050ACGGTAGATT GATTGTTGAA TGTTGTTAAT CATCAAAGGT TTAAGATTTA 2100TTAAGTGCTT TCCATTGTCT TAAAATATTG CTTCTAGGAC TAGGATGTGT 2150ATATTGGTTA CATGATTTCC CCGCCTTCGT ATCAACTTAA GCATGTTGGA 2200CTTGCACCCA TATGCAGAAA CTCAAATAAA AAACTTCATT TGTAAGGTAT 2250AATAAGTGTA TATATAACAT TGTAAGTTGT CAATCAGAGT AATTTGGATT 2300GATGGATATT TAAGTCTTCT ATAATATTTC ATTTAGAGCC AGAAGCCAGG 2350TTCAAAGGAA TAGGTAATTC ACATGAATTC ATTCTCTTGT TTCTATACAG 2400TTATTATTTT TTCCATCTTA GTGTTGCAGG AAACTACCTC AGTTGTTGTA 2450GATGTGCAAA ACTTGTATGG ATATATATAC TGTTCAGTGT TGGGAAACCC 2500ATGCTTTCTT AATTCACAGA GATACATTTA AACTTTTTTT AGAAACTTGC 2550TTAGTATCTT ATCCTGTTAT TCATTTTTGG CAGTTGGTCC TAAAGATACT 2600CCTATGAATC TTGTGCTAGA GAAGACTTAC GATGCTAAAA CAGGACGGGG 2650CATGCCTGAA CTTTAAGGAG ACGTTGCCCT GTTCCACTTC CAATTAGGTA 2700ACTGCTATCG TGATGAACAA AAATTTGGTG TGAGTTTATC ACCTTGTCCT 2750TTGCCATGAT TCAATTAAAA GCGTGTTTGG ACTTTGGAAC CTCATTCTAA 2800CACCACCCTA TGATGGGTTA GACGCAAAAT CTAGACTGGG TAGTGTTTAA 2850CGTGTATCTG TGTGAACACA GTTACAAACG CATTCCATGT TTAATGCTAC 2900CATGCCTAGG AGTTGAATCA TTTGTAACTT TACCAATTTA GTCATTACTA 2950CTAGCATTCT TTTCCCTATT CAAGTTGATG TTAGCTCCAG TTAGGGATGG 3000TCATTTCACT CCATAAACTT TAATTGTTAG GTGAGTGGAA GAGGAACCCG 3050TTTGATTGTT ATGGTTCTAG TTCTAGTGAT TTTTATTAAT TGGGTTCGAC 3100CATATTAGTG TTTGATTTGA GCTATAGATA GTTTTTTCCC CAAAAGATCA 3150GTTTTCTCAC ATGTCAGATT CATGGGTTGG TACTCTTTTC ATCCAGTTCC 3200AACAAACTTG CTGTTCGAAC TACGAAGTCA GTCTTACTTA TTGGGTAACA 3250TGTGGGTTTT GGTGTTTAAT GGATCTAGAA TACTGTTTGT AGCTAAACCT 3300ATCTTATCAT ATAGGGCCTA AAAAGTAAAA TTGGTTATTA CATTTGGAAA3350AAAAGAAATA ATCTAGGCCC ACTGGCACAC TGAAAAACGT TTTCAATGAA3400TAATTTAATA GTTTTTTTTT TATAAAAAAA TTTTAATAAA AAATAATGGA3450GTTTTTAAAA ATATTACAAC AATCTGTTTC TCTAAGGTTT TTTAATAGTT3500CAGATAATTC ATAGCTTAGA GCAATACGAC ATGGTTAGGA AGCATAAAAA3550AAATATACGA CATGGTTAGG AATTTTTTTT TAGTATGTCT GACATAATTT3600TTTAAATGTT TTGGCTTCAT ATGAATTTAA CAGTGCGTCA TATGAACTTA3650CACACTCATT ATATTTTTTA ACCTTTTAAA TGATTTTTAA AAAATATGAC3650AGATGCAATC TTATTCTCAC TTTTTATACT TTCACTACTG CTTCATATGA3700CCTAAAGTCA GAGAAATATT TTAAAAAGAT AAATACGATA AAGAATACGA3750TGAGAAAGAA ACCTCACACA ATGAATAGAC CAAATTAGAC CTATTTATTT3800TCCTTAGAAA TAAAGAAAAT AATTATTTTT TATTTTTTCA CATTACATTT3850ATATTTTTCT ATCACTTTCT CTATTTAGGT ATTGATTGAC ATATGAGTGT3900ACATGAACTT TTTTTAAAAA AAAAGCGTAA ATATTAATTA TATTCATGCA3950TTTGTTTTCT GTCTTTCATT TTCTATTTAA TCTTACGTTA TCAATAATCT4000ATTATTAAAT TTTATAGTTG ATGATGAATA TATAAGAGAT ATAAATAAAA4050AAATAATTAA TTTTATAATA AAAATTAAAA AATAATTAAT TATTTTGAGA4100TAAATTTTTT TTAAGAGAAC AATTATAAAC GGAGAGTATT ATATTTAGTT4150TTATGTGTAC CGGGTACGTG TCTACTAACA TGGTGTCTCT CCATCATTTT4200CGTAGGAAAA AACATTATAG GAGTATGAAA AAAGCAAAAG TTTTGTCTGT4250TTATGGTTTT GTATATACCC AGCTCTACTT GGCAGCAATT ACCCGTCTTG4300CTTGCTACTT ACGAGACACG TACATTAACA CTTGTCCTAG CTAGTGCATG4350CAATTGCCAC CCCATTCCTC ACTCCTCCCT TTTCCTTCTC TTTATATTTA4400TATATATAAA TAAACAAACA CAATGCATCA TCTCAAAGAA ATTAAGAGAG4450TTTTTTTGTT CCTCACTGAC CAAGCC 4476(2)SEQ ID NO8的资料(i)序列特征(A)长度23(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO8TGTAAAACGA CGGCCAGTGA ATT 23(2)SEQ ID NO9的资料(i)序列特征(A)长度23(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO9GATTACGCCA AGCTCGAAAT TAA 23(2)SEQ ID NO10的资料(i)序列特征(A)长度27(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO10ATGGCGACCA GAGCCAAGCT TTCTTTA 27(2)SEQ ID NO11的资料(i)序列特征(A)长度27(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO11CGCAACAGCG CGACGACCAC GCTCGCT27(2)SEQ ID NO12的资料(i)序列特征(A)长度27(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO12ATGGCGACCA GAGCCAAGCT TTCTTTA27(2)SEQ ID NO13的资料(i)序列特征(A)长度27(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO13GAAGGGATGA CCAGGAGGGA CAACAAA27(2)SEQ ID NO14的资料(i)序列特征(A)长度23(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO14TTGTAAACGA CGGCCAGTGA ATT23(2)SEQ ID NO15的资料(i)序列特征(A)长度23(B)类型核酸(C)链型双链(D)拓扑结构线性(xi)序列描述SEQ ID NO15GGTGAGGTCA GTGAGGAACA ACA2权利要求
1.一种经修饰的植物蔗糖结合蛋白,其中所述经修饰的蔗糖结合蛋白与相应的野生型蔗糖结合蛋白相比,其氨基酸序列有所改变,并且与相应的野生型蔗糖结合蛋白相比,经修饰的蔗糖结合蛋白在酵母分析系统中的表达使蔗糖增强。
2.按照权利要求1的经修饰的植物蔗糖结合蛋白,其中所述经修饰的蔗糖结合蛋白比野生型蔗糖结合蛋白在酵母分析系统中增强蔗糖摄取至少达10%。
3.按照权利要求1的经修饰的植物蔗糖结合蛋白,其中所述经修饰的蔗糖结合蛋白比野生型蔗糖结合蛋白在酵母分析系统中增强蔗糖摄取至少达25%。
4.按照权利要求1的经修饰的植物蔗糖结合蛋白,其中所述有所改变的氨基酸序列包括比野生型蔗糖结合蛋白的C-末端截短。
5.按照权利要求4的经修饰的植物蔗糖结合蛋白,其中所述C-末端截短导致除去10到100个范围之间的氨基酸。
6.一种经修饰的植物蔗糖结合蛋白,其中相应的野生型蔗糖结合蛋白选自SBP1和SBP2。
7.按照权利要求6的经修饰的植物蔗糖结合蛋白,其中所述蛋白具有选自Seq.I.D.Nos.2和4的氨基酸序列。
8.编码权利要求1的经修饰的植物蔗糖结合蛋白的核酸分子。
9.含有权利要求8的核酸分子的载体。
10.表达权利要求1的经修饰的植物蔗糖结合蛋白的转基因植物。
11.编码权利要求6的经修饰的蔗糖结合蛋白的核酸分子。
12.表达权利要求6的经修饰的植物蔗糖结合蛋白的转基因植物。
13.一种编码植物蔗糖结合蛋白的分离的核酸分子,其中所述蛋白质含有选自下列组中的氨基酸序列(a)Seq.I.D.No.3所示的氨基酸序列;(b)Seq.I.D.No.4所示的氨基酸序列;(c)与(a)或(b)的氨基酸序列具有至少70%序列同一性的氨基酸序列;和(d)与(a)或(b)的氨基酸序列具有至少90%序列同一性的氨基酸序列。
14.含有与权利要求13的核酸分子有效连接的启动子序列的重组表达盒序列。
15.含有权利要求14的重组表达盒序列的转基因植物。
16.含有与核酸序列有效连接的启动子序列的重组核酸分子,其中所述启动子序列包括SBP1或SBP2启动子。
17.按照权利要求16的重组核酸分子,其中所述启动子序列包括选自以下组中序列的至少25个连续核苷酸(a)Seq.I.D.No.7;和(b)Seq.I.D.No.8。
18.按照权利要求17的重组核酸分子,其中所述核酸序列编码植物蔗糖结合蛋白。
19.含有权利要求17的重组核酸分子的转基因植物。
20.含有权利要求18的重组核酸分子的转基因植物。
全文摘要
本发明提供了一种编码植物蔗糖结合蛋白(SBP)的cDNA,以及在酶母分析系统中表现增强的蔗糖摄取活性的修饰SBP。同时也提供了具有改变的蔗糖摄取活性的核酸载体、转基因细胞和转基因植物。本发明还涉及用于调控转基因(包括SBP转基因)在植物中表达的启动子序列。
文档编号A01H5/00GK1257547SQ98805333
公开日2000年6月21日 申请日期1998年5月21日 优先权日1997年5月22日
发明者霍华德·D·格里姆斯, 赵少武 申请人:华盛顿州立大学研究基金会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1