调节产纤维植物中纤维素生物合成的方法和手段的制作方法

文档序号:152330阅读:744来源:国知局
专利名称:调节产纤维植物中纤维素生物合成的方法和手段的制作方法
技术领域
本发明涉及农业生物工程学领域。更具体地,本发明提供了参与纤维素生物合成的新的基因以及使用此类基因调节产纤维植物例如棉属植物中的纤维素生物合成的方法。本发明也提供了用于在产纤维植物群体中鉴别并分离这些基因的与产生的纤维的品质有关联的等位基因的方法。
背景技术
纤维素是高等植物细胞壁的主要结构多糖。β-1,4-联葡糖残基(β-1,4-1inked glucosyl residues)的链在合成后迅速组装形成坚硬的、在化学性质上具有抵抗力的微纤维。其机械特性及其在细胞壁的定位影响了细胞在不同反向的相对伸展性,并决定成熟细胞和器官的最终机械特性。这些机械特性对于木材、纸张、纺织品和化学工业极为重要。
很多用于纺织业的高质量纤维是棉属植物产生的。全世界的大约90%的棉属植物是陆地棉(Gossypium hirsutum L.),而海岛棉(Gossypiumbarbadense)占大约8%。
已经在多种植物中通过突变分析鉴定了若干种参与纤维素生物合成的基因。鼠耳芥(Arabidopsis thaliana)的突变株说明,体内纤维素合成需要编码糖基转移酶的AtCesA基因家族成员的活性(Arioli等,1998;Taylor等,1999;Fagard等,2000;Taylor等,2000;Scheible等,2001;Burn等,2002a;Desprez等,2002)、编码膜相关性内-1,4-β-D-葡聚糖酶的AtKOR1基因(At5g49720)活性(Nicol等,1998;Zuo等,2000;Lane等,2001;Sato等,2001)、编码一种功能未知的质膜蛋白的KOBITO1的活性(Pagant等,2002)和编码ER中进行N-糖基化/品质控制途径的酶的基因的活性(Lukowitz等,2001;Bum等,2002b;Gillmor等,2002)。
内-1,4-β-D-葡聚糖酶在纤维素合成中的功能仍有待确定,但其缺乏BnCel16的对结晶纤维素的活性,BnCel16是一种相关的欧洲油菜(Brassica napus)酶(Mlhj等,2001),这提示这种酶可能裂解非结晶葡聚糖链,例如脂质连接引物(lipid-linked primer)或葡聚糖供体(Williamson等,2001;Peng等,2002)。番茄Ce13(LeCe13)是第一种得到鉴定的膜相关性内-1,4-β-D-葡聚糖酶(Brummel1等,1997),而LeCe13的抗体检测到棉纤维蛋白在除草剂抑制纤维素合成的过程中被上调(Peng等,2001)。棉纤维膜成分的体外纤维素合成活性需要Ca2+,而由于外源性的Ca2+-非依赖性内-1,4-β-D-葡聚糖酶可使得纤维素合成活性恢复,因此认为KOR(GhKOR)的棉属植物直向同源物是内源性Ca2+-依赖性因子(Peng等,2002)。截短形式的BnCel16在体外显示出Ca2+-依赖性(Mlhj等,2001)。
进一步遗传学数据指向应答于N-糖基化/品质控制途径的酶缺陷的纤维素合成。这些步骤出现于ER而不是在质膜,且因此可能通过为质膜提供关键的糖蛋白而仅仅间接作用于合成。当富甘露糖寡糖Glc3Man9GlcNac2在ER膜的多萜醇上组装并被转移到含有Asn-X-Ser或Asn-X-Thr基序(其中X是除Pro以外的任何氨基酸)的新合成的蛋白质的Asn残基的时候即开始N-糖基化。
通过葡糖苷酶I和II进一步加工糖蛋白,N-糖基化与负责保证新合成的蛋白质正确折叠的品质控制途径相交(Helenius and Aebi,2001;Vitale,2001)。葡糖苷酶I去除末端α-1,2-联葡糖残基以产生Glc2Man9GlcNac2,而葡糖苷酶II去除下一个α-1,3-葡糖残基。携带所得GlcMan9GlcNac2的多肽特异性结合分子伴侣(钙连接蛋白和钙网蛋白)以及或许其他的可促进新合成的蛋白质的正确折叠的蛋白质。当葡糖苷酶II将结合分子伴侣所需的最后的Glc残基去除后,糖蛋白释放所述分子伴侣。然后糖蛋白葡糖基转移酶将一个Glc残基再次结合到非正确折叠的糖蛋白的Man9GlcNAc2,如此使得它们可再次结合分子伴侣并仍拥有正确折叠的机会。不过,正确折叠的蛋白质则不能被该酶再次葡糖基化,而是通过分泌途径前进以进一步加工和输送。
该途径中的若干个环节的缺陷可影响纤维素合成。序列分析显示,马铃薯MAL1基因编码一种葡糖苷酶II,且反义抑制降低了葡糖苷酶II活性(Taylor等,2000a)。与对照相比,当生长于田间环境时,M4LJ反义植物积聚较少的纤维素,不过,在暖房条件下没有明显的表型。胚芽致死knopf突变体缺乏葡糖苷酶I并严重缺乏纤维素(Gillmor等,2002)。最后,胚芽致死cyt1突变体是来自甘露糖-1-磷酸guanylyltransferase缺陷的纤维素缺陷体,该酶产生组装高甘露糖寡糖所需的(包括其他)UDP-Man,高甘露糖寡糖自多萜醇转移至新生的蛋白质(Lukowitz等,2001)。影响纤维素合成的突变主要针对那些N-糖基化途径与品质控制途径发生交叉的早期步骤。似乎特别重要的是品质控制,而不是在重要蛋白质上产生成熟聚糖,这是由于一种N-乙酰氨基葡萄糖转移酶I的缺陷没有产生可检测到的表型,该缺陷阻断了高尔基体中形成成熟的N-联聚糖的步骤(von Schaewen等,1993)。
Baskin等,1992描述了鼠耳芥属突变体,这些突变体显示出根部径向膨胀,这些突变体称为rsw1、rsw2和rsw3。这些突变系显示出纤维素的产生具有选择性降低(Peng等,2000)。
WO98/00549一般性涉及分离的基因,这些基因编码参与植物中纤维素生物合成的多肽,还涉及转基因植物,其表达有义或反义方向的所述基因或作为核酶、共抑制或基因导向分子的所述基因。更具体地,其请求保护一种核酸分子,其分离自鼠耳芥、稻米(Oryza sativa)、小麦、大麦、玉米、芸苔(Brassica ssp.)、陆地棉和桉(Eucalyptus ssp),其编码一种对纤维素生物合成十分重要的酶,特别是纤维素合酶及其同源物、类似物和衍生物,及其在产生表达改变了的纤维素生物合成特性的转基因植物中的用途。
WO 98/50568公开了使用编码内-1,4-β-葡聚糖酶的核苷酸序列在植物中抑制细胞的生长。所述核苷酸序列与鼠耳芥属KOR蛋白序列或如下所述的一种蛋白序列完全或部分相对应,所述的一种蛋白序列的N端与所述KOR的前107个氨基酸具有至少40%相同性且优选地具有70%相同性。
WO 97/24448描述了重组的和分离的核酸,所述核酸编码一种植物α-葡糖苷酶。其也提供了一种反义核苷酸以及所述分离的或重组的序列和反义序列的用途。该发明的用途包括增强和降低α-葡糖苷酶的表达以及提供新的淀粉。
WO 00/08175涉及编码来自马铃薯的具有α-葡糖苷酶活性的蛋白质的核酸分子。该发明也涉及用于产生合成改性淀粉的转基因植物细胞和植物的方法。该发明进一步涉及含有所述核酸分子的载体和宿主细胞、由该发明的方法得到的植物细胞和植物、由所述植物细胞合成的淀粉以及产生此类淀粉的方法。
WO 98/39455公开了一种参与微生物合成纤维素的基因和酶。提供了编码纤维素酶、纤维素合酶复合体和α-葡糖苷酶的特定的基因。
WO9818949和US6271443提供了来自棉属植物(陆地棉)的两种植物cDNA克隆,它们是编码纤维素合酶的催化亚基的细菌CelA基因的同源物。其还提供了纤维素合酶的编码区的基因组启动子区域。还提供了在改良棉纤维和木材品质中使用纤维素合酶的方法。
不过,现有技术仍然亟需那些已知参与纤维素生物合成的基因的替代物,且没有公开参与纤维素生物合成的野生型基因的核苷酸序列以及在rsw3突变体鼠耳芥系中是突变的核苷酸序列。此外,现有技术没有公开来自棉属植物的参与纤维素生物合成的RSW2或RSW3的棉属植物同源物基因。
这些以及其他的问题通过以下公开的本发明的各种不同实施方式和权利要求书而得以解决。

发明内容
本发明的一个目的是提供一种用于增加产纤维植物,特别是棉属植物中的纤维素生物合成,例如棉绒纤维生物合成的方法,其包括以下步骤(a)给所述产纤维植物的细胞提供一种嵌合基因,所述嵌合基因包括以下可操纵连接的DNA片段i)在所述植物的所述细胞中可表达的启动子,例如组成型启动子、纤维特异性启动子或者苹果青霉素启动子;ii)编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或者所述蛋白质的具有同样酶活性的变体)的DNA区域,例如SEQ ID No.1的自第位核苷酸至第1986位核苷酸的核苷酸序列或SEQ ID No.2的自第47位核苷酸至第1906位核苷酸的核苷酸序列或SEQ ID No.3的或SEQ ID No.4的自第2位核苷酸至第1576位核苷酸的核苷酸序列或SEQ ID No.9的核苷酸序列;iii)参与转录终止和聚腺苷酸化的3’区域。
本发明的另一个目的是提供一种用于降低产纤维植物,特别是棉属植物中的纤维素生物合成,例如绒毛纤维生物合成的方法,其包括给所述产纤维植物的细胞提供一种能够降低所述产纤维植物的一种内源性基因的表达的嵌合基因的步骤,其中所述内源性基因编码一种包括SEQID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有同样的酶活性。所述导入的嵌合基因可包括一种具有21个连续的核苷酸的核苷酸序列,其选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列或其互补序列,所述核苷酸序列可操纵地连接于在植物中可表达的启动子例如组成型启动子或绒毛纤维特异性启动子,以及参与转录终止和聚腺苷酸化的3’区域。所述嵌合基因也可包括一种具有21个连续的核苷酸的第一核苷酸序列,其选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4或SEQID No.9的核苷酸序列,和一种与所述第一核苷酸序列互补的第二核苷酸序列,所述核苷酸序列可操纵地连接于在植物中可表达的启动子,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
本发明进一步涉及一种用于增加产纤维植物中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括以下可操纵连接的DNA片段在所述植物的所述细胞中可表达的启动子,例如组成型启动子、(棉绒)纤维特异性启动子或苹果青霉素启动子;编码包括SEQ ID No.6或SEQID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体的DNA区域,所述变体具有同样的酶活性,例如SEQ ID No.1的自第121位核苷酸至第1986位核苷酸或SEQ ID No.2的自第47位核苷酸至第1906位核苷酸或SEQ ID No.3的或SEQ ID No.4的自第2位核苷酸至第1576位核苷酸或SEQ ID No.9的核苷酸序列;以及参与转录终止和聚腺苷酸化的3’端区域。
本发明也涉及一种用于降低产纤维植中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列,所述序列选自编码一种包括SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.2、SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列或其互补序列,以及参与转录终止和聚腺苷酸化的3’区域。
本发明还涉及一种用于降低产纤维植物中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括可操纵地连接于在植物中可表达的启动子的一种具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列以及参与转录终止和聚腺苷酸化的3’区域,所述第一核苷酸序列选自编码一种包括SEQ ID No.6或SEQID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
本发明的另一方面提供了包含本发明的嵌合基因的植物细胞和植物,以及包含本发明的嵌合基因的此类植物的种子。此类植物优选地基本上由包含本发明的嵌合基因的植物细胞组成。
因此本发明涉及本发明的嵌合基因在调节产纤维植物的,例如棉属植物的,纤维素生物合成和纤维品质中的用途。
本发明的另一方面还在于提供了一种用于在包括一种特定植物品种的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法,所述特定植物品种优选地是产纤维植物品种,例如棉属植物,所述等位基因变异单独地或者组合地与纤维素生产的数量和/品质以及纤维生产有关联,所述方法的步骤包括a)提供包含不同等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列的特定植物品种或杂种繁殖植物品种的不同变种或基因型的群体;b)确定所述群体中每一个个体的与纤维生产和/或纤维素生物合成有关的参数;
c)确定所述群体中每一个个体是否存在一种特定等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列;以及d)将出现特定的纤维或纤维素参数与是否存在一种特定等位基因形式的所述核苷酸序列或此类等位基因形式的一种特定组合相关联。


图1蛋白质GhKOR(SEQ ID No.6)、LeCel3(保藏号T07612)和AtKOR1(保藏号At5g49720;SEQ ID No.5)与BnCel16(保藏号CAB51903)的ClustalW比对。突出的部分是极性化导向基序,涉及导向细胞板(cell plate)(Zuo等,2000);推定的靠近N端的跨膜区(跨膜);4个潜在参与催化的保守残基(Asp-198、Asp-201、His-516和E-555;标记为o)以及与家族9糖苷水解酶非常相似的代表性部分;富Pro且具有内-1,4-β-葡聚糖酶家族的膜结合成员的特征的C端区域;8个推定的N-糖基化位点(Asn-X-Ser/Thr;标记为G1至G8)。
图2通过以可操纵地连接于CaMV 35S启动子的GhKOR1 cDNA(SEQ ID No.2)进行转染而与rsw2-1互补。(A)在29℃暴露2天后,rsw2-1根发生膨胀,而野生型(Co)和含有AtKOR1或GhKOR的互补植物则不发生膨胀。(B)两株植物的成熟的茎,各自为rsw2-1(左)野生型和表达GhKOR的rsw2-1。在21℃生长于罐中的植株的照片,直至开始抽苔(bolting),此时将抽苔切下并将植株转移至29℃以使抽苔再生。
图3编码葡糖苷酶II基因的突变引起径向膨胀。(a)以自野生型基因组扩增的5.8kB片段转化的rsw3互补根部径向膨胀。Columbia野生型(左)、rsw3(中)和以葡糖苷酶II基因的基因组拷贝转化的rsw3卡那霉素抗性T1幼苗(右)。野生型基因抑制径向膨胀。在拍照前,将所有植物转移至30℃放置2天。(b)rsw3突变是插入性突变体5GT5691的等位基因突变,其在葡糖苷酶II基因的第一个外显子中含有Ds元件。Columbia野生型(左)、rsw3(中)和来自5GT5691与rsw3杂交的杂合F1植物。F1杂合子和rsw3纯合子显示温度诱导的径向膨胀。在拍照前,将所有植物转移至30℃放置2天。
图4Aglu-3/RSW3序列(Genbank NP_201189)与来自马铃薯(保藏号T07391)、小鼠(NP_032086)和裂殖酵母(CAB65603)的ER固有的葡糖苷酶II的序列的比对。Monroe等(1999)的进化枝2证实了这种高保守性。它们包括若干参与催化的残基(Asp 512和Asp 617;*)。rsw3-1突变的位点(Ser599●)在这些共有序列附近并在这些以及其他葡糖苷酶II序列中是保守的。预测的N端信号序列示于框中。在C端没有HDELER-保留序列。
图5推荐的鼠耳芥属(At5g56360)的和水稻(我们修改的BAA88186)的β-亚基与来自小鼠(AAC53183)的和裂殖酵母(BAA13906)的葡糖苷酶IIβ-亚基的比对。注意推定的N端信号序列(框中)、C端H/VDEL ER-保留信号和靠近N端的甘露糖受体同源区域(MHR)。给出了MHR中的6个半胱氨酸(f酵母中仅为4个)的编号,并标出了参与底物结合的R和Y残基(●)和半胱氨酸5和6之间的底物识别环。在该序列的其他部分,注意N端和C端结构域具有相对高水平的相似性,而中部区域的相似性要低得多并具有植物特异性插入体。
图6在所有测试的鼠耳芥属组织中均检测到α-亚基(a)和β-亚基(b)的mRNA。使用来自根(道1)、完整莲座叶(2)、叶片(3)、成熟的茎组织(4)、茎生叶片(5)、花芽(6)、花(7)、长角果(8)、黑暗中生长的胚轴(9)的mRNA的RT-PCR。(在另一个实验中证实黑暗中生长的胚轴存在β-亚基)。
图7rsw3的形态学。
(a)幼苗的根系显示在膨胀和停止延长之前侧根延伸一定距离。植物在21℃生长5天并在30℃生长6天。比例尺=2mm。
(b)根继续生长产生密集的、高度分枝的根系,并在30℃生长21天的植物上产生大量密集的极小的叶片。比例尺=5mm。
(c)在黑暗中21℃生长3天并在30℃生长3天的胚轴。左起野生型、rsw1-1、rsw2-1、rsw3、rsw1-1rsw2-1、rsw1-1rsw3。相对于其他单突变体,rsw3对胚轴的影响较弱,而rsw1-1rsw3较rsw1-1rsw2-1更弱。比例尺=5mm。
(d)在30℃在琼脂上生长35天的rsw3的光镜检查。自若干个花结出现接近正常大小的花芽的微弱荧光(右上和左下)。比例尺=5mm。
(e)在30℃生长21天的rsw3植物的扫描电子显微镜并显示出现多个花结。比例尺=1mm。
(f)(e)中环形部分的细节显示细小的叶片的非常复杂的排列,其中很多带有近似正常大小和形态的毛状体。比例尺=200μm。
(g)在30℃生长10天的植物上的野生型叶片表面的扫描电子显微镜照片。注意那些清晰显示出的细胞边界、气孔和毛状体。
(h)rsw3叶片的表面显示出铺路石状细胞(pavement cells)的轮廓明显欠清晰、在其次生细胞环的顶部有明显塌陷的毛状体(CT)以及许多气孔,其保卫细胞突出于叶片表面以上。(g)和(h)的比例尺=100μm。
图8rsw3的茎生长和再生性发生。
(a和b)21℃(a)和30℃(b)时Columbia野生型、rsw3、rsw1和rsw1rsw3双突变体的次生茎延长的动力学。所有植物生长于21℃直至茎开始出现。将其切下并在指定的温度再次生长次生抽苔。单突变体与野生型在21℃仅有极小的差异,不过双突变体延长得更加缓慢且最终高度明显更矮小。在30℃达到的最终高度差异很大,这与其经由的轨迹一样。rsw1延长得更加缓慢,但延长一直持续,至少与其野生型一样。rsw3延长得几乎与野生型一样迅速,但4天后停止延长达大约6天。rsw1rsw3双突变体延长比较不迅速,并在大约第5天停止延长。
(c和d)光镜显示野生型具有间隔良好的花(c)以及rsw3的因其早期停止延长而形成的成簇的花(d)。
(e和f)冷扫描电子显微镜显示了野生型(e)和rsw3(f)的花芽,花芽的大小相似,但rsw3过早开花。注意rsw3的柱头(St)的未成熟状态和萼片(Se)上的细胞的不规则形状。(e)和(f)的比例尺=200μm。
(g和h)冷扫描电子显微镜显示出保持在21℃(g)和30℃(h)的植物产生的吸液后的rsw3的种子。30℃的种子皱缩并缺乏21℃的种子所具有的清晰的细胞图案。
(i-n)吸液后的种子以钌红染色后的光镜照片,显示表面黏液覆层。野生型(i,j)、rsw1(k,l)、rsw3(m,n)。i,k,m中的种子产生于21℃的植物,j,l,n中的种子产生于30℃的植物。分泌黏液的通常是30℃的rsw1(l)和野生型(j)而不是rsw3(n)。
发明的详细描述本发明基于鉴定了已经发生突变的鼠耳芥属突变体rsw3的野生型基因并阐明了其功能。本发明人还鉴定了相应于rsw2和rsw3鼠耳芥属突变体中的突变基因的棉属植物基因。这些棉属植物基因参与纤维素的产生。
在一个实施方式中,本发明涉及一种用于在植物中增加纤维素产生的方法,其步骤包括为植物的细胞提供一种嵌合基因,所述嵌合基因包括可操纵地连接于一种DNA区域的在植物中可表达的启动子以及参与转录终止和聚腺苷酸化的3’区域,所述DNA区域编码一种包括SEQ IDNo.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有与所述蛋白质相似的活性。所述植物可以是产纤维植物例如棉属植物,纤维素产生增加可导致产生更大量的棉纤维,优选地为棉绒纤维,或导致产生的棉纤维的长度发生改变或长度增加,或品质的改变例如抗张强度提高。
在此,“嵌合基因”或“嵌合核酸”指的是任何基因或任何核酸,其在正常情况下不存在于具体的真核生物物种中,或者指的是任何基因,其中启动子在天然情况下不与部分或全部被转录的DNA区域相关联,或不与该基因的至少一种其他调节区域相关联。
在此,术语“启动子”指的是任何在转录起始过程中被DNA-依赖性RNA-聚合酶识别并(直接或间接)结合的DNA。启动子包括转录起始位点和与转录起始因子和RNA聚合酶的结合位点,并可以包含多种可与基因表达调节蛋白结合的其他位点(如增强子)。在此,术语“调节区域”指的是任何参与驱动转录并控制(如调节)特定DNA序列的转录时机和水平的DNA,所述特定DNA序列例如为编码蛋白质或多肽的DNA。例如,5′调节区域(或“启动子区域”)是位于编码序列上游(即5′)的DNA序列并包含启动子和5′非翻译前导序列。3′调节区域是位于编码序列下游(即3′)的DNA序列并包含合适的转录终止(和/或调节)信号,包括一或多个聚腺苷酸化信号。
在本发明的一个实施方式中,启动子是组成型启动子。在本发明的另一个实施方式中,启动子活性可被外在的或内在的刺激增强(诱导型启动子),例如但不限于激素、化学品、机械刺激、非生物性或生物学应激条件。能够以时间的或空间的方式来调节启动子的活性(组织特异性启动子;发育调节的启动子)。
在本发明的一个具体实施方式
中,启动子是植物可操纵的(即植物可表达的)启动子。在此,术语“植物可表达的启动子”指的是能够在植物细胞内控制(起始)转录的DNA序列。这包括任一一种植物来源的启动子,但也可以是非植物来源的但能够在植物细胞中指导转录的启动子,即特定的病毒或细菌来源的启动子,例如CaMV 35S启动子(Hapster等,1988)、地三叶草(subterranean clover)病毒启动子No 4.或No.7(WO9606932)或T-DNA基因启动子,但也可以是组织特异性或器官特异性启动子,包括但不限于种子特异性启动子(如WO89/03887)、器官原基特异性启动子(An等,1996)、茎特异性启动子(Keller等,1988)、叶片特异性启动子(Hudspeth等,1989)、叶肉特异性启动子(例如光诱导型Rubisco启动子)、根特异性启动子(Keller等,1989)、块茎特异性启动子(Keil等,1989)、血管组织特异性启动子(Peleman等,1989)、雄蕊选择性启动子(WO 89/10396,WO 92/13956)等等。
优选的植物可表达的启动子包括纤维特异性和/或次生细胞壁特异性启动子,可根据WO 98/18949、WO98/00549或US5932713所述对其进行分离。WO98/18949或US 6,271,443所公开的启动子也是合适的,特别优选的是棉绒纤维特异性启动子。
在上述方法的一个实施方式中,编码包含SEQ ID No.5、SEQ IDNo.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的DNA区域包含的核苷酸序列为SEQ ID No.1的第121至1986位核苷酸、SEQID No.2的第47至1906位核苷酸、SEQ ID No.3或SEQ ID No.4的第2至1576位核苷酸、或SEQ ID No.9。
在上述方法的另一个实施方式中,DNA区域编码包含SEQ ID No.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的变体。在此,“变体”蛋白质指的是这样的蛋白质,所述蛋白质通过取代、缺失、插入,使得其中一或多个氨基酸与具有SEQ ID No.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质中的相应位置的氨基酸不同;且所述蛋白质具有由SEQ ID No.5、SEQ IDNo.6、SEQ ID No.7或SEQ ID No.8编码的蛋白质的至少一种功能,例如同样的酶或催化活性。获得变体的方法例如位点特异性诱变方法以及鉴定由这些变体序列所编码的酶活性的测试方法是本领域已知的。优选的取代也称为保守性取代,其中多肽中的一种氨基酸残基被替换为另一种具有相似化学性质的天然存在的氨基酸,例如GlyAla,ValIleLeu,AspGlu,LysArg,AsnGln或PheTrpTyr。
根据说明书,编码变体蛋白质的等位基因形式的核苷酸序列可在严格性条件下通过文库杂交进行鉴定,例如不同变种或植物品系的cDNA或基因组文库,特别是棉属植物变种和植物品系。上述优选的编码区域的功能性等价物是在严格性条件下与编码SEQ ID No.5、6、7或8的氨基酸序列的核苷酸序列或SEQ ID No.1、2、3、4或9的核苷酸序列杂交的核苷酸序列或其足够大的一部分(优选地大约25个连续的核苷酸,特别优选地至少大约50个连续的核苷酸,更加特别优选地至少大约100个连续的核苷酸),并且其编码一种功能性蛋白质,该蛋白质能够互补鼠耳芥属的rsw2或rsw3突变体品系中的至少一种功能,但优选地能够互补全部受影响的能够功能。也可采用例如聚合酶链反应进行扩增而鉴别并分离此类核苷酸,扩增可使用合适的寡核苷酸对,其具有SEQ ID No.1、SEQ ID N.2、SEQ ID No.3、SEQ ID No.4或SEQ ID No.9的核苷酸的至少大约25个连续的核苷酸,特别优选地至少大约50个连续的核苷酸,更加特别优选地至少大约100个连续的核苷酸。
“严格性杂交条件”在此指的是,如果探针与靶序列之间具有至少95%且优选地至少97%的序列相同性,则通常会发生杂交。严格性杂交条件的实例是在包括50%甲酰胺,5×SSC(150mM NaCl,15mM柠檬酸钠),50mM磷酸钠(pH 7.6),5×Denhardt溶液,10%硫酸右旋糖苷和20μg/ml变性的剪断的载体DNA例如鲑精DNA的溶液中孵育过夜,随后在大约65℃在0.1×SSC中洗涤杂交支持物。其他的杂交和洗涤条件是已知的并可参照Sambrook等,Molecular CloningA Laboratory Manual,Second Edition,Cold Spring Harbor,NY(1989),特别是11章。
在本发明的另一方面,所鉴定的基因可用于在植物如产纤维植物中,例如棉属植物中,降低纤维素的生物合成。因此,本发明的另一个实施方式提供了一种在植物如产纤维植物中,特别是棉属植物中,降低纤维素生物合成的方法,其步骤包括给所述产纤维植物的细胞提供一种嵌合基因,所述嵌合基因能够降低所述产纤维植物的一种内源性基因的表达,其中所述内源性基因编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有相同的功能或酶活性。
在本发明的这种方法的一个实施方式中,将嵌合基因提供给所述植物的细胞,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如为一种选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQID No.4或SEQ ID No.9的核苷酸序列的具有21个连续的核苷酸的核苷酸序列(所谓“有义”RNA介导的基因沉默)。在本发明的这种方法的另一个实施方式中,将嵌合基因提供给所述植物的细胞,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ IDNo.8的氨基酸序列的蛋白质的核苷酸序列的互补序列,例如为一种选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列的互补序列的具有21个连续的核苷酸的核苷酸序列(所谓“反义”RNA介导的基因沉默)。
反义或有义核苷酸序列的长度可以是自大约21个核苷酸(nt)直至长度等同于靶核酸的长度(以核苷酸计)。优选地,所述反义或有义核苷酸序列的总长度为至少大约50nt,100nt,150nt,200nt,或500nt。可以预期的是,除了靶核酸的总长度以外,反义或有义核苷酸序列的总长度没有上限。不过,从实际出发(例如为了嵌合基因的稳定性),预期反义或有义核苷酸序列的长度不应该超过5000nt,特别不应该超过2500nt,且应该在大约1000nt以内。
应该可以理解的是,反义或有义核苷酸序列的总长度越长,对总反义或有义核苷酸序列与靶基因的相应的序列或其互补序列之间的序列相同性的要求也就越不严格。优选地,总反义核苷酸序列应该与相应的靶序列的互补序列具有至少大约75%的序列相同性,优选地至少大约80%,更加优选地至少大约85%,相当优选地大约90%,特别优选地大约95%,更加特别优选地大约100%,相当特别优选的是与靶核酸的相应部分的互补序列完全相同。不过,优选地所述反义或有义核苷酸序列总是包括一种大约20-21nt的序列,其与靶核酸的相应部分或其互补序列具有100%的序列相同性。优选地,为了计算序列相同性并设计相应的反义或有义序列,应当将缺口数量降至最低,特别是对于那些更短的反义或有义序列。
在本发明中,两种相关的核苷酸或氨基酸序列的“序列相同性”,以百分数表示,指的是两种最佳比对的序列中的具有相同残基的位置数目(×100)除以进行比较的位置数目。缺口是比对中的一种位置,在该处,残基出现于一条序列中但未出现于另一条中,缺口被视为不具有相同性的残基位置。通过Needleman和Wunsch算法(Needleman andWunsch 1970)进行两序列的比对。采用标准的软件程序可常规进行计算机辅助序列比对,例如采用GAP,其是Wisconsin Package Version 10.1(Genetics Computer Group,Madison,Wisconsin,USA)的一部分,使用默认评分阵列,缺口创建罚分为50,缺口延伸罚分为3。
本发明的另一种实施方式涉及用于降低产纤维植物的内源性基因表达的方法,其中所述内源性基因编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8或的氨基酸序列的蛋白质或其变体,该方法使用置于植物中可表达的启动子控制下的DNA区域,该区域的转录产生所谓双链RNA分子,其既包括有义序列又包括反义序列,能够形成如WO 99/53050所述的双链RNA分子(其全部内容在此并入作为参考)。
因此,在本发明的一个方面,可给植物细胞提供一种嵌合基因,其包括可操纵地连接于一种DNA区域的在植物中可表达的启动子,该DNA区域包含编码区域的一部分,所述部分包含来自编码具有SEQ IDNo.5、6、7或8的氨基酸序列的蛋白质的核酸的编码区域的至少20或21个连续的核苷酸(所谓有义部分),以及一种DNA序列,所述DNA序列至少包含该有义部分的至少20或21个核苷酸的互补DNA序列,但其能够完全互补于该有义部分(所谓反义部分)。所述嵌合基因可包含额外的区域,例如在植物中具有转录终止和聚腺苷酸化功能的区域。转录后可产生一种RNA,其可在有义和反义区域的互补部分之间形成一种双链RNA茎。在有义和反义核苷酸序列之间可存在间隔区域。所述嵌合基因可进一步包含内含子序列,优选地位于间隔区域内部。
在本发明的另一个实施方式涉及一种用于降低产纤维植物的内源性基因的表达的嵌合基因,其中所述内源性基因编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有相同的功能或酶活性,所述嵌合基因编码一种核酶,其识别并裂解一种RNA,所述RNA具有编码一种包括SEQ IDNo.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体的RNA的核苷酸序列。在另一个实施方式中,所述核酶识别并裂解一种RNA,所述RNA具有包括SEQ ID No.1、2、3或4的核苷酸序列的RNA的核苷酸序列。Haseloff和Gerlach(1988)已经公开了设计并使用核酶的方法,也参见WO 89/05852。
显然,只要RNA分子的核苷酸序列是通引用相应的DNA分子的核苷酸序列进行限定时,核苷酸序列中的胸腺嘧啶(T)均应替换为尿嘧啶(U)。引用的究竟是RNA或DNA分子可从本申请的上下文进行判断。在本发明的另一个实施方式中,提供了核酸(DNA或RNA分子),其可用于改变植物中的纤维素生物合成。因此本发明提供了一种嵌合基因(DNA分子),其包含以下可操纵连接的DNA片段
i)在所述植物的所述细胞中可表达的启动子;ii)包含具有至少21个核苷酸的核苷酸序列的DNA区域,所述核苷酸序列选自编码包含SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或具有相同酶活性的该蛋白质的变体)的核苷酸序列,例如SEQ ID No.1、2、3、4或9核苷酸序列;和/或iii)包含具有至少21个核苷酸的核苷酸序列的DNA区域,所述核苷酸序列选自编码包含SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或具有相同酶活性的该蛋白质的变体)的核苷酸序列的互补序列,例如SEQ ID No.1、2、3、4或9核苷酸序列;和iv)参与转录终止和聚腺苷酸化的3’端区域。
本发明还提供了可自本发明的嵌合基因获得的RNA分子。此类RNA分子通过在体内或体外对所述嵌合基因进行转录产生。它们可以通过体外转录而获得,其中转录区域置于一种启动子的控制下,该启动子被单亚基RNA聚合酶识别,其选自噬菌体例如SP6、T3或T7。或者,可通过本领域已知的方法在体外合成所述RNA分子。此外,本领域已知可对RNA核糖核苷骨架进行化学修饰以使得嵌合RNA分子更加稳定。
以上已经根据所提供的方法描述了嵌合基因或RNA分子用于改变纤维素生物合成的不同实施方式并可根据实际情况对这些实施方式进行必要的修改。
可将嵌合基因或RNA稳定地或瞬时地提供给植物细胞。典型地,可通过将嵌合基因整合入植物细胞的基因组而稳定地提供嵌合基因或RNA分子。将嵌合基因导入植物的方法是本领域已知的,并包括土壤杆菌介导的转化、微粒枪输送、微注射、对完好的细胞进行电穿孔、聚乙二醇介导的原生质体转化、原生质体电穿孔、脂质体介导的转化、硅晶须介导的转化等等。以这些方式获得的转化的细胞可再生为成熟的能够繁殖的植物。
在另一个实施方式中,本发明的嵌合基因或嵌合RNA分子可提供在一种DNA或RNA分子,所述DNA或RNA分子能够在植物细胞中自主复制,例如病毒载体。也可将本发明的嵌合基因或RNA分子瞬时地提供给植物的细胞。
本发明的目的还在于提供含有本发明的嵌合基因或RNA分子的植物细胞和植物。通过常规育种方法产生的那些包含本发明的嵌合基因的植物的配子、种子、胚芽、合子或体细胞、后代或杂合体,也属于本发明的范围内。
本发明的方法和手段特别适合用于棉属植物(陆地棉和海岛棉均可),特别适于Coker 312、Coker310、Coker 5Acala SJ-5、GSC25110、FiberMax819、FiberMax832、FiberMax966、FiberMax958、FiberMax989、FiberMax5024(和具有除草剂或害虫抗性性状的FiberMax转基因变种)Siokra 1-3、T25、GSA75、Acala SJ2、AcalaSJ4、Acala SJ5、Acala SJ-C1、Acala B1644、Acala B1654-26、AcalaB1654-43、Acala B3991、Acala GC356、Acala GC510、Acala GAM1、Acala C1、Acala Royale、Acala Maxxa、Acala Prema、Acala B638、Acala B1810、Acala B2724、Acala B4894、Acala B5002、非 Acala“picker”Siokra、“stripper”变种FC2017、Coker 315、STONEVILLE506、STONEVILLE 825、DP50、DP61、DP90、DP77、DES119、McN235、HBX87、HBX191、HBX107、FC 3027、CHEMBRED A1、CHEMBRED A2、CHEMBRED A3、CHEMBRED A4、CHEMBREDB1、CHEMBRED B2、CHEMBRED B3、CHEMBRED C1、CHEMBRED C2、CHEMBRED C3、CHEMBRED C4、PAYMASTER145、HS26、HS46、SICALA、PIMA S6和ORO BLANCO PIMA。FiberMax是Australia of Cotton Seed Distributors Pty Ltd.的注册商标。
不过,这些方法和手段也可用于其他植物品种,例如大麻、黄麻、亚麻和木本植物,包括但不限于松(Pinus spp.)、杨(Populus spp.)、杉(Picea spp)和桉,等等。
在另一个实施方式中,提供了一种用于在一种特定植物品种(优选地为一种产纤维植物品种)的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法,所述等位基因变异单独地或者组合地与纤维素生产的数量和/品质以及纤维生产有关联。所述方法包括以下步骤a)提供包含不同等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列的特定植物品种或杂种繁殖植物品种的不同变种或基因型的群体。可采用本申请其他部分所述的方法来鉴别所述不同等位基因形式。优选地提供一种分异群体(segregatingpopulation),其中存在编码参与纤维素生物合成的蛋白质的基因的不同组合的等位基因变异。用于产生分异群体的方法是植物育种领域所熟知的。
b)确定所述群体中每一个个体的与纤维生产和/或纤维素生物合成有关的参数;c)确定所述群体中每一个个体是否存在一种特定等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列;以及d)将出现特定的纤维或纤维素参数与是否存在一种特定等位基因形式的所述核苷酸序列或此类等位基因形式的一种特定组合相关联。
根据得到的信息可筛选那些对纤维素生物合成或纤维生产具有所需影响的等位基因。根据得到的信息,可通过使用常规的分子生物学技术来确定是否存在等位基因的形式,由此加快育种程序以分离或产生具有特定纤维或纤维素特征的变种或加快回交程序。本领域已知用于确定多倍体植物的等位基因形式的方法,包括例如Denaturing High-Performance Liquid Chromatography(DHPLC;Underhill等,1997Genome Research 7996-1005)。显然,在育种或回交程序中,不仅等位基因本身的序列可用于确定其存在与否,也可使用那些与所需等位基因邻近的核苷酸序列,优选地与其直接邻近的并且是连续的核苷酸序列,这些序列只能在有丝分裂过程中通过重组在有丝分裂过程中以低频率自所述等位基因中分离。
在此,“杂种繁殖植物品种”是一种品种,其能够与产纤维植物例如棉属植物杂交(包括使用杂交等技术)并能够产生子代植物。杂种繁殖植物品种可包括所述产纤维植物的野生亲缘植物。通常,对于棉属植物,指的是在海岛棉与陆地棉(G.hirsitum)之间进行杂交的杂种繁殖和在两株海岛棉或两株陆地棉(G.hirsitum)亲代之间进行杂交的种内杂交。
以下非限制性实例描述了用于在产纤维植物中调节纤维素生物合成的方法和手段。除非在实施例中另有说明,所有重组DNA技术均按照以下出版物所述的标准技术进行Sambrook等,(1989)MolecularCloningA Laboratory Manual,Second Edition,Cold Spring HarborLaboratory Press,NY和Ausubel等,(1994)Current Protocols in MolecularBiology,Current Protocols,USA(Volumes 1和2)。用于植物分子研究的标准材料和方法见R.D.D.Croy的Plant Molecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications,UK联合出版。其他标准分子生物学技术的参考书包括Sambrook和Russell(2001)Molecular CloningA Laboratory Manual,ThirdEdition,Cold Spring Harbor Laboratory Press,NY,Volumes I and II ofBrown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)。用于聚合酶链反应的标准材料和方法可参见Dieffenbach和Dveksler(1995)PCR PrimerA Laboratory Manual,Cold Spring HarborLaboratory Press,以及McPherson等,(2000)PCR-BasicsFromBackground to Bench,First Edition,Springer Verlag,Germany。
在整个说明书和实施例中,引用了以下序列SEQ ID No.1鼠耳芥属核苷酸序列rsw2(基因组;保藏号At5g4970)SEQ ID No.2棉属植物核苷酸序列rsw2(cDNA)SEQ ID No.3鼠耳芥属核苷酸序列rsw3(基因组)SEQ ID No.4棉属植物核苷酸序列rsw3(相应于3′端;cDNA)SEQ ID No.5鼠耳芥属氨基酸序列rsw2SEQ ID No.6棉属植物氨基酸序列rsw2SEQ ID No.7鼠耳芥属氨基酸序列rsw3SEQ ID No.8棉属植物氨基酸序列rsw3(部分)SEQ ID No.9鼠耳芥属核苷酸序列rsw2(cDNA)SEQ ID No.10寡核苷酸PCR引物(正向rsw2棉属植物)SEQ ID No.11寡核苷酸PCR引物(反向rsw2棉属植物)SEQ ID No.12寡核苷酸PCR引物(正向LFY3)SEQ ID No.13寡核苷酸PCR引物(反向LFY3)SEQ ID No.14寡核苷酸PCR引物(正向MBK5/α)SEQ ID No.15寡核苷酸PCR引物(反向MBK5/α)SEQ ID No.16寡核苷酸PCR引物(在葡糖苷酶IIα正向)SEQ ID No.17寡核苷酸PCR引物(在葡糖苷酶IIα反向)10SEQ ID No.18寡核苷酸PCR引物(在葡糖苷酶IIβ正向)SEQ ID No.19寡核苷酸PCR引物(在葡糖苷酶IIβ反向)SEQ ID No.20寡核苷酸PCR引物(分离的基因组拷贝RSW3的正向引物)SEQ ID No.21寡核苷酸PCR引物(分离的基因组拷贝RSW3的反向引物)
SEQ ID No.22寡核苷酸PCR引物(正向RWS3同源物棉属植物)SEQ ID No.23寡核苷酸PCR引物(反向RSW3同源物棉属植物)。
实施例实施例1.分离GhKOR基因(与鼠耳芥属的rsw2突变相应的棉属植物基因)的全长cDNANCBI EST数据库中有7个来自Gossypium arboreum 7-10dpa(花期后天数(days post anthesis))纤维文库的EST,其均与AtKOR1的序列具有相似性。上述7个EST中的5个序列是相同的。将三种不同的棉属植物EST与AtKOR1 cDNA进行比对发现,棉属植物克隆AW726657含有ATG起始密码子和47bp的5’非翻译区。克隆BE052640跨越了KOR基因的中部区域并与克隆AW668085重叠,AW668085在与AtKOR1相同的位置上含有TGA终止密码子并含有126bp的3’非翻译序列。ORF的翻译显示出与AtKOR1蛋白的区域具有>80%的氨基酸序列相同性。使用了针对G.arboreum EST的5’和3’非翻译区而设计的引物,自来自陆地棉栽培品种Siokra 1-4的18dpa纤维cDNA文库,扩增一1.9kb PCR产物。正向引物是5’-CCGCTCGAGCGGGCATTTTCCGCCCACTA-3’(SEQ ID No.10),且反向引物是5’-CGGGATCCCGTCACACATGGACAGAAGAA-3’(SEQ ID No.11)。通过对来自陆地棉的18dpa纤维的棉属植物cDNA文库进行PCR而产生棉属植物KOR基因的全长cDNA,并对若干个扩增的产物进行测序(SEQ ID No.2)。encoded a protein该cDNA编码一种具有619个氨基酸(SEQ ID No.6)的蛋白质(GhKOR),其与LeCel3(86%氨基酸相同性)、AtKOR1(82%氨基酸相同性)和BnCel16(82%相同性)高度相似(图1)。所有蛋白质共同具有参与将AtKOR1导向细胞板的极化导向基序(Zuo等,2000);靠近N端的推定的跨膜区域;作为与糖苷水解酶家族9具有强相似性部分的4个可能参与催化作用的保守残基(Asp-198、Asp-201、His-516和E-555;Nicol等,1998);富Pro的且具有内-1,4-β-D-葡聚糖酶家族的膜结合成员的特征的C端区域;位于N端结构域的8个推定的N-糖基化位点(Asn-X-Ser/Thr),推测其在糖基化过程中位于ER内腔(仅存在于GhKOR的一个额外的位点(14-16位残基)可能朝向细胞浆)。
实施例2.以GhKOR互补鼠耳芥属rsw2-1变体按照以下方式将编码GhKOR的棉属植物PCR产物克隆到CaMV35S启动子之后正向引物插入XhoI位点(下划线标出),反向引物插入BamHI位点(下划线标出),使得扩增的1.9kb片段连接于载体pART7的合适位点(Gleave,1992)。这将cDNA以有义方向置于花椰菜花叶病毒(cauliflower mosaic virus)35S启动子之后。通过以NotI消化将完整的表达盒分离并克隆入双载体pART27的相应位点。对扩增产物进行测序以确认其相同性。将这一构建体导入根癌突然杆菌(Agrobacteriumtumefaciens)菌株AGL1并用于通过植物浸渍法(floral dipping)转化rsw2-1突变体和野生型Columbia(Clough和Bent,1998)。
在含有卡那霉素(50μg ml-1)和替卡西林钠/克拉维酸钾(100μg ml-1)的Hoagland培养皿上选择卡那霉素抗性转化体,转移至不含选择物的垂直Hoagland培养皿,在29℃放置2天后筛选根膨胀的转化体。自10株显示野生型表型的单独的T1植株收集T2种子并在T2代检验互补表型的遗传性。对在29℃暴露2天的卡那霉素抗性纯合子T3幼苗的根进行拍照。其他植物在21℃生长于罐中直至开始抽苔,切下抽苔,然后转移至29℃并再生次生抽苔,成熟后拍照。rsw2-1与Columbia在At5g49720具有一个单一核苷酸的改变,其在AtKOR1中将Gly-429取代为Arg,并产生了一种易受温度影响的表型(Baskin等,1992;Lane等,2001)。植物或生长于罐中(泥炭∶堆肥∶沙子的1∶1∶1混合)或无菌生长于培养皿中(MS或Hoagland的培养基加上琼脂)(Bum等,2002a)。除非特别说明,否则生长箱提供100μmol m-2s-1的连续光照,21℃。rsw2突变体的根显示出易受温度影响的径向膨胀(Baskin等,1992),而茎显示出对延长所产生的易受温度影响的抑制(Lane等,2001)。
75株卡那霉素抗性T1幼苗中的63株的根在29℃两天后没有出现膨胀。野生型表型稳定地异常给T3代,并且根(图2A)和茎(图2B)在限制性温度条件下正常延长。卡那霉素抗性纯合子T3植株的茎生长在数量上与野生型没有区别。因此鉴别了一种编码AtKOR1的棉属植物同源物的基因,且发现其能够在rsw2-1纤维素合成突变体中在功能上替代鼠耳芥属基因。
这将涉及在鼠耳芥属中纠正减数分裂和细胞延伸的缺陷的GhKOR(Nicol等,1998;Zuo等,2000;Lane等,2001;Sato等,2001)以及与纤维素合成机制的其他元件和/或产物的适当相互作用。以前的研究鉴别了一种棉纤维蛋白质,其在免疫学上与LeCel3相关(Peng等,2001),而间接证据提示其参与棉属植物纤维膜在体外合成纤维素(Peng等,2002)。与LeCel3、BnCel16和AtKOR1的相似性包括所有已知的具有重要功能的主要特征以及那些目前尚不清楚其功能的特征,例如富Pro C端。内-1,4-β-D-葡聚糖酶在纤维素合成中的作用尚不清楚,不过可能涉及自脂质结合的引物或供体切断尚未结晶的葡聚糖(Williamson等,2001;Peng等,2002)。
实施例3鉴定并分离鼠耳芥的rsw3突变体中发生突变的基因rsw3等位基因是一种基于图谱策略而鉴定的单一孟德尔隐性基因座(Baskin等,1992)。rsw3与可见标记物品系W9杂交产生的F2子代将RSW3与第5号染色体短臂上的yi相连锁。对rsw3(Columbia背景)与Landsberg erecta ecotype杂交产生的F2群体进行筛选以产生具有根膨胀表型的植物。使用FastDNA试剂盒(BIO 101,Carlsbad,CA)自每株植物的2-3个莲座叶制备DNA,并使用LFY3(正向引物5’-GACGGCGTCTAGAAGATTC-3’(SEQ ID No.12),反向5’-TAACTTATCGGGCTTCTGC-3’;SEQ ID No.13;以RsaI裂解)和MBK5/α(正向5‘-CCCTCGCTTGGTACAAGGTAT-3’(SEQ ID No.14)和反向5’-TCCTGATCCTCTCACCACGTA-3’(SEQ ID No.15)绘制图谱。使用来自Landsberg erecta ecotype的杂交种的F2,将RSW3绘制于距离LFY3基因座的6cM处(4out of 70条染色体中有4条显示出杂交事件),因此将RSW3定位于yi和LFY3之间。对另外372条染色体的分析鉴定了MBK5/α和rsw3之间的一个重组事件,概念性图谱距离为0.27cM。在rsw3中对该区域中的若干该候选基因进行测序。P1克隆mgi19(AB007646)上的一个基因(At5g63840),编码一种葡糖苷酶II的推定的催化亚基,而rsw3等位基因显示具有一个T到C的取代,根据推定,其造成蛋白质中的Ser599被取代为Phe(野生型RSW3基因的核苷酸序列如SEQ ID No.3所示,所编码的蛋白质的氨基酸序列如SEQ ID No.7所示)。
RSW3序列与糖苷水解酶家族31(Henrissat,1991;Henrissat andBairoch,1993)的序列从大约150位残基起具有很高的相似性。Monroe等通过针对与α-葡糖苷酶的相似性对鼠耳芥属EST进行搜索鉴定了RSW3葡糖苷酶II基因,并将其命名为Aglu-3(Monroe等,1999)。其蛋白产物形成若干葡糖苷酶II的进化枝,这些葡糖苷酶II的催化活性均分别是已知的。它们均与鼠耳芥属的质外体α-糖苷酶分开,而Aglu-3/RSW3与之仅具有8%的序列相同性。图4显示了含有Aglu3/RSW3的进化枝的两种特征基序,其被认为包括催化残基和底物结合残基。Aglu3/RSW3含有这些基序中的所有保守残基,以及被认为是催化残基的Asp512和Asp617(Frandsen和Svensson,1998)。Ser599在rsw3中是突变的,其可能在功能上是重要的,因为其在来自小鼠(NP 032086)、人类(NP 055425)、猪(AAB49757)、粘液菌(AAB18921)、马铃薯(P07391)和棉属植物(见下)的同源基因产物中均是保守的,而且在相关性更加遥远的由鼠耳芥属基因Aglu-1和Aglu-2(Monroe等,1999)编码的质外体α-葡糖苷酶中也是保守的。鼠耳芥属Aglu-3/RSW3基因似乎是单拷贝的,其跨越3.84kb,具有5个内含子,并编码一种推定的2766bp转录产物,推定的翻译产物为104kDa。
最近的生物化学(Trombetta等,1996)和遗传学研究(D’Alessio等,1999;Pelletier等,2000)提示,天然的哺乳动物和酵母的葡糖苷酶II由一种催化性α-链(Aglu-3/RSW3与之同源)和一种较小的非催化性β-链组成,其在ER中保持异二聚体形式。为了确定鼠耳芥属是否含有β-亚基的直向同源物,以小鼠β-亚基进行对NCBI数据库进行BLAST搜索。未知蛋白At5g56360(来自染色体5的P1克隆MCD7(AB009049)上的蛋白质MCD7.9)与小鼠β-亚基具有27%的氨基酸相同性和42%的相似性。水稻染色体1存在一种密切相关的序列(Genbank BAA88186),但其中的终止密码子使其在496位残基后截断。理论上对PAC克隆P0038F12(AP000836)的邻近3’序列进行翻译并考虑到推测的剪切位点,提示其可能编码一种全长的β-亚基,后者与鼠耳芥属基因产物非常相似。该基因产物的推测的序列可得到与推测的外显子相匹配的一种EST(AU030896)的支持。因此图5包括我们对该全长水稻蛋白质的建议。鼠耳芥属、水稻、小鼠和Schizosaccharomyces pombe序列共同具有C端的HDEL ER-保留信号;其N端的推定的前导序列;富半胱氨酸的N端区域;C端位于HDEL序列前方的MHR(甘露糖受体同源区域)(Munro,2001);预期可能形成螺旋卷曲的序列富含酸性残基且两侧具有在程序(“螺旋”和“Paircoil”)中得到高分的区域的中心区域(Berger等,1995;Lupas等,1991)。
Munro(2001)将MRH结构域与碳水化合物识别联系起来。其包含一种与阳离子依赖性甘露糖-6-磷酸受体具有相似性的区域,所述受体的结晶结构是已知的。至关重要的保守部分(图5)包括形成3个二硫键(不过S.pombe蛋白质缺乏半胱氨酸1和2)的6个Cys残基、半胱氨酸5和6之间的底物识别环以及参与配体结合的Y和R残基(Roberts等,1998)。小鼠α和β亚基之间的相互作用被绘制于β-亚基N端第118位残基(其在所有序列中均相当保守)至273-400位残基(其不具有保守性)(Arendt和Ostergaard,2000)。不过,图5显示所有序列均具有高百分比的酸性氨基酸。
如下所述采用RT-PCR分析编码α-和β-亚基的基因的表达。按照生产商的说明,以RQ1无Rnase的Dnase(Promega,Madison,WI)处理RNA(Parcy等,1994)。针对鼠耳芥属葡糖苷酶II的α-和β-亚基编码区域的3’末端设计PCR引物α-正向5’-CGTAGTGGTCTACTGGTTCAA-3’(SEQ ID No.16),α-反向5’-TGAGCTGTGTCCCAAGAGGAT-3’(SEQ ID No.17),β-正向5’-GGTGATGAGGATACCAGCGAT-3’(SEQ ID No.18),β-反向5’-CCCACTCCCTAACCGGAGTTT-3’(SEQ ID No.19)。
每一种引物跨越一个内含子,如此可将RT-PCR产物与基因组DNA和mRNA区别开(对于α-亚基为724bp对452bp,对于β-亚基为996对474)。按照生产商的说明,使用Gibco BRL Superscript一步法RT-PCR试剂盒进行RT-PCR,RT-PCR循环为48℃-45分钟,94℃ 2分钟,(94℃/30秒,54℃/1分钟,68℃/2分钟)×45次,72℃/7分钟。
RT-PCR在所有测试的鼠耳芥属组织中检测到编码α-和β-亚基的基因的表达(图6),但是,在所采用的条件下,无法明确说明相对表达水平。鼠耳芥属的低数目的EST(α-亚基13个,β-亚基4个)说明两种均非高表达(作为对照,在相似的搜索中,一种参与纤维素合成的糖基转移酶AtCesA1/RSW1检测到40个EST)。
实施例4通过鼠耳芥属基因的基因组拷贝互补rsw3突变通过PCR扩增BAC F20A11产生了包括830bp的启动子区域的基因组拷贝的葡糖苷酶II的α-亚基,使用了正向引物5’-CCGCTCGAGCGGTTTCACTCACAACTGTGGTCTCT-3’(SEQ ID No.20)和反向引物5’-CCGCTCGAGCGGTCTCCTAAGTCCTAACCCCATA-3’(SEQ ID No.21)。两种引物均包括XhoI位点(下划线标出),其能够使得扩增的5.8kb片段连接至双载体pBin19中的SalI位点。扩增产物具有不同于基因组序列的单碱基对改变(C至T)。这造成以Leu替代Ser 142(该残基在马铃薯中是保守的,但在其他物种则不是)(图4),但并不削弱该片段互补rsw3的能力。将该构建体导入根癌土壤杆菌菌株AGL1并用于通过植物浸渍法转化rsw3突变体(Clough和Bent,1998)。在21℃在含有卡那霉素(50μg ml-1)和替卡西林钠/克拉维酸钾(100μg ml-1)的Hoaglands培养皿中选择卡那霉素抗性转化体。将幼苗转移至垂直Hoagland培养皿并在30℃放置2天以筛选根部膨胀。当在21℃生长5天且随后在30℃生长2天后,卡那霉素抗性T1子代显示出野生型的根(图3a)。花序表型(见后)也被互补。
rsw3与标记的突变体SGT5691(Parinov等,1999)之间的杂交种提供了另一个证据,突变体SGT5691在编码推定的糖苷酶II的基因的第一个启动子中含有Ds元件。其大概代表一种无效等位基因,且该突变具有纯合子致死性,因此采用看起来为野生型的半合子植物进行杂交。Ds元件中的NPTII基因将卡那霉素抗性赋予接受来自SGT5691的标记等位基因的F1植物。所有卡那霉素抗性F1幼苗(含有无效等位基因和对温度敏感的等位基因)的根在21℃看起来为野生型,但在30℃发生膨胀(图3b)。这证实Ds插入突变体与EMS产生的突变体rsw3是等位基因,且葡糖苷酶II缺陷引起径向膨胀。
实施例5对鼠耳芥属中与rsw3突变相关的其他表型的研究rsw3在容许温度21℃象野生型一样生长,当转移至30℃时幼苗根部膨胀。根部膨出的细胞(Baskin等,1992)通常位于根须的基部,提示RSW3在根须发育的早期阶段具有作用。仅当在48小时之内将膨胀的初生根放回容许温度时其才能重新开始延长,但根可继续产生侧根(图7a)。这些侧根的原基在转移至31℃时是不可见的,侧根先延长数毫米,随之膨胀并停止生长。因此,成熟的生长性植株的根系短小而呈高度分支状(图7b)。双重纤维素缺陷突变体rsw1-rsw3处于限制性温度24小时仅出现根尖膨胀,但由于处于这种高温条件下任何更长的时间均导致死亡,因此在限制性温度条件下24小时后膨胀过程可能已经减弱。
对于在黑暗中生长的胚轴的表型,rsw3的表型明显若于rsw1-1和rsw2-1,而rsw1-1rsw3的表型若于rsw1-1rsw2-1(图7c)。rsw3在光亮处的花结生长被强烈抑制,且许多细小的叶片堆积成密集的垫状,其中无法识别规则的叶序(图7d-f)。野生型叶片的复杂铺路石细胞形状(图7g)在rsw3中变得简单,气孔自叶片表面突出,且一些毛状体似乎要破裂(图5h)。一些拥挤的花结开始出现细小的花序(图7d),不过它们出现得明显迟于野生型花序(对于生长于琼脂中的植物来说为28.6士0.5天对15.5+0.17天;平均值+SE,n=98(rsw3),n=45(野生型))。细小的rsw3花序上的少数花朵是基本上完全长大的,不过花药丝、雌蕊和萼片轻度缩短,而芽在柱头受精之前提早开放(与下文中讨论的图8e、f所示的来自土壤中生长的rsw3植株的芽相似)。
为了研究突变对茎生长的直接作用,将野生型和rsw3在21℃生长于土壤中,这样随后花序的发育将不会受限于仅提供很少光合作用产物的小花结。在这样的条件下,rsw3的花结与野生型十分相似,而再生性生长按照正常时间开始。
切下初生抽苔并在21℃或30℃再生次生抽苔(图6a,b)。rsw3和rsw1-1在21℃的再生遵循略微呈S形的曲线,相对于野生型来说在生长速度和最终高度上没有统计学显著意义的降低。Rsw1-1rsw3的速度和最终高度显示出明显的下降。不过,在30℃,rsw3在少数几天中的生长速度与野生型相似,但其在大约第5天停止延长,而野生型则继续延长到第16天,rsw1-1甚至更长(图8b)。rsw1-1rsw2(Lane等,2001)在30℃没有再生出次生抽苔,而rsw1-1rsw3仅生长大约35mm(图8b),产生极少的花且没有产生种子。
我们每天测量了茎生长的增量以及外层细胞的长度,外层细胞在抽苔生长至大约一半时已经离开延长区(表1)。这样可以估计那时的细胞流(cell flux)(每天离开延长区的细胞数),因为每天的生长增量=细胞长度x细胞流。生长于21℃的rsw3的细胞流或细胞长度没有明显降低。rsw1-1rsw3在21℃的组成型表型完全归因于细胞长度的降低。在30℃,相对于野生型来说,rsw1-1的细胞长度降低57%,而细胞流降低35%。
此类分析要求植物的生长速度、延长区的长度等等均处于近乎稳定的状态。不过,当rsw3和rsw1-1rsw3的延长迅速减慢的时候条件远远达不到稳定状态,因此无法准确推算出这些表型的细胞流。为了至少对在生长减慢的情况下细胞长度是如何改变有一些了解,我们在rsw3茎的大约80mm高度处测量了细胞长度(图8b显示,当这些细胞离开延长区时,茎应该是接近其生长期的终点,这是因为根据那时生长区的长度,那时总的植物高度应该已经超过80mm;野生型为40mm,根据Fukaki等,1996)。即便如此,rsw3的细胞也仅仅略微短于野生型(表1),提示对于茎延长减慢来说,细胞产生速度的下降可能比细胞体积增加的降低更加重要。相反,当茎的延长正在减慢时,我们对30mm的rsw1-1rsw3茎进行取样用于细胞成熟(图8b),细胞的长度降低了57%(表1)。这与双突变体中存在rsw1-1使得平衡明显向细胞长度降低倾斜是一致的。
在一个更加简单的系统中验证了有关细胞分裂和细胞体积增加的结论,该系统使用冷扫描电子显微镜来检测受精的柱头的花中的雄蕊花丝(表2)。结果是相似的rsw3植物同样显示出细胞数量减少较细胞长度降低的比例更高,并且双突变体rsw1-1rsw3显示出细胞长度进一步下降但细胞数量没有额外降低。Rsw1-1显示出细胞长度较细胞数量降低更明显(表2)。在30℃进行再生的野生型和rsw3的茎在第一朵花开花前均达到大约相同的高度,即使它们的最终高度可能差别很大(图8b)。野生型茎在延长停止前产生大约27朵具有良好间隔的花,但rsw3在延长停止前仅产生大约6朵间隔紧密的花,留下一个花簇(图8c,d)。rsw3花芽在柱头受精之前即提早开花(图8e,f)。
在持续生长于其限制性温度的rsw3植物的细小的抽苔形成很少的花且没有形成种子(图7d)。对于那些在21℃具有完全生长力的植物,既便是在31℃形成的大得多的抽苔上的花(图8d,f)也仅仅拮出极少的种子。这种种子(图8g,h)是皱缩的(可能是由于种子贮存蛋白质积聚量降低所致;Boisson等,2001),其表面缺乏生长于30℃的野生型或生长于21℃的rsw3所具有的规则的细胞结构,并且其在吸涨后仅有极少的分泌黏液(图8i-n)。黏液分泌减少在纤维素缺陷体突变体是不常见的rsw1-1(CesA1糖基转移酶缺陷;图8k,l)和rsw2-1(KOR内-1,4β-葡聚糖酶缺陷)具有正常的黏液层。
为了将在单倍体阶段对花粉和胚珠发育的影响与在二倍体阶段的影响分开,我们检测了半合子Ds突变体SGT5691(一种推定的葡糖苷酶II催化亚基的无效等位基因)中的结籽(seed set)。通过自身传粉,结籽分异为147个卡那霉素抗性个体和153个敏感个体。显性纯合子致死性等位基因的比例低于预期的2∶1,说明无效等位基因影响的是花粉和/或胚珠的有丝分裂后发育。通过在半合子标记突变体与Landsberg erecta(该突变体的适当的野生型)之间进行交互杂交,我们区分了对雄性和雌性途径的影响。如果花粉或胚珠的发育不受影响,则卡那霉素抗性和敏感性植株将按照1∶1分异,如果无效等位基因降低花粉或胚珠的繁殖力,则比例会降低。来自Ds标记突变体的花粉产生的分异比例为1∶16(6个抗性个体,94个敏感性个体),提示Ds标记花粉产生有活力的种子的能力下降了94%(相对于野生型)。这与当Ds标记胚珠与野生型花粉杂交时的41%的降低程度(比例为1∶1.7,37∶63个体)相当。因此,葡糖苷酶II的无效等位基因对花粉发育单倍体阶段的影响比其对有丝分裂后胚珠的影响要严重得多。
生长于31℃的rsw3的7天幼苗的根仅含有野生型纤维素的51%(表示为每毫克组织干重),该数字与CesA1糖基转移酶(rsw1-1)和KOR内-1,4-β-葡聚糖酶(rsw2-1)中的单个氨基酸取代(Peng等,2000)产生的结果相当。形态学改变提示所有三种基因对于在初生细胞壁中产生纤维素均是必需的。
rsw3幼苗中来源于高尔基体的非纤维素多糖的产生基本没有改变(Peng等,2000)。对纤维素产生的选择性与在葡糖苷酶I缺陷(Gillmor等,2002)中所见的情况相当,葡糖苷酶I产生用于葡糖苷酶II加工的最初底物。其超出了在鼠耳芥属的胚芽致死性cyt1突变体(甘露糖-1-磷酸guanylyltransferase缺陷)(Lukowitz等,2001)和通过反义下调MALl(编码葡糖苷酶IIα-亚基)的马铃薯(Taylor等,2000a)中所见的选择性,其中非纤维素多糖和木质素出现复杂的改变。因此,我们认为,与高尔基体中的非纤维素多糖的合成相比,纤维素合成对N-聚糖加工缺陷的敏感性要高得多。
rsw3中的来源于高尔基体的种子黏液的分泌明显减少,但rsw1-1或rsw2-1则没有明显减少。黏液能够产生,但保留在细胞内(可能是因为纤维素缺陷引起的结构改变),或者黏液产生本身可能是减少的。许多发育阻滞减少黏液的产生(Western等,2001;Western等,2000),不过我们还不能排除这样一种可能性,即rsw3具有产生组成黏液的特定非纤维素多糖所需的高尔基体酶的缺陷型加工。
雄蕊花丝中的细胞数量和体积提示,rsw3对细胞分离的影响强于对细胞体积增加的影响。茎的细胞长度数据与这一发现相符和。rsw3对细胞分裂的显著影响可以解释为何其表型在黑暗中生长的缺少细胞分裂的胚轴中相当弱(Gendreau等,1997)。由于对细胞分裂的影响明显强于对细胞体积增加的影响,rsw3更加类似于rsw2-1(Bum等,2002)而不是rsw1-1(Burn等,2002)或携带针对RSW1/CesA1或CesA3的反义构建体的植物(Bum等,2002),后者对细胞长度的影响更加严重(尽管CesA1的改变对分裂速度没有什么影响,但CesA1可能在分裂的根细胞中表达,因为当rsw1-1处于其限制性温度时,细胞的细胞壁超微结构有改变(Sugimoto等,2001)并膨胀(Baskin等,1992;Beemster和Baskin,1998))。
尽管rsw3中的纤维素生物合成被削弱,但rsw3影响纤维素合成的机制还不清楚。正如在葡糖苷酶I突变(Boisson等,2001)中所注意到的,无法在高尔基体中组装成熟N-联聚糖的突变体显示出最低程度的表型(von Schaewen等,1993),这说明关键蛋白质缺少成熟N-联聚糖并不会引起明显的糖苷酶II缺陷时所见的表型。Glc1Man9GlcNAc2和Man9GlcNAc2产生速度的降低可能会同时减慢糖蛋白/分子伴侣复合体的形成和解离,于是产生一个瓶颈,可降低分泌途径上其他位点的糖蛋白的稳态水平。由于糖蛋白参与多种植物过程,因此还不清楚为何与例如非纤维素多糖合成相比,纤维素合成对ER中的加工缺陷要敏感得多。
当Gillmor等(2002)没有检测到knopf(葡糖苷酶I缺陷)发生SDS-PAGE迁移改变或改变N-糖苷酶F处理时,且当他们没有在knopf中观察到采用非定量免疫染色可观察到的CesA丰度的改变时,他们认为CesA蛋白不发生糖基化。KOR内-1,4-β-葡聚糖酶是一种更好的候选物。当在巴斯德毕赤氏酵母(pichia pastoris)中异源性表达时,KOR的欧洲油菜直向同源物的一种可溶性片段发生大量N-糖基化,且这种N-聚糖对于其体外活性是必需的(Molhoi等,2001)。rsw3和rsw2-1表型对细胞分裂的影响比对细胞体积增加的影响更大,而rsw1-1表型正好与此相反,这进一步提供了证据,支持KOR是一种靶向。
rsw1-1和rsw2-1突变影响了编码那些可能直接参与纤维素合成的质膜酶的基因,而在限制性温度条件下酶性能的改变将迅速影响纤维素合成。相反,rsw3编码一种ER内的加工酶,仅当其限制了对纤维素合成的位点的正确折叠的糖蛋白的供应时,其性能的改变才会降低纤维素合成。当将这三种突变体转移至较高温度时,会在不同的时间出现可见的表型,这似乎反映了它们不同的作用模式。径向膨胀在rsw3出现较晚(潜伏期>24h,而rsw1-1和rsw2-1<12h),而在最初的12小时内高温实际上加速了根的延长,尽管不及野生型(Baskin等,1992)。与此不同,rsw1-1或rsw2-1在最初12小时即减慢,根部明显膨胀,且rsw1-1在4小时内即出现细胞壁超微结构的改变(Sugimoto等,2001)。
已经发现,rsw3的编码推定的糖苷酶IIα-亚基的基因是突变的,已经鉴定了由两种植物基因组编码的推定的β-亚基,并发现rsw3表型的许多方面是初生细胞壁中纤维素合成降低的结果。对细胞分裂的影响似乎比对细胞体积增加的影响更大,这说明KOR内-1,4-β-葡聚糖酶(其突变同样明显影响细胞分裂)可能是受到加工缺陷影响的糖蛋白。除了在纤维素合成中的作用,葡糖苷酶II的温度敏感型等位基因也有助于对ER中的N-糖基化和质量控制的研究,并有助于确立其与其他发育和生理学过程之间的联系。
实施例6自棉属植物中分离相应于RSW3的(部分)cDNA使用序列RSW3搜索dbEST鉴定到一种Gossypium aboreumcDNA,具有833bp的高质量序列。使用自EST设计的引物自陆地棉cDNA的18dpa纤维文库来扩增一种700bp产物,使用了如下引物Cot-rsw3f 5′-CGGGATGAAGAGGATGTAGAG 3′(SEQ ID No.22)Cot-rsq3r 5′-GAACCCCTGAGATGATCCCAA 3′(SEQ ID No.23)将PCR产物用作探针以鉴定更长的cDNA。鉴定到5种推定的克隆并对2种进行了测序。三种克隆有部分重叠,并组装了棉属植物RSW3同源物的cDNA序列(SEQ ID No.4)。编码N端的区域是缺失的。
实施例7在棉属植物中表达RSW2/RSW3嵌合基因将分离自鼠耳芥属或棉属植物的相应于RSW2或RSW3的cDNA可操纵地连接于启动子如苹果青霉素启动子和参与转录终止和聚腺苷酸化的3’-端区域。
其次,将选自分离自鼠耳芥属或棉属植物的RSW2或RSW3基因的大约100bp长的片段克隆入置于启动子例如CaMV 35S启动子控制下的反向重复序列。
将嵌合基因导入进一步含有选择标记基因的T-DNA载体,并将得到的T-DNA载体导入含有辅助Ti质粒的根癌土壤杆菌菌株。使用这些土壤杆菌菌株获得转基因棉属植物。
如WO 98/00549所述进一步分析表达不同转基因拷贝的植物的细胞壁成分,例如纤维素、非晶体β-1,4葡聚糖聚合体、淀粉和碳水化合物含量。
表1.根据细胞长度以及,如果出现接近稳定的生长速度时,根据细胞流(每天离开延长区的细胞数),来分析茎延长的速度。结果表示为平均值±SE,n=5。使用T-检验分析其与野生型之间差异的统计学显著性(*=p<0.05;**=p<0.01;***=5p<0.001)。

表2.生长于30℃的成熟雄蕊花丝中的细胞长度和数量。结果表示为平均值±SE,n>7。使用T-检验分析其与野生型之间差异的统计学显著性(*=p<0.05;**=p<0.01;***p=<0.001)。

参考文献Arioli et al..(1998)Science 279717-720.
Arendt et al.(2000)Glycobiology 10487-492.
Baskin et al..Aust.J.Plant Phys.19427-437.
Beemster et al.(1998)Plant Physiol,1161515-1526.
Berger et al.(1995)Proc.Nat Acad.Sci.USA 928259-8263.
Boisson et al.(2001)EMBO J.,201010-1019.
Brada et al.(1984)Eur.J.Biochem.,141149-156.
Brummell et al.Proc.Nat.Acad.Sci.USA 944794-4799.
Burn et al (2002a)Plant Physiol.129797-807.
Clough et al.(1998)Plant J.16735-743.
D’Alessio et al.(1999)J.Biol.Chem.,27425899-25905.
Desprez,et al.(2002)Plant Physiol.128482-490.
Fagard et al.(2000)Plant Cell 122409-2424.
Frandsen et al.(1998)Plant Mol.Biol.371-13Fukaki et al.(1996)Plant Physiol.110,933-943.
Gendreau et al.(1997)Plant Physiol.,114295-305.
Gillmor et al.(2002)J.Cell Biol.1561003-1013.
Gleave,A.P.(1992)Plant Mol.Biol.201203-1207.
Helenius et al.(2001)Science 2912364-2369.
Henrissat (1991)Biochem.J.280309-316Henrissat and Bairoch (1993)Biochem.J.293781-788.
Hino and Rothman (1985)Biochemistry 24800-805.
Kimura et a1.(1999)Plant Cell 112075-2085.
Lane et al.(2001)Plant Physiol.126278-288.
Lukowitz et al.(2001)Proc.Nat.Acad.Sci.USA 982262-2267.
Lupas et al.(2001)Plant Physiol.127674-684.
Mlhj et al.(2001)Plant Physiol.127674-684.
Monroe et al.(1999)Plant Physiol.119385-397.
Munro (2001)Curr.Biol.11R499-501.
Murashige and Skoog (1962)Phys.Plant 15473-497.
Nicol et al.(1998)EMBO J.175563-5576.
Pagant et al.(2002)Plant Cell 142001-2013.
Parcy et al.(1994)Plant Cell 61567-1582Parinov et al.(1999)Plant Cell 112263-2270.
Pelletier et al.(2000)Glycobiology 10815-827.
Peng et al.(2000)Planta 211406-414.
Peng et al.(2002)Science 295147-150.
Peng et al.(2001)PlantPhysiol.126981-992.
Roberts et al.(1998)Cell 93639-648.
Sato et al.(2001)Plant Cell Physiol 42251-263.
Scheible et al.(2001)Proc.Nat.Acad.Sci.USA 9810079-10084.
Silk et al.(1989)Plant Physiol.90708-713.
Sugimoto et al.(2001)Protoplasma 215172-183.
Taylor et al.(2000a)Plant J.24305-316Taylor et al.(2000)Plant Cell 122529-2539.
Taylor et al.(1999)Plant Cell 11769-780.
Treml et al.(2000)Glycobiology 10493-502.
Trombetta et al.(2001)Biochemistry 4010717-10722.
Trombetta et al.(1996)J.Biol.Chem.27127509-27516.
Vitale (2001)Plant Cell 131260-1262von Schaewen et al.(1993)Plant Physiol 1021109-1118.
Western et al.(2001)Plant Physiol 127998-1011.
Western et al.(2000)Plant Physiol 122345-355.
Williamson et al.(2001a)Protoplasma 215116-127.
Williamson et al.(2001)Cell.Molec.Life Sci.581475-1490.
Zuo et al.(2000)Plant Cell 121137-1152.
序列表<110>澳大利亚国立大学<120>调节产纤维植物中纤维素生物合成的方法和手段<130>501987/MRO<150>US 60/432,674<151>2002-12-12<160>23<170>PatentIn version 3.1<210>1<211>2303<212>DNA<213>Arabidopsis thaliana<220>
<221>misc_feature<222>(121)..(1986)<223>coding RSW2<400>1acatttcttc acttccacac acttttactt ctttctctct tctcttctct tctccagatc 60tgatcccaaa cctttgattc attgttgttg ttctctgctg ctttatcaga gagcatcatc 120atgtacggaa gagatccatg gggaggtcca ttggagataa acactgcaga ttccgccacc 180gacgatgatc gtagtcggaa tttaaacgat ttggatcgtg cggctctttc acgtccacta 240gatgagacgc agcagagttg gttacttggt ccaacggagc agaagaagaa gaagtacgtc 300gatctcggtt gtattatcgt tagccgcaag atcttcgtct ggactgttgg tactcttgtt 360gccgccgcgt tactcgccgg attcattacc ttgatcgtta aaactgtgcc gcgtcatcat 420cctaagactc cgccgccgga taattatact atagctctac acaaagctct taagttcttc 480aatgctcaga aatctgggaa attgccaaag cataataacg tgtcatggag aggtaattct 540gggcttcaag atgggaaagg tgaaacagga agcttctata aagatttggt gggaggttat 600tatgatgctg gtgatgctat caagttcaat ttccccatgg cttatgctat gactatgttg 660agctggagtg ttattgaata tagtgctaaa tacgaagctg ctggtgagct cactcatgtt 720aaggagctta tcaaatgggg aactgattac tttctcaaga ctttcaatag tactgctgat 780tccattgatg atcttgtgtc acaggttgga tcagggaata ctgatgatgg aaatacagat 840cctaatgacc attactgttg gatgcgacct gaggatatgg actataaaag gcccgtgact 900acttgtaatg gtggatgttc ggatctcgct gcagagatgg cagctgctct ggcttcagca 960tctattgtat tcaaggataa caaggaatat tctaaaaagc ttgtccatgg tgctaaggtg1020gtgtatcagt ttggaaggac gaggagaggg agatatagtg caggcactgc ggaatctagc1080aagttctata attcaagtat gtattgggat gagttcattt ggggtggtgc ttggatgtat1140tatgctaccg gaaatgtaac gtatctcaat ctaatcaccc aacctactat ggccaagcat1200gctggtgcct tctggggtgg cccttactat ggtgtattta gctgggacaa caagcttgct1260ggtgctcagt tgctgttgag ccggttgagg ttgtttctga gtcctggata tccatatgaa1320gaaattctaa ggaccttcca caatcagacc aqcatagtca tgtgctcata cttgcctatt1380ttcaacaaat ttaacagaac caatggaggt ttaatagagt tgaatcatgg agctccacag1440ccgctgcaat attctgtaaa tgcagctttc ttagcgactc tatacagtga ttatctggat1500gctgctgata ctcctggatg gtactgtgga cctaatttct attcgacaag tgtgctacgt1560gactttgcta gatcccagat tgattatata ctgggtaaaa accctcggaa aatgagttat1620gtcgttggtt ttggcacaaa atacccaaga catgtgcatc acagaggagc ttcgataccc1680aagaacaaag tcaagtataa ctgcaaagga ggatggaaat ggagagacag caagaaacca1740aacccaaaca cgattgaagg agccatggtt gctggtcctg acaagcgcga cgggtaccgt1800gatgtccgta tgaactacaa ctacactgaa ccgactcttg caggcaatgc tggtctagtc1860gcagctcttq tggcattatc gggtgaagaa gaagccaccg gtaagataga caaaaacact1920attttctcag ctgttcctcc tttgttccct actccaccac ctccaccagc accatggaaa1980ccttgagaaa gctagacttg tgtgattctg tcgctgctgc caaaaaaaat gaatgaggta2040agaaggattt gggtgtgaga ccagaagatt agaagctaaa cacaagtcag ccataaccaa2100actactaagg atttcatttg gctttactag atacaaacac ggggtgggtt actttaccac2160aagcattgtc tttcttttct ttttttgggt tgctgttttg ttcttgtgag atatcatata2220tatctatgcg ttttactctg tatatgtttg ataccaaact tgtattcttt gataaacaat2280ttaatgaact gtattaaact ttt2303
<210>2<211>2031<212>DNA<213>Artificial Sequence<220>
<223>cDNA RSW2 homologue from cotton<220>
<221>misc_feature<222>(47)..(1906)<223>coding region RSW2 homologue<400>2ggcacgagcc tgcattttcc gcccactact cttccaaatc ctcatcatgt acggcagaga 60tccgtgggga ggtcccctgg agataaacgc cactgattct gccactgacg acgacaggag 120caggaatctg caggacctgg atagggctgc actctctcgc cccttggacg agactcagca 180aagctggctg cttggccccg gggagcaaaa gaagaagaag aagtacgttg atctcggatg 240tatcattgtg agccgcaaga tctttgtatg gaccgtgggg accctgctag tctccgccct 300cctggccgga ctcatcaccc tcatcgtcaa gactgtccca cgtcatcacc accgccactc 360tccgcccgat aactacactc tggctcttca caaggcgctc atgttcttta atgctcagcg 420ttctqgaaag ctgcccaagc ataataatgt gtcgtggaga gggaactcgg gcctccaaga 480tggcaaatcc gatccctccg ttttgatgaa agatctggtc ggcggatatt acgatgctgg 540agatgctatc aagtttaact ttcctgcatc tttttcaatg actatgttga gctggagtgt 600catcgaatac agtgctaaat acgaggctgc cggcgagctc aatcatgtta aagagatcat 660caaatggggt actgattatc ttctgaagac cttcaacaat actqctgata ccattgacag 720gattgctgcg caggtaggga taggagatac atctggagga agttcagccc caaatgatca 780ttattgctgg atgcgccctg aggacattga ttacccccgt cctgtatatg aatgtcatag 840ttgctccgat cttgctgctg aaatggctgc tgctttggct tctgcttcca tcgttttcaa 900agacaacaaa gcatactctc aaaagcttgt ccatggtgcc cgaacactct ttatgtttgc 960tagggatcaa agaggcagat atagtgctgg tggttctgac cctgccctct tttataattc1020ctcaagttac tgggatgagt ttgtttgggg tggagcctgg ttatactatg ccactgggaa1080ttcatcctat cttcagttag ctactcatcc taaacttgcc aagcatgctg gtgctttctg1140gggtggccca gattatggtg ttcttagctg ggataataag cttgctggtg ctcaggtgct1200tctgagccga ttgagattgt ttttgagtcc tgggtatcca tatgaggaaa tattgagtac1260qtttcataat caaaccaqca taattatqtq ctcattcctt ccggttttca ctagctttaa1320tagaacaaaa ggaggtttga ttcagttaaa ccatggaagg cctcagccac tgcaatacgt1380agtcaatgca gccttcttag ccgccctata tagtgattat cttgatactg ctgatacacc1440tggatggtat tgtggtccca atttctattc aactgatgtc ctgcgtgaat ttgccaaaac1500ccagattgat tatatccttg gcaaaaatcc tcgaaaaatg agctatgttg tgggctttgg1560taaccattat ccaaagcatg ttcaccatag aggggcatct atccctaaga ataagatcaa1620atataactgt aaagggggat ggaaatggag ggatacgtca aaaccaaacc ccaacacact1680tgtgggagcc atggtagctg gacctgacaa gcatgatggg tttcgtgatg ttcgcaccaa1740ctacaactat acggagccaa ctctagcagg caacgcaggg ttggttgctg cactcgtggc1800attgtctggt gacaagqcaa ccgtgattga caagaatacc attttttctg cagttccacc1860aatqtttcct acaccaccac cacctccqqc accttgqaaa ccatgaaaac gttttgatct1920ttcttctgtc catgtgtgac ttacagtctg atgattttgg aattagtttt tggtacgtaa1980atgaccttgg aagtgtaagt aacgcaaaag gcaagacagg agatgagtga t 2031<210>3<211>4500<212>DNA<213>Arabidopsis thaliana<400>3gtgtactgcg agaactgctt attacataca tggcagataa tccgcgtaga agaagggttt 60aacggagacg aatttgaact ctccgacgaa ataatcgtct tctccggcat catcttcaga 120aagctattcc aaattagggt tttgactttt gattgaagaa gacaggtcta gaaacttaca 180tacaccaatt ttaaaatcga gtttgggccg aattatggac cgtactttgg gctatgggcc 240ttcattttaa taaacaggtc ggatatatcc accggacccg gaatgatcgt cttcctcagt 300gttgtatttt ggctttcctc attgcttcct caatctaagg atttccatga acaaggaact 360aaaatgagat ctcttctctt tgtactatca ctcatttgct tttgctctca aacagcactt 420tcatggaaga aggaagagtt tcgcagctgt gaccaaactc cattttgtaa acgcgctcga 480tctcgtactc ccggcgcgtg ttctctaatt gtcggcqatg tttccatcac tgatggagat 540ctcgtagcga agcttctacc gaaagcgcct aatcaaggcg atggggatca gatcaagccg 600ttgattcttt ctctctcagt ttacaaggat gggatcgtgc ggcttaaaat cgatgaggac 660cattcgttga acccgccgaa gaagaggttc caagttcctg atgtggtagt gtctgagttt 720gaggagaaga agatctggct gcagaaagta gcgacggaga cgatctctgg agacactagt 780ccgtcttcag tagtttatgt atccgatggt tacgaggcgg tggtgcgaca cgatccgttt 840
gaggtgtatg tgcgtgagaa atcaggtgat cgccgtcgcg ttgtgtcatt gaattctcat 900ggattatttg attttgagca gttggggagg aaaactgaag gagataactg ggaagagaaa 960tttaggactc atacagattc tagaccatct ggtcctcaat ctattagttt cgatgtttcg1020ttttatgatt ccagtttcgt ttatggaatt cctgaacacg ccactagctt cgcgttgaag1080cctaccaagg gtcctggagt tgaggaatct gaaccctaca ggctttttaa tctagatgtg1140tttgaatacg atcatgaatc accgtttggg ctttacgggt cgattccgtt catggtttcg1200catgggaagt ctggtaaaac ttcaggattt ttctggttga atgctgcgga aatgcagatt1260gatgtgttgg ctaatggttg ggatgcagag agtggtattt ctttgccttc tagtcacagt1320aggatcgaca cattctggat gagcgaggca gggattgtgg atacattctt tttcgttggg1380cctgagccaa aggatgttgt aaagcagtat gcaagtqtga caggtacttc agccatgcct1440cagttgtttg ccactggtta tcatcaatgt aggtggaact acaaagatga ggaggatgtg1500gcacaggtgg actcgaaatt cgatgaacac gatattcctt atgatgttct ctggcttgac1560attgagcata cagatgggaa gagatacttt acatgggata gtgtgttgtt tcctcatcca1620gaggagatgc aaaagaaatt ggctgcaaag ggtaggaaga tggtgaccat tgtggatcct1680catatcaaga gggatgactc atacttctta cacaaagagg ctactcaqat gggatactat1740gttaaggatt catctggaaa agactttgat ggttggtgct ggcctggttc atcatcttac1800attgatatgt tgagcccaga gattagaaaa tggtggggtg ggaggttctc gtataagaac1860tatgttggtt caactccatc attgtacacc tggaatgaca tgaatgagcc ttctgtattc1920aatggtcccg aggtataact ttctgtctga atggtctttt tttcttgttc cgttattgtt1980tttctgtaat ctgtatagct catttctcat attcattttg ggattgcagt tgaatatagc2040aatccattgt ttttctattg cacaattatg gatatgtttg aactctgata gattatacat2100cccttatctt gcatactatg acacctttta ttaattattg cactactaaa gcaagtattt2160taagatccat tttatgttta tqtggtttta cattggatat ttgtttctgt gacttcttta2220agagtggagt gtaagctatg gttgcatatc tccacctctg atttgcttat atcgtaqaaa2280gtttatcata tatgtaaagg tctattactg agatgaagac tggcactttt ttctttcttt2340tttgttggag taggttacta tgccaagaga tgcattacat gttgggggtg ttgaacacag2400agaagttcat aacgcatatg gatattactt ccacatggcg acttccgatg gacttgttat2460gcgtgaagaa ggaaaggata ggccttttgt attgtcaaga gcaatctttc ccggcactca2520aagatacgga gcaatttgga ctggagataa cacagccgaa tgggaacacc ttagagtctc2580cattccaatg atattgacac ttggtcttac tggaattaca ttctctggta caaacaaatt2640tagctgttca aattctgctg gcgttttttt tttctttctc aaatttaatg gaagttttct2700tttcttttgc aggagctgat attggtgggt tttttggaaa tcctgaacca gaacttctag2760ttaggtggta ccaagtgggt gcttactatc catttttcag gggtcatgct catcacgata2820ccaaaagacg agagccttgg ttgtttgggt aagatgtgat ttagtactta attttttctt2880gtcaagaggt attattttag tatgcggtcc aggtctagtc tatggatatt tgcttgatgg2940atgatcaaqc agattgaaat gtagtgatac tggttattga gaaaagaata caattgcgga3000aactaaaacc tggtgttgca ctctagtcag ttgattgtct aaatagttag gccattagtt3060tcatcaagta ggcattgcaa cggttgtcca gaagtctctc tgcctttgtt ttgctggctc3120ataaatgttg cactttctca ttcgaatcaa atcaatgttc tcttgtttca gtgaacggaa3180cacagaactc atgagagatg ccatacacac tcgttacaca ctgctcccat acttctacac3240gttgttcaga gaagcaaacg ttacgggtgt tcctgttgta cqcccattat ggatggaatt3300cccgcaagat gaagctactt ttagcaacga tgaagccttc atggtcggta gtggtctact3360ggttcaagga gtttacacca aggtacttga gcgctaagta caacttccta cttatttata3420ttttggcctt tgtatctctt tacttaatca tatactccag ataaatgatc aaaccctgcc3480acataccctc ttctcgtctt tctgcaaaat tagggaacaa cgcaagcttc cgtgtatttg3540cctggcaaag aatcatggta tgacttgaga aacggtaaga cttacgttgg aggcaagact3600cacaagatgg atgctccaga ggagagtatt cctgcgtttc aaaaggcagg aaccatcatc3660ccaaggaagg accggtttag gcgaagttcc tctcaaatgg acaatgatcc ttatactttg3720qtacqtacaa cacttqcatc acactqtttt atcatctgct atcaqcacca tqaacaaaqt3780aaaaccggtt ggtaaaaaga ttatctctga aagtgaaatc ccaatgataa actatgtgat3840ctaacatcta aaacccttca ggtggtagct ttgaacagtt ctcaagaagc agaaggtgaa3900ctctacatcg atgacggcaa aagctttgaa ttcagacgag gctcttacat ccatcgtcgc3960ttcgtcttct caaagggtgt tcttacatca acgaacttag ctcctccaga agctcgtctc4020tcttcccaat gcttgatcga cagaattatc ctcttgggac acagctcagg tccaaaatct4080gcgttggtgg aaccgttgaa tcaaaaggca gagattgaga tgggacctct gcgaatgggt4140gggcttgtag cttcctcggg tacaaaggtg ttgactatcc gcaaaccggg tgttcgagtg4200gaccaagact ggaccgtaaa gattctgtga ttgaacggtt tgaaccagtt tcactcatgg4260ccgttagaqt ggccgaaatc tgcttttccg gcgacggaat atcacacttt ttaatatatg4320tttggagatt tagacttaaa tagttgtaag agctaacagt ttgaaagtca ctttgcattg4380ttgtttatct tcatataaat gagtttagat tttgataatt tcagaattcg tggaatcata4440attaacaatt ttgataggga aaaataattt gtttttttta gtcagagggt caaataatct4500<210>4<211>1773<212>DNA<213>Artificial Sequence
<220>
<223>cDNA RSW3 homologue from cotton(partial 3′end)<220>
<221>misc_feature<222>(2)..(1576)<223>C-terminal part of the coding region<400>4atatgatgtt ttgtggcttg atattgagca tactgatgga aagaggtatt tcacatggga 60taagatgcta ttcccacatc cagaagagat qcaaaggaaa ttggctgcca aaggtaggca 120tatggtgaca attgtggatc cgcatattaa gagggatgag tcatttcact tgcacaagga 180tgcttcccag agggggtatt atgtaaagga tgcaactggc aaggattatg atgggtggtg 240ctggccaggc tcctcctcct acccagatat gttaaatccc gagattaggt catggtgggc 300tgagaagttc tcctatgata attatgtcgg ttcaactcct tcattgtaca tttggaatga 360catgaatgag ccttctgtgt ttaatggacc tgaggtgaca atgcccagag atgctttaca 420tgttggtgga gtggaacatc gggagttaca taatgcctat ggatattact tccacatggc 480aacagctgaa ggccttctaa agcgtggaga tggtaaggac agaccttttg tcttgtccag 540agcattcttt gctggaagtc aaaggtatgg agcagtctgg actggtgata attcggcaga 600ttgggatcat ctcagggttt cagtcccaat ggttttgacg cttggtctta ctggaatgac 660attctctggg gctgatgttg gtggattttt tggcaatcct gagcctgagt tattagtgcg 720ttggtatcaa cttggtgctt attatccttt ctttagaggt catgctcatc atgacacaaa 780aagacgagag ccttggttgt ttggtgaacg aaataccgca cttatgagag atgccatacg 840aattcgttac accttgcttc catacttcta cacattattc agagaagcaa atgttagtgg 900tgttcctgtt gtacggccat tatggatgga gttcccatct gatgaagcag ctttcagcaa 960tgatgaagcc ttcatggttg ggaacagtct tttagtacaa gggatctata ctgcaagggc1020taaacatgca tcagtatatt tgcctgggaa ggaatcgtgg tacgacctta gaacaggaac1080tgcatataag ggaggaaagg tccataaact tgaagtttca gaagagagca ttcctgcttt1140ccaaagagct ggcacaatag tgccaagaaa agaccggttc cgtagaagct ccacacaaat1200ggtgcatgat ccttacacac tqqtaatagc tctgaacagt tcccaagcag ctgaaggtga1260actctatgtt gatgatggaa aaagctatga cttcaaacat ggggcataca tccatcgccg1320ctttgtgttc tcgaatgggc atctaacatc ctctcccgtt ggcaactcta ggttttcgtc1380tgactgcatt atcgagcggg ttattcttct tggatttacc cctggggcta aaactgctct1440tgtcgaacca ggaaatcaga aggctgaaat cgaacttggt ccacttcggt tcgggggaca1500acatgctgct gttgctgtaa ccatccggaa gcctggtgtg agggtggctg aagattggaa1560gataaaaatt ttgtaggatg tctatttagt tcggtgaaaa tgtaatgcca agtaaagctc1620tcctgctact tcgttattct cgacttttta gagtttatga tggagaaaac tggaaagccg1680ttgacatttc cttcgttcaa tttactttct acttttaaga atttaaaaaa aaagtcgacg1740cggccgcgaa ttccggaccg gtacctgcag gcg 1773<210>5<211>621<212>PRT<213>Arabidopsis thaliana<400>5Met Tyr Gly Arg Asp Pro Trp Gly Gly Pro Leu Glu Ile Asn Thr Ala1 5 10 15Asp Ser Ala Thr Asp Asp Asp Arg Ser Arg Asn Leu Asn Asp Leu Asp20 25 30Arg Ala Ala Leu Ser Arg Pro Leu Asp Glu Thr Gln Gln Ser Trp Leu35 40 45Leu Gly Pro Thr Glu Gln Lys Lys Lys Lys Tyr Val Asp Leu Gly Cys50 55 60Ile Ile Val Ser Arg Lys Ile Phe Val Trp Thr Val Gly Thr Leu Val65 70 75 80Ala Ala Ala Leu Leu Ala Gly Phe Ile Thr Leu Ile Val Lys Thr Val85 90 95Pro Arg His His Pro Lys Thr Pro Pro Pro Asp Asn Tyr Thr Ile Ala100 105 110
Leu His Lys Ala Leu Lys Phe Phe Asn Ala Gln Lys Ser Gly Lys Leu115 120 125pro Lys His Asn Asn Val Ser Trp Arg Gly Asn Ser Gly Leu Gln Asp130 135 140Gly Lys Gly Glu Thr Gly Ser Phe Tyr Lys Asp Leu Val Gly Gly Tyr145 150 155 160Tyr Asp Ala Gly Asp Ala Ile Lys Phe Asn Phe Pro Met Ala Tyr Ala165 170 175Met Thr Met Leu Ser Trp Ser Val Ile Glu Tyr Ser Ala Lys Tyr Glu180 185 190Ala Ala Gly Glu Leu Thr His Val Lys Glu Leu Ile Lys Trp Gly Thr195 200 205Asp Tyr Phe Leu Lys Thr Phe Asn Ser Thr Ala Asp Ser Ile Asp Asp210 215 220Leu Val Ser Gln Val Gly Ser Gly Asn Thr Asp Asp Gly Asn Thr Asp225 230 235 240Pro Asn Asp His Tyr Cys Trp Met Arg Pro Glu Asp Met Asp Tyr Lys245 250 255Arg Pro Val Thr Thr Cys Asn Gly Gly Cys Ser Asp Leu Ala Ala Glu260 265 270Met Ala Ala Ala Leu Ala Ser Ala Ser Ile Val Phe Lys Asp Asn Lys275 280 285Glu Tyr Ser Lys Lys Leu Val His Gly Ala Lys Val Val Tyr Gln Phe290 295 300Gly Arg Thr Arg Arg Gly Arg Tyr Ser Ala Gly Thr Ala Glu Ser Ser305 310 315 320Lys Phe Tyr Asn Ser Ser Met Tyr Trp Asp Glu Phe Ile Trp Gly Gly325 330 335Ala Trp Met Tyr Tyr Ala Thr Gly Asn Val Thr Tyr Leu Asn Leu Ile340 345 350Thr Gln Pro Thr Met Ala Lys His Ala Gly Ala Phe Trp Gly Gly Pro355 360 365Tyr Tyr Gly Val Phe Ser Trp Asp Asn Lys Leu Ala Gly Ala Gln Leu370 375 380Leu Leu Ser Arg Leu Arg Leu Phe Leu Ser Pro Gly Tyr Pro Tyr Glu385 390 395 400Glu Ile Leu Arq Thr Phe His Asn Gln Thr Ser Ile Val Met Cys Ser405 410 415Tyr Leu Pro Ile Phe Asn Lys Phe Asn Arg Thr Asn Gly Gly Leu Ile420 425 430Glu Leu Asn His Gly Ala Pro Gln Pro Leu Gln Tyr Ser Val Asn Ala435 440 445Ala Phe Leu Ala Thr Leu Tyr Ser Asp Tyr Leu Asp Ala Ala Asp Thr450 455 460
Pro Gly Trp Tyr Cys Gly Pro Asn Phe Tyr Ser Thr Ser Val Leu Arg465 470 475 480Asp Phe Ala Arg Ser Gln Ile Asp Tyr Ile Leu Gly Lys Asn Pro Arg485 490 495Lys Met Ser Tyr Val Val Gly Phe Gly Thr Lys Tyr Pro Arg His Val500 505 510His His Arg Gly Ala Ser Ile Pro Lys Asn Lys Val Lys Tyr Asn Cys515 520 525Lys Gly Gly Trp Lys Trp Arg Asp Ser Lys Lys Pro Asn Pro Asn Thr530 535 540Ile Glu Gly Ala Met Val Ala Gly Pro Asp Lys Arg Asp Gly Tyr Arg545 550 555 560Asp Val Arg Met Asn Tyr Asn Tyr Thr Glu Pro Thr Leu Ala Gly Asn565 570 575Ala Gly Leu Val Ala Ala Leu Val Ala Leu Ser Gly Glu Glu Glu Ala580 585 590Thr Gly Lys Ile Asp Lys Asn Thr Ile Phe Ser Ala Val Pro Pro Leu595 600 605Phe Pro Thr Pro Pro Pro Pro Pro Ala Pro Trp Lys Pro610 615 620<210>6<211>619<212>PRT<213>cotton<400>6Met Tyr Gly Arg Asp Pro Trp Gly Gly Pro Leu Glu Ile Asn Ala Thr1 5 10 15Asp Ser Ala Thr Asp Asp Asp Arg Ser Arg Asn Leu Gln Asp Leu Asp20 25 30Arg Ala Ala Leu Ser Arg Pro Leu Asp Glu Thr Gln Gln Ser Trp Leu35 40 45Leu Gly Pro Gly Glu Gln Lys Lys Lys Lys Lys Tyr Val Asp Leu Gly50 55 60Cys Ile Ile Val Ser Arg Lys Ile Phe Val Trp Thr Val Gly Thr Leu65 70 75 80Leu Val Ser Ala Leu Leu Ala Gly Leu Ile Thr Leu Ile Val Lys Thr85 90 95Val Pro Arg His His His Arg His Ser Pro Pro Asp Asn Tyr Thr Leu100 105 110Ala Leu His Lys Ala Leu Met Phe Phe Asn Ala Gln Arg Ser Gly Lys115 120 125Leu Pro Lys His Asn Asn Val Ser Trp Arg Gly Asn Ser Gly Leu Gln130 135 140
Asp Gly Lys Ser Asp Pro Ser Val Leu Met Lys Asp Leu VaL Gly Gly145 150 155 160Tyr Tyr Asp Ala Gly Asp Ala Ile Lys Phe Asn Phe Pro Ala Ser Phe165 170 175Ser Met Thr Met Leu Ser Trp Ser Val Ile Glu Tyr Ser Ala Lys Tyr180 185 190Glu Ala Ala Gly Glu Leu Asn His Val Lys Glu Ile Ile Lys Trp Gly195 200 205Thr Asp Tyr Leu Leu Lys Thr Phe Asn Asn Thr Ala Asp Thr Ile Asp210 215 220Arg Ile Ala Ala Gln Val Gly Ile Gly Asp Thr Ser Gly Gly Ser Ser225 230 235 240Ala Pro Asn Asp His Tyr Cys Trp Met Arg Pro Glu Asp Ile Asp Tyr245 250 255Pro Arg Pro Val Tyr Glu Cys His Ser Cys Ser Asp Leu Ala Ala Glu260 265 270Met Ala Ala Ala Leu Ala Ser Ala Ser Ile Val Phe Lys Asp Asn Lys275 280 285Ala Tyr Ser Gln Lys Leu Val His Gly Ala Arg Thr Leu Phe Met Phe290 295 300Ala Arg Asp Gln Arg Gly Arg Tyr Ser Ala Gly Gly Ser Asp Pro Ala305 310 315 320Leu Phe Tyr Asn Ser Ser Ser Tyr Trp Asp Glu Phe Val Trp Gly Gly325 330 335Ala Trp Leu Tyr Tyr Ala Thr Gly Asn Ser Ser Tyr Leu Gln Leu Ala340 345 350Thr His Pro Lys Leu Ala Lys His Ala Gly Ala Phe Trp Gly Gly Pro355 360 365Asp Tyr Gly Val Leu Ser Trp Asp Asn Lys Leu Ala Gly Ala Gln Val370 375 380Leu Leu Ser Arg Leu Arg Leu Phe Leu Ser Pro Gly Tyr Pro Tyr Glu385 390 395 400Glu Ile Leu Ser Thr Phe His Asn Gln Thr Ser Ile Ile Met Cys Ser405 410 415Phe Leu Pro Val Phe Thr Ser Phe Asn Arg Thr Lys Gly Gly Leu Ile420 425 430Gln Leu Asn His Gly Arg Pro Gln Pro Leu Gln Tyr Val Val Asn Ala435 440 445Ala Phe Leu Ala Ala Leu Tyr Ser Asp Tyr Leu Asp Thr Ala Asp Thr450 455 460Pro Gly Trp Tyr Cys Gly Pro Asn Phe Tyr Ser Thr Asp Val Leu Arg465 470 475 480Glu Phe Ala Lys Thr Gln Ile Asp Tyr Ile Leu Gly Lys Asn Pro Arg485 490 495
Lys Met Ser Tyr Val Val Gly Phe Gly Asn His Tyr Pro Lys His Val500 505 510His His Arg Gly Ala Ser Ile Pro Lys Asn Lys Ile Lys Tyr Asn Cys515 520 525Lys Gly Gly Trp Lys Trp Arg Asp Thr Ser Lys Pro Asn Pro Asn Thr530 535 540Leu Val Gly Ala Met Val Ala Gly Pro Asp Lys His Asp Gly Phe Arg545 550 555 560Asp Val Arg Thr Asn Tyr Asn Tyr Thr Glu Pro Thr Leu Ala Gly Asn565 570 575Ala Gly Leu Val Ala Ala Leu Val Ala Leu Ser Gly Asp Lys Ala Thr580 585 590Val Ile Asp Lys Asn Thr Ile Phe Ser Ala Val Pro Pro Met Phe Pro595 600 605Thr Pro Pro Pro Pro Pro Ala Pro Trp Lys Pro610 615<210>7<211>921<212>PRT<213>Arabidopsis thaliana<400>7Met Arg Ser Leu Leu Phe Val Leu Ser Leu Ile Cys Phe Cys Ser Gln1 5 10 15Thr Ala Leu Ser Trp Lys Lys Glu Glu Phe Arg Ser Cys Asp Gln Thr20 25 30Pro Phe Cys Lys Arg Ala Arg Ser Arg Thr Pro Gly Ala Cys Ser Leu35 40 45Ile Val Gly Asp Val Ser Ile Thr Asp Gly Asp Leu Val Ala Lys Leu50 55 60Leu Pro Lys Ala Pro Asn Gln Gly Asp Gly Asp Gln Ile Lys Pro Leu65 70 75 80Ile Leu Ser Leu Ser Val Tyr Lys Asp Gly Ile Val Arg Leu Lys Ile85 90 95Asp Glu Asp His Ser Leu Asn Pro Pro Lys Lys Arg Phe Gln Val Pro100 105 110Asp Val Val Val Ser Glu Phe Glu Glu Lys Lys Ile Trp Leu Gln Lys115 120 125Val Ala Thr Glu Thr Ile Ser Gly Asp Thr Ser Pro Ser Ser Val Val130 135 140Tyr Val Ser Asp Gly Tyr Glu Ala Val Val Arg His Asp Pro Phe Glu145 150 155 160Val Tyr Val Arg Glu Lys Ser Gly Asp Arg Arg Arg Val Val Ser Leu165 170 175
Asn Ser His Gly Leu Phe Asp Phe Glu Gln Leu Gly Arg Lys Thr Glu180 185 190Gly Asp Asn Trp Glu Glu Lys Phe Arg Thr His Thr Asp Ser Arg Pro195 200 205Ser Gly Pro Gln Ser Ile Ser Phe Asp Val Ser Phe Tyr Asp Ser Ser210 215 220Phe Val Tyr Gly Ile Pro Glu His Ala Thr Ser Phe Ala Leu Lys Pro225 230 235 240Thr Lys Gly Pro Gly Val Glu Glu Ser Glu Pro Tyr Arg Leu Phe Asn245 250 255Leu Asp Val Phe Glu Tyr Asp His Glu Ser Pro Phe Gly Leu Tyr Gly260 265 270Ser Ile Pro Phe Met Val Ser His Gly Lys Ser Gly Lys Thr Ser Gly275 280 285Phe Phe Trp Leu Asn Ala Ala Glu Met Gln Ile Asp Val Leu Ala Asn290 295 300Gly Trp Asp Ala Glu Ser Gly Ile Ser Leu Pro Ser Ser His Ser Arg305 310 315 320Ile Asp Thr Phe Trp Met Ser Glu Ala Gly Ile Val Asp Thr Phe Phe325 330 335Phe Val Gly Pro Glu Pro Lys Asp Val Val Lys Gln Tyr Ala Ser Val340 345 350Thr Gly Thr Ser Ala Met Pro Gln Leu Phe Ala Thr Gly Tyr His Gln355 360 365Cys Arg Trp Asn Tyr Lys Asp Glu Glu Asp Val Ala Gln Val Asp Ser370 375 380Lys Phe Asp Glu His Asp Ile Pro Tyr Asp Val Leu Trp Leu Asp Ile385 390 395 400Glu His Thr Asp Gly Lys Arg Tyr Phe Thr Trp Asp Ser Val Leu Phe405 410 415Pro His Pro Glu Glu Met Gln Lys Lys Leu Ala Ala Lys Gly Arg Lys420 425 430Met Val Thr Ile Val Asp Pro His Ile Lys Arg Asp Asp Ser Tyr Phe435 440 445Leu His Lys Glu Ala Thr Gln Met Gly Tyr Tyr Val Lys Asp Ser Ser450 455 460Gly Lys Asp Phe Asp Gly Trp Cys Trp Pro Gly Ser Ser Ser Tyr Ile465 470 475 480Asp Met Leu Ser Pro Glu Ile Arg Lys Trp Trp Gly Gly Arg Phe Ser485 490 495Tyr Lys Asn Tyr Val Gly Ser Thr Pro Ser Leu Tyr Thr Trp Asn Asp500 505 510Met Asn Glu Pro Ser Val Phe Asn Gly Pro Glu Val Thr Met Pro Arg515 520 525
Asp Ala Leu His Val Gly Gly Val Glu His Arg Glu Val His Asn Ala530 535 540Tyr Gly Tyr Tyr Phe His Met Ala Thr Ser Asp Gly Leu Val Met Arg545 550 555 560Glu Glu Gly Lys Asp Arg Pro Phe Val Leu Ser Arg Ala Ile Phe Pro565 570 575Gly Thr Gln Arg Tyr Gly Ala Ile Trp Thr Gly Asp Asn Thr Ala Glu580 585 590Trp Glu His Leu Arg Val Ser Ile Pro Met Ile Leu Thr Leu Gly Leu595 600 605Thr Gly Ile Thr Phe Ser Gly Ala Asp Ile Gly Gly Phe Phe Gly Asn610 615 620Pro Glu Pro Glu Leu Leu Val Arg Trp Tyr Gln Val Gly Ala Tyr Tyr625 630 635 640Pro Phe Phe Arg Gly His Ala His His Asp Thr Lys Arg Arg Glu Pro645 650 655Trp Leu Phe Gly Glu Arg Asn Thr Glu Leu Met Arg Asp Ala Ile His660 665 670Thr Arg Tyr Thr Leu Leu Pro Tyr Phe Tyr Thr Leu Phe Arg Glu Ala675 680 685Asn Val Thr Gly Val Pro Val Val Arg Pro Leu Trp Met Glu Phe Pro690 695 700Gln Asp Glu Ala Thr Phe Ser Asn Asp Glu Ala Phe Met Val Gly Ser705 7l0 715 720Gly Leu Leu Val Gln Gly Val Tyr Thr Lys Gly Thr Thr Gln Ala Ser725 730 735Val Tyr Leu Pro Gly Lys Glu Ser Trp Tyr Asp Leu Arg Asn Gly Lys740 745 750Thr Tyr Val Gly Gly Lys Thr His Lys Met Asp Ala Pro Glu Glu Ser755 760 765Ile Pro Ala Phe Gln Lys Ala Gly Thr Ile Ile Pro Arg Lys Asp Arg770 775 780Phe Arg Arg Ser Ser Ser Gln Met Asp Asn Asp Pro Tyr Thr Leu Val785 790 795 800Val Ala Leu Asn Ser Ser Gln Glu Ala Glu Gly Glu Leu Tyr Ile Asp805 810 815Asp Gly Lys Ser Phe Glu Phe Arg Arg Gly Ser Tyr Ile His Arg Arg820 825 830Phe Val Phe Ser Lys Gly Val Leu Thr Ser Thr Asn Leu Ala Pro Pro835 840 845Glu Ala Arg Leu Ser Ser Gln Cys Leu Ile Asp Arg Ile Ile Leu Leu850 855 860Gly His Ser Ser Gly Pro Lys Ser Ala Leu Val Glu Pro Leu Asn Gln865 870 875 880Lys Ala Glu Ile Glu Met Gly Pro Leu Arg Met Gly Gly Leu Val Ala
885 890 895Ser Ser Gly Thr Lys Val Leu Thr Ile Arg Lys Pro Gly Val Arg Val900 905 910Asp Gln Asp Trp Thr Val Lys Ile Leu915 920<210>8<211>524<212>PRT<213>cotton<400>8Tyr Asp Val Leu Trp Leu Asp Ile Glu His Thr Asp Gly Lys Arg Tyr1 5 10 15Phe Thr Trp Asp Lys Met Leu Phe Pro His Pro Glu Glu Met Gln Arg20 25 30Lys Leu Ala Ala Lys Gly Arg His Met Val Thr Ile Val Asp Pro His35 40 45Ile Lys Arg Asp Glu Ser Phe His Leu His Lys Asp Ala Ser Gln Arg50 55 60Gly Tyr Tyr Val Lys Asp Ala Thr Gly Lys Asp Tyr Asp Gly Trp Cys65 70 75 80Trp Pro Gly Ser Ser Ser Tyr Pro Asp Met Leu Asn Pro Glu Ile Arg85 90 95Ser Trp Trp Ala Glu Lys Phe Ser Tyr Asp Asn Tyr Val Gly Ser Thr100 105 110Pro Ser Leu Tyr Ile Trp Asn Asp Met Asn Glu Pro Ser Val Phe Asn115 120 125Gly Pro Glu Val Thr Met Pro Arg Asp Ala Leu His Val Gly Gly Val130 135 140Glu His Arg Glu Leu His Asn Ala Tyr Gly Tyr Tyr Phe His Met Ala145 150 155 160Thr Ala Glu Gly Leu Leu Lys Arg Gly Asp Gly Lys Asp Arg Pro Phe165 170 175Val Leu Ser Arg Ala Phe Phe Ala Gly Ser Gln Arg Tyr Gly Ala Val180 185 190Trp Thr Gly Asp Asn Ser Ala Asp Trp Asp His Leu Arg Val Ser Val195 200 205Pro Met Val Leu Thr Leu Gly Leu Thr Gly Met Thr Phe Ser Gly Ala210 215 220Asp Val Gly Gly Phe Phe Gly Asn Pro Glu Pro Glu Leu Leu Val Arg225 230 235 240Trp Tyr Gln Leu Gly Ala Tyr Tyr Pro Phe Phe Arg Gly His Ala His245 250 255
His Asp Thr Lys Arg Arg Glu Pro Trp Leu Phe Gly Glu Arg Asn Thr260 265 270Ala Leu Met Arg Asp Ala Ile Arg Ile Arg Tyr Thr Leu Leu Pro Tyr275 280 285Phe Tyr Thr Leu Phe Arg Glu Ala Asn Val Ser Gly Val Pro Val Val290 295 300Arg Pro Leu Trp Met Glu Phe Pro Ser Asp Glu Ala Ala Phe Ser Asn305 310 315 320Asp Glu Ala Phe Met Val Gly Asn Ser Leu Leu Val Gln Gly Ile Tyr325 330 335Thr Ala Arg Ala Lys His Ala Ser Val Tyr Leu Pro Gly Lys Glu Ser340 345 350Trp Tyr Asp Leu Arg Thr Gly Thr Ala Tyr Lys Gly Gly Lys Val His355 360 365Lys Leu Glu Val Ser Glu Glu Ser Ile Pro Ala Phe Gln Arg Ala Gly370 375 380Thr Ile Val Pro Arg Lys Asp Arg Phe Arg Arg Ser Ser Thr Gln Met385 390 395 400Val His Asp Pro Tyr Thr Leu Val Ile Ala Leu Asn Ser Ser Gln Ala405 410 415Ala Glu Gly Glu Leu Tyr Val Asp Asp Gly Lys Ser Tyr Asp Phe Lys420 425 430His Gly Ala Tyr Ile His Arg Arg Phe Val Phe Ser Asn Gly His Leu435 440 445Thr Ser Ser Pro Val Gly Asn Ser Arg Phe Ser Ser Asp Cys Ile Ile450 455 460Glu Arg Val Ile Leu Leu Gly Phe Thr Pro Gly Ala Lys Thr Ala Leu465 470 475 480Val Glu Pro Gly Asn Gln Lys Ala Glu Ile Glu Leu Gly Pro Leu Arg485 490 495Phe Gly Gly Gln His Ala Ala Val Ala Val Thr Ile Arg Lys Pro Gly500 505 510Val Arg Val Ala Glu Asp Trp Lys Ile Lys Ile Leu515 520<210>9<211>2766<212>DNA<213>Arabidopsis thaliana<400>9atgagatctc ttctctttgt actatcactc atttgctttt gctctcaaac agcactttca 60tggaagaagg aagagtttcg caqctgtgac caaactccat tttgtaaacg cgctcgatct 120cgtactcccg gcgcgtgttc tctaattgtc ggcgatgttt ccatcactga tggagatctc 180gtagcgaagc ttctaccgaa agcgcctaat caaggcgatg gggatcagat caagccgttg 240attctttctc tctcagttta caaggatggg atcgtgcggc ttaaaatcga tgaggaccat 300tcgttgaacc cgccgaagaa gaggttccaa gttcctgatg tggtagtgtc tgagtttgag 360gagaagaaga tctggctgca gaaagtagcg acggagacga tctctggaga cactagtccg 420
tcttcagtag tttatgtatc cgatggttac gaggcggtgg tgcgacacga tccgtttgag 480gtgtatgtgc gtgagaaatc aggtgatcgc cgtcgcgttg tgtcattgaa ttctcatgga 540ttatttgatt ttgagcagtt ggggaggaaa actgaaggag ataactggga agagaaattt 600aggactcata cagattctag accatctggt cctcaatcta ttagtttcga tgtttcgttt 660tatgattcca gtttcgttta tggaattcct gaacacgcca ctagcttcgc gttgaagcct 720accaagggtc ctggagttga ggaatctgaa ccctacaggc tttttaatct agatgtgttt 780gaatacgatc atgaatcacc gtttgggctt tacgggtcga ttccgttcat ggtttcgcat 840ggqaagtctg gtaaaacttc aggatttttc tggttgaatg ctgcggaaat gcagattgat 900gtgttggcta atggttggga tgcagagagt ggtatttctt tgccttctag tcacagtagg 960atcgacacat tctggatgag cgaggcaggg attgtggata cattcttttt cgttgggcct1020gagccaaagg atgttgtaaa gcagtatgca agtgtgacag gtacttcagc catgcctcag1080ttgtttgcca ctggttatca tcaatgtagg tggaactaca aagatgagga ggatgtggca1140caggtggact cgaaattcga tgaacacgat attccttatg atgttctctg gcttgacatt1200gagcatacag atgggaagag atactttaca tgggatagtg tgttgtttcc tcatccagag1260gagatgcaaa agaaattggc tgcaaagggt aggaagatgg tgaccattgt ggatcctcat1320atcaagaggg atgactcata cttcttacac aaaqaggcta ctcagatggg atactatgtt1380aaggattcat ctggaaaaga ctttgatggt tggtgctggc ctggttcatc atcttacatt1440gatatgttga gcccagagat tagaaaatgg tggggtggga ggttctcgta taagaactat1500gttggttcaa ctccatcatt gtacacctgg aatgacatga atgagccttc tgtattcaat1560ggtcccgagg ttactatgcc aagagatgca ttacatgttg gqggtgttga acacagagaa1620gttcataacg catatggata ttacttccac atggcgactt ccgatggact tgttatgcgt1680gaagaaggaa aggataggcc ttttgtattg tcaagagcaa tctttcccgg cactcaaaga1740tacggagcaa tttggactgg agataacaca gccgaatggg aacaccttag agtctccatt1800ccaatgatat tgacacttgg tcttactgga attacattct ctqgagctga tattggtqgg1860ttttttggaa atcctgaacc agaacttcta gttaggtggt accaagtggg tgcttactat1920ccatttttca ggggtcatgc tcatcacgat accaaaagac gagagccttg gttgtttggt1980gaacggaaca cagaactcat gagagatgcc atacacactc gttacacact gctcccatac2040ttctacacgt tgttcagaga agcaaacgtt acgggtgttc ctgttgtacg cccattatgg2100atggaattcc cgcaagatga agctactttt agcaacgatg aagccttcat ggtcggtagt2160ggtctactgg ttcaaggagt ttacaccaag ggaacaacgc aagcttccgt gtatttgcct2220ggcaaagaat catggtatga cttgagaaac ggtaagactt acgttggagg caagactcac2280aagatggatg ctccagagga gagtattcct gcgtttcaaa aggcaggaac catcatccca2340aggaaggacc ggtttaggcg aagttcctct caaatggaca atgatcctta tactttggtg2400gtagctttga acagttctca agaagcagaa ggtgaactct acatcgatga cggcaaaagc2460tttgaattca gacgaggctc ttacatccat cgtcgcttcg tcttctcaaa gggtgttctt2520acatcaacga acttagctcc tccagaagct cgtctctctt cccaatgctt gatcgacaga2580attatcctct tgggacacag ctcaggtcca aaatctgcgt tggtggaacc gttgaatcaa2640aaggcagaga ttgagatggg acctctgcga atgggtgggc ttgtagcttc ctcgggtaca2700aaggtgttga ctatccgcaa accgggtgtt cgagtggacc aagactggac cgtaaagatt2760ctgtga 2766<210>10<211>29<212>DNA<213>Artificial sequence<220>
<223>oligonucleotide PCR primer<400>10ccgctcgagc gggcattttc cgcccacta 29<210>11<211>29<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>11cgggatcccg tcacacatgg acagaagaa29<210>12<211>19<212>DNA
<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>12gacggcgtct agaagattc 19<210>13<211>19<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>13taacttatcg ggcttctgc 19<210>14<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>14ccctcgcttg gtacaaggta t 21<210>15<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>15tcctqatcct ctcaccacgt a21<210>16<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>16cgtagtggtc tactggttca a21<210>17<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>17tgagctgtgt cccaagagga t 21<210>18<211>21<212>DNA
<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>18ggtgatgagg ataccagcga t 21<210>19<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>19cccactccct aaccggagtt t 21<210>20<211>35<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>20ccgctcgagc ggtttcactc acaactgtgg tctct 35<210>21<211>34<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>21ccgctcgagc ggtctcctaa gtcctaaccc cata34<210>22<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>22cgggatgaag aggatgtaga g 21<210>23<211>21<212>DNA<213>Artificial Sequence<220>
<223>oligonucleotide PCR primer<400>23gaacccctga gatgatccca a 2权利要求
1.一种用于在产纤维植物中增加纤维素生物合成的方法,包括给所述产纤维植物的细胞提供一种嵌合基因的步骤,所述嵌合基因包括以下可操纵连接的DNA片段i)在所述植物的所述细胞中可表达的启动子;ii)编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白或其变体的DNA区域,所述变体具有同样的酶活性;iii)参与转录终止和聚腺苷酸化的3’区域。
2.权利要求1的方法,其中所述产纤维植物是棉属植物。
3.权利要求1或2的方法,其中所述DNA区域包括SEQ ID No.1的自第121位核苷酸至第1986位核苷酸的核苷酸序列、或SEQ ID No.2的自第47位核苷酸至第1906位核苷酸的核苷酸序列、或SEQ ID No.3的或SEQ ID No.4的自第2位核苷酸至第1576位核苷酸的核苷酸序列或SEQ ID No.9的核苷酸序列。
4.权利要求1至3中任一项的方法,其中所述启动子是组成型启动子。
5.权利要求1至3中任一项的方法,其中所述启动子是纤维特异性启动子。
6.权利要求1至3中任一项的方法,其中所述启动子是苹果青霉素启动子。
7.权利要求1至6中任一项的方法,其中在棉绒纤维中增加所述纤维素生物合成。
8.一种用于在产纤维植物中降低纤维素生物合成的方法,包括给所述产纤维植物的细胞提供一种嵌合基因的步骤,所述嵌合基因能够降低所述产纤维植物的一种内源性基因的表达,其中所述内源性基因编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有同样的酶活性。
9.权利要求8的方法,其中所述产纤维植物是棉属植物。
10.权利要求8或9的方法,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列。
11.权利要求8或9的方法,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自SEQ ID No.1或SEQID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列。
12.权利要求8或9的方法,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列的互补序列。
13.权利要求8或9的方法,其中所述嵌合基因包括一种具有21个连续的核苷酸的核苷酸序列,该序列选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列的互补序列。
14. 权利要求8或9的方法,其中所述嵌合基因包括可操纵地连接于在植物中可表达的启动子的一种选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列的具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
15.权利要求8或9的方法,其中所述嵌合基因包括可操纵地连接于在植物中可表达的启动子的一种选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列的具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
16.权利要求8至15中任一项的方法,其中所述在植物中可表达的启动子是组成型启动子。
17.权利要求8至15中任一项的方法,其中所述在植物中可表达的启动子是绒毛纤维特异性启动子。
18.权利要求8至17中任一项的方法,其中所述纤维素生物合成在绒毛纤维产生中被降低。
19.一种用于在产纤维植物中增加纤维素生物合成的嵌合基因,其包括以下可操纵连接的DNA片段i)在所述植物的所述细胞中可表达的启动子;ii)编码包括SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体的DNA区域,所述变体具有同样的酶活性;以及iii)参与转录终止和聚腺苷酸化的3’端区域。
20.权利要求19的嵌合基因,其中所述产纤维植物是棉属植物。
21.权利要求19或20的嵌合基因,其中所述DNA区域包括SEQID No.2或SEQ ID No.3或SEQ ID No.4的核苷酸序列。
22.权利要求19至21中任一项的嵌合基因,其中所述启动子是组成型启动子。
23.权利要求19至21中任一项的嵌合基因,其中所述启动子是纤维特异性启动子。
24.权利要求19至21中任一项的嵌合基因,其中所述启动子是苹果青霉素启动子。
25.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列以及参与转录终止和聚腺苷酸化的3,区域,所述核苷酸序列选自编码一种包括SEQ ID No.6或SEQ ID No.7或SEQ IDNo.8的氨基酸序列的蛋白质的核苷酸序列。
26.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,所述序列选自SEQ ID No.2或SEQ ID No.3或SEQ ID No.4的核苷酸序列。
27.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列的互补序列。
28.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含一种具有21个连续的核苷酸的核苷酸序列,所述序列选自SEQID No.2或SEQ ID No.3或SEQ ID No.4的核苷酸序列的互补序列。
29.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含可操纵地连接于在植物中可表达的启动子的一种选自编码一种包括SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列的具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
30.一种用于在产纤维植物中降低纤维素生物合成的嵌合基因,其包含可操纵地连接于在植物中可表达的启动子的一种选自SEQ ID No.2或SEQ ID No.3或SEQ ID No.4的核苷酸序列的具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。
31.权利要求25至30中任一项的嵌合基因,其中所述产纤维植物是棉属植物。
32.权利要求25至31中任一项的嵌合基因,其中所述在植物中可表达的启动子是组成型启动子。
33.权利要求25至31中任一项的嵌合基因,其中所述在植物中可表达的启动子是绒毛纤维特异性启动子。
34.一种植物细胞,其包含权利要求19至33中任一项的嵌合基因。
35.一种植物,其包含权利要求34的植物细胞。
36.权利要求35的植物,其中所述植物基本上由包含权利要求19至33中任一项的嵌合基因的植物细胞组成。
37.权利要求31或32的植物的种子,所述种子包含权利要求19至33中任一项的嵌合基因。
38.权利要求19至33中任一项的嵌合基因在调节产纤维植物的纤维素生物合成和纤维品质中的用途。
39.权利要求38的嵌合基因的用途,其中所述产纤维植物是棉属植物。
40.一种用于在包括一种特定植物品种的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法,所述等位基因变异单独地或者组合地与纤维素生产的数量和/品质以及纤维生产有关联,所述方法的步骤包括a)提供包含不同等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列的特定植物品种或杂种繁殖植物品种的不同变种或基因型的群体;b)确定所述群体中每一个个体的与纤维生产和/或纤维素生物合成有关的参数;c)确定所述群体中每一个个体是否存在一种特定等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列;以及d)将出现特定的纤维或纤维素参数与是否存在一种特定等位基因形式的所述核苷酸序列或此类等位基因形式的一种特定组合相关联。
41.权利要求40的方法,其中所述植物品种是产纤维植物品种。
42.权利要求41的方法,其中所述产纤维植物品种是棉属植物。
全文摘要
本发明提供了用于在产纤维植物例如棉属植物中调节(即增强或降低)纤维素生物合成和/或纤维品质的嵌合基因,以及利用所述嵌合基因调节纤维素生物合成的方法。本发明还提供了包括本发明的嵌合基因的植物细胞和植物以及此类包括本发明的嵌合基因的植物的种子。本发明还提供了用于在包括一种特定植物品种的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法。
文档编号A01H5/00GK1732262SQ200380105797
公开日2006年2月8日 申请日期2003年12月12日 优先权日2002年12月12日
发明者理查德·威廉森, 乔安妮·伯恩 申请人:澳大利亚国立大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1