多核苷酸及其编码的多肽和用于在表达所述多核苷酸、多肽的植物中用所述多核苷酸、多...的制作方法

文档序号:570822阅读:210来源:国知局
专利名称:多核苷酸及其编码的多肽和用于在表达所述多核苷酸、多肽的植物中用所述多核苷酸、多 ...的制作方法
多核苷酸及其编码的多肽和用于在表达所述多核苷酸、多 肽的植物中用所述多核苷酸、多肽提高非生物胁迫耐受性 和/或生物量和/或产量的方法
发明领域和背景
本发明在其某些实施方案中涉及分离的多肽和多核苷酸,更特别涉及但并非仅涉 及用于用所述多肽和多核苷酸提高植物对非生物胁迫的耐受性、植物生长、生物量、活力和 /或产量的方法。
非生物胁迫(ABS ;也称为“环境胁迫”)条件例如咸度、干旱、洪涝、亚适温和有毒 化学污染,对农作物产生相当大的损害。大部分植物进化出保护自身应对这些条件的策略。 然而,如果胁迫条件的严重程度和持续时间太过,则对植物发育、生长和产量的影响是深远 的。此外,大部分农作物极易受ABS影响,因此对于商业农作物产量而言,最佳生长条件成 为必要。持续暴露在胁迫之中引起植物代谢的严重改变,这种改变最终导致细胞死亡并因 此减产。因此,尽管进行了广泛的研究并采取了强烈的保护农作物的措施,由于非生物胁迫 条件而引起的损失仍以每年数十亿美元计。
干旱是一种渐进现象,其涉及反常的干旱天气时期,此期持续之长足以产生严重 的水失衡,例如农作物损坏及水供应短缺。在严重情况下,干旱可持续多年,对农业和水供 应产生毁灭性影响。由于急剧增长的人口和长期缺乏可用淡水,干旱不仅是农业上与气候 有关的头等问题,而且一直也列为主要自然灾害之一,其不仅引起经济损失(例如1988年 的美国干旱损失超过四百亿美元),而且还引起人的生命丧失,例如1984-1985非洲之角的 干旱引起的饥荒饿死了 750,000人。此外,干旱与对各种疾病的易感性增加有关。
对于大部分农作物来说,世界上的陆地都太干旱了。另外,过度使用可用水导致增 加丧失农业上可用的陆地(沙漠化),土壤中盐积聚增长增加了土壤中可用水的丢失。
咸度,即高盐水平,影响五分之一公顷浇灌土地。这种情形预期只能更糟,将进一 步降低可耕地的可用性和农作物生产,因为排在前五种的粮食作物(即小麦、玉米、水稻、 马铃薯和大豆)没有一种能耐受过量的盐。盐对植物的有害影响起因于导致渗压胁迫(与 干旱胁迫相似)的缺水和过量钠离子对关键生化过程的影响二者。和冰冻及干旱的情况一 样,高盐也导致水分亏缺;高盐的存在使得植物根难于从其环境中吸取水分。因此,土壤咸 度是决定植物能否茁壮成长的更为重要的变量之一。在世界的很多地方,相当大的陆地面 积由于天然的土壤高盐而不能耕种。因此,用于农业生产的土壤的盐化在主要依赖农业的 地区是显著且越来越严重的问题,这一情况由于过度耕种、施肥过多及通常因气候变化和 日益增加的人口需求而引起的缺水而更加恶化。在植物生活周期的早期耐受盐尤其重要, 因为土壤表面的蒸发引起水向上移动并在种植种子的上部土壤层积聚盐。另一方面,发芽 通常发生在高于全体土壤层中平均盐水平的盐浓度下。
很多农作物的发芽对温度敏感。在热条件下可提高发芽的基因可用于在季节晚期 或在热带气候种植的植物。另外,当蒸腾作用不足以应对热胁迫时,暴露于过度热量中的幼 苗及成熟植株可能经历热休克,这可在多种器官中出现,包括叶和尤其是果实。热还损伤 包括细胞器和细胞骨架在内的细胞结构,并削弱膜的功能。热休克可引起总蛋白质合成降低,其伴随热休克蛋白例如伴侣蛋白(chaperone)的表达,这些蛋白参与热变性蛋白的再折叠。
热胁迫通常伴随低可用水条件。热本身被认为是与水分亏缺条件互相影响的胁 迫,并增加水分亏缺条件引起的有害作用。水蒸发需求随日间温度增加表现出接近指数增 加,并可导致蒸腾率高及植物水势低。高温对花粉的损伤几乎总是与干旱胁迫一起发生,很 少在水条件良好的情况下发生。混合胁迫可以新的方式改变植物代谢;因此,理解不同胁迫 间的相互作用对于开发通过遗传操作提高胁迫耐受性的策略很重要。
过分寒冷的条件(例如低温但在冻结温度之上)影响热带来源的农作物,例如大 豆、水稻、玉米和棉花。典型的低温冷害包括萎蔫、坏死、黄萎或离子从细胞膜渗漏。寒冷敏 感性的基础机制尚未完全理解,但很可能涉及膜饱和水平及其它生理缺陷。例如,光合作用 的光抑制(由于高光强导致的光合作用中断)通常在凉寒的夏末/秋天的夜晚之后的清澈 空气条件下发生。另外,寒冷可通过延迟玉米成熟而导致产量损失及产物质量低劣。
水分亏缺是很多植物胁迫的常见组成部分。当整个植物的蒸腾率超过水摄入时, 在植物细胞中发生水分亏缺。除干旱外,还有其它胁迫(例如咸度和低温)使得细胞脱水。
盐胁迫和干旱胁迫的信号转导由离子及渗透稳态信号传导途径组成。盐胁迫的离 子方面经由SOS途径转导信号,在该途径中钙应答性S0S3-S0S2蛋白激酶复合物控制离子 转运蛋白例如SOSl的表达及活性。盐胁迫的渗透组分涉及与干旱和/或冷胁迫应答重叠 的复杂的植物反应。
干旱、寒冷和盐胁迫应答的常见方面[综述于Xiong和aiu(2002)Plant Cell Environ. 25 :131-139]包括(a)在信号传导事件早期细胞质钙水平瞬时变化[Knight,(2000)Int.Rev. Cytol. 195 :269-324 ;Sanders 等(1999)Plant Cell 11 :691-706] ; (b)经 由促分裂原活化的和/或钙依赖性蛋白激酶(CDPK)及蛋白磷酸酶的信号转换[Merlot等(2001)PlantJ. 25 :295-303 ;Tahtiharju 和 PalvaQ001)Plant J. 26 :461-470] ; (c)因响 应胁迫而提高的脱落酸水平触发了一个亚组的应答;(d)作为信号分子的肌醇磷酸(至少 对于一个亚组的胁迫应答性转录变化而言[Xiong等(2001)Genes Dev. 15 :1971-1984]; (e)磷脂酶活化,进而产生一批不同的第二信使分子,其中某些信使分子可能调控胁迫应答 性激酶的活性[例如磷脂酶D ;Frank等O000)Plant Cell 12 :111-124] ; (f)诱导胚胎发 育晚期丰富蛋白(LEA)型基因,所述基因包括CRT/DRE应答性C0R/RD基因;(g)抗氧化剂 及相容的渗压剂(osmolyte)(例如脯氨酸和可溶性糖)的水平提高[Hasegawa等Q000) Annu. Rev. Plant Mol. Plant Physiol. 51 :463-499)];和 Qi)积聚活性氧物质,例如超氧化 物、过氧化氢和羟基自由基。
渗压胁迫以多个步骤调节脱落酸生物合成。ABA依赖性及非ABA依赖性的渗压胁 迫信号转导首先都改变组成型表达的转录因子,这导致早期应答转录激活蛋白表达,然后 所述激活蛋白激活下游胁迫耐受性效应基因。
提高对寒冷或盐胁迫的耐受性的几种基因还可改进干旱胁迫保护,这些基因包括 例如转录因子 AtCBF/DREBl、0sCDPK7 (Saijo 等 2000,Plant J. 23 :319-327)或 AVPl (液泡 焦磷酸酶-质子泵,Gaxiola 等 2001,Proc. Natl. Acad. Sci. USA 98 :11444-11449)。
开发耐受胁迫的植物是有可能解决或调停至少某些这类问题的策略。然而,用于 开发对ABS表现耐受性的植物新品系的传统的植物育种策略效率相对低,因为它们冗长耗时且不能预测结果。此外,用于胁迫耐受性的种质资源有限以及远缘植物种间杂交中的不 相容性是在常规育种中遇到的重要的问题。另外,导致ABS耐受性的细胞过程本质上很复 杂,涉及多种细胞适应机制和众多代谢途径。
本领域业已阐述目标为赋予转基因作物非生物胁迫耐受性的遗传工程的成 就。Apse 禾口 Blumwald(Curr Opin Biotechnol. 13 146-150,2002)、Quesada 等(Plant Physiol. 130 :951-963,2002)、Holmstr6m等(Nature 379 :683-684,1996)、Xu 等(Plant Physiol 110 :249-257,1996), Pilon-Smits 和 Ebskamp(Plant Physiol 107:125-130, 1995)和Tarczynski等(Science 259 =508-510,1993)的研究皆尝试产生胁迫耐受性植 物。
另外,一些美国专利和专利申请也阐述与胁迫耐受性有关的多核苷酸及其在产 生胁迫耐受植物中的应用。美国专利第5,四6,462号和第5,356,816号阐述了用拟南芥 (Arabidopsis thaliana)中编码涉及冷适应的蛋白质的多核苷酸转化植物,以提高耐寒性。
美国专利第6,670,528号阐述了用编码结合胁迫应答元件的多肽的多核苷酸转 化植物,以提高非生物胁迫耐受性。
美国专利第6,720,477号阐述了用编码能够提高转化植物非生物胁迫耐受性的 信号转导胁迫相关蛋白的多核苷酸转化植物。
美国申请顺序号09/938842和10/3422M阐述了非生物胁迫相关基因及其用于赋 予植物对非生物胁迫的耐受性的应用。
美国申请顺序号10/231035阐述了在植物中过表达钼辅因子硫化酶,以提高非生 物胁迫耐受性。
Evogene Ltd.的W02004/104162教导了多核苷酸序列及应用所述多核苷酸序列 提高植物对非生物胁迫的耐受性和/或提高植物的生物量的方法。
Evogene Ltd.的W02007/020638教导了多核苷酸序列及应用所述多核苷酸序列 提高植物对非生物胁迫的耐受性和/或提高植物的生物量、活力和/或产量的方法。
Evogene Ltd.的W02007/049275教导了用于提高植物对非生物胁迫的耐受性和/ 或用于提高植物的生物量、活力和/或产量的分离的多肽、编码所述多肽的多核苷酸。
另外的背景技术包括美国专利申请第20060183137A1 Al号和第20030056M9A1 号。
发明_既述
本发明某些实施方案方面提供提高植物对非生物胁迫的耐受性的方法,所述方法 包括在植物内表达外源多核苷酸,藉此提高植物对非生物胁迫的耐受性,其中所述外源多 核苷酸编码包含与选自以下的氨基酸序列至少90%同源的氨基酸序列的多肽SEQ ID NO 201、207、212、202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供提高植物对非生物胁迫的耐受性的方法,所述方法 包括在植物内表达外源多核苷酸,藉此提高植物对非生物胁迫的耐受性,其中所述外源多 核苷酸编码包含选自以下氨基酸序列的多肽SEQ ID NO :201、207、212、202-206、208-211、 213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供提高植物的生物量、生长率、活力和/或产量的方法,所述方法包括在植物内表达外源多核苷酸,藉此提高植物的生物量、生长率、活力和/ 或产量,其中所述外源多核苷酸编码包含与选自以下的氨基酸序列至少90%同源的氨基 酸序列的多肽:SEQ ID NO :201、207、212、202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供提高植物的生物量、生长率、活力和/或产量的方 法,所述方法包括在植物内表达外源多核苷酸,藉此提高植物的生物量、生长率、活力和/ 或产量,其中所述外源多核苷酸编码包含选自以下的氨基酸序列的多肽SEQ ID NO :201, 207、212、202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供分离的多核苷酸,所述多核苷酸包含与选自以下的 核酸序列至少有 90% 同一性的核酸序列=SEQ IDNO :1530、1561、1532、1531、1562、1533、 1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、1541、1667、1542、 1544、1537、1551、1545、1-200、1653、392-960 和 1656-1659。
本发明某些实施方案方面提供分离的多核苷酸,所述多核苷酸包含选自以下的核 酸序列=SEQ ID NO :1530、1561、1532、1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、 1543、1668、1539、1550、1558、1565、1541、1667、1542、1544、1537、1551、1545、1-200、1653、 392-960 和 1656-1659。
本发明某些实施方案方面提供核酸构建体,所述核酸构建体包含所述分离的多核 苷酸和用于指导所述核酸序列转录的启动子。
本发明某些实施方案方面提供分离的多肽,所述多肽包含与选自以下的氨基酸 序列至少 90% 同源的氨基酸序列=SEQ ID NO :201、207、212、202-206、208-211、213-391、 1655,961-1529 和 1660-1663。
本发明某些实施方案方面提供分离的多肽,所述多肽包含选自以下的氨基酸序 列=SEQ ID NO :201、207、212、202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供植物细胞,所述植物细胞包含外源多肽,所述外源 多肽包含与选自以下的氨基酸序列至少90%同源的氨基酸序列SEQ ID NO :201,207,212, 202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本发明某些实施方案方面提供植物细胞,所述植物细胞包含外源多肽,所述多肽 包含选自以下的氨基酸序列:SEQ ID NO :201、207、212、202-206、208-211、213-391、1655、 961-1529 和 1660-1663。
本发明某些实施方案方面提供植物细胞,所述植物细胞包含外源多核苷酸,所述 外源多核苷酸包含与选自以下的核酸序列至少90%同源的核酸序列SEQ ID NO =1530, 1561、1532、1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、 1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、1541、1667、1542、1544、1537、1551、1545、1-200、1653、392_960和 1656-1659。
本发明某些实施方案方面提供植物细胞,所述植物细胞包含外源多核苷酸,所述 多核苷酸包含选自以下的核酸序列:SEQ ID NO :1530、1561、1532、1531、1562、1533、1538、 1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、1541、1667、1542、1544、 1537、1551、1545、1-200、1653、392-960 和 1656-1659。
根据本发明某些实施方案,所述核酸序列选自SEQ ID NO :1530,1561,1532, 1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、 1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、 1541、1667、1542、1544、1537、1551、1545、1-200、1653、392_960 和 1656-1659。
根据本发明某些实施方案,所述多核苷酸选自SEQ ID NO :1530,1561,1532, 1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、 1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、 1541、1667、1542、1544、1537、1551、1545、1-200、1653、392_960 和 1656-1659。
根据本发明某些实施方案,所述氨基酸序列选自SEQ ID NO :201、207、212、 202-206、208-211、213-391、1655、961-1529 和 1660-1663。
根据本发明某些实施方案,所述多肽选自SEQ ID NO :201、207、212、202_206、 208-211、213-391、1655、961-1529 和 1660-1663。
根据本发明某些实施方案,所述植物细胞形成植物的部分。
根据本发明某些实施方案,所述非生物胁迫选自咸度、干旱、脱水、低温、高温、重 金属毒性、缺氧(anaerobiosis)、营养缺乏、营养过剩、大气污染和UV辐射。
根据本发明某些实施方案,所述方法进一步包括培养在非生物胁迫下表达外源多 核苷酸的植物。
除非另外定义,否则本文所用的所有技术和/或科学术语具有与本发明所属领域 普通技术人员通常理解的一样的含义。尽管在实施或试验本发明实施方案中可使用与本文 所述相似或等同的方法及材料,但下面阐述例示性方法和/或材料。在有冲突的情况下,将 以本专利说明书(包括定义)为准。另外,所述材料、方法和实施例仅为阐明性的,并非必 定为限制性的。
附图简述
本文通过举例并参考附图阐述了本发明的某些实施方案。现在特别详细地提及附 图,要强调的是所示细节仅作为实例,用于说明性地论述本发明的实施方案。在该方面,说 明书并结合附图使得本领域技术人员明白本发明实施方案可如何实施。
在附图中


图1示意性阐明用于表达本发明分离的多核苷酸序列的pGI 二元质粒。RB-T-DNA 的右边界;LB-T-DNA的左边界;H-HindIII限制酶;X-XbaI限制酶;B-BamHI限制酶;S_&ill 限制酶;Sm-SmaI限制酶;R-I-EcoRI限制酶;Sc-SacI/SstI/Ecll36II ;(数字)_碱基对长 度;N0S ρΓο =胭脂氨酸合酶启动子;NPT-II =新霉素(neomycin)磷酸转移酶基因;NOS ter=胭脂氨酸合酶终止子;Poly-A信号(聚腺苷酸化信号);⑶Sintron-GUS报告基因 (编码序列和内含子)。将本发明分离的多核苷酸序列克隆到载体,同时取代GUSintron报 告基因。
图加-b为描述显现在透明的琼脂板中生长的植物根发育的图像。不同的转基因 在透明琼脂板中生长17天,在第7天开始每2天给琼脂板照相。图2a-在琼脂板上12天 后所摄的植物照片图像。图2b-根分析图象,其中所测量的根长由红色箭头表示。
发明详述
本发明在其某些实施方案中涉及分离的多肽和编码所述多肽的多核苷酸,更特别 涉及但并非仅涉及用所述多肽和多核苷酸提高对非生物胁迫的耐受性、植物的生长率、产 量、生物量和/或活力的方法。
在详细阐明至少一个本发明实施方案之前,应该理解,本发明在其应用方面不一 定限制在以下说明所提出的或通过实施例所例证的详细资料。本发明可以是其它实施方 案,或可以通过多种方式来实行或实施。
在实施本发明时,本发明人业已鉴定了新的多肽及多核苷酸,它们可用于提高对 非生物胁迫的耐受性并改进植物的生长率、生物量、产量和/或活力。
因此,如以下实施例部分所示,本发明人采用生物信息学方法并鉴定了可提高对 非生物胁迫的耐受性及改进生长、生物量、产量和活力的多核苷酸及多肽(对于多核苷酸 为 SEQ ID NO 1-200 及 1653 ;对于多肽为 SEQ ID NO =201-391 及 1655 ;实施例 1 表 1),所 述生物信息学方法联合来自拟南芥、水稻和其它公开获得的植物基因组数据库、表达序列 标签(EST)、蛋白质和途径数据库及具有数字表达谱(digitalexpression profile)( “电 子RNA印迹”)的QTL信息的序列聚类(clustering)及拼接(assembly)。通过比对直向 同源物序列和数字表达谱,鉴定了来自单子叶物种的推定的ABST直向同源物(对多核苷 酸为 SEQ IDNO :392-960、1656-1659 ;对多肽为 SEQ ID NO :961_1529、1660-1663 ;实施例 1表2)。如以下实施例部分中表3及表4进一步阐述,克隆了代表性的多核苷酸(多核苷 酸SEQ ID NO :1530、1538、1532、1549、1665、1566、1554、1563、1557、1561、1564、1534、1536、 1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543 和 1668)。制备了具 有优化核酸序列的另外的多核苷酸(多核苷酸SEQ ID N0:1531、1539、1533、1550、1558、 1562、1565、1541、1667、1542、1544、1537、1551 和 1545)。如以下实施例部分中的进一步阐 述,产生了外源表达所述已克隆的和/或优化的本发明多核苷酸的转基因植物。如表5-76 所述,当这些植物在渗压胁迫(在25% PEG存在下)、氮缺乏(在0. 75mM氮存在下)或常 规条件下生长时,表现出幼苗重量、根覆盖、根长和相对生长率的增加。另外,如表77-188 所示,当外源性表达本发明多核苷酸的植物在咸度胁迫或正常条件下生长时,表现出叶丛 面积(rosette area)、叶丛直径(rosette diameter)、叶平均面积、以上所述的相对生长 率、植物生物量、植物种子产量、种子千粒重和收获指数的增加。总之,这些结果提示本发明 新的多核苷酸及多肽用于提高非生物胁迫的耐受性及增加植物的生长率、生物量、活力和/ 或产量的用途。
因此,本发明一方面提供提高非生物胁迫耐受性、植物的生长率、生物量、产量和/ 或活力的方法。所述方法通过在植物内表达外源多核苷酸来实现,所述外源多核苷酸编码 包含与选自以下的氨基酸序列至少60%同源的氨基酸序列的多肽SEQ ID NO :201,207, 212、202-206、208-211、213-391、1655、961-1529 和 1660-1663。
本文所用短语“非生物胁迫”指对植物代谢、生长、繁殖和/或生存力的任何不利 作用。因此,非生物胁迫可由亚适环境生长条件诱导,所述条件例如咸度、脱水、水分亏缺、 干旱、漫灌、冷冻、低温或高温(例如寒冷或过热)、有毒化学污染、重金属毒性、缺氧、营养 缺乏、营养过剩、大气污染或UV辐射。非生物胁迫的含义论述于背景章节中。
本文所用短语“非生物胁迫耐受性”指植物耐受非生物胁迫而在代谢、生长、生产力和/或生存力方面不经受实质改变的能力。
本文所用短语“植物生物量”指植物在生长季节产生的组织的量(以风干或干燥 组织的克数来测量),它还能决定或影响植物产量或单位生长面积产量。
本文所用短语“植物产量”指每一植物或每一生长季节产生或收获的组织的量 (以重量、体积或尺寸来测量)或数量(数字)。因此,增加产量能影响人们可从在某一生 长面积和/或生长时间的植物获得的经济利益。
本文所用短语“植物活力”指在特定时间植物产生的组织的量(以重量来测量)。 因此,增加活力可决定或影响植物产量或每个生长时间或生长面积的产量。
本文所用术语“增加”指与天然植物[即未用本发明生物分子(多核苷酸或多肽) 改良的植物,例如在同样生长条件下生长的同样物种的非转化植物]比较,在植物非生物 胁迫耐受性、生长、生物量、产量和/或活力方面增加至少约2%、至少约3%、至少约4%、至 少约5%、至少约10%、至少约15%、至少约20%、至少约30%、至少约40%、至少约50%、 至少约60 %、至少约70 %、至少约80 %或更多。
本文所用短语“外源多核苷酸”指自然状态下不可在所述植物中表达或者需要在 所述植物中过表达的异源核酸序列。可以以稳定或瞬时方式将外源多核苷酸引入到植物 中,以便产生核糖核酸(RNA)分子和/或多肽分子。应该注意,外源多核苷酸可包含与所述 植物的内源核酸序列相同或部分同源的核酸序列。
如所述,本发明外源多核苷酸编码多肽,所述多肽具有与选自SEQID NO :201、207、 212、202-206、208-211、213-391、1655、961-1529 和 1660-1663 的氨基酸序列具有以下同源 性的氨基酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少 约81 %、至少约82 %、至少约83 %、至少约84 %、至少约85 %、至少约86 %、至少约87 %、至 少约88 %、至少约89 %、至少约90 %、至少约91%、至少约92 %、至少约93 %、至少约94 %、 至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多例如100%。
可用任何同源性比较软件来测定同源性(例如同源性百分比),所述软件包括例 如当从多肽序列开始时例如通过用缺省参数的美国生物技术信息中心(NCBI)的BlastP 或TBLASTN软件;或例如通过用缺省参数的tBLASTX算法(可由NCBI获得),其在蛋白质 序列数据库中比较核苷酸查询序列(两条链)的六种读框概念翻译产物。
同源序列包括直向同源序列和旁系同源序列两种序列。术语“旁系同源”涉及在 物种的基因组内的基因复制,产生平行进化同源基因。术语“直向同源”涉及在不同生物体 内因祖先亲缘关系产生的同源基因。
在单子叶植物种中鉴定直向同源物的一个选择是实施交互blast搜索 (reciprocal blast search)。这可通过涉及在任何序列数据库(例如公开获得的NCBI 数据库,可在此处找到http://WWW.ncbi.nlm.nih. gov)中搜索(blasting)目的序列的 第一次blast来进行。如果搜索水稻的直向同源物,则在例如可从NCBI得到的来自水稻 日本晴(Oryza sativaNipponbare)的沘,469全长cDNA克隆中搜索目的序列。可筛选 blast结果。然后在目的序列所来源的生物体序列中搜索(第二次blast)经筛选的结果 或未经筛选的结果的全长序列。然后比较第一次blast和第二 blast的结果。当在第一 次blast中产生最高分值(最佳击中(best hit))的序列在第二次blast中鉴定出作为 最佳击中的所述查询序列(初始目的序列)时,则鉴定出直向同源物。用同样推理来发现旁系同源物(与同一生物体中的基因同源)。在大序列家族情况下,可使用ClustalW程序 (http://ffffff. ebi. ac. uk/Tools/clustalw2/index. html),接着用帮助显现聚类的邻接进 化树(neighbor-joining tree) (http://en.wikipedia.org/wiki/Neighbor-joining)。
根据本发明某些实施方案,外源多核苷酸编码由SEQ ID NO :201、207、212、 202-206、208-211、213-391、1655、961-1529、1660-1662 或 1663 所示的氨基酸序列组成的 多肽。
根据本发明某些实施方案,外源多核苷酸包含与选自以下的核酸序列有至少约 60 %、至少约65 %、至少约70 %、至少约75 %、至少约80 %、至少约81%、至少约82 %、至少 约83 %、至少约84 %、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少约89 %、至 少约90 %、至少约91%、至少约92 %、至少约93 %、至少约93 %、至少约94 %、至少约95 %、 至少约96%、至少约97%、至少约98%、至少约99%、例如100%同一性的核酸序列SEQ ID NO 1530、1561、1532、1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、 1534、1536、1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、 1539、1550、1558、1565、1541、1667、1542、1544、1537、1551、1545、1-200、1653、392-960 和 1656-1659。
可用任何同源性比较软件测定同一性(例如同源性百分比),所述软件包括例如 通过用缺省参数的美国生物技术信息中心(NCBI)的BlastN软件。
根据本发明某些实施方案,外源多核苷酸为与选自以下的多核苷酸有至少约 60 %、至少约65 %、至少约70 %、至少约75 %、至少约80 %、至少约81%、至少约82 %、至少 约83 %、至少约84%、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少约89 %、至 少约90 %、至少约91%、至少约92 %、至少约93 %、至少约93 %、至少约94%、至少约95 %、 至少约96%、至少约97%、至少约98%、至少约99%、例如100%同一性的多核苷酸SEQ ID NO 1530、1561、1532、1531、1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、 1534、1536、1552、1553、1666、1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、 1539、1550、1558、1565、1541、1667、1542、1544、1537、1551、1545、1-200、1653、392-960 和 1656-1659。
根据本发明某些实施方案,外源多核苷酸由SEQ ID NO :1530、1561、1532、1531、 1562、1533、1538、1549、1665、1566、1554、1563、1557、1564、1534、1536、1552、1553、1666、 1547、1548、1556、1559、1560、1654、1555、1540、1543、1668、1539、1550、1558、1565、1541、 1667、1542、1544、1537、1551、1545、1-200、1653、392-960 和 1656-1658 或 1659 所示。
本文所用术语“多核苷酸”指单链或双链核酸序列,其以RNA序列、互补多核苷酸 序列(cDNA)、基因组多核苷酸序列和/或复合多核苷酸序列(例如以上多核苷酸序列的组 合)的形式分离及提供。
本文所用短语“互补多核苷酸序列”指用逆转录酶或任何其它依赖RNA的DNA聚 合酶从信使RNA逆转录而产生的序列。所述序列可随后在体内或在体外用依赖DNA的DNA 聚合酶扩增。
本文所用短语“基因组多核苷酸序列”指源自染色体(从染色体鉴定或分离)的 序列,因此其代表染色体的一个连续部分。
本文所用短语“复合多核苷酸序列”指至少部分为互补序列及至少部分为基因组序列的序列。复合序列可包括编码本发明多肽所需的某些外显子序列以及插入其间的某些 内含子序列。内含子序列可为任何来源,包括其它基因,通常包括保守剪切信号序列。所述 内含子序列可进一步包括顺式作用表达调控元件。
可优化编码本发明多肽的核酸序列以用于表达。在SEQ ID NO :1531中提供优化 核酸序列的非限制性实例,其编码包含SEQ ID NO :201所示氨基酸序列的多肽。这种序列 修饰的实例包括但不限于改变G/C含量,以便更接近通常在目的植物物种中发现的含量; 除去在所述植物物种中发现的非典型的密码子,通常称为密码子优化。
短语“密码子优化”指选择在接近目的植物内的密码子用法的结构基因或其片段 内使用的合适的DNA核苷酸。因此,优化的基因或核酸序列指其中天然或天然存在的基因 的核苷酸序列已被修饰以便在所述植物内使用统计上优选或统计上偏爱的密码子的基因。 通常在DNA水平检查核苷酸序列,并用任何合适的程序确定经优化用于在该植物物种中表 达的编码区,所述合适程序例如如在Sardana等(1996,PlantCell Reports 15:677-681) 中所述。在该方法中,可通过首先发现天然基因的每一密码子相对于高表达植物基因的密 码子的用法的平方比例偏差(squared proportional deviation),接着计算平均方差来计 算密码子用法标准偏差(密码子使用偏爱的量度)。所用公式为lSDCU = n= 1Ν
2/Ν,其中&指高表达植物基因中密码子η的使用频率,其中为目的基因中密码子η 的使用频率,N指目的基因中密码子的总数。用Murray等的数据(1989,Nuc Acids Res. 17 477-498)汇编了来自双子叶植物的高表达基因的密码子用法表。
根据特定植物细胞类型的优选密码子用法优化核酸序列的一种方法基于直 接使用密码子优化表,而不实施任何额外的统计计算,密码子优化表例如通过日本的 NIAS (National Institute of AgrobiologicaSiences) DNA 库在密码子用法数据库中在线 提供的那些密码子优化表(http://ffffff. kazusa. or. jp/codon/)。密码子用法数据库含有用 于多种不同物种的密码子用法表,每一密码子用法表基于Genbank中所存在的数据经统计 学上确定。
可通过使用上述表来确定特定物种(例如水稻)中对每种氨基酸最优选或最偏爱 的密码子,对编码目的蛋白的天然核苷酸序列针于该特定植物物种进行密码子优化。这可 通过用相应的密码子(对于氨基酸在统计学上更偏爱)取代在特定物种基因组中可具有低 统计学发生概率的密码子来实现。然而,可挑选一个或更多个较低偏爱的密码子来删除现 有的限制位点,以在潜在有用的接点制造新的限制位点(用以加入信号肽或终止盒的5' 和3'端,或可用于切割及将区段剪接在一起以形成正确的全长序列的内部位点),或以消 除可能负面影响mRNA稳定性或表达的核苷酸序列。
在任何修饰之前,天然存在的编码核苷酸序列可以已经含有多个对应于特定植物 物种中的统计学偏爱密码子的密码子。因此,天然核苷酸序列的密码子优化可包括确定在 天然核苷酸序列内对于特定植物哪些密码子不是统计学偏爱的密码子,并根据特定植物的 密码子用法表修改这些密码子以产生密码子优化的衍生物。经修饰的核苷酸序列可全部或 部分地根据植物密码子用法进行优化,前提为经修饰的核苷酸序列所编码的蛋白质以比由 相应的天然存在的或天然的基因所编码的蛋白质更高的水平产生。通过改变密码子用法构 建合成基因阐述于例如PCT专利申请93/07278中。
因此,本发明包括上文所述核酸序列、其片段、可与其杂交的序列、与其同源的序列、具有不同密码子用法的编码相似多肽的序列、特征为突变的改变的序列,所述突变例如 缺失、插入或置换一个或更多个核苷酸,可为天然存在的或人工诱导的突变,可为随机或定 向方式突变。
本发明提供分离的多肽,所述多肽具有与选自SEQ ID NO :201、207、212、202_206、 208-211、213-391、1655、961-1529和1660-1663的氨基酸序列有以下同源性的氨基酸序 列至少约60 %、至少约65 %、至少约70 %、至少约75 %、至少约80 %、至少约81%、至少约 82 %、至少约83 %、至少约84%、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少 约89 %、至少约90 %、至少约91%、至少约92 %、至少约93 %、至少约93 %、至少约94 %、至 少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高,例如为100%。
根据本发明某些实施方案,所述多肽由SEQ ID NO :201、207、212、202_206、 208-211、213-391、1655、961-1529 和 1660-1662 或 1663 所示。
本发明还包括上述多肽的片段及具有突变的多肽,所述突变例如缺失、插入或置 换一个或更多个氨基酸,为天然存在的或人工诱导的突变,为随机或定向方式的突变。
本文所用术语“植物”包括整株植物、所述植物的祖先及后代和植物部分,包括 种子、苗(shoot)、茎、根(包括块茎)和植物细胞、组织和器官。植物可呈任何形式,包 括悬浮培养物、胚、分生组织区、愈伤组织、叶、配子体、孢子体、花粉和小孢子。在本发明 方法中尤其有用的植物包括属于绿色植物(Viridiplantae)超科(superfamily)的所有 植物,尤其是单子叶植物和双子叶植物,包括选自包含以下植物名单的豆科牧草(fodder or forage legume)、观赏植物、粮食作物、乔木或灌木金合欢属(Acacia spp.)、槭属 (Acer spp·)、猕猴桃属(Actinidia spp·)、七叶树属(Aesculus spp·)、澳大利亚贝壳 杉(Agathis australis)、合欢(Albizia amara)、兰山与笔筒树(Alsophila tricolor)、 须芒草属(Andropogonspp.)、落花生属(Arachis spp)、模榔(Areca catechu)、Astelia fragrans>0Hf^^^; (Astragalus cicer) >^zhBf(Baikiaea plurijuga)属(Betula spp.) pfM (Brassica spp.) >7^1 (Bruguiera gymnorrhiza)、·{白克苏7^ (Burkea africana) > I5P (Butea frondosa) > Cadaba farinosa> M^t^M (Calliandra spp)、大叶茶(Camellia sinensis)、美人蕉(Cannaindica)、辣椒属(Capsicum spp.)、决明 属(Cassia spp. ) >5M|l|j3. (Centroemapubescens) > Chacoomeles spp.、肉t圭(Cinnamomum cassia)、小果咖啡(Coffea arabica)、可乐豆木(Colophospermum mopane)、变异小冠 (Coronillia varia) > Cotoneaster serotina> ill 禾查属(Crataegus spp·)、/R M (Cucumis spp.)、柏木属(Cupressus spp.)、白粉丰沙椤蕨类(Cyatheadealbata)、温梓 (Cydonia oblonga)、臼本柳杉(Cryptomeria japonica)、香茅属(Cymbopogon spp·)、 白粉丰沙 罗虫朱(Cynthea dealbata)、才显丰孛(Cydoniaoblonga) > Dalbergia monetaria、大口十 骨碎补(Davallia divaricata)、山马蝗属(Desmodium spp·)、粗糙蛘壳蕨(Dicksonia squarosa)、Dibeteropogonamplectens、油麻藤属(Dioclea spp·)、键扁豆属(Dolichos spp. ) > Dorycnium rectum、金字塔禾卑(Echinochloa pyramidalis) > Ehraffia spp.、龙 JTl 禾§ (Eleusine coracana) > IHl jg ^ M (Eragrestis spp.)、束Ij 桐属(Erythrinaspp.)、 ^ 属(Eucalypfus spp. ) > Euclea schimperi> Eulalia vi/losa> ^ ^ M (Pagopyrum spp.)、费约果(Fei joa sellowlana)、草莓属(Fragaria spp·)、千斤拔属(Flemingia spp.) > Freycinetia banksli、老鹤草(Geraniumthunbergii)、银杏(GinAgo biloba)、野黄豆(Glycine javanica)、Gliricidiaspp.、陆地棉(Gossypium hirsutum)、银禅 属(Grevillea spp.)、非洲红木(Guibourtia coleosperma)、岩黄蔑属(Hedysarum spp.)、Hemaffhiaaltissima、Heteropogon contoffus、大麦(Hordeum vulgare)、红 苟茅(Hyparrhenia rujfa)、小连 S (Hypericum erectum)、Hypeffhelia dissolute、 Indigo incamata、;^■属(Iris spp.) Λ Leptarrhena pyrolifolia、古月枝子属(Lespediza spp·)、萬苣属(Lettuca spp·)、银合欢(Leucaena leucocephala)、Loudetia simplex、 Lotonus bainesli、百脉根属(Lotus spp.)、大结豆(Macrotyloma axillare)、苹果 属(Malus spp.)、木薯(Manihot esculenta)、紫花苜猜(Medicago saliva)、水杉 (Metasequoia glyptostroboides)、大蕉(Musa sapientum)、烟草属(Nicotianum spp·)、 驴食豆属(Onobrychisspp.)、鸟足豆属(Ornithopus spp.)、稻属(Oryza spp.)、非洲双翼 豆(Peltophorum africanum)、各良尾草属(Pennisetum spp.)、鱼辱_ (Perseagratissima) Λ 碧冬 JHjM (Petunia spp·)、菜豆属(Phaseolus spp·)、针奏(Phoenix canariensis) λ§τ 西兰佥J 麻(Phormium cookianum)、石 |南属(Photinia spp·)、白云杉(Picea glauca)、 松属(Pinus spp.)、豌豆(Pisumsativam),新西兰罗汉松(Podocarpus totara)、 Pogonarthria fleckii、Pogonaffhria squarrosa、杨属(Populus spp.)、 iK 豆 M (Prosopis cineraria)、花方萁松(Pseudotsuga menziesii)、Pterolobium stellatum、西洋 梨(Pyruscommunis)、栎属(Quercus spp·)、厚叶石斑木(Rhaphiolepsis umbellata)、美 味棒花棕(Rhopalostylis sapida)、纳塔尔盐肤木(Rhus natalensis)、欧洲醋栗(Ribes grossularia)、醋栗属(Ribes spp·)、洋槐(Robiniapseudoacacia)、蔷礙属(Rosa spp·)、 悬钩子属(Rubus spp.)、柳属(Salixspp.)、红裂禾孚草(Schyzachyrium sanguineum)、 金丰公(Sciadopitysvefficillata) Λ 匕美红杉(Sequoia sempervirens) Λ 3匕美巨杉 (Sequoiadendrongiganteum)、两色蜀黍(Sorghum bicolor)、菠菜属(Spinacia spp·)、 Sporobolus fimbriatus、Stiburus alopecuroides、矮笔花豆(Stylosanthoshumilis)、 葫芦荼属(Tadehagi spp.)、落羽松(Taxodium distichum)、阿拉伯黄背草(Themeda triandra)、$ 车由胃 jg (Trifolium spp. )、/]、* (Triticumspp.) λ ^ Pf ^ ^ (Tsuga heterophylla)、越桔属(Vaccinium spp·)、里予豌豆属(Vicia spp·)、葡萄(Vitis vinifera)、维穗沃森花(Watsonia pyramidata)、马蹄莲(Zantedeschia aethiopica)、 玉米(Zea mays)、苋属植物、洋蓟(Artichoke)、芦笋、青花椰菜、孢子甘蓝(Brussels sprouts)、卷心菜、油菜、胡萝卜、花椰菜、芹菜、羽衣甘蓝(collard greens)、亚麻、球茎甘 蓝、小扁豆、芸苔、黄秋葵、洋葱、马铃薯、水稻、大豆、稻杆(straw)、甜菜、甘蔗、向日葵、番 茄、squash tea、玉米、小麦、大麦、黑麦、燕麦、花生、豌豆、小扁豆和紫花苜蓿、棉花、油菜 籽、油菜、胡椒、向日葵、烟草、茄子、桉树、树、观赏植物、多年生草和饲草作物。或者,藻类及 其它非绿色植物可用于本发明方法。
根据本发明某些实施方案,本发明方法所用的植物为农作物,例如水稻、玉米、小 麦、大麦、花生、马铃薯、芝麻、橄榄树、棕榈油、香蕉、大豆、向日葵、油菜(cmola)、甘蔗、紫 花苜蓿、黍、豆科(Ieguminosae)(菜豆、豌豆)、亚麻、羽扇豆、油菜籽、烟草、白杨(popular) 和棉花。
通过用外源多核苷酸转化一种或更多种植物细胞,接着从转化细胞产生成熟植 株,并在适于在该成熟植株内表达该外源多核苷酸的条件下栽培该成熟植株,来实现在植物内表达本发明外源多核苷酸。
根据本发明某些实施方案,通过将核酸构建体导入植物细胞中来实现转化,所述 核酸构建体包括本发明某些实施方案的外源多核苷酸和至少一个能够指导外源多核苷酸 在植物细胞内转录的启动子。下文提供合适转化方法的更详细资料。
本文所用术语“启动子”指位于基因转录启动位点上游的DNA区,RNA聚合酶结合 该区以启动RNA转录。启动子控制基因表达的位置(例如在植物的哪一部分)和/或时间 (例如在生物体的哪一阶段或何种条件)。
本发明核酸构建体可使用任何合适的启动子序列。根据本发明某些实施方案,启 动子为组成型启动子、组织特异性或非生物胁迫诱导型启动子。
合适的组成型启动子包括例如CaMV 35S启动子(SEQ IDNO 1546 ;Odell等, Nature 313 :810-812,1985);拟南芥 At6669 启动子(SEQ ID NO 1652 ;参见 PCT
发明者A·迪伯, B·J·维诺库尔, D·迪马特, E·伊曼纽尔, G·罗南, H·卡奇, M·冈, S·阿亚尔 申请人:伊沃基因有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1