人造叶绿体转运肽的制作方法

文档序号:244514阅读:460来源:国知局
人造叶绿体转运肽的制作方法
【专利摘要】本公开涉及用于将肽、多肽和蛋白质导向至含质体细胞的质体的组合物及方法。在一些实施方案中,本公开涉及可以将多肽引导到质体的叶绿体转运肽以及编码它的核酸分子。在一些实施方案中,本公开涉及包含叶绿体转运肽的转基因植物材料(如转基因植物)的制备方法,以及通过这样的方法制备的植物材料,以及由此制备的植物产品。
【专利说明】人造叶绿体转运肽
[0001] 优先权要求
[0002] 本申请要求2012年2月1日提交的美国临时专利申请系列号No. 61/593, 555以 及2012年4月17日提交的美国临时专利申请系列号No. 61/625, 222的优先权。
[0003] 根据37C. F. R. § 1. 821 (c)或(e)-以ASCII文本文件提交的序列表的声明
[0004] 根据37C. F. R. § 1. 821 (C)或(e),含ASCII文本版本序列表的文件已经随同本申 请一起提交,其内容作为参考在此引入。

【技术领域】
[0005] 本公开涉及用于基因编码和表达多肽的组合物和方法,该多肽导向至含质体细胞 的质体。在某些实施方案中,本公开涉及将多肽导向至(例如高等植物的)叶绿体的氨基 酸序列,和/或编码该氨基酸序列的核酸分子。在某些实施方案中,本公开涉及包含嵌合多 肽,其包含控制该嵌合多肽至质体的转运的氨基酸序列,和/或编码该嵌合多肽的核酸分 子。

【背景技术】
[0006] 植物细胞含有不同的亚细胞器,一般称为"质体",其由特征性膜体系界定,并且在 细胞内实施特殊功能。特定的质体参与了光合作用以及一些化合物的合成和储存。所有的 质体都衍生自存在于植物分生区中的前质体(Proplasmid)。前质体可以发育成为例如:叶 绿体、黄化体、质体、老质体(gerontoplast)、白色体、淀粉体、脂质体和蛋白质体。质体以细 胞内的半自主方式存在,含有它们自己的遗传体系和蛋白质合成机制,但是在它们的发育 和生物合成活性方面依赖于与核质系统的紧密合作。
[0007] 在1?等植物的光合叶细胞中,最引人注目的质体为叶绿体。叶绿体最必要的功能 为实施光合作用的光驱动反应。但是,叶绿体还实施许多其它的对植物细胞重要的生物合 成过程。例如,所有的细胞脂肪酸由位于叶绿体基质中的酶使用这里可获得的ATP、NAOPH 和糖类来制造。此外,光活化电子的还原能力驱使叶绿体中的亚硝酸根(NO2O还原成氨 (NH3);该氨向植物提供氨基酸和核苷酸的合成所必需的的氮。
[0008] 叶绿体也参与了农业化学工业的特别重要的过程中。例如,已知的是许多除草剂 通过在叶绿体内进行的阻断功能而起作用。近来的研究已经识别出一些除草剂的特异性靶 标。例如,三嗪衍生的除草剂通过将质体醌分子从其在光合体系的32kD多肽中的结合位点 置换来抑制光合作用。该32kD多肽在叶绿体基因组中编码,并且通过细胞器机构进行合 成。已经获得了对抗三嗪除草剂的突变植物。这些植物含有突变32kD多肽,由此质体醌不 再被三嗪除草剂所置换。磺酰脲类化合物抑制叶绿体中的乙酰乳酸合酶。乙酰乳酸合酶参 与异亮氨酸和缬氨酸的合成。草甘膦抑制5-烯醇式丙酮酰-3-莽草酸合酶(EPSPS)的功 能,后者为参与芳香族氨基酸合成的酶。所有这些酶均由细胞核基因组编码,但是它们易位 进入叶绿体中,在这里发生实际的氨基酸合成。
[0009] 大多数叶绿体蛋白质在植物细胞核中编码,在细胞质中合成为较大的前体,并且 在翻译后输入至叶绿体中。穿过外被膜和内被膜输入进入基质是以基质、类囊体膜和类囊 体腔为目的地的蛋白质的主要进入方式。输入的前体蛋白质定位至类囊体膜和类囊体腔是 通过四种不同的机制完成的,包括与细菌蛋白质运输体系同源的两种。因此,蛋白质在叶绿 体中定位的机制部分地源自原核内共生体。Cline and Henry (1996)Annu. Rev. Cell. Dev. Biol. 12:1-26。
[0010] 以叶绿体表达为目标的前体蛋白质包含被称作叶绿体转运肽(CTPs)的N-末端延 伸。转运肽对于特异性识别叶绿体表面、以及在介导前蛋白翻译后迁移穿过叶绿体被膜并 从叶绿体被膜到达叶绿体内的各种亚室(例如,基质,类囊体和类囊体膜)中有帮助。这些 N-末端转运肽序列包含将叶绿体蛋白质输入至质体中的所有必要信息;转运肽序列对于 质体运输是充分必要的。
[0011] 报道在其N-末端具有天然编码的转运肽序列的植物基因包括叶绿体小亚单位的 核酮糖_1,5-二憐酸羧化酶(RuBisCo) (de Castro Silva-Filho et al. (1996)Plant Mol. Biol. 30:769-80 ;Schnell et al. (1991) J. Biol. Chem. 266:3335-42) ;EPSPS(参见,例如, Archer et al. (1990) J.Bioenerg. and Biomemb. 22:789-810 和美国专利 US6, 867, 293、 7, 045, 684 和 Re. 36, 449);色氨酸合酶(Zhao et al. (1995) J. Biol. Chem. 270:6081-7); 质体蓝素 (Lawrence et al. (1997) J. Biol. Chem. 272:20357-63);分支酸合酶(Schmidt et al. (1993) J. Biol. Chem. 268:27447-57);捕光叶绿素 a/b 结合蛋白(LHBP) (Lamppa et al. (1988) J. Biol. Chem. 263:14996-14999);和拟南芥(Arabidopsis thaliana)叶绿体蛋 白质(Lee et al. (2008)Plant Cell 20:1603-22)。美国专利公开 US2010/0071090 提供了 来自衣藻属(Chlamydomonas sp.)的一些叶绿体导向肽。
[0012] 然而,尽管可能存在不同亚组的具有独立结构基序的叶绿体导向肽,由于叶绿体 导向肽的高度序列多样性且缺乏共同或一致的序列基序,叶绿体导向肽编码的信息的结构 要求仍然难以把握。Lee et al. (2008),同上。而且,不是所有这些序列都已经用于在高等 植物中异源表达导向叶绿体。


【发明内容】

[0013] 本文描述的是用于植物中多肽的质体导向的组合物和方法。在一些实施方案中, 组合物包含如下的核酸分子,该核酸分子包括至少一种编码可操作地连接于感兴趣的核苷 酸序列的人造叶绿体转运肽(例如,TraP23肽)的核苷酸序列。在具体的实施方案中,这 样的核酸分子可以用于在单子叶植物和双子叶植物中表达并导向由感兴趣的核苷酸序列 编码的多肽。本文进一步描述了包含如下核酸分子的载体,该核酸分子包含可操作地连接 于感兴趣的核苷酸序列的至少一个编码人造转运肽的核苷酸序列。
[0014] 在一些实施方案中,编码人造 CTP的核苷酸序列可以是从参考核苷酸序列衍生 的核苷酸序列,或其功能性变体,其中参考核苷酸序列是从多种5-烯醇式丙酮酰莽草 酸-3-磷酸合成酶(EPSPS)比对获得的。在一些实施方案中,编码人造 CTP的核苷酸序列可 以是包含来自不同生物体的部分CTP编码核苷酸序列的核苷酸序列,或其功能性变体。在 特定的实施方案中,编码人造 CTP的核苷酸序列可以含有从每个参考EPSPS CTP、或任一前 述的功能性变体得到的连续核苷酸序列。在这些和进一步的实施方案中,编码人造 CTP的 核苷酸序列可以是包含多于一个编码CTP的核苷酸序列的核苷酸序列。
[0015] 在一些实例中,编码人造 CTP的核苷酸序列可以是包含来自EPSPS酶的部分CTP 核苷酸序列或其功能性变体的核苷酸序列。在具体的实施方案中,编码人造 CTP的核苷酸 序列可以含有由EPSPS酶得到的连续核苷酸序列或其功能性变体。
[0016] 在一些实施方案中,组合物包含如下的核酸分子,该核酸分子包含至少一种自 EPSPS衍生的用于将多肽导向至叶绿体的手段。进一步描述了多个核酸分子,它们中包含如 下核酸分子:该核酸分子包含至少一个自EPSPS衍生的用于将多肽导向至叶绿体的手段, 其可操作地连接于感兴趣的核苷酸序列。在具体的实施方案中,这种核酸分子可以用于在 单子叶植物和双子叶植物中表达并导向由感兴趣的核苷酸序列编码的多肽。为了公开的目 的,自EPSPS衍生的用于将多肽导向至叶绿体的手段是指特定的人造核苷酸序列。在具体 的实施方案中,自EPSPS衍生的用于将多肽导向至叶绿体的手段选自本文称为TraP23的核 苷酸序列。
[0017] 本文还描述了包含如下核酸分子的植物材料(例如且不限于,植物,植物组织和 植物细胞),该核酸分子包含至少一个可操作地连接于感兴趣的核苷酸序列的编码人造 CTP的核苷酸序列。在一些实施方案中,植物材料在其基因组中可以具有稳定整合的此类核 酸分子。在一些实施方案中,植物材料可以瞬时表达如下的核酸分子的产物,该核酸分子包 含至少一个可操作地连接于感兴趣的核苷酸序列的编码人造 CTP的核苷酸序列。在一些实 施方案中,所述植物材料为不能再生以生成植物的植物细胞。
[0018] 还描述了用于在含质体细胞(例如植物)中在所述细胞的质体(例如叶绿体)中 表达核苷酸序列的方法。在具体的实施方案中,可以用包含至少一个可操作地连接于感兴 趣的核苷酸序列的编码人造 CTP的核苷酸序列的核酸分子转化植物细胞,使得在植物细胞 的细胞质中产生前体融合多肽,前体融合多肽包含与该感兴趣的核苷酸序列的表达产物融 合的人造 CTP,并且然后该融合多肽体内被运输至植物细胞的叶绿体中。在这种方法的一些 实施方案中,植物细胞不能再生以生成植物。
[0019] 进一步描述了用于制备包含如下核酸分子的转基因植物的方法,该核酸分子包含 至少一个可操作地连接于感兴趣的核苷酸序列的编码人造 CTP的核苷酸序列。还描述了由 该转基因植物制备的植物商业产品(例如,种子)。
[0020] 前述和其他特征将由下文对一些实施方案并参考附图的详细说明变得更加明了。
[0021] 附图简要说明
[0022] 图1显示的是mRNA分子,它们代表了可操作地连接于感兴趣的核苷酸序列的、编 码人造 CTP的核苷酸序列(例如,TraP23)的特定实例。在一些实施方案中,mRNA分子(如 所显示的这些)可以从如下的DNA分子转录,该DNA分子包含开放阅读框,该阅读框包括可 操作地连接于感兴趣的核苷酸序列的编码人造 CTP的序列。该感兴趣的核苷酸序列在一些 实施方案中可以是编码感兴趣的肽的序列,感兴趣的肽例如但不限于,要导向至质体的标 志物基因产物或肽。
[0023] 图2显示了多个EPSPS叶绿体转运肽序列的比对。带阴影的氨基酸残基表明为 TraP23选择的氨基酸序列。
[0024] 图3显示了 pDAB107640的质粒图谱。
[0025] 图4显示了 TraP23_GFP渗透进入烟草叶组织的显微图片。
[0026] 图5显示了 pDAB106598的质粒图谱。
[0027] 图6显示了 TraP23_GFP转化进入玉米原生质体的显微图片,显示转运进入玉米原 生质体的叶绿体。
[0028] 图7显示了 pDAB109808的质粒图谱。
[0029] 图8显示了 pDAB107687的质粒图谱。

【具体实施方式】
[0030] I. 一些实施方案的概述
[0031] A叶绿体转运肽(CTP)(或质体转运肽)以共翻译或翻译后方式起作用以将包含 CTP的多肽引导到质体(例如,叶绿体)。在本发明的一些实施方案中,内源性叶绿体蛋白 质或是异源蛋白质均可通过将该蛋白表达为含有CTP的较大前体多肽而被导向到叶绿体 中。在具体的实施方案中,CTP可以衍生自由多种5-烯醇式丙酮酰莽草酸-3-磷酸合成酶 (EPSPS)的比对得到的核苷酸序列,例如但不限于,通过例如,但不限于,纳入至少一个来自 从不同生物体获得的直系同源基因的连续序列,或其功能性变体衍生而来。
[0032] 在一个示例性实施方案中,自EPSPS蛋白质序列的比对分离出各自编码CTP的核 酸序列(图2)。编码CTP的序列通过以ChloroP预测服务器(prediction server)分析 EPSPS基因序列来分离。Emanuelsson et al. (1999)Protein Science 8:978-84(可在cbs. dtu. dk/services/ChloroP查阅)。分离的编码CTP的序列的预测蛋白质产物为约60-70 个氨基酸长的转运肽。在该实例中,将多个EPSPS CTP序列的比对用作参考序列来设计示 例的人造 CTP,方法是随机选择氨基酸来生成新的人造 CTP。该设计过程显示了人造 CTP的 衍生物(derivation)的特征。示例性人造 CTP在本公开全文中称为TraP23。测试示例性 人造 TraP23的质体导向功能,发现它们显示的质体导向至少不逊于对单独的天然CTP序列 观察到的质体导向。
[0033] 在进一步的示例实施方案中,独立地合成多个核酸序列,每一个均编码本发明的 人造 TraP肽,并将它们与编码黄色荧光蛋白(YFP)的核酸序列可操作地连接,从而产生多 个人造的核酸分子,每一个均编码嵌合TraP:YFP融合多肽。将这些核酸分子,它们每一个 均编码嵌合TraP: YFP多肽,分别倒入到双元载体中,使得每一个TraP: YFP编码核酸序列与 AtUbi 10启动子可操作地连接。
[0034] 在更进一步的示例实施方案中,将多个包含与AtUbi 10启动子可操作地连接的 TraP:YFP编码核酸序列的双元载体通过土壤杆菌介导的转化分别独立地瞬时转化到烟草 (本氏烟草(Nicotiana benthamiana))中。共聚焦显微术和Western印迹分析证实,每一 个TraP均成功地将YFP导向到了烟草叶绿体上。
[0035] 在进一步的示例实施方案中,独立地合成了多个核酸序列,每一个均编码本发明 的人造 TraP肽,并将它们与编码农艺学上重要的基因序列的核酸序列可操作地连接。将 TraP序列与除草剂耐受性性状(例如dgt-28)融合,从而产生多个人造的核酸分子,每一 个均编码嵌合的TraP:DGT-28融合多肽。将这些核酸分子,它们中每一个均编码嵌合的 TraP: DGT-28多肽,分别引入双元载体中,从而使每一个TraP: dgt-28编码核酸序列均与启 动子或其它基因调节元件可操作地连接。用这些含有TraP:dgt-28编码核酸序列的双元载 体转化各种植物物种。对转基因植物测定由于DGT-28酶的表达和转位到叶绿体导致的除 草剂耐受性。
[0036] 在进一步的示例实施方案中,独立地合成核酸序列,其编码本发明的人造 TraP 肽,并与编码农艺学上重要的基因序列的核酸序列可操作地连接。将TraP序列与昆虫耐 受性性状(例如cry2Aa)融合,从而产生人造的核酸分子,其编码嵌合的TraP:Cry2Aa融 合多肽。将这样的编码嵌合的TraP :Cry2Aa多肽的核酸分子引入双元载体中,使得每一 个TraP:Cry2Aa编码核酸序列均与启动子或其它基因调节元件可操作地连接。用含有 TraP: cry2Aa编码核酸序列的双元载体转化各种植物物种。对转基因植物测定由于Cry2Aa 酶的表达和转位到叶绿体导致的除草剂耐受性。
[0037] 鉴于前述的详细工作实施例,本发明的人造 CTP序列和编码它们的核酸,可用于 在广大范围的含质体细胞内将任何多肽引导到质体上。例如,通过通过本公开提供给本领 域技术人员的方法,可以将包含人造的CTP序列、且该序列与任意的第二个肽序列的N端融 合的嵌合多肽引入到含质体的宿主细胞内(或在其中表达),以便将所述第二个肽序列导 向到质体上。因此,在特定的实施方案中,本发明的TraP肽,与天然CTP相比,可以提供期 望在质体上表达的肽的更高的引入和加工效率。
[0038] II.缩写
[0039] CTP叶绿体转运肽
[0040] EPSPS 3-烯醇式丙酮酰莽草酸-5-磷酸合成酶
[0041] YFP黄色荧光蛋白质
[0042] Ti肿瘤诱导(源自根癌土壤杆菌(A. tumefaciens)的质体)
[0043] T-DNA 转移 DNA
[0044] III.术语
[0045] 为了方便本公开各实施方案的阅读,提供以下具体术语的解释:
[0046] 叶绿体转运肽:如本文所使用的,术语"叶绿体转运肽"(CTP)(或"质体转运肽") 可以指如下的氨基酸序列,当其存在于多肽的N端时,会指导该多肽进入含质体细胞(例如 植物细胞,例如在全植物或植物细胞培养物中)的质体内。CTP对于指导蛋白质转运进入 宿主细胞的质体(例如,初级、二级或三级质体,例如叶绿体)而言一般是必要而且充分的。 通过多种可用的算法中的任一种(例如PS0RT,和ChloroP (可以在cbs. dtu. dk/services/ ChloroP获得))可以鉴定推定的叶绿体转运肽。ChloroP可以提供特别好的CTP预测。 Emanuelsson et al. (1999) ,Protein Science 8:978-84。然而,任何现有算法均不能以 100%的效率实现功能性CTP的预测。因此,确认所鉴定出的假定CTP是否确实如预期的那 样发挥功能(例如,在体外或体内方法中)是重要的。
[0047] 叶绿体转运肽可以位于被转运到质体内的多肽的N端。CTP可以帮助含有CTP的多 肽的共翻译或翻译后的向质体中的转运。叶绿体转运肽通常含有大约40-大约100个氨基 酸,这些CTP已经被观察到含有某些共同的特征。例如:CTP所含的带负电荷氨基酸(例如 天冬氨酸、谷氨酸、天冬酰胺或谷氨酰胺)非常少(即使有的话);CTP的N端区缺少带电氨 基酸、甘氨酸和脯氨酸;CTP的中心区还很可能含有非常高比例的碱性或羟基化氨基酸(例 如丝氨酸和苏氨酸);并且CTP的C端很可能富含精氨酸,并具有构成两亲性β折叠片结 构的能力。在包含CTP的多肽被转运到质体内之后,质体蛋白酶可以将CTP与包含CTP的 多肽的其余部分切离。
[0048] 接触:如本文关于核酸分子所使用的,术语与细胞、组织或生物体(例如植物细 胞;植物组织;和植物)"接触",或被细胞、组织或生物体"摄取",包括核酸分子被内化到生 物体中,例如但不限于:使生物体与包含该核酸分子的组合物接触;和用含有该核酸分子 的溶液浸泡生物体。
[0049] 内源的:如本文所使用的,术语"内源的"是指源自于特定生物体、组织或细胞的物 质(例如,核酸分子和多肽)。例如,植物细胞内表达的"内源"多肽可以指通常在来自相同 物种的非遗传工程化植物的相同类型的细胞内表达的多肽。在一些实例中,可以利用内源 基因(例如EPSPS基因)来获得参考CTP基因。
[0050] 表达:如本文所使用的,编码序列(例如基因或转基因)的"表达"是指核酸转录 单元(包括例如基因组DNA或cDNA)的编码信息转变成细胞的运作性(operational)、非运 作性或结构性部分的过程,往往包括蛋白质的合成。基因表达可能受到外部信号(例如,细 胞、组织或生物体暴露于可以增加或降低基因表达的作用剂)的影响。基因的表达还可以 在从DNA到RNA到蛋白的通路中的任何地方被调节。基因表达的调节可以通过例如下述方 式发生:对转录、翻译、RNA转运和加工、中间分子如mRNA的降解等的控制,或者通过在特定 蛋白分子产生后使其活化、失活、区室化(compartmentalization)或降解,或者通过前述 的任何组合。基因表达可以通过本领域已知的方法在RNA水平或蛋白水平进行测量,这些 方法例如但不限于Northern印迹、RT-PCR、Western印迹,和体外、原位和体内蛋白活性测 定。
[0051] 遗传物质:如本文所使用的,术语"遗传物质"包括所有的基因和核酸分子,如DNA 和 RNA。
[0052] 异源的:如本文所使用的,术语"异源的"是指并非源自于特定生物体、组织或细胞 的内部的物质(例如核酸分子和多肽)。例如,在植物细胞内表达的"异源"多肽可以指通 常不在来自相同物种的非遗传工程化植物的相同类型细胞中表达的多肽(例如,在相同生 物体的不同细胞中,或者在不同生物体的细胞中表达的多肽)。
[0053] 分离的:如本文所使用的,术语"分离的"是指如下的分子(例如,核酸分子或多 肽),该分子已与天然存在该分子的生物体细胞内通常与该分子伴随的其它同类分子(例 如其它核酸分子和其它多肽)实质上分离或提纯脱离。例如,分离的核酸分子可以与天然 存在该核酸分子的生物体细胞内的染色体DNA或染色体外DNA实质性分离或提纯脱离。因 此,该术语包括经过生化纯化从而除去其它的核酸分子、多肽和细胞组分的重组核酸分子 和多肽。该术语还包括重组核酸分子、化学合成的核酸分子、和重组产生的多肽。
[0054] 如本文所使用的,术语"基本上纯化的"是指这样的分子,其与通常在天然状态下 与之伴随的其它分子是分离的。基本上纯化的分子可以是组合物中存在的主导种类。基本 上纯化的分子可以是,例如,除了天然混合物中存在的溶剂之外,其它分子有至少60%、至 少75%、或至少90%不存在。术语"基本上纯化的"不是指以天然状态存在的分子。
[0055] 核酸分子:如本文所使用的,术语"核酸分子"可以指聚合物形式的核苷酸,其可以 包括RNA、cDNA、基因组DNA、和合成形式的上述混合聚合物的有义和反义链。核苷酸可以指 核糖核苷酸、脱氧核糖核苷酸,或两者任一类型核苷酸的修饰形式。如本文所使用的,"核酸 分子"与"核酸"和"多核苷酸"同义。除非另有说明,核酸分子的长度通常为至少10个碱 基。该术语包括单链和双链形式的DNA。核酸分子包括二聚体(所谓的串联)形式,和核酸 分子的转录产物。核酸分子可包括天然存在的和/或经过修饰的核苷酸,其中核苷酸通过 天然存在的和/或非天然存在的核苷酸连接键连接在一起。
[0056] 核酸分子可以被化学或生物化学修饰,或者可以含有非天然的或衍生化的核苷酸 碱基,如本领域技术人员所容易理解的。这些修饰包括,例如,标记物、甲基化、用类似物取 代一个或多个天然存在的核苷酸、核苷酸间修饰(例如,不带电的连接键:例如,甲基膦酸 酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电荷的连接键:例如,硫代磷酸酯、二硫代磷 酸酯等;侧基部分:例如,肽;嵌入剂:例如,吖啶、补骨脂素等;螯合剂;烷化剂;和经过修 饰的连接键:例如,α异头核酸等)。术语"核酸分子"也包括任何拓扑构象,包括单链、双 链、部分双链体化(duplexed)、三链体化(triplexed)、发夹(hairpinned)、环形、和挂锁构 象。
[0057] 如本文关于DNA所使用的,术语"编码序列"、"结构核苷酸序列"或"结构核酸分子" 是指这样的核苷酸序列,当其置于合适调节序列的控制之下时,可以通过转录和mRNA最终 被翻译成多肽。关于RNA,术语"编码序列"是指被翻译成肽、多肽或蛋白质的核苷酸序列。 编码序列的边界可以由5'端的翻译起始密码子和3'端的翻译终止密码子确定。编码序列 包括,但不限于:基因组DNA ;cDNA ;EST ;和重组核苷酸序列。
[0058] 在一些实施方案中,本发明包括可以用分离方法分离、纯化或部分纯化的核苷酸 序列,分离方法例如离子交换色谱、基于分子量或亲和性的排除、基于在不同溶剂中的溶解 性的分级技术、和遗传工程化方法如扩增、克隆和亚克隆。
[0059] 序列同一性:术语"序列同一性"或"同一性",如本文在两个核酸或多肽序列的语 境中所使用的,可以指当在特定比较窗口上对齐以实现最大对应性时,两个序列中相同的 残基数。
[0060] 如本文所使用的,术语"百分比序列同一性"可以指通过比较两个在比较窗口上最 佳对齐的序列(例如,核酸序列和氨基酸序列)确定的数值,其中为了实现两个序列的最 佳对齐,比较窗口中的序列部分与参考序列(其不含添加或缺失)相比可以包括添加或缺 失(即缺口)。百分比的计算是通过确定在两个序列中均出现的相同核苷酸或氨基酸的位 置的数目,从而产生匹配位置数,并用匹配位置数除以比较窗中的位置总数,并将结果乘以 100,得到百分比序列同一性。
[0061] 用于对齐序列以供比较的方法在本领域中是公知的。多种程序和比对算 法记载于,例如:Smith and Waterman(1981)Adv. Appl. Math. 2:482 ;Needleman and Wunsch (1970) J. Mol.Biol. 48:443 ; Pear son and Lipman (1988) Proc. Natl. Acad. Sci. U. S. A. 85:2444 ;Higgins and Sharp (1988)Gene73:237-44 ;Higgins and Sharp(1989) CABIOS 5:151-3 ;Corpet et al. (1988)Nucleic Acids Res. 16:10881-90 ;Huang et al. (1992) Comp. Appl. Biosci. 8:155-65 ;Pearson et al. (1994)Methods Mol. Biol. 24:307-31 ;Tatiana et al. (1999)FEMS Microbiol. Lett. 174:247-50 中。 序 列比对方法和同源性计算的详细讨论可以参见,例如,Altschul et al. (1990)J.Mol. Biol. 215:403-10。
[0062] 美国国家生物技术信息中心(National Center for Biotechnology Information)(NCBI)基础本地比对搜索工具(Basic Local Alignment Search Tool) (BLASTTM;Altschul等(1990))可从几个来源获得,包括美国国家生物技术信息中心 (Bethesda,MD)和在因特网上,与几个序列分析程序联合使用。关于如何使用该程序来测定 序列同一性的描述可在因特网上BLAST?的"帮助"部分获得。对于核酸序列的比较,可使 用缺省参数来采用BLAST?(Blastn)程序的"Blast 2 sequences"函数。在通过此方法评 估时,与参照序列具有越大的相似性的核酸序列将显示越高的序列同一性。
[0063] 能够特异性杂交/能够特异性互补:如本文所使用的,术语"能够特异性杂交"和 "能够特异性互补"是表明互补性的程度充分,使得在核酸分子和靶核酸分子之间产生稳定 而特异的结合的术语。两个核酸分子之间的杂交涉及在两个核酸分子的核酸序列之间形成 反平行对齐。两个分子随后能够与相对链的相应碱基形成氢键,从而形成一个二聚体分子, 如果它足够稳定,则可以使用本领域众所周知的方法进行检测。核酸分子不需要与靶分子 100%互补才能特异性杂交。然而,发生特异性杂交必须存在的序列互补性的量因杂交条件 而变化。
[0064] 导致特定程度的严格性的杂交条件会取决于所选杂交方法的性质和杂交核酸 序列的组成及长度而变化。一般而言,杂交的温度和杂交缓冲液的离子强度(特别是 Na+和/或Mg++浓度)将确定杂交的严格性,尽管清洗次数也会影响严格性。获得特定 程度的严格性所要求的杂交条件的计算方法是本领域普通技术人员已知的,例如,参见 Sambrook et al. (ed. )Molecular Cloning:A Laboratory Manual, 2nd ed. , vol. 1-3, Cold Spring Harbor Laboratory Press,Cold Spring Harbor, NY,1989,chapters 9and 11; 和 Hames and Higgins(eds. )Nucleic Acid Hybridization,IRL Press,Oxford,1985。 关于核酸杂交的更加详细的说明和指导可以参见,例如,Tijssen,"Overview of principles of hybridization and the strategy of nucleic acid probe assays,,'in LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes,Part I,Chapter 2,Elsevier,NY, 1993 ; 和 Ausubel et al., Eds. , Current Protocols in Molecular Biology,Chapter 2, Greene Publishing and Wiley_Interscience,NY, 1995。
[0065] 如本文所使用的,"严格条件"包括在其中只有当杂交分子与靶核酸分子内的同源 序列之间的错配小于20%时才发生杂交的条件。"严格条件"包括进一步特定水平的严格 性。因此,如本文所使用的,"中等严格"条件是指在其中序列错配超过20%的分子将不会 杂交的条件;"高严格"条件是指在其中序列错配超过10%的分子将不会杂交的条件;"极 高严格"条件是指在其中序列错配超过5%的分子将不会杂交的条件。
[0066] 下面是代表性的、非限制的杂交条件:
[0067] 高严格条件(检测具有至少90 %序列同一性的序列):在65°C的5x SSC缓冲液 中杂交16小时;在室温下用2x SSC缓冲液清洗2次,每次15分钟;和在65°C的0. 5x SSC 缓冲液中清洗2次,每次20分钟。
[0068] 中等严格条件(检测具有至少80%序列同一性的序列):在65_70°C的5x_6x SSC缓冲液中杂交16-20小时;在室温下用2x SSC缓冲液清洗2次,每次5-20分钟;和在 55-70°C的lx SSC缓冲液中清洗2次,每次30分钟。
[0069] 非严格对照条件(检测具有至少50%序列同一性的序列):在55°C的6xSSC缓冲 液中杂交16-20小时;在室温至55°C下用2x-3x SSC缓冲液清洗至少2次,每次20-30分 钟。
[0070] 如本文关于连续核酸序列所使用的,术语"基本上同源的"或"基本上同源"是指 如下的连续核苷酸序列,其在严格条件下与参考核酸序列杂交。例如,与参考核酸序列(例 如,SEQ ID NO: 12)基本上同源的核酸序列是如下的核酸序列,其在严格条件下(例如,上文 示明的中等严格条件)与参考核酸序列杂交。基本上同源的序列可具有至少80%序列同一 性。例如,基本上同源的序列可具有大约80% -100%的序列同一性,例如大约81% ;大约 82% ;大约83% ;大约84% ;大约85% ;大约86% ;大约87% ;大约88% ;大约89% ;大约 90% ;大约91% ;大约92% ;大约93% ;大约94% ;大约95% ;大约96% ;大约97% ;大约 98% ;大约98. 5% ;大约99% ;大约99. 5% ;和大约100%。基本上同源的性质与特异性杂 交密切相关。例如,当具有充分程度的互补性,从而在期望特异性结合的条件下(例如严格 杂交条件下)避免核酸与非靶序列的非特异性结合时,核酸分子是能够特异性杂交的。
[0071] 如本文所使用的,术语"直系同源物"(或"直向同源的")是指两个或多个物种中 的基因,其从一个共同的祖先核苷酸序列进化而来,并可以在两个或多个物种中保留相同 的功能。
[0072] 如本文所使用的,对于两个核酸分子而言,当沿着5'_3'方向阅读的序列的每一个 核苷酸均与沿着3' -5'方向阅读的另一个序列的每一个核苷酸互补时,则称这两个核酸分 子显示"完全互补性"。与参考核苷酸序列互补的核苷酸序列将显示与参考核苷酸序列的反 向互补序列相同的序列。这些术语和描述在本领域中有确切的定义,且本领域的普通技术 人员容易理解。
[0073] 在确定氨基酸序列之间的百分比序列同一性时,本领域技术人员众所周知,在不 影响包含该对齐序列的多肽的期望性质的情况下,某个对齐所提供的给定位置上的氨基酸 的身份可以不同。在这些情况下,可以调整百分比序列同一性以解释被保守取代的氨基酸 之间的相似性。这些调整是本领域技术人员众所周知并且普遍使用的。见,例如Myers and Miller (1988), Computer Applications in Biosciences 4:11-7。
[0074] 本发明的实施方案包括示例性的质体转运肽氨基酸序列的功能性变体,和编码它 们的核酸序列。示例性的转运肽序列的功能性变体可以是,例如,示例转运肽氨基酸序列的 片段(例如N端或C端片段),或全长示例性转运肽氨基酸序列或示例性转运肽氨基酸序 列的片段的修饰序列。在一些实施方案中,示例性的转运肽氨基酸序列可以被修饰而引入 一个或多个保守的氨基酸取代。"保守氨基酸取代"是指如下的氨基酸取代,其中氨基酸残 基被另一个具有相似功能侧链、相似大小、和/或相似疏水性的氨基酸残基代替。可用于代 替相同家族中的另一个氨基酸以便引入保守取代的氨基酸家族是本领域已知的。例如,这 些氨基酸家族包括:碱性氨基酸(例如,赖氨酸,精氨酸和组氨酸);酸性氨基酸(例如,天 冬氨酸和谷氨酸);不带电的(在生理PH下)的极性氨基酸(例如,甘氨酸,天冬酰胺,谷 氨酰胺,丝氨酸,苏氨酸,酪氨酸,和半胱氨酸);非极性氨基酸(例如丙氨酸,缬氨酸,亮氨 酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,和色氨酸)支链氨基酸(例如,苏氨酸,缬 氨酸,和异亮氨酸);和芳香族氨基酸(例如酪氨酸,苯丙氨酸,色氨酸,和组氨酸)。见,例 如,Sambrook et al. (Eds.),同上;和 Innis et al.,PCR Protocols:A Guide to Methods and Applications,1990, Academic Press,NY,USA。
[0075] 可操作地连接:当第一核苷酸序列与第二核苷酸序列存在功能关系时,则该第一 核苷酸序列与第二核苷酸序列"可操作地连接"。例如,如果启动子影响编码序列的转录或 表达,则启动子与该编码序列可操作地连接。如果可操作地连接的核苷酸序列是重组产生 的,则这些核苷酸序列通常是连续的,并且在需要连接两个蛋白编码区时,这些核苷酸序列 将共阅读框。然而,可操作地连接的核苷酸序列不一定连续的。
[0076] 术语"可操作地连接的",在用来指基因调节序列和编码序列时,其意思是调节序 列影响所连接的编码序列的表达。"调节序列"或"控制元件"是指影响转录的时机和水平 /量,RNA加工或稳定性,或相关编码序列的翻译的核苷酸序列。调节序列可以包括启动子; 翻译前导序列;内含子;增强子;茎环结构;阻遏物结合序列;终止序列;多聚腺苷酸化识 别序列;等。特定的调节序列可位于与之可操作地连接的编码序列的上游和/或下游。此 夕卜,与编码序列可操作地连接的特定调控序列可位于双链核酸分子的相关互补链上。
[0077] 当用于指示两个或多个氨基酸序列时,术语"可操作地连接"是指第一个氨基酸序 列与至少一个额外的氨基酸序列存在功能关系。例如,在包含转运肽和第二氨基酸序列的 多肽内,如果该转运肽影响该多肽或该第二氨基酸序列的表达或运输,则该转运肽(例如 CTP)与该第二氨基酸序列可操作地连接。
[0078] 启动子:如本文所使用的,术语"启动子"是指一段DNA区域,其可以位于转录起点 的上游,并参与RNA聚合酶和其它蛋白的识别和结合以起始转录。启动子可以与用于在细 胞内表达的编码序列可操作地连接,或者启动子可以与编码信号序列的核苷酸序列可操作 地连接,而该信号序列与用于在细胞内表达的编码序列可操作地连接。"植物启动子"可以 是能够在植物细胞中起始转录的启动子。处于发育控制之下的启动子的实例包括:优先在 某些组织(例如但不限于,叶、根、种子、纤维、木质部导管、管胞或厚壁组织)中起始转录的 启动子。这些启动子被称为"组织优选的"。仅在特定组织中启动转录的启动子被称为"组 织特异的"。"细胞类型特异的"启动子主要在一个或多个器官的特定细胞类型中的驱动转 录,例如根或叶中的导管细胞。"可诱导的"启动子可以是可受环境控制的启动子。可能通 过可诱导的启动子触发转录的环境条件的实施例包括,例如但不限于,缺氧条件和光的存 在。组织特异的、组织优选的、细胞类型特异的、和可诱导的启动子构成了"非组成型"启动 子类型。"组成型"启动子是在大多数环境条件下可以有活性的启动子。
[0079] 任何可诱导的启动子均可用于本发明的一些实施方案。见Ward et al. (1993),Plant Mol. Biol. 22:361-366。使用可诱导的启动子,转录速度可响应诱导剂而 增加。可诱导的启动子的实例包括,但不限于:来自ACEI系统的对铜响应的启动子;来自玉 米的对苯磺酰胺除草剂安全剂响应的In2基因;来自TnlO的Tet阻遏物;和来自类固醇激 素基因的可诱导启动子,其转录活性可以被糖皮质激素诱导(Schena et al.(1991)Pr〇c. Natl. Acad. Sci. USA88:0421)。
[0080] 组成型启动子的实例包括,但不限于:来自植物病毒的启动子,如来自CaMV的35S 启动子;来自水稻肌动蛋白基因的启动子;泛素启动子;pPEMU;MAS ;玉米H3组蛋白启动 子;和ALS启动子,欧洲油菜ALS3结构基因5'端的Xbal/Ncol片段(或与所述Xbal/Ncol 片段相似的核苷酸序列)(国际PCT公开No. WO 96/30530)。
[0081] 此外,所有的组织特异性或组织优选的启动子可以用于一些本发明的实施方案 中。以包含可操作地连接于组织特异性启动子的编码序列的核酸分子转化的植物可以生成 仅在特定组织或择优在特定组织中的编码序列的产物。示例性组织特异性或组织优选的启 动子包括但不限于:根优选的启动子,例如,来自菜豆蛋白基因的启动子;叶特异性和光诱 导的启动子,例如来自cab或rubisco的启动子;花药特异性的启动子,例如来自LAT52的 启动子;花粉特异性的启动子,例如来自Zml3的启动子;和小孢子优选的启动子,例如来自 apg的启动子。
[0082] 转化:如本文所使用的,术语"转化"或"转导(transduction) "是指将一个或多 个核酸分子转移进入细胞中。细胞在核酸分子通过细胞复制变得稳定时通过该转导进入细 胞的核酸分子进行转化,或者通过将核酸分子结合进入细胞基因组进行转化,或者通过附 加型复制(episomal replication)进行转化。如本文所使用的,术语"转化"包括所有的 可以将核酸分子引入这种细胞中的技术。实例包括但不限于:以病毒载体进行转染;以质 粒载体进行转化;电穿孔(Fromm et al. (1986)Nature 319:791-3);脂质体转染(Feigner et al. (1987)Proc. Natl. Acad. Sci. USA 84:7413-7);显微注射(Mueller et al. (1978) Cel115:579-85) ; 土壤杆菌(Agrobacterium)介导的转移(卩四167 6七31.(1983)卩1'〇(:· Natl. Acad. Sci. USA 80:4803-7);直接 DNA 吸收;和微弹轰击法(microprojectile bombardment)(Klein et al. (1987)Nature 327:70)〇
[0083] 转基因:一种外源核酸序列。在一些实例中,转基因可以是编码包含至少一个人造 的CTP的多肽的序列。在特定实例中,转基因可以编码这样的多肽,其包含至少一个人造的 CTP和至少一个期望质体表达的额外的肽序列(例如,赋予除草剂抗性的肽序列)。在这些 和其它的实例中,转基因可以含有与转基因的编码序列可操作地连接的调节序列(例如启 动子)。为本公开的目的,术语"转基因(的)"在用于指示生物体(例如植物)时,是指包 含外源核酸序列的生物体。在一些实例中,包含外源核酸序列的生物体可以是其中通过分 子转化技术引入了该核酸分子的生物体。在其它实例中,包含外源核酸序列的生物体可以 是通过例如基因渗入或植物异花授粉而引入了该核酸序列的生物体。
[0084] 转运:如本文所使用的,术语"转运"、"导向"和"转移"是指本发明的某些氨基酸序 列帮助包含该氨基酸序列的多肽从宿主细胞的细胞核移动进入宿主细胞的质体内的性质。 在特定的实施方案中,这种氨基酸序列(例如人造的CTP序列)可能能够将包含该氨基酸 序列的多肽的大约100 %、至少大约95 %、至少大约90 %、至少大约85 %、至少大约80 %、至 少大约70%、至少大约60%、和/或至少大约50%转运到宿主细胞的质体内。
[0085] 载体:一种被引入到细胞内,例如为了产生转化细胞而被引入到细胞内的核酸分 子。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制起点。载体的实例包括, 但不限于:质粒;粘粒;噬菌体;和携带外源DNA进入细胞的病毒。载体还可以包括一个或 多个基因、反义分子、和/或选择标志物基因,以及其它本领域已知的遗传元件。载体可以 转导、转化或感染细胞,借此导致细胞表达由该载体编码的核酸分子和/或蛋白质。载体任 选地包括可帮助核酸分子实现细胞进入的材料(例如脂质体、蛋白质包壳等)。
[0086] 除非特别说明或暗示,如本文所用的,术语"一种"、"一个"和"该"意味着"至少一 个"。
[0087] 除非另有具体说明,否则本文所用的所有技术和科学术语具有与本公开所 属领域的普通技术人员通常理解的相同的含义。分子生物学中常见术语的定义可 见,例如 Lewin B. , Genes V, Oxford University Press, 1994(ISBN0-19-854287-9); Kendrew et al. (eds. ). The Encyclopedia of Molecular Biology. Blackwell Science Ltd.,1994(ISBN 0-632-02182-9);和 Meyers R. A. (ed.). Molecular Biology and Biotechnology:A Comprehensive Desk Reference,VCHPublishers, Inc. , 1995(ISBN 1-56081-569-8)。所有的百分比均为重量百分比,并且所有的溶剂混合物的比例均基于体 积,除非另有说明。所有的温度均为摄氏度。
[0088] IV.包含合成编码CTP的序列的核酸分子
[0089] 在一些实施方案中,本公开提供核酸分子,其包含可操作地连接于感兴趣的核苷 酸序列的至少一个编码人造 CTP的核苷酸序列。在具体的实施方案中,所述感兴趣的核苷 酸序列可以是编码感兴趣的多肽的核苷酸序列。在特别的实例中,提供编码多肽的单个核 酸分子,所述多肽中TraP23序列融合至感兴趣的多肽的N端。
[0090] 在一些实施方案中,人造叶绿体转运肽可以是嵌合CTP。人造 CTP可以由从多个 EPSPS酶的比对中随机选择氨基酸而得到。图2显示从植物EPSPS酶分离的CTP序列的比 对。因此,编码氨基酸序列的人造 CTP可以由从天然叶绿体转运肽序列的比对中随机选择 氨基酸而得到。在这些和其他实例中,用来产生比对的参考CTP序列的连续氨基酸序列可 以包含人造 CTP。
[0091] 本领域普通技术人员将会理解:在人造 CTP序列内选择第一氨基酸序列后,根据 前述的衍生过程从同源CTP序列的剩余部分鉴定和选择连续氨基酸序列是明确且自动的。 在一些实例中,所述第一连续氨基酸序列的长度可以是约25至约41个氨基酸(例如,24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41 和 42 个氨基酸长)。
[0092] 根据前述过程的人造 CTP蛋白质序列的实例以SEQ ID NO: 11为代表。考虑遗传 密码的简并性,本领域普通技术人员能立即想到编码这些肽的核苷酸序列的类群。这些特 定的实例从来自不同植物物种的几种ESPSP直系同源物之一的同源CTP的比对纳入了连续 序列,从而例示了人造 CTP的结构特征。
[0093] 一些实施方案包括人造叶绿体转运肽的功能性变体,和/或编码该变体的核酸。 这样的功能性变体包括,例如且不限于:由SEQ ID NO: 11所示的出的编码人造 CTP的序列, 和/或由其编码的CTP ;编码包含SEQ ID NO: 11内的连续氨基酸序列的人造 CTP的核酸, 和/或由其编码的CTP ;编码截短的人造 CTP的序列,其包含SEQ ID NO: 12的连续核酸序 列;编码截短的人造 CTP的序列,其包含与SEQ ID NO: 12基本上同源的连续核酸序列;截 短的人造 CTP,其包含SEQ ID NO: 11的连续氨基酸序列;编码人造 CTP的核酸和/或由其 编码的CTP ;所述人造 CTP包含SEQ ID NO: 11的连续氨基酸序列;编码人造 CTP的核酸和 /或由其编码的CTP,所述CTP包含SEQ ID N0:11内的连续氨基酸序列,且该序列具有一个 或多个沉默氨基酸取代;和编码人造 CTP的核酸和/或由其编码的CTP,所述CTP包含SEQ ID N0:11内的连续氨基酸序列,且该序列具有一个或多个被证明能将可操作连接的肽引导 至含质体细胞中的质体的非沉默氨基酸取代。
[0094] 因此,本发明的一些实施方案包括含有如下核苷酸序列的核酸分子,该核苷酸序 列编码人造的CTP,其包含一个或多个保守的氨基酸取代。这种核酸分子可用于,例如,在 分子生物学技术中帮助本发明CTP编码序列的操作。例如,在一些实施方案中,可将本发明 的CTP编码序列引入到合适的用于将序列亚克隆到表达载体内的载体中,或者可以将本发 明的CTP编码序列可以引入到这样的核酸分子中,该核酸分子可以帮助产生其他包含与感 兴趣的核苷酸序列可操作地连接的CTP编码序列的核酸分子。在这些和进一步的实施方案 中,人造的CTP序列中的一个或多个氨基酸位置可以被删除。例如,人造的CTP的序列可以 被修饰,使得该序列中的 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19 或 20 个位 置上的氨基酸被删除。对同源CTP序列的比对可以提供哪些氨基酸可以被删除而不会影响 人造 CTP的功能的指导。
[0095] 在特定的实施例中,人造叶绿体转运肽长度小于80个氨基酸。例如,人造 CTP的 长度可以是 79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60 个氨基 酸或更少。在一些实例中,人造 CTP的长度可以是约65、约68、约72、或约74个氨基酸。在 这些和进一步的实例中,人造 CTP可以包含如SEQ ID NO: 11所示的氨基酸序列或前述的功 能性变体。因此,人造 CTP可以包含SEQ ID NO: 11的氨基酸序列或其功能性变体,其中人 造 CTP的长度小于80个氨基酸长度。在一些实例中,人造 CTP可以包含,例如,与SEQ ID NO: 11至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少 97 %、至少98 %、至少99 %或100 %相同的氨基酸序列。
[0096] 本领域的技术人员结合本公开能识别编码某一具体的人造 CTP的所有核苷酸序 列,例如SEQ ID NO: 11的TraP23肽,或任意前述者的功能性变体,包括任何特定缺失和/ 或保守氨基酸取代。遗传密码的简并性为特定氨基酸序列提供了有限数目的编码序列。选 择特定的序列编码人造的CTP属于从业者的自由裁量。在不同的应用中可能期望使用不同 的编码序列。例如,为了提高人造 CTP在特定宿主内的表达,可以选择反映宿主密码子使用 偏好的编码序列。作为举例,人造的CTP可以由如SEQ ID N0:12所示的核苷酸序列编码。
[0097] 本发明的一些实施方案中提供的核酸分子中,编码人造的CTP的核苷酸序列的最 后一个密码子和感兴趣的核苷酸序列的第一个密码子可以由任意数量的核苷酸三联体所 分隔,例如不编码内含子或"终止(STOP)"。在一些实例中,编码在天然前体多肽中通常与 叶绿体转运肽相伴随的成熟蛋白质的第一个氨基酸的序列可以存在于编码人造 CTP的核 苷酸序列的最后一个密码子与感兴趣的核苷酸序列的第一个密码子之间。将编码人造 CTP 的核苷酸序列和感兴趣的核苷酸序列第一个密码子隔开的序列可以例如由任何序列构成, 使得所编码的氨基酸序列很可能不会显著改变嵌合多肽的翻译及其向质体的转位。在这些 和进一步的实施方案中,编码人造叶绿体转运肽的核苷酸序列的最后一个密码子可以与直 接与该序列毗邻、或者仅以短肽序列与之相隔的感兴趣的核苷酸序列的第一个密码子相位 对准(phase register)地融合,所述短肽序列例如是由人造核苷酸接头(例如,可能已经 被用于实现该融合的核苷酸接头)编码的短肽序列。
[0098] 在一些实施方案中,可能期望修饰感兴趣的核苷酸序列的核苷酸和/或与之融合 在一个编码序列中的、人造的CTP编码序列的核苷酸,以便例如增强该编码序列在特定宿 主中的表达。遗传密码是冗余的,具有64个可能的密码子,但是大多数生物优先使用这些 密码子中的一个子集。在某个物种中最经常使用的密码子被称为最优密码子,而那些不经 常使用的被归类为稀有或低使用率密码子。Zhang et al. (1991)Gene 105:61-72。可更换 密码子以反映特定宿主的优先密码子使用率,这个过程有时被称作"密码子优化"。可以制 备含有特定原核或真核宿主优选的密码子的优化密码子序列,以便,例如,增加翻译速度或 者产生具有期望性质(例如,与从非优化序列产生的转录本相比具有更长的半衰期)的重 组RNA转录本。
[0099] 任何多肽均可以通过纳入人造的CTP序列而被导向到含质体细胞的质体上。例 如,在一些实施方案中,可以将多肽与人造的CTP序列连接,从而将多肽引导到的细胞的质 体上,在质体中该多肽-CTP连接分子被表达。在特定的实施方案中,通过纳入人造的CTP序 列而被导向到质体上的多肽可以是在天然表达该多肽的细胞内通常在质体中表达的多肽。 例如但不限于,通过纳入人造的CTP序列被导向到质体上的多肽可以是参与除草剂抗性, 病毒抗性,细菌性病原体抗性,昆虫抗性,线虫抗性,或抗真菌多肽的多肽。参见,例如,美国 专利 5, 569, 823 ;5, 304, 730 ;5, 495, 071 ;6, 329, 504 和 6, 337, 431。通过纳入人造的 CTP 序 列被导向到质体上的多肽抑或可以是,例如但不限于,参与植物活力和产量的多肽(包括 参与对极端温度、土壤条件、光照水平、水的水平、和化学环境的耐受性的多肽),或者可以 用作鉴定含有感兴趣的性状的植物的标志物的多肽(例如,选择标志物基因产物、参与种 子颜色的多肽,等)。
[0100] 在本发明的一些实施方案中,可以和人造 CTP序列连接的、参与除草剂抗性的多 肽的非限制性实例包括:乙酰乳酸合酶(ALS)、突变的ALS和ALS的前体(例如,见美国专利 5, 013, 659) ;EPSPS (见,例如,美国专利 4, 971,908 和 6, 225, 114),例如 CP4EPSPS 或 III 类 EPSPS ;可修饰质体中发生的生理过程的酶,这些生理过程包括但不限于,光合作用和脂肪 酸、氨基酸、油、类胡萝卜素(carotenoids)、萜类和淀粉的合成。在特定实施方案中,可以和 人造的叶绿体转运肽连接的多肽的其它非限制性实例包括:玉米黄素环氧酶,胆碱单加氧 酶,亚铁螯合酶,ω -3脂肪酸去饱和酶,谷氨酰胺合成酶,淀粉修饰酶,参与必需氨基酸、维 生素 Α、激素、Bt毒素蛋白的人造的多肽,等等。编码上述多肽的核苷酸序列在本领域中是 已知的,可以将这些核苷酸序列和编码人造的CTP的核苷酸序列可操作地连接,其中该CTP 将被表达进入如下的多肽,其包含与该人造的CTP连接的感兴趣的多肽。此外,编码任何上 述多肽的额外核苷酸序列可以由本领域的技术人员鉴定(例如,通过克隆与编码该特定多 肽的其它基因高度同源的基因)。一旦鉴定了这样的核苷酸序列,设计包括与所鉴定核苷酸 序列可操作地连接的人造的CTP编码序列,或编码等价多肽的序列,都会是直截了当的过 程。
[0101] V.包含人造叶绿体转运肽的多肽的表达
[0102] 在一些实施方案中,可以将至少一种核酸分子引入细胞、组织或生物体中,这些核 酸分子包含编码包含至少一种人造的CTP或其功能等价物的多肽的核苷酸序列,以在所述 细胞、组织或生物体中中表达该多肽。在特定的实施方案中,核酸分子可以包含与所述编码 人造的CTP的核苷酸序列可操作地连接的感兴趣的核苷酸序列。例如,核酸分子可以包括 编码如下多肽的编码序列,该多肽包含至少一个人造的CTP和至少一个由感兴趣的核苷酸 序列编码的其他肽序列。在一些实施方案中,可以将本发明的核酸分子引入含质体的细胞、 组织或生物体(例如,植物细胞,植物组织和植物)中,使得在该含质体宿主细胞、组织或生 物体中从所述核酸分子表达多肽,其中该表达的多肽包含至少一个人造的CTP和至少一个 由感兴趣的核苷酸序列编码的其他肽序列。在某些实例中,被表达的多肽的人造的CTP可 以帮助将该多肽的至少含有所述其他肽序列的一部分导向到宿主细胞、组织或生物体的质 体上。
[0103] 在一些实施方案中,本发明的核酸分子可以通过任何本领域技术人员已知的方法 引入到含质体的细胞内。在特定的实施方案中,可以使宿主细胞、组织或生物体和本发明的 核酸分子接触,以便将该核酸分子引入到细胞、组织或生物体内。在特定的实施方案中,可 用本发明的核酸分子转化细胞,从而将该核酸分子导入细胞内,并且将核酸分子稳定整合 到细胞的基因组中。在一些实施方案中,可以使用包含至少一个与感兴趣的核苷酸序列可 操作地连接的人造 CTP的核苷酸序列的核酸分子转化细胞,例如含质体的细胞(例如植物 细胞)。为了引发或增强表达,核酸分子可以包含一个或多个调节序列,该调节序列可以和 编码包含至少一个人造 CTP的多肽的核苷酸序列可操作地连接。
[0104] 核酸分子可以是,例如,载体系统,其包括例如线性质粒和闭合环状质粒。在特定 的实施方案中,该载体可以是表达载体。本发明的核酸序列可以,例如,插入到载体中,使 该核酸序列与一个或多个调节序列可操作地连接。有许多载体可用于该目的,并且特定载 体的选择可以取决于,例如,待插入到载体内的核酸的大小,和要用载体转化的具体宿主细 胞。载体通常含有多种组分,这些组分的身份取决于载体的功能(例如,DNA扩增和DNA表 达),以及与载体相容的特定宿主细胞。
[0105] 一些实施方案可以包括植物转化载体,其包括含有至少一个上述的调节序列的核 苷酸序列,其中该调节序列与一个或多个编码含有至少一个人造 CTP的多肽的核苷酸序列 可操作地连接。该一个或多个核苷酸序列可以在该调节序列的控制下在植物细胞、组织或 生物体中表达,从而产生包含人造的CTP的多肽,该CTP将多肽的至少一部分导向到植物细 胞、组织或生物体的质体上。
[0106] 在一些实施方案中,与编码含有至少一个人造的CTP的多肽的核苷酸序列可操作 地连接的调节序列可以是启动子序列,其可以在宿主细胞中,例如要在其中扩增该核酸分 子的细菌细胞,或者要在其中表达该核酸分子的植物细胞中发挥功能。适用于根据本发明 的核酸分子的启动子,包括诱导型启动子、病毒启动子、人造启动子、或组成型启动子,所有 这些都是本领域中众所周知的。可用于本发明实施方案的启动子的非限制性实例在下列 文献中提供:美国专利Nos. 6, 437, 217 (玉米RS81启动子);5, 641,876 (水稻肌动蛋白启 动子);6, 426, 446 (玉米 RS324 启动子);6, 429, 362 (玉米 PR-I 启动子);6, 232, 526 (玉 米 A3 启动子);6, 177, 611 (组成型玉米启动子);5, 322, 938, 5, 352, 605, 5, 359, 142 和 5, 530, 196 (35S启动子);6, 433, 252 (玉米L3的油质蛋白启动子);6, 429,357(水稻肌 动蛋白2启动子和稻肌动蛋白内含子2) ;6,294,714(光诱导型启动子);6,140,078(盐 诱导型启动子);6,252,138(病原体诱导型启动子);6,175,060(磷缺乏诱导的启动 子);6, 388, 170(双向启动子);6, 635, 806U-coixin启动子);和美国专利申请序列 No. 09/757, 089 (玉米叶绿体醛缩酶启动子)。
[0107] 其它示例性启动子包括,胭脂碱合酶(NOS)启动子(Ebert et al. (1987)Proc. Natl. Acad. Sci. USA 84(16):5745-9);章鱼碱合酶(OCS)启动子(其被携带于根瘤土壤 杆菌的肿瘤诱导型质粒上);花椰菜花叶病毒启动子,例如花椰菜花叶病毒(CaMV) 19S启 动子(Lawton et al. (1987)Plant Mol. Biol. 9:315-24) ;CaMV 35S 启动子(Odell et al.(1985)Nature 313:810-2);玄参花叶病毒 35S启动子(^11?^6七31.(1987)?1'〇。· Natl. Acad. Sci. USA 84(19) :6624_8),鹿糖合酶启动子(Yang and Russell (1990)Proc. Natl.Acad. Sci. USA 87:4144-8) ;R 基因复合体启动子(Chandler et al. (1989) Plant Cell 1:1175-83);叶绿素 a/b结合蛋白基因启动子;CaMV35S(美国专利Nos. 5,322,938,5 ,352, 605, 5, 359, 142,和 5, 530, 196) ;FMV35S(美国专利 Nos. 6, 051,753,和 5, 378, 619); PClSV启动子(美国专利No. 5, 850, 019) ;SCP1启动子(美国专利No. 6, 677, 503),以 及 AGRtu. nos 启动子(GenBank 登录号 V00087 ;Depicker et al. (1982)J. Mol. Appl. Genet. 1:561-73 ;Bevan et al. (1983)Nature 304:184-7)。
[0108] 在特定的实施方案中,本发明的核酸分子可以包含组织特异性启动子。组织特异 性启动子是一种核苷酸序列,其在该启动子特异针对的组织中导致可操作地连接的核苷酸 序列发生与该生物体的其它组织相比更高水平的转录。组织特异性启动子的实例包括但不 限于:绒毡层特异性启动子;花药特异性启动子;花粉特异性启动子(参见,例如,美国专利 No. 7, 141,424,和国际PCT公开No. WO 99/042587);胚珠特异性启动子;(参见,例如,美国 专利申请Να 2001/047525A1);果实特异性启动子(参见,例如,美国专利Nos. 4, 943, 674, 和5, 753, 475);和种子特异性启动子(参见,例如,美国专利Nos. 5, 420, 034,和 5, 608, 152)。在一些实施方案中,发育阶段特异性启动子(例如,在发育晚期活跃的启动 子)可以在本发明的组合物或方法中使用。
[0109] 其他可在一些实施方案中与核酸分子可操作地连接的调节序列包括位于启动子 序列和充当翻译前导序列的编码序列之间的5'UTR。翻译前导序列存在于完全加工的mRNA 中,并且它可能影响初级转录物的加工,和/或RNA稳定性。翻译前导序列的实例包括玉米 和矮牵牛热休克蛋白前导序列(美国专利No. 5, 362, 865),植物病毒外壳蛋白前导序列,植 物rubisco(核酮糖-1,5-二磷酸羧化酶/加氧酶)前导序列,及其他。参见,例如,Turner and Foster(1995)Molecular Biotech. 3(3) :225_36。下列文献中提供了 5'UTR 的非限 制性实例:GmHsp (美国专利 No. 5, 659, 122) ;PhDnaK(美国专利 No. 5, 362, 865) ;AtAntl ; TEV(Carrington and Freed(1990)J. Virol. 64:1590-7);和 AGRtunos (GenBank 登录号 V00087;和 Bevan et al. (1983) ,Nature 304:184-7)。
[0110] 其他可在一些实施方案中与核酸分子可操作地连接的调节序列还包括3'非翻译 序列、3'转录终止区或多聚腺苷酸区。这些都是位于核苷酸序列下游的遗传元件,并包括提 供多聚腺苷酸化信号,和/或其它能够影响转录或mRNA加工的调控信号的多核苷酸。多聚 腺苷酸化信号在植物中发挥功能,导致在mRNA前体的3'端添加多聚腺苷酸核苷酸。多聚 腺苷酸序列可以来自于各种植物基因,或T-DNA基因。3'转录终止区的一个非限制性实例 是胭脂喊合酶 3' 区(nos 3';Fraley et al. (1983)Proc.Natl.Acad.Sci.USA80:4803_7)。 在 Ingelbrecht et al. (1989)Plant Cell 1:671-80 中提供了一个使用不同 3' 非翻译 区的实例。多聚腺苷酸信号的非限制性实例包括来自豌豆RBCS2基因的多聚腺苷酸信号 (Ps. RbcS2-E9 ;Coruzzi et al. (1984)EMBO J. 3:1671-9)和 AGRtu. nos (GenBank 登录号 No. E01312)。
[0111] 本发明的重组核酸分子或载体可包含选择标志物,其赋予被转化的细胞(例如植 物细胞)可选择的表型。选择标志物也可以用于选择包含本发明核酸分子的植物或植物细 胞。该标记可以编码杀生物剂抗性、抗生素抗性(例如,卡那霉素、遗传霉素(G418)、博来 霉素,和潮霉素)或除草剂抗性(例如草甘膦)。选择标志物的实例包括,但不限于:neo基 因,其赋予卡那霉素抗性并可用例如卡那霉素和G418进行筛选;bar基因,其赋予双丙氨磷 抗性;突变的EPSP合酶基因,其赋予草甘膦抗性;腈水解酶基因,其赋予溴苯腈抗性;突变 的乙酰乳酸合酶基因(ALS),其赋予咪唑啉酮或磺酰脲抗性;和氨甲喋呤抗性DHFR基因。存 在多种可赋予对氣节青霉素;博来霉素;氣霉素;庆大霉素;潮霉素;卡那霉素;林可霉素; 甲氨蝶呤;草铵膦;嘌呤霉素;大观霉素;利福平;链霉素;和四环素等抗性的选择标志物。 这些选择标志物的实例在,例如,美国专利5, 550, 318 ;5, 633, 435 ;5, 780, 708和6, 118, 047 中有举例。
[0112] 本发明的核酸分子或载体可额外地/作为替代地包含筛选标志物。筛选标志物 可用于监视表达。筛选标志物的实例包括β-葡糖醛酸糖苷酶或UidA基因(GUS),其编码 已知有多种发色底物的酶(Jefferson et al.(1987)Plant Mol. Biol. R印.5:387-405); R-座位基因,其编码的产物可调节植物组织中花青素色素(红色)的产生(Dellaporta et al. (1988) "Molecular cloning of the maize R-nj allele by transposon tagging with Ac. " 见 18th Stadler Genetics Symposium, P. Gustafson and R. Appels,编 辑,Plenum, NY(第 263-82 页);β-内酰胺酶基因 (Sutcliffe et al. (1978) Proc.Natl. Acad. Sci. USA 75:3737-41);编码其各种发色底物已知的酶的基因(例如,PADAC,一种发 色头孢菌素);荧光素酶基因(〇w et al. (1986) Science 234:856-9) ;xylE基因,其编码一 种儿茶酚双加氧酶,转换发色的儿茶酚(Zukowski et al. (1983) Gene 46(2-3):247-55); 淀粉酶基因 (Ikatu et al. (1990) Bio/Technol. 8:241-2);酪氨酸酶基因,其编码的 酶能够氧化酪氨酸为DOPA多巴醌,进一步缩合成黑色素 (Katz et al. (1983)J.Gen. Microbiol. 129:2703-14);和 α-半乳糖苷酶。
[0113] 适用于转化宿主细胞的方法包括任何能够将DNA引入到细胞内的方法,例如但 不限于:原生质体转化(参见,例如,美国专利5, 508, 184);干燥/抑制介导的DNA摄取 (desiccation/inhibition-mediated DNA uptake)(参见,例如 Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8);电穿孔(参见,例如,美国专利5, 384, 253);用碳化硅纤维搅 拌(参见,例如,美国专利5, 302, 523和5, 464, 765) ;土壤杆菌介导的转化(参见,例如,美 国专利 5, 563, 055, 5, 591,616, 5, 693, 512, 5, 824, 877, 5, 981,840,和 6, 384, 301);和 DNA 涂覆颗粒的加速(acceleration of DNA-coated particles)(参见,例如,美国专利5,015, 580, 5, 550, 318, 5, 538, 880, 6, 160, 208, 6, 399, 861,和 6, 403, 865)等。通过诸如这些技术 的应用,几乎任何物种的细胞均可以被稳定地转化。在一些实施方案中,转化DNA被整合到 宿主细胞的基因组中。在多细胞物种的情况下,转基因细胞可以再生为转基因生物。任何 这些技术均可用于产生转基因植物,例如,在转基因植物的基因组中包含一个或多个本发 明的核酸序列。
[0114] 最广泛使用的用于将表达载体导入到植物中的方法是基于土壤杆菌的天然转化 系统。根癌土壤杆菌和发根土壤杆菌是可遗传转化植物细胞的植物致病性土壤细菌。根癌 土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物遗传转化的基因 。Ti (肿瘤诱 导)质粒含有一个大区段,称为T-DNA,其可以转移到被转化的植物中。Ti质粒的另一个片 段,vir区,负责T-DNA转移。T-DNA区域的边界由重复序列构成。在某些经修饰的双元载 体中,肿瘤诱导的基因已被删除,并且vir区的功能被利用来转移被T-DNA边界序列包围的 外源DNA。T-区还可以包括,例如,选择标志物,其用于高效回收转基因植物和细胞,和多克 隆位点,其用于插入供转移的序列,例如人造的CTP编码核酸。
[0115] 因此,在一些实施方案中,植物转化载体可衍生自根癌土壤杆菌的Ti质粒(参 见,例如,美国专利 Nos. 4, 536, 475, 4, 693, 977, 4, 886, 937 和 5, 501,967,以及欧洲专利 EP 0 122 791)或发根土壤杆菌的Ri质粒。其他的植物转化载体包括,例如但不限于,在 下列文献中描述的那些:Herrera-Estrella et al.(1983)Nature 303:209-13 ;Bevan et al. (1983),同上;Klee et al. (1985)Bio/Technol. 3:637-42;和欧洲专利 EP 0 120 516, 以及从前述任一种衍生的那些。其它天然与植物互作的细菌,例如中华根瘤菌、根瘤菌属、 和慢生根瘤菌属,也可以被修饰从而介导将基因转移到多种不同的植物中。这些植物相关 的共生菌可以通过获取卸甲(disarmed)的Ti质粒和合适的双元载体而拥有基因转移能 力。
[0116] 在向受体细胞提供外源DNA之后,一般对被转化细胞进行鉴定,以用于进一步的 培养和植株再生。为了提高鉴定被转化的细胞的能力,可能期望采用与用于产生转化体的 载体相伴的选择或筛选标志物基因,如先前所述。在使用选择标志物的情况下,通过使细胞 暴露于选择试剂,在潜在的被转化细胞群体中鉴定被转化的细胞。在使用筛选标志物的情 况下,可以通过期望的标记基因性状对细胞进行筛选。
[0117] 对于暴露于选择试剂时存活的细胞,或在筛选测定中具有阳性得分的细胞,可以 在支持植株再生的培养基中培养。在一些实施方案中,对任何合适的植物组织培养基(例 如,MS和N6培养基)均可加以修饰使其包含更多的物质,如生长调节剂。组织可以保持在 含有生长调节剂的基本培养基中,直到获得足够的组织用于开始植物再生,或者进行多轮 重复的人工选择,直到组织的形态适合于再生(例如,至少2周),然后转移到有利于芽形成 的培养基中。培养被周期性转移,直到形成足够的芽。一旦芽形成,即将它们转移到有利于 根形成的培养基中。一旦有足够的根部形成,可以将植物转移到土壤中进一步生长和成熟。
[0118] 为了确认再生植物中感兴趣的核酸分子(例如编码含有至少一个人造的CTP的多 肽的核苷酸序列)的存在,可以实施的测定有很多种。这些测定包括,例如:分子生物学测 定,如Southern和Northern杂交、PCR和核酸测序;生物化学测定,例如通过如免疫学方法 (ELISA和/或Western印迹)或通过酶促作用检测蛋白质产物的存在;植物部分测定,如 叶或根测定;和全再生植物的表型分析。
[0119] 作为举例,整合事件可以通过PCR扩增进行分析,其使用,例如,特异针对感兴趣 的核苷酸序列的寡核苷酸引物。PCR基因分型理解为包括,但不限于,来自预测含有被整合 到基因组中的感兴趣的核酸分子的分离宿主植物组织的基因组DNA的聚合酶链反应(PCR) 扩增,随后是标准克隆和PCR扩增产物的序列分析。PCR基因分型的方法已经有详细的描述 (参见,例如,Rios, G.et al. (2002)Plant J. 32:243-53),并可应用于衍生自任何植物物种 (例如玉米或大豆)或组织类型(包括细胞培养物)的基因组DNA。
[0120] 使用土壤杆菌依赖的转化方法形成的转基因植物通常含有被插入到一个染色体 上的单一重组DNA序列。该单一重组DNA序列被称作"转基因事件"或"整合事件"。这样 的转基因植物对于所插入的DNA序列而言是杂合的。在一些实施方案中,可以获得对转基 因而言为纯合的转基因植物,这是通过使含有单个外源基因序列的独立分离的转基因植物 与自身(例如F tl植物)有性交配(自交)产生F1种子。所产生的F1种子中四分之一对转 基因而言是纯合的。萌发F 1种子产生能够用于杂合性测试的植物,其中杂合性测定通常使 用允许区分杂合子和纯合子的SNP测定或热扩增测定法(即,合子型测定)。
[0121] 在特定的实施方案中,在其中已经引入了至少一个包含编码至少一个含有至少一 个人造 CTP的多肽的核酸分子的含有质体的细胞内,产生了至少一个人造 CTP的多肽的多 个拷贝。每个含有至少一个人造 CTP的多肽可以由被引入到不同转化事件中的多个核酸序 列表达,或者由被引入到单个转化事件中的单个核酸序列表达。在一些实施方案中,多个这 样的多肽可以在单个启动子的控制下表达。在其它实施方案中,多个这样的多肽可以在多 个启动子的控制下表达。可以表达含有多个肽序列的单一多肽,其中每一个肽序列均将被 导向到质体。
[0122] 除了用重组核酸分子直接转化植物之外,还可以通过将具有至少一个转基因事件 的第一植物与缺少这种事件的第二植物杂交,来制备转基因植物。例如,可以将含有编码包 含至少一个人造 CTP的多肽的核苷酸序列的重组核酸分子引入到适于转化的第一植物品 系内,从而产生转基因植物,可以将转基因植物和第二植物品系杂交,从而将编码该多肽的 核苷酸序列引入到该第二植物品系内。
[0123] VI.包含被人造叶绿体转运肽引导的多肽的植物材料
[0124] 在一些实施方案中,提供了一种植物,其中该植物包含这样的植物细胞:该植物细 胞中含有编码包含至少一个人造 CTP的多肽的核苷酸序列。在特定的实施方案中,这样的 植物可以通过转化植物组织或植物细胞,并再生整株植物来产生。在进一步的实施方案中, 这样的植物可以从商业来源获得,或者通过将含有编码含有至少一个人造 CTP的多肽的核 苷酸序列的核酸渗入到种质中而获得。还提供了这样的植物材料,其包含植物细胞,该植物 细胞中含有编码含有至少一种人造 CTP的多肽的核苷酸序列。这样的植物材料可以从包含 该植物细胞的植物中获得。
[0125] 包含编码包含至少一个人造 CTP的多肽的核苷酸序列的转基因植物或植物材料 在一些实施方案中可表现出一个或多个以下的特征:在植物的细胞内表达该多肽;在植物 细胞的质体内表达该多肽的一部分;将多肽从植物细胞的细胞质导入到细胞的质体内;在 植物细胞内质体特异性地表达该多肽;和/或将多肽定位在植物的细胞内。除了表达编码 的多肽之外,这样的植物可以额外具有一个或多个期望的性状。这些性状可以包括例如:抗 昆虫等害虫以及致病剂;耐除草剂;增强稳定性、产量或保质期;环境抗性;药物生产;工业 产品生产;和营养强化。
[0126] 根据本发明的转基因植物可以是任何能够被本发明核酸分子转化的植物。因 此,该植物可以是双子叶植物或单子叶植物。本发明方法中可以使用的双子叶植物的非 限制性实例包括:拟南芥属,苜蓿,豆类,西兰花,卷心菜,胡萝卜,花椰菜,芹菜,大白菜, 棉花,黄瓜,茄子,莴苣,甜瓜,豌豆,胡椒,花生,马铃薯,南瓜,萝卜,油菜,菠菜,大豆,倭瓜 (squash),甜菜,向日葵,烟草,番茄,和西瓜。本发明方法中可以使用的单子叶植物的非 限制性实例包括:玉米,芸苔属植物(Brassica),洋葱,水稻,高粱,小麦,黑麦,黍,甘蔗,燕 麦,黑小麦,柳枝稷,以及草坪草。根据本发明的转基因植物可以按照任何方式使用或栽培。
[0127] 一些实施方案还提供了含有一个或多个编码包含至少一个人造 CTP的多肽的核 苷酸序列的商业产品,例如从含有一个或多个这样的核苷酸序列的重组植物或种子中产生 的商业产品。含有一个或多个编码包含至少一个人造 CTP的多肽的核苷酸序列的商业产品 包括,例如但不限于:含有一个或多个编码包含至少一个人造 CTP的多肽的核苷酸序列的 植物的食品、柏、油、压碎的或完整的颗粒或种子。在一个或多个商品或商业产品中检测到 一个或多个编码包含至少一个人造 CTP的多肽的核苷酸序列,是事实上的证据,表明该商 品或商业产品至少部分地是由包含一个或多个编码包含至少一个人造 CTP的多肽的核苷 酸序列的植物产生的。在特定的实施方案中,本发明的商品产品包括可检测量的、编码包含 至少一个人造 CTP的多肽的核酸序列。在一些实施方案中,这种商品产品可以通过,例如, 获得转基因植物并从它们制备食物或饲料来生产。
[0128] 在一些实施方案中,含有转基因的转基因植物或种子(该转基因包含编码包含至 少一个人造 CTP的多肽的核苷酸序列)在其基因组中还可以包含至少一个其它的转基因事 件,包括但不限于:转录RNAi分子的转基因事件;编码杀虫蛋白的基因(例如,苏云金芽孢 杆菌杀虫蛋白);除草剂耐受性基因(例如,提供对草甘膦耐受性的基因);和有助于在转 基因植物中产生期望表型的基因(例如,增加产量,改变脂肪酸代谢,或恢复细胞质雄性不 育性)。
[0129] VII.人造叶绿体转运肽介导的基因产物至质体的定位
[0130] 本发明的一些实施方案提供了一种用于将基因产物表达和/或定位于质体(例如 叶绿体)上的方法。在特定的实施方案中,基因产物可以是标志物基因产物,例如,荧光分 子。基因产物作为还包含人造 CTP的多肽的一部分的表达,可以提供一种用来评估特定的 人造 CTP序列的质体定位能力的系统。在一些实施方案中,标记基因广物的表达,其中该标 记基因产物作为包含人造 CTP的多肽的一部分,可用于将标记基因产物的表达导向到表达 该多肽的细胞的质体上。在某些实施方案中,这样的标记基因产物被定位在宿主细胞的质 体上。例如,标志物基因产物在质体中的表达水平可能比在宿主细胞细胞质或其他细胞器 中更商;标志物基因广物可能在质体中的表达水平商得多;标记基因广物可能基本上只在 质体中表达;或者标记基因产物可能完全在质体中表达,从而不能检测到其在细胞质或非 质体细胞器中的表达。
[0131] 在一些实施方案中,包括人造 CTP的功能性变体的多肽,其中该多肽与标志物基 因产物可操作地连接,用于评估功能性变体肽的特性。例如,可以改变人造 CTP序列,例如 在人造 CTP中引入至少一个保守突变,并且可将所得的变体肽和标志物基因产物可操作地 连接。在合适的宿主细胞(例如,其中表达构建体中的一个或多个调节元件可运作的细胞) 中表达后,可以确定标志物基因产物的表达。通过在参考人造 CTP-标记物构建体和变体 肽-标记物构建体之间比较标志物基因产物的亚细胞定位,可以确定变体肽是否提供,例 如,更大的(greater)质体定位,或基本上相同的质体定位。这样的变体可认为是功能性变 体。通过鉴定人造 CTP的能提供更大质体定位的功能性变体,可以将这样的变体中的突变 纳入到进一步的人造 CTP的变体中。执行多轮该评估过程,并随后将被鉴定的有利突变纳 入到人造 CTP序列内,可以产生一个迭代的过程,用于优化人造 CTP序列。这种优化的人造 CTP序列,和编码它们的核苷酸序列,被认为是本发明的一部分,无论此类优化的人造 CTP 序列是否能够通过添加额外的突变而进一步被优化。
[0132] 本文通过援引并入在本文引用的所有参考文献,包括公开、专利和专利申请,以它 们不与本公开的明确记载矛盾为限,并且并入的程度相当于将各参考文献明确地一一援引 并入,如同这些文献全文记载在本文中一样。本文所讨论的参考文献仅是为了提供它们在 本申请申请日之前的公开内容。本发明中任何内容均不应视为发明人承认无权基于发明在 先而要求将本申请视为早于这些公开。
[0133] 提供下面实施例以解释一些特定的特征和/或方面。这些实施例不应当被认为限 制所述特定特征或方面的公开。
[0134] 实施例
[0135] 实施例1 :人造叶绿体转运肽(TraP)序列的设计和制备
[0136] 质体是在高等植物物种中发现的细胞器,并存在于所有植物组织中。叶绿体是在 绿色光合组织中发现的一种特化型质体,负责至关重要的生理功能。例如,其中一种这样的 主要生理功能是合成植物所需的芳香族氨基酸。细胞核编码的酶是此生物合成途径必需 的,这些酶从细胞质被转运到叶绿体的内部。这些细胞核编码的酶通常具有N端转运肽, 其与叶绿体膜相互作用,从而促进肽转运到叶绿体的基质。Bruce B. (2000) Chloroplast transit peptides:structure, function, and evolution. Trends Cell Bio. 10:440 - 447。 在输入时,基质肽酶切掉该转运肽,而使成熟的功能蛋白被输入到叶绿体内。Richter S, Lamppa GK. (1999)Stromal processing peptidase binds transit peptides and initiates their ATP-dependent turnover in chloroplasts. Journ. Cell Bio. 147:33 -43。叶绿体转运肽是可变的序列,其在长度、组成和组织上有高度多样性。Bruce B. (2000) Chloroplast transit peptides:structure, function, and evolution. Trends Cell Bio. 10:440 - 447。叶绿体转运肽的序列相似性在来自不同植物物种的同源蛋白之间有显 著差异。叶绿体转运肽之间的差异大小出乎人们的预料,因为比较加工成熟的功能蛋白时, 从不同植物物种获得的同源蛋白通常具有相对高水平的序列相似度。
[0137] 设计、产生并在植物内测试了新的人造叶绿体转运肽序列。新的人造叶绿体转运 肽显示具有高效的转位和加工性能,用于将农艺学上重要的蛋白转运到叶绿体中。首先,通 过ChloroP?计算机程序分析来自不同植物物种的天然5-烯醇式丙酮酰莽草酸-3-磷酸 合酶(EPSPS)蛋白序列,以鉴定推定的叶绿体转运肽序列(Emanuelsson 0, Nielsen H, von Heijne G, (1999)ChloroP, a neural network-based method for predicting chloroplast transit peptides and their cleavage sites, Protein Science 8 ;978_984),该程序可 以在http://www. cbs. dtu. dk/services/ChloroP/获得。利用叶绿体转运肽序列比对,通 过随机选择氨基酸设计新的人造叶绿体转运肽来生成新的合成推定的叶绿体转运肽序列。 新设计的人造叶绿体转运肽的示例性序列为TraP23 (SEQ ID NO: 11)。对该嵌合叶绿体转运 肽通过多种包括瞬时植物内表达系统的测定法进行测试,还通过转基因手段,将其作为包 含与农艺学上重要的转基因序列融合的基因表达元件的稳定转化事件加以测试。
[0138] 实施例2 :人造叶绿体转运肽(TraP)序列的瞬时植物内测试(Transient In Planta Testing)
[0139] 烟草瞬时测定:
[0140] 首先通过瞬时植物内测定对Trap23人造叶绿体转运肽序列进行了测试。合成 了编码Trap23v2(SEQ ID N0:12)人造叶绿体转运肽序列的多核苷酸序列。所得的构建 体含有两个植物转录单元(PTU)。第一个PTU包括拟南芥泛素10启动子(AtUbilO启 动子;Callis, et al.,(1990) J. Biol. Chem.,265:12486-12493)、TraP-绿色荧光蛋白 融合基因(TraP-GFP ;美国专利号7, 678, 893)、和根癌土壤杆菌ORF 23的3'非翻译区 (Atu0RF23 3' UTR ;美国专利号5, 428, 147)。第二个PTU包括木薯叶脉花叶病毒启动子 (CsVMV promoter ;Verdaguer et al., (1996)Plant Molecular Biology, 31:1129-1139)> dsm-2(DSM2;美国专利申请号2011/0107455)和根癌土壤杆菌ORF I 3'非翻译区 域(AtuORFl 3' UTR ;Huang et al·,(1990) J. Bacteriol. ,172:1814-1822)。构建体 PDAB107640包含TraP23v2叶绿体转运肽(图3)。通过限制酶消化和测序验证了该构建体。 最后,将构建体转化到根癌土壤杆菌中,并作为甘油储液存储。
[0141] 从土壤杆菌甘油储液将一满接种环的冷冻培养物接种到含有2ml YPD (100 μ g/ml 壮观霉素)的14ml无菌管中。将接种后的培养基在28°C温育过夜,同时以200rpm震荡。 翌日,将大约100 μ 1培养物接种在含有25mlYPD (100 μ g/ml壮观霉素)的125ml无菌三隔 挡板烧瓶(tri-baffled flask)中,并在28?下温育过夜,同时以200rpm振荡。第二天, 用无菌的ddH20(pH 8. 0)将培养物稀释至OD_为0. 5。将稀释的土壤杆菌菌株以1:1的比 例与含有P19辅助蛋白的第二土壤杆菌菌株混合。使用该培养物通过下列文献中所述的方 法浸润烟草叶片:Voinnet 0, Rivas S, Mestre P, and Baulcombe D·,(2003) An enhanced transient expression system in plants based on suppression of gene silencing by the pl9protein of tomato bushy stunt virus,The Plant Journal, 33:949-956。将 经过浸润的烟草植株置于Conviron?组件中,在16小时光照、24°C下放置至少三天,直到测 定。
[0142] 显微观察结果
[0143] 从植物切下经土壤杆菌浸润的烟草叶片,并置于含有水的培养皿(petri-dish) 中防止脱水。通过蓝光激发,使用装配好长通滤光片(long-pass filter glasses)的Dark Reader Hand Lamp?(Clare Chemical Research Co. ;Dolores, CO)并使用对经过浸润的 烟草叶片进行观察,以鉴定成功表达GFP报告蛋白的叶片的未损伤区域。将具体鉴定的 叶片区域从叶片切下,并置于水中,通过共聚焦显微镜(Leica TCS-SP5A0BS? Buffalo Grove,IL)成像。YFP报告蛋白使用多谱线氩离子激光器用514nm激光谱线激发。使用一 个无表达的(暗)对照叶片样品调节检测狭缝(slit)的宽度,以排除背景叶自发荧光。同 时在另一个通道内收集叶绿素自发荧光,用于与确定叶绿体定位用的荧光报告蛋白的信号 进行直接比较。
[0144] 显微成像结果表明包含TraP23叶绿体转运肽的GFP荧光蛋白质没有在位于烟草 细胞的叶绿体中积累可检测量的GFP蛋白质(图4)。
[0145] 蛋白质印迹结果:
[0146] 通过Western印迹对经过浸润的烟草植物样品进行测定。收集叶冲孔(leaf punches)样品并进行球珠研磨。将大约100-200mg叶材料与2BBs(Daisy ;Rogers,AR)和 500ml PBST在Kleco?珠磨机中混合3分钟。然后将样品在离心机中4°C下以14, OOOx g离 心沉降。移出上清液,直接通过Western印迹进行分析,或者进行免疫沉淀。免疫沉淀使用 Pierce Direct IP Kit?(Thermo Scientific ;Rockford, IL)并按照制造商的方案进行。大 约50yg抗-GFP被结合在树脂上。样品与树脂在4°C温育过夜。接着,次日早晨对样品进 行清洗和洗脱,并通过与等体积的2X 8M尿素样品缓冲液混合后煮沸样品5分钟准备用于 分析的样品。将煮沸过的样品在MOPS缓冲液中的4-12% SDS-Bis Tris凝胶上运行40分 钟。然后,使用 Invitrogen iBlot?(Life Technologies ;Carlsbad, CA)按照制造商的方案 对凝胶进行印迹。印迹过的膜用PBS-吐温溶液中的5%脱脂奶粉封闭10分钟。用PBS-吐 温溶液中5%的脱脂奶粉以1:1000稀释第一抗体(兔单克隆抗-GFP),并用该第一抗体探 测膜1小时。接着,用PBS-吐温将膜漂洗三次,每次5分钟,以除去所有未结合的第一抗体。 用1:1000稀释的第二单克隆山羊抗兔抗体(Life Technologies)探测膜60分钟。如前所 述地清洗膜,并通过添加 Themo BCIP/NBT底物进行显影。让比色底物显影5-10分钟,然后 用水漂洗印迹,再令印迹干燥。
[0147] Western印迹结果表明GFP蛋白质在经浸润的烟草细胞中表达。pDAB107640浸润 的烟草植物叶组织表达GFP蛋白,表现在存在一个与GFP抗体反应的条带,且其大小与由不 含叶绿体转运肽的GFP对照所得到的GFP蛋白条带相当。此外,这些结果表明TraP人造叶 绿体转运肽被加工且从GFP蛋白质被切割下来。TraP23-GFP构建体表达一个被预加工的蛋 白条带,其分子量大于对照GFP蛋白。Western印迹上存在大小与对照GFP等同的条带表 明TraP23叶绿体转运肽序列被加工,从而将GFP的大小减少至与GFP对照等同的分子量大 小。
[0148] 玉米原牛质体瞬时测定:
[0149] 将Trap23v2叶绿体转运肽编码多核苷酸序列(SEQ ID NO :12)克隆在绿色荧光 蛋白基因的上游,并且纳入到PDAB106598构建体中(图5),用于通过玉米原生质体瞬时 植物内测定法进行测试。所得的构建体含有下列植物转录单元(PTU)。第一个PTU包括 玉米泛素 1 启动子(ZmUbil 启动子;Christensen, A.,Sharrock R.,and Quail P.,(1992) Maize polyubiquitin genes: structure, thermal perturbation of expression and transcript splicing, and promoter activity following transfer to protoplasts by electroporation, Plant Molecular Biology, 18:675-689), TraP-绿色突光蛋白融合基因 (TraP23-GFP ;美国专利7, 678, 893),和玉米过氧化物酶53'非翻译区(ZmPer53' UTR ;美国 专利No. 6384207)。该构建体通过限制酶消化和测序得到了确认。
[0150] 对玉米栽培种B104的种子在含有2?3滴吐温20的50% Clorox (3 %次氯酸钠) 中剧烈震荡大约20分钟进行表面灭菌。将种子用无菌蒸馏水彻底漂洗。将无菌的种子点 种在放有1/2MS培养基的Phytatrays或相似类型的盒子中,并让它们在黑暗中(28°C )中 生长12至20天。使用玉米原生质体瞬时测定法获得并转染来自B104-玉米叶片的原生质 体。这种玉米原生质体测定法是下列文献所述系统的修改版本:Yoo, S. -D.,Cho, Υ. -H.,and Sheen,J.,(2007),Arabidopsis Mesophyll Protoplasts:A Versitile Cell System for Transient Gene Expression Analysis, Nature Protocols, 2:1565-1572。溶液的制备如 Yoo et.al. (2007)所述,只是用于下述实验的甘露醇浓度改为0.6M。
[0151] 100-500 μ 1原生质体(1-5χ105)的转染通过在室温下将原生质体加入到含有约 40 μ g质粒DNA(pDAB106598)的2ml微量离心管中来完成。DNA的体积优选地保持为原生 质体体积的约10%。在5分钟的温育期间偶尔对原生质体和DNA进行混合。将等体积的 PEG溶液缓慢加入到原生质体和DNA中,每次加2滴,在各次加 PEG溶液之间的间隔进行混 合。将试管再温育约10分钟,并偶尔轻轻混合。接着,加入Iml W5+溶液,并颠倒试管数次 混匀。将管在4°C下75x g离心5分钟。最后除去上清液,并将沉淀物重悬浮于Iml WI溶 液中,并将原生质体放置在小培养皿(35x IOmm)中或放置于6孔多孔平板中,并在室温下 黑暗温育过夜。温育12小时后,通过显微镜观察GFP荧光。使用前述的显微镜条件进行成 像。
[0152] 显微镜成像的结果表明,包含TraP23人造叶绿体转运肽的GFP荧光蛋白积累在玉 米细胞细胞质中的叶绿体内,相比之下,对照GFP突光蛋白不转位到玉米细胞细胞质叶绿 体内(图6)。这些显微镜成像结果提示,GFP蛋白转位到叶绿体内是由于TraP23人造叶绿 体转运肽造成的。
[0153] 实施例3:用于在拟南芥(Arabidopsis)中表达农艺上重要的转基因的人造叶绿 体转运肽(TraP)序列
[0154] 大肠杆菌5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSP合酶)中的一个单氨基酸突 变(G96A)会导致草甘勝不敏感性(Padgette et al.,(1991) ;Eschenburg et al.,(2002); Priestman et al·,(2005) ;Haghani et al·,(2008))。尽管该突变会赋予对草甘膦的耐受 性,但是它已知也会不利地影响EPSP合酶与其天然底物--磷酸烯醇式丙酮酸(PEP)的结 合。由此造成的底物结合效率的改变可能会使得突变酶不适合于在植物内提供对草甘膦的 耐受性。
[0155] 在计算机上对NCBI GenBank数据库筛选在EPSP合酶的与该酶的大肠杆菌版 本中引入的G96A突变类似的位置上天然含有丙氨酸的EPSP合酶蛋白和多核苷酸序列 (Padgette et al. , (1991) ;Eschenburg et al. , (2002) ;Priestman et al. , (2005); Haghani et al. , (2008) )〇
[0156] -种被鉴定为在该位置含有天然丙氨酸的酶是来自斯维链霉菌(Streptomyces sviceus)ATCC29083 的 DGT-28 (GENBANK 登录号 N0:ZP_06917240. 1)。进一步的计算机数据 挖掘显示了 3个另外的与DGT-28具有更大同源性的独特链霉菌酶:DGT-31 (GENBANK ACC N0:YP_004922608.1) ;DGT-32(GENBANK ACC N0:ZP_04696613);和 DGT-33(GENBANK ACC N0:NC_010572)。这些酶中的每一个都在EPSP合酶的与该酶的大肠杆菌形式中引入的G96A 突变类似的位置上含有一个天然的丙氨酸。
[0157] 因为来自不同生物体的EPSP合酶蛋白具有不同的长度,所以对大肠杆菌版本的 EPSP合酶的突变编号不一定与对来自其它生物体的EPSP合酶的突变编号相对应。这些鉴 定的EPSP合酶先前并未就其草甘膦耐受性或PEP底物亲和力接受过表征。而且,这些EPSP 合酶代表了一类新的EPSP合酶,且它们不含有任何已经被用于表征先前描述的I类(在美 国专利No. RE39247中进一步描述的植物来源序列)、II类(在美国专利No. RE39247中进 一步描述的细菌来源序列)、和ΠΙ类(在国际专利申请WO 2006/110586中进一步描述的 细菌来源序列)EPSP合酶的序列基序。
[0158] 对新型DGT-28, DGT-31,DGT-32和DGT-33酶的草甘膦耐受性和PEP底物亲和性进 行了表征,并与I类EPSP合酶进行了比较。使用如下的I类酶进行比较:来自大豆的DGT-1, 来自欧洲油菜的DGT-3 (GENBANK登录号NO:P17688),和来自普通小麦的DGT-7 (GENBANK登 录号N0:EU977181)。合成并评估了 I类EPSP合酶及其突变变体。在植物EPSP合酶中导入 的一个突变是与该酶的大肠杆菌版本中的G96A突变的相似位置处导入的甘氨酸向丙氨酸 的突变。此外,在如Funke et al.,(2009)所述的大肠杆菌EPSP合酶的氨基酸97 (T变为 I)和氨基酸101 (P变为S)的相似位置处,在这些I类EPSP合酶中引入了苏氨酸向异亮氨 酸和脯氨酸向丝氨酸的突变。
[0159] DGT-28、DGT-31、DGT-32 和 DGT-33 :
[0160] 新设计的、双子叶植物优化的dgt_28v5多核苷酸序列如SEQ ID NO: 14所示。新 设计的、单子叶植物优化的dgt-28v6多核苷酸序列如SEQ ID NO: 15所示;该序列被稍作修 饰,在第二位氨基酸处包括丙氨酸,以便引入限制性酶切位点。所得的DNA序列具有更高度 的密码子多样性、理想的碱基组成,包含有策略地布置的限制性酶识别位点,且缺少可能干 扰基因转录或产物mRNA翻译的序列。
[0161] 包含SEQ ID NO: 14和SEQ ID NO: 15且含有额外的序列如6-框终止(添加至编 码序列3'端的、位于所有六个阅读框中的终止密码子)和克隆用5'限制性位点的DNA片 段的合成由供应商(DNA2.0, Menlo Park,CA)进行。然后将该合成核酸分子克隆进入表达 载体,并转化进入植物或细菌中,如下文实施例所述。
[0162] 用类似的密码子优化策略来设计dgt-1、dgt-3v2(G173A)、dgt-3v3(G173A ; P178S)、dgt-3v4(T174I ;P178S)、dgt-7v4(T168I ;P172S)、dgt-32v3、dgt-33v3 和 dgt-31v3。这些基因的密码子优化的版本分别如SEQ ID NO: 16、SEQ ID NO: 17、SEQ ID N0:18、SEQIDN0:19、SEQIDN0:20、SEQIDN0:21、SEQIDN0:22和SEQIDN0:23所示。
[0163] 棺物双元载体构建。用标准克降方法构建入门载体(entry vector),其含有叶 绿体转运肽多核苷酸序列与dgt-28连接在一起而形成的合框融合物。将与dgt-28融合 的转运肤(TraP)的入门载体用 In-Fusion? Advantage Technology (Clontech, Mountain View,CA)进行装配。作为融合的结果,第一个氨基酸,甲硫氨酸,被从dgt-28去除。分别 通过DNA2. 0 (Menlo Park, CA)合成编码转运肽的多核苷酸序列TraP4v2 (SEQ ID NO: 24)、 TraP5v2(SEQ ID NO:25),TraP8v2(SEQ ID NO:26),TraP9v2(SEQ ID NO:27),TraP12v2(SEQ ID N0:28)和TraP13v2(SEQ ID N0:29),并融合于dgt-28的到唯一的AccI限制性核酸内 切酶识别位点为止(含)的5'端片段。
[0164] 含有各种TraP和dgt-28表达盒的双元质粒由拟南芥泛素10启动子(AtUbi 10v2 ; Callis, et al·,(1990) J. Biol. Chem. ,265:12486-12493)驱动,并且侧翼是根癌土壤杆菌 开放阅读框 23 的 3' 非翻译区(Atu0RF233' UTR vl ;U. S. Pat. No. 5, 428, 147)。
[0165] 使用 Gateway?技术(Invitrogen, Carlsbad, CA)构建组装的 TraP和 dgt-28 表达 盒,并通过土壤杆菌介导的植物转化将其转化进植物中。限制性核酸内切酶从New England BioLabs (NEB ;Ipswich, MA)获得,并使用 T4DNA 连接酶(Invitrogen)进行 DNA 连接。使 用GatewayK LR Clonaseli酶混合物(InvitroSen)实施Gateway反应,以将一个入门载 体组装到单一目标载体中,该目标载体含有一个选择标志物盒:木薯叶脉花叶病毒启动子 (CsVMV v2;Verdaguer et al.,(1996)Plant Mol.Biol.,31:1129-1139)-DSM-2(美国专 利申请No. 2007/086813)-根癌土壤杆菌开放阅读框1的3'非翻译区(AtuORFl 3' UTR v6;Huang et al·,(1990)J.Bacteriol. 172:1814-1822)。使用 NucleoSpin'(质粒试剂盒 (Macherey-Nagel Inc. ,Bethlehem, PA)或质粒 Midi 试剂盒(Qiagen)按照供应商的指导 进行质粒制备。琼脂糖Tris-乙酸凝胶电泳后,使用QIAquick?凝胶提取试剂盒(Qiagen) 分离DNA片段。
[0166] 所有组装质粒的集落首先通过微量制备DNA的限制性消化进行筛选。将选定的集 落的质粒DNA由商业测序公司(Eurofins? MWG Operon, Huntsville, AL)进行测序。使用 Sequencher?软件(Gene Codes Corp. ,Ann Arbor, MI)对序列数据进行组装和分析。
[0167] 下列双元构建体表达多种TraP:dgt-28融合基因序列:pDAB107527含 有 TraP4v2:dgt-28v5(SEQ ID N0:30) ;pDAB105530 含有 TraP5v2:dgt-28v5(SEQ ID N0:31) ;pDAB105531 含有 TraP8v2:dgt-28v5(SEQ ID N0:32) ;pDAB105532 含有 TraP9v2:dgt-28v5(SEQIDN0:33);pDAB105533含有TraP12v2:dgt-28v5(SEQIDN0:34) ; 和 PDAB105534 含有 TraP13v2:dgt-28v5(SEQ ID N0:35)。pDAB105534 的 dgt-28v5 序列经 过修饰,其中将第一密码子(GCA)变成(GCT)。
[0168] 额外的棺物双元载体构律。类似于hf所沭的克降策略用来构律含有dgt-31、 dgt-32、dgt-33、dgt-1、dgt-3 和 dgt-7 的双元质粒。
[0169] 微生物衍生的基因:将dgt-31、dgt-32和dgt-33与不同于之前所述的叶绿体转 运肽融合。使用下列叶绿体转运肽:TraP14v2(SEQ ID N0:36)、TraP23v2(SEQ ID N0:37)、 TraP24v2(SEQ ID 勵:38)邛0六8107532 含有融合于 TraP14 v2(SEQ ID N0:39)的 dgt-32v, PDAB107534 含有融合于 TraP24 v2(SEQ ID N0:40)的 dgt-33 v3,pDAB107533 含有融合于 TraP23 v2(SEQ ID N0:41)的dgt-31 vSodgt表达盒由拟南芥泛素10启动子(AtUbilO启动 子v2)驱动并且其侧翼为根癌土壤杆菌开放阅读框23的3'未翻译区域(Atu0RF233' UTR vl)。该双元载体中还存在一个含有木薯脉花叶病毒启动子(CsVMVv2) -DSM-2-根癌土壤 杆菌开放阅读框1的:V未翻译区域(AtuORFl 3' UTRv6)的DSM-2选择标志物盒。
[0170] 构建额外的双元载体,其中dgt-31 v3、dgt-32 v3和dgt-33 v3融合于前文所述 的叶绿体转运肽序列。例如,TraP8 v2序列融合于dgt-31 v3、dgt-32 v3和dgt-33 v3,并 克隆进入上述的双元载体中。
[0171] 构建含有I类基因(dgt-l、dgt-3和dgt-7)的双元载体。构建下列双元载体并转 化至植物中:PDAB4104,其含有美国专利申请公开No. 2011/0124503中描述的dgt-1 v4序 列,侧翼为美国专利申请公开No. 2009/0064376中描述的Nicotiana tabacum Osmotin序 列;PDAB102715 ;pDAB102716 ;pDAB102717 ;和 pDAB102785。未将用来与 dgt-28、dgt-31、 dgt-32和dgt-33融合的各种TraP叶绿体转运肽添加至I类基因,因为这些植物衍生的序 列具有天然的植物叶绿体转运肽。这些载体详细描述于表1中。
[0172] 表1含I类EPSP合酶基因(即dgt-1、dgt-3或dgt-7)的双元载体的描述。

【权利要求】
1. 分尚的核酸分子,其包含: 编码人造叶绿体转运肽的核苷酸序列,该核苷酸序列衍生自从5-烯醇式丙酮酰莽草 酸-3-磷酸合成酶(EPSPS)的比对得到的参考核苷酸序列。
2. 权利要求1的分离的核酸分子,还包含可操作地连接于所述编码人造叶绿体转运肽 的核苷酸序列的感兴趣的核苷酸序列。
3. 权利要求1的分离的核酸分子,其中所述参考核苷酸序列是从分离自选自下组的种 的5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)的比对得到的:芸苔属的种(Brassica sp·)、大豆属的种(Glycine max sp·)、拟南芥属的种(Arabidopsis sp.)和 Duneila sp.。
4. 权利要求1的分离的核酸分子,其中所述参考核苷酸序列是从选自SEQ ID N0:l-10 的多肽的比对得到的。
5. 权利要求1的分离的核酸分子,其中所述人造叶绿体转运肽与SEQ ID N0:11的叶绿 体转运肽至少80 %相同。
6. 权利要求5的分离的核酸分子,其中所述人造叶绿体转运肽与SEQ ID N0:11的叶绿 体转运肽至少85 %相同。
7. 权利要求6的分离的核酸分子,其中所述人造叶绿体转运肽与SEQ ID N0:11的叶绿 体转运肽至少90 %相同。
8. 权利要求7的分离的核酸分子,其中所述人造叶绿体转运肽与SEQ ID N0:11的叶绿 体转运肽至少95 %相同。
9. 权利要求8的分离的核酸分子,其中所述人造叶绿体转运肽与SEQ ID N0:11的叶绿 体转运肽至少98 %相同。
10. 权利要求9的分离的核酸分子,其中所述人造叶绿体转运肽包含SEQ ID NO: 11。
11. 权利要求1的分离的核酸分子,其中所述编码人造叶绿体转运肽的核苷酸序列能 够与SEQ ID NO: 12的核酸特异性杂交。
12. 权利要求2的分离的核酸分子,其还包含至少一个额外的核苷酸序列,每个核苷 酸序列编码叶绿体转运肽,其中所述额外的核苷酸序列可操作地连接于感兴趣的核苷酸序 列。
13. 权利要求12的分离的核酸分子,其中所述至少一个额外的核苷酸序列来自选自下 组的生物:原核生物、低级光合真核生物和绿藻。
14. 权利要求2的分离的核酸分子,其中所述编码人造叶绿体转运肽的序列和感兴趣 的核苷酸序列可操作地连接于一个或多个调控序列。
15. 权利要求2的分离的核酸分子,其中所述核酸分子编码包含由所述感兴趣的核苷 酸序列编码的肽和所述人造叶绿体转运肽的嵌合多肽。
16. 由权利要求15的核酸分子编码的嵌合多肽。
17. 权利要求16的嵌合多肽,其中由所述感兴趣的核苷酸序列编码的肽被导向含质体 细胞中的质体。
18. 权利要求17的嵌合多肽,其中所述多肽包含人造叶绿体转运肽,该人造叶绿体转 运肽在所述由感兴趣的核苷酸序列编码的肽被导向到所述质体时被移除。
19. 权利要求16的嵌合多肽,其中所述由感兴趣的核苷酸序列编码的肽为生物活性 肽。
20. 权利要求16的嵌合多肽,其中所述由感兴趣的核苷酸序列编码的肽是荧光肽。
21. 权利要求19的嵌合多肽,其中所述生物活性肽选自下组:乙酰乳酸合酶(ALS)、突 变的ALS、ALS的前体、3-烯醇式丙酮酰莽草酸-5-磷酸合成酶(EPSPS)、CP4EPSPS和III 类 EPSPS。
22. 权利要求19的嵌合多肽,其中所述生物活性肽为DGT-28或Cry2Aa。
23. 权利要求19的嵌合多肽,其中所述生物活性肽参与选自下组的过程:除草剂抗性, 病毒抗性,细菌病原体抗性,昆虫抗性,线虫抗性,真菌抗性,植物活力,植物产量,温度耐受 性,土壤条件耐受性,低光照水平耐受性,低水位耐受性,高水位耐受性,化学环境耐受性, 种子颜色,淀粉改性,氨基酸合成,光合作用,脂肪酸合成,油合成,类胡萝卜素合成,萜类合 成,淀粉合成,和除草剂抗性。
24. 权利要求19的嵌合多肽,其中所述生物活性肽参与除草剂抗性。
25. -种植物材料,其包含权利要求2的核酸分子。
26. 权利要求35的植物材料,其中所述植物材料选自植物细胞、植物组织、植物组织培 养物、愈伤组织培养物、植物部分、和全植物。
27. 权利要求25的植物材料,其中所述核酸分子稳定地整合在来自该植物材料的细胞 的基因组中。
28. -种制备转基因植物材料的方法,该方法包括: 获得权利要求2的分离的核酸分子;和 用所述核酸分子转化植物材料。
29. 通过根据权利要求28的方法产生的转基因植物材料。
30. 分离的核酸分子,其包含用于将多肽导向至叶绿体的EPSPS衍生的手段。
31. 权利要求30的分离的核酸分子,其还包含可操作地连接于所述用于将多肽导向至 叶绿体的EPSPS衍生的手段的感兴趣的核苷酸序列。
32. 权利要求31的分离的核酸分子,其中所述核酸分子编码嵌合多肽,所述嵌合多肽 包含由所述感兴趣的核苷酸序列编码的肽。
33. -种植物表达载体,其包含权利要求31的核酸分子。
34. -种植物材料,其包含权利要求33的核酸分子。
35. -种制备转基因植物材料的方法,所述方法包括: 获得权利要求31的分离的核酸分子;和 用所述核酸分子转化植物材料。
36. 根据权利要求35的方法,其中所述植物材料选自下组:植物细胞、植物组织、植物 组织培养物、愈伤组织培养物、植物部分、和全植物。
37. 通过根据权利要求35的方法产生的转基因植物材料。
38. 由权利要求37的转基因植物材料再生的转基因植物。
39. 权利要求26的植物材料,其中所述植物材料是不能被再生以生成植物的植物细 胞。
40. 权利要求28的方法,其中所述植物材料是不能被再生以生成植物的植物细胞。
【文档编号】A01H5/00GK104219949SQ201380017054
【公开日】2014年12月17日 申请日期:2013年2月1日 优先权日:2012年2月1日
【发明者】J·M·里拉, R·M·西奇洛, C·耶基斯, A·E·鲁宾逊 申请人:陶氏益农公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1