人造的芸苔属衍生的叶绿体转运肽的制作方法

文档序号:3489753阅读:645来源:国知局
人造的芸苔属衍生的叶绿体转运肽的制作方法
【专利摘要】本公开涉及用于将肽、多肽和蛋白质导向到含质体细胞的质体上的组合物和方法。在一些实施方案中,本公开涉及可以将多肽导向到质体上的叶绿体转运肽(chloroplasttransitpeptide),及编码它的核酸分子。在一些实施方案中,本公开涉及用于产生含有叶绿体转运肽的转基因植物材料(例如转基因植物)的方法,以及通过这种方法产生的植物材料,和从其产生的植物商业产品。
【专利说明】人造的芸苔属衍生的叶绿体转运肽
[0001] 优先权声明
[0002] 本申请要求获得2012年2月1日提交的美国临时专利申请系列号No. 61/593,555 的利益,还要求获得2012年4月17日提交的美国临时专利申请系列号No. 61/625,222的 利益。
[0003] 根据37C. F. R. § 1. 821 (c)或(e)_作为ASCII文本文件提交的序列表的声明
[0004] 根据37C. F. R. § 1. 821 (C)或(e),含有ASCII文本格式的序列表的文件已经和本 专利申请一起提交。

【技术领域】
[0005] 本公开涉及用于遗传编码和表达被导向到含质体细胞的质体上的多肽的组合物 和方法。在某些实施方案中,本公开涉及将多肽导向到(例如高等植物的)叶绿体上的氨 基酸序列,和/或编码所述氨基酸序列的核酸分子。在某些实施方案中,本公开涉及嵌合多 肽,其含有控制该嵌合多肽到质体的转运的氨基酸序列,和/或编码该嵌合多肽的核酸分 子。
[0006] 背景
[0007] 植物细胞含有多种不同的亚细胞细胞器,它们被统称为"质体",由特征性的膜系 统限定边界并在细胞内执行专化的功能。某些质体负责光合作用,以及特定化合物的合成 和储存。所有质体均来源于存在于植物的分生组织区内的原质体(proplastids)。原质体 可能发育成,例如:叶绿体,黄化体(etioplasts),有色体,老质体(gerontoplasts),白色 体(Ieucoplasts),淀粉体,油质体(elaioplasts)和蛋白质体(proteinoplasts)。质体以 一种半自主的方式存在于细胞内,它们含有其自身的遗传体系和蛋白质合成机构,但其发 育和生物合成活性依赖与细胞核-细胞质系统的密切合作。
[0008] 在1?等植物的光合作用叶细胞中,最让人关注的质体是叶绿体。叶绿体最基本的 功能是实施光驱动的光合作用反应。但是,叶绿体还实施许多其它对于植物细胞重要的生 物合成过程。例如,细胞的所有脂肪酸均是由位于叶绿体基质内的酶使用在叶绿体基质内 容易获得的ATP、NADPH和碳水化合物制造的。而且,在叶绿体中,光活化电子的还原力驱动 亚硝酸盐(NO 2O还原成氨(NH3);这种氨为植物提供了合成氨基酸和核苷酸所需的氮。
[0009] 叶绿体还参与农用化学品工业中的特别重要的过程。例如,已知许多除草剂通过 阻断在叶绿体内运作的功能来发挥作用。新近的研究已经鉴定了多种除草剂的特定靶标。 例如,三嗪衍生的除草剂通过将质体醌分子从其在光系统II的32kD多肽中的结合位点上 取代下来而抑制光合作用。这个32kD多肽由叶绿体基因组编码,并由细胞器机构合成。已 经获得了对三嗪类除草剂有抗性的突变体植物。这些植物含有突变的32kD多肽,其上面的 质体醌不再能够被三嗪类除草剂取代。磺酰脲类抑制叶绿体中的乙酰乳酸合酶。乙酰乳 酸合酶参与异亮氨酸和缬氨酸的合成。草甘膦抑制5-烯醇式丙酮酰莽草酸-3-磷酸合酶 (EPSPS),其是一种参与芳香族氨基酸人造的酶。所有这些酶都是由细胞核基因组编码的, 但它们被转运到叶绿体内,实际的氨基酸合成在叶绿体内进行。
[0010] 大多数叶绿体蛋白质在植物细胞的细胞核内编码,在胞浆中合成为更大的前体蛋 白,并在翻译后被转运到叶绿体中。跨越外层和内层包膜而转运进入基质是以基质、类囊体 膜和类囊体腔为目的地的蛋白质的主要进入机制。被转入的前体蛋白向类囊体膜和类囊体 腔的定位通过四种不同的机制完成,其中两种与细菌蛋白质转运系统同源。因此,将蛋白定 位在叶绿体内的机制在一定程度上是来源于原核共生菌。Cline and Henry (1996) ,Annu. Rev. Cell. Dev. Biol. 12:1-26。
[0011] 运往叶绿体表达的前体蛋白含有称作叶绿体转运肽(CTP)的N端延伸 (extension)。转运肽在叶绿体表面的特异性识别中起作用,并参与介导在翻译后将前体 蛋白转运通过叶绿体包膜,并从叶绿体包膜转运到叶绿体的各个亚室(sub-compartment) (如基质、类囊体和类囊体膜)。这些N端转运肽序列包含将叶绿体蛋白转运到质体内所需 的全部信息;转运肽序列对于质体引入是必要而充分的。
[0012] 据报道在其N端具有天然编码的转运肽序列的植物基因包括:核酮糖1,5二磷 酸羧化酶(RuBisCo)的叶绿体小亚基(de Castro Silva-Filho et al. (1996),Plant Mol. Biol. 30:769-80 ;Schnell et al. (1991),J. Biol. Chem. 266:3335-42) ;EPSPS(见, 例如,Archer et al. (1990),J.Bioenerg. and Biomemb. 22:789-810 和美国专利 6,867,293,7,045,684,和 Re.36,449);色氨酸合酶(21^〇6七&1.(1995),了.81〇1· Chem. 270:6081-7);质体蓝素 (Lawrence et al. (1997),J. Biol. Chem. 272:20357-63);分 支酸合酶(Schmidt et al. (1993),J. Biol. Chem. 268:27447-57);捕光叶绿素 a/b 结合蛋 白(LHBP) (Lamppa et al. (1988),J. Biol. Chem. 263:14996-14999),和拟南芥的叶绿体蛋 白(Lee et al. (2008),Plant Cell20:1603-22)。美国专利公开 No. US 2010/0071090 提供 了 一些来自衣藻的叶绿体导向性肽。
[0013] 然而,由于叶绿体导向肽的序列有高度多样性且缺少共同或共有序列基序,虽然 有可能存在具有独立结构基序的叶绿体导向肽的独特亚群,但是叶绿体导向肽所编码信息 的结构要求仍然难以把握。Lee等人.(2008),同上。此外,并非所有这些序列均可用于在 高等植物中异源表达叶绿体导向的蛋白质。
[0014] 发明公开
[0015] 本文描述了用于植物中多肽的质体导向的组合物和方法。在一些实施方案中,组 合物包含核酸分子,核酸分子包含至少一个编码与感兴趣的核苷酸序列可操作地连接的人 造芸苔属来源叶绿体转运肽(例如TraP12肽和TraP13肽)。在特定的实施方案中,这些核 酸分子可用于单子叶或双子叶植物中由感兴趣的核苷酸序列编码的多肽的表达和导向。进 一步描述了包含核酸分子的载体,所述核酸分子含有至少一个编码与感兴趣的核苷酸序列 可操作地连接的人造芸苔属来源叶绿体转运肽的核苷酸序列。
[0016] 在一些实施方案中,编码人造芸苔属来源CTP的核苷酸序列可以是这样的核苷 酸序列,该序列衍生自从芸苔属物种基因(欧洲油菜(B.napus)、芜青(B.rapa)、芥菜 (B.Juncea)和埃塞俄比亚芥(B.carinata))获得的参考核苷酸序列,或其功能性变体。在 一些实施方案中,编码人造芸苔属来源CTP的核苷酸序列可以是嵌合核苷酸序列,其包含 来自芸苔属物种基因的部分CTP编码核苷酸序列,或其功能性变体。在特定的实施方案中, 编码人造芸苔属来源CTP的核苷酸序列可含有多个连续的核苷酸序列,这些核苷酸序列分 别获自:参考芸苔属物种CTP,和来自该芸苔属物种的不同基因、不同芸苔属物种、或不同 生物体(例如植物、原核生物和低等光合真核生物)的CTP,或任何前述者的功能性变体。 在特定的实施方案中,某个连续的核苷酸序列可以从参考芸苔属CTP的直系同源核苷酸序 列获得,所述直系同源核苷酸序列从所述参考芸苔属植物基因在不同生物体中的直系同源 物(例如不同的芸苔属植物基因组)获得。在这些和进一步的实施方案中,编码人工芸苔 属来源的CTP的核苷酸序列可以是嵌合核苷酸序列,其包含多于一种编码CTP的核苷酸序 列。
[0017] 在一些实例中,编码人造芸苔属来源CTP的核苷酸序列可以是嵌合核苷酸序列, 其包含来自芸苔属植物的部分CTP核苷酸序列,或其功能性变体。在具体的实例中,编码 人造芸苔属来源CTP的核苷酸序列含有多个连续的从欧洲油菜(B.napus)获得的核苷酸 序列,或其功能性变体。在更进一步的实例中,编码人造芸苔属来源CTP的核苷酸序列可含 有:从芸苔属获得的连续的核苷酸序列或其功能性变体,和从拟南芥属物种基因获得的连 续的核苷酸序列或其功能性变体。
[0018] 在一些实施方案中,组合物包括一种核酸分子,其包含至少一个芸苔属来源的用 于将多肽导向到叶绿体上的手段(means)。进一步描述了多个核酸分子,其包含如下的核酸 分子,该核酸分子包含至少一个与感兴趣的核苷酸序列可操作地连接的、用于将多肽导向 到叶绿体的芸苔属来源的手段。在特定的实施方案中,这种核酸分子可用于在单子叶植物 或双子叶植物中表达和导向由感兴趣的核苷酸序列编码的多肽。为本公开的目的,用于将 多肽导向到叶绿体上的芸苔属来源的手段是指特定的人造核苷酸序列。在特定的实施方案 中,用于将多肽导向到叶绿体上的芸苔属来源的手段选自下组:在本文中被称作TraP12和 TraP13的核苷酸序列。
[0019] 本文还描述了植物材料(例如但不限于:植物、植物组织和植物细胞),其包含核 酸分子,该核酸分子包含至少一个与感兴趣的核苷酸序列可操作地连接的、编码人造的芸 苔属来源的CTP的核苷酸序列。在一些实施方案中,植物材料可以具有这种稳定整合到其 基因组中的核酸分子。在一些实施方案中,植物材料可以瞬时表达如下所述的核酸分子的 产物,该核酸分子含有至少一个与感兴趣的核苷酸序列可操作地连接的、编码人造的芸苔 属来源的CTP的核苷酸序列。
[0020] 还描述了用于在含质体细胞(例如植物)中的质体(例如叶绿体)内表达核苷酸 序列的方法。在特定的实施方案中,可以使用含有至少一个与感兴趣的核苷酸序列可操作 地连接的、编码人造的芸苔属来源的CTP的核苷酸序列的核酸分子转化植物细胞,从而在 植物细胞的细胞质中产生包含与感兴趣的核苷酸序列的表达产物融合的人造的芸苔属来 源的CTP的前体融合多肽,然后该融合多肽被体内转运到该植物细胞的叶绿体中。
[0021] 进一步描述了用于产生包含核酸分子的转基因植物的方法,其中该核酸分子包含 至少一个与感兴趣的核苷酸序列可操作地连接的、编码人造的芸苔属来源的CTP的核苷酸 序列。还描述了从这种转基因植物产生的植物商业产品(例如种子)。
[0022] 通过下文参考附图对多个实施方案的详细说明,前述和其它的特征将不言自明。
[0023] 附图简述
[0024] 图1示出的mRNA分子,它们代表了与感兴趣的核苷酸序列可操作地连接的、编码 人造的芸苔属来源的CTP的核苷酸序列(例如TraP12和TraP13)。在一些实施方案中, mRNA分子(如所示的这些)可以从DNA分子转录而来,DNA分子其含有开放阅读框,开放阅 读框包含与感兴趣的核苷酸序列可操作地连接的、编码人造的芸苔属来源的CTP的核苷酸 序列。在一些实施方案中,感兴趣的核苷酸序列可以是编码感兴趣的肽的序列,例如但不限 于,要被导向到质体上的标记基因产物或肽。
[0025] 图2包括了来自欧洲油菜(SEQ ID NO: 2)和拟南芥(SEQ ID NO:4)的EPSPS蛋白 的预测的叶绿体转运肽的比对结果。星号指示了序列被切割(spit)并重组形成TraP12和 Trapl3的位置。
[0026] 图3示出的是质粒图谱pDAB101981。
[0027] 图4示出的是质粒图谱pDAB 101989。
[0028] 图5示出的是质粒图谱pDAB 101908。
[0029] 图6的显微镜图片显示了浸润到烟草叶组织中的TraP12_YFP被转位到烟草叶组 织的叶绿体内。
[0030] 图7的显微镜图片显示了浸润到烟草叶组织中的TraP13-YFP被转位到烟草叶组 织的叶绿体内。
[0031] 图8包含显微镜图片,其显示了浸润到烟草叶组织中的无导向YFP对照没有被纳 入到烟草叶组织的叶绿体内。
[0032] 图9包含显微镜图片,其显示了转化到玉米原生质体中的TraP12_YFP被转位到玉 米原生质体的叶绿体内。
[0033] 图10示出的是质粒图谱pDAB105528。
[0034] 图11示出的是质粒图谱pDAB105529。
[0035] 图12示出的是质粒图谱pDAB107686。
[0036] 图13示出的是质粒图谱pDAB107687。
[0037] 图14示出的是质粒图谱pDAB112711。
[0038] 图15示出的是质粒图谱pDAB11479。
[0039] 图16示出的是质粒图谱pDAB112712。
[0040] 图17示出的是质粒图谱pDAB112710。
[0041] 图18示出的是质粒图谱pDAB017540。
[0042] 图19示出的是质粒图谱pDAB107617。
[0043] 实施本发明的模式
[0044] 1.多个实施方案概览
[0045] 叶绿体转运肽(CTP)(或质体转运肽)以共翻译(co-translationally)或翻译后 方式发挥功能,将包含CTP的多肽引导到质体(例如叶绿体)上。在本发明的一些实施方 案中,内源性叶绿体蛋白质或是异源蛋白质均可通过将该蛋白表达为含有CTP的较大前体 多肽而被导向到叶绿体中。在特定的实施方案中,CTP可以衍生自从芸苔属物种基因获得 的核苷酸序列,通过例如,但不限于,纳入至少一个来自从不同生物体获得的直系同源基因 的连续序列,或其功能性变体衍生而来。
[0046] 在一个示例实施方案中,从获自欧洲油菜的EPSPS基因序列(NCBI数据库登录号 No. P17688)中分离多个核酸序列,每一个核酸序列均编码CTP。CTP编码核酸序列是通过 用ChloroP预测服务器分析EPSPS基因序列分离的。Emanuelsson et al. (1999),Protein Science 8:978-84 (可以在 cbs. dtu. dk/services/ChloroP 访问)。分离的 CTP 编码序列 的预测蛋白产物是大约60-70个氨基酸长的转运肽。从获自拟南芥的直系同源EPSPS基因 (NCBI数据库登录号NP_182055)中分离了 CTP编码核酸序列。在该实例中,使用天然欧洲 油菜CTP作为参考序列来设计示例性的人造的芸苔属来源的CTP,方法是在欧洲油菜CTP中 的特定位置处融合来自拟南芥CTP的连续序列。该设计过程例示了根据某些方面从芸苔属 物种和拟南芥属物种的核酸序列开发新型人工CTP的过程。这些示例性的人造的芸苔属来 源的CTP在本公开全文中被称作TraP12和Trapl3。测试这些示例的人造 TraP的质体导向 功能,发现它们显示的质体导向至少不逊于对单独的天然芸苔属序列观察到的质体导向。
[0047] 在进一步的示例实施方案中,独立地合成多个核酸序列,每一个均编码本发明的 人造 TraP肽,并将它们与编码黄色荧光蛋白(YFP)的核酸序列可操作地连接,从而产生多 个人造的核酸分子,每一个均编码嵌合TraP:YFP融合多肽。将这些核酸分子,它们每一个 均编码嵌合TraP: YFP多肽,分别倒入到双元载体中,使得每一个TraP: YFP编码核酸序列与 AtUbi 10启动子可操作地连接。
[0048] 在更进一步的示例实施方案中,将多个包含与AtUbi 10启动子可操作地连接的 TraP:YFP编码核酸序列的双元载体通过土壤杆菌介导的转化分别独立地瞬时转化到烟草 (本氏烟草(Nicotiana benthamiana))中。共聚焦显微术和Western印迹分析证实,每一 个TraP均成功地将YFP导向到了烟草叶绿体上。
[0049] 在进一步的示例实施方案中,独立地合成了多个核酸序列,每一个均编码本发明 的人造 TraP肽,并将它们与编码农艺学上重要的基因序列的核酸序列可操作地连接。将 TraP序列与除草剂耐受性性状(例如dgt-28和dgt-14)融合,从而产生多个人造的核酸 分子,每一个均编码嵌合的TraP:DGT-28或TraP:DGT-14融合多肽。将这些核酸分子,它们 中每一个均编码嵌合的TraP: DGT-28或TraP: DGT-14多肽,分别引入双元载体中,从而使每 一个TraP: dgt-28或TraP: dgt-14编码核酸序列均与启动子或其它基因调节元件可操作地 连接。用这些含有TraP:dgt-28或TraP:dgt-14编码核酸序列的双元载体转化各种植物物 种。对转基因植物测定由于DGT-28或DGT-14酶的表达和转位到叶绿体导致的除草剂耐受 性。
[0050] 在进一步的示例实施方案中,独立地合成多个核酸序列,每一个均编码本发明的 人造 TraP肽,并与编码农艺学上重要的基因序列的核酸序列可操作地连接。将TraP序列 与昆虫耐受性性状(例如(^7243,¥1口3&131,(^7]^,(^7]^(3和(^71〇3)融合,从而产生多个 人造的核酸分子,其每一个均编码嵌合的TraP:Cry2Aa, TraP: Vip3Abl, TraP:CrylF, TraP:C rylAc或TraP:CrylCa融合多肽。将这些核酸分子,其中每一个均编码嵌合的TraP:cry2A a, TraP: vip3abl, TraP: crylF, TraP: crylAc 或 TraP: crylCa 多肤,分别引入双兀载体中,使 得每一个 TraP: cry2Aa, TraP: vip3abl, TraP: crylF, TraP: cryIAc 或 TraP: crylCa 编码核酸 序列均与启动子或其它基因调节元件可操作地连接。用含有TraP:cry2Aa, TraP: vip3abl, T raP: cry IF, TraP: cry IAc或TraP: cry ICa编码核酸序列的双元载体转化各种植物物种。对 转基因植物测定由于Cry2Aa, Vip3Abl, CrylF, CrylAc或CrylCa酶的表达和转位到叶绿体 导致的除草剂耐受性。
[0051] 鉴于前述的详细工作实施例,本发明的人造的芸苔属来源的CTP序列和编码它们 的核酸,可用于在广大范围的含质体细胞内将任何多肽引导到质体上。例如,通过通过本公 开提供给本领域技术人员的方法,可以将包含人造的芸苔属来源的CTP序列、且该序列与 任意的第二个肽序列的N端融合的嵌合多肽引入到含质体的宿主细胞内(或在其中表达), 以便将所述第二个肽序列导向到质体上。因此,在特定的实施方案中,本发明的TraP肽,与 天然CTP相比,可以提供期望在质体上表达的肽的更高的引入和加工效率。
[0052] II.缩写
[0053] CTP 叶绿体转运肽
[0054] Bt 苏云金芽孢杆菌
[0055] EPSPS 3-烯醇式丙酮酰莽草酸-5-磷酸合酶
[0056] YFP 黄色荧光蛋白
[0057] Ti 肿瘤诱导型(来源于根癌土壤杆菌的质粒)
[0058] T-DNA 转运 DNA
[0059] III.术语
[0060] 为了便于审阅本公开的各个实施方案,提供了特定术语的如下解释:
[0061] 叶绿体转运肽:如本文所使用的,术语"叶绿体转运肽"(CTP)(或"质体转运肽") 可以指如下的氨基酸序列,当其存在于多肽的N端时,会指导该多肽进入含质体细胞(例如 植物细胞,例如在全植物或植物细胞培养物中)的质体内。CTP对于指导蛋白质转运进入 宿主细胞的质体(例如,初级、二级或三级质体,例如叶绿体)而言一般是必要而且充分的。 通过多种可用的算法中的任一种(例如PS0RT,和ChloroP (可以在cbs. dtu. dk/services/ ChloroP获得))可以鉴定推定的叶绿体转运肽。ChloroP可以提供特别好的CTP预测。 Emanuelsson et al. (1999) ,Protein Science 8:978-84。然而,任何现有算法均不能以 100%的效率实现功能性CTP的预测。因此,确认所鉴定出的假定CTP是否确实如预期的那 样发挥功能(例如,在体外或体内方法中)是重要的。
[0062] 叶绿体转运肽可以位于被转运到质体内的多肽的N端。CTP可以帮助含有CTP的多 肽的共翻译或翻译后的向质体中的转运。叶绿体转运肽通常含有大约40-大约100个氨基 酸,这些CTP已经被观察到含有某些共同的特征。例如:CTP所含的带负电荷氨基酸(例如 天冬氨酸、谷氨酸、天冬酰胺或谷氨酰胺)非常少(即使有的话);CTP的N端区缺少带电氨 基酸、甘氨酸和脯氨酸;CTP的中心区还很可能含有非常高比例的碱性或羟基化氨基酸(例 如丝氨酸和苏氨酸);并且CTP的C端很可能富含精氨酸,并具有构成两亲性β折叠片结 构的能力。在包含CTP的多肽被转运到质体内之后,质体蛋白酶可以将CTP与包含CTP的 多肽的其余部分切离。
[0063] 接触:如本文关于核酸分子所使用的,术语与细胞、组织或生物体(例如植物细 胞;植物组织;和植物)"接触",或被细胞、组织或生物体"摄取",包括核酸分子被内化到生 物体中,例如但不限于:使生物体与包含该核酸分子的组合物接触;和用含有该核酸分子 的溶液浸泡生物体。
[0064] 内源的:如本文所使用的,术语"内源的"是指源自于特定生物体、组织或细胞的物 质(例如,核酸分子和多肽)。例如,植物细胞内表达的"内源"多肽可以指通常在来自相同 物种的非遗传工程化植物的相同类型的细胞内表达的多肽。在一些实例中,可以利用来自 芸苔属物种的内源基因(例如EPSPS基因)来获得参考芸苔属CTP基因。
[0065] 表达:如本文所使用的,编码序列(例如基因或转基因)的"表达"是指核酸转录 单元(包括例如基因组DNA或cDNA)的编码信息转变成细胞的运作性(operational)、非运 作性或结构性部分的过程,往往包括蛋白质的合成。基因表达可能受到外部信号(例如,细 胞、组织或生物体暴露于可以增加或降低基因表达的作用剂)的影响。基因的表达还可以 在从DNA到RNA到蛋白的通路中的任何地方被调节。基因表达的调节可以通过例如下述方 式发生:对转录、翻译、RNA转运和加工、中间分子如mRNA的降解等的控制,或者通过在特定 蛋白分子产生后使其活化、失活、区室化(compartmentalization)或降解,或者通过前述 的任何组合。基因表达可以通过本领域已知的方法在RNA水平或蛋白水平进行测量,这些 方法包括但不限于Northern印迹、RT-PCR、Western印迹,和体外、原位或体内蛋白活性测 定。
[0066] 遗传材料:如本文所使用的,术语"遗传材料"包括全部基因,和核酸分子,例如 DNA 和 RNA。
[0067] 异源的:如本文所使用的,术语"异源的"是指并非源自于特定生物体、组织或细胞 的内部的物质(例如核酸分子和多肽)。例如,在植物细胞内表达的"异源"多肽可以指通 常不在来自相同物种的非遗传工程化植物的相同类型细胞中表达的多肽(例如,在相同生 物体的不同细胞中,或者在不同生物体的细胞中表达的多肽)。
[0068] 分离的:如本文所使用的,术语"分离的"是指如下的分子(例如,核酸分子或多 肽),该分子已与天然存在该分子的生物体细胞内通常与该分子伴随的其它同类分子(例 如其它核酸分子和其它多肽)实质上分离或提纯脱离。例如,分离的核酸分子可以与天然 存在该核酸分子的生物体细胞内的染色体DNA或染色体外DNA实质性分离或提纯脱离。因 此,该术语包括经过生化纯化从而除去其它的核酸分子、多肽和细胞组分的重组核酸分子 和多肽。该术语还包括重组核酸分子、化学合成的核酸分子、和重组产生的多肽。
[0069] 如本文所使用的,术语"基本上纯化的"是指这样的分子,其与通常在天然状态下 与之伴随的其它分子是分离的。基本上纯化的分子可以是组合物中存在的主导种类。基本 上纯化的分子可以是,例如,除了天然混合物中存在的溶剂之外,其它分子有至少60%、至 少75 %、或至少90 %不存在。术语"基本上纯化的"不是指以天然状态存在的分子。
[0070] 核酸分子:如本文所使用的,术语"核酸分子"可以指聚合物形式的核苷酸,其可以 包括RNA、cDNA、基因组DNA、和合成形式的上述混合聚合物的有义和反义链。核苷酸可以指 核糖核苷酸、脱氧核糖核苷酸,或两者任一类型核苷酸的修饰形式。如本文所使用的,"核酸 分子"与"核酸"和"多核苷酸"同义。除非另有说明,核酸分子的长度通常为至少10个碱 基。该术语包括单链和双链形式的DNA。核酸分子包括二聚体(所谓的串联)形式,和核酸 分子的转录产物。核酸分子可包括天然存在的和/或经过修饰的核苷酸,其中核苷酸通过 天然存在的和/或非天然存在的核苷酸连接键连接在一起。
[0071] 核酸分子可以被化学或生物化学修饰,或者可以含有非天然的或衍生化的核苷酸 碱基,如本领域技术人员所容易理解的。这些修饰包括,例如,标记物、甲基化、用类似物取 代一个或多个天然存在的核苷酸、核苷酸间修饰(例如,不带电的连接键:例如,甲基膦酸 酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电荷的连接键:例如,硫代磷酸酯、二硫代磷 酸酯等;侧基部分:例如,肽;嵌入剂:例如,吖啶、补骨脂素等;螯合剂;烷化剂;和经过修 饰的连接键:例如,α异头核酸等)。术语"核酸分子"也包括任何拓扑构象,包括单链、双 链、部分双链体化(duplexed)、三链体化(triplexed)、发夹(hairpinned)、环形、和挂锁构 象。
[0072] 如本文关于DNA所使用的,术语"编码序列"、"结构核苷酸序列"或"结构核酸分子" 是指这样的核苷酸序列,当其置于合适调节序列的控制之下时,可以通过转录和mRNA最终 被翻译成多肽。关于RNA,术语"编码序列"是指被翻译成肽、多肽或蛋白质的核苷酸序列。 编码序列的边界可以由5'端的翻译起始密码子和3'端的翻译终止密码子确定。编码序列 包括,但不限于:基因组DNA ;cDNA ;EST ;和重组核苷酸序列。
[0073] 在一些实施方案中,本发明包括可以用分离方法分离、纯化或部分纯化的核苷酸 序列,分离方法例如离子交换色谱、基于分子量或亲和性的排除、基于在不同溶剂中的溶解 性的分级技术、和遗传工程化方法如扩增、克隆和亚克隆。
[0074] 序列同一性:术语"序列同一性"或"同一性",如本文在两个核酸或多肽序列的语 境中所使用的,可以指当在特定比较窗口上对齐以实现最大对应性时,两个序列中相同的 残基数。
[0075] 如本文所使用的,术语"百分比序列同一性"可以指通过比较两个在比较窗口上最 佳对齐的序列(例如,核酸序列和氨基酸序列)确定的数值,其中为了实现两个序列的最 佳对齐,比较窗口中的序列部分与参考序列(其不含添加或缺失)相比可以包括添加或缺 失(即缺口)。百分比的计算是通过确定在两个序列中均出现的相同核苷酸或氨基酸的位 置的数目,从而产生匹配位置数,并用匹配位置数除以比较窗中的位置总数,并将结果乘以 1〇〇,得到百分比序列同一性。
[0076] 用于对齐序列以供比较的方法是本领域众所周知的。在例如下列文献中描述了 各种程序和对齐算法:Smith and Waterman(1981)Adv. Appl. Math. 2:482 ;Needleman and Wunsch (1970) J. Mol. Biol. 48:443 ; Pear son and Lipman (1988) Proc. Natl. Acad. Sci. U. S. A. 85:2444 ;Higgins and Sharp(1988)Gene73:237-44 ;Higgins and Sharp(1989) CABIOS 5:151-3 ;Corpet et al. (1988)Nucleic Acids Res. 16:10881-90 ;Huang et al. (1992)Comp. Appl.Biosci.8:155-65 ;Pearson et al. (1994)Methods Mol. Biol. 24:307-31 Jatiana et al.(1999)FEMS Microbiol. Lett. 174:247-50。在例如 Altschul et al. (1990)J.Mol.Biol. 215:403-10中可以找到一种序列对齐方法和同一性 计算的详细论述。
[0077] 美国国家生物技术信息中心(National Center for Biotechnology Information)(NCBI)基础本地比对搜索工具(Basic Local Alignment Search Tool) (BLASTTM;Altschul等(1990))可从几个来源获得,包括美国国家生物技术信息中心 (Bethesda,MD)和在因特网上,与几个序列分析程序联合使用。关于如何使用该程序来测定 序列同一性的描述可在因特网上BLAST?的"帮助"部分获得。对于核酸序列的比较,可使 用缺省参数来采用BLAST?(Blastn)程序的"Blast 2 sequences"函数。在通过此方法评 估时,与参照序列具有越大的相似性的核酸序列将显示越高的序列同一性。
[0078] 能够特异性杂交/能够特异性互补:如本文所使用的,术语"能够特异性杂交"和 "能够特异性互补"是表明互补性的程度充分,使得在核酸分子和靶核酸分子之间产生稳定 而特异的结合的术语。两个核酸分子之间的杂交涉及在两个核酸分子的核酸序列之间形成 反平行对齐。两个分子随后能够与相对链的相应碱基形成氢键,从而形成一个二聚体分子, 如果它足够稳定,则可以使用本领域众所周知的方法进行检测。核酸分子不需要与靶分子 100%互补才能特异性杂交。然而,发生特异性杂交必须存在的序列互补性的量因杂交条件 而变化。
[0079] 产生特定程度的严格性的杂交条件会随着所选杂交方法的性质和杂交核酸 序列的组成和长度的不同而改变。一般地,杂交温度和杂交缓冲液的离子强度(尤其 是Na +和/或Mg++浓度)将决定杂交的严格性,虽然清洗时间也会影响严格性。关于 为获得特定程度严格性所需的杂交条件的计算是本领域普通技术人员众所周知的, 并且在例如Sambrook等人(编辑),分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual), 2nd Ed. , vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9and 11 ;和 Hames 和 Higgins(编辑)Nucleic Acid Hybridization, IRL Press, Oxford, 1985中有讨论。有关核酸杂交的更详 细的说明和指导可以参见,例如,《Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes》,第一部分,第 2 章, Elsevier, NY, 1993 中的 Ti jssen, "Overview of principles of hybridization and the strategy of nucleic acid probe assays,'一文,以及Ausubel 等编辑,Current Protocols in Molecular Biology,第 2 章 ,Greene Publishing and Wiley-Interscience, NY, 1995。
[0080] 如本文所使用的,"严格条件"包括在其中只有当杂交分子与靶核酸分子内的同源 序列之间的错配小于20%时才发生杂交的条件。"严格条件"包括进一步特定水平的严格 性。因此,如本文所使用的,"中等严格"条件是指在其中序列错配超过20%的分子将不会杂 交的条件;"高严格"条件是指在其中序列错配超过10%的分子将不会杂交的条件;和"高 严格"条件是指在其中序列错配超过5%的分子将不会杂交的条件。"极高严格"条件是指 在其中序列错配超过6%的分子将不会杂交的条件。
[0081] 下面是代表性的、非限制的杂交条件:
[0082] 高严格条件(检测具有至少90 %序列同一性的序列):在65°C的5x SSC缓冲液 中杂交16小时;在室温下用2x SSC缓冲液清洗2次,每次15分钟;和在65°C的0. 5x SSC 缓冲液中清洗2次,每次20分钟。
[0083] 中等严格条件(检测具有至少80%序列同一性的序列):在65_70°C的5x_6x SSC缓冲液中杂交16-20小时;在室温下用2x SSC缓冲液清洗2次,每次5-20分钟;和在 55-70°C的lx SSC缓冲液中清洗2次,每次30分钟。
[0084] 非严格对照条件(检测具有至少50%序列同一性的序列):在551:的6以5(:缓冲 液中杂交16-20小时;在室温至55°C下用2x-3x SSC缓冲液清洗至少2次,每次20-30分 钟。
[0085] 如本文关于连续核酸序列所使用的,术语"基本上同源的"或"基本上同源"是指 如下的连续核苷酸序列,其在严格条件下与参考核酸序列杂交。例如,与参考核酸序列基本 上同源的核酸序列是如下的核酸序列,其在严格条件下(例如,上文示明的中等严格条件) 与参考核酸序列杂交。基本上同源的序列可具有至少80%序列同一性。例如,基本上同源 的序列可具有大约80% -100%的序列同一性,例如大约81% ;大约82% ;大约83% ;大约 84% ;大约85% ;大约86% ;大约87% ;大约88% ;大约89% ;大约90% ;大约91% ;大约 92% ;大约93% ;大约94% ;大约95% ;大约96% ;大约97% ;大约98% ;大约98. 5% ;大 约99% ;大约99. 5% ;和大约100%。基本上同源的性质与特异性杂交密切相关。例如,当 具有充分程度的互补性,从而在期望特异性结合的条件下(例如严格杂交条件下)避免核 酸与非靶序列的非特异性结合时,核酸分子是能够特异性杂交的。
[0086] 如本文所使用的,术语"直系同源物"或"直向同源物"是指两个或多个物种中的 基因,其从一个共同的祖先核苷酸序列进化而来,并可以在两个或多个物种中保留相同的 功能。
[0087] 如本文所使用的,对于两个核酸分子而言,当沿着5'_3'方向阅读的序列的每一个 核苷酸均与沿着3' -5'方向阅读的另一个序列的每一个核苷酸互补时,则称这两个核酸分 子显示"完全互补性"。与参考核苷酸序列互补的核苷酸序列将显示与参考核苷酸序列的反 向互补序列相同的序列。这些术语和描述在本领域中有确切的定义,且本领域的普通技术 人员容易理解。
[0088] 在确定氨基酸序列之间的百分比序列同一性时,本领域技术人员众所周知,在不 影响包含该对齐序列的多肽的期望性质的情况下,某个对齐所提供的给定位置上的氨基酸 的身份可以不同。在这些情况下,可以调整百分比序列同一性以解释被保守取代的氨基酸 之间的相似性。这些调整是本领域技术人员众所周知并且普遍使用的。见,例如Myers and Miller (1988), Computer Applications in Biosciences 4:11-7。
[0089] 本发明的实施方案包括示例性的质体转运肽氨基酸序列的功能性变体,和编码它 们的核酸序列。示例性的转运肽序列的功能性变体可以是,例如,示例转运肽氨基酸序列的 片段(例如N端或C端片段),或全长示例性转运肽氨基酸序列或示例性转运肽氨基酸序 列的片段的修饰序列。在一些实施方案中,示例性的转运肽氨基酸序列可以被修饰而引入 一个或多个保守的氨基酸取代。"保守氨基酸取代"是指如下的氨基酸取代,其中氨基酸残 基被另一个具有相似功能侧链、相似大小、和/或相似疏水性的氨基酸残基代替。可用于代 替相同家族中的另一个氨基酸以便引入保守取代的氨基酸家族是本领域已知的。例如,这 些氨基酸家族包括:碱性氨基酸(例如,赖氨酸,精氨酸和组氨酸);酸性氨基酸(例如,天 冬氨酸和谷氨酸);不带电的(在生理PH下)的极性氨基酸(例如,甘氨酸,天冬酰胺,谷 氨酰胺,丝氨酸,苏氨酸,酪氨酸,和半胱氨酸);非极性氨基酸(例如丙氨酸,缬氨酸,亮氨 酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,和色氨酸)支链氨基酸(例如,苏氨酸,缬 氨酸,和异亮氨酸);和芳香族氨基酸(例如酪氨酸,苯丙氨酸,色氨酸,和组氨酸)。见,例 如,Sambrook et al. (Eds·),同上;和 Innis et al·,PCR Protocols: A Guide to Methods and Applications, 1990,Academic Press,NY,USA。
[0090] 可操作地连接:当第一核苷酸序列与第二核苷酸序列存在功能关系时,则该第一 核苷酸序列与第二核苷酸序列"可操作地连接"。例如,如果启动子影响编码序列的转录或 表达,则启动子与该编码序列可操作地连接。如果可操作地连接的核苷酸序列是重组产生 的,则这些核苷酸序列通常是连续的,并且在需要连接两个蛋白编码区时,这些核苷酸序列 将共阅读框。然而,可操作地连接的核苷酸序列不一定连续的。
[0091] 术语"可操作地连接的",在用来指基因调节序列和编码序列时,其意思是调节序 列影响所连接的编码序列的表达。"调节序列"或"控制元件"是指影响转录的时机和水平 /量,RNA加工或稳定性,或相关编码序列的翻译的核苷酸序列。调节序列可以包括启动子; 翻译前导序列;内含子;增强子;茎环结构;阻遏物结合序列;终止序列;多聚腺苷酸化识 别序列;等。特定的调节序列可位于与之可操作地连接的编码序列的上游和/或下游。此 夕卜,与编码序列可操作地连接的特定调控序列可位于双链核酸分子的相关互补链上。
[0092] 当用于指示两个或多个氨基酸序列时,术语"可操作地连接"是指第一个氨基酸序 列与至少一个额外的氨基酸序列存在功能关系。例如,在包含转运肽和第二氨基酸序列的 多肽内,如果该转运肽影响该多肽或该第二氨基酸序列的表达或运输,则该转运肽(例如 CTP)与该第二氨基酸序列可操作地连接。
[0093] 启动子:如本文所使用的,术语"启动子"是指一段DNA区域,其可以位于转录起点 的上游,并参与RNA聚合酶和其它蛋白的识别和结合以起始转录。启动子可以与用于在细 胞内表达的编码序列可操作地连接,或者启动子可以与编码信号序列的核苷酸序列可操作 地连接,而该信号序列与用于在细胞内表达的编码序列可操作地连接。"植物启动子"可以 是能够在植物细胞中起始转录的启动子。处于发育控制之下的启动子的实例包括:优先在 某些组织(例如但不限于,叶、根、种子、纤维、木质部导管、管胞或厚壁组织)中起始转录的 启动子。这些启动子被称为"组织优选的"。仅在特定组织中启动转录的启动子被称为"组 织特异的"。"细胞类型特异的"启动子主要在一个或多个器官的特定细胞类型中的驱动转 录,例如根或叶中的导管细胞。"可诱导的"启动子可以是可受环境控制的启动子。可能通 过可诱导的启动子触发转录的环境条件的实施例包括,例如但不限于,缺氧条件和光的存 在。组织特异的、组织优选的、细胞类型特异的、和可诱导的启动子构成了"非组成型"启动 子类型。"组成型"启动子是在大多数环境条件下可以有活性的启动子。
[0094] 任何可诱导的启动子均可用于本发明的一些实施方案。见Ward et al. (1993),Plant Mol. Biol. 22:361-366。使用可诱导的启动子,转录速度可响应诱导剂而 增加。可诱导的启动子的实例包括,但不限于:来自ACEI系统的对铜响应的启动子;来自玉 米的对苯磺酰胺除草剂安全剂响应的In2基因;来自TnlO的Tet阻遏物;和来自类固醇激 素基因的可诱导启动子,其转录活性可以被糖皮质激素诱导(Schena et al. (1991)Pr〇c. Natl. Acad. Sci. USA88:0421)。
[0095] 组成型启动子的实例包括,但不限于:来自植物病毒的启动子,如来自CaMV的35S 启动子;来自水稻肌动蛋白基因的启动子;泛素启动子;pPEMU;MAS ;玉米H3组蛋白启动 子;和ALS启动子,欧洲油菜ALS3结构基因5'端的Xbal/Ncol片段(或与所述Xbal/Ncol 片段相似的核苷酸序列)(国际PCT公开No. WO 96/30530)。
[0096] 另外,任何组织特异的或组织优选的启动子均可用于本发明的一些实施方案。用 包含与组织特异的启动子可操作地连接的编码序列的核酸分子转化的植物,可以在特定组 织中排他地或优先地产生该编码序列的产物。组织特异的或组织优选的启动子包括,但不 限于:根优选的启动子,例如来自菜豆蛋白基因的启动子;叶特异的和光诱导的启动子,例 如来自cab或rubisco的启动子;花药特异性启动子,例如来自LAT52的启动子;花粉特异 的启动子,例如来自Zml3的启动子;和小孢子优选的启动子,例如如来自apg的启动子。 [0097] 转化:如本文所使用的,术语"转化"或"转导"是指将一个或多个核酸分子转移到 细胞内。当被转导到细胞内的核酸分子被细胞稳定复制时(无论是通过该核酸分子整合 到细胞基因组中,还是通过附加体型复制),则称细胞被转导到细胞内的核酸分子"转化"。 如本文所使用的,术语"转化"包括所有可以将核酸分子引入到这种细胞内的技术。实例 包括但不限于:用病毒载体转染;用脂质体载体转化;电穿孔(Fromm et al. (1986) Nature 319:791-3);脂质转染(Feigner et al. (1987)Proc.Natl.Acad. Sci. USA 84:7413-7); 显微注射(Mueller et al. (1978)Cell 15:579-85) ;土壤杆菌介导的转移(Fraley et al. (1983)Proc. Natl. Acad. Sci. USA 80:4803-7) ;DNA 直接摄取;和微粒轰击(Klein et al. (1987)Nature 327:70)〇
[0098] 转基因:一种外源核酸序列。在一些实例中,转基因可以是编码包含至少一个人造 的芸苔属来源的CTP的多肽的序列。在特定实例中,转基因可以编码这样的多肽,其包含至 少一个人造的芸苔属来源的CTP和至少一个期望质体表达的额外的肽序列(例如,赋予除 草剂抗性的肽序列)。在这些和其它的实例中,转基因可以含有与转基因的编码序列可操作 地连接的调节序列(例如启动子)。为本公开的目的,术语"转基因(的)"在用于指示生 物体(例如植物)时,是指包含外源核酸序列的生物体。在一些实例中,包含外源核酸序列 的生物体可以是其中通过分子转化技术引入了该核酸分子的生物体。在其它实例中,包含 外源核酸序列的生物体可以是通过例如基因渗入或植物异花授粉而引入了该核酸序列的 生物体。
[0099] 转运:如本文所使用的,术语"转运"、"导向"和"转移"是指本发明的某些氨基酸序 列帮助包含该氨基酸序列的多肽从宿主细胞的细胞核移动进入宿主细胞的质体内的性质。 在特定的实施方案中,这种氨基酸序列(例如人造的芸苔属来源的CTP序列)可能能够将 包含该氨基酸序列的多肽的大约100%、至少大约95%、至少大约90%、至少大约85%、至 少大约80%、至少大约70%、至少大约60%、和/或至少大约50%转运到宿主细胞的质体 内。
[0100] 载体:一种被引入到细胞内,例如为了产生转化细胞而被引入到细胞内的核酸分 子。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制起点。载体的实例包括, 但不限于:质粒;粘粒;噬菌体;和携带外源DNA进入细胞的病毒。载体还可以包括一个或 多个基因、反义分子、和/或选择标志物基因,以及其它本领域已知的遗传元件。载体可以 转导、转化或感染细胞,借此导致细胞表达由该载体编码的核酸分子和/或蛋白质。载体任 选地包括可帮助核酸分子实现细胞进入的材料(例如脂质体、蛋白质包壳等)。
[0101] 除非特别说明或暗示,如本文所用的,术语"一种"、"一个"和"该"意味着"至少一 个"。
[0102] 除非另有具体说明,否则本文所用的所有技术和科学术语具有与本公开所 属领域的普通技术人员通常理解的相同的含义。分子生物学中常见术语的定义可 见,例如 Lewin B·,Genes V,Oxford University Press, 1994(ISBN0-19-854287-9); Kendrew et al. (eds. ), The Encyclopedia of Molecular Biology, Blackwell Science Ltd. ,1994(ISBN 0-632-02182-9);和 Meyers R. A.(编辑),Molecular Biology and Biotechnology:A Comprehensive Desk Reference, VCH Publishers, Inc. , 1995(ISBN 1-56081-569-8)。除非另有具体说明,否则所有的百分比均为重量百分比,所有溶剂混合比 例均为体积比。所有温度均为摄氏度。
[0103] IV.包含人造的芸苔属来源的CTP编码序列的核酸分子
[0104] 在一些实施方案中,本公开提供了一种核酸分子,其包含与感兴趣的核苷酸序列 可操作地连接的至少一个编码人造的芸苔属来源的CTP的核苷酸序列。在特定的实施方案 中,感兴趣的核苷酸序列可以是编码感兴趣的多肽的核苷酸序列。在特定的实例中,提供 了单个核酸分子,其编码多肽,该多肽中TraP12或TraP13序列被融合到感兴趣的多肽的N 端。
[0105] 人造的芸苔属来源的CTP可以来自于芸苔属EPSPS基因。在这些实施方案的特定 实例中,芸苔属EPSPS基因可以包括如SEQ ID NO: 1所示的核酸序列,来自另一不同EPSPS 基因的同源核酸序列,或包含如SEQ ID NO: 1所示的核酸序列的芸苔属EPSPS基因的直系 同源物。
[0106] 在一些实施方案中,人造的芸苔属来源叶绿体转运肽可以是嵌合的芸苔属来源 CTP。人造的嵌合芸苔属来源CTP可以从参考芸苔属CTP序列获得,方法是通过将参考芸苔 属CTP序列内包含的第一连续氨基酸序列与包含于另一不同CTP序列(例如从拟南芥属物 种获得的CTP序列)内的第二连续氨基酸序列相连。在特定的实施方案中,包含所述第二 连续氨基酸序列的另一不同CTP序列可以由来自基因组的同源基因编码,该基因组不是从 其获得所述参考序列的芸苔属物种的基因组(例如另一不同的芸苔属物种,芸苔属物种之 外的植物;低等光合真核生物,例如绿藻;和原核生物,例如蓝藻或土壤杆菌)。因此,编码 人造的芸苔属来源的CTP的核苷酸序列可以通过下属方式从参考芸苔属物种CTP编码基因 序列获得:将编码参考芸苔属CTP序列的连续氨基酸序列的核苷酸序列与编码来自另一不 同CTP序列的、与参考芸苔属CTP序列的其余部分同源的连续氨基酸序列的核苷酸序列融 合。在这些和其它的实例中,参考芸苔属CTP序列的连续氨基酸序列可以位于人造的芸苔 属来源的CTP的5'端或3'端。
[0107] 在一些实施方案中,人造的嵌合芸苔属来源CTP可以衍生自多个芸苔属CTP序列 (包括参考芸苔属CTP序列),其方式是将一个芸苔属CTP序列内包含的连续氨基酸序列与 另一不同芸苔属物种CTP序列内包含的连续氨基酸序列连接在一起。在特定的实施方案 中,所述多个芸苔属CTP序列可以由不同芸苔属物种中的直系同源基因序列编码。在一些 实施方案中,所述多个芸苔属CTP序列可以正好是两个芸苔属CTP序列。因此,编码人造的 嵌合芸苔属来源CTP的核苷酸序列可以衍生自两个同源的(例如基本上同源的)芸苔属 CTP编码基因序列(例如直系同源基因序列),其方式是将编码来自其中一个芸苔属CTP序 列的连续氨基酸序列的核苷酸序列与编码来自另一个芸苔属CTP序列的、与前述第一个芸 苔属CTP序列的其余部分同源的连续氨基酸序列的核苷酸序列融合。TraP12和TraP13是 这种人造的嵌合芸苔属来源CTP的示例。
[0108] 在一些实施方案中,人造的嵌合芸苔属来源CTP可以通过这样的方式衍生自参考 芸苔属CTP序列:将参考芸苔属CTP序列内包含的连续氨基酸序列与从不同生物体获得的 第二CTP序列内含有的连续氨基酸序列连接在一起。在特定的实施方案中,所述第二CTP 序列可以由该不同生物体内的直系同源基因序列编码。编码人造的嵌合芸苔属来源CTP的 核苷酸序列可以通过这样的方式衍生自参考芸苔属CTP序列:将编码参考芸苔属CTP序列 的连续氨基酸序列的核苷酸序列,与来自不同生物体的同源(例如基本上同源)CTP编码基 因序列(例如直向同源基因序列)的、编码该不同生物体的CTP序列中与所述参考芸苔属 CTP序列的其余部分同源的连续氨基酸序列的核苷酸序列融合。TraP12和TraP13是这种 人造的嵌合CTP的实例,其包含来自芸苔属和拟南芥的CTP序列。
[0109] 本领域的普通技术人员会理解,在选定参考芸苔属CTP序列内的第一连续氨基酸 序列之后,根据前述衍生过程从同源CTP序列的其余部分鉴定和选择连续氨基酸序列是明 确且自动的。在一些实例中,第一连续氨基酸序列的长度可以为大约25至大约40个氨基 酸(例如长度为 24, 25, 26, 27, 28, 29, 30, 31,32, 33, 34, 35, 36, 37, 38, 39, 40, 41 和 42 个氨 基酸)。在一些实施方案中,参考芸苔属CTP序列内的第一连续氨基酸序列由一些芸苔属 EPSPS基因内保守的"SVSL"(SEQ ID NO:9)基序的3'端位置界定。
[0110] 根据前述过程人造的嵌合芸苔属来源CTP序列的实例是SEQ ID N0s:6和8。鉴于 遗传密码子的简并性,本领域普通技术人员能马上想到编码这些肽的核苷酸序列的类群。 这些特定的实例从来自欧洲油菜ESPSP基因的几种ESPSP直系同源物之一的同源CTP纳入 了连续序列,从而例示了人造嵌合芸苔属来源CTP的结构特征。
[0111] 一些实施方案包括所述人造芸苔属来源叶绿体转运肽的功能性变体,和/或编 码它们的核酸。这些功能性变体包括,例如但不限于:人造的芸苔属来源的CTP编码序 列,其衍生自如SEQ ID N0:1所示的芸苔属CTP编码序列的同源物和/或直系同源物, 和/或由该核酸编码的CTP ;编码人造的芸苔属来源的CTP的核酸,所述人造的芸苔属来 源的CTP包含SEQ ID N0:2内的连续氨基酸序列,和/或由该核酸编码的CTP ;编码截短 的人造的芸苔属来源的CTP的序列,其包含SEQ ID N0:5, 7, 11,12, 13, 15, 17和19其中 之一内的连续核酸序列;编码截短的人造的芸苔属来源的CTP的序列,其包含与SEQ ID N0s:5, 7, 11,12, 13, 15, 17和19其中之一基本上同源的连续核酸序列;截短的人造的芸苔 属来源的CTP,其包含SEQ ID N0s:6和8之一内的连续氨基酸序列;核酸序列,其编码包含 SEQ ID N0s:6和8之一内的连续氨基酸序列的截短的人造的芸苔属来源的CTP,和/或其 编码的CTP ;编码人造的芸苔属来源的CTP的核酸,该CTP包含SEQ ID N0:6和8之一内的 连续氨基酸序列,所述连续氨基酸序列具有一个或多个保守氨基酸取代,和/或由该核酸 编码的CTP ;以及编码人造的芸苔属来源的CTP的核酸,该CTP包含SEQ ID N0s:6和8其 中之一内的连续氨基酸序列,并具有一个或多个非保守的氨基酸取代,并被证明可以指导 可操作地连接的肽进入含质体细胞内的质体内,和/或由该核酸编码的CTP。
[0112] 因此,本发明的一些实施方案包括含有如下核苷酸序列的核酸分子,该核苷酸序 列编码人造的嵌合芸苔属来源CTP,其包含一个或多个保守的氨基酸取代。这种核酸分子可 用于,例如,在分子生物学技术中帮助本发明CTP编码序列的操作。例如,在一些实施方案 中,可将本发明的CTP编码序列引入到合适的用于将序列亚克隆到表达载体内的载体中, 或者可以将本发明的CTP编码序列可以引入到这样的核酸分子中,该核酸分子可以帮助产 生其他包含与感兴趣的核苷酸序列可操作地连接的CTP编码序列的核酸分子。在这些和进 一步的实施方案中,人造的嵌合芸苔属来源CTP序列中的一个或多个氨基酸位置可以被删 除。例如,人造的嵌合芸苔属来源CTP的序列可以被修饰,使得该序列中的1,2, 3, 4, 5, 6, 7 ,8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19或20个位置上的氨基酸被删除。对同源CTP序列 的比对可以提供哪些氨基酸可以被删除而不会影响人造 CTP的功能的指导。
[0113] 在特定的实施方案中,人造的芸苔属来源叶绿体转运肽的长度小于80个氨基酸。 例如,人造的芸苔属来源的CTP的长度可以是79, 78, 77, 76, 75, 74, 73, 72, 71,70, 69, 68, 67 ,66, 65, 64, 63, 62, 61,60或者更少的氨基酸。在某些实例中,人造的芸苔属来源的CTP的 长度可以为大约65,大约68,大约72或大约74个氨基酸。在这些和进一步的实例中,人造 的芸苔属来源的CTP可以包含SEQ ID N0s:6和8中其中一个所示的氨基酸序列,或任何 前述的功能性变异体。因此,人造的芸苔属来源的CTP可以包含SEQ ID N0s:6和8中其中 一个的氨基酸序列,或其功能性变体,其中人造的芸苔属来源的CTP的长度小于80个氨基 酸。在某些实例中,人造的芸苔属来源的CTP可以包含与SEQ ID N0:6和8中的一个例如 至少80%,至少85%,至少90%,至少92%,至少94%,至少95%,至少96%,至少97%,至 少98%,至少99 %或100 %相同的氨基酸序列。
[0114] 本领域的技术人员鉴于本公开能识别编码某一具体的人造芸苔属来源的CTP的 所有核苷酸序列,例如SEQ ID N0:6的TraP12肽,SEQ ID N0:8的TraP13肽,或任意前述 者的功能性变体,包括任何特定缺失和/或保守氨基酸取代。遗传密码的简并性为特定氨 基酸序列提供了有限数目的编码序列。选择特定的序列编码人造的芸苔属来源的CTP属 于从业者的自由裁量。在不同的应用中可能期望使用不同的编码序列。例如,为了提高人 造的芸苔属来源的CTP在特定宿主内的表达,可以选择反映宿主密码子使用偏好的编码序 列。作为举例,人造的芸苔属来源的CTP可以由如SEQ ID N0s:5, 7, 11,12, 13, 15, 17和19 其中之一中所示的核苷酸序列编码。
[0115] 在本发明的一些实施方案中提供的核酸分子中,编码人造的芸苔属来源的CTP的 核苷酸序列的最后一个密码子和感兴趣的核苷酸序列的第一个密码子可以由任意数量的 核苷酸三联体所分隔,例如不编码内含子或"终止(STOP)"。在一些实例中,编码在天然前 体多肽中通常与叶绿体转运肽相伴随的成熟蛋白质的第一个氨基酸的序列可以存在于编 码人造的芸苔属来源的CTP的核苷酸序列的最后一个密码子与感兴趣的核苷酸序列的第 一个密码子之间。将编码人造的芸苔属来源的CTP的核苷酸序列和感兴趣的核苷酸序列第 一个密码子隔开的序列可以例如由任何序列构成,使得所编码的氨基酸序列很可能不会显 著改变嵌合多肽的翻译及其向质体的转位。在这些和进一步的实施方案中,编码人造芸苔 属来源叶绿体转运肽的核苷酸序列的最后一个密码子可以与直接与该序列毗邻、或者仅以 短肽序列与之相隔的感兴趣的核苷酸序列的第一个密码子相位对准(phase-register)地 融合,所述短肽序列例如是由人造核苷酸接头(例如,可能已经被用于实现该融合的核苷 酸接头)编码的短肽序列。
[0116] 在一些实施方案中,可能期望修饰感兴趣的核苷酸序列的核苷酸和/或与之融 合在一个编码序列中的、人造的芸苔属来源的CTP编码序列的核苷酸,以便例如增强该编 码序列在特定宿主中的表达。遗传密码是冗余的,具有64个可能的密码子,但是大多数生 物优先使用这些密码子中的一个子集。在某个物种中最经常使用的密码子被称为最优密 码子,而那些不经常使用的被归类为稀有或低使用率密码子。Zhang et al. (1991)Gene 105:61-72。可更换密码子以反映特定宿主的优先密码子使用率,这个过程有时被称作"密 码子优化"。可以制备含有特定原核或真核宿主优选的密码子的优化密码子序列,以便,例 如,增加翻译速度或者产生具有期望性质(例如,与从非优化序列产生的转录本相比具有 更长的半衰期)的重组RNA转录本。
[0117] 任何多肽均可以通过纳入人造的芸苔属来源的CTP序列而被导向到含质体细胞 的质体上。例如,在一些实施方案中,可以将多肽与人造的芸苔属来源的CTP序列连接,从 而将多肽引导到的细胞的质体上,在质体中该多肽-CTP连接分子被表达。在特定的实施 方案中,通过纳入人造的芸苔属来源的CTP序列而被导向到质体上的多肽可以是在天然表 达该多肽的细胞内通常在质体中表达的多肽。例如但不限于,通过纳入人造的芸苔属来源 的CTP序列被导向到质体上的多肽可以是参与除草剂抗性,病毒抗性,细菌性病原体抗性, 昆虫抗性,线虫抗性,或抗真菌多肽的多肽。参见,例如,美国专利5, 569, 823 ;5, 304, 730 ; 5, 495, 071 ;6, 329, 504和6, 337, 431。通过纳入人造的芸苔属来源的CTP序列被导向到质体 上的多肽抑或可以是,例如但不限于,参与植物活力和产量的多肽(包括参与对极端温度、 土壤条件、光照水平、水的水平、和化学环境的耐受性的多肽),或者可以用作鉴定含有感兴 趣的性状的植物的标志物的多肽(例如,选择标志物基因产物、参与种子颜色的多肽,等)。
[0118] 在本发明的一些实施方案中,可以和人造的芸苔属来源的CTP序列连接的、参与 除草剂抗性的多肽的非限制性实例包括:乙酰乳酸合酶(ALS)、突变的ALS和ALS的前体 (例如,见美国专利5, 013, 659) ;EPSPS (见,例如,美国专利4, 971,908和6, 225, 114),例如 CP4 EPSPS或III类EPSPS ;可修饰质体中发生的生理过程的酶,这些生理过程包括但不限 于,光合作用和脂肪酸、氨基酸、油、类胡萝卜素(carotenoids)、萜类和淀粉的合成。在特 定实施方案中,可以和人造的芸苔属来源叶绿体转运肽连接的多肽的其它非限制性实例包 括:玉米黄素环氧酶,胆碱单加氧酶,亚铁螯合酶,ω-3脂肪酸去饱和酶,谷氨酰胺合成酶, 淀粉修饰酶,参与必需氨基酸、维生素 Α、激素、Bt毒素蛋白的人造的多肽,等等。编码上述 多肽的核苷酸序列在本领域中是已知的,可以将这些核苷酸序列和编码人造的芸苔属来源 的CTP的核苷酸序列可操作地连接,其中该CTP将被表达进入如下的多肽,其包含与该人造 的芸苔属来源的CTP连接的感兴趣的多肽。此外,编码任何上述多肽的额外核苷酸序列可 以由本领域的技术人员鉴定(例如,通过克隆与编码该特定多肽的其它基因高度同源的基 因)。一旦鉴定了这样的核苷酸序列,设计包括与所鉴定核苷酸序列可操作地连接的人造的 芸苔属来源的CTP编码序列,或编码等价多肽的序列,都会是直截了当的过程。
[0119] V.包含人造芸苔属来源叶绿体转运肽的多肽的表达
[0120] 在一些实施方案中,可以将至少一种核酸分子引入细胞、组织或生物体中,这些核 酸分子包含编码包含至少一种人造的芸苔属来源的CTP或其功能等价物的多肽的核苷酸 序列,以在所述细胞、组织或生物体中中表达该多肽。在特定的实施方案中,核酸分子可以 包含与所述编码人造的芸苔属来源的CTP的核苷酸序列可操作地连接的感兴趣的核苷酸 序列。例如,核酸分子可以包括编码如下多肽的编码序列,该多肽包含至少一个人造的芸苔 属来源的CTP和至少一个由感兴趣的核苷酸序列编码的其他肽序列。在一些实施方案中, 可以将本发明的核酸分子引入含质体的细胞、组织或生物体(例如,植物细胞,植物组织和 植物)中,使得在该含质体宿主细胞、组织或生物体中从所述核酸分子表达多肽,其中该表 达的多肽包含至少一个人造的芸苔属来源的CTP和至少一个由感兴趣的核苷酸序列编码 的其他肽序列。在某些实例中,被表达的多肽的人造的芸苔属来源的CTP可以帮助将该多 肽的至少含有所述其他肽序列的一部分导向到宿主细胞、组织或生物体的质体上。
[0121] 在一些实施方案中,本发明的核酸分子可以通过任何本领域技术人员已知的方法 引入到含质体的细胞内。在特定的实施方案中,可以使宿主细胞、组织或生物体和本发明的 核酸分子接触,以便将该核酸分子引入到细胞、组织或生物体内。在特定的实施方案中,可 用本发明的核酸分子转化细胞,从而将该核酸分子导入细胞内,并且将核酸分子稳定整合 到细胞的基因组中。在一些实施方案中,可以使用包含至少一个与感兴趣的核苷酸序列可 操作地连接的人造芸苔属来源CTP的核苷酸序列的核酸分子转化细胞,例如含质体的细胞 (例如植物细胞)。为了引发或增强表达,核酸分子可以包含一个或多个调节序列,该调节 序列可以和编码包含至少一个人造芸苔属来源CTP的多肽的核苷酸序列可操作地连接。
[0122] 核酸分子可以是,例如,载体系统,其包括例如线性质粒和闭合环状质粒。在特定 的实施方案中,该载体可以是表达载体。本发明的核酸序列可以,例如,插入到载体中,使 该核酸序列与一个或多个调节序列可操作地连接。有许多载体可用于该目的,并且特定载 体的选择可以取决于,例如,待插入到载体内的核酸的大小,和要用载体转化的具体宿主细 胞。载体通常含有多种组分,这些组分的身份取决于载体的功能(例如,DNA扩增和DNA表 达),以及与载体相容的特定宿主细胞。
[0123] 一些实施方案可以包括植物转化载体,其包括含有至少一个上述的调节序列的核 苷酸序列,其中该调节序列与一个或多个编码含有至少一个人造的芸苔属来源的CTP的多 肽的核苷酸序列可操作地连接。该一个或多个核苷酸序列可以在该调节序列的控制下在植 物细胞、组织或生物体中表达,从而产生包含人造的芸苔属来源的CTP的多肽,该CTP将多 肽的至少一部分导向到植物细胞、组织或生物体的质体上。
[0124] 在一些实施方案中,与编码含有至少一个人造的芸苔属来源的CTP的多肽的核 苷酸序列可操作地连接的调节序列可以是启动子序列,其可以在宿主细胞中,例如要在 其中扩增该核酸分子的细菌细胞,或者要在其中表达该核酸分子的植物细胞中发挥功 能。适用于根据本发明的核酸分子的启动子,包括诱导型启动子、病毒启动子、人造启动 子、或组成型启动子,所有这些都是本领域中众所周知的。可用于本发明实施方案的启 动子的非限制性实例在下列文献中提供:美国专利Nos. 6, 437, 217 (玉米RS81启动子); 5, 641,876 (水稻肌动蛋白启动子);6, 426, 446 (玉米RS324启动子);6, 429, 362 (玉 米PR-I启动子);6, 232, 526 (玉米A3启动子);6, 177, 611 (组成型玉米启动子); 5, 322, 938, 5, 352, 605, 5, 359, 142 和 5, 530, 196 (35S 启动子);6, 433, 252 (玉米 L3 的油质 蛋白启动子);6, 429, 357 (水稻肌动蛋白2启动子和稻肌动蛋白内含子2) ;6, 294, 714 (光 诱导型启动子);6,140,078(盐诱导型启动子);6,252,138(病原体诱导型启动子); 6, 175, 060 (磷缺乏诱导的启动子);6, 388, 170 (双向启动子);6, 635, 806 ( γ -coixin启动 子);和美国专利申请序列No. 09/757, 089 (玉米叶绿体醛缩酶启动子)。
[0125] 其它示例性启动子包括,胭脂碱合酶(NOS)启动子(Ebert et al. (1987)Proc. Natl. Acad. Sci. USA 84(16):5745-9);章鱼碱合酶(OCS)启动子(其被携带于根瘤土壤 杆菌的肿瘤诱导型质粒上);花椰菜花叶病毒启动子,例如花椰菜花叶病毒(CaMV) 19S启 动子(Lawton et al. (1987)Plant Mol. Biol. 9:315-24) ;CaMV 35S启动子(Odell et al. (1985)Nature 313:810-2);玄参花叶病毒 35S 启动子(此11?^6七31.(1987)?1'〇。· Natl.Acad. Sci. USA 84(19):6624_8),鹿糖合酶启动子(Yang and Russell(1990)Proc. Natl. Acad. Sci. USA87:4144-8) ;R基因复合体启动子(Chandler et al. (1989)Plant Cell 1:1175-83);叶绿素 a/b结合蛋白基因启动子;CaMV35S(美国专利Nos. 5, 322, 938, 5, 352, 605, 5, 359, 142,和 5, 530, 196) ;FMV35S (美国专利 Nos. 6, 051,753,和 5, 378, 619) ;PC1SV 启动子(美国专利No. 5, 850, 019) ;SCP1启动子(美国专利No. 6, 677, 503),以及AGRtu. nos 启动子(GenBank 登录号 V00087;D印icker et al. (1982) J. Mol. Appl. Genet. 1:561-73; Bevan et al. (1983)Nature304:184-7)。
[0126] 在特定的实施方案中,本发明的核酸分子可以包含组织特异性启动子。组织特异 性启动子是一种核苷酸序列,其在该启动子特异针对的组织中导致可操作地连接的核苷酸 序列发生与该生物体的其它组织相比更高水平的转录。组织特异性启动子的实例包括但不 限于:绒毡层特异性启动子;花药特异性启动子;花粉特异性启动子(参见,例如,美国专利 No. 7, 141,424,和国际PCT公开No. WO 99/042587);胚珠特异性启动子;(参见,例如,美国 专利申请Να 2001/047525A1);果实特异性启动子(参见,例如,美国专利Nos. 4, 943, 674, 和5, 753, 475);和种子特异性启动子(参见,例如,美国专利Nos. 5, 420, 034,和 5, 608, 152)。在一些实施方案中,发育阶段特异性启动子(例如,在发育晚期活跃的启动 子)可以在本发明的组合物或方法中使用。
[0127] 其他可在一些实施方案中与核酸分子可操作地连接的调节序列包括位于启动子 序列和充当翻译前导序列的编码序列之间的5'UTR。翻译前导序列存在于完全加工的mRNA 中,并且它可能影响初级转录物的加工,和/或RNA稳定性。翻译前导序列的实例包括玉米 和矮牵牛热休克蛋白前导序列(美国专利No. 5, 362, 865),植物病毒外壳蛋白前导序列,植 物rubisco(核酮糖-1,5-二磷酸羧化酶/加氧酶)前导序列,及其他。参见,例如,Turner and Foster(1995)Molecular Biotech. 3(3) :225_36。下列文献中提供了 5'UTR 的非限 制性实例:GmHsp(美国专利 No. 5, 659, 122) ;PhDnaK(美国专利 No. 5, 362, 865) ;AtAntl ; TEV (Carrington and Freed (1990)J. Virol. 64:1590-7);和 AGRtunos(GenBank 登录号 V00087;和 Bevan et al. (1983) ,Nature 304:184-7)。
[0128] 其他可在一些实施方案中与核酸分子可操作地连接的调节序列还包括3'非翻译 序列、3'转录终止区或多聚腺苷酸区。这些都是位于核苷酸序列下游的遗传元件,并包括提 供多聚腺苷酸化信号,和/或其它能够影响转录或mRNA加工的调控信号的多核苷酸。多聚 腺苷酸化信号在植物中发挥功能,导致在mRNA前体的3'端添加多聚腺苷酸核苷酸。多聚 腺苷酸序列可以来自于各种植物基因,或T-DNA基因。3'转录终止区的一个非限制性实例 是胭脂喊合酶 3' 区(nos 3';Fraley et al. (1983)Proc.Natl.Acad.Sci.USA80:4803_7)。 在 Ingelbrecht et al. (1989)Plant Cell 1:671-80 中提供了一个使用不同 3' 非翻译 区的实例。多聚腺苷酸信号的非限制性实例包括来自豌豆RBCS2基因的多聚腺苷酸信号 (Ps. RbcS2-E9 ;Coruzzi et al. (1984)EMBO J. 3:1671-9)和 AGRtu. nos (GenBank 登录号 No. E01312)。
[0129] 本发明的重组核酸分子或载体可包含选择标志物,其赋予被转化的细胞(例如植 物细胞)可选择的表型。选择标志物也可以用于选择包含本发明核酸分子的植物或植物细 胞。该标记可以编码杀生物剂抗性、抗生素抗性(例如,卡那霉素、遗传霉素(G418)、博来 霉素,和潮霉素)或除草剂抗性(例如草甘膦)。选择标志物的实例包括,但不限于:neo基 因,其赋予卡那霉素抗性并可用例如卡那霉素和G418进行筛选;bar基因,其赋予双丙氨磷 抗性;突变的EPSP合酶基因,其赋予草甘膦抗性;腈水解酶基因,其赋予溴苯腈抗性;突变 的乙酰乳酸合酶基因(ALS),其赋予咪唑啉酮或磺酰脲抗性;和氨甲喋呤抗性DHFR基因。存 在多种可赋予对氣节青霉素;博来霉素;氣霉素;庆大霉素;潮霉素;卡那霉素;林可霉素; 甲氨蝶呤;草铵膦;嘌呤霉素;大观霉素;利福平;链霉素;和四环素等抗性的选择标志物。 这些选择标志物的实例在,例如,美国专利5, 550, 318 ;5, 633, 435 ;5, 780, 708和6, 118, 047 中有举例。
[0130] 本发明的核酸分子或载体可额外地/作为替代地包含筛选标志物。筛选标志物 可用于监视表达。筛选标志物的实例包括β-葡糖醛酸糖苷酶或UidA基因(GUS),其编码 已知有多种发色底物的酶(Jefferson et al.(1987)Plant Mol. Biol. R印.5:387-405); R-座位基因,其编码的产物可调节植物组织中花青素色素(红色)的产生(Dellaporta et al. (1988) "Molecular cloning of the maize R-nj allele by transposon tagging with Ac·,' 见 18th Stadler Genetics Symposium, P. Gustafson and R. Appels,编 辑,Plenum, NY(第 263-82 页);β-内酰胺酶基因 (Sutcliffe et al. (1978) Proc.Natl. Acad. Sci. USA 75:3737-41);编码其各种发色底物已知的酶的基因(例如,PADAC,一种发 色头孢菌素);荧光素酶基因(〇w et al. (1986) Science 234:856-9) ;xylE基因,其编码一 种儿茶酚双加氧酶,转换发色的儿茶酚(Zukowski et al. (1983) Gene 46(2-3):247-55); 淀粉酶基因 (Ikatu et al.(1990)Bio/Technol. 8:241-2);酪氨酸酶基因,其编码的 酶能够氧化酪氨酸为DOPA多巴醌,进一步缩合成黑色素 (Katz et al. (1983)J.Gen. Microbiol. 129:2703-14);和 α-半乳糖苷酶。
[0131] 适用于转化宿主细胞的方法包括任何能够将DNA引入到细胞内的方法,例如但 不限于:原生质体转化(参见,例如,美国专利5, 508, 184);干燥/抑制介导的DNA摄取 (desiccation/inhibition-mediated DNA uptake)(参见,例如 Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8);电穿孔(参见,例如,美国专利5, 384, 253);用碳化硅纤维搅 拌(参见,例如,美国专利5, 302, 523和5, 464, 765) ;土壤杆菌介导的转化(参见,例如,美 国专利 5, 563, 055, 5, 591,616, 5, 693, 512, 5, 824, 877, 5, 981,840,和 6, 384, 301);和 DNA 涂覆颗粒的加速(acceleration of DNA-coated particles)(参见,例如,美国专利5,015, 580, 5, 550, 318, 5, 538, 880, 6, 160, 208, 6, 399, 861,和 6, 403, 865)等。通过诸如这些技术 的应用,几乎任何物种的细胞均可以被稳定地转化。在一些实施方案中,转化DNA被整合到 宿主细胞的基因组中。在多细胞物种的情况下,转基因细胞可以再生为转基因生物。任何 这些技术均可用于产生转基因植物,例如,在转基因植物的基因组中包含一个或多个本发 明的核酸序列。
[0132] 最广泛使用的用于将表达载体导入到植物中的方法是基于土壤杆菌的天然转化 系统。根癌土壤杆菌和发根土壤杆菌是可遗传转化植物细胞的植物致病性土壤细菌。根癌 土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物遗传转化的基因 。Ti (肿瘤诱 导)质粒含有一个大区段,称为T-DNA,其可以转移到被转化的植物中。Ti质粒的另一个片 段,vir区,负责T-DNA转移。T-DNA区域的边界由重复序列构成。在某些经修饰的双元载 体中,肿瘤诱导的基因已被删除,并且vir区的功能被利用来转移被T-DNA边界序列包围的 外源DNA。T-区还可以包括,例如,选择标志物,其用于高效回收转基因植物和细胞,和多克 隆位点,其用于插入供转移的序列,例如人造的芸苔属来源的CTP编码核酸。
[0133] 因此,在一些实施方案中,植物转化载体可衍生自根癌土壤杆菌的Ti质粒(参 见,例如,美国专利 Nos. 4, 536, 475, 4, 693, 977, 4, 886, 937 和 5, 501,967,以及欧洲专利 EP 0 122 791)或发根土壤杆菌的Ri质粒。其他的植物转化载体包括,例如但不限于,在 下列文献中描述的那些:Herrera-Estrella et al.(1983)Nature 303:209-13 ;Bevan et al. (1983),同上;Klee et al. (1985)Bio/Technol. 3:637-42;和欧洲专利 EP 0 120 516, 以及从前述任一种衍生的那些。其它天然与植物互作的细菌,例如中华根瘤菌、根瘤菌属、 和慢生根瘤菌属,也可以被修饰从而介导将基因转移到多种不同的植物中。这些植物相关 的共生菌可以通过获取卸甲(disarmed)的Ti质粒和合适的双元载体而拥有基因转移能 力。
[0134] 在向受体细胞提供外源DNA之后,一般对被转化细胞进行鉴定,以用于进一步的 培养和植株再生。为了提高鉴定被转化的细胞的能力,可能期望采用与用于产生转化体的 载体相伴的选择或筛选标志物基因,如先前所述。在使用选择标志物的情况下,通过使细胞 暴露于选择试剂,在潜在的被转化细胞群体中鉴定被转化的细胞。在使用筛选标志物的情 况下,可以通过期望的标记基因性状对细胞进行筛选。
[0135] 对于暴露于选择试剂时存活的细胞,或在筛选测定中具有阳性得分的细胞,可以 在支持植株再生的培养基中培养。在一些实施方案中,对任何合适的植物组织培养基(例 如,MS和N6培养基)均可加以修饰使其包含更多的物质,如生长调节剂。组织可以保持在 含有生长调节剂的基本培养基中,直到获得足够的组织用于开始植物再生,或者进行多轮 重复的人工选择,直到组织的形态适合于再生(例如,至少2周),然后转移到有利于芽形成 的培养基中。培养被周期性转移,直到形成足够的芽。一旦芽形成,即将它们转移到有利于 根形成的培养基中。一旦有足够的根部形成,可以将植物转移到土壤中进一步生长和成熟。
[0136] 为了确认再生植物中感兴趣的核酸分子(例如编码含有至少一个人造的芸苔属 来源的CTP的多肽的核苷酸序列)的存在,可以实施的测定有很多种。这些测定包括,例如: 分子生物学测定,如Southern和Northern杂交、PCR和核酸测序;生物化学测定,例如通过 如免疫学方法(ELISA和/或Western印迹)或通过酶促作用检测蛋白质产物的存在;植物 部分测定,如叶或根测定;和全再生植物的表型分析。
[0137] 作为举例,整合事件可以通过PCR扩增进行分析,其使用,例如,特异针对感兴趣 的核苷酸序列的寡核苷酸引物。PCR基因分型理解为包括,但不限于,来自预测含有被整合 到基因组中的感兴趣的核酸分子的分离宿主植物组织的基因组DNA的聚合酶链反应(PCR) 扩增,随后是标准克隆和PCR扩增产物的序列分析。PCR基因分型的方法已经有详细的描述 (参见,例如,Rios, G.et al. (2002)Plant J. 32:243-53),并可应用于衍生自任何植物物种 (例如玉米或大豆)或组织类型(包括细胞培养物)的基因组DNA。
[0138] 使用土壤杆菌依赖的转化方法形成的转基因植物通常含有被插入到一个染色体 上的单一重组DNA序列。该单一重组DNA序列被称作"转基因事件"或"整合事件"。这样 的转基因植物对于所插入的DNA序列而言是杂合的。在一些实施方案中,可以获得对转基 因而言为纯合的转基因植物,这是通过使含有单个外源基因序列的独立分离的转基因植物 与自身(例如F tl植物)有性交配(自交)产生F1种子。所产生的F1种子中四分之一对转 基因而言是纯合的。萌发F 1种子产生能够用于杂合性测试的植物,其中杂合性测定通常使 用允许区分杂合子和纯合子的SNP测定或热扩增测定法(即,合子型测定)。
[0139] 在特定的实施方案中,在其中已经引入了至少一个包含编码至少一个含有至少一 个人造的芸苔属来源的CTP的多肽的核酸分子的含有质体的细胞内,产生了至少一个人造 的芸苔属来源的CTP的多肽的多个拷贝。每个含有至少一个人造的芸苔属来源的CTP的多 肽可以由被引入到不同转化事件中的多个核酸序列表达,或者由被引入到单个转化事件中 的单个核酸序列表达。在一些实施方案中,多个这样的多肽可以在单个启动子的控制下表 达。在其它实施方案中,多个这样的多肽可以在多个启动子的控制下表达。可以表达含有 多个肽序列的单一多肽,其中每一个肽序列均将被导向到质体。
[0140] 除了用重组核酸分子直接转化植物之外,还可以通过将具有至少一个转基因事件 的第一植物与缺少这种事件的第二植物杂交,来制备转基因植物。例如,可以将含有编码包 含至少一个人造的芸苔属来源的CTP的多肽的核苷酸序列的重组核酸分子引入到适于转 化的第一植物品系内,从而产生转基因植物,可以将转基因植物和第二植物品系杂交,从而 将编码该多肽的核苷酸序列引入到该第二植物品系内。
[0141] VI.包含被人造芸苔属来源叶绿体转运肽引导的多肽的植物材料
[0142] 在一些实施方案中,提供了一种植物,其中该植物包含这样的植物细胞:该植物细 胞中含有编码包含至少一个人造的芸苔属来源的CTP的多肽的核苷酸序列。在特定的实施 方案中,这样的植物可以通过转化植物组织或植物细胞,并再生整株植物来产生。在进一步 的实施方案中,这样的植物可以从商业来源获得,或者通过将含有编码含有至少一个人造 的芸苔属来源的CTP的多肽的核苷酸序列的核酸渗入到种质中而获得。还提供了这样的 植物材料,其包含植物细胞,该植物细胞中含有编码含有至少一种人造的芸苔属来源的CTP 的多肽的核苷酸序列。这样的植物材料可以从包含该植物细胞的植物中获得。在进一步的 实施方案中,植物材料是不能再生而产生植物的植物细胞。
[0143] 包含编码包含至少一个人造的芸苔属来源的CTP的多肽的核苷酸序列的转基因 植物或植物材料在一些实施方案中可表现出一个或多个以下的特征:在植物的细胞内表达 该多肽;在植物细胞的质体内表达该多肽的一部分;将多肽从植物细胞的细胞质导入到细 胞的质体内;在植物细胞内质体特异性地表达该多肽;和/或将多肽定位在植物的细胞内。 除了表达编码的多肽之外,这样的植物可以额外具有一个或多个期望的性状。这些性状可 以包括例如:抗昆虫等害虫以及致病剂;耐除草剂;增强稳定性、产量或保质期;环境抗性; 药物生产;工业产品生产;和营养强化。
[0144] 根据本发明的转基因植物可以是任何能够被本发明核酸分子转化的植物。因 此,该植物可以是双子叶植物或单子叶植物。本发明方法中可以使用的双子叶植物的非 限制性实例包括:拟南芥属,苜蓿,豆类,西兰花,卷心菜,胡萝卜,花椰菜,芹菜,大白菜, 棉花,黄瓜,茄子,莴苣,甜瓜,豌豆,胡椒,花生,马铃薯,南瓜,萝卜,油菜,菠菜,大豆,倭瓜 (squash),甜菜,向日葵,烟草,番茄,和西瓜。本发明方法中可以使用的单子叶植物的非 限制性实例包括:玉米,芸苔属植物(Brassica),洋葱,水稻,高粱,小麦,黑麦,黍,甘蔗,燕 麦,黑小麦,柳枝稷,以及草坪草。根据本发明的转基因植物可以按照任何方式使用或栽培。
[0145] 一些实施方案还提供了含有一个或多个编码包含至少一个人造的芸苔属来源的 CTP的多肽的核苷酸序列的商业产品,例如从含有一个或多个这样的核苷酸序列的重组植 物或种子中产生的商业产品。含有一个或多个编码包含至少一个人造的芸苔属来源的CTP 的多肽的核苷酸序列的商业产品包括,例如但不限于:含有一个或多个编码包含至少一个 人造的芸苔属来源的CTP的多肽的核苷酸序列的植物的食品、柏、油、压碎的或完整的颗粒 或种子。在一个或多个商品或商业产品中检测到一个或多个编码包含至少一个人造的芸苔 属来源的CTP的多肽的核苷酸序列,是事实上的证据,表明该商品或商业产品至少部分地 是由包含一个或多个编码包含至少一个人造的芸苔属来源的CTP的多肽的核苷酸序列的 植物产生的。在特定的实施方案中,本发明的商品产品包括可检测量的、编码包含至少一个 人造的芸苔属来源的CTP的多肽的核酸序列。在一些实施方案中,这种商品产品可以通过, 例如,获得转基因植物并从它们制备食物或饲料来生产。
[0146] 在一些实施方案中,含有转基因的转基因植物或种子(该转基因包含编码包含至 少一个人造的芸苔属来源的CTP的多肽的核苷酸序列)在其基因组中还可以包含至少一个 其它的转基因事件,包括但不限于:可转录RNAi分子的转基因事件;编码杀虫蛋白的基因 (例如,苏云金芽孢杆菌杀虫蛋白);除草剂耐受性基因(例如,提供对草甘膦耐受性的基 因);和有助于在转基因植物中产生期望表型的基因(例如,增加产量,改变脂肪酸代谢,或 恢复细胞质雄性不育性)。
[0147] VII.人造芸苔属来源叶绿体转运肽介导基因产物定位在质体上
[0148] 本发明的一些实施方案提供了一种用于将基因产物表达和/或定位于质体(例如 叶绿体)上的方法。在特定的实施方案中,基因产物可以是标志物基因产物,例如,荧光分 子。基因产物作为还包含人造的芸苔属来源的CTP的多肽的一部分的表达,可以提供一种 用来评估特定的人造芸苔属来源的CTP序列的质体定位能力的系统。在一些实施方案中, 标记基因产物的表达,其中该标记基因产物作为包含人造的芸苔属来源的CTP的多肽的一 部分,可用于将标记基因产物的表达导向到表达该多肽的细胞的质体上。在某些实施方案 中,这样的标记基因产物被定位在宿主细胞的质体上。例如,标志物基因产物在质体中的表 达水平可能比在宿主细胞细胞质或其他细胞器中更高;标志物基因产物可能在质体中的表 达水平商得多;标记基因广物可能基本上只在质体中表达;或者标记基因广物可能完全在 质体中表达,从而不能检测到其在细胞质或非质体细胞器中的表达。
[0149] 在一些实施方案中,包括人造的芸苔属来源的CTP的功能性变体的多肽,其中该 多肽与标志物基因产物可操作地连接,用于评估功能性变体肽的特性。例如,可以改变人造 的芸苔属来源的CTP,例如在人造的芸苔属来源的CTP中引入至少一个保守突变,并且可将 所得的变体肽和标志物基因产物可操作地连接。在合适的宿主细胞(例如,其中表达构建 体中的一个或多个调节元件可运作的细胞)中表达后,可以确定标志物基因产物的表达。 通过在参考人造的芸苔属来源的CTP-标记物构建体和变异体肽-标记物构建体之间比较 标志物基因产物的亚细胞定位,可以确定变异体肽是否提供,例如,更大的(greater)质体 定位,或基本上相同的质体定位。这样的变体可认为是功能性变体。通过鉴定人造的芸苔属 来源的CTP的能提供更大质体定位的功能性变体,可以将这样的变体中的突变纳入到进一 步的人造芸苔属来源的CTP的变体中。执行多轮该评估过程,并随后将被鉴定的有利突变 纳入到人造的芸苔属来源的CTP序列内,可以产生一个迭代的过程,用于优化人造的芸苔 属来源的CTP序列。这种优化的人造的芸苔属来源的CTP序列,和编码它们的核苷酸序列, 被认为是本发明的一部分,无论此类优化的人造芸苔属来源CTP序列是否能够通过添加额 外的突变而进一步被优化。
[0150] 本文讨论的参考文献仅仅是由于它们公开于本专利申请提交日之前。本文中的任 何内容不应被理解为本发明人承认没有资格由于先前的发明而早于这些公开。
[0151] 下面提供的实例用于例证某些特定的特征和/或实施方案。这些实例不应视为将 本公开限制在所例证的这些特定特征或实施方案中。 实施例
[0152] 实施例1 :嵌合叶绿体转运肽(TraP)序列的设计和产生
[0153] 质体是在高等植物物种中发现的细胞器,并存在于所有植物组织中。叶绿体是在 绿色光合组织中发现的一种特化型质体,负责至关重要的生理功能。例如,其中一种这样的 主要生理功能是合成植物所需的芳香族氨基酸。细胞核编码的酶是此生物合成途径必需 的,这些酶从细胞质被转运到叶绿体的内部。这些细胞核编码的酶通常具有N端转运肽, 其与叶绿体膜相互作用,从而促进肽转运到叶绿体的基质。Bruce B. (2000) Chloroplast transit peptides:structure, function, and evolution. Trends Cell Bio. 10:440 - 447。 在输入时,基质肽酶切掉该转运肽,而使成熟的功能蛋白被输入到叶绿体内。Richter S,Lamppa GK. (1999)Stromal processing peptidase binds transit peptides and initiates their ATP-dependent turnover in chloroplasts. Journ. Cell Bio. 147:33 -43。叶绿体转运肽是可变的序列,其在长度、组成和组织上有高度多样性。Bruce B. (2000) Chloroplast transit peptides:structure, function, and evolution. Trends Cell Bio. 10:440 - 447。叶绿体转运肽的序列相似性在来自不同植物物种的同源蛋白之间有显 著差异。叶绿体转运肽之间的差异大小出乎人们的预料,因为比较加工成熟的功能蛋白时, 从不同植物物种获得的同源蛋白通常具有相对高水平的序列相似度。
[0154] 设计、产生并在植物内测试了新的嵌合叶绿体转运肽序列。新的嵌合叶绿体转运 肽显示具有高效的转位和加工性能,用于将农艺学上重要的蛋白转运到叶绿体中。首先,通 过ChloroP?计算机程序分析来自不同植物物种的天然5-烯醇式丙酮酰莽草酸-3-磷酸 合酶(EPSPS)蛋白序列,以鉴定推定的叶绿体转运肽序列(Emanuelsson 0, Nielsen H, von Heijne G, (1999)ChloroP, a neural network-based method for predicting chloroplast transit peptides and their cleavage sites, Protein Science 8 ;978_984),该程序可 以在http://www. cbs. dtu. dk/services/ChloroP/获得。在鉴定出天然叶绿体转运肽序列 之后,将第一叶绿体转运肽序列与来自第二生物体的第二叶绿体转运肽序列进行对齐。图2 示出了欧洲油菜(NCBI登录No:P17688)和拟南芥(NCBI登录No. NP_182055)的EPSPS叶绿 体转运肽序列的对齐结果。利用叶绿体转运肽的序列对齐,通过将来自第一生物体的叶绿 体转运肽的一半与来自第二生物体的叶绿体转运肽序列的另一半以大约1:1的近似比合 并,设计了新的嵌合叶绿体转运肽。新设计嵌合叶绿体转运肽的示例性序列是TraP12 (SEQ ID N0:6)和TraP13(SEQ ID N0:8)。这些新的嵌合叶绿体转运肽序列来源于欧洲油菜 (NCBI 登录 No:P17688)和拟南芥(NCBI 登录 Ν〇·ΝΡ_182055)的 EPSPS 蛋白。TraP12(SEQ ID NO :6)嵌合叶绿体转运肽序列包括来源于欧洲油菜的N末端,而该叶绿体转运肽的C端 来源于拟南芥。TraP13(SEQ ID N0:8)叶绿体转运肽序列包括来源于拟南芥的N末端,而 该叶绿体转运肽的C端来源于欧洲油菜。对该嵌合叶绿体转运肽通过多种包括瞬时植物内 表达系统的测定法进行测试,还通过转基因手段,将其作为包含与农艺学上重要的转基因 序列融合的基因表达元件的稳定转化事件加以测试。
[0155] 实施例2 :嵌合叶绿体转运肽(TraP)序列的瞬时植物内测试
[0156] 烟草瞬时测定:
[0157] 首先通过瞬时植物内测定对Trapl2和Trapl3嵌合叶绿体转运肽序列进行测试。 合成了编码Trapl2(SEQ ID N0:5)和TraP13(SEQ ID N0:7)嵌合叶绿体转运肽序列的多核 苷酸序列。在TraP序列和yfp编码序列之间加入了一个接头序列(SEQ ID NO: 10)。所得 的构建体含有两个植物转录单元(PTU)。第一个PTU包括拟南芥泛素10启动子(AtUbilO 启动子;Callis, et al·,(1990) J. Biol. Chem. ,265:12486-12493)、TraP-黄色荧光蛋白融 合基因(TraP-YFP ;美国专利申请号2007/0298412)、和根癌土壤杆菌ORF 23的3'非翻译 区(Atu0RF23 3' UTR ;美国专利号5, 428, 147)。第二个PTU包括木薯叶脉花叶病毒启动子 (CsVMV promoter ;Verdaguer et al., (1996)Plant Molecular Biology, 31:1129-1139)> 草铵膦乙酰转移酶(PAT ;Wohlleben et al.,(1988)Gene, 70:25-37)、和根癌土壤杆菌 ORF 1 的 3' 非翻译区(AtuORF13' UTR ;Huang et al.,(1990) J. Bacteriol.,172:1814-1822)。 构建体PDAB101981包含TraP12嵌合叶绿体转运肽(图3)。构建体pDAB101989包含TraP13 嵌合叶绿体转运肽(图4)。在本研究中构建并选用了对照质粒101908,其在yfp基因的上 游不含有叶绿体转运肽序列(图5)。通过限制酶消化和测序验证了这些构建体。最后,将 构建体转化到根癌土壤杆菌中,并作为甘油储液存储。
[0158] 从土壤杆菌甘油储液,将一满接种环的冷冻培养物接种到含有2ml YPD (100 μ g/ ml壮观霉素)的14ml无菌管中。将接种后的培养基在28°C温育过夜,同时以200rpm震 荡。翌日,将大约100 μ 1培养物接种在含有25mlYPD (100 μ g/ml壮观霉素)的125ml无菌 三隔挡板烧瓶(tri-baffled flask)中,并在28?下温育过夜,同时以200rpm振荡。第二 天,用无菌的CldH2O (pH 8. 0)将培养物稀释至0D_为0. 5。将稀释的土壤杆菌菌株以1:1的 比例与含有P19辅助蛋白的第二土壤杆菌菌株混合。使用该培养物通过下列文献中所述的 方法浸润烟草叶片:Voinnet 0, Rivas S, Mestre P, and Baulcombe D·,(2003) An enhanced transient expression system in plants based on suppression of gene silencing by the pl9protein of tomato bushy stunt virus,The Plant Journal, 33:949-956。将 经过浸润的烟草植株置于Conviron?组件中,在16小时光照、24°C下放置至少三天,直到测 定。
[0159] 显微观察结果
[0160] 从植物切下经土壤杆菌浸润的烟草叶片,并置于含有水的培养皿(petri-dish) 中防止脱水。通过蓝光激发,使用装配好长通滤光片(long-pass filter glasses)的Dark Reader Hand Lamp?(Clare Chemical Research Co. ;Dolores, CO)并使用对经过浸润的 烟草叶片进行观察,以鉴定成功表达YFP报告蛋白的叶片的未损伤区域。将具体鉴定的 叶片区域从叶片切下,并置于水中,通过共聚焦显微镜(Leica TCS-SP5A0BS? Buffalo Grove,IL)成像。YFP报告蛋白使用多谱线氩离子激光器用514nm激光谱线激发。使用一 个无表达的(暗)对照叶片样品调节检测狭缝(slit)的宽度,以排除背景叶自发荧光。同 时在另一个通道内收集叶绿素自发荧光,用于与确定叶绿体定位用的荧光报告蛋白的信号 进行直接比较。
[0161] 显微镜成像的结果表明,包含TraP12或TraP13叶绿体转运肽的YFP荧光蛋白积 累在位于烟草细胞细胞质中的叶绿体内,与之相比,对照YFP荧光蛋白不会转位到烟草细 胞细胞质叶绿体内(图6和图7)。这些显微镜成像结果提示,YFP蛋白转位到叶绿体内是 由于TraP12或TraP13叶绿体转运肽造成的。如图6和图7所示,YFP荧光信号被定位在 叶绿体内,而叶绿体由于自发荧光在显微镜成像条件下还发红色荧光。相比之下,图8提供 了用不含叶绿体转运肽的对照构建体PDAB101908浸润的烟草叶组织的显微图像。在显微 镜成像条件下,该图像中的叶绿体仅由于自发荧光而显示红色荧光,而没有任何在TraP浸 润的烟草细胞中所显示的YFP荧光信号。相反,对照烟草植物细胞中的YFP荧光在整个烟 草植物细胞的细胞质中弥散表达。
[0162] Western 印迹结果:
[0163] 通过Western印迹对经过浸润的烟草植物样品进行测定。收集叶冲孔(leaf punches)样品并进行球珠研磨。将大约100-200mg叶材料与2BBs(Daisy ;Rogers,AR)和 500ml PBST在Kleco?珠磨机中混合3分钟。然后将样品在离心机中4°C下以14, OOOx g离 心沉降。移出上清液,直接通过Western印迹进行分析,或者进行免疫沉淀。免疫沉淀使用 Pierce Direct IP Kit?(Thermo Scientific ;Rockford, IL)并按照制造商的方案进行。大 约50yg抗-YFP被结合在树脂上。样品与树脂在4°C温育过夜。接着,次日早晨对样品进 行清洗和洗脱,并通过与等体积的2X 8M尿素样品缓冲液混合后煮沸样品5分钟准备用于 分析的样品。将煮沸过的样品在MOPS缓冲液中的4-12% SDS-Bis Tris凝胶上运行40分 钟。然后,使用 Invitrogen iBlot?(Life Technologies ;Carlsbad, CA)按照制造商的方案 对凝胶进行印迹。印迹过的膜用PBS-吐温溶液中5%的脱脂奶粉封闭10分钟。用PBS-吐 温溶液中5%的脱脂奶粉以1:1000稀释第一抗体(兔单克隆抗-GFP),并用该第一抗体探 测膜1小时。接着,用PBS-吐温将膜漂洗三次,每次5分钟,以除去所有未结合的第一抗体。 用1:1000稀释的第二单克隆山羊抗兔抗体(Life Technologies)探测膜60分钟。如前所 述地清洗膜,并通过添加 Themo BCIP/NBT底物进行显影。让比色底物显影5-10分钟,然后 用水漂洗印迹,再令印迹干燥。
[0164] Western印迹结果表明,在被浸润的烟草细胞中表达了 YFP蛋白。在pDAB101981 和PDAB101989浸润的烟草植物叶组织中均表达了 YFP蛋白,其表现是存在与YFP抗体反应 的蛋白条带,并且该条带大小与从用YFP对照构建体浸润的烟草植物叶组织中获得的YFP 蛋白条带相当。而且,这些结果表明,TraP嵌合叶绿体转运肽被加工,并且从YFP蛋白切除。 TraP12-YFP和TraP13-YFP构建体表达一个被前处理的蛋白条带,其分子量大于对照YFP蛋 白。在Western印迹上存在与对照YFP大小相当的条带,表明该TraP12和TraP13叶绿体 转运肽序列被加工,由此减少了 YFP的大小,使其分子量大小与YFP对照相当。
[0165] 玉米原牛.质体瞬时测定
[0166] 将Trapl2嵌合叶绿体转运肽编码多核苷酸序列(SEQ ID N0:5)和接头序列(SEQ ID NO :10)克隆在黄色荧光蛋白基因的上游,并且纳入到构建体中,用于通过玉米原生质体 瞬时植物内测定法进行测试。所得的构建体含有下列植物转录单元(PTU)。第一个PTU包括 玉米泛素 1 启动子(ZmUbil 启动子;Christensen, A.,Sharrock R.,and Quail P.,(1992) Maize polyubiquitin genes: structure, thermal perturbation of expression and transcript splicing, and promoter activity following transfer to protoplasts by electroporation, Plant Molecular Biology, 18:675-689),TraP-黄色突光蛋白融 合基因(TraP12-YFP;美国专利申请2007/0298412),和玉米过氧化物酶53'非翻译区 (ZmPer53' UTR ;美国专利No. 6384207)。该构建体通过限制酶消化和测序得到了确认。
[0167] 对玉米栽培种B104的种子在含有2?3滴吐温20的50% Clorox (3 %次氯酸钠) 中剧烈震荡大约20分钟进行表面灭菌。将种子用无菌蒸馏水彻底漂洗。将无菌的种子点 种在放有1/2MS培养基的Phytatrays或相似类型盒子中,并让它们在黑暗中(28°C )中生 长12至20天。使用玉米原生质体瞬时测定法获得并转染来自B104-玉米叶片的原生质 体。这种玉米原生质体测定法是下列文献所述系统的修改版本:Yoo, S. -D.,Cho, Υ. -H.,and Sheen,J.,(2007),Arabidopsis Mesophyll Protoplasts:A Versitile Cell System for Transient Gene Expression Analysis, Nature Protocols, 2:1565-1572。溶液的制备如 Yoo et.al. (2007)所述,只是用于下述实验的甘露醇浓度改为0.6M。
[0168] 100-500 μ 1原生质体(1-5χ105)的转染通过在室温下将原生质体加入到含有约 40 μ g质粒DNA(pDAB106597)的2ml微量离心管中来完成。DNA的体积优选地保持为原生 质体体积的约10%。在5分钟的温育期间偶尔对原生质体和DNA进行混合。将等体积的 PEG溶液缓慢加入到原生质体和DNA中,每次加2滴,在各次加 PEG溶液之间的间隔进行混 合。将试管再温育约10分钟,并偶尔轻轻混合。接着,加入Iml W5+溶液,并颠倒试管数次 混匀。将管在4°C下75x g离心5分钟。最后除去上清液,并将沉淀物重悬浮于Iml WI溶 液中,并将原生质体放置在小培养皿(35x IOmm)中或放置于6孔多孔平板中,并在室温下 黑暗温育过夜。温育12小时后,通过显微镜观察YFP荧光。使用前述的显微镜条件进行成 像。
[0169] 显微镜成像的结果表明,包含TraP12嵌合叶绿体转运肽的YFP荧光蛋白积累在烟 草细胞细胞质中的叶绿体内,相比之下,对照YFP荧光蛋白不转位到烟草细胞细胞质叶绿 体内(图9)。这些显微镜成像结果提示,YFP蛋白转位到叶绿体内是由于TraP12嵌合叶绿 体转运肽造成的。
[0170] 实施例3 :用于在拟南芥中表达农艺学上重要的转基因的嵌合叶绿体转运肽 (TraP)序列
[0171] 大肠杆菌5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSP合酶)中的一个单氨基酸突 变(G96A)会导致草甘勝不敏感性(Padgette et al.,(1991) ;Eschenburg et al.,(2002); Priestman et al·,(2005) ;Haghani et al·,(2008))。尽管该突变会赋予对草甘膦的耐受 性,但是它已知也会不利地影响EPSP合酶与其天然底物--磷酸烯醇式丙酮酸(PEP)的结 合。由此造成的底物结合效率的改变可能会使得突变酶不适合于在植物内提供对草甘膦的 耐受性。
[0172] 在计算机上对NCBI GenBank数据库筛选在EPSP合酶的与该酶的大肠杆菌版 本中引入的G96A突变类似的位置上天然含有丙氨酸的EPSP合酶蛋白和多核苷酸序列 (Padgette et al. , (1991) ;Eschenburg et al. , (2002) ;Priestman et al. , (2005); Haghani et al. , (2008) )〇
[0173] -种被鉴定为在该位置含有天然丙氨酸的酶是来自斯维链霉菌(Streptomyces sviceus)ATCC29083 的 DGT-28 (GENBANK 登录号 N0:ZP_06917240. 1)。进一步的计算机数据 挖掘显示了 3个另外的与DGT-28具有更大同源性的独特链霉菌酶:DGT-31 (GENBANK ACC N0:YP_004922608.1) ;DGT-32(GENBANK ACC N0:ZP_04696613);和 DGT-33(GENBANK ACC N0:NC_010572)。这些酶中的每一个都在EPSP合酶的与该酶的大肠杆菌形式中引入的G96A 突变类似的位置上含有一个天然的丙氨酸。图1。
[0174] 因为来自不同生物体的EPSP合酶蛋白具有不同的长度,所以对大肠杆菌版本的 EPSP合酶的突变编号不一定与对来自其它生物体的EPSP合酶的突变编号相对应。这些鉴 定的EPSP合酶先前并未就其草甘膦耐受性或PEP底物亲和力被表征过。而且,这些EPSP 合酶代表了一类新的EPSP合酶,且它们不含有任何已经被用于表征先前描述的I类(在美 国专利No. RE39247中进一步描述的植物来源序列)、II类(在美国专利No. RE39247中进 一步描述的细菌来源序列)、和ΠΙ类(在国际专利申请WO 2006/110586中进一步描述的 细菌来源序列)EPSP合酶的序列基序。
[0175] 对新型DGT-14, DGT-28, DGT-31, DGT-32和DGT-33酶的草甘膦耐受性和PEP底物 亲和性进行了表征,并与I类EPSP合酶进行了比较。使用如下的I类酶进行比较:来自大豆 的DGT-1,来自欧洲油菜的DGT-3 (GENBANK登录号N0:P17688),来自小麦的DGT-7 (GENBANK 登录号N0:EU977181)。合成并评估了 I类EPSP合酶及其突变变体。在植物EPSP合酶中导 入的一个突变是与该酶的大肠杆菌版本中的G96A突变的相似位置处导入的甘氨酸向丙氨 酸的突变。此外,在如Funke et al.,(2009)所述的大肠杆菌EPSP合酶的氨基酸97 (T变 为I)和氨基酸101 (P变为S)的相似位置处,在这些I类EPSP合酶中引入了苏氨酸向异亮 氨酸和脯氨酸向丝氨酸的突变。
[0176] DGT14:
[0177] 如美国专利申请No. 11/975,658所述产生了含有与(^卜14转基因融合的1'四卩12 和TraP13嵌合叶绿体转运肽的转基因的T1拟南芥植物。用不同比率的草甘膦喷洒转基因 植物。在本研究中采用了不同浓度的草甘膦比率的分布,其中包括高比率,用于确定耐受性 的相对水平(105, 420, 1,680或3, 360gae/ha)。草甘膦的典型IX田间使用比例为1,120g ae/ha。本研究中使用的1\拟南芥植物的dgt-14转基因拷贝数不同。通过分子确认方法鉴 定低拷贝dgt-14 T1拟南芥植物,并自花受粉,用于产生T2植物。表1示出了 dgt-14转基 因植物的耐受性,与包含草甘膦除草剂抗性基因 dgt-Ι的(如美国专利申请号No. 12558351 中描述的)对照植物进行比较。
[0178] 拟南芥T1转化体首先用草甘膦筛选方案从未转化种子的背景中选择出来。为每个 T1构建体分析3个浅箱(flat)或30, 000个种子。对选出的T1植物进行分子表征,并随后 将植物转移到单独的地块,并用如前所述的不同比例的商业草甘膦喷洒。这些植物的剂量 响应用处理2周后(WAT)的%目测损伤表示。下面表中提供的数据显示了展示很少或没有 损伤(〈20% )、中等损伤(20?40% )或严重损伤(>40% )的各个植株。为每个用于拟南 芥转化的构建体提供了算术平均和标准差。还在最后一列中对每个比率和转化示明了个体 响应的范围。野生型,非转化的拟南芥(哥伦比亚栽培种),用作草甘膦敏感型对照。
[0179] 在T1拟南芥植物中植物的响应水平有不同。该变差可能是由于这样的事实,即 每株植物代表一个独立的转化事件,因此感兴趣的基因的拷贝数在每个植物之间有不同。 表1中提供了按比率别的总群体损伤平均值,证明与dgt-Ι和非转化野生型对照相比,与 TraP12 v2或TraP13 v2叶绿体转运肽连锁的每一个dgt-14构建体均提供了对不同比例草 甘膦的耐受性。这些事件含有与TraP12V2(SEQIDN0 :ll)连锁的dgt-14,其包含在构建 体pDAB105528(图10)中,和与TraP13v2(SEQ ID N0:12)连锁的dgt-14,其包含在构建体 pDAB105529(图11)中。来自对T1植物的草甘膦选择的数据证明,当dgt-14与这些叶绿体 转运肽连锁时,可以提供强的对高水平草甘膦的耐受性。相比之下,在用相似比率的草甘膦 处理非转化的(或野生型)对照时,没有提供对高浓度草甘膦处理的耐受性。此外,有些情 况下,显示含有3个或更多个拷贝的dgt-14的事件对高比例的草甘膦更加敏感。这可能是 由于,拟南芥植物中存在的高拷贝数转基因导致转基因沉默或者表观遗传效应,结果虽然 存在dgt-14转基因仍对草甘膦敏感。
[0180] 表I. dgt-14转化的T1拟南芥对萌发后施用的一定范围的草甘膦比例的响应,与 dgt-l(T2)分离群体和非转化对照比较。施用后2周的目测%损伤
[0181]

【权利要求】
1. 一种分尚的核酸分子,包含: 人造的芸苔属(Brassica)来源的核苷酸序列,其编码包含第一芸苔属叶绿体转运肽 的连续氨基酸序列的肽,该肽还包含第二叶绿体转运肽的连续氨基酸序列。
2. 权利要求1的分离的核酸分子,其还包含感兴趣的核苷酸序列,所述感兴趣的核苷 酸序列与该人造的芸苔属来源的核苷酸序列可操作地连接。
3. 权利要求1的分离的核酸分子,其中所述第一芸苔属叶绿体转运肽来自欧洲油菜 (Brassica napus)〇
4. 权利要求3的分离的核酸分子,其中所述第二叶绿体转运肽来自与第一芸苔属叶绿 体转运肽不同的芸苔属物种。
5. 权利要求1的分离的核酸分子,其中所述第二叶绿体转运肽来自拟南芥属 (Arabidopsis)物种。
6. 权利要求5的分离的核酸分子,其中所述第二叶绿体转运肽来自拟南芥 (Arabidopsis thaliana)〇
7. 权利要求1的分离的核酸分子,其中所述第一芸苔属叶绿体转运肽来自3-烯醇式丙 酮酰莽草酸-5-磷酸合成酶基因。
8. 权利要求1的分离的核酸分子,其中所述第二叶绿体转运肽来自3-烯醇式丙酮酰莽 草酸-5-磷酸合成酶基因。
9. 权利要求1的分离的核酸分子,其中所述肽与选自SEQ ID N0:6和8的叶绿体转运 肽至少80 %相同。
10. 权利要求9的分离的核酸分子,其中所述肽与选自SEQ ID N0:6和8的叶绿体转运 肽至少85 %相同。
11. 权利要求10的分离的核酸分子,其中该肽与选自SEQ ID N0:6和8的叶绿体转运 肽至少90 %相同。
12. 权利要求11的分离的核酸分子,其中该肽与选自SEQ ID N0:6和8的叶绿体转运 肽至少95 %相同。
13. 权利要求12的分离的核酸分子,其中该肽与选自SEQ ID N0:6和8的叶绿体转运 肽至少98 %相同。
14. 权利要求13的分离的核酸分子,其中该肽选自SEQ ID N0:6和8。
15. 权利要求1的分离的核酸分子,其中该感兴趣的核苷酸编码序列不编码SEQ ID NO: 1 或 SEQ ID NO:3 的肽。
16. 权利要求1的分离的核酸分子,其中编码该肽的核苷酸序列能够与选自SEQ ID N0:6和8的核苷酸序列特异性杂交。
17. 权利要求2的分离的核酸分子,还包含至少一个额外的核苷酸序列,所述额外的核 苷酸序列分别编码叶绿体转运肽,其中所述额外的核苷酸序列与所述感兴趣的核苷酸序列 可操作地连接。
18. 权利要求17的分离的核酸分子,其中所述至少一个额外的核苷酸序列来自选自下 组的生物:原核生物、低等光合真核生物、和绿藻。
19. 权利要求2的分离的核酸分子,其中所述人造的芸苔属来源的核苷酸序列以及感 兴趣的核苷酸序列与一个或多个调节序列可操作地连接。
20. 权利要求2的分离的核酸分子,其中该核酸分子编码嵌合多肽,嵌合多肽包含由所 述感兴趣的核苷酸序列编码的肽和由所述人造的芸苔属来源的核苷酸序列编码的肽。
21. 由权利要求20的核酸分子编码的嵌合多肽。
22. 权利要求21的嵌合多肽,其中由所述感兴趣的核苷酸序列编码的肽被导向到含质 体细胞中的质体。
23. 权利要求22的嵌合多肽,其中该多肽包含叶绿体转运肽,当由所述感兴趣的多核 苷酸序列编码的肽被导向到质体时,该叶绿体转运肽被除去。
24. 权利要求21的嵌合多肽,其中该由感兴趣的核苷酸序列编码的肽是生物活性肽。
25. 权利要求21的嵌合多肽,其中该由感兴趣的核苷酸序列编码的肽是荧光肽。
26. 权利要求24的嵌合多肽,其中该生物活性肽是酶。
27. 权利要求24的嵌合多肽,其中该生物活性肽正常表达于天然表达所述肽的细胞的 质体中。
28. 权利要求24的嵌合多肽,其中该生物活性肽参与选自下组的过程:除草剂抗性, 病毒抗性,细菌病原体抗性,昆虫抗性,线虫抗性,真菌抗性,植物活力,植物产量,温度耐受 性,土壤条件耐受性,低光照水平耐受性,低水位耐受性,高水位耐受性,化学环境耐受性, 种子颜色,淀粉改性,氨基酸合成,光合作用,脂肪酸合成,油合成,类胡萝卜素合成,萜类合 成,淀粉合成,和除草剂抗性。
29. 权利要求24的嵌合多肽,其中该生物活性肽选自下组:玉米黄质环氧酶,胆碱单加 氧酶,亚铁螯合酶,ω -3脂肪酸去饱和酶,谷氨酰胺合成酶,维生素原A,激素,Bt毒素蛋白, 和对于鉴定含有感兴趣的性状的植物有用的标志物。
30. 权利要求28的嵌合多肽,其中所述生物活性肽参与除草剂抗性。
31. 权利要求26的嵌合多肽,其中所述生物活性肽选自下组:乙酰乳酸合酶(ALS),突 变的ALS,ALS的前体,3-烯醇式丙酮酰莽草酸-5-磷酸合酶(EPSPS),CP4 EPSPS和III类 EPSPS。
32. 包含权利要求2的核酸分子的植物表达载体。
33. 包含权利要求2的核酸分子的植物材料。
34. 权利要求33的植物材料,其中该植物材料选自下组:植物细胞、植物组织、植物组 织培养物、愈伤组织培养物、植物部分、和全植物。
35. 权利要求33的植物材料,其还包含含有所述肽的多肽。
36. 权利要求35的植物材料,其中所述感兴趣的核苷酸序列编码多肽的一部分,所述 多肽被导向到该植物材料的细胞中的质体。
37. 权利要求33的植物材料,其中所述核酸分子稳定整合到来自所述植物材料的细胞 的基因组中。
38. 权利要求33的植物材料,其中所述植物材料是全植物。
39. 权利要求33的植物材料,其中所述植物材料来自选自下组的植物:拟南芥属,苜 蓿,芸苔属,豆类,西兰花,卷心菜,胡萝卜,花菜,芹菜,大白菜,棉花,黄瓜,茄子,莴苣,甜 瓜,豌豆,胡椒,花生,马铃薯,南瓜,萝卜,油菜,菠菜,大豆,倭瓜,甜菜,向日葵,烟草,番茄, 西瓜,玉米,洋葱,水稻,高粱,小麦,黑麦,黍,甘蔗,燕麦,黑小麦,柳枝稷,和草坪草。
40. -种用于产生转基因植物材料的方法,该方法包括: 获得权利要求2的分离的核酸分子;和 用该核酸分子转化植物材料。
41. 根据权利要求40的方法,其中所述植物材料选自下组:植物细胞、植物组织、植物 组织培养物、愈伤组织培养物、植物部分、和全植物。
42. 根据权利要求40的方法,其中该植物材料不是全植物。
43. 通过根据权利要求40的方法产生的转基因植物材料。
44. 从权利要求43的转基因植物材料再生的转基因植物。
45. 从权利要求43的植物材料产生的转基因植物商业产品。
46. 权利要求43的转基因植物材料,其中所述感兴趣的核苷酸序列编码生物活性肽。
47. 权利要求46的转基因植物材料,其中所述生物活性肽参与选自下组的过程:除草 剂抗性,病毒抗性,细菌病原体抗性,昆虫抗性,线虫抗性,真菌抗性,植物活力,植物产量, 温度耐受性,土壤条件耐受性,低光照水平耐受性,低水位耐受性,高水位耐受性,化学环境 耐受性,种子颜色,淀粉改性,氨基酸合成,光合作用,脂肪酸合成,油合成,类胡萝卜素合 成,萜类合成,淀粉合成,和除草剂抗性。
48. 权利要求46的转基因植物材料,其中所述生物活性肽选自下组:玉米黄质环氧酶, 胆碱单加氧酶,亚铁螯合酶,ω-3脂肪酸去饱和酶,谷氨酰胺合成酶,维生素原A,激素 ,Bt 毒素蛋白,和对于鉴定含有感兴趣的性状的植物有用的标志物。
49. 权利要求47的转基因植物材料,其中所述生物活性肽参与除草剂抗性。
50. 权利要求46的转基因植物材料,其中该生物活性肽选自下组:乙酰乳酸合酶 (ALS),突变的ALS,ALS的前体,3-烯醇式丙酮酰莽草酸-5-磷酸合酶(EPSPS),CP4 EPSPS 和 III 类 EPSPS。
51. 权利要求49的转基因植物材料,其中该植物材料与相同物种的野生型植物材料相 t匕,显示增加的除草剂抗性或除草剂耐受性。
52. -种分离的核酸分子,其包含芸苔属来源的用于将多肽导向到叶绿体的手段。
53. 权利要求52的分离的核酸分子,其还包含与所述芸苔属来源的用于将多肽导向到 叶绿体的手段可操作地连接的感兴趣的核苷酸序列。
54. 权利要求53的分尚的核酸分子,其中该核酸分子编码嵌合多肽,该嵌合多肽包括 由所述感兴趣的核苷酸序列编码的肽。
55. 由权利要求54的核酸分子编码的嵌合多肽。
56. 权利要求55的嵌合多肽,其中由所述感兴趣的核苷酸序列编码的肽被导向到含质 体细胞中的质体。
57. 权利要求56的嵌合多肽,其中该多肽包含叶绿体转运肽,当由所述感兴趣的多核 苷酸序列编码的肽被导向到质体时,该叶绿体转运肽被除去。
58. 权利要求55的嵌合多肽,其中由感兴趣的核苷酸序列编码的肽是生物活性肽。
59. 权利要求58的多肽,其中该生物活性肽参与选自下组的过程:除草剂抗性,病毒抗 性,细菌病原体抗性,昆虫抗性,线虫抗性,真菌抗性,植物活力,植物产量,温度耐受性,土 壤条件耐受性,低光照水平耐受性,低水位耐受性,高水位耐受性,化学环境耐受性,种子颜 色,淀粉改性,氨基酸合成,光合作用,脂肪酸合成,油合成,类胡萝卜素合成,萜类合成,淀 粉合成,和除草剂抗性。
60. 权利要求58的多肽,其中该生物活性肽选自下组:玉米黄质环氧酶,胆碱单加氧 酶,亚铁螯合酶,ω -3脂肪酸去饱和酶,谷氨酰胺合成酶,维生素原A,激素,Bt毒素蛋白,和 对于鉴定含有感兴趣的性状的植物有用的标志物。
61. 权利要求58的多肽,其中该生物活性肽选自下组:乙酰乳酸合酶(ALS),突变的 ALS,ALS的前体,3-烯醇式丙酮酰莽草酸-5-磷酸合酶(EPSPS),CP4 EPSPS和III类EPSPS。
62. 包含权利要求53的核酸分子的植物表达载体。
63. 包含权利要求53的核酸分子的植物材料。
64. 权利要求63的植物材料,其中所述核酸分子稳定整合到来自所述植物材料的细胞 的基因组中。
65. 权利要求63的植物材料,其中所述植物材料是全植物。
66. 权利要求63的植物材料,其中所述植物材料来自选自下组的植物:拟南芥属,苜 蓿,芸苔属,豆类,西兰花,卷心菜,胡萝卜,花菜,芹菜,大白菜,棉花,黄瓜,茄子,莴苣,甜 瓜,豌豆,胡椒,花生,马铃薯,南瓜,萝卜,油菜,菠菜,大豆,倭瓜,甜菜,向日葵,烟草,番茄, 西瓜,玉米,洋葱,水稻,高粱,小麦,黑麦,黍,甘蔗,燕麦,黑小麦,柳枝稷,和草坪草。
67. -种用于产生转基因植物材料的方法,该方法包括: 获得权利要求53的分离的核酸分子;和 用该核酸分子转化植物材料。
68. 根据权利要求67的方法,其中该植物材料选自下组:植物细胞、植物组织、植物组 织培养物、愈伤组织培养物、植物部分、和全植物。
69. 根据权利要求67的方法,其中该植物材料不是全植物。
70. 通过根据权利要求67的方法产生的转基因植物材料。
71. 从权利要求70的转基因植物材料再生的转基因植物。
72. 权利要求70的植物材料,其中所述转基因植物材料是全植物。
73. 从权利要求70的转基因植物材料产生的植物商业产品。
74. 权利要求70的转基因植物材料,其中该感兴趣的核苷酸序列编码生物活性肽。
75. 权利要求34的转基因植物材料,其中所述植物材料是不能再生而产生植物的植物 细胞。
76. 权利要求41的方法,其中所述植物材料是不能再生而产生植物的植物细胞。
【文档编号】C07K19/00GK104219950SQ201380018571
【公开日】2014年12月17日 申请日期:2013年2月1日 优先权日:2012年2月1日
【发明者】J·M·里拉, R·M·西奇洛, C·耶基斯, A·E·鲁宾逊 申请人:陶氏益农公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1