用于调节植物中的多肽定位的组合物和方法

文档序号:8515767阅读:365来源:国知局
用于调节植物中的多肽定位的组合物和方法
【专利说明】
[0001] 相关申请的交叉引用
[0002] 根据35U.S.C. § 119(e),本申请要求2012年10月2日提交的美国临时申请号 61/708, 909的权益,以引用的方式将其内容整体并入本文。
[0003] 序列表
[0004] 本申请包含通过EFS-Web以ASCII格式提交的序列表,并由此以引用的方式将其 内容整体并入本文。所述ASCII副本在2013年9月4日创建,命名为002806-075472-PCT_ SL.txt,大小为555, 556字节。
[0005] 政府支持
[0006] 本发明是利用美国能源部高级研宄项目局根据合作协议DE-000079授予的联邦 基金做出的。美国政府对本发明享有一定的权利。
技术领域
[0007] 本文所述的技术涉及用于调节植物细胞中的多肽定位的方法和组合物。
【背景技术】
[0008] 在工程化的细胞和/或生物体中,期望将特别的多肽靶向至特定的亚细胞位置。 当前的技术允许通过在N端或C端添加单一的定位信号,将多肽引导至一个特定的位置。[0009] 然而,具有重新构建的生物合成和/或代谢通路的细胞和/或生物体的设计通常 需要多肽存在于多个亚细胞位置。例如,当创造具有重新构建的光呼吸通路的植物时,植 物最好具有聚集于叶绿体和过氧化物酶体中的一些多肽(Kebeish,R.等,(2007),Nature Biotechnology25,593-9 ;Maier,A?等,(2012)FrontiersinPlantScience3,38)。将 蛋白靶向至多于一个位置的一种方式涉及使用相关转基因(transgene)的多个拷贝,各拷 贝具有不同的定位信号。利用该方式需要多次转化事件,该方式费时导致细胞具有多个插 入事件。这使得确保各拷贝以期望的方式运行更加困难(Que,Q.等,(2010),GMcrops1, 220-9 ;Dafny-Yelin,M?和Tzfira,T. (2007),PlantPhysiology145,1118-28)〇
[0010] 虽然在一些情况下,可通过向多肽的第二末端添加第二定位信号来将该多肽引 导至两个亚细胞位置(Hyunjong,B?等,(2006),JournalofExperimentalBotany57, 161-9),该方式受限于从可用且兼容的N端和C端延伸区(extension)制得的可能组合。此 外,当将定位信号添加在两个末端时,并非全部的多肽均能保持其活性,例如,如果将序列 附加于一些末端,一些多肽将丧失活性。

【发明内容】

[0011] 本文描述的是涉及如下定位信号的组合物和方法,所述定位信号使用位于多肽的 单一末端的标签而使得能够将所述多肽引导至至少两个(例如两个、三个、四个或更多)亚 细胞位置。本文所述的技术降低了将多肽靶向至细胞和/或生物体中的多个位置所需的克 隆量以及DNA构建体的大小。
[0012] 在一个方面,本文描述的是工程化的多重定位标签,所述标签包含编码至少两种 定位信号序列的核酸序列,其中,各定位信号序列将引导由可操作地连接的序列(operablylinkedsequence)编码的多肽定位至不同组的亚细胞区室。在一些实施方式中,定位信号 序列未被外显子分隔开。在一些实施方式中,定位信号序列被具有不超过300个碱基的外 显子分隔开。在一些实施方式中,外显子可包含甘氨酸残基和丝氨酸残基。
[0013] 在一些实施方式中,标签可进一步包含成组的兼容剪接序列;其中,所述组包含两 个可变剪接供体序列和一个剪接受体序列;其中,所述两个可变剪接供体序列位于一个定 位信号序列的侧翼;并且剪接受体序列位于所述组的两个剪接供体序列的3'。在一些实 施方式中,成组的剪接序列可位于第二定位信号的5'。在一些实施方式中,成组的剪接序 列可位于第二定位信号的3'。
[0014] 在一些实施方式中,标签可进一步包含成组的兼容剪接序列;其中,所述组包含两 个可变剪接受体序列和一个剪接供体序列;其中,所述两个可变剪接受体序列位于定位信 号序列侧翼;并且所述剪接供体序列位于所述组的两个剪接受体序列的5'。在一些实施 方式中,成组的剪接序列可位于第二定位信号的3'。在一些实施方式中,成组的剪接序列 可位于第二定位序列信号的5'。
[0015] 在一些实施方式中,成对的可变剪接位点可包含弱的剪接位点和强的剪接位点。 在一些实施方式中,弱的剪接位点可位于具有侧翼的定位信号的5',并且强的剪接位点可 位于具有侧翼的定位信号的3'。在一些实施方式中,成组的兼容剪接位点可包含SEQID N0:8的弱的剪接供体位点、SEQIDN0:9的强的剪接供体位点和SEQIDNO: 10的剪接受体 位点。在一些实施方式中,成组的兼容剪接位点可包含SEQIDNO: 11的剪接供体位点、SEQ IDNO: 12的弱的剪接受体位点和SEQIDNO: 13的强的剪接受体位点。
[0016] 在一些实施方式中,各定位信号选自于由如下定位信号所组成的组:叶绿体定位 信号、过氧化物酶体定位信号、线粒体定位信号、分泌通路定位信号、内质网定位信号以及 液泡分泌定位信号。在一些实施方式中,叶绿体定位信号可包含编码CTPa(SEQIDNO: 1) 或与CTPa具有至少90%-致性的多肽的核酸序列。在一些实施方式中,叶绿体定位信号可 包含SEQIDNO: 14的核酸序列或与SEQIDNO: 14具有至少90%-致性的序列。在一些 实施方式中,叶绿体定位信号可包含编码CTPb(SEQIDNO: 6)或与CTPb具有至少90% - 致性的多肽的核酸序列。在一些实施方式中,叶绿体定位信号可包含SEQIDNO: 15的核酸 序列或与SEQIDNO: 15具有至少90%-致性的序列。在一些实施方式中,过氧化物酶体 定位信号可包含编码PTS2(SEQIDN0:2)或与PTS2具有至少90% -致性的多肽的核酸序 列。在一些实施方式中,过氧化物酶体定位信号可包含SEQIDN0:16的核酸序列或与SEQ IDNO: 16具有至少90%-致性的序列。在一些实施方式中,过氧化物酶体定位信号可包含 SEQIDN0:5。在一些实施方式中,过氧化物酶体定位信号可包含SEQIDN0:17的核酸序 列或与SEQIDNO: 17具有至少90% -致性的序列。
[0017] 在一些实施方式中,标签可包含编码如下多肽的核酸序列:SEQIDN0:3和SEQID NO: 21-SEQIDNO: 23 的任一者的多肽或者与SEQIDNO: 3 和SEQIDNO: 21-SEQIDNO: 23 的任一者具有至少90%-致性的多肽。在一些实施方式中,标签可包含SEQIDNO: 18的核 酸序列或与SEQIDNO: 18具有至少90% -致性的序列。
[0018] 在一些实施方式中,标签可包含SEQIDNO:4和SEQIDNO: 24-SEQIDNO: 26的任 一者的序列或者与SEQIDN0:4和SEQIDN0:24-SEQIDN0:26的任一者具有至少90% - 致性的序列。在一些实施方式中,标签可包含SEQIDNO: 19的核酸序列或与SEQIDNO: 19 具有至少90% -致性的序列。
[0019] 在一些实施方式中,第一定位信号包含于第二定位信号内。在一些实施方式中,第 一定位信号取代了相当于SEQIDN0:6的第37-46位残基的氨基酸。在一些实施方式中, 标签可包含SEQIDN0:7的序列或与SEQIDN0:7具有至少90%-致性的序列。在一些实 施方式中,标签可包含SEQIDN0:20的核酸序列或与SEQIDN0:20具有至少90%-致性 的序列。
[0020] 在一个方面,本文描述的是包含本文所述的工程化的多重定位标签的载体。在一 些实施方式中,工程化的多重定位标签整体可位于编码肽的可操作地连接的序列或克隆位 点的一个侧翼。在一些实施方式中,工程化的多重定位标签可位于编码多肽的可操作地连 接的序列的5'。
[0021] 在一个方面,本文描述的是包含本文所述的工程化的多重定位标签的工程化的细 胞或生物体或者包含本文所述的工程化的多重定位标签的载体。在一个方面,本文描述的 是如下核酸分子,所述核酸分子具有如下序列或者具有编码如下序列多肽的序列:SEQID N0:28-SEQIDN0:87 的任一者、或者与SEQIDN0:28-SEQIDN0:87 的任一者具有至少 90%-致性的序列。在一个方面,本文描述的是载体,所述载体包含具有如下序列或者具有 编码如下序列多肽的序列的核酸分子:SEQIDN0:28-SEQIDN0:87任一者、或者与SEQID N0:28-SEQIDN0:87的任一者具有至少90%-致性的序列。在一个方面,本文描述的是工 程化的细胞或生物体,所述细胞或生物体包含:(a)具有如下序列或者具有编码如下序列 多肽的序列的核酸分子:SEQIDN0:28-SEQIDN0:87的任一者、或者与SEQIDN0:28-SEQ IDN0:87的任一者具有至少90% -致性的序列;或者(b)载体,所述载体包含具有如下序 列或者具有编码如下序列多肽的序列的核酸分子:SEQIDN0:28-SEQIDN0:87的任一者、 或者与SEQIDN0:28-SEQIDN0:87的任一者具有至少90% -致性的序列。
【附图说明】
[0022] 图IA-图ID描绘了可变剪接元件TriTag-I和TriTag-2的设计。图IA和图IB描 绘了TriTag-I(图1A)和TriTag-2(图1B)的示意性的剪接简图,示出非靶向序列(阴影)、 叶绿体靶向序列(Chl)、过氧化物酶体靶向序列(Per)和用于瞬时表达实验的增强的GFP编 码序列(eGFP)。图IC和图ID描绘了TriTag-l(SEQIDNO:IlO(DNA)和SEQIDNO: 111 (蛋 白);图1<:)和1'1^丁&8-2(5£〇10勵:112(0嫩)和5£〇10勵:113(蛋白) ;图10)序列的 设计。末端的ATG密码子对应于GFP开放读码框的第一残基。可变剪接靶向区域以下划线 标示。供体和受体二聚体以下划线标示。以实线无阴影框示出的DNA序列来源于PIMT2的 5'编码区(Dinkins等,2008),并包含编码叶绿体靶向序列的序列(氨基酸以实线白框示 出)。以虚线白框示出的DNA序列衍生自TTL的5'编码区(Reumann等,2007),并包含编 码过氧化物酶体靶向序列的序列(氨基酸以虚线白框示出)。
[0023] 图2A-图2D描绘了叶绿体转运肽(CTPb)与嵌入过氧化物酶体靶向信号(PTS2)的 元件TriTag-3的比较。图2A-图2B描绘了CTPb(图2A)和TriTag-3(图2B)的简图,示出 叶绿体靶向序列(Chl)、过氧化物酶体靶向序列(Per)、柔性区域(阴影区域)和用于瞬时 表达实验中的增强的GFP编码区(eGFP)。图2C-图2D描绘了CTPb(SEQIDNO: 114 (DNA)和5£0 10勵:115(蛋白);图2〇和1^丁3§-3(5£0 10勵:116(0嫩)和5£0 10勵:117(蛋 白);图2D)的序列。末端的ATG密码子对应于GFP开放读码框的第一残基。以实线白框示 出的DNA序列来源于rbcSl的Y编码区(Kebeish等,2007),并编码叶绿体靶向序列(实 线白框)。以虚线白框示出的DNA序列(图2D)编码PTS2-致性信号(虚线白框)。PTS2 序列嵌入于CTPb的柔性区域(阴影区域)内。
[0024] 图3描绘了代表性的烟叶表皮细胞的区室的示意图和表格。表明了通过共聚焦显 微镜观察到的相对表达水平以及细胞内的相对大小和定位。
[0025] 图4描绘了植物细胞区室的示意性显像,以及用于在C3植物中增强碳固定并减少 来自光呼吸的碳损失的3-H0P工程化方式的推荐的作用。粗箭头表示通过异源酶催化的反 应,虚线箭头表示天然存在的反应。GOX为乙醇酸氧化酶。
[0026] 图5描绘了在叶绿体、过氧化物酶体和细胞质内表达大肠杆菌(E.coli)乙醇酸脱 氢酶使得还原当量(reducingequivalents)的生产增加,并使得绕过对过氧化物酶体而言 天然的产生过氧化物的氧化反应的示意图。粗箭头表示通过异源酶催化的反应,虚线箭头 表示天然存在的反应。乙醛酸向P-甘油酸的天然转化已在文献(Kebeish等,2007)中观察 到。
[0027] 图6描绘了表明通过同源重组将"负载区(payload)"整合入质体基因组中的 示意图。注意到,转化体将保留其原始的左臂和右臂序列,或将所述左臂和右臂序列替 换为载体的左臂和右臂序列(只要是后一种转化体能存活)。该图重新绘制自Day和 Goldschmidt-Clermont2011〇
[0028]图7描绘了pMV02质体基因组整合载体的示意性载体图谱,所述图谱具有如同 Zarzycki等,2008,PNAS中的对反应的注释:2,丙二酰-CoA还原酶;3,丙酰-CoA合酶; 10,(S)-苹果酰-CoA/0-甲基苹果酰-CoAAS)-柠苹酰-CoA裂解酶;11,中康酰-Cl-CoA 水合酶(mesaconyl-Cl-CoAhydratase) ( 0 -甲基苹果酰-CoA脱水酶);12,中康酰-CoA Cl:C4C〇A转移酶;13,中康酰-C4-C〇A水合酶;glcDEF,大肠杆菌(E.coli)乙醇酸脱氢酶; neo,新霉素磷酸转移酶II;psbA-TT,光合体系II终止子;trnl/trnA,tRNA-异亮氨酸/ tRNA-丙氨酸;AmpR,|3 -内酰胺酶;ori,pMBl复制起点。
[0029] 图8描绘了TriTag-I的示意图。剪接变体0y-x?表达具有CTP(叶绿体转 运肽)的感兴趣的融合蛋白,所述CTP将所述感兴趣的融合蛋白引导至叶绿体。剪接变体 aY-X步表达具有PTS2的感兴趣的融合蛋白,所述PTS2将所述感兴趣的融合蛋白引导 至过氧化物酶体。剪接变体ay-x?表达无转运肽的感兴趣的融合蛋白,所述融合蛋白 定位于细胞质中。剪接变体0y-xit表达具有CTP和PTS2(即,二义性信号(ambiguous signal))的感兴趣的融合蛋白。
[0030] 图9描绘了处于框图形式的TriTag-2的示意图,TriTag-2由模块2以及其后的 模块1组成。该组合提供了功能性剪接变体,所述剪接变体表达具有PTS2和/或CTP和/ 或无限定的靶向信号(细胞质定位)的转运肽。剪接变体ay-xit表达具有CTP的感兴 趣的融合蛋白,所述CTP将所述感兴趣的融合蛋白引导至叶绿体。剪接变体0Y-x?表 达具有PTS2的感兴趣的融合蛋白,所述PTS2将所述感兴趣的融合蛋白引导至过氧化物酶 体。剪接变体ay-x?表达无转运肽的感兴趣的融合蛋白,所述融合蛋白定位于细胞质 中。剪接变体eY-x 表达具有CTP和PTS2 (即,二义性信号)的感兴趣的融合蛋白。
[0031] 图10描绘了TriTag-3的示意图。展示了PTS2信号叠加于马铃薯(Solanum tuberosum)rbcSl叶绿体肽上。由于预期在叶绿体摄取过程中,比起更邻近于N端的区域, 更邻近于CTP肽的C端的区域发挥更少的作用,将保守的PTS2氨基酸序列放置在更邻近于 CTP肽的C端。
[0032] 图11描绘了Tic-Toc叶绿体蛋白摄取机制的不意图。尚蛋白表达水平和对于蛋白 输入而言的ATP的有限的可用性可导致平衡式(1)处的瓶颈,引起前体蛋白的驻留,在本文 所述的GFP融合体的情况下,荧光示出细胞质GFP(图片JarvisP2008NewPhytol179: 257) 〇
[0033] 图12描绘了载体图谱,所述载体图谱示出了所构建的质粒,所述质粒用于通过根 癌农杆菌(agrobacteriumtumeficiens)(蘸花法)将大肠杆菌⑶H亚基递送至拟南芥 (Arabidopsisthaliana)的基因组中。核支架,使沉默的可能性最小化的RB7核苷酸区域 (Halweg、Thompson和Spiker,2005);CaMV35S-P,如Horstmann等,2004 所述的花挪菜花 叶病毒25S"长"启动子;5'UTR,来自烟草蚀纹病毒的5'非翻译区;靶向肽,rbcSl叶绿 体转运肽、TriTag-I、TriTag-2或TriTag-3 ;终止子,胭脂氨酸合酶终止子(NOS) ;PAT,草丁 膦乙酰转移酶,草按膦(FinaleHerbicide)抗性标记;KanR,新霉素磷酸转移酶II;ori,大 肠杆菌和根癌农杆菌的复制起点;glcD/glcE/glcF,优化用于拟南芥基因组表达的大肠杆 菌⑶H亚基密码子。
[0034] 图13A-图13B展示了本文所述的工程化的多重定位标签的一些实施方式。图13A 描述了介导感兴趣的蛋白定位至多个区室的DNA构建体的实施方式的一般结构的示意图, 所述结构包含编码可将蛋白定位至细胞核、细胞质、内质网、质体、过氧化物酶体、线粒体和 /或其它细胞区室的定位序列的DNA元件。示出了三个标签,但可根据用户的需求使用更 多或更少的标签。将可变剪接用于生成针对感兴趣的ORF编码一个或多个N端定位序列的 mRNA,从而编码感兴趣的蛋白。任选使用包含供体和受体位点以及少量的氨基酸(通常少 于50个氨基酸)的短序列,以允许mRNA有效剪接。图13B描绘了由图13A中描绘的DNA 构建体生成的代表性的可能的经剪接的mRNAs。
【具体实施方式】
[0035] 本文描述的是将多肽引导至特定的亚细胞位置的方法和组合物。如本文所述,本 发明人发现了对单个转基因进行工程化的方法,所述单个转基因翻译为靶向至多个亚细胞 位置(例如细胞器和/或细胞质)的一种或多种多肽异构体,此前上述事件通过利用多个 转基因(各转基因具有靶向至单一亚细胞位置的独特的序列)来实现。
[0036] 在一个方面,本文描述的是工程化的多重定位标签。本文使用的术语"工程化的 多重定位标签"或"EML标签"是指包含至少两个定位信号序列(例如2个定位信号序列、 3个定位信号序列、4个定位信号序列或更多个定位信号序列)的核酸序列。在一些实施方 式中,术语"EML标签"还可指由EML标签核酸序列编码的一种或多种多肽异构体。在EML 标签中,至少两个定位信号序列各自可独立地引导可操作地连接的多肽(本文称为"负荷 多肽")定位至不同组的亚细胞位置。所述组的亚细胞位置可重叠,但并不完全一致。负荷 多肽可为任何多肽,例如酶、支架蛋白、对该多肽所存在的细胞而言为天然的并可操作地连 接至EML标签的多肽、和/或对该多肽所存在的细胞而言为异源性的并可操作地连接至EML标签的多肽。
[0037] 本文使用的"定位信号序列"是指如下核酸序列(或该核酸序列编码的肽),当翻 译为包含负荷多肽的较大的多肽的一部分时,该核酸序列将负荷多肽定位至特定的亚细胞 位置,通常为特定的细胞器和/或质膜。如果与无可操作地连接的信号或标签进行的转录 相比,与可操作地连接的信号或标签一起转录时,聚集于亚细胞位置的负荷多肽的浓度提 高至少10% (例如与无可操作地连接的信号或标签进行的转录相比提高至少10%、至少 20 %、至少30 %、至少50 %、至少75 %、至少100 %、至少200 %或至少500 %或更高),则如 本文所使用的负荷多肽通过定位信号和/或EML标签"定位"至特定的亚细胞位置。所述浓 度可为绝对浓度,例如,在例如叶绿体中发现Ug/mL的多肽;或者为相对浓度,例如相对于 细胞的其余部分,在叶绿体中发现%的多肽。本文使用的"亚细胞区室"或"亚细胞位置"是 指细胞内离散的位置。非限定性实例可包括细胞器、叶绿体、线粒体、内体、过氧化物酶体、 核、ER、高尔基体、溶酶体和质膜(包括细胞器和细胞膜)。
[0038] 本领域已知将其负荷多肽运输至特定的亚细胞位置的定位信号(例如运输至核、 ER、高尔基体、内体、溶酶体、过氧化物酶体、叶绿体、线粒体和/或质膜的信号)。本领域 已知定位信号的实例,例如在万维网http://proline.bic.nus.edu.sg/spdb/index.html 免费可得的SPdb(信号肽数据库)(Choo等,BMCBioinformatics2005 ;6:249,以引用的 方式将其整体并入本文)。本领域已知用于预测定位信号的生物信息学工具(参见例如 Alexandersson等,FrontiersinPlantSci2013,4:9,以引用的方式将其整体并入本 文),例如SignalP(例如在Petersen等,NatureMethods20118:785中所述,以引用的方式 将其整体并入本文)。在一些实施方式中,定位信号可选自于由叶绿体定位信号和过氧化物 酶体定位信号所组成的组。在一些实施方式中,定位信号可选自于由如下定位信号所组成 的组:叶绿体定位信号(例如SEQIDNO: 1或SEQIDN0:6)、过氧化物酶体定位信号(例如 seqidno:2)、线粒体定位信号(例如h2n-mlslrqsirffkpatrtlcssryll,seqidno: 106)、 网驻留定位信号(例如h2n-mtgasrrsargri,seqidno: 108)以及液泡分泌定位信号(例 IDN0:109)。定位信号的其它实 例为本领域已知,并可使用例如SignalP来预测(参见例如Petersen等,NatureMethods 20118:785,以引用的方式将其整体并入本文)。
[0039] 在一些实施方式中,叶绿体定位信号可包含编码CTPa的核酸序列(例如,编码SEQ IDNO: 1的核酸序列)或者编码如下多肽的核酸序列,所述多肽促进或介导叶绿体定位并 与CTPa具有至少80 % -致性(例如至少80 % -致性、至少90 % -致性、至少95 % -致性或 至少98%-致性)。在一些实施方式中,叶绿体定位信号可包含SEQIDNO: 14的核酸序列 或与SEQIDNO: 14序列具有至少80%-致性(例如,至少80%-致性、至少90% -致性、 至少95%-致性、或至少98%-致性)的核酸序列。在一些实施方式中,叶绿体定位信号 可包含编码CTPb的核酸序列(例如,编码SEQIDNO:6的核酸序列)或者编码与CTPb具 有至少80 %-致性(例如至少80 %-致性、至少90 %-致性、至少95 %-致性或至少98% 一致性)的多肽的核酸序列。在一些实施方式中,叶绿体定位信号可包含SEQIDNO: 15的 核酸序列或与SEQIDNO: 15序列具有至少80%-致性(例如至少80%-致性、至少90% 一致性、至少95 %-致性、或至少98 %-致性)的核酸序列。
[0040]在一些实施方式中,过氧化物酶体定位信号可包含编码PTS2的核酸序列(例如, 编码SEQIDN0:2的核酸序列)或者编码与PTS2具有至少80%-致性(例如,至少80% - 致性、至少90%-致性、至少95%-致性或至少98%-致性)的多肽的核酸序列。在一些 实施方式中,过氧化物酶体定位信号可包含SEQIDNO: 16的核酸序列或者与SEQIDNO: 16 序列具有至少80%-致性(例如,至少80%-致性、至少90%-致性、至少95% -致性、 或至少98%-致性)的核酸序列。在一些实施方式中,过氧化物酶体定位信号可包含编码 SEQIDNO:5的多肽的核酸序列或者编码与SEQIDNO:5具有至少80%-致性(例如,至 少80%-致性、至少90%-致性、至少95%-致性、或至少98%-致性)的多肽的核酸序 列。在一些实施方式中,过氧化物酶体定位信号可包含编码SEQIDN0:27的多肽的核酸序 列或者编码与SEQIDN0:27具有至少80%-致性(例如,至少80%-致性、至少90%-致 性、至少95%-致性、或至少98%-致性)的多肽的核酸序列。在一些实施方式中,过氧化 物酶体定位信号可包含SEQI
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1