用于调节植物中的多肽定位的组合物和方法_2

文档序号:8515767阅读:来源:国知局
DNO: 17的核酸序列或与SEQIDNO: 17具有至少80%-致性 (例如,至少80%-致性、至少90%-致性、至少95%-致性、或至少98%-致性)的核酸 序列。
[0041]无论何种情况,作为本文所述序列的变体的定位信号必须保持作为其来源的参照 序列的至少10%的定位能力,例如该定位信号必须能够以参照定位信号的至少10%的有 效性(例如,至少10%、至少20%、至少30%、至少50%、至少70%、至少80%、至少90%、 至少95%、至少100%的有效性或更高的有效性)引导负荷多肽定位至期望的靶位置,所述 有效性以本文其它部分所述的绝对浓度或相对浓度测定。
[0042]在一些实施方式中,定位信号与参照定位信号序列(例如天然存在的定位信号序 列和/或本文所述的定位信号序列)具有至少70 %-致性。在一些实施方式中,定位信号与 参照定位信号序列(例如天然存在的定位信号序列和/或本文所述的定位信号序列)具有 至少80%-致性。在一些实施方式中,定位信号与参照定位信号序列(例如天然存在的定 位信号序列和/或本文所述的定位信号序列)具有至少90%-致性。定位信号和定位信号 模体的实例在本领域中加入描述,例如在BruceBD,2000,TrendsCellBiol10:440-47; SakamotoW等,2008,TheArabidopsisBook6:ellO;BruceBD,2001BiochimBiophys Acta1541 :2-21;LeeDW等,2008,ThePlantCell20 :1603-22 以及LeeDW等,2008,The PlantCell20 :1603-22加以描述;以引用的方式将各自整体并入本文。
[0043]本文所述的EML标签的至少两个定位信号序列可重叠、邻接(例如不通过外显子 分隔开)和/或通过短的接头或外显子序列分隔开,所述短的接头或外显子序列的长度不 超过300bp,例如300bp以下、250bp以下、200bp以下、150bp以下、120bp以下、IOObp以下、 75bp以下、50bp以下、40bp以下或者30bp以下。在一些实施方式中,短的接头或外显子序 列长度不超过120bp。在一些实施方式中,短的接头或外显子序列长度不超过30bp。在一 些实施方式中,接头或外显子序列可包含甘氨酸和/或丝氨酸残基。在一些实施方式中,接 头或外显子序列可包含至少10%为甘氨酸和/或丝氨酸残基(例如至少10%、至少20%、 至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或更多的甘氨 酸和/或丝氨酸残基)的序列。在一些实施方式中,接头或外显子序列可由甘氨酸和/或 丝氨酸残基组成。如本文所述,包含至少一个外显子的序列还包含至少一个内含子和/或 需要发生至少一次剪接事件从而生成成熟的mRNA。
[0044]当将工程化的多重定位标签可操作地连接至编码负荷多肽的第二核酸序列时,将 引起负荷多肽以可检测的水平在同一细胞中的至少两个亚细胞位置以及任选的细胞质中 积累,所述亚细胞位置例如第一细胞器和第二细胞器。在一些实施方式中,工程化的多重定 位标签将引起负荷多肽以可检测的水平在除细胞质以外的至少两个亚细胞位置中积累,所 述亚细胞位置例如第一细胞器和第二细胞器。在一些实施方式中,工程化的多重定位标签 将引起负荷多肽以可检测的水平在至少三个亚细胞位置以及任选的细胞质中积累,所述亚 细胞位置例如第一细胞器、第二细胞器、第三细胞器。
[0045] 本文所述的工程化的多重定位标签的特定示例性实施方式称为"TriTags",例如 TriTag-1、TriTag-2和TriTag-3,将在本文其它部分描述。
[0046] 本文描述了两大类工程化的多重定位标签。第一类利用可变剪接事件,以从单个 的EML标签核酸序列生成多个肽序列,其中,各剪接变体展示出不同的定位特征。在本文中 该第一类称为"可变剪接EML标签"。第二类EML标签称为"嵌入的EML标签",并且该第二 类EML标签包括多重定位信号序列重叠和/或彼此嵌入的EML标签,从而生成具有多重定 位靶点的单个翻译产物。
[0047]当将供体剪接位点和受体剪接位点之间的RNA转录物或前体mRNA的片段从RNA 分子移除,而将剩余的两个片段连接产生缩短的mRNA转录物以及不会被翻译的切除片段 时,发生转录物的剪接。该过程特别是在真核细胞中广泛使用,以移除内含子并生成编码给 定蛋白的不同异构体的变体。通过使成组的剪接序列或信号(例如供体剪接位点或受体剪 接位点)位于至少一个定位信号序列的侧翼,生成一系列的转录物,所述转录物包含至少 两类:1)包含具有侧翼的定位信号序列的全长转录物;2)包含如下序列的更短的变体,所 述序列通过发生剪接事件而移除了位于侧翼的定位信号序列。剪接可通过酶(例如剪接 体)或其序列自身加以催化。
[0048] 本文使用的"成组的兼容剪接序列"是指包含至少一个受体剪接位点和至少一个 供体剪接位点的一组RNA序列,当作为细胞中的相同RNA分子的一部分加以转录时,能够以 可检测的速率引起间插序列从所述RNA分子中移除。例如,成组的兼容剪接序列可引起一 系列转录物的至少5%、至少10%、至少20%、至少40%、至少60%、至少80%或至少90% 在翻译前移除间插序列。对天然存在的剪接位点/序列进行的重新构建在例如如下文献中 加以描述,以引用的方式将各自整体并入本文:〇rengo等,2006,NucleicAcidsResearch 34 :22 :el48;Younis等,2010Molec.Cell.Biol.,30 (7) :1718-1728 ;以及Syed等,2012, TrendsPlantSci17(10) :6161-23。本领域已知剪接预测软件(例如果蝇剪接预测器、人 类剪接寻迹器、RegRNA、外显子剪接增强子寻迹器、MIT剪接预测器、GeneSplicer、剪接预测 器(DK)、ASPic、SplicePort、NetPlantGeneserver(Hebsgaard等,1996)以及ASSP(Wang 和Marin,2006,Gene366:219-227)。以引用的方式将各自整体并入本文。
[0049] 当可变剪接EML标签包含多组兼容剪接序列时,各组的剪接序列不会与其它组的 成员相互作用,例如,第一组的供体剪接序列和第二组的受体剪接序列并不以显著水平参 与剪接事件(例如少于5%的转录物应经历此类剪接事件)。本文提供了可一起使用的多组 兼容剪接序列的非限定性实例。可通过本领域已知的方法(例如,通过在万维网上免费可 得的剪接预测算法)预测第一组的兼容剪接序列是否与第二组的兼容剪接序列相互作用。 此类算法的非限定性实例可在如下网站中找到:
[0050]http://www.interactive-biosoftware,com/alamut/doc/2.0/splicing,html:
[0051]http://www.wyomingbioinformatics.org/ ~achurban/:P乂及.
[0052]http://www.cbs.dtu.dk/services/NetPGene/〇
[0053] 在一些实施方式中,本文所述的可变剪接EML标签可进一步包含至少一组的兼容 剪接序列,其中,所述组的兼容剪接序列位于至少一个定位信号序列的侧翼,并且至少一个 定位信号序列的侧翼不具有所述组的兼容剪接序列。在一些实施方式中,侧翼不具有成组 的兼容剪接序列的定位信号序列为EML标签的最靠近3'端的定位信号序列。
[0054] 在一些实施方式中,成组的兼容剪接序列可包含多个供体剪接位点和/或受体剪 接位点。在一些实施方式中,多个供体或受体剪接位点可为可变剪接位点,例如,具有一个 供体剪接位点和两个受体剪接位点的组可生成至少两种可变剪接产物。在一些实施方式 中,可变供体或受体剪接位点可具有不同比例的剪接频率,例如可变供体或受体剪接位点 中的一个可为"强的",而其余的可为"弱的"。在一些实施方式中,成对的可变剪接位点包 含弱的剪接位点和强的剪接位点。本文使用的"强的"供体或受体序列为以比起"弱的"序 列的频率更高至少10% (例如至少10%、至少20%、至少30%、至少40%、至少50%、至少 75%、至少100%、至少200%、至少300%、至少500%或更高)的频率参与剪接事件的序 列。在一些实施方式中,其中,成组的兼容剪接序列包含可变剪接序列(例如,可变供体或 可变受体),弱的剪接位点可位于具有侧翼的定位信号的5',强的剪接位点可位于具有侧 翼的定位信号的3'。
[0055] 在一些实施方式中,本文所述的EML标签可进一步包含成组的兼容剪接序列,其 中,所述组包含两个可变剪接供体序列和一个剪接受体序列,其中,两个可变剪接供体序列 位于第一定位信号序列的侧翼。在一些实施方式中,受体剪接位点可位于所述组的两个供 体剪接位点的3'。在一些实施方式中,整组剪接序列可位于第二定位信号的5'。在一些 实施方式中,整组剪接序列可为位于第二定位信号的3'。
[0056] 在一些实施方式中,本文所述的EML标签可进一步包含成组的兼容剪接序列,其 中,所述组包含两个可变受体剪接位点和一个供体剪接位点,其中,所述两个可变受体剪接 位点位于第一定位信号序列的侧翼。在一些实施方式中,供体剪接位点可位于所述组的两 个受体剪接位点的5'。在一些实施方式中,整组的剪接序列可位于第二定位信号的3'。 在一些实施方式中,整组的剪接序列可位于第二定位信号的5'。
[0057] 本文描述了示例性的成组的兼容剪接位点。通过非限定性实例的方式,成组的兼 容剪接位点可包含如下序列:SEQIDN0:8和SEQIDN0:10;SEQIDN0:9和SEQIDN0:10 ; 或者SEQIDN0:8的弱的剪接供体位点、SEQIDN0:9的强的剪接供体位点和SEQIDNO: 10 的剪接受体位点。通过进一步的非限定性实例的方式,第二组的兼容剪接位点可包含如下 序列;SEQIDNO: 11 和SEQIDNO: 13;SEQIDNO: 12 和SEQIDNO: 11 ;或者SEQIDNO: 11 的剪接供体位点、SEQIDNO: 12的弱的剪接受体位点和SEQIDNO: 13的强的剪接受体位 点。图IA-图ID描绘了包含成组的兼容剪接位点的可变剪接EML标签的示例性实施方式, 并描绘了所述成组的剪接序列如何能够相互作用以生成剪接变体。
[0058] 可变剪接EML标签的非限定性实例可包括具有SEQIDNO: 18或SEQIDNO: 19的 核酸序列的标签、或者具有与SEQIDNO: 18或SEQIDNO: 19具有至少80%-致性(例如 80%以上、90%以上、95%以上或98%以上的一致性)的核酸序列的标签。可变剪接EML标 签的进一步的非限定性实例可包括包含SEQIDNO:3、SEQIDN0:4或SEQIDNO:21-SEQID NO:26的任一者的多肽的标签,或者包含与SEQIDNO:3、SEQIDN0:4或SEQIDNO:21-SEQ IDNO:26的任一者具有至少90%-致性的多肽的标签。可变剪接EML标签的进一步的非 限定性实例可包括包含编码SEQIDN0:3、SEQIDN0:4 或SEQIDN0:21-SEQIDN0:26 的多肽的任一者的核酸序列的标签,或者包含编码与SEQIDNO:3、SEQIDNO:4或SEQID N0:21-SEQIDN0:26的任一者具有至少90%-致性的多肽的核酸序列的标签。在一些实 施方式中,可变剪接EML标签可包含如下核酸序列:当在细胞中翻译时,该核酸序列将产生 一系列的不同的多肽,其中,所述系列包含可检测水平的选自于由SEQIDN0:3和SEQID N0:21-SEQIDN0:23所组成的组中的至少两种序列(例如两种、三种或全部)。在一些实 施方式中,可变剪接EML标签可包含如下的核酸序列:当在细胞中翻译时,所述核酸序列将 产生一系列的不同的多肽,其中,所述系列包含可检测水平的选自于由SEQIDN0:4和SEQ IDNO:24-SEQIDNO:26所组成的组中的至少两种序列(例如两种、三种或全部)。无论 何种情况,作为本文所述的序列的变体的EML标签必须保持作为其来源的参照序列的至少 10%的定位能力,例如该EML标签必须能够以参照定位信号的至少10%的有效性(例如, 至少10%、至少20%、至少30%、至少50%、至少70%、至少80%、至少90%、至少95%、至 少100 %的有效性或更高的有效性)引导负荷多肽定位至期望的靶位置,所述有效性以本 文其它部分所述的绝对浓度或相对浓度测定。
[0059] 本文所述的第二类EML标签包含"嵌入的'TML标签。如本发明人在本文中所展示 的,可将第一定位信号序列的一些保守性较小的序列替换为第二定位信号序列,从而将第 二序列嵌入第一序列内。所获得的EML标签可将多肽(该EML标签为该多肽的部分)引导 至两个定位信号序列的靶细胞器。
[0060] 可通过例如对相关定位信号进行比对来识别待替换的第二定位信号序列,从而确 定保守性差的区域。例如,通过比对在相应位置显示出两个相同或相似的氨基酸的地方,该 位点很可能在功能上很重要。相反地,通过比对在相应位置显示出显著不同的残基大小、 电荷、疏水性等的地方,在功能性多肽中该位点很可能能够容忍改变。本领域普通技术人 员易于例如使用比对工具BLASTP程序的默认设置进行此类比对,所述BLASTP程序在万维 网http://blast.ncbi.nlm.nih.gov/上免费可得。另外,可使用BLAST程序(例如,通过 搜索同源序列的免费可得的序列数据库,或通过查询此类数据库的表明同源物的注释(例 如,搜索包含基因名称或描述基因活性的字符串)发现任何给定的多肽或核酸序列的同源 物。此类数据库可在万维网http://ncbi.nlm.nih.gov/上找到。
[0061] 可利用例如SignalP软件识别可允许另一定位信号嵌入的定位信号的保守性差 的区域。例如参见Petersen等,NatureMethods,20118:785;以引用的方式将其整体并入 本文。
[0062] 作为非限定性的实例,CTPb包含来自SEQIDN0:6的第37-46位氨基酸的保守性 差的区域。在一些实施方式中,本文所述的EML标签可包含第一定位信号,所述第一定位信 号替换第二定位信号中的相当于SEQIDN0:6的第37-46位残基的氨基酸。
[0063] 在一些实施方式中,本文所述的嵌入的EML标签可包含具有SEQIDNO: 7序列的 多肽或者与SEQIDN0:7序列具有至少80%-致性(例如至少80%、至少90%、至少95%、 或至少98%以上的一致性)的多肽。在一些实施方式中,本文所述的嵌入的EML标签可包 含编码具有SEQIDN0:7序列的多肽的核酸、或者编码与SEQIDN0:7序列具有至少80% 一致性(例如至少80%、至少90%、至少95%、或至少98%以上的一致性)的多肽的核酸。 在一些实施方式中,本文所述的嵌入的EML标签可包含具有SEQIDNO: 20序列的核酸、或 者与SEQIDN0:20序列具有至少80%-致性(例如至少80%、至少90%、至少95%、或至 少98%以上的一致性)的核酸。无论何种情况,作为本文所述的序列的变体的EML标签必 须保持作为其来源的参照序列的至少10%的定位能力,例如该EML标签必须能够以参照定 位信号的至少10%的有效性(例如至少10%、至少20%、至少30%、至少50%、至少70%、 至少80%、至少90%、至少95%、至少100%的有效性或更高的有效性)引导负荷多肽定位 至期望的靶位置,所述有效性以本文其他部分所述的绝对浓度或相对浓度测定。
[0064] 本文所述的EML标签可包含含有定位信号和/或剪接位点的核酸和/或多肽序 列。本文提供了此类序列的非限定性实例。在一些实施方式中,EML标签可包含本文提供 的序列。在一些实施方式中,EML标签可包含本文提供的序列的功能性变体。在一些实施 方式中,功能性变体可为保守的取代变体。功能性变体将引起向至少两个不同的亚细胞位 置的定位。
[0065] 在一些实施方式中,本文所述的EML标签可适于在植物或植物细胞中表达,例如, 所述EML标签可包含在植物细胞中起作用的定位信号和剪接位点。在一些实施方式中,本 文所述的EML标签在除植物细胞以外的其它细胞(例如酵母或动物细胞)中不起作用。 [0066] 在一个方面,本文描述的是包含本文所述的EML标签的载体。在一个方面,本文描 述的是细胞或生物体,所述细胞或生物体包含本文所述的EML标签或者包含含有本文所述 的EML标签的载体。在一些实施方式中,细胞或生物体可为植物或植物细胞。在一些实施 方式中,细胞或生物体可为光合作用细胞或光合作用生物体。
[0067]在一些实施方式中,载体可进一步包含编码可操作地连接的多肽(即负荷多肽) 的核酸序列或者适用于引入编码可操作地连接的多肽(即负荷多肽)的核酸序列的克隆位 点。在一些实施方式中,EML标签可整体位于编码负荷多肽的核酸序列或克隆位点的一个侧 翼上。在一些实施方式中,EML标签可位于编码负荷多肽的核酸序列或克隆位点的5'位。 在一些实施方式中,EML标签可位于编码负荷多肽的核酸序列或克隆位点的3'。
[0068] 在一些实施方式中,表达载体可包含本文所述的EML标签,例如用于感兴趣的细 胞和/或生物体中的负荷多肽的表达以及翻译后的靶向。本文使用的术语"表达载体"是 指能够向细胞中引入并表达外源核苷酸片段的载体。克隆或表达载体可包含另外的元件, 例如表达载体可具有两种复制体系,从而使该表达载体能够在两种生物体中得以维持,例 如在植物细胞中用于表达并在原核宿主中用于克隆和扩增。还可将术语载体用于描述重组 病毒,例如,经修饰而包含感兴趣基因的编码序列的病毒。本文所使用的载体可为病毒来源 或非病毒来源。下文中将进一步探讨合适的载体。
[0069] 表达载体可包含5'调控序列和/或3'调控序列(例如本文所述的EML标签),所 述调控序列可操作地连接至编码负荷多肽的基因;在本文中将该构建体称为"转基因"。本 文使用的术语"可操作地连接"是指调控元件和第二序列之间的功能性连接,其中,调控元 件影响第二序列的表达和/或加工。一般来说,可操作地连接意味着待连接的核酸序列是 相邻接的,并且对于两个蛋白编码区域的相连而言是必要的、相邻接的且处于同一阅读框 中。转基因以5'至3'的转录方向可包含:转录起始区域和翻译起始区域(S卩,启动子或翻 译起始区域)、编码多肽的核酸序列、以及在充当宿主的生物体内起作用的转录终止区域和 翻译终止区域(即终止区域)。本文所述的EML标签可被包含在起始区域与编码负荷多肽 的核苷酸序列之间、或者被包含在编码负荷多肽的核苷酸序列与终止区域之间。对于宿主 生物体和/或编码负荷多肽的核苷酸序列而言,转录起始区域(即启动子)可为天然的、模 拟的、外来的或异源的。此外,启动子可为与负荷多肽的基因或者合成序列相关联的天然序 列。单个载体可包含多个转基因。另外的转基因可任选进一步包含本文所述的EML标签。
[0070] 表达载体可另外包含可选择的标记基因。表达载体可具有多个限制性位点,所述 限制性位点用于插入在已存在于载体中的调控区域的转录调控之下编码负荷多肽的核苷 酸序列和/或转基因。
[0071] 大多数基因具有已知为启动子的DNA序列的区域,并且所述区域调控基因表达。 启动子区域一般在原核细胞和真核细胞中的编码序列的上游的侧翼DNA序列中发现。启动 子序列提供了对下游基因序列转录的调控,并且一般包含约50至约2, 000个核苷酸碱基 对。启动子序列还可包含调控序列,例如能够影响基因表达水平的增强子序列。一些分离 的启动子序列可提供异源基因(即,与天然基因或同源基因不同的基因)的基因表达。还 已知启动子序列为强的启动子序列、弱的启动子序列或可诱导的启动子序列。强的启动子 提供高水平的基因表达,而弱的启动子提了非常低水平的基因表达。可诱导的启动子为提 供作为对外加试剂、环境刺激物或发育刺激物的应答而开启或关闭基因表达的启动子。启 动子还可提供组织特异性调控或发育调控。分离的启动子序列对于异源基因而言是强的启 动子是有利的,因为强的启动子提供了足够水平的基因表达,以使得易于对转化的细胞进 行检测和选择,并在期望时提供高水平的基因表达。
[0072] 本技术的一些实施方式包含的启动子可提供来自编码EML标签和负荷多肽的核 苷酸序列的可操作地连接的负荷多肽和EML标签的表达。在一些实施方式中,启动子可引 起EML标签和负荷多肽的可检测的水平表达。在一些实施方式中,启动子可引起一定水平 的EML标签和负荷多肽的表达,从而使得能够在亚细胞位置中发现可检测水平的负荷多 肽,所述EML标签被设计为靶向至该亚细胞位置(例如,如果EML标签包含叶绿体和过氧化 物酶体定位信号,则在叶绿体内和过氧化物酶体内)。
[0073]启动子可在例如质粒或植物细胞中起作用。可用于本文所述的表达载体中的 启动子的实例包括但不限于:CaMV35S启动子(Odell等,Nature,313 :810(1985))、 CaMV19S(Lawton等,PlantMol.Biol.,9:31F(1987))、nos(Ebert等,Proc.Nat.Acad Sci. (U.S.A. ),84 :5745 (1987))、Adh(Walker等,Proc.Nat.Acad.Sci. (U.S.A. ),84 : 6624 (1987))、蔗糖合酶(Yang等,Proc.Nat.Acad.Sci. (U.S.A.),87 :4144 (1990))、章鱼碱 (octapine)合酶(OCS)启动子、玄参花叶病毒35S启动子、a-微管蛋白、napin、肌动蛋 白(Wang等,Mol.Cell.Biol.,12 :3399 (1992))、cab(Sullivan等,Mol.Gen.Genet.,215 : 431(1989))、PEPCase启动子(Hudspeth等,PlantMol.Biol.,12 :579(1989))、7S-a伴 大豆球蛋白启动子(Beachy等,EMBOJ,4 :3047(1985))、与R基因复合体相关的启动子 (Chandler等,ThePlantCell,1:1175(1989))、TO99/43838 和美国专利号 6, 072, 050 中 公开的Rsyn7启动子和其它组成型启动子的核心启动子、CaMV35S核心启动子(Odell等 (1985)Nature313 :810-812)、大米肌动蛋白(McElroy等(1990)PlantCell2:163-171)、 泛素(Christensen等(1989)PlantMol.Biol. 12 :619-632 以及Christensen等(1992)PlantMol.Biol. 18 :675-689)、pEMU(Last等(1991)Theor.Appl.Genet. 81:581-588)、 MAS(Velten等(1984)EMB0J. 3:2723-2730)、ALS启动子(美国专利号 5, 659, 026)等。 其它组成型启动子包括例如在美国专利号5, 608, 149、5, 608, 144、5, 604, 121、5, 569, 597、 5, 466, 785、5, 399, 680、5, 268, 463、5, 608, 142 和 6, 177, 611 中讨论的。以引用的方式将前 述参考文献整体并入本文。
[0074] 此外,可将转录增强子或增强子的重复序列用来提高特定启动子的表达。此类增 强子的实例包括但不限于来自CaMV35S启动子和章鱼碱合酶基因的元件(Last等,美国专 利号5, 290, 924)。例如,在考虑之列的是可将根据本发明技术使用的载体构建为包含ocs 增强子元件。该元件最初被识别
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1