来自红冬孢属和红酵母属的多核苷酸序列及其用图

文档序号:9650232阅读:411来源:国知局
来自红冬孢属和红酵母属的多核苷酸序列及其用图
【专利说明】来自红冬孢属和红酵母属的多核苷酸序列及其用途
[0001] 相关申请的交叉引用
[0002] 本申请涉及并要求2013年3月14日提交的美国临时专利申请系列号61/782, 832 的权益。该申请通过引用并入本文。
[0003] 序列提交
[0004] 本申请和电子格式的序列表一起提交。所述序列表名为 2577230PCTSequencListing.txt,创建于2014年2月18日且大小为39kb。该序列表的电 子格式中的信息是本申请的一部分并且通过引用以其整体并入本文。
[0005] 发明背景
[0006] 本发明涉及真菌生物技术的领域,更具体涉及在柄锈菌(Pucciniomycotina)亚 门和黑粉菌(Ustilaginomycotina)亚门物种中的强基因表达系统。
[0007] 本文中用于说明发明背景的出版物和其它材料,以及尤其是针对实施提供额外细 节的例子,通过引用并入,并且出于方便在下文通过作者和日期引用并在所附参考书目中 以作者字母顺序列出。
[0008] 柄锈菌是担子菌(Basidiomycota)门中的真菌亚门(Kirk et al.,2008)。其 包括许多具有重要工业应用的物种。例如,红冬孢属(Rhodosporidium)和锁掷酵母 属(Sporidiobolus)的许多物种,如类酵母红冬抱(Rhodosporidium toruloides)(也 已知为纤细红酵母(Rhodotorula gracilis)、Rhodosporidium glutinis、胶粘红酵 母(Rhodotorula glutinis)、小石川氏圆酵母(Torula koishikawensis)和 Torula rubescens)和赭色掷孢酵母(Sporobolomyces salmonicolor),是能够高密度发酵的富油 单细胞酵母(Hu et al.,2009;Meng et al.,2009)。这些物种具有作为产生长链烃类,例 如三酰基甘油(TAG,或脂肪)、脂肪酸酯(生物柴油)、脂肪族醇类、醇类、内酯类、萜类化合 物和维生素的宿主的极大潜能(Wu et al.,2010a ;Wu et al.,2010b ;Zhao et al.,2010a ; Zhao et al.,2010b)。在另一实例中,黑粉菌亚门中的物种,尤其是黑粉菌属(Ustilago) 和Pseudozyma属,已知产生糖脂类,其可以作为表面活性剂或杀真菌剂(Hewald et al., 2005 ;Teichmann et al. ,2010)〇
[0009] 能够驱动强基因表达(组成型或诱导型)的启动子,对于微生物的生物技术应 用开发是关键的。WO 2012/169969,以其整体通过引用并入本文,描述了若干衍生自选定 的真菌物种的磷酸甘油醛脱氢酶基因(GPDl)、翻译起始因子基因(TEFl)和假定的硬脂 酰-CoA- Δ 9-去饱和酶基因(FADl)的多核苷酸序列,其能够充当柄锈菌亚门和黑粉菌亚门 中基因表达的强启动子。由于重复使用相同或高度同源的启动子存在基因组不稳定性、重 复诱导的点突变(RIP)或RNA沉默导致的染色质表观遗传修饰和遗传修饰的风险(Horns et al,2012),对于罕有经功能验证的启动子的柄锈菌亚门和黑粉菌亚门而言,非常需要扩 大的启动子库。
[0010] 启动子是位于5'区邻接转录起始位点的DNA序列。其包括顺式作用DNA元件的 组合,所述元件与转录因子相互作用激活或抑制RNA聚合酶的转录。至今,已经公布胶粘 红酵母 ATCC 204091 (GenBank Accession :GL989638.1)、类酵母红冬孢 MTCC 457 (GenBank Accession :PRJNA112573)、类酵母红冬孢 NPll (GenBank :ALAUOOOOOOOO. 1)的基因组鸟枪 序列且已经公布禾木科红酵母(Rhodotorula graminis)WPl(http ://genome. jgi-psf. org/Rhobal_l/Rhobal_l. home.html)和红色掷抱酵母(Sporobolomyces roseus) (http : //genome, jgi-psf. org/Sporol/Sporol. home, html)基因组草图序列。类酵母红冬抱 NPll 所释放的RNA-Seq、蛋白组和基因组鸟枪数据(Zhu,Z.,et al,2012)不能明确功能启动子 的序列,因为启动子的活性受若干因素的影响,例如5'和3'末端的定位、转录后沉默、内含 子影响等。启动子在异源宿主物种中的活性更加无法预测。
[0011] 发明概述
[0012] 本发明涉及真菌生物技术的领域,更具体涉及在柄锈菌(Pucciniomycotina)亚 门和黑粉菌(Ustilaginomycotina)亚门物种中的强基因表达系统。
[0013] 在第一方面,本发明提供多核苷酸序列,其作为红冬孢属(Rhodosporidium)、红酵 母属(Rhodotorula)、掷抱酵母属(Sporobolomyces)、Pseudozyma 或黑粉菌属(Ustilago) 中基因表达的强启动子起作用。这些多核苷酸序列在本文中有时称作多核苷酸启动子序 列。在一实施方式中,所述多核苷酸启动子序列包含SEQ ID勵:1、2、3、4、5、6、7、8、9、10、或 11中任一所示的序列。在另一实施方式中,所述多核苷酸启动子序列包含SEQ ID NO :1、2、 3、4、5、6、7、8、9、10、或11中任一所示的启动子序列,即不含克隆位点的序列。所述多核苷 酸启动子序列的每一个含有至少一个GAGGAG序列基序,其功能为在所述真菌物种中增强 基因表达。多核苷酸的每一个有效地在红冬孢属、红酵母属、掷孢酵母属、Pseudozyma或黑 粉菌属中进行强基因表达。此外,这些多核苷酸启动子序列的可操作片段可以使用常规启 动子筛选测定分离以及可以被筛选用于使用本文描述的技术有效地选择经转化的真菌细 胞。在一实施方式中,可操作片段,本文也称作启动子部分,从ATG密码子-1位开始长度为 大约400碱基对至多达大约1100碱基对。如本文所用"多达"指的是所公开的SEQ ID NO 中所示的启动子的启动子部分的长度。因而,如果所公开的SEQ ID NO的启动子少于1100 个核苷酸,那么"多达"指的是启动子序列的最大长度。
[0014] 在第二方面,本发明提供DNA构建体,其包含本文所描述的多核苷酸启动子序列、 可操作地连接的多肽编码序列和可操作地连接的RNA转录终止序列。可以使用本领域技术 人员熟知的任何真核转录终止子。这样的DNA构建体允许多肽在基因组偏向C和G的真菌 物种中的强表达。尤其相关的是选自柄锈菌亚门和黑粉菌亚门的物种。所述尤其相关的物 种是红冬孢属、红酵母属、掷孢酵母属、黑粉菌属或Pseudozyma中的那些,其中存在大量物 种具有将可再生资源生物转化为高价值产品的巨大潜能,所述产品例如,甘油三酯、生物柴 油、脂肪醇、维生素、内酯、萜类化合物和生物表面活性剂。
[0015] 附图简述
[0016] 图1显示启动子的克隆和转化载体。pPN007和pRH2031均是基于pPZP200且含 有Umgpdl : :hpt-3潮霉素选择标记。RtGFP是针对富含GC的基因组优化的密码子优化的 GFP基因。
[0017] 图2显不GAGGAG基序的定位。具有*的垂直线指不有乂方向的GAGGAG基序,其 余的线为反义方向。
[0018] 图3显示由不同长度的ENOl和FDl启动子驱动的RtGFP的相对荧光,所述长度定 义为从假定翻译起始密码子(ATG)第一个核苷酸开始直至5'末端的点的核苷酸数目,不包 括添加的限制性位点。所述启动子在YNB和YNB无氮(N )培养基中显示相似的趋势。35S-Q 是基础启动子,含有花椰菜花叶病毒35S基因启动子从TATA盒开始直至5' UTR的-1位以 及插入至RtGFP直接上游的烟草花叶病毒(TMV)的Ω翻译增强子序列。所有值已经扣除 了非转化菌株(R.toruloides ATCC 10657)的背景荧光。
[0019] 图4A显示了 519bp Rg2EN01启动子序列的细节。箭头指示不同缺失的5'端的位 置。
[0020] 图4B显示每个截短的Rg2EN01启动子的编码和长度。
[0021] 图5A和图5B显示由不同长度的ENOl启动子驱动的RtGFP的相对荧光,所述长度 定义为从假定翻译起始密码子(ATG)第一个核苷酸开始直至5'末端的点的核苷酸数目,不 包括添加的限制性位点。所述启动子在YNB(图5A)和YNB无氮(N )(图5B)培养基中显 示相似的趋势。Rgl Wt指的是R.glutinis ATCC 90781的背景荧光。
[0022] 发明详述
[0023] 除非另外定义,本文所用全部技术和科学术语具有与本发明所属技术领域的普通 技术人员通常所理解的含义相同的含义。
[0024] 术语"可操作地连接(operably linked) "或"可操纵地连接(operatively linked)"本文定义为这样的构型,其中调控序列或控制序列被置于相对于核酸构建体的核 苷酸序列的适当位置,使得所述控制序列指导本发明的多核苷酸的表达。如本领域所熟知, 调控或控制序列可以被置于所述核苷酸序列的5'侧或在所述核苷酸序列的3M则。
[0025] 如本文所用术语"强表达"意指标记蛋白或mRNA的表达达到使用已知的检测方法 (例如,对于GFP的荧光、对于GUS和IacZ基因的活性测定)可检测的水平。
[0026] 本发明涉及真菌生物技术的领域,更具体涉及在柄锈菌(Pucciniomycotina)亚 门和黑粉菌(Ustilaginomycotina)亚门物种中的强基因表达系统。
[0027] 在第一方面,本发明提供多核苷酸序列,其作为红冬孢属、红酵母属、掷孢酵母属、 Pseudozyma或黑粉菌属中基因表达的强启动子起作用。这些多核苷酸序列在本文中有时称 作多核苷酸启动子序列。在一实施方式中,所述多核苷酸启动子序列包含SEQ ID NO :1、2、 3、4、5、6、7、8、9、10、或11中任一所示的序列。在另一实施方式中,所述多核苷酸启动子序 列包含SEQ ID勵:1、2、3、4、5、6、7、8、9、10、或11中任一所示的启动子序列,即不含克隆位 点的序列。所述多核苷酸启动子序列的每一个含有至少一个GAGGAG序列基序,其功能为在 所述真菌物种中增强基因表达。多核苷酸的每一个有效地在红冬孢属、红酵母属、掷孢酵母 属、Pseudozyma或黑粉菌属中进行强基因表达。此外,这些多核苷酸启动子序列的可操作 片段可以使用常规启动子筛选测定分离以及可以被筛选用于使用本文描述的技术有效地 选择经转化的真菌细胞。在一实施方式中,可操作片段,本文也称作启动子部分,从ATG密 码子-1位开始长度为大约400碱基对至多达大约1100碱基对。如本文所用"多达"指的 是所公开的SEQ ID NO中所示的启动子的启动子部分的长度。因而,如果所公开的SEQ ID NO的启动子少于1100个核苷酸,那么"多达"指的是启动子序列的最大长度。
[0028] 在第二方面,本发明提供DNA构建体,其包含本文所描述的多核苷酸启动子序列、 可操作地连接的多肽编码序列和可操作地连接的RNA转录终止序列。可以使用本领域技术 人员熟知的任何真核转录终止子。这样的DNA构建体允许多肽在基因组偏向C和G的真菌 物种中的强表达。尤其相关的是选自柄锈菌亚门和黑粉菌亚门的物种。所述尤其相关的物 种是红冬孢属、红酵母属、掷孢酵母属、黑粉菌属或Pseudozyma中的那些,其中存在大量物 种具有将可再生资源生物转化为高价值产品的巨大潜能,所述产品例如,甘油三酯、生物柴 油、脂肪醇、维生素、内酯、萜类化合物和生物表面活性剂。
[0029] 本领域技术人员熟知的DNA操作技术,核酸杂交,可以用于鉴别其它合适的多核 苷酸。根据本发明,通过在低严格性条件、中严格性条件或高严格性条件下的杂交鉴别与上 面描述的启动子选择性杂交的多核苷酸,可以获得适用的其它启动子。选择性杂交的序列 一般相互之间具有至少50%序列相同性,优选具有至少70%、80%或90%序列相同性,且 最优选具有95%、98%或99%序列相同性。
[0030] 数据库搜索以及基因组和核苷酸数据库的同源性搜索基于核苷酸比对使用算法 或计算机程序鉴别类似的DNA或RNA分子,且这些技术是本领域技术人员熟知的。根据本 发明,适用的其它多核苷酸可以通过计算机模拟鉴别相互之间具有至少50%序列相同性, 优选具有至少70 %、80 %或90 %序列相同性,且最优选具有95 %、98 %或99 %序列相同性 的调控序列的多核苷酸来获得。
[0031] 本发明提供选自SEQ ID NO :1、2、3、4、5、6、7、8、9、10或11的多核苷酸启动子序 列,或其启动子序列,即,不含克隆位点的序列。在一实施方式中,提供了与这些多核苷酸启 动子序列中的任一具有至少60%相同性的多核苷酸启动子序列。在另一实施方式中,提供 了与这些多核苷酸启动子序列中的任一具有至少 70%相同性的多核苷酸启动子序列。在另 一实施方式中,提供了与这些多核苷酸启动子序列中的任一具有至少80%相同性的多核苷 酸启动子序列。在另一实施方式中,提供了与这些多核苷酸启动子序列中的任一具有至少 90%相同性的多核苷酸启动子序列。在另一实施方式中,提供了与这些多核苷酸启动子序 列中的任一具有至少95%相同性的多核苷酸启动子序列。在另一实施方式中,提供了与这 些多核苷酸启动子序列中的任一具有至少98%相同性的多核苷酸启动子序列。在一实施方 式中,本文的启动子序列,从ATG密码子-1位开始长度为大约400碱基对至多达大约1100 碱基对。如本文所用"多达"指的是所公开的SEQ ID NO中所示的启动子的启动子部分的 长度。因而,如果所公开的SEQ ID NO的启动子少于1100个核苷酸,那么"多达"指的是启 动子序列的最大长度。
[0032] 本发明提供了多核苷酸构建体,其包含本文所述的分离的启动子,例如选自SEQ ID NO :1、2、3、4、5、6、7、8、9、10或11之一或其启动子部分,所述分离的启动子可操作地与 多肽编码序列连接,所述多肽编码序列可操作地与转录终止子连接。在一实施方式中,可操 作片段,本文也称作启动子部分,从ATG密码子-1位开始长度为大约400碱基对至多达大 约1100碱基对。如本文所用"多达"指的是所公开的SEQ ID NO中所示的启动子的启动子 部分的长度。因而,如果所公开的SEQ ID NO的启动子少于1100个核苷酸,那么"多达"指 的是如果启动子序列的最大长度。在一实施方式中,所述多核苷酸构建体使得多肽能够在 选自
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1