基因表达或活性增强性元件的制作方法_2

文档序号:9756469阅读:来源:国知局
子与启动子3'末端紧密 邻接存在,或优选地与启动子3'末端相隔最多56个核巧酸、甚至更优选地相隔最多39个核 巧酸和甚至更优选地相隔最多17个核巧酸。17个核巧酸长度的优选间隔序列在SEQ ID NO. 140中给出。
[0067] 本发明的启动子优选地是最小启动子,并且因此优选地仅由为实现祀基因表达所 需要的最小长度和核巧酸序列组成,其中所述祀基因与所述启动子和增强子或非翻译区功 能性连接。W运种方式,因本发明增强子的短长度所致的上述优点保留。特别地,最小启动 子和本发明增强子的组合允许提供并不远长于祀基因的如下文描述的表达盒。因此,最小 启动子和本发明增强子的组合还允许在载体中克隆长核巧酸序列和使用在尺寸上受限制 的转化手段。当试图在植物中建立需要引入多个基因的新代谢途径时,运特别重要。运类途 径例如在W0 2005083093、W0 2007017419、W0 2007042510和W0 2007096387中描述。
[0068] 启动子也可W在W下意义上是最小的,即它仅由特定环境下作为启动子发挥作用 所要求的最小长度核巧酸序列组成,例如驱动与所述启动子功能性连接的基因仅在特定植 物组织、发育阶段或在特定环境条件下如热胁迫或受病原体感染时表达。根据本发明,启动 子还可W比最小启动子更长或包含较其更多的影响转录的元件(例如转录因子结合位点)。 合适的启动子例如在W0 2002102970、W0 2009077478、W0 2010000708和W0 2012077020中 描述,所述文献的内容通过引用的方式并入本文。
[0069] 优选的启动子包含TATA框,所述TATA框优选地包含SEQ ID NO. 108、更优选地包含 与SEQ ID NO. 107具有至少89%同一性的序列并包含SEQ ID NO. 108,并且更优选地包含 SEQ ID NO. 107。运种TATA框促进转录开始,尤其在植物细胞中如此。由于TATA框至少包含 植物TATA框的核屯、基序SEQ ID NO. 108,所W至少可W在植物中实现启动子的最小活性。如 果该启动子不包含确切序列SEQ ID NO. 107,则该启动子优选地至少包含与之相似的序列。 运种相似的序列含有确切序列SEQ ID NO. 108并且与SEQ ID NO. 107具有最小89%的同一 性并且因此优选地与SEQ ID NO. 107的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 107的序列最多1个核巧酸不同。
[0070] 优选的启动子包含CPRF因子结合位点,所述CPRF因子结合位点优选地包含SEQ ID NO. 114、更优选地包含与SEQ ID NO. 113具有至少90%同一性的序列并包含SEQ ID NO. 114,并且更优选地包含SEQ ID NO. 113。在运类启动子不包含确切序列SEQ ID NO. 113 的情况下,它包含与SEQ ID NO. 113最多1个核巧酸的序列不同并且含有确切序列SEQ ID NO.114。
[0071] 优选的启动子包含TCP I类转录因子结合位点,所述TCP I类转录因子结合位点优 选地包含SEQ ID NO. 116、更优选地包含与SEQ ID NO. 115具有至少90%同一性的序列并包 含SEQ ID NO. 116,并且更优选地包含SEQ ID NO. 115。在运类启动子不包含确切序列SEQ ID NO. 115的情况下,它包含与SEQ ID NO. 115最多1个核巧酸的序列不同并且含有确切序 列沈Q ID NO. 116。
[0072] 优选的启动子包含bZIP蛋白G框结合因子1结合位点,所述bZIP蛋白G框结合因子1 结合位点优选地包含SEQ ID NO. 118、更优选地包含与SEQ ID NO. 117具有至少85%同一性 的序列并包含SEQ ID NO. 118,并且更优选地包含SEQ ID NO. 117。如果该启动子不包含确 切序列SEQ ID NO. 117,则该启动子优选地至少包含与之相似的序列。运种相似的序列含有 确切序列SEQ ID NO. 118并且与SEQ ID NO. 117具有最小85%的同一性并且因此优选地与 SEQ ID NO. 117的序列最多3个核巧酸不同,更优选地与SEQ ID NO. 117的序列最多2个核巧 酸不同,并且甚至更优选地与SEQ ID NO. 117的序列最多1个核巧酸不同。
[0073] 优选的启动子包含Ry基序,所述Ry基序优选地包含SEQ ID NO. 110、更优选地包含 与SEQ ID NO. 109具有至少88%同一性的序列并包含SEQ ID NO. 110,并且更优选地包含 SEQ ID NO. 109。在运种启动子不包含确切序列SEQ ID NO. 109的情况下,它含有确切序列 SEQ ID NO. 110并且与SEQ ID NO. 109具有最小88%的同一性并且因此优选地与SEQ ID NO. 109的序列最多3个核巧酸不同,更优选地与SEQ ID NO. 109的序列最多2个核巧酸不同, 并且甚至更优选地与SEQ ID NO. 109的序列最多1个核巧酸不同。
[0074] 优选的启动子包含谷醇溶蛋白框,所述谷醇溶蛋白框优选地包含SEQ ID NO. 112、 更优选地包含与SEQ ID NO. Ill具有至少90%同一性的序列并包含SEQ ID NO. 112,并且更 优选地包含SEQ ID NO. Ill。在运种启动子不包含确切序列SEQ ID NO. Ill的情况下,它含 有确切序列SEQ ID NO. 112并且与SEQ ID NO. Ill具有最小90%的同一性并且因此优选地 与SEQ ID NO. 111的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 111的序列 最多1个核巧酸不同。
[0075] 优选的启动子包含如赋予光诱导性的GAPDH启动子中的顺式元件,所述顺式元件 优选地包含SEQ ID NO. 120、更优选地包含与SEQ ID NO. 119具有至少90%同一性的序列并 包含SEQ ID NO. 120,并且更优选地包含SEQ ID NO. 119。在运种启动子不包含确切序列SEQ ID NO. 119的情况下,它含有确切序列沈Q ID NO. 120并且与沈Q ID NO. 119具有最小90% 的同一性并且因此优选地与SEQ ID NO. 119的序列最多2个核巧酸不同,并且甚至更优选地 与SEQ ID NO. 119的序列最多1个核巧酸不同。
[0076] 优选的启动子包含SBF-1结合位点,所述SBF-1结合位点优选地包含SEQ ID NO. 122、更优选地包含与SEQ ID NO. 121具有至少90%同一性的序列并包含SEQ ID NO. 122,并且更优选地包含SEQ ID NO. 121。在运种启动子不包含确切序列SEQ ID NO. 121 的情况下,它含有确切序列SEQ ID NO. 122并且与SEQ ID NO. 121具有最小90%的同一性并 且因此优选地与SEQ ID NO. 121的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 121的序列最多1个核巧酸不同。
[OOW]优选的启动子包含向日葵同源域亮氨酸拉链蛋白化化-4结合位点,所述结合位点 优选地包含SEQ ID NO. 124、更优选地包含与SEQ ID NO. 123具有至少80%同一性的序列并 包含SEQ ID NO. 124,并且更优选地包含SEQ ID NO. 123。在运种启动子不包含确切序列SEQ ID NO. 123的情况下,它含有确切序列沈Q ID NO. 124并且与沈Q ID NO. 123具有最小80% 的同一性并且因此优选地与SEQ ID NO. 123的序列最多2个核巧酸不同,并且甚至更优选地 与SEQ ID NO. 123的序列最多1个核巧酸不同。
[0078] 优选的启动子包含转录阻遏蛋白邸化RINGER,所述转录阻遏蛋白邸化RING邸优选 地包含SEQ ID NO. 126、更优选地包含与SEQ ID NO. 125具有至少80%同一性的序列并包含 SEQ ID NO. 126,并且更优选地包含SEQ ID NO. 125。在运种启动子不包含确切序列SEQ ID NO. 125的情况下,它含有确切序列沈Q ID NO. 126并且与沈Q ID NO. 125具有最小80%的同 一性并且因此优选地与SEQ ID NO. 125的序列最多2个核巧酸不同,并且甚至更优选地与 SEQ ID NO. 125的序列最多1个核巧酸不同。
[0079] 优选的启动子包含花同源异型蛋白APETALA1,所述APETALA1优选地包含SEQ ID NO. 128、更优选地包含与SEQ ID NO. 127具有至少85%同一性的序列并包含SEQ ID NO. 128,并且更优选地包含SEQ ID NO. 127。在运种启动子不包含确切序列SEQ ID NO. 127 的情况下,它含有确切序列SEQ ID NO. 128并且与SEQ ID NO. 127具有最小85%的同一性并 且因此优选地与SEQ ID NO. 127的序列最多3个核巧酸不同,更优选地与SEQ ID NO. 127的 序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 127的序列最多1个核巧酸不同。
[0080] 优选的启动子包含CBF表达诱导物1,也称作AtMYC2(rd22BPl),所述CBF表达诱导 物1优选地包含SEQ ID NO. 130、更优选地包含与SEQ ID NO. 129具有至少85%同一性的序 列并包含SEQ ID NO. 130,并且更优选地包含SEQ ID NO. 129。在运种启动子不包含确切序 列沈Q ID NO. 129的情况下,它含有确切序列沈Q ID NO. 130并且与SEQ ID NO. 129具有最 小85%的同一性并且因此优选地与SEQ ID NO. 129的序列最多2个核巧酸不同,并且甚至更 优选地与SEQ ID NO. 129的序列最多1个核巧酸不同。
[0081 ]优选的启动子包含bZIP因子DPBF-1和/或2的结合位点,所述结合位点优选地包含 沈Q ID NO. 132、更优选地包含与SEQ ID NO. 131具有至少81 %同一性的序列并包含沈Q ID NO. 132,并且更优选地包含SEQ ID NO. 131。在运种启动子不包含确切序列SEQ ID NO. 131 的情况下,它含有确切序列SEQ ID NO. 132并且与SEQ ID NO. 131具有最小81 %的同一性并 且因此优选地与SEQ ID NO. 131的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 131的序列最多1个核巧酸不同。
[0082] 优选的启动子包含I类GATA因子的结合位点,所述结合位点优选地包含SEQ ID NO. 134、更优选地包含与SEQ ID NO. 133具有至少88%同一性的序列并包含SEQ ID NO. 134,并且更优选地包含SEQ ID NO. 133。在运种启动子不包含确切序列SEQ ID NO. 133 的情况下,它含有确切序列SEQ ID NO. 134并且与SEQ ID NO. 133具有最小88%的同一性并 且因此优选地与SEQ ID NO. 133的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 133的序列最多1个核巧酸不同。
[0083] 优选的启动子包含Dof2单一锋指转录因子的结合位点,所述结合位点优选地包含 沈Q ID NO. 136、更优选地包含与SEQ ID NO. 135具有至少88%同一性的序列并包含沈Q ID NO. 136,并且更优选地包含SEQ ID NO. 135。在运种启动子不包含确切序列SEQ ID NO. 135 的情况下,它含有确切序列SEQ ID NO. 136并且与SEQ ID NO. 135具有最小88%的同一性并 且因此优选地与SEQ ID NO. 135的序列最多2个核巧酸不同,并且甚至更优选地与SEQ ID NO. 135的序列最多1个核巧酸不同。
[0084] 优选的启动子包含两种或更多种前述转录因子结合位点或顺式活性元件的组合。 优选地,该启动子包含各自如上文定义的TATA框、CPRF结合位点、TCP I类转录因子结合位 点和bZIP蛋白G框结合因子1结合位点。特别优选运样的启动子,所述启动子包含序列SEQ ID NO. 138和/或沈Q ID NO. 139,或与运些序列中任一者至少70%同一、优选地80%同一、 更优选地至少90%同一的序列,并且甚至更优选地与运些序列中任一者最多10个核巧酸不 同、甚至更优选地最多9个核巧酸不同、甚至更优选地最多8个核巧酸不同、甚至更优选地最 多7个核巧酸不同、甚至更优选地最多6个核巧酸不同、甚至更优选地最多5个核巧酸不同、 甚至更优选地最多4个核巧酸不同、甚至更优选地最多3个核巧酸不同、甚至更优选地最多2 个核巧酸不同、甚至更优选地最多1个核巧酸不同。在运种启动子包含与SEQ ID NO. 138至 少70%同一的序列情况下,该启动子优选地包含如上文定义的转录因子CPRF、TCP I类转录 因子和bZIP蛋白G框结合因子1中每一者的至少一个结合位点,并且优选地至少包含根据 沈Q ID NO. 114、118和120的每个序列。在运种启动子包含与SEQ ID NO. 139至少70%同一 的序列情况下,该启动子优选地包含如上文定义的转录因子邸化RINGER、A阳TALAUCBF表 达诱导物UDPBF-1和2、1类GATA因子和Dof2中每一者的至少一个结合位点,并且优选地至 少包含根据沈Q ID N0.126、128、130、132、134和136的每个序列。
[0085] 本文中提到的转录因子的功能是技术人员已知的。通过提供(例如如上文定义)相 应的转录因子结合位点,技术人员实现了运些转录因子的作用中固有的益处。特别地,技术 人员可w组合两个或更多个并且优选地全部前述的转录因子结合位点。
[0086] 就本发明而言,将核酸序列之间的差异计算为一个序列转化成另一个序列所需要 的最少置换、插入或缺失数目。因此,例如,序列"ACGT"和"ATGT"存在1个核巧酸不同并且相 对第一序列具有75 %序列同一性,并且序列"AACCGGTr和"AACTGTr存在2个核巧酸不同, 良P,一个缺失和一个置换,并且相对第一序列具有87.5 %序列同一性。出于本发明目的,序 列WDNA序列形式给出,相应RNA序列视为相同,从而不考虑叩'由"U"置换并且反之亦然。
[0087] 启动子的长度优选地是至少或确切地98个核巧酸、甚至更优选地至少或确切地 142个核巧酸、甚至更优选地至少或确切地160个核巧酸、甚至更优选地至少或确切地197个 核巧酸、甚至更优选地至少或确切地235个核巧酸和甚至更优选地至少或确切地1063个核 巧酸。具有不多于98个核巧酸长度的启动子特别合适克隆处于严重尺寸限制下的祀基因; 不多于142个核巧酸的启动子仍然还可用于克隆处于严重尺寸限制下的祀基因;不多于160 个核巧酸的启动子仍然还可用于克隆处于严重尺寸限制下的祀基因,但是较不优选,原因 是其尺寸较大;不多于197个核巧酸的启动子仍然还可用于克隆处于严重尺寸限制下的祀 基因,但是较不优选,原因是其尺寸较大;不多于235个核巧酸的启动子仍然还可用于克隆 处于严重尺寸限制下的祀基因,但是较不优选,原因是其尺寸较大。合适的启动子优选地在 沈9 10側.141、144、147、150、153、156和159的任一者中给出和还在沈9 10側.171-220、 231-275和286-300的任一者中给出的那些当中选出。合适的启动子还优选地在与SEQ ID N0.141、144、147、150、153、156、159、171-220、231-275 和 286-300 中任一者具有至少 70%、 更优选地至少80 %和更优选地至少90 %序列同一性的那些当中选出,并且优选地包含两个 或更多个如上文所述的转录因子结合位点。
[0088] 包含本发明的启动子和增强子组合的优选核酸序列是选自SEQ ID N0.143、146、 149、152、155、158和1的那些,并且还选自沈9 10側.161-170、221-230、276-285和301-310 的那些。上文给出了序列沈Q ID ^.161-170、221-230、276-285和301-310的优选顺序^及 相应的原因。
[0089] 本发明也提供包含如上文所述的重组核酸或由其组成的表达盒。在运种重组核酸 尚未包含启动子的情况下,表达盒额外地包含如上文所述的启动子、优选地植物启动子。因 此,本发明的表达盒按5/至y方向包含启动子、作为或包含本发明增强子的非翻译区、祀基 因和任选地终止子或其他元件。本发明的表达盒优选地包含如上文定义的启动子和如上文 所述的非翻译区或增强子。W运种方式,可W使用本发明的表达盒实现上文归属于启动子 和增强子的优点。该表达盒允许将祀基因轻易转移入生物、优选地细胞和优选地植物细胞。
[0090] 因此,本发明的表达盒优选地包含运样的启动子,所述启动子因此包含
[0091] TATA框,其优选地包含沈Q ID NO. 108、更优选地包含与沈Q ID NO. 107具有至少 89%同一性的序列并包含沈Q ID NO. 108,并且更优选地包含沈Q ID NO. 107,和
[009引 CPRF因子结合位点,其优选地包含SEQIDN0.114、更优选地包含与SEQID NO. 113具有至少90%同一性的序列并包含SEQ ID NO. 114,并且更优选地包含SEQ ID NO.113,和
[0093] TCP I类转录因子结合位点,其优选地包含SEQ ID NO. 116、更优选地包含与SEQ ID NO. 115具有至少90%同一性的序列并包含SEQ ID NO. 116,并且更优选地包含SEQ ID NO.115,和
[0094] bZIP蛋白G框结合因子1结合位点,其优选地包含SEQ ID NO. 118、更优选地包含与 沈Q ID NO. 117具有至少85%同一性的序列并包含SEQ ID NO. 118,并且更优选地包含沈Q ID NO.117,
[0095] 并且优选地还包含至少一个、优选地至少两个、更优选地至少Ξ个和最优选地全 部W下元件:
[0096] Ry基序,其优选地包含SEQ ID NO. 110、更优选地包含与沈Q ID NO. 109具有至少 88%同一性的序列并包含沈Q ID NO. 110,并且更优选地包含沈Q ID NO. 109,
[0097] 谷醇溶蛋白框,其优选地包含SEQ ID NO. 112、更优选地包含与SEQ ID NO. Ill具 有至少90%同一性的序列并包含沈Q ID NO. 112,并且更优选地包含沈Q ID NO. 111,
[009引如赋予光诱导性的GAPDH启动子中的顺式元件,其优选地包含SEQ ID NO. 120、更 优选地包含与SEQ ID NO. 119具有至少90%同一性的序列并包含SEQ ID NO. 120,并且更优 选地包含沈Q ID NO. 119,
[0099] SBF-1结合位点,其优选地包含沈Q ID NO. 122、更优选地包含与沈Q ID NO. 121具 有至少90%同一性的序列并包含沈Q ID NO. 122,并且更优选地包含沈Q ID NO. 121,和
[0100] 向日葵同源域亮氨酸拉链蛋白化化-4结合位点,其优选地包含SEQ ID NO. 124、更 优选地包含与SEQ ID NO. 123具有至少90%同一性的序列并包含SEQ ID NO. 124,并且更优 选地包含沈Q ID NO. 123。
[0101] 另外,该启动子优选地包含W下核酸或由其组成
[0102] a)根据沈Q ID N0.141、142、144、145、147、148、150、151、153、154、156、157、159至 310中任一者代表的核酸;
[0103] b)与根据a)的核酸序列的任一者具有至少70%序列同一性的核酸。
[0104] 上文描述了用运类启动子所赋予的优点。
[0105] 最优选的是运样的启动子-增强子组合,其包含根据SEQ ID NO. 1的序列或与SEQ ID NO. 1的序列具有至少70%序列同一性的序列或由其组成。运种序列存在于亚麻化inum usitatissimum)中并允许更多或更少在植物种子中可表达的任何祀基因发生种子特异性 和高度活跃的表达。有趣地,尚未提到由启动子、尤其在SEQ ID NO. 1中找到的启动子和本 发明增强子的组合所赋予的优点,尽管现有技术中尝试过分析该启动子的特征。例如,在W0 0116340中,创建了包含在SEQ ID NO. 1中找到的启动子的构建体,但是增强子区域已经缺 失。因此,在运份文献中,仅如SEQ ID NO.311中给出的序列与GUS报道基因融合。但是,现在 已经发现,通过包括本发明的增强子,可W实现报道基因活性的实质增加。
[0106] 本发明的表达盒优选地包含于载体中。因此,本发明的载体允许用长的祀基因或 多个基因的组合转化细胞、优选地植物细胞,同时实现与本发明增强子功能性连接的祀基 因的高表达或活性。
[0107] 相应地,本发明提供包含本发明表达盒或本发明重组核酸的植物、植物器官或植 物细胞。当然,重组核酸应当还包含启动子,从而允许表达祀基因,因为如果祀基因由于缺 少启动子而根本不表达,则显然不能借助本发明的增强子实现祀基因表达或活性的增加。 植物、植物器官或植物细胞如此利用本发明增强子、重组核酸或表达盒所赋予的优点,从而 与包含相同启动子和祀基因组合而无本发明增强子的植物、植物器官或植物细胞相比,祀 基因的表达或活性增加。
[0108] 从上文给出的内容显而易见,本发明还提供一种增加祀基因表达或活性的方法, 所述方法包括步骤
[0109] i)在祀基因上游提供非翻译区和植物启动子W获得本发明的表达盒,和
[0110] ii)向植物细胞引入表达盒。
[0111] 对应于W上说明,增强子优选地相对于启动子和/或祀基因为异源。将所述表达盒 引入植物细胞W允许祀基因在植物细胞中或在从接受表达盒引入的确切植物细胞衍生的 植物细胞中表达。因此
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1