用于在植物中增强基因表达的调节性核酸分子的制作方法

文档序号:30869557发布日期:2022-07-23 10:14阅读:105来源:国知局
用于在植物中增强基因表达的调节性核酸分子的制作方法

1.本发明属于植物分子生物学领域,提供用于产生高表达启动子及产生核酸表达增强的植物的方法,其中核酸表达增强性核酸(neena)与所述启动子功能性连接和/或引入植物中。


背景技术:

2.转基因在植物中的表达受到各种外部和内部因素的强烈影响,导致转基因表达水平的可变和不可预测。通常,必须产生和分析大量的转化体,以鉴定出具有期望表达强度的株系。由于具有期望表达强度的株系的转化和筛选成本高且劳动密集,因此需要一个或多个转基因在植物中高表达。当必须在植物中协同表达若干基因来达到特定效果时,由于必须鉴定出每个基因都具有强表达的植物,因此,这个问题尤为突出。
3.例如,取决于构建体设计和单个转化事件中t-dna插入基因座的位置效应,转基因的表达可以显著变化。强启动子可以部分克服这些挑战。然而,具有期望特异性并显示出强表达的适宜启动子的可得性,通常受限。额外启动子的鉴定和表征有助于缩小这一差距,以确保可以获得足够的具有期望表达特异性的启动子。然而,具有相应特异性和强度的启动子的天然可得性、以及候选启动子的耗时表征,均阻碍了适宜的新启动子的鉴定。
4.为了克服这些挑战,已显示多种遗传元件和/或基序对基因表达有积极影响。其中,一些内含子已经被识别为具有改善基因表达的强大潜力的遗传元件。尽管其机制大部分尚不清楚,但已经显示,一些内含子对成熟mrna的稳态量有积极影响,这可能通过增强转录活性、改善mrna成熟、增强核mrna输出和/或改善翻译起始来实现(例如huang和gorman,1990,nucleic acid research 18;le hir等,2003,trend biochem sci 28;nott等,2004,genes dev.18)。
5.此外,已鉴定出不一定与内含子相关的通用增强子。增强子是重要的顺式调节dna元件,通过招募转录因子并将其定向到靶基因的启动子上,以细胞类型/组织特异性的方式调控转录程序。基因的表达可由一个或多个增强子调节(marand等2017;biochimica and biophysica acta 1860(131-139))。增强子难以鉴定,因为它们的位置相对于其关联启动子不可预测。它们可以定位在某个表达核酸的转录起始位点的上游或下游,并且可以在距离相应启动子5000或更多个核苷酸的位置处发挥作用。值得注意的是,很大程度上由于缺乏增强子鉴定的一般方法,在植物物种中仅鉴定出少数增强子。
6.此外,基因组编辑技术的发展理论上也允许通过在内源基因的启动子、非翻译区或内基因中插入增强子来提高内源基因的表达水平。然而,由于迄今为止鉴定的增强子数量有限,这种方法受到阻碍。
7.增强功能性连接的核酸表达的核酸分子在本技术中描述为“核酸表达增强性核酸”(neena)。
8.发明详述
9.本发明的第一实施方案包括用于产生具有增强的表达强度的启动子的方法,该方
法包括使一个或多个核酸表达增强性核酸(neena)分子功能性连接到启动子,该核酸表达增强性核酸分子包含;
10.i)具有seq id no:16至21中任一所定义的序列的核酸分子;或
11.ii)具有与seq id no:16至21所定义的序列中任一者具有80%或更多同一性的序列的核酸分子,优选地,该同一性为85%或更多,更优选地,该同一性为90%或更多,甚至更优选地,该同一性为95%或更多、96%或更多、97%或更多、98%或更多、或99%或更多,在最优选的实施方案中,与seq id no:16至21所定义的序列中任一者的同一性为100%;或
12.iii)具有30个核苷酸或更多、40个核苷酸或更多、50个核苷酸或更多、或100个核苷酸或更多的核酸分子,其在与以下条件等同的条件下与包含seq id no:16至21任一的转录增强核苷酸序列中的至少30个、优选至少40个、更优选至少50个、甚至更优选至少100个、最优选至少150个连续核苷酸的核酸分子或其互补链杂交,所述条件为在50℃、在7%十二烷基硫酸钠(sds)、0.5m napo4、1mm edta中杂交,在50℃或65℃(优选65℃)在2
×
ssc、0.1%sds中洗涤。优选地,所述核酸分子,与包含seq id no:16至21任一的转录增强核苷酸序列中的至少30个、优选至少40个、更优选至少50个、甚至更优选至少100个、最优选至少150个连续核苷酸的核酸分子或其互补链,在与以下条件等同的条件下杂交:在50℃、在7%十二烷基硫酸钠(sds)、0.5m napo4、1mm edta中杂交,在50℃或65℃(优选65℃)在1
×
ssc、0.1%sds中洗涤;更优选地,该核酸分子,与包含seq id no:16至21任一的转录增强核苷酸序列中的至少30个、优选至少40个、更优选至少50个、甚至更优选至少100个、最优选至少150个连续核苷酸的核酸分子或其互补链,在与以下条件等同的条件下杂交:在50℃、在7%十二烷基硫酸钠(sds)、0.5m napo4、1mm edta中杂交,在50℃或65℃(优选65℃)在0.1
×
ssc、0.1%sds中洗涤;
13.iv)i)至iii)的核酸分子的30个或更多个连续碱基、优选40个或更多个连续碱基、更优选50个或更多个连续碱基、甚至更优选100个或更多个连续碱基的片段,其具有表达增强活性,例如,与具有seq id no:16至21所定义的序列中任一的序列的相应核酸分子的表达增强活性相比,其具有65%或更多、优选70%或更多、更优选75%或更多、甚至更优选80%或更多、85%或更多、或90%或更多,在最优选的实施方案中,具有95%或更多的表达增强活性;或
14.v)核酸分子,其与i)至iv)的任何前述核酸分子互补或反向互补。
15.在一个实施方案中,该一个或多个neena对与之功能性连接的启动子而言是异源的。
16.在另一个实施方案中,将本发明的neena引入启动子,使其在5’端和/或3’端与(例如在wt植物的基因组中)并非与本发明的neena天然相邻的序列相邻。
17.在本发明的另一个实施方案中,将2个或更少个拷贝的本发明neena引入启动子。
18.原则上,neena可以功能性连接到任何启动子,如组织特异性、诱导型、发育特异性或组成型启动子。neena将导致异源核酸在与至少一个所述neena功能性连接的相应启动子的控制下表达增强。
19.可将一个或多个neena功能性连接到任何启动子,并增强在该启动子的控制下的核酸分子的表达。在本发明的任何方法中使用的组成型启动子可以源自植物,例如单子叶植物或双子叶植物,源自细菌和/或病毒,或者可以是合成启动子。可使用的组成型启动子
有例如,木薯叶脉花叶病毒启动子(verdaguer b等(1996).pmb 31(6),1129-39)、地三叶草矮化病毒启动子(boevink p等(1995).virology 207(2),354-61)、拟南芥组蛋白4a启动子与组蛋白3a内含子的组合(chaboute等(1984).pmb 8(2),179-91)、欧洲油菜(b.napus)p450依赖性脂肪酸ω羟化酶启动子(wo2016113333)、来自水稻的pact10s启动子(mcelroy等(1990).plant cell 2(2),163-71)、来自欧芹(p.crispum)的pcubi启动子(wo 2003102198)、来自玉米(zea mays)的zmubi启动子(christensen等(1992).plant mol biol.18(4),675-89)、来自编码腈水解酶1的拟南芥基因at3g44310的atnit启动子、来自玄参花叶病毒的34s启动子(sanger等,1990,pmb 14(3)),来自花椰菜花叶病毒的35s启动子(odell等(1985).nature 313(6005),810-2)、源自根癌农杆菌(agrobacterium tumefaciens)的nos(depicker等(1982).j mol appl genet.1(6),561-73)和ocs启动子、scbv启动子(us 5 994 123)、super启动子(lee等2007,plant.phys.145)、来自编码铁氧还蛋白nadh还原酶的拟南芥基因at5g66190的atfnr启动子、来自豌豆(pisum sativum)的ptxa启动子(wo2005085450)、来自编码丙糖磷酸转移蛋白的拟南芥基因at5g46110的attpt启动子、来自拟南芥基因at4g14880和at4g14890的双向atoastl启动子、来自编码甘油醛-3-磷酸脱氢酶的拟南芥基因at1g13440的pro0194启动子、来自编码果糖双磷酸醛缩酶的拟南芥基因at3g52930的pro0162启动子、ahas启动子(wo2008124495)、来自水稻的caffeoylcoa-mt启动子和oscp12(wo2006084868)或来自水稻的pgos2启动子(de pater等(1992).plant j.2(6),837-44)。
20.可以在本发明的任何方法中使用的组织或发育特异性或诱导型启动子可以源自植物,例如单子叶植物或双子叶植物,源自细菌和/或病毒,或者可以是合成启动子。可以使用的组织或发育特异性或诱导型启动子有,例如,种子特异性和/或种子优先启动子,例如来自普通小麦(t.aestivum)的高分子量谷蛋白bx17启动子(reddy p and appels r(1993)theor appl genet.85(5),616-24)、来自普通小麦的高分子量谷蛋白1dx5启动子(lamacchia等(2001)j exp bot.52(355),243-50)、来自普通小麦的质体agpase启动子(thorneycroft等(2003)plant biotechnol j.1(4),259-70)、来自大麦(hordeum vulgare)的大麦醇溶蛋白b1启动子(brandt等(1985)carlsberg research communications 50,333)、来自蚕豆(vicia faba)的sbp启动子(wo2000026388)、来自蚕豆的未知种子蛋白启动子(usp)(wo2003092362)、来自欧洲油菜的napin启动子(ep0255378)、来自双胚亚麻(linum usitatissmum)的conlinin启动子(wo2001016340)、来自编码过氧化物氧还蛋白样蛋白的拟南芥基因at5g01670的启动子(wo2006089950)、来自双胚亚麻的过氧化物氧还蛋白样蛋白(peroxiredoxin like protein)的启动子(wo2006089950)、来自欧洲油菜的球蛋白样蛋白启动子(roh等,2014,journal of the korean society for applied biological chemistry 57(5))、来自菜豆(phaseolus vulgaris)的arcelin5-1启动子(wo 201207720)、来自玉米的玉米醇溶蛋白启动子(shepherd和scott biotechnol appl biochem.2009,52(3))、来自玉米的球蛋白启动子(mei等,2004,maydica 49(4))、来自玉米的pkg86启动子(wo 2010122110)、来自马铃薯(solanum tuberosum)的叶特异性st-ls1启动子(stockhaus等(1989)embo j.8(9),2445-51)、来自水稻的叶特异性硫氧还蛋白启动子(fukuda等(2005)plant cell physiol.46(11),1779-86)、来自陆地棉(g.hirsutum)的根特异性或根优先启动子pbtg-26d(wo2017/025282)、来自玉米的pgl4和5
(ep1862473)或来自玉米的pzrp2(held等(1997)pmg 35(3),367

375)、来自拟南芥的诱导型启动子phpr1(wang等(2009)molecular plant 2(1),191

200)、来自拟南芥的rd29a启动子(yamaguchi-shinozaki k和shinozaki k(1994)plant cell 6(2),251-64)、来自玉米的蛋白酶抑制剂启动子(cordero等(1994)plant j.6(2),141-50)或如wo2012093032、us2013081154、wo2004065571、wo2008083969或wo2012136788中所述的来自陆地棉的纤维特异性或优先启动子。
21.功能性连接到neena的本发明高表达启动子可用于任何植物,包括例如苔藓植物、蕨类植物、裸子植物或被子植物,例如单子叶植物或双子叶植物。在优选实施方案中,功能性连接到neena的本发明启动子可用于单子叶植物或双子叶植物,优选作物植物,例如玉米、大豆、canola、棉花、土豆、甜菜、水稻、小麦、高粱、芭蕉属植物(musa)、芒属植物(miscanthus)、甘蔗或大麦等。在本发明的优选实施方案中,功能性连接到neena的启动子可用于单子叶作物植物,如玉米、水稻、小麦、高粱、芭蕉属植物、芒属植物、甘蔗或大麦。在一个尤其优选的实施方案中,功能性连接到neena的启动子可用于小麦。
22.本技术中使用的高表达启动子是指,例如,功能性连接到neena的启动子,这导致该启动子在植物或其部分中的表达增强,其中,在功能性连接到neena的相应启动子的控制下,源自该核酸分子的rna积累或rna合成速率更高,优选显著高于由缺乏本发明的neena的相同启动子引起的表达。优选地,与在相同条件下生长的相同年龄的对照植物(包含相同的启动子,但该启动子未功能性连接到本发明的neena)相比,该核酸的rna量和/或rna合成速率和/或rna在植物中的稳定性提高50%或更多,例如100%或更多,优选200%或更多,更优选5倍或更多,甚至更优选10倍或更多,最优选20倍或更多,例如50倍。
23.在本文中使用时,显著更高指统计显著性,本领域技术人员知晓如何确定统计显著性,例如通过对数据集应用诸如t检验的统计检验。
24.用于检测由启动子赋予的表达的方法为本领域已知。例如,启动子可以功能性连接到标记基因(如gus、gfp或萤光素酶),并可以测定植物或其部分中由相应标记基因编码的相应蛋白质的活性。作为一个代表性实例,下面详细描述用于检测萤光素酶的方法。其他方法包括例如,通过本领域已知的方法,例如northern印迹分析、qpcr、run-on测定、或本领域描述的其他方法,测量由该启动子控制的核酸分子的rna的稳态水平或合成速率。
25.本领域技术人员知晓用于将两个或更多个核酸分子功能性连接的多种方法。这些方法可以包括限制/连接、不依赖连接酶的克隆、重组工程(recombineering)、重组或合成。还可以使用其他方法来功能性连接两个或更多个核酸分子。
26.本发明的另一个实施方案是,用于产生与相应的对照植物或其部分相比具有一个或多个核酸分子的表达增强的植物或其部分的方法,其包括将包含上文i)至v)下定义的核酸分子的一个或多个neena引入植物或其部分,并使该一个或多个neena功能性连接到启动子和该启动子控制下的核酸分子的步骤,其中该neena对所述核酸分子而言是异源的。
27.neena对于在neena功能性连接的启动子控制下的核酸分子而言可以是异源的,或者对于启动子和该启动子控制下的核酸分子二者而言可以是异源的。
28.关于核酸分子或dna的术语“异源”是指,与在自然界中不与之有效连接或在自然界中在不同位置与之有效连接的第二核酸分子有效连接或经操纵而有效连接的核酸分子。例如,本发明的neena在其自然环境中与其天然启动子功能性连接;而在本发明中,它与另
一个启动子连接,该启动子可源自相同生物、不同生物,或可以是合成启动子,如super启动子。这也可以意味着本发明的neena与其天然启动子相连,但在该启动子控制下的核酸分子对包含其天然neena的启动子而言是异源的。此外,应理解,功能性连接到本发明neena的启动子和/或在该启动子控制下的核酸分子,对所述neena而言,可以是异源的,当:启动子和/或该启动子控制下的核酸分子序列已通过例如插入、缺失等突变进行操作,由此使得启动子和/或该启动子控制下的核酸分子的天然序列被修饰,并因此对本发明的neena而言已成为异源时。还可以理解,在neena功能性连接到其天然启动子,且其中neena相对于该启动子的位置发生改变,以致于启动子在该操作后显示出更高的表达时,neena对与之功能性连接的核酸而言是异源的。
29.如本文所述,表现出核酸分子表达增强的植物是指,与在相同条件下生长的、不具有相应neena功能性连接到相应核酸分子的对照植物相比,该植物具有更高、优选地统计学显著更高的核酸分子表达。所述对照植物可以是野生型植物、或是与本发明植物一样包含控制相同基因的相同启动子的转基因植物,其中启动子未连接到本发明的neena。
30.产生本文所用的植物包括用于稳定转化的方法,如通过农杆菌介导的转化、原生质体转化、粒子轰击等方式,将重组dna构建体引入植物或其部分,以及可选地随后再生转基因植物。
31.还包括用于瞬时转化植物或其部分的方法,如病毒感染或农杆菌浸润。本领域技术人员知道用于稳定和/或瞬时转化植物或其部分的其他方法。
32.使用供体dna的方法,如育种方法、原生质体融合或重组技术等,也可用于产生本发明的植物,并涵盖在本发明中。例如,可以使用本领域已知的重组技术将单链断裂(切口)或双链断裂引入植物基因组,如talen(wo12138939,wo12138927);锌指蛋白(wo02057293、wo05084190)、归巢核酸内切酶(wo11104382、wo14199358)或核酸引导的核酸酶,如ago、cas9或cas12(wo13141680、wo13176772、wo14093595、wo15157534或wo16205711)。连同引入这种单链或双链断裂诱导剂一起,可将一个或多个供体dna(wo13176772,wo14089290)引入植物或其部分,所述供体dna包含neena分子以及位于该neena分子侧翼的侧翼核酸分子,该侧翼核酸分子包含与该切口或双链断裂毗邻的区域基本相同或基本互补的序列,从而促进同源重组以及将neena分子引入植物或其部分的基因组。
33.此外,通过使用脱氨酶(wo0058480、wo18027078)等技术,将一系列点突变引入基因组,可以将本发明的neena序列引入基因组并功能性连接到相应的异源启动子,其中可以通过使突变多肽部分(例如脱氨酶或糖苷酶)与dna结合多肽(如talen、锌指蛋白、归巢核酸酶或rna引导的核酸酶、切口酶或失活的核酸酶,例如cas9或cas12)融合,以将诸如脱氨酶等定向到植物或其部分的基因组中的特定区域,如wo15089406、us2017321210、wo15133554或wo17070632中所述。通过应用这些方法,可以将neena序列引入基因组中而不引入异源分子,其中neena序列取代基因组中的另一个序列。这类技术涵盖在以下术语中,即,“整合”或“引入”neena序列或将neena分子“整合”或“引入”到基因组中并使该序列和/或分子功能性连接到异源启动子。
34.本发明的方法可应用于任何植物,例如裸子植物或被子植物,优选被子植物,例如双子叶植物或单子叶植物,优选单子叶植物。优选的单子叶植物是例如玉米、小麦、水稻、大麦、高粱、芭蕉属、甘蔗、芒属和短柄草属(brachypodium),尤其优选的单子叶植物是玉米、
小麦和水稻,最优选的是小麦。优选的双子叶植物是例如大豆、油菜籽、canola、亚麻籽、棉花、马铃薯、甜菜、万寿菊和拟南芥属植物,尤其优选的双子叶植物是大豆、油菜籽、canola和马铃薯。
35.在本发明方法的一个实施方案中,通过应用基因组编辑技术,将一个或多个neena分子或neena序列整合到植物或其部分的基因组中。
36.在本发明方法的另一个实施方案中,基因组编辑技术包括,使用核酸引导的核酸酶(例如ago、cas9或cas12核酸酶)、talen、归巢内切核酸酶或锌指蛋白,在neena分子待整合入基因组的位置处,引入单链或双链断裂,并进一步引入dna修复模板,该模板包含neena分子以及位于其3’端和5’端并与所述单链或双链断裂的上游和/或下游序列基本相同或基本互补的序列,以促进单链或双链断裂位置处的重组。优选地,基本相同或基本互补的序列彼此独立地为至少1000个、至少500个碱基、至少450个碱基、至少400个碱基、至少350个碱基、至少300个碱基、至少250个碱基、至少200个碱基、至少150个碱基、至少100个碱基或至少50个碱基长。优选地,相对于待与之重组的相应基因组区域,序列的同一性或互补性为至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少98%或至少99%同一或互补。
37.在本发明方法的另一个实施方案中,基因组编辑技术包括在植物或其部分的基因组中引入点突变,从而将neena序列引入植物基因组。例如,这可以通过引入与胞嘧啶脱氨酶(wo17070633)或腺嘌呤脱氨酶(wo18027078)功能性结合的dna结合蛋白质(例如锌指蛋白、tale蛋白或核酸引导的核酸酶,如cas9、cas12(cpfi)或ago)来达到。
38.在本发明的一个实施方案中,如上文定义的方法包括以下步骤:
39.a)将一个或多个包含上文i)至v)中定义的核酸分子的neena引入植物或其部分;和
40.b)使该一个或多个neena整合入该植物或其部分的基因组,由此使该一个或多个neena功能性连接到内源性表达的核酸上,其中所述内源性表达的核酸对于该一个或多个neena而言是异源的;和可选地
41.c)从该转化的细胞再生包含该一个或多个neena的植物或其部分。
42.对处于与neena功能性连接的启动子控制下的核酸分子而言,neena可以是异源的;或者对启动子和该启动子控制下的核酸分子二者而言,neena可以都是异源的。
43.可以通过粒子轰击、原生质体电穿孔、病毒感染、农杆菌介导的转化、crispr/cas、或本领域已知的任何其他方法,将该一个或多个neena分子引入植物或其部分。可以在crispr/cas方法中将neena分子,例如整合在质粒或病毒dna或病毒rna或供体dna中的neena分子引入。neena分子也可以包含在bac、yac或人工染色体上,之后引入植物或植物部分。还可将其作为包含neena序列的线性核酸分子引入,其中可在核酸分子上存在与neena序列相邻的附加序列。与neena序列相邻的这些序列可以是约20bp(例如20bp)到几百个碱基对(例如100bp或更多),并且可以促进(例如通过同源重组)整合到基因组中。可以使用任何其他用于基因组整合的方法,可以是靶向整合方法,如同源重组,或随机整合方法,如非常规重组(illegitimate recombination)。
44.可与neena分子功能性连接的内源性表达的核酸可以是任何核酸,优选任何表达的核酸分子。该核酸分子可以是蛋白质编码核酸分子或非编码分子,如反义rna、rrna、
trna、mirna、ta-sirna、sirna、dsrna、snrna、snrna或本领域已知的任何其他非编码rna。
45.实施本发明方法的另一种方式可以是:
46.a)提供包含一个或多个neena的表达构建体,其中该neena包含上文i)至v)中定义的核酸分子,并功能性连接到上文定义的启动子和一个或多个核酸分子上,其中所述核酸分子对该一个或多个neena而言是异源的,并处于所述启动子的控制之下;和
47.b)将包含该一个或多个neena的所述表达构建体整合到植物或其部分的基因组中;和可选地
48.c)从该转化的植物或其部分再生包含该一个或多个表达构建体的植物或其部分。
49.对处于与neena功能性连接的启动子控制下的核酸分子而言,neena可以是异源的;或者neena对启动子和该启动子控制下的核酸分子二者而言可以都是异源的。
50.表达构建体可以用本领域已知的任何方法整合到相应植物的基因组中。使用粒子轰击或农杆菌介导转化或crispr/cas应用等方法,整合可以是随机的。在一个优选实施方案中,通过靶向整合例如同源重组,进行整合。此后一种方法允许包含与neena功能性连接的高表达启动子的表达构建体整合到有利的基因组区域。有利的基因组区域可以例如是已知包含高表达的基因(例如种子中高表达的基因)的基因组区域,并由此所述基因组区域,与不显示转录活性的基因组区域相比,可增加自所述表达构建体的表达。
51.在另一优选实施方案中,该一个或多个neena功能性连接到启动子,靠近所述异源核酸分子的转录起始位点。
52.如本文所述,靠近转录起始位点包括,将一个或多个neena功能性连接到启动子,距离该异源核酸分子的转录起始位点5000bp或更少、4000bp或更少、3000bp或更少、2500bp或更少、优选2000bp或更少、更优选1500bp或更少、甚至更优选1000bp或更少、和最优选500bp或更少的距离。应理解,neena可以在与相应启动子的转录起始位点的相应距离的上游或下游整合。因此,该一个或多个neena可以包含在与该一个或多个neena功能性连接的启动子(优选组成型启动子)控制下的该相应异源核酸的初级转录物中,或者它可以整合在启动子分子中。如果neena整合在相应启动子的转录起始位点下游,则整合位点优选在所述启动子控制的该异源核酸的5’utr、3’utr或内含子中,最优选地,它整合在相应异源核酸的第一内含子中。
53.优选地,该一个或多个neena整合在启动子、5’utr或第一内含子中,或者neena替换启动子、5’utr或第一内含子的一部分。
54.在本发明的另一个方面,其中该一个或多个neena连接到7a海藻糖-6-磷酸磷酸酶(t6pp)基因(wo/2018/113702,seq id no.22)上,neena可在翻译起始密码子上游约200bp、约397bp、约676bp或约1000bp处插入。该一个或多个neena可在翻译起始密码子上游150至250bp之间、350至450bp之间、620至720bp之间、或950至1000bp之间的位置,插入7a海藻糖-6-磷酸磷酸酶(t6pp)基因。
55.本发明的另一个实施方案包含重组表达构建体,该重组表达构建体包含一个或多个含有上文i)至v)中定义的核酸分子的neena。
56.该重组表达构建体还可包含与该一个或多个neena功能性连接的一个或多个启动子,并可选地包含一个或多个表达的核酸分子,该核酸分子对于该一个或多个neena而言是异源的。
57.对处于与neena功能性连接的该启动子控制下的核酸分子而言,neena可以是异源的;或者它对启动子和该启动子控制下的核酸分子二者而言可以都是异源的。
58.该表达构建体可包含一个或多个,例如两个或更多个,例如5个或更多个,如10个或更多个的启动子的组合,其中所述启动子功能性连接到neena和待表达的核酸分子上,且其中该待表达的核酸分子对相应的neena而言是异源的。该表达构建体还可包含功能性连接到待表达的核酸分子上的其他启动子,该其他启动子不包含neena,且该待表达的核酸分子对该相应的启动子而言是同源的或异源的。
59.包含如上所定义的一个或多个重组表达构建体的重组表达载体是本发明的另一个实施方案。本发明中可使用的多种表达载体为本领域技术人员已知。本领域还熟知用于将包含这种表达构建体的载体引入植物基因组的方法,以及用于从转化细胞再生转基因植物的方法,其中所述的表达构建体可以包含例如功能性连接到neena的启动子、以及可选地诸如终止子的其他元件。取决于用于转化植物或其部分的方法,整个载体可以整合到该植物或其部分的基因组中,或载体的某些成分可整合到基因组中,例如t-dna。
60.本发明还包括,含有一个或多个上文i)至v)中定义的异源neena的转基因植物或其部分。如果neena是合成的、源自另一生物、或源自同一生物但与对照植物(例如野生型植物)相比其天然基因组定位被改变,则该neena应理解为对于该植物而言是异源的。应理解,改变的基因组定位意味着neena定位在另一条染色体上,或定位在同一条染色体上但偏离其在野生型植物中的天然基因组位置10kb或更多,例如10kb,优选5kb或更多,例如5kb,更优选1000bp或更多,例如1000bp,甚至更优选500bp或更多,例如500bp,尤其优选100bp或更多,例如100bp,最优选10bp或更多,例如10bp。
61.包含如上文所定义的重组表达载体或如上文所定义的重组表达构建体的转基因细胞或转基因植物或其部分,是本发明的另一个实施方案。该转基因细胞、转基因植物或其部分可选自细菌、真菌、酵母或植物、昆虫或哺乳动物细胞或植物。优选地,该转基因细胞是细菌、真菌、酵母或植物细胞。优选的细菌是肠杆菌,如大肠杆菌(e.coli),以及农杆菌属(agrobacteria)细菌,例如根癌农杆菌(agrobacterium tumefaciens)和发根农杆菌(agrobacterium rhizogenes)。优选的植物是单子叶植物或双子叶植物,例如单子叶或双子叶作物植物,如玉米、大豆、canola、棉花、马铃薯、甜菜、水稻、小麦、高粱、大麦、芒属植物、芭蕉属植物、甘蔗等。优选的作物植物是玉米、水稻、小麦、大豆、canola、棉花或马铃薯。尤其优选的双子叶作物植物是大豆、canola、棉花或马铃薯。
62.尤其优选的单子叶作物植物是玉米、小麦和水稻。最优选的是小麦。
63.包含上文i)至v)中定义的异源neena或上文定义的重组表达构建体或重组载体、从上文定义的转基因细胞或植物或其部分衍生的转基因细胞培养物、转基因种子、部分或繁殖材料是本发明的其他实施方案。
64.本文所指的转基因部分或繁殖材料包括包含相应neena、重组表达构建体或重组载体的所有组织和器官,例如叶、茎和果实,以及用于繁殖和/或再生植物的材料,如插条、接穗、层、枝或芽。
65.本发明的另一个实施方案是上文i)至v)中定义的neena或上文定义的重组构建体或重组载体在增强植物或其部分中的表达中的用途。
66.本技术提供基因表达增强性核酸分子、和包含一个或多个功能性连接到一个或多
个neena的启动子的构建体。此外,提供这种基因表达增强性核酸分子和表达构建体、包含这种基因表达增强性核酸分子的表达载体、转基因植物或其部分以及转基因细胞的用途。
67.本发明还包括源自上文定义的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料在生产食品、动物饲料、种子、药物或精细化学品中的用途。


技术实现要素:

68.定义
69.缩写:neena:核酸表达增强性核酸;gfp:绿色荧光蛋白;gus:β-葡萄糖醛酸酶;bap-6:苄基氨基嘌呤;2,4-d:2,4-二氯苯氧基乙酸;ms:murashige和skoog培养基;naa-1:萘乙酸;mes:2-(n-吗啉基)-乙磺酸;iaa:吲哚乙酸;kan:硫酸卡那霉素;ga3:赤霉酸;timentin
tm
:替卡西林二钠/克拉维酸钾;microl:微升。
70.应理解,本发明不限于具体方法或流程。还应理解,本文使用的术语仅用于描述具体实施方案,并非旨在限制本发明的范围,本发明的范围将仅受限于所附权利要求书。必须指出,除文中另有明确规定,本文和所附权利要求书中所使用的单数形式“一”、“一种”和“该”包括对复数的述及。因此,例如,提到“一种载体”包括提及一个或多个载体,并且包括本领域技术人员已知的其等同物等等。术语“约”在本文中用来指大约、大致、约或在该区域内。在术语“约”与数值范围结合使用时,它通过将边界延伸到所示数值的上方和下方来修饰该范围。一般而言,本文中用术语“约”来描述高于和低于所述及的值的数值,其中向上或向下(更高或更低)变动20%、优选10%。本文所用的词语“或”指具体列表中的任何一个成员,还包括该列表中成员的任何组合。在本说明书和以下权利要求书中使用时,词语“包含”、“含有”和“包括”旨在指定一个或多个所述特征、整数、组件或步骤的存在,但并不排除一个或多个其他特征、整数、组件、步骤或其组别的存在或添加。为清楚起见,本说明书中使用的某些术语定义和使用如下:
71.反向平行:“反向平行”在本文中是指通过互补碱基残基之间的氢键配对的两个核苷酸序列,其中一个核苷酸序列的磷酸二酯键沿5'-3'方向运行,而另一个核苷酸序列的磷酸二酯键沿3'-5'方向运行。
72.反义:术语“反义”是指这样的核苷酸序列,该核苷酸序列相对于其正常的转录或功能方向而言是反转的,并由此表达rna转录物,所述的rna转录物与宿主细胞内表达的靶基因mrna分子互补(例如,它可以通过watson-crick碱基配对与靶基因mrna分子或单链基因组dna杂交),或者与靶dna分子例如宿主细胞中存在的基因组dna互补。
73.编码区:在用于结构基因时,本文所用的术语“编码区”指这样的核苷酸序列,该核酸序列编码作为mrna分子翻译的结果而出现于新生多肽中的氨基酸。在真核生物中,编码区在5'侧以编码起始甲硫氨酸的核苷酸三联体“atg”为界,在3'侧以规定终止密码子的三个核苷酸三联体之一(即taa、tag、tga)为界。除了包含内含子外,基因的基因组形式还可以包括位于rna转录物上存在的序列的5'端和3'端的序列。将这些序列称为“侧翼”序列或区域(这些侧翼序列位于mrna转录物上存在的非翻译序列的5'或3')。5'侧翼区可以包含调节序列,如控制或影响基因转录的启动子和增强子。3'侧翼区可以包含指导转录终止、转录后切割和多聚腺苷酸化的序列。
74.互补:“互补”或“互补性”指包含反向平行核苷酸序列的两个核苷酸序列,其能够
在所述的反向平行核苷酸序列中的互补碱基残基之间形成氢键时彼此配对(通过碱基配对规则)。例如,序列5'-agt-3'与序列5'-act-3'互补。互补性可以是“部分”或“完全”的。“部分”互补是指其中一个或多个核酸碱基按照碱基配对规则不匹配。核酸分子之间的“完全”或“全部”互补是指其中每个核酸碱基在碱基配对规则下均与另一个碱基匹配。核酸分子链之间的互补程度对核酸分子链之间杂交的效率和强度有显著影响。本文中所用的核酸序列的“互补序列”是指,与具有该核酸序列的核酸分子显示完全互补的核酸分子的核苷酸序列。
75.双链rna:“双链rna”分子或“dsrna”分子包含核苷酸序列的有义rna片段和核苷酸序列的反义rna片段,这两个片段包含彼此互补的核苷酸序列,从而允许有义和反义rna片段配对并形成双链rna分子。
76.内源:“内源”核苷酸序列指存在于未转化的植物细胞的基因组中的核苷酸序列。
77.增强表达:“增强”或“增加”核酸分子在植物细胞中的表达在本文中可以等同地使用,并且意指在应用本发明的方法后植物、植物部分或植物细胞中核酸分子的表达水平,高于在应用该方法之前其在植物、植物部分或植物细胞中的表达水平,或与缺乏本发明重组核酸分子的参考植物相比具有更高表达水平。例如,参考植物包含仅缺少相应的neena的相同构建体。本文中使用的术语“增强”或“增加”是同义词,在本文中意指要表达的核酸分子的更高、优选显著更高的表达。本文中,诸如蛋白质、mrna或rna等物质的水平“增强”或“增加”是指,相对于在基本相同条件下生长的、缺少本发明的重组核酸分子(例如缺少本发明的neena分子、重组构建体或重组载体)的基本相同的植物、植物部分或植物细胞,该水平是增加的。本文中,物质,例如由靶基因表达的prerna、mrna、rrna、trna、snorna、snrna和/或由其编码的蛋白质产物,的水平“增强”或“增加”意指,相对于缺乏本发明的重组核酸分子的细胞或生物体,该水平增加50%或更多,例如100%或更多,优选200%或更多,更优选5倍或更多,甚至更优选10倍或更多,最优选20倍或更多,例如50倍。可通过本领域技术人员熟悉的方法测定该增强或增加。因此,可以例如通过蛋白质的免疫学检测来测定核酸或蛋白质数量的增强或增加。此外,诸如蛋白质测定、荧光、northern杂交、核酸酶保护测定、反转录(定量rt-pcr)、elisa(酶联免疫吸附测定)、western印迹、放射免疫测定(ria)或其他免疫测定和荧光激活细胞分析(facs)等的技术,可用于测量植物或植物细胞中的特定蛋白质或rna。取决于所诱导的蛋白产物的类型,还可以测定其活性或对生物体或细胞表型的影响。用于测定蛋白质量的方法为本领域技术人员已知。可以提到的实例有:micro-biuret法(goa j(1953)scand j clin lab invest 5:218-222)、folin-ciocalteau法(lowry oh等(1951)j biol chem 193:265-275)或测量cbb g-250的吸光度(bradford mm(1976)analyt biochem 72:248-254)。作为用于定量蛋白质活性的一个实例,下文实施例中描述了萤光素酶活性的检测。
78.表达:“表达”是指基因产物的生物合成,优选指细胞中核苷酸序列(例如内源基因或外源基因)的转录和/或翻译。例如,在结构基因的情况下,表达涉及结构基因转录为mrna,以及(可选地)随后mrna翻译为一种或多种多肽。在其他情况下,表达可以仅指含有rna分子的dna的转录。
79.表达构建体:本文所用的“表达构建体”是指,能够指导特定核苷酸序列在适当的植物部分或植物细胞中表达的dna序列,其包含在其引入的植物部分或植物细胞中有功能
的启动子,该启动子有效连接到目的核苷酸序列,可选地该目的核苷酸序列有效连接到终止信号。如果需要翻译,表达构建体通常还包含正确翻译核苷酸序列所需的序列。编码区可以编码目的蛋白质,但也可以在有义或反义方向上编码目的功能性rna,例如rnaa、sirna、snorna、snrna、microrna、ta-sirna或任何其他非编码调节rna。包含目的核苷酸序列的表达构建体可以是嵌合的,这意味着其一个或多个组分就其一个或多个其他组分而言是异源的。表达构建体也可以是天然存在的,但已以重组形式获得用于异源表达。然而,通常情况下,表达构建体对宿主而言是异源的,即表达构建体的特定dna序列并非在宿主细胞中天然存在,而必须通过转化事件引入宿主细胞或宿主细胞的祖先。表达构建体中的核苷酸序列的表达可在组成型启动子或诱导型启动子的控制之下,其中所述诱导型启动子仅在宿主细胞暴露于某些特定外部刺激时才启动转录。在植物的情况下,该启动子也可以是特定组织或器官或发育阶段特异的。
80.外源:术语“外源”指,通过实验操作引入细胞基因组中的任何核酸分子(例如基因序列),其可以包含存在于该细胞中的序列,条件是所引入的序列包含一些修饰(例如点突变、存在选择标记基因等)并因此相对于天然存在的序列不同。
81.功能性连接:术语“功能性连接”应理解为意指,例如,调节元件(例如启动子)与待表达的核酸序列和(根据需要)其他调节元件(如终止子或neena)以这样的方式顺序排列,从而使得每个调节元件都可以执行其预期功能,以允许、修饰、促进或以其他方式影响该核酸序列的表达。作为同义词,可使用“有效连接”。就有义或反义rna而言,取决于核酸序列的排列,表达可以发生。为此,并非必然需要化学意义上的直接连接。基因控制序列,例如增强子序列,也可以从远距离的位置,或者实际上从其他dna分子,发挥其对靶序列的功能。优选的排列是这样的排列,其中将要重组表达的核酸序列放置在作为启动子发挥作用的序列后面,从而使得两个序列彼此共价连接。启动子序列和待重组表达的核酸序列之间的距离优选小于200个碱基对,尤其优选小于100个碱基对,尤其优选小于50个碱基对。在一个优选实施方案中,待转录的核酸序列以这样的方式定位在启动子之后,该方式使得转录起始点与本发明的嵌合rna的期望起始点相同。功能性连接和表达构建体可以通过常规重组和克隆技术产生(例如在maniatis t,fritsch ef and sambrook j(1989)molecular cloning:a laboratory manual,第2版,cold spring harbor laboratory,cold spring harbor(ny);silhavy等(1984)experiments with gene fusions,cold spring harbor laboratory,cold spring harbor(ny);ausubel等(1987)current protocols in molecular biology,greene publishing assoc.and wiley interscience;gelvin等(编辑)(1990)plant molecular biology manual;kluwer academic publisher,dordrecht,the netherlands中描述)。然而,也可以在两个序列之间放置其他序列,例如作为具有限制性酶的特异性切割位点的接头或作为信号肽发挥作用的序列。序列的插入也可以导致融合蛋白的表达。优选地,由调节区(例如启动子)和待表达的核酸序列的连接组成的表达构建体,可以以载体整合形式存在,并例如通过转化,插入植物基因组。
82.基因:术语“基因”是指,与适宜的调节序列有效连接的区域,所述的调节区域能够以某种方式调节基因产物(例如多肽或功能性rna)的表达。基因包括编码区(可读框,orf)之前(上游)和之后(下游)的dna非翻译调节区(例如启动子、增强子、阻遏物等),以及在适用情况下,介于不同编码区(即外显子)之间的间插序列(即内含子)。本文所用的术语“结构
基因”旨在指,转录为mrna且然后该mrna可以翻译为具有特定多肽特征性的氨基酸序列的dna序列。
83.基因组和基因组dna:术语“基因组”或“基因组dna”是指,宿主生物的可遗传的遗传信息。所述基因组dna包括细胞核dna(也称为染色体dna)以及质体(例如叶绿体)和其他细胞器(例如线粒体)的dna。优选地,术语基因组或基因组dna指细胞核的染色体dna。
84.异源:关于核酸分子或dna的术语“异源”是指,有效连接到或经操作而有效连接到第二核酸分子(例如启动子)的核酸分子,其中所述核酸分子在自然界中,例如在wt植物的基因组中,与所述第二核酸分子并不有效连接;或在自然界中,例如在wt植物的基因组中,与所述第二核酸分子在不同的位置处有效连接。
85.优选地,关于核酸分子或dna(例如neena)的术语“异源”是指,核酸分子有效连接到或经操作而有效连接到在自然界中未与之有效连接的第二核酸分子(例如启动子)上。
86.包含核酸分子和与之连接的一个或多个调节核酸分子(如启动子或转录终止信号)的异源表达构建体是,通过实验操作产生的构建体,其中a)所述核酸分子或b)所述调节核酸分子或c)二者(即(a)和(b))均不位于其自然(天然)遗传环境中,或已通过实验操作进行了修饰,修饰的实例为一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。自然遗传环境是指来源生物体中的自然染色体基因座,或是指存在于基因组文库中。在基因组文库的情况下,优选至少部分保留核酸分子序列的自然遗传环境。该环境位于该核酸序列的至少一侧的侧翼,序列长度为至少50bp、优选至少500bp、尤其优选至少1000bp、尤其优选至少5000bp。天然存在的表达构建体——例如启动子与相应基因的天然组合——在通过非天然、合成的“人工”方法(例如诱变)对其进行修饰后,成为转基因表达构建体。已经描述了此类方法(us 5565350;wo 00/15815)。例如,有效连接到启动子(不是此分子的天然启动子)的蛋白质编码核酸分子,被认为对于该启动子而言是异源的。优选地,异源dna对于其所引入的细胞而言不是内源性的,或不是与之天然相关的,而是从另一个细胞获得的或是合成的。异源dna还包括这样的内源dna序列,其包含一些修饰、非天然存在的内源dna序列的多个拷贝、或在物理上与其连接的另一dna,该另一dna序列在天然情况下与之并不连接。一般而言,虽然并非必需,但异源dna可以编码rna或蛋白质,这些rna或蛋白质正常并不由表达它的细胞产生。
87.高表达启动子:本文所用的“高表达启动子”是指,在植物或其部分中引起表达的启动子,其中源自相应启动子控制的核酸分子的rna的积累或合成速率或rna的稳定性,高于、优选显著高于由缺乏本发明的neena的启动子引起的表达。优选地,相对于缺乏本发明的neena的启动子,rna的量和/或rna合成速率和/或rna的稳定性提高50%或更多,例如100%或更多,优选200%或更多,更优选5倍或更多,甚至更优选10倍或更多,最优选20倍或更多,例如50倍。
88.杂交:本文中,术语“杂交”是这样的过程,其中基本互补的核苷酸序列彼此退火。杂交过程可以完全在溶液中进行,即两种互补核酸都在溶液中。在互补核酸之一固定在基质(如磁珠、琼脂糖珠或任何其他树脂)上时也可发生杂交过程。此外,在互补核酸之一固定在固体支持物,如硝化纤维素或尼龙膜上,或通过例如光刻术固定在例如硅质玻璃支持物(称为核酸阵列或微阵列或核酸芯片)上时,也可以发生杂交过程。为了允许杂交发生,核酸分子通常经过热变性或化学变性,以将双链熔解成两条单链和/或从单链核酸中去除发夹
或其他二级结构。
89.术语“严格”指杂交发生的条件。杂交的严格性受温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。一般而言,低严格性条件选择为在确定的离子强度和ph值下低于具体序列的热熔点(tm)约30℃。中等严格性条件是温度低于tm 20℃,而高严格性条件是温度低于tm 10℃。高严格性杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,由于遗传密码的简并性,核酸的序列可以发生变化,并且仍然编码基本相同的多肽。因此,有时可能需要中等严格性杂交条件来鉴定此类核酸分子。
[0090]“tm”是在确定的离子强度和ph值下,50%的靶序列与完全匹配的探针杂交的温度。tm取决于溶液条件以及探针的碱基组成和长度。例如,较长的序列在较高的温度下特异性杂交。在tm以下约16℃至32℃的温度,可获得最大杂交速率。杂交溶液中单价阳离子的存在,可以减少两条核酸链之间的静电排斥,从而促进杂交形成;对于不超过0.4m的钠浓度,这种影响是可见的(对于更高的浓度,这种影响可以忽略)。甲酰胺使dna-dna和dna-rna双链体的熔解温度降低,每个百分比的甲酰胺降低0.6至0.7℃,添加50%甲酰胺可允许杂交在30至45℃进行,但杂交速率会降低。碱基对错配会降低双链体的杂交速率和热稳定性。对于大型探针,平均而言,每%的碱基错配使tm降低约1℃。取决于杂交体的类型,可使用以下方程计算tm:
[0091]
dna-dna杂交体(meinkoth和wahl,anal.biochem.,138:267-284,1984):
[0092]
tm=81.5℃+16.6xlog[na+]a+0.41x%[g/cb]-500x[lc]-1-0.61x%甲酰胺
[0093]
dna-rna或rna-rna杂交体:
[0094]
tm=79.8+18.5(log10[na+]a)+0.58%(g/cb)+11.8%(g/cb)2-820/lc[0095]
寡聚dna或寡聚rnad杂交体:
[0096]
对于《20个核苷酸:tm=2(ln)
[0097]
对于20-35个核苷酸:tm=22+1.46(ln)
[0098]a或对于其他单价阳离子,但仅在0.01

0.4m范围内准确。
[0099]b只有%gc在30%至75%范围内才准确。
[0100]
c l=双链体的碱基对长度。
[0101]
d oligo,寡核苷酸;ln,引物有效长度=2
×
(g/c数量)+(a/t数量)。
[0102]
非特异性结合可以使用许多已知技术中的任何一种来控制,例如,用含蛋白质的溶液封闭膜,向杂交缓冲液中添加异源rna、dna和sds,以及用rnase处理。对于非相关探针,可通过改变以下之一来进行一系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。本领域技术人员知道杂交过程中可以改变并将保持或改变严格性条件的多种参数。
[0103]
除杂交条件外,杂交的特异性通常还取决于杂交后洗涤的函数。为了去除非特异性杂交产生的背景,用稀盐溶液洗涤样品。此类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低,洗涤温度越高,洗涤严格性越高。洗涤条件通常在杂交严格度或以下进行。阳性杂交产生的信号至少是背景信号的两倍。通常,适于核酸杂交测定或基因扩增检测程序的严格条件如上所述。也可以选择更严格或更不严格的条件。本领域技术人员知道洗涤过程中可以改变并将保持或改变严格性条件的多种参数。
[0104]
例如,长度超过50个核苷酸的dna杂交体的典型高严格性杂交条件涵盖,在65℃下
在1x ssc中或在42℃下在1x ssc和50%甲酰胺中进行杂交,然后在65℃在0.3x ssc中进行洗涤。长度超过50个核苷酸的dna杂交体的中等严格性杂交条件的实例涵盖,在50℃下在4x ssc中或在40℃下在6x ssc和50%甲酰胺中进行杂交,然后在50℃下在2x ssc中进行洗涤。杂交体的长度是发生杂交的核酸的预期长度。在已知序列的核酸杂交时,杂交体长度可通过比对序列并鉴定出本文中所述的保守区域来确定。1
×
ssc为0.15m nacl和15mm柠檬酸钠;杂交溶液和洗涤溶液还可包含5x denhardt试剂、0.5-1.0%sds、100μg/ml变性的片段化鲑鱼精子dna、0.5%焦磷酸钠。高严格性条件的另一个实例是,在65℃下在0.1x ssc中杂交,该ssc包含0.1sds和可选的5x denhardt试剂、100μg/ml变性的片段化鲑鱼精子dna、0.5%焦磷酸钠,然后在65℃下在0.3x ssc中洗涤。
[0105]
为了定义严格性水平,可参考sambrook等(2001)molecular cloning:a laboratory manual,第3版,cold spring harbor laboratory press,csh,new york或current protocols in molecular biology,john wiley&sons,n.y.(1989及每年更新)。
[0106]“同一性”:在用于比较两个或更多个核酸或氨基酸分子时,“同一性”意指所述分子的序列具有一定程度的序列相似性,其中序列部分相同。
[0107]
酶变体可通过其与亲本酶相比的序列同一性来定义。序列同一性通常作为“%序列同一性”或“%同一性”提供。为了确定两个氨基酸序列之间的同一性百分比,在第一步中,在这两个序列之间产生成对序列比对,其中两个序列在其全长上比对(即成对全局比对)。可以用执行needleman和wunsch算法(j.mol.biol.(1979)48,443-453页)的程序产生比对,优选通过以程序默认参数(缺口开放=10.0、缺口延伸=0.5和矩阵=eblosum62),使用程序“needle”(欧洲分子生物学开放软件套件(emboss))。为了本发明的目的,优选的比对是可从中确定最高序列同一性的比对。
[0108]
以下实例旨在举例说明两个核苷酸序列,但相同的计算适用于蛋白质序列:
[0109]
seq a:aagatactg长度:9个碱基
[0110]
seq b:gatctga长度:7个碱基
[0111]
因此,较短的序列是序列b。
[0112]
产生显示两个序列在其全长上的成对全局比对,得到:
[0113][0114]
比对中的“|”符号表示相同的残基(dna的碱基或蛋白质的氨基酸)。相同残基数为6。
[0115]
比对中的
“‑”
符号表示缺口。比对在seq b内引入的缺口数为1。比对在seq b的边界处引入的缺口数为2,在seq a的边界处引入的缺口数为1。
[0116]
在其全长上显示所比对的序列,比对的长度为10。
[0117]
按照本发明,产生显示较短序列在其全长上的成对比对,结果得到:
[0118][0119]
按照本发明,产生显示序列a在其全长上的成对比对,结果得到:
[0120][0121]
按照本发明,产生显示序列b在其全长上的成对比对,结果得到:
[0122][0123]
显示较短序列在其全长上的比对长度为8(存在一个缺口,该缺口被包括在该较短序列的比对长度中)。
[0124]
因此,显示seq a在其全长上的比对长度将是9(意味着seq a是本发明的序列)。
[0125]
因此,显示seq b在其全长上的比对长度将是8(意味着序列b是本发明的序列)。
[0126]
在比对两个序列之后,在第二步中,从所产生的比对确定同一性值。为了本发明的目的,通过%同一性=(相同残基/显示本发明的相应序列在其全长上的比对区域的长度)*100来计算百分比同一性。因此,根据本实施方案,通过将相同残基数除以显示本发明的相应序列在其全长上的比对区域的长度,来计算与两个氨基酸序列的比较有关的序列同一性。该值乘以100,得到“%序列同一性”。根据上文提供的实例,%同一性为:对于seq a为本发明序列,(6/9)*100=66.7%;对于seq b为本发明的序列,(6/8)*100=75%。
[0127]
内含子:指基因内的dna区段(间插序列),其不编码该基因产生的蛋白质的部分,并且在从细胞核输出mrna之前从该基因转录的mrna中剪除。内含子序列是指内含子的核酸序列。因此,内含子是dna序列中与编码序列(外显子)一起转录,但在成熟mrna形成过程中被去除的那些区域。内含子可以位于实际编码区内,也在pre-mrna(未剪接mrna)的5'或3'非翻译前导区内。切除初级转录物中的内含子,同时精确连接编码序列以形成成熟的mrna。内含子和外显子的交界形成剪接位点。内含子的序列以gu开头,以ag结尾。此外,在植物中,已描述了au-ac内含子的两个实例:拟南芥reca样蛋白基因的第14个内含子和g5基因的第7个内含子是at-ac内含子。包含内含子的pre-mrna有三个短序列,除了其他序列外,它们对内含子的精确剪接至关重要。这些序列是5’剪接位点、3’剪接位点和分支点。mrna剪接是指去除初级mrna转录物中的间插序列(内含子)并拼装或连接外显子序列。这也称为顺式剪接,它将同一rna上的两个外显子连接起来,同时去除间插序列(内含子)。内含子的功能性元件包含剪接体的特定蛋白质组分识别和结合的序列(例如,内含子末端的剪接共有序列)。这些功能性元件与剪接体的相互作用导致从成熟前mrna去除内含子序列并重新连接外显子序列。内含子有三个短序列,这三个短序列对于内含子的准确剪接是必要的,但不是充分的。这些序列是5'剪接位点、3'剪接位点和分支点。分支点序列在植物的剪接和剪接位点选择中具有重要意义。分支点序列通常位于3'剪接位点上游10-60个核苷酸。
[0128]
同基因的:除可因存在或不存在异源dna序列而不同之外,遗传上相同的生物体(例如植物)。
[0129]
分离的:本文中所用的术语“分离的”意指,材料已被人为移出,并脱离其最初的天然环境而存在,因此不是自然的产物。分离的材料或分子(如dna分子或酶)可以以纯化形式存在,或者可以存在于非天然环境中,例如转基因宿主细胞中。例如,存在于活植物中的天然存在的多核苷酸或多肽不是分离的,但从天然系统中的一些或全部共存物质中分离出来的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和/或此类多核苷酸
或多肽可以是组合物的一部分,并且可以是分离的,因为这种载体或组合物不是其最初的环境的一部分。优选地,在与核酸分子相关使用时,如在“分离的核酸序列”中,术语“分离的”指从其天然来源中通常与之结合的至少一种污染核酸分子中鉴定和分离出的核酸序列。分离的核酸分子可以是这样的核酸分子,所述核酸分子以不同于其在自然界中的形式存在、或在不同于其在自然界中的环境中存在。相比之下,非分离的核酸分子是以其在自然界中的状态存在的核酸分子,如dna和rna。例如,靠近相邻基因的见于宿主细胞染色体上的给定dna序列(例如基因);作为与编码多种蛋白质的许多其他mrna的混合物见于细胞中的rna序列,例如编码特定蛋白质的特定mrna序列。然而,作为实例,包含例如seq id no:16的分离的核酸序列包括这样的核酸序列,所述核酸序列在通常包含seq id no:16的细胞中但不同于天然细胞位于不同的染色体或染色体外位置,或者侧翼为与自然界中所见不同的核酸序列。分离的核酸序列可以以单链或双链形式存在。在用分离的核酸序列来表达蛋白质时,该核酸序列将最少包含至少一部分的有义链或编码链(即核酸序列可以是单链)。备选地,它可以包含有义链和反义链二者(即该核酸序列可以是双链)。
[0130]
最小启动子:在缺乏上游激活的情况下无活性或具有大大降低的启动子活性的启动子元件,尤其是tata元件。在存在合适的转录因子的情况下,该最小启动子发挥作用以允许转录。
[0131]
neena:参见“核酸表达增强性核酸”。
[0132]
非编码:术语“非编码”指,核酸分子序列不编码部分或全部的表达蛋白质。非编码序列包括但不限于内含子、增强子、启动子区域、3'非翻译区和5'非翻译区。
[0133]
核酸表达增强性核酸(neena):术语“核酸表达增强性核酸”指特定序列的序列和/或核酸分子,该序列和/或核酸分子具有增强与neena功能性连接的启动子控制下的核酸表达的固有特性。与启动子序列不同,neena本身不能驱动表达。为了执行增强功能性连接到neena的核酸分子的表达的功能,neena本身必须功能性连接到启动子。与本领域已知的增强子序列不同,neena以顺式而非反式起作用,并且必须位于待表达的核酸的转录起始位点附近。
[0134]
核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在的或合成的或人工的核酸或核苷酸。术语“核酸”和“核苷酸”包括脱氧核糖核苷酸或核糖核苷酸或任何核苷酸类似物,以及其单链或双链、有义或反义形式的聚合物或杂交体。除非另有说明,具体核酸序列也隐含地涵盖其保守修饰的变体(例如简并密码子取代)和互补序列,以及明确指出的序列。术语“核酸”在本文中可与“基因”、“cdna”、“mrna”、“寡核苷酸”和“多核苷酸”互换使用。核苷酸类似物包括在碱基、糖和/或磷酸的化学结构中具有修饰的核苷酸,包括但不限于5位嘧啶修饰、8位嘌呤修饰、胞嘧啶外环胺修饰、5-溴尿嘧啶取代等;以及2’位糖修饰,包括但不限于糖修饰的核糖核苷酸,其中2
’‑
oh替换为选自h、or、r、halo、sh、sr、nh2、nhr、nr2或cn的基团。短发夹rna(shrna)也可以包含非天然元件,如非天然碱基,例如肌苷酸和黄嘌呤,非天然糖,如2'-甲氧基核糖,或非天然磷酸二酯键,例如甲基膦酸酯、硫代磷酸酯和肽。
[0135]
核酸序列:短语“核酸序列”是指从5'-端到3'-端读取的脱氧核糖核酸或核糖核酸碱基的单链或双链聚合物。它包括染色体dna、自我复制质粒、dna或rna的感染性聚合物以及起主要结构作用的dna或rna。“核酸序列”也指,表示核苷酸的缩写、字母、字符或单词的连续列表。在一个实施方案中,核酸可以是“探针”,其是相对较短的核酸,长度通常小于100
个核苷酸。通常,核酸探针的长度从大约50个核苷酸到大约10个核苷酸。核酸的“靶区域”是被鉴定为感兴趣的核酸的一部分。核酸的“编码区”是核酸的一部分,在置于适当的调节序列控制下时,其以序列特异的方式转录和翻译,以产生特定的多肽或蛋白质。该编码区被称作编码该多肽或蛋白质。
[0136]
寡核苷酸:术语“寡核苷酸”指核糖核酸(rna)或脱氧核糖核酸(dna)或其模拟物的寡聚物或聚合物,以及具有类似功能的具有非天然存在部分的寡核苷酸。这种修饰或取代的寡核苷酸常优于天然形式,因为具有期望的性质,例如增强的细胞摄取、增强的对核酸靶标的亲和力、以及在存在核酸酶的情况下提高的稳定性。寡核苷酸优选包括通过连接(例如磷酸二酯)或取代的连接,彼此共价偶联的两个或更多个核苷单体。
[0137]
突出端:“突出端”是指双链寡核苷酸分子的5'-或3'-羟基端上相对较短的单链核苷酸序列(也称为“延伸”、“突出端”或“粘性末端”)。
[0138]
植物:一般理解为意指具有光合作用能力的任何真核单细胞或多细胞生物体或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。本发明包括植物界高等和低等植物的所有属和种。优选一年生、多年生单子叶和双子叶植物。该术语包括成熟植物、种子、芽和幼苗及其衍生部分、繁殖材料(如种子或小孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物,例如细胞培养物,聚群产生功能或结构单元的任何其他类型的植物细胞。成熟植物是指处于幼苗期以外的任何期望发育阶段的植物。幼苗是指处于早期发育阶段的幼小未成熟植物。一年生、二年生单子叶和双子叶植物是用于产生转基因植物的优选宿主生物。此外,基因表达在所有观赏植物、有用或观赏乔木、花卉、切花、灌木或草坪中都是有利的。可以作为实例提到但非限制的植物有被子植物、苔藓植物,例如苔纲(hepaticae)(苔类)和藓纲(musci)(藓类);蕨类植物(pteridophytes),如蕨、马尾和石松;裸子植物,如针叶树、苏铁、银杏和买麻藤;藻类,如绿藻纲(chlorophyceae)、褐藻纲(phaeophyceae)、红藻纲(rhodophyceae)、粘藻纲(myxophyceae)、黄藻纲(xanthophyceae)、硅藻纲(bacillariophyceae)(硅藻)和裸藻纲(euglenophyceae)。优选用于食品或饲料目的的植物,如豆科(leguminosae)植物,如豌豆、苜蓿和大豆;禾本科(gramineae)植物,如水稻、玉米、小麦、大麦、高粱、粟、黑麦、黑小麦或燕麦;伞形科(umbelliferae),尤其是胡萝卜属(daucus),尤其是胡萝卜(carota)(胡萝卜),以及芹属(apium),尤其是graveolens dulce(芹菜)等;茄科(solanaceae)植物,尤其是番茄属(lycopersicon),尤其是esculentum(番茄),以及茄属(solanum)植物,尤其是tuberosum(马铃薯)和melongena(茄子),以及许多其他植物(如烟草);辣椒属(capsicum),尤其是annuum(辣椒)等;豆科,尤其是大豆属(glycine),尤其是大豆、苜蓿、豌豆、紫花苜蓿、菜豆或花生等;十字花科(cruciferae)(芸苔科(brassicacae)),尤其是芸苔属(brassica),尤其是欧洲油菜(油籽油菜)、campestris(甜菜)、oleracea cv tastie(卷心菜)、oleracea cv snowball y(菜花)和oleracea cv emperor(西兰花);拟南芥属(arabidopsis),尤其是拟南芥等;菊科(compositae)植物,尤其是莴苣属(lactuca),尤其是莴苣等;菊科(asteraceae)植物,如向日葵、万寿菊、莴苣或金盏花等;葫芦科(cucurbitaceae),如甜瓜、南瓜或西葫芦和亚麻籽。进一步优选的是棉花、甘蔗、大麻、亚麻、辣椒以及多种乔木、坚果和葡萄物种。
[0139]
多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在本文中可互换使用,指连续氨基酸残基的聚合物或寡聚物。
[0140]
前蛋白:通常靶向细胞器如叶绿体并仍包含其转运肽的蛋白质。
[0141]
初级转录物:本文所用的术语“初级转录物”是指基因的成熟前rna转录物。例如,“初级转录物”仍然包含内含子和/或尚未包含polya尾或帽结构,和/或缺少其作为转录物发挥其正确功能所必需的其他修饰,例如修剪或编辑。
[0142]
启动子:术语“启动子”或“启动子序列”是等同的,如本文中所用,是指在连接到目的核苷酸序列时能够控制目的核苷酸序列转录为rna的dna序列。此类启动子例如可以见于以下公开数据库中:http://www.grassius.org/grasspromdb.html;http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom;http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi。其中列出的启动子可以用本发明的方法来处理,并在此纳入作为参考。启动子位于5’(即上游),靠近受其控制转录为mrna的目的核苷酸序列的转录起始位点,并为rna聚合酶和其他转录因子的特异性结合提供位点以启动转录。启动子包含例如靠近转录起始位点的至少10kb、例如5kb或2kb。它还可以包含靠近转录起始位点的至少1500bp、优选至少1000bp、更优选至少500bp、甚至更优选至少400bp、至少300bp、至少200bp或至少100bp。在另一个优选实施方案中,启动子包含靠近转录起始位点的至少50bp,例如至少25bp。启动子不包含外显子和/或内含子区域或5’非翻译区。例如,启动子对相应植物而言可以是异源的或同源的。如果多核苷酸序列源自外来物种,或者如果来自相同物种但已具有不同于其原始形式的修饰,则该多核苷酸序列对于生物体或第二多核苷酸序列而言是“异源”的。例如,启动子有效连接到异源编码序列是指,编码序列和启动子来自不同于的物种来源,或者,如果来自同一物种,则编码序列并非与该启动子天然连接(例如,遗传改造的编码序列或来自不同生态型或变种的等位基因)。合适的启动子可以源自待在其中进行表达的宿主细胞的基因,或者来自此宿主细胞的病原体(例如植物或病原体,如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。它可以源自植物,但也可以源自植物病原体,或者可以是人为设计的合成启动子。如果启动子是诱导型启动子,那么转录速率响应于诱导剂而增加。此外,启动子可以以组织特异性或组织优选的方式调节,使得它仅在或主要在特定组织类型(例如叶、根或分生组织)中在转录相关编码区时具有活性。应用于启动子的术语“组织特异”是指,该启动子能够指导目的核苷酸序列在特定类型的组织(例如花瓣)中选择性表达,而相同的目的核苷酸序列在不同类型的组织(例如根)中相对缺乏表达。通过例如将报告基因与启动子序列有效连接以产生报告构建体,将报告构建体引入植物基因组中,使得报告构建体整合到所产生的转基因植物的每种组织中,并检测报告基因在转基因植物的不同组织中的表达(例如,检测报告基因编码的mrna、蛋白质或蛋白质的活性),可以评估启动子的组织特异性。检测到一种或多种组织中报告基因的表达水平相对于其他组织中报告基因的表达水平更高,表明该启动子对于检测到更高表达水平的组织而言是特异的。应用于启动子的术语“细胞类型特异”是指,该启动子能够指导目的核苷酸序列选择性地在特定类型的细胞中表达,而相同的目的核苷酸序列在同一组织内不同类型的细胞中相对缺乏表达。在应用于启动子时,术语“细胞类型特异”还指这样的启动子,该启动子能够促进目的核苷酸序列在单个组织内的区域中选择性表达。启动子的细胞类型特异性可使用本领域公知的方法进行评估,例如gus活性染色、gfp蛋白或免疫组织化学染色。在提到启动子或源自启动子的表达时,术语“组成性”意指该启动子能够在没有刺激(例如热休克、化学物质、光等)的情况下,在大多数植物组织和细胞中,在植物或植物部分的基本整个生
命周期中,指导有效连接的核酸分子转录。通常,组成型启动子能够指导转基因在基本上任何细胞和任何组织中表达。
[0143]
启动子特异性:在提到启动子时,术语“特异性”是指相应启动子所赋予的表达模式。特异性描述了这样的组织和/或植物或其部分的发育状态,在所述组织和/或所述发育状态中启动子赋予处于相应启动子控制下的核酸分子的表达。启动子的特异性还可包括环境条件,在该环境条件下,该启动子可激活或下调,如由生物或环境应激(如寒冷、干旱、创伤或感染)诱导或抑制。
[0144]
纯化的:本文所用的术语“纯化的”是指从其自然环境中移出、分离或分开的分子,可以是核酸或氨基酸序列。“基本纯化”的分子至少60%游离,优选至少75%游离,更优选至少90%游离于与之天然结合的其他组分。纯化的核酸序列可以是分离的核酸序列。
[0145]
重组:关于核酸分子的术语“重组”指,通过重组dna技术产生的核酸分子。重组核酸分子也可包含这样的分子,其本身并不存在于自然界中,而是经过人为修饰、改变、突变或以其他方式操作。优选地,“重组核酸分子”是非天然存在的核酸分子,其有至少一个核酸在序列上不同于天然存在的核酸分子。“重组核酸分子”还可包含“重组构建体”,其包含(优选有效连接)以非天然的顺序存在的一系列核酸分子。用于产生该重组核酸分子的优选方法可包括克隆技术、定向或非定向诱变、合成或重组技术。
[0146]
有义:术语“有义”应理解为具有与靶序列互补或相同的序列的核酸分子,例如与蛋白质转录因子结合并参与给定基因表达的序列。根据优选实施方案,该核酸分子包含目的基因和允许表达该目的基因的元件。
[0147]
显著增加或减少:大于测量技术所固有的误差界限的增加或减少,例如,酶活性或基因表达的增加或减少,优选地相对对照酶活性或对照细胞中的表达,增加或减少约2倍或更大,更优选增加或减少约5倍或更大,最优选增加或减少大约10倍或更多。
[0148]
小核酸分子:“小核酸分子”应理解为由核酸或其衍生物(如rna或dna)组成的分子。它们可以是双链或单链,并且在约15到约30bp之间,例如在15到30bp之间,更优选在约19到约26bp之间,例如在19到26bp之间,甚至更优选在约20到约25bp之间,例如在20到25bp之间。在尤其优选的实施方案中,寡核苷酸在约21至约24bp之间,例如在21至24bp之间。在最优选的实施方案中,小核酸分子为约21bp和约24bp,例如21bp和24bp。
[0149]
基本互补:当在本文中用于与参考或靶核苷酸序列相关的核苷酸序列时,在最广泛的意义上,术语“基本互补”意指这样的核苷酸序列,其中,在该基本互补的核苷酸序列和参考或靶核苷酸序列的精确互补序列之间具有至少60%、更期望至少70%、更期望至少80%或85%、优选至少90%、更优选至少93%、更优选至少95%或96%、更优选至少97%或98%、更优选至少99%、或最优选100%(等同于本文中的术语“相同”)的百分比同一性。优选地,在至少19个核苷酸、优选至少50个核苷酸的长度上、更优选在参考序列的核酸序列的全长上(如果未指定的话),评估同一性。基于needleman和wunsch(needleman和wunsch(1970)j mol.biol.48:443-453;如上文所定义)的算法,使用wisconsin大学gcg的gap seqweb应用,使用默认gap分析进行序列比较。与参考核苷酸序列“基本互补”的核苷酸序列在低严格性条件、优选中等严格性条件、最优选高严格性条件(如上文所定义),与参考核苷酸序列杂交。
[0150]
转基因:本文中所用的术语“转基因”指通过实验操作引入细胞基因组的任何核酸
序列。转基因可以是“内源性dna序列”或“异源dna序列”(即“外源dna”)。术语“内源性dna序列”是指这样的核苷酸序列,其天然见于它所引入的细胞中,并且条件是其相对于天然存在的序列不包含修饰(例如点突变、选择标记基因的存在等)。
[0151]
转基因的:在提到生物体时,术语“转基因的”是指用重组dna分子转化,优选稳定转化,其中所述重组dna分子优选包含有效连接到目的dna序列的适宜启动子。
[0152]
载体:本文所用的术语“载体”指能够运输与其连接的另一个核酸分子的核酸分子。一类载体是基因组整合载体,或“整合载体”,其可以整合到宿主细胞的染色体dna中。另一类载体是附加型载体,即能够进行染色体外复制的核酸分子。能够指导与其有效连接的基因表达的载体在本文中称为“表达载体”。在本说明书中,“质粒”和“载体”可互换使用,除非文中另有明确说明。如本文所述设计用于在体外或体内产生rna的表达载体,可以包含由任何rna聚合酶(包括线粒体rna聚合酶、rna pol i、rna pol ii和rna pol iii)识别的序列。根据本发明,这些载体可用于在细胞中转录期望的rna分子。植物转化载体应理解为适用于植物转化过程的载体。
[0153]
野生型:关于生物体、多肽或核酸序列,术语“野生型”、“天然”或“天然来源”是指该生物体是天然存在的,或可在至少一种天然存在的生物体中获得,其未经过改变、突变或以其他方式人为操作。
[0154]
附图简述
[0155]
图1:mpra表达文库的克隆策略。
[0156]
图2:候选增强子对瞬时转化的小麦原生质体中最小camv 35s启动子活性的影响。纵轴显示相对启动子活性。横轴图例显示如下增强子片段编号:a:en5128,b:en3638,c:en2516,d:en2161/2,e:en3233,f:无。利用共同引入的pka63质粒的萤光素酶活性,针对原生质体转染效率的差异,校正gus活性。不含增强子(无)的启动子的活性设为1。
[0157]
图3:候选增强子对瞬时转化的小麦原生质体中小麦t6pp启动子活性的影响。纵轴显示相对启动子活性。横轴图例显示如下增强子片段编号:a:en5128,b:en3638,c:en2516,d:en2161/2,e:almt1,f:无,g:en3233。利用共同引入的pka63质粒的萤光素酶活性,针对原生质体转染效率的差异,校正gus活性。不含增强子(无)的启动子的活性设为1。
[0158]
图4:小麦增强子的方向对瞬时转化的小麦原生质体中小麦t6pp启动子活性的影响。纵轴显示相对启动子活性。横轴显示如下所选增强子的编号和方向:a:en3233,b:en3233反向,c:en5128反向,d:en2516反向,e:无增强子。不含增强子(无)的启动子的活性设为1。
[0159]
图5:小麦增强子的重复对瞬时转化的小麦原生质体中小麦t6pp启动子活性的影响。纵轴显示相对启动子活性。横轴显示所选增强子的编号以及是否有重复,如下:a:en2516,b:en2516重复,c:无增强子,d:en5128,e:en5128重复,f:en3233,g:en3233重复。不含增强子(无)的启动子的活性设为1。
实施例
[0160]
化学品和常用方法
[0161]
除非另有说明,为本发明的目的而进行的克隆流程,包括限制性消化、琼脂糖凝胶电泳、核酸纯化、核酸连接、转化、细菌细胞的选择和培养,均按(sambrook等,1989年)所述
进行。利用sanger技术(sanger等,1977年),使用激光荧光dna测序仪(applied biosystems,foster city,ca,usa)对重组dna进行序列分析。除非另有说明,化学品和试剂均获自sigma-aldrich(sigma aldrich,st.louis,usa)、promega(madison,wi,usa)、duchefa(haarlem,the netherlands)或invitrogen(carlsbad,ca,usa)。限制性内切酶来自new england biolabs(ipswich,ma,usa)或roche diagnostics gmbh(penzberg,germany)。寡核苷酸由eurofins mwg operon(ebersberg,germany)合成。
[0162]
实施例1:从小麦基因组中发现新的候选增强子序列
[0163]
为了鉴定新的小麦增强子序列,从小麦基因组(iwgsc版本1.0 2017)中选择了500个高表达(平均cpm高于500)或中等表达水平(平均cpm介于100和500之间)且在小麦组织间具有低基因表达变异性(变异系数低)的基因。使用tmm法(edger)将基因表达水平归一化。
[0164]
从这500个基因中,基于基因组注释和改进的注释管线,提取了假定的启动子、第一内含子和3'utr(如果在基因组序列中可得)的序列。对于内含子,排除5’10nt和3’20nt。只保留长度至少为144nt的序列。总共保留了1392个序列特征。
[0165]
将这1392个序列在nhei、xbai、kpni、pvui和sfii位点进行了in silico消化。将由此产生的启动子和内含子序列拆分为具有20nt重叠的144nt长片段,但2个最靠3’的片段除外,这2个片段的重叠是这样的,其使得最后一个144nt片段的3'端与原始序列的3'端重合。以相同方式将3’utr序列拆分为重叠的139nt长片段,并将ctagc添加到每个3’utr片段的5’末端,再次得到144nt长的序列片段。整个过程产生了长度为144nt的9919个序列。在列表中添加了10个序列(seq id no 1至10)。这些序列对小麦原生质体中的表达的影响在此前的实验中是已知的。p35s和almt1 3'序列分别使35s最小启动子的表达增加了>10倍和6倍,而λ绝缘子和almt1 5'序列未增加此最小启动子的表达。
[0166]
将由此产生的9929个序列克隆到mpra文库中(melnikov等2014,j.vis.exp.(90),e51719),以筛选具有启动子增强活性的序列。每个序列连接到5个不同的11nt长的唯一条形码(unique barcode)上。这些条形码不包含aataat、aataaa、attta、ttttt、以及nhei、xbai、kpni、pvui和sfii的限制位点,差异为至少2nt,无超过2nt的碱基重复,且不以tc开头。合成了200nt长的寡核苷酸,其包含49645个查询序列-条形码组合之一、以及将文库扩增和克隆到表达载体所需的序列(图1)。在第一个克隆步骤中,使用sfii限制性识别位点,在pbay02101(seq id no 11)的3'pin2上游克隆所扩增的寡核苷酸文库。接下来,在查询序列和条形码之间的kpni和xbai位点克隆包含最小35s启动子、矮牵牛cab22l前导序列、水稻肌动蛋白-1内含子和来自pbay01697的gus编码序列(seq id no 12)的kpn-nhei片段。由此产生的质粒文库包含最小35s启动子上游的查询序列和位于gus基因3'utr中的连接的条形码。对质粒文库中48个克隆的测序显示,其中44个克隆含有预期的查询序列,而4个克隆含有比预期短的插入片段。
[0167]
将所得质粒文库转染到小麦叶肉原生质体中(在100万个原生质体中80μg质粒dna的4个转染)。将转染的原生质体孵育6小时并收集用于rna分离。使用sigma植物rna分离试剂盒,分离总rna。将分离的rna洗脱在130μl总体积中,浓度为0.54μg/μl。使用ambion的turbo dnase试剂盒,在37℃,应用2μl dnase 30分钟,对此rna进行dnase处理。
[0168]
在rna变性步骤(65℃5分钟)之后,使用thermofisher的superscript iii第一链合成试剂盒,使用oligo dt和40μl(=18μg)的总rna,在最终体积100μl中,合成cdna。cdna
合成在50℃下进行50分钟,然后在80℃下进行5分钟。cdna合成之后,使用rnase h在37℃去除rna 20分钟。
[0169]
在下一步中,在hf缓冲液(终体积为60μl)中,使用引物mpra_sfii(seq id no 13)和mpra_r3(seq id no 14)及infusion dna聚合酶,通过pcr扩增包含cdna(15μl rt反应)和质粒文库dna(1ng)的含条形码区域。
[0170]
pcr条件:
[0171]
95℃2分钟
[0172]
98℃30秒、55℃30秒、72℃30秒的25个循环
[0173]
72℃2分钟
[0174]
pcr反应物使用0.8
×
agencourt ampure微球cleanup试剂进行清洁,并洗脱在30μl水中。将适量的pcr产物装载到miseq上进行26bp单读长测序。对于每个样品,获得了超过30mio个读段。根据这些数据,可以推断出转染的原生质体的rna内以及转染的质粒dna文库内每个条形码的频率。rna中条形码的丰度与质粒文库dna中的丰度之比,是衡量连接到特定条形码的测试序列的表达增强活性的指标。由于每个测试序列连接到5个不同的条形码,每个测试序列有5个rna/dna比值。用中值来作为测试序列的增强子活性的量度。采用配对t检验,检验特定序列的表达增加的显著性(p《0.05)。
[0175]
表1:对照序列已知的增强子效应与在mpra表达文库中观察到的rna/dna比值的比较。
[0176]
对照序列已知的增强子活性观察到的rna/dna比值p35s-208至-65》10倍20.05almt1 3’6倍5.31almt1 5’无0.39λ绝缘子无0.106
[0177]
对照序列的结果(见表1)显示,35s增强子和almt1 3'序列的rna/dna比值较高,分别约为20和5,而非功能性almt1 5'和λ绝缘子序列的rna/dna比值远低于1。这表明rna/dna比值与这些控制序列的已知增强子活性一致。
[0178]
表2显示6个查询序列,其具有高于小麦almt1 3'增强子的rna/dna比值,并且不包含以高拷贝数存在于小麦基因组中的序列。这些序列包括来自低分子量谷蛋白(glutenin)亚基基因的启动子的2个高度重叠片段(en2161和en2162),这两个片段仅迁移20个核苷酸,并因此重叠124个核苷酸。
[0179]
实施例2:小麦原生质体中增强子序列的验证
[0180]
表2中列出的前4个序列以及组合的en2161+en2162序列(164nt片段)克隆到质粒pbay01697中最小35s启动子和gus编码序列的上游,以在小麦原生质体中进行验证。将所得到的质粒引入小麦叶肉原生质体中,提取蛋白质,并在过夜孵育原生质体后测定gus活性。为了校正引入效率的差异,将转染的小麦原生质体的gus活性除以来自共同引入的对照载体的萤光素酶活性,该对照载体具有处于玉米泛素启动子(pka63,seq id no 15)控制下的萤火虫萤光素酶基因。小麦原生质体制备和小麦原生质体的peg转染按照shang等(2014,nature protocols 9(10),2395-2410)进行。
[0181]
所得到的数据显示,所有候选增强子有效地增加了自最小35s启动子的表达(图
2)。
[0182]
实施例3:小麦增强子对小麦启动子活性的影响
[0183]
使用7a海藻糖-6-磷酸磷酸酶(t6pp)基因的1-kb启动子片段(wo/2018/113702,seq id no.22),测试了同一组增强子。将增强子片段插入翻译起始密码子上游200nt处,这是在插入almt1b增强子时获得最高表达增加的启动子位置(ep 19173869.9)。所得到的质粒在小麦原生质体中的瞬时表达显示,所有增强子片段都使小麦t6pp启动子的表达增加6到10倍之间,这明显高于almt1b增强子(图3)。
[0184]
实施例4:小麦增强子的方向对小麦启动子活性的影响
[0185]
将三个增强子(en3233,seq id no:19;en2516,seq id no:18;和en5128,seq id no:16)以相反方向插入小麦t6pp基因的启动子。两种增强子都保持功能,即增加自小麦启动子的表达(图4)。
[0186]
实施例5:小麦增强子的重复对小麦启动子活性的影响
[0187]
将三个增强子(en3233,seq id no:19;en5128,seq id no:16;和en2516,seq id no:18)均以重复方式插入小麦t6pp基因启动子,即在一个位置插入两次所述增强子。对于两种增强子,与仅在同一启动子中插入一个增强子相比,重复显著提高了其活性(图5)。
[0188]
实施例6:作图定位增强子序列中的功能性元件的mpra实验
[0189]
合成了mpra文库,其包含所选择的增强子序列(en3233和en5128)及其各自的单nt突变体、以及2个阳性(35s增强子和almt1 3’)和2个阴性(almt1 5’和λ绝缘子片段)对照序列。将每个序列连接19个不同的条形码。将这些序列克隆在质粒文库中,其中增强子序列位于最小35s启动子上游,条形码位于gus基因下游,gus基因处于连接增强子的最小35s启动子控制下。将质粒文库转染到小麦原生质体中,并将表达的rna中条形码的频率与质粒文库中的条形码频率进行比较,以衡量所连接的增强子序列的活性。基于这些结果,从en3233和en5128中选择序列基序。
[0190]
影响en3233增强子活性的基序和其中的突变:
[0191]
两个基序被鉴定为包含对增强子活性最重要的位置:
[0192]-第一基序:caggttcaacgaacgc(seq id no:23),这些核苷酸对应于seq id no:19的79至94位的核苷酸
[0193]-第二基序:gtccaccagcgccagccgcct(seq id no:24),这些核苷酸对应于seq id no:19的106至126位的核苷酸。
[0194]
因此,在seq id no:19的片段包含对应于seq id no:19的79至94位的核苷酸的第一核苷酸基序、对应于seq id no:19的106至126位的核苷酸的第二核苷酸基序、或两个基序时,它是具有功能的。
[0195]
一些突变对增强子活性有负面影响。在第一基序中,通过用a或g核苷酸替换79、88或92位的核苷酸,用t或g核苷酸替换80、85、87或91位的核苷酸,用c或a核苷酸替换81、83或84位的核苷酸,用t或c核苷酸替换82位的核苷酸,用g或c核苷酸替换86或90位的核苷酸,用t或a核苷酸替换89位的核苷酸,用t核苷酸替换93位的核苷酸,或用g核苷酸替换94位的核苷酸,增强子活性与seq id no:19相比降低。在第二基序中,通过用t或c核苷酸替换106、113或114位的核苷酸,用c或g核苷酸替换107、110或119位的核苷酸,用g核苷酸替换108位的核苷酸,用t或a核苷酸替换109、115或116位的核苷酸,用a或g核苷酸替换111、121或125
位的核苷酸,用g或t核苷酸替换112、117、118、122或124位的核苷酸,用任何其他核苷酸(a、t或c)替换120位的核苷酸,用t核苷酸替换123位的核苷酸,或用c核苷酸替换126位的核苷酸,增强子活性与seq id no:19相比降低。
[0196]
然而,一些突变对增强子活性有积极影响。在第一基序中,通过用t核苷酸替换94位的核苷酸,增强子活性与seq id no:19相比增加。在第二基序中,通过用a核苷酸替换106位的核苷酸,用g核苷酸替换109位的核苷酸,或用a核苷酸替换114位的核苷酸,增强子活性与seq id no:19相比增加。
[0197]
影响en5128增强子活性的基序和其中的突变:
[0198]
一个弱基序已经被鉴定为包含对增强子活性最重要的位置:attgg,这些核苷酸对应于seq id no:16的135至139位核苷酸。
[0199]
因此,在seq id no:16的片段包含对应于seq id no:16的135至139位核苷酸的此核苷酸基序时,它是具有功能的。
[0200]
一些突变对增强子活性有负面影响。通过用t核苷酸替换138位的核苷酸,增强子活性与seq id no:16相比降低。
[0201]
一些突变对增强子活性有积极影响。通过用c核苷酸替换138位的核苷酸,增强子活性与seq id no:16相比增加。
[0202]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1