基因表达或活性增强性元件的制作方法_4

文档序号:9756469阅读:来源:国知局
分子的非天然存在的多个拷贝。因此,运些术语 指运样的DNA区段,所述DNA区段相对于该细胞为外来或异源,或相对于该细胞为同源,但处 于宿主细胞核酸内部中通常不存在该元件的位置处。表达外源DNA区段W产生外源多肤。 "同源的DNA分子"是与引入它的宿主细胞天然相关的DNA分子。
[0166] 在例如植物组织、植物器官、植物、种子或植物细胞中待表达的异源核巧酸分子优 选地与一个或多个具有表达增强作用的内含子、肥ENA(W0 2011023537,W0 2011023539)、 5'和或3'非翻译区、转录终止和/或多聚腺巧化信号有效连接。3'-非翻译区域适于稳定 mRNA表达和结构。运可W导致mRNA的存在延长并且因此增强表达水平。终止和多聚腺巧化 信号适于稳定mRNA表达(例如,通过稳定RNA转录物并因而稳定RNA水平似确保恒定的mRNA 转录物长度并防止通读转录。特别地,在多基因表达构建体中运是重要特征。另外,正确终 止转录与转录从调节的5/核巧酸序列再起始,从而产生增强的表达水平相关。上文提到的 信号可W是在植物中有功能的任何信号并且可W例如从植物基因、植物病毒基因或其他植 物病原体分离。然而,在一个优选的实施方案中,3'非翻译区、转录终止信号和多聚腺巧化 信号来自作为本发明启动子的来源使用的基因。
[0167] "祀基因"指复制子上表达所需祀编码序列、功能性RNA或蛋白质的基因。祀基因不 是复制子复制必需的。额外地,祀基因可W包含插入非天然生物中的天然非病毒基因,或嵌 合基因,并且将处于合适的调节序列控制下。因此,祀基因中的调节序列可W来自任何来 源,包括病毒。祀基因可W包括相对于待转化的特定植物的基因为异源或同源的编码序列。 但是,祀基因不包括天然病毒基因。常见的祀基因包括但不限于编码结构蛋白、种子胆藏蛋 白、赋予除草剂抗性的蛋白质和赋予昆虫抗性的蛋白质的基因。由祀基因编码的蛋白质称 作"外来蛋白"。祀基因在植物中的表达一般将产生改变的植物性状。
[0168] "报道基因"是一种特殊的祀基因。意指运类报道基因经常与调节序列连接,原因 在于它们导致轻易鉴定并测量表达它们的生物,或在于它们是选择标记。经常使用报道基 因作为某基因是否已经由细胞或生物摄取或在其中表达的指示。"标记基因"编码待筛选的 可选性状。
[0169] 术语"嵌合基卸'指W下任何基因,所述基因含有
[0170] ?自然界中不功能性连接在一起的DNA序列,包括调节序列和编码序列,或
[0171] ?不天然接合的编码蛋白质部分的序列,或
[0172] .不天然接合的启动子部分。
[0173] 因此,嵌合基因可W包含衍生自不同来源的调节分子和编码序列,或包含调节分 子,和衍生自相同来源、但按照不同于自然界中存在的方式布置的编码序列。
[0174] "嵌合反式作用复制基因"指复制基因,其中复制蛋白质的编码序列处于调节型植 物启动子而非天然病毒复制基因中的启动子控制下,或修饰的天然病毒复制基因,例如,其 中位点特异性序列插入5/转录但不翻译的区域内。运类嵌合基因还包括在启动子和转录起 点位点之间插入已知的复制蛋白质结合位点,所述插入弱化病毒复制蛋白基因的转录。
[017引"复制基因"指编码病毒复制蛋白质的基因。除复制蛋白质的ORF之外,复制基因还 可W含有其他重叠性或非重叠性0RF,如自然界中在病毒序列内存在那样。尽管不是复制必 需的,运些额外的0RF可W增强复制和/或病毒DNA积累。运类额外0RF的例子分别是ACMV和 TGMV双生病毒中的AC3和AL3。
[0176]与本发明的核巧酸序列相对应的例如用于探测或扩增反应中的"寡核巧酸"可W 是约30个或更少核巧酸长度(例如,9、12、15、18、20、21、22、23或24个或者在9和30之间的任 何数目)。通常,特异性引物具有直至14个核巧酸长度。为了最佳特异性和成本有效性,可W 优选16至24个核巧酸长度的引物。本领域技术人员充分熟悉用于多种方法如PCR的引物的 设计。如果需要,可W本文公开的基因的完整限制性片段进行探测,所述完整限制性片段可 W是100个或甚至1000个核巧酸长度。
[0Π 7]"分离"或"纯化"的DNA分子或"分离"或"纯化"的多肤是因人力操作而存在于其天 然环境之外并且因此不是自然产物的DNA分子或多肤。分离的DNA分子或多肤可W纯化的形 式存在或可W存在于非天然环境(例如转基因宿主细胞)中。例如,通过重组技术产生时, "分离的"或"纯化的"核酸分子或蛋白质或其生物活性部分基本上不合其他细胞物质或培 养基,或当化学合成时,基本上不含化学前体或其他化学品。优选地,"分离"的核酸不合在 衍生该核酸的生物的基因组DNA中天然分布于该核酸侧翼的序列(即,位于该核酸的5/端和 3/端处的序列)(优选地是蛋白质编码序列)。例如,在多个实施方案中,分离的多核巧酸可 W含有在衍生该核酸的细胞的基因组DNA中天然分布于该核酸分子旁侧的小于约化b、4kb、 3化、2化、化b、0.5化或0.1化的核巧酸序列。
[017引基本上不含细胞物质的蛋白质包括具有小于约30%、20%、10%、5% (按干重计) 杂质蛋白的蛋白质或多肤制备物。当重组产生本发明的蛋白质或其生物活性部分时,培养 基优选地总计小于约30%、20%、10%、5% (按干重计)的化学前体或非目的蛋白化学品。本 发明的核巧酸序列包括天然存在的序列W及突变(变体)形式。运类变体将继续拥有所需的 活性,即,启动子活性或由非变异核巧酸序列的可读框编码的产物的活性。
[0179]如本文中所用的"表达盒"意指能够指导特定核巧酸序列在适宜宿主细胞中表达 的DNA序列,所述DNA序列包含与目的核巧酸序列有效连接的启动子,其中所述目的核巧酸 序列-任选地-与终止信号和/或其他调节元件有效连接。表达盒还可W包含为正确翻译该 核巧酸序列所要求的序列。编码区通常编码目的蛋白,但也可W按有义或反义方向编码功 能性目的RNA,例如反义RNA或非翻译性RNA。包含目的核巧酸序列的表达盒可W是嵌合的, 运意指该表达盒的组分至少之一相对于该表达盒的其他组分至少之一是异源的。表达盒也 可W是一种表达盒,所述表达盒天然地存在,但已经W用于异源表达的重组形式获得。表达 盒可W完全在胞外装配(例如,通过重组克隆技术)。但是,表达盒也可W部分地使用内源组 件装配。例如,可W通过在内源序列上游安置(或插入)启动子序列获得表达盒,所述内源序 列因而变成功能性连接的并受所述启动子序列控制。同样地,待表达的核酸序列可W安置 (或插入)于内源启动子序列下游,因而形成表达盒。该表达盒中核巧酸序列的表达可W处 于组成型启动子或仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子 的控制下。在多细胞生物的情况下,该启动子也可W是针对特定组织或器官或发育阶段特 异的。在一个优选实施方案中,运类表达盒将包含与目的核巧酸序列连接的本发明转录起 始区。运种表达盒优选地提供有多个用于插入待在调节区转录性调控下的目的基因序列的 限制性位点。该表达盒可W额外地含有选择标记基因。该表达盒按5/ -3/转录方向包含在植 物中有功能的转录及翻译起始区、目的DNA序列和转录及翻译终止区。终止区可W相对于转 录起始区是天然的,可W相对于目的DNA序列是天然的,或可W衍生自另一个来源。便利的 终止区从根瘤农杆菌(A.tumefaciens)的Ti质粒可获得,如章鱼碱合酶和姻脂碱合酶终止 区和下文描述的其他终止区(还参见,Guerineau 1991;P;rou壯oot 1991;Sanfacon 1991; Mogen 1990;Munroe 1990;Ballas 1989;Joshi 1987)〇
[0180] "载体"定义成尤其包括双链或单链线型或环状形式的任何质粒、粘粒、隧菌体或 农杆菌双元载体,它们可W或可W不自我转移或自我移动,并且可W通过整合入细胞基因 组中转化原核或真核宿主或按染色体外方式存在(例如具有复制起点的自主复制型质粒)。
[0181] 特别地包括穿梭载体,意指天然或通过设计而能够在两个不同宿主生物中复制的 DNA载体,所述宿主生物可W选自放线菌属(Actinomycetes)和相关的物种、细菌和真核生 物(例如高等植物细胞、哺乳动物细胞、酵母细胞或真菌细胞)。
[0182] 优选地,载体中的核酸处在用于宿主细胞如微生物细胞(例如细菌细胞)或植物细 胞中转录的适宜启动子或其他调节元件控制下并与之有效连接。载体可W是在多种宿主中 发挥作用的双功能表达载体。在基因组DNA的情况下,运种载体可W含有其自身启动子或其 他调节元件,并且在cDNA情况下,运种载体可W处在用于宿主细胞中表达的适宜启动子或 其他调节元件控制下。
[0183] "有效连接的"或"功能连接的"优选地指多个核酸分子在单一核酸片段上如此接 合,从而一个核酸分子的功能受其他核酸分子影响。例如,如果调节性DNA分子和编码RNA或 多肤的DNA分子处于如此位置,从而调节性DNA分子影响编码性DNA分子表达(即,编码序列 或功能性RNA处于启动子转录性控制下),则称调节性DNA分子与编码RNA或多肤的DNA分子 "有效连接"或"与之接合"。编码序列可W按有义或反义取向有效地与调节性分子连接。
[0184] "克隆载体"一般含有一个或少数限制性核酸内切酶识别位点W及适用于鉴定和 选择用克隆载体转化的细胞的标记基因,其中可W在所述识别位点在载体的必需生物学功 能不丧失的情况下按确定性方式插入外来DNA序列。标记基因通常包括提供四环素抗性、潮 霉素抗性或氨节青霉素抗性的基因。
[0185] 术语"转化"指核酸片段转移至宿主细胞的基因组中,产生遗传稳定的遗传。含有 转化的核酸片段的宿主细胞称作"转基因细胞",并且包含转基因细胞的生物称作"转基因 生物"。转化植物和植物细胞的方法例子包括农杆菌介导的转化技术(De Blaere 1987)和 粒子轰击技术化S 4,945,050)。可W通过技术人员熟知的方法从转基因细胞再生完整植株 (参见,例如,化omm 1990)。
[0186] "转化的"、"转基因的"和"重组的"指已经向其中导入异源核酸分子的宿主生物如 细菌或植物。核酸分子可W通过本领域公知及公开的方法稳定整合至基因组中(Sambrook 1989 ;Innis 1995 ;Gelfand 1995; Innis和Gelfand 1999)。已知的PCR方法包括但不限于使 用配对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分 错配引物等的方法。例如,"转化的"、"转化体"和"转基因脚'植物或愈伤组织已经历经转化 过程并且含有整合至其染色体中的外来基因。术语"未转化的"指未经历转化过程的正常植 物。
[0187] "瞬时转化的"指其中已经引入转基因和外来DNA(例如,通过运类方法如农杆菌介 导转化法或生物射弹轰击法),但是尚未针对稳定维持而选择的细胞。"稳定转化的"指转化 后已经在选择培养基上选择并再生的细胞。
[0188] "遗传稳定的"和"可遗传的"指染色体整合的遗传元件,所述遗传元件在植物中稳 定维持并且由后代经过连续世代稳定遗传。
[0189] "染色体整合的"指外来基因或DNA构建体通过共价键整合入宿主DNA中。在基因不 "染色体整合"的情况下,它们可W是"瞬时表达的"。基因瞬时表达指基因的表达,所述基因 未整合至宿主染色体中,但独立地发挥功能,例如作为自主复制型质粒或表达盒的部分或 作为另一个生物系统(如病毒)的部分独立发挥功能。"瞬时表达"指在通过病毒性感染或通 过运类方法如农杆菌介导转化法、电穿孔法或生物射弹轰击引入病毒或转基因,但尚未针 对稳定维持而选择的细胞中的表达。
[0190] "过量表达"指转基因细胞或转基因生物中的表达水平,所述表达水平超过正常细 胞或生物或未转化(非转基因)的细胞或生物中的表达水平。
[0191] "信号肤"指多肤的氨基端延长部分,所述延长部分与多肤一起翻译形成前体肤, 并且是前体肤进入分泌途径必需的。术语"信号序列"指编码信号肤的核巧酸序列。如本文 所用的"转运肤"指已表达多肤的部分(优选地指多肤的氨基端延长部分),所述部分与多肤 一起翻译形成前体肤,并且是前体肤进入细胞器(如质体(例如,叶绿体)或线粒体)必需的。 术语"转运序列"指编码转运肤的核巧酸序列。
[0192] 如果与在参考分子启动转录的相同组织中启动转录,则将转录调节性核巧酸分子 的活性视为等同。优选地使用与所述转录调节性核巧酸序列有效连接的报道基因展示运类 表达谱。在运种情况下,优选的报道基因 (Schenborn 1999)是绿色巧光蛋白(GFP)(化ui 1996;Leffel 1997)、氯霉素转移酶、蛋光素酶(Millarl992)、i3-葡糖醒酸糖巧酶或β-半乳 糖巧酶。特别优选的是0-葡糖醒酸糖巧酶(Jefferson 1987)。
[0193] 除此之外,转录调节性核巧酸分子的功能等同性同源物或片段的转录调节活性可 W较其亲本序列的活性发生变动,特别就表达水平而言。表达水平可W高于或低于亲本序 列的表达水平。取决于待表达的目的核酸序列,两种偏离可能均是有利的。优选运类功能性 等同序列,所述功能性等同序列-与其亲本序列相比-与所述亲本序列的表达水平不偏离多 于50 %、优选地25 %、更优选地10 % (如优选地通过mRNA表达或蛋白质(例如,报道基因)表 达判定)。另外优选运些等同序列,与其亲本序列相比,所述等同序列显示表达增加,优选地 增加至少50%、更优选地至少100%、最优选地至少500%。
[0194] 当谈及多核巧酸片段或同源物使用时,"基本上相同的活性"或"相同活性"意指该 片段或同源物具有全长多核巧酸的至少90%或更大,例如91%、92%、93%、94%、95%、 96%、97%、98%、直到至少99%的表达调节活性。
[0195] "显著增加"是运样的增加,其大于测量技术固有的误差幅度,优选地是约2倍或更 多的增加。
[0196] 措辞"植物"指任何植物,尤其指农艺有用植物(例如,种子植物),并且"植物细胞' 是该植物的结构单元和生理单元,其包含细胞壁,但还可W指原生质体。植物细胞可W处于 分离的单个细胞或培养的细胞形式或作为高级组织化单元(例如植物组织、分化成在植物 发育的任何阶段存在的结构的植物器官)的部分。运类结构物包括一种或多种植物器官,所 述植物器官包括但不限于果实、苗、茎、叶、花瓣等。优选地,术语"植物"包括完整植株、苗营 养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如巷片、專片、花瓣、雄蕊、屯、皮、 花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如维管组织、基 本组织等)和细胞(例如防卫细胞、卵细胞、毛状体等)及其后代。可W在本发明方法中使用 的植物类别通常广至转化技术可处理的高等植物和低等植物,包括被子植物(单子叶和双 子叶植物)、裸子植物、藤类植物和多细胞藻类。它包括许多倍性水平的植物,包括异倍体、 多倍体、二倍体、单倍体和半合子。在本发明范围中包括植物界的全部属和物种的高等和低 等植物。还包括成熟植物、种子、芽和巧苗和部分、繁殖材料(例如种子和果实)和衍生自它 们的培养物,例如细胞培养物。优选W下植物科的植物和植物材料:宽科(Amaranthaceae)、 芸苔科(8^3 3;[。日。6日6)、石竹科(〔日巧0911711日。6日6)、襲科(016]1〇9〇(11日。6日6)、菊科 (Compositae)、葫芦科(Qicurbitaceae)、唇形科(Xabia1:ae)、豆科(Xeguminosae)、蝶形花 亚科(Papilionoideae)、百合科(Xinaceae)、锦葵科(Malvaceae)、菩薇科(Rosaceae)、虎耳 草科(Saxifragaceae)、玄参科(Scrophulariaceae)、茄科(Solanacea)、番杏科 (Tetragoniaceae)。一年生、多年生、单子叶和双子叶植物是产生转基因植物的优选宿主生 物。使用本发明的重组系统和方法还在全部观赏植物、林业用树、果树或观赏树、花、切花、 灌木或草坪草中有利。所述植物可W包括但不限于苔薛植物例如猜耳细辛属化epaticae) (猜耳细辛化epaticas))和薛纲(Musci)(薛类植物);藤类植物如藤类、木贼类和石松类;裸 子植物如松柏类、苏铁类、银杏(ginkgo)和买麻藤科(Gnetaeae)植物;藻类如绿藻纲 (Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲 (Myxo地yceae)、黄藻纲(Xanthophyceae)、娃藻纲(Bacillariophyceae)(娃藻类)和裸藻纲 化uglenophyceae)。用于本发明目的植物可W包含如下科的植物:菩薇科如玫瑰、杜酷花科 化;ricaceae)如杜酷花(;rhododen化on)和印度杜酷花(azaleas)、大戟科化uphorbiaceae) 如一品红(9〇:1113日1:1:1日3)和己豆(沈〇1:〇]1)、石竹科(〔日巧0地711日。日日日)如石竹类、茄科如牵 牛花(petunias)、苦宦苔科(Gesneriaceae)如非洲紫宦苔(African violet)、凤仙花科 (Balsaminaceae)如凤仙花(touch-me-not )、兰科(Orchidaceae)如兰花(orchids )、尊尾科 (Iridaceae)如唐富蒲(gladioli)、尊尾花(iris)、小苍兰(freesia)和番红花(;沈〇(3113)、菊 科如万寿菊、彼牛儿苗科(Geraniaceae )如老鹤草、百合科化i 1 iaceae)如龙血树属 (Drachaena)、桑科(Moraceae)如格树、天南星科(Araceae)如黄葉(philoden化on)和众多 其他植物。本发明转基因植物尤其从双子叶作物植物当中进一步选择,例如,选自豆科 (Leguminosae)如魏豆、首猜和大豆;伞形科(Umbelliferae)、特别是胡萝h属(Daucus)(更 特别是物种胡萝Kcarota))和芹属(Apium)(更特别是物种旱芹(graveolens var .dulce (celery)))及多种其它植物;茄科(Solanaceae),特别是番茄属(Xycopersicon),更特别是 物种番茄(tomato)和茄属(Solanum),更特别是物种马铃馨(tomato)和茄子(aubergine)、 烟草(tobacCO)及多种其它植物;辣椒属(CapS i cum)、更特别是物种辣椒(CapS icum annum (口邱9日1'))物种及多种其它植物;豆科化日旨11111;[]1〇3日日),特别是大豆属(617(^]1日),更特别是 物种大豆(soybean )及多种其它植物;和十字花科(Cruci ferae ),特别是芸苔属 (I3rassica),更特别是物种欧洲油菜(oilseed rape)、芸苔(beet)、甘蓝(Brassica oleracea cv Tastie(卷屯、菜))、花挪菜(Brassica oleracea cv Snowball W花挪菜))和 花茎甘蓝(oleracea cv EmperoHbroccoli));和拟南芥属(Arabidopsis),更特别是物种 拟南芥及多种其它植物;菊科(Compositae),特别是窝宦属化actuca),更特别是物种窝宦 (lettuce)及多种其它植物。本发明的转基因植物可W选自单子叶作物植物例如禾谷类如 小麦、大麦、高梁和谷子、黑麦、黑小麦、玉米、稻或燕麦和甘薦。还优选树,例如苹果树、梨 树、木瓜树(quince)、李树、樓桃树、桃树、油桃树(nec化rine)、杏树、番木瓜树(papaya)、芒 果树和其他木本物种,包括针叶树和落叶树,如杨树(pop 1 ar)、松(Pine)、红杉(sequoia)、 雪松(。日(1日1')、橡树(〇日1〇等。特别优选的是拟南芥(4'日131(1〇9313 1:11日11日]1日)、普通烟草 (Nicotiana tabacum)、油巧油菜、大豆、玉米(玉蜀泰(maize))、小麦、亚麻化inum us it a tissimum)(亚麻(linseed)和亚麻(flax))、亚麻莽(Camel ina sativa)、芥菜 (Brassica化ncea)、马铃馨和万寿菊。本文中,欧洲油菜(Brassica napus)按照与油巧油 菜和卡诺拉油菜同义的方式使用。
[0197] "植物组织"包括分化和未分化的组织或植物,包括但不限于根、茎、苗、叶、花粉、 种子、肿瘤组织和多种形式的细胞及培养物如单细胞、原生质体、胚和愈伤组织。植物组织 可W处于植物中或处于器官、组织或细胞培养物中。
[0198] "成熟种子"是已经充分发育并且已成功地经历其全部发育阶段的种子。如果提供 必需的物理条件,运种种子可W萌发成巧苗。所收获的通常是成熟种子。
[0199] 术语"改变的植物性状"意指转基因植物中相对于野生型或非转基因植物宿主的 任何表型变化或基因型变化。
[0200] "转基因植物"是具有一个或多个含有表达载体或重组表达构建体的植物细胞的 植物。
[0201 ]"原代转化体"和"TO世代"指遗传世代与起初转化的组织相同的(即,自从转化后 尚未经历减数分裂和受精的)转基因植物。
[0202]"次级转化体"和"Τ1、Τ2、Τ3等世代"指通过一个或多个减数分裂循环和受精循环 从原代转化体衍生的转基因植物。它们可W通过原代或次级转化体的自我受精或原代或次 级转化体与其他转化或未转化的植物的杂交衍生。
[020;3]术语"变体"或"同源物'相对于某序列(例如,多肤或核酸序列如-例如-本发明的 转录调节性核巧酸分子)而言意图指基本上相似的序列。对于包含可读框的核巧酸序列,变 体包括因为遗传密码的简并性而编码与天然蛋白相同的氨基酸序列的那些序列。可W使用 熟知的分子生物学技术鉴定天然存在的等位基因变体(如运些变体),例如用聚合酶链反应 (PCR)和杂交技术。变体核巧酸序列也包括合成衍生的核巧酸序列,如通过例如使用位点定 向诱变法产生的那些核巧酸序列,并且对于可读框而言,编码天然蛋白,W及编码相对于天 然蛋白而言具有氨基酸置换的多肤的那些核巧酸序列。通常,本发明的核巧酸序列变体将 与天然(野生型或内源)核巧酸序列具有至少40%、50%、60%至70%、例如,优选地71 %、 72%、73%、74%、75%、7
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1