控制基因在玉米籽粒中特异表达的启动子及其获得方法和应用

文档序号:10607509阅读:669来源:国知局
控制基因在玉米籽粒中特异表达的启动子及其获得方法和应用
【专利摘要】本发明提供了一种控制基因在玉米籽粒中特异表达的启动子,所述启动子控制基因在玉米籽粒中特异表达,所述启动子的核苷酸序列如SEQ ID NO:1所示。还提供了一种控制基因在玉米籽粒中特异表达的启动子的获得方法,以及控制基因在玉米籽粒中特异表达的启动子或根据控制基因在玉米籽粒中特异表达的启动子的获得方法获得的控制基因在玉米籽粒中特异表达的启动子在控制基因在玉米籽粒中特异表达中的应用。本发明的控制基因在玉米籽粒中特异表达的启动子能够控制基因在玉米籽粒中特异表达,为研究基因在玉米籽粒中的特异表达情况奠定良好的基础,促进玉米籽粒中基因表达研究的进展,适于大规模推广应用。
【专利说明】
控制基因在玉米籽粒中特异表达的启动子及其获得方法和 应用
技术领域
[0001]本发明涉及分子遗传学技术领域,更具体地,涉及控制基因特异表达的启动子技 术领域,特别是指一种控制基因在玉米籽粒中特异表达的启动子及其获得方法和应用。
【背景技术】
[0002]基因表达(gene expression)是指细胞在生命过程中,把储存在脱氧核糖核酸 (DNA)序列中的遗传信息经过转录和翻译,转变成具有生物活性的蛋白质分子。该过程决定 了细胞的分化及形态的发生。每个基因转录产生信使核糖核酸(mRNA)的量,受到多种因素 的调控,最终影响个体的生长发育、形态结构及生物学功能。基因调控是现代分子生物学研 究的中心课题之一。
[0003] 启动子(Promoters)是RNA聚合酶特异性识别和结合的DNA序列,控制基因表达(转 录)的起始时间和表达的程度,就像"开关"一样决定基因的活动。根据转录模式及功能,启 动子可分为三类:组成型启动子、组织或器官特异性启动子和诱导型启动子。目前,在植物 基因工程中使用的大多数为组成型启动子,在所有组织或器官中都起作用,使得外源基因 在植物的所有组织或器官中都表达。这类启动子不能控制基因的专化性表达,并且过度消 耗细胞内的物质和能量,造成不必要的能源浪费。
[0004] 玉米作为我国第一大作物,是不可或缺的重要粮食及饲料来源,对其产量的研究 一直是重中之重。玉米籽粒是决定产量的关键因素,玉米籽粒中基因的表达模式决定了各 个籽粒性状并影响到最终产量。已经有越来越多的研究人员通过转基因或其他手段分析基 因在玉米籽粒中的特异表达情况。但由于缺乏能够控制基因在玉米籽粒中特异表达的启动 子,严重影响了玉米籽粒中基因表达研究的进展。
[0005 ]因此,需要提供一种控制基因在玉米籽粒中特异表达的启动子,从而能够控制基 因在玉米籽粒中特异表达,为研究基因在玉米籽粒中的特异表达情况奠定良好的基础,促 进玉米籽粒中基因表达研究的进展。

【发明内容】

[0006] 为了克服上述现有技术中的缺点,本发明的一个目的在于提供一种控制基因在玉 米籽粒中特异表达的启动子,其能够控制基因在玉米籽粒中特异表达,为研究基因在玉米 籽粒中的特异表达情况奠定良好的基础,促进玉米籽粒中基因表达研究的进展,适于大规 模推广应用。
[0007] 本发明的另一目的在于提供一种控制基因在玉米籽粒中特异表达的启动子的获 得方法,通过该方法能够获得控制基因在玉米籽粒中特异表达的启动子,而且操作简单方 便,适于大规模推广应用。
[0008] 本发明的另一目的在于提供一种控制基因在玉米籽粒中特异表达的启动子的应 用,从而控制基因在玉米籽粒中特异表达,为研究基因在玉米籽粒中的特异表达情况奠定 良好的基础,促进玉米籽粒中基因表达研究的进展,适于大规模推广应用。
[0009] 为达到以上目的,在本发明的第一方面,提供了一种控制基因在玉米籽粒中特异 表达的启动子,其特点是,所述启动子控制基因在玉米籽粒中特异表达,所述启动子的核苷 酸序列如SEQ ID N0:1所示。
[0010] 上述基因既包括所述玉米籽粒中原本存在的基因,也包括外源基因。
[0011] 在本发明的第二方面,提供了一种控制基因在玉米籽粒中特异表达的启动子的获 得方法,其特点是,所述获得方法包括以下步骤:
[0012] (1)选择至少2个高通量转录组测序数据库,所述高通量转录组测序数据库采用在 不同发育时期的玉米不同组织进行构建,所述不同组织包括玉米籽粒,将所述高通量转录 组测序数据库中的RNA序列锚定到玉米自交系B73V2版参考基因组上,获得在所述玉米自交 系B73V2版参考基因组中具有单一锚定位点的待选RNA序列,根据所述待选RNA序列获得其 锚定的所述玉米自交系B73V2版参考基因组中的待选基因;
[0013] (2)计算各所述待选基因的各转录本的FPKM值,计算所述转录本在所述不同组织 中表达的表达特异性SPM值,筛选在所述至少2个高通量转录组测序数据库中在所述玉米籽 粒中所述表达特异性SPM值均达到最高5%且大于0.9、在所述不同组织的除所述玉米籽粒 以外的其它组织中所述FPKM值小于20的候选转录本,获得所述候选转录本对应的候选基 因;
[0014] (3)选取其中一个所述候选基因作为目标基因,根据所述玉米自交系B73V2版参考 基因组的序列信息,利用生物信息学方法定位所述目标基因并预测所述目标基因的结构;
[0015] (4)获取所述目标基因的起始密码子的上游序列并利用生物信息学方法预测所述 目标基因的启动子,所述启动子即为所述的控制基因在玉米籽粒中特异表达的启动子。
[0016] 高通量测序数据库是指采用高通量测序技术例如Illumina/Solexa技术、Roche/ LS454技术、ABI/S0LID技术以及HELI⑶S单分子测序技术测量得到的基因组和转录组高通 量数据。例如NCBI(美国国立生物技术信息中心)的SRA(Sequen Ce Read Achive)数据库用 于存储、显示、提取和分析高通量测序数据。高通量转录组测序数据库是在转录组水平上进 行的高通量测序。
[0017] "所述高通量转录组测序数据库采用在不同发育时期的玉米不同组织进行构建" 意思是采用玉米的多个不同组织,且在多个不同发育时期分别采集玉米的多个不同组织, 然后对其转录组进行高通量测序来进行构建。
[0018] 所述高通量转录组测序数据库的数目可以根据需要确定,较佳地,所述高通量转 录组测序数据库的数目为3个。
[0019] 所述高通量转录组测序数据库可以是任何的高通量转录组测序数据库,只要其采 用在不同发育时期的玉米的不同组织进行构建即可,较佳地,所述高通量转录组测序数据 库分别为NCBI的SRP006463数据库、SRP010680数据库和SRP014652数据库。
[0020] 所述玉米不同组织可以采用任何合适的组织,较佳地,所述玉米不同组织还包括 选自根、叶、穗轴、穗丝和花药中的至少一种。
[0021] 所述不同发育时期可以是任何合适的发育时期,较佳地,所述不同发育时期包括 抽穗期和灌浆期。
[0022] 为了减少结合特异性太低导致的繁重的运算量,较佳地,在所述锚定之前,将长度 小于20bp的所述RNA序列去掉。当然,这个具体长度可以根据需要确定,例如可以将长度小 于25bp的所述RNA序列去掉,或是将长度小于15bp的所述RNA序列去掉。
[0023]为了减少背景干扰,较佳地,在计算所述SPM值之前,将所述FPKM值小于10的所述 转录本去掉。当然,这个具体所述FPKM值可以根据需要确定,例如所述FPKM值小于15的所述 转录本去掉,或是所述FPKM值小于5的所述转录本去掉。
[0024]所述目标基因可以是任何合适的候选基因,只要其在所述至少2个高通量转录组 测序数据库中均出现即可,较佳地,所述目标基因为GRMZM2G044625基因。
[0025]在本发明的第三方面,提供了上述的控制基因在玉米籽粒中特异表达的启动子或 根据上述的控制基因在玉米籽粒中特异表达的启动子的获得方法获得的控制基因在玉米 籽粒中特异表达的启动子在控制基因在玉米籽粒中特异表达中的应用。
[0026]本发明的有益效果在于:
[0027] a.本发明的控制基因在玉米籽粒中特异表达的启动子控制基因在玉米籽粒中特 异表达,其核苷酸序列如SEQ ID N0:1所示,因此,采用该启动子能够控制基因在玉米籽粒 中特异表达,为研究基因在玉米籽粒中的特异表达情况奠定良好的基础,促进玉米籽粒中 基因表达研究的进展,适于大规模推广应用。
[0028] b.本发明的控制基因在玉米籽粒中特异表达的启动子的获得方法通过选择至少2 个高通量转录组测序数据库,获得在玉米自交系B73V2版参考基因组中具有单一锚定位点 的待选RNA序列,进而获得其对应的待选基因;计算各待选基因的各转录本的FPKM值和在不 同组织中表达的表达特异性SPM值,筛选在至少2个高通量转录组测序数据库中在玉米籽粒 中表达特异性SPM值均达到最高5%且大于0.9、在不同组织的除玉米籽粒以外的其它组织 中FPKM值小于20的候选转录本,获得候选转录本对应的候选基因;选取其中一个候选基因 作为目标基因,根据玉米自交系B73V2版参考基因组的序列信息,利用生物信息学方法定位 目标基因并预测其结构;获取目标基因的起始密码子的上游序列并利用生物信息学方法预 测目标基因的启动子,得到控制基因在玉米籽粒中特异表达的启动子,因此,通过该方法能 够获得控制基因在玉米籽粒中特异表达的启动子,而且操作简单方便,适于大规模推广应 用。
[0029] c .本发明的控制基因在玉米籽粒中特异表达的启动子或根据上述的控制基因在 玉米籽粒中特异表达的启动子的获得方法获得的控制基因在玉米籽粒中特异表达的启动 子在控制基因在玉米籽粒中特异表达中的应用,使得控制基因在玉米籽粒中特异表达成为 可能,为研究基因在玉米籽粒中的特异表达情况奠定良好的基础,促进玉米籽粒中基因表 达研究的进展,适于大规模推广应用。
[0030] 本发明的这些和其它目的、特点和优势,通过下述的详细说明,附图和权利要求得 以充分体现,并可通过所附权利要求中特地指出的手段、装置和它们的组合得以实现。
【附图说明】
[0031] 图1是采用本发明的控制基因在玉米籽粒中特异表达的启动子融合红色荧光蛋白 质(RFP)基因转基因玉米获得的转基因玉米的玉米籽粒的照片,其中RFP基因得到表达的玉 米籽粒呈红色(见箭头所示)。
[0032]图2是图1的玉米籽粒中荧光所在位置(见箭头所示)的照片。
[0033]图3是使用共聚焦显微镜观测图1的玉米籽粒从而观测到的红色荧光(见箭头所 示)的照片。
【具体实施方式】
[0034]本发明的控制基因在玉米籽粒中特异表达的启动子可以控制基因在玉米籽粒中 特异表达,所述启动子的核苷酸序列如SEQ ID NO: 1所示。
[0035]该启动子可以通过以下方法获得:
[0036] (1)选择多个源于玉米不同组织、不同发育时期构建的高通量转录组测序(RNA- seq)数据库,利用SolexaQA软件将RNA-seq的数据进行过滤,除去长度低于20bp的序列,以 避免结合特异性太低。利用Bowtie软件将得到的序列锚定到玉米自交系B73V2版参考基因 组上,当一个序列能够锚定到基因组上的不同位点,则除去该序列,只选择在基因组中有单 一位点的序列,称为待选RNA序列,进而获得其对应的待选基因;
[0037] (2)使用Cuff links软件计算各待选基因的各转录本的FPKM值(fragments per kilobase of transcript per million mapped reads),去掉FPKM小于 10的转录本,余下 的转录本用于后续分析,计算转录本在不同组织中表达的表达特异性SPM值(表达特异性系 数),筛选在上述多个高通量转录组测序数据库中在所述玉米籽粒中表达特异性SPM值均达 到最高5%且大于0.9、在所述不同组织的除所述玉米籽粒以外的其它组织中所述FPKM值小 于20的转录本,称为候选转录本,进而获得对应的候选基因;
[0038] (3)选取其中一个候选基因作为目标基因,利用玉米品种B73的V2版基因组序列信 息,利用生物信息学方法定位该目标基因并预测其结构。
[0039] (4)搜索该目标基因的起始密码子ATG的上游序列,使用TSSP软件预测其启动子。
[0040] (5)克隆其启动子序列,与红色荧光蛋白质(RFP)融合。转入玉米品种中,检测该整 合蛋白在转基因植株中的表达情况。
[0041]为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
[0042] 实施例1:
[0043] 从玉米RNA-seq数据库(http: //trace .ncbi .nlm.nih. gov/Traces/sra/sra. cgi? study = SRP006463;http://trace .ncbi.nlm.nih.gov/Traces/sra/sra.cgi?study = SRP010680;http://trace.ncbi.nl m.nih·gov/Traces/sra/sra.cgi?study = SRP014652) 中下载不同组织(根、叶、穗轴、穗丝、花药和籽粒)、不同发育时期(抽穗期、灌浆期)测得的 RNA-seq 数据。
[0044] 首先使用 SolexaQA (Cox,Μ·Ρ·,Peters on, D.A.&Biggs,P.J. SolexaQA: A t_a_ glance quality assessment of Illumina second-generation sequencing data.BMC bioinformatics 11,485(2010))对原始数据进行过滤,除去质量比较差的数据,只留下长 度超过20bp的序列。
[0045] 通过 Bowtie2v2 · 1 · 0(Langmead B et al · Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.Genome Biol 2009,10:R25) 将上述序列锚定到玉米参考基因组B73v2 (http : //www · maizegdb · org/data_center/ sequence)的序列上。当一个序列能够锚定到基因组上的不同位点,则除去该序列,只选择 在基因组中有单一位点的序列,称为待选RNA序列,进而获得对应的待选基因。
[0046]然后利用Cuffl inks(v2 · 1 · 1) (Trapnell,C · et al · Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation.Nature biotechnology 2010,28,511-515)计 算各候选基因的各转录本的FPKM值(fragments per kilobase of transcript per million mapped reads)来反映各候选基因的表达水平。去掉FPKM值小于10的转录本,余下 的转录本用于后续分析。
[0047]计算各转录本在不同组织中表达的表达特异性SPM值(表达特异性系数)(Xiao S-J et al.TiSGeD:a database for tissue-specific genes Bioinformatics 2010 26: 1273-1275),SPM值(0~1)越大表明转录本在该组织中表达的特异性越强。筛选不同数据库 中在籽粒中的SPM值都达到前5 %且大于0.9,而且在其它组织中的表达量FPKM值小于20的 转录本,称为候选转录本,进而获得对应的候选基因。发现其中一个候选基因 GRMZM2G044625基因在三个不同RNA-seq数据库中的表达特异性都达到发明人期望的标准 (请参见表1和表2),且在三个不同1^^- 8叫数据库中在籽粒中的5?1值都达到前5%。该基因 在玉米籽粒中特异表达,可能是由其启动子调控的。
[0048] 表1籽粒特异性表达基因 GRMZM2G044625在三个不同数据库中不同组织中的表达 特异性SPM值
[0050] 表2籽粒特异性表达基因 GRMZM2G044625在三个不同数据库中不同组织中的平均 表达量(FPKM)
[0052] 根据玉米品种B73的V2版基因组序列信息,利用生物信息学方法定位 GRMZM2G044625并预测其结构。其位于玉米第4染色体5,117,781-5,118,581,含有267个氨 基酸,无内含子。搜索该基因起始密码子ATG的上游序列,使用TSSP软件预测其启动子,结果 表明该启动子的所有元件都包括在其上游1 〇〇〇bp范围内。
[0053] 克隆GRMZM2G044625起始密码子ATG上游1000bp的启动子序列(如SEQ ID N0:1所 示),将其与红色荧光蛋白质(RFP)基因融合。通过农杆菌介导法转入玉米品种H99中,检测 该整合基因在转基因植株中的表达情况,结果显示该融合基因只在玉米籽粒中表达,而在 玉米的其他组织中监测不到任何荧光信号(请参见图1-图3)。表明该启动子能够控制基因 在玉米籽粒中的特异表达。
[0054] 本发明通过本发明的上述的控制基因在玉米籽粒中特异表达的启动子的获得方 法获得了控制基因在玉米籽粒中特异表达的启动子,通过构建融合基因并转基因玉米,鉴 定该启动子可以控制基因在玉米籽粒中特异表达。
[0055] 综上所述,本发明的控制基因在玉米籽粒中特异表达的启动子能够控制基因在玉 米籽粒中特异表达,为研究基因在玉米籽粒中的特异表达情况奠定良好的基础,促进玉米 籽粒中基因表达研究的进展,适于大规模推广应用。
[0056]在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出 各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的 而非限制性的。
【主权项】
1. 一种控制基因在玉米籽粒中特异表达的启动子,其特征在于,所述启动子控制基因 在玉米籽粒中特异表达,所述启动子的核苷酸序列如SEQ ID NO: 1所示。2. -种控制基因在玉米籽粒中特异表达的启动子的获得方法,其特征在于,所述获得 方法包括以下步骤: (1) 选择至少2个高通量转录组测序数据库,所述高通量转录组测序数据库采用在不同 发育时期的玉米不同组织进行构建,所述不同组织包括玉米籽粒,将所述高通量转录组测 序数据库中的RNA序列锚定到玉米自交系B73V2版参考基因组上,获得在所述玉米自交系 B73V2版参考基因组中具有单一锚定位点的待选RNA序列,根据所述待选RNA序列获得其锚 定的所述玉米自交系B73V2版参考基因组中的待选基因; (2) 计算各所述待选基因的各转录本的FPKM值,计算所述转录本在所述不同组织中表 达的表达特异性SPM值,筛选在所述至少2个高通量转录组测序数据库中在所述玉米籽粒中 所述表达特异性SPM值均达到最高5%且大于0.9、在所述不同组织的除所述玉米籽粒以外 的其它组织中所述FPKM值小于20的候选转录本,获得所述候选转录本对应的候选基因; (3) 选取其中一个所述候选基因作为目标基因,根据所述玉米自交系B73V2版参考基因 组的序列信息,利用生物信息学方法定位所述目标基因并预测所述目标基因的结构; (4) 获取所述目标基因的起始密码子的上游序列并利用生物信息学方法预测所述目标 基因的启动子,所述启动子即为所述的控制基因在玉米籽粒中特异表达的启动子。3. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,所述高通量转录组测序数据库的数目为3个。4. 根据权利要求3所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,所述高通量转录组测序数据库分别为NCBI的SRP006463数据库、SRP010680数据库 和SRP014652数据库。5. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,所述玉米不同组织还包括选自根、叶、穗轴、穗丝和花药中的至少一种。6. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,所述不同发育时期包括抽穗期和灌浆期。7. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,在所述锚定之前,将长度小于20bp的所述RNA序列去掉。8. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,在计算所述SPM值之前,将所述FPKM值小于10的所述转录本去掉。9. 根据权利要求2所述的控制基因在玉米籽粒中特异表达的启动子的获得方法,其特 征在于,所述目标基因为GRMZM2G044625基因。10. 根据权利要求1所述的控制基因在玉米籽粒中特异表达的启动子或根据权利要求 2-9任一项所述的控制基因在玉米籽粒中特异表达的启动子的获得方法获得的控制基因在 玉米籽粒中特异表达的启动子在控制基因在玉米籽粒中特异表达中的应用。
【文档编号】C12N15/113GK105969769SQ201610320065
【公开日】2016年9月28日
【申请日】2016年5月13日
【发明人】林峰, 赵涵
【申请人】江苏省农业科学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1