确定棉纤维发育过程中上调基因和下调基因的方法

文档序号:9541264阅读:715来源:国知局
确定棉纤维发育过程中上调基因和下调基因的方法
【技术领域】
[0001] 本发明涉及植物基因及其编码蛋白,特别是棉花纤维发育过程中的差异表达基因 及其编码蛋白与其在改良棉纤维产量和品质中的应用。
【背景技术】
[0002] 棉花是我国重要的经济作物,在全球经济中起着中流祗柱作用。海岛棉 (G.barbadense)和陆地棉(G.hirsutum)是目前世界上最具有商业价值的栽培棉种。陆地 棉由于产量高和较强的环境适应能力而被广泛种植,占棉花产量的90%。相反,海岛棉仅占 棉花产量的5~8%,且由于其在长度、强度等方面具有优良纤维品质而价格昂贵。海岛棉 和陆地棉都是异源四倍体棉花栽培品种,但是它们的纤维品质和发育进程显著不同。目前 对于海岛棉优异的纤维品质机理还不清楚。
[0003] 棉纤维是由受精胚珠的单个表皮细胞经伸长、加厚而成的种子纤维。棉纤维是由 胚珠外珠被部分表皮细胞经分化等一系列复杂的发育过程而形成的单细胞物质。棉纤维的 品质好坏主要看纤维长度、强度、伸长率、马克隆值等测定值,纤维品质性状为多基因数量 遗传,其遗传机制相当复杂。棉纤维细胞的分化与突起期发生在开花当天[0开花后天数, Odayspost-anthesis值PA)],表现为胚珠表面扩展为球状或者半球状突起。
[0004] 转录组学(transcriptomics),是一口在整体水平上研究细胞中基因转录的情况 及转录调控机制的学科,主要从RNA水平研究基因表达的情况。从转录组水平上对棉纤维 复杂的多基因遗传机制进行深入研究,对了解整个纤维发育的分子调控机制,并结合分子 标记技术定位与纤维产量和纤维品质相关的QTLs,非常有助于分子标记辅助选择(MA巧育 种和纤维品质的改良。从mRNA水平了解特定棉花组织细胞、组织或器官的基因表达模式并 解释其生理属性,对人们深入了解棉花纤维发育起始、分化、成熟等机制有着极其重要的意 义。
[0005] W改善棉花纤维品质为目的的基因克隆技术,是通过克隆出与棉花纤维发育过程 中影响棉纤维质量优劣的关键功能基因,同时阐明其功能,可W进一步解析棉花纤维发育 伸长期纤维伸长和次生壁加厚期纤维素合成的分子机理,进而通过转基因手段或者开发出 相应的功能标记,有利于分子标记辅助育种,从而培育出优质纤维品质的新品种(刘进元, 赵广荣.棉花纤维品质改良的分子工程[J].植物学报:英文版,2000,42(10) :991-995.), 目前对陆地棉的一些已知的转录因子、棉纤维发育伸长阶段基因、棉纤维次生壁加厚相关 基因和棉纤维成熟阶段基因的克隆都有些报道。

【发明内容】

[0006] 依据本发明一方面提供的一种确定在棉花纤维发育过程中的上调或者下调基因 的方法,包括W下步骤:(1)分别从处于棉纤维发育第一时期和第二时期的样本中获得第 一转录组和第二转录组,对第一和第二转录组进行测序,获得第一转录组测序数据和第二 转录组测序数据,第一转录组测序数据和第二转录组测序数据各自包含多个读段(reads); (2)分别基于(I)中的第一转录组测序数据和第二转录组测序数据进行一级组装,获得第 一一级组装数据和第二一级组装数据,第一一级组装数据和第二一级组装数据各自由多个 一级基因构成;(3)合并获自(2)的第一一级组装数据和第二一级组装数据,利用第一一级 组装数据和第二一级组装数据中有重叠的一级基因进行二级组装,获得二级组装数据,二 级组装数据由多个二级基因构成;(4)基于(3)中的二级组装数据和参考基因的重叠关系 进行H级组装,获得H级组装数据,H级组装数据由多个H级基因构成;(5)计算获自(4) 的H级组装数据中各个H级基因在棉纤维发育第一时期样本和棉纤维发育第二时期样本 中的表达量;(6)确定获自(5)的各H级基因的在棉纤维发育第一时期样本和棉纤维发育 第二时期样本中的表达量的差异是否显著,W确定所说的在棉纤维发育过程中的上调基因 或者下调基因。
[0007]当所述样本来源于棉花胚珠并且来源于同一棉种,棉纤维发育第一时期和第二 时期胚珠样本为两个不同的时期,利用本发明送一方面提供的方法获得差异表达基因,获 得同一棉种两个不同发育时期的纤维发育相关基因的表达变化,利于该棉种的纤维品质产 量等特性的遗传机理研究,也可利用基于调整相关基因表达来改造该棉种或其它棉种的 纤维质地。
[0008] 当所述样本来源于棉花胚珠并且来源于不同棉种,棉纤维发育第一时期和第二 时期为同一时期,利用本发明送一方面提供的方法获得差异表达基因,获得不同棉种同一 纤维发育时期的相关基因的表达变化、共性及差异,利于了解不同棉种具有不同棉纤维特 性的遗传机理发现棉纤维品质更优越的决定基因和分子机制,有利于棉纤维品质的改良。
[0009] 依据本发明的另一方面提供的一种棉花转录因子基因GbMYB25,其具有的核巧酸 序列为如SEQIDNO=I所示的曲NA序列,或者如SEQIDNO;2所示的CDS序列。该基因编码 具有SEQIDNO;3所示的氨基酸序列的多肤。本发明的又一方面提供了一种含有抓MYB25 基因的表达载体W及,含有送个表达载体的宿主细胞。本发明的再一方面提供了GbMYB25 基因用于调控棉花纤维起始发育的用途,调控棉花纤维起始发育是通过调控棉花胚珠中的 纤维细胞的纤维基因的表达来实现的。本发明的一方面还提供了一对扩增GbMYB25基因的 引物对,所述引物对具有如SEQIDNO;5和SEQIDNO;6所示的序列。
[0010] 依据本发明再一方面提供的一种油菜素酱醇度rassinosteroids,BRs)生物合成 的限速酶基因--棉花抓DET2基因,其具有SEQIDNO;4所示的序列。本发明的又一方面 还提供一种含有所述GbDET2基因的表达载体和一种含有所说的表达载体的宿主细胞。本 发明的再一方面提供了所述GbDET2基因在改良棉纤维的产量和品质中的用途,所说的用 途是通过利用所说的抓DET2基因调控油菜素类固醇物质的合成来实现的。本发明的一方 面还提供了扩增所述抓DET2基因的引物对,所述引物对具有SEQIDNO; 13和SEQIDNO: 14所示的序列。
【附图说明】
[0011] 图1是本发明的一个【具体实施方式】中的转录组文库构建测序流程示意图;
[0012] 图2是本发明的一个【具体实施方式】中的一级组装和二级组装过程的示意图;
[0013] 图3是本发明的一个【具体实施方式】中的棉花二级组装结果维恩图;
[0014] 图4是本发明的一个【具体实施方式】中的1抓21与化36的ODPA纤维中的基因差异 表达示意图;
[0015] 图5是本发明的一个【具体实施方式】中的抓21与化36差异表达基因统计结果示意 图;
[0016] 图6是本发明的一个【具体实施方式】中的GbMYB25蛋白的二级结构示意图,其中,最 长竖代表a螺旋,中长竖代表延伸带,最短竖代表无规则卷曲
[0017] 图7是本发明的一个【具体实施方式】中的GbMYB25蛋白的H级结构同源建模示意 图;
[0018] 图8是本发明的一个【具体实施方式】中的GbMYB25蛋白与其他相关蛋白全长氨基酸 序列的系统进化树分析示意图;
[0019] 图9是本发明的一个【具体实施方式】中的GbMYB25结构示意图,其中,黑色线方块为 外显子,方块之间的细线为内含子,ATG为起始密码子,TGA为终止密码子;
[0020] 图10是本发明的一个【具体实施方式】中的GbMYB25基因的表达模式示意图;
[0021] 图11是本发明的一个【具体实施方式】中的GbMYB25蛋白的亚细胞定位图,其中,A和 B表示抓MYB25:hGFP融合蛋白定位,C和D表示对照hGFP蛋白定位,A和C表示绿色英光 下的,B和D表不可见光下的;
[0022] 图12是本发明的一个【具体实施方式】的植物DET2基因的系统发育树示意图,其中 的线段表示进化距离;
[0023] 图13是本发明的一个【具体实施方式】中的GbDET2基因在不同棉种中的扩增结果的 电泳图,其中,M:DL2000Marker,l:新海 1 号,2:新海 36 号,3:新海 21 号,4:Pima90-5379 ; 5 ;吉扎 30,6:吉扎 69,7:口1111曰309353,8:口1111曰3-7,9:9078 依,10:吉扎1号,11:(:-6019,12: 司-6002 ;
[0024] 图14是本发明的一个【具体实施方式】中的棉花纤维不同发育时期DET2基因表达的 示意图。
【具体实施方式】
[0025] 依据本发明的一种实施方式,提供了一种确定在棉花纤维发育过程中的上调或者 下调基因的方法,包括W下步骤:
[0026]巧骤一:巧得第一转录纽测序敬据巧第二转录纽郷I序敬据
[0027]分别从处于棉纤维发育第一时期和第二时期的样本中获得第一转录组和第二转 录组,对第一和第二转录组进行测序,获得第一转录组测序数据和第二转录组测序数据,第 一转录组测序数据和第二转录组测序数据各自包含多个读段。所述的处于棉纤维发育第一 时期和棉纤维发育第二时期的样本均来源于棉花胚珠。
[0028] 在本发明的一个【具体实施方式】中,棉纤维发育第一时期和棉纤维发育第二时期分 别选自0DPA、抓PA、IODPAU抓PA和2抓PA中的任两个不同的时期,而且样本来源于同一棉 种,比如样本来源于还未有公开基因组数据的海岛棉。
[0029] 在本发明的一个【具体实施方式】中,棉纤维发育第一时期和棉纤维发育第二时期为 选自0DPA、抓PA、10DPA、1抓PA和2抓PA中的任一同一时期,所述样本来源于不同棉种,比女口 样本分别来源于海岛棉和陆地棉。
[0030] 在本发明的一个【具体实施方式】中,测序包括对所述第一转录组和第二转录组进行 测序文库构建W及上机测序。可选用的文库构建、测序方法根据来自的测序平台包括但不 限于CG(CompleteGenomics)、Illumina/Solexa、ABI/S0LiD、Roche454和单分子测序平台, 依据所选测序平台进行单端或双端测序文库的制备。在本发明的一个实施例中,转录组测 序(RNA-Seq)文库的构建包括步骤;a)分别从所述处于棉纤维发育第一时期的样本和处于 棉纤维发育第二时期的样本中获得第一HiRNA和第二mRNA;b)打断从a)中获得的第一mRNA 和第二mRNA,获得第一mRNA片段和第二mRNA片段;C)分别Wb)中的第一mRNA片段和第 二mRNA片段为模板,反转录合成第一CDNA第一链和第二CDNA第一链;d)分别W从C)中 获得的第一CDNA第一链和第二CDNA第一链为模板,获得第一双链CDNA和第二双链CDNA; e)分别对从d)中所得的第一双链CDNA和第二双链CDNA进行末端修复,加AW及连接测序 接头,获得所述第一转录组测序文库和所述第二转录组测序文库;检测构建好的文库置于 IlluminaHiseq2000 上测序。
[00引]巧骤二:一级纽装
[0032] 对第一转录组测序数据和第二转录组测序数据分别进行一级组装,获得第一一级 组装数据和第二一级组装数据,第一一级组装数据和第二一级组装数据各自由多个一级基 因构成。
[0033] 在本发明的一个【具体实施方式】中,一级组装具体包括;a)通过分别拼接第一转 录组测序数据中的有重叠关系的读段或者所述第二转录组测序数据中的有重叠关系的读 段,获得第一重叠群和第二重叠群,所述第一重叠群和第二重叠群各自包含多个重叠片段 (contig) ;b)基于所述第一转录组测序数据中的有距离关系的读段或者所述第二转录本 测序数据中的有距离关
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1