来源于棉花的miRNA-GhmiRnE及其应用的制作方法

文档序号:414151阅读:376来源:国知局
专利名称:来源于棉花的miRNA-GhmiRnE及其应用的制作方法
技术领域
本发明涉及生物技术领域,尤其涉及一种来源于棉花的HiiRNA-GhmiRnE及其应用。
背景技术
miRNA (microRNA,微小RNA)是一类长度约为20_24nt的内源单链非编码小分子 RNA,在生物体中广泛存在(Bartel D P. MicroRNAs:genomics, biogenesis, mechanisms, and function. Cell, 2004,116:281-297.)。近年来大量研究表明,miRNA 能够调控生物体中许多基因的表达,在调节生长发育、细胞增殖、凋亡、抵御环境胁迫等诸多方面发挥重要作用(Bushati N, Cohen S M. MicroRNA functions. Annu. Rev. Cell Dev. Biol. , 2007, 23:175-205.;金龙国,王川,刘进元·植物MicroRNA.中国生物化学与分子生物学报,2006,22:609-614.)。植物miRNA主要通过切割靶基因mRNA,或抑制靶mRNA翻译,来调控植物个体生长发育并影响其生理过程,是一种新的基因调控模式,具有重要的石开究意义(Voinnet 0. Origin, biogenesis, and activity of plant microRNAs.Cell,2009, 136:669-687.)。棉花是世界最重要的经济作物之一,同时棉花纤维也是研究单细胞伸长的良好模型。与拟南芥、水稻等模式生物相比,目前已经发现的棉花miRNA数量可谓寥寥无几,因此通过高通量测序技术,有望挖掘出更多的棉花miRNA,这对于全面了解棉花乃至整个植物miRNA的形成过程、结构特点和功能机制具有现实意义。另外,棉花中miRNA可能在诸多生理过程(如纤维的起始与伸长等)发挥重要功能,但棉花中关于miRNA的生物学功能研究甚少,因此,通过关注特定发育时期、特定组织中的miRNA,有望阐明棉花miRNA参与的生理过程,以及在该过程中具体发挥的作用。我国是世界上主要的棉花生产和消费国,棉花对于我国具有举足轻重的地位。国内外除了利用常规育种手段之外,逐步运用基因工程技术对棉花纤维产量、品质、抗虫等进行遗传改良已经成为了一种趋势。由于miRNA对植物有广泛的调控作用,很可能成为植物遗传改良的重点研究基因之一,因此迫切需要通过大规模测序方法充分挖掘和开发属于本国知识产权的新的miRNA基因,从而为后期定向改良和培育优质性状的棉花品种奠定基础。

发明内容
本发明的目的是提供来源于棉花的HiiRNA-GhmiRnE及其应用。本发明提供miRNA-GhmiRnE,为单链RNA,为序列表的序列I所示的RNA,序列如下(5,一 3,)UUGGUAUGGAGGAUGGAAAAG 本发明还提供miRNA-GhmiRnE前体(pre_GhmiRnE),为单链RNA,为序列表的序列2 所示的 RNA,序列如下(5’ 一 3’)AAGCCUUGCUUUGGUAUGGAGGAUGGAAAAGAGUGAAGAUGGAAAAUUUAUUAAUCAAAAGGCCAAGAUUCACAAUCACUUUCCUACUUUGUAACUUAACCAUUAGAUUGACAAAUUUUCUAUCCUACCUCUUUUCCAUCCUUC⑶ACCAAACAAAGCUUA。序列I所示RNA或序列2所示的RNA在抑制乙酰辅酶A羧化酶β亚基基因(TC229767)表达中的应用也是本发明保护的范围;所述乙酰辅酶A羧化酶β亚基的氨基酸序列为序列表的序列3。所述乙酰辅酶A羧化酶β亚基基因的核苷酸序列为序列表的序列4或序列表中序列4自5’末端第708-2201位核苷酸。序列I所示RNA或序列2所示的RNA在促进乙酰辅酶A羧化酶β亚基基因的mRNA降解中的应用也是本发明保护的范围;所述乙酰辅酶A羧化酶β亚基的氨基酸序列为序列表的序列3 ;所述乙酰辅酶A羧化酶β亚基基因的核苷酸序列为序列表的序列4或序列表中序列4自5’末端第708-2201位核苷酸。其中,促进乙酰辅酶A羧化酶β亚基基因的mRNA降解为切割乙酰辅酶A羧化酶β亚基基因的mRNA。序列I所示RNA或序列2所示的RNA在棉花纤维品质改良中的应用也是本发明保护的范围。
·
Solexa克服了常规miRNA克隆技术的缺点,具有灵敏度高的优点,能够检测出最少一个小RNA分子,并且准确性高,检出的小RNA分子碱基错误率极低。HiSeq 2000是Illumina公司2010年推出的一款新的测序仪,采用稳定的可逆终止法边合成边测序技术。该技术使用4种含有末端阻断基团和不同荧光信号的碱基进行模板互补链的合成,不仅确保了测序的高精确性和高顺序性,而且排除了由重复序列和同聚物导致的测序错误。融合了最新的光学系统和制造工艺,该光学系统采用2个激光源对Flowcell进行扫描,并使用4台照相机对4种碱基分别进行记录,大幅度减少了不同碱基之间的信号干扰,提高了测序系统的准确度。同时,HiSeq 2000使用了新颖的双表面成像技术,增加了 Flowcell的有效面积,从而提高测序产量和降低成本。每个文库的测序量至少达到1500万条小RNA序列以上。基于这种最新的测序手段,将有望识别棉花中特定发育时期特定组织特异表达的新miRNAo本发明的实验证明,本发明采用国际上先进的Solexa高通量测序技术,最新的HiSeq 2000测序仪结合生物信息学分析、5' RACE等多种生物学手段,首次从基因组水平鉴定到miRNA-GhmiRnE,并且证实GhmiRnE的靶基因为乙酰辅酶A羧化酶β亚基,该基因参与了棉花纤维伸长和次生壁增厚的发育调控。这都将为棉花的品质育种(如提高棉纤维产量)提供宝贵的基因资源,带来一定的研究价值和社会效益,并最终用于实际生产。本发明提供的miRNA广泛参与了棉花多种生命活动的调节,具有重要的生物学意义和潜在应用价值。


图I为小RNA测序数据中分离和鉴定新miRNA的流程图。图2为棉花开花后5天、10天、15天、20天和25天纤维小RNA库中GhmiRnE的测序数;所有数字均代表归一化为每1,000万“干净”序列(“干净”序列见小RNA文库中新的miRNA的鉴定部分中的解释)中的数目。图3为GhmiRnE的前体二级结构图。图4为GhmiRnE的靶基因5' RACE验证;序列上方的箭头表示发生切割的位点,数值表示该切点处发生切割的克隆数与克隆总数比值。
图5为实时定量RT-PCR检测靶基因的表达;误差线表示相对标准偏差。
具体实施例方式下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的%,如无特殊说明,均为质量百分含量。以下实施例中所用棉花品种均为陆地棉中棉35 (Gossypium hirsutumcv. CRI35),棉花种子来源于中国农业科学院棉花研究所。编号国审棉990005。实施例I、miRNA-GhmiRnE 的发现 一、样品采集棉花于每年四月下旬种植于田间,常规作业,开花前一天花苞套袋,防止花粉传播造成异花传粉,开花当天除袋,并挂牌标记。分别收取开花后5、10、15、20、25天的棉铃,去除棉铃壳,将种子及纤维迅速冻存于液氮,保存于-80°C备用。二、miRNA-GhmiRnE 的发现I、RNA 提取用研杵在装有液氮的研钵中敲击棉花纤维及种子,进而将纤维和种子剥离,取出种子,研磨纤维,研磨过程中加入PVP(按1/5质量比)以防止酚类氧化,用PureLinkTMPlant RNA Reagent (Invitrogen)提取总 RNA,操作步骤如下(以 O. Ig 材料为例,相应试剂量可根据材料量按比例调整)①磨好的纤维粉末加入到Iml提取缓冲液中,加20 μ I β -巯基乙醇,混匀后置于室温10-15分钟。4度12000转/分离心5分钟,将上清转至新的离心管,加入100 μ I5MNaCl,混匀后加入300 μ I氯仿,充分混匀,4度12000转/分离心10分钟,将上清转至新的离心管;②将转出的溶液依次用氯仿、酚、酚氯仿(I :1)、氯仿抽提,经四次抽提后的上清液转入新的离心管,加入100 μ I多糖去除剂(北京华越洋生物科技有限公司),混匀后加入200 μ I氯仿,充分混匀,4度12000转/分离心10分钟,将上清转至新的离心管;③加入等体积的异丙醇,混匀后置-20度I小时以上,4度12000转/分离心10分钟,弃上清,离心得到的沉淀用75%的乙醇洗涤,晾干后溶于适量的DEPC水中,得到总RNA。使用Ultrospec 3000型紫外分光光度计(Amersham Biosciences)测定提取的RNA在260nm (OD260)和280nm (OD280)波长的吸光度值以确定RNA的纯度和浓度。质量合格的RNA浓度应在I μ g/μ I以上,0D26(i/0D28(i的比值在I. 8-2. O之间,且经电泳检测条带清晰,无明显降解和DNA污染。2、小RNA文库的构建将质量检验合格的棉花纤维总RNA用于构建小RNA文库。5个不同时期的纤维样品提取的RNA各取10 μ g,分别用于构建小RNA文库。小RNA文库的构建按照IlluminaSample Preparation Protocol文库构建方法进行,构建好的文库采用Illumina公司新一代高通量测序仪HiSeq 2000测序(北京华大基因研究中心),获得高质量的18_30nt的小RNA序列。
3、小RNA文库中新的miRNA的鉴定参考之前国外文献对高通量测序数据分析的成功方法(Jones-RhoadesM W, Bartel D P.Computational identification of plant miRNAs and theirtargets, including a stress-induced miRNA. Mol. Cell,2004,14:787-799.),建立一套计算机分析方法用来发现和鉴定测序数据中的棉花miRNA (分析流程如图I所示)。①将获得的5个小RNA文库中的原始序列通过计算机方法去掉:V接头,并过滤掉序列长度在ISnt以下的序列,获得所谓的“干净”序列库;②将“干净”的序列与国际权威的miRNA数据库 miRBase (19) (http://microrna. sanger.ac.uk/sequences/)中公布的 miRNA 成熟序列进行BLAST,从而发现哪些序列来自于已知的miRNA,已知miRNA超过2个错配的序列再进入下一步分析将排除了保守miRNA的序列再与其它非编码RNA数据库Rfam(10. I)进行序列比对,从而发现哪些序列来自于rRNA、tRNA、snRNA和snoRNA等非编码RNA,过滤掉这些序列,剩下的序列中可能含有新的miRNA,称为潜在miRNA序列库; 将潜在miRNA序列库中的序列与已有的棉花数据库进行BLAST,数据库包括棉花EST(http://C0mpbi0.dfci. harvard, edu)、棉花GSS (NCBI)、以及已有的部分雷蒙德氏棉(Gossypium raimondii) 的基因组序列。将找到的棉花数据库中对应的序列进行下一步分析。⑥使用miRNA前体结构预测软件 mireap O. 2 (http: //sourceforge. net/pro jects/mireap),对获取的棉花数据库中有小RNA对应的序列进行二级结构分析,若能形成类似miRNA前体(pre-miRNA)的良好茎环结构则该序列可以认为是候选的新miRNA 对候选的新的miRNA继续进行筛选,考察候选的新miRNA序列所在的茎环结构前体的小RNA分布特征,若主要分布在候选的新miRNA区域以及对应的miRNA*区域,则认为该候选的新miRNA序列高度可信,是真实的 miRNA 序列(Meyers B C,Axtell M J, Bartel B, Bartel D P, Baulcombe D, Bowman JL, Cao X, Carington J C, Chen X, Green P J, et al. Criteria for annotation of plantmicroRNAs. Plant Cell, 2008, 20:3186-3190.)。鉴定到I个新的miRNA,命名为GhmiRnE。GhmiRnE 的序列如下(5' —3' ) :UUGGUAUGGAGGAUGGAAAAG (序列 I)。开花后5、10、15、20和25天5个独立的棉花纤维小RNA文库中能够独立鉴定到GhmiRnE序列,测序数分别为187,645,516,332和33 (经归一化处理后每1,000万测序数中的数目)。结果见图2。miRNA前体(pre_miRNA)序列的二级莖环结构是miRNA基因最显著的特点之一,也是所有miRNA鉴定方法都不可逾越的重要规则。 GhmiRnE 前体(pre-GhmiRnE)序列如下(5' — 3' ) AAGCCUUGCUUUGGUAUGGAGGAUGGAAAAGAGUGAAGAUGGAAAAUUUAUUAAUCAAAAGGCCAAGAUUCACAAUCACUUUCCUACUUUGUAACUUAACCAUUAGAUUGACAAAUUUUCUAUCCUACCUCUUUUCCAUCCUUCGUACCAAACAAAGCUUA (序列表的序列 2 )。pre-GhmiRnE能形成良好的茎环结构,成熟的miRNA从miRNA前体的茎部产生,完全符合miRNA前体的结构特征(图3,红色部分(左侧加深)指示成熟miRNA所在的位置。)。实施例2、miRNA的靶基因预测与验证由于植物miRNA与靶基因mRNA近乎完全互补,因此可以通过生物信息学方法预测 GhmiRnE 的祀基因。采用在线软件 psRNATarget (http://plantgrn. noble, org/psRNATarget/)在棉花EST数据库CGIll中寻找到能与miRNA序列近乎完全互补的cDNA或基因,即为miRNA的靶标;参数设置为=PsRNATarget程序参数为默认设置,靶标的功能通过NCBI (http://www. ncbi. nlm. nih. gov/)同源性检索,以同源性最高的已知功能基因进行注释。预测结果见表I。表IGhmiRnE的靶基因及功能
——miRNA名称预测靶靶苺W功能一
乙Itt辅ΛΙ A羧化ftH'MlUt GhmiRnETC229767(Acetyle-CoA carboxylase beta
subunit, ACCD)GhmiRnE的靶基因为乙酰辅酶A羧化酶β亚基(ACXD)基因TC229767 (基因序列为序列表的序列4,其编码基因为序列表中序列4自5’末端第708-2201位核苷酸,其编码的蛋白见序列表的序列3)。该类基因能够调节脂肪酸生物合成,促进棉花纤维的伸长和次生壁增厚的发育调控(Peng L, Kawagoe Y, Hogan P, Delmer D. 2002.Sitosterol—beta—glucoside as primer for cellulose synthesis in plants. Science295:147-150. ;Sasaki Y, Nagano Y. 2004. Plant acetyl-CoA carboxylase:structure, biosynthesis, regulation, and gene manipulation for plant breeding. BiosciBiotechnol Biochem 68:1175-1184. ;Gou JY,Wang LJ, Chen SP, Hu WL, Chen XY. 2007.Gene expression and metabolite profiles of cotton fiber during cell elongationand secondary cell wall synthesis. Cell Res 17:422-434·)。实施例3、miRNA对靶基因mRNA的切割GhmiRnE对靶基因TC229767(见序列表的序列4)mRNA的切割用5' RACE方法进行验证(Jones-Rhoades M ff, Bartel D P. Computational identification of plant miRNAsand their targets, including a stress-induced miRNA. Mol. Cell, 2004, 14:787-799·)。靶基因mRNA被miRNA切割后,其较为稳定的3'切割产物5'端核苷酸磷酸基团暴露,用T4RNA连接酶在该切割产物5'端连接上5' RACE专用接头;通过反转录反应合成cDNA ;通过靶基因特异的巢式外引物和试剂盒所带的巢式外引物进行第一轮PCR,靶基因特异的巢式内引物和试剂盒所带的巢式内引物进行第二轮PCR ;将5' RACE获得的PCR产物连接到pMD 19-T载体(TaKaRa)后测序,就能知道精确的靶基因mRNA切割位点。I、分别提取实施例I的步骤一制备的各种棉花纤维样品的总RNA。2、按Firstchoice RLM-RACE试剂盒(Ambion)操作说明进行Y RACE,靶基因特异的巢式外引物的序列为ACCTTTTTCGTAAAATCTCGTCTA,靶基因特异的巢式内引物的序列为GGATGGGTAGAAGAAGTTGTGATGCT。3、得到90bp PCR产物进行琼脂糖电泳,回收特异条带。4、将回收的PCR产物连接到pMD 19-T载体(TaKaRa),并转化大肠杆菌DH5 α。5、挑单克隆测序,根据测序结果确定靶基因mRNA的切割位点。测序结果显示的切割位点见图4。GhmiRnE的靶基因在与其互补的区域发生了切害I],这个结果强有力的证明了 TC229767确实是GhmiRnE体内真正调控的靶基因。实施例4、靶基因的表达量分析为了进一步考察GhmiRnE的功能,用实时定量RT-PCR分别检测靶基因TC229767在开花后5、10、15、20和25天的棉花纤维中的表达情况。I、分别提取实施例I的步骤一制备的各棉花纤维样品的总RNA。2、总RNA加入DNase I (TaKaRa),室温放置30min以除去基因组DNA的污染。3、加入终止缓冲液(50mM EDTA)后,70°C加热IOmin以变性DNase I和RNA。4、采用TaKaRa RNA PCR KU,用RNA合成cDNA模板,操作按试剂盒说明书进行。5、米用 Power SYBR Green PCR Master Mix (Applied Biosystems)在 iCycler iQ5 Multicolor实时定量PCR检测仪(Bio-Rad)上进行PCR扩增反应,通过比较CT值法(Λ ACT值法)(Schmittgen T D. Real-Time Quantitative PCR. Methods, 2001,25:383-385.)计算靶基因在不同样品中的相对表达量(对照组基因的表达量设定为I)。靶基因的检测设置3个重复,结果取平均值。以棉花UBQ10基因作为内参(ffalford S A. , Wu Y R·,LlewellynD J and Dennis E S. (2011)GhMYB25-like:a key factor in early cotton fibredevelopment. Plant J, 65(5), 785-97)。扩增靶基因TC229767的引物如下(5' — )上游弓I 物AATAAAAGACTAAACACAACTC ;下游引物GCCAAAAGGACAACATACAGGA。扩增UBQ10基因引物如下(5^ — 3'):上游引物CCAGAAGGAATCCACTTTGC;下游引物CCAGCTCACATCAGCATACG。结果见图5,靶基因TC229767在纤维发育过程中表达量发生了明显的变化,通过和GhmiRnE在5个小RNA库中测序数的表达(图2)进行比较,发现TC229767的表达和GhmiRnE的表达呈现出负相关性,在开花后5天到15天的纤维中GhmiRnE表达主要呈明显上调的趋势,TC229767的表达量呈现明显下调的趋势;15天到20天,GhmiRnE呈现下调的趋势,TC229767表达量上调;这与miRNA对靶基因的负调控作用是完全一致的,20天之后,次生壁起始,棉花纤维细胞内的代谢流向纤维素合成,miRNA与TC229676同时下降。实时定量PCR的结果进一步证明了 TC229767确实是GhmiRnE的靶基因。
权利要求
1.序列表的序列I所示的RNA。
2.序列表的序列2所示的RNA。
3.权利要求I或2所述RNA在抑制乙酰辅酶A羧化酶β亚基基因表达中的应用;所述乙酰辅酶A羧化酶β亚基的氨基酸序列为序列表的序列3。
4.如权利要求3所述的应用,其特征在于所述乙酰辅酶A羧化酶β亚基基因的核苷酸序列为序列表的序列4或序列表中序列4自5’末端第708-2201位核苷酸。
5.权利要求I或2所述RNA在促进乙酰辅酶A羧化酶β亚基基因的mRNA降解中的应用;所述乙酰辅酶A羧化酶β亚基的氨基酸序列为序列表的序列3。
6.如权利要求5所述的应用,其特征在于所述乙酰辅酶A羧化酶β亚基基因的核苷酸序列为序列表的序列4或序列表中序列4自5’末端第708-2201位核苷酸; 所述促进乙酰辅酶A羧化酶β亚基基因的mRNA降解为切割乙酰辅酶A羧化酶β亚基基因的mRNA。
7.权利要求I或2所述RNA在棉花纤维品质改良中的应用。
全文摘要
本发明公开了来源于棉花的miRNA-GhmiRnE及其应用。本发明保护的GhmiRnE是序列表的序列1所示的RNA。本发明保护的GhmiRnE前体(pre-GhmiRnE)是序列表的序列2所示的RNA。本发明还保护序列1所示RNA在抑制乙酰辅酶A羧化酶β亚基基因表达和/或促进乙酰辅酶A羧化酶β亚基基因的mRNA降解中的应用。所述乙酰辅酶A羧化酶β亚基如序列表的序列3所示。所述乙酰辅酶A羧化酶β亚基基因如序列表的序列4所示。应用miRNA-GhmiRnE有望获得在棉花纤维长度,强度有重要表型的植株,具有重要的生物学意义和潜在应用价值,将为棉花的品质育种(如培育抗逆性棉花)提供宝贵的基因资源,带来一定的研究价值和社会效益,并最终用于实际生产。
文档编号C12N15/113GK102899326SQ201210398840
公开日2013年1月30日 申请日期2012年10月19日 优先权日2012年10月19日
发明者刘进元, 薛伟, 王正明 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1