一种盐肤木黄酮3‑O‑单氧酶编码基因及其应用的制作方法

文档序号:11722509阅读:289来源:国知局
一种盐肤木黄酮3‑O‑单氧酶编码基因及其应用的制作方法与工艺

本发明属于分子生物学领域,具体涉及盐肤木rchf3m基因。



背景技术:

五倍子是一种重要的化工原料,是由半翅目hemiptera,蚜总科aphidoidea,瘿绵科pemphigidae,倍蚜族melaphidini的五倍子蚜虫生活在漆树科anacardiaceae盐肤木属rhus的寄主植物上,刺激叶片组织增生而形成的虫瘿。中国五倍子利用有2000多年的历史,古代主要用于中药,现代广泛用于化工、医药、纺织、食品等行业,具有重要的经济价值。盐肤木rhuschinensis是角倍蚜schlechtendaliachinensis的主要寄主,角倍是角倍蚜在寄生在盐肤木上形成的虫瘿,是我国主要的五倍子种类之一,其产量占我国五倍子总产量的70%以上。

角倍的主要活性成分是单宁,单宁(tannins)又称单宁酸、鞣质,是植物体内一大类多酚黄酮化合物,单宁的生物合成途径已基本明确,主要是通过莽草酸途径合成,即由莽草酸途径形成苯丙氨酸,再经一系列反应后最终形成单宁。许多植物中黄酮生物合成途径中关键酶基因的生化功能已经得到验证,关键酶包括黄酮3-o-单氧酶、花青素3-o-葡糖基转移酶、无花色素还原酶(lar),花色素还原酶(anr),二氢黄酮醇4-还原酶(dfr)、查儿酮合成酶(chs)和查儿酮异构酶(chi)等。黄酮3-o-单氧酶在角倍的单宁合成过程中起到至关重要的调节作用,所以,盐肤木黄酮3-o-单氧酶的表达水平对其产生角倍的单宁含量起着重要的调节作用,黄酮3-o-单氧酶基因是控制植物黄酮3-o-单氧酶表达的遗传基础。只有找到盐肤木黄酮3-o-单氧酶的基因,才能对盐肤木进行遗传改良,从而提高角倍中单宁含量。



技术实现要素:

为解决上述问题,本发明通过对盐肤木进行接种,并定期收集不同发育阶段的虫瘿分别提取rna,通过转录组测序分析、基因注释、kegg数据库比对等步骤,得到了盐肤木单宁合成关键基因rchf3m(序列1、2),并采用qpcr技术对rchf3m基因进行验证(表2,图1),具体技术方案如下:

1、样本收集与处理

将五倍子蚜虫放于盐肤木上(rhuschinensismill),五倍子蚜虫刺激叶翅产生角倍,定期收集生长于盐肤木叶翅上不同生长时期的角倍,每次收集的角倍清除角倍内所有蚜虫后分为两部分保存,一部分冷冻保存,用于提取总rna,另一部分用于测定单宁含量。

2、测序及转录组分析

提取去除蚜虫后的五倍子的总rna,检测rna质量及纯度后进行rna转录组测序,序列经阅读质量分析、统计学比对分析、测序饱和度分析、参考基因读取分布及参考基因组读取分布分析后得到高质量盐肤木转录组序列。

3、基因注释与筛选

拼接得到的所有功能基因都分别注释到ncbi数据库中的nr数据库、nt数据库及swiss-prot数据库、kegg数据库、cog数据库、go数据库中,得到与盐肤木单宁合成通路相关基因,并结合基因表达量与单宁含量同步一致性,最终筛选出盐肤木单宁合成的关键基因rchf3m(dna序列及其对应的蛋白质序列如序列3所示)。

4、基因表达量验证

为了验证rchf3m基因,将rchf3m基因做实时荧光定量(qpcr)分析,采用相对定量方法分析rchf3m基因相对表达量(图1)。

附图说明

图1为盐肤木rhuschinensis5个不同发育时期单宁含量;

图2为盐肤木rchf3m基因qpcr相对定量结果;

图3为盐肤木rchf3m基因qpcr相对表达量验证结果;图中纵坐标rchf3m基因qpcr相对表达量,横坐标为盐肤木发育的5个不同时间点(从6月21-8月28日);

图4为盐肤木不同发育时期单宁含量动态变化图;图中纵坐标为单宁含量(单宁占盐肤木倍子重量的百分数),横坐标为盐肤木发育的5个不同时间点(从6月21-8月28日),5个时间点盐肤木分别进行rna转录组测序分析。

具体实施方式

1、样本收集

五倍子蚜虫饲养于中国西南生态研究中心资源昆虫研究所中的盐肤木上(rhuschinensismill)。每隔十五天收集一次生长于盐肤木叶翅上不同生长时期的角倍,共计8次。每次收集的角倍清除角倍内所有蚜虫后分为两部分保存,一部分先以液氮冻存,随后移入−80°c冰箱中以便提取总rna,另一部分用于单宁含量的测定。

2、测序及转录组分析

去除蚜虫后的五倍子以通用植物总rna提取试剂盒(离心柱型)(百泰克,中国)提取总rna。以1%的琼脂糖凝胶电泳检测所提总rna质量。以nanophotometer®分光光度计(implen,ca,usa)检测纯度,以核糖核酸6000纳米盒(agilenttechnologies,ca,usa)检测rna完整度。以打断后的mrna为模板,随机六聚体引物合成一链cdna,然后配制双链合成反应体系合成双链cdna。合成的双链cdna以qiaquickpcrextractionkit纯化,经过磁珠纯化、粘性末端修复、3’末端加碱基a、加测序接头后,进行pcr扩增,从而完成整个文库制备工作。

去除含接头的片段,其余所需片段以琼脂糖凝胶电泳纯化并进行pcr扩增。每个扩增样品以nebnext®ultra™directionalrnalibraryprep试剂盒进行测序(neb,usa),所得基因代码整合为测序文库。整合后,文库以illuminahiseqtm2000测序平台双向测序。最后,构建好的文库以ampurexp体系纯化并以安捷伦生物分析仪2100系统(agilenttechnologies,ca,usa)检测。经测序仪读取后,将去除含n(表示无法确定碱基信息)比例大于10%及低质量的片段(质量值q≤5的碱基数占整条read的50%以上)。

转录组序列拼接时将trinity2软件中的min_kmer_cov选项设置为2,其余所有参数均为默认值。序列经阅读质量分析、统计学比对分析、测序饱和度分析、参考基因读取分布及参考基因组读取分布分析后得到。

3、基因注释

拼接得到的所有功能基因都分别注释到ncbi数据库中的nr数据库、nt数据库及swiss-prot数据库、kegg数据库、cog数据库、go数据库中。基因表达水平为每条基因碱基读取比对到参考基因图谱上的碱基数量,以rpkm表示1,rpkm值的大小反映了基因表达的丰度。将rpkm>0.3设为基因显著表达阈值。fpkm法能消除基因长度和测序量差异对计算基因表达量的影响,计算得到的基因表达量可直接用于比较不同样品间的基因差异表达。

4、实时荧光定量分析

为了验证rna分析结果,实时荧光定量采用icycler荧光实时检测系统(bio-rad,hercules,ca),采用相对定量方法分析各目的基因相对表达量。反应体系均为25ul,其中,每个反应体系中包含以1/40(v/v)稀释过的的模板cdna2ul,及终浓度各为0.5mm的上下游引物。实时荧光定量反应条件为:95°c,5分钟;95°c,20秒;62°c,45秒;45个循环。最后,以熔解曲线检测扩增特异性,熔解曲线反应条件为:变性后样品冷却至55°c,然后以每10秒升高0.5°c为1个循环,重复80个循环,直至95°c。pcr产物以1.5%琼脂糖凝胶电泳检测,随后纯化扩增产物并测序,验证有效扩增。以actin为内参基因校准模板浓度。每个处理重复三次。

序列1.盐肤木rchf3m基因序列(996bp)

ttcagacatagcccattctaaggcagtagctgcggtatccgttgctccaaatatgagatc60

ctgtgtcatgcccttaactctattacacgttagcttatcatcaagattggtatcatcatc120

agctagctgcaatagtaaatccaccatgtcttttggcacaaaattatcccccaatgcttc180

cctgttagctttgtgttcatcaaatatgtgctcataaaatggatcaagtcttttctttaa240

ggccttcattcgcttcacatatccttgcaggtccaagaaatccagccacggaatccaatc300

cccaatattcagcactccactgagcaagaacaactcacctaacatctcttgaaactcttc360

aagtgtcacacccgatgtttcatattttgagtcttctgactcactaaagtacttcttacc420

caacacaattctgcttataatgctgagggtaacgcgtgagagatgatctttaagcacagt480

tggcttccccgaacaggcatacaggcgagatataaagtctcgtatttcttcaacacgaat540

gtactcgtaagactcgagtcgttttgaactaaatagctctgtgaggtaaattttacggcc600

tcggcgccaatatggtccataaggagcccacaaaatatctgagttgttaaaagctatgaa660

cttgcctgctgcagtttgaggtctggaagcaaagatatgatcatgtgtcttgagaaaaag720

cttagccatttctggagaagaggcaacaacaagagagaaagagccaatcttgagttgcat780

tatttctccatatttttgggatagtttgtgaaaagattggtgagggagtggaccgatgag840

atgaaggttgccgataataggccacggtttaggacctggtggaaattttcgtgggtggcg900

ccacgaagatgagatttttctgaggaaggctatggcagctagccatgccaggcctaaaat960

aacccaagaaacagcttccattgtattagtgttgtg996

序列2.盐肤木黄酮3-o-单氧酶氨基酸序列(由转录组所得序列的反义链翻译得到)

metglualavalsertrpvalileleuglyleualatrpleuala

151015

alailealapheleuarglysilesersersertrparghispro

202530

arglyspheproproglyprolysprotrpproileileglyasn

354045

leuhisleuileglyproleuprohisglnserphehislysleu

505560

serglnlystyrglygluilemetglnleulysileglyserphe

657075

serleuvalvalalaserserproglumetalalysleupheleu

808590

lysthrhisasphisilephealaserargproglnthralaala

95100105

glylyspheilealapheasnasnseraspileleutrpalapro

110115120

tyrglyprotyrtrpargargglyarglysiletyrleuthrglu

125130135

leupheserserlysargleuglusertyrglutyrileargval

140145150

glugluileargasppheileserargleutyralacyssergly

155160165

lysprothrvalleulysasphisleuserargvalthrleuser

170175180

ileileserargilevalleuglylyslystyrphesergluser

185190195

gluaspserlystyrgluthrserglyvalthrleuglugluphe

200205210

glnglumetleuglygluleupheleuleuserglyvalleuasn

215220225

ileglyasptrpileprotrpleuasppheleuaspleuglngly

230235240

tyrvallysargmetlysalaleulyslysargleuaspprophe

245250255

tyrgluhisilepheaspgluhislysalaasnargglualaleu

260265270

glyaspasnphevalprolysaspmetvalaspleuleuleugln

275280285

leualaaspaspaspthrasnleuaspasplysleuthrcysasn

290295300

argvallysglymetthrglnaspleuilepheglyalathrasp

305310315

thralaalathralaleuglutrpalametserglu

320325

序列3.盐肤木rchf3m基因碱基序列与编码氨基酸序列的对应图

cacaacactaatacaatggaagctgtttcttgggttattttaggcctg48

metglualavalsertrpvalileleuglyleu

1510

gcatggctagctgccatagccttcctcagaaaaatctcatcttcg93

alatrpleualaalailealapheleuarglysileserserser

152025

tggcgccacccacgaaaatttccaccaggtcctaaaccgtggcct138

trparghisproarglyspheproproglyprolysprotrppro

303540

attatcggcaaccttcatctcatcggtccactccctcaccaatct183

ileileglyasnleuhisleuileglyproleuprohisglnser

455055

tttcacaaactatcccaaaaatatggagaaataatgcaactcaag228

phehislysleuserglnlystyrglygluilemetglnleulys

606570

attggctctttctctcttgttgttgcctcttctccagaaatggct273

ileglyserpheserleuvalvalalaserserproglumetala

758085

aagctttttctcaagacacatgatcatatctttgcttccagacct318

lysleupheleulysthrhisasphisilephealaserargpro

9095100

caaactgcagcaggcaagttcatagcttttaacaactcagatatt363

glnthralaalaglylyspheilealapheasnasnseraspile

105110115

ttgtgggctccttatggaccatattggcgccgaggccgtaaaatt408

leutrpalaprotyrglyprotyrtrpargargglyarglysile

120125130

tacctcacagagctatttagttcaaaacgactcgagtcttacgag453

tyrleuthrgluleupheserserlysargleuglusertyrglu

135140145

tacattcgtgttgaagaaatacgagactttatatctcgcctgtat498

tyrileargvalglugluileargasppheileserargleutyr

150155160

gcctgttcggggaagccaactgtgcttaaagatcatctctcacgc543

alacysserglylysprothrvalleulysasphisleuserarg

165170175

gttaccctcagcattataagcagaattgtgttgggtaagaagtac588

valthrleuserileileserargilevalleuglylyslystyr

180185190

tttagtgagtcagaagactcaaaatatgaaacatcgggtgtgaca633

pheserglusergluaspserlystyrgluthrserglyvalthr

195200205

cttgaagagtttcaagagatgttaggtgagttgttcttgctcagt678

leugluglupheglnglumetleuglygluleupheleuleuser

210215220

ggagtgctgaatattggggattggattccgtggctggatttcttg723

glyvalleuasnileglyasptrpileprotrpleuasppheleu

225230235

gacctgcaaggatatgtgaagcgaatgaaggccttaaagaaaaga768

aspleuglnglytyrvallysargmetlysalaleulyslysarg

240245250

cttgatccattttatgagcacatatttgatgaacacaaagctaac813

leuaspprophetyrgluhisilepheaspgluhislysalaasn

255260265

agggaagcattgggggataattttgtgccaaaagacatggtggat858

argglualaleuglyaspasnphevalprolysaspmetvalasp

270275280

ttactattgcagctagctgatgatgataccaatcttgatgataag903

leuleuleuglnleualaaspaspaspthrasnleuaspasplys

285290295

ctaacgtgtaatagagttaagggcatgacacaggatctcatattt948

leuthrcysasnargvallysglymetthrglnaspleuilephe

300305310

ggagcaacggataccgcagctactgccttagaatgggctatgtctgaa996

glyalathraspthralaalathralaleuglutrpalametserglu

315320325。

序列1.盐肤木rchf3m基因序列(996bp)

ttcagacatagcccattctaaggcagtagctgcggtatccgttgctccaaatatgagatc60

ctgtgtcatgcccttaactctattacacgttagcttatcatcaagattggtatcatcatc120

agctagctgcaatagtaaatccaccatgtcttttggcacaaaattatcccccaatgcttc180

cctgttagctttgtgttcatcaaatatgtgctcataaaatggatcaagtcttttctttaa240

ggccttcattcgcttcacatatccttgcaggtccaagaaatccagccacggaatccaatc300

cccaatattcagcactccactgagcaagaacaactcacctaacatctcttgaaactcttc360

aagtgtcacacccgatgtttcatattttgagtcttctgactcactaaagtacttcttacc420

caacacaattctgcttataatgctgagggtaacgcgtgagagatgatctttaagcacagt480

tggcttccccgaacaggcatacaggcgagatataaagtctcgtatttcttcaacacgaat540

gtactcgtaagactcgagtcgttttgaactaaatagctctgtgaggtaaattttacggcc600

tcggcgccaatatggtccataaggagcccacaaaatatctgagttgttaaaagctatgaa660

cttgcctgctgcagtttgaggtctggaagcaaagatatgatcatgtgtcttgagaaaaag720

cttagccatttctggagaagaggcaacaacaagagagaaagagccaatcttgagttgcat780

tatttctccatatttttgggatagtttgtgaaaagattggtgagggagtggaccgatgag840

atgaaggttgccgataataggccacggtttaggacctggtggaaattttcgtgggtggcg900

ccacgaagatgagatttttctgaggaaggctatggcagctagccatgccaggcctaaaat960

aacccaagaaacagcttccattgtattagtgttgtg996

序列2.盐肤木黄酮3-o-单氧酶氨基酸序列(由转录组所得序列的反义链翻译得到)

metglualavalsertrpvalileleuglyleualatrpleuala

151015

alailealapheleuarglysilesersersertrparghispro

202530

arglyspheproproglyprolysprotrpproileileglyasn

354045

leuhisleuileglyproleuprohisglnserphehislysleu

505560

serglnlystyrglygluilemetglnleulysileglyserphe

657075

serleuvalvalalaserserproglumetalalysleupheleu

808590

lysthrhisasphisilephealaserargproglnthralaala

95100105

glylyspheilealapheasnasnseraspileleutrpalapro

110115120

tyrglyprotyrtrpargargglyarglysiletyrleuthrglu

125130135

leupheserserlysargleuglusertyrglutyrileargval

140145150

glugluileargasppheileserargleutyralacyssergly

155160165

lysprothrvalleulysasphisleuserargvalthrleuser

170175180

ileileserargilevalleuglylyslystyrphesergluser

185190195

gluaspserlystyrgluthrserglyvalthrleuglugluphe

200205210

glnglumetleuglygluleupheleuleuserglyvalleuasn

215220225

ileglyasptrpileprotrpleuasppheleuaspleuglngly

230235240

tyrvallysargmetlysalaleulyslysargleuaspprophe

245250255

tyrgluhisilepheaspgluhislysalaasnargglualaleu

260265270

glyaspasnphevalprolysaspmetvalaspleuleuleugln

275280285

leualaaspaspaspthrasnleuaspasplysleuthrcysasn

290295300

argvallysglymetthrglnaspleuilepheglyalathrasp

305310315

thralaalathralaleuglutrpalametserglu

320325

序列3.盐肤木rchf3m基因碱基序列与编码氨基酸序列的对应图

cacaacactaatacaatggaagctgtttcttgggttattttaggcctg48

metglualavalsertrpvalileleuglyleu

1510

gcatggctagctgccatagccttcctcagaaaaatctcatcttcg93

alatrpleualaalailealapheleuarglysileserserser

152025

tggcgccacccacgaaaatttccaccaggtcctaaaccgtggcct138

trparghisproarglyspheproproglyprolysprotrppro

303540

attatcggcaaccttcatctcatcggtccactccctcaccaatct183

ileileglyasnleuhisleuileglyproleuprohisglnser

455055

tttcacaaactatcccaaaaatatggagaaataatgcaactcaag228

phehislysleuserglnlystyrglygluilemetglnleulys

606570

attggctctttctctcttgttgttgcctcttctccagaaatggct273

ileglyserpheserleuvalvalalaserserproglumetala

758085

aagctttttctcaagacacatgatcatatctttgcttccagacct318

lysleupheleulysthrhisasphisilephealaserargpro

9095100

caaactgcagcaggcaagttcatagcttttaacaactcagatatt363

glnthralaalaglylyspheilealapheasnasnseraspile

105110115

ttgtgggctccttatggaccatattggcgccgaggccgtaaaatt408

leutrpalaprotyrglyprotyrtrpargargglyarglysile

120125130

tacctcacagagctatttagttcaaaacgactcgagtcttacgag453

tyrleuthrgluleupheserserlysargleuglusertyrglu

135140145

tacattcgtgttgaagaaatacgagactttatatctcgcctgtat498

tyrileargvalglugluileargasppheileserargleutyr

150155160

gcctgttcggggaagccaactgtgcttaaagatcatctctcacgc543

alacysserglylysprothrvalleulysasphisleuserarg

165170175

gttaccctcagcattataagcagaattgtgttgggtaagaagtac588

valthrleuserileileserargilevalleuglylyslystyr

180185190

tttagtgagtcagaagactcaaaatatgaaacatcgggtgtgaca633

pheserglusergluaspserlystyrgluthrserglyvalthr

195200205

cttgaagagtttcaagagatgttaggtgagttgttcttgctcagt678

leugluglupheglnglumetleuglygluleupheleuleuser

210215220

ggagtgctgaatattggggattggattccgtggctggatttcttg723

glyvalleuasnileglyasptrpileprotrpleuasppheleu

225230235

gacctgcaaggatatgtgaagcgaatgaaggccttaaagaaaaga768

aspleuglnglytyrvallysargmetlysalaleulyslysarg

240245250

cttgatccattttatgagcacatatttgatgaacacaaagctaac813

leuaspprophetyrgluhisilepheaspgluhislysalaasn

255260265

agggaagcattgggggataattttgtgccaaaagacatggtggat858

argglualaleuglyaspasnphevalprolysaspmetvalasp

270275280

ttactattgcagctagctgatgatgataccaatcttgatgataag903

leuleuleuglnleualaaspaspaspthrasnleuaspasplys

285290295

ctaacgtgtaatagagttaagggcatgacacaggatctcatattt948

leuthrcysasnargvallysglymetthrglnaspleuilephe

300305310

ggagcaacggataccgcagctactgccttagaatgggctatgtctgaa996

glyalathraspthralaalathralaleuglutrpalametserglu

315320325

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1