本发明涉及一种提高外源基因mrna的重复性回文序列及其应用,属于基因工程技术领域。
背景技术:
环糊精葡萄糖基转移酶(简称cgt酶)的应用范围较广,主要用于催化生产环糊精。环糊精葡萄糖基转移酶可通过环化作用将淀粉转化生成环糊精。另外,环糊精葡萄糖基转移酶可用来催化将一个或多个糖基转移到碳水化合物上,来改善其特性(如提高溶解性,稳定性,降低细胞毒性,苦味等)。环糊精葡萄糖基转移酶经常通过在大肠杆菌中异源表达来提高其产量。但是通过简单的异源表达提高环糊精葡萄糖基转移酶的产量非常有限,往往需要通过分子改造进一步增强其异源表达量。
在原核细胞表达体系中,mrna的降解是调节基因表达水平的一个重要因素,在一定时期内能翻译成蛋白质的mrna的数量是有限的。大肠杆菌缺乏5’-3’外切核糖核酸酶,而存在大量3’-5’外切核糖核酸酶,比如rnaseii,rnaser,pnpase,andoligoribonucleases,枯草芽孢杆菌中也存在rnaser,pnpase,rnaseph,yham等3’-5’外切核糖核酸酶,谷氨酸棒杆菌中也存在3’-5’外切核糖核酸酶pnpase。这些核酸外切酶可以从mrna的3’端非翻译区来降解mrna。为防止3’端外切核酸酶对mrna的消化作用,rna二级结构为茎环结构的重复性回文序列(repetitiveextragenicpalindromic(rep)序列)被考虑加在mrna的3’端非翻译区。因此,而通过对结构优化而找到一组可以有效保护外源基因mrna的重复性回文序列序列对于环糊精葡萄糖基转移酶高效表达具有重要的指导意义。
技术实现要素:
本发明的第一个目的是提供一种提高外源基因mrna的dna分子,由重复性回文序列和间隔区序列组成;含有如seqidno.1所示的核苷酸序列。
在本发明的一种实施方式中,所述重复性回文序列如seqidno.3所示;所述间隔区序列如seqidno.11组成。
本发明的第二个目的是提供一种携带所述dna分子的载体或表达所述dna分子的细胞。
在本发明的一种实施方式中,所述载体包括pet-20b(+)或pet-28a(+)。
本发明的第三个目的是提供一种基因工程菌,是以pet-20b(+)为载体,以大肠杆菌为宿主,在编码环糊精葡萄糖基转移酶基因序列的3’非翻译区克隆了如seqidno.1所示的核苷酸序列。
在本发明的一种实施方式中,所述编码环糊精葡萄糖基转移酶基因如seqidno.2所示。
本发明的第四个目的是提供构建所述基因工程菌的方法,所述方法包括如下步骤:
(1)以含有seqidno.2所示的环糊精葡萄糖基转移酶的基因序列的重组质粒cgt-p1-1-db3为模板,采用磷酸化之后的pdrep1f/pdrep1r为引物,利用pcr反应扩增含有重复性回文序列的一系列重组质粒。经过筛选选出4组酶活力最高的突变菌株:cgt-rep1/cgt-rep2/cgt-rep3/cgt-rep4,其中含有的重复性回文序列分别如seqidno.3/seqidno.4/seqidno.5/seqidno.6所示。
(2)以质粒cgt-rep1模板,利用pcr反应扩增含有不同的重复性回文序列到终止密码子之间间隔区长度的重组质粒,分别被命名为cgt-rep1-s4/cgt-rep1-s8/cgt-rep1-s12/cgt-rep1-s16/cgt-rep1-s20,其中含有的重复性回文序列分别如seqidno.7/seqidno.8/seqidno.9/seqidno.10/seqidno.11所示。将上述重组质粒转化到大肠杆菌宿主菌中,经过发酵90h后测定cgt酶活力,从中筛选出酶活力最高的菌株,从而得到重复性回文序列到终止密码子之间最佳间隔区长度。
在本发明的一种实施方式中,所述大肠杆菌为e.colibl21、e.colibl21(de3)、e.colijm109、e.colidh5α、e.colitop10中的任意一种。
在本发明的一种实施方式中,所述的大肠杆菌为escherichiacolibl21(de3)。
本发明的第六个目的在于提供一种环糊精葡萄糖基转移酶的生产方法,所述方法是将所述基因工程菌接种至发酵培养基中,发酵至od600为0.6~0.8,加入iptg,诱导3~5d。
在本发明的一种实施方式中,所述诱导是培养温度为25℃~30℃,摇床转速200~220r/min,当菌体培养至od600为0.6~0.8时,加入0.1~0.25mmiptg诱导85~100h。
本发明的第五个目的是提供所述基因工程菌在制备含环糊精葡萄糖基转移酶的产品方面的应用。
本发明还提供所述重复性回文序列在制备蛋白质或含蛋白质的产品中的应用。
有益效果:本发明提供了一种提高外源基因mrna的重复性回文序列,将该序列添加在目标基因3’非翻译区时可以改变目标基因mrna的二级结构使其更加稳定;通过对重复性回文序列到基因的终止密码子之间的间隔区长度的优化,发现当大于12bp时重复性回文序列可以有效提高外源基因的表达量,当间隔区长度为20bp时,发酵液中环糊精葡萄糖基转移酶的酶活为239.2u/ml,相比原始菌株提高了14%。
附图说明
图1为96深孔板筛选得到的4组重组菌株发酵液中环糊精葡萄糖基转移酶的酶活。
图2为含有不同长度的间隔区重复性回文序列的重组菌株发酵液中环糊精葡萄糖基转移酶的蛋白电泳图:m,marker;泳道1:wt,对应重组大肠杆菌cgt-p1-1-db3;泳道2:0,对应cgt-rep1;泳道3:4,对应cgt-rep1-s4;泳道4:8,对应cgt-rep1-s8;泳道5:12,对应cgt-rep1-s12;泳道6:16,对应cgt-rep1-s16;泳道7:20,对应cgt-rep1-s20。
图3为含有不同长度的间隔区重复性回文序列的重组菌株发酵液中环糊精葡萄糖基转移酶的酶活。
图4为不同长度的间隔区重复性回文序列的重组菌株通过rt-pcr测得的不同时期的环糊精葡萄糖基转移酶的相对表达量。
具体实施方式
歧化活力测定方法参考vanderveenba等的方法并做了部分改动,具体步骤为:取600μl含有终浓度4mmo1·l-1的eps和20mmo1·l-1的麦芽糖溶液于50℃水浴保温10min,加入0.1ml适当稀释的酶液,反应10min,加入50μl3mo1·l-1hc1终止反应,5min后加入50μl3mo1·l-1naoh中和,然后加入100μlα-葡萄糖苷酶于60℃反应60min,加入100μl1mo1·l-1na2co3溶液将ph调节到8.0以上,在401nm处测定吸光值。一个酶活单位(u)定义为在该测定条件下每分钟转化1μmo1eps所需的酶量。
实施例1含有不同重复性回文序列的表达载体的制备
以本实验室构建的含有seqidno.4所示的环糊精葡萄糖基转移酶的基因序列的重组质粒cgt-p1-1-db3为模板,采用磷酸化之后的pdrep1f/pdrep1r为引物,用pcr扩增含有重复性回文序列的一系列重组质粒。将所得到的一系列重组质粒转化到大肠宿主菌中,得到一系列分泌表达环糊精葡萄糖基转移酶的重组工程菌cgtasebl21(de3)。将重组工程菌接种至96深孔板中,发酵90h后测定cgt酶活力,并筛选出其中酶活力最高的4组,其中的重组质粒被命名为cgt-rep1/cgt-rep2/cgt-rep3/cgt-rep4,其中含有的重复性回文序列分别如seqidno.3/seqidno.4/seqidno.5/seqidno.6所示。
此实施例所用引物序列:
pdrep1f:gcgccttatccggcctacgatccggcgctaacaaagcccgaaagpdrep1r:
nnnnngcgccgncatccggcttagtggtgatggtgatgatgattctgccaatccac
实施例2含有不同长度重复性回文序列到终止密码子之间间隔区的表达载体的制备
以质粒cgt-rep1模板,采用spacer4f到spacer20r为引物,用pcr扩增含有不同的重复性回文序列到终止密码子之间间隔区长度的重组质粒,分别被命名为cgt-rep1-s4/cgt-rep1-s8/cgt-rep1-s12/cgt-rep1-s16/cgt-rep1-s20,其中含有的间隔区序列分别如seqidno.7/seqidno.8/seqidno.9/seqidno.10/seqidno.11所示。将上述重组质粒转化到大肠杆菌宿主菌中,经过发酵90h后测定cgt酶活力,从中筛选出酶活力最高的菌株,从而得到重复性回文序列到终止密码子之间最佳间隔区长度。
此实施例所用引物序列:
spacer4f:cactaaccccgccggatgccggcgcccata
spacer4r:tccggcggggttagtggtgatggtgatgatgattctgcc
spacer8f:cactaaccccccccgccggatgccggcgcccata
spacer8r:tccggcggggggggttagtggtgatggtgatgatgattctgcc
spacer12f:ccccccccccccgccggatgccggcgcccata
spacer12r:ggggggggggggtttagtggtgatggtgatgatgattctgcc
spacer16f:ccccccccccccccccgccggatgccggcgcccata
spacer16r:ggggggggggggggggttagtggtgatggtgatgatgattctgcc
spacer20f:ccccccccccccccccccccgccggatgccggcgcccata
spacer20r:
ggggggggggggggggggggttagtggtgatggtgatgatgattctgcc
实施例3重组大肠杆菌的诱导表达
种子培养:将保藏的菌种接入装有50mllb培养基的250ml三角瓶中,回旋式摇床转速200r/min,培养温度为37℃,培养8h。发酵培养:将培养好的种子培养液按4%(v/v)的接种量接种至装有100ml发酵培养基的500ml三角瓶中进行培养,开始培养温度为30℃,摇床转速200r/min,当菌体培养至od600为0.6时,加入iptg后迅速转至不同温度的摇床,继续诱导90h。各培养基使用前添加100μg/ml氨苄青霉素。
经过发酵后取发酵上清液进行sds-page电泳(图2),并测量发酵上清液的酶活。测得含有质粒cgt-p1-1-db3、cgt-rep1、cgt-rep2、cgt-rep3、cgt-rep4的重组菌株发酵液上清中环糊精葡萄糖基转移酶的酶活分别为210.6u/ml,202.7u/ml,187.9u/ml,168.2u/ml,138.5u/ml(图1)。可见,重复性回文序列直接添加在终止密码子之后,有一定几率影响核糖体与终止密码子的结合,因此在后续实验中构建了一系列含有不同长度重复性回文序列到终止密码子之间间隔区的重组质粒:cgt-rep1-s4、cgt-rep1-s8、cgt-rep1-s12、cgt-rep1-s16、cgt-rep1-s20,相应发酵上清液酶活分别为:149.1u/ml,178.3u/ml,133.6u/ml,230.4u/ml,219.7u/ml,239.2u/ml(图3)。当重复性回文序列到终止密码子之间间隔区长度为20bp时效果最佳,提高了环糊精葡萄糖基转移酶发酵上清液中胞外蛋白表达量。实施例4实时荧光定量pcr验证
以含有质粒cgt-p1-1-db3的菌株为对照,抽提发酵第24h,48h,72h的发酵上清液离心去尽上清后将菌体至于液氮下研磨,之后按照takar公司的rna抽提试剂盒说明书进行rna的提取。确认rna浓度满足要求后使用takara公司的反转录试剂盒制备cdna。以此为模板进行使用takara公司的
rtcgt1f:cctgatggacgagattga;
rtcgt1r:cgaagtagtggttgttagc;
16srrnaf:gtaacctgcctgtaagactgg;
16srrnar:ctgtaagtggtagccgaagc。
对各个发酵菌株中的基因转录水平进行归一化处理后,发现24h时cgt-rep1-s12,cgt-rep1-s20分别比原始质粒cgt-p1-1-db3所在菌株提高了3.1,4.3倍;48h时cgt-rep1-s12,cgt-rep1-s20分别比原始质粒cgt-p1-1-db3所在菌株提高了2.4,5.0倍;72h时cgt-rep1-s12,cgt-rep1-s20分别比原始质粒cgt-p1-1-db3所在菌株提高了2.5,3.8倍(图4)。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
sequencelisting
<110>江南大学
<120>一种提高外源基因mrna的重复性回文序列及其应用
<160>11
<170>patentinversion3.3
<210>1
<211>58
<212>dna
<213>人工序列
<400>1
ccccccccccccccccccccgccggatgccggcgcccatagcgccttatccggcctac58
<210>2
<211>2106
<212>dna
<213>人工序列
<400>2
gcaatcttcatcgtgtccgacacccaaaaggtgaccgtcgaggcagctggtaatctgaac60
aaggtcaacttcacctctgacgttgtataccagatcgtcgtagaccgtttcgtagacggt120
aacacttccaacaacccgtctggtgcactgttctctagcggttgtactaacctgcgtaag180
tactgcggtggcgattggcaaggtattatcaacaagatcaacgacggctatctgacggat240
atgggtgtgactgcaatctggatcagccagcctgtcgaaaacgtattctccgtgatgaac300
gacgcttccggttctgctagctaccatggttactgggcacgtgatttcaagaaaccaaac360
ccgttctttggcacgctgagcgacttccagcgtctggttgatgcagcacatgctaaaggt420
atcaaagtgatcatcgacttcgccccaaaccacactagcccggcttctgaaactaaccca480
agctacatggagaacggtcgtctgtacgataacggtaccctgctgggtggttatactaac540
gacgccaatatgtacttccaccacaacggtggcaccactttctcttctctggaggatggt600
atctaccgtaacctgttcgacctggcggatctgaaccaccaaaacccggttatcgatcgt660
tacctgaaagacgcagtaaaaatgtggatcgacatgggtatcgacggtatccgcatggat720
gcggtaaaacacatgccgttcggttggcaaaaaagcctgatggacgagattgacaactac780
cgcccggtcttcactttcggtgaatggttcctgagcgaaaacgaagtggacgctaacaac840
cactacttcgcgaacgaaagcggcatgagcctgctggatttccgtttcggtcagaaactg900
cgtcaggtactgcgtaacaacagcgataactggtacggtttcaatcagatgatccaggac960
acggcttccgcttatgacgaggtcctggaccaggtaactttcatcgacaaccacgacatg1020
gaccgttttatgatcgacggcggtgatcctcgtaaagtggatatggcactggctgtactg1080
ctgacttctcgtggtgtaccaaacatctactacggtaccgaacagtacatgaccggtaac1140
ggtgacccgaacaaccgtaaaatgatgtcctcctttaacaaaaacacccgcgcctaccag1200
gtgatccaaaaactgtcctccctgcgccgcaacaatccggctctggcttatggtgatact1260
gaacagcgctggattaatggcgatgtttacgtgtacgaacgccagtttggcaaagatgtc1320
gtgctggtcgccgttaaccgctctagcagctccaactactccatcaccggtctgtttacc1380
gcgctgccggcgggtacttatactgatcaactgggcggtctgctggacggtaataccatt1440
caggttggctctaacggctctgttaacgcgtttgatctgggccctggcgaagttggcgta1500
tgggcgtattctgcgaccgaatctaccccgattattggccacgttggcccgatgatgggc1560
caggtgggccaccaggttaccattgatggcgaaggcttcggcactaacaccggcacggtt1620
aaatttggcactaccgcggcgaacgttgtgtcttggtctaataaccagattgttgttgcc1680
gttccgaacgtttctccgggtaaatataacattaccgttcagtcctccagcggccagacc1740
tctgcggcgtatgacaattttgaagttctgacgaacgatcaggtttctgttcgctttgtt1800
gttaataacgccaccaccaacctgggccagaacatttatattgttggcaacgtgtatgaa1860
ctgggcaactgggatacgtctaaagcgattggtccgatgttcaaccaggttgtgtattcc1920
tatccgacctggtacatcgacgtgtccgttccggaaggcaaaaccatcgaattcaaattt1980
atcaaaaaagattcccagggcaatgtgacgtgggaaagcggttccaaccacgtttacacc2040
accccgaccaacaccaccggcaaaattatcgtggattggcagaatcatcatcaccatcac2100
cactaa2106
<210>3
<211>38
<212>dna
<213>人工序列
<400>3
gccggatgccggcgcccatagcgccttatccggcctac38
<210>4
<211>38
<212>dna
<213>人工序列
<400>4
gccggatggcggcgcgtaatgcgccttatccggcctac38
<210>5
<211>38
<212>dna
<213>人工序列
<400>5
gccggatgccggcgctacgtgcgccttatccggcctac38
<210>6
<211>38
<212>dna
<213>人工序列
<400>6
gccggatgtcggcgcctggcgcgccttatccggcctac38
<210>7
<211>4
<212>dna
<213>人工序列
<400>7
cccc4
<210>8
<211>8
<212>dna
<213>人工序列
<400>8
cccccccc8
<210>9
<211>12
<212>dna
<213>人工序列
<400>9
cccccccccccc12
<210>10
<211>16
<212>dna
<213>人工序列
<400>10
cccccccccccccccc16
<210>11
<211>20
<212>dna
<213>人工序列
<400>11
cccccccccccccccccccc20