本发明属于基因工程领域,具体涉及结构优化的苯酚羟化酶基因序列。
技术背景
苯酚是一种用途广泛的重要有机化工原料。它主要用于生产酚醛树脂、双酚a、己内酰胺、己二酸、苯胺、烷基酚以及水杨酸等,此外,还可用作溶剂、试剂和消毒剂等,在合成纤维、合成橡胶、塑料、医药、农药、香料、染料以及涂料等方面有广泛的应用。预计未来几年,随着我国环氧树脂和聚碳酸酯在电子、建材、汽车工业、通讯和计算机等领域消费量的不断增长,我国苯酚的需求量仍将稳步提高。
随着苯酚的大量生产和消费,苯酚不可避免的会通过各种途径污染地下水、地表水和土壤。苯酚对人、动物和农作物都有严重的危害。我国政府将其列入68种优先污染物名单并且明确规定饮用水中苯酚含量不得超过0.002mg/l。
微生物由于具有极强的变异性和适应性,是自然环境中降解酚类化合物的主要成员。目前,国内外发现的苯酚降解菌,主要包括细菌和真菌两大类。其中细菌主要来源于假单胞菌属(pseudomonassp.),其次是芽孢杆菌属(bacillussp.)、产碱菌属(alcaligenssp.)和红球菌属(rhodococcussp.)。
苯酚羟化酶是苯酚降解途径中的关键酶,它将苯酚转变为芳香族化合物降解的一种核心代谢产物——邻苯二酚,之后再通过一些相同或相似的核心代谢途径最终为微生物所利用。苯酚羟化酶主要包括三种类型,单亚基羟化酶、双亚基羟化酶和多亚基羟化酶。单亚基苯酚羟化酶是一种黄素蛋白单加氧酶,它能够打断o2的o-o键,将其中一个氧原子插入苯酚,另一个氧原子则被还原成水。双亚基或多亚基羟化酶至少都包括两部分,一部分是寡聚蛋白,负责苯环的羟化,另一部分是单组分铁硫黄素蛋白,负责将电子从nad(p)h转移到加氧酶上。有的羟化酶中还具有调控前两个组分相互感应的组分。
技术实现要素:
本发明所要解决的技术问题在于提供一种能在大肠杆菌的表达的苯酚酚羟化酶基因。不同于rhodococcuserythropolis野生型苯酚羟化酶基因操纵子表达模式(aj973228.1),本发明只保留苯酚羟化酶的两个亚基的编码序列,并分别连接上独立的t7启动子和终止子调控其表达。同时优化编码区基因结构,遵循以下原则:(一)优化基因密码子,提高基因翻译效率。(二)消除基因内部的常用限制性内切酶的识别位点,便于表达盒构建。(三)消除逆向重复序列、茎环结构和转录终止信号,使基因内部的gc/at均衡,提高rna的稳定性。(四)使基因编码蛋白符合n端原则,以提高翻译蛋白的稳定性。(五)优化mrna二级结构自由能,以提高基因表达效率。值得指出的是,本发明对密码子的优化同时还兼顾了植物的密码子偏爱。
所述经优化的苯酚羟化酶亚基phea1的核苷酸序列如seqidno1所示。所述经优化的苯酚羟化酶亚基phea2的核苷酸序列如seqidno2所示。每个基因两端分别边上t7启动子与终止子,完整序列两端分别连接ecorⅰ和hindⅲ酶切位点,全长序列由南京金斯瑞公司合成(参见图1)。
将合成的基因片段经ecorⅰ和hindⅲ双酶切后,连入相同酶切的载体pet-28a,得到重组质粒pet-ph,并将其转化大肠杆菌bl21(de3),得到阳性株系。
阳性菌株在100毫升m9(含1%甘油和50μg/ml卡那霉素)液体培养中37℃摇菌24小时,离心去上清,菌体用10毫升m9(含1%甘油、0.2%阿拉伯糖、50μg/ml卡那霉素和1mmiptg)液体培养基重悬,向其中添加不同浓度的苯酚,结果证明阳性菌株能够有效去除培养基中的苯酚。
有益效果:
本发明优化并合成了苯酚羟化酶两个亚基的基因序列,并能在大肠杆菌中成功表达,阳性菌株能够有效去除培养基中的苯酚,本发明的基因可用于制备降解苯酚微生物。在废水处理和环境修复等领域具有应用潜力。
附图说明:
图1为用于在大肠杆菌中表达两个基因的载体示意图。
图2为阳性株系对1mm苯酚的羟化作用。
图3为阳性株系对不同浓度苯酚的去除效果。
具体实施方式:
下面结合具体实施方式来进一步阐述本发明。实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对发明的技术方案进行修改或者等同替换,而不脱离本发明的技术方案的精神和范围,其均应涵盖在本发明的权利要求范围中。
本发明实施中未注明的实验方法,如连接、转化、相关培养基的配制等参照分子克隆实验指南第三版(黄培堂等译,中国,科学出版社,2002)中方法进行。所用大肠肝菌由上海市农业科学院生物技术研究所植物基因工程研究室保存,各类限制性内切酶、连接酶等购自上海皓嘉公司。未注明的化学药品为分析纯级,购自生工生物工程(上海)股份公司或上海国药集团有限公司。
实施例1
苯酚羟化酶两个亚基phea1和phea2的优化设计与合成
基于野生型rhodococcuserythropolis菌苯酚羟化酶两个亚基的基因的编码序列,按以下原则:(一)优化基因密码子,兼顾大肠杆菌和植物的密码子偏爱,提高基因翻译效率。(二)消除基因内部的常用限制性内切酶的识别位点,便于表达盒构建。(三)消除逆向重复序列、茎环结构和转录终止信号,使基因内部的gc/at均衡,提高rna的稳定性。(四)使基因编码蛋白符合n端原则,以提高翻译蛋白的稳定性。(五)优化mrna二级结构自由能,以提高基因表达效率。每个基因两端分别边上t7启动子与终止子,完整序列两端分别连接ecorⅰ和hindⅲ酶切位点,全长序列由南京金斯瑞公司合成。
实施例2
大肠杆菌表达载体的构建与转化
将合成的基因片段经ecorⅰ和hindⅲ双酶切后,连入相同酶切的载体pet-28a,得到重组质粒pet-ph。并将其通过热激转化大肠杆菌bl21(de3),在涂布在加有卡那霉素抗性人固体2yt平板上,37℃过夜培养后得到阳性克隆。对阳性克隆中的质粒进行酶切和dna序列测定确定基因序列完整性和正确性。
实施例3
阳性菌株对不同浓度苯酚的羟化作用
阳性菌株接菌于100毫升m9液体培养中(含1%甘油和50μg/ml卡那霉素),37℃摇菌24小时(150rpm),离心去上清,菌体用灭菌的蒸馏水洗一遍,之后用10毫升m9液体培养基重悬(含1%甘油、0.2%阿拉伯糖、50μg/ml卡那霉素和1mmiptg),向其中添加不同浓度的苯酚(1mm、5mm和10mm),37℃摇菌处理,不同时间取菌液,通过hplc检测其残余的苯酚含量(参见图2和图3)。
具体hplc检测条件:安捷伦1100高效液相色谱系统;c18柱(120å,4.6×150mm,5μm);流动相为甲醇:水=30:70,流速为1ml/min;柱温为30℃;检测波长为213nm;进样量为20μl。
序列表
<110>上海市农业科学院
<120>人工优化的双亚基苯酚羟化酶基因及其应用
<160>4
<170>siposequencelisting1.0
<210>1
<211>1629
<212>dna
<213>人工序列(artificalsynthesize)
<400>1
atgactactactgagattccaccaactggtgttgatccagctgacagtggtgctccacag60
gtcaatccagctgctgattctgaggctaatcgtactaagaacttcgctactcgtcctatg120
actggtgatgagtacatcagttctcttcaggatggtcgtgaaatctggcttcatggtgat180
cgtgtcaaggatgtcactactcatcctgctttccgtaatccaatccgtatgactgctcgt240
ttgtatgatgctctccatactggtgaacatgtcgatgctctcactgtcccaactgatact300
ggcaatggtggtgttactatgccattcttccgtactccaaccagtagtgctgatctgctg360
aaggaacgtgatgctatcgctacttgggctcgtatgacttacggttggatgggtcgtagt420
cctgactacaaggcttccttccttggtactctgcacgctaacaaggagctgtacgctcca480
ttccaagacaatgctgaacgttggtatcgtgagagtcaagagaaggtcctctactggaat540
catgctatcatcaatccaccagtcgatcgtcagctgccacctgatgaggttggtgatgtc600
ttcatgaaggttgagaaggagactgatgctggtctcattgtctctggtgctaaggtcgtt660
gctactggtagtgctatcaccaactacaacttcatcgctcattacggtcttccaatcaag720
aagaagcagttcgctctcatctgtactgttccaatggatgctcctggtgtcaagctcatc780
tgtcgtaccagttacactgagcacgctgctgtcatgggttctccattcgactatccactc840
agttctcgtatggatgagaatgataccatcttcgtcttcgacaaggttctcgttccttgg900
gagaacgtcttcatgtacggtgatgtcgatcgtatcaacgctttcttcccacagagtggt960
ttccttccacgtttcaccttccagggttgtactcgtcttgctgtcaagctcgacttcatt1020
gctggtctcctgatgaaggctctggaagctactggtgctggtggtttccgtggtgttcag1080
actcgtgttggtgaggtcattggttggcgtaacctcttctggagtcttactgagagtatg1140
gctcgtgacccagagcaatgggttggtgacagtgtcattccaaagctggagtatggtctg1200
acctaccgtatgttcatgatccaaggctatccacgtatcaaggagatcatcgagcaagat1260
gttgctagtggtctcatctaccttccaagttccagcttggatttcaagtctcctgatgtt1320
cgtccatacctggacaagtacgttcgtggtagtgatggtatcactgctgtcgatcgtgtc1380
aaggtcatgaaggctctctgggacagtatcggtactgagttcggtggtcgtcatgagctg1440
tatgagcgtaactacagtggcaaccacgagaacgtcaaggctgagttgctcttcgctgct1500
cagaaccgtggtcatgcttccagtatgaagggtcttgctgagcagtgcctctccgagtat1560
gatcttgatggttggactgttcctgatctgattggtaacgatgatgtcagcttcttcaag1620
aatcgttaa1629
<210>2
<211>570
<212>dna
<213>人工序列(artificalsynthesize)
<400>2
atggaacagaatcaacttcgtggtatctttggtcagtttgcctctggtgttactgtcatc60
acttgtaccaacgctgatggtcaaccacatggtgctactgtcactgccttcactgctatc120
agtcttgaacctcgtctctgtcagatcaccatgactcgtaagagtaaggcttgtggctat180
cttggtaacgctccattcgctgtcaacatcctggctgctgatcaggttgatactgctatg240
cacttcgctggtcgtccacaacgtactgaacctaagtggattgatggtccaactgctcca300
cttcttgatggtgctgctgctactatcagttgtgttccttggaaggagtatgatggtggt360
gatcacatcatcttcatcggtgagattgttgatgctcagagttctggtaaggacccactg420
ctcttctatcgttccactttccatgatcttggtgctaccagtagcactactgtctggaat480
ggttcccaagatgatcctcattctggttggtttgatgctactaccagtttcactccaatc540
cacctgcaacctgctccacagaccatctaa570
<210>3
<211>542
<212>prt
<213>人工序列(artificalsynthesize)
<400>3
metthrthrthrgluileproprothrglyvalaspproalaaspser
151015
glyalaproglnvalasnproalaalaaspserglualaasnargthr
202530
lysasnphealathrargprometthrglyaspglutyrileserser
354045
leuglnaspglyarggluiletrpleuhisglyaspargvallysasp
505560
valthrthrhisproalapheargasnproileargmetthralaarg
65707580
leutyraspalaleuhisthrglygluhisvalaspalaleuthrval
859095
prothraspthrglyasnglyglyvalthrmetprophepheargthr
100105110
prothrserseralaaspleuleulysgluargaspalailealathr
115120125
trpalaargmetthrtyrglytrpmetglyargserproasptyrlys
130135140
alaserpheleuglythrleuhisalaasnlysgluleutyralapro
145150155160
pheglnaspasnalagluargtrptyrarggluserglnglulysval
165170175
leutyrtrpasnhisalaileileasnproprovalaspargglnleu
180185190
proproaspgluvalglyaspvalphemetlysvalglulysgluthr
195200205
aspalaglyleuilevalserglyalalysvalvalalathrglyser
210215220
alailethrasntyrasnpheilealahistyrglyleuproilelys
225230235240
lyslysglnphealaleuilecysthrvalprometaspalaprogly
245250255
vallysleuilecysargthrsertyrthrgluhisalaalavalmet
260265270
glyserpropheasptyrproleuserserargmetaspgluasnasp
275280285
thrilephevalpheasplysvalleuvalprotrpgluasnvalphe
290295300
mettyrglyaspvalaspargileasnalaphepheproglnsergly
305310315320
pheleuproargphethrpheglnglycysthrargleualavallys
325330335
leuasppheilealaglyleuleumetlysalaleuglualathrgly
340345350
alaglyglypheargglyvalglnthrargvalglygluvalilegly
355360365
trpargasnleuphetrpserleuthrglusermetalaargasppro
370375380
gluglntrpvalglyaspservalileprolysleuglutyrglyleu
385390395400
thrtyrargmetphemetileglnglytyrproargilelysgluile
405410415
ilegluglnaspvalalaserglyleuiletyrleuproserserser
420425430
leuaspphelysserproaspvalargprotyrleuasplystyrval
435440445
argglyseraspglyilethralavalaspargvallysvalmetlys
450455460
alaleutrpaspserileglythrglupheglyglyarghisgluleu
465470475480
tyrgluargasntyrserglyasnhisgluasnvallysalagluleu
485490495
leuphealaalaglnasnargglyhisalasersermetlysglyleu
500505510
alagluglncysleuserglutyraspleuaspglytrpthrvalpro
515520525
aspleuileglyasnaspaspvalserphephelysasnarg
530535540
<210>4
<211>189
<212>prt
<213>人工序列(artificalsynthesize)
<400>4
metgluglnasnglnleuargglyilepheglyglnphealasergly
151015
valthrvalilethrcysthrasnalaaspglyglnprohisglyala
202530
thrvalthralaphethralaileserleugluproargleucysgln
354045
ilethrmetthrarglysserlysalacysglytyrleuglyasnala
505560
prophealavalasnileleualaalaaspglnvalaspthralamet
65707580
hisphealaglyargproglnargthrgluprolystrpileaspgly
859095
prothralaproleuleuaspglyalaalaalathrilesercysval
100105110
protrplysglutyraspglyglyasphisileilepheileglyglu
115120125
ilevalaspalaglnserserglylysaspproleuleuphetyrarg
130135140
serthrphehisaspleuglyalathrserserthrthrvaltrpasn
145150155160
glyserglnaspaspprohisserglytrppheaspalathrthrser
165170175
phethrproilehisleuglnproalaproglnthrile
180185