本发明涉及一种大肠杆菌高强度串联启动子及其应用,属于合成生物技术领域。
背景技术:
启动子是控制基因表达的第一个功能元件,启动子强度直接决定了其下游基因的表达水平。在代谢工程改造过程中,利用不同强度的启动子对代谢路径中的不同基因的表达强度进行调节可有效地平衡代谢流,降低代谢负担,进而增加目的产物产量。
目前,大肠杆菌中最常用的是一系列的诱导型启动子,利用这些启动子表达多基因代谢途径时往往难以做到对每一个基因表达强度进行精确调控。近年来,有研究者基于组成型启动子的随机突变策略构建启动子文库,最终获得了广泛强度的启动子库。然而这些突变获得的启动子由于序列极为相似,在多基因表达时容易发生质粒内部同源重组丢失基因。此外经由突变获得的启动子极少出现强度高于原始启动子的突变体,这也限制了此策略的应用。通过启动子工程可以得到适合要求的启动子,然而,启动子工程改造组成型启动子的往往会破坏启动子内在的功能区域,因此面临高失败风险。
技术实现要素:
为了解决上述问题,本发明通过启动子工程提供可在大肠杆菌内高效表达的串联启动子,为避免基因表达过程中的诱导剂添加提供了选择,同时可用于调节多基因的表达途经,控制菌体代谢流向。
所述串联启动子的核苷酸序列如SEQ ID NO.6~9任一所示。
本发明还提供一种表达载体,具有核苷酸序列如SEQ ID NO.6~9任一所示的启动子。所述表达载体的骨架包括常见的大肠杆菌、枯草芽孢杆菌的表达载体。
本发明提供应用所述启动子构建的重组菌。
在本发明的一种实施方式中,所述重组菌的宿主细胞为细菌、藻类、真菌、酵母、植物、昆虫或动物宿主细胞中的任意一种。
在本发明的一种实施方式中,应用所述启动子构建的重组菌,是利用所述的启动子连接目的基因,构建重组质粒,并在宿主中表达。
本发明的有益之处:本发明构建了4种具有梯度强度的高强度串联启动子。在传统的基因工程研究中,诱导型启动子常常被用来表达相关基因,然而由于需要添加诱导剂和难以实现同时对多个基因表达强度进行微调,诱导型启动子难以应用于多基因表达途径。来源于基因组的组成型启动子往往由于其表达强度较低同样难以满足要求。本发明所构建的高强度串联启动子不需要额外的添加诱导剂,具备高转录强度和高翻译强度,同时其具有一定的强度梯度(启动子强度跨度为4.5倍)可用于对多基因表达途径进行微调。
具体实施方式
实施例1
大肠杆菌JM109用于质粒构建,大肠杆菌K12MG1655用于表达蛋白测定启动子强度。
分析大肠杆菌转录组数据,从中选取一系列的具有高强度表达效果的启动子。以大肠杆菌K12MG1655基因组为模版,扩增启动子PssrA、PdnaKJ、PgrpE、PalsRBACE和PinfC-rplT。为测定这5个启动子的强度,以融合PCR的方式融合PssrA、PdnaKJ、PgrpE、PalsRBACE、PinfC-rplT和报告基因EGFP。
为构建和测定高强度串联启动子,以融合PCR的方法融合构建串联启动子PssrA-PinfC-rplT、PdnaKJ-PinfC-rplT、PgrpE-PinfC-rplT和PalsRBACE-PinfC-rplT,并以融合PCR的方法将串联启动子PssrA-PinfC-rplT、PdnaKJ-PinfC-rplT、PgrpE-PinfC-rplT、PalsRBACE-PinfC-rplT分别与EGFP融合。PCR扩增反应均由高保真DNA聚合酶PrimeSTAR HS(premix)(TaKaRa)扩增,扩增引物见表1。
表1所用引物序列
将融合PCR产物经过BamHI/SacI双酶切后与同样双酶切的pCDFDuet-1质粒连接,化学转化大肠杆菌K12MG1655中。测序正确的重组菌用于后续的启动子强度测定。
1、转录强度
为了测定所筛选的组成型启动子PssrA、PdnaKJ、PgrpE、PalsRBACE和PinfC-rplT的转录强度,将重组菌于LB或MOPS培养基中37℃,220rpm条件下培养,培养至稳定期(11h)后于4000rpm,4℃离心收集菌体,提取菌体的总mRNA,反转录后进行实时定量PCR检测,测定EGFP的胞内mRNA丰度。检测结果显示其mRNA丰度分别是10mM阿拉伯糖诱导的PBAD启动子的46.3、25.6、8.3、6.4和0.2倍。
2、翻译强度
为了测定所筛选的组成型启动子PssrA、PdnaKJ、PgrpE、PalsRBACE和PinfC-rplT的翻译强度,重组菌于LB或MOPS培养基中37℃,220rpm条件下培养,于大肠杆菌MG1655中稳定期检测胞内检测胞内EGFP水平。重组菌于LB培养基或MOPS中37℃,220rpm条件下培养,培养至稳定期(11h)后于4000rpm,4℃离心离心收集菌体,利用PBS(pH=7.4)缓冲液清洗细胞2次,以除去死菌体、菌体分泌物和培养基沉淀成分从而降低荧光检测背景。将清洗后的菌体至于96孔荧光板中于多功能荧光酶标仪检测荧光强度和菌体的OD600,检测条件为488nm激发,520nm发射。启动子翻译强度为荧光强度与OD600的比值。
荧光酶标仪检测结果显示翻译强度分别为10mM阿拉伯糖诱导的PBAD启动子的0、0.16、0.06、0.016和1.37倍。
3、串联启动子的翻译强度
为了测定经过启动子工程改造后的串联启动子PssrA-PinfC-rplT、PdnaKJ-PinfC-rplT、PgrpE-PinfC-rplT和PalsRBACE-PinfC-rplT的表达强度,以EGFP为表达基因,于大肠杆菌MG1655中稳定期检测胞内检测胞内EGFP水平。荧光酶标仪检测结果显示翻译强度分别为10mM阿拉伯糖诱导的PBAD启动子的4.09、1.30、0.90和2.04倍。
以上结果表明,筛选得到的4组成型启动子PssrA、PdnaKJ、PgrpE和PalsRBACE具有远高于10mM阿拉伯糖诱导的PBAD启动子的转录强度,然而翻译水平却很低,表明这4种启动子具有较强的基因转录能力,而其蛋白质的表达能力较低。反观启动子PinfC-rplT具有较低的mRNA水平却用于较高的蛋白质表达水平。经过启动子工程,得到的4种串联启动子PssrA-PinfC-rplT、PdnaKJ-PinfC-rplT、PgrpE-PinfC-rplT和PalsRBACE-PinfC-rplT同时具备了PssrA、PdnaKJ、PgrpE和PalsRBACE启动子的高转录效率和PinfC-rplT启动子的高翻译效率。
4、串联启动子表达基因的普适性
由于四种串联启动子均具有相同的5'-UTR区域,因此,为了检测这四种串联启动子5'-mRNA对于不同基因的表达,可以只选取启动子PssrA-PinfC-rplT表达其他的报告基因,并测定其表达强度,从而确定来源于PinfC-rplT的5'-mRNA对不同基因表达的影响。
分别用PssrA-PinfC-rplT串联启动子与红色荧光蛋白(RFP)和β-半乳糖苷酶(LacZ)融合表达,随后,测定其翻译强度分别为PBAD启动子的2.92倍和3.5倍。实验证明,针对不同的目的基因,串联启动子同样具有较高的表达强度。
5、串联启动子构建的负向结果
需注意的是由于mRNA二级结构的影响,因此组合高强度启动子的转录区域和5'-UTR区域并不一定能够得到正向结果。
利用试验中筛选得到的另一种高翻译强度组成型启动子PrpsT与PssrA串联构建得到串联启动子PssrA-PrpsT。然而,对这PssrA-PrpsT的翻译强度进行测定发现:其翻译强度降低到了PrpsT的0.43倍。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一种大肠杆菌高强度串联启动子及其应用
<160> 25
<170> PatentIn version 3.3
<210> 1
<211> 146
<212> DNA
<213> 大肠杆菌K12 MG1655
<400> 1
attggctatc acatccgaca caaatgttgc catcccattg cttaatcgaa taaaaatcag 60
gctacatggg tgctaaatct ttaacgataa cgccattgag gctggtcatg gcgctcataa 120
atctggtata cttaccttta cacatt 146
<210> 2
<211> 175
<212> DNA
<213> 大肠杆菌K12 MG1655
<400> 2
gcacaaaaaa tttttgcatc tcccccttga tgacgtggtt tacgacccca tttagtagtc 60
aaccgcagtg agtgagtctg caaaaaaatg aaattgggca gttgaaacca gacgtttcgc 120
ccctattaca gactcacaac cacatgatga ccgaatatat agtggagacg tttag 175
<210> 3
<211> 99
<212> DNA
<213> 大肠杆菌K12 MG1655
<400> 3
gattgatgac aatgtgagtg cttcccttga aaccctgaaa ctgatcccca taataagcga 60
agttagcgag atgaatgcga aaaaaacgcg gagaaattc 99
<210> 4
<211> 206
<212> DNA
<213> 大肠杆菌K12 MG1655
<400> 4
agcaacatct atcatctaaa aaaccagaaa aacaaataac atcatgtttt taaactaatt 60
aaatgaaata aaattttaag ccactcgcca ttgttcacaa taaaataaac tttataaatt 120
ttattttttt gtgaagtcgc cagcatcttt tctgttcttg ctgtggtgat atagtggcgt 180
cttcaattca aggacaagag aacgtg 206
<210> 5
<211> 240
<212> DNA
<213> 大肠杆菌K12 MG1655
<400> 5
gcgggcattc gtgttaaagc agacttgaga aatgagaaga ttggctttaa aatccgcgag 60
cacactttgc gtcgcgtccc atatatgctg gtctgtggtg ataaagaggt ggaatcaggc 120
aaagttgccg ttcgcacccg ccgtggtaaa gacctgggaa gcatggacgt aaatgaagtg 180
atcgagaagc tgcaacaaga gattcgcagc cgcagtctta aacaattgga ggaataaggt 240
<210> 6
<211> 374
<212> DNA
<213> 人工序列
<400> 6
attggctatc acatccgaca caaatgttgc catcccattg cttaatcgaa taaaaatcag 60
gctacatggg tgctaaatct ttaacgataa cgccattgag gctggtcatg gcgctcataa 120
atctggtata cttaccttta cacattgcgg gcattcgtgt taaagcagac ttgagaaatg 180
agaagattgg ctttaaaatc cgcgagcaca ctttgcgtcg cgtcccatat atgctggtct 240
gtggtgataa agaggtggaa tcaggcaaag ttgccgttcg cacccgccgt ggtaaagacc 300
tgggaagcat ggacgtaaat gaagtgatcg agaagctgca acaagagatt cgcagccgca 360
gtcttaaaca attg 374
<210> 7
<211> 415
<212> DNA
<213> 人工序列
<400> 7
gcacaaaaaa tttttgcatc tcccccttga tgacgtggtt tacgacccca tttagtagtc 60
aaccgcagtg agtgagtctg caaaaaaatg aaattgggca gttgaaacca gacgtttcgc 120
ccctattaca gactcacaac cacatgatga ccgaatatat agtggagacg tttaggcggg 180
cattcgtgtt aaagcagact tgagaaatga gaagattggc tttaaaatcc gcgagcacac 240
tttgcgtcgc gtcccatata tgctggtctg tggtgataaa gaggtggaat caggcaaagt 300
tgccgttcgc acccgccgtg gtaaagacct gggaagcatg gacgtaaatg aagtgatcga 360
gaagctgcaa caagagattc gcagccgcag tcttaaacaa ttggaggaat aaggt 415
<210> 8
<211> 339
<212> DNA
<213> 人工序列
<400> 8
gattgatgac aatgtgagtg cttcccttga aaccctgaaa ctgatcccca taataagcga 60
agttagcgag atgaatgcga aaaaaacgcg gagaaattcg cgggcattcg tgttaaagca 120
gacttgagaa atgagaagat tggctttaaa atccgcgagc acactttgcg tcgcgtccca 180
tatatgctgg tctgtggtga taaagaggtg gaatcaggca aagttgccgt tcgcacccgc 240
cgtggtaaag acctgggaag catggacgta aatgaagtga tcgagaagct gcaacaagag 300
attcgcagcc gcagtcttaa acaattggag gaataaggt 339
<210> 9
<211> 446
<212> DNA
<213> 人工序列
<400> 9
agcaacatct atcatctaaa aaaccagaaa aacaaataac atcatgtttt taaactaatt 60
aaatgaaata aaattttaag ccactcgcca ttgttcacaa taaaataaac tttataaatt 120
ttattttttt gtgaagtcgc cagcatcttt tctgttcttg ctgtggtgat atagtggcgt 180
cttcaattca aggacaagag aacgtggcgg gcattcgtgt taaagcagac ttgagaaatg 240
agaagattgg ctttaaaatc cgcgagcaca ctttgcgtcg cgtcccatat atgctggtct 300
gtggtgataa agaggtggaa tcaggcaaag ttgccgttcg cacccgccgt ggtaaagacc 360
tgggaagcat ggacgtaaat gaagtgatcg agaagctgca acaagagatt cgcagccgca 420
gtcttaaaca attggaggaa taaggt 446
<210> 10
<211> 40
<212> DNA
<213> 人工序列
<400> 10
ctagctagct agggatccat tggctatcac atccgacaca 40
<210> 11
<211> 56
<212> DNA
<213> 人工序列
<400> 11
tgaaaagttc ttctccctta cccataatgt gtaaaggtaa gtataccaga tttatg 56
<210> 12
<211> 56
<212> DNA
<213> 人工序列
<400> 12
agtctgcttt aacacgaatg cccgcaatgt gtaaaggtaa gtataccaga tttatg 56
<210> 13
<211> 41
<212> DNA
<213> 人工序列
<400> 13
ctagctagct agggatccgc acaaaaaatt tttgcatctc c 41
<210> 14
<211> 52
<212> DNA
<213> 人工序列
<400> 14
tgaaaagttc ttctccctta cccatctaaa cgtctccact atatattcgg tc 52
<210> 15
<211> 52
<212> DNA
<213> 人工序列
<400> 15
agtctgcttt aacacgaatg cccgcctaaa cgtctccact atatattcgg tc 52
<210> 16
<211> 34
<212> DNA
<213> 人工序列
<400> 16
tagggatccg attgatgaca atgtgagtgc ttcc 34
<210> 17
<211> 47
<212> DNA
<213> 人工序列
<400> 17
tgaaaagttc ttctccctta cccatgaatt tctccgcgtt tttttcg 47
<210> 18
<211> 47
<212> DNA
<213> 人工序列
<400> 18
agtctgcttt aacacgaatg cccgcgaatt tctccgcgtt tttttcg 47
<210> 19
<211> 37
<212> DNA
<213> 人工序列
<400> 19
atagggatcc agcaacatct atcatctaaa aaaccag 37
<210> 20
<211> 49
<212> DNA
<213> 人工序列
<400> 20
tgaaaagttc ttctccctta cccatcacgt tctcttgtcc ttgaattga 49
<210> 21
<211> 49
<212> DNA
<213> 人工序列
<400> 21
agtctgcttt aacacgaatg cccgccacgt tctcttgtcc ttgaattga 49
<210> 22
<211> 29
<212> DNA
<213> 人工序列
<400> 22
tagggatccg cgggcattcg tgttaaagc 29
<210> 23
<211> 52
<212> DNA
<213> 人工序列
<400> 23
tgaaaagttc ttctccctta cccatacctt attcctccaa ttgtttaaga ct 52
<210> 24
<211> 34
<212> DNA
<213> 人工序列
<400> 24
cgcggtaccg agctcggccg caaattaaag cctt 34
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<400> 25
atgggtaagg gagaagaact tttc 24