本发明涉及一种以左旋多巴为底物全细胞转化合成咖啡酸的方法,属于生物化工领域。
背景技术:
咖啡酸是一种高价值的芳香类化合物,结构上可划分为羟基肉桂酸,其同时具有酚羟基和丙烯酸2个官能团。体内和体外研究表明,咖啡酸具有一系列生理功能。例如,通过氧化机制,咖啡酸可以抑制癌细胞增殖;咖啡酸具有免疫调节和抗炎活性;咖啡酸亦可作为抗氧化剂,且优于其他天然化合物;另外,咖啡酸还具有抗病毒、抗抑郁、治疗糖尿病等活性。
作为木质素合成的关键中间代谢产物,咖啡酸存在于几乎所有植物中。该途径以L-酪氨酸或L-苯丙氨酸为前体,涉及到反-肉桂酸4-单加氧酶(CYP73A)、苯丙氨酸/酪氨酸氨基裂合酶、对香豆酸3-羟化酶等。然而,咖啡酸在植物中的含量普遍很低,因此提取困难。另一方面,化学方法合成的咖啡酸为顺势咖啡酸和反式咖啡酸的混合物;且由于结构的相似性,完全分离纯化出单一的任一化合物都较为困难。
通过合成生物学途径策略,将咖啡酸在植物中的合成途径平移至微生物底盘中,构建具有咖啡酸合成能力的工程菌是目前主要的研究思路。然而,由于酪氨酸等底物的溶解性较差,该类工程菌的咖啡酸产量和对底物的转化率均较低。通过以L-酪氨酸高产菌株作为咖啡酸异源合成途径的底盘,有助于解决该问题,然而效果并不理想,其表现为生产周期较长,且产量并未显著提高。
技术实现要素:
本发明要解决的问题是提供一种咖啡酸的生物合成方法,为此,本发明首先提供了一种表达酪氨酸氨基裂合酶的重组大肠杆菌。
所述的酪氨酸氨基裂合酶RgTAL来源于粘红酵母(Rhodotorula glutinis),其氨基酸序列如SEQ ID NO.1所示,编码酪氨酸氨基裂合酶的基因序列如SEQ ID NO.2所示。
所述的大肠杆菌为大肠杆菌BL21(DE3)。
所用的表达载体为pET-28a(PB),其DNA序列如SEQ ID NO.3所示,基因RgTAL通过限制性酶切位点Bam HI/Hind III亚克隆至表达载体pET-28a(PB)。
本发明还提供以所述重组大肠杆菌生产咖啡酸的方法,是以左旋多巴为底物,通过重组大肠杆菌全细胞转化合成咖啡酸。
所述的转化体系中,全细胞转化的反应介质为10-200mM的磷酸盐缓冲液,全细胞转化体系中重组大肠杆菌的浓度为OD600=20±1,底物浓度范围为0.01-10g/L,所述的反应体系的pH范围为6.0-9.0,反应温度范围为25-42℃。
在本发明的一种实施方式中,所述的反应介质为10-200mM的磷酸盐缓冲液。
在本发明的一种实施方式中,全细胞转化的反应介质为50mM的磷酸盐缓冲液,全细胞转化体系中重组大肠杆菌的浓度为OD600=20±1,底物浓度为1g/L,所述的反应体系的pH范围为7.5,反应温度范围为37℃。
在本发明的一种实施方式中,重组大肠杆菌的培养使用TB培养基。
本发明的有益之处:本发明创建了一种以左旋多巴为底物的咖啡酸的生物合成方法。与以往的以L-酪氨酸为底物的转化方法相比,该方法底物溶解度较高,产量高,转化率,且生产效率高。与化学合成方法相比,该方法的产物为单一的反-咖啡酸,不需要对同分异构体进行进一步的分离。在本较佳反应条件下,反应6小时后咖啡酸的产量为910.90mg/L,转化率为99.70%。为目前已知转化率最高的一种生物法合成咖啡酸的方法。
附图说明
图1咖啡酸的色谱图。其中,1为咖啡酸对应的色谱峰。
图2阴离子模式下咖啡酸的质谱图。其中,A为179.0350m/z对应的提取粒子流;B为咖啡酸的一级质谱图;C为咖啡酸对应的二级质谱图。
图3转化过程中不同时间点对应的咖啡酸产量。
图4不同温度条件下咖啡酸的产量。
图5不同pH条件下咖啡酸的产量。
图6不同底物浓度条件下咖啡酸的产量和转化率。
具体实施方式
材料与方法
咖啡酸和左旋多巴(L-DOPA)标准品购自Sigma-Aldrich(St.Louis,MO),Rhodotorula glutinis酪氨酸氨基裂合酶基因RgTAL由金斯瑞生物科技有限公司优化并合成,序列为SQ2。
TB培养基的配置:酵母粉24g/L,胰蛋白胨12g/L,甘油4ml/L,磷酸二氢钾17mM,磷酸氢二钾72mM。为防止沉淀,将磷酸二氢钾/磷酸氢二钾配制成10倍浓度的母液,过滤除菌,使用前加入。其他成分121℃高压蒸汽灭菌15min。
50mM磷酸盐缓冲液PBS的配置:分别配置50mM的NaH2PO4和50mM的Na2HPO4,以NaH2PO4滴定Na2HPO4至不同的pH。
样品分析:将样品12000rpm离心2min,取上清,以甲醇稀释10倍后,使用0.22μm滤膜过滤。样品分析使用Shimadzu LC-MS/MS-IT-TOF,进样体积10μL,使用自动进样器进样。使用C18反向色谱柱(Thermo scientific,ODS-2HYPERSIL,Dim.(mm)250×4.6,particle size5μm)对样品进行分离。流动相A为水,流动相B为甲醇。使用梯度洗脱,0min 5%B,8min25%B,9min 5%B,维持该浓度至12min。流速为1mL/min。柱温:40℃。使用紫外检测器,λ=323nm测定咖啡酸,λ=280nm测定左旋多巴。质谱分析使用负离子模式,以提取离子流(extracted ion chromatograms,EIC)m/z=179.0350检测咖啡酸,以提取离子流m/z=196.0615检测左旋多巴。二级质谱MS/MS分析的前体分别为:咖啡酸179.0350m/z,左旋多巴196.0615m/z;宽度设置为1Da。通过与标准品的保留时间、一级质谱、二级质谱图进行比对,确定目标物质。使用液相色谱图的峰面积对咖啡酸和左旋多巴进行定量分析。
实施例1
重组大肠杆菌的构建方法:RgTAL由金斯瑞生物科技有限公司优化合成,并克隆至pUC57-Simple,重组质粒命名为pUC57-TcXAL。使用限制性内切酶Bam HI/Hind III消化重组载体pUC57-TcXAL和表达载体pET-28a(+),使用琼脂糖凝胶电泳分离没切产物,并分别回收目的基因RgTAL(2082bp)和表达载体(5368bp)。按照摩尔比4:1混合酶切后的目的基因和表达载体,使用T4连接酶在16℃条件下连接过夜。将连接产物转化大肠杆菌JM109感受态细胞,涂布含有50μg/mL卡那霉素的LB平板。通过菌落PCR验证阳性转化子,所用引物序列为SQ4/SQ5。将阳性转化子转接至含有50μg/mL卡那霉素的液体LB培养基,37℃、220rpm过夜培养后提取质粒,将质粒转化大肠杆菌BL21(DE3)感受态细胞,即得到表达RgTAL的重组大肠杆菌工程菌株,命名为E.coli DCA-2。
重组大肠杆菌的培养方法:将平板划线分离的单菌落转接至含有50μg/mL卡那霉素的液体LB培养基,37℃、220rpm过夜培养。以1%(v/v)的接种量转接至装有25mL TB培养基的250mL三角瓶中,同时添加终浓度为50μg/mL的卡那霉素。37℃、220rpm培养4h后,添加终浓度为500μM的IPTG诱导RgTAL的表达,将三角瓶转移至25℃、220rpm,继续培养10h。将菌液收集到离心管中,4000rpm、4℃离心5min收集菌体。
咖啡酸的全细胞转化方法:以25mL PBS洗涤收集的菌体,离心后重悬于等体积的PBS(50mM,pH 7.0)中,菌体浓度为OD600=18±1。同时添加终浓度为1g/L的左旋多巴作为底物进行反应,该反应在37℃、220rpm恒温摇床上进行。以含有空质粒pET-28a(PB)的大肠杆菌BL21(DE3)作为空白对照。特定时间点取样,测定咖啡酸的合成情况。
结果表明,以E.coli DCA-2催化的反应体系中有咖啡酸的合成,而空白对照中则未检测到咖啡酸。该结果验证了RgTAL催化左旋多巴合成咖啡酸的能力,且该合成过程不能自发进行。咖啡酸的色谱图如图1,其中,1为咖啡酸对应的峰;咖啡酸的质谱图如图2所示,其中A为提取粒子流,B为一级质谱图,C为二级质谱图。通过咖啡酸的产量对取样时间点作图,可以确定在转化8小时咖啡酸达到最大产量626.10mg/L,转化率为68.53%,如图3所示。
实施例2温度对转化合成咖啡酸的影响
对咖啡酸转化过程中温度条件进行优化,以重组大肠杆菌E.coli DCA-2作为催化剂,以PBS(50mM,pH 7.0)作为反应介质,左旋多巴添加浓度为1g/L。分别在20℃、25℃、30℃、37℃和42℃的温度条件下进行转化,转速设定为220rpm。由于咖啡酸在6小时达到最大产量,因此在第6小时取样,测定咖啡酸的产量和转化率。
如图4所示,结果表明,咖啡酸的产量随着温度的升高而增加,温度超过37℃后,咖啡酸的产量不增反而降低。这可能与咖啡酸在较高温度条件下的降解有关。在37℃条件下转化6小时后,咖啡酸达到最大产量,即865.75mg/L,转化率为94.76%。
实施例3pH对咖啡酸生产结果的影响
对咖啡酸转化过程中的pH条件进行优化,以重组大肠杆菌E.coli DCA-2作为催化剂,左旋多巴添加浓度为1g/L。转化条件设定为37℃、220rpm。分别以不同pH(6.0、6.5、7.0、7.5、8.0、8.5)的PBS(50mM)作为转化介质。分别在第6小时取样,测定咖啡酸的产量和转化率。
如图5所示,结果表明,咖啡酸的产量随着pH的升高而增加,当pH超过7.5后,咖啡酸的产量开始降低。这可能和咖啡酸在碱性条件下容易转化为苯醌类化合物有关。在37℃条件下转化6小时后,咖啡酸达到最大产量,即910.90mg/L,转化率为99.70%,为目前已知生物法合成咖啡酸中转化率最高的一种方法。
实施例4不同底物浓度对咖啡酸生产的影响
对咖啡酸转化过程中的底物浓度进行优化,以重组大肠杆菌E.coli DCA-2作为催化剂,左旋多巴添加浓度分别为2g/L、5g/L和10g/L。转化条件为在上述最优条件,即37℃、220rpm、pH 7.5。在第6小时取样,测定咖啡酸的产量和转化率。
如图6所示,结果表明,随着底物浓度的增加,咖啡酸的产量不断提高,10g/L时的咖啡酸产量最高,达到4.33g/L。但是,随着底物浓度的提高,底物的转化率不断降低。原因可能在于,底物在6h时尚未完全转化。因此,延长转化时间可能有利于进一步提高底物的转化率。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一种以左旋多巴为底物全细胞转化合成咖啡酸的方法
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 693
<212> PRT
<213> Rhodotorula glutinis
<400> 1
Met Ala Pro Arg Pro Thr Ser Gln Ser Gln Ala Arg Thr Cys Pro Thr
1 5 10 15
Thr Gln Val Thr Gln Val Asp Ile Val Glu Lys Met Leu Ala Ala Pro
20 25 30
Thr Asp Ser Thr Leu Glu Leu Asp Gly Tyr Ser Leu Asn Leu Gly Asp
35 40 45
Val Val Ser Ala Ala Arg Lys Gly Arg Pro Val Arg Val Lys Asp Ser
50 55 60
Asp Glu Ile Arg Ser Lys Ile Asp Lys Ser Val Glu Phe Leu Arg Ser
65 70 75 80
Gln Leu Ser Met Ser Val Tyr Gly Val Thr Thr Gly Phe Gly Gly Ser
85 90 95
Ala Asp Thr Arg Thr Glu Asp Ala Ile Ser Leu Gln Lys Ala Leu Leu
100 105 110
Glu His Gln Leu Cys Gly Val Leu Pro Ser Ser Phe Asp Ser Phe Arg
115 120 125
Leu Gly Arg Gly Leu Glu Asn Ser Leu Pro Leu Glu Val Val Arg Gly
130 135 140
Ala Met Thr Ile Arg Val Asn Ser Leu Thr Arg Gly His Ser Ala Val
145 150 155 160
Arg Leu Val Val Leu Glu Ala Leu Thr Asn Phe Leu Asn His Gly Ile
165 170 175
Thr Pro Ile Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp Leu
180 185 190
Ser Pro Leu Ser Tyr Ile Ala Ala Ala Ile Ser Gly His Pro Asp Ser
195 200 205
Lys Val His Val Val His Glu Gly Lys Glu Lys Ile Leu Tyr Ala Arg
210 215 220
Glu Ala Met Ala Leu Phe Asn Leu Glu Pro Val Val Leu Gly Pro Lys
225 230 235 240
Glu Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ser Met Ala
245 250 255
Thr Leu Ala Leu His Asp Ala His Met Leu Ser Leu Leu Ser Gln Ser
260 265 270
Leu Thr Ala Met Thr Val Glu Ala Met Val Gly His Ala Gly Ser Phe
275 280 285
His Pro Phe Leu His Asp Val Thr Arg Pro His Pro Thr Gln Ile Glu
290 295 300
Val Ala Gly Asn Ile Arg Lys Leu Leu Glu Gly Ser Arg Phe Ala Val
305 310 315 320
His His Glu Glu Glu Val Lys Val Lys Asp Asp Glu Gly Ile Leu Arg
325 330 335
Gln Asp Arg Tyr Pro Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Leu
340 345 350
Val Ser Asp Leu Ile His Ala His Ala Val Leu Thr Ile Glu Ala Gly
355 360 365
Gln Ser Thr Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Lys Thr Ser
370 375 380
His His Gly Gly Asn Phe Gln Ala Ala Ala Val Ala Asn Thr Met Glu
385 390 395 400
Lys Thr Arg Leu Gly Leu Ala Gln Ile Gly Lys Leu Asn Phe Thr Gln
405 410 415
Leu Thr Glu Met Leu Asn Ala Gly Met Asn Arg Gly Leu Pro Ser Cys
420 425 430
Leu Ala Ala Glu Asp Pro Ser Leu Ser Tyr His Cys Lys Gly Leu Asp
435 440 445
Ile Ala Ala Ala Ala Tyr Thr Ser Glu Leu Gly His Leu Ala Asn Pro
450 455 460
Val Thr Thr His Val Gln Pro Ala Glu Met Ala Asn Gln Ala Val Asn
465 470 475 480
Ser Leu Ala Leu Ile Ser Ala Arg Arg Thr Thr Glu Ser Asn Asp Val
485 490 495
Leu Ser Leu Leu Leu Ala Thr His Leu Tyr Cys Val Leu Gln Ala Ile
500 505 510
Asp Leu Arg Ala Ile Glu Phe Glu Phe Lys Lys Gln Phe Gly Pro Ala
515 520 525
Ile Val Ser Leu Ile Asp Gln His Phe Gly Ser Ala Met Thr Gly Ser
530 535 540
Asn Leu Arg Asp Glu Leu Val Glu Lys Val Asn Lys Thr Leu Ala Lys
545 550 555 560
Arg Leu Glu Gln Thr Asn Ser Tyr Asp Leu Val Pro Arg Trp His Asp
565 570 575
Ala Phe Ser Phe Ala Ala Gly Thr Val Val Glu Val Leu Ser Ser Thr
580 585 590
Ser Leu Ser Leu Ala Ala Val Asn Ala Trp Lys Val Ala Ala Ala Glu
595 600 605
Ser Ala Ile Ser Leu Thr Arg Gln Val Arg Glu Thr Phe Trp Ser Ala
610 615 620
Ala Ser Thr Ser Ser Pro Ala Leu Ser Tyr Leu Ser Pro Arg Thr Gln
625 630 635 640
Ile Leu Tyr Ala Phe Val Arg Glu Glu Leu Gly Val Lys Ala Arg Arg
645 650 655
Gly Asp Val Phe Leu Gly Lys Gln Glu Val Thr Ile Gly Ser Asn Val
660 665 670
Ser Lys Ile Tyr Glu Ala Ile Lys Ser Gly Arg Ile Asn Asn Val Leu
675 680 685
Leu Lys Met Leu Ala
690
<210> 2
<211> 2082
<212> DNA
<213> 人工序列
<400> 2
atggcgccgc gcccgacttc tcaaagccag gcccgcactt gcccgaccac ccaggttacc 60
caagttgata tcgttgagaa aatgctggcg gctccgactg atagcaccct ggagctggac 120
ggttatagcc tgaacctggg tgatgttgtg agcgctgcgc gtaagggtcg tccggttcgt 180
gttaaagata gcgatgaaat ccgcagcaaa atcgacaaga gcgttgaatt tctgcgcagc 240
caactgagca tgtctgttta cggtgtgacc accggctttg gcggctccgc ggacacccgc 300
accgaggacg caattagcct gcaaaaggcg ctgctggaac accagctgtg tggtgtgctg 360
ccgagcagct tcgacagctt tcgcctgggt cgtggtctgg agaacagcct gccgctggaa 420
gttgttcgcg gtgcaatgac cattcgtgtg aactctctga cccgtggcca tagcgctgtt 480
cgtctggttg ttctggaagc actgaccaac tttctgaacc acggtattac cccgattgtt 540
ccgctgcgcg gtaccatctc cgcgagcggc gatctgtctc cactgtctta cattgcagcg 600
gcgattagcg gtcacccgga tagcaaagtt cacgtggttc atgaaggcaa agagaagatc 660
ctgtacgcgc gcgaagcgat ggcgctgttt aacctggagc cggtggttct gggtccgaag 720
gagggcctgg gtctggtgaa cggtaccgca gtttccgcga gcatggcaac cctggcactg 780
cacgacgcgc acatgctgag cctgctgagc caatctctga ccgcgatgac cgtggaggcg 840
atggttggtc acgcgggcag cttccatcca ttcctgcacg atgttacccg tccgcacccg 900
acccaaatcg aggttgcggg taacattcgc aaactgctgg agggctctcg cttcgcggtt 960
caccacgagg aagaggttaa ggttaaggat gatgaaggca ttctgcgtca ggatcgttat 1020
ccgctgcgca ccagcccgca atggctgggt ccgctggtgt ccgacctgat tcacgctcat 1080
gccgttctga ccatcgaagc gggtcaaagc accaccgata acccactgat cgatgttgag 1140
aacaagacca gccatcacgg tggcaacttt caagcggcag cggttgccaa cactatggaa 1200
aagacccgtc tgggcctggc ccaaatcggt aaactgaact tcacccagct gaccgagatg 1260
ctgaacgcgg gcatgaaccg tggcctgccg agctgcctgg cggctgaaga cccatccctg 1320
agctatcatt gcaaaggtct ggacattgcg gcggctgcat ataccagcga actgggccac 1380
ctggctaacc cggttaccac ccacgttcaa ccggctgaaa tggcaaacca ggcggtgaac 1440
agcctggcgc tgattagcgc acgtcgtacc accgaatcta acgacgttct gtccctgctg 1500
ctggcaaccc acctgtactg cgtgctgcag gcgatcgacc tgcgtgcgat tgagttcgag 1560
ttcaagaaac agtttggtcc ggccattgtt agcctgatcg accaacactt tggtagcgcg 1620
atgaccggta gcaacctgcg tgatgagctg gttgaaaagg ttaacaagac tctggccaag 1680
cgtctggagc aaaccaacag ctacgatctg gttccgcgct ggcacgacgc ttttagcttc 1740
gctgcaggca ctgttgttga ggttctgtcc agcaccagcc tgagcctggc ggccgtgaac 1800
gcatggaagg ttgcggcagc cgagagcgcg atctccctga cccgccaggt tcgtgaaacc 1860
ttttggtccg ctgcaagcac ctccagcccg gcgctgtctt acctgagccc gcgcacccag 1920
atcctgtacg catttgtgcg tgaggaactg ggtgttaaag cccgccgtgg tgacgttttc 1980
ctgggtaaac aagaagttac catcggcagc aacgttagca agatttacga agccatcaag 2040
agcggccgta tcaacaacgt tctgctgaag atgctggcat aa 2082
<210> 3
<211> 5371
<212> DNA
<213> 人工序列
<400> 3
gccatattca acgggaaacg tcttgctcta ggccgcgatt aaattccaac atggatgctg 60
atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc 120
gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg 180
ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc 240
cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc 300
ccgggaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg 360
atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta 420
acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg 480
atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa 540
tgcataaact tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg 600
ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa 660
tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt 720
cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc 780
agtttcattt gatgctcgat gagtttttct aagaattaat tcatgagcgg atacatattt 840
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 900
cctgaaattg taaacgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc 960
tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc 1020
gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 1080
tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 1140
ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 1200
agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 1260
aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 1320
accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt cccattcgcc aatccggagt 1380
cgactcctcc tttcgctagc aaaaaacccc tcaagacccg tttagaggcc ccaaggggtt 1440
atgctagtta ttgctcagcg gtggcagcag ccaactcagc ttcctttact agtttgttag 1500
cagccggatc tcagtggtgg tggtggtggt gctcgagtgc ggccgcaagc ttgtagacgg 1560
agctcgaatt cggatccgcg acccatttgc tgtccaccag tcatgcttgc catatggctg 1620
ccgcgcggca ccaggccgct gctgtgatga tgatgatgat ggctgctgcc catggtatat 1680
ctccttctta aagttaaaca aaattatttc tagaggggaa ttgttatccg ctcacaattc 1740
ccctatagtg agtcgtatta atttcgcggg atcgagatct cgatcctcta cgccggacgc 1800
atcgtggccg gcatcaccgg cgcctaggtg cggttgctgg cgcctatatc gccgacatca 1860
ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc ggcgtgggta 1920
tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat gcaccattcc 1980
ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta atgcaggagt 2040
cgcataaggg agagcgtcga gatcccggac accatcgaat ggcgcaaaac ctttcgcggt 2100
atggcatgat agcgcccgga agagagtcaa ttcagggtgg tgaatgtgaa accagtaacg 2160
ttatacgatg tcgcagagta tgccggtgtc tcttatcaga ccgtttcccg cgtggtgaac 2220
caggccagcc acgtttctgc gaaaacgcgg gaaaaagtgg aagcggcgat ggcggagctg 2280
aattacattc ccaaccgcgt ggcacaacaa ctggcgggca aacagtcgtt gctgattggc 2340
gttgccacct ccagtctggc cctgcacgcg ccgtcgcaaa ttgtcgcggc gattaaatct 2400
cgcgccgatc aactgggtgc cagcgtggtg gtgtcgatgg tagaacgaag cggcgtcgaa 2460
gcctgtaaag cggcggtgca caatcttctc gcgcaacgcg tcagtgggct gatcattaac 2520
tatccgctgg atgaccagga tgccattgct gtggaagctg cctgcactaa tgttccggcg 2580
ttatttcttg atgtctctga ccagacaccc atcaacagta ttattttctc ccatgaagac 2640
ggtacgcgac tgggcgtgga gcatctggtc gcattgggtc accagcaaat cgcgctgtta 2700
gcgggcccat taagttctgt ctcggcgcgt ctgcgtctgg ctggctggca taaatatctc 2760
actcgcaatc aaattcagcc gatagcggaa cgggaaggcg actggagtgc catgtccggt 2820
tttcaacaaa ccatgcaaat gctgaatgag ggcatcgttc ccactgcgat gctggttgcc 2880
aacgatcaga tggcgctggg cgcaatgcgc gccattaccg agtccgggct gcgcgttggt 2940
gcggatatct cggtagtggg atacgacgat accgaagaca gctcatgtta tatcccgccg 3000
ttaaccacca tcaaacagga ttttcgcctg ctggggcaaa ccagcgtgga ccgcttgctg 3060
caactctctc agggccaggc ggtgaagggc aatcagctgt tgcccgtctc actggtgaaa 3120
agaaaaacca ccctggcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 3180
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 3240
taatgtaagt tagctcactc attaggcacc gggatctcga ccgatgccct tgagagcctt 3300
caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac 3360
tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg 3420
cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat 3480
cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa 3540
gcaggccatt atcgccggca tggcggcccc acgggtgcgc atgatcgtgc tcctgtcgtt 3600
gaggacccgg ctaggctggc ggggttgcct tactggttag cagaatgaat caccgatacg 3660
cgagcgaacg tgaagcgact gctgctgcaa aacgtctgcg acctgagcaa caacatgaat 3720
ggtcttcggt ttccgtgttt cgtaaagtct ggaaacgcgg aagtcagcgc cctgcaccat 3780
tatgttccgg atctgcatcg caggatgctg ctggctaccc tgtggaacac ctacatctgt 3840
attaacgaag cgctggcatt gaccctgagt gatttttctc tggtcccgcc gcatccatac 3900
cgccagttgt ttaccctcac aacgttccag taaccgggca tgttcatcat cagtaacccg 3960
tatcgtgagc atcctctctc gtttcatcgg tatcattacc cccatgaaca gaaatccccc 4020
ttacacggag gcatcagtga ccaaacagga aaaaaccgcc cttaacatgg cccgctttat 4080
cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg atgaacaggc 4140
agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct gcctcgcgcg 4200
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 4260
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 4320
gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac 4380
tatgcggcat cagagcagat tgtactgaga gtgcaccata tatgcggtgt gaaataccgc 4440
acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact 4500
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4560
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4620
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4680
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4740
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4800
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4860
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4920
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4980
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 5040
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 5100
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 5160
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 5220
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 5280
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gaacaataaa actgtctgct 5340
tacataaaca gtaatacaag gggtgttatg a 5371
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
aagaaagcga aaggagcggg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
ccatacccac gccgaaacaa 20