本发明涉及一种以左旋多巴为底物合成咖啡酸的方法,属于生物化工领域。
背景技术:
咖啡酸是一种高价值的芳香类化合物,结构上可划分为羟基肉桂酸,其同时具有酚羟基和丙烯酸2个官能团。体内和体外研究表明,咖啡酸具有一系列生理功能。例如,通过氧化机制,咖啡酸可以抑制癌细胞增殖;咖啡酸具有免疫调节和抗炎活性;咖啡酸亦可作为抗氧化剂,且优于其他天然化合物;另外,咖啡酸还具有抗病毒、抗抑郁、治疗糖尿病等活性。
作为木质素合成的关键中间代谢产物,咖啡酸存在于几乎所有植物中。该途径以L-酪氨酸或L-苯丙氨酸为前体,涉及到反-肉桂酸4-单加氧酶(CYP73A)、苯丙氨酸/酪氨酸氨基裂合酶、对香豆酸3-羟化酶等。然而,咖啡酸在植物中的含量普遍很低,因此提取困难。另一方面,化学方法合成的咖啡酸为顺势咖啡酸和反式咖啡酸的混合物;且由于结构的相似性,完全分离纯化出单一的任一化合物都较为困难。通过合成生物学途径策略,将咖啡酸在植物中的合成途径平移至微生物底盘中,构建具有咖啡酸合成能力的工程菌是目前主要的研究思路。然而,由于酪氨酸等底物的溶解性较差,该类工程菌的咖啡酸产量和对底物的转化率均较低。通过以L-酪氨酸高产菌株作为咖啡酸异源合成途径的底盘,有助于解决该问题,然而效果并不理想,其表现为生产周期较长,且产量并未显著提高。
技术实现要素:
本发明要解决的问题是提供一种咖啡酸的生物合成方法,为此,本发明首先提供了一种表达酪氨酸氨基裂合酶TcXAL的重组大肠杆菌。
所述的酪氨酸氨基裂合酶TcXAL来源于皮状丝孢酵母(Trichosporon cutaneum),其氨基酸序列如SEQ ID NO.1所示,编码酪氨酸氨基裂合酶的基因序列如SEQ ID NO.2所示。
所述的大肠杆菌为大肠杆菌BL21(DE3)。
所用的表达载体为pET-28a(PB),其DNA序列如SEQ ID NO.3所示,基因TcXAL通过限制性酶切位点Bam HI/Hind III亚克隆至表达载体pET-28a(PB)。
本发明还提供以所述重组大肠杆菌生产咖啡酸的方法,是以左旋多巴为底物,通过重组大肠杆菌全细胞转化合成咖啡酸。
所述的转化体系中,全细胞转化的反应介质为10-200mM的磷酸盐缓冲液,全细胞转化体系中重组大肠杆菌的浓度为OD600=20±1,底物浓度范围为0.01-10g/L,所述的反应体系的pH范围为6.0-9.0,反应温度范围为25-42℃。
在本发明的一种实施方式中,所述的反应介质为10-200mM的磷酸盐缓冲液。
在本发明的一种实施方式中,全细胞转化的反应介质为50mM的磷酸盐缓冲液,全细胞转化体系中重组大肠杆菌的浓度为OD600=20±1,底物浓度为1g/L,所述的反应体系的pH范围为7.5,反应温度范围为37℃。
在本发明的一种实施方式中,重组大肠杆菌的培养使用TB培养基。
本发明的有益之处:本发明创建了一种以左旋多巴为底物的咖啡酸的生物合成方法。与以往的以L-酪氨酸为底物的转化方法相比,该方法底物溶解度较高,产量高,转化率,且生产效率高。与化学合成方法相比,该方法的产物为单一的反-咖啡酸,不需要对同分异构体进行进一步的分离。在本研究的最优条件下,反应6小时后咖啡酸的产量为910.90mg/L,转化率为99.70%。为目前已知转化率最高的一种生物法合成咖啡酸的方法。
附图说明
图1咖啡酸的色谱图。其中,1为咖啡酸对应的色谱峰。
图2阴离子模式下咖啡酸的质谱图。其中,A为179.0350m/z对应的提取粒子流;B为咖啡酸的一级质谱图;C为咖啡酸对应的二级质谱图。
图3转化过程中不同时间点对应的咖啡酸产量。
图4不同温度条件下咖啡酸的产量。
图5不同pH条件下咖啡酸的产量。
图6不同底物浓度条件下咖啡酸的产量。
具体实施方式
材料与方法
咖啡酸和左旋多巴(L-DOPA)标准品购自Sigma-Aldrich(St.Louis,MO),Trichosporon cutaneum酪氨酸氨基裂合酶基因TcXAL由金斯瑞生物科技有限公司优化并合成,序列为SQ2。
TB培养基的配置:酵母粉24g/L,胰蛋白胨12g/L,甘油4ml/L,磷酸二氢钾17mM,磷酸氢二钾72mM。为防止沉淀,将磷酸二氢钾/磷酸氢二钾配制成10倍浓度的母液,过滤除菌,使用前加入。其他成分121℃高压蒸汽灭菌15min。
50mM磷酸盐缓冲液PBS的配置:分别配置50mM的NaH2PO4和50mM的Na2HPO4,以NaH2PO4滴定Na2HPO4至不同的pH。
样品分析:将样品12000rpm离心2min,取上清,以甲醇稀释10倍后,使用0.22μm滤膜过滤。样品分析使用Shimadzu LC-MS/MS-IT-TOF,进样体积10μL,使用自动进样器进样。使用C18反向色谱柱(Thermo scientific,ODS-2 HYPERSIL,Dim.(mm)250×4.6,particle size 5μm)对样品进行分离。流动相A为水,流动相B为甲醇。使用梯度洗脱,0min 5%B,8min 25%B,9min 5%B,维持该浓度至12min。流速为1mL/min。柱温:40℃。使用紫外检测器,λ=323nm测定咖啡酸,λ=280nm测定左旋多巴。质谱分析使用负离子模式,以提取离子流(extracted ion chromatograms,EIC)m/z=179.0350检测咖啡酸,以提取离子流m/z=196.0615检测左旋多巴。二级质谱MS/MS分析的前体分别为:咖啡酸179.0350m/z,左旋多巴196.0615m/z;宽度设置为1Da。通过与标准品的保留时间、一级质谱、二级质谱图进行比对,确定目标物质。使用液相色谱图的峰面积对咖啡酸和左旋多巴进行定量分析。
实施例1
重组大肠杆菌的构建方法:TcXAL由金斯瑞生物科技有限公司优化合成,并克隆至pUC57-Simple,重组质粒命名为pUC57-TcXAL。使用限制性内切酶Bam HI/HindIII消化重组载体pUC57-TcXAL和表达载体pET-28a(+),使用琼脂糖凝胶电泳分离没切产物,并分别回收目的基因TcXAL(2070bp)和表达载体(5368bp)。按照摩尔比4:1混合酶切后的目的基因和表达载体,使用T4连接酶在16℃条件下连接过夜。将连接产物转化大肠杆菌JM109感受态细胞,涂布含有50μg/mL卡那霉素的LB平板。通过菌落PCR验证阳性转化子,所用引物序列为SQ4/SQ5。将阳性转化子转接至含有50μg/mL卡那霉素的液体LB培养基,37℃、220rpm过夜培养后提取质粒,将质粒转化大肠杆菌BL21(DE3)感受态细胞,即得到表达TcXAL的重组大肠杆菌工程菌株,命名为E.coli DCA-1。
重组大肠杆菌的培养方法:将平板划线分离的单菌落转接至含有50μg/mL卡那霉素的液体LB培养基,37℃、220rpm过夜培养。以1%(v/v)的接种量转接至装有25mL TB培养基的250mL三角瓶中,同时添加终浓度为50μg/mL的卡那霉素。37℃、220rpm培养4h后,添加终浓度为500μM的IPTG诱导TcXAL的表达,将三角瓶转移至25℃、220rpm,继续培养10h。将菌液收集到离心管中,4000rpm、4℃离心5min收集菌体。
咖啡酸的全细胞转化方法:以25mL PBS洗涤收集的菌体,离心后重悬于等体积的PBS(50mM,pH 7.0)中,菌体浓度为OD600=18±1。同时添加终浓度为1g/L的左旋多巴作为底物进行反应,该反应在37℃、220rpm恒温摇床上进行。以含有空质粒pET-28a(+)的大肠杆菌BL21(DE3)作为空白对照。特定时间点取样,测定咖啡酸的合成情况。
结果表明,以E.coli DCA-1催化的反应体系中有咖啡酸的合成,而空白对照中则未检测到咖啡酸。该结果验证了TcXAL催化左旋多巴合成咖啡酸的能力,且该合成过程不能自发进行。咖啡酸的色谱图如图1,其中,1为咖啡酸对应的峰;咖啡酸的质谱图如图2所示,其中A为提取粒子流,B为一级质谱图,C为二级质谱图。通过咖啡酸的产量对取样时间点作图,可以确定在转化6小时咖啡酸达到最大产量583.98mg/L,转化率为63.92%,如图3所示。
实施例2咖啡酸转化过程中温度条件优化
对咖啡酸转化过程中温度条件进行优化,以重组大肠杆菌E.coli DCA-1作为催化剂,以PBS(50mM,pH 7.0)作为反应介质,左旋多巴添加浓度为1g/L。分别在20℃、25℃、30℃、37℃和42℃的温度条件下进行转化,转速设定为220rpm。由于咖啡酸在6小时达到最大产量,因此在第6小时取样,测定咖啡酸的产量和转化率。
如图4所示,结果表明,咖啡酸的产量随着温度的升高而增加,温度超过37℃后,咖啡酸的产量不增反而降低。这可能与咖啡酸在较高温度条件下的降解有关。在37℃条件下转化6小时后,咖啡酸达到最大产量,即865.75mg/L,转化率为94.76%。
实施例3 pH对咖啡酸生产结果的影响
对咖啡酸转化过程中的pH条件进行优化,以重组大肠杆菌E.coli DCA-1作为催化剂,左旋多巴添加浓度为1g/L。转化条件设定为37℃、220rpm。分别以不同pH(6.0、6.5、7.0、7.5、8.0、8.5)的PBS(50mM)作为转化介质。分别在第6小时取样,测定咖啡酸的产量和转化率。
如图5所示,结果表明,咖啡酸的产量随着pH的升高而增加,当pH超过7.5后,咖啡酸的产量开始降低。这可能和咖啡酸在碱性条件下容易转化为苯醌类化合物有关。在37℃条件下转化6小时后,咖啡酸达到最大产量,即910.90mg/L,转化率为99.70%,为目前已知生物法合成咖啡酸中转化率最高的一种方法。
实施例4不同底物浓度对咖啡酸生产的影响
对咖啡酸转化过程中的底物浓度进行优化,以重组大肠杆菌E.coli DCA-1作为催化剂,左旋多巴添加浓度分别为2g/L、5g/L和10g/L。转化条件为在上述最优条件,即37℃、220rpm、pH 7.5。在第6小时取样,测定咖啡酸的产量和转化率。
如图6所示,结果表明,随着底物浓度的增加,咖啡酸的产量不断提高,10g/L时的咖啡酸产量最高,达到3.12g/L。但是,随着底物浓度的提高,底物的转化率不断降低。原因可能在于,底物在6h时尚未完全转化。因此,延长转化时间可能有利于进一步提高底物的转化率。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一种以左旋多巴为底物合成咖啡酸的方法
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 689
<212> PRT
<213> 皮状丝孢酵母
<400> 1
Met Phe Ile Glu Thr Asn Val Ala Lys Pro Ala Ser Thr Lys Ala Met
1 5 10 15
Asn Ala Gly Ser Ala Lys Ala Ala Pro Val Glu Pro Phe Ala Thr Tyr
20 25 30
Ala His Ser Gln Ala Thr Lys Thr Val Ser Ile Asp Gly His Thr Met
35 40 45
Lys Val Gly Asp Val Val Ala Val Ala Arg His Gly Ala Lys Val Glu
50 55 60
Leu Ala Ala Ser Val Ala Gly Pro Val Arg Ala Ser Val Asp Phe Lys
65 70 75 80
Glu Ser Lys Lys His Thr Ser Ile Tyr Gly Val Thr Thr Gly Phe Gly
85 90 95
Gly Ser Ala Asp Thr Arg Thr Ser Asp Thr Glu Ala Leu Gln Ile Ser
100 105 110
Leu Leu Glu His Gln Leu Cys Gly Phe Leu Pro Thr Asp Ala Thr Tyr
115 120 125
Glu Gly Met Leu Leu Ala Ala Met Pro Ile Pro Ile Val Arg Gly Ala
130 135 140
Met Ala Val Arg Val Asn Ser Cys Val Arg Gly His Ser Gly Val Arg
145 150 155 160
Leu Glu Val Leu Gln Ser Phe Ala Asp Phe Ile Asn Arg Gly Leu Val
165 170 175
Pro Cys Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp Leu Ser
180 185 190
Pro Leu Ser Tyr Ile Ala Gly Ala Ile Cys Gly His Pro Asp Val Lys
195 200 205
Val Phe Asp Thr Ala Ala Ser Pro Pro Thr Val Leu Thr Ser Pro Glu
210 215 220
Ala Ile Ala Lys Tyr Gly Leu Lys Thr Val Lys Leu Ala Ser Lys Glu
225 230 235 240
Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ala Ala Gly Ala
245 250 255
Leu Ala Leu Tyr Asp Ala Glu Cys Leu Ala Ile Met Ser Gln Thr Asn
260 265 270
Thr Val Leu Thr Val Glu Ala Leu Asp Gly His Val Gly Ser Phe Ala
275 280 285
Pro Phe Ile Gln Glu Ile Arg Pro His Ala Gly Gln Ile Glu Ala Ala
290 295 300
Arg Asn Ile Arg His Met Leu Gly Gly Ser Lys Leu Ala Val His Glu
305 310 315 320
Glu Ser Glu Leu Leu Ala Asp Gln Asp Ala Gly Ile Leu Arg Gln Asp
325 330 335
Arg Tyr Ala Leu Arg Thr Ser Ala Gln Trp Ile Gly Pro Gln Leu Glu
340 345 350
Ala Leu Gly Leu Ala Arg Gln Gln Ile Glu Thr Glu Leu Asn Ser Thr
355 360 365
Thr Asp Asn Pro Leu Ile Asp Val Glu Gly Gly Met Phe His His Gly
370 375 380
Gly Asn Phe Gln Ala Met Ala Val Thr Ser Ala Met Asp Ser Ala Arg
385 390 395 400
Ile Val Leu Gln Asn Leu Gly Lys Leu Ser Phe Ala Gln Val Thr Glu
405 410 415
Leu Ile Asn Cys Glu Met Asn His Gly Leu Pro Ser Asn Leu Ala Gly
420 425 430
Ser Glu Pro Ser Thr Asn Tyr His Cys Lys Gly Leu Asp Ile His Cys
435 440 445
Gly Ala Tyr Cys Ala Glu Leu Gly Phe Leu Ala Asn Pro Met Ser Asn
450 455 460
His Val Gln Ser Thr Glu Met His Asn Gln Ser Val Asn Ser Met Ala
465 470 475 480
Phe Ala Ser Ala Arg Arg Thr Met Glu Ala Asn Glu Val Leu Ser Leu
485 490 495
Leu Leu Gly Ser Gln Met Tyr Cys Ala Thr Gln Ala Leu Asp Leu Arg
500 505 510
Val Met Glu Val Lys Phe Lys Met Ala Ile Val Lys Leu Leu Asn Glu
515 520 525
Thr Leu Thr Lys His Phe Ala Ala Phe Leu Thr Pro Glu Gln Leu Ala
530 535 540
Lys Leu Asn Thr His Ala Ala Ile Thr Leu Tyr Lys Arg Leu Asn Gln
545 550 555 560
Thr Pro Ser Trp Asp Ser Ala Pro Arg Phe Glu Asp Ala Ala Lys His
565 570 575
Leu Val Gly Val Ile Met Asp Ala Leu Met Val Asn Asp Asp Ile Thr
580 585 590
Asp Leu Thr Asn Leu Pro Lys Trp Lys Lys Glu Phe Ala Lys Glu Ala
595 600 605
Gly Asn Leu Tyr Arg Ser Ile Leu Val Ala Thr Thr Ala Asp Gly Arg
610 615 620
Asn Asp Leu Glu Pro Ala Glu Tyr Leu Gly Gln Thr Arg Ala Val Tyr
625 630 635 640
Glu Ala Val Arg Ser Glu Leu Gly Val Lys Val Arg Arg Gly Asp Val
645 650 655
Ala Glu Gly Lys Ser Gly Lys Ser Ile Gly Ser Ser Val Ala Lys Ile
660 665 670
Val Glu Ala Met Arg Asp Gly Arg Leu Met Gly Ala Val Gly Lys Met
675 680 685
Phe
<210> 2
<211> 2070
<212> DNA
<213> 皮状丝孢酵母
<400> 2
atgtttattg aaaccaacgt ggcaaaaccg gctagcacga aagcgatgaa tgccggctct 60
gcaaaagcgg ccccggtcga accgttcgct acctatgcgc atagtcaggc caccaaaacg 120
gtgtccatcg atggccacac gatgaaagtt ggtgacgtgg ttgctgttgc gcgtcatggc 180
gcgaaagttg aactggcagc tagtgttgct ggtccggtcc gtgcgtccgt ggattttaaa 240
gaaagcaaaa aacacacctc gatttatggc gtgaccacgg gtttcggcgg ttcagccgat 300
acccgtacgt cggacacgga agcactgcag atctctctgc tggaacatca actgtgcggc 360
tttctgccga ccgatgcgac gtacgagggt atgctgctgg cggccatgcc gattccgatc 420
gtgcgtggtg cgatggcggt ccgtgtgaac agctgtgttc gtggccactc tggtgttcgc 480
ctggaagtcc tgcagagctt tgccgatttc attaatcgtg gtctggttcc gtgcgtcccg 540
ctgcgtggta ccatcagtgc atccggtgac ctgtcaccgc tgtcgtatat tgctggcgcg 600
atctgtggtc atccggatgt taaagtcttc gacaccgcag cttcaccgcc gaccgttctg 660
acgtcgccgg aagcaattgc aaaatatggc ctgaaaaccg tcaaactggc gagcaaagaa 720
ggcctgggtc tggttaacgg tacggcagtc tctgcggcgg caggtgctct ggcactgtac 780
gatgccgaat gcctggcaat catgagtcag accaatacgg tgctgaccgt tgaagctctg 840
gacggccatg ttggttcctt tgcaccgttc attcaggaaa tccgtccgca cgcgggccaa 900
attgaagctg cgcgtaacat ccgccatatg ctgggcggtt caaaactggc cgtgcacgaa 960
gaatcggaac tgctggctga tcaggacgcg ggtattctgc gtcaagatcg ctacgccctg 1020
cgtaccagtg cacagtggat cggtccgcaa ctggaagccc tgggtctggc acgccagcaa 1080
attgaaacgg aactgaactc caccacggat aatccgctga tcgacgtgga aggcggtatg 1140
tttcatcacg gcggtaactt ccaggcgatg gcggtcacca gtgctatgga ttccgcgcgc 1200
attgtgctgc agaatctggg taaactgtca tttgcacaag tgaccgaact gatcaactgc 1260
gaaatgaatc atggcctgcc gtcgaacctg gcgggtagcg aaccgtctac caattatcat 1320
tgtaaaggcc tggatattca ctgcggtgcc tactgtgcag aactgggctt tctggcgaac 1380
ccgatgagca atcatgttca gtctaccgaa atgcacaacc agagcgtgaa cagcatggcg 1440
ttcgcaagcg cacgtcgcac gatggaagcg aacgaagttc tgagtctgct gctgggttcc 1500
cagatgtatt gtgctaccca agcgctggat ctgcgcgtca tggaagtgaa atttaaaatg 1560
gccattgtga aactgctgaa tgaaaccctg acgaaacatt ttgccgcatt cctgaccccg 1620
gaacagctgg cgaaactgaa cacccacgct gcgatcacgc tgtacaaacg tctgaatcag 1680
accccgtcat gggattcggc accgcgcttt gaagacgccg caaaacatct ggtgggcgtt 1740
attatggatg cgctgatggt taacgatgac atcaccgacc tgacgaatct gccgaaatgg 1800
aagaaagaat ttgccaaaga agcaggtaac ctgtatcgta gcattctggt ggctaccacg 1860
gcggatggcc gcaatgacct ggaaccggcc gaatatctgg gtcagacccg tgccgtgtac 1920
gaagcagttc gcagcgaact gggcgtcaaa gtgcgtcgcg gtgatgttgc ggaaggcaaa 1980
agcggtaaat ctattggcag ctctgtcgct aaaatcgtgg aagcaatgcg tgacggtcgc 2040
ctgatgggtg cagtgggtaa aatgttttaa 2070
<210> 3
<211> 5368
<212> DNA
<213> 人工序列
<400> 3
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tccgcgaccc atttgctgtc caccagtcat gctagccata 240
tggctgccgc gcggcaccag gccgctgctg tgatgatgat gatgatggct gctgcccatg 300
gtatatctcc ttcttaaagt taaacaaaat tatttctaga ggggaattgt tatccgctca 360
caattcccct atagtgagtc gtattaattt cgcgggatcg agatctcgat cctctacgcc 420
ggacgcatcg tggccggcat caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc 480
gacatcaccg atggggaaga tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc 540
gtgggtatgg tggcaggccc cgtggccggg ggactgttgg gcgccatctc cttgcatgca 600
ccattccttg cggcggcggt gctcaacggc ctcaacctac tactgggctg cttcctaatg 660
caggagtcgc ataagggaga gcgtcgagat cccggacacc atcgaatggc gcaaaacctt 720
tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc 780
agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt 840
ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc 900
ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct 960
gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat 1020
taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg 1080
cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat 1140
cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt 1200
tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca 1260
tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc 1320
gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa 1380
atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat 1440
gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct 1500
ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg 1560
cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat 1620
cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg 1680
cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact 1740
ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 1800
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 1860
acgcaattaa tgtaagttag ctcactcatt aggcaccggg atctcgaccg atgcccttga 1920
gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac 1980
ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg ctctgggtca 2040
ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg cttgcggtat 2100
tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc aaacgtttcg 2160
gcgagaagca ggccattatc gccggcatgg cggccccacg ggtgcgcatg atcgtgctcc 2220
tgtcgttgag gacccggcta ggctggcggg gttgccttac tggttagcag aatgaatcac 2280
cgatacgcga gcgaacgtga agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa 2340
catgaatggt cttcggtttc cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct 2400
gcaccattat gttccggatc tgcatcgcag gatgctgctg gctaccctgt ggaacaccta 2460
catctgtatt aacgaagcgc tggcattgac cctgagtgat ttttctctgg tcccgccgca 2520
tccataccgc cagttgttta ccctcacaac gttccagtaa ccgggcatgt tcatcatcag 2580
taacccgtat cgtgagcatc ctctctcgtt tcatcggtat cattaccccc atgaacagaa 2640
atccccctta cacggaggca tcagtgacca aacaggaaaa aaccgccctt aacatggccc 2700
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 2760
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 2820
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 2880
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 2940
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 3000
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatat gcggtgtgaa 3060
ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc 3120
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3180
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3240
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3300
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3360
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3420
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 3480
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3540
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3600
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3660
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3720
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3780
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3840
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3900
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgaa caataaaact 3960
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc 4020
ttgctctagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 4080
tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc 4140
gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 4200
ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc attttatccg 4260
tactcctgat gatgcatggt tactcaccac tgcgatcccc gggaaaacag cattccaggt 4320
attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 4380
ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct 4440
cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 4500
gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataaacttt tgccattctc 4560
accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 4620
gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 4680
tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 4740
aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 4800
gtttttctaa gaattaattc atgagcggat acatatttga atgtatttag aaaaataaac 4860
aaataggggt tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat 4920
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 4980
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 5040
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 5100
cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 5160
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 5220
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 5280
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 5340
gccgctacag ggcgcgtccc attcgcca 5368
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
aagaaagcga aaggagcggg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
ccatacccac gccgaaacaa 20