一种改进的转氨酶及其在(R)‑3‑氨基丁醇制备上的应用的制作方法

文档序号:12411642阅读:894来源:国知局
一种改进的转氨酶及其在(R)‑3‑氨基丁醇制备上的应用的制作方法与工艺

本发明属于生物制药领域,具体涉及一种改进的转氨酶、编码基因及其在(R)-3-氨基丁醇制备上的应用。



背景技术:

(R)-3-氨基丁醇在化学反应和药物合成方面有着广泛的应用,可作为多种手性药物的关键中间体。比如抗HIV药物度鲁特韦(Dolutegravir),该药由葛兰素史克(GSK)研发生产,2013年8月12日获美国食品和药物管理局(FDA)批准上市。度鲁特韦自上市以来销售额呈现飞跃式发展,2015年度全球销售额高达90亿美元。

(R)-3-氨基丁醇常温常压下是一种无色黏稠液体,分子量为89.14,可溶于水、乙醇、乙酸乙酯等溶剂中,其结构式如下所示:

目前公布的(R)-3-氨基丁醇的合成方法以化学法为主,一种是采用动力学拆分法获得手性纯的3-氨基丁醇(Journal of Organic Chemistry,42,1650,1977),该方法产品收率低,反应过程采用四氢铝锂作为还原剂,工业化放大生产较危险。另一种是以手性化合物作为起始原料,如D-丙氨酸或R型苯乙胺通过多步反应获得手性纯的3-氨基丁醇(Tetrahedron,61,9031,2005和CN 101417954B),这一类方法中手性纯原料价格较贵,且反应步骤冗长,生产成本较高。

与化学合成法相比,生物合成法具有反应条件温和、转化率高和立体选择性强等优点,目前利用生物法制备(R)-3-氨基丁醇的报道还较少。转氨酶能够不对称催化潜手性酮类化合物一步合成手性胺类化合物,具有较好的应用前景。专利CN 104131048A公开了一种利用野生型D-转氨酶不对称催化4-羟基-2丁酮合成(R)-3-氨基丁醇的方法,但其反应底物浓度最高仅为300mM(26.4g/L),无法满足工业化生产需求,仅停留在实验室研究阶段,同时反应过程中需使用10%的有机助溶剂DMSO或乙腈,这也增加了反应后处理的操作和成本,工业三废排放量加大。



技术实现要素:

为了克服现有技术所存在的上述缺陷,本发明提供了一种改进的转氨酶,同时还公开了该转氨酶的编码基因、重组表达基因工程菌及其在(R)-3-氨基丁醇制备上的应用。

本发明第一方面提供了一种改进的转氨酶,其酶活性高于野生型转氨酶的酶活性。

所述酶活性是指催化酮类化合物发生不对称转氨反应生成手性胺的酶活性。

所述野生型转氨酶氨基酸序列如SEQ ID No.2所示,且来源于土曲霉菌Aspergillus terreus NIH2624。

在本发明的一个具体实施例中,所述酶活性是指催化底物4-羟基-2-丁酮发生不对称转氨反应生成(R)-3-氨基丁醇的酶活性。

所述改进的转氨酶是在SEQ ID No.2所示氨基酸序列中经过取代、缺失或添加一个或几个氨基酸残基衍生的具有转氨酶催化活性的蛋白质,且与SEQ ID No.2所示氨基酸序列有至少95%序列同源性。其中,所述的“几个”是指2-15个,更佳地小于10个。根据本发明,在如SEQ ID No.2所示氨基酸序列的蛋白质分子中进行2、5、10个氨基酸残基的突变得到SEQ ID No.4、6、8所示氨基酸序列的蛋白质均具有较高的转氨酶的活性。

所述SEQ ID No.4是与SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且对应于SEQ ID No.2所示氨基酸序列中的第55位和第215位分别为丙氨酸和脯氨酸。

所述SEQ ID No.6是与SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且对应于SEQ ID No.2所示氨基酸序列中的第54位、第55位、第117位、第161位和第215位分别为酪氨酸、丝氨酸、丙氨酸、亮氨酸和脯氨酸。

所述SEQ ID No.8是与SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且对应于SEQ ID No.2所示氨基酸序列中的第54位、第55位、第58位、第117位、第126位、第142位、第144位、第161位、第207位和第215位分别为酪氨酸、丝氨酸、丙氨酸、丙氨酸、脯氨酸、丝氨酸、半胱氨酸、亮氨酸、半胱氨酸和脯氨酸。

在本发明的一个具体实施例中,所述的改进的转氨酶的氨基酸序列为SEQ ID No.4。

在本发明的一个具体实施例中,该改进的转氨酶的酶活性是所述野生型转氨酶酶活性的至少2倍。

本发明第二方面提供了编码上述改进转氨酶的基因,其包含与SEQ ID No.1所示的核苷酸序列有至少95%序列同源性的核苷酸序列。

所述改进的转氨酶的编码基因的核苷酸序列可选自SEQ ID No.3、SEQ ID No.5和SEQ ID No.7.

在本发明的一个具体实施例中,该改进的转氨酶的编码基因的核苷酸序列如SEQ ID No.3所示。

本发明第三方面提供了一种基因工程菌,该菌种表达上述改进的转氨酶。

在本发明的一个具体实施例中,该基因工程菌所使用的表达载体为pET-24a,宿主细胞为大肠杆菌BL21(DE3)。

本发明第四方面提供了一种本发明所述的改进的转氨酶在催化酮类化合物不对称转氨反应生成手性胺化合物中的应用。

上述应用中,所述反应的各条件可按本领域此类反应的常规条件进行选择,优选如下:

在pH=7-9的缓冲液中,分别添加一定比例的异丙胺、磷酸吡哆醛(PLP)、4-羟基-2-丁酮及本发明所述改进的转氨酶,在30-40℃下进行不对称转氨反应,生成光学活性的(R)-3-氨基丁醇。反应混合液中转氨酶的浓度为5-10g/L、异丙胺的浓度为60-90g/L、4-羟基-2-丁酮的浓度为25-50g/L、PLP的浓度为0.1-1mM以及缓冲液的浓度为10-100mM。反应时间以反应过程中产物浓度不再增加的时间为准。反应结束后,可按本领域常规方法从反应液中提取产物(R)-3-氨基丁醇。

所述改进的转氨酶由基因工程菌发酵得到,以酶粉、转氨酶的细胞破碎液或者含酮还原酶的菌体细胞的形式加入,优选以酶粉形式加入。

在本发明的一个具体实施例中,转氨酶酶粉可采用本领域常规的分子生物学、超声破碎及真空冷冻干燥方法制得。

与现有技术相比,本发明提供了一种催化活性高、对映选择性强、底物耐受性好的改进的转氨酶,以及利用该转氨酶催化合成(R)-3-氨基丁醇的方法。该方法反应条件温和,产物手性纯度及收率均较高,同时底物浓度高达50g/L,大大提高了(R)-3-氨基丁醇的制备效率,降低其生产成本,具有较好的工业应用前景。

附图说明

图1为本发明实施例1中突变基因融合PCR产物的琼脂糖凝胶电泳图;

图2为本发明实施例3中表达AtATmut转氨酶细胞破碎沉淀和上清液的聚丙烯酰胺凝胶电泳图。A为破碎沉淀,B为破碎上清液。

具体实施方式

下面结合具体实施例对本发明的技术内容作进一步的阐述,其目的是为了更好的理解本发明的内容,但本发明的保护范围不限于此。

实施例1 转氨酶突变体库的构建

全基因合成序列如SEQ ID No.1所示核苷酸,选择NdeI和HindIII两个酶切位点插入pET24a表达载体,获得的重组表达载体命名为pET24a-AtAT。为构建突变体库,我们设计了以下6条引物,详见表1:

表1 PCR引物表

以pET24a-AtAT为模板利用上述引物进行PCR扩增,PCR体系为:10×PCR buffer为5uL,2.5mM dNTP为4uL,pfu DNA Polymerse为0.5uL,pET24a-AtAT模板为0.5uL(含DNA模板0.2ug),ddH2O为36uL,分别以表1中AtAT-up上游引物(SEQ ID No.9)与H55-down下游引物(SEQ ID No.12)、H55-up上游引物(SEQ ID No.11)与S215-down下游引物(SEQ ID No.14)、S215-up上游引物(SEQ ID No.13)与AtAT-down下游引物(SEQ ID No.10)各2uL(10umol/L)进行PCR扩增。PCR扩增步骤为:(1)95℃,预变性3min;(2)95℃,变性30s;(3)55℃退火30s;(4)72℃延伸1min;步骤(2)~(4)重复30次;(5)72℃继续延伸10min,冷却至4℃。PCR产物经琼脂糖凝胶电泳纯化后回收160、480、320bp左右的目标条带。以这些PCR产物为模板,反应体系如下:10×PCR buffer为5uL,2.5mM dNTP为4uL,pfu DNA Polymerse为0.5uL,ddH2O为33.5uL,PCR回收片段各1uL,利用AtAT-up上游引物与AtAT-down下游引物各2uL进行PCR扩增,PCR扩增步骤为:(1)95℃,预变性3min;(2)95℃,变性30s;(3)55℃退火30s;(4)72℃延伸70s;步骤(2)~(4)重复30次;(5)72℃继续延伸10min,冷却至4℃。PCR产物经琼脂糖凝胶电泳纯化后回收1000bp左右的目标条带(见图1),该片段中则包含了具有两个位点组合突变的所有突变序列。将上述基因片段和载体pET-24a质粒分别进行酶切反应(NdeI和HindIII,37℃酶切1h),酶切产物切胶回收后进行连接反应(16℃过夜反应),转入E.coli BL21(DE3)感受态细胞,通过卡那霉素筛选获得阳性单克隆。于96孔板中每孔加入LB+卡那霉素培养基0.6mL,每块96孔板挑选93个阳性克隆和3个BL21(DE3)/pET24a-AtAT作为对照,共挑取6块96孔板,在37℃摇床中震荡培养16h,此即为突变体库。

实施例2 转氨酶突变体的表达及筛选

将培养过夜的突变体库每孔取100uL菌液接种入一个新的96孔板,该板每孔内含新鲜LB+卡那霉素培养基1mL,在37℃条件下摇床培养至OD600值达到0.8~1.0,随后加入IPTG至终浓度为1.0mM,于25℃诱导培养20小时左右,离心弃上清,收集菌体。每孔加入400uL反应液,其中包括:20g/L的底物4-羟基-2-丁酮,60g/L的异丙胺,1mM的辅酶PLP,100mM磷酸钾缓冲液(pH=8.0),于30℃摇床振荡反应24h后,每孔加入10M NaOH调节pH>13,加入等体积的乙酸乙酯萃取,离心后,吸取有机层进行GC分析,检测突变体酶活。GC条件:Agilent 7820A气相色谱仪;RESTEK(30m*0.25mm*0.25μm)毛细管柱;氢火焰离子化检测器;检测器温度220℃;进样口温度200℃;程序升温,初始温度为100℃,10℃/min升至200℃,保持15min;进样方式为分流进样,分流比50:1。通过GC检测获得一株突变体转化率>95%,而对照组转化率<20%。为了从所筛选出表达突变体的细胞中获得转氨酶的编码基因,将其所对应的菌种送测序,测序结果显示含有SEQ ID No.3所示核苷酸序列,编码SEQID No.4所示氨基酸序列。该改进的转氨酶命名为AtATmut,菌种命名为BL21(DE3)/pET24a-AtATmut。

实施例3 AtATmut转氨酶的表达及酶粉制备

转接甘油保藏菌种BL21(DE3)/pET24a-AtATmut至5mL含卡那霉素的LB试管培养基中活化培养(37℃培养12h),按1%接种量转接活化培养物至400mL含卡那霉素的LB液体培养基中,37℃培养OD至0.6-0.8,加入IPTG(终浓度0.1mM)于25℃诱导培养16h。离心收集菌体,用40mL磷酸盐缓冲液(10mM,pH 7.5)重悬菌体后,于冰水浴中超声破碎15min,离心收集上清和沉淀,SDS-PAGE检测显示AtATmut转氨酶以部分可溶的形式存在(见图2),上清液-20℃预冻后真空冷冻干燥48h后碾碎,即得AtATmut转氨酶酶粉。

实施例4 AtATmut转氨酶催化4-羟基-2-丁酮的不对称转氨反应

于100mL反应容器中加入100mM的磷酸盐缓冲液(40mL,pH=7.5)和异丙胺(4.5g),用磷酸调节pH至7.5,加入底物4-羟基-2-丁酮(2.5g),搅拌均匀后加入AtATmut酶粉(0.25g)和辅酶PLP(13.25mg),定容至50mL,35℃下磁力搅拌敞口反应,反应过程中用异丙胺(4M)控制反应pH在7.5左右,TLC检测反应进程。反应结束后80℃保温2h使反应液中蛋白质变性,过滤去除蛋白质,加NaOH(10M)调节pH=13,等体积乙酸乙酯萃取三次,合并有机相,无水硫酸钠干燥,减压蒸馏获得(R)-3-氨基丁醇(2.3g),产品收率91%。GC检测转化率为99%,R型产物ee值为99.5%。

实施例5 AtATmut转氨酶催化4-羟基-2-丁酮的不对称转氨反应

于100mL反应容器中加入10mM的磷酸盐缓冲液(40mL,pH=9.0)和异丙胺(3.0g),用磷酸调节pH至8.0,加入底物4-羟基-2-丁酮(2.0g),搅拌均匀后加入AtATmut酶粉(0.5g)和辅酶PLP(13.25mg),定容至50mL,40℃下磁力搅拌敞口反应,反应过程中用异丙胺(4M)控制反应pH在8.0左右,TLC检测反应进程。反应结束后80℃保温2h使反应液中蛋白质变性,过滤去除蛋白质,加NaOH(10M)调节pH=13,等体积乙酸乙酯萃取三次,合并有机相,无水硫酸钠干燥,减压蒸馏获得(R)-3-氨基丁醇(1.93g),产品收率90%。GC检测转化率为99%,R型产物ee值为99.5%。

实施例6 AtATmut转氨酶催化4-羟基-2-丁酮的不对称转氨反应

于100mL反应容器中加入10mM的磷酸盐缓冲液(40mL,pH=7.0)和异丙胺(3.0g),用磷酸调节pH至7.0,加入底物4-羟基-2-丁酮(1.25g),搅拌均匀后加入AtATmut酶粉(0.5g)和辅酶PLP(1.325mg),定容至50mL,30℃下磁力搅拌敞口反应,反应过程中用异丙胺(4M)控制反应pH在7.0左右,TLC检测反应进程。反应结束后80℃保温2h使反应液中蛋白质变性,过滤去除蛋白质,加NaOH(10M)调节pH=13,等体积乙酸乙酯萃取三次,合并有机相,无水硫酸钠干燥,减压蒸馏获得(R)-3-氨基丁醇(1.15g),产品收率92%。GC检测转化率为99%,R型产物ee值为99.5%。

SEQUENCE LISTING

<110> 尚科生物医药(上海)有限公司

<120> 一种改进的转氨酶及其在(R)-3-氨基丁醇制备上的应用

<160> 14

<170> PatentIn version 3.3

<210> 1

<211> 978

<212> DNA

<213> 人工序列

<400> 1

atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60

accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120

ctggctgaag ctcgtatccc gctgctggac cagggtttca tgcactctga cctgacctac 180

gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240

gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300

atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttga actgatcgtt 360

acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420

atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480

gctgttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540

aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600

tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gttctggttt caacatcgtt 660

ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720

aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780

gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840

ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900

aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960

tacaacgaac gtaactaa 978

<210> 2

<211> 325

<212> PRT

<213> 人工序列

<400> 2

Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala

1 5 10 15

Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala

20 25 30

Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu

35 40 45

Leu Asp Gln Gly Phe Met His Ser Asp Leu Thr Tyr Asp Val Pro Ser

50 55 60

Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu

65 70 75 80

Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp

85 90 95

Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg

100 105 110

Asp Ala Phe Val Glu Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg

115 120 125

Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln

130 135 140

Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser

145 150 155 160

Ala Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp

165 170 175

Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe

180 185 190

Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp

195 200 205

Ala His Leu Thr Glu Gly Ser Gly Phe Asn Ile Val Leu Val Lys Asp

210 215 220

Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg

225 230 235 240

Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val

245 250 255

Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met

260 265 270

Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met

275 280 285

Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp

290 295 300

Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp

305 310 315 320

Tyr Asn Glu Arg Asn

325

<210> 3

<211> 978

<212> DNA

<213> 人工序列

<400> 3

atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60

accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120

ctggctgaag ctcgtatccc gctgctggac cagggtttca tggcgtctga cctgacctac 180

gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240

gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300

atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttga actgatcgtt 360

acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420

atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480

gctgttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540

aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600

tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gtcctggttt caacatcgtt 660

ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720

aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780

gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840

ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900

aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960

tacaacgaac gtaactaa 978

<210> 4

<211> 325

<212> PRT

<213> 人工序列

<400> 4

Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala

1 5 10 15

Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala

20 25 30

Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu

35 40 45

Leu Asp Gln Gly Phe Met Ala Ser Asp Leu Thr Tyr Asp Val Pro Ser

50 55 60

Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu

65 70 75 80

Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp

85 90 95

Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg

100 105 110

Asp Ala Phe Val Glu Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg

115 120 125

Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln

130 135 140

Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser

145 150 155 160

Ala Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp

165 170 175

Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe

180 185 190

Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp

195 200 205

Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp

210 215 220

Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg

225 230 235 240

Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val

245 250 255

Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met

260 265 270

Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met

275 280 285

Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp

290 295 300

Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp

305 310 315 320

Tyr Asn Glu Arg Asn

325

<210> 5

<211> 978

<212> DNA

<213> 人工序列

<400> 5

atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60

accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120

ctggctgaag ctcgtatccc gctgctggac cagggtttct actcttctga cctgacctac 180

gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240

gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300

atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttgc tctgatcgtt 360

acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420

atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480

ctggttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540

aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600

tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gtccgggttt caacatcgtt 660

ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720

aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780

gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840

ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900

aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960

tacaacgaac gtaactaa 978

<210> 6

<211> 325

<212> PRT

<213> 人工序列

<400> 6

Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala

1 5 10 15

Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala

20 25 30

Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu

35 40 45

Leu Asp Gln Gly Phe Tyr Ser Ser Asp Leu Thr Tyr Asp Val Pro Ser

50 55 60

Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu

65 70 75 80

Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp

85 90 95

Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg

100 105 110

Asp Ala Phe Val Ala Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg

115 120 125

Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln

130 135 140

Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser

145 150 155 160

Leu Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp

165 170 175

Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe

180 185 190

Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp

195 200 205

Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp

210 215 220

Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg

225 230 235 240

Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val

245 250 255

Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met

260 265 270

Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met

275 280 285

Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp

290 295 300

Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp

305 310 315 320

Tyr Asn Glu Arg Asn

325

<210> 7

<211> 978

<212> DNA

<213> 人工序列

<400> 7

atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60

accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120

ctggctgaag ctcgtatccc gctgctggac cagggtttct actcttctga cgctacctac 180

gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240

gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300

atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttgc tctgatcgtt 360

acccgtggtc tgaaaccggt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420

atgtctgttt gcccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480

ctggttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540

aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600

tacccgttcc tgaccgactg cgacgctcac ctgaccgaag gtccgggttt caacatcgtt 660

ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720

aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780

gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840

ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900

aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960

tacaacgaac gtaactaa 978

<210> 8

<211> 325

<212> PRT

<213> 人工序列

<400> 8

Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala

1 5 10 15

Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala

20 25 30

Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu

35 40 45

Leu Asp Gln Gly Phe Tyr Ser Ser Asp Ala Thr Tyr Asp Val Pro Ser

50 55 60

Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu

65 70 75 80

Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp

85 90 95

Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg

100 105 110

Asp Ala Phe Val Ala Leu Ile Val Thr Arg Gly Leu Lys Pro Val Arg

115 120 125

Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Ser Val Cys

130 135 140

Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser

145 150 155 160

Leu Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp

165 170 175

Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe

180 185 190

Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Cys Asp

195 200 205

Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp

210 215 220

Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg

225 230 235 240

Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val

245 250 255

Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met

260 265 270

Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met

275 280 285

Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp

290 295 300

Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp

305 310 315 320

Tyr Asn Glu Arg Asn

325

<210> 9

<211> 31

<212> DNA

<213> 人工序列

<400> 9

cccaagcttt tagttacgtt cgttgtagtc g 31

<210> 10

<211> 30

<212> DNA

<213> 人工序列

<400> 10

gggaattcca tatggcttct atggacaaag 30

<210> 11

<211> 32

<212> DNA

<213> 人工序列

<400> 11

ctggaccagg gtttcatgvn ctctgacctg ac 32

<210> 12

<211> 29

<212> DNA

<213> 人工序列

<400> 12

cgtaggtcag gtcagagnbc atgaaaccc 29

<210> 13

<211> 30

<212> DNA

<213> 人工序列

<400> 13

tcacctgacc gaaggtnnkg gtttcaacat 30

<210> 14

<211> 29

<212> DNA

<213> 人工序列

<400> 14

gaacgatgtt gaaaccmnna ccttcggtc 29

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1