一种转氨酶突变体及其在西格列汀合成中的应用的制作方法

文档序号:23339147发布日期:2020-12-18 16:33阅读:666来源:国知局
一种转氨酶突变体及其在西格列汀合成中的应用的制作方法
本发明属于基因工程和酶催化
技术领域
,具体地说,涉及一种转氨酶突变体及其在西格列汀合成中的应用。
背景技术
:西格列汀(sitagliptin)又名西他列汀,全称7-[(3r)-3-氨基-1-氧代-4-(2,4,5-三氟苯基)丁基]-5,6,7,8-四氢-3-三氟甲基-1,2,4-三唑并[4,3-a]吡嗪,是由美国默沙东公司(merck)开发的首个二肽基肽酶-4(dpp-4)抑制剂,其磷酸化水合物是当前占有巨大市场份额的ii型糖尿病治疗药物。在西格列汀的合成路线中,手性(r)-氨基的引入是关键步骤之一,目前开发了包括手性源引入、选择性还原、手性诱导和动力学拆分等方法。其中,原研药厂开发的以2,4,5-三氟苯乙酸为起始原料,先后合成(2z)-4-氧代-4-[3-(三氟甲基)-5,6-二氢-[1,2,4]三唑并[4,3-a]吡嗪-7-(8h)-基]-1-(2,4,5-三氟苯基)丁-2-酮(简称西格列汀前体酮)、(2z)-4-氧代-4-[3-(三氟甲基)-5,6-二氢-[1,2,4]三唑并[4,3-a]吡嗪-7-(8h)-基]-1-(2,4,5-三氟苯基)丁-2-烯-2-胺、西格列汀。专利wo2004087650a2利用手性磷钌催化剂对西格列汀前体酮进行不对称催化氢化,构建手性二级醇,进而转化为手性二级胺,但该路线所用的试剂较为昂贵。专利wo2004085378a1报导了默沙东公司新的西格列汀合成方法,该方法获得美国总统绿色化学奖,其关键步骤是采用了手性铑催化剂对烯胺的不对称氢化来构建手性中心,具有路线简洁、步骤较短、转化率和光学纯度高等优点,但所用的手性催化剂及手性辅剂较昂贵。随后,默沙东公司与codexis公司合作,以arthrobactersp.(r)-ω-ta117研究对象,结合蛋白质结构计算机辅助分析、定点饱和突变以及全基因随机突变等策略,经过11轮改造,最终获得了能高效催化西格列汀前体酮合成西格列汀的新型转氨酶(参见文献christopherk.savile,jacobm.janey,emilyc.mundorff,etal.biocatalyticasymmetricsynthesisofchiralaminesfromketonesappliedtositagliptinmanufacture[j].science,2010,329(5989):305-309)。相比于化学合成法,利用生物转化策略时产物得率提高10~13%,生产效率提高53%,总废弃物排放减少19%,并且反应过程无需添加重金属。专利ep2401366对高性能转氨酶以及相似序列进行了保护。当前,酶法不对称催化合成西格列汀技术仍被默沙东公司和codexis公司垄断,所用arthrobactersp.来源的天然(r)-ω-转氨酶酶源单一,野生型相似序列少,且累积进行3、4、6、11、12、13、14、15、16、20、21、23、24、25、26、27、28、29或30个氨基酸位点突变的突变体及其相似序列均受到专利保护。在此背景下,有必要筛选更多来源的(r)-ω-转氨酶并加以改造,突破现有的酶法制备西格列汀技术壁垒并取得新的改进效果。技术实现要素:本发明人对于现有技术的具有(r)-ω-转氨酶功能的转氨酶进行了广泛筛选,通过对野生型转氨酶经点突变、定点饱和突变以及全基因随机突变,经多轮筛选后获得一系列突变体,包括具有多个位点累积突变的全新突变体,该突变体用于催化合成西格列汀时,具有较高的酶活力,并保持较高的立体选择性。具体而言,本发明包括如下技术方案。一种转氨酶突变体,其为费氏新萨托菌(neosartoryafischeri)来源的转氨酶seqidno:1氨基酸序列(ncbi登录号kaf4246444.1)中的下述位点发生突变后所形成的突变体:v7、a13、l18、k27、y31、k35、f36、v37、s40、f51、h53、l56、t57、v63、r67、f68、d72、q76、r77、e80、s81、k84、k88、l91、t95、i99、e115、i117、t123、g124、g127、e131、n135、n137、l141、l143、w147、l156、p171、k179、l181、d185、t187、f191、d205、s214、k222、v233、i237、t238、d244、a248、i251、d252、i253、l255、v257、y264、t273、a275、p288、k299、h309、d311、y314、d319、g321、或者它们中两种以上的组合,该转氨酶突变体具有转氨酶seqidno:1的功能即(r)-ω-转氨酶功能。上述的术语“突变”包括但不限于氨基酸的取代、缺失或添加。优选地,上述突变选自下组:v7l、a13g、l18m、k27t、y31d或y31n、k35n或k35t、f36y、v37g、s40r、f51v、h53f或h53l、l56a或l56y、t57a或t57f或t57g、v63e、r67s、f68y或f68e、d72h、q76r、e80q、s81g、k84h、k88e、l91q、t95s、i99f、e115r、i117a、t123s、g124a、g127f或g127y、e131v、n135k、n137s、l141q、l143m、w147f、l156v、p171q、l181a、d185a、t187s、f191a或f191g、d205a或d205s、s214p、k222r、v233l、i237a或i237g、t238s、d244n、a248g或a248e或a248v、i251v或i251t、d252e、i253n、l255v、v257e、y264s、t273s、a275g、p288a、k299q、h309l、d311n、y314s、d319v、g321e、或者它们中两种以上的组合。上述转氨酶突变体优选为与seqidno:1氨基酸序列有80%以上同源性、优选地85%以上同源性、优选地90%以上同源性、更优地95%以上同源性、且具有转氨酶seqidno:1功能的多肽。在一种优选的实施方式中,上述转氨酶突变体选自下组:seqidno:3,其为seqidno:1氨基酸序列的l56a、e115r、w147f、i237g突变体;seqidno:5,其为seqidno:1氨基酸序列的l56a、e115r、w147f、i237g、h53l、k84h、i117a、f191a、t273s突变体,即seqidno:3的h53l、k84h、i117a、f191a、t273s突变体;seqidno:7,其为seqidno:1氨基酸序列的h53l、l56a、k84h、e115r、i117a、g127f、w147f、f191a、s214p、i237g、t273s、a275g突变体,即seqidno:5的g127f、s214p、a275g突变体;seqidno:9,其为seqidno:1氨基酸序列的k35n、s40r、h53l、l56a、k84h、e115r、i117a、g127f、w147f、f191a、s214p、i237g、t273s、a275g突变体,即seqidno:7的k35n、s40r突变体;seqidno:11,其为seqidno:1氨基酸序列的k35n、s40r、h53l、l56a、d72h、k84h、e115r、i117a、g127f、w147f、f191a、s214p、k222r、i237g、t273s、a275g、h309l突变体,即seqidno:9的d72h、k222r、h309l突变体;seqidno:13,其为seqidno:1氨基酸序列的k35n、s40r、h53l、l56a、d72h、q76r、k84h、e115r、i117a、g127f、w147f、f191a、s214p、k222r、i237g、a248v、t273s、a275g、h309l突变体,即seqidno:11的q76r、a248v突变体;seqidno:15,其为seqidno:1氨基酸序列的k35n、s40r、h53l、l56a、d72h、q76r、k84h、e115r、i117a、t123s、g127f、w147f、f191a、s214p、k222r、i237g、a248v、t273s、a275g、p288a、h309l突变体,即seqidno:13的t123s、p288a突变体。本发明的第二个方面提供了一种编码上述转氨酶突变体的基因。优选地,编码seqidno:3的基因的核苷酸序列可以为seqidno:4;编码seqidno:5的基因的核苷酸序列可以为seqidno:6;编码seqidno:7的基因的核苷酸序列可以为seqidno:8;编码seqidno:9的基因的核苷酸序列可以为seqidno:10;编码seqidno:11的基因的核苷酸序列可以为seqidno:12;编码seqidno:13的基因的核苷酸序列可以为seqidno:14;编码seqidno:15的基因的核苷酸序列可以为seqidno:16。本发明还提供了一种包含上述基因的质粒。上述质粒可以选自pet22b、psc101、cole1(atcc27138)、pbr322、pacyc184、puc9(atcc37252),优选pet22b质粒。本发明的另一个方面提供了一种转化了上述质粒的微生物,该微生物是表达上述转氨酶突变体的基因工程菌。优选上述微生物是大肠杆菌、枯草芽孢杆菌、毕赤酵母、酿酒酵母,优选大肠杆菌,更优选大肠杆菌bl21(de3)。当微生物是大肠杆菌e.colibl21(de3)基因工程菌时,可以使用iptg作为诱导剂,转氨酶突变体基因的表达体系还可以使用乳糖操纵子、阿拉伯糖操纵子、或者色氨酸操纵子。上述微生物可作为固定化转氨酶形式而直接用于氨基转移反应。本发明的再一个方面提供了上述转氨酶突变体或者上述微生物在生产西格列汀中的用途。例如,在西格列汀的生产中,以(2z)-4-氧代-4-[3-(三氟甲基)-5,6-二氢-[1,2,4]三唑并[4,3-a]吡嗪-7-(8h)-基]-1-(2,4,5-三氟苯基)丁-2-酮(简称“西格列汀前体酮”)作为底物,使用所述转氨酶突变体或者所述微生物作为生物催化剂催化氨基转移反应,得到西格列汀。在一种优选的实施方式中,酶催化反应体系中还添加有磷酸吡哆醛(plp)和氨基供体。磷酸吡哆醛作为辅酶可以促进转氨酶催化的氨基转移反应。所用的氨基供体可以是异丙胺等。上述反应体系的ph可以为8.0-9.0,优选ph8.2-8.8,更优选ph8.5左右。反应温度可以为40-50℃,优选42-48℃,更优选45℃左右。上述反应体系中,底物浓度可以为20~50g/l。本发明从众多转氨酶筛选出转氨酶seqidno:1,通过多轮突变,筛选出酶活力显著提高、保持高立体选择性的突变体,用于以(2z)-4-氧代-4-[3-(三氟甲基)-5,6-二氢-[1,2,4]三唑并[4,3-a]吡嗪-7-(8h)-基]-1-(2,4,5-三氟苯基)丁-2-酮为底物合成西格列汀时,西格列汀生成率达到96.7%,产物光学纯度(e.e.值)大于99.95%,具有工业化应用前景。附图说明图1为野生型转氨酶氨基酸序列差异性分析图。具体实施方式本发明筛选的野生型转氨酶seqidno:1来源于neosartoryafischeri,在genbank中的ncbi登录号是kaf4246444.1。野生型转氨酶的氨基酸序列中有些位点的突变并非是单一的突变,比如第57位突变可以是t57a,也可以是t57f或t57g,这种情况下可以表述为t57afg。其中t57a突变是指seqidno:1氨基酸序列第57位的残基苏氨酸(t或thr)被丙氨酸(a或ala)替换的突变,以此类推。为简要起见,本文中的氨基酸缩写既可以使用英文三字母、也可以采用英文单字母,这是本领域技术人员熟知的,这些缩写列于下表中:表1、氨基酸中英文对照及缩写在实施例中,术语“野生(型)”、“野生酶”、“野生型酶”表示相同的意义,都是指转氨酶的野生序列seqidno:1。为了与突变体(突变酶)相区别和表述方便起见,在本发明中可以将野生型转氨酶称为“野生(型)转氨酶”或者“野生(型)酶”。本发明对野生转氨酶seqidno:1进行了多轮突变,筛选出大量酶活力逐步提高的突变体。例如,由氨基酸序列seqidno:1出发,第51位的苯丙氨酸突变为缬氨酸(f51v)、或第57位的苏氨酸突变为丙氨酸苯丙氨酸或甘氨酸(t57afg)、或第117位异亮氨酸突变为丙氨酸(i117a)、或第187位苏氨酸突变为丝氨酸(t187s)、或第205位天冬氨酸突变为丙氨酸或丝氨酸(d205as),共计96种组合。由seqidno:1出发,第56位的亮氨酸突变为丙氨酸或酪氨酸(l56ay)、或第115位谷氨酸突变为精氨酸(e115r)、或第147位色氨酸突变为苯丙氨酸(w147f)、或第185位天冬氨酸突变为丙氨酸(d185a)、或第237位异亮氨酸突变为丙氨酸或甘氨酸(i237ag),共计72种组合。由seqidno:1出发,第53位的组氨酸突变为苯丙氨酸或亮氨酸(h53fl)、或第84位赖氨酸突变为组氨酸(k84h)、或第181位亮氨酸突变为丙氨酸(l181a)、或第191位苯丙氨酸突变为丙氨酸或甘氨酸(f191ag)、或第238位苏氨酸突变为丝氨酸(t238s)、或第273位苏氨酸突变为丝氨酸(t273s),共计144种组合。seqidno:3是在seqidno:1基础上,第56位的亮氨酸突变为丙氨酸(l56a),第115位谷氨酸突变为精氨酸(e115r),第147位色氨酸突变为苯丙氨酸(w147f),第237位异亮氨酸突变为甘氨酸(i237g)。seqidno:3对应的核酸序列为seqidno:4。由seqidno:3出发,第53位的组氨酸突变为亮氨酸(h53l)、或第57位的苏氨酸突变为甘氨酸(t57g)、或第84位赖氨酸突变为组氨酸(k84h)、或第117位异亮氨酸突变为丙氨酸(i117a)、或第191位苯丙氨酸突变为丙氨酸(f191a)、或第205位天冬氨酸突变为丝氨酸(d205s)、或第273位苏氨酸突变为丝氨酸(t273s),共计128种组合。seqidno:5是在seqidno:3基础上,第53位的组氨酸突变为亮氨酸(h53l),第84位赖氨酸突变为组氨酸(k84h),第117位异亮氨酸突变为丙氨酸(i117a),第191位苯丙氨酸突变为丙氨酸(f191a),第273位苏氨酸突变为丝氨酸(t273s)。seqidno:5对应的核酸序列为seqidno:6。seqidno:7是在seqidno:5基础上,第127位的甘氨酸突变为苯丙氨酸(g127f),第214位的丝氨酸突变为脯氨酸(s214p),第275位的丙氨酸突变为甘氨酸(a275g)。seqidno:7对应的核酸序列为seqidno:8。在seqidno:7的基础上,第91位的亮氨酸突变为谷氨酰胺(l91q)且第251位的异亮氨酸突变为缬氨酸(i251v);或第63位的缬氨酸突变为组氨酸(v63e);或第27位的赖氨酸突变为苏氨酸(k27t);或第248位的丙氨酸突变为甘氨酸(a248g)且第311位的天冬氨酸突变为天冬酰胺(d311n);或第135位的天冬酰胺突变为赖氨酸(n135k);或第264位的酪氨酸突变为丝氨酸(y264s);或第35位的赖氨酸突变为天冬酰胺(k35n)且第40位的丝氨酸突变为精氨酸(s40r)。其中,优选的k35n、s40r突变体的氨基酸序列为seqidno:9。seqidno:9对应的核酸序列为seqidno:10。在seqidno:9的基础上,第7位的缬氨酸突变为亮氨酸(v7l),第251位的异亮氨酸突变为苏氨酸(i251t)且第321位的甘氨酸突变为谷氨酸(g321e);或第67位的精氨酸突变为丝氨酸(r67s)且第99位的异亮氨酸突变为苯丙氨酸(i99f);或第35位的赖氨酸突变为苏氨酸(k35t),第141位的亮氨酸突变为谷氨酰胺(l141q)且第248位的丙氨酸突变为谷氨酸(a248e);或第31位的酪氨酸突变为天冬氨酸(y31d)且第81位的丝氨酸突变为甘氨酸(s81g);或第72位的天冬氨酸突变为组氨酸(d72h),第222位的赖氨酸突变为精氨酸(k222r)且第309位的组氨酸突变为亮氨酸(h309l)。其中,优选的d72h、k222r、h309l突变体的氨基酸序列为seqidno:11。seqidno:11对应的核酸序列为seqidno:12。在seqidno:11的基础上,第36位的苯丙氨酸突变为酪氨酸(f36y),第124位的甘氨酸突变为丙氨酸(g124a)且第233位的缬氨酸突变为亮氨酸(v233l);或第95位的苏氨酸突变为丝氨酸(t95s)且第253位的异亮氨酸突变为天冬酰胺(i253n);或第80位点的谷氨酸突变为谷氨酰胺(e80q)且第248位丙氨酸突变为甘氨酸(a248g);或第31位点的酪氨酸突变为天冬酰胺(y31n),第131位谷氨酸突变为缬氨酸(e131v)且第255位点的亮氨酸突变为缬氨酸(l255v);或第171位的脯氨酸突变为谷氨酰胺(p171q)且第257位点的缬氨酸突变为谷氨酸(v257e);或第81位的丝氨酸突变为甘氨酸(s81g)且第156位的亮氨酸突变为缬氨酸(l156v);或第13位点的丙氨酸突变为甘氨酸(a13g)且第137位点的天冬酰胺突变为丝氨酸(n137s);或第68位的苯丙氨酸突变为酪氨酸(f68y),第88位点的赖氨酸突变为谷氨酸(k88e)且第319位的天冬氨酸突变为缬氨酸(d319v);或第76位的谷氨酰胺突变为精氨酸(q76r)且第248位的丙氨酸突变为缬氨酸(a248v)。其中,优选的q76r、a248v突变体的氨基酸序列为seqidno:13,对应的核酸序列为seqidno:14。在seqidno:13的基础上,第18位的亮氨酸突变为甲硫氨酸(l18m);或第252位点的天冬氨酸突变为谷氨酸(d252e);第37位点的缬氨酸突变为甘氨酸(v37g)且第314位点的酪氨酸突变为丝氨酸(y314s);或第244位的天冬氨酸突变为天冬酰胺(d244n);或第143位点的亮氨酸突变为甲硫氨酸(l143m)且第299位的赖氨酸突变为谷氨酰胺(k299q);或第123位的苏氨酸突变为丝氨酸(t123s)且第288位脯氨酸突变为丙氨酸(p288a)。其中,优选的t123s-p288a突变体的氨基酸序列为seqidno:15,对应的核酸序列为seqidno:16。由于转氨酶突变体seqidnos:3、5、7、9、11、13和15的功能没有改变,为了描述方便起见,有时也将“转氨酶突变体”简称为“转氨酶”,这是本领域技术人员容易理解的。本发明的转氨酶突变体的氨基酸数量只有323个,且结构明确,因此本领域技术人员很容易获得其编码基因、包含这些基因的表达盒和质粒、以及包含该质粒的转化体。为了在基因工程中最常用的大肠杆菌中表达转氨酶seqidno:1,本发明对其表达基因进行了密码子优化,以此作为构建转氨酶突变体的基础模板,野生型转氨酶seqidno:1的编码基因可以是核苷酸序列seqidno:2。同样,为了在不同微生物中进行转氨酶突变体(包括seqidnos:3、5、7、9、11、13和15)的最佳表达,可以针对特定的微生物比如大肠杆菌进行密码子优化。密码子优化是可用于通过增加感兴趣基因的翻译效率使生物体中蛋白质表达最大化的一种技术。不同的生物体由于突变倾向和天然选择而通常示出对于编码相同氨基酸的一些密码子之一的特殊偏好性。例如,在生长快速的微生物如大肠杆菌中,优化密码子反映出其各自的基因组trna库的组成。因此,在生长快速的微生物中,氨基酸的低频率密码子可以用用于相同氨基酸的但高频率的密码子置换。因此,优化的dna序列的表达在快速生长的微生物中得以改良。这些基因、表达盒、质粒、转化体可以通过本领域技术人员所熟知的基因工程构建方式获得。上述转化体宿主可以使任何适合表达转氨酶的微生物,包括细菌和真菌。优选微生物是大肠杆菌、枯草芽孢杆菌、毕赤酵母、或者酿酒酵母,优选大肠杆菌,更优选大肠杆菌bl21(de3)。在该反应体系中,转氨酶突变体可以呈现酶的形式或者菌体的形式。所述酶的形式包括游离酶、固定化酶,包括纯化酶、粗酶、发酵液、载体固定的酶等;所述菌体的形式包括存活菌体和死亡菌体。以下结合具体实施例对本发明做进一步详细说明。应理解,以下实施例仅用于说明本发明而非用于限定本发明的范围。本文中涉及到多种物质的添加量、含量及浓度,其中所述的百分含量,除特别说明外,皆指质量百分含量。实施例材料和方法lb培养基:10g/l胰蛋白胨,5g/l酵母提取物,10g/l氯化钠,ph7.2。(lb固体培养基另加20g/l琼脂粉。)tb培养基:24g/l酵母提取物、12g/l胰蛋白胨、16.43g/lk2hpo4.3h2o、2.31g/lkh2po4、5g/l甘油,ph7.0-7.5。(tb固体培养基另加20g/l琼脂粉。)实施例中的全基因合成由苏州金唯智生物科技有限公司完成,并装载到载体上;引物合成及测序皆由苏州金唯智生物科技有限公司完成。实施例中的分子生物学实验包括质粒构建、酶切、连接、感受态细胞制备、转化、培养基配制等等,主要参照《分子克隆实验指南》(molecularcloning:alaboratorymanual)(第三版),j.萨姆布鲁克,d.w.拉塞尔(美)编著,黄培堂等译,科学出版社,北京,2002)进行。必要时可以通过简单试验确定具体实验条件。pcr扩增实验根据质粒或dna模板供应商提供的反应条件或试剂盒说明书进行。必要时可以通过简单试验予以调整。实施例1野生型转氨酶的筛选1、酶的挖掘与全基因合成利用生物信息学分析技术,从ncbi数据库中挖掘六株具有以芳香环及其衍生物为底物潜在催化能力的(r)-ω-转氨酶:oqe25192.1(penicilliumsteckii)、xp_015409010.1(aspergillusnomiae)、kaf4246444.1(aspergillusfumigatiaffinis)、xp_013276042.1(rhinocladiellamackenziei)、xp_023089462.1(aspergillusoryzae)、xp_020123495.1(talaromycesatroroseus),序列差异性如图1所示。根据escherichiacoli进行密码子偏好性优化核酸序列,合成基因后克隆到质粒pet22b的ncoi、xhoi位点,氨基酸序列c末端添加his标签。获得质粒pet-psata(oqe25192.1)、pet-anata(xp_015409010.1)、pet-afata(kaf4246444.1)、pet-pmata(xp_013276042.1)、pet-aoata(xp_023089462.1)和pet-taata(xp_020123495.1)。2、重组蛋白的表达条件用蒸馏水溶解10g/l蛋白胨、5g/l酵母粉、10g/lnacl配制液体lb培养基;额外添加18~20g/l的琼脂粉配制固体lb培养基。用蒸馏水溶解12g/l蛋白胨、24g/l酵母粉、0.4%甘油、0.231g/lkh2po4、1.254g/lk2hpo4配制液体tb培养基。氨苄青霉素(amp)工作浓度为50~100μg/ml,iptg的工作浓度为0.2mm。将六种质粒分别转化到e.colibl21(de3)后,获得菌株e.colibl21(de3)/pet-psata、e.colibl21(de3)/pet-anata、e.colibl21(de3)/pet-afata、e.colibl21(de3)/pet-pmata、e.colibl21(de3)/pet-aoata、e.colibl21(de3)/pet-taata。挑取单菌落至5ml含有amp的液体lb培养基中,在37℃、220rpm过夜培养。次日,按照体积浓度为1%的接种量转接至含有50ml液体tb培养基的摇瓶中,37℃、220rpm条件下培养至od600nm为0.6~0.8时,加入诱导剂iptg,随后在25℃、220rpm条件下诱导培养15~20h。3、粗酶溶液的制备4℃条件下离心收集菌体细胞,生理盐水洗涤细胞,用ph值为8.7~9.1的三乙醇胺-盐酸溶液重悬细胞,利用超声法破碎制备粗酶溶液。超声破碎条件:置于冰水浴中超生5s,暂停5s,连续60个循环。4、转氨酶在摇瓶水平上的反应条件摇瓶水平50ml反应体系:100mm三乙醇胺、1m异丙胺、0.5g/l磷酸吡哆醛、20g/l西格列汀前体酮(酶反应前溶于dmso中)、50%二甲基亚砜(dmso)、超声破碎后的细胞(超声前的细胞量为2~2.5g)、ph值为8.5(浓盐酸调ph值),45℃、300rpm条件下孵育24h。5、西格列汀以及西格列汀前体酮的提取方法酶反应结束后,4℃、12000rpm条件下离心10min,取上清。用浓盐酸调ph至2~3,45℃搅拌循环加热维持1h,然后冷却至室温。加入25ml异丙醇(ipa),搅拌均匀,再加入25ml乙酸异丙酯(ipac),搅拌均匀,用10m的naoh调节ph至11,然后搅拌5min。溶液加入50ml体积比为80:20的ipac/ipa混合液,室温搅拌5min,10000rpm条件下离心10min,取上层液体。向上层液体中加入30ml饱和食盐水,室温搅拌5min,12000rpm条件下离心10min,稀释合适的浓度,用hplc检测。6、西格列汀以及西格列汀前体酮的分析方法利用hplc法检测西格列汀以及西格列汀前体酮。色谱条件:色谱柱c18(4.6×250mm,5μm),流动相:精确称量0.05m磷酸二氢钾,加1000ml超纯水溶解,用稀磷酸(取1ml左右磷酸加纯化水稀释至10ml)调ph至3.00,利用0.45μm率膜过滤。取上述缓冲盐加入乙腈,按照体积比1:1混合后超声30min。流速:1.0ml/min;检测波长:254nm;进样量:10μl。六种转氨酶对底物西格列汀前体酮的摩尔转化率如表2所示。表2、野生型转氨酶催化能力转氨酶西格列汀生成率psata-anata-afata0.27%pmata-aoata0.10%taata0.09%其中afata的酶活力最高,西格列汀生成率为0.27%。根据该结果,后续重点研究afata,进行突变体库的构建和筛选评估。实施例2转氨酶afata关键位点突变及筛选1、突变体的构建利用生物信息学技术对afata进行分析,认定氨基酸序列中t57、r77、k179、e212、i237、t238和t273位于底物-辅因子结合区域,g50、f51、h53、g54、l56、t57、k84、e115、i117、w147、l181、d185、t187、f191、d205是二聚体多肽结合界面,这些位点在酶的结构和功能方面起到关键作用。由于西格列汀前体酮同时含有1,2,4-三唑并[4,3-a]吡嗪和2,4,5-三氟苯基结构,因此,减少转氨酶与底物结合位阻。r77、k179、e212位与酶催化以及辅因子结合相关,g50、g54空间位阻较小,不做更改。将剩余16个位点分成三组进行组合突变,第一组突变:f51v、t57afg、i117a、t187s、d205as,共计96种组合;第二组突变:l56ay、e115r、w147f、d185a、i237ag,共计72种组合;第三组突变:h53fl、k84h、l181a、f191ag、t238s、t273s,共计144种组合。利用宝日医生物技术(北京)有限公司(takara中国)的gxldna聚合酶试剂盒进行pcr扩增。反应体系:5×buffer缓冲液10μl、dntpmixture10mm、正向引物和反向引物各1μl、模板0.5μl、dna聚合酶2μl,加ddh2o补至50μl。pcr扩增条件:95℃变性5min;(95℃变性30s,60℃退火30s,72℃延伸1.2min)共10循环;(95℃变性30s,55℃退火30s,72℃延伸1.2min)共20循环;72℃延伸7min。以突变第51位的苯丙氨酸为缬氨酸(f51v)为例,以质粒pet-afata为模板,f51v-5(5'-gctgctggatgaaggcgttatgcatggcgatct-3')、f51v-3(5'-agatcgccatgcataacgccttcatccagcagc-3')为引物,pcr扩增获得质粒pet-afata-f51v,对应的afata突变体命名为afata-f51v。向pcr反应体系中直接加入1μl限制性内切酶dpni消化甲基化模板。化学转化方法:取5μl反应体系直接转化到50~100μlbl21(de3)化学感受态细胞中,冰上静止15~20min,将转化产物在42℃水浴或金属浴中热激90s,冰上冷却2min,随后加不含抗生素的液体lb培养基在37℃下孵育45~60min。最后涂布平板,在37℃培养箱中倒置培养16~24h。参照上述方法,分别以质粒pet-afata、pet-afata-f51v为模板,t57a-5(5'-ttatgcatggcgatctggcctatgatgtgaccacc-3')、t57a-3(5'-ggtggtcacatcataggccagatcgccatgcataa-3')为引物,pcr扩增获得质粒pet-afata-t57a、pet-afata-f51v-t57a。分别以质粒pet-afata、pet-afata-f51v为模板,t57f-5(5'-tatgcatggcgatctgttctatgatgtgaccacc-3')、t57f-3(5'-ggtggtcacatcatagaacagatcgccatgcata-3')为引物,pcr扩增获得质粒pet-afata-t57f、pet-afata-f51v-t57f。分别以质粒pet-afata、pet-afata-f51v为模板,t57g-5(5'-atgcatggcgatctgggctatgatgtgaccac-3')、t57g-3(5'-gtggtcacatcatagcccagatcgccatgcat-3')为引物,pcr扩增获得质粒pet-afata-t57g、pet-afata-f51v-t57g。分别以质粒pet-afata、pet-afata-f51v、pet-afata-t57a、pet-afata-f51v-t57a、pet-afata-t57f、pet-afata-f51v-t57f、pet-afata-t57g、pet-afata-f51v-t57g为模板,i117a-5(5'-gcgtttgtggaagtggctgtgacccgcggcct-3')、i117a-3(5'-aggccgcgggtcacagccacttccacaaacgc-3')为引物,pcr扩增获得质粒pet-afata-i117a、pet-afata-f51v-i117a、pet-afata-t57a-i117a、pet-afata-f51v-t57a-i117a、pet-afata-t57f-i117a、pet-afata-f51v-t57f-i117a、pet-afata-t57g-i117a、pet-afata-f51v-t57g-i117a。分别以质粒pet-afata、pet-afata-f51v、pet-afata-t57a、pet-afata-f51v-t57a、pet-afata-t57f、pet-afata-f51v-t57f、pet-afata-t57g、pet-afata-f51v-t57g、pet-afata-i117a、pet-afata-f51v-i117a、pet-afata-t57a-i117a、pet-afata-f51v-t57a-i117a、pet-afata-t57f-i117a、pet-afata-f51v-t57f-i117a、pet-afata-t57g-i117a、pet-afata-f51v-t57g-i117a为模板,t187s-5(5'-cagtggggtgatctgagcaaaggcctgtttgaa-3')、t187s-3(5'-ttcaaacaggcctttgctcagatcaccccactg-3')为引物,pcr扩增获得质粒pet-afata-t187s、pet-afata-f51v-t187s、pet-afata-t57a-t187s、pet-afata-f51v-t57a-t187s、pet-afata-t57f-t187s、pet-afata-f51v-t57f-t187s、pet-afata-t57g-t187s、pet-afata-f51v-t57g-t187s、pet-afata-i117a-t187s、pet-afata-f51v-i117a-t187s、pet-afata-t57a-i117a-t187s、pet-afata-f51v-t57a-i117a-t187s、pet-afata-t57f-i117a-t187s、pet-afata-f51v-t57f-i117a-t187s、pet-afata-t57g-i117a-t187s、pet-afata-f51v-t57g-i117a-t187s。分别以质粒pet-afata、pet-afata-f51v、pet-afata-t57a、pet-afata-f51v-t57a、pet-afata-t57f、pet-afata-f51v-t57f、pet-afata-t57g、pet-afata-f51v-t57g、pet-afata-i117a、pet-afata-f51v-i117a、pet-afata-t57a-i117a、pet-afata-f51v-t57a-i117a、pet-afata-t57f-i117a、pet-afata-f51v-t57f-i117a、pet-afata-t57g-i117a、pet-afata-f51v-t57g-i117a、pet-afata-t187s、pet-afata-f51v-t187s、pet-afata-t57a-t187s、pet-afata-f51v-t57a-t187s、pet-afata-t57f-t187s、pet-afata-f51v-t57f-t187s、pet-afata-t57g-t187s、pet-afata-f51v-t57g-t187s、pet-afata-i117a-t187s、pet-afata-f51v-i117a-t187s、pet-afata-t57a-i117a-t187s、pet-afata-f51v-t57a-i117a-t187s、pet-afata-t57f-i117a-t187s、pet-afata-f51v-t57f-i117a-t187s、pet-afata-t57g-i117a-t187s、pet-afata-f51v-t57g-i117a-t187s为模板,d205a-5(5'-tatccgtttctgaccgctggcgataccaacctg-3')、d205a-3(5'-caggttggtatcgccagcggtcagaaacggata-3')为引物,pcr扩增获得质粒pet-afata-d205a、pet-afata-f51v-d205a、pet-afata-t57a-d205a、pet-afata-f51v-t57a-d205a、pet-afata-t57f-d205a、pet-afata-f51v-t57f-d205a、pet-afata-t57g-d205a、pet-afata-f51v-t57g-d205a、pet-afata-i117a-d205a、pet-afata-f51v-i117a-d205a、pet-afata-t57a-i117a-d205a、pet-afata-f51v-t57a-i117a-d205a、pet-afata-t57f-i117a-d205a、pet-afata-f51v-t57f-i117a-d205a、pet-afata-t57g-i117a-d205a、pet-afata-f51v-t57g-i117a-d205a、pet-afata-t187s-d205a、pet-afata-f51v-t187s-d205a、pet-afata-t57a-t187s-d205a、pet-afata-f51v-t57a-t187s-d205a、pet-afata-t57f-t187s-d205a、pet-afata-f51v-t57f-t187s-d205a、pet-afata-t57g-t187s-d205a、pet-afata-f51v-t57g-t187s-d205a、pet-afata-i117a-t187s-d205a、pet-afata-f51v-i117a-t187s-d205a、pet-afata-t57a-i117a-t187s-d205a、pet-afata-f51v-t57a-i117a-t187s-d205a、pet-afata-t57f-i117a-t187s-d205a、pet-afata-f51v-t57f-i117a-t187s-d205a、pet-afata-t57g-i117a-t187s-d205a、pet-afata-f51v-t57g-i117a-t187s-d205a。分别以质粒pet-afata、pet-afata-f51v、pet-afata-t57a、pet-afata-f51v-t57a、pet-afata-t57f、pet-afata-f51v-t57f、pet-afata-t57g、pet-afata-f51v-t57g、pet-afata-i117a、pet-afata-f51v-i117a、pet-afata-t57a-i117a、pet-afata-f51v-t57a-i117a、pet-afata-t57f-i117a、pet-afata-f51v-t57f-i117a、pet-afata-t57g-i117a、pet-afata-f51v-t57g-i117a、pet-afata-t187s、pet-afata-f51v-t187s、pet-afata-t57a-t187s、pet-afata-f51v-t57a-t187s、pet-afata-t57f-t187s、pet-afata-f51v-t57f-t187s、pet-afata-t57g-t187s、pet-afata-f51v-t57g-t187s、pet-afata-i117a-t187s、pet-afata-f51v-i117a-t187s、pet-afata-t57a-i117a-t187s、pet-afata-f51v-t57a-i117a-t187s、pet-afata-t57f-i117a-t187s、pet-afata-f51v-t57f-i117a-t187s、pet-afata-t57g-i117a-t187s、pet-afata-f51v-t57g-i117a-t187s为模板,d205s-5(5'-acctatccgtttctgaccagtggcgataccaacctgac-3')、d205s-3(5'-gtcaggttggtatcgccactggtcagaaacggataggt-3')为引物,pcr扩增获得质粒pet-afata-d205s、pet-afata-f51v-d205s、pet-afata-t57a-d205s、pet-afata-f51v-t57a-d205s、pet-afata-t57f-d205s、pet-afata-f51v-t57f-d205s、pet-afata-t57g-d205s、pet-afata-f51v-t57g-d205s、pet-afata-i117a-d205s、pet-afata-f51v-i117a-d205s、pet-afata-t57a-i117a-d205s、pet-afata-f51v-t57a-i117a-d205s、pet-afata-t57f-i117a-d205s、pet-afata-f51v-t57f-i117a-d205s、pet-afata-t57g-i117a-d205s、pet-afata-f51v-t57g-i117a-d205s、pet-afata-t187s-d205s、pet-afata-f51v-t187s-d205s、pet-afata-t57a-t187s-d205s、pet-afata-f51v-t57a-t187s-d205s、pet-afata-t57f-t187s-d205s、pet-afata-f51v-t57f-t187s-d205s、pet-afata-t57g-t187s-d205s、pet-afata-f51v-t57g-t187s-d205s、pet-afata-i117a-t187s-d205s、pet-afata-f51v-i117a-t187s-d205s、pet-afata-t57a-i117a-t187s-d205s、pet-afata-f51v-t57a-i117a-t187s-d205s、pet-afata-t57f-i117a-t187s-d205s、pet-afata-f51v-t57f-i117a-t187s-d205s、pet-afata-t57g-i117a-t187s-d205s、pet-afata-f51v-t57g-i117a-t187s-d205s。综上所述,共计获得96个afata突变体(含afata)。参照上述方法,对l56ay、e115r、w147f、d185a、i237ag进行组合突变。对l56a突变,设计正向、反向引物:正向引物l56a-5:5'-aggctttatgcatggcgatgcgacctatgatgtgacca-3',反向引物l56a-3:5'-tggtcacatcataggtcgcatcgccatgcataaagcct-3';对l56y突变,设计正向、反向引物:正向引物l56y-5:5'-aaggctttatgcatggcgattatacctatgatgtgacc-3'反向引物l56y-3:5'-ggtcacatcataggtataatcgccatgcataaagcctt-3'对e115r突变,设计正向、反向引物:正向引物e115r-5:5'-ttcgcgatgcgtttgtgagagtgattgtgacccgcg-3'反向引物e115r-5:5'-cgcgggtcacaatcactctcacaaacgcatcgcgaa-3'对w147f突变,设计正向、反向引物:正向引物w147f-5:5'-gctggtgctgccgtatattttcgtgatggcgcc-3'反向引物w147f-3:5'-ggcgccatcacgaaaatatacggcagcaccagc-3'对d185a突变,设计正向、反向引物:正向引物d185a-5:5'-cctgcagtggggtgctctgaccaaaggcc-3'反向引物d185a-3:5'-ggcctttggtcagagcaccccactgcagg-3'对i237a突变,设计正向、反向引物:正向引物i237a-5:5'-gcgtgctgcgcggcgctacccgcaaaagcg-3'反向引物i237a-3:5'-cgcttttgcgggtagcgccgcgcagcacgc-3'对i237g突变,设计正向、反向引物:正向引物i237g-5:5'-gcgtgctgcgcggcggtacccgcaaaagcg-3'反向引物i237g-3:5'-cgcttttgcgggtaccgccgcgcagcacgc-3'。以上,共计获得72个afata突变体(含afata)。参照上述方法,对h53fl、k84h、l181a、f191ag、t238s、t273s进行组合突变。对h53f突变,设计正向、反向引物:正向引物h53f-5:5'-gctggatgaaggctttatgtttggcgatctgacctatg-3'反向引物h53f-3:5'-cataggtcagatcgccaaacataaagccttcatccagc-3'对h53l突变,设计正向、反向引物:正向引物h53l-5:5'-ggatgaaggctttatgcttggcgatctgacctatg-3'反向引物h53l-3:5'-cataggtcagatcgccaagcataaagccttcatcc-3'对k84h突变,设计正向、反向引物:正向引物k84h-5:5'-agcgcattctggaaagctgcgatcatatgcgcctgaaa-3'反向引物k84h-3:5'-tttcaggcgcatatgatcgcagctttccagaatgcgct-3'对l181a突变,设计正向、反向引物:正向引物l181a-5:5'-tttgatccgaccattaaaaacgcgcagtggggtgatct-3'反向引物l181a-3:5'-agatcaccccactgcgcgtttttaatggtcggatcaaa-3'对f191a突变,设计正向、反向引物:正向引物f191a-5:5'-atctgaccaaaggcctggctgaagcgatggatcgcg-3'反向引物f191a-3:5'-cgcgatccatcgcttcagccaggcctttggtcagat-3'对f191g突变,设计正向、反向引物:正向引物f191g-5:5'-atctgaccaaaggcctgggtgaagcgatggatcgcg-3'反向引物f191g-3:5'-cgcgatccatcgcttcacccaggcctttggtcagat-3'对t238s突变,设计正向、反向引物:正向引物t238s-5:5'-cgtgctgcgcggcattagccgcaaaagc-3'反向引物t238s-3:5'-gcttttgcggctaatgccgcgcagcacg-3'对t273s突变,利用正向、反向引物:正向引物t273s-5:5'-gaaatttttatgtgcagcaccgcgggcggcatt-3'反向引物t273s-3:5'-aatgccgcccgcggtgctgcacataaaaatttc-3'以上,共计获得144个afata突变体(含afata)。2、重组蛋白的表达条件挑取bl21(de3)、bl21(de3)/afata及309种afata突变体单菌落至每孔含有120μl液体lb-amp培养基中,在37℃、300rpm下培养3~5h。随后,每孔取60μl菌液转接至含有240μl液体tb-amp-iptg培养基中,在25℃、300rpm条件下诱导培养15~20h。3、转氨酶在96孔板中的反应条件在4℃、4000rpm条件下离心10min,去上清培养液收集菌体。随后,用预冷的生理盐水洗涤菌体,在4℃、4000rpm条件下离心10min,去上清液收集菌体。每孔加200μl酶反应体系重悬菌体,在45℃、450rpm条件下孵育24h,利用全细胞催化西格列汀前体酮合成西格列汀。酶反应体系同实施例1:100mm三乙醇胺、1m异丙胺、0.5g/l磷酸吡哆醛、20g/l西格列汀前体酮、50%二甲基亚砜(dmso)、ph值为8.5(浓盐酸调ph值)。4、西格列汀以及西格列汀前体酮的分析方法酶反应结束后,在4000rpm下离心,取上清液。利用异丙醇/乙酸异丙酯(体积比65/35)混合液直接稀释上清液,滤膜过滤后制备hplc待检测样品。hplc色谱条件参照实施例1。三组突变体库(第一组:f51v、t57afg、i117a、t187s、d205as;第二组:l56ay、e115r、w147f、d185a、i237ag;第三组:h53fl、k84h、l181a、f191ag)中每组最优的突变体西格列汀生成率如表3所示。其中,优选的转氨酶突变体afata-l56a-e115r-w147f-i237g的西格列汀生成率最高,为2.4%,其氨基酸序列如seqidno.3所示。与实施例1的结果相比,野生型转氨酶的西格列汀生成率从0.27%降低到0.19%,这是因为更换反应体系导致的。表3、afata突变体全细胞在微型反应体系中的西格列汀生成率转氨酶突变体西格列汀生成率提升倍数afata0.19%—afata-t57g-i117a-d205s0.94%4.94afata-l56a-e115r-w147f-i237g2.4%12.6afata-h53l-k84h-f191a-t273s0.74%3.89由表3可以看出转氨酶(seqidno:1)的l56a、e115r、w147f、i237g突变体(seqidno:3)的酶活力比野生酶seqidno:1提高了11倍多。根据该结果,继续对突变体seqidno:3进行突变体库的构建和筛选评估。实施例3afata关键位点第二轮突变及筛选1、突变体的第二轮构建参照实施例2的方法,以seqidno.3所示氨基酸序列为基础,第53位的组氨酸突变为亮氨酸(h53l);或第57位的苏氨酸突变为甘氨酸(t57g);或第84位赖氨酸突变为组氨酸(k84h);或第117位异亮氨酸突变为丙氨酸(i117a);或第191位苯丙氨酸突变为丙氨酸(f191a);或第205位天冬氨酸突变为丝氨酸(d205s);或第273位苏氨酸突变为丝氨酸(t273s)。对h53l突变,设计正向、反向引物:正向引物h53l-51:5'-tggatgaaggctttatgcttggcgatgcgacc-3'反向引物h53l-31:5'-ggtcgcatcgccaagcataaagccttcatcca-3'对t57g突变,设计正向、反向引物:正向引物t57g-51:5'-atgcatggcgatgcgggctatgatgtgaccac-3'反向引物t57g-31:5'-gtggtcacatcatagcccgcatcgccatgcat-3'对k84h突变,利用正向、反向引物:正向引物k84h-5:5'-agcgcattctggaaagctgcgatcatatgcgcctgaaa-3'反向引物k84h-3:5'-tttcaggcgcatatgatcgcagctttccagaatgcgct-3'对i117a突变,设计正向、反向引物:正向引物i117a-51:5'-gcgtttgtgagagtggctgtgacccgcggcct-3'反向引物i117a-31:5'-aggccgcgggtcacagccactctcacaaacgc-3'对f191a突变,利用正向、反向引物:正向引物f191a-5:5'-atctgaccaaaggcctggctgaagcgatggatcgcg-3'反向引物f191a-3:5'-cgcgatccatcgcttcagccaggcctttggtcagat-3'对d205s突变,利用正向、反向引物:正向引物d205s-5:5'-acctatccgtttctgaccagtggcgataccaacctgac-3'反向引物d205s-3:5'-gtcaggttggtatcgccactggtcagaaacggataggt-3'对t273s突变,利用正向、反向引物:正向引物t273s-5:5'-gaaatttttatgtgcagcaccgcgggcggcatt-3'反向引物t273s-3:5'-aatgccgcccgcggtgctgcacataaaaatttc-3'2、转氨酶突变体的筛选在90孔板中进行转氨酶突变体的筛选,蛋白表达、转氨酶反应、西格列汀以及西格列汀的分析方法参照实施例2中的方法进行。如表4所示,共计获得以下128种afata突变体(含afata-l56a-e115r-w147f-i237g),其中,最优突变体为afata-h53l-l56a-k84h-e115r-i117a-w147f-f191a-i237g-t273s(seqidno:5),西格列汀生成率为17.8%,是突变体afata-l56a-e115r-w147f-i237g(seqidno:3)的7.4倍。突变体seqidno:5对应的核酸序列如seqidno:6所示。表4、afata第二轮突变体全细胞在微型反应体系中的西格列汀生成率转化率提高倍数0~0.4:☆转化率提高倍数0.4~0.7:☆☆转化率提高倍数0.7~1:☆☆☆转化率提高倍数1~2:☆☆☆☆转化率提高倍数2~4:☆☆☆☆☆转化率提高倍数4~7:☆☆☆☆☆☆转化率提高倍数7~10:☆☆☆☆☆☆☆。根据该结果,继续对突变体seqidno:5进行突变体库的构建和筛选评估。实施例4关键位点的定点饱和突变1、定点饱和突变构建转氨酶突变体利用生物信息学技术分析突变体seqidno:5的立体结构,发现位点g127、s214和a275在底物结合位点附近,结构过大可能会增加酶与底物结合的位阻效应。其中,位点a275在底物的三氟苯基基团附近,g127和s214临近底物的四氢三唑并[4,3-α]吡嗪基团。以质粒pet-afata094为模板,g127x-5(ctgaccggcgtgcgcnnnagcaaaccggaggatctgta)、g127x-3(gcgcacgccggtcagg)为引物,pcr扩增约6.3kb的dna片段。pcr反应体系和反应条件参照实施例2的方法。向pcr产物中加入1μl的限制性内切酶dpni消化质粒模板,电泳、胶回收pcr扩增出的dna。利用南京诺唯赞生物科技有限公司的一步克隆试剂盒,使线性化dna两段同源的序列重组后成环,构建第127位位点文库。随后,利用爱思进生物技术(杭州)有限公司的pcr清洁试剂盒除去一步克隆反应体系中的缓冲液和酶,纯化dna后,将回收液电转到bl21(de3)电化学感受态细胞中,加液体lb培养基孵育1h后涂布含有amp的固体lb平板。文库s214x(x表示任意氨基酸)和a275x的构建方法与g127x相同,以质粒pet-afata094为模板,s214x-5(aacctgaccgaaggcnnnggctttaacattgtgctggt)、s214x-3(gccttcggtcaggttggta)为引物构建文库s214x;a275x-5(ttttatgtgcagcaccnnnggcggcattatgccgatta)、a275x-3(ggtgctgcacataaaaatttc)为引物构建文库a275x。2、转氨酶突变体的筛选突变体的筛选在96孔板中进行,转氨酶表达、反应条件、西格列汀以及西格列汀前体酮的分析方法参照实施例2中提供的方法进行。文库g127x、s214x和a275x各挑取200个,利用引物t7(5'-taatacgactcactataggg-3')、t7t(5'-tgctagttattgctcagcgg-3')对西格列汀生成率较高突变体测序,优选的突变体如表5所示。表5、定点饱和突变体的西格列汀生成率3、位点g127f、s214p和a275g组合突变体的构建以质粒pet-afata094-g127f为模板,s214p-5(5'-ccaacctgaccgaaggccccggctttaacattgtgc-3')、s214p-3(5'-gcacaatgttaaagccggggccttcggtcaggttgg-3')为引物,pcr扩增获得质粒pet-afata094-g127f-s214p;以质粒pet-afata094-g127f为模板,a275g-5(5'-atgtgcagcaccgggggcggcattatg-3)、a275g-3(5'-cataatgccgcccccggtgctgcacat-3'),pcr扩增获得质粒pet-afata094-g127f-a275g;以质粒pet-afata094-s214p为模板,a275g-5(5'-atgtgcagcaccgggggcggcattatg-3)、a275g-3(5'-cataatgccgcccccggtgctgcacat-3')为引物,pcr扩增获得质粒pet-afata094-s214p-a275g;以质粒pet-afata094-g127f-s214p为模板,a275g-5(5'-atgtgcagcaccgggggcggcattatg-3)、a275g-3(5'-cataatgccgcccccggtgctgcacat-3')为引物,pcr扩增获得质粒pet-afata094-g127f-s214p-a275g。pcr反应体系、扩增条件、转化操作等实验操作参照实施例2提供的方法进行。4、突变体的转氨酶反应选取afata094、afata094-g127f、afata094-s214p、afata094-a275g、afata094-g127f-s214p、afata094-g127f-a275g、afata094-s214p-a275g、afata094-g127f-s214p-a275g八种突变体在摇瓶水平上进行酶反应,酶反应条件、西格列汀以及西格列汀前体酮的提取方法、检测方法参照实施例1提供的方法进行。如表6所示,突变体afata094的西格列汀生成率从实施例3的17.8%提高到22.3%,这是因为相比于实施例2深孔板中200μl的全细胞反应体系,50ml粗酶反应体系酶与物料混合更加均匀。在以上八个转氨酶突变体中,afata094-g127f-s214p-a275g(afata-h53l-l56a-k84h-e115r-i117a-g127f-w147f-f191a-s214p-i237g-t273s-a275g)是最优的突变体,其氨基酸序列如seqidno:7所示,对应的核酸序列如seqidno:8所示。表6、突变体在摇瓶水平上的西格列汀生成率实施例5全基因随机突变构建afata突变体1、全基因随机突变构建突变体以质粒pet-afata094-g127f-s214p-a275g(装载突变体seqidno:7)为模板,t7(5'-taatacgactcactataggg-3')、t7t(5'-tgctagttattgctcagcgg-3')为引物,利用安捷伦科技有限公司(agilenttechnologies)的随机突变试剂盒pcr扩增,获得afata突变体片段。反应体系:10×buffer缓冲液5μl、dntpmixture10mm、正向引物、反向引物和酶各1μl、模板100~600ng、加ddh2o补至50μl。pcr扩增条件:95℃变性5min;(95℃变性30s,60℃退火30s,72℃延伸1.2min)共10循环;(95℃变性30s,55℃退火30s,72℃延伸1.2min)共12~15循环;72℃延伸7min。将限制性内切酶dpni加入到pcr反应后的溶液中消除甲基化模板,随后电泳、胶回收纯化pcr反应扩增出的dna片段。利用限制性内切酶ndei、bamhi消化dna片段,利用t4dna连接酶将dna片段插入到载体pet22b骨架上。接着利用爱思进生物技术(杭州)有限公司的pcr清洁试剂盒除去连接反应体系中的缓冲液和酶,纯化dna后,将回收液电转到bl21(de3)电化学感受态细胞中,加液体lb培养基孵育1h,涂布含有amp的固体lb平板,获得突变文库。2、突变体文库的筛选突变体的筛选在96孔板中进行,转氨酶表达、反应条件、西格列汀以及西格列汀前体酮的分析方法参照实施例2中提供的方法进行。在对突变文库中4,000个克隆进行筛选,优选的突变体以及底物的摩尔转化率如表7所示。表7、文库afata突变体全细胞反应体系的西格列汀生成率3、第二轮全基因随机突变构建afata突变体在优选的突变体afata-k35n-s40r-h53l-l56a-k84h-e115r-i117a-g127f-w147f-f191a-s214p-i237g-t273s-a275g(seqidno:9)基础上,进行第二轮全基因随机突变。在对突变文库中6,000个克隆进行筛选,优选的突变体以及底物的摩尔转化率如表8所示。表8、第二轮文库afata突变体全细胞反应体系的西格列汀生成率4、第三轮全基因随机突变构建afata突变体在优选的突变体afata-k35n-s40r-h53l-l56a-d72h-k84h-e115r-i117a-g127f-w147f-f191a-s214p-k222r-i237g-t273s-a275g-h309l(seqidno:11)基础上,进行第三轮全基因随机突变。在对突变文库中6,000个克隆进行筛选,优选的突变体以及底物的摩尔转化率如表9所示。表9、第三轮文库afata突变体全细胞反应体系的西格列汀生成率5、第四轮全基因随机突变构建afata突变体在优选的突变体afata-k35n-s40r-h53l-l56a-d72h-q76r-k84h-e115r-i117a-g127f-w147f-f191a-s214p-k222r-i237g-a248v-t273s-a275g-h309l(seqidno:13)基础上,进行第四轮全基因随机突变。在对突变文库中4,000个克隆进行筛选,优选的突变体以及底物的摩尔转化率如表10所示。表10、第四轮文库afata突变体全细胞反应体系的西格列汀生成率由表7-10中可以看出,转氨酶突变体seqidno:9(野生酶seqidno:1的k35n、s40r、h53l、l56a、k84h、e115r、i117a、g127f、w147f、f191a、s214p、i237g、t273s、a275g突变体)、seqidno:11(野生酶seqidno:1的k35n、s40r、h53l、l56a、d72h、k84h、e115r、i117a、g127f、w147f、f191a、s214p、k222r、i237g、t273s、a275g、h309l突变体)、seqidno:13(野生酶seqidno:1的k35n、s40r、h53l、l56a、d72h、q76r、k84h、e115r、i117a、g127f、w147f、f191a、s214p、k222r、i237g、a248v、t273s、a275g、h309l突变体)、seqidno:15(野生酶seqidno:1的k35n、s40r、h53l、l56a、d72h、q76r、k84h、e115r、i117a、t123s、g127f、w147f、f191a、s214p、k222r、i237g、a248v、t273s、a275g、p288a、h309l突变体)的酶活力相比seqidno:7又有了进一步的提高。其中,突变体afata-k35n-s40r-h53l-l56a-d72h-q76r-k84h-e115r-i117a-t123s-g127f-w147f-f191a-s214p-k222r-i237g-a248v-t273s-a275g-p288a-h309l酶活力最高,命名为afata21x,其氨基酸序列如seqidno:15所示,对应的核酸序列如seqidno:16所示。实施例6突变体afata21x不对称合成西格列汀1、重组蛋白的表达及酶反应体系的配制参照实施例1提供的方法构建表达重组转氨酶蛋白的大肠杆菌工程菌。挑取基因工程菌e.colibl21(de3)/pet-afata21x单菌落至5ml含有amp的液体lb培养基中,在37℃、220rpm过夜培养。次日,按照体积浓度为1%的接种量转接至含有50ml液体tb培养基的摇瓶中,37℃、220rpm条件下培养至od600nm为0.6~0.8时,加入诱导剂iptg,随后在25℃、220rpm条件下诱导培养15~20h。4℃条件下离心收集菌体细胞,生理盐水洗涤细胞,用ph值为8.7~9.1的三乙醇胺-盐酸溶液重悬细胞,利用超声法破碎细胞制备粗酶溶液。摇瓶水平50ml粗酶溶液反应体系:100mm三乙醇胺、1m异丙胺、0.5g/l磷酸吡哆醛、50g/l西格列汀前体酮(酶促反应前溶于dmso中,分批加入到反应体系中)、50%二甲基亚砜(dmso)、超声破碎后的细胞(超声前的细胞量为2~2.5g)、ph值为8.5(浓盐酸调ph值),45℃、300rpm条件下孵育24h。上述条件删减超声破碎细胞步骤为摇瓶水平50ml全细胞反应体系。2、酶法不对称合成西格列汀参照实施例1提供的方法提取西格列汀和西格列汀前体酮。酶反应结束后,4℃、12000rpm条件下离心10min,取上清。用浓盐酸调ph至2~3,45℃搅拌循环加热维持1h,然后冷却至室温。加入25ml异丙醇(ipa),搅拌均匀,再加入25ml乙酸异丙酯(ipac),搅拌均匀用10m的naoh调节ph至11,然后搅拌5min。溶液加入50ml体积比为80:20的ipac/ipa混合液,室温搅拌5min,10000rpm条件下离心10min,取上层液体。向上层液体中加入30ml饱和食盐水,室温搅拌5min,12000rpm条件下离心10min,稀释合适的浓度用hplc检测。利用hplc法检测西格列汀以及西格列汀前体酮。色谱条件:色谱柱c18(4.6×250mm,5μm);流动相为磷酸二氢钾-乙腈溶液,精确称量0.05m磷酸二氢钾,加1000ml超纯水溶解,用稀磷酸(取1ml左右磷酸加纯化水稀释至10ml)调ph至3.00,利用0.45μm率膜过滤,取上述缓冲盐加入乙腈,按照体积比1:1混合后超声30min;流速为1.0ml/min;检测波长为254nm;进样量为10μl。利用hplc法分析西格列汀及其s手性异构体(杂质a)。色谱条件:色谱柱chiralpakad-h(4.6×250mm,5μm);流动相为正己烷:乙醇:三乙胺(40:60:0.1);柱温为35℃;流速为0.7ml/min,检测波长为268nm;进样量为10μl;稀释液为甲醇。全细胞反应体系和粗酶溶液反应体系的产物生成率以及光学纯度(e.e.值)如表11所示。表11、突变体afata21x的催化性能反应体系西格列汀生成率e.e.值全细胞反应体系94.5%>99.95%粗酶溶液反应体系96.7%>99.95%结果表明,游离酶和全细胞都能高效催化西格列汀前体酮发生氨基转移反应,得到高光学纯度的西格列汀。因此本发明的转氨酶突变体已经具有工业化利用价值。序列表<110>国药集团威奇达药业有限公司<120>一种转氨酶突变体及其在西格列汀合成中的应用<130>shpi2010483<160>83<170>siposequencelisting1.0<210>1<211>323<212>prt<213>aspergillusfumigatiaffinis<400>1metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglylysphevalleuproseraspalaargileproleuleuasp354045gluglyphemethisglyaspleuthrtyraspvalthrthrvaltrp505560aspglyargphepheargleuaspasphismetglnargileleuglu65707580sercysasplysmetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalgluvalilevalthrargglyleuthrglyvalargglyser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyriletrpvalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleupheglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyserglypheasnilevalleuvallysasngly210215220ileleutyrthrproaspargglyvalleuargglyilethrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270thrthralaglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumethistyraspproalatyrserpheprovalasptyr305310315320glysergly<210>2<211>969<212>dna<213>artificialsequence<400>2atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaaatttgtgctgccgagc120gatgcgcgcattccgctgctggatgaaggctttatgcatggcgatctgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctggatgatcacatgcagcgcattctggaa240agctgcgataaaatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtggaagtgattgtgacccgc360ggcctgaccggcgtgcgcggcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatatttgggtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctgtttgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcagcggctttaacattgtgctg660gtgaaaaacggcattctgtataccccggatcgcggcgtgctgcgcggcattacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcaccaccgcgggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgcattatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>3<211>323<212>prt<213>artificialsequence<400>3metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglylysphevalleuproseraspalaargileproleuleuasp354045gluglyphemethisglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuaspasphismetglnargileleuglu65707580sercysasplysmetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalilevalthrargglyleuthrglyvalargglyser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleupheglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyserglypheasnilevalleuvallysasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270thrthralaglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumethistyraspproalatyrserpheprovalasptyr305310315320glysergly<210>4<211>969<212>dna<213>artificialsequence<400>4atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaaatttgtgctgccgagc120gatgcgcgcattccgctgctggatgaaggctttatgcatggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctggatgatcacatgcagcgcattctggaa240agctgcgataaaatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtgattgtgacccgc360ggcctgaccggcgtgcgcggcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctgtttgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcagcggctttaacattgtgctg660gtgaaaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcaccaccgcgggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgcattatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>5<211>323<212>prt<213>artificialsequence<400>5metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglylysphevalleuproseraspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuaspasphismetglnargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuthrglyvalargglyser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyserglypheasnilevalleuvallysasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthralaglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumethistyraspproalatyrserpheprovalasptyr305310315320glysergly<210>6<211>969<212>dna<213>artificialsequence<400>6atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaaatttgtgctgccgagc120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctggatgatcacatgcagcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgaccggcgtgcgcggcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcagcggctttaacattgtgctg660gtgaaaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccgcgggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgcattatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>7<211>323<212>prt<213>artificialsequence<400>7metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglylysphevalleuproseraspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuaspasphismetglnargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuthrglyvalargpheser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyproglypheasnilevalleuvallysasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthrglyglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumethistyraspproalatyrserpheprovalasptyr305310315320glysergly<210>8<211>969<212>dna<213>artificialsequence<400>8atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaaatttgtgctgccgagc120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctggatgatcacatgcagcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgaccggcgtgcgcttcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcccaggctttaacattgtgctg660gtgaaaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccggcggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgcattatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>9<211>323<212>prt<213>artificialsequence<400>9metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglyasnphevalleuproargaspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuaspasphismetglnargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuthrglyvalargpheser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyproglypheasnilevalleuvallysasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthrglyglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumethistyraspproalatyrserpheprovalasptyr305310315320glysergly<210>10<211>969<212>dna<213>artificialsequence<400>10atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaattttgtgctgccgagg120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctggatgatcacatgcagcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgaccggcgtgcgcttcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcccaggctttaacattgtgctg660gtgaaaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccggcggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgcattatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>11<211>323<212>prt<213>artificialsequence<400>11metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglyasnphevalleuproargaspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuhisasphismetglnargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuthrglyvalargpheser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyproglypheasnilevalleuvalargasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargalaasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthrglyglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumetleutyraspproalatyrserpheprovalasptyr305310315320glysergly<210>12<211>969<212>dna<213>artificialsequence<400>12atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaattttgtgctgccgagg120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctgcatgatcacatgcagcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgaccggcgtgcgcttcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcccaggctttaacattgtgctg660gtgagaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgcgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccggcggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgctttatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>13<211>323<212>prt<213>artificialsequence<400>13metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglyasnphevalleuproargaspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuhisasphismetargargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuthrglyvalargpheser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyproglypheasnilevalleuvalargasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargvalasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthrglyglyglyilemetproilethrleuleuaspglyglnpro275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumetleutyraspproalatyrserpheprovalasptyr305310315320glysergly<210>14<211>969<212>dna<213>artificialsequence<400>14atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaattttgtgctgccgagg120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctgcatgatcacatgcggcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgaccggcgtgcgcttcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcccaggctttaacattgtgctg660gtgagaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgtgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccggcggcggcattatgccg840attaccctgctggatggtcagccggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgctttatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>15<211>323<212>prt<213>artificialsequence<400>15metalasermetasplysvalpheserglytyrhisalaargglnlys151015leuleugluargseraspasnpropheserlysglyilealatyrval202530gluglyasnphevalleuproargaspalaargileproleuleuasp354045gluglyphemetleuglyaspalathrtyraspvalthrthrvaltrp505560aspglyargphepheargleuhisasphismetargargileleuglu65707580sercysasphismetargleulyspheproleualaproserthrval859095lysasnileleualaglumetvalalalysserglyileargaspala100105110phevalargvalalavalthrargglyleuserglyvalargpheser115120125lysprogluaspleutyrasnasnasniletyrleuleuvalleupro130135140tyrilephevalmetalaprogluileglnleuleuglyglyserala145150155160ileilethrargthrvalargargthrproproglyalapheasppro165170175thrilelysasnleuglntrpglyaspleuthrlysglyleualaglu180185190alametaspargglyserthrtyrpropheleuthraspglyaspthr195200205asnleuthrgluglyproglypheasnilevalleuvalargasngly210215220ileleutyrthrproaspargglyvalleuargglyglythrarglys225230235240servalileaspvalalaargvalasnasnileaspileargleuglu245250255valvalprovalgluglnvaltyrglnseraspgluilephemetcys260265270serthrglyglyglyilemetproilethrleuleuaspglyglnala275280285valasnaspglyglnvalglyproilethrlyslysiletrpaspgly290295300tyrtrpglumetleutyraspproalatyrserpheprovalasptyr305310315320glysergly<210>16<211>969<212>dna<213>artificialsequence<400>16atggcgagcatggataaagtgtttagcggctatcatgcgcgtcagaaactgctggaacgc60agcgataacccgtttagcaaaggcattgcgtatgtggaaggcaattttgtgctgccgagg120gatgcgcgcattccgctgctggatgaaggctttatgcttggcgatgcgacctatgatgtg180accaccgtgtgggatggccgcttttttcgcctgcatgatcacatgcggcgcattctggaa240agctgcgatcatatgcgcctgaaatttccgctggcgccgagcaccgtgaaaaacattctg300gcggaaatggtggcgaaaagcggcattcgcgatgcgtttgtgagagtggctgtgacccgc360ggcctgtccggcgtgcgcttcagcaaaccggaggatctgtataacaacaacatttatctg420ctggtgctgccgtatattttcgtgatggcgccggaaattcagctgctgggcggcagcgcg480attattacccgcaccgtgcgccgcaccccgccgggcgcgtttgatccgaccattaaaaac540ctgcagtggggtgatctgaccaaaggcctggctgaagcgatggatcgcggcagcacctat600ccgtttctgaccgatggcgataccaacctgaccgaaggcccaggctttaacattgtgctg660gtgagaaacggcattctgtataccccggatcgcggcgtgctgcgcggcggtacccgcaaa720agcgtgattgatgtggcgcgcgtgaacaacattgatattcgcctggaagtggtgccggtg780gaacaagtgtatcagagcgatgaaatttttatgtgcagcaccggcggcggcattatgccg840attaccctgctggatggtcaggcggtgaacgatggccaagttggcccgattaccaaaaaa900atttgggatggctattgggaaatgctttatgatccggcgtatagctttccggtggattat960ggcagcggc969<210>17<211>33<212>dna<213>artificialsequence<400>17gctgctggatgaaggcgttatgcatggcgatct33<210>18<211>33<212>dna<213>artificialsequence<400>18agatcgccatgcataacgccttcatccagcagc33<210>19<211>35<212>dna<213>artificialsequence<400>19ttatgcatggcgatctggcctatgatgtgaccacc35<210>20<211>35<212>dna<213>artificialsequence<400>20ggtggtcacatcataggccagatcgccatgcataa35<210>21<211>34<212>dna<213>artificialsequence<400>21tatgcatggcgatctgttctatgatgtgaccacc34<210>22<211>34<212>dna<213>artificialsequence<400>22ggtggtcacatcatagaacagatcgccatgcata34<210>23<211>32<212>dna<213>artificialsequence<400>23atgcatggcgatctgggctatgatgtgaccac32<210>24<211>32<212>dna<213>artificialsequence<400>24gtggtcacatcatagcccagatcgccatgcat32<210>25<211>32<212>dna<213>artificialsequence<400>25gcgtttgtggaagtggctgtgacccgcggcct32<210>26<211>32<212>dna<213>artificialsequence<400>26aggccgcgggtcacagccacttccacaaacgc32<210>27<211>33<212>dna<213>artificialsequence<400>27cagtggggtgatctgagcaaaggcctgtttgaa33<210>28<211>33<212>dna<213>artificialsequence<400>28ttcaaacaggcctttgctcagatcaccccactg33<210>29<211>33<212>dna<213>artificialsequence<400>29tatccgtttctgaccgctggcgataccaacctg33<210>30<211>33<212>dna<213>artificialsequence<400>30caggttggtatcgccagcggtcagaaacggata33<210>31<211>38<212>dna<213>artificialsequence<400>31acctatccgtttctgaccagtggcgataccaacctgac38<210>32<211>38<212>dna<213>artificialsequence<400>32gtcaggttggtatcgccactggtcagaaacggataggt38<210>33<211>38<212>dna<213>artificialsequence<400>33aggctttatgcatggcgatgcgacctatgatgtgacca38<210>34<211>38<212>dna<213>artificialsequence<400>34tggtcacatcataggtcgcatcgccatgcataaagcct38<210>35<211>38<212>dna<213>artificialsequence<400>35aaggctttatgcatggcgattatacctatgatgtgacc38<210>36<211>38<212>dna<213>artificialsequence<400>36ggtcacatcataggtataatcgccatgcataaagcctt38<210>37<211>36<212>dna<213>artificialsequence<400>37ttcgcgatgcgtttgtgagagtgattgtgacccgcg36<210>38<211>36<212>dna<213>artificialsequence<400>38cgcgggtcacaatcactctcacaaacgcatcgcgaa36<210>39<211>33<212>dna<213>artificialsequence<400>39gctggtgctgccgtatattttcgtgatggcgcc33<210>40<211>33<212>dna<213>artificialsequence<400>40ggcgccatcacgaaaatatacggcagcaccagc33<210>41<211>29<212>dna<213>artificialsequence<400>41cctgcagtggggtgctctgaccaaaggcc29<210>42<211>29<212>dna<213>artificialsequence<400>42ggcctttggtcagagcaccccactgcagg29<210>43<211>30<212>dna<213>artificialsequence<400>43gcgtgctgcgcggcgctacccgcaaaagcg30<210>44<211>30<212>dna<213>artificialsequence<400>44cgcttttgcgggtagcgccgcgcagcacgc30<210>45<211>30<212>dna<213>artificialsequence<400>45gcgtgctgcgcggcggtacccgcaaaagcg30<210>46<211>30<212>dna<213>artificialsequence<400>46cgcttttgcgggtaccgccgcgcagcacgc30<210>47<211>38<212>dna<213>artificialsequence<400>47gctggatgaaggctttatgtttggcgatctgacctatg38<210>48<211>38<212>dna<213>artificialsequence<400>48cataggtcagatcgccaaacataaagccttcatccagc38<210>49<211>35<212>dna<213>artificialsequence<400>49ggatgaaggctttatgcttggcgatctgacctatg35<210>50<211>35<212>dna<213>artificialsequence<400>50cataggtcagatcgccaagcataaagccttcatcc35<210>51<211>38<212>dna<213>artificialsequence<400>51agcgcattctggaaagctgcgatcatatgcgcctgaaa38<210>52<211>38<212>dna<213>artificialsequence<400>52tttcaggcgcatatgatcgcagctttccagaatgcgct38<210>53<211>38<212>dna<213>artificialsequence<400>53tttgatccgaccattaaaaacgcgcagtggggtgatct38<210>54<211>38<212>dna<213>artificialsequence<400>54agatcaccccactgcgcgtttttaatggtcggatcaaa38<210>55<211>36<212>dna<213>artificialsequence<400>55atctgaccaaaggcctggctgaagcgatggatcgcg36<210>56<211>36<212>dna<213>artificialsequence<400>56cgcgatccatcgcttcagccaggcctttggtcagat36<210>57<211>36<212>dna<213>artificialsequence<400>57atctgaccaaaggcctgggtgaagcgatggatcgcg36<210>58<211>36<212>dna<213>artificialsequence<400>58cgcgatccatcgcttcacccaggcctttggtcagat36<210>59<211>28<212>dna<213>artificialsequence<400>59cgtgctgcgcggcattagccgcaaaagc28<210>60<211>28<212>dna<213>artificialsequence<400>60gcttttgcggctaatgccgcgcagcacg28<210>61<211>33<212>dna<213>artificialsequence<400>61gaaatttttatgtgcagcaccgcgggcggcatt33<210>62<211>33<212>dna<213>artificialsequence<400>62aatgccgcccgcggtgctgcacataaaaatttc33<210>63<211>32<212>dna<213>artificialsequence<400>63tggatgaaggctttatgcttggcgatgcgacc32<210>64<211>32<212>dna<213>artificialsequence<400>64ggtcgcatcgccaagcataaagccttcatcca32<210>65<211>32<212>dna<213>artificialsequence<400>65atgcatggcgatgcgggctatgatgtgaccac32<210>66<211>32<212>dna<213>artificialsequence<400>66gtggtcacatcatagcccgcatcgccatgcat32<210>67<211>32<212>dna<213>artificialsequence<400>67gcgtttgtgagagtggctgtgacccgcggcct32<210>68<211>32<212>dna<213>artificialsequence<400>68aggccgcgggtcacagccactctcacaaacgc32<210>69<211>38<212>dna<213>artificialsequence<400>69<211>misc_feature<212>(16)..(18)<213>nisa,c,g,ortctgaccggcgtgcgcnnnagcaaaccggaggatctgta38<210>70<211>16<212>dna<213>artificialsequence<400>70gcgcacgccggtcagg16<210>71<211>38<212>dna<213>artificialsequence<400>71<211>misc_feature<212>(16)..(18)<213>nisa,c,g,ortaacctgaccgaaggcnnnggctttaacattgtgctggt38<210>72<211>19<212>dna<213>artificialsequence<400>72gccttcggtcaggttggta19<210>73<211>38<212>dna<213>artificialsequence<400>73<211>misc_feature<212>(17)..(19)<213>nisa,c,g,ortttttatgtgcagcaccnnnggcggcattatgccgatta38<210>74<211>21<212>dna<213>artificialsequence<400>74ggtgctgcacataaaaatttc21<210>75<211>20<212>dna<213>artificialsequence<400>75taatacgactcactataggg20<210>76<211>20<212>dna<213>artificialsequence<400>76tgctagttattgctcagcgg20<210>77<211>36<212>dna<213>artificialsequence<400>77ccaacctgaccgaaggccccggctttaacattgtgc36<210>78<211>36<212>dna<213>artificialsequence<400>78gcacaatgttaaagccggggccttcggtcaggttgg36<210>79<211>27<212>dna<213>artificialsequence<400>79atgtgcagcaccgggggcggcattatg27<210>80<211>27<212>dna<213>artificialsequence<400>80cataatgccgcccccggtgctgcacat27当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1