本发明涉及用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶及其在催化制备l-苏式-对甲砜基苯丝氨酸和/或l-赤式-对甲砜基苯丝氨酸中的用途。
背景技术:
作为许多农药与医药活性成分的关键前体,l-β-羟基-α-氨基酸(丝氨酸衍生物)也是许多抗体、抗真菌剂、免疫抑制剂及抗癌药物的关键结构单元。以往合成l-β-羟基-α-氨基酸的方法由于各种局限具有低的立体选择性、前体昂贵以及需要各种化学计量手性助剂等缺陷。而l-β-羟基-α-氨基酸合成酶(包括l-苏氨酸醛缩酶,l-苯丝氨酸醛缩酶,丝氨酸羟甲基转移酶等)通过催化甘氨酸和相应的醛类化合物可一步合成l-β-羟基-α-氨基酸,且反应条件较为温和,不会产生其他化学法导致的污染问题。
酶分子一般在水相中进行催化,反应条件温和。但在l-β-羟基-α-氨基酸合成酶催化甘氨酸与对甲砜基苯甲醛的反应过程中,可能需要在反应体系加入有机溶剂,这些有机溶剂的存在对酶的稳定性造成了不利的影响。因此,对酶分子进行改造使其稳定性提高就有重要意义。
技术实现要素:
本发明的第一方面涉及用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶,其中所述l-β-羟基-α-氨基酸合成酶具有seqno.1或seqno.2的氨基酸序列,或者具有在seqidno.1或seqidno.2所示的氨基酸序列基础上进行1-10个或1-5个或1-3个氨基酸残基替换、增加或缺失但具有l-β-羟基-α-氨基酸合成酶活性的氨基酸序列。该环化的酶具有良好的热稳定性和有机溶剂耐受性。
本发明的又一方面涉及所述的用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶在制备l-苏式-对甲砜基苯丝氨酸和/或l-赤式-对甲砜基苯丝氨酸中的用途。
具体实施方式
本发明的第一方面涉及用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶,该环化的酶具有良好的热稳定性和有机溶剂耐受性,其中所述l-β-羟基-α-氨基酸合成酶具有seqno.1或seqno.2的氨基酸序列,或者具有在seqidno.1或seqidno.2所示的氨基酸序列基础上进行1-10个或1-5个或1-3个氨基酸残基替换、增加或缺失但具有l-β-羟基-α-氨基酸合成酶活性的氨基酸序列。
在本发明中,术语“l-β-羟基-α-氨基酸合成酶”泛指能够催化醛基(-ch(=o))与氨基酸中的氨基(-nh2)发生缩合反应生成l-β-羟基-α-氨基酸的酶,特别是指能够催化醛基(-ch(=o))与甘氨酸中的氨基(-nh2)发生缩合反应生成l-β-羟基-α-氨基酸的酶,尤其是指能够催化甘氨酸和对甲砜基苯甲醛发生缩合反应生成l-苏式-对甲砜基苯丝氨酸的酶,例如,l-β-羟基-α-氨基酸合成酶包括l-苏氨酸醛缩酶、l-苯丝氨酸醛缩酶、丝氨酸羟甲基转移酶等等。
在本文中,将具有seqidno.1氨基酸序列的酶称为酶24-1(该酶为l-苯基丝氨酸醛缩酶,属于l-β-羟基-α-氨基酸合成酶),将具有seqidno.2氨基酸序列的酶称为kt2440(该酶为l-苏氨酸醛缩酶,属于l-β-羟基-α-氨基酸合成酶)。本领域技术人员可以理解,在保持l-β-羟基-α-氨基酸合成酶的酶活性的前提下,可以对seqidno.1或seqidno.2所示的氨基酸序列进行少量氨基酸残基(例如1-10个或1-5个或1-3个氨基酸残基)的替换、增加或缺失。
酶24-1可以通过下述方法得到:将能够翻译出seqidno.1氨基酸序列的dna序列重组到pet-28a质粒上,得到重组质粒pet28a-24-1,将所述重组质粒pet28a-24-1转入大肠杆菌e.colibl21(de3)中获得重组菌株bl21(de3)/pet28a-24-1,培养所述重组菌株使其表达酶24-1。
优选地,培养重组菌株bl21(de3)/pet28a-24-1的方法可以如下:将所述重组菌株bl21(de3)/pet28a-24-1的单菌落接种到lb培养基中,在35-40℃下振荡培养5-18h,取培养振荡后的培养液以0.5-5%的接种量转接于乳糖培养基中,在20-37℃下振荡培养12-40h,振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其用高压匀浆机匀浆破碎,将破碎液离心,收集上清液,即得所述酶24-1。
酶kt2440可以通过下述方法得到:将能够翻译出seqidno.2氨基酸序列的dna序列重组到pet28a质粒上,得到重组质粒pet28a-kt2440,将所述重组质粒pet28a-kt2440转入大肠杆菌e.colibl21(de3)中获得重组菌株bl21(de3)/pet28a-kt2440,培养所述重组菌株使其表达酶kt2440。
优选地,培养重组菌株bl21(de3)/pet28a-kt2440的方法可以如下:将所述重组菌株bl21(de3)/pet28a-kt2440的单菌落接种到lb培养基中,在35-40℃下振荡培养5-18h,取培养振荡后的培养液以0.5-5%的接种量转接于乳糖培养基中,在20-37℃下振荡培养12-40h,振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其用高压匀浆机匀浆破碎,将破碎液离心,收集上清液,即得所述酶kt2440。
为了构建环化的酶24-1或环化的酶kt2440,本发明利用全质粒megawhop的方法(miyazaki,k.,&takenouchi,m.(2002).creatingrandommutagenesislibrariesusingmegaprimerpcrofwholeplasmid.biotechniques,33(5),1033-4.),通过构建合成搭接引物,再将合成的引物和目的l-β-羟基-α-氨基酸合成酶基因进行混合pcr获得含有spytag和spycatcher接头的目的基因片段,然后再将这一片段和spytag-β-lactamase-spycatcher质粒(从addgene购得,质粒编号52656)混合,进行全质粒megawhoppcr以获得含有spytag-24-1-spycatcher或spytag-2440-spycatcher的spytag/spycatcher环化酶的质粒dna。接着,将megawhoppcr产物用dpni进行消化然后将其转化入bl21(de3)中,液体lb培养后涂抗性平板进行筛选,经过核酸测序确定spytag/spycatcher环化的酶sr-24-1或spytag/spycatcher环化的酶sr-kt2440是否构建成功。
本发明的第二方面涉及用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶在制备l-苏式-对甲砜基苯丝氨酸和/或l-赤式-对甲砜基苯丝氨酸中的用途。具体来说,涉及用该环化的l-β-羟基-α-氨基酸合成酶催化甘氨酸和对甲砜基苯甲醛制备l-苏式-对甲砜基苯丝氨酸和/或l-赤式-对甲砜基苯丝氨酸。使用该环化的l-β-羟基-α-氨基酸合成酶的制备工艺具有环境友好且简单的特点。
在反应体系中,甘氨酸和对甲砜基苯甲醛在该环化的l-β-羟基-α-氨基酸合成酶存在下进行如下反应:
上述反应中生成l-苏式-对甲砜基苯丝氨酸与l-赤式-对甲砜基苯丝氨酸。
作为本发明的反应底物,甘氨酸易溶于水,而对甲砜基苯甲醛在水中的溶解度非常低,需要加入助溶剂来在提高对甲砜基苯甲醛在水中的溶解度。
上述制备方法可以包括如下步骤:
(a)使甘氨酸和对甲砜基苯甲醛在用spytag/spycatcher环化的l-β-羟基-α-氨基酸合成酶存在下在含助溶剂的水溶液体系中反应,
(b)固液分离得到包含l-苏式-对甲砜基苯丝氨酸的液相和包含l-赤式-对甲砜基苯丝氨酸的固相,
(c)将步骤(b)中得到的液相降温以使l-苏式-对甲砜基苯丝氨酸沉淀析出,
(d)固液分离得到沉淀析出的l-苏式-对甲砜基苯丝氨酸;和
(e)任选地,将步骤(d)产生的液相用于步骤(a)的反应。
在本发明中,环化的l-β-羟基-α-氨基酸合成酶在反应中的用量没有特别的要求。用量少,反应进行的慢,所需反应时间长;用量多,反应进行的快,所需反应时间短。可以根据反应需要选择和调节环化的l-β-羟基-α-氨基酸合成酶的用量。
在本发明中,环化的l-β-羟基-α-氨基酸合成酶的活性以其催化分解l-苯丝氨酸生成苯甲醛和甘氨酸的能力进行衡量。在本发明中,环化的l-β-羟基-α-氨基酸合成酶的活性定义为:在约30℃、ph为约8.5和l-苯丝氨酸浓度为约10mmol/l的条件下,每分钟催化l-苯丝氨酸生成1μmol苯甲醛所需的酶量为1个活力单位(u)。
在本发明中,环化的l-β-羟基-α-氨基酸合成酶的活性测定方式为:
(1)底物溶液的配制:称取dl-苯丝氨酸(以其中的l-苯丝氨酸为酶的底物)于去离子水中,超声使其完全溶解,再加入5-磷酸吡哆醛(plp),调节ph=8.5,使得最终溶液中包含40mmol/ldl-苯丝氨酸、40μmol/lplp。
(2)反应条件:取10μl酶液、190μl去离子水、200μl底物溶液于1.5ml离心管中混匀,于30℃下计时反应,反应10min时立即加入400μl1.7%磷酸终止液混匀终止反应。取终止后的反应液测量其290nm处的吸光度,与苯甲醛浓度—290nm吸光度标准曲线进行比较,得到反应液中的苯甲醛浓度,进而计算得到环化的l-β-羟基-α-氨基酸合成酶的活力单位。
需要说明的是,在本发明的方法中,甘氨酸与对甲砜基苯甲醛的反应需要使用环化的l-β-羟基-α-氨基酸合成酶进行催化,而不能使用环化的d-β-羟基-α-氨基酸合成酶(例如d-苏氨酸醛缩酶)进行催化,因为环化的d-β-羟基-α-氨基酸合成酶催化甘氨酸与对甲砜基苯甲醛的反应生成上述两个产物的手性对映体d-苏式-对甲砜基苯丝氨酸和d-赤式-对甲砜基苯丝氨酸。由于d构型对映体不具有生物活性,需要通过复杂的化学法再转化获得l构型的产物。因此,使用环化的d-β-羟基-α-氨基酸合成酶在生产中不能通过简单分离获得l-苏式-对甲砜基苯丝氨酸和l-赤式-对甲砜基苯丝氨酸,即,使用环化的d-β-羟基-α-氨基酸合成酶催化甘氨酸与对甲砜基苯甲醛的反应不能实现本发明的目的。
作为本发明的反应底物,甘氨酸易溶于水,而对甲砜基苯甲醛在水中的溶解度非常低,需要加入助溶剂来在提高对甲砜基苯甲醛在水中的溶解度。优选地,对甲砜基苯甲醛和甘氨酸均以饱和状态溶解在反应体系中。优选地,对甲砜基苯甲醛以远大于其溶解度的量加入反应体系中。更优选加入到反应体系中的甘氨酸的摩尔量大于对甲砜基苯甲醛的摩尔量。例如,甘氨酸以0.5-2mol/l,例如0.6-1.5mol/l,0.8-1.2mol/l的浓度加入到反应体系中,对甲砜基苯甲醛以0.1-0.8mol/l,例如0.2-0.6mol/l,0.2-0.5mol/l的浓度加入到反应体系中。
在本发明中,可以使用的助溶剂选自以下中的一种或多种:甲醇、乙醇、正丙醇、异丙醇、正丁醇、异丁醇、仲丁醇、叔丁醇、1-戊醇、2-戊醇、3-戊醇、2-甲基-1-丁醇、3-甲基-1-丁醇、2-甲基-2-丁醇、3-甲基-2-丁醇、2,2-二甲基丙醇、乙二醇、丙三醇、巯基乙醇、乙酸乙酯、乙酸丁酯、聚乙二醇6000(peg6000)、聚乙二醇辛基苯醚(tritonx-100)、乙腈、丙酮、二甲基亚砜(dmso)、二甲基甲酰胺(dmf)、二甲基乙醇胺(dmae)、乙二醇二甲醚(dme)、甲基叔丁基醚、四丁基溴化铵、三乙胺、咪唑、吡啶、二甲基四氢呋喃、十二烷基磺酸钠(sds)、3-吗啉丙磺酸(mops)、β-环糊精和亚硫酸氢钠。优选选自dmso、dmf、乙醇和丙酮。
优选地,助溶剂在水溶液中的体积浓度不超过60%,优选地,不超过55%,不超过50%,不超过45%,不超过40%,不超过35%。优选地,助溶剂的体积浓度为至少5%,至少10%,至少12%,至少15%,至少20%,至少22%,至少25%,至少30%。
可以在步骤(a)中的反应体系中加入5-磷酸吡哆醛(plp),5-磷酸吡哆醛作为环化的l-β-羟基-α-氨基酸合成酶的辅酶可以提高酶的活性。但是,5-磷酸吡哆醛在本发明的方法中不是必须的。在加入5-磷酸吡哆醛的情况下,5-磷酸吡哆醛的加入量可以为不超过200μmol/l,例如不超过100μmol/l,不超出80μmol/l,不超过60μmol/l,不超过50μmol/l。
步骤(a)的反应可以在宽范围的温度条件下进行,例如,4-50℃的温度范围内,10-30℃的温度范围内,15-28℃的温度范围内。一般而言,温度越高,反应速度越快;温度越低,反应速度越慢。因此,根据酶的催化反应特点选择所需反应温度。
步骤(a)的反应体系的ph可以在5-10的范围内,例如,6-9的范围内,6-8的范围内,6-7的范围内。可以在反应体系中使用缓冲液,也可以不使用缓冲液。从简化工艺的角度来说,优选不使用缓冲液。
步骤(a)的反应优选在搅拌下进行,搅拌可以连续进行,也可以间断进行。搅拌速度没有特别的限制,只要使得反应体系处于大致的混合均匀状态即可。在不同的反应容器中,可以根据需要调节适合的搅拌速度。
优选地,进行步骤(a)的反应直到反应体系的反应达到平衡状态。但是,也不是必须达到反应平衡状态,可以在达到平衡状态前终止反应。根据使用的酶的量以及反应温度等反应条件,反应时间可以在宽的范围内选择,例如,反应可以进行2-75个小时,例如5-70个小时,10-68个小时,10-45个小时,10-40个小时。
在本发明方法的步骤(a)中,出人意料的发现,在本发明中描述的条件下,随着反应的进行,l-赤式-对甲砜基苯丝氨酸能够从反应体系中沉淀出来,而l-苏式-对甲砜基苯丝氨酸却可以保持溶解状态。为了加速l-赤式-对甲砜基苯丝氨酸这一沉淀进程,优选加入l-赤式-对甲砜基苯丝氨酸晶种。但是,从降低生产成本的角度,也可以不加入l-赤式-对甲砜基苯丝氨酸晶种。
如果在反应中加入l-赤式-对甲砜基苯丝氨酸晶种,其加入时间点没有特别的限制,可以随反应物一同加入到反应体系,也可以在反应开始之后反应结束之前加入,例如在反应过程中0-72小时内的任意时间内,例如,在反应开始后0小时,1小时,2小时,3小时,4小时,6小时,8小时,10小时,12小时,14小时,16小时,18小时,20小时,22小时,24小时,26小时,28小时,30小时,33小时,35小时,38小时,40小时,42小时,45小时,48小时,50小时,52小时,55小时,58小时,60小时,62小时,65小时,68小时,70小时或72小时。
在步骤(a)中,随着反应的不断进行,l-赤式-对甲砜基苯丝氨酸不断沉淀,而l-苏式-对甲砜基苯丝氨酸在液相中不断的积累。在达到平衡状态时,液相中的l-赤式-对甲砜基苯丝氨酸含量很少,大部分的l-赤式-对甲砜基苯丝氨酸沉淀出。优选地,在反应达到平衡状态后,将反应体系固液分离得到包含l-苏式-对甲砜基苯丝氨酸的液相和包含l-赤式-对甲砜基苯丝氨酸的固相(步骤(b))。所述固液分离操作可以采用常规的固液分离手段,例如过滤、离心或抽滤等。但是,可以理解的是,不是必须等到反应达到平衡状态才可以进行上述固液分离操作,也可以在达到平衡状态前进行上述固液分离操作。
在步骤(c)中,将包含l-苏式-对甲砜基苯丝氨酸的液相降温至10℃以下,例如,9℃以下、8℃以下、7℃以下、6℃以下、5℃以下、4℃以下、3℃以下、2℃以下、1℃以下,0℃以下;但是,考虑到实际操作条件限制,一般降温到-5℃以上,例如-4℃以上,-3℃以上、-2℃以上、-1℃以上。l-苏式-对甲砜基苯丝氨酸从液相中沉淀析出。理论上初步认为,该沉淀析出可能包括了结晶过程和普通析出过程的混合。为了加快这一沉淀析出进程,优选加入l-苏式-对甲砜基苯丝氨酸晶种,但是从降低生产成本的角度,也可以不加入l-苏式-对甲砜基苯丝氨酸晶种。
步骤(c)中的沉淀析出所用时间没有具体的限制,只要液相中的至少一部分(优选大部分)l-苏式-对甲砜基苯丝氨酸沉淀析出出来即可。可以根据降温速度、降温温度和所用降温设备等条件进行综合确定。一般情况下,降温沉淀析出所用时间在0.5-36小时范围内,例如1-25小时范围内,1-15小时范围内,1-5小时范围内。
在沉淀析出完成后,在步骤(d)中,通过固液分离得到沉淀析出的l-苏式-对甲砜基苯丝氨酸。所述固液分离操作可以采用常规的固液分离手段,例如过滤、离心或抽滤等。
除了前述步骤(a)至(d)之外,还可以包括步骤(e):将步骤(d)产生的液相用于步骤(a)的反应。也就是说,将分离l-苏式-对甲砜基苯丝氨酸之后的液相重新用于步骤(a)的反应。在该分离后的液相中加入对甲砜基苯甲醛和甘氨酸,不加或仅少量补加环化的l-β-羟基-α-氨基酸合成酶就可以直接重新用于反应,这可以大大降低生产成本,实现反应体系的重复套用。
在本发明中,应当理解所给出的数值点可以包括适当的偏差,例如所给出值±10%,优选±5%,更优选±3%,更优选±1%内的偏差。
以下通过实施例示例性地说明本发明,但是可以理解的是,本发明的范围不限于这些实施例。
实施例
酶制备例1
具有seqno.1的氨基酸序列的酶24-1的制备
(1)合成pet28a-24-1质粒,将能够翻译出seqidno.1氨基酸序列的dna序列seqidno.3基因进行合成,并插入到pet28a质粒的bamhi-hindiii之间,即得重组质粒pet28a-24-1,将所述重组质粒pet28a-24-1转化至大肠杆菌e.colibl21(de3)中,即得所述重组菌株bl21(de3)/pet28a-24-1。
(2)培养所述重组菌株bl21(de3)/pet28a-24-1使其表达所述酶24-1,具体包括以下步骤:将所述重组菌株bl21(de3)/pet28a-24-1的单菌落接种到lb培养基中,在37℃下振荡培养12h,取振荡培养后的培养基以2.5%的接种量转接于乳糖培养基(蛋白胨10g/l,酵母粉5g/l,na2hpo4·12h2o8.95g/l,kh2po43.4g/l,nh4cl2.67g/l,na2so40.7g/l,mgso40.24g/l,甘油5g/l,葡萄糖0.5g/l,乳糖2g/l)中,在28℃下振荡培养24h;振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其置于高压匀浆机中匀浆破碎,将破碎液离心,收集上清液,即得所述酶24-1。通过前述活性测定方法,测得酶液的酶活为33u/ml。
酶制备例2
具有seqno.2的氨基酸序列的酶kt2440的制备
(1)合成pet28a-kt2440质粒,将能够翻译出seqidno.2氨基酸序列的dna序列seqidno.4基因进行合成,并插入pet28a质粒的bamhi-hindiii之间,即得重组质粒pet28a-kt2440,将所述重组质粒pet28a-kt2440转化至大肠杆菌e.colibl21(de3)中,即得所述重组菌株bl21(de3)/pet28a-kt2440。
(2)培养所述重组菌株bl21(de3)/pet28a-kt2440使其表达所述酶kt2440,具体包括以下步骤:将所述重组菌株bl21(de3)/pet28a-kt2440的单菌落接种到lb培养基中,在37℃下振荡培养12h,取振荡培养后的培养基以2.5%的接种量转接于乳糖培养基(成分与酶制备例1中相同)中,在28℃下振荡培养24h;振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其置于高压匀浆机中匀浆破碎,将破碎液离心,收集上清液,即得所述酶kt2440。通过前述活性测定方法,测得酶液的酶活为13.6u/ml。
酶制备例3
spytag/spycatcher环化的酶sr-24-1的制备
本实施例的酶sr-24-1具有seqidno.5所述的氨基酸序列结构,所述酶sr-24-1通过以下方法得到:
(1)设计、合成具有seqidno.6所述dna序列结构的上游引物和具有seqidno.7所述dna序列结构的下游引物,用所述两引物以酶制备例1中所述pet28a-24-1质粒为模板进行pcr扩增,所得到的产物为megawhop扩增所需的长引物,用所述长引物以spytag-β-lactamase-spycatcher质粒(addgene编号#52656)为模板进行megawhop扩增,经过扩增后spytag-β-lactamase-spycatcher质粒中的β-内酰胺酶(β-lactamase)基因被替换为具有seqidno.3所述dna序列结构的基因,得到能够翻译出seqidno.5所述氨基酸序列结构的具有seqidno.8所述dna序列结构的基因,扩增所得到的产物经dpni消化后转化至大肠杆菌e.colibl21(de3)中,即得所述重组菌株bl21(de3)/pet28a-sr-24-1。
(2)培养所述重组菌株bl21(de3)/pet28a-sr-24-1使其表达所述酶sr-24-1,具体包括以下步骤:将所述重组菌株bl21(de3)/pet28a-sr-24-1的单菌落接种到lb培养基中,在37℃下振荡培养12h,取振荡培养后的培养基以2.5%的接种量转接于乳糖培养基(成分与酶制备例1中相同)中,在28℃下振荡培养24h;振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其置于高压匀浆机中匀浆破碎,将破碎液离心,收集上清液,即得所述酶sr-24-1。通过前述活性测定方法,测得酶液的酶活为13u/ml。
酶制备例4
spytag/spycatcher环化的酶sr-kt2440的制备
本实施例的环化酶sr-kt2440具有seqidno.9所述的氨基酸序列结构,所述酶sr-kt2440通过以下方法得到:
(1)设计、合成具有seqidno.10所述dna序列结构的上游引物和具有seqidno.11所述dna序列结构的下游引物,用该两引物以酶制备例2中pet28a-kt2440质粒为模板进行pcr扩增,所得到的产物为megawhop扩增所需的长引物,用所述长引物以spytag-β-lactamase-spycatcher质粒(addgene编号#52656)为模板进行megawhop扩增,经过扩增后spytag-β-lactamase-spycatcher质粒中的β-内酰胺酶(β-lactamase)基因被替换为具有seqidno.12所述dna序列结构的基因,得到能够翻译出seqidno.9所述氨基酸序列结构的具有seqidno.12所述dna序列结构的基因,扩增所得到的产物经dpni消化后转化至大肠杆菌e.colibl21(de3)中,即得所述重组菌株bl21(de3)/pet28a-sr-kt2440。
(2)培养所述重组菌株bl21(de3)/pet28a-sr-kt2440使其表达所述环化酶sr-kt2440,具体包括以下步骤:将所述重组菌株bl21(de3)/pet28a-sr-kt2440的单菌落接种到lb培养基中,在37℃下振荡培养12h,取振荡培养后的培养基以2.5%的接种量转接于乳糖培养基(成分与前述乳糖培养基相同)中,在28℃下振荡培养24h;振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其置于高压匀浆机中匀浆破碎,将破碎液离心,收集上清液,即得所述环化酶sr-kt2440。酶液的酶活为10.5u/ml。
对比酶制备例1
环化的头孢菌素c酰化酶sr-cca的制备
本对比例的环化头孢菌素c酰化酶sr-cca具有seqidno.13所述的氨基酸序列结构,所述环化头孢菌素c酰化酶sr-cca通过以下方法得到:
(1)pet28a-cca质粒,按文献(wang,y.,yu,h.,song,w.,an,m.,zhang,j.,luo,h.,&shen,z.(2012).overexpressionofsynthesizedcephalosporincacylasecontainingmutationsinthesubstratetransporttunnel.journalofbioscienceandbioengineering,113(1),36-41.)制备,将能够翻译出具有seqidno.14氨基酸序列的头孢菌素c酰化酶cca的dna序列seqidno.15插入pet-28a质粒bamhi-hindiii之间,即得重组质粒pet28a-cca。
(2)设计、合成具有seqidno.16所述dna序列结构的上游引物和具有seqidno.17所述dna序列结构的下游引物,用所述两引物以(1)中所述pet28a-cca质粒为模板进行pcr扩增,所得到的产物为megawhop扩增所需的长引物,用所述长引物以spytag-β-lactamase-spycatcher质粒(addgene编号#52656)为模板进行megawhop扩增,经过扩增后spytag-β-lactamase-spycatcher质粒中的β-内酰胺酶(β-lactamase)基因被替换为具有seqidno.15所述dna序列结构的基因,得到能够翻译出seqidno.13所述氨基酸序列结构的具有seqidno.18所述dna序列结构的基因,扩增所得到的产物经dpni消化后转化至大肠杆菌e.colibl21(de3)中,即得所述重组菌株bl21(de3)/pet28a-sr-cca。
(3)培养所述重组菌株bl21(de3)/pet28a-sr-cca使其表达所述环化头孢菌素c酰化酶sr-cca,具体包括以下步骤:将所述重组菌株bl21(de3)/pet28a-sr-cca的单菌落接种到lb培养基中,在37℃下振荡培养12h,取振荡培养后的培养基以2.5%的接种量转接于乳糖培养基(成分与前述乳糖培养基相同)中,在28℃下振荡培养24h;振荡培养结束后离心收集细胞,向收集的细胞中加入去离子水重悬细胞,将其置于高压匀浆机中匀浆破碎,将破碎液离心,收集上清液,即得所述环化头孢菌素c酰化酶sr-cca。酶液的酶活为5.66u/ml。
(4)采用与(3)同样的方法培养所述重组菌株bl21(de3)/pet28a-cca使其表达头孢菌素c酰化酶,得到头孢菌素c酰化酶cca。酶液的酶活为6.96u/ml。
实施例1
酶24-1和环化的酶sr-24-1的热稳定性评价
将酶制备例1和酶制备例3的酶液分别放置到60℃温度下处理60min,振荡摇晃均匀后取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。酶制备例1中的酶24-1的残留酶活比例为42.7%,酶制备例3的环化酶sr-24-1的残留酶活比例为91.8%。
实施例2
酶kt2440和环化酶sr-kt2440的热稳定性评价
将酶制备例2和酶制备例4的酶液分别放置到50℃温度下处理60min,振荡摇晃均匀后取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。酶制备例2中的酶kt2440的残留酶活比例为18.4%,酶制备例4的环化酶sr-kt2440的残留酶活比例为32.4%。
实施例3
酶24-1和环化酶sr-24-1的变性剂耐受能力的评价
将酶制备例1和酶制备例3的酶液加入到4m的盐酸胍变性剂中,室温孵育30min后,取出测定酶活。以未经任何处理的酶液(溶液中变性剂浓度为0m)酶活为100%,计算得到变性剂浓度下残余酶活百分比。酶制备例1中的酶24-1的残留酶活比例为3.6%,酶制备例3的环化酶sr-24-1的残留酶活比例为38.6%。
实施例4
酶24-1和环化酶sr-24-1的dmso耐受能力的评价
在酶制备例1和酶制备例3的酶液中,加入终浓度为30%浓度的dmso,常温处理一段时间后,取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。酶制备例1中的酶24-1的残留酶活比例为68.2%,酶制备例3的环酶sr-24-1的残留酶活比例为100.7%。
实施例5
酶24-1和环化酶sr-24-1的乙醇耐受能力的评价
在酶制备例1和酶制备例3的酶液中,加入终浓度为30%浓度的乙醇,常温处理36h后,取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。酶制备例1的酶24-1的残留酶活比例为55.9%,酶制备例3的环化酶sr-24-1的残留酶活比例为96.8%。
实施例6
酶24-1和环化酶sr-24-1的甲醇耐受能力的评价
在酶制备例1和酶制备例3的酶液中,加入终浓度为50%浓度的甲醇,常温处理一段时间后,取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。酶制备例1中的酶24-1的残留酶活比例为14.1%,酶制备例3的环化酶sr-24-1的残留酶活比例为74.8%。
实施例7
环化酶sr-24-1在30%乙醇中催化制备l-苏式-对甲砜基苯丝氨酸
取去离子水27.5ml于250ml锥形瓶中,加入5.63g甘氨酸,混匀后加入25ml酶制备例3中制备得到的环化酶sr-24-1酶液,混匀后加入22.5ml乙醇(占总体积的约30体积%),混匀后加入0.994mg5-磷酸吡哆醛,混匀后加入5.53g对甲砜基苯甲醛,28℃摇床200rpm振荡反应,反应39h后抽滤获得包含l-赤式-对甲砜基苯丝氨酸的固相和包含l-苏式-对甲砜基苯丝氨酸的液相,经核磁和高压液相色谱法确定,固相主要成分为l-赤式-对甲砜基苯丝氨酸,将液相降温到4℃,搅拌1h,再抽滤,获得滤饼,经核磁和高压液相色谱法确定,滤饼主要成分为l-苏式-对甲砜基苯丝氨酸,其中滤饼中l-苏式-对甲砜基苯丝氨酸与l-赤式-对甲砜基苯丝氨酸的比例为83.5:16.5。
实施例8
酶sr-2440在dmso中催化制备l-苏式-对甲砜基苯丝氨酸
取去离子水27.5ml于250ml锥形瓶中,加入5.63g甘氨酸,混匀后加入25ml酶制备例3中制备得到的酶sr-24-1酶液,混匀后加入22.5mldmso(占总体积的30%),混匀后加入0.994mg5-磷酸吡哆醛,混匀后加入5.53g对甲砜基苯甲醛,28℃摇床200rpm振荡反应,反应72h后,进行抽滤获得滤饼。用去离子水清洗收集的滤饼,再用丙酮清洗3次滤饼,洗去未反应完全的底物对甲砜基苯甲醛和甘氨酸,最后将滤饼置于真空干燥箱中烘干,所得即为l-赤式-对甲砜基苯丝氨酸,经高效液相色谱分析,纯度为94.5%,得率62%。
对比例1
头孢菌素c酰化酶sr-cca的热稳定性评价
将对比酶制备例1的头孢菌素c酰化酶cca和环化的头孢菌素c酰化酶sr-cca酶液分别放置到55℃温度下处理40min,振荡摇晃均匀后取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。头孢菌素c酰化酶的残留酶活比例为11.7%,环化的头孢菌素c酰化酶sr-cca的残留酶活比例为9.9%。
对比例2
头孢菌素c酰化酶sr-cca的dmso耐受能力评价
在对比酶制备例1的头孢菌素c酰化酶cca和环化的头孢菌素c酰化酶sr-cca酶液中,加入终浓度为30%浓度的dmso,常温处理40h后,取一定量酶液反应测定酶活,并将该酶活数据与不进行任何处理的初始酶活进行对比,计算残余酶活百分比。头孢菌素c酰化酶的残留酶活比例为80.3%,环化的头孢菌素c酰化酶的残留酶活比例为70.8%。
最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应该理解:依然可以对本发明进行修改或者等同替换;而不脱离本发明的精神和范围的任何修改或局部替换,均应涵盖在本发明的范围内。
sequencelisting
<210>1
<211>357
<212>prt
<213>artificialsequence
metasnglygluthrserargproproalaleuglypheserserasp
151015
asnilealaglyalaserprogluvalalaglnalaleuvallyshis
202530
serserglyglnalaglyprotyrglythraspgluleuthralagln
354045
vallysarglysphecysgluilephegluargaspvalgluvalphe
505560
leuvalprothrglythralaalaasnalaleucysleuseralamet
65707580
thrproprotrpglyasniletyrcyshisproalaserhisileasn
859095
asnaspglucysglyalaprogluphepheserasnglyalalysleu
100105110
metthrvalaspglyproalaalalysleuaspilevalargleuarg
115120125
gluargthrargglulysvalglyaspvalhisthrthrglnproala
130135140
cysvalserilethrglnalathrgluvalglyseriletyrthrleu
145150155160
aspgluileglualaileglyaspvalcyslysserserserleugly
165170175
leuhismetaspglyserargphealaasnalaleuvalserleugly
180185190
cysserproalaglumetthrtrplysalaglyvalaspalaleuser
195200205
pheglyalathrlysasnglyvalleualaalaglualailevalleu
210215220
pheasnthrserleualathrglumetsertyrargarglysargala
225230235240
glyhisleuserserlysmetargpheleuseralaglnileaspala
245250255
tyrleuthraspaspleutrpleuargasnalaarglysalaasnala
260265270
alaalaglnargleualaglnglyleugluglyleuglyglyvalglu
275280285
valleuglyglythrglualaasnileleuphecysargleuaspser
290295300
alametileaspalaleuleulysalaglypheglyphetyrhisasp
305310315320
argtrpglyproasnvalvalargphevalthrserphealathrthr
325330335
alagluaspvalasphisleuleuasnglnvalargleualaalaasp
340345350
argthrglngluarg
355
<210>2
<211>346
<212>prt
<213>artificialsequence
metthrasplysserglnglnphealaseraspasntyrserglyile
151015
cysproglualatrpvalalametglulysalaasnargglyhisasp
202530
argalatyrglyaspaspglntrpthrgluargalaserglutyrphe
354045
argasnleuphegluthraspcysgluvalphephealapheasngly
505560
thralaalaasnserleualaleualaserleucysglnsertyrhis
65707580
servalilecyssergluthralahisvalgluthraspglucysgly
859095
alaprogluphepheserasnglyserlysleuleuthralaalaser
100105110
valasnglylysleuthrproglnserilearggluvalalaleulys
115120125
argglnaspilehistyrprolysproargvalvalthrilethrgln
130135140
alathrgluvalglythrvaltyrargproaspgluleulysalaile
145150155160
seralathrcyslysgluleuglyleuasnleuhismetaspglyala
165170175
argphethrasnalacysalapheleuglycysserproalagluleu
180185190
thrtrplysalaglyvalaspvalleucyspheglyglythrlysasn
195200205
glymetalavalglyglualaileleuphepheasnargglnleuala
210215220
gluasppheasptyrargcyslysglnalaglyglnleualaserlys
225230235240
metargpheleuseralaprotrpvalglyleuleugluaspglyala
245250255
trpleuarghisglyasnhisalaasnhiscysalaglnleuleuala
260265270
serleuvalseraspleuproglyvalgluleumetpheprovalglu
275280285
alaasnglyvalpheleuglnmetprogluhisalaileglualaleu
290295300
argglylysglytrpargphetyrthrpheileglyserglyglyala
305310315320
argphemetcyssertrpaspthrgluglualaargvalarggluleu
325330335
alaalaaspileargthrileileglygly
340345
<210>3
<211>1074
<212>dna
<213>artificialsequence
atgaatggtgaaacatcacgtccaccagctctaggtttttcatcagataatattgctggt60
gcttcaccagaagttgctcaagctctagttaaacattcttctggtcaggctggtccgtac120
ggtactgacgaactgaccgctcaggttaaacgtaaattctgcgaaatcttcgaacgtgac180
gttgaagttttcctggttccgaccggtactgctgctaacgctctgtgcctgtctgctatg240
accccgccgtggggtaacatctactgccacccggcttctcacatcaacaacgacgaatgc300
ggtgctccggaatttttctctaacggtgctaaactgatgaccgttgacggtccggctgct360
aaactggacatcgttcgtctgcgtgaacgtacccgtgaaaaagttggtgacgttcacacc420
acccagccggcttgcgtttctatcacccaggctaccgaagttggttctatctacaccctg480
gacgaaatcgaagctatcggtgacgtttgcaaatcttcttctctgggtctgcacatggac540
ggttctcgtttcgctaacgctctggtttctctgggttgctctccggctgaaatgacctgg600
aaagctggtgttgacgctctgtctttcggtgctaccaaaaacggtgttctggctgctgaa660
gctatcgttctgttcaacacctctctggctaccgaaatgtcttaccgtcgtaaacgtgct720
ggtcacctgtcttctaaaatgcgtttcctgtctgctcagatcgacgcttacctgaccgac780
gacctgtggctgcgtaacgctcgtaaagctaacgctgctgctcagcgtctggctcagggt840
ctggaaggtctgggtggtgttgaagttctgggtggtactgaagctaacatcctgttctgc900
cgtctggactctgctatgatcgacgctctgctgaaagctggtttcggtttctaccacgac960
cgttggggtccgaacgttgttcgtttcgttacctctttcgctaccaccgctgaagacgtt1020
gaccacctactaaatcaagtacgactagctgctgatcgtactcaggaacgataa1074
<210>4
<211>1041
<212>dna
<213>artificialsequence
atgacagataaatcacaacaatttgcttcagataattattcaggtatttgtccagaagca60
tgggttgcaatggaaaaagcaaatcgtggtcatgatcgtgcttacggtgacgaccagtgg120
accgaacgtgcttctgaatacttccgtaacctgttcgaaaccgactgcgaagttttcttc180
gctttcaacggtactgctgctaactctctggctctggcttctctgtgccagtcttaccac240
tctgttatctgctctgaaaccgctcacgttgaaaccgacgaatgcggtgctccggaattt300
ttctctaacggttctaaactgctgaccgctgcttctgttaacggtaaactgaccccgcag360
tctatccgtgaagttgctctgaaacgtcaggacatccactacccgaaaccgcgtgttgtt420
accatcacccaggctaccgaagttggtactgtttaccgtccggacgaactgaaagctatc480
tctgctacctgcaaagaactgggtctgaacctgcacatggacggtgctcgtttcaccaac540
gcttgcgctttcctgggttgctctccggctgaactgacctggaaagctggtgttgacgtt600
ctgtgcttcggtggtactaaaaacggtatggctgttggtgaagctatcctgttcttcaac660
cgtcagctggctgaagacttcgactaccgttgcaaacaggctggtcagctggcttctaaa720
atgcgtttcctgtctgctccgtgggttggtctgctggaagacggtgcttggctgcgtcac780
ggtaaccacgctaaccactgcgctcagctgctggcttctctggtttctgacctgccgggt840
gttgaactgatgttcccggttgaagctaacggtgttttcctgcaaatgccggaacacgct900
atcgaagctctgcgtggtaaaggttggcgtttctacaccttcatcggttctggtggtgct960
cgtttcatgtgctcttgggacaccgaagaagctcgtgttcgtgaactagctgctgatatc1020
cgtacaatcatcggtggttaa1041
<210>5
<211>520
<212>prt
<213>artificialsequence
metglyserserhishishishishishisserserglyleuvalpro
151015
argglyserhismetglyalahisilevalmetvalaspalatyrlys
202530
prothrlysglyserglyglyserglymetasnglygluthrserarg
354045
proproalaleuglypheserseraspasnilealaglyalaserpro
505560
gluvalalaglnalaleuvallyshisserserglyglnalaglypro
65707580
tyrglythraspgluleuthralaglnvallysarglysphecysglu
859095
ilephegluargaspvalgluvalpheleuvalprothrglythrala
100105110
alaasnalaleucysleuseralametthrproprotrpglyasnile
115120125
tyrcyshisproalaserhisileasnasnaspglucysglyalapro
130135140
gluphepheserasnglyalalysleumetthrvalaspglyproala
145150155160
alalysleuaspilevalargleuarggluargthrargglulysval
165170175
glyaspvalhisthrthrglnproalacysvalserilethrglnala
180185190
thrgluvalglyseriletyrthrleuaspgluileglualailegly
195200205
aspvalcyslysserserserleuglyleuhismetaspglyserarg
210215220
phealaasnalaleuvalserleuglycysserproalaglumetthr
225230235240
trplysalaglyvalaspalaleuserpheglyalathrlysasngly
245250255
valleualaalaglualailevalleupheasnthrserleualathr
260265270
glumetsertyrargarglysargalaglyhisleuserserlysmet
275280285
argpheleuseralaglnileaspalatyrleuthraspaspleutrp
290295300
leuargasnalaarglysalaasnalaalaalaglnargleualagln
305310315320
glyleugluglyleuglyglyvalgluvalleuglyglythrgluala
325330335
asnileleuphecysargleuaspseralametileaspalaleuleu
340345350
lysalaglypheglyphetyrhisaspargtrpglyproasnvalval
355360365
argphevalthrserphealathrthralagluaspvalasphisleu
370375380
leuasnglnvalargleualaalaaspargthrglngluargglyser
385390395400
glyglyserglyglyalametvalaspthrleuserglyleuserser
405410415
gluglnglyglnserglyaspmetthrileglugluaspseralathr
420425430
hisilelyspheserlysargaspgluaspglylysgluleualagly
435440445
alathrmetgluleuargaspserserglylysthrileserthrtrp
450455460
ileseraspglyglnvallysaspphetyrleutyrproglylystyr
465470475480
thrphevalgluthralaalaproaspglytyrgluvalalathrala
485490495
ilethrphethrvalasngluglnglyglnvalthrvalasnglylys
500505510
alathrlysglyaspalahisile
515520
<210>6
<211>45
<212>dna
<213>artificialsequence
gacgaagggttcagggggttccggtatgaatggtgaaacatcacg45
<210>7
<211>46
<212>dna
<213>artificialsequence
tggcgcctccgctgccaccactccctcgttcctgagtacgatcagc46
<210>8
<211>1566
<212>dna
<213>artificialsequence
atgggcagcagccatcatcatcatcatcacagcagcggcctggtgccgcgcggcagccat60
atgggagcccacatcgtgatggtggacgcctacaagccgacgaagggttcagggggttcc120
ggtatgaatggtgaaacatcacgtccaccagctctaggtttttcatcagataatattgct180
ggtgcttcaccagaagttgctcaagctctagttaaacattcttctggtcaggctggtccg240
tacggtactgacgaactgaccgctcaggttaaacgtaaattctgcgaaatcttcgaacgt300
gacgttgaagttttcctggttccgaccggtactgctgctaacgctctgtgcctgtctgct360
atgaccccgccgtggggtaacatctactgccacccggcttctcacatcaacaacgacgaa420
tgcggtgctccggaatttttctctaacggtgctaaactgatgaccgttgacggtccggct480
gctaaactggacatcgttcgtctgcgtgaacgtacccgtgaaaaagttggtgacgttcac540
accacccagccggcttgcgtttctatcacccaggctaccgaagttggttctatctacacc600
ctggacgaaatcgaagctatcggtgacgtttgcaaatcttcttctctgggtctgcacatg660
gacggttctcgtttcgctaacgctctggtttctctgggttgctctccggctgaaatgacc720
tggaaagctggtgttgacgctctgtctttcggtgctaccaaaaacggtgttctggctgct780
gaagctatcgttctgttcaacacctctctggctaccgaaatgtcttaccgtcgtaaacgt840
gctggtcacctgtcttctaaaatgcgtttcctgtctgctcagatcgacgcttacctgacc900
gacgacctgtggctgcgtaacgctcgtaaagctaacgctgctgctcagcgtctggctcag960
ggtctggaaggtctgggtggtgttgaagttctgggtggtactgaagctaacatcctgttc1020
tgccgtctggactctgctatgatcgacgctctgctgaaagctggtttcggtttctaccac1080
gaccgttggggtccgaacgttgttcgtttcgttacctctttcgctaccaccgctgaagac1140
gttgaccacctactaaatcaagtacgactagctgctgatcgtactcaggaacgagggagt1200
ggtggcagcggaggcgccatggttgataccttatcaggtttatcaagtgagcaaggtcag1260
tccggtgatatgacaattgaagaagatagtgctacccatattaaattctcaaaacgtgat1320
gaggacggcaaagagttagctggtgcaactatggagttgcgtgattcatctggtaaaact1380
attagtacatggatttcagatggacaagtgaaagatttctacctgtatccaggaaaatat1440
acatttgtcgaaaccgcagcaccagacggttatgaggtagcaactgctattacctttaca1500
gttaatgagcaaggtcaggttactgtaaatggcaaagcaactaaaggtgacgctcatatt1560
taatga1566
<210>9
<211>509
<212>prt
<213>artificialsequence
metglyserserhishishishishishisserserglyleuvalpro
151015
argglyserhismetglyalahisilevalmetvalaspalatyrlys
202530
prothrlysglyserglyglyserglymetthrasplysserglngln
354045
phealaseraspasntyrserglyilecysproglualatrpvalala
505560
metglulysalaasnargglyhisaspargalatyrglyaspaspgln
65707580
trpthrgluargalaserglutyrpheargasnleuphegluthrasp
859095
cysgluvalphephealapheasnglythralaalaasnserleuala
100105110
leualaserleucysglnsertyrhisservalilecyssergluthr
115120125
alahisvalgluthraspglucysglyalaprogluphepheserasn
130135140
glyserlysleuleuthralaalaservalasnglylysleuthrpro
145150155160
glnserilearggluvalalaleulysargglnaspilehistyrpro
165170175
lysproargvalvalthrilethrglnalathrgluvalglythrval
180185190
tyrargproaspgluleulysalaileseralathrcyslysgluleu
195200205
glyleuasnleuhismetaspglyalaargphethrasnalacysala
210215220
pheleuglycysserproalagluleuthrtrplysalaglyvalasp
225230235240
valleucyspheglyglythrlysasnglymetalavalglygluala
245250255
ileleuphepheasnargglnleualagluasppheasptyrargcys
260265270
lysglnalaglyglnleualaserlysmetargpheleuseralapro
275280285
trpvalglyleuleugluaspglyalatrpleuarghisglyasnhis
290295300
alaasnhiscysalaglnleuleualaserleuvalseraspleupro
305310315320
glyvalgluleumetpheprovalglualaasnglyvalpheleugln
325330335
metprogluhisalaileglualaleuargglylysglytrpargphe
340345350
tyrthrpheileglyserglyglyalaargphemetcyssertrpasp
355360365
thrgluglualaargvalarggluleualaalaaspileargthrile
370375380
ileglyglyglyserglyglyserglyglyalametvalaspthrleu
385390395400
serglyleusersergluglnglyglnserglyaspmetthrileglu
405410415
gluaspseralathrhisilelyspheserlysargaspgluaspgly
420425430
lysgluleualaglyalathrmetgluleuargaspserserglylys
435440445
thrileserthrtrpileseraspglyglnvallysaspphetyrleu
450455460
tyrproglylystyrthrphevalgluthralaalaproaspglytyr
465470475480
gluvalalathralailethrphethrvalasngluglnglyglnval
485490495
thrvalasnglylysalathrlysglyaspalahisile
500505
<210>10
<211>51
<212>dna
<213>artificialsequence
gacgaagggttcagggggttccggtatgacagataaatcacaacaatttgc51
<210>11
<211>44
<212>dna
<213>artificialsequence
tggcgcctccgctgccaccactcccaccaccgatgattgtacgg44
<210>12
<211>1533
<212>dna
<213>artificialsequence
atgggcagcagccatcatcatcatcatcacagcagcggcctggtgccgcgcggcagccat60
atgggagcccacatcgtgatggtggacgcctacaagccgacgaagggttcagggggttcc120
ggtatgacagataaatcacaacaatttgcttcagataattattcaggtatttgtccagaa180
gcatgggttgcaatggaaaaagcaaatcgtggtcatgatcgtgcttacggtgacgaccag240
tggaccgaacgtgcttctgaatacttccgtaacctgttcgaaaccgactgcgaagttttc300
ttcgctttcaacggtactgctgctaactctctggctctggcttctctgtgccagtcttac360
cactctgttatctgctctgaaaccgctcacgttgaaaccgacgaatgcggtgctccggaa420
tttttctctaacggttctaaactgctgaccgctgcttctgttaacggtaaactgaccccg480
cagtctatccgtgaagttgctctgaaacgtcaggacatccactacccgaaaccgcgtgtt540
gttaccatcacccaggctaccgaagttggtactgtttaccgtccggacgaactgaaagct600
atctctgctacctgcaaagaactgggtctgaacctgcacatggacggtgctcgtttcacc660
aacgcttgcgctttcctgggttgctctccggctgaactgacctggaaagctggtgttgac720
gttctgtgcttcggtggtactaaaaacggtatggctgttggtgaagctatcctgttcttc780
aaccgtcagctggctgaagacttcgactaccgttgcaaacaggctggtcagctggcttct840
aaaatgcgtttcctgtctgctccgtgggttggtctgctggaagacggtgcttggctgcgt900
cacggtaaccacgctaaccactgcgctcagctgctggcttctctggtttctgacctgccg960
ggtgttgaactgatgttcccggttgaagctaacggtgttttcctgcaaatgccggaacac1020
gctatcgaagctctgcgtggtaaaggttggcgtttctacaccttcatcggttctggtggt1080
gctcgtttcatgtgctcttgggacaccgaagaagctcgtgttcgtgaactagctgctgat1140
atccgtacaatcatcggtggtgggagtggtggcagcggaggcgccatggttgatacctta1200
tcaggtttatcaagtgagcaaggtcagtccggtgatatgacaattgaagaagatagtgct1260
acccatattaaattctcaaaacgtgatgaggacggcaaagagttagctggtgcaactatg1320
gagttgcgtgattcatctggtaaaactattagtacatggatttcagatggacaagtgaaa1380
gatttctacctgtatccaggaaaatatacatttgtcgaaaccgcagcaccagacggttat1440
gaggtagcaactgctattacctttacagttaatgagcaaggtcaggttactgtaaatggc1500
aaagcaactaaaggtgacgctcatatttaatga1533
<210>13
<211>937
<212>prt
<213>artificialsequence
metglyserserhishishishishishisserserglyleuvalpro
151015
argglyserhismetglyalahisilevalmetvalaspalatyrlys
202530
prothrlysglyserglyglyserglymetthrmetalaalalysthr
354045
aspargglualaleuglnalaalaleuproproleuserglyserleu
505560
serileproglyleuseralaprovalargvalglnargaspglytrp
65707580
glyileprohisilelysalaserglyglualaaspalatyrargala
859095
leuglyphevalhisalaglnaspargleupheglnmetgluleuthr
100105110
argarglysalaleuglyargalaalaglutrpleuglyalagluala
115120125
alaglualaaspileleuvalargargleuglymetglulysvalcys
130135140
argargasppheglualaleuglyalaglualalysaspmetleuarg
145150155160
alatyralaalaglyvalasnalapheleualaserglyalaproleu
165170175
proileglutyrserleuleuglyalagluprogluprotrpglupro
180185190
trphisserilealavalmetargargleuglyleuleumetglyser
195200205
valtrpphelysleutrpargmetleualaleuprovalvalglyala
210215220
alaasnalaleulysleuargtyraspaspglyglyglnaspleuleu
225230235240
cysileproproglyvalglualagluargleuglualaaspleuala
245250255
alaleuargproalavalaspalaleuleulysalametglyglyasp
260265270
alaseraspalaalaglyglyglyserasnasntrpalavalalapro
275280285
glyargthralathrglyargproileleualaglyaspprohisarg
290295300
valphegluileproglymettyralaglnhishisleualacysasp
305310315320
argpheaspmetileglyleuthrvalproglyvalproglyphepro
325330335
hisasnalahisasnglylysvalalatyrcysvalthrhisalaphe
340345350
metaspthrhisaspleutyrleugluglnphealagluaspglyarg
355360365
thralaargpheglyasngluphegluprovalalatrpargargasp
370375380
argilealavalargglyglyalaaspargglupheaspilevalglu
385390395400
thrarghisglyprovalilealaglyaspproleugluglyalaala
405410415
leuthrleuargservalglnphealagluthraspleuserpheasp
420425430
cysleuthrargmetproglyalaserthrvalalaglnleutyrasp
435440445
alathrargglytrpglyleuvalasphisasnleuvalalaglyasp
450455460
valalaglyserileglyhisleuvalargalaargvalproserarg
465470475480
proarggluasnglytrpleuprovalproglytrpserglygluhis
485490495
glutrpargglytrpileprohisglualametproargvalileasp
500505510
proproglyglyleuilevalthralaasnasnargvalvalalaasp
515520525
asphisproasptyrleucysthraspcyshisproprotyrargala
530535540
gluargilemetgluargleuvalalaserproalaphealavalasp
545550555560
aspalaalaalailehisalaaspthrleuserprohisvalglyleu
565570575
leuargalaargleuglualaleuglyileglnglyserleuproala
580585590
glugluleuargglnthrleuilealatrpaspglyargmetaspala
595600605
glyserglnalaalaseralatyrasnalapheargargalaleuthr
610615620
argleuvalthralaargserglyleugluglnalailealahispro
625630635640
phealaalavalproproglyvalserproglnglyglnvaltrptrp
645650655
alavalprothrleuleuargasnaspaspalaglymetleulysgly
660665670
trpsertrpaspglualaleuserglualaleuservalalathrgln
675680685
asnleuthrglyargglytrpglyglugluhisargproargphethr
690695700
hisproleuseralaglnpheproalatrpalaalaleuleuasnpro
705710715720
valserargproileglyglyaspglyaspthrvalleualaasngly
725730735
leuvalproseralaglyproglualathrtyrglyalaleucysarg
740745750
tyrvalpheaspvalglyasntrpaspasnserargtrpvalvalphe
755760765
hisglyalaserglyhisproalaserprohistyralaaspglnasn
770775780
alaprotrpseraspcysalametvalprometleutyrsertrpasp
785790795800
argilealaalaglualavalserserglngluleuvalproalagly
805810815
serglyglyserglyglyalametvalaspthrleuserglyleuser
820825830
sergluglnglyglnserglyaspmetthrileglugluaspserala
835840845
thrhisilelyspheserlysargaspgluaspglylysgluleuala
850855860
glyalathrmetgluleuargaspserserglylysthrileserthr
865870875880
trpileseraspglyglnvallysaspphetyrleutyrproglylys
885890895
tyrthrphevalgluthralaalaproaspglytyrgluvalalathr
900905910
alailethrphethrvalasngluglnglyglnvalthrvalasngly
915920925
lysalathrlysglyaspalahisile
930935
<210>14
<211>774
<212>prt
<213>artificialsequence
metthrmetalaalalysthraspargglualaleuglnalaalaleu
151015
proproleuserglyserleuserileproglyleuseralaproval
202530
argvalglnargaspglytrpglyileprohisilelysalasergly
354045
glualaaspalatyrargalaleuglyphevalhisalaglnasparg
505560
leupheglnmetgluleuthrargarglysalaleuglyargalaala
65707580
glutrpleuglyalaglualaalaglualaaspileleuvalargarg
859095
leuglymetglulysvalcysargargasppheglualaleuglyala
100105110
glualalysaspmetleuargalatyralaalaglyvalasnalaphe
115120125
leualaserglyalaproleuproileglutyrserleuleuglyala
130135140
gluprogluprotrpgluprotrphisserilealavalmetargarg
145150155160
leuglyleuleumetglyservaltrpphelysleutrpargmetleu
165170175
alaleuprovalvalglyalaalaasnalaleulysleuargtyrasp
180185190
aspglyglyglnaspleuleucysileproproglyvalglualaglu
195200205
argleuglualaaspleualaalaleuargproalavalaspalaleu
210215220
leulysalametglyglyaspalaseraspalaalaglyglyglyser
225230235240
asnasntrpalavalalaproglyargthralathrglyargproile
245250255
leualaglyaspprohisargvalphegluileproglymettyrala
260265270
glnhishisleualacysaspargpheaspmetileglyleuthrval
275280285
proglyvalproglypheprohisasnalahisasnglylysvalala
290295300
tyrcysvalthrhisalaphemetaspthrhisaspleutyrleuglu
305310315320
glnphealagluaspglyargthralaargpheglyasnglupheglu
325330335
provalalatrpargargaspargilealavalargglyglyalaasp
340345350
argglupheaspilevalgluthrarghisglyprovalilealagly
355360365
aspproleugluglyalaalaleuthrleuargservalglnpheala
370375380
gluthraspleuserpheaspcysleuthrargmetproglyalaser
385390395400
thrvalalaglnleutyraspalathrargglytrpglyleuvalasp
405410415
hisasnleuvalalaglyaspvalalaglyserileglyhisleuval
420425430
argalaargvalproserargproarggluasnglytrpleuproval
435440445
proglytrpserglygluhisglutrpargglytrpileprohisglu
450455460
alametproargvalileaspproproglyglyleuilevalthrala
465470475480
asnasnargvalvalalaaspasphisproasptyrleucysthrasp
485490495
cyshisproprotyrargalagluargilemetgluargleuvalala
500505510
serproalaphealavalaspaspalaalaalailehisalaaspthr
515520525
leuserprohisvalglyleuleuargalaargleuglualaleugly
530535540
ileglnglyserleuproalaglugluleuargglnthrleuileala
545550555560
trpaspglyargmetaspalaglyserglnalaalaseralatyrasn
565570575
alapheargargalaleuthrargleuvalthralaargserglyleu
580585590
gluglnalailealahisprophealaalavalproproglyvalser
595600605
proglnglyglnvaltrptrpalavalprothrleuleuargasnasp
610615620
aspalaglymetleulysglytrpsertrpaspglualaleuserglu
625630635640
alaleuservalalathrglnasnleuthrglyargglytrpglyglu
645650655
gluhisargproargphethrhisproleuseralaglnpheproala
660665670
trpalaalaleuleuasnprovalserargproileglyglyaspgly
675680685
aspthrvalleualaasnglyleuvalproseralaglyprogluala
690695700
thrtyrglyalaleucysargtyrvalpheaspvalglyasntrpasp
705710715720
asnserargtrpvalvalphehisglyalaserglyhisproalaser
725730735
prohistyralaaspglnasnalaprotrpseraspcysalametval
740745750
prometleutyrsertrpaspargilealaalaglualavalserser
755760765
glngluleuvalproala
770
<210>15
<211>2325
<212>dna
<213>artificialsequence
atgacgatggcggcgaaaaccgatcgtgaagcactgcaggcggcactgccaccgttaagc60
ggtagtctgagcatcccgggtctgagtgcaccggttcgtgtgcaacgtgacggttggggt120
attccgcacatcaaagcaagcggtgaggcagacgcgtatcgcgcattaggcttcgttcat180
gcgcaagatcgtctgtttcaaatggagttaacgcgtcgtaaagccttaggtcgtgcggcc240
gagtggttaggcgccgaagccgcggaagcagacattttagttcgtcgcttaggcatggaa300
aaagtgtgtcgccgcgattttgaagcgctgggcgcagaggcgaaggatatgttacgtgcc360
tatgcagccggtgtgaacgcatttttagcgagcggtgcgccattaccgattgaatatagc420
ttattaggtgccgaaccagagccgtgggaaccatggcatagcatcgccgtgatgcgccgt480
ctgggcctgctgatgggcagtgtgtggttcaagctgtggcgcatgctggcgttaccggtg540
gttggcgcagcaaatgcgctgaaactgcgttacgatgacggcggtcaagatctgttatgc600
attccgccaggcgtggaagcggagcgtctggaggccgacttagcggcattacgtccagcc660
gttgatgcattactgaaagcgatgggcggtgatgccagcgacgcagcaggtggtggtagc720
aataactgggccgtggcaccaggtcgtaccgccacgggtcgtccgattctggcgggtgac780
ccgcatcgtgtgtttgaaattccgggtatgtatgcccagcatcatctggcgtgtgatcgt840
tttgatatgattggtctgacggtgccaggtgttccgggcttcccgcacaatgcccataat900
ggcaaagtggcgtactgtgtgacgcatgcatttatggatacccatgatctgtatctggaa960
cagtttgcggaagatggtcgcacggcgcgttttggtaatgaatttgagccggttgcgtgg1020
cgtcgtgaccgtattgcagttcgcggtggtgcggaccgcgaattcgatattgtggaaacc1080
cgtcatggcccagtgatcgccggtgacccgctggaaggtgcagcactgaccttacgtagt1140
gtgcagtttgcagaaaccgacctgagcttcgattgcctgacccgtatgccgggtgccagc1200
accgtggcgcagctgtacgatgcaacgcgtggctggggcttagtggaccacaatttagtg1260
gcaggcgatgttgcaggcagtatcggccatctggtgcgtgcgcgcgtgccaagccgtccg1320
cgcgaaaatggctggctgccagtgccaggttggagcggtgagcatgagtggcgtggttgg1380
attccacatgaagccatgccgcgtgtgattgacccaccaggtggtctgatcgttacggcg1440
aataaccgtgtggttgccgacgaccacccggattatctgtgtacggattgccatccaccg1500
taccgtgcggaacgtattatggaacgcctggttgcgagtccggcctttgccgttgatgat1560
gcagccgcgattcatgcagacaccttaagcccgcacgttggtctgctgcgtgcccgttta1620
gaagcgctgggcatccagggtagtctgccagcggaagaactgcgtcagaccctgatcgcg1680
tgggatggtcgtatggatgcgggtagccaagcagcaagcgcatacaatgcgtttcgtcgt1740
gcattaacgcgtctggttaccgcgcgtagcggcctggaacaagccattgcgcacccgttt1800
gccgccgtgccaccgggcgttagtccgcaaggccaagtgtggtgggcagttccaacgtta1860
ttacgcaatgacgacgcaggtatgttaaagggctggagctgggatgaagcgttaagcgaa1920
gccctgagtgttgcgacgcaaaacttaacgggtcgcggttggggcgaggaacatcgtcca1980
cgctttacccatccgctgagcgcccagtttccggcgtgggccgcactgctgaacccggtt2040
agtcgcccaatcggcggtgatggcgataccgttctggcgaatggtttagttccgagcgcc2100
ggtccagaggccacctatggtgcgctgtgccgttatgtgtttgatgtgggtaattgggat2160
aatagccgttgggtggtgtttcatggcgcgagcggtcatccggcgagcccacactatgcg2220
gaccagaatgcgccgtggagtgattgtgcgatggttccaatgctgtatagttgggatcgt2280
attgcggcggaggcagtttcgagtcaagaattagtgccggcgtga2325
<210>16
<211>48
<212>dna
<213>artificialsequence
gaagggttcagggggttccggtatgacgatggcggcgaaaaccgatcg48
<210>17
<211>53
<212>dna
<213>artificialsequence
cgcctccgctgccaccactccccgccggcactaattcttgactcgaaactgcc53
<210>18
<211>2817
<212>dna
<213>artificialsequence
atgggcagcagccatcatcatcatcatcacagcagcggcctggtgccgcgcggcagccat60
atgggagcccacatcgtgatggtggacgcctacaagccgacgaagggttcagggggttcc120
ggtatgacgatggcggcgaaaaccgatcgtgaagcactgcaggcggcactgccaccgtta180
agcggtagtctgagcatcccgggtctgagtgcaccggttcgtgtgcaacgtgacggttgg240
ggtattccgcacatcaaagcaagcggtgaggcagacgcgtatcgcgcattaggcttcgtt300
catgcgcaagatcgtctgtttcaaatggagttaacgcgtcgtaaagccttaggtcgtgcg360
gccgagtggttaggcgccgaagccgcggaagcagacattttagttcgtcgcttaggcatg420
gaaaaagtgtgtcgccgcgattttgaagcgctgggcgcagaggcgaaggatatgttacgt480
gcctatgcagccggtgtgaacgcatttttagcgagcggtgcgccattaccgattgaatat540
agcttattaggtgccgaaccagagccgtgggaaccatggcatagcatcgccgtgatgcgc600
cgtctgggcctgctgatgggcagtgtgtggttcaagctgtggcgcatgctggcgttaccg660
gtggttggcgcagcaaatgcgctgaaactgcgttacgatgacggcggtcaagatctgtta720
tgcattccgccaggcgtggaagcggagcgtctggaggccgacttagcggcattacgtcca780
gccgttgatgcattactgaaagcgatgggcggtgatgccagcgacgcagcaggtggtggt840
agcaataactgggccgtggcaccaggtcgtaccgccacgggtcgtccgattctggcgggt900
gacccgcatcgtgtgtttgaaattccgggtatgtatgcccagcatcatctggcgtgtgat960
cgttttgatatgattggtctgacggtgccaggtgttccgggcttcccgcacaatgcccat1020
aatggcaaagtggcgtactgtgtgacgcatgcatttatggatacccatgatctgtatctg1080
gaacagtttgcggaagatggtcgcacggcgcgttttggtaatgaatttgagccggttgcg1140
tggcgtcgtgaccgtattgcagttcgcggtggtgcggaccgcgaattcgatattgtggaa1200
acccgtcatggcccagtgatcgccggtgacccgctggaaggtgcagcactgaccttacgt1260
agtgtgcagtttgcagaaaccgacctgagcttcgattgcctgacccgtatgccgggtgcc1320
agcaccgtggcgcagctgtacgatgcaacgcgtggctggggcttagtggaccacaattta1380
gtggcaggcgatgttgcaggcagtatcggccatctggtgcgtgcgcgcgtgccaagccgt1440
ccgcgcgaaaatggctggctgccagtgccaggttggagcggtgagcatgagtggcgtggt1500
tggattccacatgaagccatgccgcgtgtgattgacccaccaggtggtctgatcgttacg1560
gcgaataaccgtgtggttgccgacgaccacccggattatctgtgtacggattgccatcca1620
ccgtaccgtgcggaacgtattatggaacgcctggttgcgagtccggcctttgccgttgat1680
gatgcagccgcgattcatgcagacaccttaagcccgcacgttggtctgctgcgtgcccgt1740
ttagaagcgctgggcatccagggtagtctgccagcggaagaactgcgtcagaccctgatc1800
gcgtgggatggtcgtatggatgcgggtagccaagcagcaagcgcatacaatgcgtttcgt1860
cgtgcattaacgcgtctggttaccgcgcgtagcggcctggaacaagccattgcgcacccg1920
tttgccgccgtgccaccgggcgttagtccgcaaggccaagtgtggtgggcagttccaacg1980
ttattacgcaatgacgacgcaggtatgttaaagggctggagctgggatgaagcgttaagc2040
gaagccctgagtgttgcgacgcaaaacttaacgggtcgcggttggggcgaggaacatcgt2100
ccacgctttacccatccgctgagcgcccagtttccggcgtgggccgcactgctgaacccg2160
gttagtcgcccaatcggcggtgatggcgataccgttctggcgaatggtttagttccgagc2220
gccggtccagaggccacctatggtgcgctgtgccgttatgtgtttgatgtgggtaattgg2280
gataatagccgttgggtggtgtttcatggcgcgagcggtcatccggcgagcccacactat2340
gcggaccagaatgcgccgtggagtgattgtgcgatggttccaatgctgtatagttgggat2400
cgtattgcggcggaggcagtttcgagtcaagaattagtgccggcggggagtggtggcagc2460
ggaggcgccatggttgataccttatcaggtttatcaagtgagcaaggtcagtccggtgat2520
atgacaattgaagaagatagtgctacccatattaaattctcaaaacgtgatgaggacggc2580
aaagagttagctggtgcaactatggagttgcgtgattcatctggtaaaactattagtaca2640
tggatttcagatggacaagtgaaagatttctacctgtatccaggaaaatatacatttgtc2700
gaaaccgcagcaccagacggttatgaggtagcaactgctattacctttacagttaatgag2760
caaggtcaggttactgtaaatggcaaagcaactaaaggtgacgctcatatttaatga2817