生物催化剂及其方法与流程

文档序号:41397095发布日期:2025-03-25 18:54阅读:140来源:国知局

本公开涉及转氨酶生物催化剂及使用生物催化剂的方法。本公开还包括制备用于制造尼拉帕尼的胺中间体化合物的方法。本公开还包括编码转氨酶生物催化剂的多核苷酸和包含所述多核苷酸的宿主细胞。


背景技术:

1、聚(adp-核糖)聚合酶(parp)是参与dna损伤修复的酶家族,并且parp抑制会导致单链断裂的累积,这随后导致双链断裂的累积。具有dsb数量增加的细胞更依赖于其他dna修复途径,主要是同源重组(hr)修复途径。因此,具有hr缺陷的癌细胞甚至更容易受到ber途径的parp损伤。目前有四种获批的parp抑制剂(例如,尼拉帕尼、奥拉帕尼、卢卡帕尼和他拉唑帕尼(talazoparib)),还有更多抑制剂目前正在临床试验中。

2、尼拉帕尼目前被批准作为parp抑制剂,用于对一线基于铂的化疗完全或部分响应的患有晚期或复发性上皮性卵巢癌、输卵管癌或原发性腹膜癌的成年患者的维持治疗;以及用于治疗已经用三种或三种以上先前化疗方案治疗,并且其癌症与同源重组缺陷(hrd)阳性状态(定义为有害或疑似有害brca突变或基因组不稳定性)相关并且在对最后一次基于铂的化疗响应后超过六个月病情出现进展的患有晚期卵巢癌、输卵管癌或原发性腹膜癌的成年患者。

3、转氨酶(又称为氨基转移酶)催化氨基基团、一对电子、和一个质子从氨基供体底物的伯胺转移到氨基受体分子的羰基基团(即酮基基团)上(shin等人, 2001, biosci.biotechnol, biochem. 65: 1782- 1788)。

4、转氨酶在将酮转化为相应胺方面的立体选择性使得这些酶可用于从相应酮化合物不对称合成光学纯的胺(hohne等人, chem. cat. chem. 1(1):42-51)。转氨酶还可以通过利用转氨酶以立体特异性方式进行逆反应的能力来应用于外消旋胺的手性拆分,即优先将一种对映体转化为相应的酮,从而产生富含另一种对映体的混合物(koselewski等人,2009, org. lett. 1 1(21):4810-2)。来自节杆菌属knk168的野生型转氨酶是从某些底物中产生r-胺的r选择性酶。一些研究表明,从节杆菌属knk168的天然存在转氨酶衍生的工程化转氨酶多肽对温度和/或有机溶剂的稳定性增加,并且其已经适应于对结构不同的氨基受体分子具有酶活性(savile等人, 2010, science 329(5989): 305-9)。

5、多年来,已经开发出各种用于制备尼拉帕尼的制造方法。然而,需要改进的转氨酶生物催化剂,其可用于制备用于制造尼拉帕尼的胺中间体化合物,以及使用这些生物催化剂的简单、成本有效、无害和商业上可行的新方法。

6、序列表

7、本技术含有序列表,该序列表已以xml格式以计算机可读形式电子提交,并在此通过引用整体并入。所述xml文件创建于2023年6月27日,命名为“tes00050wo01.xml”,并且大小为32,471字节。


技术实现思路

1、本发明提供了具有转氨酶活性的工程化转氨酶多肽、编码该多肽的多核苷酸、制备该多肽的方法以及使用该多肽制备用于制造尼拉帕尼的胺中间体化合物的方法。在本发明的一个方面,提供了工程化转氨酶多肽,其相对于如seq id no: 2所示的转氨酶变体包含至少一个、至少两个、至少三个、至少四个、至少五个、至少十个或至少二十个氨基酸取代和/或修饰。

2、本发明提供了工程化转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%或95%序列同一性的氨基酸序列,其中氨基酸序列包含x124为异亮氨酸(i)的特征。

3、在本发明的进一步的方面中,提供了编码本发明的工程化转氨酶多肽的多核苷酸。还提供了包含所述多核苷酸的组合物、载体和宿主细胞。

4、在进一步的方面中,本发明提供了制备式i的不对称化合物的方法:

5、

6、i

7、其中:

8、r1为离去基团、卤素、受保护的氨基基团、no2、或oh或其受保护的形式;

9、r2为h;

10、r3为-coor5、-ch2r6或受保护的醛;或

11、r2和r3组合以形成

12、或;

13、r4为h或胺保护基团;

14、r5为c1-6烷基、c3-6环烷基、c4-10杂环基、芳基或杂芳基;并且,

15、r6为离去基团或oh或其受保护的形式;

16、该方法包括在辅酶和氨基供体的存在下将式ii的化合物与本文公开的实施方案中的任一种的工程化转氨酶多肽接触:

17、

18、ii

19、其中:

20、r1’为离去基团、卤素、受保护的氨基基团、no2、或oh或其受保护的形式;

21、r2′为醛或醛等同物;且

22、r3′为-coor5、-ch2r6或受保护的醛;或

23、r2′和r3′组合以形成

24、,其中*代表连接的点。

25、在另一个方面中,本发明提供了制备式iii的化合物或其盐的方法:

26、

27、iii

28、其中:

29、r7为h、胺保护基团、c1-c6烷基或叔丁基;

30、r8为h;

31、r9为h、c1-c6烷基或叔丁基;该方法包括将根据本文公开的实施方案中的任一种的方法生产的式i的化合物或其盐与式iv的化合物接触,

32、

33、i

34、其中:

35、r1为卤素;

36、r2为h;

37、r3为-ch2r6;

38、r4为h或胺保护基团;且

39、r6为oh或其受保护的形式;

40、

41、iv,

42、其中:

43、r10为h;

44、r11为c1-c6烷基或叔丁基。

45、在一个方面,本发明提供了制备式v的尼拉帕尼甲苯磺酸盐一水合物的方法:

46、

47、v

48、包括将根据本文公开的实施方案中的任一种的方法生产的式iii的化合物或其盐与酸接触,

49、

50、iii

51、其中:

52、r7为h或胺保护基团;

53、r8为h;

54、r9为c1-c6烷基或叔丁基。

55、发明详述

56、本发明提供了显著改善酶活性并保持产物的高立体选择性的高度有效的转氨酶变体。这种有效的转氨酶变体是通过对转氨酶变体进行工程化而实现的。本发明提供了转氨酶变体。转氨酶变体是具有转氨酶活性且相对于seq id no: 2具有至少一个取代和/或修饰的酶。本发明进一步提供了相对于seq id no: 2包含多个(两个或更多个)氨基酸取代和/或修饰的转氨酶变体。

57、在一个实施方案中,提供了工程化转氨酶多肽,其包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸。

58、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中x124为i。

59、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中x124为i,且多肽相对于seq id no: 2具有改善的酶特性。

60、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中x124为i,且多肽相对于seq id no: 2具有增加的酶活性。

61、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中x124为i,且至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,且多肽相对于seq id no: 2具有改善的酶特性。

62、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,x124为i,且多肽相对于seq id no: 2具有改善的酶特性。

63、本发明提供了转氨酶多肽,其包含与seq id no: 2所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,x124为i,且至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269、和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且多肽相对于seq id no: 2具有改善的酶特性。

64、在一个实施方案中,改善的酶特性是增加的酶活性。在一个实施方案中,本发明的转氨酶表现出比seq id no: 2的转氨酶的酶活性改善至少1.5倍的增加的活性。在一个实施方案中,本发明的转氨酶表现出比seq id no: 2的酶活性改善至少2倍、5倍、10倍、20倍、30倍、40倍或50倍的增加的活性,并且具有大于95、96、97、98或99% e.e.的立体选择性。

65、在一个实施方案中,提供了工程化转氨酶多肽,其包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

66、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

67、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代;和其中x124为i。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为c;x69为c;x94被c取代;x196被r取代;和x297被r取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为n;x69为c或t;x94被c取代;x196被r取代;和x297被r取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq idno: 2的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为m;x69为c;x94被c取代;x196被r取代;和x297被r取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为m;x69为c;x94被c取代;x137被t取代;x196被r取代;和x297被r取代。

68、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61c、x61n或x61m取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69c或x69t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x5i取代。

69、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中至少两个、至少三个、至少四个、至少五个、至少十个或至少二十个氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x69t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m、x69t和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seqid no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m、x69t、x137t、x140q、x199t和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq idno: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x3h、x5i、x61m、x69t、x97e、x137t和x269c取代。

70、在一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一个其他取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一个选自以下的氨基酸取代:x3被h取代;x5被i取代;x48被r取代;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

71、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代,以及至少一种选自以下的其他氨基酸取代:x3h、x5i、x69t、x97e、x137t、x140q、x199t、x202c和x269c。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x5i取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x97e取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x269c取代。

72、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t取代,以及至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c和x269c。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x5i取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x97e取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seqid no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x269c取代。

73、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含与选自以下的氨基酸序列中所示的氨基酸序列具有至少80%、85%、90%、95%、99%或100%序列同一性的氨基酸序列:seq id no: 4、seq id no: 6、seq id no: 8、seq id no: 10、seq id no: 14、seq idno: 16、seq id no: 18和seq id no: 20。本领域技术人员将理解,seq id no:4、6、8、10、14、16、18或20的初始m可以被修改或删除,而不会影响工程化转氨酶多肽的功能。在另一个实施方案中,工程化转氨酶多肽包含具有式m-hx (seq id no: 21)的n末端标签,其中m是蛋氨酸残基,并且hx代表x个组氨酸残基的链,其中x是0至20之间的整数。在某些实施方案中,x是0、1、2、3、4、5、6、7、8、9、10、15或20。

74、在进一步的方面,提供了工程化转氨酶多肽,其包含与seq id no: 4中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 4中相应氨基酸位置处发现的氨基酸不同的氨基酸。

75、在一个实施方案中,提供了工程化转氨酶多肽,其包含与seq id no: 4中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 4中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

76、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含与seq id no: 4中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

77、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代;和其中x124为i。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为n;x69为c或t;x94被c取代;x196被r取代;和x297被r取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为m;x69为c;x94被c取代;x196被r取代;和x297被r取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no:4的氨基酸序列或其功能片段,其中氨基酸序列包含至少一个选自以下的特征:x48被r取代;x61为m;x69为c;x94被c取代;x137被t取代;x196被r取代;和x297被r取代。

78、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61n或x61m取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69n或x69t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x5i取代。

79、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中至少两个、至少三个、至少四个、至少五个、至少十个或至少二十个氨基酸被取代为与seq id no: 4中相应氨基酸位置处发现的氨基酸不同的氨基酸。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x69t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m、x69t和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seqid no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m、x69t、x137t、x140q、x199t和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq idno: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x3h、x5i、x61m、x69t、x97e、x137t和x269c取代。

80、在一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一个其他取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一个选自以下的氨基酸取代:x3被h取代;x5被i取代;x48被r取代;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

81、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代,以及至少一种选自以下的其他氨基酸取代:x3h、x5i、x69t、x97e、x137t、x140q、x199t、x202c和x269c。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x5i取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x97e取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x61m和x269c取代。

82、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t取代,以及至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c和x269c。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x3h取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x5i取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x97e取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x137t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seqid no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x140q取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x199t取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x202c取代。在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含seq id no: 4的氨基酸序列或其功能片段,其中氨基酸序列包含x69t和x269c取代。

83、在一些实施方案中,与seq id no: 2的工程化转氨酶的活性相比,工程化转氨酶多肽中的单点突变可使酶活性增加约1.1倍至约10倍、约1.2倍至约7倍、约1.3倍至约5倍、约1.5倍至约2.5倍或约1.5倍至约6倍或至少2倍。当在工程化转氨酶多肽中作为多个点突变组合时,单点突变的积极作用可成倍增加。在一些实施方案中,工程化转氨酶多肽可含有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸取代。在一些实施方案中,虽然工程化转氨酶的活性增加,但立体选择性仍保持在95%、96%、97%、98%或99%e.e.以上。在一些实施方案中,与seq id no: 2的工程化转氨酶的活性相比,使用本文公开的工程化转氨酶多肽使转氨酶活性增加至少约2倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍或至少约55倍。在一些实施方案中,与seq id no: 2的工程化转氨酶活性相比,使用本文公开的工程化转氨酶多肽使转氨酶活性增加至少约2倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍或至少约55倍。在一些实施方案中,所述对照转氨酶是包含seq id no: 2的氨基酸序列的工程化转氨酶。

84、在一个实施方案中,提供了工程化转氨酶多肽,其包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸f3、h5、p48、c61、v69、i94、i97、e137、i140、i196、i199、t202、p269和s297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

85、在一些实施方案中,前述实施方案中任一种的工程化转氨酶多肽具有以下特征:x124为i。

86、在另一个实施方案中,本文提供了工程化转氨酶多肽,其包含在选自以下的氨基酸序列中所示的氨基酸序列:seq id no: 4、seq id no: 6、seq id no: 8、seq id no:10、seq id no: 14、seq id no: 16、seq id no: 18和seq id no: 20。本领域技术人员将理解,seq id no:4、6、8、10、14、16、18或20的初始m可以被修改或删除,而不会影响工程化转氨酶多肽的功能。

87、试剂盒

88、在一些实施方案中,本文提供了包含如本文所述的任何一种工程化转氨酶多肽的组合物。

89、在一些实施方案中,本文提供了试剂盒,其包含工程化转氨酶多肽,该工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一种选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i;辅酶;和氨基供体。在一些实施方案中,所述辅酶为磷酸吡哆醛(plp)。在一些实施方案中,所述氨基供体为异丙胺。

90、在一些实施方案中,本文提供了试剂盒,其包含工程化转氨酶多肽,该工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代;辅酶;和氨基供体。在一些实施方案中,所述辅酶为磷酸吡哆醛(plp)。在一些实施方案中,所述氨基供体为异丙胺。

91、在一些实施方案中,本文提供了试剂盒,其包含工程化转氨酶多肽,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t取代,以及至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c和x269c;辅酶;和氨基供体。

92、在一些实施方案中,本文提供了试剂盒,其包含工程化转氨酶多肽,该工程化转氨酶多肽包含与seq id no: 4中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 4中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i;辅酶;和氨基供体。

93、在一些实施方案中,本文提供了试剂盒,其包含工程化转氨酶多肽,该工程化转氨酶多肽包含与seq id no: 4中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代;辅酶;和氨基供体。

94、在一些实施方案中,本文提供了试剂盒,其包含如本文所述的工程化转氨酶多肽、辅酶和氨基供体。

95、核酸

96、在另一个方面中,本文提供了编码本发明的工程化转氨酶多肽的多核苷酸。在一些实施方案中,多核苷酸编码工程化转氨酶多肽,该工程化转氨酶多肽包含与seq id no:2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

97、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代;和其中x124为i。

98、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中氨基酸序列包含x61m取代和至少一种选自以下的氨基酸取代:x3被h取代;x5被i取代;x48被r取代;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

99、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中氨基酸序列包含x61m取代,和至少一种选自以下的其他氨基酸取代:x3h、x5i、x69t、x97e、x137t、x140q、x199t、x202c、和x269c。

100、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中氨基酸序列包含x69t取代,和至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c、和x269c。

101、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中氨基酸序列包含x61m和x69t取代。

102、在一些实施方案中,多核苷酸编码包含seq id no: 2的氨基酸序列或其功能片段的工程化转氨酶多肽,其中至少两个、至少三个、至少四个、至少五个、至少十个或至少二十个氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸。

103、在一些实施方案中,多核苷酸包含与在选自seq id no: 3、seq id no: 5、seq idno: 7、seq id no: 9、seq id no: 13、seq id no: 15、seq id no: 17或seq id no: 19的多核苷酸序列中所示的多核苷酸序列具有至少80%、85%、90%、95%、99%或100%序列同一性的多核苷酸序列。

104、在一些实施方案中,本文提供了编码如本文所述的前述实施方案中任一种的工程化转氨酶多肽的多核苷酸。

105、在一些实施方案中,本文提供了包含编码本发明的工程化转氨酶多肽的多核苷酸的载体。在一些实施方案中,载体包含多核苷酸,该多核苷酸编码与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

106、在一些实施方案中,本文提供了载体,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

107、在一些实施方案中,本文提供了载体,其包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一种选自以下的氨基酸取代:x3被h取代;x5被i取代;x48被r取代;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

108、在一些实施方案中,本文提供了载体,其包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一种选自以下的其他氨基酸取代:x3h、x5i、x69t、x97e、x137t、x140q、x199t、x202c和x269c。

109、在一些实施方案中,本文提供了载体,其包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t取代和至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c和x269c。

110、在一些实施方案中,本文提供了载体,其包含编码如本文所述的前述实施方案中任一种的工程化转氨酶多肽的多核苷酸。

111、宿主细胞

112、在另一个方面中,本文提供了包含工程化转氨酶多肽的宿主细胞,其中工程化转氨酶多肽包含至少一个氨基酸取代。在另一个实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞包含两个或更多个工程化转氨酶多肽。

113、在另一个方面中,本文提供了宿主细胞,其包含本文提供的多核苷酸(例如,编码本文提供的工程化转氨酶多肽)。在一些实施方案中,所述宿主细胞包含两个或更多个本文提供的多核苷酸(例如,2、3、4、5、6、7、8、9、10或更多个核酸)。

114、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码本发明的工程化转氨酶多肽的多核苷酸。在一些实施方案中,所述宿主细胞包含载体,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq id no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中x124为i。

115、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含至少一个选自以下的特征:x3被h取代;x5被i取代;x48被r取代;x61为c、n或m;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

116、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一个选自以下的氨基酸取代:x3被h取代;x5被i取代;x48被r取代;x69为c或t;x94被c取代;x97被e取代;x137被t取代;x140被q取代;x196被r取代;x199被t取代;x202被c取代;x269被c或v取代;和x297被r取代。

117、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x61m取代和至少一种选自以下的其他氨基酸取代:x3h、x5i、x69t、x97e、x137t、x140q、x199t、x202c和x269c。

118、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码工程化转氨酶多肽的多核苷酸,该工程化转氨酶多肽包含seq id no: 2的氨基酸序列或其功能片段,其中氨基酸序列包含x69t取代和至少一种选自以下的其他氨基酸取代:x3h、x5i、x61n、x61c、x61m、x97e、x137t、x140q、x199t、x202c和x269c。

119、在一些实施方案中,本文提供了包含载体的宿主细胞,该载体包含编码如本文所述的前述实施方案中任一种的工程化转氨酶多肽的多核苷酸。

120、合成方法

121、在一个方面中,本发明提供了制备式i的不对称化合物的有效方法:

122、

123、i

124、其中:

125、r1为离去基团、卤素、受保护的氨基基团、-no2、或-oh或其受保护的形式;

126、r2为h;

127、r3为-coor5、-ch2r6或受保护的醛;或

128、r2和r3组合以形成

129、或;

130、r4为h或胺保护基团;

131、r5为c1-6烷基、c3-10环烷基、c4-10杂环基、芳基或杂芳基;且,

132、r6为离去基团或-oh或其受保护的形式。

133、在一个实施方案中,r1是离去基团。在一个实施方案中,r1是卤素。在一个实施方案中,r1是br。

134、在另一个实施方案中,r2和r3组合以形成

135、或;

136、其中r4为h。在进一步的实施方案中,r2和r3组合以形成

137、,其中r4为h。

138、在一个实施方案中,r1为br,r2和r3组合以形成

139、,其中r4为h。

140、在另一个实施方案中,r2为h,r3为ch2r6,r4为h且r6为oh。

141、在进一步的方面中,本发明提供了制备式i的不对称化合物的方法,其包括将本发明的任何一种工程化转氨酶多肽与式ii的化合物接触:

142、

143、ii

144、其中:

145、r1’为离去基团、卤素、受保护的氨基基团、-no2、或-oh或其受保护的形式;

146、r2′为醛或醛等同物;且

147、r3′为-coor5、-ch2r6或受保护的醛;或

148、r2′和r3′组合以形成

149、,其中*代表连接的点。

150、在一个实施方案中,r1’是离去基团。在一个实施方案中,r1’是卤素。在一个实施方案中,r1’是br。

151、在一个实施方案中,r2′和r3′组合以形成

152、,其中*代表连接的点。

153、因此,在一个实施方案中,提供了制备式i的不对称化合物的方法:

154、

155、i

156、其中:

157、r1为卤素;

158、r2为h;

159、r3为-ch2r6;

160、r4为h或胺保护基团;且

161、r6为oh或其受保护的形式;

162、该方法包括在辅酶和氨基供体的存在下,将式iia的化合物与本文公开的前述实施方案中任一种的工程化转氨酶多肽接触以提供式ia的化合物:

163、

164、iia

165、

166、ia

167、该方法任选地包括保护式ia的nh2和oh基团的步骤以提供式ib的化合物:

168、

169、ib

170、其中pg1为胺保护基团,并且其中pg2为氧保护基团。在一个实施方案中,根据本文公开的实施方案中的任一种的方法也可以是制备尼拉帕尼(包括尼拉帕尼甲苯磺酸盐一水合物)的方法。

171、在一个实施方案中,提供了制备式i的不对称化合物的方法:

172、

173、i

174、其中:

175、r1为br;

176、r2为h;

177、r3为-ch2r6;

178、r4为h或胺保护基团;且

179、r6为oh或其受保护的形式;

180、该方法包括在辅酶和氨基供体存在下,将式iia的化合物与本文公开的实施方案中的任一种的工程化转氨酶多肽接触以提供式ia的化合物:

181、

182、iia

183、

184、ia

185、在一些实施方案中,该方法任选地包括保护式ia的nh2基团的步骤以提供式ic的化合物:

186、

187、ic

188、其中pg1为胺保护基团。当r4为胺保护基团时,适用此任选的步骤。

189、在一些实施方案中,该方法进一步任选地包括保护式ic的oh基团的步骤以提供式ib的化合物:

190、

191、ib

192、其中pg2为羟基保护基团。当r6为其受保护的形式的oh且r4为胺保护基团时,适用此任选的步骤。

193、在一个实施方案中,胺保护基团选自:甲酰基、乙酰基(ac)、三氟乙酰基、苄基(bn)、苯甲酰基(bz)、氨基甲酸酯、苄基氧基羰基(“cbz”)、对甲氧基苄基羰基(moz或meoz)、叔丁氧基羰基(“boc”)、三甲基硅基(“tms”)、2-三甲基硅基-乙磺酰基(“ses”)、三苯甲基和取代的三苯甲基基团、烯丙基氧基羰基、9-芴基甲基氧基羰基(“fmoc”)、硝基-藜芦基氧基羰基(“nvoc”)、对甲氧基苄基(pmb)、甲苯磺酰基(ts)、3,4-二甲氧基苄基(dmpm)、对甲氧基苯基(pmp)、2-萘基甲基醚(nap)和氯甲酸三氯乙酯(troc)。在一个实施方案中,胺保护基团是叔丁氧基羰基(“boc”)。

194、在一个实施方案中,羟基保护基团选自:甲酯、乙酯、乙酸酯、丙酸酯基团、乙二醇酯、苄基、三苯甲基醚、烷基醚、四氢吡喃基醚、三烷基硅基醚、tms、tips、甲磺酸酯和烯丙基醚。在一个实施方案中,羟基保护基团是甲磺酸酯。

195、在一个实施方案中,式ii的化合物选自:

196、、和

197、。

198、在一个实施方案中,式i的化合物选自:

199、、、和。

200、在一个实施方案中,本发明提供了制备不对称化合物的方法,其包括在辅酶和氨基供体的存在下将本发明的任何一种工程化转氨酶多肽与接触。

201、在一个实施方案中,本发明提供了制备不对称化合物的方法,其包括在辅酶和氨基供体的存在下将本发明的任何一种工程化转氨酶多肽与接触。

202、在一个实施方案中,本发明提供了制备不对称化合物的方法,其包括在辅酶和氨基供体的存在下将本发明的任何一种工程化转氨酶多肽与接触。

203、在一个实施方案中,本发明提供了制备不对称化合物的方法,其包括在辅酶和氨基供体的存在下将本发明的任何一种工程化转氨酶多肽与接触。

204、在一个实施方案中,任何前述实施方案的方法提供了具有至少约95% e.e.、至少约96% e.e.、至少约97% e.e.、至少约98% e.e.或至少约99.9% e.e.的对映体过量(e.e.)的式i的化合物。在另一个实施方案中,如所描述的式ii的化合物的转氨酶催化方法提供了具有至少95%对映体过量的式i的化合物。在进一步的实施方案中,如所描述的式ii的化合物的转氨酶催化方法提供了具有至少99%对映体过量的式i的化合物。在一个实施方案中,式i的化合物选自:

205、、、和。在一个实施方案中,式i的化合物选自: 和。在一个实施方案中,式i的化合物为。在一个实施方案中,式i的化合物为。

206、在本文公开的任何前述方法的一个实施方案中,工程化转氨酶多肽包含与seq idno: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seq idno: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸。在一些实施方案中,工程化转氨酶多肽选自如seq id no: 4、6、8、10、14、16、18和20中所示的氨基酸序列。在一个实施方案中,工程化转氨酶多肽选自如seq id no: 16、18和20中所示的氨基酸序列。在一些实施方案中,工程化转氨酶多肽包含前述实施方案中任一种的工程化转氨酶多肽。

207、在本文公开的任何前述方法的一个实施方案中,辅酶为磷酸吡哆醛(plp)。在一些实施方案中,氨基供体为异丙胺。

208、在一个方面中,本发明提供了制备式iii的化合物或其盐的方法:

209、

210、iii

211、其中:

212、r7为h、胺保护基团、烷基、c1-c4烷基或叔丁基;

213、r8为h;

214、r9为h、烷基、c1-c4烷基或叔丁基;该方法包括将根据本文公开的实施方案中的任一种的方法生产的式i的化合物或其盐与式iv的化合物接触,

215、

216、i

217、其中:

218、r1为卤素;

219、r2为h;

220、r3是-ch2r6;

221、r4为h或胺保护基团;且

222、r6为oh或其受保护的形式;

223、

224、iv,

225、其中:

226、r10为h;

227、r11为烷基、c1-c4烷基或叔丁基。

228、在一个实施方案中,r7为胺保护基团。在一个实施方案中,胺保护基团包括叔丁氧基羰基(boc)、9-芴基甲基氧基羰基(fmoc)、羧基苄基基团(cbz)、对甲氧基苄基羰基(moz)、乙酰基(ac)、苯甲酰基(bz)、对甲氧基苄基(pmb)、3,4-二甲氧基苄基(dmpm)、对甲氧基苯基(pmp)、2-萘基甲基醚(nap)、甲苯磺酰基(ts)、或氯甲酸三氯乙酯(troc)。在一个实施方案中,所述胺保护基团为叔丁氧基羰基(boc)。

229、在一个实施方案中,r9为叔丁基(tbu)。在另一个实施方案中,r11为叔丁基(tbu)。

230、在一个实施方案中,在的存在下进行接触式i的化合物或其盐的步骤。在另一个实施方案中,接触的步骤是在至少一种选自以下的试剂的存在下进行的:甲苯、叔丁醇钾、磷酸三钾(k3po4)、溴化铜(i)、氢氧化铵和庚烷,或其任何组合。在又另一个实施方案中,接触的步骤是在溶剂的存在下进行的。与这些实施方案一致,溶剂包括但不限于甲苯、n,n-二甲基甲酰胺(dmf)、叔丁醇、二甲氧基乙烷(dme)、乙腈、二氯甲烷(dcm)、四氢呋喃(thf)、2-甲基四氢呋喃(me-thf)、异丙醇、甲醇、乙醇,或其任何组合。在一些实施方案中,溶剂包括甲苯。

231、在一个实施方案中,接触的步骤在酸的存在下进行。在一个实施方案中,酸包括甲酸、乙酸、丙酸、丁酸、戊酸、己酸、草酸、乳酸、苹果酸、柠檬酸、苯甲酸、碳酸、尿酸、牛磺酸、对甲苯磺酸、三氟甲磺酸、氨基甲基膦酸、三氟乙酸(tfa)、膦酸、硫酸、硝酸、磷酸、盐酸、乙磺酸(esa)、甲磺酸(msoh)或其任何组合。在另一个实施方案中,酸是甲磺酸(msoh)。

232、在一个实施方案中,式i的化合物或其盐具有以下结构:

233、。

234、在一个实施方案中,式iv的化合物或其盐具有以下结构:

235、。

236、在一个实施方案中,式iii的化合物或其盐具有以下结构:

237、。

238、在一个方面,本发明提供了制备式v的尼拉帕尼甲苯磺酸盐一水合物的方法:

239、

240、v

241、包括将根据本文公开的实施方案中的任一种的方法生产的式iii的化合物或其盐与酸接触,

242、

243、iii

244、其中:

245、r7为h或胺保护基团;

246、r8为h;

247、r9为c1-c4烷基或叔丁基。

248、在一个实施方案中,r7为胺保护基团。在一个实施方案中,胺保护基团为叔丁氧基羰基(boc)、9-芴基甲基氧基羰基(fmoc)、羧基苄基基团(cbz)、对甲氧基苄基羰基(moz)、乙酰基(ac)、苯甲酰基(bz)、对甲氧基苄基(pmb)、3,4-二甲氧基苄基(dmpm)、对甲氧基苯基(pmp)、2-萘基甲基醚(nap)、甲苯磺酰基(ts)、或氯甲酸三氯乙酯(troc)。

249、在一个实施方案中,胺保护基团为叔丁氧基羰基基团(boc)。在一个实施方案中,r9为叔丁基。

250、在一个实施方案中,酸为选自以下的至少一种酸:甲磺酸(msoh)、甲酸、乙酸、丙酸、丁酸、戊酸、己酸、草酸、乳酸、苹果酸、柠檬酸、苯甲酸、碳酸、尿酸、牛磺酸、对甲苯磺酸、三氟甲磺酸、氨基甲基膦酸、三氟乙酸(tfa)、膦酸、硫酸、硝酸、磷酸、盐酸和乙磺酸(esa),或其任何组合。在一个实施方案中,酸为甲磺酸(msoh)。在一个实施方案中,酸为对甲苯磺酸。

251、在一个实施方案中,接触的步骤是在溶剂的存在下进行的。在一个实施方案中,溶剂包括n,n-二甲基甲酰胺(dmf)、叔丁醇、二甲氧基乙烷(dme)、乙腈、二氯甲烷(dcm)、四氢呋喃(thf)、2-甲基四氢呋喃(me-thf)、异丙醇、甲醇、乙醇或其任何组合。在另一个实施方案中,溶剂包括me-thf。

252、在一个实施方案中,前述实施方案中的任一种的方法进一步包括制备式v的化合物的方法,

253、

254、v

255、其中该方法包括将式iii的化合物与酸接触。在一个实施方案中,其中将式iii的化合物与酸接触另外提供式vi的化合物,

256、

257、vi,

258、其中r9为叔丁基。

259、在一个实施方案中,提供了制备式vii的尼拉帕尼甲苯磺酸盐一水合物的方法,其包括:

260、

261、vii

262、将根据前述实施方案中的任一种的方法生产的式v的化合物或其盐与甲磺酸或对甲苯磺酸接触,

263、

264、v。

265、在一个实施方案中,其中所述接触是在溶剂的存在下进行的。在一个实施方案中,溶剂是水。

266、在一个方面,本发明提供了组合物,其包含

267、i)式vii的尼拉帕尼甲苯磺酸盐一水合物:

268、

269、vii;

270、和

271、ii)少于0.1重量%的式vi的化合物或其盐,

272、

273、vi。

274、在一个实施方案中,在组合物中存在的式vi的化合物的浓度小于0.09重量%、小于0.08重量%、小于0.07重量%、小于0.06重量%、小于0.05重量%、小于0.04重量%、小于0.03重量%、小于0.02或小于0.01重量%。

275、在一个实施方案中,根据本文公开的制备式v的尼拉帕尼甲苯磺酸盐一水合物的方法,在将式iii的化合物与酸接触后存在式vi的化合物。

276、在一个实施方案中,酸是强酸。在一个实施方案中,所述酸是至少一种选自以下的酸:甲磺酸(msoh)、甲酸、乙酸、丙酸、丁酸、戊酸、己酸、草酸、乳酸、苹果酸、柠檬酸、苯甲酸、碳酸、尿酸、牛磺酸、对甲苯磺酸、三氟甲磺酸、氨基甲基膦酸、三氟乙酸(tfa)、膦酸、硫酸、硝酸、磷酸、盐酸和乙磺酸(esa),或其任何组合。在一个实施方案中,酸是甲磺酸(msoh)。

277、在一些实施方案中,将尼拉帕尼甲苯磺酸盐一水合物添加到溶剂中。在一些实施方案中,将尼拉帕尼甲苯磺酸盐一水合物添加到溶剂中以形成尼拉帕尼甲苯磺酸盐一水合物的结晶形式。在一些实施方案中,所述溶剂为二甲基亚砜(dmso)。在一些实施方案中,根据前述实施方案中的任一种的方法,进一步包括湿磨本文公开的尼拉帕尼甲苯磺酸盐一水合物。在一些实施方案中,该方法进一步包括使用一个或多个温度循环对尼拉帕尼甲苯磺酸盐一水合物进行退火。

278、在一些实施方案中,溶剂包括dmso。在一些实施方案中,该方法包括将尼拉帕尼甲苯磺酸盐一水合物与dmso和水接触。在一些实施方案中,在接触中使用约200:1至约1:200的水与溶剂比率(v/v)。在一些实施方案中,水与溶剂比率(v/v)为约200:1至约1:200,例如约200:1至约100:1、约200:1至约10:1、约200:1至约5:1、约200: 1至约2:1、约200: 1至约1:1、约200: 1至约1 :2、约200: 1至约1:5、约200: 1至约1 : 10、约200: 1至约1 : 100、约100:1至约10:1、约100:1至约5:1、约100:1至约2:1、约100:1至约1:1、约100:1至约1:2、约100:1至约1:5、约100:1至约1:10、约100:1至约1:100、约100:1至约1:200、约10:1至约5:1、约10:1至约2:1、约10:1至约1:1、约10:1至约1:2、约10:1至约1:5、约10:1至约1:10、约10:1至约1 : 100、约10: 1至约1 :200、约5: 1至约2:1、约5: 1至约1 : 1、约5: 1至约1 :2、约5: 1至约1:5、约5: 1至约1:10、约5: 1至约1 : 100、约5: 1至约1 :200、约2: 1至约1 :1、约2: 1至约1 :2、约2: 1至约1:5、约2: 1至约1:10、约2: 1至约1 : 100、约2: 1至约1 :200、约1 : 1至约1 :2、约1 : 1至约1:5、约1 : 1至约1:10、约1 : 1至约1 : 100、约1 : 1至约1 :200、约1 :2至约1:5、约1 :2至约1:10、约1 :2至约1 : 100、约1 :2至约1:200、约1:5至约1:10、约1:5至约1:100、约1:5至约1:200、约1 : 10至约1 : 100、约1 : 10至约1 :200、或约1 : 100至约1 :200。在一些实施方案中,水与溶剂比率(v/v)为约5:1至约1:5。

279、在一个方面中,前述实施方案中的任一种的工程化转氨酶多肽在制备式i的不对称化合物中的用途:

280、

281、i

282、其中:

283、r1为卤素、受保护的氨基基团、-no2、或-oh或其受保护的形式;

284、r2为h;

285、r3为-coor5、-ch2r6或受保护的醛;或者,

286、r2和r3组合以形成表 1.缩写

287、或;

288、r4为h或胺保护基团;

289、r5为c1-6烷基、c3-6环烷基、c4-10杂环基、芳基或杂芳基;且,

290、r6为离去基团或-oh,或公开了其受保护的形式。

291、在根据前述实施方案的用途的一个实施方案中,工程化转氨酶多肽选自如seq idno: 4、6、8、10、14、16、18和20中所示的氨基酸序列。在一些实施方案中,工程化转氨酶多肽选自如seq id no: 16、18和20所示的氨基酸序列。

292、在根据前述实施方案中的任一种的用途的一个实施方案中,r2和r3组合以形成

293、或,且r4为h。在一个实施方案中,r2和r3组合以形成

294、,且r4为h。在一些实施方案中,r1为br,r2为h,r3为ch2r6,r4为h,且r6为oh。

295、定义

296、除非另有说明,本文使用的所有技术和科学术语均具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。除非上下文另有明确说明,否则单数术语“一个(a)”、“一个(an)”和“该”包括复数指代物。类似地,除非上下文另有明确说明,否则单词“或”旨在包括“和”。术语“复数”是指两个或更多个。术语“至少一个”指一个或多个。

297、此外,关于物质的浓度或水平(例如溶液成分浓度或其比例)以及反应条件(例如温度、压力和循环时间)给出的数值限制均旨在是近似的。除非另有说明,如果提供数值范围,则该范围是包含的,即包含端点。

298、为了本文描述的目的,用于遗传编码氨基酸的缩写是常规的,并且如下表1中所示:

299、表1.缩写

300、

301、当使用单字母或三字母缩写时,除非前面明确有“l”或“d”或从其中缩写所使用的上下文中清楚看出,否则氨基酸可为α碳(c-α)的l-或d-构型。例如,“ala”表示丙氨酸,但不指定关于α碳的构型,“d-ala”和“l-ala”分别表示d-丙氨酸和l-丙氨酸。当肽序列以一系列单字母或三字母缩写呈现时,序列按照惯例以n→c方向呈现。

302、“约”或“大约”表示大致、在…周围或在…范围内。术语“约”或“大约”进一步表示在如本领域技术人员所确定的特定值的可接受上下文误差范围内,这部分取决于该值是如何测量的,即测量系统的局限性或特定目的所需的精确度。当术语“约”或“大约”与数值范围结合使用时,它通过扩展所列数值的上下边界来修改该范围。

303、“酸性氨基酸或残基”是指当氨基酸包含在肽或多肽中时,具有表现出小于约6的pk值的侧链的亲水性氨基酸或残基。由于失去氢离子,酸性氨基酸在生理ph通常具有带负电荷的侧链。遗传编码的酸性氨基酸包括l-glu (e)和l-asp (d)。

304、如本文所公开的多肽的上下文中使用的,“氨基酸”或“残基”是指在序列位置处的特定单体(例如,p5表示在位置5处的“氨基酸”或“残基”是脯氨酸)。

305、“氨基酸差异”或“残基差异”或“氨基酸取代”是指多肽序列的一个位置处的氨基酸残基相对于在参考序列中相应位置处的氨基酸残基的变化。氨基酸差异的位置在本文中通常称为“xn”,其中n是指残基差异所基于的参考序列中的相应位置。例如,“与seq id no:2相比,在x61位置处的残基差异”是指对应于seq id no: 2的位置61的多肽位置处的氨基酸残基的变化。因此,如果seq id no: 2的参考多肽在位置61处具有酪氨酸,则“与seq idno: 2相比,在x61位置处的残基差异”是在对应于seq id no: 2的位置61的多肽位置处除酪氨酸之外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的具体氨基酸残基差异表示为“xny”,其中“xn”指定如上所述的相应位置,并且“y”是工程化多肽中发现的氨基酸的单字母标识符(即,与参考多肽中不同的残基)。在一些情况下(例如,表7和表8),本发明还提供了通过常规符号“anb”表示的特定氨基酸差异,其中a是参考序列中残基的单字母标识符,“n”是参考序列中残基位置的编号,并且b是工程化多肽序列中残基取代的单字母标识符。在一些情况下,本发明的多肽可以包括相对于参考序列的一个或多个氨基酸残基差异,这通过相对于参考序列发生变化的一系列指定位置来指示。本发明包括工程化多肽序列,其包含一个或多个氨基酸差异,这些氨基酸差异包括保守和非保守氨基酸取代中的任一个或两个。

306、“氨基受体”和“胺受体”、“酮底物”、“酮基”和“酮”在本文中可互换使用,是指从供体胺接受氨基基团的羰基(酮基或酮)化合物。氨基受体是下面所示通式的分子,

307、,其中每一个r1、r2(当独立地考虑时)为未取代的或被一个或多个酶可接受的基团取代的烷基、烷基芳基基团或芳基基团。r1在结构或手性上可以与r2相同或不同。在一些实施方案中,r1和r2合在一起可以形成未取代、取代或与其他环稠合的环。氨基受体包括酮基羧酸和脂肪酮(酮)。典型的酮基羧酸是α-酮基羧酸,例如乙醛酸、丙酮酸、草酰乙酸等,以及这些酸的盐。氨基受体还包括通过其他酶或全细胞过程转化为氨基受体的物质,例如延胡索酸(其可转化为草酰乙酸)、葡萄糖(可转化为丙酮酸)、乳酸、马来酸等。可使用的氨基受体包括(例如但不限于)(r)-2-(3,4-二甲氧基苯乙氧基)环己酮、3,4-二氢萘-1(2h)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、苯乙酮、(r)-2-(3,4-二甲氧基苯乙氧基)环己酮、2-甲氧基-5-氟苯乙酮、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、-酮、l-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、l-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮、1-苯基丁-1-酮、l-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、l-(4-羟基苯基)丁-3-酮、2-乙酰萘、苯基丙酮酸、2-酮戊二酸和2-酮琥珀酸,包括可能的(r)和(s)单一异构体。

308、“氨基供体”或“胺供体”是指将氨基基团提供给氨基受体,从而成为羰基种类的氨基化合物。氨基供体是下面所示通式的分子,

309、,其中每一个r3、r4(当独立地考虑时)为未取代或被一个或多个酶非抑制基团取代的烷基、烷基芳基基团或芳基基团。r3在结构或手性上可以与r4相同或不同。在一些实施方案中,r3和r4合在一起可以形成未取代、取代或与其他环稠合的环。可用于本发明实施方案的典型氨基供体包括手性和非手性氨基酸以及手性和非手性胺。可以与本文的实施方案一起使用的氨基供体包括(例如但不限于)异丙胺(也称为2-氨基丙烷,并且在本文的其他地方称为“ipm”)、a-苯乙基胺(也称为1-苯基乙胺)及其对映体(s)-1-苯基乙胺和(r)-1-苯基乙胺、2-氨基-4-苯基丁烷、甘氨酸、l-谷氨酸、l-谷氨酸盐、谷氨酸单钠、l-丙氨酸、d-丙氨酸、d,l-丙氨酸、l-天冬氨酸、l-赖氨酸、d,l-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺(也称为腐胺)、1,6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄基胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、l-氨基-l-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-l-(4-羟基苯基)丙烷、1-氨基-l-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、l-苯基-2-氨基丙烷、l-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、l-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、l-苯基-3-氨基丁烷、l-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢化萘、2-氨基四氢化萘、2-氨基-5-甲氧基四氢化萘和1-氨基茚满,包括可能的(r)和(s)单一异构体,并且包括胺的所有可能的盐。

310、“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括l-ala (a)、l-val (v)、l-leu (l)和l-ile (i)。

311、在短语例如“a和/或b”中使用的“和/或”旨在包括“a和b”、“a或b”、“a”和“b”。同样,在短语例如“a、b和/或c”中使用的术语“和/或”旨在涵盖以下实施方案中的每一个:a、b和c;a、b或c;a或c;a或b;b或c;a和c;a和b;b和c;a(单独);b(单独);和c(单独)。

312、“芳香族氨基酸或残基”是指具有包括至少一个芳香族或杂芳香族环的侧链的亲水性或疏水性氨基酸或残基。遗传编码的芳香族氨基酸包括l-phe(f)、l-tyr(y)和l-trp(w)。尽管由于其杂芳香族氮原子的pka,l-his (h)它有时被归类为碱性残基,或由于其侧链包含杂芳香族环而被归类为芳香族残基,但本文将组氨酸归类为亲水性残基或“受限残基”(见下文)。

313、“碱性氨基酸或残基”是指当氨基酸包含在肽或多肽中时,具有表现出大于约6的pka值的侧链的亲水性氨基酸或残基。由于与水合氢离子缔合,碱性氨基酸在生理ph通常具有带正电荷的侧链。遗传编码的碱性氨基酸包括l-arg(r)和l-lys(k)。

314、“手性胺”是指通式r1-ch(nh2)-r2的胺,并在此以最广义使用,包括各种各样的不同和混合功能类型的脂肪族和脂环族化合物,其特征在于存在与仲碳原子结合的伯氨基基团,该仲碳原子除了氢原子(h)外还带有(i)形成手性环状结构的二价基团,或(ii)在结构或手性上彼此不同的两个取代基(氢除外)。形成手性环状结构的二价基团包括,例如,2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。仲碳原子上的两个不同取代基(上述的r1和r2)也可以有很大差异,并且包括烷基、芳烷基、芳基、卤素、羟基、低级烷基、低级烷氧基、低级烷硫基、环烷基、羧基、烷氧羰基、氨基甲酰基、单和双(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单和双(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰氨基、芳基甲酰胺基等,以及被上述取代的烷基、芳烷基或芳基。

315、如本文使用的,“辅因子”是指与酶组合操作以催化反应的非蛋白质化合物。“磷酸吡哆醛”、“plp”、“5'-磷酸吡哆醛”、“pyp”和“p5p”在本文中可互换使用,是指在转氨酶反应中充当辅因子的化合物。在一些实施方案中,磷酸吡哆醛定义为结构l-(4'-甲酰基-3'-羟基-2'-甲基-5'-吡啶基)甲氧基膦酸,cas编号[54-47-7],5'-磷酸吡哆醛可通过吡哆醇(也称为维生素b6)的磷酸化和氧化在体内产生。在使用转氨酶的转氨反应中,氨基供体的胺基团被转移到辅因子上以产生酮基副产物,而5'-磷酸吡哆醛则转化为磷酸吡哆胺。5'-磷酸吡哆醛通过与不同的酮基化合物(氨基受体)反应而再生。胺基团从磷酸吡哆胺转移到氨基受体产生手性胺并再生辅因子。在一些实施方案中,5'-磷酸吡哆醛可以被维生素b6家族的其他成员替代,包括吡哆醇(pn)、吡哆醛(pl)、吡哆胺(pm)及其磷酸化对应物;磷酸吡哆醇(pnp)和磷酸吡哆胺(pmp)。如本文中使用的,“辅因子”旨在涵盖维生素b6家族化合物plp、pn、pl、pm、pnp和pmp,它们有时也称为辅酶。

316、“编码序列”是指编码蛋白质的氨基酸序列的核酸(例如基因)的部分。

317、“保守的”氨基酸取代或突变是指具有相似侧链的残基的可互换性,并且因此通常涉及将多肽中的氨基酸替换为属于同一或相似特定分类的氨基酸类别中的氨基酸。。然而,如本文所用,在一些实施方案中,如果保守突变可以代替为从脂肪族到脂肪族、非极性到非极性、极性到极性、酸性到酸性、碱性到碱性、芳香族到芳香族或受限残基到受限残基的取代,则保守突变不包括从亲水性到亲水性、疏水性到疏水性、含羟基到含羟基或小残基到小残基的取代。此外,如本文所用,a、v、l或i可以保守突变为另一个脂肪族残基或另一个非极性残基。下表2显示了示例性保守取代。

318、表2. 保守取代

319、

320、“受限氨基酸或残基”是指具有受限几何构造的氨基酸或残基。本文中,受限残基包括l-pro (p)和l-his (h)。组氨酸具有受限几何构造,因为它具有相对小的咪唑环。脯氨酸具有受限几何构造,因为它也具有五元环。

321、“转化”是指底物酶促转化为相应产物。“转化率”是指在特定条件下,在一定时间内底物转化为产物的百分比。因此,转氨酶多肽的“酶活性”或“活性”可以表示为底物到产物的“转化率”。

322、“对应于”、“关于”或“相对于”在给定氨基酸或多核苷酸序列的编号上下文中使用时,是指当给定氨基酸或多核苷酸序列与参考序列进行比较时,指定参考序列的残基的编号。将序列与指定参考序列进行比较的方法是本领域技术人员已知的。例如,可以使用needleman wunsch方法将任何氨基酸或多核苷酸序列与参考序列进行比较。

323、“相应氨基酸位置”是广泛使用且为本领域技术人员所熟知的术语。可以通过使用任何众所周知的氨基酸比对方法比对氨基酸序列来确定相应的氨基酸位置。例如,可以使用ncbi blast算法方法来识别相应的氨基酸位置。“半胱氨酸”或l-cys(c)的不寻常之处在于它可以与其他l-cys (c)氨基酸或其他含硫烷基或巯基的氨基酸形成二硫键。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫键的巯基部分的其他氨基酸。l-cys (c)(和具有含-sh侧链的其他氨基酸)以还原的游离-sh或氧化的二硫键形式存在于肽中的能力影响l-cys (c)是否为肽贡献净疏水性或亲水性。虽然根据eisenberg的标准化共识尺度(eisenberg等人, 1984,上文),l-cys (c)表现出0.29的疏水性,但应理解,出于本发明的目的,l-cys(c)被归类为其自己独特的组。

324、“缺失”是指通过从参考多肽中去除一个或多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸,最多去除组成参考酶的氨基酸总数的10%,或最多去除组成参考酶的氨基酸总数的20%,同时保留酶活性和/或保留工程化转氨酶的改进特性。缺失可以针对多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续片段或可以是不连续的。

325、如本文在工程化转氨酶的背景下使用的“来源于”指的是工程化所基于的起源转氨酶和/或编码此类转氨酶的基因。

326、如本文所用的,“片段”是指具有氨基末端和/或羧基末端缺失但剩余氨基酸序列与序列中相应位置相同的多肽。片段可以是至少14个氨基酸长,至少20个氨基酸长,至少50个氨基酸长或更长,并且是全长转氨酶的最多70%、80%、90%、95%、98%和99%或更多。“功能片段”或“生物活性片段”可互换使用,在此是指具有氨基末端和/或羧基末端缺失和/或内部缺失的多肽,但剩余的氨基酸序列与其所比较的序列中的相应位置相同,并且保留了全长多肽的基本上所有的活性。

327、“改善的酶特性”是指与参考转氨酶相比,转氨酶多肽表现出任何酶特性的改善。对于本文所描述的工程化转氨酶多肽,通常与野生型转氨酶进行比较,尽管在一些实施方案中,参考转氨酶可以是另一种改善的工程化转氨酶。期望改善的酶特性包括但不限于酶活性(其可以用底物的转化率来表示)、热稳定性、溶剂稳定性、ph活性特征、辅因子要求、对抑制剂的不应性(例如,底物或产物抑制)、立体特异性和立体选择性(包括对映选择性)。在一个实施方案中,本发明的转氨酶具有大于95、96、97、98或99% e.e.的立体选择性。

328、“酶活性增加”是指工程化转氨酶多肽的改善特性,其可以通过与参考转氨酶相比,比活性的增加(例如,产生的产物/时间/重量蛋白质)或底物到产物的转化率的增加(例如,在指定时间段内使用指定量的转氨酶的起始量的底物到产物的转化率)来表示。实施例中提供了确定酶活性的示例性方法。与酶活性有关的任何特性都可能受到影响,包括经典的酶特性km、vmax或kcat,这些特性的变化可导致酶活性增加。酶活性的改善可为约1.1倍的seq id no: 2中所示的相应转氨酶的酶活性,到几乎2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多倍的天然存在的转氨酶或转氨酶多肽所衍生的另一种工程化转氨酶的酶活性。在特定实施方案中,工程化转氨酶表现出比具有seq id no: 2的对照转氨酶的酶活性高在2.0至50倍、2.0至100倍的范围内的改善的酶活性。本领域技术人员理解,任何酶的活性都是扩散限制的,使得催化转换率不能超过底物(包括任何需要的辅因子)的扩散率。扩散限制的理论最大值,或kcat/km,通常为约108至109(m s"1)。因此,转氨酶酶活性的任何改善都将具有与转氨酶作用的底物的扩散速率相关的上限。转氨酶活性可以通过任何一种标准测定来测量,例如通过监测反应物或产物的分光光度性质的变化。酶活性的比较是使用酶的确定的制剂、在设定条件下的确定的测定法和一种或多种确定的底物进行的,如本文进一步详细描述的。

329、在一个实施方案中,本发明的转氨酶表现出比seq id no: 2的酶活性改善至少2倍的增加的活性。在一个实施方案中,本发明的转氨酶表现出比seq id no: 2的酶活性改善至少2倍、5倍、10倍、20倍、30倍、40倍或50倍的增加的活性,并且具有大于95、96、97、98或99% e.e.的立体选择性。

330、“插入”是指通过添加一个或多个来自参考多肽的氨基酸来修饰多肽。在一些实施方案中,改善的工程化转氨酶包括向天然存在的转氨酶多肽插入一个或多个氨基酸以及向其他改善的转氨酶多肽插入一个或多个氨基酸。插入可以在多肽的内部部分中,或在羧基或氨基末端。如本文使用的,插入包括本领域已知的融合蛋白。插入可以是连续的氨基酸片段,或由天然存在的多肽中的一个或多个氨基酸隔开。

331、“天然存在”或“野生型”是指在自然界中发现的形式。例如,天然存在或野生型多肽或多核苷酸序列是可从自然界来源分离,并且未经人类操作故意修改的存在于生物体中的序列。

332、“非天然存在的”、“重组的”或“工程化”或当与关于例如细胞、核酸或多肽一起使用时,是指材料或对应于材料的天然或原生形式的材料,其已经以自然界中不存在的方式进行修饰,或与其相同但由合成材料和/或通过使用重组技术进行操作而产生或衍生。非限制性实例包括,除其他外,表达在细胞的原生(非重组)形式中不存在的基因或表达以不同水平表达的原生基因的重组细胞。

333、本文中的“核酸”是指任意长度的核苷酸的聚合形式,其含有脱氧核糖核苷酸、核糖核苷酸和/或其类似物。它包括dna、rna和dna/rna杂交体。它还包括dna或rna类似物,例如含有修饰骨架(例如肽核酸(pna)或硫代磷酸酯)或修饰碱基的类似物。因此,本发明的核酸包括mrna、dna、cdna、重组核酸、分支核酸、质粒、载体等。当核酸采用rna的形式时,它可具有或不具有5'帽。rna可以是小rna、中rna或大rna。小rna每条链的核苷酸数为10-30(例如sirna)。中rna每条链含有在30-2000之间的核苷酸(例如非自我复制的mrna)。大rna每条链含有至少2,000个核苷酸,例如每条链至少2,500个、至少3,000个、至少4,000个、至少5,000个、至少6,000个、至少7,000个、至少8,000个、至少9,000个或至少10,000个核苷酸。单链rna分子的分子量(单位为g/mol(或道尔顿))可以使用以下式估计:分子量=(rna核苷酸的数量) x 340 g/mol。除了任何5'帽结构外,rna还可以包含一个或多个具有修饰核碱基的核苷酸。例如,rna可以包含一个或多个修饰嘧啶核碱基,例如假尿苷和/或5甲基胞嘧啶残基。然而,在一些实施方案中,rna不包含修饰的核碱基,并且可能不包含修饰的核苷酸,即,rna中的所有核苷酸都是标准的a、c、g和u核糖核苷酸(除了任何5'帽结构,其可能包括7'甲基鸟苷)。在其它实施方案中,rna可包含5'帽,该5'帽包含7'甲基鸟苷,并且前1、2或3个5'核糖核苷酸可能在核糖的2'位置被甲基化。

334、核酸可以是重组形式,即自然界中不存在的形式。例如,核酸可以包含一个或多个异源核酸序列(例如,编码另一种抗原的序列和/或控制序列,例如启动子或内部核糖体进入位点)。核酸可以是载体的一部分,即设计用于转导/转染一种或多种细胞类型的核酸的一部分。载体可以是例如“表达载体”,其设计用于在宿主细胞中表达核苷酸序列,或“病毒载体”,其设计用于导致重组病毒或病毒样颗粒的产生。

335、本文使用的“序列同一性百分比”、“同一性百分比”和“相同百分比(percentidentical)”是指多核苷酸序列或多肽序列之间的比较,并且通过在比较窗口上比较两个最佳比对的序列来确定,其中与用于两个序列的最佳比对的参考序列相比,比较窗口中的多核苷酸或多肽序列的部分可能包含添加或缺失(即间隙)。通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置数或核酸碱基或氨基酸残基与间隙对齐以产生匹配位置数,将匹配位置数除以比较窗口中的总位置数并将结果乘以100以产生序列同一性百分比来计算百分比。使用blast和blast 2.0算法进行最佳比对和序列同一性百分比的确定(参见例如altschul,等人, 1990, j. mol. biol. 215: 403-410 and altschul,等人,1977, nucleic acids res. 3389-3402)。进行blast分析的软件可通过国家生物技术信息中心网站公开获取。

336、在为两个序列提供百分比同一性方面有许多其他算法可用,其功能类似于blast。可以例如通过smith和waterman, 1981, adv. appl. math. 2:482的局部同源性算法、通过needleman和wunsch, 1970, j. mol. biol. 48:443的同源性比对算法、通过pearson和lipman, 1988, proc. natl. acad. sci. usa 85:2444的相似性搜索方法、通过这些算法的计算机化实现(gcg wisconsin软件包中的gap、bestfit、fasta和tfasta)、或通过目视检查(通常参见,current protocols in molecular biology, f. m. ausubel,等人, eds.,current protocols, greene publishing associates, inc.和john wiley & sons,inc.的合资公司,(1995增刊)(ausubel))进行序列的最佳比对以进行比较。此外,序列比对和序列同一性百分比的确定可以使用gcg wisconsin软件包(accelrys, madison wi)中的bestfit或gap程序,使用提供的默认参数。clustalw程序也适合用于确定同一性。

337、“蛋白质”、“多肽”和“肽”在本文中可互换使用,表示由酰胺键共价连接的至少两个氨基酸的聚合物,无论其长度或翻译后修饰如何(例如,糖基化、磷酸化、脂化、肉豆蔻酰化(myristilation)、泛素化等)。在该定义内包括d-和l-氨基酸,以及d-和l-氨基酸的混合物。

338、本文中的“纯化(purification)”或“纯化(purifying)”是指从组合物或宿主细胞或培养物中去除不期望存在的成分的过程。纯化是相对术语,并不要求从组合物中去除不需要的成分的所有痕迹。纯化可以包括例如离心、透析、离子交换色谱和尺寸排阻色谱、亲和纯化或沉淀的过程。因此,术语“纯化”并不要求绝对纯度;相反,它旨在作为相对术语。可以纯化基本上纯的核酸或蛋白质的制剂,使得期望的核酸或蛋白质占制剂总核酸含量的至少50%。在某些实施方案中,基本上纯的核酸或蛋白质将占制剂的总核酸或蛋白质含量的至少60%、至少70%、至少80%、至少85%、至少90%或至少95%或更多。未经过任何纯化步骤的免疫原性分子或抗原或抗体(即,在自然界中发现的分子)不适合用于药物(例如,疫苗)用途。

339、“参考序列”是指用作序列比较的基础的确定的序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的片段。通常,参考序列的长度为至少20个核苷酸或氨基酸残基,长度为至少25个残基,长度为至少50个残基,或为核酸或多肽的全长。由于两个多核苷酸或多肽可能各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),并且(2)可能进一步包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过在“比较窗口”上比较两个多核苷酸或多肽的序列来进行以识别和比较局部区域的序列相似性。在一些实施方案中,“参考序列”可以基于一级氨基酸序列,其中参考序列是可以在一级序列中具有一个或多个变化的序列。例如,“基于seq id no: 2的参考序列,其在对应于x137的残基处为苏氨酸”是指其中在seq id no: 2中x137处对应的残基(其为谷氨酸(e))已变为苏氨酸(t)的参考序列。“比较窗口”是指至少约20个连续核苷酸位置或氨基酸残基的概念片段,其中序列可与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中比较窗口中的序列的部分与参考序列(其不包含添加或缺失)相比可能包含20%或更少的添加或缺失(即间隙),以进行两个序列的最佳比对。比较窗口可以长于20个连续残基,并且任选地包括30、40、50、100或更长的窗口。

340、当在给定氨基酸或多核苷酸序列的编号的上下文中使用“关于”、“对应于”或“相对于”时,是指当将给定氨基酸或多核苷酸序列与参考序列进行比较时,对指定参考序列的残基进行编号。换句话说,给定聚合物的残基编号或残基位置是相对于参考序列指定的,而不是依据给定氨基酸或多核苷酸序列中残基的实际数字位置指定的。例如,可以通过引入间隙来优化两个序列之间的残基匹配,从而将给定氨基酸序列(例如工程化转氨酶的氨基酸序列)与参考序列进行比对。在这些情况下,尽管存在间隙,但给定氨基酸或多核苷酸序列中残基的编号是相对于其已经进行比对的参考序列进行的。

341、“基本上纯的多肽”是指其中多肽种类为主要存在种类的组合物(即,以摩尔或重量为基础,其比组合物中任何其他单个大分子种类更丰富),并且当目标种类占存在的大分子种类的至少约50%(摩尔或%重量)时,通常是基本上纯化的组合物。通常,基本上纯的转氨酶组合物将占组合物中存在的所有大分子种类的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多和约98%或更多(摩尔或%重量)。在一些实施方案中,目标种类被纯化至基本同质(即,通过常规检测方法无法检测到组合物中的污染物种类),其中组合物基本上由单一大分子种类组成。溶剂种类、小分子(<500道尔顿)和元素离子种类不被视为大分子种类。在一些实施方案中,分离的改善的转氨酶多肽是基本上纯的多肽组合物。

342、“立体选择性”是指在化学或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的形成比另一种更有利,或者其可以是完全的,其中只形成一种立体异构体。当立体异构体是对映体时,立体选择性称为对映选择性,即一种对映体在两种对映体的和中的分数(通常报告为百分比)。本领域通常替代地将其报告为(通常为百分比)根据公式[主要对映体-次要对映体]/[主要对映体+次要对映体]由此计算的对映体过量(e.e.)。当立体异构体是非对映异构体时,立体选择性称为非对映选择性,即一种非对映体在两种非对映体的混合物中的分数(通常报告为百分比),通常替代地将其报告为非对映体过量(d.e.)。当混合物含有两种以上的非对映体时,通常报告非对映体的比率或“非对映体比率”,而不是非对映异构体过量。对映体过量和非对映体过量是立体异构体过量的类型。“高立体选择性”是指转氨酶多肽能够将底物转化为相应的手性胺产物,具有至少约90%、95%或99%立体异构体过量。

343、“转氨酶”或“氨基转移酶”在本文中可互换使用,是指具有将氨基基团(nh2)、一对电子和一个质子从伯胺可逆地转移到受体分子的羰基基团(c=o)的酶促能力的多肽。如本领域技术人员所理解的,具有转氨酶活性的酶还能够在不同反应条件和不同底物下进行其他反应,例如脱卤/脱氨。本发明包括所有此类酶。

344、如本文所用的转氨酶包括天然存在的(野生型)转氨酶以及通过人类操作产生的非天然存在的工程化多肽。在一个实施方案中,公开了工程化转氨酶多肽,其包含与seq idno: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%或95%序列同一性的氨基酸序列,其中氨基酸序列包含x124为异亮氨酸(i)的特征。在一个实施方案中,工程化转氨酶多肽包含与seq id no: 2中所示的氨基酸序列或其功能片段具有至少80%、85%、90%或95%序列同一性的氨基酸序列,其中氨基酸序列包含以下特征:至少一个选自氨基酸x3、x5、x48、x61、x69、x94、x97、x137、x140、x196、x199、x202、x269和x297的氨基酸被取代为与seqid no: 2中相应氨基酸位置处发现的氨基酸不同的氨基酸,并且其中公开了x124是异亮氨酸(i)。

345、在一个实施方案中,公开了转氨酶多肽,其包含与seq id no: 4、6、8、10、14、16、18或20中所示的氨基酸序列具有至少80%、85%、90%、95%或100%序列同一性的氨基酸序列。在一个实施方案中,公开了转氨酶多核苷酸,其包含与seq id no: 3、5、7、9、13、15、17或19中所示的多核苷酸序列具有至少80%、85%、90%、95%或100%序列同一性的多核苷酸序列。

346、在一个方面中,本发明提供了制备式i的不对称化合物的有效方法:

347、

348、i

349、其中:

350、r1为离去基团、卤素、受保护的氨基基团、-no2、或-oh或其受保护的形式;

351、r2为h;

352、r3为-coor5、-ch2r6或受保护的醛;或

353、r2和r3组合以形成

354、或;

355、r4为h或胺保护基团;

356、r5为c1-6烷基、c3-10环烷基、c4-10杂环基、芳基或杂芳基;且,

357、r6为离去基团或-oh或其受保护的形式;该方法包括使式ii的化合物与如本文公开的前述实施方案中任一种的工程化转氨酶多肽接触:

358、

359、ii

360、其中:

361、r1’为离去基团、卤素、受保护的氨基基团、no2、或oh或其受保护的形式;

362、r2′为醛或醛等同物;且

363、r3′为-coor5、-ch2r6或受保护的醛;或

364、r2′和r3′组合以形成

365、,其中*代表连接的点。

366、“烷基”表示具有指定数量的碳原子的饱和、直链或支链烃部分。术语“(c1-c6)烷基”是指含有1至6个碳原子的烷基部分。示例性烷基包括但不限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、戊基和己基。在一些实施方案中,“me”是指甲基基团。当术语“烷基”与其他取代基基团组合使用时,术语“烷基”旨在涵盖二价直链或支链烃基,其中连接的点通过烷基部分。

367、“芳基”是指单环或双环烃,芳香族基团。芳基包括例如苯基和萘基。芳基基团可含有6至14个碳原子。术语“杂芳基”是指包含芳香族单价单环或双环基团,含有5至10个环原子(包括至少一个独立地选自氮、氧和硫的杂原子)的基团或部分。该术语还包括双环杂环芳基化合物,其含有与杂环烷基环部分稠合的芳基环部分,含有5至10个环原子,包括至少一个独立地选自氮、氧和硫的杂原子。示例性基团包括但不限于呋喃基、噻吩基、吡咯基、咪唑基、吡唑基、三唑基、四唑基、噻唑基、噁唑基、异噁唑基、噁二唑基、噻二唑基、异噻唑基、吡啶基、哒嗪基、吡嗪基、嘧啶基、三嗪基、苯并呋喃基、异苯并呋喃基、2,3-二氢苯并呋喃基、1,3-苯并二氧杂环戊烯基(1,3-benzodioxolyl)、二氢苯并二氧杂环己烯基(dihydrobenzodioxinyl)、苯并噻吩基、吲哚嗪基、吲哚基、异吲哚基、二氢吲哚基、苯并咪唑基、二氢苯并咪唑基、苯并噁唑基、二氢苯并噁唑基、苯并噻唑基、苯并异噻唑基、二氢苯并异噻唑基、吲唑基、咪唑并吡啶基、吡唑并吡啶基、苯并三唑基、三唑并吡啶基、嘌呤基、喹啉基、四氢喹啉基、异喹啉基、四氢异喹啉基、喹喔啉基、噌啉基、酞嗪基、喹唑啉基、1,5-萘啶基、1,6-萘啶基、1,7-萘啶基、1,8-萘啶基和蝶啶基。5元“杂芳基”基团的实例包括呋喃基、噻吩基、吡咯基、咪唑基、吡唑基、三唑基、四唑基、噻唑基、噁唑基、异噁唑基、噁二唑基、噻二唑基和异噻唑基。6元“杂芳基”基团的实例包括氧代吡啶基、吡啶基、哒嗪基、吡嗪基和嘧啶基。6,6-稠合“杂芳基”基团的实例包括喹啉基、异喹啉基、喹喔啉基、噌啉基、酞嗪基、喹唑啉基、1,5-萘啶基、1,6-萘啶基、1,7-萘啶基、1,8-萘啶基和蝶啶基。6,5-稠合“杂芳基”基团的实例包括苯并呋喃基、苯并噻吩基、苯并咪唑基、苯并噻唑基、吲哚嗪基、吲哚基、异吲哚基和吲唑基。

368、术语“环烷基”是指含有指定数量的碳原子的非芳香族、饱和、单环、烃环。术语“(c3-c6)环烷基”是指具有三至六个环碳原子的非芳香族环状烃环。可用于本发明的示例性“(c3-c6)环烷基”基团包括环丙基、环丁基、环戊基和环己基。可用于本发明的“(c3-c6)环烷基(c1-c4)烷基-”基团的实例包括但不限于环丁基甲基、环戊基甲基、环己基甲基、环丁基乙基、环戊基乙基和环己基乙基。

369、“卤素”和“卤代”代表氟代、氯代、溴代或碘代取代基。

370、如本文所用,术语“杂环”或“杂环基”旨在指含有1至4个选自o、n和s的杂原子的3至10元芳香族或非芳香族杂环,并且包括双环基团。为了本发明的目的,术语“杂环”也被视为与术语“杂环”和“杂环基”同义,并理解为也具有本文所述的定义。因此,“杂环基”包括上述杂芳基及其二氢和四氢类似物。“杂环基”的进一步实例包括但不限于以下:氮杂环丁烷基、苯并咪唑基、苯并呋喃基、苯并呋咱基、苯并吡唑基、苯并三唑基、苯并噻吩基、苯并噁唑基、咔唑基、咔啉基、噌啉基、呋喃基、咪唑基、吲哚啉基、吲哚基、吲哚嗪基、吲唑基、异苯并呋喃基、异吲哚基、异喹啉基、异噻唑基、异噁唑基、萘吡啶基、噁二唑基、氧代噁唑烷基、噁唑基、噁唑啉、氧代哌嗪基、氧代吡咯烷基、氧代吗啉基、异噁唑啉、氧杂环丁烷基、吡喃基、吡嗪基、吡唑基、哒嗪基、吡啶并吡啶基、哒嗪基、吡啶基、嘧啶基、吡咯基、喹唑啉基、喹啉基、喹喔啉基、四氢吡喃基、四氢呋喃基、四氢硫代吡喃基、四氢异喹啉基、四唑基、四唑并吡啶基、噻二唑基、噻唑基、噻吩基、三唑基、1,4-二噁烷基、六氢氮杂环庚三烯基、哌嗪基、哌啶基、吡啶-2-酮基、吡咯烷基、吗啉基、硫代吗啉基、二氢苯并咪唑基、二氢苯并呋喃基、二氢苯并噻吩基、二氢苯并噁唑基、二氢呋喃基、二氢咪唑基、二氢吲哚基、二氢异噁唑基、二氢异噻唑基,二氢噁二唑基、二氢噁唑基、二氢吡嗪基、二氢吡唑基、二氢吡啶基、二氢嘧啶基、二氢吡咯基、二氢喹啉基、二氢四唑基、二氢噻二唑基、二氢噻唑基、二氢噻吩基、二氢三唑基、二氢氮杂环丁烷基、二氧化硫代吗啉基、亚甲基二氧基苯甲酰基、四氢呋喃基和四氢噻吩基,以及其n-氧化物。杂环基取代基的连接可通过碳原子或杂原子发生。

371、“羟基(hydroxy)”或“羟基(hydroxyl)”旨在指基团-oh。

372、“离去基团”被定义为本领域技术人员能够理解的术语;即碳上的基团,其中反应后会形成新的键,并且在新的键形成后碳会失去该基团。使用合适的离去基团的典型实例是亲核取代反应,例如在sp3杂化碳(sn2或sn1)上,例如,当离去基团是卤化物(如溴化物)时,反应物可能是苄基溴。这种反应的另一个典型实例是亲核芳香取代反应(snar)。另一个实例是插入反应(例如通过过渡金属)到带有离去基团的芳香反应伙伴之间的键中,然后进行还原偶联。“离去基团”不限于这种机理限制。合适的离去基团的实例包括卤素(氟、氯、溴或碘)、任选取代的芳基或烷基磺酸酯、膦酸酯、叠氮化物和—s(o)0-2r,其中r是例如任选取代的烷基、任选取代的芳基或任选取代的杂芳基。有机合成领域的技术人员将容易地识别合适的离去基团以在不同反应条件下进行期望的反应。离去基团的非限制性特征和实例可以例如在organic chemistry, 2nd ed., francis carey (1992), 第328-331页;introduction to organic chemistry, 2d ed., andrew streitwieser and claytonheathcock (1981), 第169-171页; 和organic chemistry, 5th ed., john mcmurry,brooks/cole publishing (2000), 第398和408页中找到。

373、“保护基团”是指当与分子中的反应性官能团连接时,掩蔽、降低或阻止官能团的反应性的原子的组。通常,在合成的过程期间,可以根据需要选择性地去除保护基团。保护基团的实例可以在wuts和greene, “greene's protective groups in organicsynthesis,” 4th ed., wiley interscience (2006), 和harrison等人, compendium ofsynthetic organic methods, vols. 1-8, 1971-1996, john wiley & sons, ny中找到。可以具有保护基团的官能团包括但不限于羟基、氨基和羧基基团。

374、代表性的胺保护基团包括但不限于甲酰基、乙酰基(ac)、三氟乙酰基、苄基(bn)、苯甲酰基(bz)、氨基甲酸酯、苄基氧基羰基(“cbz”)、对甲氧基苄基羰基(moz或meoz)、叔丁氧基羰基(“boc”)、三甲基硅烷基(“tms”)、2-三甲基硅烷基-乙磺酰基(“ses”)、三苯甲基和取代的三苯甲基基团、烯丙氧基羰基、9-芴基甲基氧基羰基(“fmoc”)、硝基-藜芦基氧基羰基(“nvoc”)、对甲氧基苄基(pmb)、甲苯磺酰基(ts)等。

375、代表性羟基保护基团包括但不限于甲磺酸酯(so2me)、其中羟基基团被酰化(例如甲基和乙基酯、乙酸酯或丙酸酯基团或乙二醇酯)或烷基化的那些,例如苄基和三苯甲基醚,以及烷基醚、四氢吡喃基醚、三烷基硅基醚(例如tms或tips基团)和烯丙基醚。其他保护基团可在本文提及的参考文献中找到。

376、“受保护的醛”定义为本领域技术人员所理解的术语;即,醛被基团保护,使得其在测定条件下可转化为未保护的醛。受保护的醛的实例包括但不限于可通过用酸(有机酸或无机酸)处理转化为游离醛基团的缩醛或半缩醛,例如与多元醇(例如丙二醇或乙二醇)形成的缩醛基团,或在糖或糖相关化合物(例如醛糖,例如葡萄糖或半乳糖)中的半缩醛基团。受保护的醛的进一步实例是亚氨基基团(例如═nh基团),其在用酸处理后产生醛基团;硫缩醛或二硫缩醛基团(例如c(sr)2基团,其中r可以是烷基基团),其在用汞盐处理后产生醛基团;肟基团(例如,═noh基团),其在用酸处理后产生醛基团;腙基团(例如,═n—nhr基团,其中r可以是烷基基团),其在用酸处理后产生醛基团;以及咪唑酮或咪唑烷基团或苯并噻唑或二氢苯并噻唑基团,其在例如用酸等水解后产生醛。

377、实施例

378、根据上述教导,本公开的许多修改和变化是可能的。因此,应理解,在所附权利要求的范围内,本领域技术人员将认识到本发明可以以不同于具体描述的方式实施。说明性实施方案和实施例不应被解释为限制本发明。

379、实施例1:工程化转氨酶多肽的合成和优化

380、本公开的seq id no: 1的dna序列和seq id no: 2的多肽序列对应于2014年6月12日公开的wo 2014/088984 a1的seq id no: 179的dna序列和seq id no: 180的多肽序列。seq id no: 2的工程化转氨酶多肽相对于野生型节杆菌属knk168多肽序列(genbank登录号:bak39753.1; gi:336088341)具有以下28个氨基酸差异: a2s;a5h;s8p、y60f、l61y、h62t、v65a、d81g、m94i、i96l、f122i、s124i、g136w、a169l、v199i、a209l、g215f、g217n、s223p、l269p、l273y、t282s、a284g、p297s、i306v、和s321p。

381、将seq id no: 1克隆到pck110900载体系统中(参见例如,美国专利申请公开号2006/0195947 a1),该系统在lac启动子的控制下。该表达载体还含有pl5a复制起点和氯霉素抗性基因。使用标准方法将所得质粒转化到大肠杆菌w3110中,并按照实施例2中所述进行表达。

382、实施例2:用于鉴定能够将乳醇底物转化为胺的节杆菌属氨基转移酶的变体的高通量筛选。

383、a) 突变体库的库制备

384、对如实施例1所述构建的编码节杆菌属氨基转移酶的基因(seq id no: 1)进行诱变,并使用改变的dna分子群体来转化合适的大肠杆菌宿主菌株。

385、b) 突变体库的高通量生长和表达

386、使用q-pix分子装置机器人菌落拾取器(genetix usa, inc., boston, ma)将携带编码氨基转移酶的基因的重组大肠杆菌菌落拾取到96孔浅孔微量滴定板中,每个孔中含有180μl lb液体培养基、1%葡萄糖和30 µg/ml氯霉素(cam)。将板用透气尼龙密封件密封,并将细胞在30°c和85%湿度伴随着在200 rpm摇动生长过夜。然后将该培养物的20μl等分试样转移到含有380μl 2xyt液体培养基和30μg/ml cam的96深孔板(补充有100µl吡哆醇)中。同样,将板用透气尼龙密封件密封。在将深孔板在30°c和85%湿度伴随着在250 rpm摇动孵育2-3小时后,通过添加iptg至1mm的最终浓度来诱导培养细胞内的重组基因表达。然后将板在30°c和85%湿度伴随着在250 rpm摇动孵育18 hr。通过离心(3738 rcf, 10 min, 4°c)使细胞沉淀,并将沉淀物在-80c冷冻至少2小时。

387、c) 突变体库的高通量测定筛选用于鉴定改善的变体

388、选择并处理抗生素抗性的转化子,以鉴定具有在期望的反应条件下进行下述反应的改进的能力的表达氨基转移酶的那些转化子。

389、方案1:通用合成

390、

391、将细胞沉淀物在室温解冻30-120分钟。将沉淀物重悬于200μl含有缓冲液、1g/l溶菌酶和0.5g/l硫酸多粘菌素b和0.25g/l 5'-磷酸吡哆醛(plp)的裂解溶液中。裂解溶液的缓冲液和ph根据筛选条件而变化(参见表3)。

392、表3. 裂解缓冲液

393、

394、在将板用透气尼龙密封件密封后,将它们在室温剧烈摇动2小时。通过离心(3738rcf, 10 min., 4°c)沉淀细胞碎片,并将清澈的上清液直接测定或储存在4°c直至使用。对于工程化氨基转移酶的筛选,底物制备如下:将异丙胺的ph调节至在水中的目标ph条件,并将乳醇和吗啉溶解在dmso体积中以在稀释后达到目标共溶剂条件。对于所有板,将dmso中的乳醇和异丙胺分别加入圆底浅孔板中,并通过添加裂解物稀释至最终浓度以开始反应。将板用铝/聚丙烯层压热密封胶带在165°c热密封3秒,并在650rpm(infors thermotron)孵育20小时。突变体的条件总结如下。按照实施例3中所述准备反应以供分析。

395、表4. 每种转氨酶变体所用的条件

396、

397、·变体1(seq id no: 4):10%裂解物、30g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1m异丙胺(ph8.5)、5% dmso、5eq.吗啉、45°c

398、·变体2(seq id no: 6):10%裂解物、30g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1m异丙胺(ph8.5)、5% dmso、0.05eq.吗啉、45°c

399、·变体3(seq id no: 8):25%裂解物、50g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1m异丙胺(ph8.5)、20% dmso、0.05eq.吗啉、45°c

400、·变体4(seq id no: 10):20%裂解物、50g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、0.38m异丙胺(ph9.5)、20% dmso、0.05eq.吗啉、45°c

401、·变体5(seq id no: 12):30%裂解物、30g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1.6m异丙胺(ph9.5)、30% dmso、0.05eq.吗啉、25°c

402、·变体6(seq id no: 14):20%裂解物、30g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1.6m异丙胺(ph8.5)、30% dmso、0.05eq.吗啉、25°c

403、·变体7(seq id no: 16):10%裂解物、50g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1.6m异丙胺(ph8.5)、30% dmso、0.05eq.吗啉、40°c

404、·变体8(seq id no: 18):5%裂解物、50g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1.6m异丙胺(ph8.5)、30% dmso、0.05eq.吗啉、40°c

405、·变体9(seq id no: 20):5%裂解物、50g/l 3-(4-溴苯基)四氢-2h-吡喃-2-醇、1.6m异丙胺(ph8.5)、30% dmso、0.05eq.吗啉、40°c

406、在较高ph运行的反应允许更好地缓冲反应,但也具有较慢的反应速率。在这些条件下无法检测到在突变体中不期望的选择性。出乎意料的是,在ph 7.5-8.5之间运行的反应表明,具有在位置i124(特别是i124h-参见变体5)处的任何变化的突变体具有显著降低的选择性。因此,ph耐受性筛选条件恢复为ph8.5,并通过提高共溶剂浓度进行耐受性测试。

407、实施例3:转氨酶粉末的生产-摇瓶程序

408、将含有编码感兴趣的转氨酶的质粒的大肠杆菌单个微生物菌落接种到含有30 µg/ml氯霉素和1%葡萄糖的50 ml luria bertoni液体培养基中。细胞在30°c的培养箱中伴随着在250 rpm摇动生长过夜(至少16小时)。

409、将培养物稀释到含有30 µg/ml氯霉素(补充有0.1mm吡哆醇)的1000 ml 2xyt中以得到0.2的大概od600,并允许在30°c伴随着在250 rpm摇动生长。当培养物的od600为0.6至0.8时,通过添加异丙基β d-硫代半乳糖苷(iptg)至1 mm的最终浓度来诱导氨基转移酶的表达。然后继续孵育过夜(至少16小时)。

410、通过离心(3738 rcf, 20 min, 4°c)收获细胞并弃去上清液。将沉淀物在-80°c冷冻至少2小时。然后解冻沉淀物并以每克最终沉淀物质量3 ml 100mm磷酸钾缓冲液(ph7.5,补充有500µm plp)的比例重新悬浮(例如,10g冷冻沉淀物悬浮在30ml缓冲液中)。

411、重新悬浮后,细胞通过200um网孔过滤,然后以12000psig通过微流化器两次。通过离心(15,777 rcf, 40min, 4°c)去除细胞碎片。收集澄清的裂解物上清液,合并并冻干,以提供粗品氨基转移酶的干粉。

412、实施例4:转氨酶粉末的生产-发酵工序

413、将等分试样的冷冻的工作原液(含有具有感兴趣的氨基转移酶基因的质粒的大肠杆菌)从冰箱中取出,并在室温解冻。将300µl的该工作原液接种到在1l烧瓶中含有30μg/ml氯霉素和1%葡萄糖的250ml m9ye液体培养基(1.0 g/l氯化铵、0.5 g/l氯化钠、6.0 g/l磷酸氢二钠、3.0 g/l磷酸二氢钾、2.0 g/l procelys springer 0251酵母提取物、1 l/l去离子水)的初级种子阶段,并允许在37°c伴随着在200 rpm摇动生长。当培养物的od600为0.5到1.0时,将烧瓶从培养箱中取出并立即用于接种次级种子阶段。

414、次级种子阶段在实验室规模的5l发酵罐中使用4l生长培养基(0.88 g/l硫酸铵、0.98 g/l柠檬酸三钠二水合物;12.5 g/l磷酸氢二钾、6.25g/l磷酸二氢钾、3.3 g/lprocelys springer 0251酵母提取物、0.083 g/l柠檬酸铁铵、0.5 ml/l聚丙二醇消泡剂和8.3 ml/l微量元素溶液、1l/l工艺水。微量元素溶液含有2 g/l氯化钙二水合物、2.2 g/l硫酸锌七水合物、0.5 g/l硫酸锰一水合物、1 g/l硫酸铜五水合物、0.1 g/l钼酸铵四水合物和0.02 g/l四硼酸钠十水合物、1l/l去离子水)进行。生长培养基在121°c灭菌40分钟。灭菌后添加40ml/l的饲料原液(饲料原液含12g/l硫酸铵、5.1g/l硫酸镁七水合物、500g/l右旋糖一水合物、1l/l工艺水,在121°c灭菌30分钟)。发酵罐用2ml od600 0.5–1.0初级种子接种并用30μg/ml氯霉素补充,在37°c、300rpm和0.5vvm通气条件孵育。当培养物的od600为0.5–1.0时,立即将次级种子转移至最后阶段发酵。

415、最后阶段发酵在实验室规模在10l发酵罐中使用6l生长培养基(0.88 g/l硫酸铵、0.98 g/l柠檬酸三钠二水合物、12.5 g/l磷酸氢二钾、6.25g/l磷酸二氢钾、3.3 g/lprocelys springer 0251酵母提取物、0.083 g/l柠檬酸铁铵、0.5 ml/l聚丙二醇消泡剂和8.3 ml/l微量元素溶液、1l/l工艺水。微量元素溶液含有2 g/l氯化钙二水合物、2.2 g/l硫酸锌七水合物、0.5 g/l硫酸锰一水合物、1 g/l硫酸铜五水合物、0.1 g/l钼酸铵四水合物和0.02 g/l四硼酸钠十水合物、1l/l去离子水)进行。生长培养基在121°c灭菌40分钟。灭菌后生长培养基用0.035 g/l盐酸吡哆醇和40 ml/l饲料原液(饲料原液含有12g/l硫酸铵、5.1g/l硫酸镁七水合物、500g/l右旋糖一水合物、1l/l工艺水,在121°c灭菌30分钟)补充。

416、发酵罐用500ml od600 0.5–1.0次级种子接种,并在30°c和1.5vvm通气条件孵育。通过可变速度搅动将溶解氧控制在30%,通过添加17.5% v/v氢氧化铵溶液将ph保持在7.0。通过添加饲料原液(12g/l硫酸铵、5.1g/l硫酸镁七水合物、500g/l葡萄糖一水合物、1l/l工艺用水,在121°c灭菌30分钟)来维持培养物的生长。在培养物达到80+/-10的od600后,添加异丙基-β-d-硫代半乳糖苷(iptg)到1mm的最终浓度。继续发酵持续另外的18小时。在收获时将培养物冷却至8°c。通过在sorvall rc12bp离心机中在4°c以5000 g离心40分钟收集细胞。然后将收获的细胞沉淀物在-80°c冷冻并储存直至下游处理和回收。

417、收获lyo粉末

418、用磷酸氢二钾6.88g/l和磷酸二氢钾1.43g/l将发酵液体培养基缓冲至ph 7.3-7.5。一旦盐溶解并达到目标ph范围,就通过机械裂解将液体培养基均质化。将聚乙烯亚胺硫酸盐(mn ~60,000, mw 750,000)添加到裂解物中到<0.6%w/w的最终浓度(所需絮凝剂的量通过离线滴定确定)。通过离心澄清絮凝剂处理的裂解物,丢弃固相,并保留澄清的裂解物上清液。通过切向流过滤通过30kda mwco膜将澄清的裂解物浓缩~10倍。然后将5'-磷酸吡哆醛(plp)添加到浓缩物中,添加的质量与起始发酵液体培养基体积是成比例的,每l发酵液体培养基0.08g plp。然后将plp浓缩物冻干。然后将冻干材料研磨成均匀的粉末。

419、实施例5:用于鉴定能够将乳醇底物转化为胺的节杆菌属氨基转移酶变体的高通量分析方法。-

420、a)非手性分析

421、在反应过夜后,从培养箱中取出板,去除密封件,并用等效体积的乙腈稀释反应。用铝/聚丙烯层压热密封胶带在165°c对板进行热密封4秒,摇动10 min,然后在3738 rcf离心10 min以沉淀碎片。将每孔20ul的2倍稀释的上清液在新的浅孔聚丙烯板中在50%乙腈的水溶液中进一步稀释10倍或20倍(分别用于30g/l或50g/l反应)。将板再次密封、混合,并通过下文所述的uplc进行分析。

422、b)非手性uplc法定性地确定胺产物

423、使用配备有agilent zorbax sb-c18 rrhd柱(3.0 x 50 mm, 1.8μm)的agilent1290 uplc使用0.05%三氟乙酸的水溶液(流动相a)和0.05%三氟乙酸的乙腈溶液(流动相b)的梯度以2ml/min的流速以60°c的柱温确定乳醇底物(3-(4-溴苯基)四氢-2h-吡喃-2-醇)酶促转化为胺产物(参见方案1)。梯度曲线如下所示。

424、表5. 梯度曲线

425、

426、在214nm处监测化合物洗脱,dmso在~0.125min处洗脱,随后胺产物在~0.55min处洗脱,并且乳醇在~0.89 min处洗脱。四个小杂质峰在起始材料和胺产物之间洗脱。

427、c) 通过marfey试剂对胺产物进行衍生化:

428、制备1% marfey试剂(10g/l于乙腈中)。将每孔20ul按照实施例3b中所述制备的2倍稀释的上清液转移到新的96深孔板中,然后加入30µl 1 m nahco3,然后加入200µl 1%marfey试剂。将板密封并在40°c、850rpm(infors thermotron)孵育1小时。通过添加等体积1:9 2n hcl:乙腈来淬灭衍生化。将板混合5分钟,然后在3738 rcf离心10 min以沉淀碎片。去除密封,并将40µl上清液转移到在新的浅孔聚丙烯板中的160µl乙腈中。将板再次密封、混合并通过uplc分析。

429、d)手性uplc方法定性地确定胺产物的选择性

430、使用配备有agilent zorbax sb-c18 rrhd柱(3.0 x 50 mm, 1.8µm)的agilent1290 uplc使用0.05%三氟乙酸的水溶液(流动相a)和0.05%三氟乙酸的乙腈溶液(流动相b)的梯度以2ml/min的流速以60°c的柱温确定产物对映体的高通量定量。梯度曲线如下所示。

431、表6. 梯度曲线

432、

433、在340nm处监测化合物洗脱,期望产物在~4.89 min处洗脱,并且不期望的产物在~5.15 min处洗脱。

434、表7. 相对活性数据

435、

436、表8. 在每个变体中活性氨基酸突变的总结

437、

438、表7提供了除携带位置i124的突变的变体5外,所有变体均表现出增加的活性,同时保持大于99% e.e.的选择性。这对本公开的发明者来说是令人惊讶和预料不到的,因为在位置i124的任何变化(特别是i124h-参见变体5)都具有显著损失的选择性。当引入i124h取代时,在所有测试的样品变体中都存在这种选择性的损失(参见表9)。

439、表9. 在位置i124处的氨基酸取代对选择性的影响

440、

441、对映选择性的高通量表征的筛选条件(表8)与实施例2中描述的不同。反应未进展到完成,因此对映选择性无法定量,并且差异可在表7中报告的值中看出。反应足以检测到对映选择性的扰动,从而能够选择替代的变体来进展。

442、方案2:尼拉帕尼的合成

443、

444、

445、

446、

447、实施例6:化学过程。

448、1)化合物4的制备

449、阶段1a:向在25°c的异丙胺盐酸盐在水中的搅拌溶液添加1m氢氧化钠水溶液以调节ph至8.5。添加冻干的转氨酶并搅拌至少15分钟。将化合物1在dmso中的溶液添加到混合物中。用1m氢氧化钠水溶液将ph调节至8.6。然后将混合物加热至44°c并搅拌21小时。将反应冷却至25°c并使用浓hcl水溶液将ph调节至ph2并搅拌1.5小时以使酶变性。

450、阶段1b:向在阶段1a得到的搅拌溶液中添加k2hpo4,然后添加液体boc酸酐。继续搅拌。添加水,随后添加tbme,然后将其搅拌至少10分钟,然后静置。除去分离的水层。添加纤维素,并搅拌至少15 min,然后过滤。用tbme洗涤酶滤饼,然后丢弃固体。用水洗涤合并的有机物两次,每次都去除分离的水层。在真空下将有机溶液浓缩至约5 vol,然后将溶剂切换为乙腈。

451、阶段1c:将dipea添加到溶液中,冷却至0°c,并在1小时内添加甲磺酰氯,同时将内容物温度保持在≤5°c。在最后添加后,将混合物搅拌至少30分钟。添加异丙醇,并将内容物温度调节至20°c,然后在至少10分钟内添加水。将混合物用化合物4进行接种并陈化2小时。在至少1.5小时内添加水,搅拌至少2小时并过滤至干燥的表面(dry land)。依次用两次异丙醇/水(1:1v/v)饼洗涤液洗涤滤饼,然后用预冷异丙醇洗涤,并最后用庚烷洗涤。将滤饼脱液并在55°c的真空烘箱中干燥。

452、2) 化合物8的制备

453、阶段2a:化合物5的制备。伴随着搅拌将甲苯加入在25±5°c的反应器中。将化合物7加入反应器中,然后加入叔丁醇钾。在25±5°c搅拌混合物直至反应完成。

454、阶段2b:化合物8的制备。将磷酸三钾(k3po4)、化合物6和溴化铜(i)加入反应器,然后加入反式-n1,n2-二甲基环己烷-1,2-二胺(dmcyda)。将混合物加热至回流(105±10°c)并在此温度搅拌直至反应完成。将混合物冷却至45±5°c,然后加入乙酸乙酯,然后加入水和20%v/v nh3水溶液。分离各层,然后将水和20% v/v nh3水溶液添加到有机层。分离各层。通过蒸馏浓缩有机层,然后在45±5°c进行接种。将混合物陈化,然后添加庚烷。将所得浆液冷却至0±5°c并陈化nlt 16 hr。过滤混合物,然后用甲苯/etoac/庚烷混合物洗涤滤饼。将产物在60±5°c在真空下干燥,得到化合物8。

455、3)化合物9的制备

456、在至少3小时内将甲磺酸(msoh)添加到化合物8在甲苯中的浆液中,同时保持温度低于40°c。将所得双相溶液在38±5°c搅拌3小时。然后将反应器内容物冷却至0±5°c。添加水,同时保持温度低于30°c。然后分离水相和有机相。用甲苯洗涤水相,然后过滤。将一部分对甲苯磺酸的溶液添加到滤液中,然后接种化合物9(通过本文描述的相同方法制成)。在20±5°c添加剩余的对甲苯磺酸溶液,然后将浆液冷却并在0±5°c搅拌nlt 4小时。过滤浆液,通过四次水/methf(9:1 v/v)饼洗涤液洗涤,然后在ngt 40°c在真空下干燥滤饼。

457、4)化合物9的纯化

458、将化合物9添加到dmso中并加热至33°c以溶解。在2小时内伴随着搅拌将此溶液加入水中。保持一小时后,将悬浮液湿磨。将所得悬浮液加热至65°c并保持七小时,然后冷却至5°c。分离浆液并使用水洗涤。材料在高达40°c的周期性搅动下干燥。

459、当甲磺酸添加到化合物8在甲苯中的浆液中时,杂质(化合物10)作为阶段3化学反应中的副产物形成。

460、

461、控制化合物10在尼拉帕尼甲苯磺酸盐一水合物药物底物中不超过0.10% w/w。

462、实施例7:结构表征

463、7.1. 化合物1

464、

465、化合物1(结晶固体)的结构已通过质谱和nmr波谱分析确定。

466、lcms (2.0 min asap): rt = n/a, [mh]- = 255.0026

467、1h nmr (氯仿-d, 700 mhz): δ (ppm) 7.41 - 7.48 (m, 3h), 7.20 (d, j=8.4hz, 1h), 7.14 (d, j=8.4 hz, 2h), 6.45 - 6.46 (m, 1h), 5.20 (d, j=2.7 hz, 1h),4.76 (d, j=7.9 hz, 1h), 4.10 (td, j=4.5, 2.5 hz, 1h), 3.61 - 3.66 (m, 1h),3.42 - 3.42 (m, 1h), 2.95 (dt, j=12.4, 3.1 hz, 1h), 2.59 (ddd, j=11.4, 7.7,4.1 hz, 1h), 1.98 - 2.07 (m, 1h), 1.78 - 1.82 (m, 1h), 1.75 (br s, 1h), 1.70- 1.77 (m, 1h), 1.68 - 1.75 (m, 1h), 1.62 - 1.66 (m, 1h).

468、7.2. 化合物11

469、

470、化合物11(结晶固体)的结构已通过质谱和nmr波谱分析确定。

471、lcms (5.5 min三氟乙酸): rt = 2.33 min, [mh]+ = 436.0786

472、1h nmr (dmso-d6, 700 mhz): δ (ppm) 7.46 - 7.50 (m, j=8.3 hz, 2h), 7.14- 7.16 (m, j=8.4 hz, 2h), 6.80 (br t, j=5.7 hz, 1h), 4.09 - 4.14 (m, 2h),3.12 (s, 4h), 3.02 - 3.09 (m, 1h), 2.70 - 2.77 (m, 1h), 1.67 - 1.78 (m, 1h),1.46 - 1.56 (m, 2h), 1.36 - 1.45 (m, 1h), 1.32 (s, 9h)

473、7.3. 化合物12

474、

475、化合物12(结晶固体)的结构已通过质谱和nmr波谱分析确定。

476、lcms (5.5 min三氟乙酸): rt = 3.01 min, [mh]+ = 477.2869

477、1h nmr (氯仿-d, 700 mhz): δ (ppm) 9.90 (br s, 1h), 8.54 (s, 1h), 8.21(d, j=7.1 hz, 1h), 7.91 (d, j=8.3 hz, 1h), 7.83 (d, j=8.4 hz, 2h), 7.44 (d, j=8.4 hz, 2h), 7.26 - 7.30 (m, 1h), 4.22 (br d, j=12.2 hz, 1h), 4.16 (br dd, j=13.4, 1.0 hz, 1h), 2.84 - 2.87 (m, 1h), 2.82 - 2.89 (m, 1h), 2.78 - 2.85 (m,1h), 2.11 (br d, j=12.7 hz, 1h), 1.86 (dt, j=13.3, 2.9 hz, 1h), 1.72 (br dd,j=11.9, 3.0 hz, 1h), 1.64 (dt, j=12.9, 3.7 hz, 1h), 1.60 (s, 9h), 1.50 (s,9h).

478、7.4. 化合物13

479、

480、化合物13(结晶固体)的结构已通过质谱和nmr波谱分析确定。

481、lcms (50 min三氟乙酸): rt = 17.0 min, [mh]+ = 321.1711

482、1h nmr (dmso-d6, 700 mhz): δ (ppm) 7.46 - 7.50 (m, j=8.3 hz, 2h), 7.14- 7.16 (m, j=8.4 hz, 2h), 6.80 (br t, j=5.7 hz, 1h), 4.09 - 4.14 (m, 2h),3.12 (s, 4h), 3.02 - 3.09 (m, 1h), 2.70 - 2.77 (m, 1h), 1.67 - 1.78 (m, 1h),1.46 - 1.56 (m, 2h), 1.36 - 1.45 (m, 1h), 1.32 (s, 9h).

483、序列的简要描述

484、seq id no 1:节杆菌属转氨酶的工程化变体(对照)的dna序列

485、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgccgtctgaagctcgtatctctatcttcgaccagggtttttatacttctgacgctacctacaccgtcttccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatctattcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgtcgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgatccgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggctgacatcaccccggctgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaactctatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

486、seq id no 2:节杆菌属转氨酶的工程化变体(对照)的蛋白质序列

487、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvppsearisifdqgfytsdatytvfhvwngnafrlgdhierlfsnaesirlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdliraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnsisdgvpgpvtqsiirrywelnvepsslltpvqy

488、seq id no 3: 节杆菌属转氨酶的工程化变体(变体1)的dna序列

489、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgccgtctgaagctcgtatctctatcttcgaccagggtttttgtacttctgacgctacctacaccgtcttccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatctattcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgtcgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgatccgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggctgacatcaccccggctgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaactctatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

490、seq id no 4: 节杆菌属转氨酶的工程化变体(变体1)的蛋白质序列

491、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvppsearisifdqgfctsdatytvfhvwngnafrlgdhierlfsnaesirlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdliraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnsisdgvpgpvtqsiirrywelnvepsslltpvqy

492、seq id no 5: 节杆菌属转氨酶的工程化变体(变体2)的dna序列

493、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggtttttgtacttctgacgctacctacacctgcttccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggctgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

494、seq id no 6: 节杆菌属转氨酶的工程化变体(变体2)的蛋白质序列

495、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfctsdatytcfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

496、seq id no 7: 节杆菌属转氨酶的工程化变体(变体3)的dna序列

497、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttaatacttctgacgctacctacacctgcttccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggctgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

498、seq id no 8: 节杆菌属转氨酶的工程化变体(变体3)的蛋白质序列

499、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfntsdatytcfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

500、seq id no 9: 节杆菌属转氨酶的工程化变体(变体4)的dna序列

501、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttaatacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

502、seq id no 10: 节杆菌属转氨酶的工程化变体(变体4)的蛋白质序列

503、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfntsdatyttfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

504、seq id no 11: 节杆菌属转氨酶的工程化变体(变体5)的dna序列

505、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttaatacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttcatgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

506、seq id no 12: 节杆菌属转氨酶的工程化变体(变体5)的蛋白质序列

507、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfntsdatyttfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivhvsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

508、seq id no 13: 节杆菌属转氨酶的工程化变体(变体6)的dna序列

509、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttatgacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatgggagcgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

510、seq id no 14: 节杆菌属转氨酶的工程化变体(变体6)的蛋白质序列

511、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfmtsdatyttfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwerditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

512、seq id no 15: 节杆菌属转氨酶的工程化变体(变体7)的dna序列

513、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttatgacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttatcgtttctatcacccgtggttactcttctaccccatggacacgtgacatcaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggatcgtaccgtttgaccgcatccgtgacggtgttcacctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaattcaggaaacccacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

514、seq id no 16: 节杆菌属转氨酶的工程化变体(变体7)的蛋白质序列

515、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfmtsdatyttfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwtrditkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrraiqethdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

516、seq id no 17: 节杆菌属转氨酶的工程化变体(变体8)的dna序列

517、atgagcttctcacatgacacccctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttatgacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggggaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttgatcccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttattgtttctatcacccgtggttactcttctaccccatggacacgcgaccaaaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggattgtaccgtttgaccgcatccgtgacggtgttcatctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaacccaggaatgtcacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccccggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

518、seq id no 18: 节杆菌属转氨酶的工程化变体(变体8)的蛋白质序列

519、msfshdtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfmtsdatyttfhvwngnafrlgdhierlfsnaescrlippltqdevkeialelvaktelreaivivsitrgysstpwtrdqtkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrratqechdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditpaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

520、seq id no 19: 节杆菌属转氨酶的工程化变体(变体9)的dna序列

521、atgagccactcaattgacacacctgaaatcgtttacacccacgacaccggtctggactatatcacctactctgactacgaactggacccggctaacccgctggctggtggtgctgcttggatcgaaggtgctttcgttccgagatctgaagctcgtatctctatcttcgaccagggttttatgacttctgacgctacctacaccacattccacgtttggaacggtaacgctttccgtctgggtgaccacatcgaacgtctgttctctaatgcggaatcttgtcgtttggagccgccgctgacccaggacgaagttaaagagatcgctctggaactggttgctaaaaccgaactgcgtgaagcgatcgttattgtttctatcacccgtggttactcttctaccccatggacacgcgaccaaaccaaacatcgtccgcaggtttacatgtatgctgttccgtaccagtggattgtaccgtttgaccgcatccgtgacggtgttcatctgatggttgctcagtcagttcgacgtacaccgcgtagctctatcgacccgcaggttaaaaacttccagtggggtgacctgagacgtgcaacccaggaatgtcacgaccgtggtttcgagttaccgctgctgctggacttcgacaacctgctggctgaaggtccgggtttcaacgttgttgttatcaaagacggtgttgttcgttctccgggtcgtgctgctctgccgggtatcacccgtaaaaccgttctggaaatcgctgaatctctgggtcacgaagctatcctggccgacatcaccgtggccgaactgtacgacgctgacgaagttctgggttgctcaaccggtggtggtgtttggccgttcgtttctgttgacggtaaccgcatctctgacggtgttccgggtccggttacccagtctatcatccgtcgttactgggaactgaacgttgaaccttcttctctgctgaccccggtacagtac

522、seq id no 20: 节杆菌属转氨酶的工程化变体(变体9)的蛋白质序列

523、mshsidtpeivythdtgldyitysdyeldpanplaggaawiegafvprsearisifdqgfmtsdatyttfhvwngnafrlgdhierlfsnaescrleppltqdevkeialelvaktelreaivivsitrgysstpwtrdqtkhrpqvymyavpyqwivpfdrirdgvhlmvaqsvrrtprssidpqvknfqwgdlrratqechdrgfelpllldfdnllaegpgfnvvvikdgvvrspgraalpgitrktvleiaeslgheailaditvaelydadevlgcstgggvwpfvsvdgnrisdgvpgpvtqsiirrywelnvepsslltpvqy

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1