用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法_3

文档序号:9344300阅读:来源:国知局
催化原儿茶 酸的-OH基团的甲基化,其中所述甲基化导致产生与异香草酸相比至少4倍多的香草酸, 优选地与异香草酸相比至少5倍多的香草酸,例如与异香草酸相比至少10倍多的香草酸, 例如与异香草酸相比至少15倍多的香草酸,例如与异香草酸相比至少20倍多的香草酸,例 如与异香草酸相比至少25倍多的香草酸,例如与异香草酸相比至少30倍多的香草酸;并且 其具有的氨基酸序列与SEQ ID N0 :27具有至少一个氨基酸的差别。
[0074] 除了上面提到的性质之外,优选地突变体C0MT多肽还能够催化原儿茶醛的-OH 基团的甲基化,其中所述甲基化导致产生与异香草醛相比至少4、5、10、15、20、25或30倍多 的香草醛;和/或能够催化原儿茶醇的-OH基团的甲基化,其中所述甲基化导致产生与异 香草醇相比至少4、5、10、15、20、25或30倍多的香草醇。
[0075] 为了确定给定的突变体C0MT多肽是否能够催化原儿茶酸的-OH基团的甲基化, 其中所述甲基化导致产生与异香草酸相比至少X倍多的香草酸,可以执行体外测定法。在 这样的测定法中,将原儿茶酸与突变体C0MT多肽在甲基供体的存在下温育,然后测定产生 的异香草酸和香草酸的水平。所述甲基供体可以是例如S-腺苷甲硫氨酸。更优选地,这可 以通过产生带有编码待测试的突变体C0MT多肽的异源核酸的重组宿主来测定,其中所述 重组宿主还能够生产原儿茶酸。在培养重组宿主后,可以测定产生的异香草酸和香草酸的 水平。与这种方法相关,编码待测试的突变体C0MT多肽的所述异源核酸优选地可操作地连 接到允许在所述重组宿主中表达的调控区。此外,优选地,重组宿主表达至少一种3DSD和 至少一种ACAR,其优选地可以是本文中描述的3DSD和ACAR之一。在重组宿主表达能够催 化香草酸向香草醛的转化的ACAR的实施方式中,则所述方法也可以包括测定产生的香草 醛和异香草醛的水平。重组宿主也可以表达能够催化香草醛和异香草醛的葡萄糖基化的至 少一种UGT,在这种情况下,代替香草醛和异香草醛的水平,可以分别测定香草醛-葡萄糖 苷和异香草醛-葡萄糖苷的水平。或者,这可以通过产生带有编码待测试的突变体COMT多 肽的异源核酸的重组宿主,并将原儿茶酸进料到所述重组宿主,然后测定产生的异香草酸 和香草酸的水平,来测定。
[0076] 同样地,可以使用体外测定法或重组宿主细胞来确定突变体C0MT多肽是否能够 催化原儿茶醛的-0H基团的甲基化,其中所述甲基化导致产生与异香草醛相比至少X倍多 的香草醛。然而,在这种测定法中,使用原儿茶醛作为起始原料,并测定香草醛和异香草醛 的水平。
[0077] 同样地,可以使用体外测定法或重组宿主细胞来确定给定的突变体C0MT多肽是 否能够催化原儿茶醇的-OH基团的甲基化,其中所述甲基化导致产生与异香草醇相比至 少X倍多的香草醇。然而,在这种测定法中,使用原儿茶醇作为起始原料,并测定香草醇和 异香草醇的水平。
[0078] 异香草醛和香草醛的水平可以通过可用于检测这些化合物的任何适合的方法来 测定,其中所述方法可以辨别异香草醛和香草醛。这样的方法包括例如HPLC。同样地,异香 草酸、香草酸、异香草醇和香草醇的水平可以通过可用于检测这些化合物的任何适合的方 法来测定,其中所述方法可以辨别异香草醛和香草醛。这样的方法包括例如HPLC。
[0079] 对于原儿茶醛和原儿茶酸大小的底物来说,发现Hs C0MT的底物结合位点的边界 由下列疏水残基形成:Trp38, Met40, Cysl73, Prol74, Trpl43和Leul98。可能影响结合的 其他亲水残基是Arg201。儿茶酚未被甲基化的羟基与Glul99形成氢键。
[0080] 根据这种机制,为了使原儿茶醛和原儿茶酸发生间位甲基化,这些底物的结合取 向必须将间位羟基放置成使其与Mg2+配位并靠近Lysl44,而对位羟基靠近Glul99。野生型 Hs C0MT中观察到的这种所需区域选择性的缺乏,表明这种结合取向并不优先发生。对于 Hs C0MT的结合位点残基来说,一个或多个氨基酸可以被置换,以允许促进原儿茶醛和原儿 茶酸的所需间位〇-甲基化的底物结合取向。
[0081] 因此,本发明还包括用于鉴定具有提高的底物特异性的C0MT多肽的方法。具体来 说,这样的方法提供了计算方法,以鉴定提供C0MT多肽的提高的间位0-甲基化的残基突 变。方法包括几个明显不同的步骤。具体来说,鉴定最适突变的一种方法包括下述步骤:(a) 选择C0MT多肽的蛋白质结构;(b)将底物原儿茶酸和原儿茶醛对接到(a)中确定的C0MT多 肽的蛋白质结构,以推衍促进区域选择性间位或对位〇-甲基化的不同构象;(c)鉴定靠近 原儿茶酸和原儿茶醛底物的结合位点突变;(d)对在(c)中鉴定到的每个残基进行计算机 突变分析;(e)根据间位或对位0-甲基化的预测的底物构象,对来自于(d)的每个位置的 候选残基突变进行排序;以及(f)为(c)中鉴定到的每个候选残基选择最佳评分突变。
[0082] 正如上面讨论的,C0MT多肽可以处于分类在EC编号2. 1. 1. 6儿茶酚0-甲基转移 酶下的C0MT家族中。就此而言,本领域技术人员将会认识到,除了 Hs C0MT之外,所述方法 可以应用于这一分类内的任何种类的C0MT,其中这样的蛋白质具有相似的结合位点残基。 在某些实施方式中,所述方法应用于拟南芥(Arabidopsis)或草莓C0MT(分别为SEQ ID NO :54和SEQ ID NO :54)。尽管每个方法步骤是就Hs C0MT进行了更详细地描述,但应该认 识到,类似的方法步骤可以使用其他C0MT多肽来进行。
[0083] 在步骤(a)中,选择C0MT蛋白结构。Hs C0MT的蛋白结构可以从蛋白质数据库 (Protein Data Bank)公开获取,并且可以根据分辨率、突变的包含和可以被导入以产生结 晶的其他序列变化来评估用途。可以在选择结构中考虑的其他因素包括结构是否包含结合 于所述蛋白的底物,或结合于蛋白的底物的本性。晶体结构编码3BWM(RCSB蛋白质数据库) 是对Hs C0MT特别有用的结构,并被用于本文描述的方法中。专业技术人员将会认识到,其 他Hs C0MT晶体结构可以被用作建模程序的输入。
[0084] 在步骤(b)中,将目标底物例如原儿茶酸和原儿茶醛对接到蛋白质结构。对接 是描述在预测所选小分子在蛋白质结合位点中的可能构象的各种算法中执行的计算方法 的术语。所述技术通常计算结合分值,以为评估适配度和预测的相互作用结合能提供基 础。在现有程序中使用的用于推演底物构象的对接程序是ProtoScreen (Haydon等,(2008) Science 321:1673-1675)。所述方法根据 ProtoScore 算法产生结合分值(Bhurruth-Alcor 等,(2011)0rg. Biomol. Chem. 9:1169-1188)。本领域技术人员将会认识到,在这一方法步骤 中可以使用其他对接程序来鉴定原儿茶酸和原儿茶醛底物在Hs C0MT (或其他C0MT家族成 员)中的适合的结合构象。
[0085] 在步骤(c)中,进行突变分析。这可以包括几个子步骤,例如⑴鉴定待突变的 第一残基;(ii)从适合的氨基酸名单中鉴定待突变成的残基;(iii)对于(ii)中的每个残 基,搜索旋转异构体文库以寻找构象候选物;(iv)将来自于(i)的残基用来自于(iii)的 每个新的残基侧链旋转异构体选择方案进行突变;(v)最小化蛋白质复合物构象;(vi)在 不同的原儿茶酸或醛构象下,使用突变体-底物、突变体-蛋白质、突变体-溶剂和底物-溶 剂能量的各种计算,对(iv)中的每个旋转异构体候选物进行评分,允许对底物在间位或对 位处修饰的情况之间进行能量比较;以及(vii)对来自于(iii)的旋转异构体选择方案进 行排序,然后对来自于(ii)的氨基酸突变找出最高评分。
[0086] 在子步骤(i)中,轮流对每个待突变的残基进行分析。
[0087] 在子步骤(ii)中,从可用氨基酸的确定名单选择待突变成的残基。作为缺省,该 名单是自然界中存在的20种标准氨基酸,但是可以包括其他非天然氨基酸。
[0088] 在子步骤(iii)中,在旋转异构体文库中鉴定与突变的氨基酸身份匹配的所有旋 转异构体。旋转异构体文库是采取可用的3D格式的标准氨基酸侧链的一组预先计算的优 选构象。这样的文库通常用于蛋白质结构分析工作,并且被包括在大多数可商购的分子建 模软件包中。选择与进行突变的残基的身份匹配的旋转异构体组用于子步骤(iv)。
[0089] 在子步骤(iv)中,将所选的蛋白质残基换成在(iii)中鉴定到的每个旋转异构 体。这包括对蛋白质残基原子的计算表示法(representation)进行修改,以便在使用矢量 数学将选自于(iii)的输入旋转异构体连接到a碳位置之前,删除起始残基侧链原子。对 每种候选的旋转异构体重复这种方法,以获得蛋白质的3D表示法的名单,其中每个表示法 的差别仅在于单个残基位置处的不同旋转异构体构象。
[0090] 在子步骤(V)中,对在(iv)中推演的蛋白质-底物复合物进行力场最小化。在特 别有用的实施方式中,该力场是具有施加到底物的AM1-BCC电荷的AMBER99。在所述方法 的另一种情况下,使用Born溶剂化项。可以使用边壁约束来限制蛋白质骨架,同时侧链保 持不受约束。这具有减少总体蛋白质运动但允许探索单个残基突变对邻近残基的影响的效 果。本领域技术人员将会认识到,各种可商购的分子建模软件包能够执行这些任务。
[0091] 在子步骤(vi)中,对得到的蛋白质-复合物构象进行能学计算,以确定各个突变 体构象的可行性。这包括单个地计算野生型残基与底物、蛋白质环境和溶剂的相互作用能 量,然后对突变的残基构象进行同样计算。为底物的(间位和对位反应)构象两者确定计 算值。因此,这一方法步骤鉴定了与处于对位激活造型(pose)相比,对处于间位反应造型 的底物具有有利结合能的突变。使用基于力场的项计算能量。在一种实施方式中,力场是 AMBER99,并且氨基酸与蛋白质-底物环境之间的相互作用能量通过方程1来描述。 rn〇Q9l P . . .= P . .. _
+P _ f古鸦1、
[0096] 本领域技术人员将会认识到,可以使用其他类似方程来推导适合于不同底物-突 变氨基酸造型的这种差异能量分析的相互作用能量。
[0097] 在子步骤(vii)中,与处于对位反应预测造型的底物相比,选择与处于间位反应 预测造型的底物结合提供有利结合能的氨基酸。因此,这些计算确定了哪个氨基酸突变可 能促进间位区域选择性0-甲基化。
[0098] 在步骤(iv)中,重复步骤(iii)直至为待突变的每个结合位点残基输出能量值列 表。
[0099] 在步骤(V)中,通过比较每个突变在底物处于间位反应位置与对位反应位置之间 的能量差,对源自于步骤(iv)的能量值列表进行排序。该列表排名前列的条目代表了与对 位0-甲基化相比有利于间位0-甲基化的突变。
[0100] 在步骤(vi)中,根据能量值选择来自于步骤(V)的有限数量的这样的候选物。不 选择下述突变:(1)突变在能量上不利,或(2)预计突变不改变区域选择性。
[0101] 正如在本文中所描述,上述方法对Hs C0MT的应用导致鉴定到被设计用于提高酶 的区域选择性〇-甲基化的一组突变。所述突变可以单独地或组合地使用。
[0102] 在Hs C0MT的膜结合同工型中,等同的残基编号是可溶性Hs C0MT的编号加上50。 因此,在可溶性Hs C0MT中被描述或替换的残基,在膜结合Hs C0MT中也被推断为在残基编 号加上50处被描述或替换。
[0103] 在一种实施方式中,本发明提供了一种突变体C0MT多肽,其(1)具有在SEQ ID NO :27的整个长度上确定的与SEQ ID NO :27具有至少80%、例如至少85%、例如至少 90%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%的序列 同一性的氨基酸序列;并且(2)在与SEQ ID N0 :27的198至199位置对齐的位置处具有至 少一个氨基酸置换,其可以是下文中描述的氨基酸置换中的任一种;并且(3)能够催化原 儿茶酸的-OH基团的甲基化,其中所述甲基化导致产生与异香草酸相比至少4、5、10、15、 20、25或30倍多的香草酸。除了这些特征之外,所述突变体C0MT多肽可能还能够催化原儿 茶醛的-OH基团的甲基化,其中所述甲基化导致产生与异香草醛相比至少4、5、10、15、20、 25或30倍多的香草醛;和/或能够催化原儿茶醇的-OH基团的甲基化,其中所述甲基化 导致产生与异香草醇相比至少4、5、10、15、20、25或30倍多的香草醇。
[0104] 因此,在一种优选实施方式中,突变体C0MT多肽可以在与SEQIDN0 :27的198位 置对齐的位置处具有氨基酸置换。因此,突变体C0MT多肽可以是具有上面概述的特征的突 变体C0MT多肽,其中所述置换是在与SEQIDN0 :27的198位置对齐的位置处的亮氨酸被 具有更低亲水指数的另一种氨基酸置换。例如,突变体C0MT多肽可以是具有如上概述的特 征的突变体C0MT多肽,其中所述置换是在与SEQIDN0 :27的198位置对齐的位置处的亮 氨酸被亲水指数低于2的另一种氨基酸置换。因此,突变体C0MT多肽可以是具有如上概述 的特征的突变体C0MT多肽,其中所述置换是在与SEQIDN0 :27的198位置对齐的位置处 的亮氨酸被Ala、Arg、Asn、Asp、Cys、Glu、Gin、Gly、His、Lys、Met、Phe、Pro、Ser、Thr、Trp 或Tyr,例如Ala、Arg、Asn、Asp、Glu、Gin、Gly、His、Lys、Met、Pro、Ser、Thr、Trp或Tyr置 换。然而,优选地,所述置换是在与SEQIDNO:27的198位置对齐的位置处的亮氨酸被酪 氨酸置换。将与SEQIDN0 :27的198位置对齐的亮氨酸用甲硫氨酸置换,增加了对原儿茶 醛来说间位〉对位0-甲基化的区域选择性。
[0105] 在另一种优选实施方式中,突变体C0MT多肽可以在与SEQIDN0 :27的199位置 对齐的位置处具有氨基酸置换。因此,突变体C0MT多肽可以是具有如上概述的特征的突变 体C0MT多肽,其中所述置换是在与SEQIDN0 :27的199位置对齐的位置处的谷氨酸被在 pH7. 4下具有中性或正的侧链电荷的另一种氨基酸置换。因此,突变体C0MT多肽可以是 具有如上概述的特征的突变体C0MT多肽,其中所述置换是在与SEQIDN0 :27的199位置 对齐的位置处的谷氨酸被Ala、Arg、Asn、Cys、Gin、Gly、His、lie、Leu、Lys、Met、Phe、Pro、 Ser、Thr、Trp、Tyr或Val置换。然而,所述置换优选地是在与SEQIDNO:27的199位置 对齐的位置处的谷氨酸被丙氨酸或谷氨酰胺置换。将与SEQIDNO:27的199位置对齐的 谷氨酸用丙氨酸或谷氨酰胺置换,增加了对原儿茶醛来说间位〉对位〇-甲基化的区域选择 性。
[0106] 例如,突变体C0MT多肽可以具有下列突变中的一个或多个:用色氨酸、酪氨酸、苯 丙氨酸、谷氨酸或精氨酸置换在与SEQIDN0 :27中显示的氨基酸序列的198位置对齐的位 置处的亮氨酸;用精氨酸、赖氨酸或丙氨酸置换在与SEQIDN0 :27中显示的氨基酸序列的 40位置对齐的位置处的甲硫氨酸;用酪氨酸、赖氨酸、组氨酸或精氨酸置换在与SEQIDN0: 27中显示的氨基酸序列的143位置对齐的位置处的色氨酸;用异亮氨酸、精氨酸或酪氨酸 置换在与SEQIDN0 :27中显示的氨基酸序列的174位置对齐的位置处的脯氨酸;用精氨酸 或赖氨酸置换在与SEQIDN0 :27中显示的氨基酸序列的38位置对齐的位置处的色氨酸; 用苯丙氨酸、酪氨酸、谷氨酸、色氨酸或甲硫氨酸置换在与SEQIDN0 :27中显示的氨基酸序 列的173位置对齐的位置处的半胱氨酸;和/或用丝氨酸、谷氨酸或天冬氨酸置换在与SEQ IDN0 :27中显示的氨基酸序列的201位置对齐的位置处的精氨酸。
[0107] 在一种实施方式中,突变体C0MT多肽含有在与198位置对齐的位置处的亮氨酸被 色氨酸的置换。这一突变可以提高对原儿茶酸来说间位〉对位〇-甲基化的区域选择性。含 有L198W突变的C0MT多肽的蛋白质结合位点的模型化,表明在突变的残基与底物之间可以 发生空间位阻。在间位反应构象中不发生这种空间位阻,因为底物的羧酸远离该残基。
[0108] 在本发明的另一种实施方式中,突变体C0MT多肽是SEQIDN0:27的多肽,其中 198位置处的氨基酸已被具有比亮氨酸更低的亲水指数的氨基酸置换。例如,突变体C0MT 多肽可以是SEQ ID NO :27的多肽,其中198位置处的亮氨酸已被亲水指数小于2的氨基酸 置换。因此,突变体C0MT多肽可以是SEQ ID NO :1的多肽,其中198位置处的亮氨酸已被 Ala、Arg、Asn、Asp、Glu、Gin、Gly、His、Lys、Met、Pro、Ser、Thr、Trp 或 Tyr 置换,优选地被 Met或Tyr置换。
[0109] 在另一种优选实施方式中,突变体COMT多肽可以是SEQ ID NO :27的多肽,其中 199位置处的氨基酸已被在pH 7. 4下具有中性或正的侧链电荷的另一种氨基酸置换。因 此,突变体C0MT多肽可以是SEQ ID N0:27的多肽,其中199位置处的谷氨酸已被Ala、Arg、 Asn、Cys、Gin、Gly、His、lie、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr 或 Val 置换,优选 地被Ala或Gin置换。
[0110] 在某些实施方式中,突变体COMT多肽具有两个或更多个突变。例如,底物结合位 点中的2、3、4、5、6或7个残基可以被突变。例如,在一种实施方式中,突变体C0MT多肽可 以具有在与SEQ ID N0 :27的氨基酸序列的40位置对齐的位置处的甲硫氨酸被精氨酸或赖 氨酸的置换;在与SEQ ID N0 :27的氨基酸序列的143位置对齐的位置处的色氨酸被酪氨酸 或组氨酸的置换;在与SEQ ID N0 :27的氨基酸序列的174位置对齐的位置处的脯氨酸被异 亮氨酸的置换;以及在38位置处的色氨酸被精氨酸或赖氨酸的置换。突变体C0MT多肽还 可以具有在与SEQ ID N0 :27的氨基酸序列的143位置对齐的位置处的色氨酸被赖氨酸或 精氨酸的置换,以及在SEQ ID N0 :27的174位置处的脯氨酸被精氨酸或酪氨酸的置换。突 变体C0MT多肽还可以具有在与SEQ ID N0 :27中显示的氨基酸序列的173位置对齐的位置 处的半胱氨酸被苯丙氨酸、酪氨酸、谷氨酸、色氨酸或甲硫氨酸的置换,在与SEQ ID N0 :27 中显示的氨基酸序列的40位置对齐的位置处的甲硫氨酸被丙氨酸的置换,以及在与SEQ ID NO :27中显示的氨基酸序列的201位置对齐的位置处的精氨酸被丝氨酸、谷氨酸或天冬氨 酸的置换。突变体C0MT多肽还可能具有在与SEQ ID N0 :27的氨基酸序列的198位置对齐 的位置处的亮氨酸的置换,以及在与SEQ ID N0 :27的氨基酸序列的199位置对齐的位置处 的谷氨酸的置换。所述置换可以是本部分中上面描述的置换中的任一种。突变体C0MT多 肽还可能具有在与SEQ ID N0 :27的198位置对齐的位置处的亮氨酸的置换,以及在与SEQ ID N0 :27的201位置对齐的位置处的精氨酸的置换。所述置换可以是本部分中上面描述 的置换中的任一种。
[0111] 同一性百分数
[0112] 本文中给出的序列同一性优选地是在参比序列的整个长度上的序列同一性。因 此,与本文中作为SEQ ID N0 :4或SEQ ID N0 :27提供的氨基酸序列的序列同一性分别是在 SEQ ID N0 :4或SEQ ID N0 :27的整个长度上的序列同一性。
[0113] 同一性百分数可以如下确定。使用计算机程序ClUStalW(l. 83版,缺省参数)将 参比序列(例如SEQ ID N0 :4或SEQ ID N0 :27中显示的核酸序列或氨基酸序列)与一个 或多个候选序列对齐,所述程序允许在跨过核酸或多肽序列的整个长度上对它们进行比对 (全面比对)。Chenna 等,(2003)Nucleic Acids Res. 31 (13): 3497-500。
[0114
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1