具有增强的光输出的合成的刺虾萤光素酶的制作方法

文档序号:392107阅读:728来源:国知局
专利名称:具有增强的光输出的合成的刺虾萤光素酶的制作方法
具有增强的光输出的合成的刺虾萤光素酶相关申请的交叉参考本申请要求2009年5月1日申请的美国临时申请号61/174,838的优先权,其全文援引加入本文。
背景技术
本发明涉及与野生型刺虾(Oplophorus)萤光素酶相比具有增强性质的合成的刺虾萤光素酶。深海虾细角刺虾(Oplophorus gracilirostris)当受刺激时从其触角基底部发出蓝色发光云,与各种其它发光的十足目虾一样,这些十足目虾包括异腕虾属 (Heterocarpus)、腹刺虫下属(Systellaspis)禾口棘虫下属(Acanthephyra)的那些(Herring, Τ. Mar. Biol. Assoc. UK, 156 1029 (1976))。刺虾的发光机制涉及由刺虾萤光素酶催化的刺虾萤光素(coelenterazine)与分子氧的氧化作用,如下式示出
刺虾萤光素
Coelenterazine +O2 _> Coelenteramide + CO2 + hv(Amax = 454 nm)Coelenterazine是一种咪唑并吡嗪酮(imidazopyrazinone)化合物,参与许多生物体的生物发光机制,如作为萤光素或者作为光蛋白的功能部分。例如,海肾Renilla 的萤光素是 coelenterazine(Inoue et al. , Tetrahed. Lett. , 18 :2685 (1977)),来自水母Aequorea的钙敏感性光蛋白水母发光蛋白也含有coe 1 enterazine作为其功能部分 (Shimomura et al. , Biochem. ,17 :994(1978) ;Head et al. , Nature,405 :372(2000))。发明概述在一个实施方案中,本发明提供了编码修饰的萤光素酶多肽的多核苷酸。所述修饰的萤光素酶与野生型刺虾萤光素酶具有至少60%氨基酸序列相同性并且在相应于SEQ ID NO :1所示野生型刺虾萤光素酶的氨基酸的位置包括至少一个氨基酸取代。所述修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的发光性、增强的信号稳定性及增强的蛋白质稳定性中的至少一项。在另一个实施方案中,本发明提供了编码修饰的萤光素酶多肽的多核苷酸。所述修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的发光性并且在相应于SEQ ID NO 1 的第 2、4、11、20、23、沘、33、;34、44、45、51、讨、68、72、75、76、77、89、90、92、99、104、 115、124、135、138、139、143、144、164、166、167或者169位置具有至少一个氨基酸的取代。通过本发明的详细描述和附图,本发明的其它方面将会变得明显。附图简述

图1示出脂肪酸结合蛋白(FABP)和OgLuc的二级结构排列对比。图2示出腰鞭毛虫萤光素酶、FABP和OgLuc的二级结构排列对比。图 3 示出 OgLuc 和各种 FABP (分别为 SEQ ID NO :1、3、4、5 禾口 17-20)基于 FABP 的 3D结构重叠的氨基酸序列的排列对比。图4A-D示出用在OgLuc中两或更多个氨基酸取代组合修饰的OgLuc变体与m66R
5OgLuc变体和Renilla萤光素酶相比的光输出(即发光)时程。4A-4B)使用“Flash” 发光测定在若干分钟时间以两种不同的发光标度示出的以相对光单位(RLU)示出的发光 (“lum”)。4C-4D)使用“Glo”0. 5% tergitol发光测定在若干分钟时间以两种不同发光标度示出的以RLU示出的发光(“lum”)。图5A-C概述了在实施例7中描述的T = 0时各种OgLuc变体(“样品,,)以RLU 表示的平均发光(平均值)及标准误差(Mdev)和与WT OgLuc相比的变异系数(CV),使用 0. 5% tergitol测定缓冲液。图6A-B概述了从图5A-C示出的0. 5% tergitol测定缓冲液数据确定的OgLuc变体与WT OgLuc相比在T = 0的发光增加倍数。图7A-C概述了 OgLuc变体(“样品”)在T = 0的以RLU表示的平均发光(“平均值”)以及标准误差(“Stdev”)和与WT OgLuc相比的变异系数(“CV”),使用RLAB。图8概述了从图7A-C示出的RLAB数据确定的OgLuc变体与WT OgLuc相比在T =0的发光增加倍数。图9A-D示出与WT OgLuc相比,OgLuc变体的信号稳定性,使用0. 5% tergitol测定缓冲液。9A-9C) =OgLuc变体(“克隆”)的光输出时程,在若干分钟内随时间测量以RLU 表示的发光。9D)从图9A-C示出的光输出时程数据确定的OgLuc变体的以分钟表示的信号
半衰期。图10A-C示出使用RLAB,OgLuc变体与WT OgLuc相比的光输出时程(即信号稳定性),在若干分钟内随时间测量以RLU表示的发光。图IlA-B示出从图10A-C所示光输出时程数据确定的OgLuc变体与WT OgLuc相比的以分钟表示的信号半衰期。图12A-B示出与WT OgLuc相比,OgLuc变体在22°C的蛋白质稳定性,以半衰期(分钟)表示。图13A-B 概述了使用 0. 5% tergitol 测定缓冲液(13A)或者 RLAB (13B) ,A33K 禾口 F68Y OgLuc变体在T = 0以RLU表示的平均发光(“平均值”)以及与WT OgLuc相比的变异系数(“% cv”)。图14A-B概述了从在图13A-B中示出的分别使用0.5% tergitol测定缓冲液 (14A)或者RLAB(HB)的测定的数据确定的与WT OgLuc相比,A3!3K和F68Y OgLuc变体在 T = 0的发光增加倍数。图15A-B示出A3!3K和F68Y OgLuc变体与WT OgLuc相比的信号稳定性,使用0. 5% tergitol测定缓冲液。15A)A3!3K和F68Y OgLuc变体的光输出时程,在若干分钟内随时间测量以RLU表示的发光。15B)从在图15A中示出的光输出时程数据确定的A3I和F68Y OgLuc变体的以分钟表示的信号半衰期。图16A-B示出使用RLAB,A3;3K和F68Y OgLuc变体与WT OgLuc相比的信号稳定性。 16A)A33K和F68Y OgLuc变体的光输出时程,在若干分钟内随时间测量以RLU表示的发光。 16B)从在图16A中示出的光输出时程数据确定的A3I和F68Y OgLuc变体的以分钟表示的
信号半衰期。图17示出A3I和F68Y OgLuc变体在22°C的蛋白质稳定性,以半衰期(分钟)表
7J\ ο
6
图18A-B示出与m66R OgLuc变体和Renilla萤光素酶相比,核心组合OgLuc变体的光输出时程(即信号稳定性),使用0. 5% tergitol测定缓冲液,在若干分钟内随时间测量以RLU表示的发光。图19示出使用RLAB,与m66R OgLuc变体和Renilla萤光素酶相比,核心组合 OgLuc变体的光输出时程(即信号稳定性),在若干分钟内随时间测量以RLU表示的发光。图 20A-B 示出与 WT OgLuc ( “ Og-Luc")和 Renilla 萤光素酶("hRL,,)和 T2T 及A54F变体相比,C1+C2+A4E和C1+A4E OgLuc变体的光输出时程(即信号稳定性),使用 0.5% tergitol测定缓冲液(20A)或者RLAB Q0B),在若干分钟内随时间测量以RLU表示的发光。图21 示出与 WT OgLuc (“Og-Luc")和 Renilla 萤光素酶(‘‘hRL,,)和 T2T 及 A54F 变体相比,C1+C2+A4E和C1+A4E OgLuc变体的光输出时程(即信号稳定性),使用0. 25% tergitol测定缓冲液,在若干分钟内随时间测量以RLU表示的发光。图22 示出与 WT OgLuc (“Og-Luc")和 Renilla 萤光素酶(‘‘hRL,,)和 T2T 及 A54F 变体相比,在HEK 293细胞中C1+C2+A4E和C1+A4E OgLuc变体的光输出时程(即信号稳定性),使用RLAB缓冲液,根据萤火虫标准化。图 23 示出与 WT OgLuc ( “Og-Luc")和 Renilla 萤光素酶(‘‘hRL,,)相比,在 HEK 293细胞中C1+C2+A4E和C1+A4E OgLuc变体的光输出时程(即信号稳定性),使用0. 25% tergitol缓冲液,根据萤火虫标准化。图M示出与WT OgLuc、ReniIla萤光素酶和m66R变体相比,在不同温度如22°C、 37°C、42°C、50°C和 54°C温度下,Cl、C1+A4E、C1+C2+A4E 和 C1+C3+A4E OgLuc 变体的以半衰期(分钟)表示的蛋白质稳定性。图25 示出与 WT OgLuc ( “ Og-Luc")和 Renilla 萤光素酶(‘‘hRL,,)相比,Cl、 C1+A4E、C1+C2+A4E和C1+C3+A4E OgLuc变体的光输出时程(即信号稳定性),使用RLAB在若干分钟内随时间测量以RLU表示的发光(‘‘Ium”),以及从时程数据确定的以分钟表示的
半衰期。图洸示出与Renilla萤光素酶相比,使用coelenterazine作为m66R、Cl+A4E和 C1+C2+A4E变体的底物,具有最大发光的最佳波长(nm),根据光谱中最高RLU值标准化。图27A-B概述了 C1+A4E的随机诱变的变体(“样品ID”)相对于具有指定氨基酸改变的相应起始C1+A4E变体在T = 0的发光增加倍数,使用0. 5% tergitol缓冲液。图28概述了 C1+A4E的L92变体相对于具有指定氨基酸改变的相应起始C1+A4E 变体在τ = 0的发光增加倍数,使用0. 5% tergitol缓冲液。图四概述了 C1+A4E( “样品ID”)的组合变体与具有指定氨基酸改变的相应起始 C1+A4E变体相比在T = O的发光增加倍数,使用0. 5% tergitol缓冲液。图30示出在50°C与相应起始C1+A4E OgLuc相比,变体C1+A4E+F54I在若干分钟内随时间以RLU测量的发光的自然对数(In)值的光输出时程和以分钟表示的半衰期。图31示出具有共有序列的SEQ ID NO :10 (天然)、SEQ ID NO :13 (合成的WT)、SEQ ID NO :15(N166R)、SEQ ID NO :25 (Cl)、SEQ ID NO :27 (C1+C2)、SEQ ID NO :23 (C1+A4E)、SEQ ID NO :29(C1+C2+A4E)和 SEQ ID NO :31 (C1+C3+A4E)的氨基酸序列排列对比。图32示出具有共有序列的SEQ ID NO 12 (天然)、SEQ ID NO :2 (合成的WT)、SEQ
7ID NO :14(N166R)、SEQ ID NO : 18 (Cl)、SEQ ID NO :20 (Cl+C2)、SEQ ID NO : 16 (C1+A4E)、SEQ ID NO :22(C1+C2+A4E)和 SEQ ID NO :24(C1+C3+A4E)的核苷酸序列排列对比。图33A概述了从在图5A-C和14A中示出的0. 5% tergitol测定缓冲液数据确定的OgLuc变体与N166R相比在T = 0的发光增加倍数,根据N166R变体标准化。图3!3B概述了从在图7A-C和14B中示出的RLAB数据确定的OgLuc变体与m66R 相比在T = 0的发光增加倍数,根据N166R变体标准化。图33C概述了从在图9A-C和15B (0. 5 % tergitol测定缓冲液)及10A-C和 16B(RLAB)示出的光输出时程数据确定的OgLuc变体以分钟表示的信号半衰期,根据W66R 变体标准化。图33D概述了图12A-B和17示出的与WT OgLuc相比的OgLuc变体在22°C的蛋白质稳定性(以分钟表示的半衰期),根据N166R变体标准化。图33E概述了图33A-D示出的在22°C的发光增加倍数、信号半衰期和半衰期。图34A示出用0.5% tergitol测定的含有IV变体(“IV”)、Renilla萤光素酶 ("Renilla")和C1+A4E( “C1A4E,,)的大肠杆菌裂解物的发光结果。图34B示出VI变体(“VI,,)和Renilla萤光素酶(”Renilla")在50°C的蛋白质稳定性(以分钟表示的半衰期)。发明详述在详细阐述本发明的任意实施方案之前,应理解本发明的应用不限于在如下描述或者在如下图表中示出的结构、合成及排列。通过特定实施方案和技术描述本发明,但是本发明可以有其它实施方案以及可以通过不同方式实施。在下文关于本发明方法的描述中,除非特别指出,则处理步骤均是在室温(大约22°C)和大气压下进行。也应特别理解的是在本文列举的任何数值范围包括从下限值至上限值的所有数值。例如,如果浓度范围或者有益作用范围表述为_50%,是指如 2% -40%U0% -30%或者-3%等的值均在说明书中明确列举。相似地,如果序列相同性范围以如60 %至< 100 %之间的数值给出,是指65 %、75 %、90 %等数值均在说明书中明确列举。这些只是特别提及几个实例,从最低值至最高值的所有可能的数值均在说明书中明确列举。在本发明的实施方案中,使用本文描述的各种技术鉴别氨基酸取代位点以产生改良的合成的刺虾萤光素酶多肽。其它技术用于优化编码各种多肽的多核苷酸的密码子以增强所述多肽的表达。发现单独或者组合产生一或多个氨基酸取代产生具有增强的发光、增强的信号稳定性及增强的蛋白质稳定性中至少一项性质的合成的刺虾型萤光素酶。此外, 在编码各种多肽的多核苷酸中包含一或多个密码子优化取代导致所述多肽在各种真核和原核表达系统中表达增强。发光是指所述萤光素酶多肽在合适条件下的光输出,例如在存在合适的底物如 coelenterazine条件下。所述光输出可以在发光反应开始时测量即时或者近即时光输出 (有时称作T = O发光或者flash),所述发光反应可以是基于加入coelenterazine底物而开始。在各个实施方案中的所述发光反应是在含有来自如在原核或者真核表达系统中的细胞的裂解物的溶液中进行;在其它实施方案中,表达是在体外系统中发生或者所述萤光素酶蛋白分泌进胞外介质中,由此在后者的情况中不需要产生裂解物。在一些实施方案中,所述反应通过在含有所述萤光素酶蛋白的反应室(例如多孔平板如96孔平板的孔)中注射合适的材料如coelenterazine而开始。所述反应室可以位于读数装置中,所述装置可测量光输出,如使用光度计或者光电倍增器测量。所述光输出或者发光也可以随时测量,例如在相同反应室中测量若干秒、若干分钟、若干小时等。所述光输出或者发光可以随时间的平均值、信号衰退半衰期、一段时间的信号总和或者峰输出报告。增强的发光包括通过可比较地获得的测量值的适当对比确定的增加的光输出或者发光。如本文所述,对合成的刺虾萤光素酶序列进行一或多个合适的氨基酸取代产生呈现出增强的发光的修饰的萤光素酶多肽。来自野生型刺虾核苷酸序列的核苷酸序列中的改变通过导致氨基酸取代和/或通过增强蛋白质表达可有助于增强的发光。增强的信号稳定性包括延长萤光素酶信号持续发光的时间长度,例如通过在一定时程的信号衰退半衰期进行测量。增强的蛋白质稳定性包括增加的热稳定性(例如在温度升高时的稳定性)和化学稳定性(例如在存在变性剂包括例如Triton X-100的条件下的稳定性)。术语“OgLuc”是指刺虾萤光素酶蛋白质复合物的成熟的19kDa亚基,即没有信号序列;成熟OgLuc多肽序列的天然形式如SEQ ID NO 1示出。术语“OgLuc变体”是指具有一或多个氨基酸取代的合成的OgLuc。例如,“OgLuc N166R变体”和“0gLuc+N166R”是指合成的OgLuc,其具有在相对于SEQ ID NO :1第166位的由N至R的氨基酸取代。术语“WT”、 "WT OgLuc”和“野生型OgLuc”是指合成的成熟的OgLuc蛋白,其由在相对于SEQ ID NO 1 第2位具有ACC的合成的多核苷酸编码。术语“T2T”是指合成的成熟的OgLuc蛋白,其由在相对于SEQ ID NO :1的第2位具有ACA的合成的多核苷酸编码。对于在实施例中给出的数据,合成的野生型蛋白质是合成的野生型蛋白质SEQ ID N0:13,其由SEQ ID NO :2的核苷酸序列编码。本申请中用以鉴别取代的残基的氨基酸编号是相对于SEQ ID NO :1所示成熟野生型OgLuc多肽序列中的位置确定的。天然发生的野生型OgLuc序列可以是最初由其它氨基酸合成的,这些氨基酸随后被切割,产生例如SEQ ID NO :1所示成熟野生型多肽。例如,信号序列(例如指导新生蛋白质定向到特定细胞器如内质网和/或指导蛋白质分泌)可以存在于新生蛋白质初期,随后被切割产生成熟野生型蛋白质。刺虾萤光素酶的底物特异性出乎意料地广泛(Inouye and Shimomura. BBRC 223 349 (1997)。例如,bisdeoxycoelenterazine, 一种 coelenterazine 类似物,是与 coelenterazine 相当的极佳的刺虾萤光素酶底物(Nakamura et al. , Tetrahed, Lett., 38 6405 (1997)) ο此外,刺虾萤光素酶是分泌的酶,与海相介形虫(marine ostracod) Cypridina(Vargula)hilgendorfii 的萤光素酶一样(Johnson and Shimomura, Meth. Enzyme, 57 :331 (1978)),其也使用咪哔并吡嗪酮型萤光素发光。据报道刺虾萤光素酶的分子量相对于天然蛋白质复合物为130kDa(通过凝胶过滤确定),在用 SDS 处理后为 31kDa (Shimomura et al.,Biochem.,17 1994 (1978))。所述萤光素酶在凝胶过滤中也示出大约106kDa的分子量,发现在基于十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析该分子分成35kDa和19kDa蛋白质(Inouye et al.,FEBS Lett. ,481 :19(2000)) ο houye et al. (2000)报道了编码!35kDa 和 19kDa 蛋白质的 cDNA 的分子克隆,以及催化发光反应的蛋白质成分的鉴别。编码所述蛋白质的cDNA作为19kDa
9蛋白质在细菌和哺乳动物细胞中表达,其能催化coelenterazine的发光氧化作用Qnouye et al.,2000)。所述35kDa蛋白质的一级序列示出亮氨酸富集的重复序列,而催化性19kDa 蛋白质与任何已知萤光素酶包括各种咪唑并吡嗪酮萤光素酶均无同源性(Inouye et al., 2000)。刺虾萤光素酶的19kDa蛋白质(OgLuc)似乎是具有萤光素酶功能的最小催化成分,其一级结构与任何报道的萤光素酶包括咪唑并吡嗪酮萤光素酶不具有明显的同源性(Lorenz et al. , PNAS USA, 88 :4438(1991) ;Thompson et al. , PNAS USA, 86 6567(1989))。Inouye et al. (2000)报道了所述19kDa蛋白质的全部氨基酸序列,在第 217-392位残基的区域(D3-S1结构域)看起来与大肠杆菌胺氧化酶(757个氨基酸残基; Pir 140924)类似(Parson et al. Structure 3 1171 (1995)),而该蛋白质的氨基末端区域 (3-49)与脂肪酸结合蛋白(132个氨基酸残基;GenBank,L23322)的氨基末端区域(1_47) 同源(Becker et al. , Gene, 148 :321 (1994))。同源性建模需要鉴别至少一个合适的3D结构模板,通常是通过实验确定的与靶蛋白质具有显著序列相似性的同源蛋白质的3D结构。OgLuc与其它已知蛋白质不具有显著的序列相似性。因此,采用了设计用于鉴别OgLuc的远同源物如与OgLuc具有低序列相似性的蛋白质的折叠识别方法。这种方法产生属于脂肪酸结合蛋白(FABP)的蛋白质家族的一些潜在3D结构模板,其是calycin蛋白质超家族的一部分。所述模型示出calycin折叠结构特征在OgLuc中不是完全保守的,所述特征有效地用氢键将N末端和C末端连接在一起并且存在于至少三个FABP中。OgLuc残基Asnl66(接近C末端)与接近N末端的主链羰基不能形成氢键。然而,在OgLuc第166位含有Arg或Lys的突变体模型提示这个结构基序的恢复可以改良OgLuc的结构稳定性及其在细胞中的表达/活性。本发明的实施方案提供了合成的修饰的(变体)萤光素酶,以及其片段,例如可用于互补测定中的那些,其相对于相应野生型萤光素酶在与calycin蛋白质超家族如脂肪酸结合蛋白家族的成员结构同源的区域中具有至少一个氨基酸取代。在一个实施方案中,本发明提供了修饰的甲壳动物萤光素酶如修饰的十足目动物萤光素酶以及其片段,例如可用于互补测定中的那些,其相对于相应野生型甲壳动物萤光素酶在与calycin蛋白质超家族如脂肪酸结合蛋白家族的成员结构同源的区域中具有至少一个氨基酸取代。在一个实施方案中,本发明提供了真核单细胞鞭毛虫的修饰的萤光素酶以及其片段,例如可用于互补测定中的那些,其相对于相应野生型真核单细胞鞭毛虫萤光素酶如来自腰鞭毛目 (Dinoflagellata)包括甲藻纲(Dinophyceae) >NoctiIuciphyceae 或者 Syndiniophycea 的萤光素酶在与calycin蛋白质超家族如脂肪酸结合蛋白家族的成员结构同源的区域中具有至少一个氨基酸取代。编码修饰的萤光素酶的核酸分子可以编码或者不编码与修饰的萤光素酶连接的分泌性信号肽。所述合成的修饰的萤光素酶或者其片段中的至少一个取代是对在与calycin蛋白质超家族如脂肪酸结合蛋白家族的成员结构同源的区域中的相应位置的氨基酸残基,该残基在修饰的萤光素酶中可以参与分子内氢键或者离子键形成以及与增强的发光相关。增强的发光包括但不限于增加的光发射、改变的光发射动力学如光强度稳定性更高,或者改变的发光颜色如朝向更短或者更长波长移动,或者这些的组合。在一个实施方案中,所述合成的修饰的萤光素酶中在相应位置的残基可以与相应于OgLuc如具有SEQ ID NO 1序列
10(注意这些位置的编号基于在成熟序列的第1位残基的Phe而不是Met ;然而,其它残基可以在Phe之前,如在-1位置的Val,其可以通过插入克隆位点导入)的1_10或者144-148 残基的区域中的残基或者具有在相应位置(第166位)残基的4-8人内如6人内的原子的残基相互作用。相应位置可以通过排列对比序列鉴别,使用例如序列排列对比程序、二级结构预测程序或者折叠识别方法或者这些方法的组合。本发明的修饰的萤光素酶可包括另外的氨基酸取代,其改变发光颜色例如导致红移发光、改变信号稳定性、改变蛋白质稳定性或者其任何组合的取代。在一个实施方案中,本发明提供了修饰的十足目动物萤光素酶,其相对于相应野生型十足目动物萤光素酶具有增强的发光。在另一个实施方案中,本发明提供了修饰的十足目动物萤光素酶,其利用coelenterazine。Coelenterazine包括但不限于天然发生的coelenterazine以及其衍生物(类似物),如在美国专利号7,118,878中揭示的那些,以及 EnduRen> ViviRen、coelenterazine η、coelenterazine h、coelenterazine c、coelenterazine cp、coelenterazine e、coelenterazine f> coelenterazine fcp> coelenterazine hh、coelenterazine i、coelenterazine icp、2_ 甲基 coelenterazine, 及在W0/040100和美国申请系列号12/056,073中揭示的那些,所述文献的内容援引加入本文。本发明修饰的萤光素酶在相应于SEQ ID NO=I中第166位残基的位置具有不是天冬酰胺的残基,导致增强的发光,以及任选地在相应于SEQ ID NO :1第5位残基的位置具有天冬氨酸、在相应于SEQ ID NO :1第8位残基的位置具有甘氨酸、在相应于SEQ ID NO=I 第9位残基的位置具有天冬氨酸、在相应于SEQ ID NO :1第10位残基的位置具有色氨酸、 酪氨酸或者苯丙氨酸、在相应于SEQ ID NO :1第144位残基的位置具有天冬酰胺和/或在相应于SEQ ID NO :1第147位残基的位置具有甘氨酸,或者其任意组合。在一个实施方案中,所述修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基是赖氨酸。在另一个实施方案中,修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基是精氨酸。在一个实施方案中,修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基能够与在接近修饰的萤光素酶N末端的相应于SEQ ID NO :1中第9位残基的位置的羰基或者侧链形成一或多个分子内氢键或者离子键。在一个实施方案中,所述修饰的萤光素酶没有信号肽序列。在一个实施方案中,所述修饰的萤光素酶与SEQ ID NO :1具有至少60%氨基酸序列相同性,例如至少 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或者 99%但是低于100%的氨基酸序列相同性。在一个实施方案中,相应的野生型萤光素酶是刺虾萤光素酶,如细角刺虫下、Oplophorus grimaldii、 束Ij 1 束Ij 虫下(Oplophorus spinicauda) > Oplophorus foliaceus> Oplophorus noraezeelandiae、典型束Ij 虫下(Oplophorus typus) > Oplophorus noraezelandiae或者Oplophorus spinous、异腕虾属萤光素酶、腹刺虾属萤光素酶或者棘虾属萤光素酶。在一个实施方案中,所述修饰的萤光素酶相对于相应野生型萤光素酶在原核细胞和/或真核细胞中的光发射增加至少2倍或者更多,如至少4倍。在另一个实施方案中,本发明提供了修饰的腰鞭毛虫萤光素酶,其相对于相应野生型腰鞭毛虫萤光素酶例如腰鞭毛虫萤光素酶如Lingulodinium polyedrum萤光素酶、 Pyrocystis lunula萤光素酶或者具有SEQ ID NO :21序列的萤光素酶具有增强的发光。所述修饰的萤光素酶在相应于SEQ ID NO :1中第166位残基的位置具有除了天冬酰胺之外的残基如精氨酸,以及任选地在相应于SEQ ID NO :1第5位残基的位置具有脯氨酸、在相应于 SEQ ID NO :1第8位残基的位置具有甘氨酸、在相应于SEQ ID NO 1第9位残基的位置具有精氨酸、在相应于SEQ ID N0:1第10位残基的位置具有色氨酸、酪氨酸或者苯丙氨酸、在相应于SEQ ID NO :1第144位残基的位置具有苯丙氨酸和/或在相应于SEQ ID N0:1第 147位残基的位置具有苏氨酸,或者其任意组合。在一个实施方案中,所述修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基是赖氨酸。在另一个实施方案中,所述修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基是精氨酸。在一个实施方案中,所述修饰的萤光素酶中相应于SEQ ID NO :1第166位残基的残基能够与在接近修饰的萤光素酶 N末端的相应于SEQ ID NO :1第9位残基的位置的羰基或者侧链形成一或多个分子内氢键或者离子键。在一个实施方案中,所述修饰的萤光素酶没有信号肽序列。在一个实施方案中,所述修饰的萤光素酶与SEQ ID NO :21具有至少60%氨基酸序列相同性,如至少 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或者 99%但是低于100%的氨基酸序列相同性。本发明的修饰的萤光素酶包括具有改变发光颜色的额外氨基酸取代的修饰的萤光素酶可与修饰的荧光素用于发光反应中产生改变的发光颜色。本发明进一步提供了修饰的萤光素酶,其具有FABP β -桶相关3D结构结构域,该修饰的萤光素酶具有这样的取代,其导致β桶的末端β折叠通过分子内氢键或者离子键以及任选地另外的非共价键如通过分子内氢键或离子键与相邻二级结构非共价结合。本发明的实施方案还提供了修饰的十足目动物或者腰鞭毛虫萤光素酶,其相对于相应野生型十足目动物或者腰鞭毛虫萤光素酶具有增强的发光及在相应于SEQ ID Ν0:1第 166位残基的位置具有精氨酸、赖氨酸、丙氨酸、亮氨酸、脯氨酸、谷氨酰胺或者丝氨酸以及至少一个氨基酸取代。在一个实施方案中,所述修饰的萤光素酶中的至少一个氨基酸取代是在相应于 SEQ ID NO :1 中第 4、11、33、44、45、54、75、104、115、124、135、138、139、167 或者 169位残基的位置中的取代或者其组合,如相对于具有增强的发光及在相应于SEQ ID NO 1 第166位残基的位置具有精氨酸、赖氨酸、丙氨酸、亮氨酸、脯氨酸、谷氨酰胺或者丝氨酸的修饰的萤光素酶导致增强的发光的取代。在一个实施方案中,本发明的修饰的萤光素酶在N末端、C末端或者这两端具有一或多个异源氨基酸序列(融合多肽,如具有表位或者融合标记的融合多肽),其任选与感兴趣的分子直接或者间接相互作用。在一个实施方案中,异源序列的存在在与感兴趣的分子相互作用之前或者之后基本上不改变修饰的萤光素酶的发光。在一个实施方案中,所述异源氨基酸序列是表位标记。在另一个实施方案中,所述异源氨基酸序列是在与感兴趣的分子相互作用期间或之后经历构象变化的序列,其随之改变萤光素酶的活性,如具有这种氨基酸序列的修饰的OgLuc可用于检测别构相互作用。所述修饰的萤光素酶或者与所述修饰的萤光素酶或者其片段的融合物可用作报道分子。在一个实施方案中,本发明的萤光素酶的片段与异源氨基酸序列融合,所述融合从而形成β桶,该融合蛋白能从天然发生的荧光素或者其衍生物中产生发光。本发明还提供了编码本发明修饰的萤光素酶或者其融合物的多核苷酸,具有所述多核苷酸或者修饰的萤光素酶或者其融合物的分离的宿主细胞,以及使用本发明的多核苷酸、修饰的萤光素酶或者其融合物或者宿主细胞的方法。
本发明进一步提供了鉴别感兴趣的蛋白质中位于不同的二级结构如由不是二级结构一部分的5或更多个氨基酸分隔的且能彼此形成氢键或者离子键的结构中的氨基酸位置。所述方法包括将感兴趣蛋白质的氨基酸序列中推测的二级结构与整体无序列相似性如与所述感兴趣蛋白质低于30%相同性的一或多个蛋白质的二级结构进行对比。所述一或多个蛋白质具有确定的3D结构,以及至少一个蛋白质具有与至少一个第一二级结构相关的第一残基,其分别在侧链之间或者在接近或者位于与第二二级结构相关的第二残基的 5-10个残基内的主链羰基的侧链之间形成氢键或者离子键,如盐桥。在一个实施方案中, 所述第一二级结构是所述第二二级结构的C末端。在另一个实施方案中,所述第一二级结构是所述第二二级结构的N末端。然后确定感兴趣的蛋白质是否具有相应于所述一或多个蛋白质中至少第一二级结构的一或多个二级结构,以及如果具有的话,则确定感兴趣的蛋白质中相应于所述一或多个蛋白质中所述第一残基、第二残基或者这两个残基的氨基酸位置。在一个实施方案中,一个二级结构是31(|螺旋或者β-桶。在一个实施方案中,感兴趣的蛋白质是萤光素酶。在一个实施方案中,所述第一残基能与所述第二残基的5个残基内的一或多个主链羰基形成氢键或者离子键。在一个实施方案中,所述一或多个蛋白质是脂肪酸结合蛋白。本发明的修饰的萤光素酶中的氨基酸残基可以是L-构型、D-构型或者非天然发生的氨基酸如正亮氨酸、L-乙硫氨酸、β -2-噻吩基丙氨酸、5-甲基色氨酸正缬氨酸、L-刀豆氨酸、P-氟代苯丙氨酸、P-(4-羟基苯甲酰)苯丙氨酸、2-酮-4-(甲基硫)丁酸、β-羟基亮氨酸、Y -氯代正缬氨酸、Y -甲基-D-亮氨酸、β -D-L羟基亮氨酸、2-氨基-3-氯代丁酸、N-甲基-D-缬氨酸、3,4- 二氟-L-苯丙氨酸、5,5,5-三氟亮氨酸、4,4,4,-三氟-L-缬氨酸、5-氟-L-色氨酸、4-叠氮-L-苯丙氨酸、4-苯甲基-L-苯丙氨酸、硫代脯氨酸、5,5, 5-三氟亮氨酸、5,5,5,5' ,5' ,5'-六氟亮氨酸、2-氨基-4-甲基-4-戊烯酸、2-氨基-3, 3,3-三氟-甲基戊酸、2-氨基-3-甲基-5,5,5-三氟戊酸、2-氨基-3-甲基-4-戊烯酸、三氟缬氨酸、六氟缬氨酸、高半胱氨酸、羟基赖氨酸、鸟氨酸以及通过本领域已知方法具有肽键任选由如下连接置换的那些--CH2NH—、-CH2S-, -CH2-CH2-, -CH = CH—(顺式和反式)、-COCH2-, -CH(OH) CH2-和一CH2S0-。为了保持标准多肽命名,对天然发生的氨基酸残基的缩写在如下对应表中示出。对应表1个字母3个字母氮基酸
YTVr酪氨酸 G Gly L*甘氨酸
FFheL·苯丙氮酸
MMetL·甲硫氨酸
AAlaL-丙氨酸
SSerL-丝氨酸
IlieL·异亮氨酸
LLeuL·亮氨酸
TThrL·苏氨酸
VValL-缬氨酸 PProL-脯氨酸 KLysL-赖氨酸 HHisL-组氨酸 QGlnL·谷氨酰胺 EGluL-谷氨酸 WTrpL-色氨酸 RArgL-精氨酸 DAspL-天冬氮酸 NAsnL-天冬酰胺 CCysL,半胱氨酸如本文所用,增强的发光可包括如下任何定义增加的光发射,改变的光发射动力学,如更高的光强度稳定性,或者改变的发光颜色,如朝向更短或更长波长的移动。术语“同源性”是指两或更多个序列之间的互补性程度。可以是部分同源性或者完全同源性(即相同性)。同源性通常使用序列分析软件测量(如“GCG”和“kqweb"Sequence Analysis Software Package, 由 Genetics Computer Group 销售,University of Wisconsin Biotechnology Center. 1710University Avenue. Madison,WI 53705)。这禾中软件通过对各种取代、缺失、插入及其它修饰指定同源性程度而匹配相似序列。保守取代典型包括如下组内的取代甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。关于核酸或者多肽使用的术语“分离的”如“分离的寡核苷酸”、“分离的多核苷酸”、“分离的蛋白质”或者“分离的多肽”是指核酸或者氨基酸序列与其来源通常相关的至少一种污染物被鉴别及分开。因此,分离的核酸或者分离的多肽以与其天然发现不同的形式或者状态存在。相反,非分离的核酸(如DNA和RNA)或者非分离的多肽(如蛋白质和酶)以其天然存在的状态发现。例如,指定的DNA序列(如基因)在相邻基因附近的宿主细胞染色体上发现;RNA序列(如编码特定蛋白质的特定mRNA序列)作为与编码众多蛋白质的许多其它mRNA的混合物在细胞中发现。然而,分离的核酸包括例如这样的核酸,在通常表达所述核酸的细胞中,其中所述核酸位于与天然细胞中不同的染色体位置或者另外地其两侧具有与天然发现的不同的核酸序列。分离的核酸或者寡核苷酸可以单链或者双链形式存在。当分离的核酸或者寡核苷酸用于表达蛋白质时,所述寡核苷酸含有最低限度的有义链或者编码链(即单链核酸),但是可含有有义链和反义链二者(即双链核酸)。如本文所用,术语“核酸分子”、“多核苷酸”或者“核酸序列”是指包含产生多肽或者蛋白质前体必需的编码序列的核酸、DNA或者RNA。编码的多肽可以是全长多肽、其片段 (少于全长)、或者全长多肽或者其片段与另一多肽的融合,产生融合多肽。“刺虾萤光素酶”是天然35kDa和19kDa蛋白质的复合物。所述19kDa蛋白质是最小的催化成分(GenBank登记号BAB13776,196个氨基酸)。如本文所用,OgLuc是没有信号肽的19kDa蛋白质(169个氨基酸,BAB13776的第观_196位残基)。“肽”、“蛋白质”和“多肽”是指任何氨基酸链,无论其长度或者翻译后修饰(如糖基化或者磷酸化)如何。本发明的核酸分子编码各种天然发生的蛋白质或者其多肽片段, 其具有与其从中衍生的天然发生的(天然或野生型)蛋白质的氨基酸序列具有至少60%如至少 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或者 99%但是低于 100% 的氨基酸序列相同性的氨基酸序列。术语“融合多肽”或者“融合蛋白”是指嵌合蛋白质,其含有在N和/或C末端结合一或多个异源序列(如非萤光素酶多肽)的参考蛋白质(如萤光素酶)。蛋白质一级结构(一级序列、肽序列、蛋白质序列)是氨基酸序列。通常从氨基末端(N)开始至羧基末端(C)报道。蛋白质二级结构可以描述为不依赖于剩余蛋白质的肽链的局部构象。存在“规则的” 二级机构元件(如螺旋、片层或者链),其通常由参与残基的主链原子之间的氢键相互作用稳定,以及存在“不规则的” 二级结构元件(如转角、 弯曲、环、卷曲、混乱的或者无结构的节段)。蛋白质二级结构可以用不同的方法/程序推测,如 PSIPRED (McGuffin et al. , Bioinformatics, 16 :404(2000)). PORTER (Pol Iastri et al. , Bioinformatics,21 1719 (2005))、DSC (KinR and SternberR, Protein Sci.,5 2298(1996)),见 http://www. expasy. orR/tools/#secondary 所示。蛋白质三级结构是肽链的整体三维(3D)结构。在三维空间通过原子位置描述,且其可包含在一级结构中远程基团之间的相互作用。蛋白质三级结构被分类为折叠,其是二级结构元件的特异性三维排列。 有时在具有相同折叠的蛋白质之间无可辨识的序列相似性。如本文所用,术语“野生型,,或者“天然的,,是指具有分离自天然发生来源的基因或者基因产物的特性的基因或基因产物。野生型基因是在群体中最常见的基因且因此被命名为基因的“野生型”形式。相反,术语“突变体”是指当与野生型基因或者基因产物相比时在序列和/或功能性质中显示修饰(即改变的特性)的基因或者基因产物。需要注意天然发生的突变体可以是分离的;这些突变体通过其与野生型基因或者基因产物相比具有改变的特性而鉴别。I.举例的多核苷酸和蛋白质本发明包含修饰的萤光素酶或者其蛋白质片段,如具有缺失如缺失1至大约5个残基的那些,以及其嵌合物(融合物)(见美国申请系列号60/985,585和11/732,105,所述文献内容援引加入本文),其相对于野生型萤光素酶具有至少一个氨基酸取代,该取代导致修饰的萤光素酶具有增强的稳定性、增强的发光如增加的光发射、更高的发光动力学稳定性或者改变的发光颜色,或者这二者。修饰的萤光素酶的萤光素酶序列与相应野生型萤光素酶的氨基酸序列基本上相同。具有基本上相同序列的多肽或者肽是指氨基酸序列大部分但不是全部相同,保留其相关序列的功能活性。通常,两个氨基酸序列如果具有至少60 %如至少 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或者 99%、但是低于 100% 的氨基酸序列相同性,则这两个序列是基本上相同或者基本上同源的。在一个实施方案中,
15所述修饰的萤光素酶由重组多核苷酸编码。同源性或者相同性通常使用序列分析软件测量。这种软件通过给各种缺失、取代及其它修饰指定同源性程度而匹配相似序列。关于两或更多个核酸或者多肽序列的术语 “同源性”和“相同性”是指通过使用任何序列对比算法或者通过人工排列对比和目测进行测量,两或更多个序列或者子序列当在对比窗或者指定区域中以最大对应性对比和排列时是相同的或者具有指定百分比的氨基酸序列或核苷酸。对于序列对比,典型地一个序列作为参考序列,检测序列与其相对比。当使用序列对比算法时,将检测序列和参考序列输入计算机,如果需要则指定子序列配对物以及指定序列对比算法程序参数。可以使用默认程序参数,或者可以指定其他参数。然后序列对比算法基于程序参数计算检测序列相对于参考序列的序列相同性百分比。序列排列对比方法为本领域熟知。最佳的序列排列对比可以通过如下方法进行 Smith et al. (1981)的局部同源性算法,Needleman et al. (T. Mol. Biol. ,48 :443(1970) 的同源性排列对比算法,Person et al.的相似性检索法(Proc. Natl. Acad. Sci.USA,85, 2444 (1988)),这些算法的计算机执行程序(GAP、BESTFIT、FASTA 和 TFASTA,在 Wisconsin Genetics软件包中 ,Genetics Computer Group, 575 Science Dr. ,Madison,WI),或者通过人工排列对比和目测。可利用这些数学算法的计算机执行程序进行序列对比以确定序列相同性。这种执行程序包括但不限于PC/Gene 中 CLUSTAL(得自 htelligenetics,Mountain View, California) ;ALIGN 程序(2· 0 版)和 GAP、BESTFIT、BLAST、FASTA 及 TFASTA,在 Wisconsin Genetics 软件包中,第 8 版(得自 Genetics Computer Group (GCG), 575Science Drive, Madison, Wisconsin, USA)。使用这些程序的排列对比可以使用默认参数进行。CLUSTAL 程序由 Higgins et al.,Gene, 73 :237(1988) ;Higgins et al.,CABI0S,5 :157(1989); Corpet et al.,Nucl. Acids Res.,16 1088(1988) ;Huang et al.,CABI0S,8 :155(1992); 和 Pearson et al.,Methods Mol. Biol.,24 :307 (1994)详细描述。ALIGN 程序基于 Myers 和 Miller,LABI0S,4 :11 (1988)的算法。Altschul et al.的 BLAST 程序(J. Mol. Biol., 215 :403(1990))基于 Karlin 和 Altschul 的算法(PNAS USA, 90 :5873 (1993))。进行 BLAST 分析的软件可通过 National Center for Biotechnology Information(http://www. ncbi. nlm. nih. gov/)公开获得。这个算法包含首先鉴别高分序列对(HSP),通过鉴别询问序列中长度W的短字进行,当其与数据库序列中相同长度的字排列对比时匹配或者满足一些正值阈值得分Τ。T是指相邻字得分阈值(Altschul et al., J. Mol. Biol.,215 :403 (1990))。这些最初的相邻字命中(word hit)作为最初检索以发现含有其的较长HSP的种子。然后所述字命中沿着每个序列的两个方向延伸,只要累积排列对比得分可以增加。累积得分对于核苷酸序列使用参数M(对于一对匹配残基的奖励得分; 总是> 0)和N(对于错配残基的罚分;总是< 0)计算。对于氨基酸序列,得分矩阵用于计算累积得分。由于一或多个负分残基排列对比的累积或者任一序列达到末端所致,当累积排列对比得分从其最大获得值的数量X下降时,累积得分转到为O或者低于0,每个方向中字命中的延伸停止。除了计算序列相同性百分比之外,BLAST算法还进行两个序列之间相似性的统计学分析(见如 Karlin and Altschul, PNAS USA, 90 :5873 (1993)。由 BLAST 算法提供的一种相似性测量是最小和概率(smallest sum probability) (P(N)),其提供了两个核苷酸或者氨基酸序列之间的匹配偶然发生的概率指示。例如,如果检测核酸序列与参考核酸序列对比中最小和概率低于大约0. 1、更优选低于大约0. 01、最优选低于大约0. 001,则认为检测核酸序列与参考序列相似。为了获得缺口排列对比以进行对比,如Altschul et al. (Nuc. Acids Res. ,25 3389(1997))所述,可利用 Gapped BLAST (BLAST 2.0)。或者,PSI-BLAST (BLAST 2.0)可用于进行重复检索,检测分子之间的远距离关系。见Altschul et al.,如前。当利用BLAST、 Gapped BLAST、PSI-BLAST时,可以使用各个程序的默认参数(如BLASTN针对核苷酸序列, BLASTX针对蛋白质)。BLASTN程序(针对核苷酸序列)使用默认参数,字长(W) = 11,期望值(E) = 10,截断值=100,M = 5,N = -4,对比两条链。对于氨基酸序列,BLASTP程序使用默认参数,字长(W) = 3,期望值(E) = 10,以及BL0SUM62得分矩阵(见Henikoff and Henikoff, PNAS USA,89 :10915 (1989))。见 www, ncbi.nlm. nih. gov。特别地,一种多肽可以与另一(参考)多肽基本上相关,除了保守或者非保守变异之外。保守变异是指氨基酸残基由另一生物学相似残基置换,包括天然发生或者非天然发生的氨基酸残基。举例的保守变异包括一个疏水性残基如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸由另一残基取代,或者一个极性残基由另一残基取代,如赖氨酸取代精氨酸、天冬氨酸取代谷氨酸或者天冬酰胺取代谷氨酰胺等。其它举例的保守取代包括如下改变丙氨酸变为丝氨酸;精氨酸变为赖氨酸;天冬酰胺变为谷氨酰胺或者组氨酸;天冬氨酸变为谷氨酸;半胱氨酸变为丝氨酸;谷氨酰胺变为天冬酰胺;谷氨酸变为天冬氨酸;甘氨酸变为脯氨酸;组氨酸变为天冬酰胺或者谷氨酰胺;异亮氨酸变为亮氨酸或者缬氨酸;亮氨酸变为缬氨酸或者异亮氨酸;赖氨酸变为精氨酸、谷氨酰胺或者谷氨酸;甲硫氨酸变为亮氨酸或者异亮氨酸;苯丙氨酸变为酪氨酸、亮氨酸或者甲硫氨酸;丝氨酸变为苏氨酸;苏氨酸变为丝氨酸;色氨酸变为酪氨酸;酪氨酸变为色氨酸或者苯丙氨酸;缬氨酸变为异亮氨酸变为亮氨酸。本发明修饰的萤光素酶具有保守或者非保守取代,其导致增强的稳定性、发光或者这 ■~ 者 O本发明的修饰的萤光素酶蛋白和融合蛋白可以通过重组方法或者通过固相化学肽合成方法制备。这种方法为本领域已知。π.一旦制备了编码修饰的萤光素酶、其片段如具有发光活性或者可以通过另一分子互补而导致发光活性、或者其具有发光活性的融合物的希望的核酸分子,则可以制备编码所述修饰的萤光素酶、其片段如用于互补的片段或者其具有发光活性的融合物的表达盒。 例如,包含编码修饰的萤光素酶的核酸序列的核酸分子任选与转录调节序列如一或多种增强子、启动子、转录终止序列或者其组合可操纵地连接以形成表达盒。所述核酸分子或者表达盒可以导入载体中,如质粒或者病毒载体中,其任选包含选择标记基因,所述载体导入感兴趣的细胞中,如原核细胞如大肠杆菌(E.coli)、链霉菌(Sti^ptomyces spp.)、芽孢杆菌 (Bacillus spp·)、葡萄球菌(Staphylococcus spp.)等,以及真核细胞包括植物(双子叶植物或者单子叶植物)、真菌、酵母如毕赤氏酵母(Pichia)、酵母菌属(Saccharomyces)或者裂殖酵母属(Schizosaccharomyces),或者哺乳动物细胞、其裂解物,或者导入体外转录 /翻译混合物。哺乳动物细胞包括但不限于牛、山羊、绵羊、犬、猫、非人灵长类动物如猿猴以及人细胞。哺乳动物细胞系包括但不限于CH0、C0S、293、HeLa、CV-l、SH-SY5Y、HEK293和 NIH3T3 细胞。编码的修饰的萤光素酶的表达可以由能在原核细胞或者真核细胞中表达的任何启动子包括合成启动子控制。原核启动子包括但不限于SP6、T7、T5、tac、bla、trp、gal、lac 或者麦芽糖启动子,包括具有启动子活性的任何片段。真核启动子包括但不限于组成型启动子,如病毒启动子如CMV、SV40和RSV启动子,以及可调节启动子如可诱导或者可阻抑启动子,如tet启动子、hsp70启动子以及由CRE调节的合成启动子,包括具有启动子活性的任何片段。本发明的核酸分子、表达盒和/或载体可以通过任何方法包括但不限于钙介导的转化、电穿孔、显微注射、脂染等导入细胞中。III.编码修饰的帝光素酶的优化的序列及载体和宿主细胞本发明还提供了分离的核酸分子(多核苷酸),其包含编码本发明的修饰的萤光素酶、其片段或者其融合物的核酸序列。在一个实施方案中,分离的核酸分子包含被优化以在至少一种选择的宿主中表达的核酸序列。优化的序列包括密码子被优化的序列,即在一种生物体中相对于另一种生物体如远相关生物体更频繁应用的密码子,以及加入或者修饰 Kozak序列和/或内含子的修饰,和/或除去不希望的序列如潜在转录因子结合位点。这种优化的序列当导入宿主细胞中时可以产生增强的表达,例如蛋白质表达水平增加。在一个实施方案中,所述多核苷酸包括编码本发明修饰的萤光素酶的核酸序列, 该核酸序列被优化以在哺乳动物宿主细胞中表达。在一个实施方案中,优化的多核苷酸不再与相应的非优化的序列杂交,如在中等或者高严格条件下与未优化的序列不杂交。术语 “严格性”用于描述关于温度、离子强度和存在其它化合物的条件,在此条件下进行核酸杂交。“高严格性”条件是指核酸碱基配对仅在具有高频率互补碱基序列的核酸片段之间发生。因此,当希望彼此不完全互补的核酸一起杂交或者退火时,通常要求“中等”或者“低” 严格性。本领域已知许多等价条件可用于包含中等或者低严格性条件。在另一个实施方案中,所述多核苷酸与相应未优化的序列具有低于90%如低于80%的核酸序列相同性,及任选编码与未优化的序列编码的多肽具有至少60%如至少 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或者 99%但是低于 100%的氨基酸序列相同性的多肽。本发明还提供了包含所述分离的核酸分子如具有优化的核酸序列的构建体如表达盒和载体,以及包含所述分离的核酸分子、构建体或者载体的试剂盒。包含编码本发明修饰的萤光素酶、其片段或者其融合物的核酸序列的核酸分子任选被优化以在特定宿主细胞中表达,且也任选与转录调节序列如一或多种增强子、启动子、 转录终止序列或者其组合可操纵地连接以形成表达盒。在一个实施方案中,编码本发明修饰的萤光素酶、其片段或者其融合物的核酸序列通过用优先用于特定(选择的)细胞中的密码子置换野生型萤光素酶序列中的密码子如至少25%的密码子而被优化。优选的密码子具有在选择的细胞中相对高的密码子使用频率,且优选其导入导致导入对于选择的宿主细胞中存在的转录因子相对少的转录因子结合位点,以及导入相对少的其它不希望的结构属性。因此,优化的核酸产物由于改良的密码子使用频率及由于降低不希望的转录调节序列的数目而降低不适当的转录行为的危险而可具有改良水平的表达。分离的及优化的核酸分子可具有这样的密码子组成,其在30^^35^^40%以上或者45 %以上如50 %、55 %、60 %或更多的密码子处不同于相应野生型核酸序列的密码子。举例的用于本发明中的密码子是在特定生物体中比相同氨基酸的至少一个其它密码子更频繁被采用的那些密码子,以及在一个实施方案中也是在该生物体中非低使用密码子及在用于克隆或者筛选以表达核酸分子的生物体中也是非低使用密码子。此外,某些氨基酸 (即具有三或更多个密码子的那些氨基酸)的密码子可包括比其它(非优选的)密码子更频繁被采用的两或更多个密码子。所述核酸分子中存在在一种生物体中比在另一生物体中更频繁被采用的密码子导致当该核酸分子被导入更频繁采用这些密码子的生物体细胞中时,其在这些细胞中以高于野生型或者亲代核酸序列在这些细胞中的表达的水平表达。在本发明的一个实施方案中,不同的密码子是在哺乳动物中更频繁被采用的那些密码子,而在另一实施方案中,不同的密码子是在植物中更频繁被采用的那些密码子。不同生物体的优选密码子为本领域已知,如见w驟.kazusa. or. jp. /codon/所述。特定类型的哺乳动物如人与另一类型哺乳动物相比可具有不同的优选密码子组。同样,特定类型的植物与另一类型植物相比可具有不同的优选密码子组。在本发明的一个实施方案中,大多数不同的密码子是在希望的宿主细胞中优选的密码子。本领域已知生物体包括哺乳动物(如人)和植物的优选密码子(如 Wada et al. ,Nucl. Acids Res. ,18 :2367(1990) ;Murray et al. , Nucl. Acids Res. ,17 :477(1989))。IV.举例的稳定件增强的帝光素酶自深海虾细角刺虾中分泌的萤光素酶已经示出具有许多感兴趣的特性,如高活性、高量子产量以及广泛底物特异性(coelenterazine、coelenterazine类似物)。当 coelenterazind荧光素)与分子氧的氧化反应由刺虾萤光素酶催化时,发生刺虾的生物发光反应,导致在462nm最大强度的光以及产物CO2 *coelenteramide (Shimomura et al., Biochemistry, 17 :994(1978);这与 houye2000 提及的 454nm 不同)。最佳发光在 pH9 在存在0. 05-0. IM NaCl在40°C条件下发生,且由于这种酶对加热的与众不同的抗性,当使用高纯度酶时,可见发光在高于50°C的温度发生,或者当使用部分纯化的酶时,在高于70°C 温度发生。在PH 8. 7,天然萤光素酶具有大约130,000的分子量,显然包含4个31,000的单体;在较低PH,所述天然萤光素酶趋于聚合。成熟蛋白质由19kDa和35kDa蛋白质组成(由两个19kDa成分和两个35kDa成分组成的异源四聚体)。所述19kDa蛋白质(OgLuc)作为单体在大肠杆菌中过表达,示出是活性的,然而其主要作为包涵体产生。包涵体的形成可能是由于细胞内蛋白质的不稳定性所致。OgLuc的3D结构未获得。此外,还没有已知的基于同源性的模型,因为OgLuc与其它萤光素酶不具有任何序列同源性且与其它已知蛋白质不具有显著的整体序列相似性。为了产生模型,使用设计为鉴别远同源蛋白质的折叠识别方法。使用如下文所述的这种方法, 鉴别了属于calycin蛋白质超家族的一组脂肪酸结合蛋白(FABP),以及基于三个这些FABP 的3D结构产生了 OgLuc同源性模型。Calycin是一个蛋白质超家族,其成员共有相似的β -桶结构。成员包括但不限于脂肪酸结合蛋白(FABP)和脂笼蛋白(lip0Calin)。FABP蛋白质家族具有十链不连续β-桶结构;抗生物素蛋白和MPI桶尽管是八链的,但是在横切面与脂笼蛋白相比是更环状的且不具有C末端螺旋或者链I ;而triabin具有相似的桶几何结构,但是仍具有修饰的拓扑结构。FABP和脂笼蛋白的N末端和C末端链可以是紧密重叠的,丧失(FABP至脂笼蛋白)或者获得(脂笼蛋白至FABP)为实现互相转化必需的两个中心链(Flower et al.,Protein Science, 2 :753(1993)) 0此外,除了一些功能相似性之外(疏水性配体结合和/或大分子相互作用),这些家族特征在于相似的折叠模式(很大程度上+1拓扑学控制的反平行 β-桶),其中其大部分结构可以是结构相等的,尽管这些家族不共有整体序列相似性。先前的工作(Flower,ProteinPept. Lett. ,2 :341(1995))示出 calycin 超家族的成员也共有独特的结构模式。精氨酸或者赖氨酸残基(来自桶的最后链)与N末端310-样螺旋的主链羰基基团形成氢键并堆积跨过(packs across)保守的色氨酸(来自桶的第一链)。这种模式在也共有环L6的保守相互作用的核脂笼蛋白(kernel lipocalin)的结构以及在更结构多样的异常脂笼蛋白(outlier lipocalin)中可见。在包含calycin的其它四个家族中也是明显的。对链霉抗生物素蛋白和鸡抗生物素蛋白、菊欧文氏菌(Erwinia chrysanthemi)的金属蛋白酶抑制剂的可得结构以及triabin的结构的检验均显示出相互作用残基的非常相似的排列。大多数已知FABP具有与上述那些相似的侧链相互作用排列,其中来自FABP桶第一链的色氨酸堆积在来自最后链末端附近的精氨酸处。然而,一组以昆虫肌肉FABP为代表的更高度分歧的FABP缺乏这个特征。OgLuc同源性模型示出calycin折叠结构特征在OgLuc中不是完全保守的,所述特征有效地将N末端和C末端用氢键结合在一起且存在于三个FABP中。所述独特的结构特征(其中精氨酸或者赖氨酸能与短310螺旋的主链羰基形成许多潜在氢键,以结构上重叠的、非随机方式堆积跨过保守的色氨酸)相应于calycin成员家族共有的序列决定簇特征性N末端序列模式,显示出关键残基的保持以及较弱的C末端基序。在家族成员中特定残基和相互作用的保持支持了这样的观点,即如果非常远,则存在calycin超家族的共同进化来源。本OgLuc模型预测接近C末端的OgLuc残基Asnl66不能与接近N末端的主链羰基形成氢键。然而,在第166位含有Arg或Lys的突变体的模型提示这种结构基序的恢复可改良OgLuc的结构稳定性及其在细胞中的表达/活性。本发明通过如下非限制性实施例进一步描述。实施例1OgLuc的缺点可以通过蛋白质工程解决,但是以有效方式进行需要关于OgLuc三维(3D)结构的知识。还没有公布的OgLuc的实验性三级结构或者三级结构模型。同源性建模用于产生OgLuc的三级结构模型。建造同源性模型包括几个步骤,包括鉴别3D结构模板、靶序列(如OgLuc)和模板结构的排列对比、模型建造以及模型质量评估。针对OgLuc 的一或多个3D结构模板的鉴别不是直觉性的,因为标准序列检索方法未鉴别与具有已知三级结构的蛋白质的显著整体相似性。为了克服这个问题,使用两种方法鉴别具有已知三级结构的远OgLuc同系物。方法1 基于的 Hidden Markov Model (HMM)模板文库检索(KarpIus et al., Bioinformatics, 14 :846 (1998))用于检测远相关模板结构,使用SWISS-MODEL模板鉴另O 工具,见 http://swissmodel. expasy. org//SWISS-M0DEL· html(Arnold et al., Bioinformatics,22 195 (2006))。使用这种方法鉴别的OgLuc最佳(最高E-值得分)3D结构模板是脂肪酸结合蛋白(FABP) (Protein Data Bank(PDB) gid^ 1VYF) (Angelucci et al. ,Biochemistry,43 13000 (2004) ) 0也鉴别了具有较低得分的其它FABP,包括PDB登记号IPMP和1CRB。下文示出了举例的靶序列(OgLuc,1-2和168-169残基省略)和鉴别的3D结构模板(1VYF、1PMP、1CRB)的序列的排列对比。注意由于低序列相似性,序列排列对比中的缺口放置可以变化。
vyf1 GSMSSFLGKWKLSESHNFDAVMSKLGVSWATRQIGNTVTPTVTFTMDGDK., 50
FSWNDV @ iS VTPQ
靶3 --LADFVGDWQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENgl 52
Ivyf 51 .......MTMLTESTFKN. .LSCTFKF.....................GEEF 72
IFFK
m53 kadihvilPYEGLSGFQMgllEMlFKVvypvddhhfkiilhygtlvidGVTP 104
Ivyf 73 DEKTSDGRNVKSWEKNSESKLTQTQVDPKNTTVIVREV.DGDTMKTTVTVG 123
@RMIVT
靶 105 NMIDYFGRPYPGIAVFDGKQITVTGTLWNGNKIYDERLIηPDGSLLFRVTIN 15β
Ivyf 124 DVTAIRNYKRLS 135 (SEQ ID NO;5) W R
華巴 157 GVTGWRLCENI 167 (SEQ ID NO:7)
Ipmp3 SNKFLGTWKLVSSEMFDEYMKALGVGLATRKLGNLAKPRVIISKKGDI---- 48
FGWN DGLG PG
靶3 LADFVGDWQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENglka 54
Ipmp 49 ....................ITIRTESPFKNTEISFKL........GQEFEE 72
PLG IB55 dihviipyeglsgfqmglieMIFKWYPVDDHHFKIILhygtlvidGVTPNM 106
Ipmp 73 TTADNRKTKSTVTLARGSLNQVQK. WNGNETTIKRKL . VDGKMWECKMKDV 122
RWMSM R BOV
靶 107 IDYFGRPYPGlAVFDGKQITVTGTlWNGNKIYDERLInPDGSLLFRVTINGV 15B
Ipmp 123 VCTRIYEKV 131 (SEQ ID MO:3) R E
I 159 TGWRLCEN1 167 (SEQ XD NO :7)
Icrb1 PVDFNGYWKMLSNENFEEYLRA.LDVNVALRKIANLLKPDKE1VQDGDH---- 48
DF @ WN LW V &
IE3 LADFVGDWQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENg 1 ka 54
Icrb 49 ....................MlIRTLSTFRNYIMDFQV........GKEFEE 72
MIG
靶 55 dihviipyeglsgf qmglieMI FKWY PVDDHHFKIILhygtlvidGVT PNM 106
Icrb 73 DLTGIDDRKCMTTVSWDGDKLQCVQK.GEKEGRGWTQWI.EGDELHLEMRAE 122
RDGIL
IG 107 --IDYFGRPYPGIAVFDGKQITVTGTlWNGNKIYDERLInPDGSLLFRVTIN 156
Icrb 123 GVTCKQVFKKVH 134 (SEQ ID NO:4) GVT
靶 157 GVTGWRLCENI- 165 (SEQ ID NO7)
方法2 也使用在 https://genesilico. pl/meta2 (Kurowski et al. , Nuc 1. Acids Res., 31 :3305(2003))描述的“GeneSilico meta-server"的折叠识别方法鉴别具有已知三级结构的远OgLuc同系物。蛋白质折叠是3D结构类别。共有相同折叠的蛋白质具有规则二级结构的相似排列,但是没必要示出蛋白质序列水平进化关联度迹象。使用这种方法,鉴别三个最高得分的3D结构模板(PDB登记号1VYF、1PMP和 1CRB)。下文示出了举例的靶序列(OgLuc)和3D结构模板(1VYF、IPMP、1CRB)的序列排列对比。注意由于低序列相似性,因此所述排列对比中缺口的精确放置难以置信预测。OgLucfPlPMP:—SNKFLGTWKLVSSENFDEYMKALGVGLATRKLGNLAKPRVIISKKG------DIITIRT
E------------------FTLADFV ⑶ WQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENGLKADIHVIIPYEGLSGFQ MGLIEMIFKVV-----SPFKNTEISFKLGQEFEETTAD-----NRKTKSTVTLARGSLNQV-QKffNGNETTIKRKLV-DG
KMVVECKMKDVYPVDDHHFKIILHYGTL—VIDGVTP 匪 IDYFGRPYPGIAVFDGKQITVTGTLWNGNKIYDERLINPDG SLLFRVTINGVVCTRIYEKV-(IPMP) (SEQ ID NO 3)TGffRLCENILA(OgLuc) (SEQ ID NO 1)OgLucfPFABP:—SNKFLGTWKLVSSENFDEYMKALGVGLATRKLGNLAKPRVIISKKG------DIITIRTES
P----------------—PVDFNGYWKMLSNENFEEYLRALDVNVALRKIANLLKPDKEIVQDG------DHMIIRTLS
T----------------GSMSSFLGKffKLSESHNFDAVMSKLGVSWATRQIGNTVTPTVTFTMDG------DKMTMLTES
T----------------FTLADFV ⑶ WQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENGLKADIHVI IPYEGLSGFQ MGLIEMIFKVV-------FKNTEISFKLGQEFEETTA-----DNRKTKSTVTLAR-GSLNQV-QKffNGNETTIKRKLV-D
GKMVVECKMKD-------FRNYIMDFQVGKEFEEDLT-—GlDDRKCMTTVSffDG-DKLQCV-QKGEKEGRGffTQffIE-G
DELHLEMRAEG-------FKNLSCTFKFGEEFDEKTS-----DGRNVKSVVEKNSESKLTQT-QVDPKNTTVIVREVD-G
DTMKTTVTVGDYPVDDHHFKIILHYGTL—VIDGVTP 匪 IDYFGRPYPGIAVFDG-KQITVTGTLWNGNKIYDERLINPD GSLLFRVTINGVVCTRIYEKV— (IPMP) (SEQ ID NO :3)VTCKQVFKKVH- (ICRB) (SEQ ID NO :4)
22
VTAIRNYKRLS- (IVYF) (SEQ ID NO :5)VTGffRLCENILA (OgLuc)(SEQ ID NO 1)使用在上述方法中产生的信息,基于三个FABP 3D结构模板(1PMP、ICRB和1VYF) 产生 OgLuc 同源性模型,使用 Discovery Studio 和 MODELER 软件(Accelrys Software Inc.)进行。图1还示出了 FABP和OgLuc的二级结构排列对比。1PMP、1CRB、IVYF是举例的具有已知3D结构的FABP序列的Protein Data Bank (www, rcsb. org)等记代码、“PDB”是指由在ftOtein Data Bank中保藏3D结构信息的作者提供的二级结构排列对比。“DSC”是指基于 DSC 方法的二级结构预测(King et al. , Protein Science, 5 :2298 (1996))。"Kabasch 和Sander,,是指基于Kabasch和Sander方法的二级结构预测(Kabasch and Sander, Biopolymers,丝2577 (198))。红色方框表示螺旋二级结构元件的大致范围,蓝色箭头表示β-折叠二级结构元件的大致范围,灰色条表示不是螺旋或者β-折叠的二级结构。 以calycin结构特征的保守残基为中心的序列基序(Flower et al.,Biochem. Biophys. Acta. ,16 :1088(2000))在所述排列对比中可见。更高度保守的N末端M0TIF1包括OgLuc残基Trp 10,较低程度保守的C末端M0TIF2包括OgLuc残基附66。对于第二个排列对比,配对蛋白质序列相同性百分比大约是=OgLuc-IPMP 14%, OgLuc-ICRB 9%, OgLuc-IVYF 15%。图2示出腰鞭毛虫萤光素酶FABP和OgLuc的二级结构排列对比。IVI3R和IHMR 是具有已知3D结构的序列的ftOtein Data Bank (www, rcsb. org)等记代码。IVPR是腰鞭毛虫萤光素酶结构域3,IHMR是人肌肉FABP,是与腰鞭毛虫萤光素酶最密切相关的蛋白质 (Schultz et al. , PNAS USA, 102 1378 (2005)) 0 “Kabasch 和 Sander,,是指基于 Kabasch 和 Sander 方法的二级结构预测(Kabasch and Sander, Biopolymers, 22 :2577 (1983))。红色方框表示螺旋二级结构元件的大致范围,蓝色箭头表示折叠二级结构元件的大致范围,灰色条表示不是螺旋或者β-折叠的二级结构。IVra具有SEQ ID N0:21所示序列; IHMR具有SEQ ID NO 22所示序列。图3示出基于FABP的3D结构重叠,OgLuc和各种FABP (分别为SEQ ID NO :1、3、 4、5和17-20)的氨基酸序列的排列对比。实施例2脂肪酸结合蛋白(FABP)属于calycin蛋白质超家族。Calycin在序列水平不具有显著的整体相似性,但是共有具有独特结构特征的相关桶结构精氨酸或者赖氨酸 (接近C末端)能与短31(|螺旋的主链羰基形成许多潜在氢键,以及堆积跨过保守的色氨酸 (接近 N 末端)(Flower et al.,Biochem. Biophys. Acta, 1482 :9 (2000))。在如实施例 1 产生的OgLuc模型中,calycin结构特征仅部分存在。接近N末端的保守的色氨酸(TrplO) (如在β-桶的N末端β-折叠中的一个)堆积跨过天冬酰胺(Asnl66)而不是接近C末端的精氨酸或者赖氨酸(如在桶的C末端β-折叠中)。所述模型预测较短的天冬酰胺侧链似乎不能与接近N末端(在桶的N末端β-折叠中)的残基形成氢键。其中产生Asnl66Arg和Asnl66Lys取代的OgLuc模型证实OgLuc中较长的精氨酸和赖氨酸侧链应能与主链羰基和/或接近N末端的残基的侧链形成一或多个键,如一或多个氢键。例如,其可与接近N末端的OgLuc残基Asp9和/或Gly8和/或Asp5形成一或多个氢键。此外,它们可以与第166位在空间上紧密接近的其它二级结构元件中的一或多个残基如Asnl44和/或Glyl47形成一或多个氢键。因此,恢复具有Asnl66Arg或Asnl66Lys突变的OgLuc中 calycin结构特征可有效地将β-桶的两个末端(或者末端桶的β _折叠)与可能的其它二级结构元件结合在一起。这样可以改良蛋白质结构的整体稳定性及因此改良OgLuc 活性。举例的OgLuc蛋白质序列是FTLADFVGDff QQTAGYNQDQ VLEQGGLSSL FQALGVSVTP IQKVVLSGENGLKADIHVII PYEGLSGFQM GLIEMIFKVV YPVDDHHFKI ILHYGTLVIDGVTPWIDYF GRPYPGIAVF DGKQITVTGT LffNGNKIYDE RLINPDGSLLFRVTINGVTG WRLCEN ILA (SEQ ID NO 1 ; 169 个氨基酸,Asnl66 粗体下划线示出)。举例的OgLuc核苷酸序列是atggtgtttaccttggcagatttcgttggagactggcaacagacagctggatacaaccaagatcaagtg ttagaacaaggaggattgtctagtctgttccaagccctgggagtgtcagtcaccccaatccagaaagttgtgctgtctggggagaatggg ttaaaagctgatattcatgtcatcatcccttacgagggactcagtggttttcaaatgggtctgattgaaatgatcttcaaagttgtttaccc agtggatgatcatcatttcaagattattctccattatggtacactcgttattgacggtgtgacaccaaacatgattgactactttggacgccctt accctggaattgctgtgtttgacggcaagcagatcacagttactggaactctgtggaacggcaacaagatctatgatgagcgcctgatcaaccca gatggttcactcctcttccgcgttactatcaatggagtcaccggatggcgcctttgcgagAACattcttgcc(SEQ ID NO 2).在上表中用大写字母表示的SEQ ID NO :2的AAC密码子相应于在SEQ ID N0:1所示成熟野生型OgLuc序列中第166位氨基酸位置。SEQ ID NO :2的核苷酸序列在起始处也包括ATG密码子(甲硫氨酸/起始信号)和GTG密码子(缬氨酸)以便于用于表达系统中。 然而,在本申请中使用的鉴别取代的残基的氨基酸编号是相对于SEQ ID NO :1所示成熟野生型OgLuc多肽序列给出的。天然发生的野生型OgLuc序列可以是最初用随后被切割的其它氨基酸合成的,导致成熟野生型多肽产生,如SEQ ID N0:1示出。例如,信号序列(例如指导新生蛋白质定向特定细胞器如内质网和/或指导蛋白质分泌)可以存在于新生蛋白质初期,随后被切割产生成熟野生型蛋白质。举例的OgLuc和三个FABP的序列排列对比如下示出。—SNKFLGTWKLVSSENFDEyMKALGVGLATRKLGNLAKPRVIISKKG------DIITIRTES
P----------—PVDFNGYWKMLSNENFEEYLRALDVNVALRKIANLLKPDKEIVQDG------DHMIIRTLS
T----------GSMSSFLGKffKLSESHNFDAVMSKLGVSWATRQIGNTVTPTVTFTMDG------DKMTMLTES
T----------FTLADFV ⑶ IQQTAGYNQDQVLEQGGLSSLFQALGVSVTPIQKWLSGENGLKADIHVIIPYEGLSGFQ MGLIE11334454
-------------FKNTEISFKLGQEFEETTA-----DNRKTKSTVTLAR-GSLNQV-QKffNGNETTIK
RKLV--------------FRNYIMDFQVGKEFEEDLT-—GIDDRKCMTTVSffDG-DKLQCV-QKGEKEGRGffT
QffIE--------------FKNLSCTFKFGEEFDEKTS-----DGRNVKSVVEKNSESKLTQT-QVDPKNTTVIV
REVD-MIFKVVYPVDDHHFKIILHYGTL—VIDGVTPNMIDYFGRPYPGIAVFDG-KfilTVTGTLWNGNKIYDE RLINP75114115124135DGKMVVECKMKDVVCTRIYEKV— (SEQ ID NO :3)GDELHLEMRAEGVTCKQVFKKVH-(SEQ ID NO :4)GDTMKTTVTV⑶VTAIRNYKRLS-(SEQ ID NO :5)KGSLLFRVTINGVTGffRLCENILA(SEQ ID NO :1)实施例3 具有增加的发光的修饰的萤光素酶变体的产生除非特别指出,则具有随机取代的起始OgLuc序列的变体是使用基于易错诱变 PCR ^MM GeneMorph II Random Mutagenesis Kit (Stratagene ;Daughtery, PNAS USA 97(5) :2029(2000))根据厂商指导以及本领域已知的NNK饱和方法产生。针对基于T7表达(Promega Corp.)在pFlK Flexi⑧载体中构建所得变体并将其用于转化KRX大肠杆菌, 使用本领域已知技术进行。所得文库在大肠杆菌中表达,筛选与起始OgLuc蛋白质相比具有增加的光发射的变体。使用本领域已知的标准测序技术鉴别每个感兴趣克隆中的氨基酸取代。具有特定突变的起始OgLuc序列的变体使用基于寡核苷酸的定向诱变试剂盒 QuikChange Site-Directed Mutagenesis Kit(Stratagene ;Kunkel, PNAS USA 82(2) 488(1985))根据厂商指导产生。实施例4 测量光发射和信号稳定性的方法将含有编码在OgLuc中具有氨基酸取代的修饰的萤光素酶变体的质粒DNA的大肠杆菌克隆在96孔平板中生长,并用走开诱导(walk away induction)方式即自诱导方式(Shagat et al. , "KRX Autoinduction Protocol :A Convenient Method for Protein Expression,” Promega Notes 98 :17 (2008))诱导 17 小时。每个变体和相应起始萤光素酶重复6个孔。使用裂解缓冲液裂解细胞,所述裂解缓冲液由150mM HEPES pH 8. OUOOmM 硫脲、0. IX PLB (Promega Corp. Cat. No. E194A)、0. lmg/mL 溶菌酶和 0. OOlU/ μ L RQl DNase组成,使用Renilla萤光素酶底物试剂(Promega Corp.)在hfinite 500 Tecan光度计上测量发光。在裂解物样品中注射“Glo” 0. 5 % tergitol测定缓冲液 ("0. 5% tergitol”)或者“Flash” RLAB缓冲液(Promega Corp.)加入之后立即进行测量,所述“Glo”0. 5% tergitol 测定缓冲液含有 150mM KClUmM CDTAUOmM DTT,0. 5% tergitol、20 μ M coelenterazine (Promega Corp.)), ^^"Flash^RLAB M^tPM^W 20 μ M coelenterazine (Promega Corp.) (RLAB)。这种在加入之后立即进行的发光测量是在T = 0时间点的测量,在各个实施方案中是测量由所述样品产生的总光输出量(发光)。对比所述变体与相应起始萤光素酶的6个重复样品的平均发光。在各个实施方案中,将发光测量根据感兴趣的起始萤光素酶例如合成的OgLuc标准化,在某些实施方案中称作改良、增加等的“倍数”(即2倍、3倍、4. 5倍等)。变体克隆的信号稳定性通过在将测定缓冲液加入样品中之后对平板进行多次重读而确定,例如每30秒或者每分钟测量发光一段时间。信号半衰期通过使用这些测量确定,对比变体与相应起始萤光素酶的6个重复样品的平均值。表示信号稳定性的半衰期根据感兴趣的相应起始萤光素酶如OgLuc进行标准化。实施例5 测量蛋白质稳定性即热稳定性的方法裂解物样品如实施例4所述从诱导的培养物制备。将在重复的96孔平板中的裂解物样品在不同温度温育,包括例如在22、30、37、42、50或者M°C。在不同时间点,将平板置于-70°C。在如实施例4所述测量发光之前,将每个平板在室温即22°C解冻10分钟。使用如实施例4所述的0. 5% tergitol测定缓冲液测定样品。如实施例4所述对于每个时间点平板在“T = 0”的测量用于确定所述蛋白质的半衰期。表示蛋白质稳定性的半衰期根据感兴趣的相应起始萤光素酶如OgLuc进行标准化。实施例6 具有增加的光发射的修饰的萤光素酶的产生为了检验恢复OgLuc中calycin结构特征是否可以改良整体蛋白质稳定性和活性,设计合成形式的OgLuc序列。该合成形式包括针对大肠杆菌和哺乳动物细胞的优化的密码子使用以及对于在第166位的Arg或Lys取代Asn的密码子。如前所述,所述编号基于SEQ ID N0:1。密码子优化(对于大肠杆菌)以及对于密码子166的核苷酸改变为Arg 或者Lys通过合成方式工程化(Gene Dynamics, LLC)。在克隆0gLuc+N166R中,AAC密码子被改变为CGT (以编码Arg)。在克隆0gLuc+N166K中,AAC密码子被改变为AAA(以编码 Lys)。将合成的OgLuc基因亚克隆进适于在细菌中过表达的载体或者TnT 兔网状细胞裂解物(Promega Corp.;针对基于T7的表达系统的pFlK Flexi 载体)中,并用于转化 KRX大肠杆菌。挑选各个克隆,生长,用鼠李糖诱导,用溶菌酶裂解以及单次冷冻-解冻,并使用Renilla萤光素酶底物试剂(Promega Corp.)在Veritas光度计上测量发光。根据厂商指导方案(Promega Corp.)进行兔网状细胞TnT 反应并如细菌裂解物相同方式进行测 Mo将该突变体与合成的亲代(即起始)0gLuc蛋白质对比总光输出的产生(发光)。 在大肠杆菌中,使用coelenterazine作为底物观测到发光改良5倍和10倍(就N166K和 N166R分别而言)。在TnT 裂解物中,所述改良在4倍至7倍之间(N166K和m66R)。这些序列(在第166位含有Arg或者Lys)代表导致增强的稳定性的OgLuc变体。分析在第166位具有氨基酸取代的各种OgLuc变体的亮度,如筛选比野生型OgLuc 至少亮1. 2倍的变体。如下取代产生比野生型OgLuc亮至少1. 2倍的变体N166K ;N166R ; N166A ;N166L ;N166P ;N166Q及N166S。(见表1)。表1示出具有氨基酸取代m66R的最亮的变体,通过相对野生型OgLuc的改良倍数示出。表1 在第166位具有氨基酸取代的OgLuc变体相对野生型OgLuc的发光改良倍数概述
权利要求
1.编码修饰的萤光素酶多肽的多核苷酸,所述修饰的萤光素酶多肽与野生型刺虾萤光素酶具有至少60%氨基酸序列相同性,其在相应于SEQ ID NO :1所示野生型刺虾萤光素酶的氨基酸的位置包含至少一个氨基酸取代,其中所述修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的发光、增强的信号稳定性及增强的蛋白质稳定性中的至少一项。
2.权利要求1的多核苷酸,其中所述编码的修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的发光并且在相应于SEQ ID NO :1的第2、4、11、20、23、28、33、34、44、45、 51、54、68、72、75、76、77、89、90、92、99、104、115、124、135、138、139、143、144、164、166、167 或者169位置中的至少一个位置具有氨基酸取代。
3.权利要求1或2的多核苷酸,其中所述修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的信号稳定性,并且在相应于SEQ ID NO 1的第4、11、20、观、33、讨、68、75、 115、124、138、143或者166位置的至少一个位置具有氨基酸取代。
4.权利要求1-3任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的蛋白质稳定性,并且在相应于SEQ ID而1的第11、20、观、33、 34、44、45、51、54、68、72、75、77、89、90、92、99、104、115、124、135、138、139、143、144、164、 166、167或者169位置的至少一个位置具有氨基酸取代。
5.权利要求1-4任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽进一步包含相应于SEQ ID NO :10所示野生型刺虾萤光素酶的N末端的萤光素酶残基的缺失。
6.权利要求5的多核苷酸,其中所述缺失为萤光素酶序列的至多27个残基。
7.权利要求1-6任一项的多核苷酸,其中所述野生型刺虾萤光素酶来自细角刺虫下(Oplophorus gracilirostris) Λ Oplophorus grimaldii、束Ij 尾束Ij 虫下(Oplophorus spinicauda)、0plophorus foliaceus、Oplophorus novaezelandiae、Oplophorus typus 或者 Oplophorus spinous。
8.权利要求1-7任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽包含相应于如下取代中的至少一个取代所述取代为相应于SEQ ID NO 1的T2S、A4E/S/R/G/D/T/L、 Q11R/V/I/L/K/T、Q20R、E23V、S28P, A33K、L34M、V44I/L、V45E、G51V、A54F/T/V/G/S/W/L/ I、F68S/Y/V、L72Q, M75R/K/Q/G/T/A, I76V、F77W、V79I、K89E、I90T/V、L92S/A/G/Q, I99V、 P104L、P115E/I/Q/L/V/G/H/R/S/C/A/T、Q124K, N135K、Y138V/I/N/T/L/C/R/M/K、D139E、 1143L、N144K、C164S、N166R/K/A/L/P/Q/S、1167V 或者 169L。
9.权利要求1-8任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽包含在相应于SEQ ID NO :1的第11、33、44、54、115、124、138和166位置的氨基酸取代。
10.权利要求9的多核苷酸,其中所述取代包括Q11R、A33K、V44I、AMF、P115E、Q1MK、 Y138I 和 N166R。
11.权利要求9或10的多核苷酸,其中所述编码的修饰的萤光素酶进一步包含在相应于SEQ ID NO 1的第4位的氨基酸取代。
12.权利要求11的多核苷酸,其中在第4位的氨基酸是谷氨酸。
13.权利要求9-12任一项的多核苷酸,其中所述编码的修饰的萤光素酶进一步包含在相应于SEQ ID NO 1的第45、135、104、139和167位的氨基酸取代。
14.权利要求13的多核苷酸,其中在第45位的氨基酸是谷氨酸,在第104位的氨基酸是亮氨酸,在第135位的氨基酸是赖氨酸,在第139位的氨基酸是谷氨酸,及在第167位的氨基酸是缬氨酸。
15.权利要求9-12任一项的多核苷酸,其中所述编码的修饰的萤光素酶进一步包含在相应于SEQ ID NO 1的第28、34、51、99和143位的氨基酸取代。
16.权利要求16的多核苷酸,其中在第28位的氨基酸是脯氨酸,在第34位的氨基酸是甲硫氨酸,在第51位的氨基酸是缬氨酸,在第99位的氨基酸是缬氨酸,及在第143位的是亮氨酸。
17.权利要求11或12的多核苷酸,其进一步包含在相应于SEQID NO 1的第20、54、 68、72、77、79、89、90、92或者164位的至少一个氨基酸的取代。
18.权利要求17的多核苷酸,其中在第20位的氨基酸是精氨酸,在第M位的氨基酸是异亮氨酸,在第68位的氨基酸是丝氨酸,在第72位的氨基酸是谷氨酰胺,在第75位的氨基酸是赖氨酸,在第77位的氨基酸是色氨酸,在第79位的氨基酸是异亮氨酸,在第89位的氨基酸是谷氨酸,在第90位的氨基酸是苏氨酸或者缬氨酸,在第92位的氨基酸是甘氨酸、谷氨酰胺、丝氨酸或者丙氨酸,及在第164位的氨基酸是丝氨酸。
19.权利要求1-8任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽包含相应于SEQ ID NO 1的第23、沘、143和166位的氨基酸取代。
20.权利要求19的多核苷酸,其中所述取代包含E23V、S28P、I143V和m66R。
21.权利要求1-8任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽包含在相应于SEQ ID NO 1的第4、34、76和166位的氨基酸取代。
22.权利要求21的多核苷酸,其中所述取代包含A4S、L34M、I76V和m66R。
23.权利要求1-8任一项的多核苷酸,其中所述编码的修饰的萤光素酶多肽包含相应于SEQ ID NO 1的第51、99和166位的氨基酸取代。
24.权利要求23的多核苷酸,其中所述取代包含G51V、I99V和m66R。
25.权利要求I-M任一项的多核苷酸,其中所述多核苷酸进一步编码与所述修饰的萤光素酶多肽连接的感兴趣的多肽,所述感兴趣的多肽和修饰的萤光素酶多肽能作为融合蛋白表达。
26.包含权利要求1-25任一项的多核苷酸的载体。
27.权利要求沈的载体,其中所述多核苷酸与启动子可操纵地连接。
28.一种细胞,其包含权利要求1-25任一项的多核苷酸或者权利要求沈或27的载体。
29.非人转基因动物,其包含权利要求观的细胞。
30.非人转基因动物,其包含权利要求1-25任一项的多核苷酸或者权利要求沈或27 的载体。
31.一种修饰的萤光素酶,其由权利要求1-25任一项的多核苷酸编码。
32.—种多肽,其由权利要求1-25任一项的多核苷酸编码。
33.一种融合蛋白,其包含由权利要求I-M任一项的多核苷酸编码的修饰的萤光素酶。
34.一种产生修饰的萤光素酶的方法,包括使权利要求观的细胞在允许所述修饰的萤光素酶表达的条件下生长。
35.一种产生修饰的萤光素酶的方法,包括将权利要求沈或27的载体在允许所述修饰的萤光素酶表达的条件下导入细胞中。
36.一种试剂盒,其包含权利要求1-25任一项的多核苷酸或者权利要求沈或27的载体。
37.一种试剂盒,其包含权利要求31的修饰的萤光素酶。
全文摘要
本发明涉及编码修饰的萤光素酶多肽的多核苷酸。所述修饰的萤光素酶多肽与野生型刺虾萤光素酶具有至少60%氨基酸序列相同性且在相应于SEQ ID NO1所示野生型刺虾萤光素酶的氨基酸的位置具有至少一个氨基酸取代。所述修饰的萤光素酶多肽相对于野生型刺虾萤光素酶具有增强的发光性、增强的信号稳定性和增强的蛋白质稳定性中的至少一项。
文档编号C12N9/02GK102459579SQ201080019477
公开日2012年5月16日 申请日期2010年5月3日 优先权日2009年5月1日
发明者G·维杜吉里斯, K·V·伍德, K·齐默尔曼, L·P·昂塞尔, M·G·伍德, M·哈尔, P·奥托 申请人:普罗梅加公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1