稳定化逆转录酶融合蛋白的制作方法

文档序号:3570438阅读:253来源:国知局
专利名称:稳定化逆转录酶融合蛋白的制作方法
稳定化逆转录酶融合蛋白继续申请数据本申请要求于2009年3月4日提交的美国临时申请序号61/157,332的权益,上述申请通过引用结合到本文中。政府资助本工作至少部分受到来自美国国家卫生研究院卫生与公众服务部补助金号 GM37949-22的支持。美国政府可拥有本发明中的特定权利。
背景技术
逆转录聚合酶链式反应缩写为RT-PCR,是用于扩增RNA的公知技术。在RT-PCR 中,将RNA链逆转录成互补DNA (cDNA),接着在聚合酶链式反应中使用DNA聚合酶扩增互补 DNA。在该方法的第一步中,使用脱氧核糖核苷酸磷酸和逆转录酶连同DNA引物从RNA模板制备cDNA。从RNA模板合成cDNA可受到RNA 二级和三级结构的阻碍,RNA 二级和三级结构由 RNA链中的螺旋和各种其他种类的扭结组成。RNA二级和三级结构可通过在较高温度下(例如,高于50°C )进行反应或者通过加入变性添加剂来减少。然而,变性添加剂的加入是不合乎需要的,因为它经常降低逆转录酶活性。较高温度还通过降低非特异性引物结合提供增加DNA合成特异性的优点。遗憾的是,只有有限数量的能在高温下起作用的逆转录酶是目前可用的,并且它们表现出相对低保真度DNA聚合。例如,市售禽类成髓细胞性白血病病毒逆转录酶包含RNA酶H活性,并可在37°C起作用,但具有仅约1. 7 X10-4的保真度。RNA酶 H活性与DNA聚合酶活性和引物结合位点竞争,因此cDNA产出较低。因此,需要能够在较高温度下进行逆转录的逆转录酶,包括那些具有高保真度和持续合成能力的逆转录酶。这样的酶是有益的,因为较高温度减少阻碍性RNA 二级和三级结构,并通过允许使用较长和更特异的引物来增加逆转录的特异性。发明概述在一个方面,本发明提供一种稳定逆转录酶(RT)融合蛋白,其包含与稳定剂蛋白连接的热稳定逆转录酶。在稳定化逆转录酶融合蛋白的一个实施方案中,热稳定逆转录酶是细菌逆转录酶。在另一个实施方案中,细菌逆转录酶是II组内含子衍生的逆转录酶。热稳定细菌逆转录酶的实例包括细长热聚球蓝细菌(Thermosynechococcus elongatus)逆转录酶和嗜热脂肪土芽孢杆菌(GecAacillus stearothermophilus)逆转录酶。在另一个实施方案中,热稳定逆转录酶表现出高保真度cDNA合成。在又一个实施方案中,热稳定逆转录酶包含多肽,所述多肽具有与选自SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的序列实质上相似的序列同一性。稳定化逆转录酶融合蛋白包含稳定剂蛋白,当与逆转录酶连接时,其增加热稳定逆转录酶的保存期限和/或热稳定性和/或溶解度。在特定实施方案中,稳定剂蛋白是亲和蛋白或溶解度增加蛋白(例如,麦芽糖结合蛋白或N-利用物质A蛋白)。在另外的实施方案中,稳定剂蛋白通过用不带电氨基酸置换特定的带电氨基酸来修饰。 稳定化逆转录酶融合蛋白也可包含接头肽,其将热稳定逆转录酶与稳定剂蛋白连接。在一些实施方案中,该接头肽是非可切割接头,而在其他实施方案中,它是非可切割刚性接头。在一些实施方案中,接头肽由1-20个氨基酸组成,而在其他实施方案中,接头肽由 1-5个或3-5个氨基酸组成。例如,刚性非可切割接头肽可包含5个丙氨酸氨基酸。在另外的实施方案中,稳定化逆转录酶融合蛋白具有包含多肽的氨基酸序列,所述多肽具有与选自 SEQ ID NO 6,SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO 10的序列实质上相似的氨基酸序列同一性。在一些实施方案中,稳定化逆转录酶融合蛋白是能够在约45°C至约65°C的温度下以2. OX 10_5以下的错误频率进行逆转录的高保真度逆转录酶。在另外的实施方案中,稳定化逆转录酶融合蛋白能够在高达约81°C的温度下进行实质水平的逆转录。本发明的另一个方面提供一种从RNA分子制备cDNA的方法,其包括如下步骤(a) 向RNA分子中加入引物核苷酸序列,和(b)在足以合成与RNA分子的全部或部分互补的 cDNA分子的条件下,在一种或多种修饰或未修饰的脱氧核糖核苷三磷酸或双脱氧核糖核苷三磷酸和稳定化逆转录酶融合蛋白存在下孵育RNA分子,所述稳定化逆转录酶融合蛋白包含与稳定剂蛋白连接的热稳定逆转录酶。在特定实施方案中,热稳定逆转录酶通过接头肽 (例如非可切割接头肽或刚性非可切割接头肽)与稳定剂蛋白连接。优选地,逆转录在这样的温度范围内进行其中,RNA包含实质上减少量的阻碍性稳定二级或三级结构。该方法的实施方案包括其中热稳定逆转录酶是II组内含子衍生的逆转录酶的方法。在该方法的另外的实施方案中,热稳定逆转录酶包含多肽,其具有与和选自SEQ ID NO=USEQ ID NO 2、SEQ ID NO :3,SEQ ID NO :4或SEQ ID NO :5的序列实质上相似的氨基酸序列同一性;由 1-20个氨基酸组成的非可切割接头;和稳定剂蛋白是亲和蛋白或溶解度增加蛋白。在该方法其他的实施方案中,在约45°C至约65°C的温度下以2. OX 10_5以下的错误频率进行逆转录。本发明的另一方面提供一种用于生产稳定化逆转录酶融合蛋白的DNA表达载体, 所述DNA表达载体包含编码多肽的核酸,所述多肽具有与选自SEQ ID NO :6、SEQ ID NO :7、 SEQ ID NO 8, SEQ ID NO :9或SEQ ID NO 10的序列实质上相似的氨基酸序列同一性。本发明的另一方面提供一种生产稳定化逆转录酶融合蛋白的方法,其包括如下步骤(a)培养包含用于生产稳定化逆转录酶融合蛋白的DNA表达载体的宿主细胞,所述载体包含编码多肽的核酸,所述多肽具有与选自SEQ ID NO 6,SEQ ID NO :7、SEQ ID N0:8、SEQ ID NO 9或SEQ ID NO :10的序列实质上相似的氨基酸序列同一性;(b)表达由DNA表达载体编码的稳定化逆转录酶融合蛋白;和(c)从宿主细胞分离稳定化逆转录酶融合蛋白。稳定化逆转录酶融合蛋白可促进在较高温度下的cDNA合成和/或具有较高的持续合成能力和/或允许使用较长、更稳定的引物,所述引物增加逆转录的特异性(即保真度)。因此,本发明的稳定RT融合蛋白可用于多种应用,例如研究应用。应该理解,前述一般说明和下述详细说明都只是例示性和解释性的,且不限制要求保护的本发明。附图简述

图1是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO :6)。氨基酸残基1-367代表修饰的麦芽糖结合蛋白(SEQ ID N0 11);氨基酸残基368-372代表刚性接头(SEQ ID NO 12);和氨基酸残基373-935代表TeI4c ORF(SEQ ID NO :1)。图2是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO :7)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO=Il);氨基酸残基368-372代表刚性接头(SEQ ID NO 12);和氨基酸残基373-935代表1TeMf ORF (SEQ ID NO 2)。图3是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO :8)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO=Il); 氨基酸残基368-372代表刚性接头(SEQ ID NO 12);和氨基酸残基373-935代表TeI4h* ORF(SEQ ID NO :3)。图4是通过刚性接头与麦芽糖结合蛋白结合的嗜热脂肪土芽孢杆菌逆转录酶的氨基酸序列表(SEQ ID NO :9)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO=Il); 氨基酸残基368-372代表刚性接头(SEQ ID NO 12);和氨基酸残基373-1008代表嗜热脂肪土芽孢杆菌(isll ORF(SEQ ID NO :4)。图5是通过刚性接头与麦芽糖结合蛋白结合的嗜热脂肪土芽孢杆菌逆转录酶的氨基酸序列表(SEQ ID NO: 10)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO 11); 氨基酸残基368-372代表刚性接头(SEQ ID NO 12);和氨基酸残基373-792代表嗜热脂肪土芽孢杆菌 GsI2 ORF (SEQ ID NO :5)。图6是在pMAL表达构建体中细长热聚球蓝细菌的逆转录酶的MalE-TeMc开放阅读框(ORF)刚性融合体的核苷酸序列表(SEQ ID NO: 13)。图7是在pMAL表达构建体中细长热聚球蓝细菌逆转录酶的MalE_TeI4f ORF刚性融合体的核苷酸序列表(SEQ ID N0:14)。图8是在pMAL表达构建体中细长热聚球蓝细菌逆转录酶的MalE-TeI4h* ORF刚性融合体的核苷酸序列表(SEQ ID N0:15)。图9是在pMAL表达构建体中嗜热脂肪土芽孢杆菌逆转录酶的MalE-GsIl ORF刚性融合体的核苷酸序列表(SEQ ID N0:16)。图10是在pMAL表达构建体中嗜热脂肪土芽孢杆菌逆转录酶的MalE_GsI2 ORF刚性融合体的核苷酸序列表(SEQ ID N0:17)。图11提供显示在不同温度下逆转录酶(RT)活性的聚(rA)/寡(抓)42测定的图。测定的酶是 MalE-RF-GsIl、MalE-RF-(isI2、MalE-RF-TeI4c、MalE-RF-TeI4f、MalE-RF-TeI4h*、 LtrA和MalE-RF-LtrA。通过将RT (对于iTeMc为50nM、而对于所有其他RT为IOOnM)与 IOOnM 聚(rA) / 寡(dT)42 和 5μ 1 [ α -32P]-dTTP(3, OOOCi/mmol) 一起在 75mM KClUOmM MgCl2,20mM Tris-HCl, pH 7. 5和ImMDTT中孵育进行反应。在所示温度下在反应介质中预孵育RT和聚(rA)/寡(dT)42l分钟后,通过加入[α -32P]-dTTP开始反应,孵育被证实在线性范围内的时间(对于TeI4c RT为90秒、且对于所有其他RT为5分钟),并通过加入EDTA 至终浓度为250mM停止反应。[α -32P]-dTTP聚合成高分子量材料通过以下步骤定量将反应产物点于 Whatman DE81 层析纸(GE Health care Biosciences Corp)上,用 0. 3MNaCl 和0. 03M柠檬酸钠洗涤,并用Phosphorlmager扫描以定量与过滤器结合的放射性,如在材料和方法中所述。该图显示作为反应温度的函数的与过滤器结合的放射性。图12显示II组内含子RT和融合蛋白的示意图。12㈧部分提供II组内含子编码的RT和逆转录病毒RT的比较。II组内含子RT通过由Li. LtrB内含子编码的LtrA蛋白例示,通常包含4个主要结构域带保守序列区组RT-1-7的RT、X/拇指、DNA结合(D)和 DNA内切核酸酶(En)。II组内含子RT的RT和拇指结构域与通过HIV-I RT例示的逆转录病毒RT的同源,但由于N末端延伸以及保守RT序列区组上游(RT-O)和之间的插入(例如, LtrA 中的 RT-2a、3a、4a 和 7a 以及拇指结构域插入、;Blocker 等,RNA 11,14-28,2005)而较大。逆转录病毒RT的拇指结构域的三个α螺旋特征的位置对于LtrA和HIV-RT均显示。 在本工作中使用的II组内含子RT除了缺少En结构域的(isI2 RT之外都包含En结构域。 12⑶部分显示II组内含子RT融合蛋白。II组内含子RT(IEP)与融合的N末端MalE或 NusA溶解度标签一起表达。最初构建体在通过带TEV蛋白酶切割位点(下划线)的柔性接头与RT的N末端融合的表达载体PMalE-c2t中包含MalE溶解度标签。在图11中测试的这些最初构建体的变体包含缺失TEV蛋白酶切割位点的PMalE-c2t接头。改进的构建体使用修饰的MalE或NusA标签,该标签通过包含5个丙氨酸残基(下划线)的刚性接头与RT 的N末端融合。修饰的MalE标签具有的带电氨基酸残基改变为丙氨酸(斜体),且修饰的 NusA标签缺失两个C末端氨基酸残基。图13提供显示带不同刚性融合接头或溶解度标签序列的MalE-RF-TeMc RT衍生物的RT活性的图。图13(A)提供显示在60°C的RT活性的条形图。如图11使用50nM蛋白和IOOnM聚(rA)/寡(dT)42并孵育90秒,进行与MalE-RF_TeI4c RT(左条)或包含不同标签或接头序列的变体(右面的条)的反应。值是三次测定的平均,误差条表示标准差。图 13(B)提供显示NusA-RF-TeMc RT的RT活性的温度曲线的图。如图11使用50nM蛋白和 IOOnM聚(rA)/寡(dT)42并在所示温度下孵育2分钟,测定RT活性。y轴显示各蛋白(图 A)或作为反应温度函数的NusA-RF-TeMc RT (图B)的与过滤器(PhosphorImager单元) 结合的放射性。图14提供图和放射自显影图,其提供在不同温度下通过MalE-RF-TeMc、 MalE-RF-GsI2和superscript III RT活性进行cDNA合成的比较。在图(A-C)中,底物是带退火的5’-标记的37-nt引物的转录自AflIII消化的pBS KS(+)的531_nt RNA,而在图 (D-F)中,底物是带退火的5,-标记的44-nt DNA引物的1.2_kb kanR RNA。通过在以下中将 IOOnM退火的模板/引物与200nM酶孵育来进行反应对于MalE-RF-TeMc RT (图A和D)和 MalE-RF-Gs12 RT (图 B和 E),在 IOOmM KCl、20mM Tris HCl pH 7.5、10mM MgCldPlOmM DTT 中,而对于superscript III RT (图C和F),在制造商的缓冲液中。通过加入dNTP至终浓度为1. 25mM开始反应,在所示温度下孵育30分钟,并通过加入0. 1% SDS/250mM EDTA (终浓度)终止反应,然后苯酚-CIA萃取。通过在变性的6%聚丙烯酰胺凝胶中电泳分析产物, 干燥凝胶并用Wiosphorlmager定量。在各图中,顶部和底部放射自显影图分别显示包含全长产物(箭头)和未延伸或部分延伸引物的凝胶部分,而条形图基于Wiosphorlmager定量显示延伸至全长cDNA的引物百分比。“?”表示在全长产物的定量中未使用的未鉴定条带。 使用5’ -标记的10-bp梯条带anvitrogen )作为大小标记物。两种模板引物底物的示意图示于图的底部。图 15 是 1. 2-kb kanR RNA 模板的核苷酸序列表(SEQ ID NO 21)。图16提供从qRT-PCR获得的半对数图,以比较在不同温度下通过MalE-RF-TeMc RT 和 Superscript III RT 进行 cDNA 合成的量。通过 MalE-RF-iTeMc RT 或 SuperscriptIII RT (SSI 11 RT)使用带退火引物 P078(Tm = 80°C )的 1. 2_kb kanR RNA 合成 cDNA,并用 nt 188-257和nt 562-634处的引物/探针组检测(用引物组nt 188-257检测的数据示于图中,用引物组nt 562-634获得的数据示于图17中)。qPCR扩增曲线显示荧光(Δ RN) 对循环数的半对数图。对于每个样品,分析两个孔并绘于各扩增图中。通过MalE-RF-TeMc RT或superscript IIIRT进行的各cDNA合成反应的循环阈(Ct)值(荧光越过阈值0. 4的循环)示于曲线下方。较低的(^值显示较大数量的合成cDNA。图17提供从qRT-PCR获得的半对数图,以比较通过MalE-RF-TeMc RT和 superscript III RT进行cDNA合成的持续合成能力。通过MalE-RF-TeMc RT或 superscript III RT 使用带退火引物 P078 (Tm = 80°C )的 1. 2_kb kanR RNA 合成 cDNA,并用nt 188-257和nt562-634处的引物/探针组检测。cDNA样品在60°C (A、B)和65°C (C、 D)获得。对于每个样品,分析三个重复并绘于各扩增图中。平均拷贝数得自定量和稀释的 PET9质粒的标准曲线。如对于MalE-RF-TeMc RT所看到的,用两种引物组检测相似数量的cDNA拷贝显示大部分cDNA延伸至接近RNA模板的末端,这表明高持续合成能力。如对于superscript III RT所看到的,相比更靠近3’端(nt 562-634)的引物组,用接近5’端 (nt 188-257)的引物组检测的较低数量的cDNA拷贝表明,RT脱落或以某种其它方式被妨碍,而不到达RNA模板的5’端。图18是NusA溶解度增加蛋白的氨基酸序列表(SEQ ID NO 38)。发明详述除非另外定义,本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。本发明说明书中使用的术语仅用于描述具体实施方案,并非旨在限制本发明。本文提及的所有公开出版物、专利申请、专利和其他参考文献通过引用以其整体结合到本文中。定义如本发明说明书和所附权利要求中所用,除非上下文明确地另外指出,否则单数形式旨在也包括复数形式。另外,通过端点对数值范围的描述包括该范围内包含的所有数值(例如,1-5 包括 1,1. 5、2、2· 75,3,3. 80、4、5 等)。本文所用“多肽”指氨基酸多聚体,且不表示氨基酸多聚体的具体长度。因此,例如术语肽、寡肽、蛋白、抗体和酶包含在多肽的定义内。该术语亦包括带表达后修饰的多肽, 表达后修饰例如糖基化(例如糖加成)、乙酰化、磷酸化等。本文所用“分离的”多肽或多核苷酸指从其天然环境中移走的、使用重组技术生产的或者化学或酶合成的多肽或多核苷酸。优选地,本发明的多肽或多核苷酸是纯化的,即基本上不含任何其他多肽或多核苷酸和相关细胞产物或其他杂质。本文所用“氨基酸”指具有下述通式的化合物NH2-CRH-C00H,其中侧链R是H或有机基团。当R是有机基团时,R可不同且是极性的或非极性的(即疏水的)。贯穿本申请使用下列缩写A = Ala =丙氨酸、T = Thr =苏氨酸、V = Val =缬氨酸、C = Cys =半胱氨酸、L = Leu =亮氨酸、Y = Tyr =酪氨酸、I = Ile =异亮氨酸、N = Asn =天冬酰胺、P =Pro =脯氨酸、Q = Gln =谷氨酰胺、F = Phe =苯丙氨酸、D = Asp =天冬氨酸、W = Trp =色氨酸、E = Glu =谷氨酸、M = Met =甲硫氨酸、K = Lys =赖氨酸、G = Gly =甘氨酸、 R = Arg =精氨酸、S = Ser =丝氨酸、H = His =组氨酸。除非另外指出,本文使用的术语“氨基酸”亦包括仍然保留通式的氨基酸衍生物。核苷酸的组成为,通过磷酯键与戊糖(RNA中是核糖、且DNA中是脱氧核糖)连接的磷酸基团,戊糖继而与有机碱基连接。核酸的单体单元是核苷酸。天然存在的DNA和RNA 各包含四种不同的核苷酸具有腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶碱基的核苷酸存在于天然存在的DNA中,而具有腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶碱基的核苷酸存在于天然存在的 RNA中。碱基腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶通常分别缩写成A、G、C、T和U。

核苷酸包括游离的一磷酸、二磷酸和三磷酸形式(即磷酸基团分别具有一个、两个或三个磷酸部分)。因此,核苷酸包括核糖核苷三磷酸(例如ATP、UTP、CTG和GTP)和脱氧核糖核苷三磷酸(例如dATP、dCTP、dITP、dGTP和dTTP),以及其衍生物。核苷酸亦包括双脱氧核糖核苷三磷酸(ddNTP,包括ddATP、ddCTP、ddGTP、ddITP和ddTTP)及其衍生物。“实质上相似”意指给定核酸或氨基酸序列与参比序列共有至少85%、更优选至少 90%和甚至更优选至少95%的同一性。此外,总的来说,仅描述或编码其中在保守区中作出仅保守置换的蛋白的序列实质上相似。优选地,实质上相似的序列亦保留多肽的独特活性。通常视为保守置换的置换是在脂肪族氨基酸Ala、Val、Leu和Ile中的彼此置换、羟基残基Ser和Thr的互换、酸性残基Asp和Glu的交换、酰胺残基Asn和Gln之间的置换、碱性残基Lys和Arg的交换以及芳香残基Wie、Tyr间的置换。本文所用“启动子”指介导由RNA聚合酶进行的转录的起始的DNA序列。转录启动子可包含若干下述不同序列元件中的一个或多个1)存在于转录起始位点的序列元件; 2)存在于转录起始位点上游的序列元件和;幻转录起始位点下游的序列元件。各个序列元件作为DNA上的位点起作用,RNA聚合酶和促进RNA聚合酶定位到DNA上的转录因子与该位点结合。本文所用术语“聚合酶链式反应”(“PCR”)指在基因组DNA混合物中增加靶序列区段浓度而无克隆或纯化的方法。例如参见Bartlett等,Methods MoI. Biol. 226 3-6 (2003),其提供PCR及其进展的综述。该用于扩增靶序列的方法通常由以下步骤组成 将大量过量的两条寡核苷酸引物引入包含所需靶序列的DNA混合物中,然后是在DNA聚合酶存在下的系列精确的热循环。两条引物与其各自的双链靶序列的链互补。为了实现扩增, 使混合物变性,然后引物与其在靶分子内的互补序列退火。退火以后,用聚合酶延伸引物以形成新的互补链对。变性、引物退火和聚合酶延伸的步骤可重复多次,以获得高浓度的扩增的所需靶序列区段。除非另外指明,本文所用PCR亦包括PCR的变体,例如等位基因特异性 PCR、不对称PCR、热启动PCR、连接介导PCR、多重PCR、逆转录PCR或者本领域技术人员所知的任何其他PCR变体。如本说明书所用,不管在过渡性短语还是在权利要求主体中,术语“包含”和“包括”应解释为具有开放式含义。换言之,术语应解释为与短语“至少具有”或者“至少包含” 同义。当用于方法语境时,术语“包括”意指该方法至少包括列举的步骤,但可包括另外的步骤。当用于化合物或组合物语境时,术语“包含”意指化合物或组合物包含至少列举的特征或组分,但亦可包含另外的特征或组分。本文所用“融合蛋白”指具有至少两个共价连接的异源多肽的蛋白,其中一个多肽来自一个蛋白序列或结构域,而另一个多肽来自另一个蛋白序列或结构域。 稳定化逆转录酶融合蛋白
9
本发明提供稳定化逆转录酶融合蛋白,其包含与稳定剂蛋白连接的热稳定逆转录酶。在许多实施方案中,热稳定逆转录酶通过接头肽与稳定剂蛋白连接。然而,热稳定逆转录酶和稳定剂蛋白也可相互直接融合。包含融合蛋白的多肽优选从N末端到C末端连接。 然而,逆转录酶和稳定剂蛋白可按任一顺序连接在一起。例如,两个肽序列可从C端到N端连接或者从N端到C端连接。在一些实施方案中,接头肽包含在逆转录酶和稳定剂蛋白的连接C末端和N末端之间。将稳定剂蛋白与热稳定逆转录酶连接可提供一个或多个优点。稳定化逆转录酶融合蛋白可具有一个或多个下述优点(a)在高温下增加稳定性;(b)较高的持续合成能力; (c)增加溶解度,和/或(d)较高的保真度。在一些实施方案中,本发明的逆转录酶可具有多个以上列出的性质。例如,稳定化逆转录酶融合蛋白可具有增加的热稳定稳定性和增加的保真度。优点有时可源自彼此。例如,通过提供增加的溶解度,由于溶解先前不溶的高保真度热稳定逆转录酶,稳定化逆转录酶融合蛋白可提供能够提供增加的转录保真度的产物。在融合蛋白中使用稳定剂蛋白亦可提供其他优点,例如增加蛋白表达和改进蛋白折叠。 在稳定剂蛋白和热稳定逆转录酶之间包含接头肽可进一步增强这些优点。如本文所述,稳定化逆转录酶融合蛋白包含热稳定逆转录酶和稳定剂蛋白。稳定化逆转录酶融合蛋白亦可包含接头肽。例如,稳定化逆转录酶融合蛋白可具有分别示于图 1-5 的 SEQ ID N0:6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO :10 中所示的氨基酸序列。备选地,稳定化逆转录酶融合蛋白可具有与SEQ ID NO 6, SEQ ID N0:7、SEQ ID NO :8、SEQ ID NO 9或SEQ ID NO 10中所示的一个或多个序列实质上相似的氨基酸序列。与序列6-10提供的融合蛋白“实质上相似”的稳定化逆转录酶融合蛋白氨基酸序列将分享至少85%同一性、更优选90%同一性和甚至更优选95%同一性,并仅包括保守区中的保守氨基酸置换。热稳定逆转录酶本发明提供包含热稳定逆转录酶的逆转录酶融合蛋白。术语“逆转录酶”(即RNA 指导的DNA聚合酶)指一组具有逆转录酶活性的酶(即催化从RNA模板合成DNA)。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶和细菌逆转录酶(例如 II组内含子衍生的逆转录酶),以及其突变体、变体或衍生物。细菌逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)逆转录酶、细长热聚球蓝细菌逆转录酶或嗜热脂肪土芽孢杆菌逆转录酶。更多细菌逆转录酶参见Simon等,Nucleic Acids Research,36,第7219-29 M (2008)以及 Kojima 和 Kanehisa,Molecular Biology and Evolution, 25,第 1395—04 页(2008),其描述许多类别的逆转录酶(即尤其逆转录子、II组内含子和产生多样性的逆转录元件)。逆转录酶主要用于将RNA转录为cDNA,cDNA可接着被克隆到载体中用于进一步操作或者用于多种扩增方法,例如聚合酶链式反应、基于核酸序列的扩增(NASBA)、转录介导的扩增(TMA)、自动维持序列复制(3SR)、多样化引物延伸反应、5’ RACE、化学修饰的检测或者其他需要使用RNA模板合成DNA的技术。术语“热稳定的”指酶或蛋白质(例如逆转录酶)抗热灭活的能力。这样的酶通常获自已经进化成在高温环境中生长的喜温生物(即嗜热生物)。本文所用嗜热生物是具有 45°C以上的最佳生长温度和通常70°C以上的最高生长温度的生物。通常,热稳定酶比一般的酶(例如来自嗜温生物的酶)对热灭活更具抗性。因此,热稳定逆转录酶的核酸合成活性可通过热处理下降到某种程度,但比不上来自嗜温生物的逆转录酶的下降。“热稳定的” 亦指酶在高于38°C的温度下有活性,优选在约38-100°C之间,且更优选在约40-81 °C之间。 特别优选温度范围是约45°C至约65°C。在一些实施方案中,在核酸合成混合物中于90°C被加热30秒后,热稳定逆转录酶保留其至少50% (例如至少60%、至少70%、至少80%、至少90%或至少95% )的核酸合成活性。与此相反,一般逆转录酶在高温下将不起作用,在这种热处理后失去其大部分核酸合成活性。热稳定逆转录酶也通常具有较高的最佳核酸聚合温度。一些逆转录酶是热稳定的,因此在基于PCR的核酸合成中常用的温度下实质上仍有活性。这提供了能够在单一反应环境中进行逆转录和DNA扩增二者的优点。这样的温度视反应参数而不同,反应参数包括PH、模板和引物核苷酸组成、引物长度和盐浓度。热稳定逆转录酶包括细长热聚球蓝细菌(Te)RT、嗜热脂肪土芽孢杆菌(Gs)RT、这些RT的修饰形式、以及禽类成髓细胞性白血病病毒(AMV)RT、莫洛尼鼠白血病病毒(M-MLV)RT和人免疫缺陷病毒(HIV)RT的工程改造变体。可预期从生活在高温环境(即高于37°C )生物中获得的逆转录酶在生物的生存温度和合理程度以上的温度下稳定。一类特别适合在稳定化逆转录酶融合蛋白中使用的逆转录酶是II组内含子衍生的逆转录酶。许多II组内含子衍生的逆转录酶是已知的。例如参见Zimmerly实验室网址的Mobile Group II htrons (可动II组内含子),其描述105种全长II组内含子衍生的逆转录酶。该网站的使用参见Dai等,Nucleic Acids Research,31,第42416页(2003)。在特定实施方案中,热稳定逆转录酶是由II组内含子编码的酶。II组内含子RT 通常由四个保守结构域组成RT(其包含是逆转录病毒RT的手指和手掌区域特征的七个保守序列区组(RT1-7)) ;X,至少部分对应于逆转录病毒RT的拇指结构域的为RNA剪接活性所需的区);D,参与DNA靶位点识别的DNA结合结构域;和En,切割DNA靶位点以产生逆转录引物的DNA内切核酸酶结构域(图12A ;Blocker等,RNA 11,14-28,2005)。En结构域在一些II组内含子RT中缺失,这些RT改为使用DNA复制叉处的新生链以引发逆转录(Zhong 等,EMBO J. 22,4555-4565,2003)。由于N末端延伸、附加的N末端保守序列区组(RT-O) 以及在RT和X/拇指结构域的保守序列区组之间的插入(部分为非-LTR-逆转录转座子 RT所共有),因此II组内含子RT的RT和X/拇指结构域比逆转录病毒RT的大。已表明, II组内含子和相关RT的较大尺寸的RT和拇指结构域使与模板RNA的结合能够更紧密,得到在逆转录过程中更高的持续合成能力和保真度。与逆转录病毒RT不同,II组内含子RT 缺少RNA酶H结构域并通常具有很低的依赖DNA的DNA聚合酶活性(Smith等,Genes and Development 19,2477-2487,2005)。II组内含子编码一类已知其自剪接反应的RNA。在特定的体外条件下,II组内含子编码的RNA可在无蛋白帮助下将其自身从前体mRNA切除并将它们侧翼的外显子连接在一起。剪接反应机制与核前mRNA内含子的剪接相似。许多II组内含子亦编码逆转录酶 (RT)开放阅读框(ORF)并且是活性可动元件。ORF通常存在于II组内含子编码的RNA的 DIV结构域中。II组内含子RT通过稳定催化活性RNA结构辅助RNA剪接,并然后在核糖核蛋白(RNP)中保持与切除内含子RNA结合,该核糖核蛋白通过称为“反向归巢(retrohoming)” 的过程促进内含子移动性。反向归巢通过其中RNP中的切除内含子RNA直接插入DNA靶位点中并通过RT逆转录的机制发生。在反向归巢期间,II组内含子促进内含子靶向合适DNA序列,II组内含子RT必须生产内含子RNA的精确cDNA拷贝,内含子RNA通常2_2. 5kb长且折叠成高度稳定和致密的二级和三级结构。因此,II组内含子RT必须具有高的持续合成能力和保真度,以便完成其生物学功能。II组内含子衍生的RT亦缺乏RNA酶H活性,其可以是有益的,因为RNA酶H特异降解RNA:DNA杂合体的RNA,使任何RNA仅能够复制一次并可导致降低的全长cDNA产率。基于到目前为止评价的II组内含子衍生的逆转录酶,这些RT通常表现相对高的保真度和高的持续合成能力。逆转录酶的保真度指在RNA逆转录成DNA期间核苷酸参入的可靠性,其中较高的保真度描述低数量错误(例如,错参)的核苷酸复制。较高的特异性可通过使用较长和更特异的引物提供,这要求在较高温度下进行逆转录的能力。例如,II组内含子衍生的逆转录酶可提供2. OX 10_5以下的错误频率的逆转录,其中错误频率表示发生的核苷酸复制错误相对无错误发生的核苷酸复制事件的数量的比例。高保真度转录的其他实例包括 1Χ1(Γ4、7. 5Χ1(Γ5、5Χ1(Γ5、2. 5X 1(Γ5、1 X 1(Γ5 和 5X IO"6 的错误频率。关于 II 组内含子衍生的RT的高保真度的进一步描述,参见Conlan等,Nucleic Acids Research, 33,第 5262-70 页(2005)。合适II组内含子衍生的逆转录酶的实例包括SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3, SEQ ID NO :4和SEQ ID NO :5所示的逆转录酶,其获自细长热聚球蓝细菌(TeI4c、f 和h*)和嗜热脂肪土芽孢杆菌((isll和(isI2)。这些序列示于图1-5。本发明亦涵盖与SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 和 SEQ ID NO 5 所示的那些实质上相似的II组内含子衍生的逆转录酶。与由序列1-5提供的逆转录酶“实质上相似”的逆转录酶将分享至少85%同一性、更优选90%同一性和甚至更优选95%同一性,且将仅包含保守区中的保守氨基酸置换。一些Π组内含子衍生的RT的热稳定性示于图11中,其表明,当如图 11 所示评价时,包含 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 和 SEQ ID NO :5所示的逆转录酶的稳定化逆转录酶融合蛋白具有比嗜温Li. LtrB逆转录酶高的热稳定性,而不管嗜温Li. LtrB逆转录酶是否是融合蛋白的一部分。嗜温Li. LtrB单独或者作为融合蛋白的一部分均显示约35°C的最佳温度。正如本文所提及的,亦可使用热稳定II组内含子衍生的RT的修饰形式。例如, SEQ ID N0:3(TeI4h*RT)不表示天然形式的逆转录酶,而是活性位点从氨基酸序列YA⑶改变为氨基酸序列YADD的衍生物,以便更接近地相似其他活性II组内含子衍生的RT的活性位点。给定氨基酸序列与参比序列“实质上相似”的量可例如通过使用序列分析软件比较序列信息来测定,序列分析软件如BLAST 2搜索算法的Blastp程序,版本2. 2. 10,如 Tatusova 等(FEMS Microbiology Letters,174,第 247-50 页(1999))描述,并可通过万维网在美国国家生物技术信息中心(National Center for Biothechnology Information) 网站分子数据库(Molecular Database)板块的BLAST下获得。优选地,所有BLAST2搜索参数使用默认值,包括矩阵=BL0SUM62 ;开放空位罚分=11、延伸空位罚分=1、空位χ下降=50、期望值=10、字长=3和任选过滤器开。在使用BLAST搜索算法比较两个氨基酸序列中,结构相似性称为“相似性”,而结构同一性称作“同一性”。氨基酸同一性在候选多肽和参比氨基酸序列间比较的情况下定义,且通过比对两条氨基酸序列(即候选氨基酸序列和参比氨基酸序列)的残基以优化沿其序列长度的相同氨基酸数量来测定;在进行比对时允许两条序列之一或二者中的空位,但是每条序列中的氨基酸必须仍然保持其正确次序。支持II组内含子衍生的逆转录酶的结构-功能关联的信息是可得到的。例如参见对细菌逆转录酶的RT结构域进行分类和比对的Simon等,Nucleic Acids Research, 36, 第7219- 页Q008),和提供显示七个保守结构域和42个保守位置的82个RT序列比对的 Xiong 等,EMBO J.,9,第 3353-62 页(1990)。亦参见 Blocker 等,RNA,11,第 14- 页 (2005),其提供乳酸乳球菌Li. LtrB内含子RT (LtrA蛋白)的三维模型,描述蛋白酶剪切位点和保守区,并提供LtrA相对于HIV-IRT的序列比对分析。因此,多种与SEQ ID NO. 6-10 所示的那些实质上相似的稳定化逆转录酶融合蛋白可容易地通过保守区外氨基酸的修饰和已知保守区内仅保守氨基酸修饰来获得。在一个实施方案中,本发明提供具有逆转录酶活性的稳定化逆转录酶融合蛋白, 其在高温(即高于37°C)具有比相应的未结合逆转录酶长的半寿期。在一些实施方案中, 本发明逆转录酶的半寿期在50°C可为5分钟以上,且优选为10分钟以上。在一些实施方案中,本发明的逆转录酶可具有等于或大于约25分钟的半寿期(例如在50°C ),优选等于或大于约50分钟,更优选等于或大于约100分钟,以及最优选等于或大于约200分钟。稳定剂蛋白 本发明的稳定化逆转录酶融合蛋白亦包含稳定剂蛋白。本文定义的稳定剂蛋白是形成融合蛋白一部分的蛋白,其起增加融合蛋白整体稳定性的作用。稳定性包括蛋白保持其构象和活性的能力。另外,稳定剂蛋白优选增加融合蛋白的溶解度,如本文就溶解度增加蛋白的进一步描述。这对于II组内含子衍生的RT可特别有帮助,已发现II组内含子衍生的RT在RNP中的它们通常与之紧密结合的内含子RNA不存在时表达差且不溶(Vellore等 Appl. Environ. Microbiol. 70,7140-7147,2004 ;Ng 等,Gene 393,137-144,2007)。有效稳定剂蛋白包括这样的蛋白其包含独立折叠结构域和/或不折叠成可影响蛋白聚集倾向的长寿命错折叠中间体。提供独立折叠结构域的蛋白参见Janin等,Progress in Biophysics and Molecular Biology,42,第21-78页(1983),而不折叠成长寿命错折叠中间体的蛋白参见Idicula等,Protein Science,14,第582-592页(2005)。例如,稳定剂蛋白可以是包含50个以上氨基酸的蛋白。在其他实施方案中,稳定剂蛋白可以是包含100个以上氨基酸的更大的蛋白。如本文提供的麦芽糖结合蛋白和NusA蛋白所例示,稳定剂蛋白亦可具有约 250个氨基酸至约400个氨基酸的大小。稳定剂蛋白亦可是热稳定蛋白。稳定剂蛋白亦可是或者包含亲和蛋白。本文所用术语亲和蛋白指存在其容易获得的配体的蛋白,该配体表现对该蛋白的高结合常数(即“亲和力”)。亲和蛋白通常用于亲和标签的作用。如本领域技术人员已知的,亲和蛋白可在融合蛋白中提供以有助于通过例如亲和纯化(其中标签与亲和柱内的配体结合)等技术纯化与亲和蛋白连接或融合的蛋白。 合适的亲和蛋白是本领域已知的。例如参见Waugh,D.,Trends in Biotechnology,23,第 316-320页000 ,其描述许多合适的亲和蛋白,包括谷胱甘肽S-转移酶、麦芽糖结合蛋白、FLAG标签肽、生物素接纳体肽、链霉亲和素结合肽和钙调蛋白结合肽。对于制备和使用包含亲和蛋白的融合蛋白,例如参见美国专利号5,643,758,5,654, 176和7,001,745。稳定剂蛋白亦可为溶解度增加蛋白。重组表达的融合蛋白在其宿主细胞和/或在随后的方法应用中可表现低溶解度,这可通过在融合蛋白中包含溶解度增加蛋白而改良,该溶解度增加蛋白实质上增加水环境中的融合蛋白溶解度。一些使用的溶解度增加蛋白亦是亲和蛋白,并因此可描述为溶解度增加亲和蛋白。溶解度增加蛋白的实例包括糖结合蛋白,例如阿拉伯糖结合蛋白、壳多糖结合蛋白、纤维素结合蛋白和麦芽糖结合蛋白。溶解度增加蛋白的其他实例包括由Novagen 提供的NusA和Dsb溶解度标签以及hvitrogen 提供的溶解度增加标签(SET)。Harrision已经证明NusA溶解度标签提供非常高的溶解度,而 Dsb 的溶解度增加由 Collins-Racie 描述。参见 Harrison, R. G.,inNovations,11,第 4-7 页(2000),和 Collins-Racie 等,Biotechnology, 13,第 982-87 页(1995)。在一些实施方案中,稳定剂蛋白例如溶解度增加蛋白或者亲和蛋白可被修饰以改进其性能。与蛋白的正常野生型序列相比,修饰可包括提供稳定剂蛋白的蛋白序列内氨基酸的一个或多个置换、插入或缺失。例如,稳定剂蛋白(例如亲和蛋白或溶解度增加蛋白) 可通过在蛋白的特定区域中使用不带电氨基酸置换带电氨基酸来修饰。带电氨基酸包括具有带正电或带负电侧链的氨基酸。具有带正电侧链的氨基酸的实例包括精氨酸、组氨酸、赖氨酸等。具有带负电侧链的氨基酸的实例包括天冬氨酸和谷氨酸等。不带电氨基酸包括但不限于丙氨酸、丝氨酸、苏氨酸、谷氨酰胺、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸和酪氨酸。 例如,麦芽糖结合蛋白可通过用丙氨酸置换一个或多个带电氨基酸而修饰。合适亲和蛋白的实例包括SEQ ID NO :11所示的麦芽糖结合蛋白氨基酸序列(示于图1-5)和与SEQ ID NO 11实质上相似的序列。应注意,当亲和蛋白的修饰不是必需时, SEQ ID NO :11所示的麦芽糖结合蛋白被修饰为在近C末端用丙氨酸置换三个带电氨基酸。 另一种合适蛋白(在该情况下为增溶蛋白)是N-利用物质A(NusA)蛋白,其具有图18所示SEQ ID NO :38中所示的氨基酸序列。在本发明另外的实施方案中,本文描述包含麦芽糖结合蛋白的融合蛋白可用N-利用物质A蛋白置换麦芽糖结合蛋白。接头肽在一些实施方案中,稳定化逆转录酶融合蛋白亦包含位于稳定剂蛋白和热稳定逆转录酶之间的接头肽。优选地,接头肽是非可切割接头肽。“位于...之间”是指接头肽通过化学键(例如,酰胺键)与稳定剂蛋白和逆转录酶各自的N末端或C末端连接,如本文关于融合蛋白的描述。例如,接头肽可通过酰胺键与稳定剂蛋白的C末端区和热稳定逆转录酶的N末端区连接。非可切割意指接头肽不容易对蛋白酶切割易感。在另外的实施方案中,接头肽是刚性接头肽;即相对非柔性肽接头。刚性接头肽不要求完全缺乏柔性,而是比柔性接头肽如富甘氨酸肽接头柔性少。由于其相对缺乏柔性,刚性接头肽降低通过刚性接头肽连接在一起的两个蛋白结构域(在当前情况下是稳定剂蛋白和热稳定逆转录酶)的运动。提供有序链(例如α螺旋结构)的接头肽可提供刚性接头肽。例如,精氨酸、亮氨酸、谷氨酸、谷氨酰胺和甲硫氨酸都显示出相对高的螺旋接头结构倾向。然而,包含许多脯氨酸残基的非螺旋接头也可表现显著的刚性。刚性接头的实例包括聚赖氨酸和聚-DL-丙氨酸聚赖氨酸。刚性肽接头的进一步描述fifeiggers等,Biopolymers, 80,第 736-46 页(2005)提供。此外,刚性接头肽在由 George 等,Protein Engineering, 15,第871-79页000;3)描述的接头数据库中描述。优选地,刚性接头肽也是非可切割接头肽,即非可切割刚性接头肽。优选相对短的多肽用作接头肽。例如,接头肽可包含1-20个氨基酸。接头肽亦可包含1-15个、1-10个、1-5个或3-5个氨基酸。可用作接头肽的具体序列实例包括由丙氨酸氨基酸形成的二肽、三肽、四肽和五肽。一种合适的刚性接头肽是AAAAA (SEQ ID N0:12),而另一种合适刚性接头肽是AAAEF(SEQ ID N0:18)。在融合蛋白中使用接头肽(例如刚性接头肽)可提供一个或多个优点。例如,虽然未旨在受理论束缚,但是据相信刚性接头肽的使用可通过降低融合蛋白两部分相对彼此的运动量来稳定融合蛋白。虽然可使用非常短(即 1或2个氨基酸)的接头,但优选使用包含3-5个氨基酸的接头。 接头肽可以是通过蛋白酶可切割或非可切割的。亲和蛋白通常在融合蛋白中使用可切割肽与另一个蛋白相连,以便可移除亲和蛋白。然而,由于本文描述的理由,在本发明中稳定剂蛋白(例如亲和蛋白)保持与逆转录酶结合。因此,一般优选接头肽是非可切割的。然而,可切割接头可用于一些实施方案。例如,如果在后续步骤期间除去稳定剂蛋白是合乎需要的,且在使用融合蛋白过程中避免暴露于蛋白酶切割,那么可使用对蛋白酶切割易感的可切割接头,包括刚性可切割接头肽。
稳定化逆转录酶融合蛋白的使用本发明也提供从RNA (例如mRNA、rRNA、tRNA和miRNA)制备cDNA的方法,其为其他方法例如逆转录聚合酶链式反应(RT-PCR)所需。本文所用术语“RT-PCR”指RNA序列的复制和扩增。在该方法中,逆转录与PCR结合,例如,如美国专利号5,322,770中所述。在 RT-PCR中,RNA模板由于酶的逆转录酶活性转变成cDNA,然后使用相同或不同酶的聚合活性扩增。在本发明的实践中,cDNA分子的制备可通过在有助于通过组合物的酶作用逆转录核酸分子以形成cDNA分子(单链或双链)的条件下,将使用本领域公知方法获自细胞、 组织或器官的一种或多种核酸分子(例如RNA)与本发明的组合物混合。因此,本发明的方法包括(a)将一种或多种核酸模板(优选一种或多种RNA或mRNA模板,例如RNA分子群体)与本发明的稳定RT融合蛋白混合,和(b)在足以允许一种或者多种核酸模板的全部或部分的cDNA合成的条件下孵育混合物。在一个方面,方法包括如下步骤(a)将引物加入RNA分子中,和(b)在足以合成与RNA模板的全部或部分互补的cDNA分子的条件下,在一种或多种脱氧核糖核苷三磷酸或者双脱氧核糖核苷三磷酸和包含与稳定剂蛋白连接的热稳定逆转录酶的稳定化逆转录酶融合蛋白的存在下孵育RNA分子。将引物加入RNA分子中可包括使引物与RNA分子杂交。 在一些实施方案中,稳定化逆转录酶融合蛋白亦可包含将稳定剂蛋白与热稳定逆转录酶连接的接头肽。优选地,逆转录在其中RNA包含实质上减少量的阻碍性稳定二级或三级结构的温度范围内进行。这可以是约45°C至约85°C的温度,其中更优选的温度范围是约45°C至约65°C。这亦可描述成其中RNA不形成显著量的稳定二级或三级结构的温度范围。由于II 组内含子衍生的RT的高保真度和其他优点,可优选使用它们。例如,稳定化逆转录酶融合蛋白可包含11组内含子衍生的逆转录酶,其具有与选自SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO 3,SEQ ID NO :4或SEQ ID NO :5的序列实质上相似的氨基酸序列同一性;由1_20个氨基酸组成的非可切割接头;和稳定剂蛋白包含溶解度增加蛋白或亲和蛋白。稳定化逆转录酶融合蛋白亦可包含稳定剂肽和逆转录酶之间的接头肽,其可具有1-20个氨基酸的长度,可以是非可切割接头或者可以是刚性接头。方法实施方案可以2. OX 10_5以下的错误频率进行逆转录。特别是在约45°C至约65°C的温度下。稳定化逆转录酶融合蛋白亦可在用于其他应用。例如,稳定RT融合蛋白可用于克隆差别表达的mRNA 5’末端;一种称为cDNA末端快速扩增(RACE)的方法及其变体,例如 RNA配体介导的RACE (RLM-RACE)。稳定RT融合蛋白亦可用于RNA中的化学足迹作图、差示 RT-PCR(其使得能够分析细胞群体中的基因表达)和用于医学诊断的原位PCR。稳定化逆转录酶融合蛋白的制备包含编码稳定化逆转录酶融合蛋白的核酸分子的表达载体可用于在重组宿主细胞中稳定化逆转录酶融合蛋白的高水平表达。表达载体可包括但不限于克隆载体、修饰的克隆载体、特别设计的质粒或病毒。多种表达载体可用于在合适细胞类型中表达重组稳定化逆转录酶融合蛋白序列。例如,细菌载体、哺乳动物载体、真菌载体和昆虫载体可分别用于在细菌、哺乳动物细胞、真菌细菌和昆虫细胞中表达。稳定化逆转录酶融合蛋白可通过获得能够表达稳定化逆转录酶融合蛋白的核苷酸序列和接着在宿主细胞中表达该核苷酸序列来制备。由宿主细胞表达的稳定化逆转录酶融合蛋白可接着使用多种本领域技术人员已知的技术纯化,部分取决于宿主细胞的性质。本发明能够表达稳定化逆转录酶融合蛋白的核苷酸序列可使用多种本领域技术人员已知的方法制备。例如,核苷酸序列可使用其中组合有不同接头、逆转录酶和稳定剂蛋白的重组质粒制备,如本文实施例1所述。本发明亦涉及用包含能够表达稳定化逆转录酶融合蛋白的核酸分子的载体转化或转染的宿主细胞。重组宿主细胞可为原核的或真核的,包括但不限于,细菌例如大肠杆菌,真菌细胞例如酵母,哺乳动物细胞包括但不限于牛、猪、猴和啮齿动物来源的细胞系;和昆虫细胞包括但不限于果蝇和蚕衍生的细胞系。这样的重组宿主细胞可在合适条件下培养以生产稳定化逆转录酶融合蛋白或生物学等价的形式。如本文所定义,术语“宿主细胞”不旨在包括在转基因人、人胎儿或人胚胎体内的宿主细胞。如上文所示,包含编码稳定化逆转录酶融合蛋白的DNA的表达载体可用于在重组宿主细胞中表达稳定化逆转录酶融合蛋白。因此,本发明另一方面是用于在重组宿主细胞中表达稳定化逆转录酶融合蛋白的方法,包括(a)将包含核酸的载体引入合适宿主细胞中,该核酸包含编码稳定化逆转录酶融合蛋白的核苷酸序列,其中稳定化逆转录酶融合蛋白包含与稳定剂蛋白直接连接或通过接头连接的热稳定逆转录酶,和(b)在允许表达稳定化逆转录酶融合蛋白的条件下培养宿主细胞。稳定化逆转录酶融合蛋白可改变以包含本文描述的任何特征,例如包含与热稳定逆转录酶和稳定剂蛋白连接的接头肽。在稳定化逆转录酶融合蛋白在宿主细胞中表达之后,可回收稳定化逆转录酶融合蛋白以提供纯化的稳定逆转录酶融合蛋白。若干蛋白纯化方法可用且适合使用。例如,参见本文提供的实施例2。重组蛋白可通过分级盐析、离子交换层析、大小排阻层析、羟基磷灰石吸附层析和疏水作用层析的不同组合或单独应用来从细胞裂解物和萃取物中纯化。本发明一些实施方案中亲和标签的使用可有助于纯化蛋白。例如,稳定化逆转录酶融合蛋白可通过使用由对融合蛋白的逆转录酶或稳定剂蛋白部分特异的单克隆或多克隆抗体制成的免疫亲和柱与其他细胞蛋白分离。可使用加热从在高温下不稳定并将因此沉淀的宿主蛋白中分离稳定化逆转录酶融合蛋白。能够表达稳定RT融合蛋白的核酸可装配到表达盒中,该表达盒包含设计用于在宿主细胞中提供融合蛋白的有效表达的序列。该盒优选包含编码稳定化逆转录酶融合蛋白的开放阅读框,以及与其有效连接的相关转录和翻译控制序列,例如启动子和终止序列。例如,开放阅读框可包含编码多肽的核酸,该多肽具有与选自分别示于图1-5的SEQ ID NO 6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO 9 或 SEQ ID NO 10 的序列实质上相似的氨基酸序列同一性。在一个优选实施方案中,启动子是用于在大肠杆菌中表达的T7或tac启动子,但是本领域技术人员将认识到可使用许多其他已知启动子中的任一种。大肠杆菌还具有不依赖和依赖rho的终止子,并可使用T7聚合酶用于快速DNA复制。在真核细胞中,包含聚腺苷酸化位点将有助于mRNA的正确加工。开放阅读框亦可包含分别如图6-10所示的SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO 15, SEQ ID N0:16和SEQ ID NO :17中所示的多核苷酸序列。备选地,开放阅读框可包含与 SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO :15、SEQ ID NO :16 禾口 SEQ ID N0:17 所示的那些实质上相似的多核苷酸序列。在此特定的上下文中,术语“实质上相似”指核苷酸序列变体,其中可互换使用编码相同氨基酸的密码子,使得核苷酸序列将仍导致对应于SEQ ID NO 6-10的氨基酸序列的翻译。稳定化逆转录酶融合蛋白开放阅读框多核苷酸优选与选自 SEQ ID NO :13、SEQ ID NO :14、SEQ ID NO :15、SEQ ID NO 16 和 SEQ ID NO 17 的多核苷酸序列具有至少约80%同一性、至少约90%同一性、至少约95%同一性或至少约98%同一性。核苷酸同一性在候选稳定化逆转录酶融合蛋白开放阅读框与选自SEQ ID NO 13、SEQ ID NO :14、SEQ ID NO :15、SEQ ID NO 16 和 SEQ ID NO 17 的多核苷酸序列之间比较的情况下定义,且通过比对两个多核苷酸的残基以优化沿其序列长度的相同核苷酸数来测定。在进行比对时允许两个序列之一或二者中的空位,以便优化共有核苷酸的数量, 但是各序列中的核苷酸必须仍保持其正确次序。优选地,两个核苷酸序列使用BLAST 2搜索算法的 Blastn 程序比较,如 Tatusova 等(FEMS Microbiology Letters,174,第 M7-50 页(1999))所述,并可通过万维网在美国国家生物技术信息中心网站分子数据库板块的 BLAST下获得。优选地,所有BLAST 2搜索参数使用默认值,包括匹配奖励=1、错配罚分 =-2、开放空位罚分=5、延伸空位罚分=2、空位χ下降=50、期望值=10、字长=11和任选过滤器开。在使用BLAST搜索算法比较两个核苷酸序列中,核苷酸同一性称为“同一性”。关于从核苷酸序列制备蛋白,应当注意四种可能核苷酸碱基的“三联体”密码子可以超过60种变体形式存在。因为这些密码子提供仅20种不同氨基酸(以及转录起始和终止)的信息,所以一些氨基酸可由多于一种密码子编码,一种称为密码子冗余的现象。因此,用于制备稳定化逆转录酶融合蛋白特定氨基酸序列的核苷酸序列可颇为不同,视使用的具体密码子而定。由于未完全理解的原因,备选密码子不一致地存在于不同细胞类型的内源DNA中,在特定类型的细胞中某些密码子存在天然序位或“优选”。因此,在一些实施方案中,选择用于表达稳定化逆转录酶融合蛋白的密码子可通过使用导致高水平表达的特定密码子来优化。依据本发明,稳定化逆转录酶融合蛋白表达盒插入到载体中。载体优选质粒载体或腺病毒载体,但是亦可使用与启动子连接的线性DNA或其他载体,例如腺伴随病毒或修饰的痘苗病毒、逆转录病毒载体或慢病毒载体。特别优选使用大肠杆菌质粒载体。以下提供由本发明人为开发和评价稳定化逆转录酶融合蛋白而进行的工作的详细说明。II组内含子RT作为MalE融合蛋白的表达及纯化
表现差蛋白的表达和溶解度有时可通过融合高度可溶蛋白改善,高度可溶蛋白例如麦芽糖结合蛋白(MalE)或 N 利用物质 A(NusA) (Nallamsetty 等,Protein Expression and Purification 45,175-182,2005)。此外MalE标签使得能够通过直链淀粉亲和层析容易地纯化蛋白。本发明人因此测试II组内含子RT是否可作为MalE融合体表达和纯化。最初,MalE标签通过pMal-c2t表达载体中的TEV蛋白酶可切割接头与RT的N末端融合(图 12B)。若干细长热聚球蓝细菌II组内含子RT的MalE-RT融合蛋白在大肠杆菌中表达良好, 并可通过包括聚乙烯亚胺(PEI)沉淀除去核酸,然后直链淀粉亲和层析和肝素琼脂糖层析的步骤纯化。此外,纯化后立即测定的未切割MalE-RT融合蛋白具有高热稳定RT活性。然而,对于热聚球蓝细菌(Thermosynechococcus)蛋白,这些蛋白的产量< 0. 2mg/L·另外,当通过TEV蛋白酶切割除去MalE标签时,RT立刻形成不溶沉淀,而如果保持标签未切割,那么即便在保存于冰上或瞬间冷冻于50%甘油中时,MalE-RT融合蛋白也逐渐失去RT活性并在数天内降解。后者的发现是出人意外的,因为在溶解度标签的存在下正确折叠的蛋白在切除标签后趋于保持可溶(Nallamsetty 等,Protein Expression and Purification 45, 175-182,2005)。在存在而非不存在连接的MalE标签的情况下有活性的II组内含子RT似乎是例外。稳定剂蛋白必须保持与热稳定逆转录酶连接的发现表明,其在保持热稳定逆转录酶可溶和活性中起积极作用。为了克服这些困难,本发明人测试是否可通过非可切割刚性接头将MalE标签与蛋白连接使II组内含子RT稳定在活性形式。该MalE-刚性融合体通常具有3-5个丙氨酸残基的接头区,以及在MalE标签的C末端用丙氨酸置换带电氨基酸残基的改变(Smyth 等,Genes and Development 19,2477-2487,2003)。这些刚性融合体接头降低构象异质性,使带有连接的接头的蛋白能够结晶用于结构测定(Smyth等,同上)。对于本文测试的 MalE-RF-RT 融合体,将 pMal-dt 的 MalE/ 接头区 TVDEALKDAQTNS3N1(ILENLYFQGEF(SEQ ID NO 19)修饰为 TVDAALAAAQTAAA (SEQ ID NO 20),并称为 MalE-RF (刚性融合体)标签(图 12B)。为了快速确定MalE-RF标签是否影响II组内含子RT的活性,本发明人测试 MalE-RF-RT是否可支持体内反向归巢。对于初始测试,所选RT是由乳酸乳球菌Li. LtrB 内含子编码的LtrA蛋白,和是由热稳定细长热聚球蓝细菌TeI4h内含子编码的RT的活化衍生物的TeI4h* RT。在37°C反向归巢测定中,MalE-RF-LtrA蛋白以20%的效率相比天然 LtrA 86 %的效率支持反向归巢,而在48 °C反向归巢测定中,MalE-RF-TeI4h*蛋白以87 %的效率相比未融合TeI4h*蛋白100%的效率支持反向归巢;参见表1。因此,两种MalE-RF-RT 均显著保持以高但稍微降低的效率支持反向归巢的能力,而不管连接的麦芽糖结合蛋白刚性接头序列存在与否。这些发现表明,蛋白保留实质上为反向归巢所需的所有活性水平,包括RT活性、RNA剪接活性和DNA内切核酸酶活性。该移动性测定提供对活性II组内含子 RT的合宜筛查。表1 不同RT的反向归巢效率
权利要求
1.一种稳定化逆转录酶融合蛋白,包含与稳定剂蛋白连接的热稳定逆转录酶。
2.权利要求1的稳定化逆转录酶融合蛋白,其中所述热稳定逆转录酶包含细菌逆转录酶。
3.权利要求2的稳定化逆转录酶融合蛋白,其中所述细菌逆转录酶包含II组内含子衍生的逆转录酶。
4.权利要求3的稳定化逆转录酶融合蛋白,其中所述细菌逆转录酶是细长热聚球蓝细菌逆转录酶或嗜热脂肪土芽孢杆菌逆转录酶。
5.权利要求1的稳定化逆转录酶融合蛋白,其中所述热稳定逆转录酶包含与选自SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5 的序列有至少 85%氨基酸序列同一性的多肽。
6.权利要求1的稳定化逆转录酶融合蛋白,其中所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。
7.权利要求6的稳定化逆转录酶融合蛋白,其中所述稳定剂蛋白包含麦芽糖结合蛋白或N-利用物质A蛋白。
8.权利要求6的稳定化逆转录酶融合蛋白,其中所述稳定剂蛋白通过将带电氨基酸置换为不带电氨基酸而修饰。
9.权利要求1的稳定化逆转录酶融合蛋白,其中所述热稳定逆转录酶与所述稳定剂蛋白通过接头肽连接。
10.权利要求9的稳定化逆转录酶融合蛋白,其中所述接头肽是非可切割接头肽。
11.权利要求10的稳定化逆转录酶融合蛋白,其中所述非可切割接头肽是刚性接头肽。
12.权利要求10的稳定化逆转录酶融合蛋白,其中所述接头肽由1-20个氨基酸组成。
13.权利要求10的稳定化逆转录酶融合蛋白,其中所述接头肽由1-5个氨基酸组成。
14.权利要求10的稳定化逆转录酶融合蛋白,其中所述接头肽由3-5个氨基酸组成。
15.权利要求11的稳定化逆转录酶融合蛋白,其中所述刚性接头肽由SEQID N0:12组成。
16.权利要求1的稳定化逆转录酶融合蛋白,其中所述融合蛋白具有包含多肽的氨基酸序列,所述多肽与选自 SEQ ID NO :6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO 9 或 SEQ ID NO 10的序列有至少85%氨基酸序列同一性。
17.权利要求1的稳定化逆转录酶融合蛋白,其中所述稳定化逆转录酶融合蛋白能够在约45°C至约65°C的温度下以2. OX 10_5以下的错误频率进行逆转录。
18.一种从RNA分子制备cDNA的方法,所述方法包括以下步骤(a)将引物核苷酸序列加入RNA分子中(b)在足以合成与所述RNA分子的全部或部分互补的cDNA分子的条件下,在一种或多种脱氧核糖核苷三磷酸或双脱氧核糖核苷三磷酸和包含与稳定剂蛋白连接的热稳定逆转录酶的稳定化逆转录酶融合蛋白存在下孵育所述RNA分子。
19.权利要求18的方法,其中所述热稳定逆转录酶与所述稳定剂蛋白通过非可切割接头肽连接。
20.权利要求18的方法,其中在所述RNA具有实质上减少量的阻碍性稳定二级或三级结构的温度范围内进行逆转录。
21.权利要求18的方法,其中所述热稳定逆转录酶是II组内含子衍生的逆转录酶。
22.权利要求19的方法,其中所述热稳定逆转录酶包含与选自SEQID NO =USEQ ID NO 2,SEQ ID N0:3、SEQ ID NO :4或SEQ ID NO :5的序列有至少85%氨基酸序列同一性的多肽;由1-20个氨基酸组成的非可切割接头;和所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。
23.权利要求18的方法,其中在约45°C至约65°C的温度下以2.OX 10_5以下的错误频率进行逆转录。
24.一种用于生产稳定化逆转录酶融合蛋白的DNA表达载体,包含编码多肽的分离核酸,所述多Jft 与选自 SEQ ID NO 6,SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO: 10的序列有至少85%氨基酸序列同一性。
25.—种生产稳定化逆转录酶融合蛋白的方法,包括以下步骤(a)培养包含权利要求M的DNA表达载体的宿主细胞;(b)表达由所述DNA表达载体编码的稳定化逆转录酶融合蛋白;和(c)从所述宿主细胞中分离所述稳定化逆转录酶融合蛋白。
全文摘要
本发明描述稳定化逆转录酶融合蛋白,其包含与稳定剂蛋白连接的热稳定逆转录酶。将稳定剂蛋白与热稳定逆转录酶连接使融合蛋白稳定并可帮助其纯化、提供增加的溶解度、允许长期储存或者允许用于更加苛刻的条件例如较高温度下。稳定化逆转录酶融合蛋白也可包含稳定剂蛋白和热稳定逆转录酶之间的接头。稳定化逆转录酶融合蛋白适合用于核酸扩增方法,例如逆转录聚合酶链式反应和其他包括cDNA合成的应用。
文档编号C07K14/195GK102421791SQ201080020123
公开日2012年4月18日 申请日期2010年3月4日 优先权日2009年3月4日
发明者A·M·拉姆博维茨, E·加尼姆, G·摩尔, S·摩尔 申请人:得克萨斯系统大学评议会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1