用于体外再现由丙型肝炎病毒(hcv)编码的rna依赖的rna聚合酶和末端核苷酸转移酶活...的制作方法

文档序号:6131799阅读:389来源:国知局
专利名称:用于体外再现由丙型肝炎病毒(hcv)编码的rna依赖的rna聚合酶和末端核苷酸转移酶活 ...的制作方法
技术领域
本发明涉及丙型肝炎病毒(HCV)的分子生物学和病毒学。更确切地说,本发明的主题是HCV产生的RNA依赖的RNA聚合酶(RdRp)和末端核苷酸转移酶(TNTase)活性、表达HCV RdRp和TNTase的方法和为了治疗目的鉴定抑制这些酶活性从而可以干扰HCV病毒复制的化合物而体外检测由HCV编码的RdRp和TNTase活性的方法。
已知丙型肝炎病毒(HCV)是非甲非乙型肝炎(NANB)的主要原体。据估计HCV引起至少90%的输血后NANB病毒性肝炎和50%的散发NANB肝炎。虽然在选择血液供者和用于输血血液的免疫学鉴定方面已经取得了很大的进步,但在那些接受输血的患者中仍有许多发生HCV感染(全世界每年一百万或更多的感染者)。大约50%的HCV感染者在可以是5到40年的时间内发展为肝硬化。另外,近来临床研究表明在慢性HCV感染和肝细胞肉瘤的发展之间存在一定的相关性。
HCV是一种含有一条大约9.4kb正链RNA基因组的包膜病毒。该病毒是黄病毒家族的一个成员,这个家族的其它成员是黄病毒和瘟病毒。最近已绘出HCV的RNA基因组的图谱。对在世界各处分离的HCV基因组序列的比较表明这些序列可以是非常同源的。HCV基因组的大部分被一个在大约9030到9099个核苷酸之间变化的开放读框(ORF)所占据。这个ORF编码一个单一的病毒多聚蛋白,其长度可以从3010到3033个氨基酸之间变化。在病毒感染的周期中,通过蛋白裂解将多聚蛋白加工成病毒复制所必需的单个基因产物。编码HCV结构蛋白的基因定位于ORF的5'-末端,而编码非结构蛋白的区域占据ORF的其余部分。
结构蛋白由C(核心,21kDa)、E1(包膜,gp37)和E2(NS1,gp61)组成。C是一种21kDa可能形成病毒核衣壳的非糖基化蛋白质。蛋白E1是一种大约37kDa的糖蛋白,它被认为是外层病毒包膜的结构蛋白。另一种61kDa的膜糖蛋白E2可能是病毒外层包膜中的另一结构蛋白。
非结构区从NS2(p24),一种功能未知的24kDa疏水蛋白开始。据推测NS3,一种在多聚蛋白中位于NS2后的68kDa蛋白,具有两个功能域在前200个氨基末端氨基酸中的丝氨酸蛋白酶功能域,和在羧基末端的一个RNA依赖ATP酶结构域。与NS4相应的基因区编码两种分别为6kDa和26kDa的疏水蛋白质NS4A(p6)和NS4B(p26),它们的功能还不清楚。与NS5相应的基因也编码两种分别为56和65kDa的蛋白NS5A(p56),NS5B(p65)。
各种分子生物学研究表明信号肽酶(一种与宿主细胞内质网相关的蛋白酶)负责在非结构区也就是说在C/E1、E1/E2和E2/NS2位点的蛋白裂解加工。一种HCV的病毒编码蛋白酶似乎负责在NS2和NS3之间的切割。在一个包括部分NS2和含有丝氨酸蛋白酶结构域的NS3部分的区域中含有这种蛋白酶活性,但却并不利用相同的催化机制。在NS3中含有的丝氨酸蛋白酶负责在NS3和NS4A之间、NS4A和NS4B之间、NS4B和NS5A之间以及NS5A和NS5B之间连接的切点。
与其它(+)链RNA病毒相似,HCV的复制被认为是通过一个互补的(-)RNA链的启始合成开始的,它转过来又用作产生子代(+)链RNA分子的模板。推测在这些步骤中都有一种RNA依赖的RNA聚合酶(RdRp)参与。在所有RNA依赖的RNA聚合酶中都存在的一种氨基酸序列在NS5区中可以被识别。这表明NS5区含有病毒复制机器的成分。传统上认为病毒编码的聚合酶是抗病毒化合物抑制作用的重要靶子,然而,在HCV的特定情况下,对于这种物质的研究一直由于缺少一种病毒感染的合适的模型系统(例如在培养中或一种易得到的动物模型中对细胞的感染)以及一种功能性RdRp酶活性检测方法而受到严重的阻碍。
已意外地发现可以通过采用根据本发明的方法来克服这个主要的限制,本发明还提供了将由下面的描述而清楚的其它优点。
本发明的目的是一种利用在HCV NS5B蛋白中所含序列体外再现HCV的RNA依赖性RNA聚合酶活性的方法。利用这种方法也可再现NS5B蛋白的另一个特性末端核苷酸转移酶活性。这种方法利用了含有NS5B序列的蛋白质可在真核或原核异源性系统中表达这个事实纯化至表观均一性的或在超表达的生物体的提取物中存在的含有NS5B序列的重组蛋白质可以以一种模板依赖(RdRp)或模板非依赖(TNTase)的方式催化核苷酸加到外源RNA分子的3'末端。
本发明还扩展至一种新的组合物,其特征在于它含有在序列号1中所描述的或其中所含的或者由其衍生来的序列的蛋白质。已知这个序列在不同的HCV分离株中可以不同,因为所有的RNA病毒都表现出高度的变异性。这种新的组合物具有HCV为了复制其基因组而必需的RdRp活性。
本发明的另一目的是利用该组合物为治疗目的制备一种能够鉴别抑制与NS5B相关的酶活性的化合物包括RdRp的和TNTase的抑制剂。
至此已经给出了本发明的一个大体的描述。为了更清楚地理解其要点、特征、优点和操作方法,在下述实施例的帮助下,现在要给出其特定实施方案的一个更详细的描述。


图1表示用来将HCV cDNA转入一个杆状病毒表达载体的质粒结构。
图2表示分别用来体外合成HCV RNA依赖的RNA聚合酶的D-RNA底物的质粒(pT7-7(DCoH))和用来在大肠杆菌细胞中表达HCV RNA依赖的RNA聚合酶的质粒(pT7-7(NS5B))。
图3表示D-RNA的(+)和(-)链的一个模式图。转录物包括DCoH mRNA的编码区。将DNA-寡核苷酸a、b和c设计成与新合成的反义RNA退火并将DNA/RNA杂交体用RNA酶H切割。图式的下部分描绘通过RNA酶消化分别与寡核苷酸a、b和c杂交的RNA(-)所产生的预期RNA片段大小。
利用分别含有序列号1、序列号2、序列号1 2转录的cDNA和序列号1转录的cDNA的质粒pBac5B、pBac25、pT7.7 DCoH和pT7.7NS5B转化的大肠杆菌DH1细菌于1995年5月9日以登记号分别为NCIMB 40727、40728、40729和40730在英国国家工业和海洋细菌收集中心(The NationalCollections of Industrial and Marine Bacteria Ltd.(NCIMB),Aberden,Scotland,UK)寄存。
实施例1在草地夜蛾克隆9(Sf9)培养细胞中表达HCV RdRp/TNTase的方法在昆虫培养细胞中用于外源基因表达的系统如用杆状病毒载体感染的草地夜蛾克隆9(Sf9)细胞在本领域中是已知的(V.A.Luckow,用于表达人基因产物的杆状病毒系统,(1993)《生物技术中的最新观点》(Current Opinion in Biotechnology),564-572页)。通常将外源基因置于家蚕核多角体病毒苜蓿银纹夜蛾核型多角体病毒的多角体蛋白强启动子的控制下。用于通过同源重组在杆状病毒载体的预期位点上引入外源DNA的方法在本领域中也是已知的(D.R.O'Reilly,L.K.Miller,V.A.Luckow,(1992),《杆状病毒表达载体实验室手册》(BaculivirusExpression Vectors-A Laboratory Manual),W.H.Freeman and Company,纽约)。
质粒载体pBac5B和pBac25是pBlueBacIII(Invitrogen)的一个衍生物衍生来的,构建它们用来将编码NS4B和其它非结构HCV蛋白的基因转入杆状病毒表达载体。在图1中以模式图说明这些质粒,并且在实施例8中详细地描述了它们的构建。将所选的与HCV-BK分离株的基因组相应的cDNA片段(HCV-BK;Takamizawa,A.,Mori,C.,Fuke,I.,Manabe,S.,Murakami,S.,Fujita,J.,Onishi,E.,Andoh,T.,Yoshida,I.和Okayama,H.,(1991)从人携带者中分离的丙型肝炎病毒基因组的结构和组织,《病毒学杂志》(J.Virol.)65,1105-1113)克隆在核型多角病毒的多角蛋白的强启动子下并以允许在一个杆状病毒载体中同源重组的序列作为侧翼。
为了构建pBac5B,将一个含有编码HCV多聚蛋白的2420到3010位氨基酸的并与NS5B蛋白(序列号1)相应的cDNA区的PCR产物克隆在pBlueBacIII的BamHI和HindIII位点之间。PCR有义寡核苷酸含有一个翻译启始信号,而原有的HCV终止密码子用作翻译的终止。
pBac25是pBlue BacIII(Invitrogen)的一个衍生物,其中编码HCV-BK多聚蛋白的810到3010位氨基酸(序列号2)的cDNA区被克隆在NcoI和HindIII限制性位点之间。
草地夜蛾克隆9(Sf9)细胞和杆状病毒重组试剂盒购自Invitrogen。将细胞于27℃在含有10%胎牛血清(Gibco)的完全Grace昆虫培养基(Gibco)中培养于平皿上或悬浮培养。按照制造商推荐的方法进行杆状病毒构建物的转染、重组和筛选。分离到两个含有所需HCV cDNA的重组杆状病毒克隆,Bac25和Bac5B。
对于蛋白质的表达,用重组杆状病毒Bac25或Bac5B在每ml2×106细胞的密度下以大约每个细胞5个病毒颗粒的比例转染Sf9细胞。转染后48-72小时将Sf9细胞沉淀,用磷酸盐缓冲液(PBS)洗涤一次并小心重悬于(每ml 7.5×107个细胞)含有1mM二硫苏糖醇(DTT)、1mM苯甲基磺酰氟(PMSF,Sigma)和4mg/ml亮抑蛋白酶肽的缓冲液A(10mMtris/Cl pH8,1.5mM MgCl2,10mM NaCl)中。下面的所有步骤都在冰上进行溶胀30分钟后,利用一个紧密相配的研杵在一个Dounce匀浆器中通过击打20次破碎细胞。加入甘油和去污剂Nonidet P-40(NP40)和3-[(3-胆酰胺丙基)-二乙铵基]-1-丙磺酸(CHAPS)至终浓度分别为10%(v/v)、1%(v/v)和0.5%(v/v),并将细胞提取物在冰上继续孵育1小时,不时地搅拌。通过在1000×g离心10分钟沉淀细胞核,并收集上清。通过在一个Dounce匀浆器中击打20次将沉淀重悬于含有上述浓度的甘油和去污剂的缓冲液A中(每7.5×107核0.5ml)。然后在冰上孵育1小时。重新沉淀细胞核后,将两种上清混合,于8000×g离心10分钟,弃去沉淀。所获的粗制胞浆提取物或者直接用来检测RdRp的活性或者以一个蔗糖梯度进行进一步纯化(见实施例5)。
用重组的杆状病毒Bac25或Bac5B感染Sf9细胞导致预期的HCV蛋白的表达。实际上,在用Bac25感染Sf9细胞后,在细胞裂解液中通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)和免疫染色可检测到HCV的NS2(24kDa)、NS3(68kDa)、NS4B(26kDa)、NS4A(6kDa)、NS5A(56kDa)和NS5B(65kDa)蛋白。在用Bac5B感染Sf9细胞后,通过SDS-PAGE后免疫染色或考马斯蓝染色只可检测到一种HCV编码的蛋白,其大小与真正的NS5B(65kDa)相应。
实施例2在一个合成的RNA模板/底物上检测重组HCV RdRp的方法RdRp检测是基于对掺入新生RNA产物中的被标记的核苷酸的检测。在一个含有1-5ul Sf9粗制胞浆提取物或纯化后蛋白组分的40ul总体积中进行体外检测来确定RdRp的活性。被Bac25或Bac5B感染的Sf9细胞的未纯化或纯化后的胞浆提取物可用作HCV RdRp的来源。获自用表达一种与HCV无关蛋白的重组杆状病毒结构感染的Sf9细胞的提取物用作阴性对照。将下面的添加物加入反应混合物(终浓度)20mM Tris/Cl pH7.5、5mMMgCl2、1mM DTT、25mM KCl、1mM EDTA、5-10μCi的一种[32P]NTP(除非另有说明,所用的为GTP,3000Ci/mmol,Amersham)、0.5mM每种NTP(即CTP、UTP、ATP,除非另有说明)、20U RNasin(Promega)、0.5ugRNA-底物(约4pmol,终浓度100nM)、2μg放线菌素D(Sigma)。室温下孵育反应两小时,通过加入等体积2×蛋白酶K(PK,BoehringerMannheim)缓冲液(300mM NaCl,100mM Tris/Cl pH7.5,1%w/v SDS)随后在37℃用50ug PK处理半小时来终止反应。将RNA产物用PCA抽提,乙醇沉淀并通过在含有7M尿素的5%聚丙烯酰胺凝胶上电泳来分析。
我们通常用于检测的RNA底物(D-RNA)具有在序列号12中报道的序列,并典型地通过如下所述的用T7聚合酶体外转录线性化的质粒pT7-7(DCoH)来获得。
用在DCoH编码序列的末端所含的单一的Bg1II限制性位点将质粒pT7-7(DCoH)(图2)线性化并用T7聚合酶(Stratagene)利用制造商所描述的程序体外转录。通过加入5U/10μl的DNA酶I(Promega)终止转录。将混合物继续孵育15分钟并用酚/氯仿/异戊醇(PCA)抽提。通过一个1-mlSephadex G50离心柱凝胶过滤去除未掺入的核苷酸。PCA抽提和乙醇沉淀后,将RNA吹干,溶于水中并通过在260nm处的光密度确定其浓度。
除了D-RNA外任何其它RNA分子可被用于本发明的RdRp检测,这从下面所描述的实验中将会清楚。
上述的HCV RdRp检测产生一种放射性标记反应产物的特征性图谱一种被标记的产物,在所有反应包括阴性对照中都观察到它与底物RNA共迁移。通过银染色也能使这种RNA可见,因而被认为与加入的底物RNA相关,并极可能被在杆状病毒感染的Sf9细胞的胞浆提取物中存在的末端核苷酸转移酶活性标记。在用Bac25或Bac5B感染的Sf9细胞的胞浆提取物而不是用表达一种与HCV无关的蛋白的重组杆状病毒感染的细胞的胞浆提取物进行的反应中,观察到一条比底物RNA迁移快的额外的带。发现这一后者反应产物被标记为一种高的特异性活性,因为它在不加RNA的对照反应中并不出现。发现这一产物是从外加的RNA模板衍生而来的,因为在不加RNA的对照反应中不存在这一产物。有趣的是,用多种模板RNA分子无论含有HCV 3′-非翻译区与否都可以观察到形成比底物RNA迁移快的被标记的样品。肝特异性转录辅助因子DCoH的399个核苷酸的mRNA(D-RNA)在我们的RdRp检测中被证明是一种被有效接受的底物。
为了确定在反应中由Bac25或Bac5B感染细胞的提取物产生的新生样品的性质,我们进行了下述系列的实验(i)用RNA酶A或核酸酶P1处理产物混合物。由于这导致了放射性条带的完全消失,我们推断这两种被标记的产物都是RNA分子。(ii)在反应混合物中省略四种核苷酸三磷酸的任何一种导致只有输入RNA的标记,这表明快速迁移样品是聚合反应的产物。(iii)在检测中省略Mg2+离子导致反应的完全阻断既没有观察到新生RNA的合成也没有观察到输入RNA的标记。(iv)当用一种放射性标记的输入RNA和未标记的核苷酸进行检测时,被标记的产物与那些在标准条件下获得的产物是无法区别的。从这个结果我们推断新生RNA产物是从最初加入的RNA分子产生的。
总之,我们的资料表明Bac25或Bac5B感染的Sf9细胞的提取物含有一种催化RNA合成的新型镁离子依赖性酶活性。这种活性被表明是依赖输入RNA的存在但不依赖加入的引物或输入RNA分子的来源。另外,由于用Bac25或Bac5B感染的Sf9细胞的提取物所产生的产物看起来似乎是相同的,所以刚才所描述的实验表明所观察到的RdRp活性是由HCV NS5B蛋白编码的。
实施例3用于鉴定HCV RdRp RNA产物的方法。
为了阐明新合成RNA产物的结构特征,利用了下面的方法。在我们的标准电泳条件(5%聚丙烯酰胺,7M尿素),新生RNA产物的大小似乎是大约200个核苷酸。这可能是由于RNA转录的内部启始或提前终止。然而,这些可能性似乎很不可能,因为发现利用不同RNA底物进行的RdRp检测所获的产物都明显比它们各自的底物迁移快。增加电泳过程中温度和分析凝胶中的丙烯酰胺的浓度导致显著不同的RdRp产物的迁移行为。例如,利用一个如含有10%丙烯酰胺、7M尿素的凝胶系统,以较高的温度进行分离,RdRp产物比加入的底物RNA迁移慢,其在与至少两倍于输入RNA的长度相应的位置上。当在电泳前于低百分比/低温度凝胶上向RdRp产物中加入RNA变性剂如羟甲基汞(CH3HgOH,10mM)时,可观察到相似的效应。这些观察表明RdRp产物具有广泛的二级结构。
我们研究了产物分子对多种不同特异性的核糖核酸酶的敏感性。用RNA酶A处理时产物完全降解。另一方面,令人惊奇地发现它对单链特异性核酸酶RNA酶T1是有抗性的。与60U RNA酶T1于22℃孵育10分钟后输入RNA完全降解,同一凝胶的银染证实不但模板而且在Sf9细胞胞浆提取物中'常规可检测到的其他RNA也在与RNA酶T1孵育过程中被完全水解。而RdRp产物保持不变,它只在与RNA酶T1的长时间孵育后才受影响。例如,用RNA酶T1处理2小时后在凝胶中其原始位置不再能检测到标记的产物分子。而出现了电泳迁移与输入的模板RNA相似的新带。用RNA酶T1但在不同温度下消化1小时观察到相似的效果在22℃时,RdRp产物仍大部分未受影响,而在37℃它转变为与原始底物共迁移的新产物。
对这些观察的解释是输入的RNA用作HCV RdRp的模板,其中3'-OH用作通过一个回转或“回复复制”机制引起互补链的合成以产生将反义链共价连于其上的有义(模板)链组成的双链RNA“发夹”分子。这样一种结构可以解释RdRp产物在聚丙烯酰胺凝胶中的异常电泳迁移率和它对单链特异性核酸酶的高度抗性。回转环可能不是碱基配对的因而对于核酸酶应该是可接近的。于是用RNA酶T1处理导致在有义和反义链之间共价键的水解以产生一种成双链的RNA分子。在变性凝胶电泳过程中,这两条链分离并只有在长度上与原始的RNA模板相似的新合成的反义链仍可被检测到。这种机制似乎更可能,尤其考虑到这种产物是在体外由几种其它RNA聚合酶产生的这一事实。
为了证明在聚合酶反应过程中标记的并通过RNA酶T1处理而明显释放的RNA产物表现与加入的模板反义的方向,设计了下述的实验。为了这一目的,我们合成了与输入模板RNA分子的三个独立的序列相应的寡聚脱氧核苷酸(图2)与D-RNA的170-195位核苷酸相应的寡核苷酸a(序列号3);与286-309位核苷酸互补的寡核苷酸b(序列号4);与331-354位核苷酸互补的寡核苷酸c(序列号5)。这些被用于与聚合酶反应的产物形成DNA/RNA杂交体,以便将它们用RNA酶H进行消化。起初,将所有的RdRp产物用于杂交。然而,因为这个结构是非常热稳定的,所以未形成特异性的杂交,因而用RNA酶T1预处理发夹型RNA,通过煮沸5分钟变性。然后在寡核苷酸分别存在的条件下降至室温。象预期的那样,杂交体暴露于RNA酶H产生特异性的切割产物。寡核苷酸a指导的切割导致长度大约170和200个核苷酸的产物,寡核苷酸b产生大约290和110个核苷酸的产物而寡核苷酸c产生大约330和65个核苷酸的片段。由于这些片段具有预期的大小(见图3),结果提示HCV NS5B介导的RNA合成通过产生发夹样RNA双螺旋的回复复制机制进行。
实施例4在一合成的RNA底物上的重组HCV TNTase的检测方法TNTase检测是基于对非模板依赖掺入到RNA底物的3'羟基基团的标记核苷酸的检测。用于检测的RNA底物(D-RNA)典型地是如在实施例2中所描述的通过用T7聚合酶对线性化质粒pT7-7DCoH的体外转录获得的。然而,除D-RNA外的任何其它RNA分子用于本发明的TNTase检测。
在含有1-5μl Sf9粗制胞浆提取物或纯化的蛋白组分的40μl总体积中进行体外检测来确定TNTase的活性。被Bac25或Bac5B感染的Sf9细胞的未分离或纯化的胞浆提取物可用作HCV TNTase的来源。从被表达一种与HCV无关蛋白的重组杆状病毒感染的Sf9细胞获得的Sf9细胞提取物可用作一种阴性对照。将下述的添加物加入反应混合物(终浓度)20mM Tris/ClpH7.5、5mM MgCl2、1mM DTT、25mM KCl、1mM EDTA、5-10μCi的一种[32P]NTP(除非另有说明,所用的为UTP,3000Ci/mmol,Amersham)、20U RNasin(Promega)、0.5μgRNA-底物(约4pmol,终浓度100nM)、2μg放线菌素D(Sigma)。室温下孵育反应两小时,通过加入等体积2×蛋白酶K(PK,Boehringer Mannheim)缓冲液(300mM NaCl,100mMTris/Cl pH7.5,1%w/v SDS)随后在37℃用50μgPK处理半小时来终止反应。将RNA产物用PCA抽提,乙醇沉淀并通过在含有7M尿素的5%聚丙烯酰胺凝胶上电泳来分析。
实施例5通过蔗糖梯度沉降纯化HCV RdRp/TNTase的方法在含有去污剂的缓冲液A(见实施例1)中制备一个线性0.3-1.5M蔗糖梯度。将多达2ml的被Bac5B或Bac25感染的Sf9细胞的提取物(相当于大约8×107个细胞)加样至一个12ml梯度上。利用一Beckman SW40转头以39000×g进行离心20小时。收集0.5ml组分并检测活性。发现通过蛋白质印迹法鉴定的NS5B蛋白在密度梯度中以出乎预料高的沉降系数迁移。病毒蛋白和核蛋白体被发现在相同的梯度组分中共沉降。这种独特的行为使我们能够将病毒蛋白从仍保留在梯度上部的胞浆蛋白的主要部分中分离出来。RdRp活性检测揭示RdRp活性与NS5B蛋白共沉降。一种末端核苷酸转移酶活性(TNTase)也存在于这些组分中。
实施例6从Sf9细胞中纯化HCV TNTase/RdRp的方法从1g被Bac5B重组杆状病毒感染的Sf9细胞制备全细胞提取物。在冰上将冻存的细胞融化在补充有1mM PMSF的10ml含有20mM Tris/Hcl pH7.5、1mM EDTA、10mM DTT、50%甘油(N缓冲液)的缓冲液中。为了促进细胞破碎,然后加入Triton X-100和NaCl至终浓度分别为2%和500mM。在加入MgCl2(10mM)和DNA酶I(15ug/ml)后,在室温下搅拌混合物30分钟。然后通过在一Beckman离心机中利用一90Ti转头于4℃以40,000rpm超速离心30分钟澄清提取物。为了调节NaCl浓度至300mM,用含有20mMTris/HCl pH7.5、1mMEDTA、10mMDTT、20%甘油、0.5%TritonX-100(LG缓冲液)的缓冲液稀释澄清的提取物并与在含有300mM NaCl的LG缓冲液中平衡过的5ml DEAE-Sepharose Fast Flow成批孵育。然后将基质倒入一个柱子并用两倍体积的同样缓冲液洗涤。将流出物和DEAE-Sepharose Fast Flow柱的第一次洗涤液用LG缓冲液以1∶3稀释并加入一用含有100mM NaCl的LG缓冲液平衡过的肝素-Sepharose CL6B柱(10ml)中。彻底洗涤肝素-Sepharose C16B并用一在LG缓冲液中100mM到1M NaCl的线性100ml梯度洗脱所结合的蛋白质。根据通过SDS-PAGE的银染色和免疫染色的鉴定,混合含有NS5B的级分并用LG缓冲液稀释以调节NaCl浓度至50mM。随后将稀释过的级分上样于一个用含有50mM NaCl的LG缓冲液平衡过的Mono Q-FPLC柱(1ml)。用一在LG缓冲液中从50mM至1M NaCl的线性梯度(20ml)洗脱蛋白质。根据通过SDS-PAGE的银染色和免疫染色的鉴定,混合含有NS5B的级分并用含有100mM NaCl的LG缓冲液透析。在广泛的透析后,将混合的级分上样于一用含有100mM NaCl的LG缓冲液平衡过的PoyU-Sepharose CL6B(10ml)上。彻底冲洗PoyU-Sepharose CL6B并用一在LG缓冲液中从100mM到1M NaCl的线性100ml梯度洗脱所结合的蛋白质。根据通过SDS-PAGE的银染色和免疫染色的鉴定,混合含有NS5B的级分,用含有100mM NaCl的LG缓冲液透析并在活性检测前贮存在液氮中。
对含有纯化的NS5B蛋白的级分测试两种活性的存在。在相同的级分中发现了RdRp和TNTase活性。这些结果提示RNA依赖的RNA聚合酶和末端核苷酸转移酶这两种活性都是HCV NS5B蛋白质的功能。
我们利用4种核苷酸三磷酸的每一种在非饱和底物浓度下测试经纯化的NS5B的末端核苷酸转移酶活性。结果清楚地表明无论输入RNA的来源,UTP是优选的TNTase底物,随后是ATP、CTP和GTP。
实施例7在一同型多聚RNA模板上重组HCV RdRp的检测方法到此为止我们已经描述了HCV NS5B具有一种RNA依赖的RNA聚合酶活性以及互补RNA链的合成是一种模板引发的反应。有趣的是,利用Bac5B或Bac25感染的Sf9细胞的未分离的胞浆提取物作为RdRp的来源,我们不能观察到利用一种外源加入的寡核苷酸作为引物的互补链RNA的合成。我们解释这可能是由于在我们的未分离提取物中肯定存在的大量的ATP依赖的RNA双螺旋酶。因而我们想利用纯化的NS5B回答这个问题。
首先,我们想确定是否纯化的NSSB聚合酶能够以一种引物依赖的方式在一同型聚RNA模板上合成RNA,这种模板不能够形成分子内发夹结构,因而我们希望互补链RNA合成是严格引物依赖的。因而我们测定了依赖poly(A)模板的UMP渗入。并评价了oligo(rU)12和oligo(dT)12-18作为聚合酶反应的引物。按照下面的方法测定放射性UMP的渗入。在一含20mM Tris/HClpH7.5、5mM MgCl2、1mM DTT、25mM KCl、1mM EDTA、20U RNasin(Promega)、1μCi[32P]UTP(400Ci/mmol,Amersham)或1μCi[3H]UTP(55Ci/mmol,Amersham)、10μMUTP和10ug/ml poly(A)或poly(A)/oligo(dT)12-18的缓冲液中进行标准反应(10-100μl)。加入oligo(U)12(1μg/ml)作为一个引物。PolyA和PolyA/oligo(dT)12-18购自Pharmacia。oligo(U)12获自Genset。最终NS5B酶浓度是10-100nM。在这些条件下反应直线进行达3小时。在22℃孵育2小时后,通过将样品加至DE81滤膜(Whatman)终止反应,用1M Na2HPO4/NaH2PO4,pH7.0彻底冲洗滤膜,用水漂洗,吹干,在闪烁β计数仪上测定滤膜结合的放射性。另外,在0.2M焦磷酸钠中通过10%三氯乙酸和100ug载体tRNA沉淀体外合成的放射性产物,将其收集于0.45um Whatman GF/C滤膜上,真空抽干并在闪烁液体中计数。
虽然在缺少一种引物时一些[32P]UMP或[3H]UMP掺入是可检测到的并且可能是由于与我们纯化的NS5B相关的末端核苷酸转移酶活性,但只有当在反应混合物中加入oligo(rU)12作为引物时观察到了高达20%的产物渗入。出乎意料地,oligo(dT)12-18虽然效率较低但也能发挥一种poly(A)依赖的poly(U)合成的引物功能。
其它适于测定NS5B的RdRp活性的模板/引物包括在放射性GTP存在时的poly(C)/oligo(G)或poly(C)/oligo(dG),在放射性CTP存在时的poly(G)/oligo(C)或poly(G)/oligo(dC),在放射性ATP存在时的poly(U)/oligo(A)或poly(U)/oligo(dA),在放射性CTP存在时的poly(I)/oligo(C)或poly(I)/oligo(dC)。
实施例8在大肠杆菌中表达HCV RdRp/TNTase的方法为了允许在大肠杆菌中表达具有在序列号1中所报道的序列的HCV蛋白片段,构建了在图2和实施例8中所描述的质粒pT7-7(NS5B)。这种蛋白片段含有如上面所讨论的NS5B的RdRp和TNTase。于是利用分子生物学实践中已知的并在实施例8中详细描述的方法将编码NS5B蛋白的HCV eDNA片段克隆在噬菌体T7φ10启动子的下游并与噬菌体T7基因10蛋白的第1个ATG密码子在同一读框中。pT7-7(NS5B)质粒还含有可用作转有质粒pT7-7(NS5B)的大肠杆菌细胞的一个筛选标志。
然后将质粒pT7-7(NS5B)转化入大肠杆菌BL21(DE53)株,通常为了克隆入含有T7启动子的表达载体中的基因高水平表达而使用该菌株。在大肠杆菌的这个菌株中,在噬菌体1 DE53上载有T7基因聚合酶,它被整合在BL21细胞的染色体中(Studier和Moffatt,用噬菌体T7RNA聚合酶指导克隆基因的选择性高水平表达,(1986),《分子生物学杂志》(J.Mol.Biol.)189,113-130页)。按照前面已经描述的方法(Studier和Maffatt)通过在生长培养基中加入异丙基硫代半乳糖苷(IPTG)来诱导目的基因的表达。于是含有RdRp的重组NS5B蛋白片段被产生于宿主细胞的包涵体中。可以从大肠杆菌BL21(DE53)提取物的颗粒级分中纯化重组NS5B蛋白并按照本领域已知的方法重新折叠(D.R.Thatcher和A.Hichcok,在生物技术中的蛋白质折叠(1994)《蛋白质折叠机制》(Mechanism of protein folding)中R.H.Pain编,TRL PRESS,229-255页)。另外通过将细菌生长培养基的温度降低在20℃以下也可以将重组NS5B蛋白产生为可溶性蛋白。于是可以基本按照如实施例5中的描述从大肠杆菌裂解液中纯化可溶性蛋白。
实施例9附图中质粒的详细构建将所选的与HCV-BK分离株(HCVBK)基因组相应的cDNA片段克隆在核多角型病毒的核多角蛋白强启动子下,并以允许在一杆状病毒中同源重组的序列作为侧翼。
pBac5B含有包括在7590到9366位核苷酸之间的HCV-BK序列,并编码在序列号1中所报道的NS5B蛋白。为了获得该质粒,利用分别具有序列5'-AAGGATCCATGTCAATGTCCTACACATGGAC-3'(序列号6)和5'-AATATTCGAATTCATCGGTTGGGGAGCAGGTAGATG-3'(序列号7)的合成寡核苷酸通过PCR产生cDNA片段。然后用Klenow DNA聚合酶处理PCR产物,用BamHI在5'末端消化,随后克隆在Bluescript SK(+)载体的BamHI和SmaI位点之间。随后,将目的cDNA片段用限制性酶BamHI和HindIII完全消化并在pBlueBacIII载体(Invitrogen)的相同位点上重新连接。
pBac25含有2759到9416位核苷酸之间所包含的HCV-BK cDNA区,并编码HCV-BK多聚蛋白的810到3010位氨基酸(序列号2)。按照下面的方法获得该质粒。首先,通过NcoI消化从pCD(38-9.4)(Tomei,L.,Failla,C.,Santolini,E.,De Francesco,R.和La Monica,N.(1993)NS3是一种丙型肝炎病毒多聚蛋白加工所需的丝氨酸蛋白酶,《病毒学杂志》(J.Virol.),67,4017-4026)获得含有2759-3578位核苷酸之间所包括的HCV-BK序列的820bp cDNA片段,并克隆在pBlueBacIII载体(Invitrogen)的NcoI位点上产生一质粒称为pBacNCO。通过NotI和XbaI消化从pCD(38-9.4)(Tomei等,1993)获得含有1959到9461位核苷酸之间所包括的HCV-BK序列的cDNA片段并克隆在Bluescript SK(+)载体的相同位点中产生一质粒称为pBlsNX。通过SacII和HindIII消化从pBlsNX获得含有3304到9461位核苷酸之间所包括的HCV-BK序列的cDNA片段并克隆在pBlsNX质粒的相同位点上产生pBac25质粒。
pT7-7(DCoH)含有大鼠肝细胞核因子1a_的二聚化辅因子的完整编码区(316个核苷酸)(DCoH;Mendel,D.B.,Khavari,P.A.,Conley,P.B.,Graves,M.K.,Hansen,L.P.,Admon,A.和Crabtree,G.R.(1991)调节哺乳动物同源区蛋白二聚化的一种辅助因子的鉴别,《科学》(Science)254,1762-1767;基因库登记号M83740)。利用分别具有序列TGGCTGGCAAGGCACACAGGCT(序列号8)和AGGCAGGGTAGATCTATGTC(序列号9)的合成核苷酸Dprl和Dpr2通过PCR扩增与大鼠DCoH的编码序列相应的cDNA片段。将由此获得的cDNA片段克隆至大肠杆菌表达载体pT7-7的SmaI限制性位点中。pT7-7表达载体是除了β-内酰胺酶基因和Col E1复制起点外还含有T7聚合酶启动子φ10和T7基因10蛋白的翻译启始位点的pBR322的衍生物(Tabor S.和Richerdson C.C.(1985)一种用于受控的特定基因唯一表达的T7噬菌体RNA聚合酶/启动子系统,《美国国家科学院学报》(Proc.Natl.Acad.Sci.USA.)82,1074-1078)。
pT7-7(NS5B)含有从7590到9366位核苷酸的HCV序列,并编码在序列号1中所报道的NS5B蛋白。
为了获得该质粒,利用分别具有序列5'-TCAATGTCCTACACATGGAC-3'(序列号10)和5'-GATCTCTAGATCATCGGTTGGGGGAGGAGGTAGATGCC-3′(序列号11)的合成寡核苷酸通过PCR产生一cDNA片段。然后将PCR产物用Klenow DNA聚合酶处理。随后将其连接至经过用EcoRI线性化并用Klenow DNA聚合酶补平末端后的大肠杆菌表达载体pT7-7。另外,利用分别含有序列5'-TGTCAATGTCCTACACATGG-3'(序列号13)和5'-AATATTCGAATTCATCGGTTGGGGAGCAGGTAGATG-3'(序列号14)的合成寡核苷酸通过PCR产生cDNA片段。然后将PCR产物用Klenow DNA聚合酶处理,随后连接在经过NdeI线性化并用Klenow DNA聚合酶补平末端后的大肠杆菌表达载体pT7-7中。
序列表一般信息(i)申请人ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P.ANGELETTI S.p.A.
(ii)发明题目用于体外再现由丙型肝炎病毒(HCV)编码的RNA依赖的RNA聚合酶和末端核苷酸转移酶活性的方法(iii)序列数14(iv)联系地址(A)收信人Societa Italiana Brevetti(B)街:Piazza di Pietra(C)城市罗马(D)国家意大利(E)邮政编码1-00186(V)计算机可读形式(A)媒体类型3.5″1.44M字节的软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS Rev.6.22(D)软件Microsoft Word 6.0(viii)律师/代理人信息(A)姓名DI CERBO,Mario(Dr.)(C)参考号RM/X88530/PCT-DC(ix)通讯信息(A)电话06/6785941(B)传真06/6794692(C)电传612287 ROPAT(1)序列号1的资料(i)序列特征(A)长度591个氨基酸(B)类型氨基酸(C)线型单链(D)拓扑结构线性(ii)分子类型蛋白质(iii)假拟结构否(iv)反义否(v)片段类型C-末端片段(vi)最初来源(A)生物体丙型肝炎病毒(B)分离株BK(vii)直接来源由Tomei等1993年描述的cDNA克隆pCD(38-9.4)(ix)特点(A)名称NS5B非结构多聚蛋白(C)鉴别方法实验性(xi)序列描述序列号1Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys Ala Ala1 5 10 15Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Sar Leu Leu Arg20 25 30His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly Leu Arg35 40 45Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp His Tyr50 55 60Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val Lys Ala65 70 75 80Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro His Ser85 90 95Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn Leu Ser100 105 110Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu Leu Glu115 120 125Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu Val130 135 140Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu Ile145 150 155 160Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu Tyr165 170 175Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser Tyr Gly180 185 190Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn Thr Trp195 200 205Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe210 215 220Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser Ile Tyr225 230 235 240Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys Ser Leu245 250 255Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly Gln260 265 270Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr Ser275 280 285Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala Cys Arg290 295 300Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp Asp Leu305 310 315 320Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala Ser Leu325 330 335Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp340 345 350Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser355 360 365Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr Tyr Leu370 375 380Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr Ala385 390 395 400Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met Tyr Ala405 410 415Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe Ser Ile420 425 430Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln Ile Tyr435 440 445Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile Ile Glu450 455 460Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro Gly465 470 475 480Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val Pro Pro485 490 495Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu Leu500 505 510Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe Asn Trp515 520 525Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala Ser Arg530 535 540Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly Asp Ile545 550 555 560Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu Cys Leu565 570 575Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn Arg580 585 590(2)序列号2的资料(i)序列特征(A)长度2201个氨基酸(B)类型氨基酸(C)线型单链(D)拓扑结构线性(ii)分子类型多肽(iii)假拟结构否(iv)反义否(v)片段类型C-末端片段(vii)直接来源由Tomei等1993年描述的cDNA克隆pCD(38-9.4)(ix)特点(A)名称NS2-NS5B非结构蛋白前体(C)鉴别方法实验性(xi)序列描述序列号2Met Asp Arg Glu Met Ala Ala Ser Cys Gly Gly Ala Val Phe Val Gly1 5 10 15Leu Val Leu Leu Thr Leu Ser Pro Tyr Tyr Lys Val Phe Leu Ala Arg20 25 30Leu Ile Trp Trp Leu Gln Tyr Phe Thr Thr Arg Ala Glu Ala Asp Leu35 40 45His Val Trp Ile Pro Pro Leu Asn Ala Arg Gly Gly Arg Asp Ala Ile50 55 60Ile Leu Leu Met Cys Ala Val His Pro Glu Leu Ile Phe Asp Ile Thr65 70 75 80Lys Leu Leu Ile Ala Ile Leu Gly Pro Leu Met Val Leu Gln Ala Gly85 90 95Ile Thr Arg Val Pro Tyr Phe Val Arg Ala Gln Gly Leu Ile His Ala100 105 110Cys Met Leu Val Arg Lys Val Ala Gly Gly His Tyr Val Gln Met Ala115 120 125Phe Met Lys Leu Gly Ala Leu Thr Gly Thr Tyr Ile Tyr Asn His Leu130 135 140Thr Pro Leu Arg Asp Trp Pro Arg Ala Gly Leu Arg Asp Leu Ala Val145 150 155 160Ala Val Glu Pro Val Val Phe Ser Asp Met Glu Thr Lys Ile Ile Thr165 170 175Trp Gly Ala Asp Thr Ala Ala Cys Gly Asp Ile Ile Leu Gly Leu Pro180 185 190Val Ser Ala Arg Arg Gly Lys Glu Ile Leu Leu Gly Pro Ala Asp Ser195 200 205Leu Glu Gly Arg Gly Leu Arg Leu Leu Ala Pro Ile Thr Ala Tyr Ser210215 220Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly225 230 235 240Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Val Val Sar Thr Ala245 250 255Thr Gln Ser Phe Leu Ala Thr Cys Val Asn Gly Val Cys Trp Thr Val260 265 270Tyr His Gly Ala Gly Ser Lys Thr Leu Ala Ala Pro Lys Gly Pro Ile275 280 285Thr Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Lys290 295 300Pro Pro Gly Ala Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp305 310 315 320Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg325 330 335Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro Val Ser Tyr Leu340 345 350Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Phe Gly His Ala Val355 360 365Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val370 375 380Asp Phe Val Pro Val Glu Ser Met Glu Thr Thr Met Arg Ser Pro Val385 390 395 400Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Pro Gln Ser Phe Gln Val405 410 415Ala His Leu His Ala Pro Thr Gly Ser Gly Lys Ser Thr Lys Val Pro420 425 430Ala Ala Tyr Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro Ser435 440 445Val Ala Ala Thr Leu Gly Phe Gly Ala Tyr Met Ser Lys Ala His Gly450 455 460Ile Asp Pro Asn Ile Arg Thr Gly Val Arg Thr Ile Thr Thr Gly Ala465 470 475 480Pro Val Thr Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys485 490 495Ser Gly Gly Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Set Thr50θ505 510Asp Ser Thr Thr Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala Glu515 520 525Thr Ala Gly Ala Arg Leu Val Val Leu Ala Thr Ala Thr Pro Pro Gly530 535 540Ser Val Thr Val Pro His Pro Asn Ile Glu Glu Val Ala Leu Ser Asn545 550 555 560Thr Gly Glu Ile Pro Phe Tyr Gly Lys Ala Ile Pro Ile Glu Ala Ile565 570 575Arg Gly Gly Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys Asp580 585 590Glu Leu Ala Ala Lys Leu Ser Gly Leu Gly Ile Asn Ala Val Ala Tyr595 600 605Tyr Arg Gly Leu Asp Val Ser Val Ile Pro Thr Ile Gly Asp Val Val610 615 620Val Val Ala Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp625 630 635 640Ser Val Ile Asp Cys Asn Thr Cys Val Thr Gln Thr Val Asp Phe Ser645 650 655Leu Asp Pro Thr Phe Thr Ile Glu Thr Thr Thr Val Pro Gln Asp Ala660 665 670Val Ser Arg Ser Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Arg Gly675 680 685Ile Tyr Arg Phe Val Thr Pro Gly Glu Arg Pro Ser Gly Met Phe Asp690 695 700Ser Ser Val Leu Cys Glu Cys Tyr Asp Ala Gly Cys Ala Trp Tyr Glu705 710 715 720Leu Thr Pro Ala Glu Thr Ser Val Arg Leu Arg Ala Tyr Leu Asn Thr725 730 735Pro Gly Leu Pro Val Cys Gln Asp His Leu Glu Phe Trp Glu Ser Val740 745 750Phe Thr Gly Leu Thr His Ile Asp Ala His Phe Leu Ser Gln Thr Lys755 760 765Gln Ala Gly Asp Asn Phe Pro Tyr Leu Val Ala Tyr Gln Ala Thr Val770 775 780Cys Ala Arg Ala Gln Ala Pro Pro Pro Ser Trp Asp Gln Met Trp Lys785 790 795 800Cys Leu Ile Arg Leu Lys Pro Thr Leu His Gly Pro Thr Pro Leu Leu805 810 815Tyr Arg Leu Gly Ala Val Gln Asn Glu Val Thr Leu Thr His Pro Ile820 825 830Thr Lys Tyr Ile Met Ala Cys Met Ser Ala Asp Leu Glu Val Val Thr835 840 845Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr850 855 860Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser865 870 875 880Gly Arg Pro Ala Ile Val Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe885 890 895Asp Glu Met Glu Glu Cys Ala Ser His Leu Pro Tyr Ile Glu Gln Gly900 905 910Met Gln Leu Ala Glu Gln Phe Lys Gln Lys Ala Leu Gly Leu Leu Gln915 920 925Thr Ala Thr Lys Gln Ala Glu Ala Ala Ala Pro Val Val Glu Ser Lys930 935 940Trp Arg Ala Leu Glu Thr Phe Trp Ala Lys His Met Trp Asn Phe Ile945 950 955 960Ser Gly Ile Gln Tyr Leu Ala Gly Leu Ser Thr Leu Pro Gly Asn Pro965 970 975Ala Ile Ala Ser Leu Met Ala Phe Thr Ala Ser Ile Thr Ser Pro Leu980 985 990Thr Thr Gln Ser Thr Leu Leu Phe Asn Ile Leu Gly Gly Trp Val Ala99510001005Ala Gln Leu Ala Pro Pro Ser Ala Ala Ser Ala Phe Val Gly Ala Gly101010151020Ile Ala Gly Ala Ala Val Gly Ser Ile Gly Leu Gly Lys Val Leu Val1025 103010351040Asp Ile Leu Ala Gly Tyr Gly Ala Gly Val Ala Gly Ala Leu Val Ala104510501055Phe Lys Val Met Ser Gly Glu Met Pro Ser Thr Glu Asp Leu Val Asn106010651070Leu Leu Pro Ala Ile Leu Ser Pro Gly Ala Leu Val Val Gly Val Val107510801085Cys Ala Ala Ile Leu Arg Arg His Val Gly Pro Gly Glu Gly Ala Val109010951100Gln Trp Met Asn Arg Leu Ile Ala Phe Ala Ser Arg Gly Asn His Val1105 111011151120Ser Pro Thr His Tyr Val Pro Glu Sar Asp Ala Ala Ala Arg Val Thr112511301135Gln Ile Leu Ser Ser Leu Thr Ile Thr Gln Leu Leu Lys Arg Leu His114011451150Gln Trp Ile Asn Glu Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp Leu115511601165Arg Asp Val Trp Asp Trp Ile Cys Thr Val Leu Thr Asp Phe Lys Thr117011751180Trp Leu Gln Ser Lys Leu Leu Pro Gln Leu Pro Gly Val Pro Phe Phe1185 119011951200Ser Cys Gln Arg Gly Tyr Lys Gly Val Trp Arg Gly Asp Gly Ile Met120512101215Gln Thr Thr Cys Pro Cys Gly Ala Gln Ile Thr Gly His Val Lys Asn122012251230Gly Ser Met Arg Ile Val Gly Pro Lys Thr Cys Ser Asn Thr Trp His1235 1240 1245Gly Thr Phe Pro Ile Asn Ala Tyr Thr Thr Gly Pro Cys Thr Pro Ser125012551260Pro Ala Pro Asn Tyr Ser Arg Ala Leu Trp Arg Val Ala Ala Glu Glu1265 127012751280Tyr Val Glu Val Thr Arg Val Gly Asp Phe His Tyr Val Thr Gly Met128512901295Thr Thr Asp Asn Val Lys Cys Pro Cys Gln Val Pro Ala Pro Glu Phe130013051310Phe Ser Glu Val Asp Gly Val Arg Leu His Arg Tyr Ala Pro Ala Cys131513201325Arg Pro Leu Leu Arg Glu Glu Val Thr Phe Gln Val Gly Leu Asn Gln133013351340Tyr Leu Val Gly Ser Gln Leu Pro Cys Glu Pro Glu Pro ASp Val Ala1345 135013551360Val Leu Thr Ser Met Leu Thr Asp Pro Ser His Ile Thr Ala Glu Thr136513701375Ala Lys Arg Arg Leu Ala Arg Gly Ser Pro Pro Ser Leu Ala Ser Ser138013851390Ser Ala Ser Gln Leu Ser Ala Pro Ser Leu Lys Ala Thr Cys Thr Thr139514001405His His Val 5er Pro Asp Ala Asp Leu Ile Glu Ala Asn Leu Leu Trp141014151420Arg Gln Glu Met Gly Gly Asn Ile Thr Arg Val Glu Ser Glu Asn Lys1425 143014351440Val Val Val Leu Asp Ser Phe Asp Pro Leu Arg Ala Glu Glu Asp Glu144514501455Arg Glu Val Ser Val Pro Ala Glu Ile Leu Arg Lys Ser Lys Lys Phe146014651470Pro Ala Ala Met Pro Ile Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu147514801485Leu Glu Ser Trp Lys Asp Pro Asp Tyr Val Pro Pro Val Val His Gly149014951500Cys Pro Leu Pro Pro Ile Lys Ala Pro Pro Ile Pro Pro Pro Arg Arg1505 151015151520Lys Arg Thr Val Val Leu Thr Glu Ser Ser Val Ser Ser Ala Leu Ala152515301535Glu Leu Ala Thr Lys Thr Phe Gly Ser Ser Glu Ser Ser Ala Val Asp154015451550Ser Gly Thr Ala Thr Ala Leu Pro Asp Gln Ala Ser Asp Asp Gly Asp155515601565Lys Gly Ser Asp Val Glu Ser Tyr Ser Ser Met Pro Pro Leu Glu Gly157015751580Glu Pro Gly Asp Pro Asp Leu Ser Asp Gly Ser Trp Ser Thr Val Ser1585 159015951600Glu Glu Ala Ser Glu Asp Val Val Cys Cys Ser Met Ser Tyr Thr Trp160516101615Thr Gly Ala Leu Ile Thr Pro Cys Ala Ala Glu Glu Ser Lys Leu Pro162016251630Ile Asn Ala Leu Ser Asn Ser Leu Leu Arg His His Asn Met Val Tyr163516401645Ala Thr Thr Ser Arg Ser Ala Gly Leu Arg Gln Lys Lys Val Thr Phe165016551660Asp Arg Leu Gln Val Leu Asp Asp His Tyr Arg Asp Val Leu Lys Glu1665 167016751680Met Lys Ala Lys Ala Ser Thr Val Lys Ala Lys Leu Leu Ser Val Glu168516901695Glu Ala Cys Lys Leu Thr Pro Pro His Ser Ala Lys Ser Lys Phe Gly170017051710Tyr Gly Ala Lys Asp Val Arg Asn Leu Ser Ser Lys Ala Val Asn His171517201725Ile His Ser Val Trp Lys Asp Leu Leu Glu Asp Thr Val Thr Pro Ile173017351740Asp Thr Thr Ile Met Ala Lys Asn Glu Val Phe Cys Val Gln Pro Glu1745 175017551760Lys Gly Gly Arg Lys Pro Ala Arg Leu Ile Val Phe Pro Asp Leu Gly176517701775Val Arg Val Cys Glu Lys Met Ala Leu Tyr Asp Val Val Ser Thr Leu178017851790Pro Gln Val Val Met Gly Ser Ser Tyr Gly Phe Gln Tyr Ser Pro Gly179518001805Gln Arg Val Glu Phe Leu Val Asn Thr Trp Lys Ser Lys Lys Asn Pro181018151820Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe Asp Ser Thr Val Thr Glu1825 183018351840Asn Asp Ile Arg Val Glu Glu Ser Ile Tyr Gln Cys Cys Asp Leu Ala184518501855Pro Glu Ala Arg Gln Ala Ile Lys Ser Leu Thr Glu Arg Leu Tyr Ile186018651870Gly Gly Pro Leu Thr Asn Ser Lys Gly Gln Asn Cys Gly Tyr Arg Arg187518801885Cys Arg Ala Ser Gly Val Leu Thr Thr Ser Cys Gly Asn Thr Leu Thr189018951900Cys Tyr Leu Lys Ala Ser Ala Ala Cys Arg Ala Ala Lys Leu Gln Asp1905 191019151920Cys Thr Met Leu Val Asn Gly Asp Asp Leu Val Val Ile Cys Glu Ser192519301935Ala Gly Thr Gln Glu Asp Ala Ala Ser Leu Arg Val Phe Thr Glu Ala194019451950Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro Gln Pro Glu Tyr195519601965Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Val Ser Val Ala His197019751980Asp Ala Ser Gly Lys Arg Val Tyr Tyr Leu Thr Arg Asp Pro Thr Thr1985 199019952000Pro Leu Ala Arg Ala Ala Trp Glu Thr Ala Arg His Thr Pro Val Asn200520102015Ser Trp Leu Gly Asn Ile Ile Met Tyr Ala Pro Thr Leu Trp Ala Arg202020252030Met Ile Leu Met Thr His Phe Phe Ser Ile Leu Leu Ala Gln Glu Gln203520402045Leu Glu Lys Ala Leu Asp Cys Gln Ile Tyr Gly Ala Cys Tyr Ser Ile205020552060Glu Pro Leu Asp Leu Pro Gln Ile Ile Glu Arg Leu His Gly Leu Ser2065 2070 2075 2080Ala Phe Ser Leu His Ser Tyr Ser Pro Gly Glu Ile Asn Arg Val Ala208520902095Ser Cys Leu Arg Lys Leu Gly Val Pro Pro Leu Arg Val Trp Arg His210021052110Arg Ala Arg Ser Val Arg Ala Arg Leu Leu Ser Gln Gly Gly Arg Ala211521202125Ala Thr Cys Gly Lys Tyr Leu Phe Asn Trp Ala Val Lys Thr Lys Leu213021352140Lys Leu Thr Pro Ile Pro Ala Ala Ser Arg Leu Asp Leu Ser Gly Trp2145 215021552160Phe Val Ala Gly Tyr Ser Gly Gly Asp Ile Tyr His Ser Leu Ser Arg216521702175Ala Arg Pro Arg Trp Phe Met Leu Cys Leu Leu Leu Leu Ser Val Gly218021852190Val Gly Ile Tyr Leu Leu Pro Asn Arg21952200(3)序列号3的资料(i)序列特征(A)长度26个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称oligo a(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号3GCCGAGATGC CATCTTCAAA CAGTTC 26(4)序列号4的资料(i)序列特征(A)长度24个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(ii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称oligo b(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号4GTGTACAACA AGGTCCATAT CACC 24(5)序列号5的资料(i)序列特征(A)长度24个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称oligo c(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号5GGTCTTTCTG AACGGGATAT AAAC 24(6)序列号6的资料(i)序列特征(A)长度31个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称5'-5B
(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号6AAGGATCCAT GTCAATGTCC TACACATGGA C 31(7)序列号7的资料(i)序列特征(A)长度36个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称3'-5B(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号7AATATTCGAA TTCATCGGTT GGGGAGCAGG TAGATG 36(8)序列号8的资料(i)序列特征(A)长度22个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vii)直接来源寡核苷酸合成仪
(ix)特点(A)名称Dpr1(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号8TGGCTGGCAA GGCACACAGG CT 22(9)序列号9的资料(i)序列特征(A)长度20个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义是(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称Dpr2(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号9AGGCAGGGTA GATCTATGTC20(10)序列号10的资料(i)序列特征(A)长度20个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否
(iv)反义否(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称NS5B-5'(1)(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号10TCAATGTCCT ACACATGGAC20(11)序列号11的资料(i)序列特征(A)长度38个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义是(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称HCVA-13(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号11GATCTCTAGA TCATCGGTTG GGGGAGGAGG TAGATGCC38(12)序列号12的资料(i)序列特征(A)长度399个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性
(ii)分子类型mRNA(iii)假拟结构否(iv)反义否(vi)最初来源(A)生物体Rattus Norvegicus(B)分离株Sprague-Dawley(vii)直接来源pT7-7(DCoH)(ix)特点(A)名称D-RNA(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号12GGGAGACCAC AACGGUUUCC CUCUAGAAAU AAUUUUGUUU AACUUUAAGA AGGAGAUAUA60CAUAUGGCUA GAAUUCGCGC CCUGGCUGGC AAGGCACACA GGCUGAGUGC UGAGGAACGG 120GACCAGCUGC UGCCAAACCU GCGGGCCGUG GGGUGGAAUG AACUGGAAGG CCGAGAUGCC 180AUCUUCAAAC AGUUCCAUUU UAAAGACUUC AACAGGGCUU UUGGCUUCAU GACAAGAGUC 240GCCCUGCAGG CUGAAAAGCU GGACCACCAU CCCGAGUGGU UUAACGUGUA CAACAAGGUC 300CAUAUCACCU UGAGCACCCA CGAAUGUGCC GGUCUUUCUG AACGGGAUAU AAACCUGGCC 360AGCUUCAUCG AACAAGUUGC CGUGUCUAUG ACAUAGAUC 399(13)序列号13的资料(i)序列特征(A)长度20个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义否(vi)直接来源寡核苷酸合成仪(ix)特点
(A)名称NS5B-up(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号13TGTCAATGTC CTACACATGG 20(14)序列号14的资料(i)序列特征(A)长度38个核苷酸(B)类型核苷酸(C)线型单链(D)拓扑结构线性(ii)分子类型合成DNA(iii)假拟结构否(iv)反义是(vii)直接来源寡核苷酸合成仪(ix)特点(A)名称3'-5B(C)鉴别方法聚丙烯酰胺凝胶(xi)序列描述序列号14AATATTCGAA TTCATCGGTT GGGGAGCAGG TAGATG 3权利要求
1.一种用于体外再现由丙型肝炎病毒编码的RNA依赖RNA聚合酶活性或末端核苷酸转移酶活性的方法,其特征在于将含有NS5B(序列号1)的序列用于反应混合物中。
2.根据权利要求1体外再现由HCV编码的RNA依赖RNA聚合酶活性的方法,其中将NS5B以NS2-NS5B前体掺入反应混合物中,所说的前体利用发生在超量生产生物体中的多个蛋白裂解反应而产生一种酶活性形式的NS5B。
3.根据权利要求1体外再现由HCV编码的末端核苷酸转移酶活性的方法,其中将NS5B以NS2-NS5B前体掺入反应混合物中,所说的前体利用发生在超量生产生物体中的多个蛋白裂解反应而产生一种酶活性形式的NS5B。
4.一种组合物,其特征在于它含有根据权利要求1到3的NS5B序列。
5.根据权利要求4的组合物,其含有在序列号1中描述的及此中所含或由此衍生的序列的蛋白质。
6.根据权利要求4或5的组合物用于建立一种能够筛选抑制与NS5B蛋白相关酶活性的治疗目的化合物的酶检测法的用途。
7.根据上面的描述、实施例和权利要求用于体外再现NS5B的RNA依赖RNA聚合酶和末端核苷酸转移酶活性的方法、组合物和该组合物在建立一种能够筛选抑制与NS5B相关的酶活性的治疗目的化合物的酶测试法中的用途。
全文摘要
这是一种用于体外再现与丙型肝炎病毒相关RNA依赖的RNA聚合酶活性的方法。本方法的特征在于将NS5B中所含的序列用于反应混合物中。利用这种方法也可复制NS5B蛋白的另一特征性末端核苷酸转移酶活性。这种方法利用纯化至表观均一性的或在超表达的生物体的提取物中存在的NS5B蛋白可以催化核苷酸加到外源性或内源性NNA分子的3′末端这个事实。本发明还涉及一种含有在NS5B中所含序列的组合物,以及该组合物在建立一种能够筛选抑制与NS5B相关的酶活性的治疗目的化合物的酶测试法中的用途。图中所示为在培养的真核和原核细胞中产生丙型肝炎病毒RNA依赖的RNA聚合酶和末端核苷酸转移酶的方法中所用的质粒。
文档编号G01N33/573GK1189187SQ96195029
公开日1998年7月29日 申请日期1996年5月24日 优先权日1996年5月24日
发明者R·迪弗朗希斯克, L·托梅, S-E·比伦斯 申请人:布·安格莱荻公司分子生物学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1