新的dna分子的制作方法

文档序号:1058632阅读:277来源:国知局
专利名称:新的dna分子的制作方法
技术领域
本发明提供编码结核分支杆菌RNA聚合酶δ亚单位的新的核酸分子。它也涉及这种核酸分子编码的称为SigA和SigB多肽,以及载体和用该核酸分子转化的宿主细胞。本发明进一步提供了抑制δ亚单位和核心RNA聚合酶之间相互作用的化合物的筛选方法。
背景技术
基因转录成相应的RNA分子是一个复杂的过程,它由DNA依赖性RNA聚合酶催化,并涉及许多不同的蛋白因子。在真细菌中,核心RNA聚合酶由比例为2∶1∶1的α,β和β′亚单位组成。为了指导RNA聚合酶到待转录的特异基因的启动子,细菌产生多种称为δ因子的蛋白,其与RNA聚合酶相互作用以形成有活性的全酶。所产生的复合物能识别和附着到启动子中特异的核苷酸序列。
物理学测量表明δ亚单位结合至核心RNA聚合酶时诱导其构型转变。δ亚单位结合到核心酶,增加核心酶对DNA结合常数的好几个数量级。(Chamberlin,M.J.(1974)生物化学综述年刊43,721-)。
根据鉴定和测序不同生物来源的δ亚单位的特征描述将它们分为两大类组I和组II。组Iδ也称为δ70类或“管家”δ组。属于该组的δ亚单位识别细胞中的相似启动子序列。这些特性反映在种间是高度保守的蛋白质的某些区域中。
细菌δ因子与真核细胞的转录因子没有任何同源性,因而是抗菌化合物的潜在的靶子。δ亚单位的突变,影响了它的结合及赋予DNA序列对酶特异性的能力,已知其对细胞而言是致死性的。
结核分支杆菌是主要的肺部致病菌,它的特征是生长速度很慢。作为一种致病菌,它进入肺泡的巨噬细胞,在其吞噬体内增殖,最终裂解细胞,经血液不仅传播至肺的其它区域,而且至肺外组织。因此病原菌在至少两种完全不同的环境增殖,涉及利用不同营养物质和多种可能的宿主因子;一种成功的感染涉及新的多套基因协调表达。这种调节类似不同的生理阶段,以芽孢杆菌属为最好例证,其不同阶段特异的基因表达通过RNA聚合酶与不同δ因子结合而被转录。这提供了不仅定向结核分支杆菌的看家δ的可能性,而且定向不同感染和传播阶段的特异的δ亚单位的可能性。
附图简述

图1质粒pARC 8175图谱图2质粒pARC 8176图谱发明目的由于与特异性δ亚单位的结合对RNA聚合酶的特异性来说是至关重要的,因此该相关过程是药物设计的适宜靶子。为了鉴定能抑制上述相关过程的化合物,鉴定δ亚单位的一级结构是必要的。
因此本研究的目的在于提供δ亚单位的序列和结构的信息,此信息将能够筛选、鉴定和设计能与δ亚单位竞争结合核心RNA聚合酶的化合物,这些化合物可开发为有效的治疗制剂。发明公开贯穿本描述,特别是在以下的实施例中,术语“标准方案”和“标准步骤”当用于上下文分子克隆技术时,应理解为是通常能在普通实验室手册中查到的方案和步骤,如Sambrook J.,Fritsch,E.F.及Maniatis,T(1989)分子克隆实验手册,第二版,冷泉港实验室出版社,冷泉港,纽约。
第一方面本发明提供了结构分支杆菌RNA聚合酶的组Iδ亚单位的分离的多肽,或其有功能的等价修饰形式。
优选的具有根据序列表中SEQ ID NO2或4的氨基酸序列的这种多肽经重组DNA技术获得,且在下文称为SigA和SigB多肽,然而应该明确的是根据本发明多肽并不严格局限于具有与序列表内SEQ IDNO2或4相同的氨基酸序列的多肽。更有甚者本发明另外包括这些带有修饰的天然多肽的修饰形式,如替代、小的缺失、插入或倒位,然而这些多肽基本上有结核分支杆菌δ亚单位的生物活性。这些生物活性包括与核心酶结合和/或赋予启动子序列识别以及转录起始特性的能力。因而,包括在本发明中的有多肽,其氨基酸序列与列于序列表中SEQ IDNO2或4的氨基酸序列至少90%同源,优选至少有95%同源。
另一方面本发明提供分离和纯化的核酸分子,其具有编码本发明的多肽即SigA或SigB多肽的核苷酸序列。在本发明的优选形式中,上述核酸分子为DNA分子,其具有与序列表中SEQ ID NO1或3相同的核苷酸序列。然而,根据本发明的核酸分子并不严格局限于具有SEQID NO1或3所示序列的DNA分子。更有甚者,本发明包括带有修饰的核酸分子,如替代、小的缺失、插入或倒位,然而其编码基本具有根据本发明多肽的生物化学活性的蛋白。因此包括在本发明中有DNA分子,其核苷酸序列与列于序列表中SEQ ID NO1或3的核苷酸序列具有至少90%的同源性,优选至少95%的同源性。
包括在本发明中也有这类DNA分子,其核苷酸序列因遗传编码简并而成为SEQ ID NO1或3的核苷酸序列。三个核苷酸的序列组即为一个密码子,编码一个氨基酸。因有64个可能的密码子,但仅有20个天然氨基酸,故大多数氨基酸由多个密码子所编码。遗传密码子的这种天然的简并性或丰余性在本领域中众所周知。因此应理解序列表中所显示的DNA序列,仅是大量但又确定的编码上述多肽DNA序列中的一个实例。本发明因此包括选自下列来源的分离的核酸分子(a)包括在SEQ ID NO1或SEQ ID NO3中显示的编码结核分支杆菌RNA聚合酶组Iδ亚单位的核苷酸序列的DNA分子;(b)核酸分子,其包括能与(a)中定义的DNA分子多肽编码区互补的核苷酸序列杂交的并且编码结核分支杆菌组Iδ亚单位的多肽的核苷酸序列或其有功能的等价修饰形式;(c)核酸分子,其包括由于遗传编码的简并而成为(a)或(b)中定义的核苷酸序列并且编码结核分支杆菌组Iδ亚单位的核酸序列或其有功能的等价修饰形式。
术语“与核苷酸序列的杂交”应理解为在本领域的技术人员熟知的严格条件下杂交到一段核苷酸序列或其特异性部分。
本发明的DNA分子可以是载体形式如可复制的表达载体,它能携带和介导根据本发明的DNA分子的表达。本文中“复制”意指该载体能在其被导入的给定类型宿主细胞中复制。载体的实例是病毒,例如嗜菌体、粘粒、质粒和其它重组载体。用本领域众所周知的方法将核酸分子插入载体基因组。根据本发明载体包括质粒载体含有SigA基因的编码序列pARC 8175(NCIMB 40738)或含SigB基因编码序列的pARC 8176(NCIMB 40739)。
包含根据本发明载体的宿主细胞也包括在本发明之中。这种宿主细胞可以是原核细胞、单细胞的真核细胞或来自多细胞生物的细胞。因此宿主细胞可以是,如细菌如大肠杆菌细胞;来自酵母的细胞如啤酒糖酵母或巴斯德毕赤酵母;或哺乳动物细胞。载体有效地导入宿主细胞使用的方法是众所周知的标准方法即重组DNA方法。
本发明更进一步的方面是关于本发明多肽的制备方法,包括在所述多肽产生的情况下培养以根据本发明的表达载体转化的宿主细胞及回收该多肽。
用于培养细胞的培养基可以是适合此目的任何常规培养基。适宜的载体可以是上述任何载体,且合适的宿主细胞可以是上面已列出的任何类型细胞。构建载体和有效将其导入宿主细胞使用的方法可以是在重组DNA领域中用于此目的已知的任何方法。依据细胞的类型和载体的组成,细胞表达的重组多肽能够分泌即经细胞膜输出。
若该多肽由宿主细胞在细胞内产生即不由细胞分泌,于是可用标准步骤回收,包括机械法使细胞裂解,例如超声粉碎或匀浆,或通过酶或化学法,其后纯化。
为达到分泌的目的,编码多肽的DNA序列应接上编码信号肽的序列,信号肽的存在方可保证多肽由细胞分泌出来,从而至少表达多肽的重要部分分泌到培养基并回收。
本发明的另一重要方面是测定化合物的方法,此化合物具有抑制剂δ亚单位与结核分支杆菌RNA聚合酶结合的能力,所述方法包括使用重组SigA或SigB多肽或上述定义的核酸分子。这种方法优选包括(i)待检测的用于该抑制能力的化合物与上述SigA或SigB多肽和结核分支杆菌核心RNA聚合酶接触;和(ii)检测是否上述多肽与该核心RNA聚合酶结合形成RNA聚合酶全酶。术语“核心RNA聚合酶”应理解为是一种至少包含α,β和β′亚单位但不包括δ亚单位的RNA聚合酶。术语“RNA聚合酶全酶”应理解为是一种至少包含α、β、β′和δ亚单位。如需要,δ亚单位多肽可被标记,例如用适宜的放射性分子如35S或125I标记。
Lesley等发表了测定δ多肽是否与核心RNA聚合酶结合的适宜方法(生物化学28,7728-7734,1989)。这方法是基于δ多肽与核心RNA聚合酶结合后与未结合多肽的大小差异。用层析法可分离出不同大小的两种形式,如用凝胶过滤柱如Waters Protein Pok300SW大小柱。洗脱过柱后这两种形式可用已知的如闪烁计数或SDS-聚丙烯酰胺凝胶电泳接着以免疫印迹法检测和定量。
根据Lesley等(上述)描述的另一种方法,用一种与RNA聚合酶结合抗体的免疫沉淀法来检测RNA聚合酶全酶。来源于生物体如大肠杆菌、结核分支杆菌或包皮垢分支杆菌的核心RNA聚合酶能与放射性标记的SigA或SigB多肽反应。这种反应混合物用福尔马林处理的金黄色葡萄球菌细胞悬液处理,用抗RNA聚合酶抗体进行预处理。洗涤细胞悬液去除未结合蛋白,重悬于SDS-聚丙烯酰胺凝胶电泳上样缓冲液中并用SDS-聚丙烯酰胺凝胶电泳分离。结合的SigA或SigB多肽用放射自显影,其后闪烁计数来检测。
另一种用来分析抑制δ亚单位依赖性结核分支杆菌RNA聚合酶转录的化合物的方法包括(i)用于所述抑制能力的待测化合物与本发明的多肽、结核分支杆菌RNA聚合酶和具有开放连接到当结合至所述多肽时能由该核心RNA聚合酶识别启动子序列的编码序列的DNA接触,上述接触在当结核分支杆菌RNA聚合酶与上述启动子结合时,在上述编码序列转录适宜条件下完成;和(ii)检测相应于上述编码序列的mRNA的形成。
这种检定是基于这样的事实大肠杆菌共同的启动子序列,若核心RNA聚合酶缺乏δ亚单位是不可转录的。然而如加入Sigma70蛋白将能使该复合物识别特异的启动子并起始转录。因此用含有适宜启动子的DNA作为模板,监测形成特异长度的mRNA可完成筛选具有抑制δ依赖的转录能力的化合物。通过测量游离3H-UTP掺入可沉淀TCA计数和测定特异转录本的长度来监测转录(Ashok kumar et al.(1994)分子生物学杂志235,405-413;Kajitani,M.and Ishihama,A.(1983)核酸研究11,671-686和3873-3888)。用这种分析方法鉴定的化合物可抑制不同机制的转录,如(a)与δ蛋白结合并阻止其与核心RNA聚合酶结合;(b)与核心RNA聚合酶结合并从空间上抑制δ蛋白的结合;或(c)抑制转录中起始或延伸的中间步骤。本发明进一步的方面为检测结核分支杆菌RNA聚合酶δ亚单位的蛋白结构的方法,其特征在于SigA或SigB多肽用于X射线晶体衍射分析,晶体形成中SigA或SigB多肽的应用有助于一种基于X射线晶体衍射分析的具有治疗作用的化合物的合理设计,该化合物抑制Sigma70蛋白与核心RNA聚合酶之间相互作用,或者抑制与核心RNA聚合酶结合的δ70蛋白在基因转录过程中结合DNA。
实施例实施例1与Sigma70基因同源的结核分支杆菌DNA序列的鉴定1.1.推断性Sigma70同源物的PCR扩增以下PCR引物是基于枯草芽孢杆菌Sigma70(Sigma70的同源物)和大肠杆菌Sigma70的保守氨基酸序列而设计的(Gitt,M.A.等.(1985)生物化学杂志260,7178-7185)。正向引物(SEQ ID NO5)5′-AAG TTC AGC ACG TAC GCC ACG TGG TGG ATC-3′C G C反向引物(SEQ ID NO6)5′-CTT GGC CTC GAT CTG GCG GAT GCG CTC-3C C C在一些位置所示的可选核苷酸表明该引物是简并性引物,它适合于未确定基因的扩增。
结核分支杆菌H37RV(ATCC 27294)染色体DNA的制备遵循标准方法。一段长约500bp DNA片段的PCR扩增在下述条件下完成退火+55℃ 1分钟变性+93℃ 1分钟延伸+73℃ 2分钟1.2.结核分支杆菌DNA的Southern杂交结核分支杆菌H37RV(ATCC 27294)结核分支杆菌H37RA及包皮垢分支杆菌染色体DNA用标准方法制备,并用限制酶SalI限制性酶切。DNA片段用1%凝胶电泳分离并转移至尼龙膜上用标准方法进行“Southern印迹”分析。膜以上述PCR产生的带自放射标记的500bp DNA片段为探针,来检测同源片段。
Southern杂交试验分析表明在用SalI消化的两个结核分支杆菌株都存在至少三条杂交片段,分别约为4.2,2.2及0.9kb。在包皮垢分支杆菌,可检出4.2及2.2kb二条杂交片段。由此得出结论有多条DNA片段与已知Sigma70基因同源。
用结核分支杆菌的四种不同临床分离物进行类似Southern杂交实验,显示相同的结果,提示类似基因也存在于结核分支杆菌其它毒性分离物中。实施例2推断性Sigma70的同源物的克隆2.1.结核分支杆菌SigA的克隆采用下述标准方法以上述500bp PCR探针筛选结核分支杆菌Erdman菌株的染色体DNA的λgt11文库(来自WHO)。一个含有4.7kbEcoRI插入子的λgt11噬菌体被鉴定并确认可与PCR探针杂交。该4.7kb插入子的限制酶分析,揭示它具有内在的与PCR探针杂交的2.2kb SalI片段。
4.7片段用EcoRI限制酶从λgt11 DNA中切除,亚克隆至克隆载体pBR322,获得重组质粒pARC8175(图1)(NCIMB 40738)。
在2.2kb SalI片段上的推断性Sigma70同源物称为结核分支杆菌SigA,发现SigA基因编码序列具有内在的SalI位点,这就可以解释在Southern实验中0.9kb片段的杂交带。2.2.结核分支杆菌SigB的克隆结核分支杆菌H37Rv DNA用SalI限制性酶切且DNA片段用制备琼脂糖凝胶电泳分离。切除4.0至5.0kb区域的凝胶块,用标准方法提取凝胶块中的DNA。该DNA连接至克隆载体pBR329的SalI位点,连接的DNA转化至大肠杆菌DH5α以获得亚基因文库。亚基因库转化子用PCR产生的500bp探针用标准方法进行菌落印迹鉴定。分析单个转化子菌落的质粒图谱。用限制酶图谱分析详细含有所需质粒大小的重组质粒中的其中一个质粒并发现其含有所需4.2kb SalI DNA片段。在4.2kb插入点带有SigB基因的质粒命名为pARC 8176(图2)(NCIMB40739)。实施例3结核分支杆菌SigA和SigB基因核苷酸序列3.1.SigA核苷酸序列预期含有全部SigA基因的EcoRV-EcoRI DNA片段亚克隆至适宜的M13载体且基因每条链用双脱氧法测序。所得序列列于序列表中SEQ ID NO1。编码526个氨基酸蛋白的1580个核苷酸(SEQ IDNO1中位置70至1620)开放阅读框(ORF)由DNA序列中得到预测。N-末端氨基酸根据开放阅读框架头一个GTG(启始密码子)尝试性设定。
基因产物SigA(SEQ ID NO1)衍生的氨基酸序列具有与大肠杆菌Sigma7060%的一致性和与天青蓝链霉菌的HrdB序列70%的一致性。全面分析SigA的序列,其与不同生物体所见的Sigma70蛋白类似。本分析包含具有高度保守的C-末端部分,而N-末端部分一般显示更少的同源性。这两个区域被一段不同长度的且一般在蛋白中罕见的氨基酸连接。SigA序列有相似的结构,其非保守中心片段相当于SEQID NO2中270-306位的氨基酸。
N-末端的部分与大肠杆菌Sigma70具有有限的同源性,但其类似于天青蓝链霉菌HrdB的Sigma70同源物的N-末端部分。天青蓝链霉菌的3.1,3.2,4.1及4.2区域高度保守结构域单元可能参与DNA结合(Lonetto,M.等(1992)细菌学杂志174,3843-3849),在结核分支杆菌SigA序列中发现近乎相同的结构域单元。蛋白质N-末端起点基于与天青蓝链霉菌HrdB序列的同源结构域单元而尝试性设定。
SigA及SigB氨基酸序列与已知Sigma70序列的全序列相似性提示结核分支杆菌SigA应划为组I Sigma70蛋白。然而,SigA与已知Sigma70蛋白有明显的不同,尤其是一段独特而长的N-末端氨基酸(SEQ IDNO2中24至263位),该片段在识别及从结核分支杆菌启动子序列起始转录中是至关重要的。3.2.SigB的核苷酸序列SigB基因核苷酸序列(SEQ ID NO3)编码323个氨基酸(SEQ ID NO4)。蛋白N-末端起始部位基于开放阅读框中第一个氨基酸存在而被尝试性鉴定。这个开放阅读框架因此估计在SEQID NO3中起始于325位并终止于1293位。SigB基因氨基酸序列与其它Sigma70蛋白的序列比较使SigB基因归入组I Sigma70蛋白家族。基因产物SigB的全部结构与前述SigA同样类型。然而,SigB序列与SigA序列仅有60%同源性,不仅在蛋白的非保守区存在许多差异而且在SigB蛋白的推断性DNA结合部位也存在很多差异。这些特性提示SigB蛋白在生物体生理学上有独特的功能。实施例4SigA和SigB的表达4.1.结核分支杆菌SigA基因在大肠杆菌中的表达SigA基因N-末端部分用下列引物进行PCR扩增正向引物(SEQ ID NO7),包含一个NcoI位点66核苷酸-----------------80核苷酸| |5′-TT CC ATG GGG TAT GTG GCA GCG ACC-3′M G Y V A A T反向引物(SEQ ID NO7)5′-GTA CAG GCC AGC CTC GAT CCG CTT GGC-3′(a)从SigA基因构建体pARC 8175中扩增出一长约750bp片段。扩增产物用NcoI及BamHI限制酶切以获得163bp片段。
(b)用BamHI及EcoRV酶切pARC 8175获1400bp DNA片段。
(c)表达质粒pET 8ck,是一种pET 8c(Studier,F.W.等(1990)酶学方法185,61-89)的衍生物,其中β-半乳糖基因由带有卡那霉素抗性基因所替代,其用NcoI和EcoRV酶切并纯化长约4.2kb片段。
这三个片段(a)、(b)和(c)用标准方法连接,产物转化至大肠杆菌DH5α。单个转化子用下述标准方法筛选质粒图谱。转化子根据预期质粒大小(大约6.35kb)和质粒的限制酶作图鉴定。带有SigA编码片段的重组质粒命名为pARC 8171。
质粒pARC 8174转化进T7表达宿主大肠杆菌BL21(DE3),筛选存在6.35kb质粒单个转化子,并由限制酶分析证实。转化子之一培养于37℃并用标准方法用1mM异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导在表达条件下诱导出一个特异的90kDa蛋白。细胞用低速离心收集并在pH7.4磷酸缓冲液中超声法裂解细胞。裂解物100,000×g离心分成上清及沉淀。用IPTG诱导后获得的大部分70kDa产物存在于沉淀中,提示该蛋白质形成包含体。
为了提纯诱导的SigA基因产物,上述获得的细胞裂解物用BeckmanJA21转头1000rpm离心15分钟澄清。上清液置于15-60%蔗糖梯度液中,100,000×g离心60分钟,包含体从60%蔗糖垫层中沉淀出来。沉淀溶于6M盐酸胍,继而通过含有递减浓度的盐酸胍缓冲液透析而去除。透析液含75%丰度的SigA蛋白,其基本上延用Brokhov,S.和Goldfarb,A.(1993)蛋白表达和纯化,vol.4,503-511描述的纯化大肠杆菌Sigma70的方法进行纯化。4.2.结核分支杆菌SigB基因在大肠杆菌中表达SigB基因产物表达并从包含体中将其纯化。SigB基因编码序列用下列引物进行PCR扩增正向引物(SEQ ID NO9),包含一个NcoI限制酶位点5′-TTTC ATG CGG GAT GCA CCC ACA AGG GCC-3′M A D A P T R A反向引物(SEQ ID NO10)包含一个EcoRI限制酶位点5′-CTT GAA TTC AGC TGG CGT ACG ACC GCA-3′扩增出的920bp片段用EcoRI及NcoI消化,并连接至经EcoRI及NcoI消化的pRSETB上(Kroll等.(1993)DNA和细胞生物学12,441)。连接混合物转化入大肠杆菌DH5α。筛选单个转化子用于质粒图谱及限制酶分析。具有预期质粒图谱的重组质粒命名为pARC 8193。
含有pARC 8193的大肠杆菌DH5α在含50μg/ml氨苄青霉素的LB中培养至OD值为0.5,按标准方法37℃时以1mM IPTG诱导。诱导的SigB蛋白获得的是包含体,采用与所述SigA蛋白相同的方法变性、复性。纯化的SigB蛋白具有>90%的均一性,适于用作转录分析。微生物的保藏下述质粒遵循布达佩斯条约保藏于国立工业和海洋微生物保藏有限公司(NCIMB),阿伯丁,苏格兰,联合王国。质粒 登记号 保藏日期pARC 8175NCIMB 407381995年6月15日pARC 8176NCIMB 407391995年6月15日序列表(1)一般信息(i)申请人(A)姓名Astra AB(B)大街Vastra Malarehamnen 9(C)国家瑞典(E)邮政编码S-15185(G)电话+46-8-55326000(H)传真+46-8-55328820(I)电报19237 astras(ii)发明题目新的DNA分子(iii)序列数目10(vi)计算机可读方式(A)媒介物形式软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MC-DOS(D)软件PatentIn Release#1.0,Varsion#1.30(EPO)(2)SEQ ID NO1信息(i)序列特征(A)长度1724碱基对(B)类型核苷酸(C)链型双链(D)拓扑学线性(vi)最初来源(A)生物体结核分支杆菌(B)株Erdman菌株(vii)直接来源(B)克隆pARC 8175(ix)特征(A)名称/键CDS(B)位置70..1653(xi)序列描述SEQ ID NO1AACTAGCAGA CACTTTCGGT TACGCACGCC CAGACCCAAC CGGAAGTGAG TAACGACCGA 60AGGGTGTAT GTG GCA GCG ACC AAA GCA AGC ACG GCG ACC GAT GAG CCG 108Val Ala Ala Thr Lys Ala Ser Thr Ala Thr Asp Glu Pro1 5 10GTA AAA CGC ACC GCC ACC AAG TCG CCC GCG GCT TCC GCG TCC GGG GCC156Val Lys Arg Thr Ala Thr Lys Ser Pro Ala Ala Ser Ala Ser Gly Ala15 20 25AAG ACC GGC GCC AAG CGA ACA GCG GCG AAG TCC GCT AGT GGC TCC CCA204Lys Thr Gly Ala Lys Arg Thr Ala Ala Lys Ser Ala Ser Gly Ser Pro30 35 40 45CCC GCG AAG CGG GCT ACC AAG CCC GCG GCC CGG TCC GTC AAG CCC GCC252Pro Ala Lys Arg Ala Thr Lys Pro Ala Ala Arg Ser Val Lys Pro Ala50 55 60TCG GCA CCC CAG GAC ACT ACG ACC AGC ACC ATC CCG AAA AGG AAG ACC300Ser Ala Pro Gln Asp Thr Thr Thr Ser Thr Ile Pro Lys Arg Lys Thr65 70 75CGC GCC GCG GCC AAA TCC GCC GCC GCG AAG GCA CCG TCG GCC CGC GGC348Arg Ala Ala Ala Lys Ser Ala Ala Ala Lys Ala Pro Ser Ala Arg Gly80 85 90CAC GCG ACC AAG CCA CGG GCG CCC AAG GAT GCC CAG CAC GAA GCC GCA396His Ala Thr Lys Pro Arg Ala Pro Lys Asp Ala Gln His Glu Ala Ala95 100 105ACG GAT CCC GAG GAC GCC CTG GAC TCC GTC GAG GAG CTC GAC GCT GAA444Thr Asp Pro Glu Asp Ala Leu Asp Ser Val Glu Glu Leu Asp Ala Glu110 115 120 125CCA GAC CTC GAC GTC GAG CCC GGC GAG GAC CTC GAC CTT GAC GCC GCC492Pro Asp Leu Asp Val Glu Pro Gly Glu Asp Leu Asp Leu Asp Ala Ala130 135 140GAC CTC AAC CTC GAT GAC CTC GAG GAC GAC GTG GCG CCG GAC GCC GAC540Asp Leu Asn Leu Asp Asp Leu Glu Asp Asp Val Ala Pro Asp Ala Asp145 150 155GAC GAC CTC GAC TCG GGC GAC GAC GAA GAC CAC GAA GAC CTC GAA GCT588Asp Asp Leu Asp Ser Gly Asp Asp Glu Asp His Glu Asp Leu Glu Ala160 165 170GAG GCG GCC GTC GCG CCC GGC CAG ACC GCC GAT GAC GAC GAG GAG ATC636Glu Ala Ala Val Ala Pro Gly Gln Thr Ala Asp Asp Asp Glu Glu Ile175 180 185GCT GAA CCC ACC GAA AAG GAC AAG GCC TCC GGT GAT TTC GTC TGG GAT684Ala Glu Pro Thr Glu Lys Asp Lys Ala Ser Gly Asp Phe Val Trp Asp190 195 200 205GAA GAC GAG TCG GAG GCC CTG CGT CAA GCA CGC AAG GAC GCC GAA CTC732Glu Asp Glu Ser Glu Ala Leu Arg Gln Ala Arg Lys Asp Ala Glu Leu210 215 220ACC GCA TCC GCC GAC TCG GTT CGC GCC TAC CTC AAA CAG ATC GGC AAG780Thr Ala Ser Ala Asp Ser Val Arg Ala Tyr Leu Lys Gln Ile Gly Lys225 230 235GTA GCG CTG CTC AAC GCC GAG GAA GAG GTC GAG CTA GCC AAG CGG ATC 828Val Ala Leu Leu Asn Ala Glu Glu Glu Val Glu Leu Ala Lys Arg Ile240 245 250GAG GCT GGC CTG TAC GCC ACG CAG CTG ATG ACC GAG CTT AGC GAG CGC 876Glu Ala Gly Leu Tyr Ala Thr Gln Leu Met Thr Glu Leu Ser Glu Arg255 260 265GGC GAA AAG CTG CCT GCC GCC CAG CGC CGC GAC ATG ATG TGG ATC TGC 924Gly Glu Lys Leu Pro Ala Ala Gln Arg Arg Asp Met Met Trp Ile Cys270 275 280 285CGC GAC GGC GAT CGC GCG AAA AAC CAT CTG CTG GAA GCC AAC CTG CGC 972Arg Asp Gly Asp Arg Ala Lys Asn His Leu Leu Glu Ala Asn Leu Arg290 295 300CTG GTG GTT TCG CTA GCC AAG CGC TAC ACC GGC CGG GGC ATG GCG TTT 1020Leu Val Val Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Ala Phe305 310 315CTC GAC CTG ATC CAG GAA GGC AAC CTG GGG CTG ATC CGC GCG GTG GAG 1068Leu Asp Leu Ile Gln Glu Gly Asn Leu Gly Leu Ile Arg Ala Val Glu320 325 330AAG TTC GAC TAC ACC AAG GGG TAC AAG TTC TCC ACC TAC GCT ACG TGG 1116Lys Phe Asp Tyr Thr Lys Gly Tyr Lys Phe Ser Thr Tyr Ala Thr Trp335 340 345TGG ATT CGC CAG GCC ATC ACC CGC GCC ATG GCC GAC CAG GCC CGC ACC 1164Trp Ile Arg Gln Ala Ile Thr Arg Ala Met Ala Asp Gln Ala Arg Thr350 355 360 365ATC CGC ATC CCG GTG CAC ATG GTC GAG GTG ATC AAC AAG CTG GGC CGC 1212Ile Arg Ile Pro Val His Met Val Glu Val Ile Asn Lys Leu Gly Arg370 375 380ATT CAA CGC GAG CTG CTG CAG GAC CTG GGC CGC GAG CCC ACG CCC GAG 1260Ile Gln Arg Glu Leu Leu Gln Asp Leu Gly Arg Glu Pro Thr Pro Glu385 390 395GAG CTG GCC AAA GAG ATG GAC ATC ACC CCG GAG AAG GTG CTG GAA ATC 1308Glu Leu Ala Lys Glu Met Asp Ile Thr Pro Glu Lys Val Leu Glu Ile400 405 410CAG CAA TAC CCC CGC GAG CCG ATC TCG TTG GAC CAG ACC ATC GGC GAC 1356Gln Gln Tyr Ala Arg Glu Pro Ile Ser Leu Asp Gln Thr Ile Gly Asp415 420 425GAG GGC GAC AGC CAG CTT GGC GAT TTC ATC GAA GAC ACC GAG GCG GTG 1404Glu Gly Asp Ser Gln Leu Gly Asp Phe Ile Glu Asp Ser Glu Ala Val430 435 440 445GTG GCC GTC GAC GCG GTG TCC TTC ACT TTG CTG CAG GAT CAA CTG CAG 1452Val Ala Val Asp Ala Val Sar Phe Thr Leu Leu Gln Asp Gln Leu Gln450 455 460TCG GTG CTG GAC ACG CTC TCC GAG CGT GAG GCG GGC GTG GTG CGG CTA 1500Ser Val Leu Asp Thr Leu Ser Glu Arg Glu Ala Gly Val Val Arg Leu465 470 475CGC TTC GGC CTT ACC GAC GGC CAG CCG CGC ACC CTT GAC GAG ATC GGC 1548Arg Phe Gly Leu Thr Asp Gly Gln Pro Arg Thr Leu Asp Glu Ile Gly480 485 490CAG GTC TAC GGC GTG ACC CGG GAA CGC ATC CGC CAG ATC GAA TCC AAG 1596Gln Val Tyr Gly Val Thr Arg Glu Arg Ile Arg Gln Ile Glu Ser Lys495 500 505ACT ATG TCG AAG TTG CGC CAT CCG AGC CGC TCA CAG GTC CTG CGC GAC 1644Thr Met Ser Lys Leu Arg His Pro Ser Arg Ser Gln Val Leu Arg Asp510 515 520 525TAC CTG GAC TGAGAGCGCC CGCCGAGGCG ACCAACGTAG CACGTGAGCC 1693Tyr Leu AspCCCAGCAGCT AGCCGCACCA TGGTCTCGTC C 1724(2)SEQ ID NO2信息(i)序列特征(A)长度528个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Val Ala Ala Thr Lys Ala Ser Thr Ala Thr Asp Glu Pro Val Lys Arg1 5 10 15Thr Ala Thr Lys Ser Pro Ala Ala Ser Ala Ser Gly Ala Lys Thr Gly20 25 30Ala Lys Arg Thr Ala Ala Lys Ser Ala Ser Gly Ser Pro Pro Ala Lys35 40 45Arg Ala Thr Lys Pro Ala Ala Arg Ser Val Lys Pro Ala Ser Ala Pro50 55 60Gln Asp Thr Thr Thr Ser Thr Ile Pro Lys Arg Lys Thr Arg Ala Ala65 70 75 80Ala Lys Ser Ala Ala Ala Lys Ala Pro Ser Ala Arg Gly His Ala Thr85 90 95Lys Pro Arg Ala Pro Lys Asp Ala Gln His Glu Ala Ala Thr Asp Pro100 105 110Glu Asp Ala Leu Asp Ser Val Glu Glu Leu Asp Ala Glu Pro Asp Leu115 120 125Asp Val Glu Pro Gly Glu Asp Leu Asp Leu Asp Ala Ala Asp Leu Asn130 135 140Leu Asp Asp Leu Glu Asp Asp Val Ala Pro Asp Ala Asp Asp Asp Leu145 150 155 160Asp Ser Gly Asp Asp Glu Asp His Glu Asp Leu Glu Ala Glu Ala Ala165 170 175Val Ala Pro Gly Gln Thr Ala Asp Asp Asp Glu Glu Ile Ala Glu Pro180 185 190Thr Glu Lys Asp Lys Ala Ser Gly Asp Phe Val Trp Asp Glu Asp Glu195 200 205Ser Glu Ala Leu Arg Gln Ala Arg Lys Asp Ala Glu Leu Thr Ala Ser210 215 220Ala Asp Ser Val Arg Ala Tyr Leu Lys Gln Ile Gly Lys Val Ala Leu225 230 235 240Leu Asn Ala Glu Glu Glu Val Glu Leu Ala Lys Arg Ile Glu Ala Gly245 250 255Leu Tyr Ala Thr Gln Leu Met Thr Glu Leu Ser Glu Arg Gly Glu Lys260 265 270Leu Pro Ala Ala Gln Arg Arg Asp Met Met Trp Ile Cys Arg Asp Gly275 280 285Asp Arg Ala Lys Asn His Leu Leu Glu Ala Asn Leu Arg Leu Val Val290 295 300Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Ala Phe Leu Asp Leu305 310 315 320Ile Gln Glu Gly Asn Leu Gly Leu Ils Arg Ala Val Glu Lys Phe Asp325 330 335Tyr Thr Lys Gly Tyr Lys Phe Ser Thr Tyr Ala Thr Trp Trp Ile Arg340 345 350Gln Ala Ile Thr Arg Ala Met Ala Asp Gln Ala Arg Thr Ile Arg Ile355 360 365Pro Val His Met Val Glu Val Ile Asn Lys Leu Gly Arg Ile Gln Arg370 375 380Glu Leu Leu Gln Asp Leu Gly Arg Glu Pro Thr Pro Glu Glu Leu Ala385 390 395 400Lys Glu Met Asp Ile Thr Pro Glu Lys Val Leu Glu Ile Gln Gln Tyr405 410 415Ala Arg Glu Pro Ile Ser Leu Asp Gln Thr Ile Gly Asp Glu Gly Asp420 425 430Ser Gln Leu Gly Asp Phe Ile Glu Asp Ser Glu Ala Val Val Ala Val435 440 445Asp Ala Val Ser Phe Thr Leu Leu Gln Asp Gln Leu Gln Ser Val Leu450 455 460Asp Thr Leu Ser Glu Arg Glu Ala Gly Val Val Arg Leu Arg Phe Gly465 470 475 480Leu Thr Asp Gly Gln Pro Arg Thr Leu Asp Glu Ile Gly Gln Val Tyr465 490 495Gly Val Thr Arg Glu Arg Ile Arg Gln Ile Glu Ser Lys Thr Met Ser500 505 510Lys Leu Arg His Pro Ser Arg Ser Gln Val Leu Arg Asp Tyr Leu Asp515 520 525(2)SEQ ID NO3信息(i)序列特征(A)长度1508碱基对(B)类型核苷酸(C)链型双链(D)拓扑学线性(vi)最初来源(A)生物体结核分支杆菌(C)株单个分离菌atcc 27294(vii)直接来源(B)克隆pARC 8176(ix)特征(A)名称/键CDS(B)位置325..1293(xi)序列描述SEQ ID NO3ACCAGCCCGA CGACCGACGA ACCCCGCCGC TTCGACGTGC CCAGCCGGCG CATCCCGCTG60TTCCCGACCG CGAACGGCCC GCACTCGAGC CGACGGCGAC AGCCGGCAAG AAGCGGTCAG120CCCGCGGGGA TTCGCCGACC ACGGTTAGCC GTCTGTTGGC CGGCGTTCCG GGTTGTCGCC180ACTGGCCACA CTTCTCAGGA CTTTCTCAGG TCTTCGGCAG ATTCCTGCAC GTCACAGGGC240GTCAGATCAC TGCTGGGTGG GAACTCAAAG TCCGGCTTTG TCGTTAAACC CTGACAGTGC300AAGCCGATCG GGGAACGGCT CGCT ATG GCC GAT GCA CCC ACA AGG GCC ACC 351Met Ala Asp Ala Pro Thr Arg Ala Thr530 535ACA AGC CGG GTT GAC ACA GAT CTG GAT GCT CAA AGC CCC GCG GCG GAC 399Thr Ser Arg Val Asp Thr Asp Leu Asp Ala Gln Ser Pro Ala Ala Asp540 545 550CTC GTG CGC GTC TAT CTG AAC GGC ATC GGC AAG ACG GCG TTG CTC AAC 447Leu Val Arg Val Tyr Leu Asn Gly Ile Gly Lys Thr Ala Leu Leu Asn555 560 565GCG GCG GAT GAA GTC GAA CTG GCC AAG CGC ATA GAA GCC GGG TTG TAT 495Ala Ala Asp Glu Val Glu Leu Ala Lys Arg Ile Glu Ala Gly Leu Tyr570 575 580 585GCC GAG CAT CTG CTG GAA ACC CGG AAG CGC CTC GGC GAG AAC CGA AAA 543Ala Glu His Leu Leu Glu Thr Arg Lys Arg Leu Gly Glu Asn Arg Lys590 595 600CGC GAC CTG GCG GCC GTG GTG CGT GAT GGC GAG GCC GCC CGC CGC CAC 591Arg Asp Leu Ala Ala Val Val Arg Asp Gly Glu Ala Ala Arg Arg His605 610 615CTG CTG GAA GCA AAC CTG CGG CTG GTG GTA TCG CTG GCC AAG CGC TAC 639Leu Leu Glu Ala Asn Leu Arg Leu Val Val Ser Leu Ala Lys Arg Tyr620 625 630ACG GGT CGG GGC ATG CCG TTG CTG GAC CTC ATC CAG GAG GGC AAC CTG 687Thr Gly Arg Gly Met Pro Leu Leu Asp Leu Ile Gln Glu Gly Asn Leu635 640 645GGT CTG ATT CGA GCG ATG GAG AAG TTC GAC TAC ACA AAG GGA TTC AAG 735Gly Leu Ile Arg Ala Met Glu Lys Phe Asp Tyr Thr Lys Gly Phe Lys650 655 660 665TTC TTA ACG TAT GCC ACG TGG TGG ATT CGC CAG GCC ATC ACC CGC GGA 783Phe Ser Thr Tyr Ala Thr Trp Trp Ile Arg Gln Ala Ile Thr Arg Gly670 675 680ATG GCC GAC CAG AGC CGC ACC ATC CGC CTG CCC GTA CAC CTG GTT GAG 831Met Ala Asp Gln Ser Arg Thr Ile Arg Leu Pro Val His Leu Val Glu685 690 695CAG GTC AAC AAG CTG GCG CGG ATC AAG CGG GAG ATG CAC CAG CAT CTG 879Gln Val Asn Lys Leu Ala Arg Ile Lys Arg Glu Met His Gln His Leu700 705 710GGT CGC GAA CGC ACC GAT GAG GAG CTC GCC GCC GAA TCC GGC ATT CCA 927Gly Arg Glu Arg Thr Asp Glu Glu Leu Ala Ala Glu Ser Gly Ile Pro715 720 725ATC GAC AAG ATC AAC GAC CTG CTG GAA CAC AGT CGC GAC CCG GTG AGT 975Ile Asp Lys Ile Asn Asp Leu Leu Glu His Ser Arg Asp Pro Val Ser730 735 740 745CTG GAT ATG CCG GTC GGC TTC GAG GAG GAG GCC CCT TTG GGC GAT TTC 1023Leu Asp Met Pro Val Gly Ser Glu Glu Glu Ala Pro Leu Gly Asp Phe750 755 760ATC GAG GAC GCC GAA GCC ATG TTC GCG GAG AAC GCG GTC ATC GCC GAA 1071Ile Glu Asp Ala Glu Ala Met Ser Ala Glu Asn Ala Val Ile Ala Glu765 770 775CTG TTA CAC ACC GAC ATC CGC AGC GTG CTG GCC ACT CTC GAC GAG CGT 1119Leu Leu His Thr Asp Ile Arg Ser Val Leu Ala Thr Leu Asp Glu Arg780 785 790GAC GAC CAG GTG ATC CGG CTG CGC TTC GGC CTG GAT GAC GGC CAA CCA 1167Asp Asp Gln Val Ile Arg Leu Arg Phe Gly Leu Asp Asp Gly Gln Pro795 800 805CGC ACC CTG GAT CAA ATC GGC AAA CTA TTC GGG CTG TCC CGT GAG CGG 1215Arg Thr Leu Asp Gln Ile Gly Lys Leu Phe Gly Leu Ser Arg Glu Arg810 815 820 825GTT CGT CAG ATT GAG CGC GAC GTG ATG AGT AAG CTG CGG CAC GGT GAG 1263Val Arg Gln Ile Glu Arg Asp Val Met Ser Lys Leu Arg His Gly Glu830 835 840CGG GCG GAT CGG CTG CGG TCG TAC GCC AGC TGAAGCTGGA CATCCTGAGC 1313Arg Ala Asp Arg Leu Arg Ser Tyr Ala Ser845 850CAGGTAGCAG ACGGTATGCC CGCCGCGCCA GCATAGCCTG CGGTGGGGCG GCGGGCAACC 1373ATTTTCGCAG CTGGCCAAGT GTAGACTCAG CTGCAATGGA GGGTGCTGAA TGAACGAGTT 1433GGTTGATACC ACCGAGATGT ACCTGCGGAC CATCTACGAC CTCGAGGAAG AGGGCGTGAC 1493GCACTGCGTG CCGGA 1508(2)SEQ ID NO4信息(i)序列特征(A)长度323个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Ala Asp Ala Pro Thr Arg Ala Thr Thr Ser Arg Val Asp Thr Asp1 5 10 15Leu Asp Ala Gln Ser Pro Ala Ala Asp Leu Val Arg Val Tyr Leu Asn20 25 30Gly Ile Gly Lys Thr Ala Leu Leu Asn Ala Ala Asp Glu Val Glu Leu35 40 45Ala Lys Arg Ile Glu Ala Gly Leu Tyr Ala Glu His Leu Leu Glu Thr50 55 60Arg Lys Arg Leu Gly Glu Asn Arg Lys Arg Asp Leu Ala Ala Val Val65 70 75 80Arg Asp Gly Glu Ala Ala Arg Arg His Leu Leu Glu Ala Asn Leu Arg85 90 95Leu Val Val Ser Leu Ala Lys Arg Tyr Thr Gly Arg Gly Met Pro Leu100 105 110Leu Asp Leu Ile Gln Glu Gly Asn Leu Gly Leu Iie Arg Ala Met Glu115 120 125Lys Phe Asp Tyr Thr Lys Gly Phe Lys Phe Ser Thr Tyr Ala Thr Trp130 135 140Trp Ile Arg Gln Ala Ile Thr Arg Gly Met Ala Asp Gln Ser Arg Thr145 150 155 160Ile Arg Leu Pro Val His Leu Val Glu Gln Val Asn Lys Leu Ala Arg165 170 175Ile Lys Arg Glu Met His Gln His Leu Gly Arg Glu Arg Thr Asp Glu180 185 190Glu Leu Ala Ala Glu Ser Gly Ile Pro Ile Asp Lys Ile Asn Asp Leu195 200 205Leu Glu His Ser Arg Asp Pro Val Ser Leu Asp Met Pro Val Gly Ser210 215 220Glu Glu Glu Ala Pro Leu Gly Asp Phe Ile Glu Asp Ala Glu Ala Met225 230 235 240Ser Ala Glu Asn Ala Val Ile Ala Glu Leu Leu His Thr Asp Ile Arg245 250 255Ser Val Leu Ala Thr Leu Asp Glu Arg Asp Asp Gln Val Ile Arg Leu260 265 270Arg Phe Gly Leu Asp Asp Gly Gln Pro Arg Thr Leu Asp Gln Ile Gly275 280 285Lys Leu Phe Gly Leu Ser Arg Glu Arg Val Arg Gln lle Glu Arg Asp290 295 300Val Met Ser Lys Leu Arg His Gly Glu Arg Ala Asp Arg Leu Arg Ser305 310 315 320Tyr Ala Ser(2)SEQ ID NO5信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc即“PCR引物”(xi)序列描述SEQ ID NO5AAGTTCAGCA CSTACGCSAC STGGTGGATC30(2)SEQ ID NO6信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc即“PCR引物”(xi)序列描述SEQ ID NO6CTTSGCCTCG ATCTGSCGGA TSCGCTC 27(2)SEQ ID NO7信息(i)序列特征
(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc即“PCR引物”(xi)序列描述SEQ ID NO7TTCCATGGGG TATGTGGCAG CGACC 25(2)SEQ ID NO8信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc即“PCR引物”(xi)序列描述SEQ ID NO8GTACAGGCCA GCCTCGATCC GCTTGGC 27(2)SEQ ID NO9信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc 即“PCR引物”(xi)序列描述SEQ ID NO9TTTCATGGCC GATGCACCCA CAAGGGCC28(2)SEQ ID NO10信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc即“PCR引物”(xi)序列描述SEQ ID NO10CTTGAATTCA GCTGGCGTAC GACCGCA2权利要求
1.一种分离的多肽,其为结核分支杆菌RNA聚合酶组Iδ亚单位,或为其功能相当的修饰形式。
2.根据权利要求1的多肽,其氨基酸序列与序列表中SEQ IDNO2或4中相同或基本上类似。
3.一种分离的核酸分子,其含有编码根据权利要求1或2的多肽的核酸序列。
4.一种分离的核酸,选自(a)包含在SEQ ID NO1或SEQ ID NO3中所示编码结核分支杆菌RNA聚合酶组Iδ亚单位的核苷酸序列的DNA分子;(b)核酸分子,其包含一个能与(a)中所定义的DNA分子的多肽编码区互补的核苷酸序列杂交并编码结核分枝杆菌组Iδ亚单位的多肽或其功能相当的修饰体的核苷酸序列;和(c)核酸分子,其包含一个由于遗传编码简并而形成的在(a)或(b)中定义的核苷酸序列并编码结核分支杆菌组Iδ亚单位的多肽或其功能相当的修饰形式的核酸序列。
5.包含根据权利要求3或4的核酸分子的载体。
6.根据权利要求5的载体,其为质粒载体pARC 8175(NCIMB 40738)或pARC 8176(NCIMB 40739)。
7.根据权利要求5的载体其是一种可介导根据权利要求1或2中的多肽表达的表达载体。
8.携带有根据权利要求5至7中任何一个权利要求载体的宿主细胞。
9.用于制备根据权利要求1或2多肽的方法,包括在所述多肽产生的条件下培养以权利要求7表达载体转化的权利要求8的宿主细胞和回收该多肽。
10.具有抑制δ亚单位与结核分支杆菌核心RNA聚合酶结合能力的化合物的分析方法,所述方法包括(i)将待测所述抑制能力的化合物与权利要求1或2的多肽及结构分枝杆菌核心RNA聚合酶接触;和(ii)检测是否多肽与核心RNA聚合酶结合形成RNA聚合酶全酶。
11.根据权利要求10的方法,其中结合核心RNA聚合酶的多肽和/或不结合RNA聚合酶的多肽是用层析法如凝胶过滤加以检测。
12.根据权利要求10的方法,其中RNA聚合酶全酶的检测是用结合RNA聚合酶全酶抗体的免疫沉淀法。
13.一种分析化合物的方法,该化合物具有抑制δ亚单位依赖性的结核分支杆菌RNA聚合酶转录的能力,该方法包括(i)将待测所述抑制能力的化合物与权利要求1或2的多肽、结核分支杆菌核心RNA聚合酶和一段DNA分子接触,该DNA分子具有当结合到所述多肽时能由该核心RNA聚合酶所识别的与启动子序列可操纵地连接的编码序列,所述的接触是在当结核分枝杆菌RNA聚合酶结合到启动子上时,适于该编码序列转录的条件下完成的;和(ii)检测上述编码序列对应的mRNA的形成。
14.确定结核分支杆菌RNA聚合酶δ亚单位蛋白结构的方法,其特征在于根据权利要求1或2的多肽用于X-射线晶体学分析。
全文摘要
本发明提供了编码结构分支杆菌RNA聚合酶δ亚单位的新的核酸分子。它也涉及由该核酸分子编码的、称为SigA和SigB的多肽、以及载体和用上述核酸分子转化的宿主细胞。本发明进一步提供了抑制δ亚单位与核心RNA聚合酶相互作用的化合物的筛选分析方法。
文档编号A61K38/00GK1201465SQ9619426
公开日1998年12月9日 申请日期1996年3月12日 优先权日1995年5月30日
发明者M·巴加内, U·沙尔马 申请人:阿斯特拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1