包含内切核酸酶活性的多肽片段及其用途的制作方法

文档序号：581642阅读：680来源：国知局

专利名称：包含内切核酸酶活性的多肽片段及其用途的制作方法
技术领域：
本发明涉及包含具有内切核酸酶活性的病毒RNA依赖性RNA聚合酶的PA 亚基的氨基端片段或其变体的多肽片段，其中所述PA亚基来源于属于正黏病毒科 (Orthomyxoviridae)的病毒。本发明还涉及(i)适于应用X射线晶体分析法对所述多肽片段进行结构测定的多肽片段的晶体，和(ii)采用所述多肽的结构坐标筛选和设计调节、优选抑制多肽片段内的内切核酸活性部位(endonucleolytically active site)的化合物的计算方法。此外，本发明涉及优选在高通量背景下鉴定与具有内切核酸酶活性的PA多肽片段结合并且优选抑制所述内切核酸活性的化合物的方法。本发明还涉及用于治疗由正黏病毒科病毒引起的病毒感染所致疾病的化合物和包含所鉴定的的化合物的药物组合物。
背景技术：
流行性感冒是造成全球发病率和死亡率极高的原因，被许多人认为属于人类最严重的病毒威胁。每年盛行的流行性感冒横扫全球，而且不时出现新的毒株造成巨大破坏力的广泛流行。目前控制流感病毒流行的主要方法是接种疫苗。然而，突变型流感病毒快速产生，逃避接种疫苗的作用。根据产生一种新的流感疫苗需要大约6个月的事实，尤其需要替代性治疗方法(即抗病毒疗法)作为针对快速蔓延的大流行病的第一道防线。开发抗病毒疗法的极佳起点是必需的病毒蛋白的结构数据。因此，流感病毒表面抗原神经氨酸酶的晶体结构测定(von Itzstein等，1993，Nature 363:418-423)直接导致了对具有防止病毒从细胞中释放的抗病毒活性的神经氨酸酶抑制剂的开发，然而这并不能防止病毒产生。这些抑制剂及其衍生物随后被开发成抗流感药物扎那米韦(Glaxo)和奥塞米韦(Roche)，这些目前被许多国家大量贮备作为抵御可能发生的大流行的第一道防线。然而，这些药物只供缩短临床疾病的持续时间。或者，其它抗流感化合物(例如金刚烷胺和金刚乙胺)靶向病毒膜中的离子通道蛋白(即M2蛋白)，干扰细胞内病毒脱壳。然而，由于其副作用和抗性病毒突变株的快速发生而还未被广泛采用(Magden等，2005，Appl. Microbiol. Biotechnol. 66 :612-621)。此外，研究表明更多的非特异性病毒药物(例如利巴韦林)有效用作治疗流感感染(Eriksson 等，1977，Antimicrob. Agents Chemother. 11 946-951)。然而，可能由于其严重的副作用，因此利巴韦林只在少数国家获准使用(Furuta 等，2005, Antimicrob. Agents Chemother. 49 :981-986)。显然，需要新的优选针对不同靶标的抗病毒化合物。甲型、乙型和丙型流感病毒和传染性鲑鱼贫血病毒(Isavirus)以及托高土病毒 (Thogotovirus)属于正黏病毒科，其连同布尼亚病毒科(Bunyaviridae)，包括汉坦病毒属 (Hantavirus)、纳依罗病毒(Nairovirus)、正布尼亚病毒属(Orthobunyavirus)、白龄病毒 (Phlebovirus)和番茄斑萎病毒属(Tospovirus)，是负链RNA病毒。它们的基因组是分段的，并进入包括RNA依赖性RNA聚合酶的核糖核蛋白颗粒，RNA依赖性RNA聚合酶进行⑴ 将单链病毒粒RNA(vRNA)最初拷贝成病毒mRNA，和(ii) vRNA复制。对于病毒mRNA的产生，聚合酶利用所谓的“夺帽(cap-snatching)” 机制(Plotch 等，1981，Cell 23:847-858; Kukkonen 等，2005，Arch. Virol. 150 :533-556 ；Leahy 等，1997，J. Virol. 71 :8347-8351 ；Noah 和 Krug，2005，Adv. Virus Res. 65 :121-145)。聚合酶由 3 个亚基组成PB1 (聚合酶碱性蛋白)、PB2和PA。对于夺帽机制，病毒聚合酶通过其PB2亚基与细胞mRNA分子的5’RNA 帽结合，通过聚合酶的内切核酸活性在核苷酸10-13处切割细胞mRNA分子。加帽的RNA片段通过PBl亚基中的核苷酸转移酶中心用作病毒mRNA合成的引物(Li等，2001，EMBO J. 20 2078-2086)。最后，通过聚合酶在模板5’端的寡U基序上时断时续的移动，使病毒mRNA 3’端聚腺苷酸化。最新研究精确地定义了负责帽结合的PB2结构域(Fechter等，2003， J. Biol. Chem. 278 :20381-20388 ；GuiIligay 等，2008Nat. Struct. Mol. Biol. 15 :500-506)。聚合酶的内切核酸活性迄今一直被认为存在于PBl亚基上(Li等，同上)。聚合酶复合体似乎是合适的抗病毒药的靶标，因为它是病毒mRNA合成和病毒复制必不可少的，并含有若干功能活性部位，其与宿主细胞蛋白质中存在的功能活性部位可能显著不同(Magden等，同上)。因此，例如试图通过类似于PBl内的PA结合结构域的25氨基酸肽干扰聚合酶亚基的装配((ihanem等，2007，J.Virol. 81 :7801-7804)。此外，试图通过诸如2，-脱氧-2，-氟鸟嘌呤等核苷类似物干扰病毒转录(Tisdale等，1995, Antimicrob. Agents Chemother. 39 :24544458)，并且已经证实T-705，一种取代的吡嗪化合物，可起流感病毒RNA聚合酶特异性抑制剂的作用(Furuta等，同上)。此外，已经靶定聚合酶的内切核酸酶活性，并且已鉴定出一系列4-取代2，4-二氧代丁酸化合物作为流感病毒中这种活性的选择性抑制剂(Tomassini 等，1994，Antimicrob. Agents Chemother. 38 :2827-2837)。此外，研究表明，flutimide，一种在真菌菌种Delitschia confertaspora提取物中鉴定出的取代的2，6-二酮哌嗪，抑制流感病毒的内切核酸酶(Tomassini等，1996，Antimicrob. Agents Chemother. 40 :1189-1193)。然而，迄今只在聚合酶的完整三聚复合体的情况下研究了化合物对病毒聚合酶的内切核酸活性的抑制作用。虽然聚合酶的PA亚基参与帽结合和内切核酸酶活性两者、vRNA复制和有争议的蛋白酶活性，但对它功能上的表征最不充分。通过在残基213的胰蛋白酶消化可分离PA(甲型流感病毒的716个残基)。最近确定的与PBlN端肽结合的PA C端三分之二的晶体结构为大部分PA亚基(然而仍不清楚其功能)和一种关键性亚基内相互作用的确切性质两者提供了第一手的结构见解(He 等，2008，Nature 454 :1123-1126 ；Obayashi 等，2008，Nature 454:1127-1131)。PA氨基端结构域中保守残基的系统突变已鉴定出对蛋白质稳定性、启动子结合、帽结合和聚合酶复合体的内切核酸酶活性十分重要的残基(Hara等，2006， J. Virol. 80 :7789-7798)。已经广泛研究了完整病毒核糖核蛋白颗粒(RNP)情况下内切核酸酶的酶学性质。然而，迄今仍无法在具有内切核酸活性的多肽片段的情况下，研究PA亚基的内切核酸酶活性，因为不知道哪个结构域负责所述活性。本发明的发明人预料不到地发现，与本领域的一般看法相反，内切核酸活性只存在于PA亚基的氨基端区域。本发明的发明人已经通过X射线晶体分析法实现了对所述结构域的结构表征，并且鉴定出氨基端PA多肽片段内的内切核酸活性中心。因此，本发明提供在多肽片段的情况下研究病毒聚合酶的内切核酸活性的独特机会，这可大大简化靶向病毒聚合酶的内切核酸酶活性的新的抗病毒化合物的开发过程以及优化之前鉴定的化合物。本发明人的重组产生具有病毒聚合酶的内切核酸活性的PA多肽片段的预料不到的成果，可供使用易从简单表达系统获得的材料，对病毒聚合酶功能部位的抑制剂进行体外高通量筛选。此外，内切核酸的PA多肽片段以及其中酶活性中心的结构数据可供指导设计抑制剂，并经由计算机模拟筛选潜在的治疗化合物。本发明的一个目的是(i)通过X射线晶体分析法，提供病毒聚合酶PA亚基的内切核酸的氨基端结构域的高分辨率结构数据，(ii)提供优选在高通量背景下，优选通过阻断PA亚基内的内切核酸活性部位鉴定可调节、优选可抑制病毒聚合酶的内切核酸酶活性的化合物的计算以及体外方法，和(iii)提供包含这类化合物的药物组合物，所述化合物用于利用病毒mRNA合成的夺帽机制来治疗病毒引起的感染性疾病。发明概述第一个方面，本发明涉及包含具有内切核酸酶活性的病毒RNA依赖性RNA聚合酶的PA亚基的氨基端片段的多肽片段，其中所述PA亚基来源属于正黏病毒科的病毒。又一方面，本发明涉及编码本发明的分离多肽片段的分离多核苷酸。又一方面，本发明涉及包含本发明的分离多核苷酸的重组载体。又一方面，本发明涉及包含本发明的分离多核苷酸或本发明的重组载体的重组宿主细胞。又一方面，本发明涉及用于鉴定调节来源于正黏病毒科的病毒RNA依赖性RNA聚合酶的PA亚基的内切核酸酶活性的化合物的方法，所述方法包括以下步骤(a)构建活性部位的计算机模型，所述活性部位由

图18所示的本发明多肽片段的结构坐标定义；(b)通过选自以下的方法选择潜在的调节化合物(i)将分子片段装配成所述化合物，(ii)从小分子数据库选择化合物，和(iii)对所述化合物进行从头配体设计；(c)运用计算方法，进行所述化合物与所述活性部位的计算机模型之间的拟合程序运算，从而提供所述化合物在活性部位中的能量最低化构型；和(d)评价所述拟合运算的结果以量化所述化合物与活性部位模型之间的缔合，以此评价所述化合物与所述活性部位缔合的能力。又一方面，本发明涉及通过本发明的方法可鉴定的化合物，其中所述化合物能够调节、优选抑制PA亚基或其变体的内切核酸酶活性。又一方面，本发明涉及用于鉴定调节PA亚基或其多肽变体的内切核酸酶活性的化合物的方法，所述方法包括以下步骤(i)使本发明的多肽片段或本发明的重组宿主细胞与试验化合物接触，和(ii)分析所述试验化合物调节所述PA亚基多肽片段的内切核酸酶活性的能力。又一方面，本发明涉及按照本发明的体外方法可产生的药物组合物。又一方面，本发明涉及通过本发明的体外方法可鉴定的化合物，其中所述化合物能够调节、优选抑制PA亚基或其变体的内切核酸酶活性。又一方面，本发明涉及针对PA亚基或其变体的活性部位的抗体。又一方面，本发明涉及本发明的化合物、本发明的药物组合物或本发明的抗体在制备治疗、减轻或预防由正黏病毒科病毒所致病毒感染引起的疾病的药物中的用途。附图简述
图1 采用Thermofluor测定的PA-Nter结构的热稳定性。用不同的金属离子进行热迁移试验(thermal shift assay) 0为了清楚起见，只显示缺乏金属离子(黑色实线) 或在ImM MnCl2存在时(短划线)获得的结果。箭头表示表观解链温度Tm。图2 不同的金属离子对PA-Nter的热稳定性的作用。在pH 8. O下，从不同金属离子的热迁移试验得到的不同解链温度(Tm)的概况。研究了在pH 7. O下CoCl2对蛋白质稳定性的作用，但由于被金属猝灭而无法解析。图3 用远紫外⑶谱观察到的锰对PA-Nter结构的作用。在ImM MnCl2不存在(实线)或存在(短划线)时监测PA-Nter的二级结构含量。图4 用2,4- 二氧代-4-苯基丁酸(DPBA)的热稳定性试验。用不同浓度的DPBA 的热迁移试验。DPBA在MnCl2存在时进一步稳定PA-Nter。图5 不同时间的PA-Nter的内切核酸酶活性。将10 μ M纯的锅柄状 RNA (pan-handle RNA，ph_RNA)与 13μΜ PA-Nter 加 ImM MnCl2 —起温育。在 5、10、20、40 和 80分钟后(分别为泳道4-8)，加入20mM EGTA终止在37°C下的温育。作为对照，将ph-RNA 与仅 PA-Nter (泳道 1)、仅 MnCl2 (泳道 2)或 PA-Nter 和 MnCl2 加 20mM EGTA 于 37°C温育 80 分钟。将反应产物加载到8%丙烯酰胺/8M脲凝胶上，并用亚甲蓝染色。图6 二价阳离子对PA-Nter内切核酸酶(RNA酶)活性的作用。上图中，在β -巯基乙醇和 1. 5mM MnCl2, CaCl2, MgCl2, ZnCl2 或 CoCl2 存在时，将纯的 ph-RNA 加 PA-Nter 于 pH 8 温育。下图中，将 ph-RNA 和 PA-Nter 在 pH 7 下与 1. 5mM MnCl2、CaCl2、MgCl2、NiCl2 或 CoCl2—起温育。30分钟后，加入20mM EGTA终止反应。对照用标示的盐或仅PA-Nter进行。将反应产物加载到8%或15% (用于下图)丙烯酰胺/8M脲中，并用亚甲蓝染色。注意在PH 7下，CoCl2刺激内切核酸酶强于MnCl2。在pH 8下，CoCl2沉淀，因此，不激活内切核酸酶活性。图7 =PA-Nter内切核酸酶(RNA酶)活性对不同RNA底物的作用。将SRP Alu-RNA, tRNA、富含 U 的 RNA、ph-RNA 或短 ph-RNA 与 PA-Nter 力口 ImM MnCl2 (泳道 2、4、6、8 禾口 10)或在PA-Nter不存在时(泳道1、3、5、7和9)温育。消化在37°C下进行。40分钟后，加入20mM EGTA终止反应。将反应产物加载到15%丙烯酰胺/8M脲凝胶中，并用亚甲蓝染色。图8 =PA-Nter的内切核酸酶活性对单链DNA的作用。将单链DNA质粒 M13mpl8 (lOOng/ μ 1) (Fermentas)在 PA-Nter 加 MnCl2 存在时于 37°C温育 60 分钟(泳道 4)。加入20mM EGTA终止反应。作为对照，将M13mpl8与仅ImM MnCl2 (泳道2)或PA-Nter 加MnCl2和20mM EGTA(泳道3)温育。将反应产物加载到0. 8%琼脂糖凝胶中，并用溴化乙锭染色。图9 =PA-Nter内切核酸酶活性被2，4_ 二氧代_4_苯基丁酸(DPBA)抑制。在ImM MnCl2 存在时，且提高 DPBA 的浓度(0,6. 5、13、20、26、40、65、130 和 1000 μ Μ)下于 37°C温育 40分钟，检验PA-Nter对ph-RNA(A)或M13mpl8ssDNA(B)的切割。作为对照，使ph-RNA或 ssDNA与仅ImM MnCl2 一起温育(泳道1)。将反应产物加载到8%丙烯酰胺/8M脲中，并用亚甲蓝染色(A)，或加载到0.8%琼脂糖凝胶中，并用溴化乙锭染色(B)。图10 =PA-Nter的三维结构。具有α螺旋(中等灰色)和β链(浅灰色)的流感病毒PA-Nter结构的带状图。关键活性部位残基用棒状模型表示。图11 由以下代表性流感病毒毒株PA-亚基获得的多肽片段的序列比对:A/维多利亚(Victoria)/3/1975 (人 H3N2 ;SEQ ID NO :2 的氨基酸残基 1-209)、A/鸭 / 越南 /1/2007 (禽 H5m ；SEQ ID NO :8 的氨基酸残基 1-209)、B/安纳堡(Ann Arbor)/1/1966 (SEQ ID NO 4 的氨基酸残基 1-206)和 C/ 约翰内斯堡(Johannesburg)/1/1966 (SEQ ID NO 6 的氨基酸残基1-189)。在序列比对之内显示了 A/维多利亚/3/1975的二级结构含量。用方框突出显示的序列表示4个序列之间的序列相似性。在4个序列之间实心黑色背景下的残基是相同的。三角形表示关键活性部位残基。图12 按照以图11所示序列比对为基础的残基保守性描出的PA-Nter的阴影图，其中使用灰色(非保守)、灰色(等同残基)和黑色(100%保守)。图13 =PA-Nter的表面静电势。取向如图12。缺乏金属离子时ΡΑ-Nter的表面静电势。电势标度的范围为-10. 0kT/e(中等灰色，酸性残基Asp (D)和Glu (E)) M 3. OkT/ e (深灰色，碱性残基Lys (K)和Arg (R))。图14 =PA-Nter与PD- (D/E) XK超家族的其它核酸酶的比较。在保守核心活性部位结构基序重叠后，PA-Nter (左)、激烈热球菌(P. furiosus)霍利迪连结体解离酶(Holliday junction resolvase) Hjc (PDB 条目 1GEF)(中)和大肠杆菌(E. coli) EcoRV 限制性内切酶 (PDB条目1STX，与DNA和锰的产物复合体)(右)的比较。对于Hjc的77个比对的C α原
子，均方根偏差为2.9人，对于EcoRV的55(72)个比对的Ca原子为2. 46 (3.1) Α。二级结
构元件见图10，其中关键活性部位残基以棒表示。图15 锰离子与流感病毒PA-Nter (分子Α)(左)和大肠杆菌EcoRV限制性内切酶(产物复合体)(右)的活性部位的相互作用的详情。活性部位元件和残基分别以浅灰色和深灰色(左)和深灰色(右)表示。锰离子和水分子分别以中等灰色和深灰色球体表示。以利用锰K限(K edge)(波长1.89)衍射数据和模型相位计算的等高线为3 σ时的反常差异图为深灰色。对于MnU Μη2和Cys45的硫峰高分别为14. 1,10. 1和5. 0 σ。注意，在依赖于金属的核酸酶中，金属离子的确切构型和酸性侧链微妙地取决于反应坐标。图16 流感病毒PA-Nter和大肠杆菌EcoRV限制性内切酶的活性部位的重叠。PA-Nter 二级结构元件和活性部位残基(用PA表示)用浅灰色表示，其中锰离子用中等灰色表示。重叠处是EcoRV的等同元素(PDB条目1STX) (Horton和Perona，2004， Biochemistry 43 :6841_6857)，蛋白质为深灰色(用E表示)，锰离子为深灰色。对2个蛋白质的关键活性部位金属结合和催化官能团进行了比对。图17 =EcoRV产物复合体和具有来自邻近分子的Glu66的Pa-Nter的比较。 PA-Nter (分子A)的活性部位元件和残基用浅灰色表示，其中锰离子为中等灰色，含Glu66 的邻接分子的环为浅灰色。在相同方向上，在两个结构重叠后，大肠杆菌EcoRV限制性内切酶(PDB条目1STX) (Horton和Perona，同上)用深灰色表示，其中DNA碱基为浅灰色，锰离子为中等灰色。Glu59的羧基官能团在dA7易切断的磷酸上重叠，而存在于PA-Nter的活性部位有序排列的硫酸离子占有了 dT8的磷酸部分的位置。图18 按照SEQ ID NO 2所示氨基酸序列的氨基酸1-209精修(refine)的PA多肽片段氨基酸1-209的原子结构坐标。在标为A、B和C的不对称单位中有3个分子。文件标题给出有关结构精修的信息。“Atom”是指已测量坐标的元素。该栏第一个字母定义了元素。给出各个氨基酸的三字母码和氨基酸序列位置。在“Atom”行的头3个值定义了测量的元素的原子位置。相应于占有率的第四个值和第五个(最后一个)值是温度因子(B因子)。占有率因子是指每个原子占据由坐标指定的位置的分子的分数(fraction)。“1”的值表明每个原子具有相同的构象，即在晶体的全部分子中有相同的位置。B是测量原子围绕其原子中心移动的热因子。各向异性温度因子在标为“ANIS0U”的行给出。这种命名相当于PDB文件格式。发明详述在下面详细描述本发明前，要理解的是本发明不限于本文所描述的具体方法、方案和试剂，因为这些都可以改变。还要理解的是，本文所用术语只是为了描述具体的实施方案，并无意限制本发明的范围，本发明的范围只由随附权利要求书限制。除非另有说明，否则本文所用的所有科技术语都具有本领域普通技术人员通常理解的相同含义。下面，将描述本发明的要素。用具体的实施方案列出这些要素。然而，应当理解的是，它们可以任何方式和任何数目组合来产生其它实施方案。所描述的各个实施例和优选的实施方案不应解释为将本发明仅限于明确描述的实施方案。应当理解的是，本说明书支持和包括将明确描述的实施方案与任何数目的所公开的和/或优选的要素组合在一起的实施方案。此外，本申请书中所有描述的要素的任何置换和组合应视为是本申请书内容所公开的，除非文中另有说明。例如，如果在一个优选的实施方案中，本发明的多肽片段相当于SEQ ID NO :2所示氨基酸序列的氨基酸1-209，且在另一个优选的实施方案中，本发明的 PA多肽片段的可用优选使用TEV蛋白酶优选从PA多肽片段切割的肽标签加标签，则相当于SEQ ID NO 2所示氨基酸序列的氨基酸1-209的多肽片段用使用TEV蛋白酶从PA多肽切割的肽标签加标签是本发明的优选实施方案。优选，本文使用的术语按以下文献中的描述定义“A multilingual glossary of biotechnological terms (IUPAC Recommendations)" , H. G. W. Leuenberger, B. Nagel 和 H. Kolbl 编辑，Helvetica Chimica Acta, CH-4010 Basel, Switzerland, (1995)。为了实施本发明，除非另有说明，否则采用本领域文献中描述的化学、生物化学和重组DNA技术的常规方法(参照例如Molecular Cloning :A Laboratory Manual, 2nd Edition, J. Sambrook 等主编，Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989)。在整个本说明书和随附的权利要求书中，除非另有说明，否则术语“包含”和其变体例如“包括”，将理解为是指包括所述整体或步骤或者整体组或步骤组，但不排除任何其它的整体或步骤或者整体组或步骤组。如本说明书和随附权利要求书中所用，单数形式定冠词和不定冠词包括复数对象，除非文中另有明确说明。本说明书整个原文中引用了若干文献。本文引用的文献(包括全部专利、专利申请、科技出版物、生产商说明书、操作指南等)，不论是上文或下文中出现的，均通过引用全部结合到本文中。本文内容不应解释为承认本发明无权先于先前发明的所述内容。定义术语“多肽片段”是指由单条氨基酸链组成的蛋白质的一部分。术语“蛋白质”包含呈二级结构和三级结构的多肽片段，并且另还指由若干氨基酸链(即若干亚基)构成的形成四级结构的蛋白质。术语“肽”是指不一定呈二级结构或三级结构的至多50个氨基酸的短氨基酸链。“拟肽”是由N-取代甘氨酸的寡聚装配产生的肽模拟物。如果残基在多肽结构中占据相似位置，则两个或更多个多肽的残基称为彼此“相当”。如本领域众所周知的一样，可根据氨基酸序列或结构相似性，通过比对多肽序列来确定两个或更多个多肽中的类似位置。这类比对工具为本领域技术人员所熟知，并且可采用标准设置，优选 Align EMBOSS: needle, Matrix :Blosum62, Gap Open 10. 0, Gap Extend 0. 5,在例如 ClustalW(www. ebi. ac. uk/clustalw) gJc Align(http://www. ebi.ac.uk/ emboss/align/index, html)等万维网上获得。本领域技术人员清楚，可能有必要在任一序列中引入空位以产生令人满意的比对。例如，甲型流感病毒PA亚基的残基1-196分别相当于乙型流感病毒和丙型流感病毒PA亚基的残基1-195和1-178。如果在最佳序列比对中比对残基，则两个或更多个PA亚基中的残基被称为“相当”。2个多肽之间的“最佳序列比对” 定义为产生最大数目的比对相同残基的比对。如果2个比对序列之间的序列相似性、优选同一性在10、20或30个氨基酸长度内下降至小于30%、优选小于20%、更优选小于10%，则“最佳序列比对区”结束，由此确定比较序列长度的边界和界限以确定相似性得分。甲型 (aa 1-209)、乙型(aa 1-206)和丙型(aa 1-189)流感病毒PA亚基的氨基酸序列的部分最佳序列比对见图11。例如，SEQ ID NO :2所示氨基酸序列(甲型流感病毒PA亚基)的氨基酸Tyr24、 His41、Glu80、Arg84、Leul06、Aspl08、Glull9、Ilel20、Tyrl30、Glul33、Lysl34 和 Lysl37 分别相当于SEQ ID NO :4所示氨基酸序列(乙型流感病毒PA亚基)的氨基酸Phe24、His41、 Glu81、Arg85、Leul07、Aspl09、Glul20、Vall21、Tyrl31、Lysl34、Lysl35 和 Lysl38 以及 SEQ ID NO :6所示氨基酸序列(丙型流感病毒PA亚基)的氨基酸Ala24、His41、Glu65、Arg69、 Leu91、Asp93、Glul04、Ilel05、Tyrll5、Serll8、Lysll9 和 Lysl22。本发明包括具有内切核酸酶活性的流感病毒RNA依赖性RNA聚合酶PA亚基片段。术语“RNA依赖性RNA聚合酶亚基PA”优选是指甲型流感病毒、乙型流感病毒或丙型流感病毒的PA亚基，优选具有SEQ ID NO :2、4或6所示氨基酸序列。采用最佳序列比对和/或在最佳序列比对区内，“RNA依赖性RNA聚合酶亚基PA变体”在全长片段内具有至少60%、65%、 70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 93%、94%、95%、96%、97%、98%、99%序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选EMBOSS: :needle, Matrix :Blosum62, Gap Open 10. 0，Gap Extend 0.5，与SEQ ID NO :2、4或6所示氨基酸序列比对。优选当将天然存在的PA变体与SEQ ID NO :2、4或6的PA亚基比对时，比对将在2个蛋白质全长内进行，因此，比对得分将取决于这个基础。然而，很可能的是，天然变体可包含C端/N端或内部缺失或添加，例如通过N端或C端融合。在这种情况下，只使用最佳比对区分别评价相似性和同一性。优选且如下文更详细给出的一样，由这些变体得到的片段优选在需要内切核酸酶活性的区域内分别具有标示的相似性和同一性。因此，SEQ ID N0:2、4或6和PA变体之间的任何比对应优选包含内切核酸酶活性部位。因此，SEQ ID NO :2、4或6各自的上述序列相似性和同一性至少发生在超过100、110、120、130、140、150、160、165、170、180、190、 200、210、220、230、240、250、300或更多个氨基酸长度内，优选包含内切核酸酶活性部位。 SEQ ID NO :2、4或6的序列的大量天然PA变体是已知的，并在文献中有记载。所有这些PA 变体都被包括在内，并且可以是本发明的多肽片段的基础。如果SEQ ID NO :2用作参比序列，则甲型流感病毒PA亚基的优选实例包括在Phe4、Ala20、Leu28、Glu31、Val44、Tyr48、 Asn55、Gln57、Gly58、Val62、Leu65、Asp66、Thr85、Gly99、Alal00、Glul01、Ilell8、Ilel29、Asnl42、Ilel45、Glul54、Lysl58、Aspl64、Ilel71、Lysl72、Ilel78、Asnl84 和 / 或 Arg204 的一个或多个位置上的突变。在一个优选的实施方案中，所述变体包含一个或多个下列突变Phe4Leu、Ala20Thr、Leu28Pro、Glu31Lys、Val44Ala、Tyr48His、Asn55Asp、Gln57Arg、 Gly58Ser、Val62Ile、Leu65Ser、Asp66Gly、Thr85Ala、Gly99Lys、AlalOOVal、GlulOlAsp、 Ilell8Thr、Ilel29Thr、Asnl42Lys、Ilel45Leu、Glul54Gly、Lysl58Gln、Aspl64Val、 Ilel71Val、Lysl72Arg、Ilel78Val、Asnl84Ser、Asnl84Arg 和 / 或 Arg204Lys。如果 SEQ ID NO 4用作参比序列，则乙型流感病毒PA亚基的优选变体在一个或多个下列氨基酸位置上包括突变Thr60、Asn86、Argl05、Asnl58、Hisl60和/或Ilel96。在一个优选的实施方案中，乙型流感病毒PA亚基变体包含一个或多个下列突变Thr60Ala、Asn86Thr、Argl05Lys、 Asnl58Asp、Hisl60Ser和/或Ilel96Val。如果SEQ ID NO :6用作参比序列，则丙型流感病毒 PA亚基的优选变体在一个或多个以下氨基酸位置上包括突变Thrll、Leu53、Ser58、Gly70 和/或Alalll。在一个优选的实施方案中，所述突变如下ThrllAla、Leu53Met、Ser58Asn、 Gly70Arg 和 / 或 Alall IThr。因此，本发明的多肽片段以如上所述的RNA依赖性RNA聚合酶亚基PA或其变体为基础。因此，在下面的说明书中，术语“多肽片段”和“PA多肽片段”总是包含具有内切核酸酶活性的从SEQ ID NO :2、4或6给出的PA蛋白得到的这类片段，以及从上文给出的其PA蛋白变体得到的片段。然而，说明书还使用术语“PA多肽片段变体”或“PA片段变体”，明确是指从RNA依赖性RNA聚合酶亚基PA变体得到的具有内切核酸酶活性的PA片段。本发明的 PA多肽片段因此优选包含天然存在的病毒PA亚基的序列、基本由或由天然存在的病毒PA 亚基的序列组成，病毒PA亚基优选为流感病毒PA亚基。然而，还预期PA片段变体在1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15或更多个氨基酸位置上还含有氨基酸取代，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少60%、65%、70%、80%、 81 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%,95%,
96%、97 %、98 %、99 %序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMBOSS: needle，Matrix :Blosum62，Gap Open 10. 0，Gap Extend 0.5，与SEQ ID NO :2、4或6所示氨基酸序列比对。要了解的是，本发明的PA片段可包含不是得自PA的其它氨基酸，例如标签、酶等，在这类比对中将不考虑其它的这类氨基酸，即排除在比对得分的计算以外。在一个优选的实施方案中，在至少超过70、80、90、100、 110、120、130、140、150、160、165、170、180或190个氨基酸的长度内，使片段的序列与SEQ ID NO :2、4或6比对，得到上述标示的比对得分，其中SEQ ID NO :2、4或6各自的序列优选包含内切核酸酶活性部位。在一个优选的实施方案中，PA多肽片段变体包含至少相当于甲型流感病毒PA 的氨基酸残基1-196的氨基酸残基或由氨基酸残基1-196(来源于SEQ ID NO :2)组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少80 %、81 %、 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,
97%、98%、99 %序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMBOSS: :needle，Matrix :Blosum62, Gap Open 10. 0, Gap Extend 0. 5，与SEQ ID NO 2所示序列的氨基酸残基1-196比对；更优选PA多肽片段变体包含至少相当于甲型流感病毒PA的氨基酸残基1-209的氨基酸残基或由氨基酸残基1-209(来源于SEQ ID NO :2)组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMBOSS: needle, Matrix :Blosum62, Gap Open 10. 0, Gap Extend 0.5，与 SEQ ID NO :2 所示氨基酸序列的氨基酸残基1-209比对；更优选多肽片段变体包含至少相当于甲型流感病毒PA的氨基酸残基1-213的氨基酸残基或由氨基酸残基1-213 (来源于SEQ ID NO 2) 组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少60 %、更优选 65%、更优选 70%、更优选 75%、更优选 80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMBOSS: :needle,Matrix :Blosum62,Gap Open 10. 0,Gap Extend 0.5，与SEQ ID NO :2所示氨基酸序列的氨基酸残基1-213比对。在优选的实施方案中，本发明的甲型流感病毒PA多肽片段变体包含突变，优选天然存在的突变，例如与SEQ ID NO :2相比时的一个或多个下列氨基酸残基的突变Phe4、Ala20、Leu28、Glu31、Val44、Tyr48、Asn55、Gln57、Gly58、Val62、 Leu65、Asp66、Thr85、Gly99、AlalOO、GlulOU Ilell8、Ilel29、Asnl42、Ilel45、Glul54、 Lysl58、Aspl64、Ilel71、Lysl72、Ilel78、Asnl84和 /或Arg204。在一个优选的实施方案中，所述变体包含一个或多个下列突变Phe4Leu、Ala20Thr、Leu28Pro、Glu31Lys、Val44Ala、 Tyr48His、Asn55Asp、Gln57Arg、Gly58Ser、Val62Ile、Leu65Ser、Asp66Gly、Thr85Ala、 Gly99Lys、AlalOOVaU GlulOlAsp、Ilell8Thr、Ilel29Thr、Asnl42Lys、Ilel45Leu、 Glul54Gly、Lysl58Gln、Aspl64Val、Ilel71Val、Lysl72Arg、Ilel78Val、Asnl84Ser、Asn 184Arg 和 / 或 Arg204Lys。在一个优选的实施方案中，PA多肽片段变体包含至少相当于乙型流感病毒PA的氨基酸残基1-195的氨基酸残基或由氨基酸残基1-195 (来源于SEQ ID NO 4)组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少80%、81%、82%、 83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%, 98%、99%序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMB0SS: needle，Matrix :Blosum62，Gap Open 10. 0, Gap Extend 0.5，与SEQ ID NO :4所示氨基酸序列的氨基酸残基1-195比对；更优选PA多肽片段变体包含至少相当于乙型流感病毒PA的氨基酸残基1-206的氨基酸残基或由氨基酸残基 1-206(来源于SEQ ID NO :4)组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMB0SS: needle，Matrix :Blosum62，Gap Open 10. 0, Gap Extend 0.5，与 SEQ ID NO: 4所示序列的氨基酸残基1-206比对；更优选PA多肽片段变体包含至少相当于乙型流感病毒PA的氨基酸残基1-210的氨基酸残基或由氨基酸残基1-210 (来源于SEQ ID NO 4) 组成，且在使用最佳序列比对的全长片段内和/或在最佳序列比对区内，具有至少60%、更优选 65%、更优选 70%、更优选 75%、更优选 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 序列相似性，优选序列同一性，其中最佳序列比对可用本领域已知工具获得，例如采用标准设置，优选 EMBOSS:needle, Matrix :Blosum62, Gap Open 10. 0, Gap Extend 0.5，与 SEQ ID NO :4 所示氨基酸序列的氨基酸残基1-210比对。在优选的实施方案中，本发明的乙型流感病毒PA 多肽片段变体包含突变，优选与SEQ ID NO :4相比在一个或多个下列氨基酸位置上的天然存在的突变Thr60、Asn86、Argl05、Asnl58、Hisl60和/或Ilel96。在一个优选的实施方案中，乙型流感病毒PA亚基变体包含一个或多个下列突变Thr60Ala、Asn86Thr、Argl05Lys、 Asnl58Asp、His 160Ser 和 / 或 Ilel96Val。在一个优选的实施方案中，PA多肽片段变体包含至少相当于丙型流感病毒PA的氨基酸残基1-178的氨基酸残基或由氨基酸残基1-178 (来源于SEQ ID NO 6)组成，且在具有SEQ ID NO :6所示氨基酸序列的氨基酸残基1-178的全长片段内，具有至少80%、更优选85%、更优选90%、最优选95%序列相似性；更优选PA多肽片段变体包含至少相当于丙型流感病毒PA的氨基酸残基1-189的氨基酸残基或由氨基酸残基1-189 (来源于SEQ ID NO :6)组成，且在具有SEQ ID NO :6所示氨基酸序列的氨基酸残基1-189的全长片段内，具有至少70 %、更优选75 %、更优选80 %、更优选85 %、最优选90 %序列相似性；更优选PA多肽片段变体包含至少相当于丙型流感病毒PA的氨基酸残基1-193的氨基酸残基或由氨基酸残基1-193 (来源于SEQ IDNO :6)组成，且在具有SEQ ID NO :6所示氨基酸序列的氨基酸残基1-193的全长片段内，具有至少60 %、更优选65 %、更优选70 %、更优选75 %、更优选 80%、更优选85%、最优选90%序列相似性。在优选的实施方案中，本发明的丙型流感病毒 PA多肽片段变体包含突变，优选天然存在的突变，例如与SEQ ID NO :6相比时下列氨基酸残基的一个或多个突变Thr 11、Leu53、Ser58、Gly70和/或Alal 11。在一个优选的实施方案中，所述突变如下ThrllAla、Leu53Met、Ser58Asn、Gly70Arg 和 / 或 AlalIlThr。在本发明的情况下，术语“PA-Nter”是指由SEQ ID NO :2所示氨基酸序列的氨基酸残基1-209与另外的氨基端接头(即GMGSGMA(SEQ ID NO 19))组成的多肽片段。如果本发明的PA多肽片段包含上述氨基酸残基之一，则优选其它的氨基酸残基不来源于相应的甲型流感病毒、乙型流感病毒或丙型流感病毒PA蛋白。术语“序列相似性”是指是在最佳序列比对的同一位置上的氨基酸相同或相似、优选相同。“相似氨基酸”具有相似的特征，例如极性、溶解性、亲水性、疏水性、电荷或大小。相似氨基酸优选为亮氨酸、异亮氨酸和缬氨酸；苯丙氨酸、色氨酸和酪氨酸；赖氨酸、精氨酸和组氨酸；谷氨酸和天冬氨酸；甘氨酸、丙氨酸和丝氨酸；苏氨酸、天冬酰胺、谷氨酰胺和甲硫氨酸。技术人员熟知序列相似性检索工具，例如可获自万维网(例如WWW. ebi. ac. uk/ Tools/similarity, html)的序列相似性检索工具。本文使用的术语“可溶的”是指在生理等渗条件下，例如0. 14M氯化钠或蔗糖，在水性缓冲液中以100，OOOx g离心30分钟后，在不存在有效浓度的变性剂(例如胍或脲) 时，以至少200μ g/ml、优选至少500μ g/ml、优选至少lmg/ml、更优选至少2mg/ml、甚至更优选至少3mg/ml、甚至更优选至少4mg/ml、最优选至少5mg/ml的蛋白质浓度，保存在上清液中的多肽片段。测定其溶解性的蛋白质片段优选在下述细胞表达系统之一中表达。在提及多肽时，术语“纯的”并不要求绝对纯度，例如均质制备物，而是表示多肽比在天然环境中的相对较纯的情况。一般而言，优选在功能显著性水平上，纯的多肽基本上不含其它蛋白质、脂质、碳水化合物或天然与之缔合的其它物质，例如纯度至少85%、更优选纯度至少95%、最优选纯度至少99%。表述“纯化到适于结晶的程度”是指纯度为 85% -100%、优选90% -100%、更优选95% -100%，且无需沉淀便可浓缩至高于3mg/ml、优选高于10mg/ml、更优选高于18mg/ml的蛋白质。技术人员可采用蛋白质纯化的标准技术，对多肽进行纯化。基本纯的多肽可在非还原聚丙烯酰胺凝胶中产生单条主要的条带。在用本发明的方法鉴定化合物的情况下使用的术语“缔合”是指某一部分(即化学实体或化合物或其部分或片段)与PA亚基的内切核酸酶活性部位之间接近的情况。缔合可以是非供价的，即通过例如氢键合、范德华力、静电或疏水相互作用的毗邻在能量上是有利的，或者可以是共价的。术语“内切核酸酶活性”或“内切核酸活性”是指导致切割多核苷酸链内的磷酸二酯键的酶活性。在本发明的情况下，多肽片段具有内切核酸活性，优选对多核苷酸类型没有选择性，即本发明的多肽片段对DNA和RNA、优选对单链DNA(ssDNA)或单链RNA(ssRNA)优选具有内切核酸活性。在这种情况下，“单链”是指多核苷酸链内优选至少3个核苷酸、优选至少5个核苷酸、更优选至少10个核苷酸的单链段，即不与另一个核苷酸的碱基配对。优选本发明的多肽片段的内切核酸活性不依赖于识别位点，即特异性核苷酸序列，而是引起多核苷酸链的非特异性切割。例如，技术人员可通过将RNA或DNA底物(例如锅柄状RNA 或线性或环状单链DNA (例如环状M13mpl8 DNA (MBI Fermentas))，在有或没有相应的多肽片段时在例如37°C下温育特定的一段时间(例如5、10、20、40、60或80分钟)，来测定本发明的多肽片段的内切核酸活性，并且通过例如凝胶电泳，来测定多核苷酸的完整性。本文使用的术语“核苷酸”是指由在Γ位与戊糖连接的嘌呤、脱氮嘌呤或嘧啶核苷碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、脱氮腺嘌呤、脱氮鸟嘌呤等)组成的化合物，包括2 ‘-脱氧和2 ‘-羟基形式，例如参见Kornberg和Baker，DNA R印lication，第2版(Freeman，San Francisco，1992)，另外还包括但不限于具有修饰的碱基部分和/或修饰的糖部分的合成核苷，例如一般参见Scheit，Nucleotide Analogs (John Wiley, N. Y.，1980)。术语“分离的多核苷酸”是指(i)自其天然环境中分离的多核苷酸，( )通过聚合酶链式反应扩增的多核苷酸，或(iii)全部或部分合成的多核苷酸，并且是指脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物，包括有义链和反义链两者的DNA和RNA分子。该术语包含cDNA、基因组DNA和重组DNA。多核苷酸可由完整基因或其部分组成。本文使用的术语“重组载体”包括技术人员已知的任何载体，包括质粒载体、黏粒载体、噬菌体载体(例如λ噬菌体载体)、病毒载体(例如腺病毒或杆状病毒载体)或人工染色体载体，例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或Pl人工染色体(PAC)。所述载体包括表达载体及克隆载体。表达载体包括质粒以及病毒载体，且一般含有所需要的编码序列和在特定的宿主生物体(例如细菌、酵母、植物、昆虫或哺乳动物)中或在体外表达系统中表达有效连接的编码序列所需要的合适DNA序列。一般使用克隆载体改造和扩增某些需要的DNA片段，并且可能没有表达所需DNA片段所需要的功能性序列。本文使用的“重组宿主细胞”是指包含编码目标多肽片段(即本发明的PA多肽片段或其变体)的多核苷酸的宿主细胞。该多核苷酸可如下存在于宿主细胞内(i)照原样随意分散，(ii)整合到重组载体中，或(iii)整合到宿主细胞基因组或线粒体DNA中。可使用重组细胞表达目标多核苷酸或扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括用本发明的多核苷酸或重组载体转化、转染或感染的原始细胞的子代。重组宿主细胞可以是细菌细胞(例如大肠杆菌细胞)、酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris))、植物细胞、昆虫细胞(例如SF9或 Hi5细胞)或哺乳动物细胞。哺乳动物细胞的优选实例是中国仓鼠卵巢(CHO)细胞、非洲绿猴(COS)细胞、人胚肾(HEK293)细胞、HELA细胞等。本文使用的术语“晶体”或“结晶”是指其中平面以一定的角度交叉且其中有组成化学物质的规则结构(例如内部结构)的结构(例如三维固体聚集体)。术语“晶体”可包括以下的任一种固体物理晶型例如根据实验制备的晶体、从晶体衍生的晶体结构(包括二级和/或三级和/或四级结构元素)、基于晶体结构的2D和/或3D模型，或者其图像，例如其示意图或其略图或其用于计算机的数据集。一方面，晶体可用于X射线晶体学技术。本文中，所使用晶体能够经得住暴露于X射线束，并且用来产生解析X射线晶体学结构所需要的衍射图数据。可将晶体表征为能够以由文献描述的一种晶型定义的方式衍射X 身寸线:T. L. Blundell 禾口 L. N. Johnson, "Protein Crystallography", Academic Press, New York(1976)。术语“晶胞”是指基本的平行六面体形状的小块。晶体的整个体积可由这类小块有规则的装配构成。每个晶胞包含完整表示的模式单位(unit of pattern)，模式单位的重复构成晶体。术语“空间群”是指晶体的对称元素的排列。在空间群的命名中，大写字母表示晶格类型，其它符号表示可在不对称单位情况下进行对称操作而又不改变其外观。术语“结构坐标”是指定义一个或多个氨基酸残基相对于轴系统的位置的一组值。该术语是指定义一个或多个分子的三维结构的数据集(例如笛卡尔坐标、温度因子和占有率)。可对结构坐标略作修改，而仍提供几乎相同的三维结构。一组独特的结构坐标的量度是所得结构的均方根偏差。本领域普通技术人员可将提供彼此偏离小于3人、2
A、1.5 Α, 1·0 A或0.5 A均方根偏差的三维结构(特别是酶活性中心的三维结构)的结构坐标视为非常相似。术语“均方根偏差”是指平均值偏差平方的算术平均值的平方根。这是表达与趋势或对象偏差或变异的一种方法。对于本发明的目的，“均方根偏差”定义了 PA多肽片段变体的主链或其中的酶活性中心与由图18的PA多肽片段PA-Nter的结构坐标定义的PA多肽片段的主链或其中的酶活性中心的差异。本文使用的术语“构建计算机模型”包括根据原子结构信息和相互作用模型定量和定性分析分子的结构和/或功能。术语“建模”包括常规的基于数字的分子动力学和能量最小化模型(numeric-based molecular dynamic and energy minimization model)、交互式计算机图形模型(interactive computer graphic model)、改进的分子力学模型 (molecular mechanics model)、距离几何法(distance geometry)禾口其它基于结构的约束模型(structure-based constraint model)。术语“拟合程序运算”是指利用化学实体、酶活性中心、结合口袋(binding pocket)、分子或分子复合体或其部分的结构坐标使化学实体与酶活性中心、结合口袋、分子或分子复合体或其部分缔合的运算。这可通过将化学实体在酶活性中心内定位、旋转或平移以便与酶活性中心的形状和静电互补相匹配来实现。可使共价相互作用、非共价相互作用(例如氢键、静电、疏水、范德华力相互作用)及非互补静电相互作用(例如排斥的电荷-电荷、偶极_偶极和电荷-偶极相互作用)最优化。或者，可将化学实体与酶活性中心结合的形变能减到最低。本文使用的术语“试验化合物”是指其抑制目标多肽片段的内切核酸活性的能力受测试的物质，包括化合物、分子或复合体，即具有内切核酸活性的本发明的PA多肽片段或其变体。试验化合物可以是任何物质，包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂质、金属、核苷酸、核苷酸类似物、核苷、核酸、有机小分子或无机分子、化合物、元素、糖、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺及其组合物和衍生物。术语“小分子”是指分子量介于50道尔顿和约2，500道尔顿、优选范围为200-800道尔顿的分子。此外，本发明的试验化合物可任选包含可检测标记。这类标记包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可采用众所周知的方法将这类可检测标记与试验化合物连接。本发明的试验化合物还可包含物质的复杂混合物，例如含有天然产物的提取物或混合型组合合成的产物。还可对这些进行测试，而且可在后续步骤中，将抑制靶多肽片段的内切核酸活性的组分从混合物中纯化出来。试验化合物可来源于或选自合成或天然化合物的文库。例如，合成化合物文库可经商业途径获自 Maybridge Chemical Co. (Trevillet, Cornwall, UK), ChemBridge Corporation (San Diego, CA)或 Aldrich (Milwaukee，WI)。天然化合物文库可获自例如 TimTec LLC (Newark, DE)。或者，可以使用细菌、真菌、植物和动物细胞和组织提取物形式的天然化合物文库。另外，可使用组合化学合成产生试验化合物作为单独的化合物或作为混合物。采用组合化学制备的化合物集合体在本文中称为组合文库。在本发明的情况下，“调节内切核酸活性的化合物”可提高或降低、优选抑制PA亚基或病毒RNA依赖性RNA聚合酶或其变体的内切核酸活性。优选这类化合物对病毒PA亚基或其变体的内切核酸活性是特异性的，并且不调节、优选不降低其它内切核酸酶、特别是哺乳动物内切核酸酶的内切核酸活性。术语“降低内切核酸活性的化合物”是指与没有所述化合物但有相同反应条件 (即缓冲条件、反应时间和温度)的PA亚基或其变体的内切核酸活性相比，降低得自正黏病毒科的病毒RNA依赖性RNA聚合酶的PA亚基或其变体的内切核酸活性达50%、更优选达60 %、甚至更优选达70 %、甚至更优选达80 %、甚至更优选达90 %和最优选达100 %的化合物。最优选的是与没有该化合物的活性相比，抑制PA亚基或其变体的内切核酸活性的化合物抑制所述活性，即降低所述活性达至少95%、优选达100%。特别优选的是降低或抑制 PA亚基或其变体的内切核酸活性的化合物特异性地降低或抑制PA亚基或其变体的内切核酸活性，却不抑制其它内切核酸酶(例如RNA酶H或限制性内切核酸酶)的内切核酸活性至相同程度，优选根本不抑制。例如，技术人员可准备具有相同缓冲液和反应条件以及底物和内切核酸酶浓度的下列样品(1)底物例如锅柄状RNA、内切核酸活性的PA多肽片段或其变体，(2)底物例如锅柄状RNA、内切核酸活性的PA多肽片段或其变体、试验化合物，(3)底物例如锅柄状RNA、参比内切核酸酶例如RNA酶H，(4)底物例如锅柄状RNA、参比核苷酸例如RNA酶H、试验化合物。在温育样品后，技术人员可通过例如凝胶电泳分析底物。优选导致样品中的切割底物(2)和样品的完整底物(4)的试验化合物。
术语“在高通量背景下”是指高通量筛选测定法和不同类型的技术，这些技术用来筛选具有抑制目标多肽片段的内切核酸酶活性的能力的试验化合物文库。通常高通量测定法在多孔板中进行，包括无细胞测定法以及基于细胞的测定法。术语“抗体”是指单克隆和多克隆抗体两者，即任何免疫球蛋白或其能够识别抗原或半抗原的部分，即具有内切核酸活性的PA多肽片段或其肽。在一个优选的实施方案中，抗体能够与PA多肽片段或其变体内的酶促(内切核酸)活性中心结合。可通过重组DNA 技术或通过酶切割或化学裂解完整抗体产生抗体的抗原结合部分。在一些实施方案中，抗原结合部分包括Fab、Fab'、F(ab' )2、Fd、Fv、dAb和互补决定区(OTR)片段、单链抗体 (scFv)、嵌合抗体(例如人源化抗体)、双抗体和含有足以使特异性抗原与多肽结合的抗体的至少部分多肽。术语“药学上可接受的盐”是指可通过本发明的方法鉴定的化合物或本发明的化合物的盐。合适的药学上可接受的盐包括酸加成盐，其可通过例如将本发明化合物的溶液与以下药学上可接受的酸的溶液混合形成例如盐酸、硫酸、富马酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸。此外，当化合物带有酸性部分时，其合适的药学上可接受的盐可包括碱金属盐(例如钠或钾盐)；碱土金属盐(例如钙或镁盐)；以及与合适的有机配体(例如用商化物、氢氧化物、羧酸盐、硫酸盐、磷酸盐、硝酸盐、烷基磺酸盐和芳基磺酸盐等抗衡阴离子形成的铵、季铵和胺阳离子)形成的盐。药学上可接受的盐的说明性实例包括但不限于乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐(camphorsu 1 fonate/camsylate)、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡糖酸盐、二盐酸盐、十二烷基硫酸盐、乙二胺四乙酸盐、乙二磺酸盐、依托酸盐、乙磺酸盐、乙烷磺酸盐、甲酸盐、富马酸盐、glue印tate、葡庚糖酸盐、葡糖酸盐、谷氨酸盐、甘油磷酸盐、乙醇酰阿散酸盐、半硫酸盐、庚酸盐、己酸盐、己基间苯二酚盐(hexylresorcinate)、海巴胺(hydrabamine)、氢溴酸盐、盐酸盐、氢碘酸盐、2_羟基-乙磺酸盐、羟基萘甲酸盐、碘化物、异硫代硫酸盐(isothionate)、乳酸盐、乳糖酸盐、月桂酸盐、十二烷基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐、甲烷磺酸盐、甲基硫酸盐、黏酸盐、2-萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐 (N-methylglucamine ammonium salt)、油酸盐、草酸盐、双羟萘酸盐(扑酸盐)、棕榈酸盐、泛酸盐、胶质酸盐、过硫酸盐、3-苯丙酸盐、磷酸盐/ 二磷酸盐、苦味酸盐、新戊酸盐、聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、碱式乙酸盐、琥珀酸盐、单宁酸盐、酒石酸盐、茶氯酸盐、甲苯磺酸盐、三乙基碘化物(triethiodide)、十一烷酸盐、戊酸盐等(参见例如 S. M. Berge 等，“Pharmaceutical Salts"，J. Pharm. Sci. 66 1-19 (1977))。本文使用术语“赋形剂”是指药物制剂中不是活性成分的所有物质，例如载体、粘合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、矫味剂或着色剂。术语“药学上可接受的载体”包括例如碳酸镁、硬脂酸镁、滑石粉、糖、乳糖、果胶、糊精、淀粉、明胶、西黄蓍胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。详述本发明首次证实了流感病毒聚合酶的PA亚基的独特作用，并否定了被广泛持有内切核酸酶活性部位位于PBl亚基内的看法。本发明的发明人预料不到地发现，来源于PA亚基N端的一个小的独立折叠的结构域具有据报导是三聚复合体的内切核酸酶的功能性质，尽管一般认为只能在三聚复合体中检出这种活性。此外，本发明人发现，这种PA多肽片段可容易地通过重组方法产生，因此适于对内切核酸活性和其调节进行体外研究，并适于结晶以获得特别是活性部位上的结构信息。本发明的一个方面提供包含具有内切核酸酶活性的病毒RNA依赖性RNA聚合酶的 PA亚基的氨基端片段的多肽片段，其中所述PA亚基来源属于正黏病毒科的病毒。优选该多肽片段可溶于水溶液。通过其切割多核苷酸链(例如锅柄状RNA或单链DNA)的能力测定本发明的多肽片段的最小长度，即通过其内切核酸活性测定多肽的最小长度。优选内切核酸酶活性不依赖于多核苷酸类型，因此可在DNA和RNA上发挥作用，优选在单链DNA和RNA 上发挥作用。优选内切核酸酶活性不依赖于底物多核苷酸内具体的识别位点。在一个优选的实施方案中，多肽片段适于结晶，即优选该多肽片段是可结晶的。优选由本发明的多肽片段得到的晶体适于采用X射线晶体分析法进行多肽片段的结构测定。优选所述晶体大于25立方微米，优选对辐射足够稳定从而允许在暴露于单色X射线时在优选3.5人或更佳的分辨率下收集的衍射数据完整性大于85%。在一个实施方案中，多肽片段可用以下溶液结晶(i)在pH 3-pH 9、优选pH 4-pH 9、更优选pH 7-pH 9下，在浓度10mM-3M、优选10mM_2M、更优选20mM_lM的范围下，在诸如 Tris-HCl 等缓冲系统中蛋白质浓度为 5-10mg/ml，例如 5、5. 5、6、6. 5、7、7. 5、8、8. 5、9、9. 5 或10mg/ml、优选8-10mg/ml的含水蛋白质溶液，即结晶溶液，和(ii)包含一种或多种化合物(例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰或乙二醇)的沉淀剂/贮存溶液。任选蛋白质溶液可含有一种或多种盐，例如一价盐，例如NaCl、KC1或LiCl，优选NaCl，其浓度范围为 10mM-lM、优选 20mM-500mM、更优选 50mM-200mM 和 / 或二价盐，例如 MnCl2、CaCl2、MgCl2、 ZnCl2或CoCl2，优选MnCl2,其浓度范围为0. l_50mM、优选0. 5_25mM、更优选1-lOmM。优选沉淀剂/贮存溶液包含Li2SO4,浓度范围为0. 5-2M、优选1-1. 5M ；缓冲系统，例如MES,其浓度范围为20mM-lM、优选50mM-500mM、更优选75_150mM，优选pH为4_8、更优选pH 5-7 ；乙酸镁和/或乙酸锰，其浓度范围为Ι-lOOmM，优选5-20mM ；和/或乙二醇，其浓度范围为 1% _20%、优选2% -8%、更优选2-4%。结晶溶液中，PA多肽片段或其变体优选的纯度为 85% -100%，更优选的纯度为90% -100%，甚至更优选的纯度为95% -100%。为了产生晶体，可将适于结晶的蛋白质溶液与等体积的沉淀剂溶液混合。在一个优选的实施方案中，结晶介质包含0. 05-2 μ 1、优选0. 8-1. 2 μ 1的适于结晶的蛋白质溶液与类似体积、优选等体积的包含 1.0-1. 4Μ Li2SO4,80-120mM MES (pH 5. 5-pH 6. 5)、5_15mM 乙酸镁和 / 或乙酸锰禾口 2-4%乙二醇的沉淀剂溶液混合。在另一个实施方案中，沉淀剂溶液包含1. 2M Li2SO4UOOmM MES (pH 6.0)、10mM乙酸镁和/或IOmM乙酸锰，优选基本由或由1. 2M Li2SO4UOOmM MES (pH 6. 0)、10mM乙酸镁和/或IOmM乙酸锰组成，优选IOmM乙酸镁和3%乙二醇组成，并且结晶 / 蛋白质溶液包含 5-10mg/ml 蛋白质、20mM Tris (pH 8. 0) UOOmM NaCl 禾Π 2. 5mM MnCl2，优选基本由或由 5-10mg/ml 蛋白质、20mM Tris (pH 8. 0) UOOmM NaCl 和 2. 5mM MnCl2 组成。可通过本领域技术人员已知的任何方法使晶体生长，包括但不限于悬滴和坐滴 (sitting drop)技术，夹滴法(sandwich—drop)、透析禾口微批量(microbatch device)装置或微管批量装置(microtube batch device) 0对于本领域技术人员十分显而易见的是，改变上文公开的结晶条件以确定可产生单独的或与某一化合物复合的本发明的PA多肽片段或其变体的晶体的其它结晶条件。这类改变包括但不限于调节PH、蛋白质浓度和/或结晶温度、改变所使用的盐和/或沉淀剂的性质或浓度、采用不同的结晶方法或引入添加剂，例如洗涤剂(例如TWEEN 20 (单月桂酸酯)、LDOA、Brij 30 (4月桂基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二烷、二甲基甲酰胺)、镧系离子或多离子化合物。高通量结晶测定法还可用来辅助查找结晶条件或使结晶条件最优化。可使用小晶种法(Microseeding)增加结晶的大小和品质。简单来说，将微晶粉碎得到晶种贮存溶液。将晶种贮存溶液系列稀释。不含晶种时，使用针、玻璃棒或毛发丝，将各稀释溶液的少量样品加入一组含有浓度等于或小于产生晶体所需浓度的蛋白质的平衡液滴中。目的在于以单粒晶体结束，所述单粒晶体在液滴中将发挥成核进行晶体生长的作用。获得如图8所示的结构坐标的方法、解析坐标及其在了解本文所述的蛋白质结构中的应用通常为技术人员所了解并可参照标准教科书例如J. Drenth/'Principles of protein X-ray crystallography，，,第 2版，Springer Advanced Texts in Chemistry, New York(1999)；以及 G. E. Schulz 和 R. H. Schirmer，“Principles of Protein Structure", Springer Verlag, New York(1985) 例如，常常采用冷冻至100K的冷冻保护的(例如用 20% -30%甘油)晶体，使用例如同步加速设备或旋转阳极中的光束作为X射线源，先获得X射线衍射数据。然后，通过普遍已知的方法，例如多波长反常衍射(multiwavelength anomalous diffraction, MAD)、多重同晶置换(multiple isomorphous replacement, MIR)、单波长反常衍射(single wavelength anomalous diffraction, SAD)或分子置换 (MR)，求解相位问题。可采用SHELXD解析亚结构(Schneider和Sheldrick，2002，Acta Crystallogr. D. Biol. Crystallogr. (Pt 10 Pt 2)，1772-1779)，用 SHARP(Vonrhein 等， 2006，Methods Mol. Biol. 364 215-30)计算相位，并用溶剂平滑法和非晶体学不对称平均法(例如用 RESOLVE)进行改进(Terwilliger, 2000, Acta Cryst. D. Biol. Crystallogr. 56 965-972)。可用例如 ARP/wARP(Perrakis 等，1999，Nat. Struct. Biol. 6 :458_63)进行自动建模，并用例如 REFMAC(Murshudov, 1997，Acta Crystallogr. D. Biol. Crystallogr. 53 240-255)进行精修。技术人员可利用结构坐标(图18)作为二级分析(包括测定表面静电势)的输入数据(参见图13)，这有助于测定试验化合物中的侧基，其很可能与优选活性部位中的给定静电势的PA表面区域相互作用。为了利用为PA多肽片段产生的结构坐标，必需将结构坐标转化为三维形状。这可通过应用市售软件实现，该软件能够从一组结构坐标的分子或其部分产生三维示意图。这类计算机程序的实例是MODELER(Sali和 Blundell，1993，J. Mol. Biol. 234 :779-815，用 Insight II Homology 软件包执行(Insight II (97. 0), Molecular Simulations Incorporated, San Diego, CA))。这类三维不意图可与合适的程序一起使用以产生例如静电势的示意图，所述程序包括(DGaussim 92， C 片反(Frisch，Gaussian，Incorporated，Pittsburgh，PA)，(ii)AMBER，4. 0 片反(Ko1Iman, University of California, San Francisco, CA), (iii)QUANTA/CHARMM(Molecular Simulations Incorporated,San Diego,CA),(iv)OPLS-AA(Jorgensen,1998,Encyclopedia of Computational Chemistry，Schleyer 主编，Wiley，New York，第 3 卷，第 1986-1989 页) 禾口(v)Insight II/Discover(Biosysm Technologies Incorporated，San Diego, CA) 0 同样，结构信息可与在不同氨基酸位置(参见图12)上的如图11所示的保守残基的信息组合以强调PA表面上的残基和/或活性部位中的残基，所述残基在不同病毒分离株之间尤其保守，因此很可能也存在于这些病毒或其它分离株的突变株中。这也适于技术人员能够从残基相关性中获取信息。此外，本发明提供的甲型流感病毒PA片段PA-Nter的结构坐标(图 18)可用于得自正黏病毒科其它病毒的PA多肽或采用分子置换方法而具有氨基酸取代、缺失和/或插入的PA多肽变体的结构测定。在本发明的多肽片段的一个优选的实施方案中，PA亚基来自甲型、乙型或丙型流感病毒或是其变体，优选来自甲型流感病毒或其变体。优选本发明的多肽片段内包含的氨基端PA片段相当于以下氨基酸，优选基本由或由以下氨基酸组成甲型流感病毒或其变体的RNA依赖性RNA聚合酶的PA亚基的至少氨基酸1_196、优选氨基酸1_209、优选氨基酸 1-213，即SEQ ID NO 2所示氨基酸序列的氨基酸残基1-196、1-209或1-213。在一个优选的实施方案中，将本发明的多肽片段纯化到适于结晶的程度，优选纯度为 85% -100%、更优选 90% -100%、最优选 95% -100%。在另一个实施方案中，本发明的多肽片段能够与二价阳离子结合。优选本发明的多肽片段与一个或多个二价阳离子结合，优选与两个二价阳离子结合。在这种情况下，二价阳离子优选选自锰、钴、钙、镁和锌，更优选锰或钴，最优选锰。因此，在一个优选的实施方案中，本发明的多肽与2个锰阳离子一起存在于复合体中。在一个优选的实施方案中，二价阳离子由相当于SEQ ID NO :2所示的氨基酸GluSO和AsplOS (第一阳离子)的氨基酸及相当于氨基酸His41、Aspl08和Glull9(第二阳离子)的氨基酸配位(coordinate)。在本发明的多肽片段的一个优选的实施方案中，(i)N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO 2的PA亚基氨基酸序列的186-220位的氨基酸，例如186、187、 188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、 207、208、209、210、211、212、213、214、215、216、217、218、219 或 220 位的氨基酸；优选 N 端等同于或相当于15或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO 2的PA亚基氨基酸序列的196-220位的氨基酸；更优选N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、 6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO :2的PA亚基氨基酸序列的196-209位的氨基酸，(ii)N端等同于或相当于15或更小的氨基酸，例如15、14、13、12、 11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO :4的PA亚基氨基酸序列的 185-217 位的氨基酸，例如 185、186、187、188、189、190、191、192、193、194、 195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、 214、215、216或217位的氨基酸；优选N端等同于或相当于15位或更小的氨基酸，例如15、 14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO: 4的PA亚基氨基酸序列的195-217位的氨基酸；更优选N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于SEQ ID NO :4的氨基酸序列的195-206位的氨基酸，或(iii)N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于SEQ ID NO 6的PA亚基氨基酸序列的168-200位的氨基酸，例如168、169、170、 171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200位的氨基酸；优选N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位的氨基酸，C
端等同于或相当于SEQ ID NO :6的氨基酸序列及其保持内切核酸酶活性的变体的178-200 位的氨基酸；更优选N端等同于或相当于15位或更小的氨基酸，例如15、14、13、12、11、10、 9、8、7、6、5、4、3、2或1位的氨基酸，C端等同于或相当于选自SEQ ID NO :6的氨基酸序列的 178-189位的氨基酸；以及在每种情况下，SEQ ID NO :2、4或6的保持内切核酸酶活性的氨基酸序列的变体。在另一个实施方案中，所述多肽片段具有或相当于选自SEQ ID NO :2所示氨基酸序列的氨基酸 5-196、10-196、15-196、20-196、5-209、10-209、15-209、20-209 的氨基酸序列及其保持内切核酸活性的变体。在另一个实施方案中，所述PA多肽片段具有或相当于选自 SEQ ID NO :4 所示氨基酸序列的氨基酸 5-195、10-195、15-195、20-195、5-206、10-206、 15-206,20-206的氨基酸序列及其保持内切核酸活性的变体。在另一个实施方案中，所述PA多肽片段具有或相当于选自SEQ ID N0:6所示氨基酸序列的氨基酸5-178、10-178、 15-178、20-178、5-189、10-189、15-189、20-189的氨基酸及其保持内切核酸活性的变体氨基酸序列。在优选的实施方案中，所述多肽片段包含氨基酸取代、插入或缺失，优选如上所述的天然存在的突变。在另一个优选的实施方案中，本发明的多肽片段由SEQ ID NO 2所示氨基酸序列的氨基酸1-209组成，并且具有图18所示的结构坐标定义的结构。在另一个实施方案中，本发明的多肽片段晶型的优选空间群为P4A2，晶胞大小优选为a = b = 6. 71 士0. 2nm，c = 30. 29nm士0. 4nm。在另一个实施方案中，本发明的晶体为具有优选三方或六方空间群的六方片晶(hexagonal plate)，其中优选的晶胞大小为a = b =6. 79nm, c = 49. 4nm, α = β = 90°，γ = 120°。优选多肽片段的晶体衍射X射线的
分辨率为2.8 A或更高、优选A或更高、更优选A或更高、甚至更优选人或更高、
最优选2.1人或更高。本发明的另一个方面提供编码上述PA多肽片段及其变体的分离多核苷酸。用于获得这类分离核苷酸片段的分子生物学方法一般为本领域技术人员所知(有关标准分子生物学方法参见 Sambrook 等主编，“Molecular Cloning :A Laboratory Manual”，Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York(1989),通过弓|用结合到本文中)。例如，可从流感病毒感染细胞中分离RNA，并且使用随机引物(例如十聚体的随机六聚体)或对产生的目标片段有特异性的引物，应用反转录聚合酶链式反应(RT-PCR) 产生cDNA。然后，可通过使用片段特异性引物的标准PCR扩增目标片段。在一个优选的实施方案中，编码优选的实施方案的PA多肽片段的分离多核苷酸来源于SEQ ID NO 1(甲型流感病毒)、SEQ ID NO :3(乙型流感病毒)或SEQ ID NO :6(丙型流感病毒)。在这种情况下，“来源于”是指编码全长PA多肽的SEQ ID N0:l、2和3事实，因此，按分别编码的PA多肽片段的需要，编码优选的PA多肽片段的多核苷酸可在多核苷酸的3’端和/或5’端包含缺失。在一个实施方案中，本发明涉及包含所述分离多核苷酸的重组载体。本领域技术人员十分了解用于将目标多核苷酸序列掺入载体的技术(另参见Sambrook等，1989，同上)。这类载体包括技术人员已知的任何载体，包括质粒载体、黏粒载体、噬菌体载体(例如λ噬菌体载体)、病毒载体(例如腺病毒或杆状病毒载体)或人工染色体载体，例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或Pl人工染色体(PAC)。所述载体可以是适于原核或真核表达的表达载体。所述质粒可包括复制起点(ori)、多克隆位点和调节序列，例如启动子(构成型或诱导型)、转录起始位点、核糖体结合位点、转录终点、多腺苷酸化信号和选择标记(例如基于突变或缺失的互补作用的抗生素抗性或营养缺陷型标记)。在一个实施方案中，目标多核苷酸序列与调节序列有效连接。在另一个实施方案中，所述载体包括编码有利于目标多肽纯化的表位_标签、肽_标签或蛋白质_标签的核苷酸序列。这类表位_标签、肽_标签或蛋白质_标签包括但不限于血凝素_标签(HA-)、FLAG-标签、myc-标签、聚-His-标签、谷胱甘肽-S-转移酶-(GST-)标签、麦芽糖-结合-蛋白质-(MBP-)标签、NusA-标签和硫氧还蛋白-标签或荧光蛋白-标签，例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E) YFP)、来源于Discosoma物种(DsRed)的红色荧光蛋白(RFP)或单体红色荧光蛋白(mRFP)、青色荧光蛋白(CFP)等。在一个优选的实施方案中，可使用例如蛋白酶例如凝血酶、因子 Xa, PreScission, TEV蛋白酶等，将表位-标签、肽-标签或蛋白质_标签从目标多肽片段上切下。优选可用TEV蛋白酶切下标签。这类蛋白酶的识别位点为本领域技术人员所熟知。例如，TEV蛋白酶识别位点的7个氨基酸共有序列为Glu-X-X-Tyr-X-Gln-Gly/Ser，其中X可以是任何氨基酸，在本发明的情况下优选为Glu-Asn-Leu-Tyr-Phe-Gln-Gly (SEQ ID N0:21)。在另一个实施方案中，载体包括引导目标多肽片段分泌到重组宿主细胞的培养基中或细菌的周质空间中的功能序列。信号序列片段通常编码由疏水氨基酸组成的信号肽，其指导蛋白质从细胞中分泌。蛋白质或分泌到生长培养基(革兰氏阳性细菌)中，或分泌到位于细胞内膜与外膜之间的周质空间(革兰氏阴性细菌)中。优选在信号肽片段和外源基因之间有编码的加工位点，可在体内或体外切割该位点。另一方面，本发明提供包含所述分离多核苷酸或所述重组载体的重组宿主细胞。重组宿主细胞可以是原核细胞，例如古细菌(archea)细胞和细菌细胞或真核细胞，例如酵母、植物、昆虫或哺乳动物细胞。在一个优选的实施方案中，宿主细胞为细菌细胞，例如大肠杆菌细胞。本领域技术人员非常了解将所述分离多核苷酸或所述重组载体引入所述宿主细胞的方法。例如，可利用例如化学转化(例如氯化钙方法)或电穿孔，容易地转化细菌细胞。酵母细胞可使用例如乙酸锂转化方法或电穿孔转化。其它真核细胞可使用例如市售的基于脂质体的转染试剂盒(例如Lip0feCtamineTM(InVitr0gen))、市售的基于脂质的转染试剂盒(例如Fugene (Roche Diagnostics))、聚乙二醇型转染、磷酸钙沉淀、基因枪(生物射弹)、电穿孔或病毒感染转染。在本发明的一个优选的实施方案中，重组宿主细胞表达目标多核苷酸片段。在一个甚至更优选的实施方案中，所述表达产生可溶的本发明的多肽片段。这些多肽片段可采用本领域技术人员众所周知的蛋白质纯化方法纯化，任选利用上述表位_标签、肽_标签或蛋白质_标签。另一方面，本发明涉及用于鉴定调节来源于正黏病毒科的病毒RNA依赖性RNA聚合酶的PA亚基或其变体的内切核酸酶活性的化合物的方法，所述方法包括以下步骤(a)构建由图18所示的本发明的多肽片段的结构坐标定义的活性部位的计算机模型；(b)通过选自以下的方法选出潜在的调节活性的化合物
(i)将分子片段装配成所述化合物，(ii)从小分子数据库选择化合物，和(iii)对所述化合物进行从头配体设计；(c)运用计算方法，进行所述化合物与所述活性部位的计算机模型之间的拟合程序运算，从而提供所述化合物在活性部位中的能量最低化构型；和(d)评价所述拟合运算的结果以量化所述化合物与活性部位模型之间的关系，以此评价所述化合物与所述活性部位缔合的能力。优选调节化合物与PA亚基或其变体内的内切核酸活性部位结合。调节化合物可提高或降低、优选降低所述内切核酸活性。在本发明这个方面的一个优选的实施方案中，调节PA亚基或其变体的内切核酸酶活性的化合物降低所述活性，更优选所述化合物抑制所述活性。优选与没有所述化合物但有相同的反应条件(即缓冲条件、反应时间和温度)的PA亚基或其变体的内切核酸活性相比，该化合物降低PA亚基或其变体的内切核酸活性50 %，更优选60 %，甚至更优选70 %，甚至更优选80 %，甚至更优选90 %，最优选100 %。特别优选的是化合物特异性地降低或抑制PA亚基或其变体的内切核酸活性，却不降低或抑制其它内切核酸酶、特别是哺乳动物内切核酸酶的内切核酸活性至相同程度，优选根本不降低或抑制所述活性。本发明首次允许根据图18的内切核酸活性部位的结构坐标，使用分子设计技术，鉴定、选择或设计可能调节PA亚基或其变体的内切核酸活性的化合物。鉴于与制备和测试可能调节内切核酸活性的许多不同的化合物的较高成本，这类预测模型是极有益的。为了利用针对PA多肽片段产生的结构坐标，有必要将结构坐标转化为三维形状。这可应用市售的软件实现，该软件能够从一组结构坐标的分子或其部分产生三维示意图。这类计算机程序的实例为 MODELER(Sali 和 Blundell，1993，J. Mol. Biol. 234 :779-815,用 hsight II Homology 软件包执行(Insight II (97. 0) ,Molecular Simulations Incorporated, San Diego, CA))。本领域的技术人员可采用若干方法根据调节PA亚基或PA多肽变体的内切核酸活性的能力筛选化学实体或片段。该方法可根据图18的结构坐标，由目测例如PA的内切核酸活性部位的三维计算机模型开始。然后，可将选定的片段或化合物置于不同的方向或停靠在活性部位内。可应用软件(例如 Cerius、Quanta和 Sybyl (Tripos Associates, St. Louis, MO))来完成停靠，接着是能量最小化和具有标准分子动力学力场的分子动力学分析(例如 0PLS-AA、CHARMM和AMBEI )。在选择合适的化合物或片段的过程中，可辅助本领域技术人员的其它专业化计算机程序包括例如(i)AUTODOCK(Goodsell等，1990，Proteins =Struct.， Funct. ,Genet. 8 :195-202 ;AUT0D0CK可获自 The Scripps Research Institute,La Jolla, CA)和(ii)DOCK(Kuntz 等，1982，J. Mol. Biol. 161 :269-288 ；DOCK 可获自 University of California, San Francisco, CA)。一旦选出合适的化合物或片段，则可将其设计或装配成单一化合物或复合体。应用软件(例如Quanta或Sybyl)进行这种手工模型构建。在连接各个化合物或片段时有助于技术人员的有益程序包括例如(i)CAVEAT(Bartlett等，1989，in Molecular Recognition in Chemical and Biological Problems, Special Publication, Royal Chem. Soc. 78 :182-196 ；Lauri 和 Bartlett,1994，J. Comp. Aid. Mol. Des. 8:51-66 ；CAVEAT可获自 University of California, Berkley, CA), (ii) 3D 数据库系统，例如 ISIS (MDL Information Systems, San Leandro, CA ；有关综述见 Martin, 1992, J. Med. Chem. 35 2145-2154)和(iii)HOOK(Eisen等，1994，Proteins =Struct.，Funct. ,Genet. 19 :199-221 ； HOOK 可获自 Molecular Simulations Incorporated, San Diego, CA)。可由本发明实现的另一种方法是计算筛选全部或部分与PA亚基的内切核酸活性部位或PA多肽变体的活性部位结合的化合物的小分子数据库。在这种筛选中，可通过形状互补性或通过估算的互作用能判断将这类化合物与活性部位拟合的质量(Meng等，1992， J. Comp. Chem. 13 :505-524)。或者，PA亚基或多肽其变体的内切核酸活性的潜在调节剂，优选内切核酸活性的抑制剂，可根据图18的PA多肽片段的3D结构从头设计。有各种本领域技术人员可获得的从头配体设计的方法。这类方法包括(i)LUDKBohm, 1992, J. Comp. Aid. Mol. Des. 6 :61-78 ；LUDI 可获自 Molecular Simulations Incorporated, San Diego, CA), (ii) LEGEND (Nishibata 和 Itai，Tetrahedron 47 :8985-8990 ；LEGEND 可获自 Molecular Simulations Incorporated, San Diego, CA), (iii) LeapFrog (可获自 Tripos Associates, St. Louis, MO), (iv) SPROUT (Gillet 等，1993，J. Comp. Aid. Mol. Des. 7 :127-153 ；SPROUT 可获自 University of Leeds, UK)，(v) GROUPBUILD (Rotstein 和 Murcko，I993，J. Med. Chem. 36 :1700-1710)和(vi)GROW(Moon 和 Howe, 1991，Proteins 11 :314-328)。此外，已经披露了可支持本领域技术人员对内切核酸活性部位的潜在调节剂和/或抑制剂、优选内切核酸活性部位的结合配偶体的从头设计和建模的若干分子建模技术(通过引用结合到本文中)，包括例如Cohen等，1990，J. Med. Chem. 33 883-894 ； Navia 禾口 Murcko，1992，Curr. Opin. Struct. Biol. 2 :202-210 ；Balbes 等，1994，Reviews in Computational Chemistry，第 5 卷，Lipkowitz 和 Boyd 主编，VCH，New York，第 37-380 页； Guida, 1994，Curr. Opin. Struct. Biol. 4 :777-781。可进一步通过计算使按照与PA亚基或其变体的内切核酸活性部位结合设计或选择的分子最优化，使得在其结合状态中，其优选缺乏与靶区的排斥的静电相互作用。这类非互补(例如静电)的相互作用包括排斥的电荷-电荷、偶极-偶极和电荷-偶极相互作用。准确地讲，在结合状态中，结合化合物和结合口袋之间全部静电相互作用的加和，优选对结合的焓产生中性或有利的贡献。本领域可获得可以评价化合物形变能和静电相互作用的具体计算机程序。合适程序的实例包括(i) Gaussian 92，C版(Frisch，Gaussian, Incorporated,Pittsburgh,PA), (ii)AMBER,4. O版(Kollman,University of California, San Francisco, CA), (iii)QUANTA/CHARMM(Molecular Simulations Incorporated, San Diego, CA), (iv)OPLS-AA(Jorgensen,1998, Encyclopedia of Computational ChemistryJchleyer 主编，Wiley，New York，第 3 卷，第 1986-1989 页)和(ν) Insight II/ Discover (Biosysm Technologies Incorporated, San Diego, CA)。可以利用例如 Silicon Graphics工作站，IRIS 4D/35或IBM RISC/6000工作站550型执行这些程序。其它硬件系统和软件包是本领域技术人员已知的。一旦如上所述选出或设计出目标分子，然后，可在其一些原子或侧基上进行取代，以便改进或修改其结合性质。总的来说，最初的取代是保守的，即置换基团与原始基团在大小、形状、疏水性和电荷上可大致相同。当然，应当理解的是，应避免本领域已知的改变构象的组分。然后，可通过与上文详述方法相同的计算机方法，分析这类取代的化合物与PA亚基或其变体的内切核酸活性部位拟合的效能。在本发明上述方法的一个实施方案中，PA亚基或其变体的内切核酸活性部位包含相当于SEQ ID NO :2的PA亚基的氨基酸Aspl08、Ilel20和Lysl34的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸Aspl08、Ilel20、Lys 134 ^P His41的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸 Aspl08、Ilel20、Lysl34和Glu80的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO :2的氨基酸Aspl08、Ilel20、Lysl34和Glull9的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸Aspl08、Ilel20、Lysl34、His41、 Glu80和Glull9的氨基酸。在又一个实施方案中，所述活性部位包含相当于SEQ ID NO 2 的氨基酸 Aspl08、Ilel20、Lysi;34、His41、Glu80、Glull9 和 Tyr24 的氨基酸。在又一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸Aspl08、Ilel20、Lysi;M、His41、 Glu80、Glull9和Arg84的氨基酸。在又一个实施方案中，所述活性部位包含相当于SEQ ID NO 2 的氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Leul06 的氨基酸。在又一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸Aspl08、Ilel20、Lysl34、 His41、Glu80、Glul 19和Tyrl30的氨基酸。在又一个实施方案中，所述活性部位包含氨基酸相当于 SEQ ID NO 2 的氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Glul33 的氨基酸。在又一个实施方案中，所述活性部位包含氨基酸相当于SEQ ID NO :2的氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Lysl37 的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO :2的氨基酸Aspl08、Ile 120、Lysl34、His41、Glu80、 Glull9、Tyr24、Arg84和Leul06的氨基酸。在另一个实施方案中，所述活性部位包含相当于 SEQ ID NO :2 的氨基酸 Aspl08、Ile 120、Lysl34、His41、Glu80、Glull9、Tyrl30、Glul33 和Lysl37的氨基酸。在另一个实施方案中，所述活性部位包含相当于SEQ ID NO 2的氨基酸 Aspl08、Ile 120、Lysl34、His41、Glu80、Glull9、Tyr24、Arg84、Leul06、Tyrl30、Glul33 和Lysl37的氨基酸。在本发明上述方法的另一个方面，PA亚基或其变体的内切核酸活性部位由图18 的PA SEQ ID N0:2氨基酸Aspl08、Ilel20和Lysl34的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PASEQ ID NO :2氨基酸Aspl08、Ilel20、Lysl34和His41的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸AsplOS、 Ilel20、Lysl34和GluSO的结构坐标定义。在另一个实施方案中，所述活性部位由图18的 PA SEQ ID NO :2氨基酸Aspl08、Ilel20、Lysi;34和Glull9的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸Aspl08、Ilel20、LysliM、His41、 GluSO和Glull9的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO 2 氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Tyr24 的结构坐标定义。在又一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸Aspl08、Ilel20、 Lysl34、His41、Glu80、Glull9和Arg84的结构坐标定义。在另一个实施方案中，所述活性部位由图 18 的 PA SEQ ID NO :2 氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Leul06的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO 2 氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Tyr 130 的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸Aspl08、Ilel20、Lysl34、 His41、Glu80、Glull9和Glul33的结构坐标定义。在另一个实施方案中，所述活性部位由图 18 的 PA SEQ ID NO :2 氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Lysl37 的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO 2氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9、Tyr24、Arg84 和 Leul06 的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸Aspl08、Ilel20、 Lysl34、His41、Glu80、Glull9、Tyrl30、Glul33 和 Lysl37 的结构坐标定义。在另一个实施方案中，所述活性部位由图18的PA SEQ ID NO :2氨基酸Aspl08、Ilel20、LysliM、His41、 Glu80、Glull9、Tyr24、Arg84、Leul06、Tyr 130, Glul33 和 Lysl37 的结构坐标定义。一方面，本发明提供按照上述方法计算筛选化合物的方法，所述化合物能够调节作为图18的PA亚基的内切核酸活性部位的变体的内切核酸的活性部位和/或与之缔合。在一个实施方案中，所述活性部位的所述变体与图18的以下氨基酸的主链原子的均方根偏差不大于3A:氨基酸Aspl08、Ilel20和Lysl34 ；氨基酸Aspl08、Ilel20、Lysl34*His41 ；氨基酸Aspl08、Ilel20、Lysl34*Glu80 ；氨基酸Aspl08、Ilel20、Lysl34*Glull9 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80 和 Glull9 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、 Glu80、Glull9 和 Tyr24 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Arg84 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Leul06 ；氨基酸 Aspl08、Ilel20、 Lysl34、His41、Glu80、Glull9 和 Tyr 130 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、 Glull9 和 Glul33 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9 和 Lysl37 ；氨基酸 Aspl08、Ilel20、Lysl34、His41、Glu80、Glull9、Tyr24、Arg84 和 Leul06 ；氨基酸 Aspl08、 Ilel20、Lysl34、His41、Glu80、Glull9、Tyrl30、Glul33 和 Lysl37 ；氨基酸 Aspl08、Ilel20、 Lysl34、His41、Glu80、Glull9、Tyr24、Arg84、Leul06、Tyr 130, Glul33 和 Lysl37。在另一
个实施方案中，所述均方根偏差不大于2.5人。在另一个实施方案中，所述均方根偏差不大
于2人。在另一个实施方案中，所述均方根偏差不大于1.5 ·Λ。在另一个实施方案中，所述均
方根偏差不大于1人。在另一个实施方案中，所述均方根偏差不大于0.5人。如果按照上文所述方法进行的计算机建模表明化合物与PA亚基或其变体的活性部位结合，则可以合成所述化合物，并且任选可将所述化合物或其药学上可接受的盐与一种或多种药学上可接受的赋形剂和/或载体一起配制。因此，上述方法可包括又一个步骤 (e)合成所述化合物，并任选将所述化合物或其药学上可接受的盐与一种或多种药学上可接受的赋形剂和/或载体一起配制。任选可体外或体内测定所述化合物或其药学上可接受的盐或其制剂调节、优选降低、优选抑制PA亚基或其变体的内切核酸活性的能力，其包括又一个步骤(f)使所述化合物与本发明的PA多肽片段或其变体或重组宿主细胞接触，并测定所述化合物(i)结合活性部位的能力，和/或(ii)调节、降低或抑制PA亚基多肽片段或其变体的内切核酸活性的能力。可通过形状互补性或通过估算的互作用能判断将这类化合物与活性部位拟合的质量(Meng等，1992，J. Comp. Chem. 13 =505-524)。合成所述化合物的方法为本领域技术人员所熟知，或者这类化合物可为市售可获得的。本发明的另一个方面提供通过上述方法鉴定的化合物，其中所述化合物能够调节 PA亚基或其变体的内切核酸酶活性。另一方面，本发明涉及通过上述方法鉴定的化合物，其中所述化合物能够降低、优选抑制PA亚基或其变体(例如本发明的PA亚基多肽或其变体)的内切核酸酶活性。本发明的化合物可以是任何成分，包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂质、金属、核苷酸、核苷、核酸、有机小分子或无机小分子、化合物、元素、糖、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺及其组合物和衍生物。术语“小分子”是指分子量介于50道尔顿和约2，500道尔顿之间的分子，优选范围为 200-800道尔顿。此外，本发明的试验化合物可任选包含可检测标记。这类标记包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在本发明化合物的一个优选的实施方案中，化合物不是4-取代2- 二氧代丁酸、4-取代4- 二氧代丁酸、4-取代2，4- 二氧代丁酸、吡嗪_2，6- 二酮或取代吡嗪_2， 6-二酮，例如flutimide、N-异羟肟酸或N-羟胺(hydroxymide)。具体地讲，本发明的化合物不是下式I的化合物
权利要求
1.一种多肽片段，所述多肽片段包含具有内切核酸酶活性的病毒RNA依赖性RNA聚合酶的PA亚基的氨基端片段，其中所述PA亚基来自属于正黏病毒科的病毒。
2.权利要求1的多肽片段，所述多肽片段是可溶的。
3.权利要求1或2的多肽片段，所述多肽片段是可结晶的。
4.权利要求3 的多肽片段，使用 5-10mg/ml 的 20mM Tris pH 8. OUOOmM NaCl 禾P 2. 5mM MnCl2的蛋白质溶液和由1.2M Li2SO4UOOmM MES pH 6. 0、IOmM乙酸镁和3%乙二醇构成的贮存溶液可使所述多肽片段结晶。
5.权利要求1-4中任一项的多肽片段，其中所述PA亚基来源于甲型流感病毒、乙型流感病毒或丙型流感病毒或者为其变体。
6.权利要求1-5中任一项的多肽片段，其中所述氨基端片段相当于甲型流感病毒RNA 依赖性RNA聚合酶(SEQ ID NO 2)的所述PA亚基的至少1-196位氨基酸。
7.权利要求1-6中任一项的多肽片段，其中将所述多肽片段纯化到适于结晶的程度。
8.权利要求1-7中任一项的多肽片段，其中2个二价阳离子与之结合，其中所述二价阳离子优选为锰。
9.权利要求1-8中任一项的多肽片段及其保持内切核酸酶活性的变体，其中(i)N端等同于或相当于1位氨基酸，C端等同于或相当于选自SEQID NO :2的PA亚基的氨基酸序列的196-209位的氨基酸，(ii)N端等同于或相当于1位氨基酸，C端等同于或相当于选自SEQID NO :4的PA亚基氨基酸序列的195-206位的氨基酸，或(iii)其中N端等同于或相当于1位氨基酸，C端等同于或相当于选自SEQID N0:6的 PA亚基氨基酸序列的178-189位的氨基酸。
10.权利要求1-9中任一项的多肽片段，所述多肽片段由SEQID NO :2所示氨基酸序列的1-209位氨基酸和任选具有氨基酸序列GMGSGMA (SEQ ID NO 19)的氨基端接头组成且具有由图18所示的结构坐标定义的结构。
11.权利要求1-10中任一项的多肽片段，其中所述多肽片段具有空间群为P43212，晶胞大小为 a = b = 6. 71 士0. 2nm, c = 30. ^nm士0. 4nm 的晶型。
12.权利要求10或11的多肽片段，其中所述晶体衍射X射线的分辨率为2.5人或更高、优选2.1人或更高。
13.—种编码权利要求1-12中任一项的分离多肽的分离多核苷酸。
14.一种包含权利要求13的所述分离多核苷酸的重组载体。
15.一种包含权利要求13的所述分离多核苷酸或权利要求14的所述重组载体的重组宿主细胞。
16.一种方法，用于鉴定调节来自正黏病毒科的病毒RNA依赖性RNA聚合酶的PA亚基的内切核酸酶活性的化合物，所述方法包括以下步骤(a)构建活性部位的计算机模型，所述活性部位由图18所示的权利要求10的多肽片段的结构坐标定义；(b)通过选自以下的方法选择潜在的调节化合物(i)将分子片段装配成所述化合物，( )从小分子数据库选择化合物，和(iii)对所述化合物进行从头配体设计；(C)运用计算方法，进行所述化合物与所述活性部位的计算机模型之间的拟合程序运算，从而提供所述化合物在活性部位中的能量最低化构型；和(d)评价所述拟合运算的结果以量化所述化合物与活性部位模型之间的关系，以此评价所述化合物与所述活性部位缔合的能力。
17.权利要求16的方法，其中所述活性部位包含相当于SEQID NO 2的PA亚基的氨基酸Aspl08、Ilel20和Lysl34的氨基酸。
18.权利要求17的方法，其中所述活性部位还包含相当于SEQID NO :2的所述PA亚基的氨基酸His41、Glu80和Glul 19的氨基酸。
19.权利要求17或18的方法，其中所述活性部位还包含相当于SEQID NO 2的所述 PA 亚基的氨基酸 Tyr24、Arg84、Leul06、Tyrl30、Glul33 和 Lysl37 的氨基酸。
20.权利要求16的方法，其中所述活性部位由图18所示的PA亚基SEQID NO 2氨基酸Aspl08、Ilel20和Lysl34的结构坐标定义。
21.权利要求20的方法，其中所述活性部位还由图18所示的PA亚基SEQID NO 2氨基酸His41、Glu80和Glull9的结构坐标定义。
22.权利要求20或21的方法，其中所述活性部位还由图18的PA亚基SEQID N0:2氨基酸 Tyr24、Arg84、Leul06、Tyr 130, Glul33 和 Lysl37 的结构坐标定义。
23.权利要求21的方法，其中PA亚基多肽片段变体的活性部位与所述活性部位的氨基酸Aspl08、Ilel20和LyslM的主链原子的均方根偏差不大于2.5人。
24.权利要求16-23中任一项的方法，其包括以下的另外步骤(e)合成所述化合物，任选将所述化合物或其药学上可接受的盐与一种或多种药学上可接受的赋形剂和/或载体一起配制。
25.权利要求M的方法，其包括以下的另外步骤(f)使所述化合物和权利要求1-12中任一项的所述多肽片段或权利要求15的所述重组宿主细胞接触，测定所述化合物调节所述PA亚基多肽片段的内切核酸酶活性的能力。
26.—种通过权利要求16-25中任一项的方法鉴定的化合物，其中所述化合物能够调节PA亚基或其变体的内切核酸酶活性。
27.一种通过权利要求16-25的方法可鉴定的化合物，其中所述化合物能够抑制权利要求1-12中任一项的PA亚基多肽片段或其变体的内切核酸酶活性。
28.一种用于鉴定调节PA亚基或其多肽变体的内切核酸酶活性的化合物的方法，所述方法包括以下步骤(i)使权利要求1-12的所述多肽片段或权利要求15的所述重组宿主细胞与试验化合物接触，和(ii)分析所述试验化合物调节所述PA亚基多肽片段的内切核酸酶活性的能力。
29.权利要求观的方法，其中对所述试验化合物抑制所述PA亚基多肽片段的内切核酸酶活性的能力进行分析。
30.权利要求观或四的方法，所述方法在高通量背景下进行。
31.权利要求观-30中任一项的方法，其中所述试验化合物是小分子。
32.权利要求观-31中任一项的方法，其中所述试验化合物是肽或蛋白质。
33.权利要求16-25和观-32中任一项的方法，其中所述方法还包括将所述化合物或其药学上可接受的盐与一种或多种药学上可接受的赋形剂和/或载体一起配制的步骤。
34.一种按照权利要求M或33的方法可产生的药物组合物。
35.一种通过权利要求观-33中任一项的方法可鉴定的化合物，其中所述化合物能够调节PA亚基或其变体的内切核酸酶活性。
36.一种通过权利要求观-33中任一项的方法可鉴定的化合物，其中所述化合物能够抑制权利要求1-12中任一项的PA亚基多肽片段或其变体的内切核酸酶活性。
37.一种抗PA亚基或其变体的活性部位的抗体。
38.权利要求37的抗体，其中所述抗体识别SEQID NO :2所示氨基酸序列的长为5和 15个氨基酸的多肽片段，其中所述多肽片段包含一个或更多个选自Tyr24、HiS41、GlU80、 Arg84、Leul06、Aspl08、Glull9、Ilel20、Tyrl30、Glul33、Lysl34 和 Lysl37 的氨基酸残基。
39.权利要求沈、27、35或36的化合物、权利要求34的药物组合物或权利要求37或 38的抗体在制备用于治疗、减轻或预防由正黏病毒科病毒所致病毒感染引起的病况的药物中的用途。
40.权利要求39的用途，其中所述疾病状况由选自甲型流感病毒、乙型流感病毒和丙型流感病毒的病毒引起。
全文摘要
本发明涉及多肽片段，所述多肽片段包含具有内切核酸酶活性的病毒RNA依赖性RNA聚合酶的PA亚基的氨基端片段或其变体，其中所述PA亚基来源属于正黏病毒科的病毒。本发明还涉及(i)适于应用X射线晶体分析法对所述多肽片段进行结构测定的多肽片段的晶体，和(ii)利用所述多肽的结构坐标筛选和设计调节、优选抑制多肽片段内的内切核酸活性部位的化合物的计算方法。此外，本发明涉及优选在高通量背景下鉴定与具有内切核酸酶活性的PA多肽片段结合、优选抑制所述内切核酸活性的化合物的方法。本发明还涉及化合物和包含所鉴定的化合物的药物组合物用于治疗由正黏病毒科病毒引起的病毒感染所致疾病。
文档编号C12N9/12GK102449144SQ200980157310
公开日2012年5月9日申请日期2009年12月18日优先权日2008年12月19日
发明者A·迪亚斯, D·布维耶, R·吕格罗克, S·库萨克, T·克雷潘申请人:欧洲分子生物学实验室, 法国国家科学研究中心，产业政策部, 约瑟夫傅立叶附属大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D·布维耶;T·克雷潘;R·吕格罗克;A·迪亚斯;S·库萨克
技术所有人：欧洲分子生物学实验室;约瑟夫傅立叶附属大学;法国国家科学研究中心，产业政策部
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。