能够结合rna帽的流感病毒pb2蛋白可溶性片段的制作方法

文档序号：1146241阅读：356来源：国知局

专利名称：能够结合rna帽的流感病毒pb2蛋白可溶性片段的制作方法
技术领域：
本发明涉及流感病毒RNA依赖性RNA聚合酶亚基PB2的可溶性片段及其变体，及其包含RNA帽(RNA cap)类似物的结晶复合物。本发明还涉及使用所述复合物的结构坐标来筛选和设计与RNA帽结合口袋(RNA cap binding pocket)相互作用之化合物的计算方法。另外，本发明涉及通过使用PB2多肽片段来鉴定(优选以高通量形式鉴定)与包含RNA 帽结合口袋的PB2多肽片段相结合(优选抑制与RNA帽或其类似物的相互作用)之化合物的方法。本发明还涉及用于治疗由负链单链RNA病毒引起的病毒感染疾病状况的包含所鉴定化合物的化合物和药物组合物。
背景技术：
流行性感冒在世界范围内导致很高的发病率和死亡率，被许多人认为是对人类来说最为重要的病毒威胁。每年流行性感冒席卷全球，偶见的新毒株导致破坏力巨大的大范围流行。目前，控制流感病毒的主要方法是接种疫苗。但是，很快产生避开接种疫苗作用的突变流感病毒。由于产生新的流感疫苗需要约6个月，所以尤其需要替代性治疗方法(即抗病毒药物)来作为对抗迅速传播的大流行的第一道防线。开发抗病毒药物的一个很好的出发点是病毒必需蛋白的结构数据。因此，对流感病毒表面抗原神经氨酸酶的晶体结构测定(von Itzstein等，1993)直接导致开发出了具有抗病毒活性的神经氨酸酶抑制剂，其阻止病毒从细胞释放，但是不阻止病毒产生。这些药物及其衍生物随后被开发成抗流感药物扎那米韦(Glaxo)和奥司他韦(Roche)，许多国家都储备它们用作对抗万一发生的大流行的第一道防线。但是，这些药物仅仅提供临床疾病持续时间的缩短。或者，其它抗流感化合物例如金刚烷胺和金刚乙胺靶向病毒包膜中的离子通道蛋白，即M2蛋白，干扰病毒在细胞内部的脱壳。但是，由于其副作用和抗性病毒突变株的迅速产生，它们尚未被广泛应用(Magden等，2005)。另外，更加非特异性的病毒药物 (例如利巴韦林)已经显示出可用于治疗流感感染(Eriksson等，1977)。但是，可能由于严重的副作用，利巴韦林仅在少数国家得到批准(Furuta等，2005)。显然，需要新型抗病毒化合物，其优选针对不同的靶标。流感病毒以及索戈托病毒(Thogotovirus)属于正粘病毒科 (Orthomyxoviridae),其与布尼亚病毒禾斗(Bunyaviridae)(包括汉坦病毒(Hantavirus)、 P^^'MM (Nairovirus)(Orthobunyavirus)禾口(Phlebovirus)) 都是负链RNA病毒。它们的基因组是分段的，并作为核蛋白微粒，其包含RNA依赖性RNA聚合酶，其进行(i)最初将单链病毒体RNA(vRNA)复制为病毒mRNA以及(ii)vRNA复制。对于病毒mRNA的产生来说，所述聚合酶利用所谓的“帽攫取(cap-snatching)”机制(Plotch 等，1981 ；Kukkonen 等，2005 ；Leahy 等，1997 ；Noah and Krug，2005)。其与细胞mRNA 分子的 5' RNA帽结合，并将RNA帽与一段核苷酸一起切割下来。加帽的RNA片段用作病毒mRNA 合成的引物。所述聚合酶由三个亚基构成PB1 (聚合酶碱性蛋白)、PB2和PA。PBl具有核酸内切酶和聚合酶活性，而PB2含有RNA帽结合结构域。
所述聚合酶复合物似乎是合适的抗病毒药物靶标，因为其对于病毒mRNA的合成和病毒复制来说是必需的，并含有几个很可能显著区别于宿主细胞蛋白质中的功能性活性位点(Magden等，2005)。因此，例如，尝试了通过类似于PBl内PA结合结构域的25个氨基酸的肽干扰聚合酶亚基的装配(Ghanem等，2007)。此外，已靶向了所述聚合酶的核酸内切酶活性，并已鉴定出一系列4-取代的2，4-二氧代丁酸化合物作为流感病毒中此活性的选择性抑制剂(Tomassini等，1994)。另外，氟他胺(在真菌Delitschia confertaspora的提取物中鉴定到的取代的2，6_ 二酮哌嗪)已经显示出抑制流感病毒的核酸内切酶(Tomassini 等，1996)。此外，也已经尝试了通过核苷类似物干扰病毒转录，例如2'-脱氧-2'-氟鸟苷(Tisdale等，1995)，并已经显示T-105(取代的吡嗪化合物)可用作流感病毒RNA聚合酶的特异性抑制剂(Furuta等，2005)。最后，通过对人帽结合蛋白eIF4E与RNA帽结构之间结合模式与流感病毒RNP与RNA帽结构相互作用的比较研究，Hooker等(2003)鉴定出与流感病毒选择性相互作用但是不与人帽结合蛋白相互作用的新型帽类似物。但是，目前为止，鉴定与PB2的RNA帽结合口袋相互作用并且可能干扰RNA帽结合并由此干扰RNA聚合酶活性的化合物的主要障碍在于，所述结合口袋的结构和身份是未知的。
已经有一些努力试图阐明RNA帽结合位点，但是结果有争论。交联实验显示，PB2 的两个独立的序列(一个临近N端(242-282)的区段，一个临近C端(538-577)的区段) 组成流感病毒RNA聚合酶的RNA帽结合位点(Honda等，1999)。另外的交联实验鉴定了 PB2 蛋白亚基中从533位氨基酸至564位氨基酸的序列(特别是氨基酸残基Trp552)作为RNA 帽的潜在相互作用位点(Li等，2001)。此外，突变分析得到PB2中的潜在RNA帽结合氨基酸残基 Phe363 和 Phe404 (Fechter 等，2003)。本发明的一个目的是(i)通过X射线晶体衍射提供RNA帽结合口袋的高分辨率结构数据，( )提供鉴定可结合PB2的RNA结合口袋(优选与RNA帽结合竞争并由此干扰 RNA聚合酶活性)的化合物的计算机和体外方法，优选高通量形式，以及(iii)提供针对由利用帽攫取机制合成病毒mRNA的病毒所致感染性疾病的包含这些化合物的药物组合物。本发明使得第一次可以对独立折叠的结构域中PB2RNA帽结合位点进行精确定义。迄今为止，对于所述位点可能位于哪里还有很多争论。通常认为功能性帽结合位点需要全部三个聚合酶亚基，可能还需要病毒RNA (Cianci等，1995 ；Li等，2001)。本发明人出人意料的成果是重组产生包含RNA帽结合口袋的可溶性PB2多肽片段，这使得能够使用易于从直接表达系统得到的材料对流感病毒聚合酶功能性位点的抑制剂进行体外高通量筛选。之前对帽结合抑制剂的工作已经使用了例如从流感病毒体中纯化的完整核糖核蛋白颗粒(Hooker等，2003)。此外，通过提供PB2内RNA帽结合口袋的详细结构坐标，本发明人使得可以使用基于结构的帽结合抑制剂设计方法，即计算机(in silico)筛选并导致最优化。

发明内容
在第一方面中，本发明涉及可溶性多肽片段，其中所述多肽片段(i)来源于流感病毒RNA依赖性RNA聚合酶亚基PB2或其变体，并且(ii)能够结合RNA帽或其类似物。在另一个方面中，本发明涉及包含本发明可溶性多肽片段以及RNA帽或其类似物的复合物。在又一个方面中，本发明涉及编码本发明分离可溶性多肽片段的分离的多核苷酸。
在另一个方面中，本发明涉及包含本发明分离多核苷酸的重组载体。在另一个方面中，本发明涉及包含本发明分离多核苷酸或者本发明重组载体的重组宿主细胞。在又一个方面中，本发明涉及用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法，其包括以下步骤(a)构建如图18所示本发明复合物的结构坐标所定义的所述结合口袋的计算机模型；(b)通过选自下组的方法选择潜在的结合化合物(i)将分子片段组装成所述化合物，(ii)从小分子数据库中选择化合物，和(iii)对所述化合物进行配体的从头设计；(c)利用计算机方法进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算，以提供所述化合物在所述结合口袋中能量最低的构型；以及(d)评价所述拟合运算的结果来对所述化合物和所述结合口袋模型之间的结合进行定量，其中对所述化合物与所述结合口袋相结合的能力进行评价。在又一个方面中，本发明涉及可通过本发明计算机方法鉴定的化合物，前提为所述化合物不是 m7G> m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羟基丁基)_1，9- 二氢嘌呤 _6_ 酮或 T-705，并且能够结合PB2或其变体的RNA帽结合口袋。在又一个方面中，本发明涉及可通过本发明计算机方法鉴定的化合物，前提为所述化合物不是 m7G> m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羟基丁基)_1，9- 二氢嘌呤 _6_ 酮或 T-705，并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。在另一个方面中，本发明涉及鉴定与PB2的RNA帽结合口袋或PB2多肽变体的结合口袋相结合的化合物的方法，包括以下步骤(i)将本发明的多肽片段或本发明的重组宿主细胞与测试化合物相接触，以及(ii)分析所述测试化合物结合PB2的能力。在又一个方面中，本发明涉及可根据本发明的体外方法产生的药物组合物。在又一个方面中，本发明涉及可通过本发明体外方法鉴定的化合物，前提为所述化合物不是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羟基丁基)_1，9- 二氢嘌呤 _6_ 酮或 T-705，并且能够结合PB2多肽、其变体或其片段。在另一个方面，本发明涉及可通过本发明的体外方法鉴定的化合物，前提为所述化合物不是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羟基丁基)_1，9- 二氢嘌呤 _6_ 酮或 T-705，并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。在另一个方面中，本发明涉及针对PB2的RNA帽结合结构域的抗体。在又一个方面中，本发明涉及本发明化合物、本发明药物组合物或本发明抗体在制备用于治疗、改善或预防负链ssRNA病毒感染所引起疾病的药物中的用途。

图1显示了具有与流感病毒聚合酶PBl亚基之潜在结合位点以及现有技术所预测的潜在RNA帽结合位点(Cap-N/Cap-C参见Honda等(1999)，Cap-C (Trp552)参见Li等 (2001)，Cap-M参见Fechter等(2003))的全长PB2。另外，显示了为进行细菌表达而产生的PB2片段。所有这些构建体均以高水平表达并且是可溶性的。从上到下显示了由13个分离的克隆编码的PB2片段的长度，其编码7个独特的PB2片段。所分离的克隆跨越SEQ ID NO 25的以下核苷酸克隆68:886位至1449位，克隆16:871至1452位，克隆15:871 至1452位，克隆57:844至1449位，克隆13:844至1449位，克隆10832至1443位，克隆 28:805 至 1452 位，克隆 23:805 至 1452 位，克隆 12:723 至 1425 位，克隆 4:706 至 1491 位，克隆30:706至1491位，克隆07:706至1491位，以及克隆05:706至1491位。
图2A显示了在Superdex 75凝胶过滤柱上纯化PB2多肽片段318位至483位氨基酸的示意图。将以任意单位(arbitrary unit)计的280nm吸光度对洗脱时间和级分号作图。图2B显示凝胶过滤之后PB2多肽片段(318位至483位氨基酸)的级分24_34的考马斯染色的SDS PAGE凝胶。分子量标准品具有以下大小116-66. 2-45-35-25-18. 4和 14. 4kD。图3A显示使用沉淀溶液1. 6M甲酸钠、0. IM柠檬酸pH 4. 6形成的与m7GTP (5mM) 形成复合物的PB2多肽片段(318位至483位氨基酸)的天然结晶。图3B显示了使用沉淀溶液1. 6M甲酸钠、0. IM柠檬酸pH 4. 6与m7GTP (5mM)形成复合物的部分硒代甲硫氨酸化PB2多肽片段(318位至483位氨基酸)的结晶。图4显示在欧洲同步加速器辐射设施(European SynchrotronRadiation Facility)以光束线BM14在天然晶体上获得的X射线衍射图样。衍射图样指标位于空间群 C2221，晶胞大小为a = 92. 2，b = 94. 4，c = 220. 4埃。右上插图显示衍射扩展至2. 4埃解析度。右下插图显示用于数据收集的冷冻晶体，其大小约为15Χ15Χ50μπι3。图5显示与Hi7GTP形成复合物的ΡΒ2多肽片段(318至483位氨基酸)结构的带状图。根据DSSP计算标出二级结构元件(Holm，L和Sander，C.，1993)，深灰色为α螺旋，浅灰色为β链。GTP以球棒模型显示，如Phe323、Phe404和His357的侧链。标出了以348 和420位为中心的重要的环，如在该结构中可见N端和C端残基(分别为320和483位)。图6显示与Hi7GTP形成复合物的PB2多肽片段(318至483位氨基酸)结构的另一视图，显示420-环伸入溶剂中。图7显示被形成PB2中RNA帽结合口袋的一些氨基酸所围绕的Hi7GTP的构象和无偏实验性电子密度。所述电子密度对应于使用实验相和在0.95 ο处等高的非晶体学对称平均化通过RESOLVE获得的图像。图8显示包埋于PB2中具有潜在相互作用原子的RNA帽结合口袋中的帽类似物 m7GTP。推定氢键由虚线表示。图9显示来自甲型流感病毒(Influenza Α)(毒株A/Victoria/3/1975)和乙型流感病毒(毒株B/Lee/40)的PB2RNA帽结合结构域的氨基酸序列比对。在序列比对上方显示 A/Victoria/3/1975 的二级结构(由 DSSP(Holm 和 Sander, 1993)计算)。使用ESPRIPT(http://espript. ibcp. fr/ESPript/cgi-bin/ESPript. cgi)对基于结构的序列比对进行作图。实心黑色背景上的残基在两个序列中是相同的。三角表示与帽类似物Hi7GTP 相互作用的主要残基。图10显示来自甲型流感病毒(Influenza Α)(毒株A/Victoria/3/1975)、乙型流感病毒(毒株B/Lee/40)和丙型流感病毒(毒株Ann Arbor/1/50)的PB2RNA帽结合结构域的氨基酸序列比对。注释同图9。图11显示了 RNA帽类似物Hi7GTP与PB2内RNA帽结合口袋之间的相互作用。帽类似物Hi7GTP (标记为M7G)以深灰色条绘制，蛋白质残基以中等灰色条绘制，水分子以浅灰色圆绘制。氢键以虚线显示，供体和受体之间的距离以埃计。深灰色圆的细线条部分显示与配体发生范德华力接触的残基。该图对应于坐标文件中具有B链的分子。非对称单元中的四个其它分子(A、B、D和F链)给出相似的图，在距离和水的位置上略有差异。该图使用 LIGPLOT(Wallace 等，1995)制成。图12显示在4°C下与Hi7GTP Sepharose 4B树脂结合之后，所示野生型和单点突变 PB2帽结合结构域洗脱结果的考马斯染色SDS PAGE凝胶。在野生型蛋白发生结合的条件下，突变体 E361A、F404A、H357A 和 K376A 无法与 m7GTP S印harose 4B 树脂结合，而 F323A 有弱的残余结合活性，F325A几乎与野生型一样与树脂结合，但是，此结合活性在37°C下显著降低(见表3)。还制备了 H357W突变体，因为甲型和乙型流感病毒在此位置具有此残基。可溶性地纯化此突变体，发现与Hi7GTP Sepharose 4B树脂的结合与野生型相比略微增强。突变体八州通过将残基￥&1421-6111426替换为三个甘氨酸(420-环)来产生，并显示帽结合活性。图13显示野生型或突变体重组聚合酶复合物的帽结合活性。将HEK293T细胞培养物共转染表达PBl和ΡΑ(Φ)的质粒，或者共转染表达ΡΒ1、PB2-His或其突变体以及PA 的质粒。通过在4°C下使用m 7GTP-S印harose的下拉测定(pull down)分析细胞提取物。通过使用PA特异性抗体的Western印迹显示保留并被Hi7GTP洗脱的聚合酶复合物。IN和 E分别表示输入细胞提取物和洗脱蛋白。PA特异性条带的位置在右侧标出，分子量标准品的移动在左侧显示。突变体八州通过将残基￥￡11421-6111426替换为三个甘氨酸(420-环) 来产生。图14显示野生型或突变体聚合酶的复制活性。在体内重构野生型和突变体微RNP 并使用Ni2+-NTA-琼脂糖通过亲和色谱进行纯化。通过使用抗PA和抗NP抗体的Western印迹测定后代RNP的累积。数据以野生型值的百分比显示，为两个实验的平均值和范围。突变体八￥0通过将残基￥&1421-6111426替换为三个甘氨酸(420-环)来产生。图15显示纯化的野生型或突变体RNP使用ApG作为引物的体外转录活性。数据显示为两个实验的平均值和范围。突变体八州通过将残基￥&1421-6111426替换为三个甘氨酸(420-环)来产生。图16显示纯化的野生型或突变体RNP使用β -珠蛋白mRNA作为引物的体外转录活性。数据显示为两个实验的平均值和范围。突变体八州通过将残基￥&1421-6111426替换为三个甘氨酸(420-环)来产生。图17显示纯化的野生型或突变体RNP的ApG依赖性与β -珠蛋白mRNA依赖性体外转录活性的比值。数据显示为两个实验的平均值和范围。突变体AVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图18列举了具有Lys389的SEQ ID NO. 1PB2多肽片段318位至483位氨基酸的精细原子结构坐标。该片段具有SEQ ID NO :11的氨基酸序列，其与RNA帽类似物7-甲基-鸟苷三磷酸(m7GTP)形成复合物。具有链A、B、D、E、F的不对称单元中有5个分子。RNA帽类似物Hi7GTP是每个链的第一个残基。有293个水分子。文件头给出了有关结构精细化的信息。“Atom”指其坐标被测定的元素。该列中的第一个字母定义元素。给出各个氨基酸的三字母代码以及氨基酸序列位置。“Atom”列中的前3个值定义所测元素的原子位置。第四个值对应于占位率(occupancy)，第五个(最后一个)值是温度因子(B因子)。占位因子指分子中每个原子占据以坐标表示之位置的比例。值为“1”表示各个原子在晶体的所有分子中均具有相同的构象，即相同位置。B是温度因子，其度量原子围绕其原子中心的运动。在标记为“ANIS0U”的列中给出各向异性温度因子。此命名对应于PDB文件格式。发明详述在下文对本发明详细描述之前，应理解本发明不局限于本文所述的具体方法、方案和试剂，因为它们可发生变化。还应理解，本文所用术语仅用于描述具体的实施方案，而不意欲限制本发明的范围，本发明的范围仅仅由所附加权利要求限定。除非另外定义，否则本发明中所有的技术和科学名词具有与本发明所属领域技术人员通常所理解相同的含义。优选地，本文所用术语如‘‘Amultilingual glossary of biotechnologicalterms (IUPAC Recommendations) " , H. G. W. Leuenberger, B. Nagel 禾口 H. KSlbl编辑，Helvetica Chimica Acta, CH-4010Basel, Switzerland, (1995)中所述。在本说明书及其权利要求书通篇中，除非上下文另有要求，否则“包含”这一用语及其变化例如“包括”和“含有”应理解为表示包含所述整体、步骤或者整体或步骤的组，但是不排除任何其它的整体、步骤或者整体或步骤的组。在本说明书中引用了一些文献。本文所引用的每个文献(包括所有专利、专利申请、科技出版物、制造商说明、说明书等)，不论上文所述或下文所述，都通过引用以整体并入本文。本文中的任何内容均不视作认可本发明不能由于在先发明而早于这些公开内容。术语“多肽片段”指单个氨基酸链构成的蛋白质的一部分。术语“蛋白质”包括呈现二级和三级结构的多肽片段，还指由形成四级结构的数个氨基酸链(即数个亚基)组成的蛋白质。术语“肽”指最多50个氨基酸的短氨基酸链，其不一定呈现二级或三级结构。 “拟肽”是由N-取代的甘氨酸寡聚装配产生的肽类似物。如果两个或多个多肽中的残基在多肽结构中占据类似的位置，则所述残基称为彼此“对应”。如现有技术中公知的，两个或多个多肽中的类似位置可基于氨基酸顺序或结构相似性通过多肽序列比对来确定。这样的比对工具对本领域技术人员来说是公知的，可以例如获得自万维网(WouldWide Web)，例如使用标准设置的Clustalff (www, ebi. ac. uk/clustalw)或 Align(http//www, ebi. ac. uk/emboss/align/index, html),优选 AlignEMBOSS: :needle, Matrix :Blosum62，缺口打开 10. 0，缺口延伸 0. 5。本领域技术人员理解，为产生满意的比对，可能需要在序列中引入缺口。例如，甲型流感病毒PB2亚基中的 220至510位残基分别对应于乙型和丙型流感病毒PB2亚基中的222至511位残基和227 至528位残基。这样产生的对三个PB2亚基的比对在图10中显示。如果两个或更多流感病毒PB2亚基中的残基在最佳序列比对中对齐，则称其为“对应”。两个多肽之间的“最佳序列比对”定义为产生最大数量对齐的相同残基的比对。如果两个比对序列的序列相似性 (优选同一性)在10、20或30个氨基酸的长度上降至低于30%，优选低于20%，更优选低于10%，更优选在10、20或30个氨基酸的长度上低于30%，则"最佳序列比对区域"结束并由此确定为测定相似性分数的比较序列的长度边界。甲型(315至498位aa)、乙型(317 至499位aa)和丙型(327至516位aa)流感病毒PB2亚基的最佳序列比对部分显示于图 9 禾口 10。本发明包括流感病毒RNA依赖性RNA聚合酶PB2亚基的可溶性片段，其能够结合 RNA帽或其类似物。术语“RNA依赖性RNA聚合酶亚基PB2”优选表示甲型流感病毒、乙型流感病毒和丙型流感病毒的PB2，优选具有SEQ ID NO :1、2或3所示的氨基酸序列。“RNA依赖性RNA聚合酶亚基PB2变体”与SEQ ID NO :1、2或3所示氨基酸序列使用最佳序列比对在整个片段的长度上和/或在最佳序列比对区域上具有至少60%、65%、70%、80%、81%、 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%, 96%,97 %、98%、99 %序列相似性，优选序列同一性，其中所述最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: :needle，Matrix :Blosum62，缺口打开10. 0，缺口延伸0.5。优选地，当天然PB2变体与SEQ ID NO :1、2或3的PB2亚基比对时，比对在两个蛋白质的全长上进行，因此在此基础上确定比对得分。但是，有可能天然变体可包含C端/N端或内部的缺失或添加，例如通过N端或C端的融合。在此情况下，仅将最佳比对区域用于分别评估相似性和同一性。优选地，并且如下文详细描述地，来源于这些变体的可溶性片段分别显示所示相似性和同一性，优选在RNA帽结合所需的区域内。因此，SEQID NO :1、2或3与PB2变体之间的任意比对应优选包含RNA帽结合口袋。因此，上述序列与SEQ ID N0:l、2或3的相似性和同一性分别至少对应于 100、110、120、130、140、150、160、165、170、180、190、200、210、 220、230、240、250、300或更多个氨基酸的长度，优选包含RNA帽结合口袋。因此，在一个优选实施方案中，RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO :1在100个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID吣1在110个氨基酸的长度上具有至少60%、65%、70%、80%、81%、 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%, 96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO :1在120个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID NO :1在130个氨基酸的长度上具有至少60%、65%、70%、80%、 81 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%, 95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO :1在140个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID N0:1在150个氨基酸的长度上具有至少60%、65%、70%、 80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO 1在160个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、 86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID N0:1在165个氨基酸的长度上具有至少60%、65%、 70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO 1 在170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID NO :1在180个氨基酸的长度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO :1在190个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :1在200个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :1 在 210 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :1在220个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :1 在 230个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :1在240个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :1 在 250 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :1在300个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性。
在一个优选实施方案中，RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO 2 在100个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID NO 2在110个氨基酸的长度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO :2在120个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 2在130个氨基酸的长度上具有至少91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2在 140个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :2在150个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2 在 160 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 2在165个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2在 170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 2在180个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2 在 190 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :2在200个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2 在 210 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 2在220个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2 在 230个氨基酸的长度上具有至少 60%、65%、70%、80% 、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :2在240个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :2 在 250 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 2在300个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性。
在一个优选实施方案中，RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO 3 在100个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，与SEQ ID NO :3在110个氨基酸的长度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与SEQ ID NO :3在120个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :3在130个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3在 140个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%, 95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :3在150个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3 在 160 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :3在165个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3在 170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 3在180个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3在 190 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :3在200个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3 在 210 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 3在220个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQ ID NO :3 在 230个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO :3在240个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，与 SEQID NO :3 在 250 个氨基酸的长度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性，优选序列同一性，与SEQ ID NO 3在300个氨基酸的长度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性。SEQ ID NO :1、2或3的大量天然PB2序列变体是已知的，并已记载于文献中。所有这些PB2变体均包括在内，并可以是本发明可溶性片段的基础。对于甲型流感病毒，如果SEQ ID NO :1用作参考序列的话，优选实例包含一个或多个下列氨基酸位置的突变 Val227、Arg251、Ile255、Ser271、Gln288、Ile338、Val344、Arg355、Ile373、Leu374、Asn456、 Val 461和/或Ser497。在一个优选实施方案中，所述变体包含下列突变中的一个或多个Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、Gln288Leu、Ile338Val、 Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Asn456Ser、Val461Ile 和 / 或 Ser497Asn0优选的甲型流感病毒PB2亚基变体包含导致氨基酸从精氨酸变成赖氨酸的389 位突变(例如SEQ ID NO :11)，其任选地与上述突变中的一个或多个相组合。如果SEQID NO 2用作参考序列的话，乙型流感病毒PB2亚基的优选变体包含一个或多个下列氨基酸位置的突变Thr254、Met261、Ile269、Thr30U Ile303、Leu319、Ile346、Lys380、Arg382、 Met383、Lys385、Lys397、Asn442、Ser456、Glu467、Leu468 和 / 或 Thr494。在一个优选实施方案中，PB2亚基变体包含下列突变中的一个或多个Thr254Ala、Met261Thr、Ile269Val、 Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、Lys380Gln、Arg382Lys、Met383Leu、 Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、Glu467Gly、Leu468Ser 和 / 或 Thr494Ile。如果SEQ ID NO 3用作参考序列的话，乙型流感病毒PB2亚基的优选变体包含下列一个或多个氨基酸位置的突变Leu311、Pro330和/或Ser436。在一个优选实施方案中，所述突变为:Leu311Pro,Pro3 30Gln 和 / 或 Ser436Thr0因此，本发明可溶性片段基于如上定义的RNA依赖性RNA聚合酶亚基PB2或其变体。因此，在下面的说明中，术语“可溶性多肽片段”和“PB2多肽片段”均包括来自SEQ ID NO :1、2或3所示PB2蛋白的片段以及来自如上所述其PB2蛋白变体的片段，其能够结合RNA 帽或其类似物。但是，本说明书也使用术语“PB2多肽片段变体”或“PB2片段变体”具体表示来自RNA依赖性RNA聚合酶亚基PB2变体的能够结合RNA帽或其类似物的可溶性PB2片段。因此，本发明的可溶性PB2片段优选包含天然流感病毒亚基PB2的序列、基本由其组成或者由其组成。但是，也认为？82片段变体还含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 或更多个氨基酸位置处的氨基酸取代，并在使用最佳序列比对的全长上和/或在最佳序列比对区域中与SEQ ID NO :1、2或3所示氨基酸序列具有至少60%、65%、70%、80%、81%、 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%, 97%,98%,99%的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: :needle、Matrix :Blosum62、缺口打开 10. 0、缺口延伸0. 5。应理解，本发明的PB2片段可包含不来自于PB2的其它氨基酸，例如标签、酶等等，在此类比对中不考虑这些其它氨基酸，即在比对得分的计算中将其排除在外。在一个优选实施方案中，在将片段序列与SEQ ID而1、2或3比对时在至少100、110、120、 130、140、150、160、165、170、180、190、200、210、220、230、240、250、260 或 270 个氨基酸的长度上获得上述比对分数，其中SEQ IDNO :1、2或3的各自序列优选包含RNA帽结合口袋。在一个优选实施方案中，可溶性PB2多肽片段变体包含至少对应于甲型流感病毒PB2的323至404位氨基酸残基(SEQ ID NO 13)的氨基酸残基，或者由其组成，并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID N0:13所示氨基酸序列具有至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS :needle. Matrix :Blosum62、缺口打开10. 0、缺口延伸0. 5，更优选所述PB2多肽片段变体包含至少对应于甲型流感病毒PB2的318至483位氨基酸残基(SEQ ID NO :11)的氨基酸残基，并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQID NO 11所示氨基酸序列具有至少70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: needle、Matrix :Blosum62、缺口打开10. 0、缺口延伸0. 5，更优选所述 PB2多肽片段变体包含至少对应于甲型流感病毒PB2的235至496位氨基酸残基(SEQ ID NO 4)的氨基酸残基，并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ IDNO :4所示氨基酸序列具有至少60%、更优选65%、更优选70%、更优选75%、更优选 80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: :needle. Matrix Blosum62、缺口打开10. 0、缺口延伸0. 5，更优选所述PB2多肽片段变体包含至少对应于甲型流感病毒PB2的220至510位氨基酸残基的氨基酸残基，并且与SEQ ID NO=I中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60%、更优选 65%、更优选 70%、更优选 75%、更优选 80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选 EMBOSS: :needle、Matrix :Blosum62、缺口打开 10. 0、缺口延伸 0. 5。在一些优选实施方案中，本发明的甲型流感病毒PB2多肽片段变体与SEQ ID NO :1相比包含突变，优选天然突变，例如下列氨基酸残基中一个或多个的突变Val227、Arg251、Ile255、Ser271、Gln288、 Ile338、Val344、Arg355、Ile373、Leu374、Lys389、Asn456、Val 461 和 / 或 Ser497。在一些优选实施方案中，所述突变如下Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、 Gln288Leu、Ile338Val、Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Lys389、 Asn456Ser、Val461Ile和/或Ser497Asn。甲型流感病毒PB2亚基片段的一个优选变体包含导致氨基酸由精氨酸变成赖氨酸的389位突变(例如SEQ ID NO 11)，其任选地与一个或多个前述突变相组合。在一个优选实施方案中，PB2多肽片段变体包含至少对应于乙型流感病毒PB2的 325至406位氨基酸残基(来自于SEQ ID NO 2)的氨基酸残基，或者由其组成，并且与SEQ ID NO 2所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: :needle. Matrix Blosum62、缺口打开10. 0、缺口延伸0. 5，更优选地，所述PB2多肽片段变体包含至少对应于乙型流感病毒PB2的320至484位氨基酸残基(来自于SEQ ID NO 2)的氨基酸残基，并且与SEQ ID NO :2所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少 70%，更优选 75%，更优选 80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: :needle,Matrix :Blosum62、缺口打开 10. 0、缺口延伸 0· 5，更优选地，所述PB2 多肽片段变体包含至少对应于乙型流感病毒PB2的237至497位氨基酸残基(来自于SEQ ID NO 2)的氨基酸残基，并且与SEQ ID NO :2中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60 %，更优选65 %，更优选70 %，更优选75 %，更优选 80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如Align，其使用标准设置，优选EMBOSS: meedle、Matrix Blosum62、缺口打开10. 0、缺口延伸0. 5，更优选地，所述PB2多肽片段变体包含至少对应于乙型流感病毒PB2的222至511位氨基酸残基(来自于SEQ ID NO 2)的氨基酸残基，并且与SEQ ID NO :2中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60%，更优选65%，更优选70%，更优选75%，更优选80%、81%、82%、83%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99 %的序列相似性，优选序列同一性，其中最佳序列比对可使用本领域已知工具获得，例如 Align，其使用标准设置，优选 EMBOSS: :needle、Matrix :Blosum62、缺口打开 10. 0、缺口延伸0.5。。在一些优选实施方案中，本发明的乙型流感病毒PB2多肽片段变体与SEQ ID NO 2相比包含下列氨基酸残基中一个或多个的突变，优选天然突变Thr254、Met261、Ile269、 Thr301、Ile303、Leu319、Ile346、Lys380、Arg382、Met383、Lys385、Lys397、Asn442、Ser456、 Glu467、Leu468和/或Thr494。在一些优选实施方案中，所述片段变体包含一个或多个下列突变Thr254Ala、Met261Thr、Ile269Val、Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、 Lys380Gln、Arg382Lys、Met383Leu、Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、 Glu467Gly、Leu468Ser 和 / 或 Thr494Ile。在一个优选实施方案中，所述PB2多肽片段变体包含至少对应于丙型流感病毒 PB2的335至416位氨基酸残基(来源于SEQ ID NO 3)的氨基酸残基或由其组成，并且在片段全长上与SEQ ID NO :3所示氨基酸序列具有至少80%，优选85%，更优选90%，最优选 95%的序列相似性，更优选地，所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的 330至501位氨基酸残基(来源于SEQ ID NO 3)的氨基酸残基，并且在片段全长上与SEQ ID NO 3所示氨基酸序列具有至少70 %，更优选75 %，更优选80 %，优选85 %，最优选90 % 的序列相似性，更优选地，所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的242 至514位氨基酸残基(来源于SEQ ID NO :3)的氨基酸残基，并且在片段全长上与SEQ IDNO 3所示氨基酸序列具有至少60 %，更优选65 %，更优选70 %，更优选75 %，更优选80 %，优选85 %，最优选90 %的序列相似性，更优选地，所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的227至528位氨基酸残基(来源于SEQ ID NO 3)的氨基酸残基，并且在片段全长上与SEQ ID NO: 3所示氨基酸序列具有至少60%，更优选65%，更优选70%，更优选75 %，更优选80 %，优选85 %，最优选90 %的序列相似性。在一些优选实施方案中，本发明的丙型流感病毒PB2多肽片段变体与SEQID NO 3相比包含突变，优选天然突变，例如一个或多个下列氨基酸残基的突变Leu311、Pro330和/或Ser436。在一个优选实施方案中，所述片段变体包含一个或多个下列突变Leu311Pro、Pro330Gln和/或Ser436Thr。术语“序列相似性”表示最佳序列比对中相同位置处的氨基酸相同或相似，优选相同。“相似氨基酸”具有相似的特征，例如极性、溶解度、亲水性、疏水性、电荷或者大小。相似氨基酸优选为亮氨酸、异亮氨酸和缬氨酸；苯丙氨酸、色氨酸和酪氨酸；赖氨酸、精氨酸和组氨酸；谷氨酸和天冬氨酸；甘氨酸、丙氨酸和丝氨酸；苏氨酸、天冬酰胺、谷氨酰胺和甲硫氨酸。本领域技术人员非常了解序列相似性检索工具，例如可从万维网(World Wide Web) 获得(例如 www, ebi. ac. uk/Tools/similarity, html)。本文所用的术语“可溶”表示在生理等渗条件(例如0. 14M氯化钠或蔗糖)下，在蛋白质浓度高达5mg/ml时，不含有效浓度变性剂(例如胍或尿素)的水性缓冲液中以 IOOOOOXg离心30分钟后保留在上清液中的多肽片段。检测其溶解度的蛋白质片段优选在下文所述细胞表达系统之一中表达。特别优选地，这些蛋白质片段的表达(优选还有纯化)如下文实施例2中更详细描述地那样进行。涉及多肽时，术语“纯化的”不需要是绝对纯化的，例如均一制备物，而是表示所述多肽相对于自然环境中来说相对更纯。通常，纯化的多肽基本上不含其它蛋白质、脂类、碳水化合物或与其天然相关的物质，优选为功能显著性水平，例如至少85%纯，更优选至少95%纯，最优选至少99%纯。表述“纯化至适于结晶的程度”指蛋白质的纯度为85%至 100%，优选90%至100%，更优选95%至100%，并可浓缩至高于3mg/ml，优选高于IOmg/ ml，更优选高于18mg/ml，而没有沉淀。本领域技术人员可使用蛋白质纯化的标准技术来纯化多肽。基本纯化的多肽会在非还原性聚丙烯酰胺凝胶上产生单个主要条带。在使用本发明方法鉴定化合物的上下文中使用的术语“相结合”表示部分(即化学实体或化合物或其部分或片段)与PB2的结合口袋之间接近的状态。所述结合可以是非共价的，即例如氢键、范德华力、静电或疏水性相互作用在能量上有利于接近，或者也可以是共价的。术语“RNA帽”指可见于mRNA分子5'端的帽结构，其由通过非常见5'至5'三磷酸键连接到mRNA的鸟苷酸组成。此鸟苷在7位甲基化。其它修饰包括mRNA 5'端前三个核糖中2'羟基的可能的甲基化。“RNA帽类似物”指类似于RNA帽结构的结构。RNA帽类似物的实例包括-J-甲基鸟苷(m7G)、7_甲基鸟苷单磷酸(m7GMP)、7-甲基鸟苷三磷酸(m7GTP)、通过5’至5’三磷酸键连接到鸟苷的7-甲基鸟苷(m7GpppG)、通过5’至5’三磷酸键连接到在核糖2’ OH位发生甲基化之鸟苷的7-甲基鸟苷(m7GpppGm)、通过5’至5’三磷酸键连接到腺苷的7-甲基鸟苷(m7GpppA)、通过5’至5’三磷酸键连接到在核糖2’ OH位发生甲基化之腺苷的7-甲基鸟苷(m7GpppAm)、通过5’至5’三磷酸键连接到胞苷的7-甲基鸟苷 (m7GpppC)、通过5’至5’三磷酸键连接到在核糖2’ OH位发生甲基化之胞苷的7-甲基鸟苷 (m7GpppCm)、通过5’至5’三磷酸键连接到尿苷的7-甲基鸟苷(m7GpppU)、通过5’至5’三磷酸键连接到在核糖2’ OH位发生甲基化之尿苷的7-甲基-鸟苷(m7GpppUm)。因此，在本发明的一个优选实施方案中，所述帽类似物选自m7G、m7GMP、m7GTP、m7GpppN,m7GpppNm,其中 N是核苷酸，优选G、A、U或C。在另一个优选实施方案中，RNA帽类似物可包含另外的例如 1至15个核苷酸，即1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个，其中所述核苷酸优选独立地选自A、C、G、U和/或T。这些另外的核苷酸优选通过磷酸酯、磷酸二酯或者磷酸三酯键或者其不可水解的类似物连接至m7GpppN或m7GpppNm中的第一核苷酸N。本文使用的术语“核苷酸”表示由在Γ位与戊糖相连的嘌呤、氮杂嘌呤或嘧啶核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、氮杂腺嘌呤、氮杂鸟嘌呤等)组成的化合物，包括2'-脱氧和2'-羟基形式，例如Kornberg and Baker, DNA R印lication，第二版(Freeman，SanFrancisco, 1992)中所述的，还包括但不限于具有经修饰碱基部分和/或经修饰糖部分的合成核苷，例如由Scheit，Nucleotide Analogs (John Wiley, N. Y.，1980)中一般性描述的。
术语“结合口袋”表示由本发明多肽片段形成的三维结构，即PB2的RNA帽结合结构域，其由直接接触RNA帽的氨基酸残基或者使直接接触RNA帽的氨基酸残基定位的氨基酸残基(第二层氨基酸残基)排列而成，所述氨基酸残基为例如Arg332和Ser337。由于其形状，所述结合口袋接纳RNA帽或其类似物。PB2的RNA帽结合口袋由结构坐标所定义，所述结构坐标来自于对包含RNA帽结合位点的PB2多肽片段与RNA帽类似物之间的复合物的晶体结构数据分析。术语“结合口袋”还包含PB2多肽片段变体的结合口袋。术语“PB2的RNA帽结合结构域”表示在其天然三维结构中包含RNA结合口袋的 PB2最小多肽片段。术语“分离的多核苷酸”表示这样的多核苷酸，其为(i)从其天然环境中分离， (ii)通过聚合酶链式反应扩增的，或者(iii)全部或部分合成的，还表示脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链多聚体，包括DNA和RNA分子，有义和反义链。该术语包括 cDNA，基因组DNA以及重组DNA。多核苷酸可由完整基因或其部分组成。本文使用术语“重组载体”包括本领域技术人员已知的任何载体，包括质粒载体、粘粒载体、噬菌体载体(例如λ噬菌体)、病毒载体(例如腺病毒或杆状病毒载体)、或者人工染色体载体(例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或者Pl人工染色体 (PAC))。所述载体包括表达载体及克隆载体。表达载体包括质粒和病毒载体，一般含有所需的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)中或体外表达系统中表达与其有效连接之编码序列的合适DNA序列。克隆载体一般用于改造和扩增某些需要的DNA片段，可能缺乏表达所需DNA片段需要的功能序列。本文使用的“重组宿主细胞”表示包含编码目的多肽片段(即本发明的ΡΒ2多肽片段或其变体)的多核苷酸的宿主细胞。此多核苷酸可以如下方式存在于宿主细胞中(i) 自由分散的，( )并入重组载体中，或者(iii)整合在宿主细胞基因组或线粒体DNA中。重组细胞可用于表达目的多核苷酸，或者用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括以本发明多核苷酸或重组载体进行转化、转染或感染的原始细胞的后代。重组宿主细胞可以是细菌细胞，例如大肠杆菌细胞；酵母细胞例如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris)；植物细胞；昆虫细胞例如SF9或Hi5 细胞；或者哺乳动物细胞。优选的哺乳动物细胞实例有中国仓鼠卵巢(CHO)细胞、非洲绿猴肾(COS)细胞、人胚肾(HEK293)细胞、HELA细胞，等等。
本文使用的术语“晶体”或“结晶”表示这样的结构(例如三维固体聚集体)，其中平面以确定的角度相交，并且其中化学组成物质有规则的结构(例如内部结构)。术语“晶体”可包括下列任一项固体物理晶形例如实验制备的晶体，来源于晶体的晶体结构(包括二级和/或三级和/或四级结构元件)，基于晶体结构的2D和/或3D模型，其表示例如其略图或者图示，或者用于计算机的其数据集。在一个方面中，所述晶体可用于X射线晶体衍射技术。在这里，所用的晶体可承受暴露于X射线束并用于产生解析X射线晶体结构所需的衍射图样数据。晶体可以表征为能够以T.L. Blundell和L.N.Johnson，‘‘ Protein Crystallography" ,Academic Press,New York(1976)所示晶形之一所定义的衍射 X 射线图样。术语“晶胞”指基本的平行六面体形的单元。晶体的整个体积可以由规则装配的这些单元构建而成。每个晶胞包含图样单元的完整表示，对其进行重复而构建出所述晶体。术语“空间群”指晶体对称元素的排布。在空间群的命名中，大写字母表示晶格类型，其它符号表示可以在不改变外观的情况下对不对称单元内容进行的对称操作。术语“结构坐标”指定义一个或多个氨基酸残基相对于坐标系的位置的一组数值。该术语指定义分子三维结构的数据集(例如笛卡儿坐标、温度因子和占位率)。结构坐标可略微改变，但仍保持几乎相同的三维结构。独特结构坐标组的度量是所得结构的均方根差。本领域普通技术人员可以将产生均方根差小于3埃、2埃、1. 5埃、1. 0埃或0. 5埃的彼此偏差的三维结构(特别是结合口袋的三维结构)的结构坐标视为非常类似的。术语“均方根差”表示与平均值的偏差的平方的算术平均值的平方根。这是表示与趋势或目标的偏差或偏离的一种方法。出于本发明的目的，“均方根差”定义了 PB2多肽片段变体主链或者其中RNA帽结合口袋与图18的PB2-m7GTP复合物的结构坐标所定义的 PB2主链或者其中RNA帽结合口袋之间的偏差。本文所使用的术语“构建计算机模型”包括基于原子结构信息和相互作用模型进行的分子结构和/或功能的定量和定性分析。术语“建模”包括常规基于数字的分子动力学和能量最低化模型，交互式计算机图像模型，经修改的分子力学模型，距离几何以及其它基于结构的约束模型。术语“拟合程序操作”表示利用化学实体、结合口袋、分子或分子复合物或其部分的结构坐标从而将所述化学实体与结合口袋、分子或分子复合物或其部分相结合的操作。这可通过在所述结合口袋中定位、旋转或移动所述化学实体以匹配所述结合口袋的形状和静电互补性来实现。可对共价相互作用、非共价相互作用(例如氢键、静电、疏水、范德华力相互作用以及非互补静电相互作用例如排斥电荷_电荷、偶极_偶极和电荷_偶极相互作用)进行优化。或者，可使得所述化学实体与所述结合口袋的结合形变能量最小化。本文使用的术语“测试化合物”指包含测试其结合所述目的多肽片段之能力的化合物、分子或复合物的物质，即包含RNA帽结合口袋的本发明PB2多肽片段或其变体。测试化合物可以是任何物质，包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷酸类似物、核苷、核酸、小有机或无机分子、化合物、元素、糖类、同位素、碳水化合物、造影剂、脂蛋白、糖蛋白、酶、分析探针、聚胺以及其组合和衍生物。术语“小分子”指分子量为50至约2500道尔顿、优选200-800道尔顿的分子。另外，本发明的测试化合物可任选地包含检测标记。这些标记包括但不限于，酶标记、放射性同位素或者放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可使用公知方法将这些检测标记连接到测试化合物。本发明的测试化合物还可包含物质的复杂混合物，例如含有天然产物的提取物，或者混合的组合合成的产物。它们也可以被测试，并且可在后续步骤中从所述混合物中纯化出结合靶标多肽片段的组分。测试化合物可衍生自或选自合成或天然化合物的文库。例如，合成化合物文库可购自Maybridge Chemical Co. (Trevillet,Cornwall, UK), ChemBridge Corporation (San Diego, CA) ^Aldrich (Milwaukee, WI) 。文库例如可得自TimTec LLC (Newark，DE)。或者，可使用细菌、真菌、植物和动物细胞以及组织提取物形式的天然化合物文库。另外，测试化合物可使用组合化学法作为单个化合物或混合物合成产生。使用组合化学法制成的化合物集合在本文中称为组合文库。术语“高通量形式”指多种类型的高通量筛选测定和技术，其用于筛选测试化合物文库结合目的多肽片段的能力。通常，以多孔形式进行高通量测定，其包括无细胞测定以及基于细胞的测定。术语“抗体”表示单克隆和多克隆抗体，即任何免疫球蛋白或其能够识别抗原或半抗原的部分，即识别PB2的RNA帽结合结构域或其肽。抗原结合部分可通过重组DNA技术或者酶或化学切割完整抗体的方法产生。在一些实施方案中，抗原结合部分包括Fab、Fab'、 F(ab' )2、Fd、Fv、dAb以及互补性决定区(OTR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及含有抗体中至少足以赋予与多肽特异性抗原结合的部分的多肽。
术语“可药用盐”指可通过本发明方法鉴定的化合物或本发明化合物的盐。合适的可药用盐包括酸加成盐，其可以例如通过将本发明化合物的溶液与可药用酸(如盐酸、硫酸、延胡索酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸)的溶液混合来形成。此外，当所述化合物带有酸性部分时，合适的可药用盐可包括碱金属盐(例如钠盐或钾盐)；碱土金属盐(例如钙或镁盐)；以及由合适的有机配体形成的盐(例如铵，季铵，以及使用反阴离子(counteranion)例如卤化物、氢氧化物、羧酸根、硫酸根、磷酸根、硝酸根、烷基磺酸根和芳基磺酸根形成的胺阳离子)。可药用盐的示例性实例包括但不限于乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐、右旋樟脑磺酸盐、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡萄糖酸盐、二盐酸盐、十二烷基硫酸盐、依地酸盐、乙二磺酸盐、依托酸盐、乙磺酸盐(esylate)、乙磺酸盐 (ethanesulfonate)、甲酸盐、延胡索酸盐、葡庚糖酸盐、葡萄糖酸盐、葡糖酸盐、谷氨酸盐、甘油磷酸盐、羟乙酰基对氨基苯基砷酸盐、半硫酸盐、庚酸盐、己酸盐、己基间苯二酸盐、海胺盐(hydrabamine)、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、羟基萘酸盐、碘化物、异硫代硫酸盐(isothionate)、乳酸盐、乳糖酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐(mesylate)、甲磺酸盐(methanesulfonate)、甲基硫酸盐、粘酸盐、2-萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐、油酸盐、草酸盐、扑酸盐(双羟萘酸盐)、软脂酸盐、泛酸盐、pectinate、过硫酸盐、3-苯基丙酸盐、磷酸盐/ 二磷酸盐、苦味酸盐、特戊酸盐、多聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、碱式醋酸盐、琥珀酸盐、单宁酸盐、酒石酸盐、茶氯酸盐、甲苯磺酸盐、三乙基碘化物、 -j^一酸盐、戊酸盐等(参见例如 S. M. Berge等，〃 Pharmaceutical Salts"，J. Pharm. Sci.， 66，1-19 页(1977))。
在用于本文时术语“赋形剂”用于表示药物制剂中不是活性成分的所有物质，例如载体、粘合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、调味剂或着色剂。术语“可药用载体”包括例如碳酸镁、硬脂酸镁、滑石、糖、乳糖、果胶、糊精、淀粉、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。
本发明人发现了来自流感病毒RNA依赖性RNA聚合酶亚基PB2的片段，其为可溶性的并且能够结合RNA帽或其类似物，因此适于进行结晶以得到结构信息，同时还使用重组蛋白质进行了结合研究。本发明的一个方面提供了可溶性多肽片段，其中所述多肽片段 (i)来自流感病毒RNA依赖性RNA聚合酶亚基PB2，并且(ii)能够结合RNA帽或其类似物。作为本发明可溶性片段之来源的RNA依赖性RNA聚合酶亚基PB2优选来自甲型、乙型或丙型流感病毒。本发明可溶性片段的最小长度由结合RNA帽或其类似物的能力决定。因此，优选本发明的PB2多肽片段包含至少SEQ ID NO 1的323至404位或320至483位氨基酸残基或者例如PB2多肽片段变体中相应的氨基酸，或者由其组成；包含至少SEQ ID N0:2的 325至406位或者320至484位氨基酸残基，或者例如PB2多肽片段变体中相应的氨基酸或者由其组成；包含至少SEQ ID NO 3的335至416位或者330至501位氨基酸残基或者例如PB2多肽片段变体中相应的氨基酸，或者由其组成。另一方面，已观察到，如果长度超出某些C端和/或N端边界，则所述片段的溶解度降低。对于来自甲型流感的可溶性片段，优选这些边界(参照SEQ ID NO 1)在N端为220位氨基酸或者变体中与其对应的氨基酸，C 端为510位氨基酸或者变体中与其对应的氨基酸。对于来自乙型流感的可溶性片段，优选这些边界(参照SEQ ID NO 2)在N端为222位氨基酸或者变体中与其对应的氨基酸，在C 端为511位氨基酸或者变体中与其对应的氨基酸。对于来自丙型流感的可溶性片段，优选这些边界(参照SEQ ID NO :3)在N端为227位氨基酸或者变体中与其对应的氨基酸，在 C端为528位氨基酸或者变体中与其对应的氨基酸。在此背景下，术语“可溶”表示多肽片段能以至少0. lmg/ml溶剂的浓度溶解，更优选至少0. 5mg/ml，更优选至少lmg/ml，更优选 5mg/ml或更高。合适的溶剂是缓冲体系，其包含浓度0. OlM至3M的TrisHCl，优选0. 05M 至2M，更优选0. IM至1M，pH3至pH9，优选pH4至pH9，更优选pH7至pH9，并任选地包含浓度为ImM至20mM的还原剂例如二硫苏糖醇(DTT)或者TCEP. HCl (Tris (2-羧乙基)膦盐酸
^rt. ) ο在一个优选实施方案中，所述多肽片段纯化至适于结晶的程度。优选地，纯度为至少 95%,96%,98%,99%,99. 1 % ,99. 2 % ,99. 3 % ,99. 4 % ,99. 5 % ,99. 6 % ,99. 7 %, 99. 8%,99. 9%。可通过标准方法评估蛋白质的纯度，包括SDS聚丙烯酰胺凝胶电泳和通过银染进行染色，或者HPLC并在280nm检测。在另一个优选实施方案中，(i)所述多肽片段的N端与SEQ ID NO=I的PB2氨基酸序列中220位更高位或例如 225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、 315、320或323位的氨基酸相同或相对应，所述多肽片段的C端与SEQ ID N0:1的PB2氨基酸序列中510位或更低位例如505、500、495、490、489、488、487、486、485、484或483位的氨基酸相同或相对应，更优选地，所述多肽片段的N端与220位氨基酸相同或相对应，所述多肽片段的 C 端与 510、505、500、495、490、489、488、487、486、485、484 或 483 位的氨基酸相同或相对应；更优选地，所述多肽片段的N端与225位或更高位氨基酸相同或相对应，所述多肽片段的C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与230位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与235位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与240位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与245位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与250位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与255位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与260位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与265位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与270位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与275位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与280位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与280位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与285位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与290位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与295位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与300位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与305位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与310位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与315位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或
24483位氨基酸相同或相对应；更优选地，所述多肽片段的N端与320位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相对应；或者；更优选地，所述多肽片段的N端与323位或更高位氨基酸相同或相对应，C端与510位或更低位，特别是505、500、495、490、489、488、487、486、485、 484或483位氨基酸相同或相对应； (ii)所述多肽片段的N端与根据SEQ ID NO 2的PB2氨基酸序列中222位或更高位例如 225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、 310、315、320、325位氨基酸相同或相对应，C端与根据SEQ ID NO :2的PB2氨基酸序列中 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、 488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与222位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与225位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与230位或更高位氨基酸相同或相对应，C 端与 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与235位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与240位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与245位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与250位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与255位或更高位氨基酸相同或相对应，C 端与 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与260位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与265位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与270位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与275位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与280位或更高位氨基酸相同或相
25对应，C 端与 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与285位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与290位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与295位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与300位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与305位或更高位氨基酸相同或相对应，C 端与 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与310位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与315位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相对应；更优选地，所述多肽片段的N端与320位或更高位氨基酸相同或相对应，C端与511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应；或者更优选地，所述多肽片段的N端与325位或更高位氨基酸相同或相对应，C端与511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484位氨基酸相同或相对应；或者 (iii)所述多肽片段的N端与根据SEQ ID NO :3的PB2氨基酸序列中227位或更高位例如 230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、 315、320、325、330或335位氨基酸相同或相对应，C端与根据SEQ ID NO 3的PB2氨基酸序列中 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、509、
508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与227位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、519、
518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与230位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、
509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与235位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、
519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与240位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与245位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与250位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与255位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与260位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与265位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与270位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与275位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与280位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与285位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与290位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与295位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与300位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与305位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与227位或更高位相同或相对应， C 端与 310 位氨基酸或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与315位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与320位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、
27509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；更优选地，所述多肽片段的N端与325位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应；更优选地，所述多肽片段的N端与330位或更高位氨基酸相同或相对应，C 端与 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相对应；或者更优选地，所述多肽片段的N端与335位或更高位氨基酸相同或相对应，C端与528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相对应。在另一个实施方案中，所述多肽片段由选自下列的氨基酸序列组成、基本由其组成或者与其对应根据SEQ ID NO 4至13的氨基酸序列及其变体，其保留与RNA帽或其类似物相结合的能力并且可溶。在一些优选实施方案中，所述多肽片段中包含氨基酸取代、插入或缺失，优选如上文所述的天然突变。优选地，本发明的PB2多肽片段具有235至496位 (SEQID NO 4)、241 至 483 位(SEQ ID NO 5)、268 至 483 位(SEQ ID NO 6)、277 至 480 位 (SEQ ID NO 7)、281 至 482 位(SEQ ID NO 8)、290 至 483 位(SEQ ID NO 9)、295 至 482 位 (SEQ ID NO :10)、318 至 483 位(SEQID NO :11)、320 至 483 位(SEQ ID NO 12)或者 323 至 404位(SEQ IDNO=I3)氨基酸残基或与其对应。在另一个方面中，本发明提供了包含如上所述PB2多肽片段和RNA帽或其类似物的复合物。优选地，所述帽类似物选自m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、 m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm。在本发明的一个实施方案中，所述复合物中的多肽片段由SEQ ID NO :11的氨基酸序列组成，所述帽类似物是m7GTP，所述复合物具有图18所示结构坐标所定义的结构。在一个优选实施方案中，任何本发明的复合物包含晶型，优选空间群C2221;晶胞尺寸a = 9. 2纳米，b = 9. 4纳米，e = 22. 0纳米士0. 3纳米。优选地，所述晶体以3. 0埃或更高的解析度衍射X射线，优选地2. 8埃或更高，更优选2. 6 埃或更高，最优选2. 4埃或更高。在一个实施方案中，适于结晶的蛋白质溶液可在水溶液中包含5mg/ml至20mg/ ml、优选8mg/ml至18mg/ml、更优选llmg/ml至15mg/ml浓度的PB2多肽片段或其变体，2mM 至10mM、优选3mM至8mM、更优选4mM至6mM浓度的RNA帽类似物，并任选地包含缓冲体系例如浓度为0. OlM至3M、优选0. 05M至2M、更优选0. IM至1Μ，ρΗ3至pH9、优选pH4至pH9、更优选PH7至pH9的Tris-HCl，并任选地包含还原剂例如浓度为ImM至20mM的二硫苏糖醇(DTT)或TCEP.HCl(Tris(2-羧乙基)膦盐酸盐)。在结晶溶液中，PB2多肽片段或其变体或者包含所述PB2多肽片段或其变体和RNA帽或其类似物的复合物的纯度优选为85%至 100%，更优选90%至100 %，甚至更优选95%至100%。为了产生晶体，将适于结晶的蛋白质溶液与等体积的沉淀剂溶液例如甲酸钠、硫酸铵、多种大小的聚乙二醇相混合。在一个优选实施方案中，结晶介质包含0. 05至2 μ 1、优选0. 8至1. 2 μ 1适于结晶的蛋白质溶液，其与相似体积、优选等体积的包含1. 5至2Μ甲酸钠和0. 05至0. 15Μ柠檬酸ρΗ4至ρΗ5的沉淀剂溶液混合。在另一个实施方案中，所述沉淀剂溶液包含7%PEG6000、lMLiCl、0. IM柠檬酸pH5. 0，IOmM TCEP. HCl。可通过任何本领域技术人员已知的方法生长晶体，包括但不限于悬滴和坐滴技术
28(sitting drop)、夹心滴(sandwich-drop)、透析以及微批量或微管批量设备。对本领域技术人员来说很明显的是，可以改变上述结晶条件，来鉴定产生单独或与化合物相复合的本发明PB2多肽片段或其变体的晶体的其它结晶条件。这些变化包括但不限于改变pH、蛋白质浓度和/或结晶温度，改变所用盐和/或沉淀剂的种类或浓度，使用不同的结晶方法，或者引入添加剂例如去污剂(例如吐温20(单月桂酯)、0)(^、81~士」30(4月桂基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二噁烷、二甲基甲酰胺)、镧系元素离子或者帮助结晶的多聚离子化合物。可使用高通量结晶测定来帮助发现或优化结晶条件。可使用微接种(microseeding)来增加晶体的尺寸和品质。简言之，将微晶体破碎以产生原种(Stock seed)溶液。对所述原种溶液进行系列稀释。使用针、玻璃棒或毛绳，将来自每个稀释液的小样品添加到一组平衡滴中，其中含有蛋白质，其浓度等于或小于在没有种子时产生晶体所需的浓度。目的是最后得到用在滴中发挥晶体生长晶核作用的单个晶种。如本文所述，获得如图18所示结构坐标、对所述坐标的解读及其在了解蛋白质结构中的应用的方式为本领域技术人员公知，并参考标准教科书，例如 J. Drenth, 〃 Principles of protein X-ray crystallography 〃，第二片反， Springer Advanced Texts in Chemistry, New York (1999)；禾口 G.Ε·Schulz 禾口 R. H. Schirmer, “ Principles of Protein Structure “，SpringerVerlag，New York(1985)。例如，首先获得X射线衍射数据，经常使用冷冻至100K的低温保护(例如用20%至30%甘油)的晶体，例如，使用同步加速器设备的线束或者旋转阳极作为X射线源。然后，通过公知的方法解决相位问题，例如多波长异常衍射(multiwavelength anomalousdiffraction, MAD)、多重同晶置换(multiple isomorphous replacement, MIR)、单波长异常衍射(single wavelength anomalous diffraction, SAD)或者分子置换(molecular replacement, MR)。可使用 SHELXD 解出亚结构(Schneider 和 Sheldrick， 2002)，使用SHARP计算相位(Vonrhein等，2006)，以及使用溶剂平滑化及非结晶学对称平均化进行改进(例如使用RESOLVE (Terwilliger，2000))。可使用例如ARP/wARP (Perrakis 等，1999)进行模型自构建并使用例如REFMAC进行精细化(Murshudov，1997)。此外，本发明所提供PB2片段的结构坐标(图18)可用于正粘病毒科其他属的PB2多肽或者使用分子替换方法具有氨基酸取代、缺失和/或插入的PB2多肽变体的结构测定。本发明的另一个方面是提供编码上述PB2多肽片段及其变体的分离的多核苷酸。用于获得这些分离核苷酸片段的分子生物学方法是本领域技术人员公知(对于标准分子生物学方法，参见 Sambrook 等编辑，“MolecularCloning :A Laboratory Manual" ,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York(1989),其通过弓|用并入本文)。例如，可从被流感病毒感染的细胞中分离RNA，应用逆转录聚合酶链式反应 (RT-PCR)产生cDNA，其中使用随机引物(例如随机六聚体或十聚体)或者用于产生目的片段的特异性引物。可通过标准PCR使用片段特异性引物扩增目的片段。在一个优选实施方案中，编码可溶性PB2多肽片段的优选实施方案的分离多核苷酸来源于SEQ ID N0:23(甲型流感病毒)、26(乙型流感病毒)或者27(丙型流感病毒)。在一个优选实施方案中，编码可溶性甲型流感病毒PB2多肽片段或其变体的分离多核苷酸来源于SEQ ID N0:25，其与SEQ NO 1相比包含389位精氨酸变成赖氨酸的氨基酸替换。
29在一个更优选的实施方案中，编码甲型流感病毒PB2多肽片段或其变体的分离多核苷酸来源于SEQ ID NO :26，它是针对大肠杆菌密码子使用而进行了优化的DNA序列。在这种情况下，“来源于”表示SEQ ID NO :23、24、25、26或27编码全长PB2多肽，因此编码优选PB2多肽片段的多核苷酸根据各个所编码PB2多肽片段的需要而在多核苷酸的5'和3'端包含缺失。在一个实施方案中，本发明涉及包含所述分离多核苷酸的重组载体。本领域技术人员十分了解用于将目的多核苷酸序列引入载体的技术(也参见Sambrook等，1989)。这些载体包括任何本领域技术人员已知的载体，包括质粒载体、粘粒载体、噬菌体载体例如λ噬菌体、病毒载体例如腺病毒或杆状病毒，或者人工染色体载体例如细菌人工染色体 (BAC)、酵母人工染色体(YAC)或Pl人工染色体(PAC)。所述载体可以是适于原核或真核表达的表达载体。所述质粒可包含复制起点(ori)、多克隆位点和调节序列例如启动子(组成型或诱导型)、转录起始位点、核糖体结合位点、转录终止位点、多腺苷酸信号以及选择标记，例如抗生素抗性或基于对突变或缺失进行回补(complementation)的营养缺陷型标记。在一个实施方案中，所述目的多核苷酸序列与调节序列有效连接。在另一个实施方案中，所述载体包含编码有助于纯化目的多肽片段的表位、肽或蛋白质标签的核苷酸序列。这些表位、肽、或蛋白质标签包括但不限于红细胞凝集素(HA-)、 FLAG、myc标签、多His标签、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、NusA以及硫氧还蛋白标签，或者荧光蛋白标签例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E)YFP)、来源于海葵(Discosoma)物种(DsRed)或者单体(mRFP)的红色荧光蛋白(RFP)、青色荧光蛋白(CFP)，等等。在一个优选实施方案中，可将表位、肽或蛋白质标签从目的多肽片段上切下，例如，使用如凝血酶、因子Xa、PreScission, TEV蛋白酶等等的蛋白酶。这些蛋白酶的识别位点是本领域技术人员公知的。在另一个实施方案中，所述载体包括导致目的多肽片段分泌到重组寄主细胞培养基中或者细菌的周质间隙中的功能性序列。所述信号序列片段通常编码信号肽，其由引导所述蛋白质从细胞中分泌出来的疏水氨基酸构成。所述蛋白质分泌到培养基中(革兰氏阳性菌)或者位于细胞外膜和内膜之间的周质间隙中(革兰氏阴性菌)。优选地，在信号肽片段与外源基因之间编码有加工位点，其可被体内或体外切割。在另一个方面中，本发明提供包含所述分离多核苷酸或所述重组载体的重组宿主细胞。所述重组宿主细胞可以是原核细胞例如古细菌和细菌细胞或者真核细胞例如酵母、植物、昆虫或哺乳动物细胞。在一个优选实施方案中，所述宿主细胞是细菌细胞例如大肠杆菌细胞。本领域技术人员了解将所述多核苷酸或所述重组载体引入所述宿主细胞的方法。例如，细菌细胞可直接使用例如化学转化(如氯化钙法)或者电穿孔容易地进行转化。酵母细胞可以例如使用醋酸锂转化法或电穿孔进行转化。其它真核细胞可例如使用市售基于脂质体的转染试剂盒例如Lip0fectamineTM(Invitr0gen)、市售的基于脂类的转染试剂盒例如Fugene (RocheDiagnostics)、基于聚乙二醇的转染、磷酸钙沉淀、基因枪(生物射弹)、电穿孔或者病毒感染进行转染。在本发明的一个优选实施方案中，所述重组宿主细胞表达目的多核苷酸片段。在一个更优选的实施方案中，所述表达产生本发明的可溶性多肽片段。这些多肽片段可利用本领域技术人员公知的蛋白质纯化方法进行纯化，任选地利用上述表位、肽或蛋白质标签。
在另一个方面中，本发明涉及鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法，其包括下列步骤(a)构建由图18所示复合物的结构坐标定义的所述结合口袋的计算机模型；(b)通过选自下列的方法选自可能的结合化合物(i)将分子片段组装成所述化合物，(ii)从小分子数据库中选择化合物，和(iii)从头设计所述化合物的配体；(C)利用计算工具进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算，以提供所述化合物在所述结合口袋中的能量最小化构型；以及(d)评价所述拟合运算的结果，以对所述化合物和所述结合口袋模型之间的结合进行定量，由此对所述化合物与所述结合口袋相结合的能力进行评价。本发明首次允许使用分子设计技术，基于图18所述结合口袋的结构坐标来鉴定、选择或设计PB2的RNA帽结合口袋或者PB2多肽变体的RNA帽结合口袋的潜在结合配偶体，优选RNA帽结合的抑制剂。鉴于制备和测试多种可能结合所述结合口袋的化合物的更高成本，这样的预测模型非常有价值。为了使用针对与RNA帽类似物形成复合物的PB2多肽片段的结构坐标，必须将该结构坐标转变为三维形状。这通过使用市售软件完成，所述软件能够从一组结构坐标产生分子或其部分的三维图示。这样的计算机程序的实例有MODELER (A. Sali 和 T.L.Blundell，J.Mol.Biol.，234，779-815 页(1993)，在 Insight II Homology 软件包(Insight II (97. 0), Molecular Simulations Incorporated, San Diego, CA)中)。本领域技术人员可使用多种方法来筛选化学实体或片段结合PB2或PB2多肽变体 RNA帽结合口袋的能力。此过程可从对例如基于根据图18的结构坐标的PB2RNA帽结合口袋的三维计算机模型进行肉眼观察开始。然后，可将选定的片段或化合物以多种方向置于或者对接入结合口袋内。可使用软件例如Cerius、Quanta和Sybyl (Tripos Associates, St. Louis, M0)完成对接，然后是具有标准分子动力学力场的能量最小化和分子动力学，例如0PLS-AA、CHARMM和AMBER。其它可在选择合适化合物或片段的过程中协助本领域技术人员的专门计算机程序包括，例如(i)AUTODOCK(D. S. Goodsell等，“Automated Docking of Substrates toProteins by Simulated Annealing " , Proteins :Struct. , Funct., Genet.，8，195-202页(1990) ；AUT0D0CK可获得自 Scripps Research Institute,LaJolla, CA)以及(ii) DOCK (I. D. Kuntz 等，"A Geometric Approach toMacromoIecule-Ligand Interactions “，J.Mol.Biol. , 161,269-288 页(1982) ；DOCK 可获得自 University of California, San Francisco, CA)。一旦选择了合适的化合物或片段，则可将其设计或组装成单个化合物或复合物。这一手动模型构建利用软件例如Quanta或Sybyl进行。在单个化合物或片段的连接中协助本领域技术人员的可用程序包括，例如(i)CAVEAT(P.A. Bartlett等，‘‘CAVEAT: A Program to Facilitate theStructure-Derived Design of Biologically Active Molecules " , in MolecularRecognition in Chemical and Biological Problems " , Special Publication, Royal Chem. Soc,78,182-196 页(1989) ；G. Lauri 禾口 P. A. Bartlett, " CAVEAT :A Program to Facilitate the Design of Organic Molecules “，J. Comp. Aid. Mol. Des.，8，51-66 页(1994) ； CAVEAT 可获得自 University
31ofCalifornia，Berkley，CA)，(ii) 3D Database 系统例如 ISIS (MDLInformation Systems, San Leandro, CA ；综述于 Y· C· Martin，〃 3DDatabase Searching in Drug Design “， J.Med. Chem.，35，2145-2154 页(1992))，禾口 (iii)HOOK(M. B. Eisen 等，“HOOK A Program for FindingNovel Molecular Architectures that Satisfy the Chemical and StericRequirements of a Macromolecule Binding Site"，Proteins :Struct.，Funct.， Genet.，19，199-221 页(1994) ；HOOK 可获得自 Molecular Simulationslncorporated, San Diego, CA)ο实现本发明的另一种方法是在小分子数据库中用计算机筛选可与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的整体或一部分相结合的化合物。在此筛选中，这些化合物与所述结合口袋的合适程度可由形状互补性或者由估计的相互作用能来判断 (E. C. Meng 等，J. Comp. Chem.，13，505-524 页(1992))。或者，PB2的RNA帽结合口袋的可能结合配偶体(优选RNA帽结合抑制剂)可基于与根据图18的RNA帽类似物复合的PB2多肽片段的3D结构从头设计。有本领域技术人员可得到的多种从头设计配体的方法。这些方法包括(i)LUDI(H.-J.Bohm，“ The Computer Program LUDI :ANew Method for the De Novo Design of Enzyme Inhibitors" ,J. Comp. Aid. Mol.Des.，6，61—78 页(1992) ；LUDI 可得自 Molecular Simulationslncorporated, San Diego, CA)， (ii) LEGEND(Y. Nishibata 禾口 A.Itai， Tetrahedron，47，8985—8990 页(1991) ；LEGEND 可得自 MolecularSimulations Incorporated, San Diego, CA)， (iii) LeapFrog (可得自 TriposAssociates，St. Louis，MO)，(iv)SPROUT(V. Gillet 等，'’ SPROUT =AProgram for Structure Generation" , J. Comp. Aid. Mol. Des. , 7,127-153 页(1993) ；SPROUT 可得自 University of Leeds, UK), (v)GROUPBUILD(S. H. Rotstein 和 Μ. A. Murcko" GroupBuild :A Fragment-BasedMethod for De Novo Drug Design" ,J.Med· Chem.，36，1700-1710页(1993))，以及(vi)GROW(J. B. Moon和W. J. Howe, “ ComputerDesign of Bioactive Molecules :A Method for Receptor-Based De NovoLigand Design ", Proteins，11,314-328 页(1991))。另外，可支持本领域技术人员从头设计潜在的RNA帽结合口袋相互作用化合物以及建模的若干分子建模方法已有描述，包括如N. C. Cohen等，‘‘Molecular Modeling Software and Methods for Medicinal Chemistry “ , J. Med. Chem. ,33,883-894 M (1990) ;M. A. Navia 禾口 M. A. Murcko, “ TheUse of Structural Information in Drug Design " , Curr. Opin. Struct. Biol. , 2, pp. 202-210 (1992) ；L. M. Balbes φ, “ A Perspective in Modern Methods inComputer-Aided Drug Design " , Reviews in Computational Chemistry, Vol. 5, K. B. Lipkowitz 禾口D. B. Boyd编辑，VCH，New York, 37-380 页(1994) ；W. C. Guida, " Software for Structure-Based Drug Design" , Curr. Opin. Struct.Biol.，4，777-781 页(1994)。被设计或选择用作与PB2的RNA帽结合口袋或者PB2变体的结合口袋相结合的分子可以进一步通过计算进行优化，从而使其在结合状态下优选与目标区域不存在排斥性静电相互作用。这些非互补性(例如静电)相互作用包括排斥性电荷-电荷、偶极-偶极以及电荷-偶极相互作用。具体地，在结合状态下所述结合化合物与所述结合口袋之间所有静电相互作用的总和优选地对结合焓有中性的或有利的贡献。本领域有
32可评价化合物形变能和静电相互作用的具体计算机程序可用。合适的程序实例包括(i) Gaussian 92 修订版 C(M. J. Frisch, Gaussian, Incorporated, Pittsburgh, PA), (ii) AMBER,4. 0 版(P. A. KolIman, University of California, SanFrancisco, CA), (iii) QUANTA/CHARMM(Mo1ecu1ar Simulationslncorporated, San Diego, CA), (iv)OPLS-AA(W. L.Jorgensen, " OPLSForce Fields " , Encyclopedia of Computational Chemistry, Schleyer 编辑，Wiley, New York(1998)Vol. 3,1986-1989 页)，以及(ν)Insight 11/ Discover (Biosysm Technologies Incorporated, San Diego, CA)。这些禾呈序可使用例如 Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000工作站550型来执行。其它硬件系统和软件包是本领域技术人员已知的。一旦如上所述选择或设计了目的分子，就可对其进行一些原子或侧链基团进行取代以改进或改变其结合特性。一般来说，最初的取代是保守的，即，取代基团与原始基团具有大致相同的大小、形状、疏水性和电荷。当然，应理解的是，应避免本领域中已知改变构象的组分。然后可通过如上详细所述相同的计算方法分析这些取代化合物与PB2的RNA帽结合口袋或者PB2变体的结合口袋匹配的效率。在本发明上述方法的一个实施方案中，PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋包含根据SEQ ID N0:1的PB2的Phe323、His357和Phe404氨基酸或者其对应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、Phe404、 Phe325、Phe330和Phe363或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330 和 Phe363 或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Glu361和Lys376或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO :1 的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337 和Gln406 或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Phe325、 Phe330、Phe363、Glu361和Lys376或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、 Arg332、Ser337和Gln406或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Lys339、 Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和Gln406或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID N0 1 的氨基酸 Phe323、His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429 和 His432 或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸 Phe323、His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337和Gln406或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、
33Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、 Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Glu361、 Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、 LyS339、Arg355、ASn429和His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸Phe323、His357、Phe404和Met431或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、HiS357、Phe404、 Phe325、Phe330、Phe363和Met431或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、 Glu361、Lys376和Met431或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ IDNO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、 Ser320、Arg332、Ser337、Gln406和Met431或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、 Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429、His432 和Met431或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸Phe323、HiS357、Phe404、 Phe325、Phe363、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363、Glu361 和 Ser337 或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸His357、Phe404、Phe325、Glu361、 Lys376、Arg332、Ser337和Met431或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据 SEQ ID NO 1 的氨基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、 Met431、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Phe325或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、 His357、Phe404和Glu361或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Lys376或者其相应氨基酸。在另一个实施方案中，所述结合口袋包含根据SEQ ID N0:1的氨基酸Phe323、HiS357、Phe404、 Glu361和Lys376或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQID NO 1的氨基酸Phe323、His357、Phe404、Phe325和Glu361或者其相应氨基酸。在又一个实施方案中，所述结合口袋包含根据SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Phe325 和Lys376或者其相应氨基酸。此外，在其它一些实施方案中，上述定义的结合口袋可任选地包含对应于根据SEQ ID NO 1的氨基酸Met431的氨基酸或者其相应氨基酸。
在本发明上述方法的另一个方面中，PB2的RNA帽结合口袋由根据图18的PB2SEQ
34ID N0:1的氨基酸Phe323、His357和Phe404的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、Phe404、Phe325、Phe330和 Phe363的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Phe330和Phe363的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Glu361和Lys376的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图 18 的 PB2 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Ser320、Arg332、Ser337 和 Gln406的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ IDN0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363Glu361 和 Lys376 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、 Phe325、Phe330、Phe363Ser320、Arg332、Ser337 和 Gln406 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQID NO 1的氨基酸Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、 Glu361、Lys376、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ IDNO 1的氨基酸Phe323、His357、Phe404、Ser320、 Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2 SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2 SEQ ID NO 1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、Arg355、 Asn429和His432的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18 的 PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、 Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQID NO 1的氨基酸Phe323、His357、Phe404、 Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、 Gln406、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Met431的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID N0:1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363 和 Met431 的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ IDNO 1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363Glu361、Lys376 和 Met431 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406 和 Met431 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2 SEQ ID NO 1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337、Gln406、Lys339、Arg355、Asn429、His432 和 Met431 的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO :1的氨基酸Phe323、His357、 Phe404、Phe325、Glu361和Lys376的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图 18 的 PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe363、Glu361 和Lys376的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Glu361和Lys376的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO :1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361和Ser337的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2 SEQ ID NO 1的氨基酸His357、Phe404、Phe325、 Glu361、Lys376、Arg332、Ser337和Met431的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图 18 的 PB2 SEQ ID NO 1 的氨基酸 His357、Phe404、Phe325、Glu361、 Lys376、Arg332、Ser337、Met431、Lys339、Arg355、Asn429 和 His432 的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2 SEQ ID NO :1的氨基酸Phe323、 His357、Phe404和Phe325的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Glu361的结构坐标来定义。在又一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO :1的氨基酸Phe323、 His357、Phe404和Lys376的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图 18 的 PB2 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Glu361 和 Lys376 的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Phe325和Glu361的结构坐标来定义。在另一个实施方案中，所述结合口袋由根据图18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325和 Lys376的结构坐标来定义。此外，在其它一些实施方案中，如上定义的结合口袋可任选地另外由根据图18的PB2SEQ ID NO 氨基酸Met431定义。在一个方面中，本发明提供了根据上述方法用计算机筛选能够与根据图18的PB2 的RNA帽结合口袋变体的结合口袋相结合的化合物的方法。在一个实施方案中，根据图 18，所述结合口袋的所述变体与下列氨基酸主链的均方根差不超过3埃氨基酸Phe323、 His357 和 Phe404 ；氨基酸 Phe323、Phe404、Phe325、Phe330 和 Phe363 ；氨基酸 Phe323、 His357、Phe404、Phe325、Phe330 和 Phe363 ；氨基酸 Phe323、His357、Phe404、Glu361 和 Lys376 ；氨基酸 Phe323、His357、Phe404、Ser 320、Arg332、Ser337 和 Gln406 ；氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361 和 Lys376 ；氨基酸 Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Ser320、Arg332、Ser337 和 Gln406 ；氨基酸 Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、 His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 ；氨基酸 Phe323、 His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、 His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337 和 Gln406 ；氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、His357、Phe404、Phe325、 Phe330、Phe363、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 ；氨基酸 Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、 Arg355、Asn429 和 His432 ；氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、 Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432、氨基酸 Phe323、His357、Phe404 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、 Phe363 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376、Ser320、Arg332、Ser337、Gln406 和 Met431、氨基酸 Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、 Asn429、His432 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Glu361 和 Lys376、氨基酸 Phe323、His357、Phe404、Phe325、Phe363、Glu361 和 Lys376、氨基酸 Phe323、His357、 Phe404、Glu361 和 Lys376、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361 和 Ser337、氨基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337 和 Met431、氨基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、Met431、Lys339、Arg355、 Asn429 和 His432、氨基酸 Phe323、His357、Phe404 和 Phe325、氨基酸 Phe323、His357、 Phe404 和 Glu361、氨基酸 Phe323、His357、Phe404 和 Lys376、氨基酸 Phe323、His357、 Phe404、Glu361 和 Lys376、氨基酸 Phe323、His357、Phe404、Phe325 和 Glu361、氨基酸 Phe323、His357、Phe404、Phe325和Lys376，上述氨基酸组合任选地包含氨基酸Met431。在另一个实施方案中，所述均方根差不超过2. 5埃。在另一个实施方案中，所述均方根差不超过2埃。在另一个实施方案中，所述均方根差不超过1.5埃。在另一个实施方案中，所述均方根差不超过1埃。在另一个实施方案中，所述均方根差不超过0. 5埃。在一个优选实施方案中，Hi7GTP夹在溶剂侧的His357与蛋白侧5个苯丙氨酸的簇之间，主要是Phe323和Phe404,还有Phe325、Ph330和Phe363。在该优选实施方案中，鸟苷碱基的特异性识别主要由Glu361氢键键合到鸟苷的N2和m位来实现，这也有助于中和 Hi7GTP的离域正电荷。Lys376也与06形成长氢键。在配体口袋中有两个有序的埋藏水分子，其与G1u361、Lys376和Gln406相互作用而不是直接与配体相互作用。重要的第二层残基优选为Arg332和Ser337，其与His357成氢键。在碱基N2的氢键距离内有水分子或 Ser320。N7甲基与Gln406的侧链以范德华力接触(3. 4埃)，Phe404的羰基氧(3. 4埃) 略远地与Met431的侧链相接触。在该实施方案中，三磷酸向碱基弯曲。α-磷酸与His432 和Asn429相互作用，Y -磷酸与碱性残基His357、Lys339和Arg355相互作用。如果根据本文上述方法的计算机建模显示化合物与PB2的RNA结合口袋或者 PB2多肽变体的结合口袋结合，则可合成所述化合物，并任选地体外或体内测试所述化合物与所述结合口袋结合的能力，其包括另外的步骤(e)合成所述化合物，以及任选地(f) 将所述化合物与PB2多肽片段或其变体或者本发明的重组宿主细胞以及RNA帽或其类似物相接触，以测定所述化合物抑制所述多肽片段与所述RNA帽或其类似物之间结合的能力。这些化合物与所述结合口袋的合适程度可由形状互补性或者预计的相互作用能来判断
37(E. C. Meng等，J. Comp. Chem.，13，505-524页(1992)。用于合成所述化合物的方法是本领域技术人员公知的，或者这些化合物可以是市售的。用于测定所鉴定化合物的RNA帽结合抑制作用的方法实例在下文有述。本发明的另一个方面是提供可通过上述方法鉴定的化合物，前提是所述化合物不是选自下列的任何 RNA 帽类似物m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、 m7GpppC和m7GpppCm、m7GpppU、以及m7GpppUm或者RNA帽结合的小分子抑制剂2-氨基-7-苯甲基-9-(4-羟基丁基)-1，9_ 二氢嘌呤-6-酮(R00794238、Hooker 等、2003)或者T-705 (Furuta等、2005)，并且能够结合PB2的RNA帽结合口袋。在另一个方面中，本发明涉及可通过上述方法鉴定的化合物，前提是所述化学不是选自下列的RNA帽类似物m7G、 m7GMPλ m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、禾口 m7GpppCm、m7GpppU、以及 Hi7GpppUm或者RNA帽结合的小分子抑制剂2-氨基-7-苯甲基-9- (4-羟基丁基)-I，9- 二氢嘌呤-6-酮或者T-705，并且能够抑制PB2多肽片段与RNA帽或其类似物之间的结合。本发明的化合物可以是包括下列但不限于此的任何物质肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷、核酸、有机或无机小分子、化合物、元素、糖类、同位素、碳水化合物、造影剂、脂蛋白、糖蛋白、酶、分析用探针、多胺及其组合和衍生物。术语“小分子”表示分子量在50至约2500道尔顿优选200-800道尔顿的分子。另外，根据本发明的测试化合物可任选地包含检测标记。这些标记包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个方面中，本发明提供了鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法，其包括以下步骤(i)将本发明的PB2多肽片段或重组宿主细胞与测试化合物相接触以及(ii)分析所述测试化合物与PB2多肽片段或其变体结合的能力。在一个实施方案中，可以下拉测定的形式分析PB2多肽片段或其变体与测试化合物之间的相互作用。例如，PB2多肽片段可以是纯化的或者固定在珠上。在一个实施方案中，可以将固定在珠的PB2多肽片段与例如⑴另一种纯化的蛋白质、多肽片段或肽，(ii) 蛋白质、多肽片段或肽的混合物，或者(iii)细胞或组织提取物相接触，可通过聚丙烯酰胺凝胶电泳结合考马斯染色或western印迹验证蛋白质、多肽片段或肽的结合。可通过质谱分析鉴定未知的结合配偶体。在另一个实施方案中，可以基于酶联免疫吸附测定(ELISA)实验的形式分析PB2 多肽片段或其变体与测试化合物之间的相互作用。在一个实施方案中，根据本发明的PB2 多肽片段或其变体可以固定于ELISA板的表面上并与测试化合物相接触。可例如针对带有蛋白质、多肽、肽和表位标签的化合物，通过测试化合物或表位标签的特异性抗体来验证测试化合物的结合。这些抗体可以直接偶联到酶或者用与所述酶偶联的二抗检测，所述酶与合适的底物相组合发生化学发光反应(例如辣根过氧化物酶)或显色反应(例如碱性磷酸酶)。在另一个实施方案中，不能被抗体检测到的化合物结合可通过直接与所述测试化合物偶联的标记来验证。这些标记可包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个实施方案中，所述测试化合物可以固定于ELISA板上并与根据本发明的可溶性PB2多肽片段或其变体相接触。可通过如上所述的PB2多肽片段特异性抗体和化学发光或显色反应来验证所述多肽的结
38口 O在另一个实施方案中，纯化的可溶性PB2多肽片段可以与肽阵列一起孵育，并可通过例如PB2多肽特异性抗体、针对与所述PB2多肽片段融合的表位标签的抗体、或者通过由于PB2多肽片段偶联的荧光标签发射的荧光信号来分析所述PB2多肽片段与对应于特定肽序列的特异性肽斑点的结合。在另一个实施方案中，将根据本发明的重组宿主细胞与测试化合物相接触。这可以通过将测试蛋白质或多肽的共表达并通过荧光能量共振转移(FRET)或免疫共沉淀验证相互作用来实现。在另一个实施方案中，可将直接标记的测试化合物添加到重组宿主细胞的培养基中。例如可通过所述多肽的免疫沉淀与验证所述标记的存在来验证测试化合物穿透膜并与所述PB2多肽片段结合的可能性。在一个优选实施方案中，上述用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法包括添加RNA帽或其类似物的额外步骤。在所述方法的另一个实施方案中，分析所述测试化合物在所述RNA帽或其类似物存在下与PB2结合的能力，或者所述测试化合物抑制所述RNA帽或其类似物与PB2结合的能力。如果所述化合物在与RNA帽或RNA帽类似物相同的摩尔浓度下使结合减少超过20 %、超过30 %、超过40 %、超过50 %、优选超过60 %、优选超过70 %、优选超过80 %、优选超过90 %，则认为化合物抑制RNA帽或RNA帽类似物结合。在一些优选实施方案中，上述下拉、ELISA、肽阵列、FRET以及免疫共沉淀实验可以在RNA帽结构或其类似物(优选带标记的RNA帽结构或其类似物) 存在下并在测试化合物存在或者不存在时进行。在一个实施方案中，在添加所述测试化合物之前添加RNA帽或其类似物。在另一个实施方案中，在添加所述测试化合物的同时添加 RNA帽或其类似物。在又一个实施方案中，在添加所述测试化合物之后添加RNA帽或其类似物。在一个优选实施方案中，可通过在存在或不存在所述化合物的情况下将所述多肽片段与7-甲基-GTP Sepharose 4B树脂(GE Healthcare) 一起孵育并比较(优选定量) 所结合的带有和不带有所述化合物的PB2多肽片段(例如在考马斯染色的SDS PAGE凝胶上或者使用Western印迹分析)来测定可鉴定测试化合物干扰本发明PB2多肽片段与RNA 帽或其类似物相互作用的能力。在测试化合物存在或不存在的情况下评价RNA帽或其类似物与本发明PB2片段或其变体相结合的能力。在一个实施方案中，这可使用荧光标记的RNA帽类似物、荧光标记的 7-甲基鸟苷单磷酸酯(m7GMP)在如Natarajan等(2004)所述的荧光极化测定中来实现。或者，在另一个实施方案中，核糖二醇修饰的荧光帽类似物氨茴酰基-m7GTP可用于如Ren 等(1996)所示的荧光分光光度测定中。在另一个实施方案中，放射性标记的RNA帽可以在存在或不存在测试化合物的情况下与PB2多肽片段或其变体一起孵育，其中RNA帽可在添加所述测试化合物之前、同时或之后添加。通过如Hooker等(2003)所述的凝胶电泳对帽结合反应进行UV-交联、变性和分析。在另一个实施方案中，本发明的PB2多肽片段可固定于微滴定板上，在存在或不存在测试化合物的情况下与带标记的RNA帽或其类似物一起孵育，其中可在添加所述测试化合物之前、同时或之后添加RNA帽或其类似物，通过在彻底清洗所述板之后验证标记的存在来分析帽结合。将含有测试化合物的孔中RNA帽或RNA帽类似物标记的信号强度与不含测试化合物的所述标记的信号强度进行比较，如上所述，如果
39结合减少超过50 %、优选超过60 %、优选超过70 %、优选超过80 %、优选超过90 %，则认为化合物抑制RNA帽或RNA帽类似物结合。在一个优选实施方案中，用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合(优选抑制RNA帽或其类似物结合)的化合物的上述方法以高通量方式进行。在一个优选实施方案中，所述方法如上所述使用根据本发明已固定PB2多肽片段或其变体以及带标记的RNA帽或其类似物在多孔微滴定板中进行。在一个优选实施方案中，所述测试化合物来自合成或天然化合物文库。例如，合成化合物文库可购自Maybridge Chemical Co. (Trevillet, Cornwall, UK), ChemBridgeCorporation(San Diego, CA),或 Aldrich (Milwaukee，WI)。天然化合物文库例如可获得自TimTec LLC (Newark，DE)。或者，可使用细菌、真菌、植物和动物提取物形式的天然化合物文库。另外，可使用组合化学法以合成方式产生单种化合物或者混合物形式的测试化合物。RNA帽或其类似物可在添加文库化合物之前、同时或者之后添加。可如上所述评估所述化合物抑制RNA帽结合的能力。在另一个实施方案中，可在体内形式中检测所鉴定化合物对流感病毒生命周期的抑制作用。可以在存在或不存在已鉴定化合物的情况下用流感病毒感染对流感病毒感染敏感的细胞系例如293T人胚肾细胞、Madin-Darby狗肾细胞或者鸡胚胎成纤维细胞。在一个优选实施方案中，可将多种浓度的已鉴定化合物添加到所述细胞培养基中。病毒蚀斑的形成可用作流感病毒感染能力的读出值，可将用已鉴定化合物处理的细胞与未处理的细胞进行比较。在本发明的另一个实施方案中，在任意上述方法中应用的测试化合物是小分子。在一个优选实施方案中，所述小分子来源于文库，例如小分子抑制剂文库。在另一个实施方案中，所述测试化合物是肽或蛋白质。在一个优选实施方案中，所述肽或蛋白质来源于肽或蛋白质文库。在用于对与本发明PB2多肽片段或变体的RNA帽结合口袋相结合的化合物和/或抑制RNA帽结合所述结合口袋的化合物进行计算机以及体外鉴定的上述方法的另一个实施方案中，所述方法还包括将可鉴定的化合物或其可药用盐与一种或多种可药用赋形剂和 /或载体配制在一起的步骤。在另一个方面中，本发明提供了可根据上述方法产生的药物组合物。根据本发明的化合物可单独施用，但是在人疗法中，一般会与根据预定施用途径和标准药物实践所选择的合适药物赋形剂、稀释剂或载体混合施用(参见下文)。在PB2的RNA帽结合口袋或者PB2变体的结合口袋的结合配偶体进行计算机建模或者筛选的方面中，可以将对作为药物施用的分子有利的化学部分引入目的分子。例如，可以将可能并非直接影响所述分子与靶区域结合而是例如对所述分子在可药用载体中的总体溶解度、所述分子的生物利用度和/或所述分子的毒性有贡献的化学部分引入目的分子或者从中除去。优化目的分子的药理学情况的注意事项和方法可见于，例如"Goodman and Gilman' s The Pharmacological Basis of Therapeutics",第八版，L. S. Goodman, A. Gilman, T. W. Rail, A. S. Nies, & P. Taylor 编辑，Pergamon Press (1985) ；W. L. Jorgensen & E.M. Duffy，Bioorg. Med. Chem. Lett，10，1155-1158 页(2000)。另外，计算机程序〃 Qik Prop"可用于提供对身体重要性描述和有机目的分子药物相关性质的快速预测。“五项标准(Rule of Five) ”概率图表可用于预测新合成化合物的口服吸收(C. A. Lipinski等，Adv. Drug Deliv. Rev.，23，3-25页(1997))。适于药效团选择和设计的程序包括(i) DISCO (Abbot
40Laboratories, Abbot Park, IL)，(ii)Catalyst (Bio-CAD Corp.，Mountain View, CA)，禾口 (iii)Chem DBS-3D(Chemical Design Ltd. , Oxford, UK)。本发明涉及的药物组合物可以本领域技术人员公知的多种方式进行配制。例如，本发明的药物组合物可以是固体形式例如片剂、丸剂、胶囊剂(包括软胶囊剂)、扁囊剂、锭剂、卵形剂、粉剂、颗粒剂或者栓剂，或者液体形式例如酊剂、溶液剂、乳剂或者混悬剂。固体施用形式可含有赋形剂例如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢钙、甘氨酸和淀粉(优选玉米、马铃薯或木薯淀粉)，崩解剂例如羟乙酸淀粉钠、交联羧甲基纤维素钠和某些复合硅酸盐，以及颗粒粘合剂例如聚乙烯吡咯烷酮、羟丙基甲基纤维素 (HPMC)、羟丙基纤维素(HPC)、蔗糖、明胶和阿拉伯胶。另外，可包含润滑剂例如硬脂酸镁、硬脂酸、山嵛酸甘油酯以及滑石。相似类型的固体组合物还可用作明胶胶囊的填充剂。在这一点上优选的赋形剂包括乳糖、淀粉、纤维素、乳糖或者高分子量聚乙二醇。对于适于经口施用的水混悬剂、溶液、酊剂和乳剂，可以将所述化合物与多种甜味剂或调味剂、着色物质或染料、乳化剂和/或混悬剂以及与稀释剂例如水、乙醇、丙二醇和甘油以及其组合相组合。本发明的药物组合物可含有释放速率修饰剂，包括例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、醋酸纤维素酯、聚氧化乙烯、黄原胶、卡波姆、铵甲丙烯酸共聚物、氢化蓖麻油、加拿巴蜡、石蜡、醋酸邻苯二甲酸纤维素、邻苯二甲酸羟丙基甲基纤维素、甲基丙烯酸共聚物及其混合物。本发明的药物组合物可以是快速分散或溶解的剂量形式(fastdispersing or dissolving dosage formulation, FDDF)的形式，并且可含有下列成分阿司帕坦、乙酰磺胺酸钾、柠檬酸、交联羧甲纤维素钠、交聚维酮、diascorbic acid、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、甲基丙烯酸甲酯、薄荷调味剂、聚乙二醇、煅制二氧化硅、二氧化硅、淀粉羟基乙酸钠、硬脂酰基反丁烯二酸钠、山梨醇、木糖醇。对于制备栓剂而言，可首先熔化低熔点蜡例如脂肪酸甘油酯的混合物或可可脂，然后通过如搅拌将活性组分均勻地分散于其中。接着，将熔化的均勻混合物倾倒入便利大小的模，使之冷却，由此固化。适于胃肠外施用的本发明药物组合物最佳地以无菌水溶液的形式使用，其可含有其它物质，例如足够的盐或葡萄糖以使得溶液与血液等渗。如果需要，水溶液应该合适地缓冲(优选pH 3至9)。适于鼻内施用和吸入施用的药物组合物最佳地以下列形式递送干粉吸入器或来自使用合适推进剂的加压容器、泵、喷雾器或喷洒器的气溶胶喷雾形式，所述推进剂例如二氯二氟甲烷、三氯氟甲烷、克立氟烷、氢氟烷例如1，1，1，2-四氟乙烷(HFA 134A.TM)或者1， 1，1，2，3，3，3-六氟丙烷(HFA 227EA. TM)，二氧化碳或者其它合适气体。所述加压容器、泵、喷雾器或喷洒器可含有所述活性化合物的溶液或悬液，例如使用乙醇和推进剂的混合物作为溶剂，其可另外包含润滑剂，例如三油酸山梨坦。在另一个实施方案中，本发明提供了可由上述方法鉴定的化合物，其包括将本发明的PB2多肽片段或者PB2多肽片段变体或者本发明的重组宿主细胞与测试化合物接触的步骤，所述测试化合物不同于选自下列的RNA帽类似物m7G、Hi7GMP, m7GTP, m7GpppG、 m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU 和 m7GpppUm 以及帽结合的小分子
41抑制剂2-氨基-7-苯甲基-9- (4-羟基丁基)-1，9-二氢嘌呤-6-酮(R00794238、Hooker等、 2003)和T-705 (Furuta等、2005)，并且能够结合PB2。在一个优选方面中，本发明涉及可通过上述方法鉴定的化合物，其包括将本发明的PB2多肽片段或者其变体或者本发明的重组宿主细胞与测试化合物接触的步骤，所述测试化合物不同于选自下列的RNA帽类似物m7G、 m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU 禾口 m7GpppUm 以及帽结合的小分子抑制剂2-氨基-7-苯甲基-9- (4-羟基丁基)-1，9- 二氢嘌呤-6-酮和T-705，并且能够抑制PB2和RNA帽或其类似物的结合。在另一个方面中，本发明提供了针对PB2的RNA帽结合结构域的抗体。在一个优选实施方案中，所述抗体识别如上所述多肽片段或片段变体的RNA帽结合结构域，特别的选自SEQ ID NO :14至22定义的多肽。特别的，所述抗体特异性结合包含一个或多个上述定义结合口袋之氨基酸的表位。在这一点上，术语“表位”具有本领域公认的意义，优选表示4至20个氨基酸、优选5至18、6至16或7至14个氨基酸的片段。因此，优选表位具有 4至20、5至18优选6至16或7至14个氨基酸的长度，并包含SEQ ID NO 1的Ser320、 Phe323、Phe325、Phe330、Arg332、Ser337、Lys339、Arg355、His357、Glu361、Phe363、Lys376、 Phe404、Gln406、Met431和/或His432中的一个或多个或者相应的氨基酸。本发明的抗体可以是单克隆或多克隆抗体或其部分。可通过重组DNA技术或者酶或化学切割完整抗体的方法产生抗原结合部分。在一些实施方案中，抗原结合部分包括Fab、Fab'、F(ab' )2、 Fd.Fv.dAb以及互补性决定区(CDR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及至少含有抗体中足以赋予多肽特异性抗原结合的部分的多肽。本发明的抗体根据标准方案产生。例如，可根据本领域技术人员公知的标准方法通过使用目的抗原任选地与佐剂例如弗氏完全或不完全佐剂、RIBI (胞壁酰二肽)或ISCOM(免疫刺激复合物)相组合来免疫动物，例如小鼠、大鼠、兔、山羊、绵羊、猪、牛或马，从而产生多克隆抗体。针对PB2 或其片段的RNA帽结合结构域的多克隆抗血清通过对所免疫的动物放血或处死而获得自该动物。所述血清(i)可以以从动物处获得的形式原样使用，( )可从所述血清获得免疫球蛋白级分，或者(iii)可从所述血清纯化PB2或其片段的RNA帽结合结构域的特异性抗体。单克隆抗体可通过本领域技术人员公知的方法产生。简言之，在免疫后处死动物，通过本领域已知的任何方式使淋巴结和/或脾B细胞永生化。使细胞永生化的方法包括但不限于用癌基因对其进行转染、用致癌病毒对其进行感染以及在选择永生化细胞的条件下对其进行培养，使其经受致癌或致突变化合物，将其与永生化细胞(例如骨髓瘤细胞)融合，以及使肿瘤抑制基因失活。使用PB2或其片段的RNA帽结合结构域筛选永生化细胞。选择产生抗PB2或其片段的RNA帽结合结构域的抗体的细胞，例如杂交瘤，克隆，并对其理想的特征进行进一步筛选，包括生长健壮、高抗体产生以及理想的抗体特征。在(i)同基因动物体内，(ii)缺少免疫系统的动物，例如裸鼠，或者(iii)体外细胞培养物中扩增杂交瘤。选择、克隆和扩增杂交瘤的方法是本领域技术人员公知的。本领域技术人员可参考标准教科书例如"Antibodies =ALaboratory Manual" , Ε· Harlow 禾P D. Lane 编辑，Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York(1990),其通过弓|用并入本文，以作为针对抗体产生的支持。在另一个方面中，本发明涉及可通过上述方法鉴定的能够结合PB2多肽的RNA帽结合口袋或者PB2多肽变体的结合口袋和/或能够抑制RNA帽或其类似物与所述结合口
42袋结合的化合物、如上所述药物组合物或者本发明的抗体在制备用于治疗、缓解或预防单链负链RNA病毒感染所造成疾病的药剂上的用途。在一个优选实施方案中，所述疾病由不分段单链负链RNA病毒的病毒感染造成，即单链负链病毒目，包括博尔纳病毒科、丝状病毒科、副粘病毒科和弹状病毒科。在一个更优选的实施方案中，所述疾病由分段单链负链RNA 病毒引起，包括正粘病毒科，包括甲型流感病毒属、乙型流感病毒属、丙型流感病毒属、索戈托病毒属和感染性鲑鱼贫血病毒属(Isavirus)，沙粒病毒科和布尼亚病毒科，包括汉坦病毒属、内罗病毒属、正布尼亚病毒属、白蛉病毒属和番茄斑萎病毒属(Tospovirus)。在一个更优选的实施方案中，所述疾病由选自下列的病毒物种感染造成博纳病毒、马尔堡病毒、埃博拉病毒、仙台病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞体病毒、火鸡鼻气管炎病毒、印第安纳型水疱性口炎病毒、尼帕病毒、亨德拉病毒(henda virus)、狂犬病毒、牛流行热病毒、传染性造血组织坏死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、汉坦病毒、克里米亚_刚果出血热病毒、裂谷热病毒、La Crosse病毒，优选甲型流感病毒、乙型流感病毒、丙型流感病毒、索戈托病毒或汉坦病毒，更优选甲型流感病毒、乙型流感病毒、丙型流感病毒，最优选甲型流感病毒。为治疗、减轻或预防所述疾病状态，本发明的药剂可经口、口腔、舌下、鼻内、通过肺途径例如通过吸入、通过直肠途径或者胃肠外，例如海绵体内、静脉内、动脉内、腹膜内、鞘内、心室内、尿道内、胸内、颅内、肌内或皮下施用给动物患者，优选哺乳动物患者，优选人患者，它们可通过输注或者无针注射技术进行施用。本发明涉及的药物组合物可以本领域技术人员公知的多种方式进行配制。例如，本发明的药物组合物可以是固体形式例如片剂、丸剂、胶囊剂(包括软胶囊剂)、扁囊剂、锭剂、卵形剂、粉剂、颗粒剂或者栓剂，或者液体形式例如酊剂、溶液剂、乳剂或者混悬剂。固体施用形式可含有赋形剂例如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢钙、甘氨酸和淀粉(优选玉米、马铃薯或木薯淀粉)，崩解剂例如羟乙酸淀粉钠、交联羧甲基纤维素钠和某些复合硅酸盐，以及颗粒粘合剂例如聚乙烯吡咯烷酮、羟丙基甲基纤维素 (HPMC)、羟丙基纤维素(HPC)、蔗糖、明胶和阿拉伯胶。另外，可包含润滑剂例如硬脂酸镁、硬脂酸、山嵛酸甘油酯以及滑石。相似类型的固体组合物还可用作明胶胶囊的填充剂。在这一点上优选的赋形剂包括乳糖、淀粉、纤维素、乳糖或者高分子量聚乙二醇。对于适于经口施用的水混悬剂、溶液、酊剂和乳剂，可以将所述化合物与多种甜味剂或调味剂、着色物质或染料、乳化剂和/或混悬剂以及与稀释剂例如水、乙醇、丙二醇和甘油以及其组合相组合。本发明的药物组合物可含有释放速率修饰剂，包括例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、醋酸纤维素酯、聚氧化乙烯、黄原胶、卡波姆、铵甲丙烯酸共聚物、氢化蓖麻油、加拿巴蜡、石蜡、醋酸邻苯二甲酸纤维素、邻苯二甲酸羟丙基甲基纤维素、甲基丙烯酸共聚物及其混合物。本发明的药物组合物可以是快速分散或溶解的剂量形式(fastdispersing or dissolving dosage formulation, FDDF)的形式，并且可含有下列成分阿斯巴甜、乙酰磺胺酸钾、柠檬酸、交联羧甲纤维素钠、交聚维酮、二抗坏血酸(diascorbic acid)、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、甲基丙烯酸甲酯、薄荷调味剂、聚乙二醇、煅制二氧化硅、二氧化硅、淀粉羟基乙酸钠、硬脂酰基反丁烯二酸钠、山梨醇、木糖醇。对于制备栓剂而言，可首先熔化低熔点蜡例如脂肪酸甘油酯的混合物或可可脂，然后通过如搅拌将活性组分均勻地分散于其中。接着，将熔化的均勻混合物倾倒入便利大小的模，使之冷却，由此固化。适于胃肠外施用的本发明药物组合物最佳地以无菌水溶液的形式使用，其可含有其它物质，例如足够的盐或葡萄糖以使得溶液与血液等渗。如果需要，水溶液应该合适地缓冲(优选pH 3至9)。适于鼻内施用和吸入施用的药物组合物最佳地以下列形式递送干粉吸入器或来自使用合适抛射剂的加压容器、泵、喷雾器或喷洒器的气溶胶喷雾形式，所述抛射剂例如二氯二氟甲烷、三氯氟甲烷、克立氟烷、氢氟烷例如1，1，1，2-四氟乙烷(HFA 134A.TM)或者1， 1，1，2，3，3，3-六氟丙烷(HFA 227EA. TM)，二氧化碳或者其它合适气体。所述加压容器、泵、喷雾器或喷洒器可含有所述活性化合物的溶液或悬液，例如使用乙醇和推进剂的混合物作为溶剂，其可另外包含润滑剂，例如三油酸山梨坦。所述药物制剂优选地是单位剂型。在这样的形式中，所述制剂被分成含有合适量活性组分的单位剂量。所述单位剂型可以是包装的制剂，所述包装含有离散的制剂量，例如包装的片剂、胶囊剂以及瓶或安瓿中的粉剂。另外，所述单位剂型可以是胶囊、片剂、扁囊剂或锭剂本身，或者可以是合适数量的任何这些包装形式。根据具体应用和所述活性成分的效力，在本发明用途中在单位剂量制剂中施用的活性成分的量可以从约Img至约lOOOmg/m2变化或者调节，优选5mg至约150mg/m2。本发明医学用途中使用的化合物以约每天0. 05mg/kg至约20mg/kg的初始剂量施用。优选约0. 05mg/kg至约2mg/kg的每日剂量范围，最优选约0. 05mg/kg至约lmg/kg的每日剂量。但是，所述剂量可以根据患者的需要、所治疗状况的严重程度以及所使用的化合物而有所不同。特定状况的合适剂量的确定在医师的技能范围之内。一般地，治疗从较小的剂量开始，其低于化合物的最适剂量。之后，少量的增加剂量，直至达到在该情况下的最佳效果。为了方便起见，如果需要，可将每天的总剂量分为一天中的几部分并施用。
实施例为了进一步阐释本发明并更好地理解，设计了实施例。不以任何方式将它们视作对本发明范围的限制。实施例1 产生PB2表达构建体将基于甲型流感病毒/Victoria/3/1975(H3N2)PB2氨基酸序列(dela Luna 等，1989)的经大肠杆菌密码子优化的PB2基因(Geneart) SEQ IDNO :25克隆到 pET9a(Novagen)载体中，其经过修饰引入了 5' Aatll/AscI和3' Nsil/NotI限制性位点对，以用于定向截短核酸外切酶III，并提供编码C端生物素受体肽GLNDIFEAQKIEWHE的3’ 序列。从3’端产生了第一非定向截短质粒文库(Tarendeau等，2007)，合并并用作5’缺失反应的底物。从琼脂糖凝胶中分离编码150至250个氨基酸的插入片段的线性化质粒，再连接，然后用于转化含有RIL质粒(Stratagene)的大肠杆菌BL21A1，以使用Alexa488链霉亲和素(Invitrogen)与菌落印迹杂交进行表达筛选(Tarendeau等，2007)。根据其荧光信号对克隆进行排名，通过M2+亲和色谱对前36个克隆测试可纯化蛋白的表达。鉴定到13
44个克隆，对其测序，显示目的区域中的7个独特构建体(参见图1)nt 703-1488(aa 235-496)，nt 721-1449(aa 241-483)，nt 802-1449(aa 268-483)，nt 829-1440(aa 277-480)，nt 841-1446(aa 281-482)，nt 868-1449(aa 290-483)，nt 883-1446(aa 295-482)通过使用合成基因作为模板的聚合酶链式反应(PCR)产生这些PB2多核苷酸片段，并将其克隆进表达载体PETMll质粒(EMBL)的NcoI和XhoI位点之间。pETMll表达载体允许表达带His6标签的融合蛋白。可使用TEV蛋白酶将His6标签从融合蛋白上切下。实施例2 鉴定最小帽结合片段使用实施例1中所述的质粒构建体和实施例3中所述的一般性表达和纯化方案在大肠杆菌中表达PB2多肽片段235-496、241-483、268-483和290-483。发现纯化的PB2片段235-496仅在低浓度下可溶，而片段241-483、268-483和290-483溶解度更好并且可特异性结合m7GTPS印harose柱，指示了帽结合活性。对于这些测定，将0. 2mg蛋白质上样到 50 μ 1 7-甲基-GTP Sepharose 4Β树脂(GE Healthcare)上，在4°C下孵育3小时进行结合。在用含有50mM Tris. HCKpH 8. 0)、200mM NaCl、2mM DTT的缓冲液清洗之后，使用含有 ImM Hi7GTP的相同缓冲液通过离心洗脱蛋白质，在SDS-PAGE进行分析。在这些实验的过程中，注意到较小的降解片段也可结合m7GTP，这可通过N端测序及质谱鉴定为残基318-483，此外，此片段对于蛋白水解是稳定的。将相应的多核苷酸片段(nt952-1449)如实施例1所述克隆进PETMll中。实施例3 :PB2片段的表达和纯化使用化学转化将所述质粒转化进大肠杆菌。在LB培养基中的大肠杆菌菌株BL21-CodonPlus-RIL(Stratagene)中表达所述蛋白质。在25 °C下用0. 2mM异丙基-β-硫代半乳糖苷(IPTG)诱导16至20小时后，收获细胞，重悬于裂解缓冲液中 (50mM Tris ‘ HCl (pH 8.0)、300mM NaCl、5mM 2-巯基乙醇)并超声处理。离心后，将澄清的裂解液直接上样于镍亲和柱(来自GE Healthcare的螯合s印harose，载有Ni2+离子)。用50mMTris · HCl (pH 8. 0) UM NaClU5mM咪唑、mM 2-巯基乙醇缓冲液彻底清洗 Ni-s印harose 树脂，然后用 50mM Tris 'HCl (pH 8.0)、200mM NaCl、50mM 咪唑、5mM 2-巯基乙醇缓冲液清洗。然后，用50mM Tris · HCl (pH8.0)、200mM NaCl、0. 5M咪唑、5mM 2-巯基乙醇缓冲液洗脱蛋白质。在10°C下将纯化的蛋白质孵育过夜进行TEV蛋白酶切割。在以 50mMTris 'HCl (pH 8. 0)、200mM NaCl、15mM咪唑、5mM 2-巯基乙醇缓冲液透析之后，进行第二镍亲和步骤，以除去以His标签标记的TEV蛋白酶。回收未结合的蛋白质，浓缩为5-8mg/ ml在Superdex 75柱(GE Healthcare)上进行凝胶过滤，以提高纯度。PB2多肽片段(318 至483位氨基酸)的凝胶过滤结果在图2A中显示。可以将该片段(318至483位氨基酸) 浓缩至高达24mg/ml。通过SDS PAGE和考马斯染色评价所述蛋白质的纯度(参见图2B)。典型产率为120mg纯蛋白质/升细菌培养物。实施例4 :PB2和Hi7GTP的共结晶
45
使用50mM Tris-HCl (pH 8.0)、200mM NaCl、2mM 二硫苏糖醇(DTT)、5mM Hi7GTP(Sigma)中ll_15mg/ml的PB2片段318-483的蛋白质溶液进行结晶试验。使用机器人(Cartesian)筛选576种结晶条件，其使用坐滴蒸发扩散法(sitting drop vapor diffusion method)，通过将100 μ 1蛋白质溶液与0. 1 μ 1不同沉淀溶液混合来进行。在两种不同条件下鉴定晶体。使用悬滴蒸发扩散法手动优化这些条件，其使用与 μ 1沉淀溶液混合的1μ 1蛋白质溶液。使用包含0. IM柠檬酸pH 4.6、1.6-1.8Μ甲酸钠的沉淀溶液获得最佳的晶体。这些晶体为空间群C2221;晶胞尺寸为a = 9. 2nm, b = 9. 4nm, c = 22.0nm±0.3nn^^。一些较小的晶体得到分辨率为至少2. 4埃的X射线衍射。发现较大的晶体无法使用，因为它们不是单晶。在所发现的第二结晶条件下，沉淀溶液包含 PEG6000UM LiCUO. IM柠檬酸pH 5. OUOmM TCEP HCl0该条件得到薄的片状晶体，空间群未确定，显示至少3. 3埃分辨率的衍射，但是衍射品质差得多，不再继续研究这些晶体。实施例5 制备以硒代甲硫氨酸标记的蛋白质如所述在基本M9培养基中产生硒代甲硫氨酸化的蛋白质(VanDuyne，1993)。因为完全硒代甲硫氨酸化的蛋白质不结晶，所以使用50mg/l硒代甲硫氨酸和5mg/l甲硫氨酸(而不是60mg/l硒甲硫氨酸)产生部分标记的蛋白质。表达、裂解和纯化条件如同天然蛋白质一样(实施例3)。电喷雾质谱显示，对应于11/11个甲硫氨酸被取代，完全硒代甲硫氨酸化蛋白质具有19654道尔顿的MW，而部分标记的蛋白质具有19578的平均分子质量 (9. 4/11，即85%被取代)，对于具有7-11个硒的蛋白质种类获得了各个峰。实施例6 结构确定和精细化使用单波长异常衍射(SAD)法确定结构，其使用如实施例5中所述的部分硒代甲硫氨酸化蛋白质。部分硒代甲硫氨酸化蛋白质实际上产生比野生型更大的单晶体。在ESRF 的射束BM14上，在空间群C222i以及晶胞尺寸为a = 92. 2，b = 94. 4，c = 220. 4埃的小晶体 (尺寸15x15x50微米)上收集2. 4埃分辨率的原始数据(图4)。在ID29上以2. 9埃的分辨率测定部分硒代甲硫氨酸标记的蛋白质晶体，以确定精细化结构，然后对于较大的晶体在ID14-EH1上以2. 3埃的分辨率测定，以精制结构。通过SAD法使用AUT0SHARP解析结构 (Vonrhein 等，2006)。发现 50/55 个硒原子位。使用 RESOLVE (TerwiIliger，2000)利用由硒位置确定的4次非晶体学对称改进相位和图，尽管发现在非对称单元中实际有五个分子 (溶剂含量55%)。它们以不常见的方式排列。命名为A-D的4个有序的分子(平均B因子约30A2)以4次点对称排列。第五个分子介导了晶体学C-轴方向上的四聚体堆积，但是是部分无序的(平均B因子约51A2)。在将相位转移成原始数据之后，ARP/VARP(Perrakis 等，1999)能够自动构建大部分结构。观察到与每个分子结合的Hi7GTP的明显剩余电子密度。利用REFMAC (Murshudov，1997)，对于每个分子中的大部分使用紧密NCS约束，对于作为整体的每个分子使用TLS参数，进行精制。最终R因子(R-自由度)为0. 186 (0. 235)，具有 293个水分子。根据M0LPR0BITY (Lovell等，2003)，如该服务器输出所示，结构品质非常优秀REMARK 40REMARK 40M0LPR0BITY STRUCTURE VALIDATIONREMARK 40M0LPR0BITY OUTPUT SCORESREMARK 40ALL-AT0M CLASHSC0RE 8 40
46
REMARK 40BAD R0TAMERS 34% 24/708 (TARGET 0-1% )REMARK 40RAMACHANDRAN OUTLIERS 00% 0/795 (TARGET 02% )REMARK 40RAMACHANDRAN FAVORED 977% 777/795 (TARGET 98 0% )PB2的帽结合结构域具有致密、高度有序的混合α 折叠，其具有显著的反向平行β -片层，包含链β 1、β 2、β 5、β 6和β 7，其堆积在包含α 、α 2、α 3和α 4螺旋的束上，最长的螺旋α 1和α 3大致以反向平行排列。β 2和β 5之间的连接延伸为长β发夹，其包含链β3和β4以及348-环，其与分子的螺旋侧相交叉。α2和α3之间晶序差的环称为420-环，突出到溶剂中(图4和图5)。在甲型流感病毒ΡΒ2帽结合结构域中，m7G 位于主要由Phe_323(来自β 1，更加朝向核糖堆叠)和Phe_404(来自螺旋α 的C端，更加朝向碱基堆叠)形成的疏水平台上，但是两者都不是精确地与碱基平行。这两个芳香残基是显著的五苯丙氨酸簇的一部分，其还包括Phe-325、Phe-330和Phe_363。在配体的溶剂侧，由之前未在此功能中观察到的残基类型His-357(来自β4的C末端)完成夹心。关键酸性残基是Glu-361，其与鸟嘌呤的附和N2位以氢键键合，Lys-376也通过与06的相互作用参与碱基特异性识别(图6、7和10)。对于帽结合蛋白来说不寻常的是，没有与核糖羟基的直接相互作用。三磷酸向碱基弯曲。α-磷酸与His-432和Asn-429相互作用，γ-磷酸与碱性残基His-357、Lys-339和Arg-355相互作用。实施例7 帽结合位点的突变分析为了验证结构上观察到的蛋白质-配体相互作用对于体外帽结合是重要的，我们使用QuickChange位点定向诱变试剂盒(Stratagene)制备了与Hi7GTP接触的七个残基的丙氨酸突变(F323，F325，E361，F363，F404，H357，K376)。这些单点突变体预期显示帽结合活性降低，通过其在4°C下结合Hi7GTP-S印harose树脂的能力对其进行评估(表4，图12)。如实施例3中针对野生型PB2所述对突变体进行纯化。在大肠杆菌中突变体F363A表达不佳，并且溶解度差，可能是由于错误折叠，不对其进行进一步的研究。突变体H357A、E361A、K376A 和F404A良好地表达为可溶形式，但是在测定条件下不结合Hi7GTP-S印harose，而F323A具有弱的结合活性(图12)。出人意料地，突变体F325A尽管表达不佳，但几乎与野生型一样地结合树脂。我们显示该突变体的活性是强温度依赖性的(表3)。还制备了 H357W取代，与预计改善朝向碱基的堆叠一致，该突变体结构域显示Hi7GTP结合增强。结果显示于图12 和表4。实施例8 使用表面等离振子共振测定对帽结合亲和件讲行定量分析为了对多种突变体的结合亲和性提供更为量化的比较，我们用具有固定化的帽结合结构域和m7GTP作为分析物进行了表面等离振子共振(surface ρlasmon resonance, SPR)测定。SPR 分析在装有 CM5 传感器芯片(Biacore AB Uppsala, Sweden)的 Biacore T100仪器上进行。将野生型和突变体PB2帽结合结构域在IOmM醋酸钠pH6. 0中稀释到 50 μ g/mL，并使用标准胺偶联化学将其固定在传感器表面。活化/去活化的传感器表面作为参比。将0. 47-lmM的m7GTP、m7GpppG和GTP两倍连续稀释物以30 μ 1/分钟的流速注射到已固定ΡΒ2蛋白和参比表面上。运行缓冲液是IOmM Hepes, ρΗ 7. 4，其含有150mM NaCl 和ImM DTT。为了测试温度对结合的作用，在5、15、25和37°C下进行实验。使用双参比处理所有获得的传感图，通过使用Biacore T100评价软件进行的稳态亲和评价确定平衡解离常数。由于与固定化相关的表面化学和分子取向可影响该值，所以这些被称为“表观”解离常数。误差与软件所报告的拟合相关。使用不同蛋白质固定的实验之间的变异<25% (数据未显示)。在25°C下获得的表观平衡解离常数Kd结果(表1)显示与Hi7GTP-S印harose 结合结果一致的趋势，H357W突变体具有最高的亲和力(Kd = 24士3uM)，然后是野生型(Kd =177士34uM)，E361A和K376A突变体具有最低的亲和力(KD > 1500uM)。表1 在25°C下由SI3R测定的Hi7GTP与PB2帽-结合结构域的不同点突变体之间相互作用的表观平衡解离常数(Kd)。
权利要求
可溶性多肽片段，其中所述多肽片段(i)来自流感病毒RNA依赖性RNA聚合酶亚基PB2或其变体，并且(ii)能够结合RNA帽或其类似物。
2.权利要求1的多肽片段，其中所述多肽片段被纯化至适于进行结晶的程度。
3.权利要求1或2的多肽片段，其中流感病毒RNA依赖性RNA聚合酶亚基PB2来自甲型、乙型或丙型流感病毒或其变体。
4.根据权利要求1至3任一项的多肽片段，其中(i)N端与SEQID NO 1的PB2氨基酸序列中220位或更高位氨基酸相同或相对应，C 端与其510位或更低位氨基酸相同或相对应，(ii)N端与SEQID NO 2的PB2氨基酸序列的222位或更高位氨基酸相同或相对应，C 端与其511位或更低位氨基酸相同或相对应，或者(iii)N端与SEQID NO :3的PB2氨基酸序列的227位或更高位氨基酸相同或相对应， C端与其528位或更低位氨基酸相同或相对应，以及以上的变体，其保留与RNA帽或其类似物相结合的能力。
5.根据权利要求4的多肽片段，其中所述多肽片段具有选自以下的氨基酸序列或者与其相对应SEQ ID NO :4至13的氨基酸序列及其变体，其保留与RNA帽或其类似物相结合的能力。
6.包含权利要求1至5中任一项所述多肽片段以及RNA帽或其类似物的复合物。
7.根据权利要求6的复合物，其中所述帽类似物选自m7G、Hi7GMP,m7GTP, m7GpppG、η77111rJm GpppGmλ m GpppAΛ m GpppAmΛ m GpppC、m GpppCm、m GpppU 禾口 m GpppUm0
8.根据权利要求6的复合物，其中所述多肽片段由SEQID NO :11的氨基酸序列组成，所述帽类似物是m7GTP，所述复合物具有如图18所示结构坐标定义的结构。
9.根据权利要求8的复合物，其中所述复合物具有空间群为C222i的晶型，晶胞尺寸为 a = 9. 2nm，b = 9. 4nm ；c = 22. Onm (士 0. 3nm)。
10.根据权利要求8和9的复合物，其中所述晶体以为3.0埃或更高、优选2. 4埃或更高的分辨率衍射X射线。
11.编码权利要求1至5中任一项所述分离多肽的分离的多核苷酸。
12.包含权利要求11所述分离多核苷酸的重组载体。
13.包含权利要求11所述分离多核苷酸或者权利要求12所述重组载体的重组宿主细胞。
14.鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法，其包括下列步骤(a)构建如图18所示权利要求8所述复合物的结构坐标所定义的所述结合口袋的计算机模型；(b)通过选自下列的方法选择潜在的结合化合物 (i)将分子片段组装成所述化合物，( )从小分子数据库中选择化合物，和 (iii)从头设计所述化合物的配体；(c)利用计算工具进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算，以提供所述化合物在所述结合口袋中的能量最小化构型；以及(d)评价所述拟合运算的结果，以对所述化合物与所述结合口袋模型之间的结合进行定量，由此评价所述化合物与所述结合口袋相结合的能力。
15.根据权利要求14的方法，其中所述结合口袋包含SEQID NO=I的PB2的氨基酸 Phe323、His357和Phe404或与其相对应的氨基酸。
16.根据权利要求15的方法，其中所述结合口袋还包含SEQID NO 1的PB2的氨基酸 Phe325、Phe330和Phe363或与其相对应的氨基酸。
17.根据权利要求15或16的方法，其中所述结合口袋还包含SEQIDNO 1的PB2的氨基酸Glu361和Lys376或与其相对应的氨基酸。
18.根据权利要求15至17中任一项的方法，其中所述结合口袋还包含氨基酸Ser320、 Arg332、Ser337 和 Gln406。
19.根据权利要求15至18中任一项的方法，其中所述结合口袋还包含SEQID NO :1的 PB2的氨基酸Lys339、Arg355、Asn429和His432或与其相对应的氨基酸。
20.根据权利要求14的方法，其中所述结合口袋由图18中PB2SEQID NO 1的氨基酸 Phe323、His357和Phe404的结构坐标来定义。
21.根据权利要求20的方法，其中所述结合口袋还由图18中PB2SEQIDN0:1的氨基酸Phe325、Phe330和Phe363的结构坐标来定义。
22.根据权利要求20或21的方法，其中所述结合口袋还由图18中PB2SEQID NO :1的氨基酸Glu361和Lys376的结构坐标来定义。
23.根据权利要求20或22中任一项的方法，其中所述结合口袋还由图18中PB2SEQID NO 1的氨基酸Ser320、Arg332、Ser337和Gln406的结构坐标来定义。
24.根据权利要求20至23中任一项的方法，其中所述结合口袋还由图18中PB2SEQID NO 1的氨基酸Lys339、Arg355、Asn429和His432的结构坐标来定义。
25.根据权利要求20的方法，其中PB2多肽变体的结合口袋与所述结合口袋的氨基酸 Phe323、His357和Phe404的主链原子具有不超过2. 5埃的均方根差。
26.根据权利要求14至25中任一项的方法，其还包括下列步骤(e)合成所述化合物，并任选地将所述化合物或其可药用盐与一种或多种可药用赋形剂和/或载体配制在一起。
27.根据权利要求26的方法，其还包括下列步骤(f)将所述化合物、权利要求1至4中任一项的多肽片段或者根据权利要求12的重组宿主细胞与RNA帽或其类似物相接触，以确定所述化合物抑制所述PB2多肽片段与所述RNA 帽或其类似物之间结合的能力。
28.可通过权利要求14至27的方法鉴定的化合物，前提为所述化合物不是m7G、m7GMP、 m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2_ 氨基-7-苯甲基-9- (4-羟基丁基)-1，9- 二氢嘌呤-6-酮、T-705或m7Gppp (N) ，其中N是 A、Am、G、Gm、C、Cm、U或Um，并且能与PB2或其变体的RNA帽结合口袋结合。
29.可通过权利要求14至27的方法鉴定的化合物，前提为所述化合物不是m7G、m7GMP、 m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2_ 氨基-7-苯甲基-9- (4-羟基丁基)-1，9- 二氢嘌呤-6-酮、T-705或m7Gppp (N) ，其中N是 A、Am、G、Gm、C、Cm、U或Um，并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
30.一种鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法，包括以下步骤⑴将权利要求1至4的所述多肽片段或权利要求13的所述重组宿主细胞与测试化合物相接触，以及(ii)分析所述测试化合物结合PB2的能力。
31.根据权利要求30的方法，其还包括添加RNA帽或其类似物的步骤。
32.根据权利要求31的方法，其中分析所述测试化合物在所述RNA帽或其类似物存在下与PB2或其变体结合的能力，或者分析所述测试化合物抑制所述RNA帽或其类似物与PB2 或其变体结合的能力。
33.根据权利要求31或32的方法，其中所述RNA帽或其类似物在添加所述测试化合物之前、同时或之后添加。
34.根据权利要求30至33中任一项的方法，其以高通量形式进行。
35.根据权利要求30至34中任一项的方法，其中所述测试化合物是小分子。
36.根据权利要求30至34中任一项的方法，其中所述测试化合物是肽或蛋白质。
37.根据权利要求26、27或者30至36中任一项的方法，其中所述方法还包括将所述化合物或其可药用盐与一种或多种可药用赋形剂和/或载体配制在一起的步骤。
38.可根据权利要求27或37的方法产生的药物组合物。
39.可通过权利要求30至37中任一项的方法鉴定的化合物，前提为所述化合物不是 m7G、m7GMP λ m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、 m7GpppUm.2-氨基-7-苯甲基-9_(4_羟基丁基)_1，9_ 二氢嘌呤-6-酮、T-705或 ITi7Gppp (N) H5，其中N是A、Am、G、Gm、C、Cm、U或Um，并且能与PB2多肽、其变体或其片段结
40.可通过权利要求29至36中任一项的方法鉴定的化合物，前提为所述化合物不是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、 m7GpppUm、2-氨基-7-苯甲基-9_(4_羟基丁基)_1，9_ 二氢嘌呤-6-酮、T-705或 m7Gppp (N) H5，其中N是A、Am、G、Gm、C、Cm、U或Um，并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
41.针对PB2的RNA帽结合结构域的抗体。
42.根据权利要求41的抗体，其中所述抗体识别选自SEQID NO 14至22所定义多肽的多肽片段。
43.根据权利要求28、29、39或40的化合物、根据权利要求36的药物组合物或者根据权利要求41或42的抗体在制备用于治疗、改善或预防负链ssRNA病毒感染引起的疾病的药物中的用途。
44.根据权利要求43的用途，其中所述疾病是由包含博尔纳病毒科(Bornaviridae)、丝状病毒科(Filoviridae)、副粘病毒科(Paramyxoviridae)和弹状病毒科 (Rhabdoviridae)的单链负链病毒目(Mononegavirales)的病毒感染引起的。
45.根据权利要求43的用途，其中所述疾病由正粘病毒科(Orthomyxoviridae)、沙粒病毒禾斗(Arenaviridae)或布尼亚病毒禾斗(Bunyaviridae)弓丨起。
46.根据权利要求43的用途，其中所述疾病由选自以下的病毒引起博纳病毒、马尔堡病毒、埃博拉病毒、仙台病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞病毒、火鸡鼻气管炎病毒、印第安纳型水疱性口炎病毒、尼帕病毒、亨德拉病毒、狂犬病毒、牛流行热病毒、感染性造血组织坏死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、汉坦病毒、克里米亚_刚果出血热病毒、裂谷热病毒和La Crosse病毒
47.根据权利要求43的用途，其中所述疾病由选自以下的病毒引起甲型流感病毒、乙型流感病毒、丙型流感病毒、索戈托病毒和汉坦病毒。
全文摘要
本发明涉及流感病毒RNA依赖性RNA聚合酶亚基PB2的可溶性片段及其变体，及其包含RNA帽(RNA cap)类似物的结晶复合物。本发明还涉及使用所述复合物的结构坐标来筛选和设计与RNA帽结合口袋(RNA cap binding pocket)相互作用之化合物的计算方法。另外，本发明涉及通过使用PB2多肽片段(优选以高通量形式)来鉴定与包含RNA帽结合口袋的PB2多肽片段相结合的化合物的方法，所述化合物优选抑制与RNA帽或其类似物的相互作用。本发明还涉及用于治疗由负链单链RNA病毒引起的病毒感染疾病状况的包含所鉴定化合物的化合物和药物组合物。
文档编号A61K38/00GK101970465SQ200880119968
公开日2011年2月9日申请日期2008年10月9日优先权日2007年10月9日
发明者弗兰克·塔伦多, 德尔菲娜·吉利盖, 斯蒂芬·库萨克, 达伦·哈特申请人:欧洲分子生物学实验室(Embl)

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：斯蒂芬.库萨克;德尔菲娜.吉利盖;达伦.哈特;弗兰克.塔伦多
技术所有人：欧洲分子生物学实验室（ＥＭＢＬ）
我是此专利的发明人

上一篇：多步化妆品组合物的制作方法
上一篇：患者护理和治疗设备的信息和气动体系结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。