一种靶向作用于蛋白激酶非活性构象的化合物筛选方法

文档序号:6354622阅读:610来源:国知局
专利名称:一种靶向作用于蛋白激酶非活性构象的化合物筛选方法
技术领域
本发明属于蛋白质结构预测和药物分子虚拟筛选技术领域,具体涉及蛋白激酶的非活性构象的预测与筛选方法,蛋白激酶II型抑制剂对接构象的预测与虚拟筛选方法。
背景技术
随着人类基因组测序的完成,人们发现基因组中约有518种不同的基因编码了各类激酶,占了总基因数的洲左右。这个庞大的蛋白激酶家族调节着细胞内几乎方方面面的活动,包括信号的转导、DNA的转录以及细胞代谢、细胞周期的运行,进而控制着细胞的分化和凋亡。所以激酶的活化与失活关系重大,一旦产生异常便会导致各种疾病的发生,包括癌症、中枢神经系统紊乱、心血管疾病以及自体免疫失调等。正因为如此,长期以来蛋白激酶都被认为是最重要的药物靶点之一。尽管激酶家族的成员众多,但是X射线衍射得到的晶体结构表明所有蛋白激酶的催化结构域都十分的相似——一般由一个较小的N-Iobe和一个较大的C-Iobe组成, 在2个lobe之间存在一道裂缝,ATP结合位点以及对于磷酸基团转移重要的活性链段 (activation loop)都位于那里。几乎所有蛋白激酶在ATP结合位点附近都有一段3个氨基酸残基的序列一一 Asp-Phe-Gly (DTO),而Dre又同时处于活性链段的N端。这段基序的构象状态已经被证明对于激酶的活性具有决定性的作用。在活性状态下,Phe位于ATP结合位点附近的疏水腔中,而Asp位于腔外活性链段的另一侧(Dre-in构象);然而在一个被称为Dre-flip的变化发生后,激酶就会处于非活性状态。在这个状态下,这2个残基的位置恰恰相反Asp位于疏水腔侧,而Phe被旋转到外侧(Dre-out构象)。由于处于Dre-OUt构象的蛋白激酶是非活性的,这启发了人们去寻找结合这种结构的药物小分子来抑制激酶。这种小分子被称为二型(II型)抑制剂,它们能够诱导蛋白激酶形成非活性的Dre-OUt构象并占据由此产生的疏水腔。研究证明它们较之靶向激酶活性结构的type-I抑制剂具有更好的特异性和有效性。抗癌药物伊马替尼(imatinib)就是其中的一个例子。它能够特异性地结合BCR-ABL、c-Abl、c-Kit和PDGFR等激酶,从而治疗慢性骨髓白血病和其他癌症。基于受体结构的药物设计是现今新药开发中的一个重要手段。但是至今只有小部分的Dre-OUt晶体结构被人们得到,所以在结构数据上存在的空缺大大延缓了发现新II 型抑制剂的进度。在2008年ftOtein Data Bank的哺乳动物激酶数据中,70%以上的结构都是Dre-in构象的,2 处于过渡构象,还有约3%的结构是II型抑制剂不相容的Dre-out 结构。因此,目前已知的激酶结构数据绝大部分都无法用于基于受体结构的II型抑制剂的开发研究。为了解决这个问题,发展出一种能从已有的大量激酶Dre-in构象得到相应的 DFG-out构象的计算模拟方法至关重要。目前提出一个可能的Dre-flip的机制分为3个步骤活性构象Dre-in/ α C-in 过渡构象Dre_in/ α C-out 非活性构象Dre_out/ α C_in。在最近以c-Abl为对象的研究中发现,DR;中Asp的质子化对产生DTO-out构象起着关键的作用,Shan et al.用分子动力学(MD)的方法成功模拟出了从DTO-in到DTO-out 构象的变化(Sian ei a义,Proc Natl. Acad. Sci. U. S. A, 2007, Vol 106: 139-144), 发现对于Asp和Phe来说最重要的是它们所处的环境的改变。在Dre-in构象中,Asp处于一个极性、充满电荷的水性坏境中,而Phe处于一个疏水的环境中。在发生Dre-flip之后, 情况正好相反,Phe处于极性的环境而Asp处在一个几乎疏水的环境。电荷在疏水的环境中要以极大的自由能为代价,所以Asp的质子化是十分重要的。同时,在Dre-in的构象中 Asp骨架的扭转角是一个高能状态,而Phe此时就处在疏水环境来使能量达到平衡。Sian et al.和过去的研究都暗示着Dre-in可能并不是一个能量最低的构象而是一个在功能上最优化的结构。Dre-flip可能是用来在磷酸化后促进ADP的释放,而这在激酶催化反应中是一个重要的限速步骤。因此蛋白激酶的Dre-in和Dre-out构象的能量很可能是相近的, 它们都是最低的能量构象并在实际溶液中处于动态平衡。另一方面,Kufarevaet al.尝试使用所谓的 DOLPHIN (deletion-of-loop Asp-Phe-Gly-in)模型来筛选药物小分子,即直接将DTO-in构象的激酶中包含DTO的6个残基删除后的模型来预测II型抑制剂的结合构象以及虚拟筛选,取得了意想不到的效果 (Kufareva et al. , Journal of Medicinal Chemistry, 2009, Vol51: 7921—7932)。这说明除了 Dre以外,激酶的其他部分也存在与II型抑制剂结合有关的决定性结构信息。目前,虽然对药物敏感的肺结核是可以治愈的,但是需要很长的疗程并使用多种药物。不仅如此,对于结核分枝杆菌(MyccAacterium tuberculosis)来说,出现了越来越多的抗药性菌种,而且如何有效地控制肺结核的传染也面临严峻的挑战。另外,大量出现的多药抗性的菌种等(至少抗利福平和异烟胼)都表明发现新的治疗肺结核的药物已经刻不容缓。另一方面,在结核分枝杆菌中,Ser/Thr蛋白激酶已发现可磷酸化几百种蛋白质底物。在11种结核杆菌的kr/Thr蛋白激酶中有2种是可溶的;还有9种被推测为跨膜受体一N端是类似真核激酶的催化结构域,通过单一跨膜螺旋与胞外感受器结构域连接。以结核杆菌的跨膜受体激酶PknB为例,它对结核分枝杆菌的生长至关重要。其磷酸化底物涉及肽聚糖的合成、细胞分裂、应激反应、转录、代谢调控以及其他义!·/!!!!·蛋白激酶。这使得结核杆菌中的蛋白激酶成为一个潜在的药物靶点。PknB的催化结构域是细菌激酶中第一个得到结构的,其活性构象显示出与原核生物的Ser/Thr激酶相似的特征,这一结构在其他细菌的激酶家族成员中也相当的保守。

发明内容
本发明的第一个目的是为了能够既快速又准确地从大量已有的Dre-in构象来获得全原子的Dre-OUt构象模型,供II型抑制剂的筛选和分子对接使用。本发明的第二个目的是为了虚拟筛选出能抑制结核杆菌PknB激酶活性的小分子,从而找到新的抗结核病药物。本发明利用活性链段重塑的构象预测技术,对于每个蛋白激酶大约可产生31-55% 的Dre-OUt预测构象模型。这些Dre-OUt模型与其相应的χ射线衍射晶体结构有很高的相似性。本发明还提供了蛋白激酶活性状态的分类方法,按照Dre中Asp和Phe残基相对于活性链段所处的位置可以从预测之后的结果中挑选出Dre-OUt构象的模型。本发明还提供了分子对接后小分子构象聚类和筛选的方法。本发明预测得到的蛋白激酶Dre-OUt非活性构象能够很好的预测已知II型抑制剂的结合构象并从分子库中准确地识别出已知的II型抑制剂。具体而言,本发明提供一种预测蛋白激酶非活性构象的计算模拟方法,其步骤为
第一步,构建初始结构模型;
第二步,通过蛋白激酶的活性链段重塑,得到其各种可能的预测构象; 第三步,将得到预测构象按几何分类方法,进行Dre-in和Dre-OUt分类; 第四步,按活性位点的空间体积大小挑选预测出的Dre-OUt构象,构成可用于分子对接的非活性构象系综。进一步,本发明提供一种挑选II型抑制剂对接构象的方法,其步骤为
第一步,按照前面所述的方法来预测蛋白激酶的非活性构象,与小分子进行分子对
接;
第二步,通过分子对接构象的分析,排除一部分没有正确对接到活性位点的预测结
果;
第三步,通过构象聚类和对接能量排序来实现II型抑制剂对接构象的筛选。本发明还获得2个从Calbiochem筛选出来的对结核杆菌生长起抑制作用的小分子。抑菌实验证明它们具有明显的抑制结核杆菌生长的作用。下面对本发明内容进行具体描述。一、预测蛋白激酶非活性构象的计算模拟方法
从PDB(Protein Data Bank)数据库(www. rcsb. org)中下载附表1中这些既有DFG-in 又有Dre-out构象的蛋白激酶PDB文件。对所得的PDB文件进行预处理,去除其中的水分子或其他分子;如果是多聚体则取其中的一个单体。如果晶体结构中含有磷酸基团的话, 用MODELLER同源模建程序将其突变为原始残基。对于缺少残基的蛋白激酶也同样采用 MODELLER程序以自身为模板进行补齐。然后将所得的PDB文件用Rosetta软件的relax功能进行优化得到初步的起始模型。将优化后的模型与Dre-out晶体结构叠加后发现,两者之间在N-Iobe之间往往存在结构上的不同。如附图IA所示,蛋白激酶LCK的Dre-out晶体结构较之优化模型有明显的向外旋转的变化,使得它在II型抑制剂的活性位点上有更大的空间。对于蛋白激酶来说,Dre-flip的发生以及II型抑制剂的结合都需要N-Iobe的外旋;而在DTO-in的晶体结构中,N-lobe,特别是其中的aC螺旋会更多的内旋,形成更紧密的结构,使得活性位点变得狭小。这个构象变化可以被看作是N-Iobe绕一个轴旋转所致。如附图IB所示,这个轴被定义为垂直于一个包含催化域坐标中心和αC螺旋的首尾残基在内的平面,并且穿过连接N-Iobe和C-Iobe的铰链区中点残基的一条直线。然后DTO-out构象的N-Iobe相对于相应的Dre-in构象向外旋转了大约5-15度。为了定量地描述由于N-Iobe旋转引起的激酶活性位点的大小,需要使用4个保守残基两两之间的4对距离之和。这4个保守残基是形成盐桥的Lys273和Glu288以及DTO中的Asp、Phe (残基编号取自PDB :3LCK);这4对距离是Lys273到Asp和Phe的距离以及Glu288到Asp和Phe的距离。如果这4个距离之和小于30 A,则认为活性位点过小;如果和大于32 A,则认为活性位点足够大了 ;介于30-32 A的情况则认为需要略微的放大。基于上述的观察,将N-Iobe需要旋转的情况分为以下3 类上述的距离之和大于32 A的N-Iobe不需要旋转;介于30-32 A的将其N-Iobe外旋5 度;小于30 A的需要外旋15度(附表2)。在旋转之后,初始结构模型的N-Iobe与晶体 Dre-out结构的就非常相似了(附

图1C)。为了预测激酶的Dre-out构象,我们提出的活性链段重塑方法是通过Rosetta 3 软件的的“loop_relaX”功能来进行具体实施的。Rosetta 3是一款获得公认的蛋白质结构预测软件。它的loopmodeling功能可以设定目标蛋白质的若干片断为对象,对其进行重新的结构预测,运用模拟退火等算法寻找目标片断的最低能量构象。为了进行活性链段重塑,我们首先需要从蛋白激酶的FASTA序列得到其 fragments文件,其中包含了蛋白质片段的结构信息;然后设定需要重塑的链段在蛋白质中的位置,其中设定的链段对象具体是以Dre基序之前第二个残基为起始,蛋白激酶活性链段的C末端为结尾的;以这段序列中位于中点附近最亲水的残基为剪切断点;最后设定文件所在的路径以及默认的参数之后递交计算机进行计算。在活性链段重塑之后,对结果的侧链进行全原子优化来获得最终的全原子最低能量构象。流程如附图2。对于每个激酶来说,将独立地产生200个全原子最低能量模型。在一台普通Intel Pentium IV电脑上产生一个这样的模型需要3_4个CPU时。对于附表1中的每个蛋白激酶来说,大约有31-55%的预测模型为Dre-out构象。这些Dre-out模型与其相应的X射线衍射晶体结构用TM-align程序进行了对比,对比产生的C α -RMSD和TM-score值就列于附表 3。附表3的结果显示预测模型相对于晶体结构的RMSD平均值都低于3 A而TM-score的平均值都大于0. 85,表明预测出的Dre-out模型与晶体结构具有很高的相似性。和DFG-out 分类
对于获得的模型,首先要将它们按Dre-in、DFG-out和过渡构象进行分类。根据Dre-flip的定义,Asp和Phe的位置几乎翻转了 180°,也就是说在DTO-f Iip 的前后Asp和Phe分别位于主链的两侧,如附图3所示。这样的话,通过将得到的模型与初始的Dre-in结构进行叠加,如果模型的Asp和Phe残基和相应的DTO-in结构中的这2个残基都位于同侧的话,那么就认为它也是Dre-in构象的;如果情况正好相反的话,那么就把它归为Dre-out那类;其它所有的模型都认为是过渡构象。而残基的位置就通过构建向量的方法来进行判别。最终如附图;3B所示取出模型和初始Dre-in结构中各4个点的坐标后,即Asp的 Cy原子、Asp的Ca原子、Phe382的Ca原子和Wie382的Cy原子,分别标为Rl、R2、R3、R4 和Rl'、R2’、R3’、R4’。然后我们就能得到8个向量,即
r21=Rl-R2 ;r23=R3-R2 ;r32=R2-R3 ;r34=R4-R3 ;
r21' =Rl' -R2,;r23' =R3' -R2' ;r32' =R2' -R3' ;r34' =R4' -R3'。以r21、r23、r21'、r23'为例,我们注意到r21X 后所得向量的方向是向下的,而 r21' Xr23'后所得向量的方向是向上的,所以叉乘得到的2个向量夹角必然为一钝角,即这两个向量的点乘小于O。因此我们还需要将上述8个向量叉乘后得到4个向量
P「r21 X ^23 P2_r34 X ^32 Pl "^21 X ^23 P2 "^34 X ^32最终,将所有模型和已有的Dre-OUt构象叠加,并取出上述8个点,计算各个向量并规定若?171’<0且1)272’ < 0,那么就认为模型是一个Dre-OUt构象;若?1* 1’ > O且 P2-P2' > 0,那么就认为模型是一个Dre-in构象;其它的就认为是过渡构象。模型的选择
为了进一步分析已知Dre-OUt结构中活性位点的疏水腔,使用PASS(PutatiVe Active Sites with Spheres)程序来探测活性位点附近可能的结合位点。PASS的结果显示在 DFG-out结构的活性位点存在有3个结合口袋。例如,如附图ID所示,ABLl的DTO-out结构的三个结合口袋中心被分别显示为Bp化和 。这三个口袋也同时被keliger et al. 分别定义为疏水区I、腺嘌呤口袋以及异构位点。为了定量的描述这3个口袋,使用LIGSITE 程序来计算口袋中相距1 A的格点数。LIGSITE所得格点数的多少直接与腔的大小有关。为了有个直观的认识,简单地将格点数转化为1 g ml—1密度的水分子个数,即将活性口袋中的格点放入一个足够大的水盒子中,并且认为任何离格点最近距离大于1. 6 A的水分子是未被占据的。一些已知的Dre-out结构中占据上述活性口袋的水分子个数列于附表4(一些在附表1中列出的Dre-out晶体结构由于其活性链段上有缺失的残基,所以它们活性口袋中占据的水分子数未在附表4中列出)。水分子数据同样说明一个足够大的活性位点疏水腔对于II型抑制剂的结合来说是至关重要的。经过几次的测试,确定使用活性腔中能包含大于20个水分子为标准来选择Dre-out模型,构成可用于分子对接的非活性构象系综。 并用于后续的抑制剂结合构象和虚拟筛选的试验。上述步骤1-4的流程图见附图4。型抑制剂对接构象的方法
第一步,DFG-out模型系综分子对接
本发明使用AutoDock 4. 2来进行抑制剂结合构象预测和虚拟筛选中的分子对接。将之前的4位点定义为分子对接的中心,对接的格点盒子大小为60X60X60 A0对于每个蛋白激酶的每个Dre-out模型与其对应的II型抑制剂小分子计算20次对接结果,其他关于分子对接算法的参数都按照默认的进行设置。最终,每个配体-Dre-out构象对有20个对接构象产生。它们都要被集中起来进行下一步的构象选择分析。由于分子对接软件将蛋白受体作为刚性分子来处理,且对于每个蛋白激酶来说, 预测出的抑制剂结合构象可能是非常多的,所以单纯通过AutoDock的打分来判断难以得到正确的结果。首先要排除一部分没有正确对接到活性位点的预测结果。对于一个抑制剂的预测构象来说,如果其中没有一个原子与之前定义的化或 距离在3 A以内,则它就被认为是位于活性位点之外而被排除。剩下的构象用聚类的方法,即使用一个较大的RMSD (均方根偏差,是常用来表示两个结构间差异的参数)值阈将其进行大致的分类。每个类群中能量最低的构象就会被认为是这个类群的代表构象,而与它结合的Dre-out模型就被认为是相应的Dre-out代表模型。而这些代表构象最后再按照对接能量打分重新排序——拥有最低能量代表构象的类群就被指定为第一类群,以此类推。具体流程见附图5。对于附表1中的每个激酶-抑制剂对,分子对接的结果经过筛选和聚类会得到了 1 个、2个或3个类群及其代表构象。其中类群的个数取决于抑制剂在活性位点对接的取向 如果所有的构象都只有一个相近的取向,那么它们通常被归类在一起;如果有2个或3个类群存在的话,那么就表示存在2个或3个不同的对接取向。特别在2个类群的情况中,它们的取向往往是正好相反的。然后,将所有的代表构象与晶体复合物中抑制剂的结构进行了对比,其中重原子RMSD的结果列于附表5中。由于对于大部分的配体来说,它们RMSD最小的结果就是第一类群的代表构象,那么其它类群代表构象的RMSD值就不再列出了。在附表 5所列的结果中,大部分代表构象相对于晶体结构的RMSD值都低于2 A或在2 A附近。对于一些抑制剂,存在2个或3个代表构象,其中一个与X射线衍射晶体结构相似,而有一个较小的RMSD值;其它代表构象与晶体结构的取向不同或相反而有一个较大的RMSD值。然而,在所有的结果中,只有一个激酶-抑制剂对(ABLl-PRC)的最低RMSD构象是第二类群中的代表构象。从这个角度来说,这些抑制剂的预测构象其取向都与晶体结构能很好的符合, 准确率接近96%。这点也可以从附图6抑制剂预测构象与晶体结构叠加图中看出。第三步,药物的虚拟筛选
将小分子库与蛋白激酶预测出来的非活性构象系综进行分子对接,将结果经上述步骤挑选和聚类,并将第一类群的代表构象作为该Dre-OUt预测构象-小分子对的对接结果,按代表构象的对接能量排序来确定可能的II型抑制剂。方法验证时所用的小分子库含有750种抑制剂的Calbiohem分子库和已知的II型抑制剂,根据它们在最后排序表中的位置做相应的ROC (receiver operating characteristic curve,受试者工作特征曲线)图,ROC曲线下的面积即为AUC (Area Under the ROC Curve,即ROC图曲线下面积)值。最后所得的AUC值全部都大于0. 9,说明预测得到的Dre-out模型对它们的II型抑制剂有很好的选择性,见附图7。附表说明
表1本发明中用于验证方法可靠性的7种蛋白激酶,其活性与非活性构象的PDB ID 以及相应的II型抑制剂。表2 DFG-in初始模型所需作的3类外旋,按照4个保守残基的4对距离之和来确定其外旋的程度。表3 本发明方法预测所得7中蛋白激酶的非活性模型的统计及其与已知结构的叠加对比所得Ca-RMSD和TM-score值。表4具有type-II抑制剂的Dre-out晶体复合物其活性位点所能容纳的水分子数目。表5 II型抑制剂的预测最低能量的代表构象与晶体结构对比的RMSD值。表 权利要求
1.一种预测蛋白激酶非活性构象的计算模拟方法,其特征在于具体步骤为 第一步,构建初始结构模型从PDB数据库中下载既有Dre-in又有Dre-out构象的蛋白激酶PDB文件;对所得的 PDB文件进行预处理,去除其中的水分子或其他分子;如果是多聚体则取其中的一个单体, 如果晶体结构中含有磷酸基团,用MODELLER同源模建程序将其突变为原始残基,对于缺少残基的蛋白激酶也同样采用MODELLER程序以自身为模板进行补齐;然后将所得的PDB文件用Rosetta软件的relax功能进行优化得到初步的起始结构模型; 第二步,蛋白激酶的活性链段重塑采用Rosetta 3软件的的“loop^elax”功能来进行蛋白激酶的活性链段重塑,按 Rosetta 3的loopmodeling功能,设定目标蛋白质的若干片断为对象,对其进行重新的结构预测,运用模拟退火等算法寻找目标片断的最低能量构象;其中,首先从蛋白激酶的FASTA序列得到其fragments文件,然后设定需要重塑的链段在蛋白质中的位置,其中设定的链段对象具体是以Dre基序之前第二个残基为起始,蛋白激酶活性链段的C末端为结尾的;以这段序列中位于中点附近最亲水的残基为剪切断点;最后设定文件所在的路径以及默认的参数,然后递交计算机进行计算;在活性链段重塑之后,对结果的侧链进行全原子优化,获得最终的全原子最低能量构象;第三步,将预测构象按几何分类方法,进行Dre-in和Dre-out分类对于重塑后获得的模型,按Dre-in、DFG-out和过渡构象进行分类;如果模型的Asp和 Phe残基和相应的Dre-in结构中的这2个残基都位于同侧,那么就把它归为DTO-in构象的;如果情况正好相反,那么就把它归为Dre-out构象的;其它所有的模型都归为过渡构象;第四步,Dre-OUt模型的选择使用PASS程序来探测活性位点附近可能的结合位点,以进一步分析已知Dre-OUt结构中活性位点的疏水腔,PASS的结果显示在Dre-OUt结构的活性位点存在有3个结合口袋, 这三个结合口袋中心被分别记为^、化和 ,这三个口袋et al.分别定义为疏水区I、腺嘌呤口袋以及异构位点;使用LIGSITE程序来计算口袋中相距1 A的格点数,将格点数转化为1 g πιΓ1密度的水分子个数,即将活性口袋中的格点放入一个足够大的水盒子中,并且认为任何离格点最近距离大于1.6 A的水分子是未被占据的;按活性腔中能包含大于20个水分子为标准来选择Dre-out模型,构成可用于分子对接的非活性构象系综。
2.根据权利要求1所述的方法,其特征在于第一步中,优化后的模型与Dre-out晶体结构叠加后,两者在N-Iobe之间存在结构上的不同;这个构象变化是N-Iobe绕一个轴旋转所致;这个轴被定义为垂直于一个包含催化域坐标中心和αC螺旋的首尾残基在内的平面,并且穿过连接N-Iobe和C-Iobe的铰链区中点残基的一条直线;然后DTO-out构象的 N-Iobe相对于相应的Dre-in构象向外旋转5_15度;其旋转方式按如下方式进行使用4个保守残基两两之间的4对距离之和;这4个保守残基是形成盐桥的Lys273和 Glu288以及DFG中的Asp、Phe ;这4对距离是Lys273到Asp和Phe的距离以及Glu288到 Asp和Wie的距离;如果这4个距离之和,大于32 A的,其N-Iobe不需要旋转;介于30-32 A的,将其N-Iobe外旋5度;小于30 A的,将其Ν-lobe外旋15度。
3.根据权利要求1或2所述的方法,其特征在于第三步中,4个残基的位置通过构建向量的方法来进行判别,具体步骤如下取出模型和初始Dre-in结构中各4个点的坐标,即Asp的Cy原子、Asp的Ca原子、 Phe382 的 Ca 原子和 Phe382 的 Cy 原子,分别标为 Rl、R2、R3、R4 和 Rl’、R2'、R3'、R4',得到8个向量r21=Rl-R2 ;r23=R3-R2 ;r32=R2-R3 ;r34=R4-R3 ; r21' =Rl' -R2' ;r23' =R3' -R2' ;r32' =R2' -R3' ;r34' =R4' -R3'; 将上述8个向量叉乘后得到4个向量 P「r21 X ^23 P2_r34 X ^32 Pl "^21 X ^23 P2 "^34 X ^32 最终,将所有模型和已有的Dre-out构象叠加,并取出上述8个点,计算各个向量,并规定Sp1T1V OJ. P2-P2' < 0,那么就认为模型是一个Dre-OUt构象;若?1* 1’ > ο且 P2-P2' > 0,那么就认为模型是一个Dre-in构象;其它的就认为是过渡构象。
4.一种靶向作用于蛋白激酶非活性构象的化合物筛选方法,其特征在于具体步骤为 第一步,按照权利要求1、2或3所述的方法来预测蛋白激酶的非活性构象,与小分子进行分子对接;第二步,通过分子对接构象的分析,排除一部分没有正确对接到活性位点的预测结果;第三步,通过构象聚类和对接能量排序来实现II型抑制剂对接构象的筛选; 第一步中,使用AutoDock 4. 2来进行抑制剂结合构象预测和虚拟筛选中的分子对接; 将之前的B2位点定义为分子对接的中心,对接的格点盒子大小为60X60X60 A ;对于每个蛋白激酶的每个Dre-out模型与其对应的II型抑制剂小分子计算20次对接结果,其他关于分子对接算法的参数都按照默认的进行设置;最终,每个配体-Dre-out构象对有20个对接构象产生;第二步中,对于一个抑制剂的预测构象来说,如果其中没有一个原子与之前定义的化或 距离在3 A以内,则它就被认为是位于活性位点之外而被排除;剩下的构象用聚类的方法,即使用一个较大的RMSD值阈将其进行大致的分类;每个类群中能量最低的构象被认为是这个类群的代表构象,而与它结合的Dre-OUt模型就被认为是相应的Dre-OUt代表模型;这些代表构象最后再按照对接能量打分重新排序一一拥有最低能量代表构象的类群就被指定为第一类群,以此类推;第三步中,将第一类群的代表构象作为该Dre-OUt预测构象-小分子对的对接结果,按代表构象的对接能量排序来确定可能的II型抑制剂,实现药物的虚拟筛选。
全文摘要
本发明属于蛋白质结构预测和药物分子虚拟筛选技术领域,具体为一种靶向作用于蛋白激酶非活性构象的化合物筛选方法。本发明包括蛋白激酶活性链段构象预测方法,从激酶的DFG-in活性构象来产生相应的DFG-out非活性构象;还包含II型抑制剂对接后结合构象的挑选方法,用于构象预测和虚拟筛选中小分子的挑选。本发明已经在7种已知非活性构象的蛋白激酶上进行了计算验证,成功率接近96%。本发明方法已用于预测结核杆菌的PknB蛋白激酶的非活性构象,并虚拟筛选了PknB可能的II型抑制剂,经抑菌实验验证,已发现2种小分子已证明具有抑菌作用。
文档编号G06F19/10GK102156823SQ20111004032
公开日2011年8月17日 申请日期2011年2月18日 优先权日2011年2月18日
发明者万波, 张雪莲, 徐旻, 王洪海, 黄强 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1