分子表面随机采样分析法对抗艾滋病药物活性的预测的制作方法

文档序号:6523356阅读:259来源:国知局
分子表面随机采样分析法对抗艾滋病药物活性的预测的制作方法
【专利摘要】分子表面随机采样分析法对抗艾滋病药物活性的预测,搭建抗艾滋病药物分子的二维与三维结构,得到分子中各个原子的Mulliken电荷布居数与笛卡尔坐标;生成分子的240个描述子,进行RASMS分析;进行逐步回归变量筛选;在抗艾滋病药物分子实测的实验活性值与分子结构参数化计算值间进行数学建模;构建抗艾滋病药物分子结构与性质/活性间关系的数学模型;在构建抗艾滋病药物分子数学模型中获得留一法交互检验复相关系数QCV;QCV值中选取最大复相关系数QCV;由对应最大复相关系数QCV的数学模型,确定最佳对药物活性的预测模型,用于预测没有经过实验测定的同类型药物的相关活性,具有计算过程简单、构象重叠容易等优点。
【专利说明】 分子表面随机采样分析法对抗艾滋病药物活性的预测
【技术领域】
[0001]本发明涉及计算机辅助药物分子设计【技术领域】,特别涉及分子表面随机采样分析法对抗艾滋病药物活性的预测。
【背景技术】
[0002]计算机辅助药物分子设计(Computer-Aided Drug Design, CADD)是近年来在药物开发领域一个非常活跃的研究方向,它涉及到分子图形学、计算机科学、药物化学、分子生物学等众多学科,其宗旨是以计算机作为药物设计的基本工具,结合相关专业知识对目标分子进行虚拟优化及筛选,以期达到最大限度提高合成药物的有效命中概率从而降低药物开发的成本及周期的目的。然而由于生物大分子三维结构测定困难使得基于配体分子结构与活性相关性研究即定量构效关系(Quantitative Structure-ActivityRelationship, QSAR)成为CADD的重要实现手段。60年代,由Hansch等提出了用于表达药物活性与其理化性质关系的Hansch-Fujita分析法以及Free等所创立的具有指示变量性质的Free-Wilson法成为该领域的先驱,并被成功应用于如诺氟沙星、二氢叶酸还原酶抑制剂等药物的设计当中。然而,由于该类方法都是建立在分子2D性质之上,难以很好表达药物配基与受体之间的立体作用效果。和2D方法比较3D方法在物理化学意义上更为明确并能直接反映药物分子作用过程中底物和受体之间的非键作用特征,因此在近年来3D-QSAR方法得到了迅速的发展。其中主要以Cramer等创立的比较分子场法以及一系列与其类似的方法如比较分子相似性分析、比较分子瞬时偶极分析、GRID分析等基于分子空间势场分布状态分析方法成为当今3D药物设计的主流。这一类方法最大的弊端是在进行一组分子构效研究时首先要对样本进行空间构象叠合,另外在立体网格划分、变量数目控制以及势场探针选取等方面所面临的问题同样不容忽视。对于其它分子设计方法诸如Crippen创立的几何距离法、Hopfinger等的分子形状分析、Raevsky等发展的氢键热力学、Jain 及 Walters 等基于虚拟受体提出的 COMPASS, GERM (Genetic Evolved Receptor Model)等也在不同程度上具有参数选取随意、计算过程复杂、构象重叠困难等多方面缺点。

【发明内容】

[0003]为了克服上述现有技术的缺点,本发明的目的在于提供分子表面随机采样分析法对抗艾滋病药物活性的预测,具有计算过程简单、计算结果物理意义明确,可解释性强的优点。
[0004]为了达到上述目的,本发明采取的技术方案为:
[0005]分子表面随机采样分析法对抗艾滋病药物活性的预测,包括以下步骤:
[0006]①使用ChemofTice8.0自动搭建抗艾滋病药物分子的二维与三维结构,使分子结构参数化,得到分子中各个原子的Mulliken电荷布居数与笛卡尔坐标;
[0007]②利用C语言自编程序Sampling-tool.EXE对药物分子表面进行随机采样,每个分子得到240个描述子,然后进行RASMS分析;[0008]③通过SPSS for Windows 16.0统计学软件包进行逐步回归(SMR)变量筛选;
[0009]④在抗艾滋病药物分子实测的实验活性值与分子结构参数化计算值间依据多元线性回归、偏最小二乘方法进行数学建模;
[0010]⑤构建抗艾滋病药物分子结构与性质/活性间关系的数学模型;
[0011]⑥在构建抗艾滋病药物分子数学模型中获得留一法交互检验复相关系数Qw ;
[0012]⑦Qcv值中选取最大复相关系数Qw ;
[0013]⑧由对应最大复相关系数Qct的数学模型,确定最佳对药物活性的预测模型,用于预测没有经过实验测定的同类型药物的相关活性。
[0014]本发明的有益效果是:
[0015]本文提出了基于虚拟蛋白质原子探针的分子表面随机采样分析:分析目标定位于受体与药物分子作用表面,避免了传统3D势场分析方法对分子内部与活性无关点的大量取样而造成的系统噪音;通过分子表面大规模随机采样来全面获取分子周围势场分布信息,从而避开了通常使用固定网格法划分空间所带来的问题,如分子叠合、网格大小选取等;该类方法是建立在分子3D性质之上,能很好表达药物配基与受体之间的立体作用效果。和2D方法比较3D方法在物理化学意义上更为明确并能直接反映药物分子作用过程中底物和受体之间的非键作用特征,并成功应用于对部分抗艾滋病药物的活性预测中。
【专利附图】

【附图说明】
[0016]图1为DABO活性的模型计算值及实验观测值相关。
[0017]图2为DAPY活性的模型计算值及实验观测值相关。
[0018]图3为PETT活性的模型计算值及实验观测值相关。
【具体实施方式】
[0019]下面结合实例及附图对本发明做详细描述。
[0020]以下将分子表面随机采样分析方法分别对74个DABO类化合物、34个DAPY类化合物与61个PETT类化合物共3类有机物的结构进行表征,使用Sampling-tool.EXE软件,每个化合物可得到240个描述子,并与其相应的活性建立多元线性回归模型,从而验证分子表面随机采样分析方法在分子定量结构活性关系研究的有效性。
[0021 ] ①74个DABO类化合物的QSAR研究
[0022]选取15个化合物为测试集样本(外部样本),并以剩余的59个作为训练集样本(内部样本),使用Chemoffice8.0自动搭建74个DABO类抗艾滋病药物分子的立体结构,用Chem3D自带的MOPAC半经验量子化学软件在AMl水平上最终优化得到分子结构(截断值
0.0OOlkJ/mol),并采用Mulliken布居分析法以单点形式计算出原子的净电荷数量,将分子中每个原子的空间位置及电荷分别以笛卡儿坐标和净电荷数目的形式输入实验室自编的C语言应用程序Sampling-tool.EXE加以处理,得到分子的240个描述子,计算得到192个非零矢量;继而通过SPSS for Windows 16.0统计学软件包对训练集59个化合物的192个非零变量进行逐步回归(SMR)变量筛选,SMR按Fisher显著性检验依次引入变量,并采取有进有出的原则。另外,依据N/M3 3 (N为样本容量,M为变量数)的经验规则,结合交互校验的复相关系数(Qct)变化情况,最终确定选用14变量回归模型,模型的标准化形式如下:
[0023]pIC50=12.150+2.927*E卜3+2.322*Sh — 278.249?!, — 313.048*Ε2_1(ι+0.090*Η4_8+4.702*Η7_8 - 2.926*Η5_8+7.854^^+0.842*5^-0.596*S4_2+1.551^1 — 4.364*S8_3+7.923*S2_3+1.71侧3_3
[0024]其中,E表不静电作用;S表不立体作用;Η表不疏水作用,如,E1-表不第I类探针与第3类原子之间的静电作用项,S3_8表示第3类探针与第8类原子之间的立体作用项,H7_8表示第7类探针与第8类原子之间的疏水作用项,以此类推。模型相关统计量为:样本数(N)为59,复相关系数(R_),标准差(SD)与统计量(F)分别为0.923,0.357,18.138 ;留一法交互检验的复相关系数(QCT),标准差(SDw)和统计量(Fct)分别为0.869,0.460和9.677。进一步对模型外部15个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qrart)为0.793。样本活性实验观测值与模型计算值相关情况见图1。
[0025]②34个DAPY类化合物的QSAR研究
[0026]选取7个化合物为测试集样本(外部样本),并以剩余的27个作为训练集样本(内部样本),使用Chem0fTice8.0自动搭建34个DAPY类抗艾滋病药物分子的立体结构,用Chem3D自带的MOPAC半经验量子化学软件在AMl水平上最终优化得到分子结构(截断值
0.0001kJ/mol),并采用Mulliken布居分析法以单点形式计算出原子的净电荷数量,将分子中每个原子的空间位置及电荷分别以笛卡儿坐标和净电荷数目的形式输入实验室自编的C语言应用程序Sampling-tool.EXE加以处理,得到分子的240个描述子,计算得到192个非零矢量;继而通过SPSS for Windows 16.0统计学软件包对训练集27个化合物的192个非零变量进行逐步回归(SMR)变量筛选,SMR按Fisher显著性检验依次引入变量,并采取有进有出的原则。另外,依据·N/M3 3 (N为样本容量,M为变量数)的经验规则,结合交互校验的复相关系数(Qct)变化情况,最终确定选用6变量回归模型,模型的标准化形式如下:
[0027]pC=8.233 — 3793.239*Ε8_6+0.743*Η8_8_0.601^^ — 68.751*Ε6_6+22.750*Ε8_3+1.0
3佩_5
[0028]其中,E表示静电作用;S表示立体作用;H表示疏水作用,如,E8_6表示第8类探针与第6类原子之间的静电作用项,S1^3表示第I类探针与第3类原子之间的立体作用项,H8_8表示第8类探针与第8类原子之间的疏水作用项,以此类推。模型相关统计量为:样本数(N)为27,复相关系数(R_),标准差(SD)与统计量(F)分别为0.953,0.132和32.841,留一法交互检验的复相关系数(Qw),标准差(SDct)与统计量(Fw)分别为0.849,0.231和
8.559。进一步对模型外部7个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qrart)为0.836。实验值和预测值的相关性如图2。
[0029]③61个PETT类化合物的QSAR研究
[0030]选取10个化合物为测试集样本(外部样本),并以剩余的51个作为训练集样本(内部样本),使用Chemoffice8.0自动搭建61个PETT类抗艾滋病药物分子的立体结构,用Chem3D自带的MOPAC半经验量子化学软件在AMl水平上最终优化得到分子结构(截断值
0.0OOlkJ/mol),并采用Mulliken布居分析法以单点形式计算出原子的净电荷数量,将分子中每个原子的空间位置及电荷分别以笛卡儿坐标和净电荷数目的形式输入实验室自编的C语言应用程序Sampling-tool.EXE加以处理,得到分子的240个描述子,计算得到192个非零矢量;继而通过SPSS for Windows 16.0统计学软件包对训练集51个化合物的192个非零变量进行逐步回归(SMR)变量筛选,SMR按Fisher显著性检验依次引入变量,并采取有进有出的原则。另外,依据N/M3 3 (N为样本容量,M为变量数)的经验规则,结合交互校验的复相关系数(Qct)变化情况,最终确定选用11变量回归模型,模型的标准化形式如下:
[0031]pIC50=2.380+3.153*Εη — 0.534*Η8_9 — 14.526*^_8 — 0.287^^+4.575*Η7_8+143.663*Η6_8+89.202*Η4_9 — 131.247*Ε7_9+148.779*Ε8_6+13.778*5^+9.373*?,
[0032]其中,E表不静电作用;S表不立体作用;H表不疏水作用,如,E1-表不第I类探针与第3类原子之间的静电作用项,S1,表示第I类探针与第10类原子之间的立体作用项,H8_9表示第8类探针与第9类原子之间的疏水作用项,以此类推。模型相关统计量为:样本数(N)为51,复相关系数(Reum),标准差(SD)与统计量(F)分别为0.919,0.392和19.321,留一法交互检验的复相关系数(Qw),标准差(SDct)与统计量(Fw)分别为0.856,0.515和
9.713。进一步对模型外部10个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qrart)为0.885。实验值和预测值的相关性如图3。
[0033]以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范 围内。
【权利要求】
1.分子表面随机采样分析法对抗艾滋病药物活性的预测,其特征在于,包括以下步骤: ①使用ChemofTice8.0自动搭建抗艾滋病药物分子的二维与三维结构,使分子结构参数化,得到分子中各个原子的Mulliken电荷布居数与笛卡尔坐标; ②利用C语言自编程序Sampling-tool.EXE对药物分子表面进行随机采样,每个分子得到240个描述子,然后进行RASMS分析; ③通过SPSSfor Windowsl6.0统计学软件包进行逐步回归(SMR)变量筛选; ④在抗艾滋病药物分子实测的实验活性值与分子结构参数化计算值间依据多元线性回归、偏最小二乘方法进行数学建模; ⑤构建抗艾滋病药物分子结构与性质/活性间关系的数学模型; ⑥在构建抗艾滋病药物分子数学模型中获得留一法交互检验复相关系数Qct; ⑦Qw值中选取最大复相关系数Qw; ⑧由对应最大复相关系数Qct的数学模型,确定最佳对药物活性的预测模型,用于预测没有经过实验测定的同类型药物的相关活性。
【文档编号】G06F19/18GK103678951SQ201310675709
【公开日】2014年3月26日 申请日期:2013年12月11日 优先权日:2013年12月11日
【发明者】仝建波, 赵翔, 钟黎, 周鹏, 程芳玲 申请人:陕西科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1