Bp神经网络预测二肽模型多极展开属性计算方法

文档序号:8396016阅读:574来源:国知局
Bp神经网络预测二肽模型多极展开属性计算方法
【技术领域】
[0001] 本发明属于量子力学与分子力学计算相结合,计算方法和人工智能领域,具体涉 及一种通过BP神经网络预测二肽模型多极展开属性的计算方法。
【背景技术】
[0002] 分子模拟(Molecular Simulation)是二十世纪后期发展起的一种基于计算机 的模拟方法。随着量子力学理论的完善、经验力场的更新换代以及计算机硬件发展所推 动的计算速度和容量提升,分子模拟的理论和方法得到了飞速的发展,并已经在众多学科 及应用领域发挥着关键作用。从模拟的原理进行区分,分子模拟可以分为两大类:理论 计算的量子力学模拟QM (Quantum Mechanics)和经验计算的分子力学模拟MM (Molecular Mechanics)。量子力学主要是指利用计算机技术进行的量子力学模拟和计算,即计算的量 子力学,它可以精确地表达电子的运动,能够得到依赖于电子分布的性质。因为大分子体 系在原子分辨率下包含数以千记甚至是万记的原子,所以对其进行动力学模拟是非常具有 挑战性的工作。QM巨大的计算量使得得到精确解变的非常耗时。分子力学模拟则是建立在 经验力场(Force field)的基础之上,是不同原子力场类型的定义及不同价键和非键能量 表达形式的集合体。与量子力学相比,分子力学忽略了电子运动,可以大大节约计算时间, 因而可用于计算包含上万个粒子数目的体系。从本质上说,分子力学是对真实势能函数的 近似拟合。由于忽略了电子的运动,分子力学无法获得那些取决于分子中电子分布的性 质。
[0003] 分子动力学模拟已经被广泛地应用于模拟生物分子体系。而进行分子动力学模拟 必须使用描述原子之间相互作用势的分子力场。目前,大多数使用的分子力场采用的是以 固定点电荷模型来描述静电相互作用。尽管量子力学与分子力学混合(QM/MM)的方法已经 被使用了很长的一段时间,但是由于它本身固有的点电荷模型以及单向极化作用,在很多 情况下应用依旧存在着很大的局限性。
[0004]目前,被广泛应用于生命科学领域中几种主要力场
[0005]力场 1: AMBER
[0006] AMBER(Assisted Model Building with Energy Refinement)力场是在生物大分 子的模拟计算领域有着广泛应用的一个分子力场。主要适用于比较小的蛋白质,核酸,多醣 等分子。最初AMBER力场是专门为了计算蛋白质和核酸体系而开发的,计算其力场参数的 数据均来自实验值。在AMBER力场中,-CH 2-和-CH3作为联合原子出现,并考虑氢键的相互 作用。AMBER力场的势能函数形势较为简单,所需参数不多,计算量也比较小,这是这个力场 的一大特色,但是总体来讲,AMBER力场的优势在于对生物大分子的计算,其对小分子体系 的计算结果常常不能令人满意,也在一定程度上限制了这个力场的扩展性。
[0007]力场 2: CHARM
[0008] CHARM (Chemistry at Harvard Macromolecular Mechanics)力场参数除 了来自 计算结果与实验值的比对外,还引用了大量的量子力学计算的结果。此力场可应用于研究 许多分子系统,包括小的有机分子、溶液、聚合物,生化分子等。CHARM力场能够进行能量优 化MD和MC模拟,并且可以应用周期边界条件,但它不支持氢键的计算。所以,几乎除了有 机金属分子外,通常皆可得到与实验值相近的数值。
[0009]力场 3:0PLS
[0010] OPLS(Optimized Potentials for Liquid Simulations)是一个模拟有机分子和 多肽的分子力场。它有组合原子模型(〇PLS_UA)和全原子模型(0PLS_AA)两种。它的键伸 缩和弯曲参数是由AMBER力场修改得到的。该力场致力于计算气态有机分子的构象能和纯 有机液体的水合自由能及其它热力学性质。
[0011]力场 4: AMOEBA
[0012] AMOEBA (Atomic Multipole Optimized Energetic for Biomolecular Simulation)是可极化分子力场,其是基于多极距离以及考虑了诱导偶极效应的一个力场, 此力场已经被提出了很多年,并广泛应用于生物科学领域。
[0013] 对于同一个需要计算的体系中氨基酸中的二肽模型的不同构象,现有的大多数力 场以各自的同一套参数对原子的物理化学参数进行描述。它们不考虑原子之间的极化效 应,这与现实的情况具有一定的差异。AMOEBA考虑这一现象,但依旧是对各种构象物理化学 参数的一种综合,达不到针对特定构象有其特定物理化学参数用以描述原子状态的程度。

【发明内容】

[0014] 为了克服现有力场的各种不足,本发明提出了一种基于BP神经网络预测二肽模 型多极展开属性的计算方法,本发明采用的技术方案是:
[0015] 基于BP神经网络预测二肽模型多极展开属性计算方法,包括以下步骤:
[0016] 通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学 参数及原子间相互距离;
[0017] 选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网 络,得到BP神经网络的物理化学参数;并通过剩余的二肽构象作为测试集验证BP神经网络 的预测结果。
[0018] 所述物理化学参数包括能量、电荷、偶极距、四极距。
[0019] 所述通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理 化学参数及原子间相互距离包括以下步骤:
[0020] 从数据库中选择二肽构象模型,并通过Gaussian软件优化得到二肽构象,经量子 力学计算得到二肽构象的能量、电荷、偶极距、四极距;通过二肽构象中各原子的位置得到 各原子之间的相互距离。
[0021] 所述选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经 网络包括以下步骤:
[0022] 将二肽构象的能量、电荷、偶极距、四极距作为BP神经网络的输出,将各原子之间 的相互距离作为BP神经网络的输入;随机选择数据库中的部分数据作为训练集数据用于 训练BP神经网络。
[0023] 所述通过剩余的二肽构象作为测试集验证BP神经网络的预测结果包括以下步 骤:
[0024] 从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能验证 神经网络的预测结果;
[0025] 从数据库中选择剩余的二肽构象模型,通过二肽构象与水分子之间的相互作用能 验证神经网络的预测结果;
[0026] 随机生成若干对二肽构象,通过随机生成的二肽构象之间的相互作用能验证神经 网络的预测结果;
[0027] 随机生成若干对二肽构象,通过随机生成的二肽构象与水分子之间的相互作用能 验证神经网络的预测结果。
[0028] 所述从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能 验证神经网络的预测结果包括以下步骤:
[0029] 从数据库中选择剩余的二肽构象模型,得到两个二肽构象之间的相对位置,并通 过量子力学计算软件Gaussian得到两个二肽构象之间的相互作用能A ;
[0030] 根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到两个二 肽构象之间的相互作用能B;
[0031] 将相互作用能A作为真值,通过统计分析误差验证预测结果。
[0032] 所述从数据库中选择剩余的二肽构象模型,通过二肽构象与水分子之间的相互作 用能验证神经网络的预测结果包括以下步骤:
[0033] 从数据库中选择剩余的二肽构象模型,得到二肽构象与水分子的相对位置,并通 过量子力学计算软件Gaussian得到二肽构象与水分子之间的相互作用能C ;
[0034] 根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到二肽构 象与水分子之间的相互作用能D;
[0035] 将相互作用能C作为真值,通过统计分析误差验证预测结果。
[0036] 所述随机生成若干对二肽构象,通过随机生成的二肽构象之间的相互作用能验证 神经网络的预测结果包括以下步骤:
[0037] 随机生成若干对二肽构象,得到两组二肽构象间的相对位置,并通过量子力学计 算软件Gaussian得到两组二肽构象间的相互作用能E ;
[0038] 根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到两组二 肽构象间的相互作用能F;
[0039] 将相互作用能E作为真值,通过统计分析误差验证预测结果。
[0040] 所述随机生成若干对二肽构象,通过随机生成的二肽构象与水分子之间的相互作 用能验证神经网络的预测结果包括以下步骤:
[0041] 随机生成若干对二肽构象,得到二肽构象与水分子之间的相对位置,并通过量子 力学计算软件Gaussian得到二肽构象与水分子之间的相互作用能G ;
[0042] 根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到二肽构 象与水分子之间的相互作用能H;
[0043] 将相互作用能G作为真值,通过统计分析误差验证预测结果。
[0044] 本发明具有以下有
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1