一种基于阶段性多策略的群体构象空间采样方法与流程

文档序号:13289024阅读:184来源:国知局
技术领域本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于阶段性多策略的群体构象空间采样方法。

背景技术:
生物细胞中有许多蛋白质(由2多种氨基酸所形成的长链),这些大分子在生物体中起着重要作用,对于完成生物功能至关重要。蛋白质分子在分子水平上反应了其结构与功能之间的重要关系,不同的蛋白质在生物体中起着不同的作用。蛋白质的空间结构往往决定了其功能,因此,蛋白质结构的预测对新蛋白的设计、药物设计、蛋白质稳定性预测以及蛋白质之间的相互作用建模至关重要。蛋白质的结构一般分为四个层次:一级结构(氨基酸序列)、二级结构(骨架原子间的相互作用形成的局部结构)、三级结构(二级结构在大范围内堆积形成的空间结构)和四级结构(描述不同亚基之间的相互作用)。尤其是,蛋白质的三维结构(天然态结构)是了解蛋白质的生物功能的关键。蛋白质三维结构可以通过核磁共振和X光晶体衍射等实验方法得到,然而这些实验测定方法不仅耗时而且极其昂贵,对于某些不易结晶的蛋白质来说不适用。因此,根据的Anfinsen的热力学假说(具有最低能量的构象被认为是天然态结构),很多计算算法被提出用于蛋白质结构预测。通过计算技术进行蛋白结构预测通常涉及一个评价代价极高的能量函数,其能量函数曲面通常具有成千上万的自由度和大量的局部最优解。在如此巨大的高维构象空间中进行采样极其困难。为了进行构象空间搜索,从头预测方法通常首先根据基于知识的粗粒度能量模型获得构象空间的全局最小解,然后对其对应的构象进行精修,从而得到预测结构。因此,从头预测方法需要解决两个问题:1.建立合适的能量函数来衡量蛋白质分子中不同原子的之间的相互作用;2.提出有效的构象空间搜索方法来搜索能量全局最小解。差分进化算法(DE)已被证明是进化算法中最简单且强大的随机性全局优化算法。由于其结构简单,易于实现,鲁棒性强和收敛速度快等优点已被成功应用于蛋白结构预测。然而,随着氨基酸序列的增长,蛋白质分子体系自由度也增大,利用传统群体算法采样获得大规模蛋白质构象空间的全局最小解成为一项挑战性的工作;传统群体进化算法在对构象空间采样时,在前期能够很快定位到最小解所在的区域,但是后期由于局部增强能力较弱,收敛速度较慢,而且很容易陷入局部最优,无法得到全局最小解。因此,现有的群体构象空间采用方法在采样能力及收敛速度方面存在不足,需要改进。

技术实现要素:
为了克服现有群体构象空间采样方法的在采样能力和收敛速度方面的不足,本发明提供一种提升采样能力、提高收敛速度、提高预测精度的基于阶段性多策略的群体构象空间采样方法。本发明解决其技术问题所采用的技术方案是:一种基于阶段性多策略的群体构象空间采样方法,所述采样方法包括以下步骤:1)给定输入序列信息;2)根据序列信息从QUARK服务器(http://zhanglab.ccmb.med.umich.edu/QUARK/)上得到距离谱文件profile,rpi为距离谱中记录下的残基对,Di为该残基对之间的距离,其中i∈(1,N),N为距离谱中残基对数量;3)设置参数:种群大小NP,算法的迭代次数G,交叉因子CR,阶段因子s,置迭代代数g=0;4)种群初始化:由输入序列产生NP个初始构象Ci,i={1,…,NP
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1