基于多目标粒子群优化的蛋白质结构预测方法与流程

文档序号:11590856阅读:378来源:国知局

本发明涉及生物医学领域,尤其涉及一种基于多目标粒子群优化的蛋白质结构预测方法。



背景技术:

蛋白质结构指的是三级结构,即指一条多肽链在二级结构或者结构域的基础上,进一步盘绕、折叠,依靠次级键的维系固定所形成的特定空间结构。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。目前通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高,需要耗费大量的成本和时间。近年来数据采集技术的飞速发展产生了海量的生物数据,因此需要发展计算性的方法来预测蛋白质结构,弥补生物数据产生能力和理解速度之间的差距。

蛋白质结构预测优化是指将初始的、精度不高的预测结构通过合适的搜索优化方法得到精度更高的蛋白质结构。当前蛋白质结构优化的方法主要可以分为两类:基于分子动力学模拟和蒙特卡洛模拟方法。基于分子动力学模拟的优化方法的基本原理是应用立场函数所描述的分子内和分子间相互作用,根据牛顿运动力学计算蛋白质在相空间中的轨迹,搜索出力场最低态。这种方法的精确性主要依赖于力场函数的精确性和模拟时间的长短。基于蒙特卡洛模拟的基本思想是使用玻尔兹曼分布函数实现在能量空间的搜索,同样也依赖于能量函数的精确性。

在蛋白质结构预测优化中,不论是基于分子动力学模拟还是蒙特卡洛模拟都依赖于力场函数或能量函数的精确性,但是目前我们缺乏准确的能量函数来有效的搜索。对于蛋白质而言,分子的力场包含许多参数包括原子的电荷、分子间的作用势等,由于复杂性导致目前存在的很多立场函数和能量函数没有能够得到广泛的应用。在蛋白质结构预测中,我们通过分子动力学模拟或者蒙特卡洛模拟等方法来搜索能量最低态的结构,而能量最低态的结构通常是接近于原始结构的,所以如果描述蛋白质结构能量的能量函数不准确,那么就难以搜索到接近于原始结构的状态。



技术实现要素:

针对上述现有技术中的不足,本发明提供一种基于多目标粒子群优化的蛋白质结构预测方法,采用多目标粒子群方法,针对力场函数或能量函数不准确的问题采用两个能量函数进行多目标搜索,具有有效性高和预测准确性高的优点。

为了实现上述目的,本发明提供一种基于多目标粒子群优化的蛋白质结构预测方法,包括步骤:

s1:在一待预测的蛋白质序列中选择需要优化的n个不同初始结构作为n个目标粒子,并将每一所述目标粒子的位置坐标以构象表示的形式表示,n为大于零的自然数;

s2:对一更新公式进行参数设置;

s3:根据所述更新公式对三目标能量公式进行迭代,并获得一更优解集;

s4:处理所述最优解集获得一最优解,并将所述最优解作为所述目标粒子的预测位置。

优选地,所述更新公式包括公式(1)和公式(2):

其中,w为惯性系数,k为迭代次数,c1为认知系数,c2为社会系数;为更新速度,所述更新速度表示第i粒子在第k次迭代过程中相比上一次迭代过程中改变结构的速度;rand为0~1之间的随机数;为历史最优结构;为全局最优结构,为第i粒子在第k次迭代过程中的所述位置坐标。

优选地,所述s2步骤中,初始化每一所述目标粒子的所述更新速度为0,并对一最大迭代次数、所述惯性系数、所述认知系数和所述社会系数进行设置。

优选地,所述目标能量公式包括rosetta能量函数、quark能量函数和charmm能量函数。

优选地,所述s3步骤进一步包括步骤:

s31:分别利用所述目标能量公式计算获得各所述初始粒子的一第一能量函数值、一第二能量函数值和一第三能量函数值;

s32:确定并选择各所述目标粒子中的非支配粒子,并将所述非支配粒子加入一更优解集;所述非支配粒子所对应的第一能量函数值为各所述第一能量函数值中的最小值,所述非支配粒子所对应的第二能量函数值为各所述第二能量函数值中的最小值,所述非支配粒子所对应的第三能量函数值为各所述第三能量函数值中的最小值,且所述第一能量函数值为各所述第一能量函数值中唯一的最小值或所述第二能量函数值为各所述第二能量函数值中唯一的最小值或所述第三能量函数值为各所述第三能量函数值中唯一的最小值;

s33:根据所述公式(1)更新各所述目标粒子所对应的所述更新速度;

s34:根据所述公式(2)更新各所述目标粒子的所述位置坐标;

s35:分别利用两所述目标能量公式计算获得各所述目标粒子的一所述第一能量函数值、一所述第二能量函数值和一所述第三能量函数值;

s36:确定并选择各当前所述目标粒子中的非支配粒子,并将该非支配粒子加入所述更优解集;

s37:判断迭代次数是否达到所述最大迭代次数;如否,返回步骤s33;如是,继续后续步骤。

优选地,所述s4进一步包括步骤:

s41:构建一效用函数,u=λ1f1+λ2f2+λ3f3,其中f1为所述第一能量函数值、f2为所述第二能量函数值、f3为所述第三能量函数值,λ1为第一权重、λ2为第二权重、λ3为第三权重,λ1、λ2和λ3的取值范围分别为[0,1]且λ1+λ2+λ3=1;

s42:对λ1、λ2进行n次随机采样,计算所述更优解集中每个非支配粒子所对应的期望效用e(u);

选取数值最大的一所述期望效用所对应的一所述非支配粒子作为所属最优解。

本发明由于采用了以上技术方案,使其具有以下有益效果:

对三目标能量公式进行迭代,通过多目标的优化方法,有效改善了采用单一能量函数不精确的问题。通过改进的粒子群算法,能够更有效地搜索。同时,本方法提高了整体检测的准确度。

附图说明

图1为本发明实施例的带有基于多目标粒子群优化的蛋白质结构预测方法的流程图。

具体实施方式

下面根据附图1,给出本发明的较佳实施例,并予以详细描述,使能更好地理解本发明的功能、特点。

请参阅图1,本发明实施例的一种基于多目标粒子群优化的蛋白质结构预测方法,包括步骤:

s1:在一待预测的蛋白质序列中选择需要优化的n个不同初始结构作为n个目标粒子,并将每一目标粒子的位置坐标以构象表示的形式表示,具体表现形式为φ和分别为对应目标粒子在蛋白质结构中的二面角,n为大于零的自然数。

s2:对一更新公式进行参数设置。

其中,s2步骤中,初始化每一目标粒子的更新速度为0,并对一最大迭代次数、惯性系数、认知系数和社会系数进行设置。

s3:根据更新公式对三目标能量公式进行迭代,并获得一更优解集;

目标能量公式采用目前已有的用来描述蛋白质结构的能量函数,本实施例中,目标能量公式采用rosetta能量函数、quark能量函数和charmm能量函数。

其中,s3步骤进一步包括步骤:

s31:分别利用三目标能量公式计算获得各初始粒子的一第一能量函数值、一第二能量函数值和一第三能量函数值;

s32:确定并选择各目标粒子中的非支配粒子,并将非支配粒子加入一更优解集;非支配粒子所对应的第一能量函数值为各第一能量函数值中的最小值,非支配粒子所对应的第二能量函数值为各第二能量函数值中的最小值,且第一能量函数值为各第一能量函数值中唯一的最小值或第二能量函数值为各第二能量函数值中唯一的最小值;

s33:根据公式(1)更新各目标粒子所对应的更新速度:

其中,w为惯性系数,k为迭代次数,c1为认知系数,c2为社会系数;为更新速度,更新速度表示第i粒子在第k次迭代过程中相比上一次迭代过程中改变结构的速度;rand为0~1之间的随机数;为历史最优结构;为全局最优结构;为第i粒子在第k-1次迭代过程中的位置坐标。

s34:根据公式(2)更新各目标粒子的位置坐标:

为第i粒子在第k次迭代过程中的位置坐标。

s35:分别利用三目标能量公式计算获得各目标粒子的一第一能量函数值和一第二能量函数值和一第三能量函数值;

s36:确定并选择各当前目标粒子中的非支配粒子,并将该非支配粒子加入更优解集;

s37:判断迭代次数是否达到最大迭代次数;如否,返回步骤s33;如是,继续后续步骤。

s4:处理最优解集获得一最优解,并将最优解作为目标粒子的预测位置。

其中,s4进一步包括步骤:

s41:以第一能量函数值、第二能量函数值和第三能量函数值的线性和构建一效用函数,u=λ1f1+λ2f2+λ3f3,其中f1为第一能量函数值、f2为第二能量函数值、f3为第三能量函数值,λ1为第一权重、λ2为第二权重、λ3为第三权重,λ1、λ2和λ3的取值范围分别为[0,1]且λ1+λ2+λ3=1;

s42:对λ1、λ2进行n次随机采样,计算更优解集中每个非支配粒子所对应的期望效用e(u);本实施例中,n大于等于10000;

选取数值最大的一所述期望效用所对应的一非支配粒子作为所属最优解。

本发明的方法可通过一种基于多目标粒子群优化的蛋白质结构预测系统实现,该系统包括:一初始结构表示模块、一多目标粒子群优化模块和一后续决策模块,初始结构表示模块与多目标粒子群优化模块相连,多目标粒子群优化模块与后续决策模块相连。

其中,初始结构表示模块用于将蛋白质结构通用的pdb(蛋白质三维结构数据文件)表示转化为便于计算的向量x,也即在一待预测的蛋白质序列中选择需要优化的n个不同初始结构作为n个目标粒子,并将每一目标粒子的位置坐标以构象表示的形式表示。

多目标粒子群优化模块用于对预设的一更新公式进行参数设置,根据更新公式对三目标能量公式进行迭代,并获得一更优解集;

后续决策模块用于处理最优解集获得一最优解,并将最优解作为目标粒子的预测位置,即从更优解集中通过计算期望效用的方法选择最终的输出结构。

以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1