一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法与流程

文档序号：11475994阅读：178来源：国知局

本发明涉及生物信息学、计算机应用领域，尤其涉及的是一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法。

背景技术：

生物信息学是生命科学和计算机科学交叉领域的一个研究热点。生物信息学研究成果目前已经被广泛应用于基因发现和预测、基因数据的存储管理、数据检索与挖掘、基因表达数据分析、蛋白质结构预测、基因和蛋白质同源关系预测、序列分析与比对等。目前，根据anfinsen假设，直接从氨基酸序列出发，基于势能模型，采用全局优化方法，搜索分子系统的最小能量状态，从而高通量、廉价地预测肽链的天然构象，已经成为生物信息学最重要的研究课题之一。对于序列相似度低或多肽(<10个残基的小蛋白)来说，从头预测方法是唯一的选择。从头预测方法必须考虑以下两个因素：(1)蛋白质结构能量函数；(2)构象空间搜索方法。第一个因素本质上属于分子力学问题，主要是为了能够计算得到每个蛋白质结构对应的能量值。目前已经存在一些有效的结构能量函数，如简单网格模型hp及更实际的经验力场模型mm3，amber，charmm，gromos，discover，ecepp/3等；第二个因素本质上属于全局优化问题，通过选择一种合适的优化方法，对构象空间进行快速搜索，得到与某一全局最小能量对应的构象。其中，蛋白质构象空间优化属于一类非常难解的np-hard问题。2005年，d.baker在science中指出，构象空间优化方法是制约蛋白质从头预测方法预测精度的一个瓶颈因素。

因此，现有的构象空间优化方法存在采样效率、复杂度及预测精度方面存在不足，需要改进。

技术实现要素：

为了克服现有的构象空间优化方法存在采样效率、复杂度及预测精度方面存在不足，本发明提供一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法：在基本萤火虫算法框架下，采用粗粒度能量模型来有效降低构象空间维数，利用萤火虫算法的群体特性来保证蛋白质构象的多样性，采用片段组装技术对构象群体进行初始化，依据蛋白质构象的粗粒度表达模型，以一组二面角表示构象在空间中的位置，采用能量排名来确定最强发光个体，选取排名前十的萤火虫个体作为模态中心，并计算他们对其余个体的吸引度来更新构象的位置，纳入吸引度最高的模态，吸引度指标根据两个萤火虫个体的空间距离和相似度计算得到，最终在构象空间中搜索得到一系列能量较低的近天然态构象。

本发明解决其技术问题所采用的技术方案是：

一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法，所述方法包括以下步骤：

1)给定输入序列信息；

2)参数初始化：设置群体规模popsize、子种群数目nsub、子群规模上限nsup、迭代次数generation、光强吸引因子γ和位置更新步长因子α；

3)群体构象初始化：根据给定输入序列，随机生成popsize个个体，对群体中的每个个体做length次片段组装，并计算其荧光亮度io，其中length为序列长度，io＝-e(p)＝rosettascore3(p)，e为通过rosettascore3能量函数计算得到的蛋白质构象能量值，p表示单个构象；

4)对步骤3)中计算得到的荧光亮度从大到小排序，令荧光亮度最大的前nsub个体为pgⁱ，i∈[0,nsub]；

5)开始迭代：

5.1)划分子群：对群体中剩余的popsize-nsub个个体，分别计算pgⁱ对它们的吸引度βⁱ，并将其划入吸引度最大的pgⁱ所在的子群中，并判断子群pspgⁱ中个体数目nnum，若nnum＝nsup，则不再计算pgⁱ对其他个体的吸引度；

5.2)对每个子群中的每个个体，根据xkⁱ(t+1)＝xkⁱ(t)+βⁱ(xgⁱ(t)–xkⁱ(t))+α(rand–0.5)更新每个个体在空间中的位置，其中xkⁱ(t+1)，xkⁱ(t)表示第i个子群中第k个个体pkⁱ更新后的位置和当前的位置，xgⁱ(t)表示个体pgⁱ的当前位置，其中β0为最大吸引度因子，rgk表示个体pkⁱ与pgⁱ之间的距离，rmsdgk为个体pkⁱ与pgⁱ之间的相似度，rand为0到1之间的随机数，个体位置xkⁱ(t)表示为其中ψj为输入序列的氨基酸残基的二面角，j∈[1,length–l+1]，l为片段长度；

5.3)种群个体随机摆动：对群体中的每个个体进行l次随机片段组装；

5.4)重新计算每个个体的荧光亮度，更新pgⁱ；

6)判断是否达到最大迭代次数generation；

6.1)若当前迭代次数小于generation，返回步骤5.1)；

6.2)若当前迭代次数等于generation，结束。

本发明的技术构思为：在基本萤火虫算法框架下，采用粗粒度能量模型来有效降低构象空间维数，利用萤火虫算法的群体特性来保证蛋白质构象的多样性，采用片段组装技术对构象群体进行初始化，依据蛋白质构象的粗粒度表达模型，以一组二面角表示构象在空间中的位置，采用能量排名来确定最强发光个体，选取排名前十的萤火虫个体作为模态中心，并计算他们对其余个体的吸引度来更新构象的位置，纳入吸引度最高的模态，吸引度根据两个萤火虫个体的空间距离和相似度计算得到，最终在构象空间中搜索得到一系列能量较低的近天然态构象。

本发明的有益效果为：本发明在蛋白质结构预测中应用，可以得到预测精度较高、复杂度较低的构象。

附图说明

图1是预测得到的蛋白质2mrf的三维结构示意图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法，所述构象空间优化方法包括以下步骤：

1)给定输入序列信息；

2)参数初始化：设置群体规模popsize、子种群数目nsub、子群规模上限nsup、迭代次数generation、光强吸引因子γ和位置更新步长因子α；

4)对步骤3)中计算得到的荧光亮度从大到小排序，令荧光亮度最大的前nsub个体为pgⁱ，i∈[0,nsub]；

5)开始迭代：

5.5)划分子群：对群体中剩余的popsize-nsub个个体，分别计算pgⁱ对它们的吸引度βⁱ，并将其划入吸引度最大的pgⁱ所在的子群中，并判断子群pspgⁱ中个体数目nnum，若nnum＝nsup，则不再计算pgⁱ对其他个体的吸引度；

5.6)对每个子群中的每个个体，根据xkⁱ(t+1)＝xkⁱ(t)+βⁱ(xgⁱ(t)–xkⁱ(t))+α(rand–0.5)更新每个个体在空间中的位置，其中xkⁱ(t+1)，xkⁱ(t)表示第i个子群中第k个个体pkⁱ更新后的位置和当前的位置，xgⁱ(t)表示个体pgⁱ的当前位置，其中β0为最大吸引度因子，rgk表示个体pkⁱ与pgⁱ之间的距离，rmsdgk为个体pkⁱ与pgⁱ之间的相似度，rand为0到1之间的随机数，个体位置xkⁱ(t)表示为其中ψj为输入序列的氨基酸残基的二面角，j∈[1,length–l+1]，l为片段长度；

5.7)种群个体随机摆动：对群体中的每个个体进行l次随机片段组装；

5.8)重新计算每个个体的荧光亮度，更新pgⁱ；

6)判断是否达到最大迭代次数generation；

6.3)若当前迭代次数小于generation，返回步骤5.1)；

6.4)若当前迭代次数等于generation，结束。

本实施例以蛋白质2mrf为实施例，一种基于改进萤火虫算法的多模态蛋白质构象空间优化方法，包含以下步骤：

1)给定输入序列信息；

2)参数初始化：设置群体规模popsize＝300、子种群数目nsub＝10、子群规模上限nsup＝60、迭代次数generation＝100000、光强吸引因子γ＝0.5和位置更新步长因子α＝0.5；

4)对步骤3)中计算得到的荧光亮度从大到小排序，令荧光亮度最大的前nsub个体为pgⁱ，i∈[0,nsub]；

5)开始迭代：

5.9)划分子群：对群体中剩余的popsize-nsub个个体，分别计算pgⁱ对它们的吸引度βⁱ，并将其划入吸引度最大的pgⁱ所在的子群中，并判断子群pspgⁱ中个体数目nnum，若nnum＝nsup，则不再计算pgⁱ对其他个体的吸引度；

5.10)对每个子群中的每个个体，根据xkⁱ(t+1)＝xkⁱ(t)+βⁱ(xgⁱ(t)–xkⁱ(t))+α(rand–0.5)更新每个个体在空间中的位置，其中xkⁱ(t+1)，xkⁱ(t)表示第i个子群中第k个个体pkⁱ更新后的位置和当前的位置，xgⁱ(t)表示个体pgⁱ的当前位置，其中β0为最大吸引度因子，rgk表示个体pkⁱ与pgⁱ之间的距离，rmsdgk为个体pkⁱ与pgⁱ之间的相似度，rand为0到1之间的随机数，个体位置xkⁱ(t)表示为其中ψj为输入序列的氨基酸残基的二面角，j∈[1,length–l+1]，l为片段长度；

5.11)种群个体随机摆动：对群体中的每个个体进行l次随机片段组装；

5.12)重新计算每个个体的荧光亮度，更新pgⁱ；

6)判断是否达到最大迭代次数generation；

6.5)若当前迭代次数小于generation，返回步骤5.1)；

6.6)若当前迭代次数等于generation，结束。

以蛋白质2mrf为实施例，运用以上方法得到了该蛋白质的最优构象解，如图1所示。

以上阐述的是本发明给出的一个实施例表现出来的优良效果，显然本发明不仅适合上述实施例，在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张贵军;郝小虎;王小奇;周晓根;王柳静
技术所有人：浙江工业大学
我是此专利的发明人

上一篇：一种新型温水器的制造方法与工艺
上一篇：一种基于农业生产用的玉米筛选装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。