基于随机优化的老年痴呆致病机理的分析方法

文档序号:6493748阅读:267来源:国知局
基于随机优化的老年痴呆致病机理的分析方法
【专利摘要】本发明涉及一种基于随机优化的老年痴呆致病机理的分析方法,包括以下步骤:S1、确定能量模型:采用ECEPP能量力场模型以及角度坐标系;S2、搜索最小自由能蛋白质构型;S3、计算蛋白质的态密度。本发明的基于随机优化的老年痴呆致病机理的高效分析方法,与经典的WangLandau算法相比,使用具有全局更新特点的分段函数形式的修正因子能加快搜索和模拟速度,利用退火机制的灵活的更新修正因子方式可提高模拟精度和速度,且该方法的并行方式可大大加快搜索和模拟速度。
【专利说明】基于随机优化的老年痴呆致病机理的分析方法
【【技术领域】】
[0001]本发明涉及生物信息学,特别涉及一种基于随机优化的老年痴呆致病机理的分析方法。
【【背景技术】】
[0002]蛋白质折叠研究蛋白质在短时间内从一级结构(亦即一维多肽链)折叠成天然三维结构,形成具有生命功能的大分子。生物体的遗传信息(DNA)通过RNA转录和翻译过程传递给蛋白质,因此蛋白质折叠也被称为第二遗传密码。通过蛋白质折叠研究可以揭示生命遗传信息的表达和功能传递的奥秘。蛋白质在从一级结构折叠到天然三维结构的过程中,可能发生误折叠或聚集,其结构和功能也受到破坏,从而引起‘折叠病’,例如老年痴呆症。
[0003]老年痴呆症又叫阿尔茨海默病,是一种中枢神经系统变性病。老年痴呆症起病隐袭,病程呈慢性进行性,是老年期痴呆常见的一种类型,主要表现为渐进性记忆障碍、认知功能障碍、人格改变及语言障碍等神经精神症状,严重影响社交、职业与生活功能。目前,美国500多万老年痴呆症患者每年的花费是1830亿美元;中国的老年痴呆症患者也有500-600万。蛋白质折叠研究有助于蛋白质分子药物的设计,因此,蛋白质折叠研究对探索老年痴呆症致病机理以及对老年痴呆症的预防和治疗将起重大的帮助作用。
[0004]对于一个有100个氨基酸的蛋白质,假设每个氨基酸有10个构象,其构象数目即有101°° ;进一步假设搜索每个构象需要10-15秒,按照目前最快的千万亿次计算机处理速度,要搜索所有的蛋白质结构空间至少需3X 1077年。因此,搜索蛋白质全部结构空间不现实,这也对蛋白质结构高效搜索算法提出了非常高的要求。
[0005]蛋白质折叠算法依赖于一个基本假设,即蛋白质的天然结构是蛋白质自由能最低的结构。传统的分子动力学模拟和蒙特卡洛模拟方法在蛋白质折叠研究时,低温下的模拟会‘陷’在蛋白质能量的局部最优区间,很难‘跳’出来从而找到全局最优解。
[0006]经典的WangLandau算法属于随机优化领域,WangLandau算法能解决生物医学、统计物理等多个领域复杂的问题。例如,蛋白质折叠研究,该算法有两个最显著的优点--第一,该算法不会局限在局部最小能量状态,因而能搜索到全局最小能量状态;第二,该算法可模拟和计算出蛋白质系统的态密度,因而可进一步求解得到宽广温度范围内的热动力学量,如比热,实现对蛋白质系统进行定量分析。

【发明内容】

[0007]本发明要解决的技术问题在于提高随机优化的老年痴呆致病机理的高效方法精度和速度。
[0008]为此,本发明提供一种基于随机优化的老年痴呆致病机理的分析方法,包括以下步骤:
[0009]S1、确定能量模型:采用ECEPP能量力场模型以及角度坐标系;
[0010] S2、搜索最小自由能蛋白质构型:包括[0011]主进程,
[0012]S211、局部最小化方法获得能量上界Emin和能量下界Emax,初始化蛋白质系统的态密度对数 S(E)、修正因子 df,df|E= (κ Θ (E0-E)+Dlnf,
[0013]其中,Θ (E0-E)为Heaviside分段函数,κ、E。、f是模型的参数;
[0014]S212、进行Metropolis式的随机变动,构建新构型,计算能量Enew、并修改Emin或F 为F -
j^max j^new ?
[0015]3213、重复步骤5212,完成进程间通信,计算全局5?);广播全局S(E)至所有从进程;
[0016]S214、执行步骤S212至步骤S213的迭代,Emin三次保持,迭代终止;
[0017]从进程,
[0018]S221、局部最小化方法获得能量上界Emin和下界Emax,初始化蛋白质系统的态密度对数 S(E)、修正因子 df,df|E= (κ Θ (E0-E)+Dlnf,
[0019]其中,Θ (E0-E)为Heaviside分段函数,κ、EQ、f是模型的参数;
[0020]S222、进行Metropolis式的随机变动,构建新构型,计算能量Enew、并修改Emin或F 为F -
j^max j^new ?
[0021]S223、重复步骤S222,完成进程间通信,接收步骤S213计算的全局S(E);
[0022]S224、执行步骤S222、步骤S223,接收步骤S214迭代终止信息,停机;
[0023]S3、计算蛋白质的态密度:
[0024]主进程,
[0025]S311、初始化蛋白质系统的态密度对数S(E),直方图H(E),修正因子df,df|E =(κ Θ (E0-E)+1) Inf,
[0026]其中,Θ (E0-E)为Heaviside分段函数,κ、E0、f是模型的参数;
[0027]S312、进行Metropolis式的随机变动,构建新构型,计算能量Enew ;
[0028]S313、重复步骤S312,完成进程间通信,计算全局S(E)、H(E);判断直方图平缓阈值,当满足是执行步骤S314,否则重复执行步骤S312、步骤S313迭代;
[0029]S314、改变df,并执行步骤S312至步骤S313的迭代,直至df小于第二阈值,获得
蛋白质系统的相对的态密度
【权利要求】
1.一种基于随机优化的老年痴呆致病机理的分析方法,其特征在于,包括以下步骤: S1、确定能量模型:采用ECEPP能量力场模型以及角度坐标系; S2、搜索最小自由能蛋白质构型:包括 主进程, S211、局部最小化方法获得能量上界Emin和能量下界Emax,初始化蛋白质系统的态密度对数 S(E)、修正因子 df,df |E = (κ Θ (E0-E)+Dlnf, 其中,& (E0-E)为Heaviside分段函数,κ、E。、f是模型的参数; S212、进行Metropolis式的随机变动,构建新构型,计算能量Enew、并修改Emin或Emax为F.j^new ? S213、重复步骤S212,完成进程间通信,计算全局S(E);广播全局S(E)至所有从进程; S214、执行步骤S212至步骤S213的迭代,Emin三次保持,迭代终止; 从进程, S221、局部最小化方法获得能量上界Emin和下界Emax,初始化蛋白质系统的态密度对数S(E)、修正因子 df, df |E = (κ Θ (E0-E)+1) Inf, 其中,& (E0-E)为Heaviside分段函数,κ、E。、f是模型的参数; S222、进行Metropolis式的随机变动,构建新构型,计算能量Enew、并修改Emin或Emax为F.j^new ? S223、重复步骤S222,完成进程间通信,接收步骤S213计算的全局S(E); S224、执行步骤S222、步骤S223,接收步骤S214迭代终止信息,停机; S3、计算蛋白质的态密度: 主进程, S311、初始化蛋白质系统的态密度对数S(E),直方图H(E),修正因子df,df|E=(κ Θ (E0-E)+1) Inf, 其中,Θ (E0-E)为Heaviside分段函数,κ、E。、f是模型的参数; S312、进行Metropolis式的随机变动,构建新构型,计算能量Enew; S313、重复步骤S312,完成进程间通信,计算全局S(E)、H(E);判断直方图平缓阈值,当满足是执行步骤S314,否则重复执行步骤S312、步骤S313迭代; S314、改变df,并执行步骤S312至步骤S313的迭代,直至df小于第二阈值,获得蛋白质系统的相对的态密度
2.根据权利要求1所述的分析方法,其特征在于,所述ECEPP能量力场模型为:
Eecepp — Ec+Ei^Ehb+ETor 其中,Ec为两电荷之间的库伦作用力知为两原子之间的兰纳-琼斯作用力知为氢键作用力;ETot为两面角旋转作用力。
3.根据权利要求1所述的分析方法,其特征在于,所述
4.根据权利要求1所述的分析方法,其特征在于,步骤S211、S221的初始化蛋白质系统的态密度对数S(E)为S(E) = In g(E) = 0,其中Emin≤E≤Emax。
5.根据权利要求1所述的分析方法,其特征在于,步骤S212、具体为: 若,Enew < Emin,则,Enew~Emin ;初始化态密度对数S (E)为0,并修改Emin为Enew ; 若,Emax < Enew,则,Emax~Enew ;初始化态密度对数S (E)为0,并修改Emax为Enew ; 并根据Metropolis准则确定新构型被接受的概率:
6.根据权利要求1所述的分析方法,其特征在于,所述计算全局S(E)为:主进程收集所有从进程的Stmp(E)并累加计算出全局S(E),并对选取Emin和Emax分别为所有进程中的最小值或最大值; 广播全局S(E)至所有从进程。
7.根据权利要求1所述的分析方法,其特征在于,步骤S213还包括在完成进程间通信后,将从进程的Stmp(E)发送至主进程;对选取Emin和Emax分别为所有进程中的最小值或最大值,并对Stmp(E)初始化为O。
8.根据权利要求1所述的分析方法,其特征在于,步骤S311、S321的初始化蛋白质系统的态密度对数 S(E)为 S(E) = Ing(E) = O, H(E)=O ;Emin ≤ E ≤ Emax0
9.根据权利要求1所述的分析方法,其特征在于,步骤S313具体为:主进程收集所有从进程的Stmp(E)和Htmp (E)并累加计算出全局S(E)和H(E); 广播全局S(E)和H(E)至所有从进程,并求得

10.根据权利要求1所述的分析方法,其特征在于,改变修正因子df,并执行步骤S312至步骤S313的迭代,直至修正因子df小于第二阈值,获得蛋白质系统的相对的态密度
11.根据权利要求1所述的分析方法,其特征在于,改变df方式是:先连续进行N次迭代f = f° (0 < α < 1),再进行I次迭代
【文档编号】G06F19/12GK103902851SQ201210576323
【公开日】2014年7月2日 申请日期:2012年12月26日 优先权日:2012年12月26日
【发明者】彭丰斌, 魏彦杰, 张慧玲 申请人:中国科学院深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1