一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法

文档序号:10725444阅读:309来源:国知局
一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法
【专利摘要】一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法,首先,根据能量值选取当前种群中的最优构象,计算其他构象到最优构象的距离,并根据距离对所有构象进行排名;然后,选取离最优构象最近的部分构象建立Lipschitz下界支撑面,计算所选取的构象的能量下界估计值,并计算实际能量值与下界估计值的平均误差;最后,根据平均误差将算法分为两层,第一层随机选取构象进行片段组装生成新构象,第二层则根据最优构象进行片段组装生成新构象,从而引导算法快速可靠地向能量最低的区域收敛。本发明预测精度高、计算代价较低。
【专利说明】
一种基于局部Li psch i tz支撑面的双层差分进化蛋白质结构 预测方法
技术领域
[0001] 本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种 基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法。
【背景技术】
[0002] 人类基因组计划的顺利实施,标志人类基因组DNA的30亿个碱基对序列测序工作 已经基本完成。十几年以来,人类基因组计划不断深化人类对自身和疾病的认识,对生物 学、医学、数学和计算机科学带来了深远影响。然而迄今为止,尚未呈现美国前总统克林顿 当时所描绘的蓝图:"彻底改变我们对绝大多数疾病的诊断、预防和治疗手段"。事实上,基 因图谱仅描绘了蛋白质氨基酸序列(即蛋白质一级结构),蛋白质只有折叠成特定的三维结 构(即蛋白质三级结构)才能产生其特定的生物学功能。因此,为了解蛋白质的功能,就必须 获得其三维空间结构,这样才能真正实现基因诊断,并最终达到基因治疗的目的。
[0003] 蛋白质结构实验测定方法是结构基因组学研究的主要内容。X射线晶体学是测定 蛋白质结构最有效的方法,所能达到的精度是其它方法所不能比拟的,缺点主要是蛋白质 晶体难以培养且晶体结构测定的周期较长;多维核磁共振(NMR)方法可以直接测定蛋白质 在溶液中的构象,但是由于对样品的需要量大、纯度要求高,目前只能测定小分子蛋白质。 总体上,结构实验测定方法主要存在两方面问题:一方面,对于现代药物设计的主要靶标膜 蛋白而言,通过实验方法极难获得其结构;另一方面,测定过程费时费钱费力,比如,使用 NMR方法测定一个蛋白质通常需要15万美元以及半年的时间。因此,如何使得根据Anfinsen 原则,以计算机为工具,运用适当的算法,从氨基酸序列出发直接预测蛋白质的三维结构, 成为当前生物信息学中一种主要的研究课题。
[0004] 从头预测方法实质上就是利用计算机的快速处理能力,利用优化算法在蛋白质构 象空间搜索全局最低能量构象解。蛋白质能量模型考虑分子体系成键作用以及范德华力、 静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数 目随序列长度的增加呈指数增长,属于一类非常难解的NP-hard问题。从头预测方法通过能 量函数来评价构象的质量,并利用优化算法来搜索构象。根据Anfinsen原则,能量函数引导 算法向低能量的区域搜索,从而获取能量最低的构象。因此,从头预测方法最主要的问题就 是设计一种可靠、有效的优化算法来寻找能量函数的全局最优解。
[0005] 群体进化类算法是研究蛋白质分子构象优化的重要方法,主要包括遗传算法 (GA)、差分进化算法(DE),这些算法不仅结构简单,易于实现,而且鲁棒性强,因此,经常被 用于从头预测方法中的全局最小能量构象搜索。然后随着序列长度的增长,蛋白质的能量 模型曲面越来越复杂,从而导致群体算法容易陷入局部最优,而无法精确的搜索到最低能 量构象,从而降低了预测精度。而且目前单纯的进化类算法中没有适当应用片段组装这一 有效的技术,导致其搜索空间极其庞大,计算代价较大。
[0006] 因此,现有的基于群体算法的蛋白质结构预测方法在预测精度和计算代价方面存 在着缺陷,需要改进。

【发明内容】

[0007] 为了克服现有的蛋白质结构预测方法在预测精度和计算代价方面的不足,本发明 基于抽象凸理论和片段组装技术,提出一种预测精度高、计算代价较低的基于局部 Lipschitz支撑面的双层差分进化蛋白质结构预测方法。
[0008] 本发明解决其技术问题所采用的技术方案是:
[0009] 一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法,所述方法 包括以下步骤:
[0010] 1)选取力场模型:
[0011]采用Rosetta力场模型能量函数的表示形式如下
[0013] 式中,E表示蛋白质的总能量,Einterrep表示范德华排斥力作用,Einteratr表示范德华 吸引力作用,Esoivation为Lazarids和Karplus描述的隐含的溶解作用,Ebb/sc hb、Ebb/bb hb和 Esc/s。hb为依赖方向的氢键能量,Epair残基对静电作用,Ed unbrac;k为氨基酸基于旋转异构体库 的内部的能量,Er_为参考特定位置的Ramachandrin骨链扭力,为未折叠态的蛋白 质的参考能量,Winter rep 'Winter atr > Wsolvation^jEinter rep、 Einter atr、Esolvation 白勺目^ 工员 , Wbb/sc hb、Wbb/bb hb萍口Wsc/sc hb夕力丨J力jEbb/sc hb、Ebb/bb hb萍口Esc/sc hb的目^里_工员拓^^^,Wpair、Wdunbrack、 Wrama萍口Wreference^h力丨J 力jEpair、Edunbrack、Erama萍口Ereference 的目^里项权重;
[0014] 2)给定输入序列信息;
[0015] 3)设置参数:能量函数的各能量项权重值,种群大小NP,交叉因子CR,常数M;
[0016] 4)种群初始化:由输入序列产生初始构象种群 …,X; ),/ e {1,2,…,iVn},其中,Ν表示维数,X;表示第i个构象6的第Ν维元素,并初始化迭代 次数G = 0;
[0017] 5)根据式(1)计算当前种群中的每个构象的能量值fXOEK1),选取能量最低的 构象Cbest = (Xbest,l,Xbest,2,…,Xbest,N),计算其他构象C1到Cbest的欧式距离
,其中,^:为第i个构象C1的第j维元素,Xbestd为C best的第j维元素;
[0018] 6)根据各构象的欧式距离心进行升序排列,选取排名前NP/5的构象Ck,k= 1,…, NP/5,对选取的每个构象构建Lipschitz下界估计支撑面_/* _= 其中,f (Ck)为构象Ck的能量函数值,=1-Σ'?辅助变量,Μ为常数;
[0019] 7)根据所构建的下界估计支撑面计算所选取的ΝΡ/5个构象的下界估计值
其中max表示求最大值,min表示求最小值,^为支撑向量]^的 第j维元素;
[0020] 8)计算所选取的NP/5个构象Ck的下界估计值^(C4)和实际能量值f(Ck)之间的平均
[0021] 9)针对种群中的每个构象个体少,i e {1,2,3,…,NP},令Ctarget = 6,Ctarget表示目 标构象个体,执行以下操作生成变异构象C?tant:
[0022] 9.1)随机生成正整数randl,rand2,rand3e {1,2,3,......NP},且randl辛rand2 辛rand3辛i ;再生成4个随机整数randrangel,randrange2,randrange3,randrange4;其中 randrangel辛randrange2,randrange3辛randrange4G {1,2, ···,L},L为序列长度;
[0023] 9· 2)令a=min(randrangel,randrange2),b=max(randrangel,randrange2),s G [a,b] ;^c=min(randrange3,randrange4) ,d=max(randrange3,randrange4) ,pe [c,d]; 其中min表示取两个数的最小值,max表示取两个数的最大值;
[0024] 9.3)如果〇>0.5,可以判定处于第一层搜索,用(^11(12上位置 &到位置13的片段的氨 基酸s所对应的二面角phi、psi、omega替换Crandi的相同位置所对应的二面角phi、psi、 omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Crandl上相同位置所对应的二面角?1^、?8丨、〇111叩 &,然后将所得(^11(11进行片段组装得到变异 构象个体C mutant ;
[0025] 9.4)如果〇彡0.5,可以判定处于第二层搜索,则用(^11(11上位置 &到位置13的片段的 氨基酸s所对应的二面角phi、psi、omega替换Cbest的相同位置所对应的二面角phi、psi、 omega;再使用Crand2上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Cbest上相同位置所对应的二面角?1^、?81〇111叩&,然后将所得(^ 8*进行片段组装得到变异构 象个体Cmu tant ;
[0026] 10)对变异构象Uutant执行交叉操作生成测试构象Ctriai:
[0027] 10.1)生成随机数rand4,rand5,其中rand4e (〇, 1),rand5e (1,L);
[0028] 10.2)若随机数^11(14彡〇?,(^31由变异构象(^咖的片段以11(15替换为目标构象 Ctarge3t中对应的片段生成,否则Ctriai直接等于变异构象C?tant;
[0029] 11)如果 f(Ctrial)<f(Ctarget),则测试构象 Ctriai 替换目标构象 Ctarget;
[0030] 12)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
[0031] 进一步,所述步骤3)中,设置的参数还包括最大迭代次数;所述步骤12)中,对种群 中的每个构象个体都执行完步骤5)-11)以后,迭代次数G = G+1,终止条件为迭代次数G达到 预设最大迭代次数。
[0032] 本发明的技术构思为:首先,根据能量值选取当前种群中的最优构象,计算其他构 象到最优构象的距离,并根据距离对所有构象进行排名;然后,选取离最优构象最近的部分 构象建立Lipschitz下界支撑面,计算所选取的构象的能量下界估计值,并计算实际能量值 与下界估计值的平均误差;最后,根据平均误差将算法分为两层,第一层随机选取构象进行 片段组装生成新构象,第二层则根据最优构象进行片段组装生成新构象,从而引导算法快 速可靠地向能量最低的区域收敛。
[0033] 本发明的有益效果表现在:一方面,根据实际能量函数值和Lipschitz下界估计值 的平均误差将算法分为两层,从而在各层利用不同的进化信息生成新构象个体,提高了构 象的质量和算法收敛速度和可靠性;另一方面,片段组装技术生成新构象,减小了搜索空 间,降低了计算代价。
【附图说明】
[0034]图1是基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法对蛋白质 1AIL进行结构预测时的构象更新示意图。
[0035]图2是基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法对蛋白质 1AIL进行结构预测时得到的构象分布图。
[0036]图3是基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法对蛋白质 1AIL预测得到的三维结构。
【具体实施方式】
[0037]下面结合附图对本发明作进一步描述。
[0038]参照图1-3,一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方 法,包括以下步骤:
[0039] 1)选取力场模型:
[0040]采用Rosetta力场模型能量函数的表示形式如下
[0042] 式中,E表示蛋白质的总能量,Eintemp表示范德华排斥力作用,Einteratr表示范德华 吸引力作用,Esoivation为Lazarids和Karplus描述的隐含的溶解作用,Ebb/sc hb、Ebb/bb hb和 Esc/s。hb为依赖方向的氢键能量,Epair残基对静电作用,Ed unbrac;k为氨基酸基于旋转异构体库 的内部的能量,Er_为参考特定位置的Ramachandrin骨链扭力,为未折叠态的蛋白 质的参考能量,Winter rep 'Winter atr > Wsolvation^jEinter rep、 Einter atr、Esolvation 白勺目^ 工员 , Wbb/sc hb、Wbb/bb hb萍口Wsc/sc hb夕力丨J力jEbb/sc hb、Ebb/bb hb萍口Esc/sc hb的目^里_工员拓^^^,Wpair、Wdunbrack、 Wrama萍口Wreference^h力丨J 力jEpair、Edunbrack、Erama萍口Ereference 的目^里项权重;
[0043] 2)给定输入序列信息;
[0044] 3)设置参数:能量函数的各能量项权重值,种群大小NP,交叉因子CR,常数M;
[0045] 4)种群初始化:由输入序列产生初始构象种群 ...弋),/€队2,-,肥}},其中』表示维数,4表示第1个构象(:1的第_1元素,并初始化迭代 次数G = 0;
[0046] 5)根据式(1)计算当前种群中的每个构象的能量值fXC^iEK1),选取能量最低的 构象Cbest = (Xbest,l,Xbest,2,…,Xbest,N),计算其他构象C1到Cbest的欧式距离
,其中,·^为第i个构象C1的第j维元素,Xbestd为Cbest的第j维元素;
[0047] 6)根据各构象的欧式距离土进行升序排列,选取排名前NP/5的构象汐上=1,…,NP/5,对 选取的每个构象构建Lipschitz下界估计支撑面
其中,f(ck)为构象ck的能量函数值,4+1=ι-ΣΧ为辅助变量,Μ为常数;
[0048] 7)根据所构建的下界估计支撑面计算所选取的ΝΡ/5个构象的下界估计值
*其中max表示求最大值,min表示求最小值,^为支撑向量]^的 第j维元素;
[0049] 8)计算所选取的NP/5个构象Ck的下界估计值和实际能量值f(Ck)之间的平均
[0050] 9)针对种群中的每个构象个体少,i e {1,2,3,…,NP},令Ctarget = 6,Ctarget表示目 标构象个体,执行以下操作生成变异构象C?tant:
[0051 ] 9 · 1)随机生成正整数randl,rand2,rand3e {1,2,3,......NP},且randl辛rand2 辛rand3辛i ;再生成4个随机整数randrangel,randrange2,randrange3,randrange4;其中 randrangel辛randrange2,randrange3辛randrange4G {1,2, ···,L},L为序列长度;
[0052] 9· 2)令a=min(randrangel,randrange2),b=max(randrangel,randrange2),s G [a,b] ;^c=min(randrange3,randrange4) ,d=max(randrange3,randrange4) ,pe [c,d]; 其中min表示取两个数的最小值,max表示取两个数的最大值;
[0053] 9.3)如果〇>0.5,可以判定处于第一层搜索,用(^11(12上位置 &到位置13的片段的氨 基酸s所对应的二面角phi、psi、omega替换Crandi的相同位置所对应的二面角phi、psi、 omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Crandl上相同位置所对应的二面角?1^、?8丨、〇111叩 &,然后将所得(^11(11进行片段组装得到变异 构象个体C mutant ;
[0054] 9.4)如果〇彡0.5,可以判定处于第二层搜索,则用(^11(11上位置 &到位置13的片段的 氨基酸s所对应的二面角phi、psi、omega替换Cbest的相同位置所对应的二面角phi、psi、 omega;再使用Crand2上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Cbest上相同位置所对应的二面角?1^、?81〇111叩&,然后将所得(^ 8*进行片段组装得到变异构 象个体C mutant ;
[0055] 10)对变异构象Uutant执行交叉操作生成测试构象Ctriai:
[0056] 10.1)生成随机数rand4,rand5,其中rand4e (〇, 1),rand5e (1,L);
[0057] 10.2)若随机数^1?14彡〇?,(^31由变异构象(^咖的片段以11(15替换为目标构象 Ctarge3t中对应的片段生成,否则Ctriai直接等于变异构象C?tant;
[0058] 11)如果 f(Ctrial)<f(Ctarget),则测试构象 Ctriai 替换目标构象 Ctarget;
[0059] 12)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
[0060] 进一步,所述步骤3)中,设置的参数还包括最大迭代次数;所述步骤12)中,对种群 中的每个构象个体都执行完步骤5)-11)以后,迭代次数G = G+1,终止条件为迭代次数G达到 预设最大迭代次数。
[0061 ]本实施例序列长度为73的α折叠蛋白质1AIL为实施例,一种基于局部Lipschitz支 撑面的双层差分进化蛋白质结构预测方法,其中包含以下步骤:
[0062] 1)选取力场模型:
[0063]采用Rosetta力场模型能量函数的表示形式如下
[0065] 式中,E表示蛋白质的总能量,Eintemp表示范德华排斥力作用,Einterati?表示范德华 吸引力作用,Esoivation为Lazarids和Karplus描述的隐含的溶解作用,Ebb/sc hb、Ebb/bb hb和 Esc/s。hb为依赖方向的氢键能量,Epair残基对静电作用,Ed unbrac;k为氨基酸基于旋转异构体库 的内部的能量,Er_为参考特定位置的Ramachandrin骨链扭力,为未折叠态的蛋白 质的参考能量,Winter rep 'Winter atr > Wsolvation^jEinter rep、 Einter atr、Esolvation 白勺目^ 工员 , Wbb/sc hb、Wbb/bb hb萍口Wsc/sc hb夕力丨J力jEbb/sc hb、Ebb/bb hb萍口Esc/sc hb的目^里_工员拓^^^,Wpair、Wdunbrack、 Wrama萍口Wreference^h力丨J 力jEpair、Edunbrack、Erama萍口Ereference 的目^里项权重;
[0066] 2)给定输入序列1AIL;
[0067] 3)设置参数:能量函数的各能量项权重值,种群大小NP = 50,交叉因子CR = 0.5,常 数M= 1000,最大迭代次数10000;
[0068] 4)种群初始化:由输入序列产生初始构象种群P = _K'C2,._.,CA:r|r =(x丨,4, …,λ·;),/ e丨1,2,…,iVF〖},其中,N表示维数,4表示第i个构象6的第N维元素,并初始化迭代 次数G = 0;
[0069] 5)根据式(1)计算当前种群中的每个构象的能量值fXC^iEK1),选取能量最低的 构象Cbest = (Xbest,l,Xbest,2,…,Xbest,N),计算其他构象C1到Cbest的欧式距离
,其中名为第i个构象C1的第j维元素,Xbestd为C best的第j维元素;
[0070] 6)根据各构象的欧式距离d1进行升序排列,选取排名前NP/5的构象汐上=1,…,NP/5,对 选取的每个构象构建Lipschitz下界估计支撑百
其中,f(Ck)为构象Ck的能量函数值,·4+1=ι-为辅助变量,Μ为常数;
[0071] 7)根据所构建的下界估计支撑面计算所选取的ΝΡ/5个构象的下界估计值
,其中max表示求最大值,min表示求最小值,·^为支撑向量]^的 第j维元素;
[0072] 8)计算所选取的NP/5个构象Ck的下界估计值7(:〇和实际能量值f(C k)之间的平均
[0073] 9)针对种群中的每个构象个体少,i e {1,2,3,…,NP},令Ctarget = 6,Ctarget表示目 标构象个体,执行以下操作生成变异构象C?tant:
[0074] 9· 1)随机生成正整数randl,rand2,rand3E {1,2,3,......NP},且randl#rand2 #rand3# i ;再生成4个随机整数randrange 1,randrange2,randrange3,randrange4;其中 randrangel#randrange2,randrange3#randrange4E {1,2,…,L},L为序列长度;
[0075] 9.2)令a=min(randrangel,randrange2),b=max(randrangel,randrange2),s[ [a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p[ [c,d]; 其中min表示取两个数的最小值,max表示取两个数的最大值;
[0076] 9.3)如果〇>0.5,可以判定处于第一层搜索,用(^11(12上位置 &到位置13的片段的氨 基酸s所对应的二面角phi、psi、omega替换Crandi的相同位置所对应的二面角phi、psi、 omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Crandl上相同位置所对应的二面角?1^、?8丨、〇111叩 &,然后将所得(^11(11进行片段组装得到变异 构象个体Cmu tant ;
[0077] 9.4)如果〇彡0.5,可以判定处于第二层搜索,则用(^11(11上位置 &到位置13的片段的 氨基酸s所对应的二面角phi、psi、omega替换Cbest的相同位置所对应的二面角phi、psi、 omega;再使用Crand2上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换 Cbest上相同位置所对应的二面角?1^、?81〇111叩&,然后将所得(^ 8*进行片段组装得到变异构 象个体C mutant ;
[0078] 10)对变异构象Uutant执行交叉操作生成测试构象Ctriai:
[0079] 10.1)生成随机数rand4,rand5,其中rand4e (〇, 1),rand5e (1,L);
[0080] 10.2)若随机数^11(14彡〇?,(^31由变异构象(^咖的片段以11(15替换为目标构象 Ctarge3t中对应的片段生成,否则Ctriai直接等于变异构象C?tant;
[0081 ] 11)如果以(^咖1)<以(:^坪(^),则测试构象(^咖1替换目标构象(^_ (^;
[0082] 12)对种群中的每个构象个体都执行完步骤5)-11)以后,迭代次数G = G+1,判断是 否满足终止条件G = 10000,若满足则输出结果并退出,否则返回步骤5)。
[0083]以序列长度为73的α折叠蛋白质1AIL为实施例,运用以上方法得到了该蛋白质的 近天然态构象,最小均方根偏差为1.55Α,平均均方根偏差为2.99 Α,预测得到的三维结构 如图3所示。
[0084]以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不 仅适合上述实施例,而且可以应用到实际工程中的各个领域,同时在不偏离本发明基本精 神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
【主权项】
1. 一种基于局部LipscMtz支撑面的双层差分进化蛋白质结构预测方法,其特征在于: 所述蛋白质结构预测方法包括W下步骤: 1) 选取力场模型: 采用Rosetta力场模型能量函数的表示形式如下(1): 式中,E表示蛋白质的总能量,Einterrep表示范德华排斥力作用,Einteratr表示范德华吸引 力作用,EsDivatinn为Lazarids和Karplus描述的隐含的溶解作用,Ebb/schb、Ebb/bbhb和Esc/sc化为 依赖方向的氨键能量,Epair残基对静电作用,Edunbrack为氨基酸基于旋转异构体库的内部的 能量,Erama为参考特定位置的Ramachan化in骨链扭力,Ereferenee为未折叠态的蛋白质的参考 Ηκ g,Winterrep、Winteratr、Wsolvation^^^Einterrep、 Einteratr、Esolvation的能量项权重,W化/schb、W化/化hb 和Wsc/schb分别为Ebb/schb、Ebb/bb化和Esc/sc化的能量项权重,胖。3^、胖化血3。1<、胖聖3和恥6:6道。6分别为 Epair、Edunbrack、Erama巧距ref erence 的北里巧?权電; 2) 给定输入序列信息; 3) 设置参数:能量函数的各能量项权重值,种群大小ΝΡ,交叉因子CR,常数Μ; 4) 种群初始化:由输入序列产生初始构象种群Ρ = {ci,c2,...,cw|c =切,4, ...,為)八化2,···,Λ/Τ}[,其中,N表示维数,苗表示第i个构象C1的第N维元素,并初始化迭代 次数G = 0; 5) 根据式(1)计算当前种群中的每个构象的能量值f(Ci)=E(Ci),选取能量最低的构象 Chest = ( Xbest, 1,Xbest, 2,…,孔est, N),计算其他构象到Chest的欧式距离其中,為为第i个构象C1的第j维元素,孔es"为Cbest的第j维元素; 6) 根据各构象的欧式距离di进行升序排列,选取排名前NP/5的构象Ck,k=l,-,,NP/5, 对选取的每个构象构建LipscMtz下界估计支撑苗其中,f(ck)为构象Ck的能量函数值为辅助变量,Μ为常数; 7) 根据所构建的下界估计支撑面计算所选取的ΝΡ/5个构象的下界估计值其中max表示求最大值,min表示求最小值,?为支撑向量Ik的 第j维元素; 8) 计算所选取的NP/5个构象ck的下界估计值7(C")和实际能量值f(ck)之间的平均误差9 )针对种群中的每个构象个体护,i e { 1,2,3,· · ·,NP },令Ctarget = Ci,Ctarget表示目标构 象个体,执行W下操作生成变异构象Cmutant: 9.1)随机生成正整数randl,rand2,rand3E (1,2,3,......NP},且randl卓rand2卓 rand3 声 i ;再生成4个随机整数ran化ange 1, randrange2 , ran化ange3 , randrange4;其中 r曰ndr曰η邑el声r曰ndr曰η邑e2,r曰ndr曰η邑e3声r曰ndr曰η邑e4G (1,2, ··· ,L} ,L为序歹ij长度; 9.2) '4'a=niin(randrangel ,randrange2) ,b = max(randrangel ,randrange2), s e [a, b];令c = min(r曰ndr曰nge3,r曰ndr曰nge4),d=m曰x(r曰ndr曰nge3,r曰ndr曰nge4),pE k,d];其 中min表示取两个数的最小值,max表示取两个数的最大值; 9.3) 如果〇>0.5,可^判定处于第一层捜索,用紅3。<12上位置曰到位置6的片段的氨基酸8 所对应的二面角曲i、P S i、omega替换Crandi的相同位置所对应的二面角地i、P S i、ome ga;再使 用Crand3上位置C到位置d的片段的氨基酸p所对应的二面角地1、93;[、0111日旨日替换(:丽(11上相同 位置所对应的二面角9扣、931、〇111日旨日,然后将所得位3加进行片段组装得到变异构象个体 Cmutant ; 9.4) 如果〇《0.5,可W判定处于第二层捜索,则用Crandi上位置a到位置b的片段的氨基 酸S所对应的二面角地i、psi、omega替换Chest的相同位置所对应的二面角phi、psi、omega; 再使用Crand2上位置C到位置d的片段的氨基酸P所对应的二面角地;[、93;[、01]1日旨日替换0)631;上 相同位置所对应的二面角地1、931、0111日旨日,然后将所得&63*进行片段组装得到变异构象个 体Cmutant; 10)对变异构象Cmutant执行交叉操作生成测试构象Ctrial: 10.1)生成随机数rand4,rand5,其中rand4e (0,1),rand5e (1 ,L); 10.2 )右随机数rand4《CR , Ctrial由变异构象Cmutant的片段rands替换为目柄构象Ctarget 中对应的片段生成,否则Ctrial直接等于变异构象Cmutant; 11 )如果f (Ctrial) <f ( Ctarget),则测试构象Ctrial替换目柄构象Ctarget; 12)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。2.如权利要求1所述的一种基于局部LipscMtz支撑面的双层差分进化蛋白质结构预 测方法,其特征在于:所述步骤3)中,设置的参数还包括最大迭代次数;所述步骤12)中,对 种群中的每个构象个体都执行完步骤5)-11)?后,迭代次数G = G+1,终止条件为迭代次数G 达到预设最大迭代次数。
【文档编号】G06F19/16GK106096328SQ201610265960
【公开日】2016年11月9日
【申请日】2016年4月26日 公开号201610265960.X, CN 106096328 A, CN 106096328A, CN 201610265960, CN-A-106096328, CN106096328 A, CN106096328A, CN201610265960, CN201610265960.X
【发明人】张贵军, 周晓根, 俞旭锋, 郝小虎, 王柳静, 徐东伟, 李章维
【申请人】浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1