基于nga-ts算法的蛋白质结构预测方法

文档序号:10471363阅读:590来源:国知局
基于nga-ts算法的蛋白质结构预测方法
【专利摘要】本发明涉及蛋白质结构预测领域,涉及了一种基于小生境遗传和算法禁忌搜索算法的结合算法的蛋白质结构预测方法。该方法将禁忌搜索算法引入小生境遗传算法中来解决蛋白质结构预测问题,并对小生境遗传算法过程中的交叉、变异、小生境淘汰进行了一定的改进。从实验得出的数据和与其他方法的比较结果来看,该方法可以更加全面的搜索出相应的蛋白质最小自由能量值,从而能得到更稳定的蛋白质结构,说明了本方法在解决蛋白质结构预测问题上是有效的。
【专利说明】
基于NGA-TS算法的蛋白质结构预测方法
技术领域
[0001] 本发明设及小生境遗传算法和禁忌算法,具体讲的是通过小生境遗传算法和禁忌 算法捜索到最小的蛋白质自由能量值,并改进了捜索过程中的交叉算子、变异算子和小生 境淘汰算子。
【背景技术】
[0002] 在生物信息学领域中,蛋白质工程一直是一口重要的研究课题。蛋白质作为人体 生命活动的基本体现者,是人体不可或缺的物质,可是生物体内存在的天然蛋白质,有的往 往不尽人意,需要加 W改造。蛋白质工程是按人们的意志改变蛋白质的结构和功能来改造 或创建新的蛋白质的过程。由于蛋白质是由许多氨基酸按一定顺序结构组合而成的,每一 种蛋白质都有独特的氨基酸序列,蛋白质中氨基酸序列的结构也决定了蛋白质的功能和性 质。所W,改变蛋白质中的氨基酸序列结构就能改变蛋白质的性质,蛋白质结构预测问题是 蛋白质工程中重要的研究问题之一。
[0003] 蛋白质结构预测问题又被称为蛋白质折叠问题。在医学上,有许多因蛋白质折叠 错误、结构发生改变而引起的疾病,例如:疯牛病(bovine spongiform encephalopathy, BSE)、新型克雅病(CJD)、构象病(由航蛋白又名蛋白质传染因子引起的疾病)、肌萎缩性侧 索硬化症、家族性淀粉样屯、肌病、阿尔茨海默病(ADI)等。因此,研究蛋白质结构预测对运些 疾病机制的研究和治疗药物的研究都有重大的实践意义。
[0004] 蛋白质结构预测问题也是对蛋白质结构中的氨基酸的空间折叠的预测,W达到蛋 白质的最低能量和最稳定结构(能量越低,蛋白质结构越稳定)。通常对蛋白质结构的预测 问题的解决一般采用更为方便有效的模拟仿真技术,首先要将根据问题建立合适的数学模 型和物理模型,其次是找到合适的寻优算法。
[0005] 前人提出了多种研究蛋白质结构预测的适用模型,其中应用最广泛的是按照氨基 酸的亲疏水性分为疏水氨基酸和亲水氨基酸的两种简化模型:HP格点模型和AB非格点模 型。两种模型最主要的区别在于,HP格点模型中两个残基键之间的角度是直角或者平角,而 AB非格点模型中两个键之间的角度是任意的并且被记作两平面的折叠角和同一平面的扭 转角,同时AB非格点模型不仅考虑了相邻两个氨基酸间的相互作用还考虑了不相邻氨基酸 之间的非局部作用对蛋白质结构的影响。因此,AB非格点模型比HP格点模型更接近真实的 蛋白质结构。目前,采用AB非格点模型的研究人员较多,而且大部分研究人员都在寻找更好 的寻优算法,W提高研究的精确度。
[0006] 当前,国内外很多研究者对蛋白质结构预测问题的研究提出了许多算法,例如:遗 传算法、粒子群算法、蚁群算法、蜂群算法、禁忌算法、模拟退火算法、免疫算法等智能算法 或是多种算法的混合算法。化eng等提出一种基于AB非格点模型的改进禁忌捜索算法,它适 用于短的蛋白质结构序列。Zheng等采用遗传、禁忌算法的混合算法,并采取了许多改进策 略,如:排队选择、交叉操作、变异操作、变种群策略等等。化U等提出改进的遗传、粒子群混 合算法和改进的遗传、粒子群、禁忌混合算法两种解决方法,结合了遗传算法、粒子群算法 和禁忌算法的优点,提高全局最优捜索,提高结果的捜索精度。Li等采用平衡进化人工蜂群 算法来解决蛋白质结构预测问题,并且获得了好的结果。但是,对蛋白质结构预测方法进行 改进,有效提高了捜索的效率,提高精确度仍是十分必要的。

【发明内容】

[0007] 本发明的目的在于提出一种基于NGA-TS算法的蛋白质结构预测方法,将小生境遗 传算法和禁忌捜索算法用于蛋白质结构预测中,捜索出更小的自由能值和对应的更稳定的 结构,并有效提高了捜索的效率,提高精确度。其基本思想是先对种群进行竞技选择、自适 应交叉、自适应变异后,再根据种群个体之间的欧氏距离进行小生境淘汰,淘汰掉较为相似 的个体,从而增加种群个体的多样性,最后用禁忌捜索算法进行全局性领域捜索找到全局 最优解。
[0008] 为达到上述目的,本发明的技术方案为:首先进行种群初始化,并对种群进行选 择、交叉、变异操作,然后再对种群进行小生境淘汰选择操作,在进化后期对种群进行全局 性的禁忌捜索运样就可W捜索出最小自由能的蛋白质结构。在捜索稳定蛋白质结构的过程 中,对使用的交叉操作、变异操作和小生境淘汰操作进行一些的改进:交叉操作采用自适应 交叉算子,避免过早收敛现象和停滞现象的产生;变异操作采用自适应的随机线性变异算 子,可W增强局部捜索能力,加快收敛速度;小生境淘汰操作也采用动态函数求得距离参 数,使参数更灵活精确,使小生境淘汰更有效。基于NGA-TS算法的蛋白质结构预测方法,其 特征在于:其包括W下步骤:
[0009] 步骤1:初始化参数及种群;
[0010] 步骤2:进行迭代循环,计算种群适应度;
[0011] 步骤3:对种群进行竞技选择、自适应交叉、自适应随机线性变异,更新种群;
[0012] 步骤4:对新种群进行小生境淘汰选择,更新种群;
[0013] 步骤5:在进化后期,对新种群进行禁忌捜索算法,更新种群;
[0014] 步骤6:判断是否满足终止条件,若满足则退出循环,继续运行步骤7,否则跳到步 骤3;
[0015] 步骤7:结束循环后,对最优值再进行一次禁忌捜索,最后输出结果。
[0016] 该方法具体步骤如下:
[0017] 1)初始化种群《=財,町...而,其中11为种群大小;
[001引2)计算种群X中个体的适应度值Fi,其中i = l,2,···,η;根据适应度值的大小进行 升序排序,并记忆保留前rV2个个体记作记忆种群Ρ;
[0019] 3)设置代数计数器t = l;
[0020] 4)先将种群X中的前k个适应度值小的个体复制到新种群XI中,再将XI中的n-k个 个体通过对种群X进行竞技选择选出,其中竞技选择的个数为y,即从X中随机选择y个个体, 选取适应度值好的保留到新种群XI中,运样进行n-k次选择,形成种群XI;
[0021 ] 5)对种群XI进行自适应交叉:在进化初期,交叉概率化0等于0.8;在进化后期,即 I > I,其中T为迭代次数,交叉概率化用自适应公式:
[0022]化= Pc〇X(l-i/n)i/2,
[0023] 其中i为交叉个体在种群中的下标索引确定,Pco等于0.8,判断随机数a(a为一个 (〇,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成的随机数)与交叉概率 的大小:当a小于交叉概率时,随机确定交叉点对XI中的个体xi和个体xn-i+i进行交叉;当a大 于交叉概率时,不进行交叉。运样进行rV2次交叉后形成种群X2;
[0024] 6)对种群X2进行自适应随机线性变异:在进化初期,即t<^xT,其中T为迭代次 4 数,变异概率化用自适应公式:
[0025]
[0026] 其中i为变异个体在种群中的下标索引确定,在进化后期变异概率化0等于0.08, 判断随机数b(b为一个(0,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成 的随机数)与变异概率的大小:当b大于变异概率时,不进行变异;当b小于变异概率时,对XI 中的个体XI随机选取一个位置i用线性变异公式:
[0030] 进行变异,其中ran为(0,1)区间内的随机数,当ran<0.5时f (ran) = -1,当ran〉0.5 时f(ran) = l;r和α都是(〇,1)区间内的随机数;i为下标索引;
[0031] 整个种群X2运行完变异后就得到种群X3,并计算种群X3适应度;
[0032] 7)将种群X3和记忆种群P合并为种群XP,种群XP的个体数为化/2,对种群XP进行小 生境淘汰;分别对XP中的两两个体进行计算欧式距离:
[003:3]
1= l,2,...,:;00;.j 二 i + l,...,.;00 :
[0034] 当,其中L为小生境的距离参数,小生境的距离参数是由动态函数公式
爵到的,判断^和^的适应度Fi和。的大小并将适应度差的处W罚函数, 然后根据当前变更的适应度将种群XP中的个体升序排列;
[0035] 8)取种群XP的前η个个体作为种群X,计算更新种群X的适应度值并根据适应度值 大小进行升序排列,取种群X的前rV2个个体作为新的记忆种群Ρ;
[0036] 9)判断是否禁忌捜索:若t<T-5,则运行步骤10);否则对种群X进行禁忌捜索;具体 步骤如下:
[0037] a)初始化禁忌表,设置禁忌迭代计数器tscount = l;
[0038] b)对当前候选解进行随机线性变异操作,线性变异公式:
[0039] x = x+f(ran)X 化 Xfi-i,
[0040] 其中ran和f和步骤6)中定义相同,i为邻域的下标索引,范围为(1,100)的区间形 成一组邻域解,并按照适应度值排序;
[0041] C)判断邻域解中的最小值是否比最优解更小,若是则满足藐视准则,若否则不满 足藐视准则;
[0042] 若满足则更新候选解、禁忌表和最优解,即将邻域中最小值赋值给候选解和最优 解,并将邻域中最小值放入禁忌表中;
[0043] 若不满足则判断邻域解中最小的10个解是否在禁忌表中,若不在则更新禁忌表, 即将其放入禁忌表中;
[0044] (1)禁忌迭代计数器13(3〇11]11 = 13(3〇11]11+1,判断终止条件,若13(3〇11]11:< = 1'1:,其中1'1 为禁忌捜索的迭代次数,贝峭巧Ij步骤b)继续运行,若tscountxrt,则终止迭代,返回主函数 中运行,并返回最优解。
[0045] 10)判断禁忌捜索算法得到的适应度值是否小于步骤8)中X种群的适应度值,若是 则将X中原先的个体序列和适应度值替换掉,否则不做改变;运样形成新种群X,取X种群的 前n/2个个体作为新的记忆种群P;
[0046] 11)迭代计数器累加 t = t+l,判断终止条件,若t< = T,其中T为迭代次数,则继续迭 代跳到步骤4)运行,若t〉T则迭代结束,运行步骤12);
[0047] 12)将得到的最优值进行禁忌捜索,其具体步骤同步骤9),返回其邻域中的最优值 作为最后的最佳结果;
[004引13)输出最佳结果,程序结束。
[0049]优选地,上述具体步骤中步骤4)为先将种群X中的前50个适应度值小的个体复制 到新种群XI中,再将XI中的n-50个个体通过对种群X进行竞技选择选出,其中竞技选择的个 数为20,即从X中随机选择20个个体,选取适应度值好的保留到新种群XI中,运样进行n-50 次选择,形成种群XI。
[(K)加]其他说明:
[0051]适应度大小是能量函数值E,能量函数值E的计算公式为:
[0057]求解适应度时需要用到将每个个体的角度值转换为Ξ维空间坐标的公式如下:
[0化引
[0059] 本发明与现有技术相比具有W下优点:
[0060] (1)将小生境遗传算法和禁忌捜索算法同时引入蛋白质结构预测中,通过小生境 淘汰算子对种群进一步进行选择淘汰其中相近的个体,增加了种群的多样性,避免了大量 重复解的出现,并且通过禁忌捜索算法来避免陷入局部最优,实现全局化的捜索,保证了全 局捜索,加快收敛,提高了程序的准确性。
[0061] (2)对普通的小生境遗传算法和禁忌捜索算法做了一些改进,采用自适应交叉、自 适应随机线性变异、采用动态函数确定距离参数L、加入随机线性变异的禁忌捜索算法等改 进策略,改进后的NGA-TS算法更易跳出局部最优,更好地提高了全局捜索能力,从而能更准 确地捜索到最优值,提高了捜索结果的准确性。
[0062] 本发明采用小生境遗传算法和禁忌算法混合的NGA-TS算法来解决蛋白质结构预 测问题。小生境遗传算法是一种在遗传算法的基础上添加了小生境淘汰机制的算法。小生 境算法的思想是生物进化过程中总是与自己相同的物种生活在一起的现象,反应到遗传算 法中就是使遗传算法中的个体趋向于在一个特定的生存环境中进化。遗传算法中加入小生 境淘汰机制可W保护种群的多样性,避免重复解的出现,但是也容易产生后期进化的停滞 和陷入局部最优。所W,为了改进小生境遗传算法的缺陷,我们在进化后期引入了禁忌算 法。禁忌算法是一种亚启发式随机捜索算法,其思想最早由化ed Glover提出,是一种全局 逐步寻优算法,也是对人类智力过程的一种模拟。在NGA-TS算法运行后期,禁忌算法更好的 保证多样化的有效捜索,W实现全局捜索优化。本文还通过对斐波那契序列和真实蛋白质 序列的模拟实验,得到了一些较好的结果,并和其他算法结果的进行比较,更充分有力的说 明了 NGA-TS算法在解决蛋白质结构预测问题上是有效的。
【附图说明】
[0063] 图1为整体程序流程图;
[0064] 图2为禁忌算法流程图;
[0065] 图3为斐波那契序列;
[0066] 图4为真实蛋白质序列;
[0067] 图5为本发明与其他方法对斐波那契序列的实验结果比较;
[0068] 图6为本发明与其他方法对真实蛋白质序列的实验结果比较;
[0069] 图7为本发明与其他方法对真实蛋白质序列的实验结果比较。
【具体实施方式】
[0070] 下面结合附图对本发明作进一步说明.
[0071 ]结合图5的整体程序流程图,下面进行详细步骤介绍:
[0072] 步骤1:初始化参数及种群。
[0073] 步骤2:进行迭代循环,计算种群适应度值。
[0074] 步骤3:对种群进行竞技选择、自适应交叉、自适应随机线性变异,更新种群。
[0075] 步骤4:对新种群进行小生境淘汰选择,更新种群。
[0076] 步骤5:在进化后期,对新种群进行禁忌捜索算法(如图6禁忌捜索流程),更新种 群。
[0077] 步骤6:判断是否满足终止条件,若满足则退出循环,继续运行步骤7,否则跳到步 骤3。
[0078] 步骤7:结束循环后,对最优值再进行一次禁忌捜索,最后输出结果。
[0079] 实施例1
[0080] 本发明的实施例是在W本发明技术方案为前提下进行实施的,给出了详细的实施 方式和具体的操作过程,但本发明的保护范围不限于下述实施例。因为蛋白质序列的种类 很多,我们W长度为5的蛋白质序列即斐波那契序列为例,具体序列见图3中长度为5的序 列。
[0081] 步骤1:首先将蛋白质序列抽象为数字序列,W便计算机运算。其中A表示疏水氨基 酸,B表示亲水氨基酸,在程序中疏水氨基酸对应的值为1,亲水氨基酸对应的值为-1(真实 蛋白质也是同样的规则,只是氨基酸的表示字母不同)。即长度为5的序列表示为[1 -1 -1 1 -1 ]。
[0082] 步骤2:根据蛋白质序列的长度确定种群个体的维度,当序列为η时,其中η表示序 列长度,种群个体的维度应为化-5(实为氨基酸的键角和扭转角之和)。所W,在实例序列长 度为5的情况下,种群个体的维度为2*5-5 = 5。运样就可W初始化种群乂 = ^1,枯,-',^,其中 m为种群大小,且每个元素都表示角度即[-31,31]范围中的随机数。
[0083] 步骤3:根据Ξ维空间坐标的公式将每个个体中的角度转换为氨基酸的Ξ维坐标, 求解适应度时需要用到将每个个体的角度值转换为Ξ维空间坐标的公式如下:
[0084]
[0085] 并由能量函数值E的计算公式计算自由能量值作为适应度值Fi(i = l,2,…,m)。能 量函数值E的计算公式为:
[0090]
[0091] 根据Fi的大小进行升序排序,并记忆保留前m/2个个体记作种群P。设置代数计数 器t = l,进行迭代循环。
[0092] 步骤4:对种群X进行竞技选择形成新种群XI。
[0093] 步骤5:对种群XI进行自适应交叉形成新种群X2。在进化初期(t<^,其中T为迭代 次数),交叉概率化0 = 0.8;在进化后期(,交叉概率用自适应公式(化=化DX(l-i/ 其中i为交叉个体在种群中的下标索引,m为种群大小)确定。判断随机数a(a为一个 (〇,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成的随机数)与交叉概率 的大小:当a小于交叉概率时,随机确定交叉点对XI中的个体xi和个体xm-i+i进行交叉;当a大 于交叉概率时,不进行交叉。运样进行m次交叉后形成新种群X2。
[0094] 步骤6:对种群X2进行自适应的随机线性变异。在进化初期(t<^xT ),变异概率用 4 自适应公式
确定;在进化后期,变异概率化〇 = 〇.08。判断随机数b(b为一 个(〇,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成的随机数)与变异概 率的大小:当b小于变异概率时,对X随机选取一个位置i用线性变异公式进行变异;线性变 异公式为:
[0098] 当b大于变异概率时,不进行变异。经过变异操作后得到新种群X3,并计算其适应 度值。
[0099] 步骤7:将种群X3和记忆种群P合并为新种群XP(个体数为3m/2)进行小生境淘汰选 择,用欧式公式计算欧式距离dij,欧式公式为:
[0100]
[0101]当du<L(L为小生境的距离参数,由动态函数公式
-得到)时,判 断Xi和Xj的适应度Fi和Fj的大小并将适应度差的处w (加上)罚函数(Penalty=l〇i5),使之 差的适应度更大W便淘汰,最后根据当前变更的适应度值将种群XP升序排列。
[0102] 步骤8:更新种群。取XP种群的前m个个体作为新种群X,计算更新其适应度值并进 行升序排列,取X种群的前m/2个个体作为新的记忆种群P。
[0103] 步骤9:判断是否禁忌捜索。若t<T-5,则运行步骤10;否则对种群X进行禁忌捜索。 具体步骤如下:
[0104] a)初始化禁忌表,设置禁忌迭代计数器tscount = l;
[0105] b)对当前候选解进行随机线性变异操作,用线性变异公式进行变异,线性变异公 古九,
[0108]
;形成一组邻域解,并按照适应度值排序;
[0109] C)判断是否满足藐视准则(邻域解中的最小值是否比最优解更小,若是则满足,若 否则不满足),若满足则更新候选解、禁忌表和最优解(将邻域中最小值赋值给候选解和最 优解,并将邻域中最小值放入禁忌表中),若不满足则判断邻域解中最小的10个解是否在禁 忌表中,若不在则更新禁忌表(将其放入禁忌表中);
[0110] (1)禁忌迭代计数器13(3〇11]11 = 13(3〇11]11+1,判断终止条件,若13(3〇11]11:< = 1'1:(1'1:为禁 忌捜索的迭代次数)则固巧Ij步骤b)继续运行,若tscount〉Tt则终止迭代,返回主函数中运 行,并返回最优解。
[0111] 步骤10:判断禁忌捜索算法得到的适应度值是否小于X种群中原先对应的值,若是 则将X中原先的个体序列和适应度值替换掉,否则不做改变。运样形成新种群X,取X种群的 前m/2个个体作为新的记忆种群P。
[0112] 步骤11:迭代计数器累加 t = t+l,判断终止条件,若t< = T(T为迭代次数)则继续迭 代跳到步骤4运行,若t〉T则迭代结束,继续运行步骤12。
[0113] 步骤12:将得到的最优值进行禁忌捜索(具体步骤同步骤9),返回其邻域中的最优 值作为最后的最佳结果。
[0114] 步骤13:输出最佳结果,程序结束。
[0115] 根据W上所示的步骤,我们对斐波那契序列(见图3)和真实蛋白质序列(见图4)进 行相关操作,对所获得NGA-TS的数据与其他方法的数据进行了比较(见图5、图6和图7)。
[0116] 综上所述,我们通过NGA-TS算法来解决蛋白质结构预测方法,可W减少大量冗余 解的存在从而增加种群的多样性,也可W避免过早收敛现象和停滞现象的产生从而增强局 部捜索能力,还可W避免陷入局部最优,实现全局化的。由此说明我们的方法是有效可行 的。
[0117] W上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其 发明构思加 W等同替换或改变,都应涵盖在本发明的保护范围内。
【主权项】
1. 基于NGA-TS算法的蛋白质结构预测方法,其特征在于:其包括以下步骤: 步骤1:初始化参数及种群; 步骤2:进行迭代循环,计算种群适应度; 步骤3:对种群进行竞技选择、自适应交叉、自适应随机线性变异,更新种群; 步骤4:对新种群进行小生境淘汰选择,更新种群; 步骤5:在进化后期,对新种群进行禁忌搜索算法,更新种群; 步骤6:判断是否满足终止条件,若满足则退出循环,继续运行步骤7,否则跳到步骤3; 步骤7:结束循环后,对最优值再进行一次禁忌搜索,最后输出结果。2. 根据权利要求1所述的基于NGA-TS算法的蛋白质结构预测方法,其特征在于:该方法 具体步骤如下: 1) 初始化种群Χ=χι,χ2,…,χη,其中η为种群大小; 2) 计算种群X中个体的适应度值Fi,其中? = 1,2,···,η;根据适应度值的大小进行升序 排序,并记忆保留前η/2个个体记作记忆种群Ρ; 3) 设置代数计数器t = l;4) 先将种群X中的前k个适应度值小的个体复制到新种群XI中,再将XI中的n-k个个体 通过对种群X进行竞技选择选出,其中竞技选择的个数为y,即从X中随机选择y个个体,选取 适应度值好的保留到新种群XI中,这样进行n-k次选择,形成种群XI; 5) 对种群XI进行自适应交叉:在进化初期,交叉概率Pco等于0.8;在进化后期, 其中T为迭代次数,交叉概率Pc用自适应公式: Pc = Pc〇X (l-i/n)1/2, 其中i为交叉个体在种群中的下标索引确定,Pco等于0.8;判断随机数a与交叉概率的大 小,其中随机数a为一个(0,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生 成随机数a;当随机数a小于交叉概率时,随机确定交叉点对XI中的个体^和个体χ η-1+1进行 交叉;当随机数a大于交叉概率时,不进行交叉,这样进行η/2次交叉后形成种群X2; 6) 对种群Χ2进行自适应随机线性变异:在进化初期:其中Τ为迭代次数,变 异概率Pm用自适应公式:其中i为变异个体在种群中的下标索引确定,在进化后期变异概率Pmo等于0.08;判断随 机数b与变异概率的大小,其中随机数b为一个(0,1)范围内的正态分布随机数,且每个个体 交叉判断都要重新生成随机数b:当b大于变异概率时,不进行变异;当b小于变异概率时,对 XI中的个体^随机选取一个位置i用线性变异公式:进行变异,其中ran为(0,1)区间内的随机数,当ran〈0.5时f (ran) = -1,当ran>0.5时f (ran) = 1;r和α都是(Oj)区间内的随机数;i为下标索引; 整个种群X2运行完变异后就得到种群X3,并计算种群X3适应度; 7) 将种群X3和记忆种群P合并为种群XP,种群XP的个体数为3n/2,对种群XP进行小生境 淘汰;分别对XP中的两两个体进行计算欧式距离 2,···,300;j = i+Ι,···,300;当dij〈L时,其中L为小生境的距离参数,小生境的距离参数是由动态函数公式-得到的,判断xi和xj的适应度Fi和Fj的大小并将适应度差的处以罚函数,然 后根据当前变更的适应度将种群XP中的个体升序排列; 8) 取种群XP的前η个个体作为种群X,计算更新种群X的适应度值并根据适应度值大小 进行升序排列,取种群X的前η/2个个体作为新的记忆种群Ρ; 9) 判断是否禁忌搜索:若t〈T-5,则运行步骤10);否则对种群X进行禁忌搜索;具体步骤 如下: a) 初始化禁忌表,设置禁忌迭代计数器tscount = 1; b) 对当前候选解进行随机线性变异操作,线性变异公式: x = x+f(ran) X 2π Xr1-1, 其中ran为(0,1)区间内的随机数,当ran〈0 · 5时f (ran) = -1,当ran>0 · 5时f (ran) = 1; r 和α都是(0,1)区间内的随机数;i为邻域的下标索引,范围为(1,100)的区间形成一组邻域 解,并按照适应度值排序; c) 判断邻域解中的最小值是否比最优解更小,若是则满足藐视准则,若否则不满足藐 视准则; 若满足则更新候选解、禁忌表和最优解,即将邻域中最小值赋值给候选解和最优解,并 将邻域中最小值放入禁忌表中; 若不满足则判断邻域解中最小的10个解是否在禁忌表中,若不在则更新禁忌表,即将 其放入禁忌表中; (1)禁忌迭代计数器丨8001111丨=丨8〇01111丨+1,判断终止条件,若丨8〇011111:〈 = 1'1:,其中1'1:为禁 忌搜索的迭代次数,则跳到步骤b)继续运行,若tSC〇Unt>Tt,则终止迭代,返回主函数中运 行,并返回最优解; 10) 判断禁忌搜索算法得到的适应度值是否小于步骤8)中X种群的适应度值,若是则将 X中原先的个体序列和适应度值替换掉,否则不做改变;这样形成新种群X,取X种群的前η/2 个个体作为新的记忆种群Ρ; 11) 迭代计数器累加 t = t+l,判断终止条件,若t〈 = T,其中Τ为迭代次数,则继续迭代跳 到步骤4)运行,若t>T则迭代结束,运行步骤12); 12) 将得到的最优值进行禁忌搜索,其具体步骤同步骤9),返回其邻域中的最优值作为 最后的最佳结果; 13) 输出最佳结果,程序结束。3.根据权利要求2所述的基于NGA-TS算法的蛋白质结构预测方法,其特征在于:所述步 骤4)为先将种群X中的前50个适应度值小的个体复制到新种群XI中,再将XI中的n-50个个 体通过对种群X进行竞技选择选出,其中竞技选择的个数为20,即从X中随机选择20个个体, 选取适应度值好的保留到新种群XI中,这样进行n-50次选择,形成种群XI。
【文档编号】G06F19/16GK105825075SQ201610144174
【公开日】2016年8月3日
【申请日】2016年3月11日
【发明人】周昌军, 魏雪, 郑学东, 王宾
【申请人】大连大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1