一种改进的基因表达式编程方法_3

文档序号:9453500阅读:来源:国知局
选择策略,还将选择出的预设百分比的 精英染色体遗传到下一代中。所谓精英选择策略为:在群体进化过程中的精英染色体(所 谓精英染色体是迄今出现的最好个体)直接遗传到下一代,而不进行配对交叉,这种选择 操作又称为复制。比如:遗传进化到第P代时,群体中a(p)为精英染色体。则把a(p)加入 到第P+1代中,作为第P+1代的第N+1个染色体,N为第p代群体的大小。
[0067] 具体的,预设百分比可以设定为5%,6%等,本领域技术人员在具体应用过程中进 行自定义预设百分比的取值,比如预设百分比为设定为5%,则根据当代染色体的适应值从 大到小选择5%的染色体作为精英染色体直接复制到下一代。可见,选择出的精英染色体的 适应值均大于未被选择的染色体的适应值。
[0068]在S103之后,自适应多亲杂交均匀算子还包括如下设计:根据适应函数计算出进 化后子代中的每个染色体的适应值GP (Q,L2,…,Ln),p是目前进行的遗传代数,pG1,2,… P,即计算杂交算子均匀表UmOlf)中每一行值的最大适应值,选择进化后子代中适应值最大 的染色体作为基父本用于杂交后遗传给下一代。
[0069] 本发明的发明人通过试验验证了本发明实施例中技术方案应用在相关规则挖掘 方面的有效性。
[0070] 用Iris数据集来验证算法的有效性,Iris是UCI(Universityof Californialrvine,加州大学)机器学习知识库中的一个数据集。在实验过程中,我们选择 Iris数据集中2/3的数据用于训练,Iris数据集中剩余1/3的数据用于测试。试验中用现 有技术SA-MGEP作为试验对比。本发明和SA-MGEP均运行100次,并通过如下公式来量化 分析规则集的多样性:
[0071]
[0072] 其中,N代表种群大小,m代表染色体个数,n代表一个染色体的子段数,代表 个体m和n之间的汉明距离。
[0073] 本发明与现有技术SA-MGEP试验结果对比如下表2所示,表2中准确率代表每轮 实验准确度的平均值,测试集的预测率代表每一轮测试实验预测准确率的平均值。
[0074] 表2.本发明与现有技术SA-MGEP试验结果对比
[0075]
[0076] 通过表2所示的本发明与现有技术的对比可以看出,应用本发明实施例中的技术 方案获得了更高的准确度和较低的时间消耗,且改进的基因表达式算法能从Iris数据集 获得更多的关联规则。
[0077] 通过上述本发明实施例提供的一个或多个实施例,至少具有如下技术效果或优 占.
[0078] 通过本发明实施例通过在种群初始化时基于均匀设计思想,采用了混合水平均匀 表使得初始样本均匀分布,初始种群元素从元素集中均匀取样,既不会丢失重要的元素;也 不会产生大量重复的元素,从而保证了初始种群染色体的多样性。然后在遗传过程中采用 自适应的多亲均匀杂交算子产生子代,兼顾交叉和变异的特点。通过这两个技术的结合改 进了基因表达式编程的初始化和遗传变异过程,从而解决了现有技术面临的早熟收敛、收 敛过程慢、易陷入局部最优解的技术问题,均匀初始化染色体种群和采用自适应杂交算子 使得在解决复杂问题时具有全局收敛性,收敛速度也获得了极大地提升。
[0079] 进一步,本发明实施例应用了多种遗传算子和淘汰机制的使用使得算法不易陷入 局部极值,提高了获得全局最优解的概率。
[0080] 2、本发明实施例中基于均匀设计思想生成混合水平均匀表的改进的基因表达式 编程方法相比正交设计也减少了实验次数。
[0081] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优 选实施例以及落入本发明范围的所有变更和修改。
[0082] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1. 一种改进的基因表达式编程方法,其特征在于,包括如下步骤: 以染色体长度为水平、由函数集和终止符集为因素生成一混合水平均匀表,其中,所述 混合水平均匀表由g个矩阵构建,g为一个染色体上的基因组成个数,所述混合水平均匀表 的每行值代表一个染色体; 子代产生步骤:对基于所述混合水平均匀表产生的初始种群应用自适应多亲杂交算子 产生子代P,P依次取1,2,…,P,其中,P为预设最大遗传代数; 对所述子代P应用基因重组算子和Dc域重组算子进行进化处理,以获得与所述子代p对应的进化后子代; 依据精英选择策略从所述进化后子代中选择适应度最高的染色体为当前最优解; 在所述当前最优解为全局最优解或达到所述预设最大遗传代数时,结束遗传过程,否 则令P=P+1后返回所述子代产生步骤。2. 如权利要求1所述的改进的基因表达式编程方法,其特征在于,所述以染色体长度 为水平、由函数集和终止符集为因素生成一混合水平均匀表,具体包括如下步骤: 创建g个调整后等水平均匀表Unxk((nXk)h ? (v+1)),其中,h取值为染色体的头部长 度,t取值为染色体的尾部长度,kG(v+l,f+v+l),V取值为所述终止符集的元素数目,f取 值为所述函数集的元素数目,n为常量整数; 将每个所述调整后等水平均匀表Unxk((nXk)h ? (v+1))中的元素循环复制到对应的空 白表中,每个所述空白表被填满后形成子混合水平均勾表; 根据形成的g个所述子混合水平均匀表创建出如下公式表示的所述混合水平均匀表: Un*(f+v+i) (g*(f+v+Dh * (v+l)1) 其中,h取值为染色体的头部长度,t取值为染色体的尾部长度,v取值为所述终止符集 的元素数目,f取值为所述函数集的元素数目,n为常量整数,g取值为染色体上的基因组成 个数。3. 如权利要求2所述的改进的基因表达式编程方法,其特征在于,所述创建g个调整后 等水平均匀表Unxk((nXk)h ? (v+1),,包括如下步骤: 创建原始等水平均匀表UnA ((n*k)h+t),其中,h+t表示矩阵列数,h取值为染色体的头部 长度,t取值为染色体的尾部长度,n*k表示矩阵行数,kG(v+l,f+v+l),V取值为所述终 止符集的元素数目,f取值为所述函数集的元素数目,n为常量整数; 通过拟水平法调整所述原始等水平均匀表; 对调整后的所述原始等水平均匀表中染色体的头部长度进行限制,以及虚拟出调整后 的所述原始等水平均匀表的部分水平,以形成所述调整后等水平均匀表。4. 如权利要求1所述的改进的基因表达式编程方法,其特征在于,所述对基于所述混 合水平均匀表产生的初始种群应用自适应多亲杂交算子产生子代P,具体为: 将基于所述初始种群所产生父本的m*n个子段进行均匀杂交组合,以产生所述子代p, 其中,m表示所述父本包括染色体的数目,n表示所述父本中一个染色体所划分子段的数 目。5. 如权利要求4所述的改进的基因表达式编程方法,其特征在于,在所述对所述子代p 应用基因重组算子和Dc域重组算子进行进化处理,以获得与所述子代p对应的进化后子代 之后,所述方法还包括: 根据适应函数计算出所述进化后子代中每个染色体的适应值; 根据每个染色体的适应值,从所述进化后子代中选择出预设百分比个数的精英染色 体遗传到下一代中。6.如权利要求5所述的改进的基因表达式编程方法,其特征在于,所述将基于所述初 始种群所产生父本的m*n个子段进行均匀杂交组合,产生所述子代p,包括: 从所述父本中选出m个基父本放入配对池; 从所述父本中随机选择m-1个从父本加入所述配对池; 基于所述m个基父本与所述m-1个从父本构造出杂交算子均勾表Um(IHn),其中,Um(IHn) 的每一行代表所述子代P中的一个染色体。
【专利摘要】本发明公开了一种改进的基因表达式编程方法,解决了现有方法面临的早熟收敛、收敛过程慢、易陷入局部最优解的技术问题。包括如下步骤:染色体初始化阶段,以染色体长度为水平、由函数集和终止符集为因素生成一混合水平均匀表,对基于混合水平均匀表产生的初始种群应用自适应多亲杂交算子产生子代p,对子代应用基因重组算子和Dc域重组算子进行进化处理,以获得与子代P对应的进化后子代;依据精英选择策略选择当前最优解,若当前最优解为全局最优解或达到预设最大遗传代数时,结束遗传进化过程,均匀初始化染色体种群和采用自适应杂交算子使得在解决复杂问题时具有全局收敛性,收敛速度也获得了极大地提升。
【IPC分类】G06N3/12
【公开号】CN105205535
【申请号】CN201510623547
【发明人】陈云亮, 李方圆, 陈小岛, 邓泽, 杜波, 陈佳
【申请人】中国地质大学(武汉)
【公开日】2015年12月30日
【申请日】2015年9月25日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1