基于nsga-ⅱ优化改进的模糊分类模型构造方法

文档序号:6591624阅读:189来源:国知局
专利名称:基于nsga-ⅱ优化改进的模糊分类模型构造方法
技术领域
本发明属于数据挖掘和人工智能的技术领域,涉及一种模糊分类模型构造方法,尤其是一种基于第二代非支配排序遗传算法(Non-dominated sorting geneticalgorithm II,NSGA-1I)优化改进的模糊分类模型构造方法。
背景技术
模糊分类模型的知识表达形式和推理机制符合人类思维习惯,其结构和模糊集合隶属函数参数具有明显的物理意义。人们可通过易于理解的模糊规则洞察分类模型的内部运行机理,即解释性是模糊分类模型最显著的特征,尤其在医学、金融等领域,解释性甚至成为构建分类模型时的首要目标。随着分类问题维数和复杂性的提高,利用传统的方法构造模糊分类模型主要存在以下几个问题而使模型不具备解释性:1)特征变量的维数存在冗余;2)模糊规则数比实际需要的多;3)模糊规则前件数比实际需要的多;4)模糊集合的数量与参数设计不合理。为克服以上问题,诸多学者对在保证系统精确性时如何提高模型的解释性进行了相关石开究° “J.Pan, D.Westwick, E.Nowick1.Flux estimation of inductionmachines with the linear parameter-varing system identification method [C].Canadian Conference on Electrical and Computer, Engineering.2004,,利用决策树初始化模糊模型,采用模糊集合相似性度量和相似性奖励遗传算法对模型进行迭代简化,最后利用相似性惩罚遗传算法整体优化模型,但惩罚因子需预先给定。“A.Gonzalez, R.Perez.Selection of relevant features in a fuzzy genetic learning algorithm.1EEE Transactions on Systems, Man and Cybernetics.2001(31): 417-425,,将二进制编码的遗传算法用于分类模型中输入变量的选择和规则的优化,但是未涉及规则前件的优化° “F.Berlanga, M.Jesus, F.Herrera.Learning fuzzy rules using geneticprogramming: context-free grammar definition for high-dimensionality problems.Proceedings of the I Workshop on Genetic Fuzzy Systems.2005: 136-141” 和“F.Berlanga, M.Jesus, F.Herrera.GP-COACH: genetic programming-basedlearning of compact and accurate fuzzy rule-based classification systems forhigh-dimensional problems.1nformation Sciences.2010 (180): 1183-1200” 将析取泛式用于分类模型规则库的遗传优化中,减少了模糊规则数,但是规则前件数仍较多。上述技术均对模糊分类模型进行了优化,不同程度地提高了模型的解释性,但是特征变量、模糊规则及其前件冗余的情况仍然存在。

发明内容
本发明的目的在于提供一种基于NSGA-1I优化改进的模糊分类模型构造方法,减少特征变量、模糊规则及其前件的冗余,提高模糊分类模型的解释性。首先通过C4.5算法构造初始决策树,实现对特征变量和模糊集合数的选择;然后利用三角隶属函数将决策树转化为初始模糊分类模型;最后基于NSGA-1I优化模糊分类模型,同时通过对模糊规则及其前件的选择来删除模糊规则中的冗余,从而提高了模糊分类模型的精确性和解释性。实现本发明目的的技术解决方案为:一种基于NSGA-1I优化改进的模糊分类模型构造方法,包括以下步骤:步骤一、构造初始模糊分类模型根据样本输入输出数据,利用C4.5算法构造初始分类决策树,采用三角形隶属函数将初始分类决策树转化为初始模糊分类模型;步骤二、设定进化参数给定所需的种群规模L、最大迭代次数MAXTER、当前迭代次数t、交叉率pc、变异率pm ;步骤三、产生初始代种群将初始模糊分类模型直接编码产生第一条染色体,定义模糊分类模型编码方式如下:CH=CsCtCs= (CS1, cs2,..., csE)csr= (d1;r,…,dn,r, dn+1,r)Ct= (Ct1, Ct2,…,ctn+1)=Cmi J其中CH表示染色体,Cs为模糊分类模型的规则库中所有规则编码,crr为单条规则编码,r=l, 2,-,R, R为规则库中的规则数;(!&为规则r中变量i的编码,取值为O或者1,i=l, 2...,η+1,η为输入变量数;CT为模糊集合参数编码,Cti代表变量i的模糊集合参数编码,m1表示变量i的模糊集合数;第一条染色体中Cs所有基因值均取1,模糊集合参数由初始模糊分类模型的模糊集合参数实数编码得到。剩下的L-1条染色体,Cs中所有基因值也都取1,CT以第一条染色体的Ct为中心在搜索空间内随机均匀生成。这L条染色体构成初始代种群;步骤四、定义适应度函数定义如下适应度函数:
权利要求
1.一种基于NSGA-1I优化改进的模糊分类模型构造方法,其特征在于步骤如下: 步骤一、构造初始模糊分类模型 根据样本输入输出数据,利用C4.5算法构造初始分类决策树,采用三角形隶属函数将初始分类决策树转化为初始模糊分类模型; 步骤二、设定进化参数 给定所需的种群规模L、最大迭代次数MAXTER、当前迭代次数t、交叉率pc、变异率pm ; 步骤三、产生初始代种群 将初始模糊分类模型直接编码产生第一条染色体,定义模糊分类模型编码方式如下:
2.根据权利要求1所述的基于NSGA-1I优化改进的模糊分类模型构造方法,其特征在于,所述步骤一中,采用三角形隶属函数将初始分类决策树转化为初始模糊分类模型的过程如下: 首先记录全部决策节点值以及每个叶子的类标识;然后若输入变量Xi的论域范围为[PiAi],其论域上相邻的两个决策节点的值分别为
3.根据权利要求1所述的基于NSGA-1I优化改进的模糊分类模型构造方法,其特征在于,所述步骤三中,剩下的L-1条染色体,Ct以第一条染色体的Ct为中心在搜索空间内随机均匀生成,其中搜索空间为:
4.根据权利要求1所述的基于NSGA-1I优化改进的模糊分类模型构造方法,其特征在于,所述步骤五中,利用NSGA-1I算法全局搜索最优个体的过程如下: .5.1对种群进行遗传操作:采用二进制锦标赛选择;对染色体Ct部分进行 BLX-0.5交叉,对染色体Cs部分进行HUX交叉,交叉率为pc ;每两条染色体的Cs和Ct在进行交叉后各有两个子代,结合它们得到四条子代染色体,对这四条子代染色体进行概率为Pm的单点变异操作,即在Cs和Ct中各随机选择一个基因进行变异;将变异后的四条染色体反编码为对应的模糊分类模型,计算它们的适应度函数值,留下准确性最高的两条染色体作为子代;第t代种群在遗传操作完成后得到子代种群; .5.2混合第t代种群及其子代种群得到个体数为2L的新种群; .5.3将新种群中的个体反编码为对应的模糊分类模型,计算每个模型的适应度函数值,对新种群中的所有个体的适应度函数值进行非支配水平排序与密集度评估; .5.4采用比较运算符对新种群中所有个体的适应度函数值进行排序,取前L个个体作为下一代种群; . 5.5迭代次数t加1,若t〈MAXTER,则返回5.1,否则,算法终止; .5.6当前种群中非支配水平最高个体中精确性最高的个体即为最优个体。
全文摘要
本发明公开了一种基于NSGA-Ⅱ优化改进的模糊分类模型构造方法,减少特征变量、模糊规则及其前件的冗余,提高模糊分类模型的解释性。首先通过C4.5算法构造初始决策树,实现对特征变量和模糊集合数的选择;然后利用三角隶属函数将决策树转化为初始模糊分类模型;最后基于NSGA-Ⅱ优化模糊分类模型,同时通过对模糊规则及其前件的选择来删除模糊规则中的冗余,从而提高了模糊分类模型的精确性和解释性。
文档编号G06N3/12GK103198357SQ20131011773
公开日2013年7月10日 申请日期2013年4月3日 优先权日2013年4月3日
发明者邢宗义, 朱跃, 季海燕, 俞秀莲, 夏军, 陈岳剑, 任金保 申请人:南京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1