一种基于闪电接触过程算法的特征选择方法及系统与流程

文档序号:16740348发布日期:2019-01-28 12:57阅读:482来源:国知局
一种基于闪电接触过程算法的特征选择方法及系统与流程

本发明属于模式识别技术领域,涉及一种特征选择方法及系统,具体是涉及一种基于闪电接触过程算法的特征选择方法及系统。



背景技术:

一个模式识别系统的成败首先取决于所利用的特征是否能较好地反映将要研究的分类问题。而特征选择是指从原始特征中选取部分更能代表数据集的特征以降低数据集的维度的过程,是提高算法学习性能、避免维度灾难的重要手段,也是模式识别过程预处理过程中的关键步骤。

特征选择其本质是用计算的方法从一组给定的特征中选择一部分特征进行分类的过程,即对离散的集合进行优化的过程。而闪电接触过程算法不需要进行参数调优,对离散和连续问题都有较优的求解性能,因此可以将闪电接触过程算法应用到特征选择中。

闪电接触过程算法(lightingattachmentprocedureoptimization,lapo)是一种新的模拟自然界中闪电的上迎先导与下行先导接触过程的一种元启发式优化算法。在连续和离散优化问题,以及强约束优化问题上都有良好的性能表现。



技术实现要素:

本发明的目的是提供一种基于闪电接触过程算法的特征选择方法及系统,旨在利用闪电接触过程算法不需要对算法参数进行调整,算法结果多样性强,不易陷入局部最优等优势,提高模式识别效率。

本发明的方法所采用的技术方案是:一种基于闪电接触过程算法的特征选择方法,其特征在于,包括以下步骤:

步骤1:获取需要进行特征选择的训练样本集;

步骤2:生成样本标签维度的随机二进制字符串,根据所述随机二进制字符串对所述训练样本集进行特征抽取,得到样本特征集;

步骤3:利用支持向量机对所述样本特征集进行分类并得到分类准确度;

步骤4:利用以所述准确度构造的适应度函数,通过闪电接触过程算法对样本特征集进行迭代优化,进而达到特征选择的目的。

本发明的系统所采用的技术方案是:一种基于闪电接触过程算法的特征选择系统,其特征在于:包括样本获取模块、特征抽取模块、样本特征集分类模块、闪电接触过程寻优模块:

所述样本获取模块,用于获取需要进行特征选择的训练样本集;

所述特征抽取模块,用于生成样本标签维度的随机二进制字符串,根据所述随机二进制字符串对所述训练样本集进行特征抽取,得到样本特征集;

所述样本特征集分类模块,用于利用支持向量机对所述样本特征集进行分类并得到分类准确度;

所述闪电接触过程寻优模块,用于利用以所述准确度构造的适应度函数,通过闪电接触过程算法对样本特征集进行迭代优化,进而达到特征选择的目的。

本发明利用闪电接触过程优化算法不需要对算法参数进行调整,算法结果多样性强,不易陷入局部最优等优势,进一步提高了特征选择的效率和性能,能较好的平衡所选特征个数与分类准确率之间的矛盾。

附图说明

图1:本发明实施例的方法流程图;

图2:本发明实施例中闪电接触过程优化算法的流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,需要说明的是支持向量机分类器是已有技术,应当作为前提理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

请见图1、图2,本发明提供的一种基于闪电接触过程算法的特征选择方法,包括以下步骤:

步骤1:获取需要进行特征选择的训练样本集;

步骤2:生成样本标签维度的随机二进制字符串,根据所述随机二进制字符串对所述训练样本集进行特征抽取,得到样本特征集;

本实施例中,随机生成一系列二进制字符串组成一个种群大小pn行,特征维度dn列的二维矩阵x。

利用二维矩阵x每一行所对应的二进制字符串,将数值“0”对应的特征列舍弃,将数值“1”对应的特征列保留,得到种群大小pn个样本特征子集。

例如,样本x包含10个特征,通过生成10位的二进制字符串,例如xi=1011011101,则该二进制对应该特征子集由第1,3,4,6,7,8,10列所对应特征组成;

步骤3:利用支持向量机对所述样本特征集进行分类并得到分类准确度;

本实施例中,分类准确度accuracy(i)的计算公式为:

其中,i为当前计算的个体;tp为正确正例数,表示测试样本为正例并被赋予正例判定;tn为正确负例,表示样本为负例并被判定为负例;fp为错误正例,表示测试样本为负例并被赋予正例判定;fn为错误负例,表示测试样本为正例并被赋予负例判定。

步骤4:利用以所述准确度构造的适应度函数,通过闪电接触过程算法对样本特征集进行迭代优化,进而达到特征选择的目的;

本实施例中,利用分类准确度进行适应度计算,经过多次迭代计算,求解适应度最大值;最大适应度值所对应的特征子集即为最优特征子集;

其中,适应度值f(i)的计算公式为:

其中,i为当前计算的个体,accuracy(i)为分类准确度,λ为加权参数,n(i)为所选特征个数。

本实施例中闪电接触过程算法优化过程如图二所示,分为上迎先导运动与下行先导运动,其中在下行先导运动过程中对新的个体的值得计算公式为:

其中,为原先个体,xave为平均值个体,为随机个体;fjtestpoint为个体的适应度值,fave为平均值个体的适应度值;

对上迎先导运动过程中新个体xtestpoint_new的计算公式为:

xtestpointnew=xtestpointnew+rand×s×(xmin-xmax)

其中xmin为最优个体xmax为最差个体,s为指数因子,其计算公式为:

其中t为当前迭代数,tmax为最大迭代次数。

本发明还提供了一种基于闪电接触过程算法的特征选择系统,包括样本获取模块、特征抽取模块、样本特征集分类模块、闪电接触过程寻优模块:

样本获取模块,用于获取需要进行特征选择的训练样本集;特征抽取模块,用于生成样本标签维度的随机二进制字符串,根据所述随机二进制字符串对所述训练样本集进行特征抽取,得到样本特征集;样本特征集分类模块,用于利用支持向量机对所述样本特征集进行分类并得到分类准确度;闪电接触过程寻优模块,用于利用以所述准确度构造的适应度函数,通过闪电接触过程算法对样本特征集进行迭代优化,进而达到特征选择的目的。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1