一种主次特征优先级分类方法与流程

文档序号:16037050发布日期:2018-11-24 10:09阅读:983来源:国知局

本发明涉及一种模式识别方法。

背景技术

近些年,模式分类方法得到了快速发展。传统分类方法包括fisher、贝叶斯、k近邻、决策树、支持向量机、神经网络和深度学习等。

传统分类方法主要包括数据预处理、特征提取、特征选择/降维及分类器设计几个环节,其中特征选取比较关键。为提高分类准确率,常常需要选取多维特征。不同特征具有不同的单特征分类准确率,其中决策树是唯一一个考虑了不同特征具有不同分类准确率的算法。在多维特征中,可能包含对提高分类准确率无帮助的冗余特征,而且这些冗余特征还会降低分类器的执行效率,因此有必要考虑不同特征的分类作用。

russell等给出了决策树的一个定义{s.j.russell,p.norvig,ande.pagesbouic,“artificialintelligence:amodernapproach,”prenticehall,1995.}:输入一种含有描述属性的对象或者情况,然后输出是/否的决定。决策树方法对所有特征进行了逐个评价,分析了每个特征的属性。但是决策树方法并没有选取出单特征分类准确率最高的特征,即不能充分发挥主特征的优势。如果没有充分利用高分类准确率的主特征,可能会导致分类准确率偏低。



技术实现要素:

本发明的目的是提供一种准确率较高的模式分类方法,本发明将特征分为主、次两类特征,并建立特征优先级,通过优先级顺序,充分发挥主特征的优势,进一步提高分类准确率。技术方案如下:

一种主次特征优先级分类方法,优先级高的特征具有优先分类决定权,即如果通过优先级别高的特征已经完成分类,后续优先级低的特征将会无效,此分类方法包括下列步骤:

(1)建立特征优先级结构

将特征分为主特征和次特征两类,以主特征优先级最高,并设定各次特征优先级,方法如下:

首先将提取到的特征进行单特征分类,即只使用一个特征进行分类,根据分类准确率,选取准确率最优时的特征作为主特征,其余的作为次特征,定义不同类别的样本特征值不交叉的部分为特征有效部分,以特征有效部分的概率作为特征优先级评价指标,采用高斯概率确定次特征优先级;根据高斯分布,求取概率密度曲线与横坐标之间的面积即得到相关概率,概率越大,优先级越高,求取两类样本不交叉概率,以同样的方法求取其他次特征有效概率,最终根据概率值确定各个次特征的优先级;

(2)选择有效特征

针对某样本分类时,实际只有一个特征被选择用于分类,称之为有效特征,针对每个特征设定特征有效条件,符合设定条件时,认为特征有效,否则无效;根据特征有效条件,针对每个样本选取最优的特征用于分类,针对每个样本,首先考虑选择主特征,当主特征无效时,根据次特征的优先级顺序进行特征选择,一旦发现有效特征,则特征选择结束,如果所有特征均无效,则强制选择主特征为有效特征;

(3)分类

根据建立的特征优先级,对每个样本分类时,选择优先级较高的有效特征进行单特征分类。

其中,特征有效条件的设定如下:

1)次特征有效条件

对于两类分类,采取当两类样本的某个次特征互不交叉时,认为特征有效,否则无效;

2)主特征有效条件

设定阈值确定主特征是否有效,阈值确定原则:1)需要保证主特征的主导性;2)需要尽可能减少主特征误分类样本。

本发明主要优点及特色体现在如下几个方面:

1.该方法将特征分为主次两类特征并且建立了主次特征优先级。基于特征优先级,可以充分发挥高优先级特征的高分类准确率优势。

2.该方法对于单个样本分类,不涉及循环,基本语句执行次数为常数,计算复杂度为o(1),非常适合在线处理。

3.基于两类样本特征不交叉的次特征有效条件,本方法为两类分类提供了一种新的方法。

附图说明

图1为两类慢波脑电信号平均电压曲线。

图2为特征优先级确定流程图。

图3为次特征概率计算示意图(以慢波脑电信号均值特征为例)。

图4为次特征有效条件示意图(以慢波脑电信号均值特征为例)。

图5为特征选择流程图。

图6为本发明的分类原理图。

具体实施方式

本发明提供了一种主次特征优先级分类方法。对每个特征单独设计评价指标,设定主特征(一维)和次特征(一维或多维),并设定特征优先级。通过特征优先级系统对待分类样本进行分析,最终从多维特征中选出某个具体特征用于分类。通过此方法可以针对每个待分类样本选取最佳特征,剔除较差特征,而且将多维特征降为单个特征,可以省去分类器(实际上特征选择过程也是分类过程,当最佳特征确定时,分类结果也就确定了,换言之,本发明呈现的分类方法是将特征选择和分类器进行了融合)。

以慢波脑电信号分类为例(但不局限于脑电分类),本发明呈现的主次特征优先级分类方法的具体步骤如下:

(1)前期准备(特征提取)

图1展示了慢波脑电信号平均采样电压曲线。基于三次多项式拟合小波包分解的低频系数提取最小二阶导数值的绝对值和最大二阶导数值之差作为主特征;提取小波包分解的低频系数曲线的过零率,平均电压值,二次多项式拟合小波包分解的低频系数的拟合常数c(ax2+bx+c),三次拟合的最小和最大二阶导数值之差以及小波包分解的低频系数的最小值作为次特征。

(2)分类过程

[1]建立特征优先级结构。

将特征分为主特征(一维)和次特征(一维或多维)两类,以主特征优先级最高,设定了各次特征优先级,如图2所示为特征优先级结构确定流程图。

优先级高的特征具有优先分类决定权,即如果通过优先级别高的特征已经完成分类,后续优先级低的特征将会无效。首先将提取到的特征进行单特征分类,即只使用一个特征进行分类,根据分类准确率,选取准确率最优时的特征作为主特征,其余的作为次特征。本发明以特征有效部分(特征有效部分是指不同类别的样本特征值不交叉的部分,如图3阴影部分所示)的概率作为特征优先级评价指标,采用高斯概率确定次特征优先级。根据高斯分布,求取概率密度曲线与横坐标之间的面积(图3中阴影区域面积)即可得到相关概率。概率越大,优先级越高,如图3所示,以脑电样本均值特征为例,求取两类样本不交叉概率。以同样的方法求取其他次特征有效概率,最终根据概率值确定各个次特征的优先级。

[2]选择有效特征

根据特征优先级结构,针对某个具体样本分类时,实际只有一个特征被选择用于分类,称之为有效特征。为了提高分类准确率,针对每个特征设定特征有效条件。符合设定条件时,认为特征有效,否则无效。

3)主特征有效条件

设定阈值确定主特征是否有效,阈值确定原则:1)需要保证主特征的主导性。2)需要尽可能减少主特征误分类样本。

4)次特征有效条件

对于两类分类,采取当两类样本的某个次特征互不交叉时,认为特征有效,否则无效,如图4所示,以慢波脑电信号均值特征为例,对其设定有效条件。

图4中,较细的曲线代表训练样本1的均值曲线,较粗的曲线代表训练样本2的均值曲线,横轴是均值,纵轴是均值高斯分布。两虚线外代表两类训练样本均值特征不交叉部分,两虚线之间部分代表训练样本1和训练样本2均值的交叉部分:当样本均值位于虚线1的左边时表示该样本是2类样本,当样本均值位于虚线2的右边时表示该样本是1类样本;当样本均值位于虚线1和虚线2之间时无法直接确定样本分类。

对于均值特征,设定其有效条件为:样本均值<训练样本2的最小均值,或样本均值>训练样本1的最大均值时,认为均值特征有效,否则无效。同样以此方法确定其他次特征有效条件。

根据特征有效条件,可以针对每个测试样本选取最优的特征用于分类,特征选择如图5所示。针对每个测试样本,首先考虑选择主特征,当主特征无效时,根据次特征的优先级顺序进行特征选择,一旦发现有效特征,则特征选择结束。如果所有特征均无效,则强制选择主特征为有效特征。

[3]分类过程

根据建立的特征优先级,对每个测试样本分类时,自动选择最佳特征进行单特征分类,不需要单独设计分类器。

分类过程如图6所示,针对每个测试样本进行特征提取,然后确定最优(有效)特征,将多特征分类转换为单特征分类。最后利用选择的单特征进行阈值分类,通过这种方式可以用阈值分类代替复杂的分类器。以上分类过程以慢波脑电样本为例,但不局限于脑电分类。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1