一种基于多维度搜索的分类器处理方法及装置的制作方法

文档序号:6555020阅读:338来源:国知局
专利名称:一种基于多维度搜索的分类器处理方法及装置的制作方法
技术领域
本发明涉及模式识别领域,尤其涉及一种基于多维度搜索的分类器处理方法及装置。
背景技术
模糊最大-最小神经网络(简称FMMN)作为分类器是一种采用超盒模糊集对模式空间进行划分的模式分类器,FMMN分类器将一系列小模糊子集的并集构成一个能代表某类模式任意边界形状的模式集合。模糊神经网络分类器主要分为以下三层第一层为输入层; 第二层为超盒的形成和调整层;第三层为模糊决策层,即输出层。其功能主要体现在通过对部分样本进行学习而形成分类边界,再对未知样本进行分类。然而盲目的样本选择方法往往需要大量的学习样本,这不仅使得FMMN分类器的训练过程大大延长,而且在时间和工作量上也都付出了很大的代价。为了解决通过改善学习样本而提高分类器效率的问题,目前的技术包含例如 Shahshahani和Landgrebe在设计神经网络分类器时,利用未标识样本来有效提高分类器的分类性能;Davide和Sandro将无监督的核聚类算法与有监督分类的支持向量机有机结合起来,既实现了无标识样本的分类问题,又有效提高了分类器的分类正确率;Kothari和 Vivek采用遗传算法来反覆提炼未标识样本的类成员关系,以使得模式分类器中的最大化后验概率与已知类别保持一致;Fardanesh和Okan将未标识样本与已标识样本结合起来, 共同作为分类器的训练样本,发现在样本数与特征维数比率为较小值的情况下仍然能够获得较高的分类精度。学者B. Gabrys在FMMN的基础上提出了 “聚类与分类”相结合的通用型模糊最大-最小神经网络模型(简称GFMM),该模型与FMMN有以下几点不同1)其输入模式由原来的η维空间的一个点扩展为η维空间的一个超盒体;幻超盒的模糊隶属度函数以及超盒的扩张约束都被修改;幻其输入模式可以是已标识的,也可以是未标识的;4)超盒扩张时的最大尺寸限制是一个逐渐调整的改变值。从GFMM的工作原理来看,该模型的训练过程可以描述成一个动态的超盒扩张与压缩过程,超盒模糊集在输入空间中被不断地生成与调整。其基本策略是初始时设置相对较大地扩张准则并生成较大的超盒,随后通过不断地调整扩张准则及缩小超盒尺寸,来精确描述出不同类别的输入模式间的非线性边界。上述方法虽然在一些领域的应用取得了一定的成功,但是存在如下问题,例如, GFMM模型存在两个重要问题1)确定适当的网络结构(即超盒数目大小);B. Gabrys在研究通用模糊神经网络模型GFMM时,提出逐渐减小超盒最大尺寸限制值,通过比较,逐步找到最佳值。但是这种对超盒重叠区域逐步划分的方法往往容易造成超盒数目过多,网络结构过于复杂,而网络结构过于复杂又会导致网络的过适应的问题;2)样本训练时间较长; GFMM网络在运行时,数据不是一次通过,而是在不断调整超盒最大尺寸限制值的过程中多次通过。同时未标识样本在进行重叠测试时,需要与所有其他样本逐一进行重叠测试,无形中就使得样本的训练时间被延长。
因此,设计一种节省网络运行时间和优化网络结构的多维度搜索的分类器处理方法及装置十分必要,是模式识别领域目前急待解决的问题之一。

发明内容
本发明实施例提供一种基于多维度搜索的分类器处理方法及装置,通过获取输入样本间的空间连续性位置信息进行排序,并依据相似度测量值进行超盒扩张,并对超盒进行压缩,以获取最佳数量的超盒数目,进而实现节省网络运行时间和优化网络结构的目的。本发明实施例提供以下技术方案 一种基于多维度搜索的分类器处理方法,包括 步骤一、获取输入样本间的空间连续性位置信息,进行排序; 步骤二、计算相似性度测量值; 步骤三、依据相似度测量值进行超盒扩张; 步骤四、进行重叠测量;步骤五、进行超盒压缩,获取最佳数量的超盒数目。优选的,上述步骤一中输入模式采用下列形式的序对{Xh,dh},其中 h xlh ,K表示第h个输入模式,<是低端点,是高端点。
优选的,上述步骤一中,包含一初始化步骤,^及^的初始值设为Vj = 0,ffj = 0 ;当第j个超盒被首次增加进来时,超盒的最大、最小点将依次被修改为
权利要求
1.一种基于多维度搜索的分类器处理方法,其特征在于,所述处理方法包括 步骤一、获取输入样本间的空间连续性位置信息,进行排序;步骤二、计算相似性度测量值; 步骤三、依据相似度测量值进行超盒扩张; 步骤四、进行重叠测量;步骤五、进行超盒压缩,获取最佳数量的超盒数目。
2.根据权利要求1所述的分类器处理方法,其特征在于,所述步骤一中输入模式采用下列形式的序对{xh,dh},其中& = Xih 表示第h个输入模式,<是低端点,是高端点。
3.根据权利要求1所述的分类器处理方法,其特征在于,在所述步骤一中,包含一初始化步骤,Vj及Wj的初始值设为Vj = OjWj = O5当第j个超盒被首次增加进来时,超盒的最大、最小点将依次被修改为 Vj=X1jWj=X]其中,\是第h个输入模式的最小点,Wj第h个输入模式的最大点。
4.根据权利要求1所述的分类器处理方法,其特征在于,所述步骤二中,计算相似性度测量值通过公式 = I (WrVj)-(Wh-Vh) |/2。
5.根据权利要求1所述的分类器处理方法,其特征在于,在所述步骤三中,超盒扩张为对于输入模式{Xh,dh},找出属于第dh类模式的超盒,若隶属度最大的超盒为h,计算扩张公式为
6.根据权利要求1所述的分类器处理方法,其特征在于,在所述步骤四中,在进行重叠测量时,假设bj和Wc是两个属于不同类别的超盒,用d表示重叠程度,且初始值d°ld = 1, 分别对超盒的每一维分量i(i = 1,2,...,η),按其所属情况的不同,以不同的公式进行测试,找出重叠程度最小的相应维,然后对该维进行压缩;
7.根据权利要求1所述的分类器处理方法,其特征在于,在所述步骤五中,超盒压缩为如果D > 0,说明超盒b j和Wc有重叠,且第D维重叠程度最小,故对该维进行如下压缩,从而消除重叠。
8.根据权利要求7所述的分类器处理方法,其特征在于,在所述步骤五中,当输入待判别模式X,分别计算X属于每个超盒的模糊隶属度,隶属度最大的超盒所属的类别就是X的类别,即
9.一种基于多维度搜索的分类器处理装置,其特征在于,所述分类器处理装置包括位置信息获取模块、相似性度测量模块、扩张执行模块、重叠测量模块、优化模块,用于通过获取输入样本间的空间连续性位置信息进行排序,并依据相似度测量值进行超盒扩张,并对超盒进行压缩,以获取最佳数量的超盒数目。
10.根据权利要求9所述的分类器处理装置,其特征在于,所述位置信息获取模块,用于获取输入样本间的空间连续性位置信息,进行排序。
11.根据权利要求9所述的分类器处理装置,其特征在于,所述扩张执行模块,用于依据相似度测量值进行超盒扩张。
12.根据权利要求9所述的分类器处理装置,其特征在于,所述优化模块,用于进行超盒压缩,获取最佳数量的超盒数目。
全文摘要
本发明公开了一种基于多维度搜索的分类器处理方法及装置,通过获取输入样本间的空间连续性位置信息进行排序,并依据相似度测量值进行超盒扩张,并对超盒进行压缩,以获取最佳数量的超盒数目,进而实现节省网络运行时间和优化网络结构的目的。
文档编号G06F17/30GK102184246SQ20111013008
公开日2011年9月14日 申请日期2011年5月19日 优先权日2011年5月19日
发明者胡静 申请人:上海电机学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1