用于选择用于分类输入数据的特征的信息处理设备的制作方法

文档序号:6408310阅读:209来源:国知局
专利名称:用于选择用于分类输入数据的特征的信息处理设备的制作方法
技术领域
本发明涉及在从输入数据项提取出的多个特征量中选择对这些输入数据项进行分类要使用的特征量的信息处理设备,并且涉及信息处理方法等。
背景技术
对于外观检查等用的信息处理设备,存在以下方案从检测对象物体的所拍摄图像中提取诸如像素值的平均值和方差等的各种特征量的组,并且判断检查对象物体有无缺陷(分成无缺陷产品和缺陷产品这两类)。然而,当使用了所有这些大量的特征量时,特征的维数变为高阶。发生了在特定维数中出现的(诸如维数灾难(curse of dimensionality) 等的)问题、或者由提取冗余的特征量所引起的处理时间增加。因此,正注重以下方案通过选择适当的特征量来防止容易发生在特定维数中出现的问题,并且提高了运算处理的速度。在下文,将说明非专利文献1所公开的方案。在非专利文献1中,公开了以下方案 针对各个特征量确定用于评价分离度的评价值,并且基于这些评价值按从更优的评价值开始的顺序选择特征量。具体地,该方案是使用贝叶斯错误概率(Bayes-error-probability) 估计值、或者类内方差与类间方差的比来确定选择标准的特征选择方案。将详细说明贝叶斯错误概率估计值。例如,在两类问题的情况下,当由W1和W2来表示两个类、并且由XO = [X1, X2,…,Xk,…,xN]来表示观察到的特征时,由P(W1Ixk)和 P(W2Ixk)来分别表示&属于W1和W2的概率。在这种情况下,通过以下公式表示贝叶斯错误概率估计值。表汰式1Bayes = / min {P (W11 xk),P (w21 xk)} dxk (公式 1)针对各个特征量确定贝叶斯错误概率估计值。贝叶斯错误概率估计值越低表示越适合用来将两个类彼此分离。因此,可以按贝叶斯错误概率估计值的升序来选择特征量。接着,将详细说明类内方差与类间方差的比。例如,在两类问题的情况下,当由W1 和W2来表示两个类、并且由XO = [X1, X2,…,Xk,…,xN]来表示观察到的特征时,确定与特征量&相关联的类内方差与类间方差的比。另外,由Ai来表示属于类Wi的图案的集合。 由Ili来表示Ai中包括的图案的数量。由Hli来表示属于类Wi的图案的&的平均值。此外, 由η来表示所有图案的数量,并且由m来表示所有图案的&的平均值。在这种情况下,表汰式2类内方差(哞)和类间方差(σ|)通过以下公式来表示表达式2。表汰式3^1w =~ Σ Σ(xk -mi)2 (公式 i)
n i=l,2 xk ^Ai
表汰式权利要求
1.一种信息处理设备,用于在从输入数据项提取出的多个特征量中选择对所述输入数据项进行分类要使用的特征量,所述信息处理设备包括生成部件,用于通过生成从所述多个特征量中选择的特征量的组合来生成多个组合;第一计算部件,用于针对所述多个组合中的各个组合,计算用于评价针对所述输入数据项的分类的适合性的第一评价值;以及第二计算部件,用于基于所述第一评价值,针对所述多个特征量中的各个特征量,获得用于评价针对所述输入数据项的分类的适合性的第二评价值。
2.根据权利要求1所述的信息处理设备,其特征在于,还包括选择部件,所述选择部件用于基于所述第二评价值,从所述多个特征量中选择对所述输入数据项进行分类要使用的特征量。
3.根据权利要求1所述的信息处理设备,其特征在于,还包括设置部件,所述设置部件用于基于所述第二评价值,设置用于从所述多个特征量中选择对所述输入数据项进行分类要使用的特征量的选择标准。
4.根据权利要求1至3中任一项所述的信息处理设备,其特征在于,所述输入数据项是作为外观检查对象的检查对象物体的所拍摄图像的输入图像数据项,以及所述第一评价值和所述第二评价值是用于评价所述检查对象物体是否是无缺陷产品的评价值。
5.根据权利要求2所述的信息处理设备,其特征在于,所述第一评价值是用于评价所述输入数据项的分类的分离度的评价值。
6.根据权利要求5所述的信息处理设备,其特征在于,所述第一评价值是所述输入数据项的分类的贝叶斯错误概率估计值。
7.根据权利要求1至6中任一项所述的信息处理设备,其特征在于,所述第二计算部件通过将针对所述多个组合中的各个组合计算出的所述第一评价值相互比较,针对所述多个特征量中的各个特征量,计算用于评价针对所述输入数据项的分类的适合性的第二评价值。
8.根据权利要求5所述的信息处理设备,其特征在于,所述第一评价值是所述输入数据项的分类的类内方差与类间方差的比。
9.根据权利要求1所述的信息处理设备,其特征在于,所述第二计算部件基于所述第一评价值,针对各个组合提取适合于所述输入数据项的分类的特征量,并且针对所述多个特征量中的各个特征量,基于该特征量的提取次数,计算所述第二评价值。
10.根据权利要求3所述的信息处理设备,其特征在于,所述设置部件基于所述第一评价值和所述第二评价值来设置所述选择标准。
11.根据权利要求1所述的信息处理设备,其特征在于,所述第二计算部件按照预先设置的评价标准来判断各个所述第一评价值的适合度,并且基于所述适合度的判断结果来计算所述第二评价值。
全文摘要
提供了一种信息处理设备,用于在从输入数据提取出的多个特征量中选择对所述输入数据进行分类要使用的特征量。所述信息处理设备包括生成部件,用于通过组合所述多个特征量来生成多个组合;第一计算部件,用于针对所述多个组合中的各个组合,计算用于评价针对所述输入数据的分类的适合性的第一评价值;以及第二计算部件,用于基于所述第一评价值,针对所述多个特征量中的各个特征量,计算用于评价针对所述输入数据的分类的适合性的第二评价值。
文档编号G06T1/00GK102165488SQ20098013758
公开日2011年8月24日 申请日期2009年9月15日 优先权日2008年9月24日
发明者御手洗裕辅, 真继优和, 藤森友贵 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1