分类方法和设备的制作方法

文档序号:6678473阅读:121来源:国知局
专利名称:分类方法和设备的制作方法
技术领域
本发明涉及用于对物品分类的方法和设备。本发明尤其与硬币或 纸币的分类有关。
技术背景插入机械装置、例如自动售货机、兑换机等的硬币或紙币, 一方 面依据面值分类,以及/或者另一方面,在原件和拷贝或其伪造品之 间分选。已知执行这种分类的各种各样的方法。如在GB2238152A中 描述的一个例子,其内容在这里作为参考。例如,从插入的硬币得到 表示硬币的不同特征的测量值,例如材料和厚度。然后将这些测量值 与存储的相应成对值进行比较,每组成对值相应于各个可承兑的硬币 的面额。当每一个测量值落在给定面值的各个范围中时,插入的硬币 被分类为属于那个面额。在上述讨论的分类类型中,测量值可以被看作特征向量中的元 素,并且不同面额的可承兑测量值对应于特征空间中的区域,被称为 承兌区域。在上述给出的例子中,特征空间是两维的,承兑区域是矩 形的,但是特征空间可以具有任何数量的维数,在承兌区域中具有相 应的复杂性。例如,GB2254949A描述了三维特征空间中的椭球承兑区 域,其内容在这里作为参考。在EP 0067898A、 EP 0472192A、 EP 0165734A中乂^开了用于对钞 票和硬币分类的方法和装置的其他例子。例如,如EP 0553402A和EP 0671040A中所述的,其他分类方法包括采用神经网络,其内容在这里 作为参考。在硬币分类中的一个重要问题是分离不同面额的困难。所感兴趣 的不同面额的总体分布可能是这样的,它不可能容易地定义正确地分 离面额的适当的接受边界。另一个问题是,为了实现正确的分离,需 要考虑具有大量元素的特征向量,这使得理解各种分布更加困难,因
而使得获得适当的接受边界更加困难。这些问题与数据分析中的 一般 分类问题相类似已经被研究并且产生了各种不同的技术、包括统计方 法。作为数据分析的统计方法的一个例子,主分量分析("PCA")是 这样一种方法,通过这种方法,采用线性变换将在一个空间中表达的 数据变换成一个新空间,其中,数据中的大多数变化可以用比第一空 间中更少的维数来表示。PCA方法涉及找到变量的协方差矩阵的本征 向量和本征值。本征向量是在新空间中的轴,本征向量具有作为第一 "主分量,,的最高本征值,按递减大小依此类推。PCA的细节可以在 关于多元分析的教科书中找到,例如Chatfield和Collins的"多元 分析导论"第4章。用于分类目的的数据分析的另 一种方法是线性判别式分析 ("LDA")。 LDA在已知数据落入分开的组中时是有用的。LDA的目标 是将数据变换成一个新空间,以便使每个数据组的中心之间的距离在 投影到新空间的轴上时最大,还使每个组沿轴的方差最小。例如,在 Fukunaga的"统计模式识别导论,,("Fukunaga")中描述了这种方法。 在一个例子中,通过找到一个使C—W的轨迹值最大的线性变换来执行 最大化,其中V是类间协方差矩阵,C是所有样本的协方差矩阵。如 Fukunaga中所解释的,这实际上是找到C—W的本征向量和本征值。本 征向量是新空间的轴。如论文中所述的,当有N个类时,新空间具有 N-l维。.在许多情况下,PCA或LDA都不能对数据组给出正确的分离。数 据分析的另一种方法是基于PCA的非线性分量分析(NCA)。在NCA中, 采用非线性映射将数据投影在 一 个新空间中,然后在新空间中执行 PCA。在Neural Computation 10, 1299-1319 (1998)由Bernhard Scholkopf, Alexander Smola和Klaus-Robert Muller的 "Nonlinear Component Analysis as a Kernel Figenvalue problem" 文章中给 出了 NCA的细节。("Scholkopf".)NCA的问题在于,非线性空间的维数可能非常大,因此主分量的 数量也非常大。对于一给定问题,不知道对于一个好的分类需要多少 主分量。发明内容在总体上,本发明涉及一种导出用于对货币物品分类的分类的方法,该方法包括测量每个类别的已知样本,并从所测量样本导出特 征向量,将特征向量映射到对不同类别有更清楚的分离的第二空间 中,并采用第二空间中的分离导出一个分离函数。更具体地,本发明提供了一种导出用于将货币物品分类成两个或 多个类别的分类器的方法,包括测量每个类别的已知样本,并从所 测量样本导出特征向量,选择一个对应于特征向量空间到第二空间的 映射的函数,将特征向量映射到图象向量,并在第二空间中导出表示 N-l个轴的系数,其中N是类别数,获得表示所测量样本的图象向量 到N-l个轴上的投影的值,并采用这些值来导出一个与第二空间中的 分离函数等效的用于分离类别的分离函数。本发明还提供了一种用于对货币物品分类的方法,包括测量物 品特征,从测量值产生一个特征向量,并采用根据权利要求1至6中 的任何一 个的方法导出的分类器来对物品分类。本发明还提供了一种用于对货币物品分类的设备,包括用于测 量货币物品特征的测量装置,用于从测量值产生一个特征向量的特征 向量产生装置,以及,采用根据权利要求1至6中的任何一个的方法 导出的分类器来对物品分类的分类装置。本发明还提供了一种用于对货币物品分类的设备,包括用于测 量货币物品特征的测量装置,用于从测量值产生一个特征向量的特征 向量产生装置,以及,分类装置,采用一个对应于特征向量空间到第 二较高维空间的非线性映射的,从而将特征向量映射到图象向量函 数,和代表第二空间中的N-l个轴的系数,以及一个等效于第二空间 中的分离函数的函数来对物品分类,其中N是可以由所述设备分类的 类别数。


下面将参考

本发明的实施例,其中图1是一个分类系统的方框图。图2是显示一个硬币数据分布的图表;以及图3是显示图2的数据到新轴上的投影的图表。
具体实施方式
下面将参考一个硬币确认器来描述本发明。
在图1中,方框1代表一个测量系统,该测量系统包括入口 2、 以用于展示样本3的硬币入口和硬币传送路径(未显示)形式的传送 系统以及用于测量样本的物理量的传感器系统(未显示)。测量系统1 通过数据总线5连接到一个处理系统4。处理系统4通过数据总线7 连接到一个分类器6。分类器6的输出通过数据输出总线9连接到一 个使用系统8。使用系统8在这个例子中是一个自动售货机,但例如 也可以是货币兑换机。测量系统1测量插入的硬币3的特征。由处理系统4将测量的特 征汇集成一个具有n个元素的特征向量,每个元素对应于由系统4处 理的一个测量特征。在本实例中,传感器系统采用已知技术(例如, 参见GB2 254 949A)测量表示插入的^f更币的材料、厚度和直径的值, 这些值是相应的特征向量的三个元素。简言之,每个传感器包括自振 荡电路中的一个或多个线圈。在直径和厚度传感器的情况下,由所插 入硬币的邻近所引起的每个线圈的电感的变化使得振荡器的频率改 变,从而可以导出硬币的相应特性的数字表示。在电导传感器的情况 下,由所插入硬币的邻近所引起的线圏的Q的变化使得通过线圏的电 压改变,从而可以导出硬币的导电性的数字表示。虽然将每个线圏的 结构、定位和朝向以及加到其上的电压的频率安排为使得线圈提供一 个主要取决于导电性、直径和厚度特性中之一的一特定特性的输出, 但应该理解,每个测量都可以由其他硬币特性在某种程度上所影响。当然,许多表示货币物品的不同特征可以被测量并用作特征向量 的元素。例如,在纸币的情况下,所测量特征例如可以包括纸币的宽 度、紙币的长度以及从整个或部分纸币反射或发射的光的强度。例如, 可以将一个测量系统安排为采用光传感器沿N条线扫描一个紙币。每 个扫描线包含L个顺序扫描的单个区域。在每个区域,有M个不同特 征的测量。更具体地,对于每个区域,对红、绿和红外射线的反射强 度作出测量。因此,纸币的测量总数是LxMxN。这些测量形成了相 应样品的特征向量的分量,因此特征向量具有LxMxN个分量。或者, 可以以不同的方式处理测量,以获得 一 个表示所测量样品的特征向 量。例如,可以为每个所测量区域形成由该区域的M个测量构成的局 部特征向量,因此每个局部特征向量具有M个分量。然后可以在整个 纸币区域上将局部特征向量相加,以获得表示整个样品的M维特征向 量。然后将特征向量输入到分类器6。分类器6采用特征向量和包括 一个分离函数的预定分类标准来判定样本是否属于任何一个预定类 别。如果将样本识别为属于纸币的一个可接受面额,则接受该纸币, 并记入纸币的相应值。如果将样本识别为属于一个已知的伪币组,则 拒绝该纸币。在这个例子中,系统用于对硬币的两种面额和一种已知的伪币进 行分类。在图2中显示了测量空间中的分布的二维表示。十字叉表示 第一种面额的样本,圆点表示第一种面额的伪币,圆圏表示第二种面 额的样本。下面在总体意义上说明分离函数的推导。然后也在总体意义上说 明分类方法,随后解释总体方法在特定例子上的应用。简言之,依椐本发明的一个实施例的用于导出一个分离函数的方 法采用 一个非线性映射将作为所测量的特征向量的空间的输入空间映 射成一个具有线性特性的更高维空间。采用训练数据、采用映射空间 中的LDA分析的等效物在映射空间中构造分离超平面。如同下面所讨论的,分析面额的总体分布。最初,测量每个所感兴趣的面额和每个已知伪币的样本,并形成 相应的特征向量。例如,在一个n维发散图(其中n是所测量特征的 数目)上绘制时,来自样本的特征向量粗略地落入通常称为群集 (cluster)的各个组中。然后将这些测量样本用于导出一个分离函 数,如下所述。在这个例子中,使用每种面额有50个样本,伪币有50 个样本。在进一步的说明之前,提供对符号的总体说明。 输入空间、即特^E向量空间-波定义为X。X-O不,其中N是群集数。子空间Xi的基数由iii表示,X中的 元素数是M。因此,f;",-M.xt是向量x的转置。/=1在输入空间中,c是协方差矩阵,并且,C二》,〈 (1) 本发明的方法采用一个定义映射空间中的点积的核函数k。假设 (J)是将X映射进一个希尔伯特Hilbert空间F的非线性函数, 并且*"力=-(力=(2)从下面的讨论中可以看出,显然不需要为一给定k构造(J),虽然 可以用Mercer定理显示出,如果对于任何k是一个为正的正整数算 子的连续核心,则存在一个cb (参见Scholkopf部分3和附录C)。也 不需要明确地执行F中的点积,F可以是一个无限维空间。在F中,V是协方差矩阵,并且我们假设集中在F中的观察,即,|>(、.) = 0。后面将描述一个集户i中数椐的方法。B是群集中心的协方差矩阵,并且其中,^是分组1的平均值,即<formula>formula see original document page 8</formula>(4)(5)其中,Xu是分组1的元素jB代表F中的群集间惯性。 V也可以用群集表示为(<formula>formula see original document page 8</formula>6)V代表F中的总惯性。 使~ =使K为由(《^U.^在群集元素上定义的(MXM)矩阵其中Up,)是群集p和群集q之间的协方差矩阵, <formula>formula see original document page 9</formula> (8)<formula>formula see original document page 9</formula>Kpq是一个(npxnq)矩阵,并且K是对称的,所以K,pq-Kpq' W是矩阵中心,并且(9)其中W,是所有项都等于丄的(n,xrii)矩阵。W是MxM块对角矩 阵。该方法实质上执行了映射空间F中的线性判别分析,以使得群集 间惯性最大并且群集内惯性最小。这等效于本征值求解,如Fukunaga 中所示。然后可以导出一个适当的分离函数。更具体地,本方法涉及找到满足下式的本征值人和本征向量v, 义Pw = 5v (10) 本征向量是F的元^:的线性组合,因此存在着系数ocp, <formula>formula see original document page 9</formula>,使得<formula>formula see original document page 9</formula>等式(10)的本征向量与<formula>formula see original document page 9</formula> (12)的本征向量相同(参见Scholkopf )。采用K和W的定义以及等式(6 )和(11 ),可以将(12 )的左式 表示如下<formula>formula see original document page 9</formula>
采用所有分组i和所有元素j的这个公式我们获得: 其中"=( 》=^对于(14)的右项,采用等式、(5)和(11):<formula>formula see original document page 10</formula>对于所有群集i和所有元素j我们获得 "J…,《)i…,-似…U…,"^》"+皿a (14)合并(13)和(14)我们获得<formula>formula see original document page 10</formula>(15)K可以分解为K-QR (Wilkinson, 1971),因此Kot-QRot。 R是上三角,Q是正交的,即QtQ-I。Q是Mxr矩阵,R是rxM矩阵,其中r是K的秩。已知对于一个 普通的矩形矩阵来说,QR分解总是存在的。然后,j吏i c^p (16) 由于R的行是线性独立的,所以对于一给定(3,存在至少一个a解。 因此,Ka = Q(3,并且,atK-ptQt (K是对称的)。 替换(15);<formula>formula see original document page 10</formula>等式(18)是标准本征值等式的形式。由于K是奇异的,所以QR 分解允许在子空间QP上工作,这简化了求解。之后系数a能据等式(16)从(3导出,而本征向量从等式(11)导出。通过要求F中相应的向量v被标准化来将这些系数a标准化。即 vV = l (19) 或(从等式ll)n g=i /-1产i w因此,(19) =〉a,Ka=l (20) 上面给出的步骤展示了如何找到等式(10)的本征值v。 从线性判别分析(例如,参见Fukunaga)可知,本征向量数-N-1,其中N是群集数。通过本征向量上的投影找到由本征向量跨越的子空间中的群集的图象。这是采用下列等式完成的卢" (2 j)从上面可以看出,计算不需要关于cj)的知识,或不需要计算F中 的点积。在实验中已经显示出,通过使用合适的核函数,将本征向量子空 间中的群集的图象很好地分离,更具体地,可以是线性可分离的,即, 它们可以由线、平面或超平面分离。则可以容易地导出一个合适的分离函数,采用已知技术、例如检 查、平均、Malalanobis距离、与k个最近的邻近值比较来对测量物 品分类。如上所述,假设观察在F中的中心。下面将更详细地讨论居中。 首先,对于一给定观察Xij:群集i的元素j,根椐下式将图象cj) (Xij) 居中<formula>formula see original document page 12</formula> (22 )然后,我们必须以居中点定义协方差矩阵K:对于一给定分组p和q,<formula>formula see original document page 12</formula>其中,我们已经引入下列矩阵 &=(U=,..... ..... ,>,,)矩阵,其元素全部等于1。& = t)爿w=1jMxM)矩阵,其元素是块矩阵。因此,对于未居中的点(f) (Xij),我们可以从《导出f,然后求解 f的本征向量。然后,对于特征向量x, x的居中4>图象在本征向量f 上的投影由下式给出上述讨论在一般意义上展示了总体判决分析的方法。下面将参考 硬币确认器的具体例子来说明 一般原理。返回在说明书的开始的硬币确认器的例子,每个特征向量具有三 个元素,有三个群集,分别对应于所感兴趣的两个面额和已知伪钞的 每一个。将每个面额的50个样本和伪钞的50个样本输入到测量系统1。 如上所述,传感器系统测量样本,以获得表示每种情况下的厚度、材 料和直径的值。从每个样本的所测量特征形成相应的特征向量。
从每个群集的50个样本特征向量,随机地选择37个用于产生分 离函数。然后选择一个核函数。在试错法的基础上选择核函数,以便选择 给出最佳分离结果的函数。有大量的满足Mercer定理的核函数是合 适的。核函数的例子是多项核<formula>formula see original document page 13</formula>高斯核<formula>formula see original document page 13</formula>hyberbol ic切线核<formula>formula see original document page 13</formula>以及S形核<formula>formula see original document page 13</formula>在这个例子中,使用了高斯核,其中cj2-0. 01。采用所选择的样本和核函数,计算出矩阵K和W(等式(8 )和(9 ))。然后采用QR分解来分解K。然后,计算本征向量(3和相应的本征向量(等式(18))。然后,计算系数a并进行标准化(等式(16)和(20))。然后,将每个群集的剩余的13个样本的特征向量投影到本征向量v(等式12),并将结果绘制在一个图上,以便容易检查。在这个例子中,有3个群集,因此有2个本征向量,并且分离在第二空间中。这在图3中显示。可以看出,群集被很好地分离。更具体地,将每个群集投影到一个作为重心的点上。然后分析带有本征向量的群集的投影的分离,并用于导出一个分离函数。在这个例子中,线性分离函数可以通过检查容易地导出。例如,合适的分离函数是对于本征向量v^ v2,以及输入向量x, 如果<formula>formula see original document page 13</formula>则x属于组l(即,它是第一面额);如果<formula>formula see original document page 13</formula>则x属于组2(即,它是第二面额);以及
如果(-'(:c)v,) < 0or"rf(-'(jc)v2 ) 〉 0
则X属于组3(即,它是第一面额的伪钞)。未知面额的硬币的分类的执行如下。感测插入的硬币,并获得表 示样本的材料、厚度和直径的测量。然后从测量值导出一个特征向量。 然后将特征向量投影到计算出的本征向量上(采用等式21),并根据 投影值和分离函数对硬币分类,如上所述。初始数据分析的样本值的分离和分离函数的导出例如可以采用一个微处理器来完成。同样,分类器6可以是一个微处理器。或者,分类器6可以是一个神经网络,例如概率神经网络或感知器。例如,神经网络可以包括N-1个线性输出神经元和M个隐藏神经元,其中,每个核计算是一个隐藏神经元。然后,输入加权是值Xpq,系数a是隐藏神经元和输出层之间的加权。并且,分类器可以是线性分类器或支持向量机。 上述实施例的方法同样可应用于纸币,事实上还可应用于其他物品分类。其他求解(10)方法、例如采用本征向量分解来分解K也是可以的。在该实施例中,采用到更高维空间的非线性映射。也可以使用线 性映射来代替。并且,映射可以一个较低维空间,或者是与特征向量 空间相同维数的空间。
权利要求
1.一种用于处理从货币物品导出的数据的方法,所述方法包括测量各类别的货币物品的样本以在第一空间中产生特征向量,并且把所述特征向量映射到第二空间,在所述第二空间中对于所述各类别有着更分明的分离。
2. 如权利要求1所述的方法,其中使用PCA或LDA来确定所述第二空间。
3. 如权利要求2所述的方法,其中使用非线性映射把所述第一空 间中的数据映射到第三空间,并且对所述数据在所述第三空间中的图 像执行PCA或LDA。
4. 如权利要求1所述的方法,进一步包括导出用于把所述各类 别分离开的分离函数。
5. —种用于对货币物品进行分类的方法,包括 测量货币物品以导出特征向量,以及使用如权利要求1所述的方法的结果来确定所述货币物品的类别。
6. —种用于对货币验证器编程的方法,包括 使用货币物品的多个样本执行如权利要求1所述的方法,以及使用结果来对验证器编程。
7. —种用于对货币物品进行分类的设备,包括 用于感测货币物品的特征的传感器; 用于根据所感测的值生成特征向量的处理器;以及 用于使用如权利要求1所述的方法的结果对货币物品进行分类的分类器。
8. —种用于对货币物品进行分类的设备,包括用于处理从货币物品导出的特征向量数据的分类器,其中分类相 当于处理第一空间、第二空间中的输入数据,在所述第二空间中对于类别有着更分明的分离。
9. 如权利要求7所述的设备,其中优选地在经非线性映射的输 入空间的图像中,使用PDA或LDA来确定所述第二空间。
全文摘要
一种导出用于将货币物品分类成两个或多个类别的分类的方法,包括测量每个类别的已知样本,选择一个对应于特征向量空间到第二更高维数空间的非线性映射的函数,将特征向量映射到图象向量,并在第二空间中导出表示N-1个轴的系数,其中N是类别数,获得表示所测量样本的图象向量到N-1个轴上的投影的值,并采用这些值来导出一个与第二空间中的分离函数等效的用于分离类别的分离函数。
文档编号G07D5/00GK101154301SQ20071018118
公开日2008年4月2日 申请日期1999年12月1日 优先权日1998年12月2日
发明者G·鲍达特 申请人:Mei公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1