一种高斯过程多分类器的构造方法及装置的制造方法_2

文档序号：9667780阅读：来源：国知局

1以此运行每一个高斯二分类器，执行 g -1)/ 2次判定过程；针对每个测试样本都执行CJ= 次判定过程。
[0028] 103,在所判定出的所有类别中，提取测试样本的类别结果。
[0029] 其中，判定出所述测试样本的类别结果的高斯二分类器的数量，大于判定出其他类别的高斯二分类器的数量。
[0030] 现有技术中的高斯过程的二分类器采用一对多的策略，由于构建分类器所用的样本数量大，一对多高斯多分类器构建时间很长，并且在训练样本类别比较多的时候会出现训练均衡性较差问题。为解决一对多高斯多分类器存在的训练时间较长和训练样本类别数较多而导致的识别率效果不能令人满意的问题。本发明实施例利用一对一方法构建了高斯过程多分类器，将高斯过程二分类器扩展成多分类器，改进目前已有的一对多高斯过程分类器存在的不足，提出了基于一对一方法的高斯过程多分类器。将k类训练样本进行两两组合，并将组合得到训练样本作为两类输入训练得到对应的高斯二分类器，在分类阶段，采用投票法对测试样本进行投票，票数最多的类别即判为测试样本的类别数，可以降低每个分类器的输入样本个数，大大提高分类器的分类速度，并且解决了训练样本均衡性较差的问题。
[0031] 在本实施例中，所述对每种组合通过高斯过程二分类算法进行训练，并得到高斯二分类器的具体实现方式，包括：
[0032] 获取k类训练样本，并将k类训练样本两两组合，得到C/ = ·4(Α' -1)/ 2种训练样本的组合，其中，k大于等于3。
[0033] 将每种组合通过高斯过程二分类算法进行训练，得到(V,个高斯二分类器，其中每一个高斯二分类器对应一种组合，其中ie{1，· · ·，k}，je{1，· · ·，k}。
[0034] 在本实施例中，所述运行得到的所有高斯二分类器，依次对测试样本进行分类判定的具体实现方式，包括：
[0035] 设定η种类别，并将每一种类别的初始票数设为0,其中η为正整数。
[0036] 运行Cu个高斯二分类器中的第1个高斯二分类器，对目标测试样本进行分类判定，将目标测试样本判别为第i类，则将类别i的票数加1，其中，i为1至η中的一个整数值，表示当前高斯二分类器判定得到的类别编号。
[0037] 依次运行Cu个高斯二分类器中的所有高斯二分类器，并在所有高斯二分类器运行完毕后，得到η种类别中每一种类别的票数。
[0038] 进一步的，所述在所判定出的所有类别中，提取测试样本的类别结果，为：在η种类别中，提取票数最多的类别为类别结果。
[0039] 在实际应用的场景中验证本实施例方案相对于现有技术中的一对多高斯过程多分类器的优势：
[0040] -、在分类器的训练耗时方面：
[0041] 在表1-3所不的仿真结果中，0ΑΑ表不一对多高斯过程多分类器，0Α0表不一对一高斯过程多分类器，数据库采用Oil，Segment和USPS。其中，如表1所示的，Oil数据集为石油数据集，共有1000个样本，根据油质分为3个类别，同一管道中流出的石油有12个指标来表示，也就是说该数据有12维；
[0042]
[0043] 表1.两种方法在Oil上的训练时间结果对比
[0044] 如表2所示的，Segment数据集为图像分割数据集，共有2310个样本，属于7个类另IJ，是砖面、天空、树叶、水泥、窗户、路径和草地，每个类别330个样本数据，每个数据有19 个属性；
[0045]
[0046] 表2.两种方法在Segment上的训练时间结果对比
[0047] 如表3所示的，USPS数据集的手写数字数据是由0-9的10个数字组成，即数据共分为10类，其中每一类数据由大概500个样本组成，每个样本的维数是256。
[0048] 可以看出，Oil，Segment和USPS三个数据库的类别数依次增加，样本维数也依次增加。
[0049]
[0050] 表3.两种方法在USPS上的训练时间结果对比
[0051] 从表1-3所示的内容可以看出，在Oil、Segment、USPS三个数据库上，随着类别数增加，训练样本数增加，OAA的训练时间在急剧增加，与0A0的时间差值增大。由此可见，本实施例中提供的一对一高斯过程多分类器的训练时间不受类别数和训练样本数影响，远小于OAA方法。
[0052] 进一步的，由表4、5、6可以看出，在分类阶段，当训练样本数较少时，由于0A0训练的二分类器个数较多，导致分类时间略大于OAA，但是随着训练样本个数的增多，OAA的分类时间增长速度远大于0A0,且分类时间大于OAA;结合训练时间来看，训练时间占运行时间的绝大部分，总体来说，0A0方法的运行时间远小于OAA。
[0053]
[0054] 表4.两种方法在Oi 1上的分类时间结果对比[0055]
[0056]
[0057] 表5.两种方法在Segment上的分类时间结果对比
[0058]
[0059] 表6.两种方法在USPS上的分类时间结果对比
[0060] 二、分类器的分类结果：
[0061] 如图2所示的为本实施例提供的一对一高斯过程多分类器与现有技术中的一对多高斯过程多分类器在Oil数据集上的识别率差异，两种算法的识别率最多相差约〇. 47%; 如图3所示的为本实施例提供的一对一高斯过程多分类器与现有技术中的一对多高斯过程多分类器在Segment数据集上的识别率差异，在Segment数据集上的识别率最多相差约 0. 69% ;如图4所示的为本实施例提供的一对一高斯过程多分类器与现有技术中的一对多高斯过程多分类器在USPS数据集上的识别率差异，在USPS数据集上的识别率最多相差约 0. 8%。由此可见，本实施例所提供的方案在大大减少算法的运行时间的同时，并未降低算法的识别率。
[0062] 为了进一步说明本实施例在实际应用中的有效性，采用LFW数据库进行测试。LFW 数据库用标准人脸检测器Viola-Jones从Internet收集到的，包含了 5749个不同人的 13, 233张在真实环境下捕捉到的人脸图像。其中，1680人的图像数目大于或等于两幅，另外4069人只有一幅图像。图像分辨率为250X250,人脸图像以彩色为主，包含少量灰度图像。LFW中的人脸图像包含大尺度姿态、光照、表情、种族、年龄的变化，并且可能存在任意的遮挡，所以对于人脸识别来说非常具有挑战性。通过本实施例提供的上述方法，构造每类不同训练样本数，分别用0ΑΑ高斯过程多分类器和0A0高斯过程多分类器进行训练仿真，得到识别率结果如表7所示，训练仿真时间如表8所示。由此可见，本实施例解决的一对多高斯多分类器构建时间很长，并且在训练样本类别比较多的时候会出现训练均衡性较差问题。
[0063]
[0064] 表7.两种方法的识别率对比
[0065]
[0066] 表8.两种方法的训练时间比较
[0067] 本发明实施例还提供一种如图5所示的高斯过程多分类器的构造装置50,包括：
[0068] 训练模块，用于将训练样本两两组合，并对每种组合通过高斯过程二分类算法进行训练，并得到高斯二分类器，其中，每种组合包括两个训练样本，且对应一个高斯二分类器

完整全部详细技术资料下载

当前第2页1 2 3