分类方法及装置的制造方法

文档序号:9616493阅读:426来源:国知局
分类方法及装置的制造方法
【专利说明】分类方法及装置 【技术领域】
[0001] 本发明涉及机器学习技术,尤其涉及一种分类方法及装置。 【【背景技术】】
[0002] 在机器学习中,可以利用大量已知的训练样本,构建分类模型即分类器,进而利用 所构建的分类器对未知的数据进行预测。分类器可以应用在很多场景,例如,由于因网络 作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验,因此,反作 弊已经成为搜索引擎所面临的最重要的挑战之一,可以将利用已标注的正常数据和作弊数 据,构建一个分类器,以对网络数据进行识别。现有技术中,可以利用所构建的一个分类器, 对数据进行预测,以获得分类结果。
[0003] 然而,采用单一的分类器,其所预测的数据的分类结果的准确率不高。 【
【发明内容】

[0004] 本发明的多个方面提供一种分类方法及装置,用以提高分类结果的准确率。
[0005] 本发明的一方面,提供一种分类方法,包括:
[0006] 将待预测的数据分别输入Μ个目标分类器,以获得所述Μ个目标分类器中每个目 标分类器所输出的预测结果,Μ为大于或等于2的整数,所述每个目标分类器之间相互独 立;
[0007] 根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重, 获得所述数据的分类结果。
[0008] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预 测的数据分别输入Μ个目标分类器,以获得所述Μ个目标分类器中每个目标分类器所输出 的预测结果之前,还包括:
[0009] 利用Μ个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练 样本集中所包含的训练样本不完全相同;或者
[0010] 利用1个训练样本集,采用Μ个分类算法中每个分类算法,分别构建1个目标分类 器。
[0011] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所 述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的 分类结果之前,还包括:
[0012] 根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重 值;
[0013] 根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器 的第二权重值;
[0014] 根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。
[0015] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预 测的数据分别输入Μ个目标分类器,以获得所述Μ个目标分类器中每个目标分类器所输出 的预测结果之前,还包括:
[0016] 确定待更新的Ν个候选分类器,Ν为大于或等于Μ的整数;
[0017] 根据所述Ν个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分 类器的第三权重值;
[0018] 根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器 的第四权重值;
[0019] 根据所述第三权重值和/或所述第四权重值,从所述Ν个候选分类器中删除Ρ个 候选分类器,以获得所述Μ个目标分类器,Ρ为大于或等于1,且小于或等于Ν-2的整数。
[0020] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预 测的数据分别输入Μ个目标分类器,以获得所述Μ个目标分类器中每个目标分类器所输出 的预测结果之前,还包括:
[0021] 确定所构建的1个新的候选分类器;
[0022] 根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重 值;
[0023] 根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器 的第六权重值;
[0024] 根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述 新的候选分类器,作为所述Μ个目标分类器。
[0025] 本发明的另一方面,提供一种分类装置,包括:
[0026] 分类单元,用于将待预测的数据分别输入Μ个目标分类器,以获得所述Μ个目标分 类器中每个目标分类器所输出的预测结果,Μ为大于或等于2的整数,所述每个目标分类器 之间相互独立;
[0027] 处理单元,用于根据所述每个目标分类器所输出的预测结果和所述每个目标分类 器的预测权重,获得所述数据的分类结果。
[0028] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还 包括构建单元,用于
[0029] 利用Μ个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练 样本集中所包含的训练样本不完全相同;或者
[0030] 利用1个训练样本集,采用Μ个分类算法中每个分类算法,分别构建1个目标分类 器。
[0031] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述处理单 元,还用于
[0032] 根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重 值;
[0033] 根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器 的第二权重值;以及
[0034] 根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。
[0035] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还 包括第一更新单元,用于
[0036] 确定待更新的N个候选分类器,N为大于或等于Μ的整数;
[0037] 根据所述Ν个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分 类器的第三权重值;
[0038] 根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器 的第四权重值;以及
[0039] 根据所述第三权重值和/或所述第四权重值,从所述Ν个候选分类器中删除Ρ个 候选分类器,以获得所述Μ个目标分类器,Ρ为大于或等于1,且小于或等于Ν-2的整数。
[0040] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还 包括第二更新单元,用于
[0041] 确定所构建的1个新的候选分类器;
[0042] 根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重 值;
[0043] 根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器 的第六权重值;以及
[0044] 根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述 新的候选分类器,作为所述Μ个目标分类器。
[0045] 由上述技术方案可知,本发明实施例通过将待预测的数据分别输入Μ个目标分类 器,以获得所述Μ个目标分类器中每个目标分类器所输出的预测结果,Μ为大于或等于2的 整数,所述每个目标分类器之间相互独立,使得能够根据所述每个目标分类器所输出的预 测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果,由于Μ个目标分类 器中每个目标分类器之间是相互独立的,使得能够充分利用每个目标分类器的分类能力得 到数据的分类结果,从而提高了分类结果的准确率。
[0046] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,使得数据的分类 结果不再单独依赖于任何一个目标分类器的预测结果,而是综合考虑Μ个目标分类器中每 个目标分类器的预测结果,这样,能够有效提高分类结果的准确率。
[0047] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,通过动态更新候 选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,以获得 能够正常工作的分类系统即Μ个目标分类器,这样,能够避免现有技术中由于利用重新标 注的训练样本重新构建目标分类器替换原来的目标分类器而导致的无法充分利用原来的 目标分类器的问题,能够有效提高目标分类器的利用率。 【【附图说明】】
[0048] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述 中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实 施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附 图获得其他的附图。
[0049] 图1为本发明一实施例提供的分类方法的流程示意图;
[0050] 图2为本发明另一实施例提供的分类装置的结构示意图;
[0051] 图3为本发明另一实施例提供的分类装置的结构示意图;
[0052] 图4为本发明另一实施例提供的分类装置的结构示意图;
[0053] 图5为本发明另一实施例提供的分类装置的结构示意图。 【【具体实施方式】】
[0054] 为使本发明实施例的目的、技
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1