一种缺陷预测方法及装置制造方法

文档序号:6500255阅读:166来源:国知局
一种缺陷预测方法及装置制造方法
【专利摘要】本发明实施例公开了一种缺陷预测方法及装置,涉及数据处理领域,实现了对故障产品的缺陷的准确及快速定位。具体方案为:根据目标属性从预存的产品故障记录中选择训练属性集,并将所述目标属性和所述训练属性集组合成训练集;其中,所述目标属性为历史故障产品的缺陷属性;根据所述训练集生成分类器集合;其中,所述分类器集合包含至少2个树分类器;将所述分类器集合作为预测模型预测故障产品的缺陷。本发明用于故障产品的缺陷预测的过程中。
【专利说明】一种缺陷预测方法及装置
【技术领域】
[0001]本发明涉及数据处理领域,尤其涉及一种缺陷预测方法及装置。
【背景技术】
[0002]随着时代的发展,能够满足人们需求的产品种类和数量逐渐增多,产品的质量是也已成为用户及企业关心的主要问题,特别是尤其对于企业来说,产品的质量就是企业的根本,因此降低产品的缺陷率对企业至关重要。而引起产品缺陷的原因主要是产品的生产工艺,包括产品的设计、所使用材料的质量、生产商能力等,因此对于企业来讲,若想降低产品的缺陷率,就需要分析并改进产品的生产工艺,从而提高产品质量。
[0003]每个产品都有关于该产品各方面的信息的记录,如原料来源、生产信息、测试信息、运输信息、使用信息等等,而当产品在使用或者生产过程中出现某一类型的缺陷或者故障时,引起这类缺陷或故障的因素和记录的该产品的信息具有一定的关联性。
[0004]现有技术提供一种故障产品缺陷预测方法,具体为利用记录的出现过故障的产品的信息,通过基于决策树的分类算法生成单一决策树,此时当产品出现故障时,便可以根据生成的决策树对故障产品的缺陷进行预测。而当记录的出现过故障的产品的信息的分类标签较多时,采用基于决策树的分类算法产生的单一决策树就容易引起过拟合或欠拟合,从而导致无法进行缺陷预测。因此当产品出现缺陷或者故障时,如何快速的定位故障点,并查找到故障原因已成为业界研究的重点。

【发明内容】

[0005]本发明的实施例提供一种缺陷预测方法及装置,实现了对故障产品的缺陷的准确及快速定位。
[0006]本发明的第一方面,提供一种缺陷预测方法,包括:
[0007]根据目标属性从预存的产品故障记录中选择训练属性集,并将所述目标属性和所述训练属性集组合成训练集;其中,所述目标属性为历史故障产品的缺陷属性;
[0008]根据所述训练集生成分类器集合;其中,所述分类器集合包含至少2个树分类器;
[0009]将所述分类器集合作为预测模型预测故障产品的缺陷。
[0010]结合第一方面,在一种可能的实现方式中,所述训练集包含M个训练单元,每个训练单元包含一个目标属性和一个训练属性集;
[0011]所述根据所述训练集生成分类器集合,包括:
[0012]从所述训练集中选取第一训练子集;
[0013]根据预设策略生成与所述第一训练子集相对应的第一树分类器;
[0014]从所述训练集中选取第二训练子集;
[0015]根据预设策略生成与所述第二训练子集相对应的第二树分类器;
[0016]从所述训练集中选取第N训练子集;其中,所述第N训练子集包含M’个训练单元,所述M’小于等于所述M ;[0017]根据预设策略生成与所述第N训练子集相对应的第N树分类器;其中,所述N为大于等于2的整数;
[0018]将N个树分类器组合生成所述分类器集合。
[0019]结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:
[0020]当生成第K-1树分类器时,获取生成的K-1个树分类器的错误率;
[0021 ] 当生成第K树分类器时,获取生成的K个树分类器的错误率;以便当所述K个树分类器的错误率和所述K-1个树分类器的错误率的差值小于预设的阈值时,将所述K个树分类器组合生成所述分类器集合;其中,所述K为小于等于N的整数。
[0022]结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,所述当生成第K树分类器时,获取生成的K个树分类器的错误率,包括:
[0023]根据第一训练单元从所述分类器集合中选取第一类树分类器;
[0024]根据所述第一类树分类器生成所述第一训练单元的第一预测标签;
[0025]根据第二训练单元从所述分类器集合中选取第二类树分类器;
[0026]根据所述第二类树分类器生成所述第二训练单元的第二预测标签;
[0027]根据第M训练单元从所述分类器集合中选取第M类树分类器;其中,所述第M类树分类器为未使用第M训练单元生成树分类器的分类器集合,所述M为训练集中包含训练单元的个数;
[0028] 根据所述第M类树分类器生成所述第M训练单元的第M预测标签;
[0029]根据M个预测标签获取所述生成的K个树分类器的错误率。
[0030]结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,所述根据所述第M类树分类器生成所述第M训练单元的第M预测标签,具体包括:
[0031]根据
【权利要求】
1.一种缺陷预测方法,其特征在于,包括: 根据目标属性从预存的产品故障记录中选择训练属性集,并将所述目标属性和所述训练属性集组合成训练集;其中,所述目标属性为历史故障产品的缺陷属性; 根据所述训练集生成分类器集合;其中,所述分类器集合包含至少2个树分类器; 将所述分类器集合作为预测模型预测故障产品的缺陷。
2.根据权利要求1所述的缺陷预测方法,其特征在于,所述训练集包含M个训练单元,每个训练单元包含一个目标属性和一个训练属性集; 所述根据所述训练集生成分类器集合,包括: 从所述训练集中选取第一训练子集; 根据预设策略生成与所述第一训练子集相对应的第一树分类器; 从所述训练集中选取第二训练子集; 根据预设策略生成与所述第二训练子集相对应的第二树分类器; 从所述训练集中选取第N训练子集;其中,所述第N训练子集包含M,个训练单元,所述M,小于等于所述M ; 根据预设策略生成与所述第N训练子集相对应的第N树分类器;其中,所述N为大于等于2的整数; 将N个树分类器组合生成所述分类器集合。
3.根据权利要求1所述的缺陷预测方法,其特征在于,还包括: 当生成第K-1树分类器时,获取生成的K-1个树分类器的错误率; 当生成第K树分类器时,获取生成的K个树分类器的错误率;以便当所述K个树分类器的错误率和所述K-1个树分类器的错误率的差值小于预设的阈值时,将所述K个树分类器组合生成所述分类器集合;其中,所述K为小于等于N的整数。
4.根据权利要求3所述的缺陷预测方法,其特征在于,所述当生成第K树分类器时,获取生成的K个树分类器的错误率,包括: 根据第一训练单元从所述分类器集合中选取第一类树分类器; 根据所述第一类树分类器生成所述第一训练单元的第一预测标签; 根据第二训练单元从所述分类器集合中选取第二类树分类器; 根据所述第二类树分类器生成所述第二训练单元的第二预测标签; 根据第M训练单元从所述分类器集合中选取第M类树分类器;其中,所述第M类树分类器为未使用第M训练单元生成树分类器的分类器集合,所述M为训练集中包含训练单元的个数; 根据所述第M类树分类器生成所述第M训练单元的第M预测标签; 根据M个预测标签获取所述生成的K个树分类器的错误率。
5.根据权利要求4所述的缺陷预测方法,其特征在于,所述根据所述第M类树分类器生成所述第M训练单元的第M预测标签,具体包括: 根据广咖^ ) = argmax^h(£j)/(^(?)=)生成所述第M预测标签;其中,Coob (M,xM)为所述第M训练单元的第M预测标签,Cj为第j树分类器,Cf"为所述第M类树分类器,h ( ε j)为第j树分类器的权重,Cj (xm)为根据所述第j树分类器和所述第M训练单元中包含的训练属性集得到的目标属性,ye Y, Y为分类标签集合。
6.根据权利要求5所述的缺陷预测方法,其特征在于,所述根据M个预测标签获取所述生成的K个树分类器的错误率,具体包括:根据
7.根据权利要求2所述的缺陷预测方法,其特征在于,在所述根据预设策略生成与所述第N训练子集相对应的第N树分类器之后,还包括: 从所述训练集中选取第N’训练子集;其中,所述第N’训练子集与所述第N训练子集的交集为空,所述第N’训练子集包含至少一个训练单元; 根据所述第N’训练子集获取所述第N树分类器的误预测率; 根据所述第N树分类器误预测率获取所述第N树分类器的权重。
8.根据权利要求7所述的缺陷预测方法,其特征在于,所述将所述分类器集合作为预测模型预测故障产品的缺陷,包括: 统计所述故障产 品的属性信息; 根据所述属性信息将所述分类器集合作为预测模型预测所述故障产品的缺陷得到分类标签集合; 根据所述分类器集合和所述分类器集合中每个树分类器的权重,获取所述分类标签集合中每个分类标签的信任值。
9.根据权利要求2-8中任一权利要求所述的缺陷预测方法,其特征在于,所述预设策略包括决策树算法。
10.一种缺陷预测装置,其特征在于,包括: 处理单元,用于根据目标属性从预存的产品故障记录中选择训练属性集,并将所述目标属性和所述训练属性集组合成训练集;其中,所述目标属性为历史故障产品的缺陷属性; 生成单元,用于根据所述处理单元得到的训练集生成分类器集合;其中,所述分类器集合包含至少2个树分类器;预测单元,用于将所述生成单元生成的分类器集合作为预测模型预测故障产品的缺陷。
11.根据权利要求10所述的缺陷预测装置,其特征在于,所述训练集包含M个训练单元,每个训练单元包含一个目标属性和一个训练属性集; 所述生成单元,包括: 选取模块,用于从所述处理单元得到的所述训练集中选取第一训练子集; 生成模块,用于根据预设策略生成与所述选取模块选取的所述第一训练子集相对应的第一树分类器; 所述选取模块,还用于从所述处理单元得到的所述训练集中选取第二训练子集;所述生成模块,还用于根据预设策略生成与所述选取模块选取的所述第二训练子集相对应的第二树分类器;所述选取模块,还用于从所述处理单元得到的所述训练集中选取第N训练子集;其中,所述第N训练子集包含M,个训练单元,所述M,小于等于所述M ; 所述生成模块,还用于根据预设策略生成与所述选取模块选取的所述第N训练子集相对应的第N树分类器;其中,所述N为大于等于2的整数; 组合模块,用于将所述生成模块生成的N个树分类器组合生成所述分类器集合。
12.根据权利要求10所述的缺陷预测装置,其特征在于,所述生成单元还包括: 第一获取模块,用于当生成第K-1树分类器时,获取生成的K-1个树分类器的错误率; 第二获取模块,用于当生成第K树分类器时,获取生成的K个树分类器的错误率;以便当所述K个树分类器的错误率和所述K-1个树分类器的错误率的差值小于预设的阈值时,将所述K个树分类器组合生成所述分类器集合;其中,所述K为小于等于N的整数。
13.根据权利要求12所述的缺陷预测装置,其特征在于,所述第二获取模块,包括: 选取子模块,用于根据第一训练单元从所述分类器集合中选取第一类树分类器; 生成子模块,用于根据所述选取子模块选取的所述第一类树分类器生成所述第一训练 单元的第一预测标签; 所述选取子模块,还用于根据第二训练单元从所述分类器集合中选取第二类树分类器; 所述生成子模块,还用于根据所述选取子模块选取的所述第二类树分类器生成所述第二训练单元的第二预测标签; 所述选取子模块,还用于根据第M训练单元从所述分类器集合中选取第M类树分类器;其中,所述第M类树分类器为未使用第M训练单元生成树分类器的分类器集合,所述M为训练集中包含训练单元的个数; 所述生成子模块,还用于根据所述选取子模块选取的所述第M类树分类器生成所述第M训练单元的第M预测标签; 获取子模块,用于根据所述生成子模块生成的M个预测标签获取所述生成的K个树分类器的错误率。
14.根据权利要求13所述的缺陷预测装置,其特征在于,所述生成子模块,具体用于: 根据
15.根据权利要求14所述的缺陷预测装置,其特征在于,所述获取子模块,具体用于: 根据
16.根据权利要求11所述的缺陷预测装置,其特征在于,还包括: 选取单元,用于在所述生成模块根据预设策略生成与所述第N训练子集相对应的第N树分类器之后,从所述训练集中选取第N’训练子集;其中,所述第N’训练子集与所述第N训练子集的交集为空,所述第N’训练子集包含至少一个训练单元; 第一获取单元,用于根据所述选取单元选取的所述第N’训练子集获取所述第N树分类器的误预测率; 第二获取单元,用于根据所述第一获取单元获取到的所述第N树分类器误预测率获取所述第N树分类器的权重。
17.根据权利要求16所述的缺陷预测装置,其特征在于,所述预测单元包括: 统计模块,用于统计所述故障产品的属性信息; 预测模块,用于根据所述统计模块统计的所述属性信息将所述分类器集合作为预测模型预测所述故障产品的缺陷得到分类标签集合; 第三获取模块,用于根据所述分类器集合和所述分类器集合中每个树分类器的权重,获取所述分类标签集合中每个分类标签的信任值。
18.根据权利要求11-17中任一权利要求所述的缺陷预测装置,其特征在于,所述预设策略包括决策树算法。
【文档编号】G06F19/00GK104021264SQ201310066324
【公开日】2014年9月3日 申请日期:2013年2月28日 优先权日:2013年2月28日
【发明者】陈焕华, 潘璐伽 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1