有价票据的缺陷分类方法及缺陷分类系统与流程

文档序号:17699929发布日期:2019-05-17 22:12阅读:172来源:国知局
有价票据的缺陷分类方法及缺陷分类系统与流程

本发明涉及有价票据技术领域,具体而言,涉及一种有价票据的缺陷分类方法和一种有价票据的缺陷分类系统。



背景技术:

随着机器视觉技术的快速发展,在有价票据印刷行业中印刷检测已日趋自动化,但是由于受一些人为和环境因素的影响,有价票据在印刷过程中会产生各种缺陷。对产品缺陷的分类是整个过程中的重要部分,精确的缺陷分类有利于对提高检测能力,同时缺陷的精确分类能为前工序提供重要的反馈信息,帮助提升印刷质量。常用的分类方法包括:决策树,神经网络,朴素贝叶斯,svm(supportvectormachine,支持向量机)等。在实际应用中都具有各自的优缺点,比如:

一、决策树分类方法,优点:

1)决策树的构造不需要任何领域知识或参数设置,因此适合于探测式知识发现;

2)决策树可以处理高维数据,且处理速度相对较快;

3)决策树归纳的学习步骤简单快速;

缺点:

1)分类鲁棒性不强;

2)当类别太多时,错误可能就会增加的比较快;

二、神经网络,优点:

1)算法鲁棒,抗噪音数据,具有对未经训练的数据进行分析的能力;

2)可以处理离散、连续、向量等多种数据形式;

3)算法固有并行性,适用于并行计算加快计算过程;

缺点:

1)网络训练时间长;

2)网络模型缺乏可解释性,隐含层和权值中包含的信息难以理解;

3)由于sigmoid型的激励函数都存在饱和区,网络训练容易产生麻痹现象;

三、svm使用非线性映射,将原始数据映射到更高维的空间,然后再高维空间中找到一个超平面原始数据被分离的最好,

其优点:

1)分类鲁棒性强;

2)具有很强的泛化和学习能;

3)能很好克服传统算法的维数空间和过学习问。

缺点:当数据量过大时,训练时间长。

在有价票据印刷品缺陷分类中分类准确和计算时间是考虑的两个重要因素。由于印刷产品多,需要分类处理疑似缺陷也随之增加,尤其在连续废的情况下,分类处理时间就至关重要。

因此,在缺陷分类算法设计中,分类精度如何可以得到提高,如何将计算速度降到可以接受的范围,成为目前亟待解决的技术问题。



技术实现要素:

本发明正是基于上述问题,提出了一种新的有价票据的缺陷分类方案,使得分类精度得到了有效提高,计算速度也降到了可以接受的范围,提高了算法效率。

有鉴于此,本发明提出了一种有价票据的缺陷分类方法,包括:根据有价票据训练集中每个有价票据的缺陷特征,生成第一级子节点;计算每个所述第一级子节点的分割值,并根据所述分割值对所述缺陷特征进行分类;判断所有所述第一级子节点是否不可再分类,在判断结果为是时,分类完成。

其中,优选地,根据所述分割值对所述缺陷特征进行分类的步骤,具体包括:若所述分割值小于设定阈值,则采用支持向量机方法对所述缺陷特征进行分类;若所述分割值大于等于所述设定阈值,则采用决策树方法对所述缺陷特征进行分类。

在该技术方案中,通过每个第一级子节点的分割值与设定的阀值进行比较,确定采用向量机方法和决策树方法进行的分类,进一步判断所有节点是否不可再分类,确定分类完成,通过采用向量机方法和决策树方法来对缺陷特征进行分类,可以有效的提高分类精度,计算速度也降到了可以接受的范围,提高了算法效率。

在上述任一项技术方案中,优选地,根据有价票据的训练集中每个有价票据的缺陷特征,生成第一级子节点的步骤,具体包括:计算所述有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值;根据所述每个有价票据对应的信息增益值构造所述第一级子节点。

在该技术方案中,通过计算有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,可以有效的避免错误缺陷的提取,进而对缺陷残点进行再检测,计算缺陷衰减程度,根据衰减程度区分是正常缺陷还是错误缺陷,对衰减程度的判断,可以有效的提高分类精度,并且提高了算法效率。

在上述任一项技术方案中,优选地,还包括:计算每个有价票据的残点到缺陷质心的欧氏距离;在任一有价票据的残点到缺陷质心的所述欧氏距离大于或等于预设距离时,删除根据所述任一有价票据的缺陷特征生成的所述第一级子节点。欧氏

在该技术方案中,通过计算欧氏距离与预设距离进行比较,可以有效的避免异常点对缺陷特征的影响。

在上述任一项技术方案中,优选地,所述缺陷特征包括:能量、密度、残点密度、残点饱和度、残点散度和/或残点黑白特性。

根据本发明的第二方面,还提出了一种有价票据的缺陷分类系统,包括:生成单元,用于根据有价票据训练集中每个有价票据的缺陷特征,生成第一级子节点;分类单元,用于计算每个所述第一级子节点的分割值,并根据所述分割值对所述缺陷特征进行分类;处理单元,用于判断所有所述第一级子节点是否不可再分类,在判断结果为是时,分类完成。

其中,优选地,所述分类单元具体用于:若所述分割值小于设定阈值,则采用支持向量机方法对所述缺陷特征进行分类,以及若所述分割值大于等于所述设定阈值,则采用决策树方法对所述缺陷特征进行分类。

在该技术方案中,通过每个第一级子节点的分割值与设定的阀值进行比较,确定采用向量机方法和决策树方法进行的分类,进一步判断所有节点是否不可再分类,确定分类完成,通过采用向量机方法和决策树方法来对缺陷特征进行分类,可以有效的提高分类精度,计算速度也降到了可以接受的范围,提高了算法效率。

在上述任一项技术方案中,优选地,所述生成单元具体用于:计算所述有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,以及根据所述每个有价票据对应的信息增益值构造所述第一级子节点。

在该技术方案中,通过计算有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,可以有效的避免错误缺陷的提取,进而对缺陷残点进行再检测,计算缺陷衰减程度,根据衰减程度区分是正常缺陷还是错误缺陷,对衰减程度的判断,可以有效的提高分类精度,并且提高了算法效率。

在上述任一项技术方案中,优选地,还包括:计算单元,用于计算每个有价票据的残点到缺陷质心的欧氏距离;删除单元,用于在任一有价票据的残点到缺陷质心的所述欧氏距离大于或等于预设距离时,删除根据所述任一有价票据的缺陷特征生成的所述第一级子节点。

在该技术方案中,通过计算欧氏距离与预设距离进行比较,可以有效的避免异常点对缺陷特征的影响。

在上述任一项技术方案中,优选地,所述缺陷特征包括:能量、密度、残点密度、残点饱和度、残点散度和/或残点黑白特性。

通过以上技术方案,使得分类精度得到了有效提高,计算速度也降到了可以接受的范围,提高了算法效率。

附图说明

图1示出了根据本发明的一个实施例的有价票据的缺陷分类方法的示意流程图;

图2示出了根据本发明的实施例的有价票据的缺陷分类系统的示意框图;

图3示出了根据本发明的另一个实施例的有价票据的缺陷分类方法的示意流程图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的实施例的有价票据的缺陷分类方法的流程图。

如图1所示,根据本发明的实施例的有价票据的缺陷分类方法,包括:

步骤102,根据有价票据训练集中每个有价票据的缺陷特征,生成第一级子节点;

步骤104,计算每个所述第一级子节点的分割值,并根据所述分割值对所述缺陷特征进行分类;

步骤106,判断所有所述第一级子节点是否不可再分类,在判断结果为是时,分类完成。

其中,优选地,根据所述分割值对所述缺陷特征进行分类的步骤,具体包括:若所述分割值小于设定阈值,则采用支持向量机方法对所述缺陷特征进行分类;若所述分割值大于等于所述设定阈值,则采用决策树方法对所述缺陷特征进行分类。

在该技术方案中,通过每个第一级子节点的分割值与设定的阀值进行比较,确定采用向量机方法和决策树方法进行的分类,进一步判断所有节点是否不可再分类,确定分类完成,通过采用向量机方法和决策树方法来对缺陷特征进行分类,可以有效的提高分类精度,计算速度也降到了可以接受的范围,提高了算法效率。

在上述任一项技术方案中,优选地,根据有价票据的训练集中的每个有价票据的缺陷特征,生成第一级子节点的步骤,具体包括:计算所述有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值;根据所述每个有价票据对应的信息增益值构造所述第一级子节点。

在该技术方案中,通过计算有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,可以有效的避免错误缺陷的提取,进而对缺陷残点进行再检测,计算缺陷衰减程度,根据衰减程度区分是正常缺陷还是错误缺陷,对衰减程度的判断,可以有效的提高分类精度,并且提高了算法效率。

在上述任一项技术方案中,优选地,还包括:计算每个有价票据的残点到缺陷质心的欧氏距离;在任一有价票据的残点到缺陷质心的所述欧氏距离大于或等于预设距离时,删除根据所述任一有价票据的缺陷特征生成的所述第一级子节点。欧氏

在该技术方案中,通过计算欧氏距离与预设距离进行比较,可以有效的避免异常点对缺陷特征的影响。

在上述任一项技术方案中,优选地,所述缺陷特征包括:能量、密度、残点密度、残点饱和度、残点散度和/或残点黑白特性。

图2示出了根据本发明的实施例的有价票据的缺陷分类系统的示意框图。

如图2所示,根据本发明的实施例的有价票据的缺陷分类系统200,包括:生成单元202、分类单元204和处理单元206。

其中,生成单元202,用于根据有价票据训练集中每个有价票据的缺陷特征,生成第一级子节点;分类单元204,用于计算每个所述第一级子节点的分割值,并根据所述分割值对所述缺陷特征进行分类;处理单元206,用于判断所有所述第一级子节点是否不可再分类,在判断结果为是时,分类完成。

其中,优选地,所述分类单元204具体用于:若所述分割值小于设定阈值,则采用支持向量机方法对所述缺陷特征进行分类,以及若所述分割值大于等于所述设定阈值,则采用决策树方法对所述缺陷特征进行分类。

在该技术方案中,通过每个第一级子节点的分割值与设定的阀值进行比较,确定采用向量机方法和决策树方法进行的分类,进一步判断所有节点是否不可再分类,确定分类完成,通过采用向量机方法和决策树方法来对缺陷特征进行分类,可以有效的提高分类精度,计算速度也降到了可以接受的范围,提高了算法效率。

在上述任一项技术方案中,优选地,所述生成单元202具体用于:计算所述有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,以及根据所述每个有价票据对应的信息增益值构造所述第一级子节点。

在该技术方案中,通过计算有价票据训练集中每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,可以有效的避免错误缺陷的提取,进而对缺陷残点进行再检测,计算缺陷衰减程度,根据衰减程度区分是正常缺陷还是错误缺陷,对衰减程度的判断,可以有效的提高分类精度,并且提高了算法效率。

在上述任一项技术方案中,优选地,还包括:计算单元208,用于计算每个有价票据的残点到缺陷质心的欧氏距离;删除单元210,用于在任一有价票据的残点到缺陷质心的所述欧氏距离大于或等于预设距离时,删除根据所述任一有价票据的缺陷特征生成的所述第一级子节点。

在该技术方案中,通过计算欧氏距离与预设距离进行比较,可以有效的避免异常点对缺陷特征的影响。

在上述任一项技术方案中,优选地,所述缺陷特征包括:能量、密度、残点密度、残点饱和度、残点散度和/或残点黑白特性。

具体地,可以通过以下多个实施例来具体实施本发明的技术方案:

实施例一:通过根据有价票据训练集中每个有价票据的能量、密度、残点密度、残点饱和度、残点散度和/或残点黑白特性等缺陷特征,生成第一级子节点,并计算每个第一级子节点的分割值,以在分割值小于设定阈值,采用支持向量机方法对缺陷特征进行分类;在分割值大于等于设定阈值,采用决策树方法对所述缺陷特征进行分类,直至所有第一级子节点不可再分类,确定分类完成,可以有效的提高分类精度,计算速度也降到了可以接受的范围,提高了算法效率。其中,训练集是对系统的参数进行训练的一定数量的样本。

实施例二:在实施例一的基础上,具体还可以通过计算每个有价票据的缺陷特征与其他有价票据的缺陷特征之间的信息增益值,并根据每个有价票据对应的信息增益值构造第一级子节点,可以有效的避免错误缺陷的提取,进而对缺陷残点进行再检测,计算缺陷衰减程度,根据衰减程度区分是正常缺陷还是错误缺陷,对衰减程度的判断,可以有效的提高分类精度,并且提高了算法效率。

实施例三:在实施例一的基础上,具体还可以进一步排除异常点对缺陷特征的影响:计算每个有价票据的残点到缺陷质心的欧氏距离,并在任一有价票据的残点到缺陷质心的欧氏距离大于或等于预设距离时,删除根据任一有价票据的缺陷特征生成的第一级子节点。

以下结合图3对本发明的技术方案作进一步说明。

如图3所示,根据本发明的有价票据的缺陷分类方法,包括:

步骤302,提取特征1,特征1与1进行比较,若特征1大于1时,进入步骤304;若特征1小于等于1时,进入步骤314。

步骤304,提取特征2,若特征2小于0时,进入步骤306;若特征2大于等于0时,进入步骤308。

步骤306,获得分类1。

步骤308,svm使用该节点上的所有训练集进行svm分类。

步骤310,获得分类2。

步骤312,获得分类n。

步骤314,svm使用该节点上的所有训练集进行svm分类。

步骤316,获得分类1。

步骤318,获得分类n。

具体的步骤如下:

一、特征提取优化

1)为避免错误缺陷的提取,对缺陷残点进行再检测,逐步加强参数,计算缺陷衰减程度。根据衰减程度区分是正常缺陷还是错误缺陷。同时在分类学习中加入错误缺陷标记,可以通过分类算法区分是否为真正缺陷。

2)为了避免异常点对缺陷特征的影响,在特征提取过程中,增加抗干扰处理。通过聚合缺陷残点,计算每个残点到缺陷质心的欧氏距离,删除距离过大的干扰点。

3)设计有效的缺陷特征,能量,面积,残点密度,残点饱和度,残点散度,残点黑白特性等。

二、分类算法步骤

设缺陷特征为f={f1,f2,...,fn},分类标记c={c1,c2,...,cm}。

1)根据训练集的缺陷特征,生成树的根节点即第一级子节点。在子节点中分类的分割值最大,使得分类间距离最大。

2)计算第一级子节点中每个节点分割值,若分割值小于设定阈值,则说明该节点中的特征值,用决策树难以达到较好的分类效果,则采用svm进行分类;对于可以进一步分类的节点,按照决策树方法进行分类。

3)进行svm分类时,应当采用该节点上的特征值进行分类,还是采用核函数进行升维分类。

4)计算所有节点是否不可再分类,如若是,则分类完成,如若没有,则重复第二、三步,直达不可再分。

三、特征提取优化

1)为避免错误缺陷的提取,对缺陷残点进行在检测,逐步加强参数,计算缺陷衰减程度。根据衰减程度区分是正常缺陷还是错误缺陷。同时在分类学习中加入错误缺陷标记,可以通过分类算法区分是否为真正缺陷。

2)为了避免异常点对缺陷特征的影响,在特征提取过程中,增加抗干扰处理。通过聚合缺陷残点,计算每个残点到缺陷质心的欧氏距离,删除距离过大的干扰点。

3)设计有效的缺陷特征,能量,面积,残点密度,残点饱和度,残点散度,残点黑白特性等。

四、分类算法步骤

假设获得缺陷属性为f={f1,f2,...,fk},缺陷类型记为c={c1,c2,...,cm}。训练样样本集s={x1,x2,...,xn},决策树算法采用id3。

1)计算属性f之间的信息增益值gain(s,fi),其中i=1,2,...,k,表示属性fi在集合s上的信息增益。

2)选择最大的属性gain(s,fi)作为决策树节点。

3)按照属性fi的离散值d构造子节点dj,j=1,2,...,l,并把样本集s分为sj分别对应于dj,表示fi有l种可能值。

4)计算所有子节点dj对应样本集sj的信息增益值gain(s,fp),其中p=1,2,...,k,p≠i。

5)如果gain(s,fp)>=t(t为增益阈值),可以继续重复步骤1)至3)进行决策树分类;如果gain(s,fp)<t,则进行步骤6)。

6)把子节点dj所对应的样本集sj使用支持向量机(svm)方法进行分类,把分类结果直接作为dj的叶子节点。

重复步骤4)至6)直到完成所有子节点dj的分类,计算出所有分类结果的叶子节点。

以上结合附图详细说明了本发明的技术方案,本发明提出一种新的有价票据的缺陷分类方案,使得分类精度得到了有效提高,计算速度也降到了可以接受的范围,提高了算法效率。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1