一种基于随机森林的钞票鉴伪方法

文档序号:10688182阅读:609来源:国知局
一种基于随机森林的钞票鉴伪方法
【专利摘要】本发明涉及钞票防伪研究领域,具体涉及一种基于随机森林的钞票鉴伪方法,基于传感器获取的钞票的多光谱图像,利用嵌入式设备芯片进行处理,包括:由采集到的原始图像及其梯度图像截取特定区域进行特征提取,获得分类所需的多个特征;创建单棵决策树,从根节点开始节点拆分,直至到达叶子节点;建立多棵决策树的随机森林。通过上述方式,建立了可在嵌入式设备上实现的随机森林分类器,能够在使用如DSP芯片作为处理器的点钞机上实现钞票的鉴伪工作,提高了点钞机中钞票鉴伪的性能,能够准确鉴别真钞中混杂的假钞并分类,而且计算速度快,能满足设备的实时性要求。克服了传统的鉴伪方法识别未知假币和新币种的能力较弱的缺陷。
【专利说明】
一种基于随机森林的钞票鉴伪方法
技术领域
[0001] 本发明属于钞票防伪研究领域,特别是涉及一种基于随机森林的钞票鉴伪方法。
【背景技术】
[0002] 点钞机是一种自动清点钞票数目和识别假币的机电一体化装置,在现金流通量较 大的办公处,点钞机已经成为不可或缺的设备。伪钞识别是点钞机至关重要的功能。纸币上 有多种防伪信息,传统的点钞机利用磁性分布、红外线穿透、纸张荧光反应等特征来鉴伪。 随着印刷技术、复印技术和电子扫描技术的发展,伪钞制造水平越来越高,点钞机传统的鉴 别技术已不能满足。而利用多光谱图像鉴伪,不但能提高性能跟鉴别能力,并能得到许多其 他鉴伪系统无法获取的信息。
[0003] 多光谱图像检测技术对钞票进行多个波段独自全幅成像、采集,得到钞票的紫外 图像、白光图像和红外图像,分析、记录而实现钞票的真伪鉴别。钞票的多光谱图像鉴伪技 术是钞票防伪研究领域的热门问题,它与国家的金融安全息息相关,具有重要的理论价值 和广阔的应用前景。传统的多光谱图像鉴伪技术中,利用钞票图像的统计信息如像素直方 图、均值、方差等进行鉴别的方法,应用传统的"以假鉴真"技术,这种鉴伪方法容易受不同 点钞机设备采图环境的影响,鉴别结果受经验值设定的限制,因此识别未知假币和新币种 的能力较弱。基于机器学习的方法,通过较低级的分类器设计达到钞票分类目的的方法,采 用"以真鉴假"的策略,在每台点钞机机器初次使用时都需要进行训练以补偿机器差异造成 的影响,这些方法也容易受不同币种的不同光照、新旧、噪声污染等因素的影响。

【发明内容】

[0004] 本发明的目的是提供一种钞票鉴伪方法,以嵌入式数字信号处理器平台为基础, 实现了随机森林算法在嵌入式设备上的应用,能实现"以真鉴真、借假鉴假",避免不同机器 的差异性造成的影响,该方法只需要进行一次训练而无需对每台新的设备都进行初始化, 能够可靠地对纸币进行分类,并稳定地检测出传统防伪技术无法识别的假币、变造币以及 不易流通的纸币。
[0005] 为实现上述目的,本发明采用的技术方案是:一种基于随机森林的钞票鉴伪方法, 包括以下步骤:
[0006] SI.钞票图像的特征提取:
[0007] 采集钞票的多光谱图像,截取特定区域,采用SSIM方法,得到多个鉴伪指标,多个 鉴伪指标通过线性组合得到真假钞分类所需的η个特征;
[0008] S2.样本训练:
[0009] 依据所提取的特征F1、F2、···、Fm和待鉴钞票的训练样本,采用随机森林方法进行 训练;创建决策树,对训练样本有放回地随机抽样得到N个样本及其响应,真钞为1,假钞为 〇;
[0010] S3.节点拆分:
[0011] S31.从根节点开始节点拆分,拆分的终止条件为树到达最大深度或节点样本数到 达最小,若为根节点,重新计算正、负样本的概率prior,与正、负样本数加权,并归一化,得 到新的pr i or,计算每个节点的va I ue,
[0012] (1):
[0013] (1)式中Pl为正样本概率,PO为负样本概率,N正为正样本数,N负为负样本数;
[0014] 随机抽取M个不重复的特征并确定每个特征的最佳拆分阈值;具体包括以下步骤:
[0015] S311.对抽取到的每个特征,将训练数据由小到大排序,从最左边的数据起作为拆 分点,计算分裂质量,找出分裂质量最高的点并得到拆分阈值,由此选定具有最高分裂质量 的特征作为分裂特征;
[0016] S32.对所述选定的分裂特征,小于其拆分阈值的样本归入左节点,大于或等于其 拆分阈值的样本归入右节点,递归运算继续进行节点拆分直至达到终止条件;
[0017] S4.误差估计:
[0018] -棵树训练完成后进行oob误差估计,将训练树时没有被抽到的训练样本作为oob 样本,放刹该树中预涮分类,
[0019]
[0020] 若oob误差率太大则丢弃当前树,重新训练一棵树;
[0021] S5.钞票鉴伪结果:
[0022] 所有树训练完成后,得到随机森林,待鉴钞票的测试样本作为输入,放到随机森林 中预测分类得到分类结果,实现钞票的鉴伪功能。
[0023] 进一步地,实现步骤Sl中采集钞票的多光谱图像,截取特定区域还包括以下步骤:
[0024] 通过点钞机中的传感器获取钞票的自然光图像与红外图像,由sobel算子进行边 缘检测获取两幅图像的梯度图像,截取以上四幅图像的特定鉴伪区域。
[0025] 进一步地,所述点钞机中传感器采用CMOS或CIS传感器。
[0026] 进一步地,步骤Sl中所述SSIM为衡量两幅图像相似度的指标,其值越大相似度越 高,最大为1。
[0027] 进一步地,所述钞票鉴伪方法利用嵌入式设备芯片进行处理,在嵌入式设备上建 立随机森林分类器,实现真假钞鉴定分类。
[0028]进一步地,在采用DSP芯片作为处理器的点钞机上使用所述钞票鉴伪方法进行真 假钞鉴定分类。
[0029] 更进一步地,所述采集钞票的多光谱图像,包括采集真钞和假钞的多光谱图像。
[0030] 以下就上述的钞票鉴伪方法中相关概念进行阐述或者定义:
[0031]定义一:SSIM,一种衡量两幅图像相似度的新指标,其值越大相似度越高,最大为 Io
[0032] 定义二:〇〇b误差估计,oob数据即袋外数据,是训练中没有被采集到的样本集合, 它们可以用来取代测试集误差估计方法。
[0033] 上述的钞票鉴伪方法由采集到的原始图像及其梯度图像截取特定区域进行特征 提取,获得分类所需的多个特征;创建单棵决策树,从根节点开始节点拆分,直至到达叶子 节点;建立多棵决策树的随机森林。通过以上方式建立了可在嵌入式设备上实现的随机森 林分类器。
[0034]上述的钞票鉴伪方法是基于点钞机中CMOS传感器获取的多光谱图像,主要是红外 图像和自然光图像,利用DSP芯片进行处理得到钞票鉴伪结果,能够在使用DSP芯片作为处 理器的点钞机上实现钞票的鉴伪工作,提高了点钞机中钞票鉴伪的性能,能够准确鉴别真 钞中混杂的假钞并分类,而且计算速度快,能满足设备的实时性要求。
[0035]上述的钞票鉴伪方法使用多光谱图像传感器得到的高分辨率的自然光图像和红 外图像,自动获取钞票图像中具有鉴别性的特征,以同一张钞票带有防伪信息的区域在自 然光下和红外光下的图像相似度为衡量指标,"以真鉴真、借假鉴假",避免了不同机器的差 异性造成的影响。
[0036] 上述的钞票鉴伪方法利用获得的真钞特征样本和假钞特征样本,训练生成随机森 林的决策树,新的钞票样本到来时,投入已生成的随机森林中,即可得到可靠的样本分类结 果。由于避免了机器差异性的影响,该方法只需要进行一次训练而无需对每台新的设备都 进行初始化。
[0037] 上述的钞票鉴伪方法可以实现在各类嵌入式设备包括点钞机中的真假钞鉴定分 类。
[0038] 本发明的有益效果:上述的钞票鉴伪方法大大地提升了识别未知假币和新币种的 能力,能够高可靠地对纸币进行分类,并且能够稳定地检测出传统防伪技术无法识别的假 币、变造币以及不易流通的纸币,保证流通纸币的安全性和可靠性。提高了点钞机中钞票鉴 伪的性能,能够准确鉴别真钞中混杂的假钞并分类,而且计算速度快,能满足设备的实时性 要求。该钞票鉴伪方法采用"以真鉴真、借假鉴假",避免了不同机器的差异性造成的影响; 只需要进行一次训练而无需对每台新的设备都进行初始化。
【附图说明】
[0039] 图1为本发明一个实施例的图像鉴伪流程示意图;
[0040] 图2为本发明一个实施例的随机森林示意图。
【具体实施方式】
[0041] 下面结合附图对本发明的实施方式进行详细描述。
[0042 ]如图1、图2所示,为本发明的一个实施例。
[0043] 实施例的技术方案如下:一种基于随机森林的钞票鉴伪方法,包括以下步骤:
[0044] Sl.钞票图像的特征提取:
[0045] 采集钞票的多光谱图像,截取特定区域,采用SSIM方法,得到多个鉴伪指标,多个 鉴伪指标通过线性组合得到真假钞分类所需的η个特征;
[0046] S2.样本训练:
[0047]依据所提取的特征F1、F2、···、Fm和待鉴钞票的训练样本,采用随机森林方法进行 训练;创建决策树,对训练样本有放回地随机抽样得到N个样本及其响应,真钞为1,假钞为 〇;
[0048] S3.节点拆分:
[0049] S31.从根节点开始节点拆分,拆分的终止条件为树到达最大深度或节点样本数到 达最小,若为根节点,重新计算正、负样本的概率prior,与正、负样本数加权,并归一化,得 到新的pr i or,计算每个节点的va I ue,
[0050] Cl)
[0051] (1)式中Pl为正样本概率,PO为负样本概率,N正为正样本数,N负为负样本数;
[0052] 随机抽取M个不重复的特征并确定每个特征的最佳拆分阈值;具体包括以下步骤:
[0053] S311.对抽取到的每个特征,将训练数据由小到大排序,从最左边的数据起作为拆 分点,计算分裂质量,找出分裂质量最高的点并得到拆分阈值,由此选定具有最高分裂质量 的特征作为分裂特征;
[0054] S32.对所述选定的分裂特征,小于其拆分阈值的样本归入左节点,大于或等于其 拆分阈值的样本归入右节点,递归运算继续进行节点拆分直至达到终止条件;
[0055] S4.误差估计:
[0056] -棵树训练完成后进行oob误差估计,将训练树时没有被抽到的训练样本作为oob 样本,放到该树中预测分类, 「 ^ C+分奚镨误_ O幽样本数
[0057] 诶全犖=---_TT;------------------τ二--: 总_論锌本数
[0058]若oob误差率太大则丢弃当前树,重新训练一棵树;
[0059] S5.钞票鉴伪结果:
[0060] 所有树训练完成后,得到随机森林,待鉴钞票的测试样本作为输入,放到随机森林 中预测分类得到分类结果,实现钞票的鉴伪功能。
[0061] 在上述的钞票鉴伪方法中,实现步骤Sl中采集钞票的多光谱图像,截取特定区域 还包括以下步骤:通过点钞机中的传感器获取钞票的自然光图像与红外图像,由sobel算子 进行边缘检测获取两幅图像的梯度图像,截取以上四幅图像的特定鉴伪区域。
[0062] 上述的钞票鉴伪方法中所述点钞机中传感器采用CMOS或CIS传感器。步骤Sl中所 述SSIM为衡量两幅图像相似度的指标,其值越大相似度越高,最大为1。所述钞票鉴伪方法 利用嵌入式设备芯片进行处理,在嵌入式设备上建立随机森林分类器,实现真假钞鉴定分 类。在采用DSP芯片作为处理器的点钞机上使用所述钞票鉴伪方法进行真假钞鉴定分类。所 述采集钞票的多光谱图像,包括采集真钞和假钞的多光谱图像。
[0063] 根据上述实施例阐述的技术方案,具体描述如下:一种基于随机森林的钞票鉴伪 方法,基于点钞机中CMOS或CIS传感器获取的多光谱图像,主要是红外图像和自然光图像以 及R、G、B图像等,包括以下步骤:
[0064] 第一步:钞票图像的特征提取,通过点钞机中的CMOS传感器获取钞票的自然光图 像与红外图像,由sobel算子进行边缘检测获取两幅图像的梯度图像,截取以上四幅图像的 特定鉴伪区域并采用SSIM方法,得到多个鉴伪指标,多个鉴伪指标通过线性组合得到真假 钞分类所需的η个特征;
[0065]第二步:依据提取的特征Fl、F2、…、Fm和钞票的训练样本,首先,创建单棵决策树, 对训练样本有放回地随机抽样得到N个样本及其响应;真钞为I,假钞为O;
[0066] 第三步:从根节点开始节点拆分,拆分的终止条件为树到达最大深度或节点样本 数到达最小,若为根节点,重新计算正、负样本的概率prior,与正、负样本数加权,并归一 化,得到新的prior,计算每个节点的value,
[0067] ⑴
[0068] (1)式中正样本概率为Pl,负样本概率为PO,N正为正样本数,N负为负样本数;
[0069] 随机抽取M个不重复的特征并找到每个特征的最好拆分阈值,具体为:
[0070] 对抽取到的每个特征,将训练数据由小到大排序,从最左边的数据起作为拆分点, 计算分裂质量,找到分裂质量最高的点并得到拆分阈值,由此选出具有最高分裂质量的特 征作为分裂特征;
[0071] 第四步:节点拆分,对选定的分裂特征,小于其拆分阈值的样本归入左节点,大于 或等于拆分阈值的样本归入右节点,递归运算继续进行节点拆分直至达到终止条件;
[0072] 第五步:一棵树训练完成后进行oob误差估计,将训练树时没有被抽到的训练样本 作为oob样本,放到该树中预测分类, 「 ^ 城.+分类鐵误_ 样本数
[0073 ]·|>!餐煙举=---------------------------------ΓΓΤ--Τ:--- 总_ 〇说5禅本数
[0074] 若oob误差率太大则丢弃当前树,重新训练;
[0075] 第六步:所有树训练完成后,得到随机森林,待鉴钞票的测试样本作为输入,放到 森林中预测分类得到分类结果,实现钞票的鉴伪功能;
[0076] 该方法可以实现在点钞机中的真假钞鉴定分类。
[0077] 本实施例以同一张钞票带有防伪信息的区域在自然光光下和红外光下的图像相 似度为衡量指标,"以真鉴真、借假鉴假",避免了不同机器的差异性造成的影响。利用获得 的真钞特征样本和假钞特征样本,训练生成随机森林的决策树,新的钞票样本到来时,投入 以生成的随机森林中,即可得到可靠的样本分类结果。由于避免了机器差异性的影响,只需 要进行一次训练而无需对每台新的设备都进行初始化。从而大大地提升了点钞机识别未知 假币和新币种的能力,能够高可靠地对纸币进行分类,并且能够稳定地检测出传统防伪技 术无法识别的假币、变造币以及不易流通的纸币,保证流通纸币的安全性和可靠性。
[0078] 应当理解的是,本说明书未详细阐述的部分均属于现有技术。
[0079]虽然以上结合附图描述了本发明的【具体实施方式】,但是本领域普通技术人员应当 理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原 理和实质。本发明的范围仅由所附权利要求书限定。
【主权项】
1. 一种基于随机森林的钞票鉴伪方法,其特征在于:包括以下步骤:51. 钞票图像的特征提取: 采集钞票的多光谱图像,截取特定区域,采用SSM方法,得到多个鉴伪指标,多个鉴伪 指标通过线性组合得到真假钞分类所需的η个特征;52. 样本训练: 依据所提取的特征FI、F2、…、Fm和待鉴钞票的训练样本,采用随机森林方法进行训练; 创建决策树,对训练样本有放回地随机抽样得到N个样本及其响应,真钞为1,假钞为0;53. 节点拆分:531. 从根节点开始节点拆分,拆分的终止条件为树到达最大深度或节点样本数到达最 小,若为根节点,重新计算正、负样本的概率prior,与正、负样本数加权,并归一化,得到新 的prior,计算每个节点的value,(1)式中P1为正样本概率,P0为负样本概率,N正为正样本数,N负为负样本数; 随机抽取Μ个不重复的特征并确定每个特征的最佳拆分阈值;具体包括以下步骤: S311.对抽取到的每个特征,将训练数据由小到大排序,从最左边的数据起作为拆分 点,计算分裂质量,找出分裂质量最高的点并得到拆分阈值,由此选定具有最高分裂质量的 特征作为分裂特征;532. 对所述选定的分裂特征,小于其拆分阈值的样本归入左节点,大于或等于其拆分 阈值的样本归入右节点,递归运算继续进行节点拆分直至达到终止条件;54. 误差估计: 一棵树训练完成后进行〇〇b误差估计,将训练树时没有被抽到的训练样本作为〇〇b样 本,放到该树中预测分类,若oob误差率太大则丢弃当前树,重新训练一棵树;55. 钞票鉴伪结果: 所有树训练完成后,得到随机森林,待鉴钞票的测试样本作为输入,放到随机森林中预 测分类得到分类结果,实现钞票的鉴伪功能。2. 如权利要求1所述的钞票鉴伪方法,其特征在于:实现步骤S1中采集钞票的多光谱图 像,截取特定区域还包括以下步骤: 通过点钞机中的传感器获取钞票的自然光图像与红外图像,由sobel算子进行边缘检 测获取两幅图像的梯度图像,截取以上四幅图像的特定鉴伪区域。3. 如权利要求2所述的钞票鉴伪方法,其特征在于:所述点钞机中传感器采用CMOS或 CIS传感器。4. 如权利要求1所述的钞票鉴伪方法,其特征在于:步骤S1中所述SS頂为衡量两幅图像 相似度的指标,其值越大相似度越高,最大为1。5. 如权利要求1所述的钞票鉴伪方法,其特征在于:所述钞票鉴伪方法利用嵌入式设备 芯片进行处理,在嵌入式设备上建立随机森林分类器,实现真假钞鉴定分类。6. 如权利要求2所述的钞票鉴伪方法,其特征在于:在采用DSP芯片作为处理器的点钞 机上使用所述钞票鉴伪方法进行真假钞鉴定分类。7. 如权利要求2所述的钞票鉴伪方法,其特征在于:所述采集钞票的多光谱图像,包括 采集真钞和假钞的多光谱图像。
【文档编号】G07D7/20GK106056752SQ201610352247
【公开日】2016年10月26日
【申请日】2016年5月25日
【发明人】冯天鹏, 江燕婷, 颜佳, 林金勇
【申请人】武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1