一种基于视觉的统计数量方法与流程

文档序号：12906529阅读：1298来源：国知局

本发明涉及物流图像识别统计领域，尤其是涉及一种基于视觉的统计数量方法。

背景技术：

图像识别技术作为机器视觉的拓展技术，在最近十几年里已经得到了飞速发展，并在各个领域显现出强大的应用价值，广泛应用于工业、产品展示、医疗研究、军事、教育等领域，成为机器视觉技术领域的一个研究热点。而图像识别技术是机器视觉的关键技术之一，它使机器能对所拍摄到的图像进行学习和识别。图像识别系统利用深度学习的方法使机器对于特定的物体进行学习并在样本外的数据进行识别。当对计算机输入一定量的特定物体的图像数据后，通过预设好的神经网络进行学习，从而计算机获得对于特定图像一定的识别能力。此外，图像识别系统必须能够实时地检测出特定物体进入特定区域，然后根据预先训练好的模型和数据进行识别，并在输出的图像中标识出特定物体在图像中的位置和个数，这就是图像识别系统所要完成的任务。

目前国内外图像识别技术大致分为三种：基于前后照帧数对比图像不同的识别方法、基于预设物体大小轮廓形状的识别方法以及基于机器深度学习的人工智能识别方法。基于预设物体大小轮廓形状的识别方法是目前较为常用的图像方法，但是却无法克服由于特征模糊、改变镜头位置、光斑等原因造成的现实轮廓无法识别进而出现识别错误的问题。同时早期的基于前后照帧数对比图像不同的识别方法主要是借助于视频流中前后帧的图像变化进行物体识别，精度低易受外界干扰，通用性差且不能识别特定的物体。

深度学习技术拥有高通用性、精度高、支持30度到150度间任意的镜头拍摄角度、支持10cm到100cm拍摄距离，同时还能提供可调节学习对象目标、对象尺寸、对象颜色等参数。因此将深度学习模块集成于机器视觉的技术中，此外学习模型设置完成后大幅方便了识别对象的更新与管理。

此外，非接触rfid技术产品用于识别物体的场景中，rfid读头识别的是rfid芯片中的数字编码，而不是具体的物体。在某些特定的场景下，被识别的数字编码会失效，从而产生了漏检。图像识别技术是一个有效的补充手段，通过比较rfid读头获取的数量与图像识别获取的数量的一致性，确保物流统计中无差错要求。

技术实现要素：

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种统计准确、自学习模式、嵌入式系统的基于视觉的统计数量方法。

本发明的目的可以通过以下技术方案来实现：

一种基于视觉的统计数量方法，用以在自助结算中清点标识检测区域内目标物体的数目，包括以下步骤：

1)关于目标物体进行深度神经元网络训练，构建神经网络目标检测模型；

2)通过rfid系统检测标识检测区域内的目标物体，并进行数目统计；

3)当rfid系统检测到目标物体的rfid信息后触发并获取标识检测区域内的目标物体的图像，并将图像输入训练好的神经网络目标检测模型中进行识别和统计数目；

4)结合rfid系统和神经网络目标检测模型的统计数目，最终获取标识检测区域内目标物体的数目：

若rfid系统的计数与神经网络目标检测模型的计数相同，则将该计数作为最终的计数；

若rfid系统的计数与神经网络目标检测模型的计数不同，则进行报警，请求进行人工计数。

所述的步骤1)具体包括以下步骤：

11)数据准备和标注：获取多幅包含目标物体的图像作为训练样本，通过数据预处理和数据增强变换保证充足的训练数据，并通过标注工具对训练样本中的目标物体进行标注；

12)数据训练：通过标注工具获取正确的目标物体的检测信息，将神经网络检测到目标物体的类别、位置和大小数据与正确的目标物体的类别、实际位置和实际大小之间的误差作为目标函数，经过迭代使得目标函数达到最小值时完成训练；

13)数据模型测试与评定：采用测试集进行迭代、累积和自学习，确保神经网络目标检测模型的准确率。

所述的步骤11)中，从通过网络抓取和现实拍摄的方式获取多幅包含目标物体的图像作为训练样本。

所述的步骤12)中，所述的目标函数为：

其中，xi、yi为神经网络检测到第i个目标物体的位置，为第i个正确目标物体的实际位置，wi、hi为神经网络检测到第i个目标物体的大小，为第i个正确目标物体的实际大小，ci、为第i个目标物体的类别和实际类别，α、β、λ分别为经验常数参数。

所述的步骤13)中，将20％未参与标注和训练的图像做为测试集。

所述的步骤1)还包括以下步骤：

14)当神经网络目标检测模型达到预期效果准确率时，将神经网络目标检测模型设置在移动gpu平台，用于区域目标的实时检测和统计，同时评估实时目标检测性能是否达到预期。

与现有技术相比，本发明具有以下优点：

一、统计准确：本发明采用神经网络图像识别辅助非接触式的rfid技术在自助结算中清点标识检测区域内目标物体的数目，满足统计无差错的要求。解决rfid应用局限性，比流行的自助结算方式，准确性和可信度大幅度提高。

二、自学习模式：采用样本累积与迭代方式，使算法具有自成熟能力，随着应用时间推移，准确度不断提高，在有限时间内，达到98％的正确识别率，并且随着经验数据累计，识别准确率趋于100％，本发明不同于固定元模式的车牌识别，更类似于人脸识别技术，具有更通用的推广价值。

三、嵌入式系统，即插即用：成本低，时效性高，是自助结算系统的最佳辅助。使基于rfid的数字物流信息，获得看得见的物体图像信息。为更多应用开创可能。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示，本发明的目的是提出一种“以rfid技术为主，结合图像识别算法提高统计准确率”的方法。利用rfid获得检测目标的信息，利用图像识别对特定的目标物体检测，具有高准确性、高鲁棒性、高实时性，从而为实现对于目标物体的准确检测，确保不多检测也不漏检。

相比传统神经网络，深度神经网络具有更多神经元，能够对大规模不同位置、形态的区域物体图像样本进行学习；同时在数据准备阶段，通过增强变换方法可以对同一图像进行翻转变换、色调变换、尺度变换、噪声扰动、颜色变换等操作，从而生成多种不同环境特性的训练图像，使得神经网络检测器对于不同场景，不同环境，不同形状的区域物体都能够进行性能稳定的检测，保证充足的样本数据量，避免过拟合出现。另外，神经网络的dropout机制能够在训练过程的前馈运算时随机剔除部分神经元，从而减少神经网络之间的相互依赖关系，让神经网络具备更强的泛化能力，避免过拟合。

本发明的构思是：首先在自助结算设备上建立rfid系统，在平面上设定标识检测区域，对这个设定区域实时图像获取。rfid检测到物体，同时触发图像捕获。图像检测算法基于预先送入样本的训练，并把训练结果导入视觉识别模块。当捕获图像输入算法模块，快速识别和统计检测物。鉴于自助结算的时效性，设定rfid信息获取时间与图像识别时间同步，小于2秒，也就是在2秒内系统从两个独立渠道获得统计数量的结果。应用可以依据结果做出后续结算动作，确保结算过程万无一失。

根据上述的发明构思，本发明算法模块采用下述技术方案：

基于神经网络的目标检测手段，其具体操作步骤如下：

(1)、数据准备和标定：从网络和现实拍摄等多种手段获取包含检测目标的图像。通过数据预处理和数据增强变换(dataaugmentation)等方式保证充足训练数据。通过标注工具对训练样本数据的目标物体进行标注，获得位置和尺度信息。

(2)、数据训练：通过标注工具获取正确目标检测信息，将神经网络检测到的物体的类别、位置、大小信息和训练数据目标物体类别、实际大小位置之间的误差作为目标函数。经过数万次训练迭代过程使得目标函数达到最小值时训练结束。具体目标函数如下：

其中x,y,w,h为检测框的位置和大小信息，c为检测的类别信息。通过目标函数将检测的大小、位置和类别信息综合在一起，α,β,λ为经验常数参数。

(3)数据模型测试与评定：将20％未参与标注和实验的数据集做为测试集，评定模型性能，确定神经网络目标检测模型的准确率，召回率，精确率和f1-score。

模型部署：当神经网络目标模型达到预期效果准确率，将模型部署在移动gpu平台，用于区域目标的实时检测和统计，同时评估实时目标检测性能是否达到预期。

本发明能够用于基于rfid技术的自助结算系统中。通常的应用情况是利用rfid非接触读取方式，获取通过结算区的物体信息。在多个物体同时通过时，一旦某个物体信息读取失败，表现就是统计遗漏。在实际应用中，不得不安排人员值守，发现数量不符合时，由人工纠正。虽然，此时人的工作量不大，但是距离自动化设计的无人结算初衷还是颇有缺陷。

本发明作为辅助手段，目的就是克服“自动设备需要人眼观察”的弊端，做到机器自动发现统计错误。通知操作“此次结算需要重新进行”，或者“需要人工核对”。基本实现无人值守的自助结算，零差错。

具体实践案例如图描述：

当rfid结算区激活(出现被测物)，通知视觉模块启动；

视觉模块捕获有效区域的图像，开始快速分析；

视觉模块输出：捕获的图，以及通过算法统计出的物体数量。

自助结算主机比对两种技术获得的数据，决定下一步操作，并保存该图。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：穆万里;何丹;施建刚;徐旭初
技术所有人：上海上大海润信息系统有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。