基于OCR识别的低功耗仪表远程自助抄表终端及方法与流程

文档序号:12721321阅读:578来源:国知局
基于OCR识别的低功耗仪表远程自助抄表终端及方法与流程

本发明涉及OCR人工神经网络字符识别技术领域,尤其涉及一种基于OCR识别的低功耗仪表远程自助抄表终端及方法。



背景技术:

光学字符识别(Optical Character Recognition,简称OCR),是通过图像处理和模式识别技术对光学的字符进行识别,是人工智能识别技术研究和应用领域中的一个重要方向。此抄表终端的识别模块主要采用人工神经网络进行识别。

人工神经网络(Artificial Neural Network,简称ANN)是一门主流的交叉学科。它是受生物神经网络系统的结构和信息处理方式的启发而发展起来的,在于探索人脑加工、存储和搜索信息的机制,弄清人脑功能的机理,以建立人类认知过程的理论。生物学家、医学家和脑科学家试图通过对神经网络的研究,推动脑科学向定量、精确和理论的系统化发展,也希望研究成果能用于临床医学,在神经医疗方面取得突破。信息处理与计算机科学研究基于这个目的,寻求一种新途径,逐渐替代人工参与并且实现真正的信息智能化。图像识别技术在航天、医药、军事、工农业等方面发挥着重要的作用。但是,传统的图像识别方法多采用人工对图像特征进行提取,这个过程存在大量的复杂与困难,而且往往耗费大量的人力。多层神经网络作为如今人工智能时代最流行的技术,由于得到各种理论的融合丰富了其发展,特别是在智能图像识别领域中具有非常高的灵活性与识别精确率。多层神经网络学习作为非监督学习的一种方式,也很好的缓解了传统的特征提取的问题,而且能够在无人参与的情况下能够自主学习,这给图像识别带来巨大的优势。基于机器视觉与多层神经网络相结合的图像识别系统,将机器视觉采集到的图像进行图像的预处理与合适的特征提取,进而让图像识别系统能够适应各种不同环境下的识别,提高适应性和准确率。基于人工神经网络的OCR字符识别技术就是这样的一项技术,它的本质上是利用高精度光学图像采集设备去捕获图像并智能地判断并识别文字字符。

低功耗仪表远程自助抄表终端,采用高精度低功耗的集成电路,对仪表进行快速准确的图像采集,结合网络远程无线传输模块,将采集到的数字图像通过无线模组传输并存储到远程终端服务器,从而能够轻松获地取仪表的实际情况信息。利用这种高效的图像采集与网络远程无线传输设备,不仅保证了图像采集的快速性与稳定性,而且在适应各种不同环境的情况下,采用无人工参与识别的智能识别模块,能够大大减少了人工的参与和工作量,从而实现高效与低功耗的有效结合。



技术实现要素:

为了克服现有技术存在的缺点与不足,本发明提供一种基于OCR识别的低功耗仪表远程自助抄表终端及方法,不仅能够实现仪表数据的远程采集,而且能够对仪表数据进行智能识别,同时实现以低功耗为主,提高系统执行的能源利用与减少待机的功耗,大幅度提高电池供电能力,具有低功耗、智能识别、数据远程传送以及识别率高等优点。

本发明目的是提供一种基于OCR识别的低功耗仪表远程自助抄表终端,包括光学图像采集模块、OCR智能识别模块、集成电路电源管理模块、通信模块以及数据管理服务器,其中

所述光学图像采集模块用于采集所测仪表的光学图像信息,并发送至所述OCR智能识别模块;

所述OCR智能识别模块用于将光学图像采集模块采集的光学图像信息进行图像的预处理以及特征提取,并将处理结果信息发送至所述数据管理服务器;

所述集成电路电源管理模块用于对远程自助抄表终端进行低功耗的电源管理;

所述通信模块用于所述OCR智能识别模块与数据管理服务器之间的通信连接;

所述数据管理服务器用于存储和备份OCR智能识别模块发送的识别信息,并识别出所测仪表的显示结果。

进一步地,所述光学图像采集模块包括若干图像采集设备,所述图像采集设备分布设置于被采集仪表的不同区域,用于采集所测仪表的光学图像信息;所述图像采集设备为CMOS光学图像传感器。

进一步地,所述集成电路电源管理模块包括低功耗智能处理芯片,所述低功耗智能处理芯片用于进行睡眠管理、时钟唤醒和电源管理;所述低功耗智能处理芯片采用Ambiq Micro AM1800超低功耗实时时钟芯片。

进一步地,所述通信模块包括2G/3G/4G通信单元、WIFI通信单元、以太网接口单元以及蓝牙通信单元。

进一步地,所述数据管理服务器包括若干OCR字符识别模块;所述OCR字符识别模块用于识别字符图像的字符特征,并识别出所测仪表的显示结果。

本发明另一目的是提供一种基于OCR识别的低功耗仪表远程自助抄表方法,包括下述步骤:

S1、光学图像采集模块采集所测仪表的光学图像信息,并发送至OCR智能识别模块;

S2、根据光学图像信息,OCR智能识别模块进行字符图像的预处理;

S3、根据预处理后的字符图像,OCR智能识别模块进行字符特征的提取,并将字符特征发送至数据管理服务器;

S4、数据管理服务器的OCR字符识别模块对字符特征进行识别,得到所测仪表的显示结果,并对字符特征存储和备份。

进一步地,所述步骤S1中的光学图像信息为模拟信息,光学图像采集模块将模拟信息转换为数字信息后发送至OCR智能识别模块。

进一步地,所述步骤S2中,OCR智能识别模块采用数字图像处理技术进行字符图像的预处理,具体为:对字符图像进行去噪、图像增强和轮廓提取;其中

1)图像去躁为:去除所测仪表表盘上的干扰因素,干扰因素包括水雾和灰尘;由干扰因素形成的躁声为正态噪声,使用高斯噪声来模拟,高斯随机变量Z由下式给出:

其中,z表示灰度值,μ表示z的平均值或期望值,α表示z的标准差;当z服从上述分布时,其值有95%落在[(μ-2σ),(μ+2σ)]范围内。

使用中值滤波器去除高斯噪声,基本原理是把数字图像或数字序列中一点的值用该点邻域内各点的中值代换;设f(x,y)表示数字图像像素点(x,y)的灰度值,滤波窗口为A的中值滤波器可以定义为:

当n为奇数时,n个数x1、x2、…、xn的中值就是按数值大小顺序处于中间的数;当n为偶数时,定义两个中间数平均值为中值;

2)图像增强为:把表盘中的数字部分突显出来;图像增强采用高反差保留算法,目的是将图像中颜色、明暗反差较大两部分的交界处保留下来,图像增强的表达形式为:dst=r*(img-Blur(img));

3)轮廓提取为:把表盘中的数字轮廓提取出来,采用的卷积算子方法,表达如下:

其x向、y向的一阶偏导数矩阵,梯度幅值以及梯度方向的数学表达式为:

P[i,j]=(f[i,j+1]-f[i,j]+f[i+1,j+1]-f[i+1,j])/2

Q[i,j]=(f[i,j]-f[i+1,j]+f[i,j+1]-f[+1,j+1])/2

θ[i,j]=arctan(Q[i,j]/p[i,j])

求出这几个矩阵后,就进行数字轮廓的提取。

进一步地,所述步骤S3中,OCR智能识别模块采用HOG特征提取算法进行字符特征的提取,具体为:

1)灰度化将字符图像进行灰度化,并归一化字符尺寸;

2)采用高斯模糊和OTSU最大类间隔阈值化算法,用于降低字符图像局部的阴影和光照变化所造成的影响,并抑制噪音的干扰;

3)计算字符图像每个像素的梯度,包括大小和方向,用于捕获字符图像的轮廓信息,同时进一步弱化光照的干扰;

4)将字符图像划分成小Window尺寸、Block尺寸、Block步长以及cell尺寸;

5)统计每个cell的梯度直方图,即可形成每个cell的算子descriptor;

6)将若干cell组成一个block,一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征算子。

7)将字符图像内的所有block的HOG特征算子串联起来,得到字符图像的HOG特征算子,所述HOG特征算子作为字符图像的字符特征。

进一步地,所述步骤S4,具体为:

S41、数据管理服务器预先已采集、记录并存储了大量字符特征的数据,集成数据样本库;

S42、OCR字符识别模块采用人工神经网络BP算法对字符特征进行训练与识别,具体为:将字符特征作为输入层的n个向量,已知数据样本库的字符结果作为输出层,通过反复迭代计算出隐层参数保存起来,隐层的参数用来做字符识别,通过将采集所测仪表表盘图片经过预处理和提取特征后作为输入层输入,隐层采用训练的结果,获得输出层,即识别结果字符。

采用上述技术方案后,本发明至少具有如下有益效果:

(1)、本发明不仅仅只具有一个仪表集抄功能,更是结合了OCR字符识别模块,能够实时地对仪表数据进行识别处理,摆脱了单纯人工识别的过程;

(2)、本发明采用低功耗智能处理芯片进行睡眠管理、时钟唤醒和电源管理,不仅降低了自助抄表终端在无谓等待时间的无效功耗,又降低了自助抄表终端在有效运行时的有效功耗;

(3)、本发明系统的低功耗智能处理芯片选择超低功耗实时时钟芯片,集成了电源管理系统;带有电源管理的实时时钟RTC可对系统设备进行电源管理,使得系统的整体供电电流降到更低;集成硬件电路平台结合功耗管理系统,给整体硬件能耗带来极大的降低,也给供电电池续航能力带来非常巨大的提升;

(4)、本发明方法非常适用于工业生产,特别是无人生产环境,也适用于普通居民用户如电表和水表等,这给生产和日常生活带来极大的便利。

附图说明

图1为本发明基于OCR识别的低功耗仪表远程自助抄表终端的结构示意图;

图2为本发明基于OCR识别的低功耗仪表远程自助抄表方法的步骤流程图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。

如图1所示,本发明基于OCR识别的低功耗仪表远程自助抄表终端,包括光学图像采集模块、OCR智能识别模块、集成电路电源管理模块、通信模块以及数据管理服务器;所述光学图像采集模块包括若干图像采集设备,所述集成电路电源管理模块包括低功耗智能处理芯片,所述通信模块包括2G/3G/4G通信单元、WIFI通信单元、以太网接口单元以及蓝牙通信单元,数据管理服务器包括若干OCR字符识别模块。

作为系统的核心,低功耗智能处理芯片的选择与功耗的衡量对一个系统性能的优劣有着重大影响。本采集终端的低功耗智能处理芯片采用的是Ambiq Micro公司的Apollo MCU产品系列中的Apollo AM1800超低功耗实时时钟芯片。AmbiqMicro是一家专注于研发生产低功耗芯片产品的美国公司。它采用先进的SPOT技术(亚阈值功率优化技术),使芯片功耗做得更低。Ambiq Micro拥有世界最低功耗的RTC和最低功耗的MCU产品。Apollo AM1800超低功耗实时时钟芯片,具有世界上最低功耗的实时时钟,集成了电源管理,电源需求比其它任何行业的RTC低7倍以上(低至14nA)。这是首次基于创新的SPOTTM(亚阈值功率优化技术)CMOS平台的半导体,体积仅3*3mm,最佳计时精度可达+/-2ppm,并集成电源管理、复位、内部RAM。它的MCU采用Cortex-M系列内核,运行功耗仅30μA/MHz,睡眠功耗100nA,最小体积2.4*2.77mm。应用场合:可穿戴设备、无线传感器、便携设备、SensorHub、活动和健康检测、仪器仪表、安防、RFID等低功耗小体积的场合。Ambiq Micro的AM1800系列实时时钟芯片采用创新的计时功能,通过时钟和系统电源管理相结合,满足超低的功率需求,为RTC设备建立了新的标准。AM1800系列将几个芯片的功能集成到一个单一的、低成本的解决方案。该芯片具有超低功率高精度晶振模式下的功耗–55nA(精度+/-2ppm),具有自动校准下非常低功率的精确计时功耗–22nA(精度+/-10ppm),还有有极低功率RC振荡器的功耗–14nA。除正常的日历闹钟,所有元件都包括一个可配置的递减定时器、看门狗定时器,1/100秒计数器和一个非常灵活的输出时钟发生器。此外还拥有灵活的I2C和SPI系统接口,能为功能相同的元件提供了I2C(高达400KHz)或SPI(最高可达2MHz)串行接口。

通信模块采用移远通信最近推出的EC20模块。EC20模块采用LTE 3GPP Rel.9技术,支持最大下行速率100Mbps和最大上行速率50Mbps,同时在封装上兼容移远通信UMTS/HSPA+UC20模块,实现了从3G网络向4G网络轻松平滑过渡。EC20系列模块包含EC20-A,EC20-C和EC20-E三个版本,使其能够向后兼容现存的EDGE和GSM/GPRS网络,以确保在缺乏3G和4G网络的偏远地区也能正常工作。EC20支持多输入多输出技术(MIMO),即在发射端和接收端分别使用多个发射天线和接收天线,使信号通过发射端与接收端的多个天线传送和接收,从而降低误码率,改善通信质量。同时,它结合了高速无线连接与内置多星座高精度定位GPS+GLONASS接收器。EC20内置丰富的网络协议,集成多个工业标准接口,多种操作系统和软件功能(Windows XP/Windows Vista/Windows7/Windows8/8.1/Linux/Android),极大地拓展了EC20在M2M领域的应用范围,如CPE,路由器,数据卡,平板电脑,车载,安全以及工业级PDA。EC20特性:支持LTE,UMTS/HSPA+和GSM/GPRS/EDGE网络制式,极小体积的SMT封装形式满足小型终端产品对空间的要求,MIMO技术满足无线通信系统对数据速率和链接的可靠性要求,GNSS接收器实现在任何环境下快速准确定位,而且能够从3G向4G网络轻松平滑过渡。

图像采集设备采用美国OmniVision的OV2655高性能与1/5-inch光学格式的200万像素的CMOS的CameraChipTM传感器。该OV2655是基于OmniVision的1.75微米OmniPixel3-HS型TM架构,采用超低烟囱高度(ULSH)像素达到行业领先的低光灵敏度的1030毫伏/勒克斯秒,这对于高帧速率视频应用也实现。该OV2655小型化也使得它适合在一个6.5×6.5mm相机模块。OV2655工作在高达每秒15帧(fps)的全分辨率和30帧的SVGA模式。捕获的数据可以被转移或者通过一个标准的并行数字视频端口(货银两讫)或由单一的通道MIPI的高速串行接口。该货银两讫也可用于从外部输入次要的摄像头,使将要通过的MIPI接口与输出中学相机继续采用OV2655先进的ISP。尽管它的小外形,OV2655具有先进的图像信号处理器与高性能的嵌入式相机所需的全部功能。具有超低功耗和低成本的自动影像控制功能:自动曝光控制(AEC)的,自动白平衡(AWB),自动带式过滤器(早餐),50/60赫兹亮度自动检测,自动黑电平校正(ABLC)。对于帧率,共同体/自动增益控制可编程控制。图像质量控制:色彩饱和度,色调,伽马,清晰度(边缘增强),镜头校正,缺陷像素消除和噪声取消,支持LED和闪光灯频闪模式,以及高动态范围(HDR)模式的SVGA(800x600)或更低的分辨率提供了一个动态范围~85分贝。

如图2所示,本发明基于OCR识别的低功耗仪表远程自助抄表方法的步骤流程图,具体为:

其中,OCR智能识别模块主要根据从不同区域的光学图像采集模块包括的各个图像采集设备所采集到信息量巨大的数字图像数据集合,通过在服务器上搭建OCR字符识别模块,来对这些大数据进行智能分析、加工处理与识别。OCR智能字符识别模块,主要指利用多层人工神经网络框架,将光学图像系统采集到的图像进行图像的预处理与合适的特征提取,进而让图像识别系统能够适应各种不同环境下的识别,提高适应性和准确率。OCR智能字符识别模块,图像预处理模块与字符智能识别模块组成。由于从图像采集模块采集到的图像,往往存在大量的噪声等不稳定信息与冗余信息,而且图像采集设备对于光照影响非常敏感,因此必须采用有效的数字图像处理手段,减少光照对图像的干扰,才能更好地实现稳定可靠的预处理过程和分析与识别过程。因此,图像预处理是整个识别过程中最为重要的步骤。图像预处理步骤采用数字图像处理技术,包括对数字图像进行去噪、图像增强、滤波平滑和轮廓提取等过程。对于OCR字符的预处理,关键在于字符区域的定位、字符分割的过程。这个过程涉及到数字图像处理中常用的手段,如二阶微分算子边缘提取、灰度图像大津阈值化以及轮廓提取等。除此外,字符区域矫正是一个关键处理过程,采集到的图像由于镜头的本身的畸变还有图像往往并非是正对中的,存在着图像的形变,这意味着需要对字符区域进行定位后进行有效的矫正。矫正过程,通过对字符区域的定位后,根据其最小面积矩形框的与参考线的旋转角度来计算旋转矩阵并对原图像进行仿射变换进行矫正。字符的分割采用灰度大津阈值化Otsu和字符轮廓提取等方法进行分割,通过筛选获得每个字符的矩形区域,并做相应的去噪声和图像的二值化处理等预处理操作。

OCR字符识别过程。这个过程成为分析与决策过程。这个过程主要采用人工神经网络(Artificial Neural Network,ANN)简称神经网络(Neural Network),是基于生物学中神经网络的基本原理,在理解和抽象了人脑结构和外界刺激响应机制后,以网络拓扑知识为理论基础,模拟人脑的神经系统对复杂信息的处理机制的一种数学模型。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激活函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(weight),神经网络就是通过这种方式来模拟人类的记忆。网络的输出则取决于网络的结构、网络的连接方式、权重和激活函数。而网络自身通常都是对自然界某种算法或者函数的逼近。神经网络的学习规则:神经网络的学习规则是修正权值的一种算法,分为联想式和非联想式学习,有监督学习和无监督学习等。神经网络误差修正型规则:是一种有监督的学习方法,根据实际输出和期望输出的误差进行网络连接权值的修正,最终网络误差小于目标函数达到预期结果。误差修正法,权值的调整与网络的输出误差有关,它包括δ学习规则、Widrow-Hoff学习规则、多层感知器(Multi-layer perceptron neural networks,简称MLP)学习规则和误差反向传播的BP(Back Propagation)学习规则等。其中,最主要利用BP反向传播算法。BP算法的网络结构是一个前向多层网络。其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经隐层逐层处理后,传向输出层。若输出层的实际输出与期望输出不符,则转向误差的反向传播阶段。误差的反向传播是将输出误差以某种形式通过隐含层向输入层逐层反向传播,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行。权值不断调整过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可以接受的程度,或进行到预先设定的学习次数为止。

字符提取的特征采用HOG特征。HOG(Histogram of Oriented Gradient)是2005年CVPR会议上,法国国家计算机科学及自动控制研究所的Dalal等人提出的一种解决人体目标检测的图像描述子,该方法使用梯度方向直方图(Histogram of Oriented Gradients,简称HOG)特征来表达物体,提取物体的外形信息,形成丰富的特征集。实践证明,该特征比较符合字符特征的提取。

整个OCR识别过程需要建立大型的数据库,以及搭建大型的多层神经网络模型模块。数据库由采集并存储到服务器上的数字图像通过上述的定位分割处理后的字符图片进行分类后构成的大型数据样本库。我们可以通过对这个大型的数据库进行采样抽取,传递给人工神经网络BP算法模块进行训练与预测,将训练后得到的多层人工神经网络模型集成到抄表终端的智能芯片中,就能够对仪表中的字符进行一一识别并将结果显示并反馈出来,从而实现仪表OCR字符实时识别功能。此外,还有另外一个方案,就是在服务器上搭建如今主流的深度学习平台,采用主流的深度学习框架Caffe、Tensor Flow等来对远程终端采集到的字符图像进行训练学习与识别,并把识别结果保存到服务器上。这样,用户就能非常方便的获取和查看仪表数据信息和能够分析仪表的具体情况。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1