铭牌自动识别方法、装置、计算机设备和存储介质与流程

文档序号:20265877发布日期:2020-04-03 18:22阅读:484来源:国知局
铭牌自动识别方法、装置、计算机设备和存储介质与流程

本申请涉及铭牌识别技术领域,特别是涉及一种铭牌自动识别方法、装置、计算机设备和存储介质。



背景技术:

变电系统非常复杂,变电设备种类繁多,数量巨大,所以在检测和维修中,往往需要通过识别变电设备的铭牌来确定设备的型号和生产厂家,再进行针对性的维护。目前,变电企业大部分情况通过人工来识别设备的铭牌。然而,通过人工识别铭牌,一方面会提高人力成本。另一方面,在识别人疲劳的情况下,人工识别的准确度会显著下降。

而今随着智能检测识别的推广,智能检测识别技术也应用于文本的检测识别。但是,在通用物体的检测识别中,每个对象具有明确定义的闭合边界,而这种明确定义的闭合边界不存在于文本中,因为文本行或单词由许多单独的字符组成。基于文字检测和一般目标检测之间的巨大差异,采用一般的目标检测方法无法准确快速的检测和识别铭牌上的文字。



技术实现要素:

基于此,有必要针对铭牌的文本识别准确率不高的问题,提供一种铭牌自动识别方法、装置、计算机设备和存储介质。

一种铭牌自动识别方法,所述方法包括以下步骤:

获取待识别的铭牌图像;

对所述铭牌图像进行透视变换处理,得到矫正图像;

对所述矫正图像中的字符区域进行提取,获得文本图像;

基于卷积循环神经网络处理,对所述文本图像进行转换处理,得到字符信息。

在其中一个实施例中,所述对所述铭牌图像进行透视变换处理,得到矫正图像的步骤,包括:获取所述铭牌图像的四个角点坐标和透视变换矩阵,对所述铭牌图像进行调整,得到所述矫正图像。

在其中一个实施例中,所述对所述矫正图像中的字符区域进行提取,获得文本图像的步骤,包括:根据所述文本检测网络,获取文本提取框;根据所述文本提取框,对所述矫正图像中文字区域进行提取,得到所述文本图像。

在其中一个实施例中,所述采用卷积循环神经网络对所述字符区域进行识别,转化得到字符信息的步骤,包括:基于卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征;基于循环神经网络,对所述深层特征进行提取,得到对应的预测文字序列特征;基于长短期记忆网络,对所述预测文字序列特征进行转换处理,得到所述字符信息。

在其中一个实施例中,在所述获取待识别的铭牌图像的步骤后,还包括:

对所述铭牌图像进行几何变换,得到数据训练集。

在其中一个实施例中,所述几何变换包括旋转透视变换、翻转变换缩放变换、平移变换、尺度变换、对比度变换、噪声扰动、颜色变换及图像内容位置变换的一种或多种。

在其中一个实施例中,所述基于卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征的步骤,包括:

根据所述训练数据集,对所述卷积神经网络进行训练,得到训练后的卷积神经网络;根据所述训练后的卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征。

一种铭牌自动检测与识别装置,所述装置包括:

获取模块,用于获取待识别的铭牌图像;

透视矫正模块,用于对铭牌图像进行透视变换处理,得到矫正图像;

提取模块,用于对矫正图像中的字符区域进行提取,获得文本图像;以及

转换模块,用于基于卷积循环神经网络处理,对文本图像进行转换处理,得到字符信息。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述铭牌自动识别方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述铭牌自动识别方法的步骤。

上述铭牌自动识别方法、装置、存储介质和计算机设备,在预处理阶段对铭牌图像进行透视转正,获得矫正图像,提高后续文本识别的准确度。通过文本提取框提取出矫正图像内的文本图像,缩小后续的识别范围,提高检索效率。使用卷积网络和循环神经网络,有效识别文本中内在的上下文信息,在检测上收敛更快,提高文本检测的召回率和单词级检测框切割的准确率。

附图说明

图1为一实施例中的铭牌自动识别方法的流程示意图;

图2为一实施例中的铭牌自动识别装置的结构框图;

图3为另一实施例中的铭牌自动识别装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种铭牌自动识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤s202,获取待识别的铭牌图像。

其中,铭牌是指固定在产品上,向用户提供厂家商标识别、品牌区分及产品参数等信息的标牌,铭牌主要用来记载生产厂家及额定工作情况下的一些技术数据,以供正确使用而不致损坏设备。铭牌图像则是指包含前述信息的图片。

具体地,针对铭牌图像的获取对象进行采集,获得多帧铭牌图像的初始图像。例如采用终端为移动手持式的终端,移动手持式终端具有获取模块,如拍摄模组。用户手持终端,对准产品的铭牌进行拍摄,从而获取铭牌图像。

步骤s204,对所述铭牌图像进行透视变换处理,得到矫正图像。

透视变换,又称为投影映射、投射变换等,是三维空间上的非线性变换,即通过一个变换矩阵将原图投影到一个新的视平面,在视觉上的直观表现就是产生或消除了远近感。

基于获取的铭牌图像是基于用户手动获取。当采集图像时,图像采集模块的镜头未与铭牌平齐,例如基于现场环境因素,用户所处的位置相较于铭牌所在的位置更高或更低,使得用户在手持终端时,终端的图像采集模块的镜头无法与铭牌处于同一基准线,则获取的铭牌图像会出现倾斜或变形等情况。通过对获取的铭牌图像进行透视变换处理,将倾斜或变形的铭牌图像进行矫正处理,获得矫正图像。

步骤s206,对所述矫正图像中的字符区域进行提取,获得文本图像。

字符区域是指区别于矫正图像上的非字符区域,字符区域包含了铭牌上含有文字、数字、字母及符号的区域。

具体地,采用ctpn(connectionisttextproposalnetwork,场景文本检测网络)进行字符区域的识别。ctpn是一个允许输入任意尺寸的图片的全卷积网络,ctpn即所述文本检测网络。将矫正图像输入ctpn模型内,获得具有多个卷积层的卷积特征图谱。在本实施例中,基于vgg(visualgeometrygroup,视觉几何组)网络,例如,基于vgg16作为基础模型,将矫正图片输入至vgg网络中,获得具有多层卷积层的卷积特征图谱。选用设定尺寸的卷积核对卷积特征图谱进行密集滑动,相应地,每次滑动得到一个同样设定尺寸的文本提取框,每一文本提取框均具有相同的特征向量。在每个文本提取框里面预测n个固定宽度的以及在设定高度范围内的anchors(垂直锚),将上述得到的文本提取框组成序列输入双向lstm(longshort-termmemory,长短期记忆人工神经网络),输出得到密集预测的文本候选者,使用非极大值抑制过滤多余的边界框,得到所述文本图像。

步骤s208,基于crnn网络处理,对所述文本图像进行转换处理,得到字符信息。

crnn是一种end-to-end(端到端)的文字识别的网络。该网络是由三个主要部分组成,分别是卷积层、循环层及转录层。这三个部分的作用为,卷积层对图像进行卷积操作提取出图像的深层特征;循环层产生每一帧特征序列的预测值;转录层将循环层生成的帧预测序列转换为标签序列。

具体地,文本图像经过卷积神经网络的卷积层提取深层特征,利用循环神经网络的循环层对深层特征进一步提取文字序列特征,最后将提取文字序列特征转录为字符。

上述铭牌自动识别方法中,通过先将铭牌图像进行透视变换,矫正铭牌图像,使获得的原始的铭牌图像矫正成标准的矩形,提高后续的识别工作的准确度和效率。再将矫正图像中的字符区域通过ctpn进行提取,锁定文本所在的区域,排除噪音,获得文本图像。基于crnn网络处理,对所述文本图像进行转换处理,最终得到字符信息。上述方法可以自动快速且准确的获得铭牌的文字信息,降低识别出错率,提高识别结果的准确率和鲁棒性。

在其中一个实施例中,在所述获取待识别的铭牌图像的步骤s202后,还包括如下步骤s203:在所述获取待识别的铭牌图像的步骤后,还包括:对所述铭牌图像进行几何变换,得到数据训练集。

在其中一个实施例中,所述几何变换包括旋转透视变换、翻转变换缩放变换、平移变换、尺度变换、对比度变换、噪声扰动、颜色变换及图像内容位置变换的一种或多种。其中,旋转透视变换为随机旋转图像一定角度,改变图像内容的朝向。翻转变换为沿着水平或者垂直方向翻转图像。缩放变换为按照一定的比例放大或者缩小图像;平移变换为在图像平面上对图像以一定方式进行平移,可以采用随机或人为定义的方式指定平移范围和平移步长,沿水平或竖直方向进行平移,改变图像内容的位置。尺度变换为对图像按照指定的尺度因子,进行放大或缩小,或者参照sift特征提取思想,利用指定的尺度因子对图像滤波构造尺度空间,改变图像内容的大小或模糊程度。对比度变换为在图像的hsv颜色空间,改变饱和度s和v亮度分量,保持色调h不变,对每个像素的s和v分量进行指数运算,其中指数因子在0.25到4之间,增加光照变化。噪声扰动为对图像的每个像素rgb进行随机扰动,常用的噪声模式是椒盐噪声(即脉冲噪声)和高斯噪声。颜色变换为在训练集像素值的rgb颜色空间进行主成分分析,得到rgb空间的3个主方向向量和3个特征值,即p1、p2、p3、λ1、λ2和λ3,对每幅图像的每个像素进行加上相应的变化。通过对铭牌数据图像进行几何变换,达到数据增强的目的。通过上述一种和多种几何变换,得到多尺度的数据训练集,从而增加很多数据量,从而防止vgg模型过拟合。

在其中一个实施例中,对所述铭牌图像进行透视变换处理,即对铭牌数据图像进行图片转正,包括以下步骤:

铭牌数据的边框大多为规则矩形框,但由于镜头角度等原因,容易导致铭牌出现倾斜、边形等情况。为了进行后续的识别工作,本申请采取透视矫正的方法将铭牌矫正成标准矩形。

a.寻找最小水平外接矩形

获取标记的铭牌框角点,根据角点的坐标,分别计算出水平轴和纵轴的最大最小值,从而得到最小水平外接矩形。

b.计算透视变换矩阵

透视变换,又称为投影映射、投射变换等,是三维空间上的非线性变换,即通过一个变换矩阵将原图投影到一个新的视平面,在视觉上的直观表现就是产生或消除了远近感。确认原始铭牌框的四个角点以及计算出的最小水平外接矩阵的四个角点,利用opencv(现有的视觉库)已封装的透视变换函数进行转换。

在其中一个实施例中,对所述矫正图像中的字符区域进行提取,包括:采用水平文字检测模型connectionisttextproposalnetwork实现。connectionisttextproposalnetwork是一个允许输入任意尺寸的图片的全卷积网络。它通过卷积特征图中一系列稠密的小滑窗来检测文本行,并输出一系列小型固定的16像素宽文本框,本申请使用非常深的vgg16(visualgeometrygroup,视觉几何组)作为基础模型。使用小型的3*3空间窗口,滑动最后一个卷积层的特征图。总步长和感受野(receptivefield)分别固定为16和228像素。在卷积层中使用滑动窗口让它共享卷积计算。使用小型文本提取框检测器密集地查找特征图的每个空间位置。一个文本提取框被固定为宽度为16像素,并且所有的移动步长都为16像素。然后设计k个垂直的锚去预测每个提取框的竖直坐标。这k个锚的水平位置是一样的并固定为16像素的宽度,但是他们的垂直位置根据k个不同的高度而变化。每个候选框选用十个锚,也就是k=10,同时高度在11到273像素之间变化。显式垂直坐标由提取框的高度和y轴中心计算而来,本申请计算相对于锚的边界框位置的相对预测垂直坐标。根据输入的图片预先计算锚框的y轴的中心和锚框的高度。再根据预测出来的y轴坐标,其中每一个预测的文本提取框都有一个宽度16的边界框,得到输入图片的边界框。对于每次预测,水平位置和k个锚位置是通过映射特征图的空间窗口位置映射到输入图像固定的。检测器输出文本和非文本概率并预测k个锚的y轴坐标。其中,检测到的文本提取框是从文本或非文本概率>0.7的锚中生成的,使用了非极大抑制算法。

在其中一个实施例中,根据所述文本提取框,对所述矫正图像中文字区域进行提取,包括:采用循环连接文本提取框对所述矫正图像中文字区域进行提取。其具体包括:

a.将文本行分割成一系列小尺度的文本提取框并且单独预测每一个提取框。使用循环神经网络利用上下文信息对隐层进行编码,并采用一个rnn(recurrentneuralnetwork,循环神经网络)的衍生长短期记忆lstm(longshort-termmemory,长短期记忆人工神经网络)模型来连接包含每个窗口的卷积特征,并在隐藏层中反复更新其内部状态,实现尺度文本提取框的连续的网络连接。

b.滑窗在特征图上从左到右密集地移动,生成每一行的序列特征,循环内部状态由当前输入和编码的先前状态联合计算。循环计算是通过一个非线性函数来实现。

c.隐层的内部状态映射到接下来的fc层(全连接层),输出层用于计算第t个提取框的预测值。实现了端到端连接,无需额外的成本,大大减少错误检测,同时还可以恢复许多因包含非常弱的文本信息而错过的文本提取框。

在其中一个实施例中,对所述文本图像进行转换处理,包括:采用文字识别模型对所述文本图像进行转换处理。其具体包括:在定位出图像的位置后,用crnn对定位好的文字区域进行识别,将图像中的文字区域转化为字符信息。crnn网络可以分成三个组成部分:卷积层,循环网络层,转化层。使用卷积神经网络,提取输入图像的特征,将图像转化成相应大小的特征图。使用深层双向lstm网络,在卷积网络提取的特征基础上提取文字序列特征。转化层将循环网络层的输出做归一化,转化为字符。

所述基于卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征的步骤,包括:根据所述训练数据集,对所述卷积神经网络进行训练,得到训练后的卷积神经网络;根据所述训练后的卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征。

上述通过使用训练后的卷积神经网络,减小处理每次新的识别任务时的计算量,适应铭牌不同大小的文字,以及适应铭牌的特殊类型的文字,例如雕刻文字、手写文字等,提高处理效率。

在其中一个实施例中,步骤s204,所述对所述铭牌图像进行透视变换处理,得到矫正图像的步骤,包括:获取所述铭牌图像的四个角点坐标和透视变换矩阵,对所述铭牌图像进行调整,得到所述矫正图像。

其中,首先获取初始的铭牌图像的四个第一角点坐标,例如获取的待识别的铭牌图像为四边形,则获取该四边形的四个角的交点的坐标,即为四个第一角点坐标。相互比较每一第一角点坐标的x值和y值,选取最大的x值和y值以及最小的x值和y值,将所述最大的x值和y值以及最小的x值和y值两两组合,得到四个第二外框角点坐标。

根据四个所述第一外框角点坐标和四个所述第二外框角点坐标,得到透视变换矩阵。根据所述透视变换矩阵,利用opencv(现有的视觉库)已封装的透视变换函数进行转换将所述铭牌图像进行转换处理,得到所述矫正图像。所述矫正图像为矩形。

通过将初始的铭牌图像矫正为标准的程矩形的矫正图像,便于后续步骤的识别,提高识别的准确度和鲁棒性。

在其中一个实施例中,步骤s206,所述对所述矫正图像中的字符区域提取,获得文本图像的步骤,包括:根据所述文本检测网络,获取文本提取框;根据所述文本提取框,对所述矫正图像中文字区域进行提取,得到所述文本图像。

具体地,采用ctpn(connectionisttextproposalnetwork,场景文本检测网络)进行字符区域的识别。ctpn是一个允许输入任意尺寸的图片的全卷积网络,ctpn即所述文本检测网络。将矫正图像输入ctpn模型内,获得具有多个卷积层的卷积特征图谱。在本实施例中,基于vgg(visualgeometrygroup,视觉几何组)网络,例如,基于vgg16作为基础模型,将矫正图片输入至vgg16模型中,获得具有5层卷积层的卷积特征图谱。选用3*3的卷积核对卷积特征图谱进行密集滑动,3*3是指空间排列的尺寸。相应地,每次滑动得到一个同样设定尺寸的文本提取框,每一文本提取框均具有相同的特征向量,每一特征向量的3*3*c,c是特征图的数量或通道数。在每个文本提取框里面预测n个固定宽度为16像素的以及在设定高度范围内的anchors(垂直锚),设定高度范围为11像素~273像素。文本提取框密集地查找卷积特征图谱的每个空间位置,每一文本候选款固定宽度为16像素,滑动的每一步长亦为16像素。每一文本候选款选用十个anchors,十个anchors的高度分别在设定的高度范围内变化。通过文本提取框水平滑动,获取矫正后的铭牌图像内的文本区域的宽度。再通过anchors的预测高度来获取文本区域的高度,从而获得具有一定宽度和高度的文本候选者。将上述得到的文本提取框组成序列输入双向lstm(longshort-termmemory,长短期记忆人工神经网络)模型,输出得到密集预测的文本候选者,使用非极大值抑制过滤多余的边界框,得到所述文本图像。

在其中一个实施例中,步骤s208,所述采用crnn网络对所述字符区域进行识别,转化得到字符信息的步骤,包括:基于卷积神经网络,对所述字符区域进行卷积操作,提取所述字符区域的深层特征。基于循环神经网络,对所述深层特征进行提取,得到对应的预测文字序列特征。基于长短期记忆网络,对所述预测文字序列特征进行转换处理,得到所述字符信息。使用crnn网络,有效联系文本中内在的上下文信息,引入iou损失函数,在检测问题上收敛更快,提高文本检测的召回率和单词级检测框切割的准确率。

在其中一个实施例中,在步骤s206后,铭牌自动识别方法还包括循环连接文本提取框的步骤s207。循环连接文本提取框的步骤包括:

将步骤s206获得的文本图像分割成一系列小尺度的文本提取框,并且单独预测每一个提取框。使用循环神经网络利用上下文信息对隐层进行编码,并采用循环神经网络的衍生长短期记忆lstm模型来连接包含每个卷积核的卷积特征,并在隐层中反复更新其内部状态,实现一系列文本提取框的连续的网络连接。

卷积核在步骤s206的卷积特征图谱上从左到右密集地移动,生成每一行的序列特征,循环内部状态由当前输入和编码的先前状态联合计算。循环计算是通过一个非线性函数来实现。

隐层的内部状态映射到接下来的全连接层,输出层用于计算第t个文本提取框的预测值。

通过本循环连接文本提取框的步骤,实现了端到端连接,无需额外的成本,大大减少错误检测,同时还可以恢复许多因包含非常弱的文本信息而错过的文本提取框。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在其中一个实施例中,一种铭牌自动检测与识别装置,其采用任一实施例所述铭牌自动识别方法实现。在其中一个实施例中,所述铭牌自动检测与识别装置具有用于实现所述铭牌自动识别方法相关步骤的功能模块。在其中一个实施例中,一种铭牌自动检测与识别装置,其装置包括:获取模块,用于获取待识别的铭牌图像;透视矫正模块,用于对所述铭牌图像进行透视变换处理,得到矫正图像;提取模块,用于对所述矫正图像中的字符区域进行提取,获得文本图像;以及转换模块,用于基于卷积循环神经网络处理,对所述文本图像进行转换处理,得到字符信息。其余实施例以此类推。

在一个实施例中,如图2所示,提供了一种铭牌自动检测与识别装置,包括:获取模块302、透视矫正模块304、提取模块306和转换模块308,其中:获取模块302用于获取待识别的铭牌图像。透视矫正模块304用于透视转正所述铭牌图像,获得矫正的水平图像。提取模块306用于将所述水平图像输入文本检测网络进行文字检测,定位获得字符区域。转换模块308用于采用卷积循环神经网络对所述字符区域进行识别,转化得到字符信息。

在其中一个实施例中,如图3所示,铭牌自动检测与识别装置还包括数据增强模块303,数据增强模块303用于对铭牌图像进行几何变换,增加数据训练集。在其中一个实施例中,铭牌自动检测与识别装置还包括循环连接文本模块307。通过循环连接文本模块,进一步对提取模块的结果进行循环复核,减少错误检测,同时还可以恢复许多因包含非常弱的文本信息而错过的文本提取框。

上述铭牌自动识别装置,通过先将铭牌图像进行透视变换,矫正铭牌图像,使获得的原始的铭牌图像矫正成标准的矩形,提高后续的识别工作的准确度和效率。再将矫正图像中的字符区域通过ctpn进行提取,锁定文本所在的区域,排除噪音,获得文本图像。基于crnn网络处理,对所述文本图像进行转换处理,最终得到字符信息。上述方法可以自动快速且准确的获得铭牌的文字信息,降低识别出错率,提高识别结果的准确率和鲁棒性。

关于铭牌自动检测与识别装置的具体限定可以参见上文中对于铭牌自动检测与识别方法的限定,在此不再赘述。上述铭牌自动检测与识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储铭牌自动识别方法的各步骤的对应数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种铭牌自动识别方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种铭牌自动识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

获取待识别的铭牌图像;对所述铭牌图像进行透视变换处理,得到矫正图像;对所述矫正图像中的字符区域进行提取,获得文本图像;基于卷积循环神经网络处理,对所述文本图像进行转换处理,得到字符信息。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

在获取待识别的铭牌图像的步骤后,还包括对所述铭牌图像进行几何变换,得到数据训练集的步骤。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

在对所述矫正图像中的字符区域进行提取,获得文本图像的步骤后,还包括循环连接文本提取框的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取待识别的铭牌图像;对所述铭牌图像进行透视变换处理,得到矫正图像;对所述矫正图像中的字符区域进行提取,获得文本图像;基于卷积循环神经网络处理,对所述文本图像进行转换处理,得到字符信息。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

在获取待识别的铭牌图像的步骤后,还包括对所述铭牌图像进行几何变换,得到数据训练集的步骤。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

在对所述矫正图像中的字符区域进行提取,获得文本图像的步骤后,还包括循环连接文本提取框的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1