铭牌文字识别方法、装置、计算机设备和存储介质与流程

文档序号:17465824发布日期:2019-04-20 05:30阅读:422来源:国知局
铭牌文字识别方法、装置、计算机设备和存储介质与流程

本申请涉及文字识别技术领域,特别是涉及一种铭牌文字识别方法、装置、计算机设备和存储介质。



背景技术:

铭牌又称标牌,铭牌主要用来记载生产厂家及额定工作情况下的一些技术数据,以供正确使用而不致损坏设备。

管理人员在对电网设备进行管理时,往往需要根据设备上的铭牌信息来获得设备更加详细的数据信息,从而更好地了解电网设备的运行状态。由于电网设备数量庞大,因此出现了可以用于识别铭牌信息的设备,节省了管理人员的工作量。

然而,现有的铭牌识别方法是基于单一设备类型来进行识别的,往往只能针对特定铭牌中的固定识别区域进行文字识别。但在实际应用中,不同铭牌类型、不同铭牌格式、不同铭牌材质等的铭牌,其铭牌外表面的文字位置不同,进而导致无法在固定识别区域中识别出文字,影响到铭牌文字识别的准确度。

因此,现有的铭牌识别方法存在识别准确度不高的问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高铭牌识别效果的铭牌文字识别方法、装置、计算机设备和存储介质。

一种铭牌文字识别方法,所述方法包括:

获取铭牌图像;

获取所述铭牌图像的特征点;

根据所述特征点,确定文字候选框;

拼接所述文字候选框,得到文字识别框;

识别所述文字识别框,得到铭牌文字。

在其中一个实施例中,所述获取所述铭牌图像的特征点,包括:

提取所述铭牌图像中的图像特征;

获取所述图像特征中的所述特征点。

在其中一个实施例中,包括:

生成所述特征点的标准候选框,以及,获取所述特征点的特征点位置和获取所述特征点的特征值;

根据所述特征点位置和所述特征值,对所述标准候选框进行卷积运算,生成所述标准候选框的文字置信概率;

当所述文字置信概率大于预设的概率阈值,确定所述标准候选框为文字候选框。

在其中一个实施例中,所述拼接所述文字候选框,得到文字识别框,包括:

获取所述文字候选框的位置坐标;所述位置坐标为所述文字候选框的中心点在所述铭牌图像中的坐标;

根据所述位置坐标对所述文字候选框进行拼接,得到所述文字识别框。

在其中一个实施例中,所述获取铭牌图像之前,还包括:

获取初始图像,所述初始图像包括铭牌区域;

获取所述铭牌区域的边界坐标;所述边界坐标为所述铭牌区域的边缘在所述初始图像中的坐标;

根据所述边界坐标剪切所述初始图像,生成所述铭牌图像。

在其中一个实施例中,所述识别所述文字识别框,得到铭牌文字之后,还包括:

根据所述铭牌文字,查询所述铭牌文字对应的设备信息;

展示所述设备信息。

在其中一个实施例中,所述识别所述文字识别框,得到铭牌文字,包括:

识别所述文字识别框,得到初始文字;

获取针对所述初始文字的候选文字;

获取所述候选文字与所述铭牌文字的匹配程度;

根据所述匹配程度,确定所述候选文字为所述铭牌文字。

一种铭牌文字识别装置,所述装置包括:

铭牌图像获取模块,用于获取铭牌图像;

特征获取模块,用于获取所述铭牌图像的特征点;

候选框识别模块,用于根据所述特征点,确定文字候选框;

拼接模块,用于拼接所述文字候选框,得到所述文字识别框;

文字识别模块,用于识别所述文字识别框,得到铭牌文字。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取铭牌图像;

获取所述铭牌图像的特征点;

根据所述特征点,确定文字候选框;

拼接所述文字候选框,得到所述文字识别框;

识别所述文字识别框,得到铭牌文字。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取铭牌图像;

获取所述铭牌图像的特征点;

根据所述特征点,确定文字候选框;

拼接所述文字候选框,得到所述文字识别框;

识别所述文字识别框,得到铭牌文字。

上述铭牌文字识别方法、装置、计算机设备和存储介质,通过识别出铭牌的文字候选框,并对文字候选框进行的文字识别,准确地得到铭牌文字信息;从而可以适应不同铭牌类型、不同铭牌格式、不同铭牌材质等需求,避免了只能对特定铭牌中的固定识别区域进行文字识别的问题,进而解决了现有的铭牌识别方法存在识别准确度不高的问题。

附图说明

图1为一个实施例中一种铭牌文字识别方法的流程示意图;

图2为一个实施例中一种铭牌文字识别方法装置的结构框图;

图3为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种铭牌文字识别方法,包括以下步骤:

步骤110,获取铭牌图像。

其中,铭牌可以是指用来记载生产厂家及额定工作情况下的一些技术数据的标牌。

具体实现中,用户将具有铭牌图像的巡检图片输入至铭牌识别服务器。铭牌识别服务器在读取到巡检图片之后,对巡检图片进行降噪、矫正等预处理得到预处理巡检图片。进一步地,铭牌识别服务器通过定位识别,确定铭牌图像在预处理巡检图片的位置;并根据铭牌图像的位置,对预处理巡检图片进行裁剪,获取得到铭牌图像。

步骤120,获取铭牌图像的特征点。

其中,特征点可以是指铭牌图像经过特征提取得到文字特征中的特征点。实际应用中,文字特征可以为矩阵,特征点为该矩阵中的元素。

具体实现中,当铭牌识别服务器获取到铭牌图像之后,铭牌识别服务器将铭牌图像进行比例缩放,使铭牌图像的分辨率与预设分辨率相同。更具体地,预设分辨率可以是1000×1500。然后,铭牌识别服务器将铭牌图像转化为rgb三通道格式,并输入神经网络中,经过五个不同的卷积池化模块进行处理,得到铭牌图像的文字特征,并从铭牌图像的文字特征中提取特征点。更具体地,铭牌图像的文字特征可以是经过非线性运算后的浮点矩阵。

步骤130,根据特征点,确定文字候选框。

其中,文字候选框可以是指铭牌图像中可能具有文字信息的区域方框。

具体实现中,当铭牌识别服务器将铭牌图像转化为rgb三通道格式,并输入神经网络中,经过五个不同的卷积池化模块进行处理,得到铭牌特征之后;从铭牌特征的文字特征中提取特征点。对生成多个尺度标准的识别候选框。然后,将识别候选框引入一个双向长短时记忆循环神经网络模型。具体地,双向长短时记忆循环神经网络层由两个标准的一层lstm模块组成,lstm模块包括遗忘门、输入门和输出门,其中隐层神经元的维度是512×128,输入维度为512、输出维度为512。其中一个lstm模块用于预测识别候选框的坐标中心点和识别候选框的长宽偏差修正值,另一个lstm模块用于根据特征点的分布规律预测该候选框的文字置信度即该候选框具有铭牌文字信息的概率。然后,铭牌特征经过双向长短时记忆循环神经网络层处理,得到识别候选框的坐标信息、校正信息和文字置信度等。最后,根据文字置信度,对所有识别候选框进行过滤,得到具有铭牌文字信息的文字候选框。

步骤140,拼接文字候选框,得到文字识别框。

具体实现中,铭牌特征经过双向长短时记忆循环神经网络层处理时,得到文字候选框的坐标信息,根据坐标信息对文字候选框进行拼接,得到文字识别框。

步骤150,识别文字识别框,得到铭牌文字。

其中,铭牌文字可以是指雕刻在铭牌外表面上的文字。

具体实现中,当铭牌识别服务器得到文字识别框之后,将文字识别框输入到文字识别模型中。具体地,文字识别模型包括三层密集神经网络,每个密集神经网络层内的每个卷积层之间都有数据流连接。进一步地,铭牌识别服务器通过调用文字识别模型,将文字行进行字符形态特征提取,拼接取置信概率最高的字符并去重后,并根据命中字符输出文字识别框的文字识别结果即铭牌文字。

上述铭牌文字识别方法中,通过根据特征点的分布规律,识别出铭牌的文字候选框,并对文字候选框进行拼接,得到文字候选框,最后再对文字候选框进行的文字识别,准确地得到铭牌文字信息;从而可以适应不同铭牌类型、不同铭牌格式、不同铭牌材质等需求,避免了只能对特定铭牌中的固定识别区域进行文字识别的问题,进而解决了现有的铭牌识别方法存在识别准确度不高的问题。

在另一个实施例,上述的获取铭牌图像的特征点,包括:

提取铭牌图像中的图像特征;获取图像特征中的特征点。

其中,图像特征可以是经过深度卷积模块的叠加非线性计算后所得到的由浮点矩阵表示的图像特征矩阵。

具体实现中,铭牌识别服务器将铭牌图像进行比例缩放,使铭牌图像的分辨率与预设分辨率相同。更具体地,预设分辨率可以是1000×1500。然后,铭牌识别服务器将铭牌图像转化为rgb三通道格式后,将铭牌图像输入神经网络中,经过五个不同的卷积池化模块进行处理,得到铭牌图像的图像特征。由于汉字的笔画具有许多点特征,根据铭牌特征中的点特征提取图像特征区域,其中,图像特征矩阵的每一个像素点可以抽象为高纬图像特征,通过根据像素点的像素数值提取图像特征候选区域,从而缩小了铭牌识别服务器识别文字候选框时的识别范围。图像特征为矩阵。矩阵元素对应图像特征区域的像素,矩阵元素值就是经过深层抽象的图像特征中特征点的特征值。

本实施例的技术方案,通过提取铭牌图像中的图像特征;获取图像特征中的特征点,为确定图像特征中具有铭牌文字的图像区域提供依据,缩小了铭牌识别服务器识别文字候选框时的识别范围,进而提高了铭牌识别服务器确定文字识别框的效率。

在另一个实施例,上述的根据特征点,确定文字候选框,包括:

生成特征点的标准候选框,以及,获取特征点的特征点位置和获取特征点的特征值;根据特征点位置和特征值,对标准候选框进行卷积运算,生成标准候选框的文字置信概率;当文字置信概率大于预设的概率阈值,确定标准候选框为文字候选框。

其中,文字置信概率可以是指标准候选框具有铭牌文字特征的概率。

具体实现中,标准候选框可以是分辨率为16×16的识别候选框或分辨率为16×32的识别候选框等。对图像特征中的特征点生成多种不同尺度的标准候选框,然后,使用带参数卷积核扫描整个图像特征,进而获取特征点的特征点位置即图像特征中各像素点的像素位置,并获取特征点的特征值即图像特征中各像素点的像素值,根据像素点的像素位置和各像素点的像素值等特征信息,根据像素点的分布规律对标准候选框进行卷积运算,求得标准候选框的具有铭牌文字特征的概率,当文字置信概率大于预设的概率阈值,则确定标准候选框为文字候选框。

本实施例的技术方案,生成特征点的标准候选框,并获取特征点位置和获取特征点的特征值;根据特征点位置和特征值,根据特征点的分布规律对标准候选框进行卷积运算,生成标准候选框的文字置信概率;当文字置信概率大于预设的概率阈值,则确定标准候选框为文字候选框,通过根据特征点位置和特征值,对标准候选框进行卷积运算,进而可以根据图像特征的特征点的分布规律,准确地识别出具有文字特征的文字候选框,进而将文字候选框转换文字识别框。

在另一个实施例,上述的拼接所述文字候选框,得到所述文字识别框,包括:

获取文字候选框的位置坐标;位置坐标为文字候选框的中心点在铭牌图像中的坐标;根据位置坐标对文字候选框进行拼接,得到文字识别框。

具体实现中,当铭牌识别服务器获取具有文字特征的文字候选框之后,铭牌识别服务器获取文字候选框的中心点在铭牌图像中的位置坐标;不同文字候选框对应不同的位置坐标;通过根据位置坐标,从而确定不同的文字候选框之间的位置关系,对上述的文字候选框进行拼接,得到文字识别框。

例如,已知文字候选框的分辨率为16×32,经过铭牌识别服务器基于图像特征技术对铭牌图片进行识别处理后,得到具有“压”字文字特征的第一文字候选框、具有“器”字文字特征的第二文字候选框和具有“变”字文字特征的第三文字候选框。然后,铭牌识别服务器分别获取第一文字候选框的中心点在铭牌图像中的位置坐标为(9,2)、第二文字候选框的中心点在铭牌图像中的位置坐标为(18,2)和第三文字候选框的中心点在铭牌图像中的位置坐标为(1,2)。根据上述位置坐标在坐标系中的位置关系,确定第一文字候选框、第二文字候选框和第三文字候选框之间的位置关系,从而对上述三个文字候选框进行拼接,得到具有“变压器”文字特征的文字识别框。

本实施例的技术方案,通过铭牌识别服务器获取具有文字特征的文字候选框之后,获取文字特征在铭牌图像中的位置坐标,根据位置坐标对文字候选框进行拼接,从而可以准确地得到文字识别框。

在另一个实施例,上述的获取铭牌图像之前,还包括:

获取初始图像,初始图像包括铭牌区域;获取铭牌区域的边界坐标;边界坐标为铭牌区域的边缘在初始图像中的坐标;根据边界坐标剪切初始图像,生成铭牌图像。

具体实现中,用户通过使用手机或照相机对设于电机外壳的电机铭牌进行拍摄,得到初始图像。此时的初始图像的图像前景为铭牌,图像背景为电机外壳和周围环境。然后,用户将初始图像上传至铭牌识别服务器,铭牌识别服务器获取到初始图像之后,使用图像识别技术对初始图像中的铭牌特征进行识别,得到铭牌特征区域的边界坐标,边界坐标为铭牌区域的边缘在初始图像中的坐标;然后,根据铭牌特征区域的边界坐标对初始图像进行图像剪切,去除与铭牌特征无关的图像背景,生成只有铭牌特征的铭牌图像。

本实施例的技术方案,通过获取具有铭牌区域的初始图像,并识别初始图像中的铭牌区域,得到铭牌区域的在初始图像中的边界坐标;根据边界坐标准确地对初始图像进行图像剪切,去除与铭牌特征无关的图像背景,生成只有铭牌特征的铭牌图像,减少了铭牌识别服务器在生成文字识别框的处理量,进而提高了铭牌识别服务器的铭牌文字识别效率。

在另一个实施例,上述的识别文字识别框,得到铭牌文字之后,还包括:

根据铭牌文字,查询铭牌文字对应的设备信息;展示设备信息。

其中,设备可以是变压器、电机、变频器和电容器等。

其中,设备信息可以是指与设备有关的一系列具体信息,例如,设备维护方法、设备安装方法、设备维护记录、设备价格等。

具体实现中,首先根据设备名称与设备信息的映射关系,建立设备信息数据库。然后,根据铭牌文字,确定当前铭牌对应设备的设备名称;根据设备名称,在设备信息数据库中查询铭牌文字对应的设备信息,例如,设备维护方法、设备安装方法、设备维护记录和设备价格等;最后,在显示屏上显示设备维护方法、设备安装方法、设备维护记录和设备价格等设备信息。

本实施例的技术方案,通过铭牌识别服务器在识别出铭牌文字后,向用户展示铭牌文字对应的设备信息,从而避免了用户需要根据铭牌文字在设备说明书中手动查找与当前铭牌对应设备的设备参数信息的情况,提高了设备的维护效率。

在另一个实施例,上述的识别文字识别框,得到铭牌文字,包括:

识别文字识别框,得到初始文字;获取初始文字对应的候选文字;获取候选文字与铭牌文字的匹配程度;根据匹配程度,确定候选文字为铭牌文字。

具体实现中,铭牌识别服务器通过调用文字识别模型,文字识别模型通过识别文字识别框,将文字识别框中的文字行进行字符形态特征提取,拼接取置信概率最高的字符并去重后,并根据命中字符输出文字识别框的文字识别结果。此时,文字识别结果仅仅为初始文字,并不能排除铭牌因为生锈或缺损等情况而影响文字识别模型的文字识别结果。通过获取初始文字对应的候选文字;获取候选文字与铭牌文字的匹配程度;根据匹配程度,确定候选文字为铭牌文字。

例如,当具有“变压器”文字特征的铭牌出现生锈后,文字特征容易被遮挡,此时“变压器”文字特征变为“变压哭”文字特征。因此,文字识别模型对铭牌进行文字识别的结果为“变压哭”,对应的项目为设备名称;铭牌识别服务器预先建立有设备名称数据库,因此,铭牌识别服务器从设备名称数据库获取初始文字对应的候选文字,例如,“变压器”、“发电机”、“变频器”等候选文字,通过比对“变压哭”与上述候选文字的匹配程度,确定此时初始文字“变压哭”与候选文字“变压器”的匹配程度最高,因此确定“变压器”作为铭牌文字。

本实施例的技术方案,通过识别文字识别框,得到初始文字;获取初始文字对应的候选文字;获取候选文字与铭牌文字的匹配程度;根据匹配程度,确定候选文字为铭牌文字;提高了铭牌识别服务器识别铭牌文字的准确程度,解决了因铭牌破损或生锈等情况导致无法准确识别文字的问题。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图2所示,提供了一种铭牌文字识别装置,包括:

铭牌图像获取模块210,用于获取铭牌图像;

特征获取模块220,用于获取所述铭牌图像的特征点;

候选框识别模块230,用于根据所述特征点,确定文字候选框;

拼接模块240,用于拼接所述文字候选框,得到文字识别框;

文字识别模块250,用于识别所述文字识别框,得到铭牌文字。

在一个实施例中,上述的特征获取模块220,包括:

图像特征提取子模块,用于提取所述铭牌图像中的图像特征;特征点确定子模块,用于获取所述图像特征中的所述特征点。

在一个实施例中,上述的候选框识别模块230,还包括:

生成子模块,用于生成所述特征点的标准候选框,以及,获取所述特征点的特征点位置和获取所述特征点的特征值;运算子模块,用于根据所述特征点位置和所述特征值,对所述标准候选框进行卷积运算,生成所述标准候选框的文字置信概率;确定子模块,用于当所述文字置信概率大于预设的概率阈值,确定所述标准候选框为文字候选框。

在一个实施例中,上述的拼接模块240,还包括:

中心坐标获取单元,用于获取所述文字候选框的位置坐标;所述位置坐标为所述文字候选框的中心点在所述铭牌图像中的坐标;拼接单元,用于根据所述位置坐标对所述文字候选框进行拼接,得到所述文字识别框。

在一个实施例中,上述的一种铭牌文字识别装置,还包括:

初始图像获取模块,用于获取初始图像,所述初始图像包括铭牌区域;边界坐标获取模块,用于获取所述铭牌区域的边界坐标;所述边界坐标为所述铭牌区域的边缘在所述初始图像中的坐标;图像剪切模块,用于根据所述边界坐标剪切所述初始图像,生成所述铭牌图像。

在一个实施例中,上述的一种铭牌文字识别装置,还包括:

查询模块,用于根据所述铭牌文字,查询所述铭牌文字对应的设备信息;展示模块,用于展示所述设备信息。

在一个实施例中,上述的文字识别模块240,包括:

初始文字识别子模块,用于识别所述文字识别框,得到初始文字;候选文字获取子模块,用于获取所述初始文字对应的候选文字;匹配子模块,用于获取所述候选文字与所述铭牌文字的匹配程度;铭牌文字确定模块,用于根据所述匹配程度,确定所述候选文字为所述铭牌文字。

关于铭牌文字识别装置的具体限定可以参见上文中对于铭牌文字识别方法的限定,在此不再赘述。上述铭牌文字识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种铭牌文字识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

步骤110,获取铭牌图像;

步骤120,获取所述铭牌图像的特征点;

步骤130,根据所述特征点,确定文字候选框;

步骤140,拼接所述文字候选框,得到文字识别框;

步骤150,识别所述文字识别框,得到铭牌文字。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

提取所述铭牌图像中的图像特征;获取所述图像特征中的所述特征点。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

生成所述特征点的标准候选框,以及,获取所述特征点的特征点位置和获取所述特征点的特征值;根据所述特征点位置和所述特征值,对所述标准候选框进行卷积运算,生成所述标准候选框的文字置信概率;当所述文字置信概率大于预设的概率阈值,确定所述标准候选框为文字候选框。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取所述文字候选框的位置坐标;所述位置坐标为所述文字候选框的中心点在所述铭牌图像中的坐标;根据所述位置坐标对所述文字候选框进行拼接,得到所述文字识别框。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取初始图像,所述初始图像包括铭牌区域;获取所述铭牌区域的边界坐标;所述边界坐标为所述铭牌区域的边缘在所述初始图像中的坐标;根据所述边界坐标剪切所述初始图像,生成所述铭牌图像。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据所述铭牌文字,查询所述铭牌文字对应的设备信息;展示所述设备信息。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

识别所述文字识别框,得到初始文字;获取所述初始文字对应的候选文字;获取所述候选文字与所述铭牌文字的匹配程度;根据所述匹配程度,确定所述候选文字为所述铭牌文字。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

步骤110,获取铭牌图像;

步骤120,获取所述铭牌图像的特征点;

步骤130,根据所述特征点,确定文字候选框;

步骤140,拼接所述文字候选框,得到文字识别框;

步骤150,识别所述文字识别框,得到铭牌文字。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

提取所述铭牌图像中的图像特征;获取所述图像特征中的所述特征点。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

生成所述特征点的标准候选框,以及,获取所述特征点的特征点位置和获取所述特征点的特征值;根据所述特征点位置和所述特征值,对所述标准候选框进行卷积运算,生成所述标准候选框的文字置信概率;当所述文字置信概率大于预设的概率阈值,确定所述标准候选框为文字候选框。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取所述文字候选框的位置坐标;所述位置坐标为所述文字候选框的中心点在所述铭牌图像中的坐标;根据所述位置坐标对所述文字候选框进行拼接,得到所述文字识别框。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取初始图像,所述初始图像包括铭牌区域;获取所述铭牌区域的边界坐标;所述边界坐标为所述铭牌区域的边缘在所述初始图像中的坐标;根据所述边界坐标剪切所述初始图像,生成所述铭牌图像。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据所述铭牌文字,查询所述铭牌文字对应的设备信息;展示所述设备信息。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

识别所述文字识别框,得到初始文字;获取所述初始文字对应的候选文字;获取所述候选文字与所述铭牌文字的匹配程度;根据所述匹配程度,确定所述候选文字为所述铭牌文字。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1