文本识别方法及设备与流程

文档序号：22472153发布日期：2020-10-09 22:05阅读：57来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明实施例涉及图像技术领域，尤其涉及一种文本识别方法及设备。

背景技术：

车架号是车辆唯一的身份识别码，车架号通常由17位数字和字母组合形成，其有的呈弧形(例如，双排弧形车架号)，即呈曲线排列。目前，当需要记录车辆的车架号(例如，车辆经销商在统计车辆库存)时，需要相关人员人工识别车辆的车架号，并进行记录。

然而，发明人发现现有技术中至少存在如下问题：由于需要人工识别车架号，导致车架号的识别速度较低，且容易出现错误，从而造成车架号的识别效率以及准确率低。

技术实现要素：

本发明实施例提供一种文本识别方法及设备，以解决现有技术中识别效率以及准确率低的问题。

第一方面，本发明实施例提供一种文本识别方法，包括：

获取待识别的曲线文本图像，并对所述曲线文本图像进行特征提取，得到特征图；

采用目标网络模型，对所述特征图进行处理，得到所述特征图中的文本边界框，其中所述目标网络模型用于检测图像中的文本边界；

对所述文本边界框进行识别，得到所述文本边界框中的曲线文本。

在一种可能的设计中，所述对所述曲线文本图像进行特征提取，得到特征图，包括：

采用共享网络模型，对所述曲线文本图像进行特征提取，得到所述特征图，其中所述共享网络模型中的低层网络层与高层网络层连接。

在一种可能的设计中，所述目标网络模型包括矩形包围框检测模型和边界点检测模型，则所述采用目标网络模型，对所述特征图进行处理，得到所述特征图中的文本边界框，包括：

采用所述矩形包围框检测模型，对所述特征图进行文本框检测，以获取所述特征图中的文本矩形包围框，其中所述文本矩形包围框包括曲线文本，所述矩形包围框检测模型用于提取图像中的文本矩形包围框；

采用所述边界点检测模型，对所述文本矩形包围框进行边界点检测，得到所述文本矩形包围框中的曲线文本的边界点，其中所述边界点检测模型用于检测文本的边界点；

根据所述边界点和所述特征图，得到所述文本边界框。

在一种可能的设计中，所述曲线文本图像包括车架号图像，则所述对所述文本边界框进行识别，得到所述文本边界框中的曲线文本，包括：

采用文本识别模型对所述文本边界框进行车架号识别，以获取所述文本边界框中的车架号。

在一种可能的设计中，所述方法还包括：

确定所述文本边界框中的曲线文本是否处于水平状态；

若否，则对所述文本边界框进行水平矫正。

在一种可能的设计中，所述采用所述边界点检测模型，对所述文本矩形包围框进行边界点检测，得到所述文本矩形包围框中的曲线文本的边界点，包括：

采用所述边界点检测模型，对所述文本矩形包围框进行边界点检测，得到边界点与所述文本矩形包围框上的长边等分点之间的偏置距离；

获取所述长边等分点的坐标，根据所述长边等分点的坐标和所述偏置距离确定所述边界点的坐标。

在一种可能的设计中，所述根据所述边界点和所述特征图，得到所述文本边界框，包括：

基于所述边界点的坐标，确定所述特征图中的曲线文本边界；

对所述曲线文本边界进行连接，得到所述文本边界框。

第二方面，本发明实施例提供一种文本识别设备，包括：

图像获取模块，用于获取待识别的曲线文本图像，并对所述曲线文本图像进行特征提取，得到特征图；

处理模块，用于采用目标网络模型，对所述特征图进行处理，得到所述特征图中的文本边界框，其中所述目标网络模型用于检测图像中的文本边界；

所述处理模块，还用于对所述文本边界框进行识别，得到所述文本边界框中的曲线文本。

在一种可能的设计中，所述图像获取模块还用于：

采用共享网络模型，对所述曲线文本图像进行特征提取，得到所述特征图，其中所述共享网络模型中的低层网络层与高层网络层连接。

在一种可能的设计中，所述目标网络模型包括矩形包围框检测模型和边界点检测模型，则所述处理模块还用于：

采用所述矩形包围框检测模型，对所述特征图进行文本框检测，以获取所述特征图中的文本矩形包围框，其中所述文本矩形包围框包括曲线文本，所述矩形包围框检测模型用于提取图像中的文本矩形包围框；采用所述边界点检测模型，对所述文本矩形包围框进行边界点检测，得到所述文本矩形包围框中的曲线文本的边界点，其中所述边界点检测模型用于检测文本的边界点；根据所述边界点和所述特征图，得到所述文本边界框。

在一种可能的设计中，所述曲线文本图像包括车架号图像，则所述处理模块还用于：

采用文本识别模型对所述文本边界框进行车架号识别，以获取所述文本边界框中的车架号。

在一种可能的设计中，所述处理模块还用于：

确定所述文本边界框中的曲线文本是否处于水平状态；若否，则对所述文本边界框进行水平矫正。

在一种可能的设计中，所述处理模块还用于：

采用所述边界点检测模型，对所述文本矩形包围框进行边界点检测，得到边界点与所述文本矩形包围框上的长边等分点之间的偏置距离；获取所述长边等分点的坐标，根据所述长边等分点的坐标和所述偏置距离确定所述边界点的坐标。

在一种可能的设计中，所述处理模块还用于：

基于所述边界点的坐标，确定所述特征图中的曲线文本边界；对所述曲线文本边界进行连接，得到所述文本边界框。

第三方面，本发明实施例提供一种电子设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的文本识别方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面以及第一方面各种可能的设计所述的文本识别方法。

本发明提供的文本识别方法及设备，通过获取待识别的曲线文本图像，并对曲线文本图像进行特征提取，得到特征图，采用目标网络模型，对特征图进行处理，得到特征图中的文本边界框，其中目标网络模型用于检测图像中的文本边界，对文本边界框进行识别，得到文本边界框中的曲线文本。本发明实施例通过对待识别的曲线文本图像进行特征提取，得到更能表征曲线文本图像特征的特征图，并利用目标网络模型对该特征图进行处理，得到该特征图中的曲线文本的文本边界框，即得到特征图中的曲线文本所在区域，实现曲线文本的精准定位，然后对该文本边界框进行文本识别，得到文本边界框中的曲线文本，实现曲线文本的自动识别，提高曲线文本识别的效率以及准确率，无需人工识别图像中的曲线文本，不会出现现有识别效率以及准确率低的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的曲线文本的示意图；

图2为本发明实施例提供的文本识别方法的流程示意图一；

图3为本发明实施例提供的文本识别方法的流程示意图二；

图4为本发明实施例提供的共享网络模型的示意图；

图5为本发明实施例提供的边界点的示意图；

图6为本发明实施例提供的文本框的示意图一；

图7为本发明实施例提供的文本识别方法的流程示意图三；

图8为本发明实施例提供的文本框的示意图二；

图9为本发明实施例提供的文本识别设备的结构示意图；

图10为本发明实施例提供的电子设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

车架号一般呈弧形，即呈曲线排列(如图1所示的车架号)。目前，当需要记录车辆的车架号(例如，车辆经销商在统计车辆库存)时，需要相关人员人工识别车辆的车架号，并进行记录。但由于需要人工识别车架号，导致车架号的识别速度较低，且容易出现错误，从而造成车架号的识别效率以及准确率低。

因此，针对上述问题，本发明的技术构思是基于端到端的检测识别网络框架对图像中的车架号进行检测和识别，即基于构建的共享网络模型对车架号图像进行特征提取，得到相应的特征图，该共享网络模型的低层网络层和高层网络层连接，因此，得到的特征图更能反映车架号图像的特征，将该特征图输入到矩形包围框检测模型，得到文本矩形包围框，然后利用边界点检测模型检测对文本矩形包围框中的车架号进行边界点检测，得到边界点的坐标，将边界点的坐标与特征图进行结合，确定文本边界框，实现车架号的精准定位，该文本边界框所携带的背景信息较少，对该文本边界框进行旋转，以使该文本边界框处于水平状态，将处于水平状态的文本边界框输入到文本识别模型，以使文本识别模型识别该文本边界框中的车架号，从而实现车架号的自动识别，且将车架号的检测所利用到的模型与识别所利用到的模型进行融合，即基于端到端的检测识别网络框架对图像中的车架号进行检测和识别可以有效减少电子设备运行时所需要的显存占用，且可以避免由于定位所带的背景信息对识别过程的影响，可以大大提高车架号检测和识别的速度，还可以提高车架号识别的准确率，无需人工识别车架号，不会出现现有识别效率以及准确率低的问题。

下面以具体地示例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的示例可以相互结合，对于相同或相似的概念或过程可能在某些示例中不再赘述。下面将结合附图，对本公开的示例进行描述。

图2为本发明实施例提供的文本识别方法的流程示意图一，本实施例的执行主体可以为电子设备，本实施例此处不做特别限制。如图2所示，该方法包括：

s201、获取待识别的曲线文本图像，并对曲线文本图像进行特征提取，得到特征图。

在本实施例中，获取待识别的曲线文本图像，该曲线文本图像包括待识别的曲线文本，该曲线文本为呈曲线排列的文本，例如车架号。

其中，曲线文本图像可以是服务器或是其它终端发送的，也可以是通过相关传输设备(例如，u盘)导入的，本发明不对曲线文本图像的来源进行限定。

可选的，曲线文本图像为车架号图像，该车架号图像包括车架号。

在本实施例中，在得到曲线文本图像后，对该曲线文本图像进行特征提取，得到该曲线文本图像对应的特征图，该特征图更能反映出曲线文本图像的特征，即更能凸出曲线文本图像中的曲线文本，从而使得后续根据该特征图进行曲线文本定位和识别更加准确。

s202、采用目标网络模型，对特征图进行处理，得到特征图中的文本边界框，其中目标网络模型用于检测图像中的文本边界。

在本实施例中，在得到曲线文本图像对应的特征图后，利用目标网络模型对特征图进行处理，即检测特征图中的曲线文本的文本边界，得到特征图中的文本边界框，即得到特征图中的文本区域，该文本区域所包括的背景信息较少，即包括的非曲线文本信息较少，实现曲线文本的精准定位，即实现曲线文本的自动检测，以供利用该文本边界框识别曲线文本，实现曲线文本的精准识别。

其中，目标网络模型包括矩形包围框检测模型和边界点检测模型。

s203、对文本边界框进行识别，得到文本边界框中的曲线文本。

在本实施例中，在得到特征图中的文本边界框后，即在得到曲线文本图像中的文本区域后，对该文本边界框进行文本识别以确定该文本边界框中的曲线文本，实现曲线文本的识别。

从上述描述可知，对待识别的曲线文本图像进行特征提取，得到更能表征曲线文本图像特征的特征图，并利用目标网络模型对该特征图进行处理，得到该特征图中的曲线文本的文本边界框，即得到特征图中的曲线文本所在区域，实现曲线文本的精准定位，然后对该文本边界框进行文本识别，得到文本边界框中的曲线文本，实现曲线文本的自动识别，提高曲线文本识别的效率以及准确率，无需人工识别图像中的曲线文本，不会出现现有识别效率以及准确率低的问题。

图3为本发明实施例提供的文本识别方法的流程示意图二，本实施例在图2实施例的基础上，在得到特征图后，采用相关模型定位特征图中的曲线文本部分，即检测曲线文本的边界点，得到相应的文本边界框，以根据文本边界框确定曲线文本。下面将结合一个具体实施例对采用相关模型检测曲线文本的边界点的过程进行描述。如图3所示，该方法包括：

s301、获取待识别的曲线文本图像，并对曲线文本图像进行特征提取，得到特征图。

在本实施例中，在对曲线文本图像进行特征提取时，采用共享网络模型，对曲线文本图像进行特征提取，将曲线文本图像输入到共享网络模型中以使共享网络模型对其进行特征提取，得到所需的特征图，该特征图更能反映曲线文本图像中的特征部分，即更能凸出曲线文本图像中的曲线文本部分，降低噪声部分的影响。

其中，共享网络模型包括多个第一网络层和多个第二网络层。多个第一网络层依次连接。对于每个第一网络层，该第一网络层接收上一个第一网络层输出的特征图，并对其进行下采样(即降维)处理，得到大小为该第一网络层对应的预设尺寸的第一特征图。多个第二网络层依次连接，且每个第二网络层与其对应的第一网络层连接。对于每个第二网络层，该第二网络层接收其对应的第一网络层输出的第一特征图以及接收上一个第二网络层输出的第二特征图，并对第一特征图和第二特征图进行上采样(即升维)处理，得到大小为该第二网络层对应的预设尺寸的第二特征图。将最后的第二网络层输入的第二特征图作为所需的特征图。如图4所示，网络层1，2，3和4均为第一网络层，网络层4，5，6和7均为第二网络层。网络层1，2和3依次连接，网络层5，6和7依次连接，且网络层5，6和7与其对应的第一网络层连接，例如，网络层5与网络层3连接。每个网络层输出的特征图的大小均为其对应的尺寸大小，例如，网络层2输出的特征图的大小为原图的八分之一。将最后一个第二网络层，即网络层7输出的特征图作为所需的特征图。

其中，第一网络层可以包括卷积层，也可以同时包括池化层，第二网络层可以包括反卷积层，也可以同时包括池化层，用户可以根据实现需求设置网络层的结构。

可选的，共享网络模型是基于segnet网络框架构建的，该共享网络模型可以将lowlevel语义特征图和highlevel语义特征图进行综合处理，即将第一特征图和第二特征图进行综合处理，以使得到的特征图更能凸出曲线文本图像的特征部分。

s302、采用矩形包围框检测模型，对特征图进行文本框检测，以获取特征图中的文本矩形包围框，其中文本矩形包围框包括曲线文本，矩形包围框检测模型用于提取图像中的文本矩形包围框。

s303、采用边界点检测模型，对文本矩形包围框进行边界点检测，得到文本矩形包围框中的曲线文本的边界点，其中边界点检测模型用于检测文本的边界点。

在本实施例中，利用矩形包围框检测模型对特征图进行文本框检测，即将特征图输入到矩形包围框检测模型中，该矩形包围框检测模型提取特征图中的候选区，提取出候选区域后,对目标矩形框的中心偏移量、宽度、高度和倾斜角度进行回归,最终得到包围文本信息的多方向矩形框信息，即得到特征图中的文本矩形包围框。

其中，矩形包围框检测模型实际为多方向矩形包围框检测模型，其可以提取图像中的包围曲线文本的矩形框。该矩形包围框检测模型提取图像中的包围曲线文本的矩形框的过程为现有过程，在此，不再对其进行赘述。

在本实施例中，可选的，矩形包围框检测模型为区域生成网络(regionproposalnetwork，rpn)模型。

在本实施例中，在得到文本矩形包围框后，该文本矩形包围框中存在的背景噪声较多，即包含的非曲线文本部分较多，因此为了提高后续文本识别的准确率，需根据曲线文本的边界对该文本矩形包围框进行进一步分割(即提取)以得到包括非曲线文本部分较少的文本边界框。

具体的，在根据曲线文本的边界对该文本矩形包围框进行进一步分割时，需要先将文本矩形包围框输入到边界点检测模型中，以使边界点检测模型对文本矩形包围框进行边界点检测，得到文本矩形包围框中的曲线文本的边界点。

可选的，步骤s303得实现方式为：采用边界点检测模型，对文本矩形包围框进行边界点检测，得到边界点与文本矩形包围框上的长边等分点之间的偏置距离。获取长边等分点的坐标，根据长边等分点的坐标和偏置距离确定边界点的坐标。

具体的，将文本矩形包围框输入到边界点检测模型中，该边界点检测模型提取该文本矩形包围框中的曲线文本的边界点，每个边界点与一个文本矩形包围框上的长边等分点的相对应，然后对于每个边界点，确定该边界点与其对应的长边等分点之间的偏置距离，得到该边界点对应的偏置距离，并进行输出。

对于每个边界点，基于预设坐标计算公式，根据该边界点对应的长边等分点的坐标以及该边界点对应的偏置距离，得到该边界点的坐标。

其中，偏置距离包括横坐标偏置距离和纵坐标偏置距离。预设坐标计算公式为(x′b，y′b)为边界点的坐标，(x′d，y′d)为边界点对应的长边等分点的坐标，w0为文本矩形包围框的宽度(即文本矩形包围框的长边的长度)，h0为文本矩形包围框的高度(即文本矩形包围框的短边的长度)。

可选的，在确定曲线文本的边界点时，可以利用预设边界点生成算法确定边界点，预设边界点生成算法的代码如下：

需要说明，文本矩形包围框上的长边等分点为默认点，其可以根据实际需求进行设置，例如，将其设置为八等分点，该文本矩形包围框的一条长边上存在七个长边等分点。

在本实施例中，矩形包围框检测模型和边界点检测模型均为训练好的网络模型，矩形包围框检测模型可以准确提取图像中的文本矩形包围框，边界点检测模型可以确定文本矩形包围框中的曲线文本的边界点，以及边界点与文本矩形包围框的长边等分点之间的偏置距离。

s304、根据边界点和特征图，得到文本边界框。

在本实施例中，将边界点映射到特征图上，提取特征图上的边界点包围的部分，得到包括曲线文本的文本边界框，且该文本边界框相较于矩形包围框所包括的背噪声较少，以便后续进行文本识别，保证文本识别的准确度。

在本实施例中，可选的，在将边界点映射到特征图上时，可以利用边界段的坐标进行映射，从而提取特征图上的边界点包围的部分以得到文本边界框，具体过程为：基于边界点的坐标，确定特征图中的曲线文本边界。对曲线文本边界进行连接，得到文本边界框。

具体的，根据边界点的坐标，确定边界点在特征图上的位置，从而得到曲线文本边界，该曲线文本边界由多个边界点组成。将曲线文本边界上的边界点依次连接，得到包围曲线文本的文本边界框，例如，对图5中的边界点依次连接，得到图6中的文本边界框。

s305、对文本边界框进行识别，得到文本边界框中的曲线文本。

在本实施例中，在得到文本边界框后，即在得到曲线文本部分后，对该曲线文本部分进行文本识别，以得到该曲线文本部分中的曲线文本，实现曲线文本的自动识别。

其中，在对文本边界框进行识别时，可以利用文本识别模型进行文本识别。

另外，在本实施例中，对于端到端框架中的网络模型，例如，矩形包围框检测模型，边界点检测模型和文本识别模型，采用基于多任务loss进行训练。即总loss＝lossrect+lossbound+lossrec。lossrect表示矩形包围框检测模型的loss，lossbound表示边界点检测模型的loss，lossrec表示文本识别模型的loss。

另外，在对端到端框架中的网络模型进行训练时，获取人工标注好的训练样本图像，将该训练样本输入到端到端框架中，以使相关网络模型利用该训练样本进行模型训练。

图7为本发明实施例提供的文本识别方法的流程示意图三，本实施例在上述任意实施例的基础上，在识别车架号图像中的车架号时，需先检测车架号图像中的车架号区域，得到相应的文本边界框，实现车架号的精准定位，然后对该文本边界框进行识别以得到文本边界框中的车架号，实现车架号的自动识别。下面将结合一个具体实施例对识别文本边界框中的车架号的过程进行描述。如图7所示，该方法包括：

s701、获取待识别的车架号图像，并对车架号图像进行特征提取，得到特征图。

s702、采用目标网络模型，对特征图进行处理，得到特征图中的文本边界框，其中目标网络模型用于检测图像中的文本边界。

本实施例中步骤s701至s702的实现过程与上述图2实施例中的s201至s202的实现过程类似，在此不再对其进行赘述。

s703、采用文本识别模型对文本边界框进行车架号识别，以获取文本边界框中的车架号。

在本实施例中，当曲线文本图像包括车架号图像时，表明需获取车架号图像中的车架号，则在得到车架号图像对应的特征图中的文本边界框，即在得到特征图中的车架号区域后，该文本边界框包括车架号，利用训练好的文本识别模型对文本边界框进行文本识别，即将该文本边界框输入到文本识别模型，该文本识别模型对该文本边界进行文本识别，确定文本边界框中的车架号，实现车架号的自动识别。

其中，文本识别模型为训练好的长短期记忆网络(longshort-termmemory，lstm)网络模型，该训练好的lstm网络模型可以准确识别出车架号。

另外，文本识别模型的训练过程与现有神经网络模型的训练过程类似，即先获取所需的训练样本，然后利用该训练样本对基础的神经网络模型进行训练，从而得到训练好的文本识别模型，在此，不对其具体训练过程进行赘述。

另外，在任意实施例中，可选的，由于文本识别模型识别处于水平行的文本的准确率更高，因此，为了提高文本识别模型识别文本边界框中的曲线文本，即车架号的准确率，在得到文本边界框后，即先确定文本边界框中的曲线文本是否处于水平状态。若文本边界框没有处于水平状态，表明文本边界框中的曲线文本不呈水平排列，而是呈曲线排列(如图8中的a所示)，则对文本边界框中的曲线文本进行水平矫正，以使曲线文本处于水平状态，即文本边界框中的曲线文本呈水平排列(如图8中的b所示)。将曲线文本处于水平行的文本边界框输入到文本识别模型中，以使文本识别模型识别该文本边界框中的处于水平状态的文本。

在确定文本边界框中的曲线文本处于水平状态后，表明该曲线文本呈水平排列，直接将曲线文本处于水平状态的文本边界框输入到文本识别模型中，实现文本的精准识别。

在本实施例中，基于端到端的检测识别网络框架对车架号图像中的车架号进行检测和识别，即利用相关模型确定车架号图像中的文本边界框，该文本边界框所包括的非车架号部分较少，实现车架号的精准定位，即实现车架号的精准检测，然后利用文本识别模型对该文本边界框进行识别，得到相应的车架号，实现车架号的自动识别，且由于是对包括较少背景的文本边界框进行识别，可以降低背景部分对车架号的影响，从而保证识别的准确度。

基于同样的思路，本说明书实施例还提供了上述方法对应的装置，图9为本发明实施例提供的文本识别设备的结构示意图。如图9所示，该文本识别设备90包括：图像获取模块901和处理模块902。

其中，图像获取模块901，用于获取待识别的曲线文本图像，并对曲线文本图像进行特征提取，得到特征图。

处理模块902，用于采用目标网络模型，对特征图进行处理，得到特征图中的文本边界框，其中目标网络模型用于检测图像中的文本边界。

处理模块902，还用于对文本边界框进行识别，得到文本边界框中的曲线文本。

在本发明另一实施例中，在上述图9所示实施例的基础上，目标网络模型包括矩形包围框检测模型和边界点检测模型，则处理模块902还用于：

采用矩形包围框检测模型，对特征图进行文本框检测，以获取特征图中的文本矩形包围框，其中文本矩形包围框包括曲线文本，矩形包围框检测模型用于提取图像中的文本矩形包围框。采用边界点检测模型，对文本矩形包围框进行边界点检测，得到文本矩形包围框中的曲线文本的边界点，其中边界点检测模型用于检测文本的边界点。根据边界点和特征图，得到文本边界框。

在本实施例中，可选的，图像获取模块901还用于：

采用共享网络模型，对曲线文本图像进行特征提取，得到特征图，其中共享网络模型中的低层网络层与高层网络层连接。

在本实施例中，可选的，处理模块902还用于：

采用边界点检测模型，对文本矩形包围框进行边界点检测，得到边界点与文本矩形包围框上的长边等分点之间的偏置距离。获取长边等分点的坐标，根据长边等分点的坐标和偏置距离确定边界点的坐标。

在本实施例中，可选的，处理模块902还用于：

基于边界点的坐标，确定特征图中的曲线文本边界。对曲线文本边界进行连接，得到文本边界框。

在本发明另一实施例中，在上述图9所示实施例的基础上，曲线文本图像包括车架号图像，则处理模块902还用于：

采用文本识别模型对文本边界框进行车架号识别，以获取文本边界框中的车架号。

另外，可选的，处理模块902还用于：

确定文本边界框中的曲线文本是否处于水平状态。若文本边界框没有处于水平状态，则对文本边界框进行水平矫正。

本实施例提供的设备，可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，本实施例此处不再赘述。

图10为本发明实施例提供的电子设备的硬件结构示意图。如图10所示，本实施例的电子设备100包括：处理器1001以及存储器1002；其中，

存储器1002，用于存储计算机执行指令；

处理器1001，用于执行存储器存储的计算机执行指令，以实现上述实施例中接收设备所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。

可选地，存储器1002既可以是独立的，也可以跟处理器1001集成在一起。

当存储器1002独立设置时，该列车用户识别设备还包括总线1003，用于连接所述存储器1002和处理器1001。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上所述的文本识别方法。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本申请各个实施例所述方法的部分步骤。

应理解，上述处理器可以是中央处理单元(英文：centralprocessingunit，简称：cpu)，还可以是其他通用处理器、数字信号处理器(英文：digitalsignalprocessor，简称：dsp)、专用集成电路(英文：applicationspecificintegratedcircuit，简称：asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速ram存储器，也可能还包括非易失性存储nvm，例如至少一个磁盘存储器，还可以为u盘、移动硬盘、只读存储器、磁盘或光盘等。

总线可以是工业标准体系结构(industrystandardarchitecture，isa)总线、外部设备互连(peripheralcomponent，pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture，eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(applicationspecificintegratedcircuits，简称：asic)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁子凡
技术所有人：上海眼控科技股份有限公司
我是此专利的发明人

上一篇：投影式光固化3D打印装置的制作方法
上一篇：增材制造装置以及增材制造方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。