一种基于深度学习的机车工单信息智能识别方法及系统

文档序号：37126650发布日期：2024-02-22 21:39阅读：来源：国知局

技术特征：

1.一种基于深度学习的机车工单信息智能识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤2中，对所述机车工单图像数据进行图像预处理得到预处理后的图像数据，对应方法包括以下步骤：

3.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤3中，所述利用预处理后的图像数据进行文本检测和文本识别，对应方法包括以下步骤：

4.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤4中，利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建中的无模板表格重建采用hrnet网络框架进行关键点检测，利用扫描线法和连通域法进行表格重建；方法分为单通道方法和四通道方法重建表格，首先会进行四通道方法重建表格，当四通道方法重建失败时，将采用单通道方法重建表格。

5.根据权利要求2所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤215中的利用文本方向分类器，对机车工单图像数据的文本方向进行预分类，包括以下步骤：

6.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤311中的文本检测网络采用改进的增强细小文本区域响应的dbnet框架，其模型设计了针对细小文本区域特征提取模块，并通过后处理的过滤算法和增强算法适应工单文本检测，所述文本检测网络算法流程包括以下步骤：

7.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤312中的文本识别网络采用dcnresnet50骨干网络，并在所述文本识别网络的训练过程中引入正则项，防止网络过置信；所述dcnresnet50骨干网络算法包括以下步骤：

8.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤31101中的dcn包括以下步骤：

9.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤31105中的改进后的后处理算法包括以下步骤：

10.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤31203中的attention解码包括以下步骤：

11.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤31204中的改进序列置信度计算，方法如下：

12.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤312中的引入正则项方法如下：

13.根据权利要求4所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤4中的四通道方法重建表格，包括以下步骤：

14.根据权利要求4所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤4中的单通道方法重建表格，包括以下步骤：

15.根据权利要求13或14所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述轮廓中心距算法，包括以下步骤：

16.根据权利要求14所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述步骤425中的连通域法包括以下步骤：

17.根据权利要求13或14所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：所述扫描线法包括以下步骤：

18.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：在所述步骤3的文本识别中，使用基于困难样本挖掘的半自动数据标注流程，在进一步提升文本识别模型性能上，极大减少了标注成本；

19.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法，其特征在于：在所述步骤3的文本识别中，采用基于标注的数据和困难样本挖掘的合成方式，通过将真实机车工单图像数据背景、字频出现较低的字符和多种手写字体项结合，能获得贴近真实场景的广阔的工单文本行数据；

20.一种基于深度学习的机车工单信息识别系统，其特征在于：包括：机车工单图像数据获取模块、图像预处理模块、图像数据文本检测和文本识别模块、无模板表格重建和文本信息输出模块；所述机车工单图像数据获取模块，用于获得所述机车工单图像数据，所述图像预处理模块，用于对所述机车工单图像数据进行图像背景消除、图像方向矫正、文本方向进行预分类；所述图像文本检测和所述文本识别模块，用于获取文本区域和文本信息；所述无模板表格重建和文本信息输出模块，用于获得所述机车工单图像的文本信息及文本之间的联系。

技术总结
本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统，包括以下步骤：步骤1，获得机车工单图像数据；步骤2，对机车工单图像数据进行图像预处理得到预处理后的图像数据；步骤3，利用预处理后的图像数据进行文本检测和文本识别；步骤4，利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建，获得机车工单图像的文本信息及文本之间的联系；提升了对机车工单信息智能识别的识别精度，实现了机车工单复杂表格的无模板重建；特别在机车工单多类别的识别场景，都能满足机车维修等后勤工作对机车工单识别的高精度性能需求，能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。

技术研发人员：黄双萍,黄森,张慧源,李晨,徐之昊,彭文杰
受保护的技术使用者：华南理工大学
技术研发日：
技术公布日：2024/2/21

完整全部详细技术资料下载

当前第2页1 2