一种文本信息的检测方法、装置及设备与流程

文档序号：35498613发布日期：2023-09-20 02:50阅读：16来源：国知局

本发明涉及通信，特别是指一种文本信息的检测方法、装置及设备。

背景技术：

1、场景文本检测是文本识别的重要方法，例如，行驶证关键字检测方法，通过文本模糊匹配定位关键字段，依赖于文本识别结果；各种自然场景下文本识别效果差，是影响识别准确率的关键因素，进而影响定位行驶证关键字段；样本标记量大，需要将行驶证上所有的中、英文全部标记出来；

2、但现有的场景文本检测方法，存在卡证倾斜，图片方向为倒着的情况；存在一张图像有多张卡证图像情况，也存在背景ocr文字干扰关键字段定位情况，存在检测准确性较低、局限性强且浪费处理资源。

技术实现思路

1、本发明要解决的技术问题是提供一种文本信息的检测方法、装置及设备，以提高图像文本信息检测的准确率。

2、为解决上述技术问题，本发明的实施例提供一种文本信息的检测方法，所述方法包括：

3、获取待检测图像；

4、对所述待检测图像进行校正，得到校正后的目标图像；

5、对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行；

6、对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段。

7、可选的，对所述待检测图像进行校正，得到校正后的目标图像，包括：

8、通过第一预设网络模型对所述待检测图像进行预处理，得到包括所述目标图像的目标区域；

9、对所述目标区域中有形变的目标图像进行校正，得到校正后的目标图像。

10、可选的，对所述目标区域中有形变的目标图像进行校正，得到校正后的目标图像，包括：

11、对所述目标区域中有形变的目标图像的顶点坐标进行标记以及对各顶点之间的顺序进行标记，得到至少一个顶点的坐标、各顶点之间的顺序以及所述目标图像中心点的位置坐标；

12、将所述至少一个顶点的坐标、各顶点之间的顺序以及所述目标图像中心点的位置坐标，输入到所述第一预设网络模型的分类处理层进行处理，得到分类处理结果；

13、将所述分类处理结果输入到所述第一预设网络模型的输出层的第一损失函数中进行处理，得到校正后的目标图像。

14、可选的，所述分类处理结果包括：

15、通过公式a*(b+c+d)＝e计算得到卷积核个数，其中，a表示待测图像的预设检测尺寸，b表示待检测图像的类别，c表示待检测图像上的标记的坐标信息，d表示物体识别度，e表示卷积核个数。

16、可选的，所述第一损失函数为：

17、loss1＝lxy+lx1y1+lx2y2+lx3y3+lx4y4+lr1+lr2+lr3+lr4+lcon1；其中

18、lcon1是分类的置信度，lxy是中心坐标点，lx1y1、lx2y2、lx3y3以及lx4y4标记的待检测图像的四个顶点，lr1、lr2、lr3以及lr4分别表示四个顶点的顺序。

19、可选的，对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行，包括：

20、对所述目标图像进行数据标记，获得包括目标图像前景的数据标记结果；

21、将所述数据标记结果输入到第二预设网络模型进行文本行分割处理，得到所述目标图像中的至少一个文本行。

22、可选的，所述第二预设网络模型依据输出层中的第二损失函数对所述至少一个文本行进行处理，得到处理后的文本行；

23、所述第二预设网络模型的输出层的第二损失函数为：loss2＝lxy+lw+lh+lcon2；其中，lxy是中心坐标点，lw是待检测图像的宽度，lh是待检测图像的高度，lcon2是文本行的置信度。

24、可选的，对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段，包括：

25、将所述至少一个文本行进行特征融合处理，得到融合特征集合；

26、根据所述融合特征集合进行文本行分类，得到所述待检测图像中的至少一个关键字段。

27、可选的，将所述至少一个文本行行进行特征融合处理，得到融合特征集合，包括：

28、将所述至少一个文本进行尺度归一化处理，得到归一化处理结果；

29、将所述归一化处理结果，输入到第三预设网络模型进行处理，得到第三预设网络模型处理结果；

30、将所述第三预设网络模型处理结果，输入到第四预设网络模型进行处理，得到第四预设网络模型处理结果；

31、将所述第三预设网络模型处理结果和所述第四预设网络模型处理结果进行融合处理，得到融合特征集合。

32、可选的，根据所述融合特征集合进行文本行分类，得到所述待检测图像中的至少一个关键字段，包括：

33、对所述融合特征集合中的第三预设网络模型处理结果和第四预设网络模型处理结果，通过预设分类模型进行分类处理，得到所述待检测图像中的至少一个关键字段。

34、本发明的实施例还提供一种文本信息的检测装置，所述装置包括：

35、获取模块，用于获取待检测图像；

36、图像校正处理模块，用于对所述待检测图像进行校正，得到校正后的目标图像；

37、文本行分割处理模块，用于对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行；

38、文本分类处理模块，用于对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段。

39、本发明的实施例还提供一种计算设备，包括：处理器、存储有计算机程序的存储器，所述计算机程序被处理器运行时，执行如上述所述的方法。

40、本发明的实施例还提供一种计算机可读存储介质，存储指令，当所述指令在计算机上运行时，使得计算机执行如上述所述的方法。

41、本发明的上述方案至少包括以下有益效果：

42、通过对所述待检测图像进行校正，得到校正后的目标图像，避免图像背景及图像倾斜导致的干扰，提高后续关键字段定位的准确性，进一步提升检测的准确率；对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行；对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段，去除其他不必要的字段信息，避免检测干扰，减少检测工作量，提高检测的效率与准确率。

技术特征：

1.一种文本信息的检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的文本信息的检测方法，其特征在于，对所述待检测图像进行校正，得到校正后的目标图像，包括：

3.根据权利要求2所述的文本信息的检测方法，其特征在于，对所述目标区域中有形变的目标图像进行校正，得到校正后的目标图像，包括：

4.根据权利要求3所述的文本信息的检测方法，其特征在于，所述分类处理结果包括：

5.根据权利要求3所述的文本信息的检测方法，其特征在于，所述第一损失函数为：

6.根据权利要求1所述的文本信息的检测方法，其特征在于，对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行，包括：

7.根据权利要求6所述的文本信息的检测方法，其特征在于，所述第二预设网络模型依据输出层中的第二损失函数对所述至少一个文本行进行处理，得到处理后的文本行；

8.根据权利要求1所述的文本信息的检测方法，其特征在于，对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段，包括：

9.根据权利要求8所述的文本信息的检测方法，其特征在于，将所述至少一个文本行进行特征融合处理，得到融合特征集合，包括：

10.根据权利要求8所述的文本信息的检测方法，其特征在于，根据所述融合特征集合进行文本行分类，得到所述待检测图像中的至少一个关键字段，包括：

11.一种文本信息的检测装置，其特征在于，所述装置包括：

12.一种计算设备，其特征在于，包括：处理器、存储有计算机程序的存储器，所述计算机程序被处理器运行时，执行如权利要求1至10任一项所述的方法。

13.一种计算机可读存储介质，其特征在于，存储指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至10任一项所述的方法。

技术总结
本发明提供一种文本信息的检测方法、装置及设备，所述方法包括：获取待检测图像；对所述待检测图像进行校正，得到校正后的目标图像；对所述目标图像进行文本行分割处理，得到所述目标图像中的至少一个文本行；对所述至少一个文本行进行文本行分类处理，得到所述待检测图像中的至少一个关键字段。本发明提供的方案可以避免图像背景及图像倾斜导致的检测干扰，提高检测的效率与准确率。

技术研发人员：王鹏
受保护的技术使用者：中国移动通信有限公司研究院
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王鹏
技术所有人：中国移动通信集团有限公司
我是此专利的发明人

上一篇：一种长尾图像数据筛选方法、装置及存储介质与流程
上一篇：一种高浓度氮氧化物三级尾气净化塔的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。