文本检测方法和装置、电子设备和存储介质与流程

文档序号：37425604发布日期：2024-03-25 19:13阅读：11来源：国知局

本公开涉及图像识别、文本检测，尤其是一种文本检测方法和装置、电子设备和存储介质。

背景技术：

1、在多种应用场景中需要对图像进行文本检测。在实际应用中，由于高分辨率图像具有清晰度、承载信息量大等优点，已被广泛应用在多个领域。由于科技的进步，通常一张高分辨图像的像素可以达到上亿级别，图像中也可能包括数百行文本，这对文本检测的性能提出了很大挑战。如果直接将亿级别像素的高分辨率图像按照原始尺寸进行文本检测，需要具有较高配置显存，价格较为高昂。

2、为了解决上述问题，相关技术中，在对高分辨率图像进行文本检测前，先调低图像的分辨率，再对低分辨率的图像进行文本检测，然而，调低图像的分辨率可能丢失高分辨图像中的小文本信息，从而导致文本漏检，从而导致对图像中文本信息提取不全的问题。

技术实现思路

1、为了解决上述技术问题，本公开实施例提供了一种文本检测方法和装置、电子设备和存储介质。

2、本公开实施例的一个方面，提供了一种文本检测方法，包括：对待检测图像进行划分处理，得到多个子图像；对所述多个子图像进行文本检测，得到至少一个第一初始文本框和各第一初始文本框在对应子图像中的位置信息；根据各第一初始文本框在对应子图像中的位置信息，确定所述至少一个第一初始文本框在所述待检测图像中对应的至少一个第二初始文本框和各第二初始文本框在所述待检测图像中的位置信息；分别针对所述待检测图像中的各图像区域，响应于所述图像区域对应的第二初始文本框之间具有重叠区域，根据具有重叠区域的第二初始文本框在所述待检测图像中的位置信息，对所述具有重叠区域的第二初始文本框进行去重或合并处理，得到所述待检测图像中的待识别文本框，其中，所述待检测图像预先被划分为多个图像区域；对所述待检测图像中的待识别文本框进行文本识别，得到文本识别结果。

3、本公开实施例的另一个方面，提供了一种文本检测装置，其特征在于，包括：图像划分模块，用于对待检测图像进行划分处理，得到多个子图像；文本检测模块，用于对所述多个子图像进行文本检测，得到至少一个第一初始文本框和各第一初始文本框在对应子图像中的位置信息；第一文本框映射模块，用于根据各第一初始文本框在对应子图像中的位置信息，确定所述至少一个第一初始文本框在所述待检测图像中对应的至少一个第二初始文本框和各第二初始文本框在所述待检测图像中的位置信息；去重合并模块，用于分别针对所述待检测图像中的各图像区域，响应于所述图像区域对应的第二初始文本框之间具有重叠区域，根据具有重叠区域的第二初始文本框在所述待检测图像中的位置信息，对所述具有重叠区域的第二初始文本框进行去重或合并处理，得到所述待检测图像中的待识别文本框，其中，所述待检测图像预先被划分为多个图像区域；文本识别模块，用于对所述待检测图像中的待识别文本框进行文本识别，得到文本识别结果。

4、本公开实施例的又一个方面，提供了一种电子设备，包括：存储器，用于存储计算机程序；处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现文本检测方法。

5、本公开实施例的又一个方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，实现的文本检测方法。

6、本公开实施例中，通过将待检测图像划分成多个子图像，然后对多个子图像进行文本检测，并根据多个子目标图像中的第一初始文本框，确定待检测图像中的第二初始文本框，之后通过对对应同一图像区域且具有重叠的第二初始文本进行去重或合并处理，得到目标图像的待识别文本框，由此能够在保证待检测图像的分辨率不变的情况下，实现对待检测图像文本检测，全面、准确、有效的检测出待检测图像中的文本信息，避免了相关技术中由于降低待检测图像分辨率所导致的小文本信息的丢失情况，进而解决了文本漏检的问题，提高了文本召回率。

7、另外，本公开实施例中，通过单独对各待图像区域中的具有重叠区域的第二初始文本框进行去重或合并处理，能够实现对需要去重和合并处理的第二初始文本框的快速定位，提高了对第二初始文本框的去重和合并的效率，而且由于去重和合并处理是针对位于同一图像区域中的第二初始文本框进行的，无需将每个第二初始文本框与待检测图像的其他第二初始文本框进行比较确定是否进行去重或合并，从而有效的减少了文本框去重和合并时需要处理的文本框的数量，降低了文本框去重和合并的难度，提高了对文本框的去除和合并的效率。

8、下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

技术特征：

1.一种文本检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述响应于所述图像区域对应的第二初始文本框之间具有重叠区域之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据各第二初始文本框在所述待检测图像中的位置信息和各图像区域在所述待检测图像中的位置范围信息，确定各第二初始文本框分别对应的图像区域，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据具有重叠区域的第二初始文本框在所述待检测图像中的位置信息，对所述具有重叠区域的第二初始文本框进行去重或合并处理，包括：

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述对待检测图像进行划分处理，得到多个子图像，包括：

6.根据权利要求1-4中任一项所述的方法，其特征在于，所述对所述多个子图像进行文本检测，包括：

7.根据权利要求6所述的方法，其特征在于，所述文本检测模型通过如下方式训练得到：

8.根据权利要求7所述的方法，其特征在于，获取训练数据集，包括：

9.一种文本检测装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现上述权利要求1-8中任一所述的文本检测方法。

技术总结
本公开实施例公开了一种文本检测方法和装置、电子设备和存储介质，其中，方法包括：对待检测图像进行划分处理，得到多个子图像；对多个子图像进行文本检测，得到第一初始文本框和第一初始文本框在对应子图像中的位置信息；根据第一初始文本框在对应子图像中的位置信息，确定第一初始文本框在待检测图像中对应的第二初始文本框和第二初始文本框在待检测图像中的位置信息；当待检测图像中的图像区域对应的第二初始文本框之间具有重叠区域，对该具有重叠区域的第二初始文本框进行去重或合并处理，得到待检测图像中的待识别文本框；对待检测图像中的待识别文本框进行文本识别，得到文本识别结果。

技术研发人员：席浩
受保护的技术使用者：贝壳找房（北京）科技有限公司
技术研发日：
技术公布日：2024/3/24

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：席浩
技术所有人：贝壳找房（北京）科技有限公司
我是此专利的发明人

上一篇：一种用于装卸冲锋舟的翻转机构的制作方法
上一篇：一种开关的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。