文字识别方法、装置、电子设备及可读存储介质与流程

文档序号：34964757发布日期：2023-08-01 09:30阅读：24来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本技术实施例涉及文字识别，尤其涉及一种文字识别方法、装置、电子设备及可读存储介质。

背景技术：

1、光学字符识别(optical character recognition，ocr)是指对包含文本信息的图像进行分析识别处理，获取图像中的文本信息的过程。

2、ocr技术被应用于各种场景中，待识别的图像也多种多样。目前，通常使用文本行识别方法对图像进行识别。但是，若图像中包含的元素较复杂多样，文字布局不规则，可能无法检测到规则的文本行，使得ocr识别的难度较大，准确性也较低。

技术实现思路

1、本技术实施例的目的在于提供一种文字识别方法、装置、电子设备及可读存储介质，解决了现有技术中文字识别准确性较低的问题。

2、第一方面，本技术实施例提供一种文字识别方法，包括：

3、获取待识别图像；

4、确定所述待识别图像中的文字连通区域；

5、在所述文字连通区域内的字符排列满足预设条件的情况下，对所述文字连通区域进行基于文本行的文字识别，得到所述文字连通区域中的文本信息；

6、在所述文字连通区域内的字符排列不满足所述预设条件的情况下，对所述文字连通区域进行基于单字符的文字识别，得到所述文字连通区域中的文本信息。

7、可选地，在确定所述待识别图像中的文字连通区域之后，所述方法还包括：

8、确定所述文字连通区域内的字符的位置信息；

9、根据所述文字连通区域内的字符的位置信息，确定所述字符对应的目标位置点；

10、对所述文字连通区域内的目标位置点进行直线拟合，得到直线拟合误差；

11、在所述直线拟合误差满足预设误差条件的情况下，确定所述文字连通区域内的字符排列满足预设条件；

12、在所述直线拟合误差不满足所述预设误差条件的情况下，确定所述文字连通区域内的字符排列不满足所述预设条件。

13、可选地，所述确定所述文字连通区域内的字符的位置信息，包括：

14、基于所述文字连通区域和所述待识别图像中的字符的位置信息，确定所述文字连通区域内的字符的位置信息。

15、可选地，在确定所述文字连通区域内的字符的位置信息之前，所述方法还包括：：

16、提取所述待识别图像对应于第一预设尺度的第一特征图；

17、基于所述第一特征图，确定所述待识别图像中的字符的位置信息。

18、可选地，所述确定所述待识别图像中的文字连通区域，包括：

19、提取所述待识别图像对应于第二预设尺度的第二特征图；

20、基于所述第二特征图中每个位置点的特征值，确定所述待识别图像对应的第三特征图；

21、对所述第三特征图进行连通区域分析，确定所述待识别图像中的文字连通区域。

22、可选地，所述基于所述第二特征图中每个位置点的特征值，确定所述待识别图像对应的第三特征图，包括：

23、在所述第二特征图中的第一位置点的特征值满足预设特征条件的情况下，将所述第三特征图中的第二位置点的值确定为第一预设值；

24、在所述第二特征图中的第一位置点的特征值不满足所述预设特征条件的情况下，将所述第三特征图中的第二位置点的值确定为第二预设值；

25、其中，所述第三特征图中的所述第二位置点与第二特征图中的所述第一位置点对应。

26、可选地，所述在所述文字连通区域内的字符排列不满足所述预设条件的情况下，对所述文字连通区域进行基于单字符的文字识别，得到所述文字连通区域中的文本信息，包括：

27、在所述文字连通区域内的字符排列不满足所述预设条件的情况下，对所述文字连通区域进行基于单字符的文字识别，得到所述文字连通区域中的文字序列；

28、对所述文字序列进行重排序，得到所述文字连通区域中的文本信息。

29、可选地，所述待识别图像满足以下至少一项：

30、所述待识别图像中的字符的字体包括两种或两种以上；

31、所述待识别图像中的字符的尺寸包括两种或两种以上；

32、所述待识别图像中的字符的排列方式包括两种或两种以上。

33、第二方面，本技术实施例提供一种文字识别装置，包括：

34、第一获取模块，用于获取待识别图像；

35、第一确定模块，用于确定所述待识别图像中的文字连通区域；

36、第一识别模块，用于在所述文字连通区域内的字符排列满足所述预设条件的情况下，对所述文字连通区域进行基于文本行的文字识别，得到所述文字连通区域中的文本信息；

37、第二识别模块，用于在所述文字连通区域内的字符排列不满足所述预设条件的情况下，对所述文字连通区域进行基于单字符的文字识别，得到所述文字连通区域中的文本信息。

38、可选地，所述装置还包括：

39、第二确定模块，用于确定所述文字连通区域内的字符的位置信息；

40、第三确定模块，用于根据所述文字连通区域内的字符的位置信息，确定所述字符对应的目标位置点；

41、拟合模块，用于对所述文字连通区域内的目标位置点进行直线拟合，得到直线拟合误差；

42、第一判断模块，用于在所述直线拟合误差满足预设误差条件的情况下，确定所述文字连通区域内的字符排列满足预设条件；

43、第二判断模块，用于在所述直线拟合误差不满足所述预设误差条件的情况下，确定所述文字连通区域内的字符排列不满足所述预设条件。

44、可选地，所述第二确定模块，用于：

45、基于所述文字连通区域和所述待识别图像中的字符的位置信息，确定所述文字连通区域内的字符的位置信息。

46、可选地，所述装置还包括：

47、提取模块，用于提取所述待识别图像对应于第一预设尺度的第一特征图；

48、第四确定模块，用于基于所述第一特征图，确定所述待识别图像中的字符的位置信息。

49、可选地，所述第一确定模块包括：

50、提取单元，用于提取所述待识别图像对应于第二预设尺度的第二特征图；

51、第一确定单元，用于基于所述第二特征图中每个位置点的特征值，确定所述待识别图像对应的第三特征图；

52、分析单元，用于对所述第三特征图进行连通区域分析，确定所述待识别图像中的文字连通区域。

53、可选地，所述第一确定单元包括：

54、第一确定子单元，用于在所述第二特征图中的第一位置点的特征值满足预设特征条件的情况下，将所述第三特征图中的第二位置点的值确定为第一预设值；

55、第二确定子单元，用于在所述第二特征图中的第一位置点的特征值不满足所述预设特征条件的情况下，将所述第三特征图中的第二位置点的值确定为第二预设值；

56、其中，所述第三特征图中的所述第二位置点与第二特征图中的所述第一位置点对应。

57、可选地，所述第二识别模块包括：

58、识别单元，用于在所述文字连通区域内的字符排列不满足所述预设条件的情况下，对所述文字连通区域进行基于单字符的文字识别，得到所述文字连通区域中的文字序列；

59、排序单元，用于对所述文字序列进行重排序，得到所述文字连通区域中的文本信息。

60、可选地，所述待识别图像满足以下至少一项：

61、所述待识别图像中的字符的字体包括两种或两种以上；

62、所述待识别图像中的字符的尺寸包括两种或两种以上；

63、所述待识别图像中的字符的排列方式包括两种或两种以上。

64、第三方面，本技术实施例提供了一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上第一方面所述的文字识别方法的步骤。

65、第四方面，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上第一方面所述的文字识别方法的步骤。

66、本技术实施例中，以文字连通区域为单位对待识别图像进行文字识别，并基于文字连通区域内字符排列的特点对应选择文字识别算法进行文字识别。在文字连通区域内字符排列规则时，对文字连通区域进行基于文本行的文字识别，能够快速得到文字连通区域内的文本信息；在文字连通区域内字符排列不规则时，对文字连通区域进行基于单字符的文字识别，结合文字连通区域内的字符具有关联性这一特点，能够降低单字符识别的字符关系后处理的复杂度，提高文字识别的准确性和效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贾千文郑慧冯俊兰邓超
技术所有人：中国移动通信集团有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。