英文字母识别方法、客户端、服务器及计算机可读存储介质与流程

文档序号：31562824发布日期：2022-09-20 18:03阅读：49来源：国知局

1.本发明涉及一种ocr系统，尤其涉及ocr系统中的英文字母识别方法、客户端、服务器及计算机可读存储介质。

背景技术：

2.ocr(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程。目前，ocr文字识别如何除错提高识别正确率，尤其对应英文字母，是ocr最重要的课题。
3.目前，ocr文字识别在对于字母的识别过程中，由于一些英文字母经常粘连在一起，例如：mi、ru、rz、rx等字母，往往容易出错，导致识别率较低。

技术实现要素：

4.本发明提供了一种英文字母识别方法、客户端、服务器及计算机可读存储介质，可以有效解决上述问题。
5.本发明是这样实现的：
6.本发明提供一种基于离线ocr系统的英文字母识别方法，包括：
7.s1，获取粘连的英文字母块的灰度图像；
8.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
9.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
10.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
11.作为进一步改进的，在步骤s1中，所述获取粘连的英文字母块的灰度图像的步骤包括：
12.s11，获取待识别的英文字母图像；
13.s12，获取粘连的英文字母块的位置信息，并将粘连的英文字母块切割开来获取粘连的英文字母块图像；
14.s13，对所述粘连的英文字母块图像进行灰度处理获取所述灰度图像。
15.作为进一步改进的，在步骤s2中，所述通过大津法对所述灰度图像求出该灰度图像的二值化阈值的步骤包括：
16.s21，获取所述灰度图像的全局均值mg，其中，所述全局均值mg满足：
17.p1*m1+p2*m2＝mg(1)，且p1+p2＝1(2)，其中，m1、
18.m2分别为所述灰度图像中两类像素的均值，且p1、p2分别为所述两类像素的的概率；
19.s22，将类间方差表达式：σ2＝p1(m
1-mg)2+p2(m
2-mg)2(3)，代入公式(1)进行化简得到：σ2＝p1p2(m
1-m2)2(4)；
20.s23，获取公式(4)的最大化的灰度级k，从而得到二值化阈值。
21.作为进一步改进的，在步骤s4中，所述增大所述二值化阈值的步骤为：
22.每次以自然数n依次增加所述二值化阈值，其中，n为3～8。
23.作为进一步改进的，在步骤s4中，所述增大所述二值化阈值的步骤为：
24.每次以自然数n依次增加所述二值化阈值，其中，n为5。
25.本发明进一步提供一种客户端，所述客户端包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如下步骤：
26.s1，获取粘连的英文字母块的灰度图像；
27.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
28.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
29.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
30.本发明进一步提供一种服务器，所述服务器包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如下步骤：
31.s1，获取粘连的英文字母块的灰度图像；
32.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
33.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
34.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
35.本发明进一步提供一种计算机可读存储介质，所述计算机可读存储介质上存储有数据处理程序，所述数据处理程序可被一个或者多个处理器执行，以实现上述的英文字母识别方法的步骤。
36.本发明的有益效果是：本发明提供的英文字母识别方法、客户端、服务器及计算机可读存储介质，通过粘连的英文字母块进行灰度化处理、获取二值化阈值，并对图像进行二值化处理，最后通过求取连通域，从而最终切割出高自信度的英文。该识别方法可以对一些英文字母经常粘连在一起进行有效的切割及识别率，提高英文字母的整体识别率。
附图说明
37.为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
38.图1是本发明实施例提供的英文字母识别方法的方法流程图。
39.图2是本发明实施例提供的英文字母识别方法中对粘连的英文字母块进行灰度处理后的灰度图像。
40.图3为本发明实施例提供的英文字母识别方法中通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理后的图像。
41.图4为本发明实施例提供的英文字母识别方法中以自然数5增加所述二值化阈值，
并将所述粘连的英文字母块的灰度图像进行二值化处理的图像。
42.图5为本发明实施例提供的英文字母识别方法中以自然数5*2增加所述二值化阈值，并将所述粘连的英文字母块的灰度图像进行二值化处理的图像。
具体实施方式
43.为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。
44.在本发明的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
45.参照图1所示，本发明实施例提供一种基于离线ocr系统的英文字母识别方法，包括：
46.s1，获取粘连的英文字母块的灰度图像；
47.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
48.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
49.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
50.请参照图2，在步骤s1中，所述获取粘连的英文字母块的灰度图像的步骤包括：
51.s11，获取待识别的英文字母图像；
52.s12，获取粘连的英文字母块的位置信息，并将粘连的英文字母块切割开来获取粘连的英文字母块图像；
53.s13，对所述粘连的英文字母块图像进行灰度处理获取所述灰度图像。其中，图2为粘连的英文字母块图像“mi”进行灰度处理后的灰度图像。
54.作为进一步改进的，在步骤s2中，所述通过大津法对所述灰度图像求出该灰度图像的二值化阈值的步骤包括：
55.s21，获取所述灰度图像的全局均值mg，其中，所述全局均值mg满足：
56.p1*m1+p2*m2＝mg(1)，且p1+p2＝1(2)，其中，m1、
57.m2分别为所述灰度图像中两类像素的均值，且p1、p2分别为所述两类像素的的概率；
58.s22，将类间方差表达式：σ2＝p1(m
1-mg)2+p2(m
2-mg)2(3)，代入公式(1)进行化简得到：σ2＝p1p2(m
1-m2)2(4)；
59.s23，获取公式(4)的最大化的灰度级k，从而得到二值化阈值。
60.其中，在步骤s21中，大津法算法又叫最大类间方差法、最大类间阈值法(otsu)。其基本思想是，用一个阈值将图像中的数据分为两类，一类中图像的像素点的灰度均小于这个阈值，另一类中的图像的像素点的灰度均大于或者等于该阈值。在本发明中，所述大津法算法，其假设是存在阈值th将灰度图像所有像素分为两类c1(小于th)和c2(大于th)，则这两类像素各自的均值就为m1、m2，图像全局均值为mg。
61.在步骤s3中，图3为通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理后的图像。从图中可以看出，通过二值化处理mi底部还是处于粘连状态，字母i底部的联通域还不能识别出高自信度，即字母mi还是粘连在一起。
62.作为进一步改进的，在步骤s4中，所述增大所述二值化阈值的步骤为：
63.每次以自然数n依次增加所述二值化阈值，其中，n为3～8。在其中一个实施例中，其中，n为5。
64.请参见图4，图4为以自然数5增加所述二值化阈值，并将所述粘连的英文字母块的灰度图像进行二值化处理的图像。从图中可以看出，字母i底部的联通域还不能识别出高自信度，即字母mi还是粘连在一起；但，相对于图3中已经有所改善。
65.请参见图5，图5为以自然数5*2增加所述二值化阈值，并将所述粘连的英文字母块的灰度图像进行二值化处理的图像。从图中可以看出，字母i底部的联通域已经可以识别出高自信度，即字母mi已经可实现分离及准确识别。
66.本发明进一步提供一种客户端，所述客户端包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如下步骤：
67.s1，获取粘连的英文字母块的灰度图像；
68.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
69.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
70.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
71.所述客户端可以为手机、扫描仪、具有扫描功能的打印机、pad或其他便携式电子扫描设备等。
72.本发明进一步提供一种服务器，所述服务器包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如下步骤：
73.s1，获取粘连的英文字母块的灰度图像；
74.s2，通过大津法对所述灰度图像求出该灰度图像的二值化阈值；
75.s3，通过所述二值化阈值将所述粘连的英文字母块的灰度图像进行二值化处理；
76.s4，对二值化的图像求取联通域，使每个联通域都能识别出高自信度的英文则切割完成，否则增大所述二值化阈值，并进入步骤s3。
77.本发明进一步提供一种计算机可读存储介质，所述计算机可读存储介质上存储有数据处理程序，所述数据处理程序可被一个或者多个处理器执行，以实现上述的英文字母识别方法的步骤。
78.在本发明所提供的几个实施方式中，应该理解到，所揭露的系统和方法，可以通过
其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。
79.另外，在本发明各个实施方式中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
80.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random accessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
81.以上所述仅为本发明的优选实施方式而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐金棲谢发炎吴涛
技术所有人：厦门喵宝科技有限公司
我是此专利的发明人

上一篇：报文处理的方法、网络设备及控制器与流程
上一篇：改善多晶硅膜层干法刻蚀速率稳定性的方法及刻蚀腔室与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。