答题卡字符串识别方法、装置、终端和计算机存储介质与流程

文档序号：24287340发布日期：2021-03-17 00:34阅读：来源：国知局

技术特征：

1.一种答题卡字符串识别方法，其特征在于，包括：

对答题卡图像进行文本识别，获取文本内容信息以及文本位置信息；

根据所述文本内容信息以及文本位置信息定位待识别的字符串，以确定字符串所处的区域；

基于深度学习模型对所述字符串所处的区域进行识别，以获取所述字符串。

2.根据权利要求1所述的答题卡字符串识别方法，其特征在于，所述根据所述文本内容信息以及文本位置信息定位待识别的字符串，以确定字符串所处的区域，具体包括：

利用文本模版与所述文本内容信息进行匹配，根据匹配到的文本内容信息所对应的文本位置信息确定字符串所处的区域的坐标。

3.根据权利要求1所述的答题卡字符串识别方法，其特征在于，所述基于深度学习模型对所述字符串所处的区域进行识别，以获取所述字符串，具体包括：

根据所述字符串所处的区域的坐标，在已填涂的答题卡的图像中截取相应的区域图像；

对所述区域图像进行水平投影和垂直投影，根据投影结果确定所述字符串中字符的坐标；

根据所述字符的坐标，在所述区域图像中截取相应的字符图像；

根据基于深度学习的识别模型，识别所述字符图像；

合并识别结果以获取所述字符串。

4.根据权利要求3所述的答题卡字符串识别方法，其特征在于，所述对所述区域图像进行水平投影和垂直投影，根据投影结果确定所述字符串中字符的坐标，具体包括：

对所述区域图像进行二值化处理，得到二值图；

对所述二值图进行水平投影和垂直投影，生成水平投影数据和垂直投影数据；

根据水平投影数据确定限制字符填写位置的框线在水平方向上的坐标区域，根据垂直投影数据确定限制字符填写位置的框线在垂直方向上的坐标区域，所述水平方向的坐标区域对应于所述框线的上边界和下边界，所述垂直方向的坐标区域对应于所述框线的左边界和右边界；

根据所述上边界、所述下边界、所述左边界和所述右边界确定所述框线的坐标，

其中，所述水平投影用于计算所述二值图在水平方向上的像素点个数，所述垂直投影用于计算所述二值图在垂直方向上的像素点个数，所述框线的坐标即所述字符的坐标，用于表示所述字符所处的位置。

5.根据权利要求4所述的答题卡字符串识别方法，其特征在于，还包括：

根据所述框线的坐标在所述二值图中截取框线区域图像；

确定所述框线区域图像中不含有字符，则删除所述区域图像。

6.根据权利要求1至5中任一项所述的答题卡字符串识别方法，其特征在于，所述对答题卡图像进行文本识别，获取文本内容信息以及文本位置信息，具体包括：

根据光学字符识别模型识别答题卡图像，获取空白答题卡的文本内容信息以及文本位置信息。

7.根据权利要求1至5中任一项所述的答题卡字符串识别方法，其特征在于，所述字符串包括考号，所述深度学习模型包括数字识别模型。

8.一种答题卡字符串识别装置，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序，所述程序被所述处理器执行时能够实现如权利要求1至7中任一项所述的答题卡字符串识别方法限定的步骤。

9.一种终端，其特征在于，包括：

如权利要求8所述的答题卡字符串识别装置。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被执行时，实现如权利要求1至7中任一项所述的答题卡字符串识别方法的步骤。

技术总结
本发明提供了一种答题卡字符串识别方法、装置、终端和计算机可读存储介质，其中，答题卡字符串识别方法包括：对答题卡图像进行文本识别，获取文本内容信息以及文本位置信息；根据文本内容信息以及文本位置信息定位待识别的字符串，以确定字符串所处的区域；基于深度学习模型对字符串所处的区域进行识别，以获取字符串。通过本发明的技术方案，利用文本识别技术，获取答题卡中目标字符串的位置信息，而不需要定位块进行定位，能够兼容各种形式的答题卡，对存在目标字符串的图像区域进行水平投影和垂直投影，获取每个字符串中每个字符的位置从而进行精确识别，抗干扰能力强，识别率高。

技术研发人员：曾志辉;邢军华;欧阳一村;许文龙;贺涛
受保护的技术使用者：深圳中兴网信科技有限公司
技术研发日：2019.09.16
技术公布日：2021.03.16

完整全部详细技术资料下载

当前第2页1 2