图像字符识别模型生成和竖列字符图像识别方法和装置与流程

文档序号:11134706阅读:来源:国知局

技术特征:

1.一种图像字符识别模型生成方法,其特征在于,包括:

生成旋转行字符训练样本,其中,所述旋转行字符训练样本包括:旋转行字符图像以及与所述旋转行字符图像对应的预期字符识别结果,所述旋转行字符图像中的各字符单元与标准行字符图像中各字符单元相差90度;

使用所述旋转行字符训练样本对设定神经网络进行训练,生成图像字符识别模型。

2.根据权利要求1所述的方法,其特征在于,所述字符单元包括下述至少一项:中文字、日文字、英文字母以及数字。

3.根据权利要求1或2所述的方法,其特征在于,生成旋转行字符训练样本包括:

获取标准行字符图像样本中的标准行字符图像作为目标操作图像;

根据所述目标操作图像中每个字符单元的标注位置,对所述目标操作图像进行裁剪,并生成与所述目标操作图像中各字符单元对应的字符单元图片集合;

分别将所述字符单元图片集合中的各字符单元图片进行90度旋转;

将旋转后所述字符单元图片按照裁剪顺序进行拼接,生成旋转行字符图像;

根据拼接生成的所述旋转行字符图像,以及与所述目标操作图像对应的预期字符识别结果,生成所述旋转行字符训练样本。

4.根据权利要求1或2所述的方法,其特征在于,生成旋转行字符训练样本包括:

将设定字符单元输入至竖列字符图片生成工具中,生成标准竖列字符图像;

将所述标准竖列字符图像作为一个整体进行90度旋转,生成旋转行字符图像作为目标操作图像;

将所述设定字符单元作为所述目标操作图像的预期字符识别结果,生成所述旋转行字符训练样本。

5.根据权利要求3或4所述的方法,其特征在于,所述90度旋转包括:90度顺时针旋转,和/或90度逆时针旋转;

所述设定神经网络包括循环神经网络。

6.一种竖列字符图像识别方法,其特征在于,包括:

将待识别竖列字符图像作为一个整体进行90度旋转,生成旋转待识别图像;

将所述旋转待识别图像输入至图像字符识别模型中,其中,所述图像字符识别模型由旋转行字符图像训练样本训练设定神经网络模型生成,所述旋转行字符训练样本包括:旋转行字符图像以及与所述旋转行字符图像对应的预期字符识别结果,所述旋转行字符图像中的各字符单元与标准行字符图像中各字符单元相差90度;

根据所述图像字符识别模型的输出,确定与所述待识别竖列字符图像对应的竖列字符识别结果。

7.根据权利要求6所述的方法,其特征在于,在将所述旋转待识别图像输入至图像字符识别模型中之前,还包括:

根据所述图像字符识别模型的模型参数,对所述旋转待识别图像进行尺寸归一化处理。

8.根据权利要求6或7所述的方法,其特征在于,根据所述图像字符识别模型的输出,确定与所述待识别竖列字符图像对应的竖列字符识别结果包括:

获取所述图像字符识别模型的输出结果作为行字符识别结果,并在所述旋转待识别图像中识别各字符单元的显示位置;

根据各字符单元在所述旋转待识别图像与所述待识别竖列字符图像中显示位置,确定所述行字符识别结果在所述待识别竖列字符图像中的显示位置;

根据所述行字符识别结果在所述待识别竖列字符图像中的显示位置以及所述行字符识别结果,生成所述竖列字符识别结果。

9.一种图像字符识别模型生成装置,其特征在于,包括:

训练样本生成模块,用于生成旋转行字符训练样本,其中,所述旋转行字符训练样本包括:旋转行字符图像以及与所述旋转行字符图像对应的预期字符识别结果,所述旋转行字符图像中的各字符单元与标准行字符图像中各字符单元相差90度;

图像字符识别模型生成模块,用于使用所述旋转行字符训练样本对设定神经网络进行训练,生成图像字符识别模型。

10.根据权利要求9所述的装置,其特征在于,所述字符单元包括下述至少一项:中文字、日文字、英文字母以及数字。

11.根据权利要求9或10所述的装置,其特征在于,所述训练样本生成模块包括:

目标操作图像获取单元,用于获取标准行字符图像样本中的标准行字符图像作为目标操作图像;

字符单元图片集合生成单元,用于根据所述目标操作图像中每个字符单元的标注位置,对所述目标操作图像进行裁剪,并生成与所述目标操作图像中各字符单元对应的字符单元图片集合;

字符单元图片旋转单元,用于分别将所述字符单元图片集合中的各字符单元图片进行90度旋转;

旋转行字符图像生成单元,用于将旋转后所述字符单元图片按照裁剪顺序进行拼接,生成旋转行字符图像;

旋转行字符训练样本生成单元,用于根据拼接生成的所述旋转行字符图像,以及与所述目标操作图像对应的预期字符识别结果,生成所述旋转行字符训练样本。

12.根据权利要求9或10所述的装置,其特征在于,所述训练样本生成模块包括:

标准竖列字符图像生成单元,用于将设定字符单元输入至竖列字符图片生成工具中,生成标准竖列字符图像;

竖列字符目标操作图像生成单元,用于将所述标准竖列字符图像作为一个整体进行90度旋转,生成旋转行字符图像作为目标操作图像;

竖列字符训练样本生成单元,用于将所述设定字符单元作为所述目标操作图像的预期字符识别结果,生成所述旋转行字符训练样本。

13.根据权利要求11或12所述的装置,其特征在于,所述90度旋转包括:90度顺时针旋转,和/或90度逆时针旋转;

所述设定神经网络包括循环神经网络。

14.一种竖列字符图像识别装置,其特征在于,包括:

旋转待识别图像生成模块,用于将待识别竖列字符图像作为一个整体进行90度旋转,生成旋转待识别图像;

旋转待识别图像输入模块,用于将所述旋转待识别图像输入至图像字符识别模型中,其中,所述图像字符识别模型由旋转行字符图像训练样本训练设定神经网络模型生成,所述旋转行字符训练样本包括:旋转行字符图像以及与所述旋转行字符图像对应的预期字符识别结果,所述旋转行字符图像中的各字符单元与标准行字符图像中各字符单元相差90度;

竖列字符识别结果确定模块,用于根据所述图像字符识别模型的输出,确定与所述待识别竖列字符图像对应的竖列字符识别结果。

15.根据权利要求14所述的装置,其特征在于,在所述旋转待识别图像输入模块之前,还包括:

图像尺寸归一化模块,用于根据所述图像字符识别模型的模型参数,对所述旋转待识别图像进行尺寸归一化处理。

16.根据权利要求14或15所述的装置,其特征在于,所述竖列字符识别结果确定模块包括:

字符单元显示位置识别单元,用于获取所述图像字符识别模型的输出结果作为行字符识别结果,并在所述旋转待识别图像中识别各字符单元的显示位置;

行字符识别结果显示位置确定单元,用于根据各字符单元在所述旋转待识别图像与所述待识别竖列字符图像中显示位置,确定所述行字符识别结果在所述待识别竖列字符图像中的显示位置;

竖列字符识别结果生成单元,用于根据所述行字符识别结果在所述待识别竖列字符图像中的显示位置以及所述行字符识别结果,生成所述竖列字符识别结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1