图像中数字的识别方法、装置及设备的制造方法

文档序号:9579633阅读:639来源:国知局
图像中数字的识别方法、装置及设备的制造方法
【技术领域】
[0001] 本公开涉及通信领域,尤其涉及图像中数字的识别方法、装置及设备。
【背景技术】
[0002] 随着科学技术的快速发展,图像识别的应用也越来越广泛,而且深度卷积神经网 络的进一步发展和广泛应用,使得图像识别的准确率有了非常大的提升。
[0003] 相关技术中,对图像中的数字进行识别时,可以通过以下步骤进行:步骤A:视频 图像文字区域粗定位:通过计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分 割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域 分析、文字行分割和剔除规则分析定位候选文字区域;步骤B:视频图像文字区域定位验 证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否 有文字,剔除未检测文字的候选文字区域。

【发明内容】

[0004] 为克服相关技术中存在的问题,本公开提供一种图像中数字的识别方法、装置及 设备。
[0005] 根据本公开实施例的第一方面,提供一种图像中数字的识别方法,包括:
[0006] 从所述图像中获取包含数字字符的待处理图像;
[0007] 对所述待处理图像进行二值化处理,得到二值化图像;
[0008] 从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域 图像;
[0009] 确定所述数字区域图像中各数字字符所占图像宽度;
[0010] 根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。 [0011] 由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图 像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字 符精确的进行分割,提高了对数字字符识别的准确性。
[0012] 结合第一方面,在第一方面的第一种可能的实现方式中,所述二值化图像为N行Q 列像素的图像;所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得 到数字区域图像,包括:
[0013] 从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为 前景像素值的个数进行统计,若第η行的个数小于预设阈值且第n+1行的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第1行~第η行的像素;其中,η为小于或等 于Ν的整数;
[0014] 从二值化图像的第Ν行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为 前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或 等于N的整数;
[0015] 从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为 前景像素值的个数进行统计,若第P列的个数小于预设阈值且第P+1列的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第1列~第P行列的像素;其中,P为小于或 等于Q的整数;
[0016] 从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为 前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+Ι列的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第q+Ι列~第Q列的像素;其中,q为小于或 等于Q的整数。
[0017] 通过去除数字字符所在像素区域周围的像素区域,使获得的数字区域图像更准 确,从而可以提高数字字符识别的精确度。
[0018] 结合第一方面,在第一方面的第二种可能的实现方式中,所述从所述二值化图像 中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括:
[0019] 根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
[0020] 根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述 数字区域图像的前景像素的中心。
[0021] 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式 中,所述根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置,包括:
[0022] 根据公式^^ 计算所述前景像素的重心的横坐标; N ,
[0023] 根据公式计算所述前景像素的重心的纵坐标;
[0024] 其中,(Wx,Wy)为所述前景像素的重心的坐标,Ν为所述数字区域图像中前景像素 的总数,Iay)表示坐标(x,y)处的像素;
[0025] 相应的,根据所述重心位置,对所述数字区域图像进行裁剪,包括:
[0026] 以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的 边进行裁剪,使重心位于所述数字区域图像的中心位置。
[0027] 利用前景像素的重心位置对数字区域图像的边界进行优化,使获得的数字区域图 像更准确,从而可以提高数字字符识别的精确度。
[0028] 结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式, 在第一方面的第四种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图 像宽度,包括:
[0029] 对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景 像素的个数进行统计;
[0030] 确定各列像素中所述个数连续低于预设阈值的k列像素;
[0031] 计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述 各数字字符所占的图像宽度;
[0032] 其中,k为正整数。
[0033] 通过获取小数点所占的图像宽度,从而获知各个数字字符所占的图像宽度,使得 确定数字区域图像中各数字字符所占图像宽度的方式较简单,从而提高了对数字字符识别 的效率。
[0034] 结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式, 在第一方面的第五种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图 像宽度,包括:
[0035] 对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像 中的前景像素的个数进行统计;
[0036] 确定各列像素中所述个数连续低于预设阈值的k列像素;
[0037] 计算所述k列像素所占的宽度;
[0038] 确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
[0039] 根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符 所占的图像宽度;
[0040] 其中,k为正整数。
[0041] 通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的 图像宽度,可以提高每个数字字符图像宽度确定的准确度。
[0042] 根据本公开实施例的第二方面,提供一种图像中数字的识别装置,包括:
[0043] 获取模块,被配置为从所述图像中获取包含数字字符的待处理图像;
[0044] 处理模块,被配置为对所述待处理图像进行二值化处理,得到二值化图像;
[0045] 去除模块,被配置为从所述二值化图像中去除数字字符所在像素区域周围的像素 区域,得到数字区域图像;
[0046] 确定模块,被配置为确定所述数字区域图像中各数字字符所占图像宽度;
[0047] 分割模块,被配置为根据所述图像宽度对所述数字区域图像进行分割,得到单个 数字字符的图像。
[0048] 结合第二方面,在第二方面的第一种可能的实现方式中,所述二值化图像为N行Q 列像素的图像;所述去除模块包括:
[0049] 第一扫描子模块,被配置为从二值化图像的第1行开始进行正序逐行像素扫描, 并对所扫描行的像素值中为前景像素值的个数进行统计,若第η行的个数小于预设阈值且 第η+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第η行 的像素;其中,η为小于或等于Ν的整数;
[0050] 第二扫描子模块,被配置为从二值化图像的第Ν行开始进行倒序逐行像素扫描, 并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且 第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N 行的像素;其中,m为小于或等于N的整数;
[0051] 第三扫描子模块,被配置为从二值化图像的第1列开始进行正序逐列像素扫描, 并对所扫描列的像素值中为前景像素值的个数进行统计,若第P列的个数小于预设阈值且 第P+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第P行 列的像素;其中,P为小于或等于Q的整数;
[0052] 第四扫描子模块,被配置为从二值化图像的第Q列开始进行倒序逐列像素扫描, 并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且 第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
[0053] 结合第二方面,在第二方面的第二种可能的实现方式中,所述装置还包括:
[0054] 计算模块,被配置为根据所述数字区域图像中的前景像素,计算所述前景像素的 重心位置;
[0055] 裁剪模块,被配置为根据所述重心位置,对所述数字区域图像进行裁剪,以使所述 重心位置位于所述数字区域图像的前景像素的中心。
[0056] 结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式 中,所述计算模块包括:
[0057] 第一计算子模块,被配置为根据公式% 'Σ(χ^、>>])计算所述前景像素的 重心的横坐标;
[0058] 第二计算子模块,被配置为根据公式% 计算所述前景像素的 9 重心的纵坐标;
[0059] 其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素 的总数,Iay)表示坐标(x,y)处的像素;
[0060] 所述裁剪模块包括:
[0061] 裁剪子模块,被配置为以距离所述重心位置较近的边为基准,根据较近边距离重 心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
[0062] 结合第二方面、第二方面的第一种或第二方面的第三种任一种可能的实现方式, 在第二方面的第四种可能的实现方式中,所述确定模块包括:
[0063] 第五扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫 描;
[0064] 第一统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
[0065] 第一确定子模块,被配置为确定各列像素中所述个数连续低于预设阈值的k列像 素;
[0066] 第三计算子模块,被配置为计算所述k列像素所占的图像宽度,将所述k列像素所 占的图像宽度确定为所述各数字字符所占的图像宽度;
[0067] 其中,k为正整数。
[0068] 结合第二方面、第二方面的第一种或第二方面的第三种任一种可能的实现方式, 在第二方面的第五种可能的实现方式中,所述确定模块包括:
[0069] 第六扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫 描;
[0070] 第二统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
[0071] 第二确定子模块,被配置为确定
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1