文本图像的校正方法和装置制造方法

文档序号:6638997阅读:114来源:国知局
文本图像的校正方法和装置制造方法
【专利摘要】本发明实施例提供一种文本图像的校正方法和装置,通过本发明实施例提供的文本图像的校正方法和装置在进行文本图像的校正过程中,考虑到文本图像中各个区块对应的梯度直方图可以准确的反映各个区块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可以获取准确率较高的校正图像。
【专利说明】文本图像的校正方法和装置

【技术领域】
[0001] 本发明实施例设及计算机【技术领域】,尤其设及一种文本图像的校正方法和装置。

【背景技术】
[0002] 常见的,人们在需要记录文档中的信息时,通常使用手机的摄像头、数码相机等对 文档进行拍摄,可快速便捷的记录了文档中的信息,但通常由于文档的倾斜、积厚、摄像头 的摄像面的倾斜等原因,导致获取的文本图像中各个字符发生了形变,不便于人们查看;为 了解决文档中的文本在文本图像中形变,通常采用W下四个步骤进行校正;1、文本行基线 跟踪,2、竖直方向估计,3、建立=维网格,实现=维重建,4、根据=维重建的结果完成校正。 在文本行基线跟踪步骤中,首先随机选取种子点,然后从W种子点为中屯、的区块开始,在 间隔点的上下左右不同位置和方向上寻找特征相似的区域,实现向种子点的左边和右边探 测文本行基线的目的;在竖直方向估计步骤中,假设图像中竖直方向的笔画数最多,设计最 优化算法找到包含竖直笔画的区域集合,通过该集合来估计垂直方向,在建立=维网格的 步骤中,假设二维坐标在=维空间下满足平行四边形约束,计算像素点的=维坐标,实现= 维重建。最后在根据=维重建的结果完成校正的步骤中,是利用=维网格坐标和文档图像 坐标的对应关系实现几何校正。
[0003] 但采用上述方法校正文本图像的过程中发现,文本行跟踪步骤中,是基于像素点 所在区块的特征相似度形成文本行,而基于像素点的操作的复杂度非常高,影响了校正的 实用性;另一方面,该方案是基于拉了语系中竖直笔画占多数的情况所设计的,但对中日韩 文字来说,存在水平笔画占多数的情况,当遇到水平笔画占多数的情况时,竖直笔画方向估 计步骤便会产生了较大的误差,大大降低了校正准确率。


【发明内容】

[0004] 本发明实施例提供一种文本图像的校正方法和装置,用于优化文本图像的校正过 程,提升校正准确率。
[0005] 第一方面,本发明实施例提供一种文本图像的校正方法,包括:
[0006] 确定文本图像中各个文本行的文本行基线,并获取文本图像中各个区块对应的梯 度直方图;所述文本行基线是根据所述文本图像中各个像素点在所述文本图像中的第一坐 标和灰度确定的;所述梯度直方图是根据所述区块内各个像素点的梯度向量确定的;所述 区块是通过对所述文本图像进行分区获得的,所述文本图像中各个区块包括的像素点的总 和为所述文本图像的全部像素点;所述文本图像中任意两个区块之间无相同的像素点;
[0007] 根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方图,确定 各个文本行基线上每一个像素点的竖直笔画方向;所述第一基线为所述文本行基线位于所 述第一基线所属的区块内的部分;
[000引根据每一个文本行基线和每一个文本行基线上每一个像素点的竖直笔画方向,在 所述文本图像中确定各个用于建立二维网格的各个像素点,并根据各个所述用于建立二维 网格的各个像素点建立二维网格;所述各个用于建立二维网格的各个像素点分别为所述二 维网格中各个四边形的各个顶点;
[0009] 根据所述二维网格中每一个四边形的各个顶点的第一坐标和S维空间下平行四 边形约束条件,确定=维网格;所述=维网格中每一个四边形与所述二维网格中每一个四 边形一一对应;所述S维网格中的四边形的各个顶点与该S维网格中的四边形对应的二维 网格中的四边形的各个顶点一一对应;
[0010] 根据所述S维网格中每一个四边形的每一个顶点的S维坐标,和所述二维网格中 每一个四边形的每一个顶点的第一坐标,确定待建立的校正文本图像的各个校正像素点与 所述文本图像中各个像素点的对应关系;
[0011] 根据所述对应关系,建立校正文本图像。
[0012] 结合第一方面,在第一实施方式中,确定文本图像中各个文本行基线,包括:
[0013] 采用形态学操作,获取二值化后的文本图像中的各个候选文本区域;
[0014] 根据各个候选文本区域的长度、高度W及长高比,确定各个文本行;
[0015] 获取各个文本行中屯、线及各个文本行的高度平均值;
[0016] 根据各个所述文本行中屯、线和高度平均值,确定各个文本行的上基线和下基线; 所述高度平均值是根据所述文本行中屯、线上各个像素点对应的文本行高度确定的。
[0017] 结合第一方面第一实施方式,在第二实施方式中,根据每一个区块内的第一基线 的延伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素点的竖直 笔画方向,包括:
[001引根据每一个区块对应的梯度直方图,确定每一个区块的第一角度;所述区块的第 一角度为该区块对应的梯度直方图中的最大统计值对应的量化角;
[0019] 根据每一个区块的第一角度和每一个区块内各个第一基线的延伸方向与水平方 向的夹角的平均值,确定各个区块的预测竖直笔画方向;
[0020] 根据各个区块的预测竖直笔画方向,确定各个文本行基线上每一个像素点的竖直 笔画方向;
[0021] 其中,所述各个区块中的第一区块的预测竖直笔画方向的确定方法包括:
[0022] 当第一区块的第一角度和第一区块内至少一个第一基线的延伸方向与水平方向 的夹角的平均值之差满足重合预设值时,确定所述第一区块的预测竖直笔画方向与水平方 向的夹角为所述第一区块的第一角度:
[0023] 当第一区块的第一角度和第一区块内至少一个第一基线的延伸方向与水平方向 的夹角的平均值之差满足垂直预设值时,确定所述第一区块的预测竖直笔画方向与水平方 向的夹角为所述第一区块的第一角度与90度的和;
[0024] 所述各个文本行基线上的各个像素点中的第一像素点的竖直笔画方向的确定方 法包括:
[0025] 确定所述第一像素点所属的区块;
[0026] 根据所述第一像素点所属的区块的预测竖直笔画方向与水平方向的夹角,和与所 述第一像素点所属的区块相邻的各个区块的预测竖直笔画方向与水平方向的夹角,确定所 述第一像素点的竖直笔画方向。
[0027] 结合第一方面第二实施方式,在第=实施方式中,根据每一个文本行基线和每一 个文本行基线上每一个像素点的竖直笔画方向,在所述文本图像中确定用于建立二维网格 的各个像素点,并根据所述用于建立二维网格的各个像素点建立二维网格,包括:
[002引建立形变坐标系,并确定各个文本行基线上各个像素点在所述形变坐标系中的形 变坐标;在所述形变坐标系中,当像素点i。中当q为1时,像素点i 1的形变坐标中的纵坐标 与像素点ii的第一坐标中的纵坐标相等;像素点i 1的形变坐标中的横坐标为像素点i 1到 像素点(i-l)i的距离与像素点(i-1) 1到形变坐标系中的坐标原点的距离的和;当像素点i。 中当q不为1时,像素点i。的形变坐标中的横坐标与像素点i。对应的交点的横坐标相同; 像素点i。对应的交点为像素点i。的虚拟竖线穿过的位于第q-1个文本行基线上的像素点; 像素点i。的虚拟竖线是沿像素点i。的竖直笔画方向延伸的;像素点i。的形变坐标中的纵 坐标是采用双线性插值法处理像素点(i-1)。和像素点(i+1)。的第一坐标中的纵坐标确定 的;其中,像素点i。表示第q个文本行基线上第i个像素点,i为不大于M的整数,q为不大 于N的整数,M为像素点i。所在的第q个文本行基线上像素点的总数,N文本图像中文本行 基线的总数;
[0029] 根据预设的划分步长,在各个文本行基线上确定用于划分各个文本行基线的划分 像素点;
[0030] 根据各个划分像素点的形变坐标和各个划分像素点的相邻像素点的形变坐标,采 用双线性插值法,确定划分像素点对应的各个修正后的形变坐标;所述划分像素点的相邻 像素点与该划分像素点相邻且位于同一个文本行基线上;
[0031] 根据各个划分像素点对应的修正后的形变坐标,确定各个用于建立二维网格的各 个像素点;
[0032] 根据各个用于建立二维网格的各个像素点建立二维网格。
[0033] 结合第一方面第=实施方式,在第四实施方式中,根据所述=维网格中每一个四 边形的每一个顶点的=维坐标,和所述二维网格中每一个四边形的每一个顶点的第一坐 标,确定待建立的校正文本图像的各个校正像素点与所述文本图像中各个像素点的对应关 系,包括:
[0034] 根据所述=维网格中每一个四边形的各个顶点的=维坐标,确定待建立的校正图 像中各个用于建立校正网格的校正像素点,并根据各个用于建立校正网格的各个校正像素 点建立校正网格;所述校正网格包括与所述=维网格中每一个四边形一一对应的各个校正 矩形;所述校正矩形中各个边的长度与该校正矩形对应的=维网格中的四边形的各个边的 长度一一相等;所述各个用于建立校正网格的校正像素点分别为所述校正网格中各个校正 矩形的各个顶点;
[0035] 根据校正网格中每一个校正矩形对应的所述S维网格中的四边形,确定校正网格 中每一个校正矩形对应的二维网格中的四边形;
[0036] 根据校正网格中每一个校正矩形的各个顶点在待建立的校正图像中的第二坐标 和校正网格中每一个校正矩形对应的二维网格中的四边形的各个顶点的第一坐标,确定待 建立的校正图像的各个校正像素点与所述文本图像中各个像素点的对应关系。
[0037] 结合第一方面第四实施方式,在第五实施方式中,根据所述对应关系,建立校正文 本图像,包括:
[003引根据待建立的校正图像的各个校正像素点与所述文本图像中各个像素点的对应 关系,确定待建立的校正图像的各个校正像素点对应的第一坐标;
[0039] 根据待建立的校正图像的各个校正像素点对应的第一坐标,确定待建立的校正图 像的各个校正像素点对应的文本图像中的各个像素点;
[0040] 根据待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点的灰 度,确定待建立的校正图像的各个校正像素点的灰度;
[0041] 根据待建立的校正图像的各个校正像素点的灰度建立校正文本图像。
[0042] 第二方面,本发明实施例提供一种文本图像的校正装置,包括:
[0043] 基线确定模块,用于确定文本图像中各个文本行的文本行基线,并获取文本图像 中各个区块对应的梯度直方图;所述文本行基线是根据所述文本图像中各个像素点在所述 文本图像中的第一坐标和灰度确定的;所述梯度直方图是根据所述区块内各个像素点的梯 度向量确定的;所述区块是通过对所述文本图像进行分区获得的,所述文本图像中各个区 块包括的像素点的总和为所述文本图像的全部像素点;所述文本图像中任意两个区块之间 无相同的像素点;
[0044] 笔画确定模块,用于根据每一个区块内的第一基线的延伸方向和每一个区块对应 的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向;所述第一基线为所 述文本行基线位于所述第一基线所属的区块内的部分;
[0045] 二维网格确定模块,用于根据每一个文本行基线和每一个文本行基线上每一个像 素点的竖直笔画方向,在所述文本图像中确定各个用于建立二维网格的各个像素点,并根 据各个所述用于建立二维网格的各个像素点建立二维网格;所述各个用于建立二维网格的 各个像素点分别为所述二维网格中各个四边形的各个顶点;
[0046] S维网格确定模块,用于根据所述二维网格中每一个四边形的各个顶点的第一坐 标和=维空间下平行四边形约束条件,确定=维网格;所述=维网格中每一个四边形与所 述二维网格中每一个四边形一一对应;所述=维网格中的四边形的各个顶点与该=维网格 中的四边形对应的二维网格中的四边形的各个顶点--对应;
[0047] 对应关系确定模块,用于根据所述S维网格中每一个四边形的每一个顶点的S维 坐标,和所述二维网格中每一个四边形的每一个顶点的第一坐标,确定待建立的校正文本 图像的各个校正像素点与所述文本图像中各个像素点的对应关系;
[0048] 建立模块,用于根据所述对应关系,建立校正文本图像。
[0049] 结合第二方面,在第一实施方式中,所述基线确定模块包括:
[0050] 候选文本区域确定单元,用于采用形态学操作,获取二值化后的文本图像中的各 个候选文本区域;
[0051] 文本行确定单元,用于根据各个候选文本区域的长度、高度W及长高比,确定各个 文本行;
[0052] 中屯、线确定单元,用于获取各个文本行中屯、线及各个文本行的高度平均值;
[0化3] 基线确定单元,用于根据各个所述文本行中屯、线和高度平均值,确定各个文本行 的上基线和下基线;所述高度平均值是根据所述文本行中屯、线上各个像素点对应的文本行 高度确定的。
[0化4] 结合第二方面第一实施方式,在第二实施方式中,笔画确定模块包括:
[0化5] 角度确定单元,用于根据每一个区块对应的梯度直方图,确定每一个区块的第一 角度;所述区块的第一角度为该区块对应的梯度直方图中的最大统计值对应的量化角;
[0056] 预测单元,用于根据每一个区块的第一角度和每一个区块内各个第一基线的延伸 方向与水平方向的夹角的平均值,确定各个区块的预测竖直笔画方向;
[0057] 笔画确定单元,用于根据各个区块的预测竖直笔画方向,确定各个文本行基线上 每一个像素点的竖直笔画方向;
[0化引其中,所述预测单元具体用于当第一区块的第一角度和第一区块内至少一个第一 基线的延伸方向与水平方向的夹角的平均值之差满足重合预设值时,确定所述第一区块的 预测竖直笔画方向与水平方向的夹角为所述第一区块的第一角度:
[0化9] 所述预测单元具体用于当第一区块的第一角度和第一区块内至少一个第一基线 的延伸方向与水平方向的夹角的平均值之差满足垂直预设值时,确定所述第一区块的预测 竖直笔画方向与水平方向的夹角为所述第一区块的第一角度与90度的和;
[0060] 所述笔画确定单元具体用于确定所述第一像素点所属的区块;
[0061] 所述笔画确定单元具体用于根据所述第一像素点所属的区块的预测竖直笔画方 向与水平方向的夹角,和与所述第一像素点所属的区块相邻的各个区块的预测竖直笔画方 向与水平方向的夹角,确定所述第一像素点的竖直笔画方向。
[0062] 结合第二方面第二实施方式,在第=实施方式中,二维网格确定模块包括:
[0063] 形变坐标系建立单元,用于建立形变坐标系,并确定各个文本行基线上各个像素 点在所述形变坐标系中的形变坐标;在所述形变坐标系中,当像素点i。中当q为1时,像素 点ii的形变坐标中的纵坐标与像素点i 1的第一坐标中的纵坐标相等;像素点i 1的形变坐 标中的横坐标为像素点ii到像素点(i-1) 1的距离与像素点(i-1) 1到形变坐标系中的坐标 原点的距离的和;当像素点i。中当q不为1时,像素点i。的形变坐标中的横坐标与像素点i。 对应的交点的横坐标相同;像素点i。对应的交点为像素点i。的虚拟竖线穿过的位于第q-1 个文本行基线上的像素点;像素点i。的虚拟竖线是沿像素点i。的竖直笔画方向延伸的;像 素点i。的形变坐标中的纵坐标是采用双线性插值法处理像素点(i-1)。和像素点(i+1)。的 第一坐标中的纵坐标确定的;其中,像素点i。表示第q个文本行基线上第i个像素点,i为 不大于M的整数,q为不大于N的整数,M为像素点i。所在的第q个文本行基线上像素点的 总数,N文本图像中文本行基线的总数;
[0064] 划分像素点确定单元,用于根据预设的划分步长,在各个文本行基线上确定用于 划分各个文本行基线的划分像素点;
[0065] 修正确定单元,用于根据各个划分像素点的形变坐标和各个划分像素点的相邻像 素点的形变坐标,采用双线性插值法,确定各个划分像素点对应的修正后的形变坐标;所述 划分像素点的相邻像素点与该划分像素点相邻且位于同一个文本行基线上;
[0066] 二维网格像素点确定单元,用于根据各个划分像素点对应的修正后的形变坐标, 确定各个用于建立二维网格的各个像素点;
[0067] 二维网格建立单元,用于根据各个用于建立二维网格的各个像素点建立二维网 格。
[0068] 结合第二方面第=实施方式,在第四实施方式中,对应关系确定模块,包括:
[0069] 校正网格建立单元,用于根据所述S维网格中每一个四边形的各个顶点的S维坐 标,确定待建立的校正图像中各个用于建立校正网格的校正像素点,并根据各个用于建立 校正网格的各个校正像素点建立校正网格;所述校正网格包括与所述=维网格中每一个四 边形一一对应的各个校正矩形;所述校正矩形中各个边的长度与该校正矩形对应的=维网 格中的四边形的各个边的长度一一相等;所述各个用于建立校正网格的校正像素点分别为 所述校正网格中各个校正矩形的各个顶点;
[0070] 二维网格四边形确定单元,用于根据校正网格中每一个校正矩形对应的所述=维 网格中的四边形,确定校正网格中每一个校正矩形对应的二维网格中的四边形;
[0071] 对应关系确定单元,用于根据校正网格中每一个校正矩形的各个顶点在待建立的 校正图像中的第二坐标和校正网格中每一个校正矩形对应的二维网格中的四边形的各个 顶点的第一坐标,确定待建立的校正图像的各个校正像素点与所述文本图像中各个像素点 的对应关系。
[0072] 结合第二方面第四实施方式,在第五实施方式中,建立模块包括:
[0073] 坐标确定单元,用于根据待建立的校正图像的各个校正像素点与所述文本图像中 各个像素点的对应关系,确定待建立的校正图像的各个校正像素点对应的第一坐标;
[0074] 像素点确定单元,用于根据待建立的校正图像的各个校正像素点对应的第一坐 标,确定待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点;
[0075] 灰度确定单元,用于根据待建立的校正图像的各个校正像素点对应的文本图像中 的各个像素点的灰度,确定待建立的校正图像的各个校正像素点的灰度;
[0076] 校正文本图像建立单元,用于根据待建立的校正图像的各个校正像素点的灰度建 立校正文本图像。
[0077] 本发明实施例提供的文本图像的校正方法和装置,由于文本图像中各个区块对应 的梯度直方图可W准确的反映各个区块中横竖笔画的分布情况,因此根据每一个区块内的 第一基线的延伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素 点的竖直笔画方向较为准确,从而可W获取准确率较高的校正图像。

【专利附图】

【附图说明】
[007引为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可W 根据该些附图获得其他的附图。
[0079] 图1为本发明文本图像的校正方法实施例一的流程示意图;
[0080] 图2为本发明实施例一中文本图像的示意图;
[0081] 图3为本发明文本图像的校正方法实施例二的流程示意图;
[0082] 图4为本发明实施例二中二值化后的文本图像的示意图;
[0083] 图5为本发明实施例二中候选文本区域的示意图;
[0084] 图6为本发明实施例二中二维网格的示意图;
[0085] 图7为本发明实施例二中S维网格的示意图;
[0086] 图8为本发明文本图像的校正装置实施例一的结构示意图;
[0087] 图9为本发明文本图像的校正装置实施例二的结构示意图。

【具体实施方式】
[008引为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0089] 图1为本发明文本图像的校正方法实施例一的流程示意图。如图1所示,本实施 例的执行主体为文本图像的校正装置,该校正装置由软件和/或硬件的方式实现,优选的, 该校正装置可W集成在具备捕获图像的设备中,如带有摄像头的手机、i化t具体校正方法 包括:
[0090] S101、确定文本图像中各个文本行基线,并获取文本图像中各个区块对应的梯度 直方图。
[0091] 所述文本行基线是根据所述文本图像中各个像素点在所述文本图像中的第一坐 标和灰度确定的;所述梯度直方图(Gradient Histogram)是根据所述区块内各个像素点 的梯度向量确定的;
[0092] 上述文本图像显示了在=维空间中客观存在的一个文档;该文档中的字符在该文 本图像中发生了形变;上述文本图像是集成了校正装置的设备通过摄像头拍摄文档获取 的,或者是用户通过拍摄工具拍摄到文本图像后,将该文本图像传输给集成了校正装置的 设备;或者集成了校正装置的设备通过网络获取服务器中存储的一张文本图像;
[0093] 上述第一坐标用于表示像素点在文本图像中的位置;举例来说,一个文本图像的 分辨率为480X240,则该文本图像中有480X240个像素点,该480X240个像素点排列成 480行、240列,则对应的,每个像素点在该文本图像中都有其对应的位置,即为该像素点在 文本图像中的第一坐标表示各个像素点在文本图像中的位置;例如位于文本图像四个顶点 的像素点的坐标分别为(1,1)、(1,240)、(480, 1)、(480, 240);
[0094] 在实施本实施例时,上述区块是通过对所述文本图像进行分区获得的,校正装置 对所述文本图像进行分区,可将文本图像划分为至少两个区块;相应的,每个区块均包含 了多个像素点,所述文本图像中各个区块包括的像素点的总和为所述文本图像的全部像素 点;所述文本图像中任意两个区块之间无相同的像素点;根据每个区块内各个像素点的梯 度向量可W确定各个区块的梯度直方图;每个区块的梯度直方图可W反映各个区块内的字 符的笔画方向(具体如横、竖笔画)的分布情况。
[0095] S102、根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方 图,确定各个文本行基线上每一个像素点的竖直笔画方向;
[0096] 所述第一基线为所述文本行基线位于所述第一基线所属的区块内的部分;
[0097] 图2为本发明实施例一中文本图像的示意图。如图2所示,一个文本图像中,一条 文本行基线10是由左至右连续的,但由于在本实施例实施前或实施S101的同时,将文本图 像划分为多个区块,则文本行基线落在了不同的区块中,W-个区块的角度来看,各个文本 行基线落于该区块内的部分即为第一基线,则一个区块中存在至少一个第一基线。
[009引本实施例中,根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度 直方图,确定各个文本行基线上每一个像素点的竖直笔画方向;需要说明的是,通常一个文 档正常向用户呈现时,文档所在的平面与人眼的视线相互垂直,则人眼看到的文档中的各 个字符也是横平竖直的,即文档中的横向笔画必然与水平面平行,竖直笔画必然与水平面 垂直;但由于摄像头拍摄文档时,文档发生了倾斜、积厚、或者摄像头的摄像面与文档所在 平面之间不是平行的,则拍摄的文本图像中,各个字符在文档图像中均发生了形变;
[0099] S103、根据每一个文本行基线和每一个文本行基线上每一个像素点的竖直笔画方 向,在所述文本图像中确定用于建立二维网格的各个像素点,并根据所述用于建立二维网 格的各个像素点建立二维网格。
[0100] 所述各个用于建立二维网格的各个像素点分别为所述二维网格中各个四边形的 各个顶点,则二维网格中各个四边形的各个顶点均具有第一坐标;所述二维网格用于表征 文档中各个字符在上述文本图像中所发生的形变。
[0101] S104、根据二维网格中每一个四边形的各个顶点的第一坐标和S维空间下平行四 边形约束条件,确定=维网格。
[0102] 所述=维网格中每一个四边形与所述二维网格中每一个四边形一一对应;所述= 维网格中的四边形的各个顶点与该S维网格中的四边形对应的二维网格中的四边形的各 个顶点--对应;
[0103] 所述S维网格用于反映所述文本图像中各个文本行中各个字符在客观存在的S 维空间的位置;
[0104] 上述文档W印刷了多个字符的纸张为例,纸张上的字符是横平竖直的,该纸张发 生卷曲、倾斜后,各个字符相对于纸张所占据的面来说,并未发生形变,即无论纸张是否卷 曲,字符中的一个笔画的在该纸张上的起始位置、在纸张上的延伸方向、终止位置等均未发 生改变,但在摄像头直接捕获的文本图像中发生了形变;
[01化]因此本实施例通过S103确定可反映文本图像中各个字符的形变情况的二维网 格,且本实施例中的二维网格中各个四边形在=维空间下是适用于平行四边形约束条件 的,因此根据S103,便可确定=维网格,W反映文本图像中发生了形变的各个字符在客观的 =维空间中的形态(如字符在弯折的纸张上的形态)。
[0106] S105、根据所述S维网格中每一个四边形的每一个顶点的S维坐标,和所述二维 网格中每一个四边形的每一个顶点,确定待建立的校正文本图像的各个校正像素点与所述 文本图像中各个像素点的对应关系。
[0107] 本实施例的目的是根据上述文本图像,重新生成一个新的文本图像,在新的文本 图像中各个字符不发生形变,可横平竖直的显示在该新的文本图像中;则可将新的文本图 像称为校正文本图像;但在建立校正文本图像之前,需要确定待建立的校正文本图像中各 个校正像素点显示的内容(也可W说需要确定待建立的校正文本图像中各个校正像素点 的值),才可完成校正文本图像的建立,因此需要确定待建立的校正文本图像的各个校正像 素点与所述文本图像中各个像素点的对应关系,W获知待建立的校正文本图像的各个校正 像素点需显示的内容。
[0108] S106、根据所述对应关系,建立校正文本图像。
[0109] 本实施例中,由于文本图像中各个区块对应的梯度直方图可说隹确的反映各个区 块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对 应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可 W获取准确率较高的校正图像。
[0110] 图3为本发明文本图像的校正方法实施例二的流程示意图。如图3所示,本实施 例是在图1所示的实施例的基础上,做出进一步的描述,具体包括:
[0111] S201、获取文本图像。
[0112] 具体可W在网络服务器中下载文本图像,或者通过摄像头拍摄文档,获取文本图 像;或者接收第=方设备发送的文本图像。
[0113] S202、对文本图像进行二值化,获取二值化后的文本图像;
[0114] 所述二值化指的是将图像上的像素点的灰度值设置为0或255,也就是将整个图 像呈现出明显的只有黑和白的视觉效果。图4为本发明实施例二中二值化后的文本图像的 示意图。如图4所示,文本图像二值化后,呈现一行行字符和图标。
[0115] S203、采用形态学操作,获取二值化后的文本图像中的各个候选文本区域。
[0116] 在图像处理过程中,形态学操作一般是对二值化后的图像,进行边界提取,骨架提 取,孔洞填充,角点提取等方式进行图像重建。其中基本的算法有:膨胀腐蚀,开操作,闭操 作,击中击不中变换等。
[0117] 图5为本发明实施例二中候选文本区域的示意图。如图5所示,候选文本区域为 一行行字符和字符旁边的图标所占用的范围。
[011引 S204、根据各个候选文本区域的长度、高度W及长高比,确定各个文本行。
[0119] 本实施例是针对文本图像进行的,因此在S203中获取的各个候选文本区域所占 用的范围的轮廓是具有长度、高度的,具体如图5所示,一行行字符所占用的范围的轮廓和 图标所占用的范围的轮廓是具有长度、高度的,而一行行字符所占用的范围的轮廓和图标 所占用的范围的轮廓区别较大,其长度、高度及长高比相差较大,则通过S204,可W确定文 字区域,即确定一行行字符形成的各个文本行,并过滤掉非文字区域,即上述图标所占用的 区域。
[0120] S205、获取各个文本行的中屯、线及各个文本行的高度平均值。
[0121] W-个文本行为例,形成该文本行的一行字符所占用的范围的轮廓中,上边沿上 的各个像素点称为上像素点,下边沿上的各个像素点称为下像素点,在每个上像素点上沿 垂直方向画垂线,每一个垂线便会穿过一个上像素点和一个下像素点,在任意一个垂线上 确定一个与该垂线穿过的上像素点和下像素点距离均相等的像素作为中屯、像素点,各个垂 线上的中屯、像素点连成的线即为该文本行的文本行中屯、线;位于同一个垂线的上像素点、 下像素点和中屯、像素点是彼此对应的;而中屯、像素点对应的上像素点与下像素点之间的距 离即为该中屯、像素点对应的文本行高度,基于此,可W获知文本行中屯、线上各个像素点对 应的文本行高度;
[0122] 可W理解的,文本图像是由各个像素点形成,本实施例中在文本图像中确定的线、 面、距离等均是W像素点为计量单位进行说明的,例如上述一个中屯、像素点的第一坐标为 (3, 3),其对应的上像素点的第一坐标为(3, 1),下像素点的第一坐标为(3, 5),则中屯、像素 点与其对应的上像素点的距离为2个像素点,与其对应的下像素点的距离为2个像素点,该 中屯、像素点对应的文本行高度即为4个像素点。
[0123] S206、根据各个所述文本行中屯、线和高度平均值,确定各个文本行的上基线和下 基线。
[0124] 所述高度平均值是根据所述文本行中屯、线上各个像素点对应的文本行高度确定 的。
[0125] 具体的,在文本图像中,一行字符所占用的范围的轮廓中,其上边沿可当做该行字 符形成的文本行的上基线,下边沿可当做该行字符形成的文本行的下基线,但由于文本行 中各个字符之间存在差异,因此根据一行字符所占用的范围的轮廓确定的上下基线不够平 滑,不利于建立校正文本图像,因此较优的,本实施例中是根据各个所述文本行中屯、线和高 度平均值,确定构成各个文本行的上基线和下基线的各个像素点;例如W上述中屯、像素点 的第一坐标化3)为例,而确定的高度平均值为2个像素点,上述中屯、像素点确定的位于 上基线的像素点为第一坐标为化2)的像素点,确定的位于下基线的像素点为第一坐标是 (3, 4)的像素点;W此类推,确定出构成各个文本行的上基线和下基线的各个像素点;需要 补充的是,若通过计算获得的高度平均值不为整数,可采用向上取整、向下取整等方法进行 数据处理;
[01%] 更具体的,还可W按照文本行的上边沿或下边沿的延伸方向,将文本行划分为多 个细分文本行,每一个细分文本行的上基线上的各个像素点和下基线上的各个像素点,是 根据该细分文本行中的文本行中屯、线和该细分文本行中的文本行中屯、线上各个中屯、像素 点对应的文本行高度的平均值确定的,随后将用于构成各个细分文本行的上基线的各个像 素点连起来,便形成了一条平滑的文本行的上基线;将用于构成各个细分文本行的下基线 的各个像素点连起来,便形成了一条平滑的文本行的下基线;各个上基线和各个下基线均 为文本行基线。
[0127] S207、将所述文本图像划分为至少两个区块,根据每一个区块对应的梯度直方图, 确定每一个区块的第一角度。
[0128] 所述区块的第一角度为该区块对应的梯度直方图中的最大统计值对应的量化 角;
[0129] W-个区块为例,获取该区块中每个像素点的梯度向量gx和gy,并根据 = ^确定各个像素点对应的0 (本实施例中0的取值范围为0?31),并根据 占。- m =在r2+如确定各个像素点对应的模;
[0130] 将0的取值范围[0, 31]量化为多个量化区间,同时选取各个量化区间的最小值 或最大值为对应的各个量化区间的量化角;例如将区间[a。,aeJ量化为64个量化区间,分 别为[a。,aj、[a。32]......枯3, b J,量化区间[a。,aj的最小值为a。,最大值为a!,量化区间 杠,32]的最小值为ai,最大值为32, W此类推,量化区间枯3, 364]的最小值为363,最大值为 ac4;若同时选取各个量化区间的最小值为对应的各个量化区间的量化角,则为量化角依次 为a。,ai,……ae3;若同时选取各个量化区间的最大值为对应的各个量化区间的量化角,贝U 为量化角依次为a。a,,……ae4;上述"64"仅用于举例说明,在实际应用时,基于精度与鲁 椿性之间的权衡,在对0的取值范围[0, n]进行量化时,可灵活设置量化区间的个数;
[0131] 根据区块内各个像素点对应的0,确定各个量化区间对应的各个像素点,在任意 一个量化区间对应的各个像素点中,任意一个像素对应的0位于该量化区间中;则将一个 量化区间对应的全部像素的模求和,获得该量化区间对应的统计值;从而获得该区块对应 的梯度直方图;进一步在各个量化区间对应的统计值中,确定最大统计值,该最大统计值对 应的量化区间的量化角即为该最大统计值对应的量化角,并将该最大统计值对应的量化角 确定为该区块的第一角度。
[0132] S208、根据每一个区块的第一角度和每一个区块内各个第一基线的延伸方向与水 平方向的夹角的平均值,确定各个区块的预测竖直笔画方向。
[0133] 当第一区块的第一角度和第一区块内各个第一基线的延伸方向与水平方向的夹 角的平均值之差满足重合预设值时,确定所述第一区块的预测竖直笔画方向与水平方向的 夹角为所述第一区块的第一角度;重合预设值可根据需要设定,例如可W为10度至-10度, 则当第一区块的第一角度为30度,而第一区块内各个第一基线的延伸方向与水平方向的 夹角的平均值为25度,即第一区块的第一角度与第一区块内各个第一基线的延伸方向与 水平方向的夹角的平均值之差不超过上述10度至-10度所限定的范围,即确认所述第一区 块的预测竖直笔画方向与水平方向的夹角为所述第一区块的第一角度;获知第一角度后, 便可确定预测竖直笔画方向;
[0134] 当第一区块的第一角度和第一区块内至少一个第一基线的延伸方向与水平方向 的夹角的平均值之差满足垂直预设值时,确定所述第一区块的预测竖直笔画方向与水平方 向的夹角为所述第一区块的第一角度与90度的和;垂直预设值可根据需要设定,例如可W 为80度至100度,则当第一区块的第一角度为125度,而第一区块内各个第一基线的延伸 方向与水平方向的夹角的平均值为25度,即第一区块的第一角度与第一区块内各个第一 基线的延伸方向与水平方向的夹角的平均值之差没有超过上述80度至100度所限定的范 围,即确认所述第一区块的预测竖直笔画方向与水平方向的夹角为所述第一区块的第一角 度;获知第一角度后,便可确定预测竖直笔画方向;
[01巧]上述第一区块为相对概念,指待确定预测竖直笔画的区块,如图2所示,在确定第 5个区块的预测竖直笔画时,该第5个区块的即为上述第一区块;在确定第8个区块的预测 竖直笔画时,该第8个区块的即为上述第一区块。
[0136] S209、根据各个区块的预测竖直笔画方向,确定各个文本行基线上每一个像素点 的竖直笔画方向。
[0137] 具体的,先确定所述第一像素点所属的区块;根据所述第一像素点所属的区块的 预测竖直笔画方向与水平方向的夹角,和与所述第一像素点所属的区块相邻的各个区块的 预测竖直笔画方向与水平方向的夹角,确定所述第一像素点的垂直笔画方向。
[0138] 上述第一像素点为相对概念,表示任意一个待确定竖直笔画方向的、且在文本行 基线上的像素点;W图2进行说明,一个像素点位于第5个区块中,第5个区块的上下左右 相邻的区块为第2区块、第8区块、第4区块和第6区块,则采用双线性插值法处理第5个 区块、第2区块、第8区块、第4区块和第6区块的预测垂直笔画方向,从而确定该第一像素 点的垂直笔画方向;需要说明的是,由于第5区块内有多条第一基线,从而也有多个待确定 竖直笔画方向的像素点,不同的像素点与第2区块、第8区块、第4区块和第6区块的距离 不同,因此在采用双线性插值法处理第2区块、第8区块、第4区块和第6区块的预测垂直 笔画方向时,根据待确定竖直笔画方向的像素点的位置,引入不同的权重值。
[0139] S210、根据每一个文本行基线和每一个文本行基线上每一个像素点的竖直笔画方 向,在所述文本图像中确定各个用于建立二维网格的各个像素点,并根据各个所述用于建 立二维网格的各个像素点建立二维网格。
[0140] 具体依照下述各个步骤完成步骤S210 :
[0141] C1、建立形变坐标系,并确定各个文本行基线上各个像素点在所述形变坐标系中 的形变坐标;在所述形变坐标系中,当像素点i。中当q为1时,像素点i 1的形变坐标中的纵 坐标与像素点ii的第一坐标中的纵坐标相等;像素点i 1的形变坐标中的横坐标为像素点i 1 到像素点(i-l)i的距离与像素点(i-1) 1到形变坐标系中的坐标原点的距离的和;像素点ii 表示第一个文本行基线上第i个像素点;
[0142] 当像素点i。中当q不为1时,像素点i。的形变坐标中的横坐标与像素点i。对应的 交点的横坐标相同;像素点i。对应的交点为像素点i。的虚拟竖线穿过的位于第q-1个文本 行基线上的像素点;像素点i。的虚拟竖线是沿像素点i。的竖直笔画方向延伸的;像素点i。 的形变坐标中的纵坐标是采用双线性插值法处理像素点(i-1)。和像素点(i+1)。的第一坐 标中的纵坐标确定的;其中,像素点i。表示第q个文本行基线上第i个像素点,i为不大于 M的整数,q为不大于N的整数,M为像素点i。所在的第q个文本行基线上像素点的总数,N 为文本图像中文本行基线的总数;
[0143] C2、根据预设的划分步长,在各个文本行基线上确定用于划分各个文本行基线的 等分像素点;
[0144] 例如划分步长为3个像素点,而文本行基线1包括10个像素点,则文本行基线1 上第1个像素点、第4个像素点、第7个像素点和第10个像素点即为该文本行基线1的各 个划分像素点;文本行基线2包括5个像素点,则文本行基线2上第1个像素点、第4个像 素点即为该文本行基线的各个划分像素点
[0145] 通常来说,文档上一行行字符是平行排列的,若该一行行字符在文本图像中不发 生形变,则每个文本行基线上的第1个像素点的连线是与水平线垂直的,进而每个文本行 基线上的第i个像素点的连线、第i+1个像素点的连线……与各个文本行基线纵横交错,形 成各个矩形;但上述文本图像中各个字符已发生形变,每个文本行基线上的第i个像素点 的连线、第i+1个像素点的连线……与各个文本行基线纵横交错后不能形成矩形,但为了获 知文档中字符所发生的形变,本实施例将上述各个划分像素点预测为在文本图像中形变后 的矩形的各个顶点,W进行下述步骤;
[0146] C3、根据各个划分像素点的形变坐标和各个划分像素点的相邻像素点的形变坐 标,采用双线性插值法,确定各个划分像素点对应的修正后的形变坐标;
[0147] 所述划分像素点的相邻像素点与该划分像素点相邻且位于同一个文本行基线 上;
[0148] 举例来说,文本行基线1上的像素点A(文本行基线1上第1个像素点)、像素点 B (文本行基线1上第4个像素点)、文本行基线2上的像素点C (文本行基线2上第1个像 素点)和像素点D (文本行基线2上第4个像素点),分别表示一个矩形在文本图像中发生 形变后的四个顶点,通过步骤C1已知文本图像中全部文本行基线上的全部像素点的形变 坐标,根据像素点A的相邻像素点(与像素点A均位于文本行基线1上,且相邻,即文本行 基线1上第2个像素点)的形变坐标,采用双线性插值法便确定了像素点A对应的修正后 的形变坐标,根据像素点B的相邻像素点(与像素点B均位于文本行基线1上,且相邻,即 文本行基线1上第3个像素点和第5个像素点)的形变坐标,采用双线性插值法便确定像 素点B对应的修正后的形变坐标,根据像素点C的相邻像素点(与像素点C均位于文本行 基线2上,且相邻,即文本行基线2上第2个像素点)的形变坐标,采用双线性插值法便确 定像素点C对应的修正后的形变坐标;根据像素点D的相邻像素点(与像素点D均位于文 本行基线2上,且相邻,即文本行基线2上第3个像素点和第5个像素点)的形变坐标,采 用双线性插值法便确定像素点D对应的修正后的形变坐标确定;
[0149] C4、根据各个划分像素点对应的修正后的形变坐标,确定各个用于建立二维网格 的各个像素点;
[0150] 通过步骤C1已知文本图像中全部文本行基线上的全部像素点的形变坐标,而上 述修正后的形变坐标与文本图像中的某个像素点的形变坐标是相同的,因此根据各个修正 后的形变坐标,确定了用于建立二维网格的各个像素点。
[0151] 例如,上述像素点A对应的修正后的形变坐标与步骤C1中像素点E的形变坐标相 同,从而确定出像素点E为一个用于建立二维网格的像素点;上述像素点B对应的修正后的 形变坐标与步骤C1中像素点F的形变坐标相同,从而确定出像素点F也为一个用于建立二 维网格的像素点;上述像素点C对应的修正后的形变坐标与步骤C1中像素点G的形变坐标 相同,从而确定出像素点G也为一个用于建立二维网格的像素点,上述像素点D对应的修正 后的形变坐标与步骤C1中像素点H的形变坐标相同,从而确定出像素点H也为一个用于建 立二维网格的像素点,因此上述像素点E、像素点F、像素点G和像素点H可建立二维网格中 的一个四边形;依次类推,通过C2确定各个划分像素点后,依次执行C3、C4,便可确定用于 建立二维网格的各个像素点。
[0152] C5、根据各个用于建立二维网格的各个像素点,建立二维网格。
[0153] 图6为本发明实施例二中二维网格的示意图。如图6所示,根据各个修正后的形 变坐标,在文本行基线上找到对应的各个像素点,各个像素点围成二维图像中各个四边形, 用于围成二维网格中的四边形的各个像素点也即为该四边形的各个顶点,故二维网格中各 个四边形的顶点具有第一坐标。
[0154] S211、根据所述二维网格中每一个四边形的各个顶点的第一坐标和S维空间下平 行四边形约束条件,确定=维网格。
[01巧]所述S维网格中每一个四边形与所述二维网格中每一个四边形一一对应;所述S 维网格中的四边形的各个顶点与该S维网格中的四边形对应的二维网格中的四边形的各 个顶点--对应。
[0156] 依据该平行四边形约束条件,可W确定二维网格中每一个四边形的顶点对应的= 维坐标,从而在=维空间中确定各个=维坐标指向的点,进而确定=维网格,其中各个=维 坐标指向的点分别为=维网格中各个四边形的顶点;由于=维坐标是根据二维网格中各个 四边形的顶点的二维坐标确定的,所述S维网格中的四边形的各个顶点与该S维网格中的 四边形对应的二维网格中的四边形的各个顶点一一对应。
[0157] 图7为本发明实施例二中S维网格的示意图。如图7所示,若前述文本图像是在 二维图像中呈现一个纸张及其印刷的各个字符,则图7便反映出该纸张及纸张上各个字符 在客观存在的S围空间中的形态。
[0158] S212、根据所述S维网格中每一个四边形的各个顶点的S维坐标,确定待建立的 校正图像中各个用于建立校正网格的校正像素点,并根据各个用于建立校正网格的各个校 正像素点建立校正网格。
[0159] 所述校正网格包括与所述S维网格中每一个四边形一一对应的各个校正矩形 (本实施例中的校正矩形的形状为矩形);所述校正矩形中各个边的长度与该校正矩形对 应的=维网格中的四边形的各个边的长度一一相等;
[0160] 本实施例的最终目的是为了生成一个文档中的各个字符不发生形变的文本图像, 即校正文本图像,但文档中的一个字符,具体使用校正文本图像中的哪几个像素点显示才 可不发生形变的显示出来,在执行S212之前并不清楚,但已知各个字符在文本图像中是由 哪几个像素点显示,即文本图像中各个像素点的灰度均已知,因此若可W确定用于建立校 正文本图像的各个校正像素点与文本图像中各个像素点的对应关系,便可建立校正文本图 像;考虑到校正文本图像中的字符应当是横平竖直的,则在S维空间中的四边形在该校正 文本图像中也应当为一个矩形;假设待建立的校正文本图像的分辨率为480X240,则使用 480X240个校正像素点建立校正文本图像,但480X240个校正像素点所显示的内容在执 行S212之前并不清楚,但可知480 X 240个校正像素点的位置,也可W说,在校正文本图像 建立完成后,该480X240个校正像素点的位置可用校正文本图像中的第二坐标表示;考 虑到=维空间中的四边形在该校正文本图像中也应当为一个矩形,在上述480X240个校 正像素点中选取一个校正像素点与上述=维网格中的一个四边形的一个顶点对应,通常在 实际应用中,可选取S维网格中第一个四边形的第一个顶点与480X240个校正像素点中 的第一个校正像素点对应,随后根据=维网格中各个四边形的边长,且基于使=维网格中 每一个四边形的相邻边互相垂直的规则,在上述480X240个校正像素点中确定各个用于 建立校正网格的校正像素点,并根据各个用于建立校正网格的各个校正像素点建立校正网 格;所述校正网格包括与所述=维网格中每一个四边形一一对应的各个校正矩形;所述校 正矩形中各个边的长度与该校正矩形对应的=维网格中的四边形的各个边的长度一一相 等。
[0161] S213、根据校正网格中每一个校正矩形对应的所述S维网格中的四边形,确定校 正网格中每一个校正矩形对应的二维网格中的四边形。
[0162] 由于S维网格中的各个四边形与二维网格中的各个四边形一一对应,而校正网格 中各个校正矩形与=维网格中的各个四边形一一对应,从而可W确定校正网格中每一个校 正矩形对应的二维网格中的四边形;
[0163] S214、根据校正网格中每一个校正矩形的各个顶点在待建立的校正图像中的第二 坐标和校正网格中每一个校正矩形对应的二维网格中的四边形的各个顶点的第一坐标,确 定待建立的校正图像的各个校正像素点与所述文本图像中各个像素点的对应关系。
[0164] 上述对应关系可W为一个也可W为多个,但较优的,本实施例中对应关系为多个, 且分别独立,具体的,本实施例采用四点法,根据校正网格中每一个校正矩形的各个顶点的 第二坐标,和校正网格中每一个校正矩形对应的二维网格中的四边形的各个顶点的第一坐 标,分别确定各个校正矩形的各个顶点与文本图像中像素点的对应关系,也就是说是将各 个校正矩形独立看待,在S213中确定了不同的校正矩形对应的二维网格中的四边形;则在 S214中针对不同的校正矩形确定了不同的对应关系,例如校正矩形1和二维网格中的四边 形1对应,则根据校正矩形1的各个顶点的第二坐标和二维网格中的四边形1的各个顶点, 确定针对校正矩形1的对应关系1 ;校正矩形2和二维网格中的四边形2对应,则根据校正 矩形2的各个顶点的第二坐标和二维网格中的四边形2的各个顶点,确定针对校正矩形2 的对应关系2 ;
[0165] S215、根据待建立的校正图像的各个校正像素点与所述文本图像中各个像素点的 对应关系,确定待建立的校正图像的各个校正像素点对应的第一坐标。
[0166] 在对应关系有多个时,在确定待建立的校正图像的各个校正像素点对应的第一坐 标时,是先确定校正像素点所属的校正矩形,随后根据针对该校正矩形的对应关系,确定该 校正像素点对应的第一坐标;例如校正像素点1位于上述校正矩形1中,则对该校正像素点 应用针对校正矩形1的对应关系,确定校正像素点1对应的第一坐标。
[0167] S216、根据待建立的校正图像的各个校正像素点对应的第一坐标,确定待建立的 校正图像的各个校正像素点对应的文本图像中的各个像素点。
[0168] S217、根据待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点 的灰度,确定待建立的校正图像的各个校正像素点的灰度。
[0169] S218、根据待建立的校正图像的各个校正像素点的灰度建立校正文本图像。
[0170] 举例来说,一个校正像素点A对应的第一坐标为巧,5),则说明待建立的校正文 本图像中校正像素点A处需要显示的内容为位于文本图像中化5)处的像素点所显示的 内容,或者说校正像素点A的灰度应与文本图像中化5)处的像素点的灰度一致;即通过 S213?S218,确定了待建立的校正文本图像中各个校正像素点对应的灰度,则从而可建立 校正文本图像。
[0171] 需要补充的是,若在S215中确定的校正像素点的第一坐标中,横坐标和纵坐标不 为整数时,则根据该校正像素点对应的第一坐标在文本图像中选取至少两个领域像素点, 根据所述至少两个领域像素点的灰度进行双线性插值,确定该校正像素点的灰度;上述领 域像素点在文本图像中的第一坐标与该校正像素点对应的第一坐标形成相邻域。
[0172] 另外,本实施例在建立二维网格时,是同时确定了作为二维网格中各个四边形顶 点的各个像素点,也就是说,本实施例中将二维网格中各个四边形独立看待,分别确定了二 维网格中各个四边形的顶点,随后各个顶点依次连接,构成二维网格中各个四边形的顶点, 进而使得在建立的=维网格中各个四边形时避免误差积累,且建立的=维网格也是相互独 立的,随后确定的校正网格中各个校正矩形时也避免了误差积累,各个校正矩形也是相互 独立的,最后根据各个校正矩形确定的对应关系之间也避免了误差积累,不会干扰校正文 本图像的生成。
[0173] 本实施例中,由于文本图像中各个区块对应的梯度直方图可W准确的反映各个区 块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对 应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可 W获取准确率较高的校正图像,进一步的,在获取校正文本图像的过程中,采用形态学操作 获取了各个文本行基线,使得文本行基线的确定过程较为简单,便于快速、准确的获取校正 文本图像。
[0174] 图8为本发明文本图像的校正装置实施例一的结构示意图。如图8所示,文本图 像的校正装置包括:
[01巧]基线确定模块11,用于确定文本图像中各个文本行的文本行基线,并获取文本图 像中各个区块对应的梯度直方图;所述文本行基线是根据所述文本图像中各个像素点在所 述文本图像中的第一坐标和灰度确定的;所述梯度直方图是根据所述区块内各个像素点的 梯度向量确定的;所述区块是通过对所述文本图像进行分区获得的,所述文本图像中各个 区块包括的像素点的总和为所述文本图像的全部像素点;所述文本图像中任意两个区块之 间无相同的像素点;
[0176] 笔画确定模块12,用于根据每一个区块内的第一基线的延伸方向和每一个区块对 应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向;所述第一基线为 所述文本行基线位于所述第一基线所属的区块内的部分;
[0177] 二维网格确定模块13,用于根据每一个文本行基线和每一个文本行基线上每一个 像素点的竖直笔画方向,在所述文本图像中确定各个用于建立二维网格的各个像素点,并 根据各个所述用于建立二维网格的各个像素点建立二维网格;所述各个用于建立二维网格 的各个像素点分别为所述二维网格中各个四边形的各个顶点;
[0178] S维网格确定模块14,用于根据所述二维网格中每一个四边形的各个顶点的第一 坐标和=维空间下平行四边形约束条件,确定=维网格;所述=维网格中每一个四边形与 所述二维网格中每一个四边形一一对应;所述=维网格中的四边形的各个顶点与该=维网 格中的四边形对应的二维网格中的四边形的各个顶点--对应;
[0179] 对应关系确定模块15,用于根据所述S维网格中每一个四边形的每一个顶点的S 维坐标,和所述二维网格中每一个四边形的每一个顶点的第一坐标,确定待建立的校正文 本图像的各个校正像素点与所述文本图像中各个像素点的对应关系;
[0180] 建立模块16,用于根据所述对应关系,建立校正文本图像。
[0181] 本实施例中,由于文本图像中各个区块对应的梯度直方图可W准确的反映各个区 块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对 应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可 W获取准确率较高的校正图像,进一步的,在获取校正文本图像的过程中,采用形态学操作 获取了各个文本行基线,使得文本行基线的确定过程较为简单,便于快速、准确的获取校正 文本图像。
[0182] 图9为本发明文本图像的校正装置实施例二的结构示意图。如图9所示,本实施例 是在图8所示的实施例的基础上,做出进一步的描述,具体的,所述基线确定模块11包括:
[0183] 候选文本区域确定单元111,用于采用形态学操作,获取二值化后的文本图像中的 各个候选文本区域;
[0184] 文本行确定单元112,用于根据各个候选文本区域的长度、高度W及长高比,确定 各个文本行;
[0185] 中屯、线确定单元113,用于获取各个文本行中屯、线及各个文本行的高度平均值;
[0186] 基线确定单元114,用于根据各个所述文本行中屯、线和高度平均值,确定各个文本 行的上基线和下基线;所述高度平均值是根据所述文本行中屯、线上各个像素点对应的文本 行局度确定的。
[0187] 进一步的,笔画确定模块12包括:
[018引角度确定单元121,用于根据每一个区块对应的梯度直方图,确定每一个区块的第 一角度;所述区块的第一角度为该区块对应的梯度直方图中的最大统计值对应的量化角;
[0189] 预测单元122,用于根据每一个区块的第一角度和每一个区块内各个第一基线的 延伸方向与水平方向的夹角的平均值,确定各个区块的预测竖直笔画方向;
[0190] 笔画确定单元123,用于根据各个区块的预测竖直笔画方向,确定各个文本行基线 上每一个像素点的竖直笔画方向;
[0191] 其中,所述预测单元122具体用于当第一区块的第一角度和第一区块内至少一个 第一基线的延伸方向与水平方向的夹角的平均值之差满足重合预设值时,确定所述第一区 块的预测竖直笔画方向与水平方向的夹角为所述第一区块的第一角度:
[0192] 所述预测单元122具体用于当第一区块的第一角度和第一区块内至少一个第一 基线的延伸方向与水平方向的夹角的平均值之差满足垂直预设值时,确定所述第一区块的 预测竖直笔画方向与水平方向的夹角为所述第一区块的第一角度与90度的和;
[0193] 所述笔画确定单元123具体用于确定所述第一像素点所属的区块;
[0194] 所述笔画确定单元123具体用于根据所述第一像素点所属的区块的预测竖直笔 画方向与水平方向的夹角,和与所述第一像素点所属的区块相邻的各个区块的预测竖直笔 画方向与水平方向的夹角,确定所述第一像素点的竖直笔画方向。
[01巧]进一步的,二维网格确定模块13包括:
[0196] 形变坐标系建立单元131,用于建立形变坐标系,并确定各个文本行基线上各个像 素点在所述形变坐标系中的形变坐标;在所述形变坐标系中,当像素点i。中当q为1时,像 素点ii的形变坐标中的纵坐标与像素点i 1的第一坐标中的纵坐标相等;像素点i 1的形变 坐标中的横坐标为像素点ii到像素点(i-1) 1的距离与像素点(i-1) 1到形变坐标系中的坐 标原点的距离的和;当像素点i。中当q不为1时,像素点i。的形变坐标中的横坐标与像素 点i。对应的交点的横坐标相同;像素点i。对应的交点为像素点i W的虚拟竖线穿过的位于 第q-1个文本行基线上的像素点;像素点i。的虚拟竖线是沿像素点i。的竖直笔画方向延 伸的;像素点i。的形变坐标中的纵坐标是采用双线性插值法处理像素点(i-1)。和像素点 (i + 1)。的第一坐标中的纵坐标确定的;其中,像素点i。表示第q个文本行基线上第i个像 素点,i为大不大于M的整数,q为不大于N的整数,M为像素点i。所在的第q个文本行基 线上像素点的总数,N文本图像中文本行基线的总数;
[0197] 划分像素点确定单元132,用于根据预设的划分步长,在各个文本行基线上确定用 于划分各个文本行基线的划分像素点;
[0198] 修正确定单元133,用于根据各个划分像素点的形变坐标和各个划分像素点的相 邻像素点的形变坐标,采用双线性插值法,确定各个划分像素点对应的修正后的形变坐标; 所述划分像素点的相邻像素点与该划分像素点相邻且位于同一个文本行基线上;
[0199] 二维网格像素点确定单元134,用于根据各个划分像素点对应的修正后的形变坐 标,确定各个用于建立二维网格的各个像素点;
[0200] 二维网格建立单元135,用于根据各个用于建立二维网格的各个像素点建立二维 网格。
[0201] 进一步的,对应关系确定模块15,包括;
[0202] 校正网格建立单元151,用于根据所述S维网格中每一个四边形的各个顶点的S 维坐标,确定待建立的校正图像中各个用于建立校正网格的校正像素点,并根据各个用于 建立校正网格的各个校正像素点建立校正网格;所述校正网格包括与所述=维网格中每一 个四边形一一对应的各个校正矩形;所述校正矩形中各个边的长度与该校正矩形对应的= 维网格中的四边形的各个边的长度一一相等;所述各个用于建立校正网格的校正像素点分 别为所述校正网格中各个校正矩形的各个顶点;
[0203] 二维网格四边形确定单元152,用于根据校正网格中每一个校正矩形对应的所述 S维网格中的四边形,确定校正网格中每一个校正矩形对应的二维网格中的四边形;
[0204] 对应关系确定单元153,用于根据校正网格中每一个校正矩形的各个顶点在待建 立的校正图像中的第二坐标和校正网格中每一个校正矩形对应的二维网格中的四边形的 各个顶点的第一坐标,确定待建立的校正图像的各个校正像素点与所述文本图像中各个像 素点的对应关系。
[02化]进一步的,建立模块16包括;坐标确定单元161,用于根据待建立的校正图像的各 个校正像素点与所述文本图像中各个像素点的对应关系,确定待建立的校正图像的各个校 正像素点对应的第一坐标;
[0206] 像素点确定单元162,用于根据待建立的校正图像的各个校正像素点对应的第一 坐标,确定待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点;
[0207] 灰度确定单元163,用于根据待建立的校正图像的各个校正像素点对应的文本图 像中的各个像素点的灰度,确定待建立的校正图像的各个校正像素点的灰度;
[020引校正文本图像建立单元164,用于根据待建立的校正图像的各个校正像素点的灰 度建立校正文本图像。
[0209] 本实施例中,由于文本图像中各个区块对应的梯度直方图可W准确的反映各个区 块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对 应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可 W获取准确率较高的校正图像,进一步的,在获取校正文本图像的过程中,采用形态学操作 获取了各个文本行基线,使得文本行基线的确定过程较为简单,便于快速、准确的获取校正 文本图像。
[0210] 需要补充说明的是,上述各个装置实施例中的各个模块及单元对应执行上述各个 方法实施例中的各个步骤,具体实施过程及技术效果可参见方法实施例,在此不再寶述。
[0211] 本领域普通技术人员可W理解;实现上述各方法实施例的全部或部分步骤可W通 过程序指令相关的硬件来完成。前述的程序可W存储于一计算机可读取存储介质中。该程 序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括;ROM、RAM、磁碟 或者光盘等各种可W存储程序代码的介质。
[0212] 最后应说明的是;W上各实施例仅用W说明本发明的技术方案,而非对其限制; 尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其 依然可W对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征 进行等同替换;而该些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技 术方案的范围。
【权利要求】
1. 一种文本图像的校正方法,其特征在于,包括: 确定文本图像中各个文本行的文本行基线,并获取文本图像中各个区块对应的梯度直 方图;所述文本行基线是根据所述文本图像中各个像素点在所述文本图像中的第一坐标和 灰度确定的;所述梯度直方图是根据所述区块内各个像素点的梯度向量确定的;所述区块 是通过对所述文本图像进行分区获得的,所述文本图像中各个区块包括的像素点的总和为 所述文本图像的全部像素点;所述文本图像中任意两个区块之间无相同的像素点; 根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方图,确定各个 文本行基线上每一个像素点的竖直笔画方向;所述第一基线为所述文本行基线位于所述第 一基线所属的区块内的部分; 根据每一个文本行基线和每一个文本行基线上每一个像素点的竖直笔画方向,在所述 文本图像中确定各个用于建立二维网格的各个像素点,并根据各个所述用于建立二维网格 的各个像素点建立二维网格;所述各个用于建立二维网格的各个像素点分别为所述二维网 格中各个四边形的各个顶点; 根据所述二维网格中每一个四边形的各个顶点的第一坐标和三维空间下平行四边形 约束条件,确定三维网格;所述三维网格中每一个四边形与所述二维网格中每一个四边形 一一对应;所述三维网格中的四边形的各个顶点与该三维网格中的四边形对应的二维网格 中的四边形的各个顶点-对应; 根据所述三维网格中每一个四边形的每一个顶点的三维坐标,和所述二维网格中每一 个四边形的每一个顶点的第一坐标,确定待建立的校正文本图像的各个校正像素点与所述 文本图像中各个像素点的对应关系; 根据所述对应关系,建立校正文本图像。
2. 根据权利要求1所述的校正方法,其特征在于,确定文本图像中各个文本行基线,包 括: 采用形态学操作,获取二值化后的文本图像中的各个候选文本区域; 根据各个候选文本区域的长度、高度以及长高比,确定各个文本行; 获取各个文本行中心线及各个文本行的高度平均值; 根据各个所述文本行中心线和高度平均值,确定各个文本行的上基线和下基线;所述 高度平均值是根据所述文本行中心线上各个像素点对应的文本行高度确定的。
3. 根据权利要求2所述的校正方法,其特征在于,根据每一个区块内的第一基线的延 伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画 方向,包括: 根据每一个区块对应的梯度直方图,确定每一个区块的第一角度;所述区块的第一角 度为该区块对应的梯度直方图中的最大统计值对应的量化角; 根据每一个区块的第一角度和每一个区块内各个第一基线的延伸方向与水平方向的 夹角的平均值,确定各个区块的预测竖直笔画方向; 根据各个区块的预测竖直笔画方向,确定各个文本行基线上每一个像素点的竖直笔画 方向; 其中,所述各个区块中的第一区块的预测竖直笔画方向的确定方法包括: 当第一区块的第一角度和第一区块内至少一个第一基线的延伸方向与水平方向的夹 角的平均值之差满足重合预设值时,确定所述第一区块的预测竖直笔画方向与水平方向的 夹角为所述第一区块的第一角度: 当第一区块的第一角度和第一区块内至少一个第一基线的延伸方向与水平方向的夹 角的平均值之差满足垂直预设值时,确定所述第一区块的预测竖直笔画方向与水平方向的 夹角为所述第一区块的第一角度与90度的和; 所述各个文本行基线上的各个像素点中的第一像素点的竖直笔画方向的确定方法包 括: 确定所述第一像素点所属的区块; 根据所述第一像素点所属的区块的预测竖直笔画方向与水平方向的夹角,和与所述第 一像素点所属的区块相邻的各个区块的预测竖直笔画方向与水平方向的夹角,确定所述第 一像素点的竖直笔画方向。
4. 根据权利要求3所述的校正方法,其特征在于,根据每一个文本行基线和每一个文 本行基线上每一个像素点的竖直笔画方向,在所述文本图像中确定用于建立二维网格的各 个像素点,并根据所述用于建立二维网格的各个像素点建立二维网格,包括: 建立形变坐标系,并确定各个文本行基线上各个像素点在所述形变坐标系中的形变坐 标;在所述形变坐标系中,当像素点中当q为1时,像素点i i的形变坐标中的纵坐标与像 素点^的第一坐标中的纵坐标相等;像素点i i的形变坐标中的横坐标为像素点i i到像素 点距离与像素点(i-1):到形变坐标系中的坐标原点的距离的和;当像素点i q中 当q不为1时,像素点的形变坐标中的横坐标与像素点i q对应的交点的横坐标相同;像 素点对应的交点为像素点i q的虚拟竖线穿过的位于第q-1个文本行基线上的像素点;像 素点的虚拟竖线是沿像素点i q的竖直笔画方向延伸的;像素点i q的形变坐标中的纵坐 标是采用双线性插值法处理像素点(i-l)jP像素点(i+1) q的第一坐标中的纵坐标确定的; 其中,像素点表示第q个文本行基线上第i个像素点,i为不大于M的整数,q为不大于 N的整数,M为像素点所在的第q个文本行基线上像素点的总数,N文本图像中文本行基 线的总数; 根据预设的划分步长,在各个文本行基线上确定用于划分各个文本行基线的划分像素 占. 根据各个划分像素点的形变坐标和各个划分像素点的相邻像素点的形变坐标,采用双 线性插值法,确定各个划分像素点对应的修正后的形变坐标;所述划分像素点的相邻像素 点与该划分像素点相邻且位于同一个文本行基线上; 根据各个划分像素点对应的修正后的形变坐标,确定各个用于建立二维网格的各个像 素点; 根据各个用于建立二维网格的各个像素点建立二维网格。
5. 根据权利要求4所述的校正方法,其特征在于,根据所述三维网格中每一个四边形 的每一个顶点的三维坐标,和所述二维网格中每一个四边形的每一个顶点的第一坐标,确 定待建立的校正文本图像的各个校正像素点与所述文本图像中各个像素点的对应关系,包 括: 根据所述三维网格中每一个四边形的各个顶点的三维坐标,确定待建立的校正图像中 各个用于建立校正网格的校正像素点,并根据各个用于建立校正网格的各个校正像素点建 立校正网格;所述校正网格包括与所述三维网格中每一个四边形一一对应的各个校正矩 形;所述校正矩形中各个边的长度与该校正矩形对应的三维网格中的四边形的各个边的长 度一一相等;所述各个用于建立校正网格的校正像素点分别为所述校正网格中各个校正矩 形的各个顶点; 根据校正网格中每一个校正矩形对应的所述三维网格中的四边形,确定校正网格中每 一个校正矩形对应的二维网格中的四边形; 根据校正网格中每一个校正矩形的各个顶点在待建立的校正图像中的第二坐标和校 正网格中每一个校正矩形对应的二维网格中的四边形的各个顶点的第一坐标,确定待建立 的校正图像的各个校正像素点与所述文本图像中各个像素点的对应关系。
6. 根据权利要求5所述的校正方法,其特征在于,根据所述对应关系,建立校正文本图 像,包括: 根据待建立的校正图像的各个校正像素点与所述文本图像中各个像素点的对应关系, 确定待建立的校正图像的各个校正像素点对应的第一坐标; 根据待建立的校正图像的各个校正像素点对应的第一坐标,确定待建立的校正图像的 各个校正像素点对应的文本图像中的各个像素点; 根据待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点的灰度,确 定待建立的校正图像的各个校正像素点的灰度; 根据待建立的校正图像的各个校正像素点的灰度建立校正文本图像。
7. -种文本图像的校正装置,其特征在于,包括: 基线确定模块,用于确定文本图像中各个文本行的文本行基线,并获取文本图像中各 个区块对应的梯度直方图;所述文本行基线是根据所述文本图像中各个像素点在所述文本 图像中的第一坐标和灰度确定的;所述梯度直方图是根据所述区块内各个像素点的梯度向 量确定的;所述区块是通过对所述文本图像进行分区获得的,所述文本图像中各个区块包 括的像素点的总和为所述文本图像的全部像素点;所述文本图像中任意两个区块之间无相 同的像素点; 笔画确定模块,用于根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯 度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向;所述第一基线为所述文 本行基线位于所述第一基线所属的区块内的部分; 二维网格确定模块,用于根据每一个文本行基线和每一个文本行基线上每一个像素点 的竖直笔画方向,在所述文本图像中确定各个用于建立二维网格的各个像素点,并根据各 个所述用于建立二维网格的各个像素点建立二维网格;所述各个用于建立二维网格的各个 像素点分别为所述二维网格中各个四边形的各个顶点; 三维网格确定模块,用于根据所述二维网格中每一个四边形的各个顶点的第一坐标和 三维空间下平行四边形约束条件,确定三维网格;所述三维网格中每一个四边形与所述二 维网格中每一个四边形一一对应;所述三维网格中的四边形的各个顶点与该三维网格中的 四边形对应的二维网格中的四边形的各个顶点一一对应; 对应关系确定模块,用于根据所述三维网格中每一个四边形的每一个顶点的三维坐 标,和所述二维网格中每一个四边形的每一个顶点的第一坐标,确定待建立的校正文本图 像的各个校正像素点与所述文本图像中各个像素点的对应关系; 建立模块,用于根据所述对应关系,建立校正文本图像。
8. 根据权利要求7所述的校正装置,其特征在于,所述基线确定模块包括: 候选文本区域确定单元,用于采用形态学操作,获取二值化后的文本图像中的各个候 选文本区域; 文本行确定单元,用于根据各个候选文本区域的长度、高度以及长高比,确定各个文本 行; 中心线确定单元,用于获取各个文本行中心线及各个文本行的高度平均值; 基线确定单元,用于根据各个所述文本行中心线和高度平均值,确定各个文本行的上 基线和下基线;所述高度平均值是根据所述文本行中心线上各个像素点对应的文本行高度 确定的。
9. 根据权利要求8所述的校正装置,其特征在于,笔画确定模块包括: 角度确定单元,用于根据每一个区块对应的梯度直方图,确定每一个区块的第一角度; 所述区块的第一角度为该区块对应的梯度直方图中的最大统计值对应的量化角; 预测单元,用于根据每一个区块的第一角度和每一个区块内各个第一基线的延伸方向 与水平方向的夹角的平均值,确定各个区块的预测竖直笔画方向; 笔画确定单元,用于根据各个区块的预测竖直笔画方向,确定各个文本行基线上每一 个像素点的竖直笔画方向; 其中,所述预测单元具体用于当第一区块的第一角度和第一区块内至少一个第一基线 的延伸方向与水平方向的夹角的平均值之差满足重合预设值时,确定所述第一区块的预测 竖直笔画方向与水平方向的夹角为所述第一区块的第一角度: 所述预测单元具体用于当第一区块的第一角度和第一区块内至少一个第一基线的延 伸方向与水平方向的夹角的平均值之差满足垂直预设值时,确定所述第一区块的预测竖直 笔画方向与水平方向的夹角为所述第一区块的第一角度与90度的和; 所述笔画确定单元具体用于确定所述第一像素点所属的区块; 所述笔画确定单元具体用于根据所述第一像素点所属的区块的预测竖直笔画方向与 水平方向的夹角,和与所述第一像素点所属的区块相邻的各个区块的预测竖直笔画方向与 水平方向的夹角,确定所述第一像素点的竖直笔画方向。
10. 根据权利要求9所述的校正装置,其特征在于,二维网格确定模块包括: 形变坐标系建立单元,用于建立形变坐标系,并确定各个文本行基线上各个像素点在 所述形变坐标系中的形变坐标;在所述形变坐标系中,当像素点中当q为1时,像素点i i 的形变坐标中的纵坐标与像素点^的第一坐标中的纵坐标相等;像素点i :的形变坐标中的 横坐标为像素点ijlj像素点(i-1):的距离与像素点(i-1) jlj形变坐标系中的坐标原点的 距离的和;当像素点中当q不为1时,像素点i q的形变坐标中的横坐标与像素点i q对应 的交点的横坐标相同;像素点对应的交点为像素点i q的虚拟竖线穿过的位于第q-1个 文本行基线上的像素点;像素点的虚拟竖线是沿像素点i q的竖直笔画方向延伸的;像素 点的形变坐标中的纵坐标是采用双线性插值法处理像素点(i-1) 5和像素点(i+1) q的第 一坐标中的纵坐标确定的;其中,像素点表示第q个文本行基线上第i个像素点,i为不 大于M的整数,q为不大于N的整数,M为像素点所在的第q个文本行基线上像素点的总 数,N文本图像中文本行基线的总数; 划分像素点确定单元,用于根据预设的划分步长,在各个文本行基线上确定用于划分 各个文本行基线的划分像素点; 修正确定单元,用于根据各个划分像素点的形变坐标和各个划分像素点的相邻像素点 的形变坐标,采用双线性插值法,确定各个划分像素点对应的修正后的形变坐标;所述划分 像素点的相邻像素点与该划分像素点相邻且位于同一个文本行基线上; 二维网格像素点确定单元,用于根据各个划分像素点对应的修正后的形变坐标,确定 各个用于建立二维网格的各个像素点; 二维网格建立单元,用于根据各个用于建立二维网格的各个像素点建立二维网格。
11. 根据权利要求10所述的校正装置,其特征在于,对应关系确定模块,包括: 校正网格建立单元,用于根据所述三维网格中每一个四边形的各个顶点的三维坐标, 确定待建立的校正图像中各个用于建立校正网格的校正像素点,并根据各个用于建立校正 网格的各个校正像素点建立校正网格;所述校正网格包括与所述三维网格中每一个四边形 一一对应的各个校正矩形;所述校正矩形中各个边的长度与该校正矩形对应的三维网格中 的四边形的各个边的长度一一相等;所述各个用于建立校正网格的校正像素点分别为所述 校正网格中各个校正矩形的各个顶点; 二维网格四边形确定单元,用于根据校正网格中每一个校正矩形对应的所述三维网格 中的四边形,确定校正网格中每一个校正矩形对应的二维网格中的四边形; 对应关系确定单元,用于根据校正网格中每一个校正矩形的各个顶点在待建立的校正 图像中的第二坐标和校正网格中每一个校正矩形对应的二维网格中的四边形的各个顶点 的第一坐标,确定待建立的校正图像的各个校正像素点与所述文本图像中各个像素点的对 应关系。
12. 根据权利要求11所述的校正装置,其特征在于,建立模块包括: 坐标确定单元,用于根据待建立的校正图像的各个校正像素点与所述文本图像中各个 像素点的对应关系,确定待建立的校正图像的各个校正像素点对应的第一坐标; 像素点确定单元,用于根据待建立的校正图像的各个校正像素点对应的第一坐标,确 定待建立的校正图像的各个校正像素点对应的文本图像中的各个像素点; 灰度确定单元,用于根据待建立的校正图像的各个校正像素点对应的文本图像中的各 个像素点的灰度,确定待建立的校正图像的各个校正像素点的灰度; 校正文本图像建立单元,用于根据待建立的校正图像的各个校正像素点的灰度建立校 正文本图像。
【文档编号】G06K9/32GK104504387SQ201410781378
【公开日】2015年4月8日 申请日期:2014年12月16日 优先权日:2014年12月16日
【发明者】张伟, 周炳, 陈茂林 申请人:杭州华为数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1