用于文档图像的畸变校正方法和设备的制造方法_3

文档序号:9691237阅读:来源:国知局
线以获得网格的顶部线。应指出,延伸并不局限于此,并且其它的延伸方 式也可被使用,只要可获得扭曲网格的适当的顶部线即可。
[0138] 在步骤S230中,通过文档图像的文本区域的所有获得的基线和顶部及底部线以 及所确定的左边界和右边界,基线和顶部及底部线中的每一条线被划分成具有相等长度的 分段,该长度是根据基线的起点和终点以及被设定的分段数量来计算的(这里分段数量由 基线的最大长度以及平均网格高度的比确定),从而可生成文档图像的文本区域的扭曲网 格,如图6D所示。
[0139] 当然,畸变信息的形式及其确定方法并不局限于此,畸变信息可以是任何其它形 式,只要其可被用于确定整个文档图像的畸变信息即可,并且文本区域的畸变信息可被以 现有技术中的任何其它方式来确定。
[0140] 下文将参照图7描述图像畸变信息确定步骤(S300)中的处理,图7示出了根据本 发明的第一实施例的图像畸变信息确定步骤中的处理的流程图。该处理的特征在于根据文 档图像中的文本区域的畸变信息获得文档图像中的非文本区域的畸变信息,从而可根据文 本区域和非文本区域的畸变信息的组合来获得整个文档图像的畸变。
[0141] 文档图像通常可包括非文本区域(还被称为留白区域或边界区域),并且边界区 域通常包括对应于文档图像的左边界、右边界、上边界和下边界并且围绕作为中心区域的 文本区域的左边界区域、右边界区域、上边界区域和下边界区域中的至少一个,并且它们的 畸变信息将基于文本区域的畸变信息被确定。在一种实现中,存在全部四个非文本区域,并 且将根据文本区域依次确定它们的畸变信息。在另一种实现中,不需要处理全部四个边界 区域。例如,如果文本区域的边界及其对应的文档图像的边界足够近(诸如,它们之间的距 离小于预定阈值),可认为在这一侧不存在留白区域,并且这样的非文本区域的畸变信息不 需要被确定。
[0142] 应指出,执行顺序并不特别受限。该顺序通常可被任意选择,只要其畸变信息需要 被确定的所有边界区域的畸变信息可被确定即可。
[0143] 因此,图像畸变信息确定步骤可被执行为使得文本区域的畸变信息被扩展以确定 文档图像的四个边界区域中的至少一个,以便确定整个文档图像的畸变信息。
[0144] 下文,仅仅为了有助于透彻理解本发明,包含网格线的网格将作为畸变信息的示 例被描述。在这样的情况下,图像畸变信息确定处理可包括将文本区域的网格中包括的网 格线延伸至文档图像的对应边界以确定文档图像的对应非文本区域的网格,从而可确定整 个文档图像的最终网格。
[0145] 将参照图7描述文本区域的网格中包含的网格线到文档图像的对应边界的延伸, 图7是示出网格线的延伸的处理的流程图。
[0146] 在步骤S701中,确定网格线与对应边界的延伸交点。
[0147] 在步骤S702中,将网格线延伸至所确定的延伸交点。
[0148] 在步骤S703中,在从网格线到延伸交点的延伸线中定位结点。
[0149] 在步骤S704中,连接各个延伸线中的对应结点以形成用于对应非文本区域的网 格,从而将确定整个文档图像的网格。
[0150] 在上述网格线延伸处理中描述的网格线实际上指的是对应于其畸变信息需要被 确定的边界区域的网格线。也就是说,对于其畸变信息需要被确定的边界区域,如图7所示 的上述网格线延伸处理将对于文本区域的对应于该边界区域的网格线被执行。而且,当四 个边界区域中的至少一个需要被处理时,上述网格线延伸处理将对于边界区域依次执行, 每次针对一个边界区域。
[0151] 上述的用于延伸网格的处理可被等同地应用于任何类型的网格线,只要网格线可 形成反映文档图像的畸变信息的网格并且可在预定方向上延伸即可。常规地,网格通常由 水平网格线和垂直网格线构成,并且其中包含的栅格为大致四边形的形式。作为替代地,网 格线可以是任何其它形式(诸如形成三角形栅格以及任何其它合适的多边形栅格)。
[0152] 在这样的情况中,对于一组网格线,文档图像的对应边界可以是文档图像的这样 的边界,其可在边界处与网格线相交,而不是大致与网格线平行,并且对应的非文本区域 (边界区域)将是文本区域的网格与文档图像的对应边界之间的留白区域,其也可由该组 网格线中的第一网格线和最终网格线限定。
[0153] 例如,在文本区域的网格线包括水平网格线和垂直网格线的情况下,左边界区域 (文本区域和文档图像的左边界)对应于朝左侧延伸的水平网格线(即,具有从右至左的延 伸方向);右边界区域(文本区域和文档图像的右边界)对应于朝右侧延伸的水平网格线 (即,具有从左至右的延伸方向);上边界区域(文本区域和文档图像的上边界)对应于朝 上部延伸的垂直网格线(即,具有从下至上的延伸方向)以及下边界区域(文本区域和文 档图像的下边界)对应于朝下部延伸的垂直网格线(即,具有从上至下的延伸方向)。
[0154] 因此,当四个边界区域中的至少一个需要被处理时,可执行本质为图7中所示的 延伸处理的至少一个对应的以下延伸处理:
[0155] 将文本区域的网格中包含的水平网格线延伸至文档图像的作为对应边界的左边 界,以确定文档图像的作为对应非文本区域的左侧非文本区域的网格;
[0156] 将文本区域的网格中包含的水平网格线延伸至文档图像的作为对应边界的右边 界,以确定文档图像的作为对应非文本区域的右侧非文本区域的网格;
[0157] 将文本区域的网格中包含的垂直网格线延伸至文档图像的作为对应边界的上边 界,以确定文档图像的作为对应非文本区域的上部非文本区域的网格;以及
[0158] 将文本区域的网格中包含的垂直网格线延伸至文档图像的作为对应边界的下边 界,以确定文档图像的作为对应非文本区域的下部非文本区域的网格。
[0159] 应指出,当存在至少一个要被处理的边界区域时,对于各个边界区域的延伸的执 行顺序未被特性限制。该顺序通常可被任意选择。在一种实现中,延伸顺序可根据各个边界 区域的大小(诸如文档边界与该边界区域中的文本区域网格边界之间的距离)被决定,并 且可从大小最大的边界区域到大小最小的边界区域依次执行,反之亦然。在另一种实现中, 延伸可从对应于与文本行一致的水平网格线的边界区域开始,例如延伸可从对应于水平网 格线的边界区域中的大小较大的一个边界区域开始。
[0160] 将参照图8描述网格线与其对应边界线的延伸交点的确定,图8是示出延伸交点 的确定处理的流程图。
[0161] 在步骤S801中,确定文本区域的网格中包含的基准网格线与对应边界的基准延 伸交点。
[0162] 在步骤S802中,对于文本区域的网格中的除基准网格线之外的其余网格线中的 每一个,从基准网格线之一开始,依次基于该网格线的端点与前一水平网格线的对应端点 之间的距离来计算该网格线与该边界的延伸交点。
[0163] 这里,其余网格线中的每一个的延伸交点被计算为使得该延伸交点与前一网格线 和文档图像的边界的延伸交点之间的距离与该文档图像的该边界的长度的比率对应于该 网格线的最接近边界的端点与前一网格线的对应端点之间的距离和该文本区域的对应边 界的长度的比率。
[0164] 这里,该文档图像的边界的长度是基于所确定的基准延伸交点被确定的。
[0165] 关于步骤S801中的处理,在一种实现中,基准延伸交点的确定可进一步包括确定 平行于且最接近于对应边界的网格线与平行于且最接近于基准网格线的文档边界的辅助 交点。
[0166] 其中,该基准延伸交点和辅助交点可被确定为使得该基准延伸交点、辅助交点、对 应边界的最接近端点和文本区域的网格的最接近拐点构成平行四边形。
[0167] 文本区域的网格中包含的基准网格线通常对应于文本区域的网格的边界网格线 (诸如网格的顶部和底部水平边界网格线以及左侧和右侧垂直边界网格线)。根据要被处 理的边界区域的状态,基准网格线可以是一条或多条基准网格线,并且优选地为两条基准 网格线,从而上文描述的步骤S801中的处理可被应用于基准网格线中的每一个。
[0168] 更具体而言,当基准延伸交点包括第一基准延伸交点和第二基准延伸交点时,第 一基准延伸交点是第一网格线与对应边界的延伸交点,其基于第一辅助交点、该边界的第 一端点以及文本区域的网格的第一拐点;并且第二基准延伸交点是第二网格线与对应边界 的延伸交点,其基于第二辅助交点、该边界的第二端点以及文本区域的网格的第二拐点。在 此情况中,文档图像的边界的长度是第一和第二基准延伸交点之间的沿该边界的长度,并 且其余延伸交点可根据第一或第二基准延伸交点被确定。
[0169] 例如,当左边界区域需要被处理时,第一和第二基准网格线将分别是文本区域的 顶部和底部水平网格线,其中,对于顶部水平网格线,第一辅助交点可以是左边界网格线与 文档图像的上边界的交点,对应边界的最接近端点是文档图像的左边界的顶部端点,并且 文本区域的网格的最接近拐点是网格的左上拐点,并且对于底部水平网格线,第一辅助交 点可以是左边界网格线与文档图像的下边界的交点,对应边界的最接近端点是文档图像的 左边界的底部端点,并且文本区域的网格的最接近拐点是网格的左下拐点。
[0170] 从而,左边界上的其余延伸交点可根据顶部或底部基准延伸交点被确定,并且边 界的长度是这两个基准延伸交点之间的沿该边界的距离。
[0171] 对于要被处理的其它边界,用于确定边界上的延伸交点的参数可被如上类似地设 定。
[0172] 当然,对于需要被处理的边界区域,在与该边界区域相邻的两个边界区域中的至 少一个不需要被处理的情况下,对应于这样的不需要被处理的边界区域的基准网格线可变 为边界网格线或者文档图像的边界(两者几乎相同),然后基准交点可被简单确定为与对 应边界的最接近端点或文档图像的最接近的边界拐点相同(两者几乎相同),由此对于这 样的网格线可能不需要执行上述基准延伸交点确定。
[0173] 在确定延伸交点时使用的网格线的端点实际指的是网格线的在对应边界一侧的 端点。
[0174] 在获得边界上的延伸交点之后,网格线将延伸至文档边界上的对应的延伸交点, 以便形成边界区域中的延伸网格线。延伸可遵循一些特定规则(例如特定曲线函数)。各 网格线的曲线函数基于文本区网格线的结点以及基准点被确定。例如,曲线函数可通过样 条插值或者曲线拟合被确定。
[0175] 现在将参照图9描述网格线的延伸线中的结点的定位,图9是示出确定结点时的 处理的流程图。
[0176] 在步骤S901中,对于从文本区域中的网格线到对应的延伸交点的每一延伸网格 线,基于延伸网格线的长度以及文本区域中的网格线中的结点间隔的统计值(例如,均值) 确定要添加在延伸网格线中的结点的数量。
[0177] 在步骤S902中,基于对应非文本区域中的所有延伸网格线的各个延伸网格线的 结点数量的统计值来确定延伸网格线中的均匀结点数量。
[0178] 在步骤S903中,根据所确定的均匀结点数量来确定要添加在各个延伸网格线中 的结点的位置。
[0179] 在一种实现中,要添加在延伸网格线中的结点的位置被确定为使得延伸网格线通 过所确定的均匀结点数量被划分成具有相同长度的分段,分段的数量等于所确定的结点数 + 1 〇
[0180] 在另一种实现中,对于每个网格线,根据文本区域中的网格线中的统计结点间隔 以及所确定的均匀结点数量,延伸线中的结点的位置可被从文本区域中的网格线的端点朝 文本图像的对应边界依次设定。
[0181] 这里,文本区域中的网格线中的统计结点间隔可以是多种形式(诸如平均值),并 且在一种实现中,文本区域中的网格线中的统计结点间隔可以是文本区域中的所有网格线 的平均结点间隔、或者仅文本区域中的对应的一个网格线的平均结点间隔。
[0182] 下文,为了透彻理解整个文档图像的网格的确定,将描述所有四个边界区域被依 次处理的示例,在该示例中,全部四个边界区域需要被依次处理,并且一个处理后的边界区 域将作为要被处理的下一边界区域的基础。
[0183] 在这样的情况下,延伸处理的序列可以包含24个序列(例如,左_>右_>上_>下、 右_>上_>下_>左、上_>左_>下_>右等),并且为了有助于透彻理解延伸处理,延伸处理 将被以左->右->上->下的顺序被描述。应指出,在这样的示例中,各延伸中的延伸网格 线将作为下一网格线延伸的基础。即,左侧延伸网格将作为右侧网格延伸的基础,右侧延伸 网格将作为向上网格延伸的基础,等等。
[0184] 首先,文本区域网格中的水平网格线将被延伸至左侧文档边界,以填充文本区域 网格和左侧文档边界之间的留白区域。
[0185] 首先,将确定水平网格线与左文档边界的延伸交点。通常,水平网格线的延伸交点 可作为水平网格线与左边界的在如下方向上的交点,该方向可以是网格线的左端点的切线 方向,从而各个水平延伸线可从左端点沿这样的方向简单地延伸。
[0186] 更优选地,考虑到在一些情况中,网格线的在端点处的方向可能不能被准确地估 计(例如,短线情况),根据文本区域中的网格线的曲线函数的延伸可进一步被调整以便更 适当。因此,可引入左侧文档边界上的作为基准点的延伸交点以帮助确定校正的延伸方向, 在留白区域高度大的情况下尤其如此。此外,基准点还可将外插值问题变换为内插值问题。
[0187] 在这样的情况中,左侧文档边界上的基准点将是左上基准点和左下基准点,左上 基准点是左侧文档边界与文本区域网格的顶部水平网格线的延伸交点,并且左下部基准点 是左侧文档边界与文本区域网格的底部水平网格线的交点。第一(例如,顶部)和最终(例 如,底部)水平网格线中的每一个可以是第一网格线,并且另一个可以是第二网格线。
[0188] 左下基准点的位置的确定将作为示例被描述,并且这样的确定可等同地应用于任 何其它基准点。
[0189] 如图10所示,P0是文本区域网格的左下点(最接近拐角点),P3是左侧文档边 界的左下点(最接近端点),P1是网格的左边界与底部文档边界之间的延伸交点(辅助交 点),并且P2是底部水平网格线与左侧文档边界的延伸交点(要被确定的基准交点)。
[0190] 实际上,P1和P2可以是需要被优化的变量,其中P2通过将最终水平网格线沿网 格线的左端点的切线方向延伸至左侧文档边界来被初始化,P1通过将第一垂直网格线沿该 网格线的底部端点的切线方向延伸至底部文档边界来被初始化。理想状态是P0P1P2P3构 成平行四边形,从而目标函数被描述为如下:
[0192] 类似地,左侧文档边界的左上基准点可被以相同方式确定,然后这两个基准点的 位置之间的在文档边界上的范围可被确定为用于确定左边界与水平网格线之间的延伸交 点的边界的长度。
[0193] 随着基准点的位置的范围被确定,内部基准点将根据相邻基准点的间隔与相邻文 本区域网格线的间隔成比例的准则被确定。
[0194] 更具体而言,对于每个水平网格线,文本区域的当前网格线的左端点与文本区域 的下一网格线的左端点之间的距离被确定(该距离被标记为Hi (如图11所示));然后,利 用所有距离的总值来对该距离进行归一化,以得到比率
[0196] 这里,N是水平网格线的数量。
[0197] 接下来,左上基准点和左下基准点内的文档左边界根据该比率被分割。
[0198] h = L · α 1
[0199] 这里,L是左上基准点和左下基准点内的左文档边界的长度。
[0200] 结果如图12所示,其中圆圈标记了如上文确定的网格线的延伸交点。与其中延伸 交点可能没有被优化的图11相比,如图12所示的延伸交点更加适当。
[0201] 接下来,水平网格线将延
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1