用于文档图像的畸变校正方法和设备的制造方法_4

文档序号:9472204阅读:来源:国知局
0140] 下文,将参照图10详细描述根据第一实施例的方法中的子区域基线延伸步骤的 处理。送样的处理将对于被划分的至少一个子区域中的每一个顺序执行,并且可被按任何 顺序执行,例如从顶部到底部、从底部到顶部等,只要所有子区域将被处理即可。
[0141] 在子区域基线延伸中,对于每个子区域,如果在该子区域中存在至少一条短基线, 将从该子区域中包含的至少一条短基线的全部中选择具有最大长度的短基线,否则该处理 将进行至下一子区域。送里,所选择的短基线的长度将如上郝样类似地限定。
[0142] 然后,所选择的短基线基于当前子区域中包含的两个长基线(即,开始长基线和 结尾长基线)被延伸。
[0143] 送里,将参照图11描述延伸子区域中的短基线的处理,其中为了描述起见,文本 区域中的文本行已被假定为左对齐,因此延伸短基线指示的将短基线的右端点延伸至右边 界。
[0144] 如图11所示,从当前短基线的右端点起,短基线可被W固定步长(送里,X轴上的 步长为1个像素,当然,其它步长也是可能的)延伸至右侧文本区域边界,如图11中的虚线 楠圆所示。在各延伸位置处,该位置的y轴位置被确定为满足W下条件:
[0145]
[0146] 送里,dl和d2是短基线的当前端点分别与该子区域的顶部和底部长基线之间的 距离(在y轴上测量),并且dr和d2'是该短基线的当前端点将一步延伸到的位置分别与 该子区域的顶部和底部长基线之间的距离。
[0147] 延伸位置的水平坐标X'被定义为:
[014 引
[0149] 送里,Xt。。和XbDtt。。分别是顶部长基线和底部长基线的点的X轴坐标,该点对应于 延伸位置并且具有如上定义的y轴坐标。
[0150] 因此,短基线将逐步延伸,直至其最终延伸点(X。,y。)将基于顶部长基线和底部长 基线的对应端点的坐标(xl,yl)和(x2,y2)被确定。
[0151] 应指出,送样的描述仅是示例性的,并且该处理可等同地应用于其中短基线的左 端点将被延伸至左边界的右对齐情况,其中短基线的右端点和左端点将分别被延伸至右边 界和左边界的中央对齐情况。
[0152] 然后,当前子区域将通过经延伸的短基线被划分成两个新子区域,其中该两个新 子区域之一由该两个长基线之一(例如,顶部长基线)和经延伸的短基线限定(送两个基 线将作为该新子区域的顶部长基线和底部长基线),而该两个新子区域中的另一个由该经 延伸的短基线和该两个长基线中的另一个(例如,底部长基线)限定(送两个基线将作为 该新子区域的顶部长基线和底部长基线)。
[0153] 图12示出基于子区域中的经延伸的基线来分割子区域的示例。如图12中所示, 图9中所示的子区域1被划分成两个新子区域(子区域11和12)。在划分的新子区域11 中,其顶部长基线是子区域1的原始顶部长基线(图9中所示的长基线1),而其底部长基线 是当前的经延伸的基线,如实线矩形框所示,而在划分的新子区域12中,其顶部长基线是 当前的经延伸的基线,而底部长基线是子区域1的原始底部长基线(图9中所示的长基线 2)。
[0154] 接下来,对于该新子区域中的每一个,将类似地并且顺序地执行上述选择、延伸和 划分处理,直至该新子区域中包含的所有短基线已被延伸。由此,当前子区域中包含的所有 短基线将被延伸。此后,上述的选择、延伸和划分处理将进行至下一子区域,直至所有子区 域已被处理,从而所有子区域中的短基线(即,文本区域中的所有短基线)已被延伸。
[0155] 图13示出其中短基线已被延伸的文本区域的结果。
[0156] 应指出,送样的描述仅是示例性的,并且送样的短基线延伸处理可等同地应用于 其中短基线的左端点将被延伸至左边界的右对齐情况(即,短基线的左侧是留白区域的情 况),其中短基线的右端点和左端点将分别被延伸至右边界和左边界的中央对齐情况(即, 短基线的左右两侧都是留白区域的情况)。
[0157] 考虑文本区域的顶部或底部基线可能是短基线的特定情况。由于送样的短基线将 不被包含在上述划分的子区域中,送样的短基线可能不经受上述基线延伸处理。因此,送样 的短基线将被单独地延伸。
[0158] 送样的顶部或底部短基线的延伸将基于其相邻的长基线,并且将参照图13被描 述,图13示意性地示出底部短基线的延伸(示意性地对应于步骤S230)。
[0159] 如图13所示,文本区域的基线化0)是短基线。
[0160] 在延伸处理中,将选择与该短基线最接近的两个长基线(L1和L2)。在一种实现 中,最接近的两个长基线将在与该短基线相邻的并且已经受了上述子区域延伸的子区域中 被选择,因此该最接近的两个长基线将是被提取的长基线和经延伸的短基线的全部中的两 个最接近的基线。
[0161] 从当前短基线的右端点起,该短基线将被W固定步长(送里,X轴上的步长为1个 像素,当然,其它步长也是可能的)延伸至右侧文本区域边界。在各延伸位置处,该位置的 y轴位置被确定为满足W下条件:
[0162]
[0163] 送里,hei和hc2是在短基线的当前端点处该短基线与该第一最接近长基线之间的 距离W及第一最接近长基线与第二最接近长基线之间的距离(在y轴上测量),并且hei'和 h"2'是在该短基线的当前端点将一步延伸到的位置处该短基线与该子区域的第一最接近长 基线之间的距离W及该第一最接近长基线和第二最接近长基线之间的距离。
[0164] 延伸位置的水平坐标X'被定义为
[0165]
[0166] 送里,和X2分别是该第一和第二最接近长基线的点的X轴坐标,该点对应于该 延伸位置并且具有如上定义的y轴坐标。
[0167] 因此,短基线将逐步延伸,直至其最终延伸点(X。,y。)将基于该第一和第二长基线 的对应端点的坐标被确定。
[016引应指出,上述的底部基线延伸处理可等同地应用于为短基线的顶部基线。顶部和 底部短基线的延伸结果在图15中被示出。
[0169] 此外,与上文所述类似的,尽管上述底部基线延伸处理在左对齐情况下被执行,但 是其可等同地应用于其中短基线的左端点将被延伸至左边界的右对齐情况(即,短基线的 左侧是留白区域的情况),其中短基线的右端点和左端点将分别被延伸至右边界和左边界 的中央对齐情况(目P,短基线的左右两侧都是留白区域的情况)。
[0170] 应指出,上述的短基线延伸方式(即,短基线的延伸点的坐标的确定方式)仅是示 例性的,并且送样的延伸主要旨在延伸短基线W便遵循参考长基线(子区域延伸中的顶部 和底部长基线,或者顶部和底部短基线延伸中的两个最接近的长基线),由此延伸方式并不 局限于所示出的方式,并且其它延伸方式也是可能的,参考长基线也可W是除了上述的长 基线之外的其它基线。
[0171] 下文,将参照图16和17描述根据本发明的第一实施例的方法中的校正步骤的处 理。通常,校正将首先基于所获得的文档图像的文本区域的基线(包括被提取的长基线和 延伸的短基线的全部)来得出关于文档图像的文本区域的崎变的信息,然后基于崎变信息 来校正文档图像的崎变。
[0172] 在校正处理的一种典型实现中,关于文档图像的文本区域的崎变的信息可W是扭 曲网格(wa巧ingmesh),由此校正步骤将基于所获得的基线来生成送样的扭曲网格W进行 校正。
[0173] 反映文本区域的网格通常包括网格线(meshline),该网格线彼此交叉,从而文本 区域的网格可被划分成多个栅格,并且栅格的形状可基于网格线的布置被确定。网格线可 参照文档图像的文本区域中的文本行被形成。在一种典型实现中,网格中的网格线可由水 平网格线和垂直网格线构成,其中水平网格线将与文本行一致并且与对于文本行提取的基 线基本相同,并且垂直网格线是与水平网格线基本垂直的网格线,从而网格的栅格将是四 边形。
[0174] 在其它实现中,网格线可W是任何其它布置,诸如形成H角形栅格,W及任何其它 合适的多边形栅格,只要一组网格线可与文本行一致(例如,与对于文本行提取的基线基 本相同)即可。
[01巧]通常,除了基线的端点之外,扭曲网格还基于文档图像的文本区域的边界来生成, 该边界可通过基线的端点而获得。在文档图像的文本行在水平方向上的情况下,文本区域 的边界将指的是文本区域的左边界和右边界。当然,如果文本行在垂直方向上,则边界将是 上边界和下边界。
[0176] 应指出,文本区域的边界可基于所获得的基线(包括所提取的长基线和经延伸的 短基线)W各种方式(诸如,通过直接连接各基线的端点,或者通过曲线拟合各基线的端 点)被确定,因而未被特别限制。由于边界的确定利用了经延伸的短基线,而不是如现有 技术中郝样忽略送些短基线,则文档图像的文本区域的边界继而其崎变信息可被准确地获 得,即使该边界获得方法是现有技术也是如此。
[0177] 考虑到所生成的扭曲网格应包含文档图像的整个文本区域,特别地,应包含文本 区域的第一文本行和最终文本行,在扭曲网格的生成中应执行确保第一和最后文本行被涵 盖在生成的网格中的处理。下文,描述用于第一文本行的处理作为示例,并且送样的示例可 等同地应用于最终文本行。
[0178] 在对于第一文本行的处理中,首先,计算所有获得的基线(网格的网格线)的平均 网格高度,并且将其标记为avg_H,然后,计算第一文本行的文本高度(在步骤100中计算第 一文本行的顶部线的NCS函数),并且将其标记为H_text。接下来,延伸左侧文本边界W用 作顶部边界的起点,并且延伸距离可W是avg_H和H_text的最大值,然后,可通过从该起点 遵循第一文本行的基线来延伸线W获得网格的顶部线。应指出,该延伸可被W与上述的延 伸顶部基线的方式相似的方式被实现,但是,延伸并不局限于此,并且其它的延伸方式也可 被使用,只要可获得扭曲网格的适当的顶部线即可。
[0179] 通过文档图像的文本区域的所有获得的基线(包括所提取的长基线和经延伸的 短基线)和顶部及底部线W及所确定的左边界和右边界,基线和顶部及底部线中的每一条 线被划分成具有相等长度的分段(该长度是根据基线的起点和终点W及被设定的分段数 量来计算的,送里分段数量由基线的最大长度W及平均网格高度的比确定),从而可生成文 档图像的文本区域的扭曲网格,如图16所示。
[0180] 接下来,将基于所生成的网格执行文档图像的崎变校正。
[0181] 对于扭曲网格中的每一栅格,将生成变换映射图,该变换映射图可将崎变图像中 的每个点映射到去扭曲图像。例如,通过参照边界插值技术,根据所获得的扭曲网格可构建 从输入的崎变文档图像到校正后的图像的图像映射。在获得变换映射图之后,可通过对原 始文档区域中的像素进行双
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1