图像版面区域轮廓分析方法

文档序号:6585213阅读:196来源:国知局

专利名称::图像版面区域轮廓分析方法
技术领域
:本发明属于数字图像处理技术及文字识别(OCR,OpticalCharacterRecognition)
技术领域
,特别涉及一种图像版面区域轮廓分析方法。
背景技术
:文档图像中的内容可以分为文本(text)、表格(table)、图像(picture)、图形(graphics)、分隔符(separator)等,由同一种内容构成的区域称为同质区域(homogeneousregion)。版面分析就是将文档图像中的同质区域进行分割、标注的一种方法,它是进行文档图像分析(DIA,DocumentImageAnalysis)和OCR处理的首要步骤。文档图像经过版面分析后,得到一系列版面区域,为了后续处理方便,一般采用这些区域的最小外接矩形来对其轮廓进行分析。当各个区域外接矩形彼此无交叠时,这种分析方法是有效的。但是,当文档图像中存在不规则形状的文本、插入图片或者文档图像存在倾斜时,各区域的外接矩形会发生重叠,导致版面区域拟合的准确性差。
发明内容本发明针对文档图像版面区域轮廓外接矩形分析方法存在的缺陷,提出了一种图像版面区域轮廓分析方法。所谓直线多边形,就是只由水平边和竖直边构成的多边形,它一方面能够对版面区域轮廓进行有效拟合,另一方面便于记录和处理。为解决上述技术问题,本发明提供一种图像版面区域轮廓分析方法,该方法包括步骤(1),计算每个版面区域的最小外接矩形;步骤(2),找出其外接矩形与当前区域外接矩形相交的其他区域,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;步骤(3),对所述当前区域外接矩形内的像素点分类标记;步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。优选地,步骤(3)中像素点包括背景点、属于所述当前区域的前景点和属于所述其他区域的前景点。优选地,步骤(4)中可以使用四叉树递归分割法分割所述当前区域外接矩形内的像素点。优选地,所述四叉树递归分割法具体可以为根据只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点、含有背景点和属于所述当前区域的前景点的叶子节点、含有背景点和属于所述其他区域的前景点的叶子节点对所述当前区域外接矩形的像素点进行分割。优选地,步骤(5)中可以将只含有所述当前区域前景点的叶子节点、只含有背景点和所述当前区域前景点的叶子节点加和得到所述当前区域的直线多边形轮廓。优选地,所述步骤(6)具体可以为在所述当前区域的直线多边形轮廓上,以任一顶点为起始点,按照顺序方向,依次记录所有的顶点,形成所述当前区域的直线多边形。优选地,在步骤(1)之前还可以包括获取需要处理的文档图像;所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域。优选地,所述方法还可以包括步骤(7),优化所述直线多边形轮廓的顶点。本发明还提供了一种图像版面区域分析系统,该系统包括计算单元、判断单元、分类单元和分割单元,其中,计算单元,用于计算所述所有版面区域的最小外接矩形;判断单元,用于找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点作为对所述当前区域轮廓的分析,并且结束分析;分类单元,用于在所述判断单元找到所述其他区域外接矩形时对所述当前区域外接矩形内的像素点分类标记;分割单元,用于对所述当前区域外接矩形内的像素点进行分割;由计算单元根据所述分割单元分割得到的像素点获取所述当前区域的直线多边形轮廓,记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。本发明中,通过直线多边形进行版面区域轮廓的分析,大大提高了版面区域轮廓拟合的准确性,方便了后续记录和处理。图1为本发明实施例中文档图像版面区域轮廓分析方法的流程图。图2a为本发明实施例中文档图像的二值图像。图2b为本发明实施例中文档图像版面分析结果。图3为对图2b所示的版面区域201进行四叉树分割的示意图。图4a为本实施例中的版面区域201根据四叉树分割得到的直线多边形轮廓。图4b为本实施例中的版面区域201经直线多边形优化后的轮廓。图5为本发明实施例的文档图像的直线多边形轮廓分析结果。具体实施例方式为了能更清楚地理解本发明的技术内容,特举以下实施例详细说明。本发明首先提供一文档图像版面区域轮廓分析方法的实施例,结合附图具体分析如下。通过图像获取单元如扫描单元获取需要处理文档的图像,由分析单元对所述文档图像先进行二值化,然后进行版面分析,二值化和版面分析有很多成熟的算法,此处不赘述。经过版面分析后,得到一系列版面区域,需要对其轮廓进行直线多边形分析。图2a所示为本实施例中的文档图像的二值图像,图2b所示为本实施例中文档图像版面分析结果,版面共分为三个区域201、202、203,每个区域轮廓用其最小外接矩形分析,为了便于区分,三个区域用是三个不同的灰度级进行表示。在通过版面分析得到各版面区域后,利用本发明提出的版面区域轮廓分析方法对各版面区域的轮廓进行分析。图1所示为本实施例的实施流程图,以图2b中的区域201为例,本实施例的版面区域轮廓分析方法的具体实施步骤如下步骤101,由计算单元计算文档图像所有版面区域的最小外接矩形。通过计算每个版面区域的最上端像素点、最下端像素点、最左端像素点、最右端像素点的位置,可得到版面区域的最小外接矩形,为叙述方便,后面简称为外接矩形。步骤102,由判断单元找出与当前所要处理的版面区域外接矩形相交的其他区域外接矩形。如果没有其他区域外接矩形与当前区域外接矩形相交,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;否则转入下一步。如图2b所示,版面区域203的外接矩形与版面区域201的外接矩形相交,所以继续执行下一步。步骤103,由分类单元对当前所要处理的版面区域外接矩形内的像素点进行分类标记。所述当前区域外接矩形内的像素点可以分为三类,即背景点、属于所述当前区域的前景点和属于其他区域的前景点,这三类像素点可用不同的标识进行区分,比如,背景点用0表示,属于所述当前区域的前景点用1表示,属于其他区域的前景点用2表示。对像素点进行分类是为了下一步中四叉树递归分割使用。步骤104,由分割单元利用四叉树递归分割方法分割所述当前区域外接矩形内的像素点。对像素点的分割时根据分类标记的像素点进行的。四叉树递归分割方法如下其根节点对应于当前区域的外接矩形,将所述当前区域的外接矩形均分为四份,每个子矩形分别对应于四叉树的第一层四个节点中的一个,再将第一层各节点对应矩形分别均分为四份,则形成四叉树的第二层节点,以此类推,进行递归分割,当节点矩形范围内只含有单一类型像素点如只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点或者含有背景点和属于所述当前区域的前景点或者含有背景点和属于其他区域的前景点时,节点停止分裂,该节点即为四叉树的叶子节点。对区域201,图3对其四叉树递归分割过程进行了描述。301为四叉树的根节点,对图像均分为4份后,得到四叉树的第一层节点,其中有三个节点需要进一步分割。以节点302为例,说明其整个递归分割过程节点302均分为四份,得到四叉树的第二层节点,其中节点303需要进一步分割;将节点303均分为四份,得到四叉树的第三层节点,其中节点304、305需要进一步分割;将节点304、305分别均分为四份,得到四叉树的第四层节点,其中节点306、307需要进一步分割;将节点306、307分别均分为四份,得到四叉树的第五层节点,这些节点都不再需要进一步分割,节点302的递归分割过程结束。步骤105,由计算单元根据上述分割所得四叉树叶子节点获取所述当前区域的直线多边形轮廓。经过四叉树递归分割后,四叉树中的所有叶子节点可分为五类,即只含有背景点的叶子节点(C1)、只含有所述当前区域前景点的叶子节点(C2)、只含有其他区域前景点的叶子节点(C3)、只含有背景点和所述当前区域前景点的叶子节点(C4)、只含有背景点和其他区域前景点的叶子节点(C5)。将类别为C2和C4的叶子节点加和得到的区域的轮廓,即为所述当前区域的直线多边形轮廓。图4a所示为版面区域201经过四叉树递归分割后得到的直线多边形轮廓。步骤106,由计算单元记录直线多边形轮廓的顶点。在所述当前区域的直线多边形轮廓上,以某个顶点为起始点,按照一定顺序方向,依次记录所有的顶点,形成直线多边形。对版面区域201,以左上点为起始点,依次记录各顶点,结果为{(25,77),(25,732),(523,732),(523,692),(488,692),(488,609),(594,609),(594,527),(879,527),(879,517),(897,517),(897,493),(888,493),(888,486),(897,486),(897,445),(951,445),(951,404),(987,404),(987,363),(1022,363),(1022,322),(1164,322),(1164,77)},共24个顶点。步骤107,由优化单元优化所述当前区域直线多边形轮廓的顶点。在上述得到的直线多边形顶点中,去掉某些顶点并不影响对当前区域轮廓分析的有效性,相反,由于顶点数目的减少,会简化后续处理,所以需要对已得的直线多边形顶点进行优化,即在不影响当前区域轮廓分析有效性的前提下,尽量减少顶点数目。优化时,每四个相邻顶点为一组,如果中间两个顶点相对于两端两个顶点形成凹陷或者凸起,且其凹陷或凸起区域内没有前景像素点,则可将该凹陷或凸起抹平,即可去掉中间两个顶点并调整两端顶点的坐标。逐顶点测试这种四点组,四点中如果存在已经被抹去的顶点,则跳过该组,如此遍历所有的顶点。最后,从顶点分析中去掉这些被抹去顶点,并去掉由于抹平而引起合并的直线多边形边上的多余顶点,得到最终的分析结果。对版面区域201,以左上点为起始点,依次记录各顶点,结果为{(25,77),(25,732),(488,732),(488,609),(594,609),(594,527),(879,527),(879,517),(888,517),(888,486),(897,486),(897,445),(951,445),(951,404),(987,404),(987,363),(1022,363),(1022,322),(1164,322),(1164,77)},共20个顶点。图4b为本实施例中的版面区域201经直线多边形优化后的轮廓。当处理完一个版面区域后,该版面区域直线多边形轮廓内的像素点全部置为前景点,再进行其他未处理区域的处理。图5示出了当所有版面区域轮廓都经过直线多边形分析后的结果。本发明中,通过直线多边形进行版面区域轮廓的分析,大大提高了版面区域轮廓拟合的准确性,方便了后续记录和处理。权利要求一种图像版面区域轮廓分析方法,其特征在于,包括步骤(1),计算每个版面区域的最小外接矩形;步骤(2),找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;步骤(3),对所述当前区域外接矩形内的像素点分类标记;步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。2.根据权利要求1所述的方法,其特征在于,步骤(3)中像素点包括背景点、属于所述当前区域的前景点和属于所述其他区域的前景点。3.根据权利要求1所述的方法,其特征在于,步骤(4)中使用四叉树递归分割法分割所述当前区域外接矩形内的像素点。4.根据权利要求3所述的方法,其特征在于,所述四叉树递归分割法为根据只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点、含有背景点和属于所述当前区域的前景点的叶子节点、含有背景点和属于所述其他区域的前景点的叶子节点对所述当前区域外接矩形的像素点进行分割。5.根据权利要求4所述的方法,其特征在于,步骤(5)中将只含有所述当前区域前景点的叶子节点、只含有背景点和所述当前区域前景点的叶子节点加和得到所述当前区域的直线多边形轮廓。6.根据权利要求1所述的方法,其特征在于,所述步骤(6)具体为在所述当前区域的直线多边形轮廓上,以任一顶点为起始点,按照顺序方向,依次记录所有的顶点,形成所述当前区域的直线多边形。7.根据权利要求1所述的方法,其特征在于,在步骤(1)之前还包括通过扫描获取需要处理的文档图像;对所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域。8.根据权利要求1、6或7所述的方法,其特征在于,还包括步骤(7),优化所述直线多边形轮廓的顶点。9.一种图像版面区域分析系统,其特征在于,包括计算单元、判断单元、分类单元和分割单元,其中,计算单元,用于计算各个版面区域的最小外接矩形;判断单元,用于找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点作为对所述当前区域轮廓的分析,并且结束分析;分类单元,用于在所述判断单元找到所述其他区域外接矩形时对所述当前区域外接矩形内的像素点分类标记;分割单元,用于对所述当前区域外接矩形内的像素点进行分割,由计算单元根据所述分割单元分割得到的像素点获取所述当前区域的直线多边形轮廓,记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。10.根据权利要求9所述的系统,其特征在于,还包括图像获取单元,用于获取需要处理的文档的图像;分析单元,用于对所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域;优化单元,用于对所述当前区域轮廓的直线多边形顶点进行优化。全文摘要本发明提出一种图像版面区域轮廓分析方法,属于数字图像处理技术及文字识别领域。该图像版面区域轮廓分析方法包括步骤(1),计算每个版面区域的最小外接矩形;步骤(2),找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;步骤(3),对所述当前区域外接矩形内的像素点分类标记;步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。文档编号G06K9/20GK101877062SQ20091024279公开日2010年11月3日申请日期2009年12月21日优先权日2009年12月21日发明者刘正珍,李永彬申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1