图像处理装置和方法

文档序号:9930053阅读:522来源:国知局
图像处理装置和方法
【技术领域】
[0001] 本公开设及图像处理领域,具体地设及用于背透去除的装置和方法。
【背景技术】
[0002] 运个部分提供了与本公开有关的背景信息,运不一定是现有技术。
[0003] 在一些两面都存在书写或者印刷文字/图片的文档中,由于反面文档内容的影 响,在正面文档的背景区域中会存在反面背透的文字或图片。同样的现象也存在于反面文 档中。运种现象称为背透(show-t虹OU曲或bleed-t虹OU曲),如图IA和图IB所示。通 常,扫描文档图像里面的背透去除方法主要有两类:一类是只根据单面图像的信息来去除 背透;另一类是根据两面图像的信息来去除背透。与第一类方法相比,第二类方法会根据两 面图像的信息来得到文档图像的前景区域。由于利用了更多的信息,因而能够比较精确地 去除背透区域。在第二类方法中,一个比较关键的地方在于有效地提取文档图像的前景区 域。
[0004] 如图2A和图2B所示,文档图像的前景层包括图片和文字两部分。很多传统的局 部二值化/全局二值化方法可W用来提取图像的前景层。例如,根据设定的颜色或亮度阔 值,将图像像素分类为前景像素和背景像素。然而,运些局部二值化/全局二值化方法只利 用了单个像素或在局部区域内的信息。在一些文档的图片区域里,某些像素的颜色与背景 像素的颜色非常接近,因而会被错误地分类为背景像素。运会导致前景像素的丢失。尽管 有些方法可W用来定位文本行,然而,图像中的图片具有复杂的颜色分布及不规则的形状, 运些方法很难有效地提取图片区域的前景层。因此,本公开将提出一种有效的提取文档前 景区域的方案。

【发明内容】
阳0化]运个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披 露。
[0006] 本公开的目的在于提供一种图像处理装置和图像处理方法,其可W不直接定位文 档图像的前景层,而是通过检测相对容易定位的背景层,然后在检测到背景层之后将背景 层去除,从而更有效地得到文档图像的前景层。
[0007] 根据本公开的一方面,提供了一种图像处理装置,包括:图像获取单元,其获取包 含像素的图像;图片查找单元,其从图像中查找图片区域;背景获取单元,其在图像的不包 括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程W分别获取非图片 背景连通域和图片背景连通域,非图片背景连通域中的每一个像素都被认为是非图片背景 像素,而图片背景连通域中的每一个像素都被认为是图片背景像素;前景获取单元,其分 别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获 取非图片区域的非图片前景区域和图片区域的图片前景区域,非图片前景区域中的每一个 像素都被认为是非图片前景像素,而图片前景区域中的每一个像素都被认为是图片前景像 素;W及合并单元,其将非图片区域的非图片前景区域和图片区域的图片前景区域进行合 并,W获取最终图像前景区域,图像前景区域中的每一个像素都被认为是图像前景像素。
[0008] 根据本公开的另一方面,提供了一种图像处理方法,该方法包括:获取包含像素的 图像;从图像中查找图片区域;在图像的不包括图片区域的非图片区域和图片区域中,分 别执行背景连通域获取过程W分别获取非图片背景连通域和图片背景连通域,非图片背景 连通域中的每一个像素都被认为是非图片背景像素而图片背景连通域中的每一个像素都 被认为是图片背景像素;分别通过将非图片背景连通域和图片背景连通域从非图片区域和 图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域, 非图片前景区域中的每一个像素都被认为是非图片前景像素,而图片前景区域中的每一个 像素都被认为是图片前景像素;化及将非图片区域的非图片前景区域和图片区域的图片前 景区域进行合并,W获取最终图像前景区域,图像前景区域中的每一个像素都被认为是图 像前景像素。
[0009] 根据本公开的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机 器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根 据本公开的图像处理方法。
[0010] 根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有根据本公开 的程序产品。
[0011] 使用根据本公开的图像处理装置和方法,可W将文档图像划分为候选图片区域W 及非候选图片区域。然后,定位运两类区域的背景层。在检测到运两类区域的背景层之后, 将其背景层去除,从而得到了文档图像的初始前景层。最后,对文档的初始前景层去除小的 噪声后得到最终的前景层图像,从而更有效地得到文档图像的前景层。
[0012] 运个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范 围。
【附图说明】
[0013] 在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不 旨在限制本公开的范围。在附图中:
[0014] 图IA和图IB示出了本公开的技术方案所针对的存在背透的示例图像;
[0015] 图2A示例性示出包括图片区域和文字区域的输入图像;
[0016] 图2B示出图2A的输入图像的前景层;
[0017] 图3为根据本公开的技术方案的基本思路的流程图;
[0018] 图4为根据本公开的实施例的图像处理装置的框图;
[0019] 图5为根据本公开的实施例的图像处理装置的一部分的框图;
[0020] 图6示例性示出本公开的实施例中的连通域的外接矩形;
[0021] 图7为根据本公开的实施例的图像处理装置的一部分的框图;
[0022] 图8为根据本公开的另一个实施例的图像处理装置的框图;
[0023] 图9为根据本公开的实施例的图像处理装置的一部分的框图;
[0024] 图10为根据本公开的实施例的图像处理装置的一部分的框图;
[00巧]图11为根据本公开的实施例的图像处理方法的流程图; 阳0%] 图12A示例性示出初始前景像素层;
[0027] 图12B示例性示出针对图12A的初始前景像素层的二值化距离图像; 阳02引图12C示例性示出针对图12A的初始前景像素层的最终前景图像层;
[0029] 图13示例性示出从源图像中裁剪得到的图像块;W及
[0030] 图14为其中可W实现根据本公开的实施例的图像处理装置和方法的通用个人计 算机的示例性结构的框图。
[0031] 虽然本公开容易经受各种修改和替换形式,但是其特定实施例已作为例子在附图 中示出,并且在此详细描述。然而应当理解的是,在此对特定实施例的描述并不打算将本公 开限制到公开的具体形式,而是相反地,本公开目的是要覆盖落在本公开的精神和范围之 内的所有修改、等效和替换。要注意的是,贯穿几个附图,相应的标号指示相应的部件。 阳0巧实施方式
[0033] 现在参考附图来更加充分地描述本公开的示例。W下描述实质上只是示例性的, 而不旨在限制本公开、应用或用途。
[0034] 下面提供了示例实施例,W便本公开将会变得详尽,并且将会向本领域技术人员 充分地传达其范围。阐述了众多的特定细节如特定单元、装置和方法的示例,W提供对本公 开的实施例的详尽理解。对于本领域技术人员而言将会明显的是,不需要使用特定的细节, 示例实施例可W用许多不同的形式来实施,它们都不应当被解释为限制本公开的范围。在 某些示例实施例中,没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。
[0035] 图IA和图IB示出了本公开的技术方案所针对的存在背透的示例图像。当例如对 文档进行扫描时,通常会发生所谓的背透现象,亦即在其中一页能看到另一页的内容。如图 IA和图IB所示,在得到的扫描图像中,既存在由前景像素组成的正常图像部分,又存在由 背透像素组成的背透图像。显然,背透像素的存在严重影响了文档的可读性,并进而可能会 影响到自动字符识别。因此,有必要去除扫描图像中的背透部分。
[0036] 如上面提到的那样,去除背透的方法主要是根据单面图像的信息和根据两面图像 的信息来去除背透。在第二种方法中,关键在于有效地提取文档图像的前景层。图2A示出 包括图片区域和文字区域的输入图像,而图2B示出该输入图像的前景层。在图2B中,黑色 像素表示前景像素,而白色像素表示背景像素。很多传统的局部/全局二值化方法可W用 来提取图像的前景层。然而,运些方法只利用了单个像素或在局部区域内的信息。而且,在 一些文档的图片区域里,某些像素的颜色与背景像素的颜色非常接近,因而会被错误地分 类为背景像素。运会导致前景像素的丢失。尽管有些方法可W用来定位文本行,然而图像 中的图片具有复杂的颜色分布及不规则的形状,运些方法很难有效的提取图片区域的前景 层。因此,本公开提出一种有效的提取文档前景区域的方案。
[0037] 根据本公开的技术方案的基本思路并不直接定位图像的前景层,而是通过检测相 对容易定位的背景层。然后,在检测到背景层之后将背景层去除,从而得到图像的前景层。
[0038] 图3示出根据本公开的技术方案的基本思路的流程图。如图3所示,从输入图像 中定位候选图片区域,同时获取去除候选图片区域之外的非候选图片区域。亦即,在此图像 被划分为两部分:候选图片区域和非候选图片区域。接下来,在候选图片区域化及非候选图 片区域中,分别通过连通域分析来检测各自的背景区域。然后,在候
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1