图像去除黑边的方法与流程

文档序号:24622915发布日期:2021-04-09 20:28阅读:1448来源:国知局
图像去除黑边的方法与流程

本申请涉及文档电子化领域,尤其涉及一种图像去除黑边的方法。



背景技术:

现有技术中纸质文档在进行电子化归档时,需要将纸质文档扫描生成图像。扫描生成的图像由于各种原因会带有黑边,为了能够去除黑边,采取对图像上下左右四个方向扫描的方式,找到黑边边界,进行裁剪去除。

在实现现有技术的过程中,发明人发现:

采用上述所述方法只能裁剪出矩形黑边的图像,具有一定的局限性。比如,扫描的图像黑边边缘大部分都不是直线,通过该方法清楚后仍会有残留边缘,对后续ocr识别影响很大,且生成的图像也不美观;当图像黑边有噪点时,效果会变得比较差。

因此,需要提供一种图像完整去除黑边的技术方案。



技术实现要素:

本申请实施例提供一种图像去除黑边的方法。用以解决图像黑边不能完全去除的技术问题。

在本申请提供的一种图像去除黑边的方法,包括以下步骤:

获取扫描图像;

对所述扫描图像采用图像去除黑边模型处理;

根据图像去除黑边模型处理,生成去除黑边的图像。

进一步的,所述对扫描图像采用图像去除黑边模型处理,具体包括:

对扫描图像进行图像形态学运算,生成第一中间图像;

处理第一中间图像,生成去除黑边的图像。

进一步的,处理第一中间图像,生成去除黑边的图像,具体包括:

判断第一中间图像像素点阈值是否符合预设条件;

当第一中间图像像素点阈值符合预设条件时,处理第一中间图像采用替换和均值平滑方法,生成去除黑边的图像。

进一步的,判断第一中间图像像素点阈值是否符合预设条件,具体还包括:

当第一中间图像像素点阈值不符合预设条件时,确定第一中间图像为去除黑边的图像。

进一步的,所述预设条件为第一中间图像像素点阈值在预设区间范围内。

进一步的,所述处理第一中间图像采用替换和均值平滑方法,具体包括:

替换第一中间图像中在预设区间范围内的像素点;

淡化边缘渐变像素点

进一步的,所述在执行对扫描图像进行图像形态学运算之前,还包括:

对扫描图像进行灰度化、降噪中至少一项处理;

对扫描图像边缘检测,提取扫描图像边缘轮廓;

根据经过灰度化或者降噪中至少一项处理的扫描图像和提取扫描图像边缘轮廓,生成掩码图。

进一步的,所述对扫描图像边缘检测,方便提取扫描图像轮廓,具体包括:

对扫描图像中各个像素点进行微分或者二阶求导,得出扫描图像边缘轮廓。

一种图像去除黑边的装置,其特征在于,包括:

获取模块,用于获取扫描图像;

处理模块,用于对所述扫描图像采用图像去除黑边模型处理;

生成模块,用于根据图像去除黑边模型处理,生成去除黑边的图像。

进一步的,所述分析模块,具体用于:

对扫描图像进行图像形态学运算,生成第一中间图像;

处理第一中间图像,生成去除黑边的图像。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请实施例提供的图像去除黑边的工作流程图;

图2为本申请实施例提供的图像去除黑边的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参照图1,为本申请实施例提供的去除图像黑边的方法,具体包括以下步骤:

s100:获取扫描图像。

获取扫描图像主要针对在电子化归档时,纸质文档扫描生成的图像中有黑边的图像。此图像在扫描归档中,由于图像产生的黑边,往往会造成图像的整体质量差以至于在后续的ocr识别中无法继续进行工作,且图像也不美观。

具体的,在本申请提供的一种优选的实施例中,无论黑边产生的原因是由于扫描机器的故障,还是图像本生存在的像素问题,获取的扫描图像都是在对其进行扫描之后进行的处理。

进一步的,在本申请提供的一种优选的实施例中,所述获取的扫描图像在对其处理前至少可以是jpg、png、bmp格式的图片;也可以是由jpg、png、bmp的图片转化为某种特定格式的图片。可以理解的是,这里所述的图像的具体格式,显然不构成对本申请具体保护范围的限制。

s110:对所述扫描图像采用图像去除黑边模型处理。

其中,对所述扫描图像采用图像去除黑边模型处理前,还可以对所扫描的图像进行多种方式的预先处理。

具体的,在本申请提供的一种优选的实施例中,所述的预先处理可以是灰度化处理。通过灰度化处理,减少数据的运算量。灰度就是没有色彩,rgb色彩分量全部相等。如果是一个二值灰度图象,它的像素值只能为0或1,我们说它的灰度级为2。用个例子来说明:一个256级灰度的图象,如果rgb三个量相同时,如:rgb(100,100,100)就代表灰度为100,rgb(50,50,50)代表灰度为50。

现在大部分的彩色图像都是采用rgb颜色模式,处理图像的时候,要分别对rgb三种分量进行处理,实际上rgb并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配。

图像灰度化处理可以作为图像处理的预处理步骤,为之后的图像分割、图像识别和图像分析等上层操作做准备。

应当重点指出的是,灰度化处理所采用的方法可以是分量法:将彩色图像中的三分量的亮度作为三个灰度图像的灰度值,可根据应用需要选取一种灰度图像;最大值法:将彩色图像中的三分量亮度的最大值作为灰度图的灰度值;平均值法:将彩色图像中的三分量亮度求平均得到一个灰度值;加权平均法:根据重要性及其它指标,将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对rgb三分量进行加权平均能得到较合理的灰度图像。可以理解的是,这里所述的图像灰度化处理的方法,显然不构成对本申请具体保护范围的限制。

进一步的,在本申请提供的一种优选的实施例中,所述的预先处理可以是降噪处理。噪声是图像干扰的重要原因。一幅图像在实际应用中可能存在各种各样的噪声,这些噪声可能在传输中产生,也可能在量化等处理中产生。根据噪声和信号的关系可将其分为三种形式,在这三种形式中,f(x,y)表示给定原始图像,g(x,y)表示图像信号,n(x,y)表示噪声。

具体的,加性噪声,此类噪声与输入图像信号无关,含噪图像可表示为f(x,y)=g(x,y)+n(x,y),信道噪声及光导摄像管的摄像机扫描图像时产生的噪声就属这类噪声。乘性噪声,此类噪声与图像信号有关,含噪图像可表示为f(x,y)=g(x,y)+n(x,y)g(x,y),飞点扫描器扫描图像时的噪声,电视图像中的相干噪声,胶片中的颗粒噪声就属于此类噪声。量化噪声,此类噪声与输入图像信号无关,是量化过程存在量化误差,再反映到接收端而产生。

应当重点指出的是,对于图像所产生的噪声可通过均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤除器、小波去噪来处理。通过对图像噪声的滤波可减少扫描图片带来的噪点的影响。可以理解的是,这里所述的图像降噪处理的方法,显然不构成对本申请具体保护范围的限制。

进一步的,在本申请提供的一种优选的实施例中,在采用图像去除黑边模型前还需进行其他预先处理。比如,对经过灰度化或者降噪中至少一项处理的扫描图像的边缘检测和提取图像的边缘轮廓,来生成掩码图。

应当指出的是,在本申请提供的一种优选的实施例中,对扫描图像的边缘检测根据灰度化处理过的或者未处理过的图中不同灰度值的相邻区域之间存在不连续,提取图像的边缘轮廓。边缘检测的具体方法是对图像中各个像素点进行微分或者二阶求导,得出扫描图像边缘轮廓。

应当重点指出的是,在本申请实施例中,在对图像采用图像去除黑边模型前,对图像采用的预先处理顺序可以根据实际情况进行修改。例如,在对纸质化文档进行归档前,扫描的图像由于光线强、信噪比大并非对其产生很大的噪点的影响,则可以忽略掉降噪过程。

具体的,在本申请提供的一种优选的实施例中,在对扫描图像进行灰度化或者降噪处理并提取扫描图像的边缘轮廓后,生成图像的掩码图。图像掩码图的生成,是根据在原有图像的基础上,生成一张和原图一样大小的黑色图片;并在黑色图片中投影原有图像的最大轮廓;通过opencv接口填充最大轮廓内的点为白点;从而生成一张黑白二值化的掩码图。黑白二值化掩码图即在图像上像素点灰度值为0或255,即图像只有黑或者白。

可以理解的是,对图像采用图像去除黑边模型处理前,图片需经过灰度化、降噪、边缘检测、提取最大轮廓、生成掩码图,其中,对图像灰度化或者降噪的处理是对图像的后续运算所作的前期准备,并非在对扫描图像进行去黑边过程中都需要。

进一步的,在本申请提供的一种优选的实施例中,所述对扫描图像采用图像去除黑边模型处理,即对扫描图像进行图像形态学运算,生成第一中间图像;处理第一中间图像,生成去除的黑边图像。

具体的,图像形态学运算即腐蚀和膨胀两种算法,膨胀是指将像素加到图像中对象的边缘,而腐蚀是指删除图像中对象的边缘,增加和删除的像素数目依赖于使用的结构元素大小和形状。

应当指出的是,在本申请提供的一种优选的实施例中,对图像去除黑边是通过膨胀算法来实现。即黑白二值化的掩码图在进行膨胀算法后,黑白色交叉的地方的边缘会存在一定的灰度渐变,且尽量使得轮廓外都是黑色的像素。因此,在进行图像形态学运算后,得出的图像即黑白二值化掩码图膨胀所生成的第一中间图像。

进一步的,在本申请提供的一种优选实施例中,处理第一中间图像,生成去除黑边的图像,即通过对黑白二值化掩码图膨胀后的图像进行处理。

具体的,处理黑白二值化掩码图膨胀的图像通过判断是否符合预设条件来确定。

应当指出的是,预设条件是通过对膨胀后的黑白二值化掩码图中的像素点阈值是否在预设区间范围内来确定。膨胀后的黑白二值化掩码图中的像素点阈值是指其轮廓外的像素点阈值,该阈值为动态阈值。该阈值的计算方式是通过当前图像像素平均值和轮廓外最小像素值计算所得。该阈值的计算方法为:

阈值=(平均值+最小像素)/3,

其中,阈值的计算方法中3并非绝对固定的值,也可以是其他相近的整数或非整数值。可以理解的是,这里阈值计算方法的具体计算方式,显然不构成对本申请具体保护范围的限制。

进一步的,在本申请提供的一种优选实施例中,当第一中间的图像像素点阈值不符合预设条件时,则直接输出结果;当第一中间的图像像素点阈值符合预设条件时,即在预设区间范围内时,对其进行替换和均值平滑的方法。

具体的,当第一中间图像像素点符合预设条件的阈值时,对其进行替换和均值平滑。

即替换掉第一中间图像在预设区间范围内的像素点;淡化边缘渐变的像素点通过均值平滑方法。均值平滑是指对每一个像元,在以其为中心的窗口内,取邻域像元的平均值来代替该像元的亮度值,这种方法就是均值平滑,也称均值滤波。均值平滑算法简单,计算速度快,但对图像的边缘和细节有一定的削弱作用。

s130:根据图像去除黑边模型处理,生成去除黑边的图像。

在本申请提供的一种具体实施方式中,若干张纸质文档在进行电子化归档时产生黑边,纸质文档在转化为图像后的格式也变成了jpg、png等多种格式。因此,需要对图像进行去除黑边的处理。在将不同格式的图像进行处理时,可直接进行处理或者将其转化为同一种格式,在获取到这些带有黑边的图像后,首先,对这些图片进行了一系列的预处理。比如,对图像进行灰度化、图像降噪、边缘检测、提取边缘最大面积轮廓、生成图像的掩码图。然后通过图像形态学中的膨胀算法,得出第一中间图像。根据所设阈值与第一中间图像像素点阈值的比较,对第一中间图像进行判断。当在预设区间范围内时,对图像采用替换和均值平滑的方法进行修改;当不在预设区间范围内时,直接输出结果。

请参照图2,为本申请实施例提供的去除图像黑边的装置,包括:

获取模块10,用于获取扫描图像。

处理模块11,用于对所述扫描图像采用图像去除黑边模型处理。

生成模块12,用于根据图像去除黑边模型处理,生成去除黑边的图像。

在本申请提供的一种具体实施方式中,若干张纸质文档在进行电子化归档时产生黑边,黑边并非为直线,而是不同程度的弯曲线,纸质文档在转化为图像后的格式也变成了jpg、png等多种格式。通过获取模块10将产生黑边的图像获取到装置中,经过处理模块中的图像去除黑边模型对产生黑边的文档进行处理,从而生成去除黑边的图像。

这里图像去除黑边模型处理的一种具体应用可以理解为一种虚拟的装置,例如与浏览器相类似的软件产品。获取模块10、处理模块11、生成模块12的一种具体应用可以理解为可以独立封装的功能函数。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1