图像处理装置、二值图像生成方法以及存储介质与流程

文档序号:17187392发布日期:2019-03-22 21:28阅读:179来源:国知局
图像处理装置、二值图像生成方法以及存储介质与流程

本发明涉及图像处理装置、二值图像生成方法以及图像处理程序。



背景技术:

目前,已知将多值图像转换为二值图像的技术。例如,在专利文献1中,公开了基于二值化对象的区域的亮度直方图确定阈值,将比阈值高亮度的像素二值化为白色,将比阈值低亮度的像素二值化为黑色的技术。

在先技术文献

专利文献

专利文献1:日本特开2010-225047号公报

然而,在这种方法中,多值图像中包括的字符等对象有时会与背景同化。



技术实现要素:

用于达成上述目的的图像处理装置,具备:获取部,获取多值图像;以及二值部,生成对多值图像进行二值化而得的二值图像,二值部检测多值图像中的封闭区域,并基于封闭区域的内部的亮度和封闭区域的周围的亮度对封闭区域的内部进行二值化。根据该结构,能够基于封闭区域的内部的亮度和封闭区域的周围的亮度改变二值化处理。因此,例如在封闭区域的内部的亮度与封闭区域的周围的亮度的差较大的情况下和较小的情况下,能够分别执行相对应的二值化处理。

此外,也可以是如下结构,在封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度暗的情况下,二值部进行将封闭区域的主要部分成为黑色的二值化,在封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度亮的情况下,二值部进行将封闭区域的主要部分成为白色的二值化。根据该结构,能够以封闭区域的内部的主要部分与其周围不同化的方式进行二值化。

此外,也可以是如下结构,二值部基于封闭区域的形状的特征对封闭区域的内部进行二值化。根据该结构,能够提高能够将多值图像中包括的对象(例如,字符等)与周围的区域区别地进行二值化的可能性。

此外,也可以是如下结构,在封闭区域比基准尺寸小或比基准形状细的情况下,二值部基于封闭区域的内部的亮度和封闭区域的周围的亮度对封闭区域的内部进行二值化,在封闭区域比基准尺寸大且比基准形状粗的情况下,二值部不参照封闭区域的周围的亮度而是基于封闭区域的内部的亮度对封闭区域的内部进行二值化。根据该结构,能够将字符等是特征对象的可能性较高的区域基于其周围的亮度进行二值化,而对于是对象的可能性较小的封闭区域则以不参照周围的亮度的简单的方法进行二值化。

此外,也可以是如下结构,在与封闭区域外接的矩形的宽度和高度中的一方小于第一基准、且另一方小于第二基准的情况下,二值部判断为封闭区域比基准尺寸小。根据该结构,通过二值化能够容易地确定不应该与周围的区域同化的封闭区域。

此外,也可以是如下结构,二值部基于矩形的宽度和高度的比,判断封闭区域是否比基准形状细。根据该结构,通过二值化能够容易地确定不应该与周围的区域同化的封闭区域。

此外,也可以是如下结构,二值部基于封闭区域的面积和矩形的面积的比,判断封闭区域是否比基准形状细。根据该结构,通过二值化能够容易地确定不应该与周围的区域同化的封闭区域。

此外,也可以是如下结构,在关注像素和关注像素的周围的像素的亮度的分布范围比基准值大的情况下,二值部将关注像素判断为边缘,并基于所判断的边缘检测封闭区域。根据该结构,能够将亮度变化较少的对象作为同一封闭区域。

此外,二值部将由连续的边缘形成的区域和由不是边缘的非边缘像素连续形成的区域确定为封闭区域,根据该结构,能够容易地确定封闭区域。

根据本发明的二值图像生成方法,包括以下步骤:获取多值图像;以及生成对多值图像进行二值化而得的二值图像,在二值图像生成方法中,检测多值图像中的封闭区域,并基于封闭区域的内部的亮度和封闭区域的周围的亮度对封闭区域的内部进行二值化。

根据本发明的存储介质,存储有图像处理程序,图像处理程序使计算机作为以下部分发挥功能:获取部,获取多值图像;以及二值部,生成对多值图像进行二值化而得的二值图像,图像处理程序使计算机发挥以下功能:二值部检测多值图像中的封闭区域,并基于封闭区域的内部的亮度和封闭区域的周围的亮度对封闭区域的内部进行二值化。

附图说明

图1是扫描仪的框图。

图2是示出二值化处理的流程图。

图3是示出用于分配区域标签的滤波器的图。

图4是示出用于分配区域标签的滤波器的图。

图5是示出像素的边缘状态的图。

图6是说明区域标签的分配的图。

图7是示意性地示出包括白底字符a的多值图像的图。

图8是示出所提取的封闭区域的图。

图9是示出所提取的封闭区域的图。

图10是示出所提取的封闭区域的图。

图11是示出所提取的封闭区域的图。

图12是示出所提取的封闭区域的图。

图13是说明封闭区域的面积与封闭区域所外接的矩形的面积的比的图。

图14是说明封闭区域的面积与封闭区域所外接的矩形的面积的比的图。

图15是示出在封闭区域比基准尺寸大且比基准形状粗的情况下的封闭区域的亮度直方图的例子的图。

图16是由字符的边界形成的封闭区域的亮度直方图的例子。

图17是形成字符等对象的一部分的较亮的封闭区域的亮度直方图的例子。

附图标记说明:

1...扫描仪;10...控制器;11...图像处理程序;11a…获取部;11b...二值部;20...存储器;21a...多值图像数据;20b...二值图像数据;30...ui部;40...通信部;50...图像读取部。

具体实施方式

这里,按照以下顺序对本发明的实施方式进行说明。

(1)扫描仪的结构

(2)二值化处理

(3)其他实施方式

(1)扫描仪的结构:

图1是示出作为本发明的实施方式的图像处理装置发挥功能的扫描仪1的结构的框图。扫描仪1具备控制器10、存储器20、ui(userinterface:用户界面)部30、通信部40和图像读取部50。

ui部30包括触摸面板式的显示器和键输入部。显示器具备显示面板以及与显示面板重叠的触摸检测面板。显示器基于控制器10的控制在显示面板上显示各种信息。此外,显示器检测人的手指等对触摸检测面板的接触,将接触坐标输出到控制器10。键输入部将表示在检测到对电源按钮、开始按钮、取消按钮、数字按钮等键的操作时所操作的键的键操作信息输出到控制器10。

通信部40包括用于按照各种通信协议与可移动存储器、外部设备进行通信的通信接口电路。图像读取部50具备向原稿发光并接收来自原稿的光作为读取数据的公知的彩色图像传感器、光源、设备部件等。在本实施方式中,图像读取部50能够将图像作为多个颜色通道的多阶调数据进行读取。因此,从图像读取部50输出的图像是多值图像。

存储器20中能够记录表示图像读取部50读取的多值图像的多值图像数据20a、将多值图像数据20a表示的多值图像进行二值化而得的二值图像数据20b。

控制器10能够基于从ui部30获取的上述信息获取使用者的操作内容,并能够执行与该操作内容对应的处理。控制器10能够执行的处理包括各种处理,例如图像读取部50的读取指示、将读取到的多值图像二值化的指示、将读取的多值图像或进行二值化而得的二值图像发送到可移动存储器、外部设备的指示等。当然,扫描仪1也可以被与扫描仪1连接的外部设备(例如,其他计算机、便携式终端等)控制。

控制器10具备cpu、ram等,并通过执行存储器20中记录的各种程序,从而实现扫描仪1的各功能。控制器10所执行的各种程序包括,用于使控制器10实现将由图像读取部50读取到的多值图像进行二值化的功能的图像处理程序11。进行该二值化的图像处理程序11出于以下的目的而执行:例如以较少的数据量读取写有可读性重要的字符的文档的原稿等。

为了实现该功能,图像处理程序11具备获取部11a和二值部11b。获取部11a是使控制器10执行获取多值图像的功能的程序模块。即,控制器10通过获取部11a的功能对图像读取部50进行控制,对放置于扫描仪1的原稿台的原稿(也可以是由adf(autodocumentfeeder:自动进纸器)输送的原稿)进行读取而获取多值图像。所获取的多值图像作为多值图像数据20a被记录于存储器20。

二值部11b是使控制器10执行生成将多值图像进行二值化而得的二值图像的功能的程序模块。即,控制器10通过二值部11b的功能,从存储器20获取多值图像数据20a,生成将多值图像数据20a的每个像素的阶调进行二值化而得的二值图像数据20b。在本实施方式中,控制器10通过将多值图像的亮度值在阈值以上时设为1,在比阈值小时设为0,从而将多值图像转换为二值图像。

如上所述,在二值化中,多值图像的阶调以阈值为界被转换为1或0,因此如果阈值不合适,则存在应当被辨认为字符等的对象与周围的区域同化的情况。例如,在浅(高亮度的)字符的周围存在较亮区域的情况下,如果阈值是比字符的亮度小的值,则字符会与周围的区域同化。另外,在浓(低亮度的)字符的周围存在较暗区域的情况下,如果阈值是比字符的亮度大的值,则字符会与周围的区域同化。

因此,在本实施方式中,二值部11b使控制器10执行根据多值图像的内容而调整阈值的功能。具体地,控制器10检测多值图像中的封闭区域。在本实施方式中,封闭区域是在多值图像中能够作为连续的区域被识别的区域,且是在二值化中有可能是应该与周围的区域区别开的对象的区域。在本实施方式中,控制器10确定多值图像中的各像素的特征,将具有共同特征的像素连续所形成的区域确定为封闭区域。

在本实施方式中,多值图像中的各像素的特征是边缘。即,在本实施方式中,控制器10认为由边缘像素连续形成的区域、由不是边缘的非边缘像素连续形成的区域作为对象被识别。控制器10通过二值部11b的功能,检测多值图像中的边缘,并基于边缘确定封闭区域。具体地,控制器10将多值图像的各像素作为关注像素并对多值图像中进行扫描,确定关注像素是否是边缘。是否是边缘可以通过各种处理来判断,例如能够采用如下结构:控制器10确定关注像素和关注像素的周围的像素的亮度分布范围(例如,标准差、方差等),当该分布范围比基准值大时,将关注像素判断为边缘。

在确定边缘像素和非边缘像素后,控制器10通过二值部11b的功能,将由连续的边缘形成的区域和由不是边缘的非边缘像素连续形成的区域检测为封闭区域。图8~图12示出了从图7所示的白底字符及其周围(虚线表示的范围)提取的封闭区域的例子。需要说明的是,虽然原稿上没有虚线,但这里仅为了表示范围而附加了虚线。另外,由于虚线的长度方向被缩小,因此假定实际上是更大的范围为白底字符的周围区域的状态。在本实施方式中,如果是图7所示那样的白底字符,则字符的边界线如图9、图11所示那样被作为独立的封闭区域提取,这些封闭区域的周围、内部如图8、图10、图12所示那样被作为独立的封闭区域提取。

在本实施方式中,由于由边缘像素连续的区域和非边缘像素连续的区域被确定为封闭区域,因此基于边缘像素确定的封闭区域中不包括非边缘像素。因此,在图7所示的白底字符a的情况下,图9所示的边界线被视为封闭区域,但在字符a的边界线的内侧存在的非边缘像素(例如,图10)、在边界线的内侧与边界线非连续地存在的边缘像素(例如,图11)被视为其他封闭区域。此外,如果在字符a的边界线的外侧不存在边缘像素,非边缘像素直至原稿的读取范围的边界为止连续地存在,则能够形成相当于字符等的背景的部位(例如,图8)独立的封闭区域。此外,用于提取封闭区域的具体处理在后文进行详述。

在获取封闭区域后,控制器10通过二值部11b的功能,基于封闭区域的内部的亮度和封闭区域的周围的亮度来确定各封闭区域的阈值,并基于该阈值对各封闭区域的内部进行二值化。即,虽然各封闭区域是对象(字符的部分等)的一部分(对象的边界或内部)、对象的背景等,但在二值化中,应被辨认的对象被转换为与周围的区域不同的颜色是很重要的。

另外,在封闭区域是应被辨认的对象的情况下,封闭区域呈特征性形状。例如,字符的部分等与原稿相比一般较小。另外,字符的部分等一般较细。因此,在本实施方式中,具有这些特征的封闭区域被视为有可能是应被辨认的对象,并考虑封闭区域的内部和封闭区域的周围的亮度来确定封闭区域的阈值。

即,控制器10通过二值部11b的功能,判断封闭区域是否比基准尺寸小或比基准形状细。在封闭区域比基准尺寸小或比基准形状细的情况下,控制器10基于封闭区域的内部的亮度和封闭区域的周围的亮度来确定阈值,并基于该阈值将封闭区域的内部二值化。并且,在基于亮度确定阈值时,控制器10在封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度暗的情况下,以将封闭区域的主要部分成为黑色的方式确定阈值。在封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度亮的情况下,控制器10以将封闭区域的主要部分成为白色的方式确定阈值。根据该结构,能够以将封闭区域的内部成为与周围的颜色相反的颜色的方式确定阈值。

另一方面,在封闭区域比基准尺寸大并且比基准形状粗的情况下,控制器10不参照封闭区域的周围的亮度,而基于封闭区域的内部的亮度确定阈值,并基于该阈值将封闭区域的内部二值化。即,在封闭区域比基准尺寸大并且比基准形状粗的情况下,视为是应被辨认的对象的可能性较低,关注封闭区域的内部而简单地确定阈值。当然,在不用考虑处理的简易性、负荷的情况下,即使是应被辨认的对象的可能性较低的情况下,也可以考虑封闭区域的周围的亮度来确定阈值。另外,更简单地,也可以使用固定的阈值。

需要说明的是,基准尺寸只要是有较高的可能性是应被辨认的对象的尺寸即可,例如只要通过基于原稿尺寸统计确定应被视为字符等对象的尺寸等来确定基准尺寸即可。基准形状只要是有较高的可能性是应被辨认的对象的形状即可,例如只要通过基于原稿尺寸统计确定应被视为字符等对象的形状等来确定基准形状即可。

这样,在确定阈值后,控制器10基于各封闭区域内的像素的阈值将各封闭区域内的像素二值化。根据以上结构,能够基于封闭区域的内部的亮度和封闭区域的周围的亮度改变二值化阈值,能够在使封闭区域的内部的主要部分以不与其周围同化的方式进行二值化。

此外,根据本实施方式,由于基于封闭区域的形状的特征来确定是否应该基于封闭区域的周围的亮度确定阈值,因此能够提高能够将应被辨认的对象与周围的区域区别开地进行二值化的可能性。此外,对于是对象的可能性很小的区域,能够通过不参照周围的亮度的简单的方法进行二值化。因此,能够简化处理。

(2)二值化处理:

下面,对上述结构中的二值化处理进行详细说明。图2是示出二值化处理的流程图。例如当使用者操作ui部30而进行了读取原告并进行二值化的指示时,以在存储器20加载了多值图像数据20a的状态开始该二值化处理。二值化处理开始后,控制器10通过二值部11b的功能,获取多值图像的亮度(步骤s100)。即,控制器10从存储器20获取多值图像数据20a,将各像素的各颜色通道的阶调值转换为各像素的亮度。将各颜色通道的阶调值转换为亮度的方法,可以采用各种方法,例如可以通过y=(30×r+59×g+11×b)/100等公式进行转换。这里,y是亮度,r是红色通道的阶调值,g是绿色通道的阶调值,b是蓝色通道的阶调值。

接着,控制器10通过二值部11b的功能,检测边缘(步骤s200)。即,控制器10将多值图像的各像素作为关注像素而扫描整个多值图像,对各关注像素计算亮度方差。亮度方差例如能够使用公式(1)而如公式(2)所示那样来算出。

【公式1】

【公式2】

在这些公式中,在关注像素的上下左右两个像素的范围内的像素是关注像素的周围像素,对总共5×5个像素计算统计值。即,yu是亮度平均,i、j是表示像素的位置的符号,xi、yi表示像素的位置。关注像素的位置是x3、y3,yv是亮度方差。亮度方差表示共计5×5个像素的区域中的亮度的分布范围的大小。

因此,控制器10将亮度方差和预定的基准值进行比较,在亮度方差为基准值以上的情况下,视为关注像素是边缘像素。在亮度方差比基准值小的情况下,控制器10视为关注像素是非边缘像素。需要说明的是,在关注像素的上下左右两个像素的范围内不存在其他像素的情况下,该像素被忽视,公式(1)(2)中的归一化常数的值被调整。此外,是否是边缘的判断也可以通过其他各种方法进行,例如,也可以使用各种边缘检测滤波器等。

接着,控制器10通过二值部11b的功能,确定封闭区域(步骤s300)。即,控制器10参照在步骤s200中检测到的边缘,对全部像素执行将边缘连续的区域确定为一个封闭区域,将非边缘连续的区域确定为一个封闭区域的处理。

该封闭区域的确定也可以通过各种方法实施。在本实施方式中,基于滤波器,通过对各像素分配区域标签来确定封闭区域。这里,区域标签是表示是否为相同的封闭区域的值,对相同的封闭区域分配相同的标签。即,对各像素分配表示各像素所属的封闭区域的标签。

图3及图4是示出用于分配区域标签的滤波器的图。在该图中,用正方形表示像素,用pi表示关注像素的位置,用pr表示参照像素的位置。需要说明的是,在图3中,示出了在关注像素是边缘像素的情况下应用的滤波器,在图4中,示出了在关注像素是非边缘像素的情况下应用的滤波器。例如,在关注像素是边缘像素的情况下,由于对该关注像素应用图3所示的滤波器,因此位于关注像素的左、左上、上、右上的像素成为参照像素。在关注像素是非边缘像素的情况下,由于对该关注像素应用图4所示的滤波器,因此位于关注像素的左、上的像素成为参照像素。需要说明的是,以上滤波器的差异是因为以在边缘像素的情况下重视边缘的连续性来确定封闭区域、在非边缘像素的情况下重视非边缘的分离性来确定封闭区域为目的而产生的。需要说明的是,在不存在参照像素的情况下,不进行对该像素的判断。

控制器10参照步骤s200的结果对各像素分配区域标签。即,控制器10将各像素逐个作为关注像素而扫描图像整体。此外,在本实施方式中,区域标签是1以上的整数,初始值是1。例如,在从左上的像素开始关注像素的扫描、向右逐个像素地移动、到达右端后移动到一个像素下的左端的像素的情况下,左上的像素的区域标签变为初始值1。并且,在发现不同的封闭区域时,不同的封闭区域会被分配在已有的区域标签的最大值上加1后的值。

具体地,在扫描的过程中,控制器10判断关注像素是边缘像素、非边缘像素中的哪一个,在关注像素是边缘像素的情况下,选择图3所示的滤波器,在是非边缘像素的情况下,选择图4所示的滤波器。图5示意性地示出了像素的边缘状态,白底的矩形表示边缘像素,附加了阴影线的矩形表示非边缘像素。因此,例如在像素p1成为关注像素的情况下选择图3所示的滤波器,在像素p2成为关注像素的情况下选择图4所示的滤波器。

在选择关注像素的滤波器后,控制器10基于参照像素的区域标签设定关注像素的区域标签。具体地,控制器10从参照像素中提取与关注像素相同边缘状态的像素,视为区域标签的确定源。即,如果关注像素是边缘像素,则控制器10从参照像素中提取边缘像素,视为区域标签的确定源。如果关注像素是非边缘像素,则控制器10从参照像素中提取非边缘像素,视为区域标签的确定源。

例如,在图5所示的像素p1是关注像素的情况下,由于像素p1是边缘像素,因此控制器10从参照像素p11、p12、p13、p14中提取作为边缘像素的像素p13、p14,视为区域标签的确定源。在像素p2是关注像素的情况下,由于像素p2是非边缘像素,因此控制器10从参照像素p21、p22中提取作为非边缘像素的像素p21、p22,视为区域标签的确定源。

在提取区域标签的确定源后,控制器10比较对该区域标签的确定源的像素分配的区域标签,获取最小值,视为关注像素的区域标签的值。例如,在像素p1是关注像素,像素p13、p14作为区域标签的确定源被提取的情况下,控制器10获取区域标签2、4中的最小值2,将像素p1的区域标签设定为2。在像素p2是关注像素,像素p21、p22作为区域标签的确定源被提取的情况下,控制器10获取区域标签1、1中的最小值1,将像素p2的区域标签设定为1。

在以上的处理过程中,当封闭区域变大时,有可能会发生相同的封闭区域被分配不同的区域标签的情况。例如,在图5所示的例子中,属于相同的封闭区域的像素p13、p14被分配了不同的区域标签2、4。因此,控制器10为了校正这种状况,在区域标签的确定源的像素的区域标签不一致的情况下,校正为最小的区域标签。例如,控制器10将像素p14的区域标签从4校正为2。该校正既可以在扫描的过程中进行,也可以在扫描结束后进行。

通过以上处理,能够在边缘像素连续的情况下对各边缘像素分配相同的区域标签,在非边缘像素连续的情况下对各非边缘像素分配相同的区域标签。但是,进行上述关注像素的扫描时,有时也会发生未提取到区域标签的确定源情况。例如,在从左向右扫描像素的过程中,在像素p13成为关注像素的情况下,关注像素的左上、上、右上不存在参照像素。此外,在关注像素的左边存在的参照像素p12是非边缘像素,关注像素p13是边缘像素。

因此,从关注像素p13的参照像素中没有提取到区域标签的确定源。在这种情况下,控制器10认为关注像素属于与现有的封闭区域不同的封闭区域,分配在现有的区域标签的最大值上加1后的值。例如,在进行关注像素p13的处理阶段,由于现有的区域标签的最大值是1,因此控制器10对关注像素p13分配区域标签2。图6示出了在图5所示的例子中各像素的扫描结束后所分配的区域标签的例子。根据上述处理,如图6所示,能够将连续的边缘像素分割到相同的封闭区域,将连续的非边缘像素分割到相同的封闭区域,能够容易地确定封闭区域。此外,在本实施方式中,由于基于亮度方差检测边缘,并基于该边缘确定封闭区域,因此能够将浅字符那样的亮度变化少的对象作为相同的封闭区域。因此,能够降低二值化时对象消失或被断开的可能性。

在封闭区域被检测后,控制器10通过二值部11b的功能,获取封闭区域的形状的特征(步骤s400)。图7示意性地示出了包括白底字符a的多值图像。在该例中,在进行步骤s300的处理后,如图8~图12所示,确定多个封闭区域。在图8中,通过阴影线示出了在字符a的周围存在的封闭区域。在图9中,通过粗实线示出了由构成字符a的外侧的边界的边缘形成的封闭区域。在图10中,通过阴影线示出了在字符a的外侧的边界的内部存在的封闭区域。在图11中,通过粗实线示出了由构成字符a的内侧的边界的边缘形成的封闭区域。在图12中,通过阴影线示出了在字符a的内侧的边界的内部存在的封闭区域。

在进行步骤s300的处理后,如图8~图12所示,确定封闭区域,成为对各封闭区域分配了区域标签的状态。这里,特别地,关注图9所示的封闭区域,对封闭区域的形状的特征进行说明。在本实施方式中,各封闭区域的形状的特征基于与各封闭区域外接的矩形和封闭区域的像素数来确定。因此,控制器10确定与步骤s300中确定的各封闭区域外接的矩形,并确定其两边的长度。在图9中,将两边中的一方(与x方向平行的边)的长度作为宽度w、将两边中的另一方(与y方向平行的边)的长度作为高度h示出。如果是该例,则控制器10确定宽度w及高度h。

此外,控制器10获取在步骤s300中确定的各封闭区域的像素数。即,控制器10通过对被分配了相同的区域标签的像素数进行计数,获取被分配了各区域标签的封闭区域的像素数。此外,由于控制器10在之后执行获取阈值的处理,因此收集与封闭区域相关的信息。具体地,控制器10确定与各封闭区域相邻的封闭区域的区域标签,并与各封闭区域对应地记录在存储器20中。因此,控制器10通过参照存储器20,能够确定与各封闭区域相邻的封闭区域。此外,控制器10基于各封闭区域的亮度,获取封闭区域内的亮度的平均值、最频值(mode)、亮度直方图,并将其记录在存储器20中。

接着,控制器10通过二值部11b的功能,获取各封闭区域的阈值(步骤s500)。在本实施方式中,基于封闭区域的尺寸和形状获取阈值,但控制器10将与各封闭区域外接的矩形的尺寸(步骤s400中获取的w、h)视为封闭区域的尺寸。

由于字符等应被辨认的对象一般比原稿小,因此在本实施方式中,被认为对象较小的基准尺寸被作为第一基准及第二基准预先定义。控制器10在外接的矩形的宽度w小于第一基准,外接的矩形的高度h小于第二基准的情况下,对各封闭区域实施判断为封闭区域较小的处理。根据以上结构,能够通过二值化容易地确定不应该与周围的区域同化的封闭区域。需要说明的是,第一基准和第二基准既可以是预定的固定值,也可以是根据原稿的尺寸等变化的可变值,还可以是使用者指定的值等。当然,第一基准和第二基准既可以相等也可以不同。

此外,字符等应被辨认的对象的形状通常由较细的部分构成。因此,在本实施方式中,对象是否较细基于与封闭区域外接的矩形的纵横的长度比来评价,基于封闭区域的面积与封闭区域所外接的矩形的面积的比来评价。

即,与封闭区域外接的矩形的纵横的长度比越比1小或大,则越能够推断封闭区域较细。因此,控制器10将与各封闭区域外接的矩形的宽度w、高度h中较大的一方作为分母,较小的一方作为分子,以使比在1以下的方式获取与封闭区域外接的矩形的纵横的长度比。

此外,封闭区域的面积与封闭区域所外接的矩形的面积的比越比1小或大,则越能够推断封闭区域较细。图13及图14是用于说明封闭区域的面积与封闭区域所外接的矩形的面积的比的图,通过阴影线示出了封闭区域。另外,图13示出了圆形的封闭区域的例子,图14示出了环状的封闭区域的例子。在图13、图14所示的例子中,与封闭区域外接的矩形的大小相等,均为宽w1、高h1。

在这些例子中,图14所示的环状的封闭区域由较细的线构成,图13所示的圆形的封闭区域在圆周的内部被相同的特征(例如非边缘)填充而构成。在图13所示的例子中,封闭区域的面积是圆的面积,与封闭区域外接的矩形的面积是w1×h1。在图14所示的例子中,封闭区域的面积是环状的部位的面积,与封闭区域外接的矩形的面积是w1×h1。因此,若比较两者之比、即(封闭区域的面积)/(与封闭区域外接的矩形的面积),可知在图13所示的不由较细的线构成的封闭区域中,比值有变大的倾向,在图14所示的由较细的线构成的封闭区域中,比值有变小的倾向。

因此,控制器10通过将表示各封闭区域的面积的像素数除以与封闭区域外接的矩形的面积(w×h),使比在1以下,从而获取封闭区域的面积与封闭区域所外接的矩形的面积的比。

如上所述,对象是否较细能够基于与封闭区域外接的矩形的纵横的长度比来评价,能够基于封闭区域的面积与封闭区域所外接的矩形的面积的比来评价。这些比中,既可以单独地进行评价,也可以双方同时地进行评价。在本实施方式中,采用后者,控制器10计算两者的比的积,并与表示基准形状的形状阈值进行比较。即,控制器10在满足以下的公式(3)的情况下,判断为封闭区域比基准形状细。

【公式3】

cs×cwh<cth····(3)

此外,在公式(3)中,cs是封闭区域的面积与封闭区域所外接的矩形的面积的比,cwh是与封闭区域所外接的矩形的纵横的长度比。cth是用于判断是否是基准形状的形状阈值,预先通过统计等进行定义,以使得当cs×cwh的值小于cth时能够视为封闭区域是较细的形状。控制器10在满足公式(3)的情况下,对各封闭区域实施判断封闭区域比基准形状细的处理。根据该结构,通过二值化能够容易地确定不应该与周围的区域同化的封闭区域。

如上所述,在对各封闭区域进行是否比基准尺寸小的判断和是否比基准形状细的判断后,控制器10基于这些判断结果确定各封闭区域的阈值。具体地,在封闭区域比基准尺寸大并且比基准形状粗的情况下,控制器10不参照封闭区域的周围的亮度而是基于封闭区域的内部的亮度来确定阈值。具体地,控制器10在将封闭区域的内部的亮度直方图的平均值设为yave、将最频值设为ym的情况下,将yave-(ym-yave)作为阈值yth。

图15示出了在封闭区域比基准尺寸大并且比基准形状粗的情况下的封闭区域的亮度直方图(例如,图8所示的封闭区域的亮度直方图)。在封闭区域比基准尺寸大并且比基准形状粗的情况下,封闭区域不是字符等对象、而是背景等的可能性较高。因此,如果能够将构成亮度直方图的大半的像素转换为白色,则能够恰当地进行二值化的可能性较高。并且,如图15所示,作为阈值yth的yave-(ym-yave)是将大半部分转换为白色的阈值。因此,如果根据该阈值将该封闭区域二值化,则能够提高能够将背景等以作为背景等进行视觉确认的方式进行二值化的可能性。

通过如上确定的阈值进行二值化后,在存在具有接近原稿的底色的颜色的对象的情况下,通过二值化,对象与周围的区域同化。因此,在本实施方式中,在封闭区域比基准尺寸小或比基准形状细的情况下,也参照封闭区域的周围的亮度来确定阈值。

具体地,在封闭区域比基准尺寸小或比基准形状细的情况下,如果封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度暗,则控制器10以使封闭区域的主要部分成为黑色的方式确定阈值。即,控制器10在关注某个封闭区域确定阈值时,参照存储器20获取与该封闭区域相邻的封闭区域的区域标签。例如,在图6所示的例子中,在关注区域标签2的封闭区域的情况下,控制器10获取相邻的封闭区域的区域标签1、3。此外,控制器10基于区域标签,获取关注的封闭区域的亮度的最频值和相邻的封闭区域的亮度的最频值。此外,在本实施方式中,在封闭区域的内部,具有最频值的亮度的像素相当于封闭区域的内部的主要部分。

此外,控制器10将关注的封闭区域的亮度的最频值和相邻的封闭区域的亮度的最频值进行比较。在相邻的封闭区域有多个的情况下,控制器10将关注的封闭区域的亮度的最频值和相邻的全部封闭区域的最频值进行比较。并且,在关注的封闭区域的亮度的最频值比相邻的全部封闭区域的亮度的最频值小的情况下,以关注的封闭区域的亮度直方图的高亮度侧的尾部部分成为第一比率的方式确定阈值。

图16示出了由字符的边界形成的封闭区域(其中,边界的颜色接近底色)的亮度直方图的例子。另外,图17示出了在图16所示的封闭区域的周围存在的封闭区域的亮度直方图的例子。图16的亮度直方图例如是图9所示的字符的边界的亮度直方图,图17的亮度直方图例如是图10所示的字符的内侧的亮度直方图。这里,关注图16所示的封闭区域,在该封闭区域的周围的封闭区域中,假定亮度直方图的最频值最小的封闭区域是图17所示的封闭区域来进行说明。

在这些例子中,关注的封闭区域的亮度的最频值是ym1,关注的封闭区域的周围的封闭区域中的亮度的最频值是ym2。此外,关注的封闭区域的亮度的最频值ym1比相邻的封闭区域的亮度的最频值ym2小。在这种情况下,控制器10对关注的封闭区域的亮度直方图的高亮度侧的尾部部分的像素数从高亮度侧进行计数,将计数值/封闭区域的像素数成为第一比率的亮度确定为阈值。在图16中,示出了如上确定的阈值yth1。此外,第一比率以亮度直方图的高亮度侧的尾部部分成为微小的数的方式被预先确定。即,根据该阈值,以能够将封闭区域的主要部分成为黑色的方式设定第一比率。

另一方面,在封闭区域比基准尺寸小或者比基准形状细的情况下,如果封闭区域的内部的主要部分的亮度比封闭区域的周围的亮度亮,则控制器10以将封闭区域的主要部分成为白色的方式确定阈值。在这种情况下,控制器10也获取关注的封闭区域的亮度的最频值和相邻的封闭区域的亮度的最频值。

此外,控制器10将关注的封闭区域的亮度的最频值与相邻的封闭区域的亮度的最频值进行比较。在相邻的封闭区域有多个的情况下,控制器10将关注的封闭区域的亮度的最频值与相邻的全部封闭区域的最频值进行比较。此外,在关注的封闭区域的亮度的最频值比相邻的全部封闭区域的亮度的最频值大的情况下,以关注的封闭区域的亮度直方图的低亮度侧的尾部部分成为第二比率的方式确定阈值。

这里,假定是关注在图17中示出了亮度直方图的封闭区域、并且在图16中示出了亮度直方图的封闭区域是周围存在的封闭区域的状态。在该例中,关注的封闭区域的亮度的最频值是ym2,关注的封闭区域的周围的封闭区域中的亮度的最频值是ym1。因此,关注的封闭区域的亮度的最频值ym2比相邻的封闭区域的亮度的最频值ym1大。在这种情况下,控制器10对关注的封闭区域的亮度直方图的低亮度侧的尾部部分的像素数从低亮度侧进行计数,将计数值/封闭区域的像素数成为第二比率的亮度确定为阈值。

在图17中,示出了以上述方式确定的阈值yth2。需要说明的是,第二比率也以亮度直方图的低亮度侧的尾部部分成为微小的数的方式被预先确定。即,根据该阈值,以能够将封闭区域的主要部分成为白色的方式设定第二比率。需要说明的是,第二比率既可以与第一比率一致,也可以不同。此外,各比率既可以是固定值,也可以是根据亮度直方图等变化的可变值。

控制器10对各封闭区域实施以上述方式获取封闭区域的阈值的处理。在获取各封闭区域的阈值后,控制器10通过二值部11b的功能,获取二值化图像(步骤s600)。即,控制器10将各封闭区域内的像素的亮度和各封闭区域的阈值进行比较,将比阈值亮度大的像素的阶调值变为1,将亮度在阈值以下的像素的阶调值变为0。控制器10对各封闭区域实施以上述方式将封闭区域内的像素二值化的处理。根据以上结构,能够以使浅字符等颜色接近底色的对象不与周围的区域(底色的区域等)同化的方式进行二值化。另外,根据对各封闭区域确定阈值的结构,能够以白底的方式再现白底字符。

(3)其他实施方式:

以上实施方式是用于实施本发明的一例,也能够采用其他各种实施方式。例如,本发明的一实施方式的扫描仪也可以设置于作为出于读取以外的目的使用的电子设备的复合机等中。此外,以上实施方式所示的基于封闭区域的周围的亮度确定封闭区域的内部的二值化阈值的方法,也能够作为程序的发明、方法的发明或扫描数据的生成方法的发明来实现。此外,对于以上述方式生成的二值化图像,进行针对作为对象的字符的光学字符识别、针对作为对象的条(bar)的条形码转换等处理,也能够作为生成文本数据的装置、生成方法的发明来实现。

此外,也可以通过使与扫描仪1连接的计算机的驱动程序、应用程序实施控制器10中的至少一部分处理来生成二值图像数据。在这种情况下,能够将计算机视为扫描仪的一部分。

此外,上述实施方式只是一例,能够采用省略一部分结构、、追加其他结构的实施方式。例如,也可以采用如下结构:控制器10不考虑封闭区域的特征而是基于封闭区域的内部的亮度和封闭区域的周围的亮度对封闭区域的内部进行二值化。另外,在判断封闭区域是否较细时,也可以采用如下结构:仅参照与封闭区域外接的矩形的纵横的长度比、以及封闭区域的面积与封闭区域所外接的矩形的面积比中的一方的比。

获取部只要能够获取多值图像即可。即,获取部只要能够获取应该二值化的图像即可,如上述实施方式所示,除了由扫描仪读取的图像以外,各种图像也能够成为多值图像。例如,也可以是获取由图像编辑软件生成的图像或经由网络获取的图像作为二值化对象的多值图像的结构等。

二值部只要能够生成将多值图像二值化而得的二值图像即可。由于二值图像是各像素为1位的图像,因此像素值是1或0,只要将一方成为白色,另一方成为黑色,就成为单色的图像。通常是黑白的单色,当然也可以是根据用途对各颜色通道(例如,r、g、b各通道)进行二值化的结构等。

另外,二值部检测的封闭区域只要是以相同基准(例如,相同阈值)进行二值化的单位即可,是多值图像的像素中具有共同特征的像素所连续形成的区域。其中,由于是封闭区域,因此不是在该区域的内部具有不同特征的像素离散地配置的状态。在具有共同特征的像素配置成环状的情况下,只要具有共同特征的像素环状地连续,则除去环的内侧的环状区域成为封闭区域。即,在环的内侧具有相同特征的像素分离地存在的情况下,或在其他特征的像素存在的情况下,这些像素能够构成不同的封闭区域。

除了是上述边缘以外,特征也能够假定各种特征。例如,也可以是基于多值图像的梯度确定对象的边界,从而确定由边界包围的封闭区域的结构。此外,除了在特征相同的像素连续的情况下被视为封闭区域的结构以外,也可以采用在特征类似的像素连续的情况下被视为封闭区域的结构等。

此外,二值化只要基于封闭区域的内部的亮度和封闭区域的周围的亮度来实施即可,除了基于封闭区域的内部的亮度和封闭区域的周围的亮度来确定用于二值化的阈值的上述结构以外,也可以采用各种结构。例如,也可以采用基于封闭区域的内部的亮度和封闭区域的周围的亮度使封闭区域的内部成为白色或黑色的处理等。

此外,在基于封闭区域的内部的亮度和封闭区域的周围的亮度进行二值化时,参照亮度的方法能够采用各种方法。即,如上所述,既可以参照封闭区域的内部和周围的亮度差,也可以参照封闭区域的内部和周围的亮度的相似度等,可以采用各种结构。

此外,封闭区域的周围的亮度也可以是该封闭区域的外侧的区域的亮度,在封闭区域的内侧存在封闭区域以外的区域的情况下(环状等),既可以是该封闭区域的内侧的区域的亮度,也可以是二者。在封闭区域的周围有多个不同的封闭区域相邻的情况下,既可以参照其中一个(例如,亮度最亮或最暗的区域、最大的区域等)的亮度,也可以参照多个的亮度。

封闭区域的内部的主要部分只要是用于评价封闭区域的内部的亮度的部分即可,除了如上述实施方式所示那样在封闭区域的内部将亮度等于最频值的像素视为主要部分的结构以外,也可以采用各种结构。例如,也可以采用在封闭区域的内部获取亮度的统计值(平均值等),将亮度等于统计值的像素视为主要部分的结构等。当然,也可以将亮度存在于特定的范围内(例如,从统计值到标准差×常量的范围等)的像素视为主要部分。无论哪一种,只要在考虑封闭区域的面积、特征等将封闭区域二值化时,能够将应该成为白色或黑色的部分视为主要部分即可。主要部分的亮度或封闭区域的周围的亮度可以通过各种方法确定,除了最频值以外,也可以基于各种统计值等评价亮度。

封闭区域的形状的特征并不限于上述实施方式所示的通过大小、粗细进行评价的结构。即,只要是通过二值化能够将是否是不应该与周围同化的部位作为封闭区域的形状的特征即可。因此,例如,能够采用在封闭区域的周围存在尖的部位的情况下、存在锯齿部位的情况下二值化为与周围不同的值的结构等各种结构。

此外,本发明也可以作为计算机执行的程序、方法进行应用。另外,既存在以上程序、方法作为单独的装置来实现的情况,也存在利用多个装置所具备的部件来实现的情况,包括各种方式。另外,一部分是软件一部分是硬件等结构能够适当变更。此外,作为程序的记录介质,发明也成立。当然,该程序的记录介质既可以是磁记录介质,也可以是磁光记录介质,在今后开发的各种记录介质中,能够完全同样地考虑。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1