图象处理设备和由一个多级图象产生二进制图象的方法

文档序号:6571279阅读:156来源:国知局
专利名称:图象处理设备和由一个多级图象产生二进制图象的方法
技术领域
本发明涉及一种图象处理设备和通过处理一个多级图象产生二进制图象的方法。
对于常规纸张形式识别,从一种输入纸张形式的灰度图象抽取手写字符的笔划等,并且对于字符进行识别过程。一个笔画对应于构造一个字符的图案的部分或一条划出线,并且表示为一种线图案。
如果诸如手写字符、划出线等之类的多种类型笔划共同存在,并且在一个输入图象内接触,则根据象素的灰度区分笔划,并且抽取希望要分离的笔划(目标笔划)。
然而,如果不同类型的笔划的灰度几乎相同,则这些笔划仅借助于其灰度不能适当地分离。而且,由于象素灰度在同笔划与背景之间的边界相对应的轮廓区域中变化,所以即使不同类型的灰度是清晰的,也不能正确地检测目标笔划。
本发明的一个目的在于,提供一种图象处理设备和在纸张形式或文档识别中通过以高精度从诸如灰度图象等之类的多级图象分离目标笔划产生目标笔划的二进制图象的方法。
根据本发明的图象处理设备包括一个输入器件、一个笔划抽取器件、一个特征抽取器件、及一个分离器件。
输入器件包括一个多级图象。笔划抽取器件从多级图象抽取多个笔划区域,并且产生笔划区域的二进制图象。特征抽取器件根据包括在目标象素的相邻区域中的不同象素的影响通过把在每个笔划区域中的每个象素用作目标象素抽取一个特征量。分离器件通过使用每个象素的抽取特征量从笔划区域的二进制图象分离属于一个目标笔划区域的象素,并且产生目标笔划区域的二进制图象。
一个笔划区域与一个其中在一个多级图象内存在一个笔划的一个线图案的区域相对应,而象素的属性与象素在多级图象内的位置、与相邻象素的相关、灰度值等相对应。
特征抽取器件通过不仅使用目标象素本身的属性而且也使用一个不同象素在一个相邻区域中的属性,考虑到相邻区域的影响抽取一个特征量,并且把抽取的量通到分离器件。作为这样一个特征量,例如,使用指示在相邻区域中笔划区域的粗度的信息、或指示在相邻区域中笔划区域的平滑灰度的信息。
分离器件通过使用接收的特征量区分多余象素和目标笔划区域的象素,并且把笔划区域的二进制图象的象素划分成两组。然后,分离器件通过仅使用目标笔划区域的象素组产生目标笔划区域的一个二进制图象。
通过使用对其考虑相邻区域的影响的特征量,使属于相同类型笔划的象素的特征量是均匀的,并且在不同类型的笔划的特征量之间的差别成为明确的。因而,即使不同类型的笔画的灰度几乎相同,或者即使灰度在笔划的轮廓区域中变化,也能正确地分离目标笔划。


图1表示一种图象处理设备的配置;图2举例说明一个第一灰度图象;图3是流程图,表示一个二进制化过程;图4举例说明一个第一过程结果;图5举例说明一个划出线框;图6举例说明一个笔划;图7是流程图,表示一个特征量抽取过程;图8表示相交;图9表示一条切断线;图10是流程图,表示一个灰度特征量抽取过程;图11是流程图,表示一个删除过程;图12举例说明一个两维图象特征的分布;图13举例说明一个接触字符;图14举例说明一个第二灰度图象;图15举例说明一个第二过程结果;
图16表示一个信息过程器件的配置;及图17表示存储介质。
下文,参照附图将详细解释根据本发明的一个最佳实施例。
图1表示一种根据一个最佳实施例的图象处理设备的配置。图1中表示的图象处理设备包括一个笔划抽取单元11、一个特征抽取单元12、及一个分离单元13。该设备通过抽取包括在从一个扫描器输入的灰度图象中的手写字符产生一个二进制图象。
图2举例说明一个输入灰度图象。图2中表示的灰度图象除手写字符外包括划出线和预印部分。预印部分与诸如笔记的标记“※”或字符之类的预印信息相对应。图象处理设备得到每个象素的灰度特征量和粗度特征量,也得到要删除的划出线/预印象素的特征量的范围,并且对于接触字母进行高质量抽取。
图3是流程图,表示由图1中所示图象处理设备进行的二进制化过程。首先,图象处理设备输入要处理的一个灰度图象(步骤S1)。其次,笔划抽取单元11从输入图象抽取一个笔划,并且产生一个笔划二进制图象(步骤S2)。然后,特征抽取单元12抽取在笔划二进制图象内的每个象素的灰度特征量和粗度特征量,并且产生一个由两维特征量组成的两维象素特征(步骤S3)。
其次,分离单元13从笔画二进制图象删除划出线和预印象素(步骤S4)。在这时,分离单元13通过使用在灰度图象中规定的识别框的坐标得到细和粗划出线的特征量的平均和标准偏差,并且估计细(包括预印部分)和粗线的两维象素特征的范围。分离单元13然后删除在估计范围内具有特征量的象素。
其次,分离单元13除去噪声(步骤S5),并且从划出线分离接触字符(步骤S6)。在这时,对于接触象素单元中的粗划出线的黑色象素区域再次进行二进制化过程而不用使之平滑,从而得到具有平滑轮廓的线图案。得到的线图案作为一个目标笔划输出。
例如,从图2中表示的灰度图象产生由图4中表示的手写字符组成的目标笔划二进制图象。产生的目标笔划二进制图象在以后过程中用作一个字符识别目标。
其次,参照图5至15进一步详细解释图3中所示的二进制化过程。
用于二进制化过程的输入信息是要处理的灰度图象和识别框的坐标。灰度图象由256个灰度的多级图象表示,该多级图象由一个扫描器捕获。在这种情况下,把从0(黑色)至255(白色)的256个值用作象素的灰度。
而且,识别框的坐标由表示在图象内的划出线框的位置的坐标值表示。举例来说,对于图5中所示的灰度图象,把一个划出线框21用作一个识别框,并且把在框的四个角处的点22、23、24和25的坐标值规定为识别框的坐标。如果划出线具有几个点的宽度,则规定是宽度中心的位置的坐标。
一个划出线框表示其中要抽取的特征串期望存在的区域。然而,一个字符图案可能从划出线框突出,并且接触划出线。因此,所有字符串图案不总是需要在划出线框内存在。
在图3的步骤2,从灰度图象产生一个笔划二进制图象,例如,借助于如下二进制过程的任一个。可以预定使用二进制过程的哪一个。或者,用户可以选择过程之一。
(1)使用单阈值的全局二进制化,象Otsu二进制化。
(2)对于图象内的每个象素使用不同阈值的局部二进制化,象Niblack二进制化。
(3)使用一个标准偏差的基于背景区分的局部二进制化,这在日本专利申请“图象处理设备和图象处理方法(Image Processing Apparatus andImage Processing Method)”(日本专利申请No.11-335495)中叙述。
字符、划出线和预印部分作为在一个笔划二进制图象内的笔划共存,并且笔划也彼此接触。假定表示一个笔划的线图案的长方向是笔划的方向,并且一个短方向是垂直于笔划的方向,在垂直于笔划的方向上的笔划的宽度与笔划的粗度相对应。
举例说明,对于构造图6中所示数字的笔划26,垂直方向与笔划的方向相对应,而水平方向与垂直于笔划的方向相对应。即,在水平方向的宽度与笔划的粗度相对应。
在一个笔画二进制图象中,除在图象中规定的划出线框内的笔划和接触划出线框的笔划之外的笔划是多余的。因而,除去仅在划出线框外存在的黑色象素的连接分量。
另外,在图3的步骤S3,对于每个象素抽取粗度特征量和灰度特征量。首先,特征抽取单元12瞄准在笔划二进制图象中的黑色象素的每一个(当作笔画的象素),并且抽取在每个目标象素的邻近的笔划的粗度,作为目标象素的粗度特征量。
图7是流程图,表示一个粗度特征量抽取过程。特征抽取单元12首先扫描一个笔划二进制图象(步骤S11),并且查寻一个黑色象素(步骤S12)。在检测到一个黑色象素时,通过把检测象素用作一个目标象素从检测黑色象素的位置开始查寻另一个黑色象素,并且重复确定一个相邻象素是否是黑色象素(步骤S13)。这样一种查寻在诸如左、右、向上、向下、和倾斜方向之类的八个方向上进行,并且计数在诸如垂直、水平及倾斜方向之类的四个方向上的连续黑色象素的数量。
然后,把在计数结果中最短方向上的连续黑色象素的数量定义成在目标象素处的笔划的粗度特征量(步骤S14)。然而,对于一个正方形的象素,垂直/水平长度与对角线长度的比是1比21/2。因此,在倾斜方向上连续黑色象素的数量相对于在垂直/水平方向上连续黑色象素的数量乘以21/2。进行这种乘法以得到不与象素数量相对应但与实际距离相对应的粗度。
尽管这种方法适于得到笔划在简单倾斜方向上的粗度,但不适于得到笔划相交的粗度。在图8中所示笔划的相交处,不是在最短倾斜方向上的长度32,而是在水平方向上的长度33与相对于目标象素31的实际笔划的粗度相对应。因而,把在倾斜方向上的连续黑色角素的数量不变地用作在期望相交的点处的粗度特征量,而不用乘以21/2。
其次,特征抽取单元12在步骤S11中和其之后重复操作,以得到在不同黑色象素的位置处的粗度特征量。如果在步骤S12中没有留下要处理的更多黑色象素,则结束过程。
在上述步骤S13和S14中,通过使用在原始灰度图象中笔划灰度与背景灰度之间的差别,而不是连续黑色象素的数量,可以得到粗度。在这种情况下,如图9中所示,特征抽取单元12设置一条切断线43,切断线43通过一个目标象素41,并且在垂直于笔划42的方向上的目标象素41的相邻区域中切断一个笔划42。然后,得到在切断线43中每个象素的灰度与背景的灰度之间的差别,并且把通过把灰度差之和除以最大灰度差得到的值定义成一个粗度特征量。该值与指示切断线43的长度的信息相对应。
假定在切断线43中的第i个象素的灰度差是Δgi,其粗度特征量F由如下公式计算。
通过如上述那样把在笔划与背景之间的灰度差之和与一个特定灰度差的比率定义成在目标象素位置处的笔划的粗度,能减小在笔划与背景之间的边界处在扫描器捕获时内插的影响。
其次,特征抽取单元12通过瞄准在笔划二进制图象内的黑色象素的每一个,抽取目标黑色象素的相邻笔划的灰度作为目标黑色象素的灰度特征量。
图10是流程图,表示一个灰度特征量抽取过程。特征抽取单元12扫描一个笔划二进制图象(步骤S21),并且查寻一个黑色象素(步骤S22)。在检测到一个黑色象素时,在通过用作一个目标象素的黑色象素并且垂直于笔划的方向(粗度方向)上,描述象素的灰度值(步骤S23)。然后,查寻最小值(最靠近黑色的灰度),并且把查寻值定义成笔划在目标象素的位置处的灰度特征量(步骤S24)。
通过使用这样一种灰度特征量,由在粗度方向上的最小值使笔划的灰度平滑。因而即使这些象素的灰度由于笔划轮廓的灰度的波动而变化,也能防止属于相同类型的象素的灰度特征量变化。当把在粗度方向上的灰度值的平均值用作一个灰度特征量,代替在该方向的最小灰度值时,实现类似的平滑。
另外,如果轮廓区域的灰度变化不大,则可以把目标象素本身的灰度值用为一个灰度特征量,而代替这样一个平滑灰度值。
另外,在图3的步骤S4中,分离单元13估计属于划出线笔划和预印笔划的象素的特征量的范围,并且从笔划二进制图象删除具有在估计范围内的特征量的象素。
图11是流程图,表示这样一个删除过程。分离单元13首先由提供为输入信息的划出线框的给定坐标估计在图象内的划出线的范围,这些给定坐标作为输入信息提供(步骤S31)。通常,在图象内的划出线的宽度是不定的。因此,必须估计与划出线相对应的象素的范围。
其次,对于在估计划出线中的象素得到粗度和灰度特征量的每一个的平均和变化(步骤S32)。然后,把得到的平均值定义成一个中心值,把具有通过把变化乘以一个适当系数得到的宽度的范围定义成属于划出线的象素的特征量的范围,并且合并粗度和灰度特征量的范围,并且定义为一个两维象素特征的范围(步骤S33)。在这时,对于细和粗划出线的每一条独立地估计一个特征量的范围,并且认为预印部分的特征量的范围与细划出线的特征量的范围相同。
这里,如果其坐标值是在一个笔划二进制图象内的黑色象素的粗度和灰度特征量的点画在一个平面上,例如,得到图12中所示的一个两维象素特征的分布。在该图中,区域51、52、和53分别与预印象素、手写字符的象素、及在其中字符和划出线接触的区域(接触区域)中的象素相对应。另外,区域54和55分别与细和粗划出线的两维象素特征的范围相对应。
其次,分离单元13用白色象素(背景象素)替换属于在笔划二进制图象内的黑色象素中的细或粗划出线的两维象素特征范围的黑色象素。结果,删除划出线,并且也与细划出线一起删除预印部分。
在上述步骤S33中,借助于聚类可以把一组目标笔划象素与两维象素特征的分布分离。在这种情况下,分离单元13借助于聚类把两维象素特征的分布划分成多个分布,并且通过得到分布每一个的平均和标准偏差特征化分布的形状。
其次,把得到的分布组分类成希望抽取的字符和接触区域的一种象素分布、和希望删除的轮廓线和预印部分的一种象素分布。作为一种分类方法,使用一种根据诸如每种分布的平均值、一个标准差等之类的参数之间的相关分类一个分布组的方法、一种把靠近属于划出线框的象素的特征的分布定义为要删除的分布的方法。
尽管象素不能用这样一种删除过程作为属于划出线/预印部分的两维象素特征范围的象素删除,但如果象素没有手写字符分量,则必须删除他们。因此,在图3的步骤S5中,分离单元13从笔划二进制图象作为噪声除去具有小尺寸和小数量象素的黑色象素连接分量,从该笔划二进制图象删除划出线/预印象素。
另外,属于其中手写字符接触划出线的区域的邻近的象素的特征量由于在垂直于字符笔划的方向上实现的平滑,偏离要除去的特征量的范围。结果,剩下借助于步骤S4的操作没有除去的矩形区域61,如图13中所示。
因而,在图3的步骤S6中,分离单元13在灰度图象的矩形区域61内再次进行二进制化过程。在这时,对于在划出线的方向上的每条线进行二进制过程,从而把象素分类成两种类型,如仅属于划出线62的象素、和其中划出线和手写字符接触的图象的象素(接触象素)63。然后,除去仅与划出线62相对应的、在笔划二进制图象中的象素。结果,分离手写字符和划出线,由此能得到手写字符的高质量图案。
对于上述过程,能以高精度从图14中所示的差质量手写字符抽取手写字符的图案,象图15中所示的过程结果。
上述实施例主要采用灰度图象作为过程目标。然而,根据本发明,包括彩色图象的任意多级图象可以适于一个过程目标。另外,目标笔划可以不是手写字符,而与希望分离的任意图案的笔划相对应,如印刷或打印字符。
图1中所示的图象处理设备例如由图16中所示的信息处理器件(计算机)配置。图16中 所示的信息处理器件包括一个CPU(中央处理单元)71、一个存储器72、一个输入器件73、一个输出器件74、一个外部存储器件75、一个介质驱动器件76、一个网络连接器件77、及一个图象输入器件78,这些由一根总线79互连。
存储器72包括例如一个ROM(只读存储器)、一个RAM(随机存取存储器)等,并且存储用于过程的程序和数据。CPU71通过利用存储器72执行程序进行必需的过程。表示在图1中的笔划抽取单元11、特征抽取单元12、及分离单元13与由程序描述并且存储在存储器72中的软件元件相对应。
输入器件73例如是键盘、点击器件、触摸板等,并且用来从用户输入指令或信息。输出器件74例如是显示器、打印机、扬声器等,并且用来把询问输出到用户或输出过程结果。
外部存储器件75例如是磁盘器件、光盘器件、磁光盘器件、磁带器件等。信息处理器件把上述程序和数据存储在外部存储介质75中,并且通过按要求把程序和数据装载到存储器72中而使用他们。
介质驱动器件76驱动可携带存储介质80,并且存取其存储内容。作为可携带存储介质80,使用一种任意的计算机可读存储质,如存储卡、软盘、CD-ROM(紧致盘只读存储器)、光盘、磁光盘等。用户把上述程序和数据存储到可携带存储介质80上,并且通过按要求把程序和数据装载到存储器72中而使用他们。
网络连接器件77连接到诸如LAN(局域网络)等之类的任意通信网络上,并且进行伴随通信的数据转换。另外,信息处理器件从诸如服务器等之类的不同器件经网络连接器件77接收上述程序和数据,并且通过按要求把程序和数据装载到存储器72中而使用他们。
图象输入器件78例如与扫描器相对应,并且把要处理的多级图象输入到存储器72。
图17表示能向图16中所示的信息处理器件提供程序和数据的计算机可读存储介质。把存储到可携带存储介质80上或一个服务器81的数据库82中的程序和数据装载到存储器72中。在这时,服务器81产生一个用来传播程序和数据的传播信号,并且经网络中的一个任意传输介质把信号传输到信息处理器件。CPU71然后借助于数据执行程序,并且进行必需的过程。
根据本发明,把指示象素邻近中的笔划的粗度或平滑灰度的信息用作笔划区域内每个象素的一个特征量,由此即使不同类型的笔划的灰度几乎相同,也能分离目标笔划。此外,通过使用这样一种特征量,即使当灰度在笔划轮廓区域中变化时,也能清楚地区分属于一个笔划的象素。结果,能适当地分离目标笔划而不受轮廓区域的影响。
权利要求
1.一种图象处理设备,包括一个输入器件,输入一个多级图象;一个笔划抽取器件,从多级图象抽取多个笔划区域,并且产生多个笔划区域的一个二进制图象;一个特征抽取器件,通过把在多个笔划区域每一个中的每个象素用作目标象素,根据包括在目标象素相邻区域中的一个不同象素的属性,抽取一个特征量;及一个分离器件,通过使用每个象素的抽取特征量从多个笔划区域的二进制图象分离属于一个目标笔划区域的象素,并且产生目标笔划区域的一个二进制图象。
2.根据权利要求1所述的图象处理设备,其中所述笔划抽取器件通过使用一个使用单阈值的全局二进制化过程和一个使用用于在图象内的每个象素的不同阈值的局部二进制化过程的至少一个,产生多个笔划区域的二进制图象。
3.根据权利要求1所述的图象处理设备,其中所述特征抽取器件抽取指示在相邻区域中一个笔划区域的粗度的信息、和指示在相邻区域中笔划区域的平滑灰度的信息,作为特征量。
4.根据权利要求1所述的图象处理设备,其中所述特征抽取器件抽取指示在相邻区域中一个笔划区域的粗度的信息,作为特征量。
5.根据权利要求4所述的图象处理设备,其中所述特征抽取器件,抽取在相邻区域中在垂直方向上笔划区域的长度、在水平方向上的长度、及在倾斜方向上的长度中指示最短方向上的长度的信息,作为指示粗度的信息。
6.根据权利要求4所述的图象处理设备,其中所述特征抽取器件,抽取指示一根通过目标象素和在垂直于笔划区域的方向上在相邻区域中切断笔划区域的切断线的长度的信息,作为指示粗度的信息。
7.根据权利要求6所述的图象处理设备,其中所述特征抽取器件得到在切断线中的每个象素的灰度与背景的灰度之间的差,并且作为指示粗度的信息,抽取一个通过把灰度差之和除以一个最大灰度差得到的值。
8.根据权利要求1所述的图象处理设备,其中所述特征抽取器件作为特征量,抽取指示在相邻区域中的一个笔划区域的平滑灰度的信息。
9.根据权利要求8所述的图象处理设备,其中所述特征抽取器件,抽取在通过目标象素并且垂直于在相邻区域中的笔划区域的方向上在象素的灰度值中最靠近黑色的一个灰度值,作为指示平滑粗度的信息。
10.根据权利要求8所述的图象处理设备,其中所述特征抽取器件,抽取在通过目标象素并且垂直于在相邻区域中的笔划区域的方向上象素的灰度值的一个平均值,作为指示平滑粗度的信息。
11.根据权利要求1所述的图象处理设备,其中所述分离器件根据一个给定划出线框的信息估计一个其中分布有要删除的笔划区域中的象素的特征量的范围,并且通过从多个笔划区域的二进制图象删除与估计范围相对应的象素,分离属于目标笔划区域的象素。
12.根据权利要求1所述的图象处理设备,其中所述分离器件借助于聚类把包括在多个笔划区域的二进制图象中的象素特征量的分布划分成多种分布,并且分离属于目标笔划区域的象素。
13.一种其上记录一个用于计算机的程序的存储介质,该程序使计算机进行从一个多级图象抽取多个笔划区域,并且产生多个笔划区域的一个二进制图象;通过把在多个笔划区域每一个中的每个象素用作目标象素,根据包括在目标象素相邻区域中的一个不同象素的属性,抽取一个特征量;及通过使用每个象素的抽取特征量从多个笔划区域的二进制图象分离属于目标笔划区域的象素,并且产生目标笔划区域的一个二进制图象。
14.一种用来把一个程序传输到计算机的传输信号,该程序使计算机进行从一个多级图象抽取多个笔划区域,并且产生多个笔划区域的一个二进制图象;通过把在多个笔划区域每一个中的每个象素用作目标象素,根据包括在目标象素相邻区域中的一个不同象素的属性,抽取一个特征量;及通过使用每个象素的抽取特征量从多个笔划区域的二进制图象分离属于一个目标笔划区域的象素,并且产生目标笔划区域的一个二进制图象。
15.一种图象处理方法,包括从一个多级图象抽取多个笔划区域,并且产生多个笔划区域的一个二进制图象;通过把在多个笔划区域每一个中的每个象素用作目标象素,根据包括在目标象素相邻区域中的一个不同象素的属性,抽取一个特征量;及通过使用每个象素的抽取特征量从多个笔划区域的二进制图象分离属于一个目标笔划区域的象素,并且产生目标笔划区域的一个二进制图象。
16.一种图象处理设备,包括输入装置,用来输入一个多级图象;笔划抽取装置,用来从多级图象抽取多个笔划区域,并且用来产生多个笔划区域的一个二进制图象;特征抽取装置,用来通过把在多个笔划区域每一个中的每个象素用作目标象素,根据包括在目标象素相邻区域中的一个不同象素的属性,抽取一个特征量;及分离装置,用来通过使用每个象素的抽取特征量从多个笔划区域的二进制图象分离属于一个目标笔划区域的象素,并且用来产生目标笔划区域的一个二进制图象。
全文摘要
一种图象处理设备从一个多级图象抽取多个笔划区域,并且产生一个二进制图象。其次,图象处理设备通过把属于笔划每一个的每个象素用作目标象素,抽取指示在目标象素的相邻区域中的笔划的粗度和平滑灰度的特征量。然后,该设备根据抽取特征量的分布从笔划二进制图象产生一个目标笔划二进制图象。
文档编号G06K9/34GK1363911SQ01141228
公开日2002年8月14日 申请日期2001年10月10日 优先权日2001年1月11日
发明者藤本克仁, 小原敦子, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1