文档图像的二值化方法和装置、及其程序和存储介质的制作方法

文档序号：6651251阅读：217来源：国知局

专利名称：文档图像的二值化方法和装置、及其程序和存储介质的制作方法
技术领域：
本发明通常涉及图像处理。特别地，本发明涉及文档图像的二值化方法、文档图像的二值化装置、及其计算机程序和存储介质。
背景技术：
文档的二值化通常是大多数文档分析系统进行的第一步。例如，现有的光学字符识别(OCR)系统要求在文本被处理前必须将其二值化。二值信息的使用降低了计算负载并且使得运用与灰度等级或色彩图像信息相比更简化的分析方法的使用成为可能。
已经提出了许多用于二值化文档图像的全局或局部阈值方法。全局阈值使用单个的阈值来二值化整个图像，但是这在很多情况，例如，对于具有复杂布局或亮度不均匀的文档都受到限制。局部阈值方法将原始图像分割为固定尺寸的小窗口(重叠的或不重叠的)，并对每个窗口使用局部特征来计算阈值。应用阈值平滑技术来消除窗口边界之间可能存在的不平滑。
例如，日本专利申请公开文本No.JP-A-2000-20714公开了一种图像处理方法、及其装置和存储图像处理功能的记录介质。
图8示出了上述日本专利申请所公开的图像处理方法的流程图。为了获得即使在背景图像上也不具有影响识别的噪音的二值图像，将要进行阈值处理的原始图像的灰度图像在步骤S81中输入，并在步骤S82中存储。而后，在步骤S83中，关注特定的像素，并且判断所述像素是否是一个字符的边缘或者是否是格线。此后，在步骤S84，确定并存储被判断为边缘的像素在二值图像上的像素值。在步骤S85对原始图像上的所有像素重复这些操作并且在步骤S86找到非边缘的像素的所有连接分量。而后，在步骤S87，关注与某一连接分量的外围接触的并且已经具有确定的像素值的像素，并且分别计算黑色像素的数量和白色像素的数量。在步骤S88中互相比较黑色和白色像素的数量，并且当黑色像素的数量更大，则在步骤S90登记整个连接分量为黑色像素。在另一种情况下，则在S89登记整个连接分量为白色像素。在步骤S91，为所有连接分量重复上述操作，并且最后在步骤S92生成二值图像，并在步骤S93输出该二值图像。
然而，对于高速扫描仪，必须简化阈值方法，并且必须提供高质量的二值图像。但是传统的全局和局部阈值方法不能满足高速扫描仪的这些需要。另外，对于阈值方法为用户提供用户接口来调节参数，从而获得用户期望的二值图像也是很重要的。

发明内容
因此，本发明的目的在于提供一种用于文档图像的新的简单二值化方法和装置，它可以提供用于调节参数的用户接口。
为了实现上述目的，根据本发明的一个方面，提供一种文档图像的二值化方法，包括步骤将文档图像的图像像素分类为在边缘附近的前景像素和除所述前景像素之外的其它像素；将前景像素设置为黑色；以及将除前景像素之外的其它像素分类为黑色和白色。
为了实现上述目的，根据本发明的另一方面，提供一种文档图像的二值化装置，包括用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素的装置；用于将前景像素设置为黑色的装置；以及用于将除前景像素之外的其它像素分类为黑色和白色的装置。
为了实现上述目的，根据本发明的又一方面，提供一种文档图像的二值化装置，包括梯度计算装置，被安排计算文档图像的每个像素的梯度；边缘阈值计算装置，被安排根据所计算的梯度计算文档图像的边缘阈值；全局二值化阈值计算装置，被安排计算文档图像的全局二值化阈值，来将文档图像的像素分类为黑色和白色；边缘确定装置，被安排确定文档图像的一个像素是否是边缘；局部二值化阈值计算装置，被安排为由所述边缘确定装置确定为边缘的每个像素计算局部二值化阈值；分类装置，被安排将边缘的N个相邻像素中的像素分类为前景像素和背景像素；设置装置，被安排将前景像素设置为黑色；以及二值化装置，被安排基于所计算的全局二值化阈值将除前景像素之外的剩余像素二值化为黑色或白色。
同时，提供一种计算机程序用于执行上述二值化文档图像的方法。
此外，还提供一种在至少一个计算机可读介质中的计算机程序产品，包括程序代码，用于执行上述用于二值化文档图像的方法。
本发明的其它目的、特征和优点将通过结合附图和下面的描述变得更加清楚，在本发明的整个附图中，相似的附图标记表示相同或类似的部分。

包含在本说明书中并作为本说明书的组成部分的附图示出了本发明的实施例，并且结合下面的描述阐述了本发明的原理。其中图1是可以用于本发明的计算机系统的方框图；图2是示出本发明的文档图像的二值化方法的流程图；图3是示出根据本发明的实施例的每个边缘像素具有不同相邻像素数的二值图像；图4示出了根据本发明的实施例的用于调节边缘阈值和全局二值化阈值的用户接口；图5示出了根据本发明的二值化结果和现有技术之间的比较；图6示出了根据本发明的二值化结果和现有技术之间的另一个比较；图7示出了根据本发明的实施例的文档图像的二值化装置的方框图；以及图8示出了现有技术中所公开的文档图像的二值化方法的流程图。
具体实施例方式
为了更加透彻地理解本发明，下面的具体描述将给出本发明的许多具体细节。然而，本领域的普通技术人员应该知道本发明并不局限于所给出的具体细节。
计算机系统的实例本发明的方法可以用于任何图像处理设备，例如，个人计算机(PC)、笔记本或嵌入照相机、摄像机、扫描仪等中的单片微型计算机(SCM)。对于本领域的普通技术人员而言，可以通过软件、硬件和/或固件很容易地实现本发明的方法。应该特别注意的是，为了实现本方法的任意步骤或步骤的组合，或任何组件的组合，本领域的普通技术人员应该知道使用I/O设备、存储设备、如CPU的微处理器等等可能是必须的。虽然实际上使用了这些设备，然而本发明的方法和下面的描述将不必然的提到它们。
如上面提到的信息处理设备，图1所示的方框图示出了可以用于本发明的典型的计算机系统的一个实例。应该注意，虽然图1示出了计算机系统的各种组件，但这并不意在代表任何特定结构或组件之间的互连方式。应该知道，具有更少组件亦或更多组件的网络计算机和其它数据处理系统也可以用于本发明。
如图1所示，作为数据处理系统的一种形式的计算机系统包括总线101，耦合到微处理器102、ROM 104、易失性RAM 105和非易失性存储器106之上。微处理器102，可以是Intel公司的Pentium微处理器，如图1的实例所示它耦合到高速缓存103。总线101将这些组件互连在一起，而且还将这些组件103、104、105和106互连到显示控制器和显示设备107，并互连到诸如输入/输出(I/O)设备的外设，例如鼠标、键盘、调制解调器、网络接口、打印机和本领域公知的其它设备。典型地，输入/输出设备109通过输入/输出控制器108耦合到系统上。易失性RAM 105典型地实现为动态RAM(DRAM)，它需要持续地供电以刷新或保留存储器中的数据。非易失性存储器106典型地是一个磁硬盘驱动器，或者磁光盘驱动器，或者光盘驱动器，或者DVD RAM，或者其它类型的存储系统，其在系统供电被撤除之后仍然保存数据。典型地，非易失性存储器也可以是随机访问存储器，虽然这并不是必须的。虽然图1示出的非易失性存储器是一个直接耦合到数据处理系统中的其它组件的本地设备，但是应该知道本发明可以使用对于系统的远程非易失性存储器，例如通过诸如调制解调器或以太网接口的网络接口耦合到数据处理系统的网络存储设备。如本领域所公知的，总线101可以包括一个或多个通过各种桥、控制器和/或适配器而互相连接的总线。在一个实施例中，I/O控制器108包括USB(通用串行总线)适配器来控制USB外设。
文档图像的二值化方法和装置下面，将参考

根据本发明的文档图像的二值化方法的实施例。图2是示出本发明的文档图像的二值化方法的流程图。
如图2所示，在处理的开始，输入文档图像的灰度图像。而后，在步骤1，为该灰度图像的每个像素计算梯度。在本发明的一个实施例中，使用Sobel算子计算每个像素的梯度。本发明的普通技术人员都应该知道，任何其它类型的算子，例如Robert交叉算子和Prewitt算子等都可以用于计算梯度。
在步骤1为文档图像的每个像素计算梯度之后，处理过程前进到步骤2，在此为当前正在处理的文档图像计算缺省边缘阈值。
在步骤2中，首先计算为每个像素计算的上述梯度的直方图。而后，通过使用Otsu方法，计算缺省边缘阈值。
此外，在步骤3为当前正在处理的文档图像计算缺省全局二值化阈值。与步骤2类似，首先计算正在处理的文档图像的输入灰度图像的直方图。而后，通过使用Otsu方法，为正在处理的文档图像计算缺省全局二值化阈值。
在为正在处理的图像计算缺省边缘阈值和缺省全局二值化阈值之后，处理过程前进到步骤4来确定正在处理的文档图像中所包含的边缘。
在步骤4，对每个像素，如果确定该像素的梯度大于边缘阈值，则它是边缘。否则，它不是边缘。首先，该边缘阈值被设置为在步骤2中计算的缺省值，如果二值图像不能被接受，这一边缘阈值可以由用户调节，这将在下面具体描述。
此后，在步骤5，使用每个像素的N个相邻像素来计算每个边缘像素的局部二值化阈值，这将用于将每个边缘像素的N个相邻像素中的像素分类为前景像素和背景像素。
对于每个边缘像素，在它的N个相邻像素中，计算局部二值化阈值，并且基于为每个边缘像素所计算的局部二值化阈值，将这些N个相邻像素分类为前景像素和背景像素。对于N，如果它太小，那么，如图3的左图所示，正在处理的文档图像的输入灰度图像的文本将会被破坏；但是如果N太大，那么将花费很长的时间进行计算。N可以从9、13、16、21、25、29、36、37等组中选出。N个相邻像素的数量和组成是预先确定的。例如，组成为5×5的矩形(N＝25)，5×5的菱形(N＝13)等等。根据本发明的文档图像的二值化方法的优选实施例，N等于25(5×5的矩形)。
设N个相邻的这些像素中的最大灰度值是nMax并且N个相邻的这些像素中的最小灰度值是nMin，则用于特定边缘像素的局部二值化阈值是nMax和nMin的平均值。然而本领域的普通技术人员可以容易地使用其它方法来计算每个边缘像素的局部二值化阈值。
在确定正在处理的文档图像的输入灰度图像的边缘像素并为每个确定的边缘像素计算局部二值化阈值之后，在步骤6将每个确定的边缘像素的N个相邻像素中的像素分类为前景像素和背景像素。
如果在步骤5得到N个相邻像素中的一个像素的灰度值小于局部二值化阈值，该像素是前景像素，否则它是背景像素。
而后，在步骤7，在步骤6确定的这些前景像素被设置为黑色。
此后，处理过程前进到步骤8，以便用全局二值化阈值二值化其余像素。
根据本发明的文档图像的二值化方法，文档图像的图像像素首先被分为两类在步骤6中获得的前景像素，以及其它像素。对于前景像素，它们被设置为黑色，对于其它像素，它们由全局二值化阈值被进一步分类为黑色像素和白色像素。首先，全局二值化阈值被设置为在步骤3中计算的缺省值，如果二值化图像不能够被接受，那么该全局二值化阈值将在步骤9由用户进行调节，这将在下面进行描述。
可以看出，JP-A-2000-20714公开的方法和本发明的方法当中都基于在N个相邻像素(或局部窗口)中的像素值为每个边缘像素计算阈值，然而，“确定局部窗口中的阈值”的技术不是新的而且也是现有技术公知的。
但是，在JP-A-2000-20714中，仅确定了边缘像素是黑色的还是白色的，而且黑色和白色像素均在二值图像中登记。然而，在本发明中，在边缘像素的N个相邻像素内的所有像素都被考虑，但是，仅仅在二值图像上登记黑色像素。在下面的步骤中，将由全局二值化阈值再次二值化除登记像素之外的像素。
此外，N个相邻像素(或局部窗口尺寸)是本发明的一个重要参数。窗口尺寸必须大于字符的笔划宽度。否则，在笔划中就会出现“空洞”。
现在，将描述用户对边缘阈值和对全局二值化阈值的调节。
如果二值化图像不能被接受，例如，噪音非常大并且文本有丢失，用户就可以调节边缘阈值参数和全局二值化阈值的参数来获得更好的二值化图像(步骤9)。用户接口如图4所示。
在图4中，边缘阈值参数是对比度，全局二值化阈值参数是亮度。首先，将这两个参数分别设置为在步骤2和步骤3中计算的缺省值，然后正在处理的文档图像的输入灰度图像由这两个缺省值进行二值化。如果二值化图像不能被接受，在步骤9，用户可以调节这两个参数获得更好的二值图像。
对比度与文本有关、亮度与背景有关。对比度越高文本越清晰，对比度越低文本越不易读出。亮度越高背景清除得越干净，亮度越低背景变得越暗。
通过使用上述文档图像的二值化方法，用户可以在高速扫描仪中获得高质量的二值图像。图5和6示出了根据本发明的二值化结果和现有技术之间的比较。
从图5所示的二值化结果中可以看出，对于其它二值化方法，如果一些文本在高亮度背景的后面，那么在二值图像中这些文本将消失，而且一些高亮度背景将会变暗。但是对于本发明的二值化方法，这些文本能够显露出来，并且这些高亮度背景被清除干净。
此外，从图6所示的二值结果可以看出，对于其它二值化方法，如果一些文本很细微，在二值化图像中这些文本会消失。但是在本发明的二值化方法中，这些文本能够显露出来。
因此，根据本发明，首先本发明允许友好的用户界面。通过调节全局阈值，用户可以非常容易地使二值图像看起来更亮或更暗。这是本发明一个非常引人关注的特征。因为仅仅通过使用固定的设置进行二值化可能对一些图像是不好的，因此非常希望允许用户进行调节。
此外，二值图像也将更加平滑。或者，换句话说，视觉效果更好。正如所公知的那样，对于OCR而言，局部阈值方法(JP-A-2000-20714属于这类方法)比全局阈值方法更好。但是二值图像可能并不平滑。相反，全局阈值能够获得平滑的效果，但是不能解决复杂的文档，例如暗的和轻的文本和线条以及暗的和轻的背景面的组合出现在一页上。本发明的方法成功地结合了局部阈值(用于边缘的N个相邻中的像素)和全局阈值(用于没有在局部阈值中登记的像素)。因此它能够实现OCR和视觉效果之间更好的折衷。
接下来，将参考附图描述本发明的文档图像的二值化装置。图7示出了根据本发明的实施例的文档图像的二值化装置的方框图。
如图7所示，文档图像的二值化装置，包括梯度计算单元701，被安排为文档图像的每个像素计算梯度；边缘阈值计算单元702，被安排基于所计算的梯度计算文档图像的边缘阈值；全局二值化阈值计算单元703，被安排用于计算文档图像的全局二值化阈值，来将文档图像的像素分类为黑色和白色；边缘确定单元704，被安排用于确定文档图像的一个像素是否是边缘；局部二值化阈值计算单元705，被安排用于为每个由边缘确定单元704确定为边缘的每个像素计算局部二值化阈值；分类单元706，被安排用于将在边缘的N个相邻像素中的像素分类为前景像素和背景像素；设置单元707，被安排用于将前景像素设置为黑色；二值化单元708，被安排用于基于所计算的全局二值化阈值，将除前景像素之外的其余像素二值化为黑色或白色；以及用户接口709，被安排用于调节边缘阈值和全局二值化阈值。
此外，本领域的普通技术人员应该理解，文档图像的二值化装置还应该包括输入单元，用于输入文档图像的灰度图像；以及输出单元，用于在利用根据本发明的上述方法和装置进行二值化之后，输出二值图像。
显然，本领域的普通技术人员也应当理解，根据本发明的文档图像的二值化装置可以进一步实现为包括用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素的装置；用于将前景像素设置为黑色的装置；以及用于将前景像素之外的其它像素分类为黑色和白色的装置。
用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素的装置可以进一步包括用于计算边缘阈值的装置；用于基于计算的边缘阈值确定文档像素的图像像素是否是边缘的装置；用于对每个确定为边缘的像素计算局部二值化阈值的装置；用于基于对被确定为边缘的像素所计算的局部二值化阈值，将文档图像中的被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素的装置。
在本发明的优选实施例中，用于对每个确定为边缘的像素计算局部二值化阈值的装置包括用于计算nMax和nMin的平均值作为局部二值化阈值的装置，所述nMax是被确定为边缘的像素的N个相邻像素中的图像像素的最大灰度值，并且所述nMin是被确定为边缘的像素的N个相邻像素中的图像像素的最小灰度值；以及用于将文档图像的被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素的装置，如果被确定为边缘的像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值，则确定该像素为前景像素，否则它就是属于除前景像素之外的其它像素的背景像素。优选的，N为25。
在上述实施例中，预先确定N个相邻像素的数量(例如N＝25)，但是，本发明并与局限于上述实施例。例如，此外N个相邻像素的数量和组成可以在步骤9由用户来调节。
在本发明的另一实施例中，用于计算边缘阈值的装置包括用于计算文档图像的每个像素的梯度的装置；计算为文档图像的所有像素计算的梯度的直方图的装置；以及使用Otsu方法计算边缘阈值的装置。优选的，使用Sobel算子计算文档图像的每个像素的梯度。
根据本发明的优选实施例，用于将除前景像素之外的其它像素分类为黑色和白色的装置包括用于对所有除前景像素之外的其它像素计算全局二进制阈值的装置；以及如果在除前景像素之外的其它像素中的一个像素的灰度值大于全局二值化阈值，则将该像素确定为黑色，否则将该像素确定为白色的装置。
作为选择，边缘阈值和全局二值化阈值可以由用户接口进行外部调节。
除上述本发明的方法和装置的具体实施例之外，本发明的目的还可以通过如上所述的在任何信息处理设备上运行的程序或程序组来实现，它可以通过任何语音检测和任何后续处理装置来进行交互。所述信息处理设备、语音检测和后续处理装置可以是公知的通用设备。
因此，应该重点强调的，本发明包括了通过直接或远程地将执行上述实施例功能的软件程序(对应于所述实施例中的流程图的程序)提供给系统或装置，并由该系统或装置的计算机读出并执行所提供程序的代码来实现本发明的情况。这样，只要提供了程序功能，本发明的形式就不会仅局限于程序。
因此，安装在用来执行本发明的功能过程的计算机中的由该计算机执行的程序代码本身实现了本发明。即，本发明包括用于执行本发明的功能过程的计算机程序本身。
这样，程序形式不应该被特别限制，并且目标代码、由解释器执行的程序、提供给OS的脚本数据等等都可以使用，只要它们具有程序功能。
作为提供程序的记录介质，例如，软盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失性存储卡、ROM、DVD(DVD-ROM、DVD-R)等等都可以使用。
作为另一种程序提供方法，可以使用在客户端计算机上的浏览器建立到因特网上给定主页的连接，并且可以从该主页将本发明的、被压缩并包括自动安装功能的计算机程序本身或文件下载到例如硬盘等的记录介质上，由此提供程序。而且，构成本发明的程序的程序代码可以分割为多个文件，并且这些文件可以从不同的主页下载。也就是说，本发明还包括WNW服务器，它使得多个用户下载程序文件来由计算机执行本发明的功能过程。
此外，存储有本发明的加密程序的例如CD-ROM等的存储介质可以交付用户，被验证具有预定条件的用户被允许通过因特网从主页上下载密钥信息来解密该程序，并且该加密程序可以使用该密钥信息被执行来安装在计算机上，从而实现本发明。
上述实施例的功能不但可以通过由计算机执行所读出的程序代码来实现，也可以通过基于该程序的指令的、运行在计算机上的OS等执行的一些或全部实际处理操作来实现。
此外，上述实施例的功能可以通过由安排在功能扩展板或功能扩展单元中的CPU等执行的一些或全部实际处理来实现，将所述从记录介质中读出的程序写入扩展板或单元的存储器后，插入或连接所述功能扩展板或功能扩展单元到计算机。
在此描述的仅仅是本发明原理的应用。例如，上面描述的作为操作本发明的最佳模式而实现的功能仅仅用于解释的目的。作为特定的实例，例如，其它设计也可以用来获得和分析波形数据来确定语音。此外，本发明也可以用于除检测语音之外的其它目的。因此，在不背离本发明的范围和精髓的情况下，本领域的普通技术人员也可以实施其它的方案和方法。
权利要求
1.一种文档图像的二值化方法，包括步骤将文档图像的图像像素分类为在边缘附近的前景像素和除前景像素之外的其它像素；将前景像素设置为黑色；以及将除前景像素之外的其它像素分类为黑色和白色。
2.根据权利要求1所述的文档图像的二值化方法，其中将文档图像的图像像素分类为在边缘附近的前景像素和除前景像素之外的其它像素的步骤包括步骤基于边缘阈值，确定文档图像的一个图像像素是否是边缘；对在上述确定步骤中被确定为边缘的每个像素计算局部二值化阈值；以及基于对确定为边缘的像素所计算的局部二值化阈值，将文档图像中被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素。
3.根据权利要求2所述多的文档图像的二值化方法，所述方法进一步包括根据用户指令调节边缘阈值的步骤，其中，在基于用户指令调节边缘阈值后，基于调节后的边缘阈值重新执行所述分类步骤。
4.根据权利要求2所述的文档图像的二值化方法，其中，对被确定为边缘的每个像素计算局部二值化阈值的步骤包括步骤用于计算nMax和nMin的平均值作为局部二值化阈值的步骤，所述nMax是被确定为边缘的像素的N个相邻像素中的图像像素的最大灰度值，并且所述nMin是被确定为边缘的像素的N个相邻像素中的图像像素的最小灰度值；以及其中，将文档图像中被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素的步骤中，如果被确定为边缘的像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值，则该像素是前景像素，否则它是属于除前景像素之外的其它像素的背景像素。
5.根据权利要求3所述的文档图像的二值化方法，其中N值在9到37之间。
6.根据权利要求2所述的文档图像的二值化方法，其中计算边缘阈值的步骤包括步骤计算文档图像的每个像素的梯度；计算为文档图像的所有像素所计算的梯度的直方图；以及使用Otsu方法计算边缘阈值。
7.根据权利要求5所述的文档图像的二值化方法，其中使用Sobel算子计算文档图像的每个像素的梯度。
8.根据权利要求1-7中任意一项所述的文档图像的二值化方法，其中将除前景像素之外的其它像素分类为黑色和白色的步骤包括步骤为除前景像素之外的所有其它像素计算全局二值化阈值；以及如果在除前景像素之外的其它像素中的一个像素的灰度值小于全局二值化阈值，确定该像素为黑色，否则该像素为白色。
9.根据权利要求8所述的文档图像的二值化方法，所述方法进一步包括步骤根据用户指令调节全局二值化阈值，其中在根据用户指令调节全局二值化阈值后，基于调整后的全局二值化阈值重新执行所述分类步骤。
10.一种文档图像的二值化装置，包括第一分类装置，用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素；设置装置，用于将前景像素设置为黑色；以及第二分类装置，用于将除前景像素之外的其它像素分类为黑色和白色。
11.根据权利要求10所述的文档图像的二值化装置，其中所述第一分类装置包括基于边缘阈值，确定文档图像中的一个图像像素是否是边缘的装置；对于被确定为边缘的每个像素计算局部二值化阈值的装置；以及第三分类装置，基于对被确定为边缘的像素所计算的局部二值化阈值，将文档图像中被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素。
12.根据权利要求11所述的文档图像的二值化装置，所述装置还包括调节装置，用于根据用户指令调节边缘阈值，其中在根据用户指令调节边缘阈值后，所述第一分类装置根据调节后的边缘阈值对图像像素进行重新分类。
13.根据权利要求11所述的文档图像的二值化装置，其中所述计算装置计算nMax和nMin的平均值作为局部二值化阈值，所述nMax是被确定为边缘的像素的N个相邻像素中的图像像素的最大灰度值，并且所述nMin是被确定为边缘的像素的N个相邻像素中的图像像素的最小灰度值；并且其中，如果被确定为边缘的像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值，则所述第三分类装置确定该像素为前景像素，否则该像素是属于除前景像素之外的其它像素的背景像素。
14.根据权利要求13所述的文档图像的二值化装置，其中所述N值在9到37之间。
15.根据权利要求11所述的文档图像的二值化装置，所述装置还包括用于计算文档图像的每个像素的梯度的装置；用于计算为文档图像的所有像素所计算的梯度的直方图的装置；以及使用Otsu方法计算边缘阈值的装置。
16.根据权利要求15所述的文档图像的二值化装置，其中使用Sobel算子计算文档图像的每个像素的梯度。
17.根据权利要求10-16中任意一项所述的文档图像的二值化装置，其中所述第二分类装置包括为除前景像素之外的所有其它像素计算全局二值化阈值的装置；以及如果在除前景像素之外的其它像素中的一个像素的灰度值小于全局二值化阈值，则确定该像素为黑色，否则该像素为白色的装置。
18.根据权利要求17所述的文档图像的二值化装置，所述装置进一步包括根据用户指令调节全局二值化阈值的装置，其中在根据用户指令调节全局二值化阈值后，所述第二分类装置基于调整后的全局二值化阈值重新执行。
19.一种用于文档图像的二值化装置，包括梯度计算装置，被安排计算文档图像的每个像素的梯度；边缘阈值计算装置，被安排根据所计算的梯度计算文档图像的边缘阈值；全局二值化阈值计算装置，被安排计算文档图像的全局二值化阈值，该全局二值化阈值用于将文档图像的像素分类为黑色和白色；边缘确定装置，被安排确定文档图像的一个像素是否是边缘；局部二值化阈值计算装置，被安排为由所述边缘确定装置确定为边缘的每个像素计算局部二值化阈值；分类装置，被安排将边缘的N个相邻像素中的像素分类为前景像素和背景像素；设置装置，被安排将前景像素设置为黑色；以及二值化装置，被安排基于所计算的全局二值化阈值将除前景像素之外的剩余像素二值化为黑色或白色。
20.根据权利要求19所述的用于文档图像的二值化装置，还包括用户接口，被安排调节边缘阈值和全局二值化阈值。
21.一种计算机程序，当由计算机执行时，使计算机执行如权利要求1-9中任意一项所述的动作。
22.一种在至少一个计算机可读介质中的计算机程序产品，包括用功能性描述的内容，当由计算机执行时，使计算机执行如权利要求1-9中任意一项所述的动作。
全文摘要
本发明公开了一种文档图像的二值化方法和装置。根据本发明的二值化方法包括步骤将文档图像的图像像素分类为在边缘附近的前景像素和除前景像素之外的其它像素；将前景像素设置为黑色；以及将除前景像素之外的其它像素分类为黑色和白色。
文档编号G06K9/38GK1979526SQ20051012879
公开日2007年6月13日申请日期2005年12月2日优先权日2005年12月2日
发明者马小勇, 胥立丰, 游亚平申请人:佳能株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马小勇;胥立丰;游亚平
技术所有人：佳能株式会社
我是此专利的发明人

上一篇：定向输入设备和显示方位控制的制作方法
上一篇：用于使购物者能够购买物品的虚拟购物环境和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。