边界提取方法，程序，及使用该方法和程序的装置的制作方法

文档序号：6432809阅读：144来源：国知局

专利名称：边界提取方法，程序，及使用该方法和程序的装置的制作方法
技术领域：
本发明涉及图像处理装置，并更具体涉及从已使用图像处理装置捕获并包含背景的图像提取纸页部分的技术。
背景技术：
作为能够读取由纸等制成的源文件的装置，已知诸如扫描仪，复印机，传真机等。使用这种图像处理装置读取源文件通常通过设置源文件的前侧(被读取面)在图像读取装置的读取面，并通过在源文件背侧放置源文件盖而进行。当读取图像时，光从读取面一侧照射到设置的源文件前侧，并使用在读取表面一侧配置的光学读取单元(CCD)读取反射光。如果源文件的尺寸小于读取面，则源文件的盖(以下称为背景)也出现在从读取面一侧看到的源文件周围。由于当读取图像时除了源文件的前侧之外还读取了背景，获得的图像数据自然地变为背景出现在源文件周围的数据。
于是，本发明人等公开了一种技术，当捕获图像时该技术不需要特别的方案，并通过利用背景材料和源文件之间的差异，仅使用在图像捕获之后执行的图像处理来检测源文件的边缘(图2中实现的专利文件1)。
日本专利公开No.2002-370596然而，这一技术的问题是，如果背景的材料与源文件的材料类似，或如果背景上的图像不稳定，如在以平头扫描仪读取图像中那样，则边缘检测的精确性恶化。

发明内容
本发明的目的是要提供一种技术，即使背景上的图像不稳定，或即使背景的材料与源文件的材料类似，这种技术也能够以高精确度检测源文件的边缘。
在第一方面，本发明提供了一种方法，在通过以扫描仪捕获源文件获得的图像中，利用材料之间的差异来检测构成源文件边界的一个边缘。该方法包括检测边缘段的步骤，这通过在垂直于该边缘的方向从图像的一端搜索形成图像的所有搜索行来执行；检测边缘段的步骤，这通过从图像的中心附近向图像的一端在所有搜索行中进行搜索来执行；以及对于所有搜索行从边缘段确定直线边缘的步骤。
边缘确定步骤最好包括候选项确定步骤，用于对于所有搜索行从边缘段获得多个边缘候选项；以及选择步骤，用于从多个边缘候选项之中选择最优的候选项。
选择步骤可包括，基于与格线(ruled line)的比较而选择最优的候选项的步骤。
在另一方面，本发明提供了一种边界检测程序，其存储到存储介质并由CPU执行，并在包括存储该程序的存储介质、及在该程序控制下运行的CPU(中央处理单元)的一个装置中，从以扫描仪捕获源文件获得的图像，检测构成源文件边界的一个边缘。这一方法包括检测边缘段的步骤，这通过在垂直于边缘的方向从图像的一端搜索形成图像的所有搜索行来执行；检测边缘段的步骤，这通过从图像的中心附近向图像的一端搜索所有搜索行来执行；以及对于所有搜索行从边缘段确定直线边缘的步骤。
此外，本发明可提供一种装置，其功能是使用上述方法，从以扫描仪捕获源文件获得的图像提取源文件的边界。

图1是一流程图，表示根据本发明用于从捕获的图像检测源文件一个边缘的操作；图2表示根据本发明的一个优选实施例的图像处理装置的构成；
图3示例表示一个图像，根据本发明从其提取边界；图4是一流程图，表示图1步骤100中的过程的一例的细节；图5A和5B表示打印字符区的排除，这是使用图1中所示打印字符区排除过程进行的；图6是一流程图，表示图1步骤104中特征强调过程一例的细节；图7是一数据表，表示使用图6中所示的特征强调过程，对一样品图像进行的2DFFT的结果；图8是一流程图，表示在图1的步骤106中用于获得边缘候选项的边缘段的过程的一例的细节；图9示例表示使用图8的试验性边缘确定过程(步骤106)获得的边缘段；图10是一流程图，表示图1的(步骤108)多个边缘候选项提取过程一例的细节；图11A示例表示步骤110中从多个试验性边缘候选项中选择最平行于格线的试验性边缘候选项的方法中的比较；图11B是一流程图，示例表示步骤110从多个试验性边缘候选项中选择最平行于格线的试验性边缘候选项的方法；图12是一流程图，表示图1的边缘确定过程(步骤112)一例的细节；图13表示图15步骤S120中待处理的象素区；图14是一流程图，表示使用图1所示本发明的边缘检测原理提取源文件的操作；图15表示当在图14中检测源文件的4个边缘时的两类搜索方法；图16是一简化的框图，表示向计算机加载根据本发明的边界提取程序，并执行该程序的一例；图17是一简化的框图，表示向计算机加载根据本发明的边界提取程序，并执行该程序的一个第二实现例；图18是一流程图，示例表示使用根据本发明的边界提取程序的第一图像处理系统的操作；
图19是一流程图，示例表示使用根据本发明的边界提取程序的第二图像处理系统的操作；以及图20是一流程图，示例表示根据本发明的边界提取程序从捕获的图像提取源文件、并进行字符识别的一个系统的操作。
具体实施例方式
以下参照附图详细描述根据本发明的优选实施例。如果在多个附图中描绘了相同的构成元件，则这些元件以相同的标号标记。
图2示出根据本发明的一个优选实施例的图像处理装置的构成，该装置从捕获的图像提取源文件部分，并使用源文件部分。在该图示中，图像处理装置1包括一主体12，以及一个源文件盖10，用于覆盖放置在主体顶面的源文件。主体12的构成有扫描仪机构单元14，这是读取放置在主体12顶面上的源文件的扫描仪的机械部分；图像打印机构单元16，这是一个图像打印装置的机械部分；以及电子装置单元20，其使用扫描仪机构单元14与图像打印机构单元16之间的配合操作执行所需的功能。众所周知，电子装置单元20的构成有控制单元22，其包括CPU(中央处理单元)，ROM(只读存储器)，RAM(随机访问存储器)等等，它们都未示出；存储各类程序和数据的辅助存储装置26；以及输入/输出接口24，用于提供扫描仪机构单元14与图像打印机构单元16之间的接口。辅助存储装置26存储操作系统(OS)32，扫描仪驱动器34，其通过与扫描仪机构单元配合操作而捕获图像，边界提取程序36，其从使用扫描仪从捕获的图像检测边缘，以及各类程序38，它们用于实现图像处理装置1的功能。作为图2所示的图像处理装置，可使用任何装置，只要其可提取并处理包含在以扫描仪捕获的图像中的源文件部分。图像处理装置1的例子包括复印机，传真机，OCR装置，自动条带处理装置等等。
在图像处理装置1的主体上预定位置放置并读取源文件之后，调用边界提取程序36并执行，以便从读取的图像提取源文件区。就是说，检测源文件的左，右，上和下边缘。可使用类似的过程检测左，右，上和下边缘。因而，首先描述对一个边缘例如左侧边缘的检测。
图1是一流程图，表示通过控制单元22在根据本发明一个优选实施例的边界提取程序36的控制之下，从捕获的图像检测源文件的一个边缘的操作。图1的大部分由上述本申请人提交的日本专利申请公开No.2000-37059(专利文件1)公开。因而，根据本发明的原理的操作步骤由图1中粗线表示，该公开内容的详细说明从略。
图3示出一图像的一部分，从该部分使用边界提取程序36提取纸页(或源文件)的边界。在该图示中，垂直方向的虚线是源文件的左边缘，左边缘的右侧部分是源文件，而左边缘的左侧垂直指向的区域是源文件的盖。源文件包括水平和垂直的格线。以下描述用于检测这种图像中源文件边缘的操作。
当调用边界提取程序36时，在步骤100首先检测源文件的印刷字符区。然后，在步骤104中及之后的过程中，从过程目标排除该印刷字符区。具体来说，例如使用图4所示的印刷字符区排除过程，识别并存储具有200或更小的RGB阴影值的象素区，并将其从步骤104及之后的搜索目标中去除。在图5中示出从原始图像中对印刷字符区的排除。印刷字符区的排除过程可根据图4所示的流程图执行。然而，该过程不限于这一实现，而可使用其他适用的方法执行。稍后将描述图4的细节。
根据本发明一个优选实施例，通过在步骤102使用已知的方法搜索在步骤100检测出印刷字符区而提取垂直和水平格线。然后，使用这里检测出的格线确定试验性边缘(稍后描述的步骤110)。
然后，在步骤104，按以下的方式进行特征强调使用2DFFT(2维快速付立叶变换)对搜索区中设置的每一块获得频谱，获取所获得的频谱的高频分量、低频分量及直流分量的平均值，频谱的最大值的一半宽度设置为频率分布，并把获得的高频分量、低频分量及直流分量的平均值以及频率分布设置为特征量。例如可使用图6所示的特征强调过程进行这种特征强调。然而，特征强调不限于这一实现，而是可使用其他适当的方法实现。图6的细节将在稍后说明。图7是一数据表，表示使用图6所示的特征强调过程对样本图像执行2DFFT(2维快速付立叶变换)的结果。
然后在步骤106，使用在步骤104获得的特征量获取一个边缘，并确定该获得的边缘为试验性边缘。这一试验性边缘确定步骤S106包括边缘候选项确定步骤106，多边缘候选项提取步骤108，以及试验性边缘选择步骤110。
具体来说，在步骤106，使用在步骤104获得的特征量执行边缘候选项确定过程。首先，在步骤210，设置从印刷字符区的一端到开头的搜索方向，并设置一开始块。在步骤220，如图9所示，通过使用每一块的特征量在搜索方向搜索所有的行来获得各边缘段。注意，对应于边缘并且等于使用搜索过程检测的搜索块长度的部分被称为边缘段。然后，在确定步骤250，确定是否存在其边缘段没有检测到的搜索行。如果存在其边缘段不能检测到的行，搜索方向设置为从印刷字符区向该端(左端，因为在这例子中示例的是左边缘的检测)，并设置一开始块。然后，流程返回步骤220，在此从印刷字符区的左端向左侧对所有的搜索行进行搜索，以便检测边缘段。这种情形下，搜索可从中心向左侧进行。然而，通过排除印刷字符区，可使搜索更为有效。将在稍后描述步骤106的一个实现的例子。
根据本发明，从在步骤106获得的边缘候选项的边缘段提取多个边缘候选项。这一过程一例的细节示于图10。在这图示中，首先在步骤S460，对在步骤106获得的边缘段的整个列进行线性逼近，并把线性逼近的列设置为第一边缘候选项。在步骤462，获得各块之间的x轴差Δx。这里，“各块之间的x轴差Δx”指示在搜索方向相邻边缘段位置之间的差。由于当前例子中搜索方向是水平的，这一差指示在水平轴(即x轴)方向相邻边缘段的位置(即x坐标)之间的差。在步骤464，获得x轴差Δx的绝对值的平均值。在步骤466，获得排除了其x轴差Δx的绝对值超过平均值的块的一个块组(试验性地称为“沿中心的块组”)，即，相对地沿步骤106获得的边缘段列中的中心的一个边缘段集合。在步骤468，设置阈值为0。
然后在步骤S470，获得作为通过向沿中心块组添加其x轴差Δx在阈值的正范围内的一个块组(即靠右的边缘段集合)所得结果的一个块组(试验性地称为沿中心并靠右的块组)。在步骤472，获得作为通过向沿中心块组添加其x轴差Δx在阈值负范围内的一个块组(即靠左的边缘段集合)所得结果的一个块组(暂时称为沿中心并靠左的块组)。
然后在步骤474，确定阈值是否达到其x轴差Δx为最大值的块。如果阈值没有达到其x轴差Δx为最大值的块，则预定的阈值增量α被添加到当前阈值，且流程返回S470。然后重复步骤470到476。如果在步骤474阈值达到其x轴差Δx为最大值的块，则对于获得的各块组分别进行线性逼近，并将结果设置为边缘候选项。这样，可获得多个边缘候选项。通过设置阈值增量α为适当的值，可调节所要获得的边缘候选项数。
在这样提取了多个边缘候选项之后，最平行于在步骤102获得的格线的边缘候选项被确定为试验性边缘。即，在与当前检测的边缘同一方向中最平行于格线(垂直方向的格线，因为该例子中检测的是左边缘)的边缘候选项被确定为试验性边缘。如果当前被检测的边缘是在上部或下部的水平边缘，则在水平方向中最平行于格线的边缘候选项确定为试验性边缘。图11示例示出在步骤110中从多个边缘候选项选择最平行于格线的一个边缘候选项的方法。在图11A中，通过格线一端的水平轴与每一边缘候选项交叉的点的x坐标与上述一端的x坐标之间的差定义为ΔT，而通过格线另一端的水平轴与上述边缘候选项交叉的点的x坐标与上述另一端的x坐标之间的差定义为ΔB。以下描述涉及图11B所示的流程图的操作。在步骤482，获得水平方向中格线的顶部与每一边缘候选项之间的差ΔT，以及格线的底部与每一边缘候选项之间的差ΔB。在步骤484，选择其根据ΔT和ΔB的差为最小的边缘候选项，并确定为探试性边缘。在图11A所示的例子中，边缘候选项2被选择，因为其根据ΔT和ΔB的差较小。
边缘检测过程可通过确定在步骤110选择的边缘为最终边缘而终止。然而在这一优选实施例中，为了改进边缘检测的精确性，这里获得的边缘设置为试验性边缘，并在该试验性边缘附近进行更高精度(使被处理的块更小)的边缘检测，以便在后继步骤中筛选出精确的边缘位置。
就是说，在步骤112，基于在步骤110获得的试验性边缘确定最终边缘。步骤112的细节示于图12。在步骤120，如图13所示，在步骤110获得的试验性边缘的左和右16个象素宽度上，在32个垂直象素×1个水平象素的块单元中提取特征，且基于提取的特征的峰值位置被确定为边缘段。在步骤122，对获得的边缘段进行线性逼近，以获得直线。然后在步骤124的鲁棒性校正中，对于通过从步骤120获得的边缘段集合，使用步骤122获得的直线作为基准，对排除不适合确定为边缘(离步骤122获得的直线太远的一个边缘)的一个边缘而获得的边缘集合进行线性逼近，从而获得最终边缘。步骤120的细节将在稍后描述。
如上所述，在图1的优选实施例中，通过使用在步骤106中在32个垂直象素×4个水平象素的大块单元中进行的搜索确定边缘候选项，并通过在步骤112使用在试验性确定的边缘附近在32个垂直象素×1个水平象素的小块单元中进行的搜索而增加精确度，从而获得一个边缘。然而，本发明不仅仅适用于以这样的方式在两个阶段通过改变块尺寸检测一个边缘的方法。使用在小块单元中进行的搜索的边缘检测的后半部分可以省略。例如，步骤112可以省略，且图1所示的边缘检测过程可在执行步骤110之后终止。
总之，本发明的原理在于(1)如果作为使用材料之间的差别从捕获的图像一端搜索行的结果存在其边缘段不能被检测出的行，则通过从中心附近(最好是印刷字符区的一端)向一端逆向搜索各行而检测边缘段，以及(2)在从获得的边缘段列确定多个线性边缘候选项之后，从边缘候选项中选择与此前提取的格线最平行的边缘候选项作为边缘。在上述优选实施例中，在步骤104和106使用大块(以相对低的精确性)获得试验性边缘，并在步骤112在试验性边缘附近使用小块(以较高的精确性)获得最终边缘。然而，本发明不限于以这种方式在两个阶段获得边缘的方法。只要其通过从捕获的图像一端搜索各行获得一个边缘，任何方法都可用作为边缘检测方法。于是，只要其满足该目的，步骤100，104，220和112可以任何方法实现。如上所述，步骤112可省略。
这里，详细描述步骤100，104，196和112实现的例子。这些步骤可作为任何形式实现而不必限制为以下的例子，只要它们满足目的即可。
<印刷字符区的排除>
在图4所示的操作流程中，在图像平面上图3所示的框起来的源文件图像A中首先被读取的开始行的位置被设置为图像A顶部的位置(S300)。然后，位于图3中设置行左端的一个象素被设置为读取目标(S302)。这里，读取设置象素的RGB阴影值，并确定读取的值是否超过RGB阴影值200。该值在这例子中是预定的并且是用于排除作为印刷字符区的象素的基准(S304)。作为这一确定的基准的RGB值可依赖于源文件适当设置。如果读取的象素的RGB值超过200，则确定象素不是印刷字符区，并且同一行中右侧的下一个象素被设置为下一个读取目标(S306)。或者，如果在步骤S304读取的象素的RGB值等于或小于200，则试验性地假设在这一区存在印刷字符区，且流程在下一步骤S308转到噪声确定过程。在步骤S308，确定是否存在一象素，其位置与在步骤S304试验性假设为图像平面上印刷字符区的象素相继，并且该象素试验性假设为印刷字符区。如果在步骤S308确定相继的象素不存在，则流程转到步骤S306的过程，且同一行中当前被处理的象素右侧的下一个象素被设置为读取目标，并执行步骤S306中以及之后的过程。
如果两个相继的象素不被试验性地假设为印刷字符区，这意味着很可能这些象素是由于与印刷字符区不相关的污点等引起的噪声。作为这一确定的基准的相继象素数量的设置可按需要适当进行。如果在步骤S308确定相继的象素存在，则这些象素设置为从图3所示的图像A的左端最初检测出的印刷字符区(步骤S310)。然后在步骤S312，确定这行中是否留有待处理的象素。如果在步骤S312确定这行中留有待处理的象素，则流程进到步骤S306的过程，并按上述步骤类似地处理象素。如果在步骤S312确定这行中没有留下待处理的象素，则进而确定这行是否是在图3所示图像A底部待被读取的最后的行(步骤S314)。如果在步骤S314确定这行不是最后的行，则设置图像平面上紧靠这行之下的一行(步骤S316)，并从设置的行左端重复执行步骤S302中以及之后的过程。在完成图3所示图像A中所有行的扫描，即在完成直到上述最后的行的扫描时，确定当前的行为最后的行，并终止这一过程。
<特征强调>
在特征强调步骤104和边缘段检测步骤220中，图像A(从其排除印刷字符区的图像)的搜索区域被划分为相对大的象素块，诸如32个垂直象素×4水平象素的各块，并对每一块执行这些过程。
在图6所示的操作流程图中，首先设置图像A顶部左端的块为开始块(步骤S500)。然后基于图3中的信息(该信息指示在图1的印刷字符区排除步骤100中识别出的象素的印刷字符区)，确定当前块是否包含图5所示的印刷字符区(步骤S502)。如果在步骤S502确定当前块包含图4中的印刷字符区，则与当前块相邻的块重新设置为图像A中待处理的区域(步骤S504)。如果在步骤S502确定当前块不包含图4中的印刷字符区，则对块单元中的当前块执行已知的二维快速付立叶变换过程(以下简称为2DFFT)，并获得当前块的频谱(步骤S506)。这里，获取已获得的当前块频谱的高频分量(假设为1/2π≤ω＜3/4π。ω是指示频率的变量)的平均值(步骤S508)。
然后，获取已获得的当前块频谱的低频分量(这例子中假设为0＜ω＜1/2π)的平均值(步骤S510)。然后，获取已获得的当前块频谱的直流分量(这例子中假设为ω＝0)的平均值(步骤S512)。图7示例示出对于这样搜索的32个垂直象素×212个水平象素的一个矩形区中的每一块获得的上述各分量平均值的实际测量数据。这一实际测量数据指示分别对RGB的计算结果，以便于理解各RGB值中的波动。该图中的X坐标对应于图3所示图像A的X轴方向，并指示当把图3所示矩形区的左端视为X坐标原点，在右方向计数象素数量时的象素数量的值。图7进一步指示，与根据从图3所示并由X坐标规定的矩形区域左端起的各象素数量的一个位置一致的、作为各个RGB的直流分量(直流分量R，G，和B)的阴影值，作为各RGB低频分量(低频分量R，G，和B)的频谱值，以及作为各RGB高频分量(高频分量R，G，和B)的频谱值。在上述步骤中，获得了三个类型分量的平均值。这里，从当前块的频谱进一步获得半宽度，且所获得的半宽度设置为当前块的频率分布(步骤S514)。半宽度是峰值周期邻域中两个周期的区间，其指示当水平和垂直轴分别定义为频谱的周期和强度时获得的频率分布中半峰值的强度。在步骤S508到S512获得的各分量的平均值以及在步骤S514设置的频率分布被设置为当前块的特征量(步骤S516)。这里，对于图3所示加框的源文件图像A的所有块确定是否已执行上述过程(步骤S518)。如果在步骤S518确定存在与当前块相邻的待扫描的块，则流程进到步骤S504，其中图3所示图像A中下一待扫描的块被重新设置为待处理的区域，并执行上述过程。如果在步骤S518确定对于图像A的所有块已执行上述过程，且不存在与当前块相邻的待扫描的块，这一过程终止。在这一操作流程中获得了4个特征量。然而特征量不限于这四个特征量，而是可添加另外的特征量。如上所述，在图1的特征强调步骤104中，从加框的源文件图像A可提取预定尺寸的块单元中各类特征量，对该图像执行印刷字符区排除步骤100中的过程。
<边缘候选项的确定>
图8是一流程图，表示在图1的边缘候选项确定步骤106中为获得边缘候选项的边缘段的过程的一个实现例子。这一操作流程是基于在图1的特征强调步骤104中获得的各类特征量而执行的。
在这一操作流程中，首先在图3所示的图像A的区域划分为的32个垂直象素×4个水平象素的各块单元中确定图像的过程目标范围，并设置对应的过程范围(步骤S1100)。这一例子中过程范围的确定是通过把从图像A的左端(在此图5B中印刷字符区变黑)到印刷字符区看作为过程目标范围而进行的。当这样确定了过程范围时，图像A顶部的一行设置为从其读取块的开始行(步骤S1102)。这里，执行(步骤S1104)用于确定上述各类特征量的加权的过程，该过程将在以下详细说明。然后在步骤210，从该端到印刷字符区设置搜索方向，并把在图像A顶部左端的块设置为开始块。然后，对于与当前块在左侧相继并相邻的块获得在步骤S104获取的特征量的每一个的平均值(直到与当前块在左侧相邻并相继的两个块)(步骤S1108)。然后这样获得的每一特征量的平均值用于图8所示的过程(步骤S1110)。在图8的步骤S1110中，获得当前被处理的块的每一特征量与在步骤S1108获得的每一特征量的平均值之间每一特征量的变化量。
这样获得的各特征量的变化量被分别指定特征量的加权，这些加权是使用步骤S1104中加权确定过程获得的或事先以统计方法获得的(最好是，高频分量，低频分量，直流分量1及频率分布的加权分别设置为1，2，1和1)，添加加权指定量，并把添加的值设置为当前块的特征变化量(步骤S1112)。这里，执行用于获得在步骤S1112中对每一块设置的特征变化量峰值的过程(步骤S1114)。稍后将详细描述这里涉及的用于获取峰值的过程(峰值检测过程)。然后基于上述峰值检测过程进行当前块特征变化量的峰值确定(步骤S1116)。如果在步骤S1116确定峰值不存在，则进一步确定下次要扫描的块是否是印刷字符区域(步骤S1118)。如果在步骤S1118确定下次要扫描的块不是印刷字符区，则进一步确定该块是否是与中心块在扫描方向侧离开1个块的块(步骤S1120)。如果在步骤S1120确定该块与中心块在扫描方向侧离开1块的距离，则确定当前被处理的块是否是位于最后行的块(步骤S1122)。或者，如果在步骤S1116确定存在峰值，则确定当前被处理的块是对应于边缘的块，且在这一例子中这一块试验性地被确定为在源文件图像左端的一个边缘(步骤S1124)。然后流程进到在步骤S1122的上述过程。如果在步骤S1118确定当前被处理的块是印刷字符区，则流程进到步骤S1122的过程。
如果在步骤S1120确定该块不是与当前块在扫描方向侧离开1个块的块，则流程进到步骤S1126的过程，并且下一个被扫描的块设置为待处理的块。然后重复执行在步骤S1108以及之后的过程。如果在步骤S1122确定当前被处理的块不是位于最后行中的块，则流程进到步骤S1126的过程。然后，执行在步骤S1126以及之后的过程。或者，如果在步骤S1122确定当前被处理的块是位于最后行中的块，则流程进到后继步骤250的过程。在步骤250，确定是否存在其边缘段不能被检测到的行。如果存在其边缘段不能被检测到的行，则搜索方向设置为从印刷字符区向图像A的该端，并在步骤260设置开始块。然后流程进到返回到步骤S1108。如果在步骤S250确定不存在其边缘段不能被检测到的行，则这一边缘候选项确定过程终止。
<步骤120(高精度的边缘检测)>
在这一操作步骤，在扫描方向试验性设置为图像A顶部的一行中边缘位置、分别位于图9中象素列的后和前的16象素的范围(32个垂直象素×1个水平象素)首先设置为过程目标(步骤S1700)。然后，这一过程中的一个块单元设置为具有32个垂直象素×1个水平象素范围的象素列。对于象素列这一单元中的上述范围进行一维快速付立叶变换，并获得每一象素列的频谱(步骤S1702)。图13对于一行示出过程目标范围。该图示示出对于包含图9所示线性逼近的象素列的一行的过程目标范围。图13所示的矩形区域1800变为由虚线指示的行1802的过程目标范围。还对其他行以类似的方式设置过程目标范围，虽然这没有具体示出。在矩形区1800的放大部分，示出被试验性确定为边缘位置的边缘与过程目标的上述范围之间的位置关系。从这一图示证明，分别排布在由该图的中心直线指示的试验性边缘的16位后和前象素列(其每一个为32个垂直象素×1个水平象素)，被确定为上述过程目标的范围。在步骤S1702获得一个频谱之后，在上述象素列的单元中获得各分量(高频，低频和直流分量)的平均值以及频谱的频率分布(步骤S1704)。然后对各分量和频率分布指定加权，它们是在图8的步骤S1104中获得的或者事先以统计方法获得的，对每一象素列添加加权指定值，且获得的值设置为象素列的特征值(步骤S1706)。这里，对每一象素列的特征值执行已知的子波变换(步骤S1708)。
然后，执行已知的峰值检测过程，以使用以子波变换获得的值检测行单元中的边缘段(步骤S1710)。然后，确定当前被处理的行是否是规定为试验性边缘的最后行(步骤S1712)。如果当前被处理的行不是最后行，则设置下一个将被扫描的行(步骤S1714)，并且重复在步骤S1702及其后的过程。如果在步骤S1712确定当前被处理的行是最后行，则终止步骤120中的过程。
<由四边组成的边界的检测>
如上所述，可以高精度获得源文件的边缘。基于以上提供的说明描述从捕获的图像通过获得源文件的所有边缘提取源文件的情形。图14是一流程图，表示用于根据图1所示本发明的边缘检测原理提取源文件的操作。这里假设源文件的左，右，顶部和底部边缘分别为SL，Sr，Su，和Sd。还假设在这4个边缘中当前被处理的边缘为Sx(x＝L，r，u或d)。由于已经描述了图14中主过程的各步骤，这里主要涉及该过程的流程。
图14中，步骤100和102中的过程的结果可用于不考虑方向的后继搜索过程。因而，在开始执行一次这些过程即可。在步骤103中，指示左边缘的L设置为当前被检测的边缘Sx的x。
然后在步骤S104，对每一块获得特征量，并进行特征强调。在这一过程中，使用垂直指向的块。因而，必须分别对于左和右边缘，以及顶部和底部边缘执行步骤104。必须对各边缘执行后继步骤106到112。
于是，在步骤112终止时，在步骤130确定x是否为r。如果x不是r，则在步骤132设置x为指示右边缘的r。然后，流程返回步骤106，并检测右边缘。
如果在步骤130确定x是r，这意味着右边缘的检测终止。因而在确定步骤134确定x是否为指示顶部边缘的u。如果x不是u，则不终止顶部边缘的检测。因而在步骤136设置x为u，且流程返回步骤104。在为向上和向下的方向中的搜索获得了每一块的特征量之后，检测顶部边缘。
如果在步骤S134确定x是u，则这意味着终止顶部边缘的检测。因而在确定步骤138确定x是否为指示底部边缘的d。如果x不是d，则不终止底部边缘的检测。因而在步骤138设置x为d，且流程返回步骤106以检测底部边缘。如果在步骤138确定x是d，这也意味着终止底部边缘的检测。因而源文件提取过程终止。
图15示出当在图14中检测源文件的4个边缘时的两类搜索方法。一个方法是通过固定搜索方向、并通过顺序转动源文件(在这图示中是左侧)而检测4个边缘的方法。另一方法是通过固定图像的指向、并顺序转动搜索方向而检测4个边缘的方法。在每一种情形下，根据本发明，如步骤106(图1和12)及步骤220指示的，作为从外部向印刷字符区搜索所有搜索行的结果，如果存在其边缘段不能被检测的行，则从印刷字符区向端部进行搜索。这样，能够改进边缘检测的精度。
<各种修改型>
图16是表示一实施例的简化框图，其中向一计算机加载并执行根据本发明实现方式的边界提取程序。这一图示中所示的系统包括捕获源文件的扫描仪40，以及能够存储并执行根据本发明的边缘或边界提取程序36的计算机42。使用存储在计算机42中的边界提取程序36，包含在以扫描仪40捕获的图像中的源文件的部分被提取并使用。
图17是一简化的框图，表示第二实现例子，用于向一计算机加载根据本发明优选实施例的边界提取程序，并用于执行该程序。图17中所示的系统与图16所示的系统类似，所不同在于进一步包含文件编档计算机44，其连接到并能够与计算机42通信。在图17所示的计算机42从根据程序36自扫描仪40捕获的图像提取源文件之后，可把提取的源文件传送到另一装置，诸如文件编档计算机44，而不自己使用文件。这种情形下，计算42可基于在传送源文件之前边缘检测期间获得的信息，从图像提取背景部分，调节源文件的尺寸，或通过转动源文件图像来校正倾斜。
图18是一流程图，其示例性表示使用根据本发明优选实施例的边界提取程序的图像处理系统的操作。首先，捕获从扫描仪40读取的图像数据(步骤S2400)。然后根据边界提取程序36对图像数据执行用于检测源文件边缘的过程(步骤S2402)，并获得源文件的边缘信息(步骤S2404)。然后，只提取由4个边缘包围的图像区域(源文件图像)(步骤S2408)。然后，记录这样提取的源文件的图像(步骤S2410)。
图19是一流程图，示例表示使用根据本发明优选实施例的边界提取程序的第二图像处理系统的操作。首先，把从扫描仪40读取的图像数据捕获到计算机42(步骤S2500)。然后，根据上述边界提取程序36执行边缘检测过程(步骤S2502)。然后，获得源文件的边缘信息(步骤S2504)。这里，在编辑图像数据时，例如检测获得的边缘对图像平面的轴(X或Y轴)的最小斜坡(步骤S2506)，并通过转动图像数据校正图像的倾斜以消除斜坡(步骤S2508)。然后，这样校正的源文件的图像被记录到图像数据存储单元(步骤S2510)。
注意，图18和19所示的操作流程可被组合。例如，图19的步骤S2506和步骤S2508中的过程可在图18的步骤S2404和步骤S2408中的过程之间执行。这样进行倾斜校正可便于后继过程的执行。此外，可切除背景图像数据，从而可去除额外的数据，并还使得所需的数据量减小。这导致存储的数据量的减小，并提高了数据使用中的处理速度。
图20是一流程图，示例表示使用根据本发明优选实施例的边界提取程序从捕获的图像提取源文件，并进行字符识别的系统的操作。首先捕获从扫描仪40读取的图像数据(步骤S2700)。然后，根据边界提取程序36对图像数据执行边缘检测过程(步骤S2702)，并获得源文件的边缘信息(步骤S2704)。进而，在图像数据中确定不同于由4个边缘包围的图像区域的一个图像区域(步骤S2706)。把所确定的、不同于由4个边缘包围的图像区域(源文件图像)的图像区域的阴影等级变为黑色(步骤S2708)。最后，执行字符识别过程，该过程用于标识开始点(例如，在图像平面上源文件图像顶部左端位置)，用于通过从预先存储在存储单元等中的开始点例如把印刷字符位置作为目标而提取图像，用于分析提取的图像，以及用于基于模式识别过程提取包含在图像中的字符(步骤S2710)。
注意，这一过程可与图19所示的操作流程组合。例如，在图19的步骤S2506和步骤S2508中的过程可在图20的步骤S2704和步骤S2706之间执行。这样背景图像变为黑色，从而能够生成这样的图像数据，其具有与从传统的实现黑色背景的扫描仪捕获的传统的图像相同的技术规范，且其中在源文件图像的框周围存在黑色背景图像。结果，用于编辑具有传统黑色背景的图像数据的装置(诸如OCR处理装置等)也可使用通过根据本发明的图像处理装置获得的图像数据。
上述的实现例子只是引证用来解释本发明的实现例子。因而，本领域技术人员根据本发明的概念或原理能够对上述实现例子作出各种改变，修改或补充。
例如，上述过程(当然包括边缘检测过程)能够以程序的形式分配。这种情形下，程序可存储到存储介质上，诸如软盘(注册商标)，CD-ROM，DVD等，并被分配。或者程序的部分或全部可通过由公共网络使用的传输介质等分配。
根据本发明，如果存在其边缘段不能被检测的行，则从图像的中心附近向图像的一端对所有的搜索行进行搜索，从而检测的精度增加。
此外，根据本发明，可对所有搜索行从边缘段获得多个边缘候选项，并从该多个边缘候选项中选择最优的候选项，从而进一步改进检测的精度。
权利要求
1.一种在通过以扫描仪捕获源文件获得的图像中，使用材料之间的差异检测构成源文件边界的一个边缘的方法，包括检测边缘段的步骤，这通过在垂直于该边缘的方向从图像的一端搜索形成图像的所有搜索行来进行；如果存在其边缘段不能被检测到的行的情况下的检测边缘段的步骤，这通过从图像的中心附近向图像该端搜索所有搜索行来进行；以及对于所有搜索行从边缘段确定线性边缘的步骤。
2.根据权利要求1的边界检测方法，其中所述边缘确定步骤包括候选项确定步骤，对于所有搜索行从边缘段获得多个边缘候选项；以及选择步骤，从多个边缘候选项之中选择最优的候选项。
3.根据权利要求2的边界检测方法，还包括从图像中的源文件提取格线的步骤，其中所述选择步骤包括用于基于与格线的比较而选择最优的候选项的步骤。
4.根据权利要求2的边界检测方法，其中所述候选项确定步骤包括对于所有搜索行，为所有边缘段进行线性逼近，以找出边缘候选项的步骤。
5.根据权利要求2的边界检测方法，其中所述候选项确定步骤包括对于所有搜索行，为边缘段中沿中心的边缘段进行线性逼近，以找出边缘候选项的步骤。
6.根据权利要求2的边界检测方法，其中所述候选项确定步骤包括对于所有搜索行，为边缘段中沿中心并向右侧的边缘段进行线性逼近，以找出边缘候选项的步骤。
7.根据权利要求2的边界检测方法，其中所述选项确定步骤包括对于所有搜索行，为边缘段中沿中心并向左侧的边缘段进行线性逼近，以找出边缘候选项的步骤。
8.根据权利要求5的边界检测方法，其中所述候选项确定步骤包括用于获得沿搜索方向中相邻边缘之间差的绝对值的平均值的步骤，以及正侧步骤，用于对于通过向沿中心的边缘段添加其差的绝对值在根据平均值的阈值的正范围内的边缘段而获得的集合进行线性逼近，并设置为边缘候选项。
9.根据权利要求5的边界检测方法，其中所述候选项确定步骤包括用于获得沿搜索方向中相邻边缘之间差的绝对值的平均值的步骤，以及负侧步骤，用于对于通过向沿中心的边缘段添加其差的绝对值在根据平均值的阈值的负范围内的边缘段而获得的集合进行线性逼近，并将对其进行线性逼近的集合设置为边缘候选项。
10.根据权利要求8的边界检测方法，其中所述候选项确定步骤包括负侧步骤，用于对于通过向沿中心的边缘段添加其差的绝对值在根据平均值的阈值的负范围内的边缘段而获得的集合进行线性逼近，并设置为边缘候选项。
11.根据权利要求8的边界检测方法，还包括按预定的改变量改变阈值的步骤。
12.根据权利要求11的边界检测方法，其中所述改变步骤包括用于设置阈值的初始值为0的步骤，以及如果其差的绝对值为最小的边缘段包含在根据平均值的阈值的负或正范围内，用于停止阈值改变的步骤。
13.一种边界检测程序，其使计算机执行一种过程，该过程用于从通过扫描仪捕获源文件获得的图像检测构成源文件边界的一个边缘，该过程包括检测边缘段的步骤，这通过在垂直于边缘的方向从图像的一端搜索形成图像的所有搜索行来进行；如果存在其边缘段不能被检测到的行的情况下的检测边缘段的步骤，这通过从图像的中心附近向图像的该端搜索所有搜索行来进行；以及对于所有搜索行从边缘段确定线性边缘的步骤。
14.一种计算机可读存储介质，其上记录有边界检测程序，当程序被执行时，用于使计算机执行一种过程，该过程用于从通过以扫描仪捕获源文件获得的图像检测构成源文件边界的一个边缘，该过程包括检测边缘段的步骤，这通过在垂直于边缘的方向从图像的一端搜索形成图像的所有搜索行来进行；如果存在其边缘段不能被检测到的行的情况下的检测边缘段的步骤，这通过从图像的中心附近向图像的该端搜索所有搜索行来进行；以及对于所有搜索行从边缘段确定线性边缘的步骤。
15.一种装置，其用于使用权利要求1到12中任一项所述方法，从通过以扫描仪捕获源文件获得的图像提取源文件边界。
16.一种复印机，用于使用根据权利要求2的方法，从通过以扫描仪捕获源文件获得的图像提取源文件的边界。
17.一种复印机，用于使用根据权利要求1的方法，从通过以扫描仪捕获源文件获得的图像提取源文件的边界。
18.一种复印机，用于使用根据权利要求2的方法，从通过以扫描仪捕获源文件获得的图像提取源文件的边界。
全文摘要
一种边缘检测方法，通过从在垂直于边缘方向中图像的一端，搜索形成图像的所有搜索行来检测边缘段。如果存在其边缘段不能被检测的行，则在从图像中心附近向图像该端在所有搜索行中进行搜索，从而检测边缘段。从边缘段确定线性边缘。对于所有搜索行从边缘段获得多个边缘候选项，并从边缘候选项中选择最优候选项。从图像中的源文件提取格线，并基于与格线的比较选择最优候选项。结果，即使背景侧的图像不稳定，或背景与源文件的材料类似，也能够以高精度检测源文件的边缘。
文档编号G06K9/32GK1677430SQ20041008419
公开日2005年10月5日申请日期2004年10月15日优先权日2004年3月30日
发明者江口真一, 铃木直子, 胜又裕, 金元浩一申请人:富士通株式会社, 富士通先端科技株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：江口真一;铃木直子;胜又裕;金元浩一
技术所有人：富士通株式会社;富士通先端科技株式会社
我是此专利的发明人

上一篇：复合式闪存卡的制作方法
上一篇：用于智能存储器通过通信的方法和设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。