封闭区域识别方法和设备的制造方法_2

文档序号：8396167阅读：来源：国知局

素点在二值化图像中的值设置为1 ;否则设置为0。
[0046] 根据本发明的实施例，预处理单元110在对图像进行二值化之后，对图像进行去噪，以增强封闭区域的边界。
[0047] 根据本发明的实施例，预处理单元110可根据已知的图像信息，对二值化图像进行去噪。例如，可以根据已知的线段的宽度、颜色等，来对二值化图像进行处理，以去除其中的噪声。
[0048] 图2示出了根据本发明实施例的封闭区域提取方法200的流程图。首先，在步骤 S201，对输入图像进行预处理，以消除噪声并通过对图像进行二值化来增强线条，以获得二值化图像。
[0049] 接下来在步骤S202,通过以下方式，针对每行和每列确定候选区域：行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点。
[0050] 接下来在步骤S203,依次扫描每个候选点，通过以下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号。
[0051] 最后，在步骤S204,识别输入图像中的封闭区域，将具有相同类别标号值的候选点识别为属于同一个区域。
[0052] 图3示出了根据本发明实施例的二值化过程300的流程图。首先，在步骤S301，扫描输入图像的每一个点。
[0053] 接下来在步骤S302,针对输入图像中的每一个像素，估计多个信道值的方差。然后在步骤S303,进行方差判断，以设置二值化图像中对应点的值。最后在步骤S304,输出得到的二值化图像。
[0054] 例如，如果点p处的方差大于阈值，则认为点p是高光点，并且将二值化图像中点p 处的值设置为1。否则，将二值化图像中点P处的值设置为〇。特别地，还可以指定某种特定颜色C。在这种情况下，如果高光点p'的标准方差在特定范围内，则将二值化图像中点 P'处的值设置为1。否则，将二值化图像中点P'处的值设置为〇。该二值化过程可以直接作用于彩色图像，并且与传统方法不同。在传统方法中，在进行二值化之前需要将彩色图像改变为灰度图。此外，根据本发明的实施例，如果输入图像具有彩色背景，则如果所标记的颜色C与背景的颜色不同，则同样可以提取所标记的像素并进行二值化。
[0055] 图4示出了根据本发明实施例的类别标号设置过程的流程图。
[0056] 在步骤S401，创建索引矩阵A并对索引矩阵A进行初始化。索引矩阵A用于存储输入图像中每一个点的类标的索引值。因此，A具有与输入图像相同的大小。然后，扫描二值化图像。如果一个点是前景点，则将其对应的索引矩阵A中的索引值设置为-1。如果一个点是背景点且其在候选区域内，即其在所在行（或所在列）的第一个前景点和最后一个前经典之间，则将其对应的索引矩阵A中的索引值设置为-2。否则，针对在候选区域之外的背景点，将其索引值设置为〇。
[0057] 接下来，在步骤S402,创建类别矩阵B以存储对应点的类别。类别矩阵B的构造原理如下：初始B只有一个元素，且其值为0,即B [0]=0;在算法运行过程中，如果创建了一个新的类别P，其父类别和根类别就是它自己，即B[p]=p ;在之后的运算过程中如果发现，p类另_父类别是q，则将其值设为B[p] =q。作为示例，例如B[0]=，B[1]=1，B[2] =1，B[3]=2，那么3的父类别B[3]是2, 2的父类别B[2]是1，1的父类别B[l]还是1 (说明它是根类别或根节点），这样2,3的根类别就是1。B的标号就是A中的索引值，但不包含（-1，-2)，其值就是对应标号的父类别。
[0058] 在步骤S403,扫描索引矩阵A的每一行。如果其值为-2,表示其对应的点为背景点，则扫描其8个相邻点并选择值大于-1的相邻点。如果没有相邻点满足该条件，即没有相邻点的值大于-1，则在矩阵B中添加一个类别。否则，即被扫描的点的8个相邻点中存在值大于-1的相邻点，则选择值大于-1的相邻点，并从所选择的相邻点的根节点（即，类另IJ)中选择最小值，并将索引矩阵A中的元素设置为该最小值。如果存在多个值大于-1的相邻点，则更新这些值在B中对应的值，将其对应的类别的值设为其中的最小值。这是因为它们属于同一个区域。
[0059] 在步骤S404,更新矩阵B，用其根节点的值来设置每个元素的值。在步骤S405,更新矩阵A，针对大于-1的元素，用其根节点的值来设置它们的值。
[0060] 在步骤S406,对输入图像的像素点进行分组，在A中对应的索引值具有相同值的像素点属于同一个区域。换言之，具有与不在候选区域内的背景点相同的索引值的点与这些背景点属于同一个区域，其他的区域即封闭区域。
[0061] 具体地，类别标号设置算法的伪代码以下表示为如下：
[0062]
【主权项】
1. 一种封闭区域识别方法，包括：对包含一个或更多个封闭区域的输入图像进行二值化，W获得二值化图像；扫描二值化图像，针对每行和每列确定候选区域：行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点；依次扫描每个候选点，通过W下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号；W 及将具有相同类别标号值的候选点识别为属于同一个区域。
2. 根据权利要求1所述的封闭区域识别方法，还包括；针对二值化图像中的所有点，初始化类别标号。
3. 根据权利要求1所述的封闭区域识别方法，其中，将由具有相同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值不同的候选点组成的区域识别为一个封闭区域。
4. 根据权利要求1所述的封闭区域识别方法，其中，扫描其相邻点的步骤还包括；如果所述相邻点的类别标号值不同，则将所述相邻点中的类别标号中最小的值分配给该些类别标号。
5. 根据权利要求1所述的封闭区域识别方法，其中，对输入图像进行二值化包括：计算输入图像的每个像素点的多通道值的方差；如果方差大于阔值，则将该像素点在二值化图像中的值设置为1 ;否则设置为0。
6. 根据权利要求1所述的封闭区域识别方法，在进行二值化之后，还包括：对二值化图像进行去噪。
7. 根据权利要求6所述的封闭区域识别方法，其中，对二值化图像进行去噪包括：根据已知的图像信息，对二值化图像进行去噪。
8. -种封闭区域识别设备，包括：预处理单元，被配置为二值化包含一个或更多个封闭区域的输入图像，W获得二值化图像；候选区域确定单元，被配置为扫描二值化图像，针对每行和每列确定候选区域；行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点；类别标号附加单元，被配置为依次扫描每个候选点，通过W下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号；W 及区域分类单元，被配置为将具有相同类别标号值的候选点识别为属于同一个区域。
9. 根据权利要求8所述的封闭区域识别设备，其中，所述类别标号附加单元被配置为在向每一个候选点附加类别标号之前，针对二值化图像中的所有点，初始化类别标号。
10. 根据权利要求8所述的封闭区域识别设备，其中，所述区域分类单元被配置为将由具有相同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值不同的候选点组成的区域识别为一个封闭区域。
11. 根据权利要求8所述的封闭区域识别设备，其中，如果所述相邻点的类别标号值不同，则所述类别标号附加单元被配置为将所述相邻点中的类别标号中最小的值分配给该些类别标号。
12. 根据权利要求8所述的封闭区域识别设备，其中，所述预处理单元被配置为：计算输入图像的每个像素点的多通道值的方差；如果方差大于阔值，则将该像素点在二值化图像中的值设置为1 ;否则设置为0。
13. 根据权利要求8所述的封闭区域识别设备，其中，所述预处理单元还被配置为在进行二值化之后，对二值化图像进行去噪。
14. 根据权利要求13所述的封闭区域识别设备，其中，所述预处理单元被配置为根据已知的图像信息，对二值化图像进行去噪。
15. -种文档处理设备，包括：图像捕获系统，用于将文档转换为数字格式，W获得输入图像；W及封闭区域提取系统，用于对所述输入图像执行根据权利要求1-7之一所述的方法，W提取所述输入图像中的封闭区域。
【专利摘要】本发明涉及封闭区域识别方法和设备，用于精确地识别文档中的封闭区域。该方法包括对包含封闭区域的输入图像进行二值化，以获得二值化图像；扫描二值化图像以确定候选区域；依次扫描候选区域内的每个点，通过以下方式向每一个点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该点的类别标号；以及将具有相同类别标号值的点识别为属于同一个区域。即使封闭区域彼此相连，根据本发明的方法仍然可以提取所有封闭区域，并且与对区域进行标记的线的形状和宽度无关。
【IPC分类】G06K9-20, G06K9-60
【公开号】CN104715247
【申请号】CN201310681998
【发明人】张庆久, 乐宁
【申请人】夏普株式会社
【公开日】2015年6月17日
【申请日】2013年12月12日

完整全部详细技术资料下载

当前第2页1 2