封闭区域识别方法和设备的制造方法

文档序号：8396167阅读：398来源：国知局

封闭区域识别方法和设备的制造方法
【技术领域】
[0001] 本发明涉及图像处理技术，更具体地，涉及封闭区域识别方法和设备。
【背景技术】
[0002] 人们通常在阅读文档时对感兴趣的内容进行标记。因此，提出了一些方法，以提取文档中所标记区域。但是，一些方法无法精确地分离多个连通的区域。一些方法可以提取多个区域，但是当这些区域彼此连通时，无法精确地提取这些区域。其他一些方法基于图形方法来提取连通的封闭区域，但是这些方法也无法精确地提取封闭区域。
[0003] 还提出了一些方法，这些方法为了提取封闭区域可能需要知晓所标记区域的形状。一些提取方法仅适用于特定形状的区域。例如，一些方法仅能够提取矩形形状的区域。显然，这种限制对于用户而言不方便。
[0004] 近年来提出了一些方法，其假定所标记区域是通过直线构成的。但是，很难以确保用户所描绘的线是直线。这也限制了这些方法的应用。
[0005] 题为 "User-enclosed Region Extraction From Scanned Document Images (从扫描文档图像中提取用户封闭区域）"的美国专利US6, 351，559提出了一种从扫描文档图像中提取用户描绘的封闭区域的设备。其中，连通体分析器以位图格式分析文档，从而使得该设备能够检测可能存在的用户封闭区域，而无论文档图像的内容是什么。双向连通体模块使得用户可以用具有任何形状的标记来包围一个区域。用户所描绘的区域可以横跨文档页面上的文本行或图像。检测分析过滤器使用多个探索器来消除与用户所描绘的标记相似的小字符和图形。但是，该方法无法精确地提取封闭区域，也不支持多区域相连的情况。
[0006] 因此，需要一种能够精确地识别和提取文档的封闭区域的方法。

【发明内容】

[0007] 本公开提出了一种封闭区域识别方法和设备，能够精确地识别和提取多个连通的封闭区域。
[0008] 根据本发明的一个方面，提出了一种封闭区域识别方法，该方法首先对包含一个或更多个封闭区域的输入图像进行二值化，以获得二值化图像。然后扫描二值化图像，通过以下方式，针对每行和每列确定候选区域：行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点。然后，依次扫描每一个候选点，通过以下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号。具有相同类别标号值的候选点可以被识别为属于同一个区域。
[0009] 优选地，所述方法还包括：针对二值化图像中的所有点，初始化类别标号。
[0010] 优选地，将由具有相同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值不同的候选点组成的区域识别为一个封闭区域。
[0011] 优选地，扫描其相邻点的步骤还包括：如果所述相邻点的类别标号值不同，则将所述相邻点中的类别标号中最小的值分配给这些类别标号。
[0012] 优选地，对输入图像进行二值化的步骤包括：
[0013] 计算输入图像的每个像素点的多通道值的方差；
[0014] 如果方差大于阈值，则将该像素点在二值化图像中的值设置为1 ;否则设置为0。
[0015] 优选地，在进行二值化之后，还包括：对二值化图像进行去噪。
[0016] 优选地，对二值化图像进行去噪的步骤包括：根据已知的图像信息，对二值化图像进行去噪。
[0017] 根据本发明的另一方面，提出了一种封闭区域识别设备，包括：预处理单元，被配置为二值化包含一个或更多个封闭区域的输入图像，以获得二值化图像；候选区域确定单元，被配置为扫描二值化图像，针对每行和每列确定候选区域：行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点；类别标号附加单元，被配置为依次扫描每个候选点，通过以下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号；以及区域分类单元，被配置为将具有相同类别标号值的候选点识别为属于同一个区域。
[0018] 根据本发明的又一方面，提出了一种文档处理设备，包括：图像捕获系统，用于将文档转换为数字格式，以获得输入图像；以及封闭区域提取系统，用于对所述输入图像执行根据本发明实施例所述的封闭区域识别方法，以提取所述输入图像中的封闭区域。
[0019] 与现有技术不同，根据本发明实施例的封闭区域提取方法和设备在多个方面改善了封闭区域提取的性能，至少包括：
[0020] 1.即使封闭区域彼此相连，根据本发明实施例的封闭区域提取方法和设备仍然可以提取所有封闭区域，并且精确地识别每一点是在封闭区域内还是在封闭区域外。
[0021] 2.根据本发明实施例的封闭区域提取方法和设备与线的宽度和线的形状无关。包围感兴趣区域的线可以是曲线、直线或任意形状。同样，对于线的宽度也没有限制。线可以是粗线或者细线。
[0022] 3.根据本发明实施例的封闭区域提取方法和设备对于封闭区域的形状没有限制。可检测的封闭区域可以是凸行或凹形。可检测的封闭区域也可以非常大，或者非常小。
【附图说明】
[0023] 通过下面结合【附图说明】本发明的优选实施例，将使本发明的上述及其它目的、特征和优点更加清楚，其中：
[0024] 图1是示出了根据本发明实施例的封闭区域提取系统的示意框图；
[0025] 图2示出了根据本发明实施例的封闭区域提取方法的流程图；
[0026] 图3示出了根据本发明实施例的二值化过程的流程图；
[0027] 图4示出了根据本发明实施例的类别标号设置过程的流程图；
[0028] 图5示出了标记有一些封闭区域的常见页面的示例；
[0029] 图6示出了图5所示的页面中要检测的范围；
[0030] 图7示出了根据本发明实施例的方法，针对图5所示的示例所获得的二值化图像；
[0031] 图8示出了对图5所示的示例执行根据本发明实施例的方法所检测到的封闭区域；以及
[0032] 图9示出了根据本发明实施例的封闭区域识别方法可应用于的文档处理设备的框图。
【具体实施方式】
[0033] 以下参照附图，对本发明的示例实施例进行详细描述。在以下描述中，一些具体实施例仅用于描述目的，而不应该理解为对本发明有任何限制，而只是本发明的示例。在可能导致对本发明的理解造成混淆时，将省略常规结构或构造。
[0034] 本申请的发明人受到连通体标记方法（connected-component labeling)方法 (可参见 http: / / en.wikipedia.org/ wiki / Connected_component_labeling)的启发，将该方法用于标记位图图像中的点，其中用相同的标记来标记属于相同组的点，从而提出根据本发明实施例的封闭区域提取系统和方法。
[0035] 图1是示出了根据本发明实施例的封闭区域提取系统100的示意框图。该系统 100包括：预处理单元110、候选区域确定单元120、类别标号附加单元130和区域分类单元 140、输入单元150和存储器160。
[0036] 输入单元150向预处理单元110输入要处理的文件。该文件以图像的形式表示，并且包括一个或更多个用户标注的封闭区域。
[0037] 预处理单元110被配置为二值化输入图像，以增强封闭区域的边界。用户通常会使用高光颜色来标记封闭区域，因此，在多数情况下，可以将高光颜色当做前景颜色，以对输入图像进行二值化。
[0038] 二值化后的图像被输入候选区域确定单元120。候选区域确定单元120扫描二值化图像中的每一行和每一列，以确定候选区域。具体地，针对某一行，如果其第一个前景点是pl，最后一个前景点是p2,则针对该行的候选区域是[pl，p2]。同样，针对某一列，如果其第一个前景点是ql，最后一个前景点是q2,则针对该列的候选区域是[ql，q2]。将处于候选范围内的点称为候选点。
[0039] 类别标号附加单元130被配置为扫描每个候选点，向每一个候选点附加类别标号。根据本发明的实施例，类别标号附加单元130通过以下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号。
[0040] 类别标号附加单元130所附加的类别标号可以以矩阵的形式存储在存储器160 中。当然，存储器160中也可以存储待处理的二值化图像、所确定的候选范围的标记等信肩、。
[0041] 最后，区域分类单元140根据附加的类别标号，来识别区域。具体地，具有相同类别标号值的候选点被识别为属于同一个区域。
[0042] 根据本发明的实施例，类别标号附加单元130在每一个候选点附加类别标号之前，针对二值化图像中的所有点，初始化类别标号，以便在后续处理中对类别标号进行修改。
[0043] 根据本发明的实施例，具有相同类别标号值、且该类别标号值与不在候选区域内的点（即，背景点）的类别标号值不同的候选点组成的区域被识别为一个封闭区域。
[0044] 根据本发明的实施例，如果相邻点的类别标号值不同，而类别标号附加单元将相邻点中的类别标号中的最小值分配给这些相邻点的类别标号。
[0045] 根据本发明的实施例，作为一个示例，预处理单元110可根据以下方式来对图像进行二值化：计算输入图像的每个像素点的多通道值的方差；如果方差大于阈值，则将该像

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张庆久;乐宁;
技术所有人：夏普株式会社;
我是此专利的发明人

上一篇：一种对邮件广告图片的识别方法
上一篇：一种具备姿态调整功能的拍照辅助系统、设备及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。