基于文档图像的圆弧分割方法

文档序号:6524397阅读:313来源:国知局
基于文档图像的圆弧分割方法
【专利摘要】本发明提供了一种基于文档图像的圆弧分割方法,包括如下步骤:步骤1)确定圆弧的参数;步骤2)利用对称轴校正步骤1)中的参数;步骤3)判断是完整圆还是部分圆。该方法能提高文档图像的矢量化效率。为纸质文档的数字化,电子文档的管理,以及根据二维图纸构建三维模型提供强有力的支持。
【专利说明】基于文档图像的圆弧分割方法
【技术领域】
[0001 ] 本发明涉及图形分割,尤其涉及文档图像的圆弧分割。
【背景技术】
[0002]对文档图像的矢量化和数字化是信息时代的趋势,而图形识别是文档图像中的一个关键问题。只要能正确识别文档图像的内容就能处理很多文档图像。圆弧作为文档图像中很常见的一种形状,却是图形识别中的一个难点。快速准确的实现圆弧分割对处理文档
图像有重要意义。
[0003]圆弧识别与圆弧分割的区别:
[0004]圆弧识别:只需知道这个形状是一个完整的圆或者部分圆就可以了。不需要求出其半径大小,圆心坐标,和线宽。
[0005]圆弧分割:首先需要知道这个形状是一个完整的圆或者是部分圆。如果是完整的圆,需要准确求出其圆心坐标,半径,和线宽。如果是部分圆,不仅需要准确求出其圆心坐标,半径,和线宽,还需要准确求出这个部分圆的起始角度和终止角度。
[0006]在图像处理中,霍夫变换经常被用来对圆弧的识别,但是当图像的内容比较复杂时霍夫变换的分割效果非常差,而且该方法时间复杂度很高。各种改进的骨架方法也被用来分割圆弧,但是由于骨架方法的先天缺陷,这些方法分割出来的效果并不理想。因此,需要提出新的分割圆弧的方法。

【发明内容】

[0007]信息时代的到来让各种资源的数量激增,如何快速高效的传输和存储这些资源是一个亟需解决的问题。将纸质文件转成电子文件来建造数字图书馆,使之便于管理,存储和传输。通过将工程图纸文件,转换为电子文件可以构造三维模型。本发明提出的方法就是将包含各种图形的纸质文件,如建筑图纸,电路设计图,电气设计图等,转成矢量的形式存进计算机,以方便以后的文档管理和构造三维模型。其中对圆弧的分割是一个难点问题。如果能有效的分割圆弧将在很大程度上提高文档图像矢量化的质量。
[0008]为了解决现有技术中问题,本发明提供了一种基于文档图像的圆弧分割方法,包括如下步骤:
[0009]步骤I)确定圆弧的参数:
[0010]首先需要找到圆弧上至少3个点,然后利用这些点计算圆弧的参数。其方法如下:逐行扫描图像,当遇到一个黑色像素点A时,以该点为圆心,利用两个固定长度的值为半径,画两个同心圆,此处的固定长度,选择的是两个不同数值的长度,这两个同心圆与周围的线段相交得到至少3个交点,如果只有两个交点,则将该A点舍弃,继续扫描,直到满足有至少3个交点为止;去除噪声点;用包括A点在内的被保留的点求出圆心坐标和半径;
[0011]步骤2)利用对称轴校正步骤I)中的参数:
[0012]在水平方向同时采用三条线扫描,在垂直方向上同时采用三条线扫描,如果三条扫描线同时遇到黑色像素点,并且三点所在的同一条直线都是黑色,则该线可能就是一条对称轴,将该对称轴的坐标存下;
[0013]结合步骤I)求得的圆弧参数的信息,如果将某条对称轴的坐标代入圆方程时求得误差较小,则用此坐标取代圆心坐标对应的坐标;
[0014]步骤3)判断是完整圆还是部分圆:
[0015]按照固定角度并且满足圆方程的原则来生成一些点,然后再来判断这些点的像素值:
[0016]采用只生成一部分点的策略,并且将这些点分布在圆周上,如果这些都是黑色像素,则该圆弧就是完整圆;如果这些点中就一部分是黑色像素,则该圆弧是部分圆,需要进一步求出其起始角度和终止角度。
[0017]作为本发明的进一步改进,步骤I)消除噪声点方法如下:
[0018]第一种策略是根据线宽来去掉这些噪声点:
[0019]在一条线或圆弧中,如果这些交点所在的线宽与A点所在的线宽是不同的,则将这些点去掉;
[0020]第二种策略是利用连续性来去除噪声点:
[0021]以A为源点向两边扩张,如果新加进的点和以前点形成的线段不是全黑色的点,则新加进的点必须去除,否则可以保留这个新加进的点;
[0022]第三种策略是利用与内圆形成的两个交点连成的直线必须在A点和与外圆的交点之间;
[0023]只有同时满足以上三种策略的交点才会被保留下来。
[0024]所处理的图像是二值图像,背景是白色,前景是黑色。
[0025]作为本发明的进一步改进,步骤2)中,三条线优选利用以下方法确定:设待扫描图像的长度或者宽度为L,中间一条扫描线为L/2处,另外两条扫描线距离中间这条扫描线的距离为。
[0026]作为本发明的进一步改进,步骤3)中,进一步求出其起始角度和终止角度,方法如下:首先求出圆周上白色像素和黑色像素的分界点,这个分界点只是一个比较粗略的值,在这个点的附近需要再次生成密集的点,再一次求得的值才是该圆弧的起始角度或者终止角度。
[0027]作为本发明的进一步改进,步骤3)中,固定的角度如下:相邻两个点的之间的角度值范围是360/5.6R至360/5.7R,R为半径,以像素的个数为长度,角度取弧度制。
[0028]本发明的有益效果是:
[0029]该方法能提高文档图像的矢量化效率。为纸质文档的数字化,电子文档的管理,以及根据二维图纸构建三维模型提供强有力的支持。
【具体实施方式】
[0030]本方法主要包括三个方面的内容:
[0031]I)确定圆弧的参数,即圆心坐标和半径;
[0032]2)利用对称轴来校正这些参数;
[0033]3)在圆弧上生成一系列的点,并判断这些点所在的圆弧是完整的圆还是部分圆。[0034]所有处理的图像都是二值图像,背景是白色,前景是黑色。
[0035]I)确定圆弧的参数
[0036]根据不共线的三点可以确定一个圆方程的思想,首先需要找到几个点,然后利用这些点计算圆弧的参数。具体方法如下:逐行扫描图像,当遇到一个黑色像素点A时,以该点为圆心,利用两个固定长度的值为半径,画两个同心圆,此处的固定长度,选择的是两个不同数值的长度,长度的大小的确定,所属【技术领域】的技术人员根据图像的分辨率和经验进行调整和确定。这两个同心圆与周围的线段相交得到几个交点,一般情况下是四个交点,最少也需要三个交点。说明:如果只有两个交点,则将该A点舍弃,继续扫描,直到满足有至少3个交点为止。为了计算的方便只使用两个同心圆来求交点。为了尽可能的提高准确率,计算圆参数的点的个数最好大于三个。在这个求点的过程中,可能会遇到很多噪声点。本发明采用三种策略来消除这些噪声点。第一种策略是根据线宽来去掉这些噪声点。在一条线或圆弧中,各个点所在的线宽应该是相等的,如果这些交点所在的线宽与A点所在的线宽是不同的,则将这些点去掉。第二种策略是利用连续性来去除噪声点。在一幅图像中,不同的线条或圆弧很有可能是相同的线宽,但是这些交点并不是和A是在同一条线或圆弧上。根据相邻点之间的线段必须是连续黑色像素的原理,以A为源点向两边扩张,如果新加进的点和以前点形成的线段不是全黑色的点,则新加进的点必须去除,否则可以保留这个新加进的点。第三种策略是利用与内圆形成的两个交点连成的直线必须在A点和与外圆的交点之间。只有同时满足这三种策略的交点才会被保留下来。用这些(包括A点在内)被保留的点求出圆心坐标和半径。
[0037]2)利用对称轴来进行校正
[0038]根据不共线的三点可以确定一个圆的思想,不共线的三个点是可以确定一个圆方程,但是这三个点不一定可以确定唯一的一个圆,由于像素误差,计算距离很近的3个点可能会得到多个圆。由于在求圆参数的时候,同心圆的半径是固定的,并且不能保证这些交点的距离足够的大,以至于求得圆参数不是很准确。当这些交点的相对位置满足什么关系的时候,求得的圆参数才是最准确的。通过实验发现,当三个点形成的圆弧是半圆时,求得的圆参数是比较准确的。但是在实际的操作中,想让这三个点的位置分布在半圆上是不现实的。因此需要利用周围的信息来校正这些参数值。通过分析这些图纸,发现对称轴是普遍存在于图纸中的,这些对称轴通常都是经过圆心的,而且都是水平对称轴和垂直对称轴居多,所以利用对称轴的信息可以校正这些参数。由于部分图没有对称轴,或者是在图的某个局部有局部对称轴。综合这些情况,从时间和效率的角度考虑,在水平方向同时采用三条线扫描,在垂直方向上同时米用三条线扫描,此处的水平方向和垂直方向即被扫描平面的横坐标和纵坐标方向,如果三条扫描线同时遇到黑色像素点,并且三点所在的同一条直线都是黑色,则该线可能就是一条对称轴,将该对称轴的坐标存下。三条线优选利用以下方法确定:设待扫描图像的长度或者宽度为L,中间一条扫描线为L/2处,另外两条扫描线距离中间这条扫描线的距离为。使用同样的方法,直到水平方向和垂直方向都扫描完成。结合上面求得的圆弧参数的信息,如果将某条对称轴的坐标代入圆方程时求得误差较小,则可用此坐标取代圆心坐标对应的坐标。
[0039]3)判断是完整圆还是部分圆
[0040]由于部分圆还需要求出其起始角度和终止角度,所以需要判断这段圆弧是属于完整圆还是属于部分圆。有些研究人员采用经典的Bresenham(直译:博瑞森汉姆)画圆方法来“重绘”这个圆弧。本发明用实验验证得出该方法的效率有待提高。通过Bresenham画圆方法画出的圆弧中存在很多冗余的像素点。当需要进行判断时,事先将圆周上的所有像素点按照角度大小的顺序存进一个数组中,当需要找到圆弧上的下一个点时,就需要扫描这个数组,相邻的像素值通常都是有相同角度值,为了得到一个不同的角度的像素点,就必须逐一判断相同角度的像素点。当圆弧的半径越大时,需要判断的冗余点就越多。因为圆周对应的角度都是360度,半径越大,对应的圆周就越长,圆周上点的个数就越多。本发明采用的方法是“判断”这些点,如果某个点是黑色像素并且该点的坐标满足圆方程,则该点就在圆周上。开始时本发明是随机生成一些点,在后来的实验中本发明发现这些随机点会产生一些错误。于是本发明按照固定角度(计算方法说明见下文)生成一些点,然后再来判断这些点的像素值。为了提高效率,本发明可以只生成一部分点。如果这些都是黑色像素,则该圆弧就是完整圆;如果这些点中就一部分是黑色像素,则该圆弧是部分圆,需要进一步求出其起始角度和终止角度。首先求出圆周上白色像素和黑色像素的分界点,这个分界点只是一个比较粗略的值,在这个点的附近需要再次生成密集的点,再一次求得的值才是该圆弧的起始角度或者终止角度。
[0041]固定角度的计算方法如下:通过实验得到半径的大小与圆周上点的个数的关系,如下表1。例如,如果半径R是10个像素长度,则这个圆周上共有56个点,这些点的角度值都互不相同。当求出某个圆弧的半径时,就根据下面的这个表找出比较接近的半径值,然后得到对应的圆周上点的个数。360除以这个数,就是固定的角度,即相邻两个点的之间的角度值(弧度制)。[0042]表1半径大小与圆周上点的个数的关系
[0043]
【权利要求】
1.一种基于文档图像的圆弧分割方法,其特征在于,包括如下步骤: 步骤I)确定圆弧的参数: 首先需要找到圆弧上至少3个点,然后利用这些点计算圆弧的参数,逐行扫描图像,当遇到一个黑色像素点A时,以该点为圆心,利用两个固定长度的值为半径,画两个同心圆,此处的固定长度,选择的是两个不同数值的长度,这两个同心圆与周围的线段相交得到至少3个交点,如果只有两个交点,则将该A点舍弃,继续扫描,直到满足有至少3个交点为止;去除噪声点;用包括A点在内的被保留的点求出圆心坐标和半径; 步骤2)利用对称轴校正步骤I)中的参数: 在水平方向同时采用三条线扫描,在垂直方向上同时采用三条线扫描,如果三条扫描线同时遇到黑色像素点,并且三点所在的同一条直线都是黑色,则该线可能就是一条对称轴,将该对称轴的坐标存下; 结合步骤I)求得的圆弧参数的信息,如果将某条对称轴的坐标代入圆方程时求得误差较小,则用此坐标取代圆心坐标对应的坐标; 步骤3)判断是完整圆还是部分圆: 按照固定角度并且满足圆方程的原则来生成一些点,然后再来判断这些点的像素值: 采用只生成一部分点的策略,并将这些点分布到圆周上,如果这些都是黑色像素,则该圆弧就是完整圆;如果这些点中就一部分是黑色像素,则该圆弧是部分圆,需要进一步求出其起始角度和终止角度。
2.根据权利要求1所述的基于文档图像的圆弧分割方法,其特征在于:步骤I)消除噪声点方法如下: 第一种策略是根据线宽来去掉这些噪声点: 在一条线或圆弧中,如果这些交点所在的线宽与A点所在的线宽是不同的,则将这些点去掉; 第二种策略是利用连续性来去除噪声点: 以A为源点向两边扩张,如果新加进的点和以前点形成的线段不是全黑色的点,则新加进的点必须去除,否则可以保留这个新加进的点; 第三种策略是利用与内圆形成的两个交点连成的直线必须在A点和与外圆的交点之间; 只有同时满足以上三种策略的交点才会被保留下来。
3.根据权利要求1所述的基于文档图像的圆弧分割方法,其特征在于:所处理的图像是二值图像,背景是白色,前景是黑色。
4.根据权利要求1所述的基于文档图像的圆弧分割方法,其特征在于:步骤2)中,三条线优选利用以下方法确定:设待扫描的图像的长度或者宽度为L,中间一条扫描线为L/2处,另外两条扫描线距离中间这条扫描线的距离为。
5.根据权利要求1所述的基于文档图像的圆弧分割方法,其特征在于:步骤3)中,进一步求出其起始角度和终止角度,方法如下:首先求出圆周上白色像素和黑色像素的分界点,这个分界点只是一个比较粗略的值,在这个点的附近需要再次生成密集的点,再一次求得的值才是该圆弧的起始角度或者终止角度。
6.根据权利要求1所述的基于文档图像的圆弧分割方法,其特征在于:步骤3)中,固定的角度如下:相邻两个点的之间的角度值范围是360/5.6R至360/5.7R,R为半径,以像素的个数为长度,角 度取弧度制。
【文档编号】G06T7/00GK103679731SQ201310700137
【公开日】2014年3月26日 申请日期:2013年12月18日 优先权日:2013年12月18日
【发明者】王轩, 张自力, 于成龙, 李鑫鑫, 张加佳, 刘猛, 赵海楠, 李晔, 漆舒汉, 关键, 张江涛, 刘博
申请人:哈尔滨工业大学深圳研究生院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1