一种离散数据点集的线特征提取方法

文档序号:6535970阅读:4593来源:国知局
一种离散数据点集的线特征提取方法
【专利摘要】本发明公开了一种离散数据点集的线特征提取方法,其根据获得的均值、方差及主轴方向,基于聚类分析,以坐标均值为初始的聚类中心、以方差和主轴方向为约束值设定有效区域,进而调用步骤(4)和步骤(5)进一步计算有效区域内数据点坐标的均值和方差,得出新的聚类中心,如此迭代,直到当前和上一次计算得到的聚类中心之间的距离小于设定阈值,则以当前得到的主轴方向为斜率过坐标均值确定的线特征为提取的线特征。依据本发明速度快、准确率高且误检率低。
【专利说明】一种离散数据点集的线特征提取方法
【技术领域】
[0001]本发明涉及一种离散数据点集的线特征提取方法。
【背景技术】
[0002]特征检测在模式识别和数字图像处理领域发挥着重要作用,是模式识别过程的关键步骤。图像特征主要分为自然特征和人工特征两类。人工特征是指人为构造产生的图像特征,如直方图、频谱图、链码等;自然特征是指图像本身所固有的特征,是可以通过人类视觉感知系统直接获得的,如图像的边缘、纹理、形状、点、线等。研究发现,人类视觉系统能够快速准确的识别目标物体,主要在于人眼能够直接提取目标物体的线和面等高维特征。而线特征的提取一直以来都是特征提取领域的研究热点。
[0003]一般目标物体的线特征描述形式可以分为连续曲线数据描述和离散点集数据描述两类。针对这两种不同的目标数据描述形式,可以采用不同的线特征提取方法。一般具有连续曲线数据描述形式的线特征通常对应目标物体的轮廓线或者边界线,常用的线特征提取方法主要有空域微分算子方法和基于变换的方法两大类。而对于离散点集数据描述形式的线特征通常对应于大量离散数据点的某种直线近似或拟合,常采用基于变换的特征提取方法。
[0004]基于变换的线特征提取方法主要是Hough变换。1972年Duda和Hart提出利用Hough变换提取直线。Hough变换在检测直线时受噪声影响小、鲁棒性好,故应用很广泛。但传统的Hough变换在用于检测直线时,存在不能确定直线端点、会检测出虚假直线以及对称地额外画出直线等问题。另外,研究者提出了用全局阈值与局部阈值结合去除虚假直线、利用动态分组原则确定端点的方法,但是该方法的阈值确定较困难,算法也比较复杂。(Duda R.0., Hart P.E.Use of t he HT t o detect lines and curves in picture.Comm[C].ACM, 1972,15:11-15;韩秋蕾,朱明,姚志军.基于改进Hough变换的图像线段特征提取[JL仪器仪表学报,2004,25:436-439.)
[0005]线性特征提取所依赖算法:聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类是一种发现这种内在结构的技术,属于无监督学习。聚类分析己经广泛地应用在许多领域,包括模式识别、数据分析、图象处理、以及市场研究等。通过聚类,人能够识别密集的和稀疏的区域,因而发现全局的分布模式以及数据属性之间有趣的相互关系。聚类分析可分为:静态聚类和动态聚类两大类,其中静态聚类主要是指非迭代的分级聚类算法,动态聚类一般可分为C均值聚类和IS0DATA算法两种(边肇祺,张学工.模式识别[M].北京,清华大学出版社,2000年)。
[0006]K-L变换是将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法,也是数学上用来降维的一种方法,在模式识别和图像处理中用于特征的抽取。基于K-L变换的特征提取及其与该变换先关的改进算法,在模式识别技术的发展历程中产生了深远的影响。
【发明内容】

[0007]本发明的目的在于提供一种速度快、准确率高且误检率低的基于离散数据点集合的线性特征提取方法。
[0008]本发明采用以下技术方案:
[0009]一种离散数据点集的线特征提取方法,包括以下步骤:
[0010](I)读取原始离散数据点集合图像;
[0011](2)对原始离散数据点集合图像进行灰度化处理;
[0012](3)对灰度化处理得到的离散数据点集合图像进行二值化处理;
[0013](4)在初始给定的坐标系内计算二值化后所有数据点坐标的均值和方差;
[0014](5)基于K-L变换计算数据点分布的主轴方向;
[0015](6)根据获得的均值、方差及主轴方向,基于聚类分析,以坐标均值为初始的聚类中心、以方差和主轴方向为约束值设定有效区域,进而调用步骤(4)和步骤(5)进一步计算有效区域内数据点坐标的均值和方差,得出新的聚类中心,如此迭代,直到当前和上一次计算得到的聚类中心之间的距离小于设定阈值,则以当前得到的主轴方向为斜率过坐标均值确定的线特征为提取的线特征。
[0016]依据本发明的上述方法,针对原始离散数据点集合图像进行灰度化和二值化处理,在一定程度上去除了图像中的干扰数据点,计算量降低,速度提高;进而通过K-L变换和聚类分析,尤其是通过有效区域的方式,可以减少边缘的干扰数据,不仅降低了计算量,也提高了计算的准确性,并且干扰信息的减少,也有利于减少迭代次数,进一步提高计算速度。
[0017]再进一步改进的方案中,上述离散数据点集的线特征提取方法,步骤(6)中有效区域的确定方法是:
[0018]a)以当前获得的主轴方向为斜率过当前获得的聚类中心确定一条直线;
[0019]b)以步骤a)确定的直线为基准,向其两侧集合图像边缘内侧平行地设置两条扩增直线,所获得的两条扩增直线内的区域为有效区域;
[0020]其中,步骤b)中集合图像为首次扩增的约束系,进一步确定有效区域时,以上次获得的有效区域为约束系。
[0021]两条扩增直线确定的有效区域可以更加有效地滤除边缘干扰数据点信息,且相对而言,扩增直线与基准直线之间的距离相对也比较容易设定,降低了难度。
[0022]进一步地,扩增直线与确定的用作基准的直线的初始距离为:
【权利要求】
1.一种离散数据点集的线特征提取方法,其特征在于,包括以下步骤: (1)读取原始离散数据点集合图像; (2)对原始离散数据点集合图像进行灰度化处理; (3)对灰度化处理得到的离散数据点集合图像进行二值化处理; (4)在初始给定的坐标系内计算二值化后所有数据点坐标的均值和方差; (5)基于K-L变换计算数据点分布的主轴方向; (6)根据获得的均值、方差及主轴方向,基于聚类分析,以坐标均值为初始的聚类中心、以方差和主轴方向为约束值设定有效区域,进而调用步骤(4)和步骤(5)进一步计算有效区域内数据点坐标的均值和方差,得出新的聚类中心,如此迭代,直到当前和上一次计算得到的聚类中心之间的距离小于设定阈值,则以当前得到的主轴方向为斜率过坐标均值确定的线特征为提取的线特征。
2.根据权利要求1所述的离散数据点集的线特征提取方法,其特征在于,步骤(6)中有效区域的确定方法是: a)以当前获得的主轴方向为斜率过当前获得的聚类中心确定一条直线; b)以步骤a)确定的直线为基准,向其两侧集合图像边缘内侧平行地设置两条扩增直线,所获得的两条扩增直线内的区域为有效区域; 其中,步骤b)中集合图像为首次扩增的约束系,进一步确定有效区域时,以上次获得的有效区域为约束系。
3.根据权利要求2所述的离散数据点集的线特征提取方法,其特征在于,扩增直线与确定的用作基准的直线的初始距离为:
4.根据权利要求1至3任一所述的离散数据点集的线特征提取方法,其特征在于,在步骤(6)中聚类分析前,以得到的均值为原点构造新的坐标系。
5.根据权利要求1所述的离散数据点集的线特征提取方法,其特征在于,步骤(2)的灰度化处理对像素点不同的通道采用不同的权重,人眼敏感性高的通道占有较大的权重,相反,人眼敏感度低的通道占有较低的权重。
6.根据权利要求5所述的离散数据点集的线特征提取方法,其特征在于,绿色通道的权重至少为50%,且不能大于60%。
7.根据权利要求6所述的离散数据点集的线特征提取方法,其特征在于,步骤(2)得到的灰度图像为:
f (X,y) = 0.30R (X,y) +0.59G (x, y) +0.1 IB (x, y) 其中,f(x,y)表示灰度化后灰度图像的像素值,R(x,y)、G(x,y)、B(x,y)为原始数据点集合图像的R、G、B三个分量。
8.根据权利要求1、5-7任一所述的离散数据点集的线特征提取方法,其特征在于,步骤(3) 二值化处理的计算公式为:
9.根据权利要求8所述的离散数据点集的线特征提取方法,其特征在于,二值化分割阈值T为110。
10.根据权利要求1所述的离散数据点集的线特征提取方法,其特征在于,当前和上一次计算得到的聚类中心之间的距离所对应的设定阈值为2。
【文档编号】G06K9/46GK103942526SQ201410021438
【公开日】2014年7月23日 申请日期:2014年1月17日 优先权日:2014年1月17日
【发明者】邹国锋, 万会松, 傅桂霞, 姜树明, 张元元, 陈长英, 魏志强, 张江州, 祝连鹏 申请人:山东省科学院情报研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1