基于空间自相关性和分水岭算法的聚类评估方法

文档序号:6634461阅读:234来源:国知局
基于空间自相关性和分水岭算法的聚类评估方法
【专利摘要】本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,包括:对图像进行预处理,得到特征标记图像;利用分水岭算法进行分割,计算每个多边形区域的质心坐标及面积;计算多边形区域的邻接矩阵与局部Moran’s I的数值,绘制散点图;将属于散点图不同象限的多边形区域采用不同的方式标识,直观显示聚类状态;计算相关参数,对聚类状态进行评估。本发明提供的聚类评估方法,利用分水岭算法准确的反映了目标对象见的位置信息和尺寸信息;利用空间自相关性分析,无需提供初始的聚类中心点,具有效率高,准确度好,可信度高的特点,且能够从分散的面积,分散的目标数等多个角度分析和评估目标的分布行为。
【专利说明】基于空间自相关性和分水岭算法的聚类评估方法

【技术领域】
[0001] 本发明涉及一种分布图像疏密性评估方法,特别地涉及一种基于分水岭算法和空 间自相关性的聚类评估算法,可用于包括微纳米颗粒分布、金相分析、缺陷检测分布及细胞 生物形态分布的疏密性评估分析。

【背景技术】
[0002] 疏密性是图像分析、金相检测与颗粒分布检测等检测手段中不可缺少的重要环 节,它是研究图像中目标物体在整体区域中的聚集或分散行为,及其分散或聚集程度的一 个重要指标。通过将分布图像转化为二值化图像,将图像中的目标区域转变为二值化图像 中的连通域,对连通域及其相关的位置、距离分布,可以较为准确和方便的分析分布行为的 疏密性。
[0003] 图像疏密性评估,通过作为对图像中目标物分散或聚集行为的偏向性和方向性 的评估手段而存在,其分析的结果对了解目标在空间方向上分布的行为,以及这些行为产 生的原因有重要意义。主流的聚类分析或者群集分析,是把相似的对象通过静态分类的 方法分为不同的组别或者更多的子集。类似的子集都具有相似的一些属性,如空间距离 等。常规的聚类分析,如 Kieans 算法(MacQueen J. Some methods for classification and analysis of multivariate observations[C]//Proceedings of the fifth Berkeley symposium on mathematical statistics and probabil ity.1967, I (281-297):14.),是 以空间中的k个点作为输入,将这k个点作为中心进行聚类分析,按照点与点之间的距离作 为特征,将总体的其他点划分为k个点中不同的聚类子集。该算法最大的优势在于简洁和 快速,但其应用范围很狭窄,对很多结果不能很好的吻合,且聚类分析的结果对输入的k个 点的选择要求非常高。


【发明内容】

[0004] 针对现有技术中存在的不足,本发明的目的在于提供一种基于分水岭算法和空间 自相关性的聚类评估方法。
[0005] 通常的聚类算法,首先要给予程序几个初始的聚集点,这些聚集点可以是随机给 也可以是按照肉眼所见的密集区域的点的坐标给。初始点不同,效果不同。初始点如果本 身就是肉眼所见的较密集的区域,则聚类算法处理后对整体分布的把握更大,初始点随机 给出,则可能造成计算量过大,分析效果不佳。一般如果不是随机给出,则算法的智能性较 差。
[0006] 空间自相关性分析,是指一些变量在同一个分布区域内的观测数据之间存在潜在 的互相依赖性、空间的相互作用与扩散现象。空间相关作用是指一个地方发生的现象会影 响其他与之相关的位置的结果,这种结果一般与距离和方向有关。
[0007] 由于目标分布的聚集和分散的行为,与它们在整体区域中所占据的分水岭分割后 的多边形区域的面积(Meyer F, Beucher S. Morphological segmentation [J]. Journal of visual communication and image representation, 1990, I (I) : 21-46.)密切相关,越密 集的区域,其多边形面积越小,越分散的区域,多边形面积越大,因此,衡量多边形面积的大 小,可以作为空间自相关性分析的一个重要参量,用以评估目标的分散或聚集行为。
[0008] Moran 提出 了局部 Moran,s I 指标(Moran P A P. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society. Series B(Methodo logical),1948, 10(2) :243-251.)可用来衡量同一区域的不同子区域在某个参量上的相互 关系。Moran's I大于0,则正相关;小于0,则负相关;等于0,表示不相关。且通过对参量 及邻接矩阵的分析,可以将图像的分布划分为不同聚集或分散状态的区域,对了解图像的 分布的状态和疏密程度都具有较高的价值,可操作性很高。
[0009] 因此,聚类评估转变为解决以下问题:如何将分水岭算法对图像的分割,以及分割 后的多边形区域的面积计算,和空间自相关性中邻接矩阵的处理,局部Moran's I指标结合 起来,分析图像中的分散或聚集行为以及它们的程度,以及如何利用这些参数对图像中分 布的疏密程度进行评估。
[0010] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,采用分水岭算法 对图像进行分割,将分割后的多边形面积作为空间自相关性分析的参量,将多边形的质心 距离作为空间自相关性分析的邻接矩阵的基础,计算局部Moran's I指标,对图像中目标分 布的分散和聚集行为进行分析,寻找高聚集区域和低分散区域的多边形,并通过计算其相 关的参数,对图像分布的聚集和分散程度进行评估。
[0011] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,能够较为准确的 标记图像中的聚集和分散区域,效率高,直观可靠,对分散和聚集区域内部的分布的稳定性 能够有较好的分析和评估。
[0012] 本发明的具体技术方案是:先对原始图像进行灰度处理,进行中值滤波,消除噪点 和干扰信息,得到滤波后的图像。在此基础上,使用OTSU大津法进行二值化处理,接着使用 分水岭算法,对图形进行分割,并计算分割后的多边形区域的面积及质心之间的距离。在质 心矩阵的基础上,构造邻接矩阵,计算每个多边形区域的局部Moran' s I的数值,并对多边 形面积和其平均邻接值进行散点图表示。在散点图的基础上划分不同聚集状态的区域,并 计算属于这些聚集状态区域的多边形区域的相关参数,对分布图像的聚集和分散状态进行 分析评估。
[0013] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,包括以下步骤如 下:
[0014] (1)对图像进行灰度处理,并进行中值滤波,对滤波后的图像使用OTSU大津法,得 到二值化图像;
[0015] (2)对二值化图像进行形态学处理,删除边界干扰,消除明显过小的非目标特征, 得到特征标记图像;
[0016] (3)利用分水岭算法对特征标记图像进行分割,根据分割后的图像计算每个多边 形区域的质心坐标及面积;
[0017] (4)根据多边形区域的质心坐标,计算多边形区域的邻接矩阵,并计算多边形区域 的平均邻接值;利用分水岭算法分割后的图像的多边形区域的面积作为空间自相关性分析 的参量,计算每个多边形区域的局部Moran' s I的数值,并计算局部Moran' s I的数值的 标准化值;局部Moran' s I的数值的标准化值为横坐标,多边形区域的平均邻接值为纵坐 标,绘制散点图;
[0018] (5)散点图的四个象限表示不同的聚类状态,其中散点图的第一象限为低分散区 域,散点图的第三象限为高密集区域,将属于散点图第一象限的多边形区域与属于散点图 第三象限的多边形区域采用不同的方式标识,以便直观显示聚类状态;
[0019] (6)计算低分散区域与高密集区域的相关参数,对聚类状态进行评估。
[0020] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,采用分水岭算 法,可以准确的依据原始目标对象的尺寸大小与分布的距离疏密,对图像进行分割,分割后 的多边形区域能够较好的代表原始目标对象的大小和分布特性,为后续空间自相关性分析 提供了准确的邻接矩阵信息和空间相关性特征。
[0021] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,采用空间自相关 性分析,是建立在分水岭算法提供的邻接相互关系的基础上的方法,其计算效率高,准确度 好,能够准确的描述分布图像中不同区域之间的分布的稀疏和密集的属性,因此能够较好 的描述分布图像中目标对象的分布行为特征。
[0022] 本发明提供的基于分水岭算法和空间自相关性的聚类评估方法,能够较为准确的 标记图像中的聚集和分散区域,效率高,直观可靠,对分散和聚集区域内部的分布的稳定性 能够有较好的分析和评估。
[0023] 进一步地,步骤(3)中利用分水岭算法对特征标记图像进行分割,根据分割后的 图像计算每个多边形区域的质心坐标及面积的方法包括:
[0024] (31)根据分水岭算法划分的脊线,计算每个多边形区域的边界的顶点坐标,并计 算顶点坐标的算术平均值作为多边形区域的质心坐标;
[0025] (32)根据多边形区域的边界的顶点坐标,计算多边形区域的面积。
[0026] 进一步地,步骤(4)中多边形区域的邻接矩阵包括以下步骤:
[0027] (41)计算邻接矩阵Wij的方法为:
[0028] Wij = [ClijJk ? [^ijJb
[0029] 其中,Clij为多边形区域i与多边形区域j之间的质心距离,k为多边形质心距离 的指数,P U为两个相邻的多边形区域i和j之间共享的边界长度与多边形区域i的边界 长度之比,b取值为1。
[0030] 进一步地,步骤(4)中计算每个多边形区域的局部Moran' s I的数值的方法包括 以下步骤:
[0031] (42)计算多边形区域的面积的标准差S :
[0032]

【权利要求】
1. 一种基于空间自相关性与分水岭算法的聚类评估方法,其特征在于,包括以下步骤 如下: (1) 对图像进行灰度处理,并进行中值滤波,对滤波后的图像使用OTSU大津法,得到二 值化图像; (2) 对所述二值化图像进行形态学处理,删除边界干扰,消除明显过小的非目标特征, 得到特征标记图像; (3) 利用分水岭算法对所述特征标记图像进行分割,根据分割后的图像计算每个多边 形区域的质心坐标及面积; (4) 根据多边形区域的质心坐标,计算所述多边形区域的邻接矩阵,并计算所述多边形 区域的平均邻接值;利用分水岭算法分割后的图像的多边形区域的面积作为空间自相关性 分析的参量,计算每个多边形区域的局部Moran' s I的数值,并计算所述局部Moran' s I 的数值的标准化值;所述局部Moran' s I的数值的标准化值为横坐标,所述多边形区域的 平均邻接值为纵坐标,绘制散点图; (5) 所述散点图的四个象限表示不同的聚类状态,其中所述散点图的第一象限为低分 散区域,所述散点图的第三象限为高密集区域,将属于所述散点图第一象限的多边形区域 与属于所述散点图第三象限的多边形区域采用不同的方式标识,以便直观显示聚类状态; (6) 计算所述低分散区域与所述高密集区域的相关参数,对聚类状态进行评估。
2. 根据权利要求1所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(3)中利用分水岭算法对所述特征标记图像进行分割,根据分割后的图像计算每个多 边形区域的质心坐标及面积的方法包括: (31) 根据分水岭算法划分的脊线,计算每个多边形区域的边界的顶点坐标,并计算所 述顶点坐标的算术平均值作为所述多边形区域的质心坐标; (32) 根据所述多边形区域的边界的顶点坐标,计算所述多边形区域的面积。
3. 根据权利要求1所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(4)中所述多边形区域的邻接矩阵包括以下步骤: (41) 计算邻接矩阵Wu的方法为: Wij = [(IijJk · [^ijIb 其中,du为多边形区域i与多边形区域j之间的质心距离,k为多边形质心距离的指 数,β u为两个相邻的多边形区域i和j之间共享的边界长度与多边形区域i的边界长度 之比,b取值为1。
4. 根据权利要求3所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(4)中计算每个多边形区域的局部Moran' s I的数值的方法包括以下步骤: (42) 计算多边形区域的面积的标准差S :
其中,Yi为多边形区域i的面积,又为所有多边形区域的面积均值,η所有多边形区域 的个数; (43) 计算每个多边形区域的局部Moran' s I的数值Ii :
其中j尹i。
5. 根据权利要求4所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(4)中计算所述局部Moran' s I的数值的标准化值的方法为: (44) 计算邻接矩阵Wu的行和矩阵Wi的均值E (Ii):
其中Wi为邻接矩阵^的行和矩阵; (45) 计算 Var (Ii):
(46) 计算所述局部Moran' s I的数值的标准化值Z (Ii):
其中Ii为多边形区域i的局部Moran' s I的数值。
6. 根据权利要求5所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(4)中计算所述多边形区域的平均邻接值包括以下步骤: (47) 所述多边形区域的平均邻接值Wz的方法为: Wz = Z(Ii)Wij 其中Z(Ii)为局部Moran' s I的数值的标准化值,Wu为邻接矩阵。
7. 根据权利要求1所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(6)计算所述低分散区域与所述高密集区域的相关参数,对聚类状态进行评估的方法 为: (61) 计算属于低分散区域的多边形区域的面积与总面积的比值RHH ; (62) 计算属于高聚集区域的多边形区域的面积与总面积的比值RLL ; (63) 进行聚类评估,RHH越大,RLL越小,表示分散占据主导;RHH越小,RLL越大,表示 密集占据主导。
8. 根据权利要求1所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(6)计算所述低分散区域与所述高密集区域的相关参数,对聚类状态进行评估的方法 为: (64) 计算属于所述低分散区域的多边形区域的面积的平均值Rhh_s ; (65) 计算属于所述高密集区域的多边形区域的面积的平均值Rll_s ; (66) 计算Rhh_s与Rll_s的比值Rc,用于比较不同图像间的聚类状态,Re越大,表示 所述低分散区域与所述高密集区域的面积差异越大,说明分布呈现局部密集,整体稀疏的 状态;Re越小,表示低分散区域与高密集区域的面积均值差异小,说明分布较均匀。
9. 根据权利要求1所述的空间自相关性与分水岭算法的聚类评估方法,其特征在于, 步骤(6)计算所述低分散区域与所述高密集区域的相关参数,对聚类状态进行评估的方法 为: (67) 计算所述低分散区域的目标对象密度Dhh; (68) 计算所述高聚集区域的目标对象密度D11; (69) 进行聚类评估,所述目标对象密度Dhh越大表示分布更趋向稀疏的状态;所述目标 对象密度D11越大表示分布更趋向密集的状态。
【文档编号】G06K9/62GK104376329SQ201410652774
【公开日】2015年2月25日 申请日期:2014年11月17日 优先权日:2014年11月17日
【发明者】袁鑫, 熊振华, 盛鑫军, 朱向阳 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1