基于多核局部信息FCM算法的图像分割方法与流程

文档序号:12675127阅读:394来源:国知局
基于多核局部信息FCM算法的图像分割方法与流程

本发明属于数据挖掘领域进行数据分类的算法,具体地说是一种多核局部信息的模糊c均值聚类算法,并将其应用于图像分割。



背景技术:

聚类是非监督模式识别的一个很重要的分支,聚类的最终目的是使相似像素之间的距离尽可能的小,使不同像素之间的距离尽可能的大,通过这种方式来区分数据,分类数据。图像处理是计算机视觉的重要组成部分,采用模糊聚类满足两个方面的需求,首先人眼视觉的主观性使图像很适合用模糊的手段进行处理,其次,训练像素图像的匮乏需要进行无监督的分析,模糊聚类在图像处理领域最为广泛的是图像分割,也就是相当于对图像的像素进行无监督的分类,基于模糊聚类的图像分割方法有很多,并且在纹理图像分割,彩色图像分割方面也取得了很大的进展。模糊C均值聚类算法(FCM)是人们研究模糊聚类的一个基本方法,是由Dunn提出经由Bezdek发展起来的一种模糊聚类算法,该算法主要基于最小平方误差的概念,并且规定所有像素的隶属度之和为1。FCM算法对像素数目参差不齐的情况下进行聚类时候,往往得不到理想的结果。

在模糊c均值聚类算法的基础上面Krishnapuram和Keller放松了隶属度的约束条件,提出了可能性聚类算法PCM。PCM算法的隶属度值能反映数据点到聚类中心的真实距离,这也是PCM算法对噪声鲁棒性比较好的原因,这也是相比FCM算法的改进之处,然而PCM算法只能在所有的聚类中心重合的时候才能真正得到全局最优解。

基于以上原因Zhang在文献中提出一种改进的可能性聚类算法聚类方式,增加一种新的参数ηi来减少算法的误差,虽然可能性的聚类算法能够克服一致性聚类的问题,然而对于原来的mp参数的选择异常敏感,不同的mp值即使相差很小,最后得到的聚类中心也会是两个截然不同的数值。Nikhil提出的一种改进提高的c均值聚类算法(PFCM),也就是模糊c均值聚类算法。PFCM算法具有很好的噪声鲁棒性,也不会产生重合的聚类,然而PFCM算法对参数的选择通常需要人为的指定而缺乏理论上的依据,具有较强的依赖性。Krinidis提出一种基于模糊局部信息化的c均值聚类算法,该算法通过引入局部参数Gki有效避免了原始FCM算法对参数的选择,同时通过构建融合局部空间信息的模糊因子来抑制图像噪声和保持图像细节,有效的提高了图像的分割正确率,在含有噪声的图像分割上面取得了良好的效果。然而该聚类算法对于线性数据具有很好的聚类效果,但是对于非线性数据的聚类往往效果不是很理想,同时,当图像被噪声严重污染的时候,像素的邻域像素也可能被污染。此时,像素的局部空间信息就不能在含噪声的图像分割中发挥有效积极的作用。

通过引入核函数,将原始数据通过mercer核条件将像素数据x={x1,x2,···,xn}映射到高维特征空间F中,映射数据分别为{φ(x1),φ(x2),···,φ(xn)},并在空间F中对像素进行聚类,形成基于核的模糊聚类算法,在核空间能够放大像素之间的差异,增加聚类的准确率。Yang在文献中提出的基于核的模糊聚类算法KFCM,Genton从统计学的角度展示了一种核的机器学习方式,Tzortzis和Likas提出了一种确定和增量的算法来克服聚类初始化问题:他们的算法映射到一个高维特征空间的数据点,通过使用内核函数和优化的聚类错误。使其对于噪声和野值点具有很好的鲁棒性,也克服了PFCM算法对参数设置敏感的问题,然而基于核的模糊聚类算法对于球形数据效果比较好,但是对于非球状数据,往往得不到理想的效果。

Zhao et al.先前在文献中提出多核的最大核的分割聚类算法多关注于监督以及半监督的聚类学习,这是基于最大限度的边际聚类,然而很明显的一个缺点就是他们的聚类算法多用于硬聚类。Hsin-Chien先生提出的多核的核方法对基础内核的选择和组合提供了很大的灵活性,这也从不同的角度增加了信息源,另外这也提高了领域知识的编码能力,然而很明显这些多核聚类算法的一个缺点是,内核的权重的指数通常是难以确定的很难实现良好的内核权重分配。



技术实现要素:

本发明为了克服上述现有技术存在的不足之处,提出一种基于多核局部信息FCM算法的图像分割方法,以期能规避FCM对噪声点比较敏感以及FILCM算法在邻域像素被污染的问题,同时能够发现最适合权值并返回当前隶属度值的大小,从而提高算法的可靠性和收敛性,进而提高图像分割的准确性。

为了实现上述发明目的,本发明采用如下技术方案:

本发明一种基于多核局部信息FCM算法的图像分割方法的特点是按如下步骤进行:

步骤1、对具有n个像素的图像,令X={x1,x2,…,xj,…,xn}表示所述图像的像素集合,xj表示第j个像素;1≤j≤n;对像素集合X进行最优划分,使得式(1)所示的目标函数值J最小:

式(1)中,i表示第i类,c表示划分的类别个数,且1≤i≤c,uij表示第j个像素xj隶属于第i类的隶属度值,且U={uij|i=1,2,…,c;j=1,2,…,n}表示隶属度矩阵;0≤uij≤1;表示第j个像素属于第i类的隶属度的m次幂,m是加权指数,表示聚类模糊程度;Pij是平衡因素,反映第j个像素到第i类的中心像素的空间信息;Dij表示多核高维度特征空间的第j个像素和多核高维度特征空间的第i类的像素中心vi之间的距离,并有:

式(2)中,φ(xj)表示第j个像素映射到多核高维度特征空间的映射函数;φ(vi)表示第i类的像素中心映射到多核高维度特征空间的映射函数,公式中φ表示数据点在高位特种空间中的表达方式以此来区分普通数据点;

步骤2、利用模糊C均值聚类算法对所述像素集合X进行处理,获得隶属度矩阵U={uij|i=1,2,…,c;j=1,2,…,n}和像素中心V={v1,v2,···,vi,···,vc};以所述隶属度矩阵U和像素中心V作为初始隶属度矩阵U0和初始聚类中心V0

步骤3、随机初始化第j个像素到第i类的像素中心的空间信息平衡因素定义迭代次数为λ,最大迭代次数为λmax;并初始化λ=1;则第λ次迭代的隶属度矩阵为U(λ);第λ次迭代的像素中心为V(λ)

步骤4、利用式(4)获得第λ次迭代的第j个像素xj隶属于第i类的隶属度值

式(4)中,Dsj是多核高维度特征空间的第j个像素和多核高维度特征空间的第s类的像素中心vs之间的距离,1≤s≤c,是第λ-1次更新的平衡因素;

步骤5、利用式(5)计算第λ次迭代的第i类的像素中心

步骤6、利用式(6)获得第j个像素xj到第λ次迭代的第i类的像素中心的空间信息平衡因素

式(6)中,表示像素集合X的像素平均值,表示第j个像素xj和像素平均值之间的欧式距离,dij表示第j个像素xj和第i类像素中心vi的空间位置距离,表示第j个像素xj和第λ-1次迭代的第i类像素中心vi之间的欧式距离;

步骤7、利用式(7)获得引入权重指数后的目标函数J(β):

式(7)中,βk表示k重核空间的权重值,并有:αijk表示组合多项式,并有:

式(8)中,k表示核空间的核数,k(xj,xj)表示高斯核函数,且k(xj,xj)=1;

步骤8、判断或λ>λmax是否成立,若成立,则表示为最优隶属度值、是最优像素中心、为最优平衡因素值;并令后代入式(1)中;从而实现对像素集合X的最优划分,ε是预先设定的阈值;若不成立,则将λ+1赋值给λ,重复步骤4顺序执行,直到满足条件为止,最终得到分割后的图像。

与已有技术相比,本发明的有益效果体现在:

1、本发明采用多核的方法,集中了模糊聚类(FCM)方法的优点以及局部信息的模糊聚类算法(FILCM)的优点,同时减少了核的选择对于实验结果的影响,多核的聚类算法对于核函数的选择比较敏感,在多核的基础下加入局部信息的概念即平衡因素,使聚类结果更加准确;从而使得图像分割更加准确。

2、本发明采用的是局域核的算法能够同时进行非线性的数据运算,能够将在普通数据里的数据线性运算通过映射到高维数据空间,增加了算法的抗变性和鲁棒性,在本发明中也提出了权重的概念,核空间中数据点隶属于每一个核聚类中心的权重是不同的,试验中不同的图像和数据集对权重(βk)的要求是不一样的,如果对应于统一的权重不符合实验规律,因此通过迭代计算出最佳匹配的权重值进行试验。

3、本发明将多核的分割聚类算法延伸到模糊聚类方面去,将像素点的归属模糊化,准确化,同时考虑到像素的局部空间信息,通过计算像素点之间的距离来判断像素点对聚类中心的影响力,距离聚类中心越远影响力越小,因此,本方法比其他方法更适合于关系数据。

附图说明

图1为现有技术中二值图像的原图像;

图2为现有技术中添加10%的椒盐噪声的二值图像;

图3为现有技术中FCM算法得到的二值分割图像;

图4为现有技术中FILCM算法得到的二值分割图像;

图5为本发明提出的MKFILCM算法得到的二值分割图像。

具体实施方式

本实施例中,一种基于多核局部信息FCM算法的图像分割方法是按照如下步骤进行:

步骤1、对具有n个像素的图像,令X={x1,x2,…,xj,…,xn}表示图像的像素集合,xj表示第j个像素;1≤j≤n,n是像素的个数;对像素集合X进行最优划分,使得式(1)所示的目标函数值J最小:

式(1)中,i表示第i类,c表示划分的类别个数,且1≤i≤c,uij表示第j个像素xj隶属于第i类的隶属度值,且U={uij|i=1,2,…,c;j=1,2,…,n}表示隶属度矩阵;0≤uij≤1;表示第j个像素属于第i类的隶属度的m次幂,m是加权指数,表示聚类模糊程度;Pij是平衡因素,反映第j个像素到第i类的中心像素的空间信息;Dij表示多核高维度特征空间的第j个像素和多核高维度特征空间的第i类的像素中心vi之间的距离,并有:

式(2)中,φ(xj)表示第j个像素映射到多核高维度特征空间的映射函数;φ(vi)表示第i类的像素中心映射到多核高维度特征空间的映射函数,φ表示数据点在高位特种空间中的表达方式以此来区分普通数据点;

J值最小得到的聚类中心是最优的,图像分割的效果也是最好的,分割效果如表1,图图3、图4、图5所示,图1是二值图像的原图像,图2是添加10%的椒盐噪声之后的图像,试验中参数的设置,m在试验中设置范围介于1.5到2.5之间浮动设置,一般设置为2,ε设置为0.001,迭代次数100次,窗口大小设置为3×3,从图3,4,5中可以看出,由于MKFILCM算法充分考虑到了附近邻域像素的影响,且采用自适应的多核算法,通过实验对比MKFILCM算法的分割后的噪声点基本为零,其分割效果明显优于FCM算法以及FILCM算法。

表1 不同噪声条件下分割准确率对比(%)

本发明通过大量实验来验证基于多核局部信息的FCM算法在图像分割上的应用效果,比较模糊C均值算法(FCM),Fcm_S1算法,Fcm_s2算法,En_FCM算法,GFCM算法,MSOFCM算法,FILCM算法以及基于多核局部信息的FCM算法(MKFILCM)在二值灰度图像的不同噪声条件下的分割准确率,可以发现MKFILCM算法的分割准确率普遍在99%以上,相比其他经典算法有了很大的提高。通过本发明的运行过程可以得到图像分割效果要明显优于FCM算法以及FILCM算法。

步骤2、利用模糊C均值聚类算法对像素集合X进行处理,获得隶属度矩阵U={uij|i=1,2,…,c;j=1,2,…,n}和聚类中心V={v1,v2,···,vi,···,vc};以的隶属度矩阵U和聚类中心V作为初始隶属度矩阵U0和初始聚类中心V0

步骤3、随机初始化第j个像素到第i类的聚类中心的空间信息平衡因素定义迭代次数为λ,最大迭代次数为λmax;并初始化λ=1;则第λ次迭代的隶属度矩阵为U(λ);第λ次迭代的聚类中心为V(λ)

步骤4、利用式(4)获得第λ次迭代的第j个像素xj隶属于第i类的隶属度值

式(4)中,Dsj是多核高维度特征空间的第j个像素和多核高维度特征空间的第s类的聚类中心vs之间的距离,1≤s≤c,是第λ-1更新的平衡因素;

步骤5、利用式(5)计算第λ次迭代的聚类中心

步骤6、利用式(6)获得第λ次迭代的第j个像素到第i类的聚类中心的空间信息平衡因素

式(6)中,表示像素的平均值,xj是第j个像素值,c表示类别数,表示第j个像素xj和像素平均值之间的欧式距离,dij表示第j个像素和第i个像素的空间位置距离,||xj-vi||表示第j个像素xj和第i类聚类中心vi之间的欧式距离;

步骤7、利用式(7)获得引入权重指数后的目标函数J(β):

式(7)中,βk表示k重核空间的权重值,并有:αijk是为了使函数表达式简洁而设定的组合多项式,且有:

式(8)中,k表示核空间的核数,k(xj,xj)表示核函数;且:k(xj,xj)=1;

对图1的二值图像加入同水平的10%高斯噪声,得到如表二所示的对比表。从表二中,可以看出窗口半径为1的时候,无论在噪声方差多少的情况下,同种水平下的分割精度最高。随着分割半径的不断增加,分割精度逐渐降低。因为分割半径越大,图像的纹理信息越是模糊,同时,在同一分割半径之下,噪声添加越多,分割精度也会降低。当噪声方差达到50的时候,无论分割半径达到多少,分割精度都会显著下降。另外算法的复杂度增加之后,分割效果自然就会下降,因此图像噪声不是很大的时候,分割半径一般选择1,噪声很大的时候选择3比较合适。

表2 本发明在不同半径,不同噪声条件下的分割精度(%)

步骤8、判断或λ>λmax是否成立,若成立,则表示为最优隶属度值、是最优像素中心、为最优平衡因素值;并令后代入式(1)中;从而实现对像素集合X的最优划分,ε是预先设定的阈值;若不成立,则将λ+1赋值给λ,重复步骤4顺序执行,直到满足条件为止,最终得到分割后的图像。

综上所述,本发明在FCM算法的基础上进行扩展进而提出了MKFLICM算法,这种算法的结果是不相关的,免疫的。其规避了FCM对噪声点比较敏感以及FILCM算法在邻域像素被污染该如何分割图像的问题,同时减少了核的选择对于实验结果的影响,多核的聚类算法对于核函数的选择比较敏感,本文提出的算法能够同时发现最适合权值并返回当前隶属度值的大小。多种实验结果表明本发明的算法可以产生更好的整体性能,得到的分割图像优于其它算法所得到的,具有很高的实用性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1