基于免疫稀疏谱聚类的图像分割方法

文档序号:6146936阅读:128来源:国知局
专利名称:基于免疫稀疏谱聚类的图像分割方法
技术领域
本发明属于图像处理技术领域,涉及图像分割,可用于对纹理图像和SAR图像进行目标检测和目标识别。
背景技术
聚类是指把一个没有类别标记的样本集按某种准则划分成若干个子集或类别,使相似的样本尽可能归为一类,而不相似的样本尽量划分到不同的类中。聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支。作为一种无监督分类方法,聚类分析已经被广泛地应用于模式识别、数据挖掘、计算机视觉和模糊控制等许多领域。传统的聚类算法,如k-means算法,EM算法等都是建立在凸球形的样本空间上,但当样本空间不为凸时,算法会陷入局部最优。
谱聚类方法能在任意形状的样本空间上聚类,且收敛于全局最优解。该算法具有实现简单,与维数无关,以及全局寻优的良好特性,因此得到了越来越广泛的应用。谱聚类方法仅仅考虑所有样本的权值矩阵,也叫相似性矩阵,它将聚类问题转化为无向图划分问题。但是,谱聚类方法需要计算一个wxw权值矩阵的主要特征向量,"是样本个数。这对于大规模数据,计算量是相当大的,这也成为了谱聚类方法的瓶颈问题。
Fowlkes等人提出了基于Nystr6m逼近的谱聚类方法。该方法首先从所有样本中随机选取一个样本子集作为代表求解特征问题,然后再将其特征向量扩展为整个样本集合权值矩阵的特征向量。然而,选取结果对聚类影响很大,聚类结果
表现出不稳定性。2005年Marie Ouimet等人提出的贪婪谱聚类方法很好的解决了这个问题。贪婪谱聚类方法用贪婪选取替代随机选取选出代表全部样本的样本子集,并用包括所选的和未选的所有样本,来估计特征空间的协方差矩阵。这使得聚类结果的稳定性和准确率都大大提高。但是,与Nystr6m方法不同,贪婪谱聚类方法采用容差作为重要的输入参数。容差实际上直接决定了选取样本子集的大小。为了输入合适的容差来控制选取个数,需要预先知道容差和选取个数之间的关系。这在实践中无论是计算量上还是时间复杂度上都是有很大难度的。另一方面,即使找到了合适的容差,贪婪选取方式需要逐个依次计算用己选样本逼近当前候选样本的误差,当样本规模较大时,这个过程的计算量和时间花费很大,这就造成图象分割的速度非常慢。

发明内容
本发明的目的在于克服上述已有问题的缺点,提出了 一种基于免疫稀疏谱聚类的图像分割方法,以避免贪婪谱聚类方法中合适容差的选取和所有样本误差的依次计算,降低计算复杂度,加快图像分割的速度。为实现上述目的,本发明的具体实现过程包括如下
(1) 使用灰度共生矩阵对所待分割的图像进行特征提取;
(2) 将所得的特征数据归一化到
之间,以去除数据间量级的影响;
(3) 对归一化后的特征数据,使用免疫克隆选择方法选出具有代表性的样本子

3a)对归一化后的数据采用实数编码方式进行编码;
3b)随机生成初始种群J(A卜(4, 4,…,《),将it初始化为0,其中4-(v^2,…v"), i = l,2,...,",、是要选出的样本点,m是种群大小,"是选取个数,A表示迭代的次数;
3C)对所生成的初始种群,按照下式计算每个抗体的亲和度
其中,<formula>formula see original document page 5</formula>
^是所有选出样本的均值,hl是样本点V,,、之间的欧氏距离3d)根据求得的亲和度按照下式计算每个抗体克隆的个数
<formula>formula see original document page 5</formula>
其中,/"《;c)表示大于;c的最小整数,"r是设定的克隆规模;克隆后的每个抗体变为40t)—4,W,…,人(州,z、1,2,…附,整个种群变为Y,"(",如,…乂(");
3e)先随机确定,个变异位置,其中,=|",然后在变异概率/^下对变异位置的抗体进行高斯变异,比较变异后每个种群的抗体亲和度,并将每个种群亲和度最大的抗体取出,组成下一轮的初始值A(/t + l);3f)判断最大亲和度是否在连续三次迭代中是否有提高,如果没有提高,则 从总样本中随机生成60%新的样本子集,取代种群中亲和度小的抗体,如果有提 高,就不进行操作;
3g)对原迭代次数A重新赋值为;k',其中/fc、"l,并判断A'是否超过设定的 最大迭代次数T,如果超过T,则输出亲和度最高的抗体作为最终选出的样本子 集,如果没超过T,返回步骤3c);
(4) 用贪婪谱嵌入方法对选出的样本子集进行降维;
(5) 对降维后的数据进行k-means聚类,该聚类为图像的最终分割结果。 本发明与现有的技术相比具有以下优点
1. 与Nystr6m谱聚类方法相比,本发明由于利用亲和度关系选取样本子集, 因此选取的样本子集更有代表性,分割结果有明显提高;
2. 与贪婪谱聚类方法相比, 一方面,本发明由于采用选取样本子集个数为输 入,避免了容差的选取,另一方面,本发明由于从整体上选取和优化样本子集, 避免了在所有样本上逐一进行误差计算的过程,从而降低计算复杂度,加快图像 分割速度。


图1是本发明基于免疫稀疏谱聚类的图像分割方法流程图; 图2是本发明中选取子集的主要操作子流程图; 图3是本发明应用于2分类(1)纹理图像的分割结果图; 图4是本发明应用于2分类(2)纹理图像的分割结果图; 图5是本发明应用于3分类纹理图像的分割结果图6是本发明应用于SAR1图像的分割结果图; 图7是本发明应用于SAR2图像的分割结果图; 图8是本发明应用于SAR3图像的分割结果图。
具体实施例方式
参照图l,本发明的具体实施过程如下 步骤l.使用灰度共生矩阵对待分割图像进行特征提取。 对待分割的图象生成灰度共生矩阵AG"),其中S是样本点X,和、.之间的距
离,0的取值为4个离散的方向0°, 45°, 90°, 135°,每个方向上取三个统计角二阶矩,同质区,对比度,每个统计量按照以下公式进行计算
角二阶矩<formula>formula see original document page 7</formula>
同质区:<formula>formula see original document page 7</formula>
对比度:<formula>formula see original document page 7</formula>
其中,W是样本总数,/7G,力是灰度共生矩阵A^,。第/行第/列的元素。
在4个方向上分别计算上述统计量,得到特征数据v- (入,/2,...,/2)。
步骤2.对所提取的特征数据"(_/;,,/2,-,_/;2)进行归一化处理以去除数据 间量级的影响
<formula>formula see original document page 7</formula>
其中,min(v)表示C/i,/2,…,/,2)之中的最小值,max(v)表示(人,/2,…,y;2)之
中的最大值,得到归一化后的特征数据v-(/'L,/2',…,^')。
步骤3.对归一化后的特征数据采用实数编码方式进行编码。
步骤4.随机生成初始种群^(A:)^4,《…,4J,其中A:表示迭代的次数,
初始化为0, 4 =(w,v2,...v"), / = 1,2,...,",、是要选出的样本点,m是种群大小,w
是选取个数。
步骤5.对所生成的初始种群,按照下式计算每个抗体的亲和度<formula>formula see original document page 7</formula>其中,<formula>formula see original document page 7</formula>
;是所有选出样本的均值,kl是样本点v,,"之间的欧氏距离。 步骤6.根据抗体的的亲和度大小,依次进行克隆,变异,选择操作c
参照图2,本步骤的具体实现如下
6a)根据求得的亲和度按照下式计算每个抗体克隆的个数《! = 7n
其中,/""x)表示大于x的最小整数,^是设定的克隆规模; 克隆后的每个抗体变为4询={4^),...,4#)},/ = 1,2,. W ,整个种群变为
6b)对克隆后的抗体种群,先随机确定,个变异位置,其中,=|",然后在
变异概率p:下对变异位置的抗体进行高斯变异;
6c)比较变异后每个种群的抗体亲和度,并将每个种群亲和度最大的抗体
取出,组成下一轮的初始值A(;k + l);
步骤7.判断最大亲和度是否在连续三次迭代中有提高,如果没有提高,则 从总样本中随机生成60%新的样本子集,取代种群中亲和度小的抗体,如果有提 高,就不进行操作。
步骤8.对原迭代次数*重新赋值为*',其中*' = "1,并判断V是否超过设 定的最大迭代次数T,如果超过T,则输出亲和度最高的抗体作为最终选出的样 本子集,如果没超过T,返回步骤5。
步骤9.用下式对选出的样本子集", 进行降维-
V,Vi)
义a "1
其中v是待嵌入的坐标,A(v)是v降维后的第)fc维坐标,(tA,;u)是整个权值矩阵 Xd(v,,v》的第;t个特征值和特征向量,C/汰是K的第/个坐标,
&(V,V,) = eXp(J^),其中CT是核参数。
步骤10.对降维后的数据进行k-means聚类,该聚类为图像的最终分割结果<
本发明效果可以通过以下实验进一步证实-1.实验条件和内容
实验仿真环境为MATLAB 7.0.4, Intel(R) Pentium(R) 4 CPU 32GHz, WindowXP Professional 。
实验内容包括分别应用Nystr6m谱聚类方法,贪婪谱聚类方法和本发明三 种方法对纹理图像和SAR图像进行分割。实验参数设置为Nystri3m谱聚类方 法随机选取100个样本点,贪婪谱聚类方法取得到100个样本点时的容差,本 发明方法参数设置为,种群规模20,克隆规模为种群规模2.5倍,变异概率0.99, 终止条件为最大迭代次数100。另外,实验中贪婪谱聚类方法的运行时间不包括 找出合适容差的时间。这在实际中节约了大量反复实验的时间。
2.实验结果
1)将Nystr6m谱聚类方法,贪婪谱聚类方法和本发明三种方法应用于2分类 纹理图像和3分类纹理图像的分割结果如图3,图4,图5所示,其中图3(a),图 4(a),图5(a)是原纹理图像,图3(b),图4(b),图5(b)是模板,图3(c),图4(c), 图5(c)是Nystr6m谱聚类方法的分割结果,图3(d),图4(d),图5(d)是贪婪谱聚 类方法的分割结果,图3(e),图4(e),图5(e)是本发明的分割结果。
三种方法对纹理图象分割的时间和准确率统计见表1,其中运行时间和准确 率分别用T和R表示。
表1三种方法对纹理图像分割的时间和准确率统计
选取 个数Nystr6m谱聚类贪婪谱聚类本发明T(s)R(%)T(s)R(%)T(s)R(%)
2分类(l)1008.8299.5713526199.6212652799.62
2分类(2)1008.4153.4313722255.1012484866.07
3分类1008.3177.1214426594.3312707994.36
从图3,图4,图5和表1可以看到, 一方面,本发明在区域一致性和错误 划分上明显优于Nystr6m谱聚类方法,这是由于本发明方法有针对性的选取子 集,选取的子集更有代表性;另一方面,本发明与贪婪谱聚类方法相比不需要找 出合适容差,并且时间花费有所减少,这是由于在选取过程采用免疫克隆选择策 略,以选取个数为输入,避免了容差的确定和每个样本逼近误差的计算。
2)将Nystr6m谱聚类方法,贪婪谱聚类方法和本发明三种方法应用于SAR 图像的分割结果如图6,图7,图8所示,其中图6(a),图7(a),图8(a)是原SAR 图像,图6(b),图7(b),图8(b)是Nystr6m谱聚类方法的分割结果,图6(c),图7(c), 图8(c)是贪婪谱聚类方法的分割结果,图6(d),图7(d),图8(d)是本发明的分割结
9果,三种方法对SAR图像分割的时间统计见表2。
表2三利3方法对SAR图像分割的时间统计
选取 个数Nystr6m谱聚类贪婪谱聚类本发明
运行时间(s)运行时间(s)运行时间(s)
SAR11008.60136389126657
SAR21008.92140621126132
SAR31008.90137076114688
从图6,图7,图8和表2可以看到,本发明在区域一致性和错误划分上明 显优于Nystr6m谱聚类方法,这是由于本发明选取子集选取的样本子集更有代表 性,从表2可以看到,本发明与贪婪谱聚类方法相比不需要找出合适容差,并且 时间花费有所减少,这是由于本发明以选取个数为输入,避免了容差的确定和每 个样本逼近误差的计算。
以上实验表明,本发明方法与Nystr3m谱聚类方法相比准确率有大幅度提 高,与贪婪谱聚类方法相比计算复杂度减小,加快图像分割速度。
权利要求
1、一种基于免疫稀疏谱聚类的图像分割方法,包括如下步骤(1)使用灰度共生矩阵对所待分割的图像进行特征提取;(2)将所得的特征数据归一化到
之间,以去除数据间量级的影响;(3)对归一化后的特征数据,使用免疫克隆选择方法选出具有代表性的样本子集3a)对归一化后的数据采用实数编码方式进行编码;3b)随机生成初始种群A(k)=(A1,A2,…,Am),其中k表示迭代的次数,初始化为0,Ai=(v1,v2,...vn),i=1,2,...,n,vi是要选出的样本点,m是种群大小,n是选取个数,;3c)对所生成的初始种群,按照下式计算每个抗体的亲和度f(Ai)=s(Ai)×d(Ai)其中,<maths id="math0001" num="0001" ><math><![CDATA[ <mrow><mi>S</mi><mrow> <mo>(</mo> <msub><mi>A</mi><mi>i</mi> </msub> <mo>)</mo></mrow><mo>=</mo><msup> <mrow><mo>{</mo><munderover> <mi>&Sigma;</mi> <mrow><mi>i</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>v</mi> <mi>i</mi></msub><mo>-</mo><mover> <mi>v</mi> <mo>&OverBar;</mo></mover><mo>)</mo> </mrow> <mn>2</mn></msup><mo>/</mo><mi>n</mi><mo>}</mo> </mrow> <mrow><mn>1</mn><mo>/</mo><mn>2</mn> </mrow></msup> </mrow>]]></math> id="icf0001" file="A2009100243740002C1.tif" wi="55" he="13" top= "116" left = "48" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/></maths><maths id="math0002" num="0002" ><math><![CDATA[ <mrow><mi>d</mi><mrow> <mo>(</mo> <msub><mi>A</mi><mi>i</mi> </msub> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>&Sigma;</mi> <mrow><mi>i</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><munderover> <mi>&Sigma;</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><mo>|</mo><mo>|</mo><msub> <mi>r</mi> <mi>ij</mi></msub><mo>|</mo><mo>|</mo> </mrow>]]></math> id="icf0002" file="A2009100243740002C2.tif" wi="34" he="10" top= "120" left = "109" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/></maths>v是所有选出样本的均值,||rij||是样本点vi,vj之间的欧氏距离;3d)根据求得的亲和度按照下式计算每个抗体克隆的个数<maths id="math0003" num="0003" ><math><![CDATA[ <mrow><msub> <mi>q</mi> <mi>i</mi></msub><mo>=</mo><mi>Int</mi><mo>{</mo><msub> <mi>n</mi> <mi>c</mi></msub><mo>&times;</mo><mfrac> <mrow><mi>f</mi><mrow> <mo>(</mo> <msub><mi>A</mi><mi>i</mi> </msub> <mo>)</mo></mrow> </mrow> <mrow><munderover> <mi>&Sigma;</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><mi>f</mi><mrow> <mo>(</mo> <msub><mi>A</mi><mi>j</mi> </msub> <mo>)</mo></mrow> </mrow></mfrac><mo>}</mo><mo>,</mo> </mrow>]]></math> id="icf0003" file="A2009100243740002C3.tif" wi="47" he="24" top= "150" left = "49" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/></maths>i=1,2,...n其中,Int(x)表示大于x的最小整数,nc是设定的克隆规模;克隆后的每个抗体变为 id="icf0004" file="A2009100243740002C4.tif" wi="37" he="4" top= "183" left = "83" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>i=1,2,…m,整个种群变为Y(k)={A′1(k),A′2(k),…,A′m(k)};3e)先随机确定t个变异位置,其中 id="icf0005" file="A2009100243740002C5.tif" wi="11" he="6" top= "197" left = "101" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>然后在变异概率pmi下对变异位置的抗体进行高斯变异,比较变异后每个种群的抗体亲和度,并将每个种群亲和度最大的抗体取出,组成下一轮的初始值A(k+1);3f)判断最大亲和度是否在连续三次迭代中有提高,如果没有提高,则从总样本中随机生成60%新的样本子集,取代种群中亲和度小的抗体,如果有提高,就不进行操作;3g)对原迭代次数k重新赋值为k′,其中k′=k+1,并判断k′是否超过设定的最大迭代次数T,如果超过T,则输出亲和度最高的抗体作为最终选出的样本子集,如果没超过T,返回步骤3c);(4)用贪婪谱嵌入方法对选出的样本子集进行降维;(5)对降维后的数据进行k-means聚类,该聚类为图像的最终分割结果。
全文摘要
本发明公开了一种基于免疫稀疏谱聚类的图像分割方法,主要解决谱聚类方法稳定性差和复杂度高的问题。其实现过程是(1)对待分割图像提取特征;(2)对特征数据进行归一化以去除数据间量级影响;(3)对归一化后的特征数据,进行实属编码;(4)对编码后的数据,随机生成初始种群并进行亲和度计算;(5)根据抗体的亲和度大小进行克隆;(6)对克隆后的抗体种群进行高斯变异并选出亲和度最高的抗体作为下一轮的输入;(7)迭代设定的最大迭代次数,得到最终选出的样本子集;(8)对选出的样本子集进行贪婪谱降维,并对降维后的数据聚类,输出最终的图像分割结果。本发明与现有的技术相比具有不需要先验知识,准确度高,计算复杂度低的优点,可用于目标检测和目标识别。
文档编号G01S7/02GK101673398SQ20091002437
公开日2010年3月17日 申请日期2009年10月16日 优先权日2009年10月16日
发明者吴建设, 雄 庄, 佳 张, 杨淑媛, 毛莎莎, 焦李成, 田小林, 缑水平, 桦 钟 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1