一种自然图像分割方法与流程

文档序号:29692182发布日期:2022-04-16 12:04阅读:249来源:国知局
一种自然图像分割方法与流程

1.本发明涉及图像分割领域,具体涉及一种自然图像的分割方法。


背景技术:

2.图像分割是计算机视觉的核心技术之一,高精度的图像分割可以提取图像感兴趣的目标,从而为后继的图像语义分析等提供有效支撑。目前深度学习方法可以得到较好的分割结果,然而该类方法需要大量的标定数据。当标定数据不足时,深度学习模型的分割精度很难得到理想结果。因此本发明主要使用有限混合理论对自然图像进行分割。
3.传统的分割模型常假设图像服从正态分布,正态分布本身是一种对称分布。然而,自然图像常不满足该类假设。本发明提出使用偏斜正态分布构造有限混合模型。较传统的方法而言,本方法多了一个偏斜参数,当该偏斜参数为0是,可退化成正态分布。因此传统基于正态分布的方法是本发明的特例。
4.此外,图像常含有噪声,传统的有限混合模型仅仅考虑灰度分布信息,未考虑结构信息,因此对噪声敏感。本发明定义一项各向异性邻域信息,可以降低噪声的同时保持更多的细节信息。
5.本发明将各向异性结构信息耦合到有限偏斜混合模型中,并采用改进的em算法进行求解,最终得到更为准确的分割结果。


技术实现要素:

6.为了克服现有技术中的不足,本发明提出一种自然图像分割方法,其能够在图像不服从正态分布且含有噪声时可以较好的分割出图像中含有的目标。
7.为了实现上述目的,本发明提出的一种自然图像分割方法,包括如下步骤:
8.s1:建立模型,初始化模型参数;
[0009][0010]
其中第一项为有限混合项。
[0011]
p(xi|θk)为偏斜正态分布:
[0012][0013]
其中,μk为第k类的均值,∑k为第k类的方差,λ为偏斜参数。
[0014]
第二项为先验正则项。构造分布s逼近先验分布。其
中:
[0015][0016][0017]
为kl散度,分别刻画si与π
ik
的距离以及si与的距离。h(si)为信息熵。为邻域先验信息,定义为:其中为点i的邻域,j为邻域中的点,α
ij
为邻域内其他点的各向异性权重
[0018]
第三项为后验正则项。构造分布q逼近先验分布。
[0019]
综上,整个有限偏斜混合模型定义为:
[0020][0021]
其中,其中,为结尾正态分布的矩。
[0022]
参数初始化:
[0023]
使用k-means方法得到参数初始值。β一般取0.3。
[0024]
s2:计算各向异性邻域权重;
[0025][0026]
式中,g为各向异性高斯核函数:g(xi,xj)=exp(-(x
i-xj)
tdi
(x
i-xj))
×wij
。w
ij
为非局部权重:xi为当前点xi的坐标,xj为邻域点xj的坐标。n(xi)为xj邻域点构成的数值矩阵。为相似度矩阵:刻画当前点到邻域点的相似度。为点乘。ζ为常数。di为当前点的结构张量:结构张量:γ,h为常数,一般h取0.9, γ取1,邻域窗口取3
×
3。
[0027]
s3:利用改进的em算法中的e步计算模型后验概率以及截尾正态分布的矩;
[0028]
计算后验概率:
[0029]
计算截尾正态分布的矩
[0030][0031][0032]
其中
[0033]
s4:利用改进的em算法中的e步求解先验与后验的逼近分布;
[0034]
计算逼近分布:
[0035][0036][0037]
其中
[0038]
s5:利用改进的em算法中的m步求解模型参数。
[0039]
计算模型参数(先验概率、均值、方差、偏斜系数):
[0040][0041][0042]
其中,
[0043]
s6:若达到收敛条件(迭代前后两次均值的1范数小于10-4
),则算法停止,否则回到s3.
[0044]
本发明具有以下有益效果:
[0045]
本发明提出的一种自然图像分割方法,其能够分割具有非对称分布的图像,可以分割具有噪声的图像。较传统无监督方法相比,本发明分割精度更高。
附图说明
[0046]
下面结合附图对本发明作进一步描写和阐述。
[0047]
图1是本发明提出的一种自然图像分割方法流程图。
[0048]
图2是各向同性邻域信息模拟。
[0049]
图3是各向异性邻域信息模拟。
[0050]
图4是一张含有噪声的自然图像。
[0051]
图5是利用高斯混合模型分割图4所得结果。
[0052]
图6是本方法分割图4所得结果。
具体实施方式
[0053]
下面将结合附图、通过对本发明的优选实施方式的描述,更加清楚、完整地阐述本发明的技术方案。
[0054]
实施例
[0055]
如图1所示,本发明提出的一种自然图像分割方法,包括如下步骤:
[0056]
s1:建立模型,初始化模型参数。
[0057]
本发明提出的基于各向异性邻域信息的偏斜正态有限混合模型定义如下:
[0058][0059]
其中第一项为有限混合项。
[0060]
p(xi|θk)为偏斜正态分布:
[0061][0062][0063]
其中,μk为第k类的均值,∑k为第k类的方差,λ为偏斜参数。当偏斜参数等于零的时候,该模型退化为高斯分布,因此传统高斯混合模型时本发明的特例。
[0064]
第二项为先验正则项。构造分布s逼近先验分布。其中:
[0065][0066][0067]
为kl散度,分别刻画si与的距离以及si与的距离。h(si)为信息熵。该正则项考虑邻域信息,以达到降低噪声的目的。
[0068]
第三项为后验正则项。构造分布q逼近先验分布。传统的模型仅仅考虑先验信息,本发明不仅考虑先验信息正则化,而且考虑后验信息正则化。
[0069]
综上,整个有限偏斜混合模型定义为:
[0070][0071]
其中,其中,为结尾正态分布的矩。
[0072]
参数初始化:
[0073]
使用k-means方法得到参数初始值。β一般取0.3。
[0074]
s2:计算各向异性邻域权重;
[0075]
本发明定义当前点与其邻域内的点的权重关系如下:
[0076][0077]
式中,g为各向异性高斯核函数:g(xi,xj)=exp(-(x
i-xj)
tdi
(x
i-xj))
×wij
。w
ij
为非局部权重:
[0078]
xi为当前点xi的坐标,xj为邻域点xj的坐标。n(xi)为xj邻域点构成的数值矩阵。r
xi
为相似度矩阵:刻画当前点到邻域点的相似度。为点乘。ζ为常数。di为当前点的结构张量:为当前点的结构张量:为当前点的结构张量:γ,h为常数。一般h取0.9,γ取1,邻域窗口取3
×
3。该各向异性保证在图像目标边缘处切线方向上特征值远远大于法线方向上的特征值,从而达到各向异性以保持边界的目的。而在目标内部或者外部平坦区域切线与法线方向特征值相等,从而达到各向同性以加快速度的目的。
[0079]
图2给出传统方法与本发明方法提取的邻域。左边为传统方法所获取的圆形区域,右边为本发明提出的椭圆,且椭圆的长轴平行于目标边界切线方向。
[0080]
s3:利用改进的em算法中的e步计算模型后验概率以及截尾正态分布的矩;
[0081]
计算后验概率:
[0082]
计算截尾正态分布的矩
[0083][0084][0085]
其中
[0086]
s4:利用改进的em算法中的e步求解先验与后验的逼近分布;
[0087]
计算逼近分布:
[0088][0089][0090]
其中
[0091]
s5:利用改进的em算法中的m步求解模型参数。
[0092]
计算模型参数(先验概率、均值、方差、偏斜系数):
[0093][0094][0095][0096][0097]
其中,
[0098]
s6:若达到收敛条件(迭代前后两次均值的1范数小于10-4
),则算法停止,否则回到s3.
[0099]
上述具体实施方式仅仅对本发明的具体实施方式进行描述,而并非对本发明的保护范围进行限定。在不脱离本发明设计构思和精神范畴的前提下,本领域的普通技术人员根据本发明所提供的文字描述、附图对本发明的技术方案所作出的各种变形、替代和改进,均应属于本发明的保护范畴。本发明的保护范围由权利要求确定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1