基于信息融合的隐马尔可夫显著区域检测方法

文档序号:6633269阅读:387来源:国知局
基于信息融合的隐马尔可夫显著区域检测方法
【专利摘要】本发明涉及一种基于信息融合的隐马尔可夫显著区域检测方法,本发明可以应用于复杂背景下的目标区域检测和识别。技术特征在于:首先计算图像的三个颜色对比通道;然后,通过最大后验概率迭代计算各通道的最终标签图像;再用最大互信息的标签类得到各通道突出图;最后将3个通道中所有大于冗余信息的连通区域信息量相加并归一化,得到最终显著图。本发明在充分利用了图像先验信息同时保留了数据细节,解决了区域颜色信息丢失所带来的问题,能够迅速对焦于广泛的显著区域而不用提前进行训练。
【专利说明】基于信息融合的隐马尔可夫显著区域检测方法

【技术领域】
[0001] 本发明涉及图像处理【技术领域】,特别是涉及一种基于信息融合的隐马尔可夫显著 区域检测方法。

【背景技术】
[0002] 显著区域检测是从复杂的自然场景中检测出最能吸引观察者注意的图像区域,这 些区域可以给人眼带来较强的刺激,使视觉系统能够用有效的方式来分配有限的感性资 源。目前显著区域检测广泛的应用于自适应压缩和缩放,无监督图像分割,目标识别等众多 图像处理领域。因此,研究显著区域检测方法有很重要的实用价值。
[0003] 目前针对显著区域检测的一些主要方法:
[0004]SUN方法是ChristopherKanan等在"RobustClassificationofObjects,Faces, andFlowersUsingNaturalImageStatistics"inCVPR2010 中提出的。其思路是从自 然图像集合当中,用独立成分分析训练出一个基特征来模仿神经元的感受野,从而求解图 像中的显著目标区域。该方法符合自上而下的视觉系统,其计算速度较快。然而,人眼能够 迅速的从大量复杂背景中寻找出有用的目标,在很大程度上就是依赖于颜色信息。该方法 在处理时只考虑灰度图像,忽略了图像的颜色信息,而这些在不同的像素位置上的颜色值 反映的是真实场景的有关信息,这导致在不同颜色背景下计算出的显著值近似,影响了检 测的效果。
[0005] 四兀数方法是BorisSchauerte等在"Quatemion-basedSpectralSaliency DetectionforEyeFixationPrediction"inECCV2012 中提出的。其主要思想是将图 像作为一个整体映射到四元数频谱,从四元数频谱的变化率出发给出一个通用显著区域检 测模型。该方法从纯数学的角度考虑了区域显著性在四元数频谱的变化,检测出的区块较 完整。然而,该方法缺乏对图像显著区域的先验知识利用,显著区域检测是为了理解,但是 理想的检测结果需要理解后的结果作为先验知识,因而显著区域检测是一个病态问题,该 方法忽略了对这种病态性问题的考虑,随着图像场景的复杂化,其检测准确性也急剧下降。


【发明内容】

[0006] 本发明的目的是针对【背景技术】存在的缺陷,提出一种基于信息融合的隐马尔可夫 显著区域检测方法,保留了图像的先验知识和颜色信息,可以从一个复杂的自然场景当中 自动检测出显著区域,能够迅速对焦于广泛的显著区域而不用提前进行训练。
[0007] 为实现上述目的,本发明的技术方案包括如下几个步骤:
[0008] 步骤1)读取待检测图像Y,用RGB颜色空间转换为对比颜色空间方法,计算出三个 对比颜色通道YK(;,
[0009] 步骤2)将通道YK(;视作观察场来计算完全数据ZK(;和初始标签图;^e,具体步骤如 下:
[0010] 2a)用canny算法求通道YK(;的边缘响应,该边缘响应就是完全数据ZK(;。
[0011] 2b)对通道YKe用高斯模糊来降低图像细节并减少噪声。
[0012]2c)用k-means聚类算法计算通道YK(;的初始标签图,聚类数即标签类1的个 数。
[0013] 步骤3)计算初始标签图中各类标签的均值与方差,作为初始参数。
[0014]步骤4)通过最大后验概率来计算新标签图像尤^,详细步骤如下:
[0015] 4a)求似然能量函数U(y|x;X),方法为

【权利要求】
1. 一种基于信息融合的隐马尔可夫显著区域检测方法,其特征在于步骤如下: 步骤1)读取待检测图像Y,将RGB颜色空间转换为对比颜色空间,计算出三个对比颜色 通道YK(;,YBY,YIt) 步骤2)将通道视作观察场来计算完全数据ZK(;和初始标签图,具体步骤如下: 2a)用canny算法求通道YK(;的边缘响应,该边缘响应就是完全数据ZKe。 2b)对通道YK(;用高斯模糊来降低图像细节并减少噪声。 2c)用k-means聚类算法计算通道YK(;的初始标签图聚类数即标签类1的个数。 步骤3)计算初始标签图中各类标签的均值与方差,作为初始参数。 步骤4)通过最大后验概率来计算新的标签图像,详细步骤如下: 4a)求似然能量函数U(y|x;A),方法为:
.其中 为通道YKe的第i个像素,队,与心,为标签图像的第i个像素所在的标签类1的均值和 方差,
为参数集合。 4b)计算先验能量函数U(x),可以通过该式得到
'它是基团集合C中 所有基团的势函数火〇〇的总和。其中,势函数Vjx)为
1是 点\的邻域像素点。S(Xi,x'J是邻域像素对的势函数参数,该参数具有以下这种形式:
4c)重复步骤4a)-4b),更新似然能量函数和先验能量函数,用来计算新标签图像;,方法为:
步骤5)用步骤4)得到的新标签图像来重新估计参数,具体步骤如下: 5a)计算通道YK(;的条件分布gGilxi;^),条件分布用高斯分布来表达,^为新标签 图像的第1类标签的参数集合。 5b)执行t次迭代,计算标签类1的条件概率,方法为:
的计算方法同步骤4b)中势函数的计算方 法,'是Xi的邻域像素点。 5c)计算第1类标签的最大后验概率:
,P(yi)为通道 YKe在第i个像素上的概率,用高斯分布来表达。 5d)用最大后验概率P(t)(l|yi)重新估计参数,具体计算方法为:
步骤6)重复步骤4) -5),得到通道YKe的最终标签图像XKe。 步骤7)计算通道Yby与通道I的最终标签图XBY与&,方法同步骤4) -6)。得到三个通 道的最终标签图X= {XKe,XBY,XJ。 步骤8)计算三通道突出图X'方法是在给定待检测图像Y的条件下,找到各通道下最 终标签图X的互信息值最大的标签类1,该标签类1即为突出图X%
其中,H(Xi)是标签图像X中的标签类1所代表的图像区域&的熵。H(X」Y)反映的是 当人眼观察到图像Y后,图像中出现标签区域&的熵。 步骤9)删除各通道突出图)T中过小的连通区域。突出图由多个独立的连通区域{&, R2. . .,Rk}构成,若第k个连通区域满足条件
,则保留,否则从突出图中删除,其中 d为面积阈值,m?n为图像的尺寸。 步骤10)计算三个对比颜色通道突出图矿中的各连通区域的自信息。 步骤11)最后将三通道下的突出图融合成一幅显著图S,计算方法是将三通道中所有 大于冗余信息参数的连通区域的自信息相加,并归一化,得到最终显著图S。
2. 根据权利要求1所述RGB颜色空间转换对比颜色空间方法,利用文章Color invariance中提出的颜色空间转换方法。
3. 根据权利要求1所述canny算法米用文章OnregularizedLaplacianzero crossingsandotheroptimaledgeintegrators中的canny边缘检测算法。
4. 根据权利要求1所述k-means聚类算法米用文章Afastk-meansimplementation usingcoresets中的k-means聚类算法。
【文档编号】G06T7/00GK104408712SQ201410616754
【公开日】2015年3月11日 申请日期:2014年10月30日 优先权日:2014年10月30日
【发明者】彭进业, 李永恒, 冯晓毅, 谭歆, 王志成, 陈贵良, 毛琥博 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1