基于蚁群的压缩域显著性检测算法

文档序号:9711941阅读:338来源:国知局
基于蚁群的压缩域显著性检测算法
【技术领域】
[0001] 本发明属于视频检测技术领域,尤其是一种基于蚁群的压缩域显著性检测算法。
【背景技术】
[0002] 鉴于近年来数字视频时代前所未有的增长速度与消费速度,了解视频中所包含的 内容进而对视频进行智能化处理已经成为了一个热口问题。众所周知,人类获得外部信息 中有 80% 是通过视觉系统获得的(H.-B.Duan,Ant colony algorithms:theory and applications/'Chinese Science ,2005)。同时,对于大量的信息,视觉系统会按照一定的 选择性机制对它们进行处理并忽略掉一些信息,我们称这种机制为视觉选择性机制 (G.民.Mangun ,('Neural mechanisms of visual selective attention,,, Psychophysiology,vol .32,no. I,pp.4-18,1995) D因此,为了更好的理解视频中包含的内 容,视觉显著性检测如今越来越热口。
[0003] 显著性检测的研究最初是用于生物学的,在二十世纪九十年代,该研究被引入计 算机领域来处理图像和视频。近年来,显著性检测已经被应用于多个图像处理研究领域,例 如图像分割、自适应图像压缩W及目标识别等。除此之外,显著性检测在其他众多研究领域 中也具有巨大的潜力,例如物体检测和基于内容的图像检索(M.Dorigo,M.Birattari ,and T. Stutzle,('Artificial ants as a computational intelligence technique,,'IEEE computational intelligence magazine,vol ? I,pp. 28-39,2006)等D 因此,在如何定义显 著性区域这个课题上已经有非常多的经典论文化.Itti,C. Koch ,and E. Niebur,"A model of saliency-based visual attention for rapid scene analysisIEEE Transactions on pattern analysis and machine intelligence ,vol.20,no . 11, pp. 1254-1259,1998;民.A. Abrams and S.E.Christ, ('Mot ion onset captures attention/'Psychological Science,vo1.14,no .5,pp.427-432,2003;N. Bruce and J.Tsotsos,('Saliency based on information maximization,,'in Advances in neural information processing systems,2005,pp.155-162;B.Jiang,L.Zhang,H.Lu,C.Yang, and M.-H. Yang, ('Saliency detection via absorbing markov chain in Computer Vision(ICCV),2013IEEE International Conference on. IEEE,2013,pp.1665-1672; N.民iche,M.Mancas,M.Duvinage ,M.Mibulumukini,B.Gosselin ,and T.Dutoit,('民are2012: A multi-scale rarity-based saliency detection with its comparative statistical analysis,,,Signal Processing: Image Communication,vol.28,no.6, pp.642-658,2013)O
[0004] 但是,上述检测方法在解码过程存在繁复且耗时的问题,并且依赖于视频内容变 化W及编码时参数设置的影响,其扩展性及鲁棒性较差。

【发明内容】

[000引本发明的目的在于克服现有技术的不足,提供一种设计合理、鲁棒性好、扩展性强 且效率高的基于蚁群的压缩域显著性检测算法。
[0006] -种基于蚁群的压缩域显著性检测算法,包括W下步骤:
[0007] 步骤1、将视频帖划分为块,并使用块构建图的节点,进而将帖建模成一个图;
[0008] 步骤2、直接从压缩码流中提取每个节点的时域和空域特征,构建时空域启发矩 阵;
[0009] 步骤3、根据蚁群算法,直接提取压缩码流中的残差变换系数W及运动矢量;从残 差变换系数中获得空域的特征,包括亮度特征、色度特征、纹理特征,其中纹理特征根据构 建方法不同,可进行进一步细分;此外,从运动矢量中可直接提取时域特征,即运动特征;将 提取的特征按照步骤1中块的划分构建时域和空域的显著性图;
[0010] 步骤4、根据人眼视觉特性和时空域显著性图的特征,同时结合被检测视频的内容 特征,分类自适应融合时域和空域显著性图像,得到图像显著区域。
[0011] 而且,所述步骤1的具体方法包括W下步骤:
[0012] (1)将每一帖进行块的划分为每一帖构建一个图G(V,E);
[0013] (2)划分的块被作为图中的节点V,转移概率P则被用于作为图的边E;
[0014] (3)根据视频编码设置块的大小。
[0015] 而且,所述视频采用H. 264编码,块大小设置为4 X 4。
[0016] 而且,所述步骤2提取每个节点的时域和空域特征包括对应时域特征的运动矢量 MV和对应空域特征分量,所述对应空域特征分量包括:
[0017] (1)亮度特征L,对应于亮度的直流分量;
[001引(2)色度特征Cl,对应于色度Cb的直流分量;
[0019] (3)色度特征C2,对应于色度Cr的直流分量;
[0020] (4)纹理特征T,纹理特征通过对压缩码流中亮度和色度的交流分量进行处理获 得,具体包括W下几种情况:
[0021] -仅采用亮度的交流分量进行处理获得纹理特征,处理方法包括求和、求均值W及 方差;
[0022] -仅采用色度的交流分量进行处理获得纹理特征,处理方法包括求和、求均值W及 方差;
[0023] -根据视频的具体内容对亮度与色度进行符合人眼视觉规律的自适应加权处理W 获得纹理特征。
[0024] 而且,所述步骤2时空域启发矩阵的具体构造方法如下:
[0025] 针对每种特征fE化,U,V,T,MV},按照下面公式获得启发矩阵:
[0027] 式中,f(i,j)和f(l,m)分别表示坐标为(i,j)的块和坐标为(l,m)的块的特征值。
[0028] 而且,所述步骤3的具体方法包括W下步骤:
[0029] (1)在图上一次性随机洒出共K只妈蚁,并使每只妈蚁爬行L步,运个过程记为构造 过程;在一次计算中,该构造过程需要被重复执行N次;在第n次构造过程中,第k只妈蚁从节 点(i,j)移动向节点(1,m)的概率通过转移概率进行计算,计算公式如下:
[0031] 其中T和Tl分别指代信息素矩阵和启发矩阵,a和e是影响因子,Q (I,^指代当前节点 的邻居节点,在获得转移概率之后,妈蚁转向转移概率最大的方向爬行;
[0032] (2)当第k只妈蚁完成了第n个构造过程中的第1步爬行时,信息素矩阵会根据下面 公式进行更新:
[0034] 其中,P是衰减率,最优路径指第k只妈蚁根据转移概率矩阵计算结果经过的所有 节点的集合;Af]是通过启发矩阵决定的,Af ]=巧P;
[0035] (3)当第n个构造过程中的所有K只妈蚁均完成了 L步爬行之后,信息素矩阵会根据 下面法则进行更新:
[0036] 了所)'=(1 -的T(打'1 + 料闽
[0037] 其中tW指代每个构造过程中信息素矩阵最初的值,餐指代信息素挥发系数, 與 G (0,1。
[0038] 而且,所述步骤4中采用全局非线性归一化方法进行自适应融合,该自适应融合公 式如下:
[0040] 式中,Mi为显著性图SMi中的最大值,nil是显著性图SMi中除最大值外所有其他值的 平均值,N是归一化运算符;
[0041] 此外,根据被检测视频的内容特征进行符合人眼规律的自适应融合方法如下:
[0042] (1)按照运动的剧烈程度与纹理的复杂程度对视频进行分类,具体分为:运动剧烈 纹理复杂的视频、运动剧烈纹理简单的视频、运动不剧烈纹理复杂的视频、W及运动不剧烈 纹理简单的视频;
[0043] (2)根据分类,在按照上述公式分别计算不同特征获得的显著性图的归一化最大 值与均值平方之积后赋予不同特征获得的不同结果加权系数;
[0044] (3)将加权过的结果进行求和归一化,获得最终显著性图检测结果。
[004引本发明的优点和积极效果是:
[0046]本发明设计合理,其利用蚁群算法的正反馈机制和贪婪启发捜索机制,在寻找全
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1