基于蚁群的压缩域显著性检测算法

文档序号：9711941阅读：338来源：国知局

基于蚁群的压缩域显著性检测算法
【技术领域】
[0001] 本发明属于视频检测技术领域，尤其是一种基于蚁群的压缩域显著性检测算法。
【背景技术】
[0002] 鉴于近年来数字视频时代前所未有的增长速度与消费速度，了解视频中所包含的内容进而对视频进行智能化处理已经成为了一个热口问题。众所周知，人类获得外部信息中有 80% 是通过视觉系统获得的（H.-B.Duan，Ant colony algorithms:theory and applications/'Chinese Science ,2005)。同时，对于大量的信息，视觉系统会按照一定的选择性机制对它们进行处理并忽略掉一些信息，我们称这种机制为视觉选择性机制 (G.民.Mangun ,('Neural mechanisms of visual selective attention，，， Psychophysiology，vol .32，no. I，pp.4-18,1995) D因此，为了更好的理解视频中包含的内容，视觉显著性检测如今越来越热口。
[0003] 显著性检测的研究最初是用于生物学的，在二十世纪九十年代，该研究被引入计算机领域来处理图像和视频。近年来，显著性检测已经被应用于多个图像处理研究领域，例如图像分割、自适应图像压缩W及目标识别等。除此之外，显著性检测在其他众多研究领域中也具有巨大的潜力，例如物体检测和基于内容的图像检索(M.Dorigo，M.Birattari ,and T. Stutzle，('Artificial ants as a computational intelligence technique，，'IEEE computational intelligence magazine，vol ? I，pp. 28-39,2006)等D 因此，在如何定义显著性区域这个课题上已经有非常多的经典论文化.Itti，C. Koch ,and E. Niebur，"A model of saliency-based visual attention for rapid scene analysisIEEE Transactions on pattern analysis and machine intelligence ,vol.20,no . 11, pp. 1254-1259,1998;民.A. Abrams and S.E.Christ, ('Mot ion onset captures attention/'Psychological Science，vo1.14，no .5，pp.427-432，2003;N. Bruce and J.Tsotsos，('Saliency based on information maximization，，'in Advances in neural information processing systems，2005，pp.155-162;B.Jiang，L.Zhang，H.Lu，C.Yang， and M.-H. Yang, ('Saliency detection via absorbing markov chain in Computer Vision(ICCV),2013IEEE International Conference on. IEEE，2013，pp.1665-1672; N.民iche，M.Mancas，M.Duvinage ,M.Mibulumukini，B.Gosselin ,and T.Dutoit,('民are2012: A multi-scale rarity-based saliency detection with its comparative statistical analysis，，，Signal Processing: Image Communication，vol.28，no.6， pp.642-658,2013)O
[0004] 但是，上述检测方法在解码过程存在繁复且耗时的问题，并且依赖于视频内容变化W及编码时参数设置的影响，其扩展性及鲁棒性较差。

【发明内容】

[000引本发明的目的在于克服现有技术的不足，提供一种设计合理、鲁棒性好、扩展性强且效率高的基于蚁群的压缩域显著性检测算法。
[0006] -种基于蚁群的压缩域显著性检测算法，包括W下步骤：
[0007] 步骤1、将视频帖划分为块，并使用块构建图的节点，进而将帖建模成一个图；
[0008] 步骤2、直接从压缩码流中提取每个节点的时域和空域特征，构建时空域启发矩阵；
[0009] 步骤3、根据蚁群算法，直接提取压缩码流中的残差变换系数W及运动矢量;从残差变换系数中获得空域的特征，包括亮度特征、色度特征、纹理特征，其中纹理特征根据构建方法不同，可进行进一步细分;此外，从运动矢量中可直接提取时域特征，即运动特征;将提取的特征按照步骤1中块的划分构建时域和空域的显著性图；
[0010] 步骤4、根据人眼视觉特性和时空域显著性图的特征，同时结合被检测视频的内容特征，分类自适应融合时域和空域显著性图像，得到图像显著区域。
[0011] 而且，所述步骤1的具体方法包括W下步骤：
[0012] (1)将每一帖进行块的划分为每一帖构建一个图G(V，E);
[0013] (2)划分的块被作为图中的节点V，转移概率P则被用于作为图的边E;
[0014] (3)根据视频编码设置块的大小。
[0015] 而且，所述视频采用H. 264编码，块大小设置为4 X 4。
[0016] 而且，所述步骤2提取每个节点的时域和空域特征包括对应时域特征的运动矢量 MV和对应空域特征分量，所述对应空域特征分量包括：
[0017] (1)亮度特征L，对应于亮度的直流分量；
[001引（2)色度特征Cl，对应于色度Cb的直流分量；
[0019] (3)色度特征C2，对应于色度Cr的直流分量；
[0020] (4)纹理特征T，纹理特征通过对压缩码流中亮度和色度的交流分量进行处理获得，具体包括W下几种情况：
[0021] -仅采用亮度的交流分量进行处理获得纹理特征，处理方法包括求和、求均值W及方差；
[0022] -仅采用色度的交流分量进行处理获得纹理特征，处理方法包括求和、求均值W及方差；
[0023] -根据视频的具体内容对亮度与色度进行符合人眼视觉规律的自适应加权处理W 获得纹理特征。
[0024] 而且，所述步骤2时空域启发矩阵的具体构造方法如下：
[0025] 针对每种特征fE化，U，V，T，MV}，按照下面公式获得启发矩阵：
[0027] 式中，f(i，j)和f(l，m)分别表示坐标为(i，j)的块和坐标为(l，m)的块的特征值。
[0028] 而且，所述步骤3的具体方法包括W下步骤：
[0029] (1)在图上一次性随机洒出共K只妈蚁，并使每只妈蚁爬行L步，运个过程记为构造过程;在一次计算中，该构造过程需要被重复执行N次;在第n次构造过程中，第k只妈蚁从节点（i，j)移动向节点（1，m)的概率通过转移概率进行计算，计算公式如下：
[0031] 其中T和Tl分别指代信息素矩阵和启发矩阵，a和e是影响因子，Q (I,^指代当前节点的邻居节点，在获得转移概率之后，妈蚁转向转移概率最大的方向爬行；
[0032] (2)当第k只妈蚁完成了第n个构造过程中的第1步爬行时，信息素矩阵会根据下面公式进行更新：
[0034] 其中，P是衰减率，最优路径指第k只妈蚁根据转移概率矩阵计算结果经过的所有节点的集合;Af]是通过启发矩阵决定的，Af ]=巧P;
[0035] (3)当第n个构造过程中的所有K只妈蚁均完成了 L步爬行之后，信息素矩阵会根据下面法则进行更新：
[0036] 了所)'=(1 -的T(打'1 + 料闽
[0037] 其中tW指代每个构造过程中信息素矩阵最初的值，餐指代信息素挥发系数，與 G (0,1。
[0038] 而且，所述步骤4中采用全局非线性归一化方法进行自适应融合，该自适应融合公式如下：
[0040] 式中，Mi为显著性图SMi中的最大值，nil是显著性图SMi中除最大值外所有其他值的平均值，N是归一化运算符；
[0041] 此外，根据被检测视频的内容特征进行符合人眼规律的自适应融合方法如下：
[0042] (1)按照运动的剧烈程度与纹理的复杂程度对视频进行分类，具体分为:运动剧烈纹理复杂的视频、运动剧烈纹理简单的视频、运动不剧烈纹理复杂的视频、W及运动不剧烈纹理简单的视频；
[0043] (2)根据分类，在按照上述公式分别计算不同特征获得的显著性图的归一化最大值与均值平方之积后赋予不同特征获得的不同结果加权系数；
[0044] (3)将加权过的结果进行求和归一化，获得最终显著性图检测结果。
[004引本发明的优点和积极效果是：
[0046]本发明设计合理，其利用蚁群算法的正反馈机制和贪婪启发捜索机制，在寻找全

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李翠微;解伟;王强;李小雨;杨勍;涂钦;
技术所有人：国家新闻出版广电总局广播科学研究院;
我是此专利的发明人

上一篇：电视的辅助测试设备的制造方法
上一篇：用于摄像头模组测试的测试用具及其应用、测试方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。