一种广告视频检测方法

文档序号：6371739阅读：212来源：国知局

专利名称：一种广告视频检测方法
技术领域：
本发明涉及视频检测与视频检测技术领域，尤其涉及一种广告视频检测方法。
背景技术：
随着信息时代的发展，作为商业信息的主要载体和传播媒介，广告视频在人们的日常生活的信息交互中占据着越来越重要的作用。对于普通的视频浏览人员来说，他们对广告视频没有兴趣。因此他们可以借助广告检测系统，可以迅速的定位到广告视频部分，从而可以进行相关的操作，比如删除一段视频节目中对于他们毫无意义的广告视频部分，从而保留电视节目内容。这样一方面可以节省他们观看视频的时间，另一方面也可以节省存储视频数据的空间。但是面对如此浩瀚的视频数据，如何快速的检测和过滤相关的广告视频段的问题亟需解决。因此人们提出了广告视频检测系统，利用它可以自动的快速定位广告视频段。经过近些年的研究，广告视频检测从最初的简单的基于black/silent (黑色/无声)帧发展到现今的基于镜头特征的检测，从最初的仅仅考虑视觉方面的特征检测发展到如今的音频和视频特征相结合的检测。针对广告视频和普通节目视频之间的特征区别，人们提出了很多的广告检测算法。根据检测算法基于的特征不同，现在的比较实用的广告视频系统的检测算法大体上可以分成以下两类(I)基于标识的方法(Logo-based methods)此方法是最早的广告视频检测方法。该方法主要利用电视台的台标进行检测。电视台在播放普通电视节目时会将自己的台标显示出来，而播放广告时一般就会隐去台标，这使得我们可以通过检测台标的存在与否来区分广告视频和普通电视节目视频。台标一般分为三种静态台标、半透明台标和动态台标。针对不同形态的台标，都有相应的检测方法，从而实现对广告视频的检测。其中对于静态台标的研究是比较深入的，而且应用得很广泛。但是对于半透明台标和动态台标，检测起来比较困难，所以还没有比较成熟的检测方法。另夕卜，现在很多电台在播放广告视频的时候也会将台标显示出来，这时基于标识的检测方法就会失效。(2)基于规则的方法(Rule-based methods)基于规则的方法大多是利用广告镜头的信息来进行检测的，它是通过一组特征和规则来区分广告和普通电视节目视频。由于广告视频和普通电视节目视频在某些特征方面存在着比较明显的差异，因此利用这些区分性比较强的特征，就可以实现对广告视频的检测。在视频方面可以通过提取一段视频帧的平均边缘变化率A-ECR(AVerage ofEdge Change Ratio)和边缘变化方差 V-ECR(Variance of Change Ratio)以及平均巾贞差A-FD (Average of Frame Difference)和中贞方差 V-FD (Variance of Frame Difference)来实现检测。在音频方面，广告视频的音频内容和普通电视节目的音频内容也存在一些明显的特征上的区别，比如可以利用音频多维频率普系数(Mel-frequency CepstralCoefficient)和音频信息熵来实现对广告视频的分割检测。但是在以往的研究中音频方面的特征一般都用于辅助视频特征检测方面，通过两者的结合才能实现对广告段更加精确的分割检测。

发明内容
本发明的目的是在于提出一种广告视频检测方法，能够大量减少视频检测和编辑领域的工作人员的工作量，提高视频检测速度和检测的精确度。本发明提供了一种广告视频检测方法，包括以下步骤步骤A、提取不少于一个的广告视频和不少于一个的非广告视频，建立视频训练集，提取每个视频的不少于一个的音频特征，将所有所述音频特征作为输入样本进行支持向量机训练；步骤B、输入待检测视频，提取待检测视频的不少于一个的音频特征；步骤C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果；步骤D、根据所述计算结果判断视频检测结果，将所述检测结果输出。进一步地，步骤A和步骤B中，提取视频的不少于一个的音频特征，还包括以下步骤使用解码工具对视频进行解码，得到视频图像集合和音频信息，将所述音频信息以数组形式保存；将所述视频图像集合分割为不少于一个的镜头，提取每个镜头的音频特征；进一步地，所述将所述视频图像集合分割成不少于一个的镜头，还包括以下步骤提取所有视频图像的颜色直方图，计算两个相邻视频图像的颜色直方图的相似值，作为帧间相似值；根据所述视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值，确定镜头边界序列。进一步地，所述提取所有视频图像的颜色直方图，计算帧间相似值，还包括以下步骤对视频图像进行分块，共分为MXN块，其中M是列数，N是行数；对图像的每一个图像块在HSV颜色空间上提取颜色直方图，其中把亮度量化为I个区间，把色调量化为16个区间，把色饱和度量化为8个区间，每一帧图像得到MXN个有16X8X I = 128个bin的颜色直方图，并对得到的颜色直方图进行归一化；采用下面的公式计算两个相邻视频图像的颜色直方图的相似值

权利要求
1.一种广告视频检测方法，其特征在于，包括以下步骤 A、提取不少于一个的广告视频和不少于一个的非广告视频，建立视频训练集，提取每个视频的不少于一个的音频特征，将所有所述音频特征作为输入样本进行支持向量机训练; B、输入待检测视频，提取待检测视频的不少于一个的音频特征； C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果; D、根据所述计算结果判断视频检测结果，将所述检测结果输出。
2.根据权利要求I所述一种广告视频检测方法，其特征在于，步骤A和步骤B中，提取视频的不少于一个的音频特征，进一步包括以下步骤使用解码工具对视频进行解码，得到视频图像集合和音频信息，将所述音频信息以数组形式保存；将所述视频图像集合分割为不少于一个的镜头，提取每个镜头的音频特征。
3.根据权利要求2所述一种广告视频检测方法，其特征在于，将所述视频图像集合分割成不少于一个的镜头，进一步包括以下步骤提取所有视频图像的颜色直方图，计算两个相邻视频图像的颜色直方图的相似值，作为视频的帧间相似值；根据所述视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值，确定镜头边界序列。
4.根据权利要求3所述一种广告视频检测方法，其特征在于，提取所有视频图像的颜色直方图，计算帧间相似值，进一步包括以下步骤对视频图像进行分块，共分为MXN块，其中M是列数，N是行数；对图像的每一个图像块在HSV颜色空间上提取颜色直方图，其中把亮度量化为I个区间，把色调量化为16个区间，把色饱和度量化为8个区间，每一帧图像得到MXN个有16X8X I = 128个bin的颜色直方图，并对得到的颜色直方图进行归一化；采用下面的公式计算两个相邻视频图像的颜色直方图的相似值 M M 128tmn(Hu(p,qJX Hb (p, q，i))， M Np=I q=l i=l 其中^^&二匕^为处于第口列第^行的块的权重七⑦乂丨)是第a帧的第pXq ^j=I ^=I _____个块的颜色直方图的第i个bin的值，a和b为视频图像帧的序号，min函数是求取两个值中较小的值。
5.根据权利要求3所述一种广告视频检测方法，其特征在于，根据整个视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值，确定镜头边界序列，进一步包括以下步骤输入整个视频序列的帧间相似值序列S=Is1, S2, , sj ,预设高阈值Th，预设低阈值!Y，预设渐变镜头长度最低阈值Tgradual，其中Tgradual=IO ；根据每个帧间相似度Si进行判断如果SiCIY且没有设置渐变标志，判断镜头发生了突变，输出突变镜头的边界信息；如果Si〈TH但设置了渐变标志，则渐变镜头长度Length加I ; 如果Si> = IY但Si〈TH但没有设置渐变标志，则设置渐变标志，记录下当前图像帧位置作为候选镜头开始边界，并开始计数渐变镜头长度Length ；如果Si> = Th并设置了渐变标志，则检查渐变镜头长度，如果Length>TgMdual则判断发生了渐变，输出渐变镜头的边界信息，否则判断不是渐变，取消渐变标志，并把渐变镜头长度Length重新置零；如果Si> = Th且没有设置渐变标志，则判断没有发生镜头变化；输出镜头边界序列。
6.根据权利要求2所述一种广告视频检测方法，其特征在于，所述每个镜头的音频特征，具体包括过零率、短时能量、DFT系数、频谱质心和Mel频率倒谱系数。
7.根据权利要求I所述一种广告视频检测方法，其特征在于，步骤A中，将所有所述音频特征作为输入样本进行支持向量机训练，进一步包括以下步骤将广告视频镜头的音频特征标识为1，非广告视频镜头的音频特征标识为-I ; 通过非线性变换将输入空间变换到一个高维空间，在所述高位空间内求取最优线性分类面；采用下面的公式得到所述最优线性分类面
8.根据权利要求I所述一种广告视频检测方法，其特征在于，步骤C进一步包括以下步骤输入带检测视频的音频特征向量x，带入公式
9.根据权利要求I所述一种广告视频检测方法，其特征在于，步骤D进一步包括以下步骤如果多于预设高值的广告镜头是连续的，将其合并为一个广告视频段；如果小于预设高值的广告镜头是连续的，但其距离最近的广告视频段的距离少于预设低值，则将其并入所述最近的广告视频段；如果相邻的广告视频段之间的镜头数低于预设低值，则将所述相邻的广告视频段合并为一个广告视频段；重复以上步骤，直至没有新的广告视频段出现，如果待检测视频中的广告视频段大于预设值，则将所述待检测视频判断为广告视频，输出检测结果。
全文摘要
本发明公开了一种广告视频检测方法，首先，提取不少于一个的广告视频和不少于一个的非广告视频，建立视频训练集，提取每个视频的不少于一个的音频特征，将所有所述音频特征作为输入样本进行支持向量机训练；输入待检测视频，提取待检测视频的不少于一个的音频特征；输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果；根据所述计算结果判断视频检测结果，将所述检测结果输出。本发明能够有效克服现有技术的不足，为快速的检测和过滤广告视频段提供方法和依据。
文档编号G06F17/30GK102799633SQ20121021458
公开日2012年11月28日申请日期2012年6月26日优先权日2012年6月26日
发明者王建超申请人:天脉聚源(北京)传媒科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王建超
技术所有人：天脉聚源(北京)传媒科技有限公司
我是此专利的发明人

上一篇：肌电信号与关节角度信息融合的下肢运动轨迹预测方法
上一篇：一种基于pca-ga-svr的污泥回流量预测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。