基于运动感知的静态背景视频压缩算法

文档序号：10580239阅读：473来源：国知局

基于运动感知的静态背景视频压缩算法
【专利摘要】本发明公开了一种基于运动感知的静态背景视频压缩方法，首先对视频流分别进行边缘梯度检测和显著性区域检测，得到边缘信息和显著性信息，然后进行背景建模，采用vibe算法，检测运动信息，根据运动信息，计算运动目标的当前帧与上一视频帧的裁剪线的时空差异，使得裁剪后的视频在前后帧之间保持空间与时间的连续性；根据能量图，计算边缘改变代价函数，避免边缘畸变现象，采用动态规划算法，计算得到裁剪函数；定义一个裁剪顺序的最优化函数，在水平方向和垂直方向上选择需要移除的裁剪线。本发明利用边缘检测、显著性检测、目标检测和时空相关性，将图像线裁剪方法应用到视频压缩。
【专利说明】
基于运动感知的静态背景视频压缩算法
技术领域
[0001] 本发明涉及视频压缩算法领域，具体是一种基于运动感知的静态背景视频压缩算法。
【背景技术】
[0002] 随着互联网飞速发展，多媒体数据也呈几何级数的增长，我们步入了信息化时代，人们获取的信息资源是以往任何时代所无法比拟的。这些信息资源，不单有简单的文本信息，而且包括了海量视频资料。这些视频信息与文本信息相比，更加的直观生动，既与文本信息相互补充，又是提供信息的独立载体。
[0003] 视频监控系统有很多，如交通、水利、油田、银行、电信等领域的远程监控;房地产、幼儿园、建筑、厂区、库房、物流、连锁店、门店等重点区域监控。以交通视频监控为例，通过交通视频监控可进行:车牌识别，用于稽查违规车辆;车速识别，用于检测超速车辆;逆行警告，识别逆行车辆，产生报警;流量统计，统计过往的行人和车辆数量。受平安城市建设、交通信息化建设、金融监控、安全生产、智能家居等各种项目建设与发展的带动，视频监控产品需求量不断扩大。
[0004] 现在随着视频监控系统的广泛应用，视频资源呈现爆炸式增长趋势，人们希望能有更高效的视频压缩技术，使得这些视频信息能够存储和传输。在压缩视频时，如果毫无区别地对视频中所有内容进行处理则是不明智的，因为人们所需要的只是视频的主体信息，如何快速地进行数据筛选，压缩感兴趣的数据，从而寻找任务相关的信息，一直是计算机视觉研究领域中的一个热点。
[0005] 当前对视频的存储方法主要是基于视频编码的压缩方法，如Nishi的像素分析方法、Vetro.A的基于物体编码的方法，这些方法都是对原始比特流编码，对某些视频能够达到一定的效果，但是由于视频编码存在上限问题，在上限固定之后很难再有压缩率上的突破。还有就是通过对视频原始数据比特流的压缩来达到对整个视频进行压缩存储的目的，主要有ITU-T制定的H.26X系列和ISO制定的MPEG-X系列，这些视频压缩技术利用视频帧内与帧间冗余信息，在一定程度上减小了视频文件的大小，但是长时间不间断运行的监控系统所产生的文件数据量非常巨大，传统的压缩方法力不从心。
[0006] 传统的视频压缩方法，对视频的所有内容进行同等压缩，丢失了视频的主体信息。对于视频存储，如果只存储人们感兴趣的有用信息，可以极大地减少存储时间和存储空间。本发明使用运动敏感信息作为判断视频内容的标准，对非运动区域采用内容感知信息作为判断标准提出一种基于运动感知的静态背景视频压缩方法。

【发明内容】

[0007] 本发明的目的是提供一种基于运动感知的静态背景视频压缩算法，以解决现有技术静态背景视频压缩中主要内容丢失的问题和抖动现象，。
[0008] 为了达到上述目的，本发明所采用的技术方案为：
[0009] 基于运动感知的静态背景视频压缩算法，其特征在于:包括以下步骤：
[0010] (1 )、选取静态背景视频，输入视频帧，导入每一个视频帧对其进行线裁剪；
[0011] (2)、对视频帧进行边缘检测处理，得到该视频帧的梯度图，计算过程如下：
[0012] 视频帧记为I，对I的水平方向和垂直方向分别求其偏导，两者线性累加后得到该视频帧的梯度图，它反映了视频帧的结构化信息，如公式(1)所示：
[0014] 其中ei(I(x，y))表示的是视频帧I(x，y)得到的梯度图，（x，y)为图I中的一点，x代表点的横坐标，y为点的纵坐标；
[0015] (3)、对视频帧的显著性区域进行检测，使用全局对比度的显著性检测方法，保留视频帧的显著性目标信息，处理过程如下：
[0016] A.使用直方图统计对视频帧的颜色信息进行量化，在全色彩空间中将每个颜色通道量化为12个不同的值，考虑到视频帧中的颜色只占据整个色彩空间很小一部分，将出现频率较小的颜色丢掉以减少色彩数目；选择高频出现的颜色，并确保这些颜色覆盖95%以上的像素；
[0017] B.使用基于图的图像分割方法将视频帧分割成若干区域，为每个区域建立颜色直方图，对每个区域n，通过测量它与视频帧其它区域的颜色对比度来计算它的显著性值，计算公式如公式(2)所示：
[0018] W(rj)D(rrrj} 〇， i J
[0019] 公式(2)中，S(ri)是区域ri的显著值，D(ri，〇)是图像区域 ri和区域〇的颜色或者视差的对比度，w(^)为区域n的权值，即用n里的像素数w(〇)来强调大区域的颜色对比度，D(ri，rj)的计算公式如公式(3)所示： n2
[0020] D( rprf )=ztf(cu )f( c2 j )D( itc2 } ) 〇), ' i=iy=l
[0021] 公式⑶中，f(CM)为第i个颜色C1>1在第k个区域rk的所有n k种颜色中出现的概率， k= {1，2}，这里使用区域的概率密度函数中颜色出现的概率作为权值，以强调主要的颜色之间的区别，同时使用稀疏直方图以使得存储和计算过程更加高效;是第一个区域第i个灰度级和第二个区域第j个灰度级的欧氏距离。f (c2u)是第二个区域的第i个灰度级；
[0022] C.在公式(3)中引进空间权值，将空间信息加入进来，从而增加区域的空间影响；近邻的区域增大影响，较远的区域较小影响;最终区域ri的显著性值定义如公式(4)所示：
[0023] S(}V= .1 ^p(~D/^yi： )⑷，
[0024]公式⑷中，Ds(ri，n)为区域的空间距离,〇s控制空间权值强度; 〇s越大，空间权值的影响越小，导致较远区域的对比度对当前区域显著性值做出较大贡献；
[0025] D.通过基于全局对比度的显著性区域检测算法，得到了该视频帧每个像素点的显著性值，从而为每个像素分配不同能量值，计算公式如公式(5)所示：
[0026] e2(I(x，y)) = S(x，y) (5)；
[0027] S(x，y)为显著性值。
[0028] (4)、对视频帧进行背景建模处理，使用vibe算法进行背景建模，计算运动目标，得到该视频帧的运动信息，其步骤如下：
[0029] 在vibe模型中，每一个背景点都有一个样本集，从而将新的像素点和样本集进行比较，判断它是否属于背景点；如果它属于背景点，则它的值接近于样本的采样值;记v(x) 为x点处的像素值;11(1) = {￥1，￥2，一￥~}为1处的背景样本集，样本集大小为15[?(￥(1))为以 x为中心，R为半径的区域，如果公式(6)的值大于一个给定的阈值#min，那么就认为x点属于背景点;公式具体表现形式如下所示：
[0030] #{Sr(v(x)) n {vi，v2，."，vn}} (6);
[0031] (5)、判断裁剪线是否为背景，根据判断，分别计算裁剪函数：
[0032] A.针对静态背景的视频，如果裁剪线为背景，则它的能量值包括边缘梯度信息和显著性信息；由于裁剪线不穿过该视频帧的运动目标，移除裁剪线对视频帧的影响较小，且不会造成视频的抖动，这样就有运行速度快，计算效率高的优势，否则进行B处理；
[0033] B.裁剪线经过运动区域，则需要计算连续视频帧的裁剪线在时空上的差异比较：
[0034] 连续视频帧的内容十分接近，对视频帧进行裁剪时，如果裁剪线经过运动区域，视频中的内容会产生抖动现象;考虑上一帧的裁剪线放置到当前帧上，两者附近的差异程度，可获得当前帧移除裁剪线后与上一裁剪的视频帧在时空上的差异;N x,y表示当前帧N的像素点(x，y)，Px,\表示当前帧的上一视频帧的像素点，n为上一视频帧的裁剪线个数，k代表上一视频帧的某条裁剪线；i，j是水平线Y = y与两条裁剪线的交点在垂直方向上的坐标位置，x 为交点之间的像素的垂直坐标;假设i〈x〈j。视频帧的时空差异如公式(7)所示：
[0036] (6)、采用动态规划算法，根据边缘检测、显著性区域检测以及背景建模，制定裁剪标准，在能量图中引入裁剪线差异比较，计算裁剪函数，
[0037]为了找到最优的裁剪线，采用动态规划算法，对每个可能裁剪的像素点（x，y)计算，并累计最小能量M，如公式(8)所示：
[0038] M(x，y) =e(x，y)+min(Mi，Mu，Mr) (8)，
[0039] 其中： - M (x ~ 1, j -1)
[0040] =M{x-Xy) i9), Mr=M(x-\,y + \)
[0041]公式(8)、（9)中，e(x，y)为像素(x，y)的能量，M^Mu和Mr为动态规划中裁剪备选路径的累计能量；
[0042]裁剪函数计算过程如下步骤：
[0043] A.视频帧的物体特征包括梯度信息，显著性信息、运动信息和时空信息，它们共同组成了该像素的能量;ei(I(x，y))表示梯度信息的能量，e2(I(x，y))代表显著性信息，而通过判断像素(x，y)是否为背景，来估计运动信息，e3(I(x，y))表示时空相关性的能量，则像素(x，y)的能量e(x，y)如公式(10)所示：
[0044] v) = lei(I(x^))+e2^ I(x， y、H) 人'刀]ex (/(x,_y))+C?2(/(x,7))+^(/(x,^)) otherwise (10)，
[0045] B.在视频帧中移除裁剪线时，在以该像素点(x，y)为中心的邻域，引入了新的像素点，对视频帧原有的边缘造成破坏，从而造成边缘畸变。计算引入边缘改变的能量代价如公式(11)所示： Mi = A/ (x - 1, v - 1) + C1 (x, ^v)
[0046] Mu = M (x -\,y) + Cu (x, y) (⑴， Mr = M (x - 1, v +1) + Cr (x, ^v)
[0047] 公式（11)中，ChCu和Cr分别表示裁剪线路径是从该像素的左上方、正上方和右上方开始的，移除原有的像素点，引入新像素点，从而带来边缘改变的代价函数如公式(12)所示： Cl(x^y) = v1-vl；eu\
[0048] C" -V (12)， Cr(x,y)^vr-v^en'
[0049] 其中：
[0054] 其中，u(x，y)表示点(x，y)的视差值，B(x，y)为点(x，y)邻域，N表示取邻域平均值， N-般取值是9;Cu(x，y)和Cr(x，y)的计算方式同公式（13)-公式（16)，A I(x，y)的计算过程如公式(17)所示：
[0055] Mn(x,y)= /(.v-1 vr+A+I)-/(.r-l〇〇+|/' (x..y+/c+l)-/(a\.v)| (17；, Mr (A". >) =| /(.r -1,3 ? + A: +1) - /'(..v -1, j +1) I +11(x, y+k + \)~ l(x, y) \
[0056]公式（17)中，k表示邻域的半径，对于经过像素点（x，y)的垂直裁剪线路径按照上述裁剪函数不断更新，而水平裁剪线的定义同垂直裁剪线；
[0057] (7)、选择最小能量的裁剪线，通过回溯找到从像素点（x，y)到(x-1)的路径，最终将像素点进行移除，删除后如果视频帧满足指定尺寸，则对下一个视频帧进行如步骤（1)、 (2)、（3)、（4)、（5)、（6)和(7)操作，否则返回到(2)，更新能量图；
[0058] 在压缩视频帧时，可以从裁剪水平方向和垂直方向出发，因此对于裁剪顺序，定义一个最优化公式如公式(18)所示： k _9] mm Z
[0060] 公式（18)中，kir+c^rzl^m-n/ ) )，ai是一个决定因子，决定移除水平还是垂直的像素点，ai G {〇，1}，丈印二r, Z (1 -以,）二C ? i=i '
[0061] 在裁剪过程中，根据能量函数E，同时有水平与垂直的线供选择，那么就可以根据计算垂直裁剪线和水平裁剪线的两条线的能量代价函数，从中选取比较小的进行移除，后面的操作依次进行。
[0062] 本发明的技术方案所依据的科学原理：
[0063]图像的大小为m*n，指定压缩后的图像大小为m'*n'（其中m-m' =c，n-n' =r，c>0，r >0)。通过压缩图像的行信息和列信息，最终达到压缩图像的目的。在图像水平方向上，寻找垂直裁剪线进行移除，裁剪的垂直线定义如下： =Is i yjL] ^ {(i, x(〇)yiL\
[0064] 11 s.t.\f /, | x(i) - x(i -1) < 11 '19;,
[0065] X是一个向量，取值为[l，m]，定义了映射函数为[1，…，m]->[l，…，m']。上式表明对于每一行，垂直裁剪线只能取一个像素，而且必须是八连通路径上的一个像素，这样就保持了该裁剪线的单调性和连通性。从第一行到最后一行移除一个像素，就组成了一条垂直裁剪线，移除像素后，相应的像素向上或者向左移动，图像压缩的目的就达到了。同样的，有一个关于y的映射函数，Y是一个向量，取值为[1，n]，定义了映射函数为[1，???，n]->[l，…， n' ]。裁剪的水平线定义如下： ={(.A>l/))}/=i
[0066] J
[0067]裁剪线S路径上的每个像素如垂直裁剪线{ S i }的能量表示为 ,.=丨=_ ( X (/)丨.当移除图像的一行或者一列之后，即移除裁剪线后，图像的所有其他像素都全部向左或者向上移动，从而替代这条消失的路径。由于这条裁剪线关注度不高，所以当图像的剩余部分聚合在一起时，图像内容基本不会改变。因此，可以定义一条裁剪线的代价函数为五Ys)=￡as)=<.这样我们就寻找一条代价最小的裁剪线：氺 m
[0068] ^ = min E(s) = min X ^(/(^)) (21)。 s /-l
[0069] 本发明提供了一种基于运动感知的静态背景视频压缩算法，分别采用边缘检测算法和显著性区域检测方法计算能量图，保存视频帧主体的完整性;根据背景建模，检测运动目标，从而运用时空信息，避免视频抖动;考虑移除像素的影响，制定新的裁剪标准，计算裁剪函数，保持边缘连续。最终移除低能量的像素，使视频帧满足指定尺寸，最后在压缩的视频中依然保存着主体信息，视频帧边缘连续，且视频保持时空连续性。该算法计算简便，运行速度快。
[0070] 本发明优点为：
[0071] 本发明采用应用在图像上的线裁剪算法，根据视频中物体的边缘信息、显著性信息、运动特征和时空信息，对视频进行压缩。本发明兼有快速存储和保留视频主体信息且边缘连续的优点，压缩的视频没有抖动现象，保持时空连续性，且没有任何优化和复杂迭代运算，计算速度迅速，压缩效果好。
【附图说明】
[0072]图1为本发明算法流程图。
【具体实施方式】
[0073] 参见图1所示，基于运动感知的静态背景视频压缩算法，包括以下步骤：
[0074] (1 )、选取静态背景视频，输入视频帧，导入每一个视频帧对其进行线裁剪；
[0075] (2)、对视频帧进行边缘检测处理，得到该视频帧的梯度图，计算过程如下：
[0076]视频帧记为I，对I的水平方向和垂直方向分别求其偏导，两者线性累加后得到该视频帧的梯度图，它反映了视频帧的结构化信息，如公式(1)所示：
[0078]其中ei(I(x，y))表示的是视频帧I(x，y)得到的梯度图，（x，y)为图I中的一点，x代表点的横坐标，y为点的纵坐标。
[0079] (3)、对视频帧的显著性区域进行检测，使用全局对比度的显著性检测方法，保留视频帧的显著性目标信息，处理过程如下：
[0080] A.使用直方图统计对视频帧的颜色信息进行量化，在全色彩空间中将每个颜色通道量化为12个不同的值，考虑到视频帧中的颜色只占据整个色彩空间很小一部分，将出现频率较小的颜色丢掉以减少色彩数目；选择高频出现的颜色，并确保这些颜色覆盖95%以上的像素；
[0081] B.使用基于图的图像分割方法将视频帧分割成若干区域，为每个区域建立颜色直方图，对每个区域n，通过测量它与视频帧其它区域的颜色对比度来计算它的显著性值，计算公式如公式(2)所示：
[0083] 公式(2)中，S(ri)是区域ri的显著值，D(ri，〇)是图像区域 ri和区域〇的颜色或者视差的对比度，w(^)为区域n的权值，即用n里的像素数w(〇)来强调大区域的颜色对比度，D(ri，rj)的计算公式如公式(3)所示： ?1 n2
[0084] D(r；,!^ .-?= X I f(c{J)f(C2 ) )D(fu,c2>i) (3),
[0085] 公式⑶中，f(ck,i)为第i个颜色ci,i在第k个区域rk的所有nk种颜色中出现的概率， k= {1，2}，这里使用区域的概率密度函数中颜色出现的概率作为权值，以强调主要的颜色之间的区别，同时使用稀疏直方图以使得存储和计算过程更加高效；
[0086] 公式(3)中，D(ci,i，C2,j)是第一个区域第i个灰度级和第二个区域第j个灰度级的欧氏距离。f(C2u)是第二个区域的第i个灰度级。
[0087] C.在公式(3)中引进空间权值，将空间信息加入进来，从而增加区域的空间影响；近邻的区域增大影响，较远的区域较小影响;最终区域ri的显著性值定义如公式(4)所示：
[0088] S〇i) =r^r expf-D/r^./a^JwirjjDfr^) (4)， > 1
[0089]公式⑷中，Ds(ri，n)为区域的空间距离，〇s控制空间权值强度; 〇s越大，空间权值的影响越小，导致较远区域的对比度对当前区域显著性值做出较大贡献；
[0090] D.通过基于全局对比度的显著性区域检测算法，得到了该视频帧每个像素点的显著性值，从而为每个像素分配不同能量值，计算公式如公式(5)所示：
[0091] e2(I(x，y)) = S(x，y) (5)；
[0092] S(x，y)为显著性值。
[0093] (4)、对视频帧进行背景建模处理，使用vibe算法进行背景建模，计算运动目标，得到该视频帧的运动信息，其步骤如下：
[0094] 在vibe模型中，每一个背景点都有一个样本集，从而将新的像素点和样本集进行比较，判断它是否属于背景点；如果它属于背景点，则它的值接近于样本的采样值;记v(x) 为x点处的像素值;1(1) = {￥1，￥2，一￥~}为1处的背景样本集，样本集大小为15[?(7(1))是以 x为中心，R为半径的区域，如果公式(6)的值大于一个给定的阈值#min，那么就认为x点属于背景点;公式具体表现形式如下所示：
[0095] #{Sr(v(x))H {vi，v2,???，vn}} (6);
[0096] (5)、判断裁剪线是否为背景，根据判断，分别计算裁剪函数：
[0097] A.针对静态背景的视频，如果裁剪线为背景，则它的能量值包括边缘梯度信息和显著性信息；由于裁剪线不穿过该视频帧的运动目标，移除裁剪线对视频帧的影响较小，且不会造成视频的抖动，这样就有运行速度快，计算效率高的优势，否则进行B处理；
[0098] B.裁剪线经过运动区域，则需要计算连续视频帧的裁剪线在时空上的差异比较：
[0099] 连续视频帧的内容十分接近，对视频帧进行裁剪时，如果裁剪线经过运动区域，视频中的内容会产生抖动现象;考虑上一帧的裁剪线放置到当前帧上，两者附近的差异程度，可获得当前帧移除裁剪线后与上一裁剪的视频帧在时空上的差异;N x,y表示当前帧N的像素点(x，y)，Px,\表示当前帧的上一视频帧的像素点，n为上一视频帧的裁剪线个数，k代表上一视频帧的某条裁剪线；i，j是水平线Y = y与两条裁剪线的交点在垂直方向上的坐标位置，x 为交点之间的像素的垂直坐标;假设i〈x〈j。视频帧的时空差异如公式(7)所示：
[0101] (6)、采用动态规划算法，根据边缘检测、显著性区域检测以及背景建模，制定裁剪标准，在能量图中引入裁剪线差异比较，计算裁剪函数，
[0102] 为了找到最优的裁剪线，采用动态规划算法，对每个可能裁剪的像素点（x，y)计算，并累计最小能量M，如公式(8)所示：
[0103] M(x，y) = e(x，y)+min(Mi，Mu，Mr) (8)，
[0104] 其中： ^ =M(x-[oi 05] Mu = M (x -1, y) (9), Mr =M(x-\y + V)
[0106] 公式(8)、（9)中，e(x，y)为像素(x，y)的能量，M^Mu和Mr为动态规划中裁剪备选路径的累计能量；
[0107] 裁剪函数计算过程如下步骤：
[0108] A.视频帧的物体特征包括梯度信息，显著性信息、运动信息和时空信息，它们共同组成了该像素的能量; ei(I(x，y))表示梯度信息的能量，e2(I(x，y))代表显著性信息，而通过判断像素(x，y)是否为背景，来估计运动信息，e 3(I(x，y))表示时空相关性的能量，则像素(x，y)的能量e(x，y)如公式(10)所示：
[01091 e(x v) = lei(I(x^))+e2(I(x^ I(x，y)=() 、 l \e](I(x,J?))+(?2(/(x,_y))+e3(/(x,>〇) otherwise U〇y'
[0110] B.在视频帧中移除裁剪线时，在以该像素点(x，y)为中心的邻域，引入了新的像素点，对视频帧原有的边缘造成破坏，从而造成边缘畸变。计算引入边缘改变的能量代价如公式(11)所示： Mj = M (.Jt - 1, _y - 1) + Q j (x, j;)
[mu] Mu = M(x-\,y) + Cu (x,y)： u| Mf - M (x - 1, v + 1) + Cr (x, y)
[0112] 公式（11)中，Ci、Cu和Cr分别表示裁剪线路径是从该像素的左上方、正上方和右上方开始的，移除原有的像素点，引入新像素点，从而带来边缘改变的代价函数如公式(12)所示：
[0119] 其中，u(x，y)表示点(x，y)的视差值，B(x，y)为点(x，y)邻域，N表示取邻域平均值， N-般取值是9<X u(x，y)和Cr(x，y)的计算方式同公式（13)-公式（16)，A I(x，y)的计算过程如公式(17)所示： (x%3') H ^(-v~ 1->' + ^ + 0 ~ ~ K - I) [ +1 ^>-+A: +1) - /(.V, >) |
[0120] A/；(A；>-)=/(A-l,>4^-rl)-/(j-I,>〇^/(AVy+/v'+l)-/( (17), .V) =1 ^(-v - I, >' + A： +1) - /(x-1, V + 1) | + | /(.V, 3' + A' + 1) - /(.V, 3') I
[0121] 公式（17)中，k表示邻域的半径，对于经过像素点（x，y)的垂直裁剪线路径按照上述裁剪函数不断更新，而水平裁剪线的定义同垂直裁剪线；
[0122] (7)、选择最小能量的裁剪线，通过回溯找到从像素点（x，y)到(x-1)的路径，最终将像素点进行移除，删除后如果视频帧满足指定尺寸，则对下一个视频帧进行如步骤（1)、 (2)、（3)、（4)、（5)、（6)和(7)操作，否则返回到(2)，更新能量图；
[0123] 在压缩视频帧时，可以从裁剪水平方向和垂直方向出发，因此对于裁剪顺序，定义一个最优化公式如公式(18)所示： k
[0124] mm IE+ (1 - at )s-)() sx,.s},a i=]
[0125] 公式（18)中，kir+c^rzl^m-n/ ) )，ai是一个决定因子，决定移除水平还是垂直的像素点，{〇, 1}，& 二r j (1 -Q0二c ;在裁剪过程中，根据能量函数E，同 /二 1 /-1 时有水平与垂直的线供选择，那么就可以根据计算垂直裁剪线和水平裁剪线的两条线的能量代价函数，从中选取比较小的进行移除，后面的操作依次进行。
【主权项】
1.基于运动感知的静态背景视频压缩算法，其特征在于:包括以下步骤： (1 )、选取静态背景视频，输入视频帧，导入每一个视频帧对其进行线裁剪； (2) 、对视频帧进行边缘检测处理，得到该视频帧的梯度图，计算过程如下：视频帧记为I，对I的水平方向和垂直方向分别求其偏导，两者线性累加后得到该视频帧的梯度图，它反映了视频帧的结构化信息，如公式(1)所示：其中ei(I(x，y))表示的是视频帧I(x，y)得到的梯度图，（x，y)为图I中的一点，X代表点的横坐标，y为点的纵坐标； (3) 、对视频帧的显著性区域进行检测，使用全局对比度的显著性检测方法，保留视频帧的显著性目标信息，处理过程如下： A. 使用直方图统计对视频帧的颜色信息进行量化，在全色彩空间中将每个颜色通道量化为12个不同的值，考虑到视频帧中的颜色只占据整个色彩空间很小一部分，将出现频率较小的颜色丢掉以减少色彩数目；选择高频出现的颜色，并确保这些颜色覆盖95%以上的像素； B. 使用基于图的图像分割方法将视频帧分割成若干区域，为每个区域建立颜色直方图，对每个区域η，通过测量它与视频帧其它区域的颜色对比度来计算它的显著性值，计算公式如公式(2)所示：公式(2)中，S(ri)是区域Γι的显著值，D(ri，〇)是图像区域 Γι和区域〇的颜色或者视差的对比度，w(^)为区域〇的权值，即用η里的像素数w(〇)来强调大区域的颜色对比度，D (ri，rj)的计算公式如公式(3)所示：公式(3)中，f (ck, i)为第i个颜色ci, i在第k个区域rk的所有nk种颜色中出现的概率，k = U，2}，这里使用区域的概率密度函数中颜色出现的概率作为权值，以强调主要的颜色之间的区别，同时使用稀疏直方图以使得存储和计算过程更加高效;是第一个区域第i个灰度级和第二个区域第j个灰度级的欧氏距离。f(C2u)是第二个区域的第i个灰度级； C. 在公式(3)中引进空间权值，将空间信息加入进来，从而增加区域的空间影响;近邻的区域增大影响，较远的区域较小影响;最终区域^的显著性值定义如公式(4)所示：⑷， 'i"j 公式(4)中，Ds (ri，r j)为区域η和r j的空间距离，〇s控制空间权值强度;os越大，空间权值的影响越小，导致较远区域的对比度对当前区域显著性值做出较大贡献； D. 通过基于全局对比度的显著性区域检测算法，得到了该视频帧每个像素点的显著性值，从而为每个像素分配不同能量值，计算公式如公式(5)所示： e2(I(x，y))=S(x，y) (5)； S(x，y)为显著性值； (4) 、对视频帧进行背景建模处理，使用vibe算法进行背景建模，计算运动目标，得到该视频帧的运动信息，其步骤如下：在vibe模型中，每一个背景点都有一个样本集，从而将新的像素点和样本集进行比较，判断它是否属于背景点；如果它属于背景点，则它的值接近于样本的采样值;记v(x)为X点处的像素值;]?(1) = {￥1，￥2，一￥~}为1处的背景样本集，样本集大小为151?(￥(1))为以1为中心，R为半径的区域，如果公式(6)的值大于一个给定的阈值#min，那么就认为X点属于背景点;公式具体表现形式如下所示： #{Sr(v(x))n{vi，V2,···，vn}} (6); (5) 、判断裁剪线是否为背景，根据判断，分别计算裁剪函数： A. 针对静态背景的视频，如果裁剪线为背景，则它的能量值包括边缘梯度信息和显著性信息；由于裁剪线不穿过该视频帧的运动目标，移除裁剪线对视频帧的影响较小，且不会造成视频的抖动，这样就有运行速度快，计算效率高的优势，否则进行B处理； B. 裁剪线经过运动区域，则需要计算连续视频帧的裁剪线在时空上的差异比较：连续视频帧的内容十分接近，对视频帧进行裁剪时，如果裁剪线经过运动区域，视频中的内容会产生抖动现象;考虑上一帧的裁剪线放置到当前帧上，两者附近的差异程度，可获得当前帧移除裁剪线后与上一裁剪的视频帧在时空上的差异;Nx,y表示当前帧N的像素点 (x，y)，^表示当前帧的上一视频帧的像素点，η为上一视频帧的裁剪线个数，k代表上一视频帧的某条裁剪线；i，j是水平线Y = y与两条裁剪线的交点在垂直方向上的坐标位置，X为交点之间的像素的垂直坐标;假设i〈x〈j。视频帧的时空差异如公式(7)所示：(6) 、采用动态规划算法，根据边缘检测、显著性区域检测以及背景建模，制定裁剪标准，在能量图中引入裁剪线差异比较，计算裁剪函数，为了找到最优的裁剪线，采用动态规划算法，对每个可能裁剪的像素点（x，y)计算，并累计最小能量M，如公式(8)所示： M(x,y) = e(x,y)+min(Mi,Mu,Mr) (8), 其中：公式(8)、（9)中，e(x，y)为像素(x，y)的能量，M^Mu和Mr为动态规划中裁剪备选路径的累计能量；裁剪函数计算过程如下步骤： A.视频帧的物体特征包括梯度信息，显著性信息、运动信息和时空信息，它们共同组成了该像素的能量;θ1(Ι(χ，7))表示梯度信息的能量，e2(I(x，y))代表显著性信息，而通过判断像素(x，y)是否为背景，来估计运动信息，e3(I(x，y))表示时空相关性的能量，则像素(X， y)的能量e(x，y)如公式(10)所示：B.在视频帧中移除裁剪线时，在以该像素点(x，y)为中心的邻域，引入了新的像素点，对视频帧原有的边缘造成破坏，从而造成边缘畸变。计算引入边缘改变的能量代价如公式 (11)所示：公式（11)中，Ci、Cu和Cr分别表示裁剪线路径是从该像素的左上方、正上方和右上方开始的，移除原有的像素点，引入新像素点，从而带来边缘改变的代价函数如公式(12)所示：其中，u(x，y)表示点（x，y)的视差值，B(x，y)为点（x，y)邻域，N表示取邻域平均值，N- 般取值是9;Cu(x，y)和Cr(x，y)的计算方式同公式（13)-公式(16)，△ I(x，y)的计算过程如公式(17)所示：公式（17)中，k表示邻域的半径，对于经过像素点（x，y)的垂直裁剪线路径按照上述裁剪函数不断更新，而水平裁剪线的定义同垂直裁剪线； (7)、选择最小能量的裁剪线，通过回溯找到从像素点（x，y)到(χ-l)的路径，最终将像素点进行移除，删除后如果视频帧满足指定尺寸，则对下一个视频帧进行如步骤（1)、（2)、 (3)、（4)、（5)、（6)和(7)操作，否则返回到(2)，更新能量图；在压缩视频帧时，可以从裁剪水平方向和垂直方向出发，因此对于裁剪顺序，定义一个最优化公式如公式(18)所示：公式（18)中，k = r+c，r=(m-n/ )，c = (n-r/ )，ai是一个决定因子，决定移除水平还是垂直的像素点，ai e {〇，1}在裁剪过程中，根据能量函数E，同时有水平与垂直的线供选择，那么就可以根据计算垂直裁剪线和水平裁剪线的两条线的能量代价函数，从中选取比较小的进行移除，后面的操作依次进行。
【文档编号】H04N19/85GK105959707SQ201610145209
【公开日】2016年9月21日
【申请日】2016年3月14日
【发明人】邵堃, 霍星, 方帅, 安宁, 刘进军, 姚小慧, 乔子木, 刘超
【申请人】合肥工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邵堃;霍星;方帅;安宁;刘进军;姚小慧;乔子木;刘超;
技术所有人：合肥工业大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。