一种基于对象的快速分形视频压缩与解压缩方法

文档序号：8002336阅读：349来源：国知局

一种基于对象的快速分形视频压缩与解压缩方法
【专利摘要】本发明提出了一种基于对象的快速分形视频压缩与解压缩方法，首先利用视频分割方法获得视频对象分割平面即Alpha平面，对起始帧采用块DCT变换编码，对非I帧进行块运动估计/补偿编码，计算与子块域和父块域相关子块的像素和与像素平方和，分数像素内插值对应块的像素和、像素平方和，进行预搜索限制条件判断，并在前一帧搜索窗中利用分数像素块匹配和改进的非对称十字形多层次六边形格点搜索算法寻找最相似的匹配块，利用Huffman编码压缩迭代函数系统系数。对应解压缩过程为：对非I帧进行Huffman解码获得迭代函数系统系数，进行基于宏块的解码，计算父块域相关子块的像素和与像素平方和，然后依次对当前帧中的每一个宏块进行解码，并利用去方块环路滤波方法。
【专利说明】一种基于对象的快速分形视频压缩与解压缩方法
[0001]本申请是发明名称为“一种基于对象的快速分形视频压缩与解压缩方法”(申请号:201110188771.4，申请日:2011年07月06日)发明专利申请的分案申请。
【技术领域】
[0002]本发明属于信号处理中的视频压缩编码领域，特别针对新一代视频编码领域提出一种基于对象的快速分形视频压缩编码方法，在保证图像质量的前提下，大大加快了分形视频编码的速度和压缩比。
【背景技术】
[0003]基于对象(Object-Based，简称0B)编码的概念最早由MPEG-4标准提出，使用基于对象的视频压缩编码方法使得每一帧视频的前景对象和背景对象得以独立的进行编码，可以进一步提高压缩比，同时在解码端可以实现一些新的功能，比如针对每一个视频对象的独立的传输和解码、对象和背景的替换、基于对象的视频检索、特别是相对于标准的编码方法，在对象的边界上可以获得更好的图像质量，因为物体的边界通常和图像中的边缘相重合，它是编码困难的部分。MPEG-4提出了基于对象的视频编码技术标准，在视频分析中，以视频对象为基本单位，每一个视频事件和场景都可以视为由视频中所有语义对象的静态属性(如形状、色彩、纹理)及其动态属性(运动强度、方向、节奏)组合而成的。在以对象为基本分析单位的视频分析方法，符合人类的思维方式和视觉特点，排除了视频中不重要的部分对视频分析的干扰(参见Liang Zhang.0bject-basedMethod of important video clips Extraction[J].Journal of Beijing InformationScience and Technology University, 2009，24(4):83-86),(参见 Bo Huang, YujianHuang.A Scalable Object-based Wavelet Coder[J].Radio CommunicationsTechnology, 2009，35(I):35-38),(参见 Kassim Ashraf a, Zhao L F.Rate-scalableobject-based wavelet codec with implicit shape coding[J].1EEE Transactions onCircuits and Systems for Video Technology, 2000, 10 (7): 1068 - 1079)。基于对象的视频编码方法可以提高视频压缩编码的性能并使其具有更多的灵活性。
[0004]分形理论最初由Mandelbrot于上世纪70年代提出(参见BenoU B.Mandelbrot.The Fractal Geometry of Nature[M].New York:W.H.Freeman and Company, 1982.X分形编码的数学基础是迭代函数系统(IFS)理论。Barnsley首先将分形编码用于交互式图像压缩(参见 Michael F.Barnsley, Alan D.Sloan.A better way to compressimage [J].Byte Magazine, 1988, 13 (I): 215-233.)。Jacqain 提出了全自动的分形图像压缩方法(参见 Arnaud E.Jacquin.A novel fractal blocking-coding technique fordigital image[C].1EEE International Conference on Acoustics, Speech and SignalProcessing, 1990，4:2225-2228.),(参见 Arnaud E.Jacquin.Fractal image coding:areview [J].Proceeding of the IEEE, 1993，81 (10): 1451-1465.),该方法米用基于图像分块的方式以局部的仿射变换代替全局的仿射变换。之后，Fisher利用四叉树改进了这一方法(参见 Y.Fisher.Fractal Image Compression [J].Fractals, 1994, 2 (3): 347-361.),(参见 Y.Fisher, E.ff.Jacobs.1mage compression:A study the iterated transformmethod [J].Signal Processing, 1992，29 (3)，251-263.),(参见 Y.Fisher.FractalImage Compression:Theory and application to digital images [M].NewYork: Spring-Verlag, 1995，55-77.)，大大提高了编码效率，并成为目前分形图像编码中的主流方法。
[0005]在此基础之上，一些学者和研究人员把分形图像压缩的方法应用到视频序列的压缩上。Meiqing Wang等提出了综合基于数据立方体和基于帧的分形视频压缩方法(参见 Meiqing Wang, Cho1-Hong La1.A hybrid fractal video compression method[J].Computers&Mathematics with Applications, 2005，50(3-4):611-621.),(参见 MeiqingWang, Zhehuang Huang, Cho1-Hong La1.Matching search in fractal video compressionand its parallel implementation in distributed computing environments[J].Applied Mathematical Modeling, 2006，30 (8): 677-687.),(参见 Meiqing Wang, RongLiu, Cho1-Hong La1.Adaptive partition and hybrid method in fractal videocompression[J].Computers&Mathematics with Applications, 2006, 51 (11):1715-1726.)。其中最为经典和影响较大的参见(C.S.Kim，R.C.Kim, S.U.Lee.Fractal coding ofvideo sequence using circular prediction mapping and noncontractive interframemapping [J].1EEE Transactions on Image Processing, 1998，7 (4): 601-605.X 该方法米用类似于标准视频编码方法所采用的运动估计/补偿技术，该方法利用了相邻帧之间的时间强相关性，对视频序列压缩取得了较好的效果。在CPM和NCIM中，子块域中的每个图像块都由来自相邻帧相同大小的父块域通过运动补偿得到。CPM和NCM两者间最大的不同在于CPM在解码的过程中需要具备收敛性，而NCIM不需要。但是在循环预测编码(CPM)方法中，为了保证起始帧经过自身的循环解码能够近似收敛到原来的图像，压缩过程需要经过复杂变换、搜索和迭代等，压缩时间和图像质量难以达到要求。目前典型的分形图像和视频压缩方法的运算量很大，编码速度较慢，并且解码的质量有待提高，使得分形图像和视频压缩方法还需要进一步的改进和提高。
[0006]本专利申请人:已于2010年4月申请了两个有关分形编码的专利:一种基于分形的视频压缩编解码方法(201010167243.6CN101860753A)和一种基于对象的分形视频压缩编解码方法(201010167235.1CN101827268A)。本发明与上述公开文献不同在于:1)利用了预搜索限定条件；2)利用了分数像素块匹配；3)利用了改进的非对称十字形多层次六边形格点搜索算法；4)解码中，利用了去方块环路滤波。因此，编码性能有了很大的改善和提高。

【发明内容】

[0007]本发明提出了一种基于对象的快速分形视频压缩与解压缩方法，首先利用视频分割方法获得视频对象分割平面即Alpha平面，对起始帧采用块DCT变换编码，对非I帧进行块运动估计/补偿编码，计算与子块域和父块域相关子块的像素和与像素平方和，分数像素内插值对应块的像素和、像素平方和，进行预搜索限制条件判断，并在前一帧搜索窗中利用分数像素块匹配和改进的非对称十字形多层次六边形格点搜索算法寻找最相似的匹配块，利用Huffman编码压缩迭代函数系统系数。对应解压缩过程为:对非I帧进行Huffman解码获得迭代函数系统系数，进行基于宏块的解码，计算父块域相关子块的像素和与像素平方和，然后依次对当前帧中的每一个宏块进行解码，并利用去方块环路滤波方法。
[0008]一种基于对象的快速分形视频压缩方法，包括以下步骤:
[0009]步骤一:利用自动视频对象分割方法对视频序列进行自动分割，获取每一帧的视频对象分割平面即Alpha平面，根据得到的视频对象分割平面确定要编码的视频对象区域；把正在进行压缩的帧称为当前帧，把当前帧的已经编码并重建的前一帧称为参考帧；
[0010]步骤二:首先判断起始帧是否为I帧，如果是I帧，首先对该I帧进行互不重叠的固定大小的块划分，对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法，对该帧图像进行单独编码和解码，转到步骤十；否则，转到步骤三；所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧；所述块DCT变换中的块采用固定大小模式；
[0011]步骤三:若当前帧为非I帧，在进行块匹配之前，首先将当前帧划分为固定大小的互不重叠的宏块，然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和，以及当前帧的已经编码并重建的前一帧即参考帧中，按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和，同时计算分数像素内插值对应块的像素和、像素平方和，以减少块匹配过程中的重复计算；转到步骤四；所述当前帧所有块的集合称为子块域；所述前一帧的所有块的集合称为父块域；
[0012]步骤四:对当前正在处理的图像块即当前块，利用Alpha平面判别该图像块的区域属性；如果该块不在当前编码的视频对象区域内，对该块不做处理；如果该块全部都在当前编码的视频对象区域内，转入步骤五；如果该块的部分像素在当前编码的视频对象区域内，部分像素不在当前编码的视频对象区域内，需要单独处理，转入步骤九；如果所有的宏块都已处理完毕，则转到步骤十；所述不在当前编码的视频对象区域内的块称为外部块，所述全部都在当前编码的视频对象区域内的块称为内部块，所述部分像素不在当前编码的视频对象区域内的块为边界块；
[0013]步骤五:依次对当前帧的所有宏块进行编码，在父块域中的搜索窗内首先对该宏块进行块匹配；在进行子块与父块的匹配过程中，子块的位置作为父块的起始搜索点，父块的大小与子块的大小相同，转到步骤六；
[0014]步骤六:利用改进的非对称十字形多层次六边形格点搜索算法和分数像素块匹配，搜索出最佳的匹配误差:利用改进的非对称搜索算法搜索，然后搜索分数像素内插值对应小块处的RMS点，找到最小的RMS点，转到步骤七；
[0015]步骤七:预搜索限制条件判断:对于特定的子块，若与父块对应值满足预搜索限制条件，则转到步骤八；否则直接保存当前的迭代函数系统系数即IFS系数，转入步骤四编码下一宏块；
[0016]步骤八:如果匹配误差RMS小于开始设定的阈值Y，保存当前的迭代函数系统系数即IFS系数，转入步骤四编码下一宏块；否则，依次按照树状结构对该块进行划分，并对各个划分得到的小块，利用分数像素块匹配和改进的非对称十字形多层次六边形格点搜索算法，分别计算匹配误差RMS，如果RMS小于设定阈值Y，则停止划分并记录该小块IFS系数，转入步骤四编码下一宏块；否则继续划分，直到将当前块划分为预先设定的最小块，记录IFS系数；转入步骤四编码下一宏块；所述搜索窗为在参考帧中的矩形搜索区域；所述IFS系数包括父块位置(x，y)和比例因子S、偏移因子O ;如果当前帧所有的宏块都已编码完毕，则转到步骤十；
[0017]步骤九:单独处理边界块，当前帧的边界块只在父块中的属于边界块和内部块中搜索匹配，当前块和父块的像素选取准则是:在当前块中只计算位于当前编码的视频对象区域内的像素值，只在参考帧的相同视频对象区域内进行块匹配；对于父块中，如果与当前块的相对应位置的父块中的某一像素也属于该视频对象区域，则采用原像素值，否则，用其它属于该视频对象区域像素的平均值代替；返回步骤五进行处理；
[0018]步骤十:对所有IFS系数进行Huffman编码，降低IFS系数数据的统计冗余；判断当前帧是否为最后一帧，如果是最后一帧结束编码；否则，返回步骤二继续处理下一帧图像。
[0019]所述一种基于对象的快速分形视频压缩方法，处理的视频序列为YUV格式，分别对3个分量中的每个采用上述十个步骤进行处理。
[0020]所述步骤六中分数像素块匹配，包括以下三个步骤:
[0021]I)对参考帧中搜索区域内的像素进行内插形成一个相对于在整数位置的像素更高分辨率的区域；
[0022]2)在内插区域进行整数像素和半像素位置搜索找到最佳匹配；
[0023]3)用匹配块的仿射变换来替代当前块。
[0024]所述步骤六中改进的非对称十字形多层次六边形格点搜索算法，相比于H.264中的非对称六边形算法，本算法的改进主要体现在以下三点:
[0025]I)起始点预测:
[0026]基于分形的视频编码算法没有涉及到多参考帧，并且宏块和子块具有不同的大小，故利用三种方式进行起始点预测:
[0027]a)空域中值预测:取当前子块的左、上、右相邻块的运动矢量中间值为预测运动
矢量;
[0028]b)原点预测:根据时间相关性,令运动矢量取值为(0,0)；
[0029]c)相邻参考帧预测:利用前一参考帧中对应位置块的MV按比例进行预测；
[0030]2)非对称十字模板搜索时的阈值转移条件:
[0031]分形编码的子块和父块的误差匹配准则R为式(3)、(4)、(5)。根据块的大小不同选择不同的阈值，非对称十字模板搜索完毕，择最佳匹配点作为新的起始点进行后续模版的匹配；
[0032]3)提前终止条件:
[0033]根据分形编码算法的特点将提前终止分为两种情况:一是在非均匀多层次六边形格点整像素运动搜索过程中，除了该算法本身的提前终止条件外，为了减少搜索复杂度如果最优点位于六边形中心，可停止搜索；二是基于分形的视频编码算法采用树状划分结构。
[0034]所述步骤七中预搜索限制条件为以下形式其中，h为子块的像素值，Bi为父块的像素值，S为分形编码中的比例因子，ο为偏移因子，I Ial I代表二维范数，SP I Ial I =(1?!2+!?!2+...+IaJ2)1/2:
[0035]RMS = Σ(?'.?!+<?-):
【权利要求】
1.一种基于对象的快速分形视频解压缩方法，其特征在于包含以下步骤: 步骤1:首先读入压缩信息，包括压缩帧数，每帧图像的宽和高，I帧压缩质量和插入I帧的质量；步骤I1:判断解码帧是否为I帧，若是I帧转入步骤III，否则转入步骤IV ；步骤II1:对于I帧，从压缩文件中读入码流，并读入该帧的Alpha平面进行解码，解码之后的文件包括基于不同对象的视频文件和完整的视频文件，在基于对象的视频文件中，根据Alpha平面，属于该对象的像素保留，不属于该对象的像素置零，帧数加一转入步骤VI ；步骤IV:对于非I帧，首先计算参考帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和，然后从压缩文件中读入块的划分信息和Huffman码流以及该帧的Alpha平面，从而得到非I帧所有宏块的划分方式和每一个小块的迭代函数系统系数，转到步骤V ;所述参考帧为当前帧的已经编码并重建的前一帧；步骤V:采用去方块环路滤波方法:首先对边界的类型进行判断，定义参数块边缘强度，针对不同强度的块边缘，选择的滤波器和所需要滤波的像素点数也不一样，如果为帧内编码且为宏块边界，则采用强滤波；若不是帧内编码且不是宏块边界，仿射块边界采用一级滤波，非仿射块边界不需要滤波；其他情况采用二级滤波；最后按照每一宏块进行解码；所述仿射块为由仿射变换得到的块，所述非仿射块为不是由仿射变换得到的块；步骤V1:判断此时所有帧是否都已解码，若都解码完毕，结束解码过程，否则转入步骤II。
2.根据权利要求1所述的一种基于对象的快速分形视频解压缩方法，其特征在于:对于每一个宏块进行解压缩时，首先判断该宏块在编码时的划分方式，对于每一个子块，首先在父块域找到与该子块相对应的区域，然后利用下面的公式获得该子块的像素值:
Ti = s ? dj+o (I) 其中A为待解码子块的像素值，Cli为父块域中的像素值，S为比例因子，O为偏移因子。
3.根据权利要求1所述的一种基于对象的快速分形视频解压缩方法，其特征在于:在基于对象的解码过程中，当前块中只有属于该对象区域的像素才进行解码，在父块域中只利用属于同一对象区域的像素进行解码，假如父块域中的某个子块中部分像素不属于该视频对象，那么这部分像素的值用该子块中属于该对象区域的像素的平均值代替。
4.根据权利要求1所述的一种基于对象的快速分形视频解压缩方法，其特征在于:所述步骤V中的块边缘强度用BS表示；其中，PJ，Q0'，P1'，Q1'表示滤波后的像素值，P0, P1, Q0, Q1表示原始的像素值，不同的BS和对应的滤波器如下: BS=3时，需要进行强滤波，滤波器表示为:
Po，= (Pi+Po+Qo)/3
Q0' = (P0+Q0+Qi)/3 (2) P1, = (2 ? PO/3 Q1, = (2 ? Qi+Qo') /3 BS=2时，二级滤波器表示为:
P0' = (P:+2 ? P0+Q0)/4 (3)
Q0' = (P0+2 ? Q0+Qi)/4
BS=I时,一级滤波器表示为:P0' = (P!+3.P0+Q0)/5(4)
Q0' = (P0+3.Q0+Qi)/5
当BS=O时,不进行滤波。
5.根据权利要求1所述的一种基于对象的快速分形视频解压缩方法，其特征在于:处理的视频序列为YUV格式，分别对3个分量中的每个采用上述六个步骤进行处理。
【文档编号】H04N19/61GK103647969SQ201310296181
【公开日】2014年3月19日申请日期:2011年7月6日优先权日:2011年7月6日
【发明者】祝世平, 李丽芸, 赵冬玉, 陈菊嫱, 王再阔, 侯仰拴申请人:北京航空航天大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：祝世平;李丽芸;赵冬玉;陈菊嫱;王再阔;侯仰拴
技术所有人：北京航空航天大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。