基于支持向量机的avs到hevc优化视频转码方法

文档序号：8514827阅读：206来源：国知局

基于支持向量机的avs到hevc优化视频转码方法
【技术领域】
[0001] 本发明设及的是一种视频信号处理领域的技术，具体是一种基于支持向量机的 AVS到肥VC优化视频转码方法。
【背景技术】
[0002] 视频转码技术，是将已压缩的码流通过解码再编码得到符合要求的目标码流。随着多媒体技术和互联网等的广泛应用和快速发展，在网络上传输各种视频数据已经成为现在网络技术发展的趋势，目前已出现了多种视频编码标准，包括MPEG- 4、MPEG- 2、H. 264、 AVS、肥VC等。由于视频资源多种多样，W及不同的终端设备的显示能力、存储能力、对码流的处理能力存在差异，在不同情境下用户对视频的需求也不尽相同，因此，如何能够实现高效的转码，使之适应于不同硬件设备W及网络传输环境中，一直广泛受到业界的关注。肥VC 是目前最新的视频编码标准，压缩效率比H. 264等标准提高了约50%，它将会得到越来越广泛的应用。AVS是我国自主研发的标准，具有与H. 264相当的编码性能和更低的编码复杂度，在视频应用领域具有重要的影响力。目前已有许多已压缩的AVS码流，它将于肥VC等标准长期共存，因此实现AVS到肥VC标准间的视频转换成为重要的研究方向。
[0003] 机器学习应用于多个研究领域，包括人工智能、机器翻译、数据挖掘、文字识别W 及商业领域等，随着数字多媒体技术W及传输网络等的发展，它也不断的应用于视频捜索、视频分析W及视频编转码等研究方向，目前将机器学习算法应用于视频转码领域的应用也在不断增多。支持向量机是机器学习的一个重要的方法，从输入码流前面部分帖中提取出解码信息等，利用支持向量机学习出AVS信息和肥VC编码模式之间的对应关系，在后面编码的过程中，就直接根据解码出的AVS的信息，预测出肥VC编码的模式，而不需要进行完全迭代遍历的过程，从而达到降低视频转换复杂度的目的。因此，通过利用支持向量机该种机器学习方法，如何学习得到准确的训练模型，实现准确预测W降低视频转换的复杂度，提高视频转码的速率成为当前研究的一个重要课题。
[0004] 经过对现有技术的检索发现，中国专利文献号CN104320667A公开（公告）日 2015. 01. 28,公开了一种多过程最优化编码系统，包括若干个并行编码器、前瞻缓冲器和二次编码器，前瞻缓冲器的输入端与并行编码器的输出端连接，前瞻缓冲器的输出端与二次编码器的输入端连接，并公开了其方法，包括第一编码阶段、最优化选择阶段和第二编码阶段3个步骤，第一编码阶段由若干个并行编码器同时进行编码，前瞻缓冲器对第一编码阶段所得到的结果进行最优化选择W获得最优编码路径，二次编码器根据最优化选择阶段所获得的最优编码路径第二次编码，获得最终而最优的编码结果。该技术性能、质量、带宽效率更高，编码/转码结果更好，非常易于配置并且非常灵活，既可用于高视频质量的4K和超高清应用，也可用于超高效带宽的移动视频应用。但该技术的输入是原始码流，没有能够利用输入为压缩码流时包含的编码信息，且对于肥VC比较复杂的编码器，编码路径多样，实现复杂度也会相对比较高。

【发明内容】

[0005] 本发明针对现有技术存在的上述不足，提出一种基于支持向量机的AVS到肥VC优化视频转码方法，采用了简化的视频转码框架，在训练阶段将从AVS码流提取出的特征向量训练得到训练模型，然后在转码阶段利用该模型对肥VC中的编码单元划分情况进行区域转码，同时结合快速模式选择算法，减少了重编码阶段编码单元划分W及模式选择的复杂度，大大提高了视频转码速度，同时保证了有限了转码视频质量下降。
[0006] 本发明是通过W下技术方案实现的：
[0007] 本发明通过采集AVS码流的特征向量，并利用支持向量机对其进行学习并得到训练模型，将提取出的AVS特征向量分为在肥VC中相应位置的CU划分或不划分两类，在转码阶段W训练模型预测CU是否需要划分。
[000引所述的AVS特征向量采集自AVS码流，包括；宏块编码模式、运动向量和变换系数等f目息。
[0009] 所述的宏块编码模式是指；AVS中每个宏块的模式信息。
[0010] 所述的运动向量是指；AVS中宏块的平均运动向量大小。
[0011] 所述的变换系数是指；AVS编码的离散余弦变换值CT)系数中非零系数的个数。
[0012] 所述的对应关系是指；AVS特征向量与肥VC中编码单元是否需要划分通过学习得到的训练模型，也即映射关系。
[001引所述的预测，当得到当前CU需要划分时，再在当前肥VC的深度下分别进行2NX2N模式和SKIP模式计算，并从该两种模式中选择出最优预测模式，当预测得到当前CU不需要进行划分，则按照肥VC标准编码过程进行最优模式选择。技术效果
[0014] 与现有技术相比，本发明结合机器学习基本思想W及支持向量机学习方法，对视频学习得到训练模型并预测后续转码过程中肥VC编码模式，从而降低了转码复杂度，提高转码速度。整个转码过程分为两个阶段，即训练阶段和转码阶段。在训练阶段，提取出AVS 特征向量和肥VC中相应位置的CU划分信息，根据支持向量机算法和工具训练得到两者的对应关系，即训练模型；在转码阶段，利用训练阶段得到的模型，根据AVS的特征向量，对深度为0和1时肥VC相应位置CU是否划分进行预测，若预测得到当前CU需要划分，则对当前深度的CU只进行SKIP和2化2N模式选择，若预测得到当前CU不需要划分，则按照肥VC 标准过程对最优模式进行选择。通过机器学习和快速模式选择方法结合，可W自适应的根据每个序列自身的特征得到相应训练模型，在保证转码视频质量下降有限的情况下，大大减少了转码过程中的计算复杂度，从而提高了转码速度，节省了转码时间。
【附图说明】
[0015] 图1是本发明转码框架图；
[0016] 图2是本发明流程图。
【具体实施方式】
[0017] 下面对本发明的实施例作详细说明，本实施例在W本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。实施例1
[001引如图2所示，本实施例分为W下四个步骤：
[0019] 步骤一、采集AVS码流的特征向量，具体为；采集AVS码流中与对应的肥VC中深度为0和1时相应位置CU划分的信息。
[0020] 所述的AVS特征向量采集自AVS码流，包括；宏块编码模式、运动向量和变换系数等信息。
[0021] 所述的宏块编码模式是指；在AVS对应的肥VC中深度为0时，每个CU中包含有16 个宏块，因此含有16个特征；在深度为1时，每个CU中包含有4个宏块，相应的有4个模式特征。
[002引所述的运动向量是指；AVS中运动向量是W8X8为单位，一个宏块中包含4个运动向量基本单元，每个运动向量分别取模，然后将一个宏块中四个运动向量模的平均值作为一个特征。同样，深度为0时CU中含有16个运动特征，深度为1时含有4个运动特征。运动向量模的平均值Vwg等于
【主权项】
1. 一种基于支持向量机的AVS到HEVC优化视频转码方法，其特征在于，通过采集AVS 码流的特征向量，并利用支持向量机对其进行学习并得到训练模型，将提取出的AVS特征向量分为在HEVC中相应位置的CU划分或不划分两类，在转码阶段以训练模型预测CU是否需要划分，当得到当前CU需要划分时，再在当前HEVC的深度下分别进行2NX2N模式和 SKIP模式计算，并从这两种模式中选择出最优预测模式，当预测得到当前CU不需要进行划分，则按照HEVC标准编码过程进行最优模式选择。
2. 根据权利要求1所述的方法，其特征是，所述的AVS特征向量采集自AVS码流，包括：宏块编码模式、运动向量和变换系数。
3. 根据权利要求2所述的方法，其特征是，所述的宏块编码模式是指：AVS中每个宏块的模式信息；所述的运动向量是指：AVS中宏块的平均运动向量大小；所述的变换系数是指：AVS编码的离散余弦变换系数中非零系数的个数。
4. 根据权利要求2或3所述的方法，其特征是，所述的宏块编码模式是指：在AVS对应的HEVC中深度为O时，每个CU中包含有16个宏块，因此含有16个特征；在深度为1时，每个CU中包含有4个宏块，相应的有4个模式特征；所述的运动向量是指：AVS中运动向量是以8X8为单位，一个宏块中包含4个运动向量基本单元，每个运动向量分别取模，然后将一个宏块中四个运动向量模的平均值作为一个特征，当深度为〇时CU中含有16个运动特征，深度为1时含有4个运动特征；所述的变换系数是指：AVS中DCT也是以8X8块为单位，将一个宏块内所有DCT系数中非零系数的个数作为一个特征，当深度为O时含有16个DCT系数特征，深度为1时含有4个DCT系数特征。
5. 根据权利要求1所述的方法，其特征是，所述的最优预测模式是指：对2NX2N和 SKIP模式进行率失真比较，选择出的率失真代价最小的编码模式。
6. 根据权利要求1所述的方法，其特征是，所述的最优模式选择是指：对HEVC中所有的编码模式进行率失真的比较，从而选择出率失真代价最小的过程。
【专利摘要】一种基于支持向量机的AVS到HEVC优化视频转码方法，通过采集AVS码流的特征向量，并利用支持向量机对其进行学习并得到训练模型，将提取出的AVS特征向量分为在HEVC中相应位置的CU划分或不划分两类，在转码阶段以训练模型预测CU是否需要划分，当得到当前CU需要划分时，再在当前HEVC的深度下分别进行2N×2N模式和SKIP模式计算，并从这两种模式中选择出最优预测模式，当预测得到当前CU不需要进行划分，则按照HEVC标准编码过程进行最优模式选择。本发明结合了机器学习基本思想，将整个转码过程分为了训练阶段和转码阶段，通过学习得到训练模型，预测HEVC中CU的划分，并结合快速模式选择算法，既提高了转码的速度，又保证了转码后视频的整体视频质量。
【IPC分类】H04N19-103, H04N19-147, H04N19-40
【公开号】CN104837019
【申请号】CN201510215888
【发明人】解蓉, 罗瑞, 张文军, 张良
【申请人】上海交通大学
【公开日】2015年8月12日
【申请日】2015年4月30日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：解蓉;罗瑞;张文军;张良;
技术所有人：上海交通大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。