一种基于数据挖掘的高效自适应的视频转码系统的制作方法

文档序号:7799185阅读:244来源:国知局
一种基于数据挖掘的高效自适应的视频转码系统的制作方法
【专利摘要】本申请公开了一种基于数据挖掘的高效自适应的视频转码系统、以及方法,该方法包括以下步骤:步骤1、输入第一压缩标准的待转码的视频;步骤2、对所述待转码的视频进行解码,生成待编码的视频,并提取每个视频帧的每个宏块的解码信息;步骤3、将所提取的解码信息输入到编码宏块模式决策树,通过编码宏块模式决策树来确定待编码的视频的每个视频帧的每个宏块将采用的编码宏块模式;步骤4、根据所确定的编码宏块模式、以及每个宏块的运动矢量,对待编码的视频的每个视频帧的每个宏块进行第二压缩标准的编码,从而将待编码的视频编码为第二压缩标准的转码后的视频。
【专利说明】一种基于数据挖掘的高效自适应的视频转码系统
【技术领域】
[0001]本发明属于视频编码、视频转码领域,尤其涉及基于数据挖掘的高效自适应的视频转码系统,其可以对不同编码格式、不同码率、不同分辨率的视频进行解码,并重新编码,从而转码至满足需求的编码格式、码率及分辨率的视频。
【背景技术】
[0002]现有技术一的技术方案
[0003]现有技术一中实现的是等分辨率下MPEG-2/H.263 — H.264的低复杂度的视频转码技术,它利用机器学习的方法找到MPEG-2/H.263的解码信息与H.264编码信息之间的联系,从而建立起编码端快速编码的机制,实现快速转码过程。现有技术一假设解码端MPEG-2/H.263宏块的CBP、编码模式、均值及方差与编码端H.264宏块的编码模式存在某种关联,利用Weka J48分类器训练这些数据并得到决策树。图1、2示出了以MEPG — H.264为例的视频转码过程。
[0004]将宏块模式决策树应用在实际MPEG-2/H.263 — H.264转码过程中,从解码器实时获得宏块的残差信息、CBP、编码模式,将其传递到编码器端,通过决策树快速判决编码的宏块模式,而不需要全解全编,从而减少了转码复杂度。
[0005]现有技术一的缺点
[0006]1.针对较小分辨率的视频序列可以取得较好的质量和比特率之间的平衡,针对大视频以及清晰度较好的视频,取得近似图像质量情况比特率波动较大。
[0007]2.只利用单一量化参数(QP=25)的决策树模型实现转码流程,在实际转码中,每个视频帧中宏块的QP都是不同的,利用QP=25的决策树模型对于QP在25附近的待转码视频的转码效果较好,但是对偏离25较远的QP视频的转码效果不好。这是因为在应用决策树模型时需要对训练的模型中的阈值进行调整,这时用到量化因子。QP=25时,量化因子为I ;QP大于25时,每增加I量化因子下降12.5% ;QP小于25时,每下降I量化因子增长12.5%所以当实际待转码视频QP远离25时,量化因子的作用较大,不能很好与QP=25的决策树模型匹配。因此单一 QP决策树的适应范围不广泛。
[0008]现有技术二的技术方案
[0009]现有技术二实现的是等分辨率下MPEG-2 — H.264的视频转码技术。技术二同样利用解码端的残差信息、CBP、编码模式,对编码端宏块模式进行决策。与现有技术一不同的是,现有技术二使用Jrip分类器对宏块模式进行分类,决策树的结构如图3所示。
[0010]首先在节点I利用Jrip分类方法将宏块模式分为2类,分别是节点2和节点3。然后节点2进行宏块模式的遍历,节点3利用Jrip分为2类,一类是8X8,一类是节点4所包含的宏块模式。最后对节点4进行剩下3种宏块模式的遍历。
[0011]Jrip方法得到决策树的形式是一条条规则语句,而不是二叉树的形式,简化了决策树的代码,具有较好的移植性。将实现的Jrip训练结果应用到转码过程中,可以实现快速转码。[0012]现有技术二的缺点
[0013]1.仅节点I和节点3用到了 Jrip分类器,节点2和节点4是用原始H.264的全解全编技术,所以有待进一步改进。
[0014]2.只利用单一量化参数(QP=25)的决策树实现转码流程,对待QP在25附近的待转码视频的转码效果较好,但是待转码视频QP偏离25较远的转码会出现欠拟合(效果不好),因此单一 QP决策树的适应范围不广泛。
[0015]为了避免使本说明书的描述限于冗繁,将有关上述【背景技术】的以下参考文献通过引用而全文合并于此。
[0016]1、Fernandez-Escribanoj G.,Bialkowskij J.,Gamez, J.A.,Kalvaj H.,Cuenca,P.,Orozco-Barbosaj L., Kaupj A.Low-Complexity Heterogeneous Video Transcoding UsingData Mining.1EEE Transaction on Multimedia, 2008 ;
[0017]2、Fernandez-Escribanoj H.Kalvaj J.L.Martinez, P.Cuenca, An MPEG_2toH.264video transcoder in the baseline profile.1EEE Transaction onMultimedia, 2010。

【发明内容】

[0018]现有技术方案一中采用的宏块模式决策树是单一的(决策树的QP=25),在实际转码应用中,单一决策树的适应性不强。因为编码器在视频编码过程中,当待转码视频的QP与单一 QP (25)相差较多时,实际转码时获得的残差信息与模型的残差信息一致性较差,那么就不能很好的适应单一QP模型。在本发明中,训练三个不同QP(16、25、36)的宏块模式决策树,三个决策树可以更好地适应不同QP范围(常用范围QP=12-40)内视频转码策略。在实际转码中,可以根据输入视频每帧每个宏块QP的大小,自适应地选择最佳的决策树判决模型,不但减少了转码时间,而且有效地减少了转码质量的下降。
[0019]视频转码器的性能与决策树的优劣有关。为了更好地降低转码时间,并且保证转码质量不会大幅下降,本发明采用联合J48分类器和Jrip分类器,实现对模型的构建。J48分类器对于较小分类数据集的训练性能良好,但是对较多分类数据集的训练结果庞大;Jrip分类器对于数据集的分类准确率较高,而且训练得到的训练结果具有很强的代码书写能力和可移植性。结合两种分类器的优势,视频转码的性能可以得到提升。
[0020]为了进一步提高视频转码器的性能,本发明提出了一种基于宏块模式和运动矢量级联决策树的高效自适应视频转码技术,即在转码过程的编码端,利用宏块模式决策树快速选择编码所用的宏块模式,在选定的宏块模式基础上,利用训练好的运动矢量决策树快速选择当前编码块的运动矢量。由于快速选择宏块模式代替了所有宏块模式的遍历,同时运动矢量的快速判决代替了大范围内的运动搜索过程,因此,新提出的级联决策树的方法大大地改善了现有视频转码器的性能,是一种新的方法。
[0021]本发明利用级联决策树的方法不但实现了等分辨率下的视频转码技术,而且实现了降分辨率下的视频转码技术,能够满足不同终端设备的需求。同时,本发明可以根据视频转码前后码率的不同比率选择不同QP决策树的转码流程,不但保证了高码率下视频的转码质量,而且改善了低码率下转码器的性能。
[0022]简而言之,本发明实现了一种基于数据挖掘的高效自适应的视频转码器,主要完成的是MPEG-2 — H.264转码技术和H.263 — H.264转码技术。相对于以往同类技术来讲,本发明采用多决策树的方法,在维持基本相同的转码速度的情况下,能够良好地改善转码后视频的主观质量。
[0023]根据本发明的实施例,提供了一种基于数据挖掘的高效自适应的视频转码方法,包括以下步骤:步骤1、输入第一压缩标准的待转码的视频;步骤2、对所述待转码的视频进行解码,生成待编码的视频,并提取每个视频帧的每个宏块的解码信息;步骤3、将所提取的解码信息输入到编码宏块模式决策树,通过编码宏块模式决策树来确定待编码的视频的每个视频帧的每个宏块将采用的编码宏块模式;步骤4、根据所确定的编码宏块模式、以及每个宏块的运动矢量,对待编码的视频的每个视频帧的每个宏块进行第二压缩标准的编码,从而将待编码的视频编码为第二压缩标准的转码后的视频。
[0024]本发明的有益效果主要在于以下几个方面:①在改善转码质量的基础上,采用基于宏块模式和运动矢量的级联决策树判决方法,进一步提高转码效率,提高转码器的性能;②不但能够实现MPEG-2/H.263 — H.264在等分辨率下的快速转码过程,还能实现降分辨率下视频的转码流程,大大改善了低分辨率低码率下视频的转码性能;③可以根据实际要求的视频转码前后码流的不同比率来自适应的进行转码,拓展了视频转码技术的应用范围。
[0025]具体地,本发明利用三个不同QP决策树对H.264宏块模式进行快速判决,在保证视频质量的前提下,大大地减少了 MPEG-2/H.263 — H.264的转码时间,而且对于低QP和高QP的输入视频都能获得较好的转码性能。第二,本发明采用级联决策树的模型,在宏块模式已确定的基础上,对于部分模式,分别使用运动矢量决策树对水平方向运动矢量和垂直方向运动矢量进行快速判决,获得当前宏块的运动矢量后,还可以在2个整像素精度范围内进行运动搜索,可以实现视频图像的精确重建。由于运动矢量的快速选择代替了大范围的运动搜索,因此,视频转码的时间进一步减少,相对于全解全编的转码技术,本转码时间可节约80%左右。第三,在复杂的环境下,本视频转码技术可根据转码前后码流的比值自适应地选择不同QP决策树的转码流程,以获得最佳的转码效果。第四,MPEG-2/H.263 —H.264可利用与等分辨率相似的转码流程实现降分辨率下的视频转码,与现有降分辨率技术相比,转码时间和转码质量都有一定的改善。
【专利附图】

【附图说明】
[0026]图1是现有技术的MPEG-2 — H.264的转码决策树生成框图;
[0027]图2是示出现有技术的MPEG-2宏块模式决策树结构的示意图;
[0028]图3是示出现有技术的决策树结构的示意图;
[0029]图4是根据本发明的实施例的基于数据挖掘模型的视频转码框架简图;
[0030]图5是根据本发明的实施例的数据挖掘模型的框图;
[0031]图6示出了 H.264宏块及子宏块的编码模式;
[0032]图7示出了 H.264编码宏块的多决策树模型;
[0033]图8示出了 MPEG-2/H.263解码信息及H.264宏块模式的数据形式;
[0034]图9示出了根据本发明的实施例的按照转码前后码率比值选择不同决策树的示意图;
[0035]图10示出了根据本发明的实施例的宏块模式16X 16下QP=25的运动矢量的决策树;
[0036]图11示出了根据本发明的实施例的降分辨率下的宏块信息映射的示意图;
[0037]图12示出了根据本发明的实施例的视频转码平台的功能结构图;
[0038]图13示出了 WEKA arff数据文件格式的示例;
[0039]图14示出了根据本发明的实施例的J48分类器的训练结果的示例;
[0040]图15示出了根据本发明的实施例的Jrip分类器的训练结果的示例。
【具体实施方式】
[0041]下面,结合附图对技术方案的实施作进一步的详细描述。
[0042]本领域的技术人员能够理解,尽管以下的说明涉及到有关视频编解码技术和决策树分类技术的很多细节(例如转码前后的具体视频格式、决策树的训练方式、解码信息和分类信息的构成),但这仅为用来说明本发明的原理的示例、而不意味着任何限制。本发明能够适用于不同于以下例举的技术细节之外的场合,例如,现有的和将来可能出现的其它视频压缩标准、其它决策树训练方法,只要它们不背离被发明的原理和精神即可。
[0043]首先,概述本发明的基本原理。
[0044]—般的,视频转码器包括解码器和编码器。全解全编的视频转码器是比较耗时的,现在已实现的主流技术是在编码端利用解码端信息进行快速编码,来减少转码时间。视频转码的目标是在满足实际需求的前提下,使用尽可能少的时间并保持转码后的图像质量下降很少。当前视频转码主要包括码率转换、分辨率转换和不同码流之间的转码。
[0045]为了加快视频转码的速度并保证视频转码的质量,本发明提出了一系列的方法来改进视频转码技术的性能。本发明实现的是基于数据挖掘方法的高效自适应视频转码技术,主要完成的是MPEG-2 — H.264的快速转码及H.263 — H.264的快速转码。
[0046]图4是本发明中基于数据挖掘模型的视频转码框架简图。如图4所示,本技术中高效转码器的框架包括两大部分:解码器和编码器,两者之间依靠数据挖掘模型联系在一起。假设MPEG-2/H.263解码后的视频流信息(CBP、模式、均值、方差、运动矢量)与H.264编码端的宏块模式或运动矢量存在某种关联,收集这些数据,利用机器学习的方法挖掘MPEG-2/
H.263解码信息与H.264编码信息之间的联系,建立分类决策树。通过大量数据训练后,得到性能好的决策树,并将决策树应用到实际转码过程中,可以实现MPEG-2 —H.264和
H.263 — H.264的快速转码。在技术实现中,采用级联决策树的方法如图5对宏块模式和运动矢量进行快速判决,从而避免了宏块模式的遍历选择及运动矢量的大范围搜索,减少了编码复杂度,实现了转码时间的下降。
[0047]在进行视频转码前,首先要用机器学习的方式训练得到两个决策树模型:一个是
H.264编码端宏块模式决策树和运动矢量决策树。两个决策树是级联的关系,即在宏块模式决策树应用之后是运动矢量决策树的应用。训练模型的目的是为了获得分类准确率高和移植性好的决策树。
[0048]宏块模式决策模型是对编码端H.264的编码模式(9种)进行快速分类并应用。
H.264帧内预测的宏块模式是Intra,帧间预测的宏块模式除Skip (运动残差为O)之外,还有 16X16、16X8、8X16、8X8、8X4、4X8、4X4,如图 6 所示。
[0049]在本发明的实施例中,采用3种不同的QP宏块模式决策树,即对QP=16、25、36的视频进行训练,得到3个分层决策树结构,如图7所示。
[0050]以QP=25的分层决策树为例,在节点1,利用J48分类器将宏块模式分为4类,Intra、Skip、16X 16和8X8 ;在节点2,Skip和16X 16模式很容易区分开,不需用机器学习的方法;在节点3,利用J48分类器将16X16的模式细分为16X16、16X8、8X16 ;在节点4,利用J48分类器将8X8的模式细分为8X8、8X4、4X8、4X4。最终分层实现9种编码模式的分类。
[0051]图8是训练所需要的、MPEG-2/H.263解码信息及H.264宏块模式分类合并后的表现形式。其中解码彳目息包括由残差?目息计算得到的均值、方差,MPEG-2/H.263宏块模式及CBP。
[0052]下面具体说明解码信息的组成。
[0053]①残差信息
[0054]ΜΡΕ-2和H.263标准都是基于8X8块进行DCT变换,帧间编码将运动估计残差进行DCT变换再进行下一步的编码操作,而帧内编码直接对原图像像素数据进行DCT变换。所以帧间编码宏块IDCT变换的结果代表的是残差信息。获取到8X8亮度块各自的64个整数“残差”信息,分别对应8X8的各个像素点。每个8X8块又可以划分为4个4X4子块。对每个4X4块中的“残差”进行信息统计,分别求取均值和方差,得到16个均值以及16个方差。
[0055]②MPEG_2/H.263 宏块模式
[0056]Mpeg-2 中宏块模式有五种:skip(0) ; intra (I) ;motion compensation,coded(2) ;motion compensation, no coded(4) ;no me, coded(8)。H.263 的宏块模式分成三种skip (0), intra (3)和inter模式(9)。括号内为实际训练过程中的代号。
[0057]③CBP,全称是coded block pattern (编码块模式),用来标识MPEG-2/H.263的已编码块模式,本发明中选用的CBP系列特征是针对CBP各个比特位的数值,共6位。
[0058]下面说明H.264编码宏块模式(编码信息)。H.264编码宏块模式分为三组,如图6所示:(I)帧内编码宏块模式Intra (可分为帧内16X 16、8X8、4X4模式,不过,本发明的决策树不需要再对此细分);(2)帧间宏块模式:帧间16X16、16X8、8X16模式;(3)帧间子宏块模式:帧间8X8、8X4、4X8、4X4模式;(4)skip模式,因为在JM中skip模式的确认是针对遍历宏块模式决策结果为帧间16X16的宏块,若该宏块满足无像素残差、无运动矢量残差的条件则确定此宏块的编码模式为skip。
[0059]在本发明中,可选地,不论是宏块模式决策树,还是运动矢量决策树,当3个不同QP决策树训练完毕后,都可以实现根据转码前后码率的比值自适应的选择最适合的决策树。例如,如图9所示,当码率比值小于第一个阈值时,选择QP=16的决策树,当码率比值不小于第一个阈值且小于第二个阈值时,选择QP=25的决策树,当码率比值不小于第三个阈值时,选择QP=36的决策树。这样,本发明的自适应转码能力可以体现。
[0060]下面说明本发明的运动矢量决策树的原理。
[0061]运动矢量多决策树是在宏块分别为16X16、16X8、8X16、8X8时,对当前宏块的水平、垂直方向运动矢量进行决策树快速判决。16X 16宏块中QP=25的运动矢量决策树的结构如图10所示,其他 三种宏块的运动矢量决策树与图10所示类似。(a)图是对水平方向运动矢量的分类判决,(b)图是对垂直方向运动矢量的分类判决。[0062]运动矢量决策树也采取多个QP决策树联合使用的方式,能够提高大范围QP下视频的运动矢量判决的准确度,最终提升转码性能。
[0063]在H.264编码标准中,运动矢量MV的范围是(-16,16)。在本发明中,可将运动矢量MV分为{-15,-12,-9,-6,-3,0,3,6,9,12,15}共11类,利用运动矢量决策树判决得到当前运动矢量后,可直接传递到编码端,也可以当前运动矢量为搜索起点,在2个整像素精度范围内进行运动搜索,从而对运动矢量进行修正。
[0064]下面说明本发明应用于降分辨率转码的原理。
[0065]降分辨率视频转码器可以将视频从高分辨率高码率降至低分辨率低码率(本发明中指画面宽高方向的像素数目同时降低到1/2),以适应终端设备的不同需求。降分辨率的实现与等分辨率相似,利用级联决策树对解码端信息进行复用,并对宏块模式和运动矢量进行快速判决,从而节约转码时间。不同的是,降分辨率是将4个原始解码宏块映射到I个编码宏块,如图11所示,即提取原视频空间相邻4个宏块的解码信息,包括CBP、宏块模式、均值、方差和运动矢量,将这些信息用于判决降分辨率下I个编码宏块的快速决策。
[0066]综上所述,本发明所实现的视频转码技术依托于FFMPEG平台和libx264。基于数据挖掘模型的高效自适应视频转码系统的设计流程如图12所示,包括参数设置模块、解码信息提取模块、等分辨率/降分辨率宏块模式判决模块和等分辨率/降分辨率运动矢量判决模块。
[0067]有关本说明书中的编解码技术中(包括宏块模式/运动矢量等),可以参考以下文献“蔡安妮,孙景鳌,多媒体通信技术基础,电子工业出版社,2001”。
[0068]有关本说明书中的W eka机器学习方法,可参考以下文献“李德有,李凌霞,郭瑞波,基于Weka平台的机器学习方法探究,电脑知识与技术,2012”。
[0069]为了避免使本说明书的描述限于冗繁,在本说明书中的描述中,可能对可在上述参考文献或其它现有技术资料中获得的部分技术细节进行了省略、简化、变通等处理,这对于本领域的技术人员来说是可以理解的。在此,将上述参考文献通过引用全文合并于此。
[0070]下面,具体说明根据本发明的实施例的采用决策树的快速转码方法的实施方式。
[0071](一)、H.264宏块模式决策树的训练
[0072]1.从训练视频中提取数据集
[0073]MPEG-2 — H.264快速转码技术采用flower.m2v (MPEG-2格式)作为训练视频;
H.263 — H.264快速转码技术采用football.h263 (H.263格式)作为训练视频。
[0074]1.1.训练视频的解码
[0075]首先,进行训练视频的解码。
[0076]MPEG-2/H.263 解码端:将 flower.m2v 送到 MPEG-2 解码端,解码端将 flower.m2v解码为 flower, yuvo 同样,将 football.h263 送到 H.263 解码端,解码为 football, yuv。
[0077]在解码过程中,每个帧按16 X 16宏块提取256个像素点的残差信息和MPEG-2宏块模式和CBP,并计算16X16宏块中16个4X4子宏块的均值和方差,这3类信息(MPEG-2宏块模式、CBP、均值和方差)统称为MPEG-2解码信息。将MPEG-2解码信息保存到mpeg2.txt O
[0078]同样,每个巾贞按16X 16宏块提取256个像素点的残差信息和H.263宏块模式和CBP,并计算在16X 16宏块中16个4X4子宏块的均值和方差,这3类信息(H.263宏块模式、CBP、均值和方差)统称为H.263解码信息。将H.263解码信息保存到h263.txt。
[0079]1.2.解码后的训练视频的H.264编码
[0080]H.264编码端:将flower, yuv和football, yuv分别送到H.264编码端,在编码时分别固定QP=16、25、36对两个yuv视频进行编码,最后flower, yuv编码后得到QP=16、25、36 的 3 个 h264 文件(例如,flowerl.h264、flower2.h264、flower3.h264), football,yuv 编码后得到 QP=16、25、36 的 3 个 h264 文件(例如,footballl.h264、football2.h264、QP=football3.h264)。
[0081]1.3.H264编码后的训练视频的解码
[0082]H.264解码端:将QP=25的flower2.h264送到H264解码端,分别进行3次解码,每次解码都需要在解码端编写不同代码来获得如图7中3个分类节点的宏块模式。具体步骤如下。
[0083]首先,在第一次解码时,使H.264的宏块模式分类为Intra、Skip、16 X 16 (大类)、8X8 (大类);当将QP=25的flower2.h264解码为flower2.yuv时,可获得有关每巾贞的每个宏块的宏块模式属于这4种宏块模式分类中的哪个的信息,将其保存到class-1, txt (宏块模式分类文件)中;
[0084]在第二次解码时,在解码端编写代码,在宏块模式已分为Intra、Skip、16X 16 (大类)、8X8 (大类)的前提下,进一步将16X16 (大类)细分为16X16、16X8、8X16,而Intra、Skip、8X8(大类)分类不变,一共得到6种宏块模式分类;当QP=25的flower2.h264解码为flower2.yuv时,得到这6个宏块模式分类与每巾贞的每个宏块的对应关系,保存到class-2,txt O
[0085]在第三次解码时,在解码端编写代码,在宏块模式已分为Intra、Skip、16X16、8X8的前提下,将8X8 (大类)细分为8X8、8X4、4X8、4X4,其他3个分类不变,一共得到7种宏块模式分类;当QP=25的flower2.h264解码为flower2.yuv时,可得到这7个宏块模式分类,保存到class-3, txt ο
[0086]QP=25的f lowerf.h264解码过程按3个分类节点提取3次宏块模式分类,那么,对于其它两个 QP (16,36)下的与 MPEG-2 相关的 h264 文件(flowerl.h264、flower3.h264),重复上述过程。这样,QP=16、25、36 的 flowerl.h264、flower2.h264、flower3.h264 一共将提取9次宏块模式分类,生成9个宏块模式分类文件。
[0087]同样,QP=16、25、36 的 footballl.h264、football2.h264、football3.h264 也将提取9次宏块模式分类,生成9个宏块模式分类文件。
[0088]2.生成数据集
[0089]如图7,在宏块模式决策树的分类节点1,QP=25的flower2.h264将MPEG-2解码信息mpeg2.txt和H.264解码端第一次获得的宏块模式分类class-1, txt合并,得到分类节点I处的数据集;将MPEG-2解码信息mpeg2.txt和H.264解码端第二次获得的宏块模式分类class-2合并后,仅提取16X 16、16X8、8X 16分类所对应的数据集(数据行),即为分类节点3处的数据集;将MPEG-2解码信息mpeg2.txt和H.264解码端第三次获得的宏块模式分类class-3, txt合并后,仅提取8X8、8X4、4X8、4X4分类所对应的数据集,即为分类节点4处的数据集。数据集的形式如图8所示。
[0090]按照图7宏块模式决策树可知,flower.m2v — QP=25的flower.h264可以生成3个数据集,那么flower.m2v — QP=16、25、36的flower.h264可以生成9个数据集;同样的,football.h263 — QP=16、25、36的football.h264可以生成9个数据集。每个数据集都被整理成arff文件格式(一共18个arff文件),如图13所示,并送到Weka机器学习工具中进行训练。.[0091]3.训练数据集
[0092]将每一个arff文件都送到Weka机器学习工具中,采用J48分类器来挖掘每个arff数据集中MPEG-2/H.263的解码信息与H.264的宏块模式分类之间的关系。
[0093]具体地,利用J48分类器训练分类节点I的arff数据集(解码信息+上述第一次解码产生的宏块模式分类信息),得到J48训练结果如图14,即,得到了由J48分类器产生的二叉树的伪代码形式。同样的,训练分类节点3、分类节点4的arff数据集也将得到J48训练结果,与图14类似。
[0094]flower.m2v — QP=16、25、36 的 flower.h264 有 9 个 arff 数据集,则可以训练得到9个J48训练结果(每个QP对应3个二叉树,一共9个二叉树);football.h263 — QP=16、25,36的football.h264有9个arff数据集,则可以训练得到9个J48训练结果(每个QP对应3个二叉树,一共9个二叉树)。
[0095]每个QP对应的3个J48训练结果(3个二叉树)构成了一个编码宏块模式决策树的3个节点(S卩,图7中的节点1、3、4),编码宏块模式决策树的节点2可采用公知的简单判定方法获得,而不需要通过训练产生。这样,3个QP对应的9个J48训练结果一共构成了 3个编码宏块模式决策树。
[0096](二 )、运动矢量决策树的训练
[0097]运动矢量决策树的训练过程与宏块模式决策树的训练过程类似,只是提取的解码信息不同、决策树的结构不同,如图10所示。运动矢量决策树数据集的提取、生成和训练过程可以简化为以下内容。
[0098]1.提取数据集
[0099]由于运动矢量的分类较多,所以为了提高分类准确度,本发明采用多个不同运动程度的视频作为训练视频,包括 flower.m2v、football.m2v> soccer.m2v、foreman.m2v 和flower.h263、football.h263、soccer.h263、foreman.h263。
[0100]1.1.训练视频的解码
[0101]MPEG-2 解码端:将 flower.m2v、football.m2v、soccer.m2v、foreman.m2v 送到MPEG-2 解码端,解码为 flower, yuv、football, yuv、soccer, yuv、foreman, yuv,在解码每个帧时按16X 16宏块提取16个4X4子宏块的均值和方差、MPEG-2宏块编码模式、CBP及水平方向运动矢量,这些信息统称为MPEG-2解码信息I。再次将4个m2v视频送到MPEG-2解码端,在解码时按16X 16宏块提取16个4X4子宏块的均值和方差、MPEG-2宏块编码模式、CBP及垂直方向运动矢量,这些信息统称为MPEG-2解码信息II。
[0102]H.263 解码端:将 flower.h263、football.h263、soccer.h263、foreman.h263 送到 Η.263 解码端,解码为 flower, yuv、football, yuv、soccer, yuv、foreman, yuv,在解码每个帧时按16X 16宏块提取16个4X4子宏块的均值和方差、H.263宏块编码模式、CBP及水平方向运动矢量,这些信息统称为H.263解码信息I。再次将4个m2v视频送到MPEG-2解码端,在解码每个帧时按16X 16宏块提取16个4X4子宏块的均值和方差、H.263宏块编码模式、CBP及垂直方向运动矢量,这些信息统称为H.263解码信息II。
[0103]1.2.解码后的训练视频的H.264编码
[0104]H.264 编码端:编码端分别以 QP=16、25、36 将 flower, yuv, football.yuv>soccer,yuv、foreman, yuv 编码为 QP=16、25、36 的 h264 视频(flower.h264, football.h264、soccer.h264、foreman.h264),最后得到 12 个 h264 视频。
[0105]1.3.Η.264编码后的训练视频的解码
[0106]H.264解码端:将编码端产生的12个h264视频送到解码端,解码为12个yuv视频,并在解码过程中提取每个帧中每个宏块的水平方向和垂直方向的运动矢量分类信息。将相同QP的h264视频解码获得的水平方向运动矢量合并在一起,将相同QP的h264视频解码获得的垂直方向运动矢量合并在一起。最终,MPEG-2 — H.264有I个水平方向运动矢量分类和I个垂直方向运动矢量分类;H.263 — H.264有I个水平方向运动矢量分类和I个垂直方向运动矢量分类。
[0107]2.数据集的生成
[0108]将m2v视频的MPEG-2解码信息I与QP=16、25、36的h264视频解码得到的水平方向运动矢量分类合并,得到3个数据集;将m2v视频的MPEG-2解码信息II与QP=16、25、36的h264视频解码得到的垂直方向运动矢量分类合并,得到3个数据集。同样的,将h263视频的H.263解码信息I与QP=16、25、36的h264视频解码得到的水平方向运动矢量分类合并,得到3个数据集,将h263视频的H.263解码信息II与QP=16、25、36的h264视频解码得到的垂直方向运动矢量分类合并,得到3个数据集。所以,MPEG-2 — H.264训练过程共生成6个数据集,H.263 — H.264训练过程共生成6个数据集。将这12个数据集整理成arff形式,送到Weka机器学习工具中进行处理。
[0109]3.训练arff数据集
[0110]将上一步提取的arff形式数据集送到Weka机器学习工具中。由于J48分类器训练得到的J48训练结果,在代码实现时代码量比较庞大,所以不易移植和修改。另一种分类器Jrip可以实现简单分类。用Jrip分类器对arff形式数据集进行数据挖掘,可以得到如图15的Jrip训练结果。12个arff形式数据集可以训练得到12个Jrip训练结果(MPEG-2:每个QP对应2个(水平MV和垂直MV),H.263:每个QP对应2个(水平MV和垂直MV))。
[0111](三)、H.264宏块模式决策树与运动矢量决策树的级联实现
[0112]实现图7的宏块模式决策树,是将决策树中每个分类节点的J48训练结果用代码实现。实现图10的运动矢量决策树,是将水平、垂直方向决策树中分类节点的Jrip训练结果用代码实现。
[0113]MPEG-2 — H.264的QP=25级联决策树模型是将QP=25的宏块模式决策树和QP=25的运动矢量决策树级联起来。由步骤3可以得到与图7宏块模式决策树中3个分类节点一一对应的3个J48训练结果,由步骤4可以得到与图10运动矢量决策树分类节点一一对应的Jrip分类结果。
[0114]首先编写第I个分类节点的J48训练结果,得到Intra、Skip、16X 16、8X8分类;然后在16X 16分类基础上,用代码编写第3个分类节点的J48训练结果;同样在8X8分类基础上,用代码编写第4个分类节点的J48训练结果。经过分类节点I和分类节点3的级联,以及分类节点I和分类节点4的级联,最终H.264的9种宏块编码模式分类完毕。至此,宏块模式决策树代码化结束。在H.264的9种宏块模式确定后,对于16X 16、16X8、8X 16、8X8宏块模式分类,需要级联运动矢量决策树,快速判决运动矢量。如图10,用代码编写水平运动矢量决策树中分类节点的Jrip训练结果;同时,用代码编写垂直运动矢量决策树中分类节点的Jrip训练结果。至此,QP=25的宏块模式决策树和运动矢量决策树都已代码化。
[0115]在MPEG-2 — H.264中,每个QP级联决策树将代码化实现3个J48训练结果和2个Jrip训练结果,那么3个不同QP级联决策树则将总共代码化实现9个J48训练结果和6个Jrip训练结果。同样的,H.263 — H.264中,3个不同QP级联决策树将代码化实现9个J48训练结果和6个Jrip训练结果。
[0116]该部分是将训练得到的分类结果用代码实现,并能应用于实际转码。
[0117](四)、级联决策树的应用过程
[0118]实际转码时,输入视频先经过MPEG-2或H.263解码端,然后进入H.264编码端。一段视频由很多帧图像组成。第一帧图像解码完后进入编码端完成转码过程,然后进行下一帧的解码和编码过程。依次类推。
[0119]视频的一帧图像(譬如大小为704X576)划分为很多个不重叠的16X16的宏块,宏块的位置由水平坐标和垂直坐标来标识。在解码端,一帧图像中每个16 X 16宏块分别解码成yuv视频,当一个宏块解码完毕时,根据宏块坐标信息进入下一个宏块的解码并且提取每个16X 16宏块中256个像素点的残差信息,并按照4X4子宏块计算均值和方差,共有16个均值和16个方差,还有MPEG-2/H.263每个16 X 16宏块的编码模式、CBP以及水平方向运动矢量和垂直方向运动矢量。这些信息都将传递到H.264编码端。
[0120]当一帧中所有宏块都解码完毕时,进入H.264编码端。在H.264编码端,根据每个宏块的QP大小,选择适合的宏块模式决策树和运动矢量决策树;传递过来的解码信息则将用于每个宏块模式决策树和运动矢量决策树的判决。当第一个宏块的宏块模式决策树应用完成后,判决得到的宏块模式将被保存到编码端。如果宏块模式判决所得到16X 16,16X8,8X 16和8X8宏块模式中的一个,则还需要进入运动矢量决策树流程,将运动矢量判决所得到的运动矢量保存到编码端。另外,也可以将运动矢量判决所得到的运动矢量作为小范围运动搜索的起点,进行2个整像素范围内的运动搜索,对快速判决得到的运动矢量进行微调之后保存到编码端;如果宏块模式判决得到8X4、4X8、4X4、Intra、Skip宏块模式中的一个,则利用传统的运动估计和运动搜索方式(在预编码过程中)获得运动矢量,最后也将其保存到编码端。对于当前宏块,获得宏块模式及运动矢量信息后将进入后续编码阶段,直至这个宏块被编码完毕。当第一个宏块编码完毕后,第二个宏块将重复以上过程,一直到一中贞中所有宏块都编码完毕。
[0121]以上是一帧图像的解码、编码流程,下一帧的转码过程与其相同。当一段视频的所有帧都转码结束后,转码系统才可以输出H.264编码标准的视频文件。
[0122](五)、降分辨率下宏块模式决策树与运动矢量决策树
[0123]前部分实现的是等分辨率下宏块模式决策树与水平、垂直运动矢量决策树的具体训练过程与实现形式。这部分内容实现的是降分辨率下宏块模式决策树和水平、垂直运动矢量决策树的训练与实现,由于过程与等分辨率下的过程类似,因此简要说明。
[0124]本发明实现的降分辨率技术可以应用在MPEG-2 — H.264和H.263 — H.264转码技术中。降分辨率的转码器是在水平和垂直方向上分别进行2倍的降采样,即降分辨的视频帧大小是原视频帧大小的1/4。如图11所示,在MPEG-2/H.263降分辨率过程中,原视频帧中4个空间相邻宏块对应降分辨率下视频帧中I个宏块。
[0125]与等分辨率转码器的流程相似,采用级联决策树的数据挖掘模型对输入视频进行转码,不同的是,宏块模式决策树利用原视频4个宏块的残差信息、CBP和宏块模式,决策出降分辨率视频的I个宏块的模式;水平运动矢量决策树利用4个宏块的残差信息、CBP、宏块模式和水平方向运动矢量信息,决策出降分辨率视频的I个宏块的水平方向运动矢量,垂直运动矢量决策树利用4个宏块的残差信息、CBP、宏块模式和垂直方向运动矢量信息,决策出降分辨率视频的I个宏块的垂直方向运动矢量。
[0126]降分辨率下H.264宏块模式决策树与水平、垂直运动矢量决策树的训练过程与实现方式是类似的。采用的训练视频是一样的,只是提取的MEPG-2/H.263解码信息是4个空间相邻的宏块信息,提取的H.264宏块模式/运动矢量信息是在降分辨率下对应I个宏块的信息。将MPEG-2/H.263解码信息和H.264宏块模式/运动矢量信息一一合并作为数据集。降分辨率下得到的数据集个数与等分辨率下的数据集个数相同。
[0127]数据集准备完毕后,整理成arff文件的形式送到Weka工具进行分类训练,最后得到性能好的宏块模式决策树和运动矢量决策树,最后将其代码化。
[0128]降分辨率的转码系统中宏块模式决策树和运动矢量决策树的应用与等分辨率下相似,流程是一样的,只是在解码端的视频帧大小是原始大小,譬如704X576,提取每个宏块的解码信息;进入H.264编码端后,视频帧的大小变为原始的四分之一,即352X288。这时读取一帧中每个宏块的QP,根据QP大小选择决策树,获得宏块模式和运动矢量后,进入后续编码阶段。一帧一帧进行解码、编码,直到所有视频都转码完毕。
[0129](六)、高效自适应视频转码系统
[0130]下面,说明根据本发明的实施例的FFMPEG平台下高效自适应视频转码系统框架。
[0131]这部分实现的是将训练好并代码化的宏块模式策树和运动矢量决策树应用到实际转码技术中,实现自适应的快速转码,代替原始的全解全编技术。
[0132]高效自适应视频转码的实现依托于发展成熟的开源代码FFMPEG和libx264的联合开发。FFMPEG是一个开源的视频和音频流处理工具,它提供了录制、转换以及流化音视频的完整解决方案,还包含了非常先进的音频/视频编解码库libavcodec。FFMPEG框架十分完整,具有强大的解封装格式支持,使用FFMPEG作为系统基础可以将重心集中在视频转码部分而无需考虑解封装。
[0133]由图4可知,高效自适应视频转码系统的几个主要模块为:参数设置模块、标准解码/编码模块、输入视频信息提取模块、等分辨率/降分辨率的宏块快速决策模块、等分辨率/降分辨率的运动矢量快速决策模块。标准解码/编码模块实现按照FFMPEG和libx264的原始代码进行实现。启用快速转码模式时调用等分辨率/降分辨率的宏块模式快速决策模块直接决定宏块模式,后续的运动估计操作在选定宏块的基础上进行,在每个宏块上启动等分辨率/降分辨率运动矢量模块快速决定运动矢量。编码过程的其他步骤如率失真操作等保持原标准解码/编码模块实现方式不变。其他的各个模块具体的设计和实现如下。
[0134]1.参数设置模块
[0135]该模块用于接收命令进行参数设定。在实际的应用中,系统检测网络状况或终端处理能力返回信息,可根据该信息进行这些参数设定最终输出码流的比特率值、是否进行降分辨率处理等操作。由于本文涉及的是2倍降分辨率转码,所以要根据目标码流的分辨率大小来判断转码前后的视频是否为2倍降分辨率。
[0136]模块输入:对转码输出视频的要求,包括编码格式以及降分辨率要求;模块输出:设置对应参数。
[0137]2.信息提取模块
[0138]若快速模式处于开启状态,则需要进行快速转码的第一步,对输入视频的相关信息提取。需要进行提取的是输入序列残差子块的16个均值和16个方差、宏块模式、6位已编码宏块模式信息、运动矢量信息。对于宏块模式决策树,每个宏块对应39个特征;对于运动矢量决策树,每个宏块对应48个特征。该模块的实现在FFMPEG中对应的MPEG-2或H.263解码器中进行。
[0139]模块输入:原始视频巾贞信息;模块输出:各个宏块对应的39或48个特征。
[0140]3.宏块模式快速判决模块
[0141]若快速转码模式开启,则该模块在编码时会将信息提取模块获取的信息送至分层的决策树模型中直接获取当前宏块的模式决策结果,略过遍历选择最佳宏块模式的步骤。此外,根据转码是否进行2倍降分辨率操作会选择不同的决策树模型。等分辨率情况模块输入:宏块的39个信息特征;模块输出:该宏块所采用的模式。
[0142]降分辨率情况模块输入:对应的4个宏块的39X4个信息特征;模块输出:该降分辨率宏块所采用模式。
[0143]4.运动矢量快速判决模块
[0144]若快速转码模式开启,则该模块在编码时会对应到编码宏块模式中。对于一种宏块模式,将信息提取模块获取的信息送到水平方向运动矢量决策树模型中直接获取当前宏块的水平方向的运动矢量;同时将提取的信息送到垂直方向运动矢量决策树模型中直接获取当前宏块的垂直方向的运动矢量。得到判决后的运动矢量后,保存到编码端;也可以在2个整像素范围内进行运动搜索,最后得到更精确的运动矢量。然后编码器利用两个方向的运动矢量进行下一步编码。
[0145]在本模块中,仅对16X16、16X8、8X16、8X8的宏块模式进行运动矢量的快速判决,其他宏块模式采取大范围内的运动搜索的方法获得当前运动矢量。
[0146]等分辨率模块输入-水平方向:宏块的40个信息特征;模块输出:该宏块的水平方向的运动矢量。
[0147]等分辨率模块输入-垂直方向:宏块的40个信息特征;模块输出:该宏块的垂直方向的运动矢量。
[0148]降分辨率模块输入-水平方向:对应的4个宏块的40X4个信息特征;模块输出:该降分辨率宏块的水平方向的运动矢量。
[0149]降分辨率模块输入-垂直方向:对应的4个宏块的40X4个信息特征;模块输出:该降分辨率宏块的垂直方向的运动矢量。
[0150]综上所述,本领域的技术人员能够理解,对本发明的上述实施例能够做出各种修改、变型、以及替换,其均落入如所附权利要求限定的本发明的保护范围。
【权利要求】
1.一种基于数据挖掘的高效自适应的视频转码方法,包括以下步骤: 步骤1、输入第一压缩标准的待转码的视频; 步骤2、对所述待转码的视频进行解码,生成待编码的视频,并提取每个视频帧的每个宏块的解码信息; 步骤3、将所提取的解码信息输入到编码宏块模式决策树,通过编码宏块模式决策树来确定待编码的视频的每个视频帧的每个宏块将采用的编码宏块模式; 步骤4、根据所确定的编码宏块模式、以及每个宏块的运动矢量,对待编码的视频的每个视频帧的每个宏块进行第二压缩标准的编码,从而将待编码的视频编码为第二压缩标准的转码后的视频。
2.如权利要求1所述的视频转码方法,其中,所述第一压缩标准是MPEG-2或H.263压缩标准,所述第二压缩标准是H.264压缩标准,所述待编码的视频是YUV格式的视频,所述解码信息包括每个视频帧的每个宏块的残差信息、以及编码块模式信息。
3.如权利要求2所述的视频转码方法,其中,在所述步骤2中,还需要提取每个视频帧的每个宏块的运动矢量信息。
4.如权利要求3所述的视频转码方法,其中,所述运动矢量信息包括水平运动矢量信息和垂直运动矢量信息。
5.如权利要求4所述的视频转码方法,其中,所述编码宏块模式包括以下模式:Intra、16X16、16X8、8X16、8X8、8X4、4X8、4X4、skip,其中 16X 16、16X8、8X 16 构成第一大类,8\8、8父4、4\8、4父4构成第二大类。
6.如权利要求5所述的视频转码方法,其中,在所述步骤3之后,还包括以下步骤:` 步骤3-1、如果所确定的某个宏块将采用的编码宏块模式属于16X16、16X8、8X16和8X8中的一个,则将所提取的解码信息以及运动矢量信息输入到所述运动矢量决策树,通过所述运动矢量决策树来确定待编码的视频的每个视频帧的每个宏块的运动矢量; 步骤3-2、如果所确定的某个宏块将采用的编码宏块模式不属于16X16、16X8、8X16和8X8中的一个,则通过运动估计和运动搜索方式确定待编码的视频的每个视频帧的每个宏块的运动矢量。
7.如权利要求6所述的视频转码方法,其中,在所述步骤2中,还提取每个视频帧的每个宏块的量化参数, 并且,在所述步骤3中,如果所提取的量化参数的值为12~21,则所述编码宏块模式决策树是第一编码宏块模式决策树,如果所提取的量化参数的值为22~30,则所述编码宏块模式决策树是第二编码宏块模式决策树,如果所提取的量化参数的值为31~40,则所述编码宏块模式决策树是第三编码宏块模式决策树, 并且,其中,所述第一至第三编码宏块模式决策树分别对应于不同量化参数16、25、36。
8.如权利要求6或7所述的视频转码方法,在所述步骤3中,如果所提取的量化参数的值为12~21,则所述运动矢量决策树是第一水平运动矢量决策树和第一垂直运动矢量决策树,如果所提取的量化参数的值为22~30,则所述运动矢量决策树是第二水平运动矢量决策树和第二垂直运动矢量决策树,如果所提取的量化参数的值为31~40,则所述运动矢量决策树是第二水平运动矢量决策树和第二垂直运动矢量决策树, 并且,其中,所述第一至第三水平运动矢量决策树分别对应于不同量化参数16、25、36,所述第一至第三垂直运动矢量决策树分别对应于不同量化参数16、25、36。
9.如权利要求6所述的视频转码方法,其中,当待转码的视频的码率和通过预编码确定的转码后视频的码率的比值小于第一阈值时,所述编码宏块模式决策树是第一编码宏块模式决策树,当所述比值不小于第一个阈值且小于第二个阈值时,所述编码宏块模式决策树是第二编码宏块模式决策树,当所述比值不小于第三个阈值时,所述编码宏块模式决策树是第二编码宏块模式决策树, 并且,其中,所述第一至第三编码宏块模式决策树分别对应于不同量化参数16、25、36。
10.如权利要求6或7所述的视频转码方法,其中,在所述步骤3中,当待转码的视频的码率和通过预编码确定的转码后视频的码率的比值小于第一阈值时,所述运动矢量决策树是第一水平运动矢量决策树和第一垂直运动矢量决策树,当所述比值不小于第一个阈值且小于第二个阈值时,所述运动矢量决策树是第二水平运动矢量决策树和第二垂直运动矢量决策树,当所述比值不小于第三个阈值时,所述运动矢量决策树是第三水平运动矢量决策树和第三垂直运动矢量决策树, 并且,其中,所述第一至第三水平运动矢量决策树分别对应于不同量化参数16、25、36,所述第一至第三垂直运动矢量决策树分别对应于不同量化参数16、25、36。
11.如权利要求7所述的视频转码方法,其中,对于每个不同的量化参数,分别通过以下步骤生成对应的所述编码宏块模式决策树: 步骤11、对第一压缩标准的训练视频进行解码,生成待编码的训练视频,并提取每个视频帧的每个宏块的解码信息; 步骤12、固定量化参数,将待编码的训练视频编码为第二压缩标准的训练视频; 步骤13、将第二压缩标准的训练视频解码为待编码的训练视频,获得每个视频帧的每个宏块的编码宏块模式;` 步骤14、将每个视频帧的每个宏块的解码信息以及编码宏块模式输入到Weka机器学习工具中的J48分类器,产生与固定的量化参数对应的所述编码宏块模式决策树。
12.如权利要求11所述的视频转码方法,其中,所述步骤13包括: 步骤13-1、对第二压缩标准的训练视频进行第一次解码,获得每个视频帧的每个宏块的编码宏块模式属于Intra、Skip、第一大类、第二大类中的哪个的信息; 步骤13-2、对第二压缩标准的训练视频进行第二次解码,获得每个视频帧的每个宏块的编码宏块模式属于Intra、Skip、16 X 16、16 X 8、8 X 16、第二大类中的哪个的信息; 步骤13-3、对第二压缩标准的训练视频进行第三次解码,获得每个视频帧的每个宏块的编码宏块模式属于Intra、Skip、第一大类、8X8、8X4、4X8、4X4中的哪个的信息。
13.如权利要求12所述的视频转码方法,其中,所述步骤14包括: 步骤14-1、根据在所述步骤11和所述步骤13-1中获得的信息,生成所述编码宏块模式决策树的第一节点,其用来判定每个视频帧的每个宏块的编码宏块模式属于Intra、Skip、第一大类、第二大类中的哪个; 步骤14-2、根据在所述步骤11和所述步骤13-2中获得的信息,生成所述编码宏块模式决策树的第二节点,其用来在第一节点判定某个宏块的编码宏块模式属于第一大类的情况下,判定该宏块的编码宏块模式属于16X 16、16X8、8X 16中的哪个; 步骤14-3、根据在所述步骤11和所述步骤13-3中获得的信息,生成所述编码宏块模式决策树的第三节点,其用来在第一节点判定某个宏块的编码宏块模式属于第二大类的情况下,判定该宏块的编码宏块模式属于8X8、8X4、4X8、4X4中的哪个。
14.如权利要求11所述的视频转码方法,其中,对于三个不同的量化参数16、25和36,分别进行所述步骤12至14,分别生成所述第一至第三编码宏块模式决策树。
15.如权利要求8所述的视频转码方法,其中,所述运动矢量决策树是通过以下步骤而生成的: 步骤21、对第一压缩标准的训练视频进行解码,生成待编码的训练视频,并提取每个视频帧的每个宏块的解码信息、以及水平和垂直运动矢量信息; 步骤22、固定量化参数,将待编码的训练视频编码为第二压缩标准的训练视频; 步骤23、将第二压缩标准的训练视频解码为待编码的训练视频,获得每个视频帧的每个宏块的水平和垂直运动矢量信息; 步骤24、将每个视频帧的每个宏块的解码信息以及水平和垂直运动矢量信息输入到Weka机器学习工具中的Jrip分类器,产生所述水平和垂直运动矢量决策树。
16.如权利要求15所述的视频转码方法,其中,对于三个不同的量化参数16、25和36,分别进行所述步骤22至24,分别生成所述第一至第三水平和垂直运动矢量决策树。
17.如权利要求1所述的视频转码方法,其中,所述第一压缩标准的待转码的视频的宽度和高度方向的像素数目分别为所述第二压缩标准的视频的两倍。
18.一种用于进行根据权利要求1至17之一所述的视频转码方法的视频转码系统,包括以下部分: 参数设置模块,用来进行所述步骤1`,并根据待转码的视频和转码后的视频的属性来设置参数; 信息提取模块,用来进行所述步骤2, 宏块模式快速判决模块,用来进行所述步骤3, 运动矢量快速判决模块,用来进行所述步骤3-1、3-2 ; 标准编码模块,用来进行所述步骤4。
【文档编号】H04N19/176GK103888770SQ201410098019
【公开日】2014年6月25日 申请日期:2014年3月17日 优先权日:2014年3月17日
【发明者】庄伯金, 董海丰, 苏菲, 赵衍运, 赵志诚 申请人:北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1