一种视频编码的方法和编码器的制作方法

文档序号:7927848阅读:233来源:国知局
专利名称:一种视频编码的方法和编码器的制作方法
技术领域
本发明涉及视频处理技术,特别是涉及一种视频编码的方法和编码器。
背景技术
帧间预测编码是利用视频图像帧间的相关性,即时间相关性,来达到图像压縮的 目的,其广泛用于普通电视、会议电视、视频电话、高清晰度电视的压縮编码。采用帧间预测 编码不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧的对应像素x'之间的 差值,可以达到更高的数据压縮比。 具有运动补偿的帧间预测编码是视频压縮的关键技术之一,在实际实现时其经常 采用的运动估值方法是块匹配法。它将图像划分为许多子块,并认为子块内所有像素的位 移量是相同的,这意味着将每个子块视为一个"运动物体"。对于某一时间t,图像帧中的某 一子块如果在另一时间t-tl的帧中可以找到若干与其十分相似的子块,则称其中最为相 似的子块为匹配块,并认为该匹配块是时间t-tl的帧中相应子块位移的结果。位移矢量由 两帧中相应子块的坐标决定。 现有的视频编码方案,在做帧间预测时,一般都在参考帧中找到一个搜索区域,将 当前帧的宏块在该区域中进行运动搜索,找到最佳匹配位置。搜索区域的大小一般是固定 的,例如士32像素。按照这样的参数配置的编码器,在对图象中每个宏块做运动搜索时,从 参考帧中选取的搜索区域都是相同大小的。搜索区域越大,搜索时需要的计算量越大。据 估算,运动搜索的计算量,约占视频编码计算量的50 80%,因此如何降低搜索的计算复 杂度,已经成为优化视频编码性能的一个重要课题。 如图1所示,中心的MXN像素大小的矩形,表示当前帧中的一个宏块;外围的大矩 形表示在参考帧中对应的运动搜索区域,其尺寸为宽M+2Rx像素,高N+2Ry像素。运动搜索 一般是按SAD(Sum of Absolute Difference,残差绝对值求和)最小的准则寻找最佳匹配 位置。SAD的计算公式如下S4Z)(x,力=Z X! I A (附,")—厶一,(m + x," +力I 上式中,fk表示当前帧的宏块,fk-1表示参考帧中的搜索区域。 在视频监控领域,经常会遇到的场景是背景是静止的,只有前景一部分区域是运
动的,例如ATM自动取款机中安装的监控摄像机,画面中只有操作者是运动的。如何针对这
种普遍出现的应用情况,降低搜索的计算复杂度,优化视频编码的性能,是有待解决的一个
重要问题。

发明内容
本发明实施例的目的是提供一种视频编码的方法和编码器,能够优化视频编码的 性能,降低搜索的计算复杂度,解决现有技术不能根据实际需要对图像的不同区域进行区 别编码的技术问题。
3
为了实现上述目的,一方面,提供了一种视频编码的方法,包括 步骤一,将待编码的画面分为关注区域和背景区域; 步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配 第二编码资源,所述第一编码资源多于所述第二编码资源。 优选地,上述的方法中,所述步骤二具体包括在编码过程中,对所述关注区域的 宏块采用第一搜索精度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高 于所述第二搜索精度;和/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域 的宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。 优选地,上述的方法中,在所述步骤一之前,还包括预留编码器的配置接口,通过 所述配置接口修改所述关注区域和所述背景区域的范围,通过所述配置接口修改所述第一 搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。 优选地,上述的方法中,所述第一搜索精度为四分之一或二分之一像素,所述第二 搜索精度为整像素。 优选地,上述的方法中,所述第一搜索范围为士32像素,所述第二搜索范围为 士16像素。 本发明的另一个方面,提供一种视频编码的编码器,包括
划分单元,用于将待编码的画面分为关注区域和背景区域; 编码单元,用于在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所 述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或, 对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所 述第一搜索范围大于所述第二搜索范围。
优选地,上述的编码器中,还包括 配置接口,用于修改所述关注区域和所述背景区域的范围,修改所述第一搜索精 度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围 优选地,上述的编码器中,所述第一搜索精度为四分之一或二分之一像素,所述第 二搜索精度为整像素。 优选地,上述的编码器中,所述第一搜索范围为士32像素,所述第二搜索范围为 士16像素。 本发明实施例至少存在以下技术效果 1)对背景区域选用较差的搜索精度,可以大大节省编码器的插值、匹配等运算量, 降低功耗。 2)背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围。因为背景 区域一般都处于静止,出现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以 大大节省编码器的运算量,降低功耗。另外,这样得到的运动向量值会集中分布于以0为中 心的更小的范围,有利于节省熵编码后的码字长度。 3)采用本发明实施例的方法所编出来的视频码流,不需要修改解码器就可以顺利 解码。


图1为现有技术进行运动搜索的示意图; 图2为本发明实施例提供的方法的步骤流程图; 图3为本发明实施例提供的亚像素级运动搜索的示意图; 图4为本发明实施例提供的编码器的结构图。
具体实施例方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对具体实 施例进行详细描述。 图2为本发明实施例提供的方法的步骤流程图,如图所示,本发明实施例视频编 码的方法包括 步骤101,将待编码的画面分为关注区域和背景区域; 步骤102,在编码过程中,优先为所述关注区域分配资源(为所述关注区域分配第 一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资 源)。 其中步骤102可以具体包括两大部分。
第一部分 所述步骤102具体包括在编码过程中,对所述关注区域的宏块采用第一搜索精 度,对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度。
实际上,很多视频编码已经支持到亚像素级运动估计,例如mpeg4,有的甚至支持 到四分之一像素级的运动估计,例如H. 264。图3显示了亚像素级运动搜索图3中,*号表 示整像素级的点,即参考图象中原始的点;#号表示亚像素级的点,即通过原始像点插值得 到的点。运动搜索不仅在整像素级的点上进行匹配,也同样会在亚像素级的点上进行匹配, 找到更佳的运动向量。 亚像素点的插值方法,依不同的视频编码标准而有不同,表1为亚像素点的插值
表,典型的插值过程如下 表l
女A#b女B
#a#e#d
女C#c女D
a = M + C + l)/2; 6, + 5 + l)/2; c = (C + Z) + l)/2; cT=(5 + D + l)/2; e = (J + 5 + C + D + 2)/4;
,其中,大写字母表示整像素级的点,小写字母表示亚像
素级的点。对于四分之一精度的插值,计算过程更为复杂,线性滤波器的阶数也更高c
5
本发明在背景区域进行视频编码时,帧间运动估计选用较差的搜索精度。对感兴 趣的关注区域进行视频编码时,选用较高的搜索精度。背景区域选用较差的搜索精度,可以 大大节省编码器的插值、匹配等运算量,降低功耗。另外,采用这种方案编出来的视频码流, 不需要修改解码器就可以顺利解码。
第二部分 步骤102可以包括所述关注区域的宏块采用第一搜索范围,对所述背景区域的
宏块采用第二搜索范围,所述第一搜索范围大于所述第二搜索范围。这是因为 背景区域因为各种噪声的干扰,按SAD最小的准则找到的"最佳"匹配位置,已经
不能反映场景中实际景物的运动情况。例如,在监控画面中,虽然背景中没有任何运动目
标,但各个宏块在做运动搜索时却仍然得到了非零的运动向量。这些运动向量仍然需要进
行熵编码,占用编码后的码字,从而增大视频编码文件的大小,或增加视频传输的码率。 本发明在背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围,感
兴趣的关注区域进行视频编码时,选用较大的搜索范围。因为背景区域一般都处于静止,出
现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以大大节省编码器的运算
量,降低功耗。另外,这样得到的运动向量值会集中分布于以O为中心的更小的范围,有利
于节省熵编码后的码字长度。
此外,在所述步骤101之前,还包括 预留编码器的配置接口,通过所述配置接口修改所述关注区域和所述背景区域的 范围,通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和 所述第二搜索范围。所述第一搜索精度可选择为四分之一或二分之一像素,所述第二搜索 精度为整像素。所述第一搜索范围可选择为士32像素,所述第二搜索范围为士16像素。
图4为本发明实施例提供的编码器的结构图。对应以上方法,本发明实施例还提 供的视频编码的编码器如图4所示,包括 划分单元201,用于将待编码的画面分为关注区域和背景区域; 编码单元202,用于在编码过程中,对所述关注区域的宏块采用第一搜索精度,
对所述背景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和
/或,对所述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范
围,所述第一搜索范围大于所述第二搜索范围。
还包括配置接口单元203,用于修改所述关注区域和所述背景区域的范围,修
改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围 因此,配置接口允许管理员对编码器进行相应的设置,包括感兴趣区域(关注区
域),背景区域的定义,感兴趣区域运动搜索精度和搜索范围的设定,背景区域运动搜索精
度和搜索范围的设定,等等。 在编码器中,对一个宏块进行帧间预测时,先查找该宏块所属的区域类型,并根据 该区域所设定的运动搜索精度,进行运动搜索的计算。例如,在某个实施例中,对感兴趣区 域进行四分之一像素精度的运动搜索,而对背景区域则只进行整像素精度的运动搜索。
在编码器中,对一个宏块进行帧间预测时,可查找该宏块所属的区域类型,并根据 该区域所设定的运动搜索范围的值,到参考帧中取出相应的搜索区域进行计算。
由上可知,本发明实施例至少存在以下优势
1)对背景区域选用较差的搜索精度,可以大大节省编码器的插值、匹配等运算量, 降低功耗。 2)背景区域进行视频编码时,对于帧间运动估计选用较小的搜索范围。因为背景 区域一般都处于静止,出现运动目标的概率较小,对这样的区域选用较小的搜索范围,可以 大大节省编码器的运算量,降低功耗。另外,这样得到的运动向量值会集中分布于以0为中 心的更小的范围,有利于节省熵编码后的码字长度。 3)采用本发明实施例的方法所编出来的视频码流,不需要修改解码器就可以顺利 解码。 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。
权利要求
一种视频编码的方法,其特征在于,包括步骤一,将待编码的画面分为关注区域和背景区域;步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源。
2. 根据权利要求1所述的方法,其特征在于,所述步骤二具体包括在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背景区域的宏块采 用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所述关注区域的宏 块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第一搜索范围大于 所述第二搜索范围。
3. 根据权利要求2所述的方法,其特征在于,在所述步骤一之前,还包括 预留编码器的配置接口,通过所述配置接口修改所述关注区域和所述背景区域的范围,通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所 述第二搜索范围。
4. 根据权利要求2所述的方法,其特征在于,所述第一搜索精度为四分之一或二分之 一像素,所述第二搜索精度为整像素。
5. 根据权利要求2所述的方法,其特征在于,所述第一搜索范围为士32像素,所述第二 搜索范围为士16像素。
6. —种视频编码的编码器,其特征在于,包括 划分单元,用于将待编码的画面分为关注区域和背景区域;编码单元,用于在编码过程中,对所述关注区域的宏块采用第一搜索精度,对所述背 景区域的宏块采用第二搜索精度,所述第一搜索精度高于所述第二搜索精度;和/或,对所 述关注区域的宏块采用第一搜索范围,对所述背景区域的宏块采用第二搜索范围,所述第 一搜索范围大于所述第二搜索范围。
7. 根据权利要求6所述的编码器,其特征在于,还包括配置接口,用于修改所述关注区域和所述背景区域的范围,修改所述第一搜索精度、 所述第二搜索精度、所述第一搜索范围和所述第二搜索范围
8. 根据权利要求6所述的编码器,其特征在于,所述第一搜索精度为四分之一或二分之一像素,所述第二搜索精度为整像素。
9. 根据权利要求6所述的编码器,其特征在于,所述第一搜索范围为士32像素,所述第 二搜索范围为士16像素。
全文摘要
本发明提供一种视频编码的方法和编码器,方法包括步骤一,将待编码的画面分为关注区域和背景区域;步骤二,在编码过程中,为所述关注区域分配第一编码资源,为所述背景区域分配第二编码资源,所述第一编码资源多于所述第二编码资源。本发明能够优化视频编码的性能,降低搜索的计算复杂度,解决现有技术不能根据实际需要对图像的不同区域进行区别编码的技术问题。
文档编号H04N7/32GK101742325SQ20081022646
公开日2010年6月16日 申请日期2008年11月11日 优先权日2008年11月11日
发明者王浩 申请人:北京中星微电子有限公司;中星电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1