使用高精度滤波器编码/解码视频的方法和设备与流程

文档序号：13216266阅读：176来源：国知局

本申请是申请号为201180054874.X、国际申请号为PCT/KR2011/007418、申请日为2011年10月6日、发明名称为“使用高精度滤波器编码/解码视频的方法和设备”的发明专利申请的分案申请。技术领域本公开在一些实施方式中涉及一种通过使用高精度滤波器编码/解码视频的方法和设备。更具体地，本公开涉及其中利用高精度滤波器生成预测信号并且使用该预测信号来生成高准确度视频信号的视频编码/解码方法和设备。

背景技术：
本部分中的描述仅提供了与本公开相关的背景信息，并且可以不构成现有技术。运动图片专家组(MPEG)和视频编码专家组(VCEG)已经超发了优越于现有的MPEG-4第2部分和H.263标准的视频压缩技术的新标准。新标准称为H.264/AVC(高级视频编码)并且同时作为MPEG-4第10部分和ITU-T建议H.264发布。H.264/AVC(下面，简单地称为H.264)通过使用各种编码方法显著地改进了图片质量和性能。另外，关于视频编码联合小组(MPEG和VCEG的联合组)正在讨论用于比高清(HD)更高图片质量的新标准。作为现有的运动图片编码方法，已经使用了帧内预测编码方法和帧间预测编码方法。帧内预测编码方法通过使用当前正在编码的帧内编码的块的预测值来预测块。帧间预测编码方法通过根据之前重构的帧来估计运动来预测当前帧的块。在用于亮度信号的帧内预测方法中，根据将被编码的块的大小和预测方法，已经使用了帧内4×4预测、帧内16×16预测和帧内8×8预测。图1是示出典型的九种4×4帧内预测模式的图。参考图1，帧内4×4预测包括九种预测模式：垂直模式、水平模式、直流(DC)模式、指向左下的对角线模式、指向右下的对角线模式、垂直偏右模式、水平偏下模式、垂直偏左模式和水平偏上模式。图2是示出典型的四种16×16帧内预测模式的图。参考图2，帧内16×16帧内预测包括四种预测模式：垂直模式、水平模式、DC模式和平面模式。与帧内16×16预测类似地，帧内8×8预测也包括四种预测模式。在用于具有4:2:0视频格式的视频的帧间预测方法(帧间预测编码)中，已经使用了运动补偿。具体地，视频帧被划分，并且通过从之前编码的帧估计运动来预测当前块。如果减小运动补偿的块大小以便于使用，则能够以更高的准确性来预测当前块。然而，编码用于每个块的运动向量信息的要求导致编码量的增加。另外，当执行运动补偿时，通过不仅关注具有整数像素的整数采样中的运动向量并且还关注具有与亮度分量相关的1/4采样分辨率和与色度分量相关的1/8采样分辨率的子采样来获得更准确的运动向量。然而，由于子采样位置的亮度和色度采样不存在于基准图片内，因此需要通过在基准图片中插值相邻的整数采样来生成这些值。

技术实现要素：
技术问题本公开的实施方式涉及通过在视频插值期间使用比线性插值准确度更高的高精度滤波器来改进视频压缩效率并且通过高效地重构视频来改进主观图片质量。解决问题的技术手段本发明的实施方式提供了一种视频编码/解码设备，其包括：视频编码器，将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块，通过从当前块的色度分量减去预测块来生成残余块，通过变换和量化残余块来生成量化频率变换块，以及将量化频率变换块编码到比特流中；以及视频解码器，用于从比特流生成量化频率变换块，通过对量化频率变换块进行逆量化和逆变换来重构残余块，将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块，以及通过将重构的残余块与生成的预测块相加来重构当前块的色度分量。本公开的另一实施方式提供了一种视频编码设备，其包括：预测单元，用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块；减法单元，用于通过从当前块的色度分量减去预测块生成残余块；变换单元，用于通过对残余块进行变换来生成频率变换块；量化单元，用于通过对频率变换块进行量化来生成量化频率变换块；以及编码单元，用于将量化频率变换块编码为比特流。本公开的又一实施方式提供了一种视频编码设备，其包括：预测单元，用于为了获得当前块的运动向量所参照的基准块的1/2子采样值，通过相邻的整数像素值适用滤波系数求出1/2采样放大值，并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块；减法单元，用于通过从当前块减去预测块来生成残余块；变换单元，用于通过对残余块进行变换来生成频率变换块；量化单元，用于通过对频率变换块进行量化来生成量化频率变换块；以及编码单元，用于将量化频率变换块编码到比特流中。本公开的又一实施方式提供了一种视频解码设备，其包括：解码单元，用于从比特流提取量化频率变换块；逆量化单元，用于通过对量化频率变换块进行逆量化来重构频率变换块；逆变换单元，用于通过对频率变换块进行逆变换来重构残余块；预测单元，用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块；以及加法单元，用于通过将重构残余块和预测块相加来重构当前块。本公开的又一实施方式提供了一种视频解码设备，其包括：解码单元，用于从比特流提取量化频率变换块；逆量化单元，用于通过对量化频率变换块进行逆量化来重构频率变换块；逆变换单元，用于通过对频率变换块进行逆变换来重构残余块；预测单元，用于为了获得当前块的运动向量所参照的基准块的1/2子采样值，通过相邻的整数像素值适用滤波系数求出1/2采样放大值，并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块；以及加法单元，用于通过将重构的残余块和预测块相加来重构当前块。本公开的又一实施方式提供了一种视频编码/解码方法，包括：执行视频编码处理，该视频编码处理用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块，通过从当前块的色度分量减去预测块来生成残余块，通过变换并量化残余块来生成量化频率变换块，以及将量化频率变换块编码到比特流中；以及执行视频解码处理，该视频解码处理用于从比特流生成量化频率变换块，通过对量化频率变换块进行逆量化和逆变换来重构残余块，将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块，以及通过将重构的残余块与生成的预测块相加来重构当前块。本公开的又一实施方式提供了一种视频编码方法，包括：执行预测处理，该预测处理用于通过对当前块的色度分量进行运动补偿来获得色度分量的运动向量，并且将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块；执行减法处理，该减法处理用于通过从当前块的色度分量减去预测块生成残余块；执行变换处理，该变换处理用于通过对残余块进行变换来生成频率变换块；执行量化处理，该量化处理用于通过对频率变换块进行量化来生成量化频率变换块；以及执行编码处理，该编码处理用于将量化频率变换块编码到比特流中。本公开的又一实施方式提供了一种视频编码方法，包括：执行预测处理，该预测处理用于为了获得当前块的运动向量所参照的基准块的1/2子采样值，通过相邻的整数像素值适用滤波系数求出1/2采样放大值，并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块；执行减法处理，该减法处理用于通过从当前块减去预测块来生成残余块；执行变换处理，该变换处理用于通过对残余块进行变换来生成频率变换块；执行量化处理，该量化处理用于通过对频率变换块进行量化来生成量化频率变换块；以及执行编码处理，该编码处理用于将量化频率变换块编码到比特流中。本公开的又一实施方式提供了一种视频解码方法，包括：执行解码处理，该解码处理用于从比特流生成量化频率变换块；执行逆量化处理，该逆量化处理用于通过对量化频率变换块进行逆量化来重构频率变换块；执行逆变换处理，该逆变换处理用于通过对频率变换块进行逆变换来重构残余块；执行预测处理，该预测处理用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块；以及执行加法处理，该加法处理用于通过将重构的残余块和预测块相加来重构当前块的色度分量。本公开的又一实施方式提供了一种视频解码方法，其包括：执行解码处理，该解码处理用于从比特流提取量化频率变换块；执行逆量化处理，该逆量化处理用于通过对量化频率变换块进行逆量化来重构频率变换块；执行逆变换处理，该逆变换处理用于通过对频率变换块进行逆变换来重构残余块；执行预测处理，该预测处理用于为了获得当前块的运动向量所参照的基准块的1/2子采样值，通过相邻的整数像素值适用滤波系数求出1/2采样放大值，并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块；以及执行加法处理，该加法处理用于通过将重构的残余块和预测块相加来重构当前块。本发明的技术效果根据如上所述的本公开，通过准确地插值将被编码的当前块减少了实际块与预测块之间的差，从而改进了编码效率。因此，能够通过改进当前块的压缩效率并且考虑编码方法来解码变换到比特流的块来高效地重构视频。附图说明图1是示出典型的九种4×4帧内预测模式的图；图2是示出典型的四种16×16帧内预测模式的图；图3是示出使用亮度分量中的典型的子采样的运动预测的图；图4示出了典型的6抽头有限脉冲响应(FIR)滤波器的示例；图5示出了典型的色度采样的线性插值的示例；图6是示意性地示出根据本公开的实施方式的视频编码设备的框图；图7是用于描述根据本公开的实施方式的利用预测单元插值块内的子采样值的处理的示例性图；图8是示意性地示出根据本公开的实施方式的视频解码设备的构造的框图；图9是用于描述根据本公开的实施方式的视频编码方法的流程图；以及图10是用于描述根据本公开的实施方式的视频解码方法的流程图。具体实施方式如下面所述的根据一个或多个实施方式的视频编码设备和视频解码设备可以是诸如个人计算机(PC)、笔记本计算机、个人数字助理(PDA)、便携式多媒体播放器(PMP)、便携式游戏机(PSP)或无线通信终端、智能电话等等的用户终端或者诸如应用程序服务器和业务服务器的服务器终端，并且表示配备有例如用于在各种装置或有线/无线通信网络之间执行通信的诸如调制解调器的通信装置、用于存储用于编码或解码视频或者执行用于编码或解码的帧间或帧内预测的各种程序以及相关数据的存储器以及用于执行这些程序以实现操作和控制的微处理器的各种设备。另外，由视频编码设备编码为比特流的视频可以在经由包括互联网、短距离无线或个人局域网络、无线LAN网络、WiBro(也称为WiMax)网络、移动通信网络或诸如电缆或通用串行总线(USB)的通信接口发送之后被实时地或者非实时地发送到用于对其进行解码的视频解码设备，在那里被重构并再现为视频。一般来说，运动图片可以由一系列的图片构成，各个图片被分为诸如帧或块的预定区域。当图片被分成块时，划分后的块可以根据编码方法被分类为帧内块(intrablock)或帧间块(interblock)。帧内块是指通过帧内预测编码方法进行编码的块，帧内预测编码是指下述方法，其通过在当前正在编码的当前像素内利用经过先前编码和解码重建的块的像素来预测当前块的像素，从而生成预测块，并对预测块相对于当前块的像素的差值进行编码。帧间块是指通过帧间预测编码进行编码的块，该帧间预测编码是指下述方法，其通过参照一个或多个过往图片或将来图片预测当前图片中的当前块来生成预测块，并对预测块与当前块的差值进行编码。用于对当前图片进行编码和解码而参照的帧称为基准帧。图3是示出使用亮度分量中的典型的子采样的运动预测的图。参考图3，运动向量能够被获得为最多到达整数采样单元中的1/4采样的子采样位置。图4示出了6抽头有限脉冲响应(FIR)滤波器的示例。参考图4，通过使用具有整数像素值的六个值以及六个滤波器系数{1，-5，20，20，-5，1

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋振翰;林晶娟;李英烈;文柱禧;金海光;全炳宇;韩钟基;金正弼;金旲衍;
技术所有人：SK电信有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。