根据视频编码的采样点自适应偏移(sao)的制作方法

文档序号:7552292阅读:163来源:国知局
专利名称:根据视频编码的采样点自适应偏移(sao)的制作方法
技术领域
本发明总体涉及数字视频处理;更具体地,涉及根据该数字视频处理的处理及操作。
背景技术
操作用于传输数字媒体(例如,图像、视频、数据等)的通信系统已经持续开发了多年。对这种采用某种形式的视频数据的通信系统而言,以一定的帧速率(例如,每秒帧数)输出或显示多个数字图像以实现适用于输出和消费的视频信号。在利用视频数据进行操作的多个这样的通信系统中,在吞吐量(例如,可以从第一位置传输至第二位置的图像帧的数量)与最终要被输出或显示的信号的视频和/或图像质量之间存在着折中。当前技术无法充分地或可接受地提供以下手段:即,其可以根据提供充足的或可接受的视频和/或图像质量将视频数据从第一位置传输至第二位置,从而保证与通信相关联的相对少量的开销,以及各个通信链路端的通信设备的相对较低的复杂度等
发明内容
(I) 一种装置,包括:至少一个输入端,用于:从至少一个额外装置接收视频信号;以及经由信令从所述至少一个额外装置接收多个频带偏移;以及处理器,用于:分析与至少一个最大编码单元(LCU)相关的多个像素以识别像素值分布,其中,所述最大编码单元与所述视频信号相关;基于所述像素值分布推理地识别多个频带指数;根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频带指数;对所述视频信号或基于所述视频信号的信号执行采样点自适应偏移(SA0)滤波处理以生成第一滤波信号,其中,所述采样点自适应偏移滤波处理将所述多个频带偏移应用到所述多个频带指数;以及对所述第一滤波信号执行去块滤波处理以生成第二滤波信号。( 2 )根据(I)所述的装置,其中,所述处理器用于:
分析与至少一个最大编码单元相关联的多个像素以生成表示所述像素值分布的像素值直方图,其中,所述最大编码单元与所述视频信号相关;以及基于所述像素值直方图,识别要被应用所述多个频带偏移的所述多个频带指数。(3)根据(I)所述的装置,其中:所述多个频带指数具有不连续分布,使得所述多个频带指数中的至少两个连续的频带指数彼此分离至少一个频带指数值。(4)根据(I)所述的装置,其中:所述 像素值分布指示分别与所述多个频带指数中的至少一部分相关的所述多个像素的多个子集;以及要被应用所述多个频带偏移的所述多个频带指数对应于所述多个像素的多个子集中的至少一个子集,其中,该至少一个子集与所述多个像素的多个子集中的其他子集相比具有相对较大或最大数量的像素。(5)根据(I)所述的装置,其中:所述装置是在卫星通信系统、无线通信系统、有线通信系统、光纤通信系统及移动通信系统中的至少一个中操作的通信设备。(6) —种装置,包括:输入端,用于从至少一个额外装置接收视频信号及多个频带偏移;以及处理器,用于:分析与至少一个最大编码单元(IXU)相关的多个像素以识别用于识别多个频带指数的像素值分布,所述最大编码单元与所述视频信号相关;以及根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频带指数。(7)根据(6)所述的装置,其中,所述处理器用于: 对所述视频信号或基于所述视频信号的信号执行采样点自适应偏移(SA0)滤波处理以生成第一滤波信号,其中,所述采样点自适应偏移滤波处理将所述多个频带偏移应用到所述多个频带指数;以及对所述第一滤波信号执行去块滤波处理以生成第二滤波信号。(8)根据(6)所述的装置,其中,所述处理器用于:分析与至少一个最大编码单元相关的多个像素以生成表示所述像素值分布的像素值直方图,其中,所述最大编码单元与所述视频信号相关;以及基于所述像素值直方图,识别要被应用所述多个频带偏移的多个频带指数。(9)根据(6)所述的装置,其中:所述多个频带指数具有不连续分布,使得所述多个频带指数中的至少两个连续的频带指数彼此分离至少一个频带指数值。(10)根据(6)所述的装置,其中:所述像素值分布指示分别与所述多个频带指数中的至少一部分相关的所述多个像素的多个子集;以及要被应用所述多个频带偏移的所述多个频带指数对应于所述多个像素的多个子集中的至少一个子集,其中,该至少一个子集与所述多个像素的多个子集中的其他子集相比具有相对较大或最大数量的像素。(11)根据(6)所述的装置,其中:所述多个频带偏移由所述装置经由信令从所述至少一个额外装置接收;以及所述处理器用于基于所述像素值分布推理地识别所述多个频带指数。(12)根据(6)所述的装置,其中:所述装置是包括视频解码器的接收器通信设备;所述至少一个额外装置是包括视频编码器的发射器通信设备;以及所述接收器通信设备及所述发射器通信设备经由至少一个通信信道连接或通信地耦接。(13)根据(6)所述的装置,其中:所述装置是在卫星通信系统、无线通信系统、有线通信系统、光纤通信系统及移动通信系统中的至少一个中操作的通信设备。( 14) 一种通信设备的操作方法,所述方法包括:经由所述通信设备的输入端,从至少一个额外通信设备接收视频信号及多个频带偏移;分析与至少一个最大编码单元(IXU)相关的多个像素以识别用于识别多个频带指数的像素值分布,其中,所述最大编码单元与所述视频信号相关;以及根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频带指数。(15)根据(14)所述的方法,进一步包括:对所述视频信号或基于所述视频信号的信号执行采样点自适应偏移(SAO)滤波处理以生成第一滤波信号,其中,所述采样点自适应偏移滤波处理包括将所述多个频带偏移应用到所述多个频带指数;以及对所述第一滤波信号执行去块滤波处理以生成第二滤波信号。( 16)根据(14)所述的方法,进一步包括:分析与所述至少一个最大编码单元相关的多个像素以生成表示所述像素值分布的像素值直方图,其中,所述最大编码单元与所述视频信号相关;以及基于所述像素值直方图,识别要被应用所述多个频带偏移的多个频带指数。(17)根据(14)所述的方法,其中:所述多个频带指数具有不连续分布,使得所述多个频带指数中的至少两个连续的频带指数彼此分离 至少一个频带指数值。(18)根据(14)所述的方法,其中:所述像素值分布指示分别与所述多个频带指数中的至少一部分相关的所述多个像素的多个子集;以及要被应用所述多个频带偏移的所述多个频带指数对应于所述多个像素的多个子集中的至少一个子集,其中,该至少一个子集与所述多个像素的多个子集中的其他子集相比具有相对较大或最大数量的像素。(19)根据(14)所述的方法,进一步包括:经由信令从所述至少一个额外通信设备接收所述多个频带偏移;以及
基于所述像素值分布推理地识别所述多个频带指数。(20)根据(14)所述的方法,其中:所述通信设备在卫星通信系统、无线通信系统、有线通信系统、光纤通信系统及移动通信系统中的至少一个中操作。


图1和图2示出了通信系统的各个实施方式。图3A示出了计算机的实施方式。图3B示出了笔记本电脑的实施方式。图3C示出了高清(HD)电视的实施方式。图3D示出了标准清晰度(SD)电视的实施方式。图3E示出了手持媒体单元的实施方式。图3F示出了机顶盒(STB)的实施方式。图3G示出了数字视频光盘(DVD)播放器的实施方式。图3H示出了通用数字图像和/或视频处理设备的实施方式。图4、图5和图6是示出了视频编码架构的各个实施方式的示图。
·
图7是示出了帧内预测处理的实施方式的示图。图8是示出了帧间预测处理的实施方式的示图。图9和图10是示出了视频解码架构的各个实施方式的示图。图11示出了频带偏移采样点自适应偏移(SAO)滤波处理的实施方式。图12示出了视频编码架构的可替换实施方式。图12示出了 slicer头语法的实施方式。图13示出了采样点自适应偏移(SAO)频带偏移模式下的传输频带偏移的指示(自适应和/或显式信令)的各个实施方式。图14示出了 SAO频带偏移模式下的频带粒度的指示(自适应和/或显式信令)的各个实施方式。图15示出了隐式频带指数信令的实施方式。图16示出了隐式频带指数信令的可替换实施方式。图17示出了频带偏移编码的实施方式。图18及图19示出了用于操作一个或多个设备(例如,通信设备、接收器和/或解码器设备、发射器和/或编码器设备等)的方法的各个实施方式。
具体实施例方式在使用数字媒体(诸如数字视频)的多个设备中,利用像素表示各个图像(其本质为数字的)。在某些通信系统中,数字媒体可以从第一位置传输至可以输出或显示这种媒体的第二位置。数字通信系统(包括操作用于通信数字视频的通信系统)的目的在于无误差地或以可接受的低误码率将数字数据从一个位置或子系统传输至另一个位置。如图1所示,数据可以通过在各种通信系统中的各个通信信道上进行传输:磁性媒介、有线、无线、光纤、铜和/或其他类型的媒介。
图1和图2分别示出了通信系统100和200的各个实施方式。参照图1,通信系统100的实施方式是通信信道199,该通信信道将位于通信信道199 一端的通信设备110 (包括具有编码器114的发射器112并包括具有解码器118的接收器116)通信地耦接至位于通信信道199另一端的另一个通信设备120 (包括具有编码器128的发射器126并包括具有解码器124的接收器122)。在某些实施方式中,通信设备110和120之一可能仅包括发射器或接收器。存在通信信道199可以通过其实现的几种不同类型的媒介(例如,使用碟形卫星天线132和134的卫星通信信道130、使用塔142和144和/或本地天线152和154的无线通信信道140、有线通信信道150和/或使用电光(E/0)接口 162和光电(0/E)接口 164的光纤通信信道160)。另外,可以实现不止一种类型的媒介,并可以接口在一起,从而形成通信信道199。要注意的是,在不背离本发明的范围和精神的情况下,这样的通信设备110和/或120可以是静止设备或移动设备。例如,通信设备110和120之一或两者可以在固定位置实现或可以是具有与多于一个的网络接入点(例如,在包括一个或多个无线局域网(WLAN)的移动通信系统环境中的各自不同的接入点(AP)、在包括一个或多个卫星的移动通信系统环境中的各自不同的卫星或通常在包括一个或多个网络接入点的移动通信系统环境中的各自不同的网络接入点,可以通过这些网络节点利用通信设备110和/或120来实现通信)相关联和/或进行通信的能力的移动通信设备。通常采用误差校正和信道编码方案来降低通信系统中不可避免所遭受的传输误差。一般情况下,这些误差校正和信道编码方案涉及在通信信道199的发射器端使用编码器以及在通信信道199的接收器端使用解码器。在任何这样的所需通信系统(例如,包括针对图1描述的那些变形例)、任何信息存储设备(例如,硬盘驱动器(HDD)、网络信息存储设备和/或服务器等)或需要对信息进行编码和/或解码的任何应用中,可 以采用所描述的任何多种类型的ECC代码。一般来说,当考虑视频数据从一个位置或子系统传输至另一个位置的通信系统时,一般可以认为视频数据编码在通信信道199的传输端进行,一般可以认为视频数据解码在通信信道199的接收端进行。同样地,尽管该示图的实施方式示出了通信设备110和120之间能够双向通信,当然要注意的是,在某些实施方式中,通信设备110可能只包括视频数据编码功能,通信设备120可能只包括视频数据解码功能,反之亦然(例如,根据视频广播实施方式的单向实施方式)。参照图2的通信系统200,在通信信道299的发射端,向发射器297提供信息位201 (例如,尤其对应于一个实施方式中的视频数据),该发射器可操作用于利用编码器和符号映射器220 (可以分别视为独立功能块222和224)进行这些信息位201的解码,从而生成一系列离散值调制符号203,将这一系列离散值调制符号提供给发射驱动器230,该发射驱动器使用数模转换器(DAC) 232来生成连续时间传输信号204并利用发射滤波器234来生成大致与通信信道299相称的经过滤的连续时间传输信号205。在通信信道299的接收端,将连续时间接收信号206提供给模拟前端(AFE) 260,该模拟前端包括接收滤波器262(其生成经过滤的连续时间接收信号207)以及模数转换器(ADC)264 (其生成离散时间接收信号208)。度量生成器270计算解码器280用来对离散值调制符号和其中210编码的信息位进行最佳估算的度量值209 (例如,基于符号和/或位)。在发射器297和接收器298的每一个中,可以实现将各个组件、块、功能块、电路等任何所需的集成在其中。例如,该图示出处理模块280a包括编码器和符号映射器220以及其中所有相关联的对应部件,示出处理模块280包括度量生成器270和解码器280以及其中所有相关联的对应部件。这样的处理模块280a和280b可以是相应的集成电路。当然,在不背离本发明的范围和精神的情况下,可以可替换地进行其他边界和分组。例如,第一处理模块或集成电路中可以包括发射器297中的所有部件,第二处理模块或集成电路中可以包括接收器298中的所有部件。可替换地,在其他实施方式中可以任意组合发射器297和接收器298的每一个中的部件。与前述实施方式一样,这样的通信系统200可以用于视频数据从一个位置或子系统传输至另一个位置(例如,经由通信信道299从发射器297至接收器298)的通信。可以由以下图3A至图3H所示的各个设备中的任何一个来实现数字图像和/或数字图像和/或媒体(包括数字视频信号中的各个图像)的视频处理,从而允许用户观看这种数字图像和/或视频。这些多种设备并不包括穷尽的设备清单,其中可以实现本文描述的图像和/或视频处理,要注意的是,在不背离本发明的范围和精神的情况下,可以实现任何通用数字图像和/或视频处理设备以便进行本文所述的处理。图3A示出了计算机301的实施方式。该计算机301可以是台式计算机,或主机的企业存储设备(诸如服务器),其附接至存储阵列(诸如独立磁盘冗余阵列(RAID)、存储路由器、边缘路由器、存储交换机和/或存储导向器)。用户能够利用计算机301来查看静态数字图像和/或视频(例如一系列数字图像)。计算机301上时常包括多种图像和/或视频观看程序和/或媒体播放器程序以允许用户观看这种图像(包括视频)。图3B示出了笔记本电脑302的实施方式。在多种情形中的任何一种情形下可以发现并使用这样的笔记本电脑302。近年,随着笔记本电脑的处理能力和功能的不断增长,在先前使用高端且更有能力的台式计算机的许多情况下采样这种笔记本电脑。与计算机301一样,笔记本电脑302可以包括各`个图像观看程序和/或媒体播放器程序以便允许用户观看这种图像(包括视频)。图3C示出了高清(HD)电视303的实施方式。许多HD电视303包括允许在其上接收、处理并解码媒体内容(例如电视广播信号)的集成调谐器。可替换地,有时,HD电视303从另一个接收、处理并解码电缆和/或卫星电视广播信号的源(诸如数字视频光盘(DVD)播放器、机顶盒(STB))接收媒体内容。不管特定实现方式如何,HD电视303可以被实现来进行如本文所描述的图像和/或视频处理。一般来说,HD电视303具有显示HD媒体内容的能力并时常被实现为具有16:9宽屏的纵横比。图3D示出了标准清晰度(SD)电视304的实施方式。当然,SD电视304在某种程度上类似于HD电视303,至少一个不同之处在于SD电视304不包括显示HD媒体内容的能力,且SD电视304时常被实现为具有4:3的全屏纵横比。尽管如此,甚至是SD电视304也可以被实现来进行如本文所描述的图像和/或视频处理。图3E示出了手持媒体单元305的实施方式。手持媒体单元305可以操作用于对供用户回放的图像/视频内容信息(诸如联合图像专家组(JPEG)文件、标记图像文件格式(TIFF)、位图、运动图像专家组(MPEG)文件、Windows Media (WMA/WMV)文件、诸如MPEG4文件等的其他类型的视频文件)和/或可以以数字格式存储的其他类型信息进行通用存储或存储。从历史观点上说,这样的手持媒体单元主要用于存储并回放音频媒体;然而,这样的手持媒体单元305可以用于存储并回放任何虚拟媒体(例如,音频媒体、视频媒体、图像媒体等)。而且,这样的手持媒体单元305还可以包括其他功能,诸如用于有线和无线通信的集成通信电路。这样的手持媒体单元305可以被实现来进行如本文所描述的图像和/或视频处理。图3F示出了机顶盒(STB)306的实施方式。如上所述,STB306有时可以被实现来接收、处理并解码要提供给任何合适的显示可用设备(诸如SD电视304和/或HD电视303)的电缆和/或卫星电视广播信号。这样的STB306可以独立地或协同地与显示可用设备一起操作以便进行如本文所描述的图像和/或视频处理。图3G示出了数字视频光盘(DVD)播放器307的实施方式。在不背离本发明的范围和精神的情况下,这样的DVD播放器可以是蓝光DVD播放机、HD可用DVD播放器、SD可用DVD播放器、上采样可用DVD播放器(例如从SD至HD等)。DVD播放器可以向任何合适的显示可用设备(诸如SD电视304和/或HD电视303)提供信号。DVD播放器305可以被实现来进行如本文所描述的图像和/或视频处理。图3H示出了通用数字图像和/或视频处理设备308的实施方式。另外,如上所述,上述这些各种设备不包括可以实现本文描述的图像和/或视频处理的穷尽的设备清单,要注意的是,在不背离本发明的范围和精神的情况下,可以实现任何通用数字图像和/或视频处理设备308以便进行本文所述的图像和/或视频处理。图4、图5和图6分别是示出了视频编码架构的各个实施方式400、500和600的示 图。参照图4的实施方式400,针对该图可以看出,由视频编码器接收输入视频信号。在某些实施方式中,输入视频信号由编码单元(CU)或宏块(MB)构成。这种编码单元或宏块的大小可变并可以包括通常以正方形布置的多个像素。在一个实施方式中,这种编码单元或宏块的大小为16X16像素。然而,通常要注意的是,宏块可以具有任何所需的大小,诸如NXN像素,其中N为整数(例如,16X 16、8X8或4X4)。当然,虽然优选实施方式中采用了方形编码单元或宏块,但某些实现方式可以包括非方形编码单元或宏块。输入视频信号通常可以被称为对应于原始帧(或图片)图像数据。例如,原始帧(或图片)图像数据可以经历处理以生成亮度和色度样本。在某些实施方式中,宏块中的亮度样本组是一个特定布置(例如16X16),色度样本组是不同的特定布置(例如8X8)。根据本文所描述的实施方式,视频编码器以逐块为单位对这些样本进行处理。输入视频信号然后经历模式选择,输入视频信号按照该模式选择性地经历帧内和/或帧间预测处理。一般来说,输入视频信号沿压缩通路经历压缩。当无反馈地进行操作时(例如,不根据帧间预测,也不根据帧内预测)输入视频信号经由压缩通路提供从而经历变换操作(例如,根据离散余弦变换(DCT))。当然,在可替换实施方式中可以采用其他变换。在这种操作模式下,输入视频信号本身就是所压缩的信号。压缩通路可以利用人眼缺乏高频率灵敏度来进行压缩。然而,通过选择性地使用帧内或帧间预测视频编码,可以沿压缩通路进行反馈。根据反馈或预测操作模式,压缩通路对从当前宏块减去当前宏块预测值而产生的(相对较低能量)冗余(例如差值)进行操作。根据在指定实例中采用哪种预测形式,生成当前宏块和至少基于相同帧(或图片)的一部分或至少基于至少一个其他帧(或图片)的一部分的宏块预测值之间的冗余或差值。由此产生的修改的视频信号然后沿压缩通路经历变换操作。在一个实施方式中,离散余弦变换(DCT)对一组视频样本(例如,亮度、色度、冗余等)进行操作以计算预定数量的基模式中的每一个的系数值。例如,一个实施方式包括64个基函数(例如,对8 X 8样本而言)。一般来说,不同实施方式可以采用不同数量的基函数(例如,不同变换)。这些各个基函数(包括合适的且选择性加权的基函数)的任意组合可以用于表示给定的一组视频样本。与进行变换操作的各个方式相关的额外详情在与包括通过引用并入的如上所述的那些标准/草案标准的视频编码相关联的技术文献中进行描述。变换处理的输出包括各自的系数值。将该输出提供给量化器。一般情况下,大多数图像块通常会产生系数(例如,根据离散余弦变换(DCT)操作的实施方式中的DCT系数),使得大多数相关DCT系数的频率较低。由于这个原因以及人眼对高频视觉效果的灵敏度相对较差,量化器可以操作用于将大部分不大相关的系数转换为零值。也就是说,可以根据量化处理来消除相对贡献率低于某个预定值(例如某个阈值)的那些系数。量化器还可以操作用于将重要系数转换为比变化处理产生的值可以更加有效地进行编码的值。例如,量化处理可以通过将每个相应系数除以整数值并丢弃任意余数来进行操作。当对典型的编码单元或宏块进行操作时,这个处理通常会产生相对少量的非零系数,这些非零系数然后被传输至熵编码器进行无损编码并且供根据可以根据视频编码选择帧内和/或帧间预测处理的反馈路径来使用。熵编码器根据无损压缩编码处理进行操作。相比之下,量化操作通常是有损失的。熵编码处理对量化处理提供的系数进行操作。那些系数可以表示各个特征(例如,亮度、色度、冗余等)。熵编·码器可以采用各种类型的编码。例如,熵编码器可以进行上下文自适应
二进制算术编码(CABAC)和/或上下文自适应可变长编码(CAVLC)。例如,根据熵编码方案的至少一部分,将数据转换为(运行、级别)配对(run-level paring)(例如,将数据14,3,0,4,0,0,-3转换为各个(运行、级别)对(0,14),(0,3),(1,4),(2,-3))。事先,编制将可变长度编码分配至值对的表,以便将相对较短长度编码分配给相对常见的值对,并将相对较长长度编码分配给相对少见的值对。如读者理解的一样,逆量化和逆变换的操作分别对应于量化及变换的操作。例如,在DCT用于变换操作的实施方式中,逆DCT (IDCT)是逆变换操作中所采用的变换。图片缓冲器(或者称为数字图片缓冲器或DPB)从IDCT模块接收信号;图片缓冲器操作用于存储当前帧(或图片)和/或一个或多个其他帧(或图片),诸如作为根据视频编码所进行的帧内预测和/或帧间预测操作使用的帧(或图片)。要注意的是,根据帧内预测,相对少量的存储就足够了,因为也许没有必要存储帧(或图片)序列中的当前帧(或图片)或任何其他帧(或图片)。在根据视频编码进行帧间预测的时候,所存储的信息可以用来进行运动补偿和/或运动估计。在一个可能的实施方式中,对于运动估计,将来自当前帧(或图片)的相应的亮度样本组(例如,16X 16)与帧(或图片)序列(例如根据帧间预测)中其他帧(或图片)中的各个缓冲配对物进行比较。在一个可能的实现方式中,定位最匹配区域(例如预测参考)并产生矢量偏移(例如运动矢量)。在单个帧(或图片)中,可以找到多个运动矢量,但不是所有的运动矢量都必须指向相同的方向。根据运动估计进行的一种或多种操作操作地用于生成一个或多个运动矢量。运动补偿操作地采用可以根据运动估计生成的一个或多个运动矢量。识别并交付样本的预测参考组以便从原始输入视频信号中扣除,试图希望产生相对(例如,理想的、多个)较低的能量冗余。如果此类操作未导致产生较低的能量冗余,就不必进行运动补偿,变换操作可以仅对原始输入视频信号进行操作,而不对冗余进行操作(例如,根据将输入视频信号直接提供给变换操作,以便不进行帧内预测,也不进行帧间预测的操作模式),或可以使用帧内预测并对帧内预测产生的冗余进行变换操作。同样地,如果运动估计和/或运动补偿操作成功,运动矢量还可以与相应的冗余系数一起发送至熵编码器,用于进行无损熵编码。来自整个视频编码操作的输出是输出位流。要注意的是,输出位流当然可以根据生成连续时间信号(该连续时间信号可以经由通信信道传输)来进行一定处理。例如,某些实施方式在无线通信系统中操作。在这种情况下,输出位流可以在用于生成能够经由通信信道传输的连续时间信号等的无线通信设备中进行适当的数模转换、频率变换、缩放、过滤、调制、符号映射和/或任何其他操作。参照图5的实施方式500,针对该图可以看出,输入视频信号由视频编码器接收。在某些实施方式中,输入视频信号由编码单元或宏块构成(和/或可以划分为编码单元(⑶))。编码单元或宏块的大小可以改变并可以包括通常设置成正方形的多个像素。在一个实施方式中,编码单元或宏块的大小为16X16像素。然而,通常要注意的是,宏块可以具有任何所需的大小,诸如NXN像素,其中N为整数。当然,虽然优选实施方式中采用了方形编码单元或宏块,但某些实现方式可以包括非方形编码单元或宏块。输入视频信号通常可以被称为对应于原始帧(或图片)图像数据。例如,原始帧(或图片)图像数据可以进行处理以生成亮度和色度样本。在某些实施方式中,宏块中的亮度样本组是一个特定布置(例如16X16),色度样本组是不同的特定布置(例如8X8)。根据本文所描述的实施方式,视频编码器以逐块为单位对这些样本进行处理。输入视频信号然后进行模式选择,输入视频信号按照该模式可选择性地进行帧内和/或帧间预测处理。一般来说,输入视频信号沿压缩通路进行压缩。当无反馈地进行操作时(例如,不根据帧间预测,也不根据帧内预测),输入视频信号经由压缩通路提供来进行变换操作(例如,根据离散余弦变换(DCT))。当然,在可替换实施方式中可以采用其他变换。在这种操作模式下,输入视频信号本身就是所压缩的信号。压缩通路可以利用人眼缺乏高频率灵敏度来进行压缩。然而,通过选择性地使用帧内或帧间预测视频编码,可以沿压缩通路进行反馈。根据反馈或预测操作模式,压缩通路对从当前宏块减去当前宏块预测值而导致的(相对较低能量)冗余(例如差值)进行操作。根据在指定实例中采用哪种预测形式,生成当前宏块和至少基于相同帧(或图片)的一部分或至少基于至少一个其他帧(或图片)的一部分的宏块预测值之间的冗余或差值。由此产生的修改视频信号然后沿压缩通路进行变换操作。在一个实施方式中,离散余弦变换(DCT)对一 组视频样本(例如,亮度、色度、冗余等)进行操作以计算预定数量的基模式中的每一个的系数值。例如,一个实施方式包括64个基函数(例如,对8X8样本而言)。一般来说,不同实施方式可以采用不同数量的基函数(例如,不同变换)。包括合适的选择性加权的这些基函数的任意组合可以用于表示给定的一组视频样本。与进行变换操作的各个方式相关的额外详情在与包括通过引用并入的如上所述的那些标准/草案标准的视频编码相关联的技术文献中进行描述。变换处理的输出包括各自的系数值。将该输出提供给量化器。一般情况下,大多数图像块通常会产生系数(例如,根据离散余弦变换(DCT)操作的实施方式中的DCT系数),使得大多数相关DCT系数的频率较低。由于这个原因以及人眼对高频视觉效果的灵敏度相对较差,量化器可以操作用于将大部分不大相关的系数转换为零值。也就是说,可以根据量化过程来消除相对贡献低于某个预定值(例如某个阈值)的那些系数。量化器还可以操作用于将重要系数转换为比变化过程产生的值可以更加有效地进行编码的值。例如,量化过程可以通过各自的系数除以整数值并丢弃任意余数来进行操作。当对典型的编码单元或宏块进行操作时,这个过程通常会产生相对少量的非零系数,这些非零系数然后被传输至熵编码器进行无损编码并根据视频编码选择帧内和/或帧间预测处理的反馈路径进行使用。熵编码器根据无损压缩编码过程进行操作。相比之下,量化操作通常是有损的。熵编码过程对量化过程提供的系数进行操作。那些系数可以表示各个特征(例如,亮度、色度、冗余等)。熵编码器可以采用各种类型的编码。例如,熵编码器可以进行上下文自适应二进制算术编码(CABAC)和/或上下文自适应可变长编码(CAVLC)。例如,根据熵编码方案的至少一部分,将数据转换为(运行、级别)配对(run-level paring)(例如,将数据14,3,0,4,0,0,-3转换为各个(运行、级别)对(0,14),(0,3),(1,4),(2,-3))。事先,编制将可变长度码分配至值对的表,以便将相对较短长度编码分配给相对常见的值对,并将相对较长长度编码分配给相对少见的值对。如读者理解的一样,逆量化和逆变换的操作分别对应于量化和变换的操作。例如,在DCT用于变换操作的实施方式中,逆DCT (IDCT)是逆变换操作中所采用的变换。

自适应回路滤波器(ALF)被实现来处理来自逆变换块的输出。在解码图片存储在图片缓冲器(有时称为DPB、数字图片缓冲器)之前,自适应回路滤波器(ALF)应用于解码图片。自适应回路滤波器(ALF)被实现来降低解码图像的编码噪声,可以逐地选择性地分别对亮度和色度进行过滤,不管自适应回路滤波器(ALF)是否以片级别或以块级别应用。在自适应回路滤波器(ALF)的应用中可以使用二维2-D有限脉冲响应(FIR)过滤。滤波器的系数可以在编码器中逐片地进行设计,然后将此信息传递给解码器(例如,从包括视频编码器(或者称为编码器)的发射器通信设备传递给包括视频解码器(或者称为解码器)的接收器通信设备)。一个实施方式通过根据维纳滤波设计生成系数来进行操作。另外,不管是否进行滤波处理并是否根据四叉树结构将该决定传递给解码器(例如,从包括视频编码器(或者称为编码器)的发射器通信设备传递给包括视频解码器(或者称为解码器)的接收器通信设备),都可以在编码器中一块一块地应用,其中块大小根据率失真优化来决定。要注意的是,利用2D滤波的实现方式可以根据编码和解码引入复杂度。例如,通过根据自适应回路滤波器(ALF)及实现方式来使用2D滤波,在编码器(其在发射器通信设备中实现)和解码器(其在接收器通信设备中实现)中可能存在一定的增加的复杂性。在某些可选实施方式中,将来自去块滤波器的输出提供给被实现为处理来自逆变换块的输出的一个或多个其他环内滤波器(例如根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现)。例如,在解码图片存储在图片缓冲器(有时称为DPB、数字图片缓冲器)之前,ALF应用于解码图片。ALF被实现来降低解码图像的编码噪声,可以逐片地选择地分别对亮度和色度进行过滤,不管ALF是否以片级别或以块级别应用。在ALF的应用中可以使用二维2-D有限脉冲响应(FIR)过滤。滤波器的系数可以在编码器中逐片地进行设计,然后将此信息传递给解码器(例如,从包括视频编码器(或者称为编码器)的发射器通信设备传递给包括视频解码器(或者称为解码器)的接收器通信设备)。一个实施方式根据维纳滤波设计操作用于生成系数。另外,不管是否进行滤波处理并是否根据四叉树结构将该决定传递给解码器(例如,从包括视频编码器(或者称为编码器)的发射器通信设备传递给包括视频解码器(或者称为解码器)的接收器通信设备),都可以在编码器中逐块地应用,其中块大小根据率失真优化来决定。要注意的是,利用2D滤波的实现方式可以根据编码和解码引入复杂度。例如,通过根据ALF及实现方式来使用2D滤波,在编码器(其在发射器通信设备中实现)和解码器(其在接收器通信设备中实现)中可能存在一定的增加的复杂性。如针对其他实施方式所述,使用ALF可以提供根据此视频处理的一系列改进之一,包括通过进行随机量化去噪导致的峰值信号噪声比(PSNR)改进客观质量测量。另外,随后编码的视频信号的主观质量可以通过照明补偿来实现,根据ALF处理,照明补偿可以根据进行偏移处理和缩放处理(例如,根据应用增益)来引入。对一种类型的环内滤波器而言,使用自适应回路滤波器(ALF)可以提供根据此视频处理的一系列改进之一,包括通过进行随机量化去噪导致的峰值信号噪声比(PSNR)改进客观质量测量。另外,随后编码的视频信号的主观质量可以通过照明补偿来实现,根据自适应回路滤波器(ALF)处理,照 明补偿可以根据进行偏移处理和缩放处理(例如,根据应用增益)来引入。图片缓冲器(或者称为数字图片缓冲器或DPB)接收从ALF输出的信号;图片缓冲器操作用于存储当前帧(或图片)和/或一个或多个其他帧(或图片),诸如按照视频编码进行的根据帧内预测和/或帧间预测操作使用的帧(或图片)。要注意的是,根据帧内预测,相对少量的存储就足够了,因为也许没有必要存储帧(或图片)序列中的任何其他帧(或图片)或当前帧(或图片)。在根据视频编码进行帧间预测的时候,所存储的信息可以用来进行运动补偿和/或运动估计。在一个可能的实施方式中,对于运动估计,将来自当前帧(或图片)的相应的亮度样本组(例如,16X 16)与帧(或图片)序列(例如根据帧间预测)中其他帧(或图片)中的各个缓冲配对物进行比较。在一个可能的实现方式中,定位最匹配区域(例如预测参考)并产生矢量偏移(例如运动矢量)。在单个帧(或图片)中,可以找到多个运动矢量,但不是所有的运动矢量都必须指向相同的方向。根据运动估计进行的一种或多种操作操作地生成一个或多个运动矢量。运动补偿操作地采用可以根据运动估计生成的一个或多个运动矢量。识别并交付样本的预测参考组以便从原始输入视频信号中扣除,试图希望产生相对(例如理想的多个)较低的能量冗余。如果此类操作未导致产生较低的能量冗余,就不必进行运动补偿,变换操作可以仅对原始输入视频信号进行操作,而不对冗余进行操作(例如,根据将输入视频信号直接提供给变换操作,以便不进行帧内预测,也不进行帧间预测的操作模式),或可以使用帧内预测并对帧内预测产生的冗余进行变换操作。同样地,如果运动估计和/或运动补偿操作成功,运动矢量还可以与相应的冗余系数一起发送至熵编码器,用于进行无损熵编码。来自整个视频编码操作的输出是输出位流。要注意的是,输出位流当然可以根据生成连续时间信号(其可以经由通信信道传输)来进行一定处理。例如,某些实施方式在无线通信系统中操作。在这种情况下,输出位流可以在无线通信设备(其用于生成能够经由通信信道传输的连续时间信号等)中进行适当的数模转换、频率变换、缩放、过滤、调制、符号映射和/或任何其他操作。参照图6的实施方式600,针对该图描述了一种视频编码器的可替换实施方式,该视频编码器进行预测、变化以及编码处理以便产生压缩的输出位流。这种视频编码器可以根据一个或多个视频编码协议、标准和/或推荐作法(诸如IS0/IEC14496-10-MPEG-4的第10部分,AVC (高级视频编码)(或者称为H.264/MPEG-4的第10部分或AVC (高级视频编码),ITU H.264/MPEG4-AVC)进行操作并与之兼容。要注意的是,对应视频解码器(诸如位于通信信道另一端的设备内的视频解码器)操作用于进行解码、逆变换及重建的互补处理以便产生相应的解码视频序列,该序列(理想地)表示输入视频信号。在将该图与先前的图进行比较时,同样将提供给帧内预测块的来自逆量化和逆变换(例如IDCT)块的信号路径输出提供给去块滤波器。将来自去块滤波器的输出提供给被实现为处理来自逆变换块的输出的一个或多个其他环内滤波器(例如根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现)。例如,在一个可能的实施方式中,在解码图片存储在图片缓冲器(有时称为DPB、数字图片缓冲器)之前,SAO滤波器应用于解码图 片。就被实现来生成输出位流的任何视频编码器架构而言,要注意的是,这类架构可以在多种通信设备中的任何一个中实现。输出位流可以经历额外的处理(包括误差校正码(ECC)、前向纠错(FEC)等),从而生成其中具有额外的冗余交易的修改输出位流。同样,如关于此数字信号可以理解,可以根据生成适用于或适于经由通信信道进行传输的连续时间信号进行任何适当的处理。也就是说,这样的视频编码器架构可以在用于经由一个或多个通信信道传输一个或多个信号的通信设备中实现。可以对由这种视频编码器架构生成的输出位流进行额外的处理,从而生成可以发射到通信信道中的连续时间信号。图7是示出了帧内预测处理的实施方式700的示图。针对该图可以看出,视频数据的当前块(例如通常呈正方形并且通常包括NXN像素)进行处理以便对其中的各个像素进行估计。根据帧内预测采用位于当前块的上方及左边的事先编码像素。从某种角度来说,帧内预测方向可以被视为对应于从当前像素延伸至位于当前像素的上方或左边的参考像素的矢量。根据H.264/AVC应用于编码的帧内预测的详情在上文通过引用并入的对应标准内进行了规定(例如,国际电信联盟,ITU-T, TELECOMMUNICATION STANDARDIZATION SECTOR OFITU,H.264(03/2010), SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Infrastructureof audiovisual services - Coding of moving video, Advanced video coding forgeneric audiovisual services, Recommendation ITU-T H.264 (或称为 InternationalTelecomm IS0/IEC14496-10 - MPEG-4 的第 10 部分,AVC (高级视频编码),H.264/MPEG-4 的第10部分或AVC (高级视频编码),ITU H.264/MPEG4-AVC或等效文献)。冗余(其是当前像素和参考或预测像素之间的差值)为经过编码的冗余。针对该图可以看出,帧内预测利用常见帧(或图片)内的像素进行操作。当然要注意的是,给定像素可以具有与其相关联的各自不同的分量,且每个分量可能存在各自不同的样本组。图8是示出了帧间预测处理的实施方式800的示图。与帧内预测不同,帧间预测用于基于当前帧(或图片)内的当前的像素组以及位于帧(或图片)序列内的一个或多个其他帧(或图片)内的一组或多组参考或预测像素来识别运动矢量(例如,帧间预测方向)。可以看出,运动矢量从帧(或图片)序列内的当前帧(或图片)延伸至另一个帧(或图片)。帧间预测可以使用子像素插值,使得预测像素值对应于参考帧或图片中的多个像素的函数。可以根据帧间预测处理来计算冗余,尽管这样的冗余不同于根据帧内预测处理计算的冗余。根据帧间预测处理,每个像素的冗余再次对应于当前像素和预测像素值之间的差。然而,根据帧间预测处理,当前像素和参考或预测像素不位于相同帧(或图片)内。尽管该图示出了关于一个或多个先前的帧或图片所采用的帧间预测,但同样要注意的是,可替换实施方式可以利用对应于当前帧之前和/或之后的帧进行操作。例如,根据适当的缓冲和/或内存管理,可以对多个帧进行存储。当对给定的帧进行操作时,可以根据在给定帧之前和/或之后的其他巾贞来生成参考。 结合CU,基本单元可以用于预测划分模式(即,预测单元或PU)。同样要注意的是,仅为最后深度CU限定PU,且相应 大小局限于CU的大小。图9和图10是分别示出了视频解码架构的各个实施方式900和1000的示图。一般来说,这种视频解码架构对输入位流进行操作。当然要注意的是,这种输入位流可以根据通信设备从通信信道接收的信号来生成。可以对从通信信道接收的连续时间信号进行各种操作,包括诸如可以适当根据生成输入位流的数字采样、解调、缩放、滤波等。而且,可以实现一种或多种误差校正码(ECC)、前向纠错(FEC)等的某些实施方式可以根据ECC、FEC等进行适当的解码,从而生成输入位流。也就是说,在已经根据生成对应输出位流(例如,可以从发射器通信设备或收发器通信设备的发射器部分进行发射的输出位流)进行额外的冗余的某些实施方式中,可以根据生成输入位流来进行适当的处理。总体来说,这样的视频解码架构遗憾的是要处理输入位流,从而尽可能紧密地并完全在理想情况下生成对应于原始输入视频信号的输出视频信号,用于输出至一个或多个视频显示可用设备。参照图9的实施方式900,一般来说,诸如熵解码器(例如,其可以根据CABAC、CAVLC等实现)的解码器根据进行编码(如在视频编码器架构中进行的)的互补处理来处理输入位流。输入位流可以被视为(尽可能紧密地并完全在理想情况下)由视频编码器架构生成的压缩输出位流。当然,在实际应用中,在经由一个或多个通信链路传输的信号中可能已经遭受了一部分误差。熵解码器对输入位流进行处理并提取适当的系数,诸如DCT系数(例如,表示色度、亮度等信息),并将系数提供给逆量化及逆变换块。如果采用DCT变换,那么逆量化及逆变换块就可以被实现来进行逆DCT (IDCT)操作。随后,A/D阻塞滤波器被实现来生成对应于输出视频信号的各个帧和/或图片。可以将这些帧和/或图片提供给图片缓冲器或数字图片缓冲器(DPB),以便用来进行包括运动补偿的其他操作。一般来说,这样的运动补偿操作可以被视为对应于与视频编码相关联的帧间预测。同样,还可以对从逆量化及逆变换块输出的信号进行帧间预测。类似于视频编码,这种视频解码器架构可以被实现来进行模式选择,根据对输入位流进行解码,不通过帧内预测或帧间预测进行,通过帧间预测进行或通过帧内预测进行,从而生成输出视频信号。参照图10的实施方式1000,在某些可选实施方式中,诸如可以根据用于生成输出位流的视频编码来实现的一个或多个环内滤波器(例如,根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现),对应的一个或多个环内滤波器可以在视频解码器架构中实现。在一个实施方式中,在去块滤波器之后适当实现一个或多个环内滤波器。根据某些可能的实施方式,在完成解码图片的去块滤波处理之后(例如,根据在图6中的其他环内滤波器内实现的SAO滤波),可以执行采样点自适应偏移(SAO)处理。基于被定义为一个或多个完整最大编码单元(LCU)的区域执行该处理。图11示出了频带偏移采样点自适应偏移(SAO)滤波处理的实施方式1100。该图示出了频带偏移SAO的概念。在应用每个偏移之后,由此产生的像素被裁剪为有效的8位像素范围
。在该图中,将偏移应用到四个连续、有源的带;不修改剩余的带。当然,在其他实施方式中,此等偏移可以应用于非连续带。图12示出了视频编码架构的可替换实施方式1200。在此实施方式1200中,任何一个或多个其他环内滤波器(例如,根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现的环内滤波器)可以实现为处理逆量化及逆变换块(例如,在去块滤波器之前)的输出。换句话说,在此等实施方式中,在去块处理之前可以应用一个或多个其他环内滤波器(例如,一个实施方式中的SAO滤波器)。在可替换实施方式中,在去块处理之前可以实现此等环内滤波器(例如,根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现的环内滤波器)。然而,在去块处理之前,本发明的 各方面、实施方式和/或其等同物操作地应用此等环内滤波器(例如,根据自适应回路滤波器(ALF)、采样点自适应偏移(SAO)滤波器和/或任何其他滤波器类型实现的环内滤波器),如图12所示。根据有些实施方式,当SAO可操作且开启时(例如,针对来自去块处理的输出实现此SAO的实施方式),可能会出现一些不合意的块状假影。在这些实施方式中,主要是因为两个相邻的LCU正在使用不同的带偏移值。为了减轻这个问题,在去块处理之前可以应用此SA0,及去块处理可以用于在此等情况下减少任何不合意且出现的块状假影。在这种情况下,去块处理过程中使用的边界强度及变量β及tC也由SAO参数决定。从某些角度来看,带偏移SAO基本上可视为是校正滤波器(例如,某些实施方式中的直方图校正滤波器)。基于强度值来分类像素以产生像素的分布。例如,针对直方图实施方式,基于强度值将像素(例如,一个或多个最大编码单元(LCU)的像素)归类为直方图仓或“带”。将整个像素范围(0-255)分成32个均匀的带,并将特定偏移加到每个带中的所有像素上。编码器从范围[_7,7]选择要应用的偏移。尽管偏移可应用于全部32个带,为了简化带偏移处理并减少开销,可以利用任何LCU中的带偏移SAO对缩减集(例如,仅4个连续的带)进行实际修改。编码器选择四个连续的带,偏移针对这四个连续的带进行传输。不修改剩余的28个带(零偏移)。由于可能存在32个带,因此具有非零偏移的第一个带以位流表示。band_position参数携带有该信息。剩余的三个有源带可以由i G [I, 3]的(band_position+i)%32确定。注意此处的模运算,如果第一带是29、30或31,剩余的带将绕回O。图13示出了采样点自适应偏移(SAO)带偏移模式下的传输频带偏移的指示(自适应和/或显式信令)的各个实施方式1300。根据适应性地指明SAO频带偏移模式下的传输频带偏移的数量可以完成这样的操作。例如,SAO频带偏移模式下的传输频带偏移的数量可能与LCU的尺寸相关(例如,使得SAO频带偏移模式下的传输频带偏移的数量可以是LCU尺寸的函数)。例如,如果LCU尺寸减小,传输频带的数量也减小。再如,4个传输频带偏移可以用于64X 64IXU,3个传输频带偏移可以用于32 X 32IXU,2个传输频带偏移可以用于16X16LCU。一般情况下,根据LCU各自不同的尺寸,可以指出SAO频带偏移模式下的传输频带偏移的各自不同的数量。每个IXU尺寸的传输频带偏移的数量也可以按照SPS (序列参数集)、PPS (图片参数大小)、APS (自适应参数集)、宏块条头、IXU数据和/或使用其他部分显式地以信号通知。图14示出了 SAO频带偏移模式下的频带粒度的指示(自适应和/或显式信令)的各个实施方式1400。根据适应性地指明SAO频带偏移模式下的粒度可以完成这样的操作。在某些实施方式中,将整个像素范围(0-255)分成32个均匀的频带。可以利用任何LCU中的频带偏移SAO对仅4个频带进行实际修改。编码器(例如,发射器通信设备)选择四个连续的频带,偏移针对这四个连续的频带进行传输。不修改剩余的28个频带(例如,零偏移)。在每个频 带中,将特定偏移加到所有像素上。由于可以改变IXU的尺寸(例如,64 X 64、32 X 32或16 X 16 ),频带的粒度可以是自适应的。例如,IXU的尺寸越小,粒度就越粗糙。再如,如果IXU尺寸为32X32,则可以将
均匀分为16个频带,每个频带涵盖16个连续的强度值。一般来说,可以根据IXU各自不同的尺寸指明SAO频带偏移模式下的各自不同的频带粒度。每个IXU尺寸的频带粒度也可以按照SPS (序列参数集)、PPS (图片参数大小)、APS(自适应参数集)、宏块条头、IXU数据和/或使用其他部分清楚地以信号通知。图15示出了隐式频带指数信令的实施方式1500。例如,可以基于当前IXU的像素值推断出(例如,基于LCU的分析确定,推断地确定,等等)此信息,而没有显式地信号通知频带指数。例如,通过生成IXU的像素值直方图,频带偏移可以用于像素的数量占主导地位的频带。此等频带指数不一定是连续的(例如,频带指数可以使得具有不连续的分布,以便至少两个连续的频带指数可以间隔至少一个频带指数值,换句话说,频带指数彼此不一定是连续的)。图16示出了隐式频带指数信令的可替换实施方式1600。在示出了极简化实施方式的极简化图中,存在只具有两个灰度的LCU。直方图(例如,如读者所理解的描述像素分布的可能的一种方式)说明50%的像素具有灰度25,50%的像素具有灰度205。因此,两个频带偏移就足够,代替了原来的四个。图17示出了频带偏移编码的实施方式1700。在频带偏移模式下,由于sao_band_position表示具有非零偏移的频带偏移的开始,因此第一偏移值sao_offset [cldx][saoDepth] [x0] [yO]
必须为非零(例如,在某些情况下,可能的最小的值可以是取 I 的值)。所以,而不直接编码 sao_offset[cldx] [saoDepth] [xO] [yO]
, bs (sao_offset[cldx][saoDepth][xO][yO]
)I及 sao_offset[cldx][saoDepth][xO][yO]
的符号位可以单独编码,其中abs是计算绝对值的函数。图18及图19示出了一个或多个设备(例如,通信设备、接收器和/或解码器设备、发射器和/或编码器设备等)的操作方法的各个实施方式。参照图18的方法1800,方法1800首先通过通信设备的输入端从至少一个额外通信设备接收视频信号及多个频带偏移,如方框1810所示。方法1800继续分析与至少一个最大编码单元(LCU)(该最大编码单元与视频信号相关联)相关联的多个像素以识别用于识别多个频带指数的像素值分布,如方框1820所示。方法1800然后根据视频信号或基于此的信号的滤波处理将多个频带偏移应用到多个频带指数,如方框1830所示。参照图19的方法1900,该方法1900首先通过通信设备的输入端从至少一个额外通信设备接收视频信号及多个频带偏移,如方框1910所示。方法1900继续分析与至少一个最大编码单元(LCU)(该最大编码单元与视频信号相关联)相关联的多个像素以识别用于识别多个频带指数的像素值分布,如方框1920所示。方法1900继续对视频信号或基于此的信号执行采样点自适应偏移(SAO)滤波处理以生成第一滤波信号,使得SAO滤波处理包括将多个频带偏移应用到多个频带指数,如方框1930所示。方法1900继续对第一滤波信号执行去块滤波处理以生成第二滤波信号,如方框1940所示。同样要注意的是,诸如利用其中实现的基带处理模块和/或处理模块和/或其中的其他部件,可以在多种通信设备中的任意一种中进行文中针对各个方法所述的各操作和功能。例如,此基带处理模块和/或处理模块可以生成此等信号并执行如本文所述的此等操作、处理等,还可以执行如本文所述的各操作和分析,或如本文所述的任何其他操作和功能等,或各自的等同物。在某些实施方式中,此基带处理模块和/或处理模块(其可以在相同设备或不同设备中实现)可以执行根据本发明的各方面的此处理、操作等,和/或如本文所述的任何其他操作和功能等,或各自的等同物。在某些实施方式中,此处理通过第一设备中的第一处理模块以及第二设备中的第二处理模块协作地执行。在其他实施方式中,此处理、操作等全部由给定的一个设备中的基带处理模块和/或处理模块执行。在甚至其他实施方式中,使用单个设备中的至少第一处理模块及第二处理模块执行此处理、操作等。同样,如本文所使用的术语“基本上”和“近似地”为其对应术语提供行业接收的容差和/或物品间的相关性。行业接收的容差的范围小于1%_50%并对应于(但不限于)分量值、集成电路工艺变量、温度变量、上升和下降时间和/或热噪声。物品之间的相关性的差别为几个百分点至数量级。如本文同样所使用的术语“可操作地耦接至”、“耦接至”和/或“耦接”包括物品之间直接耦接和/或物品之间通过居间物品间接耦接(例如,物品包括(但不限于)部件、元件、电路和/或模块),其中,对间接耦接而言,居间物品不修改信号信息但可以调节其电流电平、电压电平 和/或功率电平。如本文进一步所使用的推测耦接(即,当一个元件通过推断与另一个元件耦接)包括以与“耦接至”相同的方式在两个物品之间直接和间接耦接。如本文更进一步所使用的术语“可操作用于”或“可操作地耦接至”表明物品包括一种或多种电源连接、输入、输出等以便在激活时执行一个或多个对应功能且可以进一步包括与一个或多个其他物品的推测耦接。如本文更进一步所使用的术语“与…相关联”包括另一物品中嵌入的独立物品和/或一个物品的直接和/或间接耦接。如本文所使用的术语“与…媲美”表明两个或两个以上物品、信号等之间的比较提供所需关系。例如,当所述关系为信号I比信号2的数量级大时,当信号I的数量级比信号2的数量级大时或当信号2的数量级比信号I的数量级小时,可以实现有利比较。如本文同样所使用的术语“处理模块”、“模块”、“处理电路”和/或“处理单元”(例如,包括可以操作、实现和/或用于编码、解码、基带处理的各种模块和/或电路等)可以是单个处理设备或多个处理设备。这种处理设备可以是微处理器、微控制器、数字信号处理器、微计算机、中央处理器、现场可编程门阵列、可编程逻辑设备、状态机、逻辑电路、模拟电路、数字电路和/或基于电路的硬编码和/或操作指令操作信号(模拟和/或数字)的任何设备。处理模块、模块、处理电路和/或处理单元可以具有相关联的存储器和/或集成存储元件,该存储器和/或集成存储元件可以是单个存储设备、多个存储设备和/或处理模块的嵌入电路、模块、处理电路和/或处理单元。这种存储设备可以是只读存储器(ROM)、随机存取存储器(RAM)、易失性存储器、非易失性存储器、静态存储器、动态存储器、闪存、高速缓冲存储器和/或存储数字信息的任意设备。要注意的是,如果处理模块、模块、处理电路和/或处理单元包括一个以上的处理设备,那么处理设备就可以中心定位(例如,通过有线和/或无线总线结构直接耦接在一起)或可以分布式定位(例如,通过局域网和/或广域网进行的间接耦接云计算)。进一步要注意的是,如果处理模块、模块、处理电路和/或处理单元通过状态机、模拟电路、数字电路和/或逻辑电路实现一种或多种功能,可以将存储有相应操作指令的存储器和/或存储器元件嵌在包括状态机、模拟电路、数字电路和/或逻辑电路的电路内或外部。进一步要注意的是,存储器元件可以存储,处理模块、模块、处理电路和/或处理单元执行对应于一个或多个图中示出的至少一部分步骤和/或功能的硬编码和/或操作指令。制品中可以包括有这种存储器设备或存储器元件。

上文在示出了指定函数的性能及其关系的方法步骤的帮助下已对本发明进行了描述。为了便于描述,本文任意限定了这些功能构建块和方法步骤的界限和顺序。只要适当执行指定功能和关系,就可以限定替代界限和顺序。任何替代界限和顺序都在要求保护的本发明的范围和精神范围内。此外,为了便于描述,任意限定了这些功能构建块的界限。只要适当执行某些重要功能,就可以限定替代界限。类似地,本文也任意限定了流程框图以便示出某些重要功能。从所用的程度来看,另外规定了流程框图界限和顺序,并仍然执行某些重要功能。功能构建块和流程图块和顺序的替代定义在要求保护的本发明的范围和精神范围内。本领域的普通技术人员还将明白,本文中的功能构建块及其他说明性块、模块和部件可以被实现为利用离散部件、专用集成电路、执行适当软件等的处理器或其任意组合来示出。可能已经至少部分地针对一个或多个实施方式对本发明进行了描述。本发明的实施方式在本文中用来说明本发明,其一方面、其特点、其概念和/或其实例。体现本发明的装置、制品、机器和/或工艺的物理实施方式可以包括参照文中所讨论的一个或多个实施方式描述的一个或多个方面、特点、概念、实例等。此外,从图到图,实施方式可以并入可以使用相同或不同参考编号的相同或类似命名的功能、步骤、模块等,正因如此,所述功能、步骤、模块等可以是相同或类似的功能、步骤、模块等或可以是不同的功能、步骤、模块等。除非从反面特别说明,传递给本文中所显示的任何一个图中的元件的信号、来自该元件的信号和/或元件之间的信号可以是模拟信号或数字信号、连续时间信号或离散时间信号以及单端信号或差分信号。例如,如果信号路径被显示为单端路径,则还表示差分信号路径。类似地,如果信号路径被显示为差分路径,则还表示单端信号路径。尽管本文对一个或多个特定架构进行了描述,但同样可以实现其他架构,其他架构使用如本领域的普通技术人员认可的一个或多个数据总线(未明确示出)、元件之间的直接连接和/或其他元件之间的间接耦接。术语“模块”用于对本发明的各个实施方式进行描述。模块包括经由硬件实现以便执行一个或多个模块功能,诸如处理一个或多个输入信号以产生一个或多个输出信号的功能块。实现模块的硬件本身可以结合软件和/或固件进行操作。如本文所使用的模块可以包含一个或多个子模块,每个子模块本身就是模块。尽管本文明确描述了本发明的各个功能和特点的特定组合,但这些特点和功能的其他组合同样是可能的。本发明不受本文所公开 的特定实例的限制并明确结合其他组合。
权利要求
1.一种装置,包括: 至少一个输入端,用于: 从至少一个额外装置接收视频信号;以及 经由信令从所述至少一个额外装置接收多个频带偏移;以及 处理器,用于: 分析与至少一个最大编码单元(LCU)相关的多个像素以识别像素值分布,其中,所述最大编码单元与所述视频信号相关; 基于所述像素值分布推理地识别多个频带指数; 根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频带指数; 对所述视频信号或基于所述视频信号的信号执行采样点自适应偏移(SAO)滤波处理以生成第一滤波信号,其中,所述采样点自适应偏移滤波处理将所述多个频带偏移应用到所述多个频带指数;以及 对所述第一滤波信号执行去块滤波处理以生成第二滤波信号。
2.根据权利要求1所述的装置,其中,所述处理器用于: 分析与至少一个最大编码单元相关联的多个像素以生成表示所述像素值分布的像素值直方图,其中,所述最大编码单元与所述视频信号相关;以及 基于所述像素值直方图,识别要被应用所述多个频带偏移的所述多个频带指数。
3.根据权利要求1所述的装置,其中: 所述多个频带指数具有不连续分布,使得所述多个频带指数中的至少两个连续的频带指数彼此分离至少一个频带指数值。
4.根据权利要求1所述的装置,其中: 所述像素值分布指示分别与所述多个频带指数中的至少一部分相关的所述多个像素的多个子集;以及 要被应用所述多个频带偏移的所述多个频带指数对应于所述多个像素的多个子集中的至少一个子集,其中,该至少一个子集与所述多个像素的多个子集中的其他子集相比具有相对较大或最大数量的像素。
5.根据权利要求1所述的装置,其中: 所述装置是在卫星通信系统、无线通信系统、有线通信系统、光纤通信系统及移动通信系统中的至少一个中操作的通信设备。
6.一种装置,包括: 输入端,用于从至少一个额外装置接收视频信号及多个频带偏移;以及 处理器,用于: 分析与至少一个最大编码单元(LCU)相关的多个像素以识别用于识别多个频带指数的像素值分布,所述最大编码单元与所述视频信号相关;以及 根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频带指数。
7.根据权利要求6所述的装置,其中,所述处理器用于: 对所述视频信号或基于所述视频信号的信号执行采样点自适应偏移(SA0)滤波处理以生成第一滤波信号,其中,所述采样点自适应偏移滤波处理将所述多个频带偏移应用到所述多个频带指数;以及 对所述第一滤波信号执行去块滤波处理以生成第二滤波信号。
8.根据权利要求6所述的装置,其中,所述处理器用于: 分析与至少一个最大编码单元相关的多个像素以生成表示所述像素值分布的像素值直方图,其中,所述最大编码单元与所述视频信号相关;以及 基于所述像素值直方图,识别要被应用所述多个频带偏移的多个频带指数。
9.根据权利要求6所述的装置,其中: 所述多个频带指数具有不连续分布,使得所述多个频带指数中的至少两个连续的频带指数彼此分离至少一个频带指数值。
10.一种通信设备的操作方法,所述方法包括: 经由所述通信设备的输入端,从至少一个额外通信设备接收视频信号及多个频带偏移; 分析与至少一个最大编码单元(LCU)相关的多个像素以识别用于识别多个频带指数的像素值分布,其中,所述最大编码单元与所述视频信号相关;以及 根据所述视频信号或基于所述视频信号的信号的滤波处理将所述多个频带偏移应用到所述多个频 带指数。
全文摘要
根据视频编码的采样点自适应偏移(SAO)。在去块处理之前可以执行SAO滤波处理(例如,根据视频信号解码和/或编码)。例如,接收器和/或解码器通信设备可以从包括各种频带偏移的发射器和/或编码器通信设备接收信令。以推理方式,在无需来自所述发射器和/或编码器通信设备的此等频带指数的信令的情况下,可以通过分析接收视频信号(例如,从发射器和/或编码器通信设备接收的视频信号)来确定对应频带指数。在适当分析了由视频信号生成的一个或多个最大编码单元(LCU)以确定像素值分布(例如,其在一个实例中可以使用直方图)之后,然后基于像素值分布,识别频带指数且频带偏移适用于此。
文档编号H04N7/50GK103248888SQ20131005284
公开日2013年8月14日 申请日期2013年2月18日 优先权日2012年2月10日
发明者陈培松, 温伟杰 申请人:美国博通公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1