用于改善压缩图像色度信息的方法和系统的制作方法

文档序号:7736356阅读:450来源:国知局
专利名称:用于改善压缩图像色度信息的方法和系统的制作方法
技术领域
本发明涉及图像压缩,尤其是涉及在类似MPEG的图像压缩系统中用以改善压缩图像的色度信息的方法、系统和计算机程序。
背景技术
MPEG背景MPEG-2和MPEG-4是规定视频句法的国际视频压缩标准,其提供了一种有效手段,以更紧凑的编码数据的形式表现图像顺序。将比特编码的语言是“句法”。例如,一些标志可以表示一整个采样块(如MPEG-2的64个采样)。这两个MPEG标准也描述了一种解码(重建)处理,其中编码的比特被从紧凑的表示转换为一种该图像顺序的原始格式的近似。例如,一个在编码比特流中的标记标志着是否后续的比特在被用离散余弦转换(DCT)算法进行解码之前,将先以一种预测算法处理。包括解码处理的算法通过由这些MPEG标准定义的语义加以调整。可应用这种句法来利用通常的视频特性,如空间冗余、时间冗余、匀速运动、空间屏蔽等等。实际上,这些MPEG标准定义了一种程序设计语言和一种数据格式。一个MPEG解码器必须能够解析和解码输入数据流,但是只要数据流符合相应的MPEG句法,可以使用各式各样可能的数据结构和压缩技术(虽然这从技术上看因为语义不一致而偏离标准)。在一个替换句法内携带所需语义也是可允许的。
这些MPEG标准使用各种各样的压缩方法,包括帧内和帧间方法。在大多数视频画面中,背景保持相对稳定,同时在前景中出现动作。背景可以移动,但是大量画面是冗余的。这些MPEG标准通过生成一个被称为“内部(intra)”帧或者“I帧”的基准帧而开始压缩。I帧被压缩与其他帧无关,因此包含完整一帧视频信息。I帧提供了用以随机存取的进入一个数据比特流的进入点,但其只能被适度压缩。典型地,代表I帧的数据每隔12至15个帧就被放置在比特流中(虽然在某些状况下在I帧之间使用宽得多的间隔也是有效的)。尔后,由于仅有一小部分帧落在与括号(bracketing)I帧不同的基准I帧之间,故仅有图像差被捕获、压缩和存储。有二种类型的帧被用于这样的图像差预测的帧或者P帧,以及双向内插的帧或者B帧。
P帧通常参考一个过去的帧(一个I帧或者一个先前的P帧)进行编码,并且通常被用作一个供后续P帧使用的基准。P帧接受相当高的压缩量。B帧提供最高的压缩量,但为了被编码既需要一个过去的基准帧也需要一个未来的基准帧。在标准压缩技术中,双向的帧从不被用于基准帧。
宏模块是图像像素的区域。对于MPEG-2,一个宏模块是具有四个8×8DCT模块的16×16像素组,其带有一个用于P帧的运动矢量,以及一个或者二个用于B帧的运动矢量。在P帧内的宏模块可以使用帧内或者帧间(预测)编码而被逐一编码。在B帧内的宏模块可以使用帧内编码、前向预测编码、后向预测编码或者前向和后向二者(即双向内插)的预测编码而被逐一编码。在MPEG-4视频编码中使用一种稍有不同但是类似的结构。
在编码之后,一个MPEG数据比特流包括I、P和B帧的序列。一个序列可以几乎由I、P和B帧(对于其位置存在一些微小的语义限制)的任何一种模式组成。但是,在产业实践中通常具有一个固定的模式(例如IBBPBBPBBPBBPBB)。
MPEG色空间表示MPEG-1、MPEG-2和MPEG-4都利用Y、U、V色空间用于压缩。存在一个亮度选择的公式,但是在RGB(红-绿-蓝)之间转换为YUV表示的一个典型转换可以表示为Y=0.59G+0.29R+0.12BU=R-YV=B-Y取决于色彩系统,对应于绿色的Y亮度因子在0.55与0.75之间变化。对应于红色的因子在0.2与0.3之间变化,而对应于蓝色的因子在0.05与0.15之间变化。
这一转换可以作为矩阵转换加以计算,该矩阵转换是为线性信号使用设计的线性算符。但是,这个简单转换在非线性视频空间中以MPEG1、2和4加以执行,就得出了不同的人为现象(artifact)和问题。
在MPEG中典型的是降低U和V色度通道的分辨率以获得更大压缩。最通常使用的分辨率降低是水平和垂直两者都使用二分之一分辨率。MPEG-2支持全分辨率色度和水平二分之一分辨率。但是,最通常使用的MPEG-2范畴(Profile),即在主层次上的主范畴(MP@ML)和在高层次上的主范畴(MP@HL),在水平和垂直上都使用二分之一分辨率。MPEG-4的版本1和2则在水平和垂直上都使用二分之一分辨率。应注意到,全色度分辨率通常被称为4∶4∶4,二分之一色度水平分辨率通常被称为4∶2∶2,而二分之一垂直和水平分辨率通常被称为4∶2∶0。(应当注意到,术语4∶x∶x就其含义和推论而言是有漏洞的,但通常做法是用它来描述色度分辨率对亮度的关系)。
当转换为U和V颜色表示时,对于非线性视频信号施用在不同的MPEG标准下降低水平和垂直色度分辨率的过滤器。当应用逆转换以恢复RGB时,非线性的信号和过滤器以产生人为现象和问题的方式交互作用。这些问题连同空间混叠一起可以被概括为在Y亮度和U及V色度通道之间的“串扰”。
有关线性与非线性的表示和转换的进一步信息可见于Gary Demos在1990年10月的SMPTE会议中发表的“用于像素的对数和密度单元的使用(The Use of Logarithmic)”,该论文刊登于SMPTE期刊上(1991年10月,卷100,no.10)。也见于Gary Demos在1993年10月的SMPTE会议上发表的“一个可升级的、可互操作和可扩展的用于图像颜色和动态范围表示的例子(An Example Representation for Image Color andDynamic Range which is Scalable,Interoperable,and Extensible)”,该论文刊登于科研报告集和未定稿版上。这些文件描述了在图像压缩处理流水线的不同阶段上对数和线性空间的优点,并且作为参考资料结合在此处。
色度子采样(sub-sampling)对于U和V降低色度分辨率的理由是人类视觉系统对于U和V上的变化比亮度Y上的变化更不敏感。因为Y主要是绿色,U和V分别主要是红和蓝色,这也可以被说成是人类视觉灵敏度对绿色比对红和蓝色更高。但是,虽然在MPEG-1、MPEG-2和MPEG-4中U和V被视为是相同的,人类视觉系统对于U(对于其红色成分)比对于V(对于其蓝色成分)更敏感。
在色度敏感度方面的这种差别体现在用于电视接收机的1951NTSC-2彩色标准中。NTSC-2使用YIQ色空间,其中I和Q类似于U和V(具有稍微不同的加权)。也就是说,I通道基本上表示红色减去亮度,而Q通道基本上表示蓝色减去亮度。在NTSC-2中,亮度被给予4.5MHz的模拟带宽,而I色度通道被给予1.5MHz的模拟带宽。表示蓝色-黄色轴的Q通道则仅被给予0.5MHz的模拟带宽。因此,NTSC-2电视制式给I通道分配的信息是其给Q通道分配的三倍,而给Y亮度通道的信息是给I通道的三倍。因此,在Y亮度通道和Q(蓝色减去亮度)通道之间的带宽比是9。这些MPEGYUV和NTSC-2相互关系概括于下表中色度分辨率对亮度的比率比率 YUV YUV YUV NTSC-24∶4∶4 4∶2∶2 4∶2∶0红色、U、和I像素对Y1∶1 2∶1 4∶1 3∶1蓝色、V、和Q像素对Y1∶1 2∶1 4∶1 9∶1显而易见,在处理中,在MPEG标准下亮度信号通道与U和V通道之间存在的差别比在NTSC-2标准下亮度和I和Q信道之间的差别更大。

发明内容
本发明提出了用于改善压缩图像的色度信息的方法、系统和计算机程序。
尤其是,在本发明的一个方面,彩色视频图像可以通过令用于RGB表示的红色分辨率(或者用于YUV表示的U分辨率)提高超过用于蓝色(或者V)的分辨率而改善。对于蓝色成分使用较低分辨率意味着例如在一个运动补偿彩色视频图像压缩系统中需要压缩较少的信息。本发明的这一方面包括方法、系统和计算机程序,其通过选择使彩色视频图像的红色成分的分辨率高于该彩色视频图像的蓝色成分的分辨率,而在视频图像压缩系统中压缩彩色视频图像的图像色度信息。
本发明的再一个方面是一种用于降低色度噪声水平而由此改善图像质量的技术,其中色度噪声由在压缩期间使用的量化参数(Qp)的任一给定值引起。这通过对于U(=R-Y)通道利用比Y通道之外更低的QP值而实现。类似地,V(=B-Y)通道的质量还可以通过对于V通道利用比Y通道之外更低的QP值而改善。
本发明的又一方面是一种在需要较高压缩时有效的技术。在这一方面,对Y通道的QP值施加一个正的QP偏置,以供U和V色度通道中的任何一个或者两个使用。
本发明的另一方面是使用对数表示以利于图像编码。如果可行,对数编码可以改善最初表示为线性RGB像素值的图像的YUV色空间表示的编码效率。在其它处理步骤上,对线性表示的往复转换可能是有益的。
本发明的另一个方面是一种在图像压缩系统中用以改善彩色视频图像的视频特征的方法,包括选择一组图像通道以表示彩色视频图像,包括一个亮度通道和n个色度通道,其中n至少为3;并且将该亮度通道和n个附加的色度通道压缩成一个经压缩的视频图像。
在附图和以下说明书中,将阐述本发明的一个或多个实施例的细节。由说明书和附图以及由权利要求将明显看到本发明的其他特点、目的以及优点。


图1是一个流程图,其展示出在YUV色空间表示中用以将对U的分辨率提高超过对V所使用的分辨率的说明性方法(其可由计算机实现)。
图2是一个流程图,其展示出对于色度通道施加一个QP偏置的说明性方法(其可由计算机实现)。
图3是一个流程图,其展示出对于亮度和色度信息进行对数编码的说明性方法(其可以由计算机实现)。
图4是一个流程图,其展示出在图像压缩系统中用于编码附加的色度通道的说明性方法(其可以由计算机实现)。在不同的附图中相同的参考标记表示相同的单元。
具体实施例方式
改善的颜色编码精度随着图像的质量相对于降低的噪声、扩展的动态范围和扩展的色彩范围等特性而改善,人对色彩的敏感度也提高。尤其是已经注意到,在RGB表示中的红色(或者在YUV表示中的U)常常比在视频压缩中通常使用的需要更高精度和透明度。
除蓝色正在被用于处理(如蓝屏特殊效应混合或者图像分析)之外,人类对于蓝色-黄色的色度轴的敏感度,如同由蓝色或者V体现的,通过水平和垂直方向上的半分辨率采样得到了适当解决。因此,一个图像的像素总数的四分之一就提供了足够品质用于表示蓝色或者V色度轴。但是,与蓝色和V不同,红色和/或U的一半分辨率的编码有时对于大的宽广动态范围显示器和投影仪而言在品质方面是不够的。
因此,图像可以通过令用于RGB表示(或者用于YUV表示的U分辨率)的红色分辨率增加超过蓝色(或者V)分辨率而得到改善。对于蓝色成分使用更低的分辨率意味着例如在一个运动补偿彩色视频图像压缩系统中需要压缩更少的信息。
根据本发明,有三种相对于下行过滤的(downfiltered)蓝色(或者V)分辨率保持增加的红色(或者U)分辨率的优选方法1)对于红色和/或U使用全分辨率;2)仅在垂直或者水平方向的一个色度轴上对于红色和/或U使用二分之一分辨率;或者3)在一个或者两个色度轴上,对于红色和/或U使用过滤的分辨率,该分辨率在实足尺寸和二分之一之间,如2/3或者3/4。
图1是展示出一种说明性方法(其可由计算机实现)的流程图,该方法在YUV色空间表示(一种类似的方法可以应用于一个RGB色空间表示)中对于U使用的分辨率比对于V使用的分辨率更高步骤101在一个利用YUV色空间表示的图像压缩系统中,将一个输入图像的V(=B-Y)通道缩小过滤为水平方向上二分之一分辨率,并且选择性地为垂直方向上二分之一分辨率。
步骤102将图像的U(=R-Y)通道缩小过滤为一个高于V(=B-Y)通道的分辨率,最好是下面的其中之一a)全分辨率;b)水平方向介于二分之一和全分辨率之间,但是垂直方向为全分辨率;c)水平和垂直均在二分之一和全分辨率之间;d)垂直方向介于二分之一和全分辨率之间,但是水平方向为全分辨率;步骤103使用一个类似MPEG的压缩系统压缩YUV图像(其具有亮度Y和缩小过滤的U和V色度信息)。
步骤104将图像解压缩成Y、U和V通道(通常是在不同的计算机中)。
步骤105使用适宜的分辨率增量(即在上述步骤101中对于V和上述步骤102中对于U所使用的缩小过滤因子的倒数),将U和V通道转换为全分辨率。
步骤106选择性地将YUV图像转换为用于观看、分析或者进一步处理的RGB图像。
不同的用于色度的QP偏置称作“视频图像的高精度编码和解码”并且转让给本发明(在此将其结合作为参考资料)的受让人的共同待决的美国专利申请No.09/798,346,指导了在压缩期间利用量化参数(QP)的不同方面。本发明还有一个方面是一种用于降低色度噪声水平从而改善图像质量的技术,该色度噪声是在压缩期间使用的量化参数(QP)的任一给定值所导致的。这通过对U(=R-Y)通道利用比Y通道更低的QP值而实现。类似地,V(=B-Y)的质量还可以通过对于V通道利用比Y通道更低的QP值而得到改善。
一种实现降低色度QP值的简单方法是从被用于Y(亮度)通道的QP值中减去一个恒定值。做为选择,可将一个单独的恒定值(比用于Y的QP值低)用于每一个U和V。例如,可以从用于Y的QP值中减去“2”,从而得出用于U的QP值,并且可以从用于Y的QP值中减去“1”,从而得出用于V的QP值。对所施用的QP值而言可以采用减去任何有效的数值,该数值仅仅受限为最小值“1”。
这种方法对于恒定QP值(可变比特率)有效。其对于可变QP值(例如在恒定的和可变的比特率的运动补偿压缩系统中)也同样有效,这是因为瞬间的QP值可以通过从用于Y的QP值中减去一个规定的差值而偏置,从而得出用于每个U和V的QP值。
此外,如在上面提及的专利申请“视频图像的高精度编码和解码”中描述的,这些不同的色度偏置的QP值的范围可以利用扩展的QP值域函数或者查找而加以扩展。
除使用预先安排的数值之外,必须从编码器到解码器用信号通知U和V的偏置值。它们例如可以对应于每个对话、图像组(GOP)、帧、或者图像区域规定一次。
图2是一个示出对于色度通道施加QP偏置的说明性方法(其可以由计算机实现)的流程图步骤201在一个图像压缩系统中,以一个选定值(其对于每个通道可以是不同的)降低用于每个U和V色度通道的QP值。
步骤202分别将这一降低的QP值用于U和V色度通道压缩。
步骤203选择性地,如果使用了可变的QP值,则确保降低的U和VQP值至少是“1”。
步骤204除使用预置的偏置之外,每当QP值可能改变时(其曾为最小值)即发信号或者传送QP值降低量给解码器。
步骤205对于U和V(再次确保降低的QP值至少是“1”)使用上述适当的QP值解压缩(通常是在不同的计算机中)信号。
步骤206选择性地,观看解压缩的图像或将该图像用于附加的处理或者分析。
本发明的另一个方面是一种在需要较高压缩时有效的技术。在这一方面,将一个正的QP偏置施加到Y通道的QP值,以便用于U和V色度通中的任何一个或者两个。(如果有的话,最好核对压缩系统的QP最大值)。可以对每个U和V通道使用单独的偏置值。另外,这样一个实施例的步骤类似于在图2中示出的那些步骤。
亮度和色度的对数编码在上面提及的称作“供像素的对数和密度单位的使用”的论文描述了对于动态范围而言对数表示的优点。与动态范围匹配的对数表示多少类似于通常使用的视频转换功能。尽管类似,与通常使用的多样的视频表示相比,对数表示在可延展性、校准使用、及在色度通道的正交性方面都更为适宜。
本发明的另一个方面是使用对数表示以利于图像编码。已经发现,对数编码如果可行的话可以改善最初表示为线性RGB像素值(如在照相机的传感器上)的图像的YUV色空间表示的编码效率。在其他处理步骤上,线性表示的往复转换可能是有益的。
如在上面提及的专利申请“视频图像的高精度编码和解码”中描述的,对亮度的色度串扰可在此时减到最小Ylog=Log(Wr*R+Wg*G+Wb*B)U=Log(R)-YlogV=Log(B)-Ylog其中Wr、Wg和Wb是用于亮度的红色、绿色和蓝色成分的线性加权,并且其中R、G和B表示一个线性光空间(light space)。这些关系式在应用本发明的这一方面是有益的。
图3是展示出一个说明性方法(其可以由计算机实现)的流程图,该方法系用于亮度和色度信息的对数编码步骤301在一个图像压缩系统中,对于输入的(例如直接来自一个摄像机)线性R、G和B像素值执行下列转换Ylog=Log(Wr*R+Wg*G+Wb*B)U=Log(R)-YlogV=Log(B)-Ylog其中Wr、Wg和Wb是用于亮度的红色、绿色和蓝色成分的线性加权。
步骤302选择性地降低U和V色度通道的分辨率(如上所述)。
步骤303对于活动图像的这一Y、U和V表示执行运动补偿压缩。
步骤304将所压缩的图像解压缩以恢复活动图像(通常是在不同的计算机中)的Y、U和V彩色成分。
步骤305如果应用了可选择的步骤302,则使上述分辨率的降低向回倒退以恢复完全的U和V分辨率。
步骤306使用下列转换恢复线性的R、G和B像素值R=逆log(Y+U)B=逆log(Y+V)G=(逆log(Y)-Wr*R-Wb*B)/Wg步骤307选择性地转换为其他视频RGB表示(做为选择,本步骤除了附加到步骤306之外,还可以作为步骤306的替代而被执行)。
附加的色度轴在扩展动态范围和扩展对比度值域的图像中,借助于可见和不可见两种图像信息的附加通道,增加可见光波长通道可能是有益的。
可以从任何给定的一组红色、绿色和蓝色中获得的颜色范围基本不包括所有可能的可见颜色。合成红色、绿色和蓝色等基色以生成其他诸如黄色、橙色、蓝绿色和褐色等可见颜色的比例是人类视觉系统的一个特征,被称为“条件配色(metamerism)”。
如在上面提及的称作“用于可升级、可互操作和可扩展的图像颜色和动态范围的一个表示例子”的论文中指出的,有可能对于红色、绿色和蓝色三种基色增加额外的基色。尤其是,蓝绿色(cyan)、洋红(magenta)和黄色的基色有助于使颜色范围扩展,超出由最通常的红、绿和蓝等基色值可获得的范围之外。此外,还可以传送紫光和紫外光(其使磷光性的颜色发亮)。
已经证明在可见颜色以外的看不见的红外波长对于穿过云雾和阴霾以及在黑暗中看物是有效的。紫外波长也可以对看到低幅度的可见图像细节如指纹和表面涂层是有效的。
此外,即使在可见光波长中,不同的材料(如烟雾和水下的海藻)通常也会降低对比度的数值或者某些波长的动态范围。这就是为什么烟雾可以显现褐色,对于在远处的所有物体给出褐色色调,降低了蓝色对比度和动态范围。这也是为什么水下摄影可以显现绿色、青绿色或者蓝色,因为可见光谱的红色端在对比度和动态范围方面降低了。
如上所述的在Y、U与V之间的对数关系将使对于可见光的彩色关系的编码最佳化。
在本发明的这个方面,额外的色度通道被增加给编码三个基本波长的通道,这典型地以RGB或者YUV表示来实现。此外,当使用YUV色空间的时候,还可能改变Y(亮度)通道的构成以利于最高幅值的图像信号。因此,举例来说,随着亮度移动到其他波长范围,绿色可见通道可以使用其自身的色度通道进行编码。在红色、绿色和蓝色(或许其他可见和不可见基色)每个均具有其自身的色度通道的情况下,这个概念可以被扩展至Y亮度是红外线。
根据本发明的这一方面,对于每个新的色度通道,应确定以下内容1)是否通道应与一个或多个其他通道(通常是与诸如U=R-Y的亮度)有区别地被编码?2)是否通道应相对于亮度而被给以全分辨率,或者是否对一个假定的预定用途可以降低分辨率而不损害图像质量?在1)中的确定是基于每个编码通道与其他通道的相关性。例如,紫外线或者远红外波长图像对于可见光波长或者对于彼此而言可能是相对无关的。在这种情况下,这些通道可以无需涉及其他通道而被编码。但是,所有的可见光波长是高度相关的,因此通常相对于彼此进行编码几乎总是有益的。
基于这些确定,可以选择一组通常超出(或者是替代并超出)三个基本通道(例如YUV)的图像通道。例如,所选择的该组图像通道可以包括一个Y′亮度通道,以及n个色度通道,如U′第一色度通道、V′第二色度通道和X′第三色度通道。
利用这个例子并应用运动补偿压缩,选择的Y′值将以全分辨率受到编码,并且各种各样的其他色度通道(U′、V′、X′)将被区别地或者独立地编码。除非存在附加的通道,所有的通道都可以利用相同的运动矢量和宏模块运动补偿结构,这与它们被用于常规的YUV表示相同。每个这种通道将相对于Y利用适当的分辨率(其与在上面步骤2确定的相同)。此外,可以将一个QP偏置(如上所述)独立地施加于每个色度通道,以确保实现所期望的压缩色度质量。
即使当仅施加于可见光波长的时候,附加的色度通道也可以不仅确保得到扩展的颜色范围和更精确的颜色,而且还使附加的透明度、清晰度和噪声保真度得以被施加给诸如洋红、橙色、黄色和水青色(aquacyan)这类高度可见的颜色。这些优点对于宽动态范围和宽对比度范围图像是特别重要的。
图4是一个的流程图,其展示出在图像压缩系统中用于编码附加的色度通道的一个说明性方法(其可以由计算机实现)步骤401在一个图像压缩系统中,确定一个用于图像的最佳亮度表示,该图像基于宽的动态范围和最高的分辨率来选择,包括可选择的不可见光波长图像信号。
步骤402确定n个附加的色度通道以显示图像,其中n至少为3。
步骤403选择性地,对于每个色度通道,确定是否有区别地相对于亮度和/或一个或多个其他色度通道编码是有益的。
步骤404对每个来自输入的色度通道图像信号,相对于亮度图像信号确定所期望的分辨率,使得分辨率等于或者小于亮度的分辨率,并且可选择施行分辨率降低。
步骤405利用运动补偿压缩来压缩该Y+n个色度图像信号。
步骤406解压缩该Y+n个色度图像(通常是在不同的计算机中)。
步骤407如果施行分辨率降低,则恢复色度通道的原始分辨率。
步骤408将每个色度通道与其在上面步骤403中的不同的对应色度通道组合(如果有的话)。
步骤409选择性地执行下列任一步骤a)将色度通道转换到一个诸如RGB的可见空间,或者转换到具有三个以上基色的空间,并且视作一个真彩色图像;b)执行a)的转换,但是视作一个伪彩色图象(如将红外光映射为绿色光);c)使用色度通道而不为处理和/或分析做转换。
作为另一个选择,每个色度通道可以相对于对亮度通道所用的QP值,具有一个施用的偏置(增加或者减少)的QP值,从而对每个色度通道获得期望的质量等级(即折衷色度噪声与较高的压缩度)。
实施例本发明可以以硬件或者软件、或者两者的结合(例如可编程逻辑阵列)来实现。除非另行说明,作为本发明的一部分包括的算法不是固有地与任何特定的计算机或者其他装置相关的。尤其是各种各样的通用设备可以借助于根据此处指导而编写的程序而进行使用,或者更方便的是可以构成专用装置(如集成电路)以执行特定的功能。因此,本发明可以以一个或多个执行于一个或多个可编程计算机系统上的计算机程序实现,该可编程计算机系统各自包括至少一个处理器、至少一个数据存储系统(包括易失和非易失性存储器和/或存储单元)、至少一个输入装置或者端口、及至少一个输出装置或者端口。程序代码被用于输入数据,以执行在此处描述的功能和产生输出信息。该输出信息被以公知的方式用于一个或多个输出设备。
每个上述程序可以以任一种所需的计算机语言(包括机器语言、汇编语言、或者高级过程语言、逻辑语言、或者面向对象的编程语言)与一个计算机系统通信。总之,所述语言可以是一种被编译或者被解释的语言。
每个上述计算机程序最好是被存储或者下载到一个由通用或专用的可编程计算机可读的存储介质或者装置(例如固态存储器或者是或为磁性或为光学介质的介质)上,以便当该存储介质或者装置被该计算机系统读取时配置和操作计算机,从而执行在此处描述的步骤。本发明的系统也可以被设想作为一个借助于计算机程序配置的计算机可读存储介质而实现,其中存储介质被配置得使该计算机系统以特定的和预先确定的方式工作,以执行在此处描述的功能。
已经描述了本发明的多个实施例。然而应理解,不脱离本发明的精神和范围可以进行各种各样的修改。例如,以上描述的某些步骤可以单独排序,因此能够以不同于所描述的顺序执行。因此,其他实施例落在所附权利要求的范围内。
权利要求
1.一种用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息的方法,包括选择用于该彩色视频图像的红色成分的分辨率,使其高于用于该彩色视频图像的蓝色成分的分辨率。
2.一种用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息的方法,包括(a)沿着该彩色视频图像的水平和垂直图像轴中的至少一个,将该彩色视频图像的蓝色成分下行过滤成为具有第一分辨率的己处理的蓝色成分;和(b)将该彩色视频图像的红色成分过滤成为具有高于该第一分辨率的第二分辨率的已处理的红色成分。
3.根据权利要求2的方法,其中沿着该彩色视频图像的水平和垂直图像轴中的至少一个,该第二分辨率处于该红色成分的全分辨率的0.5至1.0的范围中。
4.根据权利要求2的方法,进一步包括至少将该己处理的蓝色和红色成分压缩成为压缩输出图像。
5.根据权利要求4的方法,进一步包括将该压缩输出图像解压缩以获得未压缩的处理后蓝色和红色成分。
6.根据权利要求5的方法,进一步包括将该处理后蓝色和红色成分扩大过滤到该彩色视频图像的全分辨率。
7.根据权利要求1或2的方法,其中该视频图像压缩系统是一种运动补偿视频图像压缩系统。
8.一种用于在压缩期间利用量化参数(QP)而在YUV视频图像压缩系统中的彩色视频图像的压缩期间降低色度噪声的方法,该方法包括对于彩色视频图像的Y彩色通道利用第一QP值,而对于该彩色视频图像的U和V彩色通道中的至少其中之一利用第二QP值,其中该第二QP值小于该第一QP值。
9.根据权利要求8的方法,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
10.根据权利要求8的方法,进一步包括在施加该第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像。
11.根据权利要求10的方法,进一步包括使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像。
12.一种用于利用量化参数(QP)而在YUV视频图像压缩系统中的彩色视频图像的压缩期间实现更高压缩的方法,该方法包括对于彩色视频图像的Y彩色通道利用第一QP值,而对于该彩色视频图像的U和V彩色通道中的至少一个利用第二QP值,其中该第二QP值小于该第一QP值。
13.根据权利要求12的方法,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
14.根据权利要求12的方法,进一步包括在施加该第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像。
15.根据权利要求14的方法,进一步包括使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像。
16.一种用于在视频图像压缩系统中改善最初表示为线性RGB像素值的视频图像的色空间的编码效率的方法,包括将该视频图像的线性RGB像素值转换成为亮度和色度通道信息的对数表示。
17.根据权利要求16的方法,其中的转换包括应用下列公式以获得该视频图像的YUV对数表示Ylog=Log(Wr*R+Wg*G+Wb*B)U色度通道=Log(R)-YlogV色度通道=Log(B)-Ylog其中Wr、Wg和Wb是对于该视频图像的亮度的红色、绿色和蓝色成分的线性加权。
18.根据权利要求17的方法,进一步包括降低该YUV对数表示的U和V色度通道的分辨率。
19.根据权利要求17的方法,进一步包括将该视频图像的YUV对数表示压缩成为压缩视频图像。
20.根据权利要求19的方法,进一步包括将该压缩视频图像解压缩成为该视频图像的被恢复的YUV对数表示。
21.根据权利要求20的方法,进一步包括将该视频图像的被恢复的YUV对数表示转换成为线性RGB像素值。
22.根据权利要求21的方法,其中的转换包括应用下列公式以获得该线性RGB像素值R=逆log(Y+U)B=逆log(Y+V)G=(逆log(Y)-Wr*R-Wb*B)/Wg。
23.一种在图像压缩系统中用于改善彩色视频图像的图像特征的方法,包括(a)选择一组图像通道以表示该彩色视频图像,包括一个亮度通道和n个色度通道,其中n至少是3;和(b)将该亮度通道和该n个附加的色度通道压缩成为压缩视频图像。
24.根据权利要求23的方法,其中至少一个色度通道代表不可见光波长。
25.根据权利要求23的方法,其中该亮度通道是具有最高的动态范围和分辨率的图像通道。
26.根据权利要求23的方法,进一步包括独立于各其他通道而编码每个色度通道。
27.根据权利要求23的方法,进一步包括相对于选定的另一通道而有区别地编码每个色度通道。
28.根据权利要求23的方法,进一步包括降低至少一个色度通道的分辨率。
29.根据权利要求23的方法,进一步包括施加一个量化参数(QP)值给至少一个色度通道,该至少一个色度通道是相对于一个施加给该亮度通道的QP值偏置的。
30.一种存储在计算机可读介质上的计算机程序,用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息,该计算机程序包括指令,用以使计算机许可选择该彩色视频图像的红色成分的分辨率,使其高于用于该彩色视频图像的蓝色成分的分辨率。
31.一种存储在计算机可读介质上的计算机程序,用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息,该计算机程序包括指令,用以使得计算机(a)沿着该彩色视频图像的水平和垂直图像轴中的至少一个,将该彩色视频图像的蓝色成分下行过滤成为具有第一分辨率的己处理的蓝色成分;和(b)将该彩色视频图像的红色成分过滤成为具有高于该第一分辨率的第二分辨率的已处理的红色成分。
32.根据权利要求31的计算机程序,其中沿着该彩色视频图像的水平和垂直图像轴中的至少一个,该第二分辨率处于该红色成分的全分辨率的0.5至1.0的范围中。
33.根据权利要求31的计算机程序,进一步包括用以使该计算机至少将该已处理的蓝色和红色成分压缩成为压缩输出图像的指令。
34.根据权利要求33的计算机程序,进一步包括用以使该计算机将该压缩输出图像解压缩以获得未压缩的处理后蓝色和红色成分的指令。
35.根据权利要求34的计算机程序,进一步包括用以使该计算机将该处理后蓝色和红色成分扩大过滤到该彩色视频图像的全分辨率的指令。
36.根据权利要求30或31的计算机程序,其中该视频图像压缩系统是一种运动补偿视频图像压缩系统。
37.一种存储在计算机可读介质上的计算机程序,用于在压缩期间利用量化参数(QP)而在YUV视频图像压缩系统中的彩色视频图像的压缩期间降低色度噪声,该计算机程序包括用以使计算机利用第一QP值和第二QP值的指令,该第一QP值用于彩色视频图像的Y色度通道,而该第二QP值用于该彩色视频图像的U和V色度通道中的至少其中之一,其中该第二QP值小于该第一QP值。
38.根据权利要求37的计算机程序,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
39.根据权利要求37的计算机程序,进一步包括用以使该计算机在施加第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像的指令。
40.根据权利要求39的计算机程序,进一步包括用以使得解压缩计算机使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像的指令。
41.一种存储在计算机可读介质上的计算机程序,用于在压缩期间利用量化参数(QP)而在YUV视频图像压缩系统中的彩色视频图像的压缩期间获得更高的压缩,该计算机程序包括用于使计算机利用第一QP值和第二QP值的指令,该第一QP值用于彩色视频图像的Y色度通道,而该第二QP值用于该彩色视频图像的U和V色度通道中的至少其中之一,其中该第二QP值大于该第一QP值。
42.根据权利要求41的计算机程序,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
43.根据权利要求41的计算机程序,进一步包括用以使该计算机在施加该第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像的指令。
44.根据权利要求41的计算机程序,进一步包括用以使得解压缩计算机使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像的指令。
45.一种存储在计算机可读介质上的计算机程序,用于在视频图像压缩系统中改善最初表示为线性RGB像素值的视频图像的色空间表示的编码效率,该计算机程序包括用以使计算机将该视频图像的线性RGB像素值转换成为亮度和色度通道信息的对数表示的指令。
46.根据权利要求45的计算机程序,其中用以使该计算机转换的指令包括用以使计算机应用下列公式以获得该视频图像的YUV对数表示的指令Ylog=Log(Wr*R+Wg*G+Wb*B)U色度通道=Log(R)-YlogV色度通道=Log(B)-Ylog其中Wr、Wg和Wb是对于该视频图像的亮度的红色、绿色和蓝色成分的线性加权。
47.根据权利要求46的计算机程序,进一步包括用以使该计算机降低该YUV对数表示的U和V色度通道的分辨率的指令。
48.根据权利要求46的计算机程序,进一步包括用以使该计算机将该视频图像的YUV对数表示压缩成为压缩视频图像的指令。
49.根据权利要求48的计算机程序,进一步包括用以使得解压缩计算机将该压缩的视频图像解压缩成为该视频图像的被恢复的YUV对数表示的指令。
50.根据权利要求49的计算机程序,进一步包括用以使得该解压缩计算机将该视频图像的被恢复的YUV对数表示转换成为线性RGB像素值的指令。
51.根据权利要求50的计算机程序,其中用以使该计算机转换的指令包括用以使计算机应用下列公式以获得该线性RGB像素值的指令R=逆log(Y+U)B=逆log(Y+V)G=(逆log(Y)-Wr*R-Wb*B)/Wg。
52.一种存储在计算机可读介质上的计算机程序,用于在图像压缩系统中改善彩色视频图像的图像特征,该计算机程序包括指令,用以使得计算机(a)选择一组图像通道以表示该彩色视频图像,包括一个亮度信道和n个色度通道,其中n至少是3;和(b)将该亮度信道和该n个附加的色度通道压缩成为压缩视频图像。
53.根据权利要求52的计算机程序,其中至少一个色度通道代表不可见光波长。
54.根据权利要求52的计算机程序,其中该亮度通道是具有最高的动态范围和分辨率的图像通道。
55.根据权利要求52的计算机程序,进一步包括用以使计算机独立于各其他通道而编码每个色度通道的指令。
56.根据权利要求52的计算机程序,进一步包括用以使计算机相对于选定的另一通道而有区别地编码每个色度通道的指令。
57.根据权利要求52的计算机程序,进一步包括用以使计算机降低至少一个色度通道的分辨率的指令。
58.根据权利要求52的计算机程序,进一步包括用以使计算机施加一个量化参数(QP)值给至少一个色度通道的指令,该至少一个色度通道是相对于一个施加给该亮度通道的QP值偏置的。
59.一种用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息的系统,包括(a)用于选择该彩色视频图像的红色成分的分辨率而使其高于用于彩色视频图像的蓝色成分的分辨率的装置;和(b)用于施加所选择的分辨率以压缩该彩色视频图像的装置。
60.一种用于在视频图像压缩系统中压缩彩色视频图像的图像色度信息的系统,包括装置用于(a)沿着该彩色视频图像的水平和垂直图像轴中的至少一个,将该彩色视频图像的蓝色成分下行过滤成为具有第一分辨率的已处理的蓝色成分;和(b)将该彩色视频图像的红色成分过滤成为具有高于该第一分辨率的第二分辨率的已处理的红色成分。
61.根据权利要求60的系统,其中沿着该彩色视频图像的水平和垂直图像轴中的至少一个,该第二分辨率处于该红色成分的全分辨率的0.5至1.0的范围中。
62.根据权利要求60的系统,进一步包括用于至少将该已处理的蓝色和红色成分压缩成为压缩输出图像的装置。
63.根据权利要求62的系统,进一步包括用于将该压缩输出图像解压缩以获得未压缩的处理后蓝色和红色成分的装置。
64.根据权利要求63的系统,进一步包括用于将该处理后蓝色和红色成分扩大过滤到该彩色视频图像的全分辨率的装置。
65.根据权利要求59或60的系统,其中该视频图像压缩系统是一种运动补偿视频图像压缩系统。
66.一种用于在压缩期间利用量化参数(QP)而在YUV视频图像压缩系统中的彩色视频图像的压缩期间降低色度噪声的系统,包括(a)用于利用第一QP值和第二QP值的装置,该第一QP值用于彩色视频图像的Y色度通道,而该第二QP值用于该彩色视频图像的U和V色度通道中的至少其中之一,其中该第二QP值小于该第一QP值;和(b)用于在该彩色视频图像压缩期间施加该选择的QP值的装置。
67.根据权利要求66的系统,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
68.根据权利要求66的系统,进一步包括用于在施加该第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像的装置。
69.根据权利要求68的系统,进一步包括用于使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像的装置。
70.一种在压缩期间利用量化参数(QP)而在YUV视频图像压缩系统中的压缩彩色视频图像期间用于实现更高压缩的系统,包括(a)用于利用第一QP值和第二QP值的装置,该第一QP值用于彩色视频图像的Y色度通道,而该第二QP值用于该彩色视频图像的U和V色度通道中的至少其中之一,其中该第二QP值大于该第一QP值;(b)用于在该彩色视频图像的压缩期间施加所选择的QP值的装置。
71.根据权利要求70的系统,其中该第二QP值是通过对该第一QP值施加一个偏置值来确定的。
72.根据权利要求70的系统,进一步包括用于在施加该第一和第二QP值之后,将该彩色视频图像压缩成为压缩输出图像的装置。
73.根据权利要求72的系统,进一步包括用于使用该第一和第二QP值解压缩该压缩输出图像,以获得未压缩的视频图像的装置。
74.一种用于在视频图像压缩系统中改善最初表示为线性RGB像素值的视频图像的色空间表示的编码效率的系统,包括(a)用于输入视频图像的线性RGB像素值的装置;和(b)用于转换该视频图像的线性RGB像素值为亮度和色度通道信息的对数表示的装置。
75.根据权利要求74的系统,其中的转换包括应用下列公式以获得该视频图像的YUV对数表示Ylog=Log(Wr*R+Wg*G+Wb*B)U色度通道=Log(R)-YlogV色度通道=Log(B)-Ylog其中Wr、Wg和Wb是对于该视频图像的亮度的红色、绿色和蓝色成分的线性加权。
76.根据权利要求75的系统,进一步包括用于降低该YUV对数表示的U和V色度通道的分辨率的装置。
77.根据权利要求75的系统,进一步包括用于将该视频图像的YUV对数表示压缩成为压缩视频图像的装置。
78.根据权利要求77的系统,进一步包括用于将该压缩视频图像解压缩成为该视频图像的被恢复的YUV对数表示的装置。
79.根据权利要求78的系统,进一步包括用于将该视频图像的被恢复的YUV对数表示转换成为线性RGB像素值的装置。
80.根据权利要求79的系统,其中的转换包括应用下列公式以获得该线性RGB像素值R=逆log(Y+U)B=逆log(Y+V)G=(逆log(Y)-Wr*R-Wb*B)/Wg。
81.一种用于在图像压缩系统中改善彩色视频图像的图像特征的系统,包括装置(a)选择一组图像通道以表示该彩色视频图像,包括一个亮度信道和n个色度通道,其中n至少是3;和(b)将该亮度信道和该n个附加的色度通道压缩成为压缩视频图像。
82.根据权利要求81的系统,其中至少一个色度通道代表不可见光波长。
83.根据权利要求81的系统,其中该亮度通道是具有最高的动态范围和分辨率的图像通道。
84.根据权利要求81的系统,进一步包括用于独立于各其他通道而编码每个色度通道的装置。
85.根据权利要求81的系统,进一步包括用于相对于选定的另一通道而有区别地编码每个色度通道的装置。
86.根据权利要求81的系统,进一步包括用于降低至少一个色度通道的分辨率的装置。
87.根据权利要求81的系统,进一步包括用于施加一个量化参数(QP)值给至少一个色度通道的装置,该至少一个色度通道是相对于一个施加给该亮度通道的QP值偏置的。
全文摘要
用于改善压缩的图像色度信息的方法、系统和计算机程序。在本发明的一个方面中,对于彩色视频图像的红色成分使用的分辨率高于对于该彩色视频图像的蓝色成分使用的分辨率。另一个方面包括与该亮度信号通道相比较,对于一个或多个色度通道利用更低或者更高的量化参数(QP)值。另一个方面是使用视频图像的对数表示以对图像编码有益。另一个方面使用二个以上的色度通道表现一个视频图像。
文档编号H04N7/12GK1526236SQ02813792
公开日2004年9月1日 申请日期2002年7月12日 优先权日2001年7月12日
发明者G·A·迪莫斯, G A 迪莫斯 申请人:杜比实验室认证公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1