用于处理图像、视频和/或音频类型的数字文件的方法

文档序号：7851064阅读：626来源：国知局

专利名称：用于处理图像、视频和/或音频类型的数字文件的方法
技术领域：
本发明涉及一种用于处理数字文件，特别是图像、视频和/或音频类型的数字文件的方法。
背景技术：
本发明具体地但非专门地用来处理最初以原始格式出现的并包含至少两个值子集的文件。更具体地，本发明提出一种处理操作，该操作包含压缩阶段，通过该阶段可获取一个压缩文件，该压缩文件的值相对于原始文件中的值具有减小的幅度，而后是恢复阶段，通过该恢复阶段，可从压缩文件中获取一个文件，该文件的值的幅度与原始文件的值的幅度相似。一般的，现在众所周知的是，至少有三种通过对图像或视频文件进行亚采样的压缩算法，即，颜色指数化，YCbC;亚采样(对于视频，也被称为YUV)和亮度标准的减少。颜色指数化方法包含将图像的三个RGB分量减少为单一分量，其编码为8比特。使用该指数化方法，能够获取显著的压缩增益，因为系统仅对三分之一的原始信息进行编码。该指数化方法被划分为两种可选方法-静态指数化方法，也被称为通过诱发的调色板的指数化，其包含为每个像素设定系统可用的256个组合之一，以及-动态指数化方法，也被称为通过建立的调色板的指数化，其强制对不同颜色的每个组合所表示的三个字节的8比特进行存储。用于色度减少的YCbCr (或YUV)亚采样涉及三个不同的信号，即-所谓的Y亮度信号，由原始RGB信号根据眼睛敏感度曲线加权得到Y = O. 299R+0. 587G+0. 114B-根据两个互补的所谓的色度信号，可以获取Cb和C；信息Cb = -0. 169R-0. 331G+0. 500B+128Cr = 0. 500R-0. 419G-0. 080B+128使用该方法，亮度Y可使用宽的带宽发送，这显著地削减了被分配给由Cb和C；承载的色度信息的传输频带(抑制涉及不被用户察觉的精细细节的颜色信息)。用于减少亮度标准的方法包含基于确定的比例减少值的亮度等级，还包含使用从压缩阶段选择的恒定的误差率，将减小的值恢复为它们的原始亮度标准。通过该设计，能够校正由该压缩方法产生的某些误差。该方法尤其具有以下优点a)它例如将在恢复值和原始值之间的误差的范围减少到包含在“_2”和“+2”之间
的偏差。b)它例如减小被发送到编码器的值的高度并因此使得这些值能够用18比特编码，而这些值通常应该在YCbC,亚采样中用M比特编码。c)因为值的数量和它们的高度的减小，它减少要编码的值的数量。它还进一步使
5得颜色数量减少。d)它使得所有类型的静态和动态图像能够被处理，特别是具有单一分量或多个分量的图像。e)它是自含式的压缩方法或模块，可被集成到现有的压缩链中。f)使用该方法，已被压缩为Jpeg或Mpeg文件的文件可以以执行方式被“再压缩”。g)类似解压缩，它使用受限数量的操作来用于压缩。但是前述压缩方法有一些缺点。因此，尤其是，已知通过静态或动态指数化的亚采样的限制为-静态指数化是重大误差的根源。进一步，该压缩方法类似于黑白图像的压缩，对黑白图像很难大幅度减小唯一的分量，否则无法恢复。-动态指数化被证明为当处理由很大数量的颜色组合所定义的图像，诸如照片时，是无效率的成千上万颜色的指数化还必须存储与图像的颜色分量的数量相乘的成千上万字节的引用。-YCbCr亚采样因为四个理由，仅仅是不完美地处理了图像的压缩问题a)它的设计将其限制为RGB图像的处理。实际上，该方法并非设计为处理由1、2 至4色分量所组成的文件，像黑白图像，双色图像和CMJN文件。b)它不是自含式的压缩处理。实际上，它没有产生足够的文件变换以使它可以是自含式的压缩处理。单独使用的话，YC1A亚采样仅生成低压缩率。这就是公知标准对其增加其他算法步骤的原因。c) YCbCr亚采样在原理上是误差传播矢量。实际上，使用该方法，不能在原始值和恢复值之间建立一对一的关系。在这些值间的偏差一般位于“-1”和“+1”之间。当压缩系统使用YCbC, “4. 2. 2”亚采样时，这些偏差甚至可被裸眼察觉。在解压缩中，该方法使用在压缩文件的两个连续值间添加一个等于两个压缩值的平均值的附加值的内插方法，该附加值被设定为替换在压缩处理中被抑制的值。该方案导致偏差，该偏差位于“-128”和“+128”之间，即可到达“255”。d)YCbCr亚采样导致不平衡的色度退化。实际上，一方面通过收集关于单个分量一Y分量的图像的所有细节，而另一方面通过收集关于“cb”和“C/’分量的颜色信息 (理解为图像的原始颜色的综合)，由于信息的差别化处理，亚采样导致恢复更多可见的缺陷，其中Y分量不能被大幅度压缩，否则会迅速达到图像的不可恢复的退化，“cb”和“C/’分量被更强地量化。相反地，在统计上和原理上，可以看出以相同比率减小颜色像素的子像素是更为成本有效的让不同子像素间出现的亮度差的风险实际上显著少于对子像素进行差别量化的情形。现在，这是可对亚采样压缩提出的主要批评。实际上，因为视网膜滞留，正是亮度差，尤其是在子像素间的亮度差，使得缺陷更加可见。因此，优选的是对于所有子像素，子像素的亮度应该基于相同比率并在相同方向上变化(假定离原始亮度不是很远)。e)通过减少亮度标准的压缩方法，具有以下缺点.它没有足够地减小将亮度减少的文件的值拉开距离的偏差。在这点上，需要提醒的是，为获取压缩的性能，这些值之间的步长的减小是决定性的因素。现在，不管所有那些
6此外积累的，明确的是在该用于减少亮度的标准的方法中缺少该特性。.它不是为不带任何可感知的退化地压缩最大256色的图像而设计。.因为它的定义，该方法不能应用于音频文件的压缩。对于音频文件，亚采样技术是根据“N”均值的方法，基于简单的数学公式，其包含减少每秒原始采样的数量。例如对于将一个44，IOOkHz的文件亚采样到一个22，050kHz的文件，该方法执行采样的值的两两平均。只保留代表两个采样中的一个的平均。从而尽管每个声道还是在16比特上编码，但原始文件的字节量被减半。

发明内容
更具体地，本发明的目地在于处理由用于呈现图像、视频和用于产生声音的新方法的压缩所提出的新挑战，这要求更好的质量和更小的压缩。为了这个目的，它提出一种用于压缩数字文件的方法，包含-用于将任何音频、图像和视频文件的数字数据按照每一颜色层和/或每一音频声道排列成行的阶段，以及压缩阶段，在该压缩阶段中利用算法将所述文件的值连续地压缩，在该算法中通过从原始文件的行N的值Vn减去预定数目的事先算出的连续的压缩值 (VCV1，VCN_2，...),来获取同一行N的每个压缩值(即，VCn)；以及-恢复阶段，其中利用算法将压缩文件的每个值恢复到接近原始文件的相应值的值，在该算法中通过对压缩文件的行N的值VCn加上预定数目的连续的恢复值(VCV1， VCN_2，...)，来获取同一行的每个恢复值(即，VDn)。因此，压缩算法可以是以下形式VC1 =四舍五入到最接近单位[(Vfh) X k]VC2 =四舍五入到最接近单位[(V2-VCfh) X k]VC3 =四舍五入到最接近单位[(V3-VC2-VCrh) X k]........................VCn =四舍五入到最接近单位[(VN-VCH-VCM-h) X k]公式1其中的关系VCn是压缩文件的行N的值，VCV1是压缩文件的行N-I的事先算出的值，VCN_2是压缩文件的行N-2的事先算出的值，Vn是原始文件的行N的值，
k和h是基于寻求的压缩等级而变化的压缩系数，例如等级l，k=+’h=l等级2，k=+，h = 3等级3，k=+，h = 10。恢复算法可以是以下形式VD1=IVC^hVD2=+VC2+VCrHiVD3=I VC3+ VC2+ VQ+h
........................
权利要求
1.一种用于处理特别是图像、视频和/或音频类型的数字文件的方法，其特征在于包括-用于将任何音频、图像和视频文件的数字数据按照每一颜色层和/或每一音频声道排列成线的阶段，在压缩阶段中利用算法连续地压缩所述文件的值，在该算法中通过从原始文件的行N的值Vn减去预定数目的预先算出的连续的压缩值(VCV1，VCN_2，...),来获取同一行N的每个压缩值VCn ；以及-恢复阶段，在该恢复阶段中利用算法将压缩文件的每个值恢复到接近原始文件的相应值的值，在该算法中通过对压缩文件的行N的值VCn加上预定数目的连续的恢复值 (VCV1，VCN_2，...)，来获取同一行的每个恢复值VDn。
2.如权利要求1所述的方法，其特征在于压缩算法是以下形式 VC1 =四舍五入到最接近单位[(Vfh) Xk]VC2 =四舍五入到最接近单位[(V2-VCrh) Xkl VC3 =四舍五入到最接近单位[(V3-VC2-VC1-I1) Xk]VCn =四舍五入到最接近单位[(VN-VCN_「VCN_2-h) Xk]公式1 其中的关系VCn是压缩文件的行N的值，VCn^1是压缩文件的行N-I的事先算出的值，VCN_2是压缩文件的行N-2的事先算出的值，Vn是原始文件的行N的值，k和h是基于寻求的压缩等级而变化的压缩系数。
3.如权利要求2所述的方法，其特征在于 -对于等级l，lc=+，h= 1-对于等级2，k=+，h = 3 -对于等级3，k=+，h = 10。
4.如之前任意一个权利要求所述的方法，其特征在于恢复算法是以下形式 VD1=I VCfHh
5.如权利要求1所述的方法，用于处理包含至少两组值的文件，其特征在于包括 -预备阶段，用于从两组中选择一组，隔开该组中的数字值的平均偏移大于隔开另一组中的值的平均偏移，-用于使用之前描述的类型的压缩算法来压缩所选组的阶段，例如以下类型VCn =四舍五入到最接近单位[(VN-VCN_「VCN_2-h) Xk]公式1-用于使用涉及每个值的计算的压缩算法来压缩第二组的阶段VC' i =四舍五入到最接近单位[(V’ rh) Xk]VC' 2 =四舍五入到最接近单位[(V’ 2-vcrh) Xk]VC' 3 =四舍五入到最接近单位[(V’ ,-W2-W1-W Xk]VC' N =四舍五入到最接近单位[(V’ N-VCN_rVCN_2-h) Xk]公式3 公式中V’，是第二文件的行N的值， VCV1是第一文件的行N-I的压缩值， VCN_2是第一文件的行N-2的压缩值。
6.如权利要求5所述的方法，其特征在于前述第一组的值的恢复基于以下恢复算法而执行
7.如权利要求1所述的方法，其特征在于包含-使用以下形式算法的压缩阶段VC1 =四舍五入到最接近单位
全文摘要
一种用于处理图像，视频和/或音频类型的数字文件的方法，其包含用于将任何音频、图像和视频文件的数字数据按照每一颜色层和/或每一音频声道排列成行的阶段，使用其中通过从原始文件的位置N的值Vn减去预定数目的预先计算的连续压缩值(VCn-1，VCn-2，...)而获取的同一位置N的每个压缩值VCn的算法的压缩阶段，以及使用其中通过使压缩文件的位置N的值VCn加上预定数目的预先计算的连续压缩值(VCn-1，VCn-2，...)而获取的同一位置的每个恢复值VDn的算法的恢复阶段。
文档编号H04N7/34GK102369734SQ200980158432
公开日2012年3月7日申请日期2009年4月3日优先权日2009年4月3日
发明者M-E·格尔维斯坦申请人:I-Ces(创新压缩工程解决方案)公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｍ－Ｅ·格尔维斯坦
技术所有人：Ｉ－ＣＥＳ（创新压缩工程解决方案）公司
我是此专利的发明人

上一篇：生成dft系数的方法
上一篇：用于确定终端位置的方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。