视频编码方法

文档序号：7866683阅读：270来源：国知局

专利名称：视频编码方法
技术领域：
本发明涉及视频技术领域，尤其涉及一种视频编码方法。
背景技术：
在视频压缩领域，为了能够更好的改善压缩效率，越来越多的编码模式被引入到了编码标准中。例如，在最新的视频编码标准H.264/AVC中，共有超过十多种的编码模式以供选择，而选择何种编码模式作为视频宏块的最佳编码模式是非常重要。为了确定最佳编码模式，通常采用率失真优化(Rate-distortion optimization,简称:RD0)技术。具体的，RDO的表达式如下:min {J}, where J=D+λ XR其中J是率失真代价，R是一个编码单元的编码比特数，λ是拉格朗日乘子。较早的，由Gary J.Sullivan 和 Thomas Wiegand 在 1998 年的 SignalProcessingMagazine 的第 15 卷第 74-90 页的“Rate-distortion Optimization forVideoCompression” 一文中提出的率失真模型被应用于常见的混合编码标准，比如H.263和
H.264/AVC。但是，在这个模型中，拉格朗日乘子是固定的。为了使拉格朗日乘子更具有自适应性，Lulin Chen 和 Ilie Garbacea 在 2006 年 VCIP 的第 6077 卷第 1-8 页的“AdaptiveLambda Estimation inLagrangian Rate-distortion Optimization for Video Coding，，中提出了一种自适应的基于P-范围的拉格朗日乘子估计算法。但是在这个方法中，由于R和D被直接引入到了拉格朗日乘子的计算公式中，但由于R和D的误差问题导致拉格朗日乘子的计算不稳定。Xiang Li> Norbert Oertel、Andreas Hutter 和 AndreKaup 在 2009年 TCSVT 的第 19 卷的第 193-205 页的 “LaplaceDistribution Based Lagrangian RateDistortion Optimization for Hybrid VideoCoding” 中提出了一种基于变换残差拉普拉斯分布的动态RDO模型。但在上述的这些模型中，RDO过程中所采用的失真度量方式，比如SSE和MSE，都是客观上的，未充分考虑人眼主观视觉特性，即具有相同MSE失真的两幅图像可能会表现出完全不同的感知失真。最近，为了解决这个问题，Zhou Wang在2004年的TIP第13卷第600-612页的“Image Quality Assessment:From Error Visibility to StructuralSimilarity，，中提出空域质量(Structural Similarity Index Measurement,简称:SSIM)指标。SSIM 已经被证明可以在编码效率和失真性能之间取得很好的平衡，但是，SSIM是针对静态图像提出的，所以应用到视频中时只能考虑到视频的空域特征。事实上，视频的时域特征对人眼视觉感知也有很大的影响。因此，现有技术中未充分考虑人眼主观视觉特性及视频的时域特性获取的率失真代价不够准确，而根据率失真代价确定的视频编码模式对于待编码视频来说也是不合适的，从而采用不合适的编码模式对视频编码重建后使视频观看效果不佳
发明内容
本发明提供一种视频编码方法，通过该方法对视频编码后不影响视频的观看效
果O本发明第一方面提供一种视频编码方法，包括:分别确定至少两种编码模式对视频序列当前视频帧的原始宏块进行编码的率失真代价，且根据率失真代价为所述当前视频帧的原始宏块选择编码模式，其中，确定每种编码模式对视频序列当前视频帧的原始宏块进行编码的率失真代价的操作包括:采用所述编码模式对当前视频帧中的原始宏块进行编码，以获取编码码流和编码码率，且对所述编码码流进行重建，以获取重建宏块；根据所述原始宏块与所述重建宏块之间的空时相似性度量，获取宏块失真量；根据所述编码码率和所述宏块失真量的关系模型获取拉格朗日乘子；根据所述编码码率、所述宏块失真量及所述拉格朗日乘子确定所述编码模式对应的率失真代价。结合第一方面，在第一实现方式中，每个视频帧中原始宏块包括至少一个原始图像块，所述重建宏块包括至少一个与所述原始图像块对应的重建图像块，则所述根据所述原始宏块与所述重建宏块之间的空时相似性度量，获取宏块失真量，包括:根据当前视频帧中原始宏块的各个原始图像块与重建宏块的各个重建图像块的图像参数获取各个空域质量；分别根据当前视频帧与历史帧中各个原始图像块与各个重建图像块对应的图像参数获取各个时域质量；根据各个空域质量和各个时域质量获取各个所述原始图像块与重建图像块之间的各个预处理空时相似性度量；根据各个所述预处理空时相似性度量获取所述原始宏块与所述重建宏块之间的空时相似性度量；根据所述空时相似性度量获取宏块失真量。结合第一实现方式，在第二实现方式中，根据当前视频帧中每个原始图像块与每个重建图像块的图像参数获取空域质量，包括:根据公式(I)计算空域质量SSIM(x, y):
权利要求
1.种视频编码方法，其特征在于，包括: 分别确定至少两种编码模式对视频序列当前视频帧的原始宏块进行编码的率失真代价，且根据率失真代价为所述当前视频帧的原始宏块选择编码模式，其中，确定每种编码模式对视频序列当前视频帧的原始宏块进行编码的率失真代价的操作包括: 采用所述编码模式对当前视频帧中的原始宏块进行编码，以获取编码码流和编码码率，且对所述编码流进行重建，以获取重建宏块；根据所述原始宏块与所述重建宏块之间的空时相似性度量，获取宏块失真量；根据所述编码码率和所述宏块失真量的关系模型获取拉格朗日乘子；根据所述编码码率、所述宏块失真量及所述拉格朗日乘子确定所述编码模式对应的率失真代价。
2.据权利要求1所述的方法，其特征在于，每个视频帧中原始宏块包括至少一个原始图像块，所述重建宏块包括至少一个与所述原始图像块对应的重建图像块，则所述根据所述原始宏块与所述重建宏块之间的空时相似性度量，获取宏块失真量，包括: 分别根据当前视频帧中原始宏块的各个原始图像块与重建宏块的各个重建图像块的图像参数获取各个空域质量；分别根据当前视频帧与历史帧中各个原始图像块与各个重建图像块对应的图像参数获取各个时域质量；根据各个所述空域质量和各个时域质量获取各个所述原始图像块与重建图像块之间的各个预处理空时相似性度量；根据各个所述预处理空时相似性度量获取所述原始宏块与所述重建宏块之间的空时相似性度量；根据所述空时相似性度量获取宏块失真量。
3.据权利要求2所述的方法，其特征在于，根据当前视频帧中每个原始图像块与每个重建图像块的图像参数获取空域质量，包括: 根据公式(I)计算空域质量SSM(x，y):
4.据权利要求3所述的方法，其特征在于，根据当前视频帧与历史帧中每个原始图像块与每个重建图像块对应的图像参数获取时域质量，包括: 根据公式(2)计算时域质量SSIM3D(x，y):
5.据权利要求4所述的方法，其特征在于，根据每个所述空域质量和每个时域质量获取所述原始图像块与所述重建图像块之间的每个预处理空时相似性度量包括: 根据公式(3)计算每个预处理空时相似性度量stVSSM' (X，y): stVSSM' (x, y) =SSIM(x, y) XSSIM3D(x, y)(3)
6.据权利要求5所述的方法，其特征在于，根据各个所述预处理空时相似性度量获取所述原始宏块与所述重建宏块之间的空时相似性度量包括: 计算各个所述预处理空时相似性度量的平均值，以获取所述原始宏块与所述重建宏块之间的空时相似性度量。
7.据权利要求6所述的方法，其特征在于，所述根据所述空时相似性度量获取宏块失真量包括: 根据公式(4)计算宏块失真量Dstvssn1: Dstvssn=l-stVSSIM(4) 其中stVSSIM为所述原始宏块与所述重建宏块之间的空时相似性度量。
8.据权利要求1或7所述的方法，其特征在于，所述根据所述编码码率和所述宏块失真量的关系模型获取拉格朗日乘子，包括: 根据第一关系模型与第二关系模型获取所述拉格朗日乘子，其中，所述第一关系模型根据所述编码模式对应的编码码率与宏块失真量的标本视频数据拟合而成，所述第二关系模型根据所述编码模式对应的宏块失真量与量化参数的标本视频数据拟合而成。
9.据权利要求8所述的方法，其特征在于，所述第一关系模型为
10.据权利要求8所述的方法，其特征在于，所述根据所述编码码率和所述宏块失真量的关系模型获取拉格朗日乘子，还包括: 根据所述原始宏块的关注度值获取拉格朗日调节因子；根据所述拉格朗日调节因子和所述拉格朗日乘子获取调节拉格朗日乘子。
11.据权利要求10所述的方法，其特征在于，所述根据所述原始宏块的关注度值获取拉格朗日调节因子，包括:根据原始宏块中像素的关注度值获取原始宏块的关注度值；根据所述当前视频帧中全部原始宏块的关注度的平均值和所述原始宏块的关注度值获取拉格朗日调节因子。
全文摘要
本发明提供一种视频编码方法，该方法包括分别确定至少两种编码模式的率失真代价，并根据率失真代价选择编码模式，其中，确定率失真代价的操作包括根据视频中的原始宏块与重建宏块之间的空时相似性度量，获取宏块失真量；根据所述编码码率和所述宏块失真量的关系模型获取拉格朗日乘子；根据所述编码码率、所述宏块失真量及所述拉格朗日乘子确定所述编码模式对应的率失真代价。由于本发明所确定的宏块失真量更符合人眼的视觉失真感知，且拉格朗日乘子是通过准确的关系模型而获取的，因此确定的率失真代价可真实的反映出编码模式是否适用于视频序列的当前视频帧，从而可准确确定适用于视频的编码模式，使编码后的视频的观看效果处于良好状态。
文档编号H04N7/26GK103096076SQ20121050107
公开日2013年5月8日申请日期2012年11月29日优先权日2012年11月29日
发明者黄庆明, 胡方振, 苏荔, 齐洪钢申请人:中国科学院研究生院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄庆明;胡方振;苏荔;齐洪钢
技术所有人：中国科学院研究生院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。