基于字典学习的图像编码方法及系统的制作方法

文档序号：6499693阅读：318来源：国知局

基于字典学习的图像编码方法及系统的制作方法
【专利摘要】本发明公开了一种基于字典学习的图像编码方法及系统，该方法包括：从图像样本中随机选取图像块，进行基于批处理的稀疏表示，通过交替优化方法求解字典矩阵；根据已获得的字典矩阵，利用批处理的稀疏表示，对待编码图像块进行稀疏表示,并对稀疏系数向量中的非零系数进行量化熵编码；在解码端，根据已获得的字典矩阵，对上述编码后的图像进行解码和稀疏重建。该系统包括：基于批处理的稀疏表示的字典学习模块、图像编码模块、以及图像解码模块。本发明解决了字典学习中训练样本规模大的难题，同时降低了图像样本的重建误差，显著提升图像压缩的率失真性能。
【专利说明】基于字典学习的图像编码方法及系统
【技术领域】
[0001]本发明涉及多媒体信息处理与通信【技术领域】，具体涉及一种基于字典学习的图像编码方法及系统。
【背景技术】
[0002]近些年来，移动互联网用户数飞速增长，人们期望能够获得更高质量的多媒体业务服务。因此，在无线网络带宽依然相对受限的环境下，如何提供高品质的多媒体业务并满足与日俱增的用户体验需求，面临着巨大挑战。例如:移动终端上大量高质量图片、照片的浏览与分享等移动多媒体应用。
[0003]为了解决高质量用户体验需求与有限带宽的矛盾，高质量的图像编码压缩技术十分必要。其中，信号的变换与表示方法被认为是图像编码压缩技术的最核心部分，例如，离散余弦变换(DCT)应用于JPEG图像压缩标准、MPEG4/H.264,HEVC视频压缩标准，离散小波变换应用于JPEG2000图像压缩标准中。然而，DCT和离散小波都是预先定义好的正交完备基信号，用于通用图像、视频压缩，并不考虑图像的内容以及其中的纹理特点。因此，对于图像的纹理特征不具有自适应性。
[0004]近些年来，关于人眼视觉心理学的研究表明，通过从自然图像库中学习得到的过完备信号基更符合人的主观视觉感受。这些通过计算学习获得的信号基组成一个字典矩阵，通过使用其中较少的元素形成某种线形组合，从而对未知图像块进行逼近和重建。其中，求解该线形组合中非零权系数的过程，称为稀疏表示或稀疏编码。在已知大量自然图像样本的前提下，归纳学习获取字典矩阵的过程，称为字典学习。现有的字典学习方法计算复杂度高，算法缓存空间开销大，无法用于大规模图像样本的训练与处理，而现有的在线学习算法虽然为处理大量样本问题提供了可能性，但是训练精度与重建误差较大。
[0005]为了解决这个问题，在保证能够处理大量样本训练的前提下，同时降低重建误差，本发明提出了一种基于批处理的稀疏表不方法(BSR, batch based sparserepresentation),可以提高重建精度，并基于此方法,进行高效在线字典学习。利用该字典，对图像进行稀疏表示，并对直流分量和非零系数及其索引分别进行量化、熵编码，从而提升压缩效率。

【发明内容】

[0006](一)要解决的技术问题
[0007]本发明要解决的技术问题是:提供一种基于字典学习的图像编码方法及系统，其在保证能够处理大量训练样本的前提下，同时降低了图像样本的重建误差，提高了图像压缩的率失真性能。
[0008](二)技术方案
[0009]为解决上述问题，本发明提供了一种基于字典学习的图像编码方法，包括以下步骤:[0010]A、从图像样本中随机选取图像块，进行基于批处理的稀疏表示，通过交替优化方法求解字典矩阵；
[0011]B、根据已获得的字典矩阵，利用批处理的稀疏表示对待编码的图像块进行稀疏表示，并对稀疏系数向量中的非零系数进行量化熵编码；
[0012]C、在解码端，根据已获得的字典矩阵，对上述编码后的图像进行解码和稀疏重建。
[0013]优选地，所述步骤A进一步包括以下步骤:
[0014]A1、从图像样本中随机选取图像块，初始化中间变量矩阵Htl — O、Gtl — O，其中H。为m行m列的实数矩阵，m为字典矩阵的列数，Gtl为η行m列的实数矩阵，η为图象块的维度，—表示初始化运算；初始化字典矩阵Dtl，所述Dtl为η行m列的实数矩阵；
[0015]A2、令迭代次数为t，从t = I开始，循环迭代所述图像块样本到第T次，其中T为获取样本次数；
[0016]A3、对于第t次循环，获取第t批图像块样本yu，...，yt,P，其中每个图像块样本为η行I列的列向量，共P个；
[0017]Α4、在已知字典矩阵Dw的情况下，通过基于批处理的稀疏表示算法，求得P个稀疏系数列向量;5 ,β, ,，其中Dw为η行m列实数矩阵；
[0018]A5、更新中间变量矩阵:
【权利要求】
1.一种基于字典学习的图像编码方法，其特征在于，包括以下步骤: A、从图像样本中随机选取图像块，进行基于批处理的稀疏表示，通过交替优化方法求解字典矩阵； B、根据已获得的字典矩阵，利用批处理的稀疏表示对待编码的图像块进行稀疏表示，并对稀疏系数向量中的非零系数进行量化熵编码； C、在解码端，根据已获得的字典矩阵，对上述编码后的图像进行解码和稀疏重建。
2.如权利要求1所述的方法，其特征在于，所述步骤A进一步包括以下步骤: A1、从图像样本中随机选取图像块，初始化中间变量矩阵Htl — O、Gtl — O，其中Htl为m行m列的实数矩阵，m为字典矩阵的列数，Gtl为η行m列的实数矩阵，η为图像块的维度，一表示初始化运算；初始化字典矩阵Dtl，所述Dtl为η行m列的实数矩阵； A2、令迭代次数为t，从t = I开始，循环迭代所述图像块样本到第T次，其中T为获取样本次数； A3、对于第t次循环，获取第t批图像块样本yu，...，yt,P，其中每个图像块样本为η行I列的列向量，共P个； Α4、在已知字典矩阵Dw的情况下，通过基于批处理的稀疏表示算法，求得P个稀疏系数列向量及,，其中Dt-1为η行m列实数矩阵； A5、更新中间变量矩阵:
3.如权利要求2所述的方法，其特征在于，所述基于批处理的稀疏表示算法的求解步骤如下: S1、初始化图像块矩阵;f— [jf，…，yTP]"和对角字典矩阵B dlag(D,...，D)； S2、求解约束条件下的最小二乘系数矩阵:
4.如权利要求1所述的方法，其特征在于，所述步骤B进一步包括以下步骤: B1、对每个图像块的直流分量DC系数和交流分量AC系数进行分离； B2、对所述直流分量DC系数进行差分脉冲编码调制，得到残差向量； B3、对所述交流分量AC系数进行基于批处理的稀疏表示，求得相应的稀疏系数向量{aj)Jj=l，共J个列向量，其中J为待编码的图像块个数； B4、对差分脉冲编码调制后的DC系数和经过基于批处理的稀疏表示求得的稀疏系数向量进行量化和熵编码，即对所述稀疏系数向量.[?,I^1中的非零元素及其索引进行量化和Huffman熵编码,形成压缩数据。
5.如权利要求4所述的方法，其特征在于，所述步骤C进一步包括以下步骤:Cl、对所述压缩数据进行Huffman熵解码和反量化，恢复图像块的稀疏系数丨之丨二及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量； C2、进行解码重建，从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数； C3、在已知字典Dt的前提下，通过矩阵相乘，稀疏重建第j个图像块弋= O,,，恢复图像块的交流分量AC系数向量j:，共J个列向量； C4、将重建后的直流分量DC系数、交流分量AC系数合并叠加，得到重建图像。
6.一种基于字典学习的图像编码系统，其特征在于，该系统包括: 基于批处理的稀疏表示的字典学习模块，用于从图像样本中随机选取图像块，进行基于批处理的稀疏表示的字典学习，获得字典矩阵；图像编码模块，与所述基于批处理的稀疏表示的字典学习模块相连，用于根据已获得的字典矩阵，利用批处理的稀疏表示对所述图像块进行稀疏表示，并进行图像编码；图像解码模块，与所述基于批处理的稀疏表示的字典学习模块和所述图像编码模块相连，用于根据已获得的字典矩阵，对上述编码后的图像进行图像解码重建。
7.如权利要求6所述的系统，其特征在于，所述基于批处理的稀疏表示的字典学习模块包括: 训练图像样本库，用于存放用于训练学习的各种图像样本；样本预处理单元，与所述训练图像样本库相连，用于去除图像样本块的均值，并进行归一化处理；字典训练学习单元，与所述样本预处理单元相连，用于对预处理后的图像样本块进行稀疏表示与纹理归纳学习。
8.如权利要求6所述的系统，其特征在于，所述图像编码模块包括: 图像块分割与DC、AC系数分离单元，用于将输入的图像块划分为8x8或12x12或16x16大小的图像块，并对每块图像的直流分量DC系数与交流分量AC系数分开；差分脉冲编码调制单元，与所述图像块分割与DC、AC系数分离单元相连，用于对图像块的直流分量DC系数进行差分编码，得到残差向量；基于批处理的稀疏表示单元，与所述图像块分割与DC、AC系数分离单元相连，在已知字典矩阵的条件下，用于对图像块的交流分量AC系数进行稀疏变换，求得图像块的稀疏系数；量化与熵编码单元，与所述差分脉冲编码调制单元和所述基于批处理的稀疏表示单元相连，用于对差分脉冲编码调制后的直流分量DC系数和经过基于批处理的稀疏表示求得的稀疏系数及其索引进行量化和Huffman熵编码，最终形成压缩数据。
9.如权利要求6所述的系统，其特征在于，所述图像解码模块包括: 反量化与熵解码单元，用于对上述压缩数据进行Huffman熵解码和反量化，恢复图像块的稀疏系数及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量；差分脉冲编码信号重建单元，与所述反量化与熵解码单元相连，用于从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数；基于批处理的稀疏表示的图像块稀疏重建单元，与所述反量化与熵解码单元相连，在已知字典矩阵的条件下，用于对图像块进行稀疏重建，恢复每个图像块的交流分量AC系数； DC、AC系数合并与图像恢复单元，与所述差分脉冲编码信号重建单元和所述基于批处理的稀疏表示的图像块稀疏重建单元相连，用于对图像的直流分量DC系数和交流分量AC系数进行叠加，得到重建图像。
【文档编号】G06K9/66GK103489203SQ201310039436
【公开日】2014年1月1日申请日期:2013年1月31日优先权日:2013年1月31日
【发明者】陶晓明, 孙逸鹏, 葛宁, 陆建华申请人:清华大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陶晓明;孙逸鹏;葛宁;陆建华
技术所有人：清华大学
我是此专利的发明人

上一篇：计算机主的制造方法
上一篇：一种信息处理方法及电子设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。