一种基于多目标张量塔克分解的图像压缩方法

文档序号:34028767发布日期:2023-05-05 10:21阅读:152来源:国知局
一种基于多目标张量塔克分解的图像压缩方法

本发明属于图像压缩领域,具体为一种基于多目标优化算法来优化张量塔克分解进而进行图像压缩的方法。


背景技术:

1、图像出现在交流以及工作中的方方面面,人类可以用它很好地进行信息的获取,也不可置否地会应用到图像处理。然而,随着图像技术的发展,图像数据集越来越大,导致图像容量的增加,图像的存储和传输也面临着诸多挑战。所以,如何压缩数据,获得高压缩比,是近几年大家非常关心的问题。幸运的是,每个波段(空间冗余)以及相邻波段(波段冗余)中的像素值之间存在很强的相关性。这些冗余允许开发有效的压缩算法。

2、传统的图像压缩方法是先把图像所包含的数据进行向量化后再对其相应的压缩处理,这种做法会丢失图像高维空间的本征结构信息,而张量(tensor)是一种对向量和矩阵高阶扩展的多维数据存储形式,它可以完整地表示高维数据,这样一来图像高维空间数据的本征结构信息就可以得到保护。如此说来,向量就可以视作一维张量,矩阵就可以视作二维张量,而在现实中遇到的更多的是三维、四维张量及以上。从几何的角度来说,一维张量构成的就是一条线,二维张量是平面上的矩形,而三维张量是立方体,以此类推。换个角度理解,三维张量可以看做是多个矩阵堆叠而成,张量的应用面很广,大多数的数据都可以用张量表示,比如一张彩色图片是由像素矩阵和第三维的rgb颜色通道组成的三维张量,那么构成彩色图片的张量大小为h*w*3。为了更多地保留图像的结构信息,本发明采用了塔克分解这种高维图像压缩方法。

3、此外,基于多目标优化算法的张量塔克分解主要考虑以下的问题:(1)在人类视觉下,保证压缩后的图像清晰度更高;(2)在确保图像视觉清晰度的情况下减少图像的压缩比;(3)使原图像更多的结构信息保存在压缩后的图像中;(3)使原图像更多的特征信息保存在压缩后的图像中。


技术实现思路

1、在不考虑图像高维的本征结构信息的情况,或在不多方面多角度地考虑图像压缩前后的结构以及特征的情况下,图像的大量有用信息都会存在丢失的现象,而在考虑图像高维的本征结构信息以及图像压缩前后多方面的结构以及特征的情况下,平衡不好图像压缩后各项特征信息之间的比例,会导致图像的压缩质量和压缩率不能两全。为了解决这个问题,本发明将多目标优化算法和基于张量塔克分解的图像压缩相结合,提出了一种通过多目标优化算法来优化张量塔克分解进而进行图像压缩的方法。

2、本发明的技术方案:

3、一种多目标张量塔克分解的图像压缩方法,包括:

4、获取要压缩的原始图像的张量,构建原始图像的张量塔克分解模型,近似分解为一个核心张量和三个因子矩阵,然后利用该模型构建解压,得到重构图像。

5、构建图像压缩的多目标质量评估优化模型,包括:

6、以图像压缩前后的张量维度压缩比最小,图像压缩前后关于亮度对比度以及结构对比的加权结构相似性最大,衡量图像压缩前后的相位以及梯度相似性的特征相似性最大,图像压缩前后衡量图像共同信息的信息保真度标准最大,衡量图像不变矩特征的hu不变矩相似度最大,分别构建对应的目标函数。

7、采用多目标优化算法求解所述塔克分解的多目标优化模型,得到塔克分解的图像压缩最优方案集。

8、采用客观赋权的决策方法,从最优压缩方案中选择出一个最适合的图像压缩方案。

9、进一步地,所述根据输入的要压缩的原始图像,构建图像的塔克分解模型,包括:

10、

11、其中,j1、j2、j3为彩色图像a的三阶张量表示,j1、j2分别为彩色图像的宽w和高h,j3表示彩色图像的rgb三通道;b(j1,j2,j3)是指j1×j2×j3的三阶张量,相当于svd分解中的奇异值张量;为jn×jn(n=1,2,3)的矩阵,表示张量的特征张量;是指矩阵p和矩阵q的哈达玛积,即二者矩阵对应位置的乘积。

12、彩色图像由此被分解成一个核心张量b以及三个因子矩阵u(1)、u(2)、u(3),可以取前k3个最大的子张量以及该张量对应的特征向量来近似,即

13、

14、在解压图像重构过程中,通过下式恢复得到重构图像。

15、

16、其中n为图像的维度数,表示第n(n=1,2,..,n)次向量积,un为in×in的矩阵,n=1、2、3。

17、进一步地,以图像压缩前后张量维度压缩量最小构建目标函数,具体为:

18、

19、其中dx表示x的维度乘积,如果x为w×h的二维矩阵,则dx=w×h,如果x为w×h×l的三维张量,则dx=w×h×l。

20、进一步地,以加权结构相似性最大构建目标函数,具体为:

21、

22、其中,m是要计算的维度总数,βv是第v维的权重,第v维iw-ssim度量定义如下式所示:

23、

24、其中,xv,u和yv,u为第v个维度的第u个局部图像块,从第u个评价窗口中提取;wv,u为第v个维度中第u个空间位置计算的信息内容权重;c(xv,u,yv,u)为对比度对比函数;s(xv,u,yv,u)为结构对比函数;

25、对于v=1...m-1,iw-ssimv如下式所示:

26、

27、其中,nv为尺度中评价窗口的数量,l(xv,u,yv,u)为亮度对比函数;

28、进一步地,以特征相似性最大构建目标函数,具体为:

29、

30、其中,yiq颜色空间是基于rgb三原色颜色空间的转换,sc(x)是si(x)和sq(x)合并来得到色度相似性度量,i、q具有范围相同的取值空间;pcm(x)=max(pc1(x),pc2(x)),pc1(x)、pc2(x)分别表示压缩前后图像的相位一致性;λ>0且用于调整色度;ω代表着整张图片的像素域,fsimc越大说明当前压缩后的彩色图像质量越好,表明该彩色图像更加接近原始的彩色图像,sl(x)是提取压缩前后图像的相位一致性spc(x)和梯度特征sg(x)合并得到的。

31、进一步地,以信息保真度标准最大构建目标函数,具体为:

32、

33、其中,将压缩后图像的第k个子带射频dk的nk个系数表示成同理将未压缩图像的该系数表示成表示相应系数的非线性依赖。

34、进一步地,以hu不变矩相似度最大构建目标函数,具体为:

35、

36、其中θ是矩阵x和y的夹角,·是向量x和y的数量积,||a||是向量a的模。

37、aoringin是压缩前的图像a的七个不变矩合并成1*7的一维矩阵aoringin=[am1,am2...am7],aoringin是压缩后的图像a`的七个不变矩合并成1*7的一维矩阵,arecover=[a`m1,a`m2...a`m7],aoringin、arecover不变矩计算方式如下式所示:

38、m1=y20+y02

39、m2=(y20-y02)2+4y112

40、m3=(y30-3y12)2+(3y21-y03)2

41、m4=(y30+y12)2+(y21+y03)2

42、m5=(y30-3y12)(y30+y12)((y30+y12)2-3(y21+y03)2)

43、+(3y21-y03)(y21+y03)(3(y30+y12)2-(y21+y03)2)

44、m6=(y20-y02)((y30+y12)2-(y21+y03)2)

45、+4y11(y30+y12)(y21+y03)

46、m7=(3y21-y03)(y30+y12)((y30+y12)2-3(y21+y03)2)

47、-(y30-3y12)(y21+y03)(3(y30+y12)2-(y21+y03)2)

48、进一步地,所述采用多目标优化算法求解所述塔克分解的多目标张量图像压缩的模型,得到塔克分解的最优图像压缩方案集,包括:

49、根据彩色图像的rgb三通道得到图像的原始张量,生成n个核心张量做为初始种群,其中每个核心张量的维度都是随机的,判断n个核心张量是否满足三个维度都小于原始张量的三个维度,并将不满足条件的核心张量更新为满足条件的核心张量。

50、将更新后的核心张量进行塔克张量分解,再进行图像的恢复重构,得到重构张量,将原始张量和重构张量导入到所述的目标函数中,求解出这些张量的各目标值并按照多目标算法的筛选条件选出优势个体。

51、将优势个体做为父代进行模拟二进制交叉或多项式变异产生子代并将子代更新为满足约束条件的压缩方案,将父代和子代这两个种群合并为一个新的种群,进一步地,在多目标优化算法的进行环境选择的时候构造精英反向种群来构成下一次迭代的父代。

52、经过gmax次迭代之后,多目标优化算法筛选出的优势个体将作为图像压缩的最优方案。

53、进一步地,采用客观赋权的critic权重法来对最优方案集进行决策,从最优方案集中选择一个对人眼视觉而言最合适的压缩图像。

54、本发明的有益效果:

55、本发明考虑图像高维的本征结构信息,利用多目标优化算法优化塔克张量分解,寻找尽可能小的张量维度压缩比来实现加权相似性尽可能大、特征相似性尽可能大、信息保真度标准尽可能大、hu不变矩相似度尽可能大的压缩图像,并结合利用精英反向学习的环境选择策略以及critic权重决策法,得到一个全面考虑图像亮度、对比度、结构、特征相似度、共同信息以及描述图像特征的不变矩等多个角度的压缩图像。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1