基于自适应相似集合稀疏的差错隐藏方法与流程

文档序号：14250556阅读：223来源：国知局

本发明涉及一种基于自适应相似集合稀疏的差错隐藏方法，属于视频通信中的后处理技术。

背景技术：

随着互联网和无线移动通信的快速发展，视频通信逐渐成为网络通信的主要业务。压缩的视频码流对于信道误码极为敏感，传输过程中的误码可能导致解码端出现不能正确解码的图像块，严重降低视频的播放质量。为了减轻误码对视频质量的影响，相比于编码端的抗误码技术，解码端的错误隐藏技术由于不需要增加编码冗余和改变码流结构而受到广泛关注。空域错误隐藏主要利用帧内图像中普遍存在的空域相关性来恢复丢失块，不依赖任何时域信息。灵活宏块组织可以为不同空域错误隐藏(sec)算法提供一个共同的比较基准和统一的测试平台。在灵活宏块组织中，一帧图像分为几个独立可解码的块组，并且每个块组包含一系列的块，不同的块组封装成不同的包，这样，解码图像的丢失块可以被邻近的正确像素块予以隐藏。在某些应用程序中，一个包的损失意味着图像内一个块组的损失。本发明专利针对的是图像编码块大小是8×8的情况，并假设丢失块的位置可以被解码器得到。根据丢失块的周围块的损坏情况，可以将损坏情况分为棋盘丢失或连续丢失。棋盘丢失表示一个丢失块周围的相邻块被正确接收，连续丢失的一个特例是图像突发错误，即一整行的块全部丢失，它是差错隐藏的一个难题。

图1a和图1b给出了错误隐藏所用的两种通用丢失模式，即：棋盘丢失模式和连续丢失模式，图中每个方块表示大小为8×8像素块，白色表示接收成功的块，黑色表示接收到的损坏块。图1a显示了典型的棋盘丢失模式，丢失块周围四个相邻块都被正确接收。对于棋盘丢失模式，许多sec算法可以充分地利用损失块周围的信息进行有效的错误隐藏。图1b是连续丢失模式的一个示例，这是一个更具挑战性的丢失模式，因为同在一行的相邻块均丢失，待隐藏的块缺少其左右的正确块信息，可以利用的相关信息更少，许多sec算法都难以有效应对连续块损失。连续块损失仍然是空域错误隐藏的一个开放性的难题。

技术实现要素：

本发明的目的是：提高视频通信中差错隐藏的质量性能。

为了达到上述目的，本发明的技术方案是提供了一种基于自适应相似集合稀疏的差错隐藏方法，其特征在于，包括以下步骤：

步骤1、输入原始图像i及模拟丢失矩阵s，s为典型通用丢失模式，s.*i得损坏图像y；

步骤2、对损坏图像y采用双线性插值方式进行预处理，得到迭代输入图像in，并赋值给恢复图像x；

步骤3、循环执行以下步骤：

步骤3.1、更新迭代输入图像in，in＝x-c，式中，c为临时图像；

步骤3.2、将迭代输入图像in分解为n个图像块xk，k＝1，2，...，n，基于相似准则得到每个图像块的相似图像块，每个图像块的所有相似图像块构成一个块组，由每个块组构造一个自适应相似集合，其中，第k个图像块xk的块组为由块细构造的自适应相似集合为

步骤3.3、对每个自适应相似集合进行奇异值分解，获得与每个自适应相似集合相对应的自适应字典及稀疏表示向量，其中，对自适应相似集合进行奇异值分解后得到奇异值向量[sg_s，sg_v，sg_d]，式中，sg_v为对角矩阵，sg_s、sg_d为酉矩阵，将sg_v中绝对值小于τ＝λk/μn的元素置为0得到稀疏表示向量式中，λ及μ为比例系数，k为一般参数，由sg_s和sg_d得自适应字典

步骤3.4、更新临时图像f，式中，为从中提取自适应相似集合并进行转置运算的运算符；

步骤3.5、更新临时矩阵r，r＝s.*y+μ*(f+c)；

步骤3.6、更新恢复图像x，x＝(1/μ)*(r-s.*(a.*(s.*r)))，式中，a＝1./(μ+s)，/表示两个向量的元素划分；

步骤3.7、从第二次循环开始，计算前后两次得到的恢复图像x的平均绝对误差mad，当mad小于阈值e或者迭代次数到达阈值imax时直接跳出循环，否则转到执行步骤3.1；

步骤4、输出最终得到的恢复图像x。

优选地，在所述步骤3.2中，块组中的每一个相似图像块作为所述自适应相似集合的列向量。

优选地，在所述步骤3.2中，所述相似准则为欧几里得距离相似准则、结构相似性指数ssim或平均绝对误差的相似准则。

优选地，在所述步骤3.2中，所述第k个图像块xk的相似图像块通过以下步骤搜索：

在大小为swin的范围内每次滑动距离sdis来搜索第k个图像块xk的相似图像块，然后取前d个相似图像块的图像块构造所述自适应相似集合

优选地，在所述步骤3.3中，所述自适应字典被定义为：

则为中的第i列，i＝1，2，……，m，为sg_s中的第i列，为sg_d中的第i列的转置。

本发明不同于传统的采用单一图像块或固定数目图像块作为修复单元的方法，该方法根据自然图像中图像块之间的联合特征，自适应地选取不同数量的相似图像块，构造自适应相似集合；然后以相似集合作为基本单元，训练自适应字典，并构造基于稀疏表示的图像恢复模型；最后，采用分解bregman迭代框架(sbi)算法高效地求解目标代价函数。

本发明所提方法采用自适应相似集合作为差错隐藏的基本单元，能够有效地排除非相似块的干扰，准确地构造相似集合，保证恢复后的图像具有较好的清晰度。本发明与其它空域差错隐藏算法相比，能够进一步提高图像的恢复质量。由于本发明方法以自适应相似集合作为基本单元，因此能够充分地利用自然图像中的空域相关信息，根据图像信号的先验特征指导图像的恢复过程，从而保证算法的高效性。

附图说明

图1a为错误隐藏所用的棋盘丢失模式；

图1b为错误隐藏所用的连续丢失模式；

图2为建议算法的流程图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

结合图2，本发明提供的一种基于自适应相似集合稀疏的差错隐藏方法可分为以下几个阶段进行：

(1)提取自适应相似集合

首先，将待恢复图像x划分为n个尺寸为的重叠图像块，每一个图像块由向量表式，k＝1，2，...n。中bs表示每一个块向量的维度大小。对于每一个块bs，在l×l的训练窗内，寻找它的最佳相似块，它由块组构成。本发明将平均绝对误差作为不同块之间的相似准则。中的所有块被组合成尺寸为bs×c的矩阵，表示为它包含了中的每一个块来作为它的列向量，即矩阵包含了所有带有相似结构的块，它被称为一个相似集合，其定义为：

式中是一个从x中提取集合的运算符，它的转置表示为能够把一个集合放到重构图像的第k个位置，在其它位置用0填充。通过求解所有相似集合的平均值，采用对整幅图像x的恢复转化为：

式中./表示两个向量的元素划分，是一个所有元素都为1尺寸为bs×c的矩阵。在本发明中，每一个块xk代表一个向量，而每一个集合代表一个矩阵。通过上述定义，显而易见每一个块xk对应一个集台

(2)构造基于自适应相似集合的稀疏字典

为了在统一的框架内同时利用自然图像的局部稀疏性和非局部自相似性，本发明采用了自然图像在组域的稀疏表示，所提模型称为自适应相似集合稀疏表示模型，模型假设每一个相似集合都能够被自适应字典的一些原子精准地表示。构造字典每一个原子是一个和集合同样尺寸的矩阵，m是中原子的数量。的尺寸为(bs×c)×m，即特别地，每一个集合利用进行稀疏编码的过程是为了寻找一个稀疏向量使得注意不是一个严格的矩阵-向量乘法，每一个集合利用自适应字典进行稀疏编码的过程非常高效，然后整幅图像可以被稀疏编码在组域进行稀疏的表示，利用稀疏编码重构的恢复图像x可以表示为：

式中dg表示的连接，αg表示的连接。本发明所提的正则化图像差错恢复方案可以表示为：

利用重构图像可以表示成为了提高图像恢复质量，l0范数被用来在组域内测量αg的稀疏性。

(3)通过循环步骤，不断更新(训练)自适应相似集合的字典

本步骤为每一个集合训练自适应字典训练目标是让每一个能够被真实的表示，并让在上的系数向量表示尽可能的稀疏。相似集合的自适应字典训练可表示为：

式中p为0或者1。公式(5)是一个dx和的联合优化问题，可通过交替地优化dx和进行求解。本发明不直接利用公式(5)为每一个相似集合训练字典。利用公式(5)训练的字典实际上是自适应给定的图像x，不是自适应相似集合这意味着所有的集合都被同一个字典dx表示。这也是为什么利用公式(5)训练的字典在这里用dx表示，而不是公式(5)中的字典学习过程忽略了每一个集合的特征，包含了带有相似结构的块。换而言之训练一个过完备字典是没有必要的，本发明实例通过一种更加可行和高效的方式训练一个字典，提出直接以的估计量为每一个集合训练自适应字典因为实际的原始图像是未知的，无法直接通过原图得到相似集合。在获得之后，本发明实例再对其应用奇异值分解(svd)，得到：

式中是一个对角化矩阵，中的元素位于其主对角线，分别为和的列。集合的中每一个原子，被定义为：

式中，因此，最终的自适应训练字典被定义为：

通过上述定义，本发明利用svd为每一个相似集合训练一个自适应字典，优势在于保证每一个集合中的所有图像块采用同样的字典和共享同样的字典原子。

(4)进行双目标的联合优化，求解目标代价函数，最终恢复图像

因为l0最小化是非凸的np难问题，通常的求解方法是求解它的最优凸近似l1最小化，l1最小化已经被证明在一定条件下等价于l0最小化。l1最小化可以被目前一些凸优化算法有效地求解，例如迭代收缩/阈值法、分解bregman算法。因此，求解公式(4)的简单方法是把它转化成求解它的l1凸近似，即

对于一些图像逆问题，描述l0最小化和l1最小化的等价条件不一定满足。因此，本发明采用凸优化算法的框架来求解l0最小化。本发明选择采用分解bregman迭代框架(sbi)来求解公式(4)，采用如下约束优化问题：

式中是凸函数。sbi方法通常按照以下7行伪代码求解问题(10)：

1.设置t＝0，μ＞0，b0＝0，u0＝0，v0＝0；

2.循环执行以下流程：

5.b^(t+1)＝b^(t)-(u^(t+1)-gv^(t+1))；

6.t←t+1；

7.当t＞＝imax时停止循环

在上述sbi方式中，参数μ是固定值，以避免数值不稳定的问题，而不是采用一个预先设定的序列，导致最后趋于无穷大。根据sbi方式，原始的最小化问题(10)被拆分成如下2个子问题，拆分背后的合理性是每一个子问题的最小化可能比原始问题(10)简单很多，下面解释如何运用sbi方式来求解子问题。通过引入一个变量u，首先将公式(4)转化成一个受约束的形式，

定义g(αg)＝λ||αg||0。然后，sbi伪代码的第3行变成：

下一步，sbi伪代码的第4行变成：

根据sbi伪代码的第5行，更新b^(t)：

这样，公式(4)的最小化问题被转化成求解2个子问题，也就是u、αg子问题。接下来，阐述如何获得每一个子问题的有效解。

a.u子问题

给定αg，u子问题由公式(12)表示，它实质上是一个严格凸二次函数的最小化问题，即

设置q1(u)的梯度等于0，可以获得公式(15)的一个近似解，它可以被表示为

式中i是一个单位矩阵。

b.αg子问题

给定u，根据公式(13)，αg子问题可以被表示成

式中r＝u-b。由于αg的复杂的定义直接求解公式(17)是非常困难的，求解时做了一些转化，让使得公式(17)同样变为

为了使公式(18)易于求解，在本发明中，公式(18)合理地转化为：

式中τ＝λk/μn。公式(19)能够通过求解所有相似集合的n个基的子问题被有效最小化，而每一个相似集合基的子问题被表示为：

式中是通过得到的自适应训练字典，公式(20)也可以被认为是稀疏编码问题，利用和的定义，可得：由于的单一特性，进一步可得：

根据公式(21)，子问题(20)等价于

因此，(22)的闭合解被表示为

式中hard(·)代表硬阈值的运算符，⊙代表两个向量的元素间卷积。这个过程被应用于所有n个块来实现它是公式(17)中αg子问题的求解方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王冰;刘浩;李康达;陈根龙;孙嘉曈
技术所有人：东华大学
我是此专利的发明人

上一篇：基于拜耳模式的图像内相关噪声估计方法与流程
上一篇：用于多设备间实现AR室内定位的坐标轴同步方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。