基于集成字典学习的图像稀疏表示方法与流程

文档序号：13983317阅读：390来源：国知局

本发明是一种图像处理方法，尤其涉及基于集成字典学习的图像稀疏表示的方法。本发明方法作为现今先进图像压缩过程的预处理工作，能够有效提高图像压缩比以及在重构之后提高图像的清晰度。因此，在后续的图像检测和分析中，能够有效提高其效率和准确率。除此之外，该方法可用于医疗图像、遥感图像、移动通信等实际应用领域中来提高图像的可视化质量。

背景技术：

压缩感知(compressedsensing，cs)理论自提出以来就受到了信号处理领域广泛的关注和研究。其主要有三个组成部分：信号的稀疏表示、降维感知和信号重构。其中，对于可压缩的信号在某一变换域中能够利用少量非零系数进行稀疏表示(sparserepresentation)这一性质，使信号的压缩性能得到了很大的提升。特别是在多媒体信号处理领域，图像和视频所占的存储空间是十分巨大的，而进行高效的、性能优越的稀疏表示和压缩传感，对于存储空间和传输信道而言都是十分有意义的。

在对图像信号进行稀疏表示阶段，除了各种固定的正交基(dct基、小波基等)进行变换，冗余字典(over-completeddictionary)的学习和优化也是一项十分不错的选择。由于字典的冗余性，即字典的原子(atom)个数超过信号的维度，使得信号进行稀疏表示时能够得到更加精确和更加稀疏的表示。较为经典的字典学习(dictionarylearning)算法有：基于最小二乘的整体字典优化方法mod；原子逐个优化的k-svd；mod和k-svd相结合的sgk；以及基于自适应算法的rls-dla、brls等等。

但是，传统的字典学习算法基本上针对的是单个独立字典，即对于一段时间内的一类信号，只采用单独一个字典进行学习优化和使用。如此，无法对一段时间中存在较大变化的信号进行高效的稀疏表示。另外，对于现有这些独立字典学习算法，一个比较普遍的问题就是计算复杂度的问题。特别是在实时性要求比较高，同时对处理性能、抗噪性能有一定要求的场合，例如视频处理、无线传感器网络中，就无法进行在线(on-line)的字典学习和更新，因此对后续的信号压缩和重构带来的压力是非常大的。

集成学习(ensemblelearning)在数据挖掘和机器学习领域中占据着十分重要的位置，其对基学习器(componentlearner)的性能能够进行一定的提高和优化。在基学习器的集成过程中，由于优化过程相互独立，因此采用并行计算的思想将有效降低优化的复杂度。

技术实现要素：

本发明为克服现有技术的上述不足之处，提供基于集成字典学习的图像稀疏表示方法。

本发明方法通过结合独立字典学习算法、构建基学习器集成框架、图像的稀疏表示和重构融合，可以使图像的稀疏表示性能以及字典学习时间，即计算复杂度得到有效优化。通过本发明方法，将有效提高图像信号的稀疏表示性能，即能够最小化表示误差。与此同时，本发明方法作为后续图像压缩重构的预处理过程，能够让图像信号以更高的压缩比进行压缩，有利于在计算机和移动终端进行传输和存储。同时当图像从压缩域中重构出来时，能得到更高的清晰度和辨识度，有利于进行后续的图像检测和分析。

本发明通过以下技术方案达到上述目标：基于集成字典学习的图像稀疏表示方法。实施本发明的基于集成字典学习的图像稀疏表示方法运行于计算机系统上，包括独立字典学习器的设计和结合、集成字典学习框架的构建、图像的稀疏表示和图像集成，能够有效提高图像的稀疏表示能力。另外还有一维至二维的集成学习性能提高的理论推导。在医学图像处理，如mri、内窥镜，遥感图像处理等实际应用领域，也有很好的表示性能。

同时，因为稀疏表示性能的提高，有助于在后续图像压缩时能够有效提高压缩效率，减小因压缩重构带来的误差。正因如此，本发明方法在降低计算复杂度的情况下得到更多的高质量图像，为后续的图像检测和分析提供高质量的图像，以提高其准确度和效率。

本发明的基于集成字典学习的图像稀疏表示方法，具体包括以下步骤：

(1)根据现有计算复杂度较高的独立字典学习算法，设计简单的集成字典学习的框架模型。即，首先通过独立字典学习算法和少量的训练集进行学习，得到多个相互独立的字典{ψi}；然后将需要进行处理的图像h0在各个字典中进行稀疏表示，得到其对应的稀疏表示系数；接着将各个字典和稀疏系数进行重构，得到多个类似但是不完全相同的图像{hi}；最后将得到的多个图像进行融合，得到最终所需要的高清图像h。其中，独立字典学习可归结为字典和稀疏系数的交替优化问题：

其中，ψ为字典，x为原始信号，s为稀疏系数。经过优化后，对测试信号h0的独立重构信号和集成重构信号分别为：

(2)根据已知一维情况下的集成学习对基学习器性能的提高理论，推导二维矩阵情况下的集成学习对基学习器性能提高的理论公式。

根据步骤(1)给出的图像稀疏表示模型以及假设基学习器的收敛过程为定义二维情况下基学习器和集成学习器对样本x的泛化误差分别为：

另外，定义基学习器和集成学习器对样本x的均方误差分别为：

因此，结合式(3)-(7)并通过一定计算可以得到：

其中以上对服从概率密度为p(x)的样本x均满足，故存在：

进一步化简可得：

其中因此，当每个基学习器通过训练之后，就达到相互之间相似但不完全相同的表示性能；当使用集成方法后，能够降低总体的均方误差同时提高总体的泛化误差；同时根据泛化误差的定义可知非负，则可证明通过步骤(1)给出的稀疏表示模型能够让最终融合结果的均方误差e降低，即提高图像的表示性能；在实例中呈现的稀疏表示性能psnr指标能够提升2-3db，这为后续的图像高效压缩以及高清重构打下基础，并有利于图像的检测和分析。

(3)利用新型集成字典学习框架的并行潜质优化字典学习时间并提高图像稀疏表示的抗噪性能。

本发明的有益效果在于：(1)本发明方法简单，易于实现，能够通过并行计算显著改善相同训练集下单个字典学习过程中计算复杂度高的问题；(2)本发明中的图像独立稀疏表示之后集成的方法，能有效提高图像信号稀疏表示的能力，重构图像在峰值信噪比(psnr)这一性能指标方面提高了2-3db；(3)本发明的集成方法，对于图像中的高斯噪声有一定的改善作用，鲁棒性好；(4)本发明在实际应用时，能够为后续的图像压缩提供更加高效的压缩效率并保证高质量的重构性能，提高图像检测和分析的效率和准确率，应用前景十分广阔。

附图说明

图1是本发明的基于集成字典学习的图像稀疏表示方法的系统框图；

图2是本发明方法的程序流程图；

图3是本发明实施例中图像集成稀疏表示的性能曲线图；

图4是本发明实施例中图像集成和独立稀疏表示的性能对比曲线图；

图5是本发明实施例中图像集成稀疏表示的效果图，其中图5a是原始图像信号；图5b是采用一个基学习器，即传统学习情况下的图像，psnr为32.4645db；图5c是采用十个基学习器集成后的图像，psnr为34.6546db；图5d是采用五十个基学习器集成后的图像，psnr为34.8399db；

图6是本发明实施例中对高斯噪声抵抗作用的曲线图；

图7是在医疗mri图像中使用此集成框架模型的效果图；其中图7a是一个基学习器，即传统学习方法情况下的mri图像，psnr为38.1169db；图7b是采用两个基学习器集成后的mri图像，psnr为39.0703db；图7c是采用五个基学习器集成后的mri图像，psnr为39.72db；图7d是采用十个基学习器集成后的mri图像，psnr为40.0008db。

具体实施方式

下面结合具体实施例对本发明进行进一步描述，但本发明的保护范围并不仅限于此。

本发明的基于集成字典学习的图像稀疏表示方法，具体包括以下步骤：

(1)根据现有计算复杂度较高的独立字典学习算法，设计简单的集成字典学习的框架模型，如图1所示；其中，独立字典学习可归结为字典和稀疏系数的交替优化问题：

其中，ψ为字典，x为原始信号，s为稀疏系数。经过优化后，对测试信号h0的独立重构信号和集成重构信号分别为：

(2)根据已知一维情况下的集成学习对基学习器性能的提高理论，推导二维(矩阵)情况下的集成学习对基学习器性能提高的理论公式。

根据图1给出的基于集成字典学习的图像稀疏表示模型以及假设基学习器的收敛过程为定义二维情况下基学习器和集成学习器对样本x的泛化误差分别为：

另外，定义基学习器和集成学习器对样本x的均方误差分别为：

因此，结合式(3)-(7)并通过一定计算可以得到：

其中以上对服从概率密度为p(x)的样本x均满足，故存在：

进一步化简可得：

其中因此，当不同的基学习器的性能不同(大的)以及其拥有更好的表示性能(小的)时，集成学习的效果也就会越好(e更小)。

(3)利用新型集成字典学习框架的并行潜质优化字典学习时间并提高图像稀疏表示的抗噪性能。

如图1所示，是实施本发明方法的基于集成字典学习的图像稀疏表示系统结构的示意图。其中结合图2的程序流程图，为训练集中抽取给各个独立字典学习器dli的训练集。接下去的字典学习算法可采用经典的k-svd算法。通过此步骤即可得到对应训练集的独立字典并使用这些字典对测试图像h0进行稀疏表示，稀疏系数的求解可以使用但不限于omp算法。对于每一个独立字典，可以得到相对应的测试图像稀疏表示后的重构图像之后，对得到的重构图像进行加权集成在实验中，采用了较为简单的算术平均的方式，而在研究和实际应用中，还可根据稀疏表示误差进行权重的选取和优化。

对于上述过程，采用真实图像训练集和测试图像lena进行了实验仿真，图3显示了随着基学习器个数的变多，图像稀疏表示性能——峰值性噪比psnr有显著地提高并趋于一个稳定的性能。图4所示，对比传统的独立k-svd算法，集成字典学习的方式能够提高2-3db。其中，采用4个左右的基学习器进行集成即可达到十分良好的改善性能，且此数量十分适合现代计算机的并行处理。图5展示了lena原始图像及其在不同基学习器个数情况下的效果以及对应的psnr指标，发现图5d相比于图5b提高了大约2.4db。

虽然此示例中的基学习器采用的是经典的k-svd，但此框架模型属于一个顶层设计，若采用其他字典学习算法和稀疏表示方法，同样适用于此框架模型。除此之外，此框架模型对图像存在的高斯噪声有一定的抵抗作用，效果如图6所示。

图7所示为脑部mri图像某一切片运用上述方法的处理结果图。可以看出，在mri、内窥镜等医疗图像处理等实际应用领域，采用此集成框架模型，也能够对图像性能得到一定改善和提高，如图7d对比于图7a，psnr提高了2db左右。因此，在实际应用中，本发明方法能够提高图像质量，特别是对于后续需要利用图像进行检测和分析的任务是十分重大的意义。

以上的所述乃是本发明的具体实施例及所运用的技术原理，若依本发明的构想所作的改变，其所产生的功能作用仍未超出说明书及附图所涵盖的精神时，仍应属本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鲍东海;潘娟;丁佳骏;王青沛;李胜;何熊熊
技术所有人：浙江工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。