一种用于视频图像恢复增强的结构化稀疏词典的构造方法

文档序号：6438895阅读：203来源：国知局

专利名称：一种用于视频图像恢复增强的结构化稀疏词典的构造方法
技术领域：
本发明属于视频图像增强处理技术领域，更为具体地讲，涉及在图像视频增强处理中用于视频图像恢复增强的结构化稀疏词典的构造方法。
背景技术：
因为图像视频采集系统自身固有的缺陷或局限性，通过摄像系统从现实场景采集到的数字图像数据是经过了种种画质退化效应后的结果。也就是说，因为种种原因，从采集后的数字图像上看到的画面与真实场景在视觉质量上存在明显的差距。最典型的来说，有相机的点扩散函数(PSF)带来模糊效应，相机CMOS或CCD感应芯片的分辨率限制带来下采样效应，空气、相机系统噪声叠加后的噪声模糊效应等三大类图像画质退化的原因。在典型的数字电视系统中，经过各类视频压缩技术编码的视频会隐含有程度不一的块效应瑕疵，而来自传统的广播电视模拟信号除了其分辨率局限在PAL/NTSC上之外，还有模拟信号解码转为数字信号、去隔行处理等过程中因为误差带来的噪声或画质退化。这就是我们今天在从电视机上看到的画面质量差强人意的原因。在播放高清视频片源如蓝光碟片时，赏心悦目的画面效果正好说明了我们的普通视频图像画质退化有多么严重。因为海量的传统非高清视频源的存在，目前广播电视信号仍然以PAL制式标准为主，使用各种低成本便携摄像设备拍摄的低画质视频在不断增加，这些都表明有创新发明新的视频图像画质增强处理技术的巨大需求。压缩感知技术认为在满足一定的条件下，被各种退化操作污损后的信号可以在一定程度上被准确重建与恢复。具体在图像处理领域中，建模如下Ile = UIHE+w(1)Ihe是未污染的理想的高清图像信号，Iui是经过各种退化操作后所观察到的低清图像信号，w是加性的噪声变量，U线性的退化算子，可以是模糊算子、下采样算子、加性污损算子等。图像增强处理任务就是根据已知的低清图像Iui数据恢复出未知的理想高清图像Im数据。为了得到视觉舒适的逼近的高清图像Ihk，需要整合更多的自然图像先验知识，以约束高清图像Ihk的恢复过程。该过程一般建模如下 = argmin\\a\[，且|7让 _υ ζ < ε(2)Im = Da(3)这种自然图像的先验知识也就是图像信号在特定定义域里的稀疏性，也就是说高清图像Ihk可以在变换域D以稀疏系数向量5进行合理表达，其中ε为设定的阈值。而系数向量稀疏系数向量3中大部分元素都接近于零。通常来说，变换域D是一个基元素组成的过完备稀疏词典。传统的稀疏词典获取方法有两种一是预定义变换基如傅立叶基、小波基等各种知名变换域组成；另一种是从大量的训练数据中学习得到这样的过完备词典。总之，稀疏词典的构建决定了式(3)中稀疏系数向量3的稀疏性，同时决定了式(2)中椭圆凸优化问题的收敛速度与稳定性，也就最终影响了高清信号高清图像IHR恢复的性能。当前现有技术的稀疏词典及其缺陷
3
传统的过完备稀疏词典方法，隐含着假定条件是各个稀疏词典元素间是不连贯互相独立的，因而也就假定稀疏系数向量3中的非零系数位置是随机均勻分布的。另一方面为了表达高清图像Ihk的完备性，稀疏词典，即变换域D中的元素个数N相对于稀疏系数向量 3中的非零值个数M非常大，也就是说需要满足N >> M的条件。因此在求解式O)的优化
(N、
问题时，理论上解空间大小，即自由度为这导致了收敛速度慢、计算量大，且最终解的
VmJ
准确性与稳定性被减弱。有一种初步的结构化稀疏词典的方法来获得稀疏词典。具体来说是从0到π的方向均勻统一抽取出T个角度，每个角度计算出一个PCA基，随后将有T个PCA基外加一个 DCT基一起构成了这个结构化的稀疏词典，如图1所示。求解过程中，将每个PCA基看作一个独立的词典进行稀疏信号恢复，选择其中精度误差项与稀疏约束项之和最小的基为本次信号恢复计算的变换域词典。然而这种结构化稀疏词典的构造方法其缺陷在于，首先要从综合出来的T个黑白线角度边缘的图像上计算初始化的有向PCA基，随后使用ΕΜ(期望最大化)算法迭代更新PCA基里的内容。
(N、结构化的稀疏词典其优点是明显的，解空间大小(自由度)在u的基础上
VmJ
大为减少。设若每个PCA基的元素个数相同，那么在该结构化词典上求解的自由度降至 (N )
W KT+1))其次，会根据不同低清图像Iui选择不同的PCA基，也就是子词典，这样提高了低清图像Iui与结构化的稀疏词典之间的匹配适应性，从而获得更为准确的稀疏性约束。稀疏词典进行结构化约束有两方面的价值，一方面可得到更为健壮的稀疏表达，另一方面在信号解释上，活跃的词典原子项集表明了一定的信号物理属性。然而，用从综合的图像计算的PCA基来表达自然图像的局部片，有其自身固有的缺陷。因为各种自然图像片与规则的图像偏离只能一概由高斯模型里的方差参数进行建模，这样就大大的损失了稀疏表达的准确性。

发明内容
本发明的目的在于克服现有技术的不足，提供一种用于视频图像恢复增强的结构化稀疏词典的构造方法，使稀疏表达更为有效而准确。为实现上述目的，本发明用于视频图像恢复增强的结构化稀疏词典的构造方法，其特征在于，包括以下步骤(1)、从自然图像库以及边缘分明的拟合图像中分别选取一定数量级图像生成尺寸为λ/^ΧΛ^全部的图像片集合S，其中η为图像片的像素点个数；(2)、对图像片集合S中的图像片进行DCT变换，得到的DCT系数构成DCT系数集
合 SdCt ；(3)、对DCT系数集合&。t中的图像片DCT系数进行K1个中心的一级聚类处理，从而将图像片DCT系数分别划入相应的K1个聚类·(&」，&_2Λ,_3 ··《』}；
0)、对于每个聚类，对其再做结构化操作对聚彡i彡K1)中的图像片 DCT系数提取其高频分量，得到高频分量构成的聚类,；(5)、对聚类SiL ,中的高频分量执行K2」(1 ^ i ^ Ki)个中心的聚类处理，从而划分得到 K2 i 个二级聚类{sit j,Shdct」—2，Shdct j…Shdct j—K J，(6)、对每个二级聚类幻吣」(l^i ^K15I ^ K2i)进行主成分分解，提取其前m个主成分分量，构成对应该聚类的稀疏子词典SubDu (1彡i彡K1,1彡j彡K2 i)；全部的稀疏子词典SubDu构成最终的结构化稀疏词典。本发明的发明目的是这样实现的本发明用于视频图像恢复增强的结构化稀疏词典的构造方法，通过对从自然图像库以及边缘分明的拟合图像中分别选取的图像片进行DCT变换，映射到频域空间，基于图像片的一般频域特征进行初步聚类处理，随后对每个聚类进一步的基于其高频信息特征进行二级聚类处理，最后，对得到的二级聚类提取前m个主成分分量，得到该聚类的稀疏子词典SUbDi」，全部的稀疏子词典SUbDi j构成最终的结构化稀疏词典，这样建立起的两级结构化稀疏词典库，区别于传统冗长低效的线性过完备词典。本发明具有以下有益效果1、在本发明二级层级结构化稀疏词典的条件下，可以快速有效的求解输入图像视频信号的稀疏表达，而避免了传统的在一个过完备词典中进行稀疏表达求解的冗长计算，其原因在于本发明提供了两级层级结构，从而有效的去除了稀疏词典中各原子项之间的信肩、O2、在本发明二级层级结构化稀疏词典的基础上，对任意图像视频信号进行协同层级稀疏建模所得到稀疏系数向量3是准确、有效的，具备相当程度的抗噪声特性。

图1是现有技术初步结构化的稀疏词典组成结构图；图2是本发明用于视频图像恢复增强的结构化稀疏词典的构造方法的具体流程图；图3是层级结构化稀疏词典的示意图；图4是稀疏子词典结构示意图。
具体实施例方式下面结合附图对本发明的具体实施方式
进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。图2是本发明用于视频图像恢复增强的结构化稀疏词典的构造方法的具体流程图。在本实施中，如图2所示，本发明具体实施过程如下(1)、在所提供的自然图像库201和所提供的边缘分明的拟合图像库202选取一定数量级的图像，二者的比例可以视情况而定，例如3 1。在所有选取图像上提取长宽尺寸为V^x^的图像片，其中η的取值区间一般为[25，100]。图2中自然图像库201可从外部公开的高质量自然图像搜集，其所需图像数量级一般在100以内就足够了。图2中拟合图像库202的图像为像素值为0或255的黑白分界图形线的图像，其分界线角度为从0到π的方向18个均勻等分角度。步骤203提取的 V^xi图像片构成图像片集合S。(2)步骤204所示意对图像片集合S进行预处理，将其投射到频域空间，从而为对这些图像片样本基于纹理、边缘等特征进行聚类提供基础。具体来说，对图像片集合S中的图像片进行DCT变换，得到的DCT系数构成DCT系数集合i5d。t，即Sdct = DCT(S)，S e S，Sdct e Sdct(4)在中，s代表一个图像片，sd。t代表其DCT变换后的DCT系数。需要注意的是， DCT变换可以有多种替换方法，只需能有效将图像片集合S投射到频域空间中即可。如图2中在步骤205，对图像片基于纹理、边缘等频域特征显著的特性进行聚类处理，具体来说就是对DCT系数集合&。t中的图像片DCT系数进行K1个中心的聚类处理，从而
将DCT系数集合Sdrt划分为K1个聚类·(&」,& 2,&3··《j。值得注意的是，这里的聚类
处理方法可以有多种方法，一种经典而有效的方法就是K均值聚类方法，也即
权利要求
1.一种用于视频图像恢复增强的结构化稀疏词典的构造方法，其特征在于，包括以下步骤(1)、从自然图像库以及边缘分明的拟合图像中分别选取一定数量级图像生成尺寸为 V^xV^全部的图像片集合S，其中η为图像片的像素点个数；O)、对图像片集合S中的图像片进行DCT变换，得到的DCT系数构成DCT系数集合Sdct ；(3)、对DCT系数集合&。t中的图像片DCT系数进行K1个中心的一级聚类处理，从而将图像片DCT系数分别划入相应的K1个聚类化」，、,，^^ ··《』}；G)、对于每个聚类，对其再做结构化操作对聚类^^—JKiSK1)中的图像片DCT系数提取其高频分量，得到高频分量构成的聚类Si」；(5)、对聚类中的高频分量执行K2」(1^ i ^ Ki)个中心的聚类处理，从而划分得到&」个二级聚类卜1,11,* ,丄2，丄3 · · '^dct J_K2 )，(6)、对每个二级聚类幻K2i)进行主成分分解，提取其前m个主成分分量，构成对应该聚类的稀疏子词典SubDu (1彡i彡K1,1彡j彡K2 i)；全部的稀疏子词典SubDu构成最终的结构化稀疏词典。
2.根据权利要求1所述的用于视频图像恢复增强的结构化稀疏词典的构造方法，其特征在于，所述的一级聚类是基于纹理、边缘等频域特征显著的特性进行聚类处理。
全文摘要
本发明公开了一种用于视频图像恢复增强的结构化稀疏词典的构造方法，通过对从自然图像库以及边缘分明的拟合图像中分别选取的图像片进行DCT变换，映射到频域空间，基于图像片的一般频域特征进行初步聚类处理，随后对每个聚类进一步的基于其高频信息特征进行二级聚类处理，最后，对得到的二级聚类提取前m个主成分分量，得到该聚类的稀疏子词典subDi_j，全部的稀疏子词典subDi_j构成最终的结构化稀疏词典，这样建立起的两级结构化稀疏词典库，区别于传统冗长低效的线性过完备词典。可以快速有效的求解输入图像视频信号的稀疏表达，对任意图像视频信号进行协同层级稀疏建模所得到稀疏系数向量是准确、有效的，具备相当程度的抗噪声特性。
文档编号G06T5/00GK102521799SQ20111037150
公开日2012年6月27日申请日期2011年11月21日优先权日2011年11月21日
发明者袁梓瑾申请人:四川虹微技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁梓瑾
技术所有人：四川虹微技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。