融合字典训练与观测矩阵优化的数据高质压缩方法与流程

文档序号:18450572发布日期:2019-08-17 01:14阅读:216来源:国知局
融合字典训练与观测矩阵优化的数据高质压缩方法与流程

本发明属于无线传感器网络领域,具体涉及一种基于融合字典训练与观测优化的数据高质压缩方法。



背景技术:

iot在军事侦察、环境监测、安全系统和工业自动化等领域得到了广泛的研究和应用。在恶劣和灾难性的环境中,传感器的不可靠性使得部署集中式静态汇聚节点从分布式传感器收集数据变得低效甚至无效。针对这一问题,学者们提出了许多方案比如分布式数据存储(distributeddatastorage,dds),通过引入网络冗余,实现可靠的数据采集和稳健的网络运行。现有技术的研究确定了一个混合cs集群架构。该架构通过集群内的最短路径路由收集数据,并将其发送到簇头。在簇头位置,使用cs技术处理数据。这些方法证明了该架构在减少传输次数方面是成功的,但是没有保证数据接收和聚合的可靠性。

对于收集到的真实数据,同样也存在难以稀疏化表示的问题,以前针对该问题,大多数方法都应用了全局、非自适应的稀疏变换,如小波,曲波,有限差分等[10]-[11]。但是,使用这些方法很少能够实现超过2.5到3次的欠采样。近年来,使用字典学习的方法而不是使用基于预定义的全局变换字典对数据信号进行建模成为了研究热点,该方法大大提高了数据重建以及图像重建领域的性能。尤其是当字典被调用到特定任务(如mr图像重建)而不仅仅是数据方面时,其性能提升是十分显著的。另外,基于补丁的自适应字典训练方法在图像重建中也显示出了对传统字典学习方法的改进。

现阶段,对于字典训练问题的理论研究大致可以分为两类。第一类侧重于非ks字典的特定算法,第二类是关于一维数据字典训练的极小极大界限问题。第一类的研究工作提供了基于适当最小化标准的可靠字典估计的样本复杂性结果。具体来说,给定稀疏系数和有限数量样本的概率模型,这些研究工作在努力寻求非凸目标函数的局部最小化值,并表明该最小化值是真实字典给定范围内的字典。相比之下,第二类研究工作如jung等在几个系数向量分布下从一维数据给字典训练提供了极小极大界,并讨论了在某些信噪比下边界紧密的方案。但是,在数据足够的情况下,他们两者的方法都没有利用到数据中的结构。



技术实现要素:

发明目的:针对技术问题的问题,本发明的目的是提供一种基于融合字典训练与观测优化的数据高质压缩方法,在字典学习方面通过数据内部的结构实现较低的复杂性的字典训练。

一种融合字典训练与观测矩阵优化的数据高质压缩方法,包括如下步骤:

步骤(1)构建一种工业物联网用的雾协助三层网络架构,所述三层网络架构自下而上包括感知层、雾层和云层,各层级相互连通;在所述感知层中设有n个工业节点,在所述雾层中设有k个雾节点,在所述云层中设有1个云节点;

所述n个工业节点在监测区域内随机分布,各工业节点负责在固定周期内收集l个数据片段,进行分簇和数据采样;

所述k个雾节点对数据进行预处理;所述预处理包括观测矩阵的优化、数据压缩和将压缩数据转发到云节点;

所述云节点进行存储和执行数据恢复操作,字典训练以及字典与观测矩阵之间的权衡;

步骤(2)基于k-svd思想的二维字典训练,实现iiot中空时数据的稀疏表示;

步骤(3)在空间和时间域进行相应的观测矩阵优化,最小化感知矩阵的列相干性,匹配训练后的稀疏字典;

步骤(4)提出一种观测矩阵与稀疏字典的联合优化方法,在字典训练以及观测矩阵优化之间进行权衡考量,使得重构误差达到理论上的最小值。

进一步的,所述步骤(2)中,基于k-svd思想的二维字典训练方法具体包括如下内容:

(2.1)在给定训练字典的情况下,重新设计空时域的观测矩阵,替换随机高斯矩阵,使列相干性达到最小:

把原始数据作为两个训练数据集,分别为空间域的xs和时间域的xt;考虑到空时域字典训练的相似性,对空间数据集xs∈rkp×l的训练进行介绍;

空间字典训练的目标是求解如下优化问题:

其中,ψs是目标稀疏字典,θs是相关系数矩阵,s是稀疏约束,用于保证每个稀疏表示θs,i包含的非零项不超过s;

(2.2)稀疏编码和k-svd字典更新:

(2.2.1)稀疏编码:使用追踪算法,计算每个xs,i的表示向量θs,i:

其中,k表示迭代次数;

(2.2.2)k-svd字典更新:更新字典ψ≡ψ(k-1)中的每一列j0=1,2,...,k;首先用元素定义样本数据的集合,表示如下:

其次,计算总体误差表示矩阵

其中,是系数矩阵第j行;

然后,仅选择与对应的列来限制从而得到通过svd后,更新字典元素并且,表示成:

(2.2.3)执行以上两个阶段操作后,对循环次数k加1,然后重复稀疏编码和字典更新,直到训练字典收敛到稳定值。

进一步的,所述步骤(2)中,还包括一种设计观测矩阵优化方法,具体包括如下内容:

将稀疏表示表示为:

分别定义空间等效传感矩阵as以及时间等效传感矩阵at,所述as=φsψs,at=φtψt,上述公式转换为:

其中y=vec(yt),θ=vec(θt);

对as和at分别进行优化,如下:

采用等角紧框架最小化μ(as)和μ(at)的值。

进一步的,所述步骤(4)中,提出一种观测矩阵与稀疏字典的联合优化方法,具体包括如下内容:

其中,xs∈rkp×l是原始空间训练数据,α是控制的误差的权重因子,范围在(0,1)之间;ys是xs在观测矩阵φs下的投影,即ys=φsxs;

将上述公式表示成如下形式:

其中,

(4.1)给定初始化的φs和ψs的值;

(4.2)通过cosamp算法对观测矩阵φs进行优化;

(4.3)通过k-svd方法得到wψs,利用优化后的观测矩阵φs,从wψs中计算出稀疏字典ψs;

(4.4)自适应地组合稀疏字典ψs中一些相似度较高的列:先对由ψs构成的gram矩阵中的所有非对角元素的绝对值进行排序,然后标记矩阵中最大的t%,t为一个阈值,若gram矩阵中的元素gij被标记,则更新字典ψs中的值:

其中,ψi和ψj均代表ψs的列,抛弃ψj;

由上述完成一次迭代,计算出的训练字典ψs,用于下一次迭代,来得到优化观测矩阵并且同时得到训练字典重复多次,直到达到停止标准。

进一步的,所述步骤(4)中,采用压缩采样匹配跟踪算法进行数据重构。

附图说明

图1是本发明设计的融合字典训练与观测矩阵优化的数据高质压缩方法的数据流方向;

图2是原始数据基于本发明设计的字典训练方法下的变换系数;

图3是本发明对稀疏基和观测矩阵进行权衡(联合优化)前后的压缩重构误差对比;

图4是四种不同方案的重构性能对比,其中hqdc方法表示本方法。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。

一种融合字典训练与观测矩阵优化的数据高质压缩方法,称为hqdc,包括如下内容:

(1)如图1所示,构建一种工业物联网用的雾协助三层网络架构,自下而上包括感知层、雾层和云层,各层级相互连通;本实施例中,在整个监测区域随机分布40个工业节点,感知层进行分簇和数据采样。考虑到位于簇中心的雾节点具有较强的计算能力,部署在网络边缘的4个雾节点能够对数据进行预处理。首先,观测矩阵的优化将在这一阶段进行,雾节点充分挖掘数据之间的空时相关性,通过本发明涉及的优化方法设计出合理的观测矩阵;其次,雾节点对本簇内工业节点采集的数据进行压缩;最后,雾节点之间使用单跳或多跳路由将压缩数据转发到云节点。在云层,本发明通过部署云节点来存储和执行数据恢复操作,字典训练以及字典与观测矩阵之间的权衡也在这一层进行;在数据处理的最后阶段,云节点负责恢复原始数据以支持相关的工业应用。

(2)首先提出一种基于k-svd思想的信号稀疏化二维自适应字典训练方法:在给定训练字典的情况下,重新设计空时域的观测矩阵,替换随机高斯矩阵,使列相干性达到最小。

针对无线传感器网络中的空时数据集,把原始数据作为两个训练数据集,分别为空间域的xs∈r40×500和时间域的xt∈r40×500;考虑到空时域字典训练的相似性,这里对空间数据集xs的训练进行介绍;空间字典训练的目标是求解如下优化问题:

其中,ψs∈r40×60是目标稀疏字典,θs∈r60×500是相关系数矩阵,s0是稀疏约束,保证每个稀疏表示θs,i包含的非零项不超过20;

其次,用过完备dct矩阵来初始化ψs;这里用到的k-svd算法可以归纳为两个步骤:稀疏编码阶段和k-svd字典更新阶段:

1)稀疏编码阶段:使用任意的追踪算法(例如cosamp),通过以下求解方法来计算每个xs,i∈r500×1的表示向量θs,i∈r500×1

其中,约束条件在上述公式中已有解释,k表示迭代次数,这里k=40;

2)k-svd字典更新阶段:更新字典ψ≡ψ(k-1)中的每一列j0=1,2,...,k:在本阶段中,首先用元素定义样本数据的集合,表示如下:

其次,计算总体误差表示矩阵

其中,是系数矩阵第j行;

然后,仅选择与对应的列来限制从而得到紧接着,可以很容易地通过svd,即更新字典元素并且,可以表示成:

在执行以上两个阶段操作后,对循环次数k加1,然后重复稀疏编码和字典更新,直到训练字典收敛到稳定值;

通过上述流程的执行,能够获得一个新的字典来取代最初的字典。时间稀疏字典ψt的训练方法和空间稀疏字典是类似的,这里就不再重复了。在得到空时稀疏字典后,原始数据就可以稀疏表示为:

(3)使用上述方法训练字典时,可能会导致一个问题,那就是产生一个拥有高列相干性的等效传感矩阵;因此,提出了一种优化方案来设计观测矩阵,使等效传感矩阵的列与列之间尽可能不相干,如下所示:

结合上述公式的稀疏表示,可以重新表示成:

从传输和转发的过程来看,一旦传输完成,空间观测矩阵φs就确定了。本发明基于这一想法,将上述公式扩展为:

接下来,分别定义空间等效传感矩阵(as=φsψs)以及时间等效传感矩阵(at=φtψt),上述公式就可以简化表示为可以进一步转换成如下形式:

其中,y=vec(yt),θ=vec(θt);这样一来,上述公式就重新转化成一维cs问题,而且是等效传感矩阵的kronecker积形式;正如前面提到的,相关性μ(a)的值越小,重构精度就会越高。根据相干性特性,as和at可以分别进行优化,如下:

本发明的目标就是分别最小化μ(as)和μ(at)的值;

根据上述公式,相关性μ(at)是矩阵at各列之间最大的内积。从另一个角度看,它是其gram矩阵中非对角元素的最大绝对值,其中是矩阵at所有列归一化后的等价矩阵。这意味着减少μ(at)的值就是在优化φt;但只有当对应的at是一个方阵时,gram矩阵才有可能等于单位阵i,这一情况在这里是不满足的;再考虑到对于矩阵μ(at)有一个下界:

其中,μg就是welch界,所以,可以通过一个等角紧框架(etf)来减少μ(at)的值;本发明将目标调整为:

其中,h位于一个hμ集:

另外,gram矩阵中的元素可以通过以下表达式来更新:

按照以上的优化解释,观测矩阵的优化问题就变得很好解决;

另外,对于空间域的观测矩阵优化,把as看成as=φsψs,空间相关性μ(as)的减小也是以类似的方式操作。

(4)为了在信号表示的稀疏性和等效传感矩阵的非相干性之间取得更好的平衡,提出观测矩阵与稀疏字典的联合优化,如下所示:

其中,xs∈rkp×l是原始空间训练数据,α是控制的误差的权重因子,它的范围在(0,1)之间,这里取α=0.4。ys是xs在观测矩阵φs下的投影,即ys=φsxs;由此可见,上述公式中的权衡因子α是用来弥补的重构误差的,并且在数据重建阶段,在投影误差上扮演了一个重要的角色;同时,上述公式可以表示成如下形式:

为了便于表达,做如下定义:上述公式可以表示为:

上述优化问题是通过k-svd字典训练和观测矩阵优化方法来解决的;首先,给定初始化的φs和ψs的值;其次,通过cosamp算法对观测矩阵φs进行优化;接着,通过k-svd方法,可以得到wψs,并且利用之前优化后的观测矩阵φs,可以从wψs中计算出稀疏字典ψs;最后,自适应地组合稀疏字典ψs中一些相似度很高的列,具体来讲,先对由ψs构成的gram矩阵中的所有非对角元素的绝对值进行排序,然后标记矩阵中最大的t%,这里t是一个阈值(t=20),如果gram矩阵中的元素gij被标记了,就更新字典ψs中的值:

其中,ψi和ψj分别都代表了ψs的列,这里不需要ψj,抛弃该列;

这样,就完成了一次迭代,计算出的训练字典ψs被用到下一次迭代中,来得到优化观测矩阵并且同时得到训练字典该过程会重复多次,直到达到停止标准为止。

(5)采用具有比其他匹配跟踪算法有更好的恢复性能的压缩采样匹配跟踪(cosamp)算法进行数据重构,如下所示:

重构过程的主要目标是求解如下方程:

其中,观测矩阵φ∈r5760×20000和稀疏基ψ∈r6400×14400分别表示为

如果观测矩阵的项是从零均值高斯矩阵中选取的,则可以很容易地推导出传感矩阵φ·ψ以具有压倒性的高概率满足rip。另外,当正交基为dct时,观测矩阵与稀疏基的相关性较低或为零(即不连贯的);

最后,可以根据cosamp恢复θ的近似稀疏值由于云节点上已知dct基,x的最终重构值可以计算为:

综上所述,本发明设计的一种融合字典训练与观测矩阵优化的数据高质压缩方法,可以应用于真实的iiot。具体来说,为了实现真实iiot中空时数据的稀疏表示,本发明提出了一种基于k-svd思想的二维字典训练方法。此外,由于传统的随机高斯矩阵很难匹配新设计的字典,为了最小化等效传感矩阵的列相干性,本发明提出了一种针对训练后空时字典的观测矩阵设计方法。最后,本发明提出了一种观测矩阵与稀疏字典的联合优化方法,在稀疏性和非相干性之间取得了较好的平衡,实现了更准确的数据恢复。与现有的数据压缩方案相比,本发明提出的hqdc方法可以在真实的iiot场景中高效地工作,同时,hqdc方法在重建精度上明显优于其他的数据压缩方案。

融合字典训练与观测矩阵优化的数据高质压缩方法在实际中的应用,原始数据基于训练字典的变换系数如图2所示。这表明本发明的字典训练方法成效显著,同时也意味着原始数据在经过压缩之后可以很容易的以极高精度重建出来。又如图3所示,其表明了本发明对稀疏基和观测矩阵进行权衡(联合优化)前后的压缩重构误差对比。从本图可以发现,无论压缩率设为何值,经过权衡之后(即对稀疏基和观测矩阵联合优化后)本发明的重构误差总是小于权衡前的误差。一方面,这恰恰证明了单独训练稀疏基以及优化观测矩阵是无法使得压缩方案的重构误差达到理论上的最小值的;另一方面,也说明了稀疏基和观测矩阵之间存在着相关性,通过一定的联合优化可以很好的权衡它们之间的关系,从而降低数据的重构误差。不仅如此,如图4所示,本发明压缩方法相较于传统分簇方案(clusteredcompressionscheme)、基于k-means的kronecker空时(二维)压缩方法(k-meansbasedkroneckerspatio-temporalcompression,k-kstc)、基于雾计算的kronecker观测矩阵优化数据压缩方法(fog-basedoptimizedkronecker-supportedcompressiondesign,f-okscd),在重构性能方面的比较,显示本压缩方法在信号准确恢复方面的显著优势。另外,本发明在优化和数据恢复方面的计算成本似乎很高,但是稀疏字典是可以预先训练的,因此优化往往收敛于少量迭代就可以结束,再加上该方法可以适用于绝大多数类型的数据,所以在实际应用场景的实现中是非常有前途的。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1