基于模式统计的时间冗余数据消除方法

文档序号:7810121阅读:348来源:国知局
基于模式统计的时间冗余数据消除方法
【专利摘要】本发明公开了一种基于模式统计的时间冗余数据消除方法。本发明设计一种基于周期相关性和线性相关性的时间冗余数据消除方法,该方法利用物理现象中经常出现的周期相关性和线性相关性,通过分析传感节点采集的物理数据,统计得到物理现象的变化模式,以及每种变化模式的出现概率,然后利用得到的统计信息,来对未来的数据进行预测,进而抑制可预测数据的发送,以消除时间冗余数据,减少传感节点发送的数据量,降低发送频次,达到节省节点能量,降低网络负载,延长网络生存期的目的。本发明所采用的技术方案是:基于模式统计的时间冗余数据消除方法,该方法包括双预测模型冗余消除框架,基于最小二乘法的预测模型选择算法和基于模式统计的预测模型选择算法等三部分。
【专利说明】基于模式统计的时间冗余数据消除方法

【技术领域】
[0001] 本发明通常涉及无线传感器能量节省和冗余消除等领域,具体是指基于模式统计 的时间冗余数据消除方法。

【背景技术】
[0002] 无线传感器网络被广泛的应用于气候及环境监测等应用。这些应用中,传感节点 一般依赖电池供电且很难二次供电,并被随机的部署在无人值守的观测区域,周期性的采 集数据,并将数据以无线的形式发送给Sink节点。依赖电池供电这一特征,导致了传感节 点的能量非常有限。通信开销则是节点能量消耗的主要因素,例如TelosB节点,发送和接 收的能量消耗分别是每比特720nJ和810nJ,而其每比特的运算开销是I. 2nJ。但是,在环 境监测中,物理现象的连续性导致单个节点采集的数据在一定时间范围内存在很高的时间 相关性。例如采集的数据相似或者具有某种线性增长趋势,以至于我们可以利用节点的历 史信息预测得到未来一段时间内的采集值。发送这些可预测的数据(我们称为时间冗余数 据),显然会导致能量的极大浪费。因此如何利用物理现象的局部线性相关性,来减少数据 的发送量,对于节省传感节点的能量,提高能量的使用效率,延长网络的生存期有着重要的 影响。


【发明内容】

[0003] 本发明要解决的技术问题是,提供一种基于模式统计的冗余消除方法的设计和实 现。该方法通过设计一种通用的基于双预测模型的冗余消除框架,来提供一种减少数据发 送量,降低节点能耗的机制,然后提出两种不同的预测模型选择算法,以提高预测模型的 预测准确率,延长预测模型的持续时间,以尽可能多的消除冗余数据,减少数据的发送量。
[0004] 为了实现上述技术目的,本发明的技术方案是,一种基于模式统计的时间冗余数 据消除方法,包括以下步骤:
[0005] 步骤一:在Sink节点和传感节点分别预设一个相同的预测模型,在初始时,Sink 节点初始化缓存并将预测模型初始化为预设的模型,传感节点将预测模型初始化为预设的 模型;
[0006] 步骤二:传感节点周期性采集数据,并计算采集数据与通过预测模型预测得到的 数据的误差,如果误差小于预定义的误差,则不向Sink节点发送实际值,Sink节点通过自 身所储存的预测模型得到预测数据,并作为采集数据发送至用户;否则传感节点将采集数 据发送至Sink节点,Sink节点将收到的传感节点的采集数据发送至用户;若Sink节点连 续m次接收到传感节点的采集数据,则进入步骤三;
[0007] 步骤三:Sink节点对预测模型进行更新,利用传感节点所采集的物理数据在一段 时间内呈现线性变化的特点,并利用周期性现象计算各种线性模式的出现概率,选择能够 拟合最近接收的m个采集数据,且出现概率最大的线性函数作为新的预测模型,否则通过 最小二乘法,对最近接收的m个采集数据进行线性拟合,并并将此线性函数作为新的预测 模型;
[0008] 步骤四:Sink节点将新的预测模型发送至传感节点,并返回步骤二直至采集过程 结束。
[0009] 所述的方法,步骤三中所述的通过最小二乘法对数据进行拟合的步骤为:
[0010] 将Sink节点所收到最新的m个实际的采集数据S = Kt1, d),(t2, d2),…,(tm, dm)} 视为平面中的m个点,其中Cli为111个采集值中第i个被采集的数据,&为采集Cli的时间; 并使用一条直线d= a*t+P对这m个点进行拟合,则(a,¢)应使最小均方差最小,即使 得下式

【权利要求】
1. 一种基于模式统计的时间冗余数据消除方法,其特征在于,包括以下步骤: 步骤一:在Sink节点和传感节点分别预设一个相同的预测模型,在初始时,Sink节 点初始化缓存并将预测模型初始化为预设的模型,传感节点将预测模型初始化为预设的模 型; 步骤二:传感节点周期性采集数据,并计算采集数据与通过预测模型预测得到的数据 的误差,如果误差小于预定义的误差,则不向Sink节点发送实际值,Sink节点通过自身所 储存的预测模型得到预测数据,并作为采集数据发送至用户;否则传感节点将采集数据发 送至Sink节点,Sink节点将收到的传感节点的采集数据发送至用户;若Sink节点连续m 次接收到传感节点的采集数据,则进入步骤三; 步骤三:Sink节点对预测模型进行更新,利用传感节点所采集的物理数据在一段时间 内呈现线性变化的特点,并利用周期性现象计算各种线性模式的出现概率,选择能够拟合 最近接收的m个采集数据,且出现概率最大的线性函数作为新的预测模型,否则通过最小 二乘法,对最近接收的m个采集数据进行线性拟合,并并将此线性函数作为新的预测模型; 步骤四:Sink节点将新的预测模型发送至传感节点,并返回步骤二直至采集过程结 束。
2. 根据权利要求1所述的方法,其特征在于,步骤三中所述的通过最小二乘法对数据 进行拟合的步骤为: 将Sink节点所收到最新的m个实际的采集数据S = Kt1, (I1), (t2, d2),…,(tm, dm)}视 为平面中的m个点,其中Cli为111个采集值中第i个被采集的数据,t为采集Cli的时间;并 使用一条直线d= a*t+i3对这m个点进行拟合,则(α,β)应使最小均方差最小,即使得 下式
取得极小值,故(α,β )应满足式(1)
根据式(1)则求得
由此得到预测模型Μ(α,β),其中α,β分别是拟合直线的斜率和截距。
3. 根据权利要求1所述的方法,其特征在于,步骤三中所述的利用周期性现象计算各 种线性模式的出现概率,出现概率使用加权频率表示,加权频率越大,则出现概率越高,力口 权频率越小,则出现概率越低,加权频率计算方法如下: 设传感节点所使用的所有预测模型的斜率按时间顺序构成了模式序列(CI1, CI2,… ,αη),其中CIi是整个采集过程中使用的第i个预测模型的斜率;每种预测模型的持续时间 按时间顺序构成了持续时间序列(T 1, T2,…,Tn),其中Ti是整个采集过程中使用的第i个预 测模型预测的持续时间;线性模式α在i时刻的加权频率f计算方法如下:
其中f (O) = 0, r为衰老因子(0〈r〈l)。
4. 根据权利要求1所述的方法,其特征在于,步骤三中所述的选择能够拟合最近接收 的m个采集数据且出现概率最大的线性函数作为新的预测模型,其步骤为: 当Sink节点接收到某个传感节点的m个连续的采集值后,记失效的预测模型为 MUpm,PpJ ;指定的预测误差为e ;m个采集值为D= {(怀屯),(t2,d2),…,(tm,dm)},其中 Cli为m个采集值中第i个被采集的数据,&为采集Cli的时间;此时预测模型的斜率构成模 式序列A= {> D α2,…,aj,其中ai是整个采集过程中使用的第i个预测模型的斜率; 根据权利要求2中所述方法计算得到的结果为(a ls,β ls),其中a ls,β ls其中分别是权利 要求2中拟合结果的斜率和截距; 则模型选择过程如下: 步骤1 :首先检查模式序列A中是否存在能够拟合D的斜率,即斜率是否满足下式(4), 如果存在则转步骤2,否则转步骤5 ;
步骤2 :假设满足式(4)的斜率集为Af = { α n,a i2,…,a ik},根据权力要求3中计算 加权频率的方法分别计算此时Af中每种斜率的加权频率,选择其中加权频率最大的斜率α 作为新预测模型的斜率; 步骤3 :根据斜率α从式(4)中解得截距IoweKii〈upper,为了使得拟合误差最小,选 择(lower+upper)/2作为预测模型的截距; 步骤4 :将α加入模式序列A,令M = ( a,(lower+upper)/2),转步骤6 ; 步骤5 :将a ls加入模式序列A,并令M = ( a ls, β ls); 步骤6:将M作为新预测模型。
5. 根据权利要求1所述的方法,其特征在于,m的取值为3-7。
【文档编号】H04W52/02GK104394580SQ201410366167
【公开日】2015年3月4日 申请日期:2014年7月29日 优先权日:2014年7月29日
【发明者】罗娟, 宋艳超, 贺赞贻, 金鑫 申请人:湖南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1