一种满足公平性条件的最大化网络生存期传输调度方法

文档序号:7806569阅读:323来源:国知局
一种满足公平性条件的最大化网络生存期传输调度方法
【专利摘要】本发明涉及一种满足公平性条件的最大化网络生存期传输调度方法,属于无线通信领域。包括将传感器节点选择的问题建模为约束马尔可夫决策过程,利用动态规划中的Bellman方程求解CMDP问题,减少计算复杂度得出最终的约束最优生存期和最优策略,确定每个时隙选择的传感器节点。本发明针对无线体域网在实际应用中需要满足一定的公平性的情况,克服了传统传输调度方法仅考虑最大化生存期而忽略了公平性的缺点,在保证满足公平性约束条件下最大化了网络的生存期,更加适用于对一个病人监测多项生理参数的情况。
【专利说明】一种满足公平性条件的最大化网络生存期传输调度方法

【技术领域】
[0001]本发明涉及无线通信领域,是一种面向无线体域网的信号传输调度方法。

【背景技术】
[0002]无线体域网(WBAN, Wireless Body Area Network)作为物联网的重要组成部分和无线传感器网络在医疗监护等方面的应用,逐渐成为了人们关注的焦点。因为组成无线体域网的传感器节点由电池供电,能量受到严格的制约,所以设计高效、公平的传输调度方法来延长网络生存期是体域网的研究重点和热点,不仅具有理论研究意义,还具有重要的实际应用价值。
[0003]Dagher等人提出了一种最大化网络生存期的迭代算法,把最大化网络生存期的问题归结为一个PO(Pareto-Optimal)问题并且得出了最优解。Chen等提出了无线传感器网络中生存期的一般化公式,并且证明了信道状况信息和剩余能量信息是影响网络生存期的主要因素。随后Chen等又提出一个被称为DPLM(Dynamic Protocol for LifetimeMaximizat1n)的动态传输调度协议并且取得了渐进最优的网络生存期。Cohen等提出了一种时变机会协议,仿真结果表明该协议获得的生存期优于与其对比的其它几种协议。Madan等提出了一种结合了物理层、MAC层和路由层的联合优化算法,该算法将计算最优路径流、链路调度和传输功率归纳成一个非线性最优化问题,大大延长了网络生存期。Zhai等运用协作通信的方法设计了一种新的协作MAC协议,有效降低了发射功率,提高了无线传感器网络的生存期。2012年,Movassaghi等提出一个热量和能量自感应的体域网能效路由协议,根据节点的温度和能量水平为每个路径计算成本函数来决定路由的选择,有效地利用可用资源,延长了体域网的生存期。Ortiz等提出了一种基于多跳树的自适应路由协议,构建了一个同时考虑节点电池余量、接收信号强度和跳数的生成树,协议能够平衡节点间的能量消耗,延长网络使用寿命。刘汉春等以延长体域网网络生存期为目标提出了一种基于加入临时节点的高能效路由算法。该算法针对体域网在实际应用中出现的新情况,通过充分利用临时节点的剩余能量平衡网络中各传感器节点之间能量消耗,仿真结果表明,该算法大大延长了网络的生存期。
[0004]网络的资源应公平的分配给各传感器节点,公平性是无线体域网调度方法中的关键问题之一。公平的调度方法应根据各传感器节点的特性需求分配相应的资源,防止某个节点占用过多的信道资源而影响到其他用户的传输。无线体域网对实时性的要求很高,如果某个传感器节点占用过多的信道资源而导致其他节点长时间得不到机会传输,对重要的生理参数预警不及时会导致很严重的后果。好的传输调度方法不仅要最大化整个网络的生存期,同时也应保证每个传感器节点的公平性。上述各种最大化网络生存期的方法均没有考虑到公平性的要求,不能完全满足实际应用中多种传感器节点对资源需求不同的情况。经过对现有技术文献的检索,尚未见到将生存期与公平性联合考虑的方法的相关报道。


【发明内容】

[0005]本发明提供一种满足公平性条件的最大化网络生存期传输调度方法,以解决目前各种最大化网络生存期的方法均没有考虑到公平性的要求,不能完全满足实际应用中多种传感器节点对资源需求不同的情况的问题。
[0006]本发明采取的技术方案是,包括
[0007](I)无线体域网,该无线体域网是一个以人体为监测对象的网络,将若干个功能不同的传感器节点置于体表或者体内的相应位置,周期地监测和记录各种生理信息,各传感器节点将采集的数据通过蓝牙、Zigbee、超宽带或其他方式的人体通信技术传递给汇聚节点AP(Access Point),AP再将这些信息通过外部网络传送到远程控制中心;
[0008]在IEEE802.15.6通信标准的MAC层协议中,时间被分成了等长的超帧结构,超帧结构包括如下四个部分:控制阶段、竞争接入阶段CAP、竞争空闲阶段CFP、非活跃阶段,CFP阶段又继续分成若干时隙,在无线体域网中,时间是待分配给各个传感器节点的资源,无线体域网中所有传感器节点共用一个信道,在每个时隙只能有一个传感器节点将采集的数据传送到AP节点,被选中的传感器节点消耗传输数据所需的能量;
[0009](2)将传感器节点选择的问题建模为约束马尔可夫决策过程,一个传输调度协议恰好对应CMDP问题中的一个策略U,将从状态i开始最大的网络生存期为L*(i),表示如下:
[0010]r(0=maxLu(0

u
[0011]如果网络使用某个策略U在达到停止状态之前获得的报酬最多(即网络生存期最长),那么我们称这个策略为最优策略,用u*表示,
[0012]L, (i) - L (;), V; e S\St
[0013]定义Ua = {u e U:f彡fj为可行策略集。如果策略U* e Ua满足条件L (u*)彡L (u),(u e UJ,则u*被称为约束最优策略;
[0014]CMDP的目标是寻找一个最优的策略u* e Ua来最大化网络生存期L,最优的传输调度协议由最优策略给出,即明确了最优策略u%就可以知道在每个时隙选择哪个传感器节点来发送数据;
[0015]CMDP模型中的各个参数介绍如下:
[0016](a)状态空间
[0017]在每个时隙,网络的状态i由剩余能量e,传输所需要的能量w和公平系数f共同组成。我们定义网络状态空间S如下:
[0018]S={i= (e, w, f)}
[0019]当网络生存期耗尽时,网络达到一个特殊的终止状态St如下:
[0020]St - {{e,w, f):\f{en:en < ^1) ore < w}
[0021]en为传感器节点n的剩余能量,ε i为一个时隙传感器节点采用最小发射功率传输数据需要的能量,en:en< ε:表示传感器节点η的剩余能量在任何的信道状况下都不能完成一次传输,e<w意味着一次传输失败;
[0022](b)行动空间
[0023]用A来表示行动的集合,当网络处于状态i = (e,w, f) e S时,行动空间可以表示为:
[0024]A(i) = A[ (e, w, f) ] = {n: en ^ wn}
[0025]根据终止状态的定义,可以得出,任何非终止状态的行动空间均为非空的;
[0026](c)转移概率
[0027]当网络的状态为i,经过行动a的作用后,下一个状态为j的概率为
[0028]Piili= )\,'=?, /〃,,.]
[0029]其中p(w’)= Pr {W = w’}是W的概率密度函数,是由信道衰落决定的;
[0030](d)传输报酬
[0031]在每次数据传输之后,网络都会得到一个单元的回报,直到网络进入停止状态,也就是说,如果网络的状态为/ = (e,w, /)电,这个时隙的立即回报即为
[0032]
[0033](e)约束条件
[0034]假设网络处于状态i,如果经过行动a的作用以后网络的公平系数f大于等于给定的阈值fn,则我们称行动a为可行的行动,公式可表示如下:
[0035]f(i,a) ^ fn
[0036]f (i, a)表示网络在状态i经过a的作用后到达下一个状态时的公平系数,网络在状态i可行的行动集由AJi)来表示;
[0037](f)策略
[0038]策略集U中的策略u是一个序列u = {uQ, U1,...},其中un: S — {I,..., N}表示在第η个时隙选择的传感器节点,UnQ1, a1; i2, a2,..., In^1, an_1; in)是A的条件概率测度,以首个节点能量耗尽的时刻度量生存期,所以,整个网络的生存期L可以由网络到达停止状态St之前所有的回报之和来描述,定义Lu(i)为网络从状态i开始,使用策略u的生存期,即所有回报之和;
[0039](3)求解最优策略
[0040]从状态i开始,满足约束条件的最大的网络生存期L*(i)是如下Bellman最优方程的唯一解,
[0041 ] L ⑴=广[(e,/)] = R(0 + max ? Σ Pwi [ (/')!, V/ G S
ΗΕ,Λχ?).?
[0042]s.t.fj 彡 fn
[0043]其中&是网络在状态j下的公平系数,4是根据不同的应用场景给出的公平阈值;
[0044]实际上,上面的公式还可以写作
[0045]^ (O 二广[(e,^./')] = _ + max {[ Piiij r (/)}, V/ € ^
fieA W J^s
[0046]传输调度方案的最优策略U可以由如下公式得出
[0047]M(0 = arSmax (ΣPiaj广(.,)U ^ S\st

Λ (O j已s
[0048](4)减少计算复杂度
[0049]—个等效的Bellman最优方程写成如下形式:
[0050]

【权利要求】
1.一种满足公平性条件的最大化网络生存期传输调度方法,其特征在于,包括: (1)无线体域网,该无线体域网是一个以人体为监测对象的网络,将若干个功能不同的传感器节点置于体表或者体内的相应位置,周期地监测和记录各种生理信息,各传感器节点将采集的数据通过蓝牙、Zigbee、超宽带或其他方式的人体通信技术传递给汇聚节点AP(Access Point),AP再将这些信息通过外部网络传送到远程控制中心; 在IEEE802.15.6通信标准的MAC层协议中,时间被分成了等长的超帧结构,超帧结构包括如下四个部分:控制阶段、竞争接入阶段CAP、竞争空闲阶段CFP、非活跃阶段,CFP阶段又继续分成若干时隙,在无线体域网中,时间是待分配给各个传感器节点的资源,无线体域网中所有传感器节点共用一个信道,在每个时隙只能有一个传感器节点将采集的数据传送到AP节点,被选中的传感器节点消耗传输数据所需的能量; (2)将传感器节点选择的问题建模为约束马尔可夫决策过程,一个传输调度协议恰好对应CMDP问题中的一个策略U,将从状态i开始最大的网络生存期为L*(i),表示如下:E (/)= maxA,,(z_)U 如果网络使用某个策略u在达到停止状态之前获得的报酬最多(即网络生存期最长),那么我们称这个策略为最优策略,用u*表示,L, (O(O, ViG1SWi 定义Ua = {u e U:f彡fn}为可行策略集。如果策略u* e Ua满足条件L (u*)彡L (u),(u e UJ,则u*被称为约束最优策略; CMDP的目标是寻找一个最优的策略u* e Ua来最大化网络生存期L,最优的传输调度协议由最优策略u*给出,即明确了最优策略u%就可以知道在每个时隙选择哪个传感器节点来发送数据; CMDP模型中的各个参数介绍如下: (a)状态空间 在每个时隙,网络的状态i由剩余能量e,传输所需要的能量w和公平系数f共同组成。我们定义网络状态空间S如下:
S={i= (e, w, f)} 当网络生存期耗尽时,网络达到一个特殊的终止状态St如下:St = {{e,wj):/{en\en < sj ore < w} en为传感器节点n的剩余能量,ε —个时隙传感器节点采用最小发射功率传输数据需要的能量,en:en< ε:表示传感器节点η的剩余能量在任何的信道状况下都不能完成一次传输,e<w意味着一次传输失败; (b)行动空间 用A来表示行动的集合,当网络处于状态i = (e,w, f) e S时,行动空间可以表示为:
A(i) = A[(e, w, f)] = {η:en ^ wn} 根据终止状态的定义,可以得出,任何非终止状态的行动空间均为非空的; (C)转移概率 当网络的状态为i,经过行动a的作用后,下一个状态为j的概率为
其中p(w’)=Pr{W = w’}是W的概率密度函数,是由信道衰落决定的; (d)传输报酬 在每次数据传输之后,网络都会得到一个单元的回报,直到网络进入停止状态,也就是说,如果网络的状态为i = (e,w, f)€ St,这个时隙的立即回报即为
(e)约束条件 假设网络处于状态i,如果经过行动a的作用以后网络的公平系数f大于等于给定的阈值fn,则我们称行动a为可行的行动,公式可表示如下:f (i, a)≥ fn f(i,a)表示网络在状态i经过a的作用后到达下一个状态时的公平系数,网络在状态i可行的行动集由Aa(i)来表示; (f)策略 策略集U中的策略u是一个序列u = {uQ, U1,...},其中un: S — {I,..., N}表示在第η个时隙选择的传感器节点,UnQ1, a1; i2, a2,..., in_!, an_1; in)是A的条件概率测度,以首个节点能量耗尽的时刻度量生存期,所以,整个网络的生存期L可以由网络到达停止状态St之前所有的回报之和来描述,定义Lu(i)为网络从状态i开始,使用策略u的生存期,即所有回报之和; (3)求解最优策略 从状态i开始,满足约束条件的最大的网络生存期L*(i)是如下Bellman最优方程的唯一解,
其中A是网络在状态j下的公平系数,fn是根据不同的应用场景给出的公平阈值; 实际上,上面的公式还可以写作
传输调度方案的最优策略U可以由如下公式得出
(4)减少计算复杂度 一个等效的Bellman最优方程写成如下形式:
所以,约束最优策略也可以通过下式求出w[( e, w, /)] = arg max L {e-1n W11 ] 在实现过程中,每个时隙开始的时候,AP节点广播一个信标信号来唤醒所有传感器节点,为了使AP节点获取全局信道信息,所有的传感器节点都需要发送一个导频信号来回复AP的信标信号,AP节点利用接收到的信号来估计所有节点的信道状况并且得到传输需要的能量《,然后根据状态(e,w,f)来计算最优策略u,明确了最优策略,即知晓了在每个时隙应该选择的传感器节点,最后,AP节点广播被选中传感器节点的ID号,该传感器节点开始传输其采集到的数据,由于AP节点知道所有传感器节点的信道状况,所以能够继续更新网络状态为下一个时隙的到来做准备。
2.根据权利要求1所述的一种满足公平性条件的最大化网络生存期传输调度方法,其特征在于,所述公平系数f定义如下:定义(T1, T2,...,Tn)表示每个传感器节点实际的传输次数,O表示已经传输的总次数,Od1, b2,..., bN)是表示各个传感器节点重要性的权值。对于传感器节点n,定义标准化的传输次数为xn = VbnO 假设有N个用户竞争网络资源,第η个用户获得的资源为Xn,那么定义网络的公平系数为
f在O和I之间取值。如果网络的公平系数f= 1,则表示网络是完全公平的。网络的公平系数越大,公平程度越高,反之亦然。
【文档编号】H04W74/04GK104168661SQ201410275674
【公开日】2014年11月26日 申请日期:2014年6月19日 优先权日:2014年6月19日
【发明者】胡封晔, 尹颖奇, 杜大鲲, 臧达霏, 邓云蕾, 赵利英, 王志军, 杜宇, 王丰, 王璐 申请人:吉林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1