基于随机自动学习机与模糊算法的高吞吐量中继选择方法与流程

文档序号:15752644发布日期:2018-10-26 18:04阅读:340来源:国知局
基于随机自动学习机与模糊算法的高吞吐量中继选择方法与流程

本发明属于无线传感器网络技术领域,特别涉及基于随机自动学习机与模糊算法的高吞吐量的继选择方法。



背景技术:

在无线传感器网络中,无线传感器节点的资源非常有限,主要体现在能量、存储能力、处理能力和通信宽带上。在一些场景中,如机器人搜救、无人机指挥,传感器节点处于复杂的环境中,在源节点和目的节点直接距离远或者通信链路质量差的情况下,采用直接传输的方式将使系统性能严重下降。合作通信被证明是实现空间多样性和解决无线网络中日益增长的数据吞吐量需求的方法。如何选择最佳中继,通过选择的中继进行多跳传输,进而提高网络的吞吐量等性能指标,对无线传感器网络的研究具有深远的影响。

近年来,提出许多中继选择算法。例如提出的基于模型预测控制(mpc)的方法,通过粒子群移动的算法来定位和控制中继节点的移动,通过简单的考虑可用节点的数量来联合优化网络连接和吞吐量。另外,还有将遗传算法应用到中继选择中。另外一种算法维护一个中继速率表,每次进行源节点到目标节点的传输,要比较直接传输和潜在的协作传输之间速率,选出具有最快速率路径进行传输。然而这种算法当链路质量下降时,通信性能将受到严重影响。在此基础上,提出基于备份路径的辅助传输,来保证数据的可靠性,但这种方法采用可用的潜在路径进行传输,不能选择使吞吐量最优的中继进行传输。

协调器端的通信,由媒体访问控制协议(mac)提供周期性的监听/睡眠状态,防止偷听和空闲监听。当前大多数的研究集中于解决传感器节点的能量消耗问题。但这也导致了其他问题,传感器节点可以关闭其无线传输,但不能与处于该状态的其他节点通信。如果传感器节点切换到侦听状态发送数据,则必须等到其他节点也切换到侦听状态。如果其他节点具有不同的时间表,通信将变得很困难。需要紧急传输的数据经常迟到,整个网络的吞吐量和无线传感网的传输速率因此下降。此外,存在中继负载不均衡的情况,导致网络整体性能下降。



技术实现要素:

本发明实施例提供基于随机自动学习机与模糊算法的高吞吐量的继选择方法。在运行期间,各个源节点具有自组织性,拥有自我优化和自学能力。运行期内,无需与其他节点交换信息,通过环境反馈自适应选择中继,不需要人为干预,以便最大化吞吐量,保证系统稳定运行。在中继与目的节点之间,通过模糊算法达到负载均衡。

为达到上述目的,本发明实施例提供了基于随机自动学习机与模糊算法的高吞吐量的继选择方法,随机自动学习机应用于无线传感器网络中的源传感器节点所在设备上,模糊算法用于进行中继负载均衡,方法包括:

根据无线传感器网络环境进行模型建立,将传感器网络环境模型用四个参数表示e={s,m,(ai)i∈s,(cj)j∈m},其中s表示源节点,即随机自动学习机的输入;m代表所有备选中继,用于进行辅助传输;ai代表可选动作,即选择了哪一个中继去传输;cj表示节点选择合适的中继之后与环境交互输出的反馈信号,本发明中表示为各个源节点与环境交互以后得到的效益函数。

具体的,本发明属于合作通信模式,中继起到数据转发的功能。存在两种中继转发方法,放大转发(af)和解码转发(df)。

在df模式下,中继将接收到的源节点数据包进行解调,解码,然后再次进行调制,编码以后,发送到目的节点。这种方法由于编码,解码以及调制解调,使系统延时上升,传输速率下降。采用df模式传输,系统吞吐量表示如下:

在af模式下,中继节点简单地放大从源节点接收到的信号并将其传输到目标节点。这是一种简单的方法,并且可以低成本实施。采用af模式传输,系统吞吐量表示如下:

需要说明的是,对于合作传输,在特定的情况下,采用中继辅助传输系统的吞吐量不总是比采用直接传输系统的吞吐量大。所以本系统存在直接传输和af传输两种传输方法。采用直接传输,系统的吞吐量如下:

cd(s,d)=wlog2(1+snrsd)(3)

节点生成特定帧结构格式,节点选择相应的动作。即选择特定中继进行传输时,由于中继被共用,中继将采用时分多址的方式服务于各个源节点。一帧内分为两个时隙,用于从源到中继,中继到目标节点的两跳传输。

源节点根据环境反馈获得自学能力,通过和环境的反复交互不断更新状态,最终,找到最优中继进行传输。

具体的,为各个源节点初始化其动作集合,动作选择概率集合,反馈集合。随机自动学习机是一个基于概率的学习工具,它通过随机动作概率向量pik(t)来选择动作,动作概率向量是学习自动机的主要构件,所以必须保持随时更新。

需要说明的是,该系统存在多个源节点去竞争一个中继进行传输的情况,即存在竞争关系,网络建模为拥塞的非合作博弈,网络存在纳什均衡点。即系统达到ne点以后,任何一个节点改变动作,都不会获得更大的效用。

需要说明的是,在初始阶段,设置迭代因子t=0,动作选择概率集合初始化为这样可以保证初始时刻,源节点随机接入中继,进行自动学习。

源节点使用随机学习自动机方法(sla)方法与周围环境进行交互。

具体的,对于任意一个源节点i,初始化概率选择集合,节点通过该概率向量选择相应的动作。选择的动作将作为随机自动学习机的输入。

随机自动学习机将评估该动作与环境交互后对数据传输的影响,输出相应的效用函数,更新动作选择概率集合。

具体的,在时隙t开始时刻,源节点i根据其初始化的概率选择集合选择一个动作,输入到随机自动学习机。随机自动学习机与环境进行交互,在时隙t结束的时候,源节点i将会收到一个效用函数。依据此效用函数的反馈去更新动作概率集合。

需要说明的是,随机自动学习机是一个不断迭代的过程。每个时隙结束以后,完成一次迭代,更新各个源节点的概率选择集合。概率选择集合的更新按照如下公式进行。其中,β取值代表一个步进值,取值范围是0到1,β取初始值0.4,既能保证一定的学习速度,又不至于步进过大,错过最优动作。β用于将各个源节点趋近于稳定的ne点。

pik(t+1)=pik(t)+βri(t)(1-pik(t)),k=ai(t)(4)

pik(t+1)=pik(t)-βri(t)pik(t),k≠ai(t)(5)

随着t不断的增大,学习不断进行,概率选择概率集合趋向于集中化。此时应当调整β使其变小,由此可以在小范围内进行继续的学习探索。β和迭代次数存在关联,本发明中,将β定义如下:

本发明中,ri(t)代表环境奖励。源节点选择一个动作以后,会收到环境反馈的一个效用函数uo(i),然后源节点再选择另外一个动作与环境交互,得到最新的效用函数un(i),定义δu为效用函数的差值。当δu增大时,ri(t)取值+1,反之,取-1。定义如下:

源节点接有不同传感器,本发明考虑实际应用中,传感器不同节点发送数据的紧急情况有所不同。本发明在中继节点转发源节点数据到目的节点时,考虑数据发送的差异,故而本发明中存在不同优先级的数据以及不同的优先队列,用于对不同优先级数据的传输。

具体的,具有高优先级的数据比低优先级的数据拥有更多的传输机会。本发明中存在三种不同优先级的数据,优先级为1、2、3代表的优先级依次升高。优先级为1的数据在一帧内有一次数据接入信道,发送到目的节点的机会。优先级为2的数据在一帧内有两次机会。优先级为3的数据有4次数据传输机会。

相应的,存在三种级别的优先级队列。中继节点将高优先级的数据放入高优先级队列中,将低优先级数据放入低优先级队列。因此,高优先级的数据有机会在任何时间内发送。具体的发送方案见图5。

本发明中,不失一般性的,假设中继节点到目的节点的数据链路信道衰落模型为瑞利衰落。瞬时信噪比的密度函数定义如下:

上式中,代表中继节点到目的节点的平均信噪比。根据瞬时信噪比的标准定义,i链路信噪比大于j链路信噪比的概率定义如下:

对于m个中继节点,中继节点i被选做最优中继,只有当中继i到目的节点的瞬时信噪比大于其他m-1条链路,因此,中继节点i被选择的概率为:

由于不同链路有不同的信道条件,信道条件好的链路被选择的概率大,负载严重,不利于平衡传输,本发明中采用模糊算法平衡负载。

具体的,模糊系统的设计包含定义的输入信号和隶属函数,隶属函数用于量化模糊集输入值的隶属度。模糊系统的每个输出都对应一个标签。本系统中,”fir_ch”,”sec_ch”,”th_ch”,”no_ch”被用作模糊输出的标签。不同隶属函数可以确定输入空间中不同的粒度,同时保持少量状态减少控制规则的大小。

系统存在两种模糊集,snr模糊集和负载模糊集。将snr模糊集分别定义为相对高集(rh),高集(h)和非常高(vh)集。snr模糊集的隶属函数定义如下:

本发明中,负载模糊集定义为系统正在使用的信道数与中继当前可用最大信道数之间的比率。负载模糊集的隶属函数定义如下:

其中,ai和bi都是隶属函数的参数。一组模糊规则是模糊系统的核心部分,也是计算输入值输出的关键。规则遵循if-then类型的语言句法来设置控制策略。为了平衡中继的负载,我们提出的方案中的模糊规则概述如下:

1if(snris“vh”)and(loadis“l”)then(outputis“fir_ch”)

2if(snris“rh”)and(loadis“h”)then(outputis“no_ch”)

3if(snris“vh”)and(loadis“h”)then(outputis“no_ch”)

4if(snris“h”)and(loadis“l”)then(output“sec_ch”)

5if(snris“h”)and(loadis“m”)then(outputis“sec_ch”)

6if(snris“h”)and(loadis“h”)then(outputis“no_ch”)

7if(snris“rh”)and(loadis“l”)then(outputis“th_ch”)

8if(snris“rh”)and(loadis“m”)then(outputis“th_ch”)

9if(snris“rh”)and(loadis“h”)then(outputis“no_ch”)

考虑瞬时信噪比snr=α,load=β定义

ωi(i=1,2,3,4)分别代表模糊集合的输出fir_ch、sec_ch、th_ch、no_ch。

利用信噪比snr和负载两个输入集,通过各个中继的输出,选取fir_ch、sec_ch、th_ch、no_ch的最大者,不至于出现一个信道条件好的中继负载严重的情况。

为达到上述目的,本发明实施例提供了一种高吞吐量的中继选择装置,应用于无线传感器网络中的源传感器节点,所述装置包括:

发送单元,各个源节点根据自身的情况设置生成的帧格式,发送给中继节点或者直接发送给目的节点;

中继单元,在本系统中,用于进行辅助传输。中继单元用于接收各个源节点发送的数据帧,对数据帧进行放大转发;

接收单元,用于接收各个源节点发送的数据帧;所述数据帧至少包括节点id、数据体、奇偶校验位等参数;

评估单元,根据传感器节点的效用函数以及协调的工作状态评估该动作的选择概率,更新动作概率集合;

自主学习单元,节点采用随机学习自动机方法更新自身的动作集合,动作选择概率集合以及反馈的效用函数;

自适应调节单元,选择动作之后,基于学习次数调整参数β,完成快速中继选择。

模糊单元,通过模糊算法对中继进行负载均衡,完整数据平稳传输。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于随机自动学习机的高吞吐量的继选择方法的流程示意图;

图2为本发明实施例提供的学习自动机的模型示意图;

图3为本发明实施例提供的时分多址接入源节点的结构示意图;

图4为本发明实施例提供的一种高吞吐量中继选择装置的结构示意图。

图5为本发明实施例提供的目的节点采用优先级区别的方式接收发送节点数据的结构示意图。

图6为本发明中中继接收到的数据优先级说明。其中,优先级为3的数据优先级最高,一帧内有4次接入信道的机会。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

依据附图,对本发明的技术方案作具体说明。

所述的基于随机自动学习机与模糊算法的高吞吐量的继选择方法,包括以下步骤:

s101,对无线传感器网络进行模型建立。具体的,根据无线传感器网络环境进行模型建立,将传感器网络环境模型用四个参数表示e={s,m,(ai)i∈s,(cj)j∈m},其中s表示源节点,即随机自动学习机的输入;m代表所有备选中继;ai代表可选动作,即可备选的中继;cj表示节点选择合适的中继之后与环境交互输出的反馈信号,本发明中表示为表示各个源节点的效益函数。

需要说明的是,随机自动学习机是一个不断迭代的过程。每个时隙结束以后,完成一次迭代,更新各个源节点的动作集合、概率选择集合、效用函数集合。

s102,节点生成特定帧结构格式,然后进行发送。本发明中采用中继转发的方式提高系统传输速率。一帧可以分为两个时隙,在时隙1中,源节点将数据传输到中继节点。在时隙2中,中继将数据放大转发,发送到目的节点。特别的,本发明中,中继节点的数据少于源节点的数据。网络正常运行时,存在源节点竞争中继的情况。中继节点将采用时分多址的轮询方式服务于各个接入的源节点。每两帧时间结束以后,服务于下一个源节点,具体见图3。

s103,为各个源节点初始化其动作集合,动作选择概率集合以及回馈集合。

具体的,随机自动学习机是一个基于概率的学习工具,它通过随机活动概率向量pi(t)来选择动作,动作概率向量是学习自动机的主要构件,所以必须保持随时更新。学习自动机ai的动作概率向量表示如下:

其中,pi(t)表示在时刻t,节点ai选择某一动作的概率。

需要说明的是,在初始阶段,为了保证源节点随机接入中继,将概率向量集合初始化为:

其中t是迭代因子,代表一次迭代。i代表任意一个源节点。k代表动作,即选择哪一个中继。m+1代表可选动作总数。

效用函数代表各个源节点选择动作以后,环境给出的反馈。效用函数初始化如下:

s104,源节点使用随机自动学习机方法(sla)方法与周围环境进行交互。自动学习机属于强化学习的一种手段。每个源节点根据环境反馈获得自学习能力以找到合适的中继节点。源节点之间无需交换信息,具有自组织性和自我优化能力。

随机自动学习机模型可以由三维数组sla=(a,u,p)表示,其中,a={a1,a2,...,ar}表示学习随机自动机的输入动作集;u={u1,u2,...,ur}表示效用函数集,即环境的反馈;p={p1,p2,...,pr}表示概率动作选择集合,满足其中pi(t)表示经过第t轮学习以后ai对应的动作概率。

s105,特定时隙内,节点根据概率选择集合选择相应的动作。具体来讲,概率选择集合处于不断的更新之中。源节点每选择一个动作与环境进行交互,都会接收到环境的一个效用反馈。以此反馈作为概率更新的依据。概率更新完

s106,反馈与更新。在随机自动学习机模型中,sla=(a,u,p)。p代表概率动作选择集合。t次迭代结束以后,将收到环境的反馈,在本发明中代表源节点收到的效用函数ui(t)。

s107,协调器采集各个中继节点发送过来的数据。考虑接收到的数据发送到目的节点的紧急程度不同。本发明中,中继节点中接收到的数据将采用不同的优先级进行传输,需要快速接入信道的数据,将存放于高优先级队列中等待发送;不需要快速接入信道的数据,将存放于低优先级队列中等待发送。采用优先级区分的方式,数据传输更加合理。

本发明中,考虑可能存在不同中继信道条件差别很大的情况。根据snr数据集与负载数据集作为模糊算法的输入,可以实现中继与目的节点间数据传输的负载均衡,达到稳定传输的目的。

本发明假设无线传感器网络为星型拓扑结构,协调器收集终端设备发送的数据。事例性的,每个中继节点接收到的数据存在三种优先级的数据l0、l1、l2需要向协调器发送。数据l0、l1、l2对应的优先级分别为1、2、3。优先级为3的数据,将放入最高级别的优先队列中,在一帧内有4次接入信道的机会,接入信道并成功发送数据以后,在该帧时间内,将不再进行信道竞争。同样的,将优先级为2的数据放入次级优先队列中,在一帧内有2次接入信道的机会,接入成功后,将不再竞争信道资源;而无论信息是否成功发送,优先级为1的节点一帧内只有一次接入信道的机会。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1