一种基于Whittleindex的RFID多阅读器信道资源分配方法与流程

文档序号:15701831发布日期:2018-10-19 19:58阅读:259来源:国知局

本发明涉及无线射频识别(Radio Frequency Identification,RFID)中的多标签-多阅读器防碰撞技术,具体地说是一种基于Whittle index的RFID多阅读器信道资源分配方法。



背景技术:

无线射频识别(RFID)技术是一种利用无线射频通信实现的非接触式自动识别技术,无需识别系统与特定目标之间建立机械或者光学的接触便可通过无线电信号识别特定目标并读写相关数据。作为一种快速采集信息与处理信息的高新技术,RFID技术可实现快速读写、移动识别、非可视多目标识别。在无需人为干预下,通过计算机设备和互联网,对物品进行自动识别,从而实现信息的互联和共享,被广泛应用在物品识别和数据采集等领域。

传统的RFID系统中通常只有一个阅读器,随着RFID技术的发展和应用范围的扩大,一个阅读器的读取已经难以满足实际应用的需求。在许多RFID应用中,一般在一个大的范围内存在大量标签,由于阅读器和电子标签的通信空间距离受限,同时为了不漏读标签,必须在整个空间内放置多个阅读器。在存在多个阅读器和多个标签的RFID系统中,存在着两种形式的冲突方式:一种是同一标签同时收到不同阅读器发出的命令,称为阅读器碰撞;另一种是一个阅读器同时收到多个标签返回的数据,称为标签碰撞。在实际应用过程中产生的RFID多标签-多阅读器通信信道冲突问题,将导致大量的数据丢失和错误,严重影响系统的准确度和性能。

目前,标签防碰撞问题已经得到了很多研究人员的关注,并且提出了各种标签防碰撞算法,最常见的标签防碰撞算法为基于时分复用(TDMA)的方法,包括基于ALOHA的不确定性防碰撞算法和基于二叉树的确定性防碰撞算法。但是,不仅需要解决标签防碰撞的问题,同时还要解决多标签与多阅读器的通信信道冲突问题,才能解决整个RFID系统的碰撞问题。

现有技术中为了解决阅读器之间信道冲突问题,常采用的技术方案为基于调度的防碰撞算法,通过全网的体系结构来统一收集阅读器间的信道冲突消息,阅读器之间通过一定的调度策略来分配时隙或频率资源,防止多个阅读器同时发送信号给标签而产生信号干扰,使可能发生的碰撞通信分布在不同的时隙或频率上,从而避免了碰撞的发生。然而该方法必然导致无法最大化的利用空闲概率较大的信道,且不能根据数据通信的实际情况,合理地对标签进行信道的动态分配,降低了RFID系统的工作效率。



技术实现要素:

本发明的目的是提供一种基于Whittle index的RFID多阅读器信道资源分配方法,在各信道相互独立,多阅读器之间碰撞可能性小的情况下,对有限的信道资源采用Whittle index策略进行动态分配,提高了RFID系统吞吐率。

为实现上述目的,本发明提供了如下方案:

一种基于Whittle index的RFID多阅读器信道资源分配方法,包括:

步骤1)RFID多阅读器信道模型建立:在RFID系统中,多阅读器环境实际上具备了多信道通信的特征,因此多标签对应多阅读器碰撞问题可转化为多用户动态接入多信道的资源分配问题,即解决未知信道环境先验知识下的机会式多信道的选择与接入问题,引入多臂赌博机(Multi-Armed Bandit,MAB)模型,各信道的状态(忙碌或者空闲)都在随着时隙进化,产生的多臂赌博机问题是无休止的,因此归结为无休止多臂赌博机(Restless Multi-Armed Bandit,RMAB)问题,本发明针对多标签-多阅读器环境下的碰撞问题拟建立无休止多臂赌博机(RMAB)模型,对信道资源分配问题进行求解;

步骤2)信道Whittle index值计算:根据历史经验积累给予每个信道一定的信任值,并基于当前信任值下给每个信道赋予一个索引值用以表示选择此信道获得收益的程度;

步骤3)接入信道选择:在无线环境下,由于衰落、噪声以及标签地理位置的差异,同一信道对不同标签的信道质量是不同的,不同信道对同一标签的质量也不一样,因此标签在计算出各个信道索引值的基础上,对其进行降序排序;标签选择索引值最大的信道作为可能感知接入的信道,若信道空闲且信道同一时隙未被多个标签选中,则标签与阅读器之间进行数据传输,传输完毕后反馈应答信息,若信道同一时隙被多个标签选中,则碰撞标签需等待一个时隙后再次根据更新后信道的索引值重新选择接入信道进行数据传输;

步骤4)信道索引值更新:在每个时隙末尾,标签k将数据传输后得到的应答信息情况作为反馈,对信道进行索引值更新,同时对于未被选择的信道赋予适当的收益补贴β以使未来信道的选择更加全面,使标签对空闲信道的选择更加准确,通信量尽可能达到最大。

作为本发明的进一步说明,所述步骤1)中系统信道模型的建立,具体包括:假设在RFID多阅读器系统中存在K个标签,{1,2,...,K}为标签集合,标签可以择机地使用一段被划分为N条信道的阅读器进行数据通信,{1,2,...,N}为信道集合,各信道相互独立,多阅读器之间碰撞的可能性小,且N<K;系统中各信道被划分为多个时隙,信道状态在每个时隙内保持不变,定义信道空闲状态为1,忙碌状态为0,信道状态空间S={s1(t),s2(t),...,sN(t)}∈{0,1}N;信道n的状态可建模为马尔可夫链,其转移概率表示为Pr(sn(t)→sn(t+1));对于信道n,定义信道n分配给标签k时,该标签获得的平均传输速率为gn,k;在时隙t的开始阶段,标签根据历史决策和观测结果得出每个信道状态为空闲的概率,即信道的信任值,定义Wk(t)={ω1,k(t),ω2,k(t),...,ωN,k(t)},ωn,k(t)表示标签k在时隙t开始时,感知信道n的状态为1的概率,为标签k对N个信道感知结果向量,标签在数据传输后得到反馈信息an,k(t)∈{0(NAK),1(ACK)};RMAB模型的标准模型表示为:(W(t),{Pr(sn(t)→sn(t+1)):1≤n≤N},R,β)。

作为本发明的进一步说明,所述步骤2)中信道Whittle index值的计算,具体包括:假设系统中所有的标签在同一时刻对相同环境的感知结果是一致的,定义信道信任值为信道状态空闲的概率,在时隙t+1,标签k根据上一时隙的感知结果和应答信息an,k(t),对信道信任值按如下公式进行更新:

其中,f(ωn,k(t))=ωn,k(t)pn(11)+(1-ωn,k(t)pn(01))。

定义该模型的值函数为V(t,Wk(t)),表示在当前信任值向量W(t)下从时隙t开始得到的最大期望收益,即其中,R(t)=∑ωn,k(t)gn,k表示感知后的立即收益,代表未来期望收益;可证明RMAB模型(W(t),{Pr(sn(t)→sn(t+1)):1≤n≤N},R,β)是可加索引的,定义值函数Vβ,m(t,ωn,k(t);un=1)为当前信任值下被选中的信道(un=1)收益值,则Whittle index值可表示为w(ωn,k(t))=inf{m:Vβ,m(t,ωn,k(t);un=0)=Vβ,m(t,ωn,k(t);un=1};

定义其中I=pn(11)-pn(01),则Whittle index值的解析式如下:

当pn(11)>pn(01)时,

其中,

当pn(11)<pn(01)时,

其中,H=β2pn(11)I。

作为本发明的进一步说明,所述步骤3)中接入信道选择,具体包括:由于RFID系统中的标签在进行数据传输前均要对各信道进行索引值计算并降序排序,标签选择索引值最大的信道作为可能感知接入的信道,若信道空闲且信道同一时隙未被多个标签选中,则标签与阅读器之间进行数据传输,传输完毕后反馈应答信息an,k(t)给阅读器作为信道索引值更新的依据;若信道同一时隙被多个标签选中,则碰撞标签需要等待一个时隙后再次选择状态更新后的最优信道进行状态感知,空闲则进行数据传输并同样需反馈应答信息an,k(t)。

本发明实现的原理:将多标签-多阅读器环境中的数据传输问题转化为多用户动态接入多信道的资源分配问题。本发明利用RMAB模型来解决了RFID多阅读器有限信道资源的分配问题,标签根据历史经验积累给予每个信道一定的信任值(本发明中定义为信道空闲概率),并基于当前信任值下给每个信道赋予一个索引值(本发明中用以表示选择此信道获得收益的程度),标签以信道的索引值为依据,选择感知接入索引值最大的信道,当出现信道选择冲突时,标签等待一个时隙后再进行数据传输,当每个标签完成数据通信后,均会反馈给阅读器应答信息an,k(t),对已选信道的索引值进行更新,对于未被选择的信道同样给予一定的收益补贴β,使标签在每个时隙都能选择空闲概率较大的信道,提高了系统的吞吐率。

本发明一种基于Whittle index的RFID多阅读器信道资源分配方法产生了以下良好效果:

(1)在RFID系统中,通过引入RMAB模型,在标签对信道状态以及信道使用情况未知的环境下,利用标签与阅读器数据传输后的反馈信息an,k(t)以及对未被使用的信道给予一定的收益补贴β,来动态调整各个信道的Whittle index值,使标签尽可能地选择最优信道进行与阅读器之间的数据通信,提高了标签对空闲信道的利用率;

(2)当出现同一时隙多个标签选择相同信道的冲突问题时,冲突的标签需要等待一个时隙后再次选择状态更新后的最优信道进行状态感知,空闲则进行数据传输,在一定程度上可以保证标签在最优信道上进行有序的数据通信。

附图说明

为了更清楚地说明本发明现有技术中的技术方案或实施例,下面将对技术方案或实施例中所需要使用的附图作简单地介绍。

图1.本发明一种基于Whittle index的RFID多阅读器信道资源分配方法所建立的系统信道模型;

图2.本发明一种基于Whittle index的RFID多阅读器信道资源分配方法实例中阅读器和标签的分布情况;

图3.本发明一种基于Whittle index的RFID多阅读器信道资源分配方法求解信道模型流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施例对本发明作进一步详细说明。

实施例:

下面举例说明本算法的一个具体实施过程:

参见图1,为本发明一种基于Whittle index的RFID多阅读器信道资源分配方法所建立的系统信道模型。在RFID系统的信道模型中,信道与阅读器为一一对应关系,即一个阅读器对应一条信道。将系统中的N个阅读器与N条信道相对应,标签可以择机地使用此N条被划分为多个时隙的信道,信道状态在每个时隙内保持不变,阅读器与标签之间的数据通信均在一个时隙t内完成。

步骤1)RFID多阅读器信道模型的建立:假设在RFID多阅读器系统中存在5个标签,{1,2,3,4,5}为标签集合,分别为标签1、2、3、4、5,标签可以择机地使用一段被划分为3条信道的阅读器进行数据通信,{1,2,3}为信道集合,分别为信道1、2、3,3条信道相互独立,阅读器之间碰撞的可能性小,信道状态空间S={s1(t),s2(t),s3(t)}∈{0,1}3;对于信道n,定义信道n分配给标签k时,该标签获得的平均传输速率为gn,k;并且Wk(t)={ω1,k(t),ω2,k(t),ω3,k(t)},其中ωn,k(t)表示标签k在时隙t开始时,感知信道n的状态为1的概率,为标签k对3个信道感知结果向量,此RMAB模型的标准模型表示为:(W(t),{Pr(sn(t)→sn(t+1)):1≤n≤3},R,β)。

参见图2,为本发明一种基于Whittle index的RFID多阅读器信道资源分配方法实例中阅读器和标签的分布情况。在图2中,假设在部署阅读器的时候,5个标签均处于阅读器的读写范围内且尽量避免了阅读器之间的碰撞。

参见图3,为本发明一种基于Whittle index的RFID多阅读器信道资源分配方法求解信道模型流程图。

步骤2)信道Whittle index值计算:假设在RFID系统,标签与阅读器开始进行数据传输之前,时隙t开始时,3条信道的状态均为空闲,即S={1,1,1},根据历史决策和观测结果,各信道分配给各标签时,标签获得的平均传输速率gn,k如表1所示:

表1 各标签获得的平均传输速率gn,k

标签在时隙开始时,感知各信道的状态为1的概率ωn,k(t)如表2所示:

表2 标签在时隙t开始时,感知各信道的状态为1的概率ωn,k(t)

因此,在时隙t开始时,标签1、2、3、4、5对3个信道的感知结果向量可分别表示为:

由表2可知,对于各信道,其空闲的概率pn(11)=0.4,占用的概率pn(01)=0.6,假设收益补贴β=0.6,则根据Whittle index的解析式可算出标签对各信道的Whittle index值如表3所示:

表3 信道的Whittle index值

步骤3)接入信道选择:由表3计算出信道的Whittle index值可知,在时隙t,标签1拟选择信道1进行数据通信,标签2拟选择信道1进行数据通信,标签3拟选择信道2进行数据通信,标签4拟选择信道2进行数据通信,标签5拟选择信道3进行数据通信。由于在时隙t,标签5选择的信道3没有与其他标签冲突,可顺利进行数据传输并返回应答信息a3,5(t)=1,而标签1与标签2因同时选择最优信道1而发生冲突,标签3与标签4因同时选择最优信道2而发生冲突,则标签返回给阅读器的应答信息an,k(t)=0(n=1,2,3;k=1,2,3,4)。标签1、2、3、4等待下一时隙t+1再次对信道进行感知并进行数据通信。

步骤4)信道索引值更新:在下一时隙t+1的开始,剩下的标签k将根据上一时隙t的感知结果和应答信息an,k(t),对信道信任值按公式进行更新。标签在时隙t+1开始时,感知各信道的状态为1的概率,即更新后的ωn,k(t+1)如表4所示:

表4 更新后的ωn,k(t+1)

重复步骤2)信道Whittle index值计算:由表4可知,对于各信道,其空闲的概率pn(11)=0.4,占用的概率pn(01)=0.6;

更新后的Whittle index值如表5所示:

表5 信道更新后的Whittle index值

重复步骤3)接入信道选择:由表5计算出信道的Whittle index值可知,在时隙t+1,标签1拟选择信道2进行数据通信,标签2拟选择信道3进行数据通信,标签3拟选择信道1进行数据通信,标签4拟选择信道1进行数据通信。由于在时隙t+1,标签1选择的信道2以及标签2选择的信道3没有与其他标签冲突,可顺利进行数据传输并分别返回应答信息a2,1(t)=1、a3,2(t)=1,而标签3、4因同时选择最优信道1而发生冲突,则标签返回给阅读器的应答信息a1,k(t)=0(k=3,4)。标签3、4等待下一时隙t+2再次对信道进行感知并进行数据通信。

由此不断重复步骤2)、3)、4)直到最后一个标签也被识别完毕。在本发明所列举的实施例中,5个标签在3个阅读器对应的3个信道中,基于Whittle index算法的RFID多阅读器信道资源具体分配方案可概括如表6所示:

表6 实施例中信道资源具体分配方案

需要说明的是,由于标签3在信道2、3上获得的平均传输速率gn,k相同,导致在时隙t+2时,所计算出的Whittle index值在信道2、3上均为最大值,标签3可随机选择信道2或者信道3与阅读器之间进行数据通信。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求内。本发明是在多位RFID系统防碰撞算法技术人员长期进行研究的经验积累基础上,通过创造性劳动而出,各标签根据信道的Whittle index值选择最优信道,对未被使用的信道给予一定的收益补贴β,对信道的索引值进行动态地调整,使标签尽可能地选择最优信道与阅读器进行数据通信,加大了标签对空闲信道的利用率,提高了系统吞吐率。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1