一种基于非合作博弈确定多用户选择信道感知顺序的方法与流程

文档序号：16899266发布日期：2019-02-19 17:48阅读：198来源：国知局

本发明属于无线通信中频谱感知多用户竞争信道策略技术领域，特别是一种基于非合作博弈确定多用户选择信道感知顺序的方法。

背景技术：

频谱需求急剧增长和某些频段低效利用促生机会频谱接入技术(opportunisticspectrumaccess，osa)，机会频谱接入需要可重新配置的网络设备，被称为认知无线电(cr)设备，它可以根据其相应环境刺激从而改变行为。因此，这些认知设备或认知用户(secondaryuser，su)需要通过频谱检测确保当主用户(primaryuser，pu)活跃时，不占用该频段，避免对主用户造成干扰，可以看出，机会频谱接入技术可以更高效利用授权频谱。在机会频谱接入中，用户采用时隙传输模式。每个时隙的第一阶段被次级用户用来感知信道，第二阶段被用来接入空闲信道。然而，当多个认知用户需要接入可用信道时，互相之间就会发生碰撞。

认知用户在单个时隙内选择信道感知顺序会对其他认知用户是否能够成功竞争到空闲信道产生影响，进而决定全网的累积冲突水平；且每个认知用户是贪婪的，都想最大化自身的效用，因此本发明将其建模成非合作博弈模型，即多用户信道感知顺序选择博弈，并定义用户的广义冲突函数，进而采用非合作博弈数学模型构建了多用户在多信道场景下选择信道感知顺序问题的数学模型，给出了多用户在多信道场景下的信道感知顺序选择博弈模型最优解的一种迭代递推求解方法，可快速的确定全网多用户选择一种合适的信道感知顺序，降低全网的累积冲突水平。

技术实现要素：

本发明的目的是针对认知用户互相之间选择不同的信道感知顺序会影响到对空闲信道的竞争接入，需要通过全网所有用户个体间的非合作博弈过程达到全局信道竞争冲突最小的结果的问题。本发明采用非合作博弈数学模型来构建多用户在多信道场景下选择信道感知顺序问题，通过计算当前时刻t用户n选择的信道感知顺序对应的后悔值来递推计算下一时刻的用户选择某种信道感知顺序的概率然后比较全网内各个用户选择某一种信道感知顺序策略的概率是否收敛到一个固定的门限λ，从而终止迭代。本发明给出了多用户在多信道场景下的信道感知顺序选择博弈模型最优解的一种迭代递推求解方法，可快速的确定全网多用户选择一种合适的信道感知顺序，降低全网的累积冲突水平。

本发明的技术方案是：

一种基于非合作博弈确定多用户选择信道感知顺序的方法，步骤如下：

步骤1、构建多用户在多信道场景下选择信道感知顺序问题的非合作博弈模型；

步骤2、全网用户信道感知顺序策略选择初始化，网络中的每个用户n从信道感知顺序的策略空间ls中以随机概率选择一个信道感知顺序qn；

步骤3、通过计算当前时刻t用户n选择的信道感知顺序对应的后悔值来递推计算下一时刻用户选择某种信道感知顺序的概率t＝1,2,3......∞；

步骤4、比较全网内每个用户选择某一种信道感知顺序的概率是否收敛到一个固定的门限λ，如果是则结束步骤3的循环迭代，输出全网所有用户的信道感知顺序选择概率。

进一步地，步骤1中，非合作博弈模型构建步骤为：

构建多用户多信道系统，包括n个认知用户，m个通信信道，记认知用户集合为信道集合为

构建的非合作博弈模型如下：

其中：qn表示用户n选择的信道感知顺序策略，q-n表示除用户n之外其他用户选择的信道感知顺序策略；qn∈ls，ls为m个信道感知顺序组成的策略空间；qn＝(qn1,qn2,...,qnm)和qk＝(qk1,qk2,...,qkm)分别为用户n和用户k的信道感知顺序，un为认知用户n的效用函数，采用下述公式表达：

其中，l表示通信信道的编号，是位异或符号，是用户n信道感知顺序中信道qnl空闲的概率，pf是误检概率，δ是指示函数，满足：

其中dnk为认知用户n与k之间的实际距离，d0为干扰距离门限值。

进一步地，ls集合中信道索引排列规律满足拉丁方矩阵形式latinsquare，即每个信道索引在矩阵的每一行和每一列中只出现一次。

进一步地，步骤2中，全网用户信道感知顺序策略选择初始化具体为：设置起始时刻t＝0，网络中的每个用户n，从信道感知顺序的策略空间ls中以随机概率选择一种信道感知顺序qn，其中qn∈ls。

进一步地，步骤3具体过程为：

选取任意两个不同的信道感知顺序策略qn和q'n，qn、q'n∈ls，计算一段时间长度t内每次用户n选择qn策略都以q'n策略代替的后悔值

其中，表示在第t＝t时刻之前的一段时间长度t内每次用户n选择qn策略都以q'n策略代替所带来收益改变值之和再取平均；

计算用户n在第下一时刻(t+1)选择每个信道感知顺序策略的概率；

其中，μ为一个足够大的整数以保证t＝1,2,3......∞。

进一步地，步骤4具体为：设置收敛门限λ，判定t时刻用户n选择的信道感知顺序的概率是否大于门限λ，当不满足时，继续迭代，执行步骤3；如果满足，则终止步骤3的循环迭代，输出全网所有用户的信道感知顺序选择概率。

进一步地，λ取值范围是：0.8～0.99。

本发明的有益效果：

本发明与现有的信道感知顺序选择技术相比，显著优点在于：(1)通过构建多用户在多信道场景下选择信道感知顺序问题的非合作博弈模型，可以从全局角度降低全网用户之间累积冲突水平；(2)给出了多用户在多信道场景下的信道感知顺序选择博弈模型最优解的一种迭代递推求解方法，该算法可以较快地收敛到相关均衡，迭代次数少。

本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。

附图说明

通过结合附图对本发明示例性实施方式进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显，其中，在本发明示例性实施方式中，相同的参考标号通常代表相同部件。

图1是本发明基于非合作博弈确定多用户选择信道感知顺序的流程框图。

图2是本发明信道数m＝3时的拉丁方阵。

图3是本发明给出的博弈过程和随机选择信道感知顺序之间性能对比。

具体实施方式

下面将参照附图更详细地描述本发明的优选实施方式。虽然附图中显示了本发明的优选实施方式，然而应该理解，可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。

结合图1，本发明基于非合作博弈确定多用户选择信道感知顺序方法的原理为：通过构建多用户在多信道场景下选择信道感知顺序问题的非合作博弈模型，从全局角度降低全网用户之间累积冲突水平，给出了多用户在多信道场景下的信道感知顺序选择博弈模型最优解的一种迭代递推求解方法，该算法可以较快地收敛到相关均衡，迭代次数少。具体步骤如下：

步骤1，构建多用户在多信道场景下选择信道感知顺序问题的非合作博弈模型具体为：假设系统包括n个认知用户，m个通信信道，记认知用户集合为信道集合为认知用户n通过对信道集合中的多个信道按照一定的顺序进行频谱感知来获得空闲信道然后加以机会利用，如果n个认知用户中有大于或等于两个认知用户选择相同的信道感知顺序，在发现空闲信道时会都选择接入进而产生碰撞，因此认知用户互相之间选择不同的信道感知顺序会影响到对空闲信道的竞争接入，需要通过全网所有用户个体间的非合作博弈过程达到全局信道竞争冲突最小的结果。

构建的非合作博弈模型如下：

qn表示用户n选择的信道感知顺序策略，q-n表示除用户n外其他用户选择的信道感知顺序策略，其中qn∈ls。记ls为m个信道感知顺序的组成空间集合，该集合中信道索引排列规律满足拉丁方(latinsquare，ls)矩阵形式，即每个信道索引在矩阵的每一行和每一列中只出现一次。为了便于理解，图2给出了信道数m＝3时的拉丁方阵。

un(qn,q-n)为认知用户n的效用函数，因为认知用户互相之间选择不同的信道感知顺序会影响到对空闲信道的竞争接入，记qn＝(qn1,qn2,...,qnm)和qk＝(qk1,qk2,...,qkm)分别为用户n和用户k的信道感知顺序，qn和qk的取值只能是信道组成的ls矩阵的某一行或某一列。

首先定义用户n的信道感知顺序冲突水平函数为：

其中是位异或符号，是用户n信道感知顺序中信道qnl空闲的概率，pf是误检概率，δ是指示函数，满足：

其中dnk为认知用户n与k之间的实际距离，d0为干扰距离门限值。如果两个认知用户的距离不大于do时，认为他们互为邻居用户,邻居用户选择相同的信道感知顺序才发生碰撞，即存在冲突，而当两个认知用户相距较远，即使选择相同的信道感知顺序也不会发生碰撞，即不存在冲突。

因此需要通过全网所有用户个体间的非合作博弈过程达到全局信道竞争冲突水平最小的结果，而在非合作博弈模型中，每个用户的行为都是自私的，都期望自己取得最大效用值，所以可以通过冲突水平函数来表示用户n的效用函数un(qn,q-n)，具体如下：

在非合作博弈模型中，每个用户期望自己取得最大效用值，本发明构建的多用户信道感知顺序选择博弈的数学表示为：

本发明主要目的是给出多用户在多信道场景下的信道感知顺序选择博弈模型最优解的一种迭代递推求解方法。。

步骤2，全网用户信道感知顺序策略选择初始化，网络中的每个用户从信道感知顺序策略空间ls中以随机概率选择一种信道感知顺序qn，具体为：设置起始时刻t＝0，网络中的每个用户从信道感知顺序策略空间ls中以随机概率选择一个信道感知顺序qn，其中qn∈ls，按照效用函数的表达计算用户n的收益值un(qn,q-n)，单方面改变用户n的策略，同时保持其他用户策略不变，计算用户n选择其他策略的收益值un(q'n,q-n),q'n≠qn，为计算下一时刻(t＝1)的信道感知顺序选择策略概率做准备。

步骤3，通过计算当前时刻t用户n选择的信道感知顺序对应的后悔值来递推计算下一时刻的用户选择某种信道感知顺序的概率递推计算从t＝1,2,3......∞开始，具体过程为：假设qn，q'n为任意两个不同的信道感知顺序策略，qn，q'n∈ls，定义rn^t(qn,q'n)为在第t＝t时刻(包括t时刻)之前的一段时间长度t内每次用户n选择qn策略都用q'n策略代替所带来收益改变值之和再取平均得到的后悔值。

则用户n在第下一时刻(t+1)选择每个信道感知顺序策略的概率为，

其中μ为一个足够大的整数以保证t＝1,2,3......∞。

步骤4，通过比较全网内各个用户选择某一种信道感知顺序策略的概率是否收敛到一个固定的门限λ，从而结束步骤3的循环迭代，具体过程为：判定t时刻用户n选择的信道感知顺序的概率是否大于门限λ，即λ一般取值在0.8～0.99之间，如果不满足，则迭代次数t+1，继续执行步骤3。如果满足，则终止步骤3的循环迭代，输出全网所有用户的信道感知顺序选择概率。

实施示例

按照本发明提供的基于非合作博弈确定多用户选择信道感知顺序的流程框图如图1所示。以下采用仿真的方法来验证本发明博弈过程可以收敛到相关均衡解，给出的迭代递推求解方法，需要的迭代次数少。

仿真场景设置如下：用户分布在100m×100m的区域内，其无线通信距离覆盖半径为10m，干扰距离门限值do＝30m，信道数m＝16，每次迭代之间的步进时长为δt＝100ms，所有信道空闲概率满足均值是1/2的均匀分布，仿真中加入了不完美信道感知的情况，设置误检概率pf＝0.05，无悔学习算法参数μ＝4，信道感知顺序策略的概率收敛门限λ＝0.9。

图3给出了按照本发明给出的博弈过程和迭代计算出信道感知顺序选择策略和每次迭代时随机选择信道感知顺序两种策略之间的性能对比结果。用户数n＝8，从仿真结果可以看出，本发明提供的迭代算法确实可以收敛到相关均衡，迭代次数基本在15次就可达到收敛，并且收敛的全网冲突水平值比随机选择策略要低得多。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王金龙;江汉;徐以涛;徐煜华;郑学强
技术所有人：中国人民解放军陆军工程大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。