一种情景知觉下的重叠联盟博弈模型及空间自适应算法的制作方法

文档序号：14293482阅读：361来源：国知局

本发明属于无线通信技术领域，提出了一种情景知觉下的重叠联盟博弈模型及空间自适应学习(spatialadaptiveplay，sap)算法。

背景技术：

频谱资源的短缺和获取频谱资源的高开销已经成为通信领域中的一个重要问题，这使得d2d网络中的频谱拍卖和团购的研究变得越来越重要。针对这个问题，有人提出了一个频谱团购的三层拍卖框架(参考文献penglin,xiaojunfeng,qianzhangandmounirhamdi,“grouponintheair:athree-stageauctionframeworkforspectrumgroup-buying,”2013proceedingsieeeinfocom)来对团购进行分层优化；有人提出了两种诚信的团购拍卖方式(参考文献dejunyang,guoliangxueandxiangzhang,“groupbuyingspectrumauctionsincognitiveradionetworks,”doi10.1109/tvt.2016.2546948,ieee)，利用次级用户使得主设备以某种机制选择信道从而最大化次级接入用户的效益。然而，大部分研究都只是专注于用户在不同层的关系以及在上层的选择和底层的接入点，没有考虑用户自己的资源需求。

联盟形成博弈(参考文献walidsaad,zhuhan,m′erouanedebbah,areandtamerbas，ar,“coalitionalgametheoryforcommunicationnetworks”,inieeesignalprocessingmag.,specialissueongametheory,vol.26,no.5,sept.2009,pp.77c97.)主要考虑的是合作下的网络结构；重叠联盟形成博弈(参考文献tianyuwang,lingyangsong,zhuhan,andwalidsaad,“overlappingcoalitionformationgamesforemergingcommunicationnetworks,”inieeenetwork,vol.30,sept.2016,pp.46-53，以及参考文献yulizhang,yuhuaxuandqihuiwu,“groupbuyingbasedonsocialawareind2dnetworks:agametheoreticapproach,”6thieee/cicinternationalconferenceoncommunicationsinchina(iccc2017),qingdao,chinaoct.2017,accepted.)中，提到了一个在d2d网络中基于用户社会关系的联盟形成博弈模型，该模型考虑了不同用户中存在的重叠内容，在联盟形成后通过一次获取这些重叠内容转发到所有需要的用户，从而减少转发开销，但它并没有考虑到在不同内容需求下，相应的联盟形成也是不同的。

技术实现要素：

本发明的目的在于提供一种能够降低频谱资源获取开销、提高频谱利用率的情景知觉下的重叠联盟博弈模型及空间自适应学习(spatialadaptiveplay，sap)算法。

实现本发明目的的技术解决方案为：一种情景知觉下的重叠联盟博弈模型，对于d2d网络中的任意一个具有内容需求的次级用户，将其他用户按照通信范围分为邻居用户和非邻居用户；在进行需求内容获取时，存在重叠内容的相邻用户组成一个联盟，其中一个用户向上层进行相应内容的频谱资源团购，获取资源后将内容转发给联盟中其他拥有相同内容需求的用户。

一种基于所述情景知觉下的重叠联盟博弈模型的空间自适应学习算法，包括以下步骤：

步骤1，将用户团购问题建模为联盟形成博弈模型，博弈的参与者是网络内所有具有频谱资源需求的次级用户；

步骤2，引入局部互利博弈模型，针对选中用户，将其他用户按照通信范围是否在一跳范围内，分为邻居用户和非邻居用户，并定义效用函数；

步骤3，随机选择一个用户，根据此时邻居用户和选中用户自身的联盟选择情况，利用效用函数计算选中用户接入各个联盟的效用值；选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入，接入的规则是依概率进行探索学习；

步骤4，循环步骤3，用户通过探索学习进行联盟选择，直至所有用户的联盟选择实现收敛，或者达到设定的迭代次数。

进一步地，步骤1将用户团购问题建模为博弈模型，该博弈模型定义为：

该博弈模型中包含四个组成部分，其中，n＝{1,2，...n0}为参与博弈的次级用户集合，an为用户n的可选择联盟策略空间，jn为用户n一跳范围内的邻居用户，un为用户n的效用函数。

进一步地，步骤3所述随机选择一个用户，根据此时邻居用户和选中用户自身的联盟选择情况，利用效用函数计算选中用户接入各个联盟的效用值，具体如下：

定义任意时刻已经形成的联盟中，每个次级用户n拥有不同的频谱资源需求其中ln为次级用户n的内容长度；设定次级用户n的联盟选择为αn，假设获取每块内容的频谱资源开销为α0，计算出存在重叠频谱资源内容的次级用户的重叠度：

其中，表示与同属于一个联盟的其他用户的集合，并且：

其中，表示为次级用户k的第o个内容块的内容；公式(2)表示不同用户频谱资源中的内容块是否相同；

基于以上条件，能够得到次级用户n的效用函数un为：

从而得到网络全局的效用函数：

博弈的优化目标：以式(4)的效用函数进行联盟选择，通过考虑不同的内容块，使得网络全局的效用最大即获取频谱资源的开销最小：

(p1):maxu(5)

利用局部互利博弈(localaltruisticgame)模型，优化式(4)、(5)，将局部效用函数和目标函数表示如下：

进一步地，步骤3所述选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入，接入的规则是依概率进行探索学习，具体如下：

(1)初始化，每个次级用户n∈n随机选择一个联盟，选择一个内容块i，作为下一个循环中用户进行联盟选择的依据；

(2)探测：所有的次级用户进行信息交互，并通过空间自适应学习的方式，每次迭代都随机选择一个次级用户n进行操作，其他所有的用户重复之前的联盟选择；对于选中的次级用户n，利用公式(3)计算它选择不同联盟的效用值；

(3)联盟选择：用户n根据效用值对联盟进行依概率选择并接入。

进一步地，步骤4所述循环步骤3，用户通过探索学习进行联盟选择，直至所有用户的联盟选择实现收敛，或者达到设定的迭代次数，具体如下：

(1)所有的次级用户进行信息交互；

(2)每次迭代都随机选择一个次级用户n进行操作；

(3)其他所有的用户重复之前的联盟选择，即ak(j+1)＝ak(j)，k∈jn；

对于选中的次级用户n，首先利用公式(3)计算它选择不同联盟的效用值，用户n考虑内容块i的频谱获取开销然后次级用户更新它的选择策略：

其中，β＞0是学习系数，表示用户n选择其他联盟，表示用户n第j次选择时，选择联盟an的概率。

本发明与现有技术相比，其显著优点在于：(1)在情景知觉的前提下，充分考虑了次级用户存在重叠内容需求的情况，提出了频谱资源利用率更高的基于情景知觉的重叠联盟博弈模型，避免了联盟选择和内容选择存在矛盾的时候基于不同内容形成不同联盟的情况，更好地刻画了d2d网络中用户存在重叠内容的频谱资源团购特性；(2)通过引入局部互利博弈模型，利用联盟形成博弈证明了该重叠联盟博弈模型存在纳什稳定解，并且是可以求解的，为算法的设计提供了理论支持；(3)提出的基于用户内容的空间自适应学习(sap)算法，通过局部信息交互，探测并达到全局最优，避免了在计算全局最优中存在的不收敛问题，并设置了学习参数对探测学习的过程调整，所提算法适用于大规模次级用户网络。

附图说明

图1是经典的基于情景知觉的重叠联盟博弈模型的示意图。

图2是不同内容需求下网络内形成的不同联盟的示意图。

图3是本发明基于情景知觉的重叠联盟博弈模型的算法中联盟形成的示意图。

图4是在不同用户通信距离条件下，本发明实施例中模型方法与现有方法的网络全局开销的对比示意图。

图5是本发明实施例中模型方法与现有方法的网络全局开销，在不同用户数量关系下对比的示意图。

图6是本发明实施例中模型方法与现有方法的网络全局开销，不同用户内容量关系下对比的示意图。

图7是本发明实施例中模型方法与现有方法的网络全局开销，在不同用户内容重叠度关系下对比的示意图。

具体实施方式

对于d2d网络中的任意n个拥有频谱资源需求的任一次级用户，其他用户被分为邻居用户和非邻居用户。图1所示为经典的基于情景知觉的重叠联盟博弈模型。在图1中，用户a、b、c分别拥有不同的内容，其中存在重复的内容，此时针对不同内容，用户会形成不同的联盟，如考虑内容1时，用户a和用户b可以形成联盟，联盟形成后可以由其中一个用户来向上层获取相应频谱资源，即内容1，并转发给联盟中的其他用户，从而实现频谱获取开销的优化；相对于从上层获取频谱的开销，转发开销和联盟形成的开销可以忽略不计。图2为在不同内容需求条件下网络内形成的不同联盟的示意图。考虑内容2、内容3或者内容8时，用户间会在一跳范围内形成不同的联盟，这些联盟的形成对于相应的内容来说是最优的分配方案。

本发明情景知觉下的重叠联盟博弈模型，对d2d网络中的任意一个具有内容需求的次级用户，将其他用户按照通信范围分为邻居用户和非邻居用户；在进行需求内容获取时，将存在重叠内容的相邻用户组成一个联盟，其中一个用户对上层进行相应内容的频谱资源团购，获取资源后将内容转发给联盟中其他拥有相同内容需求的用户。

本发明基于联盟选择策略和网络全局效用的关系，通过求解局部最优来达到全局最优，从而达到最大化全局效用，即最小化频谱资源获取开销的目的。

本发明基于所述情景知觉下的重叠联盟博弈模型的空间自适应学习算法，包括以下步骤：

步骤1，将权利要求1所述用户团购问题建模为博弈模型，博弈的参与者是网络内所有具有频谱资源需求的次级用户；

步骤2，引入局部互利博弈(localaltruisticgame)模型，针对选中用户，将其他用户按照通信范围是否在一跳范围内，分为邻居用户和非邻居用户，定义效用函数；

步骤3，随机选择一个用户，根据此时邻居用户的联盟选择情况和自身的联盟选择情况，利用效用函数计算用户接入各个联盟的效用值。用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入，接入的规则是依概率进行探索学习；

步骤4，循环步骤3，用户通过探索学习进行联盟选择，直至所有用户的联盟选择实现收敛，或者达到设定的迭代次数。

本发明的具体实施如下：

一、步骤1所述将所述用户团购问题建模为博弈模型，该博弈模型定义为：

二、步骤2所述引入局部互利模型，根据此时邻居用户的联盟选择情况和自身的联盟选择情况，利用效用函数计算用户接入各个联盟的效用值，具体如下：

定义任意时刻已经形成的联盟中，每个次级用户n拥有不同的频谱资源需求其中ln为次级用户n的内容块数量；设定次级用户n的联盟选择为an，获取每个频谱资源内容块的开销为α0，计算出存在重叠内容需求的次级用户的重叠度：

其中，表示与同属于一个联盟的其他用户的集合，并且：

其中：表示为次级用户k的第o个内容块的内容；公式(2)表示不同用户中的内容是否相同；

基于以上条件，得到次级用户n的效用函数un为：

该效用函数表示的是用户的频谱资源获取的开销。根据之前的设定，仅考虑用户向上层获取频谱资源的开销，忽略用户之间的转发开销，从而可以得到网络全局的效用函数为：

三、博弈的优化目标：以式(4)的效用函数进行合适的联盟选择，通过考虑不同的内容块，使得网络全局的效用最大，即获取频谱资源的开销最小，如式(5)所示：

(p1):maxu(5)

通过将基于情景知觉的重叠联盟博弈模型与局部合作博弈结合，证明了该模型是具有纳什稳定的联盟形成博弈，从而优化公式(4)(5)，将局部效用函数和目标函数表示如下：

四、步骤3所述用户选择所有可接入联盟中效用数值最大即获取频谱资源开销最小的联盟进行接入，接入的规则是依概率进行探索学习，其中，

进行联盟选择，完成以下工作：

(1)初始化，每个次级用户n∈n随机选择一个不同的联盟，选择一个内容块i，作为下一个循环联盟选择所要考虑的内容。

(2)探测：所有的次级用户进行信息交互，并通过空间自适应学习的方式，每次迭代都随机选择一个次级用户n进行操作，其他所有的用户重复之前的联盟选择。对于选中的次级用户n，利用公式(3)计算它选择不同联盟的效用值；

(3)联盟选择：用户n根据效用值对联盟进行依概率选择并接入。

实施例1

本发明的一个具体实施例如下描述：系统仿真采用matlab软件，参数设定不影响一般性；n个次级用户随机布设在一个200m×200m的网络场景中，单个频谱资源获取开销α0统一设置为1，所有次级用户的通信范围都一样并设为radii，所有用户的内容重叠度设置为od，学习系数β设置为3，并随着迭代次数增加而增大至25，使得结果逐渐从学习探测过程偏向收敛。

本发明基于情景知觉的重叠联盟博弈模型的算法，具体过程如下：

步骤1：初始化，设置迭代次数j＝0，每个次级用户n∈n选择一个不同的联盟，选择一个内容块i，作为下一个循环联盟选择的内容。

步骤2：联盟选择策略更新(循环)：

①所有的次级用户进行信息交互。

②每次迭代都随机选择一个次级用户n进行操作。

③其他所有的用户重复之前的联盟选择，即ak(j+1)＝ak(j)，k∈jn。对于选中的次级用户n，利用公式(3)计算它选择不同联盟的效用值，用户n考虑计算内容块i的频谱获取开销然后次级用户依据下式更新它的选择策略：

其中，β＞0是为学习系数，表示用户n选择其他联盟，表示用户n第j次选择时，选择联盟an的概率。

步骤3：当所有用户的联盟选择实现收敛，或者达到一定的迭代次数时，回到初始化状态，此时，在特定内容块i下的用户联盟选择循环结束。

步骤4：全局效用：计算网络中考虑所有内容块的联盟选择，并计算整体的频谱资源获取开销u。

图3为20个次级用户基于内容1而形成的联盟选择。可以看出在经过算法的迭代之后，联盟选择更新策略最终收敛到一个稳定的状态。下面考虑不同的因素对总效用影响的示意图，并通过与一种基于用户自身的重叠联盟sap算法(参考文献：yulizhang,yuhuaxuandqihuiwu,“groupbuyingbasedonsocialawareind2dnetworks:agametheoreticapproach,”ieeeiccc,,qingdao,2017.)进行对比，该算法只体现所有用户对所有内容的优化情况下的一次联盟形成。对比发现，本发明所提出的算法具有更强的性能。此外，所提方法只需要知道局部信息便可以达到全局最优。

例1通信距离radii

考虑8个次级用户，由图4可知，在不同通信距离条件下，所提出的基于用户内容的空间自适应学习(sap)算法与基于用户自身的重叠联盟的sap对比算法相比较，平均频谱获取开销要减小13.8％。

例2次级用户的数量(n)

考虑不同数量的次级用户，假设每个用户n随机生成ln个内容(0＜ln＜50)，，radii为40m，其他参数都不变。比较两个算法，由图5可知，所提出的基于情景知觉的重叠联盟博弈模型的算法与基于用户自身的重叠联盟的sap对比算法相比较，平均频谱获取开销要减小17.7％。

例3内容长度

考虑内容的长度ln，假设存在8个次级用户，radii为40m，假设每个次级用户n随机生成ln个内容，范围为1到100(n＝8，)，其他参数不变。比较两个算法，由图6可知，所提出的基于情景知觉的重叠联盟博弈模型的算法平均频谱获取开销要比基于用户自身的重叠联盟的sap对比算法减小9.8％。

例4重叠度

重叠度表示用户之间内容的重叠情况，假设每个用户n随机生成ln个内容(0＜ln＜50)，生成的内容满足设重叠度公式：表示用户n中与其他用户存在重叠的内容数量，其他变量与例3中一样。比较两个算法，由图7可知，所提出的基于情景知觉的重叠联盟博弈模型的算法平均频谱获取开销要比基于用户自身的重叠联盟的sap对比算法减小12.6％。

综上，本发明提出的基于情景知觉的重叠联盟博弈模型及算法，充分地考虑到了重叠内容，利用局部信息的交互进行求解从而得到全局最优，并通过多次循环，进行不同的联盟选择，从而极大地降低了频谱资源获取的开销，有效提高了全网效用。通过与基于用户自身的重叠联盟的sap对比算法的比较，在考虑重叠内容需求的情况下，针对用户不同的重叠内容进行相应的联盟选择，避免了在不同内容下存在的联盟选择矛盾，从而更加适用于内容需求重叠度高的网络。通过算法分析证明了所提算法的频谱资源获取开销更小，性能更强，也验证了理论的正确性。

实施例2

无人机(uav)在节点部署中起着很重要的作用，能有效地执行一些任务预分配的任务。无人机需要协同合作，所以许多无人机场景中使用联盟形成博弈来完成如目标侦测、环境监控和信息传输等任务。在通信的角度下，无人机可被视为一个节点，无人机按照编组进行划分，则机群中的组长即为簇头，在进行通信频谱资源管理时起到中继和转发的作用。这些特征都表示，本发明提出的基于情景知觉的重叠联盟博弈模型可以适用于这些无人机场景。由于节点具有动态移动性，使得模型的分析更为复杂，需要更精确地对动态变化的场景进行刻画；在不同的场景和任务分配下，节点不再是单一的，而是具有不同的形式，如无人机和基站、组长和僚机等，这使节点变量设置更为复杂；优化目标不再是简单的转发开销，而可能是无人机执行任务的完成度，如信息传输量、目标侦测情况等。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈瑾;阮朗;徐煜华;陈学强;杨旸;张玉立;孔利君
技术所有人：中国人民解放军陆军工程大学
我是此专利的发明人

上一篇：一种新型夹纸小车横梁的制作方法
上一篇：一种钻机机身给进稳固装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。