一种基于频谱开销的预售系统模型及分层学习算法的制作方法

文档序号:17066165发布日期:2019-03-08 22:56阅读:172来源:国知局
一种基于频谱开销的预售系统模型及分层学习算法的制作方法

本发明属于无线通信技术领域,特别是一种基于频谱开销的预售系统模型及分层学习算法。



背景技术:

随着无线技术的发展与业务流量的增加,无线频谱资源短缺已成为新技术发展的瓶颈问题。针对这个问题,目前相关研究主要集中于用户报价的频谱资源收益最大化与用户需求的资源配置最优(参考文献1:p.si,h.ji,f.yuandv.c.mleung,“optimalcooperativeinternetworkspectrumsharingforcognitiveradiosystemswithspectrumpooling,”inieeetransactionsonvehiculartechnology,vol.59,no.4,pp.1760–1768,2010.)。

在相关的研究中,对频谱资源池机制的关注较少。频谱资源池是实现频谱资源复用和提高频谱利用率的一种频谱资源管理机制(参考文2:t.a.weissandf.k.jondral,“spectrumpooling:aninnovativestrategyfortheenhancementofspectrumefficiency,”inieeeradiooncommunications,2004.),其主要特点是频谱资源管理者,即卖方,对频谱资源进行维护,当用户有通信需求时,通过支付一定的代价获得频谱授权,进而接入信道发送数据,用户需求得到满足,频谱资源实现收益。在传统的资源池模式中,用户在有需求后随时提出频谱资源的需求,卖方立刻为其提供服务。这种“立等即取”的资源使用模式,虽然极大地满足了用户需求的实时性,但却降低了频谱资源利用率,减少了市场的频谱资源收益。

能量团购相关文献(参考文献3:j.xu,l.duanandr.zhang,“energygroupbuyingwithloadingsharingforgreencellularnetworks,”inieeejournalonselectedareasincommunications,vol.34,no.4,pp.786–799,2015.)提出的方案可以优化能量利用率,但该文献针对的是能量团购问题,并没有转化到频谱问题中。



技术实现要素:

本发明的目的在于提供一种高效的基于频谱开销的预售系统模型及分层学习算法,以提高频谱管理者与用户的直接收益。

实现本发明目的的技术解决方案为:一种基于频谱开销的预售系统模型,对该模型做如下刻画:频谱管理者对频谱资源池进行维护,通过向用户出售资源收取报酬而获得收益;采用预售机制,利用时间维度频谱资源获取代价的差异性。

一种基于频谱开销的预售系统分层学习算法,包括以下步骤:

步骤1,将联盟选择与资源预购问题建模为多用户分层博弈,博弈的参与者是频谱管理者与各用户;

步骤2,定义频谱管理者和用户的效用函数,用户间完成邻居发现过程,建立邻居联盟集合;

步骤3,用户随机选择一个邻居联盟加入,各用户在联盟内资源共享的情况下,计算自身期望效用;

步骤4,基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构;

步骤5,联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;

步骤6,循环步骤3~步骤5,直到用户间形成稳定联盟。

进一步地,步骤1所述的将联盟选择与资源预购问题建模为多用户分层博弈,博弈模型定义为:

其中,包含七个组成部分,m为频谱管理者,为参与博弈的用户集合,an为用户n的联盟选择,为用户n的预购量,mp为频谱管理者的提前准备量,v为频谱管理者的效用函数,un为用户n的效用函数;

设定提前准备的频谱资源代价为β0,临时调度的频谱资源代价为β1,有β0≤β1;

设定频谱资源的预售定价为α0,最终价格为α1,有α0≤α1;

用户传输单位需求获得的收益为γ,用户的最终真实数据需求为srn

博弈优化目标p为:

进一步地,步骤2中所述的定义频谱管理者和用户的效用函数,具体如下:

当联盟成员的总需求量大于联盟的总预购量时,先将部分用户满足完自身需求之后,剩余的需求量根据剩余用户的需求量按照比例分配,此时,用户的效用函数un为:

其中,为用户的最终真实数据需求、α0为频谱资源的预售定价、为用户n的预购量、γ为用户传输单位需求获得的收益、an为用户n的联盟选择;δpos(an)为联盟中预购量大于需求量时用户剩余频谱资源之和,δneg(an)为联盟中预购量小于需求量时用户所缺频谱资源之和,为用户n按照比例分得的联盟剩余预购资源,为需要向频谱管理者临时购买的资源;

当联盟成员的总需求量小于联盟成员的总预购量之时,剩余的频谱资源由联盟成员按照各自需求进行等比例分担,此时,用户的效用函数un为:

其中为用户剩余的资源通过联盟内二次消化后带来的回报;

频谱资源管理者的效用函数为:

其中,β0为提前准备的频谱资源代价,β1为临时调度的频谱资源代价,α0为频谱资源的预售定价,α1为频谱资源的最终价格,δneg(an)为联盟中预购小于需求的用户所缺频谱资源之和,δpos(an)为联盟中预购大于需求的用户剩余频谱资源之和;

x为满足条件的联盟集合,也即无法通过联盟内部资源二次分配来满足其效用的联盟集合;

为x中的联盟对应的临时频谱资源请求收益,当频谱管理者准备充足时,x中的联盟请求直接进行服务,否则需要通过临时调用资源来进行服务;

为预售收益减去预备量开销的部分;

即为临时调用资源满足额外需求所获得的收益。

进一步地,步骤4所述的基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构,具体如下:

对于任一用户n和两个联盟co,co',基于帕累托准则定义如下动作:

当用户遵循帕累托准则时,在从一个联盟转移到另一个联盟的过程中,离开联盟的成员和加入联盟的成员的效用函数都不减小,即

对于任一用户n的两个联盟选择稳定联盟结构定义如下:

即当一个联盟结构(an,a-n)是稳定的,当且仅当在遵循优选准则的情况下,每一个用户n都不能通过加入、离开动作来提升其效用函数。

进一步地,步骤6所述的循环步骤3~步骤5,直到用户间形成稳定联盟,具体如下:

步骤6.1、频谱管理者更新预售价格;

步骤6.2、用户在当前市场价格下,基于单用户模型确定最优预购策略,根据自身需求的分布,计算其预期的实际收益;

步骤6.3、用户随机选择一个邻居联盟加入,联盟内进行信息交互,各用户在联盟内资源共享的情况下,计算自身期望效用;

步骤6.4、基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入;联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;

步骤6.5、在业务需求达到后,用户进行信息传输和联盟内均衡。

本发明与现有技术相比,其显著优点在于:(1)采用频谱资源的分级准备机制,减少了用户需求不确定性的影响,避免了频谱资源潜在的浪费;(2)利用stackerlberg博弈对问题进行建模,通过联盟形成博弈推导了均衡的存在性,为算法的设计提供了理论支持;(3)设计了基于频谱开销的预售系统分层学习算法,提升了频谱管理者与用户的直接收益。

附图说明

图1是本发明基于频谱开销的预售系统模型中的频谱预售机制示意图。

图2是本发明中联盟内用户间合作方式示意图。

图3是本发明实施例中不同场景下用户数目递增时的平均收益对比图。

图4是本发明实施例中不同场景下最终价格递增时的平均收益对比图。

图5是本发明实施例中不同场景下用户需求范围递增时的平均收益对比图。

具体实施方式

下面参考附图并结合具体实施例来对本发明进行详细说明。

结合图1,本发明基于频谱开销的预售系统模型,包括一个频谱资源管理者和n个用户;频谱管理者对资源池进行维护,通过向用户出售资源收取报酬,获得收益;结合图2,频谱管理者通过采用预售机制,利用时间维度频谱资源获取代价的差异性,来减小用户需求不确定性造成的影响,提升频谱资源管理者和用户双方的收益。

一种基于频谱开销的预售系统分层学习算法,包括以下步骤:

步骤1,将联盟选择与资源预购问题建模为多用户分层博弈,博弈的参与者是频谱管理者与各用户;

步骤2,定义频谱管理者和用户的效用函数,用户间完成邻居发现过程,建立邻居联盟集合;

步骤3,用户随机选择一个邻居联盟加入,各用户在联盟内资源共享的情况下,计算自身期望效用;

步骤4,基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构;

步骤5,联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;

步骤6,循环步骤3~步骤5,直到用户间形成稳定联盟。

本发明的具体实施如下:

进一步地,步骤1所述的将联盟选择与资源预购问题建模为多用户分层博弈,博弈模型定义为:

其中,包含七个组成部分,m为频谱管理者,为参与博弈的用户集合,an为用户n的联盟选择,为用户n的预购量,mp为频谱管理者的提前准备量,v为频谱管理者的效用函数,un为用户n的效用函数;

设定提前准备的频谱资源代价为β0,临时调度的频谱资源代价为β1,有β0≤β1;

设定频谱资源的预售定价为α0,最终价格为α1,有α0≤α1;

用户传输单位需求获得的收益为γ,用户的最终真实数据需求为srn

博弈优化目标p为:

进一步地,步骤2中所述的定义频谱管理者和用户的效用函数,具体如下:

当联盟成员的总需求量大于联盟的总预购量时,先将部分用户满足完自身需求之后,剩余的需求量根据剩余用户的需求量按照比例分配,此时,用户的效用函数un为:

其中,为用户的最终真实数据需求、α0为频谱资源的预售定价、为用户n的预购量、γ为用户传输单位需求获得的收益、an为用户n的联盟选择;δpos(an)为联盟中预购量大于需求量时用户剩余频谱资源之和,δneg(an)为联盟中预购量小于需求量时用户所缺频谱资源之和,为用户n按照比例分得的联盟剩余预购资源,为需要向频谱管理者临时购买的资源;

当联盟成员的总需求量小于联盟成员的总预购量之时,剩余的频谱资源由联盟成员按照各自需求进行等比例分担,此时,用户的效用函数un为:

其中为用户剩余的资源通过联盟内二次消化后带来的回报;

频谱资源管理者的效用函数为:

其中,β0为提前准备的频谱资源代价,β1为临时调度的频谱资源代价,α0为频谱资源的预售定价,α1为频谱资源的最终价格,δneg(an)为联盟中预购小于需求的用户所缺频谱资源之和,δpos(an)为联盟中预购大于需求的用户剩余频谱资源之和;

x为满足条件的联盟集合,也即无法通过联盟内部资源二次分配来满足其效用的联盟集合;

为x中的联盟对应的临时频谱资源请求收益,当频谱管理者准备充足时,x中的联盟请求直接进行服务,否则需要通过临时调用资源来进行服务;

为预售收益减去预备量开销的部分;

即为临时调用资源满足额外需求所获得的收益。

进一步地,步骤4所述的基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构,具体如下:

对于任一用户n和两个联盟co,co',基于帕累托准则定义如下动作:

当用户遵循帕累托准则时,在从一个联盟转移到另一个联盟的过程中,离开联盟的成员和加入联盟的成员的效用函数都不减小,即

对于任一用户n的两个联盟选择稳定联盟结构定义如下:

即当一个联盟结构(an,a-n)是稳定的,当且仅当在遵循优选准则的情况下,每一个用户n都不能通过加入、离开动作来提升其效用函数。

进一步地,步骤6所述的循环步骤3~步骤5,直到用户间形成稳定联盟,具体如下:

步骤6.1、频谱管理者更新预售价格;

步骤6.2、用户在当前市场价格下,基于单用户模型确定最优预购策略,根据自身需求的分布,计算其预期的实际收益;

步骤6.3、用户随机选择一个邻居联盟加入,联盟内进行信息交互,各用户在联盟内资源共享的情况下,计算自身期望效用;

步骤6.4、基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入;联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;

步骤6.5、在业务需求达到后,用户进行信息传输和联盟内均衡。

实施例

本发明的一个具体实施例如下描述:系统仿真采用matlab软件,参数设定不影响一般性;用户数目为8,频谱资源预售准备开销为8,实时调用开销为12,最终价格为16,用户单位数据收益为25。用户需求分布模型为均分分布,范围是[0-10]。

仿真中共比较了3种场景,分别如下:

1)均值:即假设频谱管理者知晓用户的需求分布,频谱资源准备为需求的期望值。但不采用预售机制,只享受频谱预备资源的低价开销。

2)单用户策略:基于预售机制,用户通过自身需求分布求出最优预购量,频谱管理者在用户最优策略的反应下,给出最优的预售价格和频谱资源准备量。

3)多用户合作策略:用户基于拓扑分布,形成联盟,通过联盟平稳需求不确定性带来的影响。

图3是三种场景随着用户数目增加时的平均效用对比图。由图可知,(i)无论是用户还是频谱管理者,均值场景对应的效用最低,验证了预售机制和所提单用户场景和多用户合作等机制的有效性,表明了所提机制和模型具有双赢特性。(ii)对于频谱管理者,单用户场景的效用最高;而对于用户,单用户场景性能弱于多用户合作。这是因为多用户场景中,用户可以通过合作等方式,将多余的频谱资源与无法满足的业务需求进行匹配,从而以较低的预售价格实现业务的传输,而这部分二次匹配的需求在单用户场景下是需要支付更高的代价才能获得收益。所以,用户通过合作减小了开销,频谱管理者在用户合作的场景下性能有所下降。此时,用户和频谱管理者之间的关系呈现出了对抗性。

图4是最终价格变化条件下集中场景的性能对比图。随着最终价格递增,频谱管理者效用函数呈现出递增趋势,而用户的效用则呈现出递减趋势。

图5是随用户需求变化的性能对比图。随着需求的增加,用户和频谱管理者的效用都在增加。显然,需求越大,用户直接收益越多,频谱管理者的收益也越多。

综上所述,本发明提出的基于频谱开销的预售系统模型,通过消除用户需求不确定性,实现了用户间资源与需求的高效匹配;提出的基于频谱开销的预售系统分层学习算法,能够有效提升频谱管理者与用户的直接收益。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1