基于双层博弈的无线通信系统多用户资源分配系统的制作方法

文档序号:15456566发布日期:2018-09-15 01:14阅读:152来源:国知局

本发明涉及通信技术领域,尤其是基于双层博弈的无线通信系统多用户资源分配系统。



背景技术:

随着移动通信的发展,日益增长的通信需求给通信网络带来了越来越大的压力。到2020年,通信数据量预计将增长1000倍以上。在有限的资源条件下,如何合理的在多用户之间分配资源,实现系统的最大效用,将成为亟待解决的问题。



技术实现要素:

有鉴于此,本发明的目的在于提供基于双层博弈的无线通信系统多用户资源分配系统,通过求解双层博弈,得到运营商和用户之间的最优定价关系,以及运营商最优的系统资源分配结构,能够最小化系统的能量消耗,最大化系统收益,同时具有较低的复杂度。

第一方面,本发明实施例提供了基于双层博弈的无线通信系统多用户资源分配系统,包括群体内演化博弈求解模块、群体间演化博弈求解模块、信息收集模块、能量最优资源分配模块和斯塔克尔伯格博弈求解模块;

所述信息收集模块,与所述能量最优资源分配模块相连接,用于收集第一用户群体的第一信道信息和第二用户群体的第二信道信息;

所述群体内演化博弈求解模块,与所述群体间演化博弈求解模块相连接,用于求解所述第一用户群体内和所述第二用户群体内的用户演化均衡下的第一业务选择结果;

所述群体间演化博弈求解模块,分别与所述能量最优资源分配模块和所述斯塔克尔伯格博弈求解模块相连接,用于根据所述第一业务选择结果求解第一用户群体和第二用户群体之间演化均衡下的第二业务选择结果;

所述能量最优资源分配模块,与所述斯塔克尔伯格博弈求解模块相连接,用于在满足所述第二业务选择结果的情况下,根据所述第一信道信息和所述第二信道信息得到能量最优资源分配结果和所述系统的能量损耗结果;

所述斯塔克尔伯格博弈求解模块,用于根据不同定价下的所述第二业务选择结果和所述能量最优资源分配结果,得到运营商最大系统效用和最优资源分配结构。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述信息收集模块包括第一用户群体信道信息收集模块和第二用户群体信道信息收集模块。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,还包括:

所述第一用户群体信道信息收集模块,用于收集所述第一信道信息;

所述第二用户群体信道信息收集模块,用于收集所述第二信道信息。

结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述运营商提供低质量业务和高质量业务。

结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述第一业务选择结果包括第一用户比例和第二用户比例,其中,所述第一用户比例为所述第一用户群体中选择所述低质量业务的比例,所述第二用户比例为所述第二用户群体中选择所述低质量业务的比例。

结合第一方面的第四种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述群体内演化博弈求解模块包括第一用户群体演化博弈求解模块和第二用户群体演化博弈求解模块。

结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,还包括:

所述第一用户群体演化博弈求解模块,用于将所述第二用户群体的所述第二用户比例给定的条件下,求解所述第一用户群体的所述第一用户比例;

所述第二用户群体演化博弈求解模块,用于将所述第一用户群体的所述第一用户比例给定的条件下,求解所述第二用户群体的所述第二用户比例。

结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述群体内演化博弈求解模块通过动态价格策略求解所述第一业务选择结果。

结合第一方面的第四种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,所述群体间演化博弈求解模块根据所述第一用户比例和所述第二用户比例互为函数求解所述第二业务选择结果。

第二方面,本发明实施例提供了基于双层博弈的无线通信系统多用户资源分配系统,包括如上所述的基于双层博弈的无线通信系统多用户资源分配系统,还包括:

信息收集模块还用于利用导频估计第一用户群体和第二用户群体的信道信息。

本发明提供了基于双层博弈的无线通信系统多用户资源分配系统,包括群体内演化博弈求解模块、群体间演化博弈求解模块、信息收集模块、能量最优资源分配模块和斯塔克尔伯格博弈求解模块;信息收集模块用于收集信道信息;群体内演化博弈求解模块用于求解用户群体内演化均衡业务选择结果;群体间演化博弈求解模块用于求解不同用户群体间演化均衡业务结果;能量最优资源分配模块用于求解能量最优资源分配和最小能量损耗结果;斯塔克尔伯格博弈求解模块根据不同定价下的业务选择结果求解运营商最大系统效用和最优资源分配结构。本发明通过求解双层博弈得到运营商和用户之间的最优定价关系、运营商最优资源分配结构,最小化系统能量消耗,最大化系统收益。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于双层博弈的无线通信系统多用户资源分配系统示意图;

图2为本发明实施例提供的第一用户群体的博弈演化均衡点示意图;

图3为本发明实施例提供的系统演化过程示意图;

图4为本发明实施例提供的系统总收益对比示意图。

图标:

10-信息收集模块;20-群体内演化博弈求解模块;30-群体间演化博弈求解模块;40-能量最优资源分配模块;50-斯塔克尔伯格博弈求解模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前,随着移动通信的发展,日益增长的通信需求给通信网络带来了越来越大的压力。到2020年,通信数据量预计将增长1000倍以上。在有限的资源条件下,如何合理的在多用户之间分配资源,实现系统的最大效用,将成为亟待解决的问题。基于此,本发明实施例提供的基于双层博弈的无线通信系统多用户资源分配系统,通过求解双层博弈,得到运营商和用户之间的最优定价关系,以及运营商最优的系统资源分配结构,能够最小化系统的能量消耗,最大化系统收益,同时具有较低的复杂度。

实施例一:

在未来5G通信中,系统延时成为系统性能的重要考量,针对不同用户与服务,运营商将会提供不同的延时保障。由于用户会根据业务的延时和价格选择不同的业务,运营商需要做出最优的价格决定,从而最大化系统效用。该过程可视为典型的斯塔克尔伯格博弈,斯塔克尔伯格博弈在定价问题和基于价格的资源分配问题中有广泛的应用。斯塔克尔伯格博弈模型是一个价格领导模型,博弈双方分别扮演领导者和追随者的角色,追随者在领导者做出决定之后,追随领导者做出自身的决定,优化自身利益。

与此同时,移动通信的发展也带来了用户群体的复杂性,用户群体将从简单的单一结构,到复杂的多用户群体结构,不同用户群体之间同样存在通信资源的竞争。演化博弈通常用于建模不同群体间的竞争过程。演化博弈基于生物进化理论,考虑非完全理性的用户群体之间的竞争关系,得到不同用户群体之间的博弈均衡。

基于以上双层博弈模型,能够有效刻画运营商和用户之间,以及用户与用户之间的资源竞争关系,从而进一步优化系统资源。

图1为基于双层博弈的无线通信系统多用户资源分配系统的示意图。

参照图1,基于双层博弈的无线通信系统多用户资源分配系统,包括群体内演化博弈求解模块20、群体间演化博弈求解模块30、信息收集模块10、能量最优资源分配模块40和斯塔克尔伯格博弈求解模块50;

信息收集模块10,与能量最优资源分配模块40相连接,用于收集第一用户群体的第一信道信息和第二用户群体的第二信道信息;

群体内演化博弈求解模块20,与群体间演化博弈求解模块30相连接,用于求解第一用户群体内和第二用户群体内的用户演化均衡下的第一业务选择结果;

群体间演化博弈求解模块30,分别与能量最优资源分配模块40和斯塔克尔伯格博弈求解模块50相连接,用于根据第一业务选择结果求解第一用户群体和第二用户群体之间演化均衡下的第二业务选择结果;

能量最优资源分配模块40,与斯塔克尔伯格博弈求解模块50相连接,用于在满足第二业务选择结果的情况下,根据第一信道信息和第二信道信息得到能量最优资源分配结果和系统的能量损耗结果;

斯塔克尔伯格博弈求解模块50,用于根据不同定价下的第二业务选择结果和能量最优资源分配结果,得到运营商最大系统效用和最优资源分配结构。

进一步地,信息收集模块包括第一用户群体信道信息收集模块和第二用户群体信道信息收集模块。

进一步地,还包括:

第一用户群体信道信息收集模块,用于收集第一信道信息;

第二用户群体信道信息收集模块,用于收集第二信道信息。

进一步地,运营商提供低质量业务和高质量业务。

进一步地,第一业务选择结果包括第一用户比例和第二用户比例,其中,第一用户比例为第一用户群体中选择低质量业务的比例,第二用户比例为第二用户群体中选择低质量业务的比例。

进一步地,群体内演化博弈求解模块20包括第一用户群体演化博弈求解模块和第二用户群体演化博弈求解模块。

进一步地,还包括:

第一用户群体演化博弈求解模块,用于将第二用户群体的第二用户比例给定的条件下,求解第一用户群体的第一用户比例;

第二用户群体演化博弈求解模块,用于将第一用户群体的第一用户比例给定的条件下,求解第二用户群体的第二用户比例。

进一步地,群体内演化博弈求解模块20通过动态价格策略求解第一业务选择结果。

进一步地,群体间演化博弈求解模块30根据第一用户比例和第二用户比例互为函数求解第二业务选择结果。

实施例二:

本发明实施例的方案中,考虑运营商提供两种不同的业务(低质量业务1,高质量业务2),两种业务的延时为τ1>τ2,价格为o1<o2。同时,考虑系统中存在两种用户群体,用户群体S={uS,1,...uS,M}和用户群体T={uT,1,...uT,K}。针对两种不同业务,不同用户将会有不同的选择,表示为bS,m∈{1,2},bT,k∈{1,2}。需要说明的是,本发明实施例的用户群体S与用户群体T,对应上述实施例的第一用户群体和第二用户群体。

运营商的效用函数由收益和能量消耗两部分组成:

Uope=(πoOS+OT)-ηe(ES+ET) (1)

其中,是来自用户群体S的收益,是来自用户群体T的收益,πo>1是不同用户群体之间的价格系数,我们假设用户群体S的价格高于用户群体T。ES和ET为满足用户群体S和用户群体T所选择的业务需要消耗的能量,ηe是能量成本系数。

由于用户会根据业务的延时和价格选择不同的业务,运营商需要做出最优的价格决定,分析用户之间的竞争行为,合理分配系统资源,最大化来自用户收益,最小化系统能量消耗,从而最大化系统效用。

本发明实施例可分为以下5个模块:群体内演化博弈求解模块20、群体间演化博弈求解模块30、信息收集模块10、能量最优资源分配模块40、斯塔克尔伯格博弈求解模块50。

群体内演化博弈求解模块20的功能是求解各用户群体内用户演化均衡下的业务选择结果。包括以下2个部分:用户群体S演化博弈求解模块,用户群体T演化博弈求解模块。

在传统博弈论中,纳什均衡点通常被当做系统最优解,在纳什均衡点处,所有用户都不会主动离开该均衡点。但传统的纳什均衡点是建立在用户绝对理性的假设上的,绝对理性假设所有用户都会选择最大化自身效用的选择。但这样的假设不一定总是正确,在实际场景中,有限理性可能是更加合理的假设。因此,起源于生物学的演化博弈理论在更多领域得到了广泛的应用。在演化博弈中,系统不会立刻达到最优状态,用户会不断的改变选择,知道达到演化均衡。在演化均衡中,种群的概念被应用在其中,相同选择的用户被统一视为成一个种群,最终得到的演化均衡为不同种群的人口占比。

考虑用户的有限理性,静态的价格策略可能会在系统达到演化均衡之前遭受较大的效用损失,尤其是演化过程较长时。因此我们考虑动态的价格策略:每当运营商收到来自用户的业务选择时,运营商将会动态调整下一次业务的价格。我们用κS∈[0,1],κT∈[0,1]表示用户群体S和用户群体T中选择低质量业务的用户比例,我们可以得到

o2,next=ηupo2 (2)

ηup=πup[ηup,1κS+ηup,2(1-κS)]+[ηup,1κT+ηup,2(1-κT)]. (3)

其中,ηup,1和ηup,2是针对两种服务的价格调整系数,πup>1是针对用户群体S的额外调整系数。自然的,我们有ηup,1<1,ηup,2>1。由于运营商动态的调整价格,用户在决定业务选择的时候也需要将价格调整纳入考虑。我们用ρ∈[0,1]表示价格调整对用户选择的影响比例,ρ越大表示用户越看重当前的价格,不重视调整后的价格。用q1,q2表示用户从两种延时业务中所获得的收益,q1<q2。用户的效用函数可以表示为:

US,1=q1-πoo1,US,2=q2-πoo2[ρ+(1-ρ)ηup] (4)

UT,1=q1-o1,UT,2=q2-o2[ρ+(1-ρ)ηup] (5)

每个用户的效用与价格设定,以及其他用户的选择均相关。对于不同的价格设定,将会构成不同的演化博弈,通过求解该博弈,可以得到不同用户的比例κS,κT。

对于用户群体S演化博弈求解模块,其的功能是将用户群体T的选择κT视为定值的条件下,求解用户群体S的演化均衡解κS。

用户群体S的平均效用为:

用户群体S的演化速率,也即κS的变化率,可以用复制动态方程计算如下

系统的演化均衡点是复制动态方程的稳定不动点,在该点处κS的变化率为0,并且任何离开该点小的扰动都会返回该点。通过求解FS(κS)=0,我们可以得到不动点如下:

其中Δq=q2-q1,Δηup=ηup,2-ηup,1。当的取值在不同范围时,系统的演化均衡点有不同的结果,分析如下:

(1)如图2(a)所示,对于任何初始值κS∈(0,1),κS将会最终变化为0,系统的稳定均衡点为κS=0。

(2)如图2(b)所示,对于任何初始值κS∈(0,1),κS将会最终变化为1,系统的稳定均衡点为κS=1。

(3)如图2(c)所示,对于任何初始值κS∈(0,1),κS将会最终变化为系统的稳定均衡点为

一旦我们得到的取值,我们可以按照如实所述求得演化博弈的稳定均衡解κS。然而,的取值并不独立,实际上是用户群体T选择κT的函数。其中,等价于

同样的,等价于等价于由于κT∈[0,1],我们根据和κT的取值讨论κS的求解如下:

(1)此时,对任意κT取值都有等价于因此我们有κS=0。

(2)此时,对任意κT取值都有等价于因此我们有κS=1。

(3)此时,需要进一步讨论κT的取值

(a)此时,我们有

(b)此时,我们有κS=0。

(4)此时,对任意κT取值都有等价于因此我们有

(5)此时,需要进一步讨论κT的取值

(a)此时,我们有κS=1。

(b)此时,我们有

对于用户群体T演化博弈求解模块,其功能是将用户群体S的选择κS视为定值的条件下,求解用户群体T的演化均衡解κT。

类似于用户群体S演化博弈求解模块,结果如下:

(1)

(2)

(3)

(a)

(b)

(4)

(a)

(b)

(c)

(5)

(a)

(b)

其中,和可按照用户群体S的同样方法分析计算如下:

群体间演化博弈求解模块的功能是求解多用户群体之间演化均衡下的业务选择。

在固定另外一个用户群体选择情况下,我们分别得到了用户群体S和用户群体T的演化均衡解。然而实际上用户群体S和用户群体T的选择κS和κT互为函数,我们同时考虑二者的互相影响,求解系统的演化均衡解。

基于以上分析,我们可以得到和之间的关系如下:

由于κS和κT是和的函数,我们根据和的取值讨论系统的均衡解。由于存在过多的情况,我们给出部分典型的求解情况如下:

(1)在该情况下,由于我们可以得到系统的均衡解为(κS=0,κT=0)。

(2)在该情况下,由于我们可以得到系统的均衡解为(κS=1,κT=1)。

(3)在该情况下,κS和κT互为函数,关系如下

(a)

(b)

如图3所示,我们分4个区域讨论系统的均衡解。

区域1:在该情况下,κS趋向于0,κT趋向于因此区域1中的点将会趋于运动至区域4,区域1中无均衡点。

区域2:在该情况下,κS趋向于0,κT趋向于0。因此区域1中的点将会趋于运动至区域1、3、4,区域2中无均衡点。

区域3:在该情况下,κS趋向于κT趋向于0。因此区域3中的点将会趋于运动至均衡点

区域4:在该情况下,κS趋向于κT趋向于因此区域4中的点将会趋于运动至区域3,区域4中无均衡点。

基于以上分析,我们得到系统稳定均衡点为

类似的,通过分析所有情况,我们得到最终系统均衡解如表1所示。

表1系统演化均衡解

信息收集模块的功能是收集系统所需的信道信息。包括以下2个部分:用户群体S信道信息收集模块、用户群体T信道信息收集模块。

(1)用户群体S信道信息收集模块

用户群体S信道信息收集模块的功能是收集用户群体S的信道信息。利用导频,估计所有用户群体S的的信道信息。

(2)用户群体T信道信息收集模块

用户群体T信道信息收集模块的功能是收集用户群体T用户的信道信息。利用导频,估计所以用户群体T的信道信息。

能量最优资源分配模块的功能是,在满足不同用户业务选择的情况下,最优化用户间资源分配,最小化系统能量消耗。

基于以上演化博弈求解模块,我们得到不同业务定价情况下,多用户群体间演化均衡下的业务选择。基于信息收集模块所收集的信道信息,在满足不同用户所选择的业务情况下,最优化所有用户间的资源分配,最小化系统能量消耗。

斯塔克尔伯格博弈求解模块的功能是,根据不同定价下的用户业务选择以及能量最优资源分配结果,最大化运营商系统效用,得到最优的资源分配结构。

基于φS和φT的定义,我们可以证明,φS和φT的取值随价格o2的增加而增加,并且有假设o2=o1时有φS≤0,当运营商增加价格o2时,用户的选择将会经历表1中所示的5个阶段。由于用户数量为离散值,所以最大效用在用户选择恰好做出改变前达到最大。由于系统中总共有M+K个用户,同一时间改变选择的用户数量不会超过1个,所以我们只需计算以下的M+K+1种情况。

(1)φS=0。φS≤0所有用户均选择高质量业务,因此最大效用在φS=0时达到。

(2)0<φS<πup。在该情况下,部分用户群体S中的用户改变选择,选择低质量业务。由于用户数量只能够为整数,我们只需要计算以下M-1种情况,

(3)φS≥πup,φT≤1。在该情况下,所有用户群体S用户选择低质量业务,所有用户群体T用户选择高质量业务,最大效用在φT=1时获得。

(4)在该情况下,部分用户群体T中用户改变选择,选择低质量业务。同样的,由于用户数量为整数,我们计算K-1种情况。

(5)在该情况下,所有用户均选择低质量业务,系统效用不变。

通过计算以上所有M+K+1种情况,我们最终得到实现最大效用的系统的斯塔克尔伯格博弈均衡点,得到最优价格设定。

本发明实施例通过求解双层博弈,得到运营商和用户之间的最优定价关系,以及运营商最优的系统资源分配结构,能够最小化系统的能量消耗,最大化系统收益,同时具有较低的复杂度。

实施例三:

为简化模型同时不失一般性,定义低质量业务的价格为1,不同延时业务的收益计算为其中ηq是业务上收益系数。价格系数πo=1.5,提价系数πup=1.5,价格调整影响系数ρ=0.5,业务收益差异Δq=3。不同提价系数下的系统收益如下。基于双层博弈,得到了不同场景下的最优资源优化结构,最大化系统收益。需要说明的是,图4中的三条曲线,其中最上面一条曲线对应ηup,1=0.25,中间位置的曲线对应ηup,1=0.5,最下面的曲线对应ηup,1=0.75。

本发明实施例提供的基于双层博弈的无线通信系统多用户资源分配系统,与上述实施例具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1