双重信息非对称环境下基于行为监督的协作通信激励方法与流程

文档序号:11235442阅读:274来源:国知局
双重信息非对称环境下基于行为监督的协作通信激励方法与流程

本发明属于无线协作通信系统技术领域,具体涉及一种双重信息非对称环境下基于行为监督的协作通信激励方法。



背景技术:

无线通信技术的快速发展,使得频谱资源紧缺问题日益严峻,目前已成为制约无线通信发展的瓶颈。协作通信技术借助于无线节点之间的协作中继,能够有效提高无线频谱的利用率。然而,在实际的认知网络和协作无线网络中,普遍存在着非对称网络信息现象,使得在众多中继节点中选择出合适的、信道状态好的、通信能力高的中继节点相当困难。

针对非对称性信息条件下的协作通信技术研究正得到研究者的关注,其中,基于频谱合约共享策略的研究刚刚起步,现有文献大多研究中继用户通信能力信息非对称性引起的逆向选择问题,对于中继用户通信努力行为信息非对称性引起的道德风险问题关注较少。此外,非授权用户(secondaryuser,su)的这些能力和努力信息不对称现象常常同时并发,目前双重信息非对称环境下的协作通信激励研究较少关注实时监测中继节点的私有协作行为。通过文献检索,尚未发现现有文献涉及到双重信息非对称环境下基于行为监督的协作通信激励方法。



技术实现要素:

为了克服上述现有技术存在的不足,本发明的目的在于提出一种双重信息非对称环境下基于行为监督的协作通信激励方法。

为了达到上述目的,本发明所采用的技术方案是:双重信息非对称环境下基于行为监督的协作通信激励方法,其特征在于,所述方法包括如下步骤:

步骤1,通过将协作通信网络映射成劳动力市场,通过引入监督节点,建立中继节点、监督节点和源节点模型;

步骤2,在此基础上,考虑到源节点雇佣监督节点监测中继节点的协作行为,监督节点可以获得中继节点准确的努力行为,因此,只需设计合适的契约以解决逆向选择问题,建立基于契约理论的两阶段stackelberg博弈模型,在第一阶段,源节点向监督节点提供契约条款,以获得自身效用最大化,在第二阶段,监督节点向中继节点提供契约条款以获得自身效用最大化,通过设置契约条款,从而有效地规避契约签订后中继节点私有信息引起的逆向选择问题,保证协作通信的实现。

进一步地,步骤1中,建立中继节点模型实现过程包括:

由于第i个中继节点协作中继努力ei,源节点所获得的可用收益为πi=θiei+δ,其中θi为每单位中继努力所产生的收益,δ是服从正态分布的随机变量δ~n(0,σ2);

采用线性共享策略,第i个中继节点所获得的报酬wi可表示为wi=αi+βiπi,

其中,αi为其固定报酬,βi∈[0,1]是该节点的提成比例;

由于中继节点付出的努力越大,他所付出的中继成本ci(ei)也越大,并且,中继成本会随着付出努力的增大而增大,于是,ci′(ei)>0andci“(ei)>0,一般地,中继成本ci(ei)可简单表示为其中,ci为第i个中继节点的中继系数以描述中继传输信息,包括中继信道状态或电池性能;

于是,第i个中继节点的收益可定义为其数学期望和方差分别为

假设每个中继节点具有绝对的风险厌恶偏好,那么,其负指数效益函数可定义为其中,ρ表示中继节点的arrow-pratt绝对风险厌恶程度,ρ越大,中继节点越害怕风险,一般地,0≤ρ≤1,于是,基于上述假设,第i个中继节点的期望效益为

进一步地,步骤1中,建立监督节点模型实现过程包括:

假设源节点雇佣监督节点监测中继节点的协作行为,采用线性支付策略(u,v),则监督节点的效用可定义为:

其中,u为监督节点的基本工资,v∈[0,1]为该节点的提成比例。

进一步地,步骤1中,建立源节点模型实现过程包括:

考虑到监督节点的监测行为和中继节点的协作行为,源节点的效用可表示为:

其中,u0为源节点直接通信所获得的效用。

进一步地,步骤2中,所述中继节点私有信息,所采取的实现过程包括:

假设中继节点的私有信息θi在θ∈[θl,θh]范围内随机分布,其概率密度函数为fi(θi),分布函数为fi(θi),其中θl<θh,fi(θi)>0,为了方便后续计算,令

进一步地,步骤2中,协作通信激励第二阶段契约设计实现过程包括:

由于源节点雇佣监督节点监测中继节点的协作行为,监督节点可以获得中继节点准确的努力行为,因此,他只需要设计合适的契约以解决逆向选择问题,当私有信息θi的中继节点选择契约条款(αi(θi),βi(θi),ei(θi)),那么该节点的效用可表示为:

于是,当监督节点向该中继节点提供契约条款(αi(θi′),βi(θi′))时,该中继节点在付出中继努力ei(θi′)后所获得的效用为:

由此,可知监督节点的效用:

监督节点需提供给中继节点的契约(αi(θi),βi(θi))产生的回报要高于其保留效用即设计的契约要满足下面的个人理性(ir)条件:

此外,为了激励中继节点忠实地向源节点反馈其能力类型信息,协作契约需满足激励相容(ic)约束,以确保能力类型为θi的中继节点通过选择第i个合约条款可实现期望效用最大,即

因此,在第二阶段的契约设计优化问题为:在满足中继节点个人理性和激励相容约束条件下,监督节点效用的最大化

进一步地,步骤2中,协作通信激励模型第二阶段的契约优化求解实现过程包括:

由于由ir条件可知,于是,有

于是,可以得到监督节点的期望效用:

通过改变上述积分的顺序,可得

于是,可求得监督节点的期望效用:

可知即m(βi(θi),ei(θi))为βi(θi)的单调减函数,于是可得到最优的提成系数

可得到最优的协作努力和固定报酬

于是,中继节点最优的效用为监督节点最优的期望效用为

进一步地,步骤2中,协作通信激励第一阶段契约设计实现过程包括:

在第一阶段,源节点的期望效用为为了获得源节点效用的最大化,最优的契约设计需满足如下优化问题:

其中,ir条件使得监督节点至少能获得保留效用

进一步地,步骤2中,协作通信激励模型第一阶段的契约优化求解实现过程包括:

由于是u的增函数而us是u的减函数,因此,要获得最大的源节点效用,必须减少u,但至少要使得监督节点获得保留效用于是,最优的固定报酬

于是,第一阶段的契约设计问题可简化为

可知于是,可得到最优的契约条款:

进一步地,步骤2中,所述基于契约理论的两阶段stackelberg博弈模型的最优契约设计如下:

第一阶段:

第二阶段:

中继节点最优效用:

监督节点最优的期望效用:

源节点最优的期望效用:

与现有技术相比,本发明的有益效果是:本发明提出的一种双重信息非对称环境下基于行为监督的协作通信激励方法,该方法针对网络信息的双重非对称性,通过引入监督节点,建立基于契约理论的两阶段stackelberg博弈模型,以实时监测中继节点的协作行为,从而有效地规避契约签订后中继节点私有信息引起的逆向选择问题,保证协作通信的实现。并且,本发明提出的多用户协作通信激励方法易于实现,源节点和中继节点之间的信息交互较少,因而该方法所需的信令开销较少。

附图说明

图1是本发明的协作通信激励方法的基于契约理论的两阶段stackelberg博弈模型原理框图。

图2是本发明的协作通信网络映射成劳动力市场的原理模型。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

本实施例假设无线协作网络是一个劳动力市场。其中,源节点是雇主,监督节点为源节点的雇员,用于实时监测中继节点的协作行为,同时,监督节点是中继节点的雇主,雇佣中继节点为源节点提供中继服务。具体过程如图2所示。

本发明通过将协作通信网络映射成劳动力市场,通过引入监督节点,建立中继节点、监督节点和源节点模型。在此基础上,考虑到源节点雇佣监督节点监测中继节点的协作行为,监督节点可以获得中继节点准确的努力行为,因此,只需设计合适的契约以解决逆向选择问题。建立基于契约理论的两阶段stackelberg博弈模型,如图1所示,在第一阶段,源节点向监督节点提供契约条款,以获得自身效用最大化,在第二阶段,监督节点向中继节点提供契约条款以获得自身效用最大化。通过设置契约条款,从而有效地规避契约签订后中继节点私有信息引起的逆向选择问题,保证协作通信的实现。

(1)中继节点模型

由于第i个中继节点协作中继努力ei,源节点所获得的可用收益为πi=θiei+δ,其中θi为每单位中继努力所产生的收益,δ是服从正态分布的随机变量δ~n(0,σ2)。

采用线性共享策略,第i个中继节点所获得的报酬wi可表示为wi=αi+βiπi,其中,αi为其固定报酬,βi∈[0,1]是该节点的提成比例。不同的中继能力和中继努力,中继节点会获得不同的固定报酬和提成。

由于中继节点付出的努力越大,他所付出的中继成本ci(ei)也越大,并且,中继成本会随着付出努力的增大而增大,于是,ci′(ei)>0andci″(ei)>0。一般地,中继成本ci(ei)可简单表示为其中,ci为第i个中继节点的中继系数以描述中继传输信息,如中继信道状态或电池性能等。

于是,第i个中继节点的收益可定义为其数学期望和方差分别为

假设每个中继节点具有绝对的风险厌恶偏好,那么,其负指数效益函数可定义为其中,ρ表示中继节点的arrow-pratt绝对风险厌恶程度,ρ越大,中继节点越害怕风险,一般地,0≤ρ≤1。于是,基于上述假设,第i个中继节点的期望效益为

(2)监督节点模型

假设源节点雇佣监督节点监测中继节点的协作行为,采用线性支付策略(u,v),则监督节点的效用可定义为:

其中,u为监督节点的基本工资,v∈[0,1]为该节点的提成比例。

(3)源节点模型

考虑到监督节点的监测行为和中继节点的协作行为,源节点的效用可表示为:

其中,u0为源节点直接通信所获得的效用。

(4)中继节点私有信息

假设中继节点的私有信息θi在θ∈[θl,θh]范围内随机分布,其概率密度函数为fi(θi),分布函数为fi(θi),其中θl<θh,fi(θi)>0。为了方便后续计算,令

(5)协作通信激励模型第二阶段的契约设计

由于源节点雇佣监督节点监测中继节点的协作行为,监督节点可以获得中继节点准确的努力行为,因此,他只需要设计合适的契约以解决逆向选择问题。当私有信息θi的中继节点选择契约条款(αi(θi),βi(θi),ei(θi)),那么该节点的效用可表示为:

于是,当监督节点向该中继节点提供契约条款(αi(θi′),βi(θi′))时,该中继节点在付出中继努力ei(θi′)后所获得的效用为:

由此,可知监督节点的效用:

监督节点需提供给中继节点的契约(αi(θi),βi(θi))产生的回报要高于其保留效用即设计的契约要满足下面的个人理性(individuallyrational,ir)条件:。

此外,为了激励中继节点忠实地向源节点反馈其能力类型信息,协作契约需满足激励相容(incentivecompatibility,ic)约束,以确保能力类型为θi的中继节点通过选择第i个合约条款可实现期望效用最大,即

因此,在第二阶段的契约设计优化问题为:在满足中继节点个人理性和激励相容约束条件下,监督节点效用的最大化。

(6)协作通信激励模型第二阶段的契约优化求解

由于由ir条件可知,于是,我们有

于是,可以得到监督节点的期望效用:

通过改变上述积分的顺序,可得

于是,可求得监督节点的期望效用:

令m可知即m(βi(θi),ei(θi))为βi(θi)的单调减函数,于是可得到最优的提成系数

可得到最优的协作努力和固定报酬

于是,中继节点最优的效用为监督节点最优的期望效用为

(7)协作通信激励模型第一阶段的契约设计

在第一阶段,源节点的期望效用为为了获得源节点效用的最大化,最优的契约设计需满足如下优化问题:

其中,ir条件使得监督节点至少能获得保留效用

(8)协作通信激励模型第一阶段的契约优化求解

由于是u的增函数而us是u的减函数,因此,要获得最大的源节点效用,必须减少u,但至少要使得监督节点获得保留效用于是,最优的固定报酬

于是,第一阶段的契约设计问题可简化为

可知于是,可得到最优的契约条款:

(9)协作通信激励模型契约优化设计

上述两阶段stackelberg博弈模型的最优契约设计如下:

第一阶段:v*=1,

第二阶段:

中继节点最优效用:

监督节点最优的期望效用:

源节点最优的期望效用:

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1