一种基于势博弈的无线传感器网络拓扑控制方法与流程

文档序号：12380240阅读：266来源：国知局

本发明涉及拓扑控制算法，具体是一种基于势博弈的无线传感器网络拓扑控制方法。

背景技术：

无线传感器网络具有多跳的特性，节点在数据转发过程中为了节省能量可能会表现出自私的行为。因此，最近几年，博弈理论开始被许多学者用来研究拓扑控制问题。EIDENBENZ等人将拓扑控制问题作为一个非合作博弈，并分析了寻找纳什均衡算法的复杂性，并提出了3个连通性博弈，但是无法保证纳什均衡的存在性，也没有证明所构建拓扑的能量有效性。因此Komali等人利用非合作博弈分析了ad hoc网络的拓扑控制，设计了一种可以保证收敛的分布式的最优响应算法MIA，其基本思想是:各个节点轮流执行博弈，当一个节点执行博弈时，其它节点保持当前功率不变，执行博弈的节点选取最大化自己收益的功率，并向网络中的所有节点广播博弈执行后的功率，其它节点重新计算邻居列表，如此反复，一直到任何一个节点无法通过改变自己的功率增加收益为止，该算法能够保证最小化网络最大发射功率，但是算法中节点的不同执行顺序导致产生不同的拓扑。随后作者基于MIA拓扑控制算法提出了改进算法，DIA和Local-DIA。DIA算法基于较优响应策略，其基本思想是:所有节点将功率选择集合离散化，保证从一个功率下降至相邻功率网络最多断开一条链路，各节点依次递减自己的发射功率一直到任何一个节点无法通过改变自己的功率而增加收益为止，该算法生成的网络拓扑使得各节点在保证网络双向连通的情况下最小化发射功率，DIA算法不仅可以达到纳什均衡，而且还能保证构建拓扑的唯一性，消除了节点执行顺序对拓扑结构的影响。Local-DIA是局部DIA算法，有效地减少了算法执行过程中信息的交换次数。但是DIA和Local-DIA算法均未考虑节点剩余能量对网络生存期的影响。基于这点Sajjad等人提出了一种基于链路功耗的拓扑控制博弈算法MLPT，该算法的主要思想是:所有节点以最大功率运行最小跳数路由算法，节点计算经过其各个链路的路由路径的个数，然后计算各个链路功耗因子(功耗因子＝路由路径数量×维持该链路的最小发射功率)，各个节点轮流执行博弈，当一个节点执行博弈时，以最优响应策略选择最大化其效益函数的链路，并广播博弈后的功率，直到所有节点不再改变其功率为止。MLPT算法能够降低整个网络的能耗并均衡节点链路的负载，MLPT算法能够根据节点间相互发送数据的统计记录重新计算链路功耗因子。HAO提出了一种基于虚拟博弈的分布式拓扑控制算法VGEB，该算法中各节点根据收集到的邻居节点信息独立进行博弈并广播博弈后的功率，该算法虽然降低了博弈执行过程中信息交换的次数，但是需要节点有比较强计算能力和较大的存储空间以支持博弈的执行。

技术实现要素：

针对无线传感器网络节点能量受限的特点以及大多数基于博弈的拓扑控制未考虑节点能量的情况，本发明提供一种基于势博弈的无线传感器网络拓扑控制方法，这种方法从功率控制及能耗均衡的角度出发，综合考虑节点的剩余能量和节点发射功率设计了一种新的效用函数，提出一种基于势博弈的分布式拓扑控制算法。理论分析和仿真结果表明，该算法构造的拓扑中能达到纳什均衡并且能够保证网络的连通性、能耗均衡等良好特性，延长了网络的生存周期。

实现本发明目的的技术方案是：

一种基于势博弈的无线传感器网络拓扑控制方法，包括如下步骤：

1)确定网络模型，将传感器网络表示成平面拓扑图，确立一个连通的网络，然后建立拓扑控制博弈模型(TCBPG)；

2)在步骤1)拓扑博弈模型上，确立博弈中的收益函数：

$<mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>α</mi> <msubsup> <mi>p</mi> <mi>i</mi> <mi>max</mi> </msubsup> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>+</mo> <mi>β</mi> <mover> <mrow> <msub> <mi>E</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mi>α</mi> <msub> <mi>p</mi> <mi>i</mi> </msub> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

式中，α和β为权重因子且都为正数，p_i表示节i的发射功率，p_-i表示其它N-1个节点的发射功率，f_i(p_i，p_-i)表示网络的连通性，当f_i(p_i，p_-i)＝1时，表示网络是连通的，即节点i可以通过双向链路与其它所有节点通信，否则f_i(p_i，p_-i)＝0网络不连通，显然f_i(p_i，p_-i)为单调非递减函数，即对于任意的节点且其发射功率p_i>q_i时，f_i(p_i，p_-i)≥f_i(q_i，p_-i)，表示节点i的最大发射功率，j表示节点i在功率p_i时的一跳邻居节点，E_r(j)表示节点j的剩余能量，E_o(j)表示j的初始能量，表示在网络连通时获得的收益；

3)为了确保博弈存在纳什均衡解，定义拓扑控制的博弈模型是一个序数势博弈，其势函数定义为：

$<mrow> <mi>V</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <mi>N</mi> </mrow> </munder> <mo>[</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>α</mi> <msubsup> <mi>p</mi> <mi>i</mi> <mi>max</mi> </msubsup> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>+</mo> <mi>β</mi> <mover> <mrow> <msub> <mi>E</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mi>α</mi> <msub> <mi>p</mi> <mi>i</mi> </msub> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>]</mo> </mrow>$

式中,函数V称为Г的序数势函数；

4)根据前面步骤确立博弈模型之后，再进行分布式能耗均衡拓扑控制算法实现，分成三个阶段实现；

5)实现步骤4)算法中三个阶段的邻居发现阶段；

6)实现步骤4)算法中三个阶段的博弈执行阶段；

7)实现步骤4)算法中三个阶段的拓扑维护阶段；

经过上述步骤之后能够得到一个稳定的无线传感器网络拓扑结构。

步骤1)中将传感器网络表示成平面拓扑图

H＝(N，E，Ω) (1)

其中H代表拓扑图平面，节点集N＝{1，2，…，n}代表网络中的所有节点的集合，边集代表节点间所有通信链路的集合，Ω＝[ω_ij]则表示是一个矩阵。

n个传感器节点随机部署在二维监测区域，具有相同的最大发射功率其中ω:E→R⁺，ω(i，j)是通信链路(i，j)连通所需要的最小功率。设Ω是一个对称矩阵，即从节点i到节点j传输消息所需要的最小功率和从节点j到节点i的相同。定义向量G(p)表示为所有的双向链路集合图，G(p)为H的一个子图，设各节点采用最大功率进行通信，记G(p)为G_max，G_max称之为最大功率网络图，G_max是连通的，

网络连通是拓扑控制的基本要求，为了建立一个特性良好保证网络的能耗均衡，生存周期相对较长的网络拓扑，必须建立一个势博弈的拓扑控制模型，

定义势博弈拓扑框架为Г＝<N，P，u>：

其中，Г表示标准博弈符，N＝{1，2，…，n}表示参与者集合，P表示策略集合，策略集合P为所有节点功率级集合P_i的笛卡尔积，P_i表示节点i可以选择的功率级集合p_i∈P_i，p_i表示节点所选择的功率级，u_i(p_i，p_-i)表示收益函数。

步骤2)中博弈模型设计的收益函数

为了尽可能的选中剩余能量多的节点作为其邻居节点用收益函数中的来控制，从而使得整个网络的消耗保持平衡。

步骤3)中博弈模型设计的序数势函数

$<mrow> <mrow> <mi>V</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <mi>N</mi> </mrow> </munder> <mo>[</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>α</mi> <msubsup> <mi>p</mi> <mi>i</mi> <mi>max</mi> </msubsup> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>+</mo> <mi>β</mi> <mover> <mrow> <msub> <mi>E</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mi>α</mi> <msub> <mi>p</mi> <mi>i</mi> </msub> <mfrac> <mrow> <msub> <mi>E</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>E</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>]</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

式中,函数V称为Г的序数势函数。

步骤4)中的分布式能耗均衡拓扑控制算法特性：

G_max是一个连通网络，DEBA算法收敛于能够保持网络G_max连通特性的纳什均衡状态。由步骤3)定义得TCBPG模型是序数势博弈，已知一个有限序数势博弈，较优反应策略一定会在有限步内收敛达到纳什均衡。此外，在DEBA算法中，每个节点都在不断的增加自己的效益直到不能增加为止。根据定义1，可以知道纳什均衡状态就是一种任何节点都无法通过改变自己的策略来增加效益的稳定状态，显然，DEBA算法可以收敛与纳什均衡状态。对于所有节点来说，节点通过较优反应策略降低自己的发射功率到保持网络连通的纳什均衡状态才有意义，

根据纳什均衡定义，没有一个节点能够通过继续降低自己的功率来获取更高的效益，若继续降低功率只会降低自己的效益，甚至使网络不连通。那么就违背了引理1。其次，也不存在m(m>2)个节点在保证网络连通的前提下同时降低功率来增加自己的效益。这是因为如果某个节点能够通过降低自己的功率来增加效益的话，网络必然不连通，那么就需要其它节点来增大功率来维持网络连通，这样的话其他节点的效益就会降低。因此根据帕累托最优的定义，DEBA算法收敛于帕累托最优纳什均衡。

步骤5)算法中的邻居发现阶段：

定义节点有唯一的ID，每个节点i初始化自己的功率为然后以广播“邻居发现信息”，其中包含节点ID、和剩余能量，并且收集来自接收到其发送的“发现信息”节点发送的回复信息。节点i根据接收到的来自节点j的ACK信息，将节点j的ID、剩余能量、p_ij加到自己的邻居列表中。采用自由空间模型计算i到节点j所需要的最小功率 $<mrow> <msub> <mi>p</mi> <mi>ij</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>p</mi> <mi>th</mi> </msub> <msup> <mrow> <mo>(</mo> <mn>4</mn> <mi>π</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mi>d</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mi>L</mi> </mrow> <mrow> <msub> <mi>G</mi> <mi>t</mi> </msub> <msub> <mi>G</mi> <mi>r</mi> </msub> <msup> <mi>λ</mi> <mn>2</mn> </msup> </mrow> </mfrac> <mo>,</mo> </mrow>$ 通过信息交换各节点生成自己的策略集 $<mrow> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>=</mo> <mo>{</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>max</mi> </msubsup> <mo>=</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mn>0</mn> </msubsup> <mo>,</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mn>1</mn> </msubsup> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>min</mi> </msubsup> <mo>}</mo> <mo>,</mo> </mrow>$ 其中k为i的一跳邻居节点个数

步骤6)算法中的博弈执行阶段：

节点获取整个网络的连通性信息，所有节点通过随机或者是按照节点ID升降序来轮流执行博弈确定其功率且每轮只有一个节点调整其功率，其它节点保持其功率不变，当一个节点改变了其功率，通过发送控制信息来通知其它节点重新计算邻居节点集合。为了收敛至纳什均衡，采用较优反应(Better-Response)策略更新方案，一个有限序数势博弈，较优反应策略一定会在有限步内收敛于纳什均衡。博弈执行过程中，若节点选择等级低的功率会比当前功率获得的效益大，那么节点会选择比当前功率低的功率并重新计算邻居节点集合，否则，节点不改变功率，也就是说，对于任意节点i，其当前的功率为m＝1，2，...，k-1，那么节点i选择的功率为：是节i当前可选的功率，博弈执行的过程伪代码如下所示:

步骤7)算法中的拓扑维护阶段：

随着网络运行时间的增加，网络中的节点的剩余能量会变的越来越不均衡。为了平衡节点间的能量消耗，网络拓扑应该动态的进行调整以延长网络的生命周期。每个节点都知道自己当前的剩余能量，可以设定一个时间周期或者如果节点的能量低于某个限度时，如低于初始能量的30％，重新执行拓扑生成算法以平衡节点的负载，从而实现了势博弈的无线传感器网络拓扑控制。

有益效果：

这种基于势博弈的无线传感器网络拓扑控制方法，从功率控制及能耗均衡的角度出发，综合考虑节点的剩余能量和节点发射功率设计了一种新的效用函数，提出了一种基于势博弈的分布式拓扑控制算法，理论分析和仿真结果表明，该算法构造的拓扑中能达到纳什均衡并且能够保证网络的连通性、能耗均衡等良好特性，延长了网络的生存周期。

具体实施方式

以下对本发明内容作进一步的阐述，但不是对本发明的限定。

实施例：

一种基于势博弈的无线传感器网络拓扑控制方法，包括如下步骤：

1)将传感器网络表示成平面拓扑图H＝(N,E,Ω)，其中节点集N＝{1,2,…,n}代表网络中的所有节点的集合，假设n个传感器节点随机部署在二维监测区域,具有相同的最大发射功率其边集代表节点间所有通信链路的集合，Ω＝[ω_ij]是一个矩阵,其中ω:E→R⁺,ω(i,j)是通信链路(i,j)连通所需要的最小功率.假设Ω是一个对称矩阵,即从节点i到节点j传输消息所需要的最小功率和从节点j到节点i的相同，定义向量G(p)表示为所有的双向链路集合图，G(p)为H的一个子图，若各节点采用最大功率进行通信，则记G(p)为G_max,称之为最大功率网络图，确定网络模型，确立一个连通的网络，网络连通是拓扑控制的基本要求，为了建立一个特性良好保证网络的能耗均衡，生存周期相对较长的网络拓扑，必须建立一个势博弈的拓扑控制模型(TCBPG)，定义势博弈拓扑框架为Г＝<N，P，u>；

2)在步骤1)拓扑博弈模型上，确立博弈中的收益函数：

式中，α和β为权重因子且都为正数，p_i表示节i的发射功率，p_-i表示其它N-1个节点的发射功率，f_i(p_i，p_-i)表示网络的连通性，当f_i(p_i，p_-i)＝1时，表示网络是连通的，即节点i可以通过双向链路与其它所有节点通信，否则f_i(p_i，p_-i)＝0网络不连通，显然f_i(p_i，p_-i)为单调非递减函数，即对于任意的节点且其发射功率p_i>q_i时，f_i(p_i，p_-i)≥f_i(q_i，p_-i)，表示节点i的最大发射功率。j表示节点i在功率p_i时的一跳邻居节点，E_r(j)表示节点j的剩余能量，E_o(j)表示j的初始能量，表示在网络连通时获得的收益；

3)为了确保博弈存在纳什均衡解，定义拓扑控制的博弈模型是一个序数势博弈，其势函数定义为：

4)根据前面步骤确立博弈模型之后，再进行分布式能耗均衡拓扑控制算法实现，此处分成三个阶段实现；

5)实现步骤4)算法中的邻居发现阶段，假设节点有唯一的ID，每个节点i初始化自己的功率为然后以广播“邻居发现信息”(其中包含节点ID、和剩余能量)，并且收集来自接收到其发送的“发现信息”节点发送的回复信息；节点i根据接收到的来自节点j的ACK信息，将节点j的ID、剩余能量、p_ij加到自己的邻居列表中。采用自由空间模型计算i到节点j所需要的最小功率通过信息交换各节点生成自己的策略 $<mrow> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>=</mo> <mo>{</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>max</mi> </msubsup> <mo>=</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mn>0</mn> </msubsup> <mo>,</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mn>1</mn> </msubsup> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mi>min</mi> </msubsup> <mo>}</mo> <mo>,</mo> </mrow>$ 其中k为i的一跳邻居节点个数 $<mrow> <msubsup> <mi>p</mi> <mi>i</mi> <mi>j</mi> </msubsup> <mo>&GreaterEqual;</mo> <msubsup> <mi>p</mi> <mi>i</mi> <mrow> <mi>j</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>&ForAll;</mo> <mi>j</mi> <mo>&Element;</mo> <mo>[</mo> <mn>0</mn> <mo>,</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>]</mo> <mo>;</mo> </mrow>$

6)实现步骤4)算法中的博弈执行阶段，假设节点获取整个网络的连通性信息，所有节点通过随机或者是按照节点ID升降序来轮流执行博弈确定其功率且每轮只有一个节点调整其功率，其它节点保持其功率不变；当一个节点改变了其功率，通过发送控制信息来通知其它节点重新计算邻居节点集合；为了收敛至纳什均衡，采用较优反应(Better-Response)策略更新方案，一个有限序数势博弈，较优反应策略一定会在有限步内收敛于纳什均衡；博弈执行过程中，若节点选择等级低的功率会比当前功率获得的效益大，那么节点会选择比当前功率低的功率并重新计算邻居节点集合，否则，节点不改变功率，也就是说，对于任意节点i，其当前的功率为m＝1，2，...，k-1，那么节点i选择的功率为：是节i当前可选的功率，博弈执行的过程伪代码如下所示:

7)实现步骤4)算法中的拓扑维护阶段，随着网络运行时间的增加，网络中的节点的剩余能量会变的越来越不均衡，为了平衡节点间的能量消耗，网络拓扑应该动态的进行调整以延长网络的生命周期，每个节点都知道自己当前的剩余能量，可以设定一个时间周期或者如果节点的能量低于某个限度时，如低于初始能量的30％，重新执行拓扑生成算法以平衡节点的负载，从而实现了势博弈的无线传感器网络拓扑控制。

经过上述步骤之后能够得到一个稳定的无线传感器网络拓扑结构。

本方法中所用到的定理和定义申明：

定理1：如果策略博弈Г＝<N，S，u>是序数势博弈且V是其序数势函数，则能够使其V 最大化的策略组合s^*就是博弈Г的一个纳什均衡。因此，如果我们能确定一个博弈的序数势函数，就可以通过求使其序数势函数最大值的一个策略组合即是其的一个纳什均衡。

定理2：帕累托最优(Pareto Optimal，PO)：如果对于任意的s∈S，策略向量s^*∈S满足那么策略向量s^*就是帕累托最优。

定义1：纳什均衡：一个策略组合是一个博弈Г＝<N，S，u>的一个纳什均衡，如果对于和一个博弈可能有不止一个均衡，或者根本不存在。一些类型的博弈至少存在一个纳什均衡。为了保证纳什均衡的存在性，D.Monderer and L.Shapley分析并研究了一类特殊的策略式博弈——势博弈(Potential Games)，这类博弈的最主要特点是其至少存在一个纳什均衡。

定义2：序数势博弈(Ordinal Potential Game,OPG)和序数势函数(Ordinal Potential Function，OPF)：一个策略博弈Г＝<N，S，u>是一个序数势博弈，如果存在一个函数V:S→R，对 $<mrow> <mo>&ForAll;</mo> <mi>i</mi> <mo>&Element;</mo> <mi>N</mi> <mo>,</mo> <mo>&ForAll;</mo> <msub> <mi>s</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> </mrow>$ 以及 $<mrow> <mo>&ForAll;</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mi>i</mi> </msub> <mi>V</mi> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>V</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>></mo> <mn>0</mn> <mo>&DoubleLeftRightArrow;</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>></mo> <mn>0</mn> </mrow>$ 函数V称为Г的序数势函数。

引理1：如果G_max是一个连通网络,DEBA算法收敛于能够保持网络G_max连通特性的纳什均衡状态。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李小龙;闵仲迁;邓昀;
技术所有人：桂林市华智信息科技有限公司;
我是此专利的发明人

上一篇：一种可移动的消防巡检柜的制作方法与工艺
上一篇：一种多跳通信系统及其节点的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。