Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

文档序号:7820673阅读:293来源:国知局
Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法
【专利摘要】本发明属于移动通信【技术领域】,实现了一种在VANET中利用路边停靠车辆进行庞大的多媒体服务的方法。其特征是利用了演化博弈理论构建解决了停靠车辆不合作的情况。首先本发明将系统模型分为两种。第一种是将停靠车辆看做单群体,即单群体演化博弈模型。第二种是将停靠车辆和即走车辆看做两个群体,即多群体演化博弈模型。然后通过演化博弈理论得出本发明的复制动态方程。最后通过改变相关参数证明本发明所提出的基于演化博弈的激励机制是成功的。本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的,通过分析论证都可以得到复制动态方程,解得进化稳定策略,并且分析了影响ESS的因素。
【专利说明】VANET中利用演化博弈来激励停靠车辆合作转发进行分析 建模的方法

【技术领域】
[0001] 本发明属于移动通信【技术领域】,涉及到在VANET (vehicle Ad Hoc Network,车联 网)中利用演化博弈理论的激励机制对路边停靠车辆的合作转发进行分析建模的方法。给 出了两种不同场景下构建演化博弈模型的方法,能够通过对成本和收益的分析论证,保证 路边停靠车辆都积极合作转发,为其余车辆提供多媒体服务。

【背景技术】
[0002] 在VANET中,通过RSU (Road Side Units,路侧单元)的设置来进行多媒体服务是 一种流行的方式,但是RSU设置花费较大,还有在RSU稀疏的情况下,延迟也是不容忽视的。 为此,研究人员通过基于V2V(Vehicle To Vehicle,车到车)的通信来进行多媒体服务,但 是VANET的这种高度移动性,间断性连接等独有的特点,使得这种方式也不稳定。因此利用 路边停靠车辆进行庞大的多媒体服务倍加引起重视,场景如图1所示。
[0003] 现阶段在VANET中对停靠车辆的研究主要存在的问题是着重研究怎么利用停靠 车辆或者是怎么管理停靠车辆进行多媒体的服务,假设停靠车辆都是积极合作的。而没有 考虑停靠车辆提供服务和接受消息都是要花费能量,正是这种花费可能导致车辆不合作。 也就是忽略了停靠车辆的自私性。例如:(1)在城市场景的VANET中,把停靠车辆看成是 静止的节点接入 VANET(Nianbo liu,Ming liu,"PVA in VANETs Stopped Cars Are Not Silent",2011,INF0C0M.)。(2) -种管理停靠车辆的集群方法(Nianbo liu,Ming liu,"The sharing at roadside Vehicular content distribution using parked vehicles,',2012, INF0C0M.)。(3)路边停靠车辆的一个应用,利用路边停靠车辆及时发现在拐角处,被障碍物 挡住的车辆,有效的防止交通事故的发生(Huibin Feng, Shunyi Zhang, Chao Liu, Junrong Yan, Ming Zhang, "P2P Incentive Model On Evolutionary Game Theory",2008,WiCOM.)。


【发明内容】

[0004] 本发明要解决的问题是在城市允许停靠车辆的道路中,在服务不对称的情况下, 通过演化博弈的方法,提出激励机制,激励停靠车辆合作转发,从而实现所有停靠车辆都提 供多媒体服务。
[0005] 本发明的技术方案如下:
[0006] 通过对路边停靠车辆的场景分析,得出此场景符合演化博弈的基本特征:第一停 靠车辆并不固定,它是随着时间变化的一个群体。第二影响停靠车辆选择合作的因素并不 唯一,同时通过演化过程可以达到一定的规律性。第三是停靠车辆的选择过程,具有一定的 惯性,也就是说通过博弈,当多次选择合作的时候,以后都会合作。所以这里我们采用演化 博弈的方法,来分析影响合作因素的激励机制。本专利将影响合作因素归为两大类,一为成 本,包括电量消耗、电瓶损耗等。二为收益,包括个人声誉值、出行满意度等。通过对成本收 益的演化分析来激励停靠车辆积极合作。
[0007] 本发明的具体步骤如下:
[0008] 分为两种情况:第一种是停靠的车辆在一定时间内是静止的,也就是把停靠车辆 看成是密集、廉价、少资源的类似RSU。第二种是有些停靠车辆是在一定时间内静止不动的, 但是还有一部分车辆是即走的。
[0009] 在这两种情况下,对第一种情况我们利用单群体的演化博弈(SCEGT)激励机制, 来激励停靠车辆的合作;对第二种情况我们利用多种群的演化博弈,其中停靠的车辆为一 个种群,即走的车辆为另外一个种群,提出一种多群体的演化博弈(MCEGT)激励机制,激励 其合作。
[0010] 模型描述:
[0011] A系统模型
[0012] 在VANET中,常常研究的是V2V以及V2R (Vehicle To Rode Side Unit)这两种通 信方式。常把VANET看作是车辆集合的网络,每辆车辆配备有通信设备,允许不同车辆间的 基于802. Ilp协议的通信。本发明中主要考虑的是V2V的通信。特别地,是在城市中,允许 停车的道路的场景下,移动车辆和停靠在路边的车辆之间的通信。有两种通信模型:
[0013] 第一种情况:路边停靠车辆是在一定时间内一直停靠。当车辆Vs要传递大的多媒 体文件给车辆Vd。Vd不在Vs的传输范围内,并且道路上也没有移动的车辆可以作为中间 节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发 给停靠的车辆3, 4, 5, 6, 7,如图2所示。然后当车辆Vd通过这些拥有资源的停靠车辆时,就 会从这些车辆上下载自己满意的多媒体资源,如图3所示。
[0014] 第二种情况:路边停靠的车辆有的是长时间停靠的,有的是即走的。如图2所示, 当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内,并且道路上也没有 移动的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车 辆Vs将多媒体资源分发给停靠的车辆3, 4, 5, 6, 7。当车辆Vd正在下载车辆6上的资源时, 有停靠的车辆3要离开停靠车辆团体,那么它就会把Vs传递给自己的多媒体服务,移交给 停靠的邻居车辆2,然后离开,如图4所示。当车辆Vd往前行驶,在从车辆2上下载所有的 多媒体资源,如图5所示。
[0015] 停靠的车辆,虽然速度为0,但是内置的无线设备是开放的,可以允许所有路过车 辆接入。并且有充足的电源,使得停靠的车辆能够跟所有经过他的车辆进行通信。在城市 场景的VANET中,大量的停靠车辆,使得车与车之间资源传输的有效性和传输成功率大大 提1?。
[0016] B、演化博弈模型
[0017] Smith结合了博弈理论中分析的动态演化过程来研究复杂系统,并首次提出了演 化博弈,同时他提供了一个工具来解释个体的组织关系。定义G= {I,S,}是基本的演化 博弈模型,其中I表示参与者集合,S表示参与者策略集合,表示参与者效用函数集合。 演化博弈理论关键的概念是ESS。如果y尹X G S,存在孓e(0,l),满足等式:
[0018] u[x, e y+(l- e )x] > u[y, e y+(l~ e )x]
[0019] 这里c e ^) x就是这个模型的ESS。
[0020] 演化博弈论的核心理论有两个:即演化稳定策略、复制者动态方程。演化稳定策略 强调一个动态演化系统达到稳定状态的过程,演化稳定策略X*需要满足如下两个条件:第 一,X' = Q (x*) =0 ;第二,Q'(x*) <06。复制者动态方程描述采取变异的频数关于时间t 的一个动态微分方程。用Xi' = [(J5 (XpX)-(J) (x,x)] Xi来表示复制者动态方程,其中Xi (t) 采取纯策略的人占总人数的比例,$ (Xi, X)为策略i的适应度,Cj5 (x,x)为平均适应度(JW ffeibull, "Evolutionary game theory,,'MIT press, 1995. ) 〇
[0021] 下面介绍演化博弈理论的标准设置(Sandholm, W. H. Population Games and Evolutionary Dynamics[M]. Forthcoming, MIT Press, Cambridge, 2008.):
[0022] (I)有一个用户的种群。种群中的用户数量很大。
[0023] (2)假设有有限的纯策略或行为。种群的每个成员从同一个策略集合A = {1,2,...,1}中选择策略。
[0024]

【权利要求】
1. 一种VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法,其特征 在于以下步骤, 一、 分成两种情况 第一种是停靠的车辆在一定时间内是静止的;对第一种情况用的是单群体的演化博弈SCEGT激励机制,来激励停靠车辆的合作; 第二种是有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是即走的; 对第二种情况用的是多种群的演化博弈,其中停靠的车辆为一个种群,即走的车辆为另外 一个种群,提出一种多群体的演化博弈MCEGT激励机制; 二、 模型的建立 A、V2V的通信模型 第一种:路边停靠车辆是在一定时间内一直停靠;当车辆Vs要传递大的多媒体文件给 车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆作为中间节点传输,则利 用道路旁边停靠的车辆协助多媒体服务,车辆Vs将多媒体资源分发给停靠的车辆;然后当 车辆Vd通过这些拥有资源的停靠车辆时,就会从这些车辆上下载自己满意的多媒体资源; 第二种:路边停靠的车辆有的是长时间停靠的,有的是即走的;当车辆Vs要传递大的 多媒体文件给车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆以作为中间 节点传输;那么就利用道路旁边停靠的车辆协助多媒体服务;车辆Vs将多媒体资源分发给 停靠的车辆;当车辆Vd正在下载车辆上的资源时,停靠车辆要离开停靠车辆团体,它就会 把Vs传递给自己的多媒体服务,移交给停靠车辆的邻居车辆,然后离开;当车辆Vd往前行 驶,在从车辆2上下载所有的多媒体资源; B、 演化博弈模型 定义G= {I,S, 3i}是基本的演化博弈模型,其中I表示参与者集合,S表示参与 者策略集合,n表示参与者效用函数集合;如果y尹XGS,存在£(0,1),满足等式: u[x,ey+(l-e)X] >u[y,ey+(l-e)X],se(〇,(v),X就是模型的ESS; 演化博弈论的核心有两个:即演化稳定策略、复制者动态方程;演化稳定策略x*需要 满足如下两个条件:第一,x' =Q(x*) = 0 ;第二,Q'(x*) < 06 ;复制者动态方程描述采 取变异的频数关于时间t的一个动态微分方程;用Xi' =[小〇^3-小〇^^)]\来表示复 制者动态方程,其中Xi(t)采取纯策略的人占总人数的比例,$ (Xi,x)为策略i的适应度, 小(X,X)为平均适应度; 演化博弈论的标准设置是: (1) 有一个用户的种群;种群中的用户数量很大; (2) 假设有有限的纯策略或行为;种群的每个成员从同一个策略集合 A= {1,2,...,1}中选择策略; (3) 设{(只,…,少,)|乃
为纯策略集合I上的概率分布集合;M可以解 释为混合策略集合;事实上,假设从种群中随机选择出的用户:使用标记策略的参与者遇 到使用策略j的参与者的概率是5^ ;几个博弈过程以后,对于使用j的参与者等价于面对使 用混合策略(y。...,的参与者。
2.根据权利要求1所述的方法,其特征在于, (一)单群体的演化博弈(SCEGT)激励机制如下: A. SCEGT模型 第一种情况,停靠的车辆是长时间不移动的;在每个固定的slot中,随机选择配对,策 略空间是{〇, 1},策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服 务,同时从他们那下载自己感兴趣的资源;策略1表示停靠车辆只从其他车辆上下载自己 喜欢的资源,不服务路过车辆或者停靠车辆; 设每个节点提供一个单元的多媒体服务得到的车辆收益是P,成本是d;而每个节点接 收其他车辆的每个单元多媒体资源的收益是R,需要的成本是c ;其中,P>R,d>c;单团体中, 路边停靠的车辆没有迁移发生,每个车辆都是接收一个单元资源,也是提供一个单元的多 媒体服务;根据演化博弈规则,参与者j的收益矩阵如下:
定义Y〇 (t)表示团体中选择策略0的节点数目;Yi(t)表示团体中选择策略1的节点 数目;如公式⑴所示, y(t) =y〇(t) +y:(t) (1) 定义
表示团体中选择策略〇的比例,团体中选择策略1的比例就是 1-X(t); 根据博弈矩阵,选择策略〇的期望收益如公式(2)所示: U0(t) =x(t)*(R+P-c-d) + [l-x(t)]*(P-d) (2) =x(t)*(R-c)+P_d 选择策略1的期望收益如公式(3)所示: (t) =x(t) * (R-c)+ [l_x⑴]*0 (3) =x(t)*(R_c) 整个团体的平均收益如公式(4)所示:
B. 动态复制分析 每个阶段博弈是从kt,kGN开始,在(k+1)t,kGN结束;节点的平均收益是与博弈对 手有关的;设在一个很小的时间间隔e中,只有e部分参与博弈;在时间t+e时的复制动 态方程如公式(9)所示:
复制动态方程,如公式(10)所示:
在SMEGT激励机制作用下,ESS是存在的,并且只有一个进化稳定的策略; 本模型中存在ESS,x*(t) = 1,并且是唯一的ESS; (二)多群体的演化博弈(MCEGT)激励机制如下 A、MCEGT模型 系统模型中的第二种情况,有些停靠车辆是在一定时间内静止不动的,但是还有一部 分车辆是随时开走的; 因为车辆是移动的,那么两个车辆之间的连接时间服从指数分布,其参数A>0,那么 在时间T内,两个车辆连接的概率为1-QT,其中qt如公式(11)所示: QT = (1+AT)e…(11) 假设团体Popl和团体P〇p2的节点数量分别是m和n;考虑各个团体的车辆在平面的 分布都服从泊松分布,参数是Y>0;那么在一次演化博弈过程中,存在n个车辆的概率如 公式(12)所示:
团体1 (用P〇Pi表不)中都是停靠的车辆,P〇Pi的策略空间是Pie {〇, 1};因为考虑两 个团体的博弈,那么演化博弈是在车辆离开时开始的;在这里P〇Pi要与单团体的时候策略 有变化;策略0表示接受离开车辆移交的资源;策略1,不接受离开车辆的移交资源;团体 2(用pop2表示)包含的是即走的车辆,pop2的策略空间是p2G{〇, 1};策略〇代表离开时 移交资源给相邻车辆;策略1代表车辆离开,车辆自私,不把资源移交给相邻的车辆;每个 节点下载和提供服务都是需要成本的;因为车辆在停靠的时候,无线设备等开放是靠电量 支持的;假设每个离开节点移交一个单元的多媒体服务得到的收益是P,需要成本是d;而 每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要成本c;假设每个车辆上携 带一个单元的资源; 因为在两个团体之间不存在竞争;在popl中,如果其中的节点采取策略0,那么它得到 收益的概率如公式(13)所示:
同理,在p〇p2中,节点采取策略0的收益概率如公式(14)所示:
其中a= 1-QT ; 在popl中每个博弈参与者选择策略0的概率是X,在pop2中博弈参与者选择策略0的 概率是y;W表示团体n在选择策略S时的期望收益;那么在popl中选择策略0的个体的 收益可以用公式(15)计算:
同理,在pop2中选择策略0的个体期望收益计算如公式(16)所示:
在两个团体中,个体选择策略1的收益定义为:W(.y..v') = 0,以(.^) = 0 在popl中,采用策略〇的节点比例是x,采取策略1的节点比例是1-x,那么团体的平 均效用函数如公式(17)所示:
同理,团体P〇p2的平均效用函数如公式(18)所示:
B.复制动态分析 演化博弈的复制动态方程用公式(19)表示:
【把代入G】那么两个团体的复制动态方程为公式(20):
把公式(15) (16)带入公式(20)整理得公式(21):
用一个
表示popl的稳定演化策略ESS; 在pop2中,用
.来表示p〇p2的稳定演化策略ESS; 在MCEGT激励机制中,两个团体都有一个稳定的ESS,如公式(26)所示:
【文档编号】H04L29/08GK104408306SQ201410683430
【公开日】2015年3月11日 申请日期:2014年11月24日 优先权日:2014年11月24日
【发明者】吴迪, 赵鑫 申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1