基于信誉系统和Stackelberg博弈的可信P2P流媒体带宽定价方法与流程

文档序号:12673791阅读:244来源:国知局
基于信誉系统和Stackelberg博弈的可信P2P流媒体带宽定价方法与流程

本发明涉及一种P2P流媒体带宽定价方法,尤其涉及一种基于信誉系统和Stackelberg博弈的可信P2P流媒体带宽定价方法。涉及专利分类号H04电通信技术H04L数字信息的传输,例如电报通信H04L29/00H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统H04L29/02通信控制;通信处理H04L29/06以协议为特征的H04L29/08传输控制规程,例如数据链级控制规程。



背景技术:

P2P通信技术因其良好的扩展性和灵活性,被广泛应用于文件共享,流媒体等网络应用中。P2P系统的稳定运行依赖于节点之间的合作。然而,P2P系统的基本准则是“尊重网络中理性个体的选择”[1],因此理性的网络节点在无法获得长期的利益时,并不愿意将资源贡献给其他个体,这就出现了严重的“搭便车”问题,这种现象严重影响了P2P系统的性能。

激励机制是解决“搭便车”问题的重要手段。Haddi等人总结了许多激励机制。在这些机制中,基于积分的激励机制是最常用的一种。通常来说,在P2P流媒体中的积分机制中,节点通过共享带宽资源获取积分,付出积分来获取带宽资源。在这里,如何设定带宽的价格是一个关键的问题,不合理的价格会导致系统中的通货膨胀与紧缩现象。Kang等人首先提出了一种基于Stackelberg博弈的激励机制来获取最优的带宽价格和购买的带宽数。然而,这个模型并没有考虑节点的异质性,每个节点都要付出同样的单价,也就是说,无论节点之前是否积极共享过资源,都可以以同样的价格获取资源。这对于经常提供优质带宽服务的节点来说是不公平的。除此之外,由于P2P系统的开放性,系统常常会受到一些恶意攻击,特别是数据污染攻击。恶意节点借助分享带宽的机会,在网络中传播恶意数据块。因此,一个公平安全的定价策略是十分必要的。



技术实现要素:

本发明针对以上问题的提出,而研制的一种基于信誉系统和Stackelberg博弈的可信P2P流媒体带宽定价方法,具有如下步骤:

—定义系统内部每一个节点可同时作为带宽提供者的服务器和服务的请求 者;初始化定义所述节点拥有的积分/虚拟货币数ci、最大下载带宽di以及最大上传带宽ui和为每个请求者分配的单位价格;

—使用Stackelberg博弈描述交易过程,定义博弈的先动方为服务节点,确定价格;博弈的后动方为请求服务节点,确定需求带宽;

假设一个服务节点k为|S(k)|个节点(S(k)为服务的节点集合)服务,假设对每个个体的定价用向量表示为:

其中,为个体k的最优价格向量,为个体k对个体i的最优单位价格;

每个请求节点根据价格请求的带宽用向量表示为

其中,为请求者带宽请求向量,xi为个体i请求的带宽数;

—对每个个体的定价为:

tki为个体i对个体j的信誉值;

对每个请求者的策略

其中Si为个体i的满意度,如果在一次交易中,个体i能够获得的带宽越接近最大带宽di那么个体i对这次交易就越满意;个体ciSi表示在一次交易中个体愿意付出的最大积分。

作为优选的实施方式,所述的节点i对节点j的信誉值tij

tij=(1-γ)Dij(t)+γIij(t)

其中,Dij(t)个体i对个体j的直接信任值,lij(t)个体i对个体j的间接信任值;γ为调节直接信任和间接信任的权重;

直接信任值得计算如下式所示,提供高质量数据块和总服务数 的比值;

当二者之间没有交互时,将直接信任值置为0.5;

间接信任体现的是网络中其他节点对该节点的看法,通过询问和两个节点都有过交互的第三方节点得到,具体计算方式如下式所示。

作为优选的实施方式,给定一个带宽定价μki,个体i购买带宽的最优数量由下式给出。

更进一步的,设定一个带宽服务节点k为|S(k)|个节点提供带宽服务;按照如下阈值顺序对所有请求者进行排序:

如果则,最优的价格为此时所有请求者均请求最大带宽进而得到服务提供者k定价的取值范围。

作为优选的实施方式,对于任意服务节点k,满足条件的最优解如下:

其中

由于采用上述技术方案,本发明公开的一种基于Stackelberg博弈和信誉系统的定价方法,该方法可适用于P2P流媒体中一个节点作为带宽提供方,多个节点作为带宽服务请求方的应用场景。提供方根据请求方以往交互历史得到的信誉值,拥有的虚拟货币数以及最大的带宽等为每个请求放设定一个单位带宽价格,而请求方则根据这个价格决定自己购买的带宽数量,这就构成了一个Stackelberg博弈。该方法中的动态体现在不可信的节点需要付出的单位价格相对较高,这就保证了系统中交易的公平性。同时,采用Stackelberg博弈的方法建模可以确保带宽的提供方和请求方均能达到利益最大化。

附图说明

为了更清楚的说明本发明的实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明节点之间交易过程的示意图

图2为本发明对于污染攻击的预防效果示意图

具体实施方式

为使本发明的实施例的目的、技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:

如图1和2所示:

本发明主要考虑在P2P流媒体环境下基于积分的激励机制,系统中的每个节点即可以充当服务器(带宽的提供者),也可以作为服务的请求者。

本发明中,个体拥有的积分,最大下载带宽,最大上传带宽分别由ci,di和ui表示(详见表1)。

图1表示一个完整的交易过程。如图1所示,当一个交易启动后,请求者先选择一个最可信的节点请求带宽,并将自己的信息(ci,di)发送给该节点。服务提供节点k收到所有请求节点的信息后计算得到对每个节点的带宽单价μki。根据收到的单价信息,每个请求者决定自己请求的带宽(xi)。最后节点之间完成整个数据传输。

表1 符号定义

信誉管理模型,本发明为系统内的节点设置信誉,信誉管理模型主要用来帮助个体识别交互对象和好坏。本发明假设每个节点都存储一个对所有邻居节点的信誉表。信誉值tij是[0,1]区间的一个数值,其中0代表完全不可信,1代表完全可信,信誉值越大表示节点越可信。

本发明采用本地信誉管理模型,每个节点都要记录和自己有过交互的个体的信誉值。信誉的算法如下公式所示。

信誉的计算由两部分组成,即直接信任和间接信任。其中公式(1)中的参数γ用来调节直接信任和间接信任的权重,可以由系统的管理员根据系统的需求自行设定。

tij=(1-γ)Dij(t)+γIij(t)

直接信任体现了两个节点之间直接交互的历史。

直接信任值得计算如公式(2)所示,提供高质量数据块和总服务数的比值。

当二者之间没有交互时,将直接信任值置为0.5。

间接信任体现的是网络中其他节点对该节点的看法,通过询问和两个节点都有过交互的第三方节点得到,具体计算方式如公式(3)所示。

基于博弈论的定价策略

如图1所示为一次带宽服务的过程。

在一次交易中,服务请求方先将自己的虚拟货币数(ci)和最大的下载带宽(di)发给服务的提供方,提供方根据这些信息、信誉信息以及自己能提供的最大带宽(uk)计算为每个请求者的分配的单位价格,得到价格的请求者决定自己请求的带宽数。将这个过程用Stackelberg博弈描述:

博弈的先动方为服务节点(定价),后动方为请求服务者(确定带宽)。

假设一个服务节点k为|S(k)|个节点(S(k)为服务的节点集合)服务,假设对每个个体的定价用向量表示为

而每个请求节点根据价格请求的带宽用向量表示为

对于服务节点来说,希望在一次交易中获得最大收益,因此可以用公式(4)中的问题P1描述,即在一次交易中,得到的总的带宽收益最大

其中对每个个体的定价为

而对每个请求者来说,希望在一次交易中,花尽可能少的积分,即自己的余额最多,因此可以用公式(5)表示。

其中Si为个体i的满意度,Si的计算方式由公式(6)给出。如果在一次交易中,个体i能够获得的带宽越接近最大带宽di那么个体i对这次交易就越满意。个体ciSi表示在一次交易中个体愿意付出的最大积分。

Stackelberg均衡

最优购买策略

在这一部分讨论每个服务请求者的最优购买带宽数,给出下面结论,对弈给定一个带宽定价μki,个体i购买带宽的最优数量由公式(7)给出。

当为公式(5)-(6)的拉格朗日函数,其中α和β为非负的对偶变量。因此公式(5)中的问题可以转化为其对偶函数求解原问题P1就相当于解其对偶问题minα>0,β>0q(α,β)。由于拉格朗日函数不能改变原函数的值,因此最优解必须满足KKT条件,如公式(8)-(10)所示。

令可以得到

从公式(11)可以解得

假设当时,

那么从公式(9)中可知α=0。因此公式(12)可以改写为

根据假设可以得到

由于β≥0,可以得到与我们的假设矛盾。因此从公式(9)可以得到

同理,可以计算得出其他区间的最优值,如公式(7)所示。

最优定价策略

假设一个带宽服务节点k为|S(k)|个节点提供带宽服务。为了求解方便,我们按照如下阈值顺序对所有请求者进行排序。

如果即可得到最优的价格为

此时所有请求者均请求最大带宽因此,我们后面要求解更一般的情况,

首先我们给出如下结论:服务提供者k定价的取值范围,即定价策略的范围

如果

那么对于任何一个请求者来说,xi=0,此时服务者没有收益,因此 如果那么这与公式(4)中的条件 矛盾,因此

在定价策略的范围后,最优的定价策略如下:

对任意一个服务节点k,问题P1(公式(4))的最优解如公式(14)所示。

其中

为了更好的求解问题P1,分3种情况分别求解。

情况1:每个请求者均请求带宽在这种情况下,我们可以得到P1的子线性规划问题如公式(15)所示。

求解这个线性规划问题可以得到最优解

可以构造与μ*相关的不等式

解得

由此可以得到情况1下的最优定价策略如公式(16)所示。

情况2:有K-1个请求者xi=di,另外(|S(k)-K+1|)个请求者此时可以得到下面的子问题,即

这种情况下可以得到

情况3:有K个请求者另外(|S(k)-K|)个请求者xj=0。

此时可以得到

将三种情况相结合可以得到定价策略的一般形式,即公式(14)。

Stackelberg均衡

根据前文最优化的求解过程。

该博弈模型的Stackelberg均衡为其中中的每个由公式(7)解得,μ*由最优解公式解得。

首先考虑服务提供者的收益。由于μ*为最优解,那么对于服务提供者k来说一定有

因此,可以得到同理将两个不等式结合,可以得到为该博弈的Stackelberg均衡。

对于给定的一个服务提供者k的最大上传带宽uk,该博弈的Stackelberg均衡是唯一的且是帕累托最优的。

当给定一个uk,在一次博弈中(ci,di)是确定的,则uk所在的区间就确定了,因此定价策略μ*就可以唯一确定。从另一方面,如果定价策略μ*确定了,那么根据个体i购买带宽的最优数量的计算公式,每个服务请求者的请求带宽也就可以唯一确定。因此,该博弈的均衡是唯一的。

现在考虑该均衡是帕累托最优的。通过观察得出,当时,服务的提供者总是可以得到最优值。如果此时一个请求者提高了自己请求带宽的量,那么其他请求者必然要降低自己的请求量。根据帕累托最优的定义,任何一方都不能再不牺牲他人利益的情况下提升自己的收益,该均衡是帕累托最优的。

从上述分析可以看到,为了得到最优价格,服务提供者需要确自能提供最大带宽所在的区间。然而如果请求服务的个体数量比较大时,服务提供者需要计算的数值非常多,因此为了更好的在计算机环境中更快的计算出定价的最优解,我们提出了一种均衡求解算法,如算法1所示。

算法1的基本思想是服务提供者为了让收益最大化,那么尽可能要将自己所有的带宽分配出去。因此,服务提供者先设置一个最高的价格,得到请求者的反馈,不断降低自己的价格,直到将自己的带宽全部分配出去。根据前面的简单说明,这个博弈的Nash均衡是唯一的,因此当∈→0时,算法1得到的最优解和理论分析的结果是一致的。

实施例

模型的测试从三方面进行:算法的正确性、定价机制的公平性和抑制系统污染攻击的效果。

算法的正确性

本实施例首先验证算法的正确性。在实施例实验中模拟了1个服务提供者和三个请求者交易的过程,节点的性质表2所示。如表2所示,参数∈的取值从0.005到0.1。实验结果表明,随着∈的减小,计算得到的最优值越来越接近理论值。因此,算法1的正确性得以验证。

表2请求带宽与定价最优解

系统的公平性

在同样的环境下,本发明还验证动态定价机制的公平性。此时设∈=0.005。

如表3所示,在同质定价机制下,每个请求者付出的单位价格是相同的,而在动态定价机制下,好的节点可以花费更低的价格买到更多的带宽,好节点的满意度也有所上升,而恶意节点需要付出更多的代价才能得到带宽。因此,

动态定价机制的公平性得以验证。

表3同质定价与动态定价对比

数据污染攻击的预防

为了验证机制对于普通污染攻击的抑制效果,本发明选择100个节点,平均度为4的无标度网络中进行模拟实验。每个节点最多可以服务[2,d]个节点,d为节点的度。其他参数表2所示。

我们主要与对比文件Kang X,Wu Y.Incentive mechanism design for heterogeneous peer-to-peer networks:A stackelberg game approach[J].IEEE Transactions on Mobile Computing,2015,14(5):1018-1030.

记载的模型进行比对,引文模型称为“noTrust”。如图2所示,没有信誉机制时,节点随机选择交互对象,因此恶意节点与好节点有同等的机会被请求和被服务。所以系统中恶意攻击的比例较大。引入了信誉系统的模型后,恶意节点能够被请求和被服务的概率都随着信誉值得降低而降低,因此,恶意攻击的比例就会下降。因此,无论系统中的恶意节点的比例有多少,引入的信誉机制与没有信誉机制相比,都可以较好的抑制系统中数据污染攻击。

本发明给出了一种动态的可信带宽定价机制。带宽的定价与个体的信誉值成反比,即信誉越好的节点需要付出的单位价格越低。

本发明从理论上得到了服务提供与请求双方的最优策略,证明了博弈模型的均衡及其唯一性。同时,提出了一种在计算机环境中可解得高效算法。通过模拟实验验证了算法的正确性,机制的公平性和抑制污染攻击的有效性。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1