一种基于群智感知网络的用户激励策略确定方法及系统与流程

文档序号:21543590发布日期:2020-07-17 17:49阅读:182来源:国知局
一种基于群智感知网络的用户激励策略确定方法及系统与流程

本发明涉及群智感知网络领域,特别是涉及一种基于群智感知网络的用户激励策略确定方法及系统。



背景技术:

随着群智感知网络的出现,人们可以携带智能设备从各地收集大量的数据。与传统的传感器网络相比,群智感知具有部署成本低、数据收集更具有多样性、数据收集后更容易维护等特点。由于群智感知是需要大量的普通用户主动收集数据并且乐于上传数据,对于用户来说,除了不可避免的会打扰日常使用智能设备进行工作和生活,也会给用户造成一些成本代价,比如能量和网络带宽的消耗。造成用户参与积极性低,不能获得最大的效用。



技术实现要素:

本发明的目的是提供一种基于群智感知网络的用户激励策略确定方法及系统,激励用户积极参与任务,提高用户参与积极性。

为实现上述目的,本发明提供了如下方案:

一种基于群智感知网络的用户激励策略确定方法,包括:

获取当前群智感知网络的感知平台的感知任务和感知区域;

根据所述感知任务和所述感知区域确定报名用户集;所述报名用户集为在所述感知区域内对所述感知任务感兴趣的用户;每个所述用户都携带智能设备传感器;

对所述报名用户集采用粒子群算法确定最优报名用户集;

获取所述最优报名用户集中每个用户的效用和感知平台的效用;

根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略;所述激励策略包括带宽策略、响应策略以及任务优先级策略。

可选的,所述对所述报名用户集采用粒子群算法确定最优报名用户集,具体包括:

对所述报名用户集采用粒子群算法确定虚拟点集合;

根据所述虚拟点集合以及所述报名用户集的覆盖率和信誉度确定最优报名用户集。

可选的,所述根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略,之后还包括:

根据所述最优报名用户集中每个用户对应的激励策略进行激励。

可选的,所述根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略,之后还包括:

获取所述最优报名用户集中每个用户的感知数据;

对所述感知数据进行数据质量评估,得到数据质量评估结果;

根据所述数据质量评估结果更新所述感知数据对应的用户的信誉度。

一种基于群智感知网络的用户激励策略确定系统,包括:

第一获取模块,用于获取当前群智感知网络的感知平台的感知任务和感知区域;

报名用户集确定模块,用于根据所述感知任务和所述感知区域确定报名用户集;所述报名用户集为在所述感知区域内对所述感知任务感兴趣的用户;每个所述用户都携带智能设备传感器;

最优报名用户集确定模块,用于对所述报名用户集采用粒子群算法确定最优报名用户集;

第二获取模块,用于获取所述最优报名用户集中每个用户的效用和感知平台的效用;

激励策略确定模块,用于根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略;所述激励策略包括带宽策略、响应策略以及任务优先级策略。

可选的,所述最优报名用户集确定模块具体包括:

虚拟点集合确定单元,用于对所述报名用户集采用粒子群算法确定虚拟点集合;

最优报名用户集确定单元,用于根据所述虚拟点集合以及所述报名用户集的覆盖率和信誉度确定最优报名用户集。

可选的,还包括:

激励模块,用于根据所述最优报名用户集中每个用户对应的激励策略进行激励。

可选的,还包括:

第三获取模块,用于获取所述最优报名用户集中每个用户的感知数据;

数据质量评估结果确定模块,用于对所述感知数据进行数据质量评估,得到数据质量评估结果;

用户的信誉度更新模块,用于根据所述数据质量评估结果更新所述感知数据对应的用户的信誉度。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明所提供的一种基于群智感知网络的用户激励策略确定方法及系统,根据采用粒子群算法确定最优报名用户集,使用户上传的感知数据覆盖率与可信度得到保证,从而使所提交的数据在感知区域覆盖面积更大、数据质量可信度更高;再根据所述最优报名用户集中每个用户的效用和感知平台的效用以及stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略,获得最大的效用,进而激励用户积极参与任务,提高用户参与积极性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所提供的一种基于群智感知网络的用户激励策略确定方法流程示意图;

图2为本发明所提供的一种基于群智感知网络的用户激励策略确定系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于群智感知网络的用户激励策略确定方法及系统,激励用户积极参与任务,提高用户参与积极性。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

群智感知网络主要由感知平台(server)和若干个参与者组成,对于参与者来说,有任务发布者和n个用户(user)。在给定的感知区域,任务发布者将感知任务上传给平台,然后将任务进行广播。该区域内存在一组用户对任务做出响应,首先对该组用户基于覆盖率和信誉度进行多目标选取最优用户集,然后用户上传感知数据并进行激励,最后根据感知数据的数据质量进行信誉度的更新。

图1为本发明所提供的一种基于群智感知网络的用户激励策略确定方法流程示意图,如图1所示,本发明所提供的一种基于群智感知网络的用户激励策略确定方法,包括:

s101,获取当前群智感知网络中感知平台的感知任务和感知区域。任务发布者向感知平台发布感知任务和感知区域,进而再通过感知平台获取感知任务和感知区域。

s102,根据所述感知任务和所述感知区域确定报名用户集;所述报名用户集为在所述感知区域内对所述感知任务感兴趣的用户;每个所述用户都携带智能设备传感器。

s103,对所述报名用户集采用粒子群算法确定最优报名用户集。

对所述报名用户集采用粒子群算法确定虚拟点集合。在群智感知区域内利用粒子群算法选择用户,每个用户都有自己的历史信誉度值和地理位置信息,首先随机选出满足区域覆盖率最大的m个虚拟点集,然后根据目标函数计算每个用户的目标函数值,最后由目标函数值在用户集u={u1,u2,…,un}中筛选最优的m个用户子集w={w1,w2,…,wm}。

筛选的用户数m与任务发布者r和用户集的代价有关其中αsum为用户集的能量单位代价的总和;βsum为用户集带宽单位代价的总和;为用户集在传输数据过程中最大能量和最小能量的均值;为用户集在执行任务过程中最大带宽和最小带宽的均值;μ1,μ2为系统参数。即

其中,在感知区域内随机选取覆盖m个虚拟点集,采用粒子群算法使所选的点集覆盖范围最大。粒子群算法流程为:

第一步:参数设置,随机初始化粒子群中粒子在解空间的速度和位置。

第二步:计算粒子适应度值,寻找个体极值和群体极值。

第三步:更新粒子群中单个粒子的速度和位置。

第四步:粒子适应度值计算。

第五步:更新粒子群中个体极值和群体极值。

第六步:判断是否达到最大迭代次数,否则跳到第二步;是则输出全局最优位置结束。

其中适应度为覆盖率f=s1/s;s1为虚拟点集覆盖的面积,s为感知区域的面积。根据上述步骤随机选出m个虚拟节点。

根据所述虚拟点集合以及所述报名用户集的覆盖率和信誉度确定最优报名用户集。

区域覆盖率:用户所感知的感知区域s占目标区域s的比例。

通过上述步骤在群智感知区域内选择了m个虚拟点集,我们将报名参加该任务的n个用户进行选择。已知每个用户的历史信誉度值和地理位置信息,设置每个虚拟点j与用户i的目标函数fij=a*ci+(1/dij)*b,选取每个虚拟点的目标函数最大的用户进而构成用户子集,其中a,b为权重因子;ci为用户i的历史信誉度值;dij为用户i与虚拟点j的欧式距离。通过目标函数在用户集中选出了基于覆盖率与信誉度的多目标最优用户子集,使用户在执行任务时数据质量与区域覆盖得到保证。

s104,获取所述最优报名用户集中每个用户的效用和感知平台的效用。

1)平台的效用

利用公式确定平台的效用。

其中λ1,λ2为系统参数,bi,ei分别为用户i选择使用的带宽策略和用户传输数据时使用的能耗。平台所获得的效用由两部分组成:从用户收集数据所获得的资源量的利润和为用户所付出的总成本r。函数反映了平台获得的收益随着用户感知水平的增加而增加;随着感知速率的增加而降低。

2)用户的效用

利用公式ui=fi-gi确定用户的效用。

其中fi为用户i选择的策略所获得的收益函数;gi为用户i选择的策略所获得的代价函数。fi、gi分别为gi=αiei+βibi。

其中,

对于用户来说,每个用户只希望最大化其自身的效用,除非有足够的激励措施,否则不会参与感知任务。用户的效用是由收益函数和代价函数构成,收益函数是由用户所使用的带宽和能量来构成,带宽是由用户所选择的策略,能量是由用户在传输感知数据时与平台的距离所决定;代价函数是由能量成本、带宽成本决定,αi,βi分别为用户i的能量、带宽的单位成本。

其中,用户i的能耗主要来自于感知任务过程中发送数据和接收数据能耗,在此能耗模型中忽略了用户使用的其他能耗,以下表达式表示发射和接收数据的能耗:

e(k,d)=k*eelect+k*εfs*d2,d≤d0

e(k,d)=k*eelect+k*εamp*d4,d>d0

其中,eelect表示在发送数据和接收数据单位长度数据的能耗;d是用户与平台之间的传输距离;d0是阈值;εfs和εamp分别代表自由空间模型和多径衰减模型的放大器功耗;k是发送或接收的数据长度。当发送节点和接收节点之间的距离小于d0时,采用自由空间模型,并且将发射功率衰减为d2;否则,采用多径衰减模型,传输功率指定为d4

一个用户执行任务的任务数量大于等于1,用户在执行任务时是需要时间成本的,不同任务的效用也不同,因此,将一个用户的所执行的任务进行建模。假设用户i具有k个任务,每个任务所需要的时间为{ti1,ti2,…,tik},效用为{ui1,ui2,…,uik},用户在执行任务期间一个设备只能执行一个任务。因此将用户i的k个任务进行优先级排列pil,此时用户在执行任务l所需要的总时间为包括执行前l-1个任务的时间和执行任务l的时间,确保自身的总效用最大化。其形式化描述和约束为

此时用户i的效用为

其中,γi为用户i的时间成本。每个用户都有一个自己的时间成本,用户i在接收的任务中通过设计优先级使k个任务的总效用最大。

s105,根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略;所述激励策略包括带宽策略、响应策略以及任务优先级策略。平台给定奖励r,用户选择激励策略,使平台与用户的效用最大化,用户根据最佳策略来完成任务。

将平台(server)和用户(user)之间的互动建模为一个领导者博弈和跟随者博弈组成的stackelberg博弈。在模型中,平台server为领导者,server的策略是宣布感知任务的总奖励r;用户user为跟随者,所有的user是理性的且自私的,因此根据server的策略寻求自己的最佳带宽来最大化自身效用,server进一步来调整自己的策略。在跟随者博弈中,user首先选择了最佳带宽策略使该任务的效用最大,user接收的任务数大于等于1,因此根据该任务的效用来寻找最大化所有任务的总效用的优先级。

在模型中,user和server都旨在调整寻求最佳带宽bi和总奖励r来最大化其自身的效用。考虑到如果获得负效用并将其bi设置为0,则没有一个理性的user会参与到感知过程中。

设计一种激励机制来激励更多的诚实user参与,以便获得高质量的感知数据,并且user和server都可以最大限度地发挥其效用。将会在下面分析激励机制的细节,由于该算法基于stackelberg博弈,因此需要证明nash均衡的存在性和唯一性,其中没有人可以改变策略来获得更多的利润。

1)跟随者博弈

感知平台宣布总奖励r,将r分为两部分,首先用户一旦参与了该任务,将r/2的奖励按照每个用户消耗的能量的权值进行分配;剩余r/2的奖励每个用户通过调整带宽来获得最大的收益。所有参与感知任务的用户集合为w={w1,w2,…,wm},用户的带宽策略集为b=(b1,b2,…,bm),b-i=(b1,b2,…,bi-1,bi+1,…,bm)表示不包括用户i的策略配置文件,因此b可以表示为b=(bi,b-i),用户i的效用

用户i选择了最佳带宽保证自己获得最大效用后选择该任务的优先级。每个用户的任务大于等于1,用户i的时间成本是固定的,此时用户i的效用函数为

假设用户i此时共接收k个任务,该任务为l,与用户i的其他任务集构成ti={t1,t2,…,tk}。每个任务相对应的优先级集合为p={pi1,pi2,…,pik},此时策略空间为p=(pi1,pi2,…,pik),p-l=(pi1,pi2,…,pil-1,pil+1,…,pik)表示除了任务l的其他任务的策略配置空间。用户i选择任务l的优先级使自己的所有任务的总效用最大。

纳什均衡(带宽策略):如果每个i满足ui(bi*,b-i*)≥ui(bi,b-i),则b*=(bi*,b-i*)是纳什均衡,其中bi≥0。

响应策略:给定b-i,如果该策略bi≥0时最大化ui(bi,b-i),则该策略是最佳响应策略,用ρi(b-i)表示。

纳什均衡(任务优先级策略)用户i选择任务l的优先级,如果uitocal(pl*,p*-l)≥uitocal(pl,p-l),则p=(pl,p-l)是纳什均衡,其中pl≥1。

纳什均衡确保了所提算法的稳定性,其中每个用户根据其他用户选择最佳带宽策略;根据该用户的其他效用选择最佳优先级。为了使自己的效用最大化,没有人能够更改其策略。

所提算法对于平台给定总奖励r,跟随者博弈有唯一的纳什均衡存在;

为了研究用户的最佳带宽策略,我们计算用户i的效用ui关于其带宽策略bi的一阶导和二阶导,得:

由上式可以得到,效用函数相对于user的带宽策略是凹的,因此,给定平台r,最优策略是唯一的。

令一阶导为0,则

上式bi*为正时,该带宽为此用户的最佳响应策略。如果bi*为负,则表明user不参与感知任务,此时,该user休眠。

当给定的server宣布总奖励r时,该算法由参与的user执行。

2)领导者博弈

对于server给出的每个r,已经证明了所有参与的user都有一个唯一的纳什均衡带宽策略配置文件。在领导者博弈中,证明server可以通过调整r来最大化其效用。

基于stackelberg博弈中激励机制算法可以收敛到唯一且稳定的纳什均衡。

可以进行证明。

通过w中所有参与者可以消除i并获得以下公式

进而得到

将上式代入平台效用函数中,得

求平台效用函数的二阶导数,得

其中,

在s105之后还包括:

根据所述最优报名用户集中每个用户对应的激励策略进行激励。

获取所述最优报名用户集中每个用户的感知数据。

对所述感知数据进行数据质量评估,得到数据质量评估结果。把用户上传的感知数据的数据质量视为用户完成任务质量的体现,为每个用户wi估计一个质量评估矩阵ewi,并通过函数qi=g(ewi)将质量评估矩阵映射为该感知数据的数据质量。将感知数据的读取分为m个离散区间,表示为集合d={d1,d2,…,dm},落在不同的区间来估计用户的数据质量。质量评估矩阵ewi是一个m×m的矩阵,元素r=1,2,…,m,s=1,2,…,m。

用em算法来估计每个用户的质量评估矩阵ewi,给定一组感知数据s、一组缺少真实区间指标的p、概率矩阵e和概率密度函数f,则概率矩阵e为l(e;p,s)=f(p,s|e)。为了找到e的极大似然估计,em算法迭代地运行以下两个步骤直至收敛(假设用户wi迭代了t次后的概率矩阵e的当前值为)

e-step:根据当前e的估计值,针对给定观测值s的p的条件分布,计算似然函数的期望值,

m-step:寻找使期望函数最大化的估计

迭代e-step和m-step直至估计值达到收敛。具体步骤如下:

第一步:对于每个任务t∈t,用户的感知数据dtk落入真实区间dj时的指标函数i(dtk=dj)=1,,真实噪音区间的概率分布被初始化为

第二步:估计感知概率矩阵的似然函数,表示迭代了t次后的值,

真实的噪音区间分布估计为

第三步:估计真实噪音区间:给定感知数据s,努力矩阵e和噪音区间分布π,用贝叶斯推理估计真实的噪音区间p。我们根据以下公式计算真实噪音区间分布:

第四步:收敛。迭代步骤2-3,直至两个估计值收敛,即ε>0,η>0。根据对质量评估矩阵ewi的估计可以映射函数获得wi的感知数据的质量。设置qi=g(ewi)=σrerrwi/m,根据任务t的真实噪音区间pt={p1t,p2t,…,pmt},传递的区间dk*=argmaxkpkt

根据所述数据质量评估结果更新所述感知数据对应的用户的信誉度。使用户在以后的任务中更好的接收任务,提高用户的可信度。用户将感知数据上传后,平台根据数据质量做归一化并将信誉度化为[0,5],即本次任务的信誉度crei=5qi/qmax,其中qmax是本次任务数据质量最高的用户的值。用户进行本次信誉度评定以后进行信誉度更新crei′=(ocre0+crei)/(o+1),其中o为用户参与的历史任务次数,cre0为参与者历史信誉度值。

激励分配

用户将感知数据上传后,server将分配给用户报酬,平台发布总奖励r,根据激励机制算法中用户所获得的最终报酬为

当用户选择最佳带宽时,此时用户不参与此次任务即用户的报酬rewardi=fi=0。

图2为本发明所提供的一种基于群智感知网络的用户激励策略确定系统结构示意图,如图2所示,本发明所提供的一种基于群智感知网络的用户激励策略确定系统包括:第一获取模块201、报名用户集确定模块202、最优报名用户集确定模块203、第二获取模块204和激励策略确定模块205。

第一获取模块201用于获取当前群智感知网络的感知平台的感知任务和感知区域。

报名用户集确定模块202用于根据所述感知任务和所述感知区域确定报名用户集;所述报名用户集为在所述感知区域内对所述感知任务感兴趣的用户;每个所述用户都携带智能设备传感器。

最优报名用户集确定模块203用于对所述报名用户集采用粒子群算法确定最优报名用户集。

第二获取模块204用于获取所述最优报名用户集中每个用户的效用和感知平台的效用。

激励策略确定模块205用于根据所述最优报名用户集中每个用户的效用和感知平台的效用集,采用stackelberg博弈的激励机制确定所述最优报名用户集中每个用户的激励策略;所述激励策略包括带宽策略、响应策略以及任务优先级策略。

所述最优报名用户集确定模块203具体包括:虚拟点集合确定单元和最优报名用户集确定单元。

虚拟点集合确定单元用于对所述报名用户集采用粒子群算法确定虚拟点集合。

最优报名用户集确定单元用于根据所述虚拟点集合以及所述报名用户集的覆盖率和信誉度确定最优报名用户集。

本发明所提供的一种基于群智感知网络的用户激励策略确定系统还包括:激励模块、第三获取模块、数据质量评估结果确定模块和用户的信誉度更新模块。

激励模块用于根据所述最优报名用户集中每个用户对应的激励策略进行激励。

第三获取模块用于获取所述最优报名用户集中每个用户的感知数据。

数据质量评估结果确定模块用于对所述感知数据进行数据质量评估,得到数据质量评估结果。

用户的信誉度更新模块用于根据所述数据质量评估结果更新所述感知数据对应的用户的信誉度。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本发明中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1