一种激励方法

文档序号:10655679阅读:173来源:国知局
一种激励方法
【专利摘要】本发明提供了一种激励方法,基于平台发布激励地图为不同监测位置制定用户上传测量值可获得的收益,在每次迭代过程中,用户根据平台当前发布的激励地图主动地进行感知,然后平台依据收集到的测量值决策下一次迭代的激励地图,从而提高了数据监测结果准确性的前提下降低了平台支付给监测用户的开销,本发明的激励方法应用污染物在整个监测区域内分布的规律,基于平台部分位置的测量值估计出监测区域内所有污染源的位置和污染排放效率,从而准确推测出未收集到测量值的位置的污染情况,从而大大降低平台的支出。
【专利说明】
-种激励方法
技术领域
[0001 ]本发明设及群智感知技术领域,特别设及一种激励方法。
【背景技术】
[0002] 随着科学技术的发展,人类生活越来越现代化。与此同时,城市中的空气污染问题 也日益成为一个严峻的问题,尤其是在如中国的发展中国家。长期暴露在超标的空气污染 中会导致一些疾病的高发,如呼吸道感染和肺癌等。为了解决运个问题,一些城市通过建造 一些固定的测量站点尝试对空气污染浓度进行监测。然而,测量站点的数目极大地受限于 有限的±地资源和昂贵的维护费用,导致在城市范围内难W获得细粒度的空气污染情况。 比如,整个北京市只有22个测量站点。随着如智能手机等移动传感设备的大规模普及,群智 感知技术得到了极大的发展和促进,为在城市范围内收集感知数据提供了新的思路和前 景。一个基于群智感知的空气污染监测系统可W通过在云端搭建一个发布任务和收集数据 的平台,激励分布在不同地点的智能手机协同工作,达到监测城市空气污染的目标。尽管目 前智能手机上还未集成测量空气质量的传感器,幸运的是可W将多种测量不同污染气体 (如PM2.5,N0,C0等)的传感器的集成在一个便携的PCL板上,并通过蓝牙将数据传给手机, 进而上传到平台上。此外,在不久的将来,在手机硬件上集成运些传感器也将成为现实。最 近,一些科研工作已经致力于开发基于群智感知的空气污染监测系统。但运些工作大都关 注如何制作便携的感知设备或开发手机客户端。
[0003] 对于一个群智感知系统而言,设计一个有效的激励机制是非常关键的。一方面,智 能手机在参与感知任务的过程中消耗了一些资源,如电量、网络带宽等。所W,大部分用户 期待通过完成感知任务来获得一定的经济上的收益。另一方面,从平台的角度来看,数据收 集方希望在保证感知数量和质量的前提下,尽可能地减少因为支付给用户的奖励而带来的 开销。为了获得城市中细粒度的空气污染数据,平台通常需要收集大量位于不同地理位置 的感知数据,从而造成较大的开销。现有的激励机制通常考虑如何用最低的奖励来获得位 于某一个位置上的感知数据,从而降低平台的总开销。

【发明内容】

[0004] 本发明的目的在于提供一种激励方法激励方法,W解决现有技术中群智感知系统 获取感知数据,平台的总开销较高的问题。
[0005] 为解决上述技术问题,本发明提供一种激励方法激励方法,适用于群智感知系统 感知污染数据,所述激励方法包括:
[0006] 若干迭代过程,每次迭代过程均执行W下步骤:
[0007] 平台发布激励地图,所述激励地图包括若干方格,每个方格的位置代表监测区域 中的不同监测位置,每个方格内存储有用户上传测量值可获得的收益,所述测量值为污染 物的浓度的大小;
[000引平台根据部分格子内收集到测量值,对监测区域内所有污染源的位置和污染排放 效率进行估计,若估计结果收敛,则当前迭代结束;否则,继续执行下一步骤;
[0009] 从没收集到测量值的格子中挑选部分方格,并为所挑选的方格更新所述激励地图 中记载的收益数值。
[0010] 可选的,在所述的激励方法中,平台利用压缩感知技术对监测区域内所有污染源 的位置和污染排放效率进行估计。
[0011] 可选的,在所述的激励方法中,平台通过交叉验证的方法判断估计结果是否收敛。
[0012] 可选的,在所述的激励方法中,用户参与群智感知系统的感知任务的行为模型如 下:
[0013]
[0014] 其中,Xs表示用户S是否参与感知任务的随机变量,若激励小于用户的开销,贝化S 取值0,反之,贝化S取值1。
[0015] 可选的,在所述的激励方法中,激励地图中污染物包括:室内的污染物和室外的污 染物,室内的污染物的浓度和室外的污染物的浓度均服从正态分布。
[0016] 可选的,在所述的激励方法中,一方格内污染物的浓度为所有污染源排放的污染 物经过传播在当前方格内的叠加值。
[0017] 可选的,在所述的激励方法中,不同的污染源位于相同或不同的方格内。
[0018] 在本发明所提供的激励方法中,基于平台发布激励地图为不同监测位置制定用户 上传测量值可获得的收益,在每次迭代过程中,用户根据平台当前发布的激励地图主动地 进行感知,然后平台依据收集到的测量值决策下一次迭代的激励地图,从而提高了数据监 测结果准确性的前提下降低了平台支付给监测用户的开销,本发明的激励方法应用污染物 在整个监测区域内分布的规律,基于平台部分位置的测量值估计出监测区域内所有污染源 的位置和污染排放效率,从而准确推测出未收集到测量值的位置的污染情况,从而大大降 低平台的支出。
【附图说明】
[0019] 图1是本发明一实施例的激励方法的迭代过程的流程图。
[0020] 图2是本发明一实施例污染物传播模型的示意图。
【具体实施方式】
[0021] W下结合附图和具体实施例对本发明提出的激励方法作进一步详细说明。根据下 面说明和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的 形式且均使用非精准的比例,仅用W方便、明晰地辅助说明本发明实施例的目的。
[0022] 首先,为空气污染在地理位置上的分布建模。为了表征细粒度的空气污染分布,我 们虚拟地将整个监测区域划分成大小相等(如200米*200米)的小方格,用n表示格子的数 目,并近似认为一个格子内的污染物的浓度是相同的,表示为Cl, 平台最终所需的 监测结果即为每个格子内的污染物的浓度C= {Ci,…,Cn}。本实施例中,假设污染物来源于 监测区域内的k个污染源,污染源的污染排放速率表示为Q= {Qi,…,Qk}。假设每个污染源位 于不同的格子内(当然不同的污染源也可位于相同的方格内),并且污染源的数目是远远小 于方格的数目,即k?n,每个格子的污染排放速率由向量g={gl,…,gn}T表征,则有
[0023]
[0024] 考虑一个格子内污染物的浓度是不同的污染源排放的污染物经过传播在运个方 格内的畳加,从而有
[0025]
,
[0026] 其中Q是转换矩阵,Q U表示位于格子内的污染源对格子j内污染物的浓度的影 响。
[0027] 如附图2所示,本实施例中采用污染传播模型是高斯模型,该模型主要考虑风向和 风速对污染物传播的影响。已知污染源的位置和风向,任一位置的污染物的浓度C可W根据 W下公式计算出来:
其中,Q是污染排放速率,V是风速,d是监测 点与污染源在垂直风向的方向上的距离。a和e是常数。根据运个传播模型,我们可W计算出 转换矩阵Q,3
如果格子j在格子i的顺风方向上。
[0028] 然后,为用户参与感知的行为建模。本发明考虑用户是理性的,当且仅当完成一个 感知任务所获得的收益大于其消耗的资源所引起的开销时,用户才会参与感知,用户参与 群智感知系统的感知任务的行为模型如下:
[0029]
其中,Xs表示用户S是否参与感知任务的随机变量,若激励小于用户的开 销,贝化S取值0,反之,贝化S取值1。对一个用户而言,开销的大小取决于许多因素,如当前剩 余的能量和网络的连接情况等。因而完成同一个任务,不同的手机会有不同的开销,且运个 信息对平台而言是未知的。为了研究奖励的大小对用户参与行为的影响,假设每个用户的 开销CS满足在kmin,Cmax]之间随机均匀分布,其中Cmin和Cmax分别是Cs的下界和上界。给定奖 励(即用户获得的收益),用户S是否会参与感知的概率分布可W表示为:
其中P = Pr (Xs=I) =Pr(Cs^r)假设用户在格子内上传一 , 份感知数据(即污染物的浓度的测量值)获得的收益是ri,不同的格子可W设定不同的奖励 R = {。,…,rn}。若用Yi表示给定Tl,格子i内能收集到的测量值的个数,则有
因此,在格子i内收到丫 1个测量值的概 :>
[0030] 最后,根据上述模型,本实施例中激励方法包括若干迭代过程,请参考图I,其为本 发明的激励方法的迭代过程的流程图,每次迭代过程均执行W下步骤:
[0031] 首先,执行步骤SI,平台发布激励地图R= {ri,…,。},所述激励地图包括若干方 格,每个方格的位置代表监测区域中的不同监测位置,每个方格内存储有用户上传测量值 可获得的收益,所述测量值为污染物的浓度的大小;W i格子为例,ri表示格子i内存储的收 益,
表示格子i内收集到的测量值(即感知的污染物的浓度的数据), 丫 1表示格子i内收集到的测量值的数目。
[0032] 接着,执行步骤S2,平台根据部分格子内收集到测量值,对监测区域内所有污染源 的位置和污染排放效率进行估计,若估计结果收敛,则当前迭代结束;否则,继续执行下一 步骤;其中,平台利用压缩感知技术对监测区域内所有污染源的位置和污染排放效率进行 估计,平台通过交叉验证的方法判断估计结果是否收敛。
[0033] 例如,根据i格子内收集到的测量值,得到若干个格子的污染物浓度估计值
。由于室内和室外污染物浓度有很大的差别,需要它们进行区分。假设格 子i内的室内和室外污染物浓度值分别服从正态分布
对Mi中的每个测量值而言,存在一个隐含的变量表征该测量值是室内还是室外的,表示为 具体的,本实施例中采用EM算法
'7 来区分室内测量值和室外测量值,并估计出室外污染物浓度Cf "0。具体步骤为通过交替地 执行W下的E步骤和M步骤,从而得到未知变量
的最大似然估 计:
[0034] E步骤:给定01的估计值,计算似然函数的对数的期望,
其中L(ei;Mi,Zi)=p(Mi,Zi| 目i)。
[003引緣巧聚:计算使得似然函数的对数的期望最大的参数估计值,即S

[0036] 对监测区域内所有污染源的位置和污染排放效率进行估计,得到g的估计值f;当 象收敛时,迭代过程结束,否则继续进行下一步骤。根据污染物传播模型,有C = Q g,且已知 C中部分变量的估计值
应用压缩感知理论,因为g是稀疏的化<<n),因而g 可W通过解下面的优化问题进行估计,
.其中
由于 g的真实值未知,无法通过比较g和資.判断估计结果的准确性,从而判断迭代过程是否结束。 因此,采用交叉验证的方法来判断i是否收敛。其具体步骤为将《分为五等份,其中一等份 作为测验集,其余四等份作为训练集。用训练集按如上方法得到估计值餐,再用测验集测试 实际测量值与估计值&复之间的误差,若误差足够小,则说明估计结果收敛于真实值。
[0037] 接着,执行步骤S3,从没收集到测量值的格子中挑选部分方格(优选为扣蝶?皆个格 子),并为所挑选的方格更新所述激励地图中记载的收益数值。
[0038] 若估计值易未收敛,则需更新奖励地图,激励为收集到测量值的格子内的用户参与 参与感知,从而提高估计结果的准确性。每轮迭代中,挑选Iiognj??个格子作为下一轮的奖 励对象。对于任一格子i,其应制定的奖励大小由该格子内用户的数目决定。假设每个格子 内需要收集至少25个测量值才能准确W大于99%的概率准确地估计出该格子的污染物浓 度,根据用户行为模型,菊
,由Pr化二丫 i)=f(m,pi),已知m可 W计算出Pi,从而得到该格子应设定的奖励。下面,说明如何从没有测量值的格子里面挑选 掉獲个格子。为了 W最小的开销获得最有价值的测量值,挑选格子的判断指标有两个:奖 励(即平台的支出)和价值(在用压缩感知估计污染源中)。每个格子的价值定义为
,即连续两次迭代中由污染源的估计值推算出的该格子污染物浓度 的相差。支出越小且价值越大的格子越应该被选作收集测量值的对象,因此根据指标i对 所有为收集到测量值的格子从大到小进行排序,取前皆蝶刮个格子并在奖励地图更新它们 的奖励大小。
[0039] 本发明所提供的激励方法解决了 W下几个技术难点:
[0040] 1)测量值的可靠性及质量。首先,平台不知道收集到的测量值是在室内还是室外 测量的;其次,由于手机测量值存在测量误差,一个格子内需要收集一定数量的测量值协同 估计该格子污染物浓度的真实值,从而消除单个测量值的误差。
[0041 ] 2)每个格子的污染物浓度值对于推测其他格子的作用是未知的。由于每个格子的 位置不同,受风向和污染源位置的影响,其在使用压缩感知技术对其他格子进行推测的过 程中的作用也不同。选择关键的格子收集数据可W提高推测的准确性,从而减低需要收集 数据的数量。
[0042] 3)迭代的次数未知。因为污染源的个数未知,且无法比较每次迭代的推测结果与 真实值之间的偏差,因而难W判断为达到准确推测结果所需要进行迭代的次数。
[0043] 4)结果准确性和平台总支出之间存在权衡。显然,迭代次数越多,收集的测量值越 多,推测结果越准确,然而与此同时平台需要支付给用户的奖励越多。
[0044] 上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发 明领域的普通技术人员根据上述掲示内容做的任何变更、修饰,均属于权利要求书的保护 范围。
【主权项】
1. 一种激励方法,适用于群智感知系统感知污染数据,其特征在于,包括: 若干迭代过程,每次迭代过程均执行以下步骤: 平台发布激励地图,所述激励地图包括若干方格,每个方格的位置代表监测区域中的 不同监测位置,每个方格内存储有用户上传测量值可获得的收益,所述测量值为污染物的 浓度的大小; 平台根据部分格子内收集到测量值,对监测区域内所有污染源的位置和污染排放效率 进行估计,若估计结果收敛,则当前迭代结束;否则,继续执行下一步骤; 从没收集到测量值的格子中挑选部分方格,并为所挑选的方格更新所述激励地图中记 载的收益数值。2. 如权利要求1所述的激励方法,其特征在于,平台利用压缩感知技术对监测区域内所 有污染源的位置和污染排放效率进行估计。3. 如权利要求1所述的激励方法,其特征在于,平台通过交叉验证的方法判断估计结果 是否收敛。4. 如权利要求1所述的激励方法,其特征在于,用户参与群智感知系统的感知任务的行 为樽塑如下:其中,Xs表示用户s是否参与感知任务的随机变量,若激励小于用户的开销,则Xs取值 O,反之,则Xs取值1。5. 如权利要求1所述的激励方法,其特征在于,激励地图中污染物包括:室内的污染物 和室外的污染物,室内的污染物的浓度和室外的污染物的浓度均服从正态分布。6. 如权利要求5所述的激励方法,其特征在于,一方格内污染物的浓度为所有污染源排 放的污染物经过传播在当前方格内的叠加值。7. 如权利要求5所述的激励方法,其特征在于,不同的污染源位于相同或不同的方格 内。
【文档编号】G06F19/00GK106021861SQ201610301565
【公开日】2016年10月12日
【申请日】2016年5月9日
【发明人】刘通, 朱燕民
【申请人】上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1