数据采集资源奖励确定方法、装置、设备及存储介质与流程

文档序号:37140102发布日期:2024-02-26 16:52阅读:20来源:国知局
数据采集资源奖励确定方法、装置、设备及存储介质与流程

本技术涉及计算机,尤其涉及一种数据采集资源奖励确定方法、装置、设备及存储介质。


背景技术:

1、随着无线通信和智能移动设备的不断发展,移动群智感知技术成为一种新的数据获取模式。移动群智感知技术在智能交通、环境监测、空气污染感知、噪声污染感知等场景下都有广泛的应用,例如:智能交通服务器可以通过多个移动终端设备获取不同地点的路况数据,从而对获取的路况数据进行分析,得到交通拥堵情况。

2、目前,基于移动群智感知技术的数据采集方法中,通过多个移动终端设备采集的数据都是在云端服务器上进行分析处理,因此,多个采集数据的移动终端设备需要同时与云端服务器进行交互上传数据。另外,为了提高移动终端设备采集数据的积极性和数据的可靠性,云端服务器可以基于数据的质量给予移动终端设备一定的奖励,该奖励可以为移动终端设备所需的虚拟资源或者货币资源。但是,移动终端设备的奖励也需在云端服务器上进行计算,因此云端服务器需要处理大量数据,运行负荷较大,使得采集数据的移动终端设备的奖励确定效率较低。因此,如何提高确定移动感知技术中移动终端的奖励的效率成为目前亟待解决的技术问题。


技术实现思路

1、本技术提供一种数据采集资源奖励确定方法、装置、设备及存储介质,实现了提高数据采集的资源奖励确定的效率。

2、第一方面,本技术提供一种数据采集资源奖励确定方法,应用于资源奖励确定装置,该方法包括:获取来自服务器的数据采集任务;响应于数据采集任务,从多个目标数据采集器中获取多个目标数据集合;其中,一个目标数据集合对应一个目标数据采集器采集的数据;对每个目标数据集合进行评估计算,确定每个目标数据集合对应的目标资源奖励值;向每个目标数据集合对应的目标数据采集器发送目标资源奖励值。

3、本技术提供的数据采集资源奖励确定方法,通过获取来自服务器的数据采集任务,并响应于数据采集任务,从多个目标数据采集器中获取多个目标数据集合,进一步地,对每个目标数据集合进行评估计算,确定每个目标数据集合对应的目标资源奖励值,从而向目标数据采集器发送对应的目标资源奖励。本技术的数据采集资源奖励确定方法,将目标数据采集器的目标资源奖励确定过程从服务器转移到资源奖励确定装置,服务器仅需发布数据采集任务以及对目标数据集合进行评估计算,从而减轻了服务器的工作负荷,提高了目标数据集合评估计算的效率,从而提高了数据采集资源奖励确定的效率。

4、一种可能的实现方式,对每个目标数据集合进行评估计算,确定每个目标数据集合对应的目标资源奖励值,包括:向服务器发送多个目标数据集合;接收来自服务器发送的每个目标数据集合对应的第一性能评估值;第一性能评估值用于表征每个目标数据集合的数据质量;基于第一性能评估值,对每个目标数据集合进行迭代的时序差分运算,确定每个目标数据集合对应的目标资源奖励值。

5、另一种可能的实现方式,基于第一性能评估值,对每个目标数据集合进行迭代的时序差分运算,确定每个目标数据集合对应的目标资源奖励值,包括:步骤1、基于第一性能评估值,确定每个目标数据集合对应的第一资源奖励值;第一资源奖励值为每个目标数据集合对应的目标数据采集器发送的初始资源奖励值,或前一次迭代时序差分运算确定的资源奖励值;步骤2、基于第一性能评估值和第一资源奖励值,确定每个目标数据采集器对应的第一数据性价比;步骤3、基于第一数据性价比,对每个目标数据集合进行时序差分运算,确定每个目标数据集合对应的第二资源奖励值;步骤4、向每个目标数据集合对应的每个目标资源采集器发送第二资源奖励值;步骤5、接收每个目标数据采集器发送的第一目标数据集合;第一目标数据集合为目标数据采集器基于第二资源奖励值更新后的目标数据集合;步骤6、向服务器发送第一目标数据集合;步骤7、接收服务器发送的第二性能评估值;步骤8、基于第二性能评估值和第二资源奖励值,确定每个目标数据集合对应的第二数据性价比;步骤9、确定第一数据性价比和第二数据性价比的差值是否满足收敛条件;步骤10、若满足收敛条件,则确定第二资源奖励值为目标资源奖励值;步骤11、若不满足收敛条件,则确定第二性能评估值为第一性能评估值;确定第二资源奖励值为第一资源奖励值;并迭代执行步骤1至步骤11,直至第一数据性价比与第二数据性价比满足收敛条件。

6、又一种可能的实现方式,基于第一性能评估值和第一资源奖励值,确定每个目标数据采集器对应的第一数据性价比,包括:基于第一性能评估值和第一资源奖励值,确定每个目标数据集合对应的第一性能函数值和第一奖励函数值;确定第一性能函数值与第一奖励函数值的比值为第一数据性价比。

7、又一种可能的实现方式,基于数据采集任务,时序差分运算满足以下公式:

8、v'(s,a)=v(s,a)+α[r+γmaxa'v(s',a')-v(s,a)];

9、其中,v'(s,a)表示时序差分运算本次迭代的动作价值函数;v(s,a)表示时序差分运算首次迭代的动作价值函数,或者时序差分运算前一次迭代的动作价值函数;maxa'v(s',a')表示时序差分运算下一次迭代的动作价值函数;s表示第一性能评估值;a表示第一资源奖励值;s'表示第二性能评估值;a'表示第二资源奖励值;r表示第一数据性价比;α为超参数,取值在0到1之间;γ为超参数,取值在0到1之间。

10、第二方面,本技术提供一种数据采集资源奖励确定装置,该装置包括:处理模块。

11、处理模块用于,获取来自服务器的数据采集任务;处理模块还用于,响应于数据采集任务,从多个目标数据采集器中获取多个目标数据集合;其中,一个目标数据集合对应一个目标数据采集器采集的数据;处理模块还用于,对每个目标数据集合进行评估计算,确定每个目标数据集合对应的目标资源奖励值;处理模块还用于,向每个目标数据集合对应的目标数据采集器发送目标资源奖励值。

12、一种可能的实现方式,装置还包括:通信模块;处理模块具体用于,指示通信模块向服务器发送多个目标数据集合;指示通信模块接收来自服务器发送的每个目标数据集合对应的第一性能评估值;第一性能评估值用于表征每个目标数据集合的数据质量;基于第一性能评估值,对每个目标数据集合进行迭代的时序差分运算,确定每个目标数据集合对应的目标资源奖励值。

13、另一种可能的实现方式,处理模块具体用于,步骤1、基于第一性能评估值,确定每个目标数据集合对应的第一资源奖励值;第一资源奖励值为每个目标数据集合对应的目标数据采集器发送的初始资源奖励值,或前一次迭代时序差分运算确定的资源奖励值;步骤2、基于第一性能评估值和第一资源奖励值,确定每个目标数据采集器对应的第一数据性价比;步骤3、基于第一数据性价比,对每个目标数据集合进行时序差分运算,确定每个目标数据集合对应的第二资源奖励值;步骤4、指示通信模块向每个目标数据集合对应的每个目标资源采集器发送第二资源奖励值;步骤5、指示通信模块接收每个目标数据采集器发送的第一目标数据集合;第一目标数据集合为目标数据采集器基于第二资源奖励值更新后的目标数据集合;步骤6、指示通信模块向服务器发送第一目标数据集合;步骤7、指示通信模块接收服务器发送的第二性能评估值;步骤8、基于第二性能评估值和第二资源奖励值,确定每个目标数据集合对应的第二数据性价比;步骤9、确定第一数据性价比和第二数据性价比的差值是否满足收敛条件;步骤10、若满足收敛条件,则确定第二资源奖励值为目标资源奖励值;步骤11、若不满足收敛条件,则确定第二性能评估值为第一性能评估值;确定第二资源奖励值为第一资源奖励值;并迭代执行步骤1至步骤11,直至第一数据性价比与第二数据性价比满足收敛条件。

14、又一种可能的实现方式,处理模块具体用于,基于第一性能评估值和第一资源奖励值,确定每个目标数据集合对应的第一性能函数值和第一奖励函数值;确定第一性能函数值与第一奖励函数值的比值为第一数据性价比。

15、又一种可能的实现方式,时序差分运算满足以下公式:

16、v'(s,a)=v(s,a)+α[r+γmaxa'v(s',a')-v(s,a)];

17、其中,v'(s,a)表示时序差分运算本次迭代的动作价值函数;v(s,a)表示时序差分运算首次迭代的动作价值函数,或者时序差分运算前一次迭代的动作价值函数;maxa'v(s',a')表示时序差分运算下一次迭代的动作价值函数;s表示第一性能评估值;a表示第一资源奖励值;s'表示第二性能评估值;a'表示第二资源奖励值;r表示第一数据性价比;α为超参数,取值在0到1之间;γ为超参数,取值在0到1之间。

18、第三方面,本技术提供一种电子设备,该电子设备包括:处理器和存储器;存储器存储有处理器可执行的指令;处理器被配置为执行指令时,使得电子设备实现上述第一方面的方法。

19、第四方面,本技术提供一种计算机可读存储介质,该计算机可读存储介质包括:计算机软件指令;当计算机软件指令在电子设备中运行时,使得电子设备实现上述第一方面的方法。

20、第五方面,本技术提供一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面描述的相关方法的步骤,以实现上述第一方面的方法。

21、上述第二方面至第五方面的有益效果参考第一方面的对应描述,不再赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1