车辆群智感知均匀性提高方法、系统、设备及介质

文档序号:31450364发布日期:2022-09-07 13:06阅读:124来源:国知局
车辆群智感知均匀性提高方法、系统、设备及介质

1.本发明实施例涉及计算技术领域,尤其涉及一种车辆群智感知均匀性提高方法、系统、设备及介质。


背景技术:

2.目前,车辆群智感知(vehicle crowdsensing,vcs)指在交通运输领域上通过传感器安装车辆或利用司机和乘客携带的移动设备在不部署专用传感器的城市道路网络中,处理大规模复杂的感知任务来收集数据。vcs框架由任务发布者、感知平台和智能联网车辆三部分组成。任务发布者可以是向感知平台提供感知任务的个人或社会组织。感知平台通过分析车辆在道路网中的当前位置和轨迹信息,为车辆分配任务。车辆在接受任务分配后执行感知任务。vcs应用包括了mobeyes利用车辆移动性来测量城市污染水平、nericell收集交通信息如道路状况和拥堵情况、fliermeet用于跨空间公共信息收集与共享、pics-on-wheels车载云服务使用车载摄像头为市民按需提供图像等。vcs具有高移动性、覆盖范围广等优点,可以解决道路传感中信息采集精度低、覆盖范围有限的问题。
3.然而vcs在实践中存在一大挑战:参与车辆数不足且分布相当不均。车辆通常集中在商业和旅游区,导致社会经济弱势区在空间和时间上的传感完成率显著低。车辆的轨迹在时空域不均匀分布,导致采集数据不均匀。例如,根据上海出租车的真实轨迹,发现大约70%的道路在一天的占空比不到30%的情况下有交通报告,大约17%的道路在一天中没有感知。在这样的背景下,获取平衡的时空覆盖具有很大挑战性。因此,需要设计一种考虑均匀性的有效激励机制。
4.当前vcs激励机制按回报方式分为金钱式与非金钱式两类不同的激励方式,两类方式中都有许多激励参与车辆在特定位置收集数据,提高感知覆盖范围的面向均匀性的机制,这些机制普遍认为参与者每轮的参与意愿/绕行意愿即行驶距离的计划是独立的,不受自身以往行为结果的影响,只与本轮报酬、成本有关,认为报酬越低意愿肯定变低,成本越高意愿肯定变低,导致为了均匀性仅一昧地提高报酬降低成本。然而行为经济学的强化理论指出行为会带来一些结果,这些结果又会影响我们下一步的行为。当行为结果是积极的便会导致我们以后进行该行为的可能性增加,产生正强化效果。在实际生活中利用强化理论处理历史事件,使强化与预期效用相关联来推断当前事件的状态,受到正强化影响后产生的满意度使预期效用随之提高,再作用到之前相同行为上,则无需提高报酬降低成本便可增大绕行的复发概率。
5.可见,亟需一种对用户行为决策影响、更有效的激励参与者提高绕行意愿的车辆群智感知均匀性提高方法。


技术实现要素:

6.有鉴于此,本发明实施例提供一种车辆群智感知均匀性提高方法、系统、设备及介质,至少部分解决现有技术中存在激励参与者提高绕行意愿效果较差的问题。
7.第一方面,本发明实施例提供了一种车辆群智感知均匀性提高方法,包括:步骤1,依据该批次任务集数量影响参数规定逼近阈值,向所有在线到达的参与者发布强化规则,并提前设计逐轮完成任务后需公布的逼近速度来更新每轮获得的强化规则中的逼近值;步骤2,在强化规则影响下,结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况计算强化因子,并计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离;步骤3,依据基于强化因子预估的用户选择效用预估最优绕行距离后,以此整合平台效用公式,以平台效用最大化为目标,更新每轮次发布的最优单位报酬;步骤4,获取参与者上传的投标信息,其中,投标信息以最优绕行距离为基准,提供多条可供选择的轨迹,参与者前两轮默认以最短距离为基准提供轨迹,而后需基于绕行倾向度提供轨迹才会被选中以最优单位报酬进行结算;步骤5,平台分配任务选择参与者,每轮为达到最大社会总福利来决定获胜者,优先选择带来社会总福利最高的参与者,选择轨迹分配其中未完成的任务;步骤6,当逼近值达逼近阈值时,支付总报酬,否则逐轮累积至批次结束再结算,其中,每一轮次若按最优绕行倾向度提供轨迹则以最优单位报酬结算,否则仅以成本价结算。
8.根据本发明实施例的一种具体实现方式,所述逼近值的更新公式为,其中,为逼近值的规模即代表成功的阈值,、,分别代表逼近机制增长率、时间轮次的相关参数,是一个正实数,若=1曲线为logistic函数,曲线为bertalanffy函数,若收敛到0,则曲线收敛到gompertz函数,与参与者完成轮次t成正比, 即,瞬时增长率随t的增加先增加后减小至趋于零, 当时,达到峰值,逼近速度设定为该瞬时增长率,当前从低到高加快。
9.根据本发明实施例的一种具体实现方式,所述结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况得到强化因子的步骤具体包括:当平台预估参与者在参加第t轮任务上报绕行意愿时,以第t-1轮任务的逼近速度和平台所发布的最高逼近速度为参照对第t轮的逼近速度进行预估:其中,代表个体的估计偏差程度,参与者处于风险损失时,其值越
小表示个体越容易高估逼近速度,若 时表示个体本轮估计与上轮逼近速度一致,保持不变;当参与者预估本轮逼近速度后,对已得的逼近速度进行评估,得到强化因子的大小,其中,定义第t轮时,距其m轮的第t-m轮的逼近速度对于参与者的强化公式为:定义第t轮时,距其m轮的第t-m轮对于参与者的权重系数为:其中表示弱化系数,;参与者在第轮对单位报酬的强化感知强度为:。
10.根据本发明实施例的一种具体实现方式,所述计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离的步骤具体包括:设第t轮时参与者可支配最大行驶距离为,参与者对于自身行程的分配表示为,其中表示参与者计划参与感知任务的行驶距离,该值体现绕行倾向度,表示参与者未计划参与感知任务的丢弃距离;将参与者的选择效用分为两部分,消费和闲暇,表示参与者将完成任务以后获得的报酬进行消费产生正效用,同样的,参与者在未参与任务休息时也会产生正效用;细化消费,将其定义为,其中表示完成任务后平台提供的单位距离报酬,平台需预估参与者的单轮选择效用,将用户效用函数取为:其中为由强化感知强度表示的强化因子;根据预估的用户效用公式得到当最大化用户效用时,计划行驶距离需满足条件:根据预估的用户效用公式得到当最大化用户效用时,计划行驶距离需满足条件:当参与者计划的绕行距离满足时,参与者效用达到最大化,得到参与者的最优绕行距离。
11.根据本发明实施例的一种具体实现方式,针对第t轮次参与者的参与,平台的效用公式为:,其中为当前批次每轮单位距离下的平均任务价值。
12.根据本发明实施例的一种具体实现方式,所述t轮次参与者带来的社会总福利的计算公式为:其中,表示参与者所选轨迹上可分配任务的总价值,表示行驶该轨迹完成分配任务所需的总成本,其中第t轮次下参与者消耗的总成本函数的计算如下:参与者完成第t轮次的任务时需付出的成本包括和,为参与者在行程中对分配任务进行感知上传数据的成本,为感知任务的成本,表示第t轮次行驶路上感知任务的数量,为参与者在其提交的绕行路线下,行驶每单位绕行距离油耗和时间带来的综合绕行成本,表示第t轮次完成感知任务的行驶距离。
13.第二方面,本发明实施例提供了一种车辆群智感知均匀性提高系统,包括:发布模块,用于依据该批次任务集数量影响参数规定逼近阈值,向所有在线到达的参与者发布强化规则,并提前设计逐轮完成任务后需公布的逼近速度来更新每轮获得的强化规则中的逼近值;计算模块,用于在强化规则影响下,结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况计算强化因子,并计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离;更新模块,用于依据基于强化因子预估的用户选择效用预估最优绕行距离后,以此整合平台效用公式,以平台效用最大化为目标,更新每轮次发布的最优单位报酬;获取模块,用于获取参与者上传的投标信息,其中,投标信息以最优绕行距离为基准,提供多条可供选择的轨迹,参与者前两轮默认以最短距离为基准提供轨迹,而后需基于绕行倾向度提供轨迹才会被选中以最优单位报酬进行结算;选择参与者模块,用于平台分配任务选择参与者,每轮为达到最大社会总福利来决定获胜者,优先选择带来社会总福利最高的参与者,选择轨迹分配其中未完成的任务;报酬支付模块,用于当逼近值达逼近阈值时,支付总报酬,否则逐轮累积至批次结束再结算,其中,每一轮次若按最优绕行倾向度提供轨迹则以最优单位报酬结算,否则仅以成本价结算。
14.第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的车辆群智感知均匀性提高方法。
15.第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的车辆群智感知均匀性提高方法。
16.第五方面,本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的车辆群智感知均匀性提高方法。
17.本发明实施例中的车辆群智感知均匀性提高方案,包括:步骤1,依据该批次任务集数量影响参数规定逼近阈值,向所有在线到达的参与者发布强化规则,并提前设计逐轮完成任务后需公布的逼近速度来更新每轮获得的强化规则中的逼近值;步骤2,在强化规则影响下,结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况得到强化因子,并计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离;步骤3,依据预估的用户选择效用预估最优绕行距离后,以此整合平台效用公式,以平台效用最大化为目标,更新每轮次发布的最优单位报酬;步骤4,获取参与者上传的投标信息,其中,投标信息以最优绕行距离为基准,提供多条可供选择的轨迹,参与者前两轮默认以最短距离为基准提供轨迹,而后需基于绕行倾向度提供轨迹才会被选中以最优单位报酬进行结算;步骤5,平台分配任务选择参与者,每轮为达到最大社会总福利来决定获胜者,优先选择带来社会总福利最高的参与者,选择轨迹分配其中未完成的任务;步骤6,当逼近值达逼近阈值时,支付总报酬,否则逐轮累积至批次结束再结算,其中,每一轮次若按最优绕行倾向度提供轨迹则以最优单位报酬结算,否则仅以成本价结算。
18.本发明实施例的有益效果为:通过本发明的方案,考虑了强化理论对参与者的激励作用,建立了影响参与者决策的任务发布环境,通过设置强化物有指向性地引导参与者决策,设定递增逼近速度和逼近阈值的强化规则来提高参与者的强化因子,以此增强参与者对单位报酬的感知强度;在此基础上预估单位报价规则为环境中单位距离下的感知任务提供单位报酬值,从而参与者计算的最优计划距离会逐轮增加,提交包含多条可供选择轨迹的投标信息来反映参与者绕行倾向度,再依据最大化社会福利分配任务选择参与者。相较于对比的机制,本方案引入强化因子来最大化用户效用和平台效用, 从而在实现社会福利最大化的同时,使参与者均匀分布在特定位置,不需要提高任务报酬就提高参与者的绕行意愿,使整体任务覆盖率提高,保障了更实际有效的激励效果。
附图说明
19.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
20.图1为本发明实施例提供的一种车辆群智感知均匀性提高方法的流程示意图;图2为本发明实施例提供的一种车辆群智感知均匀性提高方法涉及的实施过程示意图;图3为本发明实施例提供的一种激励机制的流程图;图4为本发明实施例提供的一种相同数据下使用本发明实施例与现有的具有代表性的方法,多轮参与者完成任务后任务覆盖率比较图;图5为本发明实施例提供的一种相同数据下使用本发明实施例与现有的具有代表性的方法,平台和参与者总效用比较图;图6为本发明实施例提供的一种车辆群智感知均匀性提高系统的结构示意图;图7为本发明实施例提供的电子设备示意图。
具体实施方式
21.下面结合附图对本发明实施例进行详细描述。
22.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
23.需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
24.还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
25.另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
26.本发明实施例提供一种车辆群智感知均匀性提高方法,所述方法可以应用于交通运输场景中的用户行为决策影响过程中。
27.参见图1,为本发明实施例提供的一种行为决策影响方法的流程示意图。如图1所示,所述方法主要包括以下步骤:步骤1,依据该批次任务集数量影响参数规定逼近阈值,向所有在线到达的参与者发布强化规则,并提前设计逐轮完成任务后需公布的逼近速度来更新每轮获得的强化规则
中的逼近值;进一步的,所述逼近值的更新公式为,其中, 为逼近值的规模即代表成功的阈值,、,分别代表逼近机制增长率、时间轮次的相关参数,是一个正实数,若=1曲线为logistic函数, 曲线为bertalanffy函数,若 收敛到0,则曲线收敛到gompertz函数,与参与者完成轮次t成正比, 即,瞬时增长率随t的增加先增加后减小至趋于零, 当时,达到峰值,逼近速度设定为该瞬时增长率,当前从低到高加快。
28.具体实施时,构建车辆群智感知系统环境。如图2和图3所示,假设环境中每轮共有n个参与者,m个任务,参与者集合,其中表示第i个参与者,用表示单位感知成本和单位绕行成本, 为参与者t轮最大行驶距离。任务集,每个任务用元组表示任务执行的特定位置,为任务价值。
29.对于本发明进行仿真实验,假设任务均匀分布,参与者分布不均匀。具体参数如表1所示:表1发布强化规则。设计一批次下强化规则参数,一开始公布本批次强化阈值,其它相关参数:代表逼近机制增长率的本实例取0.4,时间轮次取20,固定为2。强化规则中的逼近值更新公式设为
平台依据该公式,在参与者每轮完成任务后发布递增的逼近速度 和更新的逼近值,公布规则规定逼近值达逼近阈值方可支付总报酬。当 ,逼近速度 时,对于任意参与者,发布顺序为获得的强化感知强度大于发布顺序的,即,则在所制定的强化规则下,强化感知强度最大,强化因子越大,参与者提交的计划距离越大,绕行意愿更强烈,任务覆盖率更高。
30.步骤2,在强化规则影响下,结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况计算强化因子,并计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离;进一步的,所述结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况得到强化因子的步骤具体包括:当平台预估参与者在参加第t轮任务上报绕行意愿时,以第t-1轮任务的逼近速度和平台所发布的最高逼近速度为参照对第t轮的逼近速度进行预估:其中,代表个体的估计偏差程度,参与者处于风险损失时,其值越小表示个体越容易高估逼近速度,若时表示个体本轮估计与上轮逼近速度一致,保持不变;当参与者预估本轮逼近速度后,对已得的逼近速度进行评估,得到强化因子的大小,其中,定义第t轮时,距其m轮的第t-m轮的逼近速度对于参与者强化公式为:定义第t轮时,距其m轮的第t-m轮对于参与者的权重系数为:其中表示弱化系数,;参与者在第轮对单位报酬的强化感知强度为:

31.进一步的,所述计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离的步骤具体包括:设第t轮时参与者可支配最大行驶距离为,参与者对于自身行程的分配表示为 ,其中表示参与者计划参与感知任务的行驶距离,该值体现绕行倾向度,表示参与者未计划参与感知任务的丢弃距离;将参与者的选择效用分为两部分,消费和闲暇,表示参与者将完成任务以后获得的报酬进行消费产生正效用,同样的,参与者在未参与任务休息时也会产生正效用;细化消费,将其定义为,其中表示完成任务后平台提供的单位距离报酬,平台需预估参与者的单轮选择效用,将用户效用函数取为:其中为由强化感知强度表示的强化因子;根据预估的用户效用公式得到当最大化用户效用时,计划行驶距离需满足条件:根据预估的用户效用公式得到当最大化用户效用时,计划行驶距离需满足条件:当参与者计划的绕行距离满足时,参与者效用达到最大化,得到参与者的最优绕行距离。
32.具体实施时,预估参与者绕行距离。在强化规则的影响下需引入强化因子预估每位参与者的绕行距离,而强化因子的构建需要先以第t-1轮任务获得的的逼近速度和平台发布的最高逼近速度为参照对第t轮的逼近速度进行预估,因为强化规则规定了已参与t-1轮次的参与者尚未达标的场景,使参与者在参与第t轮次时处于风险损失下高估逼近速度 ,所以在这。
33.预估本轮逼近速度后,再结合以往所有参与轮次的逼近速度与本轮预估速度的对比情况,计算本轮参与者对单位报酬的强化感知强度。
34.其中表示弱化系数,, 越小,参与者会更加关注近期的信息。
35.当参与者第一次参与任务时,不会受强化规则的作用,强化感知强度为使绕行距离取最短距离的初始值,直到t》2时,规则才开始对强化感知强度起提高作用,使绕行距离提高。
36.由强化感知强度表示的强化因子,参与者对于他自身行程的分配,是参与者计划参与感知任务的行驶距离, 是参与者未计划参与感知任务的丢弃距离。预估参与者的单轮选择效用分为两部分消费和闲暇,是完成任务后平台提供的单位距离报酬。
37.求解得当参与者计划的绕行距离满足时,参与者效用可以达到最大化。则参与者为使得自身效用最大化,也应依上述平台预估的用户效用函数选择合适的绕行距离。
38.步骤3,依据基于强化因子预估的用户选择效用预估最优绕行距离后,以此整合平台效用公式,以平台效用最大化为目标,更新每轮次发布的最优单位报酬;在上述实施例的基础上,针对第t轮次参与者的参与,平台的效用公式为:,其中为当前批次每轮单位距离下的平均任务价值。
39.具体实施时,确定平台报价。代入步骤2所求得的预估最优绕行距离到平台效用上后公式为后公式为是这一批次每轮单位距离下的平均任务价值,平台将通过确定单位报价来最大化平台效用 。而 的数值解难以通过定理求解,则使用二分算法进行求解。每轮平台对每位参与者发布对应求得的,而参与者需相对选择最优绕行距离后才可依据提供的最优单位报酬进行结算,否则以成本价结算。
40.步骤4,获取参与者上传的投标信息,其中,投标信息以最优绕行距离为基准,提供多条可供选择的轨迹,参与者前两轮默认以最短距离为基准提供轨迹,而后需基于绕行倾向度提供轨迹才会被选中以最优单位报酬进行结算;具体实施时,参与者上传投标信息。参与者前两轮默认以最短距离为基准提供轨迹,而后基于最优绕行距离提供num条候选轨迹,即每条候选轨迹的最大距离为。
41.步骤5,平台分配任务选择参与者,每轮为达到最大社会总福利来决定获胜者,优先选择带来社会总福利最高的参与者,选择轨迹分配其中未完成的任务;进一步的,所述t轮次参与者带来的社会总福利的计算公式为:其中,表示参与者所选轨迹上可分配任务的总价值,表示行驶该轨迹完成分配任务所需的总成本,其中第t轮次下参与者消耗的总成本函数的计算如下:参与者完成第t轮次的任务时需付出的成本包括和, 为参与者在行程中对分配任务进行感知上传数据的成本,为感知任务的成本,表示第t轮次行驶路上感知任务的数量,为参与者在其提交的绕行路线下,行驶每单位绕行距离油耗和时间带来的综合绕行成本,表示第t轮次完成感知任务的行驶距离。
42.具体实施时,平台分配任务选择参与者。共n个参与者,每个参与者提供num条轨迹,平台以最大社会总福利为原则决定获胜者,选择其中轨迹并分配未完成的任务。参与者每轮需消耗的总成本为:其中表示第t轮次行驶路上感知任务的数量,表示第t轮次完成感知任务的行驶距离。通过参与者所选轨迹上可分配任务的总价值减去行驶轨迹完成分配任务所需的总成本,得参与者所选轨迹带来的社会总福利:平台计算每个参与者的每条轨迹带来的社会总福利,每次把社会福利最大的参与者选进获胜者集合,并分配对应轨迹的相应任务,依此迭代直至覆盖尽可能多的任务。
43.步骤6,当逼近值达逼近阈值时,支付总报酬,否则逐轮累积至批次结束再结算,其中,每一轮次若按最优绕行倾向度提供轨迹则以最优单位报酬结算,否则仅以成本价结算。
44.具体实施时,结算报酬。每轮完成任务更新逼近值后判断其是否达逼近阈值,若达标方可支付总报酬,否则逐轮累积至批次结束再结算。其中每一轮次若按最优绕行倾向度提供轨迹以最优单位报酬累积结算,否则仅以成本价累积。
45.在本实施例中,相关的仿真实验结果如下表2和表3所示,表2是当环境中不同参与者数量时,引入强化理论后的任务覆盖率。任务覆盖率,cov表示分配给全部获胜者的轨迹上覆盖任务的总数量,m表示总任务数量,因为本实施例中不考虑放弃任务或任务完成失败,则覆盖率即完成率。表3是一批次50轮内平台效用和参与者总效用每轮结果。平台效用为所有已完成任务的总价值减去平台支付给参与者的总报酬总支出,参与者效用为所有获胜者的总效用。
46.为了更进一步评估本发明的性能,本发明提出的车辆群智感知均匀性提高方
法——基于强化理论的均匀性激励机制(evenness incentive mechanism based on reinforcement theory,简称eirt)也与其它目前有代表性的方法——时空车辆人群感知系统的调度与激励机制(scheduling and incentive mechanism for spatio-temporal vehicular crowd sensing systems,简称hector)进行比较,如图4和图5所示。验证结果表明,本发明的性能均优于其它目前最先进的方法。其中图4可观察到因为有更多参与者可以完成更多的任务,无论是本发明还是hector,覆盖率都随参与者数量增加而增加。但本发明的覆盖率一直都比hector的效果好,因为本发明通过强化规则提高了每位参与者的强化因子,每次都能得到更高的绕行倾向度,整体完成的任务也越多。图5呈现了每轮本发明和hector的平台效用和参与者总效用的比较。 本发明的平台效用和参与者总效用一直恒大于hector,表明本发明的单位报价为合理设计,能保持较好的平台效用和参与者总效用。
47.表2表3本实施例提供的车辆群智感知均匀性提高方法,通过考虑了强化理论对参与者的激励作用,建立了影响参与者决策的任务发布环境,通过设置强化物有指向性地引导参与者决策,设定递增逼近速度和逼近阈值的强化规则来提高参与者的强化因子,以此增强参与者对单位报酬的感知强度;在此基础上预估单位报价规则为环境中单位距离下的感知任务提供单位报酬值,从而参与者计算的最优计划距离会逐轮增加,提交包含多条可供选择轨迹的投标信息来反映参与者绕行倾向度,再依据最大化社会福利分配任务选择参与者。相较于对比的机制,本方案引入强化因子来最大化用户效用和平台效用, 从而在实现社会福利最大化的同时,使参与者均匀分布在特定位置,不需要提高任务报酬就提高参与者的绕行意愿,使整体任务覆盖率提高,保障了更实际有效的激励效果。
48.与上面的方法实施例相对应,参见图6,本发明实施例还提供了一种车辆群智感知均匀性提高系统,包括:发布模块601,用于依据该批次任务集数量影响参数规定逼近阈值,向所有在线到达的参与者发布强化规则,并提前设计逐轮完成任务后需公布的逼近速度来更新每轮获得的强化规则中的逼近值;计算模块602,用于在强化规则影响下,结合历史数据中全部参与轮次的逼近速度与本轮预估速度的对比情况计算强化因子,并计算在强化因子作用下行驶距离的分配情况得到参与者的最优绕行距离;更新模块603,用于依据基于强化因子预估的用户选择效用预估最优绕行距离后,以此整合平台效用公式,以平台效用最大化为目标,更新每轮次发布的最优单位报酬;
获取模块604,用于获取参与者上传的投标信息,其中,投标信息以最优绕行距离为基准,提供多条可供选择的轨迹,参与者前两轮默认以最短距离为基准提供轨迹,而后需基于绕行倾向度提供轨迹才会被选中以最优单位报酬进行结算;选择参与者模块605,用于平台分配任务选择参与者,每轮为达到最大社会总福利来决定获胜者,优先选择带来社会总福利最高的参与者,选择轨迹分配其中未完成的任务;报酬支付模块606,用于当逼近值达逼近阈值时,支付总报酬,否则逐轮累积至批次结束再结算,其中,每一轮次若按最优绕行倾向度提供轨迹则以最优单位报酬结算,否则仅以成本价结算。
49.图6所示系统可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
50.参见图7,本发明实施例还提供了一种电子设备70,该电子设备包括:至少一个处理器以及与该至少一个处理器通信连接的存储器。其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的车辆群智感知均匀性提高系统方法。
51.本发明实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的车辆群智感知均匀性提高系统方法。
52.本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的车辆群智感知均匀性提高系统方法。
53.下面参考图7,其示出了适于用来实现本发明实施例的电子设备70的结构示意图。本发明实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
54.如图7所示,电子设备70可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储装置708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中,还存储有电子设备70操作所需的各种程序和数据。处理装置701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
55.通常,以下装置可以连接至i/o接口705:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置706;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备70与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备70,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
56.特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实
施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从rom 702被安装。在该计算机程序被处理装置701执行时,执行本发明实施例的方法中限定的上述功能。
57.需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
58.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
59.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
60.或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
61.可以以一种或多种程序设计语言或其组合来编写用于执行本发明的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
62.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执
行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
63.描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
64.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。
65.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1