电动车辆边缘计算调度方法、装置、设备和存储介质

文档序号:35925812发布日期:2023-11-04 16:53阅读:37来源:国知局
电动车辆边缘计算调度方法、装置、设备和存储介质

本发明涉及人工智能,尤其涉及一种电动车辆边缘计算调度方法、装置、设备和存储介质。


背景技术:

1、随着计算机技术的快速发展,产生的数据以及对数据的计算要求越来越高。移动边缘计算是将计算和存储资源带到移动网络的边缘,使其能够运行要求很高的应用程序,同时又能满足严格的延迟要求的一种计算模式。而电动车辆,作为完美的计算平台,越来越多的电动汽车被集成到边缘计算网络中,以促进信息和能源之间的互动,计算能力有限的联网设备可以依靠附近联网的电动车辆来执行复杂的边缘计算任务。因此,依赖电动车辆进行边缘计算的智能充电网络正在转变为一个分布式且潜力较大的解决方案。

2、在智能充电网络中,充电站能够收集能量数据并充当边缘节点来执行计算任务,例如充电行为分析、交通状况预测。此外,充电站还可以与电动车辆通信并交换数据,将计算迁移到电动汽车等计算资源更丰富的边缘来,以增强充电站的计算能力。然而,电动车辆和充电站之间存在信息不对称和目标相互冲突的问题,同时,对电动车辆私人偏好的不完整或不真实披露可能会降低能源和计算资源管理的质量,因此,如何调度边缘计算任务以激励电动车辆协助边缘计算卸载成为目标亟需解决的技术问题。


技术实现思路

1、本发明提供一种电动车辆边缘计算调度方法、装置、设备和存储介质,用以解决现有技术中如何调度边缘计算任务以激励电动车辆协助边缘计算卸载的问题,在实现长期社会效用最大化的同时,确保边缘计算资源的最优调度。

2、本发明提供一种电动车辆边缘计算调度方法,应用于充电网络中的任意一个充电站,包括:

3、获取当前观测信息;

4、将所述当前观测信息输入边缘计算调度模型,输出最优调度策略,所述最优调度策略包括最优离散动作和最优调度合约,所述最优离散动作用于从所述充电站观测范围内所有电动车辆中确定目标电动车辆,所述最优调度合约用于表征分配至所述目标电动车辆对应的目标计算任务信息,所述边缘计算调度模型是基于奖励最大化训练得到的;

5、基于所述最优离散动作向所述目标电动车辆输出所述最优调度合约,并在所述目标电动车辆基于社交距离执行所述最优调度合约的情况下,获取下一观测信息,所述社交距离用于确定所述目标电动车辆对所述最优调度合约的接受概率;

6、将所述下一观测信息作为所述当前观测信息,迭代输出最优调度策略,直至达到预设阈值时结束迭代。

7、根据本发明提供的电动车辆边缘计算调度方法,所述边缘计算调度模型是基于以下步骤训练得到的:

8、基于分配至所述充电站的至少一个样本任务信息和所述充电站观测范围内所有电动车辆各自对应的样本状态信息,构建当前样本观测信息;

9、将所述当前样本观测信息输入初始边缘计算调度模型,构建所述充电站的混合动作,所述混合动作包括调度合约和离散动作;

10、执行所述混合动作,并确定所述充电站对应的第一效用信息和执行所述混合动作的电动车辆对应的第二效用信息;

11、基于所述第一效用信息和所述第二效用信息,确定所述充电站的奖励,并获取下一样本观测信息;

12、基于所述当前样本观测信息、所述混合动作、所述奖励和所述下一样本观测信息,构建训练观测样本集;

13、基于所述训练观测样本集,对所述初始边缘计算调度模型进行训练,得到所述边缘计算调度模型。

14、根据本发明提供的电动车辆边缘计算调度方法,确定执行所述混合动作的电动车辆对应的第二效用信息,包括:

15、获取执行所述混合动作对应的计算收益、计算参数、充电参数和能耗参数;

16、基于所述计算参数、所述调度合约中的计算任务和所述电动车辆的社交类型,确定所述电动车辆对应的计算成本,所述社交类型是基于所述电动车辆的社交距离确定的;

17、基于所述充电参数,确定所述电动车辆对应的充电成本;

18、基于所述能耗参数,确定所述电动车辆对应的能耗成本;

19、基于所述计算收益、所述计算成本、所述充电成本和所述能耗成本,确定所述电动车辆对应的第二效用信息。

20、根据本发明提供的电动车辆边缘计算调度方法,所述社交距离是基于以下步骤确定的:

21、获取所述计算任务对应的社交特征,所述社交特征包括:任务类型、停留意愿和所述电动车辆的地理位置;

22、确定所述任务类型、所述停留意愿和所述地理位置各自对应的权重因子,所述权重因子用于表征在所述电动车辆与所述充电站形成联系过程中所述任务类型、所述停留意愿和所述地理位置各自对应的重要程度;

23、基于所述社交特征和所述社交特征中所述任务类型、所述停留意愿、所述地理位置各自对应的权重因子,确定所述电动车辆的社交距离。

24、根据本发明提供的电动车辆边缘计算调度方法,所述确定所述充电站对应的第一效用信息,包括:

25、获取执行所述混合动作对应的子调度收益和未完成分配任务对应的惩罚;

26、基于所述子调度收益、所述惩罚和所述计算收益,确定所述充电站对应的调度收益;

27、基于所述离散动作和所述充电成本,确定所述充电站对应的充电收益;

28、基于所述调度收益和所述充电收益,确定所述充电站对应的第一效用信息。

29、根据本发明提供的电动车辆边缘计算调度方法,所述调度合约包括:所述计算任务、所述计算收益和所述充电站提供给所述电动车辆对应的充电功率;

30、所述混合动作满足约束条件,所述约束条件为:

31、所述充电站提供给至少一辆电动车辆的总充电功率小于或等于所述充电站的最大输出功率,所述总充电功率是基于所述离散动作和至少一个所述充电功率确定的;

32、所述充电站分配给至少一辆电动车辆的总计算任务小于或等于所述充电站获取的分配任务,所述总计算任务是基于所述离散动作和至少一个所述计算任务确定的;

33、执行所述调度合约的电动车辆的数量小于或等于所述充电站的充电站数量;

34、所述电动车辆执行的所述混合动作的数量小于或等于1;

35、所述离散动作包括接受或拒绝;

36、所述充电功率包括直流快充对应的功率或交流慢充对应的功率;

37、所述计算收益属于预设阈值范围。

38、根据本发明提供的电动车辆边缘计算调度方法,所述样本任务信息包括:所述分配任务对应的任务类型、任务大小和任务特征;

39、所述样本状态信息包括:所述电动车辆的计算资源、soc信息和属性类型。

40、本发明还提供一种电动车辆边缘计算调度装置,应用于充电网络中的任意一个充电站,所述装置包括:

41、获取模块,用于获取当前观测信息;

42、第一输出模块,用于将所述当前观测信息输入边缘计算调度模型,输出最优调度策略,所述最优调度策略包括最优离散动作和最优调度合约,所述最优离散动作用于从所述充电站观测范围内所有电动车辆中确定目标电动车辆,所述最优调度合约用于表征分配至所述目标电动车辆对应的目标计算任务信息,所述边缘计算调度模型是基于奖励最大化训练得到的;

43、第二输出模块,用于基于所述最优离散动作向所述目标电动车辆输出所述最优调度合约,并在所述目标电动车辆基于社交距离执行所述最优调度合约的情况下,获取下一观测信息,所述社交距离用于确定所述目标电动车辆对所述最优调度合约的接受概率;

44、迭代模块,用于将所述下一观测信息作为所述当前观测信息,迭代输出最优调度策略,直至达到预设阈值时结束迭代。

45、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述电动车辆边缘计算调度方法。

46、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述电动车辆边缘计算调度方法。

47、本发明提供的电动车辆边缘计算调度方法、装置、设备和存储介质,通过将获取的当前观测信息输入充电站内预先训练好的边缘计算调度模型,在实现长期社会效用最大化的情况下,输出包括最优离散动作和最优调度合约的最优调度策略,通过最优离散动作选择目标电动车辆,以将最优调度合约发送至目标电动车辆,在目标电动车辆基于社交距离执行最优调度合约的情况下,基于下一观测信息更新当前观测信息,并进行迭代调度,通过最优调度合约提高对电动车辆参与边缘计算卸载服务的吸引力,并通过社交距离确保最优调度合约的合理性,确保电动车辆私人偏好的完整性和对计算资源的真实披露,提高对边缘计算资源的管理质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1