路口控制策略的确定方法及装置、处理器以及电子设备与流程

文档序号:33775805发布日期:2023-04-18 23:00阅读:41来源:国知局
路口控制策略的确定方法及装置、处理器以及电子设备与流程

本申请涉及井下煤矿运输领域,具体而言,涉及一种路口控制策略的确定方法及装置、处理器以及电子设备。


背景技术:

1、相关技术中,在煤矿传统井下运输的过程中,煤矿道路复杂且多变,在每日的运输作业调度中,要求道路尽可能通畅,确保每项运输任务都可以畅通无阻进行,按时完成,保障工作的进行。

2、针对井下煤矿运输系统中信号灯控制系统中繁多且复杂的井下运输道路,在每日的运输作业调度中,信号灯调度规则要求尽可能满足运输过程中的道路通畅,确保每项运输任务都可以畅通无阻,但是现有的信号灯控制逻辑采用固定的放行和停等策略,不会随着任务的变化而变化,随着任务的增多与多变,越来越难以满足需求这一痛点。传统的井下路口交通灯控制逻辑采用固定的放行和停等策略,这样会降低道路资源的使用效率。降低井下煤矿物料或作业工人运输车辆的运行效率,造成不必要的时间浪费、影响既有运输计划的实施、提高井下运输的成本。


技术实现思路

1、本申请的主要目的在于提供一种路口控制策略的确定方法及装置、处理器以及电子设备,以解决现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题。

2、根据本发明实施例的一个方面,提供了一种路口控制策略的确定方法,预设交通区域包括有多个路口,每个路口处设置有一个智能单体,每个智能单体对应有一个值网络,该方法包括:获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络。

3、进一步地,在控制交通数据输入至目标值网络,并控制目标值网络输出路口对应的目标控制策略之前,该方法包括:确定用于训练目标值网络对应的多个训练样本;控制多个训练样本输入至目标值网络,并得到目标值网络输出多个控制策略;确定多个控制策略对应的多个价值,并确定多个价值中的最大价值,将最大价值对应的控制策略确定为目标值网络的目标输出值;控制目标输出值反馈至目标值网络,并依据目标输出值更新目标值网络。

4、进一步地,确定用于训练目标值网络对应的多个训练样本,包括:确定预设交通区域包括的多个路口,并确定多个路口对应的多个智能单体;确定多个智能单体对应的多个值网络,控制多个值网络构成混合网络;依据混合网络,确定多个训练样本。

5、进一步地,依据混合网络,确定多个训练样本,包括:确定目标智能单体在历史时间段内接收的目标交通数据;确定其余多个智能单体在历史时间段内接收的多组交通数据,其中,其余多个智能单体为混合网络中除目标智能单体外的所有智能单体;确定目标交通数据与多组交通数据之间对应的多个互信息;依据目标交通数据以及多个互信息,确定训练样本。

6、进一步地,确定目标交通数据与多组交通数据之间对应的多个互信息,包括:确定目标交通数据,以及多组交通数据;确定预设损失函数;获取循环神经网络;通过预设损失函数更新循环神经网络,以得到目标循环神经网络;控制目标交通数据以及多组交通数据输入至目标循环神经网络,以得到多个互信息。

7、进一步地,通过预设公式表示互信息,预设公式为:其中,i(x;y)为目标交通数据与第一交通数据之间的互信息,第一交通数据为多组交通数据中的任意一组交通数据,p(x,y)为目标交通数据与第一交通数据之间的联合分布,p(x)为目标交通数据对应的边缘分布,p(y)为第一交通数据对应的边缘分布。

8、根据本发明实施例的另一方面,还提供了一种路口控制策略的确定装置,预设交通区域包括有多个路口,每个路口处设置有一个智能单体,每个智能单体对应有一个值网络,该装置包括:第一获取单元,用于获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;第一控制单元,用于控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络。

9、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行一种路口控制策略的确定方法。

10、根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行一种路口控制策略的确定方法。

11、根据本发明实施例的另一方面,还提供了一种电子设备,包括:一个或多个处理器,存储器以及一个或多个程序,其中,一个或多个程序被存储在存储器中,并且被配置为由一个或多个处理器执行,一个或多个程序包括用于执行一种路口控制策略的确定方法。

12、在本发明实施例中,通过获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络,解决了现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题,进而达到了提高了井下路口的控制效率的技术效果。



技术特征:

1.一种路口控制策略的确定方法,其特征在于,预设交通区域包括有多个路口,每个所述路口处设置有一个智能单体,每个所述智能单体对应有一个值网络,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在控制所述交通数据输入至目标值网络,并控制所述目标值网络输出所述路口对应的目标控制策略之前,所述方法包括:

3.根据权利要求2所述的方法,其特征在于,确定用于训练所述目标值网络对应的多个训练样本,包括:

4.根据权利要求3所述的方法,其特征在于,依据所述混合网络,确定多个所述训练样本,

5.根据权利要求4所述的方法,其特征在于,确定所述目标交通数据与多组所述交通数据之间对应的多个互信息,包括:

6.根据权利要求5所述的方法,其特征在于,通过预设公式表示所述互信息,所述预设公式为:

7.一种路口控制策略的确定装置,其特征在于,预设交通区域包括有多个路口,每个所述路口处设置有一个智能单体,每个所述智能单体对应有一个值网络,所述装置包括:

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,所述程序执行权利要求1至6中任意一项所述的一种路口控制策略的确定方法。

9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的一种路口控制策略的确定方法。

10.一种电子设备,其特征在于,包括:一个或多个处理器,存储器以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1至6中任意一项所述的一种路口控制策略的确定方法。


技术总结
本申请提供了一种路口控制策略的确定方法及装置、处理器以及电子设备,通过获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络,解决了现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题。

技术研发人员:陈湘源,杨聪明,高启业,解鑫,杨进,胡比洋,袁晓敏,李建永,石珂,李星
受保护的技术使用者:国能榆林能源有限责任公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1