本申请涉人工智能或者强化学习,具体涉及一种智能预警方法及相关装置。
背景技术:
1、在当前社会背景下,交通安全问题备受关注,特别是在人口密集、交通繁忙的城市环境中。尤其是在交通安全方面,基于规则的预警方法通常受限于复杂多变的交通场景,无法充分适应各种情况,亟需自动预警可能存在交通违法、事故风险或需要劝导的高危交通参与人员,因此,如何实现智能交通预警的问题亟待解决。
技术实现思路
1、本申请实施例提供了一种智能预警方法及相关装置,可以实现智能交通预警。
2、第一方面,本申请实施例提供一种智能预警方法,所述方法包括:
3、在训练阶段,获取历史交通参与人员的特征数据和行为数据;
4、将所述特征数据和所述行为数据输入到lstm网络中,以通过时间序列的方法模拟整个交通场景流程;主网络包括所述lstm网络;
5、在训练过程中,获取当前所有人员的状态信息,所述状态信息包括以下至少一种:人员的位置、速度、行为;
6、将所述当前所有人员的状态信息输入到actor-critic网络中,得到所述当前所有人员的识别结果;所述actor-critic网络包括:actor网络和critic网络,所述actor网络负责生成决策策略,所述critic网络负责评估所述决策策略的性能;所述actor网络包括所述lstm网络;
7、根据所述识别结果进行预警操作。
8、第二方面,本申请实施例提供了一种智能预警装置,所述装置包括:获取单元、输入单元和预警单元,其中,
9、所述获取单元,用于在训练阶段,获取历史交通参与人员的特征数据和行为数据;将所述特征数据和所述行为数据输入到lstm网络中,以通过时间序列的方法模拟整个交通场景流程;主网络包括所述lstm网络;在训练过程中,获取当前所有人员的状态信息,所述状态信息包括以下至少一种:人员的位置、速度、行为;
10、所述输入单元,用于将所述当前所有人员的状态信息输入到actor-critic网络中,得到所述当前所有人员的识别结果;所述actor-critic网络包括:actor网络和critic网络,所述actor网络负责生成决策策略,所述critic网络负责评估所述决策策略的性能;所述actor网络包括所述lstm网络;
11、所述预警单元,用于根据所述识别结果进行预警操作。
12、第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
13、第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
14、第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
15、实施本申请实施例,具备如下有益效果:
16、可以看出,本申请实施例中所描述的智能预警方法及相关装置,在训练阶段,获取历史交通参与人员的特征数据和行为数据,将特征数据和行为数据输入到lstm网络中,以通过时间序列的方法模拟整个交通场景流程;主网络包括lstm网络,在训练过程中,获取当前所有人员的状态信息,状态信息包括以下至少一种:人员的位置、速度、行为,将当前所有人员的状态信息输入到actor-critic网络中,得到当前所有人员的识别结果;actor-critic网络包括:actor网络和critic网络,actor网络负责生成决策策略,critic网络负责评估决策策略的性能;actor网络包括lstm网络,根据识别结果进行预警操作,采用了actor-critic算法,并结合lstm模型作为主网络,这一设计不仅考虑了状态之间的关联性,也充分利用了时间序列特征,actor-critic算法提供了强大的决策能力,使得系统能够在复杂多变的交通环境中做出准确的预测和决策,同时,引入lstm模型则增强了系统对时间序列数据的建模能力,提高了预测的时序性和准确性。该方法的优势不仅在于智能预警的准确性和实时性,更在于其自适应性,系统会随着时间的推移,根据新的数据和实际场景的变化,自动对模型进行更新和优化,这种自动化的学习和适应性使得预警系统能够不断提升性能,满足监督部门对交通参与人员自动化预警的迫切需求,也能够实现智能交通预警。
1.一种智能预警方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取历史交通参与人员的特征数据和行为数据,包括:
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述时间差误差更新所述critic网络,包括:
5.根据权利要求3所述的方法,其特征在于,所述根据所述时间差误差更新所述actor网络,包括:
6.一种智能预警装置,其特征在于,所述装置包括:获取单元、输入单元和预警单元,其中,
7.根据权利要求6所述的装置,其特征在于,在所述获取历史交通参与人员的特征数据和行为数据方面,所述获取单元具体用于:
8.根据权利要求6或7所述的装置,其特征在于,所述装置还具体用于:
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。