一种智能决策算法与仿真平台的联合互锁调用方法

文档序号:34072081发布日期:2023-05-06 19:16阅读:31来源:国知局
一种智能决策算法与仿真平台的联合互锁调用方法

本申请涉及联合仿真,尤其涉及一种智能决策算法与仿真平台的联合互锁调用方法。


背景技术:

1、智能决策算法通过从样本中学习自我进化,在复杂非线性系统的控制、智能体在复杂环境下的决策等场景中已取得一系列突出成果。依据其特点,其适用性要求能够同仿真平台进行交互。

2、现有智能决策算法对主动控制仿真平台、进行交互有较高要求,即需要算法能够决定仿真平台何时进行一步仿真或重置状态。而大量用于工业控制、自动驾驶等领域的仿真平台要求算法作为一个部件嵌入,由仿真平台进行调度。两者均要求主导程序执行流程的控制权,导致结合两者、在仿真平台上进行智能决策算法开发受到阻碍,难以通用地将智能决策算法应用于仿真平台进行联合仿真。


技术实现思路

1、针对上述问题,提出了提出一种智能决策算法与仿真平台的联合互锁调用方法,用于解决智能决策算法与仿真平台交互时存在的控制权冲突问题。

2、本申请第一方面提出一种智能决策算法与仿真平台的联合互锁调用方法,包括:

3、在智能决策算法处创建算法侧模块,在仿真平台处创建平台侧模块,并进行总初始化操作,其中,所述算法侧模块与所述平台测模块在同一个进程的两个线程内分别运行;

4、分别对所述算法侧模块和所述平台侧模块进行重置操作,并重置共享上下文状态;

5、分别对所述算法侧模块和平台侧模块进行步进操作,并借助所述共享上下文进行数据交换;

6、在所述智能决策算法要求重置称为一个采样循环时,停止步进操作;

7、反复执行所述采样循环直至所述智能决策算法运行结束。

8、可选的,所述在智能决策算法处创建算法侧模块,在仿真平台处创建平台侧模块,并进行总初始化操作,包括:

9、创建所述共享上下文,其中,所述共享上下文包括待订阅消息、待发布消息、初次重置的状态和同步屏障;

10、传入所述共享上下文作为所述算法侧模块的字段,并在第一线程上运行;

11、传入所述共享上下文作为所述平台侧模块的字段,向所述仿真平台注册需要订阅和需要发布的消息名称,并在第二线程上运行。

12、可选的,所述算法侧模块与所述平台侧模块均采用重置与步进接口,其中,

13、所述算法侧模块的重置接口由所述智能决策算法调用,用于要求仿真平台重置;

14、所述平台侧模块的重置接口由所述仿真平台在状态重置时调用,用于通知所述智能决策算法重置状态准备新一轮仿真;

15、所述算法侧模块的步进接口由所述智能决策算法调用,用于输入一个控制信号给所述仿真平台,要求所述仿真平台进行一步仿真,并返回新的观测信息用于后续决策;

16、所述平台侧模块的步进接口由所述仿真平台调用,用于通知所述智能决策算法进行一步仿真。

17、可选的,所述同步屏障,用于:

18、执行等待操作,使到达所述同步屏障处的线程进行等待,直至所有线程都到达此点才可继续执行下文;

19、执行破坏操作,使所述同步屏障进入破坏状态,所有正在所述同步屏障上等待的线程将被唤醒并抛出异常;

20、执行复位操作,使所述同步屏障恢复至正常状态,可以再次接受线程等待。

21、可选的,所述同步屏障,包括:

22、根据功能将所述同步屏障分为重置发起锁、重置完成锁、消息订阅锁和消息读取锁。

23、可选的,所述对所述算法侧模块进行重置操作,包括:

24、若所述初次重置的状态为假,对所述重置完成锁等待,等待结束后,将所述重置发起锁复位;

25、对所述重置完成锁等待,等待结束后,将所述重置完成锁复位,所述算法侧模块重置完成。

26、可选的,所述对平台侧模块进行重置操作,包括

27、对所述重置发起锁等待,等待结束后,清空所述待发布消息和所述待订阅消息;

28、对所述重置完成锁等待,等待结束后,所述平台侧模块重置完成。

29、可选的,所述对所述算法侧模块进行步进操作,包括:

30、将传入的控制信号存入所述共享上下文的待发布消息中,对所述消息订阅锁等待,等待结束后,将所述消息订阅锁复位;

31、从所述共享上下文的待订阅消息中读取观测信息,存入待返回的临时变量中;

32、对所述消息读取锁等待,等待结束后,将所述消息读取锁复位;

33、将位于所述临时变量中的观测信息返回给所述智能决策算法,所述算法侧模块步进完成。

34、可选的,所述对平台侧模块进行步进操作,包括:

35、从所述仿真平台读取观测信息,存入所述共享上下文的待订阅消息字段中;

36、在异常处理作用域内对所述消息订阅锁等待,若等待抛出异常,将所述消息订阅锁复位,并通知所述仿真平台重置仿真,结束平台侧模块步进;

37、根据所述共享上下文获取待发布消息,并向所述仿真平台发布;

38、对所述消息读取锁等待,等待结束后,算法侧模块步进完成

39、可选的,所述方法还包括:

40、在所述消息订阅锁等待时,若所述第一线程调用步进,则仿真继续进行;

41、在所述消息订阅锁等待时,若所述第一线程调用重置,在所述第二线程结束处于所述消息订阅锁等待的挂起状态后,再继续进行仿真。

42、本申请的实施例提供的技术方案至少带来以下有益效果:

43、在智能决策算法侧和仿真平台侧各部署一个功能模块,通过线程同步原语实现协调,以解决智能决策算法与仿真平台交互时存在的控制权冲突问题,由于智能决策算法侧和仿真平台侧模块均只需被动接受调用,只需在本发明基础上按需对接仿真平台与智能决策算法所需的数据接口,对既有算法框架影响低,且依赖于少量线程同步原语,在同一进程内解决控制权冲突,保证了高通信效率,性能损失小。

44、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。



技术特征:

1.一种智能决策算法与仿真平台的联合互锁调用方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述在智能决策算法处创建算法侧模块,在仿真平台处创建平台侧模块,并进行总初始化操作,包括:

3.根据权利要求1所述的方法,其特征在于,所述算法侧模块与所述平台侧模块均采用重置与步进接口,其中,

4.根据权利2所述的方法,其特征在于,所述同步屏障,用于:

5.根据权利要求3所述的方法,其特征在于,所述同步屏障,包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述算法侧模块进行重置操作,包括:

7.根据权利要求1所述的方法,其特征在于,所述对所述平台侧模块进行重置操作,包括

8.根据权利要求1所述的方法,其特征在于,所述对所述算法侧模块进行步进操作,包括:

9.根据权利要求1所述的方法,其特征在于,所述对平台侧模块进行步进操作,包括:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:


技术总结
本申请提出了一种智能决策算法与仿真平台的联合互锁调用方法,涉及联合仿真技术领域,包括在智能决策算法处创建算法侧模块,在仿真平台处创建平台侧模块,并进行总初始化操作,其中,算法侧模块与平台测模块在同一个进程的两个线程内分别运行;分别对算法侧模块和平台侧模块进行重置操作,并重置共享上下文状态;分别对算法侧模块和平台侧模块进行步进操作,并借助共享上下文进行数据交换;在智能决策算法要求重置称为一个采样循环时,停止步进操作;反复执行采样循环直至智能决策算法运行结束。本申请在智能决策算法侧和仿真平台侧各部署一个功能模块,且仅依赖于少量线程同步原语,在同一进程内解决控制权冲突,保证了高通信效率,性能损失小。

技术研发人员:李升波,蒋宇轩,占国建,兰志前,任彦刚,吕尧,王建强,成波,李克强
受保护的技术使用者:清华大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1