一种机器视角下的模仿学习动态调度方法及系统

文档序号:37642384发布日期:2024-04-18 18:05阅读:来源:国知局

技术特征:

1.一种机器视角下的模仿学习动态调度方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的机器视角下的模仿学习动态调度方法,其特征在于,根据制定的加工工序列表和空闲智能体的列表,获得调度问题的方法包括:

3.根据权利要求2所述的机器视角下的模仿学习动态调度方法,其特征在于,基于通过训练的神经网络模型,获得强化学习智能体的方法包括:

4.根据权利要求3所述的机器视角下的模仿学习动态调度方法,其特征在于,基于所述强化学习智能体对所述调度问题进行处理,获得某一或某些加工工序最优化的调度方案的方法包括:

5.一种机器视角下的模仿学习动态调度系统,其特征在于,包括:获得模块、训练模块和优化模块;

6.根据权利要求5所述的机器视角下的模仿学习动态调度系统,其特征在于,所述获得模块包括:订单数据获得单元、智能体数据获得单元、调度规则制定单元和决策单元;

7.根据权利要求6所述的机器视角下的模仿学习动态调度系统,其特征在于,所述训练模块包括:互动单元和更新单元;

8.根据权利要求7所述的机器视角下的模仿学习动态调度系统,其特征在于,所述优化模块包括:构建单元、判别单元、奖励单元和决策单元;


技术总结
本发明公开了一种机器视角下的模仿学习动态调度方法及系统,其中方法包括以下步骤:根据制定的加工工序列表和空闲智能体的列表,获得调度问题;构建并训练神经网络模型,基于通过训练的神经网络模型,获得强化学习智能体;基于所述强化学习智能体对所述调度问题进行处理,获得某一或某些加工工序最优化的调度方案。本发明通过自适应即时奖励重塑的提高学习效率,降低训练成本,在奖励构造方面提升模型的迁移能力以及普适性。

技术研发人员:王碧,夏乐,杨书新,黄伟东,吴剑青
受保护的技术使用者:江西理工大学
技术研发日:
技术公布日:2024/4/17
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1