1.一种机器视角下的模仿学习动态调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的机器视角下的模仿学习动态调度方法,其特征在于,根据制定的加工工序列表和空闲智能体的列表,获得调度问题的方法包括:
3.根据权利要求2所述的机器视角下的模仿学习动态调度方法,其特征在于,基于通过训练的神经网络模型,获得强化学习智能体的方法包括:
4.根据权利要求3所述的机器视角下的模仿学习动态调度方法,其特征在于,基于所述强化学习智能体对所述调度问题进行处理,获得某一或某些加工工序最优化的调度方案的方法包括:
5.一种机器视角下的模仿学习动态调度系统,其特征在于,包括:获得模块、训练模块和优化模块;
6.根据权利要求5所述的机器视角下的模仿学习动态调度系统,其特征在于,所述获得模块包括:订单数据获得单元、智能体数据获得单元、调度规则制定单元和决策单元;
7.根据权利要求6所述的机器视角下的模仿学习动态调度系统,其特征在于,所述训练模块包括:互动单元和更新单元;
8.根据权利要求7所述的机器视角下的模仿学习动态调度系统,其特征在于,所述优化模块包括:构建单元、判别单元、奖励单元和决策单元;