一种基于赛汝生产调度的鲁棒优化方法、装置和设备

文档序号：37642981发布日期：2024-04-18 18:07阅读：12来源：国知局

本技术涉及赛汝生产，特别是一种基于赛汝生产调度的鲁棒优化方法、装置和设备。

背景技术：

1、赛汝生产方式是基于多技能化工人和简单、易移动的设备等柔性资源，通过对人员、设备和产品的合理组织来实现高效率和高柔性的一种面向装配生产系统的新型生产组织模式。赛汝生产方式的核心理念是以小团队为基础的生产单元。这些被称为赛汝单元的团队由若干多技能化工人组成，能够灵活地完成分配的多项生产任务。其中，巡回式赛汝是指每个赛汝单元由一位或多位工人组成，其中，每名工人均能够独立完成分配给该赛汝单元的产品的全部装配任务，工人按照一定顺序随着产品装配工序位置移动。近年来，赛汝生产系统中的调度问题，尤其是工人分配调度问题以及产品批次调度问题逐渐受到关注。

2、然而，目前赛汝生产调度问题的研究大多是在假设系统参数已知且确定的基础上进行的，而现实的生产过程受多种不确定因素的影响，致使实际现场作业与生产调度计划存在偏差。所以，现有的赛汝生成调度方法仍存在一定的局限性。因此，有必要开发一种基于赛汝生产调度的鲁棒优化方法、装置和设备，以生成更为准确的赛汝生产调度方案，进而提高赛汝生产效率。

技术实现思路

1、鉴于上述问题，本技术实施例提供了一种基于赛汝生产调度的鲁棒优化方法、装置和设备，以便克服上述问题或者至少部分地解决上述问题。

2、本技术实施例的第一方面，提供了一种基于赛汝生产调度的鲁棒优化方法，所述方法包括：

3、创建初始化赛汝种群，每个种群个体表示一种赛汝构造-赛汝调度对，赛汝构造表示并行工作的赛汝单元数量和每个赛汝单元中的工人组合，赛汝调度表示为每个赛汝单元分配的待执行的产品批次；

4、将所述初始化赛汝种群划分为赛汝调度子代种群和赛汝构造子代种群；

5、通过强化学习模块获取所述赛汝调度子代种群和所述赛汝构造子代种群的状态空间信息，输出动作空间信息；所述状态空间信息表示当前的所述赛汝调度子代种群和所述赛汝构造子代种群的进化状态，所述动作空间信息用于指示下一次种群进化的目标为所述赛汝调度子代种群和/或所述赛汝构造子代种群；

6、根据所述动作空间信息，以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标，对所述赛汝调度子代种群和/或所述赛汝构造子代种群进行种群进化；

7、根据进化后的结果，计算奖励值；所述奖励值表示种群进化效率；

8、根据所述奖励值，更新所述强化学习模块；

9、利用更新后的所述强化学习模块重新获取状态信息，以利用新的动作空间信息重新进行种群进化，直至目标函数收敛，将所述赛汝调度子代种群和所述赛汝构造子代种群的最优解，确定为赛汝生产调度的最优方案。

10、本技术第二方面还提供了一种基于赛汝生产调度的鲁棒优化装置，所述装置包括：

11、种群创建模块，用于创建初始化赛汝种群，每个种群个体表示一种赛汝构造-赛汝调度对，赛汝构造表示并行工作的赛汝单元数量和每个赛汝单元中的工人组合，赛汝调度表示为每个赛汝单元分配的待执行的产品批次；

12、子代种群划分模块，用于将所述初始化赛汝种群划分为赛汝调度子代种群和赛汝构造子代种群；

13、强化学习模块，用于获取所述赛汝调度子代种群和所述赛汝构造子代种群的状态空间信息，输出动作空间信息；所述状态空间信息表示当前的所述赛汝调度子代种群和所述赛汝构造子代种群的进化状态，所述动作空间信息用于指示下一次种群进化的目标为所述赛汝调度子代种群和/或所述赛汝构造子代种群；

14、种群进化模块，用于根据所述动作空间信息，以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标，对所述赛汝调度子代种群和/或所述赛汝构造子代种群进行种群进化；

15、奖励值计算模块，用于根据进化后的结果，计算奖励值；所述奖励值表示种群进化效率；

16、更新模块，用于根据所述奖励值，更新所述强化学习模块；

17、最优方案确定模块，用于利用更新后的所述强化学习模块重新获取状态信息，以利用新的动作空间信息重新进行种群进化，直至目标函数收敛，将所述赛汝调度子代种群和所述赛汝构造子代种群的最优解，确定为赛汝生产调度的最优方案。

18、本技术实施例第三方面还提供了一种电子设备，包括存储器、处理器及存储在所述存储器上的计算机程序，所述处理器执行所述计算机程序以实现本技术实施例第一方面所述的基于赛汝生产调度的鲁棒优化方法中的步骤。

19、本技术实施例第四方面还提供了一种计算机可读存储介质，其上存储有计算机程序/指令，该计算机程序/指令被处理器执行时实现本技术实施例第一方面所述的基于赛汝生产调度的鲁棒优化方法中的步骤。

20、本技术实施例第五方面还提供了一种计算机程序产品，所述计算机程序产品在电子设备上运行时，使处理器执行时实现如本技术实施例第一方面所述的基于赛汝生产调度的鲁棒优化方法中的步骤。

21、本技术实施例提供的一种基于赛汝生产调度的鲁棒优化方法，所述方法包括：创建初始化赛汝种群，每个种群个体表示一种赛汝构造-赛汝调度对，赛汝构造表示并行工作的赛汝单元数量和每个所述赛汝单元中的工人组合，赛汝调度表示为每个所述赛汝单元分配的待执行的产品批次；将所述初始化赛汝种群划分为赛汝调度子代种群和赛汝构造子代种群；通过强化学习模块获取所述赛汝调度子代种群和所述赛汝构造子代种群的状态空间信息，输出动作空间信息；所述状态空间信息表示当前的所述赛汝调度子代种群和所述赛汝构造子代种群的进化状态，所述动作空间信息用于指示下一次种群进化的目标为所述赛汝调度子代种群和/或所述赛汝构造子代种群；根据所述动作空间信息，以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标，对所述赛汝调度子代种群和/或所述赛汝构造子代种群进行种群进化；根据进化后的结果，计算奖励值；所述奖励值表示种群进化效率；根据所述奖励值，更新所述强化学习模块；利用更新后的所述强化学习模块重新获取状态信息，以利用新的动作空间信息重新进行种群进化，直至目标函数收敛，将所述赛汝调度子代种群和所述赛汝构造子代种群的最优解，确定为赛汝生产调度的最优方案。

22、具体有益效果在于：

23、一方面，本技术给出了获取产品批次加工时间最坏情况下赛汝生产解目标值的方法。具体的，本技术以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标，进行种群进化，通过确定最优解，找到产品批次加工时间最坏情况下的最大完工时间最小值所对应的赛汝生产调度方案，从而可以成功地求解产品批次加工时间不确定下的赛汝生产问题，得到最优的赛汝生产调度方案。

24、另一方面，本技术利用强化学习模块进行协同进化，将赛汝调度子代种群的最优解用于辅助进行赛汝构造子代种群的种群进化，将赛汝构造子代种群的最优解用于辅助进行赛汝调度子代种群的种群进化。并在此过程中利用奖励值更新强化学习模块，所述奖励值表示种群进化效率，奖励值越大，意味着种群进化效率越高，解决方案的质量提升的越快，所选择的动作越好，从而实现了高效解决大规模赛汝生产问题，对于小规模算例，可以在比精确算法更短的时间内求得问题的精确解；对于大规模算例，可以在给定计算时间内得到最优解。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张玉利,温沐阳,宋士吉,范伟
技术所有人：北京理工大学
我是此专利的发明人

上一篇：水密连接器的制作方法
上一篇：一种汽车零配件端面打磨装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。