基于平衡指标自适应进化的跨域协同车间动态调度方法

文档序号：30976776发布日期：2022-08-02 23:31阅读：193来源：国知局

1.本发明涉及车间动态调度技术领域，更具体的说是涉及一种基于平衡指标自适应进化的跨域协同车间动态调度方法。

背景技术：

2.由于不同制造领域具有一定的相似性，在分布式车间环境中各领域的互补增效使得跨域协同效果良好。而任务与环境都可能出现动态变化及跨域协同场景的复杂特性，使得传统方法难以实现跨域协同的分布式车间动态调度。
3.在现有技术中，一些方法考虑使用传统算法改进与其他算法相结合的思想用于动态调度。由于这类算法对场景进行简化而对不考虑相关问题的异构性，难以对分布式车间环境进行细化求解，无法实现资源的合理均衡利用。在跨域协同优化问题中，问题通常有不确定因素较多的特点，上述算法在求解过程中鲁棒性较差，难以满足自适应要求。
4.还有一些方法考虑使用强化学习和深度学习模型预测任务需求，并对小批量独立任务或流程型任务进行调度。现有的强化学习算法通过与深度神经网络结合，并利用用户需求的变化和物联网设备的移动性等工业大数据进行模型训练，设计了具有一部分的强化学习模型用于分布式车间动态调度问题。但是，现有的强化学习模型只适用于特定场景；当任务、资源、环境和调度目标发生改变时，模型就不具适用性，需要针对新的场景重新训练，因此基于强化学习的动态调度算法存在难以自适应的问题，并且强化学习不需要先验知识，且需要大量数据支撑进行模型训练，使得模型学习效率低，时间长。
5.因此，对本领域技术人员来说，如何解决动态调度算法存在的自适应性较差和求解速度慢的缺点是亟待解决的问题。

技术实现要素：

6.有鉴于此，本发明提供了一种基于平衡指标自适应进化的跨域协同车间动态调度方法，以解决背景技术中存在的问题。
7.为了实现上述目的，本发明采用如下技术方案：一种基于平衡指标自适应进化的跨域协同车间动态调度方法，具体步骤包括如下：
8.对待调度任务进行离散间接编码；
9.完成所述离散间接编码后，对编码进行遍历从而转换序列，采用基于交换序列的算子产生新的编码个体；
10.采用基于平衡指标的自适应进化策略对所述编码个体进行评价约束，评价结果作为父代个体选择以及局部搜索选择的指标。
11.可选的，所述离散间接编码的具体过程为：当有n个计算任务和m个制造任务待调度时，将编码位分为制造任务和计算任务两部分，两段的长度分别为n和m，取值分别为0～(n-1)和0～(m-1)之间的正整数，且覆盖取值范围内的全部正整数。
12.可选的，交换序列的操作过程为：选择pop1和pop2为父代个体，分别作为实现对象
50％运行时间不等。
附图说明
34.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
35.图1为本发明的方法流程图；
36.图2为本发明的排序的离散整数编码示例图；
37.图3为本发明的以pop1为实现对象的交换序算法示意图；
38.图4为本发明的基于平衡指标的自适应策略流程图；
39.图5为本发明的动态调度算法框架图；
40.图6为本发明的系统结构图。
具体实施方式
41.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
42.本发明实施例1公开了一种基于平衡指标自适应进化的跨域协同车间动态调度方法，如图1所示，具体步骤包括如下：
43.s1、对待调度任务进行离散间接编码；
44.s2、完成离散间接编码后，对编码进行遍历从而转换序列，采用基于交换序列的算子产生新的编码个体；
45.s3、采用基于平衡指标的自适应进化策略对编码个体进行评价约束，评价结果作为父代个体选择以及局部搜索选择的指标。
46.基于平衡指标的自适应进化策略旨在使调度算法在不同场景下求解调度问题都具有良好性能，也就是说提高算法适应不同场景动态变化的能力，而不是只对单一场景进行求解。s2说明的是一种新个体产生方式，类似于遗传算法中的交叉变异操作，旨在扩大算法搜索的空间，以获增强种群的多样性增强算法的搜索性能。两个策略都是对解集的操作，但侧重点是不同的。s3通过指标对个体进行评价以获取多样性和收敛性更好的解，增强算法适应不同场景的动态求解能力；s2通过产生新解扩大算法的搜索范围。
47.为了避免求解过程中产生不可行解，提高多目标进化算法的搜索效率。本发明采用离散间接编码方式，编码位表示为任务分配制造资源或计算资源时的优先级。具体来说，当有n个计算任务和m个制造任务待调度时，将编码位分为制造任务和计算任务两部分，两段的长度分别为n和m，取值分别为0～(n-1)和0～(m-1)之间的正整数，且覆盖取值范围内的全部正整数。图2为5个计算任务与制造任务编码的示例。
48.上述对待调度任务的离散整数编码完成后，采用基于交换序的算子产生新的编码个体。本实施例中算子的伪代码如算法1所示。
[0049][0050]
首先需要选择两个父代个体，分别作为实现对象与参考对象，以得到参考对象到实现对象的转换过程序列。这里，pop1为实现对象，pop2为参考对象。遍历pop1和pop2中的编码位，通过查找比较之后得到由pop2向pop1转换的交换对序列。更具体地，对于pop2[i]的数值，在pop1中寻找与其相同的编码位，并记录该编码位在pop1中的编号j，然后将交换对(i,j)存入交换对序列v中。完成对两个被选择个体的遍历后，即可获得一个长度不定的交换对序列。也就是说，若将得到的交换对序列作用于pop2之后，可以得到pop1。
[0051]
上述交换序方法的操作过程详细如图3所示，与伪代码对应，图3中依然选择pop1和pop2为父代个体，分别作为实现对象和参考对象，交换概率设置为0.5。遍历pop1中的每一个编码位上的数值，在pop2中寻找其所在位置，以0.5的概率获取交换对，如(2.4)，(2.7)等，最终得到pop2到pop1交换对序列。可以通过依据该交换对序列对某一个体进行操作，得到新个体；也可以不设置交换概率，而通过限制交换序列的长度来得到交换对序列。由于，编码位中制造任务与计算任务独立，在产生新解的过程中对制造任务编码位与计算任务编码位分别进行操作。
[0052]
区别于单一场景的静态调度任务，本发明针对跨域协同分布式车间动态调度，在完成编码设计和确定调度算子后，还要考虑如何能在不同的场景下仍然保持良好的求解能力。据此，本发明提出了一种基于平衡指标的自适应进化策略来适应多场景环境。
[0053]
在多目标进化算法中，收敛性与多样性的平衡对算法性能至关重要，为了能提升算法求速度，设计了基于收敛性与多样性指标设计解的评价机制，以该评价结果作为父代个体选择以及局部搜索选择的指标，即该评价值越小，个体被选中的概率越大。具体计算思路如下：
[0054]
设某动态调度问题的优化目标如式(1)所示，共m个优化目标。定义收敛性指标与多样性指标求解如式(2)和(3)，fc(x)是反映解与pof(帕累托最优前沿)之间距离的收敛分量，是度量解x在目标空间中相对于fm轴的位置的多样性分量。如式(4)，将各个目标
对应的多样性分量的平均值作为解x的多样性指标值。
[0055]
min f(x)＝min(f1(x),f2(x),...,fm(x))
ꢀꢀꢀ
(1)
[0056]
fc(x)＝d(r,f(x))
ꢀꢀꢀ
(2)
[0057][0058][0059]
其中，r表示位于pof上距离
x
最近的点的目标函数值，d(r,f(x))表示他们之间的距离，vm＝(0,...,1m,...,0)是m维向量，θ(vm,f(x)-z
*
)表示vm与f(x)-z
*
的夹角，z
*
为参考点。
[0060]
则收敛性与多样性二者的平衡指标定义如式(5)所示：
[0061]
b_fit(x)＝η1fc(x)+η2fd(x)
ꢀꢀꢀ
(5)
[0062]
η1表示收敛分量fc(x)的权重，η2表示表示多样性分量fd(x)的权重。
[0063]
算法思路具体如下，首先利用上述公式分别计算种群中每个个体的多样性分量和收敛性分量，加权得到本发明设计的平衡指标。然后将种群个体按照平衡指标值增序排序。最后选出当前种群平衡指标最小的个体1，并通过轮盘赌策略选出个体2。整体流程如图4所示。
[0064]
基于平衡指标的自适应进化策略具体伪代码如下所示：
[0065][0066]
综合以上技术方案，本发明的整体实现过程如图5所示。算法初始化完成后，对当前分布式车间环境进行动态检测。当发生变化时，采取不确定性动态环境动态相应策略进行动态调整。环境未发生变化时，采用全局搜索策略和局部搜索策略结合，全局搜索策略中采用基于平衡指标的自适应进化策略，搜索完成后进行目标函数值计算并更新种群和pareto前沿解集，然后重复迭代，到达终止条件后退出输出调度方案。需要说明的是，本发明的重点在于其中的算法初始化编码方式和基于平指标的自适应进化策略。
[0067]
本发明实施例2提供一种基于平衡指标自适应进化的车间动态调度系统，如图6所示，包括变量编码模块、算子计算模块、进化策略模块；其中，
[0068]
变量编码模块，用于对待调度任务进行离散间接编码；
[0069]
算子计算模块，用于完成离散间接编码后，对编码进行遍历从而转换序列，采用基
于交换序列的算子产生新的编码个体；
[0070]
进化策略模块，用于采用基于平衡指标的自适应进化策略对编码个体进行评价约束，评价结果作为父代个体选择以及局部搜索选择的指标。
[0071]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0072]
对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赖李媛君彭程郭富强张霖任磊
技术所有人：北京航空航天大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。