一种面向个性化生产环境的多主体调度方法与流程

文档序号：14347923阅读：121来源：国知局

本发明涉及生产系统性能优化领域，具体为一种面向个性化生产环境的多主体调度方法。

背景技术：

文献“ahybridalgorithmbasedonanewneighborhoodstructureevaluationmethodforjobshopschedulingproblem.computers&industrialengineering,2015,88:417-42”公开了一种基于混合调度算法的生产系统性能优化方法。该方法首先用粒子群算法对调度的最大完工时间进行全局优化，然后用变邻域搜索算法进行局部优化，以最小化调度的最大完工时间。该方法获得的调度方案由于最大完工时间更小，因而可以提高制造企业的生产效率、改善生产资源的利用率并减少生产成本，但该方法仅适用于传统的规模化生产模式。

在规模化生产模式下，制造企业通常将不同用户的需求合并处理而不加以区分，然后以资源方的相关目标(如最大完工时间)优化调度，以降低企业的制造成本并提高生产效益。但是，随着全球市场竞争日益加剧、制造业信息化飞速发展，传统的企业运作模式已经从规模化生产模式快速地转向个性化定制生产。在个性化生产环境下，每个用户都会有各自的定制任务以及相应的差异化目标，此时若仍采用以资源方主导的调度控制方法，便难以满足用户的差异化目标要求，这将影响用户的群体满意度并降低制造企业的行业竞争力。

要解决好个性化生产环境下的调度控制问题，就需要调度的优化目标由原来主要考虑资源相关的目标转向同时考虑资源和各用户的差异化目标；调度决策的主体由资源方的单一主体转变为资源方和多用户共同组成的多主体。由此便产生了一种新型调度模式——面向个性化生产环境的多主体调度。

技术实现要素：

针对现有以资源方为主的调度方法难以满足个性化生产环境下多用户的差异化目标需求的问题，本发明提出一种面向个性化生产环境的多主体调度方法。该方法先令资源方和各用户都为具有自主行为决策能力的调度主体(即资源自主体和用户自主体)，并由资源自主体随机生成一个初始调度方案提交给各用户自主体以开始多主体调度；然后资源自主体与用户自主体通过交替提案(用户自主体接收资源自主体的提案，然后用户自主体修改提案并反馈修改提案给资源自主体，接着资源自主体生成新的提案并提交给各用户自主体)进行调度协商，而当用户自主体与资源自主体未能达成协商时，存在冲突的用户自主体间将启动交替提案进行调度协商；如果资源自主体和用户自主体协商全部达成，则输出协商一致的多主体调度方案，否则采用预置的仲裁规则消除余下的冲突并生成最终的多主体调度方案。由于该方法充分发挥了资源和各用户的自主性，可以充分满足各主体的目标要求，提高结果调度的群体满意度。

本发明的技术方案为：

所述一种面向个性化生产环境的多主体调度方法，其特征在于：包括以下步骤：

步骤1，初始化多主体调度：

(a)各用户自主体与资源自主体建立通信，以确定参与多主体调度的自主体集合{a0,a1,a2,...,ai,...,an}，其中a0代表资源自主体，ai,i＝1,2,...,n代表各用户自主体；

(b)资源自主体a0与各用户自主体ai,i＝1,2,...,n通信，以确定多主体调度的加工任务集t＝{t1,t2,...,ti,...,tn}，其中ti为用户自主体ai的加工任务；

(c)各自主体ai,i＝0,1,2,...,n设置各自的最大化调度目标函数oi,i＝0,1,2,...,n，并按式(1)初始化各自的协商策略si；

式中，为自主体ai在已协商时间为ti时的提案的目标函数值，βi为自主体ai的协商策略调整因子，为自主体ai的理想目标函数值，为自主体ai可接受的最小目标函数值，为自主体ai的协商截止时间；

(d)各用户自主体ai,i＝1,2,...,n按式(2)初始化自身的接受条件ci,i＝1,2,...,n；

式中，πi,j为自主体ai收到的来自自主体aj的调度提案，oi(πi,j)为自主体ai在调度提案πi,j下的目标函数值；

(e)各自主体ai,i＝0,1,2,...,n按式(3)初始化各自的协商条件ni,i＝0,1,2,...,n；

步骤2，启动多主体调度：

资源自主体a0初始化协商约束集为空r＝{}，然后以多主体调度加工任务集t为调度对象，采用式(4)所示的方式生成一个调度方案π0，并将该调度方案作为初始提案提交给各用户自主体ai,i＝1,2,...,n以开始多主体调度；

步骤3，启动协商对象的协商信息在线学习：

当协商对象为自主体aj时，在自主体aj提交新的提案后更新其历史提案信息集，然后以历史提案以及相应的提案时间作为输入，采用随机梯度下降方法优化式(5)所示的协商策略模型，以学习自主体aj的协商策略sj；根据学习获得的自主体aj的近似协商策略求得自主体aj的理想目标函数值的估计值可接受的最小目标函数值的估计值以及协商截止时间的估计值

式中，为自主体aj在已协商时间为tj时的提案的目标函数值估计值，为自主体aj的协商策略调整因子的估计值，aj,bj,cj为常量参数；

步骤4，用户自主体与资源自主体协商调度：用户自主体与资源自主体通过不断的交替提案和修改提案，最终获得多主体协商一致的多主体调度方案：

步骤4.1，用户自主体自主行为决策：

(a)当用户自主体ai接收到来自资源自主体a0的调度提案πi,0后，通过步骤2学习资源自主体a0的协商信息综合资源自主体a0的协商信息x0以及用户自主体ai的协商信息用户自主体ai采用式(6)修改其协商策略调整因子，然后代入式(1)以调整自身的协商策略si

βi＝βi+gi(x0,xi)(6)

式中，gi(.)为用户自主体ai采用的协商策略调整函数；

(b)用户自主体ai采用调整后的协商策略si，更新自身在当前已协商时间为ti时的提案的目标函数值调整自身的接受条件ci和协商条件ni，并以此控制协商过程：如果ci＝1则通知资源自主体a0接受当前提案并完成协商，否则计算ni；如果ni＝0，则通知资源自主体a0拒绝当前提案并放弃协商，否则用户自主体ai转步骤(c)继续向资源自主体a0提案；

(c)在满足协商约束集r的条件下，用户自主体ai按式(7)，以资源自主体a0的提案πi,0为基础，采用局部搜索算法获得满足自身的目标值的调度方案，然后将该方案作为反馈提案π0,i提交给资源自主体a0；

步骤4.2，资源自主体自主行为决策：

(a)资源自主体等待并接收所有未结束协商的用户自主体的反馈信息：如果用户自主体ai接受提案，则资源自主体a0记录用户自主体ai完成协商并更新协商约束集r；如果用户自主体ai拒绝提案，则资源自主体a0识别与用户自主体ai冲突的用户自主体aj，然后转步骤5；如果用户自主体ai反馈提案π0,i，则转步骤2学习用户自主体ai的协商信息

(b)资源自主体a0判断多主体调度是否完成：按式(8)计算判断条件c0，如果c0＝1，则多主体调度完成并转步骤6，否则转步骤(c)继续协商；

式中，bi为用户自主体ai的协商状态标志：bi＝0代表放弃协商，bi＝1代表继续协商，bi＝2代表完成协商；

(c)综合资源自主体a0自身的协商信息x0以及各未完成协商的用户自主体的协商信息{x1,x2,...}，资源自主体a0采用式(9)修改其协商策略调整因子，并代入式(1)更新自身的协商策略s0；

β0＝β0+g0(x0,x1,x2,...)(9)

式中，g0(.)为资源自主体a0采用的协商策略调整函数；

(d)资源自主体a0采用调整后的协商策略s0，更新自身在当前已协商时间为t0时的提案的目标函数值按式(3)调整自身的协商条件n0来控制协商过程：如果ni＝0，则资源自主体a0放弃继续多主体调度并转步骤6，否则在满足协商约束集r的条件下，资源自主体a0修改提案并使新的调度方案π0满足自身当前的目标函数值然后将调度方案π0提交给所有未完成协商的用户自主体；

步骤5，用户自主体ai与存在调度冲突的用户自主体aj协商调度：

步骤5.1，用户自主体aj判断是否接受用户自主体ai的协商请求；如果接受协商，则转步骤5.2，否则用户自主体aj拒绝与用户自主体ai的调度协商转步骤5.3；

步骤5.2，用户自主体ai与用户自主体aj调度协商：

(a)用户自主体aj自主行为决策：用户自主体aj接收来自用户自主体ai的调度提案πj,i后，通过步骤2学习用户自主体ai的协商信息并更新自身的协商策略sj，调整自身的接受条件cj和协商条件nj；如果继续提案，则在满足协商约束集r的情况下，以用户自主体ai的提案πj,i为基础，用户自主体aj采用局部搜索算法获得满足自身的目标值的调度方案，然后将该方案作为反馈提案πi,j提交给用户自主体ai，否则用户自主体aj结束协商并转步骤5.3；

(b)用户自主体ai自主行为决策：用户自主体ai接收来自用户自主体aj的反馈调度提案πi,j后，通过步骤2学习用户自主体aj的协商信息并更新自身的协商策略si，调整自身的接受条件ci和协商条件ni；如果继续提案，则在满足协商约束集r的情况下，以用户自主体aj的反馈提案πi,j为基础，用户自主体ai采用局部搜索算法获得满足自身的目标值的调度方案，然后将方案作为新的提案πj,i提交给用户自主体aj，否则用户自主体ai结束协商并转步骤5.3；

步骤5.3，转步骤4.2的步骤(a)向资源自主体反馈协商结果：如果用户自主体ai和用户自主体aj达成协商，则将达成一致的调度方案πi,j作为用户自主体ai和用户自主体aj的共同提案提交给资源自主体a0；否则用户自主体ai通知资源自主体a0放弃协商并接受最终的多主体调度方案；

步骤6，如果多主体调度完成，则输出资源自主体和所有用户自主体协商一致的调度方案π0,1,...,m；否则对协商约束集r以外协商未达成一致的加工任务采用预置的仲裁规则进行调度，生成最终的多主体调度方案π0,1,...,m并输出。

有益效果

本发明的有益效果是：相较于传统调度以资源作为唯一的调度主体，本发明令资源和各用户同时具备自主调度决策的能力，使调度决策由以资源为单一主体的传统调度转为以资源和各用户共同参与的多主体调度，从而适应个性化生产环境下资源和各用户的差异化目标需求；用户和资源通过基于交替提案的协商调度可以充分满足自身的目标，同时各主体通过在线学习可以充分了解协商对象，进而更加合理地调整自身的协商策略，做出有利于满足自身目标、有益于达成协商一致的调度决策；当用户和资源间无法直接达成一致时，还可以通过用户与用户间的协商调度充分挖掘冲突消解的空间以改进多主体调度方案；如果各主体最终未能达成协商一致的多主体方案，仲裁决策将按既定的规则生成最终的方案，由于该方案是否能满足各主体的目标是不确定的，这将激励各主体积极参与协商并理性地进行调度决策，从而尽可能达成协商一致的多主体调度方案。总之，本发明提出的多主体调度能发挥资源和各用户的自主性，并充分满足各主体的目标要求，提高结果调度的群体满意度。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明面向个性化生产环境的多主体调度方法的框架图。

图2是本发明方法的自主体间协商调度的流程图。

图3是本发明方法的自主体自主行为决策的流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

参照图1-3，本发明面向个性化生产环境的多主体调度方法的具体步骤如下：

步骤1，初始化多主体调度：

(a)各用户自主体与资源自主体建立通信以确定参与多主体调度的自主体集合{a0,a1,a2,...,ai,...,an}，其中a0代表资源自主体，ai,i＝1,2,...,n代表各用户自主体；

(b)资源自主体a0与各用户自主体ai,i＝1,2,...,n通信以确定多主体调度的加工任务集t＝{t1,t2,...,t1,...,tn}，其中ti为用户自主体ai的加工任务；

(c)资源自主体a0和各用户自主体ai,i＝1,2,...,n设置各自的最大化调度目标函数oi,i＝0,1,2,...,n并按式(1)初始化各自的协商策略si；

(d)各用户自主体ai,i＝1,2,...,n以式(2)初始化自身的接受条件ci,i＝1,2,...,n；

式中，πi,j为自主体ai收到的来自自主体aj的调度提案，oi(πi,j)为自主体ai在调度提案πi,j下的目标函数值；

(e)资源自主体a0和各用户自主体ai,i＝1,2,...,n以式(3)初始化各自的协商条件ni,i＝0,1,2,...,n。

步骤2，启动多主体调度：资源自主体a0初始化协商约束集为空r＝{}，然后以多主体调度加工任务集t为调度对象，采用式(4)所示的方式生成一个调度方案π0，并将该调度方案作为初始提案提交给各用户自主体ai,i＝1,2,...,n以开始多主体调度。其具体步骤为：

步骤3，启动协商对象的协商信息在线学习：当协商对象为自主体aj时，在自主体aj提交新的提案后更新其历史提案信息集，然后以历史提案以及相应的提案时间作为输入，采用随机梯度下降方法优化式(5)所示的协商策略模型，以学习自主体aj的协商策略sj；根据学习获得的自主体aj的近似协商策略求得自主体aj的理想目标函数值的估计值可接受的最小目标函数值的估计值以及协商截止时间的估计值其具体步骤如下：

式中，为自主体aj在已协商时间为tj时的提案的目标函数值估计值，为自主体aj的协商策略调整因子的估计值，aj,bj,cj为常量参数。

(a)接收来自协商对象aj的第p提案信息其中，为协商对象aj提交第p提案时的已协商时间；

(b)更新协商对象的历史提案信息集：

(c)以目标函数集{o1,o2,....,oq,...,om}中的每个目标函数评估协商对象aj的提案并记录各目标函数的值{o1,p,o2,p,...,oq,p,...,om,p}，其中，oq,p,q＝1,2,...,m为目标函数oq在协商对象aj的提案下的值；

(d)更新协商对象历史提案的目标值数据集：

(e)令和采用随机梯度下降法，对式(5)所示的协商策略模型进行优化，以学习协商对手的协商策略；然后分别记录下在各目标函数oq,q＝1,2,...,m下，学习后的模型的最小平方误差及相应的协商策略模型的参数的估计值

(f)令协商对象aj的目标函数oj为对应的目标函数oθ,θ∈{1,2,...,m}，并令协商对象aj的近似协商策略为然后联立式和求得协商对象aj的理想目标函数值的估计值可接受的最小目标值的估计值以及协商截止时间的估计值

步骤4，用户自主体与资源自主体协商调度：用户自主体与资源自主体通过不断的交替提案和修改提案，最终获得多主体协商一致的多主体调度方案。

步骤4.1，用户自主体自主行为决策：

(a)当用户自主体ai接收到来自资源自主体a0的调度提案πi,0后，通过步骤2学习资源自主体a0的协商信息综合资源自主体a0的协商信息x0以及用户自主体ai的协商信息用户自主体ai采用式(6)修改其协商策略调整因子，然后代入式(1)以调整自身的协商策略si。具体步骤如下：

βi＝βi+gi(x0,xi)(6)

式中，gi(.)为用户自主体ai采用的协商策略调整函数。

当用户自主体ai收到来自资源自主体a0的调度提案πi,0后，记录资源自主体a0当前已协商时间t0；

将资源自主体a0的已协商时间t0和调度提案πi,0提交步骤2学习并获得资源自主体a0的协商信息x0：理想目标函数值可接受的最小目标值以及协商截止时间

用户自主体ai依据学习获得的资源自主体的协商信息x0以及用户自主体ai自身的协商信息xi，通过式(6)在线推理并修改用户自主体ai的协商策略调整因子：

用户自主体ai将修改后的协商策略调整因子βi代入式(1)，调整自身的协商策略si。

(c)在满足协商约束集r的条件下，用户自主体ai按式(7)，以资源自主体a0的提案πi,0为基础，采用局部搜索算法获得满足自身的目标值的调度方案，然后将该方案作为反馈提案π0,i提交给资源自主体a0。

步骤4.2，资源自主体自主行为决策：

(a)资源自主体等待并接收所有未结束协商的用户自主体的反馈信息：如果用户自主体ai接受提案，则资源自主体a0记录用户自主体ai完成协商并更新协商约束集r；如果用户自主体ai拒绝提案，则资源自主体a0识别与用户自主体ai冲突的用户自主体ai，然后转步骤5；如果用户自主体ai反馈提案π0,i，则转步骤2学习用户自主体ai的协商信息具体步骤如下：

资源自主体a0等待所有未完成协商的用户自主体ai的反馈信息：如果用户自主体ai反馈的是协商决策信息，则转步骤2；如果反馈的是调度提案，则转步骤3；如果用户自主体ai接受当前提案，则资源自主体a0记录用户自主体ai完成协商，同时将用户自主体ai的加工任务所在的时间区间加入协商约束集r，位于协商约束集r中的时间区间其他用户自主体的加工任务不得占用；如果用户自主体ai不同意当前提案并退出与资源自主体a0的协商，那么资源自主体a0将识别与用户自主体ai在调度方案上存在冲突的用户自主体aj并转步骤5。

资源自主体a0接收来自用户自主体ai的反馈方案π0,i并记录用户自主体ai的已协商时间ti，并转步骤2学习用户自主体ai的协商信息xi：理想的目标函数值可接受的最小目标值以及协商截止时间

资源自主体a0判断是否所有未结束协商的用户自主体都已提交了反馈方案：如果都已提交，转步骤(b)；否则继续等待并接收用户自主体的反馈信息。

(b)资源自主体a0判断多主体调度是否完成：按式(8)计算判断条件c0，如果c0＝1，则多主体调度完成并转步骤6，否则转步骤(c)继续协商。

式中，bi为用户自主体ai的协商状态标志：bi＝0代表放弃协商，bi＝1代表继续协商，bi＝2代表完成协商。

(c)综合资源自主体a0自身的协商信息x0以及各未完成协商的用户自主体的协商信息{x1,x2,...}，资源自主体a0采用式(9)修改其协商策略调整因子，并代入式(1)更新自身的协商策略s0。具体步骤为：

β0＝β0+g0(x0,x1,x2,...)(9)

式中，g0(.)为资源自主体a0采用的协商策略调整函数。

资源自主体a0依据学习获得的各用户自主体ai的协商信息xi：理想的目标函数值可接受的最小目标值以及协商截止时间和资源自主体a0自身的协商信息x0，通过式(9)在线推理并修改资源自主体a0的协商策略调整因子：

资源自主体a0将修改后的协商策略调整因子β0代入式(1)，调整自身的协商策略s0。

步骤5，用户自主体ai与存在调度冲突的用户自主体aj协商调度：

步骤5.2，用户自主体ai与用户自主体aj调度协商：

当用户自主体aj收到来自用户自主体ai的调度提案πj,i后，记录用户自主体ai当前已协商时间ti；

将用户自主体ai的已协商时间ti和调度提案πi提交步骤2，学习并获得用户自主体ai的协商信息xi：理想目标函数值可接受的最小目标值以及协商截止时间

用户自主体aj依据学习获得的用户自主体ai的协商信息xi以及用户自主体aj自身的协商信息xj，在线推理并修改用户自主体ai的协商策略调整因子：

用户自主体aj将修改后的协商策略调整因子βj代入式(1)，调整自身的协商策略sj。用户自主体aj采用调整后的协商策略sj，更新自身在当前已协商时间为tj时的提案的目标函数值调整自身的接受条件cj和协商条件nj，并以此控制协商过程：如果cj＝1则通知用户自主体ai接受当前提案并完成协商，否则计算nj；如果nj＝0，则通知用户自主体ai拒绝当前提案并放弃协商，否则用户自主体aj继续向用户自主体ai提案。

在满足协商约束集r的情况下，以用户自主体ai的提案πj,i为基础，用户自主体ai采用局部搜索算法获得满足自身当前的目标值的调度方案，然后将该方案作为反馈提案πi,j提交给用户自主体ai。

(b)用户自主体ai自主行为决策：用户自主体ai接收来自用户自主体aj的反馈调度提案πi,j后，通过步骤2学习用户自主体aj的协商信息并更新自身的协商策略si，调整自身的接受条件ci和协商条件ni；如果继续提案，则在满足协商约束集r的情况下，以用户自主体aj的反馈提案πi,j为基础，用户自主体ai采用局部搜索算法获得满足自身的目标值的调度方案，然后将方案作为新提案πj,i提交给用户自主体aj，否则用户自主体ai结束协商并转步骤5.3；具体步骤为：

当用户自主体ai收到来自用户自主体aj的反馈调度提案πi.j后，记录用户自主体aj当前已协商时间tj；

将用户自主体aj的已协商时间tj和调度提案πj提交步骤2，学习并获得用户自主体aj的协商信息xj：理想目标函数值可接受的最小目标值以及协商截止时间

用户自主体ai依据学习获得的用户自主体aj的协商信息xj以及用户自主体ai自身的协商信息xi，在线推理并修改用户自主体ai的协商策略调整因子：

用户自主体ai将修改后的协商策略调整因子βi代入式(1)，调整自身的协商策略si。用户自主体ai采用调整后的协商策略si，更新自身在当前已协商时间为ti时的提案的目标函数值调整自身的接受条件ci和协商条件ni，并以此控制协商过程：如果ci＝1则通知用户自主体aj接受当前提案并完成协商，否则计算ni；如果ni＝0，则通知用户自主体aj拒绝当前提案并放弃协商，否则用户自主体ai继续向用户自主体aj提案。

在满足协商约束集r的情况下，以用户自主体aj的提案πi,j为基础，用户自主体ai采用局部搜索算法获得满足自身的目标值的调度方案，然后将该方案作为反馈提案πj,i提交给用户自主体aj。

步骤5.3，转步骤4.2的步骤(a)向资源自主体反馈协商结果：如果用户自主体ai和用户自主体aj达成协商，则将达成一致的调度方案πi,j作为用户自主体ai和用户自主体aj的共同提案提交给资源自主体a0；否则用户自主体ai通知资源自主体a0放弃协商并接受最终的多主体调度方案。

步骤6，如果多主体调度完成，则输出资源自主体和所有用户自主体协商一致的调度方案π0,1,...,m；否则对协商约束集r以外的协商未达成一致的加工任务采用预置的仲裁规则进行调度，生成最终的多主体调度方案π0,1,...,m并输出。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙树栋;吴自高;肖世昌;俞少华;杨宏安;王军强;安凯;张家豪;陈丽珍
技术所有人：西北工业大学
我是此专利的发明人

上一篇：一种可扩充的移动式KTV包厢的制作方法
上一篇：一种烟花商店整体结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。