基于多智能体TLBO算法的球磨机制粉优化控制方法与流程

文档序号：25602641发布日期：2021-06-25 12:27阅读：152来源：国知局

基于多智能体tlbo算法的球磨机制粉优化控制方法
技术领域
1.本发明涉及球磨机制粉的控制方法，特别涉及基于多智能体tlbo算法的球磨机制粉优化控制方法。

背景技术：

2.在工业生产领域，常常需要用到无机粉体。球磨机是常用的制粉设备，也是制粉系统的核心设备，在电力、化工、冶金、陶瓷等领域有着不可替代的地位。目前，陶瓷企业都采用大型球磨机进行粉磨，采用喷雾干燥塔进行造粒，用喷雾干燥塔制备的粉料含水率小，粒度分布范围满足成形要求，因此广泛应用于陶瓷自动化生产。球磨机是一个复杂的对象，具有时滞性大、耦合性强、变量多、非线性等特点。典型的球磨机系统模型可以看作是具有三个输入量和三个输出量，加上多干扰量的复杂系统，三个输入量即给煤量、热风量、再循环风量，三个输出量即进出口压差、入口负压、出口温度。使得实现其优化控制成为一个复杂的问题。
3.已有的球磨机制粉系统常用控制方法主要有常规比例积分微分(pid)控制，解耦控制、预测控制、模糊控制、自寻优控制、神经网络控制等。教与学优化(teaching
‑
learning
‑
based optimization，tlbo)算法是一种新型的智能优化技术，其利用群体信息进行启发式搜索。tlbo算法对优化对象的优化速度快，收敛特性强。但是tlbo算法在解决复杂高维问题时，表现容易陷入局部最优，多样性丢失过快等不足的问题。
4.如何对tlbo算法进行优化，使其可以更好地应用于球磨机制粉的优化控制方法中，是一项有待解决的技术问题。

技术实现要素：

5.本发明的目的在于克服现有技术的至少一个不足，提供一种基于多智能体tlbo算法的球磨机制粉优化控制方法。
6.本发明所采取的技术方案是：
7.本发明的第一个方面，提供：
8.基于多智能体tlbo算法的球磨机制粉优化控制方法，包括：
9.建立球磨机制粉控制模型；
10.对基本tlbo算法进行改进，包括教学因子tf的改进，改进之后的教学因子如式(1)：
[0011][0012]
式(1)中，令tf最大值tf
max
，tf
i
的初始值设计tf1＝1，iter_max表示最大迭代次数，iter表示当前迭代次数；
[0013]
建立控制器的状态空间模型，将改进的tlbo算法用于球磨机制粉系统控制器的参数优化。
[0014]
在一些实例中，基本tlbo算法的改进还包括多智能体构造，构造过程如下：
[0015]
构造多智能体状态空间函数：在多智能体系统中当选取未经过学习的学员表示为智能体的联合状态空间s＝[s1，s2，
…
s
n
]，式中：s1～s
n
是未经过学习的学员的多智能体状态空间；
[0016]
构造多智能体动作相位：使用联合动作相位a＝[a1，a2，
…
a
n
]
[0017]
式中：a1～a
n
为动作相位。
[0018]
在一些实例中，基本tlbo算法的改进还包括stackelberg博弈均衡：
[0019]
选取最优秀的学员作为领导者，目标函数为f
领导者
(x)
[0020]
f
领导者
(x)＝max(u
领导者智能体
(s，[a1，
…
a
n
]))
[0021][0022]
式中：ω
i
(s，[a1，
…
a
n
])学员群体中领导者智能体i的性能函数，θ
i
(s，[a1，
…
a
n
])学员群体中领导者智能体i的损失函数，n表示整个学员群体中领导者智能体的个数；
[0023]
最优化学员自身收益，目标函数为f
跟随者
(x)：
[0024]
f
跟随者
(x)＝max(u
跟随智能体
(s，[a1，
…
a
n
]))
[0025][0026]
式中：φ
i
(s，[a1，
…
a
n
])学员群体中跟随者智能体i的性能函数，学员群体中跟随者智能体i的损失函数，k整个学员群体中跟随者智能体的个数。
[0027]
在一些实例中，基本tlbo算法的改进还包括改进“学”阶段：
[0028]
多智能体tlbo算法依次选中每一个学员，然后挑选一个优秀的学员作为比较，基于自学习的学习过程为：
[0029][0030]
式(2)中：x
new，i
，表示第i个学员学习后的状态值；x
old，i
表示原来的状态值；r1，r2表示[0，1]之间的随机数。
[0031]
在一些实例中，控制器的状态空间模型为：
[0032][0033]
使用tlbo算法多智能体学员对控制器k
a
，k
b
统一进行编码：统一进行编码：
[0034]
设计多智能体tlbo算法的适应度函数j，选择itae作为目标函数，其表达式为：
[0035][0036]
式(3)中，t表示时间，e(t)为系统误差；
[0037]
调用多智能体tlbo算法进行优化，由系统误差通过itae函数计算学员/个体适应度ji；判断适应度函数值是否达到要求，输出最优学员/个体对应的参数。
[0038]
在一些实例中，所述球磨机制粉控制系统模型为双输入双输出的耦合对象，分解后的双输入双输出耦合对象的数学模型表示为：
[0039]
c(s)＝g(s)r(s)
[0040]
其中c(s)是输出信号，r(s)是输入信号，g(s)是传递函数矩阵，即：
[0041][0042]
其中，t是出口温度，p是入口负压，r
t
是热风量，r
p
是再循环风量，g
11
(s)是t对r
t
的传递函数，g
12
(s)是t对r
p
的传递函数，g
21
(s)是p对r
t
的传递函数，g
22
(s)是p对r
p
的传递函数。
[0043]
在一些实例中，整个球磨机控制系统算法流程如下：
[0044]
s1)tlbo学员/个体数量及科目初始化，设定最大迭代次数iter_max；
[0045]
s2)将进行编码，依次代入控制器；
[0046]
s3)计算球磨机输出，并计算系统误差；
[0047]
s4)由系统误差通过itae函数计算学员/个体适应度；
[0048]
s5)调用多智能体tlbo算法优化，更新学员/个体参数值；
[0049]
s6)判断适应度函数值是否达到要求或是否达到最大迭代次数；如未达到要求或最大迭代次数，iter＝iter+1，返回s2)，进一步计算；其中，达到要求的标准为步骤s4中采用的itae标准优化函数，在迭代计算过程中，三次出现itae函数计算出来的适应度值相同，则判断该值为最优值；
[0050]
s7)达到要求或达到最大迭代次数后，输出最优学员/个体对应的参数a
ka
，b
ka
，
…
d
ka
，将a
kb
，b
kb
，
…
d
kb
代入球磨机的控制系统模型，计算系统输出。
[0051]
在一些实例中，初始化阶段一般是将每个tlbo学员在搜索空间中生成随机数。
[0052]
在一些实例中，迭代次数可以根据经验或相关参考文献设定。
[0053]
在一些实例中，最大迭代次数不超过300，不少于20次。优选的，最大迭代次数不低于50次，最大迭代次数不超过200次，150次，100次。
[0054]
本发明的第二个方面，提供：
[0055]
一种球磨机制粉的方法，包括使用本发明第一个方面所述的球磨机制粉优化控制方法进行控制。
[0056]
本发明的第三个方面，提供：
[0057]
一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行本发明第一个方面所述的球磨机制粉优化控制方法。
[0058]
本发明的第四个方面，提供：
[0059]
一种电子设备，包括处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行本发明第一个方面所述的球磨机制粉优化控制方法。
[0060]
本发明的有益效果是：
[0061]
本发明的一些实例，通过在基本tlbo算法基础上，对教学因子tf的进行了改进；在改进“学”阶段引入了多智能体算子，克服了基本tlbo算法易于陷入局部最优的不足，可以
更好地对球磨机制粉控制方法进行优化。能够提高瓷砖生产过程的制粉工艺效率，具有较好的经济效益，减少人工成本、缩短球磨时间、节省电耗以及减少粉尘污染，推动球磨技术的产业化，不仅会取得很好的经济效应和社会效应，也会推动瓷砖行业的可持续发展。
[0062]
本发明的一些实例，进一步采用stackelberg博弈规则，能够在种群中扩大搜索范围，使得种群多样性增加，避免tlbo算法陷入局部最优。
附图说明
[0063]
图1是基于多智能体tlbo算法的瓷砖球磨机制粉优化控制方法步骤流程图；
[0064]
图2是球磨机控制系统图；
[0065]
图3是不同tlbo算法求解的适应度函数曲线。
具体实施方式
[0066]
下面结合陶瓷工业球磨机的系统控制为例，进一步说明本发明的技术方案。
[0067]
参照图1和图2，基于改进tlbo算法的陶瓷工业球磨机优化控制方法，包括如下步骤：
[0068]
建立陶瓷工业球磨机系统控制器模型：所述球磨机系统控制器模型简化的双输入双输出的耦合模型：
[0069]
c(s)＝g(s)r(s)
[0070]
其中c(s)是输出信号，r(s)是输入信号，g(s)是传递函数矩阵，即：
[0071][0072]
其中，t是出口温度，p是入口负压，r
t
是热风量，r
p
是再循环风量，g
11
(s)是t对r
t
的传递函数，g
12
(s)是t对r
p
的传递函数，g
21
(s)是p对r
t
的传递函数，g
22
(s)是p对r
p
的传递函数，g(s)描述了两回路之间的耦合关系；球磨机控制系统的结构图如图2所示，其中t0是出口温度的给定值，p0是入口负压的给定值，分别采用两个控制器对两个变量进行闭环控制。
[0073]
针对基本tlbo算法做出改进：
[0074]
教学因子改进
[0075]
tlob算法的优化过程主要分为两个阶段：教学阶段与学习阶段，在教学阶段，班级中的各个学员通过全体学员成绩的均值mean与教师成绩之间的差异difference来向老师学习.
[0076][0077]
difference＝r
i
(x
teacher
‑
tf
i
mean)
[0078][0079]
其中，r
i
为随机因子；tf
i
为教学因子；
[0080]
改进之后的教学因子如下式：
[0081]
[0082]
式中，令tf最大值tf
max
，tf
i
的初始值设计tf1＝1；iter_max表示最大迭代次数；iter表示当前迭代次数
[0083]
多智能体构造
[0084]
构造多智能体状态空间函数：在多智能体系统中当选取未经过学习的学员表示为智能体的联合状态空间，
[0085]
s＝[s1，s2，
…
s
n
]
[0086]
式中：s1～s
n
是未经过学习的学员的多智能体状态空间；
[0087]
构造多智能体动作相位：使用联合动作相位，
[0088]
a＝[a1，a2，
…
a
n
]
[0089]
式中：a1～a
n
动作相位；
[0090]
stackelberg博弈均衡：
[0091]
将stackelberg博弈引入基于多智能体tlbo算法中，智能体的效益方程如下式所示，并且该节点的控制目标是选取最优秀的学员作为领导者，目标函数为f
领导者
(x)：
[0092]
f
领导者
(x)＝max(u
领导者智能体
(s，[a1，
…
a
n
]))
[0093][0094]
式中：ω
i
(s，[a1，
…
a
n
])学员群体中领导者智能体i的性能函数，θ
i
(s，[a1，
…
a
n
])学员群体中领导者智能体i的损失函数，n表示整个学员群体中领导者智能体的个数；
[0095]
学员群体中跟随者智能体的效益方程如下式所示，并且该节点的控制目标是最优化学员自身收益，目标函数为f
跟随者
(x)：
[0096]
f
跟随者
(x)＝matx(u
跟随智能体
(s，[a1，
…
a
n
]))
[0097][0098]
式中：φ
i
(s，[a1，
…
a
n
])学员群体中跟随者智能体i的性能函数，学员群体中跟随者智能体i的损失函数，k整个学员群体中跟随者智能体的个数；
[0099]
改进“学”阶段：
[0100]
依次选中每一个学员，然后随机挑选一个优秀的学员作为比较，基于自学习的学习过程为：
[0101][0102]
式中：x
new，i
，表示第i个学员学习后的状态值；x
old，i
表示原来的状态值；r1，r2，r3，r4表示[0，1]之间的随机数；
[0103]
将改进的tlbo算法用于陶瓷工业球磨机系统控制器，对参数进行优化：建立球磨机的控制器模型，该控制器结构采用状态空间模型表示
[0104]
[0105][0106]
将tlbo算法多智能体学员对控制器k
a
，k
b
统一进行编码：统一进行编码：调用多智能体tlbo算法进行优化，由系统误差通过itae函数计算学员/个体适应度；判断适应度函数值是否达到要求，输出最优学员/个体对应的参数，计算系统输出。
[0107]
整个球磨机控制系统算法流程如下：
[0108]
s1)tlbo学员/个体数量及科目初始化，设定最大迭代次数iter_max；
[0109]
s2)将进行编码，依次代入控制器；
[0110]
s3)计算球磨机输出，并计算系统误差；
[0111]
s4)由系统误差通过itae函数计算学员/个体适应度；
[0112]
s5)调用多智能体tlbo算法优化，更新学员/个体参数值；
[0113]
s6)判断适应度函数值是否达到要求，或判断是否达到最大送代次数。如未达到要求或最大迭代次数，iter＝iter+1，返回s2)，进一步计算；其中，达到要求的标准为步骤s4中采用的itae标准优化函数，在迭代计算过程中，三次出现itae函数计算出来的适应度值相同，则判断该值为最优值；
[0114]
s7)输出最优学员/个体对应的参数a
ka
，b
ka
，
…
d
ka
，a
kb
，b
kb
，
…
d
kb
代入球磨机的控制系统模型，计算系统输出。
[0115]
如图3所示，实线表示采用本发明改进方法多智能体tlbo算法求解的适应度函数曲线，黑色虚线表示原始tlbo算法对比曲线，可以看出，本发明提出的多智能体tlbo算法的在求解适应度函数值时，收敛速度更快，最大迭代次数达到50次左右后就具有较好的适应度，最大迭代次数达到100次左右基本可以获得最佳的适应度。而原始tlbo算法在迭代50次后，适应度依然较差，难以满足生产的需求。
[0116]
本发明的控制方法，能够在种群中产生方向剧烈变化的随机游走，扩大搜索范围，使得种群多样性增加，避免tlbo算法陷入局部最优，能够提高瓷砖生产过程的制粉工艺效率，具有较好的经济效益，减少人工成本、缩短球磨时间、节省电耗以及减少粉尘污染，推动球磨技术的产业化，不仅会取得很好的经济效应和社会效应，也会推动瓷砖行业的可持续发展。
[0117]
本发明一些实施例还提供了一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述实施例的方法步骤。本实施例提供的计算机存储介质，可执行本发明前述实施例提供的球磨机制粉优化控制方法，具体相应的功能和有益效果。
[0118]
本发明一些实施例还提供了一种电子设备，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述实施例的方法步骤。本实施例提供的电子设备，可执行本发明前述实施例提供的球磨机制粉优化控制方法，具体相应的功能和有益效果。
[0119]
以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施
例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢巍;张浪文;张翼;秦伍
技术所有人：广东道氏技术股份有限公司
我是此专利的发明人

上一篇：代码编译方法、装置、电子设备、存储介质及异构系统与流程
上一篇：一种滤波器及通信设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、褚老师：高分子生物材料与生物传感器，包括抗菌/抗污高分子材料、生物基高分子材料、超分子水凝胶、蛋白质材料的合成与自组装、等离子体聚合功能薄膜、表面等离子体共振光谱（SPR）、表面增强拉曼散射（SERS）生物传感器等。
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。