本发明涉及人工智能,具体涉及一种小样本工况下的氧化铝苛性比先进控制方法及装置、计算设备。
背景技术:
1、氧化铝溶出工艺是氧化铝生产过程中的主要工序之一,溶出的目的是将铝土矿中的氧化铝水合物溶解成铝酸钠溶液,溶出效果将直接影响到生产氧化铝的经济效益。苛性比值是衡量溶出过程的重要指标,决定了产品的产量、质量及碱耗,苛性比值稳定的控制是优化溶出过程的关键。
2、模型预测控制(mpc)是一种广泛应用于工业过程的有效控制方法,通过对系统未来响应的预测和优化来得到合适的控制策略。mpc致力于将长时间跨度分解为若干个更短时间跨度或者有限时间跨度来实现优化控制,其在滚动时域内持续求解系统约束下的优化问题,持续输出下一个时刻的控制信号。由于溶出过程具有流程长、参数多、强耦合的特点,系统反应过程波动大,使得控制校正和扰动在不同的工作区域会有不同的特性,过程变量的变化会导致控制系统循环振荡,mpc的实时预测、在线优化适用于具有强大惯性和滞后性的氧化铝溶出过程,其面临两方面的困难:(1)有效训练信息获取难以及有效数据难标记;(2)mpc是基于模型的控制算法,建立精确的系统动态模型是至关重要的,模型精度的高低影响或决定着闭环系统的控制性能。但是,这些要求对于实际工厂的应用来说是困难的。首先大量的数据对工厂设备智能化提出了更高的要求,且标签大多数要靠有经验的工人去手动标记或者长时间化验,如高温高压场景、燃烧场景、存在有毒有害气体或者液体的环境。其次,由于工业动态系统耦合关系复杂、非线性强,导致了机理模型建立困难,神经网络参数更新受限于小样本,传统的梯度下降方法可能导致模型过拟合或欠拟合。最后,根据工艺需求,生产工况会出现周期性变化,更多的未来工况信息能够有效减小控制的波动,需要更长的回顾窗口和预测步长,预测模型的长时序预测能力提出了更高的要求。
技术实现思路
1、鉴于上述问题,提出了本发明以便提供一种只需要少量样本微调网络以及提高模型鲁棒性的小样本工况下的氧化铝苛性比先进控制方法及装置、计算设备。
2、根据本发明的一个方面,提供了一种小样本工况下的氧化铝苛性比先进控制方法,包括:
3、获取氧化铝工厂生产的小样本数据;
4、从所述小样本数据中选择影响苛性比的若干个干扰变量、若干个操纵变量以及一个控制变量,将所述干扰变量、操作变量以及控制变量合并为训练数据集;
5、通过滑动数据窗口提取所述训练数据集的顺序样本,得到多元时间序列数据集;
6、根据所述多元时间序列数据集训练得到氧化铝苛性比网络模型;其中,所述氧化铝苛性比网络模型在微调时冻结自注意力块,仅更新位置编码与正则项;
7、将氧化铝工厂的生产数据输入至所述氧化铝苛性比网络模型,预测得到苛性比值;
8、基于未来多个所述苛性比值,通过梯度下降滚动优化所述操作变量,以实现氧化铝苛性比先进控制。
9、在一种可选的实施方式中,所述干扰变量包括母液苛性比值、母液碱浓度、母液温度、矿浆细粒度、矿浆固含、保温停留罐温度、二次蒸汽温度、二次蒸汽流速以及脱硅槽液位,所述操纵变量包括矿浆流速、母液流速以及新蒸汽流速,所述控制变量为苛性比。
10、在一种可选的实施方式中,所述氧化铝苛性比网络模型将gpt-2作为骨干模型,包括:
11、过程变量输入层、instance norm+patch层、embedding层、位置编码器、冻结transformer块、展平与线性层以及控制变量输出层;
12、其中,所述冻结transformer块包括冻结多头注意力层与冻结ffn层。
13、在一种可选的实施方式中,实现氧化铝苛性比先进控制进一步包括:
14、步骤1,将所述多元时间序列数据集输入至所述氧化铝苛性比网络模型,产生多个预测值;
15、步骤2,基于未来多个所述苛性比值,通过梯度下降滚动优化所述操作变量,通过所述操作变量控制氧化铝厂苛性比,从而提高溶出效率;
16、步骤3,采集新产生的过程变量,构建多元时间序列数据集,并输入至所述氧化铝苛性比网络模型,执行步骤1继续训练。
17、在一种可选的实施方式中,所述梯度下降的目标函数为:
18、minj(k)=min(yr(k)-yp(k))ta(yr(k)-yp(k))+δu(k)tbδu(k)
19、其中,yp(k)=f(u(k),d(k),y(k)),|δu(k)|≤δumax,umin≤u(k)≤umax,ypmin≤yp(k)≤ypmax,a和b是模型与控制增量的损失权重,yr(k)表示设定值,δu(k)表示操作变量的变化幅度,[u(k),d(k),y(k)]是历史输入,yp(k)表示预测输出。
20、在一种可选的实施方式中,所述目标函数使用梯度下降的具体公式为:
21、u(k)=u(k)+δu(k)
22、其中,η>0表示学习率。
23、在一种可选的实施方式中,所述操作变量的变化幅度δu(k)的计算公式为:
24、
25、根据本发明的另一方面,提供了一种小样本工况下的氧化铝苛性比先进控制装置,包括:
26、获取模块,用于获取氧化铝工厂生产的小样本数据;
27、合并模块,用于从所述小样本数据中选择影响苛性比的若干个干扰变量、若干个操纵变量以及一个控制变量,将所述干扰变量、操作变量以及控制变量合并为训练数据集;
28、提取模块,用于通过滑动数据窗口提取所述训练数据集的顺序样本,得到多元时间序列数据集;
29、训练模块,用于根据所述多元时间序列数据集训练得到氧化铝苛性比网络模型;其中,所述氧化铝苛性比网络模型在微调时冻结自注意力块,仅更新位置编码与正则项;
30、预测模块,用于将氧化铝工厂的生产数据输入至所述氧化铝苛性比网络模型,预测得到苛性比值;
31、控制模块,用于基于未来多个所述苛性比值,通过梯度下降滚动优化所述操作变量,实现氧化铝苛性比先进控制。
32、根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
33、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述小样本工况下的氧化铝苛性比先进控制方法对应的操作。
34、根据本发明提供的方案,获取氧化铝工厂生产的小样本数据;从所述小样本数据中选择影响苛性比的若干个干扰变量、若干个操纵变量以及一个控制变量,将所述干扰变量、操作变量以及控制变量合并为训练数据集;通过滑动数据窗口提取所述训练数据集的顺序样本,得到多元时间序列数据集;根据所述多元时间序列数据集训练得到氧化铝苛性比网络模型;其中,所述氧化铝苛性比网络模型在微调时冻结自注意力块,仅更新位置编码与正则项;将氧化铝工厂的生产数据输入至所述氧化铝苛性比网络模型,预测得到苛性比值;基于未来多个苛性比值,通过梯度下降滚动优化操作变量,实现氧化铝苛性比先进控制。本发明通过冻结预训练语言模型,只需要少量的样本微调网络,引入扰动变量并使用较大的预测步长,提高了模型的鲁棒性。
35、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。