一种大宗油脂产品加工参数自动决策方法

文档序号:31857748发布日期:2022-10-19 03:33阅读:55来源:国知局
一种大宗油脂产品加工参数自动决策方法

1.本发明属于食品加工与自动化工程的交叉领域,具体涉及一种大宗油脂产品加工参数自动决策方法。


背景技术:

2.油脂产品是重要的生产生活物资,通过对大豆、花生或油菜等农作物加工,可提取出用于生活和生产的油脂产品。居民消费中以大豆油、菜籽油、棕榈油和花生油为主,在大宗油脂产品的制备过程中,依次对原材料进行预处理、制油、精炼和后处理等操作过程,通过各类成分的检测,得到检测合格的成品油最终入库。
3.在原材料成为合格成品油的过程中,由于焙炒、碱炼和脱臭等工艺过程,导致成品油中产生苯并芘、3-mcpd酯和反式酸等毒素危害物,对人体健康有巨大的威胁,有些还具有致畸性和致突变性,这些是诱发癌症的重要成因。
4.为此,我国对大宗油脂产品中多种危害物含量有明确规定。为了生产出符合标准的大宗油脂产品,需要在油脂产品加工过程中对危害物含量进行有效控制,与之直接关联的是加工过程相关操作和辅料的参数,如何对参数进行选择决策直接影响油脂产品危害物含量的控制效果。
5.现有油脂产品加工企业对加工过程参数的决策方法主要采用经验法,即根据过往加工过程中的参数设定和危害物含量,对当前加工参数进行人为给定和调节;经验法对技术人员的要求较高,不易于在大规模生产过程中进行推广,同时对危害物波动等异常情况的适应性较差。


技术实现要素:

6.为了实现大规模自动化加工生产油脂产品,本发明提出了一种大宗油脂产品加工参数自动决策方法,既可以提高加工参数的给定速度,又保证了加工参数的准确性和对实时状态的适应性。
7.所述的一种大宗油脂产品加工参数自动决策方法,具体步骤如下:
8.步骤一、针对大宗油脂产品,采集历史加工过程中的相关数据,使用cubic插值方法对相关数据进行扩充;
9.相关数据包括原料中危害物含量、加工环节参数、成品中危害物含量。
10.步骤二、将扩充后的数据作为样本数据,进行样本特征的降维提取;
11.对特征进行降维提取具体为:
12.将w
×
h矩阵形式的样本数据作为输入数据,采用1*1的卷积核,卷积核大小为f
×
f,仅在宽度方向上对样本数据进行卷积,输出新的特征数据大小为:
[0013][0014]
w是扩充后样本数据的宽,表示所有危害物和加工参数的变量个数;h是扩充后样
本数据的高,表示扩充后的数据组数,p是填充padding的长度,s是步长。
[0015]
步骤三、基于相关数据中加工参数和危害物含量的映射关系,建立改进的多维变量gru网络模型,并利用提取的样本特征对该模型进行训练;
[0016]
gru网络模型,即门控循环神经网络模型;
[0017]
加工参数和危害物含量的映射关系表示为:
[0018]
yi=f(sh
in
,sh
out
,p1,p2,

,pj)
[0019]
其中,yi表示需要计算决策的加工参数,sh
in
是原料的危害物含量,sh
out
是成品中危害物的含量,p1,p2,

,pj表示加工过程的常规参数,根据不同工艺环节具有不同个数;
[0020]
首先,将提取了参数特征的二维矩阵数据l,转为多列的一维数据x
ti
,i=1,2,3,...,n;对应映射关系中的自变量,作为改进gru网络模型的输入,模型输出对应映射关系的因变量yi,输出如下:
[0021]zt
=σ(wz×
[h
t-1
,[x
t1
,x
t2
,...,x
tn
]])
[0022]rt
=σ(wr×
[h
t-1
,[x
t1
,x
t2
,

,x
tn
]])
[0023][0024][0025]zt
为gru网络模型更新门的输出;r
t
为gru网络模型重置门的输出;为gru网络模型的局部信息输出,h
t
为gru网络模型的长时信息输出;σ为sigmoid函数,可将数据变换为0-1的数值范围,从而充当门控信号;wz和wr分别为更新门和重置门的权重矩阵,w为输出权重矩阵;tanh为双曲正切函数,充当门控信号。
[0026]
利用扩充后的样本数据采用误差反向传播算法对改进的多维变量gru网络模型进行训练,直至模型的训练参数达到阈值。
[0027]
步骤四、运用训练完成的多维变量gru网络模型,对新的待测大宗油脂产品的加工参数进行自动决策,进而控制该油脂产品危害物的含量。
[0028]
具体为:
[0029]
将新的待测大宗油脂产品的危害物含量和加工参数按n列划分为一组,将每组数据的前n-1列数据输入1*1卷积核进行特征提取;然后,对卷积后的数据输入到多维变量gru网络模型,经过两个gru层,输出关键加工参数的单列数据保存到第n列;
[0030]
本发明的优点在于:
[0031]
1)一种大宗油脂产品加工参数自动决策方法,首次提出油脂产品加工过程参数的自动决策计算方法,改变传统的人工经验法,实现油脂产品加工过程的自动精准控制,更易满足现代工业化生产需求。
[0032]
2)一种大宗油脂产品加工参数自动决策方法,样本扩充方法和基于卷积的特征提取方法可充分利用有限的小样本数据,解决实际可利用数据少与模型训练需要数据量大之间的矛盾;
[0033]
3)一种大宗油脂产品加工参数自动决策方法,改进的多维输入gru模型可对多个输入变量进行分析,改变传统模型主要解决单变量时序分析的限制。
附图说明
[0034]
图1是本发明一种大宗油脂产品加工参数自动决策方法的流程图;
[0035]
图2是现有技术中基础gated recurrent unit(gru)网络图;
[0036]
图3是本发明改进的多维输入gated recurrent unit(gru)网络图;
[0037]
图4是本发明扩容后焙炒对菜籽中苯并芘的各项数据图;
[0038]
图5是本发明菜籽中苯并芘的各项数据对焙炒温度的训练误差曲线图;
[0039]
图6是本发明菜籽中苯并芘的各项数据对焙炒温度的预测拟合散点图;
[0040]
图7是本发明扩容后碱炼对菜籽中苯并芘的各项数据图;
[0041]
图8是本发明菜籽中苯并芘的各项数据对碱液质量分数的训练误差曲线图;
[0042]
图9是本发明菜籽中苯并芘的各项数据对碱液质量分数的预测拟合散点图。
具体实施方式
[0043]
下面将结合附图和实施例对本发明作进一步的详细说明。
[0044]
为了实现大规模自动化加工生产油脂产品,本发明提出了一种大宗油脂产品加工参数自动决策方法,基于加工过程采集的数据,对危害物和加工参数数据进行特征提取和信息挖掘,建立基于多维变量的门控循环神经网络模型,对加工参数和危害物含量映射关系进行建模,运用此模型可实现对大宗油脂产品加工过程参数的自动决策。
[0045]
如图1所示,具体步骤如下:
[0046]
步骤一、针对大宗油脂产品,采集历史加工过程中的相关数据,使用cubic插值方法对相关数据进行扩充;
[0047]
油脂加工的参数数据是有限的,考虑网络模型对数据量的要求以及数据特征的普适性,需要将仅有的少量数据扩充到较大容量。每一次的油脂加工产生的参数都不会受到前一次或前几次参数的影响,也就是说,每一次油脂加工产生的参数都是相互独立的,所以拥有的数据不能采用简单的在每两个数据间均匀的插入一定数量的数据的方法,因为新插入的数据不一定位于两个数据之间,为了将扩充后的数据更接近真实的数据,将使用cubic插值方法扩充。
[0048]
cubic插值扩充数据可以产生整体上光滑的曲线,由于容易产生较剧烈的波动,使得曲线的最高点比最高的节点还高、曲线的最低点比最低的节点还低,达到扩充后的数据相互独立,接近真实的数据情况。
[0049]
cubic插值方法就是求一个三次的方程,把已知的数据分为一个一个小区间,再将数据拟合到曲线上去。假设共有n+1个数据,第一个数据为x0=a,第n+1个数据为xn=b,把数据区间[a,b]分为n个区间[x0,x1],[x1,x2]
……
[x
n-1
,xn],把三次函数方程定义为:
[0050]
y=ai+bix+cix2+dix3ꢀꢀ
(1)
[0051]
三次样条函数si(x)需满足以下三个条件:
[0052]
1、在每个分段小区间[xi,x
i+1
]上,s(x)=si(x)是一个三次方程;
[0053]
2、满足插值条件:si(x)=yi(i=0,1,2

n);
[0054]
3、si(x)的一阶、二阶导数存在且连续,使曲线光滑。
[0055]
由于数据区间端点已知且确定,则si(x)在区间两端点的一阶导数为边界值a和b,如公式(2)和公式(3)所示,同时还可列出si(x)、si'(x)和si"(x),如公式(4)、公式(5)和公
式(6)所示。
[0056]
s'(x0)=a
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0057]
s'(xn)=b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0058]
si(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0059]
s'i(x)=bi+2ci(x-xi)+3di(x-xi)2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0060]
s"i(x)=2ci+6di(x-xi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0061]
通过上式的运算即可以计算出三次函数方程中的4个未知数ai、bi、ci和di,从而可以插入数据将数据拟合到曲线。
[0062]
相关数据包括原料中危害物含量、加工环节参数、成品中危害物含量。
[0063]
使用cubic插值方法扩充采集的危害物参数和加工参数历史数据,通过历史数据样本扩充,油脂产品的危害物数据和加工参数数据可涵盖一般加工过程中相关变量的变化范围;
[0064]
步骤二、将扩充后的数据作为样本数据,进行样本特征的降维提取;
[0065]
原始参数中包含了许多冗余信息导致计算量大,拿原始的数据来训练虽然可行,但是往往直接训练是低效的,因有扩充数据的存在,更可能训练到其他与最终想要预测参数无关甚至干扰的参数数据,使预测结果受到影响;所以对原始数据进行特征提取通常是有必要的。
[0066]
本网络模型选取1*1的卷积核进行卷积,可以起到降维、升维、跨通道交互、增加非线性等作用。采用一维卷积对仅在宽度一个方向上进行卷积,对原始数据进行卷积计算得到新的特征数据。将4列原始数据扩容到每列数据为3000个的3000*4的矩阵形式,然后将这个w
×
h矩阵形式的样本数据作为输入数据,采用1*1的卷积核,卷积核大小为f
×
f,那么经过卷积操作之后,输出新的特征数据大小如公式(7)所示:
[0067][0068]
w是扩充后样本数据的宽,表示所有危害物和加工参数的变量个数;h是扩充后样本数据的高,表示扩充后的数据组数,p是填充padding的长度,s是步长。
[0069]
步骤三、基于相关数据中加工参数和危害物含量的映射关系,建立改进的多维变量gru网络模型,并利用提取的样本特征对该模型进行训练;
[0070]
gru网络模型,即门控循环神经网络模型;本发明采用的gru网络是在基础的gru网络上进行修改的。基础gru网络如图2所示,由重置门r
t
和更新门z
t
组成,更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多;重置门控制前一时刻状态有多少信息被写入到当前的候选集上,重置门越小,前一状态的信息被写入的越少。gru结构中的r
t
、z
t
、和h
t
如下所示:
[0071]zt
=σ(wz×
[h
t-1
,x
t
])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0072]rt
=σ(wr×
[h
t-1
,x
t
])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0073][0074]
[0075]
本发明的重点是根据原料中的危害物含量及产品标准要求的危害物含量,结合部分加工参数,对需要调节的重点加工参数进行自动计算;加工参数和危害物含量的映射关系表示为:
[0076]
yi=f(sh
in
,sh
out
,p1,p2,

,pj)
[0077]
其中,yi表示需要计算决策的重点加工参数,sh
in
是原料的危害物含量,sh
out
是成品中危害物的含量,p1,p2,

,pj表示加工过程的常规参数,根据不同工艺环节具有不同个数;
[0078]
由于输入的训练数据是提取了参数特征的二维矩阵数据l,可以将其看做是多列的一维数据,在gru的基本网络模型中输入为x
t
、长时信息h
t
和局部信息当模型的输入变为多列的数据时,输入变为x
ti
,i=1,2,3,...,n,长时信息和局部信息根据输入的变化也产生相应地变化。多列输入数据的gru模型如图3所示,公式变形如下:
[0079]zt
=σ(wz×
[h
t-1
,[x
t1
,x
t2
,

,x
tn
]])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0080]rt
=σwr×
[h
t-1
,[x
t1
,x
t2
,...,x
tn
]])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0081][0082]
σ为sigmoid函数,可将数据变换为0-1的数值范围,从而充当门控信号;wz和wr分别为更新门和重置门的权重矩阵,w为输出权重矩阵;tanh为双曲正切函数,充当门控信号。
[0083]
本发明将gru模型的输入改进为多维输入,对应映射关系中的自变量,模型输出对应映射关系的因变量yi;利用扩充后的样本数据采用误差反向传播算法对改进的多维变量gru网络模型进行训练,当模型的训练参数达到阈值后,可认为获得了稳定的多维变量gru网络模型。
[0084]
步骤四、运用训练完成的多维变量gru网络模型,对新的待测大宗油脂产品的加工参数进行自动决策,进而控制该油脂产品危害物的含量。
[0085]
具体为:
[0086]
将新的待测大宗油脂产品的危害物含量和加工参数按n列划分为一组,每一组n列数据按照列分为两部分,前n-1列数据作为输入,第n列数据作为预测数据,先通过数据的扩容将前n-1列数据扩容到满足实验的标准,再将扩容输入数据进行1*1卷积核的卷积,对数据进行特征提取。对扩充卷积后的数据进行训练学习,再将输出的数据输入到多维变量gru网络模型,经过两个gru层,将多列数据输入,输出单列关键加工参数的数据。
[0087]
最后,通过拟合图查看预测效果,rmse、mse和r2作为最后的评价指标,公式如下:
[0088][0089][0090]
其中n是样本数,是第k个预测值,y(k)是第k个真实值,是预测值的均值。当rmse越小,则预测误差越小,r2越接近1,表示模型拟合能力越好。
[0091]
实例验证1:
[0092]
本发明涉及的大宗油脂主要包括大豆油和菜籽油;
[0093]
大宗油料(菜籽)的数据为焙炒对菜籽中苯并芘的影响,数据共有4列,分别为原料、烘炒温度、烘炒时间和成品4种,每一种有9个数据。三阶扩容将每列数据扩容到3009个。前3000组数据作为训练集和测试集数据,后9个数据作为验证集,数据总分布为如图4所示,其图例yl、hcwd、hcsj、cp分别对应原料、烘炒温度、烘炒时间和成品。
[0094]
将原料、烘炒时间和成品三列数据作为模型的输入数据,烘炒温度一列作为输出预测数据,实现gru模型的多列数据预测单列数据。验证集预测性能评价指标为表1,其训练误差曲线为如图5所示,拟合散点图为如图6所示。
[0095]
表1焙炒对菜籽的影响预测烘炒温度性能评价
[0096][0097]
实例验证2:
[0098]
大宗油料(菜籽)的数据为碱炼对菜籽中苯并芘的影响,数据共有6列,分别为原料、超碱量、碱炼温度、碱炼时间、碱液质量分数和成品6种,每一种有8个数据。
[0099]
三阶扩容将每列数据扩容到3008个。前3000组数据作为训练集和测试集数据,后8个数据作为验证集,数据总分布为如图7所示,其图例yl、cjl、jlwd、jlsj、jyzlfs、cp分别对应原料、超碱量、碱炼温度、碱炼时间、碱液质量分数和成品。
[0100]
将原料、超碱量、碱炼温度、碱炼时间和成品五列数据作为模型的输入数据,碱液质量分数作为输出预测数据,实现gru模型的多列数据预测单列数据。验证集预测性能评价指标为表2,其训练误差曲线为如图8所示,拟合散点图为如图9所示。
[0101]
表2碱炼对菜籽的影响预测碱液质量分数性能评价
[0102][0103]
从以上两个实验的拟合散点图和评价指标验证,本发明采用的数据扩容方法和决策方法能够很好的完成决策工作,达到较好的预测效果。多列输入的gru网络模型在大宗油脂产品加工参数自动决策的方向上,预测结果接近真实数据,能够在预测的任务上有更好的表现。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1