一种基于自编码神经网络的城市污水处理过程异常数据检测方法

文档序号：33712249发布日期：2023-04-01 00:23阅读：来源：国知局

技术特征：
1.一种基于自编码神经网络的城市污水处理过程异常数据检测方法，其特征在于，包括以下步骤：(1)采集城市污水处理过程数据以城市污水处理过程为研究对象，选取进水流量、进水化学需氧量、进水总磷、出水总氮、出水总磷、进水氨氮、进水酸碱度、曝气池温度和生物需氧量9个变量；所有变量按公式(1)归一化：其中，i＝1,
…
,9，t＝1,2,
…
,z，z为样本总数，l1(t)为t时刻进水流量，单位为升/立方米，l2(t)为t时刻进水化学需氧量，单位为毫克/升，l3(t)为t时刻进水总磷浓度，单位为毫克/升，l4(t)为t时刻出水总氮浓度，单位为毫克/升，l5(t)为t时刻出水总磷浓度，单位为毫克/升，l6(t)为t时刻进水氨氮浓度，单位为毫克/升，l7(t)为t时刻进水酸碱度，l8(t)为t时刻曝气池温度，单位为摄氏度，l9(t)为t时刻生物需氧量，单位为毫克/升，l
i,max
为第i个变量的最大值，l
i,min
为第i个变量的最小值，x1(t)为t时刻归一化进水流量，x2(t)为t时刻归一化进水化学需氧量，x3(t)为t时刻归一化进水总磷浓度，x4(t)为t时刻归一化出水总氮浓度，x5(t)为t时刻归一化出水总磷浓度，x6(t)为t时刻归一化进水氨氮浓度，x7(t)为t时刻归一化进水酸碱度，x8(t)为t时刻归一化曝气池温度，x9(t)为t时刻归一化生物需氧量；将归一化后的z个样本分为两组，一组为包含n个样本的训练集x，另一组为包含m个样本的测试集x
′
，n>m，m＝z-n，n且m为正整数；(2)建立基于自编码神经网络的检测模型检测模型以自编码神经网络为载体，该模型包含以下三层：输入层：由9个神经元组成，输入变量为x1(t),x2(t),x3(t),x4(t),x5(t),x6(t),x7(t),x8(t),x9(t)，每个神经元的输出为：u
i
(t)＝x
i
(t) (2)其中，u
i
(t)是t时刻第i个输入层神经元的输出值；隐含层：由5个神经元组成，每个神经元输出为：其中，h
j
(t)为t时刻第j个隐含层神经元的输出值，w
eij
(t)为t时刻第i个输入层神经元第j个隐含层神经元的连接权重，b
ej
(t)为t时刻第j个隐含层神经元的偏移量，j＝1,
…
,5；输出层：由9个神经元组成，每个神经元输出为：其中，为t时刻第i个输出层神经元的输出值，w
dji
(t)为t时刻第j个隐含层神经元第i个输出层神经元的连接权重，b
di
(t)为t时刻第i个输出层神经元的偏移量；(3)设计基于梯度下降的检测模型参数更新方法
①
设初始迭代次数s＝1，最大迭代次数s＝150，初次迭代隐含层神经元连接权重w
1eij
(t)在区间[-1,1]中随机取值，初次迭代隐含层神经元偏移量在区间[-1,1]中随机取值，初次迭代输出层神经元连接权重w
1dji
(t)在区间[-1,1]中随机取值，初次迭代输出层神经元偏移量在区间[-1,1]中随机取值；
②
将训练集x＝[x1(t),
…
,x
n
(t)]
t
输入检测模型，x
n
(t)＝[x
1n
(t),
…
,x
in
(t)]为第n个训练样本，n＝1,
…
,n，t为转置计算，根据公式(2)-(4)，得到训练误差函数e(t)为：其中，x
in
(t)为第n个训练样本中的第i个变量值，为检测模型输出中的第i个变量值；
③
利用梯度下降算法更新检测模型参数：利用梯度下降算法更新检测模型参数：利用梯度下降算法更新检测模型参数：利用梯度下降算法更新检测模型参数：其中，为第s次迭代第j个隐含层神经元连接权重，为第s次迭代第j个隐含层神经元连接权重，为第s次迭代隐含层神经元的偏移量，为第s次迭代第i个输出层神经元连接权重，为第s次迭代输出层神经元的偏移量，移量，移量，α为学习率且取值范围为(0,0.1)；
④
若s<s，则s增加1，返回步骤
②
；若s≥s，则停止训练，得到训练好的检测模型；(4)构建基于记忆模块的自适应异常分数阈值判别策略ⅰ设记忆模块初始指针为p＝1，记忆长度q＝20，初始测试样本数m＝1；ⅱ将测试集x
′
＝[x
′1(t),
…
,x
′
m
(t)]
t
顺序输入到训练好的检测模型中，第m个测试样本x
′
m
(t)＝[x
′
1m
(t),
…
,x
′
im
(t)]的异常分数为:其中，x
′
im
(t)为第m个测试样本中的第i个变量值，为检测模型输出中的第i个变量值；将异常分数e
m
(t)保存到记忆模块p；ⅲ若p≤m≤p+q，则m增加1，返回步骤ⅱ；若m>p+q，则执行步骤ⅳ；ⅳ从记忆模块p中提取异常分数e(t)＝[e
p
(t),
…
,e
m
(t)]，p≤m≤p+q，计算异常分数的
上阈值ε
max
和下阈值ε
min
：ε
max
＝u+3σ (11)ε
min
＝u-3σ (12)其中，u为测试样本异常分数的平均值，σ为测试样本异常分数的标准差，计算公式为；其中，u为测试样本异常分数的平均值，σ为测试样本异常分数的标准差，计算公式为；
ⅴ
根据公式(11)-(14)，对测试样本x
′
m
(t)标记异常标签i
m
(t)：其中，i
m
(t)＝1表示测试样本x
′
m
(t)为异常样本，i
m
(t)＝0表示测试样本x
′
m
(t)为正常样本，将i
m
(t)输入异常标签向量i(t)中；ⅵ若m≤m，则p增加1，m增加1，返回步骤ⅱ；若m>m，则停止检测；(5)实现城市污水处理过程异常数据检测输出m个测试样本异常标签向量i(t)＝[i1(t),
…
,i
m
(t)]，实现城市污水处理过程异常数据检测。

技术总结
本发明提出一种基于自编码神经网络的城市污水处理过程异常数据检测方法。针对城市污水处理过程数据具有非线性及难以构建精确数学模型的问题，该检测方法，利用自编码神经网络自动提取变量间的非线性关系，采用梯度下降算法对模型参数进行动态调整，设计记忆模块自适应地计算异常分数阈值以检测异常样本，保障了城市污水处理过程数据的质量，提高了数据研究的可信度。究的可信度。究的可信度。

技术研发人员：韩红桂孙美婷李方昱
受保护的技术使用者：北京工业大学
技术研发日：2022.12.28
技术公布日：2023/3/31

完整全部详细技术资料下载

当前第2页1 2