一种基于人工智能的水环境异常排放监测方法及系统与流程

文档序号:30795135发布日期:2022-07-16 13:07阅读:240来源:国知局
一种基于人工智能的水环境异常排放监测方法及系统与流程

1.本发明涉及人工智能技术领域,具体涉及一种基于人工智能的水环境异常排放监测方法及系统。


背景技术:

2.由于流域水资源具有跨域性,传统的属地原则治理的方式难以解决跨界流域的污染问题,为了破解跨界流域水污染的难题,目前推出了多种联防联控的机制,但是对于在跨界分界点附近的偷排现象是防不胜防;其中,偷排是指企业或者个人为了逃避监管,通过隐蔽的方式设置排污管道,并不经过法定排污口排放污染物。
3.对于偷排的识别问题,目前常规的做法是通过检测水污染处理设施中各个环节的运行状态参数,以识别各个环节的真实运行情况,例如水泵是否在运行、排水口是否在排污等,将这些运行状态参数与数据库中预存的标准的运行状态参数进行比较,判断是否存在偷排的现象。
4.发明人在实践中,发现上述现有技术存在以下缺陷:上述方法是针对已有的设施进行的状态监控,无法针对企业或个人为了偷排而私设的暗管进行监控,通过监控已有设施状态参数的方法无法判断偷排行为。


技术实现要素:

5.为了解决上述技术问题,本发明的目的在于提供一种基于人工智能的水环境异常排放监测方法及系统,所采用的技术方案具体如下:第一方面,本发明一个实施例提供了一种基于人工智能的水环境异常排放监测方法,包括:同一时刻分别采集第一区域中河流的多组水质参数、第二区域中河流的多组水质参数,所述第一区域和第二区域为河流所流经的两个不同的行政区域;每组所述水质参数包括由采集单元采集的水质指标和水体表面图像;分别获取在预设时间段内所述第一区域中每个采集单元采集的所有所述水体表面图像的第一特征描述子序列、所述第二区域中每个采集单元采集的所有所述水体表面图像的第二特征描述子序列;获取所述第一特征描述子序列和所述第二特征描述子序列的第一时间差,根据所述第一时间差得到所述第一区域与第二区域中相应采集单元的最佳匹配对;提取所述最佳匹配对所对应的水体表面图像的特征描述子,计算特征描述子之间的第一相似度,根据第一相似度的大小判断是否存在偷排行为。
6.进一步,所述所有所述水体表面图像的第一特征描述子序列的获取方法包括:将每张所述水体表面图像输入孪生网络得到第一特征描述子,所有所述水体表面图像的第一特征描述子组成所述第一特征描述子序列。
7.进一步,孪生网络在训练数据集的获取步骤包括:获取所述河流的多组样本水质
参数,提取每组所述样本水质参数中水体表面的样本图像的横向边缘响应之和以及纵向边缘响应之和,根据所述横向边缘响应之和以及纵向边缘响应之和的比值得到边缘系数;所述样本水质参数中的样本水质指标和所述样本图像的边缘系数为水质向量,对所述第一区域和第二区域的所述水质向量进行分类得到相似向量集和不相似向量集,相似向量集对应相似图像数据集、不相似向量集对应不相似图像数据集;所述相似图像数据集和不相似图像数据集组成所述训练数据集。
8.进一步,所述对所述第一区域和第二区域的所述水质向量进行分类得到相似向量集和不相似向量集的步骤包括:计算所述第一区域的水质向量与所述第二区域的水质向量之间的向量相似度,将所述向量相似度进行聚类得到所述相似向量集和所述不相似向量集。
9.进一步,所述获取所述第一特征描述子序列和所述第二特征描述子序列的第一时间差的步骤包括:对于任意两个所述第一特征描述子序列和第二特征描述子序列,选取所述第一特征描述子序列或者第二特征描述子序列为目标时间序列,未被选取的特征描述子序列为匹配时间序列;固定目标窗口在目标时间序列上、利用滑动窗口在所述匹配时间序列上滑动,得到窗口相似度序列;根据所述窗口相似度序列中的最大的窗口相似度与采样频率的比值得到所述第一时间差。
10.进一步,所述根据所述第一时间差得到所述第一区域与第二区域中相应采集单元的最佳匹配对的步骤包括:根据第一时间差分配第一区域的采集单元和第二区域的采集单元之间的权重;根据所述权重得到最佳匹配对。
11.进一步,所述根据第一时间差分配第一区域的采集单元和第二区域的采集单元之间的权重的步骤包括:通过权重损失函数得到所述权重,所述权重损失函数为时间损失和权重损失的乘积;其中,所述权重损失函数为:其中,时间损失函数,权重约束函数;为第个采集单元和第个采集单元之间的所述第一时间差,为第个采集单元和第个采集单元之间的所述权重,为第二时间差;所述第二时间差为多个最大的窗口相似度所对应的所述第一时间差的均值。
12.所述根据所述权重得到最佳匹配对的方法为采用km算法得到最佳匹配对。
13.进一步,所述水质参数包括化学需氧量、氨氮、氰化物浓度指标。
14.第二方面,本发明另一个实施例提供了一种基于人工智能的水环境异常排放监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述任意一种方法的步骤。
15.本发明实施例具有如下有益效果:本实施例提供了一种基于人工智能的水环境异常排放监测方法,该方法通过分别获取在预设时间段内第一区域中每个采集单元采集的所有水体表面图像的第一特征描述子序列、第二区域中每个采集单元采集的所有水体表面图像的第二特征描述子序列;获取第一特征描述子序列和第二特征描述子序列的第一时间差,根据第一时间差得到第一区域
与第二区域中相应采集单元的最佳匹配对;提取最佳匹配对所对应的水体表面图像的特征描述子,计算特征描述子之间的第一相似度,根据第一相似度的大小判断是否存在偷排行为,能够有效识别出私设的暗管的偷排行为。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
17.图1为本发明实施例的实施环境图;图2为本发明实施例提供的一种基于人工智能的水环境异常排放监测方法流程图;图3为本发明实施例提供的孪生网络在训练的过程中训练集的获取步骤流程图;图4为本发明实施例提供的最佳匹配对的获取步骤流程图。
具体实施方式
18.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于人工智能的水环境异常排放监测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
19.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
20.请参阅图1,其示出了本发明实施例的实施环境,对于向河流100中排放废水的工厂来说,河流100位于该工厂的下游河段,河水依次流经第一区域101和第二区域102,第一区域101位于第二区域102的上游位置,第一区域101和第二区域102分别属于两个不同行政区域的管辖范围。由于河流较宽,因此在河流100的宽度方向上设置由多个采集单元组成的第一阵列200对河流的水质参数和水体表面图像进行监测,每个采集单元是由一种传感器和一个相机组合而成。
21.工厂可以是石油、石油化工、钢铁、焦化、机械加工等工业工厂,该工厂所排放的废水中包括油污或者絮状污染物等,能够在水体表面呈现出一定纹理信息。
22.每个传感器用于采集水质的至少一个化学参数,例如对于水质评价的主要的指标:化学需氧量、氨氮、氰化物浓度指标等,其量纲统一为mg/l。在本发明实施例中采用多参数水质传感器采集多种不同的水质指标。
23.相机是采用主动红外光源垂直照射水体表面,主动红外光源能够克服日夜间差异,得到统一的水体纹理信息。相机最终采集的图像为一张单通道灰度图像。
24.由于在第一区域的河道宽度方向上设置的第一阵列200与第二区域的第二阵列300相同,因此以第一阵列200为例进行说明,第一阵列200包括个采集单元,每个采集单元是由一种传感器和一个相机组合而成,采用分布式传感器网络。为了解决跨界流域偷排
现象难易识别的技术难题,本发明实施例通过对第一阵列200和第二阵列300所采集的水质参数进行处理,得到第一区域101和第二区域102中监测数据的第一相似度,若不存在偷排现象两者的第一相似度较大,若第一相似度较小则说明存在偷排的现象。
25.在本发明实施例中,的取值为10,在其他实施例中可以根据实际需要进行取值。
26.下面结合附图具体的说明本发明所提供的一种基于人工智能的水环境异常排放监测方法及系统的具体方案。
27.请参阅图2,其示出了本发明一个实施例提供的一种基于人工智能的水环境异常排放监测方法流程图,该监测方法包括以下步骤:步骤s001,分别采集第一区域中河流的多组水质参数、第二区域中河流的多组水质参数,第一区域和第二区域为河流所流经的两个不同的行政区域;每组水质参数包括由采集单元采集的水质指标和水体表面图像。
28.进一步,水质指标包括需氧量、氨氮和氰化物浓度指标,将化学需氧量指标记为、氨氮浓度指标记为和氰化物浓度指标记为,将水体表面图像记为。
29.采集单元包括采集水质指标的水质采集装置和采集水体表面图像的相机。将第一区域中该10个采集单元采集到的第一数据序列记为,其中为第一区域中第组采集单元所采集的数据,该组数据包括相应传感器所采集的水质指标和相机采集的水体表面图像。同理将第二区域中所预设的10个第二采集单元的第二数据序列记为,其中为第二区域中第组采集单元所采集的数据。
30.在本发明实施例中,预设的10个采集单元之间均匀间隔分布。在其他实施例中,可以根据实际需要进行布置。
31.步骤s002,分别获取在预设时间段内第一区域中每个采集单元采集的所有水体表面图像的第一特征描述子序列、第二区域中每个采集单元采集的所有水体表面图像的第二特征描述子序列。
32.在本发明实施例中预设时间为5分钟,采样频率为0.5hz,因此在5分钟内每个传感器能够采集到150个数据;由于在每个区域的河道宽度方向上都各自设有10个传感器,因此,在5分钟内每个区域均能够采集到1500个数据。
33.优选的,将第一区域中的每张水体表面图像输入孪生网络得到第一特征描述子,提取该第一区域中的相应采集单元所采集的所有水体表面图像的特征得到第一特征描述子序列。对于每个采集单元来说,所得到的特征描述子序列为按照时间顺序排列的150个特征描述子的集合,该特征描述子序列为时间序列。在其他实施例中,可以根据实际情况设置预设时间段的长度。
34.孪生网络的训练过程包括:由样本图像组成训练集,样本图像是由第一区域中采集的水体表面的样本图像和第二区域中所采集的水体表面的样本图像组成,包括相似的样本图像和不相似的样本图像;换句话说,孪生网络的训练集包括由相似的样本图像构成的相似图像数据集和由不相似的样本图像构成的不相似图像数据集;将样本图像输入孪生网络,孪生网络将其映射到高维特征空间,并输出特征描述子。利用相似图像数据集和不相似
图像数据集训练孪生网络,孪生网络的损失函数采用对比损失,以缩小类内差距、扩大类间差距,其中,相似数据集为一类、不相似数据集为另一类。由于孪生网络为经典的对比学习策略,不再赘述。
35.优选的,为了扩增训练样本,本发明实施例采用将训练集中的样本图像做上下镜像或左右镜像,以扩充样本图像。对水体表面的样本图像做上下和左右镜像处理可以扩增水体流动的纹理特征,基于本发明实施例中图像采集的方式,对水体表面的样本图像镜像后仍能代表同一种水体表面的纹理特征,进而实现四倍扩增样本的效果。
36.需要说明的是,基于足够长时间的数据信息采集和数据处理,以使在该时间内能够采集到正常的排污过程和无排污过程中的数据,基于所采集到的多种状况下的水体表面图像最终完成孪生网络的训练。
37.请参阅图3,为了达到对水体表面的样本图像自动标注的目的,本发明实施例进一步提供了孪生网络在训练的过程中其相似图像数据集和不相似图像数据集的获取步骤包括:步骤s210,获取河流的多组样本水质参数,提取每组样本水质参数中水体表面的样本图像的横向边缘响应之和以及纵向边缘响应之和,根据横向边缘响应之和以及纵向边缘响应之和的比值得到边缘系数。
38.样本水质参数是在训练阶段所采集的水质参数,该样本水质参数可以是历史采集的水质参数,也可以是实时采集的用于训练的水质参数;该样本水质参数同样包括由采集单元采集的样本水质指标和水体表面的样本图像。
39.由于水体的流动性,在排放污染物时,水体表面会存在较为明显的纹理变化,使用传统的视觉检测方法容易出现较大误差,因此为了得到水体纹理特征,采用联合判断的方式进行处理。
40.以第一区域中第个采集单元所采集的水体表面图像为例,对提取样本图像的横向边缘响应之和以及纵向边缘响应之和的方法进行说明:规定在图像坐标系中,以水体流动的主方向为纵轴、垂直于水体流动的方向为横轴,建立图像坐标系;利用sobel算子对水体表面图像进行卷积处理,提取横向边缘强度,得到横向的边缘强度图像,并得到边缘响应之和;同理利用sobel算子对该水体表面图像进行卷积处理,提取纵向边缘强度,得到纵向的边缘强度图像,并得到边缘响应之和。
41.边缘系数描述的是水体中的异常物体流经相机所采集的图像区域时的纹理差异强度。由于水体的流向是纵向,而获得的图像在纵向上具有明显相对横向运动更大的模糊效应,因此将纵向的边缘响应之和作为基准归一化系数,得到边缘系数。边缘系数越大,越说明在水体中出现顺流而下的异常物体越显著。
42.步骤s220,样本水质参数中的样本水质指标和样本图像的边缘系数为水质向量,对第一区域和第二区域的水质向量进行分类得到相似向量集和不相似向量集,相似向量集对应相似图像数据集、不相似向量集对应不相似图像数据集,相似图像数据集和不相似图像数据集组成训练数据集。
43.由于传感器监测的水质参数的大小可能会存在忽高忽低的情况,因此采用边缘系
数对相应的水质指标进行约束,以提高水质指标的可信度。
44.将水质向量记为,将第一区域的第个传感器的水质向量记为第一水质向量,将第二区域的第个传感器的水质向量记为第二水质向量。对水质向量进行分类的方法为:计算第一水质向量与第二水质向量之间的向量相似度,将向量相似度进行聚类得到相似向量集和不相似向量集。
45.其中,将第一水质向量和第二水质向量之间的相似度记为向量相似度,则相似度的计算方法为:的计算方法为:为余弦相似度,其值域为[0,1],的值越大意味着两个化学指标越相似。对相似度进行归一化得到归一化之后的相似度。
[0046]
将归一化之后的相似度分为两类,以区分第一水质向量与第二水质向量之间的相似向量和不相似向量。采用k-means聚类方法,该方法中的k取值为2,对归一化后的相似度进行距离聚类得到两簇数据;将这两簇数据分别标记两个类别,相似类别标记为相似向量集,不相似类别标记为不相似向量集;根据两簇水质向量所分别对应的第一水体表面图像,得到用于训练孪生网络的两个对应的数据集,相似向量集对应的第一水体表面图像构成相似图像数据集,不相似向量集对应的第一水体表面图像构成不相似图像数据集。
[0047]
步骤s003,获取第一特征描述子序列和第二特征描述子序列的第一时间差,根据第一时间差得到第一区域与第二区域中相应采集单元的最佳匹配对。
[0048]
在水体中的漂浮物以及相应的化学物品从上游的第一区域流动到下游的第二区域存在一定的时间差。因此需要基于上下游所采集的数据确定上下游采集单元之间的最佳时间差。
[0049]
请参阅图4,获取第一特征描述子序列和第二特征描述子序列的第一时间差的步骤包括:步骤s310,对于任意两个第一特征描述子序列和第二特征描述子序列,选取第一特征描述子序列或者第二特征描述子序列为目标时间序列,未被选取的特征描述子序列为匹配时间序列;固定目标窗口在目标时间序列上、利用滑动窗口在匹配时间序列上滑动,得到窗口相似度序列。
[0050]
其中,滑动窗口的时间长度为1分钟,由于数据的采样频率为0.5hz,因此该长度的滑动窗口每次滑动均能够得到由30个特征描述子构成的子序列。在其他实施例中,可根据河流的典型流速划分滑动窗口的大小。
[0051]
窗口相似度的计算的过程包括:以第二特征描述子序列为目标时间序列、第一特征描述子序列为匹配时间序列为例,在第二特征描述子序列上滑动的滑动窗口称为目标窗口、在第一特征描述子序列上滑动的滑动窗口称为匹配窗口,以下不再声明。基于起始时间为0的时刻,利用滑动窗口得到第一特征描述子序列的匹配子序列、第二特征描述子序列的
目标子序列,计算匹配子序列和目标子序列之间的余弦相似度序列。
[0052]
具体的,将匹配窗口中的匹配子序列记为、目标窗口中的目标子序列记为、匹配子序列与目标子序列之间的余弦相似度序列记为,其中,匹配子序列中的第个特征描述子与目标子序列的第特征描述子之间的相似度的计算方法为:其中,表示时间窗口中两个元素的第个相似度,为余弦相似度。
[0053]
计算该余弦相似度序列的平均相似度,该平均相似度为起始时间为0的目标窗口与滑动窗口之间的窗口相似度,将该窗口相似度记为。
[0054]
步骤s320,根据窗口相似度序列中的最大的窗口相似度与采样频率的比值得到第一时间差。
[0055]
具体的,移动第一区域对应的滑动窗口到第一特征描述子序列的下一个位置,即得到基于起始时间为1的匹配子序列;计算基于起始时间为1的匹配子序列和起始时间为0的目标子序列之间的平均相似度,得到起始时间为0的目标窗口与起始时间为1的匹配窗口之间的窗口相似度。重复上述操作,固定目标窗口、每次移动第一特征描述子序列的滑动窗口到下一个位置之后,计算一次相应的匹配子序列与起始时间为0的目标子序列之间的窗口相似度;直至完成对第一区域中150条数据的窗口滑动,也即完成第一特征描述子序列的窗口滑动,得到基于滑动窗口的窗口相似度序列。
[0056]
基于同样的方法,计算任意两个采集单元所对应的第一特征描述子和第二特征描述子之间的窗口相似度序列,得到第一区域和第二区域中所有组合的采集单元对应的窗口相似度序列。计算每个窗口相似度序列中最大的窗口相似度为相应采集单元的单元相似度、最大的窗口相似度所对应的时间差为相应采集单元之间的第一时间差。
[0057]
其中,任意两个采集单元所对应的第一时间差的计算方法为:获取任意两个采集单元对应的窗口相似度,窗口相似度对应的时间窗口的滑动次数与刷新频率的比值的均值为第一时间差。具体的,记第一区域中第个采集单元和第二区域中第个采集单元之间的时间差为第一时间差、窗口相似度为、采样频率为,因此第一时间差。其中,在本发明实施例中采样频率的取值为0.5 hz,在其他实施例中可根据实际情况进行设定。
[0058]
作为一个示例,在窗口相似度序列中的最大的窗口相似度为,那么相应的第一时间差为:。
[0059]
选取多个最大的窗口相似度所对应的第一时间差,求均值得到第二时间差。在本
发明实施例中选取10个最大的窗口相似度,在其他实施例中可根据需求调节选取的数量。
[0060]
进一步,为了进一步消除两地对传感器的不信任问题,并在总体上降低系统内部误差,在得到第一时间差之后,基于最优化的方式得到传感器权重。因此在步骤s320之后还包括以下优化步骤:步骤s330,根据第一时间差分配第一区域的采集单元和第二区域的相似采集单元之间的权重;根据权重得到最佳匹配对。
[0061]
由于所给定的滑动窗口的大小不是最优的,因此无法确定采集单元之间的权重是最优的。为了得到采集单元之间的最优权重,构建权重损失函数,权重损失函数为时间损失函数和权重约束函数的乘积,则权重损失函数为:其中,时间损失函数,权重约束函数;为第个采集单元和第个采集单元之间的第一时间差,为第个采集单元和第个采集单元之间的权重,为第二时间差。
[0062]
第一时间差的计算方式受到采集单元权重的影响,有。
[0063]
采用权重约束函数的目的是为了防止每个采集单元的权值被调节的过低。
[0064]
在权重损失函数收敛时,此时得到第个采集单元和第个采集单元之间的优化权重。
[0065]
进一步,根据优化权重得到最佳匹配对的方法为采用km算法通过最大匹配得到对应的最佳匹配对,也即得到第一区域和第二区域中采集单元的最佳匹配对,避免由于传感器工况不一而获取的片面数据,造成两地数据不一致的误判问题。
[0066]
基于最优化方式得到每两个采集单元之间的权重,降低时间差残差。
[0067]
步骤s004,提取最佳匹配对所对应的水体表面图像的特征描述子,计算特征描述子之间的第一相似度,根据第一相似度的大小判断是否存在偷排行为。
[0068]
采用与步骤310和步骤320相同的方法得到最佳匹配对所对应的特征描述子序列之间的窗口相似度序列,由步骤s003中得到最佳匹配对之间的权重,将窗口相似度序列与相应的权重加权平均得到最终相似度,根据该最终相似度判断是否存在偷排行为,判断的方法为:当最终相似度低于预设最低阈值时,在第一区域发现偷排问题,但在第二区域未发现偷排问题,则确定第二区域存在隐瞒行为;当最终相似度低于预设最低阈值时,在第二区域发现水质参数超标,但在第一区域未发现该问题,则确定第一区域存在偷排行为;当最终相似度高于预设最高阈值时,确定第一区域和第二区域之间没有隐瞒和偷排的行为。
[0069]
也即,在两个区域之间的最终相似度高于最高阈值时,则认为两个区域之间不存在偷排和隐瞒的行为;若两者之间的相似度低于最低阈值时,任一地区发现偷排或者隐瞒
行为,均能够在另一地区得到验证。
[0070]
综上所述,本实施例提供了一种基于人工智能的水环境异常排放监测方法,该方法通过分别获取在预设时间段内第一区域中每个采集单元采集的所有水体表面图像的第一特征描述子序列、第二区域中每个采集单元采集的所有水体表面图像的第二特征描述子序列;获取第一特征描述子序列和第二特征描述子序列的第一时间差,根据第一时间差得到第一区域与第二区域中相应采集单元的最佳匹配对;提取最佳匹配对所对应的水体表面图像的特征描述子,计算特征描述子之间的第一相似度,根据第一相似度的大小判断是否存在偷排行为,能够有效解决私设的暗管的偷排行为。
[0071]
基于同样的发明构思,本发明实施例还提供了一种基于人工智能的水环境异常排放监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任意一个实施例所述的一种基于人工智能的水环境异常排放监测方法的步骤。其中,一种基于人工智能的水环境异常排放监测方法在上述实施例中已经详细说明,不再赘述。
[0072]
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0073]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0074]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1