一种三维荧光信号PCA-神经网络识别的水污染溯源方法与流程

文档序号:31704616发布日期:2022-10-01 10:18阅读:472来源:国知局
一种三维荧光信号PCA-神经网络识别的水污染溯源方法与流程
一种三维荧光信号pca-神经网络识别的水污染溯源方法
技术领域
1.本发明涉及水污染溯源技术领域,尤其涉及一种三维荧光信号pca-神经网络识别的水污染溯源方法。


背景技术:

2.突发性水污染事件的不确定性、多元化、扩散性和积累性等,无疑会增加水污染应急监测、调查和处理的难度。如果处理不及时,发生的环境污染事故需要长时间的治理修复,随之而来的还有舆论压力、经济损失和人员伤亡。且因在当前突发环境污染事件中,水污染事件发生频率高,影响大,国家对此形势高度重视,接连颁布了“中华人民共和国水污染防治法”、“水污染防治行动计划”和“碧水保卫战”等。为了迅速排查污染物的性质、数量和影响途径,需要有准确、快速的技术方法锁定污染源,才能进一步制定出针对性补救计划。
3.现阶段应对水污染突发事件的方式是在监测常规参数的过程中发现失常时,逐一取样检测,判定特征污染物,做出应对方案。这个过程中检测时间长,做不到取样留证,易发生二次污染事件。
4.荧光化合物具有的刚性平面结构、大共轭结构是发射荧光的条件,当吸收入射光的能量后,荧光化合物的分子的价电子重新跃迁,能在可见光和紫外光区域,得到特殊的发射光谱与吸收光谱。发射波长、激发波长两个变量能够决定荧光强度,用作形容荧光强度、发射波长、激发波长三者作用关系的图谱,称三维荧光光谱(excitation-emission-matrix spectra,eem)。发射光谱是在固定激发波长下,测出的荧光波长分布,激发光谱是在固定发射波长下,测出的激发波长与荧光强度的关联。可以矩阵方式表示:元素为荧光强度,列为激发波长,行为发射波长。
5.染料化合物,农药类的百菌清和西维因,和生活废水中含有的脂类、油类、多环芳烃、羰基化合物、氨基酸等,都是水体中常见的荧光化合物。由于相关仪器、技术的创新问世,三维荧光技术的可应用范围也不断扩充,现已用于检测农药残留检测、油品鉴定分析、检测蛋白质、毒品鉴定和水质分析等。且因稀释后的荧光物质,基本不改变其化学结构,发射光谱、吸收光谱同样基本不变,也就是基本不改变其三维荧光光谱特征。
6.根据这一特点,本发明提出一种三维荧光信号pca-神经网络识别的水污染溯源方法,利用三维荧光光谱特征,采集水样扫描得其原始数据,再以已知工业废水为源,环境中被稀释后的工业废水作为目标水样,将源和目标一起进行pca,提取三维荧光主成分特征并降维,再用竞争型神经网络对降维后的数据训练分类,最终识别并输出对应于该废水的一种类别属性。


技术实现要素:

7.本发明的目的是提出一种三维荧光信号pca-神经网络识别的水污染溯源方法,能够使未知污染水样准确追踪溯源到污染源,方法简便且成本低廉,也不过多占用存储资源。
8.要实现上述目的,本发明的技术方案具体包括以下步骤:
9.一种三维荧光信号pca-神经网络识别的水污染溯源方法,具体包括以下步骤:
10.步骤1、将待测水样放入三维荧光分光光度计中扫描得到多维矩阵数据;
11.步骤2、将水样的多维矩阵数据转换为一维行矩阵数据,并一同进行主成分分析并降维,得到得分系数矩阵,将其命名为三维荧光主成分特征库;
12.步骤3、对三维荧光主成分特征库通过竞争型神经网络学习分类,得出每一水样的分类属性。
13.优选的,所述步骤1中三维荧光光谱仪仪器参数,将发射波长设为230~650nm,激发波长是220~600nm,步长设为5nm,狭缝宽度是5nm。
14.优选的,所述步骤1在20
±
2℃的温度条件下,使用三维荧光光谱仪对废水进行全波长扫描。
15.优选的,所述步骤2中,采用matlab软件对三维荧光光谱矩阵数据进行数据处理,将原始多维矩阵数据,转为一维行矩阵数据,再使用pca函数将已知废水原水和未知废水一同提取特征,进行降维,得到的新矩阵则作为三维荧光主成分特征库。
16.优选的,所述步骤2中,对pca后的得分系数矩阵,当样本数n大于等于原始数据指标数量6545时,主成分数=原始数据指标数量=6545;当样本数n小于原始数据指标数量6545时,主成分数=样本数量-1=n-1。
17.优选的,所述步骤2中,水样的原始数据维度为77
×
85,其中,激发波长数=77=(600-220)/5+1,发射波长数=85=(650-230)/5+1,导入软件matlab中,通过reshape函数进行矩阵变形,将维度77
×
85的矩阵变形成维度为1
×
6545的行矩阵,再将n个不同的废水的数据,合并为维度n
×
6545的矩阵。
18.优选的,pca后将维度n
×
6545的矩阵降维,得到维度n
×
主成分数的得分系数矩阵,即得到的主成分特征库的矩阵维度是n
×
主成分数。
19.优选的,所述步骤3中,通过matlab软件中的竞争型神经网络对主成分特征库进行训练分类,根据指定类别数判定得出各水样的属性。
20.优选的,竞争型神经网络,包括:输入层、竞争层和输出层;
21.所述输入层,用于接收主成分特征库数据作为输入向量,将输入向量传递给竞争层;
22.所述竞争层,训练过程先随机赋值于初始权向量,对初始权向量和输入向量各自归一化,各神经元根据欧氏距离公式或夹角余弦公式,计算出输入向量与权向量的距离,再不断调整获胜神经元连接权。当获胜神经元的权值增加时,其他神经元的权值均减小;完成一次训练后,回到输入层进行下一次训练,以此不断循环并计算调整权值,直至输出误差小于允许值,或者训练次数达到规定的最大迭代次数,停止训练;
23.所述输出层,用于输出n个水样的分类属性的结果。
24.优选的,所述输入层初始权向量属于[0,1];输出层至少两种分类属性,即废水种类不能单一。
[0025]
综上,本发明至少具有以下有益效果:
[0026]
1、通过pca提取三维荧光光谱数据特征并降维,将原始数据多变量简化为少变量,能去除贡献率较小的数据,避免关键指标被其他噪声所遮蔽,提取到有效的主要特征,提高
计算准确率。
[0027]
2、将众多原来可能线性相关的变量,变形生成互相独立的新变量,使变量之间的相关影响得以消除。
[0028]
3、降维后,会减少用于数据存储的内存空间,加快算法的训练速度。
[0029]
4、竞争型神经网络作为一种用于聚类的神经网络算法,具有无监督学习、自组织和自适应能力,借助计算机的高速运算,故具有快速寻找优化解的作用。
[0030]
5、本发明设备投入低,不受时间、空间和条件的限值,具有较强的灵活性。
附图说明
[0031]
图1是本发明的流程图;
[0032]
图2是本发明的竞争型神经网络结构图。
具体实施方式
[0033]
为使本发明的技术便于理解,以下结合附图与优选实施例,对本发明作详尽具体的说明,并不以所有方式对本发明提出限制,依据本发明所作的变更或分析,都包括于本发明的保护范围。
[0034]
实施例1:
[0035]
一种三维荧光信号pca-神经网络识别的水污染溯源方法,具体包括以下步骤:
[0036]
步骤1、将待测水样放入三维荧光分光光度计中扫描得到多维矩阵数据;
[0037]
步骤2、将水样的多维矩阵数据转换为一维行矩阵数据,并一同进行主成分分析并降维,得到得分系数矩阵,将其命名为三维荧光主成分特征库;
[0038]
步骤3、对三维荧光主成分特征库通过竞争型神经网络学习分类,得出每一水样的分类属性;
[0039]
步骤1中三维荧光光谱仪仪器参数,将发射波长设为230~650nm,激发波长是220~600nm,步长设为5nm,狭缝宽度是5nm;
[0040]
步骤1在20
±
2℃的温度条件下,使用三维荧光光谱仪对废水进行全波长扫描;
[0041]
所述步骤2中,采用matlab软件对三维荧光光谱矩阵数据进行数据处理,将原始多维矩阵数据,转为一维行矩阵数据,再使用pca函数将已知废水原水和未知废水一同提取特征,进行降维,得到的新矩阵则作为三维荧光主成分特征库;
[0042]
步骤2中,对pca后的得分系数矩阵,当样本数n大于等于原始数据指标数量6545时,主成分数=原始数据指标数量=6545;当样本数n小于原始数据指标数量6545时,主成分数=样本数量-1=n-1;
[0043]
步骤2中,水样的原始数据维度为77
×
85,其中,激发波长数=77=(600-220)/5+1,发射波长数=85=(650-230)/5+1,导入软件matlab中,通过reshape函数进行矩阵变形,将维度77
×
85的矩阵变形成维度为1
×
6545的行矩阵,再将n个不同的废水的数据,合并为维度n
×
6545的矩阵;
[0044]
pca后将维度n
×
6545的矩阵降维,得到维度n
×
主成分数的得分系数矩阵,即得到的主成分特征库的矩阵维度是n
×
主成分数;
[0045]
所述步骤3中,通过matlab软件中的竞争型神经网络对主成分特征库进行训练分
类,根据指定类别数判定得出各水样的属性;
[0046]
竞争型神经网络,包括:输入层、竞争层和输出层;
[0047]
输入层,用于接收主成分特征库数据作为输入向量,将输入向量传递给竞争层;
[0048]
竞争层,训练过程先随机赋值于初始权向量,对初始权向量和输入向量各自归一化,各神经元根据欧氏距离公式或夹角余弦公式,计算出输入向量与权向量的距离,再不断调整获胜神经元连接权。当获胜神经元的权值增加时,其他神经元的权值均减小;完成一次训练后,回到输入层进行下一次训练,以此不断循环并计算调整权值,直至输出误差小于允许值,或者训练次数达到规定的最大迭代次数,停止训练;
[0049]
输出层,用于输出n个水样的分类属性的结果;
[0050]
输入层初始权向量属于[0,1];输出层至少两种分类属性,即废水种类不能单一。
[0051]
1.背景:
[0052]
选取典型企业的某些废水产生工段的19类废水,用新制纯水根据不同稀释比稀释,未稀释的原水作为污染源,稀释后的水样模拟环境中的废水。用三维荧光光谱仪对原水和稀释废水进行扫描,得光谱矩阵数据。为评价本发明的效果,后续建立评价体系计算溯源准确率。
[0053]
2.技术方案
[0054]
水污染溯源方案如下:
[0055]
s100:建立三维荧光光谱数据库
[0056]
采集企业的19类废水作为污染源,对污染源用三维荧光分光光度计,进行全波长扫描,得其三维荧光光谱原始矩阵数据,用于后续创建三维荧光光谱特征数据库。企业类别及采水位置见表1。
[0057]
表1企业相关信息
[0058][0059]
s200:模拟测定环境中水样的三维荧光光谱数据
[0060]
用实验室高纯水将各个废水按1、2、3至15000等不同稀释比进行稀释,稀释成58个水样,以模拟环境中的水样,用三维荧光分光光度计将发射波长设为230~650nm,激发波长是220~600nm,步长设为5nm,狭缝宽度是5nm。在20
±
2℃下进行全波长扫描,测定各废水的矩阵数据。
[0061]
s300:pca提取光谱数据特征
[0062]
将19类废水、不同稀释比的水样共58个原始数据,导入matlab r2017a软件中,使用reshape函数将维度为77
×
85的多维矩阵数据变形为维度为1
×
6545的行矩阵,再将58个不同的废水的数据,合并为维度58
×
6545的矩阵。以pca函数对58
×
6545的矩阵进行主成分分析并降维,得到维度58
×
(58-1)=58
×
57的得分系数矩阵,命名为三维荧光主成分特征库;
[0063]
s400:竞争型神经网络学习分类
[0064]
对三维荧光主成分特征库通过matlab内置竞争型神经网络学习分类,指定分类数为19,得出58个水样的分类属性,分类属性用数字1-19表示。为提高准确性,设置重复循环分类5次。
[0065]
s500:评估信号增益效果
[0066]
建立评价体系计算溯源准确率,即通过计算各类废水分类后的匹配率,p表示:
[0067][0068]
其中,p是环境中废水(目标水样)与稀释前工业原水(源水样)的匹配百分率,%;
[0069]
t
p
为目标水样分类正确的个数;
[0070]fp
为目标水样分类错误的个数。
[0071]
源水样和目标水样的分类属性一致则表示分类正确,根据评价体系公式计算,得该条件下重复循环分类5次,求得19类水样匹配率的平均值,得出的最大匹配率为83.77%。
[0072]
3、创建指纹主成分特征库编程代码
[0073]
clear all;clc;
[0074]
targetsamplen=input('请输入要建立的(目标/源)指纹主成分特征库的样品数量(包含不同稀释比样品):')
[0075]
for i=1:targetsamplen
[0076]
[file_name,path_name]=uigetfile({'*.xls;*.xlsx','excel file'},'pick the excel date file')
[0077]
sname=strcat(path_name,file_name);
[0078]
d=xlsread(sname,'b2:bz86');
[0079]
targetlib(i,:)=reshape(d,77*85,1);
[0080]
end
[0081]
display(strcat('已完成(目标/源)指纹原始数据合并为一个矩阵targetlib,共',targetsamplen,'个样品'))
[0082]
[coeff,score,latent,tsquared,explained,mu]=pca(targetlib);
[0083]
targetlib_dir=uigetdir
[0084]
xlswrite(strcat(targetlib_dir,'\','主成分特征库.xlsx'),score);
[0085]
4、竞争型神经网络分类编程代码
[0086]
clear all;clc;
[0087]
[file_name,path_name]=uigetfile({'*.xls;*.xlsx','excel file'},'pick the excel date file')
[0088]
cn=input('class number=');
[0089]
ci=input('cycle index=')
[0090]
x=(xlsread(strcat(path_name,file_name),1));
[0091]
x=x';
[0092]
for i=1:ci
[0093]
net=competlayer(cn);
[0094]
net=init(net);
[0095]
net=train(net,x);
[0096]
y_vec=net(x);
[0097]
y_ind=vec2ind(y_vec);
[0098]
y_ind=y_ind';
[0099]
m(:,i)=y_ind;
[0100]
end
[0101]
xlswrite(strcat(path_name,file_name),m,2);
[0102]
尽管这里参照本发明型的多个解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本技术公开的原则范围和精神之内。更具体地说,在本技术公开、附图和权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变形和改进外,对于本领域技术人员来说,其他的用途也将是明显的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1