本发明涉及水处理技术领域,尤其涉及一种基于相关-主成分分析的混凝剂效能验证方法。
背景技术:
在水处理中,混凝作为一种应用范围广、简单有效的水处理工艺,是去除原水浊度、uv254、codmn及色度等指标的主要手段,其处理能效往往直接影响着后续的工艺运行条件,同时也影响着整体的运行成本以及出水的水质效果。合理选择混凝剂是混凝工艺工程应用成功的关键因素之一。我国水处理混凝剂自20世纪70年代以来,特别是近20年来取得了突飞猛进的发展,以无机高分子混凝剂为代表的新型混凝剂层出不穷,产销量大幅上升。现有技术中混凝剂主要有铝盐混凝剂、铁盐混凝剂、无机高分子混凝剂、复合型混凝剂等,但对这些不同的混凝剂的使用效果的评价方法比较单一,且不同类型的污染物,其去除的机理也具有一定差异性。因此,针对不同水源水质,需要对混凝剂效能进行评价以确定最适合该水源的混凝剂。但是由于现有技术中的混凝剂筛选主要是依靠正交试验等手段进行,试验过程较为复杂、优劣性筛选难度大、评价信息重复性高、指标体系的合理性判定缺乏定量标准等缺陷。因此,准确、快捷的混凝剂评价方法对于混凝剂的筛选十分重要。
技术实现要素:
本发明就是为了克服上述现有技术存在的缺点,提供一种基于相关-主成分分析的混凝剂效能验证方法。本发明采用相关-主成分分析法对混凝剂效能进行评价,解决了现有技术的混凝剂种类多、优劣性筛选难度大等缺陷。
本发明解决技术问题的技术方案是:
一种基于相关-主成分分析的混凝剂效能验证方法,首先对同一准则层下,指标在该时间段内的数值变化进行相关性分析,删除同一准则层下相关系数大的指标,保证筛选出的指标反应信息不重复;在相关性分析的基础上,对筛选出的指标进行主成分分析,保证筛选后的指标对评价结果有显著影响;最后对指标体系构建合理性进行判别,具体包括如下步骤:
步骤1:设置准则层
水厂实际运行中,进水水质、水温等因素在年度范围内不断变化,混凝剂投加量也随之改变;考虑一个季度内水质、水温、混凝剂投加量基本维持稳定,选定某一季度下混凝剂的某一投加量为一准则层;
步骤2:确定评价指标与评价对象
所述评价对象为特定准则层下的混凝剂效能;
评价指标选取能反映混凝剂效能的指标,包括浊度去除率、codmn去除率、uv254去除率、出水絮体粒径、出水zeta电位;
步骤3:指标数据的标准化
指标数据的标准化包括1)正向指标的标准化,2)负向指标的标准化;正向指标数值越大表明混凝剂效能越好,负向指标数值越小表明混凝剂效能越好;
步骤4:利用相关系数法进行指标相关性分析;
步骤5:指标主成分分析
1)建立主成分分析的基本模型
2)主成分分析对评价指标的筛选;
步骤6:指标体系合理性判定
根据因子分析用数据方差表示指标信息含量的思路,建立指标体系构建合理性的判定标准。
所述步骤3的1)正向指标的标准化包括:
设xij为第j个评价对象第i个指标标准化后的值;vij为第j个评价对象第i个指标的值;m为被评价对象数,根据正向指标的标准化公式,xij为:
式中:1≤i≤m;
2)负向指标的标准化包括:
根据负向指标的标准化公式,xij为:
式(2)中各个符号的含义与式(1)相同。
所述步骤4包括:
1)计算各指标标准差
式中:si为i指标的标准差;sj为j指标的标准差;zki为第k个评价对象第i个指标的值;zkj为第k个评价对象第j个指标的值;
2)计算各指标的协方差
式中:sij为两指标的协方差;
3)计算各指标的相关系数
式中:rij为第i个指标和第j个指标的相关系数;
4)规定相关系数临界值m
规定一个临界值m(0<m<1),若|rij|>m,则可以删除其中一个评价指标;若|rij|<m,则同时保留两个评价指标;
通过相关性分析删除同一准则层内相关系数大的指标,保证筛选出的指标反映信息不重复。
所述步骤5的1)中主成分的实质是观测指标的线性组合;主成分分析的模型为:
fi=αi1x1+αi2x2+...+αimxm,i=1,2,...,k#(7),
式中:xi为第i个指标(i=1,2,…,m);fj为第j个主成分(j=1,2,…,k);αij为对应第i个特征值的特征向量的第j个分量;k为主成分的个数;m为指标个数;
主成分分析的具体步骤:
①求标准化指标值的相关系数矩阵rm×m;
②求矩阵r的特征值λj(j=1,2,…,m),λj表示第j个主成分fj所解释的原始指标数据的总方差,则主成分fj对原始指标数据的方差贡献率wj为:
③将特征值λj按从大到小的顺序排列,根据累计方差贡献率≥85%的要求选取前k个特征值对应的主成分,得到第i个指标在第j个主成分上因子负载bij矩阵:
所述步骤5中2)根据主成分fj上因子荷载的绝对值|bij|筛选指标,|bij|越大表明指标i对评价结果的影响越显著,越应当保留;|bij|越小则表明指标对评价结果的影响越弱,越应当剔除;
通过主成分分析筛选指标,保证筛选后的指标对评价结果有显著影响。
所述步骤6中设s为指标数据的协方差矩阵;trs为协方差矩阵的迹,表示协方差矩阵的主对角线上各指标方差之和;s为筛选后的指标个数;m为初始指标个数;则筛选后的指标对初始指标的信息贡献率in为:
式(10)的含义是筛选后的s个指标的方差之和trss占初始m个指标的方差之和trsm的比值,表示s个筛选后的指标所反映的m个初始指标的信息。
所述同一准则层是指某一季度同一混凝剂投加量。
本发明的有益效果:
1.本发明的基于相关-主成分分析的混凝剂效能评价方法,针对混凝剂种类多、优劣性筛选难度大、涉及指标繁多的缺陷,通过相关性分析判断了因素与结果之间相关度的大小以及因素对结果影响作用的强弱,删除了反应信息冗余的评价指标,消除了直接相关系数的虚假性,解决了现有技术的混凝剂种类多、优劣性筛选难度大等缺陷。
2.本发明通过主成分分析提取出了多因素的主成分,根据原始变量在主成分方向上的荷载,考察了原始变量在主成分上与结果之间的相关系数,删除了对评价结果影响较小的评价指标,保证了筛选出的指标对评价结果有显著影响。
3.本发明根据因子分析用方差表示信息含量的思路,将筛选后的指标反映的初始指标信息含量作为指标体系构建合理性的判定标准,解决了指标体系的合理性判定缺乏定量标准的问题。
附图说明
下面结合附图和实施例对本发明做进一步的说明:
图1为本发明中实施例的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明所要解决的技术问题是针对现有混凝剂种类多、优劣性筛选难度大等缺陷,采用相关-主成分分析法对混凝剂效能进行评价,提供一种效能评价方法。
结合图1,一种基于相关-主成分分析的混凝剂效能验证方法,首先对同一准则层下,指标在该时间段内的数值变化进行相关性分析,删除同一准则层下相关系数大的指标,保证筛选出的指标反应信息不重复;在相关性分析的基础上,对筛选出的指标进行主成分分析,保证筛选后的指标对评价结果有显著影响;最后对指标体系构建合理性进行判别。具体包括如下步骤:
步骤1:设置准则层
水厂实际运行中,进水水质、水温等因素在年度范围内不断变化,混凝剂投加量也随之改变。考虑一个季度内水质、水温、混凝剂投加量基本维持稳定,选定某一季度下混凝剂的某一投加量为一准则层;
步骤2:确定评价指标与评价对象
所述评价对象为特定准则层下的混凝剂效能;
评价指标选取能反映混凝剂效能的指标,包括浊度去除率、codmn去除率、uv254去除率、出水絮体粒径、出水zeta电位;
步骤3:指标数据的标准化
指标数据的标准化包括正向指标的标准化、负向指标的标准化;
1)正向指标的标准化
正向指标数值越大表明混凝剂效能越好。设xij为第j个评价对象第i个指标标准化后的值;vij为第j个评价对象第i个指标的值;m为被评价对象数,根据正向指标的标准化公式,xij为:
式中:1≤i≤m;
2)负向指标的标准化
负向指标数值越小表明混凝剂效能越好。根据负向指标的标准化公式,xij为:
式(2)中各个符号的含义与式(1)相同;
步骤4:利用相关系数法进行指标相关性分析
1)计算各指标标准差
式中:si为i指标的标准差;sj为j指标的标准差;zki为第k个评价对象第i个指标的值;zkj为第k个评价对象第j个指标的值;
2)计算各指标的协方差
式中:sij为两指标的协方差。
3)计算各指标的相关系数
式中:rij为第i个指标和第j个指标的相关系数;
4)规定相关系数临界值m
规定一个临界值m(0<m<1),若|rij|>m,则可以删除其中一个评价指标;若|rij|<m,则同时保留两个评价指标;
通过相关性分析删除同一准则层内相关系数大的指标,保证筛选出的指标反映信息不重复;
步骤5:指标主成分分析
1)主成分分析的基本模型
主成分的实质是观测指标的线性组合。主成分分析的模型为:
fi=αi1x1+αi2x2+...+αimxm,i=1,2,...,k#(7)
式中:xi为第i个指标(i=1,2,…,m);fj为第j个主成分(j=1,2,…,k);αij为对应第i个特征值的特征向量的第j个分量;k为主成分的个数;m为指标个数;
主成分分析的具体步骤:
④求标准化指标值的相关系数矩阵rm×m;
⑤求矩阵r的特征值λj(j=1,2,…,m),λj表示第j个主成分fj所解释的原始指标数据的总方差,则主成分fj对原始指标数据的方差贡献率wj为:
⑥将特征值λj按从大到小的顺序排列,根据累计方差贡献率≥85%的要求选取前k个特征值对应的主成分,得到第i个指标在第j个主成分上因子负载bij矩阵:
2)主成分分析对评价指标的筛选
根据主成分fj上因子荷载的绝对值|bij|筛选指标,|bij|越大表明指标i对评价结果的影响越显著,越应当保留;|bij|越小则表明指标对评价结果的影响越弱,越应当剔除。例如,可选取第一主成分中因子负载绝对值大于0.9的指标和第二主成分中因子负载绝对值最大的指标。
通过主成分分析筛选指标,保证筛选后的指标对评价结果有显著影响;
步骤6:指标体系合理性判定
根据因子分析用数据方差表示指标信息含量的思路,建立指标体系构建合理性的判定标准。
设s为指标数据的协方差矩阵;trs为协方差矩阵的迹,表示协方差矩阵的主对角线上各指标方差之和;s为筛选后的指标个数;m为初始指标个数。则筛选后的指标对初始指标的信息贡献率in为:
式(10)的含义是筛选后的s个指标的方差之和trss占初始m个指标的方差之和trsm的比值,表示s个筛选后的指标所反映的m个初始指标的信息。
得出结论:如果能用30%以下的筛选指标反映了95%以上的原始信息,则可认为指标体系构建合理。
所述同一准则层是指某一季度同一混凝剂投加量。
本发明针对混凝剂种类多、优劣性筛选难度大、涉及指标繁多的缺陷,通过相关性分析避免了指标反映重复信息;通过主成分分析保证了筛选出的指标对评价结果有显著影响;根据因子分析用方差表示信息含量的思路,建立了指标体系构建合理性的判定标准。
本发明的描述中,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“竖直”、“水平”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了描述本发明而不是要求本发明必须以特定的方位构造或操作,因此不能理解为对本发明的限制。本发明中的“相连”“连接”应作广义理解,例如,可以是连接,也可以是可拆卸连接;可以是直接连接,也可以是通过中间部件间接连接,对于本领域的普通技术人员而言,可以具体情况理解上述术语的具体含义。
以上所述为本发明的优选实施方式,具体实施例的说明仅用于更好的理解本发明的思想。对于本技术领域的普通技术人员来说,依照本发明原理还可以做出若干改进或者同等替换,这些改进或同等替换也视为落在本发明的保护范围。