基于支持向量机和树叶磁学的大气重金属污染评估方法与流程

文档序号:14712292发布日期:2018-06-16 00:38阅读:258来源:国知局
基于支持向量机和树叶磁学的大气重金属污染评估方法与流程

本发明涉及城市大气颗粒物重金属监测和污染研究技术领域,具体是涉及一种基于支持向量机和树叶磁学的大气重金属污染评估方法。



背景技术:

大气颗粒物来源广泛、结构复杂、比表面积大,易富集多种污染物如重金属。研究表明,大气颗粒物中重金属与人类的呼吸系统疾病和心血管疾病的发生具有重要联系。我国的环境空气质量标准(GB3095-2012)将大气汞、砷、六价铬和镉列为省级政府机构建议制定和实施监测的环境空气质量指标。传统的大气重金属污染监测方法是利用常规收集装置收集一定粒径大气颗粒物,化学提取并使用原子吸收光谱仪或电感耦合等离子质谱等方法检测颗粒物中重金属浓度,工作量较大、耗时且费用昂贵,因此,选择高效、便捷的方法研究大气颗粒物中重金属污染具有重要的现实意义和实践价值。

支持向量机(Support Vector Machines,SVM)是由Vapnik开发的新一代基于统计学习理论的学习机器,能解决小样本、非线性、高维数和局部极小点等实际问题,遵循结构风险最小化原则,可以成功应用于分类、归类和时间序列预测等领域。Libsvm是台湾大学林智仁等开发设计的一个简单、快速、有效的支持向量机模式识别与回归的软件程序,它提供了编译好的基于Windows操作系统的执行文件以及相关的软件程序源代码。

环境磁学的原理是通过测量环境介质中物质的磁学特征,从中提取环境信息。与传统的化学分析方法相比,磁学测试具有样品用量少、简便快捷、灵敏度高、费用低和非破坏性等特点。大气颗粒物中的金属元素主要有钠、钾、镁、钙、铝、铁等地壳元素以及铅、锌、砷、镉、铜等主要来自人类污染的元素。城市大气颗粒物中磁性铁氧化物和铁的氢氧化物占铁元素总质量的10-70%,主要来自工业磨损、含铁杂质燃料燃烧、钢铁加工和机动车零部件磨损等。这些磁性颗粒与大气重金属的共源性使得利用磁性特征描述或量化大气重金属成为可能。

目前针对区域性大气污染时空分布的研究多以模拟分析为主,如数值模拟和统计预报。数值模拟通常需较详尽的污染源信息及时空分辨率很高的气象预报模式等,在实际中往往难以获取。大气污染物浓度的统计预报是通过分析污染物变化规律,建立典型因子与污染物浓度之间的定量或半定量关系,根据这些关系作浓度预报,无需构建复杂的数理模型,比较简便、易于实现,且在借助合适的输入变量及模型下,常可以获得较高的模拟预测精度。近年来常用的支持向量机模型可以解决小样本、非线性、高维数和局部极小点等实际问题,是基于支持统计学习理论的学习机器,已经成功应用于建立NOX、CO、SO2、O3、PM的联系及污染物预测。尽管目前我国很多城市大气颗粒物已基本实现自动、在线、连续监测,但由于大气重金属监测分析工作量较大、研究不够,还缺乏数据积累,并未开展系统的监测和分析工作。

城市常绿树木分布广泛,叶片比表面积大,生长周期长,可以通过叶片表面的蜡质层吸附或通过气孔直接吸收大气中的颗粒物,尤其是更容易吸附或吸收粒径小于10μm的细颗粒物,是颗粒物天然的“接收器”。因此,可利用植物叶片作为载体来反演短时间内大气颗粒物中重金属的污染状况,为其污染水平、时空分布和来源等方面的研究提供重要信息和依据。空气监测站通常监测的是实时颗粒物浓度,而利用植物叶片作为载体可以很好地反演短时间内大气颗粒物污染状况。近年来,国内外已有利用树叶的磁性特征来表征大气颗粒物污染的研究,但目前还没有利用树叶磁学参数构建非线性数学模型来模拟城市大气颗粒物中重金属浓度的报道。

因此,本发明采用支持向量机的非线性数学方法,以树叶磁学参数、常规大气污染物和气象数据为基础,构建大气颗粒物中重金属磁学评估模型,模型可用于模拟预测城市大范围内大气颗粒物中重金属的时空分布,为我国城市大气中重金属污染的快速监测、评估和风险管理提供支持。



技术实现要素:

本发明解决的技术问题是:本发明针对现有技术的不足,提供一种基于支持向量机技术和树叶磁学参数的大气颗粒物重金属污染模拟、评估方法。

本发明的技术方案是:一种基于支持向量机和树叶磁学的大气重金属污染评估方法,其特征在于,包括以下步骤:

S1:大气颗粒物样品采集

使用中流量采样装置收集大气颗粒物PM2.5,采样介质使用高纯石英膜,采样前后滤膜均恒温恒湿48h并称重,所述恒温恒湿条件为温度20-25℃,湿度40-50%,按一定条件进行采样;

S2:树叶样品采集

在距离大气颗粒物采样点1km范围内调查常青灌木或乔木分布情况,以1-3种树木作为研究对象,选择树龄和高度相似、生长状况良好的树上成熟、健康无病害、无虫斑的树叶,采集新生的树枝上最成熟的叶片,每4天进行一次与颗粒物的同步采样,采样时佩戴一次性手套,避免其他物品直接接触树叶样品,与大气颗粒物同步采样,周期为1年;样品放入自封袋带回实验室放入冰箱冷藏室保存,以备测试;

S3:大气颗粒物重金属提取及分析

将大气颗粒物采样膜用陶瓷剪刀剪下1/2,并剪成条状碎片,置于消解管中,加入HF、HNO3和HCl进行提取,使用电感耦合等离子体质谱仪ICP-MS测试消解液中微量元素,使用电感耦合等离子体发射光谱仪ICP-OES测定消解液中大量金属元素;取等面积空白滤膜,按样品处理方法制成空白溶液并检测元素浓度;使用美国国家标准与技术研究院标准参考物质NIST SRM 1648a(城市颗粒物)进行加标回收,作为分析质量控制;

S4:树叶样品磁学参数测试

将树叶样品放入烘箱烘干,烘干后剪碎,称取2g样品用保鲜膜包裹放在圆柱状聚乙烯样品盒中,压实待测;利用KY-3S卡帕桥磁化率仪测量样品的体积磁化率κ,经密度校正得到样品的质量磁化率χ;使用Molspin交变退磁仪对样品进行退磁后,使用JR-6A旋转磁力仪测量样品的非磁滞剩磁ARM,并计算出无磁滞磁化率χARM。使用ASC Scientific Model IM-10-30对样品加1000mT的磁场进行脉冲磁化后,使用JR-6A旋转磁力仪测试样品的等温剩磁作为饱和等温剩磁SIRM。其中,质量磁化率χ是环境介质中铁磁性矿物含量的粗略量度;非磁滞剩磁ARM提供了铁磁晶粒的磁畴信息,对单畴晶粒的反映尤为敏感,可反映磁性颗粒物的粒径组成;饱和等温剩磁剩磁SIRM反映了磁性矿物在样品中的富集程度,与环境介质中铁磁性矿物的类型和含量有关;

S5:支持向量机磁学模型构建

分别以“气象因子+污染物+树叶磁学参数”,以及“树叶磁学参数”作为输入参数,所述气象因子包括:温度、相对湿度、气压和风速;所述污染物包括:PM2.5、SO2、NO2和O3浓度;所述磁学参数包括:树叶的χ、χARM和SIRM;以PM2.5中重金属浓度作为输出层,建立大气颗粒物重金属污染磁学评估模型;

S6:模型误差评估

使用相关系数,平均绝对误差和均方根误差来评价模型性能及预测效果;相关系数用于反映变量之间的相关关系密切程度,用于测量模型的拟合性能;平均绝对误差是所有单个模拟值与实测值偏差绝对值的平均值,用于评估模型的预测效果;均方根误差是误差平方和的平均值的平方根,用于判定该模型的可靠性,其计算公式分别如下:

S7:模型实际应用

实际应用中,模型训练完毕后,可针对任意区域任意时间段,采集不同位置用于建模的树种的叶片并分析其磁学参数,然后将“树叶磁学参数”或者“气象因子+污染物+树叶磁学参数”作为输入因子,用上述已训练好的模型预测该区域、该时段该位置对应大气颗粒物重金属的浓度,进而获得重金属浓度的时空分布情况。

进一步的,所述S1中,采样方法具体为:按季节采样,每次采样持续4天,每天固定采集8-12小时,每个样品共采集32-48个小时,避免大风和雨雪等极端天气,采样为期1年,采用上述采样方法采集的样品代表性强,能有效评估一年四季大气颗粒物重金属的含量,能使得评估的准确性更加精确。

进一步的,所述S3中,测试消解液中微量元素有As、Cd、Co、Cr、Cu、Mn、Ni、Pb、Sb、Ti、TI和V,但不仅限于这十二种;测定消解液中大量金属元素有Al、Fe和Zn,但不仅限于这三种。

进一步的,所述S4中,使用陶瓷剪刀进行剪碎,通过使用陶瓷剪刀剪碎叶片,可以防止金属剪刀在剪碎时夹带金属成分影响结果的准确性。

进一步的,所述S4中,脉冲磁化的磁场强度为1000mT。

进一步的,所述S5中,随机选择80%的数据作为训练样本,且包含其中的极大值和极小值,剩下的20%作为验证样本,采用随机选择80%作为训练样本与20%的验证样本对比,对比充分,更易对比得到的评估结果,且评估结果更客观准确。

进一步的,所述方法中支持向量机模拟模型建立具体过程为:在MATLAB R2013a环境下安装Libsvm-3.21,选取支持向量机中常用的径向核函数,RBF核函数,epsilon-SVR模型进行模拟,通过交叉试验的方法选取模型最佳核函数g值及惩罚因子c值,建立重金属浓度的磁学模型,在至少100次成功建模之中,选择训练和验证模型中相关系数最大的一次作为模拟模型。

进一步的,支持向量机用于回归统计的方法具体如下:

设训练样本为(xi,yi),(i=1,…,l),建立如下线性回归方程:

其中,为非线性映射函数,ω为法向量,b为偏置量;

进而训练目标可表示为:

且满足以下约束条件:

其中,ε为不敏感损失函数,ε≥0,表示允许的最大误差,其取值的大小影响支持向量数目;C≥0为惩罚系数,它控制对超出误差样本的惩罚程度;ξi,为松弛变量,指示样本超出允许误差的程度,分别对应计算值小于实际值及计算值大于实际值两种情况;

为得到以上最优化问题(式(5)),引入了拉格朗日乘子法,得其对偶优化问题为:

满足以下约束条件:

其中,αi和是拉格朗日乘子;

对式(9)求解,对应的预测输入样本为xi,得到如下预测值:

所述方法采用常用的径向基核函数RBF作为核函数,其表达式为:

其中,δ2是核函数的方差。

与现有技术相比,本发明的有益效果如下:

1、本发明所提供的一种基于支持向量机和树叶磁学的大气重金属污染评估方法,搭建了环磁学与重金属污染定量化评价的桥梁,拓展了利用环境磁学评价大气污染的方法和技术。

2、鉴于大气颗粒物重金属污染特征复杂、分析费时费力,对于其污染的快速监测具有一定紧迫性。本发明所构建的模型可用于城市大气颗粒物重金属污染水平的快速模拟和预测,进而识别、把握城市大气重金属污染状况和变化趋势,为大气重金属污染综合防控提供重要参考。

附图说明

图1是本发明的流程框架图;

图2是磁学模型对PM2.5中As、Cd、Cr、Fe和Pb的模拟值与实测值的对比,(a)-(e)是模型1的模拟结果,(f)-(j)是模型2的模拟结果;

具体实施方式

下面结合具体实施方式来对本发明进行更进一步详细的说明,以更好地体现本发明的优势。

一种基于支持向量机和树叶磁学的大气重金属污染评估方法,包括以下步骤:

S1:大气颗粒物样品采集

近年来,长三角地区大气颗粒物污染比较严重。南京是江苏省省会,长三角地区的第二大城市,我国重要的综合性工业生产基地,同时是华东地区重要的交通枢纽。本发明选择位于南京市北部的南京大学仙林校区作为研究区域,进行大气颗粒物和树叶样品的采集及模型构建。仙林大学城是江苏省发展高等教育产业的重点地区,因距离南京城北、江北工业区较近,其空气质量受到一定影响。

PM2.5采样设备为XY-2200型大气综合采样器(流量100L/min),采样器采气口距离地面1.5m,采样膜选用高纯石英膜,采样时间为2015年12月4日到11月30日,为期一年。每次采样持续4天,每天8小时,采样时间段为7:00-15:00,每个样品共采集32个小时,大风和雨雪等极端天气暂停采样,最终每个季节获得21个、共计获得PM2.5样品84个。同步记录采样点附近南京大学空气质量自动监测站的实时气象数据和大气污染物数据。

S2:树叶样品采集

桂花是南京市最常见、分布最广泛的常绿树种之一,其叶片对大气颗粒物吸附能力较强,且树木高度及叶片大小很适宜进行本发明的采样及分析。在距离PM2.5采样点约0.5km范围内采集桂花树叶,采样时间与频率和大气颗粒物相同,每隔4天采集一次,选取树龄为3年、高度为2m左右的3棵树,在每棵树的不同方向分别收集4片树叶,采样高度为1.5m。选择成熟、健康无病害、无虫斑的树叶进行采样。采样时佩戴一次性手套,用陶瓷剪刀剪取树叶,避免其他物品直接接触树叶样品。样品采集后放入聚乙烯袋带回实验室。采样时间为期1年,共获得84个树叶样本。

S3:大气颗粒物中重金属提取及分析

每张滤膜的1/2用于分析金属元素含量。将大气颗粒物采样膜用陶瓷剪刀剪下1/2,并剪成条状碎片,置于消解管中,加入HF、HNO3和HCl进行提取;As、Cd、Co、Cr、Cu、Mn、Ni、Pb、Sb、Ti、TI和V浓度使用电感耦合等离子体质谱(ICP-MS,Perkin Elmer SCIEX,Elan 9000,Norway)测定,最低检出限的0.01μg/L;Al、Fe和Zn使用电感耦合等离子体发射光谱仪(ICP-OES,Perkin Elmer SCIEX,Optima 5300DV,Norway)测定,最低检出限为0.001mg/L。以美国国家标准与技术研究院标准参考物质:NIST SRM 1648a(城市颗粒物)为质控标样,加标回收作为分析质量控制,绝大部分元素加标回收率为106%,符合质控要求。

PM2.5中绝大部分金属元素含量在冬季的浓度最高,只有Co和Cr在春季最高;大部分金属元素含量冬季和秋季高于夏秋季。具体地,金属元素浓度季节分布情况如下(单位ng/m3):春季:Al(1297)>Fe(930.7)>Zn(199.6)>Ti(50.66)>Ni(46.65)>Mn(44.28)>Cr(39.32)>Pb(39.20)>Cu(34.35)>As(7.392)>V(5.505)>Sb(3.52)>Cd(1.308)>Co(0.496)>TI(0.411);夏季:Al(1177)>Fe(445.4)>Zn(196.8)>Ni(36.72)>Ti(25.89)>Cr(25.67)>Mn(23.83)>Cu(18.05)>Pb(14.69)>As(4.946)>V(4.249)>Sb(2.916)>Cd(1.276)>TI(0.372)>Co(0.284);秋季:Al(1186)>Fe(354.3)>Zn(214.4)>Ni(39.12)>Pb(29.51)>Mn(28.88)>Ti(28.78)>Cr(27.26)>Cu(17.53)>V(3.875)>As(3.848)>Sb(3.145)>Cd(1.477)>TI(0.279)>Co(0.223);冬季:Al(1550)>Fe(1056)>Zn(275.7)>Pb(73.77)>Mn(56.79)>Ti(51.59)>Ni(47.7)>Cu(43.28)>Cr(36.85)>As(8.754)>V(5.9)>Sb(4.742)>Cd(2.345)>TI(0.697)>Co(0.457)。

S4:树叶样品的磁学参数

将采集到的桂花树叶样品放入烘箱烘干,温度为55℃,烘干后用陶瓷剪刀剪碎,称取约2g样品用保鲜膜包裹置于用于磁学参数测试的圆柱状聚乙烯样品盒(体积为11.15cm3)中,压实待测;在875Hz的频率下,使用卡帕桥磁化率仪KLY-3测试低频磁化率χlf;使用Molspin交变退磁仪进行退磁后,将样品置于0.04mT的直流偏置场中和100mT的交变磁场峰值下获得非磁滞剩磁,再利用JR-6A旋转磁力仪测量样品的非磁滞剩磁(ARM),计算成无磁滞磁化率(χARM);使用ASC Scientific Model IM-10-30对样品加1000mT的磁场进行脉冲磁化后,利用JR-6A旋转磁力仪测量样品的等温剩磁(IRM1T),作为样品的饱和等温剩磁(SIRM)。每个季节树叶的磁学参数如表1所示,χlf:冬季>春季>秋季>夏季;χARM值冬季最高,夏季最低;SIRM:冬季>春季>秋季>夏季。

表1桂花树叶磁学参数特征

S5:支持向量机模型构建

将大气颗粒物中重金属浓度与树叶磁学参数、污染物浓度、气象数据进行皮尔逊相关性分析,结果显示,PM2.5中金属浓度和树叶的χlf、χARM、SIRM值显著正相关,说明树叶所吸附的颗粒物中的磁性矿物与大气重金属之间具有一定的共源性及内在联系。所有金属元素浓度与PM2.5浓度均呈现正相关,Pb与PM2.5浓度相关系数最高,为0.781,Co与PM2.5浓度相关系数最低,为0.229;绝大部分金属元素浓度与O3、温度、相对湿度、风速呈显著负相关,与SO2、NO2和大气压正相关。大气重金属与大气污染物之间具有较强的共源性如工业排放、交通污染和道路扬尘等。风速对大气污染物有一定稀释作用,一般来说,温度越高,大气压越低,空气对流运动越明显,大气颗粒物扩散速率越快,其浓度也同时有所下降;空气湿度对大气颗粒物最显著的影响是对其的冲刷作用。

在分析了重金属与输入因子之间的内在关系之后,以金属浓度作为输出层,将树叶的磁学参数(χlf、χARM和SIRM)、污染物浓度(PM2.5、SO2、NO2和O3)和气象数据(温度、相对湿度、压力和风速)作为输入层作为本案例的模型1;另外,为提高模型的可应用性,考虑到采样点如不能获取气象数据和污染物的情况,再直接将“树叶的磁学参数(χlf、χARM和SIRM)”作为输入因子构建本案例的模型2。随机选择80%的数据作为训练样本,剩下的20%作为验证样本,为了确保模型的可靠性,训练集中包含了不同季节数据的极值。应用MATLAB R2013a和libsvm-3.21建立支持向量机模型,输入的参数首先利用核函数的径向基函数映射到高维特征空间,然后在特征空间中进行线性回归。

S6:模型误差评估

模型的R、MAE、RMSE值如表2所示。模型1(输入因子为树叶的磁学参数、污染物浓度和气象数据)的训练和验证模型的R值均大于0.6,误差在可接受范围内,其中Fe、Mn和Pb训练和验证模型的R值均大于0.8。对于模型2(树叶的磁学参数),只有树叶磁学参数作为输入因子时,训练和验证模型的R值也均大于0.6,误差都在可接受范围内,且训练和验证模型As、Cd、Fe、Mn和Pb的R值均大于0.7。两类模型对Fe和Pb的模拟效果较好,误差也较低,而对V、Co和Sb的预测效果相对较弱。模型对不同金属元素的模拟结果与研究区域、采样时间及来源有关,具体原因仍需进一步验证。总体上,模型1和模型2均可对大气颗粒物重金属浓度进行较为理想的预测。以As、Cd、Cr、Fe和Pb为例,树叶磁学模型对金属元素浓度模拟值与监测值的比较如附图2所示。

表2磁学模型对PM2.5中重金属浓度模拟的相关性系数(R)、平均绝对误差(MAE)和均方根误差(RMSE)

S7:南京大气颗粒物重金属浓度分布预测

上述模型实际应用时,采用网格布点法在南京市划定5km×5km的网格,每个网格中选择2个共50个居民小区作为树叶采样点。采样前一周及当天均晴朗无雨,在每个小区较为开阔的地带选择树龄、高度相似及生长状况良好的桂花树3棵,于每棵树的不同方向采摘4片共计10片左右成熟、健康、无虫斑的树叶,放入自封袋带回实验室。将树叶烘干并测试其磁学参数χlf、χARM和SIRM。将三个磁学参数作为输入因子代入上述支持向量机模型2中,即可模拟出50个点位PM2.5中重金属的浓度值。结果显示,距南钢集团、金陵石化或扬子石化等地较近或距交通密集区较近的小区,树叶磁学参数值及模拟输出的PM2.5中重金属浓度均较高,而附近交通密度较低又无明显工业源影响的小区所模拟出的重金属浓度较低。本发明所构建的模型可用于模拟预测城市大范围内大气颗粒物中重金属的时空分布,从而为我国城市大气中重金属污染的快速监测和风险管理提供参考和支持。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1