一种应用单颗粒气溶胶质谱仪进行颗粒物源解析的方法与流程

文档序号:18699845发布日期:2019-09-17 22:42阅读:317来源:国知局
一种应用单颗粒气溶胶质谱仪进行颗粒物源解析的方法与流程
本发明涉及大气颗粒物源解析领域,具体涉及到应用单颗粒气溶胶质谱仪进行大气颗粒物精细化源解析方法。
背景技术
:颗粒物浓度增加是灰霾等污染过程产生的主要内在因素,在不利的气象条件下,由pm2.5污染引发的某些域性重灰霾持续时间可长达数天(5~10天),持续的重污染过程也成为城市环境空气质量、大气能见度和居民人体健康的重大威胁。对于重污染天气,应急预案的制订应该基于科学分析和污染源解析,找准城市重污染形成的根源和关键环节。这就需要我们对重污染过程成因快速进行精确解析和对颗粒物来源进行快速、准确溯源,为重污染天气的应急预案提供科学依据,从而有效控制城市颗粒物污染尤其是重污染过程中的颗粒物。传统的基于受体模型的颗粒物源解析是通过滤膜采样、离线分析技术进行分析的。这种分析时间长、低时间分辨率(一般为24小时)的分析技术不能满足在较短时间内取得足够的样品来解析污染源对颗粒物的影响。单颗粒质谱技术相对于传统颗粒物的分析方法具有时间分辨率高且、能对几乎所有种类颗粒进行分析、能同时获得单颗粒的粒径和化学组成信息的特点。基于上述特点,目前国内外广泛应用单颗粒气溶胶质谱仪在大气颗粒物来源解析的研究中。源解析的方法主要包括:1)利用art-2a神经网络算法对环境受体按照质谱特征进行分类,从而识别他们的来源。或者通过相似度比对的方法,将受体颗粒物谱图和污染源特征谱图进行比对从而对环境受体进行来源分类。该方法的主要问题在于运算效率低,且由于不考虑颗粒物老化的问题而难以求解二次源的贡献;2)利用pmf模型对单颗粒质谱数据进行运算分析,对得到的因子进行源识别,从而解析各污染源的贡献。该方法的主要问题是难以将污染源单颗粒质谱特征及粒径分布规律充分考虑,使得解析的因子物理意义不够明确。上述方法虽然均能从不同角度定量污染源的贡献,但仍存在难以定量二次源贡献、对污染源单颗粒质谱特征及粒径分布规律考虑不充分、时效性低等问题。技术实现要素:本发明的目的是解决现在单颗粒源解析算法对污染源单颗粒质谱特征利用不充分、定量二次源贡献困难并且源解析时效性不高等问题,从环境受体的平均状态出发,提出了一种新型的单颗粒快速源解析模型——pdlen模型,并提出了四个模型结果有效性诊断指标。该模型以受体模型基本原理为基础,以环境受体和污染源单颗粒质谱数据作为输入数据,在多元线性回归模型的基础上在损失函数中纳入l1、l2和正定项,具有受源谱共线性影响小、计算的源解析结果稳定且非负的特点。本发明以污染源质谱加权成分谱和受体高时间分辨率平均质谱数据作为模型输入数据,利用pdlen模型快速求解获得高时间分辨率(1min~1h)、高粒径分辨率、多源类的精细化源解析结果。本发明提供的一种应用单颗粒气溶胶质谱仪进行颗粒物源解析的方法,采用的技术方案步骤如下:第1步、构建pdlen模型和模型诊断指标;pdlen模型,是在传统的多元线性回归模型的基础上增加了l1、l2正则项和正定项,具有受源谱共线性影响小、计算的源解析结果稳定且非负的特点。pdlen模型基于一个基本假设,即连续时间点的数据应具有一定的近似性(这种近似性被认为是有限的,即时间长度有限,且允许突变的情况存在)。在不考虑受体或源数据的噪声的前提下,该模型的假设函数:式中:ci—受体大气颗粒物中荷质比(m/z)i的相对峰面积;fij—第j类源的颗粒物中荷质比(m/z)i的相对峰面积;sj—第j类源贡献的占比;j—源类的数目,j=1,2……j;i—参与拟合的荷质比的数目,i=1,2……i。然而在实际当中,数据存在噪声影响,因此该模型方程组的矩阵形式可以写成:j(s)=mae(s)+α·l1(s)+α·l2(s)+β·r(s)(2)其中:其中:s为源贡献度向量;f为污染源质谱成分谱;ci—受体大气颗粒物中荷质比(m/z)i的相对峰面积;i为参与拟合的荷质比数;j为源类个数;pdlen模型的损失函数主要由三部分构成,误差项、正则项、正定项。其中α和β分别是正则项和正定项的权重系数,是模型运算过程中要调节的重要参数,α和β的改变会影响模型结果的稳定性、稀疏性和正定性。pdlen模型的诊断指标,为了评估模型结果的合理性,提出了四个模型诊断指标,包括:误差(rss)、稳定性(stability)、稀疏性(sparsity)和正定性(non-negativity)。rss代表实测值和模型模拟值的差异,能够反映模型的拟合效果,其计算方法为每一个荷质比处模型模拟值和实测值的均方误差;stability代表每一个污染源贡献结果在短时间内的波动程度。其计算方法为n个源以当前时刻t为中心,滑窗宽度为t内源贡献的方差的平均值;sparsity代表参与模型拟合的源类个数。其计算方法为参与模型拟合的且源贡献高于0.5%的源类个数的均值;non-negativity代表源贡献结果的正定性。其计算方法为小于0的贡献度的绝对值之和。对于模型结果的诊断,要结合用户所设置的时间分辨率和粒径分辨率的大小,对于时间和粒径分辨率低的,rss、stability和non-negativity越小越好,而sparsity越大越好,代表模型拟合效果好且解析结果较为稳定,参与拟合的源类多,负数贡献结果少。误差的数学定义如下式所示:稳定性的计算公式如下:稀疏性的计算公式如下:正定性的计算公式如下:其中:rss(t):t时刻的准确性;stability(t):t时刻的稳定性;sparsity(t):t时刻的稀疏性;non-negativity(t):t时刻的非负性亦即正定性;在时刻t,受体大气颗粒物中荷质比(m/z)i的相对峰面积;在时刻t,第j个源的荷质比(m/z)i的相对峰面积;在时刻t,第j个源的贡献度;以t时刻为中心,时间窗宽度为t的范围内的第j类源贡献度的均值;i:参与拟合的荷质比的数量;j:源类个数;t:时间窗口的长度第2步、构建污染源单颗粒质谱成分谱;通过用单颗粒气溶胶质谱仪采集而获得的各污染源大量单颗粒质谱原始数据,并筛选保留主要的荷质比;利用k-means聚类算法提取各污染源类p的特征质谱{p1,p2……pn},这些特征质谱包含了该污染源的所有质谱信息,污染源单颗粒质谱原始数据包括m/z-1~-250和m/z1~250的峰面积值。在原始荷质比信息m/z-1~-250和m/z1~250中筛选出77个主要的荷质比信息,包括m/z-16,-17,-19,-24,-25,-26,-35,-36,-37,-43,-45,-46,-48,-49,-59,-60,-62,-63,-71,-72,-73,-76,-79,-80,-84,-88,-96,-97,-119,-136,-137,7,12,23,24,27,36,37,39,40,48,50,51,54,56,60,61,62,63,64,65,66,72,74,75,77,81,83,84,96,103,108,112,120,163,168,176,180,190,201,202,207,208,213,216,226和230。利用统计学方法得到各个特征质谱的权重,将每一个污染源的多条特征质谱利用加权平均的方法获得各个污染源的加权质谱成分谱,共同构成加权质谱成分谱矩阵f。第3步、环境受体单颗粒数据采集及预处理;使用单颗粒气溶胶质谱仪(如atofms或spams)对环境受体单颗粒进行采集和分析,得到大量环境受体单颗粒质谱数据。根据用户需求设定合适的时间分辨率(一般选择在1min~1h之间)并划分合适的粒径段,对各个粒径段内的环境受体单颗粒质谱数据进行处理,求取对应时间分辨率下的受体的平均质谱数据,并筛选保留主要的荷质比,筛选保留的主要荷质比信息与第2步中相同。第4步、pdlen模型运算得到初步结果;将第2步构建的污染源单颗粒质谱成分谱和第3步获得的环境受体平均质谱数据共同输入到第1步构建的pdlen模型中进行源解析结果的运算。第5步、结果有效性诊断及反馈;使用第1步提出的四个pdlen模型结果诊断指标对第4步源解析结果进行诊断,如果结果不合理则需要返回第4步中修改模型参数重新运算,直到获得满意结果。本发明的优点和有益效果:与其他单颗粒源解析算法相比,发明充分利用了污染源的质谱特征和粒径分布规律,能够从时间、粒径和来源三个方面求解出污染源对环境颗粒物的高分辨贡献结果,便于应用单颗粒气溶胶质谱技术进行源解析技术的推广应用。附图说明:图1示出了一种应用单颗粒气溶胶质谱技术进行颗粒物精细化源解析的方法(pdlen)的流程图;图2为汽油车样品的特征质谱谱图(gv代表汽油车尾气);图3为柴油车样品的特征质谱谱图(dv代表汽油车尾气);图4为燃煤源样品的特征质谱谱图(pp代表燃煤源);图5为工业燃煤源样品的特征质谱谱图(ib代表工业燃煤源);图6为生物质燃烧样品的特征质谱谱图(bb代表生物质燃烧源);图7为扬尘样品的特征质谱谱图(dust代表扬尘源);图8为工业工艺样品的特征质谱谱图(ip代表工业工艺源);图9为汽油车分粒径段加权质谱成分谱;图10为柴油车分粒径段加权质谱成分谱;图11为燃煤源分粒径段加权质谱成分谱;图12为工业燃煤源分粒径段加权质谱成分谱;图13为生物质燃烧源分粒径段加权质谱成分谱;图14为扬尘源分粒径段加权质谱成分谱;图15为工艺过程源分粒径段加权质谱成分谱;图16为二次源加权质谱成分谱。图17为实施例1中pdlen模型计算得到的分粒径段平均源贡献;图18为实施例1中pdlen模型计算得到的分粒径段污染源贡献时间变化趋势;图19为实施例2中pdlen模型计算得到的分粒径段平均源贡献;图20为实施例2中pdlen模型计算得到的分粒径段污染源贡献时间变化趋势。具体实施方式实施例1本实施例利用2015年7月15日至8月15日采集的环境受体单颗粒数据和用单颗粒气溶胶质谱仪采集的污染源质谱数据,利用pdlen模型对环境受体的来源贡献进行解析,求解0.2~0.6μm、0.6~1.0μm和1.0~2.0μm粒径范围内的源贡献结果。使用pdlen模型四个结果诊断指标对结果的合理性进行评价。图1为技术路线图,具体步骤如下:1.构建污染源单颗粒质谱成分谱。(1)使用k-means聚类算法提取各污染源的特征质谱。使用单颗粒气溶胶质谱仪采集并分析多种污染源类(包括燃煤源、工业燃煤锅炉、扬尘源、生物质燃烧源、汽油车尾气排放、柴油车尾气排放和工艺过程)的样品,获得大量的质谱数据。并从环境受体中提取纯硫酸颗粒和纯硝酸颗粒的质谱谱图。污染源原始单颗粒质谱数据包括m/z-1~-250和1~250共500个荷质比信息,对其进行主要荷质比信息的筛选,筛选保留的主要荷质比包括:m/z-16,-17,-19,-24,-25,-26,-35,-36,-37,-43,-45,-46,-48,-49,-59,-60,-62,-63,-71,-72,-73,-76,-79,-80,-84,-88,-96,-97,-119,-136,-137,7,12,23,24,27,36,37,39,40,48,50,51,54,56,60,61,62,63,64,65,66,72,74,75,77,81,83,84,96,103,108,112,120,163,168,176,180,190,201,202,207,208,213,216,226和230。利用k-means聚类手段提取各污染的特征质谱{p1,p2……pn},这些特征质谱包含了该污染源的所有质谱信息,如图1-8所示。本研究认为即使是同一个污染源排放出来的不同颗粒物类别,由于它们的成分和粒径大小不同,从而导致其在大气中物化性质不同,因此对于受体的影响能力不同。为了评估和量化各污染源不同质谱特征对受体影响的相对关系,将这些类别作为中心用knn分类方法对环境受体按照对应粒径段进行分类,通过统计在各个粒径段归入某源类各特征的受体个数来量化彼此的影响权重。对每一个污染源,利用权重对该源类包含的所有特征质谱求加权平均值,从而构建该源类的分粒径加权质谱成分谱f,结果如图9-16所示。2.使用spams单颗粒气溶胶质谱仪在天津市南开区进行环境受体监测,监测时间为2015年7月15日至8月15日,获得环境受体的大量单颗粒质谱数据。对原始m/z-1~-250和1~250的环境受体质谱数据进行主要荷质比信息的筛选,筛选保留的主要荷质比信息包括m/z-16,-17,-19,-24,-25,-26,-35,-36,-37,-43,-45,-46,-48,-49,-59,-60,-62,-63,-71,-72,-73,-76,-79,-80,-84,-88,-96,-97,-119,-136,-137,7,12,23,24,27,36,37,39,40,48,50,51,54,56,60,61,62,63,64,65,66,72,74,75,77,81,83,84,96,103,108,112,120,163,168,176,180,190,201,202,207,208,213,216,226和230。将环境受体数据划分为三个粒径段:0.2~0.6μm、0.6~1.0μm和1.0-2.0μm,将时间分辨率设定为1小时,计算得到分粒径段的环境受体的小时平均质谱数据,将其命名为x。3.利用pdlen算法,将污染源质谱成分谱f和环境受体数据x输入到模型中,求解分粒径段的源解析结果。模型的输入参数α和β分别为0.25和0.08。分粒径段污染源平均贡献分担率如图17所示,分粒径段污染源贡献分担率的变化趋势如图18示。监测期间0.2~0.6μm粒径范围内各污染源平均源贡献由高到低排序为:柴油车(21%)>工业燃煤源(14%)>燃煤源(16%)>二次硝酸源(14%)>工艺过程源(11%)>二次硫酸源(9%)>生物质燃烧源(6%)>扬尘源(4%)>汽油车(2%)。监测期间0.6~1.0μm粒径范围内各污染源平均源贡献由高到低排序为:工艺过程源(23%)>柴油车(14%)>扬尘源(13%)>燃煤源(13%)>二次硝酸源(12%)>二次硫酸源(12%)>汽油车(5%)>生物质燃烧源(5%)>工业燃煤源(3%)。监测期间1.0~2.0μm粒径范围内各污染源平均源贡献由高到低排序为:工业燃煤源(25%)>工艺过程源(23%)>扬尘源(14%)>柴油车(12%)>燃煤源(10%)>二次硝酸源(8%)>二次硫酸源(6%)>汽油车(3%)>生物质燃烧源(2%)。4.评估源解析结果有效性。使用pdlen模型的四个评价指标对模型结果进行评估,结果如表1所示,其中rss小于5×10-4,说明模型的拟合效果好;stability小于0.04,表明短期内源贡献变化波动不剧烈;sparsity约等于6.2,说明对于每一个小时的受体样本,有6个污染源有贡献,这也符合我们的理想状况;non-negativity小于3×10-7,说明模型源解析结果中几乎没有负值贡献。表1.实施例1中pdlen模型诊断指标结果rssstabilitysparsitynon-negativity0.2~0.6μm4.24e-040.036.174.91e-080.6~1.0μm4.32e-040.036.162.77e-071.0~2.0μm5.47e-040.046.104.96e-07实施例2本实施例利用2017年6月10日~20日采集的环境受体单颗粒数据和使用单颗粒气溶胶质谱仪采集的污染源质谱数据,利用pdlen模型对环境受体的来源贡献进行解析,求解0.2~0.6μm、0.6~1.0μm和1.0~2.0μm粒径范围内的源贡献结果。使用pdlen模型四个结果评价指标对结果的合理性进行评价。图1为技术路线图,具体步骤如下:1.构建污染源单颗粒质谱成分谱。(1)使用k-means聚类算法提取各污染源的特征质谱。使用单颗粒气溶胶质谱仪采集并分析多种污染源类(包括燃煤源、工业燃煤锅炉、扬尘源、生物质燃烧源、汽油车尾气排放、柴油车尾气排放和工艺过程)的样品,获得大量的质谱数据。并从环境受体中提取纯硫酸颗粒和纯硝酸颗粒的质谱谱图。污染源原始单颗粒质谱数据包括m/z-1~-250和1~250共500个荷质比信息,对其进行主要荷质比信息的筛选,筛选保留的主要荷质比信息包括m/z-16,-17,-19,-24,-25,-26,-35,-36,-37,-43,-45,-46,-48,-49,-59,-60,-62,-63,-71,-72,-73,-76,-79,-80,-84,-88,-96,-97,-119,-136,-137,7,12,23,24,27,36,37,39,40,48,50,51,54,56,60,61,62,63,64,65,66,72,74,75,77,81,83,84,96,103,108,112,120,163,168,176,180,190,201,202,207,208,213,216,226和230。利用k-means聚类手段提取各污染的特征质谱{p1,p2……pn},这些特征质谱包含了该污染源的所有质谱信息,构建结果与实施例1相同。本研究认为即使是同一个污染源排放出来的不同颗粒物类别,由于它们的成分和粒径大小不同,从而导致其在大气中物化性质不同,因此对于受体的影响能力不同。为了评估和量化各污染源不同质谱特征对受体影响的相对关系,将这些类别作为中心用knn方法对环境受体按照对应粒径段进行分类,通过统计在各个粒径段归入某源类各特征的受体个数来量化彼此的影响权重。对每一个污染源,利用权重对该源类包含的所有特征质谱求加权平均值,从而构建该源类的分粒径加权质谱成分谱f,构建结果与实施例1相同。2.使用spams单颗粒气溶胶质谱仪在天津市南开区进行环境受体监测,监测时间为2017年6月10日至20日,获得环境受体的大量单颗粒质谱数据。对原始m/z-1~-250和1~250的环境受体质谱数据进行主要荷质比信息的筛选,筛选保留的主要荷质比信息包括m/z-16,-17,-19,-24,-25,-26,-35,-36,-37,-43,-45,-46,-48,-49,-59,-60,-62,-63,-71,-72,-73,-76,-79,-80,-84,-88,-96,-97,-119,-136,-137,7,12,23,24,27,36,37,39,40,48,50,51,54,56,60,61,62,63,64,65,66,72,74,75,77,81,83,84,96,103,108,112,120,163,168,176,180,190,201,202,207,208,213,216,226和230。将环境受体数据划分为三个粒径段:0.2~0.6μm、0.6~1.0μm和1.0-2.0μm,将时间分辨率设定为1小时,计算得到分粒径段的环境受体的小时平均质谱数据,将其命名为x。3.将污染源质谱成分谱矩阵f和环境受体数据x输入到pdlen模型中,求解分粒径段的源解析结果。模型的输入参数α和β分别为0.25和0.07。分粒径段污染源平均贡献分担率如图19所示,分粒径段污染源贡献分担率的变化趋势如图20所示。监测期间0.2~0.6μm粒径范围内各污染源平均源贡献由高到低排序为:二次硝酸源(31%)>土壤风沙尘(21%)>二次硫酸源(12%)>生物质燃烧(12%)>柴油车(8%)>工艺过程(8%)>汽油车(5%)>燃煤源(2%)>工业燃煤源(1%)。监测期间0.6~1.0μm粒径范围内各污染源平均源贡献由高到低排序为:土壤风沙尘(44%)>二次硝酸源(28%)>工艺过程(7%)>生物质燃烧(6%)>二次硫酸源(6%)>柴油车(3%)>汽油车(3%)>燃煤源(3%)>工业燃煤源(0%)。监测期间1.0~2.0μm粒径范围内各污染源平均源贡献由高到低排序为:土壤风沙尘(35%)>工业燃煤源(23%)>二次硝酸源(18%)>工艺过程(10%)>二次硫酸源(4%)>燃煤源(4%)>生物质燃烧(2%)>汽油车(3%)>柴油车(1%)。4.评估源解析结果有效性。使用pdlen模型的四个评价指标对模型结果进行评估,结果如表2所示,其中rss小于2×10-3,说明模型的拟合效果较好;在0.2~0.6μm和0.6~1.0μm粒径范围内的stability小于0.03,表明短期内源贡献变化波动不剧烈。而在1.0~2.0μm粒径范围stability小于0.16,表明短期内源贡献变化较为剧烈,这与该粒径范围内采集颗粒数较少有关;在0.2~0.6μm和0.6~1.0μm粒径范围内sparsity约等于4.39和5.88,说明对于每一个小时的受体样本,有4至5个污染源有贡献,这也符合我们的理想状况。而在1.0~2.0μm粒径范围sparsity等于3.46,这与该粒径范围内采集颗粒数较少有关;non-negativity小于1.23×10-4,说明模型源解析结果中几乎没有负值贡献。表2.实施例2中pdlen模型诊断指标结果rssstabilitysparsitynon-negativity0.2~0.6μm4.92e-040.025.881.15e-060.6~1.0μm6.59e-040.034.393.38e-061.0~2.0μm2.08e-030.163.461.23e-04当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1