一种大气颗粒物质量浓度的拟合方法

文档序号:10512535阅读:777来源:国知局
一种大气颗粒物质量浓度的拟合方法
【专利摘要】本发明公开了一种大气颗粒物质量浓度的拟合方法,首先获取气象条件参数、反应大气物化特性的关键化学组分参数与大气颗粒物质量浓度的原始数据参数,并以日为时间尺度,构成各个参数的原始值时间序列;利用所得到的原始值时间序列,逐日前后依次取差值,变换得到各个原始参数的逐日绝对变化量数据时间序列,并进行归一化处理;然后构建BP神经网络,枚举隐层神经元个数,对变换得到的各个原始参数的逐日绝对变化量数据时间序列进行训练,并确定最优的拓扑结构;利用所得到的最优拓扑结构,对大气颗粒物的质量浓度进行数据拟合,以及趋势预测分析。上述方法能够减小常规拟合方法的误差,更好地模拟气象条件和大气关键化学组分与大气颗粒物质量浓度之间的复杂非线性映射关系。
【专利说明】
_种大气)颗粒物质量浓度的拟合方法
技术领域
[0001] 本发明涉及环境监测技术领域,尤其涉及一种大气颗粒物质量浓度的拟合方法。
【背景技术】
[0002] 近年来,粗放型的经济产业结构、以煤为主的能源生产和消费结构,以及快速的城 市化进程,导致中国大气环境污染问题日益凸显。其中,以高浓度大气可吸入颗粒物(PM 10)/ 细颗粒物(PM2.5)和低大气能见度为典型特征的城市和区域大气复合污染及其对公众健康 的影响得到国际社会的高度关注。PM 2.5和PM1Q分别是指大气中空气动力学直径小于2.5微米 和10微米的颗粒物,通常根据被人体呼吸能深入到的呼吸系统位置分别被称为可入肺颗粒 物和可吸入颗粒物。PM2.5和PM 1Q组成中均可划分为由各类排放源直接排放的一次颗粒物部 分和由于各类气态前体物(二氧化硫、氮氧化物、挥发性有机物、氨等)在大气中通过大气物 理化学反应生成的二次颗粒物部分,其在大气中的质量浓度水平高低还取决于风速、风向、 温度、湿度、降水量、气压等气象条件对其在大气中的扩散稀释影响。可见,由于大气颗粒物 的成分复杂、来源广泛,以及各类气态前体物参与大气物理化学过程的非线性和复杂性,导 致目前对其形成机理和迀移转化过程、及其在大气中的扩散行为等的认识尚未完全透彻和 明晰。同时,由于PM 2.5和PM1Q的粒径区间范围不同,一次排放来源和二次生成过程及其构成 比例存在差异,导致大气PM 2.5和PM1Q的物理化学性质也不尽相同。在这种情况下,利用各种 数学模型和统计分析方法,结合对其一次排放和二次生成机理的认识,对大气颗粒物质量 浓度的时间序列进行统计分析,成为了一种能够快速、且可较为准确地掌握其质量浓度变 化规律及影响因素的重要方法和手段。
[0003] 但在现有技术中,对大气颗粒物PM2.5和PM1Q质量浓度进行统计分析时,大部分研究 侧重直接考察PM 2.5和PM1Q质量浓度的原始值与各种气象条件参数的原始值之间的关系,即 利用气象条件参数的原始值作自变量,颗粒物的质量浓度作因变量,但这些研究默认了在 时间尺度上,颗粒物前后之间互不影响,单纯地考虑由气象条件决定的扩散稀释过程,而忽 略了颗粒物在大气中的积累、沉降,以及排放到大气中的各种气态前体物(二氧化硫、氮氧 化物、挥发性有机物、氨等)在大气氧化性(臭氧等)作用下通过复杂的大气物理化学过程生 成二次颗粒物的影响,因此并不能全面地反映大气颗粒物在大气中的所有扩散稀释和生消 反应过程,使得这类利用原始值进行直接数据拟合的效果并不理想。

【发明内容】

[0004] 本发明的目的是提供一种大气颗粒物质量浓度的拟合方法,该方法能够更科学和 全面地反映和覆盖大气颗粒物从进入大气开始的所有产生、迀移输送、转化和干湿沉降等 过程,减小常规拟合方法的误差,更好地模拟气象条件和大气关键化学组分与大气颗粒物 质量浓度之间的复杂非线性映射关系。
[0005] -种大气颗粒物质量浓度的拟合方法,所述方法包括:
[0006] 首先获取气象条件参数、反应大气物化特性的关键化学组分参数与大气颗粒物质 量浓度的原始数据参数,并以日为时间尺度,构成各个参数的原始值时间序列;
[0007] 利用所得到的原始值时间序列,逐日前后依次取差值,变换得到各个原始参数的 逐日绝对变化量数据时间序列,并进行归一化处理;
[0008] 然后构建BP神经网络,枚举隐层神经元个数,对变换得到的各个原始参数的逐日 绝对变化量数据时间序列进行训练,并确定最优的拓扑结构;
[0009] 利用所得到的最优拓扑结构,对大气颗粒物的质量浓度进行数据拟合,以及趋势 预测分析。
[0010] 所述气象条件参数包括以下一种或多种:日平均气温,最高气温,最低气温,平均 湿度,最大湿度,最小湿度,海平面气压,日降雨量,日平均风速和最大风速;
[0011] 所述反应大气物化特性的关键化学组分参数包括以下一种或多种:s〇2、n〇2、co和 〇3的日均质量浓度;
[0012] 所述大气颗粒物质量浓度的原始数据参数包括以下一种或两种:PM2.5和PM1Q的日 均质量浓度。
[0013] 所述各个原始参数的逐日绝对变化量数据时间序列通过依次对各原始参数变量 取逐日差值得到,具体计算公式为:
[0014] Δ xi(t) =Xi(t)-Xi(t_l)
[0015] 其中,Xl⑴和Xl(t-1)分别代表当前日和前一日的各个输入向量或输出向量的原 始参数值,Xi代表所涉及到的各个参数。
[0016] 在所构建的BP神经网络中,以反映气象条件参数与关键化学组分各个参数的逐日 绝对变化量数据时间序列作为输入向量,具体的输入向量表示为:
[0018]并以大气颗粒物质量浓度的原始数据对应的逐日绝对变化量数据时间序列作为 输出向量,具体的输出向量表不为:
[0020]其中,Ax(t)为各参数变量(X)当前日与前一日的逐日差值;f?为日平均温度; Tmax( t)为日最高温度;Tmin( t)为日最低温度;/7(〇为日平均湿度;Hmax( t)为日最大湿度;Hmin ⑴为日最小湿度;P(t)为日降水量;B(t)为日均气压;印)为日平均风速;Vmax⑴为日最高 风速;瓦W/.K冗冗⑴、Δ0?)(〇和G(/)分别为二氧化硫、二氧化氮、一氧化碳和臭氧的日 平均质量浓度;兩和分别表示当日和前一日的大气颗粒物PM 1Q或PM2.5 日平均质量浓度。
[0021]所述BP神经网络在输入前会对输入输出向量的各参数进行归一化操作,去除各参 数绝对值变化量序列的量纲影响,具体的归一化公式表示为:
[0023] 其中,AxiUV为各参数归一化后时间序列中对应的逐日绝对变化量数值;Δχ (t)为各参数逐日变化量时间序列原始值;△ X(t )max为各参数逐日变化量时间序列中的最 大值;△ X( t )min为各参数逐日变化量时间序列中的最小值。
[0024] 所述确定最优的拓扑结构的过程具体包括:
[0025] 在枚举隐层神经元个数时,将样本归一化后的时间序列输入所构建的BP神经网 络;
[0026] 以拟合的残差平方和代表拟合效果,比较不同隐层神经元个数情况下的拟合效 果,选择最小残差平方和所对应的拓扑结构为最优的拓扑结构。
[0027] 由上述本发明提供的技术方案可以看出,上述方法能够更科学和全面地反映和覆 盖大气颗粒物从进入大气开始的所有产生、迀移输送、转化和干湿沉降等过程,减小常规拟 合方法的误差,更好地模拟气象条件和大气关键化学组分与大气颗粒物质量浓度之间的复 杂非线性映射关系。
【附图说明】
[0028] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 附图。
[0029] 图1为本发明实施例所提供的大气颗粒物质量浓度的拟合方法流程示意图;
[0030] 图2为本发明所举实例中输入向量扩展前后PM2.5日均质量浓度拟合效果比较示意 图;
[0031] 图3为本发明所举实例中输入向量扩展前后PM10日均质量浓度拟合效果比较示意 图;
[0032]图4为本发明所举实例中PM2.5日均质量浓度趋势预测的结果示意图;
[0033]图5为本发明所举实例中PM1()日均质量浓度趋势预测的结果示意图。
【具体实施方式】
[0034] 下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本 发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本发明的保护范围。
[0035] 本发明实施例所述方法从统计分析的角度出发,利用参数的逐日绝对变化量数据 时间序列建立气象条件和大气关键化学组分与大气颗粒物质量浓度之间的映射关系,从而 能够更全面地模拟并揭示气象条件和反映大气物理化学性质的关键化学组分与大气颗粒 物质量浓度之间的复杂非线性关系。下面将结合附图对本发明实施例作进一步地详细描 述,如图1所示为本发明实施例所提供的大气颗粒物质量浓度的拟合方法流程示意图,所述 方法包括:
[0036] 步骤11:首先获取气象条件参数、反应大气物化特性的关键化学组分参数与大气 颗粒物质量浓度的原始数据参数,并以日为时间尺度,构成各个参数的原始值时间序列;
[0037] 在该步骤中,所述气象条件参数包括以下一种或多种:日平均气温,最高气温,最 低气温,平均湿度,最大湿度,最小湿度,海平面气压,日降雨量,日平均风速和最大风速; [0038]所述反应大气物化特性的关键化学组分参数包括以下一种或多种:S0 2、N02、C0和 〇3的日均质量浓度;其中,s〇2、n〇2和C0浓度表征大气中通过二次反应生成二次气溶胶颗粒 物的潜力值,〇3浓度则用于反映和表征大气氧化性,从而在一定程度上从大气物理化学机 理方面更好地反映和描述了大气二次颗粒物生成潜力的强度;
[0039] 所述大气颗粒物质量浓度的原始数据参数包括以下一种或两种:PM2.5和PM1Q的日 均质量浓度。
[0040] 步骤12:利用所得到的原始值时间序列,逐日前后依次取差值,变换得到各个原始 参数的逐日绝对变化量数据时间序列,并进行归一化处理;
[0041] 在该步骤中,具体操作是以每日的各个原始参数数据减去前一日的原始参数数 据,获得各个原始参数变量的逐日数据差值,进而得到各个原始参数的逐日绝对变化量数 据时间序列,具体计算公式为:
[0042] Δ xi(t) =Xi(t)-Xi(t_l)
[0043] 其中,11(〇和11(卜1)分别代表当前日和前一日的各个输入向量或输出向量的原 始参数值,Xi代表所涉及到的各个参数。
[0044] 步骤13:然后构建BP神经网络,枚举隐层神经元个数,对变换得到的各个原始参数 的逐日绝对变化量数据时间序列进行训练,并确定最优的拓扑结构;
[0045] 在该步骤中,在所构建的BP神经网络中,以反映气象条件参数与关键化学组分各 个参数的逐日绝对变化量数据时间序列作为输入向量,具体的输入向量表示为:
[0047]并以大气颗粒物质量浓度的原始数据对应的逐日绝对变化量数据时间序列作为 输出向量,具体的输出向量表不为:
[0049]其中,Ax(t)为各参数变量(X)当前日与前一日的逐日差值;f(i)为日平均温度; Tmax( t)为日最高温度;Tmin(t)为日最低温度;哀(?)为日平均湿度;Hmax(t)为日最大湿度;H min ⑴为日最小湿度;P(t)为日降水量;B(t)为日均气压;「(〇为日平均风速;Vmax⑴为日最高 风速;奶:⑴、、Δ(Χ>(〇和G(/)_分别为二氧化硫(S〇2)、二氧化氮(N〇2)、一氧化碳 (〇0)和臭氧(〇3)的日平均质量浓度;/ >#1〇<^2..5的_和.户财1.0。《.5(|-1)分别表不当日和前一日的大 气颗粒物PM 1Q或PM2.5日平均质量浓度。所有参数均取步骤12中得到的逐日绝对变化量数据 序列。
[0050]另外,所述BP神经网络在输入前会对输入输出向量的各参数进行归一化操作,去 除各参数绝对值变化量序列的量纲影响,具体的归一化公式表示为:
[0052]其中,AxiUV为各参数归一化后时间序列中对应的逐日绝对变化量数值;Δχ (t)为各参数逐日变化量时间序列原始值;△ X(t)max为各参数逐日变化量时间序列中的最 大值;△ X( t )min为各参数逐日变化量时间序列中的最小值。
[0053] 通过上述归一化操作可以统一和缩小各个参数的数据分布范围,以便提高拟合精 度和收敛速度。
[0054] 进一步的,上述确定最优的拓扑结构的过程具体包括:
[0055]在枚举隐层神经元个数时,将样本输入所构建的BP神经网络;
[0056] 以拟合的残差平方和代表拟合效果,比较不同隐层神经元个数情况下的拟合效 果,选择最小残差平方和所对应的拓扑结构为最优的拓扑结构。
[0057] 具体实现中,首先确定神经网络的激励函数和训练函数,将归一化后样本数据时 间序列输入神经网络,由MATLAB神经网络工具箱将样本随机分为训练样本与验证样本。其 中,训练样本通过激励函数处理与神经元之间的传递后,得到拟合误差,误差前向传递,训 练函数不断调整神经元之间的权重,逐渐改进和提升拟合效果,验证样本用于在学习过程 中的检验,以避免过拟合现象的发生。每次神经元之间的权重调整后,验证样本检验误差是 否下降,当连续一定次数权重调整后,若误差没有进一步下降,则退出学习过程,学习完成。
[0058] 然后就可以利用上述寻找到的最优拓扑结构构建网络并进行训练,得到最终的拟 合网络。
[0059] 步骤14:利用所得到的最优拓扑结构,对大气颗粒物的质量浓度进行数据拟合,以 及趋势预测分析。
[0060] 在该步骤中,进行数据拟合或趋势预测时,BP神经网络的输入输出向量与上述步 骤13中所描述的输入输出向量一致。
[0061] 下面以具体的实例对上述拟合方法的过程进行详细说明,以北京市为例,对北京 市2014年8月至2015年7月的大气颗粒物浓度进行统计分析。
[0062]首先,获取2014年8月1日至2015年7月31日的日气象条件参数、大气关键化学组分 参数和大气颗粒物质量浓度参数的原始值时间序列。
[0063]然后再利用各个参数变量的原始值时间序列生成逐日绝对变化量时间序列,并进 一步将该逐日绝对变化量时间序列进行线性归一化,使得各个参数的数据范围区间通过归 一化处理缩小为[-1,1];
[0064] 再设置三层BP神经网络,网络的激励函数为tansig函数,训练函数为traingd函 数;枚举隐层神经元个数,以拟合的残差平方和作为拟合优劣的评判指标;
[0065] 将归一化后的逐日绝对变化量时间序列输入BP神经网络中进行训练,寻找BP神经 网络的最优拓扑结构,具体Mat lab函数如下:
[0067]根据上述枚举,发现对PM2.5来说,最优的隐层神经元个数为14,而对ΡΜιο来说,最优 的隐层神经元个数是21。
[0068]与传统的气象条件原始值对应大气颗粒物浓度原始值的拟合方法进行对比,如图 2所示为本实例中输入向量扩展前后PM2.5日均质量浓度拟合效果比较示意图,如图3所示为 本实例中输入向量扩展前后PM 1Q日均质量浓度拟合效果比较示意图,由图2和3可知:通过扩 展输入变量,在输入参数变量中引入和增加了包括反映大气物化性质的关键化学组分参数 和反映前期颗粒物污染水平和积累的前一日颗粒质量浓度变量,并利用输入参数变量和输 出参数变量的归一化的逐日绝对变化量数据时间序列建立一种新型的复杂非线性映射关 系,较直接采用气象条件和大气PM 2.5/PM1Q颗粒物浓度原始数据时间序列的传统映射方法可 以获得更好的数据拟合效果,并可从大气PM 2.5/PM1Q颗粒物的一次直接排放、前期积累和大 气中二次颗粒物的生消机理等方面更好地解释输入变量和输出变量之间的复杂非线性关 系,显示出本方法的创新性、优越性和科学性。
[0069]进一步,再利用北京市2015年1月至7月的数据,以得出的最优拓扑结构的BP神经 网络进行训练,并对2015年8月的PM2.5和PM1Q日均质量浓度分别进行短期趋势预测实验,如 图4所示为本实例中PM2.5日均质量浓度趋势预测的结果示意图,如图5所示为本实例中ΡΜιο 日均质量浓度趋势预测的结果示意图,由图4和5可知:用本方法构建的新型映射关系对未 来北京市大气PM2. 5与PM1Q质量浓度进行趋势预测,预测趋势正确,未来三天内的误差较小, 具有较高的预测准确度和可信度,三天后由于蝴蝶效应的影响,误差不断积累,预测的偏差 逐渐增大。就实际应用而言,本方法对预测未来3-5天以内的短期大气颗粒物质量浓度变化 发展趋势具有应用价值。
[0070] 综上所述,与现有方法相比,本发明实施例所提供的方法优点在于:
[0071] 1)本方法突破了以往直接利用气象条件原始值和大气PM2.5或PM 1Q颗粒物质量浓度 原始值建立二者之间映射关系的非线性统计回归分析方法。在常规气象条件作为输入变量 的基础上,通过在输入变量中增加引入反映二次颗粒物生成潜力的气态前体物参数(二氧 化硫、二氧化氮、一氧化碳)、反映大气氧化性的大气关键化学组分参数(臭氧),以及反映前 一日大气中累积的大气颗粒物PM 1Q或PM2.5日平均质量浓度等一系列新的输入参数变量,对 各个参数的逐日绝对变化量进行线性归一化,并利用BP神经网络拟合输入与输出参数变量 之间的复杂非线性关系,从而构建发明了一种关于气象条件、大气关键化学组分与大气颗 粒物质量浓度之间复杂非线性的新型映射关系。
[0072] 2)本方法对现有各个参数的逐日原始数据时间序列的利用更加充分,充分挖掘了 不同参数的原始数据时间序列中所蕴含的内涵信息,从而使得利用输入和输出参数变量的 逐日绝对变化量建立的映射关系得到了更优的拟合效果,更加贴近事实情况和科学全面地 反映大气中颗粒物的一次直接排放、二次颗粒物生成、前期积累和大气干湿沉降等颗粒物 的生消及迀移转化过程。
[0073] 以上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范 围为准。
【主权项】
1. 一种大气颗粒物质量浓度的拟合方法,其特征在于,所述方法包括: 首先获取气象条件参数、反应大气物化特性的关键化学组分参数与大气颗粒物质量浓 度的原始数据参数,并以日为时间尺度,构成各个参数的原始值时间序列; 利用所得到的原始值时间序列,逐日前后依次取差值,变换得到各个原始参数的逐日 绝对变化量数据时间序列,并进行归一化处理; 然后构建BP神经网络,枚举隐层神经元个数,对变换得到的各个原始参数的逐日绝对 变化量数据时间序列进行训练,并确定最优的拓扑结构; 利用所得到的最优拓扑结构,对大气颗粒物的质量浓度进行数据拟合,以及趋势预测 分析。2. 根据权利要求1所述大气颗粒物质量浓度的拟合方法,其特征在于, 所述气象条件参数包括以下一种或多种:日平均气温,最高气温,最低气温,平均湿度, 最大湿度,最小湿度,海平面气压,日降雨量,日平均风速和最大风速; 所述反应大气物化特性的关键化学组分参数包括以下一种或多种:s〇2、n〇2、co和0 3的 日均质量浓度; 所述大气颗粒物质量浓度的原始数据参数包括以下一种或两种:PM2.5和PM1Q的日均质 量浓度。3. 根据权利要求1所述大气颗粒物质量浓度的拟合方法,其特征在于, 所述各个原始参数的逐日绝对变化量数据时间序列通过依次对各原始参数变量取逐 日差值得到,具体计算公式为: A xi(t) = xi(t)-xi(t-l) 其中,^(〇和^(卜1)分别代表当前日和前一日的各个输入向量或输出向量的原始参 数值,Xl代表所涉及到的各个参数。4. 根据权利要求1所述大气颗粒物质量浓度的拟合方法,其特征在于, 在所构建的BP神经网络中,以反映气象条件参数与关键化学组分各个参数的逐日绝对 变化量数据时间序列作为输入向量,具体的输入向量表示为:并以大气颗粒物质量浓度的原始数据对应的逐日绝对变化量数据时间序列作为输出 向量,具体的输出向量表示为:其中,Ax(t)为各参数变量(X)当前日与前一日的逐日差值;Π?)为日平均温度;Tmax(t) 为日最高温度;Tmin(t)为日最低温度;吞的为日平均湿度;Hmax(t)为日最大湿度;H min(t)为 日最小湿度;P⑴为日降水量;B⑴为日均气压;「⑴为日平均风速;Vmax⑴为日最高风速; 免劝、%(/_)、Δ而(/)和0,(/)分别为二氧化硫、二氧化氮、一氧化碳和臭氧的日平均质 量浓度;两冗咏咖仍和卜1)分别表示当日和前一日的大气颗粒物ΡΜιο或PM2.5日平均 质量浓度。5. 根据权利要求1所述大气颗粒物质量浓度的拟合方法,其特征在于, 所述BP神经网络在输入前会对输入输出向量的各参数进行归一化操作,去除各参数绝 对值变化量序列的量纲影响,具体的咁一化公忒弄示为,其中,AxiUV为各参数归一化后时间序列中对应的逐日绝对变化量数值;Ax(t)为各 参数逐日变化量时间序列原始值;A x(t)max为各参数逐日变化量时间序列中的最大值;Δχ (t)min为各参数逐日变化量时间序列中的最小值。6. 根据权利要求1所述大气颗粒物质量浓度的拟合方法,其特征在于,所述确定最优的 拓扑结构的过程具体包括: 在枚举隐层神经元个数时,将样本输入所构建的BP神经网络; 以拟合的残差平方和代表拟合效果,比较不同隐层神经元个数情况下的拟合效果,选 择最小残差平方和所对应的拓扑结构为最优的拓扑结构。
【文档编号】G06N3/02GK105868559SQ201610189221
【公开日】2016年8月17日
【申请日】2016年3月29日
【发明人】田贺忠, 段事恒, 王堃, 朱传勇, 王勇
【申请人】北京师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1