一种结合污染扩散指数的城市空气质量预测方法与流程

文档序号:36325221发布日期:2023-12-09 11:37阅读:74来源:国知局
一种结合污染扩散指数的城市空气质量预测方法与流程

本发明涉及城市污染和空气质量预测,具体为一种结合污染扩散指数的城市空气质量预测方法。


背景技术:

1、最近几十年来,随着城市化进程的加速和工业化程度的提高,城市空气污染已经成为一个严重的全球性问题。城市化和工业化进程导致大量的污染物排放,例如:汽车尾气、工业排放、建筑施工和燃料燃烧等,城市空气污染的问题还受到气候条件的影响。例如,在气温升高、风速减弱的夏季,空气中的污染物更容易积聚和滞留,从而导致污染物的浓度增加。城市空气污染的影响因素非常复杂,需要综合考虑各种因素的影响,需要通过不断的科学研究和数据分析,预测城市空气质量的变化趋势,制定出针对性的空气污染控制和治理措施。

2、现有的应用在城市空气污染预测的算法模型虽能够取得一定的预测效果,但仍然存在一些缺点和挑战,例如:模型复杂度高,计算量大,增加了模型训练和调整的难度,也会限制模型在实际应用中的效率和可靠性。预测误差较大,预测精度受到天气、交通流量、污染物排放源等多种因素的干扰,难以实现预测水平的提升,提取数据内部关联特征能力单一,因此限制了预测模型在不同城市间的通用性和迁移性。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种结合污染扩散指数的城市空气质量预测方法,全面考虑城市区域内污染物扩散情况对空气质量的影响,有效提高城市空气质量预测的准确率和可靠性。

2、为达到上述目的,本发明提供如下技术方案:

3、一种结合污染扩散指数的城市空气质量预测方法,包括以下步骤:

4、s1:对城市区域内空气质量监测站和气象站的历史数据进行采集和分析,并进行数据预处理,建立时序关系的城市污染物浓度序列。

5、s2:城市区域网格化,依据气象数据和污染扩散模型计算各区域污染扩散指数,构建区域相互影响模型,全面评估污染物区域扩散的状况。

6、s3:构建基于cnn-lstm的空气污染物特征提取网络,并通过神经网络将各污染物时序特征、气象辅助特征和区域污染扩散指数进行融合,确定模型输入结构。

7、s4:构建城市空气质量预测模型并进行训练参数调优后,以空气污染物浓度、气象数据和污染扩散指数作为训练好的预测模型输入,获取城市污染物浓度预测结果。

8、进一步,所述步骤s1具体包括以下步骤:

9、对采集的原始数据进行预处理,包括缺失值填充和异常值剔除,在数据清洗过程中,提高数据的质量。

10、其中采用线性插值法对数据集中的缺失数据进行数值填充,补全数据集中的缺失值,计算公式为:

11、

12、式中,xi为缺失部分的值,xj为xi前面已知的值,xk为xi后面已知的值,i、j、k为大于或等于1的自然数。

13、计算各特征之间的皮尔逊相关系数,将与所要预测的特征不相关的其他特征剔除,减少数据冗余;

14、皮尔逊相关系数的计算公式为:

15、

16、式中,cov(x,y)是特征x和y之间的协方差,σx、σy分别为特征x和y的标准差。

17、最后采用最大最小归一化处理,归一化指定区间为0到1,消除特征之间的量纲影响,以解决数据指标之间的可比性。

18、所述最大最小归一化公式为:

19、

20、y=x*(mx-mi)+mi

21、式中,x为归一化后的中间值,x为原始值,xmin为原始数据的最小值,xmax为原始数据的最大值,y为最终结果,mx为指定区间的最大值,mi为指定区间的最小值。

22、进一步,所述步骤s2具体包括以下步骤:

23、根据空气污染扩散气象条件指数的定义和计算方式,提出污染扩散指数,利用气象数据和污染扩散模型来计算选定区域的污染扩散指数,表征当前气象背景下整个区域内污染物传输的状况。

24、将城市区域划分为网格,解析污染物扩散的微观机制。根据城市内空气质量监测站和气象站的地理位置和监测半径来对城市区域进行网格划分,得到城市空气质量网格化的污染分布图,可以精细化反映出城市不同重点区域污染物变化态势。

25、按照各气象因子分指数最大值和最小值的比值从小到大进行排序,剔除其中相关系数未通过显著性检验的自相关因子,确定各气象因子阈值,根据各因子在不同阈值范围内对空气污染扩散条件形成作用的大小分配权重,通过计算该区域内气象因子的大小和综合贡献度来得出所选区域的污染扩散指数。

26、各气象因子的权重等级划分见表1:

27、

28、

29、气象因子的优先级,数值越大,优先级越高,对污染扩散的贡献值越高。

30、对所有落在阈值范围内的气象因子和污染物浓度数值权重求和,得到城市各区域污染扩散指数(pollution diffusion index,pdi),其计算公式为:

31、

32、式中,wi为各气象因子的权重,pi为各气象因子的优先级,ηi为各气象因子的数值。

33、污染物扩散条件等级依据污染物扩散指数确定,分为三个等级,各等级划分和描述见表2:

34、

35、将得到的污染物扩散条件等级值利用one-hot编码量化为连续的特征分量。

36、依据上述城市区域的网格划分结果,得到整个城市网格的数量和区域范围,将各污染物时序特征、气象辅助特征和计算出的污染扩散指数匹配到每个区域网格中,生成城市污染物变化相关的历史序列。

37、构建区域相互影响模型(regional inter-continental transport model,简称rict)定量描述一个区域对另一个区域污染物浓度的整体影响,包括水平和垂直方向的输送,并通过对流、扩散和化学反应等过程的数学描述,计算出城市区域污染物传输和扩散状况。

38、设定以上风向和下风向形成的直线方向和位置相邻为污染扩散传输路径,随着距离的增大扩散影响越弱,设置扩散范围阈值,超过这一阈值将不会传输污染物。区域内某个网格污染物扩散范围及对应的污染物浓度贡献系数:

39、ξk=exp(aci*pdii)

40、式中,i表示选定污染物的类别,k的取值为{1,2,l,m},m是指当前污染扩散指数下该网格污染传输范围的尺度,表示网格内的第i种污染物对第k个网格区域中同类型污染物的贡献系数。

41、rict模型将城市看作一个区域,城市区域内的每个网格的污染物浓度由两部分组成:一部分是自身网格内污染源所产生浓度;另一部分是城市内其他区域网格所贡献的污染物浓度。

42、每个网格中的污染物浓度可以用以下公式来计算:

43、

44、式中,cmi(t)是选定区域第i种污染物浓度,pmi(t)是网格区域中第i种污染物的原始区域浓度,pmi,k(t)是污染传输的第k个作用网格。

45、利用某个网格的气象指数和污染扩散指数的相互组合计算出该网格对其他网格区域内污染物的贡献度,组成每个网格的扩散范围数值矩阵,最终计算出城市所有网格区域各项污染物对应的扩散指数等级。

46、进一步,所述步骤s3具体包括以下步骤:

47、基于cnn-lstm混合网络提取空气污染物特征及气象因子,特征提取网络以cnn网络作为底层,以基于多层lstm的网络作为顶层,cnn层用于提取序列中的局部特征,而lstm层用于学习序列中的长期依赖关系。

48、将空气污染物浓度数据和气象数据转化为cnn网络可接收的具有时间序列的二维矩阵,并输入到cnn网络中提取空间特征,作为lstm网络的输入;

49、其中cnn模型用于提取污染物和气象因子数据的逐小时时间特征。卷积层的卷积核进行特征提取操作,通过激活函数对卷积的结果进行非线性变换而得到输出的特征图。

50、卷积操作过程为:

51、

52、式中,yl为经过l层卷积操作后的输出,σ()激活函数,为是第l层第m部分卷积区域的输入,为第l层第m部分的权重,为卷积运算,为第l层的偏置项。

53、卷积之后,输出特征图作为池化层的输入,进行最大池化(maxpoling)操作,池化过滤器按设定步幅进行移动扫描,选择最大值输出到下一层,最大池化操作过程为:

54、

55、式中,为第l层第m个数组区域中第p个数的池化结果,poolingk()为池化函数。

56、多维特征数据池化后进行reshape操作,将矩阵转化为一维向量,作为lstm层的输入,lstm层提取城市空气污染物浓度和气象数据的时序特征,实现对历史污染物的浓度和气象数据的编码,生成隐藏向量c的表达式为:

57、yt=fl(xt,yt-1)

58、c=φ({h1l ht})

59、式中,xt为t时刻的输入值,yt-1、yt分别为lstm层在t-1和t时刻的输出,fl表示lstm层函数,φ为隐藏状态计算函数,隐藏向量c具体为lstm层中的最后时刻单元的输出状态。

60、利用矩阵拼接将城市区域网格内的污染物浓度,气象因子和污染扩散指数等时序特征进行融合,作为模型的输入,确定预测模型输入矩阵的阶数。

61、进一步,所述步骤s4具体包括以下步骤:

62、城市污染物浓度预测模型训练参数调优及预测的具体步骤如下:

63、训练所构建的基于cnn-lstm的空气污染物预测网络,并用训练好的模型预测未来空气污染物浓度值。采用解码器结合隐藏向量c和当前t时刻的输入数据预测下一时刻的污染物浓度,则有:

64、yt,st=fl(yt-1,st-1,c)

65、pt=wht+b

66、其中,st-1、st分别表示lstm层t-1和t时刻的记忆单元,pt为t时刻污染物浓度的预测输出值,w表示网络参数,b表示偏置量。

67、初始化预测模型结构,确定网络卷积核数量、初始权重、时间窗口、激活函数、隐藏层层数和迭代次数;

68、使用预测集来测试模型的预测精度,以均方根误差(rmse)为评价指标,得到模型的预测精度及误差评价指标;

69、与现有技术相比,本发明具有以下优点:

70、一、引入空气污染扩散指数作为预测模型的新特征,分析城市空气污染过程及总体趋势,充分考虑了不同气象条件对污染物扩散的影响,更好地描述城市污染物浓度的时空变化规律,有效提高空气污染物预测模型的精度。

71、二、利用特征选择和提取等方法实现多模态信息的融合,构建多源异构的数据集。对气象因子不同类别分配权重系数,合理计算出区域的污染扩散指数,根据特征重要性排序结果实现多个特征的融合,降低了模型的过拟合问题,精细化处理不同维度特征,并且能够一定程度避免因步长过长造成的记忆丢失和梯度弥散。

72、三、精细划分城市区域网格,挖掘城市内多站点间空气污染物和气象数据的时空关联性,准确反映城市各区域的污染特征和污染传输状况,解决传统模型的特征匹配损失大以及特征相关性不强等问题。即通过城市空气污染气象条件类型确定区域内污染梯度扩散方向及对应的扩散能力等级,表述整个城市区域污染物变化规律,能够从空气污染扩散气象条件的角度去进一步提升预测模型的精确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1