一种基于空间特征的细粒度空气污染物浓度区域估计方法

文档序号:6626219阅读:458来源:国知局
一种基于空间特征的细粒度空气污染物浓度区域估计方法
【专利摘要】本发明涉及空气污染物的细粒度区域估计,尤其涉及一种基于空间特征的细粒度空气污染物浓度区域估计方法,包括预处理阶段、预测阶段、估计阶段;预处理阶段进行网格划分得到训练样本,预测阶段采用距离度量学习方法学习马氏距离函数来寻找区域最近的k个区域,再对这k个区域形成的特征向量进行多元线性回归训练,估计阶段利用训练得到的多元线性回归模型对区域的空气污染物浓度进行估计。本发明的有益效果在于:本发明可用来对无空气质量监测站点的某个小区域的空气污染物浓度进行估计,充分利用邻近的空气质量监测站点,引入k个邻近区域,可以更好地捕捉空气污染物浓度在空间上的细粒度变化,更准确地估计出当前区域的污染物浓度。
【专利说明】一种基于空间特征的细粒度空气污染物浓度区域估计方法

【技术领域】
[0001]本发明涉及空气污染物的细粒度区域估计,尤其涉及一种基于空间特征的细粒度空气污染物浓度区域估计方法。

【背景技术】
[0002]近年来空气污染越来越严重,多个城市经常出现雾霾天气,催生着人们生态环保意识的加强,空气污染越来越受到大家的关注。为了对空气的污染物质进行监测,政府在城市建立了若干空气质量监测点,是空气质量控制和对空气质量进行合理评估的基础平台,是一个城市空气环境保护的基础设施。但是,建立一个空气质量监测站需要一定建设资金、占地面积、人力等,因此每个城市所拥有的空气监测站都是有限的。而同一城市中的不同地点的空气污染物浓度可能相差很大,人们在外出活动前,如骑行,无法确切知道经过路段所在区域的空气状况,如果空气质量太差,人们可以选择另一个空气较好的区域进行户外运动。
[0003]传统的空气质量区域估计方法一般仅考虑物理空间上的距离,然后进行空间线性插值,比如Kriging方法。然而,因为空气污染物的浓度是由多个因素共同影响的,例如天气现象、交通、土地使用等,所以空气污染物的浓度随着空间位置上的变化是呈非线性变化的,不能简单的用线性插值法进行估计。有一些非线性的估计方法很好的利用了大气压、湿度、交通等特征,但是其估计的是空气质量的等级,而不是空气污染物浓度的数值。此类方法存在一个弊端,假设空气质量等级分为A、B、C、D、E、F六个等级,浓度值1-50属于等级A,浓度值51-100属于等级B。当某个区域的真实浓度值为52 (空气质量等级为B)时,若一种空气质量等级估计的方法估计该区域的空气质量等级为A,则判定这个估计结果不准,因为实际的空气质量等级为B。但是若采用估计浓度值的方法,可能估计出该区域的空气污染物浓度为48,虽然换算成空气质量等级也是A,但是其与真实值52仅仅相差4,可判定这个估计结果是准确的。由上可见,采用估计浓度值的方法更为合理。


【发明内容】

[0004]本发明为克服上述的不足之处,目的在于提供一种基于空间特征的细粒度空气污染物浓度区域估计方法,该方法估计结果准确性高,能根据带空气监测点的区域和无空气监测点的区域在空间上的各种区别估计出后者的空气污染物浓度,解决现有问题。
[0005]本发明是通过以下技术方案达到上述目的:一种基于空间特征的细粒度空气污染物浓度区域估计方法,包括预处理阶段、训练阶段、估计阶段;
[0006]预处理阶段包括:
[0007]I)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同;
[0008]2)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空气污染物浓度和空间特征,每个小时可以生成m个训练样本;若历史数据跨越η个小时,则可以得到nXm个训练样本;
[0009]训练阶段:
[0010]l)k近邻网格查找:学习两个训练样本之间的马氏距离函数,通过马氏距离函数查找得到每个训练样本最近的k个样本;
[0011]2)多元线性回归模型训练:根据每个样本及其k个最近的邻居样本生成向量,nXm个训练样本生成nXm个向量;对生成的nXm个向量进行多元线性回归,输出拟合的多元线性回归模型;
[0012]估计阶段:
[0013]I)输入待估计空气质量的位置的经纬度信息,并根据经纬度信息获取所属的网格g,抽取网格g的空间特征Fg ;抽取网格g所在城市的所有空气质量监测站点所属网格的空间特征,得到特征向量Fe ;
[0014]2)利用马氏距离函数从Fe中查找到与Fg相近的k个最近的特征向量,k个最近的特征向量对应k个网格,由k个网格得到网格集合G ;
[0015]3)网格g和网格集合G生成一个向量;
[0016]4)根据训练阶段输出的多元线性回归模型对上一步得到的向量进行线性回归计算,计算结果为估计的空气质量值。
[0017]作为优选,所述的空间特征包括:交通相关特征Ft、路网结构相关特征FpPOI相关特征Fp、签到特征F。。
[0018]作为优选,所述训练阶段的k近邻网格查找步骤中,采用距离度量学习方法和空气污染物浓度值的相似性标准计算两个训练样本之间的马氏距离函数,计算公式如下:
[0019]dA (Xi, Xj) = (X1-Xj)1A(X1-Xj);
[0020]其中,dA(Xi,Xj)表示两个样本X1、Xj之间的距离,A为半正定矩阵。
[0021]作为优选,设置两个空气污染物浓度值的相似性标准。
[0022]本发明的有益效果在于:1)引入路网结构、Ρ0Ι、交通等空间相关特征,可以更好的捕捉空气污染物浓度在空间上的细粒度变化;(2)采用距离度量学习方法确定距离函数,而不是传统的欧氏距离,可以更准确的度量两个区域之间的距离;(3)充分利用邻近的空气质量监测站点,引入k个邻近区域,而不是一个区域,可以更准确的估计出当前区域的污染物浓度。

【专利附图】

【附图说明】
[0023]图1是本发明的方法步骤流程图;
[0024]图2是本发明实施例a城市的网格划分示意图;
[0025]图3是本发明的训练阶段步骤流程图;
[0026]图4是本发明的估计阶段步骤流程图。

【具体实施方式】
[0027]下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
[0028]实施例1:如图1所示,一种基于空间特征的细粒度空气污染物浓度区域估计方法,包括预处理阶段、训练阶段、估计阶段。
[0029]预处理阶段的主要步骤包括:
[0030]I)把城市a划分成不相交的网格,每个网格g = g.wXg.h具有相同的长g.w和宽g.h,用g。表示网格g的中心点。用ga(w,h)表示将a划分成不相交的长为w宽为h的网格集合,则匕=属于同一 g的空气污染物浓度视为一样。
令g.A表示g的影响区域,则g.A = (g.wX 3) X (g.hX3),g.A。= g。,由g及其周围的八个网格组成。如图2所示,每个小正方形是一个网格,小正方形阴影的网格的影响区域为大黑框正方形区域;
[0031]2)找到含有空气监测站点的网格并抽取这些网格对应的每小时的空气污染物浓度和空间特征,包括交通相关特征Ft、P0I相关特征Fp、路网结构相关特征Fp签到特征F。。
[0032]交通相关特征Ft:
[0033]a)该网格g的影响区域包含的所有路段g.R = Ir I r e g.A}过去I小时的平均车速。首先根据公式(I)计算每条路r e g.R过去I小时的平均车速E (r.v),其中,Iri表示g.R集合的第i个元素,即g.A区域内第i条道路;L表示I小时内,每条道路可获得L个不同时刻的车速值;接着根据公式(2)计算g.A所有路段g.R在过去I小时的平均车速,其中
*|表示*集合中元素的个数。

【权利要求】
1.一种基于空间特征的细粒度空气污染物浓度区域估计方法,其特征在于,包括预处理阶段、训练阶段、估计阶段; 预处理阶段包括: 1)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同; 2)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空气污染物浓度和空间特征,每个小时可以生成m个训练样本;若历史数据跨越η个小时,则可以得到nXm个训练样本; 训练阶段: 1)k近邻网格查找:学习两个训练样本之间的马氏距离函数,通过马氏距离函数查找得到每个训练样本最近的k个样本; 2)多元线性回归模型训练:根据每个样本及其k个最近的邻居样本生成向量,nXm个训练样本生成nXm个向量;对生成的nXm个向量进行多元线性回归,输出拟合的多元线性回归模型; 估计阶段: 1)输入待估计空气质量的位置的经纬度信息,并根据经纬度信息获取所属的网格g,抽取网格g的空间特征Fg ;抽取网格g所在城市的所有空气质量监测站点所属网格的空间特征,得到特征向量Fe ; 2)利用马氏距离函数从Fe中查找到与Fg相近的k个最近的特征向量,k个最近的特征向量对应k个网格,由k个网格得到网格集合G ; 3)网格g和网格集合G生成一个向量; 4)根据训练阶段输出的多元线性回归模型对上一步得到的向量进行线性回归计算,计算结果为估计的空气质量值。
2.根据权利要求1所述的一种基于空间特征的细粒度空气污染物浓度区域估计方法,其特征在于,所述的空间特征包括:交通相关特征Ft、路网结构相关特征匕、POI相关特征Fp、签到特征F。。
3.根据权利要求1所述的一种基于空间特征的细粒度空气污染物浓度区域估计方法,其特征在于,所述训练阶段的k近邻网格查找步骤中,采用距离度量学习方法和空气污染物浓度值的相似性标准计算两个训练样本之间的马氏距离函数,计算公式如下:
, Xj) —(X1-Xj) A(XfXj); 其中,dA(Xi,Xj)表示两个样本X1、Xj之间的距离,A为半正定矩阵。
4.根据权利要求3所述的一种基于空间特征的细粒度空气污染物浓度区域估计方法,其特征在于,设置两个空气污染物浓度值的相似性标准。
【文档编号】G06F19/00GK104200104SQ201410452578
【公开日】2014年12月10日 申请日期:2014年9月4日 优先权日:2014年9月4日
【发明者】王敬昌, 陈岭, 赵江奇, 蔡雅雅, 徐精忠 申请人:浙江鸿程计算机系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1