用于污染物溯源的设备和方法与流程

文档序号：12804738阅读：339来源：国知局

本申请涉及数据分析领域，具体涉及一种用于污染物溯源的设备和方法。

背景技术：

目前，大气、水源等污染状况日益严重。污染的形成受排放物、扩散条件、地理环境等因素影响，其成因复杂多样，这为准确地分析某地区污染的分布和扩散趋势带来了困难。

现有的方法主要基于高斯模型建立大气污染扩散模型。然而，该方法仅适用于对较大区域(市区与城镇)进行较长时间且尺度较大(以月份为单位)的污染扩散分析，无法用于短时间、细时空粒度的污染物溯源。

技术实现要素：

本发明提出一种对不同监测站点所监测到的污染物进行溯源的技术方案。主要思想是：通过迭代计算不同监测点污染浓度在相邻时间窗的相关性，找出污染源头。另外，本发明的技术方案同样也适用于针对与大气污染具有相似时序特征数据(如水源污染、交通拥塞流等)的事故源定位追踪。

根据本发明的一个方面，提供了一种用于污染物溯源的设备，包括：获取单元，被配置为获取监测点的监测数据；计算单元，被配置为计算相邻时间窗之间的所有监测点之间的相关性；以及确定单元，被配置为找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，计算单元被配置为：设定时间窗和时间间隔，计算所有相邻时间窗之间的所有监测点间的相关性矩阵。确定单元被配置为：根据相关性矩阵中的数值大小，找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，计算单元被配置为：计算污染浓度向量以及污染浓度矩阵；以及根据污染浓度向量以及污染浓度矩阵，计算所有相邻时间窗之间的所有监测点间的相关性矩阵。

在一个实施例中，确定单元被配置为：设定最相关的监测点对的个数为n，其中n为大于1的正整数；根据相关性矩阵中的数值大小，找出目标时刻的n个最相关的监测点对；以及依次向前移动时间窗以找出前一时刻的n个最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，计算单元被配置为：采用余弦相似性来计算相关性矩阵。

根据本发明的另一个方面，提供了一种用于污染物溯源的方法，包括：获取监测点的监测数据；计算相邻时间窗之间的所有监测点之间的相关性；以及找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，设定时间窗和时间间隔，计算所有相邻时间窗之间的所有监测点间的相关性矩阵；根据相关性矩阵中的数值大小，找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，计算污染浓度向量以及污染浓度矩阵；以及根据污染浓度向量以及污染浓度矩阵，计算所有相邻时间窗之间的所有监测点间的相关性矩阵。

在一个实施例中，设定最相关的监测点对的个数为n，其中n为大于1的正整数；根据相关性矩阵中的数值大小，找出目标时刻的n个最相关的监测点对；以及依次向前移动时间窗以找出前一时刻的n个最相关的监测点对，直到所有时间窗被追溯。

在一个实施例中，采用余弦相似性来计算相关性矩阵。

采用本发明的技术方案，能够实现较短时间(例如数小时)、细时空粒度(例如1km*1km，每15分钟)上的污染物溯源。

附图说明

通过下文结合附图的详细描述，本发明的上述和其它特征将会变得更加明显，其中：

图1是示出了根据本发明的用于污染物溯源的设备的框图。

图2是示出了根据本发明的用于污染物溯源的方法的流程图。

图3-6是示出了根据本发明一个具体示例的数据计算结果的示意图。

具体实施方式

下面，通过结合附图对本发明的具体实施例的描述，本发明的原理和实现将会变得明显。应当注意的是，本发明不应局限于下文所述的具体实施例。另外，为了简便起见，省略了与本发明无关的公知技术的详细描述。

图1是示出了根据本发明一个实施例的用于污染物溯源的设备的框图。如图1所示，设备10包括获取单元110、计算单元120和确定单元130。下面，详细描述设备10中的各个单元的操作。

获取单元110被配置为获取监测点的监测数据，该监测数据例如可以是时空数据。在本申请中，“时空数据”是指同时具有时间和空间维度的数据，例如大气污染监测数据、交通流量数据等等。

在一个示例中，对于大气污染监测站点来说，监测点的时空数据可以包括6种主要大气污染物(pm2.5、pm10、so2、no2、co、o3)的浓度及其对应空气质量指数(iaqi)值。

计算单元120被配置为计算相邻时间窗之间的所有监测点之间的相关性。例如，相关性可以用相关性矩阵来表示，这将在下文详细描述。需要说明，上述示例仅仅是“相关性”的示例表示。本领域的技术人员可以理解，也可以采用其他方式来表示监测点之间的相关性。

确定单元130被配置为找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。从而，最终确定污染源头。

下面，以相关性矩阵作为监测点之间的相关性的示例，描述图1所示的设备10的操作。

在本实施例中，用相关性矩阵来表示监测点之间的相关性。如上所述，获取单元110获取多个监测点的监测数据。就大气污染监测站点来说，获取单元110可以获取6种主要大气污染物(pm2.5，pm10，so2，no2，co，o3)的浓度及其对应空气质量指数(iaqi)值。

计算单元120设定时间窗和时间间隔，并计算所有相邻时间窗之间的所有监测点间的相关性矩阵。在一个示例中，计算单元120计算污染浓度向量以及污染浓度矩阵，以及根据污染浓度向量以及污染浓度矩阵来计算所有相邻时间窗之间的所有监测点间的相关性矩阵。

具体地，计算单元120首先将所有监测点的污染物浓度在t时刻映射为一个n维向量其中表示第n个监测点在t时刻的污染物浓度。

然后，计算单元120设定时间窗itv，其由以t时刻为终点时刻的m个时间间隔构成。第i个监测点的污染物浓度在时间窗itv里可表示为：

相应地，时间窗itv内n个监测点在m个间隔(即m+1个时刻)的n*(m+1)维污染物浓度矩阵pol^itv(t)可表示为：

即

接下来，计算单元120计算以目标时刻t为终点时刻的时间窗与以上一时刻(t-1)为终点时刻的时间窗的所有监测点之间的相关性，得到相关性矩阵cov(t)：

优选地，计算单元120可以采用余弦相似性来计算相关性矩阵。假设设向量a＝(a1，a2，...，an)，b＝(b1，b2，...，bn)，则a和b的余弦相似性为：

确定单元130根据相关性矩阵中的数值大小，找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。例如，确定单元130可以设定最相关的监测点对的个数为n，其中n为大于1的正整数。然后，根据相关性矩阵中的数值大小，找出目标时刻的n个最相关的监测点对。即，找出目标时间窗(即以目标时刻为终点时刻的时间窗)的相关性矩阵cov(t)中相关值最大的前n对监测点，每对监测点中，对应较早时刻的监测点为另一监测点污染物的源头。例如，监测点a和b监测点间的相关值较大，在该对监测点中，监测点b对应时刻t-1早于监测点a的时刻t，则监测点b为监测点a处污染的源头。

接下来，确定单元130依次向前移动时间窗以找出前一时刻的n个最相关的监测点对，直到所有时间窗被追溯。即，找到在前一时间窗的相关矩阵cov(t-1)中与其相关值最大的n对监测点，再以找到的监测点为目标，迭代执行直至所有时间窗被追溯完成，从而找到目标时刻污染的最终源头。

下面，以一个具体示例来详细说明本实施例中的设备10的操作。

假设获取单元110获取1号至5号监测站点2014年7月1日15：00-21：00(共6小时)的so2浓度数据。

计算单元120设定时间窗长度为150分钟，每个时间窗包含5个时间间隔，每个间隔长度为30分钟，因而包含6个时刻：t，t-1，t-2，t-3，t-4，t-5。这样，2014年7月1日15：00-21：00(共6小时)共有8个时间窗，如图3所示。

在本示例中，计算单元120计算得到目标时刻t(即2014年7月1日21：00)的污染物浓度向量为pol^t＝(aqi1^t，......，aqi5^t)＝(18.757，14.581，18.228，11.083，12.153)。

计算单元120计算以目标时刻t(即2014年7月1日21：00)为终点时刻的时间窗内所有监测点的污染物浓度矩阵pol^itv(t)，如图4所示。以第1个监测点为例，其在该时间窗内的污染物浓度向量为：

计算单元120计算以时刻t-1(即2014年7月1日20：30)为终点时刻的时间窗内所有监测点的污染物浓度矩阵pol^itv(t-1)，如图5所示。

计算单元120计算所有相邻时间窗之间的所有监测点间的相关性矩阵。例如，图6示出了以目标时刻t(2014.7.121：00)为终点时刻的时间窗与以其上一时刻t-1(2014.7.120：30)为终点时刻的时间窗之间的所有监测点之间的相关性矩阵cov(t)。以监测点1和2为例，根据矩阵pol^itv(t)，pol^itv(t-1)计算得到：

则t时刻监测点1与t-1时刻监测点2的相关性为：

确定单元130根据相关性矩阵中数值大小，迭代计算出前一时刻的n个最相关监测点，最终确定污染源头。例如，本示例中可以设置n＝3。

确定单元130确定目标时刻t的相关性矩阵cov(t)中相关值最大的前3对监测点为：1-＞4，2-＞4，3-＞4。其中，又以3-＞4的相关性值最大(0.992637)，这表明监测点3为监测点4的源头的可能性最大。

接着，确定单元130以监测点3为目标，找到cov(t-1)中监测点3与t-2时刻的所有监测点相关性最大的3对监测点。依次类推，确定单元130得到3-＞2-＞4-＞5-＞2-＞1-＞3-＞4。则，确定单元130最终确定目标时刻t的污染源的位置位于监测点3。

采用本发明的技术方案，能够实现较短时间(例如数小时)、细时空粒度(例如1km*1km，每15分钟)上的污染物溯源。

图2是示出了根据本发明一个实施例的用于污染物溯源的方法的流程图。如图2所示，方法20在步骤s210处开始。

在步骤s220，获取监测点的监测数据。例如，该监测数据可以包括大气污染监测数据或交通数据。

在步骤s230，计算相邻时间窗之间的所有监测点之间的相关性。

例如，可以设定时间窗和时间间隔，并计算所有相邻时间窗之间的所有监测点间的相关性矩阵。优选地，计算污染浓度向量以及污染浓度矩阵，以及根据污染浓度向量以及污染浓度矩阵，计算所有相邻时间窗之间的所有监测点间的相关性矩阵。可以采用余弦相似性来计算相关性矩阵。

在步骤s240，找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

例如，可以根据相关性矩阵中的数值大小，找出目标时刻的最相关的监测点对，并且依次向前移动时间窗以找出前一时刻的最相关的监测点对，直到所有时间窗被追溯。

最后，方法20在步骤s250处结束。

应该理解，本发明的上述实施例可以通过软件、硬件或者软件和硬件两者的结合来实现。例如，上述实施例中的系统内的各种组件可以通过多种器件来实现，这些器件包括但不限于：模拟电路、数字电路、通用处理器、数字信号处理(dsp)电路、可编程处理器、专用集成电路(asic)、现场可编程门阵列(fpga)、可编程逻辑器件(cpld)，等等。

另外，本领域的技术人员可以理解，本发明实施例中描述的初始参数可以存储在本地数据库中，也可以存储在分布式数据库中或者可以存储在远程数据库中。

此外，这里所公开的本发明的实施例可以在计算机程序产品上实现。更具体地，该计算机程序产品是如下的一种产品：具有计算机可读介质，计算机可读介质上编码有计算机程序逻辑，当在计算设备上执行时，该计算机程序逻辑提供相关的操作以实现本发明的上述技术方案。当在计算系统的至少一个处理器上执行时，计算机程序逻辑使得处理器执行本发明实施例所述的操作(方法)。本发明的这种设置典型地提供为设置或编码在例如光介质(例如cd-rom)、软盘或硬盘等的计算机可读介质上的软件、代码和/或其他数据结构、或者诸如一个或多个rom或ram或prom芯片上的固件或微代码的其他介质、或一个或多个模块中的可下载的软件图像、共享数据库等。软件或固件或这种配置可安装在计算设备上，以使得计算设备中的一个或多个处理器执行本发明实施例所描述的技术方案。

尽管以上已经结合本发明的优选实施例示出了本发明，但是本领域的技术人员将会理解，在不脱离本发明的精神和范围的情况下，可以对本发明进行各种修改、替换和改变。因此，本发明不应由上述实施例来限定，而应由所附权利要求及其等价物来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张霓;胡卫松
技术所有人：日本电气株式会社
我是此专利的发明人

上一篇：一种家庭智能错峰用电系统的制作方法与工艺
上一篇：一种方便吃药的富氢水杯的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。