一种基于时空统计的气象要素时空聚集模式挖掘方法

文档序号:6543944阅读:609来源:国知局
一种基于时空统计的气象要素时空聚集模式挖掘方法
【专利摘要】本发明一种基于时空统计的气象要素时空聚集模式挖掘方法,首先对气象数据进行预处理与探索性分析判断气象要素时空聚集模式的是否存在;若气象要素存在聚集模式,则进一步借助时空统计学理论构建时空邻近域;在此基础上,融合空间、时间与专题属性三方面因素估计气象时空实体的密度;最后,将高密度气象时空实体聚集成簇,并进行可视化表达。优点如下:采用时空统计学理论避免了人为因素对气象要素时空聚集模式挖掘的主观影响,从时间、空间耦合的视角综合考虑气象要素的动态演化规律,有效提高时空聚类分析方法挖掘深层次地学规律的能力。
【专利说明】一种基于时空统计的气象要素时空聚集模式挖掘方法
【技术领域】
[0001]本发明属于时空数据挖掘与时空分析领域,涉及一种基于时空统计的气象要素时空聚集模式挖掘方法。
【背景技术】
[0002]全球气候变化已成为影响人类生存与社会经济发展的关键因素。气温、降水等气象要素的时空演变是认识和理解全球气候变化的一个重要途径。采用时空聚类分析工具提取气象要素时空聚集模式挖掘是研究气象要素时空演变的重要手段。
[0003]现有的时空聚类方法大致可以分为三类:(1)基于时空距离的方法;(2)时空扫描统计方法,以及(3)基于时空密度的方法。基于时空距离的方法首先定义时空实体间的时空距离表达,进而采用假设检验或传统的聚类方法挖掘时空聚集结构。时空距离的方法多需要较强的应用背景与先验知识,如时空耦合距离法多应用于地震爆发聚集性探测,难以推广到气象要素时空聚集模式挖掘。基于时空距离的方法多是用于检验时空实体的聚集性,而难以获得准确的时空簇,难以估计时空实体的专题属性进行聚类。时空扫描统计方法的核心思想是在一定的范围内探测时空实体的聚集结构。时空扫描法首先需要假设数据的概率分布,进而采用一定的扫描窗口(即由空间距离定义半径、时间间隔定义高度的圆柱体),以每个时空实体为中心进行统计检验,确定时空聚集结构。时空扫描统计的方法在疾病爆发热点分析领域进行了成功的应用。然而,时空扫描统计的方法在其他领域的推广可能具有一定的局限性,首先数据的概率分布可能是未知的,而且扫描窗口的大小难以自动适应密度的变化。此外,时空扫描统计的方法无法准确的描述时空簇的范围、大小和位置信息,且不能顾及专题属性聚类,故不适用于挖掘气象要素时空聚集模式。基于时空密度的方法是传统基于密度的空间聚类算法DBSCAN基础上进行的扩展,其核心在于时空邻近域的定义与时空密度的估计,然而此类方法需要过多的认为参数设置,且难以通过严密的数学手段对参数进行估计,进而限制了其在实际中的使用。综上分析,可以发现现有的时空聚类方法难以满足同时顾及气象要素的专题属性和时空实体时空耦合特性的时空聚集模式挖掘任务。

【发明内容】

[0004]本发明的目的在于提供一种基于时空统计的气象要素时空聚集模式挖掘方法,解决了现有的时空聚类方法难以满足同时顾及气象要素的专题属性和时空实体时空耦合特性的问题。
[0005]本发明所采用的技术方案是包括以下步骤:
[0006]I)时空数据预处理与特征选取:首先对气象时空数据中重复、冗余的记录进行清理,对个别缺失数据采用空间插值或时间平滑的方式进行修补;
[0007]2)时空数据探索性分析,对预处理后的气象时空数据进行以下两个步骤:
[0008]2.1)进行时空趋势分析,检验时空数据的时空平稳性,若时空数据满足时空平稳特性则直接进行步骤3);
[0009]2.2)若时空数据不满足时空平稳特性,则借助BP神经网络提取时空趋势,进而从原始数据中减去时空趋势部分,得到时空平稳的残差时空数据,从而满足时空平稳特性,进行步骤3);
[0010]3)构建时空邻近域:
[0011]3.1)采用地统计学计算变程,获得时空邻域空间半径的最大上限;
[0012]3.2)采用时空自相关函数与时空偏相关函数计算时空邻近域时间影响范围,并确定时间邻居,得到时间窗口 ;
[0013]3.3)在变程范围内,借助K最邻近方法或Delaunay三角网确定空间邻居;
[0014]3.4)对3.2与3.3中确定的时间邻居与空间邻居取交集,完成时空邻近域构建;
[0015]4)在时空邻近域内,将时空实体集合生成时空簇,并标记;
[0016]5)采用Matlab软件对时空簇进行可视化。
[0017]本发明的技术特点还在于:所述步骤2.2)中,对非平稳的时空趋势进行剔除,获得平稳的残差时空数据的过程为:采用Matlab软件首先对时空数据进行归一化处理,进一步构造三层BP神经网络,输入时空数据进行训练,提取时空趋势,并从原始数据中进行剔除。所述步骤3.4)的过程为:根据时空自相关函数、时空偏相关函数观察截尾,统计获得时间窗口大小,其中采用变程与高斯函数定权,空间邻域采用K最邻近法或Delaunay三角网法获得,在此基础上完成时空邻近域的构建;
[0018]自相关函数如下:
【权利要求】
1.一种基于时空统计的气象要素时空聚集模式挖掘方法,其特征在于包括以下步骤: 1)时空数据预处理与特征选取:首先对气象时空数据中重复、冗余的记录进行清理,对个别缺失数据采用空间插值或时间平滑的方式进行修补; 2)时空数据探索性分析,对预处理后的气象时空数据进行以下两个步骤: 2.1)进行时空趋势分析,检验时空数据的时空平稳性,若时空数据满足时空平稳特性则直接进行步骤3); 2.2)若时空数据不满足时空平稳特性,则借助BP神经网络提取时空趋势,进而从原始数据中减去时空趋势部分,得到时空平稳的残差时空数据,从而满足时空平稳特性,进行步骤3); 3)构建时空邻近域: 3.1)采用地统计学计算变程,获得时空邻域空间半径的最大上限; 3.2)采用时空自相关函数与时空偏相关函数计算时空邻近域时间影响范围,并确定时间邻居,得到时间窗口 ; 3.3)在变程范围内,借助K最邻近方法或Delaunay三角网确定空间邻居; 3.4)对3.2与3.3中确定的时间邻居与空间邻居取交集,完成时空邻近域构建; 4)在时空邻近域内,将时空实体集合生成时空簇,并标记; 5)采用Matlab软件对时空簇进行可视化。
2.根据权利要求1所述的一种基于时空统计的气象要素时空聚集模式挖掘方法,其特征在于:所述步骤2.2)中,对非平稳的时空趋势进行剔除,获得平稳的残差时空数据的过程为:采用Matlab软件首先对时空数据进行归一化处理,进一步构造三层BP神经网络,输入时空数据进行训练,提取时空趋势,并从原始数据中进行剔除。
3.根据权利要求1所述的一种基于时空统计的气象要素时空聚集模式挖掘方法,其特征是:所述步骤3.4)的过程为:根据时空自相关函数、时空偏相关函数观察截尾,统计获得时间窗口大小,其中采用变程与高斯函数定权,空间邻域采用K最邻近法或Delaunay三角网法获得,在此基础上完成时空邻近域的构建; 自相关函数如下:
4.根据权利要求1所述的一种基于时空统计的气象要素时空聚集模式挖掘方法,其特征是:所述步骤4)的过程为: .O选取一个时空核,若其与时空邻近域内邻近时间点上、空间位置相同的时空实体均满足时空直接相连则将其视为一个初始时空核; .2)针对一个初始时空核,在时空邻近域范围内,在空间上由近到远,同时依据时间的由近及远,加入一个满足时空直接可达的时空实体,初始时空簇开始生成; . 3)按照步骤2)中原则进行时空簇扩展,针对每个扩展时空核,加入所有满足时空直接可达与时空相连的时空实体,直到一个时空簇生成完成; . 4)重新选取一个未归入任何时空簇且未被标记为孤立点的初始时空核,重复步骤I)到.3 ),直到所有时空实体被归入某一时空簇,或被标记为孤立点时,时空聚类结束,时空簇亦同时获得。
【文档编号】G06F17/30GK103914558SQ201410151706
【公开日】2014年7月9日 申请日期:2014年4月16日 优先权日:2014年4月16日
【发明者】邓敏, 刘启亮, 唐建波, 石岩, 梅小明, 何占军 申请人:中南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1