一种基于聚类分析发现环境监测罕见数据组合模式的算法

文档序号:8282335阅读:291来源:国知局
一种基于聚类分析发现环境监测罕见数据组合模式的算法
【专利说明】
所属技术领域
[0001]本发明涉及一种基于聚类分析发现环境监测罕见数据组合模式的算法。该算法可以利用聚类分析原理,对环境监测数据的多参数数据组合的数据模式进行分析,发现其中所隐藏的历史罕见的监测数据组合模式,从而能够提醒环境监测人员的注意。
【背景技术】
[0002]在环境监测中,环境监测数据的异常变化可能是由监测数据质量问题导致,也可能是暗示环境的变化。因此,对于环境监测数据中异常数据的发现,可以协助环境监测部门发现环境监测数据质量问题,并对环境变化进行提前预警。作为异常数据的一种形式,当环境监测数据出现历史罕见的数据组合模式时,就需要提醒环境监测人员可能存在数据质量问题或可能出现环境变化。
[0003]本发明所描述的算法可以通过聚类分析对环境监测数据进行分析,以发现环境监测数据中出现的历史罕见数据组合模式。

【发明内容】

[0004]本发明所描述算法所考虑的环境监测数据并不局限于某特定的监测参数,而是综合考虑同一时刻的多个参数的监测数据组合。本发明所描述算法利用聚类分析原理,综合考虑多参数的监测数据组合,并与历史数据相对比,如果发现当前的数据组合模式在历史上出现的次数少于相应阈值时,该数据组合模式将被判定为历史罕见数据组合模式。
[0005]本发明的基本原理在于同地的环境监测数据是周期性变化的,如果出现历史罕见的数据组合,则可以认为此数据组合为异常情况,可能反映监测数据质量问题或环境的趋势性变化,因此应引起环境监测人员的重视。在算法方面,本发明采用网格法对多参数监测数据构建历史特征数据库,并以实时监测数据与历史特征数据库进行比较,如果当前实时监测数据组合在历史特征数据库中所出现次数低于设定阈值,则判定为该数据组合为历史罕见数据组合。
[0006]本发明的算法描述如图1所示,通过软件开发实现该算法,可以首先生成历史特征数据库,然后将当前环境监测数据组合与历史特征数据库相对比,如当前监测数据组合低于所设定阈值,则判定为环境监测罕见数据组合模式。
[0007]本发明的有益效果是:可以通过聚类分析的分析方法,发现环境监测数据中历史罕见数据组合数据异常,从而能够提醒环境监测人员检查监测数据质量或重视环境变化趋势。
【附图说明】
[0008]下面结合附图对本发明进一步说明。
[0009]图1基于聚类分析发现环境监测罕见数据组合模式的算法流程图
【具体实施方式】
[0010]在图1中,描述了基于聚类分析发现环境监测罕见数据组合模式的算法流程。主要步骤包括:
[0011]1、对不同监测参数组合(P个参数)进行统计分析,以每个监测参数为维度,将每个维度划分为D个等分,从而将该参数组合形式的所有取值划分为(D~P)个多维网格
[0012]2、按照历史数据,计算该参数组合的历史数据在每个网格内出现的次数(N)
[0013]3、将网格组成和每个网格内数据出现次数形成历史特征数据库
[0014]4、将当前该监测参数数据组合的数据与历史特征数据库对比
[0015]5、罕见数据组合模式的判定:如当前监测数据组合所属网格对应历史数据组合出现次数(N) <设定阈值L,则判定该监测数据组合为环境监测罕见数据组合模式,否则不判定为环境监测罕见数据组合模式。
【主权项】
1.一种基于聚类分析发现环境监测罕见数据组合模式的算法,其特征是:本发明采用网格法对多参数监测数据构建历史特征数据库,并以实时监测数据与历史特征数据库进行比较,如果当前实时监测数据组合在历史特征数据库中所出现次数低于设定阈值,则判定为该数据组合为历史罕见数据组合。
2.根据权利要求1所述的一种基于聚类分析发现环境监测罕见数据组合模式的算法,其算法特征是:算法所考虑的环境监测数据并不局限于某特定的监测参数,而是综合考虑同一时刻的多个参数的监测数据组合。
3.根据权利要求1所述的一种基于聚类分析发现环境监测罕见数据组合模式的算法,其算法步骤特征是: 1)对不同监测参数组合(P个参数)进行统计分析,以每个监测参数为维度,将每个维度划分为D个等分,从而将该参数组合形式的所有取值划分为(D~P)个多维网格 2)按照历史数据,计算该参数组合的历史数据在每个网格内出现的次数(N) 3)将网格组成和每个网格内数据出现次数形成历史特征数据库 4)将当前该监测参数数据组合的数据与历史特征数据库对比 5)罕见数据组合模式的判定:如当前监测数据组合所属网格对应历史数据组合出现次数(N) <设定阈值L,则判定该监测数据组合为环境监测罕见数据组合模式,否则不判定为环境监测罕见数据组合模式。
【专利摘要】本发明涉及一种基于聚类分析发现环境监测罕见数据组合模式的算法。该算法可以利用聚类分析原理,对环境监测数据的多参数数据组合的数据模式进行分析,发现其中所隐藏的历史罕见的监测数据组合模式,从而能够提醒环境监测人员的注意。本发明所描述算法所考虑的环境监测数据并不局限于某特定的监测参数,而是综合考虑同一时刻的多个参数的监测数据组合。本发明所描述算法利用聚类分析原理,综合考虑多参数的监测数据组合,并与历史数据相对比,如果发现当前的数据组合模式在历史上出现的次数少于相应阈值时,该数据组合模式将被判定为历史罕见数据组合模式。
【IPC分类】G06F17-30
【公开号】CN104598514
【申请号】CN201410685956
【发明人】邹志强, 王正
【申请人】北京金水永利科技有限公司
【公开日】2015年5月6日
【申请日】2014年11月26日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1