一种基于时序向量相似度分析的爆管识别与定位方法与流程

文档序号:14516652阅读:264来源:国知局
一种基于时序向量相似度分析的爆管识别与定位方法与流程

本发明涉及一种对管网爆管事故的识别与定位方法,具体是关于一种基于时序向量相似度分析的爆管识别与定位方法,属于城市供水管网领域。



背景技术:

城市供水管网是现代都市的生命线,在人们日常生活和城市的发展中占据着不可替代的地位。爆管是供水管网中常见的事故类型,它不仅造成水资源与能源的浪费,而且给自来水公司造成巨大的经济损失。此外,爆管事故还会造成交通中断、地面塌陷等次生事故,危及人民群众的财产和生命安全,给居民生活和工业生产带来严重影响。然而,爆管事故的突发性、不确定性和影响因素的复杂性给自来水公司的应急处理工作带来了巨大困难。因此,对供水管网进行爆管事故的识别与定位,辅助管理者科学决策,及时发现和维修爆管区域,具有重要的经济意义和社会意义。

为了实现供水管网进行爆管事故的快速识别与定位,国内外学者已经开展了大量研究,主要方法可分为三类:基于水力学模型的方法、基于硬件的方法以及数据驱动的方法。基于水力学模型的方法需要获取众多的地理信息数据并建立复杂的管网水力模型,参数众多,计算繁琐,而且精度不高。基于硬件的方法依靠加装额外的监测设备或使用特定管材,爆管发生时,这些设备或管材会产生特殊的声信号,爆管事故由此被识别出来。但是设备成本与改造费用高昂,不利于该种方法的大规模推广。数据驱动的方法则依靠分析数据采集与监视控制(supervisorycontrolanddataacquisition,简称为scada)系统中实时采集的压力流量等数据,来发现爆管事故。近年来,scada系统已广泛应用于国内的城市供水管网中,独立计量区域(districtmeteringareas,简称为dma)也越来越受到重视并开始大力建设,这都为开发和推广数据驱动的爆管识别与定位方法奠定了良好基础。

目前,数据驱动的方法大多借助于预测模型进行预测,通过比较预测值与实测值来判断是否发生爆管。但是预测模型的训练需要大量的历史监测数据,历史数据的清洗工作较为复杂,且新建或改造管网无法满足该种方法的数据需求。此外,基于预测模型的方法大多只能识别到爆管事故的发生,而无法提供爆管的位置信息。由此可见,数据驱动的方法仍需要在以上方面做出改进。



技术实现要素:

针对上述问题,本发明的目的是提供一种基于时序向量相似度分析的爆管识别与定位方法。

为实现上述目的,本发明采取以下技术方案:一种基于时序向量相似度分析的爆管识别与定位方法,包括以下步骤:

1)使用供水管网dma中多个压力监测点的监测数据构建多维时间序列与多维时序向量,具体包括:

①将dma入口处的m个压力计设置为参考压力点,其采集的数据为持续更新的时间序列,记为参考压力序列pir,i=1,2,…,m,该参考压力序列中t时刻的压力监测数据记为所有参考压力序列组成一个m维参考压力序列

②将dma内部的n个压力计设置为普通压力点,其采集的数据为持续更新的时间序列,记为普通压力序列pj,j=1,2,…,n,该普通压力序列中t时刻的压力监测数据记为pj,t;

③将起始时间相同的m维参考压力序列与普通压力序列pj进行组合,构建m+1维时间序列,记为

④每个普通压力点均对应一个m+1维时间序列,共计n个m+1维时间序列;每个m+1维时间序列中,处于相同时刻的m+1个压力数据(分别来自于和pj)构成一个m+1维时序向量,t时刻的m+1维时序向量记为

2)设置滑动窗口及其长度,具体包括:

①设dma中所有压力监测点每t分钟采集一次数据,即t时刻与t+1时刻的压力监测数据pj,t与pj,t+1(或)的采集间隔为t分钟;对于每个m+1维时间序列而言,每t分钟生成1个m+1维时序向量(即n个m+1维时间序列每t分钟生成n个m+1维时序向量);

②设置长度为l的滑动窗口,随着压力监测数据的更新,滑动窗口每t分钟向前移动一次;对于每个m+1维时间序列而言,滑动窗口中共包含l个m+1维时序向量;

3)计算滑动窗口中m+1维时序向量间的余弦相似度,使用基于余弦相似度的异常检测算法识别异常的m+1维时序向量,确定爆管事件的发生,具体包括:

①给定一个m+1维时间序列滑动窗口中每t分钟都有l个m+1维时序向量;计算第l个m+1维时序向量与其他l-1个m+1维时序向量的余弦相似度simu,u=1,2,…,l-1,两个m+1维时序向量间余弦相似度的计算公式如下:

其中,x和y均为m+1维时序向量,其形式为

②设定数量参数p与相似度参数q(p和q均为0到1之间的小数),对第j个(共n个)m+1维时间序列,使用数量参数p确定数量阈值n,使用相似度参数q确定相似度阈值s,s=qm,其中m为l-1个相似度值的中位数;确定n与s的值后,计算l-1个相似度值中大于s的个数kj:

其中,χ(simu-s)为计数函数,如果simu-s>0,χ(simu-s)=1,否则,χ(simu-s)=0,即当simu-s>0时进行计数,simu-s<0时不计数;当kj≥n时,对于第j个m+1维时间序列而言,滑动窗口中的第l个m+1维时序向量为正常向量;当kj<n时,第l个m+1维时序向量为异常向量;

③对于n个m+1维时间序列而言,每t分钟都会对n个m+1维时序向量进行识别并得到n个识别结果o1,o2,…,on;当kj≥n时,第j个m+1维时序向量为正常向量,oj的值记为0;当kj<n时,第j个m+1维时序向量为异常向量,oj的值记为1,则每t分钟的识别结果之和sum为:

其中,oj为第j个m+1维时序向量的识别结果;若t时刻的识别结果之和大于等于1,则统计t时刻之后v个时刻识别结果之和的情况;记t,t+1,…,t+v时刻的识别结果之和分别为sumt,sumt+1,…,sumt+v,当至少连续两个时刻均识别出异常向量时,即当sumt,sumt+1,…,sumt+v均大于等于1且v≥1时,则确定有爆管事件的发生;

4)计算各个普通压力点附近发生爆管事件的疑似度,给出近似的爆管位置信息,具体包括:

每个m+1维时间序列均对应一个普通压力点,当某时刻识别出有异常向量后,计算各个普通压力点发生爆管事件的疑似度dj:

疑似度dj介于0和1之间,dj值越大,相对应的普通压力点附近发生爆管事件的可能性越大,即爆管位置距离该普通压力点越近;当dj值为零时,说明该时刻相应的普通压力点未出现异常(即oj=0),爆管事件最不可能在该普通压力点附近发生;在此规定,当有一个普通压力点的疑似度连续两个或连续两个以上时刻为最大值时,确定爆管事件发生在该普通压力点附近。

在上述步骤1)中,参考压力点的个数通常不超过3个,即1≤m≤3;普通压力点根据dma的大小数量有所变化,通常大于3个,即n≥3。

在上述步骤2)中,数据采集间隔为1-5分钟,即1≤t≤5;滑动窗口至少包含一天(1440分钟)的监测数据,考虑到计算效率,最多包含7天(10080分钟)的监测数据,用l与t进行表达,即1441≤lt≤10081。

在上述步骤3)中,参数p的取值范围为[0.1,0.3],参数q的取值范围为[0.3,0.7];对所有n个m+1维时间序列,设置相同的p和q,随着滑动窗口的移动(即时间的推移与数据的更新),p和q保持不变。

本发明由于采取以上技术方案,其具有以下优点:1、相对于人为的经验判断或是价格高昂的先进设备设施,本发明能够充分利用dma监测数据的有效信息,分析判断爆管事故发生与否,并给出爆管的大体位置,这大大节省了培训专业工作人员的时间与改造管网的费用;同时,本发明改善了爆管预警的方法,使供水企业主动而非被动地获取爆管信息,为供水企业快速有效地发现爆管事故,最大限度地降低爆管给城市生活带来的损失,保障供水管网的安全性和可靠性提供了关键的技术支持。2、区别于其他数据驱动的方法,特别是基于预测模型的爆管识别与定位方法,本发明无需大量历史监测数据进行模型的训练,将爆管识别转化为一个异常检测的科学问题,仅需要数天的监测数据便可运行,同时能够保证较高的识别准确率和较低的误报率,实用性更强。3、本发明利用matlab作为爆管识别与定位方法的开发平台,通过在m文件编辑器中编写相应的代码即可实现对dma压力监测数据的整合与异常检测,充分利用其强大的计算能力和丰富的内置函数,从而提高开发效率,缩短开发时间。

附图说明

图1为本发明的流程图;

图2为实施例所选dma的管网简图;

图3为多维时间序列与多维时序向量的示意图;

图4为实施例构建的3个二维时间序列的示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。然而应当理解,附图的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。

图1示出了本发明基于时序向量相似度分析的爆管识别与定位方法的流程图,为了能够实现爆管的识别与定位,首先需要构建多维时间序列和多维时序向量;然后设定滑动窗口及其长度;随后使用基于余弦相似度的异常检测的识别爆管的发生;最后,计算各个压力监测点附近发生爆管事件的疑似度,给出近似的爆管位置信息。

具体地,作为示例,选取一真实的dma进行实施。所选dma有1个入口压力计(参考压力点)和3个内部压力计(普通压力点),即n=1,m=3。此dma所有压力计的数据采集间隔为5min。收集该区域两个月的历史数据(2016年6月1日到2016年7月31日)用以实施本发明。在这两个月期间,发生消火栓损坏事故两次,管道冲洗一次。这些时间可以视为爆管事故,从而验证本发明的识别与定位效果。所选dma的管网简图以及压力计和事故的位置如图2所示。

本实施例中所用3次事故的具体信息如表格1所示:

表格1事故描述

1)使用dma中多个压力监测点的监测数据构建多维时间序列与多维时序向量;

图3示出了多维时间序列与多维时序向量,以此为依据,本实施例构建了如图4所示的3个二维时间序列,相应的这些序列中的向量为二维时序向量。

2)设置滑动窗口;

本实施例设定滑动窗口的长度l为1441,即滑动窗口中包含5天的监测数据,则剩余的56天监测数据用于验证本发明的识别和定位效果。对于每个2维时间序列而言,56天的数据共生成16128个二维时序向量(对应16128个时刻),即本实施例共使用基于余弦相似度的算法进行16128次异常检测。

3)计算滑动窗口中m+1维向量间的余弦相似度,使用基于余弦相似度的异常检测算法识别异常时序向量,确定爆管事件的发生;

对每个二维时间序列,每个时刻均计算滑动窗口中第1441个时序向量与其他1440个时序向量的相似度,获得1440个相似度值。设定参数p和q分别为0.19和0.47,用以确定数量阈值n和相似度阈值s。图4中第一个二维时间序列的第一次异常检测(即对2016年6月6日零点的时序向量进行检测)为例:

s=qm=0.47×2.35×10-5=1.10×10-5

经计算,1440个相似度值中小于s的个数有508个,即k1=508≥n,因此,该时刻第一个时间序列的时序向量是正常的,即o1=0。

类似的,对其他两个时间序列分别计算n和s,则在此时刻检测结果为:k2=495≥n,o2=0;k3=524≥n,o3=0。由于有三个时间序列(即每t分钟均有3个三维时序向量),对应的识别结果之和sum的取值范围为[0,3],根据检测结果,在该时刻的sum值为0。

如此共对这三个时间序列进行16128次异常检测。当连续两个或超过两个时刻sum值大于等于1时,则确定有爆管事件的发生。三次事故的检测结果如表格2所示:

表格2爆管识别结果

除以上被成功识别的事故以外,此发明还识别出3次异常的压力突变事件,持续时间均在20min以上,判断是由于大用户突然用水等用水行为造成,并未能被自来水公司记录。此外,在两个月内共有12次误报,即本发明确定有爆管事件发生,但实际情况是没有任何事故发生。这12次误报对应24个时刻(每次误报均是连续两个时刻识别出异常向量),仅占16128个时刻的0.15%。

4)计算各个普通压力监测点附近发生爆管事件的疑似度,给出近似的爆管位置信息;

表格3展示了3次事故发生的时段中,每个时刻每个普通压力点所对应的疑似度值。对于发生在h1的消防栓损坏事故,p4处的疑似度连续两个时刻最大,因此确定事故大概发生在p4附近;类似的,可确定其他两个事故分别发生在p2和p3附近。

对比此dma的管网简图,发现事故发生的位置确实与上述结论相符,这验证了本发明定位的准确性。

表格3爆管定位结果

此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1