用于监控水设施网络中的资源的系统和方法

文档序号:5938431阅读:211来源:国知局
专利名称:用于监控水设施网络中的资源的系统和方法
技术领域
本发明总地涉及监控诸如水设施网络(water utility network)之类的资源分配系统以及检测与所分配网络相关联的异常(anomaly)。
背景技术
联合国指出上个世纪水的使用已经以超过人口增长率的两倍的速度在增加,并且越来越多的区域长期缺水。到2025年,世界人口的三分之二将因为人口的增加而处于水紧张的状态。水,尤其是饮用水,对于全社会经济发展以及保持健康的人口来说是至关重要的。随着全球人口的增加,要求更多地分配干净的水以供使用,导致更大的水稀缺。应对水稀缺和保护资源的一个方法是对出现在水设施网络中的泄漏和其它事件进行检测。一些专家估计由于泄漏和盗用所导致的损失达到流经水设施网络的水的25-30%。因此,仅通过解决在人类已控制的系统中的水损失的问题就可以保存相当大的水量。老旧且劣质建造的管道、不足的腐蚀保护、维护很差的阀以及机械损坏是造成水损失的因素中的一些。此外,水的泄漏减小了系统中的供水压力,结果供水设施必须提升系统中的压力以补偿损失。提高系统压力导致更多的水被泵出并且提高了供水设施的能量消耗。实际上,水分配网络在很多国家是一个最大的能量消耗体。通过识别并修正水泄漏及其它网络问题,供水设施可以保存水以供将来使用并且大大减少了能量消耗。加大困难的是大多数水设施网络是庞大且复杂的,并且通过一点一点的逐渐发展而建立的,任意配置中都有很多管道服务于随时间而发展起来的具体的地理需求。此外,大多数水设施网络缺乏准确、频繁、实时的用户消耗计量,这可能便于简单的保存大量的输入和输出记账。此外,水设施网络被设计为将水传送给大量的用户,这些用户的个人行为是不可预测的并且容易因为很多因素而变化。这些因素包括例如天气变化和自然事件(例如炎热的天气增加消耗,干旱的天气亦是如此),节假日和非典型的社会事件(例如导致用户待在家里并且住宅网络中的水使用增加而商业街区中的水使用减少)以及随时间而发生的街区中的人口变化。用于水设施网络中的泄漏检测的现有方法不能充分解决这些问题。例如,被用于地域调查的商业上可用的硬件泄漏检测设备(例如声音传感器)可能在排查给定区域内的泄漏时是有效的,但是安装和操作起来都很昂贵,并且不能提供整个网络的快速发现和地毪式覆盖。现有的水IT系统(例如可从ABB购得的Advise 水泄漏管理)尝试使用一些仪表数据,但是那种使用是很简单的并且结果的用处是很有限的。例如,系统不能准确地识别或实时报告诸如泄漏或其它网络事件之类的具体的各个事件,不能识别仪表故障或不好的水质量状况,缺乏准确理解例行网络操作所需要的统计分析,并且还有其它的缺陷。此外,当前所使用的系统缺少检测能量损耗或水盗用的能力。大多数当前方法的关键缺陷是缺少对很多未被计量的水网络的组分的深度统计建模,最要注意的是通常用非常初级的技术进行建模的业务用户的水消耗反而对网络的分析有很大的影响。监测控制和数据采集(“SCADA”)系统已越来越多地用在全世界的供水设施中了,用于收集来自网络内的各种仪表的数据,测量诸如流量和压力之类的量。然而,在大多数设施中,这些系统被一些技术操作者主要用于平常的操作需要;这些设施很少利用在它们的系统中累积的历史数据来自动地(或者用其它方 式)检测泄漏及其它异常网络事件。此外,任何异常检测通常都仅限于单一传感器固定界限警报,导致很低的敏感性或者很高比例的错误警报。水设施网络操作者不断增加更多的仪表来监控分配系统的活动。虽然这确实提供了更大量的关于网络的数据,并且因而提供了更大的可能来理解网络内的事件,但是增加的数据量通常只是进一步使网络操作者感到困惑,并且加剧了水网络监控中的已经很困难的“大海捞针”的问题。此外,更多仪表的放置通常未被优化以提高从整个系统中接收的数据的用处以实现高级监控的目的。因此,描述网络活动的增加的数据量是未被组织的,并且通常是造成困扰的并且不允许网络操作者做出关于水设施网络的状态的任何更好的决定。因此,需要提供改进的系统和方法来更好地分析从水设施网络获取的数据和关于利用网络的数据以及网络资源的消耗以便于实现对这些资源的更好的管理。

发明内容
现有技术中的以上及其它缺点中的一些或全部通过一种用于通过监控水分配网络来保存水的计算机化的方法而得到解决,所述水分配网络包括用于将水传送给消费者的多个管道和诸如降压阀、储存器或泵之类的网络设备,以及被置于水分配网络内的多处的多个仪表。仪表可以被置于管道的内部或外部,网络设备附近或者在其它任意位置处。在一些实施例中,该方法包括接收来自仪表的仪表数据,该数据表示仪表所测得的多个参数,所述参数至少包括经过管道的水的流量。在一些实施例中,仪表数据是监测控制和数据采集(SCADA)数据。在一些实施例中,仪表数据在被分析之前被进行处理,例如从仪表数据中滤出噪声以及对仪表数据进行格式化以存储在网络信息数据库中。根据一些实施例,仪表数据被分析以识别水网络事件,水网络事件包括泄漏事件和关于在水网络上传送的水的消耗以及网络和仪表的运转的信息事件。可能被报告的信息事件包括消耗模式中的无预期的增加、消耗模式中的变化、水的盗用、地带边界突破、设施仪表故障和网络设备故障。根据一些实施例的方法还可以包括在一段时间中接收表示在网络上传送的水的浑浊度、氯含量和pH的水质量数据,并且通过检测在一段时间内水质量数据的变化超过统计、按比例的或者常数阈值来识别网络事件。一个或多个网络事件经由用户接口被报告给用户。在一些实施例中,水网络事件被存储在数据库中,因而它们可以被各种接口模块访问,所述各种接口模块以包括通过事件列表、图形或趋势数据和故障单或其它警报在内的不同方式报告事件。在一些实施例中,该方法包括接收来自仪表外部的一个或多个源的二级数据,所述二级数据表示影响水设施网络所服务的区域中的水消耗的一个或多个条件。所述二级数据例如可以包括表示在水设施网络的区域内的天气条件的天气数据;表示影响给定日期的水消耗的一个或多个因素的日历表数据;表示在水设施网络上执行的一个或多个修补的修补数据;以及表示水设施网络的结构的结构数据。如这里将进一步说明的,该二级数据可以与仪表数据一起被分析以提供更好、更准确的结果并且减少或消除错误警报。例如,在水设施网络的给定区域中出现水流量或消耗的异常增加可能被解释为由于在平均热度或干燥度以上或者由于节假日或者其它自然或人为事件导致人们待在家里而没有去工作或者在特定的一个或多个位置处改变了常见的消耗模式。在一些实施例中,通过基于来自水设施网络的其它仪表数据统计预测第一仪表的仪表数据并且将所接收到的第一仪表的仪表数据与所预测的第一仪表的仪表数据进行比较来对仪表数据进行分析,所述统计预测例如计算第一仪表的可能值的统计分布。作为说明示例,历史数据可能指示第一仪表的值通常是由第二仪表同时测得的值的大约两倍;则第一仪表被预测为具有近似为最近从第二仪表得到的读数的两倍的当前读数。网络事件可
以通过检测异常而被识别,如果在超过预定义阈值的时段中来自第一仪表的实际接收的仪表值相对于针对第一仪表的预测仪表值偏离了预定义的统计偏离值,或者如果在预定义的时间窗口内它们的发生频率超过了预定义的阈值,则检测到异常,或者通过其它方式检测异常。对仪表值的统计异常检测是一种克服水网络的很多未被计量的组件中所固有的困难的可靠方式,最要注意的是业务用户的水消耗对网络的任何分析都有很大的影响。该消耗的统计结构(例如呈现周期性的趋势)在整个网络上传播,导致相似的或导出的仪表值的统计结构,允许对在网络的例行操作期间(无异常)生成特定仪表值的可能性进行分析。此夕卜,这里所描述的统计异常检测的使用允许将本发明的方法和系统用于提供如下仪表数据的网络,所述仪表数据不覆盖网络的每个部分、不是实时提供的或者是不完整的和匮乏的。因而,例如这里所描述的异常检测被设计为在水设施网络中是最有用的,其中仪表仅被置于某些网络连接点或位置处,或者其中仪表读数是以月为单位从用户住宅处获取的或者不能提供最新的信息。实际上,如上所述,典型的水设施网络在从网络中收集的仪表数据方面存在以上这些种类的缺点中的一种或多种,并且缺乏准确、频繁、实时的用户使用计量(这可能允许对大量输入和输出记账的简单保存),并且被设计为将水传送给大量的用户,这些用户的个人行为是不可预测的并且容易因为很多因素而变化。在一些实施例中,基于来自水设施网络的其它仪表数据统计预测第一仪表的仪表数据包括选择一个或多个第二仪表作为一个或多个对应仪表并且将从第一仪表接收到的仪表数据与从所述一个或多个对应仪表接收到的仪表数据进行相关。可以通过将针对所述一个或多个第二仪表的历史仪表数据与针对第一仪表的历史仪表数据进行相关来选择所述一个或多个第二仪表。在一些实施例中,所述一个或多个第二仪表可以是每个历史上具有与第一仪表的数值的紧密相关性的仪表。宽泛地说,在例行网络操作中,第一仪表的数值被预期为继续这种相关性。作为说明,当若干个仪表测量具有相似人口分布并且因而具有相似(或成比例的)消耗模式的若干不同街区所消耗的水流量时,这种情况可能发生。所述一个或多个第二仪表还被选择作为位于水设施网络内的那些不受影响第一仪表的本地异常的影响的仪表,所述异常是网络操作者感兴趣的类型,例如泄漏;但是,作为相同网络或总体区域的一部分,第二仪表受相同的全局异常的影响,例如在炎热天气时消耗增加。按照这种方式,影响来自第一仪表的数据的本地异常将不影响来自第二仪表的数据,因此将更容易通过与来自第二仪表的数据的统计比较来进行检测,但是全局异常将不会产生错误警报,即使它的原因是不清楚的。现有技术中的以上及其它缺点中的一些或全部被一种用于监控水设施网络的计算机化的系统所解决,所述系统具有网络信息数据库,用于存储表示由仪表测得的多个参数的仪表数据和来自仪表外部的一个或多个源的二级数据,所述参数至少包括经过管道的水的流量,所述二级数据表示影响水设施网络所服务的区域中的水消耗的一个或多个条件。该系统还包括被配置为分析仪表数据和二级数据以识别异常的分析引擎;被配置为基于异常识别水设施网络事件的事件分类引擎,所述水网络事件包括泄漏事件和关于流经管道和网络设备的水的水量和质量以及水设施网络的操作的其它事件;以及用于存储表示由事件分类引擎识别的所述一个或多个水网络事件的水设施网络事件数据的事件数据库。该系统还包括一组接口模块,用于从事件数据库中获取水设施网络事件数据并将其报告给用户。 在一些实施例中,分析引擎包括用于在假设常规操作且没有异常事件的情况下生成针对给定仪表的仪表数据的可能值的统计分布的多个预测器模块,以及用于将针对给定仪表的实际仪表数据与可能值的分布进行比较以检测仪表数据中的异常的多个异常检测器模块。现有技术中的以上及其它缺点中的一些或全部被一种用于管理水设施网络的计算机化的方法所解决,所述方法包括将仪表数据发送给分析引擎,从分析引擎接收表示水设施网络事件的数据,并在计算机化的显示设备上向用户显示所接收的水设施网络事件。根据一些实施例,水网络事件包括泄漏事件和关于流经管道和网络设备的水的水量和质量以及水设施网络的操作的其它事件。水设施网络事件数据可以作为分析仪表数据和二级数据的结果而被识别,所述二级数据表示影响水设施网络所服务的区域中的水消耗的一个或多个条件。


本发明在附图中被图示,所述附图是示例性的而非限制性的,其中相似的标号被用于指代类似的或相应的部件,并且在附图中图I和图2呈现了表示根据本发明实施例的用于监控水网络的系统的框图;图3呈现了说明根据本发明实施例的用于监控水网络的方法的流程图;图4呈现了进一步说明根据本发明实施例的用于监控水网络的方法的流程图;图5呈现了说明根据本发明实施例的用于预测针对给定仪表的测量值的方法的流程图;图6和图7呈现了说明根据本发明实施例的属性选择的流程图;图8呈现了说明用于检测水泄漏事件的方法的流程图;图9-11呈现了说明根据本发明实施例的针对特定事件类型的事件检测的流程图;以及图12-15呈现了示出根据本发明的一个实施例的呈现由分析引擎生成的事件信息的web用户接口的屏幕截图。
具体实施例方式在下面的描述中,对附图进行参考,附图构成说明书的一部分,并且其中通过图示示出了本发明可以被实现的特定实施例。应当理解在不脱离本发明的范围的情况下可以采用其它实施例并且可以进行结构改变。图I呈现了图示用于监控水分配系统中的资源的系统的一个实施例的框图。如图I中所示,该系统包括水网络分析引擎100,该引擎由位于计算机硬件上且执行下面要进一步描述的功能的各种软件模块和数据库构成。引擎100可以包括响应于可执行指令执行下述操作的一个或多个处理设备。水网络分析引擎100分析从不同仪表、传感器、读取设备接收到的数据或者与分布网络有关的其它数据。本领域技术人员将理解除非有特定的上下文明确指明,一般来说这里所使用的术语“仪表”和“传感器”指同一类网络设备并且包括能够测量参数或数值或激励(尤其是与水分配网络有关的激励)的任意仪表、传感器、表盘或其它设备。系统基于所述数据识别异常和事件并向用户提供实时警报或离线数据报告,用户可以适当地采取措施来应对分析引擎100所识别的任何现象或事件。如下面要进一步描 述的,分析引擎100所识别的异常和事件包括泄漏、爆裂、无预期的水消耗、故障仪表、仪表校准问题、水质量变化、对于正在网络上被传送的水量而言的其它重要问题、网络设备中的故障以及本领域技术人员所知的其它问题。如图I中所示,在一些实施例中,所接收到的作为水网络分析引擎100的输入的数据包括GIS数据101、操作数据102、水分配系统103、仪表数据1103a、仪表数据N 103b和外部数据104。GIS数据101是来自描述水网络的结构和布局以及水网络上的仪表的放置的地理信息系统(“GIS”)的数据,并且包括仪表类型、仪表位置、仪表年份、关于水管道的描述(例如直径和制造材料)、进入压力带和/或供应带的网络的部分、城市或区域地图和本领域技术人员可辨认的其它相关数据。关于水分配系统的地理和工程的任何其它特征以及本领域技术人员所依据的任何其它数据都可以被采用。还应注意该数据可以是包括与基础资源系统本身的发展相一致的更新的演进数据,例如当系统中有新的水管道、连接、仪表等被安装或者修改时。此外,该数据还可以包括基础资源系统被采样或测量时的更新,例如当现有管道被检查由于累积的固体沉积而导致的材料疲劳或内部收缩时的更新。操作数据102包括资产管理信息,并且可以是关于网络操作者所执行的操作的任何数字形式的信息,该信息可以与仪表读数相关联以确定或驳斥异常。例如,操作数据102可以包括关于水网络操作的信息,例如例行或计划的水网络操作、影响水流的阀的开和关、泵操作、声音调查、对水网络的任意部分进行的修补或改善、修补/改善的日期和时间、修补/改善的位置、对网络进行的例行维护以及指示技术人员可以何时何处在网络上活动的访问控制信息。在一个实施例中,操作数据102由用于管理水网络的系统提供。被监控的水分配系统产生大量的时间相关的数据,例如但不限于诸如流量、压力和储存器水位之类的液压指示符以及诸如氯含量、浑浊度、PH值和其它参数之类的质量指示符。该数据可以由分布在网络上的仪表产生,并且可以用水分配系统103来表示。此外,分布在网络上的仪表可以在任意位置或者仅提供对整个网络的部分表示的位置处。仪表数据I 103a和仪表数据N 103b表示水分配系统103中的各个传感器和仪表所产生的数据。用于收集诸如由网络数据103a和仪表数据103b所表示的数据之类的网络数据的系统的一个示例是SCADA系统。SCADA数据可以包括连续的时间相关的仪表数据,例如水压、水流速、水的浑浊度、水中的氯含量、水的PH和储存器水位。本领域技术人员熟悉SCADA数据系统并可以理解该术语表示对来自工业过程的数据集合的抽象,在此称为分布网络。外部数据104包括与水消耗和网络状况相关的附加信息,但不是严格地限于以上类别中,例如天气报告、影响网络的给定部分内的水消耗和网络行为的节假日或其它日历表事件,或者可能影响水网络的功能的使用本身或使用客户的任何其它事件。水网络分析引擎100根据下面将进一步详细描述的处理操作分析各种输入数据流并返回被分类和规范化为事件数据的输出。水网络分析引擎100将数据存储在数据库106中,并且来自数据库106的数据被一个或多个接口系统获取,例如事件跟踪接口 108、警报接口 109、报告接口 110、专用系统接口 111和其它接口 112。水分析引擎100还可以访问数据库106中的之前存储的数据,以实现事件报告的连续性,例如更新之前检测到的事件仍在发生中,而不是将该事件检测为另一个独立的事件。不同类型的接口系统被用于 以不同的方式向用户和外部系统提供关于事件的信息。例如,事件跟踪接口 108使得用户能够浏览网络上被检测到的所有事件,而警报接口 109向根据规则或政策已被确定为需要更及时的关注的用户(例如通过电子邮件、SMS或语音消息)或外部系统发出警报。接口108-112可以被各种计算机化的设备访问,例如台式计算机和笔记本计算机、蜂窝电话、黑莓设备、智能电话、寻呼机以及被编程为接收页面、故障单和其它类型的警报的其它移动设备。接口 108-112可以被从通过任意适当的网络(例如但不限于互联网)连接的服务器请求接口的计算机化的设备访问,或者可以被提供给这些设备以供用户查看或者输入到诸如故障票系统之类的其它系统中。来自水网络分析引擎100的输出可以被存储在数据库106中、电子日志文件中或者打印到纸上。虽然被图示为单一系统,但是在不同的实施例中,所图示的系统可以被集成和/或分布在多个硬件设备中并且可以是在逻辑上、物理上或地理上的分布。水网络分析引擎100可以是响应于可执行指令执行这里所描述的处理操作的任何适当的物理处理设备。水网络分析引擎100还可以包括操作为电子存储数据的任何适当类型的存储设备。图2呈现了示出根据特定实施例的水网络监控系统的更多细节的框图。在一个实施例中,单元203-207构成了图I的水网络分析引擎I 00。图2包括水网络200、水网络201、数据202、网络信息数据库203、数据准备引擎204、预测器205、异常检测器206、事件确定和分类引擎207、数据库208和输出接口 209,包括事件根据接口 210、警报接口 211、报告接口 212、专用系统接口 213和其它接口 214。单元200和201所表示的水分配系统是一个或多个被连接的水分配系统,或者位于不同区域中的之间有少量连接或者没有连接的水分配系统。在一个实施例中,单元200和201可以是任何适当的资源分布网络,例如市政、郊区或大型商家水设施网络、工厂或其它大型建筑物中的液体分布网络、或者舰艇、或者诸如下水道系统之类的任何适当的资源收集网络。本领域技术人员将理解单元200和201可以是任何水分配或收集系统。水网络200和水网络201发送代表网络的时间相关的数据,例如水流动、压力、浑浊度、储存器水位、氯含量和pH值。例如,该网络可以通过使用SCADA系统包含所述信息。来自水网络200和水网络201的数据可以报告来自特定仪表或仪表的集合的数据,所述仪表中的一些可以是相关联的。例如,本领域技术人员将理解仪表可以根据地带或根据分区计量区域(DMA)在地理上被分组。数据可以直接从网络中的仪表或仪表的集合被发送,或者数据可以来自于网络接口数据库203;此外,数据可以通过数据准备引擎204被丰富,例如添加或计算新的数据类型,例如早上和晚上的消耗数据。为了方便,术语“仪表数据”在本说明书中将被用于指代来自单一仪表的实际数据、或者来自多个仪表的读数或者在一段时间上接收到的一个或多个仪表的多个读数的预定义的有意义的组合,例如到DMA的进入水流的总和,或者生成描述网络的某个方面的有意义的一组时间相关的数据的任何类似的预定义计算。本领域技术人员基于网络布局和各个仪表的位置将很容易地认定这些有意义的组合。数据202表示包括资产管理信息的其它数据,所述信息可以是可与仪表读数相关联以确定或驳斥异常的任何数字形式的信息。例如,这可以包括关于水网络操作的信息,例如例行或计划的水网络操作、影响水流的阀的开和关、声音调查、对水网络的任意部分进行的修补或改善、修补/改善的日期和时间、修补/改善的位置、对网络进行的例行维护以及指示技术人员可以何时何处在网络上活动的访问控制信息。此外,数据202包括与水消耗和网络状况相关的附加信息,例如天气报告、影响网络的给定部分内的水消耗和网络行为的节假日或其它日历表事件,或者可能影响水网络的功能的使用本身或使用客户的任何其它事件。 网络信息数据库203将从水网络200和201中的仪表收集的原始数据与数据202合并。来自网络信息数据库203的数据被发送给数据准备引擎204。数据准备引擎204对所接收到的数据进行组织和格式化以便进一步处理。如本领域技术人员所知的,不同水分配系统所使用的数据格式可以彼此不同。例如,伦敦市可能以完全不同于纽约市的格式收集和存储网络数据。此外,数据准备引擎204通过去除不反映网络的实际性能或者反映系统设计者或网络管理者已决定不进行应对的暂态现象的数据来准备用于分析的数据;本领域中所公知的方法可以被用于“平滑”从网络中收集的数据。这些方法中的一些如被应用于从给定水网络接收到的特定数据的LOWESS和启发式清理。数据准备引擎204从网络数据中提取数据单元,并将它们格式化为一致的格式。被滤出的信息中可能有与来自资源的多个方面的数据传输相关联的噪声(例如来自仪表的噪声数据传输),或者与数据测量、传输或收集相关联的错误。数据准备引擎204还可以将从水网络200和201接收到的全部数据在被格式化之后但是只进行了少量或者没有进行滤波或平滑的情况下输出,以运行系统对数据进行分析,否则如果平滑技术中有一个平滑技术被首先应用,所述数据可能被丢弃。数据准备引擎204将经过预处理的数据发送给预测器205和异常检测器206。本领域技术人员将理解单元203-214可以被包含在同一设备中或者置于同一设备上,或者分布在多个设备上。在一个实施例中,预测器205包含利用不同技术的N个独立预测器。如下面将进一步描述的,预测器205分析数据集并提供对假设没有异常事件发生的情况下所预期的实际仪表值的统计分布的预测。如本领域中所公知的,预测器可以利用机器学习框架来设计以对数据进行统计分析。机器学习框架的示例在Ethem Alpaydin, Introduction toMachine Learning(Adaptive Computation and Machine Learning), MIT Press (2004),ISBN0262012111 ;Ryszard S. Michalski, Jaime G. CarbonelI, Tom M. Mitchell, MachineLearning An Artificial Intelligence Approach,Tioga PublishingCompany(1983),ISBN 0-935382-05-4中被进行了讨论,这两篇文章全部通过引用被合并于此。关于一些特定预测器的操作的更详细的描述出现在图5-6及其相关描述中。异常检测器206 (可以包括M个独立检测器)接收来自预测器205的统计预测数据和来自数据准备引擎204的经过预处理的数据。如图5中所示,从预测器205接收的数据集包括具有可能值、方差和关于值的任何其它统计描述符的分布。本领域技术人员将意识到数据集可以包含针对正在被分析的仪表的多个可能的和实际的值。异常检测器206包括用于测试针对仪表无异常的可能性和用于测试诸如特定事件类型之类的替代假设的可能性的异常检测器。异常检测器206将异常发送给事件确定和分类引擎207。那些异常中的一些表示异常本身中相关的事件,而一些异常表示事件的一些部分,例如事件的开始、事件的结束、事件中的重大变化、事件的顶峰等等。异常检测器206操作为分析从预测器发送的预期值与从网络获取的实际值的任何偏离的显著性。对于每个数据集,每个异常检测器通过分析偏离的显著性确定在给定时间段中对于给定的仪表读数,没有相关异常发生的统计可能性。异常检测器206分析经过一段时间(例如经过若干分钟、若干小时、若干天或者更长时间)的偏离的显著性,因为例如偏离连续或经常发生会提高所述偏离的显著性。本领域技术人员将意识到系统设计者将 设计或调整异常检测器206以基于所要求的敏感性等在一段时间内对偏离进行分析,对于较小时间尺度的事件、最近开始的事件,通常当它们具有较大幅度时是可检测到的,而相反对于小幅度事件,则要求在一段更长的时间内的连续偏离以检测到该事件。因而,例如仅发生一次或者只在例如一分钟内的很短时间内发生的较小的偏离将不被检测为异常,而在延长的时段内或者在该时段内频繁发生的同样较小的偏离将被异常检测器206识别为统计上显著的并且被检测为异常。关于分析偏离的显著性,例如当与历史统计数据进行比较时,仪表读数可能在考虑历史统计数据的情况下是显著的。例如,具有三倍标准偏离或者最高百分位中的值的差异可能是显著的偏离。在其它实施例中,统计偏离通过作为参数的函数的偏离分布来测得。一个这种参数可以是一天中的时间,意思是偏离的显著性可能取决于可根据一天中的时间变化的偏离的分布。其它这种参数可以包括可能改变当天或当天中的时间的网络特征的诸如温度或湿度之类的天气测量值、天气警报、节假日或者体育事件。此外,各个值的偏离显著性阈值可能因系统设计者、用户或水设施管理者所希望的统计可信度的级别而改变。在各个实施例中,该阈值是(I)根据历史数据中的相关性(例如标准偏离的指定倍数)基于偏离的分布计算出的统计可信度级别;或者(2)常数,高于该常数则系统检测到异常。在一些实施例中,实际值与预测值的比值被分析,而不分析两者之间的差值;应当理解术语“差异”在这些实施例中被用于同样指代所述比值。在一个实施例中,当在给定的时段内存在相对于预期值的连续的统计上较大的偏差时,异常检测器发现异常。统计上较大是指统计上显著的相对误差界(例如N个标准偏差或者K倍的四分位差或者取决于具体实现方式的考虑数据的实际分配的其它标准化方式)。此外,当将“瞬时”读数与预期值进行比较时,利用与预期值的差异的总标准偏差(或其它统计描述符)可能产生大量的错误判定,因为这种比较可能例如将一天中的高变动时间与一天中的低变动时间混在一起。因此,为了减少这种错误,系统通过将X(t)-P(t)划分到例如一周的那天的近似时间处的这种差异的标准偏差中来将读数x(t)与预测值P(t)进行比较。相对误差界的大小和时段的长度是该方法的参数,这使得特定实例集中在较短或较小的事件上。在另一实施例中,异常检测器计算在特定的固定时段内在实际和预测值之间的差异(或者该差异的绝对值-这关系到低值是否可以与后面的高值抵消)的曲线(AUC)下面的面积。该计算可以例如在一天中的每四分之一时间处以这种方式被执行。AUC本身不是统计量,但是由于是固定时段,所以分布可以被按经验被测量如果在工作日的午夜到6am之间仪表X的AUC值只有5%是大于XO的,则找到这样的AUC值大概是“5%的概率”。固定时段的长度(以及它们与之相比较的时段)是该方法的参数,这使得特定实例集中在较短或较小的事件上。事件确定和分类引擎207操作为对比来自M个异常检测器206的统计分析以确定给定最近的仪表读数的情况下无异常假设的总体统计可能性。引擎207将基于对来自相同或不同仪表以及在同一时间或在给定时段上的多个异常的检测提高事件的统计可能性,所述多个异常都一致指示事件的发生。例如,一个异常可表示事件的开始,另一异常可表示事件的变化或者事件的结束,并且分类引擎207将那些异常认定为与单一事件相关。作为另一示例,在相似时间处以及源于相关位置的与流量增加相关的来自不同仪表的两个异常将·都指示同一事件。在一个实施例中,试探法被用于基于根据时间统计数据的读数的统计可能性与根据空间统计数据的读数的统计可能性的组合确定仪表读数的总体统计可能性。例如,如果历史统计数据比较指示仪表的当前读数只有15%的可能性是这么高的,但是空间统计数据比较指示仪表的当前读数有95%的可能性是这么高,则总体的读数可能性可能是有 75% 的可能性是这么高。例如参见 Koziol, James and TuckwelI, Henry, “A BayesianMethod for Combining Statistical Tests.,,Journal of Statistical Planning andInference 1999 :78 (1-2),317-323,该文章通过引用被合并于此。分析引擎所检测到的事件例如泄漏、爆裂、故障仪表、水盗用、通信故障、水质量问题、无预期的消耗增加、消耗模式的改变、诸如异常储存器水位或压力之类的网络故障等等。关于事件的更多细节可以被包括,例如事件的开始时间、事件的结束时间、事件的大小、与事件相关联的总的水损失。事件确定和分类引擎207还生成关于每个事件的附加数据,例如开始时间、结束时间、事件的大小、事件的累计大小(例如从泄漏开始损失的总水量)、事件的类型、状态和物理单位,例如压力单位、pH或氯浓度。在一些实施例中,事件的大小是表示事件的大小或比重的值,例如关于超过正常状况的额外流量、仪表误算或氯含量变化的计算。该信息被存储在数据库208中以进而被发送给接口 209。特定的异常输出被映射到存储在数据库208中的特定事件字段。与事件相关联的字段例如事件的类型(由事件确定和分类引擎207确定)、开始时间、结束时间、大小和事件类型的物理单位。本领域技术人员将理解通过使用多个预测器和异常检测器,比较来自M个异常检测器206的统计可能性可能导致检测到的事件为异常的可信度增大,或者可能导致检测到的事件为异常的可信度降低。在一个实施例中,事件确定和分类引擎207可以对从M个异常检测器中的每个检测器发送的事件或事件部分进行等值加权。在另一实施例中,事件确定和分类引擎207可以基于预定义的配置为从M个异常检测器中的每个检测器发送的事件或事件部分分配权值。数据库208接收来自事件确定和分类引擎207的信息以存储在数据库208中并且由输出接口 209从数据库208中获取。事件跟踪接口 210向系统的用户提供事件列表。用户可以通过选择被列出的事件来查看各个事件和它们的相关联数据。被发送给事件跟踪接口 210的事件可以由系统的用户过滤。例如,任务只是修补泄漏的用户可以只查看泄漏事件,而系统的管理员可以查看每种类型的事件以及事件数据或事件的总体视图。不同的用户查看不同类型的事件,并且用户的需求或责任可以决定用户查看哪些事件。例如,泄漏管理者可以选择只查看高可信度的泄漏事件或者那些大小高于某个固定阈值的泄漏。在另一实施例中,任务是监控一个街区的用户查看与位于该街区的仪表数据相关联的事件。在另一示例中,水网络201的管理者查看与水网络201相关联的全部事件,而水网络200和201的管理者查看与两个网络相关的全部事件。本领域技术人员将意识到可以由系统管理者管理的标准的基于角色的用户接口、访问控制和用户管理方法可被用于提供这种对事件数据的访问和报告的粒度。事件跟踪接口 210中所表示的事件数据可包括事件开始时间、类型、位置、大小和状态。此外,选择事件的用户还可以被呈现更详细的信息,例如地图、图形、用户所贴的关于所选择事件的评论,以及引擎或用户所做出的对所选择事件、地图、图形等的注释,这些下·面将进行说明。作为更详细的示例,事件跟踪接口的用户可以对事件进行注释,或者包括到其它事件或用户接口对象的超链接。这些注释例如作为HTML形式的字段从事件跟踪接口被传送,所述HTML形式的字段在web上被传送并在数据库208中被存储在相关联的事件记录中以供系统的其它用户查看。用户还可以向系统的其它用户分派事件或与事件相关的任务的所有权或责任。例如,泄漏分析师可以将某个被怀疑的泄漏分派给相邻区带的水工程师,询问近期的维护是否可以解释流量异常,或者分派给控制室管理者以推荐或请求调查和修补。提供给用户的详细事件信息包括将进一步帮助用户做出关于事件的明智决定并且相应地采取措施的数据。例如,如果系统检测到泄漏并将泄漏事件发送给210,则系统提供来自事件记录的事件数据以及通过地图、图形等对数据的可视化呈现来显示例如对当前实际数值与预测的或过去的数值的比较。例如,一种对事件数据的可视化呈现可以采用图形的形式,该图形显示随事件变化的流动速率并且流动速率增大的部分被突出显示以指示泄漏,以帮助用户集中在事件的重要方面。事件跟踪接口 210的样本截图在图11到图15中被示出。警报接口 211根据预定义的规则或策略进行操作以识别特定事件,这些事件需要通过特定用户所指定的计算机化的设备被指出给特定用户。例如,用户可以通过规则或策略指定具有指定大小的特定事件在被送给用户的电子邮件消息中被发送,而更紧急的或者时间敏感的类型的事件或者具有更大的指定大小的事件通过文本、传呼等被传送到用户的移动电话上。警报接口 211所生成的警报包含关于警报的某些指定数据以帮助用户做出关于事件的明智决定。用户可以就消息本身要包括多少细节以及有多少附加数据可供用户获取来对警报接口 211进行配置,所述获取例如通过到事件跟踪接口 210中的条目的链接。报告接口 212是报告系统,该系统从数据库208获取事件数据并生成各种报告、表格、图标、图形等来图示事件或事件的集合。本领域普通技术人员应当理解,报告接口 212允许用户根据诸如地理、时间、事件类型等之类的任何所需的字段或参数对事件和事件数据进行合并。通过报告接口 212生成的报告允许诸如水网络管理者之类的用户更好地计划未来对他们的网络的修补或改善、仪表的放置或者与操作、设计、库存及其它考虑因素相关的其它决定。专用系统接口 213是与水分配系统的操作者所使用的另一软件程序接口的系统。例如,专用系统接口 213从数据库208中获取事件数据并将该事件数据的全部或指定部分输入到故障单系统中以向维护人员通知泄漏或其它事件。故障报单软件例如Numara 的Track-It! 。作为另一示例,事件数据可以被发送给工作流系统或者资产管理系统(例如IBM公司的Maximo 系统),以使得可以更方便地对事件采取措施。用于向用户报告事件的事件数据被很好地进行分类并且可以被适配以供工业标准接口使用。工作流系统接口的一个示例是 Handysoft 的Bizflow 。此外对于之前描述的任意实施例,单元203-209都可以位于诸如web服务器之类的服务器或服务器组上,并且可以利用应用服务提供商(“ASP”)模型来为接口 209的用户提供经由web接口对警报和报告的访问。图3呈现了说明根据本发明实施例的用于监控水网络的方法的流程图。在步骤301中,系统接收来自或关于水网络的数据,包括网络数据(例如SCADA数据)、GIS数据、操 作数据和来自水分配系统和其它源的外部事件数据。系统可操作用于接收来自相同或其它源的其它类型的数据,并且可以被修改以用相同的分析方法处理这些数据。在一个实施例中,步骤301可以由图I中的单元100来执行,或者更具体地说是由图2中的单元203来执行。接下来,在步骤302中,系统利用这里所描述的统计模型及其它算法对所接收的数据进行分析。在一个实施例中,步骤302可以由图I中的单元100来执行,或者更具体地说是由图2中的单元204-208的任意组合来执行。最后,在步骤303中,系统生成并显示输出,该输出包括事件、警报、报告和图形。在一个实施例中,步骤303可以由图I中的单元106-112来执行,或者更具体地说是由图2中的单元210-214来执行。图4呈现了进一步详细说明根据本发明实施例的用于监控水网络的方法的流程图。在步骤401中,系统接收来自被分析的水网络的数据;该数据包括网络中的仪表的标识和地理位置。接下来,在步骤402中,系统选择要被分析的至少一个仪表。接下来,在步骤403中,系统基于在步骤401中所接收的数据预测数值的可能分布。用于预测数值的可能分布的实施例参考图5被讨论。接下来,在步骤404中,系统在将预测值与实际值进行比较之后确定是否存在统计上显著的数值偏离。用于确定偏离的显著性的实施例参考图2被讨论。如果没有数值的偏离或者偏离不显著,则系统进行到步骤402并选择要分析的下一个目标。然而,如果系统确定数值的偏离是显著的,则系统进行到步骤405并检测到异常。接下来,在步骤406中,系统对事件或事件部分进行分类。接下来,在步骤406a中,系统确定事件或者相关的事件是否存在于数据库中。如果事件或相关事件不存在于数据库中,则系统进行到步骤406b并在数据库中创建事件。然而,如果事件或相关事件存在于数据库中,则系统在步骤406c中更新数据库中之前所存储的事件。为了确定所检测到的事件是否存在于数据库中,系统将所检测到的事件与之前存储在数据库中的活动事件进行比较。活动事件可以是仍在发生的事件,例如之前检测到的尚未被修补的泄漏。在一个实施例中,为了确定仍在活动的事件,系统确定诸如泄漏之类的事件是否已结束。系统通过以下方式确定所检测到的事件是否与之前所存储的事件相关,所述方式即查看事件类型的相似度、所检测到的事件和之前所存储的事件(该之前所存储的事件尚未结束)的开始时间、所检测到的事件和之前所存储的事件的位置或者可能作为相同物理真实世界的事件的替代或部分检测将两个或多个事件关联起米的任何其它数据字段。在一个实施例中,当系统在步骤406c中更新事件时,事件记录仍作为同一事件保留在数据库中,使得监控之前存储的事件的用户将观察被检测到的事件及其对之前存储的事件的状态的影响。接下来,在步骤407中,系统将事件和关联数据提供给能够报告或存储数据的接口或其它系统。在一个实施例中,与事件一起被提供的关联数据是与检测事件相关联的数据。例如,如果系统检测到并分类为泄漏事件,则提供给用户接口的关联数据可以是显示泄漏的位置的地图,以及显示在一段时间内流动速率的差异(该差异促使系统发布事件)的图形。在步骤408中,系统选择下一个监控目标,并且系统继续检测网络中的其它仪表的异常。图5呈现了说明在图4的步骤403中的用于数值预测的方法的流程图。在图5中,系统在步骤501中通过首先选择属性来进行预测。一般来说,属性是数据的集合,例如来自给定仪表的历史数据。历史仪表数据可以包括仪表读数和针对该仪表读数的相应的日期和时间。在一个实施例中,基于来自要分析的仪表的历史数据与来自被选择的相对应的一个或多个仪表的历史数据的紧密相关性,所选择的属性是针对所述相对应的一个或多个仪表 的历史仪表数据。图6描述了基于与来自要分析的仪表的历史数据的紧密相关性确定相应的仪表的一个实施例。接下来,在步骤502中,系统可以根据误差测量(例如利用线性回归和均方根误差(RMSE)测量)来确定所选择属性的最合适的组合。最合适的组合产生关于所选择属性的函数,该函数估计要被预测的数据集。接下来,在步骤503中,系统通过应用步骤502中所得到的函数与来自所选择属性的数据来预测所选择属性的可能值分布。所得到的数据集包括针对仪表的可能值分布。接下来,所得到的数据集从单元205中的预测器到图2的单元206中相应的异常检测器。一般来说,可以通过选择诸如仪表数据集之类的若干属性并将它们组合以产生对为其生成预测的数据集的近似来生成预测。在一个实施例中,“独立的属性选择”,属性选择通过选择每个具有与被分析的数据集的最佳匹配的N个数据集来进行。例如,如果所使用的误差计量是均方根误差(RMSE)并且属性要被进行仿射组合,则被选择的数据集将是每个在最佳匹配仿射变换下就RMSE而言最好地近似了被分析的数据集的数据集。为此,系统为每个数据集找到最合适的参数(就近似被分析的数据集而言),并且记录利用最佳参数的每个数据集所得到的近似误差;系统选择具有最低误差的数据集(最佳匹配)。本领域技术人员将理解,找到最合适的参数可以通过公知的方法来实现,例如线性回归。在另一实施例中,“穷尽属性选择”,属性选择通过探查可用于预测的所有可能的N元组数据集选择使预测误差最小的N个数据集。对于每个N元组,系统找到最合适的参数(来近似被分析的数据集,就诸如RMSE之类的特定误差计量而言),记录所得到的近似误差,并选择具有最低误差(最佳匹配)的N元组。在一个实施例中,“递增属性选择”,属性选择通过一次一个地选择N个数据集,以使得每个增加的数据集在生成已选择的数据集与新的数据集的最合适的组合时实现对近似误差的最大程度的减小。在步骤K+1中,当K个数据集已经被选择时(K<N),系统通过找到最合适的参数并记录针对由K个已选择的数据集与可用于预测的其它数据集中的一个数据集构成的所有K+1个数据集的集合的近似误差,来确定要加入K个数据集的第K+1个数据集;系统选择得到最低误差(最佳匹配)的附加数据集。图7提供了“递增属性选择”的一个实施例的流程图。在步骤701中,系统选择第一数据集或仪表数据以添加到所选择的属性。第一数据集可以基于具有与被分析的仪表数据的高相关性而被选择。接下来在步骤702中,系统通过确定N(组合中的数据集的数目)是否小于K (设计者允许组合的数据集的预定数目)来确定另一数据集合是否应当被添加到数据集中。如果不是,则系统进行到步骤708并进行分析。如果另一数据集合要被添加到数据集中,则系统进行到步骤703并选择第二个数据集合以添加到数据集中。接下来在步骤704中,系统找到针对数据集中的所有数据集合的最合适的参数,然后在步骤705中记录针对数据集中的所有数据集合的近似误差。接下来,在步骤706中,系统确定所添加的数据集是否通过确定最佳匹配参数而实现了最低误差。如果所添加的数据集没有实现最低误差,则系统进行到步骤702。但是,如果第二个数据集合实现了最低误差,则系统进行到步骤707并将第二个数据集合添加到数据集中。然后系统进行到步骤702。
在这些属性选择的实施例中的每一个实施例之后,利用本领域技术人员所熟悉的任意方法(例如线性回归)来进行参数选择,以生成就所使用的误差计量(例如RMSE)而言对所有被选择数据集的最合适的仿射组合。在一个实施例中,几种不同的回归或回归方法被并行使用,并且结果是各个回归结果的中值或平均值或类似的组合。本领域技术人员应当知道,“独立属性选择”是这些实施例中计算速度最快但是最不准确的,“穷尽属性选择”是计算速度最慢但是最准确的,而“递增属性选择”可以提供中等计算速度和中等的准确度。一般来说,可用于生成预测的数据集包括系统所接收到的仪表数据集中的全部或一些,例如所有仪表读数的时间序列和那些数据集的变换(例如仪表读数的时间序列的时间偏移)。在一个实施例中,可用于预测的数据集(属性选择必须从中选出N个数据集的属性)是针对除被分析仪表以外的仪表的数据集,以及针对被分析的仪表及其它仪表的数据集的特定时间偏移。时间偏移对应于数据中所预期的时间周期(例如一天、一周和一年)的倍数。例如,其数据集被考虑的其它仪表可以是整个可用仪表的集合或者测量同一量的仪表的集合(例如流量仪表,如果被分析的仪表是流量仪表),或者只是相距被分析仪表很远的仪表,以使得被分析仪表所登记的本地事件不可能通过网络靠水力传播到这些远端仪表中的任一个上。在一个实施例中,所使用的仪表数据可以是所接收到的原始仪表数据的处理后的版本,并且可以进一步根据整个历史数据在时间上进行限制。例如,用于以上分析的数据集可以是开始于当前时间之前70天且结束于当前时间之前7天、在连续的6小时时间段上计算的平均仪表值(每6个小时每个仪表有一个平均值)。例如,这可以去除由于要被检测的正在发生的效应而造成的任何关于仪表之间的近期差异的不想要的影响;可能存在于很长时间之前(例如在另一季节期间)的任何不相关的差异;以及短暂的一天内的差异。图6呈现了说明用于为相应的仪表预测选择相应数据的方法的流程图。图6示出了以上所提到的选择算法的简单的子情况,其中来自单独仪表的单一数据集被选择作为相应的数据集。这利用了这样的观察信息,即距离较远的仪表通常不会受到相同的局部事件的影响,例如仪表中的一个的泄漏下流,但是可能会类似地受到全局消耗或网络事件的影响(例如温暖的天气或者体育事件),从而防止很多可能的错误警报。在步骤601中,系统选择包括来自仪表的历史数据的第一数据集。历史数据包括压力和流量值以及与压力和流量读数相关联的时间。接下来,在步骤602中,系统选择第二数据集,该第二数据集包括来自仪表的历史数据。在一个实施例中,第二数据集是来自与第一数据集所表示的网络设备物理上不同且在水力上没有很强的连接关系的网络设备的历史数据。例如,第一数据集与位于曼哈顿的仪表相关联,而第二数据集与位于皇后区的仪表相关联。所选择的位置可以是足够远的或者是充分远离被分析的仪表的,以使得数据集不是在水力上有连接关系的,因此不会受相同异常或事件的影响,例如它们的水流动不会受到相同泄漏的影响,一个地方水质量的变化不会影响另一地方等等。但是,虽然第二数据集将不受同一本地水事件的影响,但是两个数据集仍然可能受到同一区域或全局事件的影响,例如温暖的一天或者城市范围的体育事件。在另一实施例中,第二数据集是来自第一数据集所表示的同一仪表的不同时间段的数据集。例如,第一数据集来自仪表1,而第二数据集也来自仪表I但是表示来自三天前的数据。接下来,在步骤603中,系统将第一数据集的历史数据与第二数据集的历史数据进行比较以确定两个仪表之间是否存在很紧密的相关性。相关性可以根据本领域中已知的标准相关技术来确定。一些本领域中已知的现有相关技术在Miles, Jeremy and Shevlin, Mark,Applying Regression and Correlation A Guide for Students and Researchers,Sage Publications Ltd. (2000),ISBN 0761962301 中进行了描述。如果相关值超过预定阈值,则相关性可以被认为是紧密的,在这种情况下系统进行到步骤604。例如,如果所使用的相关性计量是范围是从O到I的R-squared(也称为决定系数),则如果所计算出的R-squared高于预定义的值(例如0. 9),则系统可以将仪表认定为相对应的仪表。在步骤604中,系统确定是否需要另一个相对应的数据集。在一个实施例中,另一相对应的数据集可能被需要以实现更准确的异常检测,并且系统进行到步骤602。如果不再需要相对应的数据集,则系统在步骤605中如参考图5所讨论的那样进行分析。然而,返回到步骤603,在另一示例中,如果相关性值低于阈值,则系统可以认定数据集不是紧密相关的,在这种情况下,系统进行到步骤602并且另一数据集被选择。在一些实施例中,预测器所用的数据可以包括可用于网络分析引擎的其它数据形式,例如操作和外部数据,如上所述。这些数据可以被用于例如进一步限制、增强或划分仪表数据。作为说明,预测器可以利用这些数据以使得只有来自之前节假日(非正常工作日)的数据被用于预测当前节假日的值,或者抵消非季节性天气、已知的网络事件或者临时性网络变化的影响。图8呈现了说明用于检测和登记水泄漏事件的方法的流程图。在步骤801中,系统获得来自水分配系统的经过预处理的数据。接下来,在步骤802中,系统根据N个统计预测模型执行N个统计预测。接下来,在步骤803中,并且对于每个预测器,系统将预测数据与实际数据进行比较以确定是否存在统计上显著的偏离。如果对于特定预测器不存在统计上显著的偏离,则系统进行到步骤807并且没有事件被生成。在步骤807处,系统进行到步骤808以选择来自水网络的另一组仪表数据进行分析。然而,在步骤803中,如果针对特定预测器存在统计上显著的偏离,则系统进行到步骤804并且检测到异常。接下来,在步骤805中,异常可以被分类为根据参考图4提供的示例讨论的事件。例如,如果系统根据不同的预测器模型发布了关于统计上显著的连续流量增加的异常和统计上显著的短期压力减小(后面跟着压力修正)的异常,则这些异常在步骤805中被分类为泄漏事件的开始。在稍后的时间点处,如果系统检测到类似大小的相应的流量降低异常,则该异常被分类为该泄漏事件的结束。在步骤805中对偏离进行分类的另一种方法是利用外部数据来确认或驳斥步骤804中所检测到的异常。例如,如果进行分析的那一天是节假日,在这一天中例如住宅用水模式可能有显著变化,则相对于预测数据的较大的统计偏离可以提高识别漏水事件所需要的统计阈值。在另一示例中,体育事件可能触发网络中的一个区域中的水消耗的增加,并且系统可以被配置以利用该信息作为外部数据来确认或驳斥事件的存在。在其它实施例中,系统可以通过对产生异常的数据应用附加限制来驳斥所检测到的异常。例如,系统或网络操作者可以决定仅对应于这样的泄漏提供警报,所述泄漏越过了特定的大小阈值、偏离预期值的持续时间超过了指定的时间段或者在一段时间内以特定的频率发生。系统检测泄漏的敏感性可至少部分取决于用户确定的大小阈值或者泄漏至少持续了指定的时间段。
接下来,在步骤806中,系统登记诸如泄漏之类的事件并且还提供所检测到的泄漏的特征。所述特征可以包括泄漏的大小、泄漏增加的趋势或速度和至今泄漏的总水量。泄漏警报和泄漏的特征可以被存储在图2中的类似数据库的单元208中,并且还可以在图2的输出210-214中的任一个上被再现。在步骤806中登记事件之后,系统进行到步骤808以选择来自网络的另一组仪表数据进行分析。图9呈现了说明用于检测故障仪表异常的方法的流程图。在步骤901中,系统选择要分析的数据集。单元902和905-909表示各种预测器和异常检测器,确定实际和预测值的任何偏离的统计显著性。本领域技术人员将理解每个单元902和905-909或者这些单元的任意组合可以被用于确定可能值和发布异常。此外,系统可以通过同时或按任意顺序相继执行这些单元的任意组合来进行操作。继续图9中的流程图所示的实施例,单元902所表示的预测器和异常检测器确定是否存在被传送值的统计上的显著偏离,超过了可以用真实网络事件可以解释的,例如泄漏。单元903-905所表示的预测器和异常检测器确定当第一数据集与第二数据集相关时,是否存在统计上显著的时钟飘移偏离。预测器和异常检测器通过在步骤903中选择参考数据集或多个数据集,然后在步骤904中将第一数据集与参考数据集相关来进行操作。参考数据集可以包括通常具有与被分析仪表有紧密相关性的值的一个或多个仪表。接下来,系统进行到步骤905以通过寻找产生最佳相关性的时间偏移来确定仪表是否表现出统计上显著的时钟飘移。如果仪表确实表现出时钟飘移(即,如果最佳时间偏移与O有显著差异),则系统进行到步骤910并发布故障仪表事件。单元906所表示的预测器和异常检测器确定是否是固定值被发送。系统确定是否是固定值或者不随时间变化的数据在步骤904中被发送。如果仪表在非常长的时间内发送固定、基本固定或者经常固定的值,则系统进行到步骤910并且发布故障仪表事件。单元907所表示的预测器和异常检测器确定短期波动是太高还是太低。如果短期波动太高或太低,则系统进行到步骤909并且发布故障仪表警报。单元908所表示的预测器和异常检测器确定是否存在相对于通常被发送数据量的统计上的显著偏离。如果远少于或远多于通常数据量的数据量被发送,则系统产生异常。例如,如果三天内仪表都没有发送数值,则系统产生异常。然而,如果预测发送的数据量与实际发送的数据量之间的偏离不是统计上显著的,则不产生异常。单元909所表示的预测器和异常检测器确定数值是否不被其它网络仪表支持。例如,质量守恒可能指示第一流量表处的读数必须比在其下行的第二流量表的读数或者若干其它仪表读数的总和大。如果这种“不可能的”值被发现,则系统进行到步骤910并发布故障仪表事件。在步骤910中发布事件之后,系统在步骤911中选择下一个目标进行分析并且继续分析网络中的其它故障仪表。图10图示了描述用于提供无预期消耗或盗用异常的实施例的流程图。单元1003-1005表示各种预测器和异常检测器,确定实际和预测值的任何偏离的统计显著性。本领域技术人员将理解每个单元1003-1005或者这些单元的任意组合可以被用于确定可能值和发布异常。此外,系统可以通过同时或按任意顺序相继执行这些单元的任意组合来进 行操作。在步骤1001中,系统选择水网络中的仪表以分析无预期的水消耗或水盗用。在另一实施例中,系统选择水网络的一部分或者整个水网络来分析无预期的水消耗或水盗用。接下来,在步骤1002中,如果系统检测到所选择仪表或网络分区的流量增加,则系统继续进一步对异常进行分类,如单元1003-1005所表示的。在一个实施例中,系统可检测超过历史仪表数据的流量增加并应用参考图2讨论的统计分析。在另一实施例中,系统可以通过分析来自仪表的实时数据来检测流量的增加。单元1003所表示的预测器和异常检测器确定是否存在与消耗模式的统计上显著的流量增加匹配。在步骤1003中,系统可以利用之前存储的消耗模式分析当前流量增加。之前存储的消耗模式可以包括去年或任意其它时间帧的仪表或网络数据以方便实现关于确定消耗模式的分析。如果流量增加与消耗模式匹配,则系统进行到步骤1006以确定事件是否可以用另一因素解释。单元1004所表示的预测器和异常检测器确定是否存在类似时间中的统计上显著的流量增加的再次发生。例如,系统分析仪表或系统的历史数据以确定消耗模式的周期性。如果存在再次发生的流量增加并且这在过去没有进一步发生,则系统进行到步骤1006以确定事件是否可以用另一因素来解释。单元1005所表示的预测器和异常检测器确定是否存在统计上显著的每次具有相似大小的再次发生的流量。在一个实施例中,系统将流量增加的时段与仪表或网络的其它历史流量数据进行比较以确定在再次发生的时段中流量大小的增加是否几乎是固定的。如果系统检测到每次都有相似的大小,并且这在过去没有再发生过,则系统进行到步骤1006以确定事件是否可以用另一因素解释。在步骤1006中,系统确定所检测到的事件是否可以被外部或操作数据驳斥。在一个示例中,系统分析操作数据以确定是否存在到要分析的地址点的授权进入。在另一示例中,如果在一个仪表处的流量增加和相同区域的另一仪表处有对应的相似大小的流量降低指示有流量的变化但是该区域中的总消耗不变,则系统驳斥所检测到的事件。如果在步骤1006中系统没有驳斥所检测到的事件,则在步骤1007中系统提供无预期或未授权的消耗或盗用事件。然而,如果系统驳斥了事件,则系统进行到步骤1008.接下来,在步骤1008中,系统选择下一个目标进行分析并且继续分析网络中的其它无预期或未授权的消耗或盗用事件。图11图示了描述用于提供水质量异常警报的实施例的流程图。在步骤1101中,系统选择来自第一地址点的数据集进行分析。单元1103,1104和1106表示各种预测器和异常检测器,确定实际和预测值的任何偏离的统计显著性。本领域技术人员将理解每个单元1103,1104和1106或者这些单元的任意组合可以被用于确定可能值和发布异常。此外,系统可以通过同时或按任意顺序相继执行这些单元的任意组合来进行操作。单元1103所表示的预测器和异常检测器确定在步骤1102中所选择的至少两个地址点中是否存在统计上显著的氯含量、浑浊度或PH的变化,所述变化超过水网络管理者所设定的预定阈值。系统可以在步骤1102中选择至少两个或多个相邻地址点。所选择的多个地址点还可以帮助系统更准确地预测水质量异常。如果系统在步骤1103中检测到变化,·则系统进行到步骤1105以决定事件是否应当被报告。单元1104所表示的预测器和异常检测器确定在来自所选择地址点的所选择仪表处是否存在统计上显著的浑浊度增加,并且如果是,则系统进行到步骤1105以决定事件是否应当被报告。单元1106所表示的预测器和异常检测器确定在相同地址点处是否存在统计上显著的氯含量降低。如果在该地址点处存在氯含量的降低,则系统进行到步骤1105以决定事件是否应当被报告。在步骤1105中,系统接收来自单元1103,1104和1106的事件并确定事件应当被报告还是被取消。取消事件的一个原因是如果存在统计上显著的压力下降、流量增加或者到步骤1101中所选择的地址点的授权进入。在一个实施例中,到该地址点的授权进入可以包括建筑人员对该地址点的修缮,这可能导致在所选择仪表处暂时的浑浊度升高。显著的短期压力下降例如可能指示泄漏事件或网络干扰,这应当被当作是看上去是质量异常的事件的根本原因。然而,因为修缮可能是相对简单的,所以系统可能不希望由于临时的修缮而发出异常警报,并且系统进行到步骤1108以选择另一数据集进行分析。如果系统没有检测到压力下降、流量增加或者到该地址点的授权进入,则系统进行到步骤1107并且提出水质量事件。在步骤1107中提出事件之后,系统在步骤1108中选择下一个目标进行分析,并继续分析网络的其它水质量事件。本领域技术人员将理解其它实施例可以类似地在考虑可能暂时影响其它水质量参数和指示符的网络事件或活动的情况下处理其它水质量参数和指示符。图12图示了根据本发明实施例的事件跟踪接口所生成的用户接口( “Π”)的屏幕截图。图12中的屏幕向用户显示检测到的事件和它们的关联信息。用户可以例如是任务为监控待分析水网络的水设施网络的工人。图12包括Π屏幕截图1201,该截图包括用于更新状态的区块1202、事件列表板1203、图形1204、事件信息1205、图形1206和地图1207。在一个实施例中,UI 1201是用户通过网络或互联网可浏览的web页面。此外,更新状态1202通知用户系统监控水网络的异常的最后日期和时间。事件列表板1203向用户提供之前检测到的事件的列表、事件的日期、时间、位置和状态。此外,事件列表板1203还允许个人查看用户接口 1201以选择事件列表板1203中的事件。与所选择事件相关联的详细信息被再现为事件信息1205、图形1204和1206以及地图1207。事件信息1205包括例如异常的开始时间、异常的结束时间、异常的大小、与异常相关联的总水损失量以及系统用户所给出的任何评论。用户或系统所给出的评论还可以提供到系统所存储的其它事件的超链接。图形1204和1206包括关于用户所选择的事件的详细信息,例如在相关仪表处的实际和预测(日常)水流量的可视比较。此外,用户接口 I 201利用与所选择事件相关联的GIS数据在地图1207上显示事件的位置。在一个实施例中,事件与特定仪表相关联,并且仪表的位置在地图1207上被示出。事件地图1207还被使得限制受被删除事件影响的网络的区域,或者其中统计上可能包含确切的事件位置的估计区域。图2中的数据库208或者甚至是事件确定和分类引擎207可以支持交互式软件应用,该应用将仪表数据、警报、报告、统计分析和水网络的地图与用户接口关联起来以允许系统的用户很容易地辨认水泄漏或其它事件的位置。用户接口可以置于数据库208上,并且被呈现给单元209所表示的任意个接口。在另一实施例中,事件确定和分类引擎207可操作为将信息直接发送给单元210,21 1,212,213,214。图13图示了根据本发明的一个实施例的事件跟踪接口所生成的UI的屏幕截图。 图13中的屏幕向用户显示检测到的事件和它们的关联信息。用户可以例如是任务为监控待分析水网络的水设施网络的工人。图13包括Π 1301,该Π包括事件列表板1302、图形1303和1304、地图1305和事件信息1306。在一个实施例中,UI 1301是用户通过网络或互联网可浏览的web页面。此外,事件列表板1302向用户提供之前检测到的事件的列表、事件的日期、时间、仪表位置和状态。此外,事件列表板1302还允许个人查看UI 1301以选择事件列表板1302中的事件。与所选择事件相关联的详细信息被再现为事件信息1306、图形1303和1304以及地图1305。用户接口 1301利用与所选择事件相关联的GIS数据在地图1305上显示事件的位置或近似位置。在一个实施例中,地图1305可操作为显示登记事件的多个仪表的位置。图14图示了根据本发明的一个实施例的事件跟踪接口所生成的另一Π的屏幕截图。图14中的屏幕显示与检测到的事件或者被选择的仪表或网络的区域相关联的数据。用户可以例如是任务为监控待分析水网络的水设施网络的工人。更具体而言,图14给出了图形模块,该模块呈现出系统所收集的数据并允许用户进一步探查、定制和修改系统针对每个事件所提供的图形或者通过各种可视方式且利用系统的一些预处理功能独立地探查数据。图14包括Π 1401、仪表列表和图形控制面板1402、图形1403和更新状态1404。在一个实施例中,UI 1401是用户通过网络或互联网可以浏览的web页面。Π 1401的用户可以从仪表列表和图形控制面板1402中选择一个或多个仪表和各种图形类型。与所选择仪表相关联的数据可以在图形1403中被产生。图形1403中产生的数据可以是系统所获得的任何信息。更新状态1402通知用户系统监控水网络的异常的最后日期和时间。图15图示了根据本发明的一个实施例的报告接口所生成的Π的屏幕截图。图15中的屏幕向用户显示所检测到的事件及其关联信息的总体概览。用户例如可以是任务为监控待分析的水网络的水设施网络的工人。图15包括Π1501、概览选择面板1502、事件计数面板1503和1504、地图1505和图形1506。在一个实施例中,UI 1501是用户通过网络或互联网可浏览的web页面。此外,概览面板1502为用户提供显示在所选择时间段内的事件合集的选项。用户可以基于仪表值、事件、日期和事件的状态来选择对事件的显示。与概览选择面板1502中的用户选择相关联的详细信息被再现为事件计数面板1503和1504、地图1505和图形1506。概览选择面板1502允许用户根据事件的各个字段和特征对事件进行分类和过滤,例如只查看近期未解决的事件、根据类型分类的事件,并且更新事件状态和其它工作流程的特征。这遵循本领域技术人员所公知的软件工业标准。事件计数面板1504和1505根据时间段显示事件的数目、事件类型和位置。在一个实施例中,事件计数面板1504和1505显示与不同时间段相对应的事件,允许用户比较和对照随时间变化的网络行为。地图1505显示区域内正在发生或之前已经发生的事件的位置及其它信息。在一个实施例中,地图显示事件并突出显示具有多个事件的区域具有较少事件的位置可以被显示为绿色,而具有很多事件的位置可以被显示为红色。图形1506操作为显示在一段时间内事件的数目和类型的变化。在一个实施例中,图形1506显示在两个连续月份期间发生的事件的类型和数目,例如允许用户比较和分析近期趋势。本领域技术人员将理解系统所收集的任何信息可以在图形1506上被再现以更好地帮助用户监控水分配网络。
图I到15是用于说明本发明的概念性图示。应当理解本发明的实施例的各个方面可以用硬件、固件、软件或者它们的组合来实现。在这些实施例中,各个组件和/或步骤将用硬件、固件和/或软件来实现以执行本发明的功能。就是说,同一个硬件、固件或软件模块可以执行所图示的方框(例如组件或步骤)中的一个或多个。还应当理解本发明不仅应用于水设施网络,还应用于任何类型的分配系统。其它类型的分配系统可以是汽油、废水或污水、天燃气、电、电报或者涉及从一个区域到消费者的液态或流动资源的其它能力传送系统。实际上,本发明可以被应用于具有在网络中的任意位置处的测量诸如流量、压力、质量或数据流动本身之类的分配参数的仪表或传感器的任何分配或收集系统。在软件实现方式中,计算机软件(例如程序或其它指令)和/或数据作为计算机程序产品的一部分被存储在机器可读介质上,并经由可移除存储驱动、硬盘驱动或通信接口被装载到计算机系统或其它设备或机器中。计算机程序(也被称为计算机控制逻辑或计算机可读程序代码)被存储在主和/或次存储器中,并且由一个或多个处理器(控制器等)执行以使得这一个或多个处理器执行如这里所描述的本发明的功能。在该文档中,术语“机器可读介质”、“计算机程序介质”和“计算机可用介质”被用于总地指代诸如随机访问存储器(RAM)、只读存储器(ROM)、可移除存储单元(例如磁盘或光盘、闪存设备等等)、硬盘等之类的介质。注意,以上的附图和示例不是为了将本发明的范围限制为单个实施例中,因为通过变换所描述或所图示的单元中的一些或全部可以实现其它实施例。此外,本发明的某些单元可以用已知的组件部分或全部实现,这些已知组件中只有那些对于理解本发明所必要的部分被进行了描述,而为了不混淆本发明,这些已知组件中的其它部分的详细描述被省略了。在本说明书中,显示单一组件的实施例不必被限制为不同于包括多个同一组件的其它实施例,反之亦然,除非这里另外明确说明。此外,申请人不希望说明书或权利要求中的任何术语被理解为不常见的或者特殊的意思,除非这里明确提出的。此外,本发明包括这里通过图示所指出的已知组件的现有和未来的已知等同物。
关于具体实施例的以上描述充分揭示了本发明的总体本质,其它人通过应用相关领域中的知识可以在不脱离本发明的总体概念的情况下不需要过多的实验就可以容易地修改和/或适配这些具体实施例以用于各种应用。因此,基于这里所给出的教导和引导,这些适配和修改被认为是在所公开实施例的等同物的意思和范围内的。虽然以上已对本发明的各种实施例进行了描述,但是应当理解这些实施例都是作为示例进行描述的,而 非限制性的。相关领域的技术人员将明白在不脱落本发明的精神和范围的情况下可以做出形式和细节上的各种改变。因而,本发明不应当被上述任一示例性实施例所限制,而是应当仅根据权利要求及其等同物来限定。
权利要求
1.一种用于监控水设施网络的计算机化的方法,所述水设施网络至少包括用于将水传送给消费者的管道的网络和位于所述水设施网络内的多个仪表,所述方法包括 接收仪表数据,所述仪表数据表示由所述仪表测得的多个参数,所述参数至少包括流经所述管道的水的流量或压力; 接收来自所述仪表外部的一个或多个源的二级数据,所述二级数据表示影响所述水设施网络所服务的区域中的水流量或消耗的一个或多个条件; 通过基于来自所述水设施网络的第二仪表数据和二级数据统计预测针对第一仪表的仪表数据来分析仪表数据,其中所述第二仪表数据包括不同于所接收到的第一仪表数据的仪表数据,并且将所接收到的第一仪表数据与针对所述第一仪表预测的仪表数据进行比较,以通过检测异常识别一个或多个水设施网络事件,所述事件包括至少一个或多个泄漏事件,所述异常发生在所接收到的第一仪表数据相对于针对所述第一仪表的预测仪表数据偏离统计偏离量的情况下;并且 将所述一个或多个水网络事件经由用户接口报告给用户。
2.根据权利要求I所述的方法,包括将所述水网络事件存储在数据库中。
3.根据权利要求I所述的方法,其中接收仪表数据包括接收监测控制和数据采集(SCADA)数据。
4.根据权利要求I所述的方法,包括将所述异常归类为泄漏事件。
5.根据权利要求I所述的方法,其中检测所述异常包括确定所述异常的持续时间是否超过预定义的阈值。
6.根据权利要求I所述的方法,其中检测所述异常包括确定在预定义的时间窗口内的所述异常的频率是否超过预定义的阈值。
7.根据权利要求I所述的方法,其中基于来自所述水设施网络的第二仪表数据统计预测针对第一仪表的仪表数据包括选择一个或多个第二仪表作为一个或多个相应的仪表并且将从所述第一仪表接收到的仪表数据与从所述一个或多个相应的仪表接收到的仪表数据相关联。
8.根据权利要求7所述的方法,其中选择一个或多个第二仪表作为所述一个或多个相应的仪表包括将针对所述一个或多个第二仪表的历史仪表数据与针对所述第一仪表的历史仪表数据相关联;并且选择存在与所述第一仪表的关联的所述一个或多个第二仪表。
9.根据权利要求7所述的方法,其中选择所述一个或多个第二仪表作为所述一个或多个相应的仪表包括标识出所述水设施网络内的所述一个或多个第二仪表,所述第二仪表位于所述水设施网络内以不受影响所述第一仪表的异常的影响。
10.根据权利要求I所述的方法,其中基于来自所述水设施网络的第二仪表数据统计预测针对所述第一仪表的仪表数据包括将从所述第一仪表接收到的仪表数据与至少所存储的针对所述第一仪表的历史仪表数据相关联。
11.根据权利要求I所述的方法,其中统计预测针对所述第一仪表的仪表数据包括计算针对所述第一仪表的可能值的统计分布。
12.根据权利要求20所述的方法,其中接收仪表数据包括在一段时间中接收表示在所述网络上传送的水的浑浊度、氯含量和pH的水质量数据,并且其中识别一个或多个网络事件包括检测在一段时间内所述水质量数据的变化超过阈值。
13.根据权利要求I所述的方法,其中接收二级数据包括接收以下数据中的至少一个 表示在所述水设施网络的区域内的天气条件的天气数据; 表示影响给定日期的水消耗的一个或多个因素的日历表数据; 表示在所述水设施网络上执行的一个或多个修补的修补数据;以及 表示所述水设施网络的结构的结构数据。
14.根据权利要求20所述的方法,其中所述一个或多个信息事件包括以下项中的至少一个消耗模式中的无预期的增加、消耗模式中的变化、水的盗用、地带边界突破、设施仪表故障和网络设备故障。
15.根据权利要求I所述的方法,包括在分析所述仪表数据之前对所述仪表数据进行处理,包括从所述仪表数据中滤出噪声。
16.一种用于监控水设施网络的计算机化的系统,所述水设施网络包括用于将水传送给消费者的管道的网络和位于所述水设施网络中的多个仪表,所述系统包括 网络信息数据库,用于存储表示由所述仪表测得的多个参数的仪表数据和来自所述仪表外部的一个或多个源的二级数据,所述参数至少包括经过所述管道的水的流量或压力,所述二级数据表示影响所述水设施网络所服务的区域中的水流量或消耗的一个或多个条件; 分析引擎,被配置为通过基于来自所述水设施网络的第二仪表数据和二级数据统计预测针对第一仪表的仪表数据来分析所述仪表数据,并将所接收到的第一仪表数据与针对所述第一仪表预测的仪表数据进行比较以识别异常,其中所述第二仪表数据包括不同于所接收到的第一仪表数据的仪表数据; 事件分类引擎,被配置为基于所述异常识别水设施网络事件,所述水网络事件包括泄漏事件;以及 事件数据库,用于存储表示由所述事件分类引擎识别的所述一个或多个水网络事件的水设施网络事件数据。
17.根据权利要求16所述的系统,其中所述分析引擎包括用于生成针对给定仪表的仪表数据的可能值的统计分布的多个预测器模块,以及用于将针对所述给定仪表的仪表数据与可能值的分布进行比较以检测仪表数据中的异常的多个异常检测器模块。
18.根据权利要求16所述的系统,包括多个接口模块,用于从所述事件数据库中获取水设施网络事件数据并将其报告给用户。
19.一种用于管理水设施网络的计算机化的方法,所述水设施网络包括用于将水传送给消费者的管道的网络和位于所述水设施网络中的多个仪表,所述方法包括 将仪表数据发送给分析引擎,所述仪表数据表示由所述仪表测得的多个参数,所述参数至少包括经过所述管道的水的流量; 从所述分析引擎接收表示水设施网络事件的数据,所述水网络事件包括泄漏事件,作为通过基于来自所述水设施网络的第二仪表数据和二级数据统计预测针对第一仪表的仪表数据而对仪表数据进行分析的结果,所述水设施网络事件数据已被识别,所述二级数据表示影响所述水设施网络所服务的区域中的水消耗或流量的一个或多个条件,其中所述第二参数数据包括不同于所接收到的第一仪表数据的仪表数据,并且将所接收到的第一仪表数据与所预测的针对所述第一仪表的仪表数据进行比较以识别异常;以及在计算机化的显示设备上将所接收到的水设施网络事件显示给用户。
20.根据权利要求I所述的方法,其中所述水网络事件还包括识别关于流经所述管道的水的水量和质量以及所述水设施网络的运转的一个或多个信息事件。
全文摘要
本发明提供了一种用于监控水设施网络的计算机化的方法,所述水设施网络包括用于将水传送给消费者的管道的网络和位于水分配网络上的管道内的多个仪表。该方法包括接收表示由仪表测得的参数的仪表数据,所述参数例如通过管道被分配的水的流量、压力、氯含量、pH和浑浊度。该方法还包括接收来自仪表外部的源的二级数据,并且表示影响水设施网络所服务的区域中的水消耗的状况,例如天气和节假日。仪表数据和二级数据利用统计技术被分析以识别水网络事件,所述水网络事件包括泄漏事件和关于流经管道的水的水量和质量以及水网络的操作的其它事件。这些事件经由用户接口被报告给用户。
文档编号G01L7/00GK102884407SQ201180022619
公开日2013年1月16日 申请日期2011年3月3日 优先权日2010年3月4日
发明者埃米尔·佩莱格, 哈盖·斯科尔尼克夫, 尤里·巴莱, 阿米塔·阿蒙, 夏伊·冈特 申请人:塔卡度有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1