一种基于电力数据网全息评估系统及其故障定位方法与流程

文档序号:14993347发布日期:2018-07-20 22:57阅读:254来源:国知局

本发明涉及电力数据网故障定位技术领域,尤其涉及一种基于电力数据网全息评估系统及其故障定位方法。



背景技术:

随着社会与经济的不断发展,电力数据网的发展也极为迅速,尤其是电力数据网故障定位技术的发展已经达到一定高度,现有这些技术有效避免和降低了电力数据网故障带来的损失,为人们提供可靠的用电环境,方便了人们的生活。电力数据网要求的风险预警时效性较普通网络更高,所要求的故障定位时间也更短,传统的网管技术所采用的被动采集网络数据的方法已经无法满足电力数据网的需求,需要研究如何利用主被动探针等多种探测方式实现网络业务质量的主动监测和实时监控,以提高风险预警的时效性。

针对现有的风险预警方法发现风险耗时较长,故障定位技术需要借助维护人员的经验判断,效率较低的技术问题,本发明提出了一种基于电力数据网全息评估系统及其故障定位方法。



技术实现要素:

针对现有技术中存在的问题,本发明提出了一种基于电力数据网全息评估系统及其故障定位方法,对网络业务质量进行实时跟踪分析,从而实现电力数据网业务质量的高精度风险预警与故障定位。

本发明提供了一种基于电力数据网全息评估系统,所述系统包括数据探测部、数据预处理部、数据分析部、数据应用部以及平台部,其中,所述数据探测部用于通过部署各类主动和/或被动测量探针,完成对多维度细粒度网络和业务质量数据的原始采集,包括对电力数据网骨干网络、接入网络、以及数据中心的网络及业务性能数据及流量数据的采集;

所述数据预处理部,根据分析需求完成对所采集数据的预处理,并将数据入库;所述数据预处理部,用于实现数据预处理配置、数据预处理过程和数据预处理管控,所述数据预处理配置为数据预处理过程提供了操作依据;所述数据预处理过程包括通过格式转换单元、数据翻译单元和数据衍生单元分别完成格式转换、数据翻译和数据衍生功能,所述数据预处理管控为预处理过程提供调度、监控、异常控制和统计功能;

所述数据分析部,包括多维数据融合分析单元,用于对经过预处理的数据进行多维数据融合分析;所述多维数据融合分析,通过对智能探针捕获的数据包经过预处理后进行分析,并借助于数据包到达序列和状态等信息,利用协议识别的结果,分别通过各单元模块完成网络层性能分析、传输层性能分析、应用层性能分析和通用业务性能分析;

所述数据应用部,用于利用所述数据分析部输出的数据完成各种应用,所述数据应用部,包括完成基于风险容忍度模型的电力数据网风险预警功能的风险预警单元,完成基于风险容忍度模型的电力数据网故障定位机制的故障定位单元和完成全网业务质量动态可视化的可视化单元;

所述平台部,用于搭建一个系统平台,承载上述所有功能,所述平台部采用模块化和分层方式实现。

优选地,所述格式转换单元,用于解析源数据与目标数据之间的不同数据存储格式以及确定相应的存储格式之间的转换规则,所述数据翻译单元,通过从源数据到目标数据的映射规则,实现数据翻译;所述数据衍生单元,用于对原始信息分析并结合业务规则进行衍生获得信息。

优选地,所述数据分析部,在完成应用层业务性能分析的过程中,还将实现应用业务溯源,以实时动态追溯某一个具体应用层业务的完成过程,记录每一个步骤上的响应时间,进而针对数据、语音、视频、多媒体以及其他电力数据网业务的具体特性,完成对多维度细粒度数据的性能分析工作。

优选地,所述风险预警单元,通过学习网络异常判断与处理的知识,如异常流量模型的参数,实现将从探针获取的网络实时数据与网络异常知识进行匹配,判断是否产生异常流量;如果发现异常流量,则按照事先设定的处理规则进行相关处理,并提出告警;同时,与数据库进行交互,更新异常流量模型的参数,产生新规则;其中,所述风险预警单元能够根据历史流量信息自动调整异常流量模型,以实现异常流量的自适应检测。

优选地,所述可视化单元,通过计算机图形技术和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理,从而实现通过图像来揭示数据中隐含的有效信息;其可视化分析结果可通过各种布局方式来体现,包括正交布局和辐射布局。

优选地,所述平台部为电力数据网智能探测及全息评估平台,包括:物理层、采集层、预处理层、管理层、分析层和展示层,其中,物理层为基础设施层,该层部署电力数据网的各类设备与链路,属于被监测被管理的对象;采集层为数据采集层,该层部署各类主被动测量探针,完成对多维度细粒度网络和业务质量数据的原始采集,包括对电力数据网骨干网络、接入网络、以及数据中心的网络及业务性能数据及流量数据的采集;预处理层根据分析需求完成对所采集数据的预处理,并将数据入库;管理层为探测控制功能层,该层完成探针管理、监测任务调度、测量策略管理等功能;分析层为分析和评估功能层,该层完成各层流量和协议分析、性能分析、性能测试,以及业务流量特征分析等功能,并完成风险预警、故障检测与定位功能;展示层为界面呈现层,该层完成整个平台系统的配置管理和界面展示功能;存储层完成对各类网络和业务质量采集数据及相关分析数据的入库存储;接口层完成与数据网综合网络管理系统之间的接口交互;在各层之间,将采用统一的安全通信机制,实现对各层功能间互访时的认证、压缩和安全传输功能。

除此之外,本发明还公开了一种应用于上述基于电力数据网全息评估系统的故障定位方法,所述方法包括以下步骤:

步骤1:选择探测路径形成探测集;

步骤2:发送探测进行故障检测;

步骤3:对故障检测的探测结果进行分析;

步骤4:基于主动探测进行故障定位;

其中,所述探测路径为由探测站点向其他节点所产生的路径,所选的探测路径需要满足覆盖网络中的所有节点,且所述探测路径为最少探测路径;

所述发送探测进行故障检测包括以下步骤:

步骤21:首次初始化时探测集合为空,否则执行步骤22;

步骤22:基于探测依赖矩阵建模,计算每个节点对应的列向量的权值;

步骤23:得出经过每个节点的探测数,找出被最少探测经过的节点;

步骤24:计算上述被最少探测经过的节点的所有探测的行向量权值,并进行降序排列,找出覆盖最多尚未被覆盖节点的探测;

所述对故障检测的探测结果进行分析包括以下步骤:

步骤31:收集探测结果,进行分析判断;

步骤32:若探测成功,则认为成功探测经过的所有节点均为正常节点,并将这些节点加入正常节点集合;

步骤33:若有节点之前被判定为可疑节点,将其从可疑节点集合中删除;

步骤34:若探测失败,则失败探测路径上所有之前未被判定为正常节点的节点均为可疑节点,并加入可疑节点集合;

步骤35:若一条失败探测所经过的所有节点中,仅有一个节点为可疑节点,其他节点都被某些成功探测经过,那么该可疑节点即为故障节点,并被加入故障节点集合。

优选地,所述基于主动探测进行故障定位包括以下步骤:

步骤41:从备选探测集合里面选取满足使得可疑节点数尽量减少的探测;

步骤42:基于探测依赖矩阵建模,对故障检测再次进行分析;

步骤43:若只覆盖一个可疑节点的探测测试结果返回失败,则表明该可疑节点为故障节点;

步骤44:若覆盖可疑节点的探测测试结果返回成功,则表明这些可疑节点为正常节点;

其中,所述备选探测集合为未被作为探测的探测集合,在故障检测阶段表示除了故障检测集合以外的可用探测集合,在故障定位阶段表示除了故障检测集合和之前故障定位探测以外的可用探测集合。

优选地,所述步骤44中,还需要把可疑节点从可疑节点集合中删除,并加入正常节点集合;之后对所有的前面探测失败的探测集合重新进行判定。

优选地,所述探测的方法包括触发对相关网络设备的信息查询和连通性检测,并结合网络设备信息自动触发主动网络性能探测。

本发明实施例的技术方案提供了一种基于电力数据网全息评估系统及其故障定位方法,本发明实施例的技术方案具有以下显著效果:

本发明提出了一种基于电力数据网全息评估系统及其故障定位方法,通过该全息评估系统及故障定位方法解决了现有的风险预警方法发现风险耗时较长,故障定位技术需要借助维护人员的经验判断,效率较低的技术问题,在需要探测时,能快速地完成探测,并进行定位,降低发现风险的时长,提高效率。

附图说明

图1为本发明实施例一的电力数据网智能探测及全息评估系统图;

图2为本发明实施例二多维数据融合分析过程示意图;

图3为本发明电力数据网故障定位方法的流程示意图;

图4为本发明电力数据网故障定位方法中故障检测的流程示意图;

图5为本发明电力数据网故障定位方法中对探测结果进行分析的流程示意图;

图6为本发明电力数据网故障定位方法中故障定位的流程示意图;

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在现有的风险预警及故障定位方法中发现风险耗时较长,故障定位技术需要借助维护人员的经验判断,效率较低的技术问题;针对上述问题,本发明提出了一种基于电力数据网全息评估系统及其故障定位方法。

实施例一、电力数据网智能探测及全息评估系统

如图1所示,为本发明实施例一的电力数据网智能探测及全息评估系统图,本发明提供了一种基于电力数据网全息评估系统,所述系统包括数据探测部1、数据预处理部2、数据分析部3、数据应用部4以及平台部5,其中,所述数据探测部1用于通过部署各类主动和/或被动测量探针,完成对多维度细粒度网络和业务质量数据的原始采集,包括对电力数据网骨干网络、接入网络、以及数据中心的网络及业务性能数据及流量数据的采集。

所述数据预处理部2,根据分析需求完成对所采集数据的预处理,并将数据入库;所述数据预处理部2,用于实现数据预处理配置、数据预处理过程和数据预处理管控,所述数据预处理配置为数据预处理过程提供了操作依据,包括预处理规则配置和预处理方式配置;所述数据预处理过程可以根据配置功能提供的规则、方式、频度等内容进行具体操作,其包括通过格式转换单元21、数据翻译单元22和数据衍生单元23分别完成格式转换、数据翻译和数据衍生功能,所述数据预处理管控为预处理过程提供调度、监控、异常控制和统计功能;

所述数据分析部3,包括多维数据融合分析单元31,用于对经过预处理的数据进行多维数据融合分析;所述多维数据融合分析,通过对智能探针捕获的数据包经过预处理后进行分析,并借助于数据包到达序列和状态等信息,利用协议识别的结果,分别通过各单元模块完成网络层性能分析、传输层性能分析、应用层性能分析和通用业务性能分析功能;

所述数据应用部4,用于利用所述数据分析部输出的数据完成各种应用,所述数据应用部4,包括完成基于风险容忍度模型的电力数据网风险预警功能的风险预警单元41,完成基于风险容忍度模型的电力数据网故障定位机制的故障定位单元42和完成全网业务质量动态可视化的可视化单元43;

所述平台部5,用于搭建一个系统平台,承载上述所有功能,所述平台部采用模块化和分层方式实现。

优选地,所述格式转换单元21,用于解析源数据与目标数据之间的不同数据存储格式以及确定相应的存储格式之间的转换规则,所述格式转换包括数据类型转换,数据精度转换,空值判断处理,字符串处理,日期格式处理;所述数据翻译单元,通过从源数据到目标数据的映射规则,实现数据翻译;所述数据衍生单元,用于对原始信息分析并结合业务规则进行衍生获得信息。

优选地,所述数据分析部2,在完成应用层业务性能分析的过程中,还将实现应用业务溯源,以实时动态追溯某一个具体应用层业务的完成过程,记录每一个步骤上的响应时间,进而针对数据、语音、视频、多媒体以及其他电力数据网业务的具体特性,完成对多维度细粒度数据的性能分析工作。

优选地,所述风险预警单元41,通过学习网络异常判断与处理的知识,如异常流量模型的参数,实现将从探针获取的网络实时数据与网络异常知识进行匹配,判断是否产生异常流量;如果发现异常流量,则按照事先设定的处理规则进行相关处理,并提出告警;同时,与数据库进行交互,更新异常流量模型的参数,产生新规则;其中,所述风险预警单元41能够根据历史流量信息自动调整异常流量模型,以实现异常流量的自适应检测。

优选地,所述可视化单元43,通过计算机图形技术和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理,从而实现通过图像来揭示数据中隐含的有效信息;其可视化分析结果可通过各种布局方式来体现,包括正交布局和辐射布局。

(1)正交布局可视化技术

正交布局要求在布局选择位置的时候都要按照垂直或者水平的方向对齐摆放,其布局方式规整,与人类视觉习惯相匹配。

针对数据网网络节点之间的拓扑层级关系、业务特征分类等可使用该图进行直观展现,当数据量大时可通过鼠标滚动操作来查看。

(2)辐射布局可视化技术

辐射式布局的主要特点是根节点位于圆心的位置,其他节点根据其所处于的层次分别放置于不同半径的同心圆上面,能够满足随着图形节点随层级增加而增加的特点。针对按照应用类别、协议类别等对数据流量进行统计分析的场景可使用该辐射布局图进行直观展现。

实施例二、多维数据融合分析

如图2所示为本发明实施例二多维数据融合分析过程示意图;所述多维数据融合分析单元31,用于对经过预处理的数据进行多维数据融合分析;所述多维数据融合分析,通过对智能探针捕获的数据包经过预处理后进行分析,并借助于数据包到达序列和状态等信息,利用协议识别的结果,分别通过各单元模块完成网络层性能分析、传输层性能分析、应用层性能分析和通用业务性能分析功能;

具体如下:数据包或流表进入网络层性能分析单元32处理之后,依次经过传输层性能分析单元33、应用层性能分析单元34和通用业务性能分析35进行分析处理,然后输出给不同的业务性能分析单元进行分析,主要包括:数据业务性能分析单元301、语音业务性能分析单元302、视频业务性能分析单元303、多媒体业务性能分析单元304、扩展业务性能分析单元305;其中,还包括协议识别模块38输出协议结果a和解码模块37输出解码结果b给应用层业务溯源单元34,而流表维护模块36分别输出流数据c和d分别给传输层性能分析单元33和网络层业务性能分析单元32,同时,网络层性能分析单元32、传输层性能分析单元33、应用层性能分析单元34和通用业务性能分析35分别输出结果给监测结果管理模块39进行管理,从而完成多维数据分析过程。

实施例三、数据预处理

数据预处理功能主要包括数据预处理配置和数据预处理过程(etl)、数据预处理管控三大部分,数据预处理配置为数据预处理过程提供了操作依据,数据预处理过程可以根据配置功能提供的规则、方式、频度等内容进行具体操作,数据预处理管控为预处理过程提供调度、监控、异常控制和统计。

a)数据预处理配置

数据预处理配置是数据处理中重要的实现环节,涉及到多个系统来源和数据处理技术,需要针对不同来源,不同质量的源数据制定灵活的处理策略,以支撑灵活的数据预处理,包括预处理规则配置和预处理方式配置。

预处理规则是在数据预处理过程中,各个阶段对数据处理的约束和要求,对数据的来源和操作明确需要遵循的规定,数据预处理规则的配置包括如下内容:

数据的清洗规则配置:针对源数据存在的准确性和完整性问题,根据数据质量评估方法,制定相应的过滤规则,以便筛选出不符合要求的数据,记录数据质量问题,以供日后进行查询统计。数据的准确性是指各对象类型数据的关键属性或信息是符合规定制值,包括值符合规定的枚举值、规定的字符长度、规定的字符串类型、规定的取值范围。数据的完整性是指各对象类型数据的关键属性或信息是否完整。所进行评价的关键属性或信息不为空,则视为完整;所进行评价的关键属性或信息为空,则视为不完整。

数据转换的规则配置:设定源数据的数据格式转换规则,对探测的原始数据和目标融合模型之间建立映射转换关系。通过规则的指引,将原始源数据转换为统一的目标数据格式。

数据的关联关系配置:由于各主题域分散在不同业务系统中,为加强数据之间的关联特性,识别出同一对象在不同主题域中的活动情况,可通过主题域之间的关联关系,建立数据与数据之间的关系,从而得到对象的完整反映。以设备为例,设备在通信资源数据模型中存在设备基本信息、设备承载业务信息、设备配置信息;该设备通过资产编号,在台帐数据模型中存在物理属性信息,资产履历信息;该设备通过资产编号,在工程数据模型中能找到设备所在工程的基本信息,工程流程信息;设备通过资产编号,可找到设备在事件数据模型中的缺陷、告警、故障等工单数据。通过以上关联关系,可将分散数据联系为一个有机整体,强化了对象的整体性。

b)数据预处理过程

根据预处理规则进行数据预处理时,对不符合要求的数据,将判断的结果通过预处理任务管控,形成数据检查任务。不符合要求的数据主要包含不完整的数据、错误的数据和重复的数据三大类。其中:不完整数据指由于一些应该有的信息缺失或数据的关联关系、承载关系不完整;错误的数据指由于解析错误或人工误操作导致,在错误数据输入时没有进行判断直接写入数据库;重复的数据指由于数据模型存在不足,主键或者约束有缺陷,或由于消息预处理过程存在错误导致的重复数据。

经过数据符合性检查后,需要对数据进行转换预处理,数据转换包括格式转换、数据翻译、数据衍生、数据聚合等。多数情况下,数据预处理过程主要是完成格式转换、数据翻译、数据衍生,而复杂的数据聚合以及其他复杂计算主要在数据汇总时实现。数据转换功能应支持数据的定义、数据结构和错误数据的转换处理。数据转换主要包括以下几个部分:

格式转换:由于数据源系统与通信大数据系统之间在数据模型、数据格式等方面可能存在较大差异或者数据源系统本身提供的数据缺乏规整性,为了使得预处理后续环节能够以简单一致的方式进行处理,需要解析源数据与目标数据之间的不同数据存储格式以及确定相应的存储格式之间的转换规则。格式转换包括数据类型转换,数据精度转换,空值判断处理,字符串处理,日期格式处理等。

数据翻译:是数据预处理中最复杂的处理过程,在数据翻译的过程中必须深刻的了解和认识源数据信息,识别异常数据情况,建立从源数据到目标数据的映射规则。在映射的过程中,有些信息是直接可以从源数据得到的,如0代表性别女,1代表性别男等。而有些并不能从源数据直接得到,需要对源数据进行一定的计算、合并、拆分等翻译操作。针对每个数据源以及数据目标,要为通信大数据的每个数据实体确定从数据源到目的表的转换(翻译)规则,这部分内容包括具体到源系统的一张或多张表的哪些字段对应到目标数据的一张或者多张表的哪些字段,以及相对应的转换规则如何等。

数据衍生:通信大数据系统中的数据围绕企业的生产运营分析应用,因此存在大量的上下文信息,源系统的数据需要提炼出来才能为通信大数据系统所使用。通信大数据的上下文信息提炼是在数据的标准化处理(清洗)之后,进行数据的衍生信息的处理。通信大数据分析应用中所要求的数据在生产系统中并不直接存在,而是需要通过对原始信息分析并结合业务规则衍生获得的信息,因此需要对原始信息进行衍生信息处理。

最后,将预处理后的数据入库,以便于后续的数据挖掘和分析工作。

实施例四、电力数据网智能探测及全息评估平台

(1)平台系统结构

所述平台部5为电力数据网智能探测及全息评估平台51,包括:物理层、采集层、预处理层、管理层、分析层和展示层,其中,物理层为基础设施层,该层部署电力数据网的各类设备与链路,属于被监测被管理的对象;采集层为数据采集层,该层部署各类主被动测量探针,完成对多维度细粒度网络和业务质量数据的原始采集,包括对电力数据网骨干网络、接入网络、以及数据中心的网络及业务性能数据及流量数据的采集;预处理层根据分析需求完成对所采集数据的预处理,并将数据入库;管理层为探测控制功能层,该层完成探针管理、监测任务调度、测量策略管理等功能;分析层为分析和评估功能层,该层完成各层流量和协议分析、性能分析、性能测试,以及业务流量特征分析等功能,并完成风险预警、故障检测与定位功能;展示层为界面呈现层,该层完成整个平台系统的配置管理和界面展示功能;存储层完成对各类网络和业务质量采集数据及相关分析数据的入库存储;接口层完成与数据网综合网络管理系统之间的接口交互;在各层之间,将采用统一的安全通信机制,实现对各层功能间互访时的认证、压缩和安全传输功能。

(2)平台系统基本功能及扩展功能

电力数据网智能探测与全息评估平台系统,主要基本功能包括:

探针管理:完成对主被动探针的统一调度和管理功能;

监测任务管理:完成对主被动探测任务的管理,包括探测任务的创建、删除、查询、修改、停止等功能;

策略管理:完成对主被动测量策略的管理,包括策略的制定、修改、查询等功能;

流量分析:完成对各类业务流量的多层次多维度分析功能;

业务质量分析:完成对各类业务质量的多角度差异化分析功能;

风险预警:根据探测数据完成对业务质量的风险预警功能;

故障检测与定位:根据探测数据完成对数据网网络故障的检测和定位功能。此外,本系统中还将实现数据网网络管理的部分功能,包括:

资源管理功能:完成对电力数据网资源数据的获取和基本管理功能。

vpn管理功能:完成vpn业务信息查看功能和vpn业务发现功能,根据定期自动获取的各pe设备上rt信息进行匹配,从而自动发现三层mplsvpn信息,得到网络中mplsvpn的拓扑情况。

路由协议分析功能:实现对电力数据网骨干pe路由器设备动态路由协议的全面监测,实时、自动发现全网路由协议的工作状况,并对重要的路由事件进行追踪,模拟。

与通信管理系统(tms)对接及数据共享功能:本系统将实现与通信管理系统(tms)的对接,通过标准接口向通信管理系统tms提供实时的流量数据,并根据tms的配置,完成流量采集周期的设定和流量数据的同步等功能。

(3)智能探测与评估平台的并行优化技术

在平台研发过程中,为了提高系统平台面向电力数据网的处理能力和实时响应能力,本课题还将研究平台系统的并行优化技术。基于多处理器平台的线程级并行技术是提高计算机系统性能的首选方案。多处理器架构根据处理器间互连方式的不同可分为:松耦合多处理器架构和紧耦合多处理器架构。前者常见于各大型计算的场合如各类集群系统。本课题较为关注后者,尤其是以cmp(多核处理器)为代表的紧耦合多处理器架构,这是一类相对轻量级却又不失高效性的解决方案。cmp可以看作一个集成了多个核的soc芯片。每个核有自己的ll级数据缓存(cache)与指令缓存(cache);各个核共享l2级缓存或有自己独立的l2级缓存,通过硬件实现同步。

随着多核处理器以及多处理器平台技术逐渐成熟,通过软件多线程提升性能成为目前的研究热点。采用多线程技术可以使硬件资源得到更加充分的利用,从而达到提高计算性能的目的。线程(thread)是一些相关指令的离散序列。线程与其他指令序列的执行相互独立。每个程序至少包含一个线程,即主线程。主线程负责程序的初始化工作,并且执行初始指令。随后,主线程会为执行各种不同任务而分别创建其他的线程。从硬件层次上讲,线程是一条与其他硬件线程执行路径相互独立的执行路径。操作系统的工作是将软件线程映射到硬件执行资源上。因为多线程技术支持多个操作同时执行,所以能够显著提高程序性能。但是,多线程同时也使得应用程序行为变得更加复杂,根本原因在于:程序会同时发生多个动作。对这些同时发生的动作以及它们之间的交互进行管理需要考虑到以下四个方面:同步、通信、负载均衡和可扩展性。

实施例五、基于电力数据网全息评估系统的故障定位

如图3所示为基于电力数据网全息评估系统的故障定位方法的流程示意图,基于智能探测的电力数据网故障检测与定位机制主要基于主动探针探测技术,该发明分为三个部分:1.探针部署位置的选择;2.探测路径的选择;3.基于主动探测的故障诊断。其中探测路径的选择又分为两部分:故障检测探测的选择和故障定位探测的选择。

(1)故障探测的主动探针选择

如图4所示,为本发明基于电力数据网全息评估系统故障定位方法中故障检测的流程示意图;故障检测的目的是检测网络中是否存在故障,所选的测试路径需要满足覆盖网络中的所有节点。由探测站点向其他所有节点产生的探测路径便形成了所有可用探测集,在故障检测探测阶段,需要在可用探测集合中选择出一部分探测路径作为故障检测集合,故障检测集合的选取需满足以下条件:所选的测试路径覆盖网络中的所有节点;测试路径尽量少。

故障检测的探测选择问题是一个二分覆盖问题,已被证明是np完全问题,常用的基本方法是基于贪心算法的近似算法,目前常见的贪心策略求解思路有两种:一是贪心增加算法:设初始化探测集合为空,不断选取能够覆盖最多的尚未被覆盖节点的探测,直到所有节点都被覆盖;二是贪心减少算法:将所有探测的全集设为初始化探测集合,不断尝试删除某个探测,只需判定该探测的删除不会导致某些节点不被覆盖,直到探测集合中没有这样的冗余探测为止。

虽然这两种算法选择出的探测集合都能覆盖到网络中的所有节点,但是选择出来的探测集合并不一定是最小的探测集合。相对于贪心增加算法,贪心减少算法存在着较多的不确定性,本课题拟针对贪心增加算法做改进,以提高算法的性能。

改进算法在开始选择时,不是首先选择覆盖最多节点的探测,而是先挑选出被最少探测覆盖的节点,再从能覆盖到该节点的探测中选出覆盖最多节点的探测。在探测依赖矩阵中,每一列向量对应一个节点被探测经过的状态,计算每个节点对应的列向量的权值,可以得出经过每个节点的探测数,在找出被最少探测经过的节点后,可以通过计算经过它的所有探测的行向量的权值,并进行降序排列,来找出覆盖最多尚未被覆盖节点的探测,如此循环,直到所有的节点均被覆盖。

(2)故障定位的主动探针选择

图5为本发明基于电力数据网全息评估系统故障定位方法中对探测结果进行分析的流程示意图;在故障检测阶段的工作完成后,需要对探测结果进行分析,如若检测到故障的存在,则会进行故障定位阶段的探测选择,目的是定位故障的根源,为达到该目的,需要发送合适的探测来获取更多的信息。

首先对故障检测的探测结果进行分析。若探测成功,则认为成功探测经过的所有节点均为正常节点,并将这些节点加入正常节点集合nnn(normalnode),若有节点之前被判定为可疑节点,将其从可疑节点集合中删除;若探测失败,则失败探测路径上所有之前未被判定为正常节点的节点均为可疑节点,并加入可疑节点集合n步骤n(步骤u步骤piciou步骤node);若一条失败探测所经过的所有节点中,仅有一个节点为可疑节点,其他节点都被某些成功探测经过,那么该可疑节点即为故障节点,并被加入故障节点集合nfn(faultnode)。

然后,通过对故障检测阶段探测返回结果的分析,我们可以得出正常节点集合,可疑节点集合以及故障节点集合。图6所示,为本发明基于电力数据网全息评估系统故障定位方法中故障定位的流程示意图;可疑节点集合作为状态不确定的节点集合,将成为故障定位阶段的探测目标。目前故障定位阶段的探测选择方法有两大类:预先选择探测方式和交互式选择探测方式。前者一次性选择出所有故障定位探测集合,发送到网络中并接收探测结果,预先选择的方式对网络施加固定的负荷,虽然这种方式计算过程比较简单,但是对所有的探测执行如此方式是极其低效的;交互式的探测方式是每次根据上一次探测结果自适应地选择下一个探测,这样可以有效减少所需执行探测的数量,从而得到更好的时效性和更低的额外网络负载,但计算过程往往异常复杂。本课题拟选择交互式探测思路来设计故障定位探针选择算法。

故障定位阶段的探测选择要求选择一个新的探测,该探测将要使得可疑节点集合中的节点数量尽量减少。该阶段探测选择的建模也是探测依赖矩阵,和故障探测阶段的探测选择不同的是,本阶段的探测选择是从备选探测集合(未被作为探测的探测集合,在故障检测阶段表示除了故障检测集合以外的可用探测集合,在故障定位阶段表示除了故障检测集合和之前故障定位探测以外的可用探测集合)里面选取满足使得可疑节点数尽量减少的探测,所以本阶段的探测必须覆盖可疑节点。

对于减少可疑节点有以下两种情况:一种情况是若只覆盖一个可疑节点的探测测试结果返回失败,则表明该可疑节点为故障节点;二是若覆盖可疑节点的探测测试结果返回成功,则表明这些可疑节点为正常节点。需要注意的是面对第二种情况时,还要考虑由于把这些可疑节点从可疑节点集合删除,加入正常节点集合之后,之前测试集合中结果返回失败且覆盖多个可疑节点的探测可能现在只含有一个可疑节点了,需要对所有的然后失败的探测集合重新进行情况一的判定。

在一个优选实施例中,所述故障定位方法基于电力数据网业务质量评估指标体系及全息评估模型进行,采用主被动探针对网络与业务质量进行联合探测,并采用多维联合分析技术,对网络业务质量进行实时跟踪分析,从而实现电力数据网业务质量的高精度风险预警。

优选地,所述主动探测的方法包括触发对相关网络设备的信息查询和连通性检测。

优选地,所述主动探测的方法包括触发对相关网络设备的信息查询和连通性检测,并结合网络设备信息自动触发主动网络性能探测。

优选地,所述电力数据网故障定位以后,基于主动探测进行故障诊断,并进行风险预警。

优选地,所述电力数据网故障定位基于电力数据网智能探测及全息评估平台进行。

在一个优选的实施例中,电力数据网风险预警技术应能够学习网络异常判断与处理的知识如异常流量模型的参数,能够将从探针获取的网络实时数据与网络异常知识进行匹配,判断是否产生异常流量。如果发现异常流量,则按照事先设定的处理规则进行相关处理,并提出告警。同时,与数据库进行交互,更新异常流量模型的参数,产生新规则。

风险预测模型能够根据历史流量信息自动调整异常流量模型,以实现异常流量的自适应检测。但是,对于异常流量判定阈值的设定,还需要对被监测网络的流量特征进行长时间的学习或研究,才能确定最佳阈值。

异常流量有许多可能的来源,包括新的应用系统与业务上线、计算机病毒、黑客入侵、网络蠕虫、拒绝网络服务、使用非法软件、网络设备故障、非法占用网络带宽等。网络流量异常的检测方法包括四类:统计异常检测法、基于机器学习的异常检测方法、基于数据挖掘的异常检测法和基于神经网络的异常检测法等。本课题将以时间序列模型为基础,研究探测数据的时间相关性,然后结合方差计算设定置信区间,运用马尔科夫过程模型,通过分析状态转移矩阵来对网络状态的变化进行预测,从而实现对电力数据网网络和业务质量的风险预警。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1