本发明涉及一种基于分级指标的分布式电网业务监控方法,属于电网业务监控领域。
背景技术:
随着电网发展速度的加快和企业规模的增长,电网的安全性以及对其业务系统的运营状况进行分析监测显得尤为重要,经常出现运营监测滞后、电力服务不合理、电力服务系统堵塞、崩溃等状况,缺少一种对分布式电网业务进行合理有效监测的方法,需要建立一套具有客观性性、准确性以及高安全性的综合监测评价指标体系,对分布式电网业务进行实时监控,提供一种具有系统安全性、综合性、前瞻性的电网业务监控方法。
技术实现要素:
本发明要解决的技术问题是提供一种基于分级指标的分布式电网业务监控方法,该方法利用决策树id3算法对数据进行训练集、测试集按比例分类进行模拟测试的特点,解决对电网业务监测指标设定分类不客观、不合理的问题,利用蚁群算法进行全局参数选优的特点,解决各项指标阈值选取不合理、产生局部最优解等问题。
本发明采用的技术方案是:一种基于分级指标的分布式电网业务监控方法,所述方法步骤如下:
step1、分别在各电网业务模块部署网络探针设备(简称np),该设备利用深度包检测技术(简称dpi)和深度流检测技术(简称dfi)采集各模块访问量、点击率、浏览量等实时业务数据,并将实时数据同步至后台云端监测服务器,便于后台对各模块实时业务数据进行统一分析处理;
step2、因后台同步所得各模块访问量、点击率、浏览量等实时数据,是在基于不同指标下所采集到的业务数据,故这些数据在经济含义、计量单位以及业务水平方面有较大差异,无法在这些数据间直接进行运算,需要利用电网业务指标与无量纲化指标间呈现出的线性关系采用直线型无量纲化方法对step1中采集的各电网业务模块实时监测数据进行统一处理,便于后续数据分析;
各指标数据分内正向指标数据与逆向指标数据,对数据进行无量纲化处理通常需要先将各指标数据压缩至[0,1]的区间内,消除量纲的影响,对数据进行无量纲处理正向指标和逆向指标标准化处理;
正向指标标准化公式为:
逆向指标标准化公式为:
上述公式中
step3、为体现监测结果的客观真实性以及其价值意义,运用决策树id3算法对step2中已经过无量纲化处理的各业务模块访问量、点击率、浏览量等实时数据进行分类处理;设s是s个实时电网业务数据样本的集合,首先将经无量纲化处理的实时电网业务数据定义为m个不同的类ci=(i=1,2,…m),si是类ci中对应的样本数,可计算出给定样本分类所需的信息熵i(s1,s2,…sm):
上式中pi为s个数据样本中任意一数据样本属于类ci的概率,即:pi=si/s,由于信息编码中常用到二进制表示数据,因此对数函数中以2作为底数
假设属性x具有n个不同取值,构成有关属性x的取值集合{x1,x2,……xn},若采用属性x对电网业务数据样本集合s的数据样本进行子集划分,构成集合{s1,s2,……sn},集合中存在子集sj在属性x上具有相同的值xj(j=1,2,……,v),v为相同值样本数,且xj∈s;若sij为子集sj中ci的数据样本数,则由属性x划分成子集的信息熵为:
其中
上式中
gain(x)=i(s1,s2,…sm)-e(x)
若信息增益gain(x)增加则代表信息的不确定性减少程度最大,则该属性作为电网业务监测指标更具合理性和客观性。因此在进行电网业务监测指标分类时以该指标的信息熵e(x)最小和信息增益gain(x)最大作为最优分类标准进行电网监测业务指标分类。
step4、在step3中已经以业务监测指标分类标准为根据对电网业务监测指标进行了分类处理,为保证每项指标的数据监测准确性以及其客观公正性,在每项电网业务监测指标下设置分级指标,通过对该项业务监测指标下的一级指标和二级指标概率值构建安全因素矩阵,然后对各项指标的安全因素矩阵进行幂值运算求得该项指标的风险指数,结合该项指标的风险指数以及step3中的信息熵e(x)和信息增益gain(a)对其进行去全面综合的评定;
各项电网业务指标风险指数由第1层因素集fa与第2层因素集fab构成,即:
第1层因素的构成为
fa(a=1,2,3)={指标f1,指标f2,指标f3}
第2层因素的构成是fab,即:fa={fab}(b=1,2,…,ε)。
f1={f11,f12,f13,f14}
f2={f21,f22,f23,f24}
f3={f31,f32,f33,f34}
最终构建出各项指标的安全因素矩阵
从而风险指数fσ=fε,其中fσ为该项监测指标的风险指数,ε为第二层因素数量值。
step5、运用蚁群算法在参数选优过程中可避免局部最优解的特性,对step4中已进行过分级处理的各项电网业务监测指标下的业务数据进行阈值设定,若监测指标类ci下的业务数据样本数为l,各项监测指标阈值k按照比例规则选择下一业务数据,由数据a1到下一数据a2的选择概率
上式中
上式中
其中
阈值k按照上述最优路径在各项监测指标的全局的数据范围内进行数据选择,并利用信息素更新规则避免数据重复选择,从而进行参数选优得各项监测指标阈值k。
step6、结合step5中计算得出的各项电网业务监测指标阈值k,建立指标群阈值雷达图,如图3所示,图中阴影部分为各项监测指标阈值k联合构建的阈值预警区域。
本发明的有益效果是:本发明首先在各业务模块部署探针,保证数据采集的全面性,其次对所采集各业务模块实时数据进行无量纲化处理消除量纲的影响,以便后续对数据的使用,然后运用决策树id3算法对经无量纲化处理的数据进行训练集、测试集按比例分类进行模拟测试的特点,解决对电网业务监测指标设定分类不客观、不合理的问题,并进行指标分级处理保持指标计算稳定性,接下来利用蚁群算法对经分类分级处理的各电网业务指标下的数据进行全局参数选优设定阈值,解决各项指标阈值选取不合理、产生局部最优解等问题,使得监测结果客观公正、可信度高、可操作性强,最后结合各指标阈值构建指标阈值雷达图,科学合理的对业务系统进行监测。
附图说明
图1为本发明的流程图;
图2为本发明的分级指标关系图;
图3为本发明的指标群阈值预警雷达图。
具体实施方式
下面结合附图和具体实施方式,对本发明做进一步的说明。
实施例1:如图1所示,一种基于分级指标的分布式电网业务监控方法,所述方法步骤如下:
step1、分别在各电网业务模块部署网络探针设备(简称np),该设备利用深度包检测技术(简称dpi)和深度流检测技术(简称dfi)采集各模块访问量、点击率、浏览量等实时业务数据,并将实时数据同步至后台云端监测服务器,便于后台对各模块实时业务数据进行统一分析处理;
step2、因后台同步所得各模块访问量、点击率、浏览量等实时数据,是在基于不同指标下所采集到的业务数据,故这些数据在经济含义、计量单位以及业务水平方面有较大差异,无法在这些数据间直接进行运算,需要利用电网业务指标与无量纲化指标间呈现出的线性关系采用直线型无量纲化方法对step1中采集的各电网业务模块实时监测数据进行统一处理,便于后续数据分析;
各指标数据分内正向指标数据与逆向指标数据,对数据进行无量纲化处理通常需要先将各指标数据压缩至[0,1]的区间内,消除量纲的影响,对数据进行无量纲处理正向指标和逆向指标标准化处理;
正向指标标准化公式为:
逆向指标标准化公式为:
上述公式中
step3、为体现监测结果的客观真实性以及其价值意义,运用决策树id3算法对step2中已经过无量纲化处理的各业务模块访问量、点击率、浏览量等实时数据进行分类处理;设s是s个实时电网业务数据样本的集合,首先将经无量纲化处理的实时电网业务数据定义为m个不同的类ci=(i=1,2,…m),si是类ci中对应的样本数,可计算出给定样本分类所需的信息熵i(s1,s2,…sm):
上式中pi为s个数据样本中任意一数据样本属于类ci的概率,即:pi=si/s,由于信息编码中常用到二进制表示数据,因此对数函数中以2作为底数
假设属性x具有n个不同取值,构成有关属性x的取值集合{x1,x2,……xn},若采用属性x对电网业务数据样本集合s的数据样本进行子集划分,构成集合{s1,s2,……sn},集合中存在子集sj在属性x上具有相同的值xj(j=1,2,……,v),v为相同值样本数,且xj∈s;若sij为子集sj中ci的数据样本数,则由属性x划分成子集的信息熵为:
其中
上式中
gain(x)=i(s1,s2,…sm)-e(x)
若信息增益gain(x)增加则代表信息的不确定性减少程度最大,则该属性作为电网业务监测指标更具合理性和客观性。因此在进行电网业务监测指标分类时以该指标的信息熵e(x)最小和信息增益gain(x)最大作为最优分类标准进行电网监测业务指标分类。
step4、在step3中已经以业务监测指标分类标准为根据对电网业务监测指标进行了分类处理,为保证每项指标的数据监测准确性以及其客观公正性,在每项电网业务监测指标下设置分级指标,通过对该项业务监测指标下的一级指标和二级指标概率值构建安全因素矩阵,然后对各项指标的安全因素矩阵进行幂值运算求得该项指标的风险指数,结合该项指标的风险指数以及step3中的信息熵e(x)和信息增益gain(a)对其进行去全面综合的评定;
各项电网业务指标风险指数由第1层因素集fa与第2层因素集fab构成,例如某电网业务监测指标类ci的风险指数构成为(如图2所示):
第1层因素的构成为
fa(a=1,2,3)={一级风险指标f1,一级风险指标f2,一级风险指标f3}
第2层因素的构成是fab,即:fa={二级风险指标fab}(b=1,2,…,ε)。
f1={f11,f12,f13,f14}
f2={f21,f22,f23,f24}
f3={f31,f32,f33,f34}
最终构建出监测指标类ci的安全因素矩阵
从而风险指数fσ=fε,其中fσ为该项监测指标的风险指数,ε为第二层因素数量值。
step5、运用蚁群算法在参数选优过程中可避免局部最优解的特性,对step4中已进行过分级处理的各项电网业务监测指标下的业务数据进行阈值设定,若监测指标类ci下的业务数据样本数为l,各项监测指标阈值k按照比例规则选择下一业务数据,由数据a1到下一数据a2的选择概率
上式中
上式中
其中
阈值k按照上述最优路径在各项监测指标的全局的数据范围内进行数据选择,并利用信息素更新规则避免数据重复选择,从而进行参数选优得各项监测指标阈值k。
step6、结合step5中计算得出的各项电网业务监测指标阈值k,建立指标群阈值雷达图,如图3所示,图中阴影部分为各项监测指标阈值k联合构建的阈值预警区域。
本发明的工作原理是:首先在各电网业务模块部署探针采集各类实时数据,然后对所采集数据进行无量纲化处理,便于后续数据分析,其次运用决策树id3算法以及构建安全因素矩阵对经无量纲化处理数据对应的各电网业务模块监测指标进行分类、分级处理,建立客观公正的电网业务指标监测体系,接下来利用蚁群算法对经分类分级处理的各监测指标下的数据进行全局参数选优设定指标阈值,解决各项指标阈值选取不合理、产生局部最优解等问题,最后结合已设定好的阈值构建指标群阈值预警雷达图,以便科学合理地对电网业务系统各业务模块进行实时监测,监控各电网业务服务器繁忙程度,对服务器资源进行合理调度,解决因某一业务领域访问拥塞,而造成整个业务系统停止运营甚至崩溃的问题。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。