本发明属于电网维护,具体是一种支撑配网故障主动抢修的分级预测与预警方法。
背景技术:
故障抢修是供电服务的核心业务,传统的配电网抢修模式是被动抢修,即故障后由用户拨打95598报修电话开始,电网公司接到报修后,安排所处片区的抢修队伍进行处理。受到技术手段的限制,管理部门仅能掌握报修情况、维修人员数量和出勤情况,对故障报修的趋势没有预测预警,难以在客户报修之前获知报修趋势并采取精准抢修预案,抢修效率不能保证。此外,由于缺少对抢修态势的量化分析,抢修资源只能按经验固定配置,一旦某区域抢修力量不足,就会导致维修时间大大延长,影响客户的正常用电。
技术实现要素:
为了解决上述问题,本发明提供了一种支撑配网故障主动抢修的分级预测与预警方法,可以根据历史数据和实时数据,提前预测故障发生的类型和概率,并按照严重和紧急程度进行分级,从而提前调配维修人员,提高维修效率,提升电网运行质量。
本发明采用以下技术方案:一种支撑配网故障主动抢修的分级预测与预警方法,其特征在于,所述的方法包括以下步骤:
步骤101:获取客户历史数据;
步骤102:预处理历史数据;
步骤103:生成基准编码;
步骤104:获取实时一级预警数据;
步骤105:生成一级预警编码;
步骤106:判断一级预警编码与基准编码是否相似,若是,发出一级预警并进入下一步,若否,返回步骤104;
步骤107:获取实时二级预警数据;
步骤108:生成二级预警编码;
步骤109:判断二级预警编码与基准编码是否相似,若是,发出二级预警并进入下一步,若否,返回步骤104;
步骤110:获取实时三级预警数据;
步骤111:生成三级预警编码;
步骤112:判断三级预警编码与基准编码是否相似,若是,发出三级预警并返回步骤104,若否,直接返回步骤104。
进一步的,所述的步骤102中,预处理历史数据的具体方法为:利用Storm实现过滤筛选和数据规划,然后将处理后的数据存储在HBase中。
进一步的,步骤103、105、107、111中,编码的生成均采用哈希算法。
进一步的,哈希算法生成编码的具体过程为:
1)输入以下参数:hashcode位数k,视图数m,客户数n,客户相似度客户特征向量
2)结合算法HashingCodeLearning(k,m,n,),输出以下参数:客户总体哈希编码U,各视图权重α,各视图哈希函数
3)初始化
4)构建连接矩阵
5)构建拉普拉斯矩阵(Dp)-1/2LP(Dp)-1/2,p=1,2,...,m,判断是否收敛,若收敛,进入7),若未收敛,进入6);
6)循环以下计算过程:
计算得到
计算得到
计算得到矩阵
计算得到矩阵H(α)的k个对应特征值最小的特征向量;
根据特征向量生成哈希编码矩阵U;
计算得到
使用二次规划算法得到α;
返回U,α;
7)在得到连续化哈希编码之后,对其进行二值化,得到每一位取值为-1或1的哈希编码。
进一步的,步骤104中,实时一级预警数据至少包括以下数据:客户报修倾向数据、历史重过载数据、历史故障数据、历史停电数据、历史天气数据。
进一步的,步骤107中,实时二级预警数据至少包括以下数据:实时重过载数据、停电发布漏报数据。
进一步的,步骤108中,生成的二级预警编码中包含一级预警数据和二级预警数据。
进一步的,步骤110中,实时三级预警数据至少包括以下数据:OMS故障停电数据、实时停电数据、电流突变数据、预报天气数据、客户物联网监控数据。
进一步的,步骤111中,生成的三级预警编码中包含一级预警数据、二级预警数据、三级预警数据。
本发明的有益效果是:
1、由于客户量巨大,我们面对的数据具有很高的维度;同时,不同类型的数据(如报修倾向、历史故障、历史天气等)决定了我们需要提取不同类型的特征和属性。在这样的背景下,我们选择采用多视图哈希方法来处理。用哈希方法能够提高寻找到相似状态客户的速度,这样就可以对相似的客户采用相同的判断结果——预警或不预警,从而提高计算效率。
2、根据不同电力故障对于客户本身和周边电网的影响,将电力故障划分为三级,一级为最弱,三级为最强,从而可以根据问题严重性合理分配处理的优先级,尽量确保电网整体运行的质量。
附图说明
图1是本发明方法的流程示意图。
具体实施方式
如图1所示的一种支撑配网故障主动抢修的分级预测与预警方法,所述的方法包括以下步骤:
步骤101:获取客户历史数据,包括往年跨部门跨业务的95598、营销、用采、PMS、OMS、EMS、配网自动化等电力数据和天气、客户物联网监控数据。
步骤102:预处理历史数据,首先对客户数据进行预处理,包括过滤筛选、数据规划等,这个过程可以利用Storm这一开源实时处理与计算技术;对预处理后的数据,我们使用HBase存储。
步骤103:生成基准编码,采用哈希算法来实现,在哈希算法应用的过程中,需要考量的环节和要素如下:
1、数据归一化
我们所拥有的每个客户Pi的数据可以用向量来表示,即[x1,x2,...,xn],其中xi分别依次表示报修倾向、历史重过载、历史故障等。由于数据排布分散,比如每个客户的历史报修次数可以从0到n不等,我们需要将数据进行归一化。本方案中我们采用min-max标准化,也称为离差标准化,是对原始数据的线性变换,使结果映射到[0,1]之间。转换函数为:
2、相似性保留
哈希编码在该系统中的主要作用是提高寻找相似客户的速度。因此,客户数据中所体现的客户之间的相似度必须在学习得到的哈希编码中保留,即相似度保留。
为了保留相似度,我们可以用如下的哈希编码带权距离和来衡量相似度保留的程度:其中权值代表客户i和客户j在视图p中的相似度,由视图p中的客户数据计算而得。哈希编码之间的距离||ui-uj||2用汉明距离(Hamming Distance)进行衡量。
可以发现,一旦存相似客户的对应哈希编码之间距离较大的情况,上示公式结果会明显增加。为了最大程度保留相似度,我们需要使上示公式的结果最小化。我们采用拉普拉斯特征映射(Laplacian Eigenmap)的方法对公式进行变换,为每个视图p定义一个n×n的对角矩阵,该矩阵对角线上的元素如此,公式转换为
3、一致性
除了保留相似度,我们还想到,所得到的多视图哈希编码应该与由各视图单独生成的哈希编码的组合之间存在紧密的联系,因此模型的另一个目标是减少总体哈希编码与各单视图哈希编码组合之间的距离。我们为每一个视图学习一个哈希函数参数矩阵Wp。总体哈希编码与单视图哈希编码组合之间的距离可以表示为同时为了防止过拟合的发生,还需要引入一个参数正则项
除了上述要求之外,对于哈希编码本身,我们需要使最终得到的编码每一位为1或-1,且概率相同,编码各位之间也不能相关,即UUT=I。综上所述,本模型最终的目标函数为
由于上式是一个多约束优化问题,想要直接求最小值比较困难,我们先将问题松弛化,再转换为正则化最小二乘问题求解。
最终,我们利用哈希算法生成编码的具体过程为:
1)输入以下参数:hashcode位数k,视图数m,客户数n,客户相似度客户特征向量
2)结合算法HashingCodeLearning(k,m,n,),输出以下参数:客户总体哈希编码U,各视图权重α,各视图哈希函数
3)初始化
4)构建连接矩阵
5)构建拉普拉斯矩阵(Dp)-1/2LP(Dp)-1/2,p=1,2,...,m,判断是否收敛,若收敛,进入7),若未收敛,进入6);
6)循环以下计算过程:
计算得到
计算得到
计算得到矩阵
计算得到矩阵H(α)的k个对应特征值最小的特征向量;
根据特征向量生成哈希编码矩阵U;
计算得到
使用二次规划算法得到α;
返回U,α;
7)在得到连续化哈希编码之后,对其进行二值化,得到每一位取值为-1或1的哈希编码。
步骤104:获取实时一级预警数据,实时一级预警数据至少包括以下数据:客户报修倾向数据、历史重过载数据、历史故障数据、历史停电数据、历史天气数据。
步骤105:生成一级预警编码。
步骤106:判断一级预警编码与基准编码是否相似,若是,发出一级预警并进入下一步,若否,返回步骤104。
步骤107:获取实时二级预警数据,实时二级预警数据至少包括以下数据:实时重过载数据、停电发布漏报数据。
步骤108:生成二级预警编码,生成的二级预警编码是利用一级预警数据和二级预警数据来编码的。
步骤109:判断二级预警编码与基准编码是否相似,若是,发出二级预警并进入下一步,若否,返回步骤104。
步骤110:获取实时三级预警数据,实时三级预警数据至少包括以下数据:OMS故障停电数据、实时停电数据、电流突变数据、预报天气数据、客户物联网监控数据。
步骤111:生成三级预警编码,生成的三级预警编码中包含一级预警数据、二级预警数据、三级预警数据。
步骤112:判断三级预警编码与基准编码是否相似,若是,发出三级预警并返回步骤104,若否,直接返回步骤104。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明的具体结构,但不以任何方式限制本发明创造。因此,尽管说明书及附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换;而一切不脱离本发明创造的精神和范围的技术方案及其改进,其均涵盖在本发明创造专利的保护范围当中。