一种配电网在线数据异常检测方法_2

文档序号:9417247阅读:来源:国知局
2所示,步骤2,包括:
[0068] 2-1.从配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线数 据;
[0069] 2-2.利用SAX解析方法对筛选后的配电网在线数据进行符号化预处理,得到符号 序列;
[0070] 2-3.提取符号序列中全部的出现次数不少于2次的符号子序列,及符号子序列在 符号序列中的间隔序列;
[0071] 2-4.将符号子序列及间隔序列均存入集合中;
[0072] 2-5.根据集合,建立以间隔序列为键值的二叉堆;
[0073] 2-6.在二叉堆中,选取满足length⑴〈=length(t)*count(T, t)* Θ的符号序列 T ;
[0074] 其中,t是符号子序列;T是符号序列;count (T,t)表示t在T中出现的次数, Iength(T)表不符号序列T的长度;length (t)表不符号子序列t的长度;Θ为用户输入的 经验参数。
[0075] 步骤4之前,还包括:
[0076] a.对语法异常规则和筛选异常规则分别进行格式分析;
[0077] b.将语法异常规则和筛选异常规则中格式符合检测要求的规则放入规则文件。
[0078] 如图3所示,步骤4,包括:
[0079] 4-1.根据规则文件,进行时间序列异常模式检测,得到检测的初始结果;
[0080] 4-2.将测试时间序列分成若干序列段,并指定初始均值和标准差;
[0081] 4-3.在一个序列段中,对于初始结果中的每一条规则,分别判断所有长度与规则 相同的子序列是否满足这条规则;若不满足,则继续对下一条规则进行判断;若满足,则输 出这个子序列为异常子序列;直到判断完初始结果中的全部规则;
[0082] 4-4.全部的异常子序列组成检测结果序列集。
[0083] 步骤5中的对检测结果序列集排序的排序原则,包括:
[0084] c.检测结果序列集中的子序列的异常程度是该子序列中每个点的异常程度的平 均值;
[0085] d.子序列中每个点的异常程度与该点被判定为异常的规则的数量呈正相关的关 系;
[0086] e.子序列中每个点的异常程度与该点被判定为异常的相同规则的数量呈负相关 的关系。
[0087] 如图4所示,步骤5,包括:
[0088] 5-1.定义一个频率矩阵F :
[0089]
[0090] 其中,F中的每一个元素 t表示序列中的第j个点被第i条规则检测出的次数; η为子序列的总数;m为规则的总数;
[0091] 5-2.得到序列点P]的分数的计算公式为:
[0092]
;
[0093] 5-3.分别算出检测结果序列集中的每一条子序列的分数;子序列< Pl,p2, ...,pn >的分数的计算公式为: CN 105138413 A 说明书 6/6 页
[0094]
[0095] 5-4.再按照每一条子序列的分数的降序对子序列进行排序,得到最终检测结果。
[0096] 如图5所示,本发明提供一种配电网在线数据异常检测方法的应用例,对配电网 运行和故障过程中产生的海量实时在线数据(包括配电网自动化终端采集数据,电力负荷 数据,营销数据等)进行清洗,该范明包括规则挖掘、规则定义、异常检测三个过程。本发明 的核心部分是配电网在线数据异常模式的定义方法和挖掘方法,的方法包括如下步骤:
[0097] 步骤1 :由电力行业的业务专家根据规则的语法规范人工定义配电网在线数据的 异常规则;
[0098] 步骤2 :选取训练配电网功率数据集,从训练数据集中挖掘出时间序列的异常规 则;
[0099] 步骤3 :根据步骤1和步骤2产生的规则,从测试数据集中找到候选异常配电网数 据,并按照异常程度进行排序后输出这些配电网数据。
[0100] 步骤2中包括以下步骤:
[0101] BI.选取长度合适的配电网在线数据。
[0102] B2.利用SAX方法将上一步中的配电网在线数据进行符号化预处理。
[0103] B3.对于上一步中预处理后的符号序列,提取其中所有出现次数不少于2所有符 号子序列。
[0104] B4.对于第B3步中的每个符号子序列,得到其在第B2步符号序列中的间隔序列。
[0105] B5.对于第M步骤的间隔序列,以间隔长度为键值建立二叉堆。
[0106] B6.在第 B5 步的二叉堆中,找到满足 length ⑴〈=length (t) *count (T, t) * Θ 的 符号序列T,其中,序列t是B3步骤中的符号序列,C〇unt(T,t)表示t在T中出现的次数, Iength(T)表示序列T的长度。
[0107] 步骤3中包括以下步骤:
[0108] Cl.对步骤1和步骤2中的规则序列进行格式检查。
[0109] C2.对测试时间序列分成若干段,并指定初始均值μ和标准差〇。
[0110] C3.在C2步骤的一个序列段中,对于每一条步骤中的规则i,设该规则的长度为 Li,判断所有长度为Li的子序列是否满足这条规则,若满足,则输出这个子序列为异常子 序列。
[0111] C4对所有检测到的异常子序列按照异常程度进行排序。
[0112] 以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对 本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的【具体实施方式】进 行修改或者等同替换,而这些未脱离本发明精神和范围的任何修改或者等同替换,其均在 申请待批的本发明的权利要求保护范围之内。
【主权项】
1. 一种配电网在线数据异常检测方法,其特征在于,所述方法包括如下步骤: 步骤1.根据语法规范,定义配电网在线数据的语法异常规则; 步骤2.从所述配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线 数据,并预处理所述配电网在线数据,得到配电网在线筛选数据; 步骤3.根据所述配电网在线筛选数据及用户的使用参数,生成筛选异常规则; 步骤4.根据所述语法异常规则和筛选异常规则对所述配电网在线数据进行异常检 测,得到检测结果序列集; 步骤5.根据异常程度对所述检测结果序列集排序,得到最终检测结果。2. 如权利要求1所述的方法,其特征在于,所述步骤1中的所述语法异常规则为包括一 个或多个规则元组的序列,每个所述规则元组均对应时间序列中的一个时序点;所述规则 元组的形式如下: 〈规则元组> ={〈数值下限〉,〈数值上限〉,〈方向>} 〈数值下限〉和〈数值上限〉为已定义的参数、具体的值或者表达式;〈方向〉为up、 dw、eq、ud或数值,其中,up表示下一个值比当前值大,dw表示下一个值比当前值小,eq表 示下一个值等于当前值,Ud表示下一个值与当前值无关,数值表示以当前所述时序点为起 点的序列段的斜率。3. 如权利要求2所述的方法,其特征在于,所述步骤2,包括: 2-1.从所述配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线数 据; 2-2.利用SAX解析方法对筛选后的所述配电网在线数据进行符号化预处理,得到符号 序列; 2-3.提取所述符号序列中全部的出现次数不少于2次的符号子序列,及所述符号子序 列在所述符号序列中的间隔序列; 2-4.将所述符号子序列及所述间隔序列均存入集合中; 2-5.根据所述集合,建立以所述间隔序列为键值的二叉堆; 2-6?在所述二叉堆中,选取满足length (T)〈 = Iength (t)*count(T,t)* 0的符号序列 T ; 其中,t是所述符号子序列;T是所述符号序列;count(T,t)表示t在T中出现的次数, Iength(T)表不符号序列T的长度;length (t)表不符号子序列t的长度;9为用户输入的 经验参数。4. 如权利要求3所述的方法,其特征在于,所述步骤4之前,还包括: a. 对所述语法异常规则和所述筛选异常规则分别进行格式分析; b. 将所述语法异常规则和所述筛选异常规则中格式符合检测要求的规则放入规则文 件。5. 如权利要求4所述的方法,其特征在于,所述步骤4,包括:4-1.根据所述规则文件, 进行时间序列异常模式检测,得到检测的初始结果; 4-2.将测试时间序列分成若干序列段,并指定初始均值和标准差; 4-3.在一个所述序列段中,对于所述初始结果中的每一条规则,分别判断所有长度与 所述规则相同的子序列是否满足这条规则;若不满足,则继续对下一条规则进行判断;若 满足,则输出这个子序列为异常子序列;直到判断完所述初始结果中的全部规则; 4- 4.全部的所述异常子序列组成所述检测结果序列集。6. 如权利要求5所述的方法,其特征在于,所述步骤5中的对所述检测结果序列集排序 的排序原则,包括: c. 所述检测结果序列集中的子序列的异常程度是该子序列中每个点的异常程度的平 均值; d. 所述子序列中每个点的异常程度与该点被判定为异常的规则的数量呈正相关的关 系; e. 所述子序列中每个点的异常程度与该点被判定为异常的相同规则的数量呈负相关 的关系。7. 如权利要求6所述的方法,其特征在于,所述步骤5,包括: 5- 1.定义一个频率矩阵F :其中,F中的每一个元素f表示序列中的第j个点被第i条规则检测出的次数;n为 子序列的总数;m为规则的总数; 5-2.得到序列点P]的分数的计算公式为:5-3.分别算出所述检测结果序列集中的每一条子序列的分数;所述子序列 < P1, p2,. . .,pn>的分数的计算公式为:5-4.再按照每一条子序列的分数的降序对所述子序列进行排序,得到最终检测结果。
【专利摘要】本发明提供一种配电网在线数据异常检测方法,根据语法规范,定义配电网在线数据的语法异常规则;从配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线数据,并预处理配电网在线数据,得到配电网在线筛选数据;根据配电网在线筛选数据及用户的使用参数,生成筛选异常规则;根据语法异常规则和筛选异常规则对配电网在线数据进行异常检测,得到检测结果序列集;根据异常程度对检测结果序列集排序,得到最终检测结果。本发明提出的检测方法,能够高效率、实时且灵活地对配电网在线数据进行异常检测,进而提升了配电网在线数据质量,实现了从海量配电网在线数据中快速地找到异常数据,提高了配电网仿真计算和状态监测等工作结果的精确度。
【IPC分类】G06F11/07, G06F17/30
【公开号】CN105138413
【申请号】CN201510511779
【发明人】刘科研, 盛万兴, 刁赢龙, 唐建岗, 叶学顺, 何开元, 贾东梨, 胡丽娟
【申请人】中国电力科学研究院, 国家电网公司, 国网北京市电力公司
【公开日】2015年12月9日
【申请日】2015年8月19日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1