基于最大区分子序列的设备安全性监控识别方法、装置与流程

文档序号:37435773发布日期:2024-03-25 19:33阅读:10来源:国知局
基于最大区分子序列的设备安全性监控识别方法、装置与流程

本公开涉及系统安全领域,具体涉及基于最大区分子序列的设备安全性监控识别方法、装置。


背景技术:

1、随着电网的信息化与智能化,新型业务终端出现海量接入,电力终端的数量正在快速增长。为了保证终端的运行安全,一般采用网络报文分析或者日志分析等方式来对电力终端的运行状态进行判断。

2、然而随着新型电力系统建设推进,终端数量和业务数量的改变,使得传统的终端监控识别方法不再适用。具体而言,电力终端数量快速增加,与此同时终端业务量也达到了前所未有的高度。这不仅导致网络报文的规模进一步增大,终端日志的存储和传输也面临着巨大的压力。传统的基于网络报文分析或者日志分析的监控方法对计算资源要求较高,对于日益增长的终端业务量而言,势必会带来巨大的开销。另一方面,传统的终端监控方法是对终端的每一个特征都去做匹配,效率较低。

3、因此,当前急需一种效率高的低计算复杂度的电力终端持续监控方法,来实时地对系统内的电力终端进行安全性监控。


技术实现思路

1、有鉴于此,本公开提供了一种基于最大区分子序列的设备安全性监控识别方法、装置,以解决当前没有一种效率高的低计算复杂度的电力终端持续监控方法,来实时地对系统内的电力终端进行安全性监控的问题。

2、第一方面,本公开提供了一种基于最大区分子序列的设备安全性监控识别方法,该方法包括:

3、获取训练样本集中的任意设备发出的原始离散信号和待安全性监控的目标设备发出的待监测离散信号,其中,训练样本集中的任意设备为安全性高于安全阈值的设备;

4、对原始离散信号进行预设处理,得到多个信号类别中包含的每个第一时间序列对应的多个第一子序列;对待监测离散信号进行预设处理,得到多个信号类别中包含的每个第二时间序列对应的多个第二子序列;

5、根据第一子序列和第二子序列,得到每个相同信号类别下的多个第一参考子序列以及原始离散信号中多个不同信号类别下的第二参考子序列,其中,第一参考子序列为从第一子序列中删除与第二子序列之间满足匹配度阈值的第一预设子序列而得到的剩余子序列,第二参考子序列为将不同信号类别下的第一参考子序列之间满足匹配度阈值的第二预设子序列全部删除后得到的剩余子序列;

6、根据第二参考子序列得到能够全部覆盖第一时间序列的第三参考子序列,其中,第三参考子序列为最大区分子序列;

7、根据第三参考子序列、第二子序列以及第二时间序列,确定待监测离散信号的安全性。

8、在本公开实施例中,通过获取到训练样本集中的安全设备发出的原始离散信号和待安全性监控的目标设备发出的待监测离散信号,对原始离散信号和待监测离散信号进行预设处理,然后从原始离散信号中得到区别于其他信号类别的且简化度最高的最大区分子序列(即第三参考子序列),然后将该最大区分子序列参与到对待监测离散信号的安全性的识别中,能够在保证低计算复杂度的前提下识别出异常终端。同时对于终端业务行为频繁、终端业务数据量大的场景,本公开实施例既能够分辨出异常终端,同时也不会影响终端的正常工作,解决了当前没有一种效率高的低计算复杂度的电力终端持续监控方法,来实时地对系统内的电力终端进行安全性监控的问题。

9、在一种可选的实施方式中,对原始离散信号进行预设处理,得到多个信号类别中包含的每个第一时间序列对应的多个第一子序列;对待监测离散信号进行预设处理,得到多个信号类别中包含的每个第二时间序列对应的多个第二子序列,包括:

10、根据原始离散信号发出的时间戳,生成多个信号类别下对应的多个第一时间序列;根据待监测离散信号发出的时间戳,生成多个信号类别下对应的多个第二时间序列;

11、对每个信号类别下的多个第一时间序列进行第一预设方式的处理,得到第一中间序列;对每个信号类别下的多个第二时间序列进行第一预设方式的处理,得到第二中间序列;

12、根据映射关系对第一中间序列进行第二预设方式的处理,得到每个第一时间序列对应的第一字符串序列;根据映射关系对第二中间序列进行第二预设方式的处理,得到第二时间序列对应的第二字符串序列;

13、对第一字符串序列进行切分,得到多个第一子序列;对第二字符串序列进行切分,得到多个第二子序列。

14、在一种可选的实施方式中,对第一字符串序列进行切分,得到多个第一子序列;对第二字符串序列进行切分,得到多个第二子序列,包括:

15、获取滑动窗口的窗口数值和前进的预设步长;

16、根据窗口数值和预设步长对第一字符串序列进行切分,得到多个第一子序列;根据窗口数值和预设步长对第二字符串序列进行切分,得到多个第二子序列。

17、在本公开实施例中,通过设置窗口数值和预设步长确定对字符串序列的切分情况,起到灵活获取不等长的子序列的目的。

18、在一种可选的实施方式中,根据第一子序列和第二子序列,得到每个相同信号类别下的多个第一参考子序列以及原始离散信号中多个不同信号类别下的第二参考子序列,包括:

19、获取相同信号类别下第一子序列和第二子序列之间的第一匹配度;

20、在第一匹配度满足匹配度阈值的情况下,从第一子序列中删除第一预设子序列,得到剩余的第一参考子序列;

21、获取原始离散信号中不同信号类别下的第一参考子序列之间的第二匹配度;

22、在第二匹配度满足匹配度阈值的情况下,从各个信号类别中删除第二预设子序列,得到各个信号类别下的多个第二参考子序列。

23、在本公开实施例中,通过对相同信号类别的子序列进行去冗余之外,还会基于去冗余之后的子序列再次从不同信号类别中做精简,以得到最精准的简化子序列。

24、在一种可选的实施方式中,根据第二参考子序列得到能够全部覆盖第一时间序列的第三参考子序列,包括:

25、获取第二参考子序列在各个第一时间序列中的出现情况;

26、根据出现情况更改第二参考子序列对应的位图数值;

27、根据位图数值确定第二参考子序列的权重位图,其中,权重位图用于表征第二参考子序列出现在各个第一时间序列中的总次数;

28、根据权重位图确定第二参考子序列中能够全部覆盖第一时间序列的第三参考子序列。

29、在本公开实施例中,根据各个子序列出现在各时间序列的情况确定位图数值,然后根据位图数值确定各个子序列的权重位图,进而选出最小子集的第三参考子序列作为最大区分子序列,保证低计算复杂度的前提下识别出异常终端。

30、在一种可选的实施方式中,在获取原始离散信号中预设数量个不同信号类别下的第一参考子序列之间的第二匹配度之后,方法还包括:

31、在第二匹配度未满足匹配度阈值的情况下,分别对不同信号类别下的第一参考子序对应的权重位图增加权重数值,得到调整后的权重位图;

32、基于调整后的权重位图确定第一参考子序列中能够全部覆盖第一时间序列的第三参考子序列。

33、在一种可选的实施方式中,根据第三参考子序列、第二子序列以及第二时间序列,确定待监测离散信号的安全性,包括:

34、获取每个第三参考子序列之间满足匹配度阈值的第四参考子序列,得到第三参考子序列和第四参考子序列的第一个数总数;

35、获取各个信号类别下的第二参考子序列的第二个数总数;

36、根据第一个数总数和第二个数总数,得到每个第三参考子序列的第一词频信息;

37、对第一词频信息进行向量化处理,得到每个第三参考子序列的第一词频向量;

38、获取待监测离散信号的第二子序列出现在第二时间序列内的第二词频信息;

39、对第二词频信息进行向量化处理,得到每个第二子序列的第二词频向量;

40、获取第一词频向量和第二词频向量之间的相似度,确定待监测离散信号的安全性。

41、在本公开实施例中,通过获取第三参考子序列的第一词频向量以及第二子序列的第二词频向量,根据第一词频向量和第二词频向量之间的相似度确定出待检测离散信号的安全性,实现了在不影响设备正常工作的前提下识别出异常设备。

42、在一种可选的实施方式中,获取第一词频向量和第二词频向量之间的相似度,确定待监测离散信号的安全性,包括:

43、利用相似度算法确定第一词频向量和第二词频向量之间的相似度;

44、在相似度大于相似度阈值的情况下,确定待监测离散信号为安全信号。

45、在本公开实施例中,基于相似度算法确定第一词频向量和第二词频向量之间的相似度,通过获取满足相似度阈值的第二子序列的数量确定目标设备的安全性,提高了识别出设备异常的效率。

46、第二方面,本公开提供了一种基于最大区分子序列的设备安全性监控识别装置,该装置包括:

47、获取模块,用于获取训练样本集中的任意设备发出的原始离散信号和待安全性监控的目标设备发出的待监测离散信号,其中,训练样本集中的任意设备为安全性高于安全阈值的设备;

48、预设处理模块,用于对原始离散信号进行预设处理,得到多个信号类别中包含的每个第一时间序列对应的多个第一子序列;对待监测离散信号进行预设处理,得到多个信号类别中包含的每个第二时间序列对应的多个第二子序列;

49、第一得到模块,用于根据第一子序列和第二子序列,得到每个相同信号类别下的多个第一参考子序列以及原始离散信号中多个不同信号类别下的第二参考子序列,其中,第一参考子序列为从第一子序列中删除与第二子序列之间满足匹配度阈值的第一预设子序列而得到的剩余子序列,第二参考子序列为将不同信号类别下的第一参考子序列之间满足匹配度阈值的第二预设子序列全部删除后得到的剩余子序列;

50、第二得到模块,用于根据第二参考子序列得到能够全部覆盖第一时间序列的第三参考子序列,其中,第三参考子序列为最大区分子序列;

51、确定模块,用于根据第三参考子序列、第二子序列以及第二时间序列,确定待监测离散信号的安全性。

52、在一种可选的实施方式中,预设处理模块包括:

53、生成单元,用于根据原始离散信号发出的时间戳,生成多个信号类别下对应的多个第一时间序列;根据待监测离散信号发出的时间戳,生成多个信号类别下对应的多个第二时间序列;

54、第一得到单元,用于对每个信号类别下的多个第一时间序列进行第一预设方式的处理,得到第一中间序列;对每个信号类别下的多个第二时间序列进行第一预设方式的处理,得到第二中间序列;

55、第二得到单元,用于根据映射关系对第一中间序列进行第二预设方式的处理,得到每个第一时间序列对应的第一字符串序列;根据映射关系对第二中间序列进行第二预设方式的处理,得到第二时间序列对应的第二字符串序列;

56、第三得到单元,用于对第一字符串序列进行切分,得到多个第一子序列;对第二字符串序列进行切分,得到多个第二子序列。

57、在一些可选的实施方式中,第三得到单元包括:

58、第一获取子模块,用于获取滑动窗口的窗口数值和前进的预设步长;

59、第一得到子模块,用于根据窗口数值和预设步长对第一字符串序列进行切分,得到多个第一子序列;根据窗口数值和预设步长对第二字符串序列进行切分,得到多个第二子序列。

60、在一些可选的实施方式中,第一得到模块包括:

61、第一获取单元,用于获取相同信号类别下第一子序列和第二子序列之间的第一匹配度;

62、第一删除单元,用于在第一匹配度满足匹配度阈值的情况下,从第一子序列中删除第一预设子序列,得到剩余的第一参考子序列;

63、第二获取单元,用于获取原始离散信号中不同信号类别下的第一参考子序列之间的第二匹配度;

64、第二删除单元,用于在第二匹配度满足匹配度阈值的情况下,从各个信号类别中删除第二预设子序列,得到各个信号类别下的多个第二参考子序列。

65、在一些可选的实施方式中,第二得到模块包括:

66、第三获取单元,用于获取第二参考子序列在各个第一时间序列中的出现情况;

67、更改单元,用于根据出现情况更改第二参考子序列对应的位图数值;

68、第一确定单元,用于根据位图数值确定第二参考子序列的权重位图,其中,权重位图用于表征第二参考子序列出现在各个第一时间序列中的总次数;

69、第二确定单元,用于根据权重位图确定第二参考子序列中能够全部覆盖第一时间序列的第三参考子序列。

70、在一些可选的实施方式中,第一得到模块包括:

71、增加单元,用于在获取原始离散信号中不同信号类别下的第一参考子序列之间的第二匹配度之后,在第二匹配度未满足匹配度阈值的情况下,分别对不同信号类别下的第一参考子序对应的权重位图增加权重数值,得到调整后的权重位图;

72、第三确定单元,用于基于调整后的权重位图确定第一参考子序列中能够全部覆盖第一时间序列的第三参考子序列。

73、在一些可选的实施方式中,确定模块包括:

74、第四获取单元,用于获取每个第三参考子序列之间满足匹配度阈值的第四参考子序列,得到第三参考子序列和第四参考子序列的第一个数总数;

75、第五获取单元,用于获取各个信号类别下的第二参考子序列的第二个数总数;

76、第四得到单元,用于根据第一个数总数和第二个数总数,得到每个第三参考子序列的第一词频信息;

77、第五得到单元,用于对第一词频信息进行向量化处理,得到每个第三参考子序列的第一词频向量;

78、第六获取单元,用于获取待监测离散信号的第二子序列出现在第二时间序列内的第二词频信息;

79、第六得到单元,用于对第二词频信息进行向量化处理,得到每个第二子序列的第二词频向量;

80、第四确定单元,用于获取第一词频向量和第二词频向量之间的相似度,确定待监测离散信号的安全性。

81、在一些可选的实施方式中,第四确定单元包括:

82、第一确定子模块,用于利用相似度算法确定第一词频向量和第二词频向量之间的相似度;

83、第二确定子模块,用于在相似度大于相似度阈值的情况下,确定待监测离散信号为安全信号。

84、第三方面,本公开提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的基于最大区分子序列的设备安全性监控识别方法。

85、第四方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的基于最大区分子序列的设备安全性监控识别方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1