一种事件处理结果的数据分析预警系统及方法与流程

文档序号:20701013发布日期:2020-05-12 15:42阅读:305来源:国知局
一种事件处理结果的数据分析预警系统及方法与流程

本发明实施例涉及数据处理分析技术领域,具体涉及一种事件处理结果的数据分析预警系统及方法。



背景技术:

复杂事件处理是一项基于分散信息的系统中提取目标信息的一种技术,这项技术使系统的使用者能够从大量信息中提取自己所需要的信息,这种信息可以是低层的网络处理数据,也可以是高层的企业管理者的决策。是低层还是高层数据是由系统的操作人员在系统的运行过程中来控制的,是可以随时改变的。

但是在现有复杂事件的数据分析中往往是直接对事件本身进行分析,这种分析将存在以下两方面的缺陷:

第一,事件本身包含的信息量太多,无法找到事件的聚焦点,难以在有限的计算资源中快速进行筛选获得目标信息;

第二,在数据处理的过程中无法基于事件数据进行比对和校验,从而导致数据在处理的过程中能够将误差一直传递下去,直至产生数据错误,另外对于数据本身来说还可能存在错误,而由于对于事件本身无法进行标准化,因此也无法进行检验和预警。



技术实现要素:

为此,本发明实施例提供一种事件处理结果的数据分析预警系统及方法,以解决现有技术中信息量大难以计算处理以及无法检验和预警的问题。

为了实现上述目的,本发明的实施方式提供如下技术方案:

一种事件处理结果的数据分析方法,包括如下步骤:

步骤100、将事件集合按照处理的过程抽象成若干个按照时间轴分布的抽象体,并在该时间轴上设置事件处理节点,在整个事件上设置若干个不同的耦合节点,依据耦合节点将具有相互关系的抽象体连续起来形成数据体;

步骤200、对生成的数据体进行规范化处理形成格式化模块;

步骤300、确定事件的标准化模块,并通过安全分析模型对格式化模型和标准化模块进行计算;

步骤400、根据计算的结果生成标准化预警信息。

作为本发明的一种优选方案,在步骤100中,将时间抽象为抽象体的具体步骤为:

步骤101、选择事件集合,并在所述事件集合内按照时间轴的分布将事件顺次排列;

步骤102、在所述事件集合中按照时间段进行分区,并在每个分区内对每个事件进行标识,标识原则为分区号、分区内序号、整体序号;

步骤103、对经过标识的每个事件赋予自身属性进行抽象化形成抽象体。

作为本发明的一种优选方案,所述自身属性包括包含时间、地点、涉及部门和人员的头文件、包含事件的起因、简要经过和结果的摘要文件、包含事件详细经过的映射文件。

作为本发明的一种优选方案,在步骤100中还包括定义事件的性质,并根据事件性质的不同设定两种处理方式,具体包括:

监督事件,根据预定义的事件类型以及对应事件类型设定的处理方式对所述时间进行处理和反馈;

自定义时间,由创建人根据事件的类型和性质分发至相应的处理人进行处理和反馈。

作为本发明的一种优选方案,在步骤200中还包括构建抽象体之间的联系,所述抽象体之间的联系依据头文件和摘要文件确定。

作为本发明的一种优选方案,在步骤200中形成格式化模块的具体步骤为:

步骤201、对经过抽象化和数据化处理之后的数据体进行规范化处理,并且通过去重降噪作用将无效信息和重复信息删除和合并;

步骤202、结合知识库数据对规划化处理后的数据体进行加强生成格式化模块。

作为本发明的一种优选方案,在步骤202中加强生成的步骤中,其具体的操作为:

根据数据体中的关键词确定数据体的索引范围,并根据索引范围在知识库数据中比对,以确定缺损位置和格式化位置;

在确定缺损位置后,通过在知识库数据中选择相关系数最大的部分进行补全,并对补全位置进行标识;对格式化位置按照知识库数据中的格式进行标准化处理。

作为本发明的一种优选方案,在步骤300中,通过安全分析模型进行计算的具体步骤为:

步骤301、基于数据流语义分析引擎确定事件的标准化模块;

步骤302、对每一个事件的标准化模块均进行真实事件的映射,并以映射的方式将真实事件的数据涵盖在标准化模块中;

步骤303、确定分析规则的计算模块,并基于所述计算模块通过安全分析模型进行计算。

另外,本发明还提供了一种事件处理结果的数据分析预警模型,包括:

事件的排序和抽象模块,用于将整个事件集合按照处理的过程抽象成若干个按照时间轴分布的抽象体,并在该时间轴上设置事件处理节点;

耦合模块,用于依据耦合节点将具有相互关系的抽象体连续起来形成数据体;

数据标准化模块,对不同的事件进行格式化处理或标准化处理;

安全分析模型,用于对格式化模型和标准化模块进行计算;

输出模块,根据计算的结果生成标准化预警信息。

作为本发明的一种优选方案,在事件的排序和抽象模块中还包括事件定义模块,用于根据事件性质的不同设定不同的处理方式。

本发明的实施方式具有如下优点:

1、本发明中的数据分析方式能检测任意抽象层的事件,能从一系列事件中找出我们感兴趣的事件,把低层的一系列事件进行抽象化的概括,避免杂乱信息的干扰,而且在抽象化处理的过程中也相当于对复杂事件进行了初步的筛选和总结;

2、本发明在数据处理的过程中进行格式化和标准化,通过进行标准比对,能够及时预警数据处理过程中的问题和事件数据本身的缺陷,对于不包含实质性内容的缺陷可以通过知识库数据进行填补和格式化处理,提高后续处理的效率和正确率。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。

图1为本发明实施方式中的流程示意图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了本发明提供了一种事件处理结果的数据分析预警模型,包括:

事件的排序和抽象模块,用于将整个事件集合按照处理的过程抽象成若干个按照时间轴分布的抽象体,并在该时间轴上设置事件处理节点,在事件的排序和抽象模块中还包括事件定义模块,用于根据事件性质的不同设定不同的处理方式;

耦合模块,用于依据耦合节点将具有相互关系的抽象体连续起来形成数据体;

数据标准化模块,对不同的事件进行格式化处理或标准化处理;

安全分析模型,用于对格式化模型和标准化模块进行计算;

输出模块,根据计算的结果生成标准化预警信息。

但是该预警模型还是基于数据分析模型建立的,因此在该模型中还应当包括:

枚举模块,用于对每一个数据体的成因进行枚举分析,根据枚举分析的结果匹配事件处理结果的相关系数;

比对和抽象模块,用于依据相关系数将每个数据体中相关的事件进一步以更高的形式抽象出来。

在本发明中,该数据分析模型的作用在于从众多杂乱分散的数据事件中筛选出目标数据,并且在筛选的过程中按照节点进行遍历查找,能够提高筛选的效率。由于实际操作中事件数据的复杂性,因此,为了保障数据筛选的准确率,建立相关系数进行阈值的判定。

在本发明中需要进一步说明的是,通过建立预警的方式能够对抽象化的数据进行标准化处理和检验,该检验的目的在于两个方面:

第一,检验事件数据处理过程中的步骤是否正确;

第二,对包含事件的数据本身进行验证,以确定事件本身是否存在需要预警的情况。

由此可知,在本发明中通过预警的方式可以对数据分析的过程进行验证,同时也可以对复杂事件本身进行验证,从两方面进行验证以保证数据的正确性和及时预警。

本发明基于前述的数据分析预警模型,如图1所示,还提供了一种事件处理结果的数据分析预警方法,包括如下步骤:

步骤100、将事件集合按照处理的过程抽象成若干个按照时间轴分布的抽象体,并在该时间轴上设置事件处理节点。

在本实施方式中,对事件的集合进行抽象化处理的目的在于将复杂的时间以数据化的形式存储起来,以便后续进行处理。在本发明中对于复杂时间的分析,其原理也等同于将不便于通过数据处理的形式转换为数据形式,以便进行数据处理。

在步骤100中,将时间抽象为抽象体的具体步骤为:

步骤101、选择事件集合,并在所述事件集合内按照时间轴的分布将事件顺次排列,需要说明的是,此处将事件集合按照时间轴进行分布的前提是按照时间顺序发生的,这其中包括同时发生的时间,但是对于不按时间顺序发生的事件,就通过人为干预的方式进行定义,关于这类型的事件将在后续中进一步说明;

步骤102、在所述事件集合中按照时间段进行分区,并在每个分区内对每个事件进行标识,标识原则为分区号、分区内序号、整体序号;

步骤103、对经过标识的每个事件赋予自身属性进行抽象化形成抽象体。

在步骤102中,为了更好说明其分区和标识过程,将结合实例进行说明:

例如对于8个按照时间先后顺序发生的事件,在按照时间轴排布后分别即为t1、t2、……、t7、t8,并且按照分区规则将其分为三个区,如t1、t2、t3记为s1区,t4、t5记为s2区,t6、t7、t8记为s3区。

按照分区后的区间序号进行排布并标识,即对于不同的分区依次记为:

对于s1区,依次记为s1-1、s1-2、s1-3;

对于s2区,依次记为s2-1、s2-2;

对于s3区,依次记为s3-1、s3-2、s3-3。

根据上述分区规则,附上整体序号后则依次为:s1-1-1、s1-2-2、s1-3-3、s2-1-4、s2-2-5、s3-1-6、s3-2-7、s3-3-8。

如上所述,通过分区号、分区内序号、整体序号的标识原则将其标识出来形成完整的标识区,并且在标识之后将自身的属性附在标识区作为附属信息。

通过这种处理方式的目的在于将事件完全转换为数据体,并且将事件自身的属性通过赋予的方式包含在标识区内,在实际处理中可以不需要考虑属性信息,只有在实际遍历的过程中才需要考虑,因此可以减少在运算过程中的数据量以及逻辑关系。

在上述中,自身属性包括包含时间、地点、涉及部门和人员的头文件、包含事件的起因、简要经过和结果的摘要文件、包含事件详细经过的映射文件。

其中,头文件和摘要文件包括了事件的检索信息,通过头文件和摘要文件即可获的事件的基本信息,以便快速准确的获得事件的说明,并基于事件的说明进行遍历查找,在查找之后再通过映射文件的方式获得具体内容。

在步骤100中还包括定义事件的性质,并根据事件性质的不同设定两种处理方式,具体包括:

监督事件,根据预定义的事件类型以及对应事件类型设定的处理方式对所述时间进行处理和反馈;

自定义时间,由创建人根据事件的类型和性质分发至相应的处理人进行处理和反馈。

在整个事件上设置若干个不同的耦合节点,依据耦合节点将具有相互关系的抽象体连续起来形成数据体。

在上述步骤中还包括构建抽象体之间的联系,所述抽象体之间的联系依据头文件和摘要文件确定。

需要进一步说明的是,本发明中的耦合关系本质上将具有相互联系的事件放置在一起,以便在遍历查找时可以快速的获得相联系的事件,减少重复性的遍历查找工作,提高了后续的工作效率。

在数据分析中,其具体的方式为:

对每一个数据体的成因进行枚举分析,根据枚举分析的结果匹配事件处理结果的相关系数。

由于不同事件均具有自身的属性,而且对于复杂事件来说,很难直接判定其属于哪一种遍历条件,因此,基于这点考虑,在本实施方式中引入相关系数的方式使得系统可以自动判定,从而提高了最终筛选的准确性和高效性。

进一步的,通过设置相关系数,可以根据实际的需求来设定相关系数的阈值,从而可以按照需求来进行筛选,如在本实施方式中,所述相关系数大于等于0.8判定为有效。

匹配事件处理结果相关系数的具体步骤为:

确定抽象体之间相互联系的关键词,并将该关键词作为数据体成因枚举的特征进行遍历查找,将遍历查找的结果顺次枚举;

确定事件处理结果的目标词,并将所述目标词进行拆分,获得若干个独立的对比词;

逐个选择对比词与所有的枚举结果进行一一对比,并将对比结果按照标识号记录下来,将不同对比词的对比结果以标识号作为索引再次进行对比;

确定索引对比的阈值区间,并依据不同的对比结果比照阈值区间确定不同的相关系数。

在上述步骤中均是将复杂的事件进行数据化处理,并且在数据化处理之后进行比对,通过比对的结果确定相关系数,以便在后续中根据比对的结果进行抽象化获得最终的结果。

基于上述的数据处理方法,在步骤200中形成格式化模块的具体步骤为:

步骤201、对经过抽象化和数据化处理之后的数据体进行规范化处理,并且通过去重降噪作用将无效信息和重复信息删除和合并,剔除包含在其中的无效数据,减少无效数据参与计算的可能;

步骤202、结合知识库数据对规划化处理后的数据体进行加强生成格式化模块。

在步骤202中加强生成的步骤中,其具体的操作为:

根据数据体中的关键词确定数据体的索引范围,并根据索引范围在知识库数据中比对,以确定缺损位置和格式化位置;

在确定缺损位置后,通过在知识库数据中选择相关系数最大的部分进行补全,并对补全位置进行标识;对格式化位置按照知识库数据中的格式进行标准化处理。

在上述中需要说明的是,通过定位缺损和格式化处理,能够对复杂数据本身存在的缺陷基于知识库数据进行填补和格式化处理,以形成能够进行标准比对的数据体,提高数据比对的正确率。

在步骤300中,通过安全分析模型进行计算的具体步骤为:

步骤301、基于数据流语义分析引擎确定事件的标准化模块;

步骤302、对每一个事件的标准化模块均进行真实事件的映射,并以映射的方式将真实事件的数据涵盖在标准化模块中;

步骤303、确定分析规则的计算模块,并基于所述计算模块通过安全分析模型进行计算。

在本发明中,其数据处理分析预警的原理在于:

将实际的复杂事件通过数据化处理的方式,将低层的时间抽象为高层时间,避免了杂乱信息在筛选过程中的干扰,同时对经过处理的数据进行格式化处理,将格式化处理后的数据与标准模块进行比对,从而输出预警信息。

正是基于这样的工作方式,它具备如下优点:

1、该数据分析方式能检测任意抽象层的事件,能从一系列事件中找出我们感兴趣的事件,把低层的一系列事件进行抽象化的概括,避免杂乱信息的干扰,而且在抽象化处理的过程中也相当于对复杂事件进行了初步的筛选和总结;

2、在数据处理的过程中进行格式化和标准化,通过进行标准比对,能够及时预警数据处理过程中的问题和事件数据本身的缺陷,对于不包含实质性内容的缺陷可以通过知识库数据进行填补和格式化处理,提高后续处理的效率和正确率。

虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1