一种基于大数据的突发事件演化推理方法及系统与流程

文档序号:18214126发布日期:2019-07-19 22:31阅读:305来源:国知局
一种基于大数据的突发事件演化推理方法及系统与流程

本发明属于数据挖掘技术领域,更具体地,涉及一种基于大数据的突发事件演化推理方法及系统。



背景技术:

数据挖掘也称为在数据库中进行知识发现,数据挖掘的目的是从大型数据库中抽象出感兴趣的知识。从抽象模式来分析,决策过程可以很容易被完成。关联规则主要是基于发现频繁项集,零售店经常使用关联规则来协助营销,广告,库存控制,预测电信网络中的故障,其中主要使用的是关联规则算法Apriori算法,Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。

随着非常规突发事件的发生越来越频繁,然而当前的突发事件预警预测方法大多从突发事件案例的宏观信息(如事件类型、资源类型等)出发,利用CBR、基于规则的推理(Rule-Based Reasoning,RBR)、基于模型的推理(Model-based Reasoning,MBR)等方法,然而采用上述方法并不能将案例最原本的信息关系挖掘出来,同时在一定程度上忽略了常规突发事件与非常规突发事件的区别,具有一定的局限性。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于大数据的突发事件演化推理方法及系统,在Apriori算法的基础上得到改进的推理算法,利用结构化的突发事件案例库的相关信息从突发事件的子事件链出发,可以从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合。由此解决现有技术中对案例推理忽略案例基本信息间关系的缺陷,以及忽略了常规突发事件与非常规突发事件的区别的技术问题。

为实现上述目的,按照本发明的一个方面,提供了一种基于大数据的突发事件演化推理方法,包括:

(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;

(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;

(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1 项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2 ,…,n-1;

(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;

(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。

按照本发明的另一方面,提供了一种基于大数据的突发事件演化推理系统,包括:

子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;

项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;

合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中, k=2 ,…,n-1;

强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将 1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1 项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;

事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要有以下的技术优点:数据集合不固定,将数据源进行关联组合与Apriori算法的固定数据集合不同;改善Apriori算法只针对强规则项集的推论,将计算过程中强弱规则项集区分,均保留为目标数据。

附图说明

图1为本发明实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图;

图2为本发明实施例公开的一种基于大数据的突发事件演化推理系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

图1为本发明实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图,在图1所示的方法中具体包括以下步骤:

(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;

(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;

(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1 项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2 ,…,n-1;

(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;

(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。

通过图1所示的方法得到的数据集合不固定,并可以将数据源进行关联组合,并且可以区分强弱规则项,依据强弱规则项得到常规突发事件演变的可能路径或非常规突发事件演变的可能路径。

为了便于对本发明提出的基于大数据的突发事件演化推理方法的理解,下面以一个具体的例子来描述该方法中数据集的实现过程。假设有如下三条事件链:

案例1:A1→B1→C1→D1→E1

案例2:A2→C1→B2→D3

案例3:A1→B2→C1→D3

针对每个案例的子事件链,获取子事件链的二项集\三项集\…\n项集:

进行元素合并得到合并之后的项集:

I)Al Bl Cl B2 D3

2)A1 B2 C1 D3

3)……

针对每一条子事件链以及合并之后的项集,利用Apriori算法分别求出强规则项以及出现概率极低的项(即弱规则项)。最终推理出与用户输入的事件对应的后续可能发生的事件集合。

图2所示为本法实施例公开的一种基于大数据的突发事件演化推理系统,在图2所示的系统中包括:

子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;

项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;

合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中, k=2 ,…,n-1;

强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将 1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1 项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;

事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1