基于日志记录挖掘与组合验证的工作流建模方法

文档序号:6609373阅读:428来源:国知局
专利名称:基于日志记录挖掘与组合验证的工作流建模方法
技术领域
本发明属于软件业务过程管理技术领域,涉及一种基于日志记录挖掘与组合验证的工作流建模方法。
背景技术
工作流挖掘最早是被用于软件工程管理领域,在早期的系统设计中,业务分析师和管理人员对业务的认知是软件设计者的需求及分析的主要来源,这样就会使其存在有一定的主观性,同时,在实际运行过程中可能出现的意外状况无法有效的处理,也会影响软件的使用效率。而在有些情况下,工作流的精确建模是相对比较困难的,因为有些要素只能在工作流运行时才能确定。因而在工作流建模时候不能过分的苛求工作流模型的完美,要使得工作流先运行起来,在数据库或日志中积累其运行数据,根据其运行数据对工作流进行 挖掘、优化,促使工作流模型不断地精确化。工作流挖掘是基于数据挖掘在工作流管理的领域的应用,其主要的思想是利用数据挖掘的技术从工作流日志中重新构造工作流模型,从而达到流程分析与流程优化的目的。目前存在的大多数管理软件中,如ERP、SCM、CRM及WFMS都可以生成工作流日志,代替掉了早期的人工记录。这些日志记录的是流程运行的真实情况,分析已运行后的工作流日志,从中发现工作流运行的模式,对于工作流的运行绩效进行一定的考评及更正工作流中存在的弊病都有很大的帮助,工作流挖掘就是在此背影下产生的。工作流挖掘方法可帮助开发者分析工作流设计框架与具体执行的不同点,同时工作流模型方法也可在任务间构建真实的控制结构与数据流结构。

发明内容
本发明针对目前的研究现状,提出一种基于日志记录挖掘与组合验证的有效的工作流建模方法。本发明方法的具体步骤是
步骤(I)从数据库中导出工作流日志,删除冗余的信息。步骤(2 )根据日志是否存在循环进行分类,分为循环日志和无循环日志。步骤(3)扫描无循环的工作流日志(即相同的节点在某次执行中只出现一次),统计每个任务节点的发生次数。步骤(4)统计任务节点发生次数同时要记录下每个任务节点的跟随任务节点,及其此节点与其跟随节点共同出现的次数。步骤(5)根据每个任务节点及其跟随任务节点集,从该任务出发,向它的每个跟随任务节点画出一条带箭头的有向边,这样的有向边表明了任务之间执行的先后关系。步骤(6)在步骤(5)中构造出的有向任务图内,可能有某两个任务节点存在有双向箭头的有向边,则表明这两个任务节点是并行结构,则将删除这两个任务节点之间的有向边。步骤(7)根据任务节点发生次数,以及其与跟随节点共同发生次数,为已构造的模型添加控制结构,即并行执行(AND_Split)、合取合并(AND_Join)、析取执行(OR_Split)、析取合并(OR_Join)。步骤(8)单独扫描带有循环的日志,找出其循环结构,并添加到已构造的模型中。步骤(9)基于Petri网(佩里特网)的转化知识,把已经构造好的模型转换为Petri网的子网一工作流网(WF-Net),利用Petri的关联矩阵和状态方程验证已挖掘的模型的正确性。本发明所提供的基于日志记录挖掘与组合验证的工作流建模方法主要由以下功能模块组成日志挖掘模块、统计任务节点次数模块、构建过程模型模块、构建工作流模型模块及工作流模型转换模块。日志挖掘模块负责从数据库中导出日志,删除冗余信息,并将日志分为有循环结构和无循环结构两类。
统计任务节点次数模块首先遍历没有循环结构的日志,计算单个任务节点出现的次数以及,然后计算出每个任务节点和其跟随任务节点共同出现的次数两个部分,某个任务发生后另一任务发生,我们称之为跟随关系,此处所说的跟随关系不一定是顺序关系,也可能会是并行关系。构建过程模型模块根据每个任务节点及其跟随任务节点集,在每个任务和其跟随节点画一条有向边,从任务节点指向其跟随节点,得到有向任务图,之后检查有向任务图,如果存在两个点存在双向箭头的有向边,则删除这两条边;
构建工作流模型模块在已构建的有向图中添加控制结构和循环结构。其中控制结构包含并行执行、合取合并、析取执行、析取合并,然后扫描带有循环结构的日志,将循环结构添加到有向任务图中构建出工作流模型。工作流模型转换模块将构建的工作流模型转换为基于Petri网的子网一工作流网,并进行正确性验证。本发明用于企业间的工作任务的流程挖掘、工作流的重组及其Web领域,用于在基于已有的流程日志的环境下挖掘具有高可靠性的工作流模型以及验证已有工作流模型的正确性。本发明提供的挖掘工作流模型的方法可有效构建出工作流程中的顺序结构、选择结构、循环结构和并行结构,并进行了形式化验证,保证了模型的准确性。
具体实施例方式相关概念定义及符号说明 σ :日志中的一条轨迹;
:任务节点I ;
τ J =表示有点的任务节点集合;
K :任务节点/发生的次数,初始为O ;
跟随关系任务发生后,任务 ' 发生则T和I具有跟随关系,Tj是 的跟随节点(后继节点),表示为P};
ψ表示X的跟随节点的集合,初始为空;雨s :表不跟随关系发生的次数,初始为O ;
本发明所提供的基于日志记录挖掘与组合验证的工作流建模方法的具体实施方式
如下
(1)从数据库中导出工作流日志,删除冗余的信息,包括将日志分为带循环结构k和不带循环结构的两部分,每个日志包含若干条执行轨迹。(2)统计任务节点次数,包括单个任务节点出现的次数以及单个节点和其跟随节点共同出现的次数,具体执行步骤如下
(2. I)统计单个任务节点出现的次数将初始化为0,遍历所有^€4__ ,若 σ ,则JVf 加 I。(2. 2)统计单个任务节点和其跟随节点共同出现的次数首先,分析任务节点之间关系,确定任务节点之间的跟随关系,得到每个任务节点的跟随节点集合,即若轨迹σ中两个相邻任务节点兑卢σ,则Fl = Ft U I),其次统计每一个任务节点与其跟随节点σ
(i=l, 2,3···,j=l,2,3…)共同出现的次数。(3)根据步骤(2)中得到的任务节点及其跟随节点集合,构造过程模型,包含两个方面
(3. I)在每个任务节点与其跟随节点之间连接一条有向边,由任务节点指向其跟随节点,构造出有向任务图。(3. 2)删除有向任务图中多余的边,构造出过程模型,多余的边指若两个任务节点之间存在双向箭头,表示这两个任务可能是并行的,则先删除这两个任务之间的边。(4)向步骤(3)得到的过程模型添加控制结构以及循环结构,得到工作流模型,其中控制结构包含并行执行、合取合并、析取执行、析取合并,具体添加方式如下
构造出过程模型的初始有向连接图,此连接图不存在控制结构及循环结构。M为初始
模型,M ^ 0 ,对于每个节点Tf—τ,若存在 'ψ eFj, Μ中增加有向边2}到Tk,直至遍历到所有任务节点;对于上述已构造出的模型中必定存在两个任务节点的双向连线,即若存在有向边G到.I;,且rt到G也存在有向边,删除I;到I;与rt到的有向边。在此之后添加控制及循环结构。
(4. I)并行执行每个任务节点2;,如果祝=胃4 = = ,即任务节点 与其每一个跟随节点的发生次数相同,ζι — -。(4. 2)合取合并每个任务节点2;,如果乂 = @1 =…=JWjr..,即任务节点I;与其每一个前继节点的发生次数相同,Tt^AMD-Pin。(4. 3)析取执行每个任务节点T,如果况=Σ柯4 (η为节点τ的后继节点个数),即任务节点ξ等于其每一个跟随节点的发生次数的总和,T1^ORspm。
(4. 4)析取合并每个任务节点τ,如果凡= iM4 (η为节点7■的前继节点个数),
即任务节点ξ等于其每一个前继节点的发生次数的总和,I ^ OR-join。(4. 5)添加循环结构到过程模型遍历带循环的日志,得到循环结构,将其添加到已有的过程模型中。(5)将过程模型转换为Petri网,并进行正确性验证
(5. I)根据普通的图式模型转化为Petri网的规则,将挖掘出的模型映射为Petri网的子网一工作流网。(5. 2)构建模型的关联矩阵j,利用其状态方程M = + 对其进行验证,X为一向量,每个值对应Petri网中变迁发生次数,日志中的每个轨迹都可以表示为一向量;开始状态为M =(U0…Q),若最后到达的状态为A/ = (0,CU,CU),则说明模型是正确的。·
权利要求
1.基于日志记录挖掘与组合验证的工作流建模方法,其特征在于该方法的具体步骤是: 步骤(I)从数据库中导出工作流日志,删除冗余的信息; 步骤(2 )根据日志是否存在循环进行分类,分为循环日志和无循环日志; 步骤(3)扫描无循环的工作流日志,即相同的任务节点在某次执行中只出现一次,统计每个任务节点的发生次数; 步骤(4)统计任务节点发生次数同时要记录下每个任务节点的跟随任务节点,及此任务节点与跟随节点共同出现的次数; 步骤(5)根据每个任务节点及其跟随任务节点集,从该任务出发,向任务节点的每个跟随任务节点画出一条带箭头的有向边,形成有向任务图,这样的有向边表明了任务之间执行的时间先后关系,但这样的任务节点间不一定是依赖关系; 步骤(6)在步骤(5)中构造出的有向任务图内,可能有某两个任务节点存在有双向箭头的有向边,即此两个任务节点在日志中的发生时间可以不分先后,则表明这两个任务节点是并行结构,则将删除这两个任务节点之间的有向边; 步骤(7)根据任务节点发生次数,以及其与跟随节点共同发生次数,为已构造的有向任务图添加控制结构,即并行执行AND_Split、合取合并AND_Join、析取执行OR_Split、析取合并 OR_Join ; 步骤(8)单独扫描带有循环的日志,找出某个任务节点在日志中出现的次数大于2的日志片段,逐一对其日志片段连线,找出其循环结构,并添加到已构造的有向任务图中;步骤(9)基于Petri网的转化知识,把已经构造好的有向任务图转换为Petri网的子网一工作流网WF-Net,利用工作流网WF-Net的关联矩阵和状态方程验证已挖掘的模型的正确性。
全文摘要
本发明公开了基于日志记录挖掘与组合验证的工作流建模方法。本发明首先从数据库中导出工作流日志,删除冗余的信息,并对日志进行分类。其次扫描无循环的工作流日志,统计任务节点发生次数同时记录下每个任务节点的跟随任务节点,及此任务节点与跟随节点共同出现的次数;根据每个任务节点及其跟随任务节点集,构建有向任务图。然后根据任务节点发生次数,以及其与跟随节点共同发生次数,为有向任务图添加控制结构,最后有向任务图转换为工作流网,利用工作流网的关联矩阵和状态方程验证已挖掘的模型的正确性。本发明可有效构建出工作流程中的顺序结构、选择结构、循环结构和并行结构,并进行了形式化验证,保证了模型的准确性。
文档编号G06F17/30GK102880684SQ201210337478
公开日2013年1月16日 申请日期2012年9月13日 优先权日2012年9月13日
发明者胡海洋, 吕倩, 谢建恩 申请人:杭州电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1