噪声环境下确定工作流轨迹中循环执行次数的方法与流程

文档序号：11134977阅读：735来源：国知局

本发明属于过程挖掘领域，具体涉及一种噪声环境下确定工作流轨迹中循环执行次数的方法。

技术背景

从传统的信息系统如企业办公自动化或科学工作流到最近的web service及联机事务，大量的工作流轨迹被生成。然而手动记录时忘记提交、系统宕机、异构执行环境的工作流轨迹混杂等一系列原因都会导致工作流轨迹日志记录含有噪声，这些噪声包括缺失、冗余、乱序等。噪声是拉低工作流轨迹质量的重要原因。若不修复这些含有噪声的工作流轨迹，基于这些含有噪声的工作流轨迹进行的应用和挖掘是不可信的。工作流轨迹的质量严重影响了商业智能功能的分析，复杂的事件挖掘，信源分析，过程挖掘等一系列以工作流轨迹日志为基石的应用。因此，修复丢失的事件变得尤为重要。

现有的一些修复算法如基于分支限界的修复算法能解决缺失情况下的修复，基于A星算法的修复算法能解决大多数情况下的修复，然而当工作流中存在循环结构时，A星算法趋于穷举法，会计算法出各种等价修复。在云计算、大数据时代，工作流轨迹以流的形式产生，如何实时高效的确定其中循环发生的次数进而修复日志变得尤为重要。

技术实现要素：

本发明的目的在于提供一种噪声环境下确定工作流轨迹中循环执行次数的方法。

实现本发明目的的技术方案为：一种噪声环境下确定工作流轨迹中循环执行次数的方法，步骤如下：

输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志，根据工作流模型计算其结构信息；

解析工作流轨迹日志得到事件序列，将事件序列中的每个事件加入多重集中，计算多重集中每个元素的重数，判断工作流模型中循环是否嵌套；

对于不带嵌套的循环，运用启发式规则计算工作流轨迹的循环次数；

对于带嵌套的循环，先运用启发式规则计算外层循环次数，再将工作流轨迹分段，最后利用启发式规则计算每个分段的内层循环次数。

与现有技术相比，本发明的显著优点为：

(1)本发明运用启发式规则，确定工作流轨迹中循环执行次数的速度更快；

(2)本发明将工作流轨迹进行分段处理，解决嵌套循环的循环次数。

附图说明

图1为本发明噪声环境下确定工作流轨迹中循环执行次数的方法流程图。

图2为基本循环的F₁和F₂结构示意图。

图3为循环不带嵌套的Petri网实例示意图。

图4为循环有嵌套的Petri网实例示意图。

具体实施方法

结合图1，本发明的一种噪声环境下确定工作流轨迹中循环执行次数的方法，步骤如下：

输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志，根据工作流模型计算其结构信息；

解析工作流轨迹日志得到事件序列，将事件序列中的每个事件加入多重集中，计算多重集中每个元素的重数，判断工作流模型中循环是否嵌套；

对于不带嵌套的循环，运用启发式规则计算工作流轨迹的循环次数；

对于带嵌套的循环，先运用启发式规则计算外层循环次数，再将工作流轨迹分段，最后利用启发式规则计算每个分段的内层循环次数。

进一步的，所述由带有循环的Petri网表示的工作流模型为一个三元组PN＝(P，T，F)，其中P为库所的有限集，T为变迁的有限集，F为Petri网的有向边，如图2所示，结构信息中循环体为有向图中的环路，F₁为循环体中至少执行一次的结构块，F₂为循环体中执行次数比F₁执行次数少一次的结构块；

计算结构信息的具体过程为：

使用有向图中寻找所有环路的算法得到所有循环体；对于每一个循环体，计算循环体中每一个元素在PN中的入度和出度，取循环体中从入度大于1的元素到出度大于1的元素的部分作为该循环体的F₁，取循环体中除F₁之外的剩余部分作为该循环体的F₂；对于PN，将每一个循环体中的F₁和F₂结构分别加入F₁和F₂的集合F₁s和F₂s中。

进一步的，解析工作流轨迹日志得到事件序列，将事件序列中的每个事件加入多重集中，计算多重集中每个元素的重数，判断工作流模型中循环是否嵌套的具体过程为：

工作流轨迹日志中事件为event₁，event₂......，事件序列为σ＝event₁event₂event₃......；多重集em＝{event₁，event₂，event₃，......}为允许同一种元素出现次数大于1的集合，对于任意多重集中的任意元素e，元素e的重数m(e)表示e在多重集中在出现的频数；

遍历事件序列σ，将事件序列σ中的每个事件σ[i]加入em中，i为事件序列中事件索引，计算em中每个事件的重数；对F₁s进行遍历，若F₁s中的任意两个元素存在交集，则工作流中的循环存在嵌套，否则没有嵌套。

进一步的，启发式规则为对于任意的多重集M，设元素t为M中主要元素，t＝domi(M)，m(t)≥m(t')；quot(L)为循环体L的循环次数，循环体L的F₁和F₂结构分别为F_L1和F_L2；

对于不带嵌套的循环，运用启发式规则计算工作流轨迹的循环次数的具体过程为：

S11，以em中元素的重数构建另一多重集M_L，M_L＝{m’(x)|x∈s(σ)∩F_L1}∪{m’(y)+1|y∈s(σ)∩F_L2}，其中s(σ)为事件序列σ中的所有事件，m’(x)和m’(y)为元素x和y在em中的重数；

S12，应用启发式规则，求出domi(M_L)；

S13，quot(L)＝domi(M_L)-1。

进一步的，对于带嵌套的循环，外层循环和内层循环分别表示为L_outer和L_inner，quot(L_outer)和quot(L_inner)分别为外层循环和内层循环的循环次数，L_outer的F₁和F₂分别为F_outer1和F_outer2，L_inner的F₁和F₂分别为F_inner1和F_inner2；

计算外层循环次数和内层循环次数的方法为：

S21，以em中元素的重数构建外层循环的多重集M_outer，M_outer＝{m(x’)|x’∈s(σ)∩F_oute1\(F_inner1∪F_inner2)}∪{m(y’)+1|y’∈s(σ)∩F_outer2}，求出quot(L_outer)＝domi(M_outer)-1，m’(x’)和m’(y’)为元素x’和y’在em中的重数；

S22，选取元素z∈F_outer1或者z'∈F_outer2使得m(z)＝m(z’)+1＝quot(L_outer1)，以该元素将工作流轨迹分段；

S23，在每段中继续递归运用启发式规则确定每个分段的内层循环次数。

下面结合具体实施例对本发明做进一步说明。

实施例1

图3是一个没有循环嵌套的工作流模型PN₁，其中P_source,P_ink,P₁,P₂......分别为工作流模型中的库所，t₁,t₂,......为PN₁中的变迁，PN₁中的F₁为图3中库所P₁至库所P₄中间的部分，入度等于2，出度等于2。

F₁＝{t₂，t₃，t₄}，F₂＝{t₅}，现有工作流轨迹σ＝t₁t₂t₄t₃t₄t₂t₃t₄t₆，求解过程如下：

步骤1，获得工作流的循环结构IR1结构信息F₁＝{t₂，t₃，t₄}，F₂＝{t₅}；

步骤2，根据工作流轨迹σ＝t₁t₂t₄t₃t₄t₂t₃t₄t₆获得多重集em＝{t₁，t₂，t₄，t₃，t₄，t₂，t₃，t₄，t₆}，计算出em中各元素出现的频数，得m(t₁)＝1，m(t₂)＝2，m(t₃)＝2，m(t₄)＝3，m(t₆)＝1；

步骤3，根据em中元素的重数构成多重集M，M＝{m(e')|e'∈s(σ)∩F₁}∪{m(e')+1|e'∈s(σ)∩F₂}＝{m(t₂)，m(t₃)，m(t₄)，m(t₅)+1}＝{2，2，3，1}，所以domi(M)＝2，计算循环发生次数quot(IR)＝domi(M)-1＝1，即此事件序列中的循环发生了一次。

实施例2

图4是一个循环带有嵌套的工作流模型PN₂，其中P_source,P_ink,P₁,P₂......分别为工作流模型中的库所，t₁,t₂,......为PN₂中的变迁，考虑其产生的带有噪声的工作流轨迹σ＝t₁t₂t₃t_b1t_e1t₄t₅t₆t_b2t₃t_b1t₃t_b1t_e1t₅t₆t_b2t₂t₃t_e1t₅t₄t₆，求解过程如下：

步骤1，获得工作流的结构信息，外部循环IR1的结构信息为F₁＝{t₂，t₃，t_b1，t_e1，t₄，t₅，t₆}，F₂＝{t_b2}，内部循环IR2的循环体结构信息为F₁'＝{t₃}，F₂'＝{t_b1}；

步骤2，根据工作流轨迹，得到多重集em＝{t₁，t₂，t₃，t_b1，t_e1，t₄，t₅，t₆，t_b2，t₃，t_b1，t₃，t_b1，t_e1，t₅，t₆，t_b2，t₂，t₃，t_e1，t₅，t₄，t₆}，计算重数的m(t₁)＝1，m(t₂)＝2，m(t₃)＝4，m(t₄)＝2，m(t₅)＝3，m(t₆)＝3，m(t_b1)＝3，m(t_e1)＝3，m(t_b2)＝2，m(t_e2)＝0；

步骤3，根据重数计算出：

M＝{m(e)|e∈s(σ)∩F₁\(F₁'∪F₂')}∪{m(e)+1|e∈s(σ)∩F₂}＝{m(t₂)，m(t_e1)，m(t₄)，m(t₅)，m(t₆)，m(t_b2)+1}＝{2，3，2，3，3，3}，其中t₂，t_e1，t₄，t₅，t₆∈F₁\(F₁'∪F₂')；计算得domi(M)＝3，因此外层循环的发生次数为quot(IR₁)＝domi(M)-1＝2；因为m(t₆)-1＝2＝quot(IR₁)，所以选取t₆为分段元素，分段后σ＝t₁t₂t₃t_b1t_e1t₄t₅t₆-t_b2t₃t_b1t₃t_b1t_e1t₅t₆-t_b2t₂t₃t_e1t₅t₄t₆所示的用“-”分隔的三个片段简写为σ＝σ₁σ₂σ₃；

步骤4：运用上面的方法继续计算σ₁、σ₂、σ₃中的循环发生次数，其中对于σ₁＝t₁t₂t₃t_b1t_e1t₄t₅t₆，M₁＝{m(t₃)∪m(t_b1)}＝{1,2}，所以domi(M₁)既可以等于1也可以等于2，我们选择domi(M₁)＝1，则quot(σ₁)＝domi(M₁)-1＝0，σ₂和σ₃依此类推。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋巍;夏小旭;陈芳菲;张成震;
技术所有人：南京理工大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。