本发明涉及流程发现领域,尤其涉及一种基于预测性日志增强的流程发现方法及系统。
背景技术:
1、流程发现是流程挖掘领域中最具有挑战性的技术。流程发现算法则主要处理序列化的日志信息,生成可视化的业务流程模型,包括通常使用图形符号来表示活动、顺序和依赖关系,以便于理解和分享。通过自动化地识别和建模业务流程,为组织提供了改进效率、降低风险和提高客户满意度的机会。
2、流程预测算法是基于历史事件数据或事件日志的分析技术,旨在预测在未来可能出现的下一个活动类型或其他状态。这些算法通常使用已经记录的事件序列来构建模型,以识别和预测业务流程中的模式和趋势,从而帮助组织提供数据驱动的决策支持,或者利用模型实时预测帮助企业更好监控业务流程。
3、目前流程发现方法过于依赖于日志数据质量,当日志文件的结构化程度较低时或存在大量噪声事件时,将难以挖掘到有效的流程模型,即意味原本期望可视化业务流程的模型没有准确概括事件日志,或没有提供对事件日志任何有意义的抽象。但目前用于预处理日志数据的方法主要是基于领域知识,筛选、过滤掉一部分可能影响流程发现过程的流程轨迹;该类方法过于依赖不同场景下的数据特征,且可能造成一些有用的信息丢失。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种可以获得更加精确的最优流程模型的基于预测性日志增强的流程发现方法。
2、本发明提供一种基于预测性日志增强的流程发现方法,包括:
3、s1:获取业务流程日志中的轨迹,将轨迹划分为训练轨迹集合laμ和预测轨迹集合lbμ,μ为迭代编号;
4、s2:计算获得训练轨迹集合laμ的训练头序列集合saμ,以及预测轨迹集合lbμ的预测头序列集合sbμ;
5、s3:通过训练头序列集合saμ对预测模型mμ-1进行训练,获得预测模型mμ;
6、s4:将预测头序列集合sbμ输入预测模型mμ进行事件活动预测,获得参考头序列集合sbμ';提取sbμ'中已完成的头序列并与laμ合并,获得训练轨迹集合laμ+1;将sbμ'中剩余的头序列作为预测头序列集合sbμ+1;
7、s5:通过训练轨迹集合laμ+1计算获得流程模型paμ+1,通过流程模型paμ+1计算获得最佳评价得分ebest;若μ等于最大迭代次数β或ebest收敛,则输出流程模型paμ+1为最优流程模型;否则令μ=μ+1并返回步骤s1。
8、优选的,步骤s1具体为:
9、s11:获取业务流程日志l={σ1, σ2, σ3,…,σλ,…},其中,λ表示轨迹的编号,σλ表示第λ条轨迹,a为业务流程日志中记录的全部活动类型的集合;
10、s12:令σλ={e1, e2,…, em, …},其中,m表示事件的编号,em=(λ, am)表示在轨迹σλ中执行的第m个事件,am∈a为事件em的活动类型;
11、s13:设置划分比例τ,将业务流程日志l中的轨迹随机划分至训练轨迹集合laμ和预测轨迹集合lbμ中,laμ和lbμ包含的轨迹数量比为τ:(1-τ)。
12、优选的,步骤s2具体为:
13、s21:设置头序列长度大小为w;
14、s22:按照时间顺序,获取训练轨迹集合laμ中各轨迹包含的活动子序列,将各活动子序列通过填充和截断转化为固定长度为w的头序列,得到对应的训练头序列集合saμ;
15、s23:按照步骤s22获取预测轨迹集合lbμ对应的预测头序列集合sbμ。
16、优选的,步骤s3具体为:
17、s31:令训练头序列集合saμ={s1, s2, …,sk,…},其中,k表示头序列的编号,sk表示第k个头序列;
18、s32:初始化活动特征矩阵h,构建映射表ftran,通过映射表ftran将头序列sk中的活动类型映射为对应的活动序号qk,根据活动序号qk和活动特征矩阵h构建对应的序列特征vk;
19、s33:重复步骤s32,获取所有头序列对应的序列特征,获得序列特征集合{v1, v2,…,vk,…};
20、s34:设置流程结束符号为[e],将序列特征集合{v1, v2, …,vk,…}和真实的下一个活动序号输入预测模型mμ-1进行训练,获得预测模型mμ。
21、优选的,步骤s4具体为:
22、s41:获取预测头序列集合sbμ={s1, s2, …,sz,…},其中,z表示头序列的编号,sz表示第z个头序列;令初始参考头序列集合sb0μ'=sbμ;
23、s42:获取头序列sz的活动类型集合<a1, a2, …, aw>,其中,w为头序列长度,aw为第w个事件的活动类型;
24、s43:将头序列sz对应的序列特征vz输入预测模型mμ进行事件活动预测,获得预测的下一个事件的活动类型y,令当前参考头序列集合sbzμ'=sb(z-1)μ'∪<a1, a2, …, aw,y>;令z=z+1;
25、s44:重复步骤s42-s43直至所有头序列对应的序列特征均输入预测模型mμ,获得参考头序列集合sbμ';
26、s45:将参考头序列集合sbμ'中具有流程结束符号[e]的头序列作为已完成的头序列,将已完成的头序列与训练轨迹集合laμ合并获得训练轨迹集合laμ+1;将参考头序列集合sbμ'中剩余的头序列作为预测头序列集合sbμ+1。
27、优选的,步骤s5具体为:
28、s51:在训练轨迹集合laμ+1中,基于流程发现算法获得流程模型paμ+1,计算获得流程模型paμ+1在训练轨迹集合laμ上的评价得分eμ+1;若eμ+1>ebest,则将eμ+1的值赋予ebest;
29、s52:判断ebest是否收敛,若收敛则输出流程模型paμ+1为最优流程模型,否则进入步骤s53:
30、s53:判断μ是否等于最大迭代次数β,若等于则输出流程模型paμ+1为最优流程模型,否则令μ=μ+1并返回步骤s1。
31、一种存储设备,所述存储设备存储指令及数据用于实现所述的基于预测性日志增强的流程发现方法。
32、一种基于预测性日志增强的流程发现系统,包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现所述的基于预测性日志增强的流程发现方法。
33、本发明具有以下有益效果:
34、本发明通过业务流程日志中的轨迹提取训练头序列集合和预测头序列集合,通过训练头序列集合训练预测模型,再将预测头序列集合输入预测模型对训练头序列集合和预测头序列集合进行更新,通过不断更新的训练头序列集合、预测头序列集合和预测模型可减少因噪声和异常数据对流程模型的影响,获得更加精确的最优流程模型,提高获得的最优流程模型的鲁棒性和通用性。
1.一种基于预测性日志增强的流程发现方法,其特征在于,包括:
2.根据权利要求1所述的基于预测性日志增强的流程发现方法,其特征在于,步骤s1具体为:
3.根据权利要求1所述的基于预测性日志增强的流程发现方法,其特征在于,步骤s2具体为:
4.根据权利要求1所述的基于预测性日志增强的流程发现方法,其特征在于,步骤s3具体为:
5.根据权利要求1所述的基于预测性日志增强的流程发现方法,其特征在于,步骤s4具体为:
6.根据权利要求1所述的基于预测性日志增强的流程发现方法,其特征在于,步骤s5具体为:
7.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~6任一项所述的基于预测性日志增强的流程发现方法。
8.一种基于预测性日志增强的流程发现系统,其特征在于:包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1~6任一项所述的基于预测性日志增强的流程发现方法。