一种流程模型的相似性度量方法、装置、设备及介质

文档序号:31634162发布日期:2022-09-24 03:01阅读:107来源:国知局
一种流程模型的相似性度量方法、装置、设备及介质

1.本技术涉及业务流程中相似性模型技术领域,特别涉及一种流程模型的相似性度量方法、装置、设备及介质。


背景技术:

2.随着企业的流程模型库规模化和复杂化,导致流程模型库的存储量越来越大,使流程模型的管理难度直线上升。为了方便流程管理,首先就是解决流程模型检索问题,实现对需要进行分析的流程模型的快速定位。流程模型的相似性,就是用于快速定位流程模型的一个有效指标,企业通过定位流程模型库中的相似流程,对流程模型做进一步的分析,从而实现流程管理效率的提高,所以流程相似性度量对于流程管理具有非常重要的作用。目前流程相似性的研究主要从这三个方面分析,即文本相似性、结构相似性和行为相似性。其中:
3.文本相似性是指度量流程模型中任务、事件或其他模型元素的标签文本信息或语法语义信息相似性,并将其作为度量两个流程模型相似性的一个指标。
4.结构相似性是指流程模型拓扑结构相似,主要体现在流程中各元素单元通过何种逻辑关系互相连接起来,在很大程度上决定了流程中的相关数据以及控制流的运转方向。
5.行为相似性是指从流程模型出发模拟流程产生的序列相似性或者研究模型中任务活动之间的依赖关系之间的相似性。
6.但是,无论是上述哪一种流程模型相似性度量方法,均存在度量维度单一,从而导致度量结果不够精确。


技术实现要素:

7.本技术提供了一种流程模型的相似性度量方法、装置、设备及介质,通过从结构相似性和行为相似性两大维度去度量新建的流程模型与企业流程模型数据库中的流程模型的相似性,能够提高度量结果的准确性。
8.为了实现上述目的,本技术采用如下技术方案:
9.第一方面,本技术提供了一种流程模型的相似性度量方法,包括:
10.将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,其中,边为变迁节点与库所节点相连的边;
11.基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,其中,紧邻变迁对为库所节点前后的两个变迁节点,各紧邻变迁对都有两条边;
12.基于所述紧邻变迁对集合以及预设流程模型的紧邻变迁对集合,确定所述petri网流程模型与预设流程模型的相似性。
13.通过采用上述技术方案,先是通过对新建的业务流程进行描述以及分析,进而根据描述以及分析结果构建一个灵活可分析的petri网流程模型,然后通过对petri网流程模
型进行仿真得到事件日志,在仿真的过程中,根据业务流程的实际要求与目的,对活动发生的概率进行预定义,能够得到更具真实性的事件日志,再根据事件日志中的行为信息来确定petri网流程模型中每条边的权重,petri网流程模型通过库所节点、变迁节点、令牌以及有向弧来将新建的业务流程映射出来,库所节点与变迁节点之间通过有向弧连接,紧邻变迁对指代中间仅隔一个库所节点的两个变迁节点,紧邻变迁对中的两个变迁节点均与同一库所节点通过有向弧连接,这里的有向弧即为上文中的描述的边,由于petri网流程模型中各边的权重是已经确定好的,所以可以确定一个紧邻变迁对有涉及有两条边的权重,可以基于这两条边的权重来确定紧邻变迁对的重要性系数,就可以得到petri网流程模型中所有带重要性系数的紧邻变迁对的集合,通过比较流程模型与流程模型之间的紧邻变迁对的集合的相似性来确定流程模型与流程模型,本方案通过事件日志的行为信息确定边权重后再通过边权重来确定紧邻变迁对的重要性系数,进而通过比较带重要性系数的紧邻变迁对之间的相似性来度量流程模型与流程模型之间的相似性,在构造紧邻变迁对的重要性系数时从边权重上去考虑,即在基于结构相似特征上增加行为相似特征,基于两大维度去比较流程模型的相似性,在比较结构相似特征的同时还比较了行为相似特征,如果仅从单一维度去比较,可能会因为考虑不周全而影响最终的度量结果,如果结合行为相似特征、结构相似特征以及文本相似特征三大维度去比较,虽然能够提高度量精度,但是会对度量流程模型相似性的速率造成较大的影响。本方案在提高度量精度的同时还能保度量速率。
14.根据本技术第一方面的一种能够实现的方式,所述将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,包括:
15.将所述petri网流程模型通过prom软件进行仿真,获取所述petri网流程模型的事件日志;
16.基于所述事件日志,再通过prom软件将所述事件日志中的行为信息进行可视化转换,得到所述petri网流程模型的行为序列轨迹以及每条行为轨迹的发生次数;
17.基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定所述petri网流程模型中各边的权重。
18.根据本技术第一方面的一种能够实现的方式,所述基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定所述petri网流程模型中各边的权重,包括:
19.基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定各紧邻变迁对所在行为轨迹的发生次数以及确定所述事件日志中所有行为轨迹的发生次数之和;
20.确定紧邻变迁对所在轨迹的发生次数与所述事件日志中所有行为轨迹的发生次数之和的比值,将所述比值作为该紧邻变迁对之间与库所相连的两条边的权重;
21.若所述petri网流程模型的一条边有多个权重,则将这多个权重的和作为该条边的权重。
22.根据本技术第一方面的一种能够实现的方式,所述基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,包括:
23.基于所述各边的权重,在确定紧邻变迁对中两条边的权重之后,将最小的权重作为该紧邻变迁对的重要性系数;
24.基于各紧邻变迁对的重要性系数,构建所述petri网流程模型的紧邻变迁对集合。
25.根据本技术第一方面的一种能够实现的方式,通过相似性计算公式确定所述petri网程模型与预设模型的相似性,其中,所述相似性计算公式为:
[0026][0027]
式中,sim(n1,n2)表示流程模型n1与预设流程模型n2的相似性,n1表示petri网流程模型,n2表示预设流程模型,tars1表示petri网流程模型的紧邻变迁对集合,tars2表示预设流程模型的紧邻变迁对集合,tars1∪tars2表示petri网流程模型的紧邻变迁对集合与预设流程模型的紧邻变迁对集合的并集,tars1∩tars2表示petri网流程模型的紧邻变迁对集合与预设流程模型的紧邻变迁对集合的交集,|tars1∪tars2|表示为并集的紧邻变迁对的重要性系数之和,|tars1∩tars2|表示为交集的紧邻变迁对的重要性系数之和。
[0028]
根据本技术第一方面的一种能够实现的方式,在确定所述petri网流程模型与预设流程模型的相似性之后,还包括:
[0029]
基于ndcg计算所述相似性的度量准确性,其中,ndcg的计算公式如下:
[0030][0031]
式中,ndcg用来表示相似性的度量准确性,dcg用来表示在实验情况下的增加相关度影响比重,idcg用来表示在理想情况下的增加相关度影响比重,p表示预设流程模型的数量,a表示实验排序结果中的排序位置,rela表示实验排序结果中排在第a位的预设流程模型对应的权重值,b表示基准排序结果中的排序位置,relb表示基准排序结果中排在第b位的预设流程模型对应的权重值。
[0032]
第二方面,本技术提供了一种流程模型的相似性度量装置,包括:
[0033]
权重确定模块,用于将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,其中,边为变迁节点与库所节点相连的边;
[0034]
紧邻变迁对集合模块,用于基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,其中,紧邻变迁对为库所节点前后的两个变迁节点,各紧邻变迁对都有两条边;
[0035]
相似性确定模块,用于基于所述紧邻变迁对集合以及预设流程模型的紧邻变迁对集合,确定所述petri网流程模型与预设流程模型的相似性。
[0036]
第三方面,本技术实施例提供一种设备,包括存储器、处理器以及存储在所述存储器中并能在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项流程模型的相似性度量方法的步骤。
[0037]
第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项流程模型的相似性度量方法的步骤。
[0038]
综上所述,与现有技术相比,本技术从结构相似性和行为相似性两大维度去度量petri网流程模型与企业数据库中流程模型的相似性,通过事件日志的行为信息确定边权重后再通过边权重来确定紧邻变迁对的重要性系数,进而通过比较带重要性系数的紧邻变迁对之间的相似性来度量流程模型与流程模型之间的相似性,在构造紧邻变迁对的重要性系数时从边权重上去考虑,在提高度量精度的同时还能保度量速率。
附图说明
[0039]
图1为本技术较优选实施例提供的流程模型的相似性度量方法的流程示意图;
[0040]
图2为本技术较优选实施例提供的流程模型的相似性度量方法的结构框图;
[0041]
图3为本技术较优选实施例提供的流程模型的相似性度量方法中的petri网流程模型和预设流程模型的结构图。
具体实施方式
[0042]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0043]
本技术的说明书和权利要求书中的术语“包括”以及它的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0044]
下面结合说明书附图对本技术实施例作进一步详细描述。
[0045]
如图1所示,本技术第一个较优选实施例公开了一种流程模型的相似性度量方法,所述方法包括:
[0046]
s1、将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,其中,边为变迁节点与库所节点相连的边;
[0047]
具体地,petri网流程模型是通过对新建的业务流程的描述以及分析之后构建得到的;然后将构建得到petri网流程模型通过prom软件软件进行仿真得到事件日志,在仿真的过程中,根据流程的实际要求与目的,对活动发生的概率进行预定义,从而能够得到更具真实性的事件日志。图3所示为petri网流程模型的一个结构图,圆形指的是库所节点,方形指的是变迁节点,本技术中提及到的边即为库所节点与变迁节点之间的有向弧。
[0048]
在一实施例中,所述将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,包括:
[0049]
将所述petri网流程模型通过prom软件进行仿真,获取所述petri网流程模型的事件日志;
[0050]
基于所述事件日志,再通过prom软件将所述事件日志中的行为信息进行可视化转换,得到所述petri网流程模型的行为序列轨迹以及每条行为轨迹的发生次数;
[0051]
基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定各紧邻变迁对所在行为轨迹的发生次数以及确定所述事件日志中所有行为轨迹的发生次数之和;
[0052]
确定紧邻变迁对所在轨迹的发生次数与所述事件日志中所有行为轨迹的发生次数之和的比值,将所述比值作为该紧邻变迁对之间与库所相连的两条边的权重;
[0053]
若所述petri网流程模型的一条边有多个权重,则将这多个权重的和作为该条边的权重。
[0054]
具体地,紧邻变迁对指的是库所节点前后的两个变迁节点。
[0055]
具体地,再次基于prom软件软件,将所述petri网流程模型的事件日志的行为信息可视化后,获取所述petri网流程模型的行为序列轨迹以及每条行为轨迹的发生次数,如将事件日志表示为《a,b》,遍历所述事件日志的所有轨迹,并统计所有轨迹中存在的以任务a开始、以任务b结束的子序列的次数,得到统计的子序列次数与事件日志所有行为轨迹之和的比值,并将该比值作为紧邻变迁对之间与库所节点相连的两条边的权重;有些边对应多个紧邻变迁对,这些边也会相应有多个权重,则将这些权重的和作为该条边的权重。
[0056]
s2、基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,其中,紧邻变迁对为库所节点前后的两个变迁节点,各紧邻变迁对都有两条边;
[0057]
在一实施例中,所述基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,包括:
[0058]
基于所述各边的权重,在确定紧邻变迁对中两条边的权重之后,将较小的权重作为该紧邻变迁对的重要性系数;
[0059]
基于各紧邻变迁对的重要性系数,构建所述petri网流程模型的紧邻变迁对集合。
[0060]
s3、基于所述紧邻变迁对集合以及预设流程模型的紧邻变迁对集合,确定所述petri网流程模型与预设流程模型的相似性。
[0061]
具体地,预设流程模型指的是企业数据库中存储的全部流程模型,预设流程模型的紧邻变迁对集合也是提前确定好并存储在企业数据库中的,需要比较petri网流程模型与预设流程模型的相似性时,直接从企业数据库中调用对应的预设流程模型的数据即可。
[0062]
在一实施例中,通过相似性计算公式确定所述petri网流程模型与预设模型的相似性,其中,所述相似性计算公式为:
[0063][0064]
式中,sim(n1,n2)表示petri网流程模型n1与预设流程模型n2的相似性,n1表示petri网流程模型,n2表示预设流程模型,tars1表示petri网流程模型的紧邻变迁对集合,tars2表示预设流程模型的紧邻变迁对集合,tars1∪tars2表示petri网流程模型的紧邻变迁对集合与预设流程模型的紧邻变迁对集合的并集,tars1∩tars2表示petri网流程模型的紧邻变迁对集合与预设流程模型的紧邻变迁对集合的交集,|tars1∪tars2|表示为并集的紧邻变迁对的重要性系数之和,|tars1∩tars2|表示为交集的紧邻变迁对的重要性系数之和。
[0065]
具体地,tars1∩tars2={λitari|λi=min(λ
1i

2i
)},式中,λitari表示交集中第i个紧邻变迁对以及对应的重要性系数,λ
1i
表示第i个紧邻变迁对在petri网流程模型中对应的重要性系数,以及λ
2i
表示第i个紧邻变迁对在预设流程模型中对应的重要性系数。
[0066]
具体地,tars1∪tars2={λitari|λi=max(λ
1i

2i
)},式中,λitari表示并集中第i个
紧邻变迁对以及对应的重要性系数,λ
1i
表示第i个紧邻变迁对在petri网流程模型中对应的重要性系数,以及λ
2i
表示第i个紧邻变迁对在预设流程模型中对应的重要性系数。
[0067]
具体地,如图3所示,可以将图3中的n1看成petri网流程模型,以及将n2看成预设流程模型,基于处理后的n1和n2,可以获取其带重要性系数tars1和tars2,分别为:
[0068]
tars1={0.85(a

b),0.15(a

c),1(a

d),0.85(b

e),0.15(c

e),1(d

e),0.875(e

f),0.125(e

g)}
[0069]
tars2={1(a

c),1(a

d),1(c

e),1(d

e),0.875(e

f),0.125(e

g)}
[0070]
基于上述tars1和tars2,求得交集tars1∩tars2与并集tars1∪tars2分别为:
[0071]
tars1∪tars2={0.85(a

b),1(a

c),1(a

d),0.85(b

e),1(c

e),1(d

e),0.875(e

f),0.125(e

g)}
[0072]
tars1∩tars2={0.15(a

b),1(a

d),0.15(c

e),1(d

e),0.875(e

f),0.125(e

g)}
[0073]
基于相似性计算公式,可以得到:
[0074][0075]
基于上述处理步骤,分别计算petri网流程模型p0与其他预设流程模型p
1-p
13
的相似性,并根据相似性从高到低对预设流程模型p
1-p
13
进行排序,如表1所示:
[0076]
[0077][0078]
表1
[0079]
为获得预设流程模型p
1-p
13
与petri网流程模型p0的相似性的基准排序结果,实验人员采访了15位相关专业的领域专家,这些专家基于专业知识及经验,对这13条预设流程模型按相似性大小进行排序,综合15位专家的排序意见得到一个基准排序结果,其排序结果会给对应的预设流程模型赋予一个权重(从0.9至0.3以间隔为0.05依次递减),如表2所示:
[0080][0081][0082]
表2
[0083]
基于表1、表2以及ndcg(归一化折损累积增益)的计算公式,计算该相似性度量方法的度量准确性,其准确性为98.6%。
[0084]
其中,ndcg的计算公式定义如下:
[0085][0086]
式中,ndcg用来表示相似性的度量准确性,dcg用来表示在实验情况下的增加相关度影响比重,idcg用来表示在理想情况下的增加相关度影响比重,p表示预设流程模型的数量,a表示实验排序结果中的排序位置,rela表示实验排序结果中排在第a位的预设流程模型对应的权重值,b表示基准排序结果中的排序位置,relb表示基准排序结果中排在第b位的预设流程模型对应的权重值。
[0087]
进一步,为了便于更直观地反映本方案的度量准确性,依据上述处理步骤,计算其它已有的流程模型相似性度量方法的度量准确性,其它流程模型相似性度量方法的度量准确性计算结果如表3所示。
[0088]
度量方法名称度量目标度量准确性mds结构相似性93.84%pts++行为相似性90.51%
[0089]
表3
[0090]
通过采用上述技术方案,先是通过对新建的业务流程进行描述以及分析,进而根据描述以及分析结果构建一个灵活可分析的petri网流程模型,然后利用prom软件对petri网流程模型进行仿真得到事件日志,在仿真的过程中,根据业务流程的实际要求与目的,对活动发生的概率进行预定义,能够得到更具真实性的事件日志,并再次利用prom软件将事件日志中的行为信息进行可视化转换,得到petri网流程模型的行为序列轨迹以及每条行为轨迹的发生次数后,确定各紧邻变迁对所在行为轨迹的发生次数与所述事件日志中所有行为轨迹的发生次数之和的比值,就将这个比值作为该紧邻变迁对的边的权重,有些边对应多个紧邻变迁对,这些边也会相应有多个权重,则将这些权重的和作为该条边的权重,由于紧邻变迁对中的两条边的权重可能是不同的,可以将紧邻变迁对中最小的权重作为该紧邻变迁对的重要性系数,就可以得到petri网流程模型中所有带重要性系数的紧邻变迁对的集合,通过比较流程模型与流程模型之间的紧邻变迁对的集合的相似性来确定流程模型与流程模型,本方案通过事件日志的行为信息确定边权重后再通过边权重来确定紧邻变迁对的重要性系数,进而通过比较带重要性系数的紧邻变迁对之间的相似性来度量流程模型与流程模型之间的相似性,在构造紧邻变迁对的重要性系数时从边权重上去考虑,即在基于结构相似特征上增加行为相似特征,基于两大维度去比较流程模型的相似性,在比较结构相似特征的同时还比较了行为相似特征,如果仅从单一维度去比较,可能会因为考虑不周全而影响最终的度量结果,如果结合行为相似特征、结构相似特征以及文本相似特征三大维度去比较,虽然能够提高度量精度,但是会对度量流程模型相似性的速率造成较大的影响。为了验证度量结果的准确率,本方案中还引入了ndcg(归一化折损累积增益)计算公
式,能够对本方案计算得到的度量方式进行验证。
[0091]
如图2所示,本技术还公开了一种流程模型的相似性度量装置,所述装置包括:
[0092]
权重确定模块201,用于将petri网流程模型进行仿真得到事件日志,确定所述petri网流程模型中各边的权重,其中,边为变迁节点与库所节点相连的边;
[0093]
紧邻变迁对集合模块202,用于基于所述各边的权重确定所述petri网流程模型中紧邻变迁对的重要性系数,从而构建所述petri网流程模型的紧邻变迁对集合,其中,紧邻变迁对为库所节点前后的两个变迁节点,各紧邻变迁对都有两条边;
[0094]
相似性确定模块203,用于基于所述紧邻变迁对集合以及预设流程模型的紧邻变迁对集合,确定所述petri网流程模型与预设流程模型的相似性。
[0095]
在一实施例中,所述权重确定模块201还包括:
[0096]
事件日志获取单元,用于将所述petri网流程模型通过prom软件进行仿真,获取所述petri网流程模型的事件日志;
[0097]
序列轨迹确定单元,用于基于所述事件日志,再通过prom软件将所述事件日志中的行为信息进行可视化转换,得到所述petri网流程模型的行为序列轨迹以及每条行为轨迹的发生次数;
[0098]
权重确定单元,用于基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定所述petri网流程模型中各边的权重。
[0099]
在一实施例中,所述权重确定模块201还包括:
[0100]
行为轨迹发生次数确定单元,用于基于所述行为序列轨迹以及每条行为轨迹的发生次数,确定各紧邻变迁对所在行为轨迹的发生次数以及确定所述事件日志中所有行为轨迹的发生次数之和;
[0101]
比值确定单元,用于确定紧邻变迁对所在轨迹的发生次数与所述事件日志中所有行为轨迹的发生次数之和的比值,将所述比值作为该紧邻变迁对之间与库所相连的两条边的权重;
[0102]
多权重确定单元,用于若所述petri网流程模型的边有多个权重,则将这多个权重的和作为该条边的权重。
[0103]
在一实施例中,所述紧邻变迁对集合模块202还包括:
[0104]
重要性系数确定单元,用于基于所述各边的权重,在确定紧邻变迁对中两条边的权重之后,将最小的权重作为该紧邻变迁对的重要性系数;
[0105]
紧邻变迁对集合确定单元,用于基于各紧邻变迁对的重要性系数,构建所述petri网流程模型的紧邻变迁对集合。
[0106]
在一个实施例中,提供了一种电子设备,具体为计算机设备,包括存储器、处理器以及存储在所述存储器中并能在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项流程模型的相似性度量方法的步骤。
[0107]
在一个实施例中,提供了一种存储介质,具体为计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时上述任意一项流程模型的相似性度量方法的步骤。
[0108]
以上所述是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为
本技术的保护范围。
[0109]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、rom(read-only memory,只读存储记忆体)或ram(random access memory,随机存储记忆体)等。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1