纵横交错的混合式资源分配规则挖掘方法

文档序号:10687758阅读:319来源:国知局
纵横交错的混合式资源分配规则挖掘方法
【专利摘要】本发明提出一种基于“纵横交错”方法的混合式资源分配规则挖掘方法,用于从工作流日志获取到更为准确的资源分配知识。该方法以事件和案例作为基本事务单位对工作流日志处理,分别获得工作流日志的横向事件视图和纵向案例视图。在上述基础上,基于关联规则挖掘方法,对两种日志视图进行数据挖掘,从而得到不同日志视图下的关联规则。在上述基础上,利用当前工作流任务的前置条件对所有的规则进行筛选,并以支持度和置信度对两种视图下挖掘的关联规则进行综合排序。本发明提出的纵横交错资源分配规则挖掘方法能够得到比现有单一日志结构的过程挖掘方法预测准确度更高的资源分配规则。
【专利说明】
纵横交错的混合式资源分配规则挖掘方法
技术领域
[0001] 本发明涉及业务过程的知识发现领域,针对过程感知信息系统在任务执行前的资 源分配规则发现,具体而言,涉及一种对历史工作流日志进行深度处理和分配规则发现的 纵横交错的混合式资源分配规则挖掘方法,从而对实例化前的工作流任务在任务分配时的 执行资源推荐。
【背景技术】
[0002] 当前大多数工作流程驱动的信息系统的资源分配任务仍然是通过常规的资源分 类方法即角色/组织的方式进行组织的,工作流资源主要通过工作流资源的角色和组织单 元属性的交集进行分类,从而将所有的工作流资源分割为资源子集合,以方便工作流管理 人员进行资源的分配。事实上,这种基于资源分类的方式得到的资源类别通常粒度较大,并 且分类获得的资源集内部个体并无优先级推荐,因此,通常需要由管理人员对关键任务手 工分配执行人员,不利于管理人员对知识密集型任务的快速分配。
[0003] 工作流管理技术是制造企业实现业务过程自动化的重要支撑技术,它能够有效管 理企业信息系统(EIS)中的业务活动、人员与数据等重要元素,并协调其相互关系。工作流 是研究整个或部分业务过程在计算机支持下的全自动或半自动化的技术,是20世纪90年代 迅速崛起的一门新兴学科,被Thomas Friedman誉为二^--世纪产平"世界的第三大动力, 是继关系数据库技术之后又一个革命性的基础软件平台技术。
[0004] 工作流(workflow)由英文单词工作(work,可以看作工作或任务)和流(flow,可看 作流动或流程)组成。自工业革命以来,人们就把工作流程的优化和组织管理看作企业管理 的重要研究内容,相关的研究工作一直没有间断过。而随着计算机技术、网络技术以及数据 库技术等快速发展,基于计算机技术的工作流管理技术在上世纪八十年代开始出现,其最 早应用于生产组织和办公自动化(OA)领域,是针对日常工作中具有固定程序的活动的管理 而提出的一个概念。其目的是通过将常见的工作分解为粒度合适的任务和定义良好的角 色,依据一定的规则和过程来对其进行监控,以提高工作效率。随着不断的优化和发展,工 作流技术逐渐进入到医院、银行业、保险业等,而制造业则是工作流技术更为重要的领域之 O
[0005] 工作流领域的过程挖掘(Process Mining,也称为工作流挖掘,Workflow Mining) 是一个年轻的跨领域的交叉学科,涉及到计算智能、数据挖掘和过程建模与分析等领域。过 程挖掘技术,是一种从系统日志中发掘有用知识的技术,这些知识包括任务的控制流信息, 也可以是系统的资源组织结构信息等。
[0006] 虽然已经经过十多年的发展,过程挖掘技术已经得到了长足发展,但是其研究内 容主要集中在过程模型(控制流)发现,即从事件日志中间发现过程模型,包括挖掘过程中 任务节点的逻辑顺序等,隶属于过程及任务范畴。其中Cook等人主要研究从软件日志中发 现软件过程模型。而美国IBM的Agrawal是最早将过程模型发现技术应用于工作流领域的研 究成果,文献基于图论来表达工作流模型,并提出了一种满足完整性、非冗余性和最小性的 工作流图挖掘算法。Aalst等人运用归纳法处理工作流管理领域的过程发现问题。后来 Aalst又研究了一种从过程运行实例的历史中发现时序模型的方法,继而发展了一种基于 启发式算法从日志中发现过程的算法,和从过程日志中间发现工作流模型的α算法。随后有 中国吉林大学刘大有等人提出了 α算法的改进算法,以及能够发现重复任务的α**算法和基 于工作流网的过程挖掘算法等等。工作流过程模型作为挖掘结果,可以用于控制流的符合 性检查,或者用于改进现有的过程模型等。
[0007] 过程挖掘技术并不局限于过程与任务层面。随着过程挖掘技术研究的深入,有学 者开始研究挖掘工作流资源相互之间的关系(社会网络分析),Minsok Song等人基于社会 网络分析技术对工作流管理系统中资源之间的工作交接关系进行分析,通过得到的社会网 络关系对当前系统资源组织/角色架构提供一致性检查或者改组优化方案。在资源角色的 识别与分配方面,有基于日志挖掘的过程角色识别研究以及业务过程模型中的角色分配研 究等。
[0008] 据笔者所知,在过程挖掘领域,已经有大量的研究成果集中于业务过程的控制流 知识发现方面。虽然研究工作流管理过程中资源与流程以及任务之间的相互关系,具有重 要的意义,但在工作流资源管理方面的知识发现方面的研究(即组织挖掘,Organizational Mining)也并不常见,而这一领域的工作流的资源分配知识发现方面的研究则仍处于探索 阶段。下面就与工作流资源分配相关的研究内容介绍如下:
[0009] 在挖掘方法方面,德国乌尔姆大学的Ly等人把从历史数据中挖掘任务执行规则的 任务看成为一个归纳学习问题,并基于一种决策树学习的方法进行了一些探索研究。Y.Liu 等人研究了一种基于隐马尔可夫模型的资源分配规则发现方法并讨论了一种半自动的工 作流资源分配方法,为了减轻系统运行时的工作流任务手动分配负担,又将几种分类算法 (C4.5,SVM,NaiiveBayes等)应用于工作流运行日志,以挖掘任务的最佳执行人信息。
[0010] 在系统架构方面,文献中,Andrzejak等人提出了一种面向工作流控制流知识挖掘 的闭环工作流管理框架,该框架遵循规划-执行-结果验证-再规划这一闭环生成工作流过 程模型。Rinderle与van der Aalst教授开发了一个支持资源分配规则的全生命周期的软 件架构。国内刘庭煜等人对工作流资源管理的闭环控制方法进行了探索,并分别基于常规 统计方法和权重矩阵方法研究了资源分配知识的发现方法。
[0011 ]工作流管理系统中的快速人员分配知识的挖掘最早于2006年由德国乌尔姆大学 的Linh Thao Ly等人提出,将其看作归纳学习方法,并采用了一种决策树的学习方法从事 务历史中挖掘人员分配规则。随后,针对人员分配规则的挖掘方法,又有研究人员提出了采 用机器学习、隐马尔科夫模型方法、分类学习方法(包括C4.5、SVM等)、基于Apriori的关联 规则搜索算法、增强学习算法等。在基础模型及应用方面,有:基于工作流资源分配约束条 件的自适应工作流规划方法,模糊环境下工作流任务分配的多级模型等,以及过程感知信 息系统中全生命周期的人员分配支持等。也有学者基于过程挖掘技术对不同资源之间的并 行工作共享问题以及不合理的资源分配等问题进行了有益的探索。
[0012]基于上述讨论可以看出,作为工作流知识发现领域的新兴研究方向,国内外研究 人员工作流资源分配领域的研究尚属起步阶段,对于工作流日志的处理手段也比较单一。 据笔者研究所知,目前尚没有对工作流日志的纵向执行逻辑和横向事务逻辑进行处理和表 征的方法,更鲜见在此基础上进行全局规则发现和搜索的方法。

【发明内容】

[0013] 针对现有技术中缺陷与不足,本发明提出一种纵横交错的混合式资源分配规则挖 掘方法,实现对实例化前的工作流任务在任务分配时的执行资源的快速推荐。
[0014] 为实现上述目的,本发明所采用的技术方案如下:
[0015] -种纵横交错的混合式资源分配规则挖掘方法,包括以下步骤:
[0016] 步骤A、以过程、任务、资源、工作流实例及时间戳五元组来表示工作流日志;
[0017] 步骤B、以事务为基本单元对工作流日志进行分解,得到工作流日志横向事件视图
[0018] 步骤C、以工作流实例为基本单元对工作流日志进行分解,得到工作流日志纵向案 例视图
[0019] 步骤D、基于出现频次prob及当前活动的前置条件对上述两种日志视图分别进行 资源分配规则挖掘;
[0020] 步骤E、基于因果条件概率conf方法对资源分配规则进行全局筛选与排序,获得全 局优化的资源分配规则。
[0021] 应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这 样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保 护的主题的所有组合都被视为本公开的发明主题的一部分。
[0022] 结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实 施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面 的描述中显见,或通过根据本发明教导的【具体实施方式】的实践中得知。
【附图说明】
[0023] 图1是本发明纵横交错的混合式资源分配规则挖掘方法的流程示意图。
[0024] 图2是熟练度较低人员与本方法执行时间对比示意图。
[0025] 图3是平均熟练度人员与本方法执行时间对比示意图。
[0026] 图4是熟练度较高人员与本方法执行时间对比示意图。
【具体实施方式】
[0027] 根据图1所示,本发明提出的一种纵横交错的混合式资源分配规则挖掘方法,包括 以下步骤:
[0028] 步骤A、以过程、任务、资源、工作流实例及时间戳五元组来表示工作流日志;
[0029] 步骤B、以事务为基本单元对工作流日志进行分解,得到工作流日志横向事件视图 V1-(L) = E = };
[0030] 步骤C、以工作流实例为基本单元对工作流日志进行分解,得到工作流日志纵向案 例视图 h (幻-万(〔')-'
[0031] 步骤D、基于出现频次prob及当前活动的前置条件对上述两种日志视图分别进行 资源分配规则挖掘;
[0032] 步骤E、基于因果条件概率conf方法对资源分配规则进行全局筛选与排序,获得全 局优化的资源分配规则。
[0033] 前述步骤A中,采用过程、任务、资源、工作流实例及时间戳五元组的五元组向量来 表达工作流日志,即£ "(? =丨tb...,丨,其中:P是工作流流程集合;T是工 作流管理系统中工作流任务的集合;R是工作流资源的集合,C是工作流实例的集合,TS为工 作流任务执行的时间戳。,示例以表格形式表达如下:
[0035]前述步骤B中,对于步骤A所得到的工作流事件集五=PxTxiixCxra = k,心…,\}, 对于事件单元es eE,es: (Pi,tj,rk)记录的工作流事件涉及流程Pi,任务tj以及资源rk,基于 上述分解,得到工作流日志横向事件视图匕(△) = △'== 丨,示例以表格形式表达如 下:
[0037]前述步骤C,定义C = E*为事件根据同一流程实例的流转轨迹的集合,即一项工作 按照流程的路由进行传递的记录集,定义日志LeB(C),其中B(C)为所有共同案例C的活动 事件的集合,且其中活动事件基于时间戳顺序排列,基于上述分解,得到工作流日志纵向案 例视图Vc(L)=B(C) = {ci,C2, . . .,C|B(C)|},其中,每一个元素 Ci都是一个流程的运行实例,
[0039] 前述步骤D中,对上述两种日志视图分别进行资源分配规则挖掘,具体包括:
[0040] 步骤D-I:对于工作流日志横向案例视图匕U) = E ,…,\},其单位事务为: es: (pi,tj,rk),Pi,tj,rk为其最小组成元;
[0041] 步骤D-2:对于工作流日志纵向案例视图Vc(L)=B(C) = {C1,c2, . . .,c|B(c)|},对于 事件es: (pi,tj,rk),定义活动属性辨识算子:π如下:Ji(es) = (pi,tj,rk),3Tp(es)=pi,3it(es) = tj,Jir(es)=rk,算子#(£*)表示:若e ,则替换幻为出,即最终所有Ji相同 的事件都被替换为一个典型事件,其中E为事件的集合,即E= (ei,ej, ... ,?);基于上述处 理,工作流日志纵向案例视图的单位案例为:c" :辦...,ek)中的典型事 件即为其最小组成元;
[0042] 步骤D-3:假设对于规则445,满足以下几个条件,即:/1c/,M=/,且 Jn5 = 0,其中,对于步骤D得到的工作流日志横向案例视图和纵向案例视图,规则d 4 Z?中 A与B都是其单位事务中最小组成元的组合,对于规则J => S在事务集合D中有两个评价指 标:出现频度prob和因果条件概率cond,其中:规则的出现频度prob表示在集合D中 存在A U B集合的事务集百分比,及A和B的并集在D中出现的概率,即, 根据项集AU B的出现概率对得到的规则进行筛选,对P(AUB)小于一定的阈值minprob的规 则进行剪除,其中〇〈minprob〈 1;对于横向案例视图,根据出现频度prob定义,对其单位事务 63:^山,^〇进行处理,计算6 3:^,1:」,^〇中口1,1:」,^{及相互之间的组合的出现频率,即 prob(pi),prob(tj),prob(rk),prob(pi,tj),prob(pi,rk),prob(tj,rk),prob(pi,tj,rk);而 对于纵向案例视图Vc(L)=B(C) = {ci,C2, . . .,cb(〇},对其c" ^^,,,.,.…,:^^进行处理^于 统计典型事件,及典型事件在案例中的组合出现频率;在上述计算结束后,所有出现频度 prob小于minprob的组成元组合均被筛除;
[0043] 步骤D-4:基于当前任务ac前置条件A对获得的所有资源分配规则进行筛选,对于 当前活动a。,首先,针对在横向案例视图中获取的资源分配规则,是根据a。的过程和任务属 性即π p ( a c),π t ( a c)对视图(Z)-五-{巧,}中e s : ( p i,t j,r k)中得到的形如 (八4 4的规则的前置条件进行筛选;而在纵向案例视图中,是根据a。的前置典型事件序 列对Vc(L)=B(C) = {ci,C2, ...,c|B(c)|}中的单元案例中的典型事件序列£? :#(e,中 得到的形如气,…,= 又限筛选,从而根据ez的资源项对a。的执行资源进行推荐。
[0044] 前述步骤E中,采用因果条件概率指标对步骤D得到的规则进行排序,以条件概率P (B IA)最大的规则为最佳候选规则;5的因果条件概率cond表不在D中包含A的事务也 包括B的概率,8卩4μ) = /;/·〇/)(/〗U ,因此,前述因果条件概率 可以通过步骤前述步骤D-3中的相应结果比值获得;cond指标用于对minprob指标筛选下来 的进彳丁排序;
[0045] 然后将筛选后的规则汇总,并按照规则的因果条件概率cond从大到小进行排序, 从而得到最优资源分配规则的列表,最终实现资源的快速分配。
[0046] 本发明的技术方案可用于任何工作流驱动的信息系统的任务实例化阶段,通过嵌 入在系统任务分配界面的当前任务执行资源优先推荐列表,实现对任务分配人员的信息支 撑,从而加快工作流任务的分配效率和准确度。
[0047] 为了验证本方法的执行效果,发明人在合作企业的工艺部门选择了几个典型产品 和三种工作熟练程度的工人在产品数据管理系统的工作流任务分配环节进行了测试,并以 同样的任务环境,用我们开发的测试程序进行分析。找了三个不同熟练程度的操作人员,从 事本工作时间分别为2个月,18个月和56个月。每组分别进行了十次实验,总计30次,分别统 计执行时间对比如图2、图3、图4所示。实验证明,本方法的资源分配推荐结果前三项的准确 率达到96.7%,并且100%符合执行角色与组织权限要求,人-机平均任务分配时间消耗比 达3.68倍。因此,本方法能够在保证较高推荐准确率的情况下大幅提升资源分配工作人员 的工作效率。
【主权项】
1. 一种纵横交错的混合式资源分配规则挖掘方法,其特征在于,包括以下步骤: 步骤A、以过程、任务、资源、工作流实例及时间戳五元组来表示工作流日志; 步骤B、以事务为基本单元对工作流日志进行分解,得到工作流日志横向事件视图 V,(L) = E = i%,\ : 步骤C、以工作流实例为基本单元对工作流日志进行分解,得到工作流日志纵向案例视 图¥。(1)=:8(〇 = {(31,〇2,...,(3|[3(〇|}; 步骤D、基于出现频次prob及当前活动的前置条件对上述两种日志视图分别进行资源 分配规则挖掘; 步骤E、基于因果条件概率conf方法对资源分配规则进行全局筛选与排序,获得全局优 化的资源分配规则。2. 根据权利要求1所述的纵横交错的混合式资源分配规则挖掘方法,其特征在于,其特 征在于,前述步骤A中,采用过程、任务、资源、工作流实例及时间戳五元组的五元组向量来 表达工作流日志,即£ = Px『x "x ('x ,其中:P是工作流流程集合;T是工 作流管理系统中工作流任务的集合;R是工作流资源的集合,C是工作流实例的集合,TS为工 作流任务执行的时间戳。3. 根据权利要求1所述的纵横交错的混合式资源分配规则挖掘方法,其特征在于,前述 步骤Β中,对于步骤Α所得到的工作流事件集I = Ρ X Γ X X C X A'=批,e2\ },对于事件单 元es eE,es: (Pi,tj,rk)记录的工作流事件涉及流程Pi,任务tj以及资源rk,基于上述分解,得 到工作流日志横向事件视图= f = …?'4. 根据权利要求1所述的纵横交错的混合式资源分配规则挖掘方法,其特征在于,前述 步骤C,定义C = E*为事件根据同一流程实例的流转轨迹的集合,即一项工作按照流程的路 由进行传递的记录集,定义日志LeB(C),其中B(C)为所有共同案例C的活动事件的集合,且 其中活动事件基于时间戳顺序排列,基于上述分解,得到工作流日志纵向案例视图Vc(L) = 8(〇 = {(31,(:2,...,(3_)|},其中,每一个元素(3 1都是一个流程的运行实例。5. 根据权利要求1所述的纵横交错的混合式资源分配规则挖掘方法,其特征在于,前述 步骤D中,对上述两种日志视图分别进行资源分配规则挖掘,具体包括: 步骤D-1:对于工作流日志横向案例视图厂(1)=苦=批,%,-,^},其单位事务为:^: (Pi,tj,rk),pi,tj,rk为其最小组成元; 步骤0-2:对于工作流日志纵向案例视图¥(;(]^)=13(〇 = {(31,〇2,...,(^(〇|},对于事件 es: (pi,tj,rk),定义活动属性辨识算子:π如下:Ji(es) = (pi,tj,rk),3Tp(es)=pi,3it(es) = tj,3ir (一^二^算子对幻表示:若^^^广反:^出卜:^^丄则替换幻为^即最终所有:^目同的事 件都被替换为一个典型事件,其中E为事件的集合,即E=(ei,ej, . . .,ek);基于上述处理,工 作流日志纵向案例视图的单位案例为:&:^^/,...,4),^,6」,...,61〇中的典型事件即为 其最小组成元; 步骤D-3:假设对于规则J 3 5,:满足以下几个条件,SP : /1 cz /,/? c: /,| = 0,其 中,对于步骤D得到的工作流日志横向案例视图和纵向案例视图,规则J 中A与B都是其 单位事务中最小组成元的组合,对于规则2 在事务集合D中有两个评价指标:出现频度 prob和因果条件概率cond,其中:规则J =5? 的出现频度prob表示在集合D中存在A U B集合 的事务集百分比,及A和B的并集在D中出现的概率,8卩声必(.4 =P(.4U 5),根据项集A U B的出现概率对得到的规则进行筛选,对P(AUB)小于一定的阈值minprob的规则进行剪除, 其中0〈minprob〈l;对于横向案例视图,根据出现频度prob定义,对其单位事务es: (pi,tj, rk)进行处理,计算es: (pi,tj ,rk)中pi, tj ,rk及相互之间的组合的出现频率,即prob(pi), prob(tj),prob(rk),prob(pi,tj),prob(pi,rk),prob(tj,rk),prob(pi,tj,rk);而对于纵向案 例视图Vc(L)=B(C) = {ci,C2, . . .,C|B(C)|},对其& :对^^…-^^进行处理^于统计典型事 件,及典型事件在案例中的组合出现频率;在上述计算结束后,所有出现频度prob小于 minprob的组成元组合均被筛除; 步骤D-4:基于当前任务a。前置条件A对获得的所有资源分配规则进行筛选,对于当前活 动a。,首先,针对在横向案例视图中获取的资源分配规则,是根据a。的过程和任务属性即πρ (a c),π t (a c)对视图匕(i)=丑=丨q,e2,…,\丨:中e s: (ρ!,t」,r k)中得到的形如(A.,5的规 则的前置条件进行筛选;而在纵向案例视图中,是根据a。的前置典型事件序列对Vc(L)=B (C) = {C1,C2,. . .,c |B(〇 |}中的单元案例中的典型事件序列中得到的形如 仅限筛选,从而根据ez的资源项对a。的执行资源进行推荐。6.根据权利要求1所述的纵横交错的混合式资源分配规则挖掘方法,其特征在于,前述 步骤E中,采用因果条件概率指标对步骤D得到的规则进行排序,以条件概率P(B|A)最大的 规则为最佳候选规则dS的因果条件概率cond表示在D中包含A的事务也包括B的概率, 即.4二妁=/^( β |/i) = U扪,因此,前述因果条件概率可以通过步骤 前述步骤D-3中的相应结果比值获得;cond指标用于对minprob指标筛选下来的进行排序; 然后将筛选后的规则汇总,并按照规则的因果条件概率cond从大到小进行排序,从而 得到最优资源分配规则的列表,最终实现资源的快速分配。
【文档编号】G06Q10/06GK106056300SQ201610404627
【公开日】2016年10月26日
【申请日】2016年6月8日
【发明人】刘庭煜, 汪惠芬
【申请人】南京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1