Workflowprocessingprogram,method,anddevice的制作方法

文档序号:6479640阅读:169来源:国知局
专利名称:Workflow processing program, method, and device的制作方法
技术领域
本发明涉及业务过程分析用的信息处理技术。
背景技术
为了进行业务流程重组(BPR :Business Process Re-engineering),需要进行当 前企业中正在运用的业务系统的分析。因此,例如使用日本特开2005-115494号公报所记 载的这种技术。该公报公开了如下事项。S卩,(1)利用基于各应用程序的方法,收集表示配置于不同业务系统中的各应用 程序的执行状态的信息即事件数据,排列到事件队列中。例外,在该公报中,事件表示在业 务系统内执行某个业务,是包含业务的开始、结束时间、以及关联属性的数据。根据配置于 各业务系统中的事件提取定义,通过每个业务系统的事件数据提取用的应用程序来提取事 件数据。在各业务系统内,将所提取出的事件信息转换为共通的XMUeXtensible Markup Language)形式,排列到管理事件数据的事件管理装置的事件队列中。在进行该排列时,例 如利用 JMS(Java(注册商标)Message Service)等。(2)在事件管理装置内,针对在事件队列内排列的事件信息,针对每个业务数据进 行归纳,将业务数据之间关联起来存储在事件管理数据库(DB)内。在该公报中,业务数据 意味着某个集中单位的业务之间共有的数据。(3)根据所输入的检索条件(例如事件产生 期间、关联属性等),进行业务数据的缩小。(4)以树形式展开显示与缩小的业务数据关联 的数据,进行从任意数据起的处理追踪。(5)检索与以树形式展开的业务数据关联的事件, 利用跟踪视图来图示与该事件关联的业务,显示当前的业务流程的执行状况。在该公报中, 跟踪是指如下的方法确认在跨越预先定义的业务系统之间的业务整体的流程即业务过程 中,执行哪个业务、不过程哪个业务。在这种公报所记载的技术中,需要针对每个业务系统导入事件数据提取用的应用 程序,对业务系统进行改变,或者对业务过程造成不必要的负荷。并且,在这种公报所记载的技术中,没有公开对实施业务流程的频度进行分析、并 对标准业务流程和例外业务流程进行分类的结构,并且,没有揭示和公开分类中的问题点。专利文献1 日本特开2005-115494号公报

发明内容
因此,本发明的目的在于,提供能够适当实施业务流程的分类并使用户容易掌握 所实施的业务流程整体的特征的技术。本发明的业务流程处理方法包含以下步骤从存储业务处理结果的数据库中提取 针对每个案件实施的一连串的业务的数据,生成以时间序列排列针对每个案件实施的业务 的业务名称的过程实例,将其存储在过程实例数据存储部中的步骤;对存储在过程实例数 据存储部中的各过程实例,判断是否产生了从该过程实例的第1业务返回到之前实施的第 2业务的复原的步骤;对产生了复原的过程实例,针对复原的每个模式类别删除该复原的
4重复复原(即、难以掌握业务整体像的复原),将删除重复复原后的过程实例存储到简化过 程实例数据存储部中的步骤;针对每个类别对存储在简化过程实例数据存储部中的过程实 例进行计数的步骤;以及输出步骤,根据计数结果,确定出现频度为规定基准以上、且存储 在简化过程实例数据存储部中的过程实例,作为主要业务流程进行输出。这样,即使多次产生相同的复原,也能够统合为一个复原,在掌握业务流程整体的 特征方面,容易确定重要的主要业务流程。另外,上述输出步骤也可以包含使所确定的过程实例重叠的步骤。这是为了能够 更加简单地掌握主要业务流程。进而,上述输出步骤也可以包含作为例外流程输出所确定的过程实例以外的过程 实例的步骤。这是为了掌握例外流程的产生状况,有助于业务改善等。进而,在本发明中,也可以进一步包含以下步骤对存储在过程实例数据存储部中 的各过程实例,判断是否产生了从该过程实例的第3业务返回该第3业务的反复的步骤;以 及对产生了反复的过程实例,针对反复的每个模式类别删除该反复的重复反复(即、难以 掌握业务整体像的反复),删除重复反复后的过程实例存储到过程实例数据存储部中的步 骤。这样,即使多次产生相同的反复,也能够统合为一个反复,在掌握业务流程整体的特征 方面,容易确定重要的主要业务流程。进而,在本发明中,也可以进一步包含以下步骤对存储在简化过程实例数据存储 部中的各过程实例,判断是否产生了从该过程实例的第3业务返回该第3业务的反复的步 骤;以及对产生了反复的过程实例,针对反复的每个模式类别删除该反复的重复反复(即、 难以掌握业务整体像的反复),将删除重复反复后的过程实例存储到简化过程实例数据存 储部中的步骤。关于重复反复的删除,既可以在重复复原之后实施,也可以在重复复原之前 实施。并且,还可以单独实施重复复原的删除或重复反复的删除。另外,能够生成用于使计算机过程本发明的方法的程序,该程序例如存储在软盘、 CD-ROM、光磁盘、半导体存储器、硬盘等的存储介质或存储装置中。并且,有时经由网络利用 数字信号颁布。另外,在计算机的存储器等存储装置中临时保管处理中途的数据。


图1是本发明的实施方式的功能框图。图2(a) (d)是用于说明本发明的实施方式的概要的图。图3是示出本发明的实施方式的主处理流程的图。图4(a)是示出提取数据例即接收订货DB的图解信息的图,图4(b)是示出接收订 货DB的记录组的图。图5(a)是示出提取数据例即生产DB的图解信息的图,图5(b)是示出生产DB的 记录组的图。图6(a)是示出提取数据例即筹备DB的图解信息的图,图6(b)是示出筹备DB的 记录组的图。图7(a)是示出提取数据例即配送DB的图解信息的图,图7(b)是示出配送DB的 记录组的图。图8(a)是示出提取数据例即产品编号DB的图解信息的图,图8
(b)是示出产品编号DB的记录组的图。图9 (a)是示出CSV形式的接收订货DB的数据例的图,图9(b)是示出对接收订货 DB的数据进行表格化的例子的图。图10(a)是示出CSV形式的生产DB的数据例的图,图10(b)是示出对生产DB的 数据进行表格化的例子的图。图11(a)是示出CSV形式的筹备DB的数据例的图,图11(b)是示出对筹备DB的 数据进行表格化的例子的图。图12(a)是示出CSV形式的配送DB的数据例的图,图12 (b)是示出对配送DB的 数据进行表格化的例子的图。图13(a)是示出CSV形式的产品编号DB的数据例的图,图13 (b)是示出对产品编 号DB的数据进行表格化的例子的图。图14是示出计时标记判定处理的处理流程的图。图15是示出计时标记可靠性得分表的一例的图。图16是示出事件ID/关联ID候选判定处理的处理流程的图。图17是示出事件ID/关联ID候选可靠性得分表的一例的图。图18是示出事件名称判定处理的处理流程的图。图19是示出包含多个时间戳的表的一例的图。图20(a) (e)是示出针对每个事件将图19的表分割为多个表的例子的图。图21是示出在存在图解信息的情况下针对接收订货DB的事件候选数据的各要素 的判定显示的一例的图。图22是示出在CSV形式的数据的情况下针对接收订货DB的事件候选的各要素的 判定显示的一例的图。图23是示出在存在图解信息的情况下针对生产DB的事件候选数据的各要素的判 定显示的一例的图。图24是示出在CSV形式的数据的情况下针对生产DB的事件候选的各要素的判定 显示的一例的图。图25是示出在存在图解信息的情况下针对筹备DB的事件候选数据的各要素的判 定显示的一例的图。图26是示出在CSV形式的数据的情况下针对筹备DB的事件候选的各要素的判定 显示的一例的图。图27是示出在存在图解信息的情况下针对配送DB的事件候选数据的各要素的判 定显示的一例的图。图28是示出在CSV形式的数据的情况下针对配送DB的事件候选的各要素的判定 显示的一例的图。图29是示出在存在图解信息的情况下针对产品编号DB的事件候选数据的各要素 的判定显示的一例的图。图30是示出在CSV形式的数据的情况下针对产品编号DB的事件候选的各要素的 判定显示的一例的图。图31是示出针对事件候选数据的各要素的选择结果的一例的图。
图32是示出在存在图解信息的情况下根据接收订货DB的数据生成的事件候选数 据的一例的图。图33是示出在CSV形式的数据的情况下根据接收订货DB的数据生成的事件候选 数据的一例的图。图34是示出在存在图解信息的情况下根据生产DB的数据生成的事件候选数据的 一例的图。图35是示出在CSV形式的数据的情况下根据生产DB的数据生成的事件候选数据 的一例的图。图36是示出在存在图解信息的情况下根据筹备DB的数据生成的事件候选数据的 一例的图。图37是示出在CSV形式的数据的情况下根据筹备DB的数据生成的事件候选数据 的一例的图。图38是示出在存在图解信息的情况下根据配送DB的数据生成的事件候选数据的 一例的图。图39是示出在CSV形式的数据的情况下根据配送DB的数据生成的事件候选数据 的一例的图。图40是示出与图19的开立发票有关的事件候选数据的一例的图。图41是示出与图19的批准有关的事件候选数据的一例的图。图42是示出与图19的订货有关的事件候选数据的一例的图。图43是示出与图19的交货有关的事件候选数据的一例的图。图44是示出与图19的验收有关的事件候选数据的一例的图。图45是示出事件数据和事件之间关系树的一例的图。图46是用于说明根据事件数据生成过程实例的图。图47是示出过程实例的一例的图。图48是用于说明主要和例外流程的提取处理的图。图49是示出使图48所示的过程实例重叠时的显示例的图。图50(a) (c)是示出将图48所示的过程实例分类为主要流程和例外流程时的 显示例的图。图51是示出用于说明重复消除处理的过程实例的例子的图。图52是示出简单地对图51所示的过程实例进行分类时的例子的图。图53是示出重复消除处理的处理流程的图。图54A是示出具有重复的反复的过程实例的例子的图。图54B是示出删除了重复的反复时的过程实例的例子的图。图55是示出复原重复消除处理的处理流程的图。图56是示出用于说明复原重复消除处理的过程实例的例子的图。图57是用于说明复原部分的切出的图。图58A是用于说明复原部分的分类的图。图58B是用于说明删除复原部分的重复的处理的图。图59是示出过程实例的再构建例子的图。
7
图60是示出图56的过程实例的重叠显示的例子的图。图61是示出图59的过程实例的重叠显示的例子的图。图62是示出针对图51所示的过程实例的例子实施了重复消除处理的结果的过程 实例的图。图63是示出存储在模型数据存储部中的数据的一例的图。图64是示出流程显示处理的处理流程的图。图65是示出使在图63中登记的全部过程实例重叠时的显示例的图。图66是示出将在图63中登记的过程实例分为主要流程和例外流程时的显示例的 图。图67是计算机装置的功能框图。
具体实施例方式图1示出本发明的一个实施方式的业务系统分析装置的功能框图。本实施方式 的业务系统分析装置包含分析对象数据存储部1,其存储从一个或多个解析对象系统收 集的数据(在规定期间内生成的数据库的记录组、日志数据、网络DB(NDB)的记录组、运行 记录等);事件候选数据生成部3,其从分析对象数据存储部1生成事件候选数据;事件候 选数据存储部5,其存储由事件候选数据生成部3生成的事件候选数据;输入输出部11,其 作为与用户之间的接口 ;事件数据生成部7,其经由输入输出部11受理用户的指示,生成事 件数据;事件数据存储部9,其存储由事件数据生成部7生成的事件数据;过程实例生成部 13,其根据存储在事件数据存储部9中的事件数据生成过程实例;过程实例数据存储部15, 其存储由过程实例生成部13生成的过程实例的数据;重复消除部17,其使用存储在过程实 例数据存储部15中的过程实例的数据,实施删除难以掌握业务的整体像的复原和反复的 处理;简化过程实例数据存储部19,其存储由重复消除部17处理后的过程实例的数据;过 程实例分类处理部21,其针对每个类别对存储在简化过程实例数据存储部中的过程实例进 行分类,并对出现数量进行计数;模型数据存储部23,其存储过程实例分类处理部21的处 理结果;以及过程显示处理部25,其使用存储在模型数据存储部23中的数据,实施显示业 务流程所需要的处理。另外,对事件候选数据生成部3、过程实例生成部13、过程显示处理部25,输入输 出部11也作为与用户之间的接口进行动作。并且,各处理部实施读出处理结果等并经由输 入输出部11提示给用户等的处理。并且,事件候选数据生成部3具有时间戳处理部31、事件ID/关联ID候选处理 部32、事件名称处理部34、得分表存储部35。进而,重复消除部17具有反复处理部171和 复原处理部173。接着,使用图2(a) (d)说明业务系统分析装置的大体处理内容。首先,事件候 选数据生成部3根据存储在分析对象数据存储部1中的业务系统的数据,生成事件候选数 据。图2(a)示出事件候选数据的一例。在图2(a)的例子中,例如从一个表(例如数据库) 中提取包含事件名称、时刻(事件的发生日期时间即时间戳)、除此之外的第1值(值1)、 第2值(值2)等在内的记录组。即,确定事件名称、时间戳、除此之外的作为事件ID和关 联ID的候选的数据字段。
接着,事件数据生成部7根据存储在事件候选数据存储部5中的事件候选数据,生 成事件数据。图2(b)示出事件数据的一例。在图2(b)的例子中,从多个表(例如数据库) 中提取包含事件名称、时刻(事件的发生日期时间即时间戳)、事件ID(这里为IDl)和其他 值在内的记录组;以及包含事件名称、时刻(时间戳)、IDl和ID2等在内的记录组,第2事 件类(即事件的种类)的记录的关联ID即ID2的字段值取第1事件类(即事件的种类)的 记录的事件ID即IDl的字段值的任一值,由此,确定第2事件类的各个记录(即事件实例) 与第1事件类的哪个记录(即事件实例)关联。这种提取事件之间的关联等的处理本身不 是本实施方式的主要部分,例如在日本的特愿2006-197294号(2006年7月19日申请)及 其对应外国申请中有所公开,本申请引入其内容。然后,过程实例生成部13根据存储在事件数据存储部9中的事件数据,生成过程 实例的数据。图2(c)示出过程实例的一例。在图2(c)的例子中,例示了 4个过程实例,在 各个过程实例中包含一连串的事件实例(具体的事件)。即,例如利用“接受订货”、“开立 发票”、“交货”、“验货”这种属于事件类的连续的事件实例(具体的事件,与特定记录对应的 事件)构成过程实例。但是,过程实例所包含的事件实例不需要来源于全部事件类,也可以 包含多个属于一个事件类的事件实例。另外,过程实例生成处理本身不是本实施方式的主 要部分,例如能够使用美国专利公开公报2005/076059A1这种业务过程跟踪方法等。另外, 在本申请中引入本公报。然后,通过重复消除部17和过程实例分类处理部21对过程实例的数据进行处理, 过程显示处理部25根据存储在模型数据存储部23中的数据,生成过程流程(也称为业务 流程)的数据,经由输入输出部11显示在显示装置上。图2(d)示出过程流程的一例。在 图2(d)的例子中,示出集中确定过程实例的业务流程。接着,使用图3 图66说明图1所示的业务系统分析装置的处理的详细内容。首 先,用户指定业务系统中的解析对象表,复制该数据并将其存储在分析对象数据存储部1 中(图3:步骤Si)。例如,指定接受订货DB、生产DB、筹备DB、配送DB、产品编号DB,对在 规定期间内生成并存储的记录组进行复制,将其存储在分析对象数据存储部1中。另外,如 果这些DB是相关数据库,则还复制图解信息,将其存储在分析对象数据存储部1中。本步 骤是用户预先操作计算机来进行的处理,所以,在图3中用虚线框表示。例如,在接受订货DB是相关数据库的情况下,将图4(a)的图解信息和图4(b)所 示的记录组存储在分析对象数据存储部1中。在图4(a)所示的图解信息的例子中,分别 针对字段1 4登记字段名称、关键字设定数据、数据类型、记录长度和注释。根据图4(a) 可知,在字段1中登记日期时间,在字段2中登记主关键字即接受订货编号,在字段3中登 记地域,在字段4中登记接受订货内容。具体而言成为图4(b)的记录组,但是,如果得到图 4(a)的图解信息,则能够容易地解释图4(b)的记录组的内容。同样,在生产DB是相关数据库的情况下,将图5(a)的图解信息和图5(b)所示的 记录组存储在分析对象数据存储部1中。在图5(a)所示的图解信息的例子中,可分别针对 字段1 5登记字段名称、关键字设定数据、数据类型、记录长度和注释。根据图5 (a)可知, 在字段1中登记日期时间,在字段2中登记主关键字即生产编号,在字段3中登记副关键字 即接受订货编号,在字段4中登记副关键字即产品编号,在字段5中登记交货日期。具体而 言成为图5(b)的记录组,但是,如果得到图5(a)的图解信息,则能够容易地解释图5(b)的记录组的内容。并且,在筹备DB是相关数据库的情况下,将图6(a)的图解信息和图6(b)所示的 记录组存储在分析对象数据存储部1中。在图6(a)所示的图解信息的例子中,分别针对字 段1 5登记字段名称、关键字设定数据、数据类型、记录长度和注释。根据图6(a)可知, 在字段1中登记日期时间,在字段2中登记主关键字即筹备编号,在字段3中登记副关键字 即接受订货编号,在字段4中登记副关键字即产品编号,在字段5中登记交货目的地。具体 而言成为图6(b)的记录组,但是,如果得到图6(a)的图解信息,则能够容易地解释图6(b) 的记录组的内容。进而,在配送DB是相关数据库的情况下,将图7(a)的图解信息和图7(b)所示的 记录组存储在分析对象数据存储部1中。在图7(a)所示的图解信息的例子中,分别针对字 段1 4登记字段名称、关键字设定数据、数据类型、记录长度和注释。根据图7(a)可知, 在字段1中登记日期时间,在字段2中登记主关键字即筹备编号,在字段3中登记副关键字 即配送包裹,在字段4中登记交货目的地。具体而言成为图7(b)的记录组,但是,如果得到 图7(a)的图解信息,则能够容易地解释图7(b)的记录组的内容。并且,在产品编号DB是相关数据库的情况下,将图8(a)的图解信息和图8(b)所 示的记录组存储在分析对象数据存储部1中。在图8(a)所示的图解信息的例子中,分别针 对字段1和2登记字段名称、关键字设定数据、数据类型、记录长度和注释。根据图8(a)可 知,在字段1中登记主关键字即产品编号,在字段2中登记产品名称。具体而言成为图8(b) 的记录组,但是,如果得到图8(a)的图解信息,则能够容易地解释图8(b)的记录组的内容。另一方面,在以CSV形式取得接受订货DB的数据的情况下,将图9 (a)所示的数据 存储在分析对象数据存储部1中。在图9(a)的例子中,在开头包含日期时间、接受订货编 号、地域和接受订货内容这样的标号数据,然后以上述标号的顺序罗列数据,数据之间利用 逗号划分。为了便于理解图9(a)而采取表形式,如图9(b)所示。即,成为包含日期时间的 列、接受订货编号的列、地域的列和接受订货内容的列在内的表。没有图解信息,所以,数据 皆存储为字符串。并且,没有关键字设定数据。同样,在以CSV形式取得生产DB的数据的情况下,将图10(a)所示的数据存储在 分析对象数据存储部1中。在图10(a)的例子中,在开头包含日期时间、生产编号、接受订 货编号、产品编号和交货日期这样的标号数据,然后以上述标号的顺序罗列数据,数据之间 利用逗号划分。为了便于理解图10(a)而采取表形式,如图10(b)所示。即,成为包含日期 时间的列、生产编号的列、接受订货编号的列、产品编号的列和交货日期的列在内的表。并且,在以CSV形式取得筹备DB的数据的情况下,将图11(a)所示的数据存储在 分析对象数据存储部1中。在图11 (a)的例子中,在开头包含日期时间、筹备编号、接受订货 编号、产品编号和交货目的地这样的标号数据,然后以上述标号的顺序罗列数据,数据之间 利用逗号划分。为了便于理解图11(a)而采取表形式,如图11(b)所示。S卩,成为包含日期 时间的列、筹备编号的列、接受订货编号的列、产品编号的列和交货目的地的列在内的表。进而,在以CSV形式取得配送DB的数据的情况下,将图12(a)所示的数据存储在 分析对象数据存储部1中。在图12(a)的例子中,在开头包含日期时间、筹备编号、配送包裹 和交货目的地这样的标号数据,然后以上述标号的顺序罗列数据,数据之间利用逗号划分。 为了便于理解图12(a)而采取表形式,如图12(b)所示。即,成为包含日期时间的列、筹备编号的列、配送包裹的列和交货目的地的列在内的表。并且,在以CSV形式取得产品编号DB的数据的情况下,将图13(a)所示的数据存 储在分析对象数据存储部1中。在图13(a)的例子中,在开头包含产品编号和产品名称这 样的标号数据,然后以上述标号的顺序罗列数据,数据之间利用逗号划分。为了便于理解图 13(a)而采取表形式,如图13(b)所示。即,成为包含产品编号的列和产品名称的列在内的表。业务系统分析装置的例如事件候选数据生成部3判断是否针对所有解析对象表 进行了处理(步骤S3)。在存在未处理的解析对象表的情况下,确定一个未处理的解析对象 表(步骤S5)。然后,实施时间戳判定处理(步骤S7)。使用图14和图15说明该时间戳判 定处理。首先,事件候选数据生成部3的时间戳处理部31参照分析对象数据存储部1,在解 析对象表中确定一个未处理的字段(图14 步骤S31)。然后,判断是否能够在分析对象数 据存储部1中使用解析对象表的图解信息(步骤S33)。在能够使用图解信息的情况下,在图解信息中确定处理对象字段的数据部分,判 断其中处理对象字段的数据类型是否是时间戳类型(步骤S35)。在处理对象字段的数据类 型不是时间戳类型的情况下,转移到步骤S39。例如,在对图9(a) 图13(a)这种数据进行 处理的情况下,没有图解信息,所以转移到步骤S39。另一方面,在判断为处理对象字段的数据类型是时间戳类型的情况下,将处理对 象字段的时间戳判定设定为“确定”,例如存储在主存储器等的存储装置中(步骤S37)。然 后,处理转移到步骤S43。例如,在图4(a)的这种图解信息的情况下,字段1的数据类型是时间戳类型,所 以,如果字段1是处理对象字段,则设定为时间戳判定=“确定”。在图5(a)的这种图解信 息的情况下,字段1的数据类型是时间戳类型,所以,如果字段1是处理对象字段,则设定为 时间戳判定=“确定”。图6(a)和图7(a)也同样。在图8(a)的情况下,针对全部字段,从 步骤S35转移到步骤S39。在步骤S33中判断为不能使用图解信息的情况下、或者处理对象字段的数据类型 不是时间戳类型的情况下,参照存储在得分表存储部35中的时间戳可靠性得分表,根据图 解信息中的处理对象字段的相应数据部分、处理对象字段的表示字段名称的标号数据、以 及处理对象字段的字段值,确定可靠性(步骤S39)。图15示出时间戳可靠性得分表的一例。在图15的例子中,如果“字段的数据类 型为可变长度字符串”,则可靠性得分设定为1 (%),如果“字段的数据类型为实数”,则可 靠性得分设定为),如果字段名称的末尾为“时刻”、“时间”等,则可靠性得分设定为 90(%),如果字段名称的末尾为“月日”、“日,,等、且不包含时刻等,则可靠性得分设定为 70(%),如果在字段名称中指定“预定”、“交货日期”等将来的时期,则可靠性得分设定为 10(% ),在字段值的字符串中包含年号(记号)、“/”、“ ”、“’”、“. ”、“_”、数字、空白这样 的与时间关联的文字以外的文字的情况下,可靠性得分设定为),如果字段值的字符 串为“YYYY/MM/DD hh:mm:SS”的形式,则可靠性得分设定为90 ),如果字段值的字符串 为“YYYY/MM/DD”的形式,则可靠性得分设定为70 ),如果字段值包含相同部分,则可靠 性得分设定为30 ),如果没有相应项目,则可靠性得分设定为50 )。
例如,在图4(a)的图解信息中,在图4(b)的记录组的情况下,关于字段2,在字段 值中包含与时间关联的文字以外的文字,可靠性得分确定为5(%)。字段3也同样,在字段 值中包含与时间关联的文字以外的文字,可靠性得分确定为5 )。进而,关于字段4,数据 类型为可变长度字符串,所以,可靠性得分确定为1(%)。另外,关于字段4,在字段值中还 包含与时间关联的文字以外的文字,所以,在时间戳可靠性得分表中对应于多个项目,而在 本实施方式中,采用从50(%)这种中央值大幅背离的值。即,采用与在字段值中包含与时 间关联的文字以外的文字的情况下的可靠性得分5 )相比更加背离的)。另一方面,在不存在图解信息的图9(a)的情况下,关于字段1,字段值的字符串为 "YYYY/MM/DD hh:mm:SS”的形式,所以,可靠性得分确定为90(%)。字段2和3也同样,但 是,关于字段4,无法确定该字段的数据类型,所以,判断为对应于在字段值中包含与时间关 联的文字以外的文字的情况,可靠性得分确定为)。并且,在图5(a)的图解信息中,在图5(b)的记录组的情况下,关于字段2 4,在 字段值中包含与时间关联的文字以外的文字,可靠性得分确定为)。关于字段5,在字 段名称的字符串中包含“交货日期”,所以,可靠性得分确定为10(%)。另外,关于字段5,字 段值的字符串为“YYYY/MM/DD”的形式,所以,在时间戳可靠性得分表中对应于多个项目,但 是,在本实施方式中,采用从50(%)这种中央值大幅背离的值。即,采用与字段值的字符串 为“YYYY/MM/DD”的形式的情况下的可靠性得分70(% )相比更加背离的10(% )。在不存 在图解信息的图10(a)的情况下,关于字段1,字段值的字符串为“YYYY/MM/DD hh:mm:ss" 的形式,所以,可靠性得分确定为90(% )。关于字段2和5,数据类型无关,所以,得到与存 在图解信息时相同的结果。进而,在图6(a)的图解信息中,在图6(b)的记录组的情况下,关于字段2 5,在 字段值中包含与时间关联的文字以外的文字,可靠性得分确定为5 )。在不存在图解信 息的图11(a)的情况下,关于字段1,字段值的字符串为“YYYY/MM/DD hh:mm: ss”的形式,所 以,可靠性得分确定为90 (%)。关于字段2和5,数据类型无关,所以,得到与存在图解信息 时相同的结果。并且,在图7(a)的图解信息中,在图7(b)的记录组的情况下,关于字段2 4,在 字段值中包含与时间关联的文字以外的文字,可靠性得分确定确定为5 )。在不存在图 解信息的图12(a)的情况下,关于字段1,字段值的字符串为“YYYY/MM/DD hh:mm:SS”的形 式,所以,可靠性得分确定为90 (% )。关于字段2和4,数据类型无关,所以,得到与存在图 解信息时相同的结果。进而,在图8(a)的图解信息中,在图8(b)的记录组的情况下,关于字段1和2,在 字段值中包含与时间关联的文字以外的文字,可靠性得分确定确定为5 )。在不存在图 解信息的图13(a)的情况下,数据类型也无关,所以,得到与存在图解信息时相同的结果。返回图14的说明,将处理对象字段的时间戳判定设定为所确定的可靠性得分(步 骤S41)。确定上述数值。然后,判断是否在处理对象表中针对所有字段进行了处理(步骤S43)。在存在未 处理的字段的情况下,返回步骤S31。另一方面,在针对所有字段进行了处理的情况下,返回 原来的处理。这样,作为事件的时间戳,在概率高的字段中设定了较高值的可靠性得分。并且,如果根据数据类型得知是时间戳,则设定“确定”这样的表示概率的数据。
返回图3的说明,接着,事件候选数据生成部3的事件ID/关联ID候选处理部32 实施事件ID和关联ID候选判定处理(步骤S9)。使用图16和图17说明该事件ID和关联 ID候选判定处理。 事件ID/关联ID候选处理部32在存储在分析对象数据存储部1中的解析对象表 中,确定一个未处理的字段(步骤S51)。然后,判断存储在分析对象数据存储部1中的处理 对象字段的字段值在全部记录中是否唯一(步骤S53)。在处理对象字段的字段值在全部记 录中不唯一、即存在值重复的记录的情况下,转移到步骤S62。这是因为,事件ID是事件的识别符的存储字段,所以,该字段值不会相互重复。因 此,如果在事件ID的字段中存在重复的值,则能够判断为其不是事件ID。另一方面,在处理对象字段的字段值在全部记录中唯一的情况下,判断在存储在 分析对象数据存储部1中的处理对象字段的字段值中是否包含NULL(无效)(步骤S55)。 在处理对象字段的字段值中包含NULL的情况下,转移到步骤S62。这是因为,事件ID是事 件的识别符的存储字段,所以,该字段值不可能是NULL。在处理对象字段的字段值在全部 记录中不唯一的情况下、或者在处理对象字段的字段值中包含NULL的情况下,判断存储在 分析对象数据存储部1中的处理对象字段的字段值除了 NULL以外是否为2个以上(步骤 S62)。在处理对象字段的字段值除了 NULL以外不是2种以上的情况下,在事件ID/关联ID 候选判定中设定“否定”,例如存储在主存储器等存储装置中(步骤S63)。然后,处理转移 到步骤S61。这是因为,关联ID是表示事件对应于其他事件的哪个的值,所以,在该字段值 除了 NULL以外不具有2个以上的值的情况下,无法得到有意义的结果。例如,在图4(b)或图9(b)的表的情况下,关于字段1、字段2、字段4,字段值不存 在重复,关于字段3,字段值存在重复,但是,取NULL以外的2种以上的值,所以,在事件ID/ 关联ID候选判定中不设定“否定”。并且,在图5(b)或图10(b)的表的情况下,关于字段1和字段2,字段值不存在重 复,关于字段3 5,存在重复,但是,取NULL以外的2种以上的值,所以,在事件ID/关联 ID候选判定中不设定“否定”。进而,在图6(b)或图11(b)的表的情况下,关于字段1和字段2,字段值不存在重 复,关于字段3 5,存在重复,但是,取NULL以外的2种以上的值,所以,在事件ID/关联 ID候选判定中不设定“否定”。并且,在图7(b)或图12(b)的表的情况下,关于字段1和字段2,字段值不存在重 复,关于字段3和4,存在重复,但是,取NULL以外的2种以上的值,所以,在事件ID/关联 ID候选判定中不设定“否定”。进而,在图8(b)或图13(b)的表的情况下,关于字段1和字段2,字段值不存在重 复,所以,在事件ID/关联ID候选判定中不设定“否定”。在步骤S55中判断为在处理对象字段的字段值中不包含NULL的情况下、或者在步 骤S62中判断为处理对象字段的字段值除了 NULL以外具有2种以上的值的情况下,参照存 储在得分表存储部35中的事件ID/关联ID候选可靠性得分表,根据图解信息中的处理对 象字段的相应数据部分、处理对象字段的表示字段名称的标号数据、以及处理对象字段的 字段值,确定可靠性(步骤S57)。但是,在事件ID/关联ID候选可靠性得分表中不存在相应项目的情况下,可靠性得分确定50 )。图17示出事件ID/关联ID候选可靠性得分表的一例。在图17的例子中,如果字段 的数据类型为可变长度字符串,则可靠性得分设定为1 (%),如果字段的数据类型为实数, 则可靠性得分设定为5 ),如果字段的数据类型为整数,则可靠性得分设定为80 ),如 果字段的数据类型为固定长度字符串,则可靠性得分设定为70(% ),如果字段的数据类型 为时间戳或日期,则可靠性得分设定为10(% ),如果字段名称指定了主关键字,则可靠性 得分设定为80 (%)。这里没有定义与字段值或字段名称的字符串有关的项目,但是有时也 进行定义。在定义了与字段值有关的项目的情况下,在步骤S57中进行参照。例如,在图4(a)的图解信息的情况下,关于字段1,数据类型为时间戳,所以可靠 性得分确定为10(%),关于字段2,数据类型为固定长度字符串且指定了主关键字,所以采 用从50%背离大的可靠性得分80(% ),关于字段3,数据类型为固定长度字符串,所以可 靠性得分确定为70(% ),关于字段4,数据类型为可变长度字符串,所以可靠性得分确定为 1(%)ο在图9(a)的不存在图解信息的例子的情况下,关于字段1 字段4,在事件ID/关 联ID候选可靠性得分表中不存在相应项目,所以,可靠性得分确定为50(% )。例如,在图5(a)的图解信息的情况下,关于字段1,数据类型为时间戳,所以可靠 性得分确定为10(%),关于字段2,数据类型为固定长度字符串且指定了主关键字,所以 采用从50%背离大的可靠性得分80 ),关于字段3 字段4,数据类型为固定长度字符 串,所以可靠性得分确定为70 (% ),关于字段5,数据类型为日期,所以可靠性得分确定为 10(%)o在图10(a)的不存在图解信息的例子的情况下,关于字段1 字段5,在事件ID/ 关联ID候选可靠性得分表中不存在相应项目,所以,可靠性得分确定为50(%)。例如,在图6(a)的图解信息的情况下,关于字段1,数据类型为时间戳,所以可靠 性得分确定为10(%),关于字段2,数据类型为固定长度字符串且指定了主关键字,所以采 用从50 %背离大的可靠性得分80 (% ),关于字段3 字段5,数据类型为固定长度字符串, 所以可靠性得分确定为70 (%)。在图11(a)的不存在图解信息的例子的情况下,关于字段 1 字段5,在事件ID/关联ID候选可靠性得分表中不存在相应项目,所以,可靠性得分确 定为50(% )0例如,在图7(a)的图解信息的情况下,关于字段1,数据类型为时间戳,所以可靠 性得分确定为10(%),关于字段2,数据类型为固定长度字符串且指定了主关键字,所以采 用从50 %背离大的可靠性得分80 (% ),关于字段3 字段4,数据类型为固定长度字符串, 所以可靠性得分确定为70 (%)。在图12(a)的不存在图解信息的例子的情况下,关于字段 1 字段4,在事件ID/关联ID候选可靠性得分表中不存在相应项目,所以,可靠性得分确 定为50(% )0例如,在图8(a)的图解信息的情况下,关于字段1,数据类型为固定长度字符串且 指定了主关键字,所以采用从50 %背离大的可靠性得分80 (% ),关于字段2,数据类型为固 定长度字符串,所以可靠性得分确定为70(%)。在图13(a)的不存在图解信息的例子的情 况下,关于字段1和2,在事件ID/关联ID候选可靠性得分表中不存在相应项目,所以,可靠 性得分确定为50(%)。然后,事件ID/关联ID候选处理部32在事件ID/关联ID候选判定中设定在步骤 S57中确定的可靠性得分,例如存储在主存储器等存储装置中(步骤S59)。
14
然后,判断在处理对象表中是否针对所有字段进行了处理(步骤S61),在存在未 处理的字段的情况下,返回步骤S51。另一方面,在针对所有字段进行了处理的情况下,返回 原来的处理。这样,针对事件ID或关联ID的概率高的字段,确定较高的可靠性得分。并且,针 对完全没有事件ID或关联ID的可能性的字段,确定“否定”这样的表示概率的数据。返回图3的说明,接着,事件候选数据生成部3的事件名称处理部34实施事件名 称判定处理(步骤S13)。使用图18 图20说明该事件名称判定处理。首先,事件名称处理部34对时间戳判定处理的处理结果为规定的可靠性得分以 上而能够视为时间戳的字段的字段数进行计数(步骤S91)。例如设定可靠性得分为70(%) 以上等的阈值。当然,确定为“确定”的字段为时间戳的字段。在上述的例子中,除了产品 编号DB以外,将字段名称为日期时间的字段判断为时间戳的字段,字段数为“1”。在产品编 号DB中,没有能够视为时间戳的字段,所以字段数为“0”。然后,判断时间戳的字段数是否为0(步骤S93)。如果字段数为0,则将解析对象 表设定为以下的处理对象之外(步骤S95)。将没有时间戳的表(例如产品编号DB)判断为 不是与在业务过程中发生的事件对应的表。然后返回原来的处理。另一方面,在时间戳的字段数不为0的情况下,判断字段数是否为1 (步骤S97)。 如果时间戳的字段数为1,则在事件名称中设定表名称,例如存储在主存储器等存储装置中 (步骤S99)。在上述例子中,如果是接受订货DB,则事件名称确定为“接受订货”,如果是 生产DB,则事件名称确定为“生产”,如果是筹备DB,则事件名称确定为“筹备”,如果是配送 DB,则事件名称确定为“配送”。然后返回原来的处理。并且,在时间戳的字段数为多个的情况下,在事件名称中设定视为时间戳的字段 的字段名称,例如存储在主存储器等存储装置中(步骤S101)。然后返回原来的处理。例如,在图19的表为处理对象表的情况下,过程步骤S101。在图19的例子中,开立 发票日期时间、批准日期时间、订货日期时间、交货日期时间、验收日期时间分别是视为事 件的时间戳的字段,成为在一个记录中记录多个事件的形式。这种表能够作为图20(a) (e)所示的开立发票表、批准表、订货表、交货表和验收表这样的多个表来进行处理。因此, 这种情况下,“开立发票”、“批准”、“订货”、“交货”、“验收”分别确定为事件名称。通过实施以上这种处理,从而确定与在业务过程中发生的事件对应的表,并且,能 够提取事件名称。返回图3的说明,接着,事件候选数据生成部3经由输入输出部11向用户提示判 定结果(步骤S15)。例如,在图4(a)和(b)所示的相关数据库形式的接受订货DB的情况 下,向用户提示图21所示的数据。在图21的例子中,分别针对日期时间字段、接受订货编 号字段、地域字段、接受订货内容字段,提示步骤S7 S13的判定结果。另外,关于事件名 称,表名称为事件名称,所以,全部为“否定”。观察可知,日期时间字段在时间戳的字段中为 “确定”,接受订货编号字段和地域字段为事件ID或关联ID的可能性高。并且,在图9 (a)所示的CSV形式的接受订货DB的情况下,向用户提示图22所示 的数据。在图22的例子中,分别针对日期时间字段、接受订货编号字段、地域字段、接受订 货内容字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表名称为事件名称,所 以,全部为“否定”。观察可知,日期时间字段为时间戳的可能性高,事件ID或关联ID的可能性在任意字段中均相同。例如,在图5(a)和(b)所示的相关数据库形式的生产DB的情况下,向用户提示图 23所示的数据。在图23的例子中,分别针对日期时间字段、生产编号字段、接受订货编号字 段、产品编号字段、交货日期字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表 名称为事件名称,所以,全部为“否定”。观察可知,日期时间字段在时间戳的字段中为“确 定”,生产编号字段、接受订货编号字段和产品编号字段为事件ID或关联ID的可能性高。并且,在图10 (a)所示的CSV形式的生产DB的情况下,向用户提示图24所示的数 据。在图24的例子中,分别针对日期时间字段、生产编号字段、接受订货编号字段、产品编 号字段、交货日期字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表名称为事 件名称,所以,全部为“否定”。观察可知,日期时间字段为时间戳的可能性高,事件ID或关 联ID的可能性在任意字段中均相同。例如,在图6(a)和(b)所示的相关数据库形式的筹备DB的情况下,向用户提示图 25所示的数据。在图25的例子中,分别针对日期时间字段、筹备编号字段、接受订货编号 字段、产品编号字段、交货目的地字段,提示步骤S7 S13的判定结果。另外,关于事件名 称,表名称为事件名称,所以,全部为“否定”。观察可知,日期时间字段在时间戳的字段中为 “确定”,筹备编号字段、接受订货编号字段、产品编号字段和交货目的地字段为事件ID或关 联ID的可能性高。并且,在图11 (a)所示的CSV形式的筹备DB的情况下,向用户提示图26所示的数 据。在图26的例子中,分别针对日期时间字段、筹备编号字段、接受订货编号字段、产品编 号字段、交货目的地字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表名称为 事件名称,所以,全部为“否定”。观察可知,日期时间字段为时间戳的可能性高,事件ID或 关联ID的可能性在任意字段中均相同。例如,在图7(a)和(b)所示的相关数据库形式的配送DB的情况下,向用户提示图 27所示的数据。在图27的例子中,分别针对日期时间字段、筹备编号字段、配送包裹字段、 交货目的地字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表名称为事件名称, 所以,全部为“否定”。观察可知,日期时间字段在时间戳的字段中为“确定”,筹备编号字段、 配送包裹字段和交货目的地字段为事件ID或关联ID的可能性高。并且,在图12(a)所示的CSV形式的配送DB的情况下,向用户提示图28所示的数 据。在图28的例子中,分别针对日期时间字段、筹备编号字段、配送包裹字段、交货目的地 字段,提示步骤S7 S13的判定结果。另外,关于事件名称,表名称为事件名称,所以,全部 为“否定”。观察可知,日期时间字段为时间戳的可能性高,事件ID或关联ID的可能性在任 意字段中均相同。例如,在图8(a)和(b)所示的相关数据库形式的产品编号DB的情况下,向用户提 示图29所示的数据。在图29的例子中,分别针对产品编号字段、产品名称字段,提示步骤 S7 S13的判定结果。另外,产品编号DB判断为没有时间戳,视为以后的处理对象以外,所 以,关于事件名称,全部为“否定”。观察可知,存在时间戳的字段的可能性非常低,产品编号 字段和产品名称字段为事件ID或关联ID的可能性高。并且,在图13 (a)所示的CSV形式的产品编号DB的情况下,向用户提示图30所示 的数据。在图30的例子中,分别针对产品编号字段、产品名称字段,提示步骤S7 S13的判定结果。另外,产品编号DB判断为没有时间戳,视为以后的处理对象以外,所以,关于事 件名称,全部为“否定”。观察可知,存在时间戳的字段的可能性非常低,事件ID或关联ID 的可能性在任意字段中均相同。返回图3的说明,步骤S15结束后,用户经由输入输出部11,针对事件名称、时间 戳、事件ID/关联ID候选等进行修正输入或确定输入,进行或命令记录的复制等,生成事件 候选数据,事件候选数据生成部3将其存储在事件候选数据存储部5中(步骤S16)。该作 业主要或一部分由用户来实施,所以,在图3中用虚线框来描绘。然后,处理返回步骤S3。例如根据图21的判定结果,如图31所示,在事件名称确定表名称即“接受订货”、 时间戳确定日期时间字段、事件ID/关联ID候选确定接受订货编号字段和地域字段的情况 下,例如在事件候选数据存储部5中存储图32所示的数据。在图32所示的例子中,在全部 记录中附加事件名称“接受订货”,将日期时间字段的字段值的全部记录复制到时间戳的字 段,将接受订货编号字段和地域字段作为事件ID/关联ID候选,复制字段名称和字段值的 全部记录。例如根据图22的判定结果,在事件名称确定表名称即“接受订货”、时间戳确定日 期时间字段、事件ID/关联ID候选确定接受订货编号字段、地域字段和接受订货内容字段 的情况下,例如在事件候选数据存储部5中存储图33的数据。进而,例如根据图23的判定结果,在事件名称确定表名称即“生产”、时间戳确定 日期时间字段、事件ID/关联ID候选确定生产编号字段、接受订货编号字段和产品编号字 段的情况下,例如在事件候选数据存储部5中存储图34的数据。并且,例如根据图24的判定结果,在事件名称确定表名称即“生产”、时间戳确定 日期时间字段、事件ID/关联ID候选确定生产编号字段、接受订货编号字段、产品编号字段 和交货日期字段的情况下,例如在事件候选数据存储部5中存储图35的数据。进而,例如根据图25的判定结果,在事件名称确定表名称即“筹备”、时间戳确定 日期时间字段、事件ID/关联ID候选确定筹备编号字段、接受订货编号字段、产品编号字段 和交货目的地字段的情况下,例如在事件候选数据存储部5中存储图36的数据。并且,例如根据图26的判定结果,在事件名称确定表名称即“筹备”、时间戳确定 日期时间字段、事件ID/关联ID候选确定筹备编号字段、接受订货编号字段、产品编号字段 和交货目的地字段的情况下,例如在事件候选数据存储部5中存储图37的数据。进而,例如根据图27的判定结果,在事件名称确定表名称即“配送”、时间戳确定 日期时间字段、事件ID/关联ID候选确定筹备编号字段、配送包裹字段和交货目的地字段 的情况下,例如在事件候选数据存储部5中存储图38的数据。并且,例如根据图28的判定结果,在事件名称确定表名称即“配送”、时间戳确定 日期时间字段、事件ID/关联ID候选确定筹备编号字段、配送包裹字段和交货目的地字段 的情况下,例如在事件候选数据存储部5中存储图39的数据。并且,例如在将图19的这种在表内存在多个时间戳的字段的表作为处理对象的 情况下,例如在事件候选数据存储部5中存储图40 图44所示的数据。在图40 图44 所示的例子中,根据确定为时间戳的字段即开立发票日期时间、批准日期时间、订货日期时 间、交货日期时间、验收日期时间,针对这些每个字段,生成分别将事件名称确定为“开立发 票”、“批准”、“订货”、“交货”、“验收”的事件候选数据。关于时间戳,将开立发票日期时间字段、批准日期时间字段、订货日期时间字段、交货日期时间字段、验收日期时间字段的字 段值的全部记录复制到各个事件候选数据的时间戳的字段。进而,全部事件候选数据共同 地,将开立发票日期时间字段、批准日期时间字段、订货日期时间字段、交货日期时间字段、 验收日期时间字段以外的字段作为事件ID/关联ID候选,复制字段名称和字段值的全部记录。这样,将在以下的处理中使用的事件候选数据存储在事件候选数据存储部5中。在步骤S3中判断为对全部解析对象表进行了处理的情况下,事件数据生成部7使 用存储在事件候选数据存储部5中的事件候选数据,实施事件数据生成处理,在事件数据 存储部9中存储处理结果(步骤S17)。图45示出对应于接受订货事件、生产事件、筹备事件、配送事件分别使用图32、图 34、图36、图38所示的事件候选数据的集合、或者分别使用图33、图35、图37、图39所示的 事件候选数据的集合生成的事件数据的例子。作为其生成方法,可以使用上述日本的特愿 2006-197294所述的事件数据的关联信息的自动提取方式,也可以手动对各事件候选数据 的事件ID/关联ID候选的字段值的对应关系进行调查和分析,由此,确定事件之间的关联 性。在图45中确定了如下内容接受订货事件的事件ID是接受订货编号,生产事件的 事件ID是生产编号,关联ID是接受订货编号,筹备事件的事件ID是筹备编号,关联ID是 接受订货编号,配送事件的事件ID是筹备编号,关联ID是配送包裹。并且,生产事件的关 联ID的字段值取接受订货事件的事件ID的字段值的某个值,由此,确定如下的事件之间的 关联性确定生产事件的各个记录(即事件实例)与接受订货事件的哪个记录(即事件实 例)关联。在筹备事件的关联ID和接受订货事件的事件ID之间、以及配送事件的事件ID 和筹备事件的事件ID之间确定同样的关联性。并且,过程实例生成部13使用存储在事件数据存储部9中的事件数据,实施过程 实例生成处理,在过程实例数据存储部15中存储处理结果(步骤S19)。作为其生成方法, 能够使用美国专利公开公报2005/076059A1这种业务过程跟踪方法等。图46示出使用图45的事件数据生成以接受订货编号JTOl的接受订货事件实例 为起点的过程实例的处理过程的概率说明。最初,作为取接受订货事件的事件ID即接受订 货编号的字段值JTOl作为关联ID的字段值的记录(即事件实例),根据生产事件确定2 个事件实例,根据筹备事件确定3个事件实例。接着,作为取所确定的筹备事件的事件ID即 筹备编号TH01、TH02、TH03作为关联ID的字段值的记录(即事件实例),根据配送事件确 定3个事件实例。最后,以所确定的接受订货编号JT01的接受订货事件实例为起点,根据 其时间戳的值,按照时间经过的顺序连接直接/间接地具有关联性的事件实例,由此生成 过程实例。即,作为第1过程实例,生成以时间序列排列接受订货、生产、筹备、筹备、筹备、 配送、生产、配送、配送这样的事件实例后的过程实例。同样,图47示出使用图45的事件数据生成的全部过程实例。第2过程实例是以 时间序列排列接受订货、筹备和配送这样的事件实例后的过程实例。第3过程实例是以时 间序列排列接受订货、生产、生产、筹备和配送这样的事件实例后的过程实例。进而,第4过 程实例是以时间序列排列接受订货、筹备和配送这样的事件实例后的过程实例。返回图3的处理流程的说明,接着,重复消除部17使用存储在过程实例数据存储部15中的过程实例的数据,实施重复消除处理(步骤S21)。使用图48 图62详细说明该处理。首先,使用图48 图52说明实施重复消除处理的主旨。首先,如图48所示,在过 程实例数据存储部15中存储10个过程实例。这里,生成5个包含Initial State (初始状 态)、合同、作成发票、请求、回收、合同到期以及Final State (最终状态)这样的事件实例 在内的过程实例,构成组A。并且,生成3个如下的过程实例在Initial State、合同、作 成发票、请求和回收后,经过合同更新返回发票生成,实施请求和回收(复原)后,进一步 转移到合同到期以及Final State,构成组B。进而,生成1个如下的过程实例在Initial State、合同、作成发票、请求和回收后,经过继续返回请求,实施回收(复原)后,进一步转 移到合同到期以及Final State,构成组C。而且,生成1个如下的过程实例在Initial State、合同、作成发票、请求和回收后,再次实施回收(反复),转移到合同到期以及Final State,构成组D。生成这种过程实例,简单地使组A D的过程实例重叠时,生成图49所示的整体 流程。在图49的整体流程中,将组A的过程实例作为主流程而用实线示出,为了便于说明, 利用虚线示出组B、C、D所包含的复原的经由事件实例和复原转移以及反复转移。并且,例如在设组的出现频度相对于整体所占的比率20%为阈值来区分主要流程 和例外流程的情况下,如图50(a)所示,作为主要流程,生成使组A和组B的过程实例重叠 后的流程,提示给用户。与此相对,关于例外流程,向用户提示图50(b)所示的组C的过程 实例(但是,为了便于说明,用虚线示出复原部分的经由事件实例和转移)、图50(c)所示的 组D的过程实例(但是,为了便于说明,用虚线示出表示反复的转移)。在这种图48的过程实例的情况下,在区分主要流程和例外流程方面没有太大问 题,在图49或图50所示的图中,用户能够容易地掌握业务流程的概况。仅通过组A,也占据 50%的出现频度,所以,仅将组A视为主要流程,也与图50同样,在掌握业务流程的概况方 面,没有特别问题。另一方面,在生成图51所示的过程实例的情况下,与图48的情况不同,出现问 题。在图51的例子中,以Initial State、合同、作成发票、请求、回收、合同到期以及Final State这样的流程为基本,生成2个回收这样的事件实例反复1次的过程实例、1个回收这 样的事件实例反复2次的过程实例、1个回收这样的事件实例反复3次的过程实例、1个回 收这样的事件实例反复4次的过程实例、1个回收这样的事件实例反复5次的过程实例。 关于其余的过程实例,以Initial State、合同、作成发票、请求、回收、合同到期以及Final State这样的流程为基本,生成1个进行经过合同更新这样的经由事件实例反复1次发票生 成、请求和回收的复原的过程实例;1个进行经过合同更新这样的经由事件实例反复2次发 票生成、请求和回收的复原的过程实例;1个进行经过合同更新这样的经由事件实例反复3 次发票生成、请求和回收的复原的过程实例。进而,以Initial State、合同、作成发票、请 求、回收、合同到期以及Final State这样的流程为基本,生成1个进行经过续约这样的经 由事件实例反复1次请求和回收的复原的过程实例。这样,生成多种仅复原次数不同的过程实例和多种仅反复次数不同的过程实例, 简单地进行分类时,判断为相同组的过程实例非常少。在图51的例子中,回收这样的事件 实例反复1次的过程实例仅有2个,所以,作为组,其出现频度仅为20%,如图52所示,将其他作为例外流程时,产生8个例外流程,在掌握业务流程的概要方面,例外流程的意义模糊。因此,通过实施图53 图62所示的这种处理,从而从过程实例中删除难以掌握业 务的整体像的复原和反复,由此,过程实例的分组容易,用户能够容易地掌握业务流程的概要。重复消除部17在过程实例数据存储部15中确定一个未处理的过程实例(图52 步骤S111)。然后,针对所确定的过程实例,检查有无反复和有无复原(步骤S113)。将经 过或不经过经由事件实例返回在特定的事件实例之前实施的其他事件实例的转移确定为 复原,将返回相同事件实例的转移确定为反复。有时在一个过程实例中包含反复和复原,进 而,有时也在多个部位包含反复或复原。然后,重复消除部17的反复处理部171针对所确定的过程实例判断是否针对所有 反复部位进行了处理(步骤S115)。在存在未处理的反复部位的情况下,反复处理部171确 定未处理的反复部位(步骤S117),在所确定的反复部位中仅剩余1次反复,删除其余反复 (步骤S119)。然后返回步骤S115。例如在图54A所示的过程实例的情况下,在发票生成中产生3次反复4001,在请求 中产生1次反复4002,在请求开始中产生4次反复4003,但是,以分别仅留下1次的方式删 除重复的其余反复。于是,如图54B所示,发票生成中的反复4001’为1次,请求中的反复 4002,为1次,请求开始中的反复4003,为1次。返回图53的处理的说明,在针对所有反复部位进行了处理的情况下或者完全不 存在反复的情况下,复原处理部173判断是否针对所有复原部位进行了处理(步骤S121)。 在存在未处理的复原部位的情况下,复原处理部173确定一个未处理的复原部位(步骤 S123)。然后,实施复原重复消除处理(步骤S125)。使用图55 图58B说明复原重复消除处理。首先,复原处理部173切出所确定的复原部位中的复原部分(步骤S131)。这里, 例如假设针对图56所示的过程实例进行处理的情况。具体而言,在该过程实例中,在进入 到Initial State、合同、作成发票、请求、更新合同、请求开始后,返回到请求,进入到更新 合同、请求开始后,进一步返回到作成发票,进一步进入到请求、更新合同、请求开始后,还 返回到请求,进一步进入更新合同、请求开始,进入请求结束、Final State。在步骤S131中, 如图57所示,切出返回到请求的第1复原部分、返回到作成发票的第2复原部分、返回到请 求的第3复原部分。然后,复原处理部173对复原部分的模式进行分类(步骤S133)。如图58A所示, 针对所切出的3个复原部分,将到请求、更新合同和请求开始为止的2个复原部分确定为模 式1,将到作成发票、请求、更新合同和请求开始为止的1个复原部分确定为模式2。然后,复原处理部173针对每个模式进行重复消除,S卩,针对各模式留下1个复原, 删除其余的复原(步骤S135)。在存在图58A的2个模式的情况下,如图58B所示,针对各 模式仅统合为一个复原。然后,复原处理部173再构建过程实例,将其存储在简化过程实例数据存储部19 中(步骤S137)。在图58B的情况下,如图59所示,构建如下的过程实例作为连续发生的 事件实例来连接模式1和2的复原部分,按照Initial State、合同、作成发票、请求、更新合
20同、请求开始、请求、更新合同、请求开始、作成发票、请求、更新合同、请求开始、请求结束、 Final State这种顺序发生事件实例。在使同一事件实例重叠来显示图56的初始状态的过程实例的情况下,如图60那 样成为转移错综复杂的形式,但是,如果实施上述的这种处理,则如图61所示,明确了在2 个部位产生复原,容易掌握整体像。返回图53的说明,在步骤S125之后返回步骤S121。在步骤S121中判断为针对所有复原部位进行了处理的情况下或者不存在复原部 位的情况下,重复消除部17判断是否针对所有过程实例进行了处理(步骤S127)。在存在 未处理的过程实例的情况下,返回步骤S111。另一方面,在不存在未处理的过程实例的情况 下,返回原来的处理。返回图3的说明,过程实例分类处理部21对存储在简化过程实例数据存储部19 中的过程实例进行分类,根据分类结果,针对每个种类进行计数,针对每个种类在模型数据 存储部23中存储计数值(步骤S23)。在生成图51所示的过程实例的情况下,实施步骤 S21时,在简化过程实例数据存储部19中存储图62所示的过程实例。即,分类为包含6个 进行了 Initial State、合同、作成发票、请求、回收、回收、合同到期、Final State这样的转 移的过程实例在内的组;包含3个进行了 Initial State、合同、作成发票、请求、回收、更新 合同、作成发票、请求、回收、合同到期、Final State这样的转移的过程实例在内的组;以及 包含1个进行了 Initial State、合同、作成发票、请求、回收、续约、请求、回收、合同到期、 Final State这样的转移的过程实例在内的组。因此,在模型数据存储部23中存储图63所 示的数据。在图63的例子中,登记上述3个组的过程实例以及各自的计数值。另外,在该 阶段,主要流程标志一栏中不登记任何信息。然后,过程显示处理部25使用存储在模型数据存储部23中的数据,实施流程显示 处理(步骤S25)。使用图64 图66说明流程显示处理。首先,流程显示处理部25根据计数值,降序排列存储在模型数据存储部23中的过 程实例的组(步骤S141)。然后,在由用户输入了作为用于将各过程的组作为主要流程进行 处理的判断基准的、该组的过程实例占据总数的比率的阈值的情况下,根据该输入值来确 定,在没有用户的输入的情况下,根据预先设定的值来确定(步骤S143)。例如在将占据总 数的比率的阈值20%以上的组分类为主要流程的情况下,输入20%。但是,也可以直接使 用预先设定的值(例如30%)。然后,流程显示处理部25从计数值上位选择一个未选择的过程实例(步骤S147)。 将该选择的过程实例指定为主要流程(也称为典型流程)(步骤S149)。具体而言,将模型 数据存储部23的表中的主要流程标志设置为打开。然后,判断是否是各组相对于整体所占 的比率>阈值(步骤S153)。在满足该条件的情况下,返回步骤S147。例如,在图63的例子中,最初,选择第1记录时,占据整体的比率为60%,如果阈值 为20%,则返回步骤S147。接着,选择第2记录时,占据整体的比率为30%,同样返回步骤 S147。这样,针对第1记录和第2记录,主要流程标志设置为打开。最后,选择第3记录时,占据整体的比率为10%,不满足占据整体的比率彡阈值这 样的条件,所以,流程显示处理部25返回原来的处理。这样,关于在步骤S147中选择的过 程实例的组以外的过程实例,没有将主要流程标志设置为打开,所以确定为例外流程。
返回图3的说明,流程显示处理部25使用存储在模型数据存储部23中的数据,经 由输入输出部11输出处理结果(步骤S27)。例如,在重叠显示全部过程实例的情况下,显 示图65所示的业务流程。如图65所示,成为经过续约的复原、经过合同更新的复原、回收 的反复分别仅存在一个的这种显示。并且,在使用存储在模型数据存储部23中的主要流程标志的数据来区分显示主 要流程和例外流程的情况下,进行图66所示的显示。例如,设90%为分类比例时,在图63 所示的表中,第1和第2记录的过程实例重叠,将图66的上级的业务流程作为主要流程进 行显示。并且,在图63所示的表中,将第3过程实例作为例外流程进行显示。如果实施这种处理,则与图52的这种分类和显示相比,以非常有条理的形式提示 业务流程,所以,用户更容易掌握实际实施的业务流程的概要。即,在掌握特征方面,省略了 难以掌握业务的整体像的复原和反复,所以,容易掌握反复的有无和方式、以及复原的有无 和方式。以上说明了本发明的实施方式,但是,本发明不限于此。例如图1所示的功能框图 是一例,不一定对应于实际的程序模块。并且,在删除难以掌握业务的整体像的复原并再构建过程实例时,如图59所示, 在一个部位存在多个复原的情况下,如果没有以一定的规则来确定其顺序,则识别为不同 的过程实例。例如,如果采用按照复原的长度从短到长的顺序排列后再构建过程实例这样 的规则,则不会生成复原的顺序不同而实质相同的过程实例。并且,各得分表也是一例,有时在经验反面更加细致地确定可靠性得分值的设定 方式。进而,关于得分表的项目,有时设定更少的项目,有时设定更多的项目。并且,在图3的处理流程中,步骤S7 S13的顺序能够颠倒,并且,也可以并列实 施。并且,在判定结果的输出中,在各判定项目中自动选择“确定”判定和规定阈值以 上的可靠性得分的字段,提示给用户,针对无法自动选择的判定项目,也可以提示用户进行 选择或输入。进而,与处理对象字段有关的循环分别由步骤S7 S13内的部分构成,但是,也可 以向步骤S7 S13的外侧输出与处理对象字段有关的循环。另外,业务系统分析装置是计算机装置,如图67所示,利用总线2519来连接存储 器2501、CPU 2503、硬盘驱动器(HDD) 2505、与显示装置2509连接的显示控制部2507、移动 盘2511用的驱动器装置2513、输入装置2515、用于与网络连接的通信控制部2517。操作系 统(OS Operating System)和用于实施本实施例中的处理的应用程序存储在HDD2505中, 由CPU 2503过程时,从HDD 2505读出到存储器2501。CPU 2503根据需要对显示控制部 2507、通信控制部2517、驱动器装置2513进行控制,进行必要的动作。并且,处理中途的数 据存储在存储器2501中,如果有需要,则存储在HDD 2505中。在本发明的实施例中,用于 实施上述处理的应用程序存储在移动盘2511中进行颁布,从驱动器装置2513安装到HDD 2505中。有时也经由因特网等网络和通信控制部2517安装到HDD 2505中。这种计算机装 置使上述CPU 2503、存储器2501等的硬件与OS和必要应用程序有机协作,由此,实现上述 各种功能。
2权利要求
一种业务流程处理程序,用于使计算机执行以下步骤从存储业务处理结果的数据库中提取针对每个案件实施的一连串的业务的数据,生成以时间序列排列所述针对每个案件实施的业务的业务名称的过程实例,将其存储在过程实例数据存储部中的步骤;对存储在所述过程实例数据存储部中的各所述过程实例,判断是否产生了从该过程实例的第1业务返回到之前实施的第2业务的复原的步骤;对产生了所述复原的所述过程实例,针对所述复原的每个模式类别删除该复原的重复复原,将删除所述重复复原后的所述过程实例存储到简化过程实例数据存储部中的步骤;针对每个类别对存储在所述简化过程实例数据存储部中的所述过程实例进行计数的步骤;以及输出步骤,根据所述计数的结果,确定出现频度为规定基准以上、且存储在所述简化过程实例数据存储部中的所述过程实例,作为主要业务流程进行输出。
2.根据权利要求1所述的业务流程处理程序,其中,该业务流程处理程序还用于使所 述计算机执行以下步骤对存储在所述过程实例数据存储部中的各所述过程实例,判断是否产生了从该过程实 例的第3业务返回到该第3业务的反复的步骤;以及对产生了所述反复的所述过程实例,针对所述反复的每个模式类别删除该反复的重复 反复,将删除所述重复反复后的过程实例存储到所述过程实例数据存储部中的步骤。
3.根据权利要求1所述的业务流程处理程序,其中,该业务流程处理程序还用于使所 述计算机执行以下步骤对存储在所述简化过程实例数据存储部中的各所述过程实例,判断是否产生了从该过 程实例的第3业务返回到该第3业务的反复的步骤;以及对产生了所述反复的所述过程实例,针对所述反复的每个模式类别删除该反复的重复 反复,将删除所述重复反复后的过程实例存储到所述简化过程实例数据存储部中的步骤。
4.根据权利要求1所述的业务流程处理程序,其中,所述输出步骤包含使所确定的所述过程实例重叠的步骤。
5.根据权利要求1所述的业务流程处理程序,其中,所述输出步骤包含作为例外流程输出所确定的所述过程实例以外的过程实例的步骤。
6.一种由计算机执行的业务流程处理方法,包含以下步骤从存储业务处理结果的数据库中提取针对每个案件实施的一连串的业务的数据,生成 以时间序列排列所述针对每个案件实施的业务的业务名称的过程实例,将其存储在过程实 例数据存储部中的步骤;对存储在所述过程实例数据存储部中的各所述过程实例,判断是否产生了从该过程实 例的第1业务返回到之前实施的第2业务的复原的步骤;对产生了所述复原的所述过程实例,针对所述复原的每个模式类别删除该复原的重复 复原,将删除所述重复复原后的所述过程实例存储到简化过程实例数据存储部中的步骤;针对每个类别对存储在所述简化过程实例数据存储部中的所述过程实例进行计数的 步骤;以及输出步骤,根据所述计数的结果,确定出现频度为规定基准以上、且存储在所述简化过程实例数据存储部中的所述过程实例,作为主要业务流程进行输出。
7. —种业务流程处理装置,其具有以下单元从存储业务处理结果的数据库中提取针对每个案件实施的一连串的业务的数据,生成 以时间序列排列所述针对每个案件实施的业务的业务名称的过程实例,将其存储在过程实 例数据存储部中的单元;对存储在所述过程实例数据存储部中的各所述过程实例,判断是否产生了从该过程实 例的第1业务返回到之前实施的第2业务的复原的单元;对产生了所述复原的所述过程实例,针对所述复原的每个模式类别删除该复原的重复 复原,将删除所述重复复原后的所述过程实例存储到简化过程实例数据存储部中的单元;针对每个类别对存储在所述简化过程实例数据存储部中的所述过程实例进行计数的 单元;以及输出单元,其根据所述计数的结果,确定出现频度为规定基准以上、且存储在所述简化 过程实例数据存储部中的所述过程实例,作为主要业务流程进行输出。
全文摘要
文档编号G06Q10/00GK101952843SQ20088012696
公开日2011年1月19日 申请日期2008年2月22日 优先权日2008年2月22日
发明者Kawamura Akira, Hara Hirotaka 申请人:Fujitsu Ltd
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1