面向用户视图的过程依赖关系分析方法

文档序号:6633745阅读:363来源:国知局
面向用户视图的过程依赖关系分析方法
【专利摘要】本发明公开一种面向用户视图的过程依赖关系分析方法,根据工作流执行流程,细化或抽象数据的How起源信息,来满足不同用户对于数据的不同级别How起源信息需求,具体利用细化操作和合成操作完成过程依赖关系分析,其特征在于,包括以下步骤:(1)给出过程依赖关系分析模型;(2)设计一种过程依赖关系分析的方法,基于工作流执行流程以及细化、合成操作,构造一套规则,完成过程不同级别之间依赖关系的分析;(3)实现基于过程依赖关系分析的用户视图。采用本发明的方法,充分考虑用户需求的不同,能够满足不同用户对于不同抽象级别How起源信息需求。
【专利说明】面向用户视图的过程依赖关系分析方法

【技术领域】
[0001] 本发明涉及数据起源追踪领域,更具体的讲,涉及到数据的How起源查询领域,提 出了一种面向用户视图的过程依赖关系分析方法,具体完成数据How起源依赖关系分析模 型的设计,利用细化操作和合成操作分析过程依赖关系,实现不同用户需求的用户视图。本 发明提出的过程依赖关系分析的方法可以满足不同用户对于不同抽象层次数据How起源 信息查询的需求。

【背景技术】
[0002] 数据起源是对数据处理的整个历史的信息,包括数据的来源和处理这些数据的所 有后继过程。在数据起源中,数据的处理流程即为How起源。数据过程依赖关系实质上就 是数据的How起源的语义信息。在数据的How起源追踪中,不同用户需要起源信息的抽象 层次不一样,关注点不一样,需要进行不同的处理。


【发明内容】

[0003] 发明目的:为了解决不同抽象层次数据How起源信息查询的问题,本发明面向用 户视图,提出一种过程依赖关系分析的方法,主要在给出数据过程依赖关系分析模型的基 础上,利用细化和合成操作,具体分析过程依赖关系,设计一套规则,给出过程依赖图的细 化和合成方法,满足不同用户对于不同抽象层次数据How起源信息查询的需求。
[0004] 技术方案:一种面向用户视图的过程依赖关系分析方法,包括如下内容:
[0005] 面向用户视图的过程依赖关系分析模型:
[0006] 本发明提出的过程依赖关系分析模型,具体分为两部分描述:
[0007] (1)面向用户需求,设计过程依赖关系分析模型,具体包括过程依赖关系、过程依 赖关系操作、过程依赖关系视图三层;
[0008] (2)基于分析模型,设计过程依赖关系的细化和合成操作。数据血统依赖关系在本 质上是数据血统的语义信息,可以分为数据依赖关系、过程依赖关系和控制依赖关系;
[0009] (3)给出基于过程依赖关系分析的用户视图。
[0010] 面向用户视图的过程依赖关系分析方法:
[0011] 本发明提出的过程依赖关系分析的方法,针对基本流程,设计一套过程依赖关系 分析规则,完成数据How起源的追踪,该方法主要包括:
[0012] (1)过程依赖图的细化:基于基本流程及依赖关系,设计一系列细化规则,并且以 此规则,建立了过程依赖图的细化算法;
[0013] (2)过程依赖图的合成:基于基本流程及依赖关系,构造了一套合成规则,并在此 基础上,设计了过程依赖图的合成算法。
[0014] 基于过程依赖关系分析方法的用户视图:
[0015] 本发明所实现的过程依赖关系用户视图,是基于过程依赖关系分析方法,根据用 户需求,利用细化或合成操作,实现数据How起源追踪的不同视图,满足用户不同的查询需 求。

【专利附图】

【附图说明】
[0016] 图1为面向用户视图的过程依赖关系分析模型;
[0017] 图2为实例流程图;
[0018] 图3为根据图2得到的过程依赖图;
[0019] 图4为根据图3过程依赖关系分析得到的可以处理信息;
[0020] 图5为根据图4进行合并得到的结果用户视图;
[0021] 图6为根据图5进行细化得到的结果用户视图。

【具体实施方式】
[0022] 下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明 而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价 形式的修改均落于本申请所附权利要求所限定的范围。
[0023] 面向用户视图的过程依赖关系分析模型
[0024] 1、过程依赖关系分析模型
[0025] 图1为本发明提出的分析模型,对该模型中的过程依赖相关的概念作如下定义阐 述。
[0026] >定义1数据起源依赖关系定义为一个5元组DP_Dependency = (Data_Set, Process_Set, Data_Data_Dependency, Data_Process_Dependency, Process_Data_ Dependency,Process_Process_Dependency),其中 Data_Set 是数据的集合;
[0027] > Process_Set 是过程的集合;
[0028] > Data_Data_Dependency :Data_Set - Data_Set,是数据到数据的映射关系,称 为数据依赖关系;
[0029] > Data_Process_Dependency :Data_Set - Process_Set,是数据到过程的映射关 系,称为过程对数据依赖关系,即过程依赖于数据,数据是过程的输入;
[0030] > Process_Data_Dependency :Process_Set - Data_Set,是过程到数据的映射关 系,称为数据对过程依赖关系,即数据依赖于过程,数据是过程的输出;
[0031] > Process-Process-Dependency !Process-Set - Process-Set,是过程到过程的 映射关系,称为过程依赖关系;
[0032] >过程对数据依赖关系和数据对过程依赖关系统称为控制依赖关系。
[0033] 定义2过程依赖对于数据Source_Data和Sink_Data,存在依赖序列p = < P1, P2,…,Pn >,满足:
[0034] > P1, P2,…,Pn E Process-Set,Source-Data,Sink-Data e Data-Set ;
[0035] >〈Source-Data,P1X Source-Data 是 P1 的输出;
[0036] > <Pn,Sink-Data〉,Sink-Data 是 Pn 的输入;
[0037] > Pi 依赖于 Pi+1,记作 Pi+1 - Pi,其中 I < i < n-1.
[0038] 则p为Source_Data的一个过程依赖,即Source_Data经过过程p的处理而得到。
[0039] 定义3完全过程依赖对于给定的过程Source_Process和Sink_Process,Source_ Process 过程依赖于 Sink_Process,即 Sink_Process - Source_Process。如果 Sink_ Process=也,P2,…,PJ,是一个组合过程。如果只有P1, P2,…,Pn全部执行结束, Source_Process才能开始执行,则称Source_Process完全过程依赖于Sink_Process,记作

【权利要求】
1. 一种面向用户视图的过程依赖关系分析方法,其特征在于,包括以下步骤: 1) 设计面向用户视图的过程依赖关系分析模型; 2) 设计一种基于细化和合成操作的过程依赖关系分析方法; 3) 实现基于过程依赖关系分析方法的用户视图; 步骤1)所设计的过程依赖关系分析模型,为不同用户查询数据的How起源信息提供基 础,满足数据How起源追踪深层次的可视化需求,进一步包含以下步骤: 11) 面向用户需求,设计过程依赖关系分析模型,包括过程依赖关系、过程依赖关系操 作、过程依赖关系视图三层; 12) 设计过程依赖关系的交、并、细化和合成操作。
2. 根据权利要求1所述的面向用户视图的过程依赖关系分析方法,其特征在于,步骤 2) 所设计的过程依赖关系分析的方法,是面向用户需求、基于过程细化和合成操作的可视 化过程依赖分析方法,包含过程依赖图的细化和合成: 21) 过程依赖图的细化:从基本流程的构成和完全、部分依赖角度,设计一套规则用于 过程依赖图的细化,并且给出了过程依赖图细化的具体算法,采用每两个结点进行比较的 思路,对两个结点的依赖关系进行细化; 22) 过程依赖图的合成:从基本流程的构成和完全、部分依赖角度,设计一套规则用于 过程依赖图的合成,并且给出了过程依赖图合成的具体算法,采用广度优先搜索来搜索到 每一个结点的相邻结点,进行是否是二分图判断,根据判断的三种情况分别进行完全依赖 合成、部分依赖合成和不合成处理。
3. 根据权利要求1所述的面向用户视图的过程依赖关系分析方法,其特征在于,步骤 3) 所实现的过程依赖关系用户视图,是依据过程依赖关系分析方法,利用细化或合成操作, 实现数据How起源追踪的不同视图,满足用户不同的查询需求。
4. 根据权利要求1所述的面向用户视图的过程依赖关系分析方法,其特征在于,对模 型中的细化和合成进行定义,并进一步定义过程依赖关系的细化和合成操作: 定义操作细化DP_Depl、0?_0印2是两个数据起源过程依赖关系图,定义DP_Depl的细 化 DP_D^)2,记为 DP_Dcpl<DP_Dcp2,满足: > Process^Set DP-Depl c: Process^Set DP-Dep- > Process-Process-DependencyI)p 0e丨)1 [ Process-Process-Dependency Dq,2 定义过程细化有过程PpPy对于任何给定的数据Sink_Data,Sink_Data经过过程P1处 理后得到数据Source_Data,Sink_Data经过过程P2处理后也得到数据Source_Data ;如果 P1不能再分解,P2是由{P21,P22,…,P 2J组合而成,P2i<= P1,i彡m,那么P2是P1的细化; 定义过程依赖图的细化对于给定的数据Source_Data,存在依赖序列C1 = < P1, P2, ? ? ?,Pn >,C2 = < X1, X2, ? ? ?,Xn > 满足: > P1, P2,. . . , Pn G Process_Set, X1, X2,. . . , Xm G Process_Set, Source_Data G Data_ Set ; >存在I彡i彡n,Pi由过程依赖序列< X1, X2, . . .,Xm >组成; 则过程依赖序列C3 = < P1, P2, Pi+ c2, Pi+1,. . .,Pn >为C1的一个过程依赖细化,记作 Cl 4?; 定义操作合成DP_Depl、0?_0印2是两个数据起源过程依赖关系图,定义DP_Depl的合 成 DP_D^2,记为 DPJDcpl > DPJDcp2,满足: > Process-Sel nr> Dupl c Process-SetDp 1X1,2 > Process-Process-Dependency Dp Depi〔 Process-Process-Dependency dp--i)eP2 定义过程依赖的合成给定过程依赖图CGraph = (Node_Set,Edge_Set,Role_Set), 通过完全过程依赖的合成和部分过程依赖合成得到的新的依赖关系New_CG,称New_CG是 CGraph的一个过程依赖的合成,记作CGraph:^Ncw_CG; 定义完全过程依赖的合成给定过程依赖图F1DGraph = (Node_Set, Edge_ Set, Role_Set),如果 3Child_PDc PDGraph, Chi ld_PD = (N, E, R), Ne Node-Se" Ee Edge-Set, Re Role-Set,满足 N = Ns U Nf, Ns = {Nsl, Ns2, ? ? ?,Nsi}, 是边起点集合,Nf = {Nfl,Nf2, . . .,Nf^,是边终点集合,图(N,E)是完全二分有向图;如果 R都是完全过程依赖,那么Ns中结点合并成一个结点s,Nf中结点合并成一个结点f,集合E 中的边合并成一条边e =< s, f >,role为完全过程依赖,记生成的图F1DGraph - Child_ PD+ ({s, f},e, role)为New_PD,则New_PD是F1DGraph的一个完全过程依赖的合成; 定义部分过程依赖的合成给定过程依赖图F1DGraph = (Node_Set,Edge_ Set,R〇le_Set),如果 3Child-PDgPDGraph,Child_PD = (N, E, R), Ng Node-Set, EgEdge-Set, RgRole-Set,满足 N = Ns U Nf,Ns = {Nsl,Ns2,…,Nsi},是边起点集合,Nf = {Nfl,Nf2,. . .,Nfj},是边终点集合,图(N,E)是完全二分有向图;如果R都是部分过程依赖, 那么Ns中结点合并成一个结点s,Nf中结点合并成一个结点f,集合E中的边合并成一条边 e =< s, f >,role 为完全过程依赖,记生成的图 F1DGraph - Child_PD+({s, f},e, role)为 New_PD,则New_PD是F1DGraph的一个部分过程依赖的合成。
5.根据权利要求1所述的面向用户视图的过程依赖关系分析方法,其特征在于,定 义数据起源过程依赖关系的用户视图定义为一个三元组User_View = (DP_Dependency, Account, DP_Dependency_Account); 定义13数据How起源DP的用户视图V如果用N(DP)表示数据How起源的结点 集合,用E(DP)表示How起源的边集合,那么一个有n个结点的How起源DP是一个 结点划分:N(DP) : {DPI, DP2, ? ? ? , DPn}, 0 ^DPiGN(DP),对于 i 关 j, i,j 彡 n,有 DPinDPj=0,DPl U DP2 U ? ? ? U DPn = N(DP);用户视图 N(V)是 How 起源的一个划分 {Ml,M2,...,Mm},0 贫Ms[N(V),对于 s 关t,s,t 彡 m,有 MsnMt=0,Ml UM2 U …UMm =N (V)。用户视图V的大小用I V I表示,I V I = m;H〇w起源N (DP)和用户视图N (V)是 一个双射关系〇 : 2N (DP) - N (V),其中: DPi, 3ms= (I)(DPi) gn(V>;相反的,VMseN(V),3DPi,I1(Ms) =DPi。 _,p2)€E(DP),pl e DPi,p2 G DPj,i 关 j,则(DPi),〇 (DPj)) G E(V);相 反的,v (Ps,Pt ) eE(V),3p ie ¢-1 (ps),3pje <I>_1 (p i, p j) e E(DP); 定义最优的用户视图给定一个数据过程起源DP和一组关注过程N(DP): {DPI, DP2,... ,DPn}, R={Rl,...,Rh}GN (DP), h〈n,N(V)是数据过程起源 DP 关于相关过程 R 的 一个最优用户视图,如果满足: >用户视图N(V)是数据过程起源的一个划分{Ml,M2,...,Mm},0#MsGN(V)?对于 s 尹 t,s,t<m,有 Mt=0 ? Ml U M2 U ? ? ? U Mm = N(V); >VDpi,3ms= ?(DPi+)eN(V)。相反的,VMseN(V), 3Dpi,I1(Ms) =DPi; > V(p1, p2)eE(DP),pl GDPi,p2GDPj,i 关 j,贝U (〇(DPi),〇(DPj)) GE(V)。相 反的,V (Ps,Pl ) SE(V), 3pie#-l(ps), 3pje€>-l(pt), (pi,pj) GE(DP); > V s<m,Ms中至多包含R中的一个过程; s<m,满足十Ms ; ,彐 pe DP,满足審{{p} U Ms}; 对于 s 尹 t, s, t < m, -i 3 Ms和 Mt,满足? {Ms, Mt}。
6.根据权利要求I所述的面向用户视图的过程依赖关系分析方法,其特征在于, 过程依赖图的细化规则 对于给定的过程 Source_Process 和 Sink_Process,Source_Process 过程依赖于 Sink_ Process,艮P Sink_Process - Source_Process ;如果 Sink_Process = {PI, ? ? ? , Pn},是-- 个组合过程,那么对于不同组合方式的细化规则如下: 规则1-1顺序结构细化规则:细化依赖序列为< Source_Process,P1, . . .,Pn >,即 Source_Process依赖于P1, P2依赖于P3, -直到Plri依赖于Pn ; 规则1-2并行结构细化规则:Source_Process全部过程依赖于(P1, . . .,P1J ; 规则1-3分支结构细化规则:Source_Process部分过程依赖于(P1, . . .,P1J ; 过程依赖图的合成规则 规则2-1完全过程依赖合成规则:对于过程集合U1, . . .,IJ和IO1, . . .,OJ,完全依 f 、 赖W足Ij -^ Oi, i < m,j < n?如果记 Source-Process = {1丨,? ? ?,Ij,Sink-Process = (O1,…,Oj,则原依赖关系替换成g〇urec_pr〇eess !~> Sink___ Process; 规则2-2部分过程依赖合成规则:对于过程集合U1, . . .,IJ和IO1, . . .,OJ,部分依 赖满足Ij 〇!,i < m,j < n〇 如果记 Source-Process = {I" --?,Ij,Sink-Process = IA,. . .,0m},则原依赖关系替换成 Source^ Process -^ Sink^ Process,
【文档编号】G06F17/30GK104361073SQ201410635328
【公开日】2015年2月18日 申请日期:2014年11月12日 优先权日:2014年11月12日
【发明者】许国艳, 杨莉 申请人:河海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1