一种交易关联性的分析方法及系统的制作方法

文档序号:6639479阅读:186来源:国知局
一种交易关联性的分析方法及系统的制作方法
【专利摘要】本发明公开了一种交易关联性的分析方法,包括:导出并存储目标交易报文;第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对应的拆分模式;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多个片段,而所述多个片段构成了每笔交易的片段集合内的片段元素;第二次遍历,利用最简拆分模式集合中的拆分模式对相应的私有报文进行拆分;第三次遍历,将任两条私有报文利用所述片段集合中的片段元素进行比较,当存在两个片段元素内的比较结果满足预定条件时,确定所述两个交易间具有关联性;构建网络图,并以交易作为节点,交易之间的关联性作为有向边。
【专利说明】一种交易关联性的分析方法及系统

【技术领域】
[0001] 本发明涉及数据挖掘领域,特别是涉及一种交易关联性的分析方法及系统。

【背景技术】
[0002] 随着银行业务广度和深度的不断扩展,银行业内涉及的后台交易有数千种之多, 每种后台交易均有用于刻画交易属性等的交易报文,而交易报文通常由公有报文和私有报 文两部分组成。其中,公有报文是所有交易所共有的,一般包括如系统资源请求、日志号等 公有字段;私有报文为执行具体交易时,所需的如当前业务属性、客户隐私信息与交易执行 相关的专用字段,各交易之间在这些专用字段上并不具备公有特征。
[0003] 单条交易报文尤其是私有报文可以直观地刻画一次后台交易本身的行为,但其 应用范围却十分有限,而更多有意义、高价值的数据是存在于各种交易之间构成的依赖关 系或关联性上,这是因为交易关联性不仅生动地反映了具体客户本身及客户之间的交易行 为、关系,而且如果在添加适当约束、规则的前提下,还可从中分析获取机构内业务的运营 流程。
[0004] 交易关联性对于金融机构而言是一笔不可多得的财富。因此挖掘并分析各个后台 交易报文之间的交易关联性有重大的实际意义,如果在实际生产中,能高效的获取后台交 易之间的关联性,将对分析、优化行内的交易流程以及业务流程十分有利;一般而言,交易 之间的关联性体现在私有报文内,然而,由于各种后台交易报文的私有报文无论是在数据 格式,还是在长度上均可能存在差异,且客户的行为是多变的,要想获取、存储全部的私有 报文格式不仅时间、空间代价较高,而且协调多个项目组的后台交易也存在较大的人力成 本。
[0005] 因此,如何能高效的获取后台交易之间的关联性,是本领域技术人员需要解决的 技术问题。


【发明内容】

[0006] 本发明的目的是提供一种交易关联性的分析方法,该方法能够高效的获取后台交 易之间的关联性;本发明的另一目的是提供一种交易关联性的分析系统。
[0007] 为解决上述技术问题,本发明提供一种交易关联性的分析方法,包括:导出并存储 目标交易报文;
[0008] 第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对应的拆分模 式,若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模式填充入 多级哈希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多个片段,而所 述多个片段构成了每笔交易的片段集合内的片段元素;
[0009] 对填充后的多级哈希表内的拆分模式进行归约,获得最简拆分模式集合;
[0010] 第二次遍历所述目标交易报文中的私有报文,利用最简拆分模式集合中的拆分模 式对当前交易报文内私有报文的拆分模式进行拆分,将产生新的子模式,添加到私有报文 所对应的拆分模式内形成新的拆分模式;根据所述新的拆分模式,对当前交易报文的私有 报文的片段集合内的片段元素进行再次拆分,删除被拆分的片段元素,并将新生成的片段 元素,添加入片段集合内;
[0011] 第三次遍历所述目标交易报文中的私有报文,将任两条私有报文利用所述片段集 合中的片段元素进行比较,当存在两个片段元素的比较结果满足预定条件时,确定所述两 条受易之间具有关联性。
[0012] 利用所述目标交易报文中的私有报文的所述片段元素建立的连接关系所形成的 结构,通过抽象规则对所述结构进行抽象,形成网络图。
[0013] 其中,所述导出并存储目标交易报文包括:利用公有报文筛选出指定的关键数据 或关键字段,将所述关键数据或关键字段导出并存储。
[0014] 其中,所述确定所述私有报文对应的拆分模式包括:
[0015] 所述私有报文在拆分过程中,形成多个片段,而这些片段在所述私有报文内的起 始位置,一一对应的形成了多个子模式;
[0016] 所述多个子模式,构成了所述私有报文的拆分模式,即所述私有报文的拆分模式 为所述子模式的一个集合;
[0017] 所述若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模 式填充入多级哈希表包括:
[0018] 依次分析各私有报文,根据交易码,按级查询多级哈希表,当存在私有报文的拆分 模式不存在时,在多级哈希表内填充该拆分模式。
[0019] 其中,所述对多级哈希表内的拆分模式进行归约,获得最简拆分模式集合包括:
[0020] 按级遍历多级哈希表,获取每个同一交易码下所对应的一个拆分模式集合;
[0021] 将每一个所述拆分模式集合内的两个拆分模式进行比较,其中,一个拆分模式内 的各子模式与另一个拆分模式内的各子模式逐条比较,取两个子模式之间的交集,并对区 间范围大的子模式进行拆分,并插入所述大区域的子模式的子集合内,其中,区间范围大是 两个子模式中起始位置跨度大的那个子模式;
[0022] 每个同一交易码下对应的一个拆分模式集合比较完成后,获得各交易对应的最简 拆分模式,并最终获取最简拆分模式集合。
[0023] 其中,所述将任两条私有报文利用所述片段集合中的片段元素进行比较,当存在 两个片段元素的比较结果满足预定条件时,确定所述两个片段元素间具有关联性包括:
[0024] 将前序私有报文和后序私有报文利用所述拆分结果进行拆分后的片段集合内的 片段元素进行逐条比较;
[0025] 当当前片段元素比较结果一致,则在两个片段元素之间添加表示关联性的边,并 更新边中的关联属性,且将第一条私有报文和第二私有报文同时进行下一个片段元素的比 较;
[0026] 当当前片段元素比较结果不一致,则将第一条私有报文的当前片断元素与第二私 有报文的下一个片段元素进行比较。
[0027] 所述构建网络图之前还包括:
[0028] 定义规则,用于对交易之间的关联性进行筛选和压缩;
[0029] 所述构建网络图包括:
[0030] 网络图中每一个节点代表一笔交易报文,根据所述定义的规则,对交易私有报文 内各片段之间的关联性进行筛选和压缩后,建立存在关联性的交易节点之间的连接关系。
[0031] 所述构建网络图还包括,网络图迭代,所述网络图迭代的方法包括:
[0032] 交易的发生存在时间序关系,迭代过程中将时间序靠前的网络图中出度为0的交 易节点,与时间序靠后的网络图中入度为〇的交易节点之间的关联性。
[0033] 所述构建网络图后还包括构建业务网络图,其中,构建业务网络图包括:
[0034] 在网络图的基础上,根据交易码对各交易进行聚类,形成业务网络图的节点集 合;
[0035] 根据各交易之间关联性,归集各类交易之间的关联性,并删除冗余边。
[0036] 本发明提供一种交易关联性的分析系统,包括:
[0037] 其中,准备模块,用于导出并存储目标交易报文;
[0038] 第一次遍历模块,第一次遍历所述目标交易报文中的私有报文,确定所述私有报 文对应的拆分模式,若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的 拆分模式填充入多级哈希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分 为多个片段,而所述多个片段构成了每笔交易的片段集合内的片段元素;
[0039]归约模块,用于对多级哈希表内的拆分模式进行归约,获得最简拆分模式集合; [0040] 第二次遍历模块,用于第二次遍历所述目标交易报文中的私有报文,利用最简拆 分模式集合中的拆分模式,对当前交易报文内私有报文的拆分模式进行拆分,将产生新的 子模式,添加到私有报文所对应的拆分模式内形成新的拆分模式;根据所述新的拆分模式, 对当前交易报文的私有报文的片段集合内的片段元素进行再次拆分,删除被拆分的片段元 素,并将新生成的片段元素,添加入片段集合内;
[0041] 第三次遍历模块,用于第三次遍历所述目标交易报文中的私有报文,将任两条私 有报文利用所述片段集合中的片段元素进行比较,当存在两个片段元素的比较结果满足预 定条件时,确定所述两个交易间具有关联性。
[0042] 网络图模块,用于所述目标交易报文中的私有报文的所述片段元素建立的连接关 系所形成的结构,通过抽象规则对所述结构进行抽象,形成网络图。
[0043] 基于上述技术方案,本发明所提供的交易关联性的分析方法及系统,导出并存储 目标交易报文;第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对应的拆 分模式,若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模式填 充入多级哈希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多个片段, 而所述多个片段构成了每笔交易的片段集合内的片段元素;对填充后的多级哈希表内的拆 分模式进行归约,获得最简拆分模式集合;第二次遍历所述目标交易报文中的私有报文,利 用最简拆分模式集合中的拆分模式,对当前交易报文内私有报文的拆分模式进行拆分,将 产生新的子模式,添加到私有报文所对应的拆分模式内形成新的拆分模式;根据所述新的 拆分模式,对当前交易报文的私有报文的片段集合内的片段元素进行再次拆分,删除被拆 分的片段元素,并将新生成的片段元素,添加入片段集合内;第三次遍历所述目标交易报文 中的私有报文,将任两条私有报文利用所述片段集合中的片段元素进行比较,当存在两个 片段元素的比较结果满足预定条件时,确定所述两个交易间具有关联性。利用所述目标交 易报文中的私有报文的所述片段元素建立的连接关系所形成的结构,通过抽象规则对所述 结构进行抽象,形成网络图。通过该方法能够高效的获取后台交易之间的关联性;且降低了 存储资源的开销,能够最大可能的找到各个交易之间的潜在的全部关联性。

【专利附图】

【附图说明】
[0044] 为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有 技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根 据这些附图获得其他的附图。
[0045] 图1为本发明实施例提供的交易关联性的分析方法的流程图;
[0046] 图2为本发明实施例提供的交易关联性的分析方法中获得最简拆分模式集合的 流程图;
[0047] 图3为本发明实施例提供的交易关联性的分析方法中确定所述两个片段元素间 具有关联性的流程图;
[0048] 图4为本发明实施例提供的交易关联性的分析方法中片段元素的存储结构图;
[0049] 图5为本发明实施例提供的交易关联性的分析方法中的示意网络图;
[0050] 图6为本发明实施例提供的交易关联性的分析方法的中构建后台业务网络图的 结果示意图;
[0051] 图7为本发明实施例提供的交易关联性的分析系统的结构框图;
[0052] 图8为本发明实施例提供的准备模块的结构框图;
[0053] 图9为本发明实施例提供的第一次遍历模块的结构框图;
[0054] 图10为本发明实施例提供的归约模块的结构框图;
[0055] 图11为本发明实施例提供的第二次遍历模块的结构框图;
[0056] 图12为本发明实施例提供的第三次遍历模块的结构框图;
[0057] 图13为本发明实施例提供的交易关联性的分析系统的再一结构框图。

【具体实施方式】
[0058] 本发明的核心是提供一种交易关联性的分析方法,该方法能够高效的获取后台交 易之间的关联性;本发明的另一目的是提供一种交易关联性的分析系统。
[0059] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060] 银行业内各企业涉及的后台交易有数千种之多,而如果在实际生产中,如果能高 效的获取后台交易之间的关联性,将对分析、优化行内的交易流程以及业务流程十分有利; 但目前没有系统的解决方案,因此,本发明提出了一种交易关联性分析的方法,该方法以私 有报文的二进制为源数据来进行的分析,进而得到交易关联性,交易关联性不仅生动的反 映了具体客户本身及客户之间的交易行为、关系,甚至可以从中分析获取机构内业务的运 营流程。这里我们可以看到由于是以报文的二进制数据作为直接的处理对象,因此,算法不 必依赖数据库的条件查询来实现,可直接在源数据层面进行分析。
[0061] 每种交易码下的私有报文本身就可能存在多种字段格式,且受限于待分析的日间 生产数据,存在报文拆分模式的数量是不确定的,因此本发明是分三次对全部的私有报文 进行遍历。
[0062] 请参考图1,图1为本发明实施例提供的交易关联性的分析方法的流程图;该方法 可以包括:
[0063] 步骤slOO、导出并存储目标交易报文;
[0064] 所述目标交易报文为从实际生产的环境中,导出后台交易的实际输入报文,并以 二进制进行存储。
[0065] 所述目标交易报文由公有报文和私有报文组成,而交易之间的关联性一般隐藏在 私有报文中,但由于私有报文内的各字段是根据具体交易设定,通常对于非交易开发人员 而言是未知格式规范的,除此之外,每笔交易根据实际的业务场景,并非全部的字段内均被 填充有效数据,因此私有报文通常是以非连续的二进制码流的形式存在的,由多个离散的 数据片段组成。
[0066] 根据全部后台交易的交易码,建立用于存储各种交易私有报文拆分模式的多级哈 希表;
[0067] 其中,所述多级哈希表是一种数据结构,它可以提供快速的插入操作和查找操作。 一般的线性表,树中,记录在结构中的相对位置是随机的,即和记录的关键字之间不存在确 定的关系,因此,在结构中查找记录时需进行一系列和关键字的比较。这一类查找方法建立 在"比较"的基础上,查找的效率依赖于查找过程中所进行的比较次数。这里构建哈希表是 为了快速查询以及聚类相同交易码下私有报文拆分模式集合。
[0068] 所述多级哈希表的构建方法为:
[0069] 假设交易码TR_C0D字段占用n+1个字节,其中第n个字节为结束符,基于此种数 据结构特征,本发明可以建立二级哈希表,建立方法如下:
[0070] 以TR_C0D[0?n/2]构成的字符串计算出2个字节哈希值,作为第一级索引,构成 的哈希键;
[0071] 以TR_C0D[n/2+l?n]构成的字符串计算出2个字节哈希值,作为第二级索引,构 成的哈希键;
[0072] 在二级哈希表创建完成后,通过上述方法依次对目标交易报文进行遍历,逐步向 二级哈希表内添加各类交易的拆分模式,完成对二级哈希表的填充。
[0073] 根据全部后台交易的交易码,建立用于存储各种交易私有报文拆分模式的多级哈 希表;
[0074] 步骤SllO、第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对应 的拆分模式,若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模 式填充入多级哈希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多个 片段,而所述多个片段构成了每笔交易的片段集合内的片段元素;
[0075] 在第一次遍历所述目标交易报文中的私有报文部分的过程中,按照确定所述私有 报文对应的拆分模式,将私有报文进行拆分,此处:读取一笔交易的私有报文,利用空格、 TAB等导致私有报文非连续化的特征字符,对私有报文进行拆分;拆分后,该条私有报文 就具有了多个报文片段,而每个片段在私有报文内的起始位置代表了一种拆分模式内的 一个子模式;本发明定义的拆分模式为ModSet: {modi, mod2, ? ? ? ?,modn},其中modi (i = 1,2. . .,n)对应的属性为{from, to}, from为modi在当前私有报文内的起始位置,而to 则代表结束的位置,其中modi (i = l,2...,n)即为拆分模式内的片段集合,所有片段集合 {modi, mod2, ----,modn}形成的拆分模式为 ModSet。这里可以将{modi, mod2, ----,modn} 内各子模式对应的属性串连为双向链表;
[0076] 根据当前交易的交易码,按级查询多级哈希表后,判断当前拆分模式是否已存在 多级哈希表中,如不存在多级哈希表中,则存储该拆分模式;然后进行下一个私有报文的分 析;
[0077] 步骤S120、对填充后的多级哈希表内的拆分模式进行归约,获得最简拆分模式集 合;
[0078] 其中,第一次遍历的过程中,是空格、TAB等导致私有报文非连续化的特征字符进 行拆分,仅仅是根据私有报文的离散性进行了最直观的拆分,而这样的拆分粒度过于粗糙, 并不利于下一步的关联性分析。以下述两个报文片段为例:假设'FFFF'交易中存在如下 两段私有报文1和2。报文1被拆分为3个片段,这三个片段构成了报文1的片段结合,报 文2则因不存在关键特征只包含一个片段,直观上来看,两者之间在拆分模式上并不存在 共性。正如前文所述,私有报文也是格式化的数据,而针对同一交易码下的不同交易报文格 式是存在共性的,也就是说,报文1内的拆分模式例如{{1,1},{3,3},{5, 27}}也是可以被 报文2所沿用,由此可见,例如报文2的拆分模式内的子模式{0, 21},通过与报文1所述拆 分模式的三个子模式进行规约,并形成如下拆分模式:
[0079] {{0, 0},{1,1},{2, 2},{3, 3},{4, 4},{5, 21}};
[0080] 因此对填充后的多级哈希表内的拆分模式进行归约,获得最简拆分模式集合,是 非常有必要的;且最后归约后的最简拆分模式,仍可在程序结束后,以文件的形式进行存 储,以便于针对新的生产数据进行分析。
[0081] 归约聚类的过程是针对相同交易码下,私有报文拆分模式的聚类,这源于实际生 产数据中,获得的一天或多天的交易报文,但交易的类型却取决于当时客户的行为,而这是 离散分布的。
[0082] 步骤S130、第二次遍历所述目标交易报文中的私有报文,利用最简拆分模式集合 中的拆分模式,对当前交易报文内私有报文的拆分模式进行拆分,将产生新的子模式,添加 到私有报文所对应的拆分模式内形成新的拆分模式;
[0083] 步骤S140、根据所述新的拆分模式,对当前交易报文的私有报文的片段集合内的 片段元素进行再次拆分,删除被拆分的片段元素,并将新生成的片段元素,添加入片段集合 内;
[0084] 其中,在第二次遍历所述目标交易报文中的私有报文,要利用最简拆分模式集合 中的拆分模式对相应的私有报文进行拆分,即每个私有报文具有与其相对应的拆分模式, 在最简拆分模式集合中找到该最简拆分模式对该私有报文进行拆分,若拆分后有新的片段 集合产生则将该新的子模式添加到其拆分模式中,即在拆分模式ModSet内增加新的节点 modi到相应的位置;并最终形成新的拆分模式,这里将新的拆分模式叫为拆分结果。
[0085] 其中,标报文进行第二次遍历,对各条目标报文中私有报文进行逐条分析;根据 当前所分析的交易报文对应的交易码,从最简拆分模式集合中选取其所对应的最简拆分模 式;基于所述最简拆分模式,对当前交易报文的私有报文的片段集合内的片段元素进行再 次拆分,删除被拆分的片段元素,并将新生成的片段元素,添加入片段集合内。
[0086] 步骤S150、第三次遍历所述目标交易报文中的私有报文,将任两条私有报文利用 所述片段集合中的片段元素进行比较,当存在两个片段元素的比较结果满足预定条件时, 确定所述两个交易间具有关联性;
[0087] 步骤S160、利用所述目标交易报文中的私有报文的所述片段元素建立的连接关系 所形成的结构,通过抽象规则对所述结构进行抽象,形成网络图。
[0088] 其中,在第三次遍历所述全部目标交易报文中的私有报文,将任两条私有报文利 用所述片段集合中的片段元素进行逐条比较。这些目标交易报文由于前台提交的时间不 同,存在序关系。假定prev代表当前交易报文的前序交易报文,next代表当前交易报文的 后序交易报文。以下述为例,逐条比较交易A与交易B之间的私有报文内片段集合内的各 元素,当A、B之间不存在任何片段相同,继续进行A与B的后序交易报文,即next之间的关 联性分析;否则,继续进行A的后序交易报文,即next与B关联性之间的分析。
[0089] 经过这一次遍历,则完成了各个交易的私有报文之间的关联性分析,可以在各个 具有关联性的片段元素之间建立代表关联关系的关联边,建立交易报文之间关联性的结 构。
[0090] 优选的,所述导出并存储目标交易报文包括:利用公有报文筛选出指定的关键数 据或关键字段,将所述关键数据或关键字段导出并存储。
[0091] 由于并非所有字段的后台交易报文在本发明中都是有益的,因此,进行关联性分 析之前,需要筛选并导出关键数据或字段,其中,关联关键数据或字段后面都对应相应的私 有报文,即相当于,将有利于以后分析所需要的那部分私有报文导出,这样做可以在很大程 度减少关联性分析的时间,因为已经除去了许多没有意义的字段数据;如下所示,表1列举 了业内各企业均适用的关键字段,通常存放于公有报文,及其在本发明所述方案内的用途。
[0092] 表一
[0093]
[0094] 关键字段

【权利要求】
1. 一种交易关联性的分析方法,其特征在于,该方法包括: 导出并存储目标交易报文; 第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对应的拆分模式,若 所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模式填充入多级哈 希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多个片段,而所述多个 片段构成了每笔交易的片段集合内的片段元素; 对填充后的多级哈希表内的拆分模式进行归约,获得最简拆分模式集合; 第二次遍历所述目标交易报文中的私有报文,利用最简拆分模式集合中的拆分模式, 对当前交易报文内私有报文的拆分模式进行拆分,将产生新的子模式,添加到私有报文所 对应的拆分模式内形成新的拆分模式; 根据所述新的拆分模式,对当前交易报文的私有报文的片段集合内的片段元素进行再 次拆分,删除被拆分的片段元素,并将新生成的片段元素,添加入片段集合内; 第三次遍历所述目标交易报文中的私有报文,将任意两条私有报文利用所述片段集合 中的片段元素进行比较,当存在两个片段元素的比较结果满足预定条件时,确定所述两个 受易间具有关联性; 利用所述目标交易报文中的私有报文的所述片段元素建立的连接关系所形成的结构, 通过抽象规则对所述结构进行抽象,形成网络图。
2. 如权利要求1所述的分析方法,其特征在于,所述导出并存储目标交易报文包括:利 用公有报文筛选出指定的关键数据或关键字段,将所述关键数据或关键字段导出并存储。
3. 如权利要求1所述的分析方法,其特征在于,所述确定所述私有报文对应的拆分模 式包括: 所述私有报文在拆分过程中,形成多个片段,而这些片段在所述私有报文内的起始位 置, 对应的形成了多个子模式; 所述多个子模式,构成了所述私有报文的拆分模式,即所述私有报文的拆分模式为所 述子模式的一个集合; 所述若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分模式填 充入多级哈希表包括: 依次分析各私有报文,根据交易码,按级查询多级哈希表,当存在私有报文的拆分模式 不存在时,在多级哈希表内填充该拆分模式。
4. 如权利要求1所述的分析方法,其特征在于,所述对多级哈希表内的拆分模式进行 归约,获得最简拆分模式集合包括: 按级遍历多级哈希表,获取每个同一交易码下所对应的一个拆分模式集合; 所述拆分模式集合为所述每一个交易码下各交易私有报文的拆分模式的集合; 将每一个所述拆分模式集合内的两个拆分模式进行比较,其中,一个拆分模式内的各 子模式与另一个拆分模式内的各子模式逐条比较,取两个子模式之间的交集,并对区间范 围大的子模式进行拆分,并插入所述大区域的子模式的子集合内,其中,区间范围大是两个 子模式中起始位置跨度大的那个子模式; 每个同一交易码下对应的一个拆分模式集合比较完成后,获得各交易对应的最简拆分 模式,并最终获取最简拆分模式集合。
5. 如权利要求1所述的分析方法,其特征在于,所述将任两条私有报文利用所述片段 集合中的片段元素进行比较,当存在两个片段元素的比较结果满足预定条件时,确定所述 两个片段元素间具有关联性包括: 将前序私有报文和后序私有报文利用所述拆分结果进行拆分后的片段集合内的片段 元素进行逐条比较; 当当前片段元素比较结果一致,则在两个片段元素之间添加表示关联性的边,并更新 边中的关联属性,且将第一条私有报文和第二私有报文同时进行下一个片段元素的比较; 当当前片段元素比较结果不一致,则将第一条私有报文的当前片段元素与第二私有报 文的下一个片段元素进行比较。
6. 如权利要求1所述的分析方法,其特征在于,所述构建网络图之前还包括: 定义规则,用于对交易之间的关联性进行筛选和压缩; 所述规则是基于行业背景而设定。
7. 如权利要求1所述的分析方法,其特征在于,所述构建网络图包括: 网络图中每一个节点代表一笔交易报文,根据所述定义的规则,对交易私有报文内各 片段元素之间的关联性进行筛选和压缩后,建立存在关联性的交易节点之间的连接关系。
8. 如权利要求1所述的分析方法,其特征在于,所述构建网络图还包括:网络图迭代, 其中,所述网络图迭代包括: 交易的发生存在时间序关系,迭代过程中将时间序靠前的网络图中出度为0的交易节 点,与时间序靠后的网络图中入度为〇的交易节点之间的关联性。
9. 如权利要求1所述的分析方法,其特征在于,所述构建网络图后还包括构建业务网 络图,其中,构建业务网络图包括: 在网络图的基础上,根据交易码对各交易进行聚类,形成业务网络图的节点集合; 根据各交易之间关联性,归集各类交易之间的关联性,并删除冗余边。
10. -种交易关联性的分析系统,其特征在于,该系统包括: 准备模块,用于导出并存储目标交易报文; 第一次遍历模块,第一次遍历所述目标交易报文中的私有报文,确定所述私有报文对 应的拆分模式,若所确定的拆分模式在所构建的多级哈希表中不存在,则将所确定的拆分 模式填充入多级哈希表;第一次遍历结束后,所述目标交易报文中私有报文均被拆分为多 个片段,而所述多个片段构成了每笔交易的片段集合内的片段元素; 归约模块,用于对多级哈希表内的拆分模式进行归约,获得最简拆分模式集合; 第二次遍历模块,用于第二次遍历所述目标交易报文中的私有报文,利用最简拆分模 式集合中的拆分模式对当前交易报文内私有报文的拆分模式进行拆分,将产生新的子模 式,添加到私有报文所对应的拆分模式内形成新的拆分模式;根据所述新的拆分模式,对当 前交易报文的私有报文的片段集合内的片段元素进行再次拆分,删除被拆分的片段元素, 并将新生成的片段元素,添加入片段集合内; 第三次遍历模块,用于第三次遍历所述目标交易报文中的私有报文,将任两条私有报 文利用所述片段集合中的片段元素进行比较,当存在两个片段元素的比较结果满足预定条 件时,确定所述两个片段元素间具有关联性; 网络图模块,用于所述目标交易报文中的私有报文的所述片段元素建立的连接关系所 形成的结构,通过抽象规则对所述结构进行抽象,形成网络图。
【文档编号】G06Q10/06GK104408584SQ201410797686
【公开日】2015年3月11日 申请日期:2014年12月18日 优先权日:2014年12月18日
【发明者】朱浩, 曹新平, 莫登嵩, 刘国兴, 周帅, 姚琥, 谢之波, 张虎 申请人:中国农业银行股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1