一种图谱即视查询系统的制作方法

文档序号:32301058发布日期:2022-11-23 08:22阅读:41来源:国知局
一种图谱即视查询系统的制作方法

1.本发明涉及一种查询系统,尤其是涉及一种图谱即视查询系统。


背景技术:

2.知识图谱在我国是设立在人工智能学学科目录下的独立学科。知识图谱作为一门工程学科,其具体方法大都来自计算机或人工智能的其它领域。知识图谱是一门面向应用的学科,旨在解决现实世界的复杂问题。决定成品质量的关键,在于选择,在于策略,要在当前技术条件下,考虑用哪个方法来解决问题。
3.现有技术,如excel、sas、db2等数据分析工具,有着强大的数据分析和图形动态展示能力,但其数据结构是行列二维的,不具备图数据结构直观的图特征(如路径长度)等等,所以,如需计算某客户与另一客户的交易关联路径,运算量比图数据结构更耗时。中国专利cn 202210168248.3公布了一种知识图谱分析系统及方法,采用mysql和neo4j混合存储技术,解决了传统数据库中无法灵活改变实体和关系的属性、数据查询效率低的问题。但只考虑了知识图谱的数据分析和展示,并没有对数据进行挖掘,形成预警规则,且现有的图数据库neo4j,在图数据库方面更专长,其市场核心竞争力主要在于提升数据性能,故,在数据分析应用场景方面还有待完善。而场景细节的完善,通常需要丰富的行业实践经验积累。问题不匹配,必然降低问题的解决方案的匹配度。
4.因此,如何将数据分析领域和图数据库知识图谱领域相融合,将图的优势发挥在数据分析领域,成为需要解决的技术问题。


技术实现要素:

5.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种图谱即视查询系统。
6.本发明的目的可以通过以下技术方案来实现:
7.一种图谱即视查询系统,所述的系统包括:
8.即视图谱筛选功能模块,用于在图谱页面完成图数据的筛选、查询和展示;
9.按边查询功能模块,用于按边类型进行统计、查询和筛选操作;
10.保存路径和快照功能模块,用于将当前路径和结果记录在操作路径中,以便下次登陆实现延续性开发;
11.翻页功能模块,用于对当前图数据页面实现翻页功能;
12.预警功能模块,用于根据跳棋剥落法实现图数据异常时的预警功能。
13.进一步地,所述的即视图谱筛选功能模块具体逻辑如下:
14.s101、在当前图谱展示界面的检索工具栏中设置高级查询条件,点击查询;
15.s102、当前图谱动态更新为高级查询结果数据对应的新的图谱。
16.进一步地,所述的按边查询功能模块具体逻辑如下:
17.s201、根据指定边类型和主体点,获得边上另外一个点类型,若是多个边,则获得
多个点类型;
18.s202、按点类型,将每种点类型取一个作为一组,形成多个小组;
19.s203、遍历小组,从组内每一个点出发查找主体点,并记录用户点列表;若查询条件中包括数量范围,则根据数量范围对列表进行筛选。
20.进一步地,所述的保存路径和快照功能模块具体逻辑如下:
21.当点击保存路径和快照功能模块时,会将当前页面展示的所有数据内容以及数据状态形成json文件保存在后台数据库中;保存多个快照,当打开快照列表并点击其中一个快照时,系统会将数据库中此快照对应的数据信息返回前台,前台根据数据内容渲染页面。
22.进一步地,所述的翻页功能模块具体逻辑为:每当有向前或向后翻5页的操作时,为目标点记录一个当前的已翻数量,后面再次翻页时根据记录的数值进行翻页,并且当点因为撤销或清空画布操作而消失时,点上记录的已翻数量也同步删除。
23.进一步地,所述的跳棋剥落法具体逻辑为:
24.s501、指定目标结点类型,指定用于跳跃的结点类型或边类型,其中,目标结点类型不可同时设置为跳跃结点类型,执行s502;
25.s502、在通过用于跳跃的结点类型或边类型实现路径可达的目标结点类型结点间,建立目标结点间的直连关系代替原跳跃路径,形成新的图结构,执行s503;
26.s503、在各目标结点类型的结点设置标志位为结点单步可达结点数,判定是否为孤立点或孤立链,其中,孤立点的标志位为0,孤立链的末端结点的标志位为1,其余结点标志位为2,执行s504;
27.s504、依据标志位,去除孤立点和孤立链末端结点,并重计算末端结点的上一结点标志位是否仍为1或0,循环去除孤立链直至留存结点标志位均为2,形成环示图,执行s505;
28.s505、清空环示图中留存的各结点的标志位,并按规律给定结点遍历操作的顺序序号,通过结点定向和记录之后的跳跃路径,逐步跳跃,逐步剥落,执行s506;
29.s506、从跳跃2个目标结点类型结点开始,跳跃步长逐步增加1,迭代执行s507-s509,直至无新的跳跃结点,或跳跃步长达到预设的n步,n步以上的归入n阶环以上的环;
30.s507、跳跃的规则:下一个可跳跃结点,不可以为起始结点,不可以是跳跃路径上已有结点;若能找到新结点则可继续跳跃,标志位设置为1,待s506迭代时延续跳跃;若无新结点可继续跳跃,标志位设置为0,表示该路径为闭环或环中环,返回上一结点,遍历其它分支,直到返回起始结点,仍无新结点可继续跳跃,则剥离为n+1边独立环;
31.s508、保存当前已遍历跳跃的路径以及标志位;
32.s509、剥离标志位为0的结点,形成n+1边独立环。
33.进一步地,所述的系统还包括:
34.名称显示功能模块,用于按需设置名称的显示类型;所述的类型包括名称全称、名称缩写、名称隐藏和名称加密;
35.统计功能模块,用于对图数据进行统计描述,统计描述的内容包括众数、中位数和数据类型;
36.权限管理功能模块,用于对用户机构权限、岗位权限和个人用户权限进行权限的管理;
37.标签实时动态化功能模块,用于实现标签的实时动态化改变;
38.图谱生成时间预计功能模块,用于提供图谱生成的进度预估。
39.进一步地,所述的名称显示功能模块,用于满足监管对信息脱敏要求的同时保留数据分析所需的关联联系,具体包括以下显示类型:
40.名称全称:遍历页面中的每一个点,获取点的名称属性,直接将名称属性赋给展示属性;
41.名称缩写:遍历页面中的每一个点,获取点的名称属性,设置超过固定字数的文字以省略号代替;
42.名称隐藏:遍历页面中的每一个点,将展示属性的值赋为空字符串;
43.名称加密:判断图中点或边的属性为身份证或人名时,执行加密逻辑,对字符串中的固定位置的字符进行加密显示。
44.进一步地,所述的统计功能模块具体逻辑为:
45.遍历选中的点类型的所有点,对点的名称进行计算,统计描述图数据的信息;
46.所述的权限管理功能模块具体逻辑为:
47.在点和边的属性中加入页面不可见的属性字段,字段中包含权限信息,页面在查询图数据时,经过后台会增加对权限属性字段的过滤条件,进而实现在数据源端对用户可见信息的控制;
48.所述的标签实时动态化功能模块具体逻辑为:
49.数据结构加一个标签列,按照后设定的标签转换规则,实时计算重置标签值,并在页面上展示重置标签后的相应图谱。
50.进一步地,所述的图谱生成时间预计功能模块具体逻辑如下:
51.通过接口读取到数据库信息和图处理信息,结合查询语句、表量级和查询条件复杂度,预估图谱进度,当图谱5秒钟内未展示时,提供该图谱进度预估,用户根据该进度预估决定继续等待还是改变查询策略。
52.与现有技术相比,本发明具有以下有益效果:
53.一、本发明的图谱即视查询系统,从图的维度来看,将图数据库知识图谱领域融入数据分析领域异常预警应用场景,可挖掘图特征相关的异常风险点,设置相应的预警规则,减少案件发生的路径,同时,宛如4d的图数据沉浸式即视数据分析体验也能激发用户直觉灵感。
54.二、本发明通过保存快照功能实现用户操作的记录和保存,避免下次登录时,因基础数据更新变动,导致之前分析内容被动地不可复现,且通过分享路径(操作日志),还可便捷地将数据分析提取过程,清晰快速地标准化地分享给其它用户。
55.三、本发明通过多个功能模块的设计,使得图谱的展示更加完善,满足用户的各种需求。
附图说明
56.图1为本发明的系统模块示意图;
57.图2为本发明的即视图谱筛选功能模块实现逻辑示意图;
58.图3为本发明的按边查询功能模块实现逻辑示意图;
59.图4为本发明的保存路径和快照功能模块实现逻辑示意图;
60.图5为本发明的翻页功能模块实现逻辑示意图;
61.图6为本发明的预警功能模块实现逻辑示意图;
62.图7为本发明的名称显示功能模块显示类型示意图;
63.图8为本发明的统计功能模块实现逻辑示意图;
64.图9为本发明的权限管理功能模块实现逻辑示意图;
65.图10为本发明的标签实时动态化功能模块实现逻辑示意图;
66.图11为本发明的图谱生成时间预计功能模块实现逻辑示意图。
具体实施方式
67.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
68.实施例
69.如图1所示,一种图谱即视查询系统,包括即视图谱筛选功能模块、按边查询模块、保存路径和快照功能模块、名称显示功能模块、统计功能模块、翻页功能模块、权限管理功能模块、预警功能模块、标签实时动态化功能模块和图谱生成时间预计功能模块。
70.所述的即视图谱筛选功能模块无需像传统流程那样,跳出图谱展示界面,到传统二维表格查询页面,完成筛选数据后,再折返到图谱展示界面,阅览二维结果数据对应的图谱展示效果。该模块可实现直接在图谱页面完成数据筛选,故提供了更流畅的沉浸式的图视觉体验,激发用户数据直觉与灵感。图谱筛选查询的传统流程中,图谱仅用于结果数据的直接展示,查询是通过数据结构为非图结构的传统报表(关系型数据库)完成的。传统图谱筛选的流程,如下所示:
71.1.关闭当前图谱展示界面
72.2.返回传统报表(二维表格,关系型数据库)筛选页面
73.3.完成数据筛选后的数据准备工作
74.4.返回图谱展示界面,以图数据的结构,展示步骤3的数据结果。
75.如图2所示,即视图谱筛选功能模块则无需跳出当前图谱页面,无需二维表格的传统筛选页面,是真正意义上的图检索,即视图谱筛选功能模块实现逻辑如下所示:
76.s101、当前图谱展示界面的检索工具栏中设置高级查询条件(参考excel函数功能);
77.s102、当前图谱动态更新为高级筛选后结果数据对应的图谱。
78.图谱即视查询的查询连贯性体验,利于用户感受到图像中的重复和不同,提升直觉性预测的准确率,并通过快速验证来调整预警规则的预测,强化直觉性预测的精准性。无需找提数人员后台个性化提数再分析,或等待几周的固定表头的报表功能开发上线。
79.图谱查询传统做法是通过一个点进行扩展,找到关联边和点,这种传统的方式只需要从点出发执行一个一层的select查询即可得到结果。而所述的按边查询功能模块,通过指定主体点类型,并指定需要扩展的边类型,可以以此边类型的维度,对指定主体点类型进行分组操作。例如,图数据有“手机号点、联系方式边、用户点”,在指定了用户和联系方式后,即可计算出每个“手机号点”以“联系方式类型边”连接的“用户点”的总数。此外,该模块
还支持指定多种边类型,可以实现类似于查找相同手机号和相同住址的用户或用户数。如图3所示,具体的逻辑如下:
80.s201、根据指定边类型和主体点,获得边上另外一个点类型。如果是多个边,则会获得多个点类型。
81.s202、按点类型,将每种点类型取一个作为一组,会形成很多小组。
82.s203、遍历小组,从组内每一个点出发查找主体点,并记录用户点列表;如果查询条件中还有数量范围,则根据数量范围对用户点列表进行筛选。
83.如图4所示,所述的保存路径和快照功能模块将用户操作记录在操作路径(含撤销操作),支持路径保存和当前结果的快照保存,用户可以多次登录实现延续性开发,同时,还能避免下次登录时,因基础数据更新变动,导致之前分析内容被动地不可复现。通过分享路径(操作日志),还可便捷地将数据分析提取过程,清晰快速地标准化地分享给其它用户。具体的实现逻辑为:图探索页面的每个操作代码内部都有日志记录逻辑,当用户在页面进行操作时,每执行一步操作,就会将操作的名称以及操作的数据(如操作的对象等信息)记录在前台内存中,并可以通过页面按钮功能随时查看所有操作步骤。当用户点击快照保存功能时,会将当前页面展示的所有数据内容以及数据状态(如隐藏点,虚拟点等)形成json文件保存在后台数据库中。可以保存多个快照,当用户打开快照列表并点击其中一个快照时,系统会将数据库中此快照对应的数据信息返回前台,前台根据数据内容渲染页面。
84.所述的翻页功能模块提供翻页功能,便于更清晰地观测集中度异常的结点;且翻页功能模块还支持单层的对指定“关系类型“或”对象类型“多选展开。如图5所示,翻页功能模块的具体实现逻辑为:每当有向前或向后翻5页的操作时,为目标点记录一个当前的已翻数量,后面再次翻页时根据记录的数值进行翻页,并且当点因为撤销或清空画布操作而消失时,点上记录的已翻数量也同步删除。
85.如图6所示,所述的预警功能模块,用于根据跳棋剥落法实现图数据的异常预警功能;所述的跳棋剥落法具体为:
86.s501、指定目标结点类型,指定用于跳跃的结点类型或边类型,其中,目标结点类型不可同时设置为跳跃结点类型,执行s502;
87.s502、在通过用于跳跃的结点类型或边类型实现路径可达的目标结点类型结点间,建立目标结点间的直连关系代替原跳跃路径,形成新的图结构,执行s503;
88.s503、在各目标结点类型的结点设置标志位为结点单步可达结点数,判定是否为孤立点或孤立链,其中,孤立点的标志位为0,孤立链的末端结点的标志位为1,其余结点标志位为2,执行s504;
89.s504、依据标志位,去除孤立点和孤立链末端结点,并重计算末端结点的上一结点标志位是否仍为1或0,循环去除孤立链直至留存结点标志位均为2,形成环示图,执行s505;
90.s505、清空环示图中留存的各结点的标志位,并按规律给定结点遍历操作的顺序序号,通过结点定向和记录之后的跳跃路径,逐步跳跃,逐步剥落,执行s506;
91.s506、从跳跃2个目标结点类型结点开始,跳跃步长逐步增加1,迭代执行s507-s509,直至无新的跳跃结点,或跳跃步长达到预设的n步,n步以上的归入n阶环以上的环;
92.s507、跳跃的规则:下一个可跳跃结点,不可以为起始结点,不可以是跳跃路径上已有结点;若能找到新结点则可继续跳跃,标志位设置为1,待s506迭代时延续跳跃;若无新
结点可继续跳跃,标志位设置为0,表示该路径为闭环或环中环,返回上一结点,遍历其它分支,直到返回起始结点,仍无新结点可继续跳跃,则剥离为n+1边独立环;
93.s508、保存当前已遍历跳跃的路径以及标志位;
94.s509、剥离标志位为0的结点,形成n+1边独立环。
95.以交通银行的图挖掘预警规则为例,将交行客户结点和电话结点,以及“担保关系”、“授信户的电话关系”、“担保户的电话关系”,使用图谱展示。
96.首先,指定“(客户)类型结点”,可跳跃“电话结点”;然后去掉“电话结点”,再通过标志位,逐步标记出孤立点、链条、孤立环等;最后剥离链条和三边孤立环,剩余最终的高阶复杂环中环,如图8所示。
97.设置客户风险集中度异常偏高偏复杂的预警规则,如担保社交圈偏复杂预警:某交行对公客户存在四边环以上的高阶担保环,并具有环中环的复杂环特征。还可进一步,将预警规则中静态参数“四边环”参数比例化、配置化,如,“环边数高于20%的环”。
98.基于跳棋剥落法的图结构简示效果,还可以通过锁定一个结点,实现局部的跳棋剥落环示;即仅对该锁定的结点的社交圈做定向简化,然后配合“边”隐藏功能,再拆分结构,从而使关系结构更清晰,达到凸显关键结点关键路径的效果。还可以给边按担保金额赋予权重,自动剥落权重小且关联结点数少的边关系。
99.如图7所示,当文字内容过多时,影响视觉效果时,所述的名称显示功能模块可按照需求设置名称全称、名称缩写、名称隐藏和名称加密功能,满足监管对信息脱敏要求的同时保留数据分析所需的关联联系,具体如下:
100.名称全称:遍历探索页面中的每一个点,获取点的名称属性,直接将名称属性赋给展示属性。
101.名称缩写:遍历探索页面中的每一个点,获取点的名称属性,设置超过固定字数的文字以...代替。
102.名称隐藏:遍历探索页面中的每一个边,将展示属性的值赋为空字符串。
103.名称加密:判断图中点或边的属性为身份证或人名时,执行加密逻辑,字符串中的固定位置的字符替换为“*”号。
104.所述的统计功能模块提供统计描述等基础统计分析功能,便于用户按数据特征设置不同的数据分析筛选和处理策略。单击“联系地址”可展开“联系地址”的数据统计描述,再单击可收起。如图8所示,具体功能实现逻辑为:
105.遍历选中的点类型的所有点,对点的名称进行计算,计算出众数、中位数等数据,并显示在页面上。
106.如图9所示,所述的权限管理功能模块用于对用户机构权限、岗位权限和个人用户权限进行权限的管理。具体的实现逻辑为:系统包含的权限控制较为全面,从上到下依次有项目级别、图谱级别、点和边级别和属性级别。点和边级别的权限控制实现方式为,在点和边的属性中加入页面不可见的属性字段,字段中包含权限信息,页面在查询图数据时,经过后台会增加对权限属性字段的过滤条件,进而实现在数据源端对用户可见信息的控制。
107.如图10所示,相比静态标签的通过预处理数据,标签实时动态化功能模块是后处理数据,数据交互结构和机制更复杂,但也更利于客户按需实时调整标签规则。具体实现逻辑如下:
108.数据结构加一个标签列,按照后设定的标签转换规则,实时计算重置标签值。这样用户可以在看到数据情况后,按需通过标签规则,浓缩提炼关键信息,减少节点数,集中度展示得更显著。
109.例如,点《交易txn65496873287》原关联点《交易金额39000》,点《交易txn65496873288》原关联点《交易金额49000》;
110.标签转换后,点《交易txn65496873287》和点《交易txn65496873288》同时关联点《交易金额的区间标签[2万-5万)》;
[0111]
当客户调整标签规则后,图谱快速响应,点《交易txn65496873287》原关联点《交易金额的区间标签[2万-4万)》,点《交易txn65496873288》原关联点《交易金额的区间标签[4万-6万)》。便于客户按需调整归集视图,对数据进行更有效的聚类观测。
[0112]
如图11所示,所述的图谱生成时间预计功能模块,依据数据集的大小和单次操作的复杂度,以及处理器当前资源状态,当等待时间超过5秒时,提示预计处理进度,若在处理中未完成,最多停留在99%的进度即可。具体实现逻辑如下:
[0113]
通过接口读取到数据库信息和图处理信息,结合查询语句涉及表、字段数和表量级、查询条件复杂度,预计图谱生成时间。当图谱5秒钟内未展示时,提供该图谱进度预估,便于用户决定继续等待还是改变查询策略。
[0114]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1