供应链网络知识图谱子图识别方法及系统

文档序号:37426616发布日期:2024-03-25 19:14阅读:17来源:国知局
供应链网络知识图谱子图识别方法及系统

本发明涉及的是一种知识图谱领域的技术,具体是一种供应链网络知识图谱子图识别方法及系统。


背景技术:

1、本发明关注于优化供应链网络知识图谱的构建和分析。现有技术中,供应链网络知识图谱通常通过整合大量的企业内外部数据和公共知识来构建,涉及企业、人员、地点和物品等主体。尽管这种方法在供应链管理、知识推理和智能物流等方面具有潜在价值,但在实际应用中却面临着多个挑战。这些挑战包括:复杂的实体数量和关系使得识别关键子图变得困难;难以确定子图中的重要实体和关系;以及缺乏系统性的交互分析方法来解决基于供应链网络知识图谱子图识别的问题。本发明提出一个创新解决方案,旨在克服这些现有技术的限制。


技术实现思路

1、本发明针对现有技术难以从供应链环境中有效识别和提取关键子图的不足以及无法实现系统性的交互分析的缺陷,提出一种供应链网络知识图谱子图识别方法及系统,支持在供应链网络中根据已知条件或者自由挖掘子图,探究其拓扑结构,同时支持识别出子图中的关键实体和关系,此外用户可以通过可视分析系统对数据集进行交互式采集和分析。

2、本发明是通过以下技术方案实现的:

3、本发明涉及一种供应链网络知识图谱子图识别方法,包括:

4、步骤一,关键子图挖掘,包括:a)已知一个或多个起始节点,挖掘与该节点相关的实体和关系以及b)无已知节点的前提下,通过节点度分析和社区检测方法挖掘新子图两种情况。

5、所述的情况a,具体包括:

6、a.1收集已知节点x的所有邻居节点。

7、a.2根据条件选择邻居节点:当设置为考虑类型为空的节点,则当节点x不是类型c,会返回所有邻居节点,否则只返回一定数量的邻居节点;当设置为不考虑类型为空的节点,则对于不是类型c的节点,将从所有邻居中筛选出那些有明确类型的节点,否则从邻居中选择有明确类型的节点。

8、a.3在邻居节点挖掘函数的基础上,进一步挖掘出整个关键子图。第一步初始化邻居层(1,2,3)用于存储不同层次的邻居节点。对于节点x,找出其第一层邻居节点,并将这些节点存储在邻居层1中。对于每个邻居层1中的节点:当节点x与该邻居的关系强度为平均或强,则获取这个邻居的邻居节点,并将它们加入到邻居层2。当节点x与该邻居的关系强度很强,则除将其邻居加入邻居层2外,还会进一步探索这些邻居的邻居,当它们之间的关系也很强,则将这些邻居的邻居添加到邻居层3。最后,子图由邻居层1、2、3中的所有节点组成,并将这些节点作为结果返回。

9、所述的情况b,具体包括:

10、b.1对数据集中的每个节点进行度分析,以识别那些与其他节点有较多关联的关键节点。这个步骤侧重于评估单个节点的连接性,帮助初步识别可能在子图中扮演重要角色的节点。

11、b.2使用社区检测方法,如leiden算法,进一步分析网络结构。这个方法通过识别紧密连接的节点群组,即社区),帮助理解网络中的子图结构。leiden算法通过其细化阶段改善社区的凝聚性,并通过快速局部移动优化计算时间,从而提高社区发现的效率和准确性。

12、b.3在划分得到的社区基础上,对不同关联强度的边赋予不同的强度值,以更准确地反映网络子图中的实际关联情况。这一步骤允许对初始通过leiden算法识别的社区进行更细致的挖掘和分析,进一步提炼出关键子图,并确保这些子图在知识图谱中的关联关系得到有效体现。

13、步骤二,核心实体识别:在得到相关的关键子图后,进一步希望识别核心实体以便于对知识图谱的关联关系加以分析,具体包括:

14、2.1首先,收集节点x的所有邻居节点,并计算这些邻居节点的总数num。

15、2.2遍历每个邻居节点y,判断节点x与其的关系类型。当x和y之间的关系是弱的,则增加弱关系节点的计数(num_weak)。当弱关系节点的数量达到或超过邻居总数的一半,则判断节点x不是核心节点,并结束流程。

16、2.3当节点x具有特定的类型特性,并且其邻居节点具有相关的特性,则进一步分析这些邻居节点的邻居。根据特定的标准,比如某种类型邻居的数量或分布,判断节点x是否为核心节点。当满足条件,则认为节点x不是核心节点,返回false。当不满足上述任一条件,则认为节点x是一个核心节点,返回true。

17、2.4接着,需要利用另一个函数来筛选出子图中满足所有规则的实体。由于没有固定的关联边数限制,选择让用户自定义一个判断核心实体参数率。

18、2.5计算子图p中所有节点的最大度,即与最多其他节点相连的节点的连接数maxdegree。

19、2.6根据给定的比率,找出那些度大于或等于maxdegree乘以ratio的节点。这些节点被视为候选的核心实体,存储在centers中。

20、2.7对于centers中的每个节点x,验证是否真正是子图p的核心实体。当经验证,节点x是核心实体,则将其添加到核心实体列表中。最后返回该列表。

21、步骤三,核心关系识别:在此基础上,希望寻找核心实体间的核心关系。有上述关键实体和关系,便能分析知识图谱的关联关系和运作机制,具体包括:

22、3.1创建一个容器con来存储识别出的关键链路。

23、3.2对于子图p中的每个来自集合x的核心实体i,遍历集合x中的每个其他核心实体j。对于每一对核心实体i和j,找出它们之间的所有最短链路(路径)。

24、3.3检查每条找到的最短链路的长度。当链路长度小于或等于5,这条链路就被认为是潜在的关键链路。进一步根据链路上的关系强度进行筛选。这可能涉及到移除那些基于弱关系形成的链路。

25、3.4将经过筛选的链路添加到关键链路容器con中并返回容器con。

26、本发明涉及一种实现上述方法的供应链网络知识图谱子图识别系统,包括:供应链网络数据与子图概览模块、供应链子图挖掘与详细信息模块,其中:供应链网络数据与子图概览模块采集整个数据集的网络数据分布以及已知的十一个子图的概览信息;供应链子图挖掘与详细信息模块采集单个供应链关键子图。

27、所述的概览信息包括:用于展示各类节点的度与对应节点数量的关联情况的网络节点度分布视图、用于展示已挖掘的11个子图的节点与边的数量信息的规模概览图和子图类型概览视图。

28、所述的网络节点度分布视图中,下拉框包含不同的节点类型,横轴对应节点的度,纵轴代表节点数量(取log后),选择某类型可以观察整体的度分布趋势,由此可以获得度高于某阈值的节点可被判定为有价值的节点的信息,有助于后续对子图的采集。

29、所述的子图规模概览视图中,根据节点的数量与边的数量,可判断子图的规模。通过边与节点的比值也可大致映射子图的紧密程度,比值高的子图内部关联紧密,反之关联稀疏。在交互设计上,考虑到需要布满多张子图,所以设计滑动条以供进行拉伸查看。

30、所述的子图类型概览视图中,使用热力图展示已挖掘的子图中各类型占比,横轴为各个子图,纵轴为每个类型的编码。可通过类型快速定位到相应子图,也可用于快速获取某个子图的类型信息。

31、所述的单个供应链关键子图包括:子图详细信息视图、子图挖掘控制面板、子图类型统计视图、核心实体与核心关系视图。

32、所述的子图详细信息视图通过力导向图展示子图分布情况。通过选择节点或子图切换该图,该图原点代表不同节点,节点类型通过节点中心名和节点颜色标识,节点中心名称是类型缩写;颜色部分子图详细信息视图,子图类型信息视图和核心实体与核心关系视图统一;连线代表节点相联,连线深色代表连线信息重要,浅色代表重要性低。运用d3.js绘制力导向图来进行可视化展示。

33、所述的子图挖掘控制面板用于选择当前展示的子图及子图的挖掘算法。提供对挖掘算法的参数修改、并支持用户更改子图的中心节点以进一步进行采集。在力导向主图的下方是对其所呈现子图的选择框,在系统中共有两种选择方式,第一种是直接选择子图序号,当采用这种方式,系统会使用得到最佳供应链子图的参数(包括是否包括类型为非重要的实体,过滤后c类型节点邻边数和判断核心实体参数,第二种是采用自主搜索的方法,在下拉框选择自主搜索后,再在搜索框中键入具体id,最后选择合适的参数,也能得到相应的子图。

34、所述的子图类型统计视图中左扇形图外部代表节点类型,对应的内部代表节点强度;右扇形图代表节点类型,每部分用横线引出来标注;上方是注释,显示不同节点代表颜色。

35、所述的核心实体与核心关系视图中,使用力导向图展示核心实体与核心关系,与子图详细信息视图使用一样的实现手段和表达方式,唯一的区别在于没有展示完整的子图而只是展示核心实体和核心关系。

36、技术效果

37、本发明技术效果包括:第一,优化供应链子图挖掘算法:本系统采用的关键子图挖掘算法能够更准确、快速地从复杂的供应链数据中识别出关键子图。这增强对供应链网络的理解,提升供应链决策的质量。第二,精准的实体和关系分析:通过核心实体和关系分析技术,本发明能够识别出供应链中的核心实体和关系。这对于优化供应链结构和增强供应链的稳健性至关重要。第三,提升分析结果的可靠性和准确性:本发明的数据处理与交互式分析系统不仅提高处理效率,也确保分析结果的可靠性和准确性,从而提供更加有效的供应链管理方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1