本发明涉及图论数据处理,尤其涉及一种基于图论的业务数据度分布分析方法及装置。
背景技术:
1、度分布是图论和网络理论中都存在的概念,一个图是一个由两个集合和构成的二元组,集合一般由有限个元素构成,其中的元素被称为图的顶点,集合是由有限个元素构成的集合,集合中的每个元素都是一个非负整数。而网络理论的数学框架建立在图论上,网络理论中的网络其实就是图论中的图。
2、目前,在对业务数据进行分析处理过程中,通过采用图论并对其度分布分析,即通过度分布分析来解决业务数据之间的相似性或相关性,并进而可以帮助发现业务问题,并与所获取的数据之间的关系是通过数据分析和挖掘来揭示的。目前。通常是直接对图论中的节点连接的综合进行统计,即一个节点的度通常定义为该节点连接的所有连接的总和,业务数据网络的度分布即为网络中节点的度的概率分布或频率分布,但不便于对业务数据的度分布的特征进行分析展示,难以实现对业务数据的度的统计进行验证纠正,导致业务数据网络的度分布分析的准确性较低,难以用于实际的分析应用。
3、因此,目前亟需一种能够提高业务数据的度分布分析准确性和展示便捷性的方法。
技术实现思路
1、本发明提供了一种基于图论的业务数据度分布分析方法及装置,以解决现有技术中业务数据网络的度分布分析准确性低、难以进行分析展示的技术问题。
2、为了解决上述技术问题,本发明实施例提供了一种基于图论的业务数据度分布分析方法,包括:
3、获取待分析的业务数据,并将所述业务数据转换成网络图的表现形式,从而得到业务数据网络图;
4、根据所述业务数网络图,计算出每个节点的度,并根据每个节点的度,绘制业务数据度分布图;
5、根据所述业务数据度分布图得到网络结构信息,并根据所述网络结构信息,对所述业务数据度分布图进行参数拟合;
6、对拟合后的度分布图进行遗漏边纠正,从而得到业务数据度分布的分析结果,进而将所述业务数据度分布的分析结果进行可视化呈现,从而完成对业务数据度分布的分析。
7、作为优选方案,所述业务数据包括社交网络数据、互联网路由关系数据、网络行为数据、交易行为数据和轨迹同步数据。
8、作为优选方案,所述根据所述业务数网络图,计算出每个节点的度,并根据每个节点的度,绘制业务数据度分布图,具体为:
9、根据所述业务数据网络图中的每个节点及每个节点所连接的边的总和,计算出每个节点的度;
10、根据每个节点的度,将度的取值作为横轴,将对应的节点数量或比例作为纵轴,从而绘制出业务数据度分布图。
11、作为优选方案,所述根据所述业务数据度分布图得到网络结构信息,并根据所述网络结构信息,对所述业务数据度分布图进行参数拟合,具体为:
12、对所述业务数据度分布图进行分析,得到业务数据度分布图的网络结构信息;所述网络结构信息为幂律分布、泊松分布或高斯分布中的一种;
13、根据网络结构信息的类型,通过最小二乘拟合法、线性混合模型法、岭回归法、奇异值分解或最大似然估计法,对所述业务数据度分布图进行度分布参数的拟合;
14、通过假设检验法,对拟合后的业务数据度分布图进行验证,从而完成对业务数据度分布图的参数拟合。
15、作为优选方案,所述对拟合后的度分布图进行遗漏边纠正,从而得到业务数据度分布的分析结果,具体为:
16、根据拟合后的度分布图进行业务数网络图中各节点的边的校验,并通过校验所得到的遗漏边,对拟合后的度分布图进行遗漏边纠正,从而得到遗漏边纠正后的度分布图,作为业务数据度分布的分析结果。
17、作为优选方案,所述将所述业务数据度分布的分析结果进行可视化呈现,具体为:
18、通过直方图、网络图、拟合曲线图、散点图、箱线图或柱状图中的一种或多种,对所述业务数据度分布的分析结果进行可视化呈现,以使得所述业务数据各节点的信息能够进行显示。
19、相应地,本发明还提供一种基于图论的业务数据度分布分析装置,包括:获取模块、绘制模块、拟合模块和可视化模块;
20、所述获取模块,用于获取待分析的业务数据,并将所述业务数据转换成网络图的表现形式,从而得到业务数据网络图;
21、所述绘制模块,用于根据所述业务数网络图,计算出每个节点的度,并根据每个节点的度,绘制业务数据度分布图;
22、所述拟合模块,用于根据所述业务数据度分布图得到网络结构信息,并根据所述网络结构信息,对所述业务数据度分布图进行参数拟合;
23、所述可视化模块,用于对拟合后的度分布图进行遗漏边纠正,从而得到业务数据度分布的分析结果,进而将所述业务数据度分布的分析结果进行可视化呈现,从而完成对业务数据度分布的分析。
24、作为优选方案,所述业务数据包括社交网络数据、互联网路由关系数据、网络行为数据、交易行为数据和轨迹同步数据。
25、相应地,本发明还提供一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的基于图论的业务数据度分布分析方法。
26、相应地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任意一项所述的基于图论的业务数据度分布分析方法。
27、相比于现有技术,本发明实施例具有如下有益效果:
28、本发明的技术方案通过获取并将待分析的业务数据转换成网络图的表现形式,从而得到业务数据网络图,并计算出每个节点的度后,绘制出业务数据度分布图,进而通过业务数据度分布图所得到的网络结构信息,对业务数据度分布图进行参数拟合,以获取最佳的分布拟合结果,提高业务数据网络的度分布分析准确性,并对拟合后的度分布图进行遗漏边纠正,从而实现分析其度分布的特性,还可以对其进行验漏纠正,最后将业务数据度分布的分析结果进行可视化呈现,从而可以从不同类型中的可视化呈现结果中进行其特性的观察,进而得出度分布的特性,且对度分布的特性进行解释分析,以便于度分布的直观了解。
1.一种基于图论的业务数据度分布分析方法,其特征在于,包括:
2.如权利要求1所述的一种基于图论的业务数据度分布分析方法,其特征在于,所述业务数据包括社交网络数据、互联网路由关系数据、网络行为数据、交易行为数据和轨迹同步数据。
3.如权利要求1所述的一种基于图论的业务数据度分布分析方法,其特征在于,所述根据所述业务数网络图,计算出每个节点的度,并根据每个节点的度,绘制业务数据度分布图,具体为:
4.如权利要求3所述的一种基于图论的业务数据度分布分析方法,其特征在于,所述根据所述业务数据度分布图得到网络结构信息,并根据所述网络结构信息,对所述业务数据度分布图进行参数拟合,具体为:
5.如权利要求4所述的一种基于图论的业务数据度分布分析方法,其特征在于,所述对拟合后的度分布图进行遗漏边纠正,从而得到业务数据度分布的分析结果,具体为:
6.如权利要求5所述的一种基于图论的业务数据度分布分析方法,其特征在于,所述将所述业务数据度分布的分析结果进行可视化呈现,具体为:
7.一种基于图论的业务数据度分布分析装置,其特征在于,包括:获取模块、绘制模块、拟合模块和可视化模块;
8.如权利要求7所述的一种基于图论的业务数据度分布分析装置,其特征在于,所述业务数据包括社交网络数据、互联网路由关系数据、网络行为数据、交易行为数据和轨迹同步数据。
9.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任意一项所述的基于图论的业务数据度分布分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至6中任意一项所述的基于图论的业务数据度分布分析方法。