一种基于易制毒行业的复杂关系网络数据可视化分析方法与流程

文档序号:11324075阅读:239来源:国知局

本发明属于化学品监管技术领域,特别是指一种基于易制毒行业的复杂关系网络数据可视化分析方法。



背景技术:

易制毒化学品既是工业生产的必需品又是制作毒品的原料,因此必须对易制毒化学品的流向进行监管,防止其流入非法渠道。

申请号为201310104026.6的中国专利公开了一种“易制毒化学品流向监管方法与系统”,该专利主要用于记录各企业中易制毒化学品的原始流向数据。但是,该专利只能依据易制毒化学品的流量信息对相关企业进行简单监管,无法获得企业之间的复杂关系。



技术实现要素:

有鉴于此,本发明提出了一种基于易制毒行业的复杂关系网络数据可视化分析方法,该方法能够深入分析易制毒化学品相关企业之间的交易关系,找出在交易网络中处于特殊地位的企业,为用户提供重要的参考信息。

为了实现上述目的,本发明提供的的技术方案是:

一种基于易制毒行业的复杂关系网络数据可视化分析方法,其包括以下步骤:

(1)从数据库中获取一段时间内企业间的所有易制毒化学品交易记录,交易记录包含用于表征易制毒化学品的流出企业、流入企业、化学品名称及交易量的信息;

(2)以企业为节点、企业间的单条交易记录为有向边构建企业交易关系网络,有向边从表示流出企业的节点指向表示流入企业的节点;

(3)在显示设备上显示企业交易关系网络,并在企业交易关系网络的每条有向边上标出该条有向边所对应的标示信息;标示信息包含交易记录中含有的化学品名称和交易量信息;

(4)将企业交易关系网络中任两节点之间的所有同向有向边合并为一条有向边,得到有向关系网络;

(5)将企业交易关系网络中任两节点之间的所有有向边合并为一条无向边,得到无向关系网络;

(6)对有向关系网络和无向关系网络分别进行特性分析,得到特性分析数据;特性分析数据包含有向关系网络中每节点的入度和出度,以及无向关系网络中每节点的聚类系数、点度和度中心性;

(7)为特性分析数据中的入度、出度、聚类系数、点度和度中心性分别设定阈值,并在显示设备上,将具有超阈值特性分析数据的节点以醒目方式展现出来。

所谓“具有超阈值特性分析数据的节点”是指这样一种节点,该节点的某项特性分析数据超过该项特性分析数据的预设阈值。

可选地,上述方法中将具有超阈值特性分析数据的节点以醒目方式展现出来的具体方式为:将该节点以不同于普通节点形状、大小和/或颜色的方式展现出来。

可选地,上述方法中将具有超阈值特性分析数据的节点以醒目方式展现出来的具体方式为:将该节点以动画的方式展现出来。

可选地,上述方法中交易记录还包含用于表征易制毒化学品的运输企业的信息,标示信息还包含该运输企业信息。

可选地,上述方法中特性分析数据还包含无向关系网络的平均聚类系数、平均点度、直径、平均路径长度、度分布、度-度相关性、网络中心性以及最大连通子图。

可选地,上述方法中特性分析数据还包含有向关系网络的入度分布和出度分布。

由此可见,本发明的有益效果在于:

1、本发明方法使用复杂网络理论对易制毒化学品的原始流通数据进行深入分析,能够得出易制毒化学品相关企业之间的详细关系,从而为易制毒化学品监管部门提供充足可靠的参考信息,便于监管部门对某些企业进行精准的重点监督和管理。

2、本发明的分析结果可以使监管部门掌握各个企业之间的关系及其关系亲密度,便于找到与某个企业关系亲密的企业;便于监管部门掌握易制毒化学品的流量及流向情况,更及时地发现异常情况;可以识别企业之间进行交易的资源消耗情况,有助于易制毒化学品交易产业链的优化。

3、本发明的分析结果可以使易制毒化学品相关企业更直观、透彻地了解本企业的业务情况,从而协助企业更加经济、便利地进行易制毒化学品的交易,并促使企业合法合理地使用易制毒化学品,遵守法律要求。

4、本发明对易制毒化学品的原始流通数据做出了较之现有技术更进一步的分析,能够提供比现有技术更加细致而深入的参考数据,是对现有技术的一种重要改进。

总之,本发明方法能够深入分析易制毒化学品涉及企业之间的交易关系,展现企业网络及网络中的特殊企业,从而为易制毒化学品的监管部门及相关企业提供重要的参考信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例中的一种方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步地详细说明。

如图1所示,一种基于易制毒行业的复杂关系网络数据可视化分析方法,其包括以下步骤:

(1)从数据库中获取一段时间内企业间的所有易制毒化学品交易记录,该交易记录包含用于表征易制毒化学品的流出企业、流入企业、化学品名称及交易量的信息;

(2)以企业为节点、企业间的单条交易记录为有向边构建企业交易关系网络,其中有向边从表示流出企业的节点指向表示流入企业的节点;

(3)在显示设备上显示企业交易关系网络,并在企业交易关系网络的每条有向边上标出该条有向边所对应的标示信息;标示信息包含交易记录中所含的化学品名称和交易量信息;

(4)将企业交易关系网络中任两节点之间的所有同方向有向边合并为一条有向边,得到有向关系网络;即,在有向关系网络中,两个节点之间最多有两条边,且该两边的方向不同;

(5)将企业交易关系网络中任两节点之间的所有有向边合并为一条无向边,得到无向关系网络;即,在无向关系网络中,两个节点之间最多有一条边;

(6)对有向关系网络和无向关系网络分别进行特性分析,得到特性分析数据;特性分析数据包含有向关系网络中每节点的入度和出度,以及无向关系网络中每节点的聚类系数、点度和度中心性;

(7)为特性分析数据中的入度、出度、聚类系数、点度和度中心性分别设定阈值,并在显示设备上,将具有超阈值特性分析数据的节点以醒目方式展现出来。

可选地,上述方法中将具有超阈值特性分析数据的节点以醒目方式展现出来的具体方式为:将该节点以不同于普通节点形状、大小和/或颜色的方式展现出来。比如,将入度超阈值的节点以三角形标出,将聚类系数超阈值的节点以红色标出,将度中心性超阈值的节点以大圆点标出,等等。

可选地,上述方法中将具有超阈值特性分析数据的节点以醒目方式展现出来的具体方式为:将该节点以动画的方式展现出来。比如,将点度超阈值的节点以循环放大的渐变圆点表示。

可选地,上述方法中的交易记录还包含用于表征易制毒化学品的运输企业的信息,标示信息还包含该运输企业信息。

可选地,上述方法中的特性分析数据还包含无向关系网络的平均聚类系数、平均点度、直径、平均路径长度、度分布、度-度相关性、网络中心性以及最大连通子图。

可选地,上述方法中特性分析数据还包含有向关系网络的入度分布和出度分布。

以上各例中所提到的特性分析数据的具体含义如下:

(a)聚类系数:

设网络中第i个节点vi的相邻节点共有ki个,即节点vi与ki个节点相连,这ki个节点之间可能存在的最大边数为ki(ki-1)/2,而实际存在边数为ri,则节点vi的聚类系数ci为:

ci=2ri/ki(ki-1);

平均聚类系数是无向网络中各节点聚类系数的算术平均值。假设网络的节点数为n,那么网络的平均聚类系数为:

某个企业的聚类系数可反映该企业的直接交易伙伴间交易的疏密程度,平均聚类系数可反映无向网络中所有企业间交易的疏密程度。企业聚类系数越大,说明该企业和其交易伙伴形成的小交易团体紧密程度越高。若某企业聚类系数与整个网络平均聚类系数的比值大于阈值1.42,则该企业以及交易伙伴将成会为监管部门的重点监管对象。

(b)无向网络的直径:

定义无向网络中节点vi与节点vj之间的最短路径长度dij(即从vi到vj的最少边数)为节点vi与节点vj之间的距离,设该无向网络中共有n个节点,则可用网络中所有距离的最大值表示该无向网络的直径d:

无向网络的直径反映了企业间建立交易需要通过的最大企业数目。若直径明显大于平均路径长度,则说明网络中存在边缘企业,即该企业与网络中其他企业交易密切程度较低。

(c)无向网络的平均路径长度:

平均路径长度l为网络中所有节点之间距离的平均值,其计算公式为:

由于在无向网络中dij=dji且dii=0,所以上述公式可简化为:

平均路径长度越小说明网络中企业关系紧密,有助于整个产业链的发展。可通过进一步调查,帮助这些边缘企业调整交易方向,减小整个网络的直径和平均路径长度,优化整个网络的交易产业链。

(d)点度及度分布:

节点的点度为一个节点所有边的数量,也等于该节点所有邻节点的数量。网络的平均点度是指网络中所有节点的点度的平均值,该值可用于衡量网络的凝聚性。无向网络的度分布为网络中度的概率分布,即网络中点度为k的节点在整个网络中所占的比率,计算公式为:

其中,n(k)指网络中点度为k的节点的数目,n为网络中总节点数目。

对于无向网络做点度分布统计,可得出网络中企业存在交易伙伴的情况。若某企业交易伙伴数量与整个网络平均点度的比值大于阈值1.75,则该企业以及交易伙伴将成会为监管部门的重点监管对象。

通过得到的p(ki)和ki可构建网络点度的概率分布图,对各个坐标为(ki,p(ki))的散点可进行曲线拟合。通过分析点的分布以及曲线拟合结果可得出网络点度分布情况,更直观的了解整个网络企业间合作程度。

(e)度-度相关性,可以采用皮尔逊相关系数(pearsoncorrelationcoefficient)来表征,具体计算方式如下:

其中,eij是节点vi与节点vj之间的边,ki为节点vi的度,kj为节点vj的度,m为网络的总边数。可见,r的取值范围为0≤|r|≤1,其中,|r|即为度-度相关的程度。当r<0时,网络是负相关的;当r>0时,网络是正相关的;当r=0时,网络是不相关的。根据拇指法则,相关系数的绝对值范围为0.0~0.2时表示极弱相关或不相关,绝对值范围为0.2~0.4表示弱相关,绝对值范围为0.4~0.6表示中度相关,绝对值范围为0.6~0.8表示强相关,绝对值范围为0.8~1.0表示极强相关。

(f)度中心性以及网络中心性:

节点的度中心性是指节点在与之直接相连的邻节点中的中心程度,节点vi的度中心性为该节点的点度ki与最大可能度n-1的比值,计算公式为:

cd(vi)=ki/(n-1),

节点vi的度中心性cd(vi)越高,节点vi就越趋向于网络的中心位置。

企业度中心性越高,表明其位置更中心化,可与之进行化学品交易的企业更多,其进行化学品交易更便利。当企业度中心性超过阈值0.32时,则可将其列为监管部门的重点监管对象。

网络中心性也称点度中心势,该值越大,说明网络中节点中心度的变异越大,网络的中心化程度就越高,网络中心性的计算公式为:

其中,vmax是网络中度中心性最大的节点。

网络中心性的值可以用于同其他的网络中心性进行比较,进而可了解哪个网络的网络中心化程度较高。网络的中心化程度越高,越有利企业间进行易制毒化学品的交易。通过比较,有利于对本网络中企业产业链进行优化。

(g)最大连通子图,即把图中所有结点用最少的边连接起来的子图,一般来说,一个无向网络的最大连通子图并不唯一。

通过获得最大连通子图,可以了解整个网络中相对较大的企业群体,便于监管和产业链优化。

(h)入度及入度分布:

节点的入度是指进入该节点的边的数目,节点的入度分布是指有向网络中节点入度的概率分布,即网络中入度为k的节点在整个网络中所占的比例,其计算公式为:

其中,nin(k)是入度为k的节点数目,n是网络中节点的总数。

企业的入度为该企业的直接供应商的数目,入度值越大,则该企业购买化学品时可选择的企业就越多,就不会被某个供货方所垄断,可比较各个供货方的价格从中选择性价比最高的企业购买。可以重点关注入度值超过阈值8的企业,通过进一步研究其与供应商的交易数据,得出其选择的优势供应企业,便于对整个网络产业链的优化。

(i)出度及出度分布:

节点的出度是指从节点发出的边的数目,节点的出度分布是指有向网络中节点出度的概率分布,其计算公式为:

其中,nout(k)是出度为k的节点数目,n是网络中节点的总数。

企业的出度为该企业的销售商的数目,可用于衡量企业的重要性和威望,出度值越大,则表明该企业的威望就越高,就越被人信任。可以重点关注出度值超过阈值45的企业,进一步研究其交易数据,综合得出威望高地位重要的企业,便于对整个网络产业链的优化。

可见,通过上述实施例方法,可以构建出易制毒化学品相关企业的关系网络,并通过分析关系网络的特性得到企业之间关系的密切程度、易制毒化学品交易的趋势等信息,供用户企业和监管部门进行参考,满足监管部门对于深度决策及趋势判断的需求。

总之,本发明方法能够深入分析易制毒化学品涉及企业之间的交易关系,展现关系网络中处于特殊地位的企业,为易制毒化学品的监管部门及相关企业提供重要的参考信息,是对现有技术的一种重要改进。

所属领域的普通技术人员应当理解:以上实施例仅为帮助本领域技术人员理解本发明方案而展示的具体个例,并非对本发明保护范围的暗示或限制。在本发明的思路下,不同实施例中的技术特征可以进行组合,步骤顺序可以发生改变。也就是说,凡在本发明的精神和原则内,对上述实施例所做的任何省略、修改、组合、等同替换以及改进等等变化,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1