网络连接强度的分析方法和装置与流程

文档序号:18361311发布日期:2019-08-06 23:53阅读:606来源:国知局
网络连接强度的分析方法和装置与流程

本发明涉及社交网络领域,具体涉及一种网络连接强度的分析方法和装置。



背景技术:

随着互联网技术的高速发展,在线社交网络被人们广泛使用,并进行各种各样的用户交互行为。例如,信息资源的分享、评论、点赞以及转发等。网络连接强度是指网络社区中用户与其他用户的关联强度,在社交网络中表现为主题帖的回复与被回复的关系。

网络连接强度大往往代表着该用户的价值较高,其主题和回帖的质量也比较高。现有技术中,网络连接强度一般通过用户的发帖数量、回帖数量等属性指标来描述,对于发帖数量、回帖数量大的用户,其网络连接强度也大。

然而,本申请的发明人发现上述分析方法在应用时,仅依赖发帖数量等信息分析网络连接强度太过于绝对,无法准确分析网络连接强度。



技术实现要素:

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种网络连接强度的分析方法和装置,解决了现有技术无法准确分析网络连接强度的问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

本发明解决其技术问题所提供的一种网络连接强度的分析方法,包括以下步骤:

获取用户的回复数据;

根据所述回复数据计算用户的中心度,所述中心度包括:点度中心度、中间中心度和接近中心度;

基于预训练的核心-边缘结构模型判断用户所在区域,所述区域包括:核心区域和边缘区域;

计算所述点度中心度、所述中间中心度、所述接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;

根据所述权重计算用户的网络连接强度。

优选的,所述点度中心度计算时的衡量指标包括:相对点出度和相对点入度;所述中间中心度计算时的衡量指标包括:相对中间中心度;所述接近中心度计算时的衡量指标包括:入度接近中心度、出度接近中心度。

优选的,所述点度中心度的计算方法为:

获取直接指向用户的其他用户的数目,获得相对点入度;

获取用户直接指向的其他用户的数目,获得相对点出度;

基于所述相对点入度和所述相对点出度获得点度中心度。

优选的,所述中间中心度的计算方法为:

获取用户出现在任意两个其他用户最短联系路径中的次数,获得相对中间中心度;

基于所述相对中间中心度获得中间中心度。

优选的,所述接近中心度的计算方法为:

获取每个其他用户直接指向用户的最短路径距离之和,获得入度接近中心度;

获取用户直接指向每个其他用户的最短路径距离之和,获得出度接近中心度;

基于所述入度接近中心度和所述出度接近中心度获得接近中心度。

优选的,所述用户的网络连接强度的计算方法包括:

计算相对点出度、相对点入度、相对中间中心度、入度接近中心度、出度接近中心度和核心-边缘模型中用户是否处在核心区域的权重;

根据所述指标权重计算网络连接强度,计算公式为:

其中:

xi表示第i个用户的网络连接强度;

xij表示第i个用户的第j项指标;

wi表示每个指标相对于总指标的权重,即

优选的,所述计算权重的方法包括:熵权法。

本发明解决其技术问题所提供的一种网络连接强度的分析装置,其特征在于,包括:

数据获取模块,用于获取用户的回复数据;

中心度模块,用于根据所述回复数据计算用户的中心度,所述中心度包括:点度中心度、中间中心度和接近中心度;

用户区域判断模块,用于基于预训练的核心-边缘结构模型判断用户所在区域,所述区域包括:核心区域和边缘区域;

网络连接强度计算模块,用于计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据所述权重计算用户的网络连接强度。

优选的,所述中心度模块中,所述点度中心度的衡量指标包括:相对点出度和相对点入度;所述中间中心度的衡量指标包括:相对中间中心度;所述接近中心度的衡量指标包括:入度接近中心度、出度接近中心度。

优选的,所述网络连接强度计算模块中,所述用户的网络连接强度的计算方法包括:

计算相对点出度、相对点入度、相对中间中心度、入度接近中心度、出度接近中心度和核心-边缘模型中用户是否在核心区域的指标权重;

根据所述指标权重计算网络连接强度,计算公式为:

其中:

xi表示第i个用户的网络连接强度;

xij表示第i个用户的第j项指标;

wi表示每个指标相对于总指标的权重,即

(三)有益效果

本发明提供了一种网络连接强度的分析方法和装置。与现有技术相比,具备以下有益效果:

本发明针对用户的回复数据计算用户的中心度,其中,中心度包括以下几种类型:点度中心度、中间中心度和接近中心度;同时基于预训练的核心-边缘结构模型判断用户所在区域,包括核心区域和边缘区域;计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据权重计算用户的网络连接强度,因此本发明可以从用户的中心度属性和用户所在区域两个角度分析用户的网络连接强度,并得出具体的计算值,可以准确分析网络连接强度。同时,根据计算出的网络连接强度可以识别出高价值用户,企业或政府可以有效地提取高价值用户的信息,从而使得工作更加高效。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例所述的网络连接强度分析方法的整体流程图;

图2为本发明实施例所述的网络连接强度分析装置的整体流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请实施例通过提供一种网络连接强度的分析方法和装置,解决了现有技术无法准确分析网络连接强度问题,实现了网络连接强度的准确分析。

本申请实施例中的技术方案为解决上述技术问题,总体思路如下:

本发明实施例针对用户的回复数据计算用户的中心度,其中,中心度包括以下几种类型:点度中心度、中间中心度和接近中心度;同时基于预训练的核心-边缘结构模型判断用户所在区域,包括核心区域和边缘区域;计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据权重计算用户的网络连接强度,因此本发明实施例可以从用户的中心度属性和用户所在区域两个角度分析用户的网络连接强度,并得出具体的计算值,可以准确分析网络连接强度。同时,根据计算出的网络连接强度可以识别出高价值用户,企业或政府可以有效地提取高价值用户的信息,从而使得工作更加高效。

为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

本发明实施例提供了一种网络连接强度的分析方法,如图1所示,包括以下步骤:

s1、获取用户的回复数据;

s2、根据上述回复数据计算用户的中心度,上述中心度包括:点度中心度、中间中心度和接近中心度;

s3、基于预训练的核心-边缘结构模型判断用户所在区域,所述区域包括:核心区域和边缘区域;

s4、计算上述点度中心度、上述中间中心度、上述接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;

s5、根据上述权重计算用户的网络连接强度。

本发明实施例针对用户的回复数据计算用户的中心度,其中,中心度包括以下几种类型:点度中心度、中间中心度和接近中心度;同时基于预训练的核心-边缘结构模型判断用户所在区域,包括核心区域和边缘区域;计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据权重计算用户的网络连接强度,因此本发明实施例可以从用户的中心度属性和用户所在区域两个角度分析用户的网络连接强度,并得出具体的计算值,可以准确分析网络连接强度。同时,根据计算出的网络连接强度可以识别出高价值用户,企业或政府可以有效地提取高价值用户的信息,从而使得工作更加高效。

下面对各步骤进行详细描述。

在步骤s1中,获取用户的回复数据。

例如,本发明实施例从地铁族论坛-北京区中获取了2018年1月10日至2018年4月10日这一个月之间的所有主题帖发帖人、主题帖回复及回复人信息,并将每个发帖人对应的回复数据整理出来,,包括主题帖标题、回复人昵称、回复人回应楼层等属性,部分数据如表1所示。

表1用户回复数据表

在步骤s2中,根据上述回复数据计算用户的中心度,上述中心度包括:点度中心度、中间中心度和接近中心度。

具体的,计算步骤如下:

s201、计算点度中心度。

点度中心度为:在线社交网络中,用户与其他用户存在直接联系,则该用户居于中心地位。

本发明实施例中用于衡量点度中心度的指标为:相对点入度和相对点出度。

其中,相对点入度的计算方法为:获取直接指向用户的其他用户的数目,获得相对点入度。

具体的,计算公式可以为:

其中:crdi表示相对点入度(rd为英文缩写,具体为relativedegree),xij表示点i与点j之间的连线数量,j是直接指向i的点,n是网络的规模。

相对点出度的计算方法为:获取用户直接指向的其他用户的数目,获得相对点出度。

具体的,计算公式可以为:

其中:crdj表示相对点出度,xij表示点i与点j之间的连线数量,j是i直接指向的点,n是网络的规模。

根据计算所得的相对点入度和相对点出度对点度中心度进行处理,计算出点度中心度。

具体的,计算公式可以为:

其中:crd(x)表示点x的相对中心度,xij表示点i与点j之间的连线数量,n是网络的规模。

部分测算结果如表2所示:

表2点度中心度

由表2可知,点出度最高的是节点1,其数值为674,其次为节点112、节点29、节点395,这些节点的点出度均超过了300,说明在论坛里,他们经常对别人的帖子进行回复,乐意发表自己的看法,是该论坛的活跃人物;点入度最高的是节点112,其数值达到986,说明该用户发表的主题帖收到的回复量较大,引起了大规模的争论争议。这些用户有可能是掌握了一定信息的关键人物,也很有可能成为舆论的发起者,值得重点关注。

s202、计算中间中心度。

中间中心度为:如果一个用户同时处于多条关系路径上,则该用户居于重要地位。

本发明实施例中用于衡量中间中心度的指标为:相对中间中心度。

相对中间中心度的计算方法为:获取用户出现在任意两个其他用户最短联系路径中的次数,获得相对中间中心度。

上述相对中间中心度可以由绝对中间中心度求得。

具体的,计算方法可以为:

计算绝对中间中心度,计算公式为:

其中:j≠k≠i,j<k;

cabi表示绝对中间中心度(ab为英文缩写,具体为absolutebetweenness),n是网络的规模,j和k是该网络中任意的两点,bjk(i)表示i点处于点j和点k之间的测地线的概率。

根据绝对中间中心度计算相对中间中心度,计算公式为:

其中:crbi表示点的相对中间中心度(rb为英文缩写,代表relativebetweenness),cabi表示点的绝对中间中心度,n是网络的规模。

中间中心度可以由相对中间中心度表示。

部分测算结果如表3所示:

表3中间中心度

由表3可知,中间中心度最高的是节点112,其数值为46702.902,其次为节点1、节点46、节点39。说明在该论坛里,很多人通过他们建立联系,他们有一定的控制资源的能力,很多信息通过他们进行传递。同时,结果表明,有152个节点中间中心度为0,占到了近27%,这些发帖人几乎不具有控制资源的能力,传递信息的能力非常弱。

s203、计算接近中心度。

接近中心度为:用户与其他用户的接近性程度,接近中心度越小的用户,其在网络中越处在核心地位。

本发明实施例中用于衡量接近中心度的指标为:入度接近中心度和出度接近中心度。

其中,入度接近中心度的计算方法为:获取每个其他用户直接指向用户的最短路径距离之和,获得入度接近中心度。

具体的,入度接近中心度可以用相对入度接近中心度表示。

计算方法可以为:

首先计算绝对入度接近中心度,计算公式为:

其中:表示绝对入度接近中心度,dij表示点i与点j(点j指向点i)之间的测地线距离。

根据绝对入度接近中心度计算相对入度接近中心度,计算公式为:

其中:是点的相对入度接近中心度,是点的绝对入度接近中心度,n为网络规模。

出度接近中心度的计算方法为:获取用户直接指向每个其他用户的最短路径距离之和,获得出度接近中心度。

具体的,出度接近中心度可以用相对出度接近中心度表示。

计算方法可以为:

首先计算绝对出度接近中心度,计算公式为:

其中:表示绝对出度接近中心度,dij是点j与点i(点j指向点i)之间的测地线距离。

根据绝对出度接近中心度,计算相对出度接近中心度,计算公式为:

其中:表示相对出度接近中心度,表示绝对出度接近中心度,n为网络规模。

接近中心度可以由入度接近中心度和出度接近中心度表示。

部分测算结果如表4所示:

表4接近中心度

由表4可知,节点338的入度接近中心度最小,说明该节点能以最小的路径抵达其他成员,在按照接近中心度由高到低进行排序中的表6中,其接近中心度最高,在网络中处于比较核心的地位,不被其他成员控制的能力较高。在论坛成员中,节点距离指标小的成员应该引起重视,这些成员在信息传递的过程中比较活跃,能把信息以最短的路径传达给网络中的其他成员。

在步骤s3中,基于预训练的核心-边缘结构模型判断用户所在区域,上述区域包括:核心区域和边缘区域。

核心一边缘结构模型根据网络中用户间联系的紧密程度而去将网络中的用户分为两个区域:核心区域和边缘区域。位于核心区域的用户在网络中有比较重要的地位,其网络连接强度也比较大。

核心-边缘的理想模型在结构上存在三个方面特征:1、核心成员两两相关;2、核心成员与某些边缘成员之间存在关系;3、边缘成员之间不存在关系。

本发明实施例在预训练模型时,将数据分组进行多次实验,衡量每组数据与理想模型的接近程度,从而找出该网络中最接近理想模型的核心-边缘模型。

部分判断结果如表5所示:

表5部分核心点构成的封闭邻接矩阵

根据表5可知,其结果将32位成员置于核心位置,包括节点1、节点26等点,通过分析以上核心节点发现,这些论坛成员的点度中心度和中间中心度大都比较高,在论坛中表现较为活跃,与之前的分析结果呈现基本一致的结果。由此可见,核心节点成员之间的沟通要更加频繁,在论坛中发挥的个人价值更大。

在步骤s4中,计算上述点度中心度、上述中间中心度、上述接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重。

具体的,本实施例在分析网络连接强度确定了6个衡量指标:相对点出度、相对点入度、相对中间中心度、入度接近中心度、出度接近中心度和核心-边缘模型中用户是否在核心区域。基于这几个指标计算指标各自的权重。

在确定指标权重上,本实施例采用熵权法,还可以为本领域技术人员所能想到的其他方法。

利用熵权法计算指标权重的步骤如下:

假设有m个被评价对象,n个评价指标,xij(1≤i≤m,1≤j≤n)为第i个被评价对象的第j项指标;

第一步,采用极差法对决策矩阵进行标准化处理:

第二步,确定第m个被评价对象的第j个评价指标的熵值hj:

其中:

第三步,利用上面计算的熵值计算指标权重:

且满足

基于上述计算方法,计算出指标的权重如表6所示:

表6指标权重

s5、根据上述权重计算用户的网络连接强度。

具体的计算方法可以为:

设n={n1,n2,...,nm}表示参与评估的地铁论坛用户群体,x={x1,x2,...,x6}表示此模型中的6个指标。

用wi表示各个指标相对于总体的权重,即:则第i个地铁论坛的用户的网络连接强度为:

其中:

xi表示第i个用户的网络连接强度;

xij表示第i个用户的第j项指标。

基于上述公式对用户的网络连接强度进行测算,部分结果如表7所示:

表7测算结果

根据上述结果,本发明实施例可以准确分析用户的网络连接强度。

本发明实施例提供了一种网络连接强度的分析装置,包括:

数据获取模块,用于获取用户的回复数据;

中心度模块,用于根据上述回复数据计算用户的中心度,上述中心度包括:点度中心度、中间中心度和接近中心度;

用户区域判断模块,用于基于预训练的核心-边缘结构模型判断用户所在区域,上述区域包括:核心区域和边缘区域;

网络连接强度计算模块,用于计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据上述权重计算用户的网络连接强度。

综上所述,与现有技术相比,具备以下有益效果:

本发明实施例针对用户的回复数据计算用户的中心度,其中,中心度包括以下几种类型:点度中心度、中间中心度和接近中心度;同时基于预训练的核心-边缘结构模型判断用户所在区域,包括核心区域和边缘区域;计算点度中心度、中间中心度、接近中心度和用户是否处在核心区域在衡量网络连接强度时的权重;根据权重计算用户的网络连接强度,因此本发明实施例可以从用户的中心度属性和用户所在区域两个角度分析用户的网络连接强度,并得出具体的计算值,可以准确分析网络连接强度。同时,根据计算出的网络连接强度可以识别出高价值用户,企业或政府可以有效地提取高价值用户的信息,从而使得工作更加高效。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1