一种电子邮件网络中节点关系的分析方法及系统与流程

文档序号:16512367发布日期:2019-01-05 09:25阅读:390来源:国知局
一种电子邮件网络中节点关系的分析方法及系统与流程

本发明涉及网络分析技术领域,尤其涉及一种电子邮件网络中节点关系的分析方法及系统。



背景技术:

如今,伴随着网络技术的飞速发展,各种网络层出不穷,为了实现网络资源的优化,需要对网络中包含的各个节点进行分析,以电子邮件网络为例,通过对电子邮件网络中各个节点来往网络关系、邮件来源进行分析,确定邮件网络中的重要节点。

由于电子邮件网络中可能存在孤立或者与其它节点关联较少的节点,上述的节点对电子邮件网络的影响较小,可以不对节点的重要性进行分析,因此,现有技术中对各个节点进行分析的方法导致计算的复杂度高,工作量大。



技术实现要素:

有鉴于此,本发明提供了一种电子邮件网络中节点关系的分析方法及系统,用以解决现有技术中对网络中包含的孤立或者与其它节点关联较少的节点进行分析的方法导致计算的复杂度高,工作量大的问题。具体方案如下:

一种电子邮件网络中节点关系的分析方法,包括:

获取与当前网络中各个节点对应的有向图;

依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;

依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;

计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。

上述的方法,可选的,依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络,包括:

获取与所述目标网络对应的网络矩阵;

分别将所述网络矩阵中的每一个节点的度值与其对应的待比较核数阈值进行比较,其中,所述度值包括出度值和入度值;

当出度值和入度值均小于其对应的待比较核数阈值时,将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一。

上述的方法,可选的,分别将所述网络矩阵中的每一个节点的出度值和入度值与其对应的待比较核数阈值进行比较,包括:

获取所述当前网络中的目标核数阈值;

确定与所述目标核数阈值对应的各个核数阈值,其中,各个核数阈值间隔预设的步长;

将每一个核数阈值作为待比较的核数阈值,分别判断所述网络矩阵中每一个节点的出度值和入度值是否小于与其对应的待比较核数阈值。

上述的方法,可选的,计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析,包括:

确定所述目标网络中各个节点的比例因子;

确定所述目标网络中各个节点的调节变量;

依据每一个节点的比例因子和调节变量,计算所述目标网络中各个节点的网页级别值。

上述的方法,可选的,还包括:

依据每一个节点的网页级别值,对所述目标网络中各个节点进行排序。

一种电子邮件网络中节点关系的分析系统,包括:

获取模块,用于获取与当前网络中各个节点对应的有向图;

确定模块,用于依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;

筛选模块,用于依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;

计算模块,用于计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。

上述的系统,可选的,所述筛选模块包括:

获取单元,用于获取与所述目标网络对应的网络矩阵;

比较单元,用于分别将所述网络矩阵中的每一个节点的度值与其对应的待比较核数阈值进行比较,其中,所述度值包括出度值和入度值;

删除单元,用于当出度值和入度值均小于其对应的待比较核数阈值时,将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一。

上述的系统,可选的,所述比较单元包括:

获取子单元,用于获取所述当前网络中的目标核数阈值;

确定子单元,用于确定与所述目标核数阈值对应的各个核数阈值,其中,各个核数阈值间隔预设的步长;

判断子单元,用于将每一个核数阈值作为待比较的核数阈值,分别判断所述网络矩阵中每一个节点的出度值和入度值是否小于与其对应的待比较核数阈值。

上述的系统,可选的,所述计算模块包括:

第一确定单元,用于确定所述目标网络中各个节点的比例因子;

第二确定单元,用于确定所述目标网络中各个节点的调节变量;

计算单元,用于依据每一个节点的比例因子和调节变量,计算所述目标网络中各个节点的网页级别值。

上述的系统,可选的,还包括:

排序模块,用于依据每一个节点的网页级别值,对所述目标网络中各个节点进行排序。

与现有技术相比,本发明包括以下优点:

本发明公开了一种电子邮件网络中节点关系的分析方法,包括:获取与当前网络中各个节点对应的有向图;依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。上述的分析方法,依据当前网络中与各个节点的对应有向图,确定所述各个节点的度值,依据每一个节点的度值对所述当前网络中的各个节点进行筛选分析,得到的目标网络中节点的数量减少,避免了对所述当前网络中孤立的节点或者与其它节点关联较少的节点进行网页级别值计算,有效降低计算的复杂度和工作量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种电子邮件网络中节点关系的分析方法流程图;

图2为本申请实施例公开的一种电子邮件网络中节点关系的分析方法又一方法流程图;

图3为本申请实施例公开的一种电子邮件网络中节点关系的分析方法又一方法流程图;

图4为本申请实施例公开的一种电子邮件网络中节点关系的分析方法又一方法流程图;

图5为本申请实施例公开的一种电子邮件网络中节点关系的分析系统结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

本发明公开了一种电子邮件网络中节点关系的分析方法,所述分析方法,应用于对网络中各个节点的关重程度进行分析的过程中,所述方法的执行主体可以为处理器或者控制器,所述网络可以为公司内部的局域网、大型购物网站、或者电子邮件网络等网络,本发明实施例中,以电子邮件网络为例对所述分析方法进行说明,实现了电子邮件来往网络关系分析、邮件来源分析,以及通过邮件来往构成的复杂邮件网络综合分析。所述分析方法的执行流程如图1所示,包括步骤:

s101、获取与当前网络中各个节点对应的有向图;

本发明实施例中,所述当前网络为电子邮件网络,所述电子邮件网络中的每一个节点对应一个电子邮箱,依据电子邮箱之间邮件的收发关系,确定所述电子邮件网络的有向图,其中,所述有向图指一个有序三元组(v(d),a(d),ψd),其中ψd)为关联函数,它使a(d)中的每一个元素(称为有向边或弧)对应于v(d)中的一个有序元素(称为顶点或点)对,所述有向图中可能包含孤立的节点或者存在较少关联的节点。

s102、依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;

本发明实施例中,有向图之间的边代表邮件的往来关系,依据往来关系,构建与所述电子邮件网络对应的临接矩阵,其中所述临接矩阵用于存放所述电子邮件网络中节点间关系(边或弧)的数据,依据所述临接矩阵中节点间的往来关系,确定每一个节点的度值,依据各个节点的度值,构建度量矩阵。

s103、依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;

本发明实施例中,由于所述电子邮件网络中存在不进行邮件收发或者收发次数较少的电子邮箱,该类邮箱对所述电子邮件网络影响较小,优选的,依据,依据k-核算法对每一个节点的度值进行筛选,删除对所述电子邮件网络影响较小的干扰节点,得到目标电子邮件网络。其中,所述目标电子邮件网络的节点数小于等于其对应的电子邮件网络中节点的数量。

s104、计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。

本发明实施例中,优选的,依据增强型的pagerank算法计算所述目标网络中各个节点的网页级别值,其中,网页级别值反映了每一个节点的重要程度,当接收到计算完成指令时,完成所述电子邮件网络中节点关系的分析。

本发明实施例中,优选的,依据每一个节点的网页级别值,对所述目标网络中各个节点进行排序,完成对所述电子邮件网络中节点关系的分析,其中网页级别值最大的节点对应所述电子邮件网络的源节点即起始电子邮箱。

本发明公开了一种电子邮件网络中节点关系的分析方法,包括:获取与当前网络中各个节点对应的有向图;依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。上述的分析方法,依据当前网络中与各个节点的对应有向图,确定所述各个节点的度值,依据每一个节点的度值对所述当前网络中的各个节点进行筛选分析,得到的目标网络中节点的数量减少,避免了对所述当前网络中孤立的节点或者与其它节点关联较少的节点进行网页级别值计算,有效降低计算的复杂度和工作量。

本发明实施例中,依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络的方法流程如图2所示,包括步骤:

s201、获取与所述目标网络对应的网络矩阵;

本发明实施例中,获取所述目标电子邮件网络对应的网络矩阵,其中,所述网络矩阵总包含所述目标电子邮件网络中各个有向边和节点之间的连接关系。

s202、分别将所述网络矩阵中的每一个节点的度值与其对应的待比较核数阈值进行比较,其中,所述度值包括出度值和入度值;

本发明实施例中,所述目标电子邮件网络对应一个目标核数阈值,优选的,所述目标核数阈值的取值为4,上述的比较过程的具体执行流程如图3所示,包括步骤:

s301、获取所述当前网络中的目标核数阈值;

本发明实施例中,获取所述电子邮件网络中的目标核数阈值,其中,优选的,对核数赋予初始值1,在k-核分解中度值或剩余度小于等于k且大于k-1的节点称其核数是k。

s302、确定与所述目标核数阈值对应的各个核数阈值,其中,各个核数阈值间隔预设的步长;

本发明实施例中,优选的,所述预设的步长为1,则,各个核数阈值分别为1,2,3和4。

s303、将每一个核数阈值作为待比较的核数阈值,分别判断所述网络矩阵中每一个节点的出度值和入度值是否小于与其对应的待比较核数阈值;

本发明实施例中,优选的,依将1作为待比较的核数阈值,将与所述电子邮件网络对应的网络矩阵中的每一个节点的出度值和入度值是否小于1。若是,可将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一,优选的,将所述待比较核数阈值1与所述目标核数阈值进行比较,若所述待比较阈值小于所述目标核数阈值时,将所述待比较阈值更新为2,继续进行步骤s303所示的判断,直至所述待比较阈值与所述目标核数阈值相同时,完成判断。

s203、当出度值和入度值均小于其对应的待比较核数阈值时,将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一。

本发明实施例中,每次的判断过程均当出度值和入度值均小于其对应的待比较核数阈值时,将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一。

本发明实施例中,提出利用核数来分解邮件网络各层,以剔除外层干扰节点,在保留重要成员的基础上减少网络节点规模,降低后续挖掘算法复杂度。

本发明实施例中,传统的pagerank算法,初始时赋予网络中节点的pr值均为1,之后迭代计算节点的pr值,直到网络中节点的pr值都趋于稳定,则最后各节点的pr值表征了节点的重要性,但pr值容易聚积在出度为0的节点而使分配不均,引入pr值调节变量和修正因子可调节节点的跳转概率,对计算过程中节点的pr值进行调节。其中,计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析的方法流程如图4所示,包括步骤:

s401、确定所述目标网络中各个节点的比例因子;

本发明实施例中,原始pagerank算法迭代公式如公式1所示:

其中,aji-节点j到节点i的权值

-节点j的出度值

本发明实施例中,优选的。比例因子g:人为规定,一般为0.85。

引入比例因子后的pagerank算法迭代公式如公式(2)所示:

s402、确定所述目标网络中各个节点的调节变量;

本发明实施例中,节点vj的反向链接和前向链接数之比:其中,inj表示节点vj反向链接数目,表示其他节点传递的pr值,outj表示前向链接数目,表示节点传递的pr值,令调节变量:

s403、依据每一个节点的比例因子和调节变量,计算所述目标网络中各个节点的网页级别值。

本发明实施例中,引用比例因子和调节变量后的pagerank算法迭代公式如公式(3)所示:

依据公式(3)计算所述电子邮件网络中节点的网页级别值。

本发明实施例中,与上述一种网络中关键节点的分析方法相对应的,本发明实施例中还提供了一种电子邮件网络中节点关系的分析系统,所述分析系统的结构框图如图5所示,包括:

获取模块501,确定模块502,筛选模块503和计算模块504。

其中,

所述获取模块501,用于获取与当前网络中各个节点对应的有向图;

所述确定模块502,用于依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;

所述筛选模块503,用于依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;

所述计算模块504,用于计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。

本发明公开了一种电子邮件网络中节点关系的分析系统,包括:获取与当前网络中各个节点对应的有向图;依据所述有向图,确定所述目标网络中各个节点的度值,得到度量矩阵;依据所述度量矩阵中各个节点的度值对所述当前网络中的各个节点进行筛选处理,得到目标网络;计算所述目标网络中各个节点的网页级别值,完成所述当前目标网络中节点的分析。上述的分析系统,依据当前网络中与各个节点的对应有向图,确定所述各个节点的度值,依据每一个节点的度值对所述当前网络中的各个节点进行筛选分析,得到的目标网络中节点的数量减少,避免了对所述当前网络中孤立的节点或者与其它节点关联较少的节点进行网页级别值计算,有效降低计算的复杂度和工作量。本发明实施例中,所述筛选模块503包括:

获取单元505,比较单元506和删除单元507。

其中,

所述获取单元505,用于获取与所述目标网络对应的网络矩阵;

所述比较单元506,用于分别将所述网络矩阵中的每一个节点的度值与其对应的待比较核数阈值进行比较,其中,所述度值包括出度值和入度值;

所述删除单元507,用于当出度值和入度值均小于其对应的待比较核数阈值时,将与所述出度值和所述入度值对应的节点删除,并将与其存在连接关系的节点的度值减一

本发明实施例中,所述比较单元506包括:

获取子单元508,确定子单元509和判断子单元510。

其中,

所述获取子单元508,用于获取所述当前网络中的目标核数阈值;

所述确定子单元509,用于确定与所述目标核数阈值对应的各个核数阈值,其中,各个核数阈值间隔预设的步长;

所述判断子单元510,用于将每一个核数阈值作为待比较的核数阈值,分别判断所述网络矩阵中每一个节点的出度值和入度值是否小于与其对应的待比较核数阈值;

本发明实施例中,所述计算模块504包括:

第一确定单元511,第二确定单元512和计算单元513。

其中,

所述第一确定单元511,用于确定所述目标网络中各个节点的比例因子;

所述第二确定单元512,用于确定所述目标网络中各个节点的调节变量;

所述计算单元513,用于依据每一个节点的比例因子和调节变量,计算所述目标网络中各个节点的网页级别值。

本发明实施例中,所述分析系统还包括:排序模块514。

其中,

所述排序模块514,用于依据每一个节点的网页级别值,对所述目标网络中各个节点进行排序。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上对本发明所提供的一种电子邮件网络中节点关系的分析方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1