一种基于决定路径权重的不确定图分割方法及系统的制作方法

文档序号:8259597阅读:168来源:国知局
一种基于决定路径权重的不确定图分割方法及系统的制作方法
【技术领域】
[0001]本发明属于数据分析技术领域,尤其涉及一种基于决定路径权重的不确定图分割方法及系统。
【背景技术】
[0002]不确定图是特殊的带权图,其上每条边的权值为O到I之间的实数。该权值通常代表对应边的存在概率。对于图数据来说,不确定图的特征不仅图的边以一定的概率存在,甚至节点也可以以一定的概率存在。由于不确定性无处不在,相关研宄又不能忽略不确定的存在,因此业界普遍认为针对不确定图的研宄具有重要的现实意义。
[0003]然而,现有对不确定图的研宄存在以下问题:1)现实中的很多图数据都是不确定的,不考虑图数据的不确定性,研宄的现实意义和应用价值不大;2)社会网络中有部分是带权的网络,以无权网络方式进行划分,聚类不准确;3)大型网络抽象的图中节点与边的数量非常大,计算最短路径时只考虑一条边的权值,不精确。

【发明内容】

[0004]鉴于此,本发明实施例提供一种基于决定路径权重的不确定图分割方法及系统,以解决现有技术存在的上述问题。
[0005]本发明实施例是这样实现的,一种基于决定路径权重的不确定图分割方法,所述方法包括:
[0006]建立不确定加权图;
[0007]以邻接矩阵的形式对所述不确定加权图进行存储;
[0008]计算存储后的所述不确定加权图中各节点之间的决定路径权重;
[0009]基于所述决定路径权重,利用k-means算法对所述不确定加权图中的节点进行划分,获得多个节点子集。
[0010]本发明实施例的另一目的在于提供一种基于决定路径权重的不确定图分割系统,所述系统包括:
[0011]不确定图建立单元,用于建立不确定加权图;
[0012]存储单元,用于以邻接矩阵的形式对所述不确定加权图进行存储;
[0013]决定路径权重计算单元,用于计算存储后的所述不确定加权图中各节点之间的决定路径权重;
[0014]聚类单元,用于基于所述决定路径权重,利用k-means算法对所述不确定加权图中的节点进行划分,获得多个节点子集。
[0015]本发明实施例与现有技术相比存在的有益效果是:本发明实施例针对现实网络数据的不确定性,对现实网络进行不确定加权图的建立,根据所述不确定加权图的决定路径权重计算各个节点之间的距离并且循环更新各个节点之间的距离,直到达到最小,并利用k-means算法对所述不确定加权图中的节点进行划分,获得多个节点子集。本发明实施例使用不确定图数据更具有应用价值和现实意义,使用加权的不确定图更能说明节点之间的关联程度,使得对不确定图的分割更准确。而且本发明实施例在实现上述过程中,不需要增加额外的硬件,可有效降低成本,具有较强的易用性和实用性。
【附图说明】
[0016]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本发明实施例一提供的基于决定路径权重的不确定图分割方法的实现流程图;
[0018]图2是本发明实施例一提供的不确定加权图的示例图;
[0019]图3是本发明实施例一提供的以邻接矩阵存储的不确定加权图的示例图;
[0020]图4是本发明实施例二提供的基于决定路径权重的不确定图分割系统的组成结构图。
【具体实施方式】
[0021]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透切理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0022]为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
[0023]实施例一:
[0024]图1示出了本发明实施例一提供的基于决定路径权重的不确定图分割方法的实现流程,该方法过程详述如下:
[0025]在步骤SlOl中,建立不确定加权图。
[0026]在本发明实施例中,以社会网络社区发现的经典例子Zachary网络为起始实例建立不确定加权图(如图2所示),在所述不确定加权图中每个成员(即节点,如图2中的V1、V2…V34)之间加上权重(如Vl和V2之间的0.9),所述权重表示各个成员之间的联系频繁度,权重越大表示成员之间的联系越频繁。
[0027]在步骤S102中,以邻接矩阵的形式对所述不确定加权图进行存储。
[0028]在本发明实施例中,所述不确定加权图可以用元素不是O或I的邻接矩阵表示(如图3所示),在不确定图分割方法中直接用每条边的存在度表示,如图3,O表示两个节点之间权重为无穷小,即没有关联;小于I的小数表示两节点之间边的存在度;1表示两节点之间存在度是1,即确定图中的边。
[0029]在步骤S103中,计算存储后的所述不确定加权图中各节点之间的决定路径权重。
[0030]在本发明实施例中,对于不确定图上的任意两节点u和V,连接节点u和V的路径的权重定义为该路径上所有边的权重之积。在所有这样的路径中,存在度最大的一条路径即为节点u和V之间的决定路径。定义节点u和V之间的距离d(u,V)为u和V在所述不确定加权图上的决定路径权重。
[0031]具体的是,计算各个节点之间的距离并且循环更新各个节点之间的距离,直到所述距离达到最小,各节点之间的最小距离即为所述决定路径权重;具体包括步骤1:从所述不确定加权图中选择任意两节点U、V ;
[0032]步骤2:初始化,令所述节点u到节点V的决定路径权重为零,即节点u与节点V没有边连接;
[0033]步骤3:访问节点u的每一个邻居节点,以节点u到邻居节点的距离乘以邻居节点到节点V的距离;在该步骤中,为每个节点设置标记字段mark = 0,对每一个被访问过的邻居节点更改标记字段mark = I。在访问节点u的邻居节点时,首先对邻居节点进行判断,如果邻居节点的mark = 0,则继续访问该邻居节点,如果邻居节点的mark = 1,则选择其他的邻居节点进行访问,通过该方法可有效避免在一次路径计算中的重复计算。
[0034]步骤4:取最小的乘积作为节点u到节点V的距离;更新节点u到V的距离即决定路径权重。在该步骤中,每计算得到一个最小距离(即最短路径),用数组存储该路径的节点集,并且把该路径中所有的节点的标记mark变量都重新置为O。
[0035]步骤5:重复步骤3和4,直到计算的距离不再发生变化时,将该距离作为节点u到节点V的最小距离。在此步骤中,每一次循环计算出一个最小数组节点集后,选择出所有生成的且数组节点中最短路径的数组,以供与下次生成的数组进行比较。直到所有的路径都遍历完全后,获得最小距尚一即为最终的决定路径权重。
[0036]在步骤S105中,基于所述决定路径权重,利用k-means算法对所述不确定加权图中的节点进行划分,获得多个节点子集。
[0037]具体的可以是,
[0038]步骤1:初始化,令所述不确定加权图中每个节点的标签值都为空;
[0039]步骤2:从所述不确定加权图中随机选择k个节点作为k个子集的中心节点,分别为k个中心节点标签值赋值1,2,3-k,所述k为大于零的整数;
[0040]步骤3:对于除中心节点之外的每个节点,计算该节点到每个中心节点的距离(根据决定路径权重计算各个节点之间的最短距离),选择距离最小的一个中心节点所属的子集,并将该节点的标签值更新为该子集的标签值;
[0041]在该步骤中,所述计算该节点到每个中心节点的距离具体为:
[0042]在该节点的邻居节点中查找属于目标子集且距离所述目标子集的中心点最近的邻居节点,若不存在该邻居节点,则跳过该目标子集;若存在该邻居节点,则该节点到所述目标子集的中心节点的距离等于该节点到该邻居节点的距离乘以该邻居节点到所述目标子集的中心点的距离。
[0043]步骤4,重新选择中心节点,并重复步骤3,直到所有节点的标签值,以及该节点到各个子集的中心节点的距离不再发生变化。
[0044]实施例二:
[0045]图4示出了本发明实施例二提供的基于决定路径权重的不确定图分割系统的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
[0046]该基于决定路径权重的不确定图分割系统可以是内置于终端设备(如个人计算机、笔记本电脑、平板电脑、智能手机等)中的软件单元、硬件单元或者软硬件相结合的单元,或者作为独立的挂件集成到终端设备或者终端设备的应用系统中。
[0047]该基于决定路径权重的不确定图分割系统包括:
[0048]不确定图建立单元41,用于建立不确定加权图;
[0049]存储单元42,用于以邻接矩阵的形式对所述不确定加权图进行存储;
[0050]决定路径权重计算单元43,用于计算存储后的所述不确定加权图中各节点之间的决定路径权重;
[0051]聚类单元44,用于基于所述决定路径权重,利用k-maens算法对所述不确定加权图中的节点进行划分,获得多个节点子集。
[0052]进一步的,所述决定路径权重计算单元43具体用于,计算各个节点之间的距离并且循环更新各个节点之间的距离,直到所述距离达到最小,各节点之间的最小距离即为所述决定路径权重;所述决定路径权重计算单元43包括:
[0053]选择模块431,用于从所述不确定加权图中选择任意两节点U、V ;
[0054]初始化模块432,用于初始化,令所述节点u到节点V的决定路径权重为零;
[0055]计算模块433,用于访问节点u的每一个邻居节点,以节点u到邻居节点的距离乘以邻居节点到节点V的距离;
[0056]确定模块434,用于取最小的乘积作为节点u到节点V的距离;
[0057]控制模块435,用于控制所述计算模块433以及确定模块434的执行,直到计算的距离不再发生变化时,将该距离作为节点u到节点V的最小距离。
[0058]进一步的,所述决定路径权重计算单元43还包括:
[0059]标记字段更改模块436,用于为每个节点设置标记字段mark = 0,对每一个被访问过的邻居节点更改标记字段mark = I。
[0060]进一步的,所述聚类单元44包括:
[
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1