一种动态图上的增量结构聚类方法及系统与流程

文档序号:12786939阅读:来源:国知局

技术特征:

1.一种动态图上的增量结构聚类方法,其特征在于,包括:

接收无向无权简单图,利用图的结构聚类算法对所述无向无权简单图进行初始化处理,得到初始化的广度优先森林及其非树边集合;

当检测到插入新的边时,根据所述新的边和初始化后的广度优先森林及其非树边集合进行合并聚类或聚类拆分的处理,得到目标广度优先森林。

2.如权利要求1所述的增量结构聚类方法,其特征在于,所述利用图的结构聚类算法对所述无向无权简单图进行初始化处理,得到初始化的广度优先森林及其非树边集合包括:

遍历所述无向无权简单图,得到所有未处理的结点;

判断当前的结点是否是核心结点,若否,则判断下一结点是否为核心结点;

若是,则生成聚类编号给作为核心结点的结点,将所述作为核心结点的结点的直接可达且未被处理的邻居插入至预置队列,并将所述作为核心结点的结点作为其余未被处理的结点在其广度优先森林中的父亲结点;

当判断所述预置队列不为空时,获取所述预置队列的首元素,并找出所述首元素的所有直接可达邻居;

判断所述首元素的邻居是否已被处理,若未被处理,则给未处理的邻居分配队列编号后插入预置队列,并将所述首元素作为插入预置队列的邻居在其对应的广度优先森林中的父亲结点;

若所述首元素的邻居已被处理,则将所述首元素和所述已被处理的邻居组成的边插入所述非树边集合。

3.如权利要求1所述的增量结构聚类方法,其特征在于,所述当检测到插入新的边时,根据所述新的边和初始化后的广度优先森林及其非树边集合进行合并聚类或聚类拆分的处理,得到目标广度优先森林包括:

当检测到插入新的边时,获取所述新的边的任一端点的结构相似性改变的边的集合,及所述新的边的两个端点的所有邻居的并集;

计算所述结构相似性改变的边的集合中所有边的相似性,得到结构相似性参数;

获取所述新的边的两个端点的所有邻居的并集中的所有结点,并判断当前结点是否为核心结点,若是,则合并需要合并的聚类,若否,则判断下一结点是否为核心点;

判断所述结构相似性改变的边的集合中的边的结构相似性参数,若当前的边的结构相似性参数满足断裂条件,则断裂当前的边对应的广度优先森林,若当前边的结构相似性参数不满足断裂条件,则判断下一个边的结构相似形参数是否满足断裂条件;

遍历所述非树边集合,合并需要合并的广度优先森林,形成目标广度优先森林。

4.如权利要求3所述的增量结构聚类方法,其特征在于,以w表示所述核心结点,以v表示所述新的边的两个端点的所有邻居的并集中的任意一个结点,以ewv表示以w和v为端点的边,则所述合并需要合并的聚类包括:

遍历w的所有邻居结点,若w直接可达v,则判断v的聚类与w的聚类是否相同;

若v不属于任何聚类,则将v加入到w对应的聚类;

若v的所属聚类与w的聚类不同,则判断v是否为核心结点,若v是核心结点,则合并v所属的聚类和w所属的聚类,若v不是核心结点,则将ewv插入所述非树边集合;

若v所属聚类与w的聚类相同,则判断v和w是否在广度优先树中存在父子关系,若不存在,则将ewv插入所述非树边集合。

5.如权利要求3所述的增量结构聚类方法,其特征在于,分别以u和v表示当前的边的两个端点,euv表示以w和v为端点的边,则断裂当前的边对应的广度优先森林包括:

判断u和v是否为核心结点;

若u和v均为核心结点,则判断u和v是否有直接父子关系,若没有,则从所述非树边集合中删除euv,若有,则从广度优先树中删除euv

若u和v其中一个为核心结点,则判断u和v是否有直接父子关系,若没有,则从所述非树边集合中删除euv,若有,则从广度优先树中删除euv

若u和v均不是核心结点,则判断u在插入新的边之前是否为核心结点;

若u在插入新的边之前是核心结点,则判断u是否为v的父亲结点,若是,则从广度优先树中删除euv,若否,则从所述非树边集合中删除euv

若u在插入新的边之前非核心结点,且v在插入新的边之前是核心结点,则判断v是否为u的父亲结点,若是,则从广度优先树中删除evu,若否,则从所述非树边集合中删除euv

6.一种动态图上的增量结构聚类系统,其特征在于,包括:

初始化单元,用于接收无向无权简单图,利用图的结构聚类算法对所述无向无权简单图进行初始化处理,得到初始化的广度优先森林及其非树边集合;

动态更新单元,用于当检测到插入新的边时,根据所述新的边和初始化后的广度优先森林及其非树边集合进行合并聚类或聚类拆分的处理,得到目标广度优先森林。

7.如权利要求6所述的增量结构聚类系统,其特征在于,所述初始化单元具体用于:

遍历所述无向无权简单图,得到所有未处理的结点;

判断当前的结点是否是核心结点,若否,则判断下一结点是否为核心结点;

若是,则生成聚类编号给作为核心结点的结点,将所述作为核心结点的结点的直接可达且未被处理的邻居插入至预置队列,并将所述作为核心结点的结点作为其余未被处理的结点在其广度优先森林中的父亲结点;

当判断所述预置队列不为空时,获取所述预置队列的首元素,并找出所述首元素的所有直接可达邻居;

判断所述首元素的邻居是否已被处理,若未被处理,则给未处理的邻居分配队列编号后插入预置队列,并将所述首元素作为插入预置队列的邻居在其对应的广度优先森林中的父亲结点;

若所述首元素的邻居已被处理,则将所述首元素和所述已被处理的邻居组成的边插入所述非树边集合。

8.如权利要求6所述的增量结构聚类系统,其特征在于,所述动态更新单元包括:

集合获取模块,用于当检测到插入新的边时,获取所述新的边的任一端点的结构相似性改变的边的集合,及所述新的边的两个端点的所有邻居的并集;

参数计算模块,用于计算所述结构相似性改变的边的集合中所有边的相似性,得到结构相似性参数;

合并聚类模块,用于获取所述新的边的两个端点的所有邻居的并集中的所有结点,并判断当前结点是否为核心结点,若是,则合并需要合并的聚类,若否,则判断下一结点是否为核心点;

聚类拆分模块,用于判断所述结构相似性改变的边的集合中的边的结构相似性参数,若当前的边的结构相似性参数满足断裂条件,则断裂当前的边对应的广度优先森林,若当前边的结构相似性参数不满足断裂条件,则判断下一个边的结构相似形参数是否满足断裂条件;

集合遍历模块,用于遍历所述非树边集合,合并需要合并的广度优先森林,形成目标广度优先森林。

9.如权利要求8所述的增量结构聚类系统,其特征在于,以w表示所述核心结点,以v表示所述新的边的两个端点的所有邻居的并集中的任意一个结点,以ewv表示以w和v为端点的边,则所述合并聚类模块具体用于:

遍历w的所有邻居结点,若w直接可达v,则判断v的聚类与w的聚类是否相同;

若v不属于任何聚类,则将v加入到w对应的聚类;

若v的所属聚类与w的聚类不同,则判断v是否为核心结点,若v是核心结点,则合并v所属的聚类和w所属的聚类,若v不是核心结点,则将ewv插入所述非树边集合;

若v所属聚类与w的聚类相同,则判断v和w是否在广度优先树中存在父子关系,若不存在,则将ewv插入所述非树边集合。

10.如权利要求8所述的增量结构聚类系统,其特征在于,分别以u和v表示当前的边的两个端点,euv表示以w和v为端点的边,则所述聚类拆分模块具体用于:

判断u和v是否为核心结点;

若u和v均为核心结点,则判断u和v是否有直接父子关系,若没有,则从所述非树边集合中删除euv,若有,则从广度优先树中删除euv

若u和v其中一个为核心结点,则判断u和v是否有直接父子关系,若没有,则从所述非树边集合中删除euv,若有,则从广度优先树中删除euv

若u和v均不是核心结点,则判断u在插入新的边之前是否为核心结点;

若u在插入新的边之前是核心结点,则判断u是否为v的父亲结点,若是,则从广度优先树中删除euv,若否,则从所述非树边集合中删除euv

若u在插入新的边之前非核心结点,且v在插入新的边之前是核心结点,则判断v是否为u的父亲结点,若是,则从广度优先树中删除evu,若否,则从所述非树边集合中删除euv

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1