一种基于超图信号处理的高效聚类方法

文档序号:37885175发布日期:2024-05-09 21:29阅读:6来源:国知局
一种基于超图信号处理的高效聚类方法

本发明属于数据聚类分析,具体涉及一种基于超图信号处理的高效聚类方法。


背景技术:

1、图信号处理技术是一种强大的工具,可以对大型数据集中的复杂关系进行建模,现在被用于数据科学、通信网络、流行病学和社会学等不同领域的无数应用。简单图只能对数据之间的两两关系进行建模,这阻碍了它们在具有高阶关系的网络建模中的应用。一种基于张量表示的超图信号处理新框架解决了上述问题,将传统的图信号处理推广到高阶领域。然而由于张量的高阶特性,这使得超图信号处理框架在分析计算时需要耗费巨大的算力。

2、综上所述,目前的图信号处理方法在处理高阶张量交互时仍存在一些问题,因此,如何解决图信号处理框架无法表示出原始信号的高阶交互问题,从而提高超图信号处理框架中张量分解的精确性和效率是本发明想要解决的技术问题。


技术实现思路

1、本发明的目的在于提供一种基于超图信号处理的高效聚类方法,以解决上述背景技术中提出的问题。

2、本发明目的是这样实现的:一种基于超图信号处理的高效聚类方法,其特征在于:该方法包括以下步骤:

3、步骤s1:将数据以超图的形式输入,根据输入的超图构建邻接张量,给出聚类数量;

4、步骤s2:通过同时对角化邻接张量的少量随机投影找到张量因子的近似值,对近似因子的逆投影进行另一轮同时对角化,从而对邻接张量进行分解;

5、步骤s3:根据分解结果得到超图傅立叶基和傅立叶频率系数,找出傅里叶基,构造傅里叶谱矩阵;

6、步骤s4:使用k-means算法对傅里叶谱矩阵进行聚类,最终输出聚类结果。

7、优选的,所述步骤s1根据超图构建邻接张量,给出聚类数量,具体为:

8、选择具有n个节点的超图其中,为节点集,ε为超边集;其超边所含有节点的最大个数为m,其邻接张量表示为其中,邻接张量

9、对于超图中的超边为

10、计算邻接张量a=ci/ai,

11、其中,ci=|ei|≤m,ci为第i条超边中元素的个数。

12、优选的,所述步骤s2中通过同时对角化邻接张量的少量随机投影找到张量因子的近似值,具体为:

13、定义邻接张量a在单位向量wl上的投影为其中均匀地从单位球中选取,由的同时对角化得到因子和因子的逆i为单位矩阵;

14、定义邻接张量a在上的投影为由的同时对角化得到因子和因子权

15、优选的,所述步骤步骤s2中对邻接张量进行分解具体为:

16、根据得到的邻接张量的分解形式

17、其中,a为m阶张量,m≥3;λr即为傅里叶频率系数,fr为傅里叶基。

18、优选的,所述步骤s3根据分解结果得到超图傅立叶基和傅立叶频率系数,找出傅里叶基,构造傅里叶谱矩阵,具体为:

19、根据得到的邻接张量的分解形式

20、其中,a为m阶张量,m≥3;λr即为傅里叶频率系数,fr为傅里叶基;

21、找到前e个对应傅里叶系数λi≠0的傅里叶基fi,将傅里叶系数λi≠0的傅里叶基合并为一个列为傅里叶基的傅里叶谱矩阵s∈rn×e。

22、优选的,所述步骤s4中使用k-means算法对傅里叶谱矩阵进行聚类,具体为:

23、步骤s4-1:所述步骤s4中使用k-means算法对傅里叶谱矩阵进行聚类,具体为:

24、步骤s4-1:从傅里叶谱矩阵s中随机选取k行,作为初始的聚类中心;

25、步骤s4-2:分别计算傅里叶谱矩阵s的每行到各个聚类中心的距离,并逐个分配到距离其最近的簇中;

26、步骤s4-3:所有行分配完成后,更新k个类中心位置,类中心定义为簇内所有对象在各个维度的均值;

27、步骤s4-4:与前一次计算得到的k个聚类中心比较,如果聚类中心发生变化转至步骤s4-2,否则转至步骤s4-5;

28、步骤s4-5:类中心不再发生变化,停止并输出聚类结果,如果第i行分配到第j个集群中,那么原始数据的第i个节点就属于第j类。

29、优选的,所述a为三阶张量时,m=3时,定义a在wl上的投影为其中均匀地从单位球中选取,由的同时对角化得到因子和因子的逆

30、定义a在上的投影为由的同时对角化得到因子和因子权

31、邻接张量a的分解形式表示为

32、令a为四阶张量,

33、通过投影到矩阵

34、其中,w是为均匀地从单位球中选取的矩阵,u是为为均匀地从单位球中选取的矩阵;通过前两个分量的投影来确定和以此方法对任意阶数的邻接张量进行分解。

35、与现有技术相比,本发明具有如下改进及优点:通过同时对角化邻接张量随机投影来找到张量因子的近似值,减少复杂的步骤,提高张量分解效率;采用超图信号处理框架解决了图信号处理框架无法表示出原始信号的高阶交互的问题,同时采用基于矩阵分解的张量分解解决了传统超图信号处理框架中张量分解效率低、不精确的问题,使得聚类任务更加高效。



技术特征:

1.一种基于超图信号处理的高效聚类方法,其特征在于:该方法包括以下步骤:

2.根据权利要求1所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述步骤s1根据超图构建邻接张量,给出聚类数量,具体为:

3.根据权利要求1所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述步骤s2中通过同时对角化邻接张量的少量随机投影找到张量因子的近似值,具体为:

4.根据权利要求1所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述步骤步骤s2中对邻接张量进行分解具体为:

5.根据权利要求1所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述步骤s3根据分解结果得到超图傅立叶基和傅立叶频率系数,找出傅里叶基,构造傅里叶谱矩阵,具体为:

6.根据权利要求1所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述步骤s4中使用k-means算法对傅里叶谱矩阵进行聚类,具体为:

7.根据权利要求3所述的一种基于超图信号处理的高效聚类方法,其特征在于:所述a为三阶张量时,m=3时,定义a在wl上的投影为其中均匀地从单位球中选取,由的同时对角化得到因子和因子的逆


技术总结
本发明公开了一种基于超图信号处理的高效聚类方法,属于数据聚类分析技术领域;方法为:将数据以超图的形式输入,根据输入的超图构建邻接张量,给出聚类数量;通过同时对角化邻接张量的少量随机投影找到张量因子的近似值,对近似因子的逆投影进行另一轮同时对角化,从而对邻接张量进行分解;根据分解结果得到超图傅立叶基和傅立叶频率系数,找出傅里叶基,构造傅里叶谱矩阵;使用k‑means算法对傅里叶谱矩阵进行聚类,最终输出聚类结果。本发明采用超图信号处理框架解决了图信号处理框架无法表示出原始信号的高阶交互的问题,同时采用基于矩阵分解的张量分解解决了传统超图信号处理框架中张量分解效率低、不精确的问题,使得聚类任务更加高效。

技术研发人员:王保云,廖祯威
受保护的技术使用者:南京邮电大学
技术研发日:
技术公布日:2024/5/8
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1