聚类方法、装置及电子设备与流程

文档序号:13760833阅读:来源:国知局
聚类方法、装置及电子设备与流程

技术特征:

1.一种聚类方法,其特征在于,所述方法包括:

获取M个样本数据中每两个样本数据之间的样本间相似度,M为正整数;

根据获取的样本间相似度将所述M个样本数据合并为N个初始化聚类簇,N为小于M的正整数;

对所述N初始化聚类簇进行聚类合并,得到所述M个样本数据对应的多个聚类簇。

2.根据权利要求1所述的方法,其特征在于,所述根据获取的样本间相似度将所述M个样本数据合并为N个初始化聚类簇,包括:

所述M个样本数据中,对于每两个样本数据而言,如果这两个样本数据的样本间相似度大于第一阈值,则将这两个样本数据合并为一疑似初始化聚类簇;

针对得到的多个疑似初始化聚类簇,将包含相同样本数据的个数大于第二阈值的至少二个疑似初始化聚类簇合并为一初始化聚类簇。

3.根据权利要求2所述的方法,其特征在于,所述根据获取的所述样本间相似度将所述M个样本数据合并为N个初始化聚类簇,还包括:

针对得到的多个疑似初始化聚类簇,将不能与其他疑似初始化聚类簇合并的疑似初始化聚类簇作为一初始化聚类簇。

4.根据权利要求1-3任一所述的方法,其特征在于,所述第二阈值根据所述至少二个疑似初始化聚类簇中各疑似初始化聚类簇所包括的样本数据的个数总和的线性函数确定。

5.根据权利要求1-4任一所述的方法,其特征在于,所述方法还包括:对所述多个聚类簇中的至少一个聚类簇进行离群点分离,得到所述M个样本数据优化后的聚类结果。

6.根据权利要求5所述的方法,其特征在于,对一所述聚类簇进行离群点分离包括:

获得所述聚类簇内每一样本数据对应的待离群簇和非待离群簇,其中,每一样本数据对应的所述待离群簇中包括所述样本数据,所述非待离群簇中包括:所述聚类簇中除所述样本数据外的其它样本数据;

获取每一样本数据对应的待离群簇与非离群簇之间的簇间相似度;

确定所述聚类簇中所有样本数据分别对应的多个簇间相似度中最小的簇间相似度是否小于第三阈值;

响应于所述最小的簇间相似度小于所述第三阈值,将所述最小的簇间相似度对应的待离群簇和非待离群簇分别作为两个新的聚类簇;

对所述非待离群簇对应的聚类簇继续进行离群点分离操作,直到没有可分离的聚类簇。

7.根据权利要求1-6任一所述的方法,其特征在于,所述对所述N个初始化聚类簇进行聚类合并,包括:

将所述N个初始化聚类簇作为多个待聚类簇;

获取每个待聚类簇与其他待聚类簇之间的簇间相似度;

确定所述多个待聚类簇对应的所有簇间相似度中的最大簇间相似度是否大于第四阈值;

响应于所述最大簇间相似度大于所述第四阈值,将所述最大簇间相似度对应的两个待聚类簇进行合并得到一新的待聚类簇;

对所述新的待聚类簇与本次未合并的其它待聚类簇构成的新的多个待聚类簇继续进行聚类合并,直到没有可合并的待聚类簇。

8.根据权利要求1-7任一所述的方法,其特征在于,所述M个样本数据为M个图像。

9.一种聚类装置,其特征在于,所述装置包括:

获取单元,用于获取M个样本数据中每两个样本数据之间的样本间相似度,M为正整数;

合并单元,用于根据获取的样本间相似度将所述M个样本数据合并为N个初始化聚类簇,N为小于M的正整数;

聚类单元,用于对所述N初始化聚类簇进行聚类合并,得到所述M个样本数据对应的多个聚类簇。

10.一种电子设备,其特征在于,包括:壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为终端的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行权利要求1-8任一项所述的聚类方法对应的操作。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1