高维数据的聚类方法、电子设备及系统与流程

文档序号:16263617发布日期:2018-12-14 21:46阅读:154来源:国知局
高维数据的聚类方法、电子设备及系统与流程

本发明涉及互联网技术领域,更具体地,涉及一种高维数据的聚类方法、电子设备及系统。

背景技术

随着互联网技术的飞速发展,每天将实时产生非常大的数据量,包括移动通信、用电数据、网络交易及实时监控信息等。信息量的爆炸式增长,使数据聚类成为现代信息管理领域中最重要的议题之一。

k-means算法是最为经典的基于距离的聚类算法,其采用距离作为相似性的评价指标,即认为两个对象的距离越近,则这两个对象相似度就越大。

目前,基于k-means算法对数据进行聚类运算时,将待分类的数据组成一个数据集并指定所要分成的类别数目k,从数据集中随机选择k个数据作为k个类别的初始聚类中心,对于数据集中除k个初始聚类中心之外的每个数据,分别计算该数据与k个初始聚类中心中的每个初始聚类中心之间的距离,并将该数据归到与该数据距离最近的初始聚类中心对应的类别中,然后根据k个类别中包括的数据,重新计算k个类别的新的聚类中心,最后将数据集中的数据重新进行分类,直到k个类别中的每个类别的相邻两次聚类中心之间的距离在预设距离内。

但是,对于高维数据,利用k-means算法进行聚类运算时,得到的聚类结果精确度较低,并且计算量很大。



技术实现要素:

为了克服上述问题或者至少部分地解决上述问题,本发明提供一种高维数据的聚类方法、电子设备及系统。

第一方面,本发明提供一种高维数据的聚类方法,包括:

自多个客户端获取降维加密后的待聚类高维数据,并通过计算所述降维加密后的待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度,初始化预设参考聚类;

采用循环迭代算法,逐次基于所述预设参考聚类和所述基聚类集对应的标签集,获取候选参考聚类;

选取所述预设参考聚类和所述候选参考聚类中与所述基聚类集中其余各聚类间相似度的平均值较大者,迭代更新所述预设参考聚类,直至所述预设参考聚类不再发生变化,则以该预设参考聚类作为最终的聚类结果。

其中,所述基于所述预设参考聚类和所述基聚类集对应的标签集,获取候选参考聚类的步骤进一步包括:以所述标签集中与所述预设参考聚类对应对象所对应的标签,替换所述预设参考聚类对应对象的标签,生成所述候选参考聚类。

其中,所述选取所述预设参考聚类和所述候选参考聚类中与所述基聚类集中其余各聚类间相似度的平均值较大者,迭代更新所述预设参考聚类的步骤进一步包括:对于任一轮迭代运算,分别计算所述预设参考聚类与所述基聚类集中其余各聚类间相似度的平均值s,以及所述候选参考聚类与所述基聚类集中其余各聚类间相似度的平均值s′;若判断s′>s,则以该轮迭代运算的候选参考聚类,更新下一轮迭代运算的预设参考聚类,进行下一轮迭代运算;否则以该轮迭代运算的预设参考聚类作为下一轮迭代运算的预设参考聚类,进行下一轮迭代运算。

其中,所述采用循环迭代算法,逐次基于所述预设参考聚类和所述基聚类集对应的标签集,获取候选参考聚类的步骤进一步包括:由第一轮迭代运算中预设参考聚类的第一个对象开始,逐个以所述标签集中与所述预设参考聚类当前对象对应的标签,替换所述预设参考聚类中当前对象的标签,获取候选参考聚类,直至遍历所述签集中与所述预设参考聚类当前对象对应的所有标签,转入所述预设参考聚类的下一个对象,进行候选参考聚类的更新,直至遍历所述预设参考聚类的所有对象。

其中,所述迭代更新所述预设参考聚类,直至所述预设参考聚类不再发生变化的步骤进一步包括:由所述第一轮迭代运算中预设参考聚类的第一个对象开始,将每次利用所述标签集中的标签替换获取的候选参考聚类,以及当前迭代的预设参考聚类,分别与所述基聚类集中其余各聚类求取相似度,并基于该相似度,求取所述候选参考聚类和所述当前预设参考聚类分别对应的相似度平均值;若判断所述候选参考聚类对应的相似度平均值大于所述当前预设参考聚类对应的相似度平均值,则以所述候选参考聚类更新所述当前预设参考聚类,否则保留所述当前预设参考聚类,直至遍历所述签集中与所述预设参考聚类当前对象对应的所有标签,转入所述预设参考聚类的下一个对象,进行预设参考聚类的迭代更新,直至无需继续替换预设参考聚类的对象标签。

进一步的,在所述通过计算所述降维加密后的待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度,初始化预设参考聚类的步骤之前,所述高维数据的聚类方法还包括:利用k-means算法,对所述降维加密后的待聚类高维数据进行初始化聚类运算,获取所述基聚类集。

进一步的,在所述自多个客户端获取降维加密后的待聚类高维数据的步骤之前,所述高维数据的聚类方法还包括:基于各所述客户端分别对应的待聚类高维数据,利用所述客户端,通过计算所述待聚类高维数据中各对象间距离,并进行给定迭代流程的迭代运算,实现所述待聚类高维数据的降维加密,获取所述降维加密后的待聚类高维数据。

第二方面,本发明提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的高维数据的聚类方法。

第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上所述的高维数据的聚类方法。

第四方面,本发明提供一种高维数据的聚类系统,包括多个客户端以及如上所述的电子设备或者非暂态计算机可读存储介质;所述客户端用于对待聚类高维数据进行降维加密,获取降维加密后的待聚类高维数据。

本发明提供的高维数据的聚类方法、电子设备及系统,通过对待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度的计算,设置预设参考聚类,并将该预设参考聚类作为初始聚类中心,利用给定的算法进行迭代运算,更新预设参考聚类进而得到最终聚类结果,提高了高维数据聚类结果的精确度,控制了计算量。

附图说明

图1为本发明实施例一种高维数据的聚类方法的流程图;

图2为根据本发明实施例一种高维数据的聚类方法的一实例场景示意图;

图3为本发明实施例一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,提供如下优选的处理流程,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

现有技术中的k-means算法由于随机设定聚类中心,聚类结果的精确度不高,对于高维数据的计算量也很大。本发明通过对待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度的计算,设置预设参考聚类,并将该预设参考聚类作为初始聚类中心,利用给定的算法进行迭代运算,更新预设参考聚类进而得到最终聚类结果,具有较好的精确度和更小的计算量。

作为本发明实施例的一个方面,本实施例提供一种高维数据的聚类方法,参考图1,为本发明实施例一种高维数据的聚类方法的流程图,包括:

s1、自多个客户端获取降维加密后的待聚类高维数据,并通过计算该降维加密后的待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度,初始化预设参考聚类。

具体地,服务器在接收多个客户端发送的经过降维加密后的待聚类高维数据后,将该经过降维加密后的待聚类高维数据通过某种基本聚类算法进行初始化,生成对应的基聚类,所有基聚类的集合为基聚类集。常见的基本聚类算法有k-means(k均值)聚类、k-medoids(k中心点)聚类、均值漂移聚类、基于密度的聚类方法(dbscan)、用高斯混合模型(gmm)的最大期望(em)聚类、凝聚层次聚类及图团体检测等。

之后,在获取待聚类数据对应的基聚类集的基础上,需根据该基聚类集,对数据聚类进行初始化设定。对于该基聚类集中的所有基聚类,任意两者之间进行两两配对,并求取任意二者间相似度。根据基聚类集对应的所有基聚类相似度,进行初始化设定,确定初始的预设参考聚类。

例如,对于来自个e客户端的降维加密后的待聚类高维数据,经上述处理后获取e个基聚类λ1,λ2,…,λe,选取λ1,λ2,…,λe中的任意两个λx和λy,计算λx和λy的相似度s(λxy):

其中,i表示第i个对象,j表示第j个基聚类,lij表示第i个对象对应于第j个基聚类的标签。

则根据上述计算公式,如果两个来自不同客户端的基聚类对应对象的标签相同,那么相似度s(λxy)等于1,否则相似度s(λxy)等于0。对于λ1,λ2,…,λe中任意两两配对的两列之间,根据上式计算两者间相似度。

然后,根据上述计算得到的所有相似度值,构建相似度矩阵:

其中,sij表示第i个基聚类与第j个基聚类的标签集合之间的相似度,i∈(1,e),j∈(1,e);i,j∈n+

计算矩阵r中每一行的平均值,该平均值反映了某一个基聚类与基聚类集中其余各基聚类间的相似度,选择最大的平均值所对应的基聚类作为预设参考聚类λr。例如,假设第3行的平均值最大,也即第3个基聚类与基聚类集中其余各基聚类间的相似度最高,那么选择第3个基聚类作为预设参考聚类。

s2、采用循环迭代算法,逐次基于预设参考聚类和基聚类集对应的标签集,获取候选参考聚类。

具体地,对于来自e个客户端的经过降维加密后的待聚类高维数据,根据上述步骤可获取e个客户端分别对应的e个基聚类。例如,令λ1,λ2,…,λe为e个客户端分别对应的基聚类,该待聚类数据包括n个对象,e个基聚类,每个对象对应每个基聚类都有其唯一的标签。则,根据n个对象的标签构建标签矩阵e如下:

其中,lij表示第i个对象对应于第j个基聚类的标签,矩阵e的每一行代表一个对象对应所有基聚类的标签的集合,每一列代表该基聚类中n个对象的标签的集合。标签矩阵e中所有元素构成标签集l,l={l11,l12,…,l1e,l21,l22,…,lne}。

则本步骤中服务器根据预设参考聚类的标签和基聚类集对应的标签集,采用循环迭代算法,用标签集中的标签对预设参考聚类中的标签进行逐次替换,并进一步进行计算,每次被替换标签之后的预设参考聚类作为候选参考聚类。

s3、选取预设参考聚类和候选参考聚类中与基聚类集中其余各聚类间相似度的平均值较大者,迭代更新预设参考聚类,直至预设参考聚类不再发生变化,则以该预设参考聚类作为最终的聚类结果。

具体地,采用循环迭代算法,在每一轮迭代中,对于获取的预设参考聚类和候选参考聚类,分别计算这两个聚类与基聚类集中其余各聚类间的相似度,并分别针对这两个聚类求取对应多个相似度的平均值。之后,选取这两个聚类所对应相似度平均值中的较大者,以该较大者对应的聚类更新预设参考聚类,并进入下一轮迭代运算,直至最后一次迭代中预设参考聚类的对象不再被替换,即预设参考聚类不再发生变化,则以该次迭代后的设参考聚类作为最终的聚类结果。

具体而言,服务期执行如下操作:若预设参考聚类与基聚类集中其余各聚类间相似度的平均值大于候选参考聚类与基聚类集中其余各聚类间相似度的平均值,则保持该预设参考聚类不变;若候选参考聚类与基聚类集中其余各聚类间相似度的平均值大于预设参考聚类与基聚类集中其余各聚类间相似度的平均值,则将该候选参考聚类作为更新后的预设参考聚类,经过反复迭代运算,直至预设参考聚类不再发生变化,则以最终更新的预设参考聚类作为最终的聚类结果。

例如,假设预设参考聚类为a,预设参考聚类a与基聚类集中其余各聚类间相似度的平均值为a;候选参考聚类为b,候选参考聚类b与基聚类集中其余各聚类间相似度的平均值为b。如果a>b,那么a仍然为预设参考聚类;如果b>a,那么令b作为新的预设参考聚类,进行下一轮迭代运算。

本实施例提供的高维数据的聚类方法,将与基聚类集中其余各基聚类间相似度最高的一个基聚类设置为预设参考聚类,并将该预设参考聚类作为初始聚类中心,使用本实施例给定算法更新预设参考聚类,将更新后的预设参考聚类确定为聚类结果,提高了高维数据聚类结果的精确度,控制了计算量。

在一个实施例中,基于预设参考聚类和基聚类集对应的标签集,获取候选参考聚类的步骤进一步包括:以该标签集中与预设参考聚类对应对象所对应的标签,替换预设参考聚类对应对象的标签,生成候选参考聚类。

具体地,根据上述实施例,每一个聚类包含n个对象分别对应的标签,服务器将与基聚类集中其余各基聚类间相似度最高的基聚类确定为预设参考聚类λr,则λr中包含n个对象分别对应的标签,而根据上述实施例基聚类集所对应的标签集l={l11,l12,…,l1e,l21,l22,…,lne}中,包含所有e个基聚类中每个基聚类对应的n个对象的标签。即n个对象中的任一个,对应在e个基聚类中有e个标签。

则,在标签替换的迭代运算中,对于当前迭代替换的对象,逐个将标签集中与该对象对应的除当前预设参考聚类中标签之外的所有标签,迭代替换当前预设参考聚类,直至标签集中与当前迭代替换的对象所对应的标签使用完毕,转入下一个对象,进行同样的迭代替换。

对于总共e个聚类,一个对象对应e个标签,则在根据上述实施例的标签集中,与该对象对应的有e个标签。则,本实施例中的对应对象可以是所有n个对象中的任一个,表示当前被替换对象。假设预设参考聚类λr中当前被替换对象的标签为l1,则标签集中与该对应对象所对应的标签为该替换对象在标签集中的其他标签l2,l3,…le。在迭代运算过程中,依次用l2,l3,…le替换λr中被替换对象的标签l1,将替代标签之后的预设参考聚类作为候选参考聚类λr′

本实施例提供的高维数据的聚类方法,通过用标签集中的标签按照给定顺序依次替换预设参考聚类中的标签,使用本实施例给定算法更新预设参考聚类,将更新后的预设参考聚类确定为聚类结果,进一步控制了计算量,提高了高维数据聚类结果的精确度。

在一个实施例中,选取预设参考聚类和候选参考聚类中与基聚类集中其余各聚类间相似度的平均值较大者,迭代更新预设参考聚类的步骤进一步包括:

对于任一轮迭代运算,分别计算预设参考聚类与基聚类集中其余各聚类间相似度的平均值s,以及候选参考聚类与基聚类集中其余各聚类间相似度的平均值s′;

若判断s′>s,则以该轮迭代运算的候选参考聚类,更新下一轮迭代运算的预设参考聚类,进行下一轮迭代运算;否则以该轮迭代运算的预设参考聚类作为下一轮迭代运算的预设参考聚类,进行下一轮迭代运算。

具体地,服务器将与基聚类集中其余各基聚类间相似度最高的基聚类确定为预设参考聚类λr后,根据上述实施例用标签集中与λr的对应对象所对应的标签,替换λr的对应对象的标签,确定候选参考聚类λr′,并分别利用下式计算λr和λr′与基聚类集中其余各基聚类间相似度的平均值:

其中,δ是基聚类集中不含参考聚类的其余基聚类的集合,e为待聚类数据中的基聚类个数。

令sa(δ,λr)为预设参考聚类λr与基聚类集中其余各基聚类间相似度的平均值,sa(δ,λr′)为候选参考聚类λr′与基聚类集中其余各基聚类间相似度的平均值。则,如果sa(δ,λr)>sa(δ,λr),则用λr′替换λr作为更新后的预设参考聚类,相应地,用sa(δ,λr)替换sa(δ,λr)。否则保持λr和sa(δ,λr)不变。

本实施例提供的高维数据的聚类方法,通过根据预设参考聚类和候选参考聚类的相似度平均值大小更新预设参考聚类,再经过循环迭代运算继续更新预设参考聚类,将更新后的预设参考聚类确定为聚类结果,进一步提高了高维数据聚类结果的精确度。

在一个实施例中,采用循环迭代算法,逐次基于预设参考聚类和基聚类集对应的标签集,获取候选参考聚类的步骤进一步包括:由第一轮迭代运算中预设参考聚类的第一个对象开始,逐个以标签集中与预设参考聚类当前对象对应的标签,替换预设参考聚类中当前对象的标签,获取候选参考聚类,直至遍历标签集中与该预设参考聚类当前对象对应的所有标签,转入该预设参考聚类的下一个对象,进行候选参考聚类的更新,直至遍历该预设参考聚类的所有对象。

具体地,服务器将与基聚类集中其余各基聚类间相似度最高的基聚类确定为预设参考聚类λr,根据上述实施例,对于所有e个基聚类,一个对象对应e个标签。

在进行预设参考聚类的迭代更新时,首先对于每一个对象,利用标签集中与该对象对应的除当前预设参考聚类的标签之前的所有标签,逐轮替换当前预设参考聚类中该对象对应的标签,直到标签集中与该对象对应的标签使用完毕,即直至遍历签集中与该对象对应的所有标签,转入下一个对象进行同样的迭代替换。每轮替换都会形成一个相应的候选参考聚类。

对于所有n个对象,采用以上循环迭代过程,逐个对象进行当前预设参考聚类中该对象的标签替换,并在每轮替换时形成一个相应的候选参考聚类,直至没有对象的标签可以被替换,即直至遍历预设参考聚类的所有对象。

例如,假设预设参考聚类λr中当前循环对象的标签为l1,标签集中与该对象所对应的其他标签为l2,l3,…le。在迭代运算过程中,依次用l2,l3,…le替换λr中被替换对象的标签l1,将替代标签之后的预设参考聚类作为候选参考聚类λr′

在每轮迭代替换中,用λr和λr′中与标签集里其余各基聚类间相似度的平均值较大的参考聚类,更新预设参考聚类λr,直到l2,l3,…le均替换过λr中当前被替换对象、即当前循环对象的标签。经过一次循环过后,预设参考聚类中的一个对象被分配到具有最大sa(δ,λr)的标签。然后,服务器针对下一个对象重复执行这个循环过程,直到参考聚类中的最后一个对象完成循环。

本实施例提供的高维数据的聚类方法,通过更换预设参考聚类中的标签,经过循环迭代更新预设参考聚类,将更新后的预设参考聚类确定为聚类结果,进一步提高了高维数据聚类结果的精确度。

在一个实施例中,迭代更新预设参考聚类,直至预设参考聚类不再发生变化的步骤进一步包括:

由第一轮迭代运算中预设参考聚类的第一个对象开始,将每次利用标签集中的标签替换获取的候选参考聚类,以及当前迭代的预设参考聚类,分别与基聚类集中其余各聚类求取相似度,并基于该相似度,求取候选参考聚类和当前预设参考聚类分别对应的相似度平均值;

若判断候选参考聚类对应的相似度平均值大于当前预设参考聚类对应的相似度平均值,则以候选参考聚类更新当前预设参考聚类,否则保留当前预设参考聚类,直至遍历标签集中与该预设参考聚类当前对象对应的所有标签,转入该预设参考聚类的下一个对象,进行预设参考聚类的迭代更新,直至无需继续替换预设参考聚类的对象标签。

具体地,服务器将与基聚类集中其余各基聚类间相似度最高的基聚类确定为预设参考聚类λr,根据上述实施例,对于所有e个基聚类,一个对象对应e个标签。

在进行预设参考聚类的迭代更新时,首先对于每一个对象,利用标签集中与该对象对应的除当前预设参考聚类的标签之前的所有标签,逐轮替换当前预设参考聚类中该对象对应的标签,直到标签集中与该对象对应的标签使用完毕,即直至遍历签集中与该对象对应的所有标签,转入下一个对象进行同样的迭代替换。每轮替换都会形成一个相应的候选参考聚类。

对于所有n个对象,采用以上循环迭代过程,逐个对象进行当前预设参考聚类中该对象的标签替换,并在每轮替换时形成一个相应的候选参考聚类,直至没有对象的标签可以被替换,即直至遍历预设参考聚类的所有对象。

n个对象的每次循环过程中,记录预设参考聚类中对象标签的改变次数。直到该改变次数为0,也即在循环中不再需要替换预设参考聚类中对象标签时,停止迭代。最后更新的预设参考聚类λr为最终的聚类结果。

本实施例提供的高维数据的聚类方法,通过更换预设参考聚类中的标签,经过循环迭代更新预设参考聚类,记录预设参考聚类中对象标签的改变次数,直到该改变次数为0时停止迭代,将更新后的预设参考聚类确定为聚类结果,进一步提高了高维数据聚类结果的精确度。

在一个实施例中,在通过计算降维加密后的待聚类高维数据所对应的基聚类集中任意两两基聚类之间的相似度,初始化预设参考聚类的步骤之前,该高维数据的聚类方法还包括:利用k-means算法,对降维加密后的待聚类高维数据进行初始化聚类运算,获取基聚类集。

在一个实施例中,在自多个客户端获取降维加密后的待聚类高维数据的步骤之前,该高维数据的聚类方法还包括:基于各客户端分别对应的待聚类高维数据,利用客户端,通过计算待聚类高维数据中各对象间距离,并进行给定迭代流程的迭代运算,实现待聚类高维数据的降维加密,获取降维加密后的待聚类高维数据。

可选地,多个客户端数据可以采用fastmap进行投影来获取降维加密后的待聚类高维数据。fastmap能够有效地处理大数据,并且可以将不同矩阵中的n个对象生成k维坐标。通过fastmap将原数据集中的n×d转换为n×b的数据集(b<d),并且仍然能够保持原始数据集的结构。

给定一个包含n个对象的m维数据x,使用欧几里得距离公式,计算任意两个对象间距离,并基于此构建距离矩阵sn×n。矩阵sn×n中的每个值代表对应两个对象之间的距离。选择两个对象oa和ob间距离最大的对象作为主对象,并将经过两个对象的直线作为第一个维度的坐标轴f1。

通过计算对象oi在第一个维度中的坐标。

其中da,b表示oa和ob间距离,da,i表示oa和oi间距离,db,i表示ob和oi间距离。

根据上式计算所有n个对象的坐标后,利用公式d′(oi,oj)2=d(oi,oj)2-(xi-xj)2计算n个对象的改化距离矩阵s′n×n。

其中,d′是s′n×n改化距离,d是sn×n的距离。

在sn×n中选择一对新的对象来计算第二个维度,重复这个过程k次,生成x的k维数据。

本实施例通过采用fastmap进行投影来获取降维加密后的待聚类高维数据,可以生成较好的组件数据集,抗噪声干扰能力较好,并且能较好地保留原始数据的聚类结构,从而保证数据的真实性。

为进一步说明本发明的技术方案,提供如下应用场景示例,但不对本发明的保护范围进行限制。

图2为根据本发明实施例一种高维数据的聚类方法的一实例场景示意图,如图2(a)所示,客户端的数据集1到数据集m通过fastmap软件进行投影,获得分别对应的投影1到投影m,投影1到投影m的总和构成了该客户端经降维加密后的待聚类高维数据。

如图2(b)所示,服务器接收e个客户端发送来的经降维加密后的待聚类高维数据,组合构成数据集x,将数据集x再通过k-means算法进行初始化运算,生成基聚类结果λ12,…λe,再将这些基聚类通过如上的聚类方法进行聚类,得到最终的聚类结果。

作为本发明实施例的另一个方面,本实施例根据上述实施例的方法提供一种电子设备,如图3所示,为本发明实施例一种电子设备的结构示意图,该电子设备包括:处理器(processor)31、通信接口(communicationsinterface)32、存储器(memory)33和总线34,其中,处理器31,通信接口32,存储器33通过总线34完成相互间的通信。处理器31可以调用存储器33中的逻辑指令,以执行上述实施例所提供的高维数据的聚类方法。

此外,上述的存储器33中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明另一实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使该计算机执行前述的高维数据的聚类方法。

作为本发明实施例的又一个方面,本实施例根据上述实施例的方法提供一种高维数据的聚类系统,包括多个客户端以及如上所述的电子设备或者非暂态计算机可读存储介质;该客户端用于对待聚类高维数据进行降维加密,获取降维加密后的待聚类高维数据。

本发明各装置实施例是用于执行本发明各方法实施例的,具体地执行方法和流程内容参见上述各方法实施例,此处不再赘述。

另外,本领域内的技术人员应当理解的是,在本发明的申请文件中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明的说明书中,说明了大量具体细节。然而应当理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。

然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1