聚类方法、装置及终端设备的制作方法

文档序号:6539162阅读:143来源:国知局
聚类方法、装置及终端设备的制作方法
【专利摘要】本公开实施例公开了一种聚类方法、装置及终端设备,所述方法首先获取待访问对象的邻居对象,根据邻居对象与待访问对象之间的距离对应的权重系数,计算待访问对象在邻域内的邻居对象的数量;距离待访问对象越近的对象,折算得到的该对象的数量比例越大,对邻域内邻居对象的贡献也就越大;反之,距离待访问对象越远的对象,折算得到该对象的数量比例越小,对邻域内邻居对象的贡献也就越小。从而在一定程度上降低邻居对象数量对邻域的扫描半径及最小包含对象数量的敏感性,进而降低了使用此种聚类方法得到的聚类结果对扫描半径及最小包含对象数量的敏感性,提高了聚类结果的准确率。
【专利说明】聚类方法、装置及终端设备
【技术领域】
[0001]本公开涉及数据处理【技术领域】,特别是涉及一种聚类方法、装置及终端设备。
【背景技术】
[0002]聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程,即将对象分类到不同的类或者簇的过程,同一个类中的对象有很大的相似性,不同类之间的对象有很大的相异性。
[0003]聚类方法包括很多种类,其中,基于密度的聚类方法与其它的聚类方法不同的是它不是基于各种距离,而是基于密度,只要一个区域中的点的密度大过某个阀值,就把它加到与之相近的聚类中去。这样能够克服基于距离的聚类算法只能发现“类圆形”的聚类的缺点° 例如,DBSCAN (Density-Based Spatial Clustering of Applications with Noise)算法就是基于密度的聚类方法中一种典型算法,DBSCAN算法将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可以在噪声的空间数据库中发现任意形状的聚类。DBSCAN算法引入了核心对象的概念和两个初始参数Eps(扫描半径)和MinPts(最小包含点数)。如果存在一个对象,在距它Eps的范围内有不少于MinPts个对象,则该对象就是核心对象。核心对象和它的Eps范围内的邻居对象形成一个簇。在一个簇内如果出现多个对象都是核心对象,则以这些核心对象为中心的簇要合并。但是,此种聚类算法的聚类结果对参数Eps和MinPts的取值非常敏感,即Eps和MinPts的取值不同,产生不同的聚类结果,从而导致聚类结果的不确定性。

【发明内容】

[0004]为克服相关技术中存在的问题,本公开提供一种聚类方法、装置及终端设备。
[0005]为了解决上述技术问题,本公开实施例公开了如下技术方案:
[0006]根据本公开实施例的第一方面,提供一种聚类方法,包括:
[0007]针对任一待访问对象,获取所述待访问对象的全部邻居对象;
[0008]根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关;
[0009]根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象;
[0010]当所述待访问对象是核心对象时,将所述待访问对象归为一类;
[0011]对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
[0012]结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,采用如下方式:
[0013]获取所述邻域内的邻居对象与所述待访问对象间的距离;[0014]根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象;
[0015]获取所述距离对应的权重系数,所述权重系数与对象间的距离相关;
[0016]根据所述权重系数,计算所述待访问对象的邻域内邻居对象的数量。
[0017]结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,获取所述距离对应的权重系数,采用如下方式:
[0018]根据样本对象统计得到对象间的距离以及两个对象是否是同一对象的概率之间的对应关系;
[0019]查询所述对应关系,获得所述距离对应的两个对象是否是同一个对象的概率;
[0020]根据所述概率及所述距离之间的乘积,得到所述距离对应的权重系数,所述权重系数与所述概率正相关。
[0021]结合第一方面,在第一方面的第三种可能的实现方式中,所述待访问对象设置有扫描半径由小到大依次变化的多重邻域;
[0022]根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象,采用如下方式:
[0023]按照所述扫描半径由小到大的顺序,判断所述邻域内邻居对象的数量是否不小于对应的预设阈值;
[0024]当所述邻域内邻居对象的数量不小于对应的预设阈值时,确定所述待访问对象是核心对象;
[0025]当所述当前邻域内邻居对象的数量小于对应的预设阈值时,判断所述待访问对象的多重邻域是否全部判断完;
[0026]当未判断完所述多重邻域时,执行按照所述扫描半径由小到大的顺序,判断下一重邻域内邻居对象的数量是否不小于对应的预设阈值;
[0027]当判断完所述多重邻域时,确定所述待访问对象不是核心对象。
[0028]结合第一方面和第一方面的第一种至第三种可能的实现方式中的任一种,在第一方面的第四种可能的实现方式中,对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类,采用如下方式:
[0029]获取所述待访问对象在指定领域内的全部直接密度可达的对象,所述指定邻域的扫描半径小于所述多重邻域中的最大扫描半径;
[0030]逐个判断所述直接密度可达的对象是否是核心对象;
[0031]当所述直接密度可达的对象是核心对象时,将所述直接密度可达的对象在指定邻域内的邻居对象加入所述待访问对象所在的类中,直到没有新的对象加入所述待访问对象所在的类中。
[0032]结合第一方面的第一种可能的实现方式,在第一方面的第五种可能的实现方式中,根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象,采用如下方式:
[0033]将各个所述邻居对象与所述待访问对象之间的距离按照大小关系进行排序;
[0034]按照所述距离的排序,统计与所述待访问对象间的距离小于所述邻域的扫描半径的邻居对象。[0035]根据本公开实施例的第二方面,提供一种聚类装置,包括:
[0036]第一获取单元,用于针对任一待访问对象,获取所述待访问对象的全部邻居对象;
[0037]第二获取单元,用于根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关;
[0038]判断单元,用于根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象;
[0039]聚类单元,用于当所述待访问对象是核心对象时,将所述待访问对象归为一类;
[0040]扩展聚类单元,用于对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
[0041]结合第二方面,在第二方面的第一种可能的实现方式中,所述第二获取单元包括:
[0042]第一获取子单元,用于获取所述邻域内的邻居对象与所述待访问对象间的距离;
[0043]第一确定子单元,用于根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象;
[0044]第二获取子单元,用于获取所述距离对应的权重系数,所述权重系数与对象间的距尚相关;
[0045]计算子单元,用于根据所述权重系数,计算所述待访问对象的邻域内邻居对象的数量。
[0046]结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第二获取子单元包括:
[0047]统计子单元,用于根据样本对象统计得到对象间的距离以及两个对象是否是同一对象的概率之间的对应关系;
[0048]查询子单元,用于查询所述对应关系,获得所述距离对应的两个对象是否是同一个对象的概率;
[0049]第三获取子单元,用于根据所述概率及所述距离之间的乘积,得到所述距离对应的权重系数,所述权重系数与所述概率正相关。
[0050]结合第二方面,在第二方面的第三种可能的实现方式中,所述待访问对象设置有多重邻域,所述多重邻域的扫描半径设置为由小到大依次变化;所述判断单元包括:
[0051]第一判断子单元,用于按照所述多重邻域的扫描半径由小到大的顺序,判断一重邻域内邻居对象的数量是否不小于对应的预设阈值;
[0052]第一确定子单元,用于当所述一重邻域内邻居对象的数量不小于对应的预设阈值时,确定所述待访问对象是核心对象;
[0053]第二判断子单元,用于当所述一重邻域内邻居对象的数量小于对应的预设阈值时,判断所述待访问对象的多重邻域是否全部判断完,当未判断完所述多重邻域时,返回执行按照扫描半径由小到大的顺序,判断下一重邻域内的邻居对象的数量是否不小于对应的预设阈值;
[0054]第二确定子单元,用于当判断完所述多重邻域时,确定所述待访问对象不是核心对象。
[0055]结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述扩展聚类单元包括:
[0056]第四获取子单元,用于获取所述待访问对象在指定领域内的全部直接密度可达的对象,所述指定邻域的扫描半径小于所述多重邻域中的最大扫描半径;
[0057]第三判断子单元,用于逐个判断所述直接密度可达的对象是否是核心对象;
[0058]聚类子单元,用于当所述直接密度可达的对象是核心对象时,将所述直接密度可达的对象在指定邻域内的邻居对象加入所述待访问对象所在的类中,直到没有新的对象加入所述待访问对象所在的类中。
[0059]结合第二方面的第一种可能的实现方式,在第二方面的第五种可能的实现方式中,所述第一确定子单元包括:
[0060]排序子单元,用于将各个所述邻居对象与所述待访问对象之间的距离按照大小关系进行排序;
[0061]统计子单元,用于按照所述距离的排序,统计与所述待访问对象间的距离小于所述邻域的扫描半径的邻居对象。
[0062]根据本公开实施例的第二方面,提供一种终端设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
[0063]针对任一待访问对象,获取所述待访问对象的全部邻居对象;
[0064]根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关;
[0065]根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象;
[0066]当所述待访问对象是核心对象时,将所述待访问对象归为一类;
[0067]对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
[0068]本公开的实施例提供的技术方案可以包括以下有益效果:根据邻居对象与待访问对象之间的距离对应的权重系数,计算待访问对象在邻域内的邻居对象的数量;距离待访问对象越近的对象,折算得到的该对象的数量比例越大,对邻域内邻居对象的贡献也就越大;反之,距离待访问对象越远的对象,折算得到该对象的数量比例越小,对邻域内邻居对象的贡献也就越小。从而在一定程度上降低邻居对象数量对邻域的扫描半径及最小包含对象数量的敏感性,进而降低了使用此种聚类方法得到的聚类结果对扫描半径及最小包含对象数量的敏感性,提高了聚类结果的准确率。
[0069]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
【专利附图】

【附图说明】
[0070]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
[0071]图1是根据一示例性实施例示出的一种聚类方法的流程图;[0072]图2是根据一示例性实施例示出的一种对象分布示意图;
[0073]图3是根据一示例性实施例示出的步骤S200的流程图;
[0074]图4是根据一示例性实施例示出的步骤S220的流程图;
[0075]图5是根据一示例性实施例示出的步骤S230的流程图;
[0076]图6是根据一示例性实施例示出的步骤S300的流程图;
[0077]图7是根据一示例性实施例示出的邻域分布示意图;
[0078]图8是根据一示例性实施例示出的步骤S500的流程图;
[0079]图9是根据一示例性实施例示出的聚类装置的框图;
[0080]图10是根据一示例性实施例示出的一种终端设备的框图。
[0081]通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
【具体实施方式】
[0082]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0083]在对本公开的实施例进行详细说明之前,首先介绍本公开出现的以下名词的概念:
[0084]E邻域:以某个对象为圆心,扫描半径为E的区域称为该对象的E邻域;
[0085]核心对象:如果某个对象P的E邻域内的邻居对象的数量不小于最小包含对象数MinPts,则称该对象为核心对象;
[0086]邻居对象:对于某个对象P,能够与对象P直接相连的对象称为P的邻居对象;
[0087]直接密度可达:对于样本集合,如果邻居对象Q在对象P的E邻域内,且对象P是核心对象,则称对象Q从对象P直接密度可达,也即Q为对象P在E邻域内的邻居对象。
[0088]图1是根据一示例性实施例示出的一种聚类方法的流程图,如图1所示,所述聚类方法用于终端中,包括以下步骤:
[0089]在步骤SlOO中,针对任一待访问对象,获取所述待访问对象的全部邻居对象;
[0090]本公开提供的聚类方法的对象可以是人脸图像,将属于同一个人的图像聚集在一起形成一个聚类。将人脸图像中的特征转换成一组向量,因此,对象间的距离即向量之间的距离。当然,本公开所提供的聚类方法还可以适用于除图片之外的其它的数据。
[0091]对于一个待处理的对象集,该对象集内的每一个对象作为待访问对象,获取所述待访问对象的全部邻居对象。如图2所示,对象5与对象4、6和7直接相连,则对象4、6和7为对象5的邻居对象。
[0092]每个对象设置一访问标识,当访问某个对象时,将该对象的访问标识标记为已访问。例如,某对象未被访问时,对应的访问标识为“O”;如果该对象已被访问过,则将访问标识修改为“I”。根据对象的访问标识识别所述对象是否是待访问对象。可以根据对象的访问标识判断所述对象是否是待访问的对象。[0093]在步骤S200中,根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关;
[0094]所述权重系数能够体现对象间的相似性的关联性,例如,对象间的距离越大,表明两对象间的相似性越小,其对应的权重系数越小;反之,对象间的距离越小,表明两对象间的相似性越大,其对应的权重系数越大。即距离所述待访问对象越近的对象,在计算对象数量时贡献越大;距离所述待访问对象越远的对象,在计算对象数量时贡献越小。
[0095]在本公开一示例性实施例中,如图3所示,所述步骤S200可以包括以下步骤:
[0096]S210,获取所述邻域内的邻居对象与所述待访问对象间的距离;所述距离可以是余弦相似度、欧式距离等。
[0097]假设两个对象分别为A和B,其中,该两个对象间的余弦相似度根据公式(I)计算:
[0098]cosθ=A.B/||A||B||
[0099]公式(1)中,分子表示向量A与向量B的内积,A是向量A的长度,B是向量B的长度。
[0100]需要说明的是,本公开采用对象间的余弦相似度反应对象间的距离关系时,利用(1-COS θ )表征对象间的距离,即d=l-C0S θ,这样,对象间的距离越小,两个对象的相似性越大。
[0101]S220,根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象;
[0102]对象P的邻居对象中,如果邻居对象与对象P之间的距离不大于对象P的El邻域的扫描半径El,则确定该邻居对象是对象P在El邻域内的邻居对象。
[0103]可选地,在本公开一示例性实施例中,如图4所示,步骤S220可以包括以下步骤:
[0104]在步骤S221中,将各个所述邻居对象与所述待访问对象之间的距离按照大小关系进行排序;
[0105]在步骤S222中,按照所述距离的排序,统计与所述待访问对象间的距离小于所述邻域的扫描半径的邻居对象。
[0106]判断El邻域内的对象的数量,按照El邻域内对象与对象P之间的距离大小关系进行排序,得到距离序列,可以首先根据查找法(例如,二分查找法)确定所述距离序列中与扫描半径El最接近的距离,然后统计序列中小于该距离的个数,提高了判断效率。
[0107]在步骤S230,获取所述距离对应的权重系数,所述权重系数与对象间的距离相关;
[0108]所述权重系数可以根据对象间的属性距离来确定,还可以对象间的距离以及两个对象是否是同一个对象的概率确定,本公开对此并不限定。
[0109]在本公开一示例性实施例中,如图5所示,步骤S230可以包括以下步骤:
[0110]在步骤S231中,根据样本对象统计,得到对象间的距离以及两个对象是否是同一对象的概率之间的对应关系;
[0111]例如,在人脸识别中,根据高维特征计算出的两个人脸图像的余弦相似度COS Θ的范围是[O,I],根据大量的人脸图像统计数据得出,当余弦相似度在[0.45,I]范围内时,两对象是同一个人的概率基本是98%以上;当余弦相似度在[0.35,0.45)范围内时,两对象是同一个人的概率基本是70% ;当余弦相似度在[0.25,0.35)范围内时,两对象是同一个人的概率基本是40% ;当余弦相似度在[0.15,0.25)范围内时,两对象是同一个人的概率基本是10% ;当余弦相似度在[0,0.15)范围内时,两对象是同一个人的概率基本是0.1%。
[0112]根据上述统计结果可以得到对象间的距离以及两个对象是否是同一个对象的概率之间的对应关系,所述对应关系可以以表格形式或其它形式存储。
[0113]在步骤S232中,查询所述对应关系,获得所述距离对应的两个对象是否是同一个对象的概率;
[0114]在步骤S233中,根据所述概率及所述距离之间的乘积,得到所述距离对应的权重系数,所述权重系数与所述概率正相关。
[0115]当对象间的距离利用余弦相似度计算时,需要将对象间的距离转换成对应的余弦相似度,对象间距离的取值范围转换成对应的余弦相似度的取值范围,得到所述概率与余弦相似度之间的对应关系;根据此对应关系。可以采用以下的公式(2)描述权重系数与余弦相似度之间的关系:
【权利要求】
1.一种聚类方法,其特征在于,包括: 针对任一待访问对象,获取所述待访问对象的全部邻居对象; 根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关; 根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象; 当所述待访问对象是核心对象时,将所述待访问对象归为一类; 对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,采用如下方式: 获取所述邻域内的邻居对象与所述待访问对象间的距离; 根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象; 获取所述距离对应的权重系数,所述权重系数与对象间的距离相关; 根据所述权重系数,计算所述待访问对象的邻域内邻居对象的数量。
3.根据权利要求2所述的方法,其特征在于,获取所述距离对应的权重系数,采用如下方式: 根据样本对象统计得到对象间的距离以及两个对象是否是同一对象的概率之间的对应关系; 查询所述对应关系,获得所述距离对应的两个对象是否是同一个对象的概率; 根据所述概率及所述距离之间的乘积,得到所述距离对应的权重系数,所述权重系数与所述概率正相关。
4.根据权利要求1所述的方法,其特征在于,所述待访问对象设置有扫描半径由小到大依次变化的多重邻域; 根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象,采用如下方式: 按照所述扫描半径由小到大的顺序,判断所述邻域内邻居对象的数量是否不小于对应的预设阈值; 当所述邻域内邻居对象的数量不小于对应的预设阈值时,确定所述待访问对象是核心对象; 当所述当前邻域内邻居对象的数量小于对应的预设阈值时,判断所述待访问对象的多重邻域是否全部判断完; 当未判断完所述多重邻域时,执行按照所述扫描半径由小到大的顺序,判断下一重邻域内邻居对象的数量是否不小于对应的预设阈值; 当判断完所述多重邻域时,确定所述待访问对象不是核心对象。
5.根据权利要求4所述的方法,其特征在于,对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类,采用如下方式:获取所述待访问对象在指定领域内的全部直接密度可达的对象,所述指定邻域的扫描半径小于所述多重邻域中的最大扫描半径; 逐个判断所述直接密度可达的对象是否是核心对象; 当所述直接密度可达的对象是核心对象时,将所述直接密度可达的对象在指定邻域内的邻居对象加入所述待访问对象所在的类中,直到没有新的对象加入所述待访问对象所在的类中。
6.根据权利要求2所述的方法,其特征在于,根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象,采用如下方式: 将各个所述邻居对象与所述待访问对象之间的距离按照大小关系进行排序; 按照所述距离的排序,统计与所述待访问对象间的距离小于所述邻域的扫描半径的邻居对象。
7.一种聚类装置,其特征在于,包括: 第一获取单元,用于针对任一待访问对象,获取所述待访问对象的全部邻居对象;第二获取单元,用于根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关; 判断单元,用于根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象; 聚类单元,用于当所述待访问对象是核心对象时,将所述待访问对象归为一类; 扩展聚类单元,用于对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
8.根据权利要求7所述的装置,其特征在于,所述第二获取单元包括: 第一获取子单元,用于获取所述邻域内的邻居对象与所述待访问对象间的距离; 第一确定子单元,用于根据所述距离,从所述待访问对象的全部邻居对象中确定在所述邻域内的邻居对象; 第二获取子单元,用于获取所述距离对应的权重系数,所述权重系数与对象间的距离相关; 计算子单元,用于根据所述权重系数,计算所述待访问对象的邻域内邻居对象的数量。
9.根据权利要求8所述的装置,其特征在于,所述第二获取子单元包括: 统计子单元,用于根据样本对象统计得到对象间的距离以及两个对象是否是同一对象的概率之间的对应关系; 查询子单元,用于查询所述对应关系,获得所述距离对应的两个对象是否是同一个对象的概率; 第三获取子单元,用于根据所述概率及所述距离之间的乘积,得到所述距离对应的权重系数,所述权重系数与所述概率正相关。
10.根据权利要求7所述的装置,其特征在于,所述待访问对象设置有多重邻域,所述多重邻域的扫描半径设置为由小到大依次变化;所述判断单元包括: 第一判断子单元,用于按照所述多重邻域的扫描半径由小到大的顺序,判断一重邻域内邻居对象的数量是否不小于对应的预设阈值;第一确定子单元,用于当所述一重邻域内邻居对象的数量不小于对应的预设阈值时,确定所述待访问对象是核心对象; 第二判断子单元,用于当所述一重邻域内邻居对象的数量小于对应的预设阈值时,判断所述待访问对象的多重邻域是否全部判断完,当未判断完所述多重邻域时,返回执行按照扫描半径由小到大的顺序,判断下一重邻域内的邻居对象的数量是否不小于对应的预设阈值; 第二确定子单元,用于当判断完所述多重邻域时,确定所述待访问对象不是核心对象。
11.根据权利要求10所述的装置,其特征在于,所述扩展聚类单元包括: 第四获取子单元,用于获取所述待访问对象在指定领域内的全部直接密度可达的对象,所述指定邻域的扫描半径小于所述多重邻域中的最大扫描半径; 第三判断子单元,用于逐个判断所述直接密度可达的对象是否是核心对象; 聚类子单元,用于当所述直接密度可达的对象是核心对象时,将所述直接密度可达的对象在指定邻域内的邻居对象加入所述待访问对象所在的类中,直到没有新的对象加入所述待访问对象所在的类中。
12.根据权利要求8所述的装置,其特征在于,所述第一确定子单元包括: 排序子单元,用于将各个所述邻居对象与所述待访问对象之间的距离按照大小关系进行排序; 统计子单元,用于按照所述距离的排序,统计与所述待访问对象间的距离小于所述邻域的扫描半径的邻居对象。
13.一种终端设备,其特征在于,包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为: 针对任一待访问对象,获取所述待访问对象的全部邻居对象; 根据所述邻居对象与所述待访问对象间的距离及对应的权重系数,获取所述待访问对象的邻域内邻居对象的数量,所述权重系数与所述对象间的距离相关; 根据所述待访问对象的邻域内邻居对象的数量,判断所述待访问对象是否是核心对象; 当所述待访问对象是核心对象时,将所述待访问对象归为一类; 对所述待访问对象在邻域内的直接密度可达的对象进行扩展聚类,直到没有新的对象加入所述待访问对象所在的类。
【文档编号】G06F17/30GK103902654SQ201410073353
【公开日】2014年7月2日 申请日期:2014年2月28日 优先权日:2014年2月28日
【发明者】陈志军, 王琳, 王百超 申请人:小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1