一种基于Radviz的模糊聚类结果可视化方法

文档序号:10687079阅读:908来源:国知局
一种基于Radviz的模糊聚类结果可视化方法
【专利摘要】本发明提供了一种基于Radviz的模糊聚类结果可视化方法,其步骤为:1)对模糊聚类算法的结果进行数据预处理;2)为RadViz圆周设计合理的聚类簇维度锚点布局;3)将数据样本以圆点模式或饼图模式投影到Radviz内部;4)将维度锚点扩展为维度圆环,实现Radviz圆环的可视编码;5)将隶属度分布信息融合到Radviz主视图中;6)提取聚类间的共存关联关系,并使用弦线映射共存关系。本发明基于Radviz对模糊聚类算法得到的模糊隶属度矩阵进行展示,不但为用户提供了尽可能多的模糊聚类信息,而且允许研究人员自由探索数据属性、隶属度矩阵和聚类簇等信息,从而使用户进行更加快速、直观、准确的决策。
【专利说明】
一种基于Radv i z的模糊聚类结果可视化方法
技术领域
[0001 ]本发明属于计算机信息处理技术领域,涉及到一种基于Radviz的模糊聚类结果可 视化方法。
【背景技术】
[0002] 模糊聚类是一种重叠聚类方法,它允许数据对象属于多个聚类簇。在模糊聚类中, 数据点在每个聚类簇上都对应一个隶属度,它反映了数据点属于该类别的不确定性程度, 模糊聚类的结果也就是数据点属于每个聚类簇的隶属度矩阵。由于在真实世界中很难准确 判定聚类簇边界,所以模糊聚类的部分划分显得更为合理,能更加客观地反映现实世界。但 是当聚类算法得到的聚类较多、数据中包含海量节点时,隶属度矩阵为结构复杂的高维数 据,研究人员在分析模糊聚类结果时会面临以下两方面的问题:
[0003] -方面,模糊聚类算法得到的隶属度描述了样本从属于各个聚类的概率,对应的 判决方式为软判决。但在实际应用过程中,研究人员将根据需要利用某种原则把模糊隶属 度矩阵这种软判决转化为硬判决,常用的原则包括最大隶属度原则、阈值原则、贴近原则 等。把模糊隶属度转化成硬判决的过程存在某些固有的缺陷,如信息丢失过多,可能出现比 较大的误差,甚至得到相反的结果等。
[0004] 另一方面,隶属度矩阵存储了数据点被划分到各个聚类的隶属度,它可以帮助我 们直观地判断数据点相对而言最应该被划分到哪个聚类,但是并不允许我们获得更多更有 意义的信息,如多个聚类簇之间的关系、各个聚类的大小等。
[0005] 这些问题将导致用户难以全面、准确地理解模糊聚类结果,在一定程度上削弱了 模糊聚类分析在实际领域应用中的易用性。

【发明内容】

[0006] 本发明所解决的技术问题是,针对现有技术的不足,提供一种基于Radviz的模糊 聚类算法结果可视化方法,为用户展示了模糊聚类算法得到的模糊隶属度矩阵,帮助用户 以清晰直观的方式观察、探索难以理解的模糊聚类结果,并从中获得信息进行更加精准有 效的数据挖掘及其后续应用。
[0007] 本发明所提供的技术方案为:
[0008] 一种基于Radviz的模糊聚类结果可视化方法,包含以下步骤:
[0009] 步骤1):对模糊聚类算法结果进行数据预处理,得到隶属度矩阵M,隶属度矩阵M中 数据点Pi对应的行向量为数据APi从属于各个聚类簇的隶属度向量Vi,每个数据点从属于 各个聚类簇的隶属度向量,…,Vi,…,V n]T,0<i<n,n为数据点的总个数;隶属度 矩阵M中聚类簇&对应的列向量为聚类簇&中各个数据点从属于该聚类簇的隶属度向量 每个聚类簇中各个数据点从属于该聚类簇的隶属度向量1]=[山,1] 2,…,Uj,…,Um],0<j< m,m为聚类簇的个数;聚类簇的大小记为Size(C),其中Si Ze(Cj)表示第j个聚类簇&的大小; 聚类簇的权重记为Weight(C),Weight(Cj)表示第j个聚类簇Cj的权重;
[0010]步骤2):根据步骤1)得到的隶属度向量U,计算出聚类簇两两之间的相似性,然后 以各个聚类簇为节点,聚类簇之间的相似性作为节点间边的权值构造一个加权连通图,再 利用prim算法在加权连通图里搜索最小生成树,将节点映射到Radviz圆周上作为Radviz维 度锚点,将节点被添加到最小生成树的顺序作为Radviz维度锚点的排序t,最后根据得到的 聚类簇对两两之间的相似性和Radv i z维度锚点的排布顺序t,计算出每个Rad v i z维度锚点 在Radvi z圆周上的弧度,进一步计算得到Radvi z维度锚点在Radvi z圆周上的位置;
[0011 ] 步骤3):根据步骤2)得到的Radviz维度锚点排布顺序t和Radviz维度锚点在 Radviz圆周上的位置,将所有的数据点在Radviz维度锚点的弹簧拉力作用下投影到Radviz 内部,弹簧拉力大小正比于数据点从属于聚类簇的隶属度;并根据步骤1)得到的每个数据 点从属于各个聚类簇的隶属度向量V对数据点进行不同的着色;
[0012] 步骤4):根据步骤2)得到的Radviz维度锚点排布顺序t和每个Radviz维度锚点在 Radviz圆周上的弧度,将Radviz维度锚点扩展为维度圆环,并根据Radviz维度锚点对应的 聚类簇给维度圆环进行不同的着色,根据步骤1)得到的每个聚类簇的大小和每个聚类簇的 权重,使用维度环的厚度来映射聚类簇的大小或权重;
[0013]步骤5):根据步骤1)得到的隶属度矩阵,把隶属度范围[0,1 ]划分为N个等分的块, N取10至100中的整数;统计各个聚类中隶属度取值落在各个块中的比例,以此得到整个聚 类的隶属度分布直方图,并将其映射为折线图;
[0014]步骤6):根据步骤1)得到的隶属度矩阵,计算两两聚类簇间的共存关系,并使用 Radviz维度锚点之间的弦线来表示相应聚类间的共存关系,弦线越粗、不透明度越高则表 示以大概率同时从属于这两个聚类簇的节点越多,反之则越少。
[0015] 所述步骤1)包括以下步骤:
[0016] 步骤1.1):根据模糊聚类算法的结果得到n个数据点被聚类成m类的隶属度矩阵M, 其中0<111<1,0纪<11,0<衫 111,即矩阵的每一行表示一个数据点从属于各个聚类簇的隶 属度向量,矩阵的每一列表示一个聚类簇中所有的数据点从属于该聚类簇的隶属度向量;
[0017] 步骤1.2):根据步骤1.1)得到的隶属度矩阵M,得到每个数据点从属于各个聚类簇 的隶属度向量V,其中第i个数据点Pi从属于各个聚类簇的隶属度向量记为Vi={Vi[l],Vi [2],..., 1[」],...,1[111]},其中0彡¥1[」]彡1;
[0018] 步骤1.3):根据步骤1.1)得到的隶属度矩阵M,得到每个聚类簇中各个数据点从属 于该聚类簇的隶属度向量U,其中第j个聚类簇Q中各个数据点从属于该聚类簇的隶属度向 量记为Uj={Uj[l],Uj[2],. . .,Uj[i],. . .,Uj[n]},其中0彡Uj[i]彡 1;
[0019] 步骤1.4):根据步骤1.1)得到的隶属度矩阵M和步骤1.2)得到的每个数据点从属 于各个聚类簇的隶属度向量V,计算出每个聚类簇的大小Size(C),其中聚类簇Q大小的计 算公式为:Size(Cj) = Count[Mij=max(Vi)],即判断聚类簇Cj中以最大隶属度从属于该聚 类簇的数据点的数目,其中Count[ ?]为计数函数,max( ?)为求最大值函数;
[0020] 步骤1.5):根据步骤1.3)得到的每个聚类簇对应的隶属度向量U,计算出每个聚类
簇的权重Weight(C),其中聚类簇Cj的权重Weight(Cj)的计算公式为: 即聚类簇Cj对应的隶属度向量Uj中所有隶属度之和。
[0021] 所述步骤2)中,通过以下方法计算聚类簇对两两之间的相似性:根据步骤1)得到 的每个聚类簇对应的隶属度向量U,计算任意两个聚类簇对应的隶属度向量Ua,Ub之间的欧 式距离dis tan ceab :
其中,(Xa,b<m,令聚类簇对Ca和Cb之间的相似性Sab等于distance ab,聚类簇对应的隶属度 向量之间的欧式距离越小则聚类簇之间越相似,距离越大则聚类簇之间越不相似;
[0022]然后,根据得到的聚类簇对两两之间的相似性和Radviz维度锚点的排布顺序t,计 算出每个Radviz维度锚点在Radviz圆周上的弧度,第j个维度锚点的弧度为
-,其中,tj表示Radviz维度锚点的排布顺序中第j个维度锚点, 表示Radviz维度锚点tj和t(j+i)Md m对应的聚类簇;和^+^^之间的相似性,(j+i)m〇d m 表示对tG+1)的下标(j+1)进行取余操作;S为维度锚点排布序列t中任意两个相邻的维度锚 点之间的相似性之和,即
在计算
,用到的两个维 度锚点之间的相似性是排布序列t中两个相邻的维度锚点之间的相似性;为了计算维度锚 点排布顺序t中最后一个维度锚点以。〇和第一个维度锚点to之间的相似性,对tG+1)的下标 (j+1)进行取余操作;
[0023] 最后,计算出每个Rad v i z维度锚点DA在Rad v i z圆周上的位置,第j个Rad v i z维度锚 点记为DA(j),计算DA(j)在圆周上的坐标的公式为: 其中,DA j (j )x为DA( j)的横坐标,DA( j )y*DA( j)的纵坐标,直角坐标系以Radviz圆周的圆心为原点, 分别以Radviz圆周两条相互垂直的直径所在直线为横轴和纵轴,R为Radviz圆周半径。 [0024]所述的步骤3)中,Radviz内部的数据点使用圆点或饼图表示。
[0025]所述步骤3)中,在Radviz内部使用圆点表示数据点,并从步骤1)得到的每个数据 点从属于各个聚类簇的隶属度向量V中找到每个数据点的最大隶属度,根据最大隶属度对 应的聚类簇给圆点着色,根据最大隶属度的值设置圆点的不透明度。
[0026]所述步骤3)中,在Radviz内部使用饼图表示数据点,并从步骤1)得到的每个数据 点从属于各个聚类簇的隶属度向量V中找到每个数据点的第二大和第三大隶属度,饼图的 颜色由第二大和第三大隶属度对应的聚类簇共同确定,并根据第二大隶属度和第三大隶属 度在这两个隶属度之和中所占的比例确定两种颜色在饼图中所占的比例。
[0027] 所述步骤4)包括以下步骤:
[0028] 步骤4.1):根据步骤2)得到的Radviz维度锚点的排布顺序t和每个Radviz维度锚 点在Radviz圆周上的弧度,计算出每个维度锚点扩展为维度圆环的起始弧度和终止弧度, 若prim算法得到维度锚点排序为{. . .,a, j,b, . . .},则第j个聚类簇起始弧度StartAngle (j)、终止弧度EndAngle( j)的计算公式为:
[0030] 步骤4.2):根据维度圆环对应的聚类簇给维度圆环进行着色;
[0031] 步骤4.3):根据步骤1)得到的每个聚类簇大小51狀(〇或权重如181^(〇给每个维 度圆环设置厚度,维度圆环厚度越大表示该聚类簇大小或权重越大,反之越小。
[0032] 可由用户自由选择使用维度圆环的厚度来映射聚类簇的大小或聚类簇的权重信 息。
[0033] 所述步骤5)包括以下步骤:
[0034]步骤5.1):将隶属度取值范围[0,1 ]划分为50个等分的块;
[0035]步骤5.2):根据步骤1)得到的隶属度矩阵M,统计各个聚类簇对应的隶属度中取值 落在各个块中的数量,计算出每个聚类簇对应的隶属度在各个块中的比例,以此得到整个 聚类的隶属度分布直方图,横轴为隶属度范围,纵轴为落在相应隶属度区间的数据点比例;
[0036] 步骤5.3):将步骤5.2)得到的隶属度分布直方图映射为折线图,横轴为隶属度区 间范围,纵轴为落在相应隶属度区间的数据点比例。
[0037] 所述步骤6)中,计算两两聚类簇间的共存关系计算方法为:
[0038] 根据步骤1)得到的每个数据点的隶属度向量I,计算出任意两个聚类簇Q、Ck之间 的共存关系Relation(Cj,Ck),其计算公式为:

表示所有以最大隶属度从属于Q聚类簇的数据点从属于聚类&的隶属度累加和,
表示所有以最大隶属度从属于Ck聚类簇的数据点从属于聚类q的隶属度累加和, 所以两个聚类簇Q、Ck间的共存关系Relati〇n(ChCk)表示以最大隶属度从属于聚类Q/Ck的 节点同时从属于聚类Ck/Cj的隶属度之和。
[0039] 有益效果:
[0040] 本发明提供了一种基于Radviz的模糊聚类结果可视化方法,Radviz (radial vi sua 1 i zat i on,径向可视化)作为一个经典的多维数据可视化方法,它可以将多维数据投 影到二维平面上且能较好地保留数据之间的原始特性,因此基于Radviz的模糊聚类结果可 视化方法,将模糊聚类算法得到的隶属度矩阵投影到Radviz中,并将隶属度的分布、聚类簇 的大小、聚类簇之间的关系等信息融合到Radviz主视图中,可以帮助用户以清晰直观的方 式观察、感知难以理解的模糊聚类结果,并从中得到信息进行更加精准有效的数据挖掘及 其后续应用。
【附图说明】
[0041 ]图1是本发明所述方法流程图;
[0042]图2是聚类簇维度锚点布局流程图;
[0043]图3是对数据点的可视编码,图3(a)为圆点模式,图3(b)为饼图模式;
[0044] 图4是对圆环的可视编码;
[0045] 图5是聚类隶属度分布信息的融合;
[0046] 图6是聚类簇间关系的可视编码。
【具体实施方式】
[0047]为使本发明的目的、设计思路和优点更加清楚,以下结合具体实例,并参照附图, 对本发明作进一步详细说明。
[0048]本发明提供了一种基于Radviz的模糊聚类结果可视化方法(标题),如图1所示,包 括六个主要步骤:对模糊聚类算法结果进行数据预处理;为Radviz圆周设计合理的聚类簇 维度锚点布局;将数据样本以圆点模式或饼图模式投影到Radviz内部;将维度锚点扩展为 维度圆环,实现Radviz圆环的可视编码;将隶属度分布信息融合到Radviz主视图中;提取聚 类间的共存关联关系,并使用弦线映射共存关系。
[0049] 下面对本发明的方法涉及的关键步骤进行逐一详细说明,具体步骤如下所示:
[0050] 步骤一,对给定的模糊聚类算法的结果进行数据预处理,其中包括五项工作:
[0051] (1)构建517个数据样本点被聚类成10类的隶属度矩阵M,该矩阵的每一行表示每 个数据点从属于各个聚类簇的隶属度向量,矩阵的每一列表示每个聚类簇中所有的数据点 从属于该聚类簇的隶属度向量;(2)从隶属度矩阵M中提取出每个行向量,作为每个数据点 的隶属度向量V; (3)从隶属度矩阵M中提取出每个列向量,作为每个聚类簇的隶属度向量U; (4)通过统计每个聚类簇中以最大隶属度属于该聚类簇的数据点的数目,得到每个聚类簇 的大小Size(C); (5)通过计算每个聚类簇的隶属度向量U的所有隶属度之和,得到每个聚类 簇的权重Weight(C)。
[0052]步骤二,为Radviz圆周设计合理的聚类簇维度锚点布局,如图2所示,主要包括三个 步骤:首先根据数据预处理得到的每个聚类簇的隶属度向量U,计算任意两个聚类簇Ca,Cb的隶 属度向量U a,Ub之间的欧式距离 并将聚类簇之间的欧式距离作为聚类簇之间相似性的度量方式,距离越小则越相似,距离 越大则越不相似,得到了聚类簇对两两之间的相似性;其次将聚类簇(CW3,...,c1())作 为节点,聚类簇之间的相似性作为权值构造出一个加权连通图,使用prim算法对该连通图 进行处理,利用prim算法添加节点到最小生成树的顺序作为Radviz维度锚点的排布排序, 可以得到合理的Radviz维度锚点排布顺序t;然后,根据得到的聚类簇对两两之间的相似性 和Radv i z维度锚点的排布顺序t,计算出每个Radvi z维度锚点在Radv i z圆周上的弧度,第j 个维度锚点的弧度为
,其中,tj表示Radviz维度锚点的排布顺序中第 j个维度锚点,表示Radviz维度锚点tj和t(j+i)Md m对应的聚类簇&,和之间 的相似性,(j+l)mod m表示对tG+1)的下标(j+1)进行取余操作,S为维度锚点排布序列t中任
意两个相邻的维度锚点之间的相似性之和 时,用到的两个维度锚点之间的相似性是排布序列t中两个相邻的维度锚点之间的相似 性,为了计算维度锚点排布顺序t中最后一个维度锚点和第一个维度锚点to之间的相 似性,对t(j+i)的下标(j+1)进行取余操作;最后,计算出每个Radviz维度锚点DA在Radviz圆 周上的位置,第j个Radviz维度锚点记为DA(j),计算DA(j)在圆周上的坐标的公式为: ,其中,DA( j )ADA( j)的横坐标,DA( j )ADA( j)的纵坐标,直角
坐标系以Radviz圆周的圆心为原点,分别以Radviz圆周两条相互垂直的直径所在直线为横 轴和纵轴,R为Radviz圆周半径。
[0053]步骤三,将数据样本以圆点模式或饼图模式投影到Radviz内部,如图3所示。根据 步骤二得到的Radv i z维度锚点的排布顺序t,将步骤一得到的各个数据点的隶属度向量V在 所有维度锚点的弹簧拉力作用下投影到Radviz内部,拉力大小正比于数据点从属于聚类簇 的隶属度。
[0054] Radviz中的数据点可以使用圆点模式表示,如图3(a)所示,从步骤一得到的每个 数据点的隶属度向量V中找到每个数据点的最大隶属度,使用最大隶属度对应的聚类给圆 点着色,并使用最大隶属度的值设置圆点的不透明度;
[0055] Radviz中的数据点还可以使用饼图模式表示,如图3(b)所示,从步骤一得到的每 个数据点的隶属度向量V中找到每个数据点的第二大和第三大隶属度,饼图的颜色由第二 大和第三大隶属度对应的聚类簇共同决定,并根据第二大隶属度和第三大隶属度在这两个 隶属度之和中所占的比例决定两种颜色在饼图中所占的比例。
[0056] Radv i z中数据点的表示模式由用户任意选择。
[0057] 步骤四,将维度锚点扩展为维度圆环,实现Radviz圆环的可视编码,如图4所示。该 部分具体需要完成五项工作:(1)根据步骤二得到的Radviz维度锚点的排布顺序t和每个 Radvi z维度锚点在Radvi z圆周上的弧度,计算出每个维度锚点扩展为维度圆环的起始弧度 和终止弧度,若Prim算法得到维度锚点排序为{. . .,a,j,b,. . .},则各聚类簇起始弧度和终 止弧度的计算公式为:
;(2)根据维度圆环对 应的聚类簇给维度圆环进行着色;(3)根据步骤一得到的每个聚类簇大小Size(C)给每个维 度圆环设置厚度,维度圆环厚度越大表示该聚类簇大小越大,反之越小;(4)根据步骤一得 到的每个聚类簇权重Weight(C)给每个维度圆环设置厚度,维度圆环厚度越大表示该聚类 簇权重越大,反之越小。
[0058]维度圆环厚度映射的信息由用户任意选择。
[0059]步骤五,为了将隶属度分布信息融合到Radviz主视图中,如图5所示。首先将隶属 度取值范围[0,1 ]划分为50个等分的块(Bin);其次根据步骤一得到的隶属度矩阵M,统计各 个聚类簇的隶属度中取值落在各个块中的数量,计算出每个聚类簇的隶属度在各个块中的 比例,以此得到整个聚类的隶属度分布直方图,直方图的横轴为隶属度范围,纵轴为落在相 应隶属度区间的样本比例;最后将隶属度分布直方图映射为折线图,折线图的横轴为隶属 度范围,纵轴为落在相应隶属度区间的样本比例。
[0060]步骤六,提取聚类间的共存关联关系,并使用弦线映射共存关系,如图6所示。首先 根据步骤一得到的每个数据点从属于各个聚类簇的隶属度向量V,计算出任意两个聚类簇
Cj、Ck间的共存关系Relation(Cj,Ck),其计算公式为: 表示所有以最大隶属度属于聚类簇Cj的数据点从属于聚类Ck的隶属度累加和,

表示所有以最大隶属度属于聚类簇ck的数据点从属于聚类Cj的隶属度累加和,所 以两个聚类簇Cj、Ck间的共存关系Relati〇n(ChCk)表示以最大隶属度从属于聚类Cj/C k的节 点同时从属于聚类&/Q的隶属度之和;然后将Radviz圆周上的Radviz维度锚点使用弦线连 接,来映射两两聚类簇之间的共存关系,弦线越粗、不透明度越高则表示以大概率同时属于 这两个聚类的节点越多,反之则越少。
【主权项】
1. 一种基于Radviz的模糊聚类结果可视化方法,其特征在于,包含以下步骤: 步骤1):对模糊聚类算法结果进行数据预处理,得到隶属度矩阵M,隶属度矩阵M中数据 APi对应的行向量为数据APi从属于各个聚类簇的隶属度向量Vi,每个数据点从属于各个 聚类簇的隶属度向量VzW,%,…,Vi,…,V n]T,0彡i<n,n为数据点的总个数;隶属度矩阵M 中聚类簇Q对应的列向量为聚类簇Q中各个数据点从属于该聚类簇的隶属度向量山,每个 聚类簇中各个数据点从属于该聚类簇的隶属度向量1]=[山,1] 2,…,Uj,…,Um],0<j<m,m为 聚类簇的个数;聚类簇的大小记为Size(C),其中Si Ze(Cj)表示第j个聚类簇Q的大小;聚类 簇的权重记为Weight(C),Weight(Cj)表示第j个聚类簇Cj的权重; 步骤2):根据步骤1)得到的隶属度向量U,计算出聚类簇两两之间的相似性,然后以各 个聚类簇为节点,聚类簇之间的相似性作为节点间边的权值构造一个加权连通图,再利用 prim算法在加权连通图里搜索最小生成树,将节点映射到Radviz圆周上作为Radviz维度锚 点,将节点被添加到最小生成树的顺序作为Radviz维度锚点的排序t,最后根据得到的聚类 簇对两两之间的相似性和Radviz维度锚点的排布顺序t,计算出每个Radviz维度锚点在 Radvi z圆周上的弧度,进一步计算得到Radvi z维度锚点在Radvi z圆周上的位置; 步骤3):根据步骤2)得到的Radviz维度锚点排布顺序t和Radviz维度锚点在Radviz圆 周上的位置,将所有的数据点在Radviz维度锚点的弹簧拉力作用下投影到Radviz内部,弹 簧拉力大小正比于数据点从属于聚类簇的隶属度;并根据步骤1)得到的每个数据点从属于 各个聚类簇的隶属度向量V对数据点进行不同的着色; 步骤4):根据步骤2)得到的Radviz维度锚点排布顺序t和每个Radviz维度锚点在 Radv i z圆周上的弧度,将Radv i z维度锚点扩展为维度圆环,并根据Radvi z维度锚点对应的 聚类簇给维度圆环进行不同的着色,根据步骤1)得到的每个聚类簇的大小和每个聚类簇的 权重,使用维度环的厚度来映射聚类簇的大小或权重; 步骤5):根据步骤1)得到的隶属度矩阵,把隶属度范围[0,1]划分为N个等分的块,N取 10至100中的整数;统计各个聚类中隶属度取值落在各个块中的比例,以此得到整个聚类的 隶属度分布直方图,并将其映射为折线图; 步骤6):根据步骤1)得到的隶属度矩阵,计算两两聚类簇间的共存关系,并使用Radviz 维度锚点之间的弦线来表示相应聚类间的共存关系,弦线越粗、不透明度越高则表示以大 概率同时从属于这两个聚类簇的节点越多,反之则越少。2. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤1)包括以下步骤: 步骤1.1):根据模糊聚类算法的结果得到n个数据点被聚类成m类的隶属度矩阵M,其中 即矩阵的每一行表示一个数据点从属于各个聚类簇的隶属度 向量,矩阵的每一列表示一个聚类簇中所有的数据点从属于该聚类簇的隶属度向量; 步骤1.2):根据步骤1.1)得到的隶属度矩阵M,得到每个数据点从属于各个聚类簇的隶 属度向量¥,其中第1个数据点?1从属于各个聚类簇的隶属度向量记为¥1={¥1[1],1 [2],...,1[」],...,1[111]},其中0彡¥1[」]彡1; 步骤1.3):根据步骤1.1)得到的隶属度矩阵M,得到每个聚类簇中各个数据点从属于该 聚类簇的隶属度向量U,其中第j个聚类簇Q中各个数据点从属于该聚类簇的隶属度向量记 为Uj={Uj[l],Uj[2],? ? ?,Uj[i],? ? ?,Uj[n]},其中0彡Uj[i]彡 1; 步骤1.4):根据步骤1.1)得到的隶属度矩阵M和步骤1.2)得到的每个数据点从属于各 个聚类簇的隶属度向量V,计算出每个聚类簇的大小Size(C),其中聚类簇Q大小的计算公 式为:3126((:」)=(:011111:[1^=11^(^)],即判断聚类簇(:冲以最大隶属度从属于该聚类簇的 数据点的数目,其中Count[ ?]为计数函数,max( ?)为求最大值函数; 步骤1.5):根据步骤1.3)得到的每个聚类簇对应的隶属度向量U,计算出每个聚类簇的 权重Weight(C),其中聚类簇Cj的权重Weight(Cj)的计算公式为:即聚 类簇Cj对应的隶属度向量Uj中所有隶属度之和。3. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤2)中,首先通过以下方法计算聚类簇对两两之间的相似性:根据步骤1)得到的每个 聚类簇对应的隶属度向量U,计算任意两个聚类簇对应的隶属度向量U a,Ub之间的欧式距离 dis tan ceab:.,.其中,0 <a,b<m,令聚类簇对Ca和Cb之间的相似性Sab等于dis tan ceab; 然后,根据得到的聚类簇对两两之间的相似性和Radviz维度锚点的排布顺序t,计算出每个 Radv i z维度锚点在Radv i z圆周上的弧度,第j个维度锚点的弧度为其中,tj表示Radviz维度锚点的排布顺序中第j个维度锚点,*5^,表示Radviz维度锚点tj 和t(j+i)m〇d m对应的聚类簇和之间的相似性,(j+l)mod m表示对t(j+i)的下标(j+1) 进行取余操作;S为维度锚点排布序列t中任意两个相邻的维度锚点之间的相似性之和,即最后,计算出每个Radv i z维度锚点DA在Rad v i z圆周上的位置,第j个Radv i z维度锚点记 为DA(j),计算DA(j)在圆周上的坐标的公式为:,其中,DA(j)x* DA( j)的横坐标,DA( j )y*DA( j)的纵坐标,直角坐标系以Radviz圆周的圆心为原点,分别以 Radviz圆周两条相互垂直的直径所在直线为横轴和纵轴,R为Radviz圆周半径。4. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述的步骤3)中,Radviz内部的数据点使用圆点或饼图表示。5. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤3)中,在Radviz内部使用圆点表示数据点,并从步骤1)得到的每个数据点从属于各 个聚类簇的隶属度向量V中找到每个数据点的最大隶属度,根据最大隶属度对应的聚类簇 给圆点着色,根据最大隶属度的值设置圆点的不透明度。6. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤3)中,在Radviz内部使用饼图表示数据点,并从步骤1)得到的每个数据点从属于各 个聚类簇的隶属度向量V中找到每个数据点的第二大和第三大隶属度,饼图的颜色由第二 大和第三大隶属度对应的聚类簇共同确定,并根据第二大隶属度和第三大隶属度在这两个 隶属度之和中所占的比例确定两种颜色在饼图中所占的比例。7. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤4)包括以下步骤: 步骤4.1):根据步骤2)得到的Radviz维度锚点的排布顺序t和每个Radviz维度锚点在 Radviz圆周上的弧度,计算出每个维度锚点扩展为维度圆环的起始弧度和终止弧度,若 prim算法得到维度锚点排序为{. . .,a, j,b,. . .},则第j个聚类簇起始弧度StartAngle( j)、 终止弧度EndAngle( j)的计算公式为:步骤4.2):根据维度圆环对应的聚类簇给维度圆环进行着色; 步骤4.3):根据步骤1)得到的每个聚类簇大小5^6(〇或权重1^81^(〇给每个维度圆 环设置厚度,维度圆环厚度越大表示该聚类簇大小或权重越大,反之越小。8. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤5)包括以下步骤: 步骤5.1):将隶属度取值范围[0,1 ]划分为50个等分的块; 步骤5.2):根据步骤1)得到的隶属度矩阵M,统计各个聚类簇对应的隶属度中取值落在 各个块中的数量,计算出每个聚类簇对应的隶属度在各个块中的比例,以此得到整个聚类 的隶属度分布直方图,横轴为隶属度范围,纵轴为落在相应隶属度区间的数据点比例; 步骤5.3):将步骤5.2)得到的隶属度分布直方图映射为折线图,横轴为隶属度区间范 围,纵轴为落在相应隶属度区间的数据点比例。9. 根据权利要求1所述的一种基于Radviz的模糊聚类结果可视化方法,其特征在于,所 述步骤6)中,计算两两聚类簇间的共存关系计算方法为: 根据步骤1)得到的每个数据点的隶属度向量Vi,计算出任意两个聚类簇C」、Ck之间的共 存关系1^]^1:;[〇11((^,〇1〇,其计算公式为:表示所有以最大隶属度从属于Cj聚类簇的数据点从属于聚类ck的隶属度累加和, 表示所有以最大隶属度从属于&聚类簇的数据点从属于聚类Cj的隶属度累加和,所以两个 聚类簇Cj、Ck间的共存关系Relation(Cj,Ck)表示以最大隶属度从属于聚类Cj/Ck的节点同时 从属于聚类Ck/Cj的隶属度之和。
【文档编号】G06K9/62GK106055580SQ201610341872
【公开日】2016年10月26日
【申请日】2016年5月23日
【发明人】周芳芳, 陈明慧, 黄伟, 赵颖, 钟增胜, 李俊材
【申请人】中南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1