对聚类分析结果进行可视化的方法

文档序号:6603720阅读:1788来源:国知局

专利名称::对聚类分析结果进行可视化的方法
技术领域
:本发明属于计算机信息处理
技术领域
,涉及到一种对聚类分析结果进行可视化的方法。
背景技术
:聚类分析是数据挖掘、知识发现的重要手段,可以从海量的数据集合中抽取隐含的、先前未知的、对决策有潜在价值的信息。目前,对大量数据信息进行聚类分析的一般过程如下所述首先,确定要进行聚类分析的数据信息范围;然后,选择合适的聚类分析算法,对数据信息进行聚类分析处理;最后,将聚类分析结果以恰当的形式进行展现。用可视化的方法对聚类结果进行表示,能很好地利用人们对可视化模型和结构的直观理解力,解决信息量大、无法快速和有效交流的问题,同时可视化技术可帮助观察、筛选、发现和理解信息,发现隐藏在数据和信息背后的知识。目前,对聚类分析结果进行可视化多采用饼图、柱状、导航式的树型结构标签等形式来表现聚类分析结果,但是这些表现形式往往只能反映聚类结果中类与类之间的数量关系、类内成员的比例关系以及隶属关系等。专利200710142715.0提出的结构化数据的聚类实现了类别与类成员关系的可视化表达,不能反映类成员之间的语义关系;专利200610001267.8提出用于增强搜索结果导航的可视化方法及设备,该方法中涉及到对聚类信息的可视化,但其主要针对将可视化聚类信息与搜索结果相联动,并没有涉及聚类语义信息中的可视化;专利200810108432.9和200710160532.1提出的可视化方法主要针对层次化信息的可视化表现,未涉及到信息本身之间相似关系的可视化表达;许翔燕等人发表的“聚类结果可视化研究”一文,提出了几种对聚类结果的可视化方法,但是可视化表现中缺乏语义信息。由于丢失了文本及其之间的语义信息,所以这类可视化表示方法不能进一步利用成员的内容信息反映语义关系,增加了对聚类分析结果理解的困难,也很难表达更全面的信息和隐含在数据信息中较复杂的知识结构。本发明利用吴江宁、田海燕所发表的“基于主题地图的文献组织方法研究”(吴江宁、田海燕,《情报学报》第26卷第3期,P323-331,2007年6月)中所提出“基于主题地图的多层文献组织模型方法”,构建聚类分析结果的主题层次逻辑。首先,利用多阶段层次聚类算法进行聚类;然后,确定类别(主题)及其所处的层次。
发明内容基于上述现存技术中存在的问题,其提供了一种适用于对聚类分析结果进行可视化的方法,可以反映聚类分析结果的特点又能反映数据信息之间的语义相似程度,以帮助用户迅速地理解聚类分析结果,发现其中隐含的模式和知识;并将具有层次的可视化聚类分析结果主题图与数据信息联动地显示,帮助用户迅速、准确地找到所需要的信息。本发明所述方法的步骤如下(1)构建主题层次逻辑利用吴江宁、田海燕所发表的“基于主题地图的文献组织方法研究”中所提出“基于主题地图的多层文献组织模型方法”,构建聚类分析结果的主题层次逻辑。首先,利用多阶段层次聚类算法进行聚类;然后,确定类别(主题)及其所处的层次;最后,根据聚类结果建立类别(主题)及其之间的关联以及数据信息对象及其之间的关系,从而形成树状结构主题层次逻辑。其中,当聚类分析结果中不存在层次关系时,将聚类分析结果中的类别和数据信息对象作为层次,构建两层主题层次逻辑。该步骤也可以使用其他方法构建主题层次逻辑,但其特点要求是既要能清楚反映数据信息对象的聚类结果,又能清楚反映聚类类别间的结构关系及其关联、数据信息对象间的语义相似程度。构建主题层次逻辑的目的是将根据类别涵盖范围的不同将类别划分为多个层次,并对各层类别建立关联,通过多层次类别之间以及类别与数据信息对象、数据信息对象之间的关联体现聚类分析结果的特点及数据信息之间的语义关系。(2)根据设计的布局模型和布局算法对主题层次进行抽象布局聚类分析结果的主题层次涉及两类对象虚拟类别对象和类成员对象。它们也是抽象布局所处理的对象。布局模型包括模拟所有对象之间语义相似关系的力模型,以及评判布局效果的能量评估模型。在此基础上使用布局算法进行抽象布局。1)力模型包括弹簧力模型和电子力模型弹簧力模型将两个对象控制在代表其语义相似程度的理想距离附近,适用于存在语义关系的对象。该模型中的弹簧力分为以下四种Fs(1):同一层次中类质心之间的力;质心和子结点之间的力,即各类的质心与该类内的结点之间的相互作用力;同一类中结点之间的力。结点与其他质心之间的力,该力最弱。弹簧力计算公式为Fs(a,b)=k_a'b=-Fs(b,a)(0<ks(i)<1,i=1,2,3,4)d{a,b)其中,ks(i)是弹簧系数,代表对象间的关系类型对力的影响程度,比如,对象是同一类时ks则大,对象属于不同类时ks则小;d(a,b)是对象a,b之间的可视化距离;la,b是a,b之间的理想距离,它是a,b之间的相似度sim(a,b)、调节参数a,3的函数。iab=a*e-(彻(a’6)*妁2a,0是可调参数。其中,a用来根据a,b所处的层次调整标准距离,0用来根据a,b间力的种类加强相似度到距离转换的区分。一般情况下,当a,b间的力是Fs(1)并且层次越高时,由于sim(a,b)较小,映射后的距离区分度不大,可通过提高0的值来增强距离的区分;同时由于该层次对象之间的语义关系弱于低层次,所以a值相应增大可得到比较大的标准距离。电子力模型使得对象相互排斥,避免重叠,起到辅助布局的作用。计算公式为Fe(a,b)=Kq"qt=-Fe(b,a)(a(a,b))其中,d(a,b)是对象a,b之间的可视化距离;qa和qb是两个常量;ke是电子斥力系数,代表对象间的关系类型对力的影响程度,比如,同一类中对象间的排斥力比不同类中对象间的排斥力要小,相应的也小。2)能量评估模型每种布局都是聚类分析结果映射到二维或三维空间中的映射函数p,使用能量评估函数E评价各种映射函数p的布局效果。布局中的对象在力的作用下向理想的位置移动,在整个布局系统中产生能量E(p),形成不稳定状态;对象通过移动不断被布局在理想位置附近,系统的能量E(p)也逐渐变小,布局效果不断优化;当E(p)达到全局最小时,映射函数p将得到最优的布局效果。所以,能量评估模型定义如下其中,v。是对象o在力的作用下运动的速度,<是对象o的能量。3)布局算法布局算法通过对象间的理想距离和可视化距离计算施加在对象之间的力,根据力的大小和布局能量对布局进行调整,最终达到最优的布局效果。布局算法主要步骤描述如下Stepl随机初始化布局和能量阈值e;St印2对于每个点a今计算a与其存在语义关系的点间的弹簧力的和Fs(a)=EFs(a,b);今计算a与所有其他点间的电子力之和Fe(a)=EFe(a,b);今计算a受到的力的总和:F(a)=Fs(a)+Fe(a);今根据受到的力与平衡关系,计算a的新位置;St印3对布局系统进行能量评估E(p);St印4如果E(p)<0,得到布局结果,布局完成;否则执行St印5;St印5:根据所有点的新位置,更新布局。然后返回St印2。(3)利用等值线生成算法构建等值线形式的聚类分析结果主题层次图使用等值线的形式构建层次性主题图,分区域、分层次地表现聚类分析结果中数据信息的聚集情况,反映数据信息间的语义相似关系。其步骤为对二维平面布局后的类成员应用设计的山峰模型生成高度,用叠加的山峰高度反映类成员的疏密分布;对叠加高度的山峰进行使用等值线生成算法生成等值线,进而构建具有等值线效果的主题层次图可视化表现形式。1)山峰模型的构建公式为其中,(x0,y0)是类内成员对象布局中的坐标,z(x,y)表示受(X(l,y0)处山峰模型的影响,(x,y)处所形成的高度值,\控制山峰的高度,9控制山峰的影响范围的大小。其他可以生成“山峰”形状的函数亦可以作为山峰模型的函数,如球形函数、椭球函数或墨西哥帽函数等。2)等值线生成算法对叠加高度的山峰进行等值切剖、投影生成等值线,然后根据一定的梯度进行区域着色,进而构建具有等值线效果的主题图可视化表现形式。等值切剖使用特定高度的平面切剖山峰形成截面,核心是寻找等值点。该方法利用插值法计算等值点其中,(X,Y)是特定高度Z的点的坐标,已知(Xl,Y1)和(x2,y2)的高度分别是Z1和z2。两个等值点的连线就是一条等值线片段。投影将不同高度的山峰截面垂直映射到二维布局平面上,核心是等值线追踪,即对不同高度的等值点所构成的等值线片段进行追踪则可连接成一个整体,或为封闭等值线亦或为非封闭等值线。等值线追踪算法描述输入网格点高度值集,特定高度序列;输出等值线集序列;对于每一特定高度Stepl等值线段首尾相接构成等值线片段;Step2如果存在等值线片段,继续;否则输出等值线集序列;St印3如果等值线片段首尾端点不同,继续;否则转St印7;St印4等值线片段首尾相接;St印5如果端点不是边界点,转St印3,否则转St印6;St印6生成边界等值线,转St印8;St印7生成封闭等值线,转St印8;StepS剔除连接所用的等值线片段,转St印2。本发明提供的可视化方法能够充分表现聚类结果中数据信息对象间的语义相似关系,提高聚类分析结果表达的直观性和可理解性,有利于发现其中的新模式、新知识。附图1是利用聚类分析结果中的层次特点以及对象间的语义相似程度相结合而构建主题层次逻辑示意图。附图2是力模型示意图。附图3是布局流程示意图。附图4是山峰模型示意图。附图5是对聚类分析结果进行可视化后的效果示意图。具体实施例方式以下结合技术方案和附图详细叙述本发明的具体实施例。步骤1构建主题层次逻辑应用基于主题地图的多层文献组织模型方法,构建聚类分析结果的主题层次逻辑。(如图1所示)。步骤2:构建力模型根据聚类分析结果中主题层次逻辑,分析其中的力模型并进行构建。1)弹簧力Fs(1)同一层次中类质心之间的力,如图2中的虚线所示。Fy2)质心和子结点之间的力,如图2中的点划线所示。Fs(3)同一类中结点之间的力,如图2中的实线所示。Fsw结点与其他质心之间的力,该力最弱,如图2中的粗短线所示。任何两个存在语义关系的对象(质心/文本)间的弹簧力计算公式为a,b之间的理想距离la,b为2)电子力适用于所有的对象。任何两个对象(质心/文本)之间的电子力计算公式步骤3构建能量评估模型每种布局都是聚类分析结果映射到二维或三维空间中的映射函数p,使用能量评估函数E评价各种映射函数ρ的布局效果。能量评估函数E(p)定义如下其中,V0是对象ο在力的作用下运动的速度,V〗是对象ο的能量。步骤4进行布局在对聚类分析结果的主题层次构建力模型和能量评估模型的基础上,应用设计的布局算法进行抽象布局,反映聚类分析结果中数据信息对象之间的语义相似关系。布局算法主要步骤描述如下Stepl随机初始化布局和能量阈值θ;St印2对于每个点a今计算a与其存在语义关系的点间的弹簧力的和Fs(a)=ΣFs(a,b);今计算a与所有其他点间的电子力之和Fe(a)=ΣFe(a,b);今计算a受到的力的总和=F(a)=Fs(a)+Fe(a);今根据受到的力与平衡关系,计算a的新位置;St印3对布局系统进行能量评估E(p);St印4如果Ε(ρ)<θ,得到布局结果,布局完成;否则执行St印5;St印5:根据所有点的新位置,更新布局。然后返回St印2。步骤5:构建山峰模型布局中的每一个类内成员对象表示为一个小山峰,示意图见图4。如果在一个小的区域内类内成员对象相互聚集,重叠的山峰和高度将进行叠加,构成更大和更高的结构-山脉-类内成员对象的主题。山峰模型的构建公式为z(、沪((^O)2+(少-KJ)2)(λ>0,θ>0)其中,(x0,y0)是类内成员对象布局中的坐标,z(x,y)表示受(X(l,y0)处山峰模型的影响,(x,y)处所形成的高度值,λ控制山峰的高度,θ控制山峰的影响范围的大小。步骤6:生成等值线本发明方法的等值线生成算法为四部高度值构建、等值点计算、等值线追踪和等值线区域着色。1)高度值构建可视化视野由许多网格组成的,根据类内成员对象在可视化视野中的布局和山峰模型的思想,将叠加的高度值赋予相关的网格上的点,这样就构建了反映类内成员对象布局特征的高度值。2)等值点计算特定高度的点构成了等值线,然而网格中的点是离散的数据点,具有离散的高度,该方法利用插值法计算等值点其中,(X,Y)是特定高度Z的点的坐标,已知(X1,Y1)和(x2,J2)的高度分别是Z1和z2。两个等值点的连线就是一条等值线片段。3)等值线追踪对不同高度的等值点所构成的等值线片段进行追踪则可连接成一个整体。根据等值线的构成不同,该方法将其分为封闭等值线和非封闭等值线,并提出如下等值线追踪算法描述输入网格点高度值集,特定高度序列输出等值线集序列对于每一特定高度Stepl等值线段首尾相接构成等值线片段;Step2如果存在等值线片段,继续;否则输出等值线集序列;Step3如果等值线片段首尾端点不同,继续;否则转St印7;Step4等值线片段首尾相接;Step5如果端点不是边界点,转St印3,否则转St印6;Step6生成边界等值线,转St印8;Step7生成封闭等值线,转St印8;StepS剔除连接所用的等值线片段,转St印2。4)等值线区域着色对生成的等值线图区域,根据一定的梯度进行着色,构建具有层次的可视化主题图。图5显示了应用本发明方法的一个实例图。其中每个节代表一篇专利文本,而点之间的距离表示了全局中两点之间的语义相似程度。相似度大的文本点之间距离小,反之距离大。图5明显地由5个山峰(Cluster_l,Cluster_2,Cluster_3,Cluster_4,Cluster_6)组成,构成5个主题,反映了聚类分析结果中的5个类别。Cluster_5形成的山峰不明显,和Cluster_4基本在一个山脉中,说明Cluster_5和Cluster_4的语义相似程度较大,是Cluster_4主题中的外围专利主题类。这是在其他非可视化的聚类分析结果表达中无法得到的隐含模式。以上结合具体实施例对本发明所涉及的对聚类分析结果进行可视化的方法进行了详尽的描述,但本发明并不限于此,本领域的相关研究人员和技术人员在对本发明思想的理解下,可根据实际问题对相关参数进行修改和替换;本发明的保护范围由所附权利要求进行限定。本发明的可视化方法可以应用于任何聚类分析的场合,尤其是对大量文本信息进行聚类分析的情况下。通过该可视化方法,聚类分析结果中对象之间的语义相似关系通过直观的平面距离得到很好的体现,类别(主题)和数据信息对象的疏密分布及其聚集情况也能够清晰的表达出来。权利要求一种对聚类分析结果进行可视化的方法,其特征在于包括如下步骤(1)构建聚类分析结果的主题层次逻辑首先,利用多阶段层次聚类算法进行聚类;然后,确定类别主题及其所处的层次;最后,根据聚类结果建立类别主题及其之间的关联以及数据信息对象及其之间的关系,从而形成树状结构主题层次逻辑;其中,当聚类分析结果中不存在层次关系时,将聚类分析结果中的类别和数据信息对象作为层次,构建两层主题层次逻辑;(2)设计的布局模型和布局算法对主题层次进行抽象布局聚类分析结果的主题层次涉及两类对象虚拟类别对象和类成员对象,它们也是抽象布局所处理的对象;布局模型包括模拟所有对象之间语义相似关系的力模型和评判布局效果的能量评估模型,并在此基础上使用布局算法进行抽象布局;1)力模型包括弹簧力模型和电子力模型弹簧力模型将两个对象控制在代表其语义相似程度的理想距离附近,适用于存在语义关系的对象;该模型中的弹簧力分为以下四种Fs(1)同一层次中类质心之间的力;Fs(2)质心和子结点之间的力,即各类的质心与该类内的结点之间的相互作用力;Fs(3)同一类中结点之间的力;Fs(4)结点与其他质心之间的力,该力最弱;弹簧力计算公式为<mrow><msub><mi>F</mi><mi>s</mi></msub><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>k</mi><mrow><mi>s</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></msub><mfrac><mrow><mi>d</mi><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>l</mi><mrow><mi>a</mi><mo>,</mo><mi>b</mi></mrow></msub></mrow><mrow><mi>d</mi><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mo>-</mo><msub><mi>F</mi><mi>s</mi></msub><mrow><mo>(</mo><mi>b</mi><mo>,</mo><mi>a</mi><mo>)</mo></mrow></mrow>(0<ks(i)<1,i=1,2,3,4)其中,ks(i)是弹簧系数,代表对象间的关系类型对力的影响程度,比如,对象是同一类时ks则大,对象属于不同类时ks则小;d(a,b)是对象a,b之间的可视化距离;la,b是a,b之间的理想距离,它是a,b之间的相似度sim(a,b)、调节参数α,β的函数;<mrow><mi>E</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mi>o</mi></munder><msubsup><mi>v</mi><mi>o</mi><mn>2</mn></msubsup></mrow><mrow><msub><mi>l</mi><mrow><mi>a</mi><mo>,</mo><mi>b</mi></mrow></msub><mo>=</mo><mi>a</mi><mo>*</mo><msup><mi>e</mi><mrow><mo>-</mo><msup><mrow><mo>(</mo><mi>sim</mi><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>*</mo><mi>&beta;</mi><mo>)</mo></mrow><mn>2</mn></msup></mrow></msup></mrow>α,β是可调参数;其中,α用来根据a,b所处的层次调整标准距离,β用来根据a,b间力的种类加强相似度到距离转换的区分;一般情况下,当a,b间的力是Fs(1)并且层次越高时,由于sim(a,b)较小,映射后的距离区分度不大,可通过提高β的值来增强距离的区分;同时由于该层次对象之间的语义关系弱于低层次,所以α值相应增大可得到比较大的标准距离;电子力模型使得对象相互排斥,避免重叠,起到辅助布局的作用;计算公式为<mrow><msub><mi>F</mi><mi>e</mi></msub><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>k</mi><mi>e</mi></msub><mfrac><mrow><msub><mi>q</mi><mi>a</mi></msub><msub><mi>q</mi><mi>b</mi></msub></mrow><msup><mrow><mo>(</mo><mi>d</mi><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></mfrac><mo>=</mo><mo>-</mo><msub><mi>F</mi><mi>e</mi></msub><mrow><mo>(</mo><mi>b</mi><mo>,</mo><mi>a</mi><mo>)</mo></mrow></mrow>其中,d(a,b)是对象a,b之间的可视化距离;qa和qb是两个常量;ke是电子斥力系数,代表对象间的关系类型对力的影响程度,比如,同一类中对象间的排斥力比不同类中对象间的排斥力要小,相应的ke也小;2)能量评估模型每种布局都是聚类分析结果映射到二维或三维空间中的映射函数p,使用能量评估函数E评价各种映射函数p的布局效果;布局中的对象在力的作用下向理想的位置移动,在整个布局系统中产生能量E(p),形成不稳定状态;对象通过移动不断被布局在理想位置附近,系统的能量E(p)也逐渐变小,布局效果不断优化;当E(p)达到全局最小时,映射函数p将得到最优的布局效果;所以,能量评估模型定义如下其中,vo是对象o在力的作用下运动的速度,是对象o的能量;3)布局算法布局算法通过对象间的理想距离和可视化距离计算施加在对象之间的力,根据力的大小和布局能量对布局进行调整,最终达到最优的布局效果;布局算法主要步骤描述如下Step1随机初始化布局和能量阈值θ;Step2对于每个点a计算a与其存在语义关系的点间的弹簧力的和Fs(a)=∑Fs(a,b);计算a与所有其他点间的电子力之和Fe(a)=∑Fe(a,b);计算a受到的力的总和F(a)=Fs(a)+Fe(a);根据受到的力与平衡关系,计算a的新位置;Step3对布局系统进行能量评估E(p);Step4如果E(p)<θ,得到布局结果,布局完成;否则执行Step5;Step5根据所有点的新位置,更新布局;然后返回Step2;(3)利用等值线生成算法构建等值线形式的聚类分析结果主题层次图使用等值线的形式构建层次性主题图,分区域、分层次地表现聚类分析结果中数据信息的聚集情况,反映数据信息间的语义相似关系;其步骤为对二维平面布局后的类成员应用设计的山峰模型生成高度,用叠加的山峰高度反映类成员的疏密分布;对叠加高度的山峰进行使用等值线生成算法生成等值线,进而构建具有等值线效果的主题层次图可视化表现形式;1)山峰模型的构建公式为<mrow><msub><mi>z</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></msub><mo>=</mo><mi>&lambda;</mi><mo>*</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>&theta;</mi><mo>*</mo><mrow><mo>(</mo><msup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><msub><mi>x</mi><mn>0</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>y</mi><mo>-</mo><msub><mi>y</mi><mn>0</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow></mrow></msup></mrow>(λ>0,θ>0)其中,(x0,y0)是类内成员对象布局中的坐标,z(x,y)表示受(x0,y0)处山峰模型的影响,(x,y)处所形成的高度值,λ控制山峰的高度,θ控制山峰的影响范围的大小;2)等值线生成算法对叠加高度的山峰进行等值切剖、投影生成等值线,然后根据一定的梯度进行区域着色,进而构建具有等值线效果的主题图可视化表现形式;等值切剖使用特定高度的平面切剖山峰形成截面,核心是寻找等值点;该方法利用插值法计算等值点<mfencedopen='{'close=''><mtable><mtr><mtd><mi>X</mi><mo>=</mo><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><mfrac><mrow><mi>Z</mi><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mrow><mrow><msub><mi>z</mi><mn>2</mn></msub><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mrow></mfrac><mrow><mo>(</mo><msub><mi>x</mi><mn>2</mn></msub><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mi>Y</mi><mo>=</mo><msub><mi>y</mi><mn>1</mn></msub><mo>+</mo><mfrac><mrow><mi>Z</mi><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mrow><mrow><msub><mi>z</mi><mn>2</mn></msub><mo>-</mo><msub><mi>z</mi><mn>1</mn></msub></mrow></mfrac><mrow><mo>(</mo><msub><mi>y</mi><mn>2</mn></msub><mo>-</mo><msub><mi>y</mi><mn>1</mn></msub><mo>)</mo></mrow></mtd></mtr></mtable></mfenced>(z1≤z0≤z2)其中,(X,Y)是特定高度Z的点的坐标,已知(x1,y1)和(x2,y2)的高度分别是z1和z2;两个等值点的连线就是一条等值线片段;投影将不同高度的山峰截面垂直映射到二维布局平面上,核心是等值线追踪,即对不同高度的等值点所构成的等值线片段进行追踪则可连接成一个整体,或为封闭等值线亦或为非封闭等值线;等值线追踪算法描述输入网格点高度值集,特定高度序列;输出等值线集序列;对于每一特定高度Step1等值线段首尾相接构成等值线片段;Step2如果存在等值线片段,继续;否则输出等值线集序列;Step3如果等值线片段首尾端点不同,继续;否则转Step7;Step4等值线片段首尾相接;Step5如果端点不是边界点,转Step3,否则转Step6;Step6生成边界等值线,转Step8;Step7生成封闭等值线,转Step8;Step8剔除连接所用的等值线片段,转Step2。FSA00000132770100031.tif,FSA00000132770100032.tif,FSA00000132770100033.tif,FSA00000132770100034.tif,FSA00000132770100035.tif2.根据权利要求1所述的对聚类分析结果进行可视化的方法,其特征还在于,利用“基于主题地图的多层文献组织模型方法”构建聚类分析结果的主题层次逻辑。3.根据权利要求1或2所述的对聚类分析结果进行可视化的方法,其特征还在于,所述的山峰模型的函数可为球形函数、椭球函数或墨西哥帽函数,其他生成“山峰”形状的函数作为山峰模型的函数。全文摘要本发明涉及一种对聚类分析结果进行可视化的方法,属于计算机信息处理
技术领域
。该方法利用聚类分析结果的特点和数据信息对象间的语义相似关系,根据聚类分析结果中的类间、类成员间、以及类与成员间的信息设计平面布局方法,并根据平面布局数据自动生成直观的、具有层次信息的可视化主题图。本发明提供的可视化方法能够充分表现聚类结果中类内成员对象间的语义相似关系,提高聚类分析结果表达的直观性和可理解性,有利于发现其中的新模式、新知识。文档编号G06F17/30GK101859324SQ20101019439公开日2010年10月13日申请日期2010年6月3日优先权日2010年6月3日发明者吴江宁,宣照国,王桂才,马凤闸申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1