针对具有多维属性的层次结构数据的可视化方法和应用

文档序号:9646576阅读:580来源:国知局
针对具有多维属性的层次结构数据的可视化方法和应用
【技术领域】
[0001] 本发明属于信息可视化领域,具体涉及一种针对具有多维属性的层次结构数据的 可视化方法和应用。
【背景技术】
[0002] 随着数据采集技术的革新与进步,经济社会各领域获得的数据体量和复杂性不断 激增,为数据分析提出了极大的挑战。信息可视化与可视分析作为一种大数据分析的有效 方法已逐渐显示出其强大的生命力。在可视分析领域中,分析研究的数据对象通常包括具 有多维属性的多维数据、具有层次结构的层次数据、具有网络关系的网络数据和具有时间 空间特征的时空数据等等,针对这些类型的数据,人们也提出了相应的可视化方法。
[0003] 层次数据的可视化算法主要有结点-链接法和空间填充法2种。结点-链接法采 用不同形状的点表示对象(内容信息),点之间的连线表示对象间的关系(结构信息)。其 优点为就是层次结构表现清晰,但其缺点为空间利用率低,展现层次和节点数目有限,通常 不能表现属性值的大小等。空间填充法则利用空间嵌套形式表示层次结构,利用多边形面 积表示对象属性值的大小。其优点是空间利用率高,展现的层次和节点数较节点-链接法 多,且可展现节点权值的大小;其缺点是层次结构展现没有节点-链接法清晰。多维数据 的可视化方法主要有散点图、散点图矩阵、平行坐标、雷达图、堆叠图等,其目的将多维数据 从抽象的高维空间上映射到可视的二维或三维空间上,便于人们理解数据和发现其中的信 息。
[0004] 而在实际应用领域中,数据的组成不断趋于复杂,大部分数据不仅仅具有单一的 数据特征,而是同时具有多种数据特征,本文称其为复杂数据,如农药残留侦测数据、股票 数据和网络安全数据就都具有多种数据特征。对于这类复杂数据,现有针对单一数据特征 的可视化和可视分析方法已不能满足对其分析的需求,一般采用由2种或以上的可视化方 法结合而成,例如Newsmap、ElasticHierarchies和TreemapBar等。
[0005] 树图是一种典型的层次数据可视化方法之一,近年来人们对其布局算法进行了大 量研究。Johnson等于1991年提出了一种树图布局算法,命名为SliceandDice。该布局算 法容易出现长宽比恶劣(长宽比与1相差很多)的矩形,导致矩形难以识别,不利于交互, 影响算法可应用的范围。Bruls等针对该缺点于1999年提出了Squarified布局算法,确保 填充的矩形更接近正方形,易于人眼对矩形的识别。为了使无序的Squarified布局算法部 分有序,陈谊等于2013年提出一种分块排序的正方化树图布局算法。Shneiderman等采用 轴的思想于2001年提出了Pivot布局算法,Bederson等于2002年提出了以带状形式进行 矩形填充的Strip算法,Tu等于2007年提出了以螺旋状进行矩形填充的Spiral算法。这 3种算法在保证树图布局矩形的平均长宽比的情况下,追求更高的连续性和可读性。针对 具有地理位置属性的特殊层次结构的数据,Wood等于2008年提出了Ordered-Squarified 和SpatiallyOrdered2种算法。胡海云等于2014年针对结点权值值差异大的层次数据, 提出了一种有序的正方化树图布局算法S0TLA,在保证平均长宽比的情况下兼顾了连续性。 Thomas等于2012年将树图布局算法的决定因素归纳为Order、Size、Chunk、Recurse和Phrase,用户可以通过对该5项属性的自定义设置可以实现不同形式的树图布局。
[0006] TimeWheel由Tominski等提出,将6个属性轴以六边形的形式围绕时间轴,以不同 的颜色连线代表不同的属性与时间轴的映射关系。Jarry等人提出一种灵活连接坐标。通 过改造平行坐标的轴,可帮助用户自定义不同的形状的坐标轴表示不同属性。
[0007] 树图布局算法可以很好地应用于层次数据的可视分析。对于较为复杂的数据,单 一的树图布局无法满足其所有属性可视化的需求。选用混合布局算法将能实现可视化算法 之间的互补,更好地显示数据的复杂特征。根据树图布局的矩形布局特点,结点通过与结点 链接、标签云和柱状图等可视化方法相结合,可以形成新的混合布局算法。

【发明内容】

[0008] 为了克服上述现有技术的不足,本发明提供一种树图中的多维坐标布局算法 MCT (Multi-Coordinates Treemap),该算法将平行坐标的思想应用于树图布局之中,充分 结合树图布局矩形填充的特点,利用有限的可视化空间,同时展示数据的层次结构和多维 属性信息,帮助领域可视分析。
[0009] 本发明提供的技术方案是:
[0010] -种针对具有多维属性的层次结构数据的可视化方法,所述方法是一种树图中的 多维坐标布局方法,针对层次结构中多维属性数据,选择一组通过层次结构关系互相关联 的四维属性数据作为待显示的数据集,将平行坐标的思想结合树图布局矩形填充方法,利 用有限的可视化空间同时展示数据的层次结构和多维属性信息;针对待显示的数据集进行 可视化的操作步骤如下:
[0011] A,通过树图布局方法,将待显示的数据集中的每个数据结点表示为一个矩形,矩 形的四条边分别用于表示待显示的数据集中的每个数据结点的四维属性;
[0012] B,以矩形的最上边开始以顺时针方向依次排列属性一至属性四,可通过设置刻度 缩进q,使得数据结点的每个属性的属性值根据从小到大的方向分别为从左至右或从上至 下排列在矩形的四条边,从而实现四维属性从平行坐标到多维坐标的映射;
[0013]C,利用基数样条曲线方法进行属性连接,通过收缩系数r和张力系数g将直线优 化为中间收缩的曲线,从而得到待显示的数据集的四维属性数据的多维坐标布局。
[0014] 上述针对具有多维属性的层次结构数据的可视化方法中,步骤A所述树图布局方 法为Squarifeid方法或Strip方法。
[0015] 上述针对具有多维属性的层次结构数据的可视化方法中,步骤B所述数据结点的 每个属性的属性值分为连续属性值和离散属性值;所述属性值根据从小到大的方向分别为 从左至右或从上至下排列在矩形的四条边,包括连续属性值和离散属性值排列方法;具体 为:
[0016] 情况1 :连续属性值的映射;
[0017] Bl. a :根据属性值的最小值Mn和最大值^确定矩形中属性值在该矩形边上的映射 位置;
[0018] Bl. b :设定位置PjP Px分别对应属性值的最小值Μ"和最大值Μ x;
[0019]Bl. c :属性值为Va的点在矩形边上的对应位置Pa可根据公式1计算得到:
[0021] Bl.d:当相邻属性分别为属性值的最大值和最小值时,若直接将矩形边的两端设 为^和Px,若连线与矩形边重叠,属性值的点处于矩形两条边相交的顶点处,会影响该点的 归属判定,则步骤Bl.b对边的有效位置进行重新设定,具体为:
[0022] 采取百分比缩进的方法重新设定矩形边位置^和?.,为每一条的两端留出空白位 置,作为临界区域不进行使用;所述百分比缩进的方法是:设属性映射的矩形边长为L,缩 进百分比为q,^和Px的取值分别通过公式2和公式3计算得到:
[0024]Px=LX(l-q/2)(式 3)
[0025] 情况2 :离散属性值的映射:
[0026]B2.a:设A属性具有离散值X{Xl,x2,……,xj,总计共有s个值,计算其去重后的 离散值为Y{y:,y2,......,yj,共计u个;
[0027]B2.b:设属性对应的矩形边边长为L,则计算两个离散属性值之间的间隔距离为d =L/u;
[0028]B2.c:设定每个离散属性值在矩形边的开始端位置为D{d/2,d/2+d,…… ,d/2+(u_l)d},分别对应属性值y2,......,yj;
[0029]B2.d:为了防止某一离散刻度上的线过于密集,对不同属性值对应的相同的离散 刻度进行位置偏移;首先通过c=d/s计算得到每个点位移的位置;然后,具有相同离散值 的点在矩形边上的位置是以D[i]为中心,按照顺序依次从左向右或从上至下进行位置映 射。
[0030] 上述针对具有多维属性的层次结构数据的可视化方法中,步骤C所述通过基数样 条曲线方法进行属性连接,将直线优化为中间收缩的曲线,具体包括如下步骤:
[0031]C1:取矩形的最上边和最右边的属性之间的连接线,设最上边的属性的最小值和 最大值坐标分别对应Pln和Plx,设最右边的属性的最小值和最大值坐标分别对应P2n和P2x。 则4个点形成的不规则四边形为PlnPlxP2xP2n;
[0032]C2:取PlnP2x和PlxP2n的中点Μ3和Mb,根据用户设定的收缩系数r,以仏和Mb的中 点对线段MaMb进行长度的收缩,使得式4成立:
[0033]M、-M、=(Mb-Ma)Xr (式 4)
[0034] 式4中,Ma'与Mb'为收缩后的对应仏和Mb的点;
[0035]C3:与属性i和属性i+1相对应的两点Ple和Pu+&分别与P2x与Plx存在连线,假 设这两条连线与线段MaMb的交点为a、b,经过缩放系数r改变后的交点位置为a'、b',则a'、 b'通过式5和式6计算得到:
[0038] 通过式5和式6分别确定好a'、b'点的位置后,根据基数样条函数过点PdPP2x 画曲线PiA,过点Plx和P 画曲线PΙχΡ(i+l)e,
[0039]C4:步骤C3所述曲线是由两个曲线顶点和基础函数组所确定,具体过程如下:
[0040] 用于计算的点包括曲线顶点Pa、Pb,两个张力相关的变量TdPT2,其中
[0042] 式7中,ge(〇, 1)为用户设定的张力系数;当Ρι+1或Pii不存在时,设定其值等于 〇 ;
[0043] C5 :1\和T2分别作用于点P3和PJ:;基础函数组为式8 :
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1