一种针对非连续层次数据的可视化方法和应用

文档序号:9597861阅读:589来源:国知局
一种针对非连续层次数据的可视化方法和应用
【技术领域】
[0001] 本发明属于信息可视化领域,具体涉及一种基于ThemeRiver模型的非连续层次 数据的可视化方法和应用。
【背景技术】
[0002] 随着社会的飞速发展,各种社会生活问题也随之暴露出来。大数据时代,现代化的 手段如数据挖掘,机器学习等,将数据分析技术与先进的信息可视化技术相结合,可帮助人 们掌握并分析领域内相关数据。
[0003] 大规模层次数据可视化是现今的一大热点,通常情况下,此类数据同时还具有时 间属性。如何在保持层次结构清晰展现的基础上,将时变特征表现出来是现今的一大挑战。 展示层次数据的可视化方法主要有结点-链接法和空间填充法。其中,结点-链接法主要 通过线段和结点连接的方式展现层次结构特性,优点是展现层次关系清晰明了,但是空间 浪费严重。此外,当数量太大时,由于屏幕空间不足,十分容易出现结点重叠的现象。空间 填充法的典型代表是Treemap方法,Treemap能够最大限度的利用空间,同时能够通过面积 显示数据的属性值,但是在展现层次结构方面不如结点链接法直观。无论是结点链接法还 是空间填充法,都很难在时间序列上合理的布局展示。
[0004] ThemeRiver模型是一种典型的处理时序数据的可视化的结构样式,它能够将得 到的大量时序数据集合在一起,按时间顺序构造一个类似"河流"的可视化显示方式,通过 河流的流动趋势和涌流(current)的坡度可以反映主题强度信息随时间的变化情况,这种 方式能够解决大规模数据的时序特性,且无论主题如何变化,其走向总是清晰可见,一目了 然。但主题河流能够展示的信息过于单一,通常无法展现数据的层次特性,难以展示具体细 节信息。因此,针对具有时间属性的大规模层次数据,现有可视化方法难以实现同时表示数 据的层次结构和时序特征。

【发明内容】

[0005] 为了克服上述现有技术的不足,本发明提供一种基于ThemeRiver模型的非连续 层次数据的可视化方法,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利 用用户交互方法来展示数据的层次特性和时序特征的主题河流图对具有时变特性的大规 模非连续层次数据进行可视化,实现同时表示数据的层次结构和时序特征。
[0006] 本发明提供的技术方案是:
[0007] -种非连续层次数据的可视化方法,针对具有时变特性的非连续层次数据,基于 ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的 层次特性和时序特征的主题河流图进行可视化,包括如下步骤:
[0008] 1)针对η个具有层次属性和时间特性的大规模数据集,进行预处理,执行如下操 作:
[0009] 11)对每个数据集按时间跨度进行划分处理,设总布局时间跨度为Τ ;时间粒度为 6;时间点为^,1£(〇,2),其中2 = 1/6,为时间段的数目;
[0010] 12)针对每个数据集,设定数据点个数门限值为K ;针对每个时间段中的数据点的 数目Μ,判断Μ是否大于等于Κ ;若Μ小于Κ,则通过对不同年份的相同时间段的数据进行取 平均操作得到新数据,为该时间段添加新的数据点,直到Μ = Κ ;
[0011] 13)针对每个数据集,得到ζ个时间段的数据,分别记为V Α2、Α3……ΑΖ;Β ρ Β2、 Β3......Βζ;......;
[0012] 2)针对η个数据集,利用Themeriver主题河流的中心摇摆法,执行如下操作:
[0013] 21)首先生成第一层次数据,作为河流的涌流数据线的纵坐标;包括如下步骤:
[0014] 211)计算得到η个数据集z个时间段的数据值ηι~η z,数据值ηι~η 2分别等于 每个数据集在相应时间段数据的加和;
[0015] 212)计算得到每一个时间段的初始点纵坐标,构成Themeriver主题河流的初始 线,具体地:
[0016] 计算第一个时间段的初始点纵坐标的公式为8。」=g+n 1;其中,g+g αι= 0 ;贝1J
[0017] 计算第二个时间段的初始点纵坐标为
[0018] 以此类推;
[0019] 对计算得到的所有时间段的初始点纵坐标数据进行图像拟合,得到Themeriver 主题河流的初始线;
[0020] 213)针对每一个数据集,计算得到该数据集在每一个时间段的纵坐标,构成 Themeriver主题河流的一条涌流线;具体地,针对数据集A,利用步骤13)中得到的z个时 间段的数据ΑρΑ^Α;^......Αζ;ζ个时间段的纵坐标值分别为gQ,2+A 2;& 此类推;
[0021] 对计算得到的所有时间段的纵坐标值数据进行图像拟合,得到该数据集相对应的 一条涌流线的数据;
[0022] 针对所有数据集,按照上述步骤计算得到所有数据集在每一个时间段的纵坐标, 构成Themeriver主题河流的η条涌流线;
[0023] 22)针对上述非连续层次数据集的第一层次数据之下层的第二层次数据,通过与 步骤21)相同的方法对数据进行处理和计算,得到所有层次数据集的第一层次数据所属的 第二层次数据的数据线,构成第一层次数据相应的涌流下属的子涌流线;
[0024] 23)逐层数据进行步骤21)相同的处理,直至得到所有层次的数据线;
[0025] 3)绘制主题河流图,包括:
[0026] 31)将得到的初始线和η条涌流线绘制到屏幕上,构成第一层次的主题河流图;
[0027] 绘制出的主题河流图中,初始线到第一条涌流线之间的区域代表该涌流线相对应 的数据集;第一条涌流线到第二条涌流线之间的区域代表第二条涌流线相对应的数据集; 以此类推;每个区域用不同颜色区分;
[0028] 32)在第一层次的主题河流图上,在每一个数据集相对应的区域,采用与步骤31) 相同方法,绘制该数据集对应的下一层次数据的初始线和子涌流线;构成具有多层次的主 题河流图。
[0029] 针对上述针对非连续层次数据的可视化方法,进一步地,步骤3)所述绘制主题河 流图,采用颜色差异较大的不同色系显示不同涌流;涌流内部的子涌流采用相同色系不同 饱和度的颜色进行展示。
[0030] 针对上述针对非连续层次数据的可视化方法,进一步地,步骤32)所述子涌流通 过标签进行展示,展示子涌流的标签布局按照以下方法进行:
[0031] El. 1标签显示不能够遮挡其他涌流;
[0032] E1. 2能够明确表示显示的标签与该标签展示子涌流所属的涌流的关系,具体地, 在涌流较小的情况下,标签可以直接分布在每个涌流层上面;当涌流过多时,通过交互操 作,通过鼠标滑动和点击主题河流中的某一条涌流来弹出窗口显示标签信息。
[0033] 针对上述针对非连续层次数据的可视化方法,进一步地,通过交互操作方式绘制 主题河流图,用户点击选取主题河流图中的某个涌流,未点选的涌流颜色淡去,放大选取的 涌流进一步显示该涌流内部的子涌流。
[0034] 针对上述针对非连续层次数据的可视化方法,进一步地,步骤进行图像拟合包括 高斯模型图像拟合和傅里叶模型图像拟合。
[0035] 本发明同时提供一种应用,将上述针对非连续层次数据的可视化方法应用于农药 残留数据的展示,其特征是,把某区域内的多个地区各个省份的农药检测结果数据作为非 连续层次数据集,第一层次为地区,第二层次为地区包括的省份;根据时间跨度对非连续层 次数据集的数据点进行时间段划分,记录每个时间段中的数据点的个数;通过设置数据点 数目阈值对时间段内数据点个数小于所设置阈值补加
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1