用于高维数据特征属性变化趋势的可视化呈现系统及方法_3

文档序号:9261441阅读:来源:国知局
骤4所确定的坐标上。例如,图标中部的大小用来显示该词在所有数据中的平均出现频率,如果图标中部大,表明该词平均出现频率高,否则表明该词平均出现频率低。头部和尾部用来表示视野区间之外的的数据发展趋势。例如头部大尾部短的情况表明视野区间之后数据发展变化较大,而视野区间之前属性值变化较小,趋势持续时间短,头小尾部长的情况可以表明视野区间之后数据发展变化稳定,而视野区间之前词的出现频率一直持续增大,趋势持续时间长。
[0047]6)根据观察区间边缘时刻的趋势变化情况,调整图标显示的角度。例如图2中,经过计算发现A1在上个月和下个月出现的频率变化一直保持匀速增高,所以图标的尾部和头部与水平线的夹角都接近于O。^在之前的月份中频率变化较慢,而在之后的月份频率变化的更快,所以A3图标的头部在水平线之上,而尾部在水平线之下。确定图标数据之后传输给图标存储单元,绘制单元同时提取坐标存储单元和图标存储单元中的数据,在屏幕上绘制图形。
[0048]7)当调整视野范围时,用户可以重新选定目标的月份,即选择新的观察区间(如图3),根据新的观察区间,重复步骤2-5。如图3中,A的位置以及属性在改变了视野区间之后也发生了相应的变化。
[0049]本实施例可以呈现多维数据集在给定观察时间区间范围内符合筛选条件的特征属性的总体变化情况,以及在更小的视野时间区间内的特征属性的具体取值和变化情况。在可视化呈现中,特征所处的位置是属性值的峰值位置,随着时间的变化,这个位置可能固定不动,也可跟随时间方向不断演变。这种对特征属性趋势变化的可视化呈现,有利于用户在数量众多的特征中找出符合趋势变化要求的特征,帮助用户把握众多特征随时间变化的情况,在多类高维数据分析系统中应用广泛。
【主权项】
1.一种用于高维数据特征属性变化趋势的可视化呈现系统,其特征在于,包括:数据准备模块、特征初选模块以及可视化模块,其中:数据准备模块与特征初选模块相连,从数据集中读取数据并输出经过格式处理的数据,特征初选模块与可视化模块相连并传输经过筛选和计算的数据,可视化模块与计算机显示硬件相连并传输图形信息。2.根据权利要求1所述的系统,其特征是,所述的数据准备模块包括:数据读取单元、数据整理单元和数据存储单元,其中:数据读取单元与数据整理单元相连,读取数据集中的数据并输出初始数据,数据整理单元与数据存储单元相连并传输整理好的数据,数据存储单元与特征初选模块相连并准备为其提供数据。3.根据权利要求1所述的系统,其特征是,所述的特征初选模块包括:数据提取单元、计算整理单元和特征存储单元,其中:数据提取单元接收并根据用户的请求从数据准备模块中的数据存储单元提取相应数据,将提取到的数据传输给计算整理单元处理,计算整理单元与特征存储单元相连并传输经过计算处理的特征信息,特征存储单元与可视化模块相连并准备为其提供特征信息; 所述的请求是指:明确指定在数据集中可视化的属性和时间区间,对给定时间区间之间属性取值的变化情况进行统计分析,根据统计结果对特征进行排序并进行初选选择。4.根据权利要求1所述的系统,其特征是,所述的可视化模块包括:特征映射子模块、特征描述子模块和绘制单元,其中:特征映射子模块接收来自特征初选模块的特征数据并向绘制单元传输映射后的坐标数据,特征描述子模块接收来自特征初选模块的特征数据并向绘制单元传输特征图标描述数据。5.根据权利要求4所述的系统,其特征是,所述的特征映射子模块包括:坐标计算单元和坐标存储单元,其中:坐标计算单元根据特征数据计算出显示的图形在平面上的位置坐标,并将坐标数据传输给坐标存储单元进行保存,坐标存储单元和绘制单元连接并传输给其坐标数据; 所述的特征描述子模块包括:图标生成单元和图标存储单元,其中:图标生成单元根据特征数据计算出特征呈现图标的各个图形特征,并将图形数据传输给图标存储单元进行保存,图标存储单元和绘制单元连接并传输给其图标数据。6.根据权利要求5所述的系统,其特征是,所述的特征呈现图标包括:头部、中部和尾部,其中:图标朝向右侧,即时间轴的正方向的一侧称为头部,图标朝向左侧,即时间轴反方向的一侧称为尾部,头部和尾部的中间则是中部。7.根据权利要求6所述的系统,其特征是,所述的特征呈现图标与X轴的夹角表示属性值在视野区间前和视野区间内数据总体的变化趋势; 所述的特征呈现图标的头部与水平的夹角表示属性值在观察区间中视野区间后的变化情况; 所述的特征呈现图标的尾部在水平线之上表明该属性值在视野区间之前的属性值变化趋势为下降趋势,该夹角约等于O的情况表明视野区间之前该属性值基本保持常数,尾部在水平线之下表明该属性值在视野区间之前小于视野区间的属性值,说明该属性值的变化趋势一直保持上升趋势; 所述的特征呈现图标的中部所呈现的是在视野区间内的属性值变化。8.—种根据上述任一权利要求所述系统的可视化呈现方法,其特征在于,包括以下步骤: 1)针对给定高维数据集中每一维度上的特征数值,根据每一个数据的生成或者采集的时间标记,计算所有的特征随时间变化的属性值; 2)用户指定两个时间区间,其中一个时间区间包含在另一个时间区间内,被包含的时间区间为视野区间,包含另一个时间区间的时间区间为观察区间,用户指定可视化的属性; 3)根据屏幕上定义的可视化区间的大小及其分辨率的大小以及图标的平均大小计算可在可视化区间内清晰呈现的特征数量N,以此为依据以及数据集合各项特征在观察区间的属性值对特征进行筛选; 4)以时间T为横坐标,频率f为纵坐标,视野区间的最小值对应可视化空间最左侧的位置,视野区间的最大值对应可视化空间最右侧的位置,区间内其他值在横轴上均匀分布;筛选出的数据集合A中,可视化特征属性的最小值Amin所代表的数据对应可视化空间的最下方,最大值Amax所代表的数据对应可视化空间的最上方,最大值和最小值之间的数据在纵轴分布;数据集合A中的每一个特征依据其在视野区间中的最大值及其最大值出现的时间来确定该特征的坐标; 5)计算属性值的数值特征,将图标的头部、尾部和中部的长、宽根据数值特征对图标各部分的大小做相应调整; 6)用户在观察区间内部调整视野区间,根据新的视野区间,重复步骤4- 5)。9.根据权利要求8所述的方法,其特征是,步骤5)中所述的相应调整是指:根据观察区间边缘时刻的趋势变化情况相应调整图标显示的角度。10.根据权利要求8所述的方法,其特征是,当调整视野范围时,用户可以重新选定观察区间,根据新的观察区间,重复步骤2-5)0
【专利摘要】一种用于高维数据特征属性变化趋势的可视化呈现系统及方法,包括:数据准备模块、特征初选模块以及可视化模块,其中:数据准备模块与特征初选模块相连,从数据集中读取数据并输出经过格式处理的数据,特征初选模块与可视化模块相连并传输经过筛选和计算的数据,可视化模块与计算机显示硬件相连并传输图形信息。本发明将多特征趋势变化情况进行静态地呈现,所呈现的数据集的每一个维度即是一个特征,时间作为其中一个参照性的维度特征,每一个特征的属性随时间不同而不同。该可视化方法是一种交互式的可视化方法,可视化内容由时间区间和时间区间内的特征属性的分布决定。
【IPC分类】G06F17/30
【公开号】CN104978407
【申请号】CN201510341140
【发明人】马颖华, 李建华, 胡琦伟
【申请人】上海交通大学
【公开日】2015年10月14日
【申请日】2015年6月18日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1