本技术涉及数据图表,特别涉及一种数据图表刻度线的生成技术。
背景技术:
1、本部分旨在为权利要求书中陈述的本技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是已被公开的现有技术。
2、当大量的数据以数字方式被记录后,形成了大量数据组成的数据表。读者对于数值化数据表的理解效率较为低下,很难从大量数字中发现数据表的整体特征和规律。
3、数据图表泛指可在平面设备中显示的、可直观展示数据集合的统计信息属性(时间性、数量性等),对知识挖掘和信息直观生动感受起关键作用的图形结构,是一种很好地将对象属性数据直观、形象地"可视化"的手段。
4、这一过程中,获取的数据存在很大的随机性,绘制工具无法事先预测到这些数据及其统计特性,因此要求绘制工具具有相当完善的绘制逻辑,通常需要满足如下的需求:
5、数据的覆盖性:工具所提供的图表界限,应当能将所有数据包含在内,通常会在数据统计出边界值后,再加入一定的留白量;
6、数据的区分性:数据应当尽量散布在图表空间,避免过于聚集而无法区分;因此在确保前述的覆盖性时,也要避免加入过多的留白量,否则将会压缩数据间的区分性;
7、刻度线的区分性:刻度线是用于数据点快速读取的参考,密集且无差异的刻度线无助于数据点的数值读取,因此应当设计合理的刻度线层级,便于读者能以线读数,提高效率。
8、这里以折线图记录一段时间内的目标对象电压值为例,数据如表1所示。
9、表1
10、 索引号 电压(伏特) 1 0.994 2 0.971 3 0.93 4 0.947 5 0.965 6 0.958 7 0.952 8 0.968 9 0.979 10 0.957 11 0.982 12 0.966
11、使用microsoft excel绘制出的折线图如图1所示,这里的主要问题是电压刻度线的区分性,用于区分电压的水平刻度线,其线型、宽度、颜色完全一致,如果读者需要读取任一点的数值,需要先从左侧的纵轴上找到数值,然后视线平移到数据点读取数据。
技术实现思路
1、本技术的目的在于提供一种数据图表刻度线的生成方法,将数据图表刻度线的外观加以层级区分,有利于立即读取数据,提高效率。
2、本技术公开了一种数据图表刻度线的生成方法,包括:
3、获取输入数据的上限和下限,并根据留白量的需要,扩大并确定图表绘制区间;
4、根据所述图表绘制区间和图表显示精度的要求,确定主刻度线的数值和数量,绘制图表主刻度线;以及
5、根据所述主刻度线的间距和统计特性,确定次刻度线的数值和数量,绘制图表次刻度线。
6、在一个优选例中,所述获取输入数据的上限和下限,并根据留白量的需要,扩大并确定图表绘制区间的步骤,具体包括:
7、根据所述输入数据的统计特性,结合所述输入数据的数量来确定图表绘制区间;或者
8、当所述输入数据符合正态分布特征时,通过正态分布函数确定图表绘制区间;或者
9、当所述输入数据符合正态分布特征时,根据绘制区间的置信度要求,通过计算所述输入数据的正态分布方差的极大似然估计,结合统计学的φ2分布特性,计算所述输入数据的绘制区间,确定图表绘制区间。
10、在一个优选例中,还包括:
11、将根据留白量的需要确定的图表绘制区间加上预测的数据区间获得所述图表绘制区间。
12、在一个优选例中,所述预测的数据区间通过如下步骤获得:
13、根据输入数据的统计特性,如果所述输入数据的采样过程具有马尔可夫过程的特性,获取数据的变化趋势;
14、将所述数据的变化趋势,离散化到上升、下降和维持三个离散状态;
15、通过所述输入数据,计算出所述三个离散状态的两两状态转移概率,形成转移概率矩阵;
16、根据所述转移概率矩阵,得到预测数据区间,将所述输入数据区间和所述预测数据区间结合,更新数据区间,根据所述数据区间对图表绘制区间进行平移,使得所述数据区间的中心处于图表视图中心的位置。
17、在一个优选例中,所述根据所述图表绘制区间和图表显示精度的要求,确定主刻度线的数值和数量,绘制图表主刻度线的步骤,具体包括:
18、根据输入数据的最高精度,遍历所述输入数据;
19、当所述输入数据为10进制时,取尾部0数目最多的一个或一组数据值,作为主刻度值候选对象;
20、如果所述主刻度值候选对象的数目少于第一阈值,加上尾部0数目减1的下一级数据值进行筛选,或者获取相邻的主刻度线中间位置的数据值,将所述数据值升级为所述主刻度值候选对象;
21、如果所述主刻度值候选对象的数目多于第二阈值,将所述主刻度值候选对象减半。
22、在一个优选例中,所述根据所述主刻度线的间距和统计特性,确定次刻度线的数值和数量,绘制图表次刻度线的步骤,具体包括:
23、相邻主刻度线之间次刻度线划分的分值点为固定值;
24、当所述主刻度线的间距小于第三阈值时,所述次刻度线的分值点为第一固定值;
25、当所述主刻度线的间距不小于所述第三阈值时,所述次刻度线的分值点为第二固定值。
26、在一个优选例中,在所述绘制图表次刻度线的步骤之后,还包括;
27、根据精度需要,继续迭代生成次一级的刻度线。
28、在一个优选例中,所述主刻度线的数值和数量通过查表方式确定,具体包括:
29、当输入数据为10进制时,将所述输入数据的上下限相减得到差值,保留两位有效数字,再通过移动小数点将所述差值的范围控制在10和99之间;
30、根据图表显示精度的要求,查表得到所述差值匹配的有效数字,所述有效数字为所述主刻度线的数量;
31、将所述主刻度线的数值恢复到移动小数点之前的数值,得到所述主刻度线的数值。
32、本技术还公开了一种数据图表刻度线的生成装置,包括:
33、存储器,用于存储计算机可执行指令;以及,
34、处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
35、本技术还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
36、本技术实施方式中,图表的主次刻度线数量适中、划分合理、读取方便、适应性广,避免了部分以往流程的刻度线数量极端、可读性差、而需要人工反复介入的问题。
37、本技术的说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本技术所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本技术上述
技术实现要素:
中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征a+b+c,在另一个例子中公开了特征a+b+d+e,而特征c和d是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征e技术上可以与特征c相组合,则,a+b+c+d的方案因技术不可行而应当不被视为已经记载,而a+b+c+e的方案应当视为已经被记载。