一种基于四分位图展示数据的可视化方法及系统的制作方法

文档序号:6513147阅读:1077来源:国知局
一种基于四分位图展示数据的可视化方法及系统的制作方法
【专利摘要】本发明提供一种基于四分位图展示数据的可视化方法,该方法包括:定义数据格Gx,并确定X轴的展示刻度步骤;进行数据源配置、扫描和读取步骤;分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤;采用四分位图进行数据展示步骤。本发明通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。另外,本发明还提供一种基于四分位图展示数据的可视化系统。
【专利说明】—种基于四分位图展示数据的可视化方法及系统
【技术领域】
[0001]本发明涉及数据处理领域,尤其涉及一种基于四分位图展示数据的可视化方法及系统。
【背景技术】
[0002]四分位图是一种展示一维数据分布情况的图形,能直观表现出数据的分布形态,包括五个数据点:最低位、四分之一位、中值位、四分之三位、最高位。其中最低位、最高位分别对应最小值、最大值,四分之一位含义为所有数据中有25%的数据小于该值,同理中值位为所有数据中有50%小于该值,四分之三位为所有数据中有75%小于该值。四分位图只是个展示工具,且只能用来展示一维数据分布情况。因而缺少一种采用四分位图展示二维数据分布情况的可视化方法。

【发明内容】

[0003]因此,本发明为了解决上述缺陷之一。
[0004]因而,本发明提供一种基于四分位图展示数据的可视化方法及系统,本发明通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。
[0005]所以,本发明一个实施例提供一种基于四分位图展示数据的可视化方法,该方法包括:
定义数据格Gx,并确定X轴的展示刻度步骤;
进行数据源配置、扫描和读取步骤;
分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤;
采用四分位图进行数据展示步骤。
[0006]在本发明一个实施例中,所述定义数据格Gx,并确定X轴的展示刻度步骤包括:计算自变量X的取值范围,并对自变量X进行离散化。
[0007]在本发明一个实施例中,所述定义数据格Gx,并确定X轴的展示刻度步骤还包括:根据自变量X的取值范围对X的最大和最小值进行调整,进而将所述取值范围划分成一系列等分的Gx。
[0008]优选地,所述展示刻度为4种,并可相互进行切换。
[0009]在本发明一个实施例中,所述进行数据源配置、扫描和读取步骤包括:
依据自变量X和因变量Y进行数据源配置;
获取自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正;
扫描数据源,读取每一记录的X与Y值:X和y,并计算出X和I对应的数据格GX,将所述数据保存到该Gx中。
[0010]优选地,所述计算每一刻度级别的每一数据格Gx内数据的四分位包括:最低位、四分之一位、中值位、四分之三位和最高位。
[0011]在本发明一个实施例中,所述采用四分位图进行数据展示步骤包括:所述采用四分位图进行数据展示的数据为数据格Gx中存储的数据。
[0012]优选地,所述采用四分位图进行数据展示步骤还包括:所述展示可进行上限或下限单方向修改和范围整体拖动。
[0013]优选地,所述采用四分位图进行数据展示步骤还包括:
所述展示可选择一片区域进行,所述展示为对应数据格Gx内详细信息。
[0014]本发明另一个实施例提供一种基于四分位图展示大数据的可视化系统,该系统包括:数据格定义单元,用于定义数据格Gx,并确定X轴的展示刻度;数据源获取单元,用于进行数据源配置、扫描和读取;数据源存储单元,用于分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位;数据展示单元,用于采用四分位图进行数据展示。
[0015]所述数据源获取单元根据数据格定义单元确定的自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,并扫描数据源,读取每一记录的X与Y值:X和y,计算出X和y对应的数据格Gx。所述数据展示单元展示的数据为数据源存储单元存储的数据格Gx内的数据。
【专利附图】

【附图说明】
[0016]图1是本发明一个实施例提供的一种基于四分位图展示数据的可视化方法的具体流程示意图。
[0017]图2是本发明一个实施例中定义的数据格Gx的示意图。
【具体实施方式】
[0018]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
[0019]本发明提供一种基于散点图展示数据的可视化方法及系统,本发明通过定义数据格Gxy来存储数据,并利用散点图来展示数据,实现了在数据量巨大情况下的数据展示的可视化,可用于数据展示和数据分析。
[0020]如图1是本发明一个实施例提供一种基于四分位图展示数据的可视化方法具体流程示意图,具体为以下步骤:
步骤SllO:定义数据格Gx,并确定X轴的展示刻度。
[0021]在本发明一个实施例中,为了展示二维四分位图需要先计算自变量X的取值范围,并对自变量X进行离散化。并根据自变量X的取值范围对X的最大和最小值进行调整,进而将所述取值范围划分成一系列等分的Gx。如图2所示对数据格Gx作如下定义:
Gx{xl,x2}为 G{ (X,y) I xl〈=x〈x2},简称 Gx,即所有满足 xl〈=x〈x2 的点(x, y)。
[0022]步骤S120:进行数据源配置、扫描和读取。
[0023]该步骤中,数据源依据自变量X和因变量Y进行数据源配置,并获取自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,使得最小值、最大值为10的η次方(η为整数)的倍数,即Xmin (或Xmax) = m * 10~n。如X的实际取值区间为[0.1,983.7],进行修整后X的最小值为O,最大值为1000,即取值区间变为:[0,1000]。依据修正后的X轴取值区间划分成一系列等距的Gx,Gx的间距刻度Sx将会动态的识别成10的η次方(η为整数),即s=10~n,可能的取值为1、10、100、1000000、0.1,0.01等。同时为了支持缩放功能,本系统将同时支持3种Gx展示刻度,并支持切换(η连续,每切换一次,对应的将放大、缩小10倍)。4种Gx展示刻度将动态识别,识别的标准为使得最大展示刻度时X轴被等分成10-100个Gx,如X数据的分布区间为O到50000,那么本系统支持的Gx的展示刻度将为:
1、10、100、1000。
[0024]扫描数据源,读取每一记录的X、Y值χ和y,并计算出χ和y对应的数据格Gx,将所述数据保存到该Gx中。如x=155.3且X轴刻度为“10”时,155.3/10 = 15.53,则Gx为Gx {150, 160},当刻度为 I 时则属于 Gx {155,156}。
[0025]步骤S130:分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位。
[0026]读取数据完毕后,分析存储的数据,修正X轴展示刻度,如果某个小级别的刻度中有效的Gx数量(Gx中记录数大于O则称该Gx有效)小于上级的有效Gx数量的2倍,则删除该刻度。删除该刻度的原因是当放大到该级别时,信息增加的并不多,实际数据明细并没有得到有效的放大。确定保留的有效展示刻度中最大的为初始展示的刻度。所述计算每一刻度级别的每一数据格Gx内数据的四分位包括:最低位、四分之一位、中值位、四分之三位和最闻位。
[0027]步骤S140:采用四分位图进行大数据展示。
[0028]在本发明一个实施例中,所述采用四分位图进行数据展示的数据为Gx中存储的数据。所述展示可进行上限或下限单方向修改和范围整体拖动。在X轴四种展示刻度间可相互进行切换,鼠标选择四分位图中一片区域时,可展示为对应数据格Gx内详细信息。
[0029]本发明另一个实施例提供一种基于四分位图展示大数据的可视化系统,该系统包括:数据格定义单元,用于定义数据格Gx,并确定X轴的展示刻度;数据源获取单元,用于进行数据源配置、扫描和读取;数据源存储单元,用于分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位;数据展示单元,用于采用四分位图进行数据展示。
[0030]所述数据源获取单元根据数据格定义单元确定的自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,并扫描数据源,读取每一记录的X、Y值X和y,计算出χ和y对应的数据格Gx。所述数据展示单元展示的数据为数据源存储单元存储的数据格Gx内的数据。本发明通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。
【权利要求】
1.一种基于四分位图展示数据的可视化方法,其特征在于,所述方法包括: 定义数据格GX,并确定X轴的展示刻度步骤; 进行数据源配置、扫描和读取步骤; 分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤; 采用四分位图进行数据展示步骤。
2.根据权利要求1所述的方法,其特征在于,所述定义数据格Gx,并确定X轴的展示刻度步骤包括: 计算自变量X的取值范围,并对自变量X进行离散化。
3.根据权利要求1所述的方法,其特征在于,所述定义数据格Gx,并确定X轴的展示刻度步骤还包括: 根据自变量X的取值范围对X的最大和最小值进行调整,进而将所述取值范围划分成一系列等分的Gx。
4.根据权利要求1-3任一所述的方法,其特征在于,所述展示刻度为4种,并可相互进行切换。
5.根据权利要求1所述的方法,其特征在于,所述进行数据源配置、扫描和读取步骤包括: 依据自变量X和因变量Y进行数据源配置; 获取自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正; 扫描数据源,读取每一记录的X与Y值:X和y,并计算出X和I对应的数据格GX,将所述数据保存到该Gx中。
6.根据权利要求1所述的方法,其特征在于,所述计算每一刻度级别的每一数据格Gx内数据的四分位包括:最低位、四分之一位、中值位、四分之三位和最高位。
7.根据权利要求1所述的方法,其特征在于,所述采用四分位图进行数据展示步骤包括: 所述采用四分位图进行数据展示的数据为Gx中存储的数据。
8.根据权利要求1或7所述的方法,其特征在于,所述采用四分位图进行数据展示步骤还包括: 所述展示可进行上限或下限单方向修改和范围整体拖动。
9.根据权利要求1或7所述的方法,其特征在于,所述采用四分位图进行数据展示步骤还包括: 所述展示可选择一片区域进行,所述展示为对应数据格Gx内详细信息。
10.一种基于四分位图展示大数据的可视化系统,其特征在于,所述系统包括: 数据格定义单元,用于定义数据格Gx,并确定X轴的展示刻度; 数据源获取单元,用于进行数据源配置、扫描和读取; 数据源存储单元,用于分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位; 数据展示单元,用于采用四分位图进行数据展示 。
11.根据权利要求10所述的系统,其特征在于,所述数据源获取单元根据数据格定义单元确定的自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,并扫描数据源,读取每一记录的X与Y值:χ和y,计算出X和y对应的数据格Gx。
12.根据权利要求10所述的系统,其特征在于,所述数据展示单元展示的数据为数据源存储单元存储的数据格Gx内的数据。
【文档编号】G06F3/0481GK103472978SQ201310442900
【公开日】2013年12月25日 申请日期:2013年9月26日 优先权日:2013年9月26日
【发明者】王明兴, 樊文飞, 贾西贝 申请人:深圳市华傲数据技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1