本发明涉及数据分析技术领域,特别涉及一种数据分析方法和装置。
背景技术:
可视化是一个新兴的研究领域,是将各种复杂的数据信息和知识转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力。从而,可以让人们更容易观察、浏览、分析、研究、处理大规模的数据,通过与界面的交互和理解来发现蕴含在信息内部的规律。
空间数据信息可视化分析是GIS(Geographic Information System,地理信息系统)的重要功能和特征,以地理对象的位置和形态为基础进行数据分析与挖掘,通过地理计算和空间表达挖掘潜在的空间信息。
目前,大多数的使用GIS对空间数据信息可视化分析时,对GIS专业知识要求较高,对于大多数用户来说,由于GIS知识的匮乏,从而造成数据信息分析效率较低。
技术实现要素:
本发明实施例提供了一种数据分析方法和装置,能够提高数据信息分析的效率。
第一方面,本发明实施例提供了一种数据分析方法,该方法包括:
预先设置待分析数据信息与标注符号的对应关系,其中,所述待分析数据信息中包括空间属性;
获取至少一个待分析数据信息;
根据目标地图的坐标系,将每个所述待分析数据信息中的空间属性转换为经纬度坐标;
针对每个所述待分析数据信息,在所述目标地图上的当前待分析数据信息对应的经纬度坐标处,利用所述对应关系中所述当前待分析数据信息对应的标注符号,对所述当前待分析数据信息进行标注。
优选地,在所述预先设置待分析数据信息与标注符号的对应关系之前,进一步包括:
将所述待分析数据信息划分为时空数据组和非时空数据组,其中,所述时空数据组中的待分析数据信息中包括时间属性,所述非时空数据组中的待分析数据信息中不包括时间属性;
所述待分析数据信息包括:属于所述时空数据组的时空待分析数据信息和属于所述非时空数据组的非时空待分析数据信息;
所述对应关系,包括:
时空待分析数据信息对应第一标注符号;
非时空待分析数据信息对应第二标注符号。
优选地,在所述对所述当前待分析数据信息进行标注之后,进一步包括:
接收用户输入的第一时间范围;
在所述目标地图中展示在所述第一时间范围内的时空待分析数据信息对应的第一标注符号。
优选地,在所述对所述当前待分析数据信息进行标注之后,进一步包括:
将所述时空待分析数据信息,按照至少一个时间粒度进行聚合,获取每一个所述时间粒度内的所述时空待分析数据信息,确定每一个所述时间粒度对应的时空待分析数据信息的数量,其中,所述至少一个时间粒度包括:年、月、天、小时、分钟或秒;
接收用户输入的第二时间范围和目标时间粒度;
在所述目标地图中展示在所述第二时间范围内的所述时空待分析数据信息对应的第一标注符号;
在所述目标地图中展示在所述第二时间范围内的每个所述目标时间粒度对应的时空待分析数据信息的数量。
优选地,在对所述当前待分析数据信息进行标注之后,进一步包括:
在所述目标地图中展示由所述第二标注符号的数量确定的空间分布热力图。
第二方面,本发明实施例提供了一种数据分析装置,该数据分析装置包括:设置单元,获取单元、转换单元和标注单元,其中,
所述设置单元,用于预先设置待分析数据信息与标注符号的对应关系,其中,所述待分析数据信息中包括空间属性;
所述获取单元,用于获取至少一个待分析数据信息;
所述转换单元,用于根据目标地图的坐标系,将所述获取单元获取的每个所述待分析数据信息中的空间属性转换为经纬度坐标;
所述标记单元,用于针对每个所述待分析数据信息,在所述目标地图上的当前待分析数据信息对应的经纬度坐标处,利用所述对应关系中所述当前待分析数据信息对应的标注符号,对所述当前待分析数据信息进行标注。
优选地,进一步包括:划分单元,用于将所述待分析数据信息划分为时空数据组和非时空数据组,其中,所述时空数据组中的待分析数据信息中包括时间属性,所述非时空数据组中的待分析数据信息中不包括时间属性;
所述待分析数据信息包括:属于所述时空数据组的时空待分析数据信息和属于所述非时空数据组的非时空待分析数据信息;
所述对应关系,包括:
时空待分析数据信息对应第一标注符号;
非时空待分析数据信息对应第二标注符号。
优选地,进一步包括:第一接收单元和第一展示单元,其中,
所述第一接收单元,用于接收用户输入的第一时间范围;
所述第一展示单元,用于在所述目标地图中展示在所述第一时间范围内的时空待分析数据信息对应的第一标注符号。
优选地,进一步包括:聚合单元,第二接收单元和第二展示单元,其中,
所述聚合单元,用于将所述时空待分析数据信息,按照至少一个时间粒度进行聚合,获取每一个所述时间粒度内的所述时空待分析数据信息,确定每一个所述时间粒度对应的时空待分析数据信息的数量,其中,所述至少一个时间粒度包括:年、月、天、小时、分钟或秒;
所述第二接收单元,用于接收用户输入的第二时间范围和目标时间粒度;
所述第二展示单元,用于在所述目标地图中展示在所述第二时间范围内的所述时空待分析数据信息对应的第一标注符号,以及在所述目标地图中展示在所述第二时间范围内的每个所述目标时间粒度对应的时空待分析数据信息的数量。
优选地,进一步包括:热力图单元,用于在所述目标地图中展示由所述第二标注符号的数量确定的空间分布热力图。
本发明实施例提供了一种数据分析方法和装置,通过预先设置待分析数据信息与标注符号的对应关系,获取至少一个待分析数据信息,根据目标地图的坐标系,将每个待分析数据信息中的空间属性转换为经纬度坐标,针对每个待分析数据信息,在目标地图上的当前待分析数据信息对应的经纬度坐标处,利用对应关系中当前待分析数据信息对应的标注符号,对当前待分析数据信息进行标注。由于对专业知识要求不高,不会因为专业知识匮乏而影响数据信息可视化分析的效率,所以能够提高数据信息分析的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种数据分析方法的流程图;
图2是本发明一个实施例提供的另一种数据分析方法的流程图;
图3是本发明一个实施例提供的一种数据分析装置的结构示意图;
图4是本发明一个实施例提供的另一种数据分析装置的结构示意图;
图5是本发明一个实施例提供的又一种数据分析装置的结构示意图;
图6是本发明一个实施例提供的再一种数据分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种数据分析方法,该方法可以包括以下步骤:
步骤101:预先设置待分析数据信息与标注符号的对应关系,其中,所述待分析数据信息中包括空间属性。
步骤102:获取至少一个待分析数据信息。
步骤103:根据目标地图的坐标系,将每个所述待分析数据信息中的空间属性转换为经纬度坐标。
步骤104:针对每个所述待分析数据信息,在所述目标地图上的当前待分析数据信息对应的经纬度坐标处,利用所述对应关系中所述当前待分析数据信息对应的标注符号,对所述当前待分析数据信息进行标注。
在图1所示的实施例中,通过预先设置待分析数据信息与标注符号的对应关系,获取至少一个待分析数据信息,根据目标地图的坐标系,将每个待分析数据信息中的空间属性转换为经纬度坐标,针对每个待分析数据信息,在目标地图上的当前待分析数据信息对应的经纬度坐标处,利用对应关系中当前待分析数据信息对应的标注符号,对当前待分析数据信息进行标注。由于对专业知识要求不高,不会因为专业知识匮乏而影响数据信息可视化分析的效率,所以能够提高数据信息分析的效率。
值得说明的是,目标地图可以是GIS地图,也可以是百度地图、谷歌地图等等。在进行数据分析时,只需要每个待分析数据信息中的空间属性转换为在目标地图的坐标系中的经纬度坐标即可。
在本发明一个实施例中,为了实现对不同类型的待分析数据信息的分析,在所述预先设置待分析数据信息与标注符号的对应关系之前,进一步包括:
将所述待分析数据信息划分为时空数据组和非时空数据组,其中,所述时空数据组中的待分析数据信息中包括时间属性,所述非时空数据组中的待分析数据信息中不包括时间属性;
所述待分析数据信息包括:属于所述时空数据组的时空待分析数据信息和属于所述非时空数据组的非时空待分析数据信息;
所述对应关系,包括:
时空待分析数据信息对应第一标注符号;
非时空待分析数据信息对应第二标注符号。
在该实施例中,待分析数据信息中包括时间属性,也就是说该待分析数据信息与时间有关系。例如,对于车牌号为×××的出租车,当北京时间12:01时,位于A地,而当北京时间12:08时,位于B地,且A地和B地不在同一个位置,说明随着时间的改变的车的位置也相应的发生的改变,此时,就认为这个待分析数据信息中包括时间属性。而对于待分析数据信息中不包括时间属性,就是说该待分析数据信息与时间没有关系。例如,对于××路与×××路交叉口的信号灯,不论是北京时间12:01还是北京时间12:08都一直在那里,在一定时间范围内是不会发生变化的,此时,就认为这个待分析数据信息中不包括时间属性。
值得说明的是,第一标注符号与第二标注符号不同,可以是颜色不同也可以是形状不同,同时也可以大小不同,用户可以根据自己的喜好,对其进行设置,只要能够区分即可。
在本发明一个实施例中,为了使用户能够得到自己想要时间范围内的数据,在所述对所述当前待分析数据信息进行标注之后,进一步包括:
接收用户输入的第一时间范围;
在所述目标地图中展示在所述第一时间范围内的时空待分析数据信息对应的第一标注符号。
在该实施例中,由于非时空数据组没有时间属性,所以不予以考虑。用户只需要输入想要查看数据信息的时间范围即可。例如,在目标地图中标注了2010年6月8日到2016年8月6日的数据信息,而用户想查看2015年1月1日到2015年12月31日的数据信息,只需要输入相应的时间范围,目标地图就会展示相应时间范围的数据信息对应的第一标注符号。
在本发明一个实施例中,为了能够清楚获取到统计结果,在所述对所述当前待分析数据信息进行标注之后,进一步包括:
将所述时空待分析数据信息,按照至少一个时间粒度进行聚合,获取每一个所述时间粒度内的所述时空待分析数据信息,确定每一个所述时间粒度对应的时空待分析数据信息的数量,其中,所述至少一个时间粒度包括:年、月、天、小时、分钟或秒;
接收用户输入的第二时间范围和目标时间粒度;
在所述目标地图中展示在所述第二时间范围内的所述时空待分析数据信息对应的第一标注符号;
在所述目标地图中展示在所述第二时间范围内的每个所述目标时间粒度对应的时空待分析数据信息的数量。
在该实施例中,为了方便对不同时间范围内待分析数据信息的展示分析,可以设置时间轴,通过时间轴控件进行调节。例如,待分析数据信息可以先按照年进行聚合,通过时间轴控件缩小时间范围,依次按照年、月、日、小时等不同粒度进行时间聚合分析,逐步缩小待分析数据信息的范围,从而达到数据可视化分析的目的。
在本发明一个实施例中,在所述对所述当前待分析数据信息进行标注之后,进一步包括:
在所述目标地图中展示由所述第二标注符号的数量确定的空间分布热力图。
在该实施例中,使用第二标注将非时空数据组中的非时空待分析数据信息进行一一标注,通过标注的密度可以确定出空间分布热力图。例如,可以展示某区域内的人口密度、信号灯密度等等。
如图2所示,本发明实施例提供了一种数据分析方法,该方法可以包括以下步骤:
步骤201:将待分析数据信息划分为时空数据组和非时空数据组。
在该步骤中,由于不同类型的待分析数据信息具有不同的处理方法,因此要先将待分析数据信息分类。
步骤202:设置待分析数据信息中的时空待分析数据信息对应第一标注符号,非时空待分析数据信息对应第二标注符号。
在该步骤中,为了能够在地图中区分不同类型的待分析数据信息,因此要先设置待分析数据信息与标注符号的对应关系。
步骤203:获取至少一个待分析数据信息。
在该步骤中,待分析数据信息可以是从外部数据库获取,也可以是用户输入。
步骤204:根据目标地图的坐标系,将每个待分析数据信息中的空间属性转换为经纬度坐标。
在该步骤中,由于不同的待分析数据信息中包括的空间属性,可能是详细地址,也可能是其他在地图上对应的经纬度坐标,因此需要将所有待分析数据信息中包括的空间属性进行转换,使其在目标地图的坐标系中统一。
步骤205:针对每个待分析数据信息,在目标地图上的当前待分析数据信息对应的经纬度坐标处,利用对应关系中当前待分析数据信息对应的标注符号,对当前待分析数据信息进行标注,针对非时空数据组,执行步骤206,针对时空数据组,执行步骤207。
在该步骤中,使用第一标注符号对时空待分析数据信息进行标注,使用第二标注符号对非时空待分析数据信息进行标注。
步骤206:在目标地图中展示由第二标注符号的数量确定的空间分布热力图。
步骤207:将时空待分析数据信息,按照至少一个时间粒度进行聚合,获取每一个时间粒度内的时空待分析数据信息,确定每一个时间粒度对应的时空待分析数据信息的数量。
步骤208:接收用户输入的时间范围和目标时间粒度。
步骤209:在目标地图中展示在第二时间范围内的时空待分析数据信息对应的第一标注符号,以及展示在第二时间范围内的每个目标时间粒度对应的时空待分析数据信息的数量。
如图3所示,本发明实施例提供了一种数据分析装置,该数据分析装置可以包括:设置单元301、获取单元302、转换单元303和标注单元304,其中,
所述设置单元301,用于预先设置待分析数据信息与标注符号的对应关系,其中,所述待分析数据信息中包括空间属性;
所述获取单元302,用于获取至少一个待分析数据信息;
所述转换单元303,用于根据目标地图的坐标系,将所述获取单元302获取的每个所述待分析数据信息中的空间属性转换为经纬度坐标;
所述标记单元304,用于针对每个所述待分析数据信息,在所述目标地图上的当前待分析数据信息对应的经纬度坐标处,利用所述对应关系中所述当前待分析数据信息对应的标注符号,对所述当前待分析数据信息进行标注。
如图4所示,在本发明一个实施例中,为了实现对不同类型的待分析数据信息的分析,该数据分析装置可以进一步包括:划分单元401,用于将所述待分析数据信息划分为时空数据组和非时空数据组,其中,所述时空数据组中的待分析数据信息中包括时间属性,所述非时空数据组中的待分析数据信息中不包括时间属性;
所述待分析数据信息包括:属于所述时空数据组的时空待分析数据信息和属于所述非时空数据组的非时空待分析数据信息;
所述对应关系,包括:
时空待分析数据信息对应第一标注符号;
非时空待分析数据信息对应第二标注符号。
在本发明一个实施例中,为了使用户能够得到自己想要时间范围内的数据,该的数据分析装置可以进一步包括:第一接收单元(图中未示出)和第一展示单元(图中未示出),其中,
所述第一接收单元,用于接收用户输入的第一时间范围;
所述第一展示单元,用于在所述目标地图中展示在所述第一时间范围内的时空待分析数据信息对应的第一标注符号。
如图5所示,在本发明一个实施例中,为了能够清楚获取到统计结果,该数据分析装置可以进一步包括:聚合单元501,第二接收单元502和第二展示单元503,其中,
所述聚合单元501,用于将所述时空待分析数据信息,按照至少一个时间粒度进行聚合,获取每一个所述时间粒度内的所述时空待分析数据信息,确定每一个所述时间粒度对应的时空待分析数据信息的数量,其中,所述至少一个时间粒度包括:年、月、天、小时、分钟或秒;
所述第二接收单元502,用于接收用户输入的第二时间范围和目标时间粒度;
所述第二展示单元503,用于在所述目标地图中展示在所述第二时间范围内的所述时空待分析数据信息对应的第一标注符号,以及在所述目标地图中展示在所述第二时间范围内的每个所述目标时间粒度对应的时空待分析数据信息的数量。
如图6所示,在本发明一个实施例中,为了能够清楚明了的对非时空数据进行分析,该数据分析装置可以进一步包括:热力图单元601,用于在所述目标地图中展示由所述第二标注符号的数量确定的空间分布热力图。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上,本发明的各实施例,至少具有如下有益效果:
1、在本发明实施例中,通过预先设置待分析数据信息与标注符号的对应关系,获取至少一个待分析数据信息,根据目标地图的坐标系,将每个待分析数据信息中的空间属性转换为经纬度坐标,针对每个待分析数据信息,在目标地图上的当前待分析数据信息对应的经纬度坐标处,利用对应关系中当前待分析数据信息对应的标注符号,对当前待分析数据信息进行标注。由于对专业知识要求不高,不会因为专业知识匮乏而影响数据信息可视化分析的效率,所以能够提高数据信息分析的效率。
2、在本发明实施例中,通过对待分析数据信息进行分类,根据待分析数据信息中是否包括时间属性,将待分析数据信息分为两类,并使用不同的标注符号,分别对不同类型的待分析数据信息进行标注,从而能够实现对不同类型的待分析数据信息的分析。
3、在本发明实施例中,通过使用时间控件,用户可以输入时间范围,查看自身需要的时间范围内的待分析数据信息,获取特定时间范围内的待分析数据信息,从而使数据分析更具有针对性。
4、在本发明实施例中,通过聚合单元,用户可以将输入时间范围内的待分析数据信息进行聚合,获取特定时间范围内的待分析数据信息以及特定时间范围内特定时间粒度对用的待分析数据信息的数量,不仅使数据分析更具有针对性,而且使数据分析更加方便快捷。
5、在本发明实施例中,通过使用空间热力图的方式将非时空数据组中的非时空待分析数据信息进行展示,直观展现非时空待分析数据信息的空间分布情况,从而进一步提高了数据分析效率。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。